Процессор AMD A10-7800 нами уже тестировался, но в «не совсем правильном» окружении: с памятью, работающей на частоте 1333 МГц, что в полтора раза ниже, чем поддерживаемая по спецификациям. Соответственно, мы решили повторить тестирование «правильным» образом, однако приступив к работе, обнаружили некоторые странности в результатах тестов. Что, после вдумчивого изучения вопроса, привело к написанию данной статьи, поскольку выявленные особенности касаются не только этой модели, но могут проявиться при использовании большинства процессоров семейства Kaveri. И связаны они с одним из нововведений последнего — настраиваемым TDP.
Custom TDP — история вопроса и детали реализации
Долгое время производители х86-процессоров вообще не задумывались об их энергопотреблении и тепловыделении, что было оправдано: микросхемы, потребляющие единицы ватт энергии, в охлаждении не нуждаются, спокойно себя чувствуя в любом типичном персональном компьютере. Однако по мере увеличения сложности полупроводниковых приборов и роста рабочей тактовой частоты начали появляться проблемы. Впервые во весь рост они заявили о себе в Pentium 66, который банально перегревался. А к какому уровню тепловыделения оказались не готовы производители компьютеров? Сейчас уже смешно вспоминать, но речь шла всего лишь о 16 Вт :) Да-да, уровень ниже специализированных CULV-процессоров недавнего прошлого (и даже настоящего) вызвал серьезные проблемы, поскольку оказался неожиданным для привыкшего к маленьким радиаторам или даже их отсутствию рынка.
В дальнейшем рост энергопотребления продолжался, что вызвало бурный прогресс охлаждающих устройств. Но коснулся он и самих процессоров, заставив задуматься их производителей. К примеру: что будет, если кулер выйдет из строя? Надо делать защиту от критичного перегрева, чтобы не «спалить» дорогостоящий прибор — так появился тротлинг как защитный механизм. А нужно ли процессору всегда работать в одном и том же режиме? В настольных моделях на это долго не обращали внимания, но рост популярности ноутбуков заставил заняться и данным вопросом, «научив» процессоры снижать тактовую частоту и потребляемый ток с целью экономии энергии. Когда процессоры стали многоядерными, усложнились и схемы их работы. В конце концов, далеко не все программное обеспечение равномерно загружает все блоки современного процессора: обычно простаивает то или иное количество вычислительных ядер, а иногда все «упирается» в GPU. В результате полезным оказывается отключить все ненужное в данный момент (для экономии), а оставшийся запас энергии (если есть) отдать «активным работникам». Соответственно, появились несколько состояний простоя, турбо-режимы и многое другое.
Где-то в середине этого процесса энергопотребление как характеристика процессора ушло на задний план — оно все равно меняется в широких пределах каждую секунду (а то и чаще). Зато появилось такое понятие, как TDP. Фактически, это не потребление и не совсем характеристика процессора — это требования к системе охлаждения, при выполнении которых сохраняются гарантийные обязательства поставщика процессора в случае выхода его из строя из-за перегрева. На практике TDP может быть выше реального энергопотребления, а может быть и ниже оного — это неважно. Важно то, что если сборщик конечной системы обеспечил условия по отводу, грубо говоря, как минимум 65 Вт тепла от процессора с TDP 65 Вт, то работоспособность последнего производителем гарантируется. А если не обеспечил — пусть сам с покупателем и разбирается. Таким образом, сборщик может и не обеспечивать должное охлаждение, если уверен, что в большинстве случаев ничего плохого не произойдет. Или может обеспечивать его с запасом для подстраховки.
Ну и следствие из этого, подводящее нас к основной схеме: TDP является не фактическим, а целевым параметром, определяя рабочие частоты и все остальное. Как раз из-за этого на рынке формально представлено огромное количество процессоров на одном и том же кристалле, хотя в беспечальные времена «статических частот» их были считанные экземпляры. Сейчас вот приходится выпускать Celeron для планшетов (Y-серия с TDP 11,5 Вт), ультрабуков и нетбуков (U-серия — 15 Вт), полноразмерных ноутбуков (традиционные М с тепловым пакетом 37 Вт), моноблоков и компактных десктопов (сокетные «Т»-шки, укладывающиеся в 35 Вт) и обычных настольных компьютеров (а тут уже и 53 Вт нормальное дело), т. е. пятикратный разброс между концами линейки. То же самое можно сказать и про четырехъядерные Core i7, только тут уже диапазон поскромнее — от 35 до 88 Вт. И в каждом классе — куча моделей. При том, что есть и пересечения, поскольку рынок стал более разнообразным, чем во времена одних лишь десктопов или десктопов и ноутбуков. Соответственно, нужны разные процессоры для разных условий эксплуатации.
Мы отвлеклись на продукцию Intel, поскольку этот производитель крупнее и многие этапы проходил первым. Однако и AMD приходилось решать те же задачи, причем аналогичным способом, но с поправкой на меньшую долю рынка, из-за чего дробить процессоры на такое количество тепловых классов оказалось накладным: сделаешь больше экономичных моделей — а рынку потребуются высокопроизводительные; выпустишь в следующем квартале больше обычных — а ситуация изменится. Такие ошибки планирования, разумеется, будут бить по продажам, чего желательно избегать. И компания AMD, как обычно, нашла способ избегать этих ошибок. Ноутбучные процессоры — отдельная история, но они и продаются обычно очень крупными партиями по долгосрочным контрактам. А в настольном сегменте удалось резко сократить ассортимент, как раз перейдя к настраиваемому TDP (изначально, впрочем, опробованному на серверном рынке, но там его, естественно, мало кто из широких масс трудящихся заметил).
Что было раньше? Для FM1, например, выпускались APU, рассчитанные на 65 и 100 Вт. Для FM2 изначально — они же. При создании FM2+ компания исправила второе значение на 95 Вт, что равно одной из ступенек для АМ2/АМ3 — весьма разумный подход, поскольку системы охлаждения для этих платформ совместимы. Но рынок требовал и чего-нибудь более экономичного. Для классического FM2 компания выпустила A8-6500T и A10-6700T с TDP 45 Вт, что пригодно и для мини-ПК. Они разлетелись, как горячие пирожки, подтвердив тем самым наличие спроса, однако точно оценить величину спроса сложно — по описанным выше причинам. Поэтому в линейке Kaveri процессоров со сниженным уровнем TDP нет, но они и не нужны: благодаря cTDP любой процессор с TDP 65 Вт можно заставить ограничиваться и 45 Вт, а для линейки Pro нижний порог вообще уменьшен до 35 Вт. Старшие модели (с TDP 95 Вт) ограничение уровня теплопакета, естественно, не поддерживают — чтоб разгону не мешало, благо все множители в них разблокированы. Из моделей на 65 Вт «Black Edition» только один, а именно А6-7400К, но он имеет изначально немалый запас по сравнению с А8/А10 того же теплового класса, поскольку процессор одномодульный и графическое ядро у него урезано.
В общем, что получается? В ассортименте AMD официально больше нет моделей с TDP 35/45 Вт, а у Intel они есть. Но AMD такие процессоры и не требуются, поскольку сборщик конечных систем (по совместительству нередко являющийся и их пользователем) может покупать обычные процессоры, с TDP 65 Вт, и ограничивать TDP средствами BIOS. Схема очень гибкая, но таящая в себе определенный подводный камень: если у Intel процессоры разных тепловых классов относятся к ним именно физически (за исключением ультрамобильных моделей, где у производителя есть определенная свобода), так что от системной платы ничего не зависит, то у AMD все зависит как раз от платы — в схеме работы турбо-режима она занимает не последнее место. Более того, на деле речь идет не о переключении двух режимов, заявленных в спецификации (65 и 35/45 Вт), а о гибком их конфигурировании: большинство системных плат позволяют устанавливать уровень TDP с точностью до 1 Вт в поддерживаемом диапазоне. Такая точность обычно не требуется, но для проверки работоспособности данной возможности мы провели практическое испытание промежуточных значений при помощи одного из тестов методики:
Что ж, хорошо видно, что производительность зависит от выбранного уровня TDP практически линейно. Еще очень хорошо видно, что она от него действительно зависит даже в области максимального значения, т. е. никакого «запаса» у старших двухмодульных моделей APU нет (вопреки расхожему мнению некоторых пользователей, что тепловой пакет указан с учетом графического ядра, так что процессорные его далеко не достигают). В общем, тут есть что изучать, и далеко не только сам процессор А10-7800, который, повторимся, нам все равно нужно было подвергнуть повторному тестированию с полноскоростной памятью.
Кстати, есть ли аналог такой схемы работы у Intel? Да, есть — в серверных платформах и их «настольных» модификациях. В частности, аналогичную картину зависимости производительности от TDP мы в свое время получали на разогнанном Core i7-965 Extreme. А сейчас наблюдаем то же у AMD, причем в самом что ни на есть массовом сегменте.
Конфигурация тестовых стендов
Процессор | AMD A10-7800 | AMD A10-7850K |
Название ядра | Kaveri | Kaveri |
Технология пр-ва | 28 нм | 28 нм |
Частота ядра std/max, ГГц | 3,5/3,9 | 3,7/4,0 |
Кол-во ядер(модулей)/потоков вычисления | 2/4 | 2/4 |
Кэш L1 (сумм.), I/D, КБ | 192/64 | 192/64 |
Кэш L2, КБ | 2×2048 | 2×2048 |
Кэш L3, МиБ | — | — |
Оперативная память | 2×DDR3-2133 | 2×DDR3-2133 |
TDP, Вт | 65/45 | 95 |
Графика | Radeon R7 | Radeon R7 |
Кол-во ГП | 512 | 512 |
Частота std/max, МГц | 720 | 720 |
Цена | $154(66), | $162(67), |
На первый взгляд, 7800 и 7850K выглядят как близнецы-братья: у первого частота процессорной части ниже всего на 100-200 МГц, а графическая у них и вовсе одинаковая, причем работает на постоянной тактовой частоте. На чем же компании удалось сэкономить целых 30 Вт, а то и все 60?
Все просто: на самом деле официальная документация несколько не совпадает с реальностью. Во-первых, это касается графического ядра: в наиболее экономичном режиме его частота может составлять не 720 МГц, а ≈650 или даже ≈550 МГц. Таким образом, надеяться на высокую игровую производительность в режиме 45 Вт не приходится, но если условия позволяют отводить 65 Вт, производительность GPU в двух старших А10 должна быть примерно равной. Но не производительность процессорной части — при нагрузке на графическое ядро она автоматически «проваливается» на уровень 2,5 ГГц, независимо от выбранного теплового пакета. Без оной на 65 Вт реальные частоты совпадают с приведенными в спецификации, а вот на 45 Вт снижаются примерно на полгигагерца. В общем, это куда более сложный процессор, чем кажется.
Причем все описанное выше относится к идеальному случаю: как оно может работать, если ничего не мешает. Но может мешать и материнская плата, с чем мы столкнулись при попытке повторить тестирование. В процессе решения проблем у нас образовался набор результатов, полученных на трех разных системных платах: Asus CrossBlade Ranger, Biostar Hi-Fi A88W 3D и MSI A88XM-E35. Все они основаны на одном и том же чипсете, все имеют позиционирование «выше среднего», но все работают по-разному. К сожалению, это относится не только к результатам — нам, например, не удалось «завести» на 2133 МГц никакие из имеющихся модулей памяти при использовании Asus CrossBlade Ranger. Точнее, все прекрасно работало в процессорных тестах, но вылетали все игровые — при том, что на двух других платах подобных проблем не возникло. В итоге игровые результаты отличаются и по этому параметру: для Asus они получены с DDR3-1866, а на двух других платах — в «полноценном» режиме DDR3-2133. Как это скажется — проверим.
Методика тестирования
Для оценки производительности мы использовали нашу методику измерения производительности с применением бенчмарков iXBT Notebook Benchmark v.1.0 и iXBT Game Benchmark v.1.0. Все результаты тестирования в бенчмарке iXBT Notebook Benchmark v.1.0 мы нормировали относительно результатов Pentium G3250 с 8 ГБ памяти и SSD Intel 520 240 ГБ, а сама методика вычисления интегрального результата осталась неизменной. Еще одна программа, которую мы, как и в прошлый раз, добавили к тестовому набору — бенчмарк Basemark CL 1.0.1.4, созданный для измерения производительности OpenCL-кода.
iXBT Notebook Benchmark v.1.0
Платы Asus и MSI демонстрируют ожидаемый результат: 7800 немного отстает от 7850K в режиме 65 Вт, но теряет еще 15% производительности при снижении TDP. Все соответствует тактовой частоте: в первом случае она ниже на 200 МГц, а во втором на все 700. А вот с Biostar все плохо: даже на 65 Вт система работает медленнее, чем в случае двух других плат на 45 Вт, ну а в последнем режиме производительность вообще уходит ниже 100 баллов. Такое ощущение, что незначительное использование OpenCL-кода этой моделью определяется как серьезная нагрузка на GPU со снижением тактовой частоты ниже 3 ГГц.
В этих тестах загрузка процессора, вообще говоря, ниже, так что менее заметны отмеченные ранее зависимости, но в целом они сохраняются.
Несмотря на то, что Photoshop CC не слишком любезен с «дополнительными» процессорными ядрами, быстрое выполнение кода OpenCL ему, судя по всему, полезно. Но в общем и целом это не кончается ничем хорошим для платы Biostar. Остальные же теряют по 10% производительности на каждые 30 Вт.
Audition CC еще больше тяготеет к двум-, а не четырехпоточным процессорам, но с применением OpenCL, так что тут 7800 «в родном режиме» почти не отстает от 7850K, резко снижая темп при переходе на 45 Вт. Естественно, происходит такое при нормальном управлении частотами процессорных ядер. Если у платы (или ее прошивки, что вернее) с этим есть проблемы, на результаты без слез не взглянешь.
Причем, заметим, положение дел тем хуже, чем ближе тесты к «чисто процессорным». Фактически на Biostar Hi-Fi A88W 3D при снижении TDP до 45 Вт А10-7800 «тормозится» до уровня... Pentium J2900, что было бы смешно, если бы не было так грустно.
Бывает и еще грустнее — до уровня двухъядерного Celeron J1700. А тест, напомним, тоже в первую очередь на связку «процессор—память».
Компьютер не прекращает тормозить даже при выполнении «бытовых операций». Впрочем, это все равно на 10-20% быстрее эталонной системы на Pentium G3250, но ведь можно же и быстрее!
В общем и целом анализировать результаты платы Biostar не имеет особого смысла до тех пор, пока программисты не исправят ошибки в прошивке. Asus и MSI одинаковы с точностью до погрешности измерения, так что полученные цифры можно считать как раз правильными для А10-7800. И результат этого процессора неплох: отставание от А10-7850K менее 5% в «штатном режиме» и чуть более 10% в экономичном. Таким образом, процессоры четко разделяются по позиционированию: 7850K нужен любителям разгона, а вот 7800 всем остальным будет даже более интересен. Тем более что он способен конкурировать с энергоэффективными «квадами» и двухъядерными процессорами Intel напрямую, а не с поправкой на прожорливость.
Касательно быстрой памяти и APU можно отметить следующее: с DDR3-2166 А10-7800 быстрее, чем Pentium G3250 на 3/15% (45/65 Вт), а при использовании DDR3-1333 он уже отстает на 9% на 45 Вт и буквально на пару процентов обгоняет соперника в штатном режиме. Как нам кажется, развернутые комментарии здесь не требуются :)
OpenCL
Примечательно, что и в тесте для GPU (в первую очередь) у Biostar все плохо — видимо, процессорная часть «не успевает подносить снаряды» быстрому GPU. А последний и правда быстрый: разница с 7850K минимальна в обоих режимах.
Игры в низком разрешении
Поскольку все упирается в графику, все платы примерно одинаковы. За исключением Asus, где пришлось использовать DDR3-1866.
Вот здесь уже отстающей оказалась плата Biostar — по-видимому, влияние процессорной части на частоту кадров в данной игре более весомо.
И вырожденный случай — когда именно процессорные ядра являются определяющими.
Тут — менее, но тоже ощутимо. Заметим, что в режиме 65 Вт результаты испытуемых ближе друг к другу и к 7850K: здесь не требуется управлять частотой GPU.
...поскольку именно с неправильной стратегией регулирования явно и связан проигрыш платы Biostar.
Игры в высоком разрешении
Эти результаты мы приводим без подробных комментариев, поскольку зависимости в целом те же, что и при низком разрешении: чем больше зависит от GPU, тем меньше разница между 7800 и 7850K и тем меньше влияние материнской платы. Кое-где получилось так, что 7850K оказался даже медленнее прочих, т. е. разница между процессорами вполне сравнима с погрешностью измерений и прочими сопутствующими факторами.
Итого
Итак, что мы имеем в итоге? AMD до сих пор не обновила флагмана для платформы FM2+, зато сумела выпустить очень удачный процессор с пониженным энергопотреблением, вполне сравнимый с топовым APU. Особенно это касается игр — так для подобного применения А10 и покупают. Тем более что и в плане быстродействия процессорной части все очень неплохо. В режиме 45 Вт производительность, разумеется, ниже, но ранее в этом сегменте вообще особого выбора не было — особенно при желании получить качественное видеоядро (сама AMD ранее могла предложить только А8). С ценами, правда, ситуация неидеальная, что вообще свойственно Kaveri, но тут уж все на усмотрение покупателя — нужно смотреть цены у себя на местности и покупать или не покупать в зависимости от того, устроят они или не устроят.
К сожалению, данная схема при всех своих достоинствах имеет один серьезный недостаток, которого можно было бы избежать (наверняка), будь уровней TDP действительно два (с жестко «прошиваемыми» в самом процессоре параметрами), а не текущая гибкая настройка, при которой очень многое отдается на откуп системной плате. Иногда это приводит к таким вот совсем уж неприятным эффектам, как мы сегодня получили. В ряде случаев возможно не столь катастрофическое снижение быстродействия, но тоже абсолютно ненужное пользователю. Словом, ситуация похожа на лихие 90-е — когда производительность процессора сильно зависела от платы, в которую он устанавливался. Поэтому остается только надеяться на то, что производители плат сумеют эти ложки дегтя подливать пореже — или сама AMD придумает способ лишить их такой возможности, после чего технологию Custom TDP можно будет признать однозначно полезной и рекомендованной к использованию.