Недавно мы вкратце изучили производительность трех APU для Socket FM1, упомянув также о короткой жизни упомянутой платформы — дебютировав на рынке летом 2011 года, в конце 2012-го она уже начала уступать место процессорам и платам с Socket FM2. Но и платформа Socket FM2 формально не зажилась — вот уже где-то год проходит поэтапное внедрение FM2+. Впрочем, внедрение это очень поэтапное — две платформы совместимы снизу вверх, т. е. более старые процессоры можно использовать и на новых платах, но не наоборот. Новым APU подходят только новые, однако расширяет их ассортимент компания не слишком торопливо — почти год как самой быстрой моделью продолжает оставаться A10-7850K, замены которой все еще нет, ну а в младших семействах новая архитектура вообще почти не представлена.
А стоит ли за ней вообще гоняться? Компания много рассказывает о бенефициях HSA и вообще — светлом будущем гетерогенных систем, но, по правде говоря, реальный прогресс в данной области продолжает приносить весьма скромные плоды. Да, конечно, по сравнению с ситуацией трехлетней давности использование OpenCL стало хоть немного заметным в массовом программном обеспечении, но ведь история внедрения GPGPU насчитывает уже более пяти лет. Все эти годы мы слышали обещания, что вот завтра-то гетерогенные вычисления станут массовыми и нужными каждому пользователю, а на деле те, кто покупал компьютеры в те годы, уже успели их поменять :) Не все, конечно, но те, кто старался получить максимум производительности — точно. А вот те, кто к покорению вершин не стремился, вряд ли торопился с прыжками с платформы на платформу. Поэтому нам стало интересно — а каковы «вершины» каждой из них? Чтобы это выяснить, достаточно протестировать всего три процессора, чем мы сегодня и займемся.
Конфигурация тестовых стендов
Процессор | AMD A8-3870K | AMD A10-6800K | AMD A10-7850K |
Название ядра | Llano | Richland | Kaveri |
Технология пр-ва | 32 нм | 32 нм | 28 нм |
Частота ядра std/max, ГГц | 3,0 | 4,1/4,4 | 3,7/4,0 |
Кол-во ядер(модулей)/потоков вычисления | 4/4 | 2/4 | 2/4 |
Кэш L1 (сумм.), I/D, КБ | 256/256 | 128/64 | 192/64 |
Кэш L2, КБ | 4×1024 | 2×2048 | 2×2048 |
Кэш L3, МиБ | — | — | — |
Оперативная память | 2×DDR3-1866 | 2×DDR3-2133 | 2×DDR3-2133 |
TDP, Вт | 100 | 100 | 95 |
Графика | Radeon HD 6550D | Radeon HD 8670D | Radeon R7 |
Кол-во ГП | 400 | 384 | 512 |
Частота std/max, МГц | 600 | 844 | 720 |
Цена | Н/Д(0) | $138(73) | $162(67) |
A8-3870K является самым быстрым устройством в исполнении FM1, на каковом посту весной 2012 года сменил A8-3850. А в конце того же года, как уже было сказано выше, на смену FM1 пришла платформа FM2 и новый флагман в лице A10-5800K, который летом 2013 года уступил место A10-6800K. Где-то спустя полгода оказалось, что FM2 не сможет работать с процессорами на новых ядрах, так что пришлось переходить на FM2+, сохранив, впрочем, совместимость в обратном направлении. Но формально топовым APU AMD стал A10-7850K, замены которому пока нет. Его мы уже тестировали недавно, однако из-за особенностей использованной материнской платы частота памяти оказалась равной 1333 МГц, а не 2133 МГц, что, разумеется, на многих результатах сказалось и потребовало устройство «перемерять» :)
Таким образом, у нас и получилось три процессора для двух с половиной платформ, тестированием которых мы и будем заниматься сегодня.
Методика тестирования
Для оценки производительности мы использовали нашу методику измерения производительности с применением бенчмарков iXBT Notebook Benchmark v.1.0 и iXBT Game Benchmark v.1.0. Все результаты тестирования в бенчмарке iXBT Notebook Benchmark v.1.0 мы нормировали относительно результатов Pentium G3250 с 8 ГБ памяти и SSD Intel 520 240 ГБ, а сама методика вычисления интегрального результата осталась неизменной. Еще одна программа, которую мы как обычно добавили к тестовому набору — бенчмарк Basemark CL 1.0.1.4, созданный для измерения производительности OpenCL-кода.
iXBT Notebook Benchmark v.1.0
Приложение способно загрузить работой хоть 16 потоков вычисления, да еще и активно использует OpenCL, так что результаты всех трех APU существенно различаются. Как и положено, самым быстрым оказался 7850К, но несколько смущает то, что его преимущество над 6800К каких-то 5%, в то время, как переход с FM1 на FM2 способен дать более 15%.
В создании контента и вовсе самый новый APU AMD проигрывает предшественнику. А чем эти программы отличаются от конвертеров? Они тоже неплохо задействуют процессорные ядра, но вот вклад GPU здесь куда менее весом. Таким образом, можно утверждать, что процессорная часть при переходе с 6800К на 7850К даже стала медленнее, а все случаи, когда последнему удается выиграть (или, хотя бы, не проиграть) связаны в основном с гетерогенными вычислениями. Так это или не так — проверим при помощи других тестов. Пока же отметим, что переход с FM1 на FM2 по-прежнему способен обеспечить порядка 15%: этого слишком мало, если первая платформа уже есть в наличии, но не так и плохо в глобальном плане.
Photoshop не относится к программам, слишком уж активно использующим OpenCL, но, тем не менее, в нем 7850К с работой справился немного быстрее. Что ж — значит иногда и улучшения архитектуры в Kaveri сказываются настолько, что способны превозмочь отставание по тактовой частоте. А вот «атлоноподобная» архитектура Llano здесь однозначный аутсайдер — 30-35% разницы говорят сами за себя.
Но иногда выход на сцену A10-7850K кончается позором — как в этом случае. Он конечно обогнал А8-3870К, но сделал это вяло и нехотя, расположившись почти посередине между упомянутым «старичком» и тоже не новым А10-6800К. Впрочем, даже последний далеко не дотягивает до банального бюджетного Pentium G3250 (который, напомним, в этом цикле взят нами за точку отсчета в 100 баллов), что связано с не слишком высокой потребностью приложения в многопоточности. Словом, производительность каждого вычислительного потока в процессорах AMD по-прежнему остается очень низкой, что можно скомпенсировать разве что высокими тактовыми частотами. А можно и не скомпенсировать :)
Но бывает и так, что четыре «полуядра» обгоняют четыре ядра, даже будучи задействованными полностью. Более того — четыре «полуядра» меньшей тактовой частоты могут обогнать и сходные, работающие на большей. Правда совсем немного, да и, опять же, по сути речь идет лишь о конкуренции с двухъядерными процессорами Intel. Причем с «совсем двухъядерными» - типа Celeron и Pentium, поскольку Core i3 со своими четырьмя потоками вычисления будут уже быстрее.
Ситуация сходная с предыдущим случаем, хотя тут более новый процессор еще и более медленный. В общем, их проще считать примерно равными в среднем — иногда немного быстрее один, иногда немного быстрее другой. Чем лучшие устройства для FM1 быстрее, но это было достигнуто, повторимся, уже на этапе перехода с FM1 на FM2, а последующий тюнинг платформы преимущество не увеличил.
Для тестирования двух процессоров из трех мы воспользовались одной системной платой, так что тут условия максимально равные. Да и результат примерно равный. A8-3870K работал на более старой плате со старым чипсетом и медленной памятью, но тут в принципе ничего изменить нельзя, так что можно констатировать, что и «в быту» системы с ним где-то на 20% медленнее — аналогично прочим тестам.
Итог закономерен: смена FM1 на FM2 обеспечивает потенциально порядка 20% производительности и позволяет хотя бы оторваться от Pentium, а внедрение FM2+ не дает вообще ничего :) Что касается быстрой памяти, то и для приложений общего назначения она полезна: DDR3-2133 обеспечила 21% превосходства над Pentium G3250, а в нашем более раннем тестировании с DDR3-1333 A10-7850K обходил этот процессор лишь на 6% в общем зачете.
OpenCL
Переход на Kaveri может что-то дать при активном внедрении гетерогенных вычислений — как видим, скорость интерпретации OpenCL-кода у A10-7850K почти в полтора раза выше, чем обеспечивает A10-6800K, а A8-3870K он обгоняет почти вдвое. Прекрасный результат, который портит лишь одно — на практике большую часть времени процессорам все еще приходится «ворочать» обычный х86-код. «Ускориться» посредством GPGPU можно не везде, да и там, где можно, улучшения имеют лишь местный эффект. Иными словами, если код, занимающий 10% общего времени выполнения, будет ускорен даже на порядок, сэкономить удастся всего 9% времени. О чем всегда стоит помнить, рассматривая идеальные случаи — неважно: в специализированных бенчмарках или особенно хорошо ложащихся на GPGPU алгоритмах.
Игры в низком разрешении
Режим 1366х768 является вторым по популярности среди геймеров по статистике Steam, но связано это в первую очередь с популярностью ноутбуков (в том числе, и позволяющих хоть как-то поиграть в игры). Для настольных систем он несколько атипичен, однако если уж приходится полагаться на силы встроенного видеоядра, тут уж не до жиру.
Что сразу же демонстрирует первая же взятая нами для сравнения игра: как видим, даже в низком разрешении и на минимальных настройках удается получить неплохое, но не идеальное быстродействие. Причем можно это сделать даже на старых А8, а более новые А10 лишь увеличивают «запас прочности», но не более того: высококачественный режим далек даже для А10-7850К.
Аналогично складывается положение дел и в Bioshok. И неважно, что в качественном режиме A10-7850K обошел А10-6800К аж на 20% — их обоих для такого режима мало. По мере же снижения качества, как видим, разница в производительности быстро снижается.
Вот в «танчики» можно погонять и в качественном режиме. А8-3870К справляется с этим, правда, без особого запаса, что, скорее всего, будет верно и для других А8, а вот А10 — вполне достаточно. И большого смысла в снижении качества нет — игра очень процессорозависима, причем движок ее до сих пор радикально однопоточный, так что каких-то умопомрачительных результатов от процессоров AMD ждать не стоит, независимо от используемой видеокарты. И с учетом сказанного, нет ничего удивительного, что самым быстрым оказался не 7850К, а 6800К ;)
Хотя сама игра отлично работает и на A8-3870K, бенчмарк для нее не запускается на многих процессорах, поскольку требует обязательной поддержки команд AVX. Поэтому можно лишь сравнить два А10, но это не очень интересно — их обоих «слишком много» для минимальных настроек, но мало для режима высокого качества. В общем, и там, и там на практике будет использоваться нечто среднее :)
Metro худо-бедно работает на А8 и хорошо — на А10, но тут замахиваться на режим высокого качества можно будет еще очень не скоро.
А вот требования Hitman еще выше, так что и у А10 (не говоря уже об А8) особого запаса нет даже «на минималке». Но играть можно на всех процессорах.
В общем, вывод простой — в низком разрешении и на минимальных настройках все APU начиная от A8 справляются с большинством игр. Появление А10 вместе с выпуском FM2 производительность платформы увеличило, переход на FM2+ пока не дал ничего. А вот высокие настройки пока еще не получится использовать даже в таком разрешении. Точнее, в старых и/или простых играх — вполне, но не более того.
Игры в высоком разрешении
Итак, увеличивать качество пока не получится. А нельзя ли хотя бы на настольных А10 повысить разрешение до нормального?
FPS на грани «играбельности», но с правильной стороны этой грани. Разумеется, «на минималках», но хоть так — уже неплохо.
Положение дел еще лучше — тут уже безо всяких натяжек нормальная частота кадров.
В «танчиках» есть даже некоторый запас для повышения качества. Впрочем, игра весьма динамичная, так что просадки FPS тут ни к чему, так что лучше уж не гоняться за визуальными эффектами. Но вот разрешение можно не снижать — уже хорошо.
В кольцевых гонках слишком высокая частота кадров, напротив, не требуется, так что тут уже можно и качество повысить. Не до максимального, естественно, но «на минималках» мучаться не обязательно.
И две игры пока не сдаются даже топовым А10 и даже на минимальных настройках. Впрочем, в Hitman, пожалуй что можно и поиграть: 28-29 средних FPS для этого в принципе хватит, тем более, что минимальная частота кадров ниже 20 не опускается.
Таким образом, общий вердикт прост — поиграть на минимальных настройках с FHD-разрешением в принципе можно не во все, но во многие игры. Естественно, в этом случае речь о высоком качестве уже не идет практически никогда. За исключением игр с совсем уж слабой графикой, что естественно.
Итого
Как видим, несмотря на всю «прогрессивность» процессоры на ядре Kaveri абсолютно не интересны как минимум для владельцев плат с сокетом FM2: для перехода на них придется плату менять, в то время, как старшие модели Richland способны обеспечить тот же уровень производительности процессорной части и почти тот же графической и без замены. А с учетом текущих розничных цен можно даже утверждать, что настольные Kaveri не нужны... никому. В самом деле: A10-7850K намного дороже, нежели А10-6800К. Есть возможность сэкономить еще больше — купив А10-6790К или вообще А10-5800К: они медленнее из-за более низкой тактовой частоты, зато намного дешевле — в полтора раза и более. Ну а отставание по частоте можно и скомпенсировать небольшим разгоном, благо у всех упомянутых APU все множители разблокированы. А10-7850К, конечно, тоже можно немного разогнать, но вот платить за него придется слишком дорого. Настолько, что цена сравнима с, например, комплектом из Athlon и быстрой (во всяком случае, куда более быстрой, чем любая интегрированная графика) дискретной видеокартой, использование которого вполне возможно даже в некоторых mini-ITX системах, не говоря уже о MicroATX. В общем, при таких малозаметных улучшениях, A10-7850K и его аналоги должны стоить столько же, сколько предшественники, но никак не дороже — только в этом случае покупка будет оправдана.
Жестко? Да, но так уж вышло. Причем, заметим, что выше мы говорили только о внутрифирменной конкуренции, не провоцируя так любимые многими «войны за веру» - добавление к списку рассматриваемых решений еще и процессоров от Intel может только усугубить расклад. Но сегодня мы этим заниматься не будем, поскольку в основном ограничиваемся процессорами (вернее, APU) AMD. Так что просто подытожим, что даже для рафинированного фаната, выбирающего строго из ассортимента одного из основных вендоров, случаев, в которых оправдана покупка устройства под FM2+, на данный момент почти нет. Хотя это не отрицает покупку при прочих равных платы именно с таким разъемом — вполне возможно, что в будущем ситуация изменится. Но вряд ли сильно — радикальное улучшение GPU на практике нивелируется невысокой скоростью работы с памятью. Вот на последней лучше не экономить, но и не надеяться на улучшения в будущем: повышение частот будет связано только с переходом на DDR4, для чего с большой вероятностью все равно потребуется новый сокет.
Оценивая же прогресс компании за три года... В целом не слишком высокий. Да, разумеется, процессоры Llano использовали весьма архаичную микроархитектуру, унаследованную от Phenom II 2008 года разработки (а на практике восходящую к еще более ранним временам), так что обновление процессорной части было весьма актуальным. Однако на практике оно повысило производительность лишь примерно на 20%, причем сделано это было уже в APU Trinity/Richland, т. е. на первом шаге обновления — второй не дал ровным счетом ничего. Графическая часть также улучшилась, что позволило «надстроить» линейку А4-А6-А8 еще одной ступенькой в виде А10, но и это было сделано уже при разработке Trinity — практической пользы от Kaveri почти никакой, поскольку производительность GPU уже сильно лимитирует производительность памяти. Ну а с учетом того, что, как сказано было выше, пока еще процессоры под «полный» FM2+ стоят слишком дорого, эффект от последней модернизации семейства APU вообще отрицательный.
В общем, как видим, на месте топчется давно уже не только Intel, но и AMD. А вот кто больше — пока не ясно: для этого надо проверить на практике и решения крупнейшего производителя процессоров, чем мы в ближайшее время и займемся.