Несмотря на то, что первые двухчиповые платформы («процессор+чипсет») появились на рынке стараниями SiS более 10 лет назад, до последнего времени этот вариант был не слишком уж популярным. Изредка встречался, конечно (опять же, среди решений SiS и некоторых чипсетов NVIDIA), но именно что изредка. И даже перенос контроллера памяти непосредственно в процессор (что AMD сделала еще в 2003 году) не сразу переломил тенденцию — производители по-прежнему предпочитали более гибкую и дешевую трехчиповую композицию. Однако после того, как контроллер памяти переселился и в процессоры Intel, эта компания быстро взялась за исправление ситуации. Первенцем стала платформа LGA1156, в которой от чипсета, фактически, остался один лишь прежний южный мост (в процессор отправился и контроллер PCIe, а чуть позднее — и GPU), а несколькими месяцами спустя аналогичным образом была «облагорожена» и «атомная» платформа Pine Trail — в общем, сейчас для продукции Intel это скорее правило, чем исключение.
AMD же продолжала использовать трехчиповую комбинацию, благо, как мы уже сказали, это более гибкий вариант: можно собирать какие угодно конфигурации: от многоядерного процессора с интегрированным видео и простеньким южным мостом — до среднего CPU, но с отличной поддержкой Multi-GPU и богатыми возможностями расширения. Для рынка настольных систем это хорошая практика — на типовых десктопных платах места более чем достаточно :) Но вот в мобильном сегменте логичным было количество чипов сокращать, что сейчас и делается. Первой на рынок вышла платформа Brazos, о которой мы уже вкратце писали. В принципе, ничего принципиально нового в ней нет: как и в случае решений Intel, отказ от северного моста достигается путем переноса из него и контроллера PCIe, и GPU непосредственно в процессор. Заметим, что работу над объединением CPU и GPU в AMD начали ранее, чем в Intel, а вот продукты на рынок вышли позднее.
Так что нет ничего удивительного в том, что компания позиционирует это не просто как объединение, а как принципиально новый класс устройств — APU (Accelerated Processing Unit). Дескать, теперь процессорные и видеоядра не только находятся рядом, но и представляют собой гетерогенную многоядерную процессорную архитектуру, «помогая» друг другу в решении различных задач, в том числе и не связанных исключительно с графикой. Да — то самое GPGPU, о котором много говорят в последнее время, хотя практической отдачи в массовых задачах от него меньше, чем если бы все это сотрясение воздуха направить на получение электроэнергии при помощи ветрогенератора :) Тем более что особого запаса времени у AMD нет: декодировать видео высокого разрешения (что действительно на практике многим бывает нужно) умел и встроенный видеоускоритель GMA HD (не отвечающий определению APU, поскольку GPU и CPU в «старых» процессорах Intel находились на отдельных кристаллах), а GMA HD 2000/3000 платформы LGA1155 научили уже и «помогать» процессору в транскодировании этого самого видео.
В общем, все как обычно — производители идут одним и тем же путем, иногда изобретая на нем какие-нибудь красивые названия, на деле ничего особенного не означающие. Но и ничего страшного в этом нет. Главное — как полученный продукт работает, а не то, каким образом это достигается. Как бы то ни было, но с точки зрения графики решение AMD более функциональное (в частности, поддерживается DirectX 11), теоретически более производительное (80 потоковых процессоров), да и вообще — основной конкурент (а именно Intel Atom) до сих пор не обзавелся даже чем-нибудь уровня GMA HD, не говоря уже о новейших GMA HD 2000/3000. И в плане процессорной части решение AMD несколько интереснее Atom хотя бы тем, что, подобно прочим современным процессорам, поддерживает переупорядочивание команд. При этом, благодаря более тонкому техпроцессу, Zacate и Ontario даже компактнее Atom и сравнимы с ним по уровню энергопотребления.
На этом пока с теорией закончим — у нас уже была пара статей на эту тему («Процессорное трио AMD» и «AMD Zacate — предварительный обзор первого APU»), причем останавливаться на достигнутом мы не планируем :) Поскольку же сейчас удалось получить реальный продукт на основе нового процессора, начнем знакомиться с практической производительностью. Ограничиваться одной статьей на эту тему мы тоже не станем, и сегодня вашему вниманию предлагается первая из них, в которой производительность Zacate (конкретно — AMD E-350, старшей модели в линейке) будем сравнивать с производительностью старшего Atom и пары двухъядерных Celeron — одного из первых и самого лучшего на сегодняшний момент.
Конфигурация тестовых стендов
Процессор | E-350 | Atom D525 | Celeron E1400 | Celeron E3500 |
Название ядра | Zacate | Pineview | Allendale | Wolfdale-2М |
Технология пр-ва | 40 нм | 45 нм | 65 нм | 45 нм |
Частота ядра, ГГц | 1,6 | 1,8 | 2,0 | 2,7 |
Коэффициент умножения | — | 13,5 | 10 | 13,5 |
Кол-во ядер/потоков вычисления | 2/2 | 2/4 | 2/2 | 2/2 |
Кэш L1, I/D, КБ | 32/32 | 32/24 | 32/32 | 32/32 |
Кэш L2, КБ | 2×512 | 2×512 | 512 | 1024 |
Интегрированная графика | Radeon HD 6310 | GMA 3150 | Нет | Нет |
Оперативная память | 1×DDR3-1066 | 1×DDR3/DDR2-800 | Определяется чипсетом | |
Сокет | BGA413 | BGA559 | LGA775 | LGA775 |
TDP | 18 Вт | 13 Вт | 65 Вт | 65 Вт |
Собственно, по поводу участников все сказано выше: E-350 как главный сегодняшний герой, Atom D525 как его непосредственный конкурент, Celeron E1400, к которому (несмотря на почтенный возраст) в прошлый раз новейший Atom так и не сумел приблизиться, и Celeron E3500 как быстрый представитель современных бюджетных настольных процессоров. Собственно, по предварительным прикидкам именно он и должен стать победителем сегодняшнего соревнования, однако нас больше интересует вопрос, насколько современный настольный лоу-энд быстрее Atom и Zacate в конкретном выражении.
Системная плата | Оперативная память | |
BGA559 | Gigabyte D525TUD | Kingston KVR1333D3N9K3/6G (1×800; 6-6-6-15) |
LGA775 | Gigabyte G41M-ES2H (G41) | Crucial Ballistix BL2KIT25664AA80A (2×800; 4-4-4-12) |
BGA413 | Sapphire Fusion Mini E350 (AMD A50M) | Kingston KVR1333D3S39/2G (1×1066; 8-8-8-19) |
Тестирование на единой платформе, естественно, невозможно, тем более что низкопотребляющие процессоры обычно к платам попросту припаиваются, но мы постарались максимально сократить количество использованных плат. Обоим Celeron, в частности, пришлось довольствоваться моделью на формально современном, но функционально устаревшем (зато дешевом) чипсете G41. Впрочем, «специализированная» методика тестирования такова, что графику она не затрагивает — нас интересует собственно процессорная часть (видео — отдельная история, которая требует подробного изложения, но чуть позднее). Винчестер мы опять взяли мобильный — Seagate Momentus 5400.5 ST9320320AS (2,5″, скорость вращения 5400 об/мин, емкость 320 ГБ, кэш-память 8 МБ, интерфейс SATA300), дабы исключить потенциальное влияние этого фактора. Память во всех системах была разной просто потому, что одинаковую установить просто невозможно :) Но везде использовалось по 4 ГБ — хоть этот объем и кажется великоватым для нетбуков и неттопов, однако стоит память ныне недорого, да и использование меньшей емкости ОЗУ, мягко говоря, не слишком совместимо с текущей методикой тестирования.
Тестирование
Методика тестирования производительности (список используемого ПО и условия тестирования) подробно описана в отдельной статье. Для удобства восприятия, результаты на диаграммах представлены в процентах (за 100% принят результат AMD Athlon II X4 620 в каждом из тестов). Подробные результаты в абсолютных величинах доступны в виде таблицы в формате Microsoft Excel.
Как и в прошлый раз, мы полностью убрали четыре группы тестов. Однако все баллы на диаграммах, за исключением итоговой, совместимы с «полноформатными» тестированиями, что позволяет провести быстрое самостоятельное сравнение представленных процессоров с любыми из нами протестированных. Для того чтобы это стало возможным, мы и убирали группы целиком, вместо более тонкой работы с конкретными приложениями. Последнее могло бы дать более полезный результат в узком смысле (поскольку некоторые из отброшенных приложений, возможно, и будут работать на Atom или, тем более, Zacate, а некоторые из оставленных запускать на таких системах никто не станет), но не позволило бы обеспечить совместимость результатов в широком смысле.
Графические редакторы
Трем приложениям из четырех вполне достаточно двух ядер Е-350, да и Photoshop предпочел бо́льшую эффективность двух потоков — меньшей четырех, так что процессор AMD с легкостью обошел Atom D525 на 20%. Хороший результат с точки зрения тех, кто купит нетбук на нем, но посредственный для неттопов: отставание от бюджетного настольного процессора трехлетней давности — полуторократное! У Atom оно, конечно, вообще двукратное, однако в конечном итоге разницу можно признать несущественной на практике — неттоп так и не приблизился заметным образом к старому (!) бюджетному (!) десктопу. Ну а с новым вообще и сравнивать особо нечего — Celeron E3500 является одним из самых медленных настольных процессоров, однако в сравнении с обоими «легковесами» он не просто быстр, а принципиально быстрее :)
Архиваторы
При поддержке HT Atom немного выигрывает в 7-Zip, но проигрывает в остальных двух тестах (несмотря на более емкий разделяемый кэш второго уровня), так что немного отстает и в общем зачете. Сравнения даже с бюджетными настольными процессорами все равно не получается: полуторократное отставание от трехлетнего процессора и двукратное от современного говорит само за себя. Впрочем, можно взглянуть на ситуацию и с другой стороны: как видим, в бюджетном сегменте производительность растет небыстро. Даже медленнее, чем у массовых или топовых процессоров. Таким образом, если обе компании приложат достаточные усилия к модернизации энергоэффективных решений, «временной разрыв» между ними и «полноценной» бюджетной продукцией может быть сокращен хотя бы до двух-трех лет.
Компиляция
А вот в этом весьма кэшелеюбивом (впрочем, корректнее будет говорить «всеголюбивом» :)) тесте Celeron E1400 находятся в изначально неудобном положении — всего 512К L2 на оба ядра дают о себе знать. У остальных процессоров его по мегабайту (правда у E-350 разделенного на две половины, но и то хлеб), Atom так и вовсе выполняет четыре потока вычислений одновременно… В общем, хотя от Celeron E3500 наши главные герои опять отстали в два раза, зато очень близко подобрались к Е1400. А результаты их примерно равные. Atom, впрочем, выиграл три секунды, но на баллах это не отразилось (на фоне получаса-то общего времени выполнения теста).
Java
В Intel жестоко подшутили над Atom, лишив его переупорядочивания команд. В результате даже «лишние» потоки вычисления не позволили ему капитулировать с честью — AMD E-350 быстрее на 25%. Хотя оба смотрятся достаточно бледно на фоне Celeron, но для процессоров одного класса разрыв существенен: E-350 от E1400 отделяют практически те же 25%.
Интернет-браузеры
Избиение младенцев продолжается и даже усугубляется — полуторократное превосходство! Заметной ложкой дегтя, конечно, является и то, что отставание от обоих Celeron в этом тесте тоже увеличилось, однако… Что бюджетные настольные процессоры «для интернета достаточны» — это и так все знают, а вот то, что неттопы и нетбуки на Zacate куда в большей степени соответствуют корню «net» — результат важный и показательный для тех, кто планирует подобную покупку.
Кодирование аудио
Опять сказалась возможность Atom запускать сразу четыре потока вычислений, хотя не так уж она ему и помогла — два потока E-350 оказались более эффективными :) Но все же здесь фиксируем проигрыш платформы AMD. Хотя с учетом того, как организован данный тест, ничего неожиданного в этом нет. Размер отставания от каждого из Celeron все тот же.
Кодирование видео
Несколько нетипичная для обоих процессоров (с учетом их позиционирования) задача, тем не менее хорошо раскрывающая их вычислительные возможности. Как видим, они примерно равные с небольшим преимуществом решения AMD.
Итого
Те, кто ждал от платформы Brazos чуда, возможно, будут разочарованы, поскольку чуда не случилось — новое решение AMD, безусловно, несколько быстрее Pine Trail, но относится к тому же классу, если говорить о производительности собственно процессорной части. Конкурировать с настольными процессорами (пусть и бюджетными трехлетней давности) ни то, ни другое все еще не может. Да и сложно было бы ожидать обратного — все-таки производительность К8/К10 давно уже известна всем, а выше головы не прыгнешь. В свое время (лет пять назад) Athlon 64 X2 3600+ (младший в линейке) неплохо выглядел на фоне Pentium D, но мгновенно «сдулся» после появления Conroe. И чем кончилась попытка сравнения Athlon X2 BE-2350 со «старыми» Pentium E2000 (которые были, конечно, чуть лучше, чем Celeron E1000, но хуже, чем новые Celeron E3000) тоже можно посмотреть в статье по ссылке. А ведь оба упомянутых процессора AMD все-таки работали на частоте порядка 2 ГГц, а не 1,6 ГГц, как E-350. Да, конечно, при переходе от К8 к К10 компания провела немало оптимизирующих мероприятий, однако какого-либо сногсшибательного эффекта, способного скомпенсировать уменьшение тактовой частоты (а также урезание кэш-памяти первого уровня), все они не дают.
Впрочем, можно взглянуть на сложившуюся ситуацию и совсем с другой точки зрения. Да, безусловно, по производительности Brazos даже в старшей модификации (т. е. с процессорами семейства Zacate, а не Ontario) возвращает нас на пять-шесть лет назад. Но ведь тогда тот же уровень достигался при использовании многочиповой компоновки, центральным элементом которой являлся процессор с TDP в несколько десятков ватт. Плюс северный мост чипсета, который питался далеко не святым духом. Плюс отдельный видеочип — а ведь по производительности и, особенно, функциональности нынешний Radeon HD 6310 на голову выше не только интегрированных решений того времени, но и дискретных видеокарт среднего (а то и топового) уровня: еще экономия нескольких десятков ватт. А в денежном исчислении все это суммарно тянуло на несколько сотен долларов. Сейчас же те же возможности удалось «втиснуть» в один маленький чип, а ту же сумму придется отдавать за готовый мобильный компьютер, со всей дополнительной обвязкой (включая дисплей, накопители и прочее). Так что не все так плохо. Хотя, конечно, всегда хочется, чтобы и производительность была повыше :)
Что касается сравнения непосредственных конкурентов вида «старший Zacate против старшего Atom», то, как видим, в плане процессорной части они примерно эквивалентны: в общем зачете E-350 быстрее D525 примерно на 10%. Но у обоих процессоров есть свои сильные и слабые места. Atom не так уж мало выигрывает в плане потребляемой и выделяемой мощности (TDP 13 Вт против 18 Вт) и хорошо себя чувствует в мультипоточном окружении. У Zacate же выше производительность на поток, что иногда сказывается драматическим образом: достаточно посмотреть на тесты браузеров и Java-машины — а ведь как раз такие задачи зачастую приходится решать нетбукам и неттопам!
Ну и сильным местом нового APU является то, что он действительно APU — наличие аж 80 блоков потоковой обработки, работающих с частотой 500 МГц. А это не так уж и мало — шейдерные процессоры эквивалентны применяемым в сериях Radeon HD 5000/6000. Что касается количества, а не качества, то, фактически, в новые процессоры компания встроила свое… младшее дискретное решение (причем настольное, а не мобильное — те еще слабее) — HD5450 (там те же два SIMD-блока по 40 процессоров в каждом, только работающие на частоте 650 МГц). Разумеется о полном равенстве решений речи не идет, поскольку 5450 имеет свою память, за доступ к которой не нужно сражаться с процессорными ядрами, но в остальном они вполне сравнимы. И на голову превосходят самое мощное из прежних интегрированных решений AMD в виде Radeon HD 4290 (топовый чипсет 890GX), где процессоров всего 40 (пусть и работающих на частоте 700 МГц), да и функциональность которого находится лишь на уровне предыдущего поколения GPU AMD.
Таким образом, у Brazos имеется туз в рукаве при игре с Pine Trail: в приложениях, где получится хотя бы часть работы переложить на потоковые процессоры, производительность будет различаться существенным образом. Конечно, возможность разыграть этого «туза» сильно зависит от производителей программного обеспечения, однако в некоторых относительно массовых задачах, типа просмотра видео в HD-форматах (включая флэш-плеер), эффект есть уже сейчас. Но встроенное в эти процессоры видеоядро — тема отдельной статьи (и даже не одной). А сегодня мы с вами с практической точки зрения оценили собственно процессорную часть чипа. Которая, напомним, в среднем оказалась чуть лучше Atom (а значит, и заметно лучше предыдущих мобильных энергоэкономичных решений AMD, типа Athlon Neo). Но революции не произошло — до уровня хотя бы Celeron трехлетней давности все еще далеко.