Bulldozer… Пожалуй, самый долгожданный продукт (точнее, архитектура целого семейства продуктов) второй половины 2011 года. Наряду с LGA2011 и SB-E у Intel, конечно, но цены этого настольного выброса серверного сегмента изначально заставили даже истинных фанатов компании возлюбить экстремальную платформу лишь платонически — без надежд на физическое обладание :) Насчет новых процессоров AMD таких опасений не было: благодаря давно возникшим утечкам было известно, что даже старшие модели будут стоить дешевле, нежели, например, Core i7-2600, а младшие — и вовсе впишутся в мейнстрим. Плюс полный карт-бланш на любые методы разгона, плюс потенциальная возможность разблокировки дешевых «трехмодульных» процессоров, плюс возможность использования новых процессоров совместно с уже купленными материнскими платами (что в глазах местами еще не до конца вымерших поклонников покомпонентной модернизации компьютеров является весомым достоинством) — все это заранее привлекло внимание многих энтузиастов. Ну а людей со здоровой психикой привлекали заявления о выросшей производительности новых решений сравнительно со старыми. Да и в общем-то вполне обычное стремление увидеть что-нибудь новое у AMD (а до последнего времени все процессоры этой компании восходили к К7 десятилетней давности, развивавшегося все эти годы чисто эволюционным путем, который все более и более начинал напоминать эволюционный тупик) и надежды на то, что даже если процессоры нового семейства и не сумеют сразу после старта занять лидирующее положение по производительности, то хотя бы обострят конкуренцию в сегменте 200-300 долларов, что (чем шайтан не шутит!) сможет привести и к снижениям цен.
Именно поэтому новых процессоров ждали многие. Так, как давно не ждали ни один из процессоров AMD, за исключением, может быть, первых Phenom. Тогда вот, правда, такое затянувшееся ожидание сыграло с поклонниками компании злую шутку — первое время эти «истинно четырехъядерные» процессоры возлагаемых на них надежд не оправдывали. Над ними пришлось достаточно долго работать, чтобы в конечном итоге прийти к очень неплохим Phenom II, но это было уже позднее. Вообще, складывается ощущение, что проще всего было разрабатывать как раз K7 и K8 — тогда мало кто надеялся на то, что у компании получится что-нибудь удачное, так что никаких излишних надежд (с последующими разочарованиями) не было. А тут… вынь да положь чудо. А часто ли чудеса случаются?
Первоначально Сеть будоражили слухи, что процессоры семейства FX (в AMD заранее верили в возможности новых CPU, так что подлили масла в огонь ожидания реанимацией торговой марки, под которой когда-то компания отгружала самые быстрые процессоры на рынке, ценой порядка 1000 долларов каждый) появятся еще летом. К этому моменту производители системных плат уже успели обновить свои модельные линейки продукцией с разъемом AM3+ (и на новых чипсетах тоже), а также наперегонки повыступать с анонсами о поддержке новых процессоров старыми моделями — которые «просто» АМ3. В общем, все замерли в ожидании, и… Процессоры широкой публике представлены не были. Оказалось, что они «не совсем готовы», так что нуждаются в доработке. Однако инженерных образцов к тому моменту в руки разнообразных «независимых» тестеров попало немало, так что, не имея точной информации о производительности новых процессоров, все ресурсы начали наперегонки публиковать «предварительные» данные. Прямо скажем, не слишком блестящие. В паре с задержкой анонса это вызвало тот эффект, о котором мы предупреждали еще по весне: Bulldozer рискует тоже оказаться хорошим процессором, но недостаточно хорошим с учетом выданных ему авансов. После чего, как это часто бывает, наиболее активные его сторонники первыми же мигрируют в лагерь противников — неудовлетворенные ожидания нередко делают с людьми и не такое. Как-то сразу затихли те, кто ожидал побед над более дорогим Core i7-2600, зато нашлось немало желающих позлорадствовать по поводу того, что вот, дескать, даже в срок процессор сделать не могут, а что сделали — никуда не годится. В общем, второй этап ожидания официального анонса, в отличие от первого, был заполнен не оптимизмом, а сарказмом. Но наконец-то он закончился — что бы там ни получилось, но компания, похоже, решила, что еще одного переноса анонса процессор не переживет, так что пора.
Что случилось на самом деле? Практически в AMD умудрились наступить на те же грабли, которые нанесли большой урон Intel при работе над Prescott: одновременно и представить новую архитектуру, и освоить новый технологический процесс изготовления кристаллов. Но прежде чем злорадствовать по поводу ошибочности данного пути, стоило задуматься: а был ли у компании другой выход? Делать простой «шринк» Stars на 32 нм особого смысла не имело — запас модернизации данная архитектура уже исчерпала. В Llano вот сделали, ну и что? Спасает новые (настольную и мобильную) платформы лишь очень высокая степень интеграции компонентов, позволяющая при помощи всего двух чипов создавать вполне современные компьютеры не без возможности даже игрового применения, но отнюдь не привлекательность собственно процессорной части, которая как раз отсутствует напрочь. А продолжать выпускать Phenom II тоже особого смысла не имеет. Четырехъядерный Deneb имеет площадь 258 мм² при 758 миллионах транзисторов, шестиядерный Thuban — все 346 мм² и 904 миллиона транзисторов. Но по сути, что тот, что другой уже неспособны конкурировать с Sandy Bridge площадью лишь 216 мм².
Допустим, более тонкие нормы позволили бы сравняться по площади и немного повысить тактовые частоты, но это было бы решением лишь на несколько месяцев — в лучшем случае до выхода Ivy Bridge (а может, и этого бы не получилось — нынешние процессоры Intel имеют немалый запас для роста тактовых частот без каких-либо существенных переделок). Zambezi (основа новых FX) содержит уже около двух миллиардов транзисторов, так что выпуск подобного процессора по нормам 45 нм почти невозможен (либо цены должны быть четырехзначными — какие наблюдались у серверных Intel Beckton). А вот при использовании техпроцесса 32 нм площадь удалось сделать равной всего 315 мм²! Не так уж и мало, но уже очевидно, что если процессор будет сразу хотя бы равен или немного лучше, чем Phenom II X6, смысл в нем есть. Пусть и не с точки зрения фанатов, а согласно рыночным реалиям — он может быть дешевле в производстве, нежели Thuban. Ну а далее — простое «вылизывание» архитектуры уже в процессе продаж готовых устройств, что компания делать умеет. Да — фанаты будут не слишком довольны: они ж чуда желали. А всем остальным и такой прогресс подойдет.
В общем, тройка новых процессоров нового семейства так или иначе с сегодняшнего дня начинает продаваться в магазинах. Архитектура эта, еще раз повторимся, новая, именно ей в ближайшее время предстоит стать основой всех процессоров AMD (в том числе, прийти и в APU), так что у любителей теоретических исследований открывается огромное поле для деятельности. Мы им мешать не будем :) Сегодня на повестке дня стоит практический вопрос: следует ли из возможности покупки нового процессора ее оправданность c точки зрения использования совершенно обычных программ повседневного спроса? Т. е., переводя с русского на русский, мы будем тестировать старшую из представленных моделей с применением нашей стандартной методики тестирования.
Конфигурация тестовых стендов
Процессор | FX-8150 | Phenom II X4 980 | Phenom II X6 1100T | Core i5-2500 | Core i7-2600 |
Название ядра | Zambezi | Deneb | Thuban | Sandy Bridge QC | Sandy Bridge QC |
Технология пр-ва | 32 нм | 45 нм | 45 нм | 32 нм | 32 нм |
Частота ядра (std/max), ГГц | 3,6/4,2 | 3,7 | 3,3/3,7 | 3,3/3,7 | 3,4/3,8 |
Стартовый коэффициент умножения | 18 | 37 | 33 | 33 | 34 |
Схема работы Turbo-режима | 6-6-6-6-3-3-3-3 | — | 3-3-3-0-0-0 | 4-3-2-1 | 4-3-2-1 |
Кол-во ядер/потоков вычисления | 8/8 | 4/4 | 6/6 | 4/4 | 4/8 |
Кэш L1, I/D, КБ | 4×64/8×16 | 4×64/4×64 | 6×64/6×64 | 4×32/4×32 | 4×32/4×32 |
Кэш L2, КБ | 4×2048 | 4×512 | 6×512 | 4×256 | 4×256 |
Кэш L3, МиБ | 8 | 6 | 6 | 6 | 8 |
Частота UnCore, ГГц | 2,2 | 2 | 2 | 3,3 | 3,4 |
Оперативная память | 2×DDR3-1866 | 2×DDR3-1333 | 2×DDR3-1333 | 2×DDR3-1333 | 2×DDR3-1333 |
Видеоядро | — | — | — | GMA HD 2000 | GMA HD 2000 |
Сокет | AM3+ | AM3 | AM3 | LGA1155 | LGA1155 |
TDP | 125 Вт | 125 Вт | 125 Вт | 95 Вт | 95 Вт |
Цена | Н/Д(0) | Н/Д(0) | Н/Д(0) | $229(43) | $340(32) |
Внутреннее устройство новых процессоров стало настолько новым, что возникли сложности с наполнением стандартной таблички, а также сравнением технических характеристик новых процессоров со старыми. Во-первых, ныне «ядра» — это не те ядра, что были ранее. AMD впрочем, могла бы сохранить старый подход, честно сообщив, что используется вариация на базе SMT, но в компании решили по-иному. Хотя бы потому, что сложно было бы объяснить покупателям, почему вместо шестиядерных процессоров за те же деньги начали предлагаться четырехъядерные. Ну а переход с шести на восемь ядер — совсем другое дело, в обоснованиях не нуждающееся. Под ядром теперь понимается совокупность транзисторов, способных выполнять один поток х86-кода — определение достаточно корректное, тем более что в рекламных материалах AMD аккуратно оперирует понятием «х86-ядро» (что сильно напоминает, кстати, сотни «ядер» графических процессоров ;)). Но единственное, что есть собственного у нового ядра — это кэш данных первого уровня, емкостью 16К. А вот два таких ядра объединяются в модуль. В последнем еще есть один блок FPU/MMX/SSE и т. п. (на двоих), кэш инструкций емкостью 64К и 2 МиБ кэш-памяти второго уровня. Три или четыре модуля в совокупности и дают на данный момент полный процессор после того, как к ним добавят еще 6/8 МиБ L3 (по 2 МиБ на каждый модуль, т. е. в шестиядерном FX-6100, ценой всего 165 долларов, или в ожидающемся чуть позже FX-4100 за «сущие копейки» в количестве 115 этих самых копеек можно будет попробовать разблокировать не только «ядра», но и кэш), а также контроллеры памяти и HT.
В принципе, сразу видны слабые места новой конструкции. В частности, от одно-двухпоточных приложений процессоры будут страдать даже сильнее, нежели Phenom II X6: ранее на каждый поток приходилось по 64К быстрого кэша данных, а теперь емкость уменьшилась в четыре раза. Правда в те же четыре раза увеличился потенциально доступный одному потоку кэш L2, но скомпенсирует ли одно другое? Сложный вопрос. Да и блоков для работы с плавающей запятой, а также целочисленными векторными инструкциями столько же, сколько в Phenom II X4, что можно считать шагом назад относительно Phenom II X6. Правда, они должны работать быстрее, причем в пределе как раз вдвое… Но ладно — не будем отбирать хлеб у исследователей микроархитектур :) Как уже было сказано выше, сегодня перед нами стоит вполне практическая цель: посмотреть, как все эти смелые решения будут себя вести на практике — в реальных программных пакетах. Чем и займемся.
Благо тратить много времени на представление конкурентов не приходится — естественно, ими просто обязаны стать самые быстрые Phenom II X4 и X6, а также два процессора для LGA1155, между которыми по цене и позиционируется FX-8150. Да и не только по ней — в своих материалах компания AMD сравнивает нового флагмана именно с i5-2500 и i7-2600. Вот и мы не будем изобретать велосипед.
Системная плата | Оперативная память | |
LGA1155 | Biostar TH67XE (H67) | Corsair Vengeance CMZ8GX3M2A1600C9B (2×1333; 9-9-9-24) |
AM3 | ASUS M4A78T-E (790GX) | Corsair Vengeance CMZ8GX3M2A1600C9B (2×1333; 9-9-9-24-2T, Unganged Mode) |
AM3+ | ASUS Crosshair V Formula (990FX) | G.Skill [RipjawsX] F3-14900CL9D-8GBXL (2×1866; 9-10-9-28) |
Тестирование
Традиционно, мы разбиваем все тесты на некоторое количество групп и приводим на диаграммах средний результат по группе тестов/приложений (детально с методикой тестирования вы можете ознакомиться в отдельной статье). Результаты на диаграммах приведены в баллах, за 100 баллов принята производительность референсной тестовой системы iXBT.com образца 2011 года. Основывается она на процессоре AMD Athlon II X4 620, ну а объем памяти (8 ГБ) и видеокарта (NVIDIA GeForce GTX 570 1280 МБ в исполнении Palit) являются стандартными для всех тестирований «основной линейки» и могут меняться только в рамках специальных исследований. Тем, кто интересуется более подробной информацией, опять-таки традиционно предлагается скачать таблицу в формате Microsoft Excel, в которой все результаты приведены как в преобразованном в баллы, так и в «натуральном» виде.
Интерактивная работа в трёхмерных пакетах
Изначально было много прогнозов, что новая архитектура все-таки повысит производительность на поток. В этой группе приложений подобный эффект был бы хорошо заметен (и на примере Sandy Bridge хорошо проявлялся). Если бы существовал на практике. Чего, как видим, не наблюдается — это плохая новость. Но есть и хорошая: по-видимому, упрощение каждого «ядра» во многих случаях удается скомпенсировать архитектурными улучшениями или тактовой частотой (второе — более вероятно), так что процессор даже в этой группе оказался пусть и чуть-чуть, но лучше, чем Phenom II. Причем, как видим, здесь старший Phenom II X6 был (тоже чуть-чуть) хуже старшего Phenom II X4, а вот у FX-8150 подобных проблем нет. Но и о конкуренции с процессорами на ядре Sandy Bridge, конечно, тоже говорить преждевременно. Вернее, говорить-то можно, но разве что говорить.
Финальный рендеринг трёхмерных сцен
Скорее всего, это наилучшая иллюстрация разницы между ядрами и «ядрами» — напомним, что нецелочисленных модулей (а именно они тут и задействуются) в процессоре как раз столько, сколько модулей (каламбур), т. е. не восемь, а всего четыре. А в Phenom II X6 их все-таки шесть, поэтому он быстрее, но они медленные, поэтому он немного медленнее, чем Core i5-2500, где ядра быстрые, пусть их всего четыре. В конечном итоге результат новинки все-таки ближе к Phenom II X4, пусть и с чуть более чем десятипроцентным перевесом над старшим представителем последней линейки.
Впрочем, в этой группе многое может еще измениться. Судя по всему, в используемых нами версиях рендер-движков точно не применяется AVX (поэтому, например, Core i7-870 быстрее, чем Core i5-2500), да и новые версии SSE тоже слабо задействованы (иначе бы отставание Phenom II X6 1100T от того же Core i5-2500 было бы не номинальным, а вполне заметным). По мере того, как поддержка современных расширений набора инструкций станет более массовой, «феномы» начнут всё больше и больше проваливаться в производительности, а вот «бульдозеру» это не грозит: он и AVX поддерживает, и SSE 4.2 тоже. Разумеется, конкуренции с Sandy Bridge это вряд ли поможет (сложно представить, что свои «любимые» наборы команд компания Intel реализует хуже), а вот секретное оружие в виде FMA4 — может и выстрелить. Как оно получится на практике — вопрос будущего, конечно. Но предпосылки к тому, что в этом самом будущем у FX хотя бы получится «громить» шестиядерные Phenom II, есть, и немалые. Однако это в будущем — пока же отмечаем серьезный проигрыш своим же предшественникам на некоторых типах нагрузки в настоящем.
Упаковка и распаковка
FX-8150 получил поддержку быстрой памяти, а общее количество кэша превышает 15 МБ — это в активе, равно как и способность 7-Zip использовать большое количество потоков вычислений. В пассиве то, что WinRar до сих пор в реальной работе (а не во встроенном бенчмарке, которым до сих пор продолжают пользоваться в некоторых отдаленных от цивилизации местах) ограничивается двумя потоками, а распаковка в обоих случаях (т. е. два подтеста из четырех) вообще однопоточная, что дает немалую фору Sandy Bridge, где потоки вычисления самые быстрые, в чем мы уже не раз убеждались. В совокупности же это обеспечивает новому топовому FX совсем незначительное отставание (хотя все же отставание) от Core i5-2500. Да и старшему Core i7-2600 наш новичок уступает меньше, чем выигрывает у Phenom II X6 1100T — в абсолютном исчислении и там, и там 24 балла, но базы для относительного сравнения разные. Вообще же отсутствие чудес продолжается, но в рамках внутрифирменной конкуренции прирост порядка 20% мы можем оценить как очень хороший.
Кодирование аудио
Пожалуй, наилучшая сфера применения для новых процессоров, тем более что, как мы уже не раз говорили, тест специально «подыгрывает» многопоточным устройствам. Однако даже это не позволяло Phenom II X6 1100T угнаться за Core i5-2500, а вот результаты FX-8150 в точности соответствуют его позиционированию. Всегда бы так было, а не как в предыдущих трех случаях! Впрочем, на этом тестовый набор (да и вообще представленное на рынке программное обеспечение) не заканчивается, так что посмотрим, что будет в других группах.
Компиляция
И еще один несомненный успех новых процессоров AMD, усиленный тем, что Core i5 в компиляторах вовсе не блещет. Правда, и прирост относительно Phenom II X6 не слишком велик, но не забывайте, что до последнего времени эта группа тестов была «лебединой песней» процессоров на Thuban, фактически проигрывающих здесь лишь «полноценным» Core i7. А Zambezi для данной сферы применения подходят еще лучше, в чем никто и не сомневался — больше целочисленных потоков (которые как раз и нужны), больше кэш-памяти, высокая скорость работы с оперативной памятью. Хотя в целом, если посмотреть на подробные результаты… Видно, что не все так уж гладко: компилятор Microsoft отдал предпочтение 1100Т, а в GCC почти равенство. В общем, по иронии судьбы, максимальный вклад в высокий итоговый результат FX-8150 внес… компилятор само́й компании Intel! Он же, кстати, является и главным виновником проигрыша всех Core i5 в этой группе. Возникает провокационная мысль: а нужно ли AMD делать свой компилятор при такой-то поддержке от конкурента? :) Пусть хотя бы в плане скорости разработки проектов, а не их итоговой производительности, но одна целевая группа покупателей в результате точно будет. Ну и, кстати, попутно можно забить гвоздь в конспирологические версии о специальной деоптимизации программ некоторых разработчиков с целью «опустить» негодные процессоры по заказу конкурента. Какой уж тут заказ — скорее, бардак! Если в Intel никто не занялся доработкой собственных компиляторов под собственные же процессоры (чтоб первые быстрее всего работали на последних, невзирая ни на что), то какова вероятность, что кто-то более качественно подойдет к вопросу специальных диверсий в выдаваемом ими коде?
Математические и инженерные расчёты
С учетом почти никакой оптимизации данной группы под многопоточность, нет ничего удивительного, что FX-8150 здесь, мягко говоря, не блещет, демонстрируя результаты лишь на уровне процессоров предыдущего поколения. Даже чуть более низкие, но незначительно.
Растровая графика
А вот здесь сводный результат чуть более высокий, чем у Phenom II, чего, естественно, все равно совершенно недостаточно для конкуренции с Sandy Bridge. Но с учетом того, что приложения по своим предпочтениям здесь разные, можно (при желании) найти и положительные тенденции. Например, одним из главных «адвокатов» FX-8150 (и, по совместительству, самой весомой программой в группе — хотя бы потому, что сто́ит как компьютер, а не раздается бесплатно всем желающим) является Adobe Photoshop. Ранее лучшим процессором AMD с точки зрения этой программы был Phenom II X6 1100T, который в ней отставал даже от Core i3-2100 или Core i5-660 (напомним: это двухъядерные процессоры, хотя и с поддержкой НТ). А вот FX-8150 поднялся примерно на уровень Core i5-2300, из «старичков» обойдя даже Core i7-860. Т. е. чуда, безусловно, не произошло, но прирост хороший — как раз там, где надо. А в тесте ACDSee новый процессор даже Core i5-2400 обогнать сумел, и лишь незначительно отстал от Core i7-870, в то время как силенок 1100T недоставало и для обгона i7-920. Понятно, что по-хорошему FX-8150 надо было бы выйти на уровень выше i5-2500 (а с точки зрения фанатов — везде и безоговорочно разгромить i7-2600), но на фоне провала в некоторых программах — и это хороший результат. Особенно если посмотреть на следующую группу…
Векторная графика
И все-таки, что б там ни утверждали в Corel и Adobe, но мы все больше укрепляемся во мнении, что эти две программы однопоточные. До сих пор. Ну а один поток Bulldozer — это, как мы уже говорили, даже меньше, чем один поток Stars. Так что никакой рост тактовых частот (в том числе, и за счет турбо-режима) иногда не может скомпенсировать некоторые архитектурные изменения — очень может быть, что вот тут-то критичным оказалось резкое уменьшение размера кэша первого уровня. Или что-нибудь еще. В конечном итоге факт остается фактом — производительность флагманского FX-8150 здесь даже ниже, чем у Pentium G620. Правда, выше, чем у любых Athlon II или там А-серии… если это, конечно, хоть кого-то утешит.
Кодирование видео
Зато в случае с видеокодированием утешения скорее не требуются, чем наоборот. Не в том плане, что FX-8150 сумел вдруг свершить невозможное и обогнал всех — на деле он, по совокупности, опять отстал даже от Core i5-2500. Но, напомним, его восемь ядер — это «x86-ядра», а вот блоков вычисления с плавающей запятой (и вообще — любыми векторными данными) у процессора вдвое меньше. В тестах рендеринга это сказалось, и очень сильно, а вот видеокодеры к новой архитектуре подошли куда более лояльно. По сути, проиграть Phenom II X6 1100T новый процессор умудрился только в достаточно древнем XviD 1.30, также «славном» тем, что в нем Core i7-2600 отстает от Core i5-2500 (в общем, похоже, в видеочасти методики образовался новый «враг прогресса», каким когда-то был однопоточный Canopus ProCoder). Кстати, аналогичным образом «голосует против» Hyper-Threading и Microsoft Expression Encoder 4, но даже в нем FX-8150 быстрее, нежели 1100Т. Особенно радикальным образом (сравнительно с предшественниками) ускорился Sony Vegas Pro, что позволило FX-8150 выйти на уровень младших современных Core i5 или Core i7 предыдущего поколения. В общем, безусловно, говорить о победе нового процессора AMD не стоит, но и к поражениям существующее положение дел не отнесешь. Все-таки это выход из тупика, в который в конце своей жизни попали Phenom II, которым даже преимущество в количестве самых настоящих ядер перестало помогать сражаться на равных с процессорами Intel. А «Бульдозер» таки что-то умеет. Не идеально, но умеет. Тем паче, что, как минимум, он поддерживает те же расширения наборов команд, что и нынешние Core, а это, как мы уже говорили, будет иметь всё большее и большее значение по мере обновления программного обеспечения.
Офисное ПО
Опять перед нами группа малопоточных (в основной своей массе) программ без какой-либо оптимизации под новомодные «фишки», и опять примерное равенство новых и старых процессоров на фоне весомого отрыва (в отрицательном смысле) от продукции конкурентов. Просто констатация факта, разумеется — для этих программ и Celeron какого-нибудь из прошлых семейств на практике хватает, так что для топовых моделей процессоров данная диаграмма носит чисто иллюстративный характер :)
Java
С одной стороны, можно поругать FX-8150 за то, что он практически повторил результат Phenom II X6 1100T, с другой же стороны, это как раз еще один пример случая, когда ничего улучшать и не требовалось — и 1100Т хватало, чтобы обойти Core i5-2500, так что и FX-8150 свое позиционирование оправдал. Но вообще-то на Java-машину мы возлагали несколько бо́льшие надежды — по опыту прошлых тестирований. Впрочем, это просто очевидное подтверждение того, что иногда не стоит доверять житейской мудрости. Особенно когда под старыми названиями начинают скрываться новые сущности.
Игры
Несмотря на то, что в своих рекламных материалах компания AMD активно упирает на удачность нового семейства процессоров в игровых приложениях, никакого прорыва и здесь, как видим, не наблюдается. Впрочем, а стоило ли на него надеяться после первой же диаграммы, показавшей, что производительность одного потока вычислений в новых процессорах не выросла (не говоря уже о некоторых других диаграммах, согласно которым она иногда оказывается даже ниже, чем была)? За последние годы игровые движки (точнее, их разработчики) сильно продвинулись на ниве использования многопоточности, но… Пока наиболее весомым достижением их стала лишь актуальность установки в игровой компьютер процессора более производительного, чем «классический» двухъядерный. Но за четырехъядерным пока гоняться не обязательно — новые Core i3 подходят для этой сферы применения просто замечательно. Поэтому рассчитывать на серьезный прирост от любых дополнительных потоков вычисления… Да полноте! Вот, мягко говоря, выдающийся объем кэш-памяти, теоретически, мог бы чем-то помочь (к ней игры весьма восприимчивы), но видимо, оказался он слишком выдающимся :) И результаты процессоров Intel, кстати, подтверждают бессмысленность улучшения параметров выше порогового значения: у 2600 в сравнении с 2500 больше кэша, вдвое больше потоков вычисления, даже частота на 100 МГц выше, а все это дало лишь 1% прибавки производительности. Ну и у AMD при сравнении 8150 с 980 получилось где-то полтора процента. Правда, увы, на существенно более низком, чем у «второго поколения Core», уровне — так что не стоит надеяться, что это видеокарта или что-нибудь еще помешало.
Многозадачное окружение
Как мы помним, в этом экспериментальном тесте очень хорошо прослеживался эффект от Hyper-Threading. Технология AMD более «продвинутая», так что интересно будет посмотреть, насколько она поможет получению высоких результатов в такой вот несколько синтетичной, но многим интересной ситуации. Суть теста проста: пять бенчмарков запускаются практически одновременно (с паузой в 15 секунд), при этом всем задачам присваивается «фоновый» статус (ни одно окно не является активным). Результатом является среднее геометрическое времён выполнения всех тестов. Более подробную информацию можно получить из описания методики тестирования, ну а сейчас просто посмотрим на результаты.
Комментируем уже привычным образом: ничего существенно нового по сравнению с прочими многопоточными группами. Core i5-2500 здесь проигрывал уже Phenom II X6, а о сравнении новичка с Core i7-2600 речь все равно не идет, независимо от того, эффективнее ли удвоение количества «х86-ядер», чем Hyper-Threading, или нет. Так оно выглядит в первом приближении. Но если присмотреться внимательно, то скромная пара процентов превосходства FX-8150 над Phenom II X6 1100T превращается в оглушительную победу :) Действительно, вспомним, какую именно пятерку подтестов мы используем:
- Растровая графика: GIMP — «в чистом виде» FX-8150 здесь быстрее, нежели 1100Т, но само по себе приложение однопоточное, так что слишком уж серьезной фоновой нагрузки оно не создает.
- Финальный рендеринг трёхмерных сцен: Maya — а вот здесь «в чистом виде» FX-8150 примерно на 15% медленнее, чем 1100Т!
- Компиляция: MSVC — FX-8150 отстает примерно на 3%.
- Кодирование видео: XviD — FX-8150 отстает на те же 3%.
- Упаковка и распаковка: упаковка 7-Zip — здесь FX-8150 «в чистом виде» намного быстрее, но не забываем, что при «имитации кипучей деятельности» ему достанутся вовсе не все потоки.
Вот так вот — создавая методику и этот дополнительный экспериментальный тест в ее рамках, мы еще практически ничего не знали о новой архитектуре AMD, однако по иронии судьбы три из пяти попавших в тест приложений на дух эту архитектуру не переносят. Однако если запустить одновременно пять «плохих» приложений, конечный результат оказывается схож с тем, который можно получить от одного «хорошего». На открытие не тянет, но вот на очередное подтверждение того, где может пригодиться многоядерность/многопоточность — вполне: лучше всего ее эффект виден там, где и самих приложений «много». Даже неважно — каких.
Итого
Как нам кажется, те, кто ждал чуда, статью либо вообще не стали читать, ознакомившись с краткими результатами из других источников, либо давно уже прекратили чтение (особенно после второй диаграммы :)). Те, кто ждал от новой архитектуры полного и безоговорочного провала, тоже, думаем, давно уже удовлетворили свою жажду. Поэтому попробуем вместе с оставшимися порассуждать спокойно и беспристрастно.
Как видим, картина вовсе не напоминает торжественное явление Sandy Bridge рынку в январе этого года (единственная аналогия — тогда некоторые тоже ждали какого-то чуда, так что сочли себя обманутыми, увидев, что новые процессоры всего лишь заметно быстрее старых, а не разрывают их в клочья). Причина — компании в очередной раз пошли разными путями. В Intel решили заморозить количество ядер в массовых процессорах, потратив силы на доработку встроенной графики и увеличение «однопоточной производительности». Логику своих действий компания объяснила прямо и четко: у пользователей настольных компьютеров потребности в более чем четырехъядерных процессорах пока не возникло, так что нет смысла зря тратить транзисторы и увеличивать энергопотребление. Пусть ядер будет не более четырех, как и ранее, но каждое будет быстрее, чем ранее. Это везде обеспечит нужный эффект — хоть в старых, хоть в новых программах. А для самых требовательных — есть Hyper-Threading, который намного «дешевле», чем полноценные ядра, но при необходимости может их в какой-то степени заменить. Получаем дешевые и быстрые процессоры. Заметим только, что получили мы их именно такими не сразу: модульная архитектура у Intel появилась в конце 2008 года (кстати, к ее выходу на рынок тоже было немало вопросов) — та самая Core, пришедшая на смену монолитной Core 2. И выпускались ее представители по уже отлаженному техпроцессу, поражали первые модели своим энергопотреблением даже видавших виды (и разные «пентивумы четыре») аксакалов, но при этом нередко умудрялись не слишком-то обгонять своих предшественников (особенно в плохо оптимизированном программном обеспечении, которое до сих пор умудряется замедляться при включении Hyper-Threading). Потом была отладка нового техпроцесса, от простого к сложному — первым «отладочным объектом» стал даже не процессор, а кусочек процессора на ядре Clarkdale. И только потом уже — триумфальный выход второго поколения Core.
Чтобы лучше понять, в чем же отличия позиции AMD, для начала вспомним, что сегодня мы увидели и новые процессоры, и новую архитектуру. Совершенно новую — это уже не много раз обновленный и надстроенный К7. Соответственно, она изначально спроектирована в расчете на применение технологии динамического управления частотой, поддержку нецелочисленных векторных инструкций и многое, многое другое, о чем десять лет назад никто не задумывался. В том числе, и о процессорах для планшетов и нетбуков или об APU, где «атлоновские» ядра, несмотря на все ухищрения, выглядят неубедительно, а вот один-два модуля нового типа могут прийтись «ко двору». Да и в серверном сегменте, где количество одновременно выполняемых потоков вычисления обычно велико, новая архитектура может дать AMD второе дыхание, особенно если со временем удастся увеличить количество модулей, пусть даже пожертвовав частотой. А вероятность этого есть — ведь модуль Bulldozer проще, чем модуль Core: в последний входят два полноценных процессорных ядра, да еще и сдобренных Hyper-Threading. Ранее же элементарным кирпичиком, из которых строились процессоры AMD, было однопоточное ядро Athlon, возраст которого уже пошел на второй десяток. А одного такого ядра для современного ПО мало — надо два. И для получения более-менее пристойного уровня производительности пришлось «прикручивать» и кэш третьего уровня, о котором изначально речи не шло, так что обеспечить полноценную работу такой архитектурной солянки было не так уж просто (вспоминаем, кстати, что в результате первые Phenom вообще оказались практически провалом, пусть и позволив создать на своей базе Phenom II). А в бюджетных процессорах L3 был слишком уж дорогим излишеством, так что различным Athlon II и вариациям на их тему проблемы с межъядерным обменом данными, да и вообще с низкой емкостью кэш-памяти (больше мегабайта L2 AMD за долгие годы так и не сумела прикрутить к Athlon) во многих приложениях жизнь изрядно портили.
Но сегодня мы тестировали вовсе не обновленный APU с целью выяснить, лучше ли четыре новых «ядра» четырех старых ядер, а новый топовый процессор AMD. Производительность одного потока в новой архитектуре увеличить не удалось. Более того — некоторые решения вообще потенциально опасны с точки зрения «старого» кода (например, инструкций FPU). Однако при этом необходимо сделать так, чтобы новый флагман выглядел лучше старого и не уступал конкурентам. А как этого добиться, если интенсивный путь оказался недоступен? Естественно, экстенсивным: «выкатив» процессор в максимально возможной на сегодняшний день конфигурации с четырьмя модулями, полным объемом кэш-памяти и максимальной тактовой частотой. В плане последней, кстати, наблюдается очередная победа человеческого разума — компания сдержала слово выпустить процессор с частотой более 4 ГГц. У Intel вот последнего в штатном режиме не получилось, а у AMD — получилось. Пусть только в турбо-режиме, но хоть что-то. Правда, и толку от этого не слишком много — новые процессоры Intel имеют более высокую удельную производительность. И от восьми ядер толку не слишком много — может быть, подход AMD и эффективнее, чем Hyper-Threading, только вот где в настольном компьютере такой тип нагрузки найти, чтоб это увидеть? В общем, фанаты надеялись на победу над Core i7-2600, а на деле задержка с выпуском не позволила в общем зачете обойти и более дешевый Core i5-2500 (причем более дешевый по цене — а себестоимость у него вообще в полтора раза ниже). Вот если бы удалось сделать частоты в районе 4 ГГц не максимально достижимыми, а стартовыми (как некогда прогнозировалось) — было бы немного веселее. Но тут уже техпроцесс «на стадии отладки» мешает.
Разумеется, можно рассчитывать на увеличение эффективности Turbo Core по мере отладки BIOS’ов системных плат: мы уже были свидетелями того, как процессоры под LGA1156 получили через несколько месяцев существования платформы лишние 5% производительности, так что ничего невозможного в этом нет. Будет увеличение производительности (особенно относительно Phenom II) по мере появления новых оптимизированных версий программного обеспечения. Будут новые степпинги и улучшения процесса производства, так что появятся новые более быстрые модели в семействе. Очень может быть, что где-то еще найдутся какие-то скрытые резервы. Но надеяться на принципиальное изменение ситуации в ближайшее время попросту невозможно. FX-8150 — хороший процессор. Но не настолько хороший, насколько требуется и насколько ожидалось. Революция не состоялась — всем спасибо, все свободны.