Всем, наверное, уже достаточно очевидно, что с ростом частот у процессоров Intel на ядре Prescott (и его идеологических потомков) в последнее время дела обстоят не очень хорошо. Вполне логичным выглядит и предположение о том, что с ростом частот двухъядерных процессоров дела будут обстоять как минимум также, а как максимум — ещё хуже: ведь два ядра греются при работе намного больше, чем одно. Однако, несмотря на это, сегодня компания Intel анонсировала новый процессор «экстремальной» серии (Intel Pentium eXtreme Edition 955), частота которого равна 3,46 ГГц. Много это или мало? С одной стороны — не очень-то и много: всего на 260 МГц больше, чем у предыдущего Pentium eXtreme Edition 840. С другой стороны, учитывая то, что энергопотребление и нагрев PXE 840 и так смущали компьютерную общественность несколько больше, чем обычно — даже такой рост заслуживает уважения.
Однако не в одной частоте дело. В Pentium XE 955 сосредоточились практически ВСЕ достижения данного производителя за последнее время: кроме частоты, PXE 955 имеет ещё и 1066-мегагерцевую шину, а также по 2 (2!) мегабайта кэш-памяти второго уровня на каждое (!) ядро. Фактически, получившийся в результате монстр является в некотором роде «экстремумом» достижений всей архитектуры NetBurst в целом. Трудно вообразить себе возможные дальнейшие пути его развития: как максимум, удастся повысить частоту ещё на 266 МГц, максимально приблизившись к пику частот для одноядерных CPU на базе того же ядра. То есть, учитывая подчёркнутое исключение из роадмапов Intel 4-гигагерцевого CPU, наследник у Pentium 4 eXtreme Edition 955 даже чисто теоретически может быть всего один. Да и то непонятно — будет ли. Таким образом, сегодня мы наблюдаем либо пик производительности, которую способна обеспечить архитектура NetBurst в своём самом совершенном варианте применительно к двухъядерным CPU, либо самое преддверие этого пика. Исходя из этого предположения, мы и будем строить сегодняшнее тестирование.Сухие факты
«Новое» ядро Presler представляет собой «сдвоенный» вариант адаптированного под 65-нанометровую технологию 90-нанометрового ядра Prescott-2M т.е. двухъядерный CPU фактически представляет собой два полноценных одноядерных (как это и было ранее во всех предыдущих двухъядерниках Intel). Если кому-то интересно (?..), выглядит это примерно вот так:
В отличие от Smithfield, мы наблюдаем здесь уже по 2 мегабайта кэша второго уровня на каждое ядро, что выглядит вполне естественным решением т.к. за счёт перехода с 90-нанометровой технологии производства на 65-нанометровую, площадь кристалла (по сравнению со Smithfield) удалось уменьшить. Насколько — это пока вопрос открытый, мы не нашли такой характеристики как «площадь кристалла» в доступной нам на данный момент документации Intel. Зато известно число транзисторов — 376 миллионов, TDP (напоминаем — это НЕ максимальное энергопотребление, а скорее один из вариантов на тему «типичного») — 130 ватт, и максимальная (согласно документации) нормальная рабочая температура — 68,6 градусов. Заметьте, что несмотря на переход на 65-нанометровый техпроцесс, TDP у нового eXtreme Edition точно такое же, как у старого. Логично предположить, что все бонусы 65-нанометрового процесса «съели» возросшая частота ядер и FSB а также дополнительные объёмы кэшей второго уровня. Согласно спецификациям, минимальное напряжение питания PXE 955 составляет 1,2 вольта, а максимальное — 1,3375 вольта. В Intel Pentium eXtreme Edition 955 реализованы следующие технологии:
- Двухъядерность;
- Hyper-Threading;
- Intel Virtualization Technology;
- 1066 МГц FSB;
- Execute Disable Bit;
- Extended Memory 64 Technology (EM64T).
Все они, за исключением третьего пункта, нам уже хорошо известны. Что же касается Intel Virtualization Technology, то она будет исследована чуть позднее в рамках отдельной статьи. Тестирование
Конфигурация тестовых стендов
- Процессоры
- Intel Pentium eXtreme Edition 955 (2 x 2 MB L2, 1066 MHz FSB, 2 x 3.46 GHz core)
- AMD Athlon 64 FX-57 (1 MB L2, 2.8 GHz core)
- AMD Athlon 64 FX-55 (1 MB L2, 2.6 GHz core)
- AMD Athlon 64 X2 4800+ (2 x 1 MB L2, 2 x 2.4 GHz core)
- Intel Pentium eXtreme Edition 840 (2 x 1 MB L2, 800 MHz FSB, 2 x 3.2 GHz core)
- Intel Pentium 4 670 (2 MB L2, 800 MHz FSB, 3.8 GHz core)
- Intel Pentium 4 eXtreme Edition 3.73 GHz (2 MB L2, 1066 MHz FSB)
- Системные платы
- Intel D975XBX Desktop Board (чипсет Intel 975X)
- Intel D955XBK Desktop Board (чипсет Intel 955X)
- ASUS A8N SLI Deluxe (чипсет NVIDIA nForce4)
- Память
- 2x512 МБ PC5400 (DDR2-533) DIMM 3-3-3-8 (Corsair)
- 2x512 МБ PC3200 (DDR-400) DIMM 2-2-2-5 (Corsair)
- Видеокарта ATI Radeon X800 (256 MB)
- Жесткий диск Samsung SP1614C (SATA), 7200 об/мин, 8 МБ кэша
- Блок питания: FSP 550-60PLN (500-550W)
- Windows XP Professional SP2, DirectX 9.0c
- ATI CATALYST 5.4 (Display Driver 6.14.10.6525)
Напомним, что диаграммы со всеми результатами тестов (в количестве 64 штук), вынесены на отдельную страницу без комментариев, просто «as is». В статье же приведены только сводные диаграммы, объединяющие результаты целой группы тестов в некий средний балл. Такой подход позволяет, с одной стороны, удовлетворить любопытство особо пытливых читателей, возражающих против сокращения количества приводимых в статьях результатов тестов, а с другой сделать «основной» материал менее пёстрым и насыщенным графикой.
SPECapc for 3ds max 6 + 3ds max 7.0
Если взглянуть на подробные диаграммы, можно увидеть, что в подтесте на скорость рендеринга, Pentium XE 955 всё же удалось обогнать топовый на данный момент двухъядерник от AMD — Athlon 64 X2 4800+. Однако выигрыш в рендеринге не очень велик, а вот отставание в подтесте Interactive намного больше. В результате по среднему баллу по-прежнему лидирует двухъядерник AMD, правда, по сравнению с Pentium XE 840, 955-му удалось существенно сократить разрыв.
Maya 6.5
В SPEC for Maya двухъядерники вообще не очень хорошо выглядят (напомним, почему: в данном случае тест на скорость рендеринга SPEC в свой бенчмарк вообще не включила). Однако возросшая частота (видимо, вкупе со скоростной шиной), позволила PXE 955 номинально обогнать прямого конкурента (Athlon 64 X2 4800+). Впрочем, столь же номинально Pentium XE 955 тут же уступил флагманскому двухъядернику от AMD в нашем тесте на скорость рендеринга. В целом, можно сказать, что оба основных конкурента выступили на равных,
Lightwave 8.2, рендеринг
Опять-таки: Pentium XE 955 сократил разрыв с A64 X2 4800+ до такой величины, что процессоры можно считать примерно равными по производительности. В случае сравнения Athlon 64 X2 4800+ vs. Pentium XE 840, так сказать было нельзя…
SPECapc for SolidWorks 2003
Тут всё по-прежнему плохо. Судя по всему, мы наблюдаем совершенно сложившееся «архитектурное предпочтение» конкретного программного пакета, и «бодаться» с AMD для Intel в данном случае не имеет никакого смысла. Посудите сами: если воспользоваться методом простейшей экстраполяции, мы получим, что для того, чтобы хотя бы сравняться в производительности с Athlon 64 X2 4800+, процессор, аналогичный по архитектуре Pentium XE 955, должен будет иметь частоту ядер… 3.8 гигагерца. То есть сравняться по частоте с топовыми одноядерниками. Слабо в это верится, слабо… Проще уговорить SolidWorks, чтобы она лучше оптимизировала своё ПО под архитектуру NetBurst :).
Adobe Photoshop CS (8)
Adobe Photoshop — одна из тех программ, в которых даже Pentium XE 840 смотрелся на фоне двухъядерников AMD вполне прилично, а 955-й, разумеется, оказался ещё быстрее. Судя по всему, спасибо за это следует сказать Adobe: сомнительно, чтобы такое отрицание общей закономерности (не будем скрывать очевидного: общая закономерность состоит в том, что побеждают процессоры AMD) было обязано своим проявлением случайности. Видимо, программисты Adobe достаточно хорошо изучили всевозможные Optimization Manual для Pentium 4. С другой стороны, это даёт повод задуматься: по всей видимости, если действительно приложить усилия, архитектура от Intel вовсе не так плоха. Просто под неё нужно уметь программировать так, чтобы использовать её возможности полностью…
Adobe Acrobat 6.0
В данном случае оптимизации под Intel, видимо, было уделено намного меньшее внимание: все процессоры этой компании стабильно уступают процессорам AMD.
«Универсальное» сжатие данных (архивация)
Если посмотреть на подробные диаграммы, видно, что даже честная двухъядерность не позволяет процессорам Intel получить преимущество в том единственном архиваторе, который поддерживает многопоточность — 7-zip. Правда, объективности ради, следует заметить, что «много-» в данном случае означает не более чем «двух-».
Сжатие мультимедийных данных с потерями (MP3/MPEG2-4)
Одна не очень (постфактум) корректная особенность нашей методики тестирования сжатия мультимедийных данных с потерями, надеемся, всем уже известна: процессоры Intel получают здесь большое преимущество исключительно за счёт одного подтеста: LAME с максимальными установками качества. Однако мы хотели бы предостеречь наших читателей от излишне прямолинейного подхода к общему баллу: если посмотреть на подробные диаграммы, становится видно, что результаты Pentium XE 955 в том же Canopus ProCoder 2 весьма неплохи, и вплотную приблизились к достижениям Athlon 64 X2 4800+. Так что в целом мы можем констатировать, что данные процессоры примерно равны даже по результатам прочих тестов, не только за счёт LAME Encoder.
CPU RightMark 2004B
Четырёхпотоковый рендеринг (два ядра + Hyper-Threading) стал решающим доводом в пользу нового процессора Intel. С одной стороны — очевидно и ожидаемо, с другой — всё-таки абсолютное преимущество есть абсолютное преимущество, и никуда от этого не денешься…
Трехмерные игры и визуализация графики
в профессиональных пакетах
DOOM 3
Far Cry
Painkiller
Unreal Tournament 2004
Общий балл по играм
SPEC viewperf
Что касается визуализации трёхмерной графики: «не выходит каменная чаша» у CPU от Intel в данной области. Как ни наращивай мощь — а всё же не выходит. Судя по тому, что все четыре игры и пакет бенчмарков для профессиональных графических пакетов придерживаются относительно данной архитектуры одного общего мнения, следует сделать вывод, что «беда» всё-таки в общих принципах архитектуры, и ничего тут не поделаешь… Робкие ростки поддержки multicore
Также кроме «обязательной программы», мы решили проверить, пока ещё в чисто экспериментальном ключе, насколько хорошо реализована поддержка многоядерных процессоров в тех программах, в которых она не так давно с наибольшей, так сказать, помпой, была заявлена. Для примера мы взяли два приложения: Quake 4 с последним патчем 1.0.5 beta и DivX 6. Поскольку основной задачей было не сравнение процессоров между собой, а лишь выяснение вопроса «видна ли польза от многоядерности?», мы ограничились одним двухъядерным процессором — главным героем данной статьи, Intel Pentium eXtreme Edition 955.
Quake 4
Тестировалась игра с установками, которые она по Autodetect выставила себе сама: High Quality, разрешение 800x600, 32-битный цвет. Как известно, Quake 4 содержит в себе инструмент измерения производительности, но не содержит встроенных «демок» — их нужно записывать самостоятельно. Поначалу, взяв демку, любезно предоставленную редактором видеораздела Андреем Воробьёвым, мы было вообще решили, что поддержка SMP в Quake 4 — это просто какая-то «утка»: что со включенной поддержкой, что без неё, результат был один и тот же (разница в 0,2 fps явно укладывается в погрешность измерений).
Однако, почитав материалы других сайтов, которые, насколько мы поняли, пользовались демкой, лежащей на сервере THG, мы всё-таки решили для очистки совести «прогнать» и её. Каково же было наше удивление, когда поддержка SMP вдруг заработала!
Итак, констатируя факты: поскольку никаких установок самой игры в демо-файле не хранится, можно сделать вывод, что существуют просто определённые сцены, на которых включение поддержки SMP помогает поднять fps, и существуют сцены, на которых никакого прироста ждать не приходится. Далее мы вступаем в область предположений (вполне, впрочем, логичных, исходя из того, что мы знаем об устройстве игровых движков): судя по абсолютным значениям fps, демка THG намного менее сложна для видеокарты. Видимо, поэтому и видна польза от SMP. На нашей демке нагрузка на видеокарту намного больше, поэтому скорость просчёта сцены процессором (процессорами) на результирующий fps практически не влияет. Если наши предположения верны, то мы в результате получаем вполне классическую и для одноядерных процессоров дилемму: быстрый процессор для игр — это, конечно, здорово, но быстрая видеокарта может дать эффект намного более ощутимый.
DivX 6.1 Pro
Разумеется, способов отключения одного ядра мы не нашли, поэтому везде, где на диаграмме присутствует «1 core», — это не реальное физическое отключение ядра, а использование affinity mask (любому процессу в Windows XP можно принудительно указать, какие процессоры он имеет право задействовать, а какие — нет). Результат вполне очевиден: DivX 6 действительно как-то поддерживает SMP, но по сравнению с тем же Quake 4 (в случае с демкой THG) эффект намного менее выражен. Также чётко видно, что виртуальная многопроцессорность (одно ядро + Hyper Threading) даёт намного меньший эффект, чем «честные» два ядра, а включение HT при наличии двух физических ядер — не даёт ничего. Впрочем, этого следовало ожидать: распределение нагрузки по процессорам демонстрирует, что о полном задействовании всех возможностей двухъядерников при кодировании с помощью DivX 6 речи не идёт:
В данном случае полная нагрузка на все CPU давала бы нам 100% CPU Usage (по показаниям Windows Task Manager). Нагрузка только на один процессор давала бы значение 25% CPU Usage (так как всего процессоров четыре). Реальное значение, как видите, — 43%. То есть чуть больше, чем 100% нагрузка на один CPU, но даже меньше, чем 100% нагрузка на два. Графики для CPU со второго по четвёртый также красноречиво свидетельствуют: чем-то они на фоне работы «основного» процессора, конечно, занимаются — но не очень активно… Заключение
В целом, наш вердикт будет примерно таков: Intel всё же почти удалось догнать топовый двухъядерник от AMD. Ценой колоссального «ужирнения» чипа (1066-мегагерцевая шина + 2 мегабайта кэша на каждое ядро + возросшая частота) — но, тем не менее, удалось. На данный момент Intel Pentium eXtreme Edition 955 действительно может считаться примерно равным (в общем зачёте) по производительности AMD Athlon 64 X2 4800+. Чуть-чуть, конечно, он до него не дотягивает (опять-таки — в общем зачёте по всем приложениям чохом) — но всё-таки примерный паритет есть. Скажем так: разница, в большинстве случаев, настолько мала, что вам вряд ли удастся её ощутить. Является ли этот факт поводом для оптимизма? Трудно сказать. Понятно, что сейчас оба производителя «упёрлись в частоты», и возможности их роста практически исчерпаны как с одной, так и с другой стороны. Таким образом, чисто формальное лидерство обеспечит себе тот, кто сможет «догнать» своё ядро до чуть большего порога, чем соперник… но в целом это общую ситуацию никак не изменит. Ну, будет у компании «X» ОДИН процессор, который быстрее, чем топовый продукт от компании «Y». И что? А остальные?
В такой ситуации большее значение приобретает ценовой аспект. И тут у нас намечается уже совсем другое противостояние: AMD, упирая на относительно (относительно Intel, понятное дело) высокую производительность своих двухъядерных решений, — не спешит снижать цены. Intel, признавая относительно меньшую производительность своих двухъядерных процессоров — предлагает их по намного более демократичной цене. Получается «странный паритет» — те, кому нужна наивысшая производительность, — покупают AMD (однако результаты сегодняшнего тестирования свидетельствуют о том, что Intel теперь тоже есть что предложить этим господам), с другой стороны — те, кто делает ставку на двухъядерность, но не обладает безграничными финансами — вынуждены покупать у Intel, потому что AMD в данном ценовом сегменте просто нечего им предложить.
Массовость vs. техническая привлекательность? Оглядываясь назад, на историю развития компьютерной техники, мы можем лишь констатировать, что исход подобных битв зачастую оказывался вовсе не таким очевидным, как можно было бы предполагать…