Задача оптимального выбора компьютерных комплектующих не имеет, к сожалению, четкого математического решения: слишком много факторов. Обычно используют такой метод: берется прайс-лист, из него выбрасываются крайние позиции (полный отстой и слишком крутые), а из оставшихся выбирается товар с наибольшим приростом узвончения торговых марок и количественного распухания псевдотехнических характеристик на прирост цены. Решение не самое плохое, не будем даже обращать внимание на то, что 256 МБ памяти на борту у GeForce2 MX это чуть многовато. Подумаем лучше вот о чем: а зачем вообще нужен новый процессор?
Действительно, а зачем? Нет, есть, конечно, задачи, которые и N-гигагерцовый Pentium M загрузят по самые верхние регистры, вот только страшно далеки они от народа, и не на их решателей рассчитаны пляски сине-оранжевых человечков в ваших устройствах отображения информации. Нет, разница все еще есть даже при работе в Word, вот только замерять ее все трудней и трудней не зря же каждое новое поколение бенчмарков выдает итоговый результат в баллах на порядок ниже, чтобы, значит, было куда расти, да и пользователя 10,5 балла напрягают куда сильней, чем 1050.
Игры Да, остаются, как всегда, игры, но тут все слишком запущено. Intel тщетно демонстрирует на презентациях трехмерные демки, рассчитанные и показанные силами одного только центрального процессора. Гораздо вероятнее, что какой-нибудь очередной GeForce, уже практически интегрировавший звук, будет заодно и считать физику в игре, а уж с винчестером они договорятся: организуют новый протокол прямого доступа к графической памяти, и зачем им тогда нужны будут процессор с системной памятью эти пережитки прошлого, ошибочно считавшиеся двигателем прогресса?
А бедные, никому не нужные процессоры будут все уменьшаться и ускоряться пока в один (прекрасный?) день не разлетятся горсткой фотонов. Ну, до этого дня, впрочем, еще далеко. Пока посмотрим, чем нас порадует новый Pentium 4 глядишь, и блеснет просвет
Новое ядро Pentium 4 «Northwood»
Для начала, сам герой и его предшественник:
Intel Pentium 4 «Northwood», 2,2 ГГц, Socket 478
Intel Pentium 4 «Willamette», 2 ГГц, Socket 478
Обратите внимание на нижнюю строчку маркировки: цифры «512» в конце как раз указывают на единственное архитектурное отличие нового процессора от старого 512 КБ кэша L2 вместо 256 КБ. Впрочем, реализация этого отличия стала возможной лишь вследствие перехода фабрик Intel на 0,13-микронную технологию производства с использованием медных соединений. В результате, на 200-миллиметровой пластине умещается вдвое больше кристаллов, чем при производстве по 0,18-микронной технологии. (В дальнейшем же, с переходом на 300-миллиметровые пластины, это количество увеличится еще в 2,5 раза.) Ну а следствием нового техпроцесса станут, совершенно очевидно, более высокая допустимая частота процессоров и пониженное тепловыделение (49,8 Вт TDP у 2,2-гигагерцовой версии Northwood против 75 Вт у Willamette 2 ГГц). Любопытно отметить, что процессор на новом ядре содержит 55 миллионов транзисторов (площадь 146 мм2), из которых около 40% (у Willamette 42 миллиона транзисторов, а изменился только объем L2) приходится на кэш неплохо?!
Northwood 2,2 ГГц, работающий на 2 ГГц
Willamette 2 ГГц
Естественно, новое ядро требует новой нагрузочной прямой питания процессора, но здесь никаких проблем для пользователей возникнуть не должно: все материнские платы под Socket 478 проектировались уже в расчете на новые процессоры, их нынешний VRM такую прямую поддерживает, так что в худшем случае вам придется перепрошить БИОС платы. Остается еще упомянуть о том, что процессор с частотой 2 ГГц будет последним в линейке Willamette, линейка же Northwood начнется с 2-гигагерцового, так что для различения крайних экземпляров Intel вновь вынужден прибегнуть к индексу «A»: младший Northwood будет официально называться Intel Pentium 4 2A ГГц.
Исследование производительности
Тестовый стенд:
- Процессор Intel Pentium 4 «Willamette», 2 ГГц, Socket 478
- Процессор Intel Pentium 4 «Northwood», 2,2 ГГц, Socket 478
- Материнская плата ASUS P4T-E (Intel 850)
- 2x128 МБ PC800 RDRAM RIMM Samsung
- ASUS 8200 GeForce3
- IBM IC35L040AVER07-0, 7200 об/мин, 2 МБ cache, 40 ГБ
- CD-ROM ASUS 50x
Программное обеспечение:
- Windows 2000 Professional SP2
- NVIDIA Detonator v22.50 (Vsync=Off)
- RazorLame 1.1.4 + Lame v3.89 codec
- VirtualDub 1.4.7 + DivX v4.02 & v4.11 codec
- WinZip 8.0
- WinAce 2.11
- eTestingLabs Content Creation Winstone 2001
- eTestingLabs Business Winstone 2001
- BAPCo & MadOnion SYSmark 2001 Internet Content Creation
- BAPCo & MadOnion SYSmark 2001 Office Productivity
- 3DStudio MAX 4.2
- SPECviewperf 6.1.2
- Expendable Demo version
- MadOnion 3DMark 2001
- idSoftware Quake III Arena v1.30, demo four
- DroneZmarK
Отметим, что в тестировании были использованы показания еще двух «участников».
Во-первых, Northwood был протестирован на частоте 2 ГГц, для чего мы понизили коэффициент умножения имевшегося у нас разлоченного сэмпла. Таким образом мы получили возможность выяснить чистый эффект от увеличения кэша L2 у процессора на новом ядре.
Во-вторых, имевшийся Willamette 2 ГГц был разогнан до 2,2 ГГц шиной (110 МГц x 20). Это позволяет прояснить «академический» вопрос, что лучше: больше кэша или более быстрая шина, а также сделать некоторые прикидки на будущее, ведь не секрет, что вскоре частота шины Pentium 4 (правда, уже Northwood) вырастет до 133 МГц (533 МГц Quad-Pumped).
Также отметим, что желающие сравнить производительность нового флагмана процессорного рынка от Intel с самой быстрой на текущий момент моделью от AMD могут сопоставить результаты сегодняшнего тестирования с результатами сравнения Willamette 2 ГГц и Athlon XP 1900+. Как только AMD анонсирует свою модель 2000+, мы обязательно сведем ее с Northwood в честном поединке.
Результаты тестирования:
Кодирование в MP3 с помощью Lame, как мы уже не раз видели, не слишком чувствительно к пропускной способности памяти. В этом тесте мы можем наблюдать некоторый (3-4%) прирост от увеличившегося у Northwood объема кэша и хорошую (~10%) масштабируемость теста по частоте процессора. Эффект от ускорения шины вроде бы есть, но абсолютная разница в показаниях слишком мала, подождем делать выводы.
Здесь еще до собственно результатов тестирования процессора обращает на себя внимание выигрыш от использования новой версии кодека DivX, оптимизированной под SSE2. 30-40%! Тут даже комментарии излишни!
Что же до сравнения процессоров на старом и новом ядре, то можно отметить несколько интересных моментов. 7-9% преимущества получает Northwood за счет «чистого» увеличения частоты на 10%, а вот преимущество ускоряемого шиной Willamette более существенное: 10-15%. Некоторый, не слишком значительный эффект имеется от увеличенного кэша у Northwood, причем эффект этот перекрывается повышением частоты шины (разгоняющей, в том числе, и кэш L2). Кстати, обратите внимание на то, что при включении SSE2 разница проявляется более ярко во всех случаях: и при увеличении частоты процессора, и при ускорении шины, и при удвоении объема кэша.
Результаты WinZip напоминают результаты кодирования MP3 и по абсолютным цифрам, и по характеру зависимости. Опять же отметим, что разница в пару секунд не дает возможности делать далеко идущие выводы.
А результаты WinAce, как и следовало ожидать, напоминают результаты кодирования MPEG4 оба теста агрессивно работают с памятью, но при архивировании WinAce происходит частое обращение к словарю, что и обеспечивает больший (до 8%) выигрыш при прочих равных процессору на ядре Northwood. Очевидно, что если бы в кэш удалось запихнуть весь 4-мегабайтный словарь, ускорение было бы весьма значительным. По частоте же процессора тест масштабируется не очень хорошо, здесь большее влияние оказывает скорость работы с памятью.
Картина в обоих «полусинтетических» тестах в общем похожа, из странностей можно отметить только то, что на частоте 2,2 ГГц «честный» Northwood выигрывает у ускоренного шиной Willamette больше, чем на частоте 2 ГГц в равных условиях.
Описание использованных сцен для 3DStudio MAX можно найти в нашем введении к тестированию профессиональных видеокарт, а интересующий нас сейчас результат сравнения процессоров таков: вне зависимости от сложности расчета сцены процессором и сложности прорисовки сцены графическим ускорителем, характер вычислений один и тот же, и ускоряется расчет всех сцен одинаково. В цифрах это выглядит так: на ~9% при увеличении частоты процессора, на ~3% за счет большего кэша, ускорение шины почти никак не сказывается на результате. Как видите, тест этот, что неоднократно нами подчеркивалось, чисто вычислительный, и масштабируется он именно по частоте процессора, слабо завися от скорости памяти и прочих факторов.
Со SPECviewperf дело обстоит более интересно, в первую очередь, за счет разнообразия проявленных зависимостей подтестов. AWadvs-04 никаких неожиданностей не приносит, стабильно упирая скорость отрисовки сцены в скорость работы видеоакселератора. Зато DX-06
Казалось бы, ничего странного: производительность системы слегка растет при переходе от 2 к 2,2 ГГц; если при этом ускоряется шина она растет сильнее. Только вот незадача: имеется очень заметный отрицательный эффект от «лишнего» кэша. Удивительно, но факт: увеличение размера кэша в этом тесте значительно снижает скорость обмена с памятью. Внятных объяснений у нас на данный момент нет, остается лишь констатировать: если вы посвятили свою жизнь работе с IBM Data Explorer Northwood не для вас.
Нынешнее тестирование позволяет нам выявить и разницу между этими двумя тестами, которые обычно демонстрируют сходные зависимости результатов. В DRV-07, как хорошо видно, система почти не получает прироста производительности от простого увеличения частоты процессора, частота же шины (скорее всего, связка память-AGP) на результат влияет весьма прилично. Но этот выигрыш в 8% ничто, в сравнении с 30-процентным выигрышем 512К L2 Northwood у 256К L2 Willamette. Отложим ненадолго рассмотрение этого артефакта, и обратим свой взор на Light-04. Картина действительно похожа на предыдущую, только без загадочного взлета у Northwood, а в его отсутствие разогнанная шина AGP у Willamette 2,2 ГГц выводит того в лидеры в полном соответствии с данными наших прошлых тестирований: производительность видеоускорителя прежде всего.
Ага, и снова этот взлет! Ну, теперь, опираясь на все тот же опыт, мы с достаточной уверенностью можем сказать: причина RDRAM. Нами уже неоднократно было отмечено, что Expendable игра с довольно «хаотичным» алгоритмом, который «сводит с ума» длинный конвейер Pentium 4 и, как видите, сильно напрягает своими «прыжками по памяти» обладающий большой латентностью RDRAM. Увеличенный кэш у Northwood значительно сглаживает этот эффект, и результат налицо. Впрочем, нельзя не учитывать, что в случае использования, например, DDR SDRAM этот артефакт проявился бы менее заметно, так что волшебное ускорение смогут испытать на себе лишь фанаты Expendable (если таковые еще остались тест-то уже давно просится на свалку) и Rambus одновременно. Еще стоит отметить, что разгон шины в этом тесте, в отличие от SPECviewperf, ускоряет не работу видеоакселератора (нельзя ускорить то, чего нет), а связку процессор-память.
Все более или менее современные игрушки демонстрируют одну и ту же картину: Northwood за счет большего кэша имеет преимущество в 5%, которое сглаживается до 1-2% при разгоне шины у Willamette. Все это, конечно, справедливо только для тех тестов и разрешений, где от процессора зависит суммарная производительность системы.
Выводы
Подводя итоги, первым делом надо определиться с позицией, с которой будет оцениваться Northwood. К счастью, сегодня мы не стоим на пороге какого-нибудь революционного поворота, неминуемо влекущего за собой смену чипсета и типа системной памяти. Налицо плавный эволюционный процесс, в котором нам отведена лишь роль наблюдателя, а все остальное сделает Intel. Так что расслабимся, и будем получать удовольствие.
Благо, причины быть довольными есть. У нового процессора всего одно преимущество перед старым, но оно реально работает и приносит очень неплохие дивиденды. На одной чаше весов, правда, у нас копеечное превосходство в кодировании с помощью DivX v4.02 и отрицательный прирост в DX-06, но на другой, зато, доходящее до 30% улучшение работы с RDRAM. В среднем же весы показывают +5-8%. И это учитывая, что в чисто процессорных задачах может быть и больше (а для чего еще вы берете топ-модель?).
Впрочем, еще раз напомню, что сравнивать напрямую новое и старое ядро не очень интересно и умно: они все равно не пересекутся в линейке Pentium 4 (точнее, пересекутся лишь один раз, и сравнительные показатели у вас перед глазами), так что выбора не будет. Можно лишь поставить зарубку себе в памяти: Intel не подвел, новый процессор не хуже старого.
Ну а что же с перспективами? Они тоже представляются в радужном свете: в тестах на взаимодействие процессора и памяти получается 10-15% выигрыша на 10-процентное ускорение шины. Преимущество в приложениях, ориентированных на графику, мы принимать во внимание не будем, так как частота AGP и PCI у плат с будущим 133-мегагерцовым процессором очевидно будет «в норме», а вот синхронно работающие на 133 МГц Pentium 4 и DDR266 это очень заманчиво и очень «результативно», как можно предположить, исходя из показателей Willamette 2,2 ГГц.
Осталось только понять: зачем вам новый процессор?