Буквально на днях компания ATI собирается анонсировать новый чипсет (или даже серию чипсетов), который должен обеспечить модную маркетинговую особенность — поддержку двух полноскоростных графических интерфейсов PCI Express x16, разумеется, с поддержкой CrossFire. До этого аналогичный шаг сделала NVIDIA с чипсетом nForce4 SLI X16 (nForce Pro в этом контексте упоминать не будем), а прежде желающим создать систему SLI/CrossFire приходилось довольствоваться менее скоростным сочетанием графических интерфейсов. В большинстве продуктов на рынке (чипсеты NVIDIA, ATI) для такого случая использовалась формула x8+x8 — пропускная способность единственного интерфейса x16 поровну распределялась между двумя слотами (форм-фактора, разумеется, PCIEx16).
Однако чипсеты Intel, первыми предложившие пользователям интерфейс PCI Express, такой возможностью не обладали даже во втором поколении (i945/955), поэтому некоторые производители материнских плат прибегали к нестандартному решению с формулой x16+x4. В данном случае первый графический слот обслуживается силами собственно графического интерфейса (x16), а второй подключается не к северному, а к южному мосту и задействует его четыре линии PCI Express, вообще-то предназначенные для подключения периферии. Причем если у платы на i945/955 с южным мостом ICH7R оставалось в этом случае хоть две свободные линии PCI-E, то решения с южным мостом ICH7 или на i915/925 лишались нового интерфейса полностью. (Впрочем, карт расширения с интерфейсом PCIEx1 на рынке даже сейчас практически нет, так что покупатель такой платы лишался, по сути, только интегрированных контроллеров (LAN, SATA RAID), подключаемых к шине PCI Express.) Лишь i975X позволил организовать разделение графического интерфейса на два слота по формуле x8+x8, как у конкурентов.
Нам показалось интересным проверить, существует ли в реальных приложениях разница между разными чипсетами или разными способами организации SLI/CrossFire хотя бы у текущих решений. Дело в том, что даже сами производители видеоускорителей не обещают заметного прироста от перехода к режиму x16+x16, называя осторожную цифру 10% для топовых моделей в самых тяжелых условиях. Изучению этого вопроса и посвящена сегодняшняя статья, в которой мы используем два ускорителя на базе ATI Radeon X850 XT (более скоростные карты в достаточном количестве на момент тестирования в нашей лаборатории отсутствовали).
Исследование производительности
Тестовый стенд:
- Процессоры:
- AMD Athlon 64 4000+ (2,4 ГГц), Socket 939
- Intel Pentium 4 Extreme Edition 3,46 ГГц, Socket 775
- Материнские платы:
- Sapphire PC-A9RD480Adv (версия BIOS I-4M) на чипсете ATI Xpress 200 CFE (AMD)
- ECS PA1 MVP (2.0) (версия BIOS 1.0A) на чипсете ATI Xpress 200 CFE (Intel)
- ECS PF22 Extreme (BIOS от 14.10.2005) на чипсете i955X
- Gigabyte G1975X (версия BIOS F1) на чипсете i975X
- Память:
- 2x512 МБ DDR400 DDR SDRAM DIMM Corsair (CMX512-3200XL), 2-2-2-5
- 2x512 МБ DDR2-533 DDR2 SDRAM DIMM Corsair (CM2X512A-4300C3PRO), 3-3-3-8
- Видеокарты:
- основная: [PCIEx16] Sapphire (ATI) Radeon X850 XT CrossFire Edition (256 МБ)
- дополнительная: [PCIEx16] PowerColor (ATI) Radeon X850 XT PE (256 МБ)
- Жесткий диск: Seagate Barracuda 7200.7 (SATA), 7200 об/мин
Программное обеспечение:
- ОС и драйверы:
- Windows XP Professional SP2
- DirectX 9.0c
- Intel Chipset Software Installation Utility 7.0.0.1019
- ATI Catalyst 5.12
- Тестовые приложения:
- 7-Zip 4.10b
- MPEG4-кодек DivX Pro 5.2.1
- Doom 3 (v1.0.1282)
- FarCry (v1.1.3.1337)
- Unreal Tournament 2004 (v3339)
Результаты тестов
В качестве платформ для тестирования взяты почти все имеющиеся, с учетом того, что чипсеты NVIDIA не позволяют (надеемся, пока) запускать два CrossFire-ускорителя, хотя разделение графического интерфейса для двух SLI-карт у них есть. Таким образом, система на AMD осталась в гордом одиночестве — соответствующих серийных продуктов на чипсетах VIA и SiS мы пока не видели. Сразу хотим отметить, что напрямую сравнивать ее результаты с тремя Intel-системами не нужно, так как процессоры, разумеется, разные (единственным принципом их подбора была близость к топовым решениям, чтобы как можно меньше тормозить связку видеокарт). Более того, мы не ставили своей целью максимизировать результаты каждой из платформ — скорее, наоборот, старались их выровнять, для чего запускали платы с поддержкой DDR2 при таймингах 4-4-4, так как плата ECS PF22 Extreme меньшие «не потянула». Впрочем, ECS PA1 MVP (2.0) и вовсе отказалась нам сообщить, с какими таймингами она стартует (возможности выставить их принудительно также не было).
Итак, наша задача сегодня — наблюдать возможные отличия «CrossFire Ready»-платы (ECS PF22 Extreme) от «CrossFire Ready»-чипсета (i975X), а также от второго чипсета — ATI Xpress 200 CrossFire Edition, название которого говорит само за себя. Результаты же системы с процессором AMD даны в качестве реперной точки, хотя определенные выводы по ним мы, конечно, сделаем. Однако прежде чем броситься к играм, необходимо оценить «отвлеченное» быстродействие каждой из платформ, дабы не смешивать возможный эффект от более удачной реализации CrossFire с обычным превосходством в производительности при работе с памятью.
Действительно, налицо разница в скорости между системами, причем i975X выигрывает пару процентов у [конкретного представителя] i955X и до 5% у чипсета ATI. Разная процессорная архитектура неизбежно приводит к разнице между платформами Intel и AMD, однако и здесь есть интересный момент, который трудно было предсказать заранее. Все системы с процессором Pentium 4 EE практически не отреагировали на включение CrossFire, в то время как результаты платы с не самым слабым Athlon 64 4000+ «просели» (да-да, вы ведь не ожидали, что добавление второго видеоускорителя ускорит процесс архивирования?!) почти на 3%. Не очень много, но наглядная демонстрация пользы от Hyper-Threading: второй логический процессор целиком берет на себя обслуживание Catalyst AI.
Впрочем, кодирование видео практически не замедляется во всех случаях, так что, в конечном итоге, интеллект видеодрайверов ATI обходится не слишком дорого.
Теперь о 3D-приложениях. Наверное, следует напомнить, что далеко не все игры получают выигрыш от распараллеливания рендеринга картинки — или из-за недоработок в драйверах, или из-за того, что производительность системы упирается не в видеоускоритель, а в какой-либо иной компонент (как правило, процессор). Так, мы не стали приводить в статье добросовестно отснятые показатели в SPECviewperf (тут включение CrossFire вызывает замедление работы до двух раз) и игре Painkiller (±0%); ситуацию в целом красноречиво иллюстрирует Unreal Tournament 2004:
Обратимся к тем двум играм, в которых эффект от CrossFire наблюдается.
Разумеется, в 640×480 при минимальном качестве графики мы будем тестировать процессоры при любой сколь-нибудь современной видеокарте, так что здесь получаем картину, весьма напоминающую тест на архивирование.
Режим 1024×768 при настройках графики «High» — это, фактически, переломная точка, где ЦП по возможностям подтягивается к загруженному работой X850 XT; здесь уже можно ожидать выигрыша от CrossFire. Действительно, небольшой прирост есть во всех случаях, хотя эти 3—6% — явно недостаточная причина для покупки пары видеоускорителей. Разница в эффекте от CrossFire у трех чипсетов под Pentium 4 настолько незначительна, что никаких серьезных выводов делать нельзя.
Наконец, 1600×1200 при максимальном качестве графики, которого позволяют добиться настройки игры, — это как раз бенефис решения ATI; посмотрим на результат внимательно. Во-первых, отметим, что при работе с одной картой три системы явно упираются в производительность X850 XT, и на этом фоне повышенная скорость платы Gigabyte G1975X может быть объяснена разве что автоматическим разгоном видеоускорителя. Разумеется, при тестировании мы отключаем подобные функции в BIOS Setup, но, вероятно, в случае Gigabyte сделать это невозможно. Теперь, если говорить о разнице в эффекте от CrossFire, хорошо заметно, что единственная платформа AMD выигрывает больше прочих (+57%), у остальных показатели такие: ATI Xpress 200 CFE — +50%, i955X — +53%, i975X — +46%.
Режим 640×480 в FarCry ничем не отличается принципиально от такового в Doom 3 — ускорение около нуля или отрицательное.
Режим 1024×768, «High» — уже есть положительный эффект, хотя и скромный (5—8%). Однако отметим разницу по минимальному показателю fps: везде небольшое падение при включении CrossFire, так что, по-видимому, здесь наблюдается зависимость от скорости процессора. Расхождения между системами очень невелики, о различиях в приросте от CrossFire серьезно говорить не приходится.
Наконец, самое интересное: максимальный режим. Снова тот же артефакт производительности у i975X (прирост от CrossFire всего 54% из-за слегка завышенной общей скорости), прочие результаты почти одинаковы (~62%). По-видимому, здесь даже связка CrossFire упирается в собственную производительность, а скорость процессоров избыточна. А вот про минимальный показатель fps этого сказать нельзя, здесь четко наблюдается превосходство системы с Athlon 64 4000+: в режиме CrossFire у нее этот показатель выше на 32%, в то время как у систем с Pentium 4 EE 3,46 ГГц прирост составляет всего ~22%. Разница же между Intel-системами почти отсутствует.
Выводы
Подводя итог нашему сегодняшнему тестированию, отметим ряд замеченных фактов:
- Далеко не все игры (и прочие 3D-приложения) позволяют «развернуться» CrossFire-связке двух X850 XT при практически самых быстрых одноядерных процессорах в линейках AMD и Intel на сегодня. Для данного сочетания комплектующих некоторый эффект начинает появляться с разрешения 1024×768 при почти максимальном качестве графики (конечно, обобщать эти цифры на все игры мы не можем).
- В наиболее тяжелых игровых режимах скорость CrossFire-системы может вновь ограничиваться производительностью ЦП, хотя одиночной видеокарте скорости процессора хватало с избытком. В большинстве таких случаев производительность оказывается выше у процессоров AMD.
- Скорость CrossFire-системы зависит от так называемой «производительности чипсета» (в основном определяемой подсистемой памяти) примерно в той же мере, что и скорость одиночной карты — рекомендации по покупке очевидны.
- Наконец, наиболее интересное: в наших условиях (набор «железа» и тестового ПО) никакой разницы между режимами работы двух видеокарт x8+x8 или x16+x4 мы не обнаружили (что, вообще говоря, не означает, что ее нельзя обнаружить в других условиях). Эти данные позволяют, во-первых, оставить мысли о необходимости покупки платы с поддержкой x16+x16, если вы не собираетесь прикупать к ней пару X1900 XT или GeForce 7800 GTX. Во-вторых, по итогам сегодняшнего исследования можно смело рекомендовать тем, кто собирается взять плату под CrossFire «на вырост», выбирать модель себе по душе, не обращая особого внимания на формулу функционирования слотов для графики (лишь бы их было два). Возможно, вторую карту вы так и не купите, но в любом случае в производительности потеряете навряд ли.