Новый двухчиповый претендент на трон 3D короля: Gigabyte Geforce 9800 GX2 2x512MB PCI-E, XFX Geforce 9800 GX2 2x512MB PCI-E
СОДЕРЖАНИЕ
- Часть 1 Теория и архитектура
- Часть 2 Практическое знакомство
- Особенности видеокарт
- Конфигурация стенда, список тестовых инструментов
- Результаты синтетических тестов
- Результаты игровых тестов (производительность)
Часть 1: Теория и архитектура
Ну вот и подошло долгожданное время анонса двухчиповой видеокарты Nvidia Geforce 9800 GX2, которая объединяет мощь двух видеочипов G92 в одном решении. В отличие от компании AMD, которая для верхнего ценового диапазона уже выпускает и в дальнейшем хочет выпускать мультичиповые решения на основе технологии CrossFire, Nvidia вроде бы не отказывается от одночипового будущего своих видеокарт, и в дальнейшем планирует предлагать быстрые решения на основе единственного GPU. Но рассматриваемое сегодня решение призвано перехватить корону номинального лидерства в бенчмарках у AMD RADEON HD 3870 X2, которую тот захватил в конце января этого года.
Nvidia не занимать опыта по проектированию и производству мультичиповых карт, они раньше AMD вышли на рынок со своей технологией SLI, был у них и опыт производства современного двухчипового решения на её основе Geforce 7950 GX2. Это была карта на основе двух G71, работающих на сниженных частотах, объединенных в один ускоритель по технологии SLI. И вот сейчас компания анонсировала очередную аналогичную видеокарту, основанную на базе двух чипов G92, которую мы сегодня вкратце рассмотрим. Время двухчиповых решений снова настало (после Quantum3D Obsidian, ATI Rage Fury MAXX, Geforce 7950 GX2).
Повторимся ещё раз, что увлечение мультичиповыми продуктами не может радовать. Несмотря на удобство создания продуктов для разных ценовых диапазонов на основе разного количества одних и тех же чипов, одночиповое решение всегда будет обладать преимуществами: оно будет быстрее во всех приложениях, а не только оптимизированных для мультичиповых конфигураций, кроме того, оно не содержит избыточных блоков в каждом из чипов, обладает лучшими характеристиками по энергопотреблению и тепловыделению, и в случае одночипового решения отсутствуют проблемы задержек при отрисовке изображения, свойственные режиму Alternate Frame Rendering (AFR).
Производители видят в многочиповых конфигурациях один из самых простых путей роста производительности, заметный, прежде всего, в бенчмарках. Эффективность технологий SLI/CF в них высока, и достигает 80-90%, но такой прирост наблюдается лишь в высоких разрешениях и лишь в некоторых бенчмарках. На наш взгляд, подобные продукты должны служить лишь для временного усиления позиций на рынке до выхода следующего поколения видеочипов, а полностью заменять одночиповые high-end видеокарты они не должны.
Теоретическая часть по Geforce 9800 GX2 будет очень короткой, это просто два чипа G92, установленные на две соединенные между собой печатные платы вместе с памятью и остальной обвязкой. Двухчиповая система работает по технологии SLI, реализованной на карте аппаратно, линии PCI Express и соответствующий мост выполнены прямо на плате, и карта не использует соответствующих ресурсов системной платы. Разницей, по сравнению с системой из двух Geforce 8800 GTS 512MB, можно считать лишь иные рабочие частоты чипа и памяти.
Перед прочтением данного материала мы рекомендуем внимательно ознакомиться с базовыми теоретическими материалами DX Current, DX Next и Longhorn, описывающими различные аспекты современных аппаратных ускорителей графики и архитектурные особенности продукции Nvidia и AMD.
- [06.06.05] Longhorn ускорители и шейдеры для DirectX 10
- [01.03.05] DirectX.Update Ускорители 3D-графики: полшага вперед
- [09.04.04] DX.Next: ближайшее и ближнее будущее аппаратного ускорения 3D-графики
Эти материалы достаточно точно спрогнозировали текущую ситуацию с архитектурами видеочипов, оправдались многие предположения о будущих решениях. А подробную информацию об унифицированной архитектуре Nvidia G8x/G9x на примере предыдущих чипов можно найти в следующих статьях:
- [11.12.07] Nvidia Geforce 8800 GTS 512MB (G92) Снова 128 более сильных калифорнийских стрелков, но с урезанными копьями
- [29.10.07] Nvidia Geforce 8800 GT (G92) Уже 112 быстрых калифорнийских стрелков…
- [17.04.07] Nvidia Geforce 8600 GTS (G84) 32 калифорнийских стрелка в действии
- [08.11.06] Nvidia Geforce 8800 GTX (G80) новый монстр в 3D-графике и первый DX10-ускоритель
Как мы уже упоминали в предыдущих материалах, чипы серии G9x основаны на уже известной архитектуре Geforce 8 (G8x) и включают в себя все её преимущества: унифицированную шейдерную архитектуру, полную поддержку DirectX 10 API, качественные методы анизотропной фильтрации и алгоритм антиалиасинга CSAA с количеством сэмплов до шестнадцати включительно. Отличительными особенностями новых чипов являются некоторые из блоков, измененных в лучшую сторону (TMU, ROP, PureVideo HD), а также технология производства 65 нм, позволившая снизить себестоимость продукции. Рассмотрим характеристики новой мультичиповой карты на основе двух G92:
Графический ускоритель Geforce 9800 GX2
- Кодовое имя чипа 2 × G92-450
- Технология 65 нм
- 2 × 754 миллиона транзисторов
- Унифицированная архитектура с массивом общих процессоров для потоковой обработки вершин и пикселей, а также других видов данных
- Аппаратная поддержка DirectX 10, в том числе шейдерной модели Shader Model 4.0, генерации геометрии и записи промежуточных данных из шейдеров (stream output)
- Двойная 256-битная шина памяти, по четыре независимых контроллера шириной по 64 бита
- Частота ядра 600 МГц
- ALU работают на более чем удвоенной частоте 1.5 ГГц
- 2 × 128 скалярных ALU с плавающей точкой (целочисленные и плавающие форматы, поддержка FP 32-бит точности в рамках стандарта IEEE 754, MAD+MUL без потери тактов)
- 2 × 64 блока текстурной адресации с поддержкой FP16 и FP32 компонент в текстурах
- 2 × 64 блока билинейной фильтрации (как и в G84 и G86, нет бесплатной трилинейной фильтрации и более эффективной анизотропной фильтрации)
- Возможность динамических ветвлений в пиксельных и вершинных шейдерах
- 2 × 4 широких блока ROP (16 пикселей) с поддержкой режимов антиалиасинга до 16 сэмплов на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Каждый блок состоит из массива гибко конфигурируемых ALU и отвечает за генерацию и сравнение Z, MSAA, блендинг. Пиковая производительность всей подсистемы до 128 MSAA отсчетов (+ 128 Z) за такт, в режиме без цвета (Z only) 256 отсчетов за такт
- Запись результатов до 8 буферов кадра одновременно (MRT)
- Все интерфейсы (два RAMDAC, два Dual DVI, HDMI, HDTV) интегрированы на чип
Спецификации референсной видеокарты Geforce 9800 GX2
- Частота ядра 600 МГц
- Частота универсальных процессоров 1500 МГц
- Количество универсальных процессоров 2 × 128
- Количество текстурных блоков 2 × 64, блоков блендинга 2 × 16
- Эффективная частота памяти 2,0 ГГц (2*1000 МГц)
- Тип памяти GDDR3
- Объем памяти 2 × 512 мегабайт
- Пропускная способность памяти 2 × 64,0 гигабайта в сек.
- Теоретическая максимальная скорость закраски 2 × 9,6 гигапикселя в сек.
- Теоретическая скорость выборки текстур до 2 × 38,4 гигатекселя в сек.
- Два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600
- Разъем HDMI с поддержкой HDCP
- SLI разъем
- Шина PCI Express 2.0
- TV-Out, HDTV-Out
- Энергопотребление до 197 Вт
- Двухслотовое исполнение
- Рекомендуемая цена $599-$649
Ничего нового и интересного. Как видно по характеристикам, двухчиповый вариант на G92 отличается от одночипового Geforce 8800 GTS 512MB частотами GPU целиком и шейдерных блоков в частности. Пропускная способность памяти у решения аналогична SLI системе из Geforce 8800 GTS 512MB, да и объём видеопамяти остался тем же (в расчёте на один GPU). А это уже интереснее, ведь карты предназначены для разных ценовых секторов…
Хотя 512 мегабайт видеопамяти на один чип, согласно нашим недавним исследованиям, на сегодняшний день достаточно для подавляющего большинства современных игр, судя по ещё более новым играм, таким, как Crysis, топовым видеокартам в высоких разрешениях, для которых они и предназначены, этого может не хватать, и в некоторых условиях Geforce 9800 GX2 может даже отставать от той же Geforce 8800 Ultra, имеющей 768 мегабайт памяти. С другой стороны, на видеоплате с G92 нельзя установить столько памяти, возможен только объём в 512 или 1024 мегабайт. А дважды по гигабайту быстрой GDDR3 памяти будет слишком дорого для Nvidia, и видимо поэтому они решили комплектовать Geforce 9800 GX2 объёмом в 512 Мбайт золотой серединой для современных игр.
Nvidia отмечает, что видеоплата Geforce 9800 GX2 использует патентованную двухплатную конструкцию, оптимальную по акустическим и другим качествам. Этот специальный дизайн предполагает монтаж двух GPU, каждый из которых размещается на своей PCB, что даёт следующие преимущества:
- Каждый чип выделяет тепло, нагревая только «свою» PCB, в отличие от одноплатного дизайна, где оба чипа расположены на одной PCB и нагревают её совместными усилиями, что может вызвать необходимость снижения частот установленных GPU.
- Две PCB позволяют сделать более качественную разводку, что важно для работы видеопамяти на высоких частотах.
- Патентованный кулер охлаждает одновременно оба чипа, в отличие от Geforce 7950 GX2, где использовались два отдельных устройства охлаждения.
Заявлено, что Geforce 9800 GX2 будет работать на любой системной плате с поддержкой PCI Express, от неё не требуется специальная поддержка технологии SLI. Это ещё нужно проверить на практике, ибо случаи несовместимости вполне могут быть.
Также важно отметить, что для Geforce 9800 GX2 обязательно подключение двух PCI-E разъемов питания: 6-штырькового и 8-штырькового. Видеокарта не будет работать при подключении лишь одного из них или при использовании двух 6-штырьковых разъемов. Соответственно, требования к блоку питания дополняются ещё и минимально допустимой мощностью. Для одиночной карты требуется минимум 580-ваттный блок питания, а для двух Geforce 9800 GX2 нужна современная 850-ваттная модель.
Архитектура
Ничего нового рассказать мы не можем, чипы G92 остались теми же, они были подробно описаны нами в соответствующих материалах. Архитектура Nvidia G9x была анонсирована ещё осенью прошлого года, а если учитывать, что это лишь слегка модифицированная архитектура G8x то и того раньше, аж в 2006 году. Основным отличием чипа G92 от предыдущего топового G80 стала технология производства 65 нм, позволившая снизить себестоимость сложных чипов и понизить энергопотребление и тепловыделение. Количество блоков ALU и TMU у них равное, а ещё одно значительное отличие более нового чипа заключается в том, что у него вместо 384-битной шины реализована 256-битная.
В общем, как было написано в материалах про Geforce 8800 GT и 8800 GTS 512MB, G92 является предыдущим флагманом G80, переведенным на новый техпроцесс, но с некоторыми изменениями: уменьшенным количеством блоков ROP и некоторыми улучшениями в TMU, а также новым алгоритмом сжатия, реализованным в блоках ROP, который работает на 15% эффективнее. Обо всём этом подробнее написано в наших предыдущих материалах.
Quad SLI
Кроме того, что Geforce 9800 GX2 сам является двухчиповой SLI системой, новые возможности технологии Quad SLI позволяют объединять две такие платы в одной системной плате с поддержкой SLI. Подобной поддержкой обладают системные платы на основе чипсетов Nvidia nForce 680i, 780i и 780a.
Первые реализации технологии Quad SLI на четырехчиповых конфигурациях использовали гибридный режим SLI: Split Frame Rendering (SFR) и Alternate Frame Rendering (AFR) одновременно. В массе современных игр, использующих сложные шейдеры, многопроходный рендеринг и сложную постобработку, режим SFR заметно уступает по эффективности режиму AFR, поэтому было решено сделать чистый AFR режим, когда параллельно обрабатываются уже четыре кадра. В таком случае частота кадров растёт почти линейно, вместе с геометрической, текстурной и шейдерной производительностью. Да и с совместимостью проблем меньше.
Системы Quad SLI получают большое преимущество в играх, в которых производительность ограничена филлрейтом, таких, как FEAR. Так, игровая система из двух Geforce 9800 GX2 в этой игре почти в два раза быстрее, чем одиночная карта. В других приложениях картина несколько хуже, средний прирост от добавления второй GX2 составляет около 40-50%. Впрочем, около 70% прироста для Crysis при максимальных настройках это уже очень неплохо.
Самое время поговорить о недостатках. Мы уже упоминали о задержках, вносимых (точнее, не уменьшаемых при видимом росте FPS) режимом AFR. Но если на двухчиповой системе они практически незаметны, то на четырехчиповой уже вполне могут ощущаться человеком, так как FPS хоть и растёт, но задержки не снижаются. Картинка вроде бы становится плавнее, чем на одночиповой системе, но играть почти так же некомфортно, в случае, если один чип не обеспечивает хотя бы 30 средних кадров в секунду в тех же условиях. Ну и ещё одним небольшим недостатком Quad SLI является то, что технология работает только в операционной системе Windows Vista.
HybridPower
Видеокарта Geforce 9800 GX2 частично поддерживает технологию Hybrid SLI, которая включает две основных возможности: HybridPower и Geforce Boost. Рассматриваемая сегодня двухчиповая видеокарта поддерживает HybridPower технологию, которая автоматически переключает используемое видеоядро между внешней видеокартой (Geforce 9800 GX2, в нашем случае) и интегрированным в чипсет ядром Geforce (естественно, требуется системная плата с поддержкой технологии HybridPower), в зависимости от степени нагрузки.
На схеме отображены два варианта работы SLI системы в HybridPower. Первый режим (сверху) используется при запуске 3D приложений, интенсивно использующих возможности установленных видеокарт Geforce 9800 GX2, которые работают в полную силу. Второй режим предназначен для повседневного использования и просмотра видео с аппаратным ускорением, в том числе. В этом случае используются мощности интегрированного в чипсет видеоядра, а установленные видеокарты могут быть выключены полностью, не потребляя энергии вовсе!
При работе HybridPower изображение от внешних видеокарт пересылается на встроенную и выводится по одному видеовыходу, расположенному на задней части системной платы, что позволяет использовать и встроенное видео и дискретное при помощи одного и того же физического разъема. В повседневном использовании HybridPower отключает внешнее видео, сохраняя электроэнергию и уменьшая шум, производимый устройствами охлаждения видеокарт. Но в случае, когда требуется вся 3D мощь установленных видеокарт, на них подаётся питание и они начинают работу по рендерингу изображения.
PureVideo HD
Ничего нового, по сравнению с видеокартами на одном чипе G92, тут не появилось, да и не могло. Но все программные улучшения PureVideo HD, появившиеся в новых версиях драйверов, начиная с ForceWare 174, приуроченные к выходу Geforce 9600 GT, работают и на Geforce 9800 GX2. Из важных последних нововведений PureVideo HD можно отметить двухпоточное декодирование, динамическое изменение контрастности и цветовой насыщенности.
Ещё одним полезным нововведением последней версии PureVideo HD стала возможность одновременной работы оболочки Aero в операционной системе Windows Vista во время проигрывания аппаратно ускоренного видео в оконном режиме, что ранее не было возможно. Обо всем этом подробнее написано в обзоре Geforce 9600 GT.
Поддержка внешних интерфейсов
Поддержка внешних интерфейсов у Geforce 9800 GX2 мало чем отличается от того, что есть у предыдущих решений на тех же GPU. Имеющийся на платах Geforce 8800 (кроме основанных на чипе G92) дополнительный чип NVIO, поддерживающий вынесенные за пределы основного внешние интерфейсы, в G92 включен в состав самого чипа.
На референсных видеокартах Geforce 9800 GX2 установлены два Dual Link DVI выхода (каждый на своей PCB) с поддержкой HDCP, а также один HDMI, поддерживающий HDCP. Хотя разъемы HDMI и DisplayPort на видеокарте не обязательны, их могут заменить простые переходники с DVI на HDMI или DisplayPort.
Для вывода звука по HDMI, на рассматриваемой видеокарте разместили SPDIF вход, к которому требуется присоединить источник аудиосигнала при использовании HDMI выхода. Для этого, системная плата с SPDIF выводами соединяется прилагаемым кабелем к SPDIF разъему на верхней части видеокарты. Интересно, что не все тестовые экземпляры содержат оптический звуковой вход, возможно, необходимость его применения решается партнерами компании.
Итак, сегодня мы с вами только вкратце рассмотрели теоретические особенности нового двухчипового решения Geforce 9800 GX2. А практические части исследования, с синтетическими и игровыми тестами, будут доступны несколько позже. В них мы узнаем, насколько увеличилась производительность двухчиповой видеокарты Nvidia относительно одночиповых вариантов, а также двухчипового решения от AMD, определив слабые и сильные стороны.