NVIDIA GeForce FX 5600 Ultra (NV31) и GeForce FX 5200 Ultra (NV34)

"Ширпотребшейдеры"


Уже по традиции, предваряя большой материал анализа работы нового акселератора, мы настоятельно рекомендуем прочитать аналитическую статью, посвященную архитектуре и спецификациям NVIDIA GeForce FX (NV30), а также практический обзор NVIDIA GeForce FX 5800 Ultra, поскольку рассматриваемые сегодня ускорители базируются на технологиях NV30

СОДЕРЖАНИЕ

  1. Общие сведения
  2. Особенности видеокарт NVIDIA GeForce FX 5600 Ultra и 5200 Ultra
  3. Конфигурации тестовых стендов и особенности настроек драйверов
  4. Результаты тестов: коротко о 2D
  5. Синтетические тесты RightMark3D: идеология и описание тестов
  6. Результаты тестов: RightMark3D: Pixel Filling
  7. Результаты тестов: RightMark3D: Geometry Processing Speed
  8. Результаты тестов: RightMark3D: Hidden Surface Removal
  9. Результаты тестов: RightMark3D: Pixel Shading
  10. Результаты тестов: RightMark3D: Point Sprites
  11. Результаты тестов: Синтетические тесты 3DMark2001 SE
  12. Выводы из результатов синтетических тестов
  13. Результаты тестов: Игровые тесты 3DMark2001 SE: Game1
  14. Результаты тестов: Игровые тесты 3DMark2001 SE: Game2
  15. Результаты тестов: Игровые тесты 3DMark2001 SE: Game3
  16. Результаты тестов: Игровые тесты 3DMark2001 SE: Game4
  17. Результаты тестов: Игровые тесты 3DMark03: Game1
  18. Результаты тестов: Игровые тесты 3DMark03: Game2
  19. Результаты тестов: Игровые тесты 3DMark03: Game3
  20. Результаты тестов: Игровые тесты 3DMark03: Game4
  21. Результаты тестов: Quake3 ARENA
  22. Результаты тестов: Serious Sam: The Second Encounter
  23. Результаты тестов: Return to Castle Wolfenstein
  24. Результаты тестов: Code Creatures DEMO
  25. Результаты тестов: Unreal Tournament 2003 DEMO
  26. Результаты тестов: AquaMark
  27. Результаты тестов: RightMark 3D
  28. Результаты тестов: DOOM III Alpha version
  29. Качество 3D: Анизотропная фильтрация
  30. Качество 3D в целом
  31. Выводы
Общие сведения

Не так давно мы тщательным образом рассмотрели новый флагман от NVIDIA — GeForce FX 5800 Ultra, известный ранее как NV30. А что такое NV30 вообще? Один чип или семейство? Если подходить к этому вопросу буквально, то это два одинаковых чипа, просто работающих на разных частотах, вследствие чего в свет должны выйти 5800 Ultra и просто 5800. Но если посмотреть на NV30 как родоначальника новой архитектуры, даже нового подхода к формированию графических процессоров, то это начало целого семейства.

Да, на основе предыдущего материала, где мы тщательно и даже не один раз исследовали работу NV30, мы уже убедились, что пора отвыкать от традиционных представлений устройства ускорителя. Речь идет об архитектуре рендеринга. Если упростить все эти малопонятные для простого пользователя термины и рассуждения, то можно сказать следующее:

Речь вести о том, что у чипа 4 или 8 конвейеров, можно теперь условно. На самом деле, драйвер каждый раз, даже под каждую сцену отдельно, может конфигурировать работу VPU по-разному. Этим достигается большая гибкость работы ускорителя на современных играх. К сожалению, не все игры могут работать столь оптимизированно, некоторые старые игры, использующие одиночное текстурирование, не смогут воспользоваться всеми возможностями новых процессоров, к тому же все зависит от настройки драйверов под ту или иную игру.

Итак, NV30, кроме вышеупомянутой гибкости конфигурирования и настраивания, обладает поддержкой DX9, а следовательно и шейдерами 2.0 и даже 2.0+. Мы не станем сейчас снова рассказывать о преимуществах нового API от Microsoft, в статьях, о которых мы говорили в начале обзора, все есть по данному вопросу.

Однако, как известно из прошлого, практически все новые интересные и прогрессивные технологии из области 3D внедрялись в топовых акселераторах уровня High-End, обладающих очень высокими ценами и малодоступными для большинства пользователей. Поэтому разработчики игр крайне неохотно шли на новшества, и мы уже не один год видели появление на рынке игр со старыми уже наработанными техниками. Естественно, какой производитель игр будет внедрять, скажем, шейдеры, делать на их основе более красивую и реалистичную графику, тратить ресурсы (время и деньги), когда это увидеть смогут от силы 5% пользователей? А выпускать гибко настраиваемые под всевозможные акселераторы игры — еще накладнее. Поэтому обилие на рынке GeForce2, да и старых TNT2 тормозило развитие игрового рынка, несмотря на выпуск огромного числа 3D-игр (обладающих подчас очень скромным объемом полигонов в сцене, да и эффектами не могущих впечатлить).

Мы видим, что вплоть до 2003 года от NVIDIA на рынок до $100 поступали видеокарты как раз таких весьма слабых возможностей — GeForce4 MX, неспособных держать даже DX8. Все "шейдерные" ускорители от этой компании ниже $120-130 и по сей день не опускаются. Когда как ATI еще летом 2002 года выдвинула в данный сектор свой RADEON 9000(PRO), обладающий полноценной поддержкой DirectX 8.1. Да, тогда благодаря именно ATI в Low-End секторе появился современный ускоритель. Пусть и медленный, конечно. Однако, та же канадская фирма сделала все возможное, чтобы RADEON 9000 не стал очень популярным: это и чехарда с драйверами (то одна игра глючит, то вторая, то еще какие-то проблемы), и проблема несовместимостей с рядом системных плат, и подчас низкое качество изготовления карт от некоторых партнеров ATI (о знаменитом 2D-качестве карт от ATI можно забыть). И последнее: грубейшая маркетинговая ошибка с названием карты, когда более слабый по производительности RADEON 9000 имеет в названии более высокую цифру, чем предшественник RADEON 8500, а по сути обе карты поддерживают одни и те же технологии (даже у 8500-го есть аппаратный TrueForm, чего нет у 9000-го).

Поэтому популярность GeForce4 MX хоть и пошла на спад, но RADEON 9000 был слишком слабым соперником по вышеизложенным причинам. Но все же NVIDIA беспокоило то, что новые технологии очень медленно внедряются из-за того, что на Low и Middle-секторах рынка в огромных количествах находится даже не DX8, а DX7-ускорителей. И поэтому, первым же шагом в проектировании новой архитектуры (NV30) стало планирование распространения техник DX9 на Low- и Middle-ускорители.

Да, нечто подобное есть и у ATI (RADEON 9500 64MB/128MB, 9500 PRO). Однако, самая нижняя граница цен, которой ныне достиг самый дешевый 9500 64MB, это $150. Ниже этой отметки у ATI нет больше DX9-акселераторов. Да и вообще имеется большая "дыра", так как RADEON 9000 PRO, ближайший от RADEON 9500 "сосед" имеет стоимость уже ниже $100. Следовательно в нише $100-150 у ATI есть только остатки старых RADEON 8500, которые ныне мало кому интересны. Именно сюда, а также на вытеснение RADEON 9000/PRO, направлена линейка ускорителей от NVIDIA под общим кодовым названием NV34. Разумеется, все GeForce4 MX должны или спуститься до уровня $50, или уйти с рынка вообще. Конечно, когда на рынке появится RADEON 9200 (тот же RADEON 9000 с AGP 8x), то именно он будет соперничать с самыми дешевыми моделями NV34.

Средняя модель — NV31 (вернее, также линейка) позиционируется как соперник RADEON 9500-9500 PRO, а также приходящей ему на смену линейки RADEON 9600/PRO. Разумеется, уйдут в небытье прежние продукты NVIDIA — GeForce4 Ti 4600(4800) и 4200 (4200-8х). Их заменят GeForce FX 5600 Ultra и 5600.

Таким образом, весной 2003 года NVIDIA выкатывает на сцену арсенал новых ускорителей для Low- и Middle-секторов рынка.

  • GeForce FX 5600 Ultra — 350 МГц чип, 128/256 Мбайт 350 МГц (DDR 700) 128 бит памяти (~$199);
  • GeForce FX 5600 — ??? МГц чип, 128 Мбайт ??? МГц (DDR) 128 бит памяти (~$179);
  • GeForce FX 5200 Ultra — 325 МГц чип, 64/128 Мбайт 325 МГц (DDR 650) 128 бит памяти (~$100-149);
  • GeForce FX 5200 — ??? МГц чип, 64/128 Мбайт ??? МГц (DDR) 128 бит памяти (~$79-99).

Цены в скобках указаны предварительные, они могут меняться (в сторону снижения), поэтому мы ориентируемся на них только приблизительно.

А теперь познакомимся с архитектурой GeForce FX 5600 и 5200:


 NV30NV31NV34
Технология, нм.130130150
Транзисторов, млн.1257547
Пиксельных конвейеров42/4(1)2
Текстурных блоков844
Частота ядра, Мегагерц400/500 (Ultra)350 (Ultra)250/325 (Ultra)
Шина памяти, бит128 (DDR II)128 (DDR) (2)128 (DDR)
Частота шины памяти (эфф.) Mегагерц800/1000 (Ultra)700 (Ultra)333… 650 (Ultra)
Пиксельные шейдеры2.0+2.0+2.0+ (3)
Вершинные шейдеры2.0+2.0+2.0+
ПСП, гигабайт в сек.1611,2До 10,4 (Ultra)
HSRДаДаДа
Ранний Z тестДаДаДа
Сжатие ZДаДаДа
Сжатие цвета в MSAA режимахДо 1:4До 1:4Нет
Аппаратный геометрический блокЕстьЕсть (4)Есть (4)
RAMDAC, Мегагерц2х4002х4002х350
TV-outВстроен ?Внешний ?Внешний ?
DVIВнешний (5)ВстроенВстроен
КорпусFCPGABGA (6)BGA (6)
Внешнее питаниеОбязательноЖелательноОпционально

Примечания:

  1. NV31 может работать по схеме 4х1 (конвейеров х текстурных модулей) или 2х2 (см. далее подробное исследование).
  2. Есть поддержка DDR2
  3. Есть некоторые отличия в возможностях пиксельных шейдеров NV34, относительно NV31, но они как минимум соответствуют 2.0.
  4. Аппаратный геометрический процессор NV31 и NV34 имеет одинаковую (!) вычислительную производительность, меньшую более чем вдвое по сравнению с NV30. Все отличия между NV31 и NV34 в плане скорости обработки геометрии обусловлены контроллерами памяти, КЭШами и размером внутренних очередей.
  5. До двух DVI интерфейсов, причем, один может быть двухканальный.
  6. Совместим с NV25

Кроме того:

  1. NV31 снабжена всеми возможностями NV30 и кроме того имеет некоторые дополнительные оптимизации. NV35 видимо будет включать не только эти оптимизации но и более агрессивную производительность пиксельных операций с плавающей запятой.
  2. Размеры КЭШей и очередей расположились следующим образом NV30 > NV31 > NV34, причем видимо в соотношении 4 > 2 > 1

Платы

Карты снабжены интерфейсом AGP х2/x4/x8, 128 МБ локальной памяти DDR SDRAM (восемь микросхем, размещенных на лицевой и оборотной сторонах PCB).

NVIDIA GeForce FX 5600 Ultra; NVIDIA GeForce FX 5200 Ultra


На картах установлены микросхемы памяти Hynix марки HY5DU283222-AF25, форм-фактора BGA. Максимальная частота работы — 400 (800) МГц, время выборки — 2.5 нс. По умолчанию память работает у GeForce FX 5600 Ultra на частоте 350 (700) МГц, у GeForce FX 5200 Ultra — 325 (650) МГц.

Обе карты совершенно идентичны, то есть используется одна и та же PCB. Но все равно мы более детальные фотографии покажет раздельно.

NVIDIA GeForce FX 5600 Ultra
NVIDIA GeForce FX 5200 Ultra
NVIDIA GeForce FX 5800 Ultra
NVIDIA GeForce4 Ti 4600

Как мы видим, дизайн у обеих карт совершенно одинаковый, PCB короче чем у GeForce FX 5800 и GeForce4 Ti 4600. Тем не менее, внешнее питание требуется. Мы видим у NV31 и NV34 есть такие же 4-х пиновые разъемы для поключения питания от БП, как у и NV30. Если его не подключить, то при загрузке операционной системы драйвер выдаст сообщение:

Однако если у NV30 при отсутствии внешнего питания производительность резко затормаживается, то у NV31/34 ничего не происходит.

В отличие от своего старшего собрата FX 5800 Ultra новые карты оснащаются простыми кулерами по подобию тех, что мы ранее видели у плат GeForce4 Ti 4600:



Охлаждающее устройство представляет собой закрытый радиатор, через который вентилятор гонит воздух. Крышка радиатора — практически зеркальная.

Если снять радиаторы, то можем увидеть и сами процессоры, которые выполнены в традиционном "стиле" с пластиковой крышкой, в центре которой металлическая пластина. Размеры корпусов обоих чипов одинаковы.



Карты снабжаются внешним TV-кодером — Philips 7114, поэтому рассказывать о качестве TV-out нет нужды, работа подобных кодеров уже рассматривалась в статье Алексея Самсонова и Дмитрия Дорофеева.

На этом рассматривать сами карты мы заканчиваем.

Разгон

С разгоном интересная штука. У карты NV31 в драйверах нет разделения частот на 2D и 3D, можно регулировать общую частоту, и карта разогналась до 405/810 МГц. А вот с NV34 сложности. Почему-то драйвера у этой карты разделяют частоты на 2D и 3D (как у NV30), несмотря на то, что сама плата относится почти к Low-end. Разумеется, частоты одинаковые в 2D и 3D — 325/650 МГц, но разгон выше 355/720 МГц невозможен, начинаются сильные тормоза, непонятные глюки (именно глюки, а не зависания). Поэтому мы ограничились съемом результатов на частоте 350/700 МГц, чтобы сравнить в некоторых тестах NV31 и NV34 на равных частотах.

Установка и драйверы

Рассмотрим конфигурацию тестового стенда, на котором проводились испытания карт:

  • Компьютер на базе Pentium 4 (Socket 478):
    • процессор Intel Pentium 4 3066 (HT=ON);
    • системная плата ASUS P4G8X (iE7205);
    • оперативная память 1024 MB DDR SDRAM;
    • жесткий диск Seagate Barracuda IV 40GB;
    • операционная система Windows XP SP1.

На стенде использовались мониторы ViewSonic P810 (21") и ViewSonic P817 (21").

При тестировании применялись драйверы от NVIDIA версии 42.72, VSync отключен, компрессия текстур отключена в приложениях. Установлен DirectX 9.0.

Для сравнительного анализа приведены результаты уже знакомых читателям видеокарт:

  • Gainward Powerpack Ultra/750 (GeForce Ti 4600, 300/325 (650) МГц, 128 МБ);
  • ABIT Siluro GFTi4200-8x (GeForce Ti 4200-8x, 250/256 (512) МГц, 128 МБ);
  • Prolink PixelView GeForce4 MX 440-8x (275/256 (512) МГц, 128 МБ);
  • Hercules 3D Prophet 9000 PRO (RADEON 9000 PRO, 275/275 (550) МГц, 128 МБ, driver 6.292);
  • Hercules 3D Prophet 9500 PRO (RADEON 9500 PRO, 275/270 (540) МГц, 128 МБ, driver 6.292).
Настройки драйверов

Думаю, что нет нужды еще раз рассказывать о настройках драйверов, желающие смогут прочитать подробности в материале по GeForce FX 5800 Ultra.

Напомню, что получить доступ к некоторым закрытым по умолчанию закладкам можно, запустив патч к registry Windows XP.

Результаты тестов

2D-графика

Традиционно начнем с 2D. Заметим, что качество отменное. В 1600х1200 при 85Гц все прекрасно у обеих карт.

Наверняка старожилы помнят, что когда дорогой Леонид Ильич Брежнев на 25-м съезде КПСС говорил о необходимости экономику сделать экономной, а качество 2D — объективно оцениваемым, половина делегатов съезда этот момент проспала. Вероятно поэтому оно так и осталось на бумаге, в лозунгах и розовых мечтах "матроксоведов". Поэтому напомню, что и сегодня качество зависит от конкретного экземпляра, да и связка карта-монитор может по-прежнему играть огромную роль. Прежде всего, надо обращать внимание на качество монитора и кабеля. Тестирование 2D у нас происходит на мониторе ViewSonic P817-E совместно с BNC-кабелем Bargo.

Синтетические тесты RightMark 3D (DirectX 9)

В этой статье мы представим вам подробные описания и первые результаты тестирования, полученные с помощью разрабатываемого нами набора конфигурируемых синтетических тестов для API DX9.

Набор синтетических тестов из разрабатываемого нами тестового пакета RightMark 3D включает в себя (на данный момент) следующие тесты:

  1. Тест на закраску и фильтрацию текстур (Pixel Filling Test);
  2. Тест на производительность обработки геометрии (Geometry Processing Speed Test);
  3. Тест на производительность работы с отсечением невидимых точек и примитивов (Hidden Surface Removal Test);
  4. Тест на производительность сложных пиксельных шейдеров (Pixel Shader Test);
  5. Тест на производительность отрисовки, освещения и анимации спрайтов (Point Sprites Test).

Полагаем, что нет смысл повторять здесь освещение идеологических вопросов тестирования, поэтому еще раз просим желающих узнать по-подробнее об идеологии синтетических тестов прочитать внимательно материал по NV30. Там же можно найти и их описание.

Внутри каждого архива вы найдете описание параметров каждого теста и пример .bat файла, используемого нами для тестирования ускорителей. Мы будем благодарны любым откликам, как в плане пожеланий и идей, так и информации об ошибках или странном поведении тестов.

Пишите по адресу: unclesam@ixbt.com.

Результаты практического тестирования

Приведем и прокомментируем данные, полученные нами на бюджетных и мэйнстрим ускорителях двух "основных" в данный момент семейств (ATI и NVIDIA).

  • ATI:
    • RADEON 9000 PRO 128 Mb
    • RADEON 9500 64 Mb
    • RADEON 9500 PRO 128 Mb
  • NVIDIA:
    • GeForce 4 MX 440-8x
    • GeForce 4 Ti 4200-8x
    • GeForce 4 Ti 4600
    • GeForce FX 5200 Ultra
    • GeForce FX 5600 Ultra

Число пиксельных конвейеров и их конфигурация

Для начала нам не терпится определиться с самым интригующим и спорным вопросом — реальным числом конвейеров и текстурных блоков новых членов семейства GeForce FX.

Вначале NV34:

Итак, налицо все признаки конфигурации 2х2 — два пиксельных конвейера с двумя текстурными блоками на каждом. Цифры очень близки к теоретическим значениям именно такой конфигурации. Теперь посмотрим, что происходит в случае использования пиксельных шейдеров 1.1 и 2.0:



Удивительно, но результаты совершенно аналогичные! Итак, либо теперь все операции выполняются единым ALU (и не факт что плавающим — возможно это ALU с фиксированной запятой и это еще предстоит выяснить) либо драйверы выполняют агрессивную оптимизацию, сводя шейдеры до минимальной функционально необходимой версии. Т.е. те задачи, которые могут быть уложены в знакомые еще по DX7 картам рамки бленд стадий (register combiners) и укладываются в оные драйверами. Несколько далее, мы проверим это предположение на основе результатов производительность сложных шейдеров версии 2.0.

Теперь NV31:





А здесь все еще интереснее! Для программ, не использующих шейдеры, в случае одной текстуры чип работает как 4х1, но для 3 текстур, судя по всему, как 2х2 (!) из чего можно сделать вывод, что и для 2 и 4 текстур тоже используется схема 2х2. В случае использования шейдеров первой версии мы совершенно четкую картину 2х2. В случае использования шейдеров второй версии, мы сталкиваемся с чем-то аналогичным NV30 — 2х2, но гораздо медленнее из-за того, что выборка текстур не может выполняться параллельно с вычислительными командами шейдера. Т.е. NV31 можно назвать 2х2 чипом с 4х1 оптимизацией для частного случая, не использующих пиксельные шейдеры приложений. Видимо, так или иначе пиксельный блок чипа состоит из массива гибко конфигурируемых ALU (стадий) которые могут объединяться в различное число конвейеров в зависимости от текущей ситуации (настройки стадий или шейдера).

Итак, подведем итоги:

  • NV31 — 4х1 чип на приложениях без пиксельных шейдеров и 2х2 на приложениях с пиксельными шейдерами.
  • NV34 — 2х2 чип в любой ситуации, причем на данном тесте производительность от версии пиксельного шейдера не зависела (!).

Pixel Filling

  1. Тест на скорость закраски буфера кадров (Pixel Fillrate). Закраска константным цветом - выборка текстур не производится. Приведены результаты в миллионах пикселов в секунду для разных разрешений, причем как в обычном режиме, так и для 4х MSAA:

    RADEON 9500 PRO лидер, сказывается наличие 8 пиксельных конвейеров (закраска без текстур зависит от числа пиксельных конвейеров, частоты ядра, пропускной полосы памяти и эффективного ее использования). На втором месте NV31 в лице GeForce FX 5600 Ultra, конвейеров в этом тесте у нее 4, но отставание куда как меньше двукратного — RADEON 9500 PRO в этом тесте упирается в пропускную полосу памяти, а 5600 Ultra нет — что говорит о разумном балансе последнего. Сохранится ли этот баланс в случае вычислительно интенсивных шейдеров? Далее мы проясним этот вопрос.

    По результатам хорошо видно, что 5600 Ultra является DX9 заменой для 4600. Впрочем, не забываем, что прогресс не стоит на месте и эта замена выходит в свет по существенно более низкой цене. С точки зрения MSAA чипы показывают удивительно схожую эффективность, точнее, удивительно схожее, значительное падение.

    NV34 показывает куда как более скромные абсолютные результаты — сказывается наличие только двух пиксельных конвейеров. Этот чип будет отличной DX9 заменой для ниши GeForce 4 MX 440. Впрочем, далее мы посмотрим, не поможет ли более совершенная архитектура нового чипа более заметно вырваться вперед относительно своего старого собрата в реальных приложениях.

  2. Тест на скорость закраски буфера кадров с одновременным текстурированием. Добавляется выборка одной простой билинейной текстуры — проверим, насколько наличие конкурентного потока чтения из памяти понизит эффективность закраски. Приведены результаты в миллионах пикселов в секунду, для разных разрешений, причем как в обычном режиме, так и для 4х MSAA:

    В общем и целом, картина практически та же, но у некоторых карт пиковые значения несколько упали. А вот с RADEON 9500 PRO творится что то странное. Цифры явно не соответствуют возможностям чипа - видимо происходит какой то лаг вызванный взаимодействием теста и драйверов. В данный момент мы пытаемся разрешить эту проблему со специалистами ATI. Интересно отметить, что в случае RADEON 9700 и 9700 PRO (см. обзор RADEON 9700 PRO DX9 часть 2) ранее, таких аномалий не наблюдалось!

    Давайте посмотрим, насколько хорошо измеренная действительность соотносится с теоретическими пределами, основанными на частоте ядра и числе конвейеров:

    ПродуктТеоретический максимумИзмеренный максимум(без текстуры)Измеренный максимум(с одной текстурой)
    RADEON 9000 PRO110010491026
    RADEON 950011001049228 ???
    RADEON 9500 PRO22001746450 ???
    GeForce4 MX 440-8x550537534
    GeForce4 Ti 4200-8x1000978945
    GeForce4 Ti 4600120011751150
    GeForce FX 5600 Ultra140013711315
    GeForce FX 5200 Ultra650630622

    Итак, все карты кроме RADEON 9500 PRO хорошо реализуют свой теоретический потенциал. Но в режиме с одной текстурой с семейством RADEON 9500, как мы уже отмечали, происходит что-то странное.

  3. Посмотрим на зависимость Texturing Rate (числа выбираемых и фильтруемых из текстур пикселей в секунду) от числа накладываемых за один проход текстур более менее реального размера 256х256:

    А вот и сюрприз — мы совсем забыли о том, что 4х2 конфигурация GeForce 4 4200 обеспечит ему заметное преимущество в режимах с мультитекстурированием (от 2 до 4 текстур). Преимущество на лицо - однако, посмотрим, скажется ли оно на реальных приложениях.

    Для сравнения мы привели результаты NV34 разогнанной до частоты NV31 как по шине памяти так и по ядру и результаты NV30 опять таки на частоте NV31. Хорошо видно что на закраске с одной текстурой, когда можно не использовать бленд стадии вообще, эти чипы сравнялись по производительности, а в остальных случаях NV30 вдвое производительнее NV31.

    ПродуктТеоретический максимумДостигнутый максимум
    GeForce FX 5200 Ultra13001142 (2 текст.)
    GeForce FX 5600 Ultra14001315 (2 текст.)

  4. Исследуем зависимость от типа фильтрации:

    На более или менее существенных установках анизотропии обе карты на базе NV25 (4200 и 4600) начинают катастрофически терять производительность. Этот факт подробно исследован в наших материалах ранее и не требует дополнительных комментариев. Зато NV31 и NV34 теряет производительность лишь немного более активно, чем произведения ATI. И снова мы наблюдаем аномальное поведение RADEON 9500.

Geometry Processing Speed

Займемся исследованием геометрической производительности ускорителей.

  1. Производительность фиксированного TCL (для NV30 и R300 — производительность эмулирующего его шейдера):

    Результаты сортированы по степени сложности используемой модели освещения. Самый нижняя группа — простейший вариант, соответствующий пиковой пропускной способности ускорителя по вершинам. Интересно, что геометрическая производительность NV31 и NV34 на большинстве задач практически эквивалентна, заметное отличие есть только на самом простом варианте и связано оно с объемами вершинных кэшей а не скоростью обработки геометрии. В остальных заданиях NV31 и NV34 все время в 2.5 раза медленнее NV30 на равной частоте — видимо число вершинных ALU урезано именно во столько крат. Сразу отметим, что полученные результаты свидетельствуют о наличии аппаратной обработки геометрии в обоих чипах. На этой задаче NV31 и NV34 проигрывают RADEON 9500 PRO в среднем в полтора раза. Но не будем забывать, что RADEON 9600 PRO будет иметь вдвое более низкую геометрическую производительность!

  2. Теперь обратимся к вершинным шейдерам 1.1:

    Та же самая картина — взаимная расстановка NV30, NV31 и 34 не поменялась — чипы используют схожие по организации геометрические блоки. RADEON 9500 опять на высоте — его геометрическая мощь не урезана и равна RADEON 9700 — что существенно превышает возможности NV31 и NV34.

  3. А теперь самое интересное — шейдеры 2.0 с циклами:

    Картина повторяет оную для вершинных шейдеров 1.1, разве что преимущество ATI чуть увеличилось.

    Итак, аппаратная эмуляция T&L в исполнении ATI менее эффективна, чем у NV и сравнима по эффективности с вершинным шейдером 2.0. Самое сильное место NV3x — эмуляция TCL. Самое слабое — циклы. В этом плане у ATI больше простор для оптимизации в драйверах — статическое исполнение переходов и циклов позволяет применять куда как более агрессивную оптимизацию.

    Производительность NV31 и NV34 в вершинных задачах эквивалентна и приблизительно в 2.5 раза ниже производительности NV30 на равной частоте.

  4. Проверим перекрестную зависимость от степени детализации геометрии и сложности шейдера:




    Чем выше сложность шейдера и чем выше детализация сцены, тем большее преимущество получает NV30 (сказываются кэши вершин и прочие аспекты балансировки). А вот для NV31 и NV34 картина обратная — они оптимизированы для не умерено детализированных сцен.

Hidden Surface Removal

  1. Наличие и максимальная эффективность HSR в процентах в зависимости от разрешения и от числа треугольников, на сцене без текстур (не учитывается ранняя проверка Z):

    Итак, NV31 и NV34 снабжены эффективным HSR, причем эффективность оного в NV34 несколько выше. Кроме того, GeForce 4 MX также может похвастаться работой этого блока! В RADEON 900 PRO, 9500 и семействе GeForce 4 Ti HSR деактивирован. В RADEON 9500 PRO этот блок работает в полную силу, так же как и в RADEON 9700 PRO.

    R300 использует иерархическую структуру, и зачастую отсечение происходит на более высоком уровне, а следовательно, и более эффективно, в то время как у NV30 присутствует только один уровень принятия решения, совмещенный с тайлами, на основе которых сжимается информация о глубине. В максимальном разрешении 1600х1200 происходит резкое падение эффективности HSR на R300 — видимо, по каким-то соображениям, например, соображениям экономии памяти, иерархический буфер глубины уже не используется, и решение об отсечении блоков принимается так же, как и в случае NV30, только на самом нижнем базовом уровне, совмещенном с сжимаемыми блоками в буфере глубины.

  2. Наличие и максимальная эффективность HSR в процентах в зависимости от разрешения и от числа треугольников, на сцене с текстурами (с учетом ранней проверки Z):

    Итак, здесь и NV31/NV34, и R300 демонстрируют дополнительный рост эффективности. Причем, у NVIDIA он заметно больше — NV31 и NV34 почти достигли рекордных показателей RADEON 9500 PRO а в максимальном разрешении даже превысили их!

Pixel Shading

В данном тесте участвуют только R300 и NV3x — т.к. аппаратное исполнение версии 2.0 пиксельных шейдеров является минимальным требованием для этого теста. Судите сами: на старой доброй GeForce4 Ti 4600 вкупе с 2 ГГц Pentium 4 программная эмуляция второй версии пиксельных шейдеров выдает порядка одного кадра в две секунды. И это — в маленьком окне.

  1. Сам тест, шейдеры 2.0:

    На равной частоте NV31 и NV34 выполняют пиксельные шейдеры 2.0 с одинаковой скоростью, вдвое медленнее NV30. Ничего удивительного. R300 в различных ипостасях лидирует, разумеется, благодаря 4 (8) пиксельным шейдерным конвейерам против 2 в случае NV31 и NV34.

  2. Проверим зависимость от разрешения:

    Все нормально. Зависимости совпадают — все зависит только от числа закрашенных пикселей, никаких аномалий не наблюдается.

    Отметим, что в случае форсированной установки 16 или 32 битной точности в DirectX никаких отличий в производительности не наблюдается, видимо драйверы всегда сами принимают решение о точности операций игнорируя соответствующие модификаторы команд в шейдерах.

Point Sprites

Итак, спрайты.

  1. С освещением и без, в зависимости от размеров:


    Как и ожидалось наличие или отсутствие освещения сказывается только на маленьких спрайтах, по мере роста размера все упирается в закраску. Происходит это при размере 8 и более. Итак, для вывода систем, состоящих из большого числа частиц, следует признать оптимальными размеры менее 8.

    NV31 и NV34 отстоят от NV30 на равной частоте на уже хорошо нам знакомые по тесту геометрической производительности величины. В случае большего размера спрайтов различие нивилируется за счет (здесь искусственно полученной торможением NV30) ПСП. Т.е. — как и ожидалось, ПСП начинает играть все более и более заметную роль.

    Пиковые значения достигаются, разумеется, без освещения, и составляют соответственно около 8 миллионов спрайтов в секунду для NV31/34 и около 17 миллионов для заторможенной до частот GeForce 5600 Ultra NV30 и RADEON 9500 (PRO).

    Опять-таки отметим уже ранее озвученный вывод, что никакой особой панацеи точечные спрайты нам не приносят — цифры не сильно далеки от тех, что можно получить при помощи обычных полигонов. Впрочем, зачастую само использование точечных спрайтов с точки зрения программирования более удобно, и в первую очередь для всевозможных систем частиц.

3D-графика, 3DMark2001 SE — синтетические тесты

Подчеркну, что все замеры по всем 3D-тестам проводились в 32-битной глубине цвета.

Скорость закраски



Наблюдается уже хорошо знакомая нам по результатам работы Pixel Filling теста из RightMark 3D зависимость, однако она не столь ярко выражена. Кроме того, по какой то причине драйверы не смогли использовать NV31 в режиме 4х1 для этого теста (что несколько странно) и в итоге чип показал лишь половину своего потенциального результата.

В случае мультитекстурирования:

Результаты снова соотносятся с полученными нами ранее в тестах RightMark 3D. Здесь чип NV31 работает в режиме 2х2, что при мультитекстурировании является предпочтительным.

Пиксельный шейдер

Простой вариант:

Интересно, что NV31 заметно опережает NV34 в этом тесте. Фактически этот тест достаточно интенсивно выбирает текстуры, но при этом производит минимум вычислений, кроме того, все вычисления происходят в целочисленном формате (шейдеры 1.1). Видимо большие Кэши текстур NV31 позволили ей опередить NV34.

RADEON 9500 на высоте — вдвое (а для PRO версии вчетверо) большее число конвейеров позволяет ему демонстрировать отличные результаты. С другой стороны, NV31 при вдвое меньшем числе конвейеров идет наравне с RADEON 9500 — она обладает более высокой тактовой частотой и более производительными конвейерами.

Посмотрим, изменится ли картина при условии более вычислительно интенсивных пиксельных шейдеров:

Да, теперь R300 лидирует во всех вариантах (и 8 и 4 конвейера), лишний раз подтверждая сделанные нами ранее выводы о более слабой вычислительной и более высокой текстурной производительности семейства NV3X.

Вершинные шейдеры



Тест вершинных шейдеров демонстрирует сходные с нашими предыдущими исследованиями результаты. Как бы там ни было мы склонны обращать больше внимания на предыдущие результаты, полученные на синтетических тестах RightMark 3D, которые не проявляют столь заметной зависимости от разрешения.

Итак, за исключением отдельных моментов результаты 3D Mark 2001 хорошо согласуются с полученными ранее результатами RightMark 3D, хотя и несут изначально меньше информации ввиду отсутствия каких либо настроек параметров синтетических тестов. Выводы из результатов синтетических тестов

Итак, подведем краткий итог по детальному исследованию различных блоков NV31 и NV34 с помощью синтетических тестов.

В NV31 удалось компенсировать самый спорный момент NV30 — этот чип может работать как в конфигурации 4х1, так и в конфигурации 2х2 в зависимости от числа текстур и задачи. Таким образом, NVIDIA исправила серьезный недостаток NV30, потенциально влияющий на производительность в старых и современных приложениях интенсивно накладывающих одну текстуру.

Радует наличие аппаратной геометрической обработки как на NV34, так и на NV31. Интересно, что ее производительность не втрое и не вдвое, а в два с половиной раза ниже NV30 на равной частоте — видимо в чипах этого поколения NVIDIA использует схожий с 3dlabs P10 широкий VLIW геометрический процессор с массивом ALU, способный параллельно обрабатывать несколько вершин. Такая схема наиболее оптимальна с точки зрения КПД (занятости ALU) и, кроме того, позволяет аккуратно масштабировать геометрическую производительность чипов, в том числе в нецелое число раз.

Если архитектура пиксельной части NV34 видимо повторяет NV30, то NV31 видится нам скорее как предвестник NV35 — более гибко конфигурируемого чипа. Хотя, мы на заметили вычислительного преимущества NV31 на пиксельных шейдерах 2.0 над NV34 — в наличии ровно половина вычислительной производительности NV30, видимо пиксельная часть имеют несколько иную, отличную от NV30 структуру. Возможно, что используется общие универсальные ALU для выборки текстур, стадий и пиксельных шейдеров обеих версий. Это не только экономит транзисторы, но позволяет нам надеяться на прирост производительности по мере оптимизации драйверов.

В свою очередь, пиксельная архитектура NV34 требует еще более пристального изучения — удивляют одинаковые результаты для всех типов шейдеров в тесте закраски, это совершенно не похоже на NV30 или NV31. И в то же время в тесте на шейдеры 2.0 чип показал схожий с NV31 характер результатов. Мы будем исследовать этот вопрос. Возможно, на NV34 обкатываются какие то агрессивные оптимизации на уровне драйверов.

Судя по результатам синтетических тестов, основные отличия в производительности NV31 и NV34 в реальных приложениях будут вызваны размерами очередей и КЭШей. С точки зрения отдельно взятых базовых блоков (геометрический, пиксельный) на равных частотах эти чипы показывают эквивалентную производительность.

Итак, со скоростью отдельных блоков все ясно — теперь все зависит от реальных приложений и цены.

3D-графика, 3DMark2001 — игровые тесты

Сразу отмечу, почему мы использовали в наших тестах настройки анизотропии 16х у карт от ATI и 8х у карт от NVIDIA. Никакой дискриминации в отношении карт от ATI нет! Алгоритмы работы этой функции у ATI и NVIDIA очень различаются (об этом мы говорили подробно в нашем материале по NV30), поэтому сопоставлять только цифры "8" неразумно. Критерий один: максимально возможное качество. У NVIDIA по ее "счетчику" — это 8х, а у ATI — 16х. Скриншоты мы уже приводили, и не один раз. К тому же, интересно будет узнать, как сопоставляются разные режимы работы анизотропии (Application, Balanced, Aggressive) от NVIDIA с максимально качественным режимом от ATI, тем более, что опять же, скриншоты мы уже приводили, и читатель может оценить соотношение скорости и качества (милости просим в обзор NV30 за скриншотами оценки качества анизотропной фильтрации).

Думаю, что в таблицах соотношений все данные имеются, поэтому комментировать нет смысла. Замечу лишь, что мы провели сравнение GeForce FX 5200 Ultra и с RADEON 9500 64MB, хотя по позиционированию эти карты находятся в разных секторах. Однако начальная цена самой дорогой карты FX 5200 Ultra возможно будет до $149, а ныне по таким ценам можно купить RADEON 9500 64MB.



3DMark2001, 3DMARKS













Если кто хочет проценты перевести в "разы", то надо к процентам прибавить 100 и все разделить на 100.



3DMark2001, Game1 Low details















3DMark2001, Game2 Low details















3DMark2001, Game3 Low details















3DMark2001, Game4













Подводя итоги по тестированию в 3DMark2001, можно сказать, что NV31 прекрасно сражается с соперниками в тяжелых режимах с АА и/или анизотропии, а NV34 показывает хорошие результаты в борьбе с RADEON 9000 PRO да и с прежним кумиром Low-end-а — GeForce4 MX 440-8x. Заметим, что в борьбе с RADEON 9500 64MB есть некоторые проигрыши, однако не надо забывать, что в конце марта прекращается производство RADEON 9500, цена на эти карты снижаться пока не собирается, когда как у NV34 есть большой задел в плане падений цен.

3D-графика, 3DMark03 — игровые тесты



3DMark03, 3DMARKS





3DMark03, Game1

Характеристики теста Wings of Fury:

  • DirectX 7.0 тест; примерно 32000 полигонов в сцене, под текстуры используется 16 мегабайт видеопамяти, 6 мегабайт для буферов под вершины и 1 мегабайт для индексов.
  • Все геометрические операции базируются на использовании вершинных шейдеров 1.1, которые могут эмулироваться через CPU (если "железо" не поддерживает аппаратно).
  • Все самолеты выполнены с помощью 4-х текстурных слоев, поэтому акселераторы, умеющие обрабатывать 4 текстуры за проход, будут в выигрыше.
  • Эффекты дыма и шлейфов выполнены с помощью техник точечных спрайтов и др.






3DMark03, Game2

Характеристики теста Battle of Proxycon:

  • DirectX 8.1 тест; примерно 250 000 полигонов в сцене при использовании пиксельных шейдеров 1.1 (и 150 000 полигонов — если используются шейдеры 1.4), под текстуры используется 80 мегабайт видеопамяти, 6 мегабайт для буферов под вершины и 1 мегабайт для индексов.
  • Все геометрические операции базируются на использовании вершинных шейдеров 1.1, которые могут эмулироваться через CPU (если "железо" не поддерживает аппаратно).
  • Все персонажи "одеты" также с помощью вершинных шейдеров.
  • Некоторые источники света производят динамические тени, получаемые при помощи стенсил-буфера.
  • Все пиксельные операции производятся с помощью шейдеров 1.1, или, если это возможно, 1.4.
  • Вычисление попиксельного освещения для эффектов дымок, и других компонентов.
  • Акселераторы, поддерживающие пиксельные шейдеры 1.1, используют один проход для определения Z-буфера, затем по три прохода на каждый источник света. Если акселератор поддерживает шейдеры 1.4, то ему требуется всего по одному проходу на каждый источник света.






3DMark03, Game3

Характеристики теста Trolls' Lair:

  • DirectX 8.1 тест; примерно 560 000 полигонов в сцене при использовании пиксельных шейдеров 1.1 (и 280 000 полигонов — если используются шейдеры 1.4), под текстуры используется 64 мегабайт видеопамяти, 19 мегабайт для буферов под вершины и 2 мегабайта для индексов.
  • Все геометрические операции базируются на использовании вершинных шейдеров 1.1, которые могут эмулироваться через CPU (если "железо" не поддерживает аппаратно).
  • Все персонажи "одеты" также с помощью вершинных шейдеров.
  • Некоторые источники света производят динамические тени, получаемые при помощи стенсил-буфера.
  • Все пиксельные операции производятся с помощью шейдеров 1.1, или, если это возможно, 1.4.
  • Вычисление попиксельного освещения для эффектов дымок, и других компонентов.
  • Для реалистичного отображения волос героини используются физические модели, а также анизотропное освещение.






3DMark03, Game4

Характеристики теста Mother Nature:

  • DirectX 9.0 тест; примерно 780 000 полигонов в сцене, под текстуры используется 50 мегабайт видеопамяти, 54 мегабайт для буферов под вершины и 9 мегабайт для индексов.
  • Каждый лист на деревьях отдельно анимирован при помощи вершинных шейдеров 2.0. Трава анимирована с помощью вершинных шейдеров 1.1.
  • Поверхность озера образована при помощи пиксельных шейдеров 2.0.
  • Небо также получено при помощи пиксельных шейдеров 2.0, для солнечных бликов используется реализованная в DX9 повышенная точность расчетов.
  • Поверхность земли получена с помощью шейдеров 1.4.






А вот 3DMark03 продемонстрировал, что в очень тяжелых сценах при массовом использовании самых современных техник новинки от NVIDIA проигрывают. Но не будем забывать, что игр, подобных игровым тестам из этого пакета, в реале нет и не будет. И все же показательно, что низкая скорость шейдеров у NV3x сильно влияет на общую производительность в тестах, с использованием DX9-технологий. Хотя… Пока подобные игры (под DX9) появятся, уже выйдет новое поколение акселераторов, в т.ч. и для Low/Middle рынка.

3D-графика, игровые тесты

Приступаем к оценке производительности видеокарты в 3D-играх. В качестве инструментария мы использовали:

  • Return to Castle Wolfenstein (MultiPlayer) (id Software/Activision) — OpenGL, мультитекстурирование, Checkpoint-demo, настройки тестирования — все на максимально возможном уровне, S3TC OFF, конфигурации можно скачать тут

  • Serious Sam: The Second Encounter v.1.05 (Croteam/GodGames) — OpenGL, мультитекстурирование, Grand Cathedral demo, настройки тестирования: quality, S3TC OFF

  • Quake3 Arena v.1.17 (id Software/Activision) — OpenGL, мультитекстурирование, Quaver, настройки тестирования все на максимальном уровне: уровень детализации — High, уровень детализации текстур — №4, S3TC OFF, плавность кривых поверхностей резко увеличена при помощи переменных r_subdivisions "1" и r_lodCurveError "30000" (подчеркну, что по умолчанию r_lodCurveError "250" !), конфигурации можно скачать тут

  • Unreal Tournament 2003 Demo (Digital Extreme/Epic Games) — Direct3D, Vertex Shaders, Hardware T&L, Dot3, cube texturing, качество по умолчанию

  • Code Creatures Benchmark Pro (CodeCult) — игровой тест, демонстрирующий работу платы в DirectX 8.1, Shaders, HW T&L.

  • AquaMark (Massive Development) — игровой тест, демонстрирующий работу платы в DirectX 8.1, Shaders, HW T&L.

  • RightMark 3D v.0.4 (одна из игровых сцен) — DirectX 8.1, Dot3, cube texturing, shadow buffers, vertex and pixel shaders (1.1, 1.4).

Quake3 Arena, Quaver















Что можно сказать? Превосходная отлаженность драйверов NVIDIA под игры на Quake3-движке делает свое дело, и новоиспеченные "середнячки" выиграли сражение.

Serious Sam: The Second Encounter, Grand Cathedral















А вот здесь картина разнородная. Несмотря на известную оптимизацию драйверов ATI под эту игру, NV31 все же в тяжелых режимах удержала победу. А вот с NV34 — все печально, даже RADEON 9000 PRO сумел обойти.

Return to Castle Wolfenstein (Multiplayer), Checkpoint















Как ни странно, но ситуация схожа с предыдущей (хотя эта игра базируется на движке Quake3). Драйвера и есть раз драйвера… Могу напомнить, что у NV30 между версиями драйверов 42.* именно в этом тесте производительность прыгала от 70 до 120 fps в 1600х1200 (весьма приличная "вилка", не правда ли?).

Code Creatures



М-да… Грустно. Тормозные шейдеры опять тянут ко дну…

Unreal Tournament 2003 DEMO















Ситуация снова разная. Трудно дать единую оценку: много проигрышей, но есть и выигрыши и снова в тяжелых режимах.

AquaMark















Этот тест нам прежде всего показал оптимизацию работы с анизотропией, посмотрите на разницу между новыми продуктами NVIDIA и прежними в этом режиме. В целом тендеция схожа: там где тяжелые режимы, там новинки сильнее.

RightMark 3D















Этот тест очень сильно зависит от скорости работы шейдеров, поэтому, увы, новые продукты от NVIDIA тут не блещут.

DOOM III Alpha









Сюрприз? А вот и нет. Как раз этот результат нам говорит о том, что при правильной оптимизации работы процессора и игры все может получиться как нельзя лучше. Просто данная игра наилучшим образом использует на сегодня возможности новой архитектуры NV3x. Качество 3D-графики

АНИЗОТРОПНАЯ ФИЛЬТРАЦИЯ

В статье по NV30 мы уже подробно рассмотрели особенности работы анизотропной фильтрации у нового семейства. Поэтому в данном разделе я лишь приведу некоторые примеры.

Напомню, что у всех группы NV3x есть по сути три разновидности анизотропной фильтрации: зависящая от приложения, сбалансированная между производительностью и качеством и агрессивная в плане предпочтения производительности качеству. По умолчанию используется сбалансированная разновидность. Мы тестировали скорость как этого подвида, так и "агрессивного". Замечу, что в разных версиях драйверов название режима Aggressive может заменяться на Performance.

Давайте рассмотрим теперь отличия между этими подвидами.

ApplicationBalancedAggressive
RightMark3D
Anisotester (from Unwinder)
Serious Sam: TSE


Мы прекрасно видим, что между подвидами анизотропии есть разница не только в скорости, но и в качестве. Идет некая манипуляция MIP-mapping-ом, заодно и трилинейной фильтрацией. Это четко видно на примере XMAS — программы для тестирования анизотропии в OpenGL.

РежимыApplicationBalancedAggressive
Пример 1
Bilinear
Trilinear
Anisotropic 8x
Пример 2
Anisotropic 8x


Мы видим, что в режиме Performance/Aggressive трилинейки почти нет. Конечно, поклонники ATI могут сразу кричать, что, мол, "отстой", однако напомню, что у RADEON 9000/8500/9200/9100 и по сей день трилинейка и анизотропия вообще не могут сосуществовать друг с другом, плюс огрехи качества у анизотропной фильтрации у названных выше карт. Поэтому, считаю, что использование режима Balanced очень даже оправдано с точки зрения компромисса между скоростью и качеством (ведь поклонники ATI мирятся же с тем, что у RADEON 9500/9700 не на всех углах зрения есть максимально выставленная анизотропная фильтрация).

Качество 3D в целом

Работу анти-алиасинга мы в этом материале рассматривать не будем, поскольку все подробности есть уже в статье по GeForce FX 5800. Замечу лишь, что в ряде режимов работы АА скриншоты корректно снять невозможно из-за того, что АА обрабатывается неким постфильтром уже после передачи всех данных из фрейм-буфера на RAMDAC, а любой скриншот — это слепок копии содержимого фрейм-буфера.

Выводы

Прежде всего, выводы по скорости. Как мы видим, нет однозначной картины явного превосходства над конкурентами, но нет и явного поражения. Очевидно, что пользователь, покупая даже ускорители среднего класса, должен хоть немного разбираться в техниках 3D-графики и представлять себе — что такое АА и анизотропия. Ибо только при таких режимах максимального качества новинки от NVIDIA дают самые лучшие результаты.

Хотим отметить, что очень вероятен совместный с NV35 выпуск более мощной карты на базе NV31, с более высокими частотами ядра и DDR2 памятью. Эта карта позволит успешно конкурировать новыми и еще не достигшими прилавка RADEON среднего звена. Итак:

  1. Да, конечно, при начальных ценах (а они будут явно завышенными) на NV31 и (особенно!) NV34 в лице самых быстрых акселераторов внутри каждой линейки будут где-то проигрывать.
  2. С другой стороны, мы получаем ускорители последнего поколения с поддержкой всех современнейших технологий, которые даже по многим тестам весьма и весьма опережают по скорости предыдущее поколение (GeForce4 Ti), несмотря на более скромные спецификации чипов с точки зрения традиционных подходов к определению пиковой скорости заполнения сцены.
  3. До выпуска RV350 со стороны ATI еще весьма далеко (еще по крайней мере месяц), поэтому даже если новый продукт от ATI и будет быстрее, чем NV31, то по цене последний уже успеет значительно упасть.
  4. Конечно мы не можем обойти молчанием и минусы. Прежде всего, это низкая скорость работы шейдеров, к сожалению, свойственная всему семейству NV3x. Это приводит к неоправданно низким скоростям в ряде современных приложений, и только режимы с АА и/или анизотропией как-то спасают положение. Однако, если современная игра использует интенсивное текстурирование, то NV31/NV34 — на высоте (пример DOOM III).
  5. И все же, не будем забывать про главное достижение этих чипов: пользователи, способные выложить за видеокарту сумму только до $100. ныне смогут увидеть все красоты современных игр, тестов и демок.
  6. Конечно, хотелось бы увидеть более капитальное устранение прочих слабых мест NV30 уже в этих чипах.




12 марта 2003 Г.

NVIDIA GeForce FX 5600 Ultra (NV31) GeForce FX 5200 Ultra (NV34)

NVIDIA GeForce FX 5600 Ultra (NV31) GeForce FX 5200 Ultra (NV34)

""


, , , NVIDIA GeForce FX (NV30), NVIDIA GeForce FX 5800 Ultra, NV30

  1. NVIDIA GeForce FX 5600 Ultra 5200 Ultra
  2. : 2D
  3. RightMark3D:
  4. : RightMark3D: Pixel Filling
  5. : RightMark3D: Geometry Processing Speed
  6. : RightMark3D: Hidden Surface Removal
  7. : RightMark3D: Pixel Shading
  8. : RightMark3D: Point Sprites
  9. : 3DMark2001 SE
  10. : 3DMark2001 SE: Game1
  11. : 3DMark2001 SE: Game2
  12. : 3DMark2001 SE: Game3
  13. : 3DMark2001 SE: Game4
  14. : 3DMark03: Game1
  15. : 3DMark03: Game2
  16. : 3DMark03: Game3
  17. : 3DMark03: Game4
  18. : Quake3 ARENA
  19. : Serious Sam: The Second Encounter
  20. : Return to Castle Wolfenstein
  21. : Code Creatures DEMO
  22. : Unreal Tournament 2003 DEMO
  23. : AquaMark
  24. : RightMark 3D
  25. : DOOM III Alpha version
  26. 3D:
  27. 3D

NVIDIA — GeForce FX 5800 Ultra, NV30. NV30 ? ? , , , 5800 Ultra 5800. NV30 , , .

, , NV30, , . . , :

, 4 8 , . , , , VPU -. . , , , , , .

, NV30, , DX9, 2.0 2.0+. API Microsoft, , , .

, , 3D High-End, . , . , , , , , ( ), 5% ? — . GeForce2, TNT2 , 3D- ( , ).

, 2003 NVIDIA $100 — GeForce4 MX, DX8. "" $120-130 . ATI 2002 RADEON 9000(PRO), DirectX 8.1. , ATI Low-End . , . , , RADEON 9000 : ( , , - ), , ATI ( 2D- ATI ). : , RADEON 9000 , RADEON 8500, ( 8500- TrueForm, 9000-).

GeForce4 MX , RADEON 9000 . NVIDIA , - , Low Middle- DX8, DX7-. , (NV30) DX9 Low- Middle-.

, ATI (RADEON 9500 64MB/128MB, 9500 PRO). , , 9500 64MB, $150. ATI DX9-. "", RADEON 9000 PRO, RADEON 9500 "" $100. $100-150 ATI RADEON 8500, . , RADEON 9000/PRO, NVIDIA NV34. , GeForce4 MX $50, . , RADEON 9200 ( RADEON 9000 AGP 8x), NV34.

— NV31 (, ) RADEON 9500-9500 PRO, RADEON 9600/PRO. , NVIDIA — GeForce4 Ti 4600(4800) 4200 (4200-8). GeForce FX 5600 Ultra 5600.

, 2003 NVIDIA Low- Middle- .

  • GeForce FX 5600 Ultra — 350 , 128/256 350 (DDR 700) 128 (~$199);
  • GeForce FX 5600 — ??? , 128 ??? (DDR) 128 (~$179);
  • GeForce FX 5200 Ultra — 325 , 64/128 325 (DDR 650) 128 (~$100-149);
  • GeForce FX 5200 — ??? , 64/128 ??? (DDR) 128 (~$79-99).

, ( ), .

GeForce FX 5600 5200:


  NV30 NV31 NV34
, . 130 130 150
, . 125 75 47
4 2/4(1) 2
8 4 4
, 400/500 (Ultra) 350 (Ultra) 250/325 (Ultra)
, 128 (DDR II) 128 (DDR) (2) 128 (DDR)
(.) M 800/1000 (Ultra) 700 (Ultra) 333… 650 (Ultra)
2.0+ 2.0+ 2.0+ (3)
2.0+ 2.0+ 2.0+
, . 16 11,2 10,4 (Ultra)
HSR
Z
Z
MSAA 1:4 1:4
(4) (4)
RAMDAC, 2400 2400 2350
TV-out ? ? ?
DVI (5)
FCPGA BGA (6) BGA (6)

:

  1. NV31 41 ( ) 22 (. ).
  2. DDR2
  3. NV34, NV31, 2.0.
  4. NV31 NV34 (!) , NV30. NV31 NV34 , .
  5. DVI , , .
  6. NV25

:

  1. NV31 NV30 . NV35 .
  2. NV30 > NV31 > NV34, 4 > 2 > 1

AGP 2/x4/x8, 128  DDR SDRAM ( , PCB).

NVIDIA GeForce FX 5600 Ultra; NVIDIA GeForce FX 5200 Ultra


Hynix HY5DU283222-AF25, - BGA. — 400 (800) , — 2.5 . GeForce FX 5600 Ultra 350 (700) , GeForce FX 5200 Ultra — 325 (650) .

, PCB. .

NVIDIA GeForce FX 5600 Ultra
NVIDIA GeForce FX 5200 Ultra
NVIDIA GeForce FX 5800 Ultra
NVIDIA GeForce4 Ti 4600

, , PCB GeForce FX 5800 GeForce4 Ti 4600. , . NV31 NV34 4- , NV30. , :

NV30 , NV31/34 .

FX 5800 Ultra , GeForce4 Ti 4600:



, . — .

, , "" , . .



TV- — Philips 7114, TV-out , .

.

. NV31 2D 3D, , 405/810 . NV34 . - 2D 3D ( NV30), , Low-end. , 2D 3D — 325/650 , 355/720 , , ( , ). 350/700 , NV31 NV34 .

, :

  • Pentium 4 (Socket 478):
    • Intel Pentium 4 3066 (HT=ON);
    • ASUS P4G8X (iE7205);
    • 1024 MB DDR SDRAM;
    • Seagate Barracuda IV 40GB;
    • Windows XP SP1.

ViewSonic P810 (21") ViewSonic P817 (21").

NVIDIA 42.72, VSync , . DirectX 9.0.

:

  • Gainward Powerpack Ultra/750 (GeForce Ti 4600, 300/325 (650) , 128 );
  • ABIT Siluro GFTi4200-8x (GeForce Ti 4200-8x, 250/256 (512) , 128 );
  • Prolink PixelView GeForce4 MX 440-8x (275/256 (512) , 128 );
  • Hercules 3D Prophet 9000 PRO (RADEON 9000 PRO, 275/275 (550) , 128 , driver 6.292);
  • Hercules 3D Prophet 9500 PRO (RADEON 9500 PRO, 275/270 (540) , 128 , driver 6.292).

, , GeForce FX 5800 Ultra.

, , registry Windows XP.

2D-

2D. , . 16001200 85 .

, 25- , 2D — , . , "". , , - - . , . 2D ViewSonic P817-E BNC- Bargo.

RightMark 3D (DirectX 9)

, API DX9.

RightMark 3D ( ) :

  1. (Pixel Filling Test);
  2. (Geometry Processing Speed Test);
  3. (Hidden Surface Removal Test);
  4. (Pixel Shader Test);
  5. , (Point Sprites Test).

, , - NV30. .

.bat , . , , .

: unclesam@ixbt.com.

, "" (ATI NVIDIA).

  • ATI:
    • RADEON 9000 PRO 128 Mb
    • RADEON 9500 64 Mb
    • RADEON 9500 PRO 128 Mb
  • NVIDIA:
    • GeForce 4 MX 440-8x
    • GeForce 4 Ti 4200-8x
    • GeForce 4 Ti 4600
    • GeForce FX 5200 Ultra
    • GeForce FX 5600 Ultra

GeForce FX.

NV34:

, 22 — . . , 1.1 2.0:



, ! , ALU ( — ALU ) , . .. , DX7 (register combiners) . , 2.0.

NV31:





! , , 41, 3 , , 22 (!) , 2 4 22. 22. , - NV30 — 22, - , . .. NV31 22 41 , . , ALU () ( ).

, :

  • NV31 — 41 22 .
  • NV34 — 22 , (!).

Pixel Filling

  1. (Pixel Fillrate). - . , , 4 MSAA:

    RADEON 9500 PRO , 8 ( , , ). NV31 GeForce FX 5600 Ultra, 4, — RADEON 9500 PRO , 5600 Ultra — . ? .

    , 5600 Ultra DX9 4600. , , . MSAA , , , .

    NV34 — . DX9 GeForce 4 MX 440. , , .

  2. . — , . , , , 4 MSAA:

    , , . RADEON 9500 PRO . - . ATI. , RADEON 9700 9700 PRO (. RADEON 9700 PRO DX9 2) , !

    , , :

    ( ) ( )
    RADEON 9000 PRO 1100 1049 1026
    RADEON 9500 1100 1049 228 ???
    RADEON 9500 PRO 2200 1746 450 ???
    GeForce4 MX 440-8x 550 537 534
    GeForce4 Ti 4200-8x 1000 978 945
    GeForce4 Ti 4600 1200 1175 1150
    GeForce FX 5600 Ultra 1400 1371 1315
    GeForce FX 5200 Ultra 650 630 622

    , RADEON 9500 PRO . RADEON 9500, , - .

  3. Texturing Rate ( ) 256256:

    — , 42 GeForce 4 4200 ( 2 4 ). - , , .

    NV34 NV31 NV30 NV31. , , , NV30 NV31.

    GeForce FX 5200 Ultra 1300 1142 (2 .)
    GeForce FX 5600 Ultra 1400 1315 (2 .)

  4. :

    NV25 (4200 4600) . . NV31 NV34 , ATI. RADEON 9500.

Geometry Processing Speed

.

  1. TCL ( NV30 R300 — ):

    . — , . , NV31 NV34 , . NV31 NV34 2.5 NV30 — ALU . , . NV31 NV34 RADEON 9500 PRO . , RADEON 9600 PRO !

  2. 1.1:

    — NV30, NV31 34 — . RADEON 9500 — RADEON 9700 — NV31 NV34.

  3. — 2.0 :

    1.1, ATI .

    , T&L ATI , NV 2.0. NV3x — TCL. — . ATI — .

    NV31 NV34 2.5 NV30 .

  4. :




    , NV30 ( ). NV31 NV34 — .

Hidden Surface Removal

  1. HSR , ( Z):

    , NV31 NV34 HSR, NV34 . , GeForce 4 MX ! RADEON 900 PRO, 9500 GeForce 4 Ti HSR . RADEON 9500 PRO , RADEON 9700 PRO.

    R300 , , , , NV30 , , . 16001200 HSR R300 — , - , , , , , NV30, , .

  2. HSR , ( Z):

    , NV31/NV34, R300 . , NVIDIA — NV31 NV34 RADEON 9500 PRO !

Pixel Shading

R300 NV3x — .. 2.0 . : GeForce4 Ti 4600 2 Pentium 4 . — .

  1. , 2.0:

    NV31 NV34 2.0 , NV30. . R300 , , 4 (8) 2 NV31 NV34.

  2. :

    . — , .

    , 16 32 DirectX , .

Point Sprites

, .

  1. , :


    , . 8 . , , , 8.

    NV31 NV34 NV30 . ( NV30) . .. — , .

    , , , 8 NV31/34 17 GeForce 5600 Ultra NV30 RADEON 9500 (PRO).

    - , — , . , , .

3D-, 3DMark2001 SE —

, 3D- 32- .



Pixel Filling RightMark 3D , . , NV31 41 ( ) .

:

RightMark 3D. NV31 22, .

:

, NV31 NV34 . , , , ( 1.1). NV31 NV34.

RADEON 9500 — ( PRO ) . , NV31 RADEON 9500 — .

, :

, R300 ( 8 4 ), NV3X.



. , RightMark 3D, .

, 3D Mark 2001 RightMark 3D, .

, NV31 NV34 .

NV31 NV30 — 41, 22 . , NVIDIA NV30, .

NV34, NV31. , , NV30 — NVIDIA 3dlabs P10 VLIW ALU, . ( ALU) , , , .

NV34 NV30, NV31 NV35 — . , NV31 2.0 NV34 — NV30, , NV30 . , ALU , . , .

, NV34 — , NV30 NV31. 2.0 NV31 . . , NV34 .

, NV31 NV34 . (, ) .

, — .

3D-, 3DMark2001 —

, 16 ATI 8 NVIDIA. ATI ! ATI NVIDIA ( NV30), "8" . : . NVIDIA "" — 8, ATI — 16. , . , , (Application, Balanced, Aggressive) NVIDIA ATI, , , , ( NV30 ).

, , . , GeForce FX 5200 Ultra RADEON 9500 64MB, . FX 5200 Ultra $149, RADEON 9500 64MB.



3DMark2001, 3DMARKS













"", 100 100.



3DMark2001, Game1 Low details















3DMark2001, Game2 Low details















3DMark2001, Game3 Low details















3DMark2001, Game4













3DMark2001, , NV31 / , NV34 RADEON 9000 PRO Low-end- — GeForce4 MX 440-8x. , RADEON 9500 64MB , , RADEON 9500, , NV34 .

3D-, 3DMark03 —



3DMark03, 3DMARKS





3DMark03, Game1

Wings of Fury:

  • DirectX 7.0 ; 32000 , 16 , 6 1 .
  • 1.1, CPU ( "" ).
  • 4- , , 4 , .
  • .






3DMark03, Game2

Battle of Proxycon:

  • DirectX 8.1 ; 250 000 1.1 ( 150 000 — 1.4), 80 , 6 1 .
  • 1.1, CPU ( "" ).
  • "" .
  • , -.
  • 1.1, , , 1.4.
  • , .
  • , 1.1, Z-, . 1.4, .






3DMark03, Game3

Trolls' Lair:

  • DirectX 8.1 ; 560 000 1.1 ( 280 000 — 1.4), 64 , 19 2 .
  • 1.1, CPU ( "" ).
  • "" .
  • , -.
  • 1.1, , , 1.4.
  • , .
  • , .






3DMark03, Game4

Mother Nature:

  • DirectX 9.0 ; 780 000 , 50 , 54 9 .
  • 2.0. 1.1.
  • 2.0.
  • 2.0, DX9 .
  • 1.4.






3DMark03 , NVIDIA . , , , . , NV3x , DX9-. … ( DX9) , , .. Low/Middle .

3D-,

3D-. :

  • Return to Castle Wolfenstein (MultiPlayer) (id Software/Activision) — OpenGL, , Checkpoint-demo, — , S3TC OFF,

  • Serious Sam: The Second Encounter v.1.05 (Croteam/GodGames) — OpenGL, , Grand Cathedral demo, : quality, S3TC OFF

  • Quake3 Arena v.1.17 (id Software/Activision) — OpenGL, , Quaver, : High, №4, S3TC OFF, r_subdivisions "1" r_lodCurveError "30000" (, r_lodCurveError "250" !),

  • Unreal Tournament 2003 Demo (Digital Extreme/Epic Games) — Direct3D, Vertex Shaders, Hardware T&L, Dot3, cube texturing,

  • Code Creatures Benchmark Pro (CodeCult) — , DirectX 8.1, Shaders, HW T&L.

  • AquaMark (Massive Development) — , DirectX 8.1, Shaders, HW T&L.

  • RightMark 3D v.0.4 ( ) — DirectX 8.1, Dot3, cube texturing, shadow buffers, vertex and pixel shaders (1.1, 1.4).

Quake3 Arena, Quaver















? NVIDIA Quake3- , "" .

Serious Sam: The Second Encounter, Grand Cathedral















. ATI , NV31 . NV34 — , RADEON 9000 PRO .

Return to Castle Wolfenstein (Multiplayer), Checkpoint















, ( Quake3). … , NV30 42.* 70 120 fps 16001200 ( "", ?).

Code Creatures



-… . …

Unreal Tournament 2003 DEMO















. : , .

AquaMark















, NVIDIA . : , .

RightMark 3D















, , , NVIDIA .

DOOM III Alpha









? . , . NV3x.

3D-

NV30 . .

, NV3x : , . . , "". , Aggressive Performance.

.

Application Balanced Aggressive
RightMark3D
Anisotester (from Unwinder)
Serious Sam: TSE


, , . MIP-mapping-, . XMAS — OpenGL.

Application Balanced Aggressive
1
Bilinear
Trilinear
Anisotropic 8x
2
Anisotropic 8x


, Performance/Aggressive . , ATI , , , "", , RADEON 9000/8500/9200/9100 , . , , Balanced ( ATI , RADEON 9500/9700 ).

3D

- , GeForce FX 5800. , - , - RAMDAC, — -.

, . , , . , , , 3D- — . NVIDIA .

, NV35 NV31, DDR2 . RADEON . :

  1. , , ( ) NV31 (!) NV34 - .
  2. , , (GeForce4 Ti), .
  3. RV350 ATI ( ), ATI , NV31, .
  4. . , , , NV3x. , / - . , , NV31/NV34 — ( DOOM III).
  5. , : , $100. , .
  6. , NV30 .