NVIDIA GeForce FX 5600 Ultra (NV31) и GeForce FX 5200 Ultra (NV34)

"Ширпотребшейдеры"


Уже по традиции, предваряя большой материал анализа работы нового акселератора, мы настоятельно рекомендуем прочитать аналитическую статью, посвященную архитектуре и спецификациям NVIDIA GeForce FX (NV30), а также практический обзор NVIDIA GeForce FX 5800 Ultra, поскольку рассматриваемые сегодня ускорители базируются на технологиях NV30

СОДЕРЖАНИЕ

  1. Общие сведения
  2. Особенности видеокарт NVIDIA GeForce FX 5600 Ultra и 5200 Ultra
  3. Конфигурации тестовых стендов и особенности настроек драйверов
  4. Результаты тестов: коротко о 2D
  5. Синтетические тесты RightMark3D: идеология и описание тестов
  6. Результаты тестов: RightMark3D: Pixel Filling
  7. Результаты тестов: RightMark3D: Geometry Processing Speed
  8. Результаты тестов: RightMark3D: Hidden Surface Removal
  9. Результаты тестов: RightMark3D: Pixel Shading
  10. Результаты тестов: RightMark3D: Point Sprites
  11. Результаты тестов: Синтетические тесты 3DMark2001 SE
  12. Выводы из результатов синтетических тестов
  13. Результаты тестов: Игровые тесты 3DMark2001 SE: Game1
  14. Результаты тестов: Игровые тесты 3DMark2001 SE: Game2
  15. Результаты тестов: Игровые тесты 3DMark2001 SE: Game3
  16. Результаты тестов: Игровые тесты 3DMark2001 SE: Game4
  17. Результаты тестов: Игровые тесты 3DMark03: Game1
  18. Результаты тестов: Игровые тесты 3DMark03: Game2
  19. Результаты тестов: Игровые тесты 3DMark03: Game3
  20. Результаты тестов: Игровые тесты 3DMark03: Game4
  21. Результаты тестов: Quake3 ARENA
  22. Результаты тестов: Serious Sam: The Second Encounter
  23. Результаты тестов: Return to Castle Wolfenstein
  24. Результаты тестов: Code Creatures DEMO
  25. Результаты тестов: Unreal Tournament 2003 DEMO
  26. Результаты тестов: AquaMark
  27. Результаты тестов: RightMark 3D
  28. Результаты тестов: DOOM III Alpha version
  29. Качество 3D: Анизотропная фильтрация
  30. Качество 3D в целом
  31. Выводы

3D-графика, 3DMark2001 SE — синтетические тесты

Подчеркну, что все замеры по всем 3D-тестам проводились в 32-битной глубине цвета.

Скорость закраски



Наблюдается уже хорошо знакомая нам по результатам работы Pixel Filling теста из RightMark 3D зависимость, однако она не столь ярко выражена. Кроме того, по какой то причине драйверы не смогли использовать NV31 в режиме 4х1 для этого теста (что несколько странно) и в итоге чип показал лишь половину своего потенциального результата.

В случае мультитекстурирования:

Результаты снова соотносятся с полученными нами ранее в тестах RightMark 3D. Здесь чип NV31 работает в режиме 2х2, что при мультитекстурировании является предпочтительным.

Пиксельный шейдер

Простой вариант:

Интересно, что NV31 заметно опережает NV34 в этом тесте. Фактически этот тест достаточно интенсивно выбирает текстуры, но при этом производит минимум вычислений, кроме того, все вычисления происходят в целочисленном формате (шейдеры 1.1). Видимо большие Кэши текстур NV31 позволили ей опередить NV34.

RADEON 9500 на высоте — вдвое (а для PRO версии вчетверо) большее число конвейеров позволяет ему демонстрировать отличные результаты. С другой стороны, NV31 при вдвое меньшем числе конвейеров идет наравне с RADEON 9500 — она обладает более высокой тактовой частотой и более производительными конвейерами.

Посмотрим, изменится ли картина при условии более вычислительно интенсивных пиксельных шейдеров:

Да, теперь R300 лидирует во всех вариантах (и 8 и 4 конвейера), лишний раз подтверждая сделанные нами ранее выводы о более слабой вычислительной и более высокой текстурной производительности семейства NV3X.

Вершинные шейдеры



Тест вершинных шейдеров демонстрирует сходные с нашими предыдущими исследованиями результаты. Как бы там ни было мы склонны обращать больше внимания на предыдущие результаты, полученные на синтетических тестах RightMark 3D, которые не проявляют столь заметной зависимости от разрешения.

Итак, за исключением отдельных моментов результаты 3D Mark 2001 хорошо согласуются с полученными ранее результатами RightMark 3D, хотя и несут изначально меньше информации ввиду отсутствия каких либо настроек параметров синтетических тестов.

Выводы из результатов синтетических тестов

Итак, подведем краткий итог по детальному исследованию различных блоков NV31 и NV34 с помощью синтетических тестов.

В NV31 удалось компенсировать самый спорный момент NV30 — этот чип может работать как в конфигурации 4х1, так и в конфигурации 2х2 в зависимости от числа текстур и задачи. Таким образом, NVIDIA исправила серьезный недостаток NV30, потенциально влияющий на производительность в старых и современных приложениях интенсивно накладывающих одну текстуру.

Радует наличие аппаратной геометрической обработки как на NV34, так и на NV31. Интересно, что ее производительность не втрое и не вдвое, а в два с половиной раза ниже NV30 на равной частоте — видимо в чипах этого поколения NVIDIA использует схожий с 3dlabs P10 широкий VLIW геометрический процессор с массивом ALU, способный параллельно обрабатывать несколько вершин. Такая схема наиболее оптимальна с точки зрения КПД (занятости ALU) и, кроме того, позволяет аккуратно масштабировать геометрическую производительность чипов, в том числе в нецелое число раз.

Если архитектура пиксельной части NV34 видимо повторяет NV30, то NV31 видится нам скорее как предвестник NV35 — более гибко конфигурируемого чипа. Хотя, мы на заметили вычислительного преимущества NV31 на пиксельных шейдерах 2.0 над NV34 — в наличии ровно половина вычислительной производительности NV30, видимо пиксельная часть имеют несколько иную, отличную от NV30 структуру. Возможно, что используется общие универсальные ALU для выборки текстур, стадий и пиксельных шейдеров обеих версий. Это не только экономит транзисторы, но позволяет нам надеяться на прирост производительности по мере оптимизации драйверов.

В свою очередь, пиксельная архитектура NV34 требует еще более пристального изучения — удивляют одинаковые результаты для всех типов шейдеров в тесте закраски, это совершенно не похоже на NV30 или NV31. И в то же время в тесте на шейдеры 2.0 чип показал схожий с NV31 характер результатов. Мы будем исследовать этот вопрос. Возможно, на NV34 обкатываются какие то агрессивные оптимизации на уровне драйверов.

Судя по результатам синтетических тестов, основные отличия в производительности NV31 и NV34 в реальных приложениях будут вызваны размерами очередей и КЭШей. С точки зрения отдельно взятых базовых блоков (геометрический, пиксельный) на равных частотах эти чипы показывают эквивалентную производительность.

Итак, со скоростью отдельных блоков все ясно — теперь все зависит от реальных приложений и цены.

3D-графика, 3DMark2001 — игровые тесты

Сразу отмечу, почему мы использовали в наших тестах настройки анизотропии 16х у карт от ATI и 8х у карт от NVIDIA. Никакой дискриминации в отношении карт от ATI нет! Алгоритмы работы этой функции у ATI и NVIDIA очень различаются (об этом мы говорили подробно в нашем материале по NV30), поэтому сопоставлять только цифры "8" неразумно. Критерий один: максимально возможное качество. У NVIDIA по ее "счетчику" — это 8х, а у ATI — 16х. Скриншоты мы уже приводили, и не один раз. К тому же, интересно будет узнать, как сопоставляются разные режимы работы анизотропии (Application, Balanced, Aggressive) от NVIDIA с максимально качественным режимом от ATI, тем более, что опять же, скриншоты мы уже приводили, и читатель может оценить соотношение скорости и качества (милости просим в обзор NV30 за скриншотами оценки качества анизотропной фильтрации).

Думаю, что в таблицах соотношений все данные имеются, поэтому комментировать нет смысла. Замечу лишь, что мы провели сравнение GeForce FX 5200 Ultra и с RADEON 9500 64MB, хотя по позиционированию эти карты находятся в разных секторах. Однако начальная цена самой дорогой карты FX 5200 Ultra возможно будет до $149, а ныне по таким ценам можно купить RADEON 9500 64MB.



3DMark2001, 3DMARKS













Если кто хочет проценты перевести в "разы", то надо к процентам прибавить 100 и все разделить на 100.



3DMark2001, Game1 Low details















3DMark2001, Game2 Low details















3DMark2001, Game3 Low details















3DMark2001, Game4













Подводя итоги по тестированию в 3DMark2001, можно сказать, что NV31 прекрасно сражается с соперниками в тяжелых режимах с АА и/или анизотропии, а NV34 показывает хорошие результаты в борьбе с RADEON 9000 PRO да и с прежним кумиром Low-end-а — GeForce4 MX 440-8x. Заметим, что в борьбе с RADEON 9500 64MB есть некоторые проигрыши, однако не надо забывать, что в конце марта прекращается производство RADEON 9500, цена на эти карты снижаться пока не собирается, когда как у NV34 есть большой задел в плане падений цен.







Дополнительно

Обзор NVIDIA GeForce FX 5600 Ultra (NV31) и GeForce FX 5200 Ultra (NV34)

NVIDIA GeForce FX 5600 Ultra (NV31) и GeForce FX 5200 Ultra (NV34)

"Ширпотребшейдеры"


Уже по традиции, предваряя большой материал анализа работы нового акселератора, мы настоятельно рекомендуем прочитать аналитическую статью, посвященную архитектуре и спецификациям NVIDIA GeForce FX (NV30), а также практический обзор NVIDIA GeForce FX 5800 Ultra, поскольку рассматриваемые сегодня ускорители базируются на технологиях NV30

СОДЕРЖАНИЕ

  1. Общие сведения
  2. Особенности видеокарт NVIDIA GeForce FX 5600 Ultra и 5200 Ultra
  3. Конфигурации тестовых стендов и особенности настроек драйверов
  4. Результаты тестов: коротко о 2D
  5. Синтетические тесты RightMark3D: идеология и описание тестов
  6. Результаты тестов: RightMark3D: Pixel Filling
  7. Результаты тестов: RightMark3D: Geometry Processing Speed
  8. Результаты тестов: RightMark3D: Hidden Surface Removal
  9. Результаты тестов: RightMark3D: Pixel Shading
  10. Результаты тестов: RightMark3D: Point Sprites
  11. Результаты тестов: Синтетические тесты 3DMark2001 SE
  12. Выводы из результатов синтетических тестов
  13. Результаты тестов: Игровые тесты 3DMark2001 SE: Game1
  14. Результаты тестов: Игровые тесты 3DMark2001 SE: Game2
  15. Результаты тестов: Игровые тесты 3DMark2001 SE: Game3
  16. Результаты тестов: Игровые тесты 3DMark2001 SE: Game4
  17. Результаты тестов: Игровые тесты 3DMark03: Game1
  18. Результаты тестов: Игровые тесты 3DMark03: Game2
  19. Результаты тестов: Игровые тесты 3DMark03: Game3
  20. Результаты тестов: Игровые тесты 3DMark03: Game4
  21. Результаты тестов: Quake3 ARENA
  22. Результаты тестов: Serious Sam: The Second Encounter
  23. Результаты тестов: Return to Castle Wolfenstein
  24. Результаты тестов: Code Creatures DEMO
  25. Результаты тестов: Unreal Tournament 2003 DEMO
  26. Результаты тестов: AquaMark
  27. Результаты тестов: RightMark 3D
  28. Результаты тестов: DOOM III Alpha version
  29. Качество 3D: Анизотропная фильтрация
  30. Качество 3D в целом
  31. Выводы

3D-графика, 3DMark2001 SE — синтетические тесты

Подчеркну, что все замеры по всем 3D-тестам проводились в 32-битной глубине цвета.

Скорость закраски



Наблюдается уже хорошо знакомая нам по результатам работы Pixel Filling теста из RightMark 3D зависимость, однако она не столь ярко выражена. Кроме того, по какой то причине драйверы не смогли использовать NV31 в режиме 4х1 для этого теста (что несколько странно) и в итоге чип показал лишь половину своего потенциального результата.

В случае мультитекстурирования:

Результаты снова соотносятся с полученными нами ранее в тестах RightMark 3D. Здесь чип NV31 работает в режиме 2х2, что при мультитекстурировании является предпочтительным.

Пиксельный шейдер

Простой вариант:

Интересно, что NV31 заметно опережает NV34 в этом тесте. Фактически этот тест достаточно интенсивно выбирает текстуры, но при этом производит минимум вычислений, кроме того, все вычисления происходят в целочисленном формате (шейдеры 1.1). Видимо большие Кэши текстур NV31 позволили ей опередить NV34.

RADEON 9500 на высоте — вдвое (а для PRO версии вчетверо) большее число конвейеров позволяет ему демонстрировать отличные результаты. С другой стороны, NV31 при вдвое меньшем числе конвейеров идет наравне с RADEON 9500 — она обладает более высокой тактовой частотой и более производительными конвейерами.

Посмотрим, изменится ли картина при условии более вычислительно интенсивных пиксельных шейдеров:

Да, теперь R300 лидирует во всех вариантах (и 8 и 4 конвейера), лишний раз подтверждая сделанные нами ранее выводы о более слабой вычислительной и более высокой текстурной производительности семейства NV3X.

Вершинные шейдеры



Тест вершинных шейдеров демонстрирует сходные с нашими предыдущими исследованиями результаты. Как бы там ни было мы склонны обращать больше внимания на предыдущие результаты, полученные на синтетических тестах RightMark 3D, которые не проявляют столь заметной зависимости от разрешения.

Итак, за исключением отдельных моментов результаты 3D Mark 2001 хорошо согласуются с полученными ранее результатами RightMark 3D, хотя и несут изначально меньше информации ввиду отсутствия каких либо настроек параметров синтетических тестов.

Выводы из результатов синтетических тестов

Итак, подведем краткий итог по детальному исследованию различных блоков NV31 и NV34 с помощью синтетических тестов.

В NV31 удалось компенсировать самый спорный момент NV30 — этот чип может работать как в конфигурации 4х1, так и в конфигурации 2х2 в зависимости от числа текстур и задачи. Таким образом, NVIDIA исправила серьезный недостаток NV30, потенциально влияющий на производительность в старых и современных приложениях интенсивно накладывающих одну текстуру.

Радует наличие аппаратной геометрической обработки как на NV34, так и на NV31. Интересно, что ее производительность не втрое и не вдвое, а в два с половиной раза ниже NV30 на равной частоте — видимо в чипах этого поколения NVIDIA использует схожий с 3dlabs P10 широкий VLIW геометрический процессор с массивом ALU, способный параллельно обрабатывать несколько вершин. Такая схема наиболее оптимальна с точки зрения КПД (занятости ALU) и, кроме того, позволяет аккуратно масштабировать геометрическую производительность чипов, в том числе в нецелое число раз.

Если архитектура пиксельной части NV34 видимо повторяет NV30, то NV31 видится нам скорее как предвестник NV35 — более гибко конфигурируемого чипа. Хотя, мы на заметили вычислительного преимущества NV31 на пиксельных шейдерах 2.0 над NV34 — в наличии ровно половина вычислительной производительности NV30, видимо пиксельная часть имеют несколько иную, отличную от NV30 структуру. Возможно, что используется общие универсальные ALU для выборки текстур, стадий и пиксельных шейдеров обеих версий. Это не только экономит транзисторы, но позволяет нам надеяться на прирост производительности по мере оптимизации драйверов.

В свою очередь, пиксельная архитектура NV34 требует еще более пристального изучения — удивляют одинаковые результаты для всех типов шейдеров в тесте закраски, это совершенно не похоже на NV30 или NV31. И в то же время в тесте на шейдеры 2.0 чип показал схожий с NV31 характер результатов. Мы будем исследовать этот вопрос. Возможно, на NV34 обкатываются какие то агрессивные оптимизации на уровне драйверов.

Судя по результатам синтетических тестов, основные отличия в производительности NV31 и NV34 в реальных приложениях будут вызваны размерами очередей и КЭШей. С точки зрения отдельно взятых базовых блоков (геометрический, пиксельный) на равных частотах эти чипы показывают эквивалентную производительность.

Итак, со скоростью отдельных блоков все ясно — теперь все зависит от реальных приложений и цены.

3D-графика, 3DMark2001 — игровые тесты

Сразу отмечу, почему мы использовали в наших тестах настройки анизотропии 16х у карт от ATI и 8х у карт от NVIDIA. Никакой дискриминации в отношении карт от ATI нет! Алгоритмы работы этой функции у ATI и NVIDIA очень различаются (об этом мы говорили подробно в нашем материале по NV30), поэтому сопоставлять только цифры "8" неразумно. Критерий один: максимально возможное качество. У NVIDIA по ее "счетчику" — это 8х, а у ATI — 16х. Скриншоты мы уже приводили, и не один раз. К тому же, интересно будет узнать, как сопоставляются разные режимы работы анизотропии (Application, Balanced, Aggressive) от NVIDIA с максимально качественным режимом от ATI, тем более, что опять же, скриншоты мы уже приводили, и читатель может оценить соотношение скорости и качества (милости просим в обзор NV30 за скриншотами оценки качества анизотропной фильтрации).

Думаю, что в таблицах соотношений все данные имеются, поэтому комментировать нет смысла. Замечу лишь, что мы провели сравнение GeForce FX 5200 Ultra и с RADEON 9500 64MB, хотя по позиционированию эти карты находятся в разных секторах. Однако начальная цена самой дорогой карты FX 5200 Ultra возможно будет до $149, а ныне по таким ценам можно купить RADEON 9500 64MB.



3DMark2001, 3DMARKS













Если кто хочет проценты перевести в "разы", то надо к процентам прибавить 100 и все разделить на 100.



3DMark2001, Game1 Low details















3DMark2001, Game2 Low details















3DMark2001, Game3 Low details















3DMark2001, Game4













Подводя итоги по тестированию в 3DMark2001, можно сказать, что NV31 прекрасно сражается с соперниками в тяжелых режимах с АА и/или анизотропии, а NV34 показывает хорошие результаты в борьбе с RADEON 9000 PRO да и с прежним кумиром Low-end-а — GeForce4 MX 440-8x. Заметим, что в борьбе с RADEON 9500 64MB есть некоторые проигрыши, однако не надо забывать, что в конце марта прекращается производство RADEON 9500, цена на эти карты снижаться пока не собирается, когда как у NV34 есть большой задел в плане падений цен.