NVIDIA GeForce4 Ti 4400 и GeForce4 Ti 4600 (NV25)

или "Опять двадцать пять"




3D-графика, 3DMark2001 — синтетические тесты

Скорость закраски

Мы измеряли этот параметр только для 32 битной глубины цвета:

NV25 вновь лидер (на что несколько ранее уже намекал нам EMBM тест из раздела DX SDK). Особенно интересно наглядно сравнить эффективность закраски в исполнении NV25, установленного на штатную частоту Ti500 (240/500). Налицо заметный прирост, а, следовательно, и наличие архитектурной оптимизации конвейера закраски и контроллера памяти. Напомним, что теоретические пределы для данного теста составляют 960 миллионов пикселей в секунду для Ti 500, 1100 для RADEON 8500 и 1200 для Ti 4600 соответственно. На сей раз архитектура NV25 достигла сравнимой с R200 степени приближения к теоретическому максимуму филрэйта, исправив небольшое отставание NV20 в этом вопросе. В какой раз мы убеждаемся в целенаправленной и эффективной "работе над ошибками", проделанной специалистами из NVIDIA. Не забываем, что, несмотря на ту же самую технологию производства и лишь незначительно возросшее число транзисторов, NV25 существенно превосходит NV20 как по предельной рабочей частоте, так и по эффективности работы на равных частотах. Редкий случай, когда удалось и рыбку съесть, и ничего не уколоть (прозрачный намек в сторону производителей центральных процессоров).

В случае нескольких текстур чипы еще немного приблизились к теоретическому пределу, сохранив общую картину взаимного расположения. Наибольший результат этого теста всегда достигается при максимальном разрешении — здесь чипу остается только красить, красить и еще раз красить бескрайние поля экрана.

Сцена с большим количеством полигонов

На этом тесте особое внимание следует уделить минимальному разрешению — именно там зависимость от закраски практически нивелируется:

При наличии одного источника света NV25 показывает себя абсолютным лидером. Его результат не только значительно (более, чем на разницу частот) превосходит Ti 500, но и (что более важно) вплотную приблизился к значению практического предела пропускной способности по треугольникам, полученному ранее с помощью Optimized Mesh из DX8.1 SDK. Еще одно свидетельство мощи двойного T&L NV25 и прекрасного баланса всей архитектуры чипа. Общий прирост эффективности, достигнутый благодаря появлению второго шейдерного блока, можно наблюдать, сравнив результаты NV25 и NV20 на одинаковой частоте (более чем в полтора раза!). Впрочем, не будем умалять достоинств R200, также приблизившегося к предельной цифре, полученной в тесте из SDK, но значительно отстающего по абсолютным значениям, несмотря на близкую к NV25 частоту ядра.

В случае 8 источников света R200 немного реабилитирует себя: с ростом числа источников его производительность падает чуть более медленно чем у NV20 и NV25. Но абсолютное лидерство по-прежнему за NVIDIA.

Рельефное текстурирование

Посмотрим на результаты синтетической EMBM сцены:

Наибольшее отношение собственно к EMBM результаты этого теста имеют в высоких разрешениях, в 800х600 все определяет зависимость от геометрии. Интересно, что на одинаковой частоте собственно EMBM выполняется NV25 чуть медленнее NV20 — вероятно, это расплата за оптимизацию конвейера закраски, гораздо более эффективного при обыкновенной закраске и, особенно, при использовании MSAA (об этом далее). А теперь DP3 рельеф:

Здесь все встает на свои места и никаких досадных исключений из общей победоносности NV25 не возникает.

Вершинные шейдеры

Мы приводим результаты этого теста в нескольких разрешениях. Читатель легко подметит интересную зависимость:

С ростом разрешения R200 стремительно сдает свои позиции, упираясь в недостаточную эффективность закраски, в то время как скорость NV25 падает существенно медленнее. Кроме того, вновь четко выражено архитектурное преимущество двойного T&L NV25 над NV20 на одинаковой частоте.

Пиксельный шейдер

Руководствуясь высказанными выше соображениями о том, что слишком малые разрешения "упираются" в геометрию, а слишком большие — в пропускную полосу памяти, обратим основное внимание на 1024х768 и 1280х1024:

Картина вполне узнаваема: NV25 вновь на коне, в том числе и на равной NV20 частоте. Впрочем, архитектурное преимущество в исполнении пиксельных шейдеров минимально, и это ожидаемый результат: простор для аппаратной оптимизации на этом поприще значительно уже, чем в случае вершинных шейдеров (если не затрагивать простое увеличение числа конвейеров закраски, которое не имеет смысла из-за ограничений на пропускную способность памяти).

Спрайты



В этой области NV25 значительно опережает NV20 на равной частоте. В маленьких разрешениях наибольший вклад в этот тест вносит скорость геометрической обработки, а в средних все встает на свои места. В принципе — нельзя говорить о четком преимуществе NV25 над R200 или наоборот, на штатных частотах разница минимальна. Как бы там ни было — работа над ошибками (в отношении того, что наблюдалось ранее у NV20) налицо. Следует отметить и возросшие возможности по масштабированию спрайтов (см. ранее таблицу с параметрами чипов).

Итак, подведем первый промежуточный итог. По сумме синтетических тестов карта NVIDIA GeForce4 Ti 4600 выходит очевидным, "четким" победителем. Что, впрочем, от нее и ожидалось — удивительно, если бы разница в полгода не сказалась именно таким образом. Однако не будем забывать, что только результаты реальных приложений позволят нам судить об общей сбалансированности этого чипа. Оставайтесь с нами.

3D-графика, 3DMark2001 — игровые тесты



3DMark2001, 3DMARKS





На основании общих "марков" можно отметить, что GeForce4 обгоняет своего предшественника более, чем на 30%. Интересно отметить, что RADEON 8500 утратил былое яркое преимущество над GeForce3 Ti 500 по общему "зачету" в 3DMark2001. А теперь посмотрим более подробно.

Как известно, в состав 3DMark2001 входит 4 игровых теста, 3 из которых присутствуют в 2-х вариантах: так называемой низкой и высокой детализации графики. Высокая детализация в этих тестах сводится, в основном, к усилению нажима на процессор и видеоускоритель дополнительными эффектами и повышением полигональной сложности сцен. Однако движок этих тестов сделан таким образом, что высокий уровень детализации в игровых тестах приводит к "упиранию" в частоту CPU в случае очень производительного ускорителя. Что мы, к сожалению, и наблюдали (в достаточно жесткой форме) на примере результатов GeForce 4. Мы были вынуждены исключить High Detail тесты из нашего рассмотрения в данном материале. Надеемся, что обновленная версия 3D Mark, которая, по слухам, готовится к выходу, разрешит эту проблему.

3DMark2001, Game1 Low details





Боевой авто-симулятор, навеянный нетленной антиутопией о войне с роботами (Terminator 1 и 2). Создатели теста утверждают, что эта игровая сцена честным образом тратит процессорное время на расчет физики и поведения объектов, как это сделала бы любая реальная игра. Что ж, это несомненно плюс — мы сможем не только говорить о скорости ускорителя, но и прикинуть, как он покажет себя в будущих играх. Характеристики:

  • Rendered triangles per frame (min/avg/max): 19773/33753/143422
  • Rendered textures per frame with 16 bit textures (min/avg/max): 7.5/8.8/16.5 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 15.1/17.7/30.3 MB
  • Rendered textures per frame with texture compression (min/avg/max): 10.7/12.2/21.0 MB

Превосходство над GeForce3 Ti 500 в разрешении 1600х1200х32 таково: у GeForce4 Ti 4400 — 30.5%, у GeForce4 Ti 4600 — 36.2%.

Что касается сравнения Windows ME и Windows XP, то здесь наблюдается некоторое отставание результатов XP от ME.

3DMark2001, Game2 Low details





Cказочно-историческая фэнтези с драконом, красивой наездницей оного, городом, кораблем и нещадно опаляемыми огнем людьми. Так как жанр этой игры определить сложно, будем считать, что это — аркадная сцена из какой-то 3D Adventure или стратегии. Судя по всему, сцены имеют высокое значение overdraw и достаточно слабую оптимизацию геометрии при выводе. От ускорителя требуется оптимизация работы с Z-буфером. Характеристики:

  • Rendered triangles per frame (min/avg/max): 46159/51440/147828
  • Rendered textures per frame with 16 bit textures (min/avg/max): 8.0/8.8/10.1 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 15.6/17.2/19.8 MB
  • Rendered textures per frame with texture compression (min/avg/max): 9.3/10.9/13.5 MB

Превосходство над GeForce3 Ti 500 в разрешении 1600х1200х32 таково: у GeForce4 Ti 4400 — 27.4%, у GeForce4 Ti 4600 — 38.8%, в 1280х1024х32 — 35.1% и 45.3% cоответственно. Интересно заметить, что в очередной раз пик прироста наблюдается в 1280х1024 (вспомним описанные ранее синтетические тесты), и затем спадает в 1600х1200.

Сравнение Windows ME vs Windows XP в этом тесте показало, что у ATI RADEON 8500 производительность в обеих ОС равна, а у NVIDIA-карт чуть-чуть выше у второй.

3DMark2001, Game3 Low details





Сцена навеяна "Mатрицей". Надо отметить, что детальность самих моделей невысока — где-то на уровне Quake2. Судя по всему, присутствует скининг (матричный блендинг) и скелетная анимация. В активе — детальные текстуры и огромное количество всяческих гильз, осколков и прочих мелочей, они значительно нагружают ускоритель. Назовем этот жанр киношутером. Характеристики:

  • Rendered triangles per frame (min/avg/max): 16681/21746/39890
  • Rendered textures per frame with 16 bit textures (min/avg/max): 2.8/4.1/4.7 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 5.7/8.2/9.4 MB
  • Rendered textures per frame with texture compression (min/avg/max): 5.0/7.2/8.4 MB

Превосходство над GeForce3 Ti 500 в разрешении 1600х1200х32 таково: у GeForce4 Ti 4400 — 19.3%, у GeForce4 Ti 4600 — 29.1%.

Сравнение Windows ME vs Windows XP в этом тесте показало, что у всех карт производительность чуть-чуть выше под первой — ME.

3DMark2001, Game4





Безусловно, это самый красивый из всех игровых тестов. Главная его особенность, что он использует пиксельные шейдеры, вершинные шейдеры и кубическое текстурирование для формирования водных поверхностей (кроме быстро бегущей речки). Поэтому лицезреть эту игру во всей красе можно пока только на GeForce3/4 и RADEON 8500 (в демо-режиме водные поверхности не отображаются). Характеристики:

  • Rendered triangles per frame (min/avg/max): 55601/81714/180938
  • Rendered textures per frame with 16 bit textures (min/avg/max): 14.9/17.4/20.7 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 28.4/33.5/40.0 MB
  • Rendered textures per frame with texture compression (min/avg/max): 28.4/33.5/40.0 MB

Превосходство над GeForce3 Ti 500 в разрешении 1600х1200х32 таково: у GeForce4 Ti 4400 — 25%, у GeForce4 Ti 4600 — 37.5%.

Сравнение Windows ME vs Windows XP в этом тесте показало, что у NVIDIA-карт производительность чуть-чуть выше под первой ME, а у ATI RADEON 8500 она одинаковая под обеими ОС.

3D-графика, игровые тесты

Приступаем к оценке производительности видеокарты в 3D-играх. В качестве инструментария мы использовали:

  • Quake3 Arena v.1.17 (id Software/Activision) — игровой тест, демонстрирующий работу плат в OpenGL с использованием демо-бенчмарка уровня Q3DM9 с огромными текстурами — Quaver;
  • Return to Castle Wolfenstein (id Software/Activision) — игровой тест, демонстрирующий работу плат в OpenGL с использованием демо-бенчмарка Checkpoint;
  • Serious Sam v.1.05 (Croteam/God Games) — игровой тест, демонстрирующий работу плат в OpenGL с использованием демо-бенчмарка Karnak demo;
  • GLMark (Vulpine) — синтетический тест, демонстрирующий работу плат в OpenGL с использованием возможностей GeForce3 (это единственный тест — исключение из игровых программ);
  • AquaMark v.2.2 (Massive Development) — игровой тест, демонстрирующий работу плат в DirectX 8.1 с использованием пиксельных шейдеров;
  • Giants: Citizen Kabuto (Planet Moon Studios/Digital Mayhem/Interplay) — игровой тест, демонстрирующий работу платы в Direct3D с использованием демо-бенчмарка gamegauge.

Quake3 Arena

Quaver, режимы максимального качества

Тестирование на примере Quaver проводилось в режиме 16- и 32-битного цветов при максимально возможной детализации и с усилением сложности геометрии (r_subdivisions "1" r_lodCurveError "30000"). Этот бенчмарк очень нагружает акселераторы не только геометрией, но и огромным объемом текстур, а также массовостью эффектов.

Pentium 4 2100







Athlon XP 1800+

Эти тесты нам продемонстрировали производительность новинок в 16-, 32-битном цвете, а также падение скорости при переходе от 16- к 32-битному цвету, где прекрасно видно, что 16-битный цвет заслуженно нами отправлен в историю при рассмотрении видеокарт даже уровня GeForce3 Ti. Обратите внимание на то, что специально заторможенная нами до частот Ti 500 (d/c 240/500 MHz) GeForce4 показывает значительно более высокую производительность, чем Ti 500, что свидетельствует о том, что GeForce4 — не просто увеличение диапазона рабочих частот предыдущего продукта, но и значительная оптимизация различных блоков (о чем мы писали вначале).

Также хочу заметить, что мы разогнали ATI RADEON 8500 до уровня предполагаемых частот следующей ревизии этой карты (если она всетаки будет) — 300/300 (600) МГц. Отлично видно, что этот чип такой прирост частот не спасает.



На этой диаграмме хорошо видно, что оба производителя видеочипсетов потрудились над OpenGL ICD, сравняв производительность Windows XP c Windows ME, а драйверы NVIDIA для Windows XP демонстрируют даже более высокую скорость.

Думаю, что оценка производительности GeForce4 не нуждается в комментариях, в 1280х1024х32 мы видим превосходство над GeForce3 Ti 500 у GeForce4 Ti 4400 в 20.3%; у GeForce4 Ti 4600 — 24.3%. В 1600х1200х32 соответственно - 26.5% и 33.3%. Замечу, что частота чипа выросла с 240 до 300 МГц, что составляет 25%.





Дополнительно

Обзор референс-видеокарт NVIDIA GeForce4 Ti 4400 и 4600

NVIDIA GeForce4 Ti 4400 и GeForce4 Ti 4600 (NV25)

или "Опять двадцать пять"



3D-графика, 3DMark2001 — синтетические тесты

Скорость закраски

Мы измеряли этот параметр только для 32 битной глубины цвета:

NV25 вновь лидер (на что несколько ранее уже намекал нам EMBM тест из раздела DX SDK). Особенно интересно наглядно сравнить эффективность закраски в исполнении NV25, установленного на штатную частоту Ti500 (240/500). Налицо заметный прирост, а, следовательно, и наличие архитектурной оптимизации конвейера закраски и контроллера памяти. Напомним, что теоретические пределы для данного теста составляют 960 миллионов пикселей в секунду для Ti 500, 1100 для RADEON 8500 и 1200 для Ti 4600 соответственно. На сей раз архитектура NV25 достигла сравнимой с R200 степени приближения к теоретическому максимуму филрэйта, исправив небольшое отставание NV20 в этом вопросе. В какой раз мы убеждаемся в целенаправленной и эффективной "работе над ошибками", проделанной специалистами из NVIDIA. Не забываем, что, несмотря на ту же самую технологию производства и лишь незначительно возросшее число транзисторов, NV25 существенно превосходит NV20 как по предельной рабочей частоте, так и по эффективности работы на равных частотах. Редкий случай, когда удалось и рыбку съесть, и ничего не уколоть (прозрачный намек в сторону производителей центральных процессоров).

В случае нескольких текстур чипы еще немного приблизились к теоретическому пределу, сохранив общую картину взаимного расположения. Наибольший результат этого теста всегда достигается при максимальном разрешении — здесь чипу остается только красить, красить и еще раз красить бескрайние поля экрана.

Сцена с большим количеством полигонов

На этом тесте особое внимание следует уделить минимальному разрешению — именно там зависимость от закраски практически нивелируется:

При наличии одного источника света NV25 показывает себя абсолютным лидером. Его результат не только значительно (более, чем на разницу частот) превосходит Ti 500, но и (что более важно) вплотную приблизился к значению практического предела пропускной способности по треугольникам, полученному ранее с помощью Optimized Mesh из DX8.1 SDK. Еще одно свидетельство мощи двойного T&L NV25 и прекрасного баланса всей архитектуры чипа. Общий прирост эффективности, достигнутый благодаря появлению второго шейдерного блока, можно наблюдать, сравнив результаты NV25 и NV20 на одинаковой частоте (более чем в полтора раза!). Впрочем, не будем умалять достоинств R200, также приблизившегося к предельной цифре, полученной в тесте из SDK, но значительно отстающего по абсолютным значениям, несмотря на близкую к NV25 частоту ядра.

В случае 8 источников света R200 немного реабилитирует себя: с ростом числа источников его производительность падает чуть более медленно чем у NV20 и NV25. Но абсолютное лидерство по-прежнему за NVIDIA.

Рельефное текстурирование

Посмотрим на результаты синтетической EMBM сцены:

Наибольшее отношение собственно к EMBM результаты этого теста имеют в высоких разрешениях, в 800х600 все определяет зависимость от геометрии. Интересно, что на одинаковой частоте собственно EMBM выполняется NV25 чуть медленнее NV20 — вероятно, это расплата за оптимизацию конвейера закраски, гораздо более эффективного при обыкновенной закраске и, особенно, при использовании MSAA (об этом далее). А теперь DP3 рельеф:

Здесь все встает на свои места и никаких досадных исключений из общей победоносности NV25 не возникает.

Вершинные шейдеры

Мы приводим результаты этого теста в нескольких разрешениях. Читатель легко подметит интересную зависимость:

С ростом разрешения R200 стремительно сдает свои позиции, упираясь в недостаточную эффективность закраски, в то время как скорость NV25 падает существенно медленнее. Кроме того, вновь четко выражено архитектурное преимущество двойного T&L NV25 над NV20 на одинаковой частоте.

Пиксельный шейдер

Руководствуясь высказанными выше соображениями о том, что слишком малые разрешения "упираются" в геометрию, а слишком большие — в пропускную полосу памяти, обратим основное внимание на 1024х768 и 1280х1024:

Картина вполне узнаваема: NV25 вновь на коне, в том числе и на равной NV20 частоте. Впрочем, архитектурное преимущество в исполнении пиксельных шейдеров минимально, и это ожидаемый результат: простор для аппаратной оптимизации на этом поприще значительно уже, чем в случае вершинных шейдеров (если не затрагивать простое увеличение числа конвейеров закраски, которое не имеет смысла из-за ограничений на пропускную способность памяти).

Спрайты



В этой области NV25 значительно опережает NV20 на равной частоте. В маленьких разрешениях наибольший вклад в этот тест вносит скорость геометрической обработки, а в средних все встает на свои места. В принципе — нельзя говорить о четком преимуществе NV25 над R200 или наоборот, на штатных частотах разница минимальна. Как бы там ни было — работа над ошибками (в отношении того, что наблюдалось ранее у NV20) налицо. Следует отметить и возросшие возможности по масштабированию спрайтов (см. ранее таблицу с параметрами чипов).

Итак, подведем первый промежуточный итог. По сумме синтетических тестов карта NVIDIA GeForce4 Ti 4600 выходит очевидным, "четким" победителем. Что, впрочем, от нее и ожидалось — удивительно, если бы разница в полгода не сказалась именно таким образом. Однако не будем забывать, что только результаты реальных приложений позволят нам судить об общей сбалансированности этого чипа. Оставайтесь с нами.

3D-графика, 3DMark2001 — игровые тесты



3DMark2001, 3DMARKS





На основании общих "марков" можно отметить, что GeForce4 обгоняет своего предшественника более, чем на 30%. Интересно отметить, что RADEON 8500 утратил былое яркое преимущество над GeForce3 Ti 500 по общему "зачету" в 3DMark2001. А теперь посмотрим более подробно.

Как известно, в состав 3DMark2001 входит 4 игровых теста, 3 из которых присутствуют в 2-х вариантах: так называемой низкой и высокой детализации графики. Высокая детализация в этих тестах сводится, в основном, к усилению нажима на процессор и видеоускоритель дополнительными эффектами и повышением полигональной сложности сцен. Однако движок этих тестов сделан таким образом, что высокий уровень детализации в игровых тестах приводит к "упиранию" в частоту CPU в случае очень производительного ускорителя. Что мы, к сожалению, и наблюдали (в достаточно жесткой форме) на примере результатов GeForce 4. Мы были вынуждены исключить High Detail тесты из нашего рассмотрения в данном материале. Надеемся, что обновленная версия 3D Mark, которая, по слухам, готовится к выходу, разрешит эту проблему.

3DMark2001, Game1 Low details





Боевой авто-симулятор, навеянный нетленной антиутопией о войне с роботами (Terminator 1 и 2). Создатели теста утверждают, что эта игровая сцена честным образом тратит процессорное время на расчет физики и поведения объектов, как это сделала бы любая реальная игра. Что ж, это несомненно плюс — мы сможем не только говорить о скорости ускорителя, но и прикинуть, как он покажет себя в будущих играх. Характеристики:

  • Rendered triangles per frame (min/avg/max): 19773/33753/143422
  • Rendered textures per frame with 16 bit textures (min/avg/max): 7.5/8.8/16.5 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 15.1/17.7/30.3 MB
  • Rendered textures per frame with texture compression (min/avg/max): 10.7/12.2/21.0 MB

Превосходство над GeForce3 Ti 500 в разрешении 1600х1200х32 таково: у GeForce4 Ti 4400 — 30.5%, у GeForce4 Ti 4600 — 36.2%.

Что касается сравнения Windows ME и Windows XP, то здесь наблюдается некоторое отставание результатов XP от ME.

3DMark2001, Game2 Low details





Cказочно-историческая фэнтези с драконом, красивой наездницей оного, городом, кораблем и нещадно опаляемыми огнем людьми. Так как жанр этой игры определить сложно, будем считать, что это — аркадная сцена из какой-то 3D Adventure или стратегии. Судя по всему, сцены имеют высокое значение overdraw и достаточно слабую оптимизацию геометрии при выводе. От ускорителя требуется оптимизация работы с Z-буфером. Характеристики:

  • Rendered triangles per frame (min/avg/max): 46159/51440/147828
  • Rendered textures per frame with 16 bit textures (min/avg/max): 8.0/8.8/10.1 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 15.6/17.2/19.8 MB
  • Rendered textures per frame with texture compression (min/avg/max): 9.3/10.9/13.5 MB

Превосходство над GeForce3 Ti 500 в разрешении 1600х1200х32 таково: у GeForce4 Ti 4400 — 27.4%, у GeForce4 Ti 4600 — 38.8%, в 1280х1024х32 — 35.1% и 45.3% cоответственно. Интересно заметить, что в очередной раз пик прироста наблюдается в 1280х1024 (вспомним описанные ранее синтетические тесты), и затем спадает в 1600х1200.

Сравнение Windows ME vs Windows XP в этом тесте показало, что у ATI RADEON 8500 производительность в обеих ОС равна, а у NVIDIA-карт чуть-чуть выше у второй.

3DMark2001, Game3 Low details





Сцена навеяна "Mатрицей". Надо отметить, что детальность самих моделей невысока — где-то на уровне Quake2. Судя по всему, присутствует скининг (матричный блендинг) и скелетная анимация. В активе — детальные текстуры и огромное количество всяческих гильз, осколков и прочих мелочей, они значительно нагружают ускоритель. Назовем этот жанр киношутером. Характеристики:

  • Rendered triangles per frame (min/avg/max): 16681/21746/39890
  • Rendered textures per frame with 16 bit textures (min/avg/max): 2.8/4.1/4.7 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 5.7/8.2/9.4 MB
  • Rendered textures per frame with texture compression (min/avg/max): 5.0/7.2/8.4 MB

Превосходство над GeForce3 Ti 500 в разрешении 1600х1200х32 таково: у GeForce4 Ti 4400 — 19.3%, у GeForce4 Ti 4600 — 29.1%.

Сравнение Windows ME vs Windows XP в этом тесте показало, что у всех карт производительность чуть-чуть выше под первой — ME.

3DMark2001, Game4





Безусловно, это самый красивый из всех игровых тестов. Главная его особенность, что он использует пиксельные шейдеры, вершинные шейдеры и кубическое текстурирование для формирования водных поверхностей (кроме быстро бегущей речки). Поэтому лицезреть эту игру во всей красе можно пока только на GeForce3/4 и RADEON 8500 (в демо-режиме водные поверхности не отображаются). Характеристики:

  • Rendered triangles per frame (min/avg/max): 55601/81714/180938
  • Rendered textures per frame with 16 bit textures (min/avg/max): 14.9/17.4/20.7 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 28.4/33.5/40.0 MB
  • Rendered textures per frame with texture compression (min/avg/max): 28.4/33.5/40.0 MB

Превосходство над GeForce3 Ti 500 в разрешении 1600х1200х32 таково: у GeForce4 Ti 4400 — 25%, у GeForce4 Ti 4600 — 37.5%.

Сравнение Windows ME vs Windows XP в этом тесте показало, что у NVIDIA-карт производительность чуть-чуть выше под первой ME, а у ATI RADEON 8500 она одинаковая под обеими ОС.

3D-графика, игровые тесты

Приступаем к оценке производительности видеокарты в 3D-играх. В качестве инструментария мы использовали:

  • Quake3 Arena v.1.17 (id Software/Activision) — игровой тест, демонстрирующий работу плат в OpenGL с использованием демо-бенчмарка уровня Q3DM9 с огромными текстурами — Quaver;
  • Return to Castle Wolfenstein (id Software/Activision) — игровой тест, демонстрирующий работу плат в OpenGL с использованием демо-бенчмарка Checkpoint;
  • Serious Sam v.1.05 (Croteam/God Games) — игровой тест, демонстрирующий работу плат в OpenGL с использованием демо-бенчмарка Karnak demo;
  • GLMark (Vulpine) — синтетический тест, демонстрирующий работу плат в OpenGL с использованием возможностей GeForce3 (это единственный тест — исключение из игровых программ);
  • AquaMark v.2.2 (Massive Development) — игровой тест, демонстрирующий работу плат в DirectX 8.1 с использованием пиксельных шейдеров;
  • Giants: Citizen Kabuto (Planet Moon Studios/Digital Mayhem/Interplay) — игровой тест, демонстрирующий работу платы в Direct3D с использованием демо-бенчмарка gamegauge.

Quake3 Arena

Quaver, режимы максимального качества

Тестирование на примере Quaver проводилось в режиме 16- и 32-битного цветов при максимально возможной детализации и с усилением сложности геометрии (r_subdivisions "1" r_lodCurveError "30000"). Этот бенчмарк очень нагружает акселераторы не только геометрией, но и огромным объемом текстур, а также массовостью эффектов.

Pentium 4 2100







Athlon XP 1800+

Эти тесты нам продемонстрировали производительность новинок в 16-, 32-битном цвете, а также падение скорости при переходе от 16- к 32-битному цвету, где прекрасно видно, что 16-битный цвет заслуженно нами отправлен в историю при рассмотрении видеокарт даже уровня GeForce3 Ti. Обратите внимание на то, что специально заторможенная нами до частот Ti 500 (d/c 240/500 MHz) GeForce4 показывает значительно более высокую производительность, чем Ti 500, что свидетельствует о том, что GeForce4 — не просто увеличение диапазона рабочих частот предыдущего продукта, но и значительная оптимизация различных блоков (о чем мы писали вначале).

Также хочу заметить, что мы разогнали ATI RADEON 8500 до уровня предполагаемых частот следующей ревизии этой карты (если она всетаки будет) — 300/300 (600) МГц. Отлично видно, что этот чип такой прирост частот не спасает.



На этой диаграмме хорошо видно, что оба производителя видеочипсетов потрудились над OpenGL ICD, сравняв производительность Windows XP c Windows ME, а драйверы NVIDIA для Windows XP демонстрируют даже более высокую скорость.

Думаю, что оценка производительности GeForce4 не нуждается в комментариях, в 1280х1024х32 мы видим превосходство над GeForce3 Ti 500 у GeForce4 Ti 4400 в 20.3%; у GeForce4 Ti 4600 — 24.3%. В 1600х1200х32 соответственно - 26.5% и 33.3%. Замечу, что частота чипа выросла с 240 до 300 МГц, что составляет 25%.