NVIDIA GeForce4 Ti 4400 и GeForce4 Ti 4600 (NV25)
или "Опять двадцать пять"
3D-графика, 3DMark2001 — синтетические тесты
Скорость закраски
Мы измеряли этот параметр только для 32 битной глубины цвета:
![](images/gf4/3dm-fillrate-single.png)
NV25 вновь лидер (на что несколько ранее уже намекал нам EMBM тест из раздела DX SDK). Особенно
интересно наглядно сравнить эффективность закраски в исполнении NV25, установленного на штатную
частоту Ti500 (240/500). Налицо заметный прирост, а, следовательно, и наличие архитектурной оптимизации
конвейера закраски и контроллера памяти. Напомним, что теоретические пределы для данного теста
составляют 960 миллионов пикселей в секунду для Ti 500, 1100 для RADEON 8500 и 1200 для Ti 4600
соответственно. На сей раз архитектура NV25 достигла сравнимой с R200 степени приближения к
теоретическому максимуму филрэйта, исправив небольшое отставание NV20 в этом вопросе. В какой
раз мы убеждаемся в целенаправленной и эффективной "работе над ошибками", проделанной специалистами
из NVIDIA. Не забываем, что, несмотря на ту же самую технологию производства и лишь незначительно
возросшее число транзисторов, NV25 существенно превосходит NV20 как по предельной рабочей частоте, так
и по эффективности работы на равных частотах. Редкий случай, когда удалось и рыбку съесть, и
ничего не уколоть (прозрачный намек в сторону производителей центральных процессоров).
![](images/gf4/3dm-fillrate-multi.png)
В случае нескольких текстур чипы еще немного приблизились к теоретическому пределу, сохранив общую картину взаимного расположения. Наибольший результат этого теста всегда достигается при максимальном разрешении — здесь чипу остается только красить, красить и еще раз красить бескрайние поля экрана.
Сцена с большим количеством полигонов
На этом тесте особое внимание следует уделить минимальному разрешению — именно там зависимость от
закраски практически нивелируется:
![](images/gf4/3dm-1light.png)
При наличии одного источника света NV25 показывает себя абсолютным лидером. Его результат не только
значительно (более, чем на разницу частот) превосходит Ti 500, но и (что более важно) вплотную
приблизился к значению практического предела пропускной способности по треугольникам, полученному ранее
с помощью Optimized Mesh из DX8.1 SDK. Еще одно свидетельство мощи двойного T&L NV25 и прекрасного
баланса всей архитектуры чипа. Общий прирост эффективности, достигнутый благодаря появлению второго
шейдерного блока, можно наблюдать, сравнив результаты NV25 и NV20 на одинаковой частоте (более чем
в полтора раза!). Впрочем, не будем умалять достоинств R200, также приблизившегося к предельной
цифре, полученной в тесте из SDK, но значительно отстающего по абсолютным значениям, несмотря на близкую к
NV25 частоту ядра.
![](images/gf4/3dm-8light.png)
В случае 8 источников света R200 немного реабилитирует себя: с ростом числа источников его производительность падает чуть более медленно чем у NV20 и NV25. Но абсолютное лидерство по-прежнему за NVIDIA.
Рельефное текстурирование
Посмотрим на результаты синтетической EMBM сцены:
![](images/gf4/3dm-embm.png)
Наибольшее отношение собственно к EMBM результаты этого теста имеют в высоких разрешениях, в 800х600
все определяет зависимость от геометрии. Интересно, что на одинаковой частоте собственно EMBM
выполняется NV25 чуть медленнее NV20 — вероятно, это расплата за оптимизацию конвейера закраски,
гораздо более эффективного при обыкновенной закраске и, особенно, при использовании MSAA (об этом далее).
А теперь DP3 рельеф:
![](images/gf4/3dm-dot3.png)
Здесь все встает на свои места и никаких досадных исключений из общей победоносности NV25 не возникает.
Вершинные шейдеры
Мы приводим результаты этого теста в нескольких разрешениях. Читатель легко подметит интересную
зависимость:
![](images/gf4/3dm-vertex.png)
С ростом разрешения R200 стремительно сдает свои позиции, упираясь в недостаточную эффективность закраски, в то время как скорость NV25 падает существенно медленнее. Кроме того, вновь четко выражено архитектурное преимущество двойного T&L NV25 над NV20 на одинаковой частоте.
Пиксельный шейдер
Руководствуясь высказанными выше соображениями о том, что слишком малые разрешения "упираются" в
геометрию, а слишком большие — в пропускную полосу памяти, обратим основное внимание на 1024х768
и 1280х1024:
![](images/gf4/3dm-pixel.png)
Картина вполне узнаваема: NV25 вновь на коне, в том числе и на равной NV20 частоте. Впрочем, архитектурное преимущество в исполнении пиксельных шейдеров минимально, и это ожидаемый результат: простор для аппаратной оптимизации на этом поприще значительно уже, чем в случае вершинных шейдеров (если не затрагивать простое увеличение числа конвейеров закраски, которое не имеет смысла из-за ограничений на пропускную способность памяти).
Спрайты
![](images/gf4/3dm-sprites.png)
В этой области NV25 значительно опережает NV20 на равной частоте. В маленьких разрешениях наибольший вклад в этот тест вносит скорость геометрической обработки, а в средних все встает на свои места. В принципе — нельзя говорить о четком преимуществе NV25 над R200 или наоборот, на штатных частотах разница минимальна. Как бы там ни было — работа над ошибками (в отношении того, что наблюдалось ранее у NV20) налицо. Следует отметить и возросшие возможности по масштабированию спрайтов (см. ранее таблицу с параметрами чипов).
Итак, подведем первый промежуточный итог. По сумме синтетических тестов карта NVIDIA GeForce4 Ti 4600 выходит очевидным, "четким" победителем. Что, впрочем, от нее и ожидалось — удивительно, если бы разница в полгода не сказалась именно таким образом. Однако не будем забывать, что только результаты реальных приложений позволят нам судить об общей сбалансированности этого чипа. Оставайтесь с нами.
3D-графика, 3DMark2001 — игровые тесты
3DMark2001, 3DMARKS
![](images/gf4/3dm-p4.png)
![](images/gf4/3dm-ath.png)
![](images/gf4/3dm-win.png)
На основании общих "марков" можно отметить, что GeForce4 обгоняет своего предшественника более, чем на 30%. Интересно отметить, что RADEON 8500 утратил былое яркое преимущество над GeForce3 Ti 500 по общему "зачету" в 3DMark2001. А теперь посмотрим более подробно.
Как известно, в состав 3DMark2001 входит 4 игровых теста, 3 из которых присутствуют в 2-х вариантах:
так называемой низкой и высокой детализации графики. Высокая детализация в этих тестах сводится, в основном,
к усилению нажима на процессор и видеоускоритель дополнительными эффектами и повышением полигональной
сложности сцен. Однако движок этих тестов сделан таким образом, что высокий уровень детализации в игровых
тестах приводит к "упиранию" в частоту CPU в случае очень производительного ускорителя. Что
мы, к сожалению, и наблюдали (в достаточно жесткой форме) на примере результатов GeForce 4. Мы были
вынуждены исключить High Detail тесты из нашего рассмотрения в данном материале. Надеемся, что обновленная
версия 3D Mark, которая, по слухам, готовится к выходу, разрешит эту проблему.
3DMark2001, Game1 Low details
![](images/gf4/game1-p4.png)
![](images/gf4/game1-ath.png)
![](images/gf4/game1-win.png)
Боевой авто-симулятор, навеянный нетленной антиутопией о войне с роботами (Terminator 1 и 2). Создатели теста утверждают, что эта игровая сцена честным образом тратит процессорное время на расчет физики и поведения объектов, как это сделала бы любая реальная игра. Что ж, это несомненно плюс — мы сможем не только говорить о скорости ускорителя, но и прикинуть, как он покажет себя в будущих играх. Характеристики:
- Rendered triangles per frame (min/avg/max): 19773/33753/143422
- Rendered textures per frame with 16 bit textures (min/avg/max): 7.5/8.8/16.5 MB
- Rendered textures per frame with 32 bit textures (min/avg/max): 15.1/17.7/30.3 MB
- Rendered textures per frame with texture compression (min/avg/max): 10.7/12.2/21.0 MB
Превосходство над GeForce3 Ti 500 в разрешении 1600х1200х32 таково: у GeForce4 Ti 4400 — 30.5%, у GeForce4 Ti 4600 — 36.2%.
Что касается сравнения Windows ME и Windows XP, то здесь наблюдается некоторое отставание результатов XP от ME.
3DMark2001, Game2 Low details
![](images/gf4/game2-p4.png)
![](images/gf4/game2-ath.png)
![](images/gf4/game2-win.png)
Cказочно-историческая фэнтези с драконом, красивой наездницей оного, городом, кораблем и нещадно опаляемыми огнем людьми. Так как жанр этой игры определить сложно, будем считать, что это — аркадная сцена из какой-то 3D Adventure или стратегии. Судя по всему, сцены имеют высокое значение overdraw и достаточно слабую оптимизацию геометрии при выводе. От ускорителя требуется оптимизация работы с Z-буфером. Характеристики:
- Rendered triangles per frame (min/avg/max): 46159/51440/147828
- Rendered textures per frame with 16 bit textures (min/avg/max): 8.0/8.8/10.1 MB
- Rendered textures per frame with 32 bit textures (min/avg/max): 15.6/17.2/19.8 MB
- Rendered textures per frame with texture compression (min/avg/max): 9.3/10.9/13.5 MB
Превосходство над GeForce3 Ti 500 в разрешении 1600х1200х32 таково: у GeForce4 Ti 4400 — 27.4%, у GeForce4 Ti 4600 — 38.8%, в 1280х1024х32 — 35.1% и 45.3% cоответственно. Интересно заметить, что в очередной раз пик прироста наблюдается в 1280х1024 (вспомним описанные ранее синтетические тесты), и затем спадает в 1600х1200.
Сравнение Windows ME vs Windows XP в этом тесте показало, что у ATI RADEON 8500 производительность в обеих
ОС равна, а у NVIDIA-карт чуть-чуть выше у второй.
3DMark2001, Game3 Low details
![](images/gf4/game3-p4.png)
![](images/gf4/game3-ath.png)
![](images/gf4/game3-win.png)
Сцена навеяна "Mатрицей". Надо отметить, что детальность самих моделей невысока — где-то на уровне Quake2. Судя по всему, присутствует скининг (матричный блендинг) и скелетная анимация. В активе — детальные текстуры и огромное количество всяческих гильз, осколков и прочих мелочей, они значительно нагружают ускоритель. Назовем этот жанр киношутером. Характеристики:
- Rendered triangles per frame (min/avg/max): 16681/21746/39890
- Rendered textures per frame with 16 bit textures (min/avg/max): 2.8/4.1/4.7 MB
- Rendered textures per frame with 32 bit textures (min/avg/max): 5.7/8.2/9.4 MB
- Rendered textures per frame with texture compression (min/avg/max): 5.0/7.2/8.4 MB
Превосходство над GeForce3 Ti 500 в разрешении 1600х1200х32 таково: у GeForce4 Ti 4400 — 19.3%, у GeForce4 Ti 4600 — 29.1%.
Сравнение Windows ME vs Windows XP в этом тесте показало, что у всех карт производительность чуть-чуть
выше под первой — ME.
3DMark2001, Game4
![](images/gf4/game4-p4.png)
![](images/gf4/game4-ath.png)
![](images/gf4/game4-win.png)
Безусловно, это самый красивый из всех игровых тестов. Главная его особенность, что он использует пиксельные шейдеры, вершинные шейдеры и кубическое текстурирование для формирования водных поверхностей (кроме быстро бегущей речки). Поэтому лицезреть эту игру во всей красе можно пока только на GeForce3/4 и RADEON 8500 (в демо-режиме водные поверхности не отображаются). Характеристики:
- Rendered triangles per frame (min/avg/max): 55601/81714/180938
- Rendered textures per frame with 16 bit textures (min/avg/max): 14.9/17.4/20.7 MB
- Rendered textures per frame with 32 bit textures (min/avg/max): 28.4/33.5/40.0 MB
- Rendered textures per frame with texture compression (min/avg/max): 28.4/33.5/40.0 MB
Превосходство над GeForce3 Ti 500 в разрешении 1600х1200х32 таково: у GeForce4 Ti 4400 — 25%, у GeForce4 Ti 4600 — 37.5%.
Сравнение Windows ME vs Windows XP в этом тесте показало, что у NVIDIA-карт производительность чуть-чуть выше под первой ME, а у ATI RADEON 8500 она одинаковая под обеими ОС.
3D-графика, игровые тесты
Приступаем к оценке производительности видеокарты в 3D-играх. В качестве инструментария мы использовали:
- Quake3 Arena v.1.17
(id Software/Activision) игровой тест, демонстрирующий работу плат в OpenGL с использованиемдемо-бенчмарка уровня Q3DM9 с огромнымитекстурами Quaver; - Return to Castle Wolfenstein
(id Software/Activision) игровой тест, демонстрирующий работу плат в OpenGL с использованиемдемо-бенчмарка Checkpoint; - Serious Sam v.1.05 (Croteam/God Games) игровой тест, демонстрирующий работу плат в OpenGL с
использованием
демо-бенчмарка Karnak demo; - GLMark (Vulpine) синтетический тест, демонстрирующий работу плат в OpenGL с использованием возможностей GeForce3 (это единственный тест — исключение из игровых программ);
- AquaMark v.2.2 (Massive Development) игровой тест, демонстрирующий работу плат в DirectX 8.1 с использованием пиксельных шейдеров;
-
Giants: Citizen Kabuto (Planet Moon Studios/Digital Mayhem/Interplay) игровой тест, демонстрирующий работу платы в Direct3D с использованиемдемо-бенчмарка gamegauge.
Quake3 Arena
Quaver, режимы максимального качества
Тестирование на примере Quaver проводилось в режиме 16- и
Pentium 4 2100
![](images/gf4/q3-16.png)
![](images/gf4/q3-32.png)
![](images/gf4/q3-ph.png)
Athlon XP 1800+
![](images/gf4/q3-ath.png)
Эти тесты нам продемонстрировали производительность новинок в 16-, 32-битном цвете, а также падение скорости при переходе от 16- к 32-битному цвету, где прекрасно видно, что 16-битный цвет заслуженно нами отправлен в историю при рассмотрении видеокарт даже уровня GeForce3 Ti. Обратите внимание на то, что специально заторможенная нами до частот Ti 500 (d/c 240/500 MHz) GeForce4 показывает значительно более высокую производительность, чем Ti 500, что свидетельствует о том, что GeForce4 — не просто увеличение диапазона рабочих частот предыдущего продукта, но и значительная оптимизация различных блоков (о чем мы писали вначале).
Также хочу заметить, что мы разогнали ATI RADEON 8500 до уровня предполагаемых частот следующей ревизии этой
карты (если она всетаки будет) — 300/300 (600) МГц. Отлично видно, что этот чип такой прирост частот не спасает.
![](images/gf4/q3-p4-win.png)
![](images/gf4/q3-ath-win.png)
На этой диаграмме хорошо видно, что оба производителя видеочипсетов потрудились над OpenGL ICD, сравняв производительность Windows XP c Windows ME, а драйверы NVIDIA для Windows XP демонстрируют даже более высокую скорость.
Думаю, что оценка производительности GeForce4 не нуждается в комментариях, в 1280х1024х32 мы видим превосходство
над GeForce3 Ti 500 у GeForce4 Ti 4400 в 20.3%; у GeForce4 Ti 4600 — 24.3%. В 1600х1200х32 соответственно -
26.5% и 33.3%. Замечу, что частота чипа выросла с 240 до 300 МГц, что составляет 25%.
Дополнительно |
|