ATI RADEON 9800 PRO 128MB
но и оптимизация драйверов с F-buffer-ом…"
СОДЕРЖАНИЕ
- Общие сведения
- Особенности видеокарты ATI RADEON 9800 PRO 128MB
- Конфигурации тестовых стендов и особенности настроек драйверов
- Результаты тестов: коротко о 2D
- Синтетические тесты RightMark3D: идеология и описание тестов
- Результаты тестов: RightMark3D: Pixel Filling
- Результаты тестов: RightMark3D: Geometry Processing Speed
- Результаты тестов: RightMark3D: Hidden Surface Removal
- Результаты тестов: RightMark3D: Pixel Shading
- Результаты тестов: RightMark3D: Point Sprites
- Результаты тестов: Синтетические тесты 3DMark2001 SE
- Выводы из результатов синтетических тестов
- Результаты тестов: Игровые тесты 3DMark2001 SE: Game1
- Результаты тестов: Игровые тесты 3DMark2001 SE: Game2
- Результаты тестов: Игровые тесты 3DMark2001 SE: Game3
- Результаты тестов: Игровые тесты 3DMark2001 SE: Game4
- Результаты тестов: Игровые тесты 3DMark03: Game1
- Результаты тестов: Игровые тесты 3DMark03: Game2
- Результаты тестов: Игровые тесты 3DMark03: Game3
- Результаты тестов: Игровые тесты 3DMark03: Game4
- Результаты тестов: Quake3 ARENA
- Результаты тестов: Serious Sam: The Second Encounter
- Результаты тестов: Return to Castle Wolfenstein
- Результаты тестов: Code Creatures DEMO
- Результаты тестов: Unreal Tournament 2003 DEMO
- Результаты тестов: AquaMark
- Результаты тестов: RightMark 3D
- Результаты тестов: DOOM III Alpha version
- Качество 3D
- Выводы
Результаты практического тестирования
Приведем и прокомментируем данные, полученные нами на бюджетных и мэйнстрим ускорителях двух "основных" в данный момент семейств (ATI и NVIDIA).
- ATI:
- RADEON 9700 PRO 128 Mb
- RADEON 9800 PRO 128 Mb
- NVIDIA:
- GeForce FX 5800 Ultra 128MB
Pixel Filling
- В виду того, что все последние драйверы Catalyst (3.1 и старше) вкупе с нашим синтетическим
тестом выдают на некоторых продуктах ATI странные, очевидно заниженные, результаты, видимо из за неуспешной
попытки оптимизировать работу этого теста на режимах с выборкой значений текстур, мы не приводим
результатов Pixel Filling с текстурами для RADEON и ограничимся только вариантом теста без наложения текстур:
…совершенно очевидно, что в этом тесте разница результатов заключается сугубо в различии тактовых частот RADEON 9700 и RADEON 9800. Еще раз отметим преимущество чипов ATI в режимах с закраской цвета, возникшее, несмотря на более низкие тактовые частоты, благодаря наличию 8 пиксельных конвейеров (NV30 имеет 4 конвейера) и достаточной для этого ПСП 256-битной локальной шины памяти.
Продукт Теоретический максимум, млн.текселей в сек. Полученный максимум, млн.текселей в сек. RADEON 9700 PRO 2600 2335 RADEON 9800 PRO 3000 2546 GeForce FX 5800 Ultra 2000 1995 Как видно из этой таблицы, NVIDIA ближе всего подобралась к теоретическому пределу, но и продукты ATI не особенно отстают от своего потенциального потолка, разве что RADEON 9700 PRO мог бы продемонстрировать более высокие результаты, но сдерживающим фактором видимо стала пропускная полоса памяти.
Geometry Processing Speed
Займемся исследованием геометрической производительности ускорителей.
- Производительность фиксированного TCL (производительность эмулирующего его шейдера):
В случае фиксированного TCL картина вполне ожидаемая, разница производительности соответствует разнице частот.
- Теперь обратимся к вершинным шейдерам 1.1:
в случае шейдеров версии 1.1 тоже самое
- Шейдеры 2.0 с циклами:
А вот в области шейдеров 2.0 нас ожидает приятный сюрприз! ATI выполнила обещания по оптимизации производительности вторых шейдеров вообще и циклов в них в частности получен заметный, похвальный прирост, на некоторых сложных шейдерах достигающий почти двукратного значения! Скорее всего, прирост кроется не столько в железе, сколько в драйверах и позже, по мере выхода следующих версий наверняка распространится на семейство RADEON 9700. Так что его владельцам не стоит переживать по этому поводу. А пока эти оптимизации включены только на R350, и таким образом, видимо, призваны "наглядно символизировать" преимущества R350 над R300 для не слишком вникающих в детали энтузиастов.
Однако, есть вероятность (хотя и небольшая) что низкая производительность вторых вершинных шейдеров была следствием и соответственно могла быть исправлена на уровне железа, в скором времени мы выясним этот вопрос.
Итак, с новыми драйверами R350 получил в этом тесте заметное преимущество над NV30. Вторые шейдеры догнали по производительности первые теперь циклы стали действительно практически бесплатными. Роль оптимизации драйверов (а именно компилятора и оптимизатора микрокода шейдеров) видна здесь как никогда хорошо почти двукратный прирост это очень и очень много. Интересно, готовит ли NVIDIA подобные сюрпризы, как это уже не раз бывало?
- Проверим перекрестную зависимость от степени детализации геометрии и сложности шейдера:
Баланс производительности в зависимости от сложности сцены практически не изменился видимо размеры и алгоритмы вершинных очередей и КЭШей остались прежними.
Hidden Surface Removal
- Посмотрим на эффективность HSR в различных разрешениях на сложной сцене (без текстур и с текстурами):
и в том и в другом случае отличий практически не наблюдается, небольшое различие вызвано (видимо) побочными эффектами следствием разницы частот. Любое изменение алгоритма HSR или его эффективности, несомненно, дало бы куда как более наглядную разницу.
- Теперь посмотрим на зависимость эффективности HSR от сложности сцены (без текстур и с текстурой):
Как и ранее, в обзоре RADEON 9700 PRO, мы констатируем, что одноуровневый HSR NVIDIA предпочитает простые сцены, в то время как иерархический алгоритм ATI получает максимальное преимущество на сценах средней сложности, но наличие текстур уравнивает эти подходы, как в смысле характера закономерности, так и чуть более сближает их по эффективности. В идеальном пределе HSR алгоритм NVIDIA менее эффективен, но в реальной работе наличие текстур и раннего Z отсечения делает эту разницу не столь вопиющей.
Pixel Shading
- Посмотрим, не изменилась ли производительность пиксельных процессоров R350 по сравнению с R300:
…ничего неожиданного рост производительности R350 в вопросе вторых пиксельных шейдеров опять хорошо соответствует росту тактовой частоты его ядра. В результате, проигрыш флагмана NVIDIA NV30 только усиливается.
Point Sprites
- Теперь спрайты (без освещения и с освещением):
Разница слегка превышает разницу в частотах это следствие оптимизации вторых вершинных шейдеров. Теперь, в отличие от R300, NV30 проигрывает во всех режимах.
3D-графика, 3DMark2001 SE синтетические тесты
Подчеркну, что все замеры по всем 3D-тестам проводились в 32-битной глубине цвета.
Скорость закраски
![](images/r9800pro/3dm-fillrate-single.png)
В случае мультитекстурирования:
![](images/r9800pro/3dm-fillrate-multi.png)
…никаких сюрпризов R350 и R300 расположились согласно разнице тактовых частот. В режиме мультитекстурирования NV30 лидирует 8 текстурных блоков на более высокой частоте 500 МГц опережают продукты ATI, а в режиме с одной текстурой проигрывает из-за вдвое меньшего числа пиксельных конвейеров.
Пиксельный шейдер
Простой вариант:
![](images/r9800pro/3dm-pixel.png)
На высоком разрешении заметен существенный прирост результатов. Но, мы проверили ранее (с помощью синтетики RightMark 3D) производительность пиксельных шейдеров она не изменилась, точнее, изменилась точно на разницу частот. Значит, дело в чем-то другом.
Возможно, что это еще одна оптимизация новых драйверов ATI работающая только с R350 на сей раз в области пиксельных шейдеров и только под этот конкретный тест.
Посмотрим, изменится ли картина при условии более вычислительно интенсивных пиксельных шейдеров:
![](images/r9800pro/3dm-advpixel.png)
Здесь все в хорошем соответствии с разницей частот, т.е. этот результаты этого теста можно признать более-менее адекватными.
Вершинные шейдеры
![](images/r9800pro/3dm-vertex.png)
И вновь вполне ожидаемые результаты.
Итак, за исключением отдельных моментов результаты 3D Mark 2001 хорошо согласуются с полученными ранее результатами RightMark 3D, хотя и несут изначально меньше информации ввиду отсутствия каких либо настроек параметров синтетических тестов.
Выводы из результатов синтетических тестов
Итак, подведем краткий итог по детальному исследованию различных блоков R350 с помощью синтетических тестов.
- Каких либо существенных архитектурных отличий не обнаружено. Можно относиться к R350 как к R300 с увеличенной тактовой частотой ядра, усиленной оптимизацией работы с двусторонним буфером шаблонов, которая возможно даст о себе знать в DOOM III и играх на его основе и потенциальным наличием аппаратной поддержки для F-буфера и длинных пиксельных шейдеров.
- Налицо не очень корректное поведение драйверов ATI в плане включения некоторых новых оптимизаций только на R350 результаты полученные на таких драйверах могут создать ошибочное впечатление о значительном архитектурном преимуществе R350 надо R300 и стимулировать неоправданную покупку первого. Каково же будет удивление новоиспеченного владельца R350, когда через некоторое время выйдут драйверы на сей раз обеспечивающие те же самые приросты и для R300 т.е. сводящие разницу между этими чипами до разницы их тактовых частот, которая собственно не столь велика. И даже если подобные драйверы не выйдут по той или иной причине никогда, все равно остается возможным появление сторонних модификаций и патчей (например в составе RivaTuner) включающих эти оптимизации и на R300. Впрочем, для принятия осторожного решения мы рекомендуем подождать развития событий.
[ Предыдущая часть (1) ]
[ Следующая часть (3) ]
Дополнительно |
|