ATI RADEON 9800 PRO 128MB


"9800 — это не только 9700 плюс 100,
но и оптимизация драйверов с F-buffer-ом…"

СОДЕРЖАНИЕ

  1. Общие сведения
  2. Особенности видеокарты ATI RADEON 9800 PRO 128MB
  3. Конфигурации тестовых стендов и особенности настроек драйверов
  4. Результаты тестов: коротко о 2D
  5. Синтетические тесты RightMark3D: идеология и описание тестов
  6. Результаты тестов: RightMark3D: Pixel Filling
  7. Результаты тестов: RightMark3D: Geometry Processing Speed
  8. Результаты тестов: RightMark3D: Hidden Surface Removal
  9. Результаты тестов: RightMark3D: Pixel Shading
  10. Результаты тестов: RightMark3D: Point Sprites
  11. Результаты тестов: Синтетические тесты 3DMark2001 SE
  12. Выводы из результатов синтетических тестов
  13. Результаты тестов: Игровые тесты 3DMark2001 SE: Game1
  14. Результаты тестов: Игровые тесты 3DMark2001 SE: Game2
  15. Результаты тестов: Игровые тесты 3DMark2001 SE: Game3
  16. Результаты тестов: Игровые тесты 3DMark2001 SE: Game4
  17. Результаты тестов: Игровые тесты 3DMark03: Game1
  18. Результаты тестов: Игровые тесты 3DMark03: Game2
  19. Результаты тестов: Игровые тесты 3DMark03: Game3
  20. Результаты тестов: Игровые тесты 3DMark03: Game4
  21. Результаты тестов: Quake3 ARENA
  22. Результаты тестов: Serious Sam: The Second Encounter
  23. Результаты тестов: Return to Castle Wolfenstein
  24. Результаты тестов: Code Creatures DEMO
  25. Результаты тестов: Unreal Tournament 2003 DEMO
  26. Результаты тестов: AquaMark
  27. Результаты тестов: RightMark 3D
  28. Результаты тестов: DOOM III Alpha version
  29. Качество 3D
  30. Выводы

Результаты практического тестирования

Приведем и прокомментируем данные, полученные нами на бюджетных и мэйнстрим ускорителях двух "основных" в данный момент семейств (ATI и NVIDIA).

  • ATI:
    • RADEON 9700 PRO 128 Mb
    • RADEON 9800 PRO 128 Mb
  • NVIDIA:
    • GeForce FX 5800 Ultra 128MB

Pixel Filling

  1. В виду того, что все последние драйверы Catalyst (3.1 и старше) вкупе с нашим синтетическим тестом выдают на некоторых продуктах ATI странные, очевидно заниженные, результаты, видимо из за неуспешной попытки оптимизировать работу этого теста на режимах с выборкой значений текстур, мы не приводим результатов Pixel Filling с текстурами для RADEON и ограничимся только вариантом теста без наложения текстур:

    …совершенно очевидно, что в этом тесте разница результатов заключается сугубо в различии тактовых частот RADEON 9700 и RADEON 9800. Еще раз отметим преимущество чипов ATI в режимах с закраской цвета, возникшее, несмотря на более низкие тактовые частоты, благодаря наличию 8 пиксельных конвейеров (NV30 имеет 4 конвейера) и достаточной для этого ПСП 256-битной локальной шины памяти.


    Продукт Теоретический максимум, млн.текселей в сек. Полученный максимум, млн.текселей в сек.
    RADEON 9700 PRO 2600 2335
    RADEON 9800 PRO 3000 2546
    GeForce FX 5800 Ultra 2000 1995

    Как видно из этой таблицы, NVIDIA ближе всего подобралась к теоретическому пределу, но и продукты ATI не особенно отстают от своего потенциального потолка, разве что RADEON 9700 PRO мог бы продемонстрировать более высокие результаты, но сдерживающим фактором видимо стала пропускная полоса памяти.

Geometry Processing Speed

Займемся исследованием геометрической производительности ускорителей.

  1. Производительность фиксированного TCL (производительность эмулирующего его шейдера):

    В случае фиксированного TCL картина вполне ожидаемая, разница производительности соответствует разнице частот.

  2. Теперь обратимся к вершинным шейдерам 1.1:

    в случае шейдеров версии 1.1 — тоже самое

  3. Шейдеры 2.0 с циклами:

    А вот в области шейдеров 2.0 нас ожидает приятный сюрприз! ATI выполнила обещания по оптимизации производительности вторых шейдеров вообще и циклов в них в частности — получен заметный, похвальный прирост, на некоторых сложных шейдерах достигающий почти двукратного значения! Скорее всего, прирост кроется не столько в железе, сколько в драйверах и позже, по мере выхода следующих версий наверняка распространится на семейство RADEON 9700. Так что его владельцам не стоит переживать по этому поводу. А пока эти оптимизации включены только на R350, и таким образом, видимо, призваны "наглядно символизировать" преимущества R350 над R300 для не слишком вникающих в детали энтузиастов.

    Однако, есть вероятность (хотя и небольшая) что низкая производительность вторых вершинных шейдеров была следствием и соответственно могла быть исправлена на уровне железа, в скором времени мы выясним этот вопрос.

    Итак, с новыми драйверами R350 получил в этом тесте заметное преимущество над NV30. Вторые шейдеры догнали по производительности первые — теперь циклы стали действительно практически бесплатными. Роль оптимизации драйверов (а именно компилятора и оптимизатора микрокода шейдеров) видна здесь как никогда хорошо — почти двукратный прирост это очень и очень много. Интересно, готовит ли NVIDIA подобные сюрпризы, как это уже не раз бывало?

  4. Проверим перекрестную зависимость от степени детализации геометрии и сложности шейдера:


    Баланс производительности в зависимости от сложности сцены практически не изменился — видимо размеры и алгоритмы вершинных очередей и КЭШей остались прежними.

Hidden Surface Removal

  1. Посмотрим на эффективность HSR в различных разрешениях на сложной сцене (без текстур и с текстурами):


    и в том и в другом случае отличий практически не наблюдается, небольшое различие вызвано (видимо) побочными эффектами — следствием разницы частот. Любое изменение алгоритма HSR или его эффективности, несомненно, дало бы куда как более наглядную разницу.

  2. Теперь посмотрим на зависимость эффективности HSR от сложности сцены (без текстур и с текстурой):


    Как и ранее, в обзоре RADEON 9700 PRO, мы констатируем, что одноуровневый HSR NVIDIA предпочитает простые сцены, в то время как иерархический алгоритм ATI получает максимальное преимущество на сценах средней сложности, но наличие текстур уравнивает эти подходы, как в смысле характера закономерности, так и чуть более сближает их по эффективности. В идеальном пределе HSR алгоритм NVIDIA менее эффективен, но в реальной работе наличие текстур и раннего Z отсечения делает эту разницу не столь вопиющей.

Pixel Shading

  1. Посмотрим, не изменилась ли производительность пиксельных процессоров R350 по сравнению с R300:

    …ничего неожиданного — рост производительности R350 в вопросе вторых пиксельных шейдеров опять хорошо соответствует росту тактовой частоты его ядра. В результате, проигрыш флагмана NVIDIA — NV30 только усиливается.

Point Sprites

  1. Теперь спрайты (без освещения и с освещением):


    Разница слегка превышает разницу в частотах — это следствие оптимизации вторых вершинных шейдеров. Теперь, в отличие от R300, NV30 проигрывает во всех режимах.

3D-графика, 3DMark2001 SE — синтетические тесты

Подчеркну, что все замеры по всем 3D-тестам проводились в 32-битной глубине цвета.

Скорость закраски

В случае мультитекстурирования:

…никаких сюрпризов — R350 и R300 расположились согласно разнице тактовых частот. В режиме мультитекстурирования NV30 лидирует — 8 текстурных блоков на более высокой частоте 500 МГц опережают продукты ATI, а в режиме с одной текстурой проигрывает из-за вдвое меньшего числа пиксельных конвейеров.

Пиксельный шейдер

Простой вариант:

На высоком разрешении заметен существенный прирост результатов. Но, мы проверили ранее (с помощью синтетики RightMark 3D) производительность пиксельных шейдеров — она не изменилась, точнее, изменилась точно на разницу частот. Значит, дело в чем-то другом.

Возможно, что это еще одна оптимизация новых драйверов ATI работающая только с R350 — на сей раз — в области пиксельных шейдеров и только под этот конкретный тест.

Посмотрим, изменится ли картина при условии более вычислительно интенсивных пиксельных шейдеров:

Здесь все в хорошем соответствии с разницей частот, т.е. этот результаты этого теста можно признать более-менее адекватными.

Вершинные шейдеры

И вновь вполне ожидаемые результаты.

Итак, за исключением отдельных моментов результаты 3D Mark 2001 хорошо согласуются с полученными ранее результатами RightMark 3D, хотя и несут изначально меньше информации ввиду отсутствия каких либо настроек параметров синтетических тестов.

Выводы из результатов синтетических тестов

Итак, подведем краткий итог по детальному исследованию различных блоков R350 с помощью синтетических тестов.

  1. Каких либо существенных архитектурных отличий не обнаружено. Можно относиться к R350 как к R300 с увеличенной тактовой частотой ядра, усиленной оптимизацией работы с двусторонним буфером шаблонов, которая возможно даст о себе знать в DOOM III и играх на его основе и потенциальным наличием аппаратной поддержки для F-буфера и длинных пиксельных шейдеров.
  2. Налицо не очень корректное поведение драйверов ATI в плане включения некоторых новых оптимизаций только на R350 — результаты полученные на таких драйверах могут создать ошибочное впечатление о значительном архитектурном преимуществе R350 надо R300 и стимулировать неоправданную покупку первого. Каково же будет удивление новоиспеченного владельца R350, когда через некоторое время выйдут драйверы на сей раз обеспечивающие те же самые приросты и для R300 — т.е. сводящие разницу между этими чипами до разницы их тактовых частот, которая собственно не столь велика. И даже если подобные драйверы не выйдут по той или иной причине никогда, все равно остается возможным появление сторонних модификаций и патчей (например в составе RivaTuner) включающих эти оптимизации и на R300. Впрочем, для принятия осторожного решения мы рекомендуем подождать развития событий.

[ Предыдущая часть (1) ]

[ Следующая часть (3) ]





Дополнительно

Обзор ATI RADEON 9800 PRO 128MB

ATI RADEON 9800 PRO 128MB

"9800 — это не только 9700 плюс 100,
но и оптимизация драйверов с F-buffer-ом…"

СОДЕРЖАНИЕ

  1. Общие сведения
  2. Особенности видеокарты ATI RADEON 9800 PRO 128MB
  3. Конфигурации тестовых стендов и особенности настроек драйверов
  4. Результаты тестов: коротко о 2D
  5. Синтетические тесты RightMark3D: идеология и описание тестов
  6. Результаты тестов: RightMark3D: Pixel Filling
  7. Результаты тестов: RightMark3D: Geometry Processing Speed
  8. Результаты тестов: RightMark3D: Hidden Surface Removal
  9. Результаты тестов: RightMark3D: Pixel Shading
  10. Результаты тестов: RightMark3D: Point Sprites
  11. Результаты тестов: Синтетические тесты 3DMark2001 SE
  12. Выводы из результатов синтетических тестов
  13. Результаты тестов: Игровые тесты 3DMark2001 SE: Game1
  14. Результаты тестов: Игровые тесты 3DMark2001 SE: Game2
  15. Результаты тестов: Игровые тесты 3DMark2001 SE: Game3
  16. Результаты тестов: Игровые тесты 3DMark2001 SE: Game4
  17. Результаты тестов: Игровые тесты 3DMark03: Game1
  18. Результаты тестов: Игровые тесты 3DMark03: Game2
  19. Результаты тестов: Игровые тесты 3DMark03: Game3
  20. Результаты тестов: Игровые тесты 3DMark03: Game4
  21. Результаты тестов: Quake3 ARENA
  22. Результаты тестов: Serious Sam: The Second Encounter
  23. Результаты тестов: Return to Castle Wolfenstein
  24. Результаты тестов: Code Creatures DEMO
  25. Результаты тестов: Unreal Tournament 2003 DEMO
  26. Результаты тестов: AquaMark
  27. Результаты тестов: RightMark 3D
  28. Результаты тестов: DOOM III Alpha version
  29. Качество 3D
  30. Выводы

Результаты практического тестирования

Приведем и прокомментируем данные, полученные нами на бюджетных и мэйнстрим ускорителях двух "основных" в данный момент семейств (ATI и NVIDIA).

  • ATI:
    • RADEON 9700 PRO 128 Mb
    • RADEON 9800 PRO 128 Mb
  • NVIDIA:
    • GeForce FX 5800 Ultra 128MB

Pixel Filling

  1. В виду того, что все последние драйверы Catalyst (3.1 и старше) вкупе с нашим синтетическим тестом выдают на некоторых продуктах ATI странные, очевидно заниженные, результаты, видимо из за неуспешной попытки оптимизировать работу этого теста на режимах с выборкой значений текстур, мы не приводим результатов Pixel Filling с текстурами для RADEON и ограничимся только вариантом теста без наложения текстур:

    …совершенно очевидно, что в этом тесте разница результатов заключается сугубо в различии тактовых частот RADEON 9700 и RADEON 9800. Еще раз отметим преимущество чипов ATI в режимах с закраской цвета, возникшее, несмотря на более низкие тактовые частоты, благодаря наличию 8 пиксельных конвейеров (NV30 имеет 4 конвейера) и достаточной для этого ПСП 256-битной локальной шины памяти.


    Продукт Теоретический максимум, млн.текселей в сек. Полученный максимум, млн.текселей в сек.
    RADEON 9700 PRO 2600 2335
    RADEON 9800 PRO 3000 2546
    GeForce FX 5800 Ultra 2000 1995

    Как видно из этой таблицы, NVIDIA ближе всего подобралась к теоретическому пределу, но и продукты ATI не особенно отстают от своего потенциального потолка, разве что RADEON 9700 PRO мог бы продемонстрировать более высокие результаты, но сдерживающим фактором видимо стала пропускная полоса памяти.

Geometry Processing Speed

Займемся исследованием геометрической производительности ускорителей.

  1. Производительность фиксированного TCL (производительность эмулирующего его шейдера):

    В случае фиксированного TCL картина вполне ожидаемая, разница производительности соответствует разнице частот.

  2. Теперь обратимся к вершинным шейдерам 1.1:

    в случае шейдеров версии 1.1 — тоже самое

  3. Шейдеры 2.0 с циклами:

    А вот в области шейдеров 2.0 нас ожидает приятный сюрприз! ATI выполнила обещания по оптимизации производительности вторых шейдеров вообще и циклов в них в частности — получен заметный, похвальный прирост, на некоторых сложных шейдерах достигающий почти двукратного значения! Скорее всего, прирост кроется не столько в железе, сколько в драйверах и позже, по мере выхода следующих версий наверняка распространится на семейство RADEON 9700. Так что его владельцам не стоит переживать по этому поводу. А пока эти оптимизации включены только на R350, и таким образом, видимо, призваны "наглядно символизировать" преимущества R350 над R300 для не слишком вникающих в детали энтузиастов.

    Однако, есть вероятность (хотя и небольшая) что низкая производительность вторых вершинных шейдеров была следствием и соответственно могла быть исправлена на уровне железа, в скором времени мы выясним этот вопрос.

    Итак, с новыми драйверами R350 получил в этом тесте заметное преимущество над NV30. Вторые шейдеры догнали по производительности первые — теперь циклы стали действительно практически бесплатными. Роль оптимизации драйверов (а именно компилятора и оптимизатора микрокода шейдеров) видна здесь как никогда хорошо — почти двукратный прирост это очень и очень много. Интересно, готовит ли NVIDIA подобные сюрпризы, как это уже не раз бывало?

  4. Проверим перекрестную зависимость от степени детализации геометрии и сложности шейдера:


    Баланс производительности в зависимости от сложности сцены практически не изменился — видимо размеры и алгоритмы вершинных очередей и КЭШей остались прежними.

Hidden Surface Removal

  1. Посмотрим на эффективность HSR в различных разрешениях на сложной сцене (без текстур и с текстурами):


    и в том и в другом случае отличий практически не наблюдается, небольшое различие вызвано (видимо) побочными эффектами — следствием разницы частот. Любое изменение алгоритма HSR или его эффективности, несомненно, дало бы куда как более наглядную разницу.

  2. Теперь посмотрим на зависимость эффективности HSR от сложности сцены (без текстур и с текстурой):


    Как и ранее, в обзоре RADEON 9700 PRO, мы констатируем, что одноуровневый HSR NVIDIA предпочитает простые сцены, в то время как иерархический алгоритм ATI получает максимальное преимущество на сценах средней сложности, но наличие текстур уравнивает эти подходы, как в смысле характера закономерности, так и чуть более сближает их по эффективности. В идеальном пределе HSR алгоритм NVIDIA менее эффективен, но в реальной работе наличие текстур и раннего Z отсечения делает эту разницу не столь вопиющей.

Pixel Shading

  1. Посмотрим, не изменилась ли производительность пиксельных процессоров R350 по сравнению с R300:

    …ничего неожиданного — рост производительности R350 в вопросе вторых пиксельных шейдеров опять хорошо соответствует росту тактовой частоты его ядра. В результате, проигрыш флагмана NVIDIA — NV30 только усиливается.

Point Sprites

  1. Теперь спрайты (без освещения и с освещением):


    Разница слегка превышает разницу в частотах — это следствие оптимизации вторых вершинных шейдеров. Теперь, в отличие от R300, NV30 проигрывает во всех режимах.

3D-графика, 3DMark2001 SE — синтетические тесты

Подчеркну, что все замеры по всем 3D-тестам проводились в 32-битной глубине цвета.

Скорость закраски

В случае мультитекстурирования:

…никаких сюрпризов — R350 и R300 расположились согласно разнице тактовых частот. В режиме мультитекстурирования NV30 лидирует — 8 текстурных блоков на более высокой частоте 500 МГц опережают продукты ATI, а в режиме с одной текстурой проигрывает из-за вдвое меньшего числа пиксельных конвейеров.

Пиксельный шейдер

Простой вариант:

На высоком разрешении заметен существенный прирост результатов. Но, мы проверили ранее (с помощью синтетики RightMark 3D) производительность пиксельных шейдеров — она не изменилась, точнее, изменилась точно на разницу частот. Значит, дело в чем-то другом.

Возможно, что это еще одна оптимизация новых драйверов ATI работающая только с R350 — на сей раз — в области пиксельных шейдеров и только под этот конкретный тест.

Посмотрим, изменится ли картина при условии более вычислительно интенсивных пиксельных шейдеров:

Здесь все в хорошем соответствии с разницей частот, т.е. этот результаты этого теста можно признать более-менее адекватными.

Вершинные шейдеры

И вновь вполне ожидаемые результаты.

Итак, за исключением отдельных моментов результаты 3D Mark 2001 хорошо согласуются с полученными ранее результатами RightMark 3D, хотя и несут изначально меньше информации ввиду отсутствия каких либо настроек параметров синтетических тестов.

Выводы из результатов синтетических тестов

Итак, подведем краткий итог по детальному исследованию различных блоков R350 с помощью синтетических тестов.

  1. Каких либо существенных архитектурных отличий не обнаружено. Можно относиться к R350 как к R300 с увеличенной тактовой частотой ядра, усиленной оптимизацией работы с двусторонним буфером шаблонов, которая возможно даст о себе знать в DOOM III и играх на его основе и потенциальным наличием аппаратной поддержки для F-буфера и длинных пиксельных шейдеров.
  2. Налицо не очень корректное поведение драйверов ATI в плане включения некоторых новых оптимизаций только на R350 — результаты полученные на таких драйверах могут создать ошибочное впечатление о значительном архитектурном преимуществе R350 надо R300 и стимулировать неоправданную покупку первого. Каково же будет удивление новоиспеченного владельца R350, когда через некоторое время выйдут драйверы на сей раз обеспечивающие те же самые приросты и для R300 — т.е. сводящие разницу между этими чипами до разницы их тактовых частот, которая собственно не столь велика. И даже если подобные драйверы не выйдут по той или иной причине никогда, все равно остается возможным появление сторонних модификаций и патчей (например в составе RivaTuner) включающих эти оптимизации и на R300. Впрочем, для принятия осторожного решения мы рекомендуем подождать развития событий.

[ Предыдущая часть (1) ]

[ Следующая часть (3) ]