Дорогие читатели! Редакция сайта iXBT.com обращается к вам с просьбой отключить блокировку рекламы на нашем сайте.
Дорогие читатели,
Редакция сайта iXBT.com обращается к вам с просьбой отключить блокировку рекламы на нашем сайте.
Дело в том, что деньги, которые мы получаем от показа рекламных баннеров, позволяют нам писать статьи и новости, проводить тестирования, разрабатывать методики, закупать специализированное оборудование и поддерживать в рабочем состоянии серверы,
чтобы форум и другие проекты работали быстро и без сбоев.
Мы никогда не размещали навязчивую рекламу и не просили вас кликать по баннерам.
Вашей посильной помощью сайту может быть отсутствие блокировки рекламы.
Приведем и прокомментируем данные, полученные нами на бюджетных и мэйнстрим ускорителях
двух "основных" в данный момент семейств (ATI и NVIDIA).
ATI:
RADEON 9700 PRO 128 Mb
RADEON 9800 PRO 128 Mb
NVIDIA:
GeForce FX 5800 Ultra 128MB
Pixel Filling
В виду того, что все последние драйверы Catalyst (3.1 и старше) вкупе с нашим синтетическим
тестом выдают на некоторых продуктах ATI странные, очевидно заниженные, результаты, видимо из за неуспешной
попытки оптимизировать работу этого теста на режимах с выборкой значений текстур, мы не приводим
результатов Pixel Filling с текстурами для RADEON и ограничимся только вариантом теста без наложения текстур:
…совершенно очевидно, что в этом тесте разница результатов заключается сугубо в различии
тактовых частот RADEON 9700 и RADEON 9800. Еще раз отметим преимущество чипов ATI в режимах с
закраской цвета, возникшее, несмотря на более низкие тактовые частоты, благодаря наличию 8 пиксельных
конвейеров (NV30 имеет 4 конвейера) и достаточной для этого ПСП 256-битной локальной шины памяти.
Продукт
Теоретический максимум, млн.текселей в сек.
Полученный максимум, млн.текселей в сек.
RADEON 9700 PRO
2600
2335
RADEON 9800 PRO
3000
2546
GeForce FX 5800 Ultra
2000
1995
Как видно из этой таблицы, NVIDIA ближе всего подобралась к теоретическому пределу, но и продукты ATI не
особенно отстают от своего потенциального потолка, разве что RADEON 9700 PRO мог бы продемонстрировать более
высокие результаты, но сдерживающим фактором видимо стала пропускная полоса памяти.
Производительность фиксированного TCL (производительность эмулирующего его шейдера):
В случае фиксированного TCL картина вполне ожидаемая, разница производительности соответствует разнице частот.
Теперь обратимся к вершинным шейдерам 1.1:
в случае шейдеров версии 1.1 тоже самое
Шейдеры 2.0 с циклами:
А вот в области шейдеров 2.0 нас ожидает приятный сюрприз! ATI выполнила обещания по оптимизации
производительности вторых шейдеров вообще и циклов в них в частности получен заметный, похвальный
прирост, на некоторых сложных шейдерах достигающий почти двукратного значения! Скорее всего, прирост кроется
не столько в железе, сколько в драйверах и позже, по мере выхода следующих версий наверняка распространится
на семейство RADEON 9700. Так что его владельцам не стоит переживать по этому поводу. А пока эти
оптимизации включены только на R350, и таким образом, видимо, призваны "наглядно символизировать" преимущества
R350 над R300 для не слишком вникающих в детали энтузиастов.
Однако, есть вероятность (хотя и небольшая) что низкая производительность вторых вершинных шейдеров
была следствием и соответственно могла быть исправлена на уровне железа, в скором времени мы выясним
этот вопрос.
Итак, с новыми драйверами R350 получил в этом тесте заметное преимущество над NV30. Вторые шейдеры догнали
по производительности первые теперь циклы стали действительно практически бесплатными. Роль оптимизации
драйверов (а именно компилятора и оптимизатора микрокода шейдеров) видна здесь как никогда хорошо почти
двукратный прирост это очень и очень много. Интересно, готовит ли NVIDIA подобные сюрпризы, как это уже
не раз бывало?
Проверим перекрестную зависимость от степени детализации геометрии и сложности шейдера:
Баланс производительности в зависимости от сложности сцены практически не изменился видимо
размеры и алгоритмы вершинных очередей и КЭШей остались прежними.
Hidden Surface Removal
Посмотрим на эффективность HSR в различных разрешениях на сложной сцене (без текстур и с текстурами):
и в том и в другом случае отличий практически не наблюдается, небольшое различие вызвано (видимо) побочными
эффектами следствием разницы частот. Любое изменение алгоритма HSR или его эффективности, несомненно,
дало бы куда как более наглядную разницу.
Теперь посмотрим на зависимость эффективности HSR от сложности сцены (без текстур и с текстурой):
Как и ранее, в обзоре RADEON 9700 PRO, мы констатируем, что одноуровневый HSR NVIDIA предпочитает
простые сцены, в то время как иерархический алгоритм ATI получает максимальное преимущество на сценах средней
сложности, но наличие текстур уравнивает эти подходы, как в смысле характера закономерности, так и чуть
более сближает их по эффективности. В идеальном пределе HSR алгоритм NVIDIA менее эффективен, но в
реальной работе наличие текстур и раннего Z отсечения делает эту разницу не столь вопиющей.
Pixel Shading
Посмотрим, не изменилась ли производительность пиксельных процессоров R350 по сравнению с R300:
…ничего неожиданного рост производительности R350 в вопросе вторых пиксельных шейдеров опять
хорошо соответствует росту тактовой частоты его ядра. В результате, проигрыш флагмана NVIDIA NV30 только
усиливается.
Point Sprites
Теперь спрайты (без освещения и с освещением):
Разница слегка превышает разницу в частотах это следствие оптимизации вторых вершинных шейдеров. Теперь,
в отличие от R300, NV30 проигрывает во всех режимах.
3D-графика, 3DMark2001 SE синтетические тесты
Подчеркну, что все замеры по всем 3D-тестам проводились в 32-битной глубине цвета.
Скорость закраски
В случае мультитекстурирования:
…никаких сюрпризов R350 и R300 расположились согласно разнице тактовых частот. В режиме
мультитекстурирования NV30 лидирует 8 текстурных блоков на более высокой частоте 500 МГц опережают
продукты ATI, а в режиме с одной текстурой проигрывает из-за вдвое меньшего числа пиксельных конвейеров.
Пиксельный шейдер
Простой вариант:
На высоком разрешении заметен существенный прирост результатов. Но, мы проверили ранее (с помощью
синтетики RightMark 3D) производительность пиксельных шейдеров она не изменилась, точнее, изменилась
точно на разницу частот. Значит, дело в чем-то другом.
Возможно, что это еще одна оптимизация новых драйверов ATI работающая только с R350 на сей раз в области
пиксельных шейдеров и только под этот конкретный тест.
Посмотрим, изменится ли картина при условии более вычислительно интенсивных пиксельных шейдеров:
Здесь все в хорошем соответствии с разницей частот, т.е. этот результаты этого теста можно признать более-менее адекватными.
Вершинные шейдеры
И вновь вполне ожидаемые результаты.
Итак, за исключением отдельных моментов результаты 3D Mark 2001 хорошо согласуются с полученными ранее
результатами RightMark 3D, хотя и несут изначально меньше информации ввиду отсутствия каких либо настроек
параметров синтетических тестов.
Выводы из результатов синтетических тестов
Итак, подведем краткий итог по детальному исследованию различных блоков R350 с помощью синтетических тестов.
Каких либо существенных архитектурных отличий не обнаружено. Можно относиться к R350 как к R300 с
увеличенной тактовой частотой ядра, усиленной оптимизацией работы с двусторонним буфером шаблонов, которая
возможно даст о себе знать в DOOM III и играх на его основе и потенциальным наличием аппаратной
поддержки для F-буфера и длинных пиксельных шейдеров.
Налицо не очень корректное поведение драйверов ATI в плане включения некоторых новых оптимизаций только
на R350 результаты полученные на таких драйверах могут создать ошибочное впечатление о значительном
архитектурном преимуществе R350 надо R300 и стимулировать неоправданную покупку первого. Каково же будет
удивление новоиспеченного владельца R350, когда через некоторое время выйдут драйверы на сей раз
обеспечивающие те же самые приросты и для R300 т.е. сводящие разницу между этими чипами до разницы их
тактовых частот, которая собственно не столь велика. И даже если подобные драйверы не выйдут по той
или иной причине никогда, все равно остается возможным появление сторонних модификаций и
патчей (например в составе RivaTuner) включающих эти оптимизации и на R300. Впрочем, для принятия
осторожного решения мы рекомендуем подождать развития событий.
Приведем и прокомментируем данные, полученные нами на бюджетных и мэйнстрим ускорителях
двух "основных" в данный момент семейств (ATI и NVIDIA).
ATI:
RADEON 9700 PRO 128 Mb
RADEON 9800 PRO 128 Mb
NVIDIA:
GeForce FX 5800 Ultra 128MB
Pixel Filling
В виду того, что все последние драйверы Catalyst (3.1 и старше) вкупе с нашим синтетическим
тестом выдают на некоторых продуктах ATI странные, очевидно заниженные, результаты, видимо из за неуспешной
попытки оптимизировать работу этого теста на режимах с выборкой значений текстур, мы не приводим
результатов Pixel Filling с текстурами для RADEON и ограничимся только вариантом теста без наложения текстур:
…совершенно очевидно, что в этом тесте разница результатов заключается сугубо в различии
тактовых частот RADEON 9700 и RADEON 9800. Еще раз отметим преимущество чипов ATI в режимах с
закраской цвета, возникшее, несмотря на более низкие тактовые частоты, благодаря наличию 8 пиксельных
конвейеров (NV30 имеет 4 конвейера) и достаточной для этого ПСП 256-битной локальной шины памяти.
Продукт
Теоретический максимум, млн.текселей в сек.
Полученный максимум, млн.текселей в сек.
RADEON 9700 PRO
2600
2335
RADEON 9800 PRO
3000
2546
GeForce FX 5800 Ultra
2000
1995
Как видно из этой таблицы, NVIDIA ближе всего подобралась к теоретическому пределу, но и продукты ATI не
особенно отстают от своего потенциального потолка, разве что RADEON 9700 PRO мог бы продемонстрировать более
высокие результаты, но сдерживающим фактором видимо стала пропускная полоса памяти.
Производительность фиксированного TCL (производительность эмулирующего его шейдера):
В случае фиксированного TCL картина вполне ожидаемая, разница производительности соответствует разнице частот.
Теперь обратимся к вершинным шейдерам 1.1:
в случае шейдеров версии 1.1 тоже самое
Шейдеры 2.0 с циклами:
А вот в области шейдеров 2.0 нас ожидает приятный сюрприз! ATI выполнила обещания по оптимизации
производительности вторых шейдеров вообще и циклов в них в частности получен заметный, похвальный
прирост, на некоторых сложных шейдерах достигающий почти двукратного значения! Скорее всего, прирост кроется
не столько в железе, сколько в драйверах и позже, по мере выхода следующих версий наверняка распространится
на семейство RADEON 9700. Так что его владельцам не стоит переживать по этому поводу. А пока эти
оптимизации включены только на R350, и таким образом, видимо, призваны "наглядно символизировать" преимущества
R350 над R300 для не слишком вникающих в детали энтузиастов.
Однако, есть вероятность (хотя и небольшая) что низкая производительность вторых вершинных шейдеров
была следствием и соответственно могла быть исправлена на уровне железа, в скором времени мы выясним
этот вопрос.
Итак, с новыми драйверами R350 получил в этом тесте заметное преимущество над NV30. Вторые шейдеры догнали
по производительности первые теперь циклы стали действительно практически бесплатными. Роль оптимизации
драйверов (а именно компилятора и оптимизатора микрокода шейдеров) видна здесь как никогда хорошо почти
двукратный прирост это очень и очень много. Интересно, готовит ли NVIDIA подобные сюрпризы, как это уже
не раз бывало?
Проверим перекрестную зависимость от степени детализации геометрии и сложности шейдера:
Баланс производительности в зависимости от сложности сцены практически не изменился видимо
размеры и алгоритмы вершинных очередей и КЭШей остались прежними.
Hidden Surface Removal
Посмотрим на эффективность HSR в различных разрешениях на сложной сцене (без текстур и с текстурами):
и в том и в другом случае отличий практически не наблюдается, небольшое различие вызвано (видимо) побочными
эффектами следствием разницы частот. Любое изменение алгоритма HSR или его эффективности, несомненно,
дало бы куда как более наглядную разницу.
Теперь посмотрим на зависимость эффективности HSR от сложности сцены (без текстур и с текстурой):
Как и ранее, в обзоре RADEON 9700 PRO, мы констатируем, что одноуровневый HSR NVIDIA предпочитает
простые сцены, в то время как иерархический алгоритм ATI получает максимальное преимущество на сценах средней
сложности, но наличие текстур уравнивает эти подходы, как в смысле характера закономерности, так и чуть
более сближает их по эффективности. В идеальном пределе HSR алгоритм NVIDIA менее эффективен, но в
реальной работе наличие текстур и раннего Z отсечения делает эту разницу не столь вопиющей.
Pixel Shading
Посмотрим, не изменилась ли производительность пиксельных процессоров R350 по сравнению с R300:
…ничего неожиданного рост производительности R350 в вопросе вторых пиксельных шейдеров опять
хорошо соответствует росту тактовой частоты его ядра. В результате, проигрыш флагмана NVIDIA NV30 только
усиливается.
Point Sprites
Теперь спрайты (без освещения и с освещением):
Разница слегка превышает разницу в частотах это следствие оптимизации вторых вершинных шейдеров. Теперь,
в отличие от R300, NV30 проигрывает во всех режимах.
3D-графика, 3DMark2001 SE синтетические тесты
Подчеркну, что все замеры по всем 3D-тестам проводились в 32-битной глубине цвета.
Скорость закраски
В случае мультитекстурирования:
…никаких сюрпризов R350 и R300 расположились согласно разнице тактовых частот. В режиме
мультитекстурирования NV30 лидирует 8 текстурных блоков на более высокой частоте 500 МГц опережают
продукты ATI, а в режиме с одной текстурой проигрывает из-за вдвое меньшего числа пиксельных конвейеров.
Пиксельный шейдер
Простой вариант:
На высоком разрешении заметен существенный прирост результатов. Но, мы проверили ранее (с помощью
синтетики RightMark 3D) производительность пиксельных шейдеров она не изменилась, точнее, изменилась
точно на разницу частот. Значит, дело в чем-то другом.
Возможно, что это еще одна оптимизация новых драйверов ATI работающая только с R350 на сей раз в области
пиксельных шейдеров и только под этот конкретный тест.
Посмотрим, изменится ли картина при условии более вычислительно интенсивных пиксельных шейдеров:
Здесь все в хорошем соответствии с разницей частот, т.е. этот результаты этого теста можно признать более-менее адекватными.
Вершинные шейдеры
И вновь вполне ожидаемые результаты.
Итак, за исключением отдельных моментов результаты 3D Mark 2001 хорошо согласуются с полученными ранее
результатами RightMark 3D, хотя и несут изначально меньше информации ввиду отсутствия каких либо настроек
параметров синтетических тестов.
Выводы из результатов синтетических тестов
Итак, подведем краткий итог по детальному исследованию различных блоков R350 с помощью синтетических тестов.
Каких либо существенных архитектурных отличий не обнаружено. Можно относиться к R350 как к R300 с
увеличенной тактовой частотой ядра, усиленной оптимизацией работы с двусторонним буфером шаблонов, которая
возможно даст о себе знать в DOOM III и играх на его основе и потенциальным наличием аппаратной
поддержки для F-буфера и длинных пиксельных шейдеров.
Налицо не очень корректное поведение драйверов ATI в плане включения некоторых новых оптимизаций только
на R350 результаты полученные на таких драйверах могут создать ошибочное впечатление о значительном
архитектурном преимуществе R350 надо R300 и стимулировать неоправданную покупку первого. Каково же будет
удивление новоиспеченного владельца R350, когда через некоторое время выйдут драйверы на сей раз
обеспечивающие те же самые приросты и для R300 т.е. сводящие разницу между этими чипами до разницы их
тактовых частот, которая собственно не столь велика. И даже если подобные драйверы не выйдут по той
или иной причине никогда, все равно остается возможным появление сторонних модификаций и
патчей (например в составе RivaTuner) включающих эти оптимизации и на R300. Впрочем, для принятия
осторожного решения мы рекомендуем подождать развития событий.