Контрнаступление ATI Technologies:
семейство RADEON X1800 (R520), X1600 (RV530) и X1300 (RV515)
Часть 2: Особенности видеокарт, синтетические тесты
СОДЕРЖАНИЕ
- Часть 1 Теория и архитектура
- Часть 2 Практическое знакомство
- Особенности видеокарт
- Конфигурации стендов, список тестовых инструментов
- Результаты синтетических тестов
Установка и драйверы
Конфигурации тестовых стендов:
- Компьютер на базе Athlon 64 (939Socket)
- процессор AMD Athlon 4000+ (2400MHz) (L2=1024K);
- системная плата ASUS A8N SLI Deluxe на чипсете NVIDIA nForce4 SLI;
- оперативная память 1 GB DDR SDRAM 400MHz (CAS (tCL)=2.5; RAS to CAS delay (tRCD)=3; Row Precharge (tRP)=3; tRAS=6);
- жесткий диск WD Caviar SE WD1600JD 160GB SATA.
- RADEON X850 XT PE (PowerColor RX850XT PE, PCI-E, 256MB GDDR3, 540/1180 MHz);
- GeForce 7800 GTX (ASUS EN7800GTX TOP, PCI-E, 256MB GDDR3, 486/1350 MHz);
- GeForce 7800 GTX (Leadtek WinFast PX7800GTX, PCI-E, 256MB GDDR3, 430/1200 MHz);
- GeForce 7800 GTX (Gainward PowerPack Ultra/3500 GS, PCI-E, 256MB GDDR3, 459/1300 MHz);
- GeForce 7800 GT (Gainward PowerPack Ultra/3400 GS, PCI-E, 256MB GDDR3, 450/1100 MHz);
- GeForce 7800 GT (Palit, PCI-E, 256MB GDDR3, 400/1000 MHz);
- операционная система Windows XP SP2; DirectX 9.0c;
- мониторы
ViewSonic P810 (21") иMitsubishi Diamond Pro 2070sb (21"). - драйверы ATI версии 6.571beta (CATALYST 5.10beta); NVIDIA версии 81.84.
VSync отключен.
|
По сути контрольная панель драйверов особых изменений не претерпела, добавилось лишь меню по AVIVO (о нем в пятой части материала), в 3D-настройках появились новые опции для Adaptive AA и HQ Aniso. Надо отметить, что улучшена работа карт с TV-out, есть режим вывода на ТВ (или второй приемник) полноэкранного изображения фильма или иного видеоролика (вне зависимости от выставленного на нем разрешения).
Напомню, что для совместной работы X1800-карт с TV и монитором последний надо подключать к нижнему гнезду на видеокарте.
Синтетические тесты
Использованная нами версия пакета синтетических тестов D3D RightMark Beta 4 (1050) и ее описание доступна на сайте 3d.rightmark.org.
Параметры D3D вы можете посмотреть и сравнить здесь:
D3D RightMark: X1800 XT, G70
DX Caps: X1800 XT, G70
Тесты проводились:
- На GeForce 7800 GTX, 6600, 6600 GT со стандартными параметрами;
- На оригинальном RADEON X850 XT
- На новых картах RADEON X1300, X1600 XT, X1800 XL, X1800 XT.
Тест Pixel Filling
Пиковая производительность выборки текстур (texelrate), режим FFP, для разного числа текстур накладываемых на один пиксель:
В случае старших карт (первый график) ATI одерживает четкую победу. Дает себя знать более эффективная работа с памятью в том числе благодаря ее скорости и сжатию данных до кэширования, даже большее число конвейеров не спасает 7800 GTX (хотя и проигрыш его не столь силен чтобы говорить о каком либо поражении NVIDIA). Зато в случае среднего сегмента, картина не столь удачная для ATI сказывается перекос в числе текстурных модулей RV530 их всего 4 и это явно недостаточно в данном случае. Этот факт уравнивает RV515 и RV530 в этом тесте и назвать это нормальным мы никак не можем цена этих решений отличается почти вдвое. Возникает подозрение, что 4 текстурных блока у RV530 вынужденная мера, а изначально их планировалось все-таки большее число. В реальных приложения этот неприятный эффект будет сглажен, но, и дальше вы это увидите, не настолько, чтобы о нем забыть или даже считать его оправданным.
А сейчас — скорость закраски буфера кадра (fillrate, pixelrate), режим FFP, для разного числа текстур накладываемых на один пиксель:
В старшем сегменте в случае с 1 текстурой (и с фиксированным цветом) заметно лидирует ATI. Далее лидерство сохраняется, но оно уже не столь велико. Однако, учитывая лишь 16 конвейеров R520 можно говорить о более успешной, в этом плане, архитектуре и прогнозировать ещё большую величину отрыва с выходом R580. В среднем классе опять сказывается печальный эффект 4-х текстурных модулей только в случае 1-2 текстур ATI обыгрывает противопоставленные карты NVIDIA, а вот по мере роста числа текстур RV530 заметно сдает свои позиции. Шутка-ли двукратная разница в числе текстурных блоков.
Посмотрим, как скорость закраски зависит от наличия шейдеров (2.0):
та же картина для среднего класса:
Итак, можно констатировать что ничего не изменилось как FFP так и шейдеры работают совершенно одинаково с точки зрения железа (FFP эмулируется шейдером) и показывают одинаковые результаты. Все та же хорошо заметная проблема с небольшим числом текстурных блоков RV530 и все тоже примущество R520 в грубой закраске, несмотря на меньшее число пиксельных конвейеров.
Тест Geometry Processing Speed
Самый простой шейдер — предельная пропускная способность по треугольникам:
Итак, G70 по прежнему несомненный лидер, a X1800 не далеко ушла в плане пиковой скорости геометрии от X850 XT. В среднем классе ATI задает жару NVIDIA заметно проигрывает. Значит у ATI более эффективный и широкий блок установки и отбрасывания треугольников.
Более сложный шейдер — один смешанный источник света:
Усложняем задачу и для среднего класса:
Как мы видим, везде FFP чуть быстрее сказывается наличие специальных аппаратных блоков для его эмуляции (было время когда ATI манкировали этой возможностью, но теперь это не так). А теперь самая сложная задача, три источника света, причем, для сравнения в вариантах без переходов, со статическим и динамическим управлением исполнением:
Вот здесь ATI впереди во всех случаях. С ростом сложности задачи преимущество 7800 в обработке простых треугольников пропало, а частота ядра X1800 XT дает развернуться его геометрическим возможностям. Интересно, что если шейдеры с динамическими переходами на новых продуктах ATI заработали, то такие же шейдеры с указанием модели 3.0 почему то исполняются неверно судя по всему мы наткнулись на ошибку в драйверах или странности при его взаимодействии с нашим тестом. Но, как бы там нибыло переходы что в 2.X динамическом профиле, что в 3.0 у нас одинаковые и мы можем оценить эффективность реализации динамчиеских переходов у ATI. Она ниже чем статическая версия, как и у NVIDIA, и накладные расходы чуть выше, но больше в абсолюте, из-за более мощного геометрического блока вообще. Напомним, что, к сожалению, новые продукты ATI не поддерживают доступ к текстурам из вершинных шейдеров.
Итак, если не считать отсутствие доступа к текстурами и странности с компиляцией и исполнением шейдеров 3.0, вершинные блоки продуктов ATI заслуживают похвалу всё на уровне!
Тест Pixel Shaders
Первая группа шейдеров — достаточно простых для исполнения в реальном времени, 1.1, 1.4 и 2.0:
В старшей группе царит примерный паритет 7800 и X1800 XT с одной стороны эффективные конвейеры и частота, с другой 24 пиксельных конвейера. Победила дружба, точнее противостояние. А вот в средней группе мы опять замечаем досадное поведение RV530 нехорошо. 4 текстурных модуля снова «портят нам малину» и даже 12 пиксельных конвейеров не спасают X1600. Он ЗАМЕТНО проигрывает 6600 GT. Плохо!
Интересно, что NVIDIA в силу наличия карусели квадов и весьма бережного отношения ко временным регистрам до сих пор получает преимущество от использования 16 битных регистров, во время обработки промежуточных данных в шейдере! А вот архитектура ATI свободна от этой зависимости она построена по иному принцыпу и не зависит так сильно от числа и размера временных переменных при компиляции шейдера. Это похвально! И должно заметно сказаться на эффективности сложных шейдеров с вычислениями. Итак, посмотрим, изменится ли что-либо для более сложных шейдеров:
В старшем классе в режиме 16 бит выигрывает 7800. Но, это 16 бит со всеми потенциальными артефактами. В режиме FP32 мы наблюдаем паритет. Интересно что в среднем классе ATI безоговорочно выигрывает. Даже, несмотря на 4 текстурных блока. Ну правильно много вычислений, меньше доступов к текстурам. Но в реальных играх такие сложные шейдеры редки и не стоит об этом забывать. Эх, если бы текстурников было 12 как бы развернулся этот чип и во всех остальных тестах. 6600 GT был бы просто сметен X1600 XT, но этого не случилось. Досадный промах или досадные обстоятельства…
Тест HSR
Пиковая эффективность (без текстур и с текстурами) в зависимости от сложности геометрии:
Эффективность HSR топового решения ATI традиционно выше, как и ранее. Хотя, из-за более низкой латентности работы с текстурами NVIDIA заметно лучше выглядит в случае тестирования HSR совместно с текстурированием. А вот в среднем классе все не так просто с текстурами ATI выглядит даже чуть хуже 6600/GT, особенно RV515 там HyperZ очевидно слабее, чем в старших чипах ATI.
Тест Point Sprites
Все как и раньше NVIDIA лучше справляется с маленькими спрайтами, а ATI с большими. В случае освещения ATI получает еще немного преимущества вершинные блоки там сильнее.
Выводы по синтетическим тестам
- Самая досадная проблема 4 текстурных блока RV530. Не надо быть провидцем чтобы предсказать, что она аукнется и в реальных игровых тестах. Если бы их было 8 или 12 6600 GT заметно проиграл бы X1600 XT, но при текущей ситуации можно говорить о паритете с переменным успехом. В чем же всё-таки дело в ТАКОЙ просчет архитекторов слабо верится, неужели проблемы с реализацией и производством?
- В верхнем классе R520 опережает или равен 7800 в зависимости от теста и параметров. Что очень неплохо, учитывая его 16 конвейеров. Это говорит о крайне эффективной архитектуре пиксельной части, которая только выиграет в случае последующего масштабирования (R580). Пока что нет явного превосходства над 7800, но есть факт доминирования во многих предельных синтетических тестах. Это не победа, это разумеется и не поражение, это хорший задел.
- Эффективность вычислительной части пиксельных процессоров ATI на высоте. Хороший задел для будущего и будущих архитектур с поддержкой WGF 2.0 которые будет не сложно развить из текущей архитектуры, в силу ее особенностей.
- Вершинная производительность ATI на высоте (хотя и есть небольшие выше упомянутые «но»).
Контрнаступление ATI Technologies: семейство RADEON X1800 (R520), X1600 (RV530) и X1300 (RV515) — Часть 2 (начало): Описание карт
Впереди еще будут части по тестам в играх и по изучению AVIVO. Оставайтесь с нами!
Контрнаступление ATI Technologies: семейство RADEON X1800 (R520), X1600 (RV530) и X1300 (RV515) — Часть 3: Игровые тесты (производительность)
Дополнительно |
|