СОДЕРЖАНИЕ
- Введение
- Особенности видеокарт
- Конфигурации стендов, список тестовых инструментов
- Синтетические тесты в D3D RightMark
- Результаты тестов: Quake3 ARENA
- Результаты тестов: Serious Sam: The Second Encounter
- Результаты тестов: Return to Castle Wolfenstein
- Результаты тестов: Code Creatures DEMO
- Результаты тестов: Unreal Tournament 2003
- Результаты тестов: Unreal II: The Awakening
- Результаты тестов: RightMark 3D
- Результаты тестов: TRAOD
- Результаты тестов: FarCry (скорость и качество)
- Результаты тестов: Call Of Duty
- Результаты тестов: HALO: Combat Evolved
- Результаты тестов: Half-Life2(beta)
- Результаты тестов: Splinter Cell
- Результаты тестов: Colin Mcrae Rally04 (скорость и качество)
- Результаты тестов: Max Payne-2 (скорость и качество)
- Результаты тестов: Painkiller (скорость и качество)
- Результаты тестов: Need For Speed: Underground (скорость и качество)
- Результаты тестов: Пираты Карибского моря (качество)
- Результаты тестов: Vietcong (качество)
- Результаты тестов: 3DMark03-Game1
- Результаты тестов: 3DMark03-Game2
- Результаты тестов: 3DMark03-Game3
- Результаты тестов: 3DMark03-Game4
- Результаты тестов: 3DMark03-MARKS
- Результаты тестов: AquaMark3
- Driver NVIDIA version 61.11
- Выводы
Совсем немного времени прошло с тех пор, как прогремели анонсы новых High-End продуктов от NVIDIA (13 апреля) и ATI (4 мая). Обе новинки мы уже достаточно подробно рассмотрели в наших материалах:
Теоретико-аналитические материалы и обзоры видеокарт, в которых рассматриваются функциональные особенности GPU ATI RADEON X800 (R420) и NVIDIA GeForce 6800 (NV40)
- NVIDIA GeForce 6800 Ultra (NV40). Часть 1 — особенности архитектуры и синтетические тесты в D3D RightMark (одностраничный вариант)
- NVIDIA GeForce 6800 Ultra (NV40). Часть 1 — особенности архитектуры и синтетические тесты в D3D RightMark (вариант разбит на страницы)
- NVIDIA GeForce 6800 Ultra (NV40). Часть 2 — исследование производительности и качества в игровых приложениях (одностраничный вариант)
- NVIDIA GeForce 6800 Ultra (NV40). Часть 2 — исследование производительности и качества в игровых приложениях (вариант разбит на страницы)
- Обзор ATI RADEON X800 XT и X800 PRO (R420) (одностраничный вариант)
- Обзор ATI RADEON X800 XT и X800 PRO (R420) (вариант разбит на страницы)
В последнем обзоре по R420 я написал, что впереди нас ждет изучение работы новых супер-мощных ускорителей на современных играх, которых среди ранее проведенных тестов было не так много.
На примерах старых тестов мы убедились в том, что все новые акселераторы очень сильно зависят от центрального процессора и производительности системы в целом, полностью упираясь в них даже при максимальных нагрузках АА и анизотропией. Вывод ясен: если даже найдутся такие, кто захочет отдать немалые деньги за суперускоритель для того, чтобы продолжать использовать его в старых и любимых играх, то ему надо обновить всю систему, иначе толку от такой покупки будет немного.
Вкратце: какие основные вещи мы узнали, исследовав новинки?
Прежде всего, это удвоение числа конвейеров у RADEON X800 XT, по сравнению с 9800XT, плюс увеличение частоты работы. Все это дало прирост производительности в 2 раза, при максимальной нагрузке акселератора (разумеется, в современных играх). Заметим, что не на 15-20-25%, как было ранее, а в 2 раза! А подчас и даже больше.
Прирост возможностей и производительности у GeForce 6800 Ultra относительно предшественника GeForce FX 5950 Ultra, вообще потрясает воображение! Поскольку число пиксельных конвейеров выросло в 4(!) раза, а текстурников и вершинных конвейеров — в 2 раза! Плюс прибавить к этому отличную работу инженеров NVIDIA над ускорением работы шейдерных блоков, и новый продукт обгоняет своего предшественника подчас просто с феноменальным отрывом! Несмотря на то, что частота получилась ниже (400 против 475 МГц).
И если раньше мы могли говорить о том, что NV38 дотягивает до R360 только в старых играх (подчас OpenGL, где конек у драйверов от NVIDIA), да и то с помощью подпорок из оптимизаций и т.п., то теперь оба новых продукта выступают с равными весовыми категориями и полноценно конкурируют друг с другом.
Означает ли это, что война «оптимизаций» и подгонки под скорость за счет снижения качества подошла к концу? — Хочется надееться, но есть и сомнения в обратном.
Разумеется, полезные (благие) оптимизации в драйверах, например, правящие ошибки разработчиков, будут и дальше иметь место, и это только надо поощрять.
Сегодня мы рассмотрим три аспекта:
- Работу GeForce 6800 Ultra на 450 МГц (и сравнение с 400 МГц вариантом, а также с RADEON X800 XT).
- Сравнение версии драйверов NVIDIA 61.11 с ранее использованной 60.72.
- Исследование работы GeForce 6800 и RADEON X800 на некоторых современных играх, ранее не принимавших участия в наших тестах.
Что касается первого пункта, то здесь пока нет определенной ясности в том, какие карты пойдут в серию: 400 или 450 МГц. Есть мнение, что более ускоренное решение все же пойдет в очень ограниченном количестве, и на его базе 2-3 вендора выпустят особые карты, типа Golden Sample от Gainward. А все остальные 6800 Ultra будут на 400 МГц (уже появившиеся в США заказы на поставки таких изделий от eVGA явно говорят о том, что в продажу пойдут 400 МГц-карты).
А по второму пункту надо проверить: будет ли прирост по скорости у NV40, и за счет чего. Ну и заодно протестировать надежность и стабильность этой версии.
Итак, кратко напомню, что за карты рассматриваем.
ATI RADEON X800 XT | NVIDIA GeForce 6800 Ultra |
---|---|
Оба продукта представляют собой reference cards, то есть предсерийные образцы. Мы еще будем рассматривать и серийные изделия, но это позже.
Напомню, то обе карты имеют по 256 мегабайт памяти GDDR3 со временем выборки 1.6 ns, при этом у NV40 частота по памяти — 550 (1100) МГц, а у R420 — 575 (1150) МГц. Частоты работы чипов: NV40 — 400 и 450 МГц, R420 — 525 МГц. Оба GPU содержат по 16 пиксельных и 6 вершинных конвейеров. NV40 поддерживает еще версию шейдеров 3.0, а R420 — собственную технология сжатия карт нормалей — 3Dc. Вот кратко и все.
Для визуальной и очень примерной оценки возможностей по разгону неплохо бы привести снова снимок, где представлены оба чипа: NV40 и R420:
Мы заметим, что размер кристалла у NV40 самый большой (что и не удивительно при его 222 млн. транзисторов), однако, как показал опыт, все же отдельные экземпляры могут разгоняться с 400 до 450 МГц. Например, наша карта при использовании термопасты с содержанием серебра, смогла заработать на таких частотах при наличии всего небольшого дополнительного вентилятора, обеспечивающего поток холодного воздуха на турбину родного кулера от видеокарты. Конечно, это ни о чем не говорит насчет процента GPU, способных гарантированно работать на 450 МГц, но все же показательно. Хотя, пока по Сети ходят слухи, что процент выхода мал, и на 450 МГц работать будут считанные отобранные чипы. Как будет на самом деле — покажет время.
Насчет разгонов X800 XT пока ничего не могу сказать, во время тестирования у карты был BIOS, запрещающий разгон по чипу. Этот вопрос мы будем еще исследовать дальше. Хотя, надо сказать, что последняя бета-версия RivaTuner (автор Алексей Николайчук AKA Unwinder) уже поддерживает X800 в полном объеме, показывая не только число пиксельных конвейеров, но и осуществляя мониторинг по температуре:
Сейчас автор совместно с нами работает над патчем к драйверам, позволяющим менять число конвейеров, включая ранее заблокированные (как было у RADEON 9500/9700; 9800SE/9800). Пока есть проблемы (сотрудник ATI не обманул меня, говоря о том, что так просто поменять число конвейеров программным путем уже не удастся), стоят защиты. Но работа ведется и время покажет! :-)
Установка и драйверы
Конфигурации тестовых стендов:
- Компьютер на базе Pentium 4 3200 MHz: — использовался для тестирования в синтетике
- процессор Intel Pentium 4 3200 МГц;
- системная плата ASUS P4C800 Delux на чипсете i875P;
- оперативная память 1024 MB DDR SDRAM;
- жесткий диск Seagate Barracuda IV 40GB;
- Компьютер на базе Athlon 64 3200+: — использовался для тестирования в играх
- процессор AMD Athlon 64 3200+ (L2=1024K);
- системная плата ASUS K8V SE Deluxe на чипсете VIA K8T800;
- оперативная память 1 GB DDR SDRAM PC3200;
- жесткий диск Seagate Barracuda 7200.7 80GB SATA.
- операционная система Windows XP SP1; DirectX 9.0b;
- мониторы ViewSonic P810 (21") и Mitsubishi Diamond Pro 2070sb (21").
- драйверы ATI версии 6.444 (CATALYST 4.5); NVIDIA версии 60.72 и 61.11.
VSync отключен Синтетические тесты D3D RightMark
Использованная нами версия пакета синтетических тестов D3D RightMark Beta 4 (1050) и ее описание доступны на сайте 3d.rightmark.org
Еще раз отмечу, что все тесты в RightMark снимались на компьютере на базе Pentium4.
Все тесты включают в себя результаты из обзоров NV40 на частоте 400МГц и обзора R420, поэтому мы прокомментируем только отличия и характер поведения NV40 с ядром 450МГц. Итак:
Тест Pixel Filling
Пиковая производительность выборки текстур (texelrate), режим FFP, для разного числа текстур накладываемых на один пиксель:
В случае одной и двух текстур NV40-450 вполне предсказуемо упирается в пропускную способность памяти, а точнее скорость работы с буфером кадра. По мере роста числа текстур преимущество более высокой частоты ядра начинает проявляться, но никаких кардинальных изменений в расклад сил не вносит — R420 лидер.
А сейчас — скорость закраски буфера кадра (fillrate, pixelrate), режим FFP, для разного числа текстур накладываемых на один пиксель:
Та же самая ситуация.
Посмотрим, как скорость закраски зависит от версии шейдеров:
Ничего нового.
Итак, 450 МГц не внесли существенных изменений в расклад сил в этом тесте. Вполне логично — до 525 МГц им все еще далеко.
А теперь посмотрим, как текстурные модули справляются с кэшированием и билинейной фильтрацией реальных текстур различных размеров:
Различия есть, но их сложно назвать существенными. Полоса пропускания памяти и алгоритм фильтрации определяют в этом тесте больше, чем 50 МГц прирост ядра.
А теперь посмотрим на зависимость производительности текстурных модулей от формата текстур:
Больше размер:
Вновь ничего нового или удивительного.
Итак, можно констатировать отсутствие существенных отличий.
Тест Geometry Processing Speed
Самый простой шейдер – предельная пропускная способность по треугольникам:
Заметный прирост, причем теперь NV40-450 становится лидером. Интересно, что скачок на вершинных шейдерах превышает разницу частоты — сказались новые драйверы — на лицо лучшая оптимизация коротких вершинных шейдеров. Посмотрим, сохранится ли этот скачкообразный прирост на более сложных задачах.
Более сложный шейдер – один простой точечный источник света:
Сюрпризы исчезли. Оптимизация коснулась только пиковой пропускной способности, на более-менее стандартной задаче она себя уже так не проявит. Как бы там ни было, результат вершинных шейдеров не зависит так сильно от пропускной полосы памяти, и потому увеличился пропорционально частоте ядра.
Усложняем задачу далее:
Здесь NV40 FFP лидер, несмотря на частотное преимущество ATI. Но общая картина по-прежнему скалывается скорее в пользу ATI — выше частота ядра — больше скорость вершинных шейдеров.
А теперь самая сложная задача, три источника света, причем, для сравнения в вариантах без переходов, со статическим и динамическим управлением исполнением:
FFP силен, а статические переходы заметно ударяют по чипам NVIDIA. Парадокс в том, что динамические переходы на чипах от NVIDIA выгоднее статических. Общая картина вновь в пользу R420, везде, где дело не касается FFP…
Вывод — вновь никаких сюрпризов. Вершинные шейдеры масштабируются строго пропорционально частоте ядра — сказывается отсутствие сильной зависимости от пропускной полосы памяти.
Тест Pixel Shaders
Первая группа шейдеров – достаточно простых для исполнения в реальном времени, 1.1, 1.4 и 2.0:
Мы видим, что NV40 на частоте 450 МГц работает быстрее. Но, недостаточно быстрее — лидер по пиксельным шейдерам игровой сложности прежний — R420.
Посмотрим, сможет ли спасти положение NV40 использование 16 битной точности плавающих чисел:
Преимущество 16 битной точности для NV40 есть, в некоторых шейдерах больше, в некоторых меньше. Порою, оно позволяет догнать R420 (не забываем про возможные артефакты пониженной точности — см. игровую секцию обзора) но не отыграть у него пальму первенства. Частота и еще раз частота.
А теперь посмотрим на действительно сложный, «кинематографичный» шейдер 2.a в силу небольшого числа зависимых выборок уложившийся в ограничения пиксельных конвейеров R420:
Пропорционально быстрее. Теперь NV40-450 выигрывает у R420, но только в случае использования 16 битной точности.
Итого, по пиксельным шейдерам: 450 МГц позволяют, порой, выровнять производительность с R420. Но не демонстрируют того, что можно было бы назвать четким лидерством.
Тест HSR
Пиковая эффективность (без текстур и с текстурами) в зависимости от сложности геометрии:Картина практически идентична, небольшие отличия в эффективности 450 МГц варианта NV40 вызваны иным соотношением частот ядра и памяти.
Тест Point Sprites.
Интересно, что в новых драйверах NVIDIA кардинально исправлено досадное падение производительности, которое мы наблюдали на малых размерах спрайтов!
ВЫВОДЫ
- Увеличение частоты не меняет картину кардинально.
- В некоторых областях оно позволяет NV40 сравниться с R420, но, в общем и целом, последний остается лидером.
- В новых драйверах успешно исправлено несколько досадных моментов, которые, видимо, не были связаны с железом.
То есть, даже 450 МГц не дает твердой победы NV40 в области синтетических тестов.