Обзор VPU 3Dlabs P10 и карты Wildcat VP870 на его основе
или "Наглядный процессор"
(А.Л. Гуртовцев, В.С. Гудыменко — "Программы для микропроцессоров", с.3.)

СОДЕРЖАНИЕ
- Общие сведения о P10 и позиционирование
- Линейка продуктов
- Спецификации P10
- Архитектура P10
- Особенности видеокарты 3Dlabs Wildcat VP870 128MB
- Конфигурации тестовых стендов и особенности настроек драйверов
- Результаты тестов: коротко о 2D и предельные тесты из DirectX 8.1 SDK
- Результаты тестов: Синтетические тесты 3DMark2001 SE
- Результаты тестов: Игровые тесты 3DMark2001 SE
- Качество 3D в играх
- Результаты тестов: Профессиональные тесты: SPECviewperf 7.0
- Результаты тестов: Профессиональные тесты: Discreet 3DS MAX 4.26
- Выводы
3D-графика, 3DMark2001 SE — синтетические тесты
Подчеркну, что все замеры по всем 3D-тестам проводились в 32-битной глубине цвета.
Скорость закраски

Напомним, что теоретические пределы для данного теста составляют 880 миллионов пикселей в секунду для
Parhelia, 1100 для RADEON 8500 и 1200 для Ti 4600 соответственно. Как мы видим, по фактической скорости
закраски Parhelia наиболее близко подошла к пиковым значениям, видимо, благодаря 256-битной шине памяти.
Точное значение частоты ядра P10 неизвестно, однако, зная, что чип может записывать 4 точки за такт, можно
предположить, что оно очень близко к Parhelia 512. Интересно, что с ростом разрешения эффективность
закраски Parhelia чуть падает, что говорит о недостаточном совершенстве контроллера памяти.

Также напомним, что пиковые значения для этого теста составляют 3520 (1760) миллионов текселей в секунду для Parhelia (в скобках указано значение при работе схемы 4 конвейера по 2 текстурника на каждом), 2200 - для RADEON 8500 и 2400 для Ti 4600. В случае мультитекстурирования большую роль играет сбалансированность чипа. На сей раз, около своей пиковой скорости оказался уже Ti 4600, чуть далее — RADEON 8500. P10 существенно проигрывает остальным картам — он не может похвастаться наличием нескольких текстурных блоков на конвейер закраски, и посему было вполне логично ожидать сравнимых с предыдущим тестом результатов. Интересно, наличие лишь одного текстурного блока столь же существенно скажется на R300?
Сцена с большим количеством полигонов
На этом тесте особое внимание следует уделить минимальному разрешению — именно там зависимость от
закраски практически нивелируется:

При наличии одного источника света Ti 4600 показывает себя абсолютным лидером. Его результат не только
значительно (более, чем в 2 раза) превосходит Parhelia, но и (что более важно) вплотную приблизился к
значению практического предела пропускной способности по треугольникам, полученному ранее с помощью
Optimized Mesh из DX8.1 SDK. Впрочем, не будем умалять достоинств RADEON 8500, также приблизившегося к
предельной цифре, полученной в тесте из SDK. А вот с P10 и Parhelia ситуация далека от идеала. Особенно
далека от него Matrox Parhelia.

В случае 8 источников света Parhelia несколько реабилитирует себя: с ростом числа источников его производительность падает более медленно, чем RADEON 8500. Лидер — по-прежнему Ti 4600, аутсайдером теперь становится P10.
Интересно, это проблема драйверов или недостаточной производительности самого пула вершинных процессоров?
Рельефное текстурирование
Посмотрим на результаты синтетической EMBM сцены:

Печальная картина подтверждает тесты из SDK. А теперь DP3 рельеф:

"Все те же лица".
Вершинные шейдеры

Проигрыш по всем статьям. И это при столь обещающих результатах теста на предельную пропускную способность по треугольникам. И это, при наличии 16 скалярных вершинных процессоров. Либо что-то не в порядке с драйверами, либо вершинное железо очень сильно заточено под OpenGL и не может конкурировать с DX ускорителями, либо оно просто-напросто недостаточно производительно. Последнее было бы крайне обидно, но маловероятно.
Пиксельный шейдер
Руководствуясь высказанными выше соображениями о том, что слишком малые разрешения "упираются" в
геометрию, а слишком большие — в пропускную полосу памяти, обратим основное внимание на 1024х768
и 1280х1024:

На несложных пиксельных шейдерах P10 умудряется сохранять приемлемую производительность, несколько выигрывая у
Parhelia. Это подтверждает полученные при тестировании пиксельных шейдеров в SDK результаты. Но посмотрим
и на тест Advanced Pixel Shader.

Картина совершенно иная. Как уже отмечалось в секции SDK — чем длинее шейдер, тем хуже для P10. И вновь, интересно, как будут обстоять дела с этим вопросом у R300 и NV30.
Спрайты

В этой области у P10 все плохо — еще хуже чем у Parhelia. Очевидно, что спрайты эмулируются стандартными треугольниками. С другой стороны, не будем забывать, что подобные скоростные системы плоских частиц имеют пока сугубо игровые применения.
Итак, подведем второй промежуточный итог. По сумме синтетических тестов карта 3Dlabs P10 в основном проигрывает своим конкурентам. Впрочем, это и ожидалось — ускоритель не ориентирован на игровые приложения, а тест 3D Mark 2001 несомненно является игровым тестом, даже с точки зрения синтетических алгоритмов. Кроме того, судя по всему драйверы для DX8 не являлись первичной целью создателей P10 и до сих пор являются слишком слабо оптимизированными, чтобы соревноваться с продуктами ATI или NVIDIA.
3D-графика, 3DMark2001 — игровые тесты
3DMark2001, 3DMARKS

Как мы видим, в целом положение 3Dlabs Wildcat VP870 в игровых тестах DirectX 8.1 оказалось между ATI RADEON 7500 и RADEON 9000 Pro. Но это благодаря тому, что карта поддерживает пиксельные шейдеры, и поэтому Game4 функционирует. Ниже мы убедимся в том, что реальная скорость бывает даже ниже, чем у GeForce4 MX 440 (который по сумме баллов проиграл из-за отсутствия результатов по Game4).
3DMark2001, Game1 Low details

Характеристики теста:
- Rendered triangles per frame (min/avg/max): 19773/33753/143422
- Rendered textures per frame with 16 bit textures (min/avg/max): 7.5/8.8/16.5 MB
- Rendered textures per frame with 32 bit textures (min/avg/max): 15.1/17.7/30.3 MB
- Rendered textures per frame with texture compression (min/avg/max): 10.7/12.2/21.0 MB
А тут карта на P10 — аутсайдер, даже GeForce4 MX 440 смог показать чуть более высокую производительность.
3DMark2001, Game2 Low details

Характеристики теста:
- Rendered triangles per frame (min/avg/max): 46159/51440/147828
- Rendered textures per frame with 16 bit textures (min/avg/max): 8.0/8.8/10.1 MB
- Rendered textures per frame with 32 bit textures (min/avg/max): 15.6/17.2/19.8 MB
- Rendered textures per frame with texture compression (min/avg/max): 9.3/10.9/13.5 MB
Картина схожая, производительность где-то около той, что выдает GeForce4 MX 440.
3DMark2001, Game3 Low details

Характеристики теста:
- Rendered triangles per frame (min/avg/max): 16681/21746/39890
- Rendered textures per frame with 16 bit textures (min/avg/max): 2.8/4.1/4.7 MB
- Rendered textures per frame with 32 bit textures (min/avg/max): 5.7/8.2/9.4 MB
- Rendered textures per frame with texture compression (min/avg/max): 5.0/7.2/8.4 MB
Чуть-чуть скорость у P10 выросла, а толку все равно мало.
3DMark2001, Game4

Характеристики теста:
- Rendered triangles per frame (min/avg/max): 55601/81714/180938
- Rendered textures per frame with 16 bit textures (min/avg/max): 14.9/17.4/20.7 MB
- Rendered textures per frame with 32 bit textures (min/avg/max): 28.4/33.5/40.0 MB
- Rendered textures per frame with texture compression (min/avg/max): 28.4/33.5/40.0 MB
Заметим, что в этом тесте, достаточно сложном и современном с точки зрения насыщеной эффетками реалистичной сцены P10 наконец-то хоть кого-то опередила :-). На сей раз в аутсайдерах осталась карта Matrox Parhelia.
В целом по 3DMark2001 можно сказать, что наши предварительные результаты тестирования в синтетике и выводы по ним полностью подтвердились практикой: 3Dlabs Wildcat VP870 и ее драйверы пока никоим образом не приспособлены к DirectX игровым приложениям. Пока невозможно даже четко сказать, кто больше виноват: драйверы или баланс возможностей самого P10. Будем ждать известий от Creative Labs — нынешнего хозяина 3Dlabs, который обещал выпустить на рынок игровой акселератор на базе P10. Тогда мы сможем подробно исследовать: что в этом вопросе изменилось в лучшую сторону.
Пока же постараемся утешить профессионалов-дизайнеров — они уже сейчас смогут в часы (или минуты) своего досуга поиграть на этой карте в любимые игры (пусть и с несколько меньшим комфортом в плане скорости: придется снижать разрешение).
Качество 3D-графики в играх
Однако и тут есть нарекания. Слава Богу, что их не так много, но вот пресловутая игра Morrowind, в которой
практически впервые водная поверхность реализована через пиксельные шейдеры, выдала следующие картинки
на 3Dlabs Wildcat VP870 (для сравнения приведены скриншоты, полученные на RADEON 8500):
При этом игра была обновлена при помощи последнего патча до версии 1.02.0722.
Были замечены некоторые искажения и в других играх (правда малозначительные). Более подробно можно будет узнать
о качестве из следующего (августовского) выпуска 3DGiТогов (в галерею скриншотов будут помещены кадры из
многих игр, полученные на P10).
Дополнительно |
|