и не совершил восхождения на гору Фуджи.
Но тот, кто полез на нее дважды — дважды глуп."
(японская поговорка)
Итак, начинаем наше восхождение на RADEON 8500. Экспедиция обещает быть не только рискованной (так как мы имеем дело с новой, неизведанной ранее вершиной), но и тяжелой. По ходу подъема, от синтетических тестов к реальным приложениям, нам предстоит исследовать множество закоулков и особенностей горы. А пока мы находимся у ее подножья, необходимо провести предварительную теоретическую рекогносцировку. Неопытных альпинистов мы отсылаем к нашим предыдущим исследованиям. Кроме того, всем участникам экспедиции рекомендуем еще раз бросить взгляд на схематическую карту, очерченную в нашем превью R200. Тактико-технические характеристики
Для начала приведем сравнительную таблицу общих характеристик чипов и доступных в текущих драйверах DirectX 8.1 возможностей, дабы опытные альпинисты сразу могли понять, с чем мы имеем дело:
Кто есть кто | ||
---|---|---|
Карта | GeForce3 Ti 500 | RADEON 8500 |
Чип | NV20 | R200 |
Ревизия чипа | A05 | A13 |
Основные параметры | ||
Число конвейеров | 4 | 4 |
Число текстурных блоков | 2 | 2 |
Текстур за проход | 4 | 6 |
Частота ядра, МГц | 240 | 275 |
Филрейт (млн. пикселей) | 960 | 1100 |
Филрейт (млн. текселей) | 1920 | 2200 |
RAMDAC, МГц | 350 | 400 (+ внешний 240) |
Память | ||
Частота памяти, МГц | 250 | 275 |
Шина памяти, бит | 128 (DDR) | 128 (DDR) |
Технология, мкм | 0.15 | 0.15 |
Объем памяти, МБ | 64 | 64 |
Скорость памяти, нс | 3.5 | 3.6 |
API | ||
Версия OpenGL | 1.3 | 1.2 (1.3?) |
Версия DirectX | 8.1 | 8.1 |
Наличие GDI+ | Да | Да |
Пиксельный конвейер | ||
Пиксельные шейдеры | 1.0, 1.1 | 1.0, 1.1, 1.4 |
Максимальное значение цвета в регистрах пиксельного шейдера | 1.0 | 8.0 |
Число стадий выборки текстур | 4 | 8 |
Число стадий комбинатора | 8 | 8 |
Вершинный конвейер | ||
Вершинные шейдеры | 1.0, 1.1 | 1.0, 1.1 |
Число потоков вершин | 16 | 8 |
Число констант вершинного шейдера | 96 | 192 |
Прочее | ||
Максимальный размер текстур | 2048х2048 (4096x4096?) | 2048х2048 |
Максимум матриц для блендинга | 4 | 4 |
Индексированный блендинг | Нет | до 57 матриц |
Масштабирование спрайтов до | 64 | 64 |
Число источников света | 8 | 8 |
Число плоскостей отсечения | 0 (6?) | 6 |
Pure Device | Да | Да |
N-Patches | Нет | Да |
RT-Patches | Нет (!) | Нет |
Multisampling | 2, 3, 4 | Нет |
3D текстуры | Да | Да (без MIPMAP) |
Карты отражения (среды) | Да | Да (без MIPMAP) |
Анизотропная фильтрация | Да (без MIPMAP) | Да (без MIPMAP) |
Степень анизотропии до | 8 | 16 |
Туман | FOGVERTEX FOGRANGE FOGTABLE | FOGVERTEX FOGRANGE |
Буфер кадра | ||
Форматы буфера рендеринга | A8R8G8B8 X8R8G8B8 R5G6B5 X1R5G5B5 | A8R8G8B8 X8R8G8B8 R5G6B5 A1R5G5B5 A4R4G4B4 R3G3B2 |
Форматы буфера глубины | D32 D24S8 D16 D24X8 | D32 D24S8 D16 D24X8 |
Форматы текстур | ||
Форматы 2D текстур | A8R8G8B8 X8R8G8B8 R5G6B5 X1R5G5B5 A1R5G5B5 A4R4G4B4 DXT1 DXT2 DXT3 DXT4 DXT5 V8U8 L6V5U5 X8L8V8U8 Q8W8V8U8 P8 D32 D24S8 D16 D24X8 | A8R8G8B8 X8R8G8B8 R5G6B5 X1R5G5B5 A1R5G5B5 A4R4G4B4 DXT1 DXT2 DXT3 DXT4 DXT5 V8U8 L6V5U5 X8L8V8U8 Q8W8V8U8 L8 R3G3B2 A8L8 V16U16 W11V11U10 |
Форматы 3D текстур | A8R8G8B8 X8R8G8B8 R5G6B5 X1R5G5B5 A1R5G5B5 A4R4G4B4 P8 | A8R8G8B8 X8R8G8B8 R5G6B5 X1R5G5B5 A1R5G5B5 A4R4G4B4 R3G3B2 L8 A8L8 DXT1 DXT2 DXT3 DXT4 DXT5 |
Заострим наше внимание на некоторых пунктах:
- Более высокая тактовая частота ядра и памяти RADEON 8500;
- Более высокая предельная частота первичного RAMDAC R200 — 400 МГц, а также наличие на карте вторичного, внешнего RAMDAC c частотой 240 МГц, что дает хорошие возможности по выводу видеосигнала на два приемника;
- Схожая с NV20 организация внутренней архитектуры чипа — 4 конвейера закраски, по два текстурных блока на каждом. Однако у R200 результаты их работы могут накапливаться два раза, в результате чего мы получаем возможность комбинировать до 6 текстур за один проход. Разумеется, с двумя штрафными тактами для 6 и одним для 4 текстур как минимум (так же как и у NV20);
- Поддержка пиксельных шейдеров 1.4 (подробнее см. в превью R200) и, следовательно, более гибкий механизм выборки значений текстур. Так как реально шейдеры транслируются в настройки конвейеров выборки и комбинации, это выразилось в увеличении до 8 числа стадий конвейера выборки текстур и расширении его возможностей;
- Комбинационные конвейеры обоих чипов имеют 8 стадий и поддерживают все декларированные DirectX 8.1 операции;
- Увеличено число констант, которые можно задействовать в вершинных шейдерах — до 192 против 96 у NV20. Это несомненно позволит реализовывать более сложные алгоритмы блендинга и обработки вершин;
- Несмотря на более скромные характеристики времени доступа (3.6 нс против 3.5 нс у GeForce3 Ti 500), память RADEON 8500 успешно работает на более высокой частоте, причем без радиаторов. Само по себе это еще не говорит о более "грамотной" или "скоростной" организации работы с памятью — подходы R200 и NV20 в вопросах работы с памятью существенно разнятся. NV20 предпочитает мелкие блоки и эффективный кроссбар контроллер, R200 — крупные блоки и интенсивное кеширование. Какой из подходов оказался более жизнеспособен в современных тестах и приложениях, мы увидим далее, а пока отметим, что R200 поступает с памятью более "гуманно", и это может вылиться в дополнительный потенциал для разгона последней. Опять же: далее мы проверим это предположение;
- R200 опережает NV20 в наборе реализованных возможностей DirectX 8.1, но, в свою очередь, NV20 имеет прекрасный OpenGL 1.3 драйвер. Текущий же OpenGL драйвер R200 рапортует о версии 1.2 и, по результатам тестов, не столь эффективен, как творение программистов NVIDIA;
- R200 имеет возможность задать 6 произвольных плоскостей отсечения, а у NV20 ситуация в этой области сложилась достаточно интересная. По той или иной причине текущие драйверы рапортуют, что плоскостей отсечения нет, хотя на поверку оказывается, что они прекрасно работают, как это и было в предыдущих драйверах! Но если подходить к этому вопросу формально, они отсутствуют, так как решение о поддержке подобных возможностей, как правило, принимается программами но основе рапортуемой драйверами информации. Надеемся, что NVIDIA не забудет вернуть потерявшиеся плоскости отсечения в ближайших версиях драйверов;
- R200 имеет аппаратную поддержку N-Patches, а NV20 — нет;
- По непонятной причине текущие драйверы NV20 перестали поддерживать аппаратную тесселяцию гладких поверхностей (RT-Patches);
- R200 может осуществлять индексированный матричный блендинг, используя палитру из 57 матриц (одновременно по-прежнему задействуются 4). Впрочем, при наличии вершинных шейдеров это преимущество не столь важно - шейдеры позволяют организовать любые схемы блендинга со значительно большим числом одновременно используемых матриц. Но при этом остается открытым вопрос производительности: так ли быстр блендинг с помощью шейдеров, как обычный аппаратный? Далее мы исследуем этот аспект;
- R200 не поддерживает Multisampling (!);
- R200 не поддерживает Mip-mapping (а следовательно и трилинейную фильтрацию) для карт отражения и объемных текстур;
- В DirectX оба ускорителя не позволяют делать Mip-mapping и анизотропную фильтрацию одновременно, то есть трилинейная + анизотропная фильтрация невозможна. С другой стороны, NV20 поддерживает этот режим в OpenGL, а DirectX приложения пока не особенно балуют нас возможностью включать в них трилинейную фильтрацию;
- Максимальная степень анизотропии у R200 вдвое выше;
- Пиксельные шейдеры R200 могут оперировать значениями, превышающими 1.0 (т.е. 255) — а именно: от 0 до 8.0. Это так называемый OverBright подход. Сложные вычисления могут иметь дополнительный запас точности, можно реализовать накопление каких-либо величин, например, для более адекватной передачи яркого освещения;
- Поддерживается примерно одинаковый джентельменский набор форматов текстур, однако если R200 имеет поддержку нескольких экзотических форматов для использования в шейдерах дополнительных данных (карт нормалей и смещений) с повышенной точностью передачи компонент (11 и 16 бит — V16U16, W11V11U10), то NV20, в свою очередь, позволяет использовать текстуры с форматом буфера глубины (D32, D24S8, D16, D24X8), необходимые для реализации алгоритмов класса буфера теней (Shadow Buffer);
- Поддерживаются все форматы сжатых текстур, однако если R200 позволяет сжимать теми же форматами и 3D-текстуры, то NV20 — нет! Учитывая существенные размеры 3D-текстур, это можно смело считать заметным недостатком драйверов или чипа. По крайней мере, можно будет считать, когда эти пресловутые объемные текстуры наконец начнут применяться :-). А вот в OpenGL NVIDIA успешно использует свой собственный формат сжатия 3D-текстур;
- В DirectX R200 поддерживает все разновидности тумана, кроме табличного;
Приведем также список расширений OpenGL, поддерживаемых текущими драйверами Radeon 8500:
GL_VENDOR: ATI Technologies Inc.
GL_RENDERER: Radeon 8500 DDR x86/SSE
GL_VERSION: 1.2.2357 Win9x Release
GL_EXTENSIONS:
GL_ARB_multitexture
GL_ARB_texture_border_clamp
GL_ARB_texture_compression
GL_ARB_texture_cube_map
GL_ARB_texture_env_add
GL_EXT_texture_env_add
GL_ARB_texture_env_combine
GL_ARB_texture_env_crossbar
GL_ARB_texture_env_dot3
GL_ARB_transpose_matrix
GL_ARB_vertex_blend
GL_S3_s3tc
GL_ATI_element_array
GL_ATI_envmap_bumpmap
GL_ATI_fragment_shader
GL_ATI_pn_triangles
GL_ATI_texture_mirror_once
GL_ATI_vertex_array_object
GL_EXT_vertex_shader
GL_ATI_vertex_streams
GL_ATIX_texture_env_combine3
GL_ATIX_texture_env_route
GL_ATIX_vertex_shader_output_point_size
GL_EXT_abgr
GL_EXT_bgra
GL_EXT_blend_color
GL_EXT_blend_func_separate
GL_EXT_blend_minmax
GL_EXT_blend_subtract
GL_EXT_clip_volume_hint
GL_EXT_compiled_vertex_array
GL_EXT_draw_range_elements
GL_EXT_fog_coord
GL_EXT_packed_pixels
GL_EXT_point_parameters
GL_ARB_point_parameters
GL_EXT_rescale_normal
GL_EXT_secondary_color
GL_EXT_separate_specular_color
GL_EXT_stencil_wrap
GL_EXT_texgen_reflection
GL_EXT_texture3D
GL_EXT_texture_compression_s3tc
GL_EXT_texture_cub
GL_MAX_TEXTURE_SIZE: 1024
GL_MAX_ACTIVE_TEXTURES_ARB: 6
Как видите, текущие драйверы рапортуют о 1.2 версии OpenGL, а не 1.3, о которой говорят спецификации на сайте и сотрудники ATI. Возможно, в ближайшее время будут доступны для скачивания полноценные, рапортующие о версии 1.3 драйверы.
Не будем судить о перспективности тех или иных возможностей — только через существенное время появятся продукты, которые позволят определить популярность каждой "фичи" в реальных применениях. Да и то, только если карта получит широкое распространение — программисты, как известно, народ консервативный и зачастую не видят смысла в поддержке новых или нераспространенных возможностей.
Итак, подведем итог. Картина несколько отличается от той, что мы видели год назад, в момент выхода R100. Технологическое преимущество по-прежнему налицо, но оно не столь подавляюще, как это было в случае R100 и NV15 (GeForce2). Зато налицо преимущество иного рода — при сходной конфигурации конвейеров потенциальная производительность чипа должна быть выше, чем у его конкурента, вследствие более высокой тактовой частоты. Посмотрим, что покажет практика.
Теперь, когда подготовка окончена, настало время штурмовать нашу вершину. Для начала окинем ее взглядом, рассмотрев саму видеокарту ATI RADEON 8500.
Карта
Самая старшая модель игровой карты ATI имеет то же название, что и графический процессор (возможно, продукты на базе RADEON 8500 от партнеров компании ATI будут иметь иные наименования).
Плата имеет AGP x2/x4 интерфейс, 64 МБ DDR SDRAM памяти, размещенной в 8-ми микросхемах на лицевой и оборотной сторонах PCB. В целом компоновка очень схожа с той, что мы встречали ранее у RADEON 64MB DDR.
Микросхемы памяти произведены компанией Hynix (бывшая Hyundai Semiconductor) и имеют время выборки 3.6 ns, т.е. чипы памяти рассчитаны на рабочую частоту 277 (554) МГц. |
Память функционирует на частоте 275 (550) МГц, что практически совпадает с номинальным режимом. Конечно, сразу бросается в глаза тот факт, что работающие на столь высоких частотах микросхемы лишены всякого охлаждения. Я подчеркну, что мы рассматриваем не опытный образец, а серийную карту, соответствующий номер которой можно увидеть на оборотной стороне PCB. Поэтому отсутствие охлаждения модулей памяти — это особенность всей серии RADEON 7500/8500. Если видеокарты на базе процессоров последнего поколения от NVIDIA требуют обязательного охлаждения микросхем памяти, а также понижения частоты работы памяти заметно ниже номинальных значений (вспомним про частоту 230 МГц при наличии памяти со временем выборки 3.8ns, штатная частота которой равняется 263 МГц), то инженеры ATI Technologies решили этот вопрос качественно и обстоятельно — следует признать, что чип снабжен прекрасным и "экологичным" контроллером памяти.
Я могу напомнить, что видеокарта ATI RADEON 7500, о которой мы недавно рассказывали, также снабжена быстрой 4ns памятью. Есть информация, что контроллер памяти RADEON 7500 совершенно аналогичен (перенят от) RADEON 8500. И хотя частота работы памяти снижена с 250 до 230 МГц, оптимизация работы с ней за счет применения этого контроллера и качественной разводки налицо — RADEON 7500 также не требует охлаждения памяти (вспомним GeForce2 Ultra, видеокарты на базе которого имеют обязательное охлаждение очень сильно греющихся микросхем памяти). Более того, разгон по памяти на RADEON 7500 возможен на большую величину, чем у пресловутой GeForce2 Ultra.
Раз уж мы заговорили о RADEON 7500, нелишне будет сравнить дизайн обеих карт (слева 7500-й, справа 8500-й RADEON):
На первый взгляд обе платы похожи, особенно в правой части. Тем не менее, при одинаковом размере PCB отличия есть, и весьма существенные. Прежде всего мы можем заметить, что расположение гнезд DVI и VGA у плат разное. Плюс, наличие у RADEON 8500 модуля RAGE THEATER, который, как известно владельцам видеокарт последнего поколения от ATI, отвечает за VIVO (Video In Video Out). В данном случае задействована только Video Out возможность. Видимо, ATI отказалась от монтажа полноценного набора мультимедийных функций на 3D-акселератор, четко отделив возможности своих карт семейства All-In-Wonder ото всех прочих (в самом деле, навороченный комбайн "Все-В-Чуде" отличается от простой видеокарты с VIVO только наличием ТВ-тюнера, что делает производство первого маловыгодным). Теперь полные возможности VIVO будут доступны только в видеокартах All-In-Wonder (появление последнего на базе RADEON 8500 мы с нетерпением ожидаем). Что касается TV-out — мы коснемся этого вопроса чуть позже.
Вернемся к рассмотрению самой карты RADEON 8500. По сложившейся традиции проектировщики видеокарт фирмы ATI обеспечивают охлаждение видеопроцессора посредством наклеивания на него кулера, а не крепежа оного к PCB. На всех платах от ATI нет никаких отверстий для крепления кулеров, поэтому в случае поломки вентилятора пользователю ничего не остается, кроме как отламывать кулер от чипа (с риском для последнего и карты в целом) и искать не только новый кулер, но и термоклей, а также тщательно зачищать поверхность чипа от остатков прежнего клея, что, кстати, вполне может привести к стиранию всех надписей с GPU. В данном случае обошлось без происшествий (ацетон помог убрать остатки клея):
После снятия кулера нам предстал чип во всей своей красе. Можно увидеть полную маркировку, в том числе и ревизию A13. Впрочем, ревизия и так была ясна, даже без снятия клеевого нароста: утилита PowerStrip сообщила, как и ожидалось, о А13-м степпинге.
Как я уже говорил ранее, RADEON 8500 комплектуется сопроцессором RAGE THEATER, отвечающим за мультимедийные функции. В данном случае у этого чипсета необычная роль. Прежде всего, как можно догадаться по наличию DVI, да и по схожести PCB с PCB RADEON 7500, исследуемая карта полноценно поддерживает мультимониторность, то есть предоставляет все возможности, имеющиеся у 7500-го, в том числе и TV-out, полноценно работающий отдельно от монитора. Однако если младшая карта реализует эту функцию с помощью самого графического процессора, то у RADEON 8500 за ТВ-выход отвечает RAGE THEATER.
Как известно, большинство видеопотоков записано в Interlaced режиме, то есть вначале четные, а затем нечетные строки. На мониторах и телевизорах с интерлейсингом сперва рисуется первая часть, а потом, во время второго прохода развертки — вторая. Но на современных мониторах никто так не делает, отсюда нужда в деинтерлейсинге — перегоне в обычное нечередующееся изображение.
Стандартно для этого используются два метода — BOB и Weave. Первый метод предусматривает выполнение двух кадров: один из нечетных, второй из четных. При этом приходится тупо копировать каждую строку два раза. Этод метод хорош для видеозаписей, в которых присутствует интенсивное движение. Пример метода BOB:
Второй, Weave, пригоден для остановленных кадров. В нем берут и честно чередуют строки. Получается только один кадр, но с реальным удвоенным вертикальным разрешением. Пример Weave:
ATI нам предлагает свой метод попиксельного деинтерлейсинга, который предусматривает серьезное улучшение качества картинки:
Надо отметить, что хотя ATI и преувеличивает свои заслуги в этой области (вроде заявлений, что эта компания первой придумала такой метод и т.д.), качество ТВ-выхода и воспроизведения видео у RADEON 8500 действительно одно из лучших.
Но на этом особенности RADEON 8500 по работе с 2D-графикой не заканчиваются. Как и RADEON 7500, карта может выводить изображение на два приемника, поскольку чип имеет два интегрированных в него CRTC модуля (плюс трансмиттер для цифровых мониторов). Насчет наличия на чипе второго RAMDAC возник вопрос. В некоторых материалах ATI значится, что RADEON 8500 имеет два интегрированных 400 МГц RAMDAC, однако в числе шумно рекламируемых особенностей этого чипа такая сенсационная, казалось бы, новость не упоминается. На поверку оказалось, что второй RAMDAC является внешним (на фотографии карты его можно увидеть между GPU и RAGE THEATER) 10-битным чипом с максимальной частотой 240 МГц. Да, это не два полноценных RAMDAC по 350 МГц, как у RADEON 7500, однако и такая частота работы второго RAMDAC весьма велика и дает возможность на втором мониторе получить разрешение 1600х1200 при 100Гц. Поэтому мы можем смело говорить, что "двухмониторность" у RADEON 8500 полноценная. Всеми особенностями работы RADEON 7500, в том числе и технологией HydraVision, 8500-й обладает; желающие могут почитать наш обзор по RADEON 7500 и получить сведения о тонкостях вывода картинки на два приемника.
Видеокарта поставляется как в ОЕМ, так и в Retail-поставке, что традиционно для ATI. В поставку входят:
- Руководство пользователя;
- Диск с программным обеспечением (драйверы и утилиты);
- Диски с играми и демо-продуктами;
- Переходник S-Video-to-RCA;
- Переходник DVI-to-VGA;
- Кабели S-Video, RCA.
Разгон
При наличии дополнительного охлаждения данный экземпляр карты стабильно работал при частотах ядра и памяти 310/295(590) МГц соответственно. Я полагаю, что новый чип ATI имеет очень хороший потенциал в этом плане. Разгон памяти, уже работающей на своем номинале, разумеется, оказался не столь велик по сравнению с полученными ранее приростами по частотам у схожей по времени выборки памяти. Тем не менее, учитывая хорошую сбалансированность карты, увеличение частоты GPU является наиболее приоритетным.
Установка и драйверы
Перед рассмотрением работы программного обеспечения и результатов тестирования следует ознакомить читателя с конфигурацией тестовых стендов:
- Компьютер на базе Athlon:
- процессор AMD Athlon 1400 MHz;
- системная плата Chaintech 7KJD (AMD760);
- оперативная память 512 MB DDR SDRAM PC2100;
- жесткий диск IBM DTLA 45GB;
- операционная система Windows 98 SE.
- Компьютер на базе Pentium 4:
- процессор Intel Pentium 4 1500 MHz;
- системная плата ASUS P4T (i850);
- оперативная память 512 MB RDRAM PC800;
- жесткий диск Quantum FB AS 20GB;
- операционная система Windows 98 SE.
На стендах использовались мониторы ViewSonic P810 (21") и ViewSonic P817 (21").
Тестирование проводилось на версии 7.191 драйверов от ATI, для сравнительного анализа были использованы тесты видеокарт на базе процессоров от NVIDIA, полученные на драйверах NVIDIA версии 21.85. А состязались с RADEON 8500 следующие карты:
- NVIDIA GeForce3 Ti 500 (240/250 (500) MHz, 64MB DDR;
- NVIDIA GeForce3 Ti 200 (175/200 (400) MHz, 64MB DDR);
- ABIT Siluro GF3 VIO (GeForce3, 200/230 (460) MHz, 64MB DDR).
При снятии результатов тестов VSync был отключен в драйверах у всех карт.
Внимание!!! Всем известно, что столь мощные видеокарты изначально рассчитаны на полноценную работу в 32-битном цвете, так что мы опускаем анализ результатов, полученных в 16-битном цвете, полагая, что последнее поколение (GeForce3/RADEON 8500) поставило "крест" на "хай-колоре", а будущее, разумеется , за 32(и даже более)-битным цветом.DirectX 8.1 SDK — предельные тесты
Для тестирования различных предельных характеристик чипа мы использовали модифицированные нами для большего удобства и контроля примеры из пререлиза последней версии DirectX SDK (релиз пока недоступен). Ввиду заметных изменений пришлось вновь переписать несколько примеров — старый код и компилированные примеры из SDK 8.0 не совместимы с DirectX и DirectX SDK 8.1. Не стоит пугаться — это специфика примеров SDK и большинство других игр и приложений, даже скомпилированные для DirectX 8.0 будут выполнятся на 8.1 без каких либо проблем. Мы же акцентируем ваше внимание на этой несовместимости ввиду возникавших в конференции вопросов о прекращении работы EMBM примеров BumpLens и BumpWaves и примера RTPatch на новых драйверах для GeForce3. Так вот, если два первых примера не работают сугубо "по собственной" вине, и будучи скомпилированны из среды SDK 8.1 начинают прекрасно функционировать, то с RTPatch ситуация обстоит хуже. Как было уже отмечено ранее, на данный момент драйверы от NVIDIA прекратили поддерживать эту аппаратную возможность карты, по неизвестной причине. Впрочем, перейдем к нашим тестам:
Optimized Mesh
Этот тест призван выяснить практический предел пропускной способности ускорителя по треугольникам. Для этого используется несколько одновременно выводимых в небольшом окне моделей, каждая из которых состоит из 50 тысяч треугольников. Текстурирование отсутствуют. Размеры моделей минимальны - каждый треугольник не превышает одного пиксела. Хочется сразу отметить, что результат этого теста, разумеется, останется недостижим для реальных приложений, где размеры треугольников значительны, присутствуют текстуры и освещение. В дальнейшем, мы еще вернемся к этому вопросу. Приведем результаты этого теста для трех моделей — оптимизированной для оптимальной скорости вывода (в том числе с учетом размера кеша вершин на чипе) модели — Optimized, неоптимизированной исходной модели — Unoptimized и той-же модели, выводимой в виде одного Triangle Strip — Strip:
Как мы видим, в случае оптимизированоой модели оба ускорителя показывают внушительную цифры — более 30 миллионов полигонов в секунду, причем преимущество RADEON 8500 ниже ожидаемого благодаря разнице частот. Далее, мы увидим, как хороший баланс чипа смог кардинально перевернуть картину в мало-мальски реальной (а не предельной) сцене. С неоптимизированной моделью RADEON справился очень хоршо, получив двукратное преимущество. Сказались, вероятно, большие размеры вершинных кешей. Но самое интересное - неоптимизированная Strip модель. Она явилась причиной проигрыша RADEON, которому по какой то причине стало крайне неуютно с ней работать. А вот GeForce 3 Ti 500 молодец — для него Strip практически равен Optimized, как в качественном так и в колличественном плане. Чтож, разработчики игр должны взять на заметку оба этих аспекта.
Кроме того, отметим существенное преимущество GeForce 3 в случае принудительной активации програмного рассчета геометрии. Причина этого явления кроется во взаимодействии процессора и ускорителя при передаче рассчитанных процессором данных — GeForce 3 получил значительное преимущество благодаря FastWrites механизму, позволяющему напрямую передавать геометрические данные из процессора в ускоритель, минуя системную память.
Производительность блока вершинного шейдера
Этот тесть позволяет определить предельную производительность блока вершинных шейдеров. Выполняется достаточно сложный шейдер, вычисляющий как видовые преобразования так и геометрические функции. Тест выполнялся в минимальном разрешении, дабы минимизировать влияние закраски. Z-буфер был отключен, и HSR таким образом также не мог влиять на результаты. Итак:
Удивительно, но в случае аппаратного испольнения вершинного шейдера Ti 500 существенно (практически вдвое) опережает RADEON. Кроме того, если вернуться к результатам нашего первого тестирования GeForce3 — мы заметим, что его результат почти вдвое обогнал (если так можно выразится) его самого, полугодовой давности. Кроме того, нас смутила поразительное совпадение результатов программного и аппаратного исполнения шейдеров на GeForce 3. Причем, подобная картина наблюдалась и пол года назад. Разумеется, закралось подозрение — а не выполняются ли все шейдеры на GeForce3 программно? Для проверки этой гипотезы мы снизили тактовую частоту Pentium4 до 1000 МГц. На сей раз, расхождение программного и аппаратного результата увеличилось, программный упал до ~1200 а аппаратный остался практически на том же уровне. Что позволило нас с облегчением вздохнуть — никакого обмана нет, просто новая ревизия чипа NV20 (A05) и/или новые драйверы вызвали практически двукратный прирост производительности вершинных шейдеров. Нам остается только поздравить NVIDIA, посетовать на неопытность ATI в "шейдерных" делах и отметить поразительный результат RADEON в случае программной эмуляции.
Вершинный матричный блендинг
Эта возможность T&L используется для правдоподобной анимации и скиннинга моделей. Мы протестировали блендинг с использованием двух матриц, как в жестком "аппаратном" варианте, так и с использованием вершинного шейдера выполняющего туже функцию. Кроме того, мы как обычно "подстраховались" результатами полученными в режиме програмной эмуляции T&L:
Налицо вновь значительное преимущество Ti 500, особенно в случае полностью аппаратной реализации блендинга. Кроме того, отметим повсеместное превосходство аппаратного исполнения над программным — задача умножения матриц для ускорителя привычна и удобна, чего не скажешь о процессоро подобной работе по последовательному исполнению команд вершинного шейдера.
Уже какой раз мы обнаруживаем картину валового превосходства различных блоков GeForce 3. Однако, поможет ли это "предельное" превосходство в реальных приложениях, где важна не только скорость отдельных блоков чипа но и правильная организация взаимодействия между ними (и в первую очередь отсутствие узких мест) мы узнаем чуть далее. А пока оставайтесь с нами.
Производительность пиксельных шейдеров
Мы вновь использовали модифицированный пример MFCPixelShader, измерив производительность карт в высоком разрешении при выполнении 5 различных по сложности шейдеров, для билинейно фильтрованных текстур:
Интересно, что в случае самого простого, не использующего текстуры шейдера, ATI немного лидирует, но то что начинается дальше, может вызвать только благородное негодование. Сохраняя небольшое отставание в случае двух текстур, RADEON просто проваливается при четырех! И дело тут, как видно, не в сложности самого шейдера, а только в числе используемых им текстур. Использование текстурных модулей второй раз вызывает у творения ATI скачкообразное падение производительности. Остается только надеятся, что это явление исправимо (так или иначе) на уровне драйверов. Впрочем, сия надежда весьма призрачна.
Отметим, что карта, как и было обещано, выполняет шейдеры версии 1.4. Среди демо-программ, которые будут поставляться в комплекте с RADEON 8500, есть интересная программа, которая позволяет увидеть визуальную разницу между реализациями PS1.1 и PS1.4 (слева 1.1, справа 1.4)
Производительность версии 1.4 адекватна производительности предыдущих версий на аналогичных задачах (что совершенно естественно). Как уже упоминалось ранее в превью нового семейства RADEON, шейдеры 1.4 гораздо более гибки в вопросах выборки значений из текстур, и существует целый класс эффектов, которые реализуются с их использованием проще, либо вообще нереализуемы без их участия. Впрочем, несмотря на очевидное архитектурное превосходство, потребность сравнивать скорость выполнения новой версии шейдеров в предельных тестах не возникнет у нас никогда — NVIDIA не планирует поддерживать шейдеры 1.4, а следующий продукт ATI будет уже совместим с DirectX 9 и, как следствие, c пиксельными шейдерами версии 2.0.
EMBM рельеф
В этом тесте мы измеряем производительность, а точнее ее падение, возникающее при использовании наложения карт отражения (Environment) и рельефа на основе карт отражения (EMBM — Environment Bump). Для тестирования использовалось разрешение 1280*1024 — т.к. именно в нем различия между картами и разными режимами текстурирования выражено наиболее резко:
В главном тесте — Environment + Bump мы наблюдаем небольшой проигрыш RADEON 8500, несмотря на превосходство в обычном текстурировании и наложении карт среды. Судя по всему последняя стадия EMBM — пертурбация (смещенная выборка значений из текстуры) выполняется чипом не так уверенно как хотелось бы. О чем и свидетельствует больше падение производительности в %.
Аппаратная реализация N-Patches
Так как на данный момент не существует приложений, в которых можно было бы нормально протестировать зависимость производительности аппаратной реализации N-Patches в зависимости от уровня детализации, мы попросили автора RADEON Screen Saver Филиппа Герасимова модифицировать его программу (одна из загружаемых сцен которой демонстрирует N-Patches), добавив туда возможность регулировать детализацию. Филипп любезно согласился, и мы получили следующую тестовую сцену (на представленных скриншотах слева — без N-Patches, справа — с использованием технологии Truform):
На основании полученных результатов мы построили график:
Очевидно, что реальное практическое использование N-Patches возможно только с числом разбиений порядка 2 или менее. В случае одного разбиения (треугольник превращается в 4) эта возможность практически бесплатна, но уже в случае двух мы наблюдаем двукратное падение производительности. Большие уровни детализации практически беcсмысленны — скорость падает почти на порядок. В защиту RADEON отметим что этот тест несколько синтетичен — в реальных приложениях N-Patches как правило используются только с моделями, в то время как вся окружающая сцена выводится обычным образом, да и уровень детализации 2 уже сам по себе существенно сглаживает модель. Но как бы там ни было — бесплатного обеда опять не получилось. И тем не менее, надо отметить, что данная технология позволяет воплотить в трехмерных объектах образы, уже очень близкие по форме к человеку:
А ведь это "лицо прекрасной девушки" состоит из неимоверного числа полигонов (уже после отработки TruForm):
Подытожим предельные тесты. Эта информация будет несомненно полезна как разработчикам, так и просто пытающимся проинтерпретировать результаты производительности в реальных приложениях энтузиастам. Несколько раз отдельные блоки GeForce3 демонстрировали подавляющее преимущество над RADEON 8500. Однако, несколько раз и RADEON как минимум вдвое опережал GeForce 3. В общем и целом нет смысла выделять на этой фазе тестирования конкретного лидера — оставайтесь с нами и именно реальные приложения далее покажут "кто есть кто". Тестирование эффективности HSR
Для того, чтобы оценить эффективность реализации HSR мы использовали тест с большим уровнем OverDraw - VillageMark v.1.17. Приводим результаты обеих карт со включенным и отключенным HSR:
Очевидно что эффективность HSR у RADEON существенно выше, но с ростом разрешения выигрышь от включения HyperZ II падает быстрее нежели в случае Ti 500. Итак, RADEON 8500 вновь лидер, налицо добротная реализация HSR. 3D Mark 2001 — синтетические тесты
Скорость закраски
Мы измеряли этот параметр только для 32 битной глубины цвета. Читатель наверняка поддержит нас во мнении, что современные топовые игровые ускорители если и будут работать в 16 битном цвете, то лишь у нерадивого тестера. Более того, можно ожидать полного исчезновения поддержки 16 бит буфера кадра в течении нескольких ближайших поколений ускорителей — все современные приложения могут совершенно спокойно выполняться в 32 бит цвете, а наличие поддержки 16 бит только немного усложняет чип.
Итак, как же обстоят дела со скоростью закраски — наглядным критерием мощи и архитектурного совершенства современного ускорителя:
Мы приводим данные для разрешения 1600*1200 для того, чтобы зависимость от других аспектов производительности чипа (например геометрической) стала минимальной. Наибольший результат этого теста всегда достигается при максимальном разрешении — здесь чипу остается только красить, красить и еще раз красить бескрайние поля экрана. Напомним, что теоретические пределы для данного теста (также изображены на диаграмме) составляют 960 миллионов пикселей в секунду для Ti 500 и 1100 для RADEON 8500 соответственно. Последний наиболее близко подобрался к своему потенциальному потолку, продемонстрировав тем самым отличную организацию кеширования и работы с памятью, а также прекрасную сбалансированность архитектуры.
И в случае максимального использования мультитекстурирования (4 текстуры для Ti 500 и 6 текстур для RADEON 8500) ситуация вновь повторяется. Теоретические пределы в этом тесте составили соответсвенно 1920 для Ti 500 и 2200 для RADEON 8500. Нет никаких сомнений в совершенстве архитектуры нового RADEON, особенно если вспомнить факт успешной и "холодной" работы с более медленной формально, нежели у Ti 500 памятью на более высоких частотах.
Сцена с большим количеством полигонов
Этот тест мы проводили в небольшом разрешении, дабы снизить влиянее закраски на полученные результаты. Итак:
При наличии одного источника света новый RADEON показывает себя абсолютным лидером. Его результат не только значительно (более чем на разницу частот) превосходит Ti 500, но и (что более важно) вплотную приблизился к значению практического предела пропускной способности по треугольникам, полученному нами ранее с помощью Optimized Mesh из DX8.1 SDK. Т.е. даже в реальной динамической сцене RADEON 8500 демонстрирует производительность близкую к практическому лимиту своей пропускной способности по треугольникам, в отличии от GeForce 3 - продемонстрировавшей прекрасные предельные характеристики в тесте из SDK, но существенно сдавшей в этом более менее "реальном" тесте. Еще одно свидетельство мощи T&L RADEON 8500 и прекрасного баланса всей архитектуры чипа.
В случае с 8 источниками света мы можем отметим следующие моменты. Добавление новых источников света до сих пор не бесплатно для любого чипа. Производительность RADEON упала втрое. Но, если так можно выразится, для Ti 500 эти источники дались еще более небесплатно. Сделаем вывод: в играх будущего (например Next Doom), вероятно интенсивное использование большого числа аппаратных источников света. Именно в таких приложениях RADEON сможет "во всей красе" продемонстрировать свое архитектурное преимущество над семейством GeForce3.
Рельефное текстурирование
Этот тест мы проводили в разрешении 1024*768 как в наиболее характерном для современных игровых приложений. Необходимо учесть, что слишком маленькое разрешение чревато заметной зависимостью от геометрической производительности карты, а слишком большое от пропускной полосы шины памяти. Мы имеем:
Сюрприз — более медленная по скорости закраски Ti 500 справилась с этим тестом существенно лучше, даже в сравнении с разогнанным RADEON. Впрочем, именно это и предвещал нам упомянутый ранее предельный тест EMBM производительности из DirectX SDK. Минорные недостатки реализации EMBM в новом RADEON по прежнему налицо. Перейдем более перспективному DOT3 рельефу:
И здесь GeForce3 на коне. Остается поздравить инжинеров NVIDIA c удачной реализацией этой возможности, или наоборот посетовать на потенциальные "драйверные" проблемы RADEON, которые не дают ему полностью раскрыть свой частотный запас в этих тестах. Мы предоставим читателям право выбирать наиболее приглянувшийся им сценарий :-). Со своей же стороны хочу подлить масло в огонь заявив что с приходом пиксельных шейдеров эти два теста начинают терять свою важность — ибо с помошью шейдеров можно реализовать много различных методов рельефного текстурирования, в том числе с попиксельным рассчетом освещения.
Вершинные шейдеры
Мы приводим результаты этого теста в нескольких разрешениях. Читатель легко подметит интересную зависимость:
Если производительность Ti 500 практически остается постоянной, крайне медленно падая с ростом разрешения, что говорит о довлеющей зависимости от геометрической производительности чипа (что мы и хотели бы видеть от этого теста) то RADEON явно упирается не столько в собственный интерпретатор шейдеров, сколько в скорость закраски! Т.е. даже интенсивный синтетический тест не смог застать программируемый TCL блок RADEON в расплох — его производительность всегда оставалась "достаточной". Чтож, нам остается пожелать создателям 3DMark2001 усовершенствовать этот тест сделав его еще более тяжелым для геометрического блока ускорителя, и констатировать факт как минимум двукратного преимущества RADEON над Ti 500. Вспомнив полученные ранее на предельный тестах из DirectX SDK результаты (где RADEON отнюдь не блистал по сравнению с GeForce3 Ti 500), отметим что в менее синтетической (если так можно выразится) сцене из 3D Mark 2001, RADEON полностью реабилитирует себя, показав завидную производительность в условиях реальной сцены.
Пиксельный шейдер
Руководствуясь высказанными выше соображениями о том что слишком малые разрешения "упираются" в геометрию, а слишком большие в пропускную полосу памяти, проведем этот тест в привычных многим 1024*768:
Мы вновь наблюдаем преимущество RADEON, впрочем не столь уверенное, как бы хотелось. Фактически, оно коррелирует с разницей в тактовых частотах соперников, и даже чуть ниже ожидаемого из этих соображений результата. Что только подтверждает полученные ранее на предельном тесте MFCPixelShader результаты. Впрочем, общий баланс чипа оказался очень даже удовлетворителен в этом тесте — в реальном применении мы уже не наблюдаем потенциально возможного двукратного проигрыша RADEON.
Спрайты
Здесь мы приведем наименьшее разрешение, т.к. в остальных разрешениях взаимная картина ничуть не меняется:
RADEON существенно обыгрывает Ti 500, причем, восновном благодаря своей геометрической производительности. Закраска плоских спрайтов крайне проста, скорость их вывода все время упирается в геометрический аспект - спрайтов очень много, и перед закраской надо преобразовать множество координат.
Подытожив синтетические тесты из 3D Mark 2001 отметим, что при переходе от предельных тестов SDK к более "реальным", если так можно выразится, но все же синтетическим сценам 3D Mark, RADEON как правило получает преимущество благодаря хорошо сбалансированной архитектуре. Далее, мы посмотрим получит ли эта тенденция свое логичное продолжение в реальных играх. Оставайтесь с нами. Результаты тестирования в игровых приложениях и 3DMark2001 (игровые тесты)
3DMark2001, DirectX 8.0
Общие результаты
Первое, что бросается в глаза — перманентная победа RADEON 8500 на своим соперником NVIDIA GeForce3 Ti 500. Означает ли это, что в DirectX играх RADEON станет полновластным лидером? А теперь давайте рассмотрим по отдельности каждый игровой тест, входящий в состав 3DMark2001, попутно отмети что при переходе с Pentium4-1500 на Athlon-1400 производительность обеих карт практически не изменилась.
Game1, Low details
Этот тест представляет собой нечто среднее между автогонками и "cтрелялкой", сцены весьма сложные, много эффектов. И, как видно, хоть и с небольшим перевесом, но RADEON 8500 в лидерах!
Game1, High details
Сцена из предыдущего теста еще более усложнена, добавлены эффекты, и… все решает арбитр, тьфу, то есть центральный процессор (отлично видно, что практически вся производительность зависит от CPU).
Game2, Low details
Это очень красивая сцена из игры типа фэнтези (очень жаль, что подобных игрушек нет пока "живьем"), где помимо сложности объектов (один дракон чего стоит!) еще очень высокая величина Overdraw (перекрытий объектов). Это своего рода еще один тест HSR (или HyperZ у RADEON). Как и в случае VillageMark, мы видим прекрасную оптимизацию RADEON 8500 под подобные задачи, и даже не менее замечательная технология ZCull и ZCompression от NVIDIA не спасла ее детище.
Game2, High details
И без того красивый игровой тест был еще улучшен (вернее, усложнен), мы видим уже дракона в полный рост, а также множество объектов на большой высоте полета, и RADEON 8500 показал прежнее преимущество над NVIDIA GeForce3 Ti 500. Судя по всему, Game2 — самый любимый тест поклонников ATI :-).
Game3, Low details
Этот тест уже иного плана. Тут банальный экшен. А значит, стрельбы, вспышки, эффекты освещения (блики), сложность персонажей, приличный Overdraw (колонн много). И RADEON 8500 вновь победил, хотя и с мизерным перевесом. Можно только порадоваться за поклонников продукции ATI ;-).
Game3, High details
А вот и долгожданная "ложка дегтя" без которой как известно не обходится ни одна бочка меда;. При усилении предыдущей сцены всевозможными эффектами, уже преимущество RADEON 8500 растаяло и только в сверхвысоких разрешениях ему удается немного обогнать соперников.
Game4
"Ура! Теперь озеро и речка есть не только на GeForce3!" — воскликнули многие читатели. Да, наконец-то самый красивый тест стал доступен не только владельцам NVIDIA GeForce3 — карт. Однако, оставим в стороне красоты природы и обратимся к сухим цифрам — "Ложка дегтя" стала целым "половником". RADEON 8500 справился с этим тестом хуже даже GeForce3, не говоря уже про Ti 500. Вспоминаем наше повествование о производительности шейдеров, которое вы могли прочитать несколькими разделами выше и признаем что налицо горькое подтверждение ранее высказанным опасениям, на сей раз основанное на реальной тестовой сцене.
Подводя итоги тестов 3DMark2001, отметим, что на всех игровых сценах, кроме той, в формировании которой принимают участие пиксельные шейдеры, мы видим преимущество RADEON 8500 не только над GeForce3, но и над Ti 500 (вспоминаем про предполагаемое ценовое соотношение этих карт!).
Giants, DirectX
Горькая пилюля, полученная на Game4, способна стать неплохой клизмой, по мере перехода от синтетики к реальным играм. Одна из них — Giants, работающая в Direct3D и содержащая, пусть и аляповатые, но очень сложные объекты (в сцене может быть свыше 50000 полигонов).
"получите-распишитесь". Явный проигрышь RADEON 8500. Сразу возникает вопрос: а почему? Почему на более сложных сценах 3DMark2001 карта в лидерах, а тут такое фиаско? Отметим, что эта игра весьма капризна. Вспомним, как некоторых версиях драйверов от NVIDIA GeForce3 проваливался по производительности на 7-10 fps (что сравнимо с нынешним поражением RADEON 8500 относительно Ti 500), а затем последующие версии полностью исправляли ситуацию. Вероятно и RADEON 8500, с будущими версиями драйверов сможет поднять производительность в этой игре хотя бы до уровня GeForce3.
Quake3 Arena, OpenGL
Для тестирования мы использовали версию 1.17 игры Quake3 Arena от id Software с использованием стандартного бенчмарка demo002.
Наконец то мы добрались до любимого теста всех обозревателей и почитателей NVIDIA. Почему? Позиции этой компании по написанию качественных OpenGL-драйверов давно известны, и поклонникам ATI заранее следует запастись терпением на прослушивание малоприятных сведений.
Стандартный тест (32-битный цвет — режим High Quality)
Как и предполагалось, обогнать Ti 500 не удалось, однако RADEON 8500 все таки смог обойти более раннюю модель GeForce3, что уже достаточно неплохо.
Производительность при максимальной детализации
В данном тесте используется не только максимально возможная детализация уровня и моделей, но и преднамеренное усложнение геометрии — задается разбиение кривых объектов на 30000 полигонов (r_subDivisions "1" r_LodCurveError "30000").
Как и ранее, на высоких разрешениях RADEON 8500 обогнал своих соперников, что может означать, что благодаря более производительной щине памяти и HyperZ II этот тест оказался все же по плечу карте, не имеющей столь отлаженных и подогнанных OpenGL-драйверов, какие имеют карты на базе чипов от NVIDIA. Кстати, меня многие упрекают в том, что я не использую более новые версии Quake3 и даже Quake3 Team Arena для тестирования. Мотивы — сложность графики у новых версий Quake3 намного выше. Так вот, я проанализировал качество и уровень графики в этих версиях, и пришел к выводу, что наш утяжеленный тест на базе версии 1.17 дает ПРИМЕРНО ТО ЖЕ САМОЕ с точки зрения нагрузки на карту, что и демо, встроенные в Team Arena.
Анизотропная фильтрация
Мы подошли к очень интересной части. Думаю, что после чтения этого раздела упавшие духом поклонники RADEON смогут поднять голову и увидеть, что и в OpenGL-секторе игр новому продукту есть чем блеснуть.
Почему в качестве основы для рассмотрения я выбрал навысшую степень анизотропии у RADEON 8500 (которая доступна через драйверы) и среднюю степень (Level4) у GeForce3 Ti 500? Ну частично ответ на этот вопрос есть уже в выше представленной диаграмме. Посмотрите на падение производительности у Ti 500 при даже средней степени анизотропной фильтрации! Явно видно, что у RADEON 8500 шансов больше дать пользователю красоту графики и при этом не потерять скорость. Конечно, многих беспокоит вопрос: а что с качеством? Ведь когда-то RADEON нам выдавал на максимальном уровне анизотропии меньшее качество графики, чем GeForce3. Давайте посмотрим на примере сверхпопулярной игры Serious Sam (немного отвлечемся от Quake3).
Вот, перед нами скриншот, где включена трилинейная фильтрация и отсутствует анизотропия:
Теперь включаем анизотропию на Level4 и смотрим, что получилось на GeForce3 Ti 500:
А теперь на все 100! То бишь на Level8!
Вы видите разницу между Level4 и Level8? Я вижу, если только пристально присмотреться. А вот теперь на ринг выходит RADEON 8500 со своей Highest Anisotropic:
Отлично видно, что по качеству анизотропия у RADEON 8500, если уж не превосходит, но уж точно равна той, что мы видели у GeForce3 Ti 500. А теперь смотрим выше на падения производительности. Выводы нужны? Думаю, что нет.
Для любителей твикеров и выставления национальных "радеоновых" параметров анизотропии, как то 128-точечный уровень (одному автору наверно известно, что сие значит) я приведу скриншот, полученный при выставлении такого уровня анизотропии через Registry:
Как и ожидалось, разницы никакой (да и сам Serious Sam писал, что выставляет уровень 16, даже если хоть в нем пиши — 128).
Напоследок рассмотрения анизотропии я приведу данные тестирования при максимальном качестве и усложненной геометрии в Quake3:
Как видим, результаты почти аналогичны предыдущим.
Как достаточно большой минус можно принять отсутствия возможности одновременного включения анизотропии и трилинейки, однако из-за особенностей работы MIP-mapping у RADEON при активизации анизотропии это просто невозможно технически. Я напомню, что способы реализации анизотропии у NVIDIA и ATI — совершенно разные (отсюда, кстати, и такие различия в падениях производительности).
Мы заканчиваем рассмотрение этой функции с точки зрения производительности, но вернемся к ней в четвертой части, где мы исследуем анизотропию в Direct3D с позиций качества графики.
Анти-алиасинг и анизотропная фильтрация
Учитывая, что в OpenGL у RADEON 8500 в качестве FSAA работает обычный супер-сэмплинг, нет смысла рассматривать его отдельно, ибо ничего нового в этой функции нет. К сожалению, SmoothVision, как вид анти-алиасинга в Direct3D, пока не работает (драйверы виноваты, ATI обещала в скором времени "починить").
Поэтому мы рассмотрим мой любимый вопрос: а что с производительностью и играбельностью при активизации обеих функций: анти-алиасинга и анизотропии? Ведь обе эти функции как бы дополняют друг друга, обеспечивая наилучшее качество графики.
Как мы видим, АА2х плюс анизотропия обеспечивают RADEON 8500 хорошую играбельность в 1024х768х32, к сожалению, FSAA 4х в этом разрешении у него уже не работает. Однако, GeForce3 Ti 500, имея более качественный анти-алиасинг и хороший уровень анизотропии, несмотря на падение из-за последней, обеспечивает более высокую производительность, поэтому, бесспорно, в совместном режиме АА+Анизотропия RADEON 8500 проиграл.
На этом вопросы производительности мы все рассмотрели, оставайтесь с нами, читайте последнюю часть материала, посвященную качеству графики. Некоторые аспекты качества 3D-графики
Перед тем, как дружно поохать над великолепием графики в технологических демо (как и положено в обзоре любого нового продукта :-), мы спустимся с небес и посмотрим, как обстоят дела в некоторых традиционно "проблемных" для ATI играх. Например, всем пользователям продукции ATI хорошо известно, что заставить включиться туман в игре Need For Speed:Porsche 2000 при работе с RADEON (или RAGE128/Pro) почти невозможно, а если и можно, то путем перебираний многих версий драйверов и копания в Registry. К удовольствию фэнов могу сказать, что на RADEON 8500 с этой проблемой покончено:
Правда, есть и новое нарекание: что-то случилось со шрифтом в меню игры, и текст стал еле читаемым, а некоторые ниспадающие меню и вовсе оказались без текста. Ждем исправлений в новых драйверах.
Теперь, как я и обещал, давайте посмотрим на работу анизотропии в Direct3D. Я предвижу удивленные глаза и поэтому сразу скажу, что чуда не случилось и форсирования анизотропии в этом API у RADEON нет. Однако фильтрация сама в наличии и включается, если это умеет приложение. К таковым относится Max Payne, игра, которая уже успела стать весьма популярной (основана на том же движке, что и 3DMark2001). В обзоре Palit Daytona GeForce3 в свое время я поднимал эту же тему, используя скрытые NVIDIA возможности форсирования анизотропии в Direct3D у GeForce2/3 — карт. Давайте посмотрим, как выглядит сцена при использовании трилинейной фильтрации (анизотропии нет):
Я отмечу, что скриншот на GeForce3 был получен при максимально возможной степени анизотропии Level8 (напоминаю про катастрофическое падение производительности при этом), а уровень анизотропной фильтрации у RADEON 8500 неизвестен, поскольку игра не дает возможности его задавать (полагаю, что используется Highest уровень). Мы видим, что качество у обеих карт превосходное, а значит RADEON 8500 можно отнести в лидеры и по данной игре даже без измерений производительности, зная какое падение претерпит GeForce3 при активизации Level8.
Ну вот, теперь приступим к "сладкому". На десерт у нас есть скриншоты, полученные с демо-программ, которые после выхода DirectX 8.1 будут поставляться вместе с RADEON 8500 — картами.
Я уже приводил выше скриншоты из демки, наглядно показывающей, что можно сделать, используя пиксельные шейдеры версии 1.4. Вот и еще пример:
Многие помнят, какая вода была в X-Isle, этой демо-программе, которая показывала возможности GeForce3 в части рельефного текстурирования и формирования воды, да и озеро из 3DMark2001, Game4 все помнят. А вот, какую реализацию поверхности воды предлагает ATI (разумеется, при участии шейдеров):
Как мне кажется, это самое реалистичное представление воды, какое я только видел (к сожалению, пена, что должна символизировать сам водопад, оказалась невписывающейся и портящей даже картинку, но вода — отменно сделана). Выводы
Когда писался обзор по NVIDIA GeForce3, выводы можно было делать довольно легко: самый мощный акселератор, цена поднебесная, и т.д. Как говорится, High-End, он и в России таков. В данном случае уже все гораздо сложнее.
- На рынке уже есть High-End акселератор от NVIDIA, который в ближайшее время еще немного усилится/улучшится (речь о GeForce3 Ti 500), в то время как новый продукт от ATI, как мы видим, только-только сумел догнать лидера от соперника. С другой стороны, наконец то созданы существенные предпосылки для нормальной конкуренции, как в плане скорости и возможностей, так и цены;
- Учитывая то, что у NVIDIA Ti 500 — не новый продукт, а лишь слегка улучшенный прежний (и затрат на его разработку почти не было), компания уже готова выдать на-гора свой новый продукт (NV25) в ближайшие несколько месяцев, даже в тех областях, где RADEON 8500 захватил первенство, его звезда может померкнуть;
- Опираясь на имеющиеся сведения о ценах на RADEON 8500 и карт на базе GeForce3 Ti 500, можно сказать, что сейчас RADEON 8500 выглядит очень привлекательно, особенно если учесть, что он несет в себе не только мощнейший 3D-ускоритель, но и возможность работы с двумя выходами. Но, мы не знаем, на сколько быстро и насколько низко NVIDIA может опустить цены, и насколько сильно от этого потускнеет звезда RADEON 8500;
- По производительности RADEON 8500 несомненный лидер в DirectX, и немного проигрывает в OpenGL (конфуз с Giants испортил впечатление, однако, зная репутацию этой капризной игры будем терпеливо следить за драйверами и патчами: возможно, что еще не все потеряно);
- У RADEON 8500 есть традиционное уже для карт от ATI достоинство — высокое качество 2D-графики (правда, и GeForce3 — карты в этом отношении очень хороши, однако встречаются бракованные карты, которые мылят уже в 1280х1024), поэтому владельцы огромных мониторов будут очень довольны. Плюс к этому — возможность вывода картинки на второй монитор с очень хорошими характеристиками, а также надо отметить отличное качество TV-out (разумеется, с возможностью одновременного просмотра изображения на мониторе и на ТВ)
- У RADEON 8500, как и у всех RADEON, в наличии все плюсы, касающиеся проигрывания DVD-видео (четкость картинки, аппаратная поддержка), а также оверлеев, что важно владельцам многих дисков с MPEG4-фильмами. Тут не помешает и отличного качества TV-out.
Итак, мы рассмотрели новейший продукт от ATI, относящийся к High-End ряду, при этом тестировали серийную карту, а не опытный образец. Если мысленно усреднить все значения производительности, RADEON 8500 окажется на уровне последнего продукта от NVIDIA — GeForce3 Ti 500. При этом, если стоимость (реальная, а не декларированная пока) окажется ниже, чем у карт на GeForce3 Ti 500 (а уж не говорю про GeForce3 — карты), то успех RADEON 8500 гарантирован. Несколько отпугивать может репутация программистов от ATI, которые обычно вначале "валяют дурака", а потом начинают лечить продукт с уже подпорченной репутацией, однако, в отличие от RADEON, вышедшего более 1 года назад, нарекания на нынешнее качество драйверов малы, и создается впечатление что над ПО для RADEON 8500 работала совершенно иная команда, нежели ранее (перечитайте первый обзор RADEON и вы увидите, сколько там было нареканий на качество 3D в играх).
Поэтому мы ждем появления в продаже новинки от ATI, а также от ее партнеров. Впереди еще много интересного, связанного c RADEON 8500 (это и новые карты, и выпуск новых драйверов способных изменить ситуацию). Читайте наши 3DGiТоги, в которых отныне будет участвовать и карта ATI RADEON 8500.