СОДЕРЖАНИЕ
- Общие сведения
- Особенности видеокарты NVIDIA GeForce FX 5900 Ultra 256MB
- Конфигурации тестовых стендов и особенности настроек драйверов
- Результаты тестов: коротко о 2D
- Синтетические тесты RightMark3D: идеология и описание тестов
- Результаты тестов: RightMark3D: Pixel Filling
- Результаты тестов: RightMark3D: Geometry Processing Speed
- Результаты тестов: RightMark3D: Hidden Surface Removal
- Результаты тестов: RightMark3D: Pixel Shading
- Результаты тестов: RightMark3D: Point Sprites
- Результаты тестов: Синтетические тесты 3DMark2001 SE и 3DMark03
- Выводы из результатов синтетических тестов
- Результаты тестов: Игровые тесты 3DMark2001 SE: Game1
- Результаты тестов: Игровые тесты 3DMark2001 SE: Game2
- Результаты тестов: Игровые тесты 3DMark2001 SE: Game3
- Результаты тестов: Игровые тесты 3DMark2001 SE: Game4
- Результаты тестов: Игровые тесты 3DMark03: Game1
- Результаты тестов: Игровые тесты 3DMark03: Game2
- Результаты тестов: Игровые тесты 3DMark03: Game3
- Результаты тестов: Игровые тесты 3DMark03: Game4
- Результаты тестов: Quake3 ARENA
- Результаты тестов: Serious Sam: The Second Encounter
- Результаты тестов: Return to Castle Wolfenstein
- Результаты тестов: Code Creatures DEMO
- Результаты тестов: Unreal Tournament 2003 DEMO
- Результаты тестов: AquaMark
- Результаты тестов: RightMark 3D
- Результаты тестов: DOOM III Alpha version
- Качество 3D
- Выводы
Не хочется банальных фраз вроде "Пришла весна, началось обострение…", гм, что-то не то. "Пришла весна, и начался вылет на свет Божий новых ускорителей." Право же, и так понятно, что каждая новинка будет сопровождаться тоннами красивых слов, высокими материями из 3D-функциональности, и скриншотами из прекрасно выглядящих игр из… будущего.
А нам, по совести, очень жалко тех, кто уже потратил кровные свои деньги на супер-ускоритель GeForce FX 5800 Ultra, а ведь это подчас выше $500 (когда я посмотрел на цены на такие продукты от Gainward в ряде фирм в Москве, то мне стало нехорошо). Да-да, снова NVIDIA их обманула. Или не обманула? Разговоры о скором выходе NV35 давно ведутся, но ведь это разговоры. Официально компания не обещала и не расписывалась в том, что не стоит покупать NV30, когда вскоре будут улучшенные версии.
И вот, как только в продаже начали появляться обещанные еще перед Новым Годом, видеокарты на базе GeForce FX 5800/Ultra, бац, и анонс. Да еще выступление президента NVIDIA, где он, неделю назад, обещал выход NV35 и назвал NV30 ошибкой и неудачным продуктом. А как быть тем, кто уже купил этот "неудачный" продукт? Бесплатно на NV35 его никто не обменяет. Поэтому мы можем лишь посочувствовать тем, кто уже купился на красивые слова и манящие жесты "эльфийки".
Хотя, по сути, NV35 — это не одна карта, а опять линейка. Ходят разговоры, что будет три карты, однако пока есть достоверные сведения только о двух:
- GeForce FX 5900 Ultra 450 МГц чип, 256 Мбайт 425 МГц (DDR 850) 256 бит шина локальной памяти ($499);
- GeForce FX 5900 450 МГц чип, 128 Мбайт 425 МГц (DDR 850) 256 бит шина локальной памяти ($399);
- GeForce FX 5??? 425? МГц чип, 128? Мбайт 400? МГц (DDR 800?) 256 бит шина локальной памяти ($299);
Вообще-то, спецификации GF FX 5900 также еще могут меняться. Пока мы имеем на сегодня самый быстрый ускоритель от NVIDIA — GeForce FX 5900 Ultra, ранее имевший кодовое название NV35.
Столь малое изменение в номере от названия карты наводит на мысли, что изменений у 5900 по сравнению с 5800 не так уже и много. Однако, судя по частотам, разгона не было, более того, частоты даже снижены относительно NV30. Только добавлена 256-битная шина? В общем, будем разбираться.
Одно понятно: NV35 — это не выпуск просто новой линейки, которая (как ранее было) смещает с трона предыдушие продукты, переводя их на ступень ниже, а ЗАМЕЩЕНИЕ предыдущего продукта NV30! И в этом коренное отличие от ранее вышедших тандемов: NV10-NV15 (GeForce256-GeForce2), NV20-NV25 (GeForce3-GeForce4Ti). Да, разумеется, целью NVIDIA и тогда была замена продуктов GeForce256 и GeForce3, однако она шла постепенно и в штатном режиме продаж. А тут все иначе: мы еще не сталкивались с таким, что предыдущий продукт появляется в продаже, и буквально через месяц анонсируется новый. Разумеется, фирмы-производители обо всем знали заранее, и потому на выпуск NV30 клюнули немногие, а кто и решился, тот выпустил мизерное количество таких карт. Это объясняется еще и высочайшей себестоимостью GF FX 5800/Ultra. Но мы про все это уже писали, вот список наших статей, посвященных новому семейству GeForce FX:
- Аналитический материал по особенностям архитектуры NVIDIA NV30 (GeForce FX)
- Базовый обзор NVIDIA GeForce FX 5800 Ultra (NV30) — одностраничный
- Базовый обзор NVIDIA GeForce FX 5800 Ultra (NV30) — многостраничный
- Базовый обзор NVIDIA GeForce FX 5600 Ultra (NV31) и GeForce FX 5200 Ultra (NV34) — одностраничный
- Базовый обзор NVIDIA GeForce FX 5600 Ultra (NV31) и GeForce FX 5200 Ultra (NV34) — многостраничный
- Обзор ASUS V9900 Ultra на базе NVIDIA GeForce FX 5800 Ultra — продолжение рассмотрения качества АА и анизотропии
- Обзор Gainward FX Powerpack Ultra/1000 Golden Sample и Gainward FX Powerpack Pro/660 TV/DVI на базе NVIDIA GeForce FX 5800 Ultra и 5200 — масштабирование (зависимость производительности от частоты работы CPU) GeForce FX 5800 Ultra, а также изучение производительности GeForce FX 5200
- Обзор Leadtek WinFast A300 Ultra MyVIVO на базе NVIDIA GeForce FX 5800 Ultra — продолжение изучения зависимости производительности GeForce FX 5800 Ultra от частоты работы CPU в тяжелых режимах при АА и анизотропии
- Обзор MSI FX5800 Ultra-TD8X на базе NVIDIA GeForce FX 5800 Ultra
- Обзор видеокарт на базе NVIDIA GeForce FX 5200 производства Albatron, Chaintech, Gainward, InnoVision, Leadtek, Palit и Prolink
Технические характеристики
- Технологическая норма 0.13 микрон, медные соединения
- 135 миллионов транзисторов
- 3 геометрических процессора (превышают спецификации DX9 VS 2.0)
- 4 усовершенствованных конвейеризированных пиксельных процессора. Функциональность пиксельных процессоров значительно превышает спецификации DirectX9 PS 2.0, в два раза превосходят по мощности шейдеры в NV30 и операции, использующие плавающую точку, выполняются с истинной 128 битной точностью.
- системный интерфейс AGP 3.0 (8х)
- 256-битный интерфейс локальной памяти DDR1 (!)
- Intellisample HCT (High Compression Technology) является развитием Intellisample представленной в NV30 — техники экономии пропускной полосы локальной памяти.
- Тайловые оптимизации: кэширования, сжатия и раннего отсечения невидимых поверхностей (Early HSR, Early z Cull)
- Технология UltraShadow — увеличивает скорость прорисовки стенсильных теней (называемых так из-за широкого использования стенсил (stencil) буфера при их генерации) за счет ограничения обрабатываемых объектов по глубине сцены.
- Поддержка точных целочисленных форматов (10/16 бит на компоненту) и точных плавающих форматов (16 и 32 бита на компоненту) для буфера кадра и текстур.
- Сквозная точность всех операций 32-бит плавающей арифметики (поддержка т.н. 128-битной глубины цвета)
- Новый алгоритм оптимизированной анизотропной фильтрации, будучи активирован пользователем, снижает падение производительности (читай величины fps) без особенного падения качества
- Качество анизотропии вплоть до 8х от обычной билинейной фильтрации, т.е. до 32 дискретных отсчетов на одну выборку из текстуры
- Гибридные режимы АА 8х и 6xS
- Сжатие буфера кадра позволяет существенно снизить падение производительности при активации FSАА
- Два встроенных RAMDAC 400 МГц
- Встроенный интерфейс для внешнего TV-Out чипа
- Встроенные в чип три TMDS-канала для внешних интерфейсных DVI-чипов
Рассмотрим этот список более детально.
- Чип из 135 миллионов транзисторов: Как мы видим, количество транзисторов в чипе увеличилось ненамного — это косвенно говорит о том, что изменения в чипе, базирующемся на архитектуре NV30, скорее косметические.
- 256-битный интерфейс локальной памяти: Пожалуй, самое ожидаемое нововведение в NV35. С момента выпуска NV30 энтузиасты трехмерной графики на ПК, предсказывая характеристики NV35, даже не представляли себе этот чип без 256-битного интерфейса обмена с локальной памятью.
- 4 усовершенствованных конвейеризированных пиксельных процессора: Здесь же вместо также ожидаемого увеличения числа пиксельных процессоров до 8 NVIDIA оставила все те же 4 процессора. Каждый из пиксельных процессоров снабжен: двумя блоками, фильтрующими текстуры, двумя смешанными целочисленными и работающими с плавающей точкой операциями ALU и одним ALU, выполняющим операции только. с плавающей точкой. То есть, всего три операции с плавающей точкой. Такая конфигурация позволяет выполнять до 12 пиксельных операций за такт. Однако, пока в силу некоторых обстоятельств, эта мощь работает только в OpenGL, в D3D все по-прежнему — только одна операция с плавающей точкой, однако обещают и это выправить. Разумеется, декларируется, что по мощности пиксельных процессоров при выполнении пиксельных шейдеров DirectX9 PS 2.0 со 128 битной точностью вычислений новый чип превосходит NV30 в два раза.
- Технология Intellisample HCT: техника экономии пропускной полосы локальной памяти: сжатие без потерь буфера кадра, включая как информацию о цвете, так и из буфера глубины (Z буфера). Возможный коэффициент сжатия — до 4:1. По сравнению с NV30 технология Intellisample была усовершенствованна — как и ранее в чипе на основании нескольких факторов определяется, будет ли эффект от сжатия передаваемых блоков данных, но теперь, в результате оптимизации, вероятность сжатия данных увеличена. Также под общим названием Intellisample HCT включены следующие техники, увеличивающие эффективность работы с локальной памятью: контроллер локальной памяти с коммутатором, текстурные кэши, раннее отсечение невидимых пикселей (z-culling), быстрая очистка буфера глубины (fast z-clear). Все эти оптимизации позволяют существенно снизить падение производительности при активации FSАА.
- Технология UltraShadow: Данная технология позволяет увеличить скорость визуализации теней при использовании техники стенсил-буфера (stencil buffer shadows), как раз той техники, которая используется в Doom III. Как часть технологии UltraShadow декларируется возможность чипов NV30/NV35 удваивать fillrate, выдавая до 8 пикселей за такт, если закрашивается только буфер глубины и/или стенсил буфер, по сравнению с 4 пикселями при обычном рендеринге. Вторая, наиболее интересная часть заключается в возможности задавать диапазон глубины в кадре, в котором объект может отбрасывать тень. Для демонстрации взглянем на рисунок:
Если при прорисовке теней значение глубины пикселя, хранящееся в буфере глубины, не попадает в заданный диапазон, то стенсил-буфер для пикселя не обновляется. Таким образом, становится возможной экономия достаточно большого процента от скорости закраски (fillrate). По всей видимости, для реализации этой функции в чипе усовершенствован блок, отвечающий за раннее отбрасывание невидимых поверхностей (early z-cull), который теперь сверяет значение, хранящееся в буфере глубины, не только с текущим значением, интерполированным исходя из координат треугольника, но и с двумя дополнительными значениями. В итоге выигрыш по сравнению с другими чипами с одинаковым количеством конвейеров будет двукратный в худшем случае (8 значений буфера глубины по сравнению с 4 значениями цвета) и четырехкратный (с учетом, что early z-cull может отбрасывать до 16 пикселей за такт), даже без учета уменьшения объема данных, записываемых обратно в локальную память.
Ниже можно видеть, насколько большую площадь занимают визуализированные буферы теней.
Выше мы перечислили плюсы технологии, но у нее есть и свои ограничения.
- технология UltraShadow будет доступна только в OpenGL при помощи расширения "NV_depth_bounds_test"
- NVIDIA ожидает получения патента на технологию UltraShadow
- Технология не включается парой строчек кода (как в свое время говорили про N-Patch aka Truform) — программисты должны анализировать отображаемую сцену и эффективно задавать диапазон, в котором возможна прорисовка теней.
- Пока технология анонсирована только для NV35, расширение в текущих драйверах доступно также только на NV35. Неизвестно, будет ли в дальнейшем это расширение доступно для остальных карт на базе NV3x, хотя есть положительный сигнал, т.к. расширение "NV_depth_bounds_test" доступно в режиме эмуляции NV30 в "Buzz/emulated" в OpenGL драйвере, выпущенном еще в августе 2002 года.
Карта снабжена интерфейсом AGP х2/x4/x8, 256 МБ локальной памяти DDR SDRAM (16(!) микросхем, размещенных на лицевой и оборотной сторонах PCB).
На карте установлены микросхемы DDR памяти Hynix марки HY5DU283222-AF22, форм-фактора BGA. Максимальная частота работы 450 (900) МГц, время выборки 2.2 нс. По умолчанию память работает на частоте 425 (850) МГц, чип 450 МГц. |
Мы видим, что для набора объема памяти в 256 мегабайт используется в 2 раза большее, чем мы привыкли видеть, количество микросхем. Заметим, что суммарно они составляют 512бит, то есть при наличии аппаратной 512-битной шины обмена с памятью у чипа и PCB, карта смогла бы иметь столь огромную ПСП. Но, как выше было сказано, шина — 256 битная, поэтому мы снова сталкиваемся с таким явлением, как двухстрочная организация подсистемы памяти. Память при этом работает по двубанковой схеме, что дает некоторый прирост в скорости обмена с нею. Поэтому можно почти смело говорить о том, что если 128-мегабайтные карты GeForce FX 5900 будут иметь немного меньшую производительность, нежели 256-мегабайтные, как это было в случае RADEON 8500 64 и 128 мегабайт.
NVIDIA GeForce FX 5900 Ultra 256MB | |
---|---|
NVIDIA GeForce FX 5800 Ultra 128MB | |
Как мы видим, карта очень большая по длине, и примерно равна PCB карты Voodoo5 5500. Расположение микросхем напоминает Matrox Parhelia:
PCB достаточно сложна по разводке, однако слоев используется меньше — всего 8 плюс экранирование (в отличие от 12-слойной PCB у NV30):
Что касается системы охлаждения, то она состоит из двух кулеров: для процессора и для памяти, что является очень верным решением (мы уже неоднократно отмечали, что единый кулер для GPU и памяти может сыграть злую роль для менее нагревающихся элементов, неся к ним тепло от более сильногреющихся компонентов). Центральный кулер представляет собой копию того, что мы могли видеть ранее на Quadro FX или GeForce FX 5800 (не-Ultra), только с обрезанной крышкой на радиаторе, что способствует уменьшению шума. Вентилятор работает в режиме, как у GeForce FX 5800-не-Ultra: постоянно крутится на малых оборотах, при надобности включаясь на полные обороты (при повышении температуры выше определенных критических значений). Система охлаждения памяти состоит из двух массивных алюминиевых радиаторов, покрашенных в черный цвет. Тепло передается через специальные термоэлементы, приклеенные к радиаторам, они же гарантируют плотный прижим к поверхности микросхем памяти. Сам крепеж системы охлаждения тщательно продуман, нет больше никаких пластмассовых клипс (фитюлек), все на болтах с пружинами. | |
Отметим, что нагрев в целом НАМНОГО меньше, чем у NV30. Если до карты GeForce FX 5800 Ultra после часа работы в 3D просто невозможно дотронуться (даже до самой PCB!), то здесь нагрев радиаторов всего лишь чуть выше болевого порога человека (или на его уровне).
Завершая рассмотрение карты, заметим, что весь "хвост" у нее отдан системе питания, где имеется и разъем для подключения внешнего питания от БП.
Что касается TV-out, то на карте установлен кодек Philips 7108, который потенциально поддерживает VIVO.
Более подробно о работе ТВ-выхода с помощью такого кодека можно прочитать в материале Алексея Самсонова и Дмитрия Дорофеева.
Разгон
К сожалению, разгон заблокирован драйверами: частоты видны, их можно "менять", но после тестирования новых установок частоты сбрасываются на начальные. Уже после окончания тестирования было выяснено, что через Auto Detect есть возможность разгона, поэтому в следующем материале мы это проверим.