64 калифорнийских по-прежнему метких стрелка в виде Nvidia Geforce 9600 GT

BFG Geforce 9600 GT OC 512MB PCI-E, ECS Geforce 9600 GT Accelero Edition 512MB PCI-E, Forsa Geforce 9600 GT 512MB PCI-E, Galaxy Geforce 9600 GT Overclocked 512MB PCI-E, Point Of View Geforce 9600 GT 512MB PCI-E, Zotac Geforce 9600 GT AMP! Edition 512MB PCI-E



СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


Nvidia Geforce 9600 GT (G94): Часть 1: Теоретические сведения


Мы протестировали 6 видеокарт на базе Geforce 9600 GT производства BFG, ECS, Forsa, Galaxy, Point of View (PoV) и Zotac. Все ускорители, кроме от PoV и Forsa, имеют повышенные частоты работы. Карты собственного производства — только от ECS и Galaxy. Остальные — референс-платы, купленные партнерами у Nvidia, и произведенные на заводах Flextronics и PC Partner по заказу калифорнийского чип-мейкера.

Платы



BFG Geforce 9600 GT OC 512MB PCI-E
  • GPU: Geforce 9600 GT (G94)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 675/1700 MHz (номинал — 650/1625 МГц)
  • Частоты работы памяти (физическая (эффективная)): 900 (1800) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 64
  • Число текстурных процессоров: 32 (BLF)
  • Число ROPs: 16
  • Размеры: 210x100x15 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: зеленый
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).
ECS Geforce 9600 GT Accelero Edition 512MB PCI-E
  • GPU: Geforce 9600 GT (G94)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 680/1750 MHz (номинал — 650/1625 МГц)
  • Частоты работы памяти (физическая (эффективная)): 930 (1860) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 64
  • Число текстурных процессоров: 32 (BLF)
  • Число ROPs: 16
  • Размеры: 210x130x30 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: синий
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).
Forsa Geforce 9600 GT 512MB PCI-E
  • GPU: Geforce 9600 GT (G94)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 650/1625 MHz (номинал — 650/1625 МГц)
  • Частоты работы памяти (физическая (эффективная)): 900 (1800) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 64
  • Число текстурных процессоров: 32 (BLF)
  • Число ROPs: 16
  • Размеры: 210x100x15 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: зеленый
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).
Point Of View Geforce 9600 GT 512MB PCI-E
  • GPU: Geforce 9600 GT (G94)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 650/1625 MHz (номинал — 650/1625 МГц)
  • Частоты работы памяти (физическая (эффективная)): 900 (1800) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 64
  • Число текстурных процессоров: 32 (BLF)
  • Число ROPs: 16
  • Размеры: 210x100x15 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: зеленый
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).
Galaxy Geforce 9600 GT Overclocked 512MB PCI-E
  • GPU: Geforce 9600 GT (G94)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 675/1625 MHz (номинал — 650/1625 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1000 (2000) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 64
  • Число текстурных процессоров: 32 (BLF)
  • Число ROPs: 16
  • Размеры: 200x100x32 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: синий
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).
Zotac Geforce 9600 GT AMP! Edition 512MB PCI-E
  • GPU: Geforce 9600 GT (G94)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 725/1750 MHz (номинал — 650/1625 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1000 (2000) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 64
  • Число текстурных процессоров: 32 (BLF)
  • Число ROPs: 16
  • Размеры: 210x100x15 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: зеленый
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).


BFG Geforce 9600 GT OC 512MB PCI-E
Point Of View Geforce 9600 GT 512MB PCI-E
Forsa Geforce 9600 GT 512MB PCI-E
Galaxy Geforce 9600 GT Overclocked 512MB PCI-E
ECS Geforce 9600 GT Accelero Edition 512MB PCI-E
Zotac Geforce 9600 GT AMD! Edition 512MB PCI-E
Каждая карта имеет 512 МБ памяти GDDR3 SDRAM, размещенной в 8 микросхемах на лицевой стороне PCB

Микросхемы памяти Samsung (GDDR3). Время выборки у микросхем памяти 1,0 ns, что соответствует частоте работы 1000 (2000) МГц.



Сравнение с эталонным дизайном, вид спереди
Point Of View Geforce 9600 GT 512MB PCI-E Reference card Nvidia Geforce 8800 GT
BFG Geforce 9600 GT OC 512MB PCI-E
Galaxy Geforce 9600 GT Overclocked 512MB PCI-E
Forsa Geforce 9600 GT 512MB PCI-E
ECS Geforce 9600 GT Accelero Edition 512MB PCI-E
Zotac Geforce 9600 GT AMP! Edition 512MB PCI-E


Сравнение с эталонным дизайном, вид сзади
Point Of View Geforce 9600 GT 512MB PCI-E Reference card Nvidia Geforce 8800 GT
BFG Geforce 9600 GT OC 512MB PCI-E
Galaxy Geforce 9600 GT Overclocked 512MB PCI-E
Forsa Geforce 9600 GT 512MB PCI-E
ECS Geforce 9600 GT Accelero Edition 512MB PCI-E
Zotac Geforce 9600 GT AMP! Edition 512MB PCI-E


Понятно, что при схожей архитектуре в плане шины обмена с памятью, разводка PCB не должна сильно отличаться от 8800 GT, что мы и можем наблюдать. Изменения коснулись в основном силового блока (это понятно, ибо потребление ядер несколько отличается), а также несколько упрощена сама PCB, мы видим достаточно большое количество пустых мест на картах. Это все относится к эталонному дизайну 9600 GT, на котором основаны 5 из 6-ти карт (разве что ECS внесла в свой дизайн минорные отличия).

А вот продукт Galaxy имеет свою собственную PCB с полностью переработанной разводкой. Предполагаю, что основой для нее стал также их собственный дизайн PCB от 8800 GT, с рядом упрощений (нет второго вывода на подключение дополнительного питания, а также убран переключатель напряжения, подаваемого на ядро). В результате карта стала чуть короче эталонной.

О кулерах поговорим ниже.

Видеокарты этой серии оснащены гнездом для подключения звукового потока с аудио-карты для передачи его затем на HDMI (с помощью переходника DVI-to-HDMI), то есть сама видеокарта не оснащена аудио-кодеком, но осуществляет прием сигнала от внешней звуковой карты. Поэтому, если кому эта функция важна, следите за тем, чтобы в комплекте поставки видеокарты был аудио-шнурок для этих целей.

У всех карт имеется гнездо TV-выхода, которое уникально по разъему, и для вывода изображения на ТВ как через S-Video, так и по RCA, требуются специальные адаптеры-переходники, поставляемые вместе с картой. Более подробно о ТВ-выходе можно почитать здесь.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также поставляются переходники DVI-to-HDMI (мы помним, что данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник), поэтому проблем с такими мониторами также не должно быть. Максимальные разрешения и частоты:

  • 240 Hz Max Refresh Rate
  • 2048 × 1536 × 32bit x85Hz Max — по аналоговому интерфейсу
  • 2560 × 1600 @ 60Hz Max — по цифровому интерфейсу (все DVI-гнезда с Dual-Link)

Что касается возможностей видеокарт по проигрыванию MPEG2 (DVD-Video), то еще в 2002 году мы изучали этот вопрос, с тех пор мало что поменялось. В зависимости от фильма загрузка CPU при проигрывании на современных видеокартах не поднимается выше 25%.

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Напомним, что карты этих серий требуют дополнительное питание, поэтому с каждой платой поставляются переходники с молекс на 6-пиновый разъем, хотя уже все современные БП имеют такие «хвосты».

Теперь о системах охлаждения (СО). 4 карты из 6-ти являются копиями референс, поэтому оснащены одинаковыми кулерами, ниже мы рассмотрим один такой на примере карты от PoV. Остальные два изделия от ECS и Galaxy имеют уникальные СО, с которыми мы также познакомимся подробно.

Point Of View Geforce 9600 GT 512MB PCI-E Reference cooler Geforce 8800 GT


Как мы видим, СО представляет собой традиционный длинный закрытый радиатор, через который цилиндрический вентилятор прогоняет воздух. Увы, но выходит уже нагретый воздух не за пределы корпуса компьютера, а остается внутри (но тогда пришлось бы ставить двухслотовое устройство, а компании Nvidia так хотелось поблистать сочетанием очень мощной для своей цены карты и узким небольшим кулером, вот и доблисталась: что в ряде системных блоков 8800 GT может нагреваться до 100 градусов, не выводя горячий воздух наружу и нагревая все остальные части внутренностей системного блока.)

Я не зря сравнил две СО: ранее выпущенную вместе с 8800 GT, и новую, поставляемую с 9600 GT. Опытные читатели помнят, что кулер от 8800 GT вызывал серьезные нарекания в плане шума и невысокой эффективности в виду маленького вентилятора. Еще в первом материале по 8800 GT мы рассматривали альтернативный кулер, которым оснащалась карта от Zotac, и который по сути отличался от референс только размерами турбины. А эффект был колоссальным: и нагрев меньше, и шума уже нет. Очевидно тот опыт показался Nvidia полезным, и ныне такие же большие турбины мы видим и на референс СО от 9600 GT.

Galaxy Geforce 9600 GT Overclocked 512MB PCI-E
А вот данные разработчики снова установили двухслотовую СО, которая ранее вызывала очень серьезные нарекания в части шума. Однако теперь эту огреху убрали, оснастив кулер и карту правильной системой слежения за температурой и оборотами, поэтому СО уже работает на малых оборотах турбины, и шума нет.
ECS Geforce 9600 GT Accelero Edition 512MB PCI-E
Компания ECS продолжает традицию снабжать свои карты особым устройством от Arctic Cooling, представляющего собой пассивный радиатор без вентилятора вообще. Мы ранее уже изучали аналогичную СО, поэтому подробно останавливаться не стану. Огромный радиатор выше самой карты на 3 с лишним сантиметра, разумеется, СО — двухслотовая. Теплообмен идет только с ядром с помощи тепловых трубок. А микросхемы памяти имеют свои собственные небольшие радиаторы.


Мы провели исследование температурного режима с помощью утилиты RivaTuner (автор А.Николайчук AKA Unwinder) и получили следующие результаты:

ECS Geforce 9600 GT Accelero Edition 512MB PCI-E



BFG Geforce 9600 GT OC 512MB PCI-E



Point Of View Geforce 9600 GT 512MB PCI-E
Forsa Geforce 9600 GT 512MB PCI-E



Galaxy Geforce 9600 GT Overclocked 512MB PCI-E



Zotac Geforce 9600 GT AMP! Edition 512MB PCI-E



Хорошо видим, как все карты, имеющие эталоанную СО, вне зависимости от частот работы, улучшили охлаждаемость относительно 8800 GT, и нигде температура не подходит близко к критическим значениям.

Более того, продукт ECS с пассивной СО показал самые выдающиеся результаты с учетом бесшумности кулера.

Ниже представлен сам чип — G94 — Geforce 9600 GT. Может для кого-то 500 млн транзисторов это и пустой звук, но еще совсем недавно трудно было себе представить, что такое огромное число транзисторов будет находиться в ядре от ускорителя среднего класса! Кстати, сам кристалл повернут относительно его подошвы на 45 градусов.



Теперь насчет комплектов поставки.

Все карты в базовом номинальном комплекте имеют руководство пользователя, диск с драйверами и утилитами, разветвитель внешнего питания, переходник-адаптер DVI-to-VGA, DVI-to-HMDI адаптер и адаптер компонентного вывода (TV-out). Ниже мы покажем, что предлагается каждым вендором дополнительно.



BFG Geforce 9600 GT OC 512MB PCI-E
Производитель почему-то не положил в комплект адаптер HDMI, хотя переходников DVI-to-VGA два (сегодня уже странно себе представить, что кому-то потребуется подключать два CRT монитора к новой видеокарте). Представитель BFG умолчал об отсутствии упомянутого адаптера, но при этом обращал пристальное внимание на цвет конвертов и наличие логотипов на переходниках. Единого руководства пользователя в комплекте нет, а есть куча листовок и ненужных никому бумажек. А также нет аудио-шнурка для вывода сигнала со звуковой карты на HDMI. Видимо, в американской компании считают, что HDMI вообще никому не нужно.
ECS Geforce 9600 GT Accelero Edition 512MB PCI-E
Этот комплект полностью соответствует базовому набору, имеется также и аудио-шнурок.
Forsa Geforce 9600 GT 512MB PCI-E
Нет адаптера HDMI, но зато есть мало кому нужный кабель TV. Не знаю, минус это или нет. С учетом пока небольшой актуальности HDMI в России, наверно не минус.
Point Of View Geforce 9600 GT 512MB PCI-E
Комплект также не лишен изъянов: нет адаптера компонентного вывода, а также нет аудио-шнурка.
Galaxy Geforce 9600 GT Overclocked 512MB PCI-E
Комплект поставки схож с Forsa, нет HDMI адаптера и аудио-шнурка. Видимо в этой компании также считают, что HDMI нафиг никому не нужен в реализации этой карты :)
Zotac Geforce 9600 GT AMP! Edition 512MB PCI-E
А вот этот комплект, как и у ECS, полноценный.


Плохо то, что ни одна компания не положила в комплект никаких бонусов!

Упаковки.

BFG Geforce 9600 GT OC 512MB PCI-E

Уже традициоанный черный бокс небольших размеров, из которого просто все высыпается, если его открыть. Карта сама хорошо упакована, но запрятана в коробку-самоделку. В общем, остался осадок того, что перед тобой noname-продукт, а не хваленый американский бренд. Про то, что нарисовано на коробке — я вообще умолчу. Мне сложно понять дизайнера из BFG.

ECS Geforce 9600 GT Accelero Edition 512MB PCI-E

Компания традиционно придерживается вертикальной формы упаковки, которая представляет собой супер, внутри которого бокс из белого картона. Весь комплект хорошо разложен по отсекам, сама карта в упаковке из пенополиуретана, поэтому сохранность в процессе перевозки гарантируется. Сам дизайн упаковки очень приятный, яркий и привлекательный.

Forsa Geforce 9600 GT 512MB PCI-E

Когда я издали увидел коробку, то первое, что мне пришло в голову: Баба-Яга на метле (подумалось, что добрались до русских сказок в Китае). Ан нет, при детальном рассмотрении это совсем иной персонаж, нечто человекообразное с секирой (тяжелый вздох: опять очередной монстр с оружием, сколько можно…). Сама коробка из толстого картона, а вот комплект небрежно засунут внутрь (межлу картой и комплектом лишь перегородка, и то и другое может свободно перемещаться внутри коробки при транспортировке, что очень плохо.

Point Of View Geforce 9600 GT 512MB PCI-E

Если на упаковке BFG мы видим что-то невразумительное, то дизайнер этой компании наверно творил сей дизайн под действием чего-то сверхестественного :-). Ибо явно пахнет каким-то авангардизмом. Особо это сочетается с названием компании, что в переводе может быть «Точка зрения». Вот так, дорогие читатели, такими глазами смотрит на вас данная компания. :)

Весь комплект хорошо разложен по отсекам, карта закреплена в распорках, поэтому «болтанка» исключена.

Galaxy Geforce 9600 GT Overclocked 512MB PCI-E

Традиционный синий дизайн у этой фирмы. Очень неплохо! Размытое изображение гепарда хорошо оттеняет скоростные параметры ускорителя. Что касается указанной на коробке утилиты Xtreme Tuner, то ее мы изучим чуть ниже.

Весь комплект, включая карту, плотно разложен в многочисленных отсеках, поэтому все там очень зажато, и карта в процессе транспортировки не повредится.

Zotac Geforce 9600 GT AMP! Edition 512MB PCI-E

Также очень симпатичный дизайн с «драконьей» темой. Упаковка представляет собой супер, в котором находится картонный бокс. Внутри коробки весь комплект тщательно разложен по отсекам, сама карта — в боксике из пенополиуретана. Поэтому сохранность в процессе перевозки гарантирована.



Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core2 (775 Socket)
    • процессор Intel Core2 Extreme QX9650 (3000 MHz);
    • системная плата Gigabyte GA-X38-DQ6 на чипсете Intel X38;
    • оперативная память 2 GB DDR2 SDRAM Corsair 1142MHz (CAS (tCL)=5; RAS to CAS delay (tRCD)=5; Row Precharge (tRP)=5; tRAS=15);
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
    • блок питания Tagan 1100-U95 (1100W).
  • операционная система Windows XP SP2; DirectX 9.0c;
  • операционная система Windows Vista 32bit; DirectX 10.0;
  • монитор Dell 3007WFP (30").
  • драйверы ATI версии CATALYST 8.1; Nvidia версии 169.28/174.12.

VSync отключен.



Как я выше отмечал, в комплекте поставки с картой от Galaxy идет утилита для разгона, а также слежения за температурным режимом. Мне представляется это важным особенно для пользователей MS Windows Vista, ведь в драйверах для этой ОС у Nvidia нет закладок с разгоном.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: ссылка

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • Nvidia Geforce 9600 GT со стандартными параметрами (далее GF9600GT)
  • Nvidia Geforce 8800 GT с тактовыми частотами от 9600 GT, то есть 650/1625/1800 МГц (далее GF8800GT (650))
  • Nvidia Geforce 8800 GT со стандартными параметрами (далее GF8800GT)
  • Nvidia Geforce 8600 GTS со стандартными параметрами (далее GF8600GTS)
  • RADEON HD 3870 со стандартными параметрами (далее HD3870)
  • RADEON HD 3850 со стандартными параметрами (далее HD3850)

Для сравнения результатов Geforce 9600 GT были выбраны именно эти модели видеокарт по следующим причинам: с Geforce 8800 GT её будет интересно сравнить, как со схожим решением из близкого ценового диапазона, с ним же на равных частотах сравниваем, чтобы определить возможные архитектурные изменения и влияние уменьшенного количества блоков ALU и TMU, со старой моделью Geforce 8600 GTS сравниваем, как с прямым предшественником на прошлой архитектуре G8x, оцениваем прирост производительности от измененного количества исполнительных блоков и архитектурных модификаций, с RADEON HD 3870 сравнение будет интересным потому, что это в целом быстрейшее решение от AMD из одночиповых, ну а HD 3850 является прямым конкурентом Geforce 9600 GT, исходя из рекомендованных производителями цен.

К сожалению, исследование производительности в синтетических тестах вновь не будет очень интересным, так как с архитектурной точки зрения в G94 по сравнению с G92 фактически ничего не изменилось, все возможности те же, просто количество ALU и TMU иное, как и рабочие частоты. Будем ждать лета-осени, когда могут появиться реально новые архитектуры GPU… Вообще, хотелось бы сравнить G94 с G92 на равных частотах и с отключенной частью ALU и TMU у G92, чтобы понять, есть ли в G94 какие-то отличия. Но такого сравнения не получается потому, что нет возможности отключения части блоков в G92, а сравнение с аналогично "урезанным" G80 не очень интересно по той причине, что их невозможно сравнять по количеству блоков ROP.

Direct3D 9: Тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:



Традиционно далеко не у всех видеокарт получаются значения, близкие к теоретическому максимуму. Чаще всего результаты синтетики не дотягивают до теории, ближе всего к ним подбираются видеокарты на основе G8x и решения AMD. А вот для видеокарт Nvidia, отличающихся улучшенными TMU, в нашем старом тесте теоретический максимум не достигается. Хотя это соотношение у Geforce 9600 GT оказалось лучше, чем у Geforce 8800 GT. G94, судя по полученным цифрам, способен выбирать более 16 текселей за один такт для 32-битных текстур при билинейной фильтрации, хотя теоретически способен на большее. Возможно, сказывается недостаток пропускной способности памяти…

В случае с малым количеством текстур на пиксель, Geforce 9600 GT идёт почти наравне с Geforce 8800 GT и RADEON HD 3850, в таких случаях все карты ограничены пропускной способностью видеопамяти. Дальше способности блоков ROP раскрываются больше, и в более тяжелых условиях видеокарта на основе нового mid-end чипа с запасом выигрывает у HD 3850, а Geforce 8600 GTS обгоняет более чем в два раза, отставая от Geforce 8800 GT всего лишь в полтора раза. Посмотрим на результаты в тесте филлрейта:



Наш второй синтетический тест измеряет скорость заполнения, и в нём мы видим ту же самую ситуацию, но уже с учетом количества записанных в буфер кадра пикселей. Хорошо видно, что в случаях с 0 и 1 накладываемыми текстурами, производительность ограничена ПСП, а также количеством и рабочей частотой блоков ROP. Всё так же, как и в предыдущем тесте — в ситуациях с большим количеством текстур на пиксель, новая карта выигрывает у конкурента от AMD и заметно опережает предшественника — Geforce 8600 GTS.

Direct3D 9: Тесты Geometry Processing Speed

Рассмотрим пару предельных геометрических тестов, и первым у нас будет самый простой вершинный шейдер, показывающий максимальную пропускную способность по треугольникам:



Так как все чипы основаны на унифицированных архитектурах, их универсальные исполнительные блоки в этом тесте заняты только геометрической работой, и решения показывают высокие результаты, явно упирающиеся не в пиковую производительность унифицированных блоков, а в производительность других блоков, например, triangle setup.

Результаты в очередной раз подтверждают то, что чипы AMD традиционно быстрее обрабатывают геометрию, по сравнению с чипами Nvidia. И хотя разница между Geforce 9600 GT и RADEON HD 3850 невелика, уже тут видно, что решение AMD быстрее в этой задаче. Эффективность выполнения теста в разных режимах у G84 и RV670 примерно одинакова, пиковая производительность в FFP, VS 1.1 и VS 2.0 отличается не сильно. Только у всех представителей архитектуры G9x режим FFP оказался заметно быстрее.

Мы убрали из рассмотрения промежуточные тесты на скорость обработки геометрии с одним источником освещения, и сразу же переходим к рассмотрению самой сложной геометрической задачи с тремя источниками света, включающей статические и динамические переходы:



Вот теперь видна разница между всеми участниками тестов, особенно заметно увеличилась разница между скоростью решений AMD и Nvidia. RADEON HD 3850 опережает все остальные решения, и даже в нашей самой сложной геометрической задаче его возможности не раскрыты полностью, результаты в разных режимах равны, кроме теста с динамическими переходами. Отмечаем традиционные противоположные слабые места вершинных блоков архитектур AMD и Nvidia — динамические переходы вызывают большее падение производительности у чипов первой, а статические — у чипов второй. Также отметим, что на трех смешанных источниках света наличие оптимизированной эмуляции FFP у G9x стало ещё заметнее.

Geforce 9600 GT показывает результат хоть и ниже, чем у HD 3850, но он сильно опережает Geforce 8600 GTS, почти в два раза, как и должно быть, исходя из теории. И от Geforce 8800 GT на тех же частотах отстаёт вполне объяснимо теоретически, хотя и не в 1.75 раза. В целом, все чипы неплохо проявляют себя в тестах, и способны использовать все свои универсальные потоковые процессоры для решения геометрических задач, но в реальных приложениях универсальные шейдерные процессоры заняты в основном пиксельными расчетами, к исследованию производительности которых мы и переходим.

Direct3D 9: Тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, является очень простой для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0.



Эти тесты слишком просты для современных архитектур и не показывают их истинную силу. В простых тестах производительность ограничена скоростью текстурных выборок и филлрейтом, что хорошо видно по относительно слабым результатам RADEON HD 3850. Geforce 9600 GT его обгоняет в таких тестах с запасом, сказывается сравнительно малое количеством TMU у чипа AMD. А вот в более сложных PS 2.0 тестах результаты становятся интереснее, и в самом сложном (Phong с тремя источниками света) решение AMD даже выходит вперёд, опережая в том числе и карту на основе чипа G92.

Geforce 9600 GT показывает отличные результаты, в сложных PS 2.0 тестах более чем в два раза обгоняя своего предшественника — Geforce 8600 GTS. В наиболее сложных тестах разница между ними весьма велика. От Geforce 8800 GT новая карта отстаёт меньше чем должна теоретически, хотя архитектурно чип, по сравнению с G92, изменился мало. Видимо, в этих тестах на результате сильно сказывается и ПСП, которая у данных видеокарт почти равна. Посмотрим на результаты тестов более сложных пиксельных программ промежуточных версий:



В сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, поэтому единственный RADEON сильно отстаёт от решений на основе G9x, показывая результат, конкурирующий лишь с Geforce 8600 GTS. Ну а герой сегодняшнего обзора оказался быстрее его более чем в полтора раза. Это первый тест, где практическая разница между Geforce 8800 GT и 9600 GT получилась настолько близкой к теоретической (73% на практике и 75% в теории, при равных тактовых частотах).

Во втором тесте, более интенсивном вычислительно, уже решение AMD выходит вперёд всех, и даже карта на G92 проигрывает ему. Эта задача явно лучше подходит для архитектуры R6xx с большим числом вычислительных блоков. Что касается сравнения Geforce 9600 GT с 8600 GTS, новая mid-end карта Nvidia выигрывает у старой в вычислительном тесте, разница между их производительностью составила 2.5 раза. А вот Geforce 8800 GT на частоте 9600 GT быстрее его лишь в полтора раза, а не в 1.75, как могло быть теоретически.

Direct3D 9: Тесты пиксельных шейдеров New Pixel Shaders

Эти тесты пиксельных шейдеров DirectX 9 ещё сложнее, они делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:



Ситуация между видеокартами в тесте «Frozen Glass» схожа с той, что получилась в предыдущем блоке тестов в тесте «Water». Geforce 9600 GT отстаёт от 8800 GT на 60%, и в два раза опережает Geforce 8600 GTS. В этом тесте карты Nvidia на базе чипов G9x впереди HD 3850, что подтверждает ограничение производительности в тесте скоростью текстурных выборок, прежде всего.

Ранее лидерство во втором тесте «Parallax Mapping» традиционно принадлежало решениям AMD, но выход решений на основе G9x с улучшенными блоками TMU изменил ситуацию. Для параллакс маппинга нужна дополнительная текстурная выборка, поэтому Geforce 8800 GT обгоняют HD 3850, хотя рассматриваемый сегодня Geforce 9600 GT отстаёт от них обоих. Но всего лишь менее чем в полтора раза от G92, зато быстрее G84 снова в 2.5 раза! Рассмотрим эти тесты в модификации с предпочтением выборок из текстур математическим вычислениям, там видеокарта Geforce 9600 GT должна показать ещё более высокие результаты:



Ситуация несколько изменилась, теперь производительность в тестах ещё больше упирается в скорость текстурных блоков, и поэтому новый Geforce 9600 GT опережает RADEON HD 3850 уже в обоих тестах. Не говоря про Geforce 8600 GTS, где во втором тесте разница между ними составила 2.85 раза! Конечно, 9600 GT проигрывает старшему брату на основе G92, но всё же чуть меньше, чем должен теоретически. Кстати, даже на Geforce 8600 GTS варианты шейдеров с большим количеством математических вычислений работают быстрее.

Рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Тесты отличаются тем, что сильно нагружают и ALU и текстурные модули, обе шейдерные программы сложные, длинные, включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D графики
  • Fur — процедурный шейдер, визуализирующий мех



В этих тестах нагрузка на видеокарты уже очень велика, и только такие мощные чипы, как RV670 и G92, справлялись с ней ранее. Теперь к ним добавился и G94. Решение на основе этого чипа опережает карту на базе G84 более чем в два раза в обоих тестах, и отстаёт от карт Geforce 8800 GT на той же частоте более чем на 70%, что близко к теоретической разнице в количестве универсальных процессоров. И хотя решения AMD обеспечивают эффективное исполнение сложных пиксельных шейдеров версии 3.0 с большим количеством ветвлений, новая видеокарта Nvidia в обоих тестах опережает решение AMD, что можно объяснить ускоренными билинейными текстурными выборками в архитектуре G9x. При анализе результатов таких синтетических тестов нужно учитывать, что в реальных приложениях картина может быть несколько иной, если там будет использоваться трилинейная и/или анизотропная фильтрация текстур.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

В новую версию RightMark3D 2.0 вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два полностью новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель!) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Все результаты в «High» получились примерно в полтора раза ниже, чем в «Low». Direct3D 10 тесты процедурной визуализации меха с большим количеством текстурных выборок в очередной раз показывают огромное преимущество решений Nvidia над AMD. Подобной разницы не должно быть, ну как может RADEON HD 3870 отставать от Geforce 8600 GTS, будучи теоретически сильнее его во всём?

Судя по нашим исследованиям, производительность в этом тесте зависит не только от количества и скорости блоков TMU, но и от филлрейта и ПСП. Сравнение результатов Geforce 9600 GT и 8800 GT показывает примерно полуторакратное преимущество старшего варианта, а Geforce 8600 GTS отстаёт от сегодняшнего героя почти в два раза. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится:

Включение суперсэмплинга теоретически увеличивает нагрузку в четыре раза, но на видеокартах Nvidia скорость снижается сильнее, чем на AMD, за счет чего отрыв между ними сокращается, и HD 3870 подтягивается к самой слабой из Geforce. В остальном, с увеличением сложности шейдера и нагрузки на видеочип, ничего не меняется, разница между Geforce 8800 GT и новым 9600 GT остаётся примерно той же, хотя на общую скорость филлрейт и ПСП влияет уже меньше.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Этот тест интереснее с практической точки зрения, разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются в последних релизах, например, в Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Хотя решения AMD ранее были традиционно сильны в Direct3D 9 тестах parallax mapping, в обновленном D3D10 варианте без суперсэмплинга они могут справиться с задачей лишь на уровне Geforce 8600 GTS. Кроме того, включение самозатенения вызывает на продукции AMD большее падение производительности (более двух раз), по сравнению с полуторакратной разницей для решений Nvidia.

Рассматриваемый нами сегодня Geforce 9600 GT опережает предшественника по ценовой категории в два раза, а разница с Geforce 8800 GT чуть-чуть увеличилась, превысив 1.6 крат. Посмотрим, что изменит включение суперсэмплинга, в прошлом тесте он вызывал большее падение скорости на картах Nvidia…

Полученные значения FPS при включенных суперсэмплинге и самозатенении вновь говорят о тяжелой задаче, совместное включение сразу двух опций: суперсэмплинга и самозатенения, увеличивают нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростью разных видеокарт в целом сохраняется, включение суперсэмплинга сказывается как и в предыдущем случае — карты на чипах AMD значительно улучшают свои показатели относительно решений Nvidia. Но, несмотря на это, даже HD 3870 продолжает отставать от Geforce 9600 GT. Что касается сравнения Geforce 9600 GT с родственниками, он вновь обгоняет Geforce 8600 GTS в два раза, отставая от равночастотного 8800 GT на величину, близкую к теоретическому значению. А без учёта частот, разница между ними составляет около полутора раз.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Мы уже отмечали ранее при анализе результатов наших Direct3D 9 синтетических тестов, что в вычислительно сложных задачах современная архитектура AMD показывает себя зачастую лучше конкурирующей от Nvidia. Так оно получилось и в этом тесте при сражении RADEON HD 3850 и Geforce 9600 GT, да и HD 3870 обгоняет лучшее решение на базе G92.

Производительность Geforce 9600 GT в те же два раза выше скорости «старой» Geforce 8600 GTS. Обновленная mid-end модель на G94 отстаёт от 8800 GT меньше, чем в полтора раза, что немного не соответствует разнице в производительности (количестве и тактовой частоте) универсальных шейдерных блоков. Вероятно, на результаты немного влияет и пропускная способность памяти…

Второй тест шейдерных вычислений носит название Fire, и он ещё более тяжёл для ALU. В нём текстурная выборка только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Вплоть до 2008 года во всех предыдущих тестовых сравнениях видеокарты AMD проваливали этот тест, показывая очень низкие результаты, указывающие на какую-то ошибку. И только тестирование, проведенное при выходе RADEON HD 3870 X2, показало, что результат решений AMD наконец-то стал подобающим и, как видите сами, RADEON HD 3870 и HD 3850 показывают скорость выше, чем у Geforce 8800 GT и Geforce 9600 GT. В следующий раз мы дополнительно проверим эти результаты, немного изменив тест, чтобы исключить возможность специфических оптимизаций…

Ну а в этот раз мы констатируем, что Geforce 9600 GT отстаёт в данном тесте от своего прямого конкурента HD 3850 более чем на 60%. Что касается сравнения видеокарт Nvidia, ситуация там та же, Geforce 8800 GT быстрее 9600 GT более чем в 1.5 раза, а та, в свою очередь, опережает Geforce 8600 GTS примерно в два раза. Что соответствует разнице в мощности ALU/TMU, частотах и количестве исполнительных блоков.

Direct3D 10: Тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое. Производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт несложная, как показали предыдущие исследования, ограничения скорости мощностью шейдерных ALU в тесте не явное, задача ограничена скорее больше ПСП и филлрейтом, чем мощностью чипов. То, что Geforce 9600 GT показывает точно такой же результат, что и Geforce 8800 GT на равной тактовой частоте, подтверждает отсутствие ограничений скоростью ALU/TMU.

Конкуренты Geforce 9600 GT от AMD показывают скорость, близкую к таковой у Geforce 8600 GTS, а сама Geforce 9600 GT опережает их больше, чем в полтора раза. На номинальных частотах новое решение опережает в этом тесте даже 8800 GT, что объясняется её более высокими тактовыми частотами. Возможно, при переносе части вычислений в геометрический шейдер ситуация изменится.

Но в данном случае никаких существенных изменений не произошло. Все видеокарты показывают почти те же результаты при изменении параметра GS load, отвечающем за перенос части вычислений в геометрический шейдер. Единственная разница среди видеокарт Nvidia состоит в падении результатов Geforce 8600 GTS, а карты AMD, наоборот, получили небольшой прирост скорости. И теперь в отстающих именно GF 8600 GTS, которую GF 9600 GT обгоняет всё в те же два раза. Посмотрим, что изменится в следующем тесте…

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

И снова относительные результаты в разных режимах соответствуют нагрузке: во всех случаях производительность хорошо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть в два раза медленней. А производительность Geforce 9600 GT в этот раз даже немного выше, чем у равночастотного варианта GF 8800 GT, хотя эту разницу можно смело списать на погрешность измерения… Снова карты AMD проигрывают всем решениям Nvidia в этом тесте при любой геометрической сложности. Даже Geforce 8600 GTS, проигрывая сегодняшнему герою обзора почти двукратно, оказалась сильнее, чем карты RADEON.

В целом, наблюдается то же самое, что и в предыдущем тесте — Geforce 9600 GT идёт на уровне с 8800 GT. Но цифры могут измениться в следующем тесте, с более активным использованием геометрических шейдеров, также интересно сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

Вот теперь соотношение скоростей изменилось очень сильно. Наглядно видно, что чипы AMD выполняют более сложные геометрические шейдеры эффективнее всех чипов Nvidia. Но посмотрите сами — в очередной раз Nvidia исправляет некоторые недостатки своих архитектур, и Geforce 9600 GT в этих условиях не просто опережает старшего Geforce 8800 GT на 20%, но и практически догоняет младший вариант карты AMD на основе чипа RV670, отставая только от более дорогого старшего! А ведь раньше отставание было значительно больше… Отличный результат для Nvidia!

В остальном, можно отметить, что Geforce 8600 GTS для данного теста безнадёжен, он проигрывает новому mid-end решению почти в четыре раза. Да что там, даже Geforce 8800 GT медленнее того… Что касается сравнения результатов в разных режимах, тут всё как обычно, в конкурентной борьбе видеоплатам AMD не помогает и то, что при переходе от использования «instancing» к геометрическому шейдеру при выводе, видеокарты Nvidia очень сильно теряют в производительности. И у всех карт Geforce на основе чипов архитектуры G9x скорость в «Balanced» режиме получается выше, чем в «Heavy» у RADEON HD 3870. При этом, получаемая в разных режимах картинка не отличается визуально.

Direct3D 10: Скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

И вновь результаты в разных режимах показывают примерно одинаковую картину производительности видеокарт относительно друг друга. Судя по предыдущим исследованиям, на результаты этого теста сильно влияет в том числе и пропускная способность памяти, и чем проще режим, тем большее влияние на скорость она оказывает. В этот раз сравнительные результаты G92 и G94 на одинаковых частотах немного отличаются уже в сторону старшей модели, но в общем, Geforce 9600 GT показывает почти равный с Geforce 8800 GT результат. Geforce 8600 GTS отстаёт от неё почти в три раза уже, RADEON HD 3850 — на треть, а HD 3870 примерно на том же уровне. Посмотрим на результаты этого же теста с увеличенным количеством текстурных выборок:

Ситуация изменилась не слишком сильно, только поменялся номинальный лидер, теперь это опять Geforce 9600 GT, обогнавший старшего брата на G92 совсем немного. Geforce 8600 GTS отстаёт почти столь же сильно, обе карты производства AMD не изменили своей позиции. По мере усложнения задачи, результаты карт уплотняются.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

А вот в тесте «Waves» ситуация уже повернулась в сторону решений AMD, да и Geforce 9600 GT теперь справедливо проигрывает решению более высокого уровня — Geforce 8800 GT. Похоже, что в этом тесте скорость уже зависит в том числе и от мощности TMU, а не только от ПСП и филлрейта. Обе модели семейства RADEON HD 3800 смотрятся очень хорошо, младшая показывает результат на уровне Geforce 8800 GT, почти догоняя того в тяжелых режимах, ну а HD 3870 является явным лидером, не учитывая GF 8800 GT с повышенными частотами. Geforce 8600 GTS привычно проигрывает заменяющему её Geforce 9600 GT около двух раз во всех режимах. Рассмотрим второй вариант теста:

И тут ситуация почти без изменений, хотя с увеличением сложности теста результат серии RADEON HD 3800 стал ещё лучше, по сравнению с картами Nvidia, ведь последние потеряли в скорости значительно больше. Все остальные выводы также остаются в силе — в легком режиме скорость немного ограничивается ПСП, а в тяжёлых большую роль играют блоки TMU и ROP. Видно, что положение плат AMD улучшилось в тестах VTF, ранее мы отмечали, что решения Nvidia лучше справляются с тестами текстурных выборок из вершинных шейдеров по сравнению с картами AMD, а теперь ситуация стала для них намного лучше.

Выводы по синтетическим тестам

На основе результатов синтетических тестов Geforce 9600 GT и других моделей из разных ценовых диапазонов мы убедились в том, что новое mid-end решение Nvidia получилось весьма мощным и конкурентоспособным. Оно не только опережает своего прямого предшественника Geforce 8600 GTS примерно в два раза, но в большинстве тестов остаётся впереди RADEON HD 3850, обладающего примерно той же рекомендуемой ценой, и даже может составить конкуренцию более дорогой видеокарте AMD — RADEON HD 3870, особенно с учётом фабрично разогнанных вариантов от партнеров компании.

Сама по себе архитектура G9x по сравнению с G8x изменилась не слишком сильно, она всё так же отличается высокой вычислительной производительностью, нацелена на современные и будущие приложения с большим количеством сложных шейдеров всех типов. Высокая эффективность универсальных процессоров, достаточное количество блоков ALU, TMU и ROP, а также высокие рабочие частоты позволяют рассмотренному чипу показывать отличные результаты во всех синтетических тестах.

Архитектура чипа была дополнительно улучшена, по сравнению с предыдущей G8x, внесены изменения в блоки TMU и ROP. Текстурные модули в определенных условиях умеют выбирать вдвое больше данных, по сравнению с G80, а блоки ROP оснащены новой технологией компрессии, улучшающей эффективность использования видеопамяти. Всё это, вместе с повышенной частотой, приводит к тому, что Geforce 9600 GT во многих случаях не отстаёт от Geforce 8800 GT, обладающего на 75% большим количеством ALU и TMU, а иногда даже опережает! У видеокарты фактически нет слабых мест, она очень хорошо сбалансирована, обладает достаточным количеством всех исполнительных блоков, широкой для этого ценового диапазона шиной памяти и высокой её пропускной способностью. Всё это позволяет надеяться, что Geforce 9600 GT покажет отличные результаты в игровых тестах и составит очень мощную конкуренцию решениям AMD.

Как раз в следующей части статьи и будет самое главное — тесты нового решения Nvidia в современных игровых приложениях, которые должны показать справедливость выводов, сделанных при анализе результатов синтетических тестов. Эти результаты должны быть значительно интереснее синтетических, ведь ситуация в играх почти всегда сильнее зависит от скорости текстурирования и филлрейта, чем от мощности ALU и блоков обработки геометрии, как в наших специализированных тестах…



Nvidia Geforce 9600 GT (G94) — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией TAGAN
Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia




Дополнительно

64 калифорнийских по-прежнему метких стрелка в виде Nvidia Geforce 9600 GT (от BFG, ECS, Forsa, Galaxy, Point Of View, Zotac)

64 калифорнийских по-прежнему метких стрелка в виде Nvidia Geforce 9600 GT

BFG Geforce 9600 GT OC 512MB PCI-E, ECS Geforce 9600 GT Accelero Edition 512MB PCI-E, Forsa Geforce 9600 GT 512MB PCI-E, Galaxy Geforce 9600 GT Overclocked 512MB PCI-E, Point Of View Geforce 9600 GT 512MB PCI-E, Zotac Geforce 9600 GT AMP! Edition 512MB PCI-E


СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


Nvidia Geforce 9600 GT (G94): Часть 1: Теоретические сведения


Мы протестировали 6 видеокарт на базе Geforce 9600 GT производства BFG, ECS, Forsa, Galaxy, Point of View (PoV) и Zotac. Все ускорители, кроме от PoV и Forsa, имеют повышенные частоты работы. Карты собственного производства — только от ECS и Galaxy. Остальные — референс-платы, купленные партнерами у Nvidia, и произведенные на заводах Flextronics и PC Partner по заказу калифорнийского чип-мейкера.

Платы



BFG Geforce 9600 GT OC 512MB PCI-E
  • GPU: Geforce 9600 GT (G94)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 675/1700 MHz (номинал — 650/1625 МГц)
  • Частоты работы памяти (физическая (эффективная)): 900 (1800) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 64
  • Число текстурных процессоров: 32 (BLF)
  • Число ROPs: 16
  • Размеры: 210x100x15 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: зеленый
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).
ECS Geforce 9600 GT Accelero Edition 512MB PCI-E
  • GPU: Geforce 9600 GT (G94)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 680/1750 MHz (номинал — 650/1625 МГц)
  • Частоты работы памяти (физическая (эффективная)): 930 (1860) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 64
  • Число текстурных процессоров: 32 (BLF)
  • Число ROPs: 16
  • Размеры: 210x130x30 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: синий
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).
Forsa Geforce 9600 GT 512MB PCI-E
  • GPU: Geforce 9600 GT (G94)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 650/1625 MHz (номинал — 650/1625 МГц)
  • Частоты работы памяти (физическая (эффективная)): 900 (1800) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 64
  • Число текстурных процессоров: 32 (BLF)
  • Число ROPs: 16
  • Размеры: 210x100x15 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: зеленый
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).
Point Of View Geforce 9600 GT 512MB PCI-E
  • GPU: Geforce 9600 GT (G94)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 650/1625 MHz (номинал — 650/1625 МГц)
  • Частоты работы памяти (физическая (эффективная)): 900 (1800) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 64
  • Число текстурных процессоров: 32 (BLF)
  • Число ROPs: 16
  • Размеры: 210x100x15 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: зеленый
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).
Galaxy Geforce 9600 GT Overclocked 512MB PCI-E
  • GPU: Geforce 9600 GT (G94)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 675/1625 MHz (номинал — 650/1625 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1000 (2000) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 64
  • Число текстурных процессоров: 32 (BLF)
  • Число ROPs: 16
  • Размеры: 200x100x32 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: синий
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).
Zotac Geforce 9600 GT AMP! Edition 512MB PCI-E
  • GPU: Geforce 9600 GT (G94)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 725/1750 MHz (номинал — 650/1625 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1000 (2000) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 64
  • Число текстурных процессоров: 32 (BLF)
  • Число ROPs: 16
  • Размеры: 210x100x15 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: зеленый
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).


BFG Geforce 9600 GT OC 512MB PCI-E
Point Of View Geforce 9600 GT 512MB PCI-E
Forsa Geforce 9600 GT 512MB PCI-E
Galaxy Geforce 9600 GT Overclocked 512MB PCI-E
ECS Geforce 9600 GT Accelero Edition 512MB PCI-E
Zotac Geforce 9600 GT AMD! Edition 512MB PCI-E
Каждая карта имеет 512 МБ памяти GDDR3 SDRAM, размещенной в 8 микросхемах на лицевой стороне PCB

Микросхемы памяти Samsung (GDDR3). Время выборки у микросхем памяти 1,0 ns, что соответствует частоте работы 1000 (2000) МГц.



Сравнение с эталонным дизайном, вид спереди
Point Of View Geforce 9600 GT 512MB PCI-E Reference card Nvidia Geforce 8800 GT
BFG Geforce 9600 GT OC 512MB PCI-E
Galaxy Geforce 9600 GT Overclocked 512MB PCI-E
Forsa Geforce 9600 GT 512MB PCI-E
ECS Geforce 9600 GT Accelero Edition 512MB PCI-E
Zotac Geforce 9600 GT AMP! Edition 512MB PCI-E


Сравнение с эталонным дизайном, вид сзади
Point Of View Geforce 9600 GT 512MB PCI-E Reference card Nvidia Geforce 8800 GT
BFG Geforce 9600 GT OC 512MB PCI-E
Galaxy Geforce 9600 GT Overclocked 512MB PCI-E
Forsa Geforce 9600 GT 512MB PCI-E
ECS Geforce 9600 GT Accelero Edition 512MB PCI-E
Zotac Geforce 9600 GT AMP! Edition 512MB PCI-E


Понятно, что при схожей архитектуре в плане шины обмена с памятью, разводка PCB не должна сильно отличаться от 8800 GT, что мы и можем наблюдать. Изменения коснулись в основном силового блока (это понятно, ибо потребление ядер несколько отличается), а также несколько упрощена сама PCB, мы видим достаточно большое количество пустых мест на картах. Это все относится к эталонному дизайну 9600 GT, на котором основаны 5 из 6-ти карт (разве что ECS внесла в свой дизайн минорные отличия).

А вот продукт Galaxy имеет свою собственную PCB с полностью переработанной разводкой. Предполагаю, что основой для нее стал также их собственный дизайн PCB от 8800 GT, с рядом упрощений (нет второго вывода на подключение дополнительного питания, а также убран переключатель напряжения, подаваемого на ядро). В результате карта стала чуть короче эталонной.

О кулерах поговорим ниже.

Видеокарты этой серии оснащены гнездом для подключения звукового потока с аудио-карты для передачи его затем на HDMI (с помощью переходника DVI-to-HDMI), то есть сама видеокарта не оснащена аудио-кодеком, но осуществляет прием сигнала от внешней звуковой карты. Поэтому, если кому эта функция важна, следите за тем, чтобы в комплекте поставки видеокарты был аудио-шнурок для этих целей.

У всех карт имеется гнездо TV-выхода, которое уникально по разъему, и для вывода изображения на ТВ как через S-Video, так и по RCA, требуются специальные адаптеры-переходники, поставляемые вместе с картой. Более подробно о ТВ-выходе можно почитать здесь.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также поставляются переходники DVI-to-HDMI (мы помним, что данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник), поэтому проблем с такими мониторами также не должно быть. Максимальные разрешения и частоты:

  • 240 Hz Max Refresh Rate
  • 2048 × 1536 × 32bit x85Hz Max — по аналоговому интерфейсу
  • 2560 × 1600 @ 60Hz Max — по цифровому интерфейсу (все DVI-гнезда с Dual-Link)

Что касается возможностей видеокарт по проигрыванию MPEG2 (DVD-Video), то еще в 2002 году мы изучали этот вопрос, с тех пор мало что поменялось. В зависимости от фильма загрузка CPU при проигрывании на современных видеокартах не поднимается выше 25%.

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Напомним, что карты этих серий требуют дополнительное питание, поэтому с каждой платой поставляются переходники с молекс на 6-пиновый разъем, хотя уже все современные БП имеют такие «хвосты».

Теперь о системах охлаждения (СО). 4 карты из 6-ти являются копиями референс, поэтому оснащены одинаковыми кулерами, ниже мы рассмотрим один такой на примере карты от PoV. Остальные два изделия от ECS и Galaxy имеют уникальные СО, с которыми мы также познакомимся подробно.

Point Of View Geforce 9600 GT 512MB PCI-E Reference cooler Geforce 8800 GT


Как мы видим, СО представляет собой традиционный длинный закрытый радиатор, через который цилиндрический вентилятор прогоняет воздух. Увы, но выходит уже нагретый воздух не за пределы корпуса компьютера, а остается внутри (но тогда пришлось бы ставить двухслотовое устройство, а компании Nvidia так хотелось поблистать сочетанием очень мощной для своей цены карты и узким небольшим кулером, вот и доблисталась: что в ряде системных блоков 8800 GT может нагреваться до 100 градусов, не выводя горячий воздух наружу и нагревая все остальные части внутренностей системного блока.)

Я не зря сравнил две СО: ранее выпущенную вместе с 8800 GT, и новую, поставляемую с 9600 GT. Опытные читатели помнят, что кулер от 8800 GT вызывал серьезные нарекания в плане шума и невысокой эффективности в виду маленького вентилятора. Еще в первом материале по 8800 GT мы рассматривали альтернативный кулер, которым оснащалась карта от Zotac, и который по сути отличался от референс только размерами турбины. А эффект был колоссальным: и нагрев меньше, и шума уже нет. Очевидно тот опыт показался Nvidia полезным, и ныне такие же большие турбины мы видим и на референс СО от 9600 GT.

Galaxy Geforce 9600 GT Overclocked 512MB PCI-E
А вот данные разработчики снова установили двухслотовую СО, которая ранее вызывала очень серьезные нарекания в части шума. Однако теперь эту огреху убрали, оснастив кулер и карту правильной системой слежения за температурой и оборотами, поэтому СО уже работает на малых оборотах турбины, и шума нет.
ECS Geforce 9600 GT Accelero Edition 512MB PCI-E
Компания ECS продолжает традицию снабжать свои карты особым устройством от Arctic Cooling, представляющего собой пассивный радиатор без вентилятора вообще. Мы ранее уже изучали аналогичную СО, поэтому подробно останавливаться не стану. Огромный радиатор выше самой карты на 3 с лишним сантиметра, разумеется, СО — двухслотовая. Теплообмен идет только с ядром с помощи тепловых трубок. А микросхемы памяти имеют свои собственные небольшие радиаторы.


Мы провели исследование температурного режима с помощью утилиты RivaTuner (автор А.Николайчук AKA Unwinder) и получили следующие результаты:

ECS Geforce 9600 GT Accelero Edition 512MB PCI-E



BFG Geforce 9600 GT OC 512MB PCI-E



Point Of View Geforce 9600 GT 512MB PCI-E
Forsa Geforce 9600 GT 512MB PCI-E



Galaxy Geforce 9600 GT Overclocked 512MB PCI-E



Zotac Geforce 9600 GT AMP! Edition 512MB PCI-E



Хорошо видим, как все карты, имеющие эталоанную СО, вне зависимости от частот работы, улучшили охлаждаемость относительно 8800 GT, и нигде температура не подходит близко к критическим значениям.

Более того, продукт ECS с пассивной СО показал самые выдающиеся результаты с учетом бесшумности кулера.

Ниже представлен сам чип — G94 — Geforce 9600 GT. Может для кого-то 500 млн транзисторов это и пустой звук, но еще совсем недавно трудно было себе представить, что такое огромное число транзисторов будет находиться в ядре от ускорителя среднего класса! Кстати, сам кристалл повернут относительно его подошвы на 45 градусов.



Теперь насчет комплектов поставки.

Все карты в базовом номинальном комплекте имеют руководство пользователя, диск с драйверами и утилитами, разветвитель внешнего питания, переходник-адаптер DVI-to-VGA, DVI-to-HMDI адаптер и адаптер компонентного вывода (TV-out). Ниже мы покажем, что предлагается каждым вендором дополнительно.



BFG Geforce 9600 GT OC 512MB PCI-E
Производитель почему-то не положил в комплект адаптер HDMI, хотя переходников DVI-to-VGA два (сегодня уже странно себе представить, что кому-то потребуется подключать два CRT монитора к новой видеокарте). Представитель BFG умолчал об отсутствии упомянутого адаптера, но при этом обращал пристальное внимание на цвет конвертов и наличие логотипов на переходниках. Единого руководства пользователя в комплекте нет, а есть куча листовок и ненужных никому бумажек. А также нет аудио-шнурка для вывода сигнала со звуковой карты на HDMI. Видимо, в американской компании считают, что HDMI вообще никому не нужно.
ECS Geforce 9600 GT Accelero Edition 512MB PCI-E
Этот комплект полностью соответствует базовому набору, имеется также и аудио-шнурок.
Forsa Geforce 9600 GT 512MB PCI-E
Нет адаптера HDMI, но зато есть мало кому нужный кабель TV. Не знаю, минус это или нет. С учетом пока небольшой актуальности HDMI в России, наверно не минус.
Point Of View Geforce 9600 GT 512MB PCI-E
Комплект также не лишен изъянов: нет адаптера компонентного вывода, а также нет аудио-шнурка.
Galaxy Geforce 9600 GT Overclocked 512MB PCI-E
Комплект поставки схож с Forsa, нет HDMI адаптера и аудио-шнурка. Видимо в этой компании также считают, что HDMI нафиг никому не нужен в реализации этой карты :)
Zotac Geforce 9600 GT AMP! Edition 512MB PCI-E
А вот этот комплект, как и у ECS, полноценный.


Плохо то, что ни одна компания не положила в комплект никаких бонусов!

Упаковки.

BFG Geforce 9600 GT OC 512MB PCI-E

Уже традициоанный черный бокс небольших размеров, из которого просто все высыпается, если его открыть. Карта сама хорошо упакована, но запрятана в коробку-самоделку. В общем, остался осадок того, что перед тобой noname-продукт, а не хваленый американский бренд. Про то, что нарисовано на коробке — я вообще умолчу. Мне сложно понять дизайнера из BFG.

ECS Geforce 9600 GT Accelero Edition 512MB PCI-E

Компания традиционно придерживается вертикальной формы упаковки, которая представляет собой супер, внутри которого бокс из белого картона. Весь комплект хорошо разложен по отсекам, сама карта в упаковке из пенополиуретана, поэтому сохранность в процессе перевозки гарантируется. Сам дизайн упаковки очень приятный, яркий и привлекательный.

Forsa Geforce 9600 GT 512MB PCI-E

Когда я издали увидел коробку, то первое, что мне пришло в голову: Баба-Яга на метле (подумалось, что добрались до русских сказок в Китае). Ан нет, при детальном рассмотрении это совсем иной персонаж, нечто человекообразное с секирой (тяжелый вздох: опять очередной монстр с оружием, сколько можно…). Сама коробка из толстого картона, а вот комплект небрежно засунут внутрь (межлу картой и комплектом лишь перегородка, и то и другое может свободно перемещаться внутри коробки при транспортировке, что очень плохо.

Point Of View Geforce 9600 GT 512MB PCI-E

Если на упаковке BFG мы видим что-то невразумительное, то дизайнер этой компании наверно творил сей дизайн под действием чего-то сверхестественного :-). Ибо явно пахнет каким-то авангардизмом. Особо это сочетается с названием компании, что в переводе может быть «Точка зрения». Вот так, дорогие читатели, такими глазами смотрит на вас данная компания. :)

Весь комплект хорошо разложен по отсекам, карта закреплена в распорках, поэтому «болтанка» исключена.

Galaxy Geforce 9600 GT Overclocked 512MB PCI-E

Традиционный синий дизайн у этой фирмы. Очень неплохо! Размытое изображение гепарда хорошо оттеняет скоростные параметры ускорителя. Что касается указанной на коробке утилиты Xtreme Tuner, то ее мы изучим чуть ниже.

Весь комплект, включая карту, плотно разложен в многочисленных отсеках, поэтому все там очень зажато, и карта в процессе транспортировки не повредится.

Zotac Geforce 9600 GT AMP! Edition 512MB PCI-E

Также очень симпатичный дизайн с «драконьей» темой. Упаковка представляет собой супер, в котором находится картонный бокс. Внутри коробки весь комплект тщательно разложен по отсекам, сама карта — в боксике из пенополиуретана. Поэтому сохранность в процессе перевозки гарантирована.



Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core2 (775 Socket)
    • процессор Intel Core2 Extreme QX9650 (3000 MHz);
    • системная плата Gigabyte GA-X38-DQ6 на чипсете Intel X38;
    • оперативная память 2 GB DDR2 SDRAM Corsair 1142MHz (CAS (tCL)=5; RAS to CAS delay (tRCD)=5; Row Precharge (tRP)=5; tRAS=15);
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
    • блок питания Tagan 1100-U95 (1100W).
  • операционная система Windows XP SP2; DirectX 9.0c;
  • операционная система Windows Vista 32bit; DirectX 10.0;
  • монитор Dell 3007WFP (30").
  • драйверы ATI версии CATALYST 8.1; Nvidia версии 169.28/174.12.

VSync отключен.



Как я выше отмечал, в комплекте поставки с картой от Galaxy идет утилита для разгона, а также слежения за температурным режимом. Мне представляется это важным особенно для пользователей MS Windows Vista, ведь в драйверах для этой ОС у Nvidia нет закладок с разгоном.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: ссылка

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • Nvidia Geforce 9600 GT со стандартными параметрами (далее GF9600GT)
  • Nvidia Geforce 8800 GT с тактовыми частотами от 9600 GT, то есть 650/1625/1800 МГц (далее GF8800GT (650))
  • Nvidia Geforce 8800 GT со стандартными параметрами (далее GF8800GT)
  • Nvidia Geforce 8600 GTS со стандартными параметрами (далее GF8600GTS)
  • RADEON HD 3870 со стандартными параметрами (далее HD3870)
  • RADEON HD 3850 со стандартными параметрами (далее HD3850)

Для сравнения результатов Geforce 9600 GT были выбраны именно эти модели видеокарт по следующим причинам: с Geforce 8800 GT её будет интересно сравнить, как со схожим решением из близкого ценового диапазона, с ним же на равных частотах сравниваем, чтобы определить возможные архитектурные изменения и влияние уменьшенного количества блоков ALU и TMU, со старой моделью Geforce 8600 GTS сравниваем, как с прямым предшественником на прошлой архитектуре G8x, оцениваем прирост производительности от измененного количества исполнительных блоков и архитектурных модификаций, с RADEON HD 3870 сравнение будет интересным потому, что это в целом быстрейшее решение от AMD из одночиповых, ну а HD 3850 является прямым конкурентом Geforce 9600 GT, исходя из рекомендованных производителями цен.

К сожалению, исследование производительности в синтетических тестах вновь не будет очень интересным, так как с архитектурной точки зрения в G94 по сравнению с G92 фактически ничего не изменилось, все возможности те же, просто количество ALU и TMU иное, как и рабочие частоты. Будем ждать лета-осени, когда могут появиться реально новые архитектуры GPU… Вообще, хотелось бы сравнить G94 с G92 на равных частотах и с отключенной частью ALU и TMU у G92, чтобы понять, есть ли в G94 какие-то отличия. Но такого сравнения не получается потому, что нет возможности отключения части блоков в G92, а сравнение с аналогично "урезанным" G80 не очень интересно по той причине, что их невозможно сравнять по количеству блоков ROP.

Direct3D 9: Тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:



Традиционно далеко не у всех видеокарт получаются значения, близкие к теоретическому максимуму. Чаще всего результаты синтетики не дотягивают до теории, ближе всего к ним подбираются видеокарты на основе G8x и решения AMD. А вот для видеокарт Nvidia, отличающихся улучшенными TMU, в нашем старом тесте теоретический максимум не достигается. Хотя это соотношение у Geforce 9600 GT оказалось лучше, чем у Geforce 8800 GT. G94, судя по полученным цифрам, способен выбирать более 16 текселей за один такт для 32-битных текстур при билинейной фильтрации, хотя теоретически способен на большее. Возможно, сказывается недостаток пропускной способности памяти…

В случае с малым количеством текстур на пиксель, Geforce 9600 GT идёт почти наравне с Geforce 8800 GT и RADEON HD 3850, в таких случаях все карты ограничены пропускной способностью видеопамяти. Дальше способности блоков ROP раскрываются больше, и в более тяжелых условиях видеокарта на основе нового mid-end чипа с запасом выигрывает у HD 3850, а Geforce 8600 GTS обгоняет более чем в два раза, отставая от Geforce 8800 GT всего лишь в полтора раза. Посмотрим на результаты в тесте филлрейта:



Наш второй синтетический тест измеряет скорость заполнения, и в нём мы видим ту же самую ситуацию, но уже с учетом количества записанных в буфер кадра пикселей. Хорошо видно, что в случаях с 0 и 1 накладываемыми текстурами, производительность ограничена ПСП, а также количеством и рабочей частотой блоков ROP. Всё так же, как и в предыдущем тесте — в ситуациях с большим количеством текстур на пиксель, новая карта выигрывает у конкурента от AMD и заметно опережает предшественника — Geforce 8600 GTS.

Direct3D 9: Тесты Geometry Processing Speed

Рассмотрим пару предельных геометрических тестов, и первым у нас будет самый простой вершинный шейдер, показывающий максимальную пропускную способность по треугольникам:



Так как все чипы основаны на унифицированных архитектурах, их универсальные исполнительные блоки в этом тесте заняты только геометрической работой, и решения показывают высокие результаты, явно упирающиеся не в пиковую производительность унифицированных блоков, а в производительность других блоков, например, triangle setup.

Результаты в очередной раз подтверждают то, что чипы AMD традиционно быстрее обрабатывают геометрию, по сравнению с чипами Nvidia. И хотя разница между Geforce 9600 GT и RADEON HD 3850 невелика, уже тут видно, что решение AMD быстрее в этой задаче. Эффективность выполнения теста в разных режимах у G84 и RV670 примерно одинакова, пиковая производительность в FFP, VS 1.1 и VS 2.0 отличается не сильно. Только у всех представителей архитектуры G9x режим FFP оказался заметно быстрее.

Мы убрали из рассмотрения промежуточные тесты на скорость обработки геометрии с одним источником освещения, и сразу же переходим к рассмотрению самой сложной геометрической задачи с тремя источниками света, включающей статические и динамические переходы:



Вот теперь видна разница между всеми участниками тестов, особенно заметно увеличилась разница между скоростью решений AMD и Nvidia. RADEON HD 3850 опережает все остальные решения, и даже в нашей самой сложной геометрической задаче его возможности не раскрыты полностью, результаты в разных режимах равны, кроме теста с динамическими переходами. Отмечаем традиционные противоположные слабые места вершинных блоков архитектур AMD и Nvidia — динамические переходы вызывают большее падение производительности у чипов первой, а статические — у чипов второй. Также отметим, что на трех смешанных источниках света наличие оптимизированной эмуляции FFP у G9x стало ещё заметнее.

Geforce 9600 GT показывает результат хоть и ниже, чем у HD 3850, но он сильно опережает Geforce 8600 GTS, почти в два раза, как и должно быть, исходя из теории. И от Geforce 8800 GT на тех же частотах отстаёт вполне объяснимо теоретически, хотя и не в 1.75 раза. В целом, все чипы неплохо проявляют себя в тестах, и способны использовать все свои универсальные потоковые процессоры для решения геометрических задач, но в реальных приложениях универсальные шейдерные процессоры заняты в основном пиксельными расчетами, к исследованию производительности которых мы и переходим.

Direct3D 9: Тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, является очень простой для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0.



Эти тесты слишком просты для современных архитектур и не показывают их истинную силу. В простых тестах производительность ограничена скоростью текстурных выборок и филлрейтом, что хорошо видно по относительно слабым результатам RADEON HD 3850. Geforce 9600 GT его обгоняет в таких тестах с запасом, сказывается сравнительно малое количеством TMU у чипа AMD. А вот в более сложных PS 2.0 тестах результаты становятся интереснее, и в самом сложном (Phong с тремя источниками света) решение AMD даже выходит вперёд, опережая в том числе и карту на основе чипа G92.

Geforce 9600 GT показывает отличные результаты, в сложных PS 2.0 тестах более чем в два раза обгоняя своего предшественника — Geforce 8600 GTS. В наиболее сложных тестах разница между ними весьма велика. От Geforce 8800 GT новая карта отстаёт меньше чем должна теоретически, хотя архитектурно чип, по сравнению с G92, изменился мало. Видимо, в этих тестах на результате сильно сказывается и ПСП, которая у данных видеокарт почти равна. Посмотрим на результаты тестов более сложных пиксельных программ промежуточных версий:



В сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, поэтому единственный RADEON сильно отстаёт от решений на основе G9x, показывая результат, конкурирующий лишь с Geforce 8600 GTS. Ну а герой сегодняшнего обзора оказался быстрее его более чем в полтора раза. Это первый тест, где практическая разница между Geforce 8800 GT и 9600 GT получилась настолько близкой к теоретической (73% на практике и 75% в теории, при равных тактовых частотах).

Во втором тесте, более интенсивном вычислительно, уже решение AMD выходит вперёд всех, и даже карта на G92 проигрывает ему. Эта задача явно лучше подходит для архитектуры R6xx с большим числом вычислительных блоков. Что касается сравнения Geforce 9600 GT с 8600 GTS, новая mid-end карта Nvidia выигрывает у старой в вычислительном тесте, разница между их производительностью составила 2.5 раза. А вот Geforce 8800 GT на частоте 9600 GT быстрее его лишь в полтора раза, а не в 1.75, как могло быть теоретически.

Direct3D 9: Тесты пиксельных шейдеров New Pixel Shaders

Эти тесты пиксельных шейдеров DirectX 9 ещё сложнее, они делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:



Ситуация между видеокартами в тесте «Frozen Glass» схожа с той, что получилась в предыдущем блоке тестов в тесте «Water». Geforce 9600 GT отстаёт от 8800 GT на 60%, и в два раза опережает Geforce 8600 GTS. В этом тесте карты Nvidia на базе чипов G9x впереди HD 3850, что подтверждает ограничение производительности в тесте скоростью текстурных выборок, прежде всего.

Ранее лидерство во втором тесте «Parallax Mapping» традиционно принадлежало решениям AMD, но выход решений на основе G9x с улучшенными блоками TMU изменил ситуацию. Для параллакс маппинга нужна дополнительная текстурная выборка, поэтому Geforce 8800 GT обгоняют HD 3850, хотя рассматриваемый сегодня Geforce 9600 GT отстаёт от них обоих. Но всего лишь менее чем в полтора раза от G92, зато быстрее G84 снова в 2.5 раза! Рассмотрим эти тесты в модификации с предпочтением выборок из текстур математическим вычислениям, там видеокарта Geforce 9600 GT должна показать ещё более высокие результаты:



Ситуация несколько изменилась, теперь производительность в тестах ещё больше упирается в скорость текстурных блоков, и поэтому новый Geforce 9600 GT опережает RADEON HD 3850 уже в обоих тестах. Не говоря про Geforce 8600 GTS, где во втором тесте разница между ними составила 2.85 раза! Конечно, 9600 GT проигрывает старшему брату на основе G92, но всё же чуть меньше, чем должен теоретически. Кстати, даже на Geforce 8600 GTS варианты шейдеров с большим количеством математических вычислений работают быстрее.

Рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Тесты отличаются тем, что сильно нагружают и ALU и текстурные модули, обе шейдерные программы сложные, длинные, включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D графики
  • Fur — процедурный шейдер, визуализирующий мех



В этих тестах нагрузка на видеокарты уже очень велика, и только такие мощные чипы, как RV670 и G92, справлялись с ней ранее. Теперь к ним добавился и G94. Решение на основе этого чипа опережает карту на базе G84 более чем в два раза в обоих тестах, и отстаёт от карт Geforce 8800 GT на той же частоте более чем на 70%, что близко к теоретической разнице в количестве универсальных процессоров. И хотя решения AMD обеспечивают эффективное исполнение сложных пиксельных шейдеров версии 3.0 с большим количеством ветвлений, новая видеокарта Nvidia в обоих тестах опережает решение AMD, что можно объяснить ускоренными билинейными текстурными выборками в архитектуре G9x. При анализе результатов таких синтетических тестов нужно учитывать, что в реальных приложениях картина может быть несколько иной, если там будет использоваться трилинейная и/или анизотропная фильтрация текстур.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

В новую версию RightMark3D 2.0 вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два полностью новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель!) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Все результаты в «High» получились примерно в полтора раза ниже, чем в «Low». Direct3D 10 тесты процедурной визуализации меха с большим количеством текстурных выборок в очередной раз показывают огромное преимущество решений Nvidia над AMD. Подобной разницы не должно быть, ну как может RADEON HD 3870 отставать от Geforce 8600 GTS, будучи теоретически сильнее его во всём?

Судя по нашим исследованиям, производительность в этом тесте зависит не только от количества и скорости блоков TMU, но и от филлрейта и ПСП. Сравнение результатов Geforce 9600 GT и 8800 GT показывает примерно полуторакратное преимущество старшего варианта, а Geforce 8600 GTS отстаёт от сегодняшнего героя почти в два раза. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится:

Включение суперсэмплинга теоретически увеличивает нагрузку в четыре раза, но на видеокартах Nvidia скорость снижается сильнее, чем на AMD, за счет чего отрыв между ними сокращается, и HD 3870 подтягивается к самой слабой из Geforce. В остальном, с увеличением сложности шейдера и нагрузки на видеочип, ничего не меняется, разница между Geforce 8800 GT и новым 9600 GT остаётся примерно той же, хотя на общую скорость филлрейт и ПСП влияет уже меньше.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Этот тест интереснее с практической точки зрения, разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются в последних релизах, например, в Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Хотя решения AMD ранее были традиционно сильны в Direct3D 9 тестах parallax mapping, в обновленном D3D10 варианте без суперсэмплинга они могут справиться с задачей лишь на уровне Geforce 8600 GTS. Кроме того, включение самозатенения вызывает на продукции AMD большее падение производительности (более двух раз), по сравнению с полуторакратной разницей для решений Nvidia.

Рассматриваемый нами сегодня Geforce 9600 GT опережает предшественника по ценовой категории в два раза, а разница с Geforce 8800 GT чуть-чуть увеличилась, превысив 1.6 крат. Посмотрим, что изменит включение суперсэмплинга, в прошлом тесте он вызывал большее падение скорости на картах Nvidia…

Полученные значения FPS при включенных суперсэмплинге и самозатенении вновь говорят о тяжелой задаче, совместное включение сразу двух опций: суперсэмплинга и самозатенения, увеличивают нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростью разных видеокарт в целом сохраняется, включение суперсэмплинга сказывается как и в предыдущем случае — карты на чипах AMD значительно улучшают свои показатели относительно решений Nvidia. Но, несмотря на это, даже HD 3870 продолжает отставать от Geforce 9600 GT. Что касается сравнения Geforce 9600 GT с родственниками, он вновь обгоняет Geforce 8600 GTS в два раза, отставая от равночастотного 8800 GT на величину, близкую к теоретическому значению. А без учёта частот, разница между ними составляет около полутора раз.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Мы уже отмечали ранее при анализе результатов наших Direct3D 9 синтетических тестов, что в вычислительно сложных задачах современная архитектура AMD показывает себя зачастую лучше конкурирующей от Nvidia. Так оно получилось и в этом тесте при сражении RADEON HD 3850 и Geforce 9600 GT, да и HD 3870 обгоняет лучшее решение на базе G92.

Производительность Geforce 9600 GT в те же два раза выше скорости «старой» Geforce 8600 GTS. Обновленная mid-end модель на G94 отстаёт от 8800 GT меньше, чем в полтора раза, что немного не соответствует разнице в производительности (количестве и тактовой частоте) универсальных шейдерных блоков. Вероятно, на результаты немного влияет и пропускная способность памяти…

Второй тест шейдерных вычислений носит название Fire, и он ещё более тяжёл для ALU. В нём текстурная выборка только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Вплоть до 2008 года во всех предыдущих тестовых сравнениях видеокарты AMD проваливали этот тест, показывая очень низкие результаты, указывающие на какую-то ошибку. И только тестирование, проведенное при выходе RADEON HD 3870 X2, показало, что результат решений AMD наконец-то стал подобающим и, как видите сами, RADEON HD 3870 и HD 3850 показывают скорость выше, чем у Geforce 8800 GT и Geforce 9600 GT. В следующий раз мы дополнительно проверим эти результаты, немного изменив тест, чтобы исключить возможность специфических оптимизаций…

Ну а в этот раз мы констатируем, что Geforce 9600 GT отстаёт в данном тесте от своего прямого конкурента HD 3850 более чем на 60%. Что касается сравнения видеокарт Nvidia, ситуация там та же, Geforce 8800 GT быстрее 9600 GT более чем в 1.5 раза, а та, в свою очередь, опережает Geforce 8600 GTS примерно в два раза. Что соответствует разнице в мощности ALU/TMU, частотах и количестве исполнительных блоков.

Direct3D 10: Тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое. Производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт несложная, как показали предыдущие исследования, ограничения скорости мощностью шейдерных ALU в тесте не явное, задача ограничена скорее больше ПСП и филлрейтом, чем мощностью чипов. То, что Geforce 9600 GT показывает точно такой же результат, что и Geforce 8800 GT на равной тактовой частоте, подтверждает отсутствие ограничений скоростью ALU/TMU.

Конкуренты Geforce 9600 GT от AMD показывают скорость, близкую к таковой у Geforce 8600 GTS, а сама Geforce 9600 GT опережает их больше, чем в полтора раза. На номинальных частотах новое решение опережает в этом тесте даже 8800 GT, что объясняется её более высокими тактовыми частотами. Возможно, при переносе части вычислений в геометрический шейдер ситуация изменится.

Но в данном случае никаких существенных изменений не произошло. Все видеокарты показывают почти те же результаты при изменении параметра GS load, отвечающем за перенос части вычислений в геометрический шейдер. Единственная разница среди видеокарт Nvidia состоит в падении результатов Geforce 8600 GTS, а карты AMD, наоборот, получили небольшой прирост скорости. И теперь в отстающих именно GF 8600 GTS, которую GF 9600 GT обгоняет всё в те же два раза. Посмотрим, что изменится в следующем тесте…

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

И снова относительные результаты в разных режимах соответствуют нагрузке: во всех случаях производительность хорошо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть в два раза медленней. А производительность Geforce 9600 GT в этот раз даже немного выше, чем у равночастотного варианта GF 8800 GT, хотя эту разницу можно смело списать на погрешность измерения… Снова карты AMD проигрывают всем решениям Nvidia в этом тесте при любой геометрической сложности. Даже Geforce 8600 GTS, проигрывая сегодняшнему герою обзора почти двукратно, оказалась сильнее, чем карты RADEON.

В целом, наблюдается то же самое, что и в предыдущем тесте — Geforce 9600 GT идёт на уровне с 8800 GT. Но цифры могут измениться в следующем тесте, с более активным использованием геометрических шейдеров, также интересно сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

Вот теперь соотношение скоростей изменилось очень сильно. Наглядно видно, что чипы AMD выполняют более сложные геометрические шейдеры эффективнее всех чипов Nvidia. Но посмотрите сами — в очередной раз Nvidia исправляет некоторые недостатки своих архитектур, и Geforce 9600 GT в этих условиях не просто опережает старшего Geforce 8800 GT на 20%, но и практически догоняет младший вариант карты AMD на основе чипа RV670, отставая только от более дорогого старшего! А ведь раньше отставание было значительно больше… Отличный результат для Nvidia!

В остальном, можно отметить, что Geforce 8600 GTS для данного теста безнадёжен, он проигрывает новому mid-end решению почти в четыре раза. Да что там, даже Geforce 8800 GT медленнее того… Что касается сравнения результатов в разных режимах, тут всё как обычно, в конкурентной борьбе видеоплатам AMD не помогает и то, что при переходе от использования «instancing» к геометрическому шейдеру при выводе, видеокарты Nvidia очень сильно теряют в производительности. И у всех карт Geforce на основе чипов архитектуры G9x скорость в «Balanced» режиме получается выше, чем в «Heavy» у RADEON HD 3870. При этом, получаемая в разных режимах картинка не отличается визуально.

Direct3D 10: Скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

И вновь результаты в разных режимах показывают примерно одинаковую картину производительности видеокарт относительно друг друга. Судя по предыдущим исследованиям, на результаты этого теста сильно влияет в том числе и пропускная способность памяти, и чем проще режим, тем большее влияние на скорость она оказывает. В этот раз сравнительные результаты G92 и G94 на одинаковых частотах немного отличаются уже в сторону старшей модели, но в общем, Geforce 9600 GT показывает почти равный с Geforce 8800 GT результат. Geforce 8600 GTS отстаёт от неё почти в три раза уже, RADEON HD 3850 — на треть, а HD 3870 примерно на том же уровне. Посмотрим на результаты этого же теста с увеличенным количеством текстурных выборок:

Ситуация изменилась не слишком сильно, только поменялся номинальный лидер, теперь это опять Geforce 9600 GT, обогнавший старшего брата на G92 совсем немного. Geforce 8600 GTS отстаёт почти столь же сильно, обе карты производства AMD не изменили своей позиции. По мере усложнения задачи, результаты карт уплотняются.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

А вот в тесте «Waves» ситуация уже повернулась в сторону решений AMD, да и Geforce 9600 GT теперь справедливо проигрывает решению более высокого уровня — Geforce 8800 GT. Похоже, что в этом тесте скорость уже зависит в том числе и от мощности TMU, а не только от ПСП и филлрейта. Обе модели семейства RADEON HD 3800 смотрятся очень хорошо, младшая показывает результат на уровне Geforce 8800 GT, почти догоняя того в тяжелых режимах, ну а HD 3870 является явным лидером, не учитывая GF 8800 GT с повышенными частотами. Geforce 8600 GTS привычно проигрывает заменяющему её Geforce 9600 GT около двух раз во всех режимах. Рассмотрим второй вариант теста:

И тут ситуация почти без изменений, хотя с увеличением сложности теста результат серии RADEON HD 3800 стал ещё лучше, по сравнению с картами Nvidia, ведь последние потеряли в скорости значительно больше. Все остальные выводы также остаются в силе — в легком режиме скорость немного ограничивается ПСП, а в тяжёлых большую роль играют блоки TMU и ROP. Видно, что положение плат AMD улучшилось в тестах VTF, ранее мы отмечали, что решения Nvidia лучше справляются с тестами текстурных выборок из вершинных шейдеров по сравнению с картами AMD, а теперь ситуация стала для них намного лучше.

Выводы по синтетическим тестам

На основе результатов синтетических тестов Geforce 9600 GT и других моделей из разных ценовых диапазонов мы убедились в том, что новое mid-end решение Nvidia получилось весьма мощным и конкурентоспособным. Оно не только опережает своего прямого предшественника Geforce 8600 GTS примерно в два раза, но в большинстве тестов остаётся впереди RADEON HD 3850, обладающего примерно той же рекомендуемой ценой, и даже может составить конкуренцию более дорогой видеокарте AMD — RADEON HD 3870, особенно с учётом фабрично разогнанных вариантов от партнеров компании.

Сама по себе архитектура G9x по сравнению с G8x изменилась не слишком сильно, она всё так же отличается высокой вычислительной производительностью, нацелена на современные и будущие приложения с большим количеством сложных шейдеров всех типов. Высокая эффективность универсальных процессоров, достаточное количество блоков ALU, TMU и ROP, а также высокие рабочие частоты позволяют рассмотренному чипу показывать отличные результаты во всех синтетических тестах.

Архитектура чипа была дополнительно улучшена, по сравнению с предыдущей G8x, внесены изменения в блоки TMU и ROP. Текстурные модули в определенных условиях умеют выбирать вдвое больше данных, по сравнению с G80, а блоки ROP оснащены новой технологией компрессии, улучшающей эффективность использования видеопамяти. Всё это, вместе с повышенной частотой, приводит к тому, что Geforce 9600 GT во многих случаях не отстаёт от Geforce 8800 GT, обладающего на 75% большим количеством ALU и TMU, а иногда даже опережает! У видеокарты фактически нет слабых мест, она очень хорошо сбалансирована, обладает достаточным количеством всех исполнительных блоков, широкой для этого ценового диапазона шиной памяти и высокой её пропускной способностью. Всё это позволяет надеяться, что Geforce 9600 GT покажет отличные результаты в игровых тестах и составит очень мощную конкуренцию решениям AMD.

Как раз в следующей части статьи и будет самое главное — тесты нового решения Nvidia в современных игровых приложениях, которые должны показать справедливость выводов, сделанных при анализе результатов синтетических тестов. Эти результаты должны быть значительно интереснее синтетических, ведь ситуация в играх почти всегда сильнее зависит от скорости текстурирования и филлрейта, чем от мощности ALU и блоков обработки геометрии, как в наших специализированных тестах…



Nvidia Geforce 9600 GT (G94) — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией TAGAN
Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia