BFG Geforce 9600 GT OC 512MB PCI-E, ECS Geforce 9600 GT Accelero Edition 512MB PCI-E, Forsa Geforce 9600 GT 512MB PCI-E, Galaxy Geforce 9600 GT Overclocked 512MB PCI-E, Point Of View Geforce 9600 GT 512MB PCI-E, Zotac Geforce 9600 GT AMP! Edition 512MB PCI-E
Статуя Свободы и небоскреб Taipei101… Что их объединяет? — Нет, не надо искать философий и высоких материй. Все просто: это Тайвань. Именно там можно встретить и то и другое на расстоянии полукилометра друг от друга. Ясно, что Статуя Свободы — в виде копии. Почему Тайвань? — ну ведь именно там родился новый кристалл, который затем был облачен в оправу в виде подошвы, поддерживающей 256-битный обмен с памятью. И именно отсюда идут первые сигналы в американскую Nvidia — получился «пирог» или нет.
Нам вот кажется, что получился. И весь отменным. Но обо всем по порядку.
Часть 1: Теория и архитектура
Прошло уже довольно много времени с выхода решения среднего уровня Nvidia Geforce 8600 GTS, основанного на чипе G84, которое отличалось от топового решения того времени на базе G80 слишком малым количеством исполнительных блоков ALU и TMU, по сравнению с ожидаемым пользователями уровнем, и сравнительно низкой производительностью. Разрыв в скорости между Geforce 8800 GTX и Geforce 8600 GTS был слишком велик. В дальнейшем, компаниями AMD и Nvidia были выпущены видеокарты более высокого уровня: Geforce 8800 GT и RADEON HD 3870, но у AMD вышла и младшая модель HD 3850, призванная конкурировать с Geforce 8600 GTS. Естественно, более совершенный техпроцесс и большое преимущество по времени выхода дали решению AMD преимущество в производительности, и HD 3850 оказался во многих приложениях быстрее, чем Geforce 8600 GTS.
А сегодня компания Nvidia анонсирует чип G94, основанный на базе обновленной унифицированной архитектуры G9x, и решение на этом GPU — Geforce 9600 GT, сдвигающее Geforce 8600 GTS в ценовой линейке вниз. Новое решение расположилось в линейке компании между 8800 GT и 8600 GTS, видеокарта Geforce 9600 GT базируется на G94, который отличается от G92 лишь меньшими количественными характеристиками по количеству универсальных шейдерных процессоров и текстурным блокам, принося поддержку 256-битной шины памяти в сегмент видеокарт стоимостью менее $200. Соответственно, основными особенностями видеочипа G94 является поддержка 256-битной шины памяти и уменьшенное количество исполнительных блоков ALU и TMU. Давайте познакомимся с новым решением от компании Nvidia поближе…
Перед прочтением данного материала мы рекомендуем внимательно ознакомиться с базовыми теоретическими материалами DX Current, DX Next и Longhorn, описывающими различные аспекты современных аппаратных ускорителей графики и архитектурные особенности продукции Nvidia и AMD.
- [06.06.05] Longhorn ускорители и шейдеры для DirectX 10
- [01.03.05] DirectX.Update Ускорители 3D-графики: полшага вперед
- [09.04.04] DX.Next: ближайшее и ближнее будущее аппаратного ускорения 3D-графики
Эти материалы достаточно точно спрогнозировали текущую ситуацию с архитектурами видеочипов, оправдались многие предположения о будущих решениях. А подробную информацию об унифицированной архитектуре Nvidia G8x/G9x на примере предыдущих чипов можно найти в следующих статьях:
- [11.12.07] Nvidia Geforce 8800 GTS 512MB (G92) Снова 128 более сильных калифорнийских стрелков, но с урезанными копьями
- [29.10.07] Nvidia Geforce 8800 GT (G92) Уже 112 быстрых калифорнийских стрелков…
- [17.04.07] Nvidia Geforce 8600 GTS (G84) 32 калифорнийских стрелка в действии
- [08.11.06] Nvidia Geforce 8800 GTX (G80) новый монстр в 3D-графике и первый DX10-ускоритель
Как мы упоминали в предыдущих материалах, чипы серии G9x основаны на известной нам архитектуре Geforce 8 (G8x) и включают в себя все её преимущества: унифицированную шейдерную архитектуру, полную поддержку DirectX 10 API, качественные методы анизотропной фильтрации и алгоритм антиалиасинга CSAA с количеством сэмплов до шестнадцати включительно. Отличительными особенностями новых чипов являются некоторые из блоков, измененных в лучшую сторону (TMU, ROP, PureVideo HD), а также технология производства 65 нм, позволившая снизить себестоимость продукции и выпустить столь мощные решения в среднем ценовом диапазоне. Рассмотрим характеристики нового GPU и пока что единственной модели видеокарты на его основе:
Графический ускоритель Geforce 9600 GT
- Кодовое имя чипа G94
- Технология 65 нм
- 505 миллионов транзисторов
- Унифицированная архитектура с массивом общих процессоров для потоковой обработки вершин и пикселей, а также других видов данных
- Аппаратная поддержка DirectX 10, в том числе шейдерной модели Shader Model 4.0, генерации геометрии и записи промежуточных данных из шейдеров (stream output)
- 256-бит шина памяти, четыре независимых контроллера шириной по 64 бита
- Частота ядра 650 МГц (Geforce 9600 GT)
- ALU работают на более чем удвоенной частоте (1.625 ГГц у Geforce 9600 GT)
- 64 скалярных ALU с плавающей точкой (целочисленные и плавающие форматы, поддержка FP 32-бит точности в рамках стандарта IEEE 754, MAD+MUL без потери тактов)
- 32 блока текстурной адресации с поддержкой FP16 и FP32 компонент в текстурах
- 32 блока билинейной фильтрации (как и в G84 и G92, это даёт увеличенное количество билинейных выборок, но без бесплатной трилинейной фильтрации и эффективной анизотропной фильтрации)
- Возможность динамических ветвлений в пиксельных и вершинных шейдерах
- 4 широких блока ROP (16 пикселей) с поддержкой режимов антиалиасинга до 16 сэмплов на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Каждый блок состоит из массива гибко конфигурируемых ALU и отвечает за генерацию и сравнение Z, MSAA, блендинг. Пиковая производительность всей подсистемы до 64 MSAA отсчетов (+ 64 Z) за такт, в режиме без цвета (Z only) 128 отсчета за такт
- Запись результатов до 8 буферов кадра одновременно (MRT)
- Все интерфейсы (два RAMDAC, два Dual DVI, HDMI, DisplayPort) интегрированы на чип
Спецификации референсной карты Geforce 9600 GT
- Частота ядра 650 МГц
- Частота универсальных процессоров 1625 МГц
- Количество универсальных процессоров 64
- Количество текстурных блоков 32, блоков блендинга 16
- Эффективная частота памяти 1.8 ГГц (2*900 МГц)
- Тип памяти GDDR3
- Объем памяти 512 мегабайт
- Пропускная способность памяти 57.6 гигабайта в сек.
- Теоретическая максимальная скорость закраски 10.4 гигапикселя в сек.
- Теоретическая скорость выборки текстур до 20.8 гигатекселя в сек.
- Два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600
- SLI разъем
- Шина PCI Express 2.0
- TV-Out, HDTV-Out, поддержка HDMI и DisplayPort с HDCP
- Энергопотребление до 95 Вт
- Рекомендуемая цена $169-189
Новая mid-end видеокарта Nvidia сильно отличается от предыдущей Geforce 8600 GTS, у неё вдвое большее количество исполнительных блоков: ALU, ROP и TMU, несколько выше и частота, на которой работают шейдерные блоки. Почти вдвое увеличилась и пропускная способность локальной видеопамяти, в этом заслуга 256-битной шины, которая впервые для решений Nvidia появилась в данном ценовом секторе. В результате, новая видеоплата Geforce 9600 GT обладает усиленной примерно вдвое мощью по всем параметрам: скорости выполнения шейдеров, текстурных выборок, вместе с увеличенными филлрейтом и ПСП.
Очень важно и то, что на видеокарту было решено устанавливать 512 мегабайт памяти, а не 256. Последнее значение было бы слишком мало, согласно нашим исследованиям, его явно недостаточно для современных игровых приложений. Видимо поэтому в Nvidia решили комплектовать видеоплаты объёмом в 512 Мбайт — золотой серединой для современных игр, весьма требовательных к объёму видеопамяти, использующих в среднем до 500-600 мегабайт.
Архитектура
С архитектурной точки зрения G94 отличается от G92 только количественными характеристиками, у него меньше исполнительных блоков. Да и от G8x отличий не так много. Как было написано в предыдущих материалах, линейка чипов G9x является слегка модифицированной линейкой G8x, переведенной на новый техпроцесс с небольшими архитектурными изменениями. Новый mid-end чип имеет 4 больших шейдерных блока (всего 64 ALU) и 32 текстурных блока, а также четыре широких ROP.
Итак, архитектурных изменений в чипе немного, почти обо всех мы уже рассказывали, и всё сказанное в обзорах предыдущих решений остаётся в силе. А сегодня приведём только основную диаграмму чипа G94:
Остановимся на некоторых архитектурных изменениях в G9x ещё раз. Текстурные блоки в G94 точно такие же, что и в G84/G86 и G92, они умеют выбирать вдвое больше билинейно отфильтрованных выборок из текстур, по сравнению с G80. Но 32 текстурных блока Geforce 9600 GT в реальных приложения не будут работать быстрее, чем 32 блока у Geforce 8800 GTX лишь из-за большей рабочей частоты GPU. Такое может наблюдаться только при выключенной трилинейной и анизотропной фильтрации, что бывает крайне редко, только в тех алгоритмах, где применяются неотфильтрованные выборки, к примеру, в parallax mapping.
Ещё одним из преимуществ G9x и Geforce 9600 GT в частности, компания Nvidia считает некую новую технологию сжатия, реализованную в блоках ROP, которая, по их оценке, работает на 15% эффективнее той, что использовалась в предыдущих чипах. Видимо, это как раз те самые архитектурные модификации в G9x, предназначенные для обеспечения большей эффективности работы 256-битной шины памяти, по сравнению с 320/384-битной, о которых мы писали ранее. Естественно, в реальных приложениях такой большой разницы не будет, даже по данным самой Nvidia прирост от нововведений в ROP чаще всего составляет лишь около 5%.
Несмотря на все изменения в архитектуре G9x, добавляющие сложности чипу, о которых мы ещё поговорим ниже, число транзисторов в чипе довольно велико. Вероятно, такая сложность GPU объясняется включением в его состав ранее отдельного чипа NVIO, видеопроцессора нового поколения, усложнение блоков TMU и ROP, а также другие скрытые модификации: изменение размеров кэшей и т.п.
PureVideo HD
В G94 встроен всё тот же видеопроцессор второго поколения, известный по G84/G86 и G92, отличающийся улучшенной поддержкой PureVideo HD. Он почти полностью разгружает CPU при декодировании большинства распространенных типов видеоданных, в том числе H.264, VC-1 и MPEG-2, с разрешением до 1920x1080 и битрейтом до 30-40 Мбит/с, выполняя работу по декодированию полностью аппаратно. И хотя декодирование VC-1 у решений Nvidia не такое эффективное, как H.264, небольшая часть процесса использует мощности центрального процессора, но это всё равно позволяет воспроизводить все существующие HD DVD и Blu-Ray диски даже на средних по мощности компьютерах. Подробнее о видеопроцессоре второго поколения можно прочитать в наших обзорах G84/G86 и G92, ссылки на которые приведены в начале статьи.
Ну а мы поговорим о программных улучшениях PureVideo HD, которые приурочены к выходу Geforce 9600 GT. Из последних нововведений PureVideo HD можно отметить двухпоточное декодирование, динамическое изменение контрастности и цветовой насыщенности. Эти изменения не исключительны для Geforce 9600 GT, и в новых версиях драйверов, начиная с ForceWare 174, они введены для всех чипов, поддерживающих полное аппаратное ускорение при помощи PureVideo HD. Помимо рассматриваемой сегодня видеокарты, в этот список входят: Geforce 8600 GT/GTS, Geforce 8800 GT и Geforce 8800 GTS 512.
Динамическое улучшение контрастности довольно часто используется в бытовой технике, в телевизорах и видеоплеерах, оно может улучшить изображение с неоптимальной экспозицией (сочетание выдержки и диафрагмы). Для этого, после декодирования каждого кадра, анализируется его гистограмма, и если у кадра неудачная контрастность, гистограмма пересчитывается и применяется к изображению. Вот пример (слева — начальное изображение, справа — обработанное):
Примерно то же самое относится и к появившемуся в PureVideo HD динамическому улучшению цветовой насыщенности. Бытовая техника также очень давно применяет некоторые улучшающие изображение алгоритмы, в отличие от компьютерных мониторов, которые воспроизводят всё как есть, что во многих случаях может вызывать слишком тусклую и неживую картинку. Автоматический баланс компонент цвета в видеоданных, рассчитываемый также каждый новый кадр, улучшает восприятие картинки человеком, немного скорректировав насыщенность её цветов:
Двухпоточное декодирование позволяет ускорять декодирование и постобработку двух разных потоков видеоданных одновременно. Это может быть полезно при выводе в таких режимах, как "картинка-в-картинке", которые используются в некоторых Blu-Ray и HD DVD дисках (к примеру, второе изображение может показывать режиссёра фильма, дающего свои комментарии к показываемым в основном окне сценам), такими возможностями снабжены издания фильмов WAR и Resident Evil: Extinction.
Ну и ещё одним полезным нововведением последней версии PureVideo HD стала возможность одновременной работы оболочки Aero в операционной системе Windows Vista во время проигрывания аппаратно ускоренного видео в оконном режиме, что ранее не было возможно. Не сказать, чтобы это очень сильно волновало пользователей, но возможность приятная.
Поддержка внешних интерфейсов
Поддержка внешних интерфейсов у Geforce 9600 GT аналогична Geforce 8800 GT, за исключением появившейся интегрированной поддержки DisplayPort, разве что. Имеющийся на платах Geforce 8800 дополнительный чип NVIO, поддерживающий вынесенные за пределы основного внешние интерфейсы в G94 также был включен в состав самого чипа.
На референсных видеокартах Geforce 9600 GT установлены два Dual Link DVI выхода с поддержкой HDCP. Поддержка HDMI и DisplayPort реализована аппаратно в чипе, и эти порты могут быть выполнены партнёрами Nvidia на картах специального дизайна. Причём, как уверяет Nvidia, в отличие от G92, поддержка DisplayPort теперь встроена в чип и внешние трансмиттеры не требуются. Вообще, разъемы HDMI и DisplayPort на видеокарте необязательны, их могут заменить простые переходники с DVI на HDMI или DisplayPort, которые иногда попадаются в комплекте с современными видеокартами.
Итак, мы вкратце рассмотрели все архитектурные особенности Geforce 9600 GT, следующей частью материала будет практическая часть исследования, посвященная синтетическим тестам, показывающим, насколько хорошо выглядит новое mid-end решение Nvidia в предельных тестах.