Nvidia G92 живее всех живых! Очередное переименование в сфере графических ускорителей
СОДЕРЖАНИЕ
- Часть 1 Теория и архитектура
- Часть 2 Практическое знакомство
- Особенности видеокарт
- Конфигурация стенда, список тестовых инструментов
- Результаты игровых тестов (производительность)
Часть 1: Теория и архитектура
В самом начале весны компания Nvidia вдруг решила порадовать нас своим очередным анонсом. Естественно, наименование представленной модели было приведено в соответствие с новым принципом, и анонсированная видеокарта получила название Geforce GTS 250. GTS в этом случае означает менее высокий уровень производительности по сравнению с GTX, ну а 250 номер модели в линейке.
По характеристикам видеокарты становится понятно, что вся статья могла уместиться в одну эту картинку, или даже строчку: «Geforce GTS 250 = Geforce 9800 GTX+». Ну или «Geforce GTS 250 = Geforce 9800 GTX+ + 1GB», хотя это уточнение ничего особенно не меняет. Но, будучи примерными журналистами, которым нужно рассказать читателям о «новинке», мы сделали почти полноценную статью. «Почти» это потому что без обычных теоретических данных, которые не изменялись продолжительное время, и без синтетических тестов, в которых просто нет смысла в данном случае.
Итак, Geforce GTS 250 это «обновление» (как его называет Nvidia) популярной модели Geforce 9800 GTX+, конкурирующей с RADEON HD 4850. Проследим историю всех таких «обновлений». Первой моделью на основе полноценного чипа G92, со всеми включенными потоковыми процессорами, была Geforce 8800 GTS 512MB, выпущенная в конце 2007 года по рекомендуемой цене в $349-399. Мы ещё тогда удивлялись, почему ей не дали собственное название, и запутали покупателей многогранной серией 8800.
Затем появилась Geforce 9800 GTX немного ускоренная, но в целом почти та же самая карта, правда, с новым дизайном PCB. Настала очередь удивляться уже тому, для чего из-за весьма небольшого увеличения частот изменили вполне приличный дизайн? 9800 GTX была анонсирована в феврале 2008 года, с рекомендуемой ценой в $299-$349. Далее, летом того же прошлого года, она была снова «обновлена» небольшим разгоном, и стала называться Geforce 9800 GTX+. Это было уже в июне 2008, когда цена решения снизилась до $229.
Теперь, всё та же карта на основе чипа G92 (правда, уже произведённого по 55 нм технологии), но с упрощённым дизайном PCB, похожим больше на старый-добрый дизайн 8800 GTS 512, была «обновлена» в очередной раз, и получила название Geforce GTS 250. Хотя потенциальным покупателям не так важно, как она называется, в отличие от того, что за 512-мегабайтную модель теперь будут просить всего $129, а плата с гигабайтом локальной видеопамяти станет стоить $149. Впрочем, указаны цены рекомендованные для североамериканского рынка, наша розница привычно поснимает сливки пару-тройку месяцев.
В общем-то, несмотря на все наши колкости, выход модели Geforce GTS 250 можно назвать вполне своевременным по нескольким причинам. Первая уже изрядно набила оскомину во всех СМИ и в устах знакомых и близких мировое экономическое положение. В такое время люди стараются не покупать то, что не является необходимым, ну или просто умеряют свои аппетиты. Что им вполне позволит сделать GTS 250, предлагая очень хороший уровень производительности, достаточный для всех мультиплатформенных проектов и большинства ПК-эксклюзивных игр, и всего за $130-150.
Второй причиной является довольно скорый весенний выход как конкурирующих решений от компании AMD, предназначенных для нижнего ценового диапазона (менее $100), так и выпуск очередного «обновленного» продукта от Nvidia для того же сектора, и соответствующее снижение цен более дорогих моделей. Кстати, конкурент уже поддержал снижение цен, предложенное Nvidia выпуском GTS 250, также снизив цены на конкурирующие RADEON HD 4850 и HD 4870.
Чем же отличается решение Nvidia, что они могут предложить покупателям, кроме третьего по счету лёгкого обновления одного и того же продукта (8800 GTS 512 9800 GTX 9800 GTX+ GTS 250)? Представители компании выделяют следующее (по сравнению с конкурентом, а не со «старыми» картами на G92, естественно): поддержка технологий Nvidia CUDA и Nvidia PhysX, а также Nvidia 3D Vision, ну и некая «готовность» к выходу новой операционной системы Microsoft Windows 7. Далее мы чуть подробнее остановимся на этих особенностях, раз уж толком нечего писать про новую видеокарту.
Как вы поняли, теоретическая часть обзора Geforce GTS 250 будет короткой, мы уже рассматривали архитектуру G92, которая основана на архитектуре G80, и в G92b, произведённом по 55 нм технологическим нормам, ничего не изменилось. Единственными существенными для пользователя отличиями, по сравнению с Geforce 9800 GTX(+), можно считать лишь снижение требований к электропитанию и немного снизившееся тепловыделение. Ну и про цену не забываем.
Если же вы по какой-то странной причине ещё не знакомы с современными архитектурами Nvidia, то все подробности о G92 можно прочитать в базовом обзоре на нашем сайте. Это дальнейшее развитие архитектуры G8x, в которую были внесены некоторые улучшения. Также, перед прочтением данного материала, мы рекомендуем внимательно ознакомиться с базовыми теоретическими материалами DX Current, DX Next и Longhorn, описывающими различные аспекты современных аппаратных ускорителей графики и архитектурные особенности предыдущей продукции Nvidia и AMD.
- [06.06.05] Longhorn ускорители и шейдеры для DirectX 10
- [01.03.05] DirectX.Update Ускорители 3D-графики: полшага вперед
- [09.04.04] DX.Next: ближайшее и ближнее будущее аппаратного ускорения 3D-графики
Эти материалы довольно точно спрогнозировали текущую ситуацию с архитектурами видеочипов, оправдались многие предположения о будущих решениях. Дополнительную информацию об унифицированных архитектурах Nvidia G8x/G9x на примере предыдущих решений можно найти в следующих статьях:
- [18.03.08] Nvidia Geforce 9800 GX2 Новый двухчиповый претендент на трон 3D короля
- [11.12.07] Nvidia Geforce 8800 GTS 512MB (G92) Снова 128 более сильных калифорнийских стрелков, но с урезанными копьями
- [29.10.07] Nvidia Geforce 8800 GT (G92) Уже 112 быстрых калифорнийских стрелков…
- [08.11.06] Nvidia Geforce 8800 GTX (G80) новый монстр в 3D-графике и первый DX10-ускоритель
Будем считать, что с архитектурой G9x большинство читателей давно знакомо, и рассмотрим подробные характеристики первой модели видеоплаты серии Geforce GTS 200, основанной на GPU марки G92, выполненном с применением 55 нм техпроцесса.
Графический ускоритель Geforce GTS 250
- Кодовое имя чипа G92
- Технология производства 55 нм
- 754 миллиона транзисторов
- Унифицированная архитектура с массивом общих процессоров для потоковой обработки вершин и пикселей, а также других видов данных
- Аппаратная поддержка DirectX 10, в том числе шейдерной модели Shader Model 4.0, генерации геометрии и записи промежуточных данных из шейдеров (stream output)
- 256-битная шина памяти, четыре независимых контроллера шириной по 64 бита
- Частота ядра 738 МГц
- Более чем удвоенная частота ALU 1836 МГц
- 128 скалярных ALU с плавающей точкой (целочисленные и плавающие форматы, поддержка FP32 точности в рамках стандарта IEEE 754, выполнение двух операций MAD+MUL за такт)
- 64 блока текстурной адресации и фильтрации с поддержкой FP16 и FP32 компонент в текстурах
- Возможность динамических ветвлений в пиксельных и вершинных шейдерах
- 4 широких блока ROP (16 пикселей) с поддержкой режимов антиалиасинга до 16 сэмплов на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Каждый блок состоит из массива гибко конфигурируемых ALU и отвечает за генерацию и сравнение Z, MSAA, блендинг. Пиковая производительность всей подсистемы до 64 MSAA отсчетов (+ 64 Z) за такт, в режиме без цвета (Z only) 128 отсчетов за такт
- Запись результатов до 8 буферов кадра одновременно (MRT)
- Все интерфейсы (два RAMDAC, два Dual Link DVI, HDMI, DisplayPort, HDTV) интегрированы на чип
Спецификации референсной видеокарты Geforce GTS 250
- Частота ядра 738 МГц
- Частота универсальных процессоров 1836 МГц
- Количество универсальных процессоров 128
- Количество текстурных блоков 64, блоков блендинга 16
- Эффективная частота памяти 2200 (2*1100) МГц
- Тип памяти GDDR3
- Объем памяти 512/1024/2048 мегабайт
- Пропускная способность памяти 70.4 ГБ/с
- Теоретическая максимальная скорость закраски 11.8 гигапикселей в сек.
- Теоретическая скорость выборки текстур до 47.2 гигатекселей в сек.
- Два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600
- Двойной SLI разъем
- Шина PCI Express 2.0
- TV-Out, HDTV-Out, поддержка HDCP, HDMI, DisplayPort
- Энергопотребление до 150 Вт (один 6-штырьковый разъём)
- Двухслотовое исполнение
- Рекомендуемая цена $129/$149/$169
В общем-то, не видно ничего интересного, «новая» видеокарта на основе 55 нм чипа G92 не отличается от Geforce 9800 GTX+ ничем. Впрочем, выход новой модели может быть частично оправдан установкой на неё не 512 мегабайт видеопамяти, как у 9800 GTX+, а гигабайта, что сильно влияет на производительность в тяжёлых режимах с максимальными настройками качества, высокими разрешениями с включенным полноэкранным сглаживанием. А есть ещё двухгигабайтные варианты, но это уже больше маркетинговое преимущество, чем реальное.
В таких условиях старшие версии Geforce GTS 250 действительно должна быть ощутимо быстрее Geforce 9800 GTX+ из-за увеличенного объёма памяти. А некоторые наиболее современные игры получат преимущество даже не в самых высоких разрешениях. Всё бы ничего, да только ведь некоторые производители карт выпустили Geforce 9800 GTX+ с гигабайтом памяти ещё раньше…
Производство видеочипов G92b по 55 нм технологическим нормам и заметное упрощёние дизайна PCB позволило компании Nvidia сделать решение, аналогичное Geforce 9800 GTX по характеристикам, но с меньшей ценой и сниженными потреблением энергии и тепловыделением. И теперь, чтобы обеспечить Geforce GTS 250 электропитанием, на плате установлен лишь один 6-штырьковый PCI-E разъём питания.
О названии анонсированной модели мы уже писали в самом начале. В данном случае Nvidia просто привела наименование своих карт на основе G92 к принятому современному порядку. После общего названия Geforce идёт индекс серии (GTX, GTS, GT, G), а заканчивается всё номером модели, где первая цифра обозначает поколение (мало что значащее, впрочем, ведь в серию 200 входят карты на основе и GT200 и G92), а две оставшиеся положение модели внутри линейки.
Архитектура и особенности решения
Мы не можем рассказать читателям ничего нового об архитектуре чипа, на котором основана Geforce GTS 250, ведь чип G92 это тот же известный нам с осени 2007 года GPU, просто меньшей площади и требующий меньше энергии при работе. Использование улучшенной архитектуры, основанной на 55 нм техпроцессе, сделало Nvidia Geforce GTS 250 дешевле, тише и энергоэффективнее, по сравнению с Geforce 9800 GTX+.
Вообще, очень интересно, чем занимаются в Nvidia отделы по проектированию чипов. По сути, уже почти три года мы не видели ничего по-настоящему нового, только небольшие улучшения (ну хорошо, в GT200 изменений было довольно много, но это всё равно лишь улучшенная архитектура G8x), а ещё чаще обновления в виде изменённых частот, дизайна и названия.
Напомним, что архитектура GT200, анонсированная прошлым летом, является модифицированной архитектурой G8x/G9x, начало которой положил чип G80, выпущенный ещё в 2006 году. Основными отличиями чипа G92 от G80 была технология производства 65 нм, блок аппаратного декодирования видео и некоторые улучшения в текстурных модулях, а нововведения GT200 в основном количественные. Поэтому мы продолжаем ждать действительно новой архитектуры (с поддержкой DirectX 11 API) от Nvidia, и очень надеемся, что никакие финансовые трудности не повлияют на эти планы.
Nvidia CUDA
Как и все остальные современные решения компании, модель Geforce GTS 250 поддерживает технологию вычислений на видеочипах CUDA. Этой технологии посвящены два наши материала, поэтому подробно мы останавливаться на её описании не будем, всё можно прочитать там.
Важно, что программы с использованием CUDA, предназначенные для обычных пользователей, начали мало-помалу появляться. Одним из первых подобных приложений, использующих CUDA, является программа для перекодирования видео от компании Elemental, со странным названием Badaboom. Но не бадабумом единым… Сейчас можно упомянуть уже и другие полезные (имеется в виду видимая польза здесь и сейчас, поэтому Folding@Home и SETI@Home пропускаем) приложения с поддержкой CUDA: Pegasys TMPGEnc 4 GPU-ускоренная постобработка видеоданных, ArcSoft TotalMedia Theatre GPU-ускоренное масштабирование видеопотока до HD разрешений.
Pegasys TMPGEnc 4 (ранее известна как Tsunami MPEG Encoder) это утилита для кодирования видео в разные форматы, также предлагающая и некоторые возможности по редактированию потока и применению к изображению специальных фильтров постобработки. С недавних пор TMPGEnc использует технологию CUDA для ускорения декодирования видеоданных (ускорение кодирования видео при помощи GPU пока что не поддерживается), а также для увеличения производительности таких фильтров, как цветокоррекция, удаление шума и увеличение резкости (smart sharpen).
Перечисленные задачи весьма требовательны к вычислительной мощности, и обработка видеопотока при их использовании занимает значительно больше времени. При использовании видеокарт Nvidia, поддерживающих технологию CUDA, фильтры могут быть ускорены до 4-5 раз, по сравнению с аналогичной обработкой на CPU. Может быть, пока что это не так уж сильно впечатляет, но работу для некоторых пользователей облегчить всё же в состоянии.
ArcSoft TotalMedia Theatre это приложение для просмотра видео различных форматов на компьютере, поддерживающее технологию Nvidia CUDA для очень качественного масштабирования видеопотока с DVD и других форматов низкого разрешения до HD разрешений (1280х720, 1920х1080). Технология повышения разрешения (upscaling) ArcSoft SimHD в своём алгоритме качественного повышения разрешения перекладывает часть расчётов на GPU при помощи CUDA, что обеспечивает возможность такой обработки в режиме реального времени, на скорости 30 кадров в секунду. Для сравнения, без CUDA-ускорения обычные центральные процессоры обеспечивают производительность в этой же задаче лишь в единицы FPS.
Не стоит забывать, что это всё лишь теория, а практическое исследование всех подобных возможностей как чипов производства Nvidia, так и AMD, есть у нас в планах. Вот только бы больше приложений появилось к тому времени, особенно тех, где можно сравнить конкурирующие решения лицом к лицу…
Nvidia PhysX
И всё же, для игровой видеокарты всё вышеперечисленное пока не так уж и важно, а вот улучшения в играх это совсем другое дело. Про технологию аппаратного ускорения физических эффектов при помощи GPU мы уже неоднократно писали. PhysX позволяет использовать такие вычислительно сложные эффекты как симуляция жидкостей и тканей, а также рассчитывать физику для многих тысяч объектов одновременно.
В этом деле очень важна поддержка игровой индустрии, без которой любое хорошее начинание закончится, едва начавшись. И такая поддержка у PhysX есть. В прошлом году три больших игровых издателя: Electronic Arts, Take-Two Interactive и THQ анонсировали использование технологии PhysX при разработке игр своими игровыми студиями. Учитывая появление игр с активным использованием физических PhysX эффектов, аппаратно ускоряемых на видеокартах Nvidia, уже в прошлом году, можно с уверенностью говорить о том, что в 2009-м количество таких игр только увеличится.
Хорошим примером могут служить игры Анабиоз и Mirror's Edge. Технология PhysX хоть и не влияет на игровой процесс этих игр настолько сильно, чтобы от её поддержки нельзя было отказаться, но она приносит игрокам новый опыт, повышая интерактивность игрового мира, добавляя качественные эффекты симуляции ткани, стекла, дыма и жидкости. Игры с включенными PhysX эффектами выгодно отличаются большей интерактивностью и физически корректным поведением объектов.
Естественно, пока что все игровые приложения создаются с учётом систем, аппаратно не ускоряющих PhysX. Таких систем очень много, и в их случае вся тяжесть расчётов ложится на CPU, который не может обеспечить высокой производительности в этой задаче. К примеру, на некоторых уровнях игры Mirror’s Edge, системы без аппаратной поддержки технологии PhysX не могут дать даже 30 кадров в секунду, тогда как анонсированный сегодня Geforce GTS 250 предоставляет возможность комфортного геймплея в этой игре даже при максимальных настройках в разрешениях до 2560 × 1600 включительно.
Geforce 3D Vision
Одной из последних технологий компании, поддержкой которой обладает и Geforce GTS 250 в том числе, стала Geforce 3D Vision. Это готовое решение для просмотра стереоизображений, использующее беспроводные затворные стереочки (shutter glasses). Затворный принцип обеспечивает лучшее качество изображения, по сравнению с пассивными очками на основе поляризационных фильтров. Это касается как увеличенного разрешения, так и больших углов обзора.
Другим важным преимуществом технологии Geforce 3D Vision против конкурирующих, является отличная совместимость с 3D играми. Стереодрайвер Nvidia обеспечивает «родную» поддержку стереорендеринга в играх, список которых включает уже более 300 наименований. Кроме игр поддерживается 3D видеоплееры вроде 3dtv Stereoscopic Player, а также просмотр стереоскопических фотографий, для чего в комплекте поставки прилагается специальная утилита.
Важно, что стереодрайверы Nvidia основаны на том же коде, что и обычные, и не используют программных перехватчиков (wrapper), снижающих производительность. Поддержка стерео в играх сделана аналогично SLI профилям, с готовыми настройками для каждой конкретной игры. Работники Nvidia исследуют игровые приложения, и находят оптимальные настройки для каждой игры, поэтому от пользователя не требуется самому подбирать их.
Однако, основой проблемой, мешающей внедрению Geforce 3D Vision, нам видятся даже не дополнительные $200 за очки, и не увеличенные вдвое требования к производительности видеоподсистемы (ведь кадры нужно рассчитывать для каждого глаза), а практически полное отсутствие на нашем рынке устройств вывода изображения, совместимых с данной технологией. Ведь для этого нужны не просто мониторы с 120 Гц панелями, а устройства, принимающие по DVI сигнал с частотой 120 Гц.
Из всех мониторов такими возможностями обладают пока только две модели: SAMSUNG SyncMaster 2233RZ и ViewSonic VX2265wm, которые пока что даже не продаются у нас. Хотя многие современные ЖК-телевизоры обладают поддержкой 100 или 120 Гц, но это относится лишь к частоте вывода на экран, а по HDMI сигнал с частотой 120 Гц они воспринимать не умеют, и поэтому их не получится использовать для вывода стереоизображения. Да и ЭЛТ-мониторы с частотой от 100 Гц использовать вроде как можно, но обязательно нужно, чтобы у них был двухканальный DVI вход, что также большая редкость в реальности. Есть также возможность работы на Mitsubishi 1080p DLP устройствах и DepthQ HD 3D проекторах, но это тоже вряд ли серьёзно увеличивает круг потенциальных покупателей Geforce 3D Vision.
И всё же, несмотря на некоторые сложности, в целом технология стереоизображения весьма любопытна, и в ближайшем будущем мы по возможности постараемся рассказать о ней больше. Пока что у технологии есть неприятная особенность, которую можно считать главным недостатком жёсткие (если не сказать жесточайшие) требования к устройству вывода. По мере выхода соответствующих мониторов и телевизоров на рынок положение должно значительно улучшиться. Ждём.
В выводах теоретической части статьи мы можем отметить, что Nvidia Geforce GTS 250, хоть и является почти полной копией Geforce 9800 GTX+ с точки зрения технических характеристик, но это одновременно и отличное рыночное предложение с большей производительностью по сравнению с предыдущей моделью 9800 GTX+. Думается, что GTS 250 должен стать успешным на рынке видеокарт, составив очень хорошую конкуренцию для RADEON HD 4850 от компании AMD.
Впрочем, все вопросы производительности в современных 3D играх подробно рассмотрены в следующей части нашей статьи. Именно она показывает, кто есть кто среди нынешних решений, а также расставляет все точки над i в вопросах относительной скорости рендеринга, а значит и оправданности выхода обновленного решения на рынок.