СОДЕРЖАНИЕ
- Особенности видеокарты
- Конфигурации стендов, список тестовых инструментов, качество в 2D
- Результаты тестов: Unreal Tournament 2004
- Результаты тестов: TRAOD
- Результаты тестов: FarCry Research
- Результаты тестов: FarCry Regulator
- Результаты тестов: FarCry Pier
- Результаты тестов: Half-Life2, ixbt01
- Результаты тестов: Half-Life2, ixbt02
- Результаты тестов: Half-Life2, ixbt03
- Результаты тестов: DOOM III
- Результаты тестов: 3DMark05 Game1
- Результаты тестов: 3DMark05 Game2
- Результаты тестов: 3DMark05 Game3
- Результаты тестов: 3DMark05 MARKS
- Выводы
Официальные спецификации GeForce 6200 TC
- Кодовое имя чипа NV44
- Технология 110 нм (TSMC)
- 77 миллионов транзисторов
- FС корпус (перевернутый чип, без металлической крышки)
- 64 бит двуканальный интерфейс памяти
- До 64 мегабайт DDR/GDDR-2/GDDR-3 памяти
- Встроенный в чип PCI Express16х шинный интерфейс
- Возможность трансляции интерфейса в APG 8х с помощью двустороннего PCI Express<->AGP моста HIS
- Расширенные возможности использования системной памяти адресуемой через PCI Express для хранения буферов кадра, текстур и другой информации традиционно располагаемой в локальной памяти.
- 4 Пиксельных процессора, по одному текстурному блоку на каждом с произвольной фильтрацией целочисленных и плавающих текстур (анизотропия степени до 16х включительно).
- 3 Вершинных процессора, по одному текстурному блоку на каждом, без фильтрации выбираемых значений (дискретная выборка)
- Вычисление, блендинг и запись до 2 полных (цвет, глубина, буфер шаблонов) пикселей за такт
- Вычисление и запись до 4 значений глубины и буфера шаблонов за такт (если не производятся операции с цветом)
- Поддержка «двустороннего» буфера шаблонов
- Поддержка специальных оптимизаций прорисовки геометрии для ускорения алгоритмов теней на основе буфера шаблонов (т.н. технология Ultra Shadow II) в частности широко используемых в движке Doom III
- Все необходимое для поддержки пиксельных и вершинных шейдеров версии 3.0, включая динамические ветвления в пиксельных и вершинных процессорах, выбор значений текстур из вершинных процессоров и т.д.
- Фильтрация текстур в плавающем формате
- Поддерживается буфер кадра в плавающем формате (включая операции блендинга)
- MRT
- 2 RAMDAC 400 МГц
- 2 DVI интерфейса (требуются интерфейсные чипы)
- TV-Out и TV-In интерфейс (требуются интерфейсные чипы)
- Программируемый потоковый видеопроцессор (для задач компрессии, декомпрессии и постобработки видео)
- 2D ускоритель с поддержкой всех функций GDI+
- Встроенный мониторинг температуры и энергопотребления
Спецификации референсной карты GeForce 6200 TC-16
- Частота ядра 350 МГц
- Эффективная частота памяти 700 МГц (2*350 МГц)
- Шина памяти 32 бит
- Тип памяти GDDR
- Объем памяти 16 мегабайт
- Пропускная способность памяти 2,8 гигабайта в сек.
- Теоретическая скорость закраски 700 мегапикселей в сек.
- Теоретическая скорость выборки текстур 1.4 гигатекселя в сек.
- Один VGA (D-Sub) и один DVI-I разъем
- TV-Out
- На PCI-Express карте разъем для дополнительного питания не нужен
Спецификации референсной карты GeForce 6200 TC-32
- Частота ядра 350 МГц
- Эффективная частота памяти 700 МГц (2*350 МГц)
- Шина памяти 64 бит
- Тип памяти GDDR
- Объем памяти 32 мегабайт
- Пропускная способность памяти 5,6 гигабайт в сек.
- Теоретическая скорость закраски 700 мегапикселей в сек.
- Теоретическая скорость выборки текстур 1.4 гигатекселя в сек.
- Один VGA (D-Sub) и один DVI-I разъем
- TV-Out
- На PCI-Express карте разъем для дополнительного питания не нужен
Общая схема чипа
Какие-либо глобальные архитектурные отличия от NV40 и NV43 отсутствуют, есть некоторые новшества в пиксельном конвейере нацеленные на эффективную работу с системной памятью в качестве буфера кадра, но об этом будет рассказано далее.
В общем и целом NV44 является масштабированным (путем уменьшения числа вершинных и пиксельных процессоров и каналов контроллера памяти) решением, основанным на архитектуре NV40. Отличия количественные (на схеме выделены жирным), а не качественные — с точки зрения архитектуры чип практически не изменился.
Итак, в наличии 3 вершинных процессора, как у NV43, и один (было два) независимый пиксельный процессор, работающий с одним квадом (фрагментом 2х2 пикселя). PCI Express стал нативным, как и в случае NV43 и (т.е. реализован на чипе), а AGP 8х платы с этим чипом, видимо, пока, не планируются. По крайней мере, — в варианте TC (TurboCache), т.к. сама идея эффективного использования системной памяти для рендеринга требует адекватной пропускной способности графической шины в обе стороны. Если и появятся карты с буфером 64Мб и дополнительным двусторонний мостом PIC-E <-> AGP (показан пунктиром), стоимость их будет неоправданно высока для low-end сегмента, и они не смогут конкурировать с исконно AGP 8х решениями.
Кроме того, отметим очень важный ограничивающий момент — двухканальный контроллер и 64 (!) битную шину памяти — этот факт мы подробно обсудим и исследуем далее. Судя по корпусу чипа и числу выводов, 64 бит это аппаратный предел для NV44 и 128 битных карт не будет.
Архитектура вершинных и пиксельных процессоров, а также видеопроцессора осталась прежней — эти элементы были детально описаны нами в обзоре GeForce 6800 Ultra. Поэтому поговорим о потенциальных количественных и качественных изменениях по отношению к NV43:
Соображения о том, что и как было урезано
Очевидно, что даже с учетом использования системной памяти через PCI Express, все модели 6200 TC будут в первую очередь страдать из-за недостатка полосы пропускания памяти, как системной, так и локальной. Пиковая скорость закраски 6200 TC составляет 700 мегапикселей, в то время как пропускная способность локальной памяти более чем вдвое ниже, и это, без учета потенциально уменьшенных кэшей и двуканального контроллера памяти.
Можно предсказать, что все решится исходя из двух параметров. Скорости системной памяти и ее адресации через PCI Express (зависит от чипсета и других параметров системы) и сложности выполняемых шейдеров (сложные шейдеры с большим числом команд не будут так привередливы к памяти и, возможно, сумеют полностью раскрыть вычислительный и закрасочный потенциал пиксельных процессоров).
Слабым местом семейства 6200 TC как и в случае 6600 будут большие разрешения и режимы с полноэкранным сглаживанием, особенно на простых приложениях, а сильным — программы с длинными и сложными шейдерами и анизотропная фильтрация без одновременного MSAA. Причем, здесь эта тенденция будет выражена особенно болезненно, на порядок заметнее, чем в случае 6600 — т.е. можно говорить о сильной зависимости этих ускорителей от приложения. Судя по всему сравнительные результаты с конкурирующим семейством (например, X300 * от ATI) будут отличаться в разы, в зависимости от теста, разрешения и настроек. Т.е. на каких то приложениях 6200 TC будет выглядеть равноправно, или лучше, а на каких то — заметно проигрывать.
Далее, мы проверим это предположение тестами.
Сложно судить насколько оправданным был ход с 64 и даже 32-х битной шиной памяти — с одной стороны это удешевляет корпус чипа и уменьшает число бракованных чипов, с другой стороны, разница в цене печатной платы для 64 и 32 бит еще ниже, чем для 256 и 128! И, эта разница с избытком компенсируется разницей в цене обычной недорогой 200 МГц DDR и все еще пока дорогой 350МГц GDDR памяти. Снова, как и в случае 6600, с точки зрения производителей карт решение с 128 битной шиной и более дешевой DDR памятью (как в случае X300) было бы более удобным, как минимум, если бы у них была возможность выбора. А с точки зрения NVIDIA, производящей чипы и зачастую продающей с ними в комплекте память, более выгодно 64 или даже 32 бит решение в комплекте с GDDR.
Вершинные и пиксельные процессоры в NV44, судя по всему, остались неизменными, если не считать декларируемых доработок для эффективной адресации системной памяти из блоков текстурирования и блендинга. Однако это то, что озвучивается — реально есть причины считать, что все эти возможности, не такие принципиальные, и реализуемые скорее на уровне менеджера общего Кэша и кроссбара, изначально были заложены в семейство NV4X. Просто не было смысла использовать их (на уровне драйверов) у более старших карт с более скоростной, емкой и широкой локальной памятью. Также нет смысла в такой технологии у карт с AGP интерфейсом, который несомненно станет узким местом (скажется низкая скорость записи в системную память сравнимая с PCI).
Вот так поясняет различия NVIDIA в своих материалах:
… обычная схема и NV44 с TurboCache:
Очевидна разница, связанная с подачей данных для текстур и дополнительным путем для записи данных кадра (блендинга) в системную память. Однако исходная схема чипа с кроссбаром, трактующим графическую шину практически как пятый канал контроллера памяти, может быть изначально способна на такое (начиная с NV40 и даже ранее). И сложно сказать, действительно ли в NV44 есть архитектурные изменения в плане работы с записью и чтением данных или эти возможности просто задействуются на уровне драйвера.
С другой стороны, не будем отрицать, что оптимальным было бы некое страничное MMU и динамическая подкачка данных из системной памяти в локальную, которая трактовалась бы как Кэш третьего уровня. Если реализована такая схема — все становится на свои места. И эффективность будет заметно выше дискретного размещения объектов там или там, и наличие небольших аппаратных переделок оправдано. Тем более, что, обкатав этот страничный блок подкачки, можно будет задействовать его в будущих архитектурах, которые, судя по всему, будут в обязательном порядке снабжены такими блоками (к этому приводят требования DX Next).
Если в первом случае все зависит от драйвера, он принимает решение, где и какие располагать текстуры, геометрические данные и буфера кадров, то в случае страничной подкачки все может решаться только аппаратурой. Или можно помечать некоторые объекты как « некэшируемые» , например, геометрические данные, или некоторые буфера кадра, в случае которых копирование в локальную память карты не дало бы особого выигрыша, а наоборот снизило бы финальную эффективность. Вообще, задача такого распределения видится очень непростой и по-хорошему требует постоянного, в каждом кадре, анализа значений внутренних счетчиков производительности чипа, причем относительно к разным отдельным объектам в его памяти, т.к. предсказать влияние паттернов доступа в разных случаях тяжело. В пиковом случае системная память может считываться, особенно в случае TC-16, даже быстрее чем локальная, но задержки системной памяти и ее реальная скорость (DDR200-300*64 бит — нужды CPU и арбитраж конкурентного доступа) все равно приведет к более низкой эффективности, чем 32 битный 350 МГц вариант локальной.
Только практика покажет, насколько решение NVIDIA было оправданным как в случае 32 битной TC-16, так и в случае 64 битной TC-32. Однако одно можно сказать точно — реально, все решит цена и приложения, на которые ориентируется покупатель. Если карта будет стоить 40$ — это один случай, если 70$ — другой, т.к. конкурирующие 128 бит решения будут задавливать TurboCache 128 битной памятью, которая, как ни крути, эффективнее. Приложения тоже дадут о себе знать — интенсивные шейдеры или UltraShadow как в Doom 3 — и 6200 TC на коне, простые шейдеры, и полноэкранное сглаживание — и она провалилась.
Далее мы проверим все эти предположения и поговорим о цене.
Платы
Обе карты совершенно аналогичны по разводке, отличаются лишь тем, что у 16-мегабайтной нет одной из двух микросхем памяти.
NVIDIA GeForce 6200 TurboCache 16/32 MB (128MB) (NV44) |
---|
NVIDIA GeForce 6200 TurboCache 16/32 MB (128MB) (NV44) | |
---|---|
Карты имеют интерфейс PCI-Express x16, 16 или 32 МБ памяти DDR SDRAM, размещенной в одной или двух микросхемах на лицевой и оборотной сторонах PCB. Микросхемы памяти Samsung. Время выборки у микросхем памяти 2.8 ns, что соответствует частоте работы 350 (700) МГц, на которой память и работает. Частота работы GPU 350 MHz. Шина обмена с памятью — 32 bit у 16-ти мегабайтной карты и 64 bit у 32-х мегабайтной. 4 пиксельных конвейеров и 3 вершинных. |
Сравнение с эталонным дизайном, вид спереди | |
---|---|
NVIDIA GeForce 6200 TurboCache 16/32 MB (128MB) (NV44) | Reference card NVIDIA GeForce 6200 128MB |
Сравнение с эталонным дизайном, вид сзади | |
---|---|
NVIDIA GeForce 6200 TurboCache 16/32 MB (128MB) (NV44) | Reference card NVIDIA GeForce 6200 128MB |
Мы видим, что разводка претерпела сильные изменения. Вызвало большое недоумение — почему у столь примитивной карты с двумя микросхемами памяти столь сложная PCB. Ведь мы еще помним старые платы с таким же объемом памяти, которые были на порядок проще. Да, разумеется, частоты высокие. Но зачем, спрашивается, урезать столь сильно шину и поднимать частоту? Мне лично этот подход кажется неразумным и даже глупым. Только неграмотный может устанавливать ОДНУ(!), но дорогую BGA 2.8ns микросхему, делая ужасной шину (32 бит), нежели поставить 4 или 8 микросхем старого плана (TSOP, 5 ns, например), которые обойдутся ДЕШЕВЛЕ, но шину не портить. В общем, у меня осталось много вопросов при изучении дизайна карты.
Система охлаждения примитивная: радиатор, поэтому ее не рассматриваем.
Посмотрим на графический процессор.
Можно заметить, что размеры чипа намного меньше его предшественников (например, GeForce 6200/6600 — NV43). Я имею в виду подложку, а не сам кристалл, который впрочем, также уменьшился (это понятно, поскольку конвейеров в 2 раза меньше). Это говорит о том, что NV44 аппаратно поддерживает шину обмена с памятью НЕ БОЛЕЕ 64 бит. И опять же мой вопрос: зачем тогда такую сложную PCB воротить с 64битной шиной?
Установка и драйверы
Конфигурации тестовых стендов:
- Компьютер на базе Athlon64
- процессор AMD Athlon64 2400 MHz (218MHz × 11; L2=512K) (~3800+);
- системная плата ASUS A8N SLI Deluxe на чипсете NVIDIA nForce4 SLI; Включен режим работы с ОДНОЙ видеокартой!
- оперативная память 1 GB DDR SDRAM 400MHz;
- жесткий диск WD Caviar SE WD1600JD 160GB SATA.
- операционная система Windows XP SP2; DirectX 9.0c;
- мониторы ViewSonic P810 (21") и Mitsubishi Diamond Pro 2070sb (21").
- драйверы ATI версии 6.497 (CATALYST 4.12); NVIDIA версии 71.20.
VSync отключен.
По умолчанию в драйверах обеих компаний включены оптимизации трилинейной фильтрации.
Надо отметить, что автор программы RivaTuner Алексей Николайчук оперативно смог вставить в свою утилиту поддержку nv44. При этом выяснилось, что у чипа есть два бита в регистрах, отвечающих за каждый квад. То есть, по логике вещей, у чипа должно быть 8 конвейеров, но 2 ROP. Конечно, это не поддается логике и здравому смыслу (к тому же тесты FillRate показали, что все же конвейеров 4). И потому единственным разумным выводом стало, что работа у NV44 все же не с квадами, а с парами пикселов. Этот вопрос мы будем прояснять дальше.
Заметим, что о том, сколько реально памяти на видеокарте, вы не узнаете, кроме как из RT :), поскольку драйвера пишут суммарный объем: локальная память+кусок основного ОЗУ.
Результаты тестов
Перед тем, как кратко дать оценку качеству в 2D, я еще раз поясню, что на настоящий момент НЕТ полноценной методики объективной оценки этого параметра по следующим причинам:
- Практически у всех современных 3D-акселераторов качество 2D может сильно зависеть от конкретного экземпляра, а отследить все карты невозможно физически;
- Качество 2D зависит не только от видеокарты, но и от монитора, соединительного кабеля;
- В последнее время огромное влияние на этот параметр стали оказывать связки: монитор-карта. То есть, встречаются мониторы, « не дружащие» с теми или иными видеокартами.
Что касается протестированных экземпляров, то совместно с Mitsubishi Diamond Pro 2070sb платы продемонстрировали одинаково отменное качество в следующих разрешениях и частотах:
NVIDIA GeForce 6200 TurboCache 16/32 MB (128MB) (NV44) | 1600x1200x75Hz, 1280x1024x85Hz, 1024x768x100Hz |
---|
Результаты тестов: сравнение производительности
В качестве инструментария мы использовали:
- Unreal Tournament 2004 v.3225 (Digital Extreme/Epic Games) Direct3D, Vertex Shaders, Hardware T&L, Dot3, cube texturing, качество max; demo (MOON
- Tomb Raider: Angel of Darkness v.49 (Core Design/Eldos Software) DirectX 9.0, Paris5_4 demo. Тестирование проводилось при максимально установленном качестве, выключены были лишь Depth of Fields PS20.
- Half-Life2 (Valve/Sierra) DirectX 9.0, demo (ixbt01, ixbt02, ixbt03 Тестирование проводилось при максимальном качестве, опция -dxlevel 90, в файле dxsupport.cfg убраны предустановки для видов карт.
- FarCry 1.3 (Crytek/UbiSoft), DirectX 9.0, мультитекстурирование, 3 demo из уровней Research, Pier, Regulator (запуск игры с опцией -DEVMODE), настройки тестирования все Very High.
- DOOM III (id Software/Activision) OpenGL, мультитекстурирование, настройки тестирования High Quality (ANIS8x). Имеется пример автоматизации запуска с увеличением скорости и уменьшением числа рывков (прекешинг). (НЕ ПУГАТЬСЯ черного экрана после первого меню, так и должно быть! Он будет секунд 5-10, а потом должна пойти демка)
- 3DMark05 (FutureMark) DirectX 9.0, мультитекстурирование, настройки тестирования trilinear,
Unreal Tournament 2004
Результаты тестов: Unreal Tournament 2004
- GeForce 6200TC 16MB (79USD) — против RADEON X300SE (70USD) поражение
- GeForce 6200TC 32MB (99USD) — против RADEON X300 (90USD) аналогично.
Пока все печально для новинок, которые, к тому же, и дороже (по предварительным ценам).
TR:AoD, Paris5_4 DEMO
Аналогично предыдущему тесту, провал. Конечно, относительно PCX5750, которая дороже, новинки смотрятся очень хорошо, но последний уже уходит с рынка, выталкиваемый GF6200/6600.
FarCry, Research
Результаты тестов: FarCry Research
По-прежнему, пока результаты явно отрицательные. Разве что 32меговая карта относительно X300SE выиграла в 1024х768. Но пока по ценам соперничество явно не складывается. Вот если на 30-40 долларов скинуть цифры по стоимости у новых продуктов NVIDIA, тогда уже лучше будет смотреться.
FarCry, Regulator
Результаты тестов: FarCry Regulator
- GeForce 6200TC 16MB (79USD) — против RADEON X300SE (70USD) вот первый тест, где показатели у новинок лучше, и даже победа!
- GeForce 6200TC 32MB (99USD) — против RADEON X300 (90USD) ещё больший успех!
FarCry, Pier
Результаты тестов: FarCry Pier
- GeForce 6200TC 16MB (79USD) — против RADEON X300SE (70USD) снова поражение
- GeForce 6200TC 32MB (99USD) — против RADEON X300 (90USD) а здесь не очень однозначно. С натяжкой можно назвать паритетом с X300.
Half-Life2: ixbt01 demo
Результаты тестов: Half-Life2, ixbt01
- GeForce 6200TC 16MB (79USD) — против RADEON X300SE (70USD) поражение
- GeForce 6200TC 32MB (99USD) — против RADEON X300 (90USD) победа, но над X300SE, а своему сопернику карта проиграла.
Half-Life2: ixbt02 demo
Результаты тестов: Half-Life2, ixbt02
- GeForce 6200TC 16MB (79USD) — против RADEON X300SE (70USD) по-прежнему поражение
- GeForce 6200TC 32MB (99USD) — против RADEON X300 (90USD) аналогично предыдущему тесту
Half-Life2: ixbt03 demo
Результаты тестов: Half-Life2, ixbt03
Все то же самое.
DOOM III
- GeForce 6200TC 16MB (79USD) — против RADEON X300SE (70USD) можно осторожно обозначить победу.
- GeForce 6200TC 32MB (99USD) — против RADEON X300 (90USD) значительный успех.
Хоть в этой игре новинки как-то себя показали с хорошей стороны.
3DMark05: Game1
Результаты тестов: 3DMark05 Game1
3DMark05: Game2
Результаты тестов: 3DMark05 Game2
3DMark05: Game3
Результаты тестов: 3DMark05 Game3
3DMark05: MARKS
Результаты тестов: 3DMark05 MARKS
У 32-мегабайтной карты явный выигрыш, хотя у более дешевой с 16-ю мегабайтами все же небольшое поражение.
Основное слабое место — полоса пропускания памяти, двуканальный 64 бит контроллер, запись результатов в буфер кадра. TurboCache помогает, но не является панацеей, хорошее 128 бит решение может стоить сравнимо и при этом однозначно выигрывать по скорости.
Похвален факт полного соответствия NV40 по набору поддерживаемых возможностей и архитектуре вершинных и пиксельных процессоров — нет необходимости учитывать особенности NV44 в программах.
Меньшая сложность и потребление сыграли свою положительную роль. Тактовая частота высока, и судя по технологии, может быть поднята в будущем гораздо выше — все упирается только в память.
Хочется верить, что такая узкая системная шина и простой корпус в скором времени сыграют роль и в снижении стоимости.
При таких предполагаемых ценах (79 и 99 долларов США) они в явном проигрыше. Тесты ясно дали понять, что только если карты будут дешевле, чем соперники (причем значительно, цена не должна быть выше 50-70 долларов), тогда на них будет спрос.
Разумеется, в данном случае скорость работы карт очень сильно зависит от драйверов, ведь сам по себе TurboCache обеспечивается ими. И потому скорости еще могут вырасти.
Да и, как мы видим, ТурбоКеш не особо помог этим картам. Цель благая — удешевить карты, т.к. память в размере 128 и 256мегабайт в дешевом сегменте уже составляет приличную долю себестоимости. Но что вышло? Вместо удешевления — удорожание? Надеемся, что цены встанут на свои места.
Если окончательные розничный цены будут не 79,99 и 129 долларов за такие продукты, а 49, 69 и 89, то это даст шанс таким картам быть востребованными, и они смогут быть привлекательными.
Поэтому окончательных выводов мы не делаем, их сделать пока невозможно, ибо они полностью зависят от цен на новинки.
Более полные сравнительные характеристики видеокарт этого и других классов вы можете увидеть также в наших 3DGiТогах.