Nvidia Geforce GTX 550 Ti:


описание видеокарты и результаты синтетических тестов

Содержание

Nvidia Geforce GTX 550 Ti — Часть 1: Теоретические сведения

В этой части, как обычно, мы изучим саму видеокарту, а также познакомимся с результатами синтетических тестов. Вернее, видеокарты. Поскольку перед анонсом мы получили два продукта от InnoVision и Gainward. На их основе и делались все тесты.

Плата

Inno3D Geforce GTX 550 Ti 1024 МБ 192-битной GDDR5, PCI-E
  • GPU: Geforce GTX 550 Ti (GF116)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs) (МГц): 920 (номинал — 900)
  • Частота работы памяти (физическая (эффективная)) (МГц): 1025 (4100) (номинал — 1025 (4100))
  • Ширина шины обмена с памятью (бит): 192
  • Число вычислительных блоков в GPU/частота работы блоков (МГц): 192/1840 (номинал — 192/1800)
  • Число операций (ALU) в блоке: 1
  • Суммарное число операций (ALU): 192
  • Число блоков текстурирования: 32 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 24
  • Размеры (мм): 195×100×33 (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: синий
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 2×DVI (Dual-Link/HDMI), HDMI-mini
  • Поддержка многопроцессорной работы: SLI (Hardware)
Gainward Geforce GTX 550 Ti Golden Sample 1024 МБ 192-битной GDDR5, PCI-E
  • GPU: Geforce GTX 550 Ti (GF116)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs) (МГц): 1000 (номинал — 900)
  • Частота работы памяти (физическая (эффективная)) (МГц): 1100 (4400) (номинал — 1025 (4100))
  • Ширина шины обмена с памятью (бит): 192
  • Число вычислительных блоков в GPU/частота работы блоков (МГц): 192/2000 (номинал — 192/1800)
  • Число операций (ALU) в блоке: 1
  • Суммарное число операций (ALU): 192
  • Число блоков текстурирования: 32 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 24
  • Размеры (мм): 195×100×33 (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: красный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), HDMI, VGA
  • Поддержка многопроцессорной работы: SLI (Hardware)

Inno3D Geforce GTX 550 Ti 1024 МБ 192-битной GDDR5, PCI-E

Карта имеет 1024 МБ памяти GDDR5 SDRAM, размещенной в шести микросхемах на лицевой сторонe PCB. При этом четыре микросхемы памяти имеют емкость по 1 Гбит, и две микросхемы — по 2 Гбит.

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.

Gainward Geforce GTX 550 Ti Golden Sample 1024 МБ 192-битной GDDR5, PCI-E

Карта имеет 1024 МБ памяти GDDR5 SDRAM, размещенной в шести микросхемах на лицевой сторонe PCB. При этом четыре микросхемы памяти имеют емкость по 1 Гбит, и две микросхемы — по 2 Гбит.

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.


Сравнение с эталонным дизайном, вид спереди
Inno3D Geforce GTX 550 Ti 1024 МБ 192-битной GDDR5, PCI-E Reference card Nvidia Geforce GTS 450
Gainward Geforce GTX 550 Ti Golden Sample 1024 МБ 192-битной GDDR5, PCI-E Reference card Nvidia Geforce GTS 450

Сравнение с эталонным дизайном, вид сзади
Inno3D Geforce GTX 550 Ti 1024 МБ 192-битной GDDR5, PCI-E Reference card Nvidia Geforce GTS 450
Gainward Geforce GTX 550 Ti Golden Sample 1024 МБ 192-битной GDDR5, PCI-E Reference card Nvidia Geforce GTS 450

Даже если просто взглянуть на цвета текстолита у каждой из плат, то можно понять, что поработали над ними инженеры каждой из компаний. Видеокарты в основе своей базируются на эталонном дизайне, однако внесено множество изменений. Особенно это касается карты от Gainward, где дизайн печатной платы вообще свой собственный, даже в плане размещения микросхем памяти (эталонный предусматривает размешение памяти как на лицевой, так и на оборотной сторонах PCB). Разумеется, мы сравниваем с GTS 450, который является своего рода предком GTX 550, мы уже говорили об этом.

Собственно, очевидно, что продукт от Inno3D позволяет установить на карте в два раза больший объем памяти, поскольку имеются свободные посадочные места под микросхемы памяти.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. А у изделия от Gainward имеется и свое VGA-гнездо. Что касается вывода на HDMI, то оба продукта также обладают такой возможностью, имея соответствующие гнезда (у карты от Inno3D гнездо HDMI в формате мини, поэтому потребуется соответствующий переходник).

Максимальные разрешения и частоты:

  • 240 Гц максимальная частота обновления
  • 2048×1536@85 Гц — по аналоговому интерфейсу
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI)

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Есть смысл еще раз напомнить, что карта требует дополнительного питания, причем одним 6-контактным разъемом.

О системах охлаждения.

Inno3D Geforce GTX 550 Ti 1024 МБ 192-битной GDDR5, PCI-E
Продукт обладает простой СО, представляющей собой банальный округлый центральный радиатор из алюминиевых сплавов. Над ним размещен большой вентилятор, а все это получило этакую стилизованную пластиковую оправу.

Вентилятор работает на невысоких оборотах, потому шума практически нет даже под сильной нагрузкой.

Микросхемы памяти не охлаждаются, только ядро.
Gainward Geforce GTX 550 Ti Golden Sample 1024 МБ 192-битной GDDR5, PCI-E
Кулер по сути аналогичной конструкции, центральный радиатор в большим вентилятором в центре. А длинный кожух — это лишь дизайн, декорация.

Вентилятор также работает на малых оборотах, потому почти бесшумен.

Микросхемы памяти также не охлаждаются.

Мы провели исследование температурного режима с помощью утилиты MSI Afterburner (автор А. Николайчук AKA Unwinder) и получили следующие результаты:

Inno3D Geforce GTX 550 Ti 1024 МБ 192-битной GDDR5, PCI-E
Gainward Geforce GTX 550 Ti Golden Sample 1024 МБ 192-битной GDDR5, PCI-E

Очевидно, что даже при таком очень существенном разгоне ядра, как у карты компании Gainward, нагрев не превышает критические значения и нормален для карт такого класса.

Теперь о комплектации. Видеокарта от Inno3D прибыла к нам без упаковки и комплекта, потому мы изучим лишь комплект от Gainward.

Базовый комплект поставки должен включать в себя руководство пользователя, диск с драйверами и утилитами.

Gainward Geforce GTX 550 Ti Golden Sample 1024 МБ 192-битной GDDR5, PCI-E
Перед нами базовый комплект плюс разветвитель для питания.

Упаковка.

Gainward Geforce GTX 550 Ti Golden Sample 1024 МБ 192-битной GDDR5, PCI-E
Упаковка состоит из суперобложки традицинного фирменного дизайна, а также коробки из толстого картона.

Внутри нее — отсеки из картона, в которых и находится весь комплект. Сама карта жестко закреплена, поэтому перевозка ей не страшна.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core i7-975 (Socket 1366)
    • процессор Intel Core i7-975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900W.
  • операционная система Windows 7 64 бит; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы ATI версии Catalyst 11.2; Nvidia версии 266.58/266.66/267.59.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать по ссылкам:

  • D3D RightMark Beta 4 (1050) с описанием на сайте http://3d.rightmark.org.
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: Vista без SP1, Vista c SP1.

Для работы RightMark3D 2.0 также требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 550 Ti со стандартными параметрами (далее GTX 550);
  • Geforce GTX 460 со стандартными параметрами, модель с 768 МБ видеопамяти (далее GTX 460);
  • Geforce GTS 450 со стандартными параметрами (далее GTS 450);
  • Radeon HD 6850 со стандартными параметрами (далее HD 6850);
  • Radeon HD 5770 со стандартными параметрами (далее HD 5770).

Для сравнения результатов новой модели Geforce GTX 550 Ti мы выбрали именно эти видеокарты по следующим причинам: Radeon HD 6850 и Radeon HD 5770 основаны на разных GPU и являются наиболее близкими по цене решениями от конкурирующей с Nvidia компании AMD. Geforce GTS 450 — видеокарта на схожем графическом процессоре из предыдущего поколения, а GTX 460 с 768 МБ памяти — это близкое по характеристикам решение предыдущей линейки, основанное на более мощном чипе GF114.

Direct3D 9: тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

В нашем первом тесте видеокарты традиционно показывают цифры, далёкие от теоретически возможных значений, и поэтому мы перепроверим их ещё раз в аналогичном тесте 3DMark Vantage. Результаты данной синтетики для GTX 550 Ti не дотягивают до пиковых значений, по ней получается, что новая видеокарта выбирает до 21 текселя за один такт из 32-битных текстур при билинейной фильтрации в этом тесте, что значительно ниже теоретической цифры в 32 отфильтрованных текселя.

Что касается сравнения с другими платами, то по скорости текстурирования новый GTX 550 Ti оказался ровно посередине между GTS 450 и GTX 460. Иначе говоря, новый чип работает несколько эффективнее его старшего собрата из предыдущей линейки — GF104.

Ну а обе сравниваемые видеокарты от компании AMD значительно опережают все решения Nvidia, в том числе и новое, во всех режимах с любым количеством накладываемых на пиксель текстур. Что интересно, разница наиболее очевидна в случаях с небольшим количеством текстур, хотя там должно сказываться больше ограничение по ПСП. Похоже, что Radeon выполняют задачу эффективнее, хотя также не достигают реально возможных показателей. Рассмотрим тест филлрейта:

Во втором синтетическом тесте, который показывает скорость заполнения, видно всё то же самое, но уже с учетом количества записанных в буфер кадра пикселей. И по диаграмме видно странное ограничение скорости рендеринга у решений Nvidia в условиях вплоть до четырёх текстур включительно, а у видеокарт AMD — лишь до двух-трех текстур на пиксель.

Максимальный результат всё так же остаётся за решениями AMD, значительно более эффективно справляющимися с нашим синтетическим тестом. Удивительно, что в простых условиях лучший результат показывает Radeon HD 5770, а в сложных вперёд выходит уже HD 6850. Рассматриваемое сегодня решение Nvidia уступает всем, кроме предшественницы GTS 450, хотя её соответствующие теоретические характеристики близки к цифрам младшей видеокарты AMD.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Эти тесты пиксельных шейдеров младших версий весьма и весьма просты для современных GPU даже такого уровня, и они явно не могут показать возможности современных видеочипов. Производительность в этих тестах ограничена по большей части скоростью текстурных модулей, с учётом эффективности блоков (см. выше) и кэширования текстурных данных. Также есть некоторое влияние ПСП видеопамяти.

Хорошо заметно, что GF116 повторяет результаты GF106, но с учётом более высоких тактовых частот GPU для GTX 550 Ti. Новая модель снова расположилась примерно посередине между GTS 450 и GTX 460. В самых простых шейдерах разница между GTX 550 Ti и GTX 460 составила 10–14% в пользу старой модели, что ниже теоретической разницы по мощности этих GPU. Похоже, что производительность GTX 460 в этом тесте больше ограничена пропускной способностью видеопамяти, и GTX 550 Ti весьма близка к ней в части задач.

Впрочем, если брать сравнение с видеокартами AMD, то тут снова нет ничего позитивного — GTX 550 Ti во всех тестах проигрывает и HD 5770, и HD 6850. Впрочем, разница между ними зачастую не так уж велика. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Эти тесты традиционно более любопытны. В сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и поэтому карты в нём обычно располагаются по скорости текстурирования. В этом тесте GTX 550 Ti показывает теоретически вполне обоснованный результат, отставая от GTX 460 на 22%, что чуть меньше теоретической разницы. В этот раз новая GTX 550 Ti ближе уже к GTS 450. К сожалению, видеокарты AMD всё так же остаются впереди, хотя они оторвались не так далеко.

Результаты второго подтеста иные, хотя тут GTX 550 Ti всё так же уступает всем решениям, кроме младшей сестры GTS 450. Тест более интенсивен вычислительно, и в нём уже сказывается влияние математической производительности. И поэтому тест гораздо лучше подходит для видеокарт AMD, обладающих заметно большим количеством блоков ALU. Разница между GTX 550 Ti и GTS 450 во втором тесте составила менее 20%.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики.
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, зависящие и от скорости блоков ALU, и от скорости текстурирования, в них важен общий баланс чипа. Производительность видеокарт в тесте «Frozen Glass» схожа с той, что мы видели выше в «Cook-Torrance», и новая GTX 550 Ti снова уступает порядка 15% Geforce GTX 460, да и оба решения компании AMD также оказались привычно впереди. GTX 550 Ti по скорости снова примерно посередине между GTS 450 и GTX 460.

Во втором тесте «Parallax Mapping» результаты тоже мало чем отличаются от предыдущих. Решения на основе чипов GF116 и GF106 привычно позади остальных, и GTX 550 Ti опережает только GTS 450, отставая на такое же расстояние от GTX 460. Разница между ними чуть выше — 17%, что подтверждает тот факт, что новому решению Nvidia больше всего не хватает математической производительности. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

Положение нового решения относительно GTX 460 и GTS 450 не изменилось, они расположились на ровной лесенке по порядку: GTS 450, GTX 550 Ti, GTX 460. В этот раз видеокарты Nvidia стали даже ещё немного больше уступать HD 6850 и HD 5770. Разница между видеокартами на GF104 и GF116 получилась 15–20%, и по сравнению с математическим аналогом теста она немного увеличилась. В скорости текстурирования новому GTX 550 Ti похвастать также особо нечем.

Но всё это были устаревшие задачи, в основном с упором в текстурирование или филлрейт, да и не особенно сложные. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API, которые намного показательнее с точки зрения современных игр на ПК. Эти тесты отличаются тем, что сильнее нагружают и ALU, и текстурные модули, обе шейдерные программы сложные и длинные, включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D графики.
  • Fur — процедурный шейдер, визуализирующий мех.

А вот с тестами пиксельных шейдеров версии 3.0 у нового решения Nvidia всё гораздо лучше. Что и немудрено, так как оба PS 3.0 теста довольно сложны, почти не зависят от ПСП и текстурирования, и являются хоть и математическими, но с большим количеством переходов и ветвлений, с которыми неплохо справляется новая архитектура Nvidia. Хотя и последние видеокарты AMD показывают тут очень сильные результаты.

Итак, в одном из наиболее сложных Direct3D 9 тестов (Fur) представленная сегодня GTX 550 Ti показала результат заметно выше чем у обоих Radeon, а во втором (Steep Parallax Mapping) оказалась на уровне HD 5770 и немного уступила HD 6850. Что касается сравнения с другими платами Nvidia, то в обоих тестах новое решение снова расположилось ровно между GTS 450 на GF106 и GTX 460 на GF104. Своему старшему собрату GTX 460 новое решение Nvidia уступает 20–23%, что объясняется меньшим количеством блоков ALU. В целом, результат для GTX 550 Ti по этой паре неплохой, ведь она успешно конкурирует с обоими представителями от AMD.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40–80, включение «шейдерного» суперсэмплинга — до 60–120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит не только от количества и эффективности блоков TMU, но и от филлрейта. Результаты в режиме «High» получаются примерно в полтора раза ниже, чем в «Low», как и должно быть по теории. В Direct3D 10 тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia ранее были сильнее, но последняя архитектура AMD показывает схожие результаты.

В результате, новая видеокарта Nvidia немного отстаёт от младшего Radeon и очень сильно уступает старшей модели конкурента, которая и стала лидером теста. Это говорит о явном влиянии ПСП на скорость рендеринга, этот показатель у HD 6850 максимален. А в случае GTX 550 Ti и GTX 460 разница в скорости соответствует теоретической разнице в скорости ALU и TMU — чуть выше 30%.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится и ПСП с филлрейтом будут влиять иначе:

Включение суперсэмплинга увеличивает теоретическую нагрузку вчетверо, и в таком случае все решения Nvidia сдают позиции, а обе видеокарты AMD выглядят ещё сильнее. Теперь оба Radeon выигрывают у всех карт Nvidia. При этом HD 6850 значительно опережает HD 5770. Вероятно, производительность ограничивается всё же производительностью ROP, которая у HD 6850 заметно выше. А вот в случае карт Nvidia всё иначе, GTX 550 Ti отстаёт от GTX 460, несмотря на большую ПСП и филлрейт.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок, называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Этот тест интереснее с практической точки зрения, так как многие разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются во многих проектах, например, в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить и самозатенение, увеличивающее нагрузку на видеочип примерно в два раза — такой режим называется «High».

Диаграмма весьма похожа на предыдущую (также без SSAA), и результаты близки даже по абсолютным цифрам. В обновленном D3D10 варианте данного теста без включения суперсэмплинга, новая модель GTX 550 Ti справляется с данной задачей примерно на 30% медленнее, чем GTX 460, основанная на чипе GF104. В этом тесте она явно ближе к GTS 450 по скорости, так как скорость текстурирования и математических вычислений у неё ближе к младшей модели.

От обеих видеокарт производства AMD всё так же отстают обе платы на чипах GF106 и GF116, и только GTX 460 конкурирует с Radeon HD 5770. Ну а явным лидером снова становится HD 6850, основанная на чипе Barts. Данная видеокарта имеет явное преимущество по теоретическим характеристикам филлрейта и ПСП. Поглядим, что изменит включение суперсэмплинга.

При включении SSAA и самозатенения задача получилась заметно более тяжёлой, совместное включение сразу этих двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями нескольких видеокарт изменилась, включение суперсэмплинга сказывается как и в предыдущем случае — карты производства AMD ещё больше упрочили свои показатели относительно решений Nvidia.

Radeon HD 6850 остаётся впереди без вариантов, а второе место забирает HD 5770. Наш сегодняшний герой GTX 550 Ti отстаёт от обоих конкурентов и традиционно расположился между GTS 450 и GTX 460. Не очень высокий результат, хотя от платы на чипе GF104 новая видеокарта Nvidia отстаёт ровно на всё близкие к теоретическим 25–27%.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Чисто математические тесты подтверждают, что графический процессор GF116 архитектурно не отличается от своего предшественника GF106, разница между GTX 550 Ti и GTS 450 почти соответствует теоретическим 15% по сравнительной производительности блоков ALU. Практический разрыв между решениями несколько больше из-за влияния ПСП, особенно на младшую модель. Все остальные решения также расположились примерно соответственно теоретическим показателям.

Видеокарты AMD в этом синтетическом тесте традиционно значительно быстрее, так как в вычислительно сложных задачах современная архитектура AMD имеет просто огромное преимущество перед конкурирующими видеокартами Nvidia, даже несмотря на меньший КПД. Вот и в этот раз разница между картами Nvidia и AMD остаётся весьма большой, HD 6850 и HD 5770 показывают результаты примерно вдвое выше, чем GTX 550 Ti, что соответствует теории. Новая модель отстаёт от GTX 460 на близкие к теоретическим 27%.

В наших прошлых исследованиях мы отметили, что данный тест не полностью зависит от скорости ALU, производительные решения ограничиваются ещё и скоростью видеопамяти. Поэтому рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он ещё тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Изменений в расположении карт по ранжиру немного, только разница между HD 6850 и HD 5770 немного сократилась. Во втором математическом подтесте скорость рендеринга ограничена почти исключительно производительностью шейдерных блоков, и разница между GTX 550 Ti и GTS 450 уменьшилась, хотя и осталась выше теоретической. Между новой моделью и GTX 460 лишь 27% разницы, хотя по теории должно быть чуть больше.

Итог по математическим вычислениям всё тот же — у решений компании AMD есть явное преимущество, объясняемое большим количеством блоков ALU. Далее мы рассмотрим результаты тестирования геометрических шейдеров, они нам будут интересны потому, что основным ограничителем производительности в них часто является скорость обработки геометрии, и будет интересно сравнить GTX 550 Ti с конкурентами.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений. Производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не особенно сложная, производительность ограничена не только скоростью выполнения геометрических шейдеров, но и пропускной способностью памяти.

Geforce GTX 550 Ti снова оказался ровно посередине между GTX 460 и GTS 450, а разница между GTX 550 Ti и GTX 460 получилась около 22%. По сравнению с конкурентами, новая видеокарта Nvidia показала результат чуть выше, чем получилось у Radeon HD 5770, но в полтора раза ниже, чем у HD 6850. При этом HD 6850 не имеет большого количества блоков обработки геометрии. Это говорит о большом влиянии на результаты скорости блоков ROP и/или ПСП.

Также возможно, что у HD 6850 «сработала» оптимизация геометрических блоков, которые сделали инженеры AMD. В данном тесте скорость выполнения ей геометрических шейдеров оказалась даже выше, чем у GTX 460, что очень неплохо. Посмотрим, что изменится при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте, цифры для решений Nvidia и Radeon HD 6850 почти не изменились, а вот младшая видеокарта Radeon HD 5770 слегка подтянула свои результаты. А платы Nvidia в этом тесте вовсе не замечают изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, и показывают аналогичные предыдущей диаграмме результаты. В результате, HD 5770 идёт ноздря в ноздрю вместе с представленной сегодня GTX 550 Ti. Перейдём к следующему тесту, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. Иными словами, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть менее чем в два раза медленней.

В этом тесте при сбалансированной загрузке скорость рендеринга для всех решений менее явно ограничена геометрической производительностью, и цифры говорят о явном упоре в ПСП. Новый Geforce GTX 550 Ti в этот раз уже ближе к GTX 460 (разница составляет лишь 9–13%), и с ростом сложности геометрии его отставание всё меньше и меньше. Что интересно, теперь новое решение Nvidia показывает результат ровно между двумя видеокартами AMD.

Цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

А вот в этом тесте разница между GF116 и GF104 стала ближе к теоретически обоснованной — порядка 25%. К сожалению, у GF116 нет преимуществ по скорости исполнения геометрических шейдеров, так как он имеет в своём составе лишь один растеризатор, в отличие от двух у GF114 и GF104. Да и оптимизированная обработка геометрии в Barts позволила Radeon HD 6850 оказаться заметно впереди.

Сравнение с видеокартами AMD показывает, что производительность GTX 550 Ti в этом тесте находится на уровне лишь младшей модели — HD 5770. А вот более новое решение компании — HD 6850 — неожиданно стало лидером теста, обогнав даже карту на GF104, имеющей два блока растеризации.

На основе тестов геометрических шейдеров делаем вывод о том, что скорость растеризации и triangle setup может стать потенциально слабым показателем GF116 для общей производительности в некоторых современных играх с большим количеством геометрии. Хотя для решения такого низкого уровня показанные результаты неплохи, но стоящий столько же Radeon HD 6850 явно показал себя лучше. Впрочем, в задачах тесселяции скорость будет ограничена не растеризаторами, а тесселяторами, и в таких случаях новый GPU может показать более сильные результаты.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования и пропускная способность памяти. Разница между решениями не очень большая, причём они явно показывают странные результаты, не ускоряясь в простых режимах. Свежая модель GTX 550 Ti традиционно настолько же быстрее GTS 450, насколько медленнее чем GTX 460.

В сложном режиме GTX 550 Ti обгоняет обоих конкурентов от AMD (причём, HD 5770 отстал чуть ли не вдвое), а вот в среднем и лёгком результат нового решения явно чем-то ограничен. Поэтому HD 6850 выходит в среднем и лёгком режимах, а HD 5770 быстрее только в лёгком. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме изменилось не слишком сильно, но теперь упор видеокарт на чипах Nvidia во что-то неведомое стал ещё более заметен, особенно в самом лёгком режиме. И, что весьма интересно, GTX 550 Ti в этот раз значительно ближе к GTS 450, чем к GTX 460, основанной на другом чипе. Разница между решениями на базе GF116 и GF104 составила до 34%, что выше теоретической разницы в скорости текстурирования.

Все остальные выводы можно просто повторить. Так как Nvidia сильнее в тяжёлом режиме, то GTX 550 Ti обгоняет обе карты AMD. В среднем режиме обходит уже только одну HD 5770, а в лёгком и вовсе уступает обоим конкурентам. Тут явно не обошлось без каких-то специфических оптимизаций драйвера Nvidia.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

А вот тут уже результаты не похожи на те, что мы видели на предыдущих диаграммах. В тесте «Waves» в разных условиях мы видим уже явное преимущество Radeon HD 6850, а вот все остальные решения показывают ожидаемые результаты. Наш сегодняшний герой GTX 550 Ti в этом тесте показывает производительность лишь немногим выше, чем GTS 450, а от GTX 460 новая карта на чипе GF116 отстаёт аж на 36% в тяжёлом режиме. Похоже, что на результатах теста сказывается эффективность кэширования. Рассмотрим второй вариант этого же теста:

Изменений с ростом сложности условий совсем немного, и ничего интересного мы не отметили. Относительные результаты графического процессора GF116 во втором тесте вершинных выборок при высокой детализации остались примерно на уровне конкурирующего Radeon HD 5770, в тяжёлом режиме GTX 550 Ti впереди, а в лёгком уступает.

Ну а с Radeon HD 6850 сравнивать бессмысленно — эта видеокарта в данном тесте явно сильнейшая, и особенно это заметно в простых условиях. Разница между видеокартами на основе GF116 и GF106 составила 11–12%, что почти соответствует теоретической разнице по скорости текстурирования.

А вот что касается сравнения GTX 460 и GTX 550 Ti, то практическая разница в 37–41% явно выше теоретических 31%. Похоже, производительность в этом тесте не ограничена одной лишь скоростью текстурирования, и уже сказывается влияние производительности блоков установки треугольников.

3DMark Vantage: Feature тесты

Синтетические тесты из пакета 3DMark Vantage хоть уже и не новы, но они обладают поддержкой D3D10 и интересны тем, что отличаются от наших. При анализе результатов нового решения компании Nvidia в этом пакете мы сможем сделать какие-то полезные выводы, ускользнувшие от нас в тестах семейства RightMark.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

В тесте текстурной производительности пакета Vantage результаты получаются не такие, как в нашем RightMark. И вот эти цифры больше похожи на истину, да и к теории они очень близки. В текстурной синтетике из 3DMark Vantage все видеокарты Nvidia заметно более эффективно используют имеющиеся текстурные блоки, и поэтому GTX 550 Ti показал результат лишь на 20–30% хуже, чем обе видеокарты Radeon, что подтверждается и теоретическими цифрами. Но всё же видеокарты AMD остаются быстрее, обладая большим количеством блоков текстурирования.

Что касается сравнения с видеокартами Nvidia, то и тут получился вполне объяснимый результат — GTX 550 Ti обгоняет своего собрата GTS 450 и сильнее отстаёт от GTX 460, в полном соответствии с теорией. Разница между производительностью GTX 550 Ti и GTX 460 составила более 30%, что почти равно теоретической разнице по производительности TMU. В целом, новая видеокарта на базе чипа GF116 показывает неплохой результат, учитывая, что видеокарты Nvidia обычно сильно уступают конкурентам в таких тестах.

Feature Test 2: Color Fill

Тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Показатели производительности в этом тесте примерно соответствуют теоретическим цифрам филлрейта (производительности блоков ROP), но на некоторых результатах сказывается и влияние ПСП видеопамяти. Цифры не похожи на наши потому, что у нас используется целочисленный буфер с 8 бит на компоненту, а в тесте Vantage — 16 бит с плавающей точкой.

Относительные результаты анонсированного GTX 550 Ti в этом тесте хуже, чем теоретические. Вероятно, влияние ПСП есть на некоторых из решений, так как по теории GTX 550 Ti должна быть быстрее GTX 460 с 768 МБ видеопамяти. Но новая модель Nvidia показывает результат хуже чем GTX 460, что не даёт ей догнать конкурентов от компании AMD, в том числе и имеющего меньшую теоретическую скорость заполнения Radeon HD 5770. Немудрено, что между HD 6850 и новой платой Nvidia — гигантская пропасть. Ну и по сравнению с GTS 450 новая модель в этом тесте оказалась быстрее лишь на 17%.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника), с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения.

Отрисовываемая поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Тест отличается от других подобных тем, что результаты в нём зависят не исключительно от скорости математических вычислений или эффективности исполнения ветвлений или скорости текстурных выборок, а от всего понемногу. И для достижения высокой скорости важен грамотный баланс блоков GPU и ПСП видеопамяти. Заметно влияет на скорость и эффективность выполнения ветвлений в шейдерах.

Увы, но все чипы Nvidia в этом тесте показывают слабые результаты. Сильнейшая из них (GTX 460) не достаёт даже Radeon HD 5770, не говоря уже о более простых платах компании. Представленная сегодня GTX 550 Ti, предназначенная для верхней части нижнего ценового диапазона, не дотягивает до младшей из выбранных решений AMD примерно 50%. А по сравнению с видеокартами Nvidia ситуация привычная — новинка расположилась ровно между GTX 460 и GTS 450.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

И только тут решения Nvidia реабилитируются. Похоже, что на скорость рендеринга в этом тесте также влияет сразу несколько различных параметров. Но всё же, больше всего скорость зависит от производительности обработки геометрии и эффективности исполнения геометрических шейдеров. В этом тесте GTX 460 работает быстрее всех, являясь явным лидером сравнения. Ну а GTX 550 Ti обгоняет обе видеокарты AMD, хоть и с небольшим преимуществом.

В данном тесте все платы Nvidia показывают более высокие результаты при выполнении сложных шейдеров. С выполнением геометрических шейдеров, скоростью обработки геометрии и эффективностью исполнения сложных программ у GF116 всё очень неплохо. Очень интересно, что GTX 550 Ti в этом тесте ближе по скорости к GTX 460, чем к GTS 450.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты этого теста схожи с теми, что мы видели на прошлой диаграмме. Но в этот раз у Radeon HD 6850 нашлись резервы, чтобы подтянуть свои результаты. GTX 460 остаётся на лидирующей позиции, ну а наш герой GTX 550 Ti показывает скорость на уровне сильнейшей из двух плат AMD. Также отметим, что разница между видеокартами Nvidia снова несколько непривычна — результат GTX 550 Ti расположился на диаграмме ближе к результату GTX 460, а GTS 450 отстала от них довольно сильно. Поэтому мы склоняемся к тому, чтобы списать разницу на недостаток ПСП у младшего решения компании.

В целом же, по двум синтетическим тестам имитации тканей и частиц из этого тестового пакета, в которых используются геометрические шейдеры, можно сделать вывод о том, что представленный графический процессор Nvidia показал очень хороший результат, опередив обе конкурирующие видеокарты от компании AMD. Даже с учётом наличия всего одного растеризатора в GF116.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он использует очень много математических расчётов.

Данный тест из пакета 3DMark Vantage измеряет пиковую математическую производительность видеочипов в предельных задачах. И показанная в нём скорость всех решений примерно соответствует тому, что получается по теории и нашим математическим тестам из пакета RightMark 2.0.

Видеокарты AMD снова с треском выигрывают у всех решений компании Nvidia и в этом тесте. Мы уже не раз убеждались в том, что простые, но интенсивные математические расчёты выполняются на видеокартах Radeon значительно быстрее, чем на Geforce. Вот и в этом математическом тесте Geforce GTX 550 Ti, основанный на улучшенном чипе GF116, показывает скорость почти вдвое ниже, чем оба прямых конкурента, как и должно быть по теории.

По сравнению с другими платами Nvidia, новая модель быстрее, чем GTS 450 на 22%, что меньше теоретической разницы. А отставание от GTX 460 составляет 27%, что совсем недалеко от теоретических 31%. А вот с обеими видеокартами AMD поделать ничего нельзя, они тут явно сильнее, как и в остальных предельных математических тестах.

Выводы по синтетическим тестам

По результатам проведённых синтетических тестов новой модели Nvidia Geforce GTX 550 Ti, основанной на улучшенном графическом процессоре GF116, а также результатам других моделей видеокарт от обоих производителей видеочипов, можно сделать вывод о том, что модификация чипа GF106 исходной архитектуры Fermi получилась технически неплохой, а вот рыночный успех в данном ценовом диапазоне будет больше зависеть от розничных цен. Во многих синтетических тестах новое решение Nvidia показало себя неплохо, порой на уровне Radeon HD 6850. И всё же, есть у него и явные слабые стороны.

Обновленный GPU отличается от исходного GF106 повышенной тактовой частотой и увеличенным количеством активных блоков ROP и расширенным контроллером памяти. Эти модификации привели к увеличенной производительности (20–30% в большинстве случаев), и представленная сегодня видеокарта на основе этого GPU по скорости расположилась ровно посередине между GTS 450 и GTX 460. Особенно можно отметить высокий филлрейт и ПСП — по этому параметру GTX 550 Ti теоретически опережает даже довольно сильную модель GTX 460 с 768 МБ видеопамяти.

А среди недостатков отметим то, что производительность геометрической обработки в GF116 невелика, во многом потому, что чип имеет лишь один растеризатор, хотя и четыре блока тесселяции. Итак, в некоторых задачах скорость растеризации может быть меньше, чем у конкурирующих графических процессоров. Вторым потенциальным недостатком мы считаем относительно низкую математическую и текстурную производительность, если сравнивать новый GPU с решениями AMD. В составе GTX 550 Ti есть ровно те же 192 ALU и 32 TMU, что и в GTS 450, и их недостаток может сказаться во многих играх.

Результаты Geforce GTX 550 Ti в синтетических тестах должны подтвердиться в следующей части нашего материла, посвящённой тестированию в игровых приложениях. Будет интересно посмотреть, насколько успешно новое решение Nvidia будет конкурировать даже не с Radeon HD 5770, цену которого недавно снизили, а с HD 6850 — прямым конкурентом по цене. Эта видеокарта от AMD основана на GPU явно более высокого уровня, и она вполне может опередить GTX 550 Ti в большинстве игр.

Ведь в реальных игровых приложениях скорость рендеринга может зависеть сразу от нескольких характеристик. И довольно часто она зависит от математической производительности и текстурирования, чем выгодно отличается конкурирующее с GTX 550 Ti по цене решение от компании AMD — Radeon HD 6850.

Нам кажется, что рекомендованная цена на новую модель Nvidia несколько завышена. Возможно, изначально предполагалось, что её конкурентом станет Radeon HD 5770, но теперь новинке придётся бороться с подешевевшей Radeon HD 6850, что будет значительно труднее, и даже фабрично разогнанные версии GTX 550 Ti вряд ли с ней справятся.



Nvidia Geforce GTX 550 Ti — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией TAGAN

Корпус ThermalTake 8430 для тестового стенда предоставлен компанией 3Logic

Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia




Дополнительно

Nvidia Geforce GTX 550 Ti — 3/8 от GTX 580, или Продолжение дела GTS 450

Nvidia Geforce GTX 550 Ti:

описание видеокарты и результаты синтетических тестов

Содержание

Nvidia Geforce GTX 550 Ti — Часть 1: Теоретические сведения

В этой части, как обычно, мы изучим саму видеокарту, а также познакомимся с результатами синтетических тестов. Вернее, видеокарты. Поскольку перед анонсом мы получили два продукта от InnoVision и Gainward. На их основе и делались все тесты.

Плата

Inno3D Geforce GTX 550 Ti 1024 МБ 192-битной GDDR5, PCI-E
  • GPU: Geforce GTX 550 Ti (GF116)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs) (МГц): 920 (номинал — 900)
  • Частота работы памяти (физическая (эффективная)) (МГц): 1025 (4100) (номинал — 1025 (4100))
  • Ширина шины обмена с памятью (бит): 192
  • Число вычислительных блоков в GPU/частота работы блоков (МГц): 192/1840 (номинал — 192/1800)
  • Число операций (ALU) в блоке: 1
  • Суммарное число операций (ALU): 192
  • Число блоков текстурирования: 32 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 24
  • Размеры (мм): 195×100×33 (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: синий
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 2×DVI (Dual-Link/HDMI), HDMI-mini
  • Поддержка многопроцессорной работы: SLI (Hardware)
Gainward Geforce GTX 550 Ti Golden Sample 1024 МБ 192-битной GDDR5, PCI-E
  • GPU: Geforce GTX 550 Ti (GF116)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs) (МГц): 1000 (номинал — 900)
  • Частота работы памяти (физическая (эффективная)) (МГц): 1100 (4400) (номинал — 1025 (4100))
  • Ширина шины обмена с памятью (бит): 192
  • Число вычислительных блоков в GPU/частота работы блоков (МГц): 192/2000 (номинал — 192/1800)
  • Число операций (ALU) в блоке: 1
  • Суммарное число операций (ALU): 192
  • Число блоков текстурирования: 32 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 24
  • Размеры (мм): 195×100×33 (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: красный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), HDMI, VGA
  • Поддержка многопроцессорной работы: SLI (Hardware)

Inno3D Geforce GTX 550 Ti 1024 МБ 192-битной GDDR5, PCI-E

Карта имеет 1024 МБ памяти GDDR5 SDRAM, размещенной в шести микросхемах на лицевой сторонe PCB. При этом четыре микросхемы памяти имеют емкость по 1 Гбит, и две микросхемы — по 2 Гбит.

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.

Gainward Geforce GTX 550 Ti Golden Sample 1024 МБ 192-битной GDDR5, PCI-E

Карта имеет 1024 МБ памяти GDDR5 SDRAM, размещенной в шести микросхемах на лицевой сторонe PCB. При этом четыре микросхемы памяти имеют емкость по 1 Гбит, и две микросхемы — по 2 Гбит.

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.


Сравнение с эталонным дизайном, вид спереди
Inno3D Geforce GTX 550 Ti 1024 МБ 192-битной GDDR5, PCI-E Reference card Nvidia Geforce GTS 450
Gainward Geforce GTX 550 Ti Golden Sample 1024 МБ 192-битной GDDR5, PCI-E Reference card Nvidia Geforce GTS 450

Сравнение с эталонным дизайном, вид сзади
Inno3D Geforce GTX 550 Ti 1024 МБ 192-битной GDDR5, PCI-E Reference card Nvidia Geforce GTS 450
Gainward Geforce GTX 550 Ti Golden Sample 1024 МБ 192-битной GDDR5, PCI-E Reference card Nvidia Geforce GTS 450

Даже если просто взглянуть на цвета текстолита у каждой из плат, то можно понять, что поработали над ними инженеры каждой из компаний. Видеокарты в основе своей базируются на эталонном дизайне, однако внесено множество изменений. Особенно это касается карты от Gainward, где дизайн печатной платы вообще свой собственный, даже в плане размещения микросхем памяти (эталонный предусматривает размешение памяти как на лицевой, так и на оборотной сторонах PCB). Разумеется, мы сравниваем с GTS 450, который является своего рода предком GTX 550, мы уже говорили об этом.

Собственно, очевидно, что продукт от Inno3D позволяет установить на карте в два раза больший объем памяти, поскольку имеются свободные посадочные места под микросхемы памяти.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. А у изделия от Gainward имеется и свое VGA-гнездо. Что касается вывода на HDMI, то оба продукта также обладают такой возможностью, имея соответствующие гнезда (у карты от Inno3D гнездо HDMI в формате мини, поэтому потребуется соответствующий переходник).

Максимальные разрешения и частоты:

  • 240 Гц максимальная частота обновления
  • 2048×1536@85 Гц — по аналоговому интерфейсу
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI)

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Есть смысл еще раз напомнить, что карта требует дополнительного питания, причем одним 6-контактным разъемом.

О системах охлаждения.

Inno3D Geforce GTX 550 Ti 1024 МБ 192-битной GDDR5, PCI-E
Продукт обладает простой СО, представляющей собой банальный округлый центральный радиатор из алюминиевых сплавов. Над ним размещен большой вентилятор, а все это получило этакую стилизованную пластиковую оправу.

Вентилятор работает на невысоких оборотах, потому шума практически нет даже под сильной нагрузкой.

Микросхемы памяти не охлаждаются, только ядро.
Gainward Geforce GTX 550 Ti Golden Sample 1024 МБ 192-битной GDDR5, PCI-E
Кулер по сути аналогичной конструкции, центральный радиатор в большим вентилятором в центре. А длинный кожух — это лишь дизайн, декорация.

Вентилятор также работает на малых оборотах, потому почти бесшумен.

Микросхемы памяти также не охлаждаются.

Мы провели исследование температурного режима с помощью утилиты MSI Afterburner (автор А. Николайчук AKA Unwinder) и получили следующие результаты:

Inno3D Geforce GTX 550 Ti 1024 МБ 192-битной GDDR5, PCI-E
Gainward Geforce GTX 550 Ti Golden Sample 1024 МБ 192-битной GDDR5, PCI-E

Очевидно, что даже при таком очень существенном разгоне ядра, как у карты компании Gainward, нагрев не превышает критические значения и нормален для карт такого класса.

Теперь о комплектации. Видеокарта от Inno3D прибыла к нам без упаковки и комплекта, потому мы изучим лишь комплект от Gainward.

Базовый комплект поставки должен включать в себя руководство пользователя, диск с драйверами и утилитами.

Gainward Geforce GTX 550 Ti Golden Sample 1024 МБ 192-битной GDDR5, PCI-E
Перед нами базовый комплект плюс разветвитель для питания.

Упаковка.

Gainward Geforce GTX 550 Ti Golden Sample 1024 МБ 192-битной GDDR5, PCI-E
Упаковка состоит из суперобложки традицинного фирменного дизайна, а также коробки из толстого картона.

Внутри нее — отсеки из картона, в которых и находится весь комплект. Сама карта жестко закреплена, поэтому перевозка ей не страшна.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core i7-975 (Socket 1366)
    • процессор Intel Core i7-975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900W.
  • операционная система Windows 7 64 бит; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы ATI версии Catalyst 11.2; Nvidia версии 266.58/266.66/267.59.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать по ссылкам:

  • D3D RightMark Beta 4 (1050) с описанием на сайте http://3d.rightmark.org.
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: Vista без SP1, Vista c SP1.

Для работы RightMark3D 2.0 также требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 550 Ti со стандартными параметрами (далее GTX 550);
  • Geforce GTX 460 со стандартными параметрами, модель с 768 МБ видеопамяти (далее GTX 460);
  • Geforce GTS 450 со стандартными параметрами (далее GTS 450);
  • Radeon HD 6850 со стандартными параметрами (далее HD 6850);
  • Radeon HD 5770 со стандартными параметрами (далее HD 5770).

Для сравнения результатов новой модели Geforce GTX 550 Ti мы выбрали именно эти видеокарты по следующим причинам: Radeon HD 6850 и Radeon HD 5770 основаны на разных GPU и являются наиболее близкими по цене решениями от конкурирующей с Nvidia компании AMD. Geforce GTS 450 — видеокарта на схожем графическом процессоре из предыдущего поколения, а GTX 460 с 768 МБ памяти — это близкое по характеристикам решение предыдущей линейки, основанное на более мощном чипе GF114.

Direct3D 9: тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

В нашем первом тесте видеокарты традиционно показывают цифры, далёкие от теоретически возможных значений, и поэтому мы перепроверим их ещё раз в аналогичном тесте 3DMark Vantage. Результаты данной синтетики для GTX 550 Ti не дотягивают до пиковых значений, по ней получается, что новая видеокарта выбирает до 21 текселя за один такт из 32-битных текстур при билинейной фильтрации в этом тесте, что значительно ниже теоретической цифры в 32 отфильтрованных текселя.

Что касается сравнения с другими платами, то по скорости текстурирования новый GTX 550 Ti оказался ровно посередине между GTS 450 и GTX 460. Иначе говоря, новый чип работает несколько эффективнее его старшего собрата из предыдущей линейки — GF104.

Ну а обе сравниваемые видеокарты от компании AMD значительно опережают все решения Nvidia, в том числе и новое, во всех режимах с любым количеством накладываемых на пиксель текстур. Что интересно, разница наиболее очевидна в случаях с небольшим количеством текстур, хотя там должно сказываться больше ограничение по ПСП. Похоже, что Radeon выполняют задачу эффективнее, хотя также не достигают реально возможных показателей. Рассмотрим тест филлрейта:

Во втором синтетическом тесте, который показывает скорость заполнения, видно всё то же самое, но уже с учетом количества записанных в буфер кадра пикселей. И по диаграмме видно странное ограничение скорости рендеринга у решений Nvidia в условиях вплоть до четырёх текстур включительно, а у видеокарт AMD — лишь до двух-трех текстур на пиксель.

Максимальный результат всё так же остаётся за решениями AMD, значительно более эффективно справляющимися с нашим синтетическим тестом. Удивительно, что в простых условиях лучший результат показывает Radeon HD 5770, а в сложных вперёд выходит уже HD 6850. Рассматриваемое сегодня решение Nvidia уступает всем, кроме предшественницы GTS 450, хотя её соответствующие теоретические характеристики близки к цифрам младшей видеокарты AMD.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Эти тесты пиксельных шейдеров младших версий весьма и весьма просты для современных GPU даже такого уровня, и они явно не могут показать возможности современных видеочипов. Производительность в этих тестах ограничена по большей части скоростью текстурных модулей, с учётом эффективности блоков (см. выше) и кэширования текстурных данных. Также есть некоторое влияние ПСП видеопамяти.

Хорошо заметно, что GF116 повторяет результаты GF106, но с учётом более высоких тактовых частот GPU для GTX 550 Ti. Новая модель снова расположилась примерно посередине между GTS 450 и GTX 460. В самых простых шейдерах разница между GTX 550 Ti и GTX 460 составила 10–14% в пользу старой модели, что ниже теоретической разницы по мощности этих GPU. Похоже, что производительность GTX 460 в этом тесте больше ограничена пропускной способностью видеопамяти, и GTX 550 Ti весьма близка к ней в части задач.

Впрочем, если брать сравнение с видеокартами AMD, то тут снова нет ничего позитивного — GTX 550 Ti во всех тестах проигрывает и HD 5770, и HD 6850. Впрочем, разница между ними зачастую не так уж велика. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Эти тесты традиционно более любопытны. В сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и поэтому карты в нём обычно располагаются по скорости текстурирования. В этом тесте GTX 550 Ti показывает теоретически вполне обоснованный результат, отставая от GTX 460 на 22%, что чуть меньше теоретической разницы. В этот раз новая GTX 550 Ti ближе уже к GTS 450. К сожалению, видеокарты AMD всё так же остаются впереди, хотя они оторвались не так далеко.

Результаты второго подтеста иные, хотя тут GTX 550 Ti всё так же уступает всем решениям, кроме младшей сестры GTS 450. Тест более интенсивен вычислительно, и в нём уже сказывается влияние математической производительности. И поэтому тест гораздо лучше подходит для видеокарт AMD, обладающих заметно большим количеством блоков ALU. Разница между GTX 550 Ti и GTS 450 во втором тесте составила менее 20%.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики.
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, зависящие и от скорости блоков ALU, и от скорости текстурирования, в них важен общий баланс чипа. Производительность видеокарт в тесте «Frozen Glass» схожа с той, что мы видели выше в «Cook-Torrance», и новая GTX 550 Ti снова уступает порядка 15% Geforce GTX 460, да и оба решения компании AMD также оказались привычно впереди. GTX 550 Ti по скорости снова примерно посередине между GTS 450 и GTX 460.

Во втором тесте «Parallax Mapping» результаты тоже мало чем отличаются от предыдущих. Решения на основе чипов GF116 и GF106 привычно позади остальных, и GTX 550 Ti опережает только GTS 450, отставая на такое же расстояние от GTX 460. Разница между ними чуть выше — 17%, что подтверждает тот факт, что новому решению Nvidia больше всего не хватает математической производительности. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

Положение нового решения относительно GTX 460 и GTS 450 не изменилось, они расположились на ровной лесенке по порядку: GTS 450, GTX 550 Ti, GTX 460. В этот раз видеокарты Nvidia стали даже ещё немного больше уступать HD 6850 и HD 5770. Разница между видеокартами на GF104 и GF116 получилась 15–20%, и по сравнению с математическим аналогом теста она немного увеличилась. В скорости текстурирования новому GTX 550 Ti похвастать также особо нечем.

Но всё это были устаревшие задачи, в основном с упором в текстурирование или филлрейт, да и не особенно сложные. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API, которые намного показательнее с точки зрения современных игр на ПК. Эти тесты отличаются тем, что сильнее нагружают и ALU, и текстурные модули, обе шейдерные программы сложные и длинные, включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D графики.
  • Fur — процедурный шейдер, визуализирующий мех.

А вот с тестами пиксельных шейдеров версии 3.0 у нового решения Nvidia всё гораздо лучше. Что и немудрено, так как оба PS 3.0 теста довольно сложны, почти не зависят от ПСП и текстурирования, и являются хоть и математическими, но с большим количеством переходов и ветвлений, с которыми неплохо справляется новая архитектура Nvidia. Хотя и последние видеокарты AMD показывают тут очень сильные результаты.

Итак, в одном из наиболее сложных Direct3D 9 тестов (Fur) представленная сегодня GTX 550 Ti показала результат заметно выше чем у обоих Radeon, а во втором (Steep Parallax Mapping) оказалась на уровне HD 5770 и немного уступила HD 6850. Что касается сравнения с другими платами Nvidia, то в обоих тестах новое решение снова расположилось ровно между GTS 450 на GF106 и GTX 460 на GF104. Своему старшему собрату GTX 460 новое решение Nvidia уступает 20–23%, что объясняется меньшим количеством блоков ALU. В целом, результат для GTX 550 Ti по этой паре неплохой, ведь она успешно конкурирует с обоими представителями от AMD.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40–80, включение «шейдерного» суперсэмплинга — до 60–120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит не только от количества и эффективности блоков TMU, но и от филлрейта. Результаты в режиме «High» получаются примерно в полтора раза ниже, чем в «Low», как и должно быть по теории. В Direct3D 10 тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia ранее были сильнее, но последняя архитектура AMD показывает схожие результаты.

В результате, новая видеокарта Nvidia немного отстаёт от младшего Radeon и очень сильно уступает старшей модели конкурента, которая и стала лидером теста. Это говорит о явном влиянии ПСП на скорость рендеринга, этот показатель у HD 6850 максимален. А в случае GTX 550 Ti и GTX 460 разница в скорости соответствует теоретической разнице в скорости ALU и TMU — чуть выше 30%.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится и ПСП с филлрейтом будут влиять иначе:

Включение суперсэмплинга увеличивает теоретическую нагрузку вчетверо, и в таком случае все решения Nvidia сдают позиции, а обе видеокарты AMD выглядят ещё сильнее. Теперь оба Radeon выигрывают у всех карт Nvidia. При этом HD 6850 значительно опережает HD 5770. Вероятно, производительность ограничивается всё же производительностью ROP, которая у HD 6850 заметно выше. А вот в случае карт Nvidia всё иначе, GTX 550 Ti отстаёт от GTX 460, несмотря на большую ПСП и филлрейт.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок, называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Этот тест интереснее с практической точки зрения, так как многие разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются во многих проектах, например, в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить и самозатенение, увеличивающее нагрузку на видеочип примерно в два раза — такой режим называется «High».

Диаграмма весьма похожа на предыдущую (также без SSAA), и результаты близки даже по абсолютным цифрам. В обновленном D3D10 варианте данного теста без включения суперсэмплинга, новая модель GTX 550 Ti справляется с данной задачей примерно на 30% медленнее, чем GTX 460, основанная на чипе GF104. В этом тесте она явно ближе к GTS 450 по скорости, так как скорость текстурирования и математических вычислений у неё ближе к младшей модели.

От обеих видеокарт производства AMD всё так же отстают обе платы на чипах GF106 и GF116, и только GTX 460 конкурирует с Radeon HD 5770. Ну а явным лидером снова становится HD 6850, основанная на чипе Barts. Данная видеокарта имеет явное преимущество по теоретическим характеристикам филлрейта и ПСП. Поглядим, что изменит включение суперсэмплинга.

При включении SSAA и самозатенения задача получилась заметно более тяжёлой, совместное включение сразу этих двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями нескольких видеокарт изменилась, включение суперсэмплинга сказывается как и в предыдущем случае — карты производства AMD ещё больше упрочили свои показатели относительно решений Nvidia.

Radeon HD 6850 остаётся впереди без вариантов, а второе место забирает HD 5770. Наш сегодняшний герой GTX 550 Ti отстаёт от обоих конкурентов и традиционно расположился между GTS 450 и GTX 460. Не очень высокий результат, хотя от платы на чипе GF104 новая видеокарта Nvidia отстаёт ровно на всё близкие к теоретическим 25–27%.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Чисто математические тесты подтверждают, что графический процессор GF116 архитектурно не отличается от своего предшественника GF106, разница между GTX 550 Ti и GTS 450 почти соответствует теоретическим 15% по сравнительной производительности блоков ALU. Практический разрыв между решениями несколько больше из-за влияния ПСП, особенно на младшую модель. Все остальные решения также расположились примерно соответственно теоретическим показателям.

Видеокарты AMD в этом синтетическом тесте традиционно значительно быстрее, так как в вычислительно сложных задачах современная архитектура AMD имеет просто огромное преимущество перед конкурирующими видеокартами Nvidia, даже несмотря на меньший КПД. Вот и в этот раз разница между картами Nvidia и AMD остаётся весьма большой, HD 6850 и HD 5770 показывают результаты примерно вдвое выше, чем GTX 550 Ti, что соответствует теории. Новая модель отстаёт от GTX 460 на близкие к теоретическим 27%.

В наших прошлых исследованиях мы отметили, что данный тест не полностью зависит от скорости ALU, производительные решения ограничиваются ещё и скоростью видеопамяти. Поэтому рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он ещё тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Изменений в расположении карт по ранжиру немного, только разница между HD 6850 и HD 5770 немного сократилась. Во втором математическом подтесте скорость рендеринга ограничена почти исключительно производительностью шейдерных блоков, и разница между GTX 550 Ti и GTS 450 уменьшилась, хотя и осталась выше теоретической. Между новой моделью и GTX 460 лишь 27% разницы, хотя по теории должно быть чуть больше.

Итог по математическим вычислениям всё тот же — у решений компании AMD есть явное преимущество, объясняемое большим количеством блоков ALU. Далее мы рассмотрим результаты тестирования геометрических шейдеров, они нам будут интересны потому, что основным ограничителем производительности в них часто является скорость обработки геометрии, и будет интересно сравнить GTX 550 Ti с конкурентами.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений. Производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не особенно сложная, производительность ограничена не только скоростью выполнения геометрических шейдеров, но и пропускной способностью памяти.

Geforce GTX 550 Ti снова оказался ровно посередине между GTX 460 и GTS 450, а разница между GTX 550 Ti и GTX 460 получилась около 22%. По сравнению с конкурентами, новая видеокарта Nvidia показала результат чуть выше, чем получилось у Radeon HD 5770, но в полтора раза ниже, чем у HD 6850. При этом HD 6850 не имеет большого количества блоков обработки геометрии. Это говорит о большом влиянии на результаты скорости блоков ROP и/или ПСП.

Также возможно, что у HD 6850 «сработала» оптимизация геометрических блоков, которые сделали инженеры AMD. В данном тесте скорость выполнения ей геометрических шейдеров оказалась даже выше, чем у GTX 460, что очень неплохо. Посмотрим, что изменится при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте, цифры для решений Nvidia и Radeon HD 6850 почти не изменились, а вот младшая видеокарта Radeon HD 5770 слегка подтянула свои результаты. А платы Nvidia в этом тесте вовсе не замечают изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, и показывают аналогичные предыдущей диаграмме результаты. В результате, HD 5770 идёт ноздря в ноздрю вместе с представленной сегодня GTX 550 Ti. Перейдём к следующему тесту, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. Иными словами, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть менее чем в два раза медленней.

В этом тесте при сбалансированной загрузке скорость рендеринга для всех решений менее явно ограничена геометрической производительностью, и цифры говорят о явном упоре в ПСП. Новый Geforce GTX 550 Ti в этот раз уже ближе к GTX 460 (разница составляет лишь 9–13%), и с ростом сложности геометрии его отставание всё меньше и меньше. Что интересно, теперь новое решение Nvidia показывает результат ровно между двумя видеокартами AMD.

Цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

А вот в этом тесте разница между GF116 и GF104 стала ближе к теоретически обоснованной — порядка 25%. К сожалению, у GF116 нет преимуществ по скорости исполнения геометрических шейдеров, так как он имеет в своём составе лишь один растеризатор, в отличие от двух у GF114 и GF104. Да и оптимизированная обработка геометрии в Barts позволила Radeon HD 6850 оказаться заметно впереди.

Сравнение с видеокартами AMD показывает, что производительность GTX 550 Ti в этом тесте находится на уровне лишь младшей модели — HD 5770. А вот более новое решение компании — HD 6850 — неожиданно стало лидером теста, обогнав даже карту на GF104, имеющей два блока растеризации.

На основе тестов геометрических шейдеров делаем вывод о том, что скорость растеризации и triangle setup может стать потенциально слабым показателем GF116 для общей производительности в некоторых современных играх с большим количеством геометрии. Хотя для решения такого низкого уровня показанные результаты неплохи, но стоящий столько же Radeon HD 6850 явно показал себя лучше. Впрочем, в задачах тесселяции скорость будет ограничена не растеризаторами, а тесселяторами, и в таких случаях новый GPU может показать более сильные результаты.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования и пропускная способность памяти. Разница между решениями не очень большая, причём они явно показывают странные результаты, не ускоряясь в простых режимах. Свежая модель GTX 550 Ti традиционно настолько же быстрее GTS 450, насколько медленнее чем GTX 460.

В сложном режиме GTX 550 Ti обгоняет обоих конкурентов от AMD (причём, HD 5770 отстал чуть ли не вдвое), а вот в среднем и лёгком результат нового решения явно чем-то ограничен. Поэтому HD 6850 выходит в среднем и лёгком режимах, а HD 5770 быстрее только в лёгком. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме изменилось не слишком сильно, но теперь упор видеокарт на чипах Nvidia во что-то неведомое стал ещё более заметен, особенно в самом лёгком режиме. И, что весьма интересно, GTX 550 Ti в этот раз значительно ближе к GTS 450, чем к GTX 460, основанной на другом чипе. Разница между решениями на базе GF116 и GF104 составила до 34%, что выше теоретической разницы в скорости текстурирования.

Все остальные выводы можно просто повторить. Так как Nvidia сильнее в тяжёлом режиме, то GTX 550 Ti обгоняет обе карты AMD. В среднем режиме обходит уже только одну HD 5770, а в лёгком и вовсе уступает обоим конкурентам. Тут явно не обошлось без каких-то специфических оптимизаций драйвера Nvidia.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

А вот тут уже результаты не похожи на те, что мы видели на предыдущих диаграммах. В тесте «Waves» в разных условиях мы видим уже явное преимущество Radeon HD 6850, а вот все остальные решения показывают ожидаемые результаты. Наш сегодняшний герой GTX 550 Ti в этом тесте показывает производительность лишь немногим выше, чем GTS 450, а от GTX 460 новая карта на чипе GF116 отстаёт аж на 36% в тяжёлом режиме. Похоже, что на результатах теста сказывается эффективность кэширования. Рассмотрим второй вариант этого же теста:

Изменений с ростом сложности условий совсем немного, и ничего интересного мы не отметили. Относительные результаты графического процессора GF116 во втором тесте вершинных выборок при высокой детализации остались примерно на уровне конкурирующего Radeon HD 5770, в тяжёлом режиме GTX 550 Ti впереди, а в лёгком уступает.

Ну а с Radeon HD 6850 сравнивать бессмысленно — эта видеокарта в данном тесте явно сильнейшая, и особенно это заметно в простых условиях. Разница между видеокартами на основе GF116 и GF106 составила 11–12%, что почти соответствует теоретической разнице по скорости текстурирования.

А вот что касается сравнения GTX 460 и GTX 550 Ti, то практическая разница в 37–41% явно выше теоретических 31%. Похоже, производительность в этом тесте не ограничена одной лишь скоростью текстурирования, и уже сказывается влияние производительности блоков установки треугольников.

3DMark Vantage: Feature тесты

Синтетические тесты из пакета 3DMark Vantage хоть уже и не новы, но они обладают поддержкой D3D10 и интересны тем, что отличаются от наших. При анализе результатов нового решения компании Nvidia в этом пакете мы сможем сделать какие-то полезные выводы, ускользнувшие от нас в тестах семейства RightMark.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

В тесте текстурной производительности пакета Vantage результаты получаются не такие, как в нашем RightMark. И вот эти цифры больше похожи на истину, да и к теории они очень близки. В текстурной синтетике из 3DMark Vantage все видеокарты Nvidia заметно более эффективно используют имеющиеся текстурные блоки, и поэтому GTX 550 Ti показал результат лишь на 20–30% хуже, чем обе видеокарты Radeon, что подтверждается и теоретическими цифрами. Но всё же видеокарты AMD остаются быстрее, обладая большим количеством блоков текстурирования.

Что касается сравнения с видеокартами Nvidia, то и тут получился вполне объяснимый результат — GTX 550 Ti обгоняет своего собрата GTS 450 и сильнее отстаёт от GTX 460, в полном соответствии с теорией. Разница между производительностью GTX 550 Ti и GTX 460 составила более 30%, что почти равно теоретической разнице по производительности TMU. В целом, новая видеокарта на базе чипа GF116 показывает неплохой результат, учитывая, что видеокарты Nvidia обычно сильно уступают конкурентам в таких тестах.

Feature Test 2: Color Fill

Тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Показатели производительности в этом тесте примерно соответствуют теоретическим цифрам филлрейта (производительности блоков ROP), но на некоторых результатах сказывается и влияние ПСП видеопамяти. Цифры не похожи на наши потому, что у нас используется целочисленный буфер с 8 бит на компоненту, а в тесте Vantage — 16 бит с плавающей точкой.

Относительные результаты анонсированного GTX 550 Ti в этом тесте хуже, чем теоретические. Вероятно, влияние ПСП есть на некоторых из решений, так как по теории GTX 550 Ti должна быть быстрее GTX 460 с 768 МБ видеопамяти. Но новая модель Nvidia показывает результат хуже чем GTX 460, что не даёт ей догнать конкурентов от компании AMD, в том числе и имеющего меньшую теоретическую скорость заполнения Radeon HD 5770. Немудрено, что между HD 6850 и новой платой Nvidia — гигантская пропасть. Ну и по сравнению с GTS 450 новая модель в этом тесте оказалась быстрее лишь на 17%.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника), с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения.

Отрисовываемая поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Тест отличается от других подобных тем, что результаты в нём зависят не исключительно от скорости математических вычислений или эффективности исполнения ветвлений или скорости текстурных выборок, а от всего понемногу. И для достижения высокой скорости важен грамотный баланс блоков GPU и ПСП видеопамяти. Заметно влияет на скорость и эффективность выполнения ветвлений в шейдерах.

Увы, но все чипы Nvidia в этом тесте показывают слабые результаты. Сильнейшая из них (GTX 460) не достаёт даже Radeon HD 5770, не говоря уже о более простых платах компании. Представленная сегодня GTX 550 Ti, предназначенная для верхней части нижнего ценового диапазона, не дотягивает до младшей из выбранных решений AMD примерно 50%. А по сравнению с видеокартами Nvidia ситуация привычная — новинка расположилась ровно между GTX 460 и GTS 450.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

И только тут решения Nvidia реабилитируются. Похоже, что на скорость рендеринга в этом тесте также влияет сразу несколько различных параметров. Но всё же, больше всего скорость зависит от производительности обработки геометрии и эффективности исполнения геометрических шейдеров. В этом тесте GTX 460 работает быстрее всех, являясь явным лидером сравнения. Ну а GTX 550 Ti обгоняет обе видеокарты AMD, хоть и с небольшим преимуществом.

В данном тесте все платы Nvidia показывают более высокие результаты при выполнении сложных шейдеров. С выполнением геометрических шейдеров, скоростью обработки геометрии и эффективностью исполнения сложных программ у GF116 всё очень неплохо. Очень интересно, что GTX 550 Ti в этом тесте ближе по скорости к GTX 460, чем к GTS 450.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты этого теста схожи с теми, что мы видели на прошлой диаграмме. Но в этот раз у Radeon HD 6850 нашлись резервы, чтобы подтянуть свои результаты. GTX 460 остаётся на лидирующей позиции, ну а наш герой GTX 550 Ti показывает скорость на уровне сильнейшей из двух плат AMD. Также отметим, что разница между видеокартами Nvidia снова несколько непривычна — результат GTX 550 Ti расположился на диаграмме ближе к результату GTX 460, а GTS 450 отстала от них довольно сильно. Поэтому мы склоняемся к тому, чтобы списать разницу на недостаток ПСП у младшего решения компании.

В целом же, по двум синтетическим тестам имитации тканей и частиц из этого тестового пакета, в которых используются геометрические шейдеры, можно сделать вывод о том, что представленный графический процессор Nvidia показал очень хороший результат, опередив обе конкурирующие видеокарты от компании AMD. Даже с учётом наличия всего одного растеризатора в GF116.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он использует очень много математических расчётов.

Данный тест из пакета 3DMark Vantage измеряет пиковую математическую производительность видеочипов в предельных задачах. И показанная в нём скорость всех решений примерно соответствует тому, что получается по теории и нашим математическим тестам из пакета RightMark 2.0.

Видеокарты AMD снова с треском выигрывают у всех решений компании Nvidia и в этом тесте. Мы уже не раз убеждались в том, что простые, но интенсивные математические расчёты выполняются на видеокартах Radeon значительно быстрее, чем на Geforce. Вот и в этом математическом тесте Geforce GTX 550 Ti, основанный на улучшенном чипе GF116, показывает скорость почти вдвое ниже, чем оба прямых конкурента, как и должно быть по теории.

По сравнению с другими платами Nvidia, новая модель быстрее, чем GTS 450 на 22%, что меньше теоретической разницы. А отставание от GTX 460 составляет 27%, что совсем недалеко от теоретических 31%. А вот с обеими видеокартами AMD поделать ничего нельзя, они тут явно сильнее, как и в остальных предельных математических тестах.

Выводы по синтетическим тестам

По результатам проведённых синтетических тестов новой модели Nvidia Geforce GTX 550 Ti, основанной на улучшенном графическом процессоре GF116, а также результатам других моделей видеокарт от обоих производителей видеочипов, можно сделать вывод о том, что модификация чипа GF106 исходной архитектуры Fermi получилась технически неплохой, а вот рыночный успех в данном ценовом диапазоне будет больше зависеть от розничных цен. Во многих синтетических тестах новое решение Nvidia показало себя неплохо, порой на уровне Radeon HD 6850. И всё же, есть у него и явные слабые стороны.

Обновленный GPU отличается от исходного GF106 повышенной тактовой частотой и увеличенным количеством активных блоков ROP и расширенным контроллером памяти. Эти модификации привели к увеличенной производительности (20–30% в большинстве случаев), и представленная сегодня видеокарта на основе этого GPU по скорости расположилась ровно посередине между GTS 450 и GTX 460. Особенно можно отметить высокий филлрейт и ПСП — по этому параметру GTX 550 Ti теоретически опережает даже довольно сильную модель GTX 460 с 768 МБ видеопамяти.

А среди недостатков отметим то, что производительность геометрической обработки в GF116 невелика, во многом потому, что чип имеет лишь один растеризатор, хотя и четыре блока тесселяции. Итак, в некоторых задачах скорость растеризации может быть меньше, чем у конкурирующих графических процессоров. Вторым потенциальным недостатком мы считаем относительно низкую математическую и текстурную производительность, если сравнивать новый GPU с решениями AMD. В составе GTX 550 Ti есть ровно те же 192 ALU и 32 TMU, что и в GTS 450, и их недостаток может сказаться во многих играх.

Результаты Geforce GTX 550 Ti в синтетических тестах должны подтвердиться в следующей части нашего материла, посвящённой тестированию в игровых приложениях. Будет интересно посмотреть, насколько успешно новое решение Nvidia будет конкурировать даже не с Radeon HD 5770, цену которого недавно снизили, а с HD 6850 — прямым конкурентом по цене. Эта видеокарта от AMD основана на GPU явно более высокого уровня, и она вполне может опередить GTX 550 Ti в большинстве игр.

Ведь в реальных игровых приложениях скорость рендеринга может зависеть сразу от нескольких характеристик. И довольно часто она зависит от математической производительности и текстурирования, чем выгодно отличается конкурирующее с GTX 550 Ti по цене решение от компании AMD — Radeon HD 6850.

Нам кажется, что рекомендованная цена на новую модель Nvidia несколько завышена. Возможно, изначально предполагалось, что её конкурентом станет Radeon HD 5770, но теперь новинке придётся бороться с подешевевшей Radeon HD 6850, что будет значительно труднее, и даже фабрично разогнанные версии GTX 550 Ti вряд ли с ней справятся.



Nvidia Geforce GTX 550 Ti — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией TAGAN

Корпус ThermalTake 8430 для тестового стенда предоставлен компанией 3Logic

Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia