Nvidia Geforce GTX 570:


описание видеокарты и результаты синтетических тестов



СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


Nvidia Geforce GTX 570: Часть 1: Теоретические сведения


В этой части, как обычно, мы изучим саму видеокарту, а также познакомимся с результатами синтетических тестов.

Nvidia Geforce GTX 570 1280MB 320-битной GDDR5, PCI-E
  • GPU: Geforce GTX 570 (GF110)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 732/1464 МГц (номинал — 732/1464 МГц)
  • Частоты работы памяти (физическая (эффективная)): 950 (3800) МГц (номинал — 950 (3800) МГц)
  • Ширина шины обмена с памятью: 320 бит
  • Число универсальных процессоров: 480
  • Число текстурных процессоров: 60 (BLF/TLF/ANIS)
  • Число ROPs: 40
  • Размеры: 270×110×39 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 2×DVI (Dual-Link/HDMI), HDMI-mini
  • TV-out: нет
  • Поддержка многопроцессорной работы: SLI (Hardware)




Nvidia Geforce GTX 570 1280MB 320-битной GDDR5, PCI-E
Карта имеет 1280 МБ памяти GDDR5 SDRAM, размещенной в 10 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.





Сравнивать карту с GTX 580 нет смысла, ибо полностью базируется на 580-м дизайне. Да, можно просто посмотреть на карту в этой статье, убрать две микросхемы памяти и заменить 8-пиновый коннектор на 6-пиновый — и все. Остальное все то же самое. Почему 10 микросхем памяти, а не 12? Чтобы получить ширину шины обмена с памятью в 320 бит (изначально PCB поддерживает 384 бита). Полагаем, что только первые партии GTX 570 карт будут такого же образца, а потом партнеры-производители видеокарт наладят выпуск изделий своего дизайна уже с разведенной шиной именно 320, а не 384 бит. Как это уже было, например, с GTX 260.

Напомним, что карта получилась стандартных для топовых ускорителей размеров, поэтому поместится в любом корпусе.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также с серийными картами поставляются переходники DVI-to-HDMI (данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник, поскольку обладают собственным звуковым кодеком), поэтому проблем с такими мониторами также не должно быть. К тому же продукт уже оснащен одним разъемом HDMI. Следует напомнить, что комбинация из двух таких карт в режиме SLI позволяет выводить картинку игры сразу на ТРИ монитора, делая впечатления от игры более яркими, по аналогии с технологией AMD EyeFinity, но уже с поддержкой 3D-Vision (стереокартинки).

Максимальные разрешения и частоты:

  • 240 Hz Max Refresh Rate
  • 2048×1536×32bit @ 85Hz Max — по аналоговому интерфейсу
  • 2560×1600 @ 60Hz Max — по цифровому интерфейсу (для DVI-гнезд с Dual-Link / HDMI)

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Есть смысл сказать, что карта требуют дополнительного питания, причем двумя 6-пиновыми разъемами.

О системе охлаждения также нового мы ничего не напишем, так как на карте стоит точно такой же кулер, что и у GTX 580.

Nvidia Geforce GTX 570 1280MB 320-битной GDDR5, PCI-E

CO базируется на испарительной камере, которая заключена в медном узком отсеке, соприкасающемся с GPU. Над этой камерой выстроена конструкция из ребер охлаждения, через которые проходит воздух, гонимый турбиной на конце всего устройства.

Как показал опыт, данное решение — более эффективно, нежели предыдущее на тепловых трубках. Внутри испарительной камеры особая жидкость, которая моментально передает тепло от нижней пластины к верхней. Но главный момент — это принципиально новое управление кулером, когда как теперь обороты турбины меняются плавно в зависимости от нагрева, и потому эффективность охлаждения выросла. Все это вкупе дает то, что кулера практически не слышно, особенно когда работа в простое или при малой нагрузке.




Мы провели исследование температурного режима с помощью утилиты EVGA Precision (автор А. Николайчук AKA Unwinder) и получили следующие результаты:

Nvidia Geforce GTX 570 1280MB 320-битной GDDR5, PCI-E



Как мы видим, максимальный нагрев всего лишь 84 градусов (это после восьмичасовой непрерывной работы в 3D). Это говорит и о том, что CP — весьма эффективна.

Максимальное энергопотребление карты под нагрузкой — 200—210 Вт.

Комплектация. Учитывая, что референс-образцы никогда не имеют комплектаций, мы этот вопрос опустим.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core I7 CPU 975 (Socket 1366)
    • процессор Intel Core I7 CPU 975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600MHz;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900W.
  • операционная система Windows 7 64bit; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы ATI версии Catalyst 10.11; Nvidia версии 263.09 / 260.99.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте http://3d.rightmark.org.
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: Vista без SP1, Vista c SP1.

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 570 со стандартными параметрами (далее GTX 570)
  • Geforce GTX 480 со стандартными параметрами (далее GTX 480)
  • Geforce GTX 470 со стандартными параметрами (далее GTX 470)
  • Radeon HD 5870 со стандартными параметрами (далее HD 5870)
  • Radeon HD 6870 со стандартными параметрами (далее HD 6870)

Для сравнения результатов новой модели Geforce GTX 570 были выбраны эти видеокарты по следующим причинам: Radeon HD 5870 — это до сих пор самое мощное одночиповое решение конкурирующей компании AMD (но мы ждём скорого обновления их линейки), модель HD 6870 будет интересна потому, что в ней была улучшена скорость обработки геометрии, хотя конкурентом для GTX 570 она не является.

Указанные решения Nvidia взяты потому, что Geforce GTX 480 — наиболее производительная одночиповая карта на предыдущем топовом GPU, производительность которой должна быть на том же уровне, а GTX 470 была взята как прямая предшественница GTX 570 из того же ценового диапазона.

Direct3D 9: тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

Снова мы видим, что видеокарты показывают в этом тесте цифры, далёкие от теоретически возможных значений. И мы перепроверим эти показатели в тесте из пакета 3DMark Vantage. В нашей текстурной синтетике результат GTX 570 заметно ниже пиковых значений, по этим цифрам получилось, что новый чип выбирает лишь около 40 текселей за один такт из 32-битных текстур при билинейной фильтрации в этом тесте, что в полтора раза ниже теоретической цифры в 60 отфильтрованных текселей.

По этим цифрам GTX 570 сильно уступил пока ещё топовой видеокарте конкурента и даже от HD 6870 отстал. Что касается сравнения GTX 480 и GTX 570, то в разных условиях и показатели разные. В случаях с большим количеством текстур, где больше сказывается количество TMU и их частота, те самые теоретически возможные 4—5% выигрывает вариант на основе нового чипа GF110, а при уменьшении количества текстур на пиксель, GTX 480 опережает GTX 570 на 10—12%, так как имеет большую пропускную способность памяти. Рассмотрим эти же результаты в тесте филлрейта:

А эти цифры показывают скорость заполнения, и в них мы видим всё то же самое, но с учетом количества записанных в буфер кадра пикселей. Максимальный результат остаётся за решениями AMD, имеющими большее количество TMU и более эффективными по достижению высокого КПД в данном синтетическом тесте (только при малом количестве текстур HD 6870 упирается в ПСП и проигрывает). В случаях с 0—2 накладываемыми текстурами новая видеокарта Nvidia уступает GTX 480, затем положение выравнивается, а при 5—8 текстурах приходит к теоретически обоснованному — около 5% преимущества.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Данные тесты весьма просты для современных GPU и показывают не все возможности современных видеочипов, но они всё же интересны для оценки баланса между текстурными выборками и математическими вычислениями, особенно при внесении каких-либо изменений в архитектуру GPU. Посмотрим, во что упирается производительность этих тестов, в текстурирование или филлрейт.

Больше похоже на то, что производительность в этих тестах ограничена и филлрейтом и скоростью текстурных модулей, так как GTX 480 и GTX 570 показали близкие результаты. Но всё же, так как GTX 480 была всегда впереди, хоть и немного (1—3%) — тесты больше упираются в филлрейт, количество и производительность блоков ROP, а возможно и ПСП видеопамяти.

В самых лёгких тестах GTX 570 отстала от HD 6870, а HD 5870 показала более высокие результаты во всех случаях. К таким нагрузкам карты AMD явно лучше приспособлены, вероятно, блоки ROP у них работают эффективнее. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

А вот здесь упор уже явно в текстурирование и производительность ALU, так как GTX 570 получилась быстрее чем GTX 480 на 4—5%, что полностью соответствует теории. В сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и карты в нём располагаются по скорости текстурирования, с поправкой на разную эффективность использования TMU. В этом тесте GTX 570 быстрее GTX 480 как раз на 5%, но оба решения AMD где-то далеко впереди.

Результаты второго теста схожи с первым, но разница между GTX 480 и GTX 570 в нём составила 4%. Тест более интенсивен вычислительно, и разница в нём примерно соответствует разнице в количестве ALU и их частоте. Тест лучше подходит для архитектуры AMD, имеющей большее количество математических блоков и более производительное текстурирование, и поэтому даже более дешёвый Radeon HD 6870 обходит новинку компании Nvidia, не говоря уже о HD 5870.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, зависящие и от скорости блоков ALU, и от скорости текстурирования, в них важен общий баланс GPU. Производительность видеокарт в тесте «Frozen Glass» схожа с той, что мы видели выше в «Cook-Torrance», хотя GTX 570 в этот раз оказалась быстрее GTX 480 лишь на 2%, то есть производительность ограничена скоростью ALU и TMU, но и филлрейт на неё влияет. Обе видеокарты компании AMD оказались заметно быстрее и в этот раз.

Во втором тесте «Parallax Mapping» разница между GTX 570 и GTX 480 ещё меньше — всего 1%. Вероятно, скорость в тесте ограничена не только математической производительностью, но и чем-то другим. Впрочем, игровые приложения обычно зависят от большего числа параметров и не упираются явно в какой-то один параметр. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

Для решений Nvidia стало только хуже, с текстурированием в DX9 тестах Radeon справляются гораздо эффективнее. Новая видеокарта GTX 570 ещё сильнее уступает и HD 5870 и HD 6870 и в этих тестах с упором на текстурирование. Разница между GTX 570 и GTX 480 осталась в тех же рамках 1—2%, что означает отсутствие явного ограничения одним теоретическим параметром. Зато GTX 470 новая видеокарта опередила с большим запасом.

Всё это были устаревшие задачи, в основном с упором в текстурирование или филлрейт, а далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API, которые намного показательнее с точки зрения современных игр на ПК. Тесты отличаются тем, что сильнее нагружают и ALU, и текстурные модули, обе шейдерные программы сложные и длинные, включают большое количество ветвлений:

Это единственные DX9-тесты, в которых видеокарты производства Nvidia выступают сильнее, чем решения от AMD. Оба PS 3.0 теста довольно сложные, скорость в них слабо зависит от ПСП и текстурирования, и они отличаются большим количеством ветвлений, с которыми очень неплохо справляется новая архитектура Nvidia.

В этих тестах GTX 570 показывает результат выше на 3—4%, по сравнению с GTX 480, что близко к теоретическим 5% ускорения в производительности текстурирования и математики. Результаты GTX 570 значительно выше, чем у обеих видеокарт AMD, а HD 6870 и вовсе отстаёт чуть ли не вдвое, особенно в тесте Fur. Результат для GTX 570 отличный и позволяет надеяться, что в DX10-тестах новое решение Nvidia улучшит свои позиции, по сравнению с устаревшими DX9-тестами.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Видимо, скорость рендеринга в этом тесте зависит и от количества и эффективности блоков TMU, и от филлрейта с ПСП одновременно. Результаты в «High» получаются примерно на 50% ниже, чем в «Low», как и должно быть по теории. В тестах Direct3D 10 процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia остались сильны даже несмотря на то, что последняя архитектура AMD заметно подтянулась к ним.

В результате, обе видеокарты конкурента соперничают с GTX 470, но GTX 570 показывает более высокие результаты на уровне GTX 480. В предыдущих тестах мы отмечали явное влияние эффективного филлрейта и ПСП, вот и в этот раз они сказались, нивелировав ускорение текстурирования и математики по сравнению с GTX 480. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится и ПСП с филлрейтом будут влиять меньше:

Включение суперсэмплинга не только увеличивает теоретическую нагрузку в четыре раза, но и позволяет решениям AMD перехватить первенство. В этот раз все представленные решения Nvidia уже остались позади обеих плат Radeon. GTX 570 и GTX 480 показали идентичные результаты, что явно говорит об отсутствии исключительного влияния лишь одного из многочисленных параметров GPU на результаты теста.

Второй тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Данный тест несколько интереснее с практической точки зрения, так как разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping, используются во многих проектах, например, в играх Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Результаты в обновленном D3D10 варианте теста без суперсэмплинга похожи на предыдущие (тоже без SSAA), но обе Radeon немного подтянулись вверх, обогнав GTX 470. GTX 570 справляется с поставленной задачей даже лучше, чем GTX 480 и быстрее обоих конкурентов. Разница с GTX 480 в этот раз получилась до 3%, что примерно соответственно количеству исполнительных блоков и их тактовой частоте. Посмотрим, что изменит включение суперсэмплинга, он снова должен вызвать большее падение скорости на картах Nvidia.

При включении суперсэмплинга и самозатенения задача усложняется, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась, включение суперсэмплинга сказывается почти как и в предыдущем случае — карты производства AMD явно улучшили свои показатели относительно решения Nvidia.

Теперь HD 5870 уже опережает GTX 570 в лёгком режиме, а HD 6870 успешно конкурирует с GTX 480. Очень интересными получились сравнительные цифры GTX 480 и GTX 570 — новая видеокарта Nvidia опережает предыдущее топовое решение компании на 5—12%, что явно говорит в том числе и о влиянии неких архитектурных оптимизаций на скорость в этом тесте, что подтверждает выводы, сделанные в обзоре Geforce GTX 580.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

В чисто математических тестах разница между решениями должна примерно соответствовать разнице в частотах и количестве ALU. Очевидно, что решения AMD в таких тестах явно будут далеко впереди, так как в вычислительно сложных задачах они всегда были сильнее. Современная архитектура AMD имеет большое преимущество перед конкурирующими видеокартами Nvidia, что подтверждается в очередной раз: HD 5870 более чем вдвое быстрее, чем GTX 470. Что будет после выхода их нового топового решения — страшно даже подумать.

Что касается сравнения GTX 570 и GTX 480, то разница получилась менее 4%, что несколько хуже теоретического значения. Но в целом, все решения расположились примерно соответственно теоретическим показателям, это касается как карт Nvidia, так и AMD. Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Да и тут всё примерно так же — скорость рендеринга ограничена почти исключительно производительностью шейдерных блоков, и карты AMD оказались далеко впереди. Разница между GTX 480 и GTX 570 осталась той же — менее 4%, что чуть меньше теоретического значения в 5%. Но при таких малых отрывах сильно влияет погрешность измерений, и разницей между 4 и 5% можно пренебречь.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёхуровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не особенно сложная, производительность в целом ограничена не только скоростью обработки геометрии, но и пропускной способностью памяти в том числе.

Новая модель Nvidia, основанная на графическом процессоре GF110, во всех режимах заметно обгоняет конкурентов от AMD (видно, что HD 6870 немного быстрее HD 5870 как раз из-за оптимизированной обработки геометрии в чипе Barts). Выполнение геометрических шейдеров у Nvidia более эффективное, и новое решение даже немного быстрее предыдущего топа. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте, цифры для решений и Nvidia и AMD почти не изменились. Видеокарты в данном тесте «не замечают» изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, и показывают аналогичные предыдущей диаграмме результаты. Соответственно и выводы те же. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy», — ещё и для их отрисовки. Иными словами, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть менее чем в два раза медленней. Только в лёгких условиях скорость уже упирается во что-то.

В этом тесте скорость рендеринга не ограничена одной лишь геометрической производительностью. Хотя разница между всеми решениями есть, но она очень маленькая, производительность упёрлась во что-то так, что это делает результаты практически бесполезными. Впрочем, новая Geforce GTX 570 остаётся лидером теста, но и в этот раз она превосходит GTX 480 совсем немного.

Цифры должны сильно измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

Как обычно, именно в этом тесте видна явная разница между чипами с традиционным графическим конвейером (Radeon в данном случае) и топовыми чипами архитектуры Fermi. Возможности чипов Nvidia по обработке геометрии и скорости исполнения геометрических шейдеров явно выше, чем у конкурирующих решений AMD. Даже GTX 470 значительно быстрее лучших одночиповых видеокарт AMD, не говоря уже о более производительных моделях.

Ну а новое решение GTX 570 в этом тесте опережает GTX 480 на 3— 6%, а GTX 470 — на 25— 30%. И в этот раз мы снова увидели полное соответствие теоретическим показателям. Именно на столько отличаются математическая и текстурная производительность указанных решений.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути, и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования и пропускная способность памяти. И вообще — разница между всеми решениями не такая уж большая, только GTX 470 почему-то показал весьма странный результат в лёгком режиме. Выборки из вершин у видеокарт Nvidia лишь немногим быстрее, чем у Radeon, и GTX 570 является номинальным лидером теста.

Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме почти не изменилось, только теперь уже все видеокарты компании Nvidia показывают некорректные результаты в лёгком режиме. Зато в среднем и тяжёлом режиме GTX 570 впереди всех, и заметно сильнее обеих видеокарт из стана конкурента. Разница с GTX 480 невелика, но в лёгком режиме заметна. Возможно, в этом виноваты отличающиеся оптимизации в различных версиях драйверов.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты в тесте «Waves» совсем не похожи на то, что мы видели на предыдущих диаграммах. Явного преимущества продукции AMD нет, но они сравнялись с решениями Nvidia в этом тесте, показав цифры значительно лучшие, чем в прошлый раз, особенно в наиболее тяжёлом режиме. GTX 570 показывает производительность примерно на уровне GTX 480, HD 5870 и HD 6870. Рассмотрим второй вариант этого же теста:

Произошли очень странные изменения. Видеокарты Radeon показали скорость ниже, чем в предыдущем тесте, да и GTX 570 теперь проиграла GTX 480. Так как GTX 580 в прошлом материале значительно опережала GTX 480, сделаем единственно возможный вывод — скорость в этом тесте сильно зависит от ПСП видеопамяти. В любом случае, Geforce GTX 570 показывает результаты на приличном уровне модели GTX 480.

3DMark Vantage: Feature тесты

Синтетические тесты из пакета 3DMark Vantage могут показать нам что-то, что мы упустили. Этот тестовый пакет хоть уже и не нов, но его feature-тесты обладают поддержкой D3D10 и интересны уже тем, что отличаются от наших. При анализе результатов нового решения Nvidia в этом пакете мы сможем сделать какие-то новые и полезные выводы, ускользнувшие от нас в тестах семейства RightMark. Особенно это касается теста скорости текстурных выборок.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Текстурный тест Futuremark тоже не получает преимущества от модификаций в текстурных блоках GF110 в определённых условиях. Но в этом тесте текстурной производительности получается несколько иное соотношение результатов между AMD и Nvidia. Хотя в этом тесте карты Nvidia чуть более эффективно используют имеющиеся текстурные блоки, но они продолжают отставать от решений AMD, что вполне объяснимо с точки зрения теории, так как у HD 5870 больше блоков TMU. Geforce GTX 570 показывает результат почти на уровне HD 6870.

В данном приложении новая видеокарта на базе чипа GF110 показывает результат, превосходящий предшественницу GTX 470 на 30%, а GTX 480 — на 5%, что полностью соответствует теории. Так что в этом тесте разница между решениями Nvidia получилась точно такая, какая и должна быть по техническим характеристикам.

Feature Test 2: Color Fill

Тест скорости заполнения, в котором используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

В этом тесте мы уже видели влияние архитектурных изменений в GF110, так как в подтесте 3DMark Vantage используется как раз 16-битный текстурный формат с плавающей точкой. Поэтому GTX 570 отстал от GTX 480 не на 15%, а лишь на 6% — остальное было возмещено архитектурными улучшениями в новом GPU.

В целом, показатели производительности в тесте примерно соответствуют теоретическим цифрам филлрейта без учёта влияния ПСП видеопамяти. Цифры Vantage показывают именно производительность блоков ROP, а не величину пропускной способности, и GTX 570 в этом тесте оказался на уровне Radeon HD 5870, уступив только Geforce GTX 480, у которого больше активных блоков ROP.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Тест отличается от других подобных тем, что результаты в нём зависят не исключительно от скорости математических вычислений или эффективности исполнения ветвлений или скорости текстурных выборок, а от всего понемногу. И для достижения высокой скорости важен правильный баланс блоков GPU и ПСП видеопамяти. Заметно влияет на скорость и эффективность выполнения ветвлений в шейдерах.

Как видно по результатам, этот тест выполняется на GTX 570 на 8,5% быстрее, чем на GTX 480. Другими словами, снова более чем на 5%, которые объяснимы большей математической и текстурной мощью. Это говорит о влиянии архитектурных изменений в GF110 на производительность в тесте Parallax Occlusion Mapping. Вместе с увеличенной производительностью блоков ALU и TMU это позволило GTX 570 приблизиться к Radeon HD 5870 в этом тесте. И особенно заметен контраст по сравнению с предшественником Geforce GTX 470 — целых 35% прироста!

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Как мы ранее выяснили, скорость рендеринга в этом тесте зависит сразу от нескольких параметров, среди которых производительность обработки геометрии и эффективность исполнения геометрических шейдеров. И с этими задачами представленный сегодня GTX 570 справляется отлично, становясь лидером и заметно опережая обоих конкурентов от AMD.

Как видно, с выполнением геометрических шейдеров и вообще скоростью обработки геометрии у Nvidia в последнем поколении архитектуры всё стало даже ещё лучше. Разница между GTX 570 и GTX 480 составила 9%, что объясняется тем же количеством геометрических блоков, но работающих на более высоких частотах.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты этого теста были бы схожи с теми, которые мы видели на предыдущей диаграмме, за исключением как раз нашего сегодняшнего героя — Geforce GTX 570. Новая модель, основанная на чипе GF110, в этот раз совсем чуть-чуть уступила GTX 480, что может объясняться меньшей пропускной способностью видеопамяти. И всё же она при этом вдвое быстрее конкурирующих видеокарт от компании AMD в этом тесте.

В синтетических приложениях с имитацией тканей и частиц тестового пакета 3DMark Vantage, где используются геометрические шейдеры, новый GTX 570 показал себя с самой лучшей стороны, обогнав конкурирующие графические процессоры компании AMD почти в два раза. Разница между GTX 570 и GTX 480 в этот раз составила менее 4%, причём в пользу старой модели из более высокого ценового диапазона.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он использует очень много математических расчётов.

В математическом тесте из пакета компании Futuremark, который показывает пиковую производительность видеочипов в предельных задачах, мы видим уже знакомую по нашим тестам картину. Показанная решениями производительность примерно соответствует тому, что должно получаться по теории, и тому, что мы уже видели ранее в наших математических тестах из пакета RightMark 2.0.

В этом математическом тесте Geforce GTX 570 показывает результат на 5% выше, чем GTX 480, что полностью соответствует теории. А вот что касается сравнения с конкурентом, то мы уже привыкли к тому, что видеокарты AMD всегда выигрывают похожие тесты с большим преимуществом. Так получилось и в этот раз — интенсивная математика выполняется на видеокартах Radeon значительно быстрее. Разница между GTX 570 и HD 5870 составляет более полутора раз, и даже с HD 6870 из среднего ценового диапазона новой модели Nvidia конкурировать очень трудно.

Выводы

По результатам проведённых нами синтетических тестов новой модели Geforce GTX 570, основанной на графическом процессоре GF110, а также результатам других моделей видеокарт обоих производителей, можно сделать вывод о том, что у Nvidia получилась хорошо сбалансированная модель высокого уровня, созданная на базе чипа архитектуры Fermi и обладающая вполне оправданной ценой.

Geforce GTX 570 отличается значительно увеличенной производительностью — на четверть, по сравнению с предшествующей ей моделью GTX 470, а также улучшенными потребительскими характеристиками по нагреву и шуму. Благодаря увеличению количества исполнительных блоков и возросшей тактовой частоте, результаты GTX 570 примерно соответствуют скорости GTX 480.

Но самое главное достижение GTX 570 даже не в том, что она будет продаваться дешевле GTX 480, обладая примерно той же производительностью, а в том, что архитектурные изменения в чипе GF110 и повышенные тактовые частоты привели к росту производительности при снижении энергопотребления, по сравнению с GTX 480. При этом оба GPU произведены по одному и тому же техпроцессу. Но теперь видеокарта подобной мощности и возможностей довольствуется лишь двумя 6-штырьковыми разъёмами питания, а новый кулер работает гораздо тише и эффективнее.

Мы ожидаем, что очень хорошие результаты Geforce GTX 570 в наших синтетических тестах, подкреплённые довольно сильными теоретическими характеристиками, получат своё подтверждение и в результатах следующей части нашего материала, посвящённой игровым тестам. Предполагаем, что в игровых тестах Geforce GTX 570 будет примерно равна по скорости модели Geforce GTX 480. Вероятно, новое решение будет впереди на несколько процентов в части тестов, ограниченной скоростью ALU и TMU, а в других играх, производительность в которых ограничена филлрейтом и ПСП, оно может уступить те же единицы процентов.



Nvidia Geforce GTX 570 — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией TAGAN

Корпус ThermalTake 8430 для тестового стенда предоставлен компанией 3LOGIC

Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia








Дополнительно

iXBT.com: Nvidia Geforce GTX 570: описание видеокарты и результаты синтетических тестов

Nvidia Geforce GTX 570:

описание видеокарты и результаты синтетических тестов



СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


Nvidia Geforce GTX 570: Часть 1: Теоретические сведения


В этой части, как обычно, мы изучим саму видеокарту, а также познакомимся с результатами синтетических тестов.

Nvidia Geforce GTX 570 1280MB 320-битной GDDR5, PCI-E
  • GPU: Geforce GTX 570 (GF110)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 732/1464 МГц (номинал — 732/1464 МГц)
  • Частоты работы памяти (физическая (эффективная)): 950 (3800) МГц (номинал — 950 (3800) МГц)
  • Ширина шины обмена с памятью: 320 бит
  • Число универсальных процессоров: 480
  • Число текстурных процессоров: 60 (BLF/TLF/ANIS)
  • Число ROPs: 40
  • Размеры: 270×110×39 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 2×DVI (Dual-Link/HDMI), HDMI-mini
  • TV-out: нет
  • Поддержка многопроцессорной работы: SLI (Hardware)




Nvidia Geforce GTX 570 1280MB 320-битной GDDR5, PCI-E
Карта имеет 1280 МБ памяти GDDR5 SDRAM, размещенной в 10 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.





Сравнивать карту с GTX 580 нет смысла, ибо полностью базируется на 580-м дизайне. Да, можно просто посмотреть на карту в этой статье, убрать две микросхемы памяти и заменить 8-пиновый коннектор на 6-пиновый — и все. Остальное все то же самое. Почему 10 микросхем памяти, а не 12? Чтобы получить ширину шины обмена с памятью в 320 бит (изначально PCB поддерживает 384 бита). Полагаем, что только первые партии GTX 570 карт будут такого же образца, а потом партнеры-производители видеокарт наладят выпуск изделий своего дизайна уже с разведенной шиной именно 320, а не 384 бит. Как это уже было, например, с GTX 260.

Напомним, что карта получилась стандартных для топовых ускорителей размеров, поэтому поместится в любом корпусе.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также с серийными картами поставляются переходники DVI-to-HDMI (данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник, поскольку обладают собственным звуковым кодеком), поэтому проблем с такими мониторами также не должно быть. К тому же продукт уже оснащен одним разъемом HDMI. Следует напомнить, что комбинация из двух таких карт в режиме SLI позволяет выводить картинку игры сразу на ТРИ монитора, делая впечатления от игры более яркими, по аналогии с технологией AMD EyeFinity, но уже с поддержкой 3D-Vision (стереокартинки).

Максимальные разрешения и частоты:

  • 240 Hz Max Refresh Rate
  • 2048×1536×32bit @ 85Hz Max — по аналоговому интерфейсу
  • 2560×1600 @ 60Hz Max — по цифровому интерфейсу (для DVI-гнезд с Dual-Link / HDMI)

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Есть смысл сказать, что карта требуют дополнительного питания, причем двумя 6-пиновыми разъемами.

О системе охлаждения также нового мы ничего не напишем, так как на карте стоит точно такой же кулер, что и у GTX 580.

Nvidia Geforce GTX 570 1280MB 320-битной GDDR5, PCI-E

CO базируется на испарительной камере, которая заключена в медном узком отсеке, соприкасающемся с GPU. Над этой камерой выстроена конструкция из ребер охлаждения, через которые проходит воздух, гонимый турбиной на конце всего устройства.

Как показал опыт, данное решение — более эффективно, нежели предыдущее на тепловых трубках. Внутри испарительной камеры особая жидкость, которая моментально передает тепло от нижней пластины к верхней. Но главный момент — это принципиально новое управление кулером, когда как теперь обороты турбины меняются плавно в зависимости от нагрева, и потому эффективность охлаждения выросла. Все это вкупе дает то, что кулера практически не слышно, особенно когда работа в простое или при малой нагрузке.




Мы провели исследование температурного режима с помощью утилиты EVGA Precision (автор А. Николайчук AKA Unwinder) и получили следующие результаты:

Nvidia Geforce GTX 570 1280MB 320-битной GDDR5, PCI-E



Как мы видим, максимальный нагрев всего лишь 84 градусов (это после восьмичасовой непрерывной работы в 3D). Это говорит и о том, что CP — весьма эффективна.

Максимальное энергопотребление карты под нагрузкой — 200—210 Вт.

Комплектация. Учитывая, что референс-образцы никогда не имеют комплектаций, мы этот вопрос опустим.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core I7 CPU 975 (Socket 1366)
    • процессор Intel Core I7 CPU 975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600MHz;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900W.
  • операционная система Windows 7 64bit; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы ATI версии Catalyst 10.11; Nvidia версии 263.09 / 260.99.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте http://3d.rightmark.org.
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: Vista без SP1, Vista c SP1.

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 570 со стандартными параметрами (далее GTX 570)
  • Geforce GTX 480 со стандартными параметрами (далее GTX 480)
  • Geforce GTX 470 со стандартными параметрами (далее GTX 470)
  • Radeon HD 5870 со стандартными параметрами (далее HD 5870)
  • Radeon HD 6870 со стандартными параметрами (далее HD 6870)

Для сравнения результатов новой модели Geforce GTX 570 были выбраны эти видеокарты по следующим причинам: Radeon HD 5870 — это до сих пор самое мощное одночиповое решение конкурирующей компании AMD (но мы ждём скорого обновления их линейки), модель HD 6870 будет интересна потому, что в ней была улучшена скорость обработки геометрии, хотя конкурентом для GTX 570 она не является.

Указанные решения Nvidia взяты потому, что Geforce GTX 480 — наиболее производительная одночиповая карта на предыдущем топовом GPU, производительность которой должна быть на том же уровне, а GTX 470 была взята как прямая предшественница GTX 570 из того же ценового диапазона.

Direct3D 9: тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

Снова мы видим, что видеокарты показывают в этом тесте цифры, далёкие от теоретически возможных значений. И мы перепроверим эти показатели в тесте из пакета 3DMark Vantage. В нашей текстурной синтетике результат GTX 570 заметно ниже пиковых значений, по этим цифрам получилось, что новый чип выбирает лишь около 40 текселей за один такт из 32-битных текстур при билинейной фильтрации в этом тесте, что в полтора раза ниже теоретической цифры в 60 отфильтрованных текселей.

По этим цифрам GTX 570 сильно уступил пока ещё топовой видеокарте конкурента и даже от HD 6870 отстал. Что касается сравнения GTX 480 и GTX 570, то в разных условиях и показатели разные. В случаях с большим количеством текстур, где больше сказывается количество TMU и их частота, те самые теоретически возможные 4—5% выигрывает вариант на основе нового чипа GF110, а при уменьшении количества текстур на пиксель, GTX 480 опережает GTX 570 на 10—12%, так как имеет большую пропускную способность памяти. Рассмотрим эти же результаты в тесте филлрейта:

А эти цифры показывают скорость заполнения, и в них мы видим всё то же самое, но с учетом количества записанных в буфер кадра пикселей. Максимальный результат остаётся за решениями AMD, имеющими большее количество TMU и более эффективными по достижению высокого КПД в данном синтетическом тесте (только при малом количестве текстур HD 6870 упирается в ПСП и проигрывает). В случаях с 0—2 накладываемыми текстурами новая видеокарта Nvidia уступает GTX 480, затем положение выравнивается, а при 5—8 текстурах приходит к теоретически обоснованному — около 5% преимущества.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Данные тесты весьма просты для современных GPU и показывают не все возможности современных видеочипов, но они всё же интересны для оценки баланса между текстурными выборками и математическими вычислениями, особенно при внесении каких-либо изменений в архитектуру GPU. Посмотрим, во что упирается производительность этих тестов, в текстурирование или филлрейт.

Больше похоже на то, что производительность в этих тестах ограничена и филлрейтом и скоростью текстурных модулей, так как GTX 480 и GTX 570 показали близкие результаты. Но всё же, так как GTX 480 была всегда впереди, хоть и немного (1—3%) — тесты больше упираются в филлрейт, количество и производительность блоков ROP, а возможно и ПСП видеопамяти.

В самых лёгких тестах GTX 570 отстала от HD 6870, а HD 5870 показала более высокие результаты во всех случаях. К таким нагрузкам карты AMD явно лучше приспособлены, вероятно, блоки ROP у них работают эффективнее. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

А вот здесь упор уже явно в текстурирование и производительность ALU, так как GTX 570 получилась быстрее чем GTX 480 на 4—5%, что полностью соответствует теории. В сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и карты в нём располагаются по скорости текстурирования, с поправкой на разную эффективность использования TMU. В этом тесте GTX 570 быстрее GTX 480 как раз на 5%, но оба решения AMD где-то далеко впереди.

Результаты второго теста схожи с первым, но разница между GTX 480 и GTX 570 в нём составила 4%. Тест более интенсивен вычислительно, и разница в нём примерно соответствует разнице в количестве ALU и их частоте. Тест лучше подходит для архитектуры AMD, имеющей большее количество математических блоков и более производительное текстурирование, и поэтому даже более дешёвый Radeon HD 6870 обходит новинку компании Nvidia, не говоря уже о HD 5870.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, зависящие и от скорости блоков ALU, и от скорости текстурирования, в них важен общий баланс GPU. Производительность видеокарт в тесте «Frozen Glass» схожа с той, что мы видели выше в «Cook-Torrance», хотя GTX 570 в этот раз оказалась быстрее GTX 480 лишь на 2%, то есть производительность ограничена скоростью ALU и TMU, но и филлрейт на неё влияет. Обе видеокарты компании AMD оказались заметно быстрее и в этот раз.

Во втором тесте «Parallax Mapping» разница между GTX 570 и GTX 480 ещё меньше — всего 1%. Вероятно, скорость в тесте ограничена не только математической производительностью, но и чем-то другим. Впрочем, игровые приложения обычно зависят от большего числа параметров и не упираются явно в какой-то один параметр. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

Для решений Nvidia стало только хуже, с текстурированием в DX9 тестах Radeon справляются гораздо эффективнее. Новая видеокарта GTX 570 ещё сильнее уступает и HD 5870 и HD 6870 и в этих тестах с упором на текстурирование. Разница между GTX 570 и GTX 480 осталась в тех же рамках 1—2%, что означает отсутствие явного ограничения одним теоретическим параметром. Зато GTX 470 новая видеокарта опередила с большим запасом.

Всё это были устаревшие задачи, в основном с упором в текстурирование или филлрейт, а далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API, которые намного показательнее с точки зрения современных игр на ПК. Тесты отличаются тем, что сильнее нагружают и ALU, и текстурные модули, обе шейдерные программы сложные и длинные, включают большое количество ветвлений:

Это единственные DX9-тесты, в которых видеокарты производства Nvidia выступают сильнее, чем решения от AMD. Оба PS 3.0 теста довольно сложные, скорость в них слабо зависит от ПСП и текстурирования, и они отличаются большим количеством ветвлений, с которыми очень неплохо справляется новая архитектура Nvidia.

В этих тестах GTX 570 показывает результат выше на 3—4%, по сравнению с GTX 480, что близко к теоретическим 5% ускорения в производительности текстурирования и математики. Результаты GTX 570 значительно выше, чем у обеих видеокарт AMD, а HD 6870 и вовсе отстаёт чуть ли не вдвое, особенно в тесте Fur. Результат для GTX 570 отличный и позволяет надеяться, что в DX10-тестах новое решение Nvidia улучшит свои позиции, по сравнению с устаревшими DX9-тестами.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Видимо, скорость рендеринга в этом тесте зависит и от количества и эффективности блоков TMU, и от филлрейта с ПСП одновременно. Результаты в «High» получаются примерно на 50% ниже, чем в «Low», как и должно быть по теории. В тестах Direct3D 10 процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia остались сильны даже несмотря на то, что последняя архитектура AMD заметно подтянулась к ним.

В результате, обе видеокарты конкурента соперничают с GTX 470, но GTX 570 показывает более высокие результаты на уровне GTX 480. В предыдущих тестах мы отмечали явное влияние эффективного филлрейта и ПСП, вот и в этот раз они сказались, нивелировав ускорение текстурирования и математики по сравнению с GTX 480. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится и ПСП с филлрейтом будут влиять меньше:

Включение суперсэмплинга не только увеличивает теоретическую нагрузку в четыре раза, но и позволяет решениям AMD перехватить первенство. В этот раз все представленные решения Nvidia уже остались позади обеих плат Radeon. GTX 570 и GTX 480 показали идентичные результаты, что явно говорит об отсутствии исключительного влияния лишь одного из многочисленных параметров GPU на результаты теста.

Второй тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Данный тест несколько интереснее с практической точки зрения, так как разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping, используются во многих проектах, например, в играх Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Результаты в обновленном D3D10 варианте теста без суперсэмплинга похожи на предыдущие (тоже без SSAA), но обе Radeon немного подтянулись вверх, обогнав GTX 470. GTX 570 справляется с поставленной задачей даже лучше, чем GTX 480 и быстрее обоих конкурентов. Разница с GTX 480 в этот раз получилась до 3%, что примерно соответственно количеству исполнительных блоков и их тактовой частоте. Посмотрим, что изменит включение суперсэмплинга, он снова должен вызвать большее падение скорости на картах Nvidia.

При включении суперсэмплинга и самозатенения задача усложняется, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась, включение суперсэмплинга сказывается почти как и в предыдущем случае — карты производства AMD явно улучшили свои показатели относительно решения Nvidia.

Теперь HD 5870 уже опережает GTX 570 в лёгком режиме, а HD 6870 успешно конкурирует с GTX 480. Очень интересными получились сравнительные цифры GTX 480 и GTX 570 — новая видеокарта Nvidia опережает предыдущее топовое решение компании на 5—12%, что явно говорит в том числе и о влиянии неких архитектурных оптимизаций на скорость в этом тесте, что подтверждает выводы, сделанные в обзоре Geforce GTX 580.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

В чисто математических тестах разница между решениями должна примерно соответствовать разнице в частотах и количестве ALU. Очевидно, что решения AMD в таких тестах явно будут далеко впереди, так как в вычислительно сложных задачах они всегда были сильнее. Современная архитектура AMD имеет большое преимущество перед конкурирующими видеокартами Nvidia, что подтверждается в очередной раз: HD 5870 более чем вдвое быстрее, чем GTX 470. Что будет после выхода их нового топового решения — страшно даже подумать.

Что касается сравнения GTX 570 и GTX 480, то разница получилась менее 4%, что несколько хуже теоретического значения. Но в целом, все решения расположились примерно соответственно теоретическим показателям, это касается как карт Nvidia, так и AMD. Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Да и тут всё примерно так же — скорость рендеринга ограничена почти исключительно производительностью шейдерных блоков, и карты AMD оказались далеко впереди. Разница между GTX 480 и GTX 570 осталась той же — менее 4%, что чуть меньше теоретического значения в 5%. Но при таких малых отрывах сильно влияет погрешность измерений, и разницей между 4 и 5% можно пренебречь.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёхуровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не особенно сложная, производительность в целом ограничена не только скоростью обработки геометрии, но и пропускной способностью памяти в том числе.

Новая модель Nvidia, основанная на графическом процессоре GF110, во всех режимах заметно обгоняет конкурентов от AMD (видно, что HD 6870 немного быстрее HD 5870 как раз из-за оптимизированной обработки геометрии в чипе Barts). Выполнение геометрических шейдеров у Nvidia более эффективное, и новое решение даже немного быстрее предыдущего топа. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте, цифры для решений и Nvidia и AMD почти не изменились. Видеокарты в данном тесте «не замечают» изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, и показывают аналогичные предыдущей диаграмме результаты. Соответственно и выводы те же. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy», — ещё и для их отрисовки. Иными словами, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть менее чем в два раза медленней. Только в лёгких условиях скорость уже упирается во что-то.

В этом тесте скорость рендеринга не ограничена одной лишь геометрической производительностью. Хотя разница между всеми решениями есть, но она очень маленькая, производительность упёрлась во что-то так, что это делает результаты практически бесполезными. Впрочем, новая Geforce GTX 570 остаётся лидером теста, но и в этот раз она превосходит GTX 480 совсем немного.

Цифры должны сильно измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

Как обычно, именно в этом тесте видна явная разница между чипами с традиционным графическим конвейером (Radeon в данном случае) и топовыми чипами архитектуры Fermi. Возможности чипов Nvidia по обработке геометрии и скорости исполнения геометрических шейдеров явно выше, чем у конкурирующих решений AMD. Даже GTX 470 значительно быстрее лучших одночиповых видеокарт AMD, не говоря уже о более производительных моделях.

Ну а новое решение GTX 570 в этом тесте опережает GTX 480 на 3— 6%, а GTX 470 — на 25— 30%. И в этот раз мы снова увидели полное соответствие теоретическим показателям. Именно на столько отличаются математическая и текстурная производительность указанных решений.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути, и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования и пропускная способность памяти. И вообще — разница между всеми решениями не такая уж большая, только GTX 470 почему-то показал весьма странный результат в лёгком режиме. Выборки из вершин у видеокарт Nvidia лишь немногим быстрее, чем у Radeon, и GTX 570 является номинальным лидером теста.

Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме почти не изменилось, только теперь уже все видеокарты компании Nvidia показывают некорректные результаты в лёгком режиме. Зато в среднем и тяжёлом режиме GTX 570 впереди всех, и заметно сильнее обеих видеокарт из стана конкурента. Разница с GTX 480 невелика, но в лёгком режиме заметна. Возможно, в этом виноваты отличающиеся оптимизации в различных версиях драйверов.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты в тесте «Waves» совсем не похожи на то, что мы видели на предыдущих диаграммах. Явного преимущества продукции AMD нет, но они сравнялись с решениями Nvidia в этом тесте, показав цифры значительно лучшие, чем в прошлый раз, особенно в наиболее тяжёлом режиме. GTX 570 показывает производительность примерно на уровне GTX 480, HD 5870 и HD 6870. Рассмотрим второй вариант этого же теста:

Произошли очень странные изменения. Видеокарты Radeon показали скорость ниже, чем в предыдущем тесте, да и GTX 570 теперь проиграла GTX 480. Так как GTX 580 в прошлом материале значительно опережала GTX 480, сделаем единственно возможный вывод — скорость в этом тесте сильно зависит от ПСП видеопамяти. В любом случае, Geforce GTX 570 показывает результаты на приличном уровне модели GTX 480.

3DMark Vantage: Feature тесты

Синтетические тесты из пакета 3DMark Vantage могут показать нам что-то, что мы упустили. Этот тестовый пакет хоть уже и не нов, но его feature-тесты обладают поддержкой D3D10 и интересны уже тем, что отличаются от наших. При анализе результатов нового решения Nvidia в этом пакете мы сможем сделать какие-то новые и полезные выводы, ускользнувшие от нас в тестах семейства RightMark. Особенно это касается теста скорости текстурных выборок.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Текстурный тест Futuremark тоже не получает преимущества от модификаций в текстурных блоках GF110 в определённых условиях. Но в этом тесте текстурной производительности получается несколько иное соотношение результатов между AMD и Nvidia. Хотя в этом тесте карты Nvidia чуть более эффективно используют имеющиеся текстурные блоки, но они продолжают отставать от решений AMD, что вполне объяснимо с точки зрения теории, так как у HD 5870 больше блоков TMU. Geforce GTX 570 показывает результат почти на уровне HD 6870.

В данном приложении новая видеокарта на базе чипа GF110 показывает результат, превосходящий предшественницу GTX 470 на 30%, а GTX 480 — на 5%, что полностью соответствует теории. Так что в этом тесте разница между решениями Nvidia получилась точно такая, какая и должна быть по техническим характеристикам.

Feature Test 2: Color Fill

Тест скорости заполнения, в котором используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

В этом тесте мы уже видели влияние архитектурных изменений в GF110, так как в подтесте 3DMark Vantage используется как раз 16-битный текстурный формат с плавающей точкой. Поэтому GTX 570 отстал от GTX 480 не на 15%, а лишь на 6% — остальное было возмещено архитектурными улучшениями в новом GPU.

В целом, показатели производительности в тесте примерно соответствуют теоретическим цифрам филлрейта без учёта влияния ПСП видеопамяти. Цифры Vantage показывают именно производительность блоков ROP, а не величину пропускной способности, и GTX 570 в этом тесте оказался на уровне Radeon HD 5870, уступив только Geforce GTX 480, у которого больше активных блоков ROP.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Тест отличается от других подобных тем, что результаты в нём зависят не исключительно от скорости математических вычислений или эффективности исполнения ветвлений или скорости текстурных выборок, а от всего понемногу. И для достижения высокой скорости важен правильный баланс блоков GPU и ПСП видеопамяти. Заметно влияет на скорость и эффективность выполнения ветвлений в шейдерах.

Как видно по результатам, этот тест выполняется на GTX 570 на 8,5% быстрее, чем на GTX 480. Другими словами, снова более чем на 5%, которые объяснимы большей математической и текстурной мощью. Это говорит о влиянии архитектурных изменений в GF110 на производительность в тесте Parallax Occlusion Mapping. Вместе с увеличенной производительностью блоков ALU и TMU это позволило GTX 570 приблизиться к Radeon HD 5870 в этом тесте. И особенно заметен контраст по сравнению с предшественником Geforce GTX 470 — целых 35% прироста!

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Как мы ранее выяснили, скорость рендеринга в этом тесте зависит сразу от нескольких параметров, среди которых производительность обработки геометрии и эффективность исполнения геометрических шейдеров. И с этими задачами представленный сегодня GTX 570 справляется отлично, становясь лидером и заметно опережая обоих конкурентов от AMD.

Как видно, с выполнением геометрических шейдеров и вообще скоростью обработки геометрии у Nvidia в последнем поколении архитектуры всё стало даже ещё лучше. Разница между GTX 570 и GTX 480 составила 9%, что объясняется тем же количеством геометрических блоков, но работающих на более высоких частотах.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты этого теста были бы схожи с теми, которые мы видели на предыдущей диаграмме, за исключением как раз нашего сегодняшнего героя — Geforce GTX 570. Новая модель, основанная на чипе GF110, в этот раз совсем чуть-чуть уступила GTX 480, что может объясняться меньшей пропускной способностью видеопамяти. И всё же она при этом вдвое быстрее конкурирующих видеокарт от компании AMD в этом тесте.

В синтетических приложениях с имитацией тканей и частиц тестового пакета 3DMark Vantage, где используются геометрические шейдеры, новый GTX 570 показал себя с самой лучшей стороны, обогнав конкурирующие графические процессоры компании AMD почти в два раза. Разница между GTX 570 и GTX 480 в этот раз составила менее 4%, причём в пользу старой модели из более высокого ценового диапазона.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он использует очень много математических расчётов.

В математическом тесте из пакета компании Futuremark, который показывает пиковую производительность видеочипов в предельных задачах, мы видим уже знакомую по нашим тестам картину. Показанная решениями производительность примерно соответствует тому, что должно получаться по теории, и тому, что мы уже видели ранее в наших математических тестах из пакета RightMark 2.0.

В этом математическом тесте Geforce GTX 570 показывает результат на 5% выше, чем GTX 480, что полностью соответствует теории. А вот что касается сравнения с конкурентом, то мы уже привыкли к тому, что видеокарты AMD всегда выигрывают похожие тесты с большим преимуществом. Так получилось и в этот раз — интенсивная математика выполняется на видеокартах Radeon значительно быстрее. Разница между GTX 570 и HD 5870 составляет более полутора раз, и даже с HD 6870 из среднего ценового диапазона новой модели Nvidia конкурировать очень трудно.

Выводы

По результатам проведённых нами синтетических тестов новой модели Geforce GTX 570, основанной на графическом процессоре GF110, а также результатам других моделей видеокарт обоих производителей, можно сделать вывод о том, что у Nvidia получилась хорошо сбалансированная модель высокого уровня, созданная на базе чипа архитектуры Fermi и обладающая вполне оправданной ценой.

Geforce GTX 570 отличается значительно увеличенной производительностью — на четверть, по сравнению с предшествующей ей моделью GTX 470, а также улучшенными потребительскими характеристиками по нагреву и шуму. Благодаря увеличению количества исполнительных блоков и возросшей тактовой частоте, результаты GTX 570 примерно соответствуют скорости GTX 480.

Но самое главное достижение GTX 570 даже не в том, что она будет продаваться дешевле GTX 480, обладая примерно той же производительностью, а в том, что архитектурные изменения в чипе GF110 и повышенные тактовые частоты привели к росту производительности при снижении энергопотребления, по сравнению с GTX 480. При этом оба GPU произведены по одному и тому же техпроцессу. Но теперь видеокарта подобной мощности и возможностей довольствуется лишь двумя 6-штырьковыми разъёмами питания, а новый кулер работает гораздо тише и эффективнее.

Мы ожидаем, что очень хорошие результаты Geforce GTX 570 в наших синтетических тестах, подкреплённые довольно сильными теоретическими характеристиками, получат своё подтверждение и в результатах следующей части нашего материала, посвящённой игровым тестам. Предполагаем, что в игровых тестах Geforce GTX 570 будет примерно равна по скорости модели Geforce GTX 480. Вероятно, новое решение будет впереди на несколько процентов в части тестов, ограниченной скоростью ALU и TMU, а в других играх, производительность в которых ограничена филлрейтом и ПСП, оно может уступить те же единицы процентов.



Nvidia Geforce GTX 570 — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией TAGAN

Корпус ThermalTake 8430 для тестового стенда предоставлен компанией 3LOGIC

Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia