Nvidia Geforce GTX 760:

описание видеокарт и результаты синтетических тестов


Содержание

В этой части мы изучим видеокарту, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала эталонная карта Nvidia.

Платы

Nvidia Geforce GTX 760 2048 МБ 256-битной GDDR5 PCI-E
  • GPU: Geforce GTX 760 (GK104)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 980-1033 МГц (номинал — 980-1033 МГц)
  • Частота работы памяти (физическая (эффективная)): 1500 (6000) МГц (номинал — 1500 (6000) МГц)
  • Ширина шины обмена с памятью: 256 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 6/980-1033 МГц (номинал — 6/980-1033 МГц)
  • Число операций (ALU) в блоке: 192
  • Суммарное число операций (ALU): 1192
  • Число блоков текстурирования: 96 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 32
  • Размеры: 245×100×38 мм (карта занимает 2 слота в системном блоке)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 169/67/52 Вт
  • Выходные гнезда: 2×DVI (Dual-Link/HDMI), 1×HDMI 1.4a, 1×DisplayPort 1.2
  • Поддержка многопроцессорной работы: SLI (Hardware)

Nvidia Geforce GTX 760 2048 МБ 256-битной GDDR5 PCI-E
Карта имеет 2048 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах (по 4 на каждой сторонe PCB).

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1500 (6000) МГц.

Сравнение с эталонным дизайном, вид спереди
Nvidia Geforce GTX 760 2048 МБ 256-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 670

Сравнение с эталонным дизайном, вид сзади
Nvidia Geforce GTX 760 2048 МБ 256-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 670

Если GTX 770 базируется на PCB от GTX 680 (как мы уже отмечали), то логично предположить, что GTX 760, исходя из схожего энергопотребления, основан на PCB от GTX 670, что и продемонстрировано на фотографиях выше. Причем идентичность 100%.

Ускоритель имеет следующий набор гнезд вывода: 2 DVI Dual-Link (один из которых совместим с выводом на VGA) и по одному DisplayPort и HDMI (второе гнездо DVI обладает возможностью через адаптер передавать сигнал на HDMI, поэтому суммарно можно подключить 2 приемника с HDMI). Напомним, что ускорители Nvidia достаточно давно обладают собственными звуковыми кодеками, поэтому передача на HDMI-монитор будет полноценной, со звуком. Также уместно напомнить, что возможность одновременного вывода картинки максимально на 4 монитора (каждый до разрешения Full HD), реализована и тут. Но если в случае GTX 780/Titan она наиболее полно востребована, учитывая мощность и возможности тех ускорителей, то для GTX 760 уже вряд ли. Играбельность будет ниже минимальных рамок.

Максимальные разрешения и частоты:

  • 240 Гц — максимальная частота обновления;
  • 2048×1536@85 Гц — по аналоговому интерфейсу;
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI).

Что касается возможностей по ускорению декодирования видео, в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.

Напомним, что карта требует дополнительного питания, причем двумя разъемами с шестью контактами.

О системе охлаждения.

Nvidia Geforce GTX 760 2048 МБ 256-битной GDDR5 PCI-E
Система охлаждения в целом традиционна. Длинный кожух, который увеличивает размер карты со 190 до 245 мм, имеет на конце цилиндрический стандартный вентилятор.

На ядре установлен радиатор на основе испарительной камеры, кроме того, свой радиатор имеют силовые транзисторы; оба охлаждаются единым потоком воздуха.

А вот микросхемы памяти оставлены без охлаждения, при этом, напомню, они размещены на обеих сторонах карты. При максимальном нагреве ядра вентилятор поднимает обороты примерно до 52% (1800 об/мин) от своего максимума, что не делает шум от него заметным.

Мы провели исследование температурного режима с помощью новой версии утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

Nvidia Geforce GTX 760 2048 МБ 256-битной GDDR5 PCI-E

После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 82 градуса, что для ускорителя такого класса является приемлемым результатом. Таким образом, СО получилась весьма эффективной и малошумной.

Комплектация. Reference-карты всегда поставляются без комплектов, поэтому этот пункт мы пропустим.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
    • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
    • корпус Corsair Obsidian 800D Full-Tower.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell UltraSharp U3011 (30″);
  • драйверы AMD версии Catalyst 13.5beta; Nvidia версии 320.39 (для GTX 760), 320.18 (для остальных карт).

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационной программы Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010).

Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 760 со стандартными параметрами (далее GTX 760)
  • Geforce GTX 770 со стандартными параметрами (далее GTX 770)
  • Geforce GTX 660 Ti со стандартными параметрами (далее GTX 660 Ti)
  • Radeon HD 7950 со стандартными параметрами (далее HD 7950)
  • Radeon HD 7870 со стандартными параметрами (далее HD 7870)

Для сравнения результатов новой модели видеокарты Geforce GTX 760 эти решения были выбраны по следующим причинам. Geforce GTX 660 Ti является прямым предшественником новинки из предыдущего семейства, и эта модель основана на таком же GPU, но с другим количеством активных блоков, и отличается разной ПСП видеопамяти, и поэтому будет интересно оценить их сравнительную производительность. Geforce GTX 770 нам интересна как видеокарта текущего поколения более высокого уровня, основанная на таком же графическом процессоре, но полностью разблокированном.

От конкурирующей компании AMD взяты две модели видеокарт, которые являются самыми близкими соперниками по цене и характеристикам для представленной сегодня модели GTX 760. Radeon HD 7950 — это несколько более мощное решение компании AMD, которое чуть дороже, а HD 7870 и продаётся дешевле и менее производительно. GTX 770 как бы находится между ними по цене, и поэтому нам придётся сравнивать с обоими решениями.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх, и она очень проста для современных видеочипов.

Тесты простые для современных видеокарт, и скорость мощных решений в них упирается в различные ограничители, вроде филлрейта. Они способны показать далеко не все возможности современных видеочипов и интересны лишь с точки зрения устаревших игровых приложений. В случае набора из довольно мощных видеокарт, все они показывают сравнимые результаты.

Новая плата компании Nvidia в этом сравнении ощутимо отстала только от платы на базе аналогичного чипа GK104, но с большим количеством исполнительных блоков — Geforce GTX 770 оказалась чуть-чуть быстрее, точно по теории. А вот GTX 660 Ti немного уступает новинке, кроме теста освещения по Фонгу, в котором важна математическая производительность. Сравнение с платой Radeon HD 7950 даёт схожие результаты. Посмотрим на более сложные пиксельные программы промежуточных версий:

Тест Cook-Torrance более интенсивен вычислительно, и скорость в нём сильнее зависит от количества ALU и их частоты, но также и от скорости TMU. Этот тест исторически лучше подходит для графических решений компании AMD, но новые платы Geforce на базе архитектуры Kepler в нём также показывают довольно сильные результаты, поэтому GTX 760 показал скорость примерно на уровне Radeon HD 7950. А вот GTX 660 Ti оказалась быстрее новинки, что вполне объяснимо с точки зрения теории.

Новая видеоплата из линейки Geforce GTX 700 оказалась медленнее предшествующей GTX 660 Ti и во втором тесте, что также объясняется меньшим количеством ALU и TMU. Понятно, что мощнейшая в сравнении — GTX 770. В тесте освещения, больше зависящем от скорости ALU, Radeon HD 7950 также немного отстала от новой модели Nvidia.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура AMD смотрится несколько лучше графической архитектуры Nvidia.

В тесте «Frozen Glass» скорость больше зависит от математической производительности и эффективности в конкретной задаче, поэтому Radeon HD 7950 оказалась быстрее и новинки Nvidia, и вообще всех остальных решений, включая GTX 770. GTX 760 в этом подтесте показала скорость ровно на уровне GTX 660 Ti.

Во втором тесте «Parallax Mapping» новая видеокарта Nvidia почти не отстаёт от Radeon HD 7950, да и преимущество над GTX 660 Ti появилось небольшое — порядка 6%. Понятно, что верхняя модель GTX 770 их всех обгоняет. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В условиях предпочтительности текстурных выборок, положение плат на чипах производства Nvidia улучшилось. Теперь новая Geforce GTX 760 во всех подтестах опережает своего конкурента от AMD, хотя и ненамного. Анонсированная сегодня видеокарта в этих задачах работает сравнительно неплохо, уступая только более дорогой и мощной GTX 770. Интересно сравнение с GTX 660 Ti, в тесте параллакс-маппинга новинка обогнала предшественника на 4%, а в другом тесте уступила 6%. Хорошо видно, где важна ПСП, а где — текстурная производительность.

Однако всё это давно устаревшие задачи, с упором в текстурирование и филлрейт. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
  • Fur — процедурный шейдер, визуализирующий мех.

Эти тесты практически не ограничены производительностью текстурных выборок или филлрейтом и больше всего зависят от эффективности исполнения сложного шейдерного кода. В самых тяжёлых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в предыдущие годы были сильнее, но в последних архитектурах решения AMD сильно ускорились.

Новая модель Nvidia выступила в этих тестах не слишком хорошо, но это было ожидаемо, ведь она уступает по математической производительности даже GTX 660 Ti. По сравнению с предшественницей на базе того же чипа GK104, она проигрывает 7-8%, что полностью соответствует теоретической разнице между ними. Своей старшей сестре из того же семейства новинка сильно проигрывает, а что касается сравнения с Radeon HD 7950, то в тесте Fur сравниваемые платы практически равны, а в тесте параллакс-маппинга новинка всё же проигрывает конкуренту.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает ещё и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раз ниже, чем при «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок за пару поколений графических архитектур компания AMD сократила разницу с платами Nvidia, а с выпуском GCN даже вырвалась вперёд. Сейчас именно платы Radeon являются лидерами таких сравнений, что говорит о высокой эффективности выполнения ими данных программ, что видно и по сегодняшнему сравнению.

Новинка Geforce GTX 760 показывает результат на уровне аналогичной платы GTX 660 Ti, заметно уступая GTX 770. Все решения Nvidia проигрывают в этом тесте паре моделей конкурента — Radeon HD 7950 и даже HD 7870. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

В целом всё похоже на то, что мы видели на предыдущей диаграмме, но видеокарты Nvidia стали проигрывать соперникам от AMD ещё больше. Новинка Geforce GTX 760 теперь уже проигрывает GTX 660 Ti до 4%, так как имеет меньшую математическую производительность. Но и GTX 770 теперь не так уж далеко впереди. Чего не скажешь о платах AMD, которые при включении суперсэмплинга, увеличивающего теоретическую нагрузку вчетверо, показали значительно большую производительность. Преимущество в подобных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип ещё примерно в два раза — такой режим называется «High».

Диаграмма в целом похожа на предыдущую, также без включения SSAA, и снова даже Geforce GTX 770 не смогла достать Radeon HD 7950 и HD 7870. Платы Nvidia и в этом тесте справляются с работой несколько хуже конкурирующих, а новая модель Geforce GTX 760 в обновленном D3D10-варианте теста без суперсэмплинга в лёгком режиме слегка опережает предшественницу GTX 660 Ti, но в сложном — уступает ей. Посмотрим, что изменит включение суперсэмплинга.

И снова получилось то же, что и в «Fur» — при включении суперсэмплинга и самозатенения, задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьёзное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, включение суперсэмплинга на Nvidia сказывается меньше, чем в предыдущем случае.

Графические решения Nvidia в D3D10-тестах пиксельных шейдеров из нашего пакета работают менее эффективно, и героиня обзора в этой задаче показывает скорость почти как у Geforce GTX 660 Ti, основанной на точно таком же графическом процессоре, но обе они далеки от HD 7950 и HD 7870. Посмотрим, что будет в чисто вычислительных задачах.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты наших предельных математических тестов примерно соответствуют разнице в частотах и количестве вычислительных блоков, но с влиянием разной эффективности их использования и с учётом отличающейся оптимизации драйверов. К сожалению, в случае теста Mineral, новая модель Geforce GTX 760 по какой-то странной причине показала результат аж на 12% хуже, чем GTX 660 Ti, хотя по теории между ними разница должна быть менее 10%.

В остальном, хотя архитектура AMD в таких тестах ранее имела серьёзное преимущество перед конкурирующими видеокартами Nvidia, но в чипах семейства Kepler компания Nvidia увеличила число потоковых процессоров, и пиковая математическая производительность моделей Geforce, начиная с GTX 680, значительно возросла. Что мы и видим по результатам нашего первого математического теста, где рассматриваемая Geforce GTX 760 показала результат, близкий к скорости конкурирующих видеокарт в лице Radeon HD 7950 и HD 7870.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Удивительно, но во втором математическом тесте мы видим совсем иной относительный результат. Если сравнивать GTX 760 и GTX 660 Ti, то разница между ними составила лишь 3%, что меньше теоретической, и это не объяснить одной только скоростью математических вычислений. Вероятно, в этом конкретном тесте новинке также помогло и увеличение пропускной способности видеопамяти. Если сравнивать выпущенную плату с Radeon, то GTX 760 всё же отстаёт от обоих конкурентов и в этом тесте.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии и пропускной способностью памяти.

Разница между результатами видеокарт на чипах Nvidia и AMD обусловлена отличиями в геометрических конвейерах чипах этих компаний. Если в предыдущих тестах с пиксельными шейдерами платы AMD были заметно эффективнее и быстрее, то тесты геометрии показывают, что в таких задачах платы Nvidia оказываются производительнее.

Сегодняшняя новинка Geforce GTX 760 имеет достаточно большое количество геометрических блоков и даже опережает GTX 660 Ti примерно на 15%, что можно объяснить только упором последней в пропускную способность памяти. Неудивительно, что новая плата Nvidia легко справляется со своими конкурентами — и Radeon HD 7870, и HD 7950 новая Geforce обходит с приличным запасом. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD, и для решений Nvidia. Видеокарты в первом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, а поэтому и все выводы остаются прежними. Новая модель Geforce GTX 760 всё так же немного отстаёт от GTX 770, но она стала ещё быстрее своей предшественницы GTX 660 Ti (на 20%). А видеоплаты семейства Radeon HD 7000 проигрывают ей до двух раз. Посмотрим далее — интересно, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленным в «Heavy», — ещё и для их отрисовки. Иначе говоря, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер.

Относительные результаты всех решений в разных режимах примерно соответствуют изменению нагрузки: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть до двух раз медленней.

В случае сбалансированной загрузки геометрических шейдеров, результаты всех решений близки и скорость рендеринга в этом тесте ограничена чем-то. Новая модель Geforce GTX 760 показала скорость чуть выше, чем GTX 660 Ti, но уступила GTX 770, а единственная отработавшая в этом тесте плата Radeon уступила им всем.

Цифры могут серьёзно измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

В усложнённом тесте получилось как всегда — единственная плата AMD стала отставать ещё больше, заметно уступив всем платам Nvidia, в том числе и новой GTX 760. Она в этом тесте проиграла предшественнице до 10%, что явно говорит об упоре в скорость ALU или TMU. Похоже, что скорость обработки геометрии, с которой дела у Nvidia обстоят заметно лучше, не является единственно важным параметром в этом тесте. На это указывает и тот факт, что GTX 770 заметно обошла своих коллег.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста может влиять и скорость текстурирования и пропускная способность памяти (в лёгком режиме), а результаты видеокарт Nvidia иногда ограничены ещё чем-то. Результаты новой платы на чипе GK104 схожи с теми, что получается у GTX 660 Ti, хотя в лёгком режиме она меньше ограничена ПСП и оказывается впереди, зато в сложном режиме они сравнялись. Новинка уступает только своей старшей сестре GTX 770. Ну а обе Radeon новая плата Nvidia обогнала, хотя разница в лёгком режиме небольшая. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме слабо изменилось — сравнительные результаты решений компании AMD в тяжёлых режимах слегка ухудшились — обе Radeon уступают в т. ч. и новинке. Анонсированная сегодня плата GTX 760 в тяжёлых режимах показала скорость ниже, чем у GTX 660 Ti на 5-9%, хотя опередила старую модель в лёгком режиме, в котором важна ПСП.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» не похожи на те, что мы видели на предыдущих диаграммах, и все решения показали близкие результаты. В этом тесте скорость всех плат (кроме GTX 770) примерно одинаковая, Radeon HD 7950 и HD 7870 оказались очень близко к Geforce GTX 760. Показатели новой платы чуть лучше, чем у GTX 660 Ti, как и должно быть. Рассмотрим второй вариант этого же теста:

С усложнением задачи скорость всех решений снизилась, но это мало что изменило. Во всех режимах этого теста новая GTX 760 показывает скорость на уровне своих соперников в виде Radeon HD 7950 и HD 7870, да и GTX 660 Ti где-то рядом. Результаты сегодняшней новинки заметно уступают в скорости разве что GTX 770.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты Nvidia в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и сравнительные цифры моделей близки к соответствующим теоретическим параметрам. Новая видеокарта из семейства Geforce GTX 700 уступает 8% предшественнице GTX 660 Ti, что полностью соответствует теории, а также проигрывает GTX 770 по той же причине.

Что касается сравнения производительности Geforce GTX 760 с представленными решениями конкурента, то тут всё также соответствует теории. Новинка Nvidia по текстурной скорости оказалась быстрее платы Radeon HD 7870 и почти на одном уровне с HD 7950.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нём используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры этого подтеста из 3DMark Vantage показывают производительность блоков ROP с учётом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест иногда измеряет скорее пропускную способность памяти, а не производительность ROP. Впрочем, в нашем случае у GTX 760 перед GTX 660 Ti есть преимущество и в том, и в другом.

Поэтому неудивительно, что в тесте производительности блоков ROP новинка GTX 760 оказалась быстрее своей предшественницы на 19%, проиграв только старшей GTX 770. Что касается сравнения скорости Geforce GTX 760 с видеоплатами компании AMD, то представленная сегодня модель Nvidia сравнима по скорости с HD 7950, и обе они заметно быстрее HD 7870, имеющей худшие теоретические показатели скорости заполнения сцены.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Третий тест отличается от проведённых нами ранее тем, что результаты в нём зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости тут важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае больше остальных важны математическая и текстурная производительность, и поэтому в синтетике из 3DMark Vantage новая плата Geforce GTX 760 оказалась медленнее всех. Она уступает предшественнице более 10%, весьма серьёзно отстаёт и от GTX 770, и от Radeon HD 7950 с HD 7870, как и должно быть по теории. GPU производства AMD до сих пор отличаются более эффективной работой в данном тесте, и лучшими в сравнении стала пара из GTX 770 и HD 7950.

Feature Test 4: GPU Cloth

Четвёртый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, но основными факторами влияния является уже производительность обработки геометрии и эффективность выполнения геометрических шейдеров, поэтому и картину на диаграмме мы видим совершенно иную. Из-за значительного влияния геометрических блоков получается, что видеокарты производства Nvidia чувствуют себя в этом тестировании заметно лучше конкурентов, обгоняя обе платы AMD. Это один из тех тестов, в которых видно преимущество решений Nvidia, имеющих распараллеленный геометрический конвейер.

В тесте симуляции ткани рассматриваемая сегодня модель Geforce GTX 760 идёт почти вровень с GTX 660 Ti из предыдущего поколения, разница между ними не больше погрешности измерения. Неудивительно, что GTX 770 стала лучшей в сравнении, что объясняется более высокой тактовой частотой GPU и большим количеством геометрических блоков.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Во втором геометрическом тесте из 3DMark Vantage новинка Geforce GTX 760 уже оказалась быстрее GTX 660 Ti на 11%, что говорит о важности пропускной способности видеопамяти и филлрейта в этой задаче. Обе платы Radeon подтянулись повыше, но всё же уступили новинке Nvidia, которая проиграла только старшей плате GTX 770, основанной на том же GPU. В общем, синтетические тесты имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, наглядно показали, что платы Nvidia в них остаются лучшими.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчётов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим отличающееся распределение результатов, по сравнению с двумя аналогичными тестами из нашего тестового пакета. В этом случае производительность решений также не полностью соответствует теории и расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Видеокарты Radeon компании AMD, созданные на базе чипов архитектуры GCN, всегда очень хорошо справляются с такими задачами и показывают лучшие результаты в случаях, когда выполняется сравнительно простая, но весьма интенсивная математика. Вот и платы Radeon HD 7950 и HD 7870 показали отличные результаты, чуть-чуть уступив лишь более дорогому решению из новой линейки конкурента в виде Geforce GTX 770.

Рассматриваемая сегодня видеокарта GTX 760 показала скорость на 4% хуже, чем GTX 660 Ti, что близко к теории. Обе они серьёзно уступили как топовой плате на том же GK104, так и конкурентам от AMD. Возросшая эффективность видеокарт на основе чипов архитектуры Kepler в этой задаче не позволила GTX 760 на равных побороться с её главными конкурентами.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новое решение компании Nvidia в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Это не самый удачный пример с вычислительными шейдерами, но разницу в производительности в конкретной задаче он показывает. Скорость расчётов в вычислительном и пиксельном шейдерах для всех плат давно примерно одинаковая, хотя у видеокарт с GPU предыдущих архитектур были различия. Судя по нашим предыдущим тестам, результаты в задаче зависят не только от математической мощи и эффективности вычислений, но и от других факторов, вроде ПСП и производительности ROP.

Впрочем, в этом конкретном случае разница между GTX 760 и GTX 660 Ti в 11% говорит о том, что важнее всё же математическая производительность. Анонсированная сегодня видеокарта компании Nvidia в этом тесте оказалась медленнее своих коллег в виде GTX 770 и GTX 660 Ti, а что касается сопоставления с единственной представленной в сравнении Radeon HD 7870, новинка чуть быстрее её. К сожалению, Radeon HD 7950 мы не тестировали в этих задачах.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

Во втором тесте расклад получился совершенно иной, у решений Nvidia есть явное преимущество в таких сложных расчётных задачах. В этом тесте совершенно логично побеждает мощнейшая Geforce GTX 770 на базе полноценного GK104, а следом за ней идёт анонсированная сегодня плата Geforce GTX 770 на базе урезанного GK104. Свою предшественницу из 6-й серии новинка опережает на 9%.

В этой конкретной задаче графические чипы Nvidia весьма сильны, и Radeon HD 7870 в этом сравнении оказался на последнем месте, серьёзно уступив и GTX 760. Впрочем, плата AMD и должна быть медленнее, да и стоит она дешевле всех. Давайте перейдём к тестам производительности в задачах тесселяции, которые традиционно должны показать одну из сильных сторон новинки.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но ещё одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нём реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга платы чаще всего упираются в ПСП, но не всегда — результат новой видеокарты от Nvidia почти такой же, что у Geforce GTX 660 Ti на том же чипе. Интересно, что лучшими в подтесте стали GTX 770 и даже Radeon HD 7870. Второй подтест с более сложными попиксельными расчётами интереснее — в нём GTX 760 уже слегка (на 3%) опередила свою предшественницу, а значит, скорость здесь ограничена ПСП. Удивительно, но дешёвая Radeon HD 7870 снова обходит новинку, да и от GTX 770 мало отстаёт.

Да и в самом интересном тесте с тесселяцией результат новинки позволил обойти почти на 20% лишь GTX 660 Ti. А вот Radeon HD 7870 снова удивила, обогнав GTX 760. Впрочем, в данном тесте тесселяции разбиение треугольников весьма умеренное, и скорость в нём не упирается в производительность блоков обработки геометрии, поэтому и скорости обработки треугольников у платы компании AMD вполне хватает, чтобы показывать высокие результаты.

Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом примере применяется более сложная геометрия, и поэтому сравнение геометрической мощи различных решений по данному тесту обычно приносит другие выводы. Обычно, но не сейчас. Увы, по какой-то странной причине, GTX 760 показала лишь 80% производительности от скорости GTX 660 Ti. Мы склонны отнести это отставание на счёт недоработки в драйверах, так как никакой теорией его не объяснить.

Все представленные решения хорошо справляются с лёгкой и средней геометрической нагрузкой, показывая высокую скорость, но в тяжёлых условиях графические процессоры Nvidia оказываются значительно более производительными. Анонсированная сегодня модель Geforce GTX 760 основана на чипе GK104, который имеет достаточное количество геометрических блоков, поэтому новинка даже с учётом странной потери скорости обгоняет в сложных условиях своего конкурента в виде Radeon HD 7870.

Рассмотрим результаты ещё одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии.

Мы протестировали эту программу при четырёх разных коэффициентах тесселяции (в данном случае настройка называется Dynamic Tessellation LOD). Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, единственная видеокарта от компании AMD в этом сравнении показывает достаточно высокий результат на уровне Geforce GTX 660 Ti, то при усложнении геометрической работы решения компании Nvidia вырываются далеко вперёд.

Новая видеокарта Geforce GTX 760 в этом тесте показала отличный результат, в лёгких режимах заметно опередила предшествующую модель GTX 660 Ti, что объясняется возросшей ПСП. Разница между ними больше в лёгких режимах, в которых сказывается разница в ширине шины памяти. Понятно, что новая плата во всех режимах заметно опережает плату конкурента, сравнение с Radeon можно даже не проводить.


Результаты синтетических тестов новой модели видеокарты Geforce GTX 760, основанной на графическом процессоре GK104 из семейства Kepler, а также результаты других моделей видеокарт производства обоих производителей дискретных видеочипов показали, что новое решение компании Nvidia является логичным обновлением линейки и заменяет собой Geforce GTX 660 Ti.

Сравнение новинки с этой моделью прошлого поколения в синтетических тестах привело к неоднозначным выводам. Судя по результатам наших предельных тестов, превосходство новой модели в производительности перед GTX 660 Ti хоть и есть, но не во всех тестах. В случаях, когда скорость ограничена пропускной способностью памяти или скоростью ROP, новинка явно быстрее. Но если мы сравниваем новинку в задачах, где важнее математическая и текстурная производительность GPU (а таких среди игр много!), то в них анонсированная сегодня модель Nvidia уступает предшественнице до 5-7%.

И хотя даже так новинка Nvidia выгодно смотрится и по сравнению с аналогичной по цене моделью конкурента — Radeon HD 7950, остаётся непонятным, что мешало ещё немного повысить частоту работы GPU, чтобы нивелировать отставание по количеству активных ALU перед GTX 660 Ti. Хотя бы просто для того, чтобы новое решение ни в чём не уступало тому, для замены которого оно предназначено.

В любом случае Geforce GTX 760 является очень неплохим вариантом для тех пользователей, которые хотят играть при настройках, близких к максимальным, но не готовы платить цену топовых моделей. Новая плата Nvidia стоит совсем недорого, и хотя аппаратно GTX 760 основан на старом GPU, но с учётом цены новой видеокарты у компании получилось очередное удачное решение, производительность которого в играх мы проверим в следующей части статьи.

Nvidia Geforce GTX 760 — Часть 3: производительность в игровых тестах →

2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair

Корпус Corsair Obsidian 800D-Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией AsusTeK

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair




Дополнительно

Обзор нового видеоускорителя Nvidia Geforce GTX 760. Часть 2 — Особенности видеокарты, результаты синтетических тестов

Nvidia Geforce GTX 760:

описание видеокарт и результаты синтетических тестов

Содержание

В этой части мы изучим видеокарту, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала эталонная карта Nvidia.

Платы

Nvidia Geforce GTX 760 2048 МБ 256-битной GDDR5 PCI-E
  • GPU: Geforce GTX 760 (GK104)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 980-1033 МГц (номинал — 980-1033 МГц)
  • Частота работы памяти (физическая (эффективная)): 1500 (6000) МГц (номинал — 1500 (6000) МГц)
  • Ширина шины обмена с памятью: 256 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 6/980-1033 МГц (номинал — 6/980-1033 МГц)
  • Число операций (ALU) в блоке: 192
  • Суммарное число операций (ALU): 1192
  • Число блоков текстурирования: 96 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 32
  • Размеры: 245×100×38 мм (карта занимает 2 слота в системном блоке)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 169/67/52 Вт
  • Выходные гнезда: 2×DVI (Dual-Link/HDMI), 1×HDMI 1.4a, 1×DisplayPort 1.2
  • Поддержка многопроцессорной работы: SLI (Hardware)

Nvidia Geforce GTX 760 2048 МБ 256-битной GDDR5 PCI-E
Карта имеет 2048 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах (по 4 на каждой сторонe PCB).

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1500 (6000) МГц.

Сравнение с эталонным дизайном, вид спереди
Nvidia Geforce GTX 760 2048 МБ 256-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 670

Сравнение с эталонным дизайном, вид сзади
Nvidia Geforce GTX 760 2048 МБ 256-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 670

Если GTX 770 базируется на PCB от GTX 680 (как мы уже отмечали), то логично предположить, что GTX 760, исходя из схожего энергопотребления, основан на PCB от GTX 670, что и продемонстрировано на фотографиях выше. Причем идентичность 100%.

Ускоритель имеет следующий набор гнезд вывода: 2 DVI Dual-Link (один из которых совместим с выводом на VGA) и по одному DisplayPort и HDMI (второе гнездо DVI обладает возможностью через адаптер передавать сигнал на HDMI, поэтому суммарно можно подключить 2 приемника с HDMI). Напомним, что ускорители Nvidia достаточно давно обладают собственными звуковыми кодеками, поэтому передача на HDMI-монитор будет полноценной, со звуком. Также уместно напомнить, что возможность одновременного вывода картинки максимально на 4 монитора (каждый до разрешения Full HD), реализована и тут. Но если в случае GTX 780/Titan она наиболее полно востребована, учитывая мощность и возможности тех ускорителей, то для GTX 760 уже вряд ли. Играбельность будет ниже минимальных рамок.

Максимальные разрешения и частоты:

  • 240 Гц — максимальная частота обновления;
  • 2048×1536@85 Гц — по аналоговому интерфейсу;
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI).

Что касается возможностей по ускорению декодирования видео, в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.

Напомним, что карта требует дополнительного питания, причем двумя разъемами с шестью контактами.

О системе охлаждения.

Nvidia Geforce GTX 760 2048 МБ 256-битной GDDR5 PCI-E
Система охлаждения в целом традиционна. Длинный кожух, который увеличивает размер карты со 190 до 245 мм, имеет на конце цилиндрический стандартный вентилятор.

На ядре установлен радиатор на основе испарительной камеры, кроме того, свой радиатор имеют силовые транзисторы; оба охлаждаются единым потоком воздуха.

А вот микросхемы памяти оставлены без охлаждения, при этом, напомню, они размещены на обеих сторонах карты. При максимальном нагреве ядра вентилятор поднимает обороты примерно до 52% (1800 об/мин) от своего максимума, что не делает шум от него заметным.

Мы провели исследование температурного режима с помощью новой версии утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

Nvidia Geforce GTX 760 2048 МБ 256-битной GDDR5 PCI-E

После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 82 градуса, что для ускорителя такого класса является приемлемым результатом. Таким образом, СО получилась весьма эффективной и малошумной.

Комплектация. Reference-карты всегда поставляются без комплектов, поэтому этот пункт мы пропустим.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
    • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
    • корпус Corsair Obsidian 800D Full-Tower.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell UltraSharp U3011 (30″);
  • драйверы AMD версии Catalyst 13.5beta; Nvidia версии 320.39 (для GTX 760), 320.18 (для остальных карт).

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационной программы Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010).

Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 760 со стандартными параметрами (далее GTX 760)
  • Geforce GTX 770 со стандартными параметрами (далее GTX 770)
  • Geforce GTX 660 Ti со стандартными параметрами (далее GTX 660 Ti)
  • Radeon HD 7950 со стандартными параметрами (далее HD 7950)
  • Radeon HD 7870 со стандартными параметрами (далее HD 7870)

Для сравнения результатов новой модели видеокарты Geforce GTX 760 эти решения были выбраны по следующим причинам. Geforce GTX 660 Ti является прямым предшественником новинки из предыдущего семейства, и эта модель основана на таком же GPU, но с другим количеством активных блоков, и отличается разной ПСП видеопамяти, и поэтому будет интересно оценить их сравнительную производительность. Geforce GTX 770 нам интересна как видеокарта текущего поколения более высокого уровня, основанная на таком же графическом процессоре, но полностью разблокированном.

От конкурирующей компании AMD взяты две модели видеокарт, которые являются самыми близкими соперниками по цене и характеристикам для представленной сегодня модели GTX 760. Radeon HD 7950 — это несколько более мощное решение компании AMD, которое чуть дороже, а HD 7870 и продаётся дешевле и менее производительно. GTX 770 как бы находится между ними по цене, и поэтому нам придётся сравнивать с обоими решениями.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх, и она очень проста для современных видеочипов.

Тесты простые для современных видеокарт, и скорость мощных решений в них упирается в различные ограничители, вроде филлрейта. Они способны показать далеко не все возможности современных видеочипов и интересны лишь с точки зрения устаревших игровых приложений. В случае набора из довольно мощных видеокарт, все они показывают сравнимые результаты.

Новая плата компании Nvidia в этом сравнении ощутимо отстала только от платы на базе аналогичного чипа GK104, но с большим количеством исполнительных блоков — Geforce GTX 770 оказалась чуть-чуть быстрее, точно по теории. А вот GTX 660 Ti немного уступает новинке, кроме теста освещения по Фонгу, в котором важна математическая производительность. Сравнение с платой Radeon HD 7950 даёт схожие результаты. Посмотрим на более сложные пиксельные программы промежуточных версий:

Тест Cook-Torrance более интенсивен вычислительно, и скорость в нём сильнее зависит от количества ALU и их частоты, но также и от скорости TMU. Этот тест исторически лучше подходит для графических решений компании AMD, но новые платы Geforce на базе архитектуры Kepler в нём также показывают довольно сильные результаты, поэтому GTX 760 показал скорость примерно на уровне Radeon HD 7950. А вот GTX 660 Ti оказалась быстрее новинки, что вполне объяснимо с точки зрения теории.

Новая видеоплата из линейки Geforce GTX 700 оказалась медленнее предшествующей GTX 660 Ti и во втором тесте, что также объясняется меньшим количеством ALU и TMU. Понятно, что мощнейшая в сравнении — GTX 770. В тесте освещения, больше зависящем от скорости ALU, Radeon HD 7950 также немного отстала от новой модели Nvidia.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура AMD смотрится несколько лучше графической архитектуры Nvidia.

В тесте «Frozen Glass» скорость больше зависит от математической производительности и эффективности в конкретной задаче, поэтому Radeon HD 7950 оказалась быстрее и новинки Nvidia, и вообще всех остальных решений, включая GTX 770. GTX 760 в этом подтесте показала скорость ровно на уровне GTX 660 Ti.

Во втором тесте «Parallax Mapping» новая видеокарта Nvidia почти не отстаёт от Radeon HD 7950, да и преимущество над GTX 660 Ti появилось небольшое — порядка 6%. Понятно, что верхняя модель GTX 770 их всех обгоняет. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В условиях предпочтительности текстурных выборок, положение плат на чипах производства Nvidia улучшилось. Теперь новая Geforce GTX 760 во всех подтестах опережает своего конкурента от AMD, хотя и ненамного. Анонсированная сегодня видеокарта в этих задачах работает сравнительно неплохо, уступая только более дорогой и мощной GTX 770. Интересно сравнение с GTX 660 Ti, в тесте параллакс-маппинга новинка обогнала предшественника на 4%, а в другом тесте уступила 6%. Хорошо видно, где важна ПСП, а где — текстурная производительность.

Однако всё это давно устаревшие задачи, с упором в текстурирование и филлрейт. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
  • Fur — процедурный шейдер, визуализирующий мех.

Эти тесты практически не ограничены производительностью текстурных выборок или филлрейтом и больше всего зависят от эффективности исполнения сложного шейдерного кода. В самых тяжёлых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в предыдущие годы были сильнее, но в последних архитектурах решения AMD сильно ускорились.

Новая модель Nvidia выступила в этих тестах не слишком хорошо, но это было ожидаемо, ведь она уступает по математической производительности даже GTX 660 Ti. По сравнению с предшественницей на базе того же чипа GK104, она проигрывает 7-8%, что полностью соответствует теоретической разнице между ними. Своей старшей сестре из того же семейства новинка сильно проигрывает, а что касается сравнения с Radeon HD 7950, то в тесте Fur сравниваемые платы практически равны, а в тесте параллакс-маппинга новинка всё же проигрывает конкуренту.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает ещё и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раз ниже, чем при «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок за пару поколений графических архитектур компания AMD сократила разницу с платами Nvidia, а с выпуском GCN даже вырвалась вперёд. Сейчас именно платы Radeon являются лидерами таких сравнений, что говорит о высокой эффективности выполнения ими данных программ, что видно и по сегодняшнему сравнению.

Новинка Geforce GTX 760 показывает результат на уровне аналогичной платы GTX 660 Ti, заметно уступая GTX 770. Все решения Nvidia проигрывают в этом тесте паре моделей конкурента — Radeon HD 7950 и даже HD 7870. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

В целом всё похоже на то, что мы видели на предыдущей диаграмме, но видеокарты Nvidia стали проигрывать соперникам от AMD ещё больше. Новинка Geforce GTX 760 теперь уже проигрывает GTX 660 Ti до 4%, так как имеет меньшую математическую производительность. Но и GTX 770 теперь не так уж далеко впереди. Чего не скажешь о платах AMD, которые при включении суперсэмплинга, увеличивающего теоретическую нагрузку вчетверо, показали значительно большую производительность. Преимущество в подобных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип ещё примерно в два раза — такой режим называется «High».

Диаграмма в целом похожа на предыдущую, также без включения SSAA, и снова даже Geforce GTX 770 не смогла достать Radeon HD 7950 и HD 7870. Платы Nvidia и в этом тесте справляются с работой несколько хуже конкурирующих, а новая модель Geforce GTX 760 в обновленном D3D10-варианте теста без суперсэмплинга в лёгком режиме слегка опережает предшественницу GTX 660 Ti, но в сложном — уступает ей. Посмотрим, что изменит включение суперсэмплинга.

И снова получилось то же, что и в «Fur» — при включении суперсэмплинга и самозатенения, задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьёзное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, включение суперсэмплинга на Nvidia сказывается меньше, чем в предыдущем случае.

Графические решения Nvidia в D3D10-тестах пиксельных шейдеров из нашего пакета работают менее эффективно, и героиня обзора в этой задаче показывает скорость почти как у Geforce GTX 660 Ti, основанной на точно таком же графическом процессоре, но обе они далеки от HD 7950 и HD 7870. Посмотрим, что будет в чисто вычислительных задачах.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты наших предельных математических тестов примерно соответствуют разнице в частотах и количестве вычислительных блоков, но с влиянием разной эффективности их использования и с учётом отличающейся оптимизации драйверов. К сожалению, в случае теста Mineral, новая модель Geforce GTX 760 по какой-то странной причине показала результат аж на 12% хуже, чем GTX 660 Ti, хотя по теории между ними разница должна быть менее 10%.

В остальном, хотя архитектура AMD в таких тестах ранее имела серьёзное преимущество перед конкурирующими видеокартами Nvidia, но в чипах семейства Kepler компания Nvidia увеличила число потоковых процессоров, и пиковая математическая производительность моделей Geforce, начиная с GTX 680, значительно возросла. Что мы и видим по результатам нашего первого математического теста, где рассматриваемая Geforce GTX 760 показала результат, близкий к скорости конкурирующих видеокарт в лице Radeon HD 7950 и HD 7870.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Удивительно, но во втором математическом тесте мы видим совсем иной относительный результат. Если сравнивать GTX 760 и GTX 660 Ti, то разница между ними составила лишь 3%, что меньше теоретической, и это не объяснить одной только скоростью математических вычислений. Вероятно, в этом конкретном тесте новинке также помогло и увеличение пропускной способности видеопамяти. Если сравнивать выпущенную плату с Radeon, то GTX 760 всё же отстаёт от обоих конкурентов и в этом тесте.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии и пропускной способностью памяти.

Разница между результатами видеокарт на чипах Nvidia и AMD обусловлена отличиями в геометрических конвейерах чипах этих компаний. Если в предыдущих тестах с пиксельными шейдерами платы AMD были заметно эффективнее и быстрее, то тесты геометрии показывают, что в таких задачах платы Nvidia оказываются производительнее.

Сегодняшняя новинка Geforce GTX 760 имеет достаточно большое количество геометрических блоков и даже опережает GTX 660 Ti примерно на 15%, что можно объяснить только упором последней в пропускную способность памяти. Неудивительно, что новая плата Nvidia легко справляется со своими конкурентами — и Radeon HD 7870, и HD 7950 новая Geforce обходит с приличным запасом. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD, и для решений Nvidia. Видеокарты в первом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, а поэтому и все выводы остаются прежними. Новая модель Geforce GTX 760 всё так же немного отстаёт от GTX 770, но она стала ещё быстрее своей предшественницы GTX 660 Ti (на 20%). А видеоплаты семейства Radeon HD 7000 проигрывают ей до двух раз. Посмотрим далее — интересно, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленным в «Heavy», — ещё и для их отрисовки. Иначе говоря, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер.

Относительные результаты всех решений в разных режимах примерно соответствуют изменению нагрузки: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть до двух раз медленней.

В случае сбалансированной загрузки геометрических шейдеров, результаты всех решений близки и скорость рендеринга в этом тесте ограничена чем-то. Новая модель Geforce GTX 760 показала скорость чуть выше, чем GTX 660 Ti, но уступила GTX 770, а единственная отработавшая в этом тесте плата Radeon уступила им всем.

Цифры могут серьёзно измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

В усложнённом тесте получилось как всегда — единственная плата AMD стала отставать ещё больше, заметно уступив всем платам Nvidia, в том числе и новой GTX 760. Она в этом тесте проиграла предшественнице до 10%, что явно говорит об упоре в скорость ALU или TMU. Похоже, что скорость обработки геометрии, с которой дела у Nvidia обстоят заметно лучше, не является единственно важным параметром в этом тесте. На это указывает и тот факт, что GTX 770 заметно обошла своих коллег.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста может влиять и скорость текстурирования и пропускная способность памяти (в лёгком режиме), а результаты видеокарт Nvidia иногда ограничены ещё чем-то. Результаты новой платы на чипе GK104 схожи с теми, что получается у GTX 660 Ti, хотя в лёгком режиме она меньше ограничена ПСП и оказывается впереди, зато в сложном режиме они сравнялись. Новинка уступает только своей старшей сестре GTX 770. Ну а обе Radeon новая плата Nvidia обогнала, хотя разница в лёгком режиме небольшая. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме слабо изменилось — сравнительные результаты решений компании AMD в тяжёлых режимах слегка ухудшились — обе Radeon уступают в т. ч. и новинке. Анонсированная сегодня плата GTX 760 в тяжёлых режимах показала скорость ниже, чем у GTX 660 Ti на 5-9%, хотя опередила старую модель в лёгком режиме, в котором важна ПСП.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» не похожи на те, что мы видели на предыдущих диаграммах, и все решения показали близкие результаты. В этом тесте скорость всех плат (кроме GTX 770) примерно одинаковая, Radeon HD 7950 и HD 7870 оказались очень близко к Geforce GTX 760. Показатели новой платы чуть лучше, чем у GTX 660 Ti, как и должно быть. Рассмотрим второй вариант этого же теста:

С усложнением задачи скорость всех решений снизилась, но это мало что изменило. Во всех режимах этого теста новая GTX 760 показывает скорость на уровне своих соперников в виде Radeon HD 7950 и HD 7870, да и GTX 660 Ti где-то рядом. Результаты сегодняшней новинки заметно уступают в скорости разве что GTX 770.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты Nvidia в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и сравнительные цифры моделей близки к соответствующим теоретическим параметрам. Новая видеокарта из семейства Geforce GTX 700 уступает 8% предшественнице GTX 660 Ti, что полностью соответствует теории, а также проигрывает GTX 770 по той же причине.

Что касается сравнения производительности Geforce GTX 760 с представленными решениями конкурента, то тут всё также соответствует теории. Новинка Nvidia по текстурной скорости оказалась быстрее платы Radeon HD 7870 и почти на одном уровне с HD 7950.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нём используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры этого подтеста из 3DMark Vantage показывают производительность блоков ROP с учётом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест иногда измеряет скорее пропускную способность памяти, а не производительность ROP. Впрочем, в нашем случае у GTX 760 перед GTX 660 Ti есть преимущество и в том, и в другом.

Поэтому неудивительно, что в тесте производительности блоков ROP новинка GTX 760 оказалась быстрее своей предшественницы на 19%, проиграв только старшей GTX 770. Что касается сравнения скорости Geforce GTX 760 с видеоплатами компании AMD, то представленная сегодня модель Nvidia сравнима по скорости с HD 7950, и обе они заметно быстрее HD 7870, имеющей худшие теоретические показатели скорости заполнения сцены.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Третий тест отличается от проведённых нами ранее тем, что результаты в нём зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости тут важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае больше остальных важны математическая и текстурная производительность, и поэтому в синтетике из 3DMark Vantage новая плата Geforce GTX 760 оказалась медленнее всех. Она уступает предшественнице более 10%, весьма серьёзно отстаёт и от GTX 770, и от Radeon HD 7950 с HD 7870, как и должно быть по теории. GPU производства AMD до сих пор отличаются более эффективной работой в данном тесте, и лучшими в сравнении стала пара из GTX 770 и HD 7950.

Feature Test 4: GPU Cloth

Четвёртый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, но основными факторами влияния является уже производительность обработки геометрии и эффективность выполнения геометрических шейдеров, поэтому и картину на диаграмме мы видим совершенно иную. Из-за значительного влияния геометрических блоков получается, что видеокарты производства Nvidia чувствуют себя в этом тестировании заметно лучше конкурентов, обгоняя обе платы AMD. Это один из тех тестов, в которых видно преимущество решений Nvidia, имеющих распараллеленный геометрический конвейер.

В тесте симуляции ткани рассматриваемая сегодня модель Geforce GTX 760 идёт почти вровень с GTX 660 Ti из предыдущего поколения, разница между ними не больше погрешности измерения. Неудивительно, что GTX 770 стала лучшей в сравнении, что объясняется более высокой тактовой частотой GPU и большим количеством геометрических блоков.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Во втором геометрическом тесте из 3DMark Vantage новинка Geforce GTX 760 уже оказалась быстрее GTX 660 Ti на 11%, что говорит о важности пропускной способности видеопамяти и филлрейта в этой задаче. Обе платы Radeon подтянулись повыше, но всё же уступили новинке Nvidia, которая проиграла только старшей плате GTX 770, основанной на том же GPU. В общем, синтетические тесты имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, наглядно показали, что платы Nvidia в них остаются лучшими.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчётов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим отличающееся распределение результатов, по сравнению с двумя аналогичными тестами из нашего тестового пакета. В этом случае производительность решений также не полностью соответствует теории и расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Видеокарты Radeon компании AMD, созданные на базе чипов архитектуры GCN, всегда очень хорошо справляются с такими задачами и показывают лучшие результаты в случаях, когда выполняется сравнительно простая, но весьма интенсивная математика. Вот и платы Radeon HD 7950 и HD 7870 показали отличные результаты, чуть-чуть уступив лишь более дорогому решению из новой линейки конкурента в виде Geforce GTX 770.

Рассматриваемая сегодня видеокарта GTX 760 показала скорость на 4% хуже, чем GTX 660 Ti, что близко к теории. Обе они серьёзно уступили как топовой плате на том же GK104, так и конкурентам от AMD. Возросшая эффективность видеокарт на основе чипов архитектуры Kepler в этой задаче не позволила GTX 760 на равных побороться с её главными конкурентами.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новое решение компании Nvidia в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Это не самый удачный пример с вычислительными шейдерами, но разницу в производительности в конкретной задаче он показывает. Скорость расчётов в вычислительном и пиксельном шейдерах для всех плат давно примерно одинаковая, хотя у видеокарт с GPU предыдущих архитектур были различия. Судя по нашим предыдущим тестам, результаты в задаче зависят не только от математической мощи и эффективности вычислений, но и от других факторов, вроде ПСП и производительности ROP.

Впрочем, в этом конкретном случае разница между GTX 760 и GTX 660 Ti в 11% говорит о том, что важнее всё же математическая производительность. Анонсированная сегодня видеокарта компании Nvidia в этом тесте оказалась медленнее своих коллег в виде GTX 770 и GTX 660 Ti, а что касается сопоставления с единственной представленной в сравнении Radeon HD 7870, новинка чуть быстрее её. К сожалению, Radeon HD 7950 мы не тестировали в этих задачах.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

Во втором тесте расклад получился совершенно иной, у решений Nvidia есть явное преимущество в таких сложных расчётных задачах. В этом тесте совершенно логично побеждает мощнейшая Geforce GTX 770 на базе полноценного GK104, а следом за ней идёт анонсированная сегодня плата Geforce GTX 770 на базе урезанного GK104. Свою предшественницу из 6-й серии новинка опережает на 9%.

В этой конкретной задаче графические чипы Nvidia весьма сильны, и Radeon HD 7870 в этом сравнении оказался на последнем месте, серьёзно уступив и GTX 760. Впрочем, плата AMD и должна быть медленнее, да и стоит она дешевле всех. Давайте перейдём к тестам производительности в задачах тесселяции, которые традиционно должны показать одну из сильных сторон новинки.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но ещё одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нём реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга платы чаще всего упираются в ПСП, но не всегда — результат новой видеокарты от Nvidia почти такой же, что у Geforce GTX 660 Ti на том же чипе. Интересно, что лучшими в подтесте стали GTX 770 и даже Radeon HD 7870. Второй подтест с более сложными попиксельными расчётами интереснее — в нём GTX 760 уже слегка (на 3%) опередила свою предшественницу, а значит, скорость здесь ограничена ПСП. Удивительно, но дешёвая Radeon HD 7870 снова обходит новинку, да и от GTX 770 мало отстаёт.

Да и в самом интересном тесте с тесселяцией результат новинки позволил обойти почти на 20% лишь GTX 660 Ti. А вот Radeon HD 7870 снова удивила, обогнав GTX 760. Впрочем, в данном тесте тесселяции разбиение треугольников весьма умеренное, и скорость в нём не упирается в производительность блоков обработки геометрии, поэтому и скорости обработки треугольников у платы компании AMD вполне хватает, чтобы показывать высокие результаты.

Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом примере применяется более сложная геометрия, и поэтому сравнение геометрической мощи различных решений по данному тесту обычно приносит другие выводы. Обычно, но не сейчас. Увы, по какой-то странной причине, GTX 760 показала лишь 80% производительности от скорости GTX 660 Ti. Мы склонны отнести это отставание на счёт недоработки в драйверах, так как никакой теорией его не объяснить.

Все представленные решения хорошо справляются с лёгкой и средней геометрической нагрузкой, показывая высокую скорость, но в тяжёлых условиях графические процессоры Nvidia оказываются значительно более производительными. Анонсированная сегодня модель Geforce GTX 760 основана на чипе GK104, который имеет достаточное количество геометрических блоков, поэтому новинка даже с учётом странной потери скорости обгоняет в сложных условиях своего конкурента в виде Radeon HD 7870.

Рассмотрим результаты ещё одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии.

Мы протестировали эту программу при четырёх разных коэффициентах тесселяции (в данном случае настройка называется Dynamic Tessellation LOD). Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, единственная видеокарта от компании AMD в этом сравнении показывает достаточно высокий результат на уровне Geforce GTX 660 Ti, то при усложнении геометрической работы решения компании Nvidia вырываются далеко вперёд.

Новая видеокарта Geforce GTX 760 в этом тесте показала отличный результат, в лёгких режимах заметно опередила предшествующую модель GTX 660 Ti, что объясняется возросшей ПСП. Разница между ними больше в лёгких режимах, в которых сказывается разница в ширине шины памяти. Понятно, что новая плата во всех режимах заметно опережает плату конкурента, сравнение с Radeon можно даже не проводить.


Результаты синтетических тестов новой модели видеокарты Geforce GTX 760, основанной на графическом процессоре GK104 из семейства Kepler, а также результаты других моделей видеокарт производства обоих производителей дискретных видеочипов показали, что новое решение компании Nvidia является логичным обновлением линейки и заменяет собой Geforce GTX 660 Ti.

Сравнение новинки с этой моделью прошлого поколения в синтетических тестах привело к неоднозначным выводам. Судя по результатам наших предельных тестов, превосходство новой модели в производительности перед GTX 660 Ti хоть и есть, но не во всех тестах. В случаях, когда скорость ограничена пропускной способностью памяти или скоростью ROP, новинка явно быстрее. Но если мы сравниваем новинку в задачах, где важнее математическая и текстурная производительность GPU (а таких среди игр много!), то в них анонсированная сегодня модель Nvidia уступает предшественнице до 5-7%.

И хотя даже так новинка Nvidia выгодно смотрится и по сравнению с аналогичной по цене моделью конкурента — Radeon HD 7950, остаётся непонятным, что мешало ещё немного повысить частоту работы GPU, чтобы нивелировать отставание по количеству активных ALU перед GTX 660 Ti. Хотя бы просто для того, чтобы новое решение ни в чём не уступало тому, для замены которого оно предназначено.

В любом случае Geforce GTX 760 является очень неплохим вариантом для тех пользователей, которые хотят играть при настройках, близких к максимальным, но не готовы платить цену топовых моделей. Новая плата Nvidia стоит совсем недорого, и хотя аппаратно GTX 760 основан на старом GPU, но с учётом цены новой видеокарты у компании получилось очередное удачное решение, производительность которого в играх мы проверим в следующей части статьи.

Nvidia Geforce GTX 760 — Часть 3: производительность в игровых тестах →

2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair

Корпус Corsair Obsidian 800D-Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией AsusTeK

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair