Содержание
- Часть 1 — Теория и архитектура
- Часть 2 — Практическое знакомство
- Часть 3 — Результаты игровых тестов и выводы
Справочные материалы
Устройство(а)
Palit Geforce GT 740 1024 МБ 128-битной GDDR5 PCI-E | ||
---|---|---|
Параметр | Значение | Номинальное значение (референс) |
GPU | Geforce GT 740 (GK107) | |
Интерфейс | PCI Express x16 | |
Частота работы GPU (ROPs), МГц | 993 | 993 |
Частота работы памяти (физическая (эффективная)), МГц | 1250 (5000) | 1250 (5000) |
Ширина шины обмена с памятью, бит | 128 | |
Число вычислительных блоков в GPU/частота работы блоков, МГц | 2/993 | 2/993 |
Число операций (ALU) в блоке | 192 | |
Суммарное число операций (ALU) | 384 | |
Число блоков текстурирования (BLF/TLF/ANIS) | 32 | |
Число блоков растеризации (ROP) | 16 | |
Размеры, мм | 155×100×35 | 155×100×35 |
Количество слотов в системном блоке, занимаемые видеокартой | 2 | 2 |
Цвет текстолита | черный | черный |
Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»), Вт | 64/41/28 | 64/41/28 |
Выходные гнезда | 1×DVI (Dual-Link/HDMI), 1×HDMI 1.4a, 1×d-Sub(VGA) | 1×DVI (Dual-Link/HDMI), 1×HDMI 1.4a, 1×DisplayPort 1.2 |
Поддержка многопроцессорной работы | Нет | |
Максимальное количество приемников/мониторов для одновременного вывода изображения | 3 | 3 |
Дополнительное питание: количество 8-контактных разъемов | Нет | Нет |
Дополнительное питание: количество 6-контактных разъемов | Нет | 1 |
Максимальное разрешение 2D: HDMI/Dual-Link DVI/VGA | 3840×2400/2560×1600/2560×1600 | |
Максимальное разрешение 3D: HDMI/Dual-Link DVI/VGA | 3840×2400/2560×1600/2048×1536 |
Комплектация локальной памятью | |
---|---|
Карта имеет 1024 МБ памяти GDDR5 SDRAM, размещенной в 4 микросхемах по 1 Гбит (на лицевой стороне PCB). Микросхемы памяти Samsung (GDDR5). Микросхемы расчитаны на максимальную частоту работы в 1500 (6000) МГц. |
Очевидно, что карта GT 740 спроектирована на основе GTX 650, ведь ядро одно и то же, разница лишь в частотах работы. Также GTX 650 поддерживает 2 гигабайта памяти (8 микросхем памяти, по 4 с каждой стороны PCB), а в данном случае распаян лишь 1 гигабайт, и оборотная сторона пуста. В принципе, карта очень простая, да и должна быть такой. По наследству от GTX 650 ей досталась схема питания, рассчитанная на использование внешней дополнительной подпитки через 6-контактный разъем, однако в данном случае он не используется, потребление карты ниже 75 Вт, поэтому все материнские платы с PCI-E смогут обеспечить необходимое питание через слот.
Мониторинг температурного режима (с помощью EVGA PrecisionX (автор А. Николайчук AKA Unwinder) |
---|
Комплектация | |
---|---|
Базовый комплект поставки должен включать в себя руководство пользователя, диск с драйверами и утилитами. Мы видим базовый комплект. |
Установка и драйверы
Конфигурация тестового стенда
- Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
- 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
- СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
- СО Intel Thermal Solution RTS2011LC;
- системная плата Asus Sabertooth X79 на чипсете Intel X79;
- системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
- оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
- жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
- жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
- 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
- 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
- корпус Corsair Obsidian 800D Full-Tower.
- операционная система Windows 7 64-битная; DirectX 11.1;
- монитор Dell UltraSharp U3011 (30″);
- монитор Asus ProArt PA249Q (24″);
- драйверы AMD версии Catalyst 14.7, Nvidia версии 340.43. VSync отключен.
Используемые нами пакеты синтетических тестов можно скачать здесь:
- D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org.
- D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0, ссылка.
- RightMark3D 2.0 с кратким описанием: под Vista без SP1, под Vista c SP1.
Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.
В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.
Синтетические тесты проводились на следующих видеокартах:
- Geforce GT 740 модель с GDDR5-памятью со стандартными параметрами (далее GT 740)
- Geforce GTX 650 со стандартными параметрами (далее GTX 650)
- Geforce GT 640 со стандартными параметрами (далее GT 640)
- Radeon R7 250X со стандартными параметрами (далее R7 250X)
- Radeon HD 7750 со стандартными параметрами (далее HD 7750)
Для анализа результатов видеокарты Geforce GT 740 нами были выбраны именно эти решения по следующим причинам. Geforce GTX 650 является ближайшей по техническим характеристикам моделью из предыдущего семейства, основанной на том же графическом процессоре, а Geforce GT 640 — модель компании предыдущего поколения также на GK107, которая стояла ранее в линейке ровно на той же позиции, что и рассматриваемая нами сегодня GT 740.
От конкурирующей компании AMD для сравнения были выбраны две видеоплаты, основанные на одинаковом графическом процессоре, не слишком сильно отличающиеся по производительности друг от друга, также лишь номинально относящихся к разным поколениям. Основным конкурентом для рассматриваемой Geforce GT 740 является Radeon R7 250X, а Radeon HD 7750 взята дополнительно, так как еще присутствует в продаже и стоит еще дешевле.
Direct3D 9: тесты Pixel Shaders
Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся разве что в старых играх, очень простых для современных видеочипов.
С такими тестами современные GPU справляются с легкостью, и скорость даже бюджетных решений упирается в различные ограничители. Эти тесты не способны показать возможности современных видеочипов, и интересны лишь с точки зрения устаревших игровых приложений. Производительность современных видеокарт в них ограничена скоростью текстурирования или филлрейта, а видеокарты Nvidia вообще очень давно перестали оптимизироваться для подобных задач, что прекрасно видно по их не впечатляющим результатам.
Новая модель видеокарты Nvidia в этом сравнении уступает более дорогому решению из предыдущего поколения, основанному на таком же чипе, где-то на 5-8%. Но зато GT 640 осталась далеко позади. Естественно, что новинка во всех этих тестах серьезно уступает плате конкурента — Radeon R7 250X. Вывод все тот же, платы Nvidia в этом сравнении все так же проигрывают решениям AMD. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:
Если сравнивать видеокарты Nvidia, видно, что в одном из тестов новинка уступила больше, чем в другом. Тест Cook-Torrance вычислительно интенсивный, и скорость в нем больше зависит от количества ALU и их частоты, и в нем GT 740 показала довольно хороший результат, уступив GTX 650 лишь 6%. GT 640 из-за недостатка ПСП показывает заметно худшую производительность. Так как этот тест лучше подходит для графических решений компании AMD, то новая плата Geforce в нем показала результат, далекий от уровня Radeon R7 250X.
В тесте Water скорость больше зависит от текстурирования, и там мы видим другую картину, по скорости текстурирования новая модель уступает старшей Geforce предыдущего поколения чуть больше — 13%. Собственно, в этом тесте новинка также обгоняет только Geforce GT 640, как и должно быть, исходя из теории.
Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0
Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:
- Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
- Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.
Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:
Это — универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Все наши предыдущие исследования показывают, что в этих задачах архитектура GCN от AMD выступает значительно лучше графической архитектуры Nvidia Kepler (да и Maxwell).
Впрочем, есть явная зависимость относительных результатов от теста. В тесте «Frozen Glass» скорость больше зависит от математической производительности и в случае плат Nvidia всегда есть непонятная преграда, из-за которой они упираются во что-то, серьезно проигрывая аналогичным по цене платам Radeon. Новая модель Geforce оказывается в этом тесте на 8% медленнее GTX 650, заметно опережает GT 640 и столь же серьезно уступает Radeon R7 250X.
Во втором тесте «Parallax Mapping» новая видеокарта Geforce GT 740 показала производительность на уровне GTX 650, что говорит о влиянии пропускной способности, которая у этих плат идентична. Если сравнивать с платой AMD Radeon, то новинка все так же отстает от R7 250X, хотя уже не так критично, как в предыдущем тесте. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:
В изменившихся условиях положение видеоплат от Nvidia чуть-чуть улучшилось, так как они справляются с текстурными выборками несколько лучше конкурирующих решений. Но даже это помогло Geforce GT 740 не слишком сильно, новинка все равно остается позади своего главного конкурента в обоих тестах, особенно в Frozen Glass. GT 740 на 8% медленнее GTX 650 из предыдущего поколения в этом тесте, но в Parallax Mapping вдруг выигрывает 7% — похоже, сказываются программные оптимизации.
Это были давно устаревшие задачи, с упором в текстурирование, чего почти не встречается в играх. Дальше мы рассмотрим результаты еще двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они более показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:
- Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
- Fur — процедурный шейдер, визуализирующий мех.
Эти тесты не ограничены производительностью только текстурных выборок или филлрейтом и скорость в них более всего зависит от эффективности исполнения сложного шейдерного кода. И когда дело коснулось самых тяжелых DX9-тестов из первой версии пакета RightMark, то новая видеокарта производства Nvidia показала результат, идентичный производительности Geforce GTX 650 предыдущего семейства, а обе они обогнали GT 640. Впрочем, плата AMD на чипе архитектуры GCN все равно впереди всех Geforce.
Новинка от Nvidia показывает в этих задачах неплохой результат, оказавшись вдвое быстрее аналогичной модели предыдущего поколения Geforce GT 640 и идя вровень с GTX 650. Вероятно, больше всего на результатах сказалась пропускная способность памяти. Что касается сравнения с конкурентом от AMD, то новинка не способна конкурировать с Radeon R7 250X и в этих задачах.
Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)
Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.
Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.
Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.
Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.
Производительность в этом тесте зависит от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».
В задачах процедурной визуализации меха с большим количеством текстурных выборок, в последних поколениях графических архитектур компания AMD сократила разницу с платами Nvidia, а с выпуском видеочипов на базе архитектуры GCN и вовсе вырвалась вперед, и теперь именно платы Radeon являются лидерами в этих сравнениях, что говорит о более высокой эффективности выполнения ими этих программ.
Видеоплата модели Geforce GT 740 явно быстрее аналога из предыдущего поколения (GT 640), но более мощной GTX 650 она уступает, хоть и совсем немного — 5-7%. Увы, но обе соперничающие видеокарты от конкурента далеко впереди, так что для Nvidia в этих тестах все остается по-прежнему, даже более мощные и дорогие платы уступают дешевым Radeon.
Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:
В таких условиях новая модель Geforce GT 740 также заметно опережает аналог из предыдущего поколения — устаревшую GT 640, а GTX 650 впереди нее на 7-8%. Отставание от конкурентов в виде Radeon R7 250X и HD 7750 лишь усилилось — превосходство в подобных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.
Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:
Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».
Диаграмма в целом похожа на предыдущую, также без включения SSAA, и в этот раз новая Geforce GT 740 показала скорость лишь на 3-5% хуже, чем GTX 650. Также она продолжает заметно опережать GT 640. Если брать сравнение с видеокартами AMD, то в этом случае все снова печально, новинка уступает всем, так как платы Nvidia в этом тесте снова справляются с работой заметно хуже конкурирующих решений. Посмотрим, что изменит включение суперсэмплинга:
Мало что изменилось и в этот раз. При включении суперсэмплинга и самозатенения задача получается еще более тяжелой и совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась слабо, а включение суперсэмплинга сказывается меньше, чем в предыдущем случае.
Снова мы видим, что графические решения Radeon в D3D10-тестах пиксельных шейдеров работают значительно эффективнее, по сравнению с конкурирующими Geforce. И поэтому новая плата Geforce GT 740 на чипе архитектуры Kepler хоть и выступает на хорошем уровне относительно аналогичных плат Nvidia на том же чипе, но если сравнивать ее с Radeon R7 250X и HD 7750, то отставание новинки слишком велико.
Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)
Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.
Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.
Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, а на результаты также влияет и разная эффективность их использования в конкретных решениях, равно как и оптимизация драйверов. В случае теста Mineral, новая модель Geforce GT 740 оказалась на 10% медленнее старшего аналога из предыдущего поколения (GTX 650), выиграв у более медленной платы GT 640.
Сравнение GT 740 с платами AMD в очередной раз показало сильные стороны архитектуры конкурента, так как платы Radeon в таких тестах имеют значительное преимущество перед конкурирующими решениями калифорнийцев. В математических тестах конкурирующая с новинкой по цене видеокарта Radeon R7 250X оказалась далеко впереди, и даже устаревшая и менее дорогая Radeon HD 7750 вырвалась вперед.
Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:
Во втором математическом тесте мы видим уже несколько иные результаты видеокарт относительно друг друга, хотя они изменились не так уж сильно. Так, разницы между Geforce GT 740 и GTX 650 уже нет (наблюдаем упор в ПСП или действие программных оптимизаций), GT 640 все так же проиграла всем подряд, ну а Radeon R7 250X и HD 7750 все так же обгоняют новинку от Nvidia. В общем, с тестами пиковой математической производительности все как обычно — видеочипы Nvidia сильно отстают.
Direct3D 10: тесты геометрических шейдеров
В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.
Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.
Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:
Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт очень простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда также и пропускной способностью памяти.
Хотя некоторая разница между результатами видеокарт на чипах Nvidia и AMD, которая обусловлена отличиями в геометрических конвейерах чипов этих компаний, и заметна, но в целом результаты очень близкие. Если в предыдущих тестах с пиксельными шейдерами платы AMD были заметно эффективнее и быстрее, то тесты геометрии показывают, что в таких задачах платы Nvidia достаточно производительны.
Летняя новинка Geforce GT 740 уступает более мощному варианту платы прошлого поколения около 10% и примерно настолько же быстрее модели GT 640. А вот видеокарты Radeon в этот раз впервые в роли догоняющих — геометрическая производительность у них похуже. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:
При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD и для решений Nvidia, но разница невелика. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и выводы остаются прежними. Новинка Nvidia быстрее аналогичной модели прошлого поколения и уступает GTX 650 где-то 9-10%. Да и в остальном в выводах ничего не изменилось, платы Geforce быстрее обеих Radeon.
К сожалению, «Hyperlight» — наш второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD просто не работает. В какой-то момент очередное обновление драйверов Catalyst привело к тому, что данный тест перестал запускаться на платах этой компании, и эта ошибка не исправлена вот уже несколько лет.
Direct3D 10: скорость выборки текстур из вершинных шейдеров
В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.
Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:
Предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, что особенно заметно в легком режиме. Результаты новой видеокарты компании Nvidia близки к скорости старшего из пары решений предыдущего поколения — GTX 650, новинка отстала лишь на 7-8%, точно по теории. Главный конкурент новинки в виде Radeon R7 250X в этот раз опережает новинку, хотя HD 7750 из предыдущего поколения чуть медленнее. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:
Ситуация на диаграмме изменилась, так как решения компании AMD в тяжелых режимах потеряли несколько больше, чем все Geforce. В результате, новая видеоплата Geforce GT 740 показала скорость на уровне своего конкурента, опередив HD 7750. Если же сравнивать с решениями Nvidia предыдущего поколения, то там все без изменений — новинка уступает старшей GTX 650 около 7-8%, а GT 640 далеко позади из-за медленной DDR3-памяти.
Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.
Результаты во втором тесте вершинного текстурирования «Waves» не похожи на то, что мы видели на предыдущих диаграммах, скоростные показатели всех Geforce в этом тесте ухудшились. Новая модель Nvidia заметно быстрее Geforce GT 640 и почти на уровне GTX 650 (разница лишь 3-4%), но обе платы Radeon заметно быстрее во всех режимах. Рассмотрим второй вариант этого же теста:
С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, и чуть больше пострадали видеокарты от Nvidia. Поэтому и в выводах мало что меняется. Новая модель Geforce GT 740 уступает 2-6% старшей модели предыдущего поколения GTX 650, а младшая GT 640 остается далеко позади — самой последней. А вот сравнение с прямыми конкурентами не особенно радужное — увы, но новинка серьезно уступает даже Radeon HD 7750, не говоря уже о R7 250X.
3DMark Vantage: тесты Feature
Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов видеокарты модели Geforce GT 740 в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark. Feature Test 1: Texture Fill
Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.
Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между GT 740 и GTX 650 — близкими по характеристикам моделями нового и предыдущего поколения, созданными на основе графического процессора GK107, достигает более чем 12%, что больше теоретического отличия между ними. Новая модель Nvidia по скорости текстурирования в этом тесте находится примерно посередине между GT 640 и GTX 650.
Что касается сравнения скорости новой видеоплаты с решениями конкурента, то новинка Nvidia по текстурной скорости обгоняет только более слабого и дешевого конкурента из прошлого поколения (Radeon HD 7750), а прямой ценовой соперник в лице Radeon R7 250X заметно быстрее ее. Feature Test 2: Color Fill
Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.
Цифры второго подтеста 3DMark Vantage показывают производительность блоков ROP с учетом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет пропускную способность и/или производительность ROP. Результат у выпущенной летом бюджетной видеоплаты Geforce снова получился между GT 640 и GTX 650, но чуть ближе к старшей из моделей предыдущего поколения.
Если сравнивать скорость заполнения сцены видеокартой GT 740 с видеокартами AMD, то рассматриваемая нами сегодня плата в этом тесте показывает почти такую же скорость заполнения сцены, что и конкурирующие с ней по цене Radeon, в том числе и прямая соперница — R7 250X. Разница в скорости между всеми тремя картами есть, но небольшая. Feature Test 3: Parallax Occlusion Mapping
Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.
Этот тест пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.
В данном случае, важны и математическая и текстурная производительность, поэтому в этой «синтетике» из 3DMark Vantage новая плата Geforce GT 740 оказалась заметно быстрее младшей своей предшественницы на том же чипе, но почему-то уступила старшей GTX 650 с близкими характеристиками целых 15%, что не объяснить теорией.
Неудивительно, что при этом новинка также сильно проигрывает и не только своему прямому конкуренту от AMD, но и показывает результат ниже уровня устаревшей и более дешевой Radeon HD 7750 из предыдущего поколения. Графические процессоры производства компании AMD явно работают в этой задаче более эффективно. Feature Test 4: GPU Cloth
Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.
Скорость рендеринга в этом тесте обычно зависит сразу от нескольких параметров, а основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны бы проявиться именно тут. Но нет, новая бюджетная модель компании Nvidia и тут показала не слишком высокую скорость. Да, она уступила GTX 650 лишь 9%, что близко к теории, и опередила GT 640, но сравнивать ее нужно с платами Radeon.
Которые, несмотря на меньшее количество соответствующих исполнительных блоков и большую геометрическую производительность, по сравнению с конкурирующими решениями Nvidia, в этом тесте работают очень неплохо. Но это касается лишь новой Radeon R7 250X, которая заметно обошла новинку Geforce GT 740. Разница же между двумя Radeon объясняется соответствующими программными оптимизациями. Feature Test 5: GPU Particles
Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.
Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.
Во втором геометрическом тесте из 3DMark Vantage ситуация снова изменилась, в этот раз новая Geforce GT 740 оказалась между GT 640 и GTX 650, но ближе к старшей из них. Вероятно, в этом тесте наблюдается упор не только в геометрическую производительность, а также и производительность блоков ROP и/или пропускную способность видеопамяти.
Сравнивая новинку с конкурирующими видеокартами от компании AMD, отметим, что она показала скорость, хоть и ниже своего прямого конкурента Radeon R7 250X, но отставание не слишком большое. Правда, даже Radeon HD 7750 смогла опередить плату Nvidia. Платы на чипах AMD хорошо оптимизированы для синтетических тестов имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры. Feature Test 6: Perlin Noise
Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.
В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим почти такое же распределение результатов, как и в двух аналогичных тестах нашего тестового пакета. В этом случае производительность решений не совсем соответствует теории, но близка к тому, что мы видели в математических тестах и ранее.
Видеокарты Radeon компании AMD, созданные на базе чипов архитектуры GCN, очень хорошо справляются с подобными задачами и показывают результаты лучше конкурента в случаях, когда выполняется интенсивная «математика». Неудивительно, что новая модель компании Nvidia в этом тесте показала результат хуже, чем у Radeon R7 250X. Однако, что интересно, ее скорость почти на уровне Radeon HD 7750, что совсем неплохо. Geforce GT 640 по каким-то причинам провалилась, а разница между GT 740 и GTX 650 равна 12%, что снова несколько выше теоретической.
Direct3D 11: Вычислительные шейдеры
Чтобы протестировать новое решение компании Nvidia в задачах, использующих такие свежие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.
Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.
Скорость расчетов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia давно уже одинаковая, хотя у видеокарт с GPU предыдущих архитектур были явные отличия. Судя по нашим предыдущим тестам, результаты в задаче явно зависят не столько от математической мощи и эффективности вычислений, но от других факторов, вроде пропускной способности памяти и производительности блоков ROP.
В данном случае скорость видеокарт упирается в ПСП (что отчетливо видно по серьезно отставшей Geforce GT 640), и новая бюджетная плата компании Nvidia по этому параметру лишь слегка (7%) отстает от GTX 650. Если сравнивать Geforce GT 740 с прямым конкурентом в лице Radeon R7 250X, то новинка все же немного отстает от соперника.
Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.
В этом тесте упор не только в скорость исполнения простых математических вычислений и ПСП, но и в эффективности выполнения сложного кода с ветвлениями. Во втором DX11-тесте расклад сил между решениями разных компаний оказался иным, и решения от Nvidia снова уступают соперникам.
Платы Geforce в подобных расчетных задачах обычно смотрятся неплохо, но не в этот раз. Во-первых, новые Radeon также хорошо выглядят, а во-вторых — в GK107 слишком мало геометрических блоков, чтобы получить преимущество. В общем, в этом тесте победила единственная видеокарта AMD, а Geforce GT 740 оказалась лишь третьей — позади GTX 650 на 10%, что близко к теории.
Direct3D 11: Производительность тесселяции
Вычислительные шейдеры очень важны, но еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.
Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.
Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:
В тесте простого бампмаппинга скорость плат не слишком важна, так как эта задача стала слишком легкой даже для сравнительно маломощных решений. Сегодняшний герой обзора — уступает Geforce GTX 650 совсем немного, да и Radeon R7 250X также оказался впереди. Ну а самой слабой стала Geforce GT 640 по понятным причинам.
Во втором подтесте со сложными попиксельными расчетами новинка вдвое уступила Radeon R7 250X, ведь эффективность выполнения таких математических вычислений в пиксельных шейдерах у чипов архитектуры GCN заметно выше, чем у Kepler. Интересно, что если сравнивать новую модель GT 740 со старой GTX 650, которая мощнее теоретически, то мы видим небольшое несоответствие теории — новинка оказалась чуть быстрее.
И в подтесте с применением тесселяции, новая плата почти не уступает старшей из пары Geforce предыдущего семейства. Увы, но единственная плата AMD выигрывает у новинки лагеря Nvidia — это объясняется тем, что в этом тесте тесселяции разбиение треугольников умеренное и скорость в нем упирается не в производительность блоков обработки геометрии, а по остальным параметрам решение AMD явно мощнее.
Вторым тестом производительности тесселяции будет еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.
В этом тесте в самом тяжелом режиме применяется уже более сложная геометрия, поэтому и сравнение геометрической мощи различных решений приносит другие выводы. Все представленные в материале современные решения достаточно хорошо справляются с легкой и средней геометрической нагрузкой, показывая высокую скорость. И даже в тяжелых условиях графические процессоры Nvidia не смогли составить конкуренцию единственной Radeon — сказывается малое количество геометрических блоков в бюджетном чипе GK107. Удивительно, но Radeon R7 250X во всех режимах оказалась лидером.
Что касается сравнения плат Nvidia между собой, то и тут не обошлось без сюрпризов. По какой-то причине, рассматриваемая сегодня модель Geforce GT 740 уступила аналогичной плате на чипе GK107 из прошлого поколения слишком много — до 40%, что нельзя объяснить ни одним из теоретических показателей. Похоже, что в более свежей версии драйверов что-то изменилось в худшую сторону.
Рассмотрим результаты еще одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.
Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Хотя основной все равно остается именно нагрузка на блоки обработки геометрии.
Мы тестируем все видеоплаты при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. Обычно, при первом коэффициенте разбиения треугольников, скорость не ограничена производительностью геометрических блоков, и видеокарты Radeon от компании AMD показывают достаточно высокие результаты, а в следующих ступенях нагрузки начинают уступать скорости плат Nvidia, так как производительность всех Radeon снижается заметнее.
Но не в случае сравнения Geforce GT 740 и Radeon R7 250X. Плата AMD показывает себя очень неплохо, практически не отставая от видеокарты Nvidia. А в играх геометрическая нагрузка всегда намного ниже, и Radeon будет лишь быстрее. Если сравнивать GT 740 с GTX 650, то они весьма близки — разница между их производительностью не превышает 8-10%.
Подведем итоги этого раздела статьи. Результаты синтетических тестов представленной летом видеокарты Nvidia Geforce GT 740, а также результаты других моделей видеокарт обоих производителей дискретных видеочипов показали, что рассматриваемой плате будет весьма непросто конкурировать на рынке с главным соперником по цене в лице Radeon R7 250X. Видеокарта AMD почти всегда показывает более высокие результаты в «синтетике», кроме некоторых геометрических тестов, и это очень нехороший знак для Geforce GT 740.
Учитывая, что в реальных игровых приложениях нагрузка на геометрические блоки никогда не бывает такой, как в тестах, можно сделать вывод о том, что Radeon R7 250X почти всегда должен быть победителем в сражении с Geforce GT 740 и в игровых тестах. Увы, но свежая бюджетная модель Nvidia основана на уже изрядно устаревшем графическом процессоре архитектуры Kepler и серьезно уступает сопернику по скорости, имея при этом еще и явно завышенную цену.
Было бы совсем другое дело, если бы подобная плата использовала видеочип GM107, пусть и урезанный по своим возможностям. Тогда он мог бы стать отличным выбором по многим параметрам и выгодным предложением в целом. Но увы, при близкой с Radeon R7 250X цене шансов на успех у такой «новинки» не слишком много. Впрочем, чтобы сделать окончательные выводы, давайте узнаем реальную производительность новинки в играх в следующей части нашего материала, оценив заодно и оправданность ее розничной цены уже с учетом скорости в игровых приложениях.
Средняя текущая цена (количество предложений) в московской рознице: | |
---|---|
Рассматриваемые карты | Конкуренты |
GT 740 GDDR5 — $82 (на 01.06.16) | R7 250 — $83 (на 01.06.16) |
GT 740 GDDR5 — $82 (на 01.06.16) | R7 250X — $94 (на 01.06.16) |
GT 740 GDDR5 — $82 (на 01.06.16) | GTX 650 — $95 (на 01.05.16) |
GT 740 GDDR5 — $82 (на 01.06.16) | GT 640 GDDR5 — $92(1) |
Palit GT 740 — $104(4), | GT 740 GDDR5 — $82 (на 01.06.16) |
Предложения Palit GT 740 | |
2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair | Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair | Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair | Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair |
Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт | Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией Asustek | Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI | Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate |
Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia | 2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair | Монитор Asus ProArt PA249Q для рабочего компьютера предоставлен компанией Asustek |