Содержание
- Часть 1 — Теория и архитектура
- Часть 2 — Практическое знакомство
- Часть 3 — Результаты игровых тестов (производительность)
В этой части мы изучим видеокарту, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала карта компании MSI.
Платы
MSI Radeon HD 7730 1024 МБ 128-битной GDDR5 PCI-E | |
---|---|
Карта имеет 1024 МБ памяти GDDR5 SDRAM, размещенной в 4 микросхемах (на лицевой стороне PCB). Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц. |
Сравнение с эталонным дизайном, вид спереди | |
---|---|
MSI Radeon HD 7730 1024 МБ 128-битной GDDR5 PCI-E | Reference card AMD Radeon HD 7750 |
Сравнение с эталонным дизайном, вид сзади | |
---|---|
MSI Radeon HD 7730 1024 МБ 128-битной GDDR5 PCI-E | Reference card AMD Radeon HD 7750 |
Как и ожидалось, эта карта полностью базируется на PCB от старшего собрата — Radeon HD 7750. Оно и понятно: зачем переделывать и так довольно дешевое решение?
Ускоритель имеет следующий набор гнезд вывода: 1 DVI (совместим с выводом на VGA и HDMI) и по одному DisplayPort и HDMI (суммарно можно подключить 2 приемника с HDMI). Напомним, что ускорители AMD достаточно давно обладают собственными звуковыми кодеками, поэтому передача на HDMI-монитор будет полноценной, со звуком.
Максимальные разрешения и частоты:
- 240 Гц — максимальная частота обновления;
- 2048×1536@85 Гц — по аналоговому интерфейсу;
- 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI).
Что касается возможностей по ускорению декодирования видео, в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.
Карта НЕ требует дополнительного питания.
О системе охлаждения.
Мы провели исследование температурного режима с помощью новой версии утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.
MSI Radeon HD 7730 1024 МБ 128-битной GDDR5 PCI-E | |
---|---|
После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 57 градусов. Отличный результат для ускорителя такого плана. Таким образом, СО действительно получилась очень эффективной.
Комплектация. Базовый комплект поставки должен включать в себя руководство пользователя и диск с драйверами и утилитами.
MSI Radeon HD 7730 1024 МБ 128-битной GDDR5 PCI-E | |
---|---|
Перед нами базовый комплект. |
Упаковка.
MSI Radeon HD 7730 1024 МБ 128-битной GDDR5 PCI-E | |
---|---|
Установка и драйверы
Конфигурация тестового стенда:
- Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
- 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
- СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
- СО Intel Thermal Solution RTS2011LC;
- системная плата Asus Sabertooth X79 на чипсете Intel X79;
- системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
- оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
- жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
- жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
- 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
- 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
- корпус Corsair Obsidian 800D Full-Tower.
- операционная система Windows 7 64-битная; DirectX 11;
- монитор Dell UltraSharp U3011 (30″);
- драйверы AMD версии Catalyst 13.6beta; Nvidia версии 326.19
VSync отключен.
Используемые нами пакеты синтетических тестов можно скачать здесь:
- D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org.
- D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0, ссылка.
- RightMark3D 2.0 с кратким описанием: под Vista без SP1, под Vista с SP1.
Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.
В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационной программы Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010).
Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.
Синтетические тесты проводились на следующих видеокартах:
- Radeon HD 7730 со стандартными параметрами (далее HD 7730)
- Radeon HD 7750 со стандартными параметрами (далее HD 7750)
- Radeon HD 6670 со стандартными параметрами и GDDR5-памятью (далее HD 6670)
- Geforce GTX 550 Ti со стандартными параметрами (далее GTX 550 Ti)
- Geforce GT 640 со стандартными параметрами (далее GT 640)
Для сравнения результатов новой модели видеокарты Radeon HD 7730 эти решения были выбраны по следующим причинам. Radeon HD 7750 является старшей моделью этого же семейства, которая основана на таком же GPU, но имеет другое количество активных блоков и частоту, поэтому будет интересно сопоставить их производительность. Radeon HD 6670 же нас интересует как видеокарта AMD предыдущего поколения, которую новинка заменяет на рынке.
От конкурирующей компании Nvidia нами были взяты две модели видеокарт, но лишь младшая из них является близким к Radeon HD 7730 соперником по цене и характеристикам — Geforce GT 640. Эти две модели будут главной парой сравнения, так как именно им и бороться за кошельки потребителей. А вот Geforce GTX 550 Ti — это более мощное и дорогое решение компании Nvidia, с которым будет интересно сравнить HD 7730 в некоторых из тестов чисто теоретически, ведь рассматриваемая новинка с этой моделью не конкурирует.
Direct3D 9: тесты Pixel Shaders
Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх, и она очень проста для современных видеочипов.
Тесты эти просты даже для современных видеокарт бюджетного уровня, и скорость многих решений в них упирается в различные ограничители. Они способны показать далеко не все возможности современных видеочипов, и интересны лишь с точки зрения устаревших игровых приложений. В случае набора из маломощных видеокарт, кое-какие выводы по результатам сделать можно.
Новая видеоплата AMD в этом сравнении показывает очень неплохой результат, если сравнивать с конкурирующей Geforce GT 640, во всех тестах опережая решение Nvidia. Отставание от HD 7750 обусловлено теоретической разницей в количестве активных исполнительных блоков, а вот выигрыш старой HD 6670 в некоторых из подтестов весьма любопытен и объясняется разницей в пиковой математической производительности, которая у «старичка» выше. Особенно хорошо это заметно по результатам теста освещения по Фонгу, в котором важна именно скорость обработки математики. Посмотрим на более сложные пиксельные программы промежуточных версий:
Тест Cook-Torrance более интенсивен вычислительно, и скорость в нём сильнее зависит от количества ALU и их частоты, но и от скорости TMU. Тест исторически лучше подходит для графических решений компании AMD, и хотя новые платы Geforce на базе архитектуры Kepler в нём показывают достаточно сильные результаты, но GT 640 так и отстаёт от всех Radeon в сравнении. Быстрейшей в этом тесте стала старая HD 6670, имеющая максимальную пиковую производительность ALU.
А вот во втором тесте новая видеоплата из линейки Radeon HD 7700 оказалась чуть-чуть медленнее своей соперницы GT 640, и здесь дело в меньшей скорости текстурирования. Большим количеством блоков ALU объясняется результат мощнейшей в сравнении Radeon HD 7750, а старая HD 6670 осталась в аутсайдерах.
Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0
Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:
- Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
- Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.
Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:
Это универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что и в этих конкретных задачах архитектура AMD обычно смотрится несколько лучше графической архитектуры Nvidia.
В тесте «Frozen Glass» скорость больше зависит от математической производительности и эффективности в конкретной задаче, поэтому Radeon HD 7730 уступила обеим Radeon, которые попали в сравнение, что легко объяснимо теорией. Зато новинка AMD оказалась значительно быстрее (почти вдвое!) платы Nvidia — GT 640 в этом подтесте показала очень слабую производительность и эффективность.
Да и во втором тесте «Parallax Mapping» видеокарта Nvidia не может ничем похвастать, уступая чуть ли не ещё больше. Любопытно, что выиграла этот поединок видеокарта прошлого поколения — Radeon HD 6670. Всё-таки сильно сказывается большое количество ALU и эффективность GPU компании AMD предыдущей архитектуры в этой конкретной задаче. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:
В условиях предпочтительности текстурных выборок, положение платы на графическом чипе производства Nvidia улучшилось, но совсем немного. Geforce GT 640 во всех подтестах всё так же остаётся слабейшей среди всех конкурирующих видеокарт в этих тестах. Рассматриваемая сегодня видеокарта Radeon в этих задачах работает весьма неплохо, в одном из тестов уступая только более дорогой и мощной модели. Ну а в тесте параллакс-маппинга сильнее всех снова старая модель — Radeon HD 6670.
Всё это были устаревшие задачи, с упором в текстурирование и филлрейт. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:
- Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
- Fur — процедурный шейдер, визуализирующий мех.
Эти тесты практически не ограничены производительностью текстурных выборок или филлрейтом и больше всего зависят от эффективности исполнения сложного шейдерного кода. В самых тяжёлых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в предыдущие годы были сильнее, но в последних архитектурах решения AMD сильно ускорились. Это отлично видно по сравнению результатов Radeon HD 6670 и HD 7730.
Новая модель компании AMD выступила в этих тестах ровно так, как и должна была. Другими словами, уступила старшей Radeon HD 7750 из-за меньшей теоретической производительности и обогнала плату предыдущего поколения, крайне неэффективную в этих тестах. По сравнению с Geforce GT 640 можно сказать, что плата Nvidia проиграла всё, что только можно, в тесте «Fur» скорость GT 640 не сильно превышает производительность Radeon HD 6670, а в тесте параллакс-маппинга она и вовсе стала худшей в сравнении — в который уже раз.
Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)
Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.
Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.
Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.
Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.
Производительность в этом тесте зависит от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает ещё и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раз ниже, чем при «Low».
В задачах процедурной визуализации меха с большим количеством текстурных выборок за пару поколений графической архитектуры компания AMD серьёзно улучшила показатели, не просто сократив разницу с платами Nvidia, но с выпуском GCN даже вырвавшись вперёд, что видно по сравнению плат HD 7730 и HD 6670. И сейчас именно платы Radeon являются лидерами таких сравнений, что говорит о высокой эффективности выполнения ими данных программ, что видно и по сегодняшнему сравнению.
Новинка в лице Radeon HD 7730 показывает результат, уступающий только старшей HD 7750. Аналогичная по цене плата GT 640 заметно ей уступает, разница почти двукратная. Даже более дорогая и мощная GTX 550 Ti проигрывает в этом тесте паре моделей конкурента текущего поколения — Radeon HD 7750 и HD 7730. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:
В целом всё похоже на то, что мы видели на предыдущей диаграмме, но старшая видеокарта Nvidia проигрывает соперникам от AMD ещё больше. Новинка Radeon HD 7730 всё так же впереди конкурентов и проигрывает только старшей модели. Явным аутсайдером является HD 6670, но и GT 640 недалеко от неё ушла, а там и GTX 550 Ti. Новые же платы AMD при включении суперсэмплинга, увеличивающего теоретическую нагрузку вчетверо, показали значительно большую производительность. Так что преимущество в подобных вычислениях явно у новых чипов компании AMD, предпочитающих попиксельные вычисления.
Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:
Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип ещё примерно в два раза — такой режим называется «High».
Диаграмма в целом похожа на предыдущую, также без включения SSAA, и снова мы видим то же взаимное расположение видеокарт. Плата AMD отстаёт только от старшей Radeon HD 7750, а их же решение предыдущего поколения оказывается почти на уровне GT 640, ставшей слабейшей в тесте. И даже Geforce GTX 550 Ti не смогла достать Radeon HD 7730, так как бюджетные платы Nvidia в этом тесте справляются с работой хуже конкурирующих. Новая же модель Radeon HD 7730 в обновленном D3D10-варианте теста без суперсэмплинга заметно опережает предшественницу и уступает лишь плате на том же GPU, но с большим количеством исполнительных блоков. Посмотрим, изменит ли что-либо включение суперсэмплинга.
Нет, снова получилось примерно то же самое, что и в «Fur» — при включении суперсэмплинга и самозатенения задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьёзное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, включение суперсэмплинга на Nvidia сказывается меньше, чем в предыдущем случае. Но больше всего потеряла старая Radeon HD 6670, оказавшись самой медленной.
Графические решения Nvidia в D3D10-тестах пиксельных шейдеров из нашего пакета работают заметно менее эффективно, поэтому героиня обзора — Radeon HD 7730 — в этой задаче опережает не только Geforce GT 640, но и GTX 550 Ti, которая стоит заметно дороже её. Похоже, что именно сложные пиксельные шейдеры являются слабым местом для бюджетных чипов Nvidia. Ну а Cape Verde даже висполнении LE весьма неплох.
Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)
Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.
Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.
Результаты наших предельных математических тестов примерно соответствуют разнице в частотах и количестве вычислительных блоков, но с влиянием разной эффективности их использования и с учётом разной оптимизации в драйверах. В случае теста Mineral новая модель Radeon уступила обеим сравниваемым моделям компании AMD, что и должно быть, исходя из теории.
Архитектура AMD в таких тестах имеет серьёзное преимущество перед конкурирующими видеокартами Geforce, и хотя в чипах семейства Kepler компания Nvidia увеличила число потоковых процессоров, и пиковая математическая производительность моделей Geforce значительно возросла, но это не позволило GT 640 догнать любую из представленных плат соперника. По результатам нашего первого математического теста мы видим, что рассматриваемая Radeon HD 7730 показала результат между скоростями конкурирующих видеокарт в лице Geforce GT 640 и GTX 550 Ti.
Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:
Во втором математическом тесте мы видим ровно такой же относительный результат. Если сравнивать Radeon HD 7730 и другие Radeon, то новинка стала слабейшей, как и в прошлом тесте. Это полностью соответствует теоретической разнице в скорости математических вычислений. Если же сравнивать недавно выпущенную модель платы Radeon с платами Geforce, то в данном случае она гораздо ближе к более дорогой GTX 550 Ti, чем к сравнимой по цене GT 640.
Direct3D 10: тесты геометрических шейдеров
В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.
Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.
Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:
Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии и пропускной способностью памяти.
Разница между результатами топовых видеокарт на чипах Nvidia и AMD в этом тесте обычно есть, и она обусловлена отличиями в организации геометрических конвейеров в GPU этих компаний. В случае же бюджетных видеочипов, современные модели обеих компаний сравнимы по скорости.
К примеру, рассматриваемая модель Radeon HD 7730 имеет оптимизированный геометрический конвейер и за счёт этого заметно опережает HD 6670 из предыдущего поколения. Старшей модели серии она уступает, но это и понятно. Обе Geforce имеют не слишком большое количество геометрических блоков по сравнению с топовыми чипами, поэтому новая плата AMD хоть и отстаёт от них, но не слишком сильно. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:
При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD, и для решений Nvidia. Видеокарты в первом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и все выводы остаются прежними. Новая модель Radeon всё так же немного отстаёт от GTX 550 Ti, а вот своему прямому конкуренту в виде GT 640 она стала проигрывать ещё чуть больше.
К сожалению, второй тест геометрических шейдеров «Hyperlight», демонстрирующий использование техник: instancing, stream output, buffer load и использующий динамическое создание геометрии при помощи отрисовки в буферы и stream output, на видеокартах AMD Radeon серии HD 7700 не работает вот уже который год. А ведь он предполагает большую нагрузку именно на геометрические шейдеры и был бы значительно интереснее для нашего исследования.
Direct3D 10: скорость выборки текстур из вершинных шейдеров
В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.
Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:
Предыдущие наши исследования показали, что на результаты этого теста может влиять и скорость текстурирования, и пропускная способность памяти (особенно в лёгком режиме), а результаты более-менее мощных видеокарт Nvidia иногда ограничены и ещё чем-то, что видно на примере GTX 550 Ti.
Результаты новой платы компании AMD на чипе Cape Verde LE ниже, чем у старшей модели, что можно объяснить меньшей математической производительностью, которая, однако, не помогает HD 6670, уступившей обеим платам Radeon, основанным на современном GPU. Что касается сравнения с Geforce, то новинка немного уступает только старшей модели GTX 550 Ti, которая не является прямым конкурентом и продаётся заметно дороже. Сравнение с GT 640 получилось для платы Nvidia печальным. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:
Взаимное расположение карт на диаграмме заметно изменилось — сравнительные результаты решений компании AMD ухудшились, особенно в тяжёлых режимах — и теперь новая Radeon хоть и опережает своего конкурента в виде GT 640, но это уже совсем не двукратная разница. Radeon HD 7730 во всех режимах сильно проиграла старшей модели HD 7750, что объясняется ухудшением оптимизации кода в свежих драйверах AMD. Ну хоть Radeon HD 6670 слегка опередить удалось.
Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.
Результаты во втором тесте вершинного текстурирования «Waves» совсем не похожи на те, что мы видели на предыдущих диаграммах. Налицо огромная разница между «кучками» HD 7700 с GTX 550 Ti и HD 6670 с GT 640. Вторые серьёзно уступают первым во всех режимах. Новинка Radeon HD 7730 оказалась весьма близко к HD 7750 и серьёзно обогнала как HD 6670, так и GT 640. Рассмотрим второй вариант этого же теста:
С усложнением задачи скорость всех решений снизилась, но больше всего это сказалось на платах Geforce. Во всех режимах этого теста новая Radeon показала скорость на уровне своей старшей сестры в виде Radeon HD 7750, а все остальные платы обеспечили заметно меньшую производительность. Geforce GT 640 оказалась худшей в сравнении, а HD 6670 расположилась между двумя платами компании Nvidia.
3DMark Vantage: тесты Feature
Синтетические тесты из пакета 3DMark Vantage обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов видеокарты Radeon HD 7730 в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark. Feature Test 1: Texture Fill
Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.
Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока, и сравнительные цифры моделей близки к соответствующим теоретическим параметрам, хотя некоторое несовпадение наблюдается. Новая видеокарта из семейства Radeon HD 7700 идёт вровень с предшественницей из предыдущего поколения, что полностью соответствует теории, и проигрывает старшей HD 7750, как и должна.
Что касается сравнения производительности новинки HD 7730 с представленными в нашем сравнении решениями конкурента, то и тут всё соответствует теории — новинка компании AMD по текстурной скорости медленнее обеих плат Nvidia, которые, к слову, имеют равную теоретическую скорость текстурирования, но GT 640 сильно ограничивает пропускная способность памяти. Feature Test 2: Color Fill
Вторая задача — тест скорости заполнения. В нём используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.
Цифры из этого подтеста 3DMark Vantage показывают производительность блоков ROP с учётом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест иногда измеряет скорее пропускную способность памяти, а не производительность ROP. По второму показателю Radeon HD 7730 просто нечем похвастать, ведь количество блоков ROP у неё урезано вдвое, по сравнению с HD 7750.
Тем более удивителен проигрыш старой HD 6670 в тесте производительности блоков ROP, в котором по теории они должны быть примерно равны. Но новинка оказалась заметно медленнее всех остальных видеокарт в этом тесте. По сравнению с Geforce GT 640 видеоплата компании AMD проиграла почти вполовину. Правда, теоретические показатели скорости заполнения сцены у новинки ещё хуже. Feature Test 3: Parallax Occlusion Mapping
Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.
Третий тест отличается от проведённых нами ранее тем, что результаты в нём зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости тут важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.
В данном случае больше остальных важны математическая и текстурная производительность, и поэтому в синтетике из 3DMark Vantage видеокарты производства AMD довольно сильны. Так, новая плата Radeon HD 7730 оказалась быстрее не только своей предшественницы из предыдущей серии в виде HD 6670, но обогнала и GTX 550 Ti, не говоря уже о GT 640. Конкурент сегодняшней героини от Nvidia оказался в этом тесте очень слаб и серьёзно уступил в сражении. Feature Test 4: GPU Cloth
Четвёртый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.
Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, но основными факторами влияния является производительность обработки геометрии и эффективность выполнения геометрических шейдеров. И так как у бюджетных чипов Nvidia, имеющих распараллеленный геометрический конвейер, преимущество по количеству геометрических блоков весьма небольшое и на результаты сильнее влияют другие параметры, то все Radeon в этом тесте оказываются быстрее обеих Geforce.
В тесте симуляции ткани рассматриваемая сегодня модель Radeon HD 7730 немного отстала только от старшей HD 7750, что можно объяснить разницей в количестве блоков ALU (неудивительно, что последняя стала лучшей в сравнении). Плата AMD предыдущего поколения заметно отстала, а ещё хуже в этом тесте оказались обе платы Nvidia, показав очень низкий результат. Feature Test 5: GPU Particles
Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.
Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.
А вот во втором геометрическом тесте 3DMark Vantage влияние распараллеленного геометрического конвейера уже заметно. Но в основном по старшей модели Geforce GTX 550 Ti, которая попала в наше сравнение из теоретического интереса. Реальный конкурент для Radeon HD 7730 показывает даже чуть меньший результат, чем у новинки AMD. Рассматриваемая модель Radeon оказалась чуть быстрее и GT 640, и HD 6670.
В очередной раз при тестировании бюджетных графических процессоров в синтетических тестах имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, у нас получилось так, что платы AMD в них ничуть не уступают и даже оказываются впереди соответствующих по цене Geforce. Feature Test 6: Perlin Noise
Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчётов.
В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим заметно отличающееся распределение результатов, по сравнению с двумя аналогичными тестами из нашего тестового пакета. В этом случае производительность решений совсем не соответствует теории и расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.
Новая видеокарта Radeon от компании AMD, созданная на базе чипа архитектуры GCN, неплохо справляется с такими задачами и показывает отличные результаты в случаях, когда выполняется сравнительно простая, но весьма интенсивная математика. Однако предыдущая архитектура справилась с задачей ещё лучше, и Radeon HD 6670 оказалась лучшей в сравнении.
Рассматриваемая сегодня видеокарта модели HD 7730 уступила как старшему решению на этом же чипе, так и HD 6670. Зато она не слишком отстала от значительно более дорогой Geforce GTX 550 Ti и почти вдвое опередила своего главного конкурента в лице Geforce GT 640. Похоже, что с эффективностью младшей видеокарты Nvidia в этом тесте что-то явно не в порядке, так как по теории она не должна уступать сопернице. Вероятно, её «душит» очень малая пропускная способность памяти, которая более чем вдвое ниже, чем у HD 7730.
Direct3D 11: Вычислительные шейдеры
Чтобы протестировать Radeon HD 7730 в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.
Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.
Не самый удачный пример с вычислительными шейдерами, но разницу в производительности в конкретной задаче он показывает. Скорость расчётов в вычислительном и пиксельном шейдерах для всех плат примерно одинаковая, хотя у некоторых видеокарт с GPU предыдущих архитектур были различия. Судя по нашим предыдущим тестам, результаты в задаче зависят не только от математической мощи и эффективности вычислений, но и от других факторов, вроде ПСП и производительности ROP — что видно по отставанию HD 7730 от HD 7750.
Из-за вдвое урезанного количества блоков ROP рассматриваемая сегодня видеокарта компании AMD в этом тесте оказалась медленнее своих коллег, и даже HD 6670 она уступила. А вот что касается сравнения с единственной представленной в сравнении видеокартой Nvidia, новинка оказалась всё же несколько быстрее, чем Geforce GT 640.
Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.
Во втором тесте расклад получился совершенно иной, единственное решение Nvidia слегка подтянулось к Radeon в этой сложной расчётной задаче. В этом тесте совершенно логично побеждает мощнейшая Radeon HD 7750, но сразу следом за ней идёт рассматриваемая в данной статье видеоплата Radeon HD 7730, основанная на том же Cape Verde, но урезанном ещё сильнее. Новинка опередила и свою предшественницу из 6000-й серии. И хотя в этой задаче графические чипы Nvidia традиционно сильны, сама по себе Geforce GT 640 очень медленная, и поэтому Radeon HD 7730 в этом сравнении опередил её.
Direct3D 11: Производительность тесселяции
Вычислительные шейдеры очень важны, но ещё одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.
Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.
Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нём реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:
В тесте простого бампмаппинга платы чаще всего упираются в ПСП или производительность ROP, что не дало новой видеокарте AMD показать результат на уровне своих собратьев. Однако этого хватило для того, чтобы опередить Geforce GT 640. А лучшей в подтесте стала Radeon HD 7750, что объяснимо теоретически.
Второй подтест с более сложными попиксельными расчётами куда интереснее — в нём HD 7730 всё так же отстаёт от старшей модели, но уже опережает предшественницу, а значит, что скорость ограничена в основном эффективностью математики. Рассматриваемая Radeon HD 7730 снова обходит конкурента Nvidia, но GT 640 отстаёт от неё в этот раз не так уж и сильно.
А в самом интересном тесте с тесселяцией результат новинки снова позволил обойти решение Nvidia чуть ли не вдвое. Radeon HD 7730 обогнала GT 640 и немного опередила модель предыдущего поколения, уступив лишь старшей модели. Но в данном тесте тесселяции разбиение треугольников весьма умеренное,и скорость в нём не упирается в производительность блоков обработки геометрии.
Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.
В этом примере применяется более сложная геометрия, поэтому и сравнение геометрической мощи различных решений по этому тесту приносит другие выводы. Radeon HD 7730 в этом тесте показывает ожидаемый результат, немного отставая от старшей модели на том же Cape Verde и серьёзно опережая Radeon HD 6670. И по сравнению с конкурентом в виде Geforce GT 640 новинка весьма неплоха, в тяжёлых режимах оба решения идут примерно на одном уровне, а в лёгких плата AMD оказалась даже быстрее.
Рассмотрим результаты ещё одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.
Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии.
Мы протестировали эту программу при четырёх разных коэффициентах тесселяции (в данном случае настройка называется Dynamic Tessellation LOD). В этом тесте соотношение скоростей всех видеокарт очень похоже на то, что получилось и в предыдущем. Новая видеокарта компании AMD в этом сравнении показывает достойный результат слегка ниже уровня Radeon HD 7750 и явно обгоняет HD 6670.
При сравнении Radeon HD 7730 и Geforce GT 640 можно сказать, что при усложнении геометрической работы решение компании Nvidia вырывается немного вперёд, но в целом новинка на чипе Cape Verde LE отстала не так уж сильно. В лёгких режимах ей помогает сравнительно высокая пропускная способность памяти, а в сложных — оптимизации геометрического конвейера и драйверов, которые снижают реальную степень разбиения треугольников.
В общем, по результатам синтетических тестов новой модели видеокарты Radeon HD 7730 и результатам других моделей видеокарт производства обоих производителей дискретных видеочипов можно сказать, что представленное решение производства компании AMD является весьма выгодным обновлением бюджетной линейки, замещающим Radeon HD 6670 в нижнем ценовом диапазоне.
Сравнение Radeon HD 7730 с этой моделью прошлого поколения в синтетических тестах говорит о том, что новинка почти всегда оказывается быстрее устаревшей модели. Судя по результатам наших предельных тестов, превосходство новой модели в производительности есть и перед главным конкурентом от Nvidia в лице модели Geforce GT 640. Практически во всех синтетических тестах, когда скорость не была жёстко ограничена производительностью блоков ROP, новинка AMD оказывалась явно быстрее, иногда до двух раз. Итак, бюджетная модель Nvidia явно уступает сопернице по всем показателям, кроме скорости тесселяции разве что.
Видеокарта Radeon HD 7730 является отличным вариантом для тех пользователей, которые лишь изредка хотят поиграть в современные игры и не используют максимальные настройки качества. Зато новинка предлагает современную функциональность, стоит совсем дёшево и фактически не имеет конкурентов в исполнении Nvidia, близких по соотношению цены и производительности. Так что у компании AMD получилось весьма удачное решение, особенно с учётом цены новой видеокарты, производительность которой в играх мы проверим в следующей части статьи.
AMD Radeon HD 7730 — Часть 3: производительность в игровых тестах →
2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair | Корпус Corsair Obsidian 800D-Full Tower для тестового стенда предоставлен компанией Corsair | Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair | Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair |
Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт | Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией AsusTeK | Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI | Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate |
Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia | 2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair |