Содержание
- Часть 1 — Теория и архитектура
- Часть 2 — Практическое знакомство
- Часть 3 — Результаты игровых тестов (производительность)
В этой части мы изучим видеокарту, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала карта Powercolor.
Платa
Powercolor Radeon R9 270 2048 МБ 256-битной GDDR5 PCI-E | |
---|---|
Карта имеет 2048 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах (на лицевой стороне PCB). Микросхемы памяти Elpida (GDDR5). Микросхемы рассчитаны на номинальную частоту работы в 1500 (6000) МГц. |
Сравнение с эталонным дизайном, вид спереди | |
---|---|
Powercolor Radeon R9 270 2048 МБ 256-битной GDDR5 PCI-E | Reference card AMD Radeon R9 270X |
Сравнение с эталонным дизайном, вид сзади | |
---|---|
Powercolor Radeon R9 270 2048 МБ 256-битной GDDR5 PCI-E | Reference card AMD Radeon R9 270X |
Несмотря на то, что R9 270 архитектурно полностью повторяет 270Х, а разница лишь в частотах работы, именно этот фактор послужил причиной существенных различий в дизайне PCB у этих карт. Прежде всего, мы видим, что переделан блок питания, и если у R9 270Х имеется два разъема питания (как было у HD 7870), то у R9 270 — уже только один. Это означает выставление определенных пределов по энергопотреблению, что отразится на частотах работы R9 270. Логика понятна: если каждая карта R9 270 сможет разгоняться до уровня R9 270Х, то это негативно отразится на популярности последней.
Поэтому, несмотря на то, что у нас был продукт Powercolor, а не эталонная карта AMD, мы все же считаем, что такие ограничения в дизайн были внесены именно со стороны AMD. Как и снижение числа фаз в схеме питания с 5 до 4. То, что видеокарта все же имеет повышенную частоту ядра (955 МГц), мало о чем говорит: мы знаем, что у семейства Radeon (по опыту многих лет) только повышение частоты работы свыше 80 МГц может дать мало-мальски заметный прирост производительности, обычно требуется +100 МГц. А в данном случае +30 МГц — это максимум 1,7% прироста, что умещается в рамки погрешности измерений.
Ускоритель имеет следующий набор гнезд вывода: 1 DVI (совместим с выводом на HDMI и VGA) и по одному DisplayPort и HDMI (суммарно можно подключить 2 приемника с HDMI или с DVI при наличии соответствующих переходников). Напомним, что ускорители AMD достаточно давно обладают собственными звуковыми кодеками для вывода звука по HDMI.
Максимальные разрешения и частоты в 3D: 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI). Также декларирована поддержка разрешения 4К, однако работоспособность на такого рода мониторах нами еще не проверялась.
Что касается возможностей по ускорению декодирования видео — в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.
Карта требует дополнительного питания в виде одного 6-контактного разъема.
О системе охлаждения.
Мы провели исследование температурного режима с помощью новой версии 4.2.1 утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.
Powercolor Radeon R9 270 2048 МБ 256-битной GDDR5 PCI-E | |
---|---|
После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 70 градусов, что для такого рода ускорителей очень хороший результат.
Комплектация. Референс-карта прибыла к нам в ОЕМ-упаковке, поэтому комплекта нет.
Установка и драйверы
Конфигурация тестового стенда:
- Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
- 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
- СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
- СО Intel Thermal Solution RTS2011LC;
- системная плата Asus Sabertooth X79 на чипсете Intel X79;
- системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
- оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
- жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
- жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
- 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
- 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
- корпус Corsair Obsidian 800D Full Tower.
- операционная система Windows 7 64-битная; DirectX 11;
- монитор Dell UltraSharp U3011 (30″);
- монитор Asus ProArt PA249Q (24″);
- драйверы AMD версии Catalyst 13.11beta9.4; Nvidia версии 331.82
VSync отключен.
Используемые нами пакеты синтетических тестов можно скачать здесь:
- D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org.
- D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0, ссылка.
- RightMark3D 2.0 с кратким описанием: под Vista без SP1, под Vista c SP1.
Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.
В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.
Синтетические тесты проводились на следующих видеокартах:
- Radeon R9 270 со стандартными параметрами (далее R9 270)
- Radeon R9 270X со стандартными параметрами (далее R9 270X)
- Radeon R7 260X со стандартными параметрами (далее R7 260X)
- Geforce GTX 660 со стандартными параметрами (далее GTX 660)
- Geforce GTX 650 Ti Boost со стандартными параметрами (далее GTX 650 Ti+)
Для анализа результатов новой видеокарты Radeon R9 270 были выбраны именно эти решения по следующим причинам. Radeon R7 260X является моделью компании из новой линейки, которая стоит в ней на ступень ниже рассматриваемой R9 270, и будет интересно оценить разницу в их производительности. А R9 270X основана на том же чипе Curacao и сравнение с ней интересно потому, что их характеристики и цена отличаются не слишком сильно — на 10-12%.
Из стана конкурирующей компании Nvidia для нашего сравнения были выбраны две видеоплаты, основанные на одинаковом графическом процессоре, но отличающиеся по производительности и цене. Geforce GTX 660 на время выхода Radeon R9 270 является ее ближайшим конкурентом по цене, так как продается лишь чуть дешевле, а менее производительная видеоплата с длинным названием Geforce GTX 650 Ti Boost имеет меньшую производительность и стоит еще дешевле.
Direct3D 9: тесты Pixel Shaders
Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся разве что в старых играх, очень простых для современных видеочипов.
С такими тестами все современные GPU справляются с легкостью, и скорость даже не самых мощных решений в них упирается в различные ограничители. Тесты не способны показать возможности современных видеочипов, и интересны лишь с точки зрения устаревших игровых приложений. Производительность современных видеокарт в них ограничена скоростью текстурирования или филлрейта, а видеокарты Nvidia так и вовсе давно перестали оптимизироваться для них.
Вышедшая недавно модель видеокарты AMD Radeon R9 270 в этом сравнении совсем немного уступает старшей модели Radeon R9 270X — около 8-12%, в зависимости от теста, как и должно быть по теории. Младшую модель в лице Radeon R7 260X новинка обходит во всех тестах, находясь явно ближе к R9 270X. Единственная плата Nvidia в этом сравнении уступает всем моделям Radeon, даже самой слабой R7 260X. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:
Тест Cook-Torrance вычислительно интенсивный, и скорость в нем больше зависит от количества ALU и их частоты, но также и от скорости TMU. Этот тест исторически лучше подходит для графических решений компании AMD, но новые платы Geforce на базе архитектуры Kepler в нем также показывают довольно сильные результаты, что мы и видим по неплохим показателям Geforce GTX 660.
Младшая плата из семейства Radeon R9 270 оказалась быстрее младшей в серии R7 260X, но медленнее модели R9 270X. И в тесте освещения, больше зависящем от скорости ALU, и в тесте Water, скорость в котором больше зависит от текстурирования, мы видим примерно одно и то же — по скорости текстурирования и математических расчетов две модели серии отличаются на 9%, что чуть меньше теоретической разницы в 12%.
Своего единственного конкурента из стана Nvidia новинка компании AMD обошла в одном из тестов — в тесте освещения, где важнее математическая производительность, по которой у плат AMD есть явное преимущество. Во втором тесте результаты Geforce GTX 660 и Radeon R9 270 получились почти равные.
Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0
Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:
- Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
- Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.
Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:
Это — универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура AMD GCN выступает значительно лучше графической архитектуры Nvidia Kepler.
В тесте «Frozen Glass» скорость больше зависит от математической производительности и в случае всех плат Geforce всегда есть непонятная преграда, из-за которой они проигрывают аналогичным по цене платам Radeon. Модель Radeon R9 270 оказывается примерно посередине между Radeon R7 260X и R9 270X и чуть ближе к старшей плате в этом тесте, что согласуется с теорией. Разница между 270 и 270X составляет 8% и обе они заметно быстрее единственной Geforce.
Во втором тесте «Parallax Mapping» новая видеокарта Radeon также показала производительность выше конкурента, отстав от старшей сестры на 11%, что почти полностью соответствует теории. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:
В этих условиях положение единственной видеоплаты Nvidia чуток улучшилось, так как она справляется с текстурными выборками несколько лучше конкурентов. Но Radeon R9 270 все равно остается впереди с приличным запасом в обоих тестах, особенно в Frozen Glass. Новинка на 5-9% медленнее чем R9 270X, что примерно соответствует теории. По сравнению с младшей моделью R7 260X новинка явно быстрее ее в обеих задачах.
Это были давно устаревшие задачи, с упором в текстурирование, чего почти не встречается в играх. Дальше мы рассмотрим результаты еще двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они более показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:
- Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
- Fur — процедурный шейдер, визуализирующий мех.
Эти тесты не ограничены производительностью только текстурных выборок или филлрейтом и скорость в них более всего зависит от эффективности исполнения сложного шейдерного кода. В самых тяжелых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в предыдущие годы были несколько сильнее, но архитектура GCN помогла видеокартам AMD вырваться вперед, особенно после тщательной доводки драйверов Catalyst.
И новинка компании AMD показывает в этих задачах весьма неплохой результат, прилично обойдя младшую модель из нового поколения на базе чипа Bonaire. Что касается сравнения с самой мощной видеокартой на базе Curacao, то новинка отстает от нее на 9%, что чуть меньше теоретических цифр разницы по математической производительности.
В сравнении с Nvidia Geforce GTX 660 все также очень неплохо. Решение AMD явно быстрее представительницы конкурента, хотя в тесте Fur плата Radeon R9 270 выиграла не так много, но в тесте продвинутого параллакс-маппинга разница по производительности между GTX 660 и R9 270 составляет более чем 50%.
Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)
Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.
Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.
Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.
Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.
Производительность в этом тесте зависит от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».
В задачах процедурной визуализации меха с большим количеством текстурных выборок, за пару поколений графических архитектур компания AMD сократила разницу с платами Nvidia, а с выпуском видеочипов на базе архитектуры GCN и вовсе вырвалась вперед, и теперь именно платы Radeon являются лидерами в этих сравнениях, что говорит о высокой эффективности выполнения ими данных программ.
Новая видеоплата Radeon R9 270 отстала только от старшей сестры R9 270X на 7-8%, обойдя остальные представленные решения. Преимущество над R7 260X существенное, новинка явно ближе к R9 270X, чем к младшему решению. Что касается сравнения новинки с двумя моделями конкурента, то для Nvidia все печально — даже самая слабая плата AMD опережает обе Geforce. Поэтому рассматривать пару R9 270 и GTX 660 нет смысла — модель компании AMD почти вдвое быстрее.
Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:
Ситуация снова похожа на ту, что мы видели на предыдущей диаграмме. Свежая модель Radeon R9 270 оказывается заметно быстрее младшей R7 260X и проигрывает R9 270X те же 8%, что чуть меньше теоретической разницы. Преимущество над прямым конкурентом в виде Geforce GTX 660 снова чуть ли не двукратное. Преимущество в подобных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.
Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:
Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».
Диаграмма снова похожа на предыдущую, также без включения SSAA, и в этот раз Radeon R9 270 опережает младшую модель Radeon R7 260X, а плате R9 270X новинка уступает лишь 7%. Так как видеокарты Nvidia в этом тесте снова справляются с работой заметно хуже конкурирующих решений AMD, то модели Geforce GTX 660 и GTX 650 Ti Boost в обновленном D3D10-варианте теста без суперсэмплинга снова показывают результат хуже, чем все представленные в сравнении Radeon. Посмотрим, что изменит включение суперсэмплинга:
Почти ничего не изменилось, хотя при включении суперсэмплинга и самозатенения задача получается еще более тяжелой и совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась совсем немного, а включение суперсэмплинга сказывается меньше, чем в предыдущем случае.
В очередной раз мы видим, что графические решения Radeon в наших D3D10-тестах пиксельных шейдеров работают более эффективно, по сравнению с конкурирующими Geforce, и младшая плата на чипе Curacao показывает весьма неплохую скорость, отставая от старшей Radeon R9 270X на те же 7-8% — то есть даже меньше, чем должна по теории. Естественно, что оба конкурента Nvidia остались далеко позади. Посмотрим, что получится в чисто вычислительных задачах.
Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)
Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.
Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.
Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, на них влияет и разная эффективность их использования в конкретных решениях и оптимизация драйверов. В случае теста Mineral, новая модель Radeon R9 270 отстает лишь от старшего решения R9 270X на 7%, что несколько меньше теоретической разницы по математической производительности между этими моделями.
Архитектуры AMD в таких тестах всегда имели значительное преимущество перед конкурирующими решениями Nvidia, но в архитектуре Kepler калифорнийской компании удалось увеличить число потоковых процессоров, и пиковая математическая производительность моделей Geforce, начиная с GTX 680, серьезно возросла. Но, в первом же математическом тесте видеокарты Geforce все еще продолжают уступать платам компании AMD, прямой конкурент модели R9 270 в лице Geforce GTX 660 отстает от нее на 26%.
Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:
Во втором математическом тесте мы видим иные результаты видеокарт относительно друг друга. Разница между Radeon R9 270X и новинкой R9 270 в этом тесте снова меньше теоретической — всего лишь 8%. Видимо, это объясняется работой PowerTune, когда GPU работает на частоте, которую ему позволяет текущее энергопотребление и температура чипа. Radeon R7 260X сильно отстал от новинки.
Как и оба ее конкурента по цене компании Nvidia. Даже более мощная Geforce GTX 660 не может противостоять новинке компании AMD, которая оказывается быстрее нее во втором математическом тесте уже на целых 40%! В общем, с тестами пиковой математической производительности все понятно — видеочипы Nvidia пока что все так же сильно отстают.
Direct3D 10: тесты геометрических шейдеров
В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.
Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.
Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:
Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии, а иногда — пропускной способностью памяти.
Отлично заметна разница между результатами видеокарт на чипах Nvidia и AMD, которая обусловлена отличиями в геометрических конвейерах чипов этих компаний. Если в предыдущих тестах с пиксельными шейдерами платы AMD были заметно эффективнее и быстрее, то первые же тесты геометрии показывают, что в таких задачах платы Nvidia оказываются производительнее.
Недавняя новинка Radeon R9 270 хоть и имеет некоторые оптимизации геометрического конвейера, но изрядно уступает сопернику. В случае сравнения плат AMD, хорошо видно, как слабая Radeon R7 260X сильно отстала от обеих R9 270(X). К слову, в сравнении R9 270 и R9 270X разница получилась еще меньше — лишь 6%.
У решений Nvidia с геометрической производительностью дела всегда были лучше, и поэтому они оказываются быстрее. Новая модель Radeon уступает в этом тесте и Geforce GTX 660 и GTX 650 Ti Boost. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:
При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD и для решений Nvidia. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и выводы остаются прежними. Новая модель Radeon R9 270 все так же заметно быстрее младшей модели Radeon R7 260X и отстает от R9 270X лишь на 6%, так что в выводах не изменилось вообще ничего.
К сожалению, но «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD, включая и Radeon R9 270, просто не работает. В какой-то момент очередное обновление драйверов Catalyst привело к тому, что данный тест просто перестал запускаться на платах этой компании.
Direct3D 10: скорость выборки текстур из вершинных шейдеров
В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.
Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:
Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, что особенно заметно в легком режиме. Результаты видеокарт Nvidia зачастую ограничены еще чем-то странным, и разница между скоростью рендеринга в разных режимах лишь подтверждает эту аномалию.
Самой быстрой в сравнении ожидаемо стала Radeon R9 270X, а сразу же за ней идет выпущенная недавно новая модель Radeon R9 270, которая отстает лишь на 5-7% от старшей сестры. Результаты новинки превосходят производительность обеих представленных в сравнении плат Nvidia, и GTX 660 и GTX 650 Ti Boost уступают новинке (в тяжелом режиме не так уж много, впрочем). Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:
Ситуация на диаграмме заметно изменилась — решения компании AMD в тяжелых режимах потеряли заметно больше, чем обе Geforce. И теперь в тяжелом режиме лидируют платы Nvidia. Новая видеоплата Radeon R9 270 отстает от старшей модели на те же 6-7%, что меньше теоретической разницы. Новинка уступает своей прямой сопернице Geforce GTX 660 в двух сложных режимах, опередив при этом ее в самом простом.
Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.
Результаты во втором тесте вершинного текстурирования «Waves» в целом схожи с теми, что мы видели на предыдущих диаграммах. По каким-то причинам показатели обеих плат Geforce в легких режимах остаются весьма заниженными и сравнимы лишь результатами Radeon R7 260X. Скорость же новой платы Radeon R9 270 в этом тесте очень неплохая, эта видеокарта оказалась медленнее старшей модели R9 270X снова лишь на 6-8%. Рассмотрим второй вариант этого же теста:
Во втором тесте текстурных выборок с усложнением задачи скорость всех решений стала ниже, и особенно серьезно пострадали видеокарты Geforce в легких режимах. Платы на чипах Nvidia во всех режимах могут конкурировать максимум с Radeon R7 260X, которая сильно отстает от старших моделей серии R9. Результаты у сегодняшней новинки R9 270 оказались заметно выше, ведь скорость текстурирования и блоков ROP у нее отличается в большую сторону. Разница между R9 270 и R9 270X получилась традиционная — до 8%.
3DMark Vantage: тесты Feature
Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты Radeon R9 270 в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark. Feature Test 1: Texture Fill
Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.
Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и сравнительные цифры моделей близки к соответствующим теоретическим параметрам. Младшая модель семейства Radeon R9 270 на 9% медленнее старшей R9 270X, что примерно соответствует теоретической разнице (12%) по скорости текстурирования. Новинка ощутимо быстрее младшей R7 260X из текущего же поколения.
Что касается сравнения скорости платы Radeon R9 270 с решениями конкурента, то новинка AMD по текстурной скорости обгоняет и Geforce GTX 660 и GTX 650 Ti Boost. В целом, все ожидаемо и более-менее соответствует теоретическим показателям, хотя по теории GTX 660 должна немного выигрывать у R9 270, а не наоборот. Впрочем, разница все равно невелика — лишь около 5%. Feature Test 2: Color Fill
Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.
В тесте производительности блоков ROP, результат у анонсированной недавно видеоплаты AMD получился почти таким же, что и у старшей модели Radeon R9 270X. Если в тесте измерялась бы именно пиковая скорость блоков ROP, то Radeon R9 270 должен был оказаться медленнее R9 270X примерно на 12%, но на деле цифры этого подтеста 3DMark Vantage показывают производительность блоков ROP с учетом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно пропускную способность, а не производительность ROP.
А по ПСП теоретической разницы между R9 270 и R9 270X просто нет, поэтому и их почти одинаковый результат в тесте легко объясним. Что касается сравнения скорости новинки с видеокартами Nvidia, то рассматриваемая модель AMD Radeon показала в этом тесте несколько меньшую скорость заполнения сцены, по сравнению со своим прямым конкурентом — Geforce GTX 660, обойдя лишь GTX 650 Ti Boost, которая стоит дешевле. Feature Test 3: Parallax Occlusion Mapping
Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.
Этот тест пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.
В данном случае, важны и математическая и текстурная производительность, поэтому в этой «синтетике» из 3DMark Vantage новая плата Radeon R9 270 отстает от более мощной модели того же семейства на 9%, но с приличным запасом обгоняет и плату младшего семейства в виде R7 260X и обе представленные в сравнении платы Nvidia, что соответствует теоретической разнице в вычислительной производительности.
Графические процессоры производства компании AMD являются более эффективными в этой конкретной задаче, и Geforce GTX 660 тут соперничает разве что с Radeon R7 260X, отставая от сегодняшнего героя более чем на треть. Feature Test 4: GPU Cloth
Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.
Скорость рендеринга в этом тесте по идее также должна зависеть сразу от нескольких параметров, но основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Но картина на диаграмме получилась несколько странная, видеокарты Radeon и Geforce упираются в какие-то пределы.
В любом случае, младшая модель семейства Radeon R9 270 показывает скорость лишь на 8% хуже, чем старшая в семействе R9 270X, но и плата R7 260X, основанная на менее сложном чипе от них отстала не слишком сильно, что подтверждает упор в производительность обработки геометрии по крайней мере для AMD.
Тем удивительнее то, что, несмотря на большее количество соответствующих исполнительных блоков и большую геометрическую производительность видеокарт Nvidia, по сравнению с конкурентом, и Geforce GTX 660 и GTX 650 Ti Boost явно уступили всем платам Radeon, что необъяснимо теорией. Feature Test 5: GPU Particles
Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.
Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.
Во втором геометрическом тесте из 3DMark Vantage ситуация серьезно изменилась, и в этот раз новая Radeon R9 270 уже лишь на 4% отстает от старшей сестры, но уже значительно производительнее младшей Radeon R7 260X. Вероятно, наблюдается упор не только в геометрическую производительность.
Если сравнивать скорость новинки AMD с конкурирующими платами Geforce, то новая модель AMD близка к своему прямому конкуренту в виде GTX 660, и все же слегка опережает менее дорогую GTX 650 Ti Boost. И это — неплохой результат, ведь ранее синтетические тесты имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, показывали, что платы Nvidia опережают конкурирующие модели AMD. Feature Test 6: Perlin Noise
Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчетов.
В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим почти такое же распределение результатов, по сравнению с двумя аналогичными тестами из нашего тестового пакета. В этом случае производительность решений не совсем соответствует теории, но близка к тому, что мы видели ранее в математических тестах из пакета RightMark 2.0.
Видеокарты Radeon компании AMD, созданные на базе чипов архитектуры GCN, очень хорошо справляются с подобными задачами и показывают лучшие результаты в случаях, когда выполняется интенсивная «математика». Даже видеоплата Radeon R7 260X в этом тесте показала отличный результат, опередив Geforce GTX 660, поэтому R9 270 тем более легко обошла обоих конкурентов. Недавно вышедшая на рынок видеокарта модели Radeon R9 270 показала производительность на 11% медленнее старшей модели R9 270X, что полностью соответствует теории.
Direct3D 11: Вычислительные шейдеры
Чтобы протестировать новое решение компании AMD в задачах, использующих такие свежие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.
Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.
Скорость расчетов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia давно почти одинаковая, хотя у видеокарт с GPU предыдущих архитектур были различия (любопытно, что у обеих плат серии R9 270 она также есть, хоть и небольшая). Судя по нашим предыдущим тестам, результаты в задаче явно зависят не только от математической мощи и эффективности вычислений, но и от других факторов, вроде пропускной способности памяти и производительности ROP.
В данном случае скорость видеокарт упирается в ПСП, это подтверждается тем, что новая плата компании AMD в этом тесте оказалась весьма близка к своей старшей сестре — лишь на 3% уступив ей. Также, новинка AMD опережает конкурирующую видеокарту Nvidia — главную соперницу в виде Geforce GTX 660, которая, впрочем, стоит чуть дешевле новинки.
Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.
В случае второго DX11-теста расклад сил между решениями разных компаний снова изменился. Решения Nvidia в подобных расчетных задачах весьма неплохо смотрятся, но и новые платы Radeon также прилично справляются с ними. Похоже, что в этом тесте упор не только в скорость исполнения простых математических вычислений, но и в эффективности выполнения сложного кода с ветвлениями.
В этом тесте победила мощнейшая из плат AMD, а следом за ней идет рассматриваемая сегодня Radeon R9 270. Разница между ними составила 8%, что близко к теоретическим 12% сразу по нескольким важным параметрам: скорости текстурирования, математических вычислений и производительности блоков ROP. Соперница Nvidia показала схожий результат в этом тесте, а разницей в 3% можно пренебречь.
Direct3D 11: Производительность тесселяции
Вычислительные шейдеры очень важны, но еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.
Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.
Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:
В тесте простого бампмаппинга скорость чаще всего упирается в ПСП, и результат новой видеокарты AMD подтверждает это — он весьма близок к скорости Radeon R9 270X и обе они далеко впереди модели R7 260X из младшего подсемейства. Единственная плата Geforce в этом подтесте оказалась быстрее лишь самой слабой из Radeon и она далеко позади сегодняшнего героя обзора.
Во втором подтесте с более сложными попиксельными расчетами все сложилось практически так же. Эффективность выполнения таких математических вычислений в пиксельных шейдерах у чипов архитектуры GCN выше, чем у Kepler. Поэтому плата Nvidia проиграла даже Radeon R7 260X в этот раз, не говоря о более мощных решениях. Radeon R9 270 оказался заметно быстрее конкурирующей платы и в этом подтесте, уступив менее 10% старшей модели, что очень близко к теории.
И в самом подтесте с тесселяцией новинка также показала неплохой результат. Модель R9 270 выступила лишь на 5% медленнее, чем R9 270X и заметно опередила своего прямого соперника в виде Geforce GTX 660. Это объясняется тем, что в этом тесте тесселяции разбиение треугольников умеренное и скорость в нем не упирается в производительность блоков обработки геометрии, и скорости обработки треугольников у платы компании AMD вполне хватает.
Вторым тестом производительности тесселяции будет еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.
В этом примере применяется уже куда более сложная геометрия (в сложных режимах), поэтому и сравнение геометрической мощи различных решений приносит совсем другие выводы. Все представленные в материале современные решения хорошо справляются с легкой и средней геометрической нагрузкой, показывая достаточно высокую скорость, но в тяжелых условиях графический процессоры Nvidia всегда намного производительнее.
Рассматриваемая сегодня модель Radeon R9 270 отстала от R9 270X на 7-9%, что соответствует разнице в тактовых частотах, и они обе опередили младшую модель в трех конфигурациях теста, кроме самой сложной. Если сравнивать с конкурирующей платой Nvidia, то R9 270 уступает Geforce GTX 660 только в сложных условиях, когда скорость всех Radeon сильно падает, а у платы Geforce остается достаточно высокой.
Рассмотрим результаты еще одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.
Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Впрочем, основной все равно остается именно нагрузка на блоки обработки геометрии.
Мы протестировали решения при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, видеокарты серии R9 270 компании AMD показывают достаточно высокие результаты, то уже в следующей ступени они уже не дотягиваются до уровня Geforce GTX 660. При увеличении геометрической работы единственная плата компании Nvidia вырывается вперед очень далеко, а производительность всех Radeon заметно снижается.
Видеокарты конкурента в этом тесте всегда очень быстры, и Geforce GTX 660 в самых сложных условиях чуть ли не вдвое производительнее новинки в лице Radeon R9 270. И все же новая плата AMD показывает неплохие результаты во всех режимах, отстав от старшей модели Radeon R9 270X всего лишь на 6-9% (еще большая разница видна при сопоставлении скорости новинки с R7 260X). И хотя для соперничества с видеокартой на чипе Nvidia этого мало, в играх геометрическая нагрузка всегда заметно ниже, и возможностей новой видеокарты там вполне хватит.
Результаты синтетических тестов младшей видеоплаты из серии AMD Radeon R9 270, а также результаты других моделей видеокарт производства обоих производителей дискретных видеочипов показали, что новая плата является лишь на 8-10% менее мощной видеокартой по сравнению с видеокартой Radeon R9 270X, которая стоит примерно настолько же дороже. Реальное отставание новой модели семейства от старшей оказалось совсем небольшим, и она может стать одним из самых выгодных предложений в соответствующем ценовом диапазоне.
Если сравнивать новинку с конкурентом в виде Geforce GTX 660, то в большинстве синтетических тестов она явно опережает плату Nvidia, кроме геометрических тестов и пары тестов с упором в филлрейт, разве что. Наш набор синтетических тестов показал, что по игровой производительности новая плата Radeon R9 270 должна весьма успешно соперничать с Geforce GTX 660 и в реальных приложениях. Будет интересно узнать реальную производительность новинки в играх в следующей части нашего материала, к которой мы сейчас и переходим.
AMD Radeon R9 270 — Часть 3: производительность в игровых тестах →
2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair | Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair | Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair | Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair |
Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт | Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией AsusTeK | Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI | Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate |
Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia | 2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair | Монитор Asus ProArt PA249Q для рабочего компьютера предоставлен компанией AsusTeK |