Дорогие читатели! Редакция сайта iXBT.com обращается к вам с просьбой отключить блокировку рекламы на нашем сайте.
Дорогие читатели,
Редакция сайта iXBT.com обращается к вам с просьбой отключить блокировку рекламы на нашем сайте.
Дело в том, что деньги, которые мы получаем от показа рекламных баннеров, позволяют нам писать статьи и новости, проводить тестирования, разрабатывать методики, закупать специализированное оборудование и поддерживать в рабочем состоянии серверы,
чтобы форум и другие проекты работали быстро и без сбоев.
Мы никогда не размещали навязчивую рекламу и не просили вас кликать по баннерам.
Вашей посильной помощью сайту может быть отсутствие блокировки рекламы.
Частота работы памяти (физическая (эффективная)), МГц
2000 (8000)
2000 (8000)
Ширина шины обмена с памятью, бит
256
Число вычислительных блоков в GPU
36
Число операций (ALU) в блоке
64
Суммарное количество блоков ALU
2304
Число блоков текстурирования (BLF/TLF/ANIS)
144
Число блоков растеризации (ROP)
32
Размеры, мм
220×100×35
220×100×35
Количество слотов в системном блоке, занимаемые видеокартой
2
2
Цвет текстолита
черный
черный
Энергопотребление
Пиковое в 3D, Вт
152
152
В режиме 2D, Вт
22
22
В режиме «сна», Вт
3
3
Уровень шума
В режиме 2D, дБА
22,5
22,5
В режиме 2D (просмотр видео), дБА
22,5
22,5
В режиме максимального 3D, дБА
45,5
45,5
Выходные гнезда
1×HDMI 2.0b, 3×DisplayPort 1.3/1.4
1×HDMI 2.0b, 3×DisplayPort 1.3/1.4
Поддержка многопроцессорной работы
CrossFire
Максимальное количество приемников/мониторов для одновременного вывода изображения
4
4
Дополнительное питание: количество 8-контактных разъемов
Нет
Нет
Дополнительное питание: количество 6-контактных разъемов
1
1
Максимальное разрешение 2D
Display Port
4096×2160
HDMI
4096×2160
Максимальное разрешение 3D
Display Port
4096×2160
HDMI
4096×2160
Комплектация локальной памятью
Карта имеет 8 ГБ памяти GDDR5 SDRAM,
размещенной в 8 микросхемах по 8 Гбит на лицевой сторонe PCB.
Микросхемы памяти Samsung (GDDR5).
Микросхемы расчитаны на номинальную частоту работы в 2000 (8000) МГц.
Сравнение с эталонным дизайном (reference)
Вид спереди
AMD Radeon RX 480 8 ГБ 256-битной GDDR5 PCI-E
Reference card AMD Radeon R9 380X
Вид сзади
AMD Radeon RX 480 8 ГБ 256-битной GDDR5 PCI-E
Reference card AMD Radeon R9 380X
RX 480 (судя по номеру) выступает преемником R9 380X, обе карты имеют одинаковую шину обмена с памятью 256 бит, поэтому мы сравниваем именно эти карты. Очевидно, что
из-за шины печатные платы весьма похожи, правда несколько изменено расположение микросхем памяти в силу наличия более емких микросхем у RX 480, которые имеют иные геометрические формы.
Системы питания также отличаются. У RX 480 cхема питания получила 5+1 фазу, управляется цифровым контроллером IOR 35678 компании Infineon.
На момент написания материала разгон ускорителя был возможен только через фирменную панель управления AMD Crimson Edition. Мы займемся этим вопросом при рассмотрении серийных видеокарт
партнеров AMD.
Система охлаждения
Референсная СО AMD имеет закрытую форму с цилиндрическим вентилятором на конце. Радиатор, прижимающийся к ядру, выполнен из алюминиевого сплава и
имеет медное основание, прижимающееся к ядру. Тепловых медных трубок, помогающих равномерно распределять тепло по ребрам радиатора, нет. Поэтому данная СО выглядит несколько
упрощенной даже для ускорителя среднего уровня.
Микросхемы памяти и силовые транзисторы охлаждаются с помощью специальной пластины у кулера.
После 6-часового прогона под нагрузкой максимальная температура GPU достигла 88 градусов, что является удовлетворительным результатом для такого рода ускорителей. Подчеркну, что
измерение было проведено только через внешние устройства.
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder). К сожалению, на момент написания материала последняя версия утилиты не умела
распознавать термодатчики нового ядра Polaris, поэтому данные по температуре мы получили только с помощью наших внешних измерений.
Методика измерения шума
Помещение шумоизолировано и заглушено, снижены реверберации.
Системный блок, в котором исследовался шум видеокарт, не имеет вентиляторов, не является источником
механического шума.
Фоновый уровень 20 дБА — это уровень шума в комнате и уровень шумов собственно шумомера.
Измерения проводились на расстоянии 50 см от видеокарты на уровне системы охлаждения.
Режимы измерения:
Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов.
Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой
промежуточных кадров.
Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark.
В режиме простоя в 2D вентилятор работал на частоте 780 оборотов в минуту, при этом температура графического ядра не поднималась выше 34 градусов, а уровень шума был почти равен
фоновому и составлял 22,5 дБА.
При просмотре фильма с аппаратным декодированием температура графического ядра медленно вырастала до 52 градусов, вентилятор работал на той же частоте вращения 780 оборотов в минуту,
уровень шума не менялся.
В режиме максимальной нагрузки в 3D температура достигала уровня 75 °C, после чего частота вращения вентилятора начинала расти. Температура стабилизировалась на
уровне 88 градусов, при этом частота вращения поднималась до 2220 оборотов в минуту, шум вырастал до 42,5 дБА.
В результате мы смело можем говорить о шумной СО (при работе в 3D). Стоит напомнить, что референсные кулеры будут встречаться на практике только в первых партиях, пока партнеры AMD будут продавать
именно референсные карты, а не продукты собственного производства. Поэтому мы не учитываем характеристики штатной СО в выводах, так как мало кто из потребителей с ней столкнется.
Термоснимок
Хорошо видно, что наиболее нагрета область в районе преобразователей напряжения (даже нагрев GPU ниже).
Комплектация
Карта к нам попала c референс-комплектом (партнерская упаковка AMD без дополнений).
Упаковка
Установка и драйверы
Конфигурация тестового стенда
Компьютер на базе процессора Intel Core i7-5960X (Socket 2011):
процессор Intel Core i7-5960X (o/c 4 ГГц);
СО Intel Thermal Solution RTS2011LC;
системная плата ASRock Fatal1ty X99X Killer на чипсете Intel X99;
оперативная память 16 ГБ DDR4 G.Skill Ripjaws4 F4-2800C16Q-16GRK 2800 МГц;
жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
блок питания Thermaltake Toughpower DPS G 1050W (1050 Вт);
корпус Corsair Obsidian 800D Full Tower.
операционная система Windows 10 Pro 64-битная; DirectX 12;
монитор Samsung U28D590D (28″);
клавиатура Cougar 700K;
драйверы AMD версии Crimson Edition 16.6.2;
драйверы Nvidia версии 368.39;
VSync отключен.
Синтетические тесты
Используемые нами пакеты синтетических тестов можно скачать здесь:
D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org.
D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0, ссылка.
В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.
Синтетические тесты проводились на следующих видеокартах:
Radeon RX 480 со стандартными параметрами (сокращенно RX 480)
Radeon R9 390 со стандартными параметрами (сокращенно R9 390)
Radeon R9 380 со стандартными параметрами (сокращенно R9 380)
GeForce GTX 970 со стандартными параметрами (сокращенно GTX 970)
GeForce GTX 960 со стандартными параметрами (сокращенно GTX 960)
Выбор видеокарт для проведения анализа производительности новой модели Radeon RX 480 в синтетических тестах в этот раз был очень непростым, так как прямых конкурентов из стана Nvidia у новинки просто нет, да и не очень понятно, с какими моделями Radeon из предыдущего поколения ее сравнивать. В итоге, мы взяли близкую по теоретической производительности видеоплату Radeon R9 390, которая основана на графическом процессоре Hawaii, а также Radeon R9 380 — предшественницу новинки по позиционированию из линейки компании AMD.
Соответственно, и от конкурирующей компании Nvidia для нашего сравнения мы взяли две видеокарты, которые конкурируют именно с указанными выше моделями Radeon из предыдущего поколения. Младшая из видеоплат GeForce GTX 960 стоит заметно дешевле новинки на чипе Polaris и вряд ли составит ей достойную конкуренцию, а вот сравнение с GeForce GTX 970 в синтетических тестах может быть довольно интересным, так как и по теории и в играх они должны быть довольно близки по скорости (но не по цене).
От DirectX 9 тестов мы давно отказались, а во вторую версию RightMark3D вошли два ранее знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.
Эти тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.
Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.
Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.
В этом тесте производительность больше зависит от количества и эффективности блоков TMU, но на результат обычно влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются несколько ниже, чем при детализации «Low».
В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD в числе лидеров еще со времени выпуска первых видеочипов на базе архитектуры GCN. Платы Radeon до сих пор являются лучшими в этих сравнениях, что говорит о высокой эффективности выполнения ими этих программ, но конкретно Polaris немного сдал позиции. Вышедшая сегодня видеокарта Radeon RX 480 явно уступила предшествующему решению в виде Radeon R9 390, выступив примерно на уровне Radeon R9 380.
Однако и этого хватило, чтобы новая видеоплата компании AMD в первом нашем Direct3D 10 тесте чуть-чуть обошла модель GeForce GTX 970 — старшую из пары плат Nvidia, которые мы взяли для сегодняшнего сравнения. А младшая GeForce GTX 960 уступает вообще всем и очень серьезно, став аутсайдером этого теста. Посмотрим на результат в этой же задаче, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации что-то должно измениться, и ПСП с филлрейтом будут влиять меньше:
В усложненных условиях результаты теста традиционно получились куда интереснее. Новая видеокарта модели Radeon RX 480 уже заметно опережает аналогичную по позиционированию модель из прошлого поколения R9 380, и подбирается очень близко к старшей R9 390, особенно в самых сложных условиях, все же немного уступая последней. Преимущество перед конкурентами в виде GeForce GTX 970 и GTX 960 серьезно возросло, а младшая плата Nvidia так и вовсе уступила новинке более чем в два раза.
Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:
Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».
Диаграмма в целом очень похожа на предыдущую, также без учета суперсэмплинга, и в этом тесте новая модель видеокарты Radeon RX 480 оказалась примерно на уровне R9 380, уступив старшей R9 390 около 20-30%. Если же сравнивать новинку с конкурирующими с ней на данный момент времени видеокартами Nvidia, то и в этом тесте новинка выступает примерно на уровне GeForce GTX 970 и серьезно обгоняет младшую из GeForce. Посмотрим, что изменит включение суперсэмплинга:
При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга сказывается меньше, чем в предыдущем случае.
Эти условия сильно изменили соотношение сил в нашем сравнении. Графические решения AMD Radeon и в этом D3D10-тесте пиксельных шейдеров всегда работали эффективнее конкурирующих плат GeForce, и только самые новые модели GeForce GTX 1080 и GTX 1070, основанные на архитектуре Pascal, смогли наконец-то поспорить с ними. А вот платы предыдущего поколения ожидаемо отстают. Выпущенная сегодня модель семейства Radeon RX 400 показала результат на уровне Radeon R9 390, и они оказались быстрее всех остальных решений. GeForce GTX 970 уступила новинке до 27%, а GTX 960 привычно обосновалась на последнем месте.
Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.
Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.
Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, потому что на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП. В случае нашего теста Mineral, видеокарты показали не слишком показательные результаты, довольно далекие как от теории, так и от результатов в других тестах — похоже, что этот тест не полностью отражает реальность.
В этом тесте новая Radeon на чипе Polaris 10 снова оказалась лишь на уровне Radeon R9 380, проиграв и старшей плате компании Nvidia и старшей из Radeon на базе чипа Hawaii, причем довольно серьезно. Так что к этим результатам нужно отнестись с немалой долей скептицизма, ведь они явно странные. Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:
Во втором математическом тесте из нашего RigthMark соотношение между скоростью видеокарт относительно друг друга уже ближе к теории и другим тестам. В этот раз новая модель Radeon RX 480 уже куда ближе к Radeon R9 390 и GeForce GTX 970 — они хоть и устарели, но до сих пор весьма сильны в математических тестах. Если сравнивать результаты новой видеокарты на GPU архитектуры Polaris с остальными решениями, то она заметно опережает как Radeon R9 380, так и GeForce GTX 960, что примерно соответствует теоретическим параметрам.
Direct3D 10: тесты геометрических шейдеров
В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.
Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.
Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:
Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт довольно простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.
Разница между результатами видеокарт Nvidia и AMD почти всегда в пользу решений первой, что обусловлено отличиями в геометрических конвейерах чипов этих компаний. В тестах геометрии платы GeForce всегда были конкурентоспособнее Radeon, и в данном случае хорошо заметно, что старший видеочип Nvidia выигрывает у всех, имея большее количество блоков по обработке геометрии.
Но новая модель Radeon RX 480 имеет специальные оптимизации и показывает неплохой результат на уровне Radeon R9 380, и обе они слегка обошли Radeon R9 390. Интересно, что GeForce GTX 960 уступила вообще всем, а вторая плата Nvidia прошлого поколения в лице GTX 970 стала явным лидером в этом тесте — вот такая большая разница между чипами GP104 и GP106. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:
При изменении нагрузки в этом тесте цифры изменились не слишком сильно и для плат AMD и для решений Nvidia. Поэтому ничего особо не меняется. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и наши выводы остаются неизменными. Radeon RX 480 в этом подтесте показала результат на уровне других плат Radeon, явно обогнав только одну видеокарту — GeForce GTX 960. Старшая же модель конкурента GTX 970 снова впереди всех, и отставание новой Radeon от нее составляет до 25-30%.
К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD не работает. Этот тест давно перестал запускаться на платах этой компании, и ошибка не исправлена вот уже несколько лет.
Direct3D 10: скорость выборки текстур из вершинных шейдеров
В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.
Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:
Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, ограничивающая производительность, что хорошо заметно по результатам плат Nvidia, которые в простых режимах не сильно быстрее себя же в более тяжелом. Да и новая видеокарта компании AMD в этом тесте также показывает скорость явно ограниченную чем-то — этот тест не очень хорошо исполняется на многих видеокартах.
Лидером в этом тесте традиционно является уже довольно старая плата компании AMD на базе видеочипа Hawaii — в этот раз Radeon R9 390 оказалась сильнее всех плат Nvidia и AMD. Новинка в виде Radeon RX 480 уступила даже Radeon RX 380, обойдя разве что GeForce GTX 960 — не очень высокий результат. Скорее всего, скорость ограничена возможностями блоков ROP. Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, но с увеличенным количеством текстурных выборок:
Ситуация на диаграмме довольно сильно изменилась, решения компании AMD в тяжелых режимах потеряли значительно больше плат GeForce. Хотя в самом легком режиме Radeon R9 390 продолжает лидировать. Новая модель Radeon в сложных условиях показала скорость в среднем чуть выше, чем у Radeon R9 380, но старшей плате предыдущего поколения она все же уступает. Если сравнивать ее результаты с обеими GeForce, то она ожидаемо выиграла у младшей платы Nvidia во всех режимах, серьезно проиграв GeForce GTX 970, в свою очередь.
Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.
Результаты во втором тесте вершинного текстурирования «Waves» не очень похожи на то, что мы видели на предыдущих диаграммах, так как решения Nvidia сдали позиции. Скоростные показатели младшей GeForce в этом тесте уступают производительности всех остальных решений, а новая модель Radeon RX 480 показывает скорость на уровне старшей GeForce GTX 970. Впрочем, если сравнивать новинку с другими Radeon, то она почему-то уступила обеим моделям. Рассмотрим второй вариант этой же задачи:
С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, а видеокарты Nvidia пострадали даже несколько больше. Но в выводах мало что меняется, разве что рассматриваемая сегодня плата серии Radeon RX 400 теперь уже обогнала GeForce GTX 970, пусть и еле заметно. Понятно, что GTX 960 осталась далеко позади. Зато обе видеокарты из семейства Radeon R9 300 снова оказались в этот раз быстрее новинки. Неоднозначные результаты в этой серии тестов у платы на базе чипа Polaris получились, надо сказать.
3DMark Vantage: тесты Feature
Синтетические тесты из пакета 3DMark Vantage могут показать нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших. При анализе результатов видеокарты Radeon RX 480 в этом пакете мы наверняка сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.
Feature Test 1: Texture Fill
Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.
Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между Radeon RX 480 и Radeon R9 390 близка к теоретической, а R9 380 от новинки отстала довольно далеко, что также вполне ожидаемо и оправдано.
Что касается сравнения скорости текстурирования новой видеоплаты Radeon с давно присутствующими на рынке решениями конкурента, то RX 480 показала почти результат заметно выше, чем обе GeForce, да и в целом решения Nvidia выступили очень слабо, ведь даже GeForce GTX 970 смогла сравняться лишь с R9 380. Большое количество блоков текстурирования у решений AMD архитектуры GCN в этом тесте явно сказывается.
Feature Test 2: Color Fill
Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.
Цифры второго подтеста 3DMark Vantage показывают производительность блоков ROP, без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно производительность ROP. Очень интересно, что рассматриваемая нами сегодня плата Radeon RX 480 опередила не только своих предшественниц, но вообще стала лучшей в сравнении, несмотря на всего лишь 32 блока ROP — явно сработали какие-то оптимизации, появившиеся именно в четвертом поколении GCN.
Если сравнивать скорость заполнения сцены новой видеокартой компании AMD с результатами ускорителей GeForce в этом тесте, то рассматриваемая нами плата показала скорость заполнения сцены на 20% быстрее по сравнению с GeForce GTX 970, и еще больше опередила более слабую модель GTX 960. Так что в сравнении видеокарт AMD и Nvidia сейчас важно не только само по себе большое количество блоков ROP, но и эффективность оптимизаций по сжатию данных.
Feature Test 3: Parallax Occlusion Mapping
Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.
Этот тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.
В данном случае важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage первая плата Radeon на базе архитектуры Polaris показала отличный результат, чуть-чуть опередив даже более дорогую модель предыдущего поколения Radeon R9 390. Младшая же модель прошлого поколения оказалась заметно медленнее их обеих, как и должно быть по теории. Конкурирующая GeForce GTX 970 в этом тесте показала неплохой результат, но все же уступила новинке Radeon RX 48 порядка 20%. Не говоря уже о GTX 960, традиционно завоевавшей последнее место.
Feature Test 4: GPU Cloth
Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.
Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны проявляться, но увы — в очередной раз отмечаем странные результаты плат GeForce. В этом тесте новая видеокарта компании AMD впервые показала скорость заметно выше, чем даже Radeon R9 390 — явно сказываются оптимизации геометрического конвейера, о которых мы писали в первой части.
Несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности у чипов AMD, по сравнению с конкурирующими решениями, платы Radeon в этом тесте работают весьма эффективно, обгоняя абсолютно все видеокарты GeForce, представленные в сравнении. Вышедшая сегодня плата Radeon RX 480 обогнала в этом тесте GTX 970 на 60%, в GTX 960 отстала от нее более чем вдвое!
Feature Test 5: GPU Particles
Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.
Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.
Во втором «геометрическом» тесте из 3DMark Vantage ситуация уже ближе к той, что мы видели скорее в чисто математических тестах. В этот раз новая видеокарта Radeon RX 480 показывает результат чуть выше прошлого решения на чипе Hawaii, заметно опережая Radeon R9 380. Новая плата компании AMD в этот раз очень близка по скорости к GeForce GTX 970, а отставание младшей модели GeForce получилось чуть ли не полуторакратным. Неплохой результат в обоих геометрических тестах для первенца архитектуры Polaris.
Feature Test 6: Perlin Noise
Последний feature-тест пакета Vantage является математически-интенсивным тестом для GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.
В пакет компании Futuremark включен математический тест, в котором производительность решений хоть и не полностью соответствует теории, но близка к тому, что должно быть, исходя из пиковых показателей. В данном математическом тесте, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, серьезно отличающееся от того, что мы получили в схожих тестах нашего тестового пакета.
Видно, что видеочипы компании AMD с архитектурой GCN справляются с подобными задачами лучше решений конкурента в случаях, когда выполняется интенсивная «математика». Только самые новые модели видеокарт компании Nvidia, основанные на архитектуре Pascal, тоже показали высокую скорость, но GTX 1060 пока еще не вышла, и именно Radeon RX 480 может похвастать лидерством в этом сравнении. Новинка обошла Radeon R9 390 хоть и немного, но все же это факт.
Если же сравнивать скорость нового решения с платами GeForce, то новая модель компании AMD из семейства Polaris в этом тесте на 20% быстрее GeForce GTX 970, а GTX 960 уступила ей слишком много. Так что по тестам из пакета 3DMark Vantage можно сделать такой вывод, что Radeon RX 480 в играх будет примерно на уровне Radeon R9 390 и GeForce GTX 970, или даже окажется чуть быстрее этой неразлучной парочки из предыдущих поколений.
***
По результатам синтетических тестов новой видеокарты AMD Radeon RX 480, основанной на новом графическом процессоре Polaris 10, а также результатам других моделей видеокарт обоих производителей видеочипов, можно сделать такой вывод, что вышедшая сегодня в продажу видеокарта может стать одним из самых выгодных приобретений и наиболее производительным решением на рынке в своем классе.
Новая видеокарта компании AMD показала очень хорошие результаты в наших синтетических тестах примерно на уровне куда более дорогих и сложных Radeon R9 390 и GeForce GTX 970 из предыдущих поколений, основанных на графических процессорах, произведенных еще по 28 нм техпроцессу. Во многих из тестов новинка даже опережает эти условно конкурирующие решения, и это впечатляет, учитывая ее рекомендованную цену. Хотя в некоторых тестах были и проигрыши, но на результаты в реальных играх они мало повлияют. Просто нужно помнить, что решения компании AMD традиционно отличаются более эффективным исполнением интенсивных вычислительных задач, а графические процессоры Nvidia отыгрываются в геометрических тестах с применением тесселяции.
Впрочем, по-хорошему первой плате семейства Polaris для полноценного сравнения в равных условиях нужен равный соперник, также использующий все преимущества нового FinFET-техпроцесса — вроде планирующейся к выходу видеокарты GeForce GTX 1060 компании Nvidia. Пока что мы мало что можем вам о ней рассказать, но она наверняка будет примерно аналогичной по производительности и цене, и должна выйти уже достаточно скоро, по слухам. Уверены, что сравнение Radeon RX 480 с GeForce GTX 1060 будет куда интереснее, чем оценка сегодняшней новинки на фоне устаревших решений прошлых поколений.
Думаем, что и в реальных игровых приложениях новая модель Radeon покажет в играх скорость на уровне Radeon R9 390 и GeForce GTX 970 или даже чуть выше их. В следующей части нашего материала мы как раз и рассмотрим производительность новинки по сравнению с конкурентами в реальных играх, протестировав GeForce GTX 1070 в наборе актуальных игровых приложений.
Частота работы памяти (физическая (эффективная)), МГц
2000 (8000)
2000 (8000)
Ширина шины обмена с памятью, бит
256
Число вычислительных блоков в GPU
36
Число операций (ALU) в блоке
64
Суммарное количество блоков ALU
2304
Число блоков текстурирования (BLF/TLF/ANIS)
144
Число блоков растеризации (ROP)
32
Размеры, мм
220×100×35
220×100×35
Количество слотов в системном блоке, занимаемые видеокартой
2
2
Цвет текстолита
черный
черный
Энергопотребление
Пиковое в 3D, Вт
152
152
В режиме 2D, Вт
22
22
В режиме «сна», Вт
3
3
Уровень шума
В режиме 2D, дБА
22,5
22,5
В режиме 2D (просмотр видео), дБА
22,5
22,5
В режиме максимального 3D, дБА
45,5
45,5
Выходные гнезда
1×HDMI 2.0b, 3×DisplayPort 1.3/1.4
1×HDMI 2.0b, 3×DisplayPort 1.3/1.4
Поддержка многопроцессорной работы
CrossFire
Максимальное количество приемников/мониторов для одновременного вывода изображения
4
4
Дополнительное питание: количество 8-контактных разъемов
Нет
Нет
Дополнительное питание: количество 6-контактных разъемов
1
1
Максимальное разрешение 2D
Display Port
4096×2160
HDMI
4096×2160
Максимальное разрешение 3D
Display Port
4096×2160
HDMI
4096×2160
Комплектация локальной памятью
Карта имеет 8 ГБ памяти GDDR5 SDRAM,
размещенной в 8 микросхемах по 8 Гбит на лицевой сторонe PCB.
Микросхемы памяти Samsung (GDDR5).
Микросхемы расчитаны на номинальную частоту работы в 2000 (8000) МГц.
Сравнение с эталонным дизайном (reference)
Вид спереди
AMD Radeon RX 480 8 ГБ 256-битной GDDR5 PCI-E
Reference card AMD Radeon R9 380X
Вид сзади
AMD Radeon RX 480 8 ГБ 256-битной GDDR5 PCI-E
Reference card AMD Radeon R9 380X
RX 480 (судя по номеру) выступает преемником R9 380X, обе карты имеют одинаковую шину обмена с памятью 256 бит, поэтому мы сравниваем именно эти карты. Очевидно, что
из-за шины печатные платы весьма похожи, правда несколько изменено расположение микросхем памяти в силу наличия более емких микросхем у RX 480, которые имеют иные геометрические формы.
Системы питания также отличаются. У RX 480 cхема питания получила 5+1 фазу, управляется цифровым контроллером IOR 35678 компании Infineon.
На момент написания материала разгон ускорителя был возможен только через фирменную панель управления AMD Crimson Edition. Мы займемся этим вопросом при рассмотрении серийных видеокарт
партнеров AMD.
Система охлаждения
Референсная СО AMD имеет закрытую форму с цилиндрическим вентилятором на конце. Радиатор, прижимающийся к ядру, выполнен из алюминиевого сплава и
имеет медное основание, прижимающееся к ядру. Тепловых медных трубок, помогающих равномерно распределять тепло по ребрам радиатора, нет. Поэтому данная СО выглядит несколько
упрощенной даже для ускорителя среднего уровня.
Микросхемы памяти и силовые транзисторы охлаждаются с помощью специальной пластины у кулера.
После 6-часового прогона под нагрузкой максимальная температура GPU достигла 88 градусов, что является удовлетворительным результатом для такого рода ускорителей. Подчеркну, что
измерение было проведено только через внешние устройства.
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder). К сожалению, на момент написания материала последняя версия утилиты не умела
распознавать термодатчики нового ядра Polaris, поэтому данные по температуре мы получили только с помощью наших внешних измерений.
Методика измерения шума
Помещение шумоизолировано и заглушено, снижены реверберации.
Системный блок, в котором исследовался шум видеокарт, не имеет вентиляторов, не является источником
механического шума.
Фоновый уровень 20 дБА — это уровень шума в комнате и уровень шумов собственно шумомера.
Измерения проводились на расстоянии 50 см от видеокарты на уровне системы охлаждения.
Режимы измерения:
Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов.
Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой
промежуточных кадров.
Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark.
В режиме простоя в 2D вентилятор работал на частоте 780 оборотов в минуту, при этом температура графического ядра не поднималась выше 34 градусов, а уровень шума был почти равен
фоновому и составлял 22,5 дБА.
При просмотре фильма с аппаратным декодированием температура графического ядра медленно вырастала до 52 градусов, вентилятор работал на той же частоте вращения 780 оборотов в минуту,
уровень шума не менялся.
В режиме максимальной нагрузки в 3D температура достигала уровня 75 °C, после чего частота вращения вентилятора начинала расти. Температура стабилизировалась на
уровне 88 градусов, при этом частота вращения поднималась до 2220 оборотов в минуту, шум вырастал до 42,5 дБА.
В результате мы смело можем говорить о шумной СО (при работе в 3D). Стоит напомнить, что референсные кулеры будут встречаться на практике только в первых партиях, пока партнеры AMD будут продавать
именно референсные карты, а не продукты собственного производства. Поэтому мы не учитываем характеристики штатной СО в выводах, так как мало кто из потребителей с ней столкнется.
Термоснимок
Хорошо видно, что наиболее нагрета область в районе преобразователей напряжения (даже нагрев GPU ниже).
Комплектация
Карта к нам попала c референс-комплектом (партнерская упаковка AMD без дополнений).
Упаковка
Установка и драйверы
Конфигурация тестового стенда
Компьютер на базе процессора Intel Core i7-5960X (Socket 2011):
процессор Intel Core i7-5960X (o/c 4 ГГц);
СО Intel Thermal Solution RTS2011LC;
системная плата ASRock Fatal1ty X99X Killer на чипсете Intel X99;
оперативная память 16 ГБ DDR4 G.Skill Ripjaws4 F4-2800C16Q-16GRK 2800 МГц;
жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
блок питания Thermaltake Toughpower DPS G 1050W (1050 Вт);
корпус Corsair Obsidian 800D Full Tower.
операционная система Windows 10 Pro 64-битная; DirectX 12;
монитор Samsung U28D590D (28″);
клавиатура Cougar 700K;
драйверы AMD версии Crimson Edition 16.6.2;
драйверы Nvidia версии 368.39;
VSync отключен.
Синтетические тесты
Используемые нами пакеты синтетических тестов можно скачать здесь:
D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org.
D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0, ссылка.
В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.
Синтетические тесты проводились на следующих видеокартах:
Radeon RX 480 со стандартными параметрами (сокращенно RX 480)
Radeon R9 390 со стандартными параметрами (сокращенно R9 390)
Radeon R9 380 со стандартными параметрами (сокращенно R9 380)
GeForce GTX 970 со стандартными параметрами (сокращенно GTX 970)
GeForce GTX 960 со стандартными параметрами (сокращенно GTX 960)
Выбор видеокарт для проведения анализа производительности новой модели Radeon RX 480 в синтетических тестах в этот раз был очень непростым, так как прямых конкурентов из стана Nvidia у новинки просто нет, да и не очень понятно, с какими моделями Radeon из предыдущего поколения ее сравнивать. В итоге, мы взяли близкую по теоретической производительности видеоплату Radeon R9 390, которая основана на графическом процессоре Hawaii, а также Radeon R9 380 — предшественницу новинки по позиционированию из линейки компании AMD.
Соответственно, и от конкурирующей компании Nvidia для нашего сравнения мы взяли две видеокарты, которые конкурируют именно с указанными выше моделями Radeon из предыдущего поколения. Младшая из видеоплат GeForce GTX 960 стоит заметно дешевле новинки на чипе Polaris и вряд ли составит ей достойную конкуренцию, а вот сравнение с GeForce GTX 970 в синтетических тестах может быть довольно интересным, так как и по теории и в играх они должны быть довольно близки по скорости (но не по цене).
От DirectX 9 тестов мы давно отказались, а во вторую версию RightMark3D вошли два ранее знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.
Эти тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.
Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.
Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.
В этом тесте производительность больше зависит от количества и эффективности блоков TMU, но на результат обычно влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются несколько ниже, чем при детализации «Low».
В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD в числе лидеров еще со времени выпуска первых видеочипов на базе архитектуры GCN. Платы Radeon до сих пор являются лучшими в этих сравнениях, что говорит о высокой эффективности выполнения ими этих программ, но конкретно Polaris немного сдал позиции. Вышедшая сегодня видеокарта Radeon RX 480 явно уступила предшествующему решению в виде Radeon R9 390, выступив примерно на уровне Radeon R9 380.
Однако и этого хватило, чтобы новая видеоплата компании AMD в первом нашем Direct3D 10 тесте чуть-чуть обошла модель GeForce GTX 970 — старшую из пары плат Nvidia, которые мы взяли для сегодняшнего сравнения. А младшая GeForce GTX 960 уступает вообще всем и очень серьезно, став аутсайдером этого теста. Посмотрим на результат в этой же задаче, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации что-то должно измениться, и ПСП с филлрейтом будут влиять меньше:
В усложненных условиях результаты теста традиционно получились куда интереснее. Новая видеокарта модели Radeon RX 480 уже заметно опережает аналогичную по позиционированию модель из прошлого поколения R9 380, и подбирается очень близко к старшей R9 390, особенно в самых сложных условиях, все же немного уступая последней. Преимущество перед конкурентами в виде GeForce GTX 970 и GTX 960 серьезно возросло, а младшая плата Nvidia так и вовсе уступила новинке более чем в два раза.
Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:
Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».
Диаграмма в целом очень похожа на предыдущую, также без учета суперсэмплинга, и в этом тесте новая модель видеокарты Radeon RX 480 оказалась примерно на уровне R9 380, уступив старшей R9 390 около 20-30%. Если же сравнивать новинку с конкурирующими с ней на данный момент времени видеокартами Nvidia, то и в этом тесте новинка выступает примерно на уровне GeForce GTX 970 и серьезно обгоняет младшую из GeForce. Посмотрим, что изменит включение суперсэмплинга:
При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга сказывается меньше, чем в предыдущем случае.
Эти условия сильно изменили соотношение сил в нашем сравнении. Графические решения AMD Radeon и в этом D3D10-тесте пиксельных шейдеров всегда работали эффективнее конкурирующих плат GeForce, и только самые новые модели GeForce GTX 1080 и GTX 1070, основанные на архитектуре Pascal, смогли наконец-то поспорить с ними. А вот платы предыдущего поколения ожидаемо отстают. Выпущенная сегодня модель семейства Radeon RX 400 показала результат на уровне Radeon R9 390, и они оказались быстрее всех остальных решений. GeForce GTX 970 уступила новинке до 27%, а GTX 960 привычно обосновалась на последнем месте.
Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.
Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.
Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, потому что на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП. В случае нашего теста Mineral, видеокарты показали не слишком показательные результаты, довольно далекие как от теории, так и от результатов в других тестах — похоже, что этот тест не полностью отражает реальность.
В этом тесте новая Radeon на чипе Polaris 10 снова оказалась лишь на уровне Radeon R9 380, проиграв и старшей плате компании Nvidia и старшей из Radeon на базе чипа Hawaii, причем довольно серьезно. Так что к этим результатам нужно отнестись с немалой долей скептицизма, ведь они явно странные. Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:
Во втором математическом тесте из нашего RigthMark соотношение между скоростью видеокарт относительно друг друга уже ближе к теории и другим тестам. В этот раз новая модель Radeon RX 480 уже куда ближе к Radeon R9 390 и GeForce GTX 970 — они хоть и устарели, но до сих пор весьма сильны в математических тестах. Если сравнивать результаты новой видеокарты на GPU архитектуры Polaris с остальными решениями, то она заметно опережает как Radeon R9 380, так и GeForce GTX 960, что примерно соответствует теоретическим параметрам.
Direct3D 10: тесты геометрических шейдеров
В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.
Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.
Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:
Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт довольно простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.
Разница между результатами видеокарт Nvidia и AMD почти всегда в пользу решений первой, что обусловлено отличиями в геометрических конвейерах чипов этих компаний. В тестах геометрии платы GeForce всегда были конкурентоспособнее Radeon, и в данном случае хорошо заметно, что старший видеочип Nvidia выигрывает у всех, имея большее количество блоков по обработке геометрии.
Но новая модель Radeon RX 480 имеет специальные оптимизации и показывает неплохой результат на уровне Radeon R9 380, и обе они слегка обошли Radeon R9 390. Интересно, что GeForce GTX 960 уступила вообще всем, а вторая плата Nvidia прошлого поколения в лице GTX 970 стала явным лидером в этом тесте — вот такая большая разница между чипами GP104 и GP106. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:
При изменении нагрузки в этом тесте цифры изменились не слишком сильно и для плат AMD и для решений Nvidia. Поэтому ничего особо не меняется. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и наши выводы остаются неизменными. Radeon RX 480 в этом подтесте показала результат на уровне других плат Radeon, явно обогнав только одну видеокарту — GeForce GTX 960. Старшая же модель конкурента GTX 970 снова впереди всех, и отставание новой Radeon от нее составляет до 25-30%.
К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD не работает. Этот тест давно перестал запускаться на платах этой компании, и ошибка не исправлена вот уже несколько лет.
Direct3D 10: скорость выборки текстур из вершинных шейдеров
В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.
Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:
Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, ограничивающая производительность, что хорошо заметно по результатам плат Nvidia, которые в простых режимах не сильно быстрее себя же в более тяжелом. Да и новая видеокарта компании AMD в этом тесте также показывает скорость явно ограниченную чем-то — этот тест не очень хорошо исполняется на многих видеокартах.
Лидером в этом тесте традиционно является уже довольно старая плата компании AMD на базе видеочипа Hawaii — в этот раз Radeon R9 390 оказалась сильнее всех плат Nvidia и AMD. Новинка в виде Radeon RX 480 уступила даже Radeon RX 380, обойдя разве что GeForce GTX 960 — не очень высокий результат. Скорее всего, скорость ограничена возможностями блоков ROP. Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, но с увеличенным количеством текстурных выборок:
Ситуация на диаграмме довольно сильно изменилась, решения компании AMD в тяжелых режимах потеряли значительно больше плат GeForce. Хотя в самом легком режиме Radeon R9 390 продолжает лидировать. Новая модель Radeon в сложных условиях показала скорость в среднем чуть выше, чем у Radeon R9 380, но старшей плате предыдущего поколения она все же уступает. Если сравнивать ее результаты с обеими GeForce, то она ожидаемо выиграла у младшей платы Nvidia во всех режимах, серьезно проиграв GeForce GTX 970, в свою очередь.
Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.
Результаты во втором тесте вершинного текстурирования «Waves» не очень похожи на то, что мы видели на предыдущих диаграммах, так как решения Nvidia сдали позиции. Скоростные показатели младшей GeForce в этом тесте уступают производительности всех остальных решений, а новая модель Radeon RX 480 показывает скорость на уровне старшей GeForce GTX 970. Впрочем, если сравнивать новинку с другими Radeon, то она почему-то уступила обеим моделям. Рассмотрим второй вариант этой же задачи:
С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, а видеокарты Nvidia пострадали даже несколько больше. Но в выводах мало что меняется, разве что рассматриваемая сегодня плата серии Radeon RX 400 теперь уже обогнала GeForce GTX 970, пусть и еле заметно. Понятно, что GTX 960 осталась далеко позади. Зато обе видеокарты из семейства Radeon R9 300 снова оказались в этот раз быстрее новинки. Неоднозначные результаты в этой серии тестов у платы на базе чипа Polaris получились, надо сказать.
3DMark Vantage: тесты Feature
Синтетические тесты из пакета 3DMark Vantage могут показать нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших. При анализе результатов видеокарты Radeon RX 480 в этом пакете мы наверняка сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.
Feature Test 1: Texture Fill
Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.
Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между Radeon RX 480 и Radeon R9 390 близка к теоретической, а R9 380 от новинки отстала довольно далеко, что также вполне ожидаемо и оправдано.
Что касается сравнения скорости текстурирования новой видеоплаты Radeon с давно присутствующими на рынке решениями конкурента, то RX 480 показала почти результат заметно выше, чем обе GeForce, да и в целом решения Nvidia выступили очень слабо, ведь даже GeForce GTX 970 смогла сравняться лишь с R9 380. Большое количество блоков текстурирования у решений AMD архитектуры GCN в этом тесте явно сказывается.
Feature Test 2: Color Fill
Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.
Цифры второго подтеста 3DMark Vantage показывают производительность блоков ROP, без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно производительность ROP. Очень интересно, что рассматриваемая нами сегодня плата Radeon RX 480 опередила не только своих предшественниц, но вообще стала лучшей в сравнении, несмотря на всего лишь 32 блока ROP — явно сработали какие-то оптимизации, появившиеся именно в четвертом поколении GCN.
Если сравнивать скорость заполнения сцены новой видеокартой компании AMD с результатами ускорителей GeForce в этом тесте, то рассматриваемая нами плата показала скорость заполнения сцены на 20% быстрее по сравнению с GeForce GTX 970, и еще больше опередила более слабую модель GTX 960. Так что в сравнении видеокарт AMD и Nvidia сейчас важно не только само по себе большое количество блоков ROP, но и эффективность оптимизаций по сжатию данных.
Feature Test 3: Parallax Occlusion Mapping
Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.
Этот тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.
В данном случае важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage первая плата Radeon на базе архитектуры Polaris показала отличный результат, чуть-чуть опередив даже более дорогую модель предыдущего поколения Radeon R9 390. Младшая же модель прошлого поколения оказалась заметно медленнее их обеих, как и должно быть по теории. Конкурирующая GeForce GTX 970 в этом тесте показала неплохой результат, но все же уступила новинке Radeon RX 48 порядка 20%. Не говоря уже о GTX 960, традиционно завоевавшей последнее место.
Feature Test 4: GPU Cloth
Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.
Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны проявляться, но увы — в очередной раз отмечаем странные результаты плат GeForce. В этом тесте новая видеокарта компании AMD впервые показала скорость заметно выше, чем даже Radeon R9 390 — явно сказываются оптимизации геометрического конвейера, о которых мы писали в первой части.
Несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности у чипов AMD, по сравнению с конкурирующими решениями, платы Radeon в этом тесте работают весьма эффективно, обгоняя абсолютно все видеокарты GeForce, представленные в сравнении. Вышедшая сегодня плата Radeon RX 480 обогнала в этом тесте GTX 970 на 60%, в GTX 960 отстала от нее более чем вдвое!
Feature Test 5: GPU Particles
Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.
Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.
Во втором «геометрическом» тесте из 3DMark Vantage ситуация уже ближе к той, что мы видели скорее в чисто математических тестах. В этот раз новая видеокарта Radeon RX 480 показывает результат чуть выше прошлого решения на чипе Hawaii, заметно опережая Radeon R9 380. Новая плата компании AMD в этот раз очень близка по скорости к GeForce GTX 970, а отставание младшей модели GeForce получилось чуть ли не полуторакратным. Неплохой результат в обоих геометрических тестах для первенца архитектуры Polaris.
Feature Test 6: Perlin Noise
Последний feature-тест пакета Vantage является математически-интенсивным тестом для GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.
В пакет компании Futuremark включен математический тест, в котором производительность решений хоть и не полностью соответствует теории, но близка к тому, что должно быть, исходя из пиковых показателей. В данном математическом тесте, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, серьезно отличающееся от того, что мы получили в схожих тестах нашего тестового пакета.
Видно, что видеочипы компании AMD с архитектурой GCN справляются с подобными задачами лучше решений конкурента в случаях, когда выполняется интенсивная «математика». Только самые новые модели видеокарт компании Nvidia, основанные на архитектуре Pascal, тоже показали высокую скорость, но GTX 1060 пока еще не вышла, и именно Radeon RX 480 может похвастать лидерством в этом сравнении. Новинка обошла Radeon R9 390 хоть и немного, но все же это факт.
Если же сравнивать скорость нового решения с платами GeForce, то новая модель компании AMD из семейства Polaris в этом тесте на 20% быстрее GeForce GTX 970, а GTX 960 уступила ей слишком много. Так что по тестам из пакета 3DMark Vantage можно сделать такой вывод, что Radeon RX 480 в играх будет примерно на уровне Radeon R9 390 и GeForce GTX 970, или даже окажется чуть быстрее этой неразлучной парочки из предыдущих поколений.
***
По результатам синтетических тестов новой видеокарты AMD Radeon RX 480, основанной на новом графическом процессоре Polaris 10, а также результатам других моделей видеокарт обоих производителей видеочипов, можно сделать такой вывод, что вышедшая сегодня в продажу видеокарта может стать одним из самых выгодных приобретений и наиболее производительным решением на рынке в своем классе.
Новая видеокарта компании AMD показала очень хорошие результаты в наших синтетических тестах примерно на уровне куда более дорогих и сложных Radeon R9 390 и GeForce GTX 970 из предыдущих поколений, основанных на графических процессорах, произведенных еще по 28 нм техпроцессу. Во многих из тестов новинка даже опережает эти условно конкурирующие решения, и это впечатляет, учитывая ее рекомендованную цену. Хотя в некоторых тестах были и проигрыши, но на результаты в реальных играх они мало повлияют. Просто нужно помнить, что решения компании AMD традиционно отличаются более эффективным исполнением интенсивных вычислительных задач, а графические процессоры Nvidia отыгрываются в геометрических тестах с применением тесселяции.
Впрочем, по-хорошему первой плате семейства Polaris для полноценного сравнения в равных условиях нужен равный соперник, также использующий все преимущества нового FinFET-техпроцесса — вроде планирующейся к выходу видеокарты GeForce GTX 1060 компании Nvidia. Пока что мы мало что можем вам о ней рассказать, но она наверняка будет примерно аналогичной по производительности и цене, и должна выйти уже достаточно скоро, по слухам. Уверены, что сравнение Radeon RX 480 с GeForce GTX 1060 будет куда интереснее, чем оценка сегодняшней новинки на фоне устаревших решений прошлых поколений.
Думаем, что и в реальных игровых приложениях новая модель Radeon покажет в играх скорость на уровне Radeon R9 390 и GeForce GTX 970 или даже чуть выше их. В следующей части нашего материала мы как раз и рассмотрим производительность новинки по сравнению с конкурентами в реальных играх, протестировав GeForce GTX 1070 в наборе актуальных игровых приложений.