Содержание
- Часть 1 — Теория и архитектура
- Часть 2 — Практическое знакомство
- Часть 3 — Результаты игровых тестов и выводы
Справочные материалы
Данная часть знакомит читателей с особенностями видеокарты, а также с результатами синтетических тестов.
Видеообзор
Для начала предлагаем посмотреть наш видеообзор ускорителя AMD Radeon RX 580:
Теперь давайте взглянем на спецификации устройства.
Устройство(а)
Sapphire Nitro+ Radeon RX 580 8 ГБ 256-битной GDDR5 (SKU 11265-01, P/N 299-1E366-001SA) | |||
---|---|---|---|
Параметр | Значение | Номинальное значение (референс) | |
GPU | Radeon RX 580 (Polaris 20) | ||
Интерфейс | PCI Express x16 | ||
Частота работы GPU (ROPs), МГц | 1257—1411 | 1257—1340 | |
Частота работы памяти (физическая (эффективная)), МГц | 2000 (8000) | 2000 (8000) | |
Ширина шины обмена с памятью, бит | 256 | ||
Число вычислительных блоков в GPU | 36 | ||
Число операций (ALU) в блоке | 64 | ||
Суммарное количество блоков ALU | 2304 | ||
Число блоков текстурирования (BLF/TLF/ANIS) | 144 | ||
Число блоков растеризации (ROP) | 32 | ||
Размеры, мм | 260×125×43 | 220×100×35 | |
Количество слотов в системном блоке, занимаемые видеокартой | 3 | 2 | |
Цвет текстолита | черный | черный | |
Энергопотребление | Пиковое в 3D, Вт | 175 | 175 |
В режиме 2D, Вт | 22 | 22 | |
В режиме «сна», Вт | 3 | 3 | |
Уровень шума | В режиме 2D, дБА | 18,0 | 18,0 |
В режиме 2D (просмотр видео), дБА | 18,0 | 18,0 | |
В режиме максимального 3D, дБА | 22,0 | 25,5 | |
Выходные гнезда | 1×DVI (Dual-Link/HDMI), 2×HDMI 2.0b, 2×DisplayPort 1.3/1.4 | 1×HDMI 2.0b, 3×DisplayPort 1.3/1.4 | |
Поддержка многопроцессорной работы | CrossFire | ||
Максимальное количество приемников/мониторов для одновременного вывода изображения | 4 | 4 | |
Дополнительное питание: количество 8-контактных разъемов | 1 | 1 | |
Дополнительное питание: количество 6-контактных разъемов | 1 | 1 | |
Максимальное разрешение 2D | Display Port | 4096×2160 | |
HDMI | 4096×2160 | ||
Dual-Link DVI | 2560×1600 | ||
Single-Link DVI | 1920×1200 | ||
Максимальное разрешение 3D | Display Port | 4096×2160 | |
HDMI | 4096×2160 | ||
Dual-Link DVI | 2560×1600 | ||
Single-Link DVI | 1920×1200 |
Комплектация локальной памятью | |
---|---|
Карта имеет 8 ГБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах по 8 Гбит на лицевой стороне PCB. Микросхемы памяти Samsung (GDDR5) рассчитаны на номинальную частоту работы в 2000 (8000) МГц. |
Система питания получила 4 фазы для GPU и 2 фазы для памяти, управляется цифровым контроллером компании On Semiconductor. При изготовлении ускорителя использовался набор высококачественных дросселей Black Diamond 4. На карте имеется система Dual BIOS, позволяющая переключать версии BIOS для загрузки. В дальнейшем это будет использоваться в ОС-версиях карт для активации повышенных частот работы.
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder) |
---|
Методика измерения шума
- Помещение шумоизолировано и заглушено, снижены реверберации.
- Системный блок, в котором исследовался шум видеокарт, не имеет вентиляторов, не является источником механического шума.
- Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера.
- Измерения проводились на расстоянии 50 см от видеокарты на уровне системы охлаждения.
- Режимы измерения:
- Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов.
- Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров.
- Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark.
- Оценка градаций уровня шума выполняется по методике, описанной здесь:
- 28 дБА и менее: шум плохо различим уже на расстоянии одного метра от источника, даже при очень низком уровне фонового шума. Оценка: шум минимальный.
- от 29 до 34 дБА: шум различим уже с двух метров от источника, но не особо обращает на себя внимания. С таким уровнем шума вполне можно мириться даже при долговременной работе. Оценка: шум низкий.
- от 35 до 39 дБА: шум уверенно различается и заметно обращает на себя внимание, особенно в помещении с низким уровнем шума. Работать с таким уровнем шума можно, но спать будет затруднительно. Оценка: шум средний.
- 40 дБА и более: такой постоянный уровень шума уже начинает раздражать, от него быстро устаешь, появляется желание выйти из комнаты или выключить прибор. Оценка: шум высокий.
В режиме простоя вентиляторы не работали, температура графического ядра не поднималась выше 36 градусов, а уровень шума был равен фоновому и составлял 18,0 дБА.
При просмотре фильма с аппаратным декодированием температура графического ядра медленно вырастала до 46 градусов, вентиляторы по-прежнему не работали, уровень шума не изменялся.
В режиме максимальной нагрузки в 3D температура достигала уровня 75 °C, частота вращения вентиляторов поднималась до 1172 оборотов в минуту, шум вырастал до 22,0 дБА. В итоге шум СО под нагрузкой минимальный, кулер практически бесшумный.
Термоснимок
Максимальный нагрев 77 градусов — на печатной плате в вырезе на пластине с обратной стороны. На фотографии получилось меньше, так как снято с большего расстояния.
Комплектация | |
---|---|
Базовый комплект поставки должен включать в себя руководство пользователя, диск с драйверами и утилитами. Тестовый экземпляр попал к нам без комплекта. |
Синтетические тесты
Используемые нами пакеты синтетических тестов можно скачать здесь:
- D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org.
- D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0, ссылка.
- RightMark3D 2.0 с кратким описанием: под Vista без SP1, под Vista c SP1.
Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.
Синтетические тесты проводились на следующих видеокартах:
- Radeon RX 580 со стандартными параметрами (сокращенно RX 580)
- Radeon RX 480 со стандартными параметрами (сокращенно RX 480)
- Radeon R9 Fury X со стандартными параметрами (сокращенно R9 Fury X)
- GeForce GTX 1070 со стандартными параметрами (сокращенно GTX 1070)
- GeForce GTX 1060 со стандартными параметрами (сокращенно GTX 1060)
Для анализа производительности новой модели Radeon RX 580 в синтетических тестах мы в первую очередь взяли аналогичную ей по большинству характеристик модель Radeon RX 480 из предыдущего семейства. Эти видеокарты практически идентичны, за исключением повышенных частот GPU у более новой, и мы определим, что это дает на практике, учитывая не изменившуюся ПСП. Второй видеокартой от AMD мы взяли старшую Radeon R9 Fury X, которая основана на более мощном, хоть и уже довольно старом графическом процессоре Fiji — посмотрим, насколько новинка от нее отстает.
От конкурирующей компании Nvidia для нашего сравнения мы также взяли две видеокарты, одна из которых будет конкурировать именно с рассматриваемой сегодня моделью Radeon. Видеоплата GeForce GTX 1060 (модификация с 6 ГБ видеопамяти) является прямым рыночным соперником новинки, и сравнение с ней интереснее всех остальных. Ну а более дорогую GeForce GTX 1070 для синтетических тестов мы взяли исключительно потому, что решения AMD в некоторых задачах заметно опережают аналоги от Nvidia и подбираются близко к более мощным картам, вот мы и посмотрим, насколько близко.
Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)
Во вторую версию RightMark3D вошли два ранее знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.
Эти тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.
Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.
Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.
В этом тесте производительность больше зависит от количества и эффективности блоков TMU, но на результат обычно влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются несколько ниже, чем при детализации «Low».
В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD заняли лидирующие позиции еще со времен выпуска первых видеочипов на базе архитектуры GCN. Платы Radeon до сих пор являются лучшими в этих сравнениях, что говорит о высокой эффективности выполнения ими таких программ, но конкретно графические решения Polaris немного сдали позиции, как мы отмечали в прошлый раз. Анонсированная сегодня видеокарта Radeon RX 580 показала скорость, равную RX 480 (это говорит об упоре в ПСП), сильно отстав от более мощного решения в виде Radeon R9 Fury X.
Но и этого хватило, чтобы новинка от компании AMD в нашем первом тесте обошла модель GeForce GTX 1060 примерно на 20%. Да и старшая из пары плат Nvidia, которые мы взяли для сегодняшнего материала, ушла вперед совсем недалеко, они очень близки с картой на графическом процессоре Polaris 20. Посмотрим на результат в этой же задаче, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации что-то должно измениться, и ПСП с филлрейтом будут влиять меньше:
В усложненных условиях результаты теста традиционно получились чуть интереснее. Новая видеокарта модели Radeon RX 580 все так же показала идентичный Radeon RX 480 результат, и мы убеждаемся в том, что в данном тесте они скорее упираются в пропускную способность видеопамяти. Обе платы очень сильно отстают от старшей модели прошлого поколения R9 Fury X, а вот преимущество перед конкурентом в виде GeForce GTX 1060 даже немного выросло, младшая плата Nvidia уступила новинке до 25%. Правда, GTX 1070 в этот раз побыстрее, но она и заметно дороже.
Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:
Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».
Диаграмма в целом похожа на предыдущую, также без учета суперсэмплинга, и в этом тесте новая модель видеокарты Radeon RX 580 снова оказалась ровно на уровне RX 480, все так же уперевшись в ПСП. Старшая модель R9 Fury X где-то далеко впереди. Если же сравнивать новинку с конкурирующей с ней на данный момент времени видеокартой GeForce GTX 1060, то и в этом тесте новинка выступает на 17-19% быстрее, почти догоняя старшую из пары GeForce. Посмотрим, что изменит включение суперсэмплинга:
При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга сказывается не так сильно и явно меньше, чем в предыдущем случае.
Более сложный режим не сильно изменил соотношение сил в нашем сравнении. Графические решения AMD Radeon и в этом D3D10-тесте пиксельных шейдеров всегда работали эффективнее конкурирующих плат GeForce, и только самые новые модели GeForce, основанные на архитектуре Pascal, могут поспорить с ними. Но и то не при равном позиционировании, ведь вышедшая сегодня старшая модель семейства Radeon RX 500 показала результат явно выше уровня GeForce GTX 1060, которая уступила новинке до 26%, а GTX 1070 была лишь немногим быстрее.
Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)
Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.
Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.
Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, потому что на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП. Увы, но в случае нашего теста Mineral, видеокарты показали не слишком показательные результаты, довольно далекие как от теории, так и от результатов в аналогичных тестах.
Похоже, что Radeon RX 580 в этом тесте снова упирается в пропускную способность памяти. Новая Radeon на чипе Polaris 20 снова оказалась на одном уровне с Radeon RX 480, проиграв при этом главному конкуренту от компании Nvidia и сильно отстав от двух старших решений: Radeon на базе чипа Fiji и GeForce на среднем Pascal. Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:
Во втором математическом тесте из нашего RigthMark соотношение между скоростью видеокарт относительно друг друга оказалось практически таким же и далеким от других аналогичных тестов. В этот раз новая модель Radeon RX 580 даже немного (4%) уступила своему близнецу Radeon RX 480, отличающемуся от новинки исключительно частотой GPU. Удивительно, но пока что ни в одном из тестов RightMark мы не увидели прироста скорости от повышенной частоты работы Polaris 20. Если сравнивать результаты новой видеокарты AMD с решениями Nvidia, то она снова немного отстала от GeForce GTX 1060, не говоря о более мощных решениях.
Direct3D 10: тесты геометрических шейдеров
В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.
Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.
Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:
Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт довольно простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.
Разница между результатами видеокарт компаний Nvidia и AMD почти всегда в пользу решений первой, что обусловлено отличиями в геометрических конвейерах чипов этих производителей GPU. В тестах геометрии платы GeForce всегда были конкурентоспособнее Radeon, и в данном случае хорошо видно, что оба видеочипа Nvidia выигрывают у всех Radeon, имея большее количество блоков по обработке геометрии.
Новая модель Radeon RX 580 имеет те же специальные оптимизации, что и RX 480, но GPU у нее работает на повышенной частоте, что должно было привести и к лучшему результату. Но увы, разницы между этими решениями в нашей синтетике снова нет, новинка даже немного уступила Radeon RX 480, и обе они чуть отстают от Radeon R9 Fury X. Естественно, что GeForce GTX 1060 оказалась быстрее их всех, а старшая плата Nvidia текущего поколения в виде GTX 1070 стала лидером этого теста. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:
При изменении нагрузки в этом тесте цифры почти не изменились и для плат AMD и для решений Nvidia. Поэтому и в наших выводах ничего не меняется. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер. Radeon RX 580 в этом подтесте показала результат на уровне платы предыдущего поколения на основе того же Polaris, и обе они явно отстали от своего прямого конкурента GeForce GTX 1060 примерно на четверть. Старшая же модель конкурента GTX 1070 снова оказалась впереди всех.
К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD не работает уже несколько лет, поэтому мы и перестали его использовать.
Direct3D 10: скорость выборки текстур из вершинных шейдеров
В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.
Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:
Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, ограничивающая производительность, что хорошо заметно по результатам всех плат, кроме основанной на Fiji и имеющей очень быструю HBM-память — все они в простых режимах не сильно быстрее себя же в тяжелом. Новая видеокарта компании AMD в этом тесте также показывает скорость явно ограниченную ПСП и даже немного уступает своей предшественнице на точно таком же чипе Polaris — разница между ними доходит до 7%, что не объяснить никакой теорией.
Лидером в этом тесте традиционно является довольно старая плата компании AMD на базе видеочипа Fiji — в этот раз Radeon R9 Fury X оказалась сильнее всех плат Nvidia и AMD. Новинка в виде Radeon RX 580 уступила своему прямому конкуренту GeForce GTX 1060, показав худший в сравнении результат. Еще раз повторим, что это явно указывает на то, что скорость рендеринга ограничена пропускной способностью видеопамяти. Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, но с увеличенным количеством текстурных выборок:
Ситуация на диаграмме довольно сильно изменилась, и видеокарты компании AMD в тяжелых режимах потеряли значительно больше плат GeForce. Хотя в самом легком режиме у Radeon все хорошо, но в тяжелых они сильно сдали. Новая модель Radeon в сложных условиях показала скорость до 6% ниже, чем Radeon RX 480, снова уперевшись в ПСП. Ну а если сравнивать результаты RX 580 с видеокартами GeForce, то новинка ожидаемо проиграла обеим платам Nvidia во всех режимах, и отставание от GeForce GTX 1060 в тяжелом режиме достигло 33%.
Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.
Результаты во втором тесте вершинного текстурирования «Waves» не очень похожи на то, что мы видели на предыдущих диаграммах, так как решения Nvidia тут явно медленнее. Скоростные показатели новой Radeon RX 580 в этом тесте практически на одном уровне с производительностью видеокарты RX 480, что неудивительно, и обе модели показывают скорость на 15% ниже уровня младшей GeForce, являющейся их прямым конкурентом. Рассмотрим второй вариант этой же задачи:
С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, но выводов это почти не меняет. Рассматриваемая сегодня старшая плата серии Radeon RX 500 в сложных условиях уже обгоняет Radeon RX 480, выйдя из упора в пропускную способность видеопамяти — разница между ними доходит до 4%, что как раз уже вполне объяснимо теорией. Если сравнивать новинку с GeForce, то она снова оказалась медленнее своей соперницы GeForce GTX 1060, уступив ей не так уж много.
Подводя итог по тестам во второй версии теста RightMark, нужно отметить явно странные результаты в этой серии тестов у новой платы на базе чипа Polaris. Radeon RX 580 практически везде была на уровне предшествующей ей модели RX 480, хотя по теории должна опережать ее до 6-12% из-за повышенных частот GPU. Скорее всего, дело объясняется неизменной пропускной способностью, которая идентична для обеих видеокарт. А значит, тесты RightMark слишком часто упираются в ПСП. Лишь бы такого не было в игровых приложениях, но проверим еще в 3DMark Vantage.
3DMark Vantage: тесты Feature
Синтетические тесты из пакета 3DMark Vantage могут показать нам другие результаты, на что мы и надеемся. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших и реже упираются в ПСП. При анализе результатов видеокарты Radeon RX 580 в этом пакете мы наверняка сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark. Feature Test 1: Texture Fill
Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.
Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между Radeon RX 580 и Radeon RX 480 получилась даже выше теоретической, что можно объяснить или какими-то проблемами в раннем драйвере, на котором тестировалась RX 480, или упором в предел по питанию и сниженной частотой GPU в случае решения предыдущего поколения.
Что касается сравнения скорости текстурирования новой видеоплаты Radeon с аналогичным показателем основного конкурента на рынке, Radeon RX 580 показала результат на треть лучший, чем GeForce GTX 1060, и даже куда более дорогая GTX 1070 опередила новинку совсем чуть-чуть. В этом тесте решения Nvidia выступили весьма слабо, явно сказывается большое количество блоков текстурирования у решений AMD архитектуры GCN. Feature Test 2: Color Fill
Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.
Цифры второго подтеста 3DMark Vantage обычно показывают производительность блоков ROP, без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно производительность ROP. Любопытно, что рассматриваемая нами сегодня плата Radeon RX 580 опередила свою предшественницу лишь на 3%, что ниже разницы по тактовой частоте, а количество блоков ROP у этих GPU одинаковое, да и оптимизации по сжатию данных не изменились. Снова упор в ПСП?
Если сравнивать скорость заполнения сцены новой видеокартой компании AMD с результатами ускорителей Nvidia в этом тесте, то сегодняшняя новинка показала скорость заполнения сцены на 9% быстрее, чем GeForce GTX 1060, хоть и отстала от более дорогой модели GTX 1070. Лидером же теста в целом стала хоть и старая, но весьма мощная видеокарта Radeon R9 Fury X. Feature Test 3: Parallax Occlusion Mapping
Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.
Этот тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.
В данном случае важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage старшая плата Radeon семейства RX 500 на базе архитектуры Polaris показала хороший результат, опередив аналогичную модель предыдущего семейства Radeon RX 480 на 6%, что полностью соответствует теоретическим данным. Старшая же Radeon оказалась заметно быстрее обеих, что также должно быть, исходя из теории. Конкурирующая с новинкой GeForce GTX 1060 в этом тесте показала результат на 10% хуже, и именно небольшое повышение частоты GPU и дало RX 580 уже вполне ощутимое преимущество в этой задаче. Feature Test 4: GPU Cloth
Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.
Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны проявиться, но мы давно отметили странные результаты всех GeForce в тесте. Новая видеокарта компании AMD снова показала скорость чуть ниже предшественницы Radeon RX 480, которой уступила 6% — возможно, скорость рендеринга тут также ограничена пропускной способностью.
Несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности у чипов AMD, по сравнению с конкурирующими решениями, платы Radeon в этом тесте работают очень быстро, обгоняя все видеокарты GeForce, представленные в сравнении, даже значительно более дорогие. Так, анонсированная сегодня плата Radeon RX 580 обогнала в этом тесте конкурента GeForce GTX 1060 почти на 50%, а GTX 1070 уступила им обеим. Feature Test 5: GPU Particles
Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.
Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.
Во втором «геометрическом» тесте из 3DMark Vantage ситуация ближе к той, что мы видели скорее в чисто математических тестах. В тесте симуляции физики для частиц, новая видеокарта Radeon RX 580 показывает результат лишь чуть выше прошлого решения на чипе Polaris (вероятно, снова виноват недостаток пропускной способности памяти), и обе они отстают от Radeon R9 Fury X. Новая плата компании AMD также близка по скорости к GeForce GTX 1060, являющейся главным соперником по цене, ведь 3% разницы в пользу платы Nvidia трудно назвать существенным отличием. Feature Test 6: Perlin Noise
Последний feature-тест пакета Vantage является математически-интенсивным тестом для GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.
В пакет компании Futuremark включен математический тест, в котором производительность решений хоть и не полностью соответствует теории, но близка к тому, что должно быть, исходя из пиковых показателей. В данном математическом тесте, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, сильно отличающееся от того, что мы получили в схожих тестах нашего тестового пакета.
Хорошо видно, что графические процессоры архитектуры GCN справляются с подобными задачами лучше решений конкурента в случаях, когда выполняется интенсивная «математика». И хотя новые модели видеокарт компании Nvidia, основанные на архитектуре Pascal, также показали высокую скорость, но GeForce GTX 1060 все же отстает от новинки AMD. Также она обошла предшествующую ей RX 480 из предыдущего семейства, и в этот раз разница чуть выше теоретической — 14%. Вероятно, в пользу RX 580 идет и более качественная система питания, обеспечивающая работу на более высокой реальной тактовой частоте.
Если сравнивать скорость нового решения с платами GeForce, то представленная видеокарта компании AMD из обновленного семейства Polaris в этом тесте оказалась на 25% быстрее конкурирующей с ней GeForce GTX 1060, а более дорогая GTX 1070 обошла ее не так уж и сильно. Так что по тестам из пакета 3DMark Vantage мы делаем вывод, что Radeon RX 580 в играх должен быть в среднем на 5-10% быстрее Radeon RX 480, что даст новинке дополнительное рыночное преимущество перед основным ее конкурентом в лице GeForce GTX 1060.
По результатам синтетических тестов новой видеокарты AMD Radeon RX 580, основанной на слегка улучшенном графическом процессоре Polaris 20, а также результатам других моделей видеокарт обоих производителей видеочипов, можно сделать вывод о том, что вышедшая сегодня видеокарта AMD может стать довольно выгодным приобретением и одним из наиболее производительных решений на рынке в своем классе.
Новая видеокарта компании AMD показала в целом неплохие результаты в наших синтетических тестах, обойдя свою предшественницу на аналогичном чипе Polaris на несколько процентов — вплоть до 10-15% в некоторых случаях, когда отсутствует влияние ПСП и GPU требует максимум энергии. Во многих из тестов новинка опережает конкурирующее с ним решение в виде GeForce GTX 1060 и даже приближается к GTX 1070, что очень хорошо, учитывая ее рекомендованную цену. Решения компании AMD традиционно отличаются более эффективным исполнением интенсивных вычислительных задач, а графические процессоры Nvidia сильны в геометрических тестах.
Единственное, что настораживает — странные результаты новинки во многих синтетических тестах, идентичные по скорости Radeon RX 480, было даже несколько отставаний в 4-5%. Это говорит о том, что в некоторых случаях (если брать синтетику RightMark, то почти во всех тестах) общая производительность рендеринга Radeon RX 580 будет ограничена пропускной способностью памяти, и новинка не получит никакого преимущества перед более ранним решением на основе Polaris 10. В том числе вполне вероятны аналогичные случаи с упором в ПСП и в играх — при высоком разрешении новая видеокарта может упираться в возможности установленной GDDR5-памяти. Увы, поделать с этим ничего нельзя, разгонять такой тип памяти уже некуда, GDDR5X стоит слишком дорого, а HBM... ждем в Vega.
Предполагаем, что в реальных игровых приложениях новая модель Radeon все же покажет в играх скорость на 5-10% выше уровня Radeon RX 480 и чаще всего будет весьма близка к GeForce GTX 1060, а в играх с использованием DirectX 12 или Vulkan может даже чуть опережать конкурента, что очень хорошо для новинки с рыночной точки зрения. В следующей части нашего материала мы рассмотрим производительность новинки по сравнению с конкурентами в наборе современных игровых приложений и сделаем уже окончательные выводы.
Средняя цена (количество предложений) в московской рознице: | |
---|---|
Рассматриваемые карты | Конкуренты |
RX 580 8 ГБ — 19000 руб. (на 10.05.17) | GTX 1060 6 ГБ — 16500 руб. (на 10.05.17) |
RX 580 8 ГБ — 19000 руб. (на 10.05.17) | GTX 1060 3 ГБ — 14000 руб. (на 10.05.17) |
RX 580 8 ГБ — 19000 руб. (на 10.05.17) | RX 480 8 ГБ — 17500 руб. (на 10.05.17) |
RX 580 8 ГБ — 19000 руб. (на 10.05.17) | GTX 970 4 ГБ — 17500 руб. (на 10.05.17) |
Блок питания Thermaltake DPS G 1050W для тестового стенда предоставлены компанией Thermaltake | Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair | Модули памяти G.Skill Ripjaws4 F4-2800C16Q-16GRK для тестового стенда предоставлены компанией G.Skill | Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair |
Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт | Системная плата ASRock Fatal1ty X99X Killer для тестового стенда предоставлена компанией ASRock | Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate | 2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair |