Содержание
- Часть 1 — Теория и архитектура
- Часть 2 — Практическое знакомство
- Часть 3 — Результаты игровых тестов и выводы
Справочные материалы
Устройство(а)
Gigabyte Radeon R9 285 2048 МБ 256-битной GDDR5 PCI-E | ||
---|---|---|
Параметр | Значение | Номинальное значение (референс) |
GPU | Radeon R9 285 (Tonga) | |
Интерфейс | PCI Express x16 | |
Частота работы GPU (ROPs), МГц | 973 | 918 |
Частота работы памяти (физическая (эффективная)), МГц | 1375 (5500) | 1375 (5500) |
Ширина шины обмена с памятью, бит | 256 | |
Число вычислительных блоков в GPU/частота работы блоков, МГц | 28/973 | 28/918 |
Число операций (ALU) в блоке | 64 | |
Суммарное число операций (ALU) | 1792 | |
Число блоков текстурирования (BLF/TLF/ANIS) | 112 | |
Число блоков растеризации (ROP) | 32 | |
Размеры, мм | 250×115×35 | 250×100×33 |
Количество слотов в системном блоке, занимаемые видеокартой | 2 | 2 |
Цвет текстолита | черный | черный |
Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»), Вт | 197/61/3 | 190/57/3 |
Выходные гнезда | 1×DVI (Dual-Link/HDMI), 1×DVI (Single-Link/HDMI), 1×HDMI 1.4a, 1×DisplayPort 1.2 | 1×DVI (Dual-Link/HDMI), 1×DVI (Single-Link/HDMI), 1×HDMI 1.4a, 1×DisplayPort 1.2 |
Поддержка многопроцессорной работы | CrossFire | |
Максимальное количество приемников/мониторов для одновременного вывода изображения | 4 | 4 |
Дополнительное питание: количество 8-контактных разъемов | Нет | Нет |
Дополнительное питание: количество 6-контактных разъемов | 2 | 2 |
Максимальное разрешение 2D: DP/HDMI/Dual-Link DVI/Single-Link DVI | 3840×2400/3840×2400/2560×1600/1920×1200 | |
Максимальное разрешение 3D: DP/HDMI/Dual-Link DVI/Single-Link DVI | 3840×2400/3840×2400/2560×1600/1920×1200 |
Комплектация локальной памятью | |
---|---|
Картa имеeт 2048 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах по 2 Гбит (на лицевой стороне PCB). Микросхемы памяти Elpida (GDDR5). Микросхемы рассчитаны на номинальную частоту работы в 1500 (6000) МГц. |
С первого взгляда понятно, что 280 от 285 отличаются шиной обмена с памятью. У R9 285 она ужалась до 256 бит, вследствие чего суммарный объем памяти снизился с 3 до 2 гигабайт. Поэтому сравнение плат условное: ведь PCB сильно отличаются.
Схема питания 5-фазная для ядра и 2-фазная для микросхем памяти, управляется цифровым контроллером. Набор гнезд вывода картинки также изменился со времен Radeon HD 7970/R9 280. Наличие двух видеовыходов DP (как было у R9 280) посчитали лишним, поэтому вернули второе гнездо DVI (на 280 было одно), и теперь ускоритель может выводить картинку на приемники со всеми популярными ныне интерфейсами (причем в полноформатном виде, переходники с мини-форматов не требуются).
Мониторинг температурного режима (с помощью EVGA PrecisionX (автор А. Николайчук AKA Unwinder) |
---|
Комплектация. Карта попала к нам в ОЕМ-поставке, поэтому упаковки и комплекта нет.
Установка и драйверы
Конфигурация тестового стенда
- Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
- 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
- СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
- СО Intel Thermal Solution RTS2011LC;
- системная плата Asus Sabertooth X79 на чипсете Intel X79;
- системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
- оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
- жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
- жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
- 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
- 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
- корпус Corsair Obsidian 800D Full Tower.
- операционная система Windows 7 64-битная; DirectX 11.1;
- монитор Dell UltraSharp U3011 (30″);
- монитор Asus ProArt PA249Q (24″);
- драйверы AMD версии Catalyst 14.7 (14.8 для R9 285), Nvidia версии 340.52. VSync отключен.
- D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org.
- D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0, ссылка.
- RightMark3D 2.0 с кратким описанием: под Vista без SP1, под Vista c SP1.
Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.
В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.
- Radeon R9 285 со стандартными параметрами (далее R9 285)
- Radeon R9 280X со стандартными параметрами (далее R9 280X)
- Radeon R9 280 со стандартными параметрами (далее R9 280)
- Geforce GTX 770 со стандартными параметрами (далее GTX 770)
- Geforce GTX 760 со стандартными параметрами (далее GTX 760)
Для сравнительного анализа результатов новой видеокарты Radeon R9 285 были выбраны именно эти модели по следующим причинам. Radeon R9 280 является аналогом рассматриваемой модели AMD из этой же линейки, основанном на графическом процессоре Tahiti, которое замещается анонсированным сегодня решением. Ну а сравнение с R9 280X интересно потому, что это — уже следующая ступень, и будет интересно оценить производительность всех трёх решений.
Из видеокарт конкурирующей компании Nvidia для нашего сравнения мы выбрали две видеоплаты, основанные на одном и том же графическом процессоре GK104, с разным количеством активных блоков и разной ценой. Geforce GTX 760 является игровым решением из этого же ценового диапазона, являющимся прямым конкурентом для новинки AMD и имеющим аналогичную рекомендованную цену. А GTX 770 — это решение уже более высокого уровня, в том числе и по цене и по производительности — конкурент для R9 280X.
С этого материала мы решили окончательно отказаться от давно устаревших DirectX 9 тестов, так как практически все современные видеокарты сейчас показывают в нём не слишком показательные результаты, будучи сильно ограничены какими-то из параметров: пропускной способностью памяти, скоростью заполнения или текстурирования. К тому же, видеокарты как минимум от Nvidia давно не оптимизируются под подобные устаревшие приложения, а некоторые решения от разных производителей и вовсе могут не проходить набор наших DX9-тестов или показывают в них явно аномальные результаты.
Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)
Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.
Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.
Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.
Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.
Производительность в этом тесте зависит от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».
В задачах процедурной визуализации меха с большим количеством текстурных выборок, в последних поколениях графических архитектур компания AMD сократила разницу с платами Nvidia, а с выпуском видеочипов на базе архитектуры GCN даже вырвалась вперед, и теперь именно платы Radeon являются лидерами в этих сравнениях, что говорит о заметно более высокой эффективности выполнения ими данных программ.
Интересно, что видеоплата модели Radeon R9 285 даже чуть быстрее модели Radeon R9 280 на чипе Tahiti — на 5-8%. Теорией это объяснить сложно, разве что из-за большей энергоэффективности GPU и новой версии PowerTune, новинка работает на большей тактовой частоте. Естественно, что от более мощной R9 280X она отстаёт, зато опережает обе соперничающие видеокарты от конкурента, даже более дорогую Geforce GTX 770.
Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:
В таких условиях новая модель Radeon R9 285 опережает заменяемую ей видеокарту R9 280 уже на 9-10%, что явно больше погрешности. Radeon R9 280X снова в лидерах, а преимущество R9 285 над конкурентами в виде Geforce GTX 770 и GTX 760 лишь усилилось — превосходство в подобных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.
Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:
Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».
Диаграмма в целом похожа на предыдущую, также без включения SSAA, и снова новая Radeon R9 285 показала скорость на 6-7% выше, чем Radeon R9 280. Также она продолжает отставать от Radeon R9 280X и выигрывать у обеих видеокарт на чипах Nvidia. И в этом случае новинка от AMD опережает Geforce GTX 770 — платы Nvidia и в этом тесте справляются с работой заметно хуже конкурирующих решений AMD. Посмотрим, что изменит включение суперсэмплинга:
Мало что изменилось и в этих условиях. При включении суперсэмплинга и самозатенения задача получается еще более тяжелой и совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась слабо, а включение суперсэмплинга сказывается меньше, чем в предыдущем случае.
Снова мы видим, что графические решения Radeon в наших D3D10-тестах пиксельных шейдеров работают более эффективно, по сравнению с конкурирующими Geforce. Свежая видеоплата на новом чипе Tonga показывает скорость на 8-15% выше, чем Radeon R9 280, и снова опережает в том числе и старшую из конкурирующих плат Nvidia.
Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)
Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.
Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.
Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, а на результаты также влияет и разная эффективность их использования в конкретных решениях, равно как и оптимизация драйверов. В случае теста Mineral, новая модель Radeon R9 285 оказалась на 8% быстрее заменяемой ей видеокарты с индексом R9 280, что снова может быть обусловлено лишь более высокой Boost-частотой — очень похоже, что обновленный PowerTune и переработанный чип действительно даёт 5-10% преимущества при прочих равных.
Более мощной плате Radeon новинка уступила, конечно же, но зато сравнение с платами Nvidia в очередной раз показало сильные стороны архитектуры AMD, так как она в таких тестах всегда имеет значительное преимущество перед конкурирующими решениями Nvidia. В математических тестах конкурирующая с новинкой по цене видеокарта Geforce GTX 760 серьёзно уступила новинке от компании AMD, а более дорогая GTX 770 показывает скорость рендеринга, аналогичную показателю Radeon R9 285.
Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:
Во втором математическом тесте мы видим несколько иные результаты видеокарт относительно друг друга. Разница между Radeon R9 285 и R9 280 в этом тесте выросла до 10%, но от Radeon R9 280X новинка всё так же серьёзно отстаёт. В этот раз более дорогая видеокарта от компании Nvidia уже отстаёт, даже GTX 770 показала скорость хуже, чем новая модель Radeon на базе чипа Tonga. Не говоря уже о прямом конкуренте GTX 760, уступившей новинке чуть ли не в полтора раза. В тестах пиковой математической производительности видеочипы Nvidia до сих пор сильно отстают.
Direct3D 10: тесты геометрических шейдеров
В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.
Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.
Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:
Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии, а иногда — пропускной способностью памяти.
Очень хорошо заметна разница между результатами видеокарт AMD на старых Tahiti и Tonga, которая обусловлена улучшениями по обработке геометрии, о которых мы писали в первой части статьи. Да и чипы Nvidia также в лучшую сторону отличаются по устройству геометрических конвейеров, по сравнению со старыми чипами AMD. А вот Tonga уже даже чуть быстрее, чем GK104.
Наша сегодняшняя новинка в виде Radeon R9 285 основана на этом чипе, и улучшенный геометрический конвейер позволил заметно опередить обе платы на Tahiti, даже более мощный вариант. R9 280 отстала от новинки на 55-70%. Видеокарт Geforce имеют неплохую геометрическую производительность, но обе представленные платы всё же оказываются медленнее, чем Radeon R9 285. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:
При изменении нагрузки в этом тесте цифры слегка улучшились для некоторых плат. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и выводы остаются прежними. Новинка Radeon R9 285 быстрее заменяемой ей модели на 50-60%, и всё так же опережает в том числе и R9 280X. В остальном в выводах ничего не изменилось, обе платы Geforce также уступают новинке, хотя GTX 770 показывает скорость почти на том же уровне.
К сожалению, «Hyperlight» — наш более тяжёлый и показательный тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD просто не работает. В какой-то момент очередное обновление драйверов Catalyst привело к тому, что данный тест перестал запускаться на платах этой компании, и это не исправляется вот уже несколько лет.
Direct3D 10: скорость выборки текстур из вершинных шейдеров
В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.
Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:
Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, и особенно заметно в лёгком режиме. Результаты новой видеокарты компании AMD в лёгком режиме подтверждают это, новинка уступает платам на чипе Tahiti: Radeon R9 280 и R9 280X. В среднем режиме она уже на уровне с R9 280X, а в тяжёлом и вовсе заметно впереди — похоже, что сжатие кадрового буфера действительно эффективно работает!
Представленные в этом сравнении платы Nvidia ведут себя схоже с новой платой Radeon, но младшая Geforce GTX 760 отстаёт до 30%, а старшая GTX 770 весьма близка к R9 285 (сильно зависит от условий сравнения). Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:
Ситуация на диаграмме немного изменилась — решения компании AMD в тяжелых режимах потеряли больше, чем обе Geforce. Новая видеоплата Radeon R9 285 опережает обе платы на чипе предыдущего поколения Tahiti, в том числе и старшую Radeon R9 280X. В этот раз прямой конкурент новинки Geforce GTX 760 показал идентичный с R9 285 результат, а GTX 770 опережает обе эти модели, являясь лидером сравнения.
Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.
Результаты во втором тесте вершинного текстурирования «Waves» в чём-то схожи с теми, что мы видели на предыдущей диаграмме (также при низкой детализации), но скоростные показатели новой платы во всех режимах ещё улучшились относительно конкурентов. Новая модель быстрее Radeon R9 280 до 53%, да и старшая R9 280X в тяжёлых условиях отстаёт.
Ну а если сравнивать новинку с платами от Nvidia, то в этот раз она всё же быстрее и прямого конкурента Geforce GTX 760 и даже GTX 770, кроме самого лёгкого режима. С учётом того, что эти тесты обычно ограничены филлрейтом, можно точно сказать, что улучшенное сжатие кадрового буфера в Tonga работает отлично. Рассмотрим второй вариант этого же теста:
С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, и видеокарты Geforce пострадали даже больше. Новая модель Radeon R9 285 оказывается всегда быстрее Geforce GTX 770, а уж прямого конкурента она обгоняет ещё существеннее. Если сравнивать новинку с R9 280 и R9 280X, то тут все так же — в лёгком режиме R9 285 уступает старшей плате на Tahiti, а в среднем и тяжёлом она уже оказывается впереди.
3DMark Vantage: тесты Feature
Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов анонсированной сегодня видеокарты Radeon R9 285 в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark. Feature Test 1: Texture Fill
Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.
Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark всегда достаточно высока и итоговые цифры разных моделей обычно близки к соответствующим теоретическим параметрам. Единственное, что не совсем понятна разница между R9 285 и R9 280 в 12%, ведь по скорости текстурирования у Tonga нет преимущества. Похоже, что это снова можно объяснить тем, что PowerTune на новом GPU лучше работает, обеспечивая большую реальную частоту для новинки. Но Radeon R9 280X по скорости текстурирования она всё же уступает.
Что касается сравнения скорости платы Radeon R9 285 с решениями конкурента, то новинка AMD по текстурной скорости ровно между ними. Новая модель опередила прямого конкурента в лице Geforce GTX 760, но уступила старшей GTX 770, близкой скорее к уровню R9 280X. Нужно учитывать, что GTX 770 заметно дороже, и не является прямым конкурентом для рассматриваемой модели Radeon, так что результат у Tonga отличный. Feature Test 2: Color Fill
Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.
Цифры второго подтеста 3DMark Vantage показывают производительность блоков ROP с учетом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет или пропускную способность или производительность ROP, в зависимости от решения. И результат у выпущенной сегодня видеоплаты AMD получился... просто ошеломительным. Новая модель выступает заметно лучше всех решений, включая более мощную карту на Tahiti и даже Geforce GTX 770.
Похоже, что в этот раз мы видим результат гораздо более эффективного сжатия кадрового буфера у Tonga, по сравнению с Tahiti, да и GK104. Если сравнивать скорость заполнения сцены видеокартой Radeon R9 285 с R9 280, то разница составляет 73%, да и конкурирующая видеокарта Nvidia отстала примерно на столько же. И даже Geforce GTX 770 более чем на 40% медленнее новинки. Feature Test 3: Parallax Occlusion Mapping
Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.
Этот тест пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.
В данном случае, важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая плата Radeon R9 285 оказалась быстрее своей предшественницы R9 280 на чипе Tahiti с близкими характеристиками аж на 18%, что трудно объяснить чистой теорией. Скорее всего, и в этом случае на результате сказывается лучшая работа PowerTune и более высокая частота для нового GPU.
Понятно, что новинка с огромным запасом обгоняет своего прямого конкурента от Nvidia и показывает результат даже выше уровня более дорогой Geforce GTX 770, так как графические процессоры производства компании AMD являются более эффективными в этой задаче. И только Radeon R9 280X остаётся где-то далеко впереди. Feature Test 4: GPU Cloth
Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.
Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, а основными факторами влияния обычно являются производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Так что шанс на улучшение результатов Tonga по сравнению с Tahiti вроде бы есть, ведь геометрическая производительность была улучшена.
Но увы, новая среднебюджетная модель из семейства Radeon R9 показала скорость на уровне Radeon R9 280, а R9 280X не слишком далеко ушла от новинки вперёд. Зато, несмотря на большее количество соответствующих исполнительных блоков и большую геометрическую производительность видеокарт Nvidia, обе платы Geforce уступили всем Radeon, в том числе и новой плате. Похоже, что в сегодняшнем сравнении дело не в геометрической производительности, а скорее в математической. Feature Test 5: GPU Particles
Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.
Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.
Во втором геометрическом тесте из 3DMark Vantage ситуация совершенно иная, и на этот раз новая Radeon R9 285 оказалась значительно производительнее своей предшественницы R9 280 — разница между их производительностью составила более 20%. Да и R9 280X новинка обогнала! Похоже, что именно в этом тесте больший упор именно в геометрическую производительность, а частично и в скорость заполнения, которая в Tonga также стала выше из-за эффективного сжатия кадрового буфера.
Если сравнивать Radeon R9 285 с конкурирующими видеокартами от Nvidia, то она показала скорость, близкую к производительности более дорогой Geforce GTX 770, опередив своего прямого конкурента GTX 760. Для платы на чипе AMD это просто отличный результат, ведь ранее в синтетических тестах имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, платы Nvidia заметно опережали конкурирующие с ними модели. Feature Test 6: Perlin Noise
Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.
В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим несколько иное распределение результатов, по сравнению с двумя аналогичными тестами из нашего тестового пакета. В этом случае производительность решений не совсем соответствует теории, но близка к тому, что мы видели в математических тестах ранее.
Видеокарты Radeon компании AMD, созданные на базе чипов архитектуры GCN, всегда очень хорошо справляются с подобными задачами и показывают отличные результаты в случаях, когда выполняется интенсивная «математика». Неудивительно, что новая модель Radeon R9 285 в этом тесте показала результат лучше, чем даже более дорогая Geforce GTX 770, не говоря о соперничающей с ней по цене GTX 760.
Вышедшая сегодня видеокарта AMD показала производительность на целых 19% выше заменяемого ей решения в лице Radeon R9 280, хотя R9 280X осталась далеко впереди. Отличный результат для Tonga, новый GPU явно эффективнее использует возможности имеющихся исполнительных блоков при меньшем энергопотреблении.
Direct3D 11: Вычислительные шейдеры
Чтобы протестировать новое решение компании AMD в задачах, использующих такие свежие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.
Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.
Скорость расчетов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia давно уже практически одинакова, хотя у видеокарт с GPU предыдущих архитектур были более явные различия. Судя по нашим предыдущим тестам, результаты в задаче явно зависят не столько от математической мощи и эффективности вычислений, но от других факторов, вроде пропускной способности памяти.
В данном случае скорость видеокарт упирается явно в ПСП. И увы, новая плата компании AMD по этому параметру заметно отстаёт от Radeon R9 280, просто из-за 256-битной шины против 384-битной. Видимо, сжатие кадрового буфера в этой задаче не работает достаточно эффективно. Если сравнить новинку с прямым конкурентом в лице Geforce GTX 760, то их результаты очень близки, что также говорит в пользу теории об упоре в ПСП.
Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.
В этом тесте упор производительности наблюдается не только в скорость исполнения простых математических вычислений, но и в эффективность выполнения сложного кода с ветвлениями. Во втором DX11-тесте расклад сил между решениями разных компаний оказался иным. Платы Geforce в подобных расчетных задачах всегда неплохо смотрятся.
Поэтому в данном тесте победила единственная видеокарта Nvidia, а Radeon R9 285 оказалась примерно на уровне R9 280, как и должно быть по теории. Отставание обеих от Radeon R9 280X оказалось в этот раз небольшим, но даже её мощности не хватает, чтобы достать главного конкурента сегодняшней новинки — Geforce GTX 760, которая стала победителем в этот раз.
Direct3D 11: Производительность тесселяции
Вычислительные шейдеры очень важны, но еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.
Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.
Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:
Эта задача давно стала слишком легкой для достаточно мощных решений, и в тесте простого бампмаппинга скорость плат AMD чаще всего упирается в ПСП. Сегодняшний герой обзора уступил обеим моделям Radeon на чипе Tahiti, а R9 280X оказалась быстрейшей. Впрочем, единственная из Geforce в этом подтесте ещё медленнее новинки.
Во втором подтесте со сложными попиксельными расчетами новинка уже на 9% быстрее Radeon R9 280, хотя отставание от старшей модели на Tahiti осталось. А вот преимущество над Geforce GTX 760 лишь увеличилось, ведь эффективность выполнения таких математических вычислений в пиксельных шейдерах у чипов архитектуры GCN заметно выше, чем у Kepler.
Даже в подтесте с применением тесселяции все платы AMD выигрывают у единственного представителя лагеря Nvidia. Такая ситуация объясняется тем, что в этом конкретном тесте разбиение треугольников весьма умеренное и скорость в нем упирается не в производительность блоков обработки геометрии, а в ПСП. Поэтому и чипу архитектуры Kepler негде развернуться, да и преимущества улучшенных геометрических блоков Tonga не видно.
Вторым тестом производительности тесселяции будет еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.
В этом тесте в самом тяжёлом режиме применяется уже более сложная геометрия, поэтому и сравнение геометрической мощи различных решений приносит другие выводы. Все представленные в материале современные решения хорошо справляются с легкой и средней геометрической нагрузкой, показывая достаточно высокую скорость, но в тяжелых условиях графический процессор Nvidia все-таки оказался заметно производительнее.
Особенно хорошо видно это в самом сложном режиме, когда Radeon R9 285 серьезно уступил Geforce GTX 760, так как скорость у всех плат AMD сильно упала. К сожалению, в этом конкретном тесте по каким-то причинам не видно никакого преимущества по обработке геометрии в графическом процессоре Tonga, по сравнению с Tahiti. Разница между R9 285 и R9 280 не превысила и 5%.
Рассмотрим результаты еще одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.
Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Впрочем, основной все равно остается именно нагрузка на блоки обработки геометрии.
Мы тестируем все видеоплаты при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, видеокарты Radeon на чипе Tahiti показывают достаточно высокие результаты (Radeon R9 280 почти на уровне Geforce GTX 760), то уже при следующей ступени они не дотягиваются до скорости платы Nvidia.
При увеличении геометрической работы платы калифорнийской компании обычно вырываются вперед, а производительность старых Radeon снижается много сильнее. А вот новинка в лице Radeon R9 285 на базе чипа Tonga показывает себя просто отлично, она не просто опередила заменяемую ей модель R9 280 до двух раз, но легко превзошла и более мощную плату Radeon R9 280X. И хотя в более простых условиях представленная сегодня видеокарта проигрывает конкурирующей с ней Geforce GTX 760, в самом сложном режиме она даже вырвалась вперёд! Просто отличный результат для нового решения, AMD наконец-то сделала графический процессор среднего ценового уровня, который по геометрической производительности не уступает соперничающим с ним решениям от Nvidia, и в тесте тесселяции он оказался не хуже GK104.
Результаты синтетических тестов представленной в самом начале осени видеоплаты AMD Radeon R9 285, а также результаты других моделей видеокарт от обоих производителей дискретных видеочипов показали, что рассматриваемая плата по скорости будет ещё более конкурентоспособна на рынке, по сравнению с Radeon R9 280. Новая плата AMD почти всегда показывает более высокие результаты в «синтетике», по сравнению с её главным соперником по цене в виде Geforce GTX 760.
Самое главное, что и проблема «ахиллесовой пяты» в виде геометрических тестов была успешно решена в новом графическом процессоре Tonga. Теперь в тестах тесселяции никакого отставания нет. Единственный возможный недостаток нового GPU в виде меньшей пропускной способности памяти по сравнению с Tahiti (Radeon R9 280) во многих случаях будет компенсирован улучшенным алгоритмом сжатия кадрового буфера, да и у прямого конкурента Geforce GTX 760 показатель ПСП не слишком то и выше.
Поэтому можно смело сделать вывод о том, что Radeon R9 285 должна оказаться победителем в сражении с Geforce GTX 760 и в игровых приложениях. В следующей части нашего материала мы оценим все представленные на рынке решения в этом ценовом диапазоне и посмотрим, насколько хорошо новинка справляется с нашим набором игровых тестов.
Средняя текущая цена (количество предложений) в московской рознице: | |
---|---|
Рассматриваемые карты | Конкуренты |
R9 285 — $213(5) | GTX 760 — $212 (на 01.06.16) |
R9 285 — $213(5) | GTX 660 Ti — $309(2) |
R9 285 — $213(5) | R9 280 — $276(2) |
R9 285 — $213(5) | R9 270X — $195 (на 01.06.16) |
Gigabyte R9 285 — $258(1) | R9 285 — $213(5) |
и лично Кирилла Погорелова
за предоставленную на тестирование видеокарту
2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair | Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair | Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair | Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair |
Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт | Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией Asustek | Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI | Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate |
Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia | 2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair | Монитор Asus ProArt PA249Q для рабочего компьютера предоставлен компанией Asustek |