СОДЕРЖАНИЕ
- Часть 1 Теория и архитектура
- Часть 2 Практическое знакомство
- Особенности видеокарт
- Конфигурация стенда, список тестовых инструментов
- Результаты синтетических тестов
- Результаты игровых тестов (производительность)
ATI RADEON HD 5770 и 5750: Часть 1: Теоретические сведения
Ну что же, теорию работы «игрушек» внутри новой когорты продуктов AMD мы рассмотрели (напомним, что «игрушками» мы назвали среднего уровня ускорители HD 57xx класса), теперь познакомимся с ними лично.
Gigabyte RADEON HD 5770 (GV-R577D5) 1024MB PCI-E MSI RADEON HD 5770 (R5770) 1024MB PCI-E Sapphire RADEON HD 5770MB 1024MB PCI-E XFX RADEON HD 5750 1024MB PCI-E XFX RADEON HD 5770 1024MB PCI-E Sapphire RADEON HD 5750MB 1024MB PCI-E | |
---|---|
Каждая карта имеет 1024 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах на лицевой и оборотной сторонах PCB Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц. |
Мы не зря сравниваем PCB новых карт с HD 4770, поскольку последний также имел 128-битную шину обмена с памятью, а также поддерживал GDDR5. Однако в данном случае разводка сушественно изменилась. Если ранее все 8 микросхем памяти присутствовали на лицевой стороне печатной платы, то теперь половина на лицевой, а половина на оборотной. При этом было принято весьма странное решение - охлаждать только половину микросхем центральным кулером, когда как память на оборотной стороне осталась без охлаждения. Нам очень сложно понять чем руководствовались инженеры, уходя от размещения всех микросхем на лицевой стороне, когда как охлаждать их было бы проще.
Очевидно, что все карты копируют эталонный дизайн, а в случае с 5770 - это вообще все продукты от самой AMD, купленные у последней партнерами, снабженные соответствующими стикерами и упакованные в свои коробки.
Про ТВ-выход можно уже забывать. Все реже и реже встречаются современные видеокарты с этим интерфейсом. Считается, что HDMI должен вытеснить старые аналоговые решения.
Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также с серийными картами поставляются переходники DVI-to-HDMI (мы помним, что данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник), поэтому проблем с такими мониторами также не должно быть. К тому же продукт уже оснащен один разъемом HDMI. Следует напомнить ОЧЕНЬ ВАЖНУЮ ЧЕРТУ HD 5xxx серии - способность одновременного вывода изображения на ТРИ приемника (монитора).
Максимальные разрешения и частоты:
- 240 Hz Max Refresh Rate
- 2048 x 1536 x 32bit x85Hz Max - по аналоговому интерфейсу
- 2560 x 1600 @ 60Hz Max - по цифровому интерфейсу (для DVI-гнезд с Dual-Link / HDMI)
По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.
Есть смысл сказать, что все карты требуют дополнительного питания, поэтому с каждой платой поставляются переходники с молекс на 6-пиновый разъем, хотя уже все современные БП имеют такие «хвосты».
О системах охлаждения. Устройства, идущие с картами HD 5770, одинаковые и эталонные, потому мы мзучим их на одном примере.
Для всех карт мы провели исследование температурного режима с помощью утилиты RivaTuner (автор А. Николайчук AKA Unwinder) и получили следующие результаты:
Все карты RADEON HD 5770 1024MB PCI-E
Все карты RADEON HD 5750 1024MB PCI-E
Очевидно, что все СО очень хорошо справляются со своей работой.
Стоит особо отметить утилиту Afterburner от MSI. Она базируется на RivaTuner (ее автор - тот же А.Николайчук), однако имеет более стильный и особый дизайн. Но принцип действия тот же - осуществлять изменение частот работы карты, мониторинг состояние продукта (температуры, частоты как работы карты, так и оборотов вращения вентилятора), управление кулером и т.д.
Комплектация.
Базовый комплект поставки должен включать в себя: руководство пользователя, диск с драйверами и утилитами, переходник-адаптер DVI-to-VGA, адаптер CrossFire, а также разветвители внешнего питания. Далее, мы покажем, что предлагается к каждой карте дополнительно.
Упаковки.
А вначале покажем конфигурацию тестового стенда.
Установка и драйверы
Конфигурация тестового стенда:
- Компьютер на базе Intel Core I7 CPU 920 (Socket 1366 LGA)
- процессор Intel Core I7 CPU 920 (2667 MHz);
- системная плата Asus P6T Deluxe на чипсете Intel X58;
- оперативная память 3 GB DDR3 SDRAM Corsair 1066MHz;
- жесткий диск WD Caviar SE WD1600JD 160GB SATA.
- блок питания Tagan TG900-BZ 900W.
- операционная система Windows Vista 32bit SP1; DirectX 10.1;
- монитор Dell 3007WFP (30").
- драйверы ATI версии CATALYST 9.10; Nvidia версии 191.07.
VSync отключен.
Используемые нами пакеты синтетических тестов можно скачать здесь:
- D3D RightMark Beta 4 (1050) с описанием на сайте http://3d.rightmark.org
- D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
- RightMark3D 2.0 с кратким описанием: Vista без SP1, Vista c SP1
Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.
К сожалению, время синтетических DirectX 11 тестов ещё не пришло. Уже появился интересный псевдоигровой бенчмарк Unigine Heaven, но для этой части статьи он не подходит, так как не является синтетическим в чистом виде. Ничего не поменялось и в ситуации с RightMark, он всё так же застыл в развитии. Надеемся, что к выходу конкурирующих с DX11 видеокартами решений от Nvidia такие тесты появятся. Возможно, Futuremark постарается, рано или поздно. Ну а пока что используем то, что есть.
Синтетические тесты проводились на следующих видеокартах:
- RADEON HD 5770 со стандартными параметрами (далее HD 5770)
- RADEON HD 5750 со стандартными параметрами (далее HD 5750)
- RADEON HD 5870 со стандартными параметрами (далее HD 5870)
- RADEON HD 4870 со стандартными параметрами (далее HD 4870)
- Geforce GTX 260 со стандартными параметрами (далее GTX 260)
- Geforce GTS 250 со стандартными параметрами (далее GTS 250)
Для сравнения результатов новых моделей линейки RADEON HD 5700 были выбраны именно эти видеокарты по следующим причинам: RADEON HD 4870 является производительной одночиповой моделью от AMD предыдущего поколения, которое примерно соответствует теоретической производительности новых моделей. HD 5870 интересен тем, что это самая быстрая карта компании на сегодня, а также топовое решение серии HD 5000, с которым будет интересно сравнить новую mid-end линейку. А с решениями Nvidia сравниваем напрямую: Geforce GTX 260 является конкурентом для старшей видеокарты серии HD 5700, а GTS 250 для младшей.
Direct3D 9: Тесты Pixel Filling
В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:
Хотя тест немного устарел, и в нём новые видеокарты уже не достигают теоретически возможных значений, расположение карт относительно друг друга по скорости текстурирования он показывает. Результаты синтетики не дотягивают до пиковых значений, и получается, что HD 5770 в этом тесте выбирает около 33 текселей за один такт из 32-битных текстур при билинейной фильтрации в этом тесте, что несколько ниже теоретической цифры в 40 отфильтрованных текселей.
Примерно то же самое показывает и младшее решение 31 тексель против 36 теоретически возможных. Но и этого вполне хватает, чтобы всегда обгонять старый HD 4870 и показывать результат на уровне конкурентов, а в случае 5770 даже выше. Естественно, что разница с HD 5870 более чем полуторакратная, хотя не двукратная, которая должна быть, исходя из теории.
В тесте с небольшим количеством текстур скорость ограничивается ПСП, и HD 5870 не так уж силён в этих случаях, и лишь при 3-4 текстурах все решения выходят на свою номинальную мощность. Смотрим на эти же результаты в тесте филлрейта:
Второй синтетический тест показывает скорость заполнения, и в нём мы видим ту же самую ситуацию, но уже с учетом количества записанных в буфер кадра пикселей. Максимальный результат остаётся за новым топовым решением AMD, что естественно. В случаях с 0, 1 и 2 накладываемыми текстурами разница между решениями ниже, в таких режимах производительность ограничена ПСП, прежде всего.
Впрочем, всё равно во всех тестах новые решения серии HD 5700 опережают HD 4870, а HD 5770 обгоняет GTX 260. А вот GTS 250 по текстурированию и филлрейту оказалась чуть сильнее своего нового соперника. Хотя это только синтетика, в реальных задачах всё может получиться совсем иначе.
Direct3D 9: Тесты Pixel Shaders
Первая группа пиксельных шейдеров, которую мы рассматриваем, является очень простой для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0.
Мы уже не раз писали, что эти тесты весьма просты для современных архитектур, и они показывают далеко не всю мощь GPU, но остаются интересными для оценки баланса между текстурными выборками и математическими вычислениями. Но сейчас, в этих простых тестах производительность ограничена в основном скоростью текстурных модулей. Так оно и получилось результаты примерно соответствуют тестам на скорость текстурирования.
Так как больших изменений в архитектуре со времени RV7xx не было, то новые карты линейки HD 5700 ведут себя примерно так же, как и HD 4870. Хотя разница в одном тесте есть самый сложный математически подтест с тремя источниками света. Там важнее математическая производительность, поэтому HD 5750 немного отстаёт от других карт AMD того же уровня производительности.
Новые решения среднего уровня от компании AMD отлично конкурируют с обеими видеокартами Nvidia. HD 5770 с запасом обгоняет GTX 260, а HD 5750 показывает результаты примерно на уровне GTS 250. С учётом прогнозируемого преимущества в вычислительных тестах, это неплохая заявка на победу и в общем зачёте. HD 5870 не так уж далеко впереди, кстати. Посмотрим на результаты тестов более сложных пиксельных программ промежуточных версий:
А вот тут даже интереснее получается. Скорость явно ограничена в основном способностями блоков ALU. В зависящем в том числе и от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и карты располагаются примерно по скорости текстурирования и скорости заполнения (исключая разницу между вендорами). Карта на основе Cypress показывает максимальный результат, ровно вдвое обгоняя старшую карту на Juniper. Что соответствует теоретическим цифрам.
Сравнение серии HD 5700 с конкурентами от Nvidia явно в пользу первых HD 5770 оказывается быстрее GTX 260, а HD 5750 на одном уровне с GTS 250. То есть, примерно то же самое, что было в тесте текстурирования. Интересно, что GTX 260 проиграл в этом тесте всем, даже GTS 250, пусть и немного.
Второй тест более интенсивен вычислительно, и лучше подходит для архитектуры AMD, обладающей большим количеством вычислительных блоков. Разница между новым решением среднего уровня от AMD и топовым от них же, уже чуть меньше двух раз. Видимо, HD 5870 в таких условиях не может раскрыть все свои способности. Зато соответствует теории то, что HD 5770 примерно на уровне HD 4870, а HD 5750 проигрывает им обоим. И обе карты HD 5700 всё так же обгоняют соперников от Nvidia.
Direct3D 9: Тесты пиксельных шейдеров New Pixel Shaders
Эти тесты пиксельных шейдеров DirectX 9 ещё сложнее, они делятся на две категории. Начнем с более простых шейдеров версии 2.0:
- Parallax Mapping знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики
- Frozen Glass сложная процедурная текстура замороженного стекла с управляемыми параметрами
Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:
Это универсальные тесты, зависящие и от скорости блоков ALU и от скорости текстурирования, тут важен общий баланс чипа. Производительность видеокарт в тесте «Frozen Glass» ограничена не только математикой, но и скоростью текстурных выборок. Ситуация в нём похожа на то, что мы видели чуть выше, разве что карты Nvidia тут несколько сильнее. HD 5770 отстаёт от топового HD 5870 снова менее чем в два раза, показывая результат на уровне HD 4870. Этого хватает, чтобы обогнать соперника GTX 260. А вот у HD 5750 и GTS 250 в этом тесте результаты схожие.
Во втором тесте «Parallax Mapping» результат зависит от производительности ALU, но больше от ПСП, поэтому HD 4870 заметно опережает обе карты новой серии. Вот и слабая сторона новых решений обнажилась 128-битная шина памяти. Хотя, с учётом снизившихся показателей GTS 250, они обе показывают большую производительность, по сравнению с прямыми конкурентами от Nvidia. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям, чтобы убедиться в выводах окончательно:
Ситуация похожая, но с текстурными выборками новые карты справляются чуть лучше, чем HD 4870, например. Обе модели показывают очень хорошие результаты. Старшая карта почти на уровне HD 4870, но в тесте parallax mapping из-за низкой ПСП она всё же отстаёт. Тут явно виден больший упор производительности в скорость текстурных блоков, так как GTS 250 выигрывает у GTX 260 в этих тестах. Но это даёт ей лишь равные с HD 5750 показатели. А вот HD 5770 заметно быстрее, чем GTX 260.
Рассмотрим результаты ещё двух тестов пиксельных шейдеров версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Тесты отличаются тем, что сильно нагружают и ALU и текстурные модули, обе шейдерные программы сложные, длинные, включают большое количество ветвлений:
- Steep Parallax Mapping значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D графики
- Fur процедурный шейдер, визуализирующий мех
Оба PS 3.0 теста не ограничены пропускной способностью памяти и филлрейтом, они чисто математические. Это даёт возможность новым решениям показать всю свою силу. Ну а сильнейший участник HD 5870 далеко впереди, показывая вдвое больший результат по сравнению с HD 5770, что и должно быть, исходя из теории. Интересно, что результаты HD 4870 находятся как раз между результатами двух карт линейки HD 5700.
В общем, новый чип архитектуры R8xx ведёт себя схоже с предыдущими GPU, у него очень высокая производительность в PS 3.0 тестах. Особенно если сравнивать с производительностью видеокарт Nvidia, которые отстают порой более чем в полтора раза. Это очень неплохой результат, который предполагает сильные результаты и в остальных наших математических тестах.
Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)
Во вторую версию RightMark3D вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.
Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.
Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» от 160 до 320 выборок из карты высот.
Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.
Если не обращать внимания на разницу между решениями AMD и Nvidia, производительность в этом тесте зависит и от количества и скорости блоков TMU, и от филлрейта с ПСП. Результаты в «High» получились примерно в полтора раза ниже, чем в «Low», как и должно быть. В Direct3D 10 тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia традиционно сильны, и новые видеокарты AMD с трудом с ними конкурируют HD 5770 показывает скорость на уровне GTS 250.
С другой стороны, HD 5770 быстрее, чем HD 4870, и это радует. Видеокарта на старом чипе RV770 снова расположилась между двумя моделями новой серии HD 5700. Ну и HD 5870 почти вдвое быстрее HD 5770, как и должно быть, исходя из теории. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:
Включение суперсэмплинга теоретически увеличивает нагрузку в четыре раза, и в этот раз видеокарта на Cypress уже ровно вдвое сильнее, чем более мощное решение на Juniper. Интересно, что теперь HD 4870 конкурирует только с HD 5750, а HD 5770 ещё быстрее. Видимо, влияние ПСП на результат стало меньше, и основной упор всё же в ALU и эффективность ветвлений. GTS 250 потеряла от включения суперсэмплинга очень много и скатилась на последнее место, а вот GTX 260 остался на втором месте, в этом тесте он явно сильнее, чем HD 5770.
Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:
Данный тест несколько интереснее с практической точки зрения, ведь разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются в некоторых проектах, например, в Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».
Ситуация очень близка к той, что мы видели в предыдущем тесте. Результаты очень похожи даже по абсолютным цифрам, кроме провала GTS 250, разве что. В обновленном D3D10 варианте теста без суперсэмплинга, RADEON HD 5870 вдвое быстрее новой HD 5770, как и должно быть в синтетике. RADEON HD 5750 успешно сражается с GTS 250, а вот HD 5770 не может ничего противопоставить своему сопернику в лице Geforce GTX 260.
В лёгком режиме новая карта (HD 5770) чуть не дотягивает до прошлой топовой HD 4870, но в тяжёлом всё-таки опережает её. Посмотрим, что изменит включение суперсэмплинга, в прошлом тесте он вызывал несколько падение скорости на картах Nvidia, особенно на младшем решении.
При включении суперсэмплинга и самозатенения задача становится значительно тяжёлее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между показателями видеокарт изменилась, включение суперсэмплинга сказывается как и в предыдущем случае карты производства Nvidia ухудшают свои показатели относительно решения AMD, особенно GTS 250, которая уныло плетётся в хвосте.
Разница между HD 5770 и HD 5870 в очередной раз примерно двукратная, теоретическая разница снова подтверждается в наших синтетических тестах. RADEON HD 4870 показывает скорость ближе к младшему решению новой линейки HD 5750. HD 5770 сильнее их обеих, но всё же проигрывает своё локальное сражение конкуренту Geforce GTX 260.
Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (вычисления)
Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.
Первый математический тест Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.
Рассказывать при анализе результатов синтетических тестов о том, что в вычислительно сложных задачах современная архитектура AMD показывает себя значительно лучше конкурирующих от Nvidia, нам уже порядком надоело. Это стало нормой и привычным порядком вещей. Подтверждается положение и сейчас, как вы видите на диаграмме в этом тесте даже сравнительно слабые новые решения линейки HD 5700 с запасом обходят соответствующие карты Nvidia.
И почти двукратная разница между HD 5770 и HD 5870 снова налицо. А вот что интересно, так это отличный результат у HD 4870, которая в этом тесте должна даже отставать от HD 5770 из-за своей меньшей тактовой частоты (количество ALU у них равное). Что это, влияние большей пропускной способности, или же какие-то аппаратные особенности GPU? А может оптимизаций в драйверах для RV8xx пока не хватает? В любом случае, от Cypress и Juniper мы ожидали несколько большего в этом тесте, если сравнивать с RV770.
Посмотрим на второй тест шейдерных вычислений, который носит название Fire. Он ещё более тяжёл для ALU, в нём текстурная выборка только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:
Вот во втором тесте скорость рендеринга ограничена исключительно производительностью шейдерных блоков, и других явных ограничений нет. Видимо, в предыдущем математическом тесте сказалась более высокая пропускная способность памяти у HD 4870, по сравнению с HD 5770. А в этот раз мы видим схожий с PS 3.0 тестами результат. И RADEON HD 5870 в этом тесте показывает скорость почти вдвое выше, чем HD 5770.
Что касается рассматриваемой линейки RADEON HD 5700, то они ожидаемо обгоняют соответствующие карты компании Nvidia. Конкуренты далеко позади, она показывают результат почти вдвое ниже. Итог по пиковым математическим вычислениям остаётся неизменным в который раз налицо явное и неоспоримое преимущество всех решений компании AMD.
Direct3D 10: Тесты геометрических шейдеров
В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.
Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления в вершинном или геометрическом. Количество вычислений всегда одинаково.
Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:
Соотношение скоростей при разной геометрической сложности сцен у всех участников теста примерно одинаковое, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не очень сложная и ограничения скорости мощностью потоковых процессоров нет, производительность ограничена чем-то иным, даже не пропускной способностью памяти.
Сложно сделать какие-то выводы, если все решения показывают настолько близкие результаты, нет даже полуторакратной разницы между лучшим и худшим решениями. По опыту предыдущих исследований, лишь двухчиповые видеокарты получают выгоду от своего AFR и показывают результаты, которые почти вдвое выше. Посмотрим, возможно, при переносе части вычислений в геометрический шейдер это положение изменится:
Увы, цифры при увеличении нагрузки почти не изменились. Все карты в этом тесте практически не реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, и показывают аналогичные результаты. Смотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.
«Hyperlight» это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.
Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:
И снова относительные результаты в разных режимах соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть в два раза медленней.
Но в остальном... Явно виден упор скорее в пропускную способность видеопамяти, чем в возможности самих GPU. Это хорошо видно по тому, что HD 4870 значительно быстрее в этот раз. А скорость RADEON HD 5870 снова почти вдвое выше, чем у HD 5770, это также объясняется большей ПСП. Сравнивая линейку HD 5700 с видеокартами Nvidia, отметим, что в этот раз HD 5770 конкурирует с GTX 260, а вот GTS 250 быстрее их обоих, не говоря про HD 5750. Явно в результатах «виноват» упор в пропускную способность памяти и филлрейт.
Цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.
В этот раз цифры выросли больше. Это относится к большинству видеокарт, но не Geforce GTS 250, которая стала единственной, потерявшей скорость от перехода к варианту теста с более активным использованием геометрических шейдеров. Естественно, она стала последней и не может конкурировать с HD 5750.
А вот GTX 260 усилила позиции, и теперь она значительно обгоняет конкурента новую модель RADEON HD 5770. Но это лишь один из синтетических тестов, да и геометрические шейдеры так и не получили особого распространения в игровых приложениях, к сожалению.
Direct3D 10: Скорость выборки текстур из вершинных шейдеров
В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» нет.
Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:
Предыдущие исследования показали, что на результаты этого теста влияет не только скорость текстурирования, но и пропускная способность памяти, примерно в равной степени. И сегодняшний результат это только подтверждает.
Разница между решениями AMD получилась очень интересная. HD 5870 хоть и впереди всех, но опережает HD 4870 совсем немного, что объясняется незначительно увеличившейся ПСП (та же GDDR5 и 256-битная шина, разве что частота выше). Именно из-за низкой ПСП наши сегодняшние герои провалились в данном тесте, и уступают во всех режимах картам Nvidia до полутора раз. Посмотрим на результаты этого же теста с увеличенным количеством текстурных выборок:
Взаимное положение всех протестированных решений изменилось незначительно, показатели всех видеокарт несколько ухудшились. HD 5870 снова впереди HD 4870, но не так уж сильно. За ними следуют обе видеокарты Geforce, и замыкают группу новые решения линейки HD 5700. Но уже заметно, что ПСП хоть и очень важна, но больше всего в лёгком режиме. И чем тяжелее режим, тем лучше относительные результаты новой линейки на чипе Juniper.
Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.
Результаты в тесте «Waves» в общем-то похожи на те, что мы видели в предыдущем тесте вершинных выборок. Но теперь преимущества продукции Nvidia над линейкой RADEON HD 5700 почти нет, оно осталось только в лёгком и среднем режимах для пары HD 5770 и GTX 260. HD 5870 всё так же далеко впереди, а HD 4870 немного проигрывает.
Новые модели семейства RADEON HD 5700 страдают из-за недостаточной для данного синтетического теста пропускной способности памяти. Хотя, как мы уже говорили, этого хватает для соперничества с Geforce. Рассмотрим второй вариант этого же теста:
Изменений почти нет, мы видим всё то же самое. Geforce GTX 260 снова чуть впереди RADEON HD 5770, а HD 5750 примерно на уровне своего конкурента GTS 250. RADEON HD 5870 в этот раз показала даже более чем вдвое больший результат, по сравнению с HD 5770, что может объясняться какими-то небольшими архитектурными отличиями (размер кэшей, их пропускная способность и т.п.). Впрочем, похоже, что наши VTF тесты в RightMark 2.0 в любом случае уже не могут показать адекватной разницы между такими решениями.
Выводы по синтетическим тестам
На основе результатов синтетических тестов новых моделей RADEON HD 5770 и HD 5750, основанных на чипе RV840 «Juniper», а также результатов других моделей видеокарт обоих производителей видеочипов, мы делаем вывод о том, что новые решения компании AMD примерно соответствуют по скорости предыдущим топовым решениям вроде RADEON HD 4870, что является явным успехом. Можно предположить, что и в игровых приложениях их результаты будут достаточно сильными, в том числе по сравнению с конкурентами от Nvidia.
Новый чип относится к архитектуре RV8xx, получившей поддержку DirectX 11 API, и он мало чем отличается от RV870 «Cypress» с архитектурной точки зрения (не считая отсутствия возможности исполнения расчётов с двойной точностью, которая не нужна в игровой графике). Его явным преимуществом, обусловленным применением нового технологического процесса 40 нм, является большое количество различных исполнительных блоков и сравнительно высокая тактовая частота при малом размере чипа и себестоимости. Это позволяет предположить отличные результаты в играх и хорошее соотношение цены и производительности.
Как мы заметили в нескольких синтетических тестах, в некоторых случаях производительность решений на основе Juniper может быть ограничена пропускной способностью памяти. Ведь у чипа лишь 128-битная шина памяти, что вдвое меньше, чем у RV770 и RV870. Использование скоростной GDDR5 памяти помогло повысить ПСП, но этого может быть недостаточно в тех случаях, когда скорость рендеринга в целом ограничена эффективным филлрейтом. И иногда в реальных играх новые решения могут даже немного проигрывать, по сравнению с HD 4870 и HD 4890.
А вот что касается конкуренции с решениями компании Nvidia, то можно сказать, что в большинстве синтетических тестов RADEON HD 5770 и HD 5750 показывают отличные показатели. Они значительно опережают Geforce во всех тестах с активными математическими вычислениями, а в остальных не отстают, кроме случаев недостатка ПСП. Хотя в играх, вполне возможно, решения Nvidia будут несколько сильнее, чем в теоретических тестах, так как там не требуется особенная математическая мощь.
И ещё один вывод, один из главных НУЖНЫ DIRECTX 11 СИНТЕТИЧЕСКИЕ ТЕСТЫ!!! Желательно взамен не очень хорошо показывающих себя в последнее время синтетических тестов DX10 из RightMark 2.0. К сожалению, пока что мы таких тестов не знаем, а разработка RightMark приостановлена на неопределённый срок. Остаётся ждать известных мастеров этого дела из Futuremark...
Итак, в следующей части статьи мы рассмотрим игровые тесты новых решений компании AMD, основанных на новом GPU. Производительность в современных игровых приложениях должна примерно соответствовать нашим выводам, сделанным при анализе результатов синтетических тестов. HD 5770 должен показать скорость примерно на уровне HD 4870 и GTX 260, а HD 5750 должен составить сильную конкуренцию для GTS 250. Заодно мы проверим, ограничивается ли производительность новых решений невысокой пропускной способностью памяти.
ATI RADEON HD 5770 и 5750 - Часть 3: Игровые тесты (производительность)