ATI RADEON HD 4850 512MB PCI-E
Число шейдерных процессоров выросло в 2.5 раза!
Gigabyte GV-R485-512H-B (RADEON HD 4850) 512MB PCI-E
HIS RADEON HD 4850 512MB PCI-E
MSI R4850-72D512 (RADEON HD 4850) 512MB PCI-E
Powercolor RADEON HD 4850 512MB PCI-E
СОДЕРЖАНИЕ
- Часть 1 Теория и архитектура
- Часть 2 Практическое знакомство
- Особенности видеокарт
- Конфигурация стенда, список тестовых инструментов
- Результаты синтетических тестов
- Результаты игровых тестов (производительность)
ATI RADEON HD 4850 (RV770): Часть 1: Теоретические сведения
Есть такая старая песенка Аллы Пугачевой, где в припеве звучит фраза: «Если долго мучиться, что-нибудь получится…». Вот и AMD, которая ATI, долго мучалась с отставаниями от Nvidia, долго выпускала относительно ущербные продукты (вернее, несбалансированные), вынуждена была спускать цены, чтобы хоть какие-то были продажи… И наконец-то до инженеров дошло то, о чем кричали во всех форумах и в специализированных СМИ, и они исправили ряд ошибок в архитектуре, заодно смогли запихать в ядро аж 800 универсальных процессоров (вместо 320 в 38хх — семействе).
Видимо голодные годы 2005–2007 заставили умы более активно и тщательно продумать новую архитектуру, поскольку кушать-то хочется. И синусоида противостояний ATI-Nvidia перешла на новую фазу, когда уже Nvidia вынуждена после сытой и спокойной жизни пристраиваться к ситуации и снижать цены.
Да, незадолго жо выхода RADEON HD 48xx серии Nvidia заявила о снижении цены на Geforce 9800 GTX с 299 долларов США аж до 199! И о выпуске разогнанного решения 9800 GTX+ по цене в 229 долларов. Понятно, что испуг перед силой 4850 был велик. И весьма дорогой в производстве 9800 GTX теперь будет получать меньше прибыли, но надо же спасать продажи…
А мы сегодня будем изучать эту новинку от ATI (AMD), которая так напугала калифорнийского чипмейкера.
Причем, изучим не только, собственно, референс-карту, но и еще 4 аналога от партнеров AMD, которые, впрочем, ничем не отличаются, а являются просто копиями той же эталонной карты.
Платы
Reference ATI RADEON HD 4850 512MB PCI-E Gigabyte GV-R485-512H-B (RADEON HD 4850) 512MB PCI-E HIS RADEON HD 4850 512MB PCI-E MSI R4850-72D512 (RADEON HD 4850) 512MB PCI-E Powercolor RADEON HD 4850 512MB PCI-E |
|
---|---|
Каждая карта имеет 512 МБ памяти GDDR3 SDRAM,
размещенной в 8 микросхемах (на лицевой стороне PCB)
Микросхемы памяти Qimonda (GDDR3). Микросхемы расчитаны на максимальную частоту работы в 1000 (2000) МГц. |
Понятно, что из-за одинаковой шины обмена с памятью нет никакой нужды кардинально переделывать PCB от RADEON 3850, поэтому принципиально на 4850 она осталась прежней. Однако есть и отличия. Например, расположение микросхем памяти стало четко прямоугольным в две линии под углом в 90 градусов. Разумеется, из-за нового ядра внесены изменения в блок питания видеокарты. Но принципиально разводка не изменилась, поэтому внешне карты 3850 и 4850 очень похожи.
Это фотография ядра, в который разработчики смогли вместить 800 шейдерных процессоров.
Кристалл был получен на 19-й неделе, то есть в начале мая 2008.
Теперь о кулере. Система охлаждения точно такая же, как и у RADEON HD 3850. По сути только изменена форма подошвы, прижимающейся к карте (согласно новому расположению микросхем памяти), а также радиатор стал полностью из медного сплава, поэтому вес карты немного вырос.
Принцип действия тот же: прогон воздуха через радиатор с помощью турбины. Минус: воздух не выносится за пределы системного блока, остается внутри. Плюс: кулер узкий и однослотовый. Плюс номер два: СО тихая, и карта потому получилась весьма бесшумной.
Видеокарты этой серии оснащены собственным звуковым кодеком, поэтому именно этот звуковой поток затем передается на HDMI (с помощью переходника DVI-to-HDMI). Поэтому, если кому эта функция важна, следите за тем, чтобы в комплекте поставки видеокарты был этот переходник.
Также отметим, что питание ускорителя осуществляется с помощью одного 6-пинового разъема.
У карты имеется гнездо TV-выхода, которое уникально по разъему, и для вывода изображения на ТВ как через S-Video, так и по RCA, требуются специальные адаптеры-переходники, поставляемые вместе с картой. Более подробно о ТВ-выходе можно почитать здесь.
Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также поставляются переходники DVI-to-HDMI (мы помним, что данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник), поэтому проблем с такими мониторами также не должно быть.
Максимальные разрешения и частоты:
- 240 Hz Max Refresh Rate
- 2048 × 1536 × 32bit x85Hz Max — по аналоговому интерфейсу
- 2560 × 1600 @ 60Hz Max — по цифровому интерфейсу (все DVI-гнезда с Dual-Link)
Что касается возможностей видеокарт по проигрыванию MPEG2 (DVD-Video), то еще в 2002 году мы изучали этот вопрос, с тех пор мало что поменялось. В зависимости от фильма загрузка CPU при проигрывании на современных видеокартах не поднимается выше 25%.
По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.
К сожалению на настоящий момент утилита RivaTuner (автор А.Николайчук AKA Unwinder) не поддерживает новую серию RV770, и потому мониторинга нет.
Поскольку референс-карта поставляется в ОЕМ-виде как сэмпл, то о комплекте поставки для нее речь не идет.
Комплектация остальных карт.
Базовый комплект поставки должен включать в себя: руководство пользователя, диск с драйверами и утилитами, переходник-адаптер DVI-to-VGA, мост CrossFire, DVI-to-HMDI адаптер, адаптер компонентного вывода (TV-out), а также разветвители внешнего питания. Ниже мы покажем, что предлагается к каждой карте дополнительно.
Упаковки.
Установка и драйверы
Конфигурация тестового стенда:
- Компьютер на базе Intel Core2 (775 Socket)
- процессор Intel Core2 Extreme QX9650 (3000 MHz);
- системная плата Zotac 790i Ultra на чипсете Nvidia nForce 790i Ultra;
- оперативная память 2 GB DDR3 SDRAM Corsair 2000MHz (CAS (tCL)=5; RAS to CAS delay (tRCD)=5; Row Precharge (tRP)=5; tRAS=15);
- жесткий диск WD Caviar SE WD1600JD 160GB SATA.
- блок питания Tagan TG900-BZ 900W.
- операционная система Windows Vista 32bit SP1; DirectX 10.1;
- монитор
Dell 3007WFP (30"). - драйверы ATI версии CATALYST 8.5; Nvidia версии 175.16 (9ххх серия) и 177.34 (GTX 260).
VSync отключен.
Синтетические тесты
Используемые нами пакеты синтетических тестов можно скачать здесь:
- D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org
- D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
- RightMark3D 2.0 с кратким описанием: ссылка (Vista без SP1(!) ссылка (Vista c SP1(!)
Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.
Синтетические тесты проводились на следующих видеокартах:
- RADEON HD 4850 со стандартными параметрами (далее HD4850)
- RADEON HD 3870 с частотами 625/2000 МГц (далее HD3870(625))
- RADEON HD 3870 со стандартными параметрами (далее HD3870)
- Nvidia Geforce GTX 280 со стандартными параметрами (далее GTX280)
- Nvidia Geforce 9800 GTX со стандартными параметрами (далее GF9800GTX)
Для сравнения результатов нового RADEON HD 4850 были выбраны именно эти модели видеокарт по следующим причинам: с RADEON HD 3870 и RADEON HD 3870 на частотах RADEON HD 4850 её будет интересно сравнить, как с предыдущим решением компании AMD, чтобы оценить влияние улучшений архитектуры и разницу в производительности между поколениями. Geforce 9800 GTX один из основных конкурентов (ещё одного конкурента Geforce 9800 GTX+, можно примерно представить самому, промасштабировав производительность) от Nvidia, ну а Geforce GTX 280 тут выступает просто как топовое решение Nvidia на основе новой архитектуры. Эта видеокарта продаётся гораздо дороже, поэтому и сравнивать её с HD 4850 напрямую нет смысла. Она здесь просто ради интереса.
Direct3D 9: Тесты Pixel Filling
В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:
Тут всё как всегда не все видеокарты достигают значений, близких к теоретическим. Чаще всего, результаты синтетики не дотягивают до теории, ближе всего к ним подбираются видеокарты на основе G80 и RV670, они не добирают до теории немного. Но и для видеокарт Nvidia, отличающихся улучшенными TMU, и для нового RV770, в нашем старом тесте теоретический максимум не достигается. RV770 в нашем тесте выбирает лишь около 27 текселей за один такт из 32-битных текстур при билинейной фильтрации, не дотягивая до 40 теоретических.
В любом случае прогресс по сравнению с RV670 заметен прекрасно! Новая карта на одинаковых частотах опережает старую на 86%, это почти вдвое. Естественно, в тесте с одной текстурой HD 3870 обгоняет HD 4850 за счёт большей ПСП, но в случае с большим количеством текстур на пиксель, способности блоков ROP раскрываются, и в таких условиях карта на RV770 становится быстрее. В целом, новая видеокарта AMD по скорости текстурирования располагается между старым решением и конкурентом Geforce 9800 GTX. Посмотрим на результаты в тесте филлрейта:
Второй синтетический тест измеряет скорость заполнения, и в нём мы видим ту же самую ситуацию, но уже с учетом количества записанных в буфер кадра пикселей. В случаях с 0 и 1 накладываемыми текстурами у RADEON HD 4850 получается ровно такой же результат, что и у HD 3870 на тех же частотах, так как в таких режимах производительность ограничена ПСП, а также количеством и рабочей частотой блоков ROP. Но, как и в предыдущем тесте, в ситуациях с большим количеством текстур на пиксель, новая видеоплата выходит вперёд.
Direct3D 9: Тесты Geometry Processing Speed
Рассмотрим пару предельных геометрических тестов, и первым у нас будет самый простой вершинный шейдер, показывающий максимальную пропускную способность по треугольникам:
Все современные чипы основаны на унифицированных архитектурах, их универсальные исполнительные блоки в этом тесте заняты только геометрической работой, и решения показывают высокие результаты, явно упирающиеся не в пиковую производительность унифицированных блоков, а в производительность других блоков, например, triangle setup.
Результаты это и показывают RV670 и RV770 на одной частоте показали одинаковые результаты. Традиционно более высокие, чем результаты чипов Nvidia. RADEON HD 4850 в этом тесте чуть-чуть выигрывает у карт Nvidia и немного отстаёт от более высокочастотного HD 3870. Снова получается, что этот тест зависит исключительно от тактовой частоты GPU.
Мы убрали из рассмотрения промежуточные тесты на скорость обработки геометрии с одним источником освещения, и сразу же переходим к рассмотрению самой сложной геометрической задачи с тремя источниками света, включающей статические и динамические переходы:
В этом варианте разница между решениями AMD и Nvidia видна лучше, разрыв немного увеличился. Интересно, что здесь уже видна разница между HD 3870 и HD 4850 на одинаковых частотах. И новая видеоплата выглядит лучше, будучи снова ограничена чем-то вроде triangle setup цифры то почти не изменились с прошлого раза. В этом тесте все видеокарты AMD опережают и Geforce 9800 GTX и GTX 280. Новый чип всё также отлично проявляет себя в геометрических тестах, но в реальных приложениях универсальные шейдерные процессоры заняты в основном пиксельными расчетами, к исследованию производительности которых мы и переходим.
Direct3D 9: Тесты Pixel Shaders
Первая группа пиксельных шейдеров, которую мы рассматриваем, является очень простой для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0.
Хоть тесты слишком просты для современных архитектур и не показывают их истинную силу, на них интересно посмотреть при смене архитектур. Ведь в простых тестах производительность ограничена скоростью текстурных выборок, а видеокарта HD 4850, которую мы сегодня рассматриваем, основана на чипе RV770, улучшившем свои показатели по текстурированию. Так и есть HD 4850 почти догоняет карты Nvidia, что ранее не было в этом тесте. Он опережает RV670, работающий на тех же частотах, более чем в два раза! Это очень хороший результат от улучшений в TMU.
Да и в более сложных тестах RADEON HD 4850 показывает просто отличные результаты, значительно (в 1.5-2.5 раза) опережая своего предшественника на равных частотах. Особенно удивил тест Marble, в котором достигнут максимальный прирост, и где карта от AMD догнала своего соперника из стана Nvidia. Посмотрим на результаты тестов более сложных пиксельных программ промежуточных версий:
Даже беглый взгляд на диаграмму сразу скажет об отличном результате RV770! Даже в сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water», где используется зависимая выборка из текстур больших уровней вложенности, и карты располагаются по скорости текстурирования, он показал результат на одном уровне с обеими картами Nvidia! Разница с RV670 на равной частоте более чем 3.5 раза!
Второй тест, более интенсивный вычислительно, лучше подходит для архитектур AMD, обладающих большим количеством вычислительных блоков. И в этом тесте новое решение AMD показывает лучший результат. Да-да, быстрее Geforce 280 на GT200. По сравнению с предыдущим поколением HD 3800, новая плата быстрее более чем в два раза. Снова наши самые лучшие оценки архитектурным изменениям, браво AMD!
Direct3D 9: Тесты пиксельных шейдеров New Pixel Shaders
Эти тесты пиксельных шейдеров DirectX 9 ещё сложнее, они делятся на две категории. Начнем с более простых шейдеров версии 2.0:
- Parallax Mapping знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики
- Frozen Glass сложная процедурная текстура замороженного стекла с управляемыми параметрами
Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:
Это математические тесты, зависящие от частоты шейдерных блоков и скорости текстурирования, тут важен баланс чипа. Производительность видеокарт в тесте «Frozen Glass» ограничена не только математикой, но и скоростью текстурных выборок, поэтому старые решения RADEON показывают самый слабый результат. Но посмотрите на нашего героя, он в три раза быстрее предыдущего чипа. И даже немного обогнал Geforce 9800 GTX, слегка отставая лишь от новейшего и мощнейшего GT200!
Это не говоря про второй тест «Parallax Mapping», где решение AMD даже ещё сильнее. В этот раз оно проигрывает только новой видеокарте Nvidia, обгоняя основного конкурента Geforce 9800 GTX. Улучшения в TMU значительно усилили результат HD 4850, она обогнала предыдущий RADEON на той же частоте более чем в два раза. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям, там результат RV770 может получиться даже более ошеломляющим:
Такое впечатление, что RADEON HD 4850 это второй Geforce 9800 GTX. Уж очень близки их показатели в этом тесте. Да, положение немного изменилось, виден явный упор производительности в скорость текстурных блоков. RV770 в обоих тестах показывает результаты на уровне карт Nvidia, немного отставая от топовой (она и стоит заметно дороже, да и чип сложнее, не забывайте). А своих сородичей обгоняет в 2.5-3 раза, выводя HD 4850 в совсем другой класс.
Рассмотрим результаты ещё двух тестов пиксельных шейдеров версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Тесты отличаются тем, что сильно нагружают и ALU и текстурные модули, обе шейдерные программы сложные, длинные, включают большое количество ветвлений:
- Steep Parallax Mapping значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D графики
- Fur процедурный шейдер, визуализирующий мех
Предыдущие разы мы сетовали, что хотя решения AMD обеспечивают эффективное исполнение сложных пиксельных шейдеров версии 3.0 с большим количеством ветвлений, в этом тесте они сильно проигрывают картам Nvidia. С новой архитектурой RV770 мы видим совсем иной расклад HD 4850 опережает всех, и HD 3870 (в 3.5-4 раза!) и Geforce 9800 GTX, и даже Geforce GTX 280! Просто превосходные результаты переработанной архитектуры AMD, это прямо чудо какое-то. Которое можно объяснить значительно измененным чипом, ускоренными текстурными возможностями архитектуры и значительно большей эффективностью использования имеющихся ресурсов.
Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)
В новую версию RightMark3D 2.0 вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два полностью новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.
Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель!) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.
Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» от 160 до 320 выборок из карты высот.
Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.
Производительность в этом тесте зависит не только от количества и скорости блоков TMU, но и от филлрейта и ПСП. Результаты в «High» получились почти в полтора раза ниже, чем в «Low». К сожалению, несмотря на мажорный настрой в Direct3D 9 тестах, Direct3D 10 тесты процедурной визуализации меха с большим количеством текстурных выборок снова показывают огромное преимущество решений Nvidia над AMD. Разве может это объясняться чем-то иным, нежели недоработками драйверов? Сомневаемся. Ибо такой разницы быть не должно ну никак.
Но относительно карт AMD, у героя обзора RADEON HD 4850 получились очень хорошие результаты в этом тесте, он более чем в два раза опередил видеокарту HD 3870 на чипе предыдущего поколения. Хотя до решений Nvidia очень далеко. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:
Включение суперсэмплинга теоретически увеличивает нагрузку в четыре раза. И в этот раз преимущество карт Nvidia никуда не делось, оно подавляющее. В остальном, с увеличением сложности шейдера и нагрузки на видеочип, разница между HD 4850 и HD 3870 остаётся примерно двукратной. Очень неплохо для переработанной архитектуры. Разобраться бы теперь со скоростью решений AMD по сравнению с Nvidia… Geforce 9800 GTX почти в два раза быстрее, про GTX 280 уж и не говорим.
Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:
Этот тест интереснее с практической точки зрения, ведь разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются в некоторых проектах, например, в Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».
Снова повторилась ситуация предыдущего теста. Хотя решения AMD ранее были сильны в Direct3D 9 тестах parallax mapping, в обновленном D3D10 варианте без суперсэмплинга они не могут справиться с нашей задачей на уровне видеокарт Geforce. Да и включение самозатенения вызывает на продукции AMD большее падение производительности, по сравнению с разницей для решений Nvidia.
Рассматриваемый нами HD 4850, хоть и отстаёт от обеих видеокарт Geforce, но снова значительно опережает предшественников от компании AMD. Разница между HD 4850 и HD 3870 на равных частотах достигает 1.7-2 раз. Посмотрим, что изменит включение суперсэмплинга, в прошлом тесте он вызывал большее падение скорости на картах Nvidia.
При включении суперсэмплинга и самозатенения задача получается более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростью разных видеокарт уже несколько другая. Включение суперсэмплинга сказывается как и в предыдущем случае карты производства AMD улучшают свои показатели относительно решений Nvidia. HD 4850 продолжает отставать от всех Geforce, обгоняя в два раза HD 3870. Неплохой результат, если не сравнивать с конкурентом.
Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (вычисления)
Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.
Первый математический тест Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.
При анализе результатов наших синтетических тестов, мы не раз отмечали, что в вычислительно сложных задачах современные архитектуры AMD показывают себя зачастую лучше конкурирующих от Nvidia. Ситуация изменялась со временем, в соперничестве RADEON HD 3870 и Geforce 9800 решение AMD уступает.
Но посмотрите, что показывает в Mineral наш новичок HD 4850… Просто отличную производительность, видеокарта на основе нового чипа RV770 в 2.3 раза обгоняет карту прошлого поколения на RV670, что близко к разнице в количестве потоковых процессоров. В итоге новая видеокарта опережает и прямого конкурента Geforce 9800 GTX (почти в два раза) и даже Geforce GTX 280. Разница между GT200 и RV770 даже не полностью соответствует теоретической мощи, в пользу чипа AMD. Отличный результат!
Второй тест шейдерных вычислений носит название Fire, и он ещё более тяжёл для ALU. В нём текстурная выборка только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:
В данном тесте скорость рендеринга явно ограничена только производительностью шейдерных блоков. Со времени выхода RADEON HD 3870 X2 ошибка в драйверах AMD была исправлена, результат решений AMD стал подобающим теории. Мы видим, что RADEON HD 3870 в этом тесте показывает скорость даже выше, чем у Geforce 9800 GTX, не говоря пока про новую карту.
А что же она? Не оставляет соперникам ни шанса, ровно в 2.5 раза превышая производительность карты на основе чипа RV670, работающего на той же частоте, что полностью соответствует теоретической разнице в количестве шейдерных процессоров. Более чем в два раза быстрее Geforce 9800 GTX и на 40% опережает новинку Nvidia топовую карту на чипе GT200! Мы были полностью правы, когда в обзоре Geforce GTX 280 предположили, что с появлением новых решений AMD, пальма первенства в математических тестах перейдёт к ним.
Direct3D 10: Тесты геометрических шейдеров
В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.
Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления в вершинном или геометрическом. Количество вычислений всегда одинаково.
Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:
Тесты интересны тем, что AMD пообещала увеличение эффективности исполнения геометрических шейдеров. И уже первый же тест показывает явные улучшения. Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не очень сложная и ограничение скорости мощностью потоковых процессоров в тесте не явное, задача ограничена также и ПСП и филлрейтом.
Итак, RADEON HD 4850 показывает результат на уровне конкурирующей Geforce 9800 GTX, даже чуть выше. Немного не достаёт до GT200, но это и не нужно чипы разной сложности и ценовых диапазонов. Зато карта на RV770 чуть более чем в два раза опережает RADEON HD 3870 с теми же частотами, снова мы видим просто отличный результат. Возможно, при переносе части вычислений в геометрический шейдер ситуация будет ещё лучше, посмотрим:
Но нет, разница между рассмотренными вариантами теста невелика, существенных изменений не произошло. Все видеокарты Nvidia показывают почти те же результаты при изменении параметра GS load, отвечающем за перенос части вычислений в геометрический шейдер, а результаты видеоплат AMD немного выросли. Впрочем, ничего не меняется, RADEON HD 4850 вдвое быстрее HD 3870. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры…
«Hyperlight» это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.
Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:
Относительные результаты в разных режимах соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть в два раза медленней. В этот раз скорость RADEON 4850 не в два раза быстрее предыдущего решения, и обе карты производства AMD отстают от всех решений Nvidia.
В прошлые разы мы определили, что упор в тесте получается во что-то отличное от ПСП, филлрейта и вычислительной мощности, и в этот раз обе карты Nvidia практически равны, чего быть не должно. Но RV770 всё же показывает, что даже в этом случае можно улучшить показатели. Похоже, что на его результат повлияли улучшенные возможности текстурирования. Впрочем, цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.
Мы видим, что в RV770 действительно было улучшено исполнение геометрических шейдеров, они устранили один из недостатков предыдущих архитектур и, хотя и не догнали Geforce GTX 280, но опередили как Geforce 9800 GTX, так и RADEON HD 3870. Предыдущее поколение чипов в этом тесте слабее в 1.7-2 раза.
Что касается сравнения результатов в разных режимах, тут всё как всегда, видеоплаты AMD при переходе от использования «instancing» к геометрическому шейдеру при выводе, улучшают свои показатели, а видеокарты Nvidia, кроме GT200, теряют в производительности. Поэтому GT200 тут явный лидер, ну а за второе место спорят RADEON HD 4850 и Geforce 9800 GTX. Что весьма интересно, у карты Geforce на основе чипа G92 скорость в «Balanced» режиме получилась практически точно такая же, что и в «Heavy» у RADEON HD 4850, разница между ними минимальная. При этом, получаемая в разных режимах картинка не отличается визуально.
Direct3D 10: Скорость выборки текстур из вершинных шейдеров
В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» нет.
Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:
Судя по предыдущим исследованиям, на результаты этого теста сильно влияет пропускная способность памяти, и чем проще режим, тем большее влияние на скорость она оказывает. Интересно, что снижение частот у RADEON HD 3870 очень странно повлияло на результаты, такое впечатление, что или драйверы виноваты, или погрешность тестирования.
Во всех режимах лидером является топовая карта Nvidia, затем идёт видеоплата RADEON HD 4850, обзор которой вы читаете. Она опережает своего прямого конкурента в этом тесте пусть и немного, но всё же опережает. Разница с предшествующим RADEON HD 3870 совсем невелика, похоже на ограничения в ПСП. Посмотрим на результаты этого же теста с увеличенным количеством текстурных выборок:
Ситуация изменилась не слишком сильно, но HD 4850 теперь уступает и лидеру Geforce GTX 280 и Geforce 9800 GTX. Интересно, что с ростом сложности геометрии разница между 4850 и 3870 снижается, и новинка даже уступает полноскоростному HD 3870 в самом тяжёлом режиме. Вероятно, сказывается сырость драйверов. Хотя отставание даже от конкурирующего Geforce 9800 GTX совсем небольшое.
Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.
А вот тест «Waves» благосклоннее к продукции AMD, новая модель семейства RADEON HD 4800 смотрится отлично, опережая решение на базе G92 во всех режимах, и даже выигрывает в тяжёлом у GTX 280! Видимо, эффективность TMU у RV770 значительно выше, чем у чипов Nvidia в этих условиях. Хотя, непонятно тогда, почему предшественника решение опережает лишь на 20-40%… Рассмотрим второй вариант этого же теста:
И снова немного изменений. Разве что с увеличением сложности теста результаты видеоплат AMD стали ещё чуть лучше относительно скорости карт Nvidia, так как последние потеряли несколько больше в скорости. Остальные выводы также остаются в силе: в самом лёгком режиме впереди Geforce GTX 280, в среднем они равны с RADEON HD 4850, в наиболее сложном решение на новом чипе RV770 становится лучшим. Снова отмечаем, что в тестах вершинных выборок положение плат AMD стало значительно лучше, чем ранее.
Выводы по синтетическим тестам
На основе результатов синтетических тестов видеокарты RADEON HD 4850 на основе чипа RV770, а также других моделей видеокарт обоих основных производителей видеочипов, мы можем сделать вывод, что новое решение компании AMD превзошло все смелые ожидания. В чипе было сделано настолько много изменений и исправлений архитектуры, что почти во всех синтетических тестах оно в разы опережает по скорости варианты видеокарт предыдущего поколения, до двух-трёх раз и даже более! Мало того, во многих тестах карта на RV770 показывает результат на уровне и даже выше, чем у значительно более дорогого Geforce GTX 280! Всё это благодаря улучшенной архитектуре RV770, в которой исправили все недостатки, увеличили количество исполнительных блоков ALU и TMU, усилили TMU и ROP, сделали многое другое.
Очень важно, что увеличение производительности достигнуто не только за счёт банального увеличения количества исполнительных блоков, но и действительно эффективных улучшений архитектуры по сравнению с RV670. RV770 явно исправил ошибки предыдущих чипов, стал гораздо более эффективным и сбалансированным, что весьма важно как для современных, так и для будущих приложений с большим количеством сложных шейдеров.
Особое внимание уделено устранению недостатков в RV670, изменены к лучшему возможности и производительность всех важнейших блоков чипа, и теперь новые видеокарты серии RADEON HD 4800 можно признать прекрасно сбалансированными для разных приложений, требовательных к шейдерной производительности, сложному текстурированию и филлрейту. Чип RV770 обладает большим количеством исполнительных блоков, поддерживает новую память GDDR5, которая позволила выпустить решение HD 4870 с высокой ПСП на основе лишь 256-битной шины обмена с памятью. Собственно, мы не видим явных технических недостатков и просчётов у данного решения вообще, вот таким хорошим получился видеочип у AMD.
Ну а следующая часть нашей статьи содержит тесты нового решения компании AMD в современных игровых приложениях. Игровые результаты должны показать справедливость наших выводов по анализу результатов синтетических тестов. Хотя скорость рендеринга в играх сильнее зависит от скорости текстурирования и филлрейта, у новых решений серии RADEON HD 4800 с этим нет никаких проблем. Можно предположить, что в среднем скорость HD 4850 в играх будет примерно на уровне Geforce 9800 GTX, может быть чуть выше.
ATI RADEON HD 4850 (RV770) — Часть 3: Игровые тесты (производительность)
Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia
Дополнительно |
|