Почти половина от 4870 плюс 128bit шина, что получится? –
Новый супершустряк в 3D-графике, если в кармане мало денег.
СОДЕРЖАНИЕ
- Часть 1 Теория и архитектура
- Часть 2 Практическое знакомство
- Особенности видеокарт
- Конфигурация стенда, список тестовых инструментов
- Результаты синтетических тестов
- Результаты игровых тестов (производительность)
Часть 1: Теория и архитектура
Давненько у нас не было базовых обзоров low-end решений с рекомендуемой ценой менее $100… Длительное время low-end видеокарты считаются плохо подходящими для современных игр, так как зачастую они не обеспечивают приемлемой производительности в игровых приложениях даже не на максимальных настройках качества. Но время идёт, и всё меняется. Конкурентная борьба чуть раньше сделала возможным выпуск мощных решений нижнего среднего ценового диапазона (например, Radeon HD 3850 и Geforce 9600 GT), а теперь, похоже, пришло время и для нижнего ценового сектора.
Важно понимать, что не только постепенное увеличение производительности видеокарт всех ценовых диапазонов даёт такой эффект. Это естественный процесс развития индустрии. Весьма сильное влияние на игровые проекты сейчас оказывают консоли, и большинство выходящих игр являются мультиплатформенными, они проектируются одновременно и для персональных компьютеров, и для двух основных игровых консолей текущего поколения: Microsoft Xbox 360 и Sony PlayStation 3.
Естественно, мощности и ресурсы консолей ограничены единственной конфигурацией, по сравнению с персональными компьютерами, и уже через пару лет после их выпуска, по 3D-производительности они начинают отставать даже от сравнительно недорогих ПК конфигураций. И выходящие для компьютеров видеокарты даже из нижнего ценового диапазона вполне способны обеспечить ту необходимую мощность, которая требуется мультиплатформенными играми. Большая производительность дорогих 3D-видеокарт часто расходуется на сверхвысокие разрешения, большие уровни сглаживания и лучшую текстурную фильтрацию. И редкие эксклюзивные для ПК проекты, вроде Crysis и S.T.A.L.K.E.R.: Clear Sky.
Сегодня мы рассматриваем новые решения для нижнего ценового диапазона от компании AMD, которые вполне могут стать теми low-end видеокартами, способными на вполне приемлемую игровую производительность в большинстве проектов за относительно небольшие деньги. Все представляемые сегодня решения и видеочипы основаны на архитектуре RV7xx, на которой базируются и весьма удачные решения серии RADEON HD 4800, получившие очень хорошие оценки в обзорах и у пользователей. Пока что в практической части нашей статьи будет только самый быстрый вариант на основе чипа RV730, но мы приведём и характеристики менее производительных видеокарт.
Перед прочтением данного материала мы рекомендуем внимательно ознакомиться с базовыми теоретическими материалами DX Current, DX Next и Longhorn, описывающими различные аспекты современных аппаратных ускорителей графики и архитектурные особенности предыдущей продукции Nvidia и AMD.
- [06.06.05] Longhorn ускорители и шейдеры для DirectX 10
- [01.03.05] DirectX.Update Ускорители 3D-графики: полшага вперед
- [09.04.04] DX.Next: ближайшее и ближнее будущее аппаратного ускорения 3D-графики
Эти материалы достаточно точно спрогнозировали текущую ситуацию с архитектурами видеочипов, оправдались многие предположения о будущих решениях. Подробную информацию об унифицированных архитектурах AMD R6xx, RV6xx и RV7xx на примере предыдущих решений, можно найти в следующих статьях:
- [14.05.07] Долгожданное появление DirectX 10-семейства от AMD/ATI
- [04.07.07] ATI RADEON HD 2400-2600-серии: новые решения от AMD для среднего и бюджетного секторов с поддержкой DirectX 10
- [19.11.07] ATI RADEON 3850/3870 (RV670): 320 шейдерных процессора с 256-битной шиной памяти
- [30.06.08] ATI RADEON HD 4850 (RV770): Число шейдерных процессоров выросло в 2.5 раза!
- [08.07.08] ATI RADEON HD 4870 512MB PCI-E: закрепляет успех AMD!
Итак, давайте рассмотрим подробные характеристики новых видеоплат серий RADEON HD 4600 и 4500, основанных на новых чипах RV730 и RV710.
Графические ускорители серии RADEON HD 4600
- кодовое имя чипа RV730;
- технология 55 нм;
- 514 миллионов транзисторов;
- унифицированная архитектура с массивом общих процессоров для потоковой обработки вершин и пикселей, а также других видов данных;
- аппаратная поддержка DirectX 10.1, в том числе и новой шейдерной модели Shader Model 4.1, генерации геометрии и записи промежуточных данных из шейдеров (stream output);
- 128-битная шина памяти: два контроллера шириной по 64 бита с поддержкой памяти DDR2/DDR3/GDDR2/GDDR3;
- частота ядра 600-750 МГц;
- 8 SIMD ядер, включающих 320 скалярных ALU для расчётов с плавающей точкой (целочисленные и плавающие форматы, поддержка FP32 и FP64 точности в рамках стандарта IEEE 754);
- 8 укрупненных текстурных блоков, с поддержкой FP16 и FP32 форматов;
- 32 блока текстурной адресации;
- 128 блоков текстурной выборки;
- 32 блока билинейной фильтрации с возможностью фильтрации FP16 текстур на полной скорости и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов;
- возможность динамических ветвлений в пиксельных и вершинных шейдерах;
- 8 блоков ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Пиковая производительность до 8 отсчетов за такт (в т.ч. и для режимов MSAA 2x/4x, в том числе для буферов формата FP16), в режиме без цвета (Z only) 32 отсчета за такт;
- запись результатов до 8 буферов кадра одновременно (MRT);
- интегрированная поддержка двух RAMDAC, двух портов Dual Link DVI, HDMI, HDTV, DisplayPort.
Спецификации карты RADEON HD 4670
- частота ядра 750 МГц;
- количество универсальных процессоров 320;
- количество текстурных блоков 32, блоков блендинга 8;
- эффективная частота памяти 2000 МГц (2*1000 МГц)/1800 МГц (2*900 МГц);
- тип памяти GDDR3/DDR3;
- объем памяти 512 МБ/1 ГБ;
- пропускная способность памяти 32,0/28,8 ГБ/с;
- теоретическая максимальная скорость закраски 6,0 гигапикселей в с;
- теоретическая скорость выборки текстур 24,0 гигатекселей в с;
- два CrossFireX разъема;
- шина PCI Express 2.0 x16;
- два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600;
- TV-Out, HDTV-Out, поддержка HDCP, HDMI, DisplayPort;
- энергопотребление менее 75 Вт (без дополнительных разъёмов);
- однослотовый дизайн;
- рекомендуемая цена $79.
Спецификации карты RADEON HD 4650
- частота ядра 600 МГц;
- количество универсальных процессоров 320;
- количество текстурных блоков 32, блоков блендинга 8;
- эффективная частота памяти 1000 МГц (2*500 МГц);
- тип памяти DDR2;
- объем памяти 512 МБ;
- пропускная способность памяти 16.0 ГБ/с;
- теоретическая максимальная скорость закраски 4,8 гигапикселей в с;
- теоретическая скорость выборки текстур 19,2 гигатекселей в с;
- два CrossFireX разъема;
- шина PCI Express 2.0 x16;
- два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600;
- TV-Out, HDTV-Out, поддержка HDCP, HDMI, DisplayPort;
- энергопотребление менее 60 Вт (без дополнительных разъёмов);
- однослотовый дизайн;
- рекомендуемая цена $69.
Графические ускорители серии RADEON HD 4500
- кодовое имя чипа RV710;
- технология 55 нм;
- 242 миллиона транзисторов;
- унифицированная архитектура с массивом общих процессоров для потоковой обработки вершин и пикселей, а также других видов данных;
- аппаратная поддержка DirectX 10.1, в том числе и новой шейдерной модели Shader Model 4.1, генерации геометрии и записи промежуточных данных из шейдеров (stream output);
- 64-битная шина памяти: один контроллер шириной 64 бита с поддержкой памяти DDR2/DDR3/GDDR2/GDDR3;
- частота ядра 600 МГц;
- 2 SIMD ядра, включающих 80 скалярных ALU для расчётов с плавающей точкой (целочисленные и плавающие форматы, поддержка FP32 и FP64 точности в рамках стандарта IEEE 754);
- 2 укрупненных текстурных блока, с поддержкой FP16 и FP32 форматов;
- 8 блоков текстурной адресации;
- 32 блоков текстурной выборки;
- 8 блока билинейной фильтрации с возможностью фильтрации FP16 текстур на полной скорости и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов;
- возможность динамических ветвлений в пиксельных и вершинных шейдерах;
- 4 блока ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Пиковая производительность до 4 отсчетов за такт (в том числе и для режимов MSAA 2x/4x, в том числе для буферов формата FP16), в режиме без цвета (Z only) 16 отсчетов за такт;
- запись результатов до 8 буферов кадра одновременно (MRT);
- интегрированная поддержка двух RAMDAC, двух портов Dual Link DVI, HDMI, HDTV, DisplayPort.
Спецификации карты RADEON HD 4550
- частота ядра 600 МГц;
- количество универсальных процессоров 80;
- количество текстурных блоков 8, блоков блендинга 4;
- эффективная частота памяти 1600 МГц (2*800 МГц);
- тип памяти DDR3;
- объем памяти 256/512 МБ;
- пропускная способность памяти 14,4 ГБ/с;
- теоретическая максимальная скорость закраски 2,4 гигапикселей в с;
- теоретическая скорость выборки текстур 4,8 гигатекселей в с;
- шина PCI Express 2.0 x16;
- два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600;
- TV-Out, HDTV-Out, поддержка HDCP, HDMI, DisplayPort;
- энергопотребление менее 25 Вт (без дополнительных разъёмов);
- однослотовый дизайн, пассивное охлаждение;
- рекомендуемая цена $29-35.
Компания AMD продолжает выпуск графических решений по 55 нм технологическим нормам, теперь пришло время и для low-end чипов семейства RV7xx. По сравнению с до сих пор широко используемой Nvidia технологией 65 нм, этот более совершенный технологический процесс даёт следующие преимущества: меньшую площадь ядра, увеличенный частотный потенциал и процент выхода годных чипов на требуемых тактовых частотах. Всё это влечёт за собой и меньшую себестоимость. Как и предыдущие решения на RV770, новые чипы весьма эффективны энергетически и с точки зрения производительности на площадь чипов.
Маркировка решений осталась в стиле предыдущей серии HD 3000, поменялась только первая цифра. Позиционирование HD 4650 совпадает с положением HD 3650 во время их выпуска, а новые решения HD 4670 и HD 4550 будут занимать промежуточные положения в линейке. Так как чипы RV730 и RV710 создавались для замены предыдущих семейств AMD, серия HD 3000 будет постепенно вытесняться ими в продаже.
Варианты HD 4670 и 4650, как обычно у AMD, отличаются тактовыми частотами, и видеочипа и памяти. Но это не единственное отличие между моделями карт на старшей установлена память типа GDDR3 или новая DDR3 большего объёма, а на младшей DDR2. Из других отличий старшего варианта большее энергопотребление и лишь чуть-чуть меньшая рекомендованная цена. Впрочем, посмотрим ещё на реальные розничные цены…
Объём видеопамяти у low-end карт всегда очень сильно зависит от её типа. В случае недорогой DDR2 и DDR3 памяти, обычно её ставят больше. У HD 4600 минимальным объёмом является 512 МБ, что очень хорошо, так как современные игры очень требовательны к объёму видеопамяти и используют обычно 500-600 МБ, а в редких случаях и более. Объём памяти в 512 МБ на данный момент является оптимальным количеством памяти для видеокарт нижнего и среднего уровня. И лишь самая дешёвая модель HD 4550 предлагает, в том числе, и вариант с 256 МБ DDR3 памяти, для карты такого уровня это решение оправдано.
Архитектура чипов RV730 и RV710
По сути, всю теорию о новой архитектуре AMD можно получить из нашей базовой статьи по RV770. GPU для решений нижних ценовых диапазонов, которые мы сегодня рассматриваем, отличаются от RV770 лишь количественно (впрочем, небольшие нюансы есть и здесь). Текущая архитектура хорошо масштабируется в обе стороны, что мы и видим сейчас на примере low-end решений. Схемы чипов RV730 и RV710 выглядят так:
По схеме видно, что RV730 отличается от RV760 количеством разнообразных исполнительных блоков: ALU, ROP, TMU, во всем остальном повторяя старшее решение. У RV710 отличий несколько больше, они не только количественные (блоков ALU, ROP и TMU ещё меньше), но есть и одно качественное кэш первого уровня совмещает кэширование вершинных и пиксельных данных, в отличие от раздельных у старших решений. Основные количественные изменения: число шейдерных процессоров в RV730 снижено до 64 (320 ALU) а в RV710 до 16 (80 ALU), число блоков текстурирования до 32 и 8, соответственно. Но в этот раз блоков ROP у младших чипов разное количество 8 и 4 для RV730 и RV710, соответственно. Кстати, из других отличий RV730/RV710 от RV770 разное количество как SIMD ядер, так и количества потоковых процессоров внутри каждого ядра (восемь ALU вместо шестнадцати).
Естественно, все эти изменения сделаны для снижения количества транзисторов и площади чипов, что понятным образом скажется на производительности относительно быстрейшего GPU линейки. Обо всех остальных архитектурных особенностях RV7xx вы можете узнать из базового материала, ссылка на который приведена выше. Также, у младших чипов вместо 256-битной шины сделана поддержка 128-битной и 64-битной для RV730 и RV710, соответственно, а всё остальное, написанное в основном материале, относится и к ним тоже.
Наиболее важное изменение новых GPU заключается в том, что в отличие от RV770, соотношение между количеством блоков TMU и ALU здесь иное. Хотя каждое SIMD ядро имеет по четыре выделенных текстурных модуля, число ALU внутри SIMD отличается, и соотношение между ALU и TMU теперь стало не 4:1, а 2:1. То есть, число текстурных модулей в RV730, по сравнению с RV770, снизилось незначительно (с 40 до 32), а число ALU сильнее — с 800 до 320. Получается, что в AMD сделали ещё один шаг в обратную от архитектуры R6xx и RV6xx сторону. И хотя каждый из 32 и 8 блоков текстурирования в RV730 и RV710 несколько слабее, чем в RV6xx, их увеличенное количество и эффективность должны дать прирост скорости текстурных выборок.
Поговорим немного о применении нового для видеокарт типа памяти на решениях серий HD 4600 и HD 4500. Для так называемых mainstream-видеокарт компанией AMD впервые использованы микросхемы памяти DDR3 (не путать с GDDR3!). Несмотря на то, что она обеспечивает ту же производительность, что и GDDR3 (на равных частотах, естественно), предполагается, что в ближайшем будущем стоимость DDR3-памяти сравняется со стоимостью микросхем DDR2, которые сейчас крайне дёшевы. Соответственно, за счёт этого у производителей видеокарт будет возможность комплектации видеокарт большими объемами сравнительно быстрой видеопамяти.
DirectX 10.1
Уже в который раз компания AMD упирает на поддержку всеми видеокартами серий HD 4000 (а также и HD 3000) обновленной версии основного графического API от Microsoft — DirectX 10.1. Эта версия расширяет некоторые ограничения предыдущей, и упрощает использование некоторых техник и алгоритмов. Следует упомянуть и улучшенные возможности сглаживания, позволяющие повысить качество изображения в некоторых случаях. Но основным преимуществом этой версии API в ближайшем будущем станет увеличение производительности некоторых алгоритмов за счёт снижения количества необходимых проходов рендеринга. И, скорее всего, первые DirectX 10.1 игры будут отличаться в основном этим, а не какими-то видимыми качественными улучшениями. Подробнее о возможностях этого API вы можете прочитать в базовом обзоре RV670.
Первыми играми с поддержкой DirectX 10.1 предполагаются проекты от Electronic Arts и Phenomic Studio, SEGA и NHN Games. Это онлайновая RTS Battleforge, футуристическая RTS Stormrise, и RPG под названием Cloud 9. Заявлено, что все эти проекты используют возможности DirectX 10.1 для увеличения производительности рендеринга и качества картинки. Сроки выхода данных игр пока не называются — вероятнее всего, проекты выйдут уже в 2009 году.
Технология ATI Avivo
Как и в старший чип серии, в RV730 и RV710 встроен модуль обработки видеоданных Unified Video Decoder второго поколения (UVD 2). Он появился в решениях серии Radeon HD 3000 и позднее был без существенных изменений перенесен в HD 4000. UVD2 аппаратно декодирует видеоданные во всех наиболее распространённых форматах: H.264, VC-1 и MPEG-2. В новых решениях серии HD 4000 видеопроцессор был модифицирован для поддержки одновременного декодирования двух полноформатных (1080p) потоков видео для обеспечения возможностей, которые иногда встречаются на дисках Blu-ray. Также добавились улучшенные возможности по постобработке видео, такие как масштабирование DVD-видео до HD-разрешений, а также динамическая регулировка контрастности.
Улучшенное масштабирование
Технология ATI Avivo в серии Radeon HD 4000 включает в себя высококачественное масштабирование видеоданных из низкого разрешения (например, DVD) в более высокие HD (720p, 1080p). Таким образом, стандартные DVD с разрешением 720x480 или 720x576 при выводе на HD устройства вывода с разрешением 1920x1080 или 1920x1200 с ATI Avivo HD масштабированием обеспечат лучшее качество, чем с обычно применяемым программным масштабированием плееров. Вот пример, который приводит в презентациях компания AMD:
В целом, хорошо видно, что чёткость на левой части картинки выше, чем на правой, как по вертикали, так и по горизонтали. В будущих исследованиях скорости и качества декодирования видео при помощи GPU, мы постараемся рассмотреть этот вопрос более подробно.
Динамическая регулировка контрастности
Контрастность сильно влияет на восприятие визуальных данных. Изображения с низкой контрастностью обычно выглядят тусклыми и менее чёткими, когда мелкие детали в некоторых участках изображения плохо различимы. И хотя большинство плееров позволяют подстраивать контрастность, эти настройки не меняются от сцены к сцене, хотя оптимальные настройки контрастности для разных сцен будут разными.
В ATI Avivo HD есть возможность динамического изменения контрастности видеопотока. При помощи специальных алгоритмов постобработки, контрастность изображения автоматически подстраивается, постоянно адаптируясь к изменению параметров изображения. Это обеспечивает улучшенное восприятие видео человеком, в результате, давая большее количество деталей и чёткость (слева — фрагмент картинки с включенной обработкой):
Управление питанием PowerPlay
Новыми чипами поддерживается второе поколение технологии ATI PowerPlay. Эта технология динамического управления питанием получила дальнейшие усовершенствования, её суть в том, что специальная управляющая схема в чипе отслеживает загрузку работой и определяет оптимальный рабочий режим, управляя рабочей частотой чипа, памяти, напряжением питания и другими параметрами, оптимизируя энергопотребление и тепловыделение.
В режиме низкой нагрузки при выводе 2D-картинки и невысокой загрузке GPU, его напряжение и частоты будут максимально снижены, как и частота вращения вентилятора, в режиме средней 3D-нагрузки все параметры установятся на средние значения, а при максимальной работе видеочипа частоты с напряжением будут выставлены максимальными. Таким образом, за счёт обновленной технологии управления питанием была значительно увеличена энергетическая эффективность чипов серии RV7xx, по сравнению с предыдущим поколением видеокарт.
Итак, мы познакомились с теоретическими особенностями новых low-end чипов на основе архитектуры RV7xx, в следующей части статьи вас ждёт практическая часть исследования, в которой мы узнаем, как производительность новых решений на их основе соотносится со скоростью предыдущих решений компании AMD и конкурирующих видеокарт Nvidia в нашем обычном наборе синтетических тестов.