СОДЕРЖАНИЕ
- Часть 1 Теория и архитектура
- Часть 2 Практическое знакомство
- Особенности видеокарт
- Конфигурация стенда, список тестовых инструментов
- Результаты игровых тестов (производительность)
Часть 1: Теория и архитектура
Довольно давно у нас не было базовых обзоров решений из нижних ценовых диапазонов с рекомендуемыми ценами менее $100. Хотя сейчас даже такие дешёвые решения зачастую обеспечивают приемлемую производительность в большинстве игровых приложений, и особенно — в мультиплатформенных проектах. Сначала очень мощные решения были выпущены в средний ценовой диапазон, а затем, пришло время и нижнего ценового сектора.
Совсем недавно и AMD и Nvidia выпустили новые модели для верхнего ценового диапазона. Но ведь основная масса покупаемых видеокарт явно не стоит по $250 и выше. Тем более в жёстких условиях продолжающегося непростого экономического положения во всём мире. А задавался ли наш читатель вопросом, к какому ценовому диапазону принадлежат наиболее массовые видеокарты? Компания AMD приводит такой график, основанный на исследованиях известной компании Mecrury Research, и показывающий доли рынка в последнем квартале прошлого года, занятые дискретными видеокартами разных ценовых сегментов:
Как видно на диаграмме, больше всего видеокарт продаётся по $50, $100 и выше $250. Понятно, что пользователь покупает продукт по той цене, что предлагает продавец, но хорошо видно, что именно сектор около $100 является одним из наиболее массовых. Именно поэтому компания AMD решила выпустить новое решение в этот ценовой диапазон. Причём, решение примечательное не только ценой, но и новейшим технологическим процессом, на котором был произведён этот GPU.
Казалось бы — что интересного в переходе на очередной технологический процесс? И GPU и CPU постепенно выпускаются по более совершенным техпроцессам, это совершенно обычное дело. Но именно сейчас произошло любопытное событие, хоть и не имеющее особенных следствий. Вспомните, раньше всегда именно CPU переходили на более «тонкие» техпроцессы первыми, по сравнению с видеочипами. И хотя технологические процессы на фабриках, например, Intel и TSMC (Taiwan Semiconductor Manufacturing Company) совершенно разные, и сравнивать их напрямую не совсем корректно, GPU всё равно отставали ранее от универсальных процессоров в деле освоения техпроцессов.
И вот, в конце апреля 2009 года произошло любопытное событие, которому посвящена сегодняшняя статья, — компания AMD официально анонсировала и выпустила на рынок новое решение, получившее название RADEON HD 4770 и основанное на чипе RV740. Это — первый в мире видеочип, произведённый по 40 нм нормам, и именно сегодня по «тонкости» техпроцесса GPU впервые за всё время обогнали CPU. Вроде бы просто любопытный факт и ничего особенного, однако перспективы у 40 нм техпроцесса для производства будущих GPU весьма хороши.
Когда переход от 65 нм к 45 нм только начался, TSMC анонсировала предполагаемое время массового выпуска продукции на 32 нм техпроцессе — 2009 год. А 40 нм продукция должна была быть переходной между 45 нм и 32 нм. Но из-за конкуренции с другими фабриками TSMC предпочла пропустить 45 нм техпроцесс, предложив сразу 40 нм. Понятно, что одним из важнейших партнёров по выпуску подобной продукции стала компания AMD, которая раньше Nvidia осваивала и предыдущие техпроцессы тайваньских фабрик при производстве GPU. Но хотя чипы AMD стали первыми, которые производятся по 40 нм техпроцессу, произошло это несколько позднее ранее запланированного срока.
Так как RV740 является представителем архитектуры RADEON HD 4000 (R7xx), все подробности о ней можно прочитать в базовом обзоре на нашем сайте. Эта архитектура является сильно переработанной архитектурой R6xx, в которую были внесены изменения, положительно сказавшиеся на функциональности и производительности GPU. Подробную информацию об унифицированных архитектурах R7xx/R6xx на примере предыдущих решений можно найти в следующих статьях на нашем сайте:
- [20.04.09] ATI RADEON HD 4870 (RV770) Самый мощный однопроцессорный 3D ускоритель от AMD
- [08.07.08] ATI RADEON HD 4870 (RV770) закрепляет успех AMD
- [30.06.08] ATI RADEON HD 4850 (RV770): Число шейдерных процессоров выросло в 2.5 раза!
- [19.11.07] ATI RADEON 3850/3870 (RV670): 320 шейдерных процессора с 256-битной шиной памяти
- [04.07.07] ATI RADEON HD 2400-2600-серии: новые решения от AMD для среднего и бюджетного секторов с поддержкой DirectX 10
- [14.05.07] Долгожданное появление DirectX 10-семейства от AMD/ATI
Итак, будем считать, что с архитектурой RV7xx читатели знакомы, и рассмотрим подробные характеристики новой модели видеоплаты серии RADEON HD 4700, основанной на новом GPU с кодовым именем RV740:
Графический ускоритель RADEON HD 4770
- Кодовое имя чипа RV740
- Технология 40 нм
- 826 (в отличие от 956-959 у RV770 и RV790) миллионов транзисторов
- Унифицированная архитектура с массивом общих процессоров для потоковой обработки вершин и пикселей, а также других видов данных
- Аппаратная поддержка DirectX 10.1, в том числе и новой шейдерной модели Shader Model 4.1, генерации геометрии и записи промежуточных данных из шейдеров (stream output)
- 128-битная шина памяти: два контроллера шириной по 64 бита с поддержкой GDDR3/GDDR5
- Частота ядра 750 МГц
- 8 SIMD ядер, включающих 640 скалярных ALU для расчётов с плавающей точкой (целочисленные и плавающие форматы, поддержка FP32 и FP64 точности в рамках стандарта IEEE 754)
- 8 укрупненных текстурных блоков, с поддержкой FP16 и FP32 форматов
- 32 блока текстурной адресации
- 128 блоков текстурной выборки
- 32 блока билинейной фильтрации с возможностью фильтрации FP16 текстур на полной скорости и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
- Возможность динамических ветвлений в пиксельных и вершинных шейдерах
- 16 блоков ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Пиковая производительность до 16 отсчетов за такт (в т.ч. и для режимов MSAA 2x/4x, в т.ч. для буферов формата FP16), в режиме без цвета (Z only) 64 отсчета за такт
- Запись результатов до 8 буферов кадра одновременно (MRT)
- Интегрированная поддержка двух RAMDAC, двух портов Dual Link DVI, HDMI, HDTV, DisplayPort
Спецификации карты RADEON HD 4770
- Частота ядра 750 МГц
- Количество универсальных процессоров 640
- Количество текстурных блоков 32, блоков блендинга 16
- Эффективная частота памяти 3200 МГц (4*800 МГц)
- Тип памяти GDDR5
- Объем памяти 512 мегабайт
- Пропускная способность памяти 51.2 гигабайт в сек.
- Теоретическая максимальная скорость закраски 12.0 гигапикселей в сек.
- Теоретическая скорость выборки текстур 24.0 гигатекселей в сек.
- Два CrossFireX разъема
- Шина PCI Express 2.0 x16
- Два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600
- TV-Out, HDTV-Out, поддержка HDCP, HDMI, DisplayPort
- Энергопотребление до 80 Вт
- Двухслотовый дизайн
- Рекомендуемая цена для рынка США $99
Компания AMD называет свой RADEON HD 4770 самым быстрым решением среди видеокарт с ценой ниже $100. Собственно, цена решения только номинально ниже этой планки, и правильнее будет назвать новую карту быстрейшей за сотню долларов. В будущем ожидается и менее производительное решение HD 4750, которое будет ещё дешевле. А RADEON HD 4770 пришёл на смену HD 4830, основанному на чипе RV770, который становится невыгодным при производстве, если продавать его в розницу за $100.
Как раз во многом именно производство нового чипа по техпроцессу 40 нм и позволило компании AMD выпустить весьма производительное решение, превосходящее по теоретическим параметрам старую модель RADEON HD 4830. Новая видеокарта отличается от устаревшей улучшенными скоростными характеристиками и потребляет значительно меньше энергии. В этом заслуга и нового 40 нм чипа и установленной на плату GDDR5 памяти.
Как обычно, обратим внимание на объём памяти и наименование модели. Вполне логично, что на HD 4770 решили устанавливать именно 512 МБ памяти. Хотя для новых решений предпочтительнее уже один гигабайт видеопамяти, но для данного ценового диапазона установка такого количества GDDR5 памяти неоправданна. Да и до сих пор именно 512 МБ является оптимальным объёмом для видеокарт такого уровня, на которых обычно не применяется сглаживание с большим количеством выборок.
Но наименование анонсированной модели не совсем логично, на наш взгляд. С одной стороны, первые две цифры указывают, что серия 4700 менее «продвинутая», по сравнению с 4800, но с другой — две последние цифры у 4770 больше, чем у той же 4850, имеющей лучшие характеристики. И неопытному пользователю непросто будет выбрать между HD 4850 и HD 4770, руководствуясь только их названиями. Впрочем, далеко не в первый раз…
Архитектура и особенности решения
Основные теоретические особенности новой архитектуры AMD можно получить из нашей базовой статьи по RV770. GPU для нижнего ценового диапазона, которое мы сегодня рассматриваем, отличается от RV770 только количественно, разве что с некоторыми особенностями, которые мы рассмотрим далее. Ранее, мы убедились, что архитектура R7xx хорошо масштабируется, и теперь ещё раз видим это по схеме RV740:
Видно, что RV740 отличается от RV770/RV790 количеством исполнительных блоков ALU и TMU, а также уменьшенным вдвое количеством 64-битных контроллеров памяти. Новый чип полностью повторяет структуру RV770, точнее, его варианта RV770LE, который используется в RADEON HD 4830, и часть исполнительных блоков которого отключена.
Основные количественные изменения: число шейдерных процессоров в RV740 снижено до 640 ALU, число блоков текстурирования до 32 TMU. Но блоки ROP в этот раз для младшего чипа не стали урезать. Все остальные архитектурные особенности R7xx подробнейше рассмотрены в базовом материале, ссылка на который была дана выше.
В последствиях перехода на новый техпроцесс и снижения стоимости такого мощного решения нужно особо отметить ещё и переход от 256-битной шины памяти к 128-битной. Площадь чипа на 40 нм гораздо меньше, чем на 55 нм, и поэтому разводка 256-битной шины на RV740 просто невозможна. Да и для снижения себестоимости производства печатной платы переход на 128-бит также полезен.
Всё это логично и понятно… Но как не потерять в пропускной способности видеопамяти, ведь она очень важна для современных приложений, особенно при использовании полноэкранного сглаживания и активной постобработки? У AMD решение этого вопроса давно есть! Это применение GDDR5 памяти, которая используется компанией с середины прошлого года в RADEON HD 4870.
Память типа GDDR5 обеспечивает вдвое большую ПСП, по сравнению с GDDR3, и поэтому HD 4770 почти не потерял в пропускной способности, по сравнению с HD 4830. Так, используемая в HD 4770 память типа GDDR5 обеспечивает эффективную частоту 3200 МГц, тогда как физическая частота составляет лишь 800 МГц. В итоге, ПСП у RADEON HD 4770 превышает 51 ГБ/с, тогда как у 256-битного HD 4830 с GDDR3 она лишь чуть больше — около 58 ГБ/с.
Несмотря на то, что чипы памяти GDDR5 стоят дороже, чем GDDR3, особенно в начале её широкого применения, узкая ширина шины памяти позволяет упростить дизайн PCB, и получить преимущество, так что в перспективе это правильное решение. Ещё один плюс этого типа памяти в том, что RADEON HD 4770 использует второе поколение GDDR5, с напряжением чипов 1.5 В, она потребляет меньше энергии, по сравнению с чипами предыдущего поколения.
По сравнению с RV770LE, у RV740 есть важное преимущество в тактовой частоте чипа, в модели HD 4770 он работает на 750 МГц, поэтому теоретические цифры производительности (математическая производительность и скорость текстурирования) превышают таковые для HD 4830 на 30%. А это уже близко к производительности HD 4850.
Но и это ещё не все преимущества нового решения перед RADEON HD 4830. Несмотря на сниженную общую ширину шины памяти, RV740 содержит всё те же 16 блоков ROP, сгруппированные по четыре в укрупнённые блоки. Интересно, что ранее на каждый из таких Render Back-End (RBE) в чипе был один 64-битный контроллер памяти. Теперь же, несмотря на наличие четырёх блоков RBE, количество контроллеров памяти снизилось до двух, как вы можете увидеть на схеме GPU.
Что это даёт? Теоретическую цифру пикового филлрейта, равную таковому для HD 4870. То есть, больше чем у HD 4830 и HD 4850. С учётом того, что некоторые из реальных приложений иногда упираются в производительность блоков ROP, в отдельных игровых тестах мы можем ожидать даже преимущества над HD 4850. И мы это обязательно проверим в следующих частях статьи.
Новый 40 нм технологический процесс
Применение технологического процесса с 40 нм нормами производства выгодно для производителей GPU. Он обеспечивает значительно меньший размер чипа при сохранении той же сложности, и снижение себестоимости производства в перспективе. При 40 нм техпроцессе плотность транзисторов на чипе намного выше той же цифры для 55 нм, теоретически 40 нм чип будет примерно на 40% меньше по площади, по сравнению с аналогичным чипом, произведённым по 55 нм технологическому процессу.
Например, чип RV740 имеет площадь около 140 кв.мм, что значительно меньше, чем площадь RV770, произведённого по 55 нм нормам, равная примерно 260 кв.мм. Понятно, что тут повлияло и снижение количества исполнительных блоков, присутствующих в GPU, но смена техпроцесса имела значительно больший эффект. Важно и то, что 40 нм техпроцесс позволяет RV740 работать на высоких тактовых частотах.
Что касается себестоимости производства GPU, то её снижение будет достигнуто лишь в перспективе потому, что в начале освоения действительно массового производства более выгодным зачастую бывает предыдущий технологический процесс, который обкатан и отработан полностью. А новые нормы означают сравнительно большое количество брака поначалу, а также не такую уж низкую стоимость для заказчиков (ведь AMD заказывает у TSMC производство чипов RV740).
Теоретически, в преимуществах «тонкого» техпроцесса должно быть и меньшее энергопотребление с тепловыделением. Транзисторы при 40 нм производстве расположены ближе друг к другу, и, теоретически, требуют меньше энергии. Однако, на практике, разница оказывается совсем не такой большой, как разница в плотности, например. Так, максимальное потребление у RADEON HD 4770 составляет 80 Вт, а у RADEON HD 4830 — 110 Вт. Неплохо, но хотелось бы ещё лучше. Впрочем, практические особенности решения будут рассмотрены далее, в третьей части статьи.
Итак, мы познакомились с теоретическими особенностями нового решения нижнего ценового диапазона, основанного на чипе RV740, другие особенности (поддержка DirectX 10.1, ATI Stream и другие) были подробно рассмотрены нами в предыдущих материалах. В следующей части статьи будет практическая часть исследования, в которой мы узнаем, как производительность RADEON HD 4770 соотносится со скоростью предыдущих решений компании AMD и конкурирующих видеокарт Nvidia в нашем обычном наборе синтетических тестов.