СОДЕРЖАНИЕ
- Часть 1 — Теория и архитектура
- Часть 2 — Практическое знакомство
- Часть 3 — Результаты игровых тестов (производительность)
Да, вот таким получился этот продукт — 3/8 от монстра GTX 580, если считать по вычислительным блокам, или CUDA-процессорам, как любит их называть Nvidia. Другими словами, чуть меньше половинки. Интересно, что ранее решения такого ценового уровня были более слабыми и доходили по вычислительным блокам до 1/4 от топового GPU. Так или иначе, перед нами продолжатель GTS 450 (почему он получил суффикс GTX — известно только самой Nvidia). Мы все помним, как печатные платы у видеокарт с процессором Geforce GTS 450 имели уже разведенную шину обмена с памятью с 192 бит, но реально использовались только 128 бит (две микросхемы памяти просто не были установлены).
Теперь же, как и в случае с GTX 580 (когда это по сути то, чем должен был быть GTX 480 без урезаний), проведена работа над ошибками, и перед нами обновленный GTS 450, который получил новое имя GTX 550 Ti.
А уже о деталях архитектуры вам расскажет Алексей Берилло.
Часть 1: Теория и архитектура
Ещё в 2010 году компания Nvidia начала обновление своей линейки графических процессоров, получившее гордое звание «перезагрузки» линейки Fermi. Сначала вышли обновленные модели GTX 580 и GTX 570, основанные на улучшенном по сравнению с GF100 чипе, получившем название GF110. Затем, уже в начале этого года появилась модель GTX 560 Ti, напомнившая о старом-добром индексе «Titanium». Она также была основана на переработанном чипе GF114, который был улучшенным аналогом ранее выпущенного GF104.
Совершенно логично, что и GF106 (на этом чипе основана Geforce GTS 450) получил аналогичные улучшения, связанные с переразводкой графического процессора, результатом которых стали улучшенные частотные характеристики и показатели энергоэффективности. Новое решение также решили включить в линейку «Titanium», поэтому оно получило название Geforce GTX 550 Ti.
Со времени своего выпуска, модель Geforce GTS 450 стала одной из наиболее успешных современных видеокарт Nvidia на рынке. Что немудрено, так как именно решения с ценой в $130–150 продаются лучше всего. Ведь экономным и нетребовательным пользователям вполне хватает и 192 потоковых процессоров с гигабайтом видеопамяти на 128-битной шине.
Представленная сегодня модель ровно так же смещает старую вниз, как это ранее сделали другие видеокарты линейки GTX 500. GTX 550 Ti предлагает бо́льшую производительность за начальную цену всё ещё продающейся Geforce GTS 450. В целом, сегментирование рынка Nvidia видит примерно так (показаны только основные «игровые» сегменты):
Как видите, ключевыми отличиями решений из разных сегментов компания считает целевое разрешение и уровень полноэкранного сглаживания, количество потоковых процессоров, влияющее на вычислительные возможности, ширину шины памяти, а также требовательность по питанию, хотя и косвенную — выраженную в количестве и типе дополнительных разъёмов PCI-E.
Естественно, что для Geforce GTX 580 нет никаких преград по разрешению и уровню MSAA, средним уровнем Nvidia признаёт Geforce GTX 560 Ti и разрешения вроде 1920×1200 или 1920×1080, вместе с включенным MSAA. Ну а выпущенному сегодня Geforce GTX 550 Ti достаётся сегмент недорогих мониторов с разрешением порядка 1680×1050 и менее, также с полноэкранным сглаживанием.
GTX 550 Ti, как и его предшественник в виде GTS 450, целит в ценовую категорию видеокарт с ценой чуть ниже $150, но имеет несколько ключевых отличий — улучшенную производительность более энергоэффективного GPU, а также на 70% большую пропускную способность памяти из-за 192-битной шины (что, вероятно, объясняет включение сглаживания в состав целевых параметров данного сегмента).
Теоретическая часть статьи снова получилась небольшой, так как GF116 функционально полностью идентичен GF106, который во многом похож на GF110 и GF114, рассмотренные нами ранее, отличаясь от последнего чипа лишь количественно. А уж вычислительная архитектура «Fermi» нам с вами знакома ещё с осени 2009 года, поэтому будет полезно вспомнить предшествующие статьи о современной архитектуре компании Nvidia:
- [25.01.11] Nvidia Geforce GTX 560 Ti: чуть слабее Geforce GTX 570/580, но и дешевле
- [09.11.10] Nvidia Geforce GTX 580: новый король 3D-графики на закате 2010 года
- [12.07.10] Nvidia Geforce GTX 460: распространение новой архитектуры GF1xx на средний ценовой диапазон
- [27.03.10] Nvidia Geforce GTX 480: архитектура нового графического процессора изнутри
- [19.01.10] Новая графическая архитектура Nvidia GF100
Графические ускорители серии Geforce GTX 550 Ti
- Кодовое имя чипа GF116;
- Технология производства 40 нм;
- 1,17 миллиарда транзисторов;
- Унифицированная архитектура с массивом процессоров для потоковой обработки различных видов данных: вершин, пикселей и др.;
- Аппаратная поддержка DirectX 11 API, в том числе шейдерной модели Shader Model 5.0, геометрических (geometry) и вычислительных (compute) шейдеров, а также тесселяции;
- 192-битная шина памяти, три независимых контроллера шириной по 64 бита каждый, с поддержкой GDDR5 памяти в микросхемах смешанной плотности;
- Частота ядра 900 МГц;
- Удвоенная частота ALU 1800 МГц;
- 4 потоковых мультипроцессора, включающих 192 скалярных ALU для расчётов с плавающей точкой (поддержка вычислений в целочисленном формате, с плавающей запятой, с FP32 и FP64 точностью в рамках стандарта IEEE 754-2008);
- 32 блока текстурной адресации и фильтрации с поддержкой FP16 и FP32 компонент в текстурах и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов;
- 3 широких блока ROP (24 пикселя) с поддержкой режимов антиалиасинга до 32 выборок на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Каждый блок состоит из массива конфигурируемых ALU и отвечает за генерацию и сравнение Z, MSAA, блендинг;
- Запись результатов до восьми буферов кадра одновременно (MRT);
- Интегрированная поддержка RAMDAC, двух портов Dual Link DVI, а также HDMI и DisplayPort.
Спецификации референсной видеокарты Geforce GTX 550 Ti
- Частота ядра 900 МГц;
- Частота универсальных процессоров 1800 МГц;
- Количество универсальных процессоров 192;
- Количество текстурных блоков — 32, блоков блендинга — 24;
- Эффективная частота памяти 4104 (1026×4) МГц;
- Тип памяти GDDR5, 192-битная шина памяти;
- Объем памяти 1024 МБ;
- Пропускная способность памяти 98,5 ГБ/с;
- Теоретическая максимальная скорость закраски 21,6 гигапикселей в секунду;
- Теоретическая скорость выборки текстур 28,8 гигатекселей в секунду;
- Два разъема Dual Link DVI-I и один Mini HDMI;
- Один SLI-разъем;
- Шина PCI Express 2.0;
- Поддержка HDCP, HDMI, DisplayPort;
- Энергопотребление до 116 Вт (один 6-штырьковый разъём);
- Двухслотовое исполнение;
- Рекомендованная цена для России — 5999 руб (для США — $149).
Новая модель Geforce GTX 550 Ti, выполненная на основе улучшенного графического процессора GF116, не заменит на рынке видеокарту Geforce GTS 450. В начале своего пути эти две модели будут сосуществовать в линейке компании вместе. Обновленный GPU выполнен по всё тем же технологическим нормам 40 нм, как и другие видеочипы этого поколения, а улучшение его характеристик стало возможным из-за отладки 40-нанометрового техпроцесса и глубокой переработки GPU.
Принцип наименования видеокарты снова немного изменился. Обновленная модель теперь не просто принадлежит к новому пятому поколению, и по сравнению с GTS 450 добавился не только суффикс Ti. По какой-то причине Nvidia решила перевести выпущенное решение на основе чипа GF116 в более высокий класс GTX, по сравнению с предшествующей аналогичной картой, относящейся к классу GTS. Неужели 192-битной шины достаточно для этого?
На базе видеочипа GF116 сегодня была выпущена единственная модель — GTX 550 Ti, и продавать её будут на североамериканском рынке по ценам от $149. Конкурентами данной платы одновременно являются и Radeon HD 5770 и Radeon HD 6850. Компания AMD предусмотрительно снизила рекомендованные цены перед анонсом конкурирующего решения, и теперь новая цена для HD 5770 равна $129, а для HD 6850 — $149. Что как раз чуть меньше или равно цене плат GTX 550 Ti со стандартными частотами. Российская рекомендованная цена для видеокарты от Nvidia ещё выше, хотя уже с момента анонса они будут продаваться дешевле.
Архитектура и аппаратные изменения
Как и в вышедших ранее моделях серии Geforce GTX 500, в анонсированном GTX 550 Ti используется улучшенный графический процессор, уже знакомый нам по предыдущей серии, и лишь слегка модифицированный для того, чтобы поднять производительность и улучшить энергетическую эффективность.
Модификации в GF116 направлены на то, чтобы снизить утечки и повысить выход годных чипов на высоких частотах, по сравнению с GF106. В результате, GTX 550 Ti имеет лучшие характеристики, работая при этом на частоте, почти на 120 МГц большей, чем графический процессор GTS 450. При этом он потребляет лишь на 10% больше энергии.
Подробная информация обо всех архитектурных особенностях Fermi дана в базовых обзорах линеек Geforce GTX 400 и 500, здесь мы лишь повторим основное. Geforce GTX 550 Ti использует ту же конфигурацию мультипроцессоров, что и GTS 450. GF116 содержит один кластер GPC, четыре мультипроцессора SM и три 64-битных контроллера памяти, сблокированных с кэш-памятью второго уровня и восемью блоками ROP в каждом. Итого, в состав нового GPU входит 192 потоковых процессора, собранных в четыре мультипроцессора по 48 штук в каждом.
А вот подсистема памяти GF116 всё же претерпела некоторые изменения. Каждый мультипроцессор имеет всё те же 64 килобайта начиповой памяти, и GPU в целом содержит 384 КБ унифицированной кэш-памяти второго уровня, которая обслуживает все запросы по загрузке и сохранению данных. Зато в составе GTX 550 Ti активны уже три контроллера памяти, а не два, как было в GTS 450, что в сумме составляет 192-битную шину.
Но даже это ещё не всё. В GF116 изменились не только частоты и ширина шины. Как вы помните из технических характеристик решения, при 192-битной шине памяти GTX 550 Ti каким-то образом содержит ровно 1 ГБ видеопамяти, хотя обычно в таких случаях должно получаться 768 или 1536 МБ. Если использовать одинаковые микросхемы GDDR5, конечно.
Так вот контроллер памяти нового GPU поддерживает использование чипов памяти смешанной плотности. Что и позволяет набрать ровно 1024 мегабайт, используя 192-битный интерфейс. Применяется четыре чипа одной плотности (32M×32) общим объёмом 512 мегабайт, и ещё два чипа вдвое большей плотности (64M×32), которые вместе также составляют 512 МБ. И в сумме как раз и получается 1 ГБ.
Интересно, каким образом решены некоторые трудности, и не возникнет ли проблем с производительностью в определённых условиях? Но решение любопытное и, видимо, имеет больше смысла для более дорогих чипов. Ведь если бы тот же GF110 поддерживал такую возможность, на него можно было бы поставить не 3 ГБ памяти, что пока явно излишне, а 2 ГБ, получив ту же производительность при меньшей себестоимости. Посмотрим, получит ли продолжение поддержка микросхем памяти смешанной плотности в будущих решениях Nvidia.
Как и все остальные графические процессоры архитектуры Fermi, GF116 использует несколько полиморфных движков (PolyMorph Engines), работающих параллельно, но лишь один блок растеризации (Raster Engine). Сравнительно большое количество движков PolyMorph в этом GPU способно обеспечить высокую производительность тесселяции, а вот единственный растеризатор, скорее всего, не будет настолько же эффективно выполнять задачи по растеризации, как у старших чипов Nvidia.
Графический процессор, лежащий в основе Geforce GTX 550 Ti, имеет лишь один растеризатор, как и конкурирующие с ним Radeon HD 6850 и HD 5770, но у чипов AMD растеризатор обычно работает эффективнее. Конечно, GTX 550 Ti в любом случае обеспечит достаточную производительность обработки геометрии, но вот преимущества перед своими конкурентами, которое имеют старшие чипы Nvidia, у него уже не будет.
Зато скорость самой тесселяции у нового чипа должна быть всё же выше, чем у того же Radeon HD 5770 (а возможно и HD 6850), ведь эта работа распределяется между четырьмя движками PolyMorph, в отличие от одного выделенного блока тесселяции (хотя и более производительного) у конкурентов. Это может сказаться в таких новых играх DirectX 11 с поддержкой тесселяции, как HAWX 2.
Важнейшее изменение GTX 550 Ti, с точки зрения производительности, состоит в значительном повышении тактовых частот GPU и памяти, а также расширение её шины. В отличие от референсной частоты чипа GTS 450, равной 783/1566 МГц, в GTX 550 Ti её повысили до 900/1800 МГц, что на 15% выше. С видеопамятью ещё лучше, её частота повышена с 3608 МГц до 4104 МГц, то есть на 14%, да ещё шина расширилась в полтора раза. В итоге общее увеличение пропускной способности GTX 550 Ti по сравнению с GTS 450 превышает 70%!
Подобное повышение теоретических характеристик вызывает рост практической производительности рендеринга в играх, особенно в случаях, когда скорость ограничена ПСП видеопамяти. Судя по тестам самой Nvidia, при типичных для GTX 550 Ti настройках (1680×1050 и MSAA 4x), одно только расширение шины до 192-бит даёт порядка 14% в среднем, а в случае некоторых игр даже выше (StarCraft II — 31%, Aliens vs Predator — 23%, Batman: Arkham Asylum — 21%).
Среднее ускорение от роста частот с 783/1566 до 900/1800 МГц составляет ещё примерно столько же (около 13–14%), а в некоторых современных играх, таких как Just Cause 2 и Battlefield Bad Company 2, оно и вовсе равно теоретическому приросту в частотах. Ну а в среднем по набору игровых тестов у Nvidia для Geforce GTX 550 Ti получились приросты FPS порядка 28%, что мы проверим в следующих разделах статьи, сравнив решение с другими видеокартами.
Как обычно для линейки Geforce GTX 500, заметно повышенные частоты и характеристики не вызвали такого же прироста в энергопотреблении. По данным компании, благодаря аппаратным модификациям, направленным на снижение потребления, GTX 550 Ti получилась в среднем на 20% энергоэффективнее, по сравнению со своей предшественницей.
При всём этом новый GPU имеет отличные возможности по разгону. Похоже, что без необходимости каких-либо модификаций, большинство плат GTX 550 Ti будет работать на частоте выше 1 ГГц. И для этого даже не нужно повышать напряжения и частоту вращения вентилятора референсной системы охлаждения. Поэтому, как и в случае со многими другими платами на чипах Nvidia, одновременно с видеокартами, имеющими стандартные частоты (900/1800/4100 МГц), на рынок выходят и фабрично разогнанные модели от партнёров компании.
Эти видеокарты имеют повышенные до 950-975-1000-1050 МГц частоты для GPU, что даст дополнительные 5–10% производительности в случаях отсутствия явной зависимости скорости рендеринга от пропускной способности памяти. И такие решения точно не будут редкими в продаже, так как уже все основные партнёры Nvidia объявили о планах по их выпуску. И на примере той же Geforce GTX 560 Ti мы видим, что зачастую сложнее найти решение с референсными частотами, нежели разогнанное фабрично.
Теоретические выводы
Очевидно, что GF116 — это доработанный и слегка улучшенный GF106, равно как и GTX 550 Ti — это ускоренный GTS 450. Обновленный GPU из верхней части нижнего ценового диапазона выгодно отличается от своего предшественника значительно повышенными тактовыми частотами, увеличенным количеством блоков ROP и заметно большей пропускной способностью видеопамяти при лишь немного возросшем энергопотреблении.
Представленный графический процессор может похвастать достаточной (особенно для видеокарт Nvidia) текстурной производительностью, высокими показателями филлрейта (производительность блоков ROP) и пропускной способности памяти. Среди возможных минусов решения — недостаток математической производительности (особенно в борьбе с HD 6850), который может ограничивать скорость нового решения в некоторых случаях, а также отсутствие преимущества по скорости обработки геометрии.
На наш взгляд, GTX 550 Ti вполне может стать неплохим вариантом для обновления видеоподсистемы для экономных пользователей, если его реальная цена будет соответствовать производительности. Хотя поддержка DirectX 11 появилась ещё во время выхода Windows 7, большинство пользователей до сих пор используют устаревшие модели видеокарт. Как мы уже отмечали ранее, более 80% пользователей не имеют в составе своих систем видеокарт с поддержкой DirectX 11.
Например, это такие видеокарты как Geforce 9600 и Geforce 8600, весьма популярные в своё время. И апгрейд таких систем до GTX 550 Ti даст не только большую функциональность в виде поддержки новых возможностей DirectX, но и впечатляющий прирост теоретической производительности в несколько раз по всем показателям: шесть раз по математической мощи, четыре раза по объёму видеопамяти, три раза по ПСП, три раза по скорости обработки геометрии.
Соответственно, при модернизации с Geforce 8600 GT до GTX 550 Ti пользователь не просто получит большую частоту кадров в играх, но и сможет повысить графические настройки в абсолютном большинстве игр с минимальных и средних до очень высоких или даже максимальных. Это вызовет заметное невооружённым глазом улучшение качества рендеринга. В качестве примера приведём скриншоты из Just Cause 2, которые сняты на Geforce 8600 GT и Geforce GTX 550 Ti при одинаковой производительности около 30 FPS.
Настройки Just Cause 2 на старой видеокарте Nvidia при 30 FPS получаются лишь минимальные («Lowest» в терминах игры) и при этом рендеринг ограничен разрешением 1280×1024, без включения полноэкранного сглаживания. С той же скоростью с игрой справляется Geforce GTX 550 Ti, но при очень высоких («Very High») настройках, в разрешении 1680×1050 и с включенным сглаживанием MSAA 4x.
По теоретическим показателям Geforce GTX 550 Ti выглядит вполне неплохо, но что касается сравнения с конкурирующими решениями от AMD, то тут всё будет определяться игровыми тестами и реальными розничными ценами (рекомендованная от Nvidia кажется нам немного завышенной). Это мы проверим в третьей части статьи, а вторая будет посвящена практической части исследования в синтетических тестах. В ней мы сравним производительность нового решения Nvidia со скоростью других решений от обоих производителей дискретных графических процессоров в предельных тестах.
Nvidia Geforce GTX 550 Ti — Часть 2: видеоплаты и синтетические тесты