Содержание
- Часть 1 — Теория и архитектура
- Часть 2 — Практическое знакомство
- Часть 3 — Результаты игровых тестов и выводы
Представляем базовый детальный материал с исследованием Nvidia Geforce GTX 970 на основе карты Gigabyte.
Справочные материалы
Объект исследования: Ускоритель трехмерной графики (видеокарта) Gigabyte Geforce GTX 970 WindForce SuperOC 4096 МБ 256-битной GDDR5 PCI-E
Сведения о разработчике: Компания Nvidia Corporation (торговая марка Nvidia) основана в 1993 году в США. Штаб-квартира в Санта-Кларе (Калифорния). Разрабатывает графические процессоры, технологии. До 1999 года основной маркой была Riva (Riva 128/TNT/TNT2), с 1999 года и по настоящее время — Geforce. В 2000 году были приобретены активы 3dfx Interactive, после чего торговые марки 3dfx/Voodoo перешли к Nvidia. Своего производства нет. Общая численность сотрудников (включая региональные офисы) около 5000 человек.
Часть 1: Теория и архитектура
Вместе с новой топовой моделью Geforce GTX 980, созданной на основе графического процессора GM204 графической архитектуры Maxwell, компания Nvidia выпустила и менее дорогую модель GTX 970 с урезанными характеристиками. По опыту прошлых лет мы знаем, что топовые платы компании почти всегда выходят парами: самое мощное решение и второе по силе, основанное на том же GPU, но с несколькими отключенными функциональными устройствами и работающее на меньшей частоте. Таким вот «упрощенным» вариантом и стала модель Geforce GTX 970.
Видеокарта Geforce GTX 970 основана на том же чипе верхнего ценового диапазона с наименованием GM204 — уже второго поколения архитектуры Maxwell, но имеет меньшую производительность и потребление энергии лишь в 145 Вт. Так как графический процессор тот же, что и у более дорогой модели, то новинкой поддерживаются и все новые возможности, которые мы рассмотрели в базовом обзоре GTX 980: методы полноэкранного сглаживания MFAA и DSR, аппаратная поддержка для ускорения одного из методов глобального освещения VXGI, равно как и давно известные нам возможности, вроде G-Sync.
Как мы выяснили в обзоре старшей модели, энергоэффективность у топового Maxwell весьма впечатляющая — по сравнению с чипами архитектуры Kepler и конкурирующими решениями. Так, новый GPU примерно вдвое эффективнее, чем весьма неплохой для своего времени GK104. С учетом небольшого отставания от Geforce GTX 980 по теоретическим параметрам, новая модель GTX 970 отлично подойдет для самых современных игр с любыми настройками качества и в любом разрешении, включая 2560×1600 и 4K, в том числе и с включенным полноэкранным сглаживанием.
Лишь для наиболее требовательных игровых проектов и разрешений вроде 4K, могут понадобиться две такие карты, работающие в режиме SLI. К слову, сравнительно низкая цена Geforce GTX 970 сыграет здесь свою роль — создание подобной видеосистемы из двух мощных, но не сверхдорогих плат будет весьма выгодно. Новая видеокарта также станет отличным вариантом и для апгрейда устаревающих систем на основе одиночных видеокарт моделей Geforce GTX 600 и старше, типа популярных в свое время Geforce GTX 680 и GTX 670.
Рассматриваемая сегодня новая модель видеокарты Nvidia основана на уже известном нам графическом процессоре архитектуры «Maxwell», которая в деталях схожа с предыдущей архитектурой «Kepler», и перед прочтением данного материала полезно ознакомиться с ранними статьями о видеокартах компании Nvidia:
- [19.09.14] Nvidia Geforce GTX 980 — Последователь Geforce GTX 680, обгоняющий даже GTX 780 Ti
- [12.03.14] Nvidia Geforce GTX 750 Ti — Maxwell начинает с малого... несмотря на Maxwell
- [18.03.13] Nvidia Geforce Titan — новый однопроцессорный флагман 3D-графики игрового класса
- [22.03.12] Nvidia Geforce GTX 680 — новый однопроцессорный лидер 3D-графики
Рассмотрим подробные характеристики видеоплаты Geforce GTX 970, основанной на графическом процессоре GM204.
Графический ускоритель Geforce GTX 970 | |
---|---|
Параметр | Значение |
Кодовое имя чипа | «GM204» |
Технология производства | 28 нм |
Количество транзисторов | 5,2 млрд. |
Площадь ядра | 398 мм2 |
Архитектура | Унифицированная, с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др. |
Аппаратная поддержка DirectX | DirectX 12, в том числе шейдерной модели Shader Model 5.0 |
Шина памяти | 256-битная, четыре независимых контроллера памяти шириной по 64 бита с поддержкой GDDR5-памяти |
Частота графического процессора | 1050 (1178) МГц |
Вычислительные блоки | 13 (из 16 физически присутствующих) потоковых мультипроцессоров, включающих 1664 (из 2048) скалярных ALU для расчетов с плавающей запятой одинарной и двойной точности в рамках стандарта IEEE 754-2008; |
Блоки текстурирования | 104 (из 128) блоков текстурной адресации и фильтрации с поддержкой FP16- и FP32-компонент в текстурах и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов |
Блоки растеризации (ROP) | 4 широких блока ROP (64 пикселей) с поддержкой различных режимов сглаживания, в том числе при FP16- или FP32-формате буфера кадра. Каждый блок состоит из массива конфигурируемых ALU и отвечает за генерацию и сравнение Z, MSAA, блендинг |
Поддержка мониторов | Интегрированная поддержка до четырех мониторов, подключенных по интерфейсам Dual Link DVI, HDMI 2.0 и DisplayPort 1.2 |
Спецификации референсной видеокарты Geforce GTX 970 | |
---|---|
Параметр | Значение |
Частота ядра | 1050 (1178) МГц |
Количество универсальных процессоров | 1664 |
Количество текстурных блоков | 104 |
Количество блоков блендинга | 64 |
Эффективная частота памяти | 7000 (4×1750) МГц |
Тип памяти | GDDR5 |
Шина памяти | 256 бит |
Объем памяти | 4 ГБ |
Пропускная способность памяти | 224 ГБ/с |
Вычислительная производительность (FP32) | 4,0 терафлопс |
Теоретическая максимальная скорость закраски | 67,2 гигапикселей/с |
Теоретическая скорость выборки текстур | 109,2 гигатекселей/с |
Шина | PCI Express 3.0 |
Разъемы | Один разъем Dual Link DVI, один HDMI 2.0 и три DisplayPort 1.2 |
Энергопотребление | до 145 Вт |
Дополнительное питание | Два 6-контактных разъема |
Число слотов, занимаемых в системном корпусе | 2 |
Рекомендуемая цена | $329 (США), 14990 руб. (Россия) |
Новая модель Geforce GTX 970 получила типичное для решений Nvidia наименование. Пропуск серии GTX 800 обусловлен тем, что в мобильных решениях такие модели уже были, а в обновленной продуктовой линейке компании Geforce GTX 970 располагается чуть ниже топового (на базе единственного GPU) игрового решения в виде Geforce GTX 980. Как мы уже писали, модели GTX 780 Ti, GTX 780 и GTX 770 с момента анонса новых видеокарт выпускать перестали, а эксклюзивные платы серии Titan пока что остаются на рынке — у них есть свой (немногочисленный) покупатель.
Рекомендованная цена на новую плату составляет $329, и это вполне неплохо для ожидаемого от платы уровня производительности. Да, некоторые пользователи ожидали меньших цен, так как и платы и GPU сами по себе довольно простые, но Nvidia и сама умеет заработать деньги, и своим партнерам помогает в этом. У конкурирующей с Nvidia компании AMD против второй из пары новых Geforce имеется соперник в виде модели Radeon R9 290, хотя по сложности и потреблению энергии видеочип GM204 и плата GTX 970 ближе к Tonga и R9 285, соответственно.
Рассматриваемая сегодня модель компании Nvidia сделана на базе урезанного по скорости чипа GM204, но все так же имеет 256-битную шину памяти, поэтому объем установленной на нее видеопамяти мог быть 2 или 4 ГБ. В случае пусть и не самой дорогой, но все же топовой модели, было принято решение по установке 4 ГБ памяти. Этот объем видеопамяти оптимален для современных топовых решений, работающих в условиях сверхтребовательных 3D-приложений, максимальных настроек качества и самых высоких разрешений.
Референсная плата Geforce GTX 970 имеет стандартную длину в 10,5 дюймов (267 мм), для дополнительного питания используются два 6-контактных разъема PCI-E — это практически полная копия GTX 980, за исключением некоторых деталей в системе питания. Плата дизайна Nvidia имеет три DisplayPort 1.2 разъема, один Dual Link DVI и порт HDMI 2.0 (мы уже писали о том, что GM204 — это первый графический процессор с поддержкой вывода изображения по HDMI 2.0:
Последняя версия стандарта HDMI позволяет выводить полноценное 4K-разрешение с частотой обновления вплоть до 60 Гц, и из-за распространения устройств вывода изображения с таким разрешением, в новом графическом процессоре появилась поддержка разрешений до 5K (5120×3200 пикселей при 60 Гц), и к видеокарте Geforce GTX 970 можно подключить до четырех дисплеев с разрешением 4K по Multi-Stream Transport (MST).
Уровень типичного энергопотребления у видеокарты Geforce GTX 970 составляет всего лишь 145 Вт (цифра, заявленная компанией Nvidia, реальная будет выше, скорее всего), что значительно меньше, чем даже 190 Вт у Radeon R9 285, не говоря уже о 275 Вт у ценового конкурента в лице Radeon R9 290. Для дополнительного снабжения энергией в референсной Geforce GTX 970 используется пара 6-контактных разъемов дополнительного питания, как и у более дорогой GTX 980.
Следует оговориться, что указанный набор портов вывода изображения и разъемов питания справедливы лишь для видеокарт референсного дизайна, а производители видеокарт сразу выпустили собственные варианты Geforce GTX 970, отличающиеся дизайном печатных плат, систем охлаждения и питания, а также работой GPU и видеопамяти на фабрично повышенных частотах.
Архитектура
Так как вторая видеокарта семейства Geforce GTX 900 также основана на новом графическом процессоре GM204, который относится ко второму поколению Maxwell, то все сказанное в статье по GTX 980 относится в полной мере и к ней. Мы уже писали о том, что инженеры компании Nvidia проделали очень большую работу для увеличения эффективности всех внутренних блоков нового GPU и достигли превосходной энергоэффективности GPU новой архитектуры путем загрузки большей части имеющихся вычислительных возможностей.
Напомним, что графический процессор GM204 состоит из кластеров графической обработки Graphics Processing Cluster (GPC), которые содержат по несколько потоковых мультипроцессоров (в данном случае — SMM). Каждый кластер GPC содержит выделенный движок растеризации и по четыре мультипроцессора SMM. В свою очередь, каждый мультипроцессор состоит из 128 вычислительных блоков CUDA, блока обработки геометрии PolyMorph и восьми блоков текстурирования (TMU). Часть из исполнительных блоков в варианте чипа для GTX 970 была отключена, они изображены темным цветом на диаграмме:
Итак, модель Geforce GTX 970 является еще одним представителем новой линейки, и основана она уже на «урезанном» чипе GM204, содержащем те же четыре кластера GPC, но уже лишь 13 активных (из 16 физически присутствующих в чипе) мультипроцессоров SMM. Три из имеющихся шестнадцати мультипроцессоров в Geforce GTX 970 отключены аппаратно, и в целом GPU содержит 1664 потоковых процессоров CUDA и 104 блоков TMU, по сравнению с 2048 ALU и 128 TMU у GTX 980.
Как и старшая модель, Geforce GTX 970 имеет четыре 64-битных контроллера памяти, что в сумме составляет 256-битную шину памяти. К каждому контроллеру памяти «привязаны» по 16 блоков ROP и 512 КБ кэш-памяти второго уровня, поэтому в целом чип содержит 64 блока ROP и 2048 КБ кэш-памяти.
Графический процессор GM204 поддерживает последнюю версию технологии динамического изменения тактовой частоты и напряжения GPU Boost, обеспечивающую максимально возможную 3D-производительность в определенных условиях (напряжение, температура, потребление) при сохранении минимального уровня частоты, который гарантируется при любых номинальных условиях.
Базовая тактовая частота для видеочипа в Geforce GTX 970 равна 1050 МГц, а турбо-частота (средняя повышенная частота в нескольких играх и приложениях) достигла значения 1178 МГц — это близко к частоте видеочипа в Geforce GTX 980. Турбо-частота, как обычно, является лишь усредненным значением для нескольких игр, используемых компанией Nvidia в своих тестах. В реальности она может изменяться, и может быть как выше, так и ниже.
По остальным вопросам архитектурных и функциональных тонкостей новинки вы можете обратиться к обзорам Geforce GTX 980 и GTX 750 Ti, в которым мы гораздо более подробно писали об архитектуре Maxwell, устройстве потоковых мультипроцессоров (Streaming Multiprocessor — SM), организации подсистемы памяти и других архитектурных отличиях. Там же вы можете ознакомиться и с новыми функциональными изменениями, вроде аппаратной поддержки ускорения расчета глобального освещения VXGI, новыми методами полноэкранного сглаживания и улучшенными возможностями графического API DirectX 12, который поддерживается новым решением.
Оценка производительности
В этой части материала мы лишь предварительно оцениваем производительность нового решения Geforce GTX 970, исходя из теоретических данных и тестирования, проведенного самой компанией Nvidia. В видеочипе Geforce GTX 970 остались активными лишь 13 блоков SMM и 1664 вычислительных ядер CUDA и 104 блока TMU. Частота работы GPU в этом варианте понижена до 1050 МГц базовой и 1178 МГц турбо-частоты.
А вот подсистему памяти не тронули вовсе и никаких урезаний тут нет, модель снабжена теми же 4 ГБ GDDR5-памяти, работающими на частоте в 7 ГГц по 256-битной шине. В итоге, Geforce GTX 970 на четверть медленнее GTX 980 по скорости текстурирования и математическим вычислениям, но всего лишь на 7% хуже по скорости заполнения (блоки ROP) и вовсе не уступает старшей модели по пропускной способности памяти.
Поэтому наши предварительные ожидания от Geforce GTX 970 довольно высоки, она точно должна быть быстрее аналогичных по позиционированию моделей из предыдущих серий и отстанет от топовой GTX 980 максимум на 15-20%, да и то далеко не всегда. При этом младшая Geforce GTX 970 потребляет меньше энергии — всего лишь 145 Вт. Давайте рассмотрим усредненные результаты тестов в играх, проведенные самой компанией Nvidia, которая сравнила новинку только с Geforce GTX 670:
По сравнению с Geforce GTX 670, которая является одной из самых популярных топовых видеокарт в современных ПК-системах на данный момент, новая модель этого же уровня обеспечивает приличный прирост производительности около полутора раз, а в сверхвысоких разрешениях и того больше. А уж если учитывать новый алгоритм полноэкранного сглаживания MFAA, который дает качество MSAA при большей производительности, то она и вовсе минимум вдвое лучше, если верить графикам Nvidia.
В качестве конкурента для Geforce GTX 970 компания Nvidia выделяет плату AMD Radeon R9 290. И в среднем, по собственным данным компании, их новинка получилась где-то на 5-10% быстрее соперника. Впрочем, у нас еще будут собственные игровые тесты Geforce GTX 970 в третьей части статьи и соответствующие выводы, исходя из ее производительности в играх.
В любом случае, мощности рассматриваемой модели должно быть вполне достаточно для всех самых современных игр и даже проектов, которые выйдут в последующие годы, при работе в самых высоких разрешениях, а ведь GTX 970 стоит заметно меньше старшей модели. Кроме этого, партнеры компании Nvidia уже предложили фабрично разогнанные варианты этой модели, а при достижении вполне реалистичных 1400 МГц, новинка может поспорить даже и с лучшей одночиповой платой конкурента — Radeon R9 290X.
Выводы по теоретической части
Мы уже писали в обзоре Geforce GTX 980 о том, что с архитектурной точки зрения, новый топовый GPU второго поколения архитектуры Maxwell был очень сильно изменен и взял все самое лучшее от прошлых архитектур, получив дополнительные модификации, практически лишившие его слабых мест. А новые методы сглаживания вместе с более эффективным сжатием содержимого буфера кадра приносят заметно улучшенную производительность в условиях высоких разрешений, позволяя улучшить качество картинки при избытке производительности или повысить производительность при сохранении того же качества.
Получается, что и функционально и по производительности новое решение выглядит намного лучше предыдущих. При помощи глубокой модернизации блоков предыдущих архитектур и внесения множества нововведений, компания Nvidia добилась удвоения показателя соотношения производительности к потреблению энергии и при этом добавила своему новому графическому процессору функциональности (сглаживание, VXGI, DirectX 12, ...).
Рассматриваемая сегодня модель Geforce GTX 970 на базе чипа GM204 становится одним из лучших решений по энергоэффективности и уж точно одним из самых выгодных приобретений среди видеокарт верхнего ценового диапазона. Соотношение производительности, энергопотребления и цены у новинки получилось весьма впечатляющим. И если по цене конкуренты из стана AMD еще могут поспорить с новинкой, то с точки зрения сочетания производительности, энергопотребления и тепловыделения у Geforce GTX 970 есть явное преимущество перед всеми остальными решениями в данном ценовом диапазоне.
В общем, Geforce GTX 970 является отличным вариантом для обновления видеоподсистемы тех пользователей, которые так и не успели приобрести топовые модели линеек Geforce GTX 600 и 700. Все владельцы устаревших видеокарт моделей Geforce GTX 670, GTX 680 и ниже, при смене видеокарты на GTX 970 получат заметный прирост производительности и функциональности, да еще и при значительно меньшем энергопотреблении.
В следующей части нашего материала мы традиционно исследуем скорость рендеринга новой видеокарты Nvidia Geforce GTX 970 на практике — сравним ее скорость с производительностью конкурентов от компании AMD и со скоростными показателями предшественников производства Nvidia в синтетических тестах.
Средняя текущая цена (количество предложений) в московской рознице: | |
---|---|
Рассматриваемые карты | Конкуренты |
GTX 970 — $323 (на 01.06.16) | R9 290X — $431(33) |
GTX 970 — $323 (на 01.06.16) | R9 290 — $551(2) |
GTX 970 — $323 (на 01.06.16) | GTX 770 — $377 (на 01.06.16) |
GTX 970 — $323 (на 01.06.16) | GTX 780 — $515 (на 01.06.16) |
Gigabyte GTX 970 OC — $362(2) | GTX 970 — $323 (на 01.06.16) |
и лично Наталью Лагуненко
за предоставленную на тестирование видеокарту
2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair | Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair | Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair | Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair |
Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт | Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией Asustek | Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI | Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate |
Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia | 2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair | Монитор Asus ProArt PA249Q для рабочего компьютера предоставлен компанией Asustek | Клавиатура Cougar 700K для рабочего компьютера предоставленa компанией Cougar |