Обзор видеоускорителя Nvidia GeForce RTX 4090 (24 ГБ) на примере карты Palit GeForce RTX 4090 GameRock OC

Особенности архитектуры

Мы уже детально рассмотрели архитектуру нового GPU в первой части нашего материала, вышедшей не так давно. Поэтому нет смысла повторяться, переходим сразу к практическому изучению.

Особенности карты Palit GeForce RTX 4090 GameRock OC 24 ГБ

Сведения о производителе: Компания Palit Microsystems (торговая марка Palit) основана в 1988 году в Китайской Республике (Тайвань). Штаб-квартира — в Тайбэе/Тайвань, крупный центр по логистике — в Гонконге, второй офис (по продажам в Европе) — в Германии. Фабрики — в Китае. На рынке в России — с 1995 года (начинались продажи как безымянных продуктов, так называемых Noname, а под маркой Palit продукты начали идти только после 2000 года). В 2005 году компания приобрела торговую марку и ряд активов Gainward (после, по сути, банкротства одноименной компании), после чего был образован холдинг Palit Group. Был открыт еще один офис в Шеньжене, направленный на продажи в Китае. На сегодня внутри Palit Group сосредоточено еще несколько торговых марок и брендов.

Объект исследования: серийно выпускаемый ускоритель трехмерной графики (видеокарта) Palit GeForce RTX 4090 GameRock OC 24 ГБ 384-битной GDDR6X

Palit GeForce RTX 4090 GameRock OC 24 ГБ 384-битной GDDR6X
Параметр Значение Номинальное значение (референс)
GPU GeForce RTX 4090 (AD102)
Интерфейс PCI Express x16 4.0
Частота работы GPU (ROPs), МГц BIOS P: 2610(Boost)—2775(Max)
BIOS S: 2520(Boost)—2730(Max)
2520(Boost)—2640(Max)
Частота работы памяти (физическая (эффективная)), МГц 2625 (21000) 2625 (21000)
Ширина шины обмена с памятью, бит 384
Число вычислительных блоков в GPU 128
Число операций (ALU/CUDA) в блоке 128
Суммарное количество блоков ALU/CUDA 16384
Число блоков текстурирования (BLF/TLF/ANIS) 512
Число блоков растеризации (ROP) 176
Число блоков Ray Tracing 128
Число тензорных блоков 512
Размеры, мм 330×138×72 310×130×70
Количество слотов в системном блоке, занимаемые видеокартой 4 4
Цвет текстолита черный черный
Энергопотребление пиковое в 3D, Вт (BIOS P/BIOS S) 475/452 450
Энергопотребление в режиме 2D, Вт 40 40
Энергопотребление в режиме «сна», Вт 11 11
Уровень шума в 3D (максимальная нагрузка), дБА (BIOS P/BIOS S) 28,8/25,7 37,0
Уровень шума в 2D (просмотр видео), дБА 18,0 18,0
Уровень шума в 2D (в простое), дБА 18,0 18,0
Видеовыходы 1×HDMI 2.1, 3×DisplayPort 1.4a 1×HDMI 2.1, 3×DisplayPort 1.4a
Поддержка многопроцессорной работы нет
Максимальное количество приемников/мониторов для одновременного вывода изображения 4 4
Питание: 8-контактные разъемы 0 0
Питание: 6-контактные разъемы 0 0
Питание: 16-контактные разъемы 1 1
Вес карты с комплектом поставки (брутто), кг 2,6 3,0
Вес карты чистый (нетто), кг 2,0 2,2
Максимальное разрешение/частота, DisplayPort 3840×2160@144 Гц, 7680×4320@60 Гц
Максимальное разрешение/частота, HDMI 3840×2160@144 Гц, 7680×4320@60 Гц
Средняя цена карты Palit единичные предложения в районе 150-160 тысяч рублей на момент подготовки обзора

Память

Карта имеет 24 ГБ памяти GDDR6X SDRAM, размещенной в 12 микросхемах по 16 Гбит на лицевой стороне PCB. Микросхемы памяти Micron (GDDR6X, MT61K512M32KPA-21 / D8BZC) рассчитаны на номинальную частоту работы в 2625 (21000) МГц.

Особенности карты и сравнение с... Palit GeForce RTX 3090 Ti GameRock

Palit GeForce RTX 4090 GameRock OC (24 ГБ) Palit GeForce RTX 3090 Ti GameRock (24 ГБ)
вид спереди
вид сзади

Мы сравниваем карту Palit с ее же продуктом на базе RTX 3090 Ti по двум причинам: во-первых, эталонной карты Nvidia на базе RTX 4090 (24 ГБ) никто из медиасообщества в РФ не получал; во-вторых, было очень много сообщений о том, что RTX 3090 Ti — «обкаточный» вариант RTX 4090, то есть чипы AD102 и GA102 по контактам совпадают, и для RTX 4090 впоследствии могут использовать PCB от 3090 Ti (для этого на них уже установлены 16-контактные разъемы питания).

Однако по данному примеру мы видим, что печатная плата у RTX 4090 все же заметно переделана и не является копией решения для RTX 3090 Ti. Референс-дизайн RTX 4090 очень схож с RTX 3090 Ti, инженеры Nvidia использовали ту же форму PCB с большим треугольным вырезом справа, чтобы обеспечить сквозную продувку радиатора СО.

Фото GeForce RTX 4090 FE взято с TechPowerUp.com

Однако инженеры Palit не только не стали следовать этому дизайну, но и в корне переделали правую часть PCB, вследствие чего от выреза не осталось и следа. Там же мы видим посадочные места, похожие на те, куда устанавливаются 8-контактные разъемы питания. Для чего они нужны — неизвестно.

Мы видим, что ядро имеет маркировку AD102-300, защиты от майнинга нет, дата выспуска — 28-я неделя этого года (июль).

Суммарное количество фаз питания у GeForce RTX 4090 FE — 23, у карты Palit GeForce RTX 4090 GameRock OC (24 ГБ) — 19, а у ее предшественницы на базе 3090 Ti — 21. Сразу напрашивается вопрос: почему настолько урезали количество действующих фаз? Ведь если посмотреть на фотографии, то можно увидеть 4 пустых посадочных места, а значит, общее количество фаз может быть таким же, как у референс-карты. Грубо говоря, чем больше фаз, тем более гибко настраивается подача напряжения на GPU, шаг каждого изменения становится меньше, а это значит, что ядро для своих задач может потреблять ровно столько, сколько в данный момент требуется от него (а не больше).

При этом распределение фаз такое: у GeForce RTX 4090 FE — 20 фаз на ядро и 3 на микросхемы памяти, у карты Palit GeForce RTX 4090 GameRock OC (24 ГБ) — 16 + 3, у Palit GeForce RTX 3090 Ti GameRock — 18 + 3. Да, память у всех перечисленных карт одна и та же, работает на одинаковых частотах, так что более трех фаз питания не требуется. При этом у всех трех карт имеется посадочное место под четвертую фазу питания для памяти.

Зеленым цветом отмечена схема питания ядра, красным — памяти. Следует еще заметить, что, в отличие от референс карты GeForce RTX 4090 FE и Palit GeForce RTX 3090 Ti GameRock, где применены очень качественные элементы VRM производителя Monolithic Power Systems (DrMOS на 70 А, многофазный ШИМ-контроллер), здесь элементная база выбрана попроще, подешевле.

Все контроллеры расположены на оборотной стороне PCB. Фазами питания ядра и микросхем памяти управляет тандем из двух ШИМ-контроллеров uPI Semi — uP9512U (максимум 12 фаз) и uP9512R (максимум 8 фаз). Возможно, именно ограничение по количеству фаз питания до 20 заставило разработчиков отказаться от установки всех возможных фаз питания GPU.

В преобразователе питания, традиционно для всех видеокарт Nvidia, используются транзисторные сборки DrMOS — в данном случае NCP302150 (On Semiconductor), каждая из которых рассчитана максимально на 50 А.

Также на тыльной стороне карты имеется контроллер uS5650Q (uPI Semi), который отвечает за мониторинг карты (отслеживание напряжений и температуры). Опять же, ранее таких контроллеров было два (по одному на каждой стороне карты).

Управление подсветкой традиционно возложено на контроллер Holtek.

Карта имеет два режима работы, они заложены в двух вариантах BIOS, которые переключаются с помощью переключателя на верхнем торце карты: P (performance / производительный, он же 1) и S (silent / тихий, он же 2). Разница между режимами заключается не только в оборотах вентиляторов, также у GPU в этих режимах разные максимальные и бустовые частоты. При этом предел энергопотребления для BIOS P заложен в 500 Вт, а для BIOS S — 450 Вт.

Штатные частоты памяти, а также Boost-значение частоты работы ядра в режиме BIOS 2(S) равны референсным значениям. При этом Boost-частота GPU в режиме BIOS 1(P) выше референс-аналога почти на 3,5%, а максимальная — на 5%. Исследования показали, что в среднем мы получили в играх прирост производительности в 4,5% относительно референс-карты в режиме BIOS P. Если же мы включаем BIOS 2(S), то здесь максимальная частота GPU выше референс-аналога всего на 3,4%.

Энергопотребление карты Palit в тестах доходило до 475 Вт (в режиме BIOS P) и до 452 Вт (BIOS S).

Я попробовал ручной разгон и получил максимальные частоты 2880/23100 МГц, что обеспечило прирост в играх в разрешении 4К в среднем почти на 8% относительно референсных значений. Энергопотребление карты выросло до 527 Вт (в пиковых всплесках).

Питание на карту Palit подается через новый 16-контактный разъем питания стандарта PCIe 5.0.

В комплекте поставки карты имеется переходник на такой разъем с четырех обычных 8-контактных (хорошо всем знакомых).

Отметим приличные габариты данной карты, особенно по толщине: 7 см. В результате видеокарта занимает 4 слота в системном блоке.

RTX 4090 (в отличие от RTX 3090/3090 Ti) не обладает поддержкой мультиграфической конфигурации, то есть технологией SLI, и у карты нет специального разъема на верхнем торце.

Карта имеет стандартный набор видеовыходов: три DP 1.4a и один HDMI 2.1.

Управление работой карты обеспечивается с помощью фирменной утилиты ThunderMaster.

Панель управления частотами и лимитами
Панель управления вентиляторами
Панель мониторинга состояния

Эта программа предоставляет управление вентиляторами, частотами работы карты, напряжением ядра и слежение за состоянием карты (мониторинг).

Нагрев и охлаждение

Еще при выпуске поколения ускорителей GeForce RTX 30 в Nvidia решили сделать более компактную PCB и придумали новую систему охлаждения, продувающую радиатор насквозь (при этом частично оставляющую нагретый воздух в объеме корпуса). Здесь мы видим кулер, выполненный именно по этой концепции: его основой является огромный многосекционный пластинчатый никелированный радиатор с восемью тепловыми композитными трубками, распределяющими тепло по ребрам радиатора.

Трубки припаяны к огромному медному плато, скрывающему испарительную камеру (это, по сути, этакая огромная «расплющенная» тепловая трубка, в которой легкокипящая жидкость переносит тепло с нагреваемой стороны на охлаждаемую).

Микросхемы памяти охлаждаются с помощью этой же огромной медной подошвы (через термопрокладки). Для охлаждения преобразователей питания VRM имеются свои узкие подошвы у того же радиатора.

В зависимости от расположения в радиаторе пластины имеют разные углы поворота, улучшая прохождение воздушного потока.

Задняя пластина служит только элементом защиты PCB и является составной частью общей концепции дизайна.

Как видно из снимка выше, к радиатору прикручена специальная черная рама, усиливающая конструкцию и противостоящая провисанию (изгибу) карты в слоте PCIe.

Поверх радиатора установлен кожух с тремя вентиляторами ∅90 мм, имеющими по 9 лопастей и работающими на единой частоте вращения (по умолчанию, но через программу ThunderMaster можно настроить их работу раздельно по двум группам: центральный — одна группа, два крайних — другая группа).

Остановка вентиляторов при малой нагрузке видеокарты происходит, если температура GPU опускается ниже 50 градусов, а нагрев микросхем памяти — ниже 80 градусов. Разумеется, СО при этом становится бесшумной. При запуске ПК вентиляторы работают, однако после загрузки видеодрайвера идет опрос рабочей температуры, и они выключаются. Ниже есть видеоролик на эту тему.

Мониторинг температурного режима с помощью MSI Afterburner:

Режим BIOS 1(P):

После 2-часового прогона под нагрузкой максимальная температура ядра не превысила 68 градусов, а температура микросхем памяти — 76 градусов, что является великолепным результатом для видеокарт флагманского уровня! Энергопотребление карты доходило до 475 Вт. Напомним, что безопасный предел нагрева памяти GDDR6X — 105 °C.

Режим BIOS 2(S):

В этом случае максимальная температура ядра достигала 70 градусов, а микросхем памяти — тех же 76 °C, что, в принципе, тоже является отличным результатом для видеокарт такого уровня. Энергопотребление карты чуть понизилось (до 452 Вт) из-за более низкого лимита потребления.

При ручном разгоне (режим BIOS 1(P)) при выставлении лимита потребления в 110% параметры нагрева и шума менялись мало (максимальная температура ядра достигла 71 градуса, памяти — 79 градусов), потребление вырастало до 527 Вт.

Мы засняли и ускорили в 50 раз 8-минутный прогрев (BIOS 1(P)):

Максимальный нагрев наблюдался около разъема питания, о чем можно было догадаться и так: ведь в такой небольшой по размерам разъем сходятся четыре 8-контактных разъема, а максимально пропускаемая через данный 16-контактный разъем мощность достигает 600 Вт. Конечно же, в этом месте сам разъем и текстолит могут максимально нагреваться. Зачем так сделали разработчики спецификации PCIe — не очень понятно (ранее просто росло число устанавливаемых на PCB 8-контактных разъемов, что помогало распределять тепловую нагрузку на бо́льшую площадь).

Шум

Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.

Режимы измерения:

  • Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
  • Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
  • Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark

Оценка градаций уровня шума следующая:

  • менее 20 дБА: условно бесшумно
  • от 20 до 25 дБА: очень тихо
  • от 25 до 30 дБА: тихо
  • от 30 до 35 дБА: отчетливо слышно
  • от 35 до 40 дБА: громко, но терпимо
  • выше 40 дБА: очень громко

В режиме простоя в 2D в обоих режимах 1/2 температура была не выше 52 °C, вентиляторы не работали, уровень шума был равен фоновому — 18 дБА.

При просмотре фильма с аппаратным декодированием ничего не менялось.

Режим BIOS 1(P):

В режиме максимальной нагрузки в 3D температура достигала 68/76 °C (ядро/память). Вентиляторы при этом раскручивались до 1645 оборотов в минуту, шум вырастал до 28,8 дБА: это всё еще тихо относительно типичного шумового фона. В видеоролике ниже можно оценить, как вырастает шум (он фиксировался на пару секунд через каждые 30 секунд).

Режим BIOS 2(S):

В режиме максимальной нагрузки в 3D температура достигала 70/76 °C (ядро/память). Вентиляторы при этом раскручивались до 1523 оборотов в минуту, шум вырастал до 25,7 дБА: это еще более тихо. В видеоролике ниже это продемонстрировано (шум фиксировался на пару секунд через каждые 30 секунд).

С учетом того, сколько данная карта потребляет, тихая работа системы охлаждения в режиме BIOS 1(P) заслуживает похвалы, а уж шум на грани очень тихого в режиме BIOS 2(S) — это вообще сказка! Правда, не стоит забывать, что тепло, выделяемое картой, в значительной степени остается внутри системного блока, так что использование корпуса с хорошей вентиляцией крайне желательно.

Подсветка

Карта имеет шикарную красивейшую подсветку Midnight Kaleidoscope практически по всей площади кожуха СО, где установлены несколько десятков адресуемых светодиодов под акриловым покрытием «под кристаллы».

Также на верхнем торце карты подсвечены логотипы серий.

Это не новый тип подсветки, такой дизайн появился в 2020 году с выходом RTX 30 в серии GameRock, сейчас он лишь немного изменен. Управление режимами подсветки, в том числе и ее отключением, осуществляется той же утилитой ThunderMaster.

Имеется возможность сохранения выбранного режима в самой карте, то есть при желании можно настроить подсветку один раз и больше не запускать программу.

Отметим, что в комплект поставки карт серии GameRock входит кабель для подключения к разъему ARGB (5 В) на материнской плате, чтобы синхронизировать работу подсветки с платой. В этом случае запускать утилиту ThunderMaster вообще не требуется: карта самостоятельно определит подключение, и подсветка по умолчанию будет синхронизирована.

Комплект поставки и упаковка

В комплекте поставки уже нет даже традиционного краткого руководства пользователя (все переведено в интернет!), но зато имеются: разборная металлическая подставка-штатив под карту, переходник питания, кабель синхронизации подсветки.

Стоит обратить внимание на переходник питания с четырех 8-контактных разъемов на один 16-контактный.

Несмотря на, казалось бы, очень толстые оплетенные кабели и наличие оплетки у входа в 16-контактный разъем, данный адаптер крайне не рекомендуется сгибать в месте той самой оплетки, ибо на входе в разъем по стандарту PCIe 5.0 находится микросхема, задействующая два управляющих контакта в разъеме. Коллега из немецкого издания Igor’s Lab тщательно разобрался, как это всё работает.

Схема взята с сайта Igor’s Lab

Если использовать менее трех 8-контактных разъемов или не задействовать 8-контактный разъем №1, то карта просто не запустится. С тремя подключенными разъемами запуск состоится, но потребление карты будет ограничено на уровне 450 Вт. И только когда все 4 разъема подключены, через разъем удастся получить все 600 Вт. Такую схему работы имеют только поставляемые с видеокартами «интеллектуальные» адаптеры, которые (вероятно) партнерам поставляет Nvidia вместе с GPU и микросхемами памяти. При покупке подобных адаптеров питания в случайных местах типа AliExpress можно теоретически натолкнуться на упрощенный вариант без микросхемы, где питание с разъемов будет просто заведено на общую шину без задействования управляющих контактов. Использование таких переходников может привести к непредсказуемым результатам. Поэтому мы еще раз рекомендуем приобретать полноценные БП ATX 3.0 с разъемом 12VHPWR и кабелем с 16 контактами для видеокарт новых поколений.

Особо надо отметить, что такой адаптер питания ни в коем случае нельзя изгибать непосредственно после 16-контактного разъема, это может привести к печальным последствиям, с которыми уже столкнулись некоторые пользователи RTX 4090, у которых выгорели как адаптер, так и 16-контактное гнездо на самой карте.

Подставка типа штатив, упирающаяся в дно корпуса, состоит из трех секций, на ней установлен кронштейн, регулируемый по высоте, так что можно подобрать нужный вариант. Такой способ поддержки не перекрывает слоты ниже видеокарты в системном блоке. Однако не всегда прямо под видеокартой имеется открытое пустое пространство на дне корпуса для установки такой подставки-штатива (корпуса сейчас делают очень разные). Сама подставка не просто подпирает карту в углу, а крепится к ней.

Подставка способна поддерживать и две карты, если они установлены в одном системном блоке. Для этого имеется дополнительный кронштейн, надеваемый на опору. В целом идея отличная, ибо ранее мы видели комплектацию карт акриловым кронштейном-подставкой, который крепится под видеокартой, занимая два слота под ней.

Тестирование: синтетические тесты

Конфигурация тестового стенда

  • Компьютер на базе процессора Intel Core i9-12900K (Socket LGA1700):
    • Платформа:
      • процессор Intel Core i9-12900K (разгон до 5,1 ГГц по всем ядрам);
      • ЖСО Cougar Helor 360;
      • системная плата Asus ROG Maximus Z690 Extreme на чипсете Intel Z690;
      • оперативная память Kingston Fury (KF552C40BBK2-32) 32 ГБ (2×16) DDR5 4800 МГц (XMP 5200 МГц);
      • SSD Intel 760p NVMe 1 ТБ PCI-E;
      • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA3;
      • блок питания Palit UD1000GM PG5 (1000 Вт);
      • корпус Thermaltake Level20 XT;
    • операционная система Windows 11 Pro 64-битная;
    • телевизор LG 55Nano956 (55″ 8K HDR, HDMI 2.1);
    • драйверы AMD версии 22.9.2;
    • драйверы Nvidia версии 517.48/522.25;
    • VSync отключен.

Мы провели тестирование новой модели видеокарты Nvidia со стандартными частотами в нашем наборе синтетических тестов. Он продолжает меняться, иногда добавляются новые тесты, а устаревшие постепенно убираются. Мы бы хотели добавить еще больше примеров с вычислениями, но с этим есть определенные сложности. Мы постоянно стараемся расширять и улучшать набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — напишите их в комментариях к статье или отправьте авторам.

Из более-менее новых бенчмарков мы начали использовать несколько примеров, входящих в DirectX SDK и пакет SDK компании AMD (скомпилированные примеры применения D3D11 и D3D12), а также несколько разнообразных тестов для измерения производительности трассировки лучей, программной и аппаратной. В качестве полусинтетических тестов у нас также используется набор подтестов из довольно популярного пакета 3DMark: Time Spy, Port Royal, DX Raytracing, Speed Way и др.

Синтетические тесты проводились на следующих видеокартах:

  • GeForce RTX 4090 со стандартными параметрами (RTX 4090)
  • GeForce RTX 3090 Ti со стандартными параметрами (RTX 3090 Ti)
  • GeForce RTX 3090 со стандартными параметрами (RTX 3090)
  • GeForce RTX 2080 Ti со стандартными параметрами (RTX 2080 Ti)
  • Radeon RX 6950 XT со стандартными параметрами (RX 6950 XT)
  • Radeon RX 6900 XT со стандартными параметрами (RX 6900 XT)

Для анализа производительности новой видеокарты GeForce RTX 4090, мы взяли несколько топовых видеокарт компании Nvidia из пары предыдущих поколений. Это модели RTX 3090 Ti и RTX 3090 из прошлого семейства, основанные на лучшем графическом процессоре семейства Ampere с разной степенью урезанности, также мы взяли в некоторые тесты и топовое решение позапрошлого поколения — RTX 2080 Ti. Оно будет полезно для того, чтобы отследить приросты производительности за три поколения GPU.

Соперники для новинки от компании AMD будут лишь номинальные. Пока не вышла новая линейка на основе архитектуры RDNA3, главным условным конкурентом для GeForce RTX 4090 можно считать ускоренный вариант — Radeon RX 6950 XT, но также мы добавили в некоторые тесты и результаты Radeon RX 6900 XT, хотя по цене и производительности все они далеки друг от друга, естественно. Просто ждем RDNA3 и пока что лишь номинально сравниваем RTX 4090 с RX 6950 XT, хотя это и не имеет особого смысла.

 
Тесты из 3DMark Vantage
 
Тесты Direct3D 11
 
Тесты Direct3D 12
 
Тесты трассировки лучей
 
Вычислительные тесты
 
Тесты технологий DLSS/XeSS/FSR

Тестирование: игровые тесты

Список инструментов тестирования

Во всех игровых тестах использовалось максимальное качество графики в настройках.

  • Hitman III (IO Interactive/IO Interactive)
  • Cyberpunk 2077 (Софтклаб/CD Projekt RED), патч 1.4 (версия 1.5 еще не тестировалась)
  • God of War (Sony IE/Sony IE)
  • Assassin’s Creed Valhalla (Ubisoft/Ubisoft)
  • Marvel’s Guardians of the Galaxy (Eldos/Square Enix)
  • The Medium (Bloober/Bloober)
  • Godfall (Gearbox Publishing/Counterplay Games)
  • Resident Evil Village (Capcom/Capcom)
  • Far Cry 6 (Ubisoft/Ubisoft)
  • Battlefield 2042 (DICE/EA)

Кратко о производительности в 3D-играх

Перед демонстрацией детальных тестов мы приводим краткие сведения о производительности семейства, к которому относится конкретный исследуемый ускоритель, а также его соперников. Все это нами субъективно оценивается по шкале из пяти градаций.

Игры без использования трассировки лучей (классическая растеризация):

Полагаем, что долгих комментариев не требуется — и так понятно, что RTX 4090 лидер, во всех трех разрешениях его значок наверху. Что касается карты Palit, то она еще чуть быстрее референс-аналога.

Игры с использованием трассировки лучей и DLSS/FSR:

Конечно, некоторое падение производительности при активации в играх трассировки лучей имеется, но мы знаем, что появляется все больше и больше игр с поддержкой Nvidia DLSS, а эта технология «умного» антиалиасинга позволяет резко поднять производительность, в том числе компенсируя падение от включения RT, а иногда DLSS поднимает производительность даже выше уровня, который выдают карты семейства RTX без трассировки лучей (когда массово начнет внедряться DLSS 3, можно будет вообще забыть о том, чтобы отключать трассировку в играх). Также становится всё больше игр с поддержкой AMD FSR (еще одна технология умного масштабирования картинки), а она работает и на картах Nvidia. Всё это говорит о том, что в целом выводы не меняются: RTX 4090 и в играх с RT способен обеспечить полный комфорт на максимальных настройках графики в разрешении 4К. Про 8К пока умолчим, этому вопросу будет посвящена отдельная статья.

Результаты тестирования в 3D-играх

Стандартные результаты тестов без использования аппаратной трассировки лучей в разрешениях 1920×1200, 2560×1440 и 3840×2160

 
Hitman III
 
Cyberpunk 2077
 
God of War
 
Assassin’s Creed Valhalla
 
Marvel’s Guardians of the Galaxy
 
The Medium
 
Godfall
 
Resident Evil Village
 
Far Cry 6
 
Battlefield 2042

Все регулярно тестируемые нами видеокарты сейчас поддерживают технологию RT, поэтому мы проводим тесты не только с использованием обычных методов растеризации, но и с включением RT и/или DLSS/FSR.

Результаты тестов со включенной аппаратной трассировкой лучей и/или DLSS/FSR в разрешениях 1920×1200, 2560×1440 и 3840×2160

 
Cyberpunk 2077, RT
 
Cyberpunk 2077, RT+DLSS/FSR
 
God of War, DLSS/FSR
 
Marvel’s Guardians of the Galaxy, RT
 
Marvel’s Guardians of the Galaxy, RT + DLSS/FSR
 
The Medium, RT
 
The Medium, RT + DLSS/FSR
 
Resident Evil Village, RT
 
Far Cry 6, RT
 
Far Cry 6, RT + FSR
 
Battlefield 2042, RT
 
Battlefield 2042, RT + DLSS

Результаты тестов с включенной аппаратной трассировкой лучей и DLSS/FSR в разрешении 7680×4320 (8К) мы сейчас демонстрировать не станем, ждите выхода нашего отдельного материала по этой теме.

Рейтинг iXBT.com

Рейтинг ускорителей iXBT.com демонстрирует нам функциональность видеокарт друг относительно друга и представлен в двух вариантах:

  1. Вариант рейтинга iXBT.com без включения RT

Рейтинг составлен по всем тестам без использования технологий трассировки лучей. Этот рейтинг нормирован по наиболее слабому ускорителю из группы карт — Radeon RX 6500 XT (то есть сочетание скорости и функций Radeon RX 6500 XT приняты за 100%). Рейтинги ведутся по 19 ежемесячно исследуемым нами акселераторам в рамках проекта Лучшая видеокарта месяца. В данном случае из общего списка выбрана группа карт для анализа, в которую входят GeForce RTX 4090 и его конкуренты.

Рейтинг приведен суммарно для всех трех разрешений.

Модель ускорителя Рейтинг iXBT.com Рейтинг полезности Цена, руб.
01 Palit RTX 4090 GameRock OC, разгон до 2880/23100 607 41 148 000
02 Palit RTX 4090 GameRock OC, 2610—2775/21000 593 40 148 000
03 RTX 4090 24 ГБ, 2520—2640/21000 569 42 136 000
04 RTX 3090 Ti 24 ГБ, 1860—1965/21000 448 49 91 000
05 RX 6950 XT 16 ГБ, 2310—2525/18000 447 51 88 000
06 RX 6900 XT 16 ГБ, 2250—2470/16000 422 56 75 000
07 RTX 3090 24 ГБ, 1695—1965/19500 419 54 77 000

Полагаем, что комментарии излишни: лидерство RTX 4090 очевидно, средний прирост производительности относительно RTX 3090 Ti и RX 6950 XT по всем разрешениям составляет 27%, а в разрешении 4К — и вовсе 47%. Карта Palit за счет фабричного разгона быстрее еще на 4,5%.

  1. Вариант рейтинга iXBT.com с включением RT/DLSS/FSR

Рейтинг составлен по 9 тестам, в которых используется технология трассировки лучей и одновременно технология Nvidia DLSS или AMD FSR. Этот рейтинг нормирован по самому слабому ускорителю в данной группе — Radeon RX 6500 XT (то есть сочетание скорости и функций Radeon RX 6500 XT приняты за 100%).

Рейтинг приведен суммарно для всех трех разрешений.

Модель ускорителя Рейтинг iXBT.com Рейтинг полезности Цена, руб.
01 Palit RTX 4090 GameRock OC, разгон до 2880/23100 1041 70 148 000
02 Palit RTX 4090 GameRock OC, 2610—2775/21000 1012 68 148 000
03 RTX 4090 24 ГБ, 2520—2640/21000 965 71 136 000
04 RTX 3090 Ti 24 ГБ, 1860—1965/21000 766 84 91 000
05 RTX 3090 24 ГБ, 1695—1965/19500 711 92 77 000
07 RX 6950 XT 16 ГБ, 2310—2525/18000 650 74 88 000
08 RX 6900 XT 16 ГБ, 2250—2470/16000 619 83 75 000

В данном случае лидерство RTX 4090 выражено еще более ярко относительно флагманов AMD вследствие большего падения производительности у тех при включении RT. В среднем прирост производительности относительно RTX 3090 Ti по всем разрешениям составляет 26%, а в разрешении 4К — 43%. Карта Palit за счет фабричного разгона опять же еще немного быстрее. Разница же в производительности с RX 6950 XT в данном случае составляет 48% по всем разрешениям и аж 91%(!) в 4К.

Рейтинг полезности

Рейтинг полезности тех же карт получается, если показатель предыдущего рейтинга разделить на цены соответствующих ускорителей. Для расчета рейтинга полезности использованы розничные цены на конец октября 2022 года. Учитывая нацеленность RTX 4090 на разрешение 4К, мы привели рейтинг, подсчитанный только при использовании разрешения 3840×2160. Поэтому цифры отличаются от рейтинга iXBT.com.

  1. Вариант рейтинга полезности без включения RT
Модель ускорителя Рейтинг полезности Рейтинг iXBT.com Цена, руб.
14 RTX 3090 24 ГБ, 1695—1965/19500 84 650 77 000
15 RX 6900 XT 16 ГБ, 2250—2470/16000 84 631 75 000
16 RTX 3090 Ti 24 ГБ, 1860—1965/21000 78 712 91 000
17 RTX 4090 24 ГБ, 2520—2640/21000 77 1048 136 000
18 RX 6950 XT 16 ГБ, 2310—2525/18000 77 675 88 000
19 Palit RTX 4090 GameRock OC, разгон до 2880/23100 76 1131 148 000
20 Palit RTX 4090 GameRock OC, 2610—2775/21000 74 1097 148 000

Мы не раз говорили, что рейтинг полезности, основанный исключительно на игровой производительности, для карт уровня RTX 3090/3090 Ti/4090 не вполне корректен, ибо эти ускорители не только игровые, но и предназначенные для использования в составе ПК для моделирования, проектирования и т. п. Оттого и ценники на такие карты изначально сильно выше, чем у чисто игровых решений. Плюс завышенные цены из-за новизны RTX 4090, так что даже не видим смысла анализировать результаты. Хотя забавно, что из-за очень серьезного превосходства над всеми соперниками по скорости в 4К даже высокая стоимость новинки не помешала RTX 4090 опередить флагман AMD (RX 6950 XT).

  1. Вариант рейтинга полезности с включением RT
Модель ускорителя Рейтинг полезности Рейтинг iXBT.com Цена, руб.
08 RTX 3090 24 ГБ, 1695—1965/19500 141 1085 77 000
10 RTX 3090 Ti 24 ГБ, 1860—1965/21000 132 1199 91 000
12 RTX 4090 24 ГБ, 2520—2640/21000 125 1707 136 000
13 Palit RTX 4090 GameRock OC, разгон до 2880/23100 125 1844 148 000
17 Palit RTX 4090 GameRock OC, 2610—2775/21000 121 1797 148 000
19 RX 6900 XT 16 ГБ, 2250—2470/16000 111 832 75 000
20 RX 6950 XT 16 ГБ, 2310—2525/18000 101 890 88 000

Почти все вышесказанное справедливо и здесь. Если кратко, то сейчас уже нет смысла приобретать флагманы AMD 6000-й серии. А вот в последних обзорах по RTX 3090 Ti мы отмечали, что эти карты еще будут какое-то время популярны из-за упавших на них цен и с учетом завышенных в первое время цен на RTX 4090. Так оно и вышло: RTX 3090/3090 Ti пока значительно выгоднее.

Выводы

Есть простой рецепт апгрейда для владельцев RTX 3060: вместо того, чтобы тратиться на покупку RTX 4090, им надо лишь приобрести GT 1030 :). Кстати, это равенство вполне справедливо и в жизни… но только в плане количества перекрытых слотов в системном блоке.

А если серьезно, то Nvidia GeForce RTX 4090 (24 ГБ) — безусловный лидер в мире игровой 3D-графики для ПК, флагманское решение на базе последнего поколения GPU Nvidia на сегодня.

GeForce RTX 4090 имеет GPU с просто фантастическим количеством активных вычислительных блоков, включая текстурные, тензорные и RT-ядра. Как и у GeForce RTX 3090/Ti, изюминкой нового ускорителя является поддержка разрешения 8К, поскольку GeForce RTX 4090 уже обладает достаточной производительностью, чтобы некоторые игры с использованием DLSS обеспечивали игроку нормальный комфорт на максимальных настройках графики в 8К (а когда в игры внедрят поддержку DLSS 3, комфорт станет еще выше). Объем памяти в 24 ГБ позволяет свободно хранить необходимые текстуры и данные даже для столь высокого разрешения. Наши тесты показали, что у RTX 4090 к тому же заметно повышена эффективность блоков трассировки лучей, обновлены тензорные ядра, так что чем больше та или иная игра использует возможности RT, тем заметнее будут эффективность и превосходство RTX 4090. Что касается вопроса о том, что у RTX 3090 Ti и RTX 4090 одинаковая пропускная способность памяти, и при этом GPU разительно отличаются по количеству тех или иных блоков (не станет ли ПСП бутылочным горлышком для RTX 4090?) — здесь можно смело сказать, что с учетом сильно увеличенного кеша в самом ядре влияние ПСП на RTX 4090 не так велико, как у RTX 3090 Ti. Во всяком случае, до разрешения 4К включительно. А вот в разрешении 8К ПСП уже может стать ограничивающим фактором в ряде игр, но детально мы поговорим об этом в отдельном материале.

Возможности исполнительных блоков в новой архитектуре Ada Lovelace были серьезно улучшены, особенно это касается аппаратной трассировки лучей. Само определение пересечений луча и треугольника в третьем поколении RT-ядер было ускорено вдвое, но еще интереснее дополнительные аппаратные блоки в RT-ядрах: Opacity Micromap Engine, ускоряющий обработку полупрозрачных объектов, вроде языков пламени и листьев, и Displaced Micro-Mesh Engine, способный снизить время построения структур BVH и сократить требования к объему геометрических данных для очень сложных объектов. Еще одна важная новая возможность — переупорядочивание выполнения шейдеров при трассировке лучей — Shader Execution Reordering. Специальный планировщик способен на лету оптимизировать загрузку вычислительных блоков мультипроцессора SM, что потенциально может обеспечить двух-трехкратное ускорение для многих алгоритмов трассировки лучей.

Отдельно стоит упомянуть и новую версию DLSS 3, использующую ускоритель оптического потока Optical Flow Accelerator, улучшенный в архитектуре Ada Lovelace. DLSS 3 использует как масштабирование разрешения из DLSS 2, так и удвоение частоты кадров при помощи вставки промежуточных, используя поле оптического потока. Данные из него комбинируются с векторами движения, и искусственный интеллект при помощи тензорных ядер генерирует промежуточные кадры — чтобы видеоряд был плавнее. А для того чтобы задержки при этом не слишком увеличивались, используется известная технология компании Reflex. В результате игрок может получить вдвое больше кадров в секунду при визуальном качестве, сравнимом с DLSS 2.

Также мы помним, что GeForce RTX 4090 (как и GeForce RTX 3090/Ti) нацелен не только на игровой сегмент, но и на использование в профессиональной сфере — например, для 3D-моделирования. И еще тестируя GeForce RTX 3090, мы убедились, что объем памяти в 24 ГБ позволяет этому ускорителю легко работать с высококачественными, очень сложными моделями, тогда как на GeForce RTX 3080/Ti реализация тех же сценариев может приводить к падению программы или вызывать ошибку нехватки памяти. Так что GeForce RTX 4090 — это одновременно и самое быстрое на сегодня игровое решение, и очень мощное полупрофессиональное.

Выпуск поколения RTX 40 был запланирован еще на конец лета, однако падение спроса со стороны майнеров, а также чрезмерно большое количество запасов карт поколения RTX 30 (дефицит закончился, теперь маятник традиционно качнулся в иную крайность) вынудили Nvidia отложить запуск нового поколения. Тем не менее, новинки уже вышли и RTX 4090 уже завоевал высокую популярность, несмотря на высокую стоимость.

Конкретная протестированная нами карта Palit GeForce RTX 4090 GameRock OC (24 ГБ) — это исключительно мощное решение для энтузиастов, желающих играть в очень высоких разрешениях при максимальных настройках графики, причем без компромиссов. Разгонный потенциал позволяет еще сильнее повысить комфорт в тяжелых игровых режимах. Это одна из самых длинных видеокарт, которые когда-либо выпускались, ее 33 см влезут далеко не в каждый корпус. При этом видеокарта еще и очень толстая, она занимает 4 слота в корпусе, что надо учитывать при планировании апгрейда своего ПК. В комплекте поставки есть поддерживающий штатив с опорой на дно корпуса, поэтому за прогибание карты в системном блоке можно не волноваться (к тому же жесткая рама в конструкции самой карты помогает ей не провисать даже без опоры).

Система охлаждения тихая в обоих режимах BIOS. Карта может потреблять до 475 Вт (теоретически до 500 Вт в BIOS P), она требует четыре 8-контактных разъема питания (которые подключаются к прилагаемому переходнику на 16-контактный разъем на самой плате), так что наличие мощного БП обязательно! Особо надо отметить, что такой переходник питания ни в коем случае нельзя изгибать непосредственно после 16-контактного разъема

А еще лучше заиметь современный БП ATX 3.0 с наличием отдельного кабеля для подключения питания к таким картам напрямую. Конечно же, требуется хорошо продуваемый корпус, поскольку почти весь нагретый воздух видеокарта оставляет внутри системного блока.

Производитель декларирует наличие 3-летней гарантии на эту карту.

Отметим еще раз, что GeForce RTX 4090 отлично подходит для игры в разрешении 4К с максимальным качеством графики с трассировкой лучей даже без DLSS, а также для разрешения 8К в играх с поддержкой DLSS (или RT+DLSS). Также отметим поддержку стандарта HDMI 2.1, позволяющего выводить 4K-изображение со 120 FPS или 8K-разрешение при помощи одного кабеля, поддержку аппаратного декодирования видеоданных в формате AV1, технологию RTX IO, способную обеспечить быструю передачу и распаковку данных с накопителей прямо в GPU, а также технологию снижения задержек Reflex, полезную для киберспортсменов. Разумеется, RTX 4xxx принес нам DLSS 3, но об этой технологии мы поговорим отдельно, когда в свет выйдут соответствующие патчи для популярных и используемых нами игр, а также новые игры с уже реализованной поддержкой DLSS 3.

Справочные материалы:

В номинации «Оригинальный дизайн» плата Palit GeForce RTX 4090 GameRock OC (24 ГБ) получила награду:

В номинации «Отличная поставка» плата Palit GeForce RTX 4090 GameRock OC (24 ГБ) получила награду:

26 октября 2022 Г.