В ушедшем году компания Nvidia анонсировала сразу три видеокарты на основе новой графической архитектуры Ada Lovelace, которая продолжила дело предыдущих поколений Turing и Ampere, обеспечив значительно более высокую производительность в графических и неграфических применениях. Мы уже рассмотрели ранее две видеокарты этой серии, и новые графические процессоры флагманского уровня оказались в полтора-два раза производительнее предыдущих аналогов при растеризации и трассировке лучей, а также они выделяются новой технологией увеличения производительности — DLSS 3, которая позволяет дополнительно повысить частоту кадров. Главное нововведение DLSS 3 заключается в генерации дополнительных кадров на основе существующих, для чего используется аппаратный движок Optical Flow Accelerator, интерполирующий соседние кадры и создающий на их основе еще один.
Да и в остальном улучшений хватает: RT-ядра новой архитектуры обеспечивают вдвое бо́льшую пиковую производительность теста пересечения луча и треугольника, а также имеют дополнительные аппаратные блоки: Opacity Micromap Engine — ускоряющий трассировку полупрозрачной геометрии до двух раз, и Displaced Micro-Mesh Engine — использующий микротреугольники для достижения большей геометрической сложности. Еще одним важным изменением новой архитектуры является изменяемый порядок шейдерных вычислений — Shader Execution Reordering, который может дать до 40%-50% прироста производительности при интенсивной трассировке лучей.
Создать заметно более сложные и большие GPU с увеличенной производительностью при сохранившемся уровне потреблении энергии, позволил новый техпроцесс — модифицированный под потребности Nvidia процесс TSMC 4N с технологическими нормами 5 нм. Обзор двух старших моделей GPU новой линейки у нас был, и сегодня мы рассмотрим младшую из трех анонсированных видеокарт, основанную на чипе AD104. Видеокарта GeForce RTX 4070 Ti имеет пиковую вычислительную производительность более 40 терафлопс, что в теории соответствует возможностям флагмана прошлой линейки — GeForce RTX 3090 Ti, и это при более чем полуторакратной разнице в энергопотреблении. А если использовать технологии семейства Ada Lovelace, направленные на дальнейшее повышение производительности, то эта разница еще увеличится.
Модель GeForce RTX 4070 Ti обеспечит огромный скачок производительности при модернизации игровой системы с таких моделей видеокарт, как GeForce RTX 2080 и GeForce GTX 1080 Ti. Новая видеокарта предназначена для игроков, которые хотят получить функциональность новой архитектуры и очень высокую производительность, но при меньшей цене по сравнению с двумя верхними моделями новой линейки. Рассматриваемая сегодня видеокарта официально предназначена для разрешения 2560×1440 при максимальных графических настройках, включая трассировку лучей, а также для 4K-разрешения при условии использования DLSS. Новинка обеспечивает достаточно высокую производительность и в играх с продвинутой графикой с применением трассировки пути (path tracing): Portal with RTX и обновления Cyberpunk 2077 в режиме Overdrive RT.
GeForce RTX 4070 Ti неплохо подходит и для применения в профессиональных задачах по созданию цифрового контента — она достаточно производительная, имеет тензорные ядра, которые способны ускорять инструменты на основе искусственного интеллекта, а также аппаратные блоки для ускорения трассировки лучей, работа которых поддерживается в таких 3D-пакетах и движках, как Blender Cycles, Redshift, V-Ray, Octane и т. д. Все это позволит ускорить визуализацию сложных сцен и эффективнее работать над проектами.
Графическая архитектура Ada Lovelace во многом схожа с архитектурой Ampere, на которой основаны различные модификации чипов GA10x, обе эти архитектуры имеют достаточно много общего и с предыдущими архитектурами Turing и Volta, и перед прочтением материала будет полезно ознакомиться с нашими предыдущими статьями по теме:
- [16.11.22] Обзор видеоускорителя Nvidia GeForce RTX 4080 (16 ГБ)
- [26.10.22] Обзор видеоускорителя Nvidia GeForce RTX 4090 (24 ГБ)
- [10.10.22] Теоретический обзор Nvidia GeForce RTX 4090 и RTX 4080
- [30.09.20] Nvidia GeForce RTX 3090: самое производительное, но не чисто игровое решение
- [16.09.20] Nvidia GeForce RTX 3080, часть 1: теория, архитектура, синтетические тесты
Графический ускоритель GeForce RTX 4070 Ti | |
---|---|
Кодовое имя чипа | AD104 |
Технология производства | 5 нм (TSMC 4N) |
Количество транзисторов | 35,8 млрд (AD103 — 45,9 млрд) |
Площадь ядра | 294,5 мм² (AD103 — 378,6 мм²) |
Архитектура | унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др. |
Аппаратная поддержка DirectX | DirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2 |
Шина памяти | 192-битная: 6 независимых 32-битных контроллеров памяти с поддержкой памяти типа GDDR6X |
Частота графического процессора | до 2610 МГц |
Вычислительные блоки | 60 потоковых мультипроцессоров, включающих 7680 CUDA-ядер для целочисленных расчетов INT32 и вычислений с плавающей запятой FP16/FP32/FP64 |
Тензорные блоки | 240 тензорных ядер для матричных вычислений INT4/INT8/FP16/FP32/BF16/TF32 |
Блоки трассировки лучей | 60 RT-ядер для расчета пересечения лучей с треугольниками и ограничивающими объемами BVH |
Блоки текстурирования | 240 блоков текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов |
Блоки растровых операций (ROP) | 10 широких блоков ROP на 80 пикселей с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра |
Поддержка мониторов | поддержка HDMI 2.1 и DisplayPort 1.4a (со сжатием DSC 1.2a) |
Спецификации видеокарты GeForce RTX 4070 Ti | |
---|---|
Частота ядра | 2310/2610 МГц |
Количество универсальных процессоров | 7680 |
Количество текстурных блоков | 240 |
Количество блоков блендинга | 80 |
Эффективная частота памяти | 21 ГГц |
Тип памяти | GDDR6X |
Шина памяти | 192 бита |
Объем памяти | 12 ГБ |
Пропускная способность памяти | 504 ГБ/с |
Вычислительная производительность (FP32) | до 40,1 терафлопс |
Теоретическая максимальная скорость закраски | 209 гигапикселей/с |
Теоретическая скорость выборки текстур | 626 гигатекселей/с |
Шина | PCI Express 4.0 x16 |
Разъемы | по выбору производителя |
Энергопотребление | до 285 Вт |
Дополнительное питание | один 16-контактный разъем |
Число слотов, занимаемых в системном корпусе | по выбору производителя |
Рекомендуемая цена | $799 |
Название сегодняшней новинки из нового семейства в целом более-менее соответствует принципу наименования решений компании, особенно после того, как Nvidia изменила ее первое название «RTX 4080 12 ГБ» на RTX 4070 Ti. Именовать две абсолютно разные видеокарты на базе чипов разной мощности было неудачной идеей, как показала практика, и название второго варианта позднее решили поменять на более подходящее. Теперь она и по наименованию стоит на ступень ниже RTX 4080, а не почти наравне с «RTX 4080 16 ГБ».
На рынке видеокарт главным конкурентом RTX 4070 Ti является младшее из пары уже вышедших топовых видеокарт нового семейства AMD Radeon RX 7000. Причем в этот раз уже не конкурент стоит дешевле GeForce, а решение Nvidia отличается меньшей ценой, по сравнению с RX 7900 XT. Мы совсем скоро протестируем новинку AMD в том числе и в тестах трассировки лучей, но пока что очень похоже, что даже новое поколение Radeon по эффективности аппаратной трассировки догнало только Ampere, но не Ada. А производительность трассировки лучей стала важнейшим показателем для графических процессоров, так как скорости растеризации топовых GPU уже давно и так достаточно.
По объему видеопамяти для новой видеокарты у Nvidia в соответствии с шириной шины был выбор между 12 ГБ и 24 ГБ, и для RTX 4070 Ti первый вариант кажется вполне достаточным на данный момент. Прямо сейчас наличие 20 ГБ видеопамяти против 12 ГБ не принесет преимущества конкуренту новинки в виде Radeon RX 7900 XT — в существующих играх и типичных условиях. Но хотя пока что 12 ГБ памяти будет вполне достаточно при любых графических настройках, это все же можно считать потенциальным недостатком новинки Nvidia, который может негативно сказаться в будущем.
Для питания видеокарт новой модели используется все тот же 16-контактный разъем питания PCIe 5.0, ставший стандартом для ATX 3.0, который мы видели еще на GeForce RTX 3090 Ti. Блоки питания с подобным разъемом представлены на рынке, также можно применить переходник с пары более привычных 8-контактных разъемов. Редкие проблемы пользователей RTX 4090 с оплавлением этих разъемов касаются только топовой модели, а конкретно RTX 4070 Ti это вряд ли коснется, так как уровень энергопотребления для нее установлен в 285 Вт, и проблем возникнуть не должно.
В отличие от RTX 4090 и RTX 4080, модель RTX 4070 Ti не будет предлагаться рынку в варианте самой Nvidia — в виде решений специального издания Founders Edition. А вот партнеры компании уже анонсировали и выпустили на рынок по несколько решений собственного дизайна, включая разогнанные варианты, имеющие улучшенные системы питания и охлаждения. Модели GeForce RTX 4070 Ti уже доступны в разных модификациях у партнеров компании: Asus, Colorful, Gainward, Galaxy, Gigabyte, Innovision 3D, MSI, Palit, PNY, Zotac и других.
Особенности архитектуры
В линейке видеокарт GeForce RTX 40 применяются графические процессоры AD10x, основанные на графической архитектуре Ada Lovelace. Инженеры компании Nvidia спроектировали графическую архитектуру, которая не только повысила производительность операций трассировки лучей и машинного вычисления на тензорных ядрах, но и предоставила некоторые новые возможности, позволяющие улучшить эффективность, также заметно повлиял переход на современный технологический процесс тайваньской компании TSMC, позволивший разместить в чипах большое количество исполнительных блоков. Новые GPU получились заметно более сложными, но при этом они работают на высокой тактовой частоте, по сравнению с решениями предыдущих серий.
Графический процессор AD104 включает в себя все возможности и особенности AD102 флагманского решения, включая RT-ядра третьего поколения и тензорные ядра четвертого — то есть, поддерживает все улучшения трассировки лучей, а также технологию увеличения производительности DLSS 3 и новый ускоритель оптического потока OFA. Кристалл AD104 в составе модели видеокарты GeForce RTX 4070 Ti обеспечивает достаточно высокий уровень производительности — почти на уровне флагманского решения RTX 3090 Ti, основанного на чипе GA102 предыдущего поколения, но при гораздо меньшем уровне энергопотребления.
Как и все графические процессоры компании Nvidia, чип AD104 состоит из укрупненных кластеров Graphics Processing Cluster (GPC), которые включают несколько кластеров текстурной обработки Texture Processing Cluster (TPC), содержащих потоковые процессоры Streaming Multiprocessor (SM), блоки растеризации ROP и контроллеры памяти. Как и в предыдущих архитектурах, кластер GPC самостоятельно производит все основные вычисления внутри кластера, и включает свой движок растеризации Raster Engine, шесть кластеров TPC, состоящих из 12 мультипроцессоров SM. Рассмотрим диаграмму графического процессора в полной конфигурации:
Модель видеокарты GeForce RTX 4070 Ti выполнена на основе полной версии графического процессора AD104, который содержит 35,8 миллиардов транзисторов и включает 5 вычислительных кластеров GPC, 30 кластеров текстурной обработки TPC, 60 потоковых мультипроцессоров SM и шесть 32-битных контроллеров памяти (192-бит в целом). Всего полноценный GPU содержит 7680 CUDA-ядер, 60 RT-ядер, 240 тензорных ядер, 240 текстурных блоков TMU и 80 блоков ROP. Подсистема памяти включает 7680 КБ L1-кэша, 15360 КБ регистрового файла и 48 МБ L2-кэша.
Каждый мультипроцессор в чипах AD10x содержит по 128 CUDA-ядер, по одному RT-ядру третьего поколения, по четыре тензорных ядра четвертого поколения, по четыре текстурных блока TMU, регистровый файл на 256 КБ и 128 КБ L1-кэша или разделяемой памяти, объем которых конфигурируется по необходимости. Количество блоков текстурирования и заполнения возросло по сравнению с аналогичными графическими процессорами семейства Ampere, что должно сказаться при упоре в скорость текстурных выборок и заполнения, что иногда встречается в играх.
Память в GeForce RTX 4070 Ti применяется уже знакомая — GDDR6X, и в случае рассматриваемой модели ее эффективная рабочая частота составляет 21 ГГц — общая пропускная способность памяти в этом случае превышает 500 ГБ/с, что аж вдвое меньше, чем у RTX 3090 Ti из предыдущего поколения, схожей с новинкой по теоретическим показателям производительности. Общий объем видеопамяти составляет 12 ГБ, что хоть и достаточно для решения такого уровня, но это также вдвое меньше, чем у RTX 3090 (Ti). Нехватка ПСП и сравнительно небольшой объем видеопамяти — это немногочисленные потенциальные недостатки новой видеокарты, ведь во многих случаях общая производительность рендеринга может упираться именно в это.
Возможно, часть проблем решат улучшения в подсистеме кэширования. Всего RTX 4070 Ti содержит 7680 КБ кэш-памяти первого уровня, по сравнению с 10752 КБ в топовой версии прошлого поколения — RTX 3090 Ti, зато значительно вырос объем кэш-памяти второго уровня — тут его целых 48 МБ, в отличие от всего лишь 6 МБ в той же RTX 3090 Ti. Это должно частично нивелировать нехватку ПСП, да и многие приложения получат преимущество от большого объема кэш-памяти — он положительно сказывается в сложных вычислительных задачах, вроде аппаратной трассировки лучей и растеризации — в играх и тестах с большим количеством полупрозрачных частиц, вроде бенчмарка 3DMark FireStrike.
Сравним теоретические показатели пары выпущенных моделей видеокарт серии GeForce RTX 40, основанных на разных чипах линейки AD10x, с некоторыми из моделей предыдущей линейки Ampere, что позволит наглядно оценить разницу между ними.
RTX 4080 | RTX 4070 Ti | RTX 3090 Ti | RTX 3080 Ti | RTX 3070 Ti | |
---|---|---|---|---|---|
Кристалл | AD103 | AD104 | GA102 | GA102 | GA104 |
Кол-во транзисторов, млрд. | 45,9 | 35,8 | 28,3 | 28,3 | 17,4 |
Площадь, мм² | 379 | 295 | 628 | 628 | 393 |
CUDA-ядра | 9728 | 7680 | 10752 | 10240 | 6144 |
Тензорные ядра | 304 | 240 | 336 | 320 | 192 |
RT-ядра | 76 | 60 | 84 | 80 | 48 |
Базовая частота, ГГц | 2,21 | 2,31 | 1,56 | 1,37 | 1,58 |
Турбо-частота, ГГц | 2,51 | 2,61 | 1,86 | 1,67 | 1,77 |
Производительность FP32, ТФлопс | 48,7 | 40,1 | 40,0 | 34,1 | 21,8 |
Текстурирование, ГТекс/с | 762 | 626 | 625 | 533 | 340 |
Скорость заполнения, ГПикс/с | 281 | 209 | 208 | 187 | 170 |
Объем памяти, ГБ | 16 | 12 | 24 | 12 | 8 |
Шина памяти, бит | 256 | 192 | 384 | 384 | 256 |
ПСП, ГБ/с | 717 | 504 | 1008 | 912 | 608 |
Потребление, Вт | 320 | 285 | 450 | 350 | 290 |
Если сравнивать RTX 4070 Ti (бывшая «RTX 4080 12 ГБ») и RTX 4080 (бывшая «RTX 4080 16 ГБ»), то между ними налицо большая разница по количеству исполнительных блоков, по их теоретической производительности, а также по ПСП. Если RTX 4090 — бескомпромиссный флагман, то RTX 4080 подходит для большего количества пользователей, а RTX 4070 Ti — это еще более массовый продукт. При теоретической производительности по большинству показателей на уровне RTX 3090 Ti, новинка имеет более чем в полтора раза меньшее потребление энергии и вдвое меньшую площадь кристалла — все это благодаря новому 5-нанометровому техпроцессу. В целом, RTX 4070 Ti должна быть более чем в полтора раза энергоэффективнее, чем RTX 3090 Ti, и примерно на одном уровне с ней по производительности.
Рассматриваемую сегодня модель Nvidia явно делала для того, чтобы создать полный аналог RTX 3090 Ti по скорости. Из таблицы видно, что это им удалось — почти по всем важным показателям пиковой теоретической производительности они идентичны. Но именно что почти по всем — кроме пропускной способности видеопамяти, которая у RTX 4070 Ti ровно вдвое ниже! Да что там, даже у RTX 4090 она осталась на уровне RTX 3090 Ti, а 504 ГБ/с у новинки на фоне 1008 ГБ/с у флагманской видеокарты предыдущей серии вообще не воодушевляют. Надеемся на то, что увеличившийся в 8 раз объем кэш-памяти второго уровня позволит нивелировать этот недостаток, но уж очень он велик, и наверняка в жизни встретятся случаи, когда этого добиться не удастся.
Хотя по тестам самой Nvidia все шоколадно, конечно же — новая RTX 4070 Ti в худших случаях наравне с RTX 3090 Ti, а в лучших — вдвое-втрое быстрее. Но это уже явно с применением DLSS 3, да и вообще — где тот давно обещанный режим Overdrive для Cyberpunk 2077?
Все архитектурные улучшения семейства Ada Lovelace были разобраны нами в теоретическом обзоре, там подробно описаны все изменения в RT-ядрах новой архитектуры, включая аппаратные блоки Opacity Micromap Engine и Displaced Micro-Mesh Engine, а также дополнительный планировщик для изменения порядка выполнения шейдеров Shader Execution Reordering, позволяющие повысить эффективность аппаратной трассировки лучей.
Там же подробно расписана и работа технологии DLSS 3, которая стала не просто технологией масштабирования разрешения, как DLSS 2, а приобрела возможность вставки дополнительных кадров на основе информации из существующих, что увеличивает их частоту и плавность видеоряда в итоге. DLSS 3 состоит из трех частей: генерация кадров Frame Generation, увеличение разрешения Super Resolution (то, что мы знаем под именем DLSS 2) и технология снижения задержек Reflex. Видеокарты серии RTX 40 поддерживают все три, а предыдущие модели — две, за исключением генерации кадров, и DLSS в играх будет работать на всех GPU, просто с разными возможностями. Важно, что DLSS 3 сразу получила поддержку большого количества игровых разработчиков и игровых движков.
Возможности GeForce RTX 4070 Ti по работе с видеоданными не отличаются от таковых у флагманской модели — в специализированном аппаратном кодировщике NVEnc восьмого поколения появилась поддержка кодирования видео в формате AV1, кодировщик AV1 в Ada на 40%-50% эффективнее кодировщика H.264, используемого в графических процессорах предыдущей серии, и новый формат AV1 позволит увеличить разрешение видеопотока при стриминге с 1080p до 1440p при том же битрейте. Кроме этого, представленные графические процессоры Ada имеют по два аппаратных кодировщика NVEnc на борту, что позволяет кодировать видеоданные с разрешением 8K при 60 FPS или сразу четыре видеопотока разрешения 4K при 60 FPS — и при этом быстрее, чем на RTX 3090 Ti.
Кроме NVEnc, в графические процессоры архитектуры Ada включен аппаратный декодер пятого поколения NVDec, который появился в Ampere. Он поддерживает декодирование видеоданных с аппаратным ускорением в форматах: MPEG-2, VC-1, H.264 (AVCHD), H.265 (HEVC), VP8, VP9 и AV1. Также полностью поддерживается и декодирование видеоданных в разрешении 8K при 60 FPS. На этом с теоретической частью мы закончили и переходим к рассмотрению практических особенностей видеокарты GeForce RTX 4070 Ti в исполнении компании Palit.
Особенности карты Palit GeForce RTX 4070 Ti GameRock Classic OC 12 ГБ
Сведения о производителе: Компания Palit Microsystems (торговая марка Palit) основана в 1988 году в Китайской Республике (Тайвань). Штаб-квартира — в Тайбэе/Тайвань, крупный центр по логистике — в Гонконге, второй офис (по продажам в Европе) — в Германии. Фабрики — в Китае. На рынке в России — с 1995 года (начинались продажи как безымянных продуктов, так называемых Noname, а под маркой Palit продукты начали идти только после 2000 года). В 2005 году компания приобрела торговую марку и ряд активов Gainward (после, по сути, банкротства одноименной компании), после чего был образован холдинг Palit Group. Был открыт еще один офис в Шеньжене, направленный на продажи в Китае. На сегодня внутри Palit Group сосредоточено еще несколько торговых марок и брендов.
Объект исследования: серийно выпускаемый ускоритель трехмерной графики (видеокарта) Palit GeForce RTX 4070 Ti GameRock Classic OC 12 ГБ 192-битной GDDR6X
Palit GeForce RTX 4070 Ti GameRock Classic OC 12 ГБ 192-битной GDDR6X | ||
---|---|---|
Параметр | Значение | Номинальное значение (референс) |
GPU | GeForce RTX 4070 Ti (AD104) | |
Интерфейс | PCI Express x16 4.0 | |
Частота работы GPU (ROPs), МГц | BIOS P: 2760(Boost)—2850(Max) BIOS S: 2610(Boost)—2805(Max) |
2610(Boost)—2805(Max) |
Частота работы памяти (физическая (эффективная)), МГц | 2625 (21000) | 2625 (21000) |
Ширина шины обмена с памятью, бит | 192 | |
Число вычислительных блоков в GPU | 60 | |
Число операций (ALU/CUDA) в блоке | 128 | |
Суммарное количество блоков ALU/CUDA | 7680 | |
Число блоков текстурирования (BLF/TLF/ANIS) | 240 | |
Число блоков растеризации (ROP) | 80 | |
Число блоков Ray Tracing | 60 | |
Число тензорных блоков | 240 | |
Размеры, мм | 310×125×63 | 310×130×70 |
Количество слотов в системном блоке, занимаемые видеокартой | 4 | 4 |
Цвет текстолита | черный | черный |
Энергопотребление пиковое в 3D, Вт (BIOS P/BIOS S) | 293/293 | 285 |
Энергопотребление в режиме 2D, Вт | 40 | 40 |
Энергопотребление в режиме «сна», Вт | 11 | 11 |
Уровень шума в 3D (максимальная нагрузка), дБА (BIOS P/BIOS S) | 32,5/30,8 | 32,0 |
Уровень шума в 2D (просмотр видео), дБА | 18,0 | 18,0 |
Уровень шума в 2D (в простое), дБА | 18,0 | 18,0 |
Видеовыходы | 1×HDMI 2.1, 3×DisplayPort 1.4a | 1×HDMI 2.1, 3×DisplayPort 1.4a |
Поддержка многопроцессорной работы | нет | |
Максимальное количество приемников/мониторов для одновременного вывода изображения | 4 | 4 |
Питание: 8-контактные разъемы | 0 | 0 |
Питание: 6-контактные разъемы | 0 | 0 |
Питание: 16-контактные разъемы | 1 | 1 |
Вес карты с комплектом поставки (брутто), кг | 2,2 | 2,5 |
Вес карты чистый (нетто), кг | 1,7 | 2,0 |
Максимальное разрешение/частота, DisplayPort | 3840×2160@144 Гц, 7680×4320@60 Гц | |
Максимальное разрешение/частота, HDMI | 3840×2160@144 Гц, 7680×4320@60 Гц | |
Средняя цена карты Palit | единичные предложения в районе 83-88 тысяч рублей на момент подготовки обзора |
Память
Карта имеет 12 ГБ памяти GDDR6X SDRAM, размещенной в 6 микросхемах по 16 Гбит на лицевой стороне PCB. Микросхемы памяти Micron (GDDR6X, MT61K512M32KPA-21 / D8BZC) рассчитаны на номинальную частоту работы в 2625 (21000) МГц.
Особенности карты и сравнение с Palit GeForce RTX 4080 GameRock
Palit GeForce RTX 4070 Ti GameRock Classic OC (12 ГБ) | Palit GeForce RTX 4080 GameRock (16 ГБ) |
---|---|
вид спереди | |
вид сзади | |
Мы сравниваем карту Palit с ее же продуктом на базе RTX 4080 по двум причинам: во-первых, эталонной карты Nvidia на базе RTX 4070 Ti (12 ГБ) никто из медиасообщества в РФ не получал; во-вторых, интересно сравнить рассматриваемую сейчас карту со «старшей сестрой». В целом мы видим, что карты сильно отличаются, хотя, казалось бы, можно было просто убрать с карты RTX 4080 две микросхемы памяти, получив тем самым и объем 12 ГБ, и 192-битную шину обмена с памятью. В случае поколения RTX 30 часто делалось именно так, когда карты, имеющие в качестве GPU один и тот же физический чип, использовали разводку PCB под максимальную ширину шины, а дальше уже комплектовались разным количеством микросхем памяти. Печатная плата под RTX 4080 имеет максимальную ширину шины 256 бит, и по наличию двух пустых посадочных мест для микросхем памяти на PCB RTX 4070 Ti можно предположить, что разводка карты точно такая же, под ширину шины в 256 бит, да и размеры обеих карт по сути одинаковые. Зачем тогда надо было существенно переделать PCB под RTX 4070 Ti? Ответ получен из инсайдерской среды Nvidia: разводка чипа AD104 сильно отличается от предыдущих, потому требует установки на плату со смещением на 90 градусов, и это вызывает существенные переделки в разводке.
Сбоку справа на карте мы видим посадочные места, похожие на те, куда устанавливаются 8-контактные разъемы питания. На самом деле они предназначены для подключения мощных внешних вентиляторов в системах, использующих профессиональные версии подобных видеокарт (для игровых и профессиональных видеокарт используются одни и те же GPU, разница может быть лишь в объеме памяти, конфигурации рабочих блоков и, конечно же, в программном обеспечении).
Ядро имеет маркировку AD104-400, защиты от майнинга нет, дата выпуска — 43-я неделя 2022 года (октябрь).
Суммарное количество фаз питания у карты Palit GeForce RTX 4070 Ti GameRock Classic OC (12 ГБ) — 14, а у ее собрата на RTX 4080 — 18.
При этом распределение фаз такое: у Palit GeForce RTX 4080 GameRock — 15 фаз на ядро и 3 на микросхемы памяти, у карты Palit GeForce RTX 4070 Ti GameRock Classic OC (12 ГБ) — 12 + 2.
Зеленым цветом отмечена схема питания ядра, красным — памяти. Обоими схемами (12+2) управляет один ШИМ-контроллер MP2891 (Monolithic Power Systems), расположенный на оборотной стороне PCB. Это новый контроллер, есть данные, что он рассчитан максимум на 16 фаз.
В преобразователе питания, традиционно для всех видеокарт Nvidia, используются транзисторные сборки DrMOS — в данном случае MP86957 (Monolithic Power Systems), каждая из которых рассчитана максимально на 70 А.
На тыльной стороне платы имеется контроллер uS5650Q (uPI Semiconductor), который отвечает за мониторинг карты (отслеживание напряжений и температуры).
Управление подсветкой традиционно возложено на контроллер Holtek.
Карта имеет два режима работы, они заложены в двух вариантах BIOS, которые переключаются с помощью переключателя на верхнем торце: P (performance / производительный, он же 1) и S (silent / тихий, он же 2). Разница между режимами не только в оборотах вентиляторов, но и в частотах работы GPU, плюс небольшая разница в лимитах: предел энергопотребления для BIOS P заложен в 330 Вт, а для BIOS S — в 285 Вт.
Штатные частоты памяти в обоих режимах BIOS равны референсным значениям. При этом Boost-значение частоты работы ядра в BIOS 1(P) выше референс-аналога почти на 6,8%. Исследования показали, что в среднем мы получили в играх прирост производительности на 5% относительно референс-карты. Частоты работы ядра в BIOS 2(S) соответствуют референс-значениям.
Энергопотребление карты Palit в пиках доходило до 293 Вт в обоих режимах BIOS.
Я попробовал ручной разгон и получил максимальные частоты 3000/23000 МГц, что обеспечило прирост в играх в разрешении 4К в среднем почти на 8% относительно референсных значений (лимит потребления можно поднять до 112%), энергопотребление карты выросло при этом до 315 Вт.
Питание на карту Palit подается через новый 16-контактный разъем питания стандарта PCIe 5.0.
В комплекте поставки карты имеется переходник на такой разъем с двух обычных 8-контактных PCIe 2.0 (хорошо всем знакомых).
Отметим приличные габариты данной карты, особенно по толщине: 6,3 см. В результате видеокарта занимает 4 слота в системном блоке.
RTX 4070 Ti не обладает поддержкой мультиграфической конфигурации, то есть технологии SLI, и у карты нет специального разъема на верхнем торце.
Карта имеет стандартный набор видеовыходов: три DP 1.4a и один HDMI 2.1.
Управление работой карты обеспечивается с помощью фирменной утилиты Thunder Master.
Нагрев и охлаждение
В целом концепция СО у этой карты соответствует той, что рекомендовала Nvidia при выпуске серии RTX 30: компактная PCB и система охлаждения, продувающая крайним вентилятором радиатор насквозь. Собственно, инженеры Palit даже усилили такой вариант: основой кулера является огромный многосекционный пластинчатый никелированный радиатор с тепловыми трубками, распределяющими тепло по ребрам радиатора. Трубки припаяны к огромному медному плато (подошве). Испарительной камеры в данном случае нет, просто сама подошва весьма толстая.
Микросхемы памяти и преобразователи питания VRM охлаждаются с помощью этой же огромной подошвы (через термопрокладки).
Задняя пластина участвует в охлаждении оборотной стороны платы через термопрокладки, а также служит элементом защиты и усиления жесткости PCB. Концепция в целом предусматривает тройную защиту печатной платы от любых повреждений и изгибов: кроме задней пластины имеется еще и черная рама, связывающая ее с радиатором охлаждения, а также с крепежной планкой, создавая этакий монолитный каркас вокруг PCB.
Поверх радиатора установлен кожух, покрывающий три вентилятора ∅95 мм.
Остановка вентиляторов при малой нагрузке видеокарты происходит, если температура GPU опускается ниже 50 градусов, а нагрев микросхем памяти — ниже 80 градусов. При запуске ПК вентиляторы работают, однако после загрузки видеодрайвера идет опрос рабочей температуры, и они выключаются. Ниже есть видеоролик на эту тему.
Мониторинг температурного режима с помощью MSI Afterburner:
Режим BIOS 1(P):
После 2-часового прогона под нагрузкой максимальная температура ядра не превысила 68 градусов, а температура микросхем памяти — 75 градусов, что является великолепным результатом для видеокарт такого уровня! Энергопотребление карты доходило до 293 Вт. Напомним, что безопасный предел нагрева памяти GDDR6X — 105 °C.
Режим BIOS 2(S):
В этом случае максимальная температура ядра достигала 69 градусов, а микросхем памяти — 76 °C, что также является отличным результатом для видеокарт такого уровня. Энергопотребление карты почти не изменилось (293 Вт).
При ручном разгоне (режим BIOS 1(P)) при выставлении лимита потребления в 112% параметры нагрева и шума менялись мало: максимальная температура ядра достигала 70 градусов, памяти — 77 градусов, потребление вырастало до 315 Вт.
Мы засняли и ускорили в 50 раз 8-минутный прогрев (BIOS 1(P)):
Максимальный нагрев наблюдался около блока VRM и микросхем памяти.
Шум
Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.
Режимы измерения:
- Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
- Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
- Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark
Оценка градаций уровня шума следующая:
- менее 20 дБА: условно бесшумно
- от 20 до 25 дБА: очень тихо
- от 25 до 30 дБА: тихо
- от 30 до 35 дБА: отчетливо слышно
- от 35 до 40 дБА: громко, но терпимо
- выше 40 дБА: очень громко
В режиме простоя в 2D в обоих режимах BIOS температура была не выше 42 °C, вентиляторы не работали, уровень шума был равен фоновому — 18 дБА.
При просмотре фильма с аппаратным декодированием ничего не менялось.
Режим BIOS 1(P):
В режиме максимальной нагрузки в 3D температура достигала 68/75 °C (ядро/память). Вентиляторы при этом раскручивались до 1707 оборотов в минуту, шум вырастал до 32,5 дБА: это отчетливо слышно, но еще не громко. В видеоролике ниже можно оценить, как вырастает шум (он фиксировался на пару секунд через каждые 30 секунд).
Режим BIOS 2(S):
В режиме максимальной нагрузки в 3D температура достигала 69/77 °C (ядро/память). Вентиляторы при этом раскручивались до 1570 оборотов в минуту, шум вырастал до 30,8 дБА: это тот же уровень, немного тише. В видеоролике ниже это продемонстрировано (шум фиксировался на пару секунд через каждые 30 секунд).
В целом относительно тихая работа системы охлаждения заслуживает похвалы.
Подсветка
Карта Palit имеет СО, доставшуюся ей «по наследству» от RTX 3090 Ti, так что мы видим хорошо знакомую нам по картам 30-й серии подсветку практически по всей площади кожуха СО, где установлены несколько десятков адресуемых светодиодов под акриловым покрытием характерного и запоминающегося вида.
Также на верхнем торце карты подсвечены логотипы серий.
Это не новый тип подсветки, такой дизайн появился в 2020 году с выходом RTX 30 в серии GameRock. Управление режимами подсветки, в том числе и ее отключением, осуществляется той же утилитой ThunderMaster.
Имеется возможность сохранения выбранного режима в самой карте, то есть при желании можно настроить подсветку один раз и больше не запускать программу.
Отметим, что в комплект поставки карт серии GameRock входит кабель для подключения к разъему ARGB (5 В) на материнской плате, чтобы синхронизировать работу подсветки с платой. В этом случае запускать утилиту ThunderMaster вообще не требуется: карта самостоятельно определит подключение, и подсветка по умолчанию будет синхронизирована.
Комплект поставки и упаковка
В комплекте поставки уже нет даже традиционного краткого руководства пользователя (все переведено в интернет!), но зато имеются: разборная металлическая подставка-штатив под карту, переходник питания, кабель синхронизации подсветки.
Стоит обратить внимание на переходник питания с двух 8-контактных разъемов на один 16-контактный.
Напомним, что данный адаптер крайне не рекомендуется сгибать в месте той самой оплетки.
И хотя данная карта потребляет не так много, то есть нагрузка на адаптер питания сравнительно невелика, все же рекомендуем приобретать полноценные БП ATX 3.0 с разъемом 12VHPWR и кабелем с 16 контактами для видеокарт новых поколений.
Подставка типа штатив, упирающаяся в дно корпуса, состоит из трех секций, на ней установлен кронштейн, регулируемый по высоте, так что можно подобрать нужный вариант. Такой способ поддержки не перекрывает слоты ниже видеокарты в системном блоке. Однако не всегда прямо под видеокартой имеется свободное пустое пространство на дне корпуса для установки такой подставки-штатива (корпуса сейчас делают очень разные). Подставка не просто подпирает угол карты, а крепится к ней.
Подставка способна поддерживать и две карты, если они установлены в одном системном блоке. Для этого имеется дополнительный кронштейн, надеваемый на опору. В целом идея отличная, ибо ранее мы видели комплектацию карт акриловым кронштейном-подставкой, который крепится под видеокартой, занимая два слота под ней.
Тестирование: синтетические тесты
Мы провели тестирование новой модели видеокарты Nvidia со стандартными частотами в нашем наборе синтетических тестов. Он продолжает меняться, иногда добавляются новые тесты, а устаревшие постепенно убираются. Мы бы хотели добавить еще больше примеров с вычислениями, но с этим есть определенные сложности. Мы постоянно стараемся расширять и улучшать набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — напишите их в комментариях к статье или отправьте авторам.
Из более-менее новых бенчмарков мы начали использовать несколько дополнительных тестов для измерения производительности трассировки лучей и, а также технологий масштабирования разрешения и увеличения производительности: DLSS и XeSS. В качестве полусинтетических тестов у нас также используется набор подтестов из довольно популярного пакета 3DMark: Time Spy, Port Royal, DX Raytracing, Speed Way и др. А вот примеры приложений DirectX 11 и 12, входящие в различные SDK, пришлось убрать — последнее время они все чаще давали некорректные результаты.
Синтетические тесты проводились на следующих видеокартах:
- GeForce RTX 4070 Ti со стандартными параметрами (RTX 4070 Ti)
- GeForce RTX 4080 со стандартными параметрами (RTX 4080)
- GeForce RTX 3090 Ti со стандартными параметрами (RTX 3090 Ti)
- GeForce RTX 3090 со стандартными параметрами (RTX 3090)
- Radeon RX 6950 XT со стандартными параметрами (RX 6950 XT)
Для анализа производительности видеокарты GeForce RTX 4070 Ti мы взяли модель, которая стоит на ступень выше в новой линейке — RTX 4080. Более того, раньше эти две видеокарты имели одно наименование — RTX 4080 и отличались лишь суффиксом, указывающим на объем памяти и модификацию. По этому сравнению будет понятно, насколько новинка на чипе AD104 медленнее решения этого же семейства на основе AD103. Также в тесты вошла и пара топовых видеокарт компании Nvidia из предыдущего поколения — они нужны чтобы узнать, насколько новая видеокарта быстрее или медленнее.
Соперник для новинки у компании AMD в виде Radeon RX 7900 XT уже вышел, но нами пока что не протестирован (хотя тесты уже на подходе — ожидайте статью в январе). Ну а пока что остается лишь один номинальный конкурент в виде Radeon RX 6950 XT — просто как самый быстрый вариант из уже протестированных нами решений на основе архитектуре RDNA2. Но не забываем, что новая видеокарта Nvidia будет напрямую конкурировать на рынке уже с решениями на основе архитектуры RDNA3.
Тестирование: игровые тесты
Конфигурация тестового стенда
- Компьютер на базе процессора Intel Core i9-12900K (Socket LGA1700):
- Платформа:
- процессор Intel Core i9-12900K (разгон до 5,1 ГГц по всем ядрам);
- ЖСО Asus ROG Ryujin II 360;
- системная плата Asus ROG Maximus Z690 Extreme на чипсете Intel Z690;
- оперативная память Kingston Fury (KF552C40BBK2-32) 32 ГБ (2×16) DDR5 4800 МГц (XMP 5200 МГц);
- SSD Intel 760p NVMe 1 ТБ PCI-E;
- жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA3;
- блок питания Gigabyte UD1000GM PG5 (1000 Вт);
- корпус Thermaltake Level20 XT;
- операционная система Windows 11 Pro 64-битная;
- телевизор LG 55Nano956 (55″ 8K HDR, HDMI 2.1);
- драйверы AMD версии 22.12.1;
- драйверы Nvidia версии 527.56/527.62;
- VSync отключен.
- Платформа:
Список инструментов тестирования
Во всех игровых тестах использовалось максимальное качество графики в настройках.
- Marvel's Spider-Man Miles Morales (Insomniac Games/Sony Interactive)
- Cyberpunk 2077 (Софтклаб/CD Projekt RED), патч 1.4 (версия 1.5 еще не тестировалась)
- God of War (Sony IE/Sony IE)
- Call of Duty: Modern Warfare II (Infinity Ward/Activision)
- Marvel’s Guardians of the Galaxy (Eldos/Square Enix)
- The Medium (Bloober/Bloober)
- A Plague Tale: Requiem (Asobo Studio/Focus Entertainment)
- Resident Evil Village (Capcom/Capcom)
- Far Cry 6 (Ubisoft/Ubisoft)
- Battlefield 2042 (DICE/EA)
Кратко о производительности в 3D-играх
Перед демонстрацией детальных тестов мы приводим краткие сведения о производительности семейства, к которому относится конкретный исследуемый ускоритель, а также его соперников. Все это нами субъективно оценивается по шкале из пяти градаций.
Игры без использования трассировки лучей (классическая растеризация):
При оценке исходим из того, что еще летом 2022 года лидерами производительности в классических играх были GeForce RTX 3090 Ti и Radeon RX 6950 XT. Учитывая, что RTX 4070 Ti в среднем находится почти на уровне (в разрешении 4K — на 1% быстрее) RTX 3090 Ti, то выводы очевидны: перед нами практически замена бывшего флагмана 3ххх серии, а значит все игры в 4K на максимальных настройках графики будут по плечу «бронзовому» финалисту нынешней гонки ускорителей.
Игры с использованием трассировки лучей и DLSS/FSR:
C учетом некоторого падения производительности при активации в играх трассировки лучей (при этом появляется все больше и больше игр с поддержкой Nvidia DLSS, а эта технология «умного» антиалиасинга позволяет резко поднять производительность, в том числе компенсируя падение от включения RT) , а также того факта, что у Radeon RX 6950 XT падение FPS куда более драматично, новинка RTX 4070 Ti смотрится еще ярче относительно былых лидеров. Опять же, в отличие от предыдущего флагмана RTX 3090 Ti нынешний равный с ним игрок в лице RTX 4070 Ti обладает DLSS 3, так что когда массово начнет внедряться эта технология, то можно будет вообще никогда отключать трассировку в играх.
Результаты тестирования в 3D-играх
Стандартные результаты тестов без использования аппаратной трассировки лучей в разрешениях 1920×1200, 2560×1440 и 3840×2160
Все регулярно тестируемые нами видеокарты сейчас поддерживают технологию RT, поэтому мы проводим тесты не только с использованием обычных методов растеризации, но и с включением RT и/или DLSS/FSR.
Результаты тестов со включенной аппаратной трассировкой лучей и/или DLSS/FSR в разрешениях 1920×1200, 2560×1440 и 3840×2160
Результаты тестов с включенной аппаратной трассировкой лучей и DLSS/FSR в разрешении 7680×4320 (8К)
Сегодня нормально поиграть в таком разрешении можно только на самых флагманских и дорогих видеокартах, да и то для приемлемого комфорта требуется обязательное использование DLSS (или FSR). В итоге поиграть в таком разрешении все же можно, хотя и далеко не во все игры.
Рейтинг iXBT.com
Рейтинг ускорителей iXBT.com демонстрирует нам функциональность видеокарт друг относительно друга и представлен в двух вариантах:
- Вариант рейтинга iXBT.com без включения RT
Рейтинг составлен по всем тестам без использования технологий трассировки лучей. Этот рейтинг нормирован по наиболее слабому ускорителю из группы карт — Radeon RX 6500 XT (то есть сочетание скорости и функций Radeon RX 6500 XT приняты за 100%). Рейтинги ведутся по 25 ежемесячно исследуемым нами акселераторам в рамках проекта Лучшая видеокарта месяца. В данном случае из общего списка выбрана группа карт для анализа, в которую входят GeForce RTX 4070 Ti и его конкуренты.
Рейтинг приведен суммарно для всех трех разрешений.
№ | Модель ускорителя | Рейтинг iXBT.com | Рейтинг полезности | Цена, руб. |
---|---|---|---|---|
02 | RTX 4080 16 ГБ, 2505—2625/22400 | 502 | 51 | 98 000 |
03 | Palit RTX 4070 Ti GR OC, разгон до 3000/23000 | 485 | 57 | 85 000 |
04 | Palit RTX 4070 Ti GR OC, 2790—2850/21000 | 478 | 56 | 85000 |
05 | RTX 4070 Ti 12 ГБ, 2610—2805/21000 | 466 | 55 | 85000 |
06 | RTX 3090 Ti 24 ГБ, 1860—1965/21000 | 463 | 47 | 99500 |
07 | RX 6950 XT 16 ГБ, 2310—2525/18000 | 450 | 54 | 83100 |
08 | RTX 3090 24 ГБ, 1695—1965/19500 | 434 | 47 | 93000 |
Отлично видно, что в классических играх по всем разрешениям средний прирост производительности относительно RTX 3090 Ti составляет около 1%, относительно RX 6950 XT — 3,5%, а в разрешении 4К — 2% и 5% соответственно. Карта Palit еще чуть быстрее: прирост FPS относительно RTX 3090 Ti — 3,5%, а против RX 6950 XT — 6,3%. В целом, третий по уровню производительности ускоритель последнего поколения Nvidia окончательно отправляет флагманы 2020—2022 годов на пенсию.
- Вариант рейтинга iXBT.com с включением RT/DLSS/FSR
Рейтинг составлен по 9 тестам, в которых используется технология трассировки лучей и одновременно технология Nvidia DLSS, AMD FSR или Intel XeSS. Этот рейтинг нормирован по самому слабому ускорителю в данной группе — Radeon RX 6500 XT (то есть сочетание скорости и функций Radeon RX 6500 XT приняты за 100%).
Рейтинг приведен суммарно для всех трех разрешений.
№ | Модель ускорителя | Рейтинг iXBT.com | Рейтинг полезности | Цена, руб. |
---|---|---|---|---|
02 | RTX 4080 16 ГБ, 2505—2625/22400 | 875 | 89 | 98 000 |
03 | Palit RTX 4070 Ti GR OC, разгон до 3000/23000 | 822 | 97 | 85 000 |
04 | Palit RTX 4070 Ti GR OC, 2790—2850/21000 | 803 | 94 | 85 000 |
05 | RTX 4070 Ti 12 ГБ, 2610—2805/21000 | 785 | 92 | 85 000 |
06 | RTX 3090 Ti 24 ГБ, 1860—1965/21000 | 766 | 77 | 99 500 |
07 | RTX 3090 24 ГБ, 1695—1965/19500 | 711 | 76 | 93 000 |
09 | RX 6950 XT 16 ГБ, 2310—2525/18000 | 652 | 78 | 83 100 |
В данном случае превосходство RTX 4070 Ti над флагманами AMD выражено еще более ярко вследствие большего падения производительности у тех при включении RT. В среднем прирост производительности относительно RTX 3090 Ti по всем разрешениям составляет 2,5%, а в разрешении 4К — 4%. Разница же в производительности с RX 6950 XT в данном случае составляет 20% по всем разрешениям и аж 46% в 4К. Карта Palit смотрится еще более выигрышно за счет повышенных частот работы.
Рейтинг полезности
Рейтинг полезности тех же карт получается, если показатель предыдущего рейтинга разделить на цены соответствующих ускорителей. Для расчета рейтинга полезности использованы розничные цены на конец декабря 2022 года. Учитывая нацеленность RTX 4070 Ti на разрешение 4К, мы привели рейтинг, подсчитанный только при использовании разрешения 3840×2160. Поэтому цифры отличаются от рейтинга iXBT.com.
- Вариант рейтинга полезности без включения RT
№ | Модель ускорителя | Рейтинг полезности | Рейтинг iXBT.com | Цена, руб. |
---|---|---|---|---|
10 | Palit RTX 4070 Ti GR OC, разгон до 3000/23000 | 88 | 745 | 85 000 |
14 | Palit RTX 4070 Ti GR OC, 2790—2850/21000 | 86 | 728 | 85 000 |
16 | RTX 4070 Ti 12 ГБ, 2610—2805/21000 | 83 | 704 | 85 000 |
19 | RTX 4080 16 ГБ, 2505—2625/22400 | 81 | 790 | 98 000 |
21 | RX 6950 XT 16 ГБ, 2310—2525/18000 | 77 | 644 | 83 100 |
23 | RTX 3090 Ti 24 ГБ, 1860—1965/21000 | 70 | 698 | 99 500 |
24 | RTX 3090 24 ГБ, 1695—1965/19500 | 68 | 636 | 93 000 |
Еще при изучении RTX 4080 мы обратили внимание, что цена этого ускорителя высоковата для его возможностей, однако после относительно массового появления в продаже таких карт стоимость начала падать, потому даже RTX 4080 оказался выгоднее, чем RTX 3090 Ti. Новый RTX 4070 Ti чуть лучше по выгодности, чем RTX 4080. Карта Palit еще на ступень выше за счет повышенных частот работы и занимает первое место в группе.
- Вариант рейтинга полезности с включением RT
№ | Модель ускорителя | Рейтинг полезности | Рейтинг iXBT.com | Цена, руб. |
---|---|---|---|---|
04 | Palit RTX 4070 Ti GR OC, разгон до 3000/23000 | 155 | 1319 | 85 000 |
05 | Palit RTX 4070 Ti GR OC, 2790—2850/21000 | 151 | 1282 | 85 000 |
07 | RTX 4070 Ti 12 ГБ, 2610—2805/21000 | 146 | 1245 | 85 000 |
09 | RTX 4080 16 ГБ, 2505—2625/22400 | 143 | 1404 | 98 000 |
18 | RTX 3090 Ti 24 ГБ, 1860—1965/21000 | 121 | 1201 | 99 500 |
20 | RTX 3090 24 ГБ, 1695—1965/19500 | 117 | 1086 | 93 000 |
23 | RX 6950 XT 16 ГБ, 2310—2525/18000 | 107 | 892 | 83 100 |
Да, проблема карт AMD 6000-й серии (падение FPS при включении трассировки лучей) и здесь хорошо видна. Сейчас флагманы AMD 6000-й серии уже вообще нет смысла приобретать. Да и RTX 3090 Ti не столь привлекательны (если не считать, конечно, вторичный рынок). В остальном картина такая же: новый RTX 4070 Ti — лидер в группе.
Выводы
Nvidia GeForce RTX 4070 Ti (12 ГБ) — третий по старшинству ускоритель в новой линейке игровой 3D-графики для ПК, уступающий на текущий момент только GeForce RTX 4090 и GeForce RTX 4080. (Согласно данным западных медиаресурсов, Radeon RX 7900 XTX тоже быстрее, но новые ускорители AMD мы еще не изучали.)
Наши исследования показали, что GeForce RTX 4070 Ti имеет очень привлекательное соотношение цены и скорости в лидерской группе. Он продемонстрировал производительность на уровне GeForce RTX 3090 Ti, а вот стоит дешевле: прямо накануне выпуска компания Nvidia снизила MSRP до 800 долларов, так что рублевые цены могут быть весьма интересными. На момент подготовки нашего обзора продажи GeForce RTX 4070 Ti еще не начались, однако по информации дистрибьютеров уже можно было прикинуть ожидаемую розничную стоимость, и условно мы оценили ее в 85 тысяч рублей. Разумеется, по мере появления карт в продаже мы будем корректировать цены в наших материалах.
В отличие от GeForce RTX 4090, который имеет GPU с просто фантастическим количеством активных вычислительных блоков, включая текстурные, тензорные и RT-ядра, у GeForce RTX 4080, не говоря уж о GeForce RTX 4070 Ti, суммарное количество потоковых процессоров меньше, чем у GeForce RTX 3090 Ti, но все-таки даже GeForce RTX 4070 Ti быстрее топа предыдущего поколения. Здесь сыграли свою роль более тонкий техпроцесс и сильно повышенные частоты работы ядра, а также элементы новой архитектуры с увеличенными кэшами и новыми версиями блоков RT и тензорных ядер.
В случае GeForce RTX 4080 и GeForce RTX 4090 изюминкой нового ускорителя мы называли поддержку разрешения 8К, поскольку даже GeForce RTX 4080 уже обладает достаточной производительностью, чтобы некоторые игры с использованием DLSS обеспечивали игроку нормальный комфорт на максимальных настройках графики в 8К (а когда в игры массово внедрят поддержку DLSS 3, комфорт станет еще выше). GeForce RTX 4070 Ti все еще может условно входить в число ускорителей, обеспечивающих приемлемый FPS в таком разрешении, но таких игр уже наберется немного. Разумеется, широкое внедрение DLSS 3 поможет GeForce RTX 4070 Ti остаться востребованным ускорителем для 8K (полагаем, что объема памяти в 12 ГБ будет достаточно для игр даже в столь высоком разрешении).
Наши тесты показали, что у всего семейства GeForce RTX 40 заметно повышена эффективность блоков трассировки лучей, обновлены тензорные ядра, так что чем больше та или иная игра использует возможности RT, тем заметнее будет превосходство нового поколения, ведь в новой архитектуре Ada Lovelace возможности указанных блоков были серьезно улучшены, особенно это касается аппаратной трассировки лучей. Само определение пересечений луча и треугольника в третьем поколении RT-ядер было ускорено вдвое, но еще интереснее дополнительные аппаратные блоки в RT-ядрах: Opacity Micromap Engine, ускоряющий обработку полупрозрачных объектов, вроде языков пламени и листьев, и Displaced Micro-Mesh Engine, способный снизить время построения структур BVH и сократить требования к объему геометрических данных для очень сложных объектов. Еще одна важная новая возможность — переупорядочивание выполнения шейдеров при трассировке лучей — Shader Execution Reordering. Специальный планировщик способен на лету оптимизировать загрузку вычислительных блоков мультипроцессора SM, что потенциально может обеспечить двух-трехкратное ускорение для многих алгоритмов трассировки лучей.
Отдельно стоит упомянуть и новую версию DLSS 3, использующую ускоритель оптического потока Optical Flow Accelerator, улучшенный в архитектуре Ada Lovelace. DLSS 3 использует как масштабирование разрешения из DLSS 2, так и удвоение частоты кадров при помощи вставки промежуточных, используя поле оптического потока. Данные из него комбинируются с векторами движения, и искусственный интеллект при помощи тензорных ядер генерирует промежуточные кадры, чтобы видеоряд был плавнее. А для того, чтобы задержки при этом не слишком увеличивались, используется известная технология компании Reflex. В результате игрок может получить вдвое больше кадров в секунду при визуальном качестве, сравнимом с DLSS 2.
Конкретная протестированная нами карта Palit GeForce RTX 4070 Ti GameRock Classic OC (12 ГБ) — это опять-таки очень производительное решение для энтузиастов, желающих играть как минимум в 4K при максимальных настройках графики, причем без компромиссов. Однако следует помнить, что карта имеет длину более 30 см и толщину в 4 слота, что надо учитывать при планировании апгрейда своего ПК. В комплекте поставки есть поддерживающий штатив с опорой на дно корпуса, поэтому за прогибание карты в системном блоке можно не волноваться (к тому же жесткая рама в конструкции самой карты помогает ей не провисать даже без опоры). Карта, точнее именно вариант GameRock Classic, точь-в-точь похожа на свою сестру на базе GeForce RTX 3090 Ti (в продаже будут и GeForce RTX 4070 Ti серии GameRock, имеющие более новые СО, которые мы видели у новых решений Palit на базе GeForce RTX 4080 и GeForce RTX 4090). Система охлаждения сравнительно тихая в обоих режимах BIOS. Карта может потреблять до 293 Вт (ручной разгон способен преодолеть планку в 300 Вт), она требует использовать два 8-контактных разъема питания (которые подключаются к прилагаемому переходнику на 16-контактный разъем на самой плате), так что наличие приличного БП обязательно! Особо отметим, что такой переходник питания ни в коем случае нельзя изгибать непосредственно после 16-контактного разъема.
Производитель декларирует наличие 3-летней гарантии на эту карту.
Отметим еще раз, что GeForce RTX 4070 Ti отлично подходит для игры в разрешении 4К с максимальным качеством графики с трассировкой лучей с поддержкой DLSS/FSR/XeSS. Также отметим поддержку стандарта HDMI 2.1, позволяющего выводить 4K-изображение со 120 FPS или 8K-разрешение при помощи одного кабеля, поддержку аппаратного декодирования видеоданных в формате AV1, технологию RTX IO, способную обеспечить быструю передачу и распаковку данных с накопителей прямо в GPU, а также технологию снижения задержек Reflex, полезную для киберспортсменов. Разумеется, выход RTX 40 означает начало распространения DLSS 3, но об этой технологии мы поговорим отдельно, когда в свет выйдут соответствующие патчи для популярных и используемых нами игр, а также новые игры с уже реализованной поддержкой DLSS 3.
Справочные материалы:
- Руководство покупателя игровой видеокарты
- Справочник по AMD Radeon HD 7xxx/Rx
- Справочник по Nvidia GeForce GTX 6xx/7xx/9xx/1xxx
В номинации «Отличная поставка» карта Palit GeForce RTX 4070 Ti GameRock Classic OC (12 ГБ) получила награду: