Обзор видеоускорителя AMD Radeon RX 9070 XT на основе карты Gigabyte Aorus Radeon RX 9070 XT Elite 16G (16 ГБ)

Общая информация о Radeon RX 9070 XT

Наконец-то долгожданная серия Radeon RX 9000 вышла — в самом начале марта AMD выпустила свои новые видеокарты, основанные на графических процессорах архитектуры RDNA 4. Изначально планировалось не только анонсировать новые решения на CES 2025, но и выпустить их вскоре, но в последний момент AMD решила придержать их выпуск и посмотреть, что предложит рынку Nvidia со своими GeForce RTX 50. Сама архитектура RDNA 4 и некоторые детали о серии Radeon RX 9000 были частично раскрыты на выставке CES, но подробности и полные спецификации появились позже. Официально компания задержала запуск продаж, чтобы гарантировать больший объем видеокарт на начале запуска, но вряд ли они случайно вышли лишь после того, как конкурент выпустил все четыре видеокарты новой линейки, только тогда настала очередь и для Radeon RX 9070 XT и Radeon RX 9070.

С их выходом AMD окончательно перестала даже пытаться бороться за абсолютное лидерство по максимальной производительности GPU — они решили вовсе не делать соперников для GeForce RTX 5090 и даже GeForce RTX 5080. По словам представителей компании, они сосредоточились на более доступных GPU для более существенных по объему сегментов рынка, предпочтя достижение лучшего соотношения цены и скорости при разрешениях 1440p и 4K в ценовых сегментах до $700.

Две вышедшие модели видеокарт новой серии основаны на графическом процессоре Navi 48 — первом и единственном пока представителе новой графической архитектуры RDNA 4. Эта архитектура предназначена для обеспечения максимальной эффективности (производительности на площадь кристалла), чтобы оказаться примерно на уровне конкурирующих решений подсерии GeForce RTX 5070, и конкурировать с ними по всем параметрам. AMD заявила о значительном увеличении производительности на такт по сравнению с RDNA 3, а также о двукратном увеличении производительности аппаратных блоков трассировки лучей, что являлось главной проблемой для предыдущих решений компании. Такой же уровень ускорения относится к матричным вычислениям на ИИ-ускорителях, что обеспечило возможность внедрения масштабирования FSR 4, основанного на нейросетях, улучшающих качество изображения и производительность.

По сравнению с предыдущей архитектурой компании, в RDNA 4 больше всего улучшений было внедрено в аппаратные блоки трассировки лучей, но и ИИ-ускорители не обошли вниманием. Практически все вычислительные блоки получили свои усовершенствования для повышения производительности и эффективности, ИИ-ускорители получили поддержку новых типов данных с меньшей точностью, но большей производительностью, а блоки трассировки лучей стали значительно быстрее справляться с работой. Но хотя Nvidia перешла уже на память GDDR7 в своих новейших видеокартах, AMD продолжила использовать память «старого» стандарта — GDDR6, обеспечивающего максимальную производительность в 20 Гбит/с против 30 Гбит/с, но для улучшения эффективной пропускной способности в их графических процессорах есть специальный большой кэш Infinity Cache.

Radeon RX 9070 XT — это видеокарта для высокопроизводительного сегмента, которая предназначена для обеспечения комфортной игры в 4K-разрешении при любых графических настройках, которая в полтора раза опережает Radeon RX 6900 XT и на четверть быстрее GeForce RTX 3090 (почему-то для первых слайдов взяли такие старые GPU) по данным AMD. Рассматриваемая новинка имеет рекомендованную цену $600, что слегка больше, чем у GeForce RTX 5070, против которой выступает Radeon RX 9070 без индекса, но заметно ниже, чем у GeForce RTX 5070 Ti. Новая модель должна вернуть AMD к полноценной конкурентоспособности на игровом рынке, ведь сложилась такая ситуация, что более ранние серии Radeon RX 5000 и Radeon RX 6000 были достаточно продвинутыми и производительными для того, чтобы конкурировать с GeForce RTX 20 и GeForce RTX 30, при том, что трассировка лучей в те времена еще не была столь важной, а вот серия Radeon RX 7000 (RDNA 3) уже явно отставала от GeForce RTX 40 и по производительности и по возможностям. Так что в RDNA 4 требовалось повысить конкурентоспособность новой серии, улучшив положение компании на рынке.

Наверняка не все согласны с тем, что видеокарты по цене в $600 уже не считаются флагманскими решениями для энтузиастов, это сейчас скорее высокий средний уровень. А всё, что дешевле $300, вообще называется бюджетными решениями. Всё вокруг дорожает, видеокарты не исключение, и они стали намного дороже за последнее годы, как и всё остальное. Мало того, розничные цены в магазинах еще выше — рекомендованные цены для GPU среднего и высокого уровня не выдерживаются. А, учитывая то, что случилось с Intel Arc B580, можно предположить, что и сравнительно недорогие видеокарты также могут столкнуться с проблемами недостаточного предложения и завышенных цен — новые видеокарты Intel купить не так просто, и уж тем более — по рекомендованной цене. Сейчас только модели типа GeForce RTX 4060 и Radeon RX 7600 доступны по близким к рекомендованным розничным ценам, а всё более мощное продается дороже.

С доступностью видеокарт есть явные проблемы у всех производителей, немногочисленные поставки быстро распродаются, а имеющееся в продаже сильно переоценено. Причем, если раньше AMD сталкивалась с трудностями при переходе на новые графические процессоры из-за того, что предыдущее поколение еще долго оставалось на рынке, то теперь и решения серии Radeon RX 7000 во многом исчезли из продажи еще в декабре и январе, за исключением моделей нижнего уровня Radeon RX 7600 (XT), которые массово продаются по близким к рекомендованным ценам. Виноваты в ситуации и меньшие объемы выпуска новых решений и рост спроса на производительные решения — GeForce RTX 5090 так вообще сразу распродаются, как горячие пирожки, да еще и по значительно более высоким ценам, по сравнению с заявленной MSRP.

У остальных моделей дела получше, но тоже есть проблемы, как и у Radeon RX 9070 XT с Radeon RX 9070 — накопившийся спрос явно превышает предложение, и требуется еще много недель на исправление ситуации. В ближайшем же будущем можно ожидать продолжения недостаточности поставок и стабильно завышенных цен. И хотя AMD не продает так же много решений для высокопроизводительных вычислений, как Nvidia, часть ее ограниченного объема производства на TSMC, вероятно, также занята CPU и GPU, предназначенными для центров обработки данных — игроки не являются приоритетом ни для Nvidia ни для AMD, и рынок игровых видеокарт получает лишь то, что остается после ИИ и остальных вычислений. Эта отрасль стремительно растет, и игровые GPU сейчас являются менее приоритетными для всех производителей. Даже Ryzen 7 9800X3D принесет AMD больше денег, чем графический процессор для Radeon RX 9070 XT, а есть еще чипы для центров обработки данных: MI300X и MI350X, которые стоят значительно дороже игровых GPU. Но если компания хочет увеличить долю на рынке игровых решений, то им придется пожертвовать частью прибыли, увеличив выпуск игровых GPU.

Но хватит о плохом, давайте рассмотрим новинку во всех подробностях. Так как основой рассматриваемой сегодня модели видеокарты является новый графический процессор Navi 48 из высокопроизводительного рыночного сегмента, базирующийся на архитектуре RDNA четвертого поколения, которая тесно связана с архитектурами RDNA предыдущих версий, то перед прочтением статьи будет полезно ознакомиться и с нашими предыдущими материалами по видеокартам компании AMD:

Графический ускоритель Radeon RX 9070 XT
Кодовое имя чипа	Navi 48
Технология производства	5 нм ( N4P TSMC)
Количество транзисторов	53,9 млрд
Площадь ядра	357 мм²
Архитектура	унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX	DirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2
Шина памяти	256-битная: 4 независимых 64-битных контроллера памяти с поддержкой GDDR6
Частота графического процессора	до 2970 МГц
Вычислительные блоки	64 вычислительных блока CU, состоящих в целом из 4096 ALU для целочисленных расчетов и расчетов с плавающей запятой (поддерживаются форматы INT4, INT8, INT16, FP16, FP32 и FP64)
Блоки трассировки лучей	64 блока Ray Accelerator для расчета пересечения лучей с треугольниками и ограничивающими объемами BVH
Блоки текстурирования	256 блоков текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP)	16 широких блоков ROP на 128 пикселей с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторов	поддержка интерфейсов HDMI 2.1b и DisplayPort 2.1a

Спецификации видеокарты Radeon RX 9070 XT
Частота ядра (игровая/турбо)	2400/2970 МГц
Количество универсальных процессоров	4096
Количество текстурных блоков	256
Количество блоков блендинга	128
Эффективная частота памяти	20 ГГц
Тип памяти	GDDR6
Шина памяти	256 бит
Объем памяти	16 ГБ
Пропускная способность памяти	640 ГБ/с
Вычислительная производительность (FP32)	до 48,7 терафлопс
Теоретическая максимальная скорость закраски	380 гигапикселей/с
Теоретическая скорость выборки текстур	760 гигатекселей/с
Шина	PCI Express 5.0 x16
Разъемы	один HDMI 2.1b, три DisplayPort 2.1a
Энергопотребление	до 304 Вт
Дополнительное питание	два 8-контактных разъема
Число слотов, занимаемых в системном корпусе	2
Рекомендованная цена	$599

С серии Radeon RX 9000 компания решила изменить систему наименований, так как старая перестала соответствовать реальному положению дел. Если раньше Radeon RX 6800 XT была прямым соперником GeForce RTX 3080, то Radeon RX 7800 XT уже стал заметно медленнее GeForce RTX 4080 и даже уступал GeForce RTX 4070 Ti, да и серия Radeon RX 7900 не конкурировала с GeForce RTX 4090 даже близко — для решения этой странности (причиной которой была сама компания, впрочем) в AMD решили изменить наименование игровой линейки. Серию Radeon RX 8000 пропустили, чтобы быть на равных с CPU, и пока что выпустили лишь два продукта — Radeon RX 9070 XT и Radeon RX 9070, приблизив схему наименований к тому, что применяет Nvidia. И новое название рассматриваемой сегодня видеокарты говорит о том, что это решение уровня GeForce RTX 5070 и GeForce RTX 5070 Ti, хотя цена модели Radeon RX 9070 XT располагается между ними.

Соответственно, рассматриваемое сегодня решение превосходит GeForce RTX 5070 по цене и производительности, и приближается к GeForce RTX 5070 Ti, которая заметно дороже — $750 (пока что мы говорим исключительно о рекомендованных ценах). Любопытно также и то, что в серии Radeon RX 9000 вообще не будет решений для энтузиастов уровня GeForce RTX 5080 и выше, пока что в ней вообще есть еще только Radeon RX 9070 на основе этого же GPU, но в урезанном варианте — обзор этой видеокарты также вскоре выйдет у нас на сайте. Вероятно, на основе еще более урезанного по блокам (да и ширине шины памяти, наверняка) чипа Navi 48 будет сделана и еще не анонсированная модель Radeon RX 9060 XT.

Цена же Radeon RX 9070 XT начинается с $599, но это привычное по последним временам лукавство, по такой цене видеокарту можно было купить при должной удаче и сноровке только в западных магазинах на самом начале продаж, которые начались 6 марта, но ведь AMD сдвинула их начало с января на март якобы чтобы добиться лучшей доступности на рынке, что не очень хорошо получилось в итоге. Учитывая текущие условия, вообще не сильно важно, какую цену кто указывает в качестве рекомендованной розничной цены — по крайней мере, в краткосрочной перспективе, реальные всегда будут выше, а все карты первых партий быстро распродаются. В первые месяцы новых карт просто не хватает для удовлетворения спроса, во что обязательно вмешиваются спекулянты со своими наценками. Это можно было бы назвать повторением дефицита во время криптовалютного майнинга на GPU, но сейчас он несколько мягче и связан скорее с развитием ИИ-технологий.

Исходя из ширины шины видеопамяти в 256 бит, выбор ее объема у AMD был между 16 и 32 ГБ, и так как компания много говорит о важности большого объема видеопамяти для современных игр, то можно было предположить, что на быстрейшее решение новой линейки поставят уже 32 ГБ, так как предыдущий флагман уже снабжался 24 ГБ памяти. Но нет, так как Radeon RX 9070 XT отличается сравнительно низкой (в теории, по крайней мере) ценой, то AMD решила ограничиться объемом 16 ГБ. И это действительно оптимальное значение на сейчас, установка 32 ГБ обошлась бы куда дороже, и AMD логично решила ограничиться меньшим значением. Хотя многие считают, что объем видеопамяти является важным конкурентным преимуществом карт Radeon, и нужно было ставить больше памяти, прямо сейчас 32 ГБ не дали бы вообще никакого прироста, а ориентироваться на гипотетические игры будущего, которые выйдут лет через пять, было бы довольно странно.

В этот раз AMD решила не выпускать на рынок собственные варианты видеокарт серии Radeon RX 9070 (XT). То, что показано у них на слайдах — всего лишь графические изображения видеокарт самой AMD, и они действительно существуют в физическом воплощении, но лишь внутри компании. А на рынке таких продуктов именно производства AMD нет — все видеокарты серии Radeon RX 9070 будут производиться партнерами компании. Они получили очень разные тактовые частоты и уровни энергопотребления, а также системы охлаждения. Все видеокарты имеют разъем PCIe 5.0 x16, а стандартные варианты потребляют до 304 Вт энергии — это меньше, чем у предыдущего флагмана, но варианты производителей отличаются в том числе бо́льшим уровнем потребления.

Партнеры AMD сразу выпустили большое количество моделей с собственными дизайном, размерами, подсветкой и системами охлаждения, многие из них еще и фабрично разогнаны и имеют повышенные уровни энергопотребления и производительности. Многие производители выставили собственные рекомендованные цены на улучшенные Radeon RX 9070 XT, которые оказались куда выше $600 — эти решения имеют официальные рекомендованные цены порядка $750-$800, к которым нужно еще добавить пошлины, так что сейчас в эту игру с низкими рекомендованными ценами играют все — и Nvidia, и AMD, и Intel. Редкие модели Radeon RX 9070 XT изначально были доступны по $600, но в крайне ограниченных количествах, а остальные поставки уже идут по более высоким ценам.

Вполне вероятно, что AMD требует, чтобы у производителей в ассортименте была модель с заявленной ими рекомендованной розничной ценой, но не более того. Заставить их продавать по такой цене всё они не могут. Так как этих видеокарт мало производят и быстро продают, то у пользователя не остается других вариантов, кроме как купить разогнанную модель, которая на пару сотен долларов дороже. Так было с видеокартами Nvidia, ровно так же получилось и тут. Со временем, если предложение удовлетворит спрос, можно будет быстро снизить цены и на эти специальные варианты, но пока что все компании предпочитают получать дополнительную прибыль из-за недостаточного объема производства новинок.

Особенности архитектуры RDNA 4

Обе новые видеокарты серии Radeon RX 9000, которые выпустила AMD, основаны на чипе Navi 48 — он стал самым крупным GPU этого поколения, большего по сложности графического процессора компания выпускать не планирует. Модели Radeon RX 9070 XT и Radeon RX 9070 основаны на этом кристалле и разница лишь в том, что в первой применяется полная версия Navi 48, а вторая довольствуется урезанной по количеству блоков модификацией.

Одним из наиболее интересных изменений высокого уровня в новых графических процессорах стало то, что AMD отказалась от чиплетной организации GPU в случае Navi 48 и младшего Navi 44, который ожидается позднее. Navi 48, в отличие от Navi 31 и Navi 32, это обычный монолитный кристалл площадью 356,5 мм², содержащий впечатляющее количество транзисторов в 53,9 млрд., изготовленный тайваньской TSMC, а GPU из нескольких отдельных кристаллов с графикой и контроллерами памяти, как было в RDNA 3, в этом поколении не будет. Вероятно, таким образом AMD признает тот свой эксперимент не самым удачным — по крайней мере, на данный момент времени.

Кроме этого, AMD также перешли на улучшенный техпроцесс TSMC — с N5 на N4P, который обеспечивает небольшое увеличение производительности и эффективности по сравнению с N4 — улучшенным по отношению к базовому техпроцессу N5. Не очень понятно, насколько N4P сравним с 4N и 4NP — специализированными вариантами аналогичного техпроцесса для Nvidia, но есть предположение, что они довольно похожи друг на друга, так что тут особого преимущества ни у кого из конкурентов быть не должно.

Новый GPU по большинству базовых характеристик похож на Navi 32, но содержит заметно больше транзисторов — почти как Navi 31. Предыдущий топовый чип, на котором основан прошлый флагман Radeon RX 7900 XTX, имеет лишь на 8% больше транзисторов (57,8 млрд), несмотря на наличие в полтора раза большего количества блоков CU, больший кэш Infinity Cache и 384-битную шину памяти. При этом общая площадь кристалла Navi 31 составляет 529 мм², так что AMD очень сильно улучшила плотность размещения транзисторов в новом GPU. Из-за отказа от чиплетной организации и перехода на лучший техпроцесс, Navi 48 более чем на треть меньше топового чипа предыдущего семейства по площади, так как у последнего только основной кристалл производился по схожему 5 нм техпроцессу, а чиплеты с контроллерами памяти и кэшем использовали менее продвинутое полупроводниковое производство.

Один только чиплет GCD в Navi 32 в версии для Radeon RX 7800 XT с 60 CU-блоками был размером 200 мм², а все кристаллы вместе занимали 346 мм². Navi 48 при этом имеет схожую площадь 357 мм², и в конкурентах у него GB205 (GeForce RTX 5070) на 263 мм² и урезанный GB203 (GeForce RTX 5070 Ti) на 378 мм², что также совсем немногим больше. При том, что транзисторов в Navi 48 содержится аж 53,9 млрд, против 31,1 у GB205 и 45,6 у GB203, а по производительности Radeon RX 9070 XT находится скорее между GeForce RTX 5070 или 5070 Ti. Но еще раз отметим, что плотность размещения транзисторов у Navi 48 впечатляет, AMD с TSMC и их N4P смогли заметно обойти Nvidia, продукты которых используют специализированную версию 4N техпроцесса — хотя они оба 5 нм, но первый обеспечивает чуть лучшие характеристики.

Можно предположить, что серия Radeon RX 9070 должна быть довольно выгодной для AMD, так как размер кристалла Navi 48 аналогичен размеру кристалла Navi 32 в Radeon RX 7800 XT, и подсистема памяти приблизительно такая же. Но по скорости AMD сравнивает новинку даже не только с Radeon RX 7900 XT, но с и флагманским XTX. Хотя Radeon RX 9070 XT имеет меньше всего, чем Radeon RX 7900 XT: на 24% меньше вычислительных ядер, на 33% меньший кристалл, на 20% меньше кэш-памяти, объема и пропускной способности памяти, все равно ожидается, что новинка обеспечит как минимум ту же производительность — во многом благодаря архитектурным улучшениям, к рассмотрению которых мы и переходим.

Естественно, что обновленная архитектура RDNA 4 является в очередной раз измененной и доработанной архитектурой AMD, известной уже несколько поколений, но в ней появилось больше изменений, чем мы видели в предыдущих обновлениях. По своему общему строению решения RDNA 4 в виде единственного пока Navi 48 не особенно отличаются от RDNA 3, чип состоит из четырех шейдерных движков Shader Engine, в каждом из них есть по восемь процессоров, содержащих по два вычислительных блока Compute Unit (CU). В итоге это 64 укрупненных вычислительных блоков Compute Unit (CU), которые состоят из 4096 потоковых процессоров, что очень похоже по структуре на решения RDNA 3.

Всего Navi 48 содержит 4096 потоковых процессоров, 128 ИИ-ускорителей, 64 RT-ускорителей, 256 блоков TMU и 128 блоков ROP. Новый графический процессор с такими характеристиками и 256-битной шиной очень похож на условный Radeon RX 7800 XT, но AMD противопоставляет новый GPU скорее флагманскому Navi 31, который содержит в полтора раза больше потоковых вычислительных ядер — видимо, из-за многочисленных архитектурных улучшений и повышенной тактовой частоты новых решений. В новом флагмане линейки GPU работает на игровой частоте 2400 МГц, а турбо-частота доходит почти до 3 ГГц — 2970 МГц, если точнее.

В основе архитектуры RDNA 4 лежит улучшенный вычислительный блок CU с существенными улучшениями по эффективности, подсистеме памяти, динамическом распределении регистров и т. д. Каждый блок CU имеет два блока планировщика, управляющих регистровым файлом объемом 192 КБ, скалярным файлом регистров объемом 8 КБ, 32 блока FMA ALU, 32 блока FMA+INT ALU и 32 TLU для специальных функций. На схеме вычислительных блоков CU изменилось мало что, они имеют по два векторных блока SIMD32 для большего параллелизма, умеют выполнять две 32-битные векторные операции, а матричные блоки поддерживают FP16-вычисления с удвоенной производительностью. Скалярный блок поддерживает операции Float32, также была улучшена предвыборка инструкций.

Векторные и скалярные блоки имеют регистровые файлы объемом в 192 КБ и 8 КБ, кэш разделен на 16 КБ для скалярных блоков и 32 КБ для инструкций, есть и разделяемая память объемом в 128 КБ. В чипе есть также и 8 МБ L2-кэша, а в дополнение к нему кэш Infinity Cache объемом 64 МБ, но по нему ни о каких изменениях явно не было заявлено. Планировщик инструкций вычислительного блока поддерживает внеочередное исполнение инструкций, получил улучшенную предвыборку инструкций, появилось динамическое выделение регистров для шейдерных программ — они могут запрашивать и освобождать данные динамически, что позволяет улучшить эффективность использования регистрового файла.

Производительность растеризации, даже по данным самой AMD, улучшилась меньше всего, но это все равно до +40% к скорости RDNA 3 — по сравнению с удвоенной производительностью трассировки и даже еще большего ускорения ИИ-вычислений это кажется не слишком большим улучшением. Но особых деталей об улучшениях по растеризационной части нам дали не слишком много — да, RDNA 4 получила возможность запрашивать данные из памяти вне очереди, что AMD выделяет особенно как полезную для трассировки лучей функцию, это может помочь и при растеризации. Еще одно важное изменение — появление динамического выделения регистров, на что не были способны RDNA 3 и более ранние GPU, оно также может дать какой-то прирост, но неизвестно насколько заметный в реальном ПО.

Ускорение нейросетей

Куда важнее другие изменения в блоках CU — например, в четвертом поколении RDNA появились свои «тензорные ядра» и у AMD, они назвали их ИИ-ускорителями (AI Accelerators). Для этого специалисты компании перенесли часть аппаратных возможностей из вычислительной архитектуры CDNA 3 в RDNA 4. Теперь каждый блок CU может выполнить 512 операций с точностью FP16 без учета разреженности за такт, или 1024 операций INT4. ИИ-ускорителями также поддерживается структурированная разреженность матриц 4:2, которая позволяет удалять лишние данные и обрабатывать меньше данных в целом. Разреженность может пропускать до половины операций с перемножением на ноль, что потенциально удваивает производительность — эту функцию поддерживают графические процессоры Nvidia с серии GeForce RTX 30 и вычислительные чипы AMD семейства CDNA.

Базовая производительность для формата вычислений FP16 была увеличена в RDNA 4 вдвое, для разреженных матриц возможно еще одно удвоение и еще одно в случае использования формата FP8, который часто используют в ИИ-нагрузках — это уже до восьми раз большая производительность, по сравнению с RDNA 3. В результате получается до 389 TFLOPS вычислений FP16 (с учетом разреженности) и до 1557 TOPS вычислений с точностью INT4 и также с учетом разреженности.

AMD приводит пример того, как это сказывается на производительности при использовании нейросети Stable Diffusion XL, в которой Radeon RX 9070 XT сравнивалась с Radeon RX 7900 XT. По вычислительным блокам новинка отстает от более старого решения более чем на 30%, но Radeon RX 9070 XT показывает почти двукратную производительность от Radeon RX 7900 XT, так что этот прирост будет весьма полезен для всех задач ИИ и машинного обучения, включая масштабирование FSR 4. В других реальных задачах разница поменьше, конечно, но тоже немалая:

К слову, вскоре в шейдерах DirectX должна появиться поддержка кооперативных векторов (Cooperative Vectors), необходимая для нейронного рендеринга. Это новая функция, которая появится в Shader Model 6.9, по сути это аппаратное ускорение векторных и матричных операций при помощи аппаратных блоков — тензорных ядер у Nvidia, XMX-блоков у Intel и т. д. Она нужна для эффективной интеграции нейронного рендеринга в существующие графические конвейеры. Мы уже много писали о возможностях нейрорендеринга на примере предложений Nvidia GeForce, эту функциональность можно использовать для нейронного текстурного сжатия, что может значительно сократить использование видеопамяти при небольших потерях качества, улучшения качества рендеринга при трассировке пути при помощи умного шумоподавления, кэширования данных глобального освещения и даже полной генерации некоторых участков изображения при помощи ИИ — например, реалистичные человеческие лица.

Nvidia Neural Shading SDK будет поддерживать эти возможности, да и остальные производители наверняка присоединятся к этому многообещающему начинанию, благо, что аппаратные блоки для ускорения векторных и матричных операций есть теперь у всех производителей GPU. Хотя AMD не уточняла в подробностях, но решения архитектуры RDNA 4 должны иметь совместимость с будущим нейронного рендеринга в DirectX — этими самыми Cooperative Vectors, когда Microsoft окончательно стандартизирует нейронные шейдеры и возможность приложений использовать ИИ-ускорители, и они будут добавлены в графический API, то новые решения AMD также смогут реализовать эти возможности.

Улучшенная трассировка лучей

Не менее важные улучшения получили вычислительные блоки RDNA 4 и в плане аппаратной трассировки лучей. По данным AMD, специализированные блоки Ray Accelerator на 240% быстрее аналогичных ядер RDNA 2 — из-за многочисленных улучшений. Блоки аппаратной трассировки лучей получили удвоенную скорость тестирования пересечений луча с ограничивающими объемами и треугольниками — каждый ускоритель умеет обрабатывать их ровно вдвое больше. Если RDNA 3 умели тестировать за такт по четыре пересечения с боксом и лишь один с треугольником, то теперь эти значения выросли до 8 и 2. Хотя возможности RT-блоков в последних решениях Intel и Nvidia все равно больше — например, у Blackwell скорость по пересечениям с треугольником вдвое выше.

Есть и другие улучшения в Ray Accelerator: использование структуры BVH8 вместо BVH4 увеличивает производительность и снижает использование видеопамяти, объем структур BVH уменьшается. Новые RT-ядра поддерживают аппаратную трансформацию копий объектов (instance), что позволяет их копировать для сцены без дублирования в памяти, обрабатывая несколько образцов как один. В RDNA 4 также был изменен порядок операций при трассировке и обращения к памяти, шейдеры запрашивают данные из кэша без строгой очередности для улучшения общей эффективности, так как попадания и промахи в кэше меньше мешают друг другу. Но эти улучшения лишь немного повысили производительность ускорителей трассировки, а основной прирост дает удвоение производительности аппаратных движков пересечений:

Еще из совсем нового в аппаратной трассировке на RDNA 4 можно отметить новый вид BVH-структур в виде ориентированных ограничивающих объемов (Oriented Bounding Boxes — OBB), которые могут быть ориентированы не по глобальным осям сцены, а по оси объектов. Таким образом улучшается эффективность обхода BVH, что дает прирост скорости в 10% по данным AMD. Обычно используют ограничивающие объемы, расположенные в пространстве по глобальным осям сцены, но чаще всего геометрия объектов имеет другую форму, которая не очень хорошо вписывается в них — это приводит к лишней трате ресурсов при тестировании лучей. AMD предлагает вариант ориентированных по оси объекта ограничивающих объемов, чтобы ориентировать их ближе к форме объекта — это сокращает количество лучей, необходимых для расчетов. Изменение ориентации ограничивающих примитивов относительно оси объектов позволит снизить количество итераций при поиске пересечений.

Перечисленные улучшения повысили производительность RDNA 4 в трассировке и видеокарты AMD теперь уже не теряют слишком много производительности даже при сложной трассировке пути. Трассировка лучей на Radeon стала заметно лучше, чем в предыдущих поколениях RDNA, но конкуренты за эти годы ушли вперед. AMD постепенно улучшает характеристики своих RT-ядер, но и делает это не слишком оперативно. Некоторые новые возможности в RDNA 4 поддерживались еще в решениях архитектуры Turing главного конкурента, а некоторые до сих пор не получили аппаратной поддержки в Radeon. Например, аппаратная трансформация instance была в Turing, как и аппаратный обход BVH, которого так и нет в RDNA 4, по некоторым данным. Так что AMD хоть и приближается к Nvidia по производительности блоков трассировки лучей, но делает это уж слишком медленно — GeForce до сих пор лучше в этом деле. Но у AMD есть возможности быстро улучшить их GPU именно для сложных случаев типа трассировки пути, так как более простая трассировка не предъявляет особых требований к RT-блокам по их производительности. Пока обход дерева BVH в решениях AMD производится программно на обычных вычислительных SIMD-блоках, они проигрывают именно в тяжелых случаях трассировки, когда есть много расхождений лучей. При трассировке лучей для рассеянных отражений или глобального освещения лучи летят в разные стороны и сразу всему блоку SIMD нужно ждать завершения расчетов самых медленных лучей. Пока что даже в RDNA 4 не сделан полностью аппаратный обход, поэтому Radeon отстают в играх с трассировкой пути, а ведь он есть уже не только у Nvidia, но у Intel, Apple и даже в мобильных GPU.

Еще есть дополнительные функции, которые Nvidia давно продвигает, а та же AMD продолжает отставать от них и других производителей GPU по возможностям аппаратных блоков трассировки лучей. В частности, вскоре выйдет обновление DirectX Raytracing версии 1.2 с некоторыми важными улучшениями, направленными на увеличение производительности и эффективности. В частности это микрокарты непрозрачности (opacity micromaps — OMM) и переупорядочение выполнения шейдеров (shader execution reordering — SER) — динамическую группировку потоков инструкций для повышения когерентности обращений к памяти, что способно значительно повышать производительность при сложной трассировке, вроде трассировки пути. Они обеспечивают заметное повышение производительности при трассировке лучей в определенных условиях.

Микрокарты непрозрачности поддерживаются многими решениями Nvidia, они оптимизируют трассировку полупрозрачной геометрии, сокращая количество вызовов шейдеров, что дает улучшение производительности без потери качества. Переупорядочение выполнения шейдеров поддерживается чипами Nvidia и Intel и также обеспечивает повышение производительности рендеринга за счет интеллектуальной группировки выполнения шейдеров до двух раз в некоторых случаях. Пока что только графические процессоры Nvidia полностью поддерживают эти возможности, у Intel вроде бы есть SER и они планируют внедрить OMM в будущем, а вот по поводу уже вышедших решений AMD Radeon не очень понятно, будут ли они аппаратно поддерживать DXR 1.2. Зато в RDNA 4 есть функциональность Out of Order Memory, которая изменяет порядок получения данных из памяти, делая их независимым от очередности запросов.

Трассировка лучей и ускорение матричных операций чувствительны к скорости и задержкам памяти, поэтому AMD решила внести некоторые изменения и в систему управления памятью, внедрив внеочередную память — Out-of-Order Memory Queuing. Так как математические операции выполняются волнами (waves), то взаимные зависимости между этими волнами иногда приводят к пропуску запросов, так как очередь запросов памяти из одной волны ждет окончания работы другой волны. Это можно исправить при помощи внеочередного управления памятью, которое повышает в том числе и эффективность трассировки лучей. И скоро мы узнаем, как все улучшения и изменения на нее повлияли.

Другие архитектурные изменения

Кроме этого, в RDNA 4 была переработана часть иерархии кэша и памяти — тут снова обошлось без особых подробностей, но что-то они всё же сделали в Infinity Cache, раз он стал «третьего поколения», хотя его емкость всё так же составляет 64 МБ, как было в Radeon RX 7900 GRE и Radeon RX 7800 XT. Единственный явный плюс по сравнению с предыдущим поколением в том, что теперь кэш снова размещен на том же кристалле, что и остальные блоки, в отличие от чиплетов RDNA 3, и это должно обеспечивать меньшие задержки и более высокую пропускную способность кэша.

А вот что не изменилось в RDNA 4, так это тип и скорость памяти. Nvidia использовала в прошлом поколении GDDR6X (но она была эксклюзивом для них), в GeForce RTX 50 перешла уже на GDDR7-память, а AMD продолжает использовать GDDR6-память со скоростью 20 Гбит/с. В сочетании с 256-битной шиной памяти это дает пропускную способность в 640 ГБ/с, что уже меньше, чем у конкурентов — даже у GeForce RTX 5070 этот показатель выше — 672 ГБ/с, не говоря уже о 896 ГБ/с для GeForce RTX 5070 Ti. Но у графических процессоров AMD есть большой Infinity Cache кэш, повышающий эффективную пропускную способность памяти, и его столько же, что и в Radeon RX 7900 GRE и Radeon RX 7800 XT — 64 МБ. Возможно, именно он делает переход на GDDR7-память не столь критичным для Radeon, но нужно учитывать, что один из конкурентов Radeon RX 9070 XT имеет на 40% более высокую ПСП именно из-за более скоростной памяти (28 Гбит/с против 20 Гбит/с). Кроме этого, в GeForce RTX 5070 Ti есть кэш-память второго уровня тоже немалого объема — 48 МБ.

Уже первые решения RDNA 4 получили поддержку внешнего интерфейса PCIe 5.0, удваивающего пропускную способность по сравнению с более привычной версией 4.0. На практике даже в самых сложных нагрузках сложно заметить разницу, видимую лишь в синтетических тестах и некоторых ИИ-нагрузках. В играх же даже PCIe 3.0 при полной ширине разъема в x16 будет достаточно в большинстве случаев, но поддержка 5.0 позволит выпустить бюджетные чипы со сниженным количеством линий — до x8 точно, а может и до x4.

Нам осталось поговорить о движках обработки видеоданных и вывода данных. Новый движок вывода информации на дисплеи в Navi 48 получил долгожданные аппаратные обновления, снижающие энергопотребление в режиме простоя в многомониторных конфигурациях, также внедрена аппаратная очередь кадров, снижающая нагрузку на процессор и повышающая энергоэффективность, а планирование кадров улучшает синхронизацию. Есть в движке и возможность для аппаратного повышения резкости изображения — Radeon Image Sharpening (RIS), получившая вторую версию — это повышение резкости картинки на уровне драйвера, использующее разработки алгоритма CAS (Contrast Aware Sharpening).

Что касается возможностей именно вывода на дисплеи, то это современные разъемы DisplayPort 2.1a и HDMI 2.1b с максимальным битрейтом UHBR 13.5, что вдвое больше, чем у DisplayPort 1.4. Поддержка пропускной способности 54 Гбит/с (UHBR 13.5) означает возможность подключения 4K-дисплея одним кабелем — с частотой обновления до 240 Гц без использования сжатия видеопотока, а со сжатием Display Stream Compression можно использовать 4K при 480 Гц или 8K при 165 Гц. Но если в прошлом поколении у Radeon было преимущество перед аналогичными решениями Nvidia, ограниченными возможностями DisplayPort 1.4a, то теперь его нет. Более того, новые решения серии GeForce RTX 50 поддерживают версию DisplayPort 2.1b с пропускной способностью до 80 Гбит/с (UHBR 20) с лучшими характеристиками по выводу информации. Но это в теории, а в реальности отличие не дает особых преимуществ из-за крайней редкости мониторов с поддержкой таких возможностей.

В чипе Navi 48 есть два медиадвижка для работы с видеоданными (кодирования и декодирования), в этом они схожи с конкурентами Nvidia, имеющими по два блока NVEnc и NVDec. Новый медиадвижок AMD обеспечивает улучшение качества кодирования форматов H.264 и H.265 с низкими задержками, а при кодировании AV1 теперь поддерживаются B-кадры, что повышает эффективность при том же битрейте. AMD говорит, что качество кодирования H.264 (AVC) было увеличено до 25%, а H.265 (HEVC) — на 11%, и это хорошо, так как по качеству кодирования видео AMD до сих пор отставала от Intel и Nvidia, чьи решения дают близкое качество картинки, превосходящее предыдущие Radeon. Если говорить о производительности, то медиадвижок показывает на 50% более высокую скорость кодирования AV1 и VP9 по сравнению с предшественником при сокращенном использовании видеопамяти.

FSR 4 и программные технологии

В серии RDNA 4 и Radeon RX 9070 (XT) появилась поддержка новой версии технологии FidelityFX Super Resolution 4 (FSR 4) — она получила крупнейшее обновление со времен FSR 2, в этой версии появился новый метод масштабирования кадров на основе нейросетей, и FSR 4 технологически приблизился к DLSS 3. Новые графические процессоры также могут использовать ИИ-ускорители для шумоподавления при трассировке лучей и пути, а вот технология генерации дополнительных кадров была перенесена из FSR 3, похоже, и есть ли в ней какие-то улучшения — неизвестно.

FSR 4 будет существовать одновременно с FSR 3.1, и режим масштабирования без использования ИИ также останется. Пока что не очень понятно, как это будет работать, просто во всех играх с поддержкой FSR 3.1 можно будет использовать и более продвинутый алгоритм. FSR 4 же это не только масштабирование, алгоритм поддерживает и генерацию дополнительных кадров — также с участием ИИ-ускорителей в графических процессорах новой серии. AMD говорит о поддержке FSR 4 более чем в 30 играх на запуске серии Radeon RX 9070, а всего в этом году выйдет более 75 таких игр. Во многие игры поддержку добавили при помощи патчей, а в будущем выйдут и проекты с родной поддержкой новой технологии.

Новая версия FSR использует искусственный интеллект в работе и способна задействовать такие преимущества архитектуры, как FP8-вычисления с увеличенным темпом на ИИ-ускорителях. Модели переобучили, они работают быстрее и с лучшим качеством, а нового в FSR 4 то, что это уже не просто технология повышения разрешения, использующая информацию из предыдущих кадров, но работающая на основе нейросети. К сожалению, это же ограничивает применение FSR 4 — в теории и старшие решения могут поддерживать новую технологию, но нужна определенная производительность, гарантированно доступная на RDNA 4 из-за удвоения темпа FP8-вычислений. AMD говорит о том, что для работы FSR 4 нужна матричная производительность от 779 AI TOPS, и у Radeon RX 9070 XT с этим всё в порядке, но из-за этих требований пропало преимущество версии FSR 3, работающей на всех решениях AMD и даже на графических процессорах конкурентов. Новый же вариант ИИ-масштабирования работает пока исключительно на видеокартах архитектуры RDNA 4.

Вопрос качества FSR 4 в сравнении с DLSS требует отдельного тщательного рассмотрения, но что уже точно можно сказать по примерам самой AMD — качество картинки заметно увеличилось, FSR 4 отрисовывает многие детали даже более четко, чем рендеринг в родном разрешении. Это как минимум уровень DLSS 3, а местами новая технология AMD даже опередила своего конкурента... который еще чуть раньше выкатил DLSS 4 с дальнейшими улучшениями и поэтому снова ушел вперед, даже если не говорить о многокадровой генерации, а просто о качестве изображения, доступном на всей линейке GeForce RTX.

Улучшились и многие другие программные и программно-аппаратные инструменты. Под маркой Hypr-RX привычно собраны все решения по увеличению производительности: FSR, Radeon Anti-Lag, Radeon Boost и AMD Fluid Motion Frames (AFMF) — последний был улучшен и также предлагает более четкое изображение. FMF 2.1 обеспечивает улучшенное качество изображения и меньшие артефакты в виде ореолов, а инструмент повышения резкости изображения Radeon Image Sharpening был обновлен до второй версии. Функции повышения производительности Hypr-RX, работающие на уровне драйвера, могут быть полезными в некоторых случаях GPU недостаточной производительности, но вряд ли это справедливо для довольно мощных Radeon RX 9070 XT.

Что касается остальных программных улучшений, то можно отметить удобное приложение драйвера «AMD Software», в котором есть способ сообщения об ошибках и артефактах в играх — AMD Image Inspector, также представлен локальный чат-бот, работающий на ИИ-ускорителях — AMD Chat, утилиты потокового вещания для стримеров, удобное средство для запуска игр, аппаратное ускорение шумопонижения AMD Noise Suppression и многое другое.

AMD Chat — это чат-бот, специализирующийся на ответах на вопросы об оборудовании вашей системы, его можно спросить об условиях работы графического процессора, производительности и другом. Но стоит ли ради этого загружать 25 ГБ данных, если вы не планируете часто общаться с вашим ПК? Функция AI Apps Manager выдает список ПО, которые способны использовать ИИ-ускорители — из списка доступных для установки. Ну а Image Inspector помогает находить и сообщать об ошибках рендеринга и проблемах, связанных с GPU. Используя часть ресурсов GPU, эта функциональность может автоматически фиксировать ошибки рендеринга и отправлять их в AMD — любопытное нововведение и для самой компании это интересная возможность, но не очень понятно, как оно работает и будут ли этим пользоваться сами игроки.

Предварительная оценка производительности

Рассмотрим характеристики новой видеокарты AMD по сравнению с младшей моделью без индекса XT и близкими по позиционированию решениями из предыдущего поколения. По эффективной мощности Radeon RX 9070 XT близка сразу к Radeon RX 7900 XT и Radeon RX 7900 XTX, а по теоретическим характеристикам скорее ближе к Radeon RX 7900 GRE. По таблице как раз удобно прикинуть, насколько топовая модель нынешней линейки Radeon RX 9070 XT сопоставима с видеокартами прошлого поколения по пиковым характеристикам.

	RX 9070 XT	RX 9070	RX 7900 XTX	RX 7900 XT	RX 7900 GRE
Модель GPU	Navi 48		Navi 31
Техпроцесс	TSMC N4P		TSMC N5/N6
Площадь GPU, мм	357		529
Блоки ALU	4096	3584	6144	5376	5120
Блоки TMU	256	224	384	336	320
Блоки ROP	128	128	192	192	160
RT-ускорители	64	56	96	84	80
ИИ-ускорители	128	112	-	-	-
Кэш Infinity Cache, МБ	64		96	80	64
Турбо-частота, МГц	2970	2520	2500	2400	2250
Объем памяти, ГБ	16		24	20	16
Скорость памяти, Гбит/с	20				18
Шина памяти, бит	256		384	320	256
ПСП, ГБ/с	640		960	800	576
Энергопотребление, Вт	304	220	355	300	260
Рекомендованная цена, $	600	550	1000	900	550

Видеокарта Radeon RX 9070 XT основана на полной версии кристалла Navi 48 и по своим характеристикам похожа на Radeon RX 7800 XT, но компания позиционирует ее для замены флагманской модели прошлого поколения — Radeon RX 7900 XTX. Чтобы добиться этого, по сравнению с этой видеокартой были значительно увеличены тактовые частоты новинки — и игровая и турбо, они составляют 2,40 ГГц и 2,97 ГГц, соответственно. Пиковая теоретическая производительность Radeon RX 7900 XTX с учетом частот всё еще на четверть выше, но это компенсируется улучшениями новой архитектуры, которая должна выгодно отличаться по эффективности.

Теоретически, Radeon RX 9070 XT имеет пиковую вычислительную скорость 48,7 TFLOPS для FP32-вычислений, и до 1557 TOPS для ИИ-ускорителей и формата INT4 (с разреженностью матриц). Предыдущее же флагманское решение Radeon RX 7900 XTX предлагает целых 61,4 TFLOPS для FP32, но лишь 123 TOPS для ИИ-вычислений в формате INT8. Так что не знаем пока про игры, но для ИИ-задач ситуация точно изменится. То же самое касается аппаратных блоков ускорения трассировки лучей — в RDNA 4 их производительность (скорость расчета пересечения лучей с треугольниками и лучей с ограничивающими объемами) по сравнению с RDNA 3 увеличилась вдвое, и 64 новых RT-блока в 9070 XT по производительности соответствуют не менее чем 128 RT-блокам RDNA 3 RT, но в Radeon 7900 XTX их лишь 96, так что даже без остальных архитектурных улучшений новый чип имеет на треть большую производительность при трассировке лучей. Но важны и другие характеристики, вроде пропускной способности и емкости памяти. Если Radeon RX 7900 XTX имеет 384-битную шину и 24 ГБ памяти, то у Radeon RX 9070 XT это 256-битный интерфейса и лишь 16 ГБ всё той же GDDR6-памяти с производительностью 20 Гбит/с, так что предыдущий флагман имеет в полтора раза большую пропускную способность и емкость памяти, что тоже может сказываться на итоговой производительности.

Но теоретические характеристики графических процессоров — это далеко не всё, что нужно принимать во внимание, на итоговую реальную производительность влияет и эффективность разных блоков и GPU в целом. Например, сравнительно новая видеокарта Intel Arc B580 имеет пиковые характеристики вроде вычислительной производительности хуже, чем было у предыдущего Arc A770 (14,6 TFLOPS против 19,7 TFLOPS), но в реальных тестах новый B580 более чем на 15% быстрее из-за решения проблем с низкой эффективностью использования имеющихся ресурсов. Но даже новые решения Intel всё еще уступают решениям AMD и Nvidia из предыдущих поколений, не говоря о новинках. В свою очередь, конкретно серия GeForce RTX 50 не слишком сильно улучшила эффективность и производительность по сравнению с предшествующей линейкой, а что получилось у Radeon RX 9000 мы скоро узнаем по собственным тестам.

А пока что посмотрим на данные AMD, по которым новая видеокарта Radeon RX 9070 XT получилась быстрее решения предыдущего поколения Radeon RX 7900 GRE в 11 играх с растеризацией и 9 играх с трассировкой лучей в среднем на 42% в 4K-разрешении и на 38% быстрее в 2560x1440. Если разделить эти показатели, то в растеризации будет 37% и 33% дополнительной производительности в 4K и 1440p, а в играх с трассировкой лучей это уже целых 53% и 49% в тех же разрешениях. Но это собственные подсчеты AMD, которые даны лишь для примерной прикидки. Чуть позже появилось и официальное сравнение и с конкурентом — по тестам компании, их новая Radeon RX 9070 XT уступает GeForce RTX 5070 Ti всего лишь 2%, а с трассировкой лучей AMD немного отстает.

Если верить этому сравнению, то Radeon RX 9070 XT и RDNA 4 — несомненный успех для AMD, они наконец-то смогли серьезно улучшить свою графическую архитектуру, устранив основные недостатки предыдущих — в RDNA 4 было усилено всё то, что требовало особого внимания, появились выделенные ИИ-ускорители и заметно ускорена аппаратная трассировка лучей. Почему этого пришлось ждать так долго — вопрос интересный. Вероятно, во времена RDNA 2 выход первых решений линейки GeForce RTX конкурента застал AMD врасплох, и они далеко не сразу смогли нагнать по функциональности своих соперников.

Зато теперь можно сказать, что AMD подтянулась к Nvidia по большому количеству параметров. В первую очередь по трассировке лучей — она всё еще отстает, но отрывы уже далеко не такие, как раньше. В новом GPU улучшена ИИ-производительность, что позволило внедрить поддержку FSR 4 — пусть в ней и нет многокадровой генерации, как у конкурента, но качество картинки было улучшено и в этом Radeon хоть и снова чуть-чуть не догнали GeForce, но разрыв также уменьшился. Это же касается и энергоэффективности — AMD подтянулась к Nvidia и по этому параметру, хотя решения последней продолжают быть лидерами, так как GeForce RTX 5070 Ti при полной нагрузке потребляет меньше энергии, чем Radeon RX 9070 XT.

Важно, что улучшения и новая функциональность хоть и привели к увеличению сложности GPU, но не площади кристалла — у AMD получилось удержать его во вменяемых рамках. Площадь Navi 48 равна 357 мм² — при том, что у Navi 31 один только основной кристалл имеет площадь в 300 мм². Если в RDNA 3 компания AMD упирала на то, что трассировка лучей и ИИ не очень нужны, то в RDNA 4 решили почти все основные моменты, связанные с отставанием от главного конкурента. Решения архитектуры RDNA 4 успешно конкурируют с Nvidia Blackwell и Intel Battlemage, хотя у последней пока что и нет видеокарт уровня Radeon RX 9070 (XT), да и у AMD еще не вышли менее дорогие и мощные GPU, но последнее уж точно вскоре произойдет.

Radeon RX 9070 XT действительно оказалась способна заменить Radeon RX 7900 XTX даже в играх без трассировки лучей. Пусть новинка и заметно медленнее теоретически, усовершенствования архитектуры позволили увеличить игровую производительность. В среднем, новый графический процессор условно среднего уровня даже обогнал предыдущего флагмана, но... сделать это же с тем же GeForce RTX 5070 Ti не смог. В играх с чистой растеризацией они близки, но включение трассировки дает преимущество решению Nvidia на 30%-60% в зависимости от сложности той самой трассировки. Да, теоретическая цена у Radeon RX 9070 XT ниже, чем у GeForce RTX 5070 Ti, но если вам важна производительность при трассировке (а сейчас она уже мало для кого совсем не важна), то выбор между Radeon RX 9070 XT и GeForce RTX 5070 Ti всё равно придется делать в пользу последней.

Технические улучшения RDNA 4 несомненны, но Radeon не стали функционально лучше GeForce. И если на новые решения Nvidia многие справедливо жалуются из-за невысокого прироста между поколениями, то у AMD дела хоть и лучше, но не слишком, ведь топовых решений в этом поколении AMD вообще не будет. Но самое главное, в чем Radeon RX 9070 XT потенциально лучше решений конкурента — это более выгодное соотношение цены и производительности. Если судить по рекомендованным ценам, то новинка AMD опережает и GeForce RTX 5070 и GeForce RTX 5070 Ti. Одна беда — на рынке по таким ценам видеокарты не найти, и GeForce RTX 5070 в реальности стоит дешевле той же Radeon RX 9070, хотя они равны по рекомендованным ценам. Так что смотреть нужно исходя из конкретной ситуации на данный момент. Главное, что Radeon RX 9070 XT стал более сильным конкурентом для игровых решений Nvidia, и это позволяет надеяться на дальнейший прогресс с обеих сторон. Но было бы очень неплохо, если бы у AMD появилось и настоящее флагманское решение — рынку нужен такой соперник, просто лучшим соотношением цены и производительности в среднем сегменте Nvidia не победить.

В остальном же — похоже, что изменение схемы наименования видеокарт для лучшего соответствия решениям конкурента вполне оправдалось — в разрешении 2560x1440 без трассировки лучей получился прирост производительности по сравнению с Radeon RX 7900 GRE примерно на треть, что пусть и не слишком много, но неплохо, особенно на уровне GeForce. Общая производительность Radeon RX 9070 XT без учета трассировки примерно соответствует GeForce RTX 5070 Ti, новая модель AMD находится примерно посередине между GeForce RTX 4070 Ti Super и GeForce RTX 4080 — это выше большинства ожиданий. При этом, новая видеокарта AMD этого поколения чуть не догнала флагман прошлого поколения — Radeon RX 7900 XTX, который остался на 3%-5% быстрее (без трассировки лучей, напомним). Также по энергоэффективности новый GPU не смог превзойти конкурентов Nvidia, но она немного улучшилась по сравнению с прошлым поколением Radeon.

Что же касается трассировки, то у AMD наконец-то получилось значительно увеличить ее производительность. По сравнению с RDNA 3 прирост производительности впечатляющий, но всё же Radeon RX 9070 XT отстает от GeForce RTX 5070 Ti, а вот GeForce RTX 5070 в среднем даже в играх с трассировкой медленнее — в том числе и из-за того, что у карты AMD целых 16 ГБ видеопамяти, а GeForce RTX 5070 имеет лишь 12 ГБ. Объем в 16 ГБ памяти является выигрышным, в некоторых играх в 4K-разрешении при трассировке лучей и генерации кадров уже не хватает 12 ГБ, а в будущем количество таких проектов лишь увеличится — игры всегда предъявляют всё более высокие требования к объему видеопамяти.

Важным делом стало и приближение последних поколений технологий DLSS и FSR по возможностям и качеству. Но если новинки Nvidia получили улучшенное качество масштабирования при помощи новых ИИ-моделей и многокадровую генерацию, то AMD еще только в самом начале этого процесса. Технология FSR 4 приблизилась к DLSS 3 по качеству и возможностям масштабирования и генерации кадров, но при этом потеряла важное преимущество в универсальности. Ведь FSR 4 полноценно работает только на решениях RDNA 4, а остальные видеокарты, включая предыдущие Radeon и всех конкурентов, этой поддержкой не обладают.

Если сравнивать Radeon RX 9070 (XT) с вышедшими чуть раньше решениями Nvidia GeForce RTX 50, то RDNA 4 содержит куда больше улучшений, по сравнению со слабо изменившейся Blackwell к Ada Lovelace. Но тут можно говорить как о том, что и Ada Lovelace на фоне RDNA 3 и RDNA 4 до сих пор хороша, а перспективные нововведения Blackwell скорее нацелены на будущее и возьмут свое тогда, когда начнут применяться в играх. В свою очередь, AMD любит просто улучшать сырую аппаратную производительность уже проверенных и точно полезных блоков. Наверное, самой важной новинкой в RDNA 4 стал увеличенный темп исполнения матричных вычислений, используемых в машинном обучении и нейросетях, но производительность ИИ-ускорителей в RDNA 4 также достигла лишь уровня видеокарт Nvidia пары поколений назад.

Но не будем принижать Radeon RX 9070 XT, по своей рекомендованной розничной цене — это действительно отличное предложение с производительностью выше, чем у Radeon RX 7900 XT из предыдущего поколения, также новинка лучше конкурирующей с ней GeForce RTX 5070 — она имеет больше памяти, обеспечивает более высокую производительность в растеризации и достаточную в трассировке, при стоимости лишь на $50 дороже. Да, у Nvidia есть всё же более эффективное аппаратное и более проработанное программное обеспечение, включая DLSS 4, которая явно превосходит FSR 4 и функционально и по распространенности — первая технология используется в гораздо большем количестве игр, а FSR 4 потеряла свое преимущество в универсальности. Но всё это имеет меньшее значение, чем реальные розничные цены.

Увы, многие модели Radeon RX 9070 XT партнеров компании продаются намного дороже объявленной цены — даже по собственным данным компаний, рекомендованные розничные цены на оригинальные варианты этой модели составляет $730-$750, что уже заметно больше стартовой цены в $600. И реальность показывает, что по ценам в магазинах Radeon RX 9070 XT пока что скорее ближе к Radeon RX 5070 Ti, чем к GeForce RTX 5070. И ближайший конкурент рассмотренной новинки именно GeForce RTX 5070 Ti, который предлагает чуть лучшую производительность при растеризации, всегда лучшую производительность при трассировке лучей, лучшую энергоэффективность и лучшую технологию повышения производительности (выше качество изображения и многокадровую генерацию). Так что нужно сравнивать реальные розничные цены, и если Radeon RX 9070 XT будет продаваться по цене на $150-$200 меньше GeForce RTX 5070 Ti, то в ней точно есть смысл. Если же разница в ценах меньше — решение Nvidia смотрится предпочтительнее.

На момент написания статьи в американских магазинах (Newegg, Amazon, B&H, Best Buy и т. д.) вообще не было в наличии видеокарт Radeon RX 9070 и Radeon RX 9070 XT, равно как и GeForce RTX 5090 и GeForce RTX 5080. Но GeForce RTX 5070 есть — при ценах, близких к рекомендованным (чуть выше), есть и GeForce RTX 5070 Ti, но уже с явно завышенными до $1000 ценами. На нашем рынке есть всё, кроме GeForce RTX 5090, пожалуй, но всё по завышенным ценам, и к рекомендованной ближе всего снова GeForce RTX 5070 — вероятно, Nvidia помогает начало продаж на несколько недель раньше. Сейчас ситуация сложнее обычного, если не брать майнинговое время с конца 2020 года, но почти каждый запуск видеокарт какое-то время проходит с дефицитом и завышенными ценами, и всё же есть вероятность, что к маю или июню поставки нормализуются — уж решения уровня GeForce RTX 5070 (Ti) и Radeon RX 9070 (XT) вряд ли широко используются нейросетевиками и должны появиться в широкой продаже уже по нормальным ценам.

На этих позитивных ожиданиях переходим к рассмотрению практических особенностей видеокарты Radeon RX 9070 XT в исполнении компании Gigabyte.

Особенности карты Gigabyte Aorus Radeon RX 9070 XT Elite 16G (16 ГБ)

Сведения о производителе: Компания Gigabyte Technology (торговая марка Gigabyte) основана в 1986 году в Китайской Республике (Тайвань). Штаб-квартира в Тайбэе/Тайвань. Изначально создавалась как группа разработчиков и исследователей. В 2004 году на базе компании был образован холдинг Gigabyte, в который вошли Gigabyte Technology (разработка и производство видеокарт и материнских плат для ПК); Gigabyte Communications (производство коммуникаторов и смартфонов под маркой GSmart (с 2006 г.

Объект исследования: серийно выпускаемый ускоритель трехмерной графики (видеокарта) Gigabyte Aorus Radeon RX 9070 XT Elite 16G 16 ГБ 256-битной GDDR6

Gigabyte Aorus Radeon RX 9070 XT Elite 16G 16 ГБ 256-битной GDDR6
Параметр	Значение	Номинальное значение (референс)
GPU	Radeon RX 9070 XT (Navi48)
Интерфейс	PCI Express x16 5.0
Частота работы GPU (ROPs), МГц	BIOS P: 3100(Boost)—3142(Max) BIOS S: 3100(Boost)—3125(Max)	2970(Boost)—3090(Max)
Частота работы памяти (физическая, МГц (ПСП, ГТ/с))	2500 (20)	2500 (20)
Ширина шины обмена с памятью, бит	256
Число вычислительных блоков в GPU	64
Число операций (ALU/CUDA) в блоке	64
Суммарное количество блоков ALU/CUDA	4096
Число блоков текстурирования (BLF/TLF/ANIS)	256
Число блоков растеризации (ROP)	128
Число блоков Ray Tracing	64
Число тензорных блоков	128
Размеры, мм	340×135×60	320×120×50
Количество слотов в системном блоке, занимаемые видеокартой	3	3
Цвет текстолита	черный	черный
Энергопотребление пиковое в 3D, Вт (BIOS P/BIOS S)	340/340	350
Энергопотребление в режиме 2D, Вт	18	18
Энергопотребление в режиме «сна», Вт	4	4
Уровень шума в 3D (максимальная нагрузка), дБА (BIOS P/BIOS S)	29,4/25,1	33,0
Уровень шума в 2D (просмотр видео), дБА	18,0	18,0
Уровень шума в 2D (в простое), дБА	18,0	18,0
Видеовыходы	2×HDMI 2.1b, 2×DisplayPort 2.1a	1×HDMI 2.1b, 3×DisplayPort 2.1a
Поддержка многопроцессорной работы	нет
Максимальное количество приемников/мониторов для одновременного вывода изображения	4	4
Питание: 8-контактные разъемы	3	3
Питание: 6-контактные разъемы	0	0
Питание: 16-контактные разъемы	0	0
Вес карты с комплектом поставки (брутто), кг	2,2	2,4
Вес карты чистый (нетто), кг	1,55	1,7
Максимальное разрешение/частота, DisplayPort	3840×2160@240 Гц, 7680×4320@120 Гц
Максимальное разрешение/частота, HDMI	3840×2160@144 Гц, 7680×4320@120 Гц
Минимальная стоимость карт на базе Radeon RX 9070 XT	105 000 рублей

Память

Карта имеет 16 ГБ памяти GDDR6 SDRAM, размещенной в 8 микросхемах по 16 Гбит на лицевой стороне PCB. Микросхемы памяти SK Hynix (H56G42AS8DX014) рассчитаны на номинальную частоту работы в 2500 МГц (эффективная ПСП 20 ГТ/с, или 20 Гбит/с).

В случае GDDR7 физическую частоту надо умножать на 12: технология кодирования PAM3 (3 Pulse Amplitude Modulation) × 2 (двойная передача сигнала (DDR)) × 2 (два канала) = 12.

В случае GDDR6X физическую частоту надо умножать на 16: технология кодирования PAM4 (4 Pulse Amplitude Modulation) × 2 (двойная передача сигнала (DDR)) × 2 (два канала) = 16.

В случае GDDR6 физическую частоту надо умножать на 8: технология кодирования PAM2 (2 Pulse Amplitude Modulation) × 2 (двойная передача сигнала (DDR)) × 2 (два канала) = 8.

Особенности карты и сравнение с Gigabyte Radeon RX 7800 XT Gaming (16 ГБ)

Gigabyte Aorus Radeon RX 9070 XT Elite 16G (16 ГБ)	Gigabyte Radeon RX 7800 XT Gaming (16 ГБ)
вид спереди

вид сзади

Мы сравниваем Radeon RX 9070 XT с Radeon RX 7800 XT из предыдущего поколения по двум причинам: во-первых, компания AMD позиционирует Radeon RX 9070/XT как среднеуровневые решения, а во-вторых, ускоритель Radeon RX 7700 XT, для которого Radeon RX 9070 XT кажется логичным продолжением (наличие цифры 7 в названии) имеет 192-битную шину обмена с памятью, а не 256-битную.

Прекрасно видно, что, карты отличаются кардинально. Во-первых, сами графические ядра различаются по размерам как кристаллов, так и упаковок, во-вторых, совершенно иное расположение микросхем памяти вокруг GPU.

В традициях AMD ядро имеет зашифрованную числовую маркировку, произведено на 52-й неделе 2024 года (кристалл выполнен по техпроцессу TSMC N4P — по разным оценкам это 4 нм).

Суммарное количество фаз питания у карты Gigabyte Aorus Radeon RX 9070 XT Elite 16G — 17 (14+3).

Зеленым цветом отмечена схема питания ядра (14 фаз), красным — памяти (3 фазы).

У карты имеется два ШИМ-контроллера Monolithic Power Systems MP2868, они работают в паре и управляют обеими схемами питания.

В преобразователе питания ядра и микросхем памяти используются транзисторные сборки DrMOS — MP87993 той же компании MPS, рассчитанные на 90 А.

Выделенного контроллера для мониторинга (отслеживания напряжений и температур) нет, эта функция опять же в традициях AMD возложена на GPU.

Управление подсветкой у видеокарт Gigabyte осуществляется контроллером Holtek.

Карта имеет два режима работы, они заложены в двух вариантах BIOS, которые переключаются с помощью переключателя на переднем торце карты: P (performance / производительный) и S (silent / тихий). Разница между режимами заключается, по сути, только в оборотах вентиляторов, предел энергопотребления в обоих случаях составляет 350 Вт.

Штатные частоты памяти равны референсным значениям. А Boost-значение частоты работы ядра в обоих режимах BIOS P/BIOS S выше референсного на 4,3%. При этом максимальная частота GPU у карты Gigabyte выше референсной всего на 1,5%. Исследования показали, что карта Gigabyte продемонстрировала производительность в играх выше референсной на 3,3% (в среднем в разрешении 2.5K).

Энергопотребление карты Gigabyte в тестах доходило до 340 Вт (в обоих режимах BIOS P/S).

Лимит потребления можно поднять на 10%, поэтому мы попробовали ручной разгон, получив стабильную работу карты на частоте ядра 3271 МГц, при этом частота работы памяти не понималась выше 2605 МГц (речь о физической частоте), так что ПСП выросла не сильно — до 21 МТ/с. В итоге в среднем мы получили прирост производительности 4,6% в разрешении 2.5K.

Питание на карту Gigabyte подается через три 8-контактных разъема питания стандарта PCIe 2.0.

Отметим большие габариты данной карты, 34 см в длину, 13,5 см по высоте и 6 см толщиной. В результате видеокарта занимает 3 слота в системном блоке.

Карта имеет стандартный набор видеовыходов: два DP 2.1a и два HDMI 2.1b.

Управление работой карты обеспечивается с помощью фирменной программы Gigabyte Control Center.

Панель выбора предустановленных режимов работы карты (с упором в энергоэффективность или производительность)

Нагрев и охлаждение

Мы видим кулер со сквозным продувом хвостовой части радиатора. Основой СО является огромный многосекционный пластинчатый никелированный радиатор с тепловыми трубками, распределяющими тепло по ребрам радиатора.

8 трубок припаяны к большой медной никелированной пластине, которая охлаждает как ядро, так и микросхемы памяти. Для охлаждения преобразователей питания VRM имеются свои подошвы на радиаторе. Задняя пластина не только служит элементом защиты PCB, но и участвует в охлаждении тыльной стороны PCB в области ядра через термопрокладки.

В качестве термоинтерфейса для охлаждения микросхем памяти и преобразователей питания VRM используются так называемые жидкие термопрокладки (термогель). Это, по сути, одноразовый интерфейс, его можно использовать вторично, но потребуется ювелирная работа по формированию требуемых поверхностей для равномерного распределения.

Поверх радиатора установлен кожух с тремя вентиляторами ∅96 мм, имеющими по 7 лопастей и работающими на единой частоте вращения.

В традициях карт Gigabyte, средний вентилятор вращается в противоположную сторону, образуя с крайними вентиляторами «эффект шестеренок», помогающий бороться с турбулентностью воздушных потоков.

Остановка вентиляторов при малой нагрузке на видеокарту происходит, если температура GPU опускается ниже 50 градусов, а нагрев микросхем памяти ниже 85 градусов. При запуске ПК вентиляторы работают, однако после загрузки видеодрайвера идет опрос рабочей температуры, и они выключаются. Ниже есть видеоролик на эту тему.

Мониторинг температурного режима:

Режим BIOS P:

После прогона под нагрузкой максимальная температура ядра не превысила 64 градусов, а микросхем памяти — 90 градусов, что является хорошим результатом для карт такого уровня. Энергопотребление карты доходило до 340 Вт. Напомним, что предельный нагрев GDDR6 — 115 °C.

Мы засняли и ускорили в 50 раз 8-минутный прогрев

Максимальный нагрев наблюдался в области ядра, нижней части PCB около разъема PCIe, а также около разъема питания карты.

При ручном разгоне нагрев вырос незначительно (65/92 °C), однако потребление скакнуло до 375 Вт.

Режим BIOS S:

После прогона под нагрузкой максимальная температура ядра не превысила 68 градусов, микросхем памяти — 94 градуса, что также является нормальным результатом. Энергопотребление карты доходило до 340 Вт.

Шум

Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.

Режимы измерения:

Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark

Оценка градаций уровня шума следующая:

менее 20 дБА: условно бесшумно
от 20 до 25 дБА: очень тихо
от 25 до 30 дБА: тихо
от 30 до 35 дБА: отчетливо слышно
от 35 до 40 дБА: громко, но терпимо
выше 40 дБА: очень громко

В режиме простоя в 2D температура была не выше 31 °C, вентиляторы не работали, уровень шума был равен фоновому — 18 дБА.

При просмотре фильма с аппаратным декодированием ничего не менялось.

Режим BIOS P:

В режиме максимальной нагрузки в 3D температура достигала 64/90 °C (ядро/память). Вентиляторы при этом раскручивались до 1890 оборотов в минуту, шум вырастал до 29,4 дБА: это всё еще тихо.

Аудиозапись шума — здесь. Спектрограмма шума:

Режим BIOS S:

В режиме максимальной нагрузки в 3D температура достигала 68/91 °C (ядро/память). Вентиляторы при этом раскручивались до 1525 оборотов в минуту, шум вырастал до 25,1 дБА: это тем более тихо, даже очень тихо.

Подсветка

Карта имеет подсветку в трех зонах.

Основной элемент подсветки — это фирменная подсветка вентиляторов Gigabyte Halo: светодиоды расположены на внутренней стороне кожуха по периметру каждого вентилятора. Совместно с вращающимися лопастями вентиляторов они образуют интересные световые эффекты.

Управление режимами подсветки, в том числе и ее отключением, осуществляется той же утилитой Gigabyte Control Center.

Имеется возможность сохранения выбранного режима в самой карте, то есть при желании можно настроить подсветку один раз и больше не запускать программу.

Отметим, что синхронизация подсветки возможна только с материнскими платами Gigabyte, но при этом выбор сценариев сокращается. Возможности синхронизации подсветки с иными материнскими платами нет.

Комплект поставки и упаковка

В комплекте поставки кроме карты и краткого руководства имеется еще разборная подставка под видеокарту с регулируемым по высоте упором, а также бонусная наклейка.

Тестирование: синтетические тесты

Мы провели тестирование новой модели видеокарты AMD со стандартными частотами в нашем наборе синтетических тестов. Он продолжает меняться, иногда добавляются новые тесты, а устаревшие постепенно убираются. Мы бы хотели добавить еще больше примеров с вычислениями, но с этим есть определенные сложности. Мы постоянно стараемся расширять и улучшать набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — напишите их в комментариях к статье или отправьте авторам.

Из более-менее новых бенчмарков мы начали использовать несколько дополнительных тестов для измерения производительности трассировки лучей и, а также технологий масштабирования разрешения и увеличения производительности: DLSS, FSR и XeSS. В качестве полусинтетических тестов у нас также используется набор подтестов из довольно популярного пакета 3DMark: Time Spy, Port Royal, DX Raytracing, Speed Way и др. А вот примеры приложений DirectX 11 и 12, входящие в различные SDK, пришлось убрать — последнее время они всё чаще давали некорректные результаты. Зато мы добавили тесты ИИ-нагрузок в виде нейросетевых вычислений.

Синтетические тесты проводились на следующих видеокартах:

Radeon RX 9070 XT со стандартными параметрами (RX 9070 XT)
Radeon RX 7900 XTX со стандартными параметрами (RX 7900 XTX)
Radeon RX 7900 XT со стандартными параметрами (RX 7900 XT)
GeForce RTX 5070 Ti со стандартными параметрами (RTX 5070 Ti)
GeForce RTX 5070 со стандартными параметрами (RTX 5070)

Для анализа производительности видеокарты Radeon RX 9070 XT мы использовали две модели Radeon из предыдущего поколения — RX 7900 XTX и RX 7900 XT. Они обе основаны на топовом чипе Navi 31 в разных версиях, и именно против них выставляет новую модель сама AMD, считая, что новинка справится с уровнем производительности недавнего флагмана. Ну а если и не везде справится с самым топом, то уж со второй то моделью точно. Можно было бы добавить еще и RX 7900 GRE, но уж она то точно должна быть медленнее.

Конкурентов у рассматриваемой сегодня видеокарты и на рынке всего два — это пара моделей GeForce из совсем свежей линейки Nvidia GeForce RTX 50. Да, RTX 5070 стоит дешевле рассматриваемого Radeon, с ней конкурирует скорее младшая RX 9070, а вот RTX 5070 Ti уже явно дороже, и они расположены по цене по разные стороны от рассматриваемой сегодня модели, так что прямого сравнения не получится. Но обе эти видеокарты являются соперниками для RX 9070 XT, и по сравнению с ними будет видно, насколько в RDNA 4 смогли улучшить как производительность в целом, так и исправить основные недостатки RDNA 3.

Тесты 3DMark Vantage

Много лет мы рассматриваем устаревшие синтетические тесты из пакета 3DMark Vantage, ведь в них зачастую можно найти что-то интересное, чего нет в других, более современных тестах. Feature тесты из этого тестового пакета имеют поддержку DirectX 10, они до сих пор более-менее актуальны и при анализе результатов новых видеокарт мы всегда делаем какие-то полезные выводы.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark обычно довольно высока, и тест показывает результаты, близкие к соответствующим теоретическим параметрам, хотя иногда они всё же получаются несколько заниженными в случае некоторых GPU. Производительность полной версии графического процессора Navi 48 в этом тесте оказалась заметно хуже и RX 7900 XTX из предыдущего поколения, и даже RX 7900 XT заметно впереди. Это не очень хорошо бьется с теорией, наверное драйверы еще недостаточно проработаны, тем более, что под DirectX 10 уже мало что оптимизируется в принципе.

Понятно, что и сравнение рассматриваемой сегодня видеокарты AMD с конкурентами оказалось не самым успешным, хотя предыдущие несколько поколений графических процессоров AMD были в этом тесте заметно сильнее соперников, но эффективная скорость текстурирования семейства Radeon RX 7000 уже снизилась, и RX 9070 XT и вовсе показала результат хуже всех, уступив даже младшему GPU из своих конкурентов — RTX 5070, а уж Ti-версия заметно быстрее. Раньше решения AMD были заметно сильнее соперников в этом тесте.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне современным.

Результаты второго подтеста 3DMark Vantage показывают производительность блоков ROP без учета величины пропускной способности видеопамяти, и тест измеряет именно производительность подсистемы ROP, а ПСП обычно не оказывает явного влияния. И снова мы отмечаем явно аномально низкий результат, так как рассматриваемая видеокарта Radeon RX 9070 XT еще раз показала себя заметно хуже, чем GPU предыдущего поколения — даже RX 7900 XT быстрее новинки более чем вдвое!

Пара представленных в сегодняшнем сравнении видеокарт серии GeForce RTX 50 также показала невысокую производительность, куда ниже уровня RX 7900 XT(X), и новая видеокарта RX 9070 XT смогла обойти только младшую из них — RTX 5070. И это при том, что видеокарты компании Nvidia по пиковой скорости заполнения сцены ранее всегда уступали конкурирующим по цене Radeon, так что мы удивлены подобным результатам в этом подтесте — но спишем их на недоработки в драйверах, так как подобных аппаратных слабостей у Navi 48 нет.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Результаты этого теста из пакета 3DMark Vantage не зависят исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU, а также эффективность выполнения сложных шейдеров. Это довольно полезный тест, так как результаты в нем нередко коррелируют с тем, что получается в игровых тестах. Тут важны и математическая и текстурная производительность, а вот пропускная способность памяти хоть и важна, но не так уж сильно.

И вот в этой «синтетике» из 3DMark Vantage модель Radeon RX 9070 XT уже показала результат более-менее на том уровне, что мы от нее ожидаем — выше уровня младшей модели из предыдущего семейств. Флагманская модель RX 7900 XTX из прошлого поколения осталась впереди, но не так уж сильно. Если же говорить о соперниках других производителей, то младший конкурент в виде GeForce RTX 5070 ожидаемо отстал, а вот более дорогая модель RTX 5070 Ti показала результат примерно на том же уровне — неплохой знак для сегодняшней новинки.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что в нем рассчитываются физические взаимодействия (имитация ткани) при помощи GPU. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также должна зависеть сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Сильные стороны чипов Nvidia должны были проявиться, но мы давно уже получаем явно некорректные результаты в этом тесте, поэтому учитывать результаты всех видеокарт GeForce тут просто нет смысла, они неверны. Да и видеокарты Radeon со временем оказались точно в этой же ситуации — более новые драйверы AMD на GPU текущего поколения показывают аномально низкие результаты, вот и для Radeon RX 9070 XT они явно не соответствуют теории. Так что все результаты в этом тесте можно считать некорректными, дело явно в драйверах, которые никто давно не оптимизирует для столь древнего тестового пакета.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи графического процессора. Используется вершинная симуляция, где каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Тут мы видим абсолютно то же самое — и во втором геометрическом тесте из 3DMark Vantage получились далекие от теории результаты у сегодняшней новинки, аналогично прошлому подтесту этого же бенчмарка. Все результаты некорректны, новая Radeon RX 9070 XT не может почти втрое отставать от RX 7900 XT просто в принципе — этого не может быть по теории. У решений Nvidia тут всё заметно лучше, обе видеокарты семейства RTX 50 далеко впереди.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В этом математическом тесте производительность всех решений хоть и не совсем соответствует теории, но она обычно близка к пиковой производительности видеочипов в предельных задачах. В тесте используются операции с плавающей запятой, и новые архитектуры AMD и Nvidia должны были раскрыть часть своих уникальных возможностей по двойному запуску соответствующих команд, но... так как этот тест уже порядком устарел, то не способен показать новые способности современных GPU, судя по сравнительным результатам.

Немного удивляет, что модель Radeon RX 9070 XT не смогла опередить даже младшую видеокарту на чипе Navi 31 — Radeon RX 7900 XT, и результаты всего пакета Vantage в целом остаются сомнительными. Да и если сравнивать новинку по математической производительности с GeForce, то результаты тоже странные — рассматриваемая сегодня RX 9070 XT совсем немного обогнала младшего соперника в виде RTX 5070, а RTX 5070 Ti оказалась заметно впереди — почти на уровне RX 7900 XTX, но она и дороже остальных решений. Посмотрим, что получается в более современных синтетических тестах, использующих повышенную нагрузку на GPU, под которые оптимизируют драйверы современных видеокарт.

Тесты Direct3D 12

Примеры из DirectX SDK компании Microsoft и из SDK компании AMD, использующие графический API Direct3D12, мы решили убрать из наших тестов, так как они давно показывают некорректные результаты в большинстве случаев. И в качестве единственного вычислительного теста с поддержкой Direct3D12 в этом разделе остался известный бенчмарк Time Spy из 3DMark. В нем нам интересно не только общее сравнение GPU по мощности, но и разница в производительности с включенной и отключенной возможностью асинхронных вычислений, появившихся в DirectX 12. Для верности мы протестировали видеокарты сразу в двух графических тестах.

В этом тесте все Radeon обычно выглядят явно лучше конкурирующих с ними по цене GeForce, это всегда нужно учитывать. Вот в этом тесте производительность рассматриваемой сегодня видеокарты Radeon RX 9070 XT оказалась даже выше наших ожиданий — она опередила даже флагманскую RX 7900 XTX — архитектурные улучшения и повышенные частоты GPU явно хорошо помогли в этом деле. В этом тесте важна и эффективная пропускная способность памяти, и с ней всё оказалось в порядке, ведь пиковая у новинки ниже, чем у предшествующих GPU.

Так что рассматриваемая нами сегодня новая видеокарта архитектуры RDNA 4 вполне может оказаться мощнее некогда топовой RX 7900 XTX если не во всех, то во многих играх. Что касается GeForce, то новая RX 9070 XT опередила обоих конкурентов, даже более дорогая модель RTX 5070 Ti осталась позади. Даже если учитывать завышенные результаты всех Radeon тут, это очень хороший знак для новинки, в растеризации она точно хороша. Самое время посмотреть, что у нее с ахиллесовой пятой всех предыдущих архитектур компании.

Тесты трассировки лучей

Одним из первых тестов производительности трассировки лучей является бенчмарк Port Royal создателей известных тестов серии 3DMark. Этот тест работает на всех графических процессорах с поддержкой DirectX Raytracing API. Мы проверили несколько видеокарт в разрешении 2560×1440 при различных настройках, когда отражения рассчитываются при помощи трассировки лучей в двух режимах, а также традиционным для растеризации методом.

Бенчмарк показывает несколько новых возможностей применения трассировки лучей через DXR API, в нем используются алгоритмы отрисовки отражений и теней с применением трассировки, но тест в целом не слишком хорошо оптимизирован и достаточно сильно загружает в том числе и мощные GPU. Хотя для сравнения производительности разных видеокарт в этой конкретной задаче тест вполне подходит.

Раньше мы всегда писали о том, что результаты этого теста наглядно показывают разницу в подходах компаний AMD, с одной стороны, а также Nvidia и Intel с другой — к поддержке аппаратного ускорения трассировки лучей до RDNA 4 первая компания подходила не слишком ответственно, с каждым шагом улучшая положение совсем чуть-чуть. Да, RDNA 3 чуть улучшила положение Radeon прошлого семейства и они теряли от включения трассировки меньше предыдущего поколения, но не приближались к конкурентам.

В случае RDNA 4 на примере Radeon RX 9070 XT мы видим верный признак исправления ситуации — по крайней мере при гибридном рендеринге новинка точно лучше предшественников справляется с нагрузкой на блоки трассировки лучей, и заметно опережает даже флагмана RX 7900 XTX. Более того, сравнение с парой GeForce показывает, что и с ними в таких условиях новинка легко справилась, показав результат на уровне более дорогой RTX 5070 Ti — то, чего мы так давно ждали! Но не будем слишком торопиться с радостью, посмотрим на более сложную трассировку лучей.

Позднее вышел еще один подтест 3DMark, направленный на тестирование производительности трассировки лучей — DirectX Raytracing. В отличие от предыдущего, он не гибридный, и не использует растеризацию вовсе, а только трассировку лучей, поэтому гораздо лучше отражает скорость GPU именно по возможностям аппаратного ускорения трассировки. Сцена в бенчмарке используется уже известная нам по другим подтестам 3DMark, и она довольно небольшая — BVH-структура в теории может поместиться в Infinity Cache, что может помочь видеокартам Radeon.

С одной стороны, прям чуда не случилось, даже сильно улучшенные блоки аппаратной трассировки лучей RDNA 4 в этом тесте работают точно хуже, чем аналогичные блоки в GeForce RTX 50. С другой — RX 9070 XT почти догнала RTX 5070 в чуть ли не самом худшем для AMD случае! И в этом тесте RDNA 4 с трассировкой лучей работает сравнительно эффективно, но разница по сравнению с Nvidia всё же остается. Новая RX 9070 XT и тут оказалась побыстрее RX 7900 XTX, что уже можно считать положительным результатом, но RTX 5070 Ti осталась в единоличных лидерах, она ощутимо быстрее всех. Но и куда дороже по рекомендованной цене, про это тоже не нужно забывать.

Кроме того, это чисто синтетический тест, в играх такое будет разве что в Portal RTX, Quake II RTX, спецрежиме Cyberpunk 2077 и других аналогичных проектах с трассировкой пути. В большинстве же игр с применением более простой трассировки лучей, нагрузка на RT-блоки заметно ниже, и положение Radeon RX 9070 XT будет заметно лучше — в таких тестах видеокарты Nvidia уже не будут иметь столь явное преимущество.

К выходу предыдущих поколений графических процессоров Nvidia и AMD в пакет 3DMark был добавлен еще один тест с достаточно серьезной нагрузкой именно на трассировку лучей — Speed Way. Вот он по своей нагрузке на различные блоки GPU кажется более похожим на распространенные игровые проекты, которые активно используют трассировку лучей, и поэтому для нас весьма интересен.

Неудивительно, что мы видим немного другое соотношение результатов — RX 9070 XT снова оказалась чуть быстрее недавней флагманской RX 7900 XTX, опередив младшую модель еще сильнее. В 4K-разрешении частота кадров неиграбельная, но в 2560x1440 получилось более 64 FPS — хороший результат. Разница между Radeon и GeForce осталась в пользу решений Nvidia, но уменьшилась — рассматриваемая сегодня видеокарта AMD тут по скорости примерно между двумя условными конкурентами в виде GeForce RTX 5070 и RTX 5070 Ti, и это очень хороший результат для новинки, учитывая трассировку лучей.

Рассмотрим еще один полусинтетический бенчмарк, который сделан уже на реальном игровом движке. Boundary — один из китайских игровых проектов с поддержкой DXR и DLSS. Это бенчмарк с очень серьезной нагрузкой на GPU, трассировка лучей в нем используется весьма активно — и для сложных отражений с несколькими отскоками луча, и для мягких теней, и для глобального освещения. Естественно, технологию DLSS в тестах Radeon мы использовать не можем.

Без технологий масштабирования разрешения даже в Full HD-разрешении приемлемо работают только достаточно мощные видеокарты от уровня RX 7900 XT и выше, и рассматриваемую сегодня модель можно отнести к ним — новинка показала частоту кадров на уровне 80 FPS — это лучше, чем даже у RX 7900 XTX на полноценном топовом чипе архитектуры RDNA 3, не говоря о младшем варианте с урезанным GPU. Новая модель видеокарты AMD пусть и снова отстает от обеих представленных в сравнении видеокарт GeForce, в том числе немного не дотянула до RTX 5070, которая стоит чуть дешевле новинки, но она всё равно неплохо смотрится на фоне решений конкурента — работа над ошибками у AMD явно удалась.

Вычислительные тесты

Мы продолжаем поиск бенчмарков, использующих OpenCL для актуальных вычислительных задач, чтобы включить их в состав нашего пакета синтетических тестов. Пока что в этом разделе остается довольно старый и не слишком хорошо оптимизированный тест трассировки лучей (не аппаратной) — LuxMark 3.1. Этот кроссплатформенный тест основан на LuxRender и использует OpenCL.

Новая модель видеокарты Radeon RX 9070 XT на основе графического процессора Navi 48, показала слегка неожиданный результат в этом тесте — практически на уровне младшей из подсемейства RX 7900 из предыдущего поколения. Но интересного тут то, что если в паре более простых тестов новинка сильно уступила предыдущему флагману, то
в самом сложном тесте результат рассматриваемой видеокарты AMD оказался заметно выше. По сравнению с конкурентами результаты новинки во всех подтестах ниже — даже если взять менее дорогую RTX 5070, не говоря о Ti-версии. Всё же чисто вычислительные тесты исключительно на ALU — не самая лучшая сторона Navi 48.

К сожалению, ни в Cinebench 2024 ни в OctaneRender 2020 новинка не работает. Возможно, приложения в будущем получат обновления с оптимизацией под новые серии Radeon RX 9000 и GeForce RTX 50, но пока что мы были вынуждены заменить их единственной работоспособной на Radeon версией бенчмарка V-Ray. Это тоже трассировка лучей без применения аппаратного ускорения. Тест производительности на базе рендерера V-Ray раскрывает возможности GPU в сложных вычислениях и также может показать некоторые преимущества новых видеокарт.

Тест также показывает программную трассировку лучей, в нем новая модель Radeon RX 9070 XT оказалась быстрее предшественниц, прошлый флагман на пару секунд медленнее, а RX 7900 XT медленнее на все пять секунд, что немало. Однако парочка GeForce и тут опередила новинку. Даже RTX 5070 тут впереди на секунду, а более дорогая модель с суффиксом Ti — на три секунды. Но можно сказать, что рассматриваемая сегодня модель Radeon показала достаточно неплохой результат по вычислительным тестам в целом.

Для измерения производительности GPU в задачах искусственного интеллекта мы используем тестовый набор MLPerf — семейство тестов машинного обучения, разработанное исследователями из Гарварда, Стэнфорда, Nvidia, Google и других университетов и организаций. MLPerf используется для оценки производительности Large Language Model (LLM) — языковой модели из нейронной сети с множеством параметров, являющейся важнейшей технологией генеративного ИИ. MLPerf измеряет производительность генерации текста при помощи искусственного интеллекта в ответ на разные исходные данные — тесты используют модель Llama2-7B, и этот бенчмарк измеряет как время обработки входного запроса и получения первого токена в четырех типах тестов, так и количество токенов в секунду после этого — то есть устоявшуюся производительность в дальнейшем.

Мы сравниваем производительность разных GPU в объединенной категории, содержащей геометрическое среднее всех подтестов. Партнерами разработчика теста являются и Nvidia и AMD и Intel, и если графические процессоры первых двух компаний могут использовать только DirectML, то Intel — еще и OpenVINO, с которым Intel Arc показывают более высокие результаты.

Время получения первого токена показывает, насколько быстро ИИ начинает давать ответ, так что это как время отклика системы. По этому показателю все видеокарты Nvidia явно лучше всех решений AMD, включая флагманскую модель прошлого поколения RX 7900 XTX. Новинка где-то между RX 7900 XT и XTX, но более чем вдвое медленнее обоих конкурентов — даже младшая GeForce RTX 5070 по получению первого токена оказалась сильно быстрее. Но в темпе выдачи последующих токенов разница должна быть большей.

По скорости выдачи второго и последующих токенов положение уже совсем иное — разница между Radeon RX 9070 XT и RX 7900 XT/XTX изменилась, новинка чуть медленнее даже младшей модели — как так, ведь у нее есть выделенные ИИ-ускорители! Похоже, тест еще не оптимизирован именно под RDNA 4, так что не получает преимуществ от улучшений в матричных блоках новой архитектуры. Если говорить о сравнении с GeForce, то RTX 5070 немного уступила сегодняшней новинке, а вот RTX 5070 Ti стала лидером сравнения по этому тесту. Надо подождать оптимизаций, они могут заметно изменить ситуацию.

Раз уж и новые графические процессоры AMD получили поддержку шины PCIe 5.0, то мы решили сравнить новинку с RTX 5080, на которой разница между версиями 5.0 и 4.0 была заметна лишь в синтетическом тесте. Поэтому также для номинальной проверки узнаем влияние пропускной способности шины PCI Express в двух вариантах — 5.0 и 4.0 в специализированном тесте из состава пакета 3DMark, позволяющего измерять пиковую пропускную способность по шине.

Хорошо видно, что пиковая пропускная способность в случае обоих GPU сильно зависит от версии шины PCIe. Разница между 5.0 и 4.0 явно меньше теоретической двукратной, но она всё равно почти полуторакратная. В теории и синтетике, а на практике столь высокая скорость передачи данных почти ничего не меняет в результатах реальных тестов — заметной разницы между 5.0 и 4.0 мы не обнаружили ни в одном из тестов, есть лишь пара-тройка процентов преимущества. Интересно, что Radeon RX 9070 XT всё же имеет некоторое преимущество в обоих режимах и обеспечивает более высокую пропускную способность данных по шине PCIe, по сравнению с GeForce RTX 5080.

Возможно, ИИ-приложения смогут выжать из PCIe больше, когда и если это потребуется. Шины PCI Express пятого поколения довольно давно доступна в настольных ПК и используется твердотельными накопителями, но GPU получают не слишком большое преимущество от вдвое большей полосы пропускания и поэтому решение не особо популярно среди производителей видеокарт. Тем не менее, анонсированные решения архитектуры RDNA 4 поддерживают интерфейс PCIe 5.0, это может пригодиться в будущем.

Тесты технологий DLSS/XeSS/FSR

В этом разделе мы рассматриваем дополнительные тесты, связанные с технологиями повышения производительности. Ранее это были только технологии масштабирования разрешения (DLSS 1.x и 2.x, FSR 1.0 и 2.0, XeSS), затем к ним добавилась и технология генерации промежуточных кадров — DLSS 3. Так как DLSS работает только на графических процессорах Nvidia, а сегодня мы рассматриваем видеокарту Radeon, то переходим сразу к XeSS, которая является всеядной, как и FSR.

XeSS — это очередной метод повышения производительности посредством рендеринга в меньшем разрешении и масштабировании картинки до более высокого — аналог DLSS 2.0, предложенный компанией Intel. Он также использует возможности искусственного интеллекта при восстановлении информации в кадре и отличается от DLSS тем, что работает не только на пока еще редких видеокартах компании-разработчика, но и на всех современных GPU, пусть и не столь эффективно, как на решениях самой Intel. Для тестирования мы использовали специализированный бенчмарк из пакета 3DMark.

Включение XeSS позволяет заметно повысить частоту кадров — до двух раз и более. С учетом своей универсальности, технология вполне имеет право на жизнь, так как у всех трех компаний есть свои технологии и блоки для их ускорения, но есть у них и недостатки: DLSS самая продвинутая, но работает только на Nvidia, FSR (кроме версии 4) самая универсальная, но и самая простая, а также пока что не умеет ускорять процесс при помощи специализированных блоков, ну а XeSS хороша и универсальна, но заметно отстает от DLSS и по качеству и по функциональности.

Видеокарта Radeon RX 9070 XT в этом тесте работает с более высокой эффективностью, по сравнению с видеокартами из прошлого поколения — вероятнее всего, дело в оптимизации драйверов под этот тест. Рассматриваемая новая модель с суффиксом XT оказалась быстрее и простой RX 7900 XT и флагманской RX 7900 XTX — похоже, что сам тест такой, да и оптимизации разные. Хуже то, что видеокарты Nvidia явно эффективнее решений AMD и лучше справляются именно с масштабированием. Если результат без XeSS для RX 9070 XT оказался выше, чем у RTX 5070, то включение масштабирование приводит уже к почти равным результатам этих моделей, а ведь Radeon дороже. Понятно, что RTX 5070 Ti вообще быстрее всех.

Еще один представитель семейства технологий масштабирования рендеринга — FSR 2.0 компании AMD. Почему-то именно эта технология последней появилась в списке специализированных подтестов 3DMark. К сожалению, сцены разных технологий масштабирования во всех случаях отличаются и напрямую их сравнить не получится, можно только по росту производительности, но нужно еще учитывать реальное разрешение рендеринга и разницу в качестве, а это — тема отдельного разговора.

Сразу заметим, что это не тест FSR 4 — пока что этот бенчмарк не имеет такой поддержки, а отдельное исследование мы обязательно выпустим. FSR 2 — это еще одна универсальная технология, которая работает на разных графических процессорах примерно одинаково, поэтому и ничего необычного в тестах FSR 2.0 нет — GPU расположились на диаграмме примерно так, как мы и ожидали. Модель Radeon RX 9070 XT в этот раз чуть отстала от RX 7900 XTX и в родном разрешении рендеринга и при включении масштабирования. Новая видеокарта AMD заметно быстрее GeForce RTX 5070 в этом тесте, что хорошо, да и до результатов RTX 5070 Ti ей не слишком далеко.

В целом, новая модель на архитектуре RDNA 4 показала довольно ожидаемые результаты на фоне прошлого флагмана Radeon RX 7900 XTX, а также соперничающих с ней видеокарт GeForce и в растеризации и с трассировкой лучей она неплохо справляется с задачей, почти на этом же уровне, всегда опережая модель RX 7900 XT, что очень хорошо. Похоже, что в большинстве игр производительности полной версии Navi 48 вполне будет хватать для того, чтобы быть на уровне предыдущего флагмана, да и обойти RTX 5070 получится почти везде — кроме игр с действительно сложной трассировкой лучей. Переходим к тестированию новой видеокарты AMD в игровых тестах, как раз для того, чтобы подтвердить или опровергнуть наши выводы по синтетическим тестам.

Тестирование: игровые тесты

Конфигурация тестового стенда

Список инструментов тестирования

Во всех игровых тестах использовалось максимальное качество графики в настройках.

Black Myth: Wukong (Game Science/Game Science)
Cyberpunk 2077 (Софтклаб/CD Projekt RED), патч 2.21 (январь 2025 г.)
Senua’s Saga: Hellblade II (Ninja Theory/Xbox Games)
Call of Duty: Modern Warfare II (Infinity Ward/Activision) (без трассировки и DLSS/FSR/XeSS!)
Alan Wake 2 (Remedy/Epic Games)
Ratchet and Clank: Rift Apart (Insomniac Games/Sony/Софтклаб)
Ghost of Tsushima Director’s Cut (Sucker Punch Productions/Sony Interactive)
Hogwarts Legacy (Avalance Software/Warner Bros)
Avatar: Frontiers of Pandora (Ubisoft)
Atomic Heart (Mundfish/VK)
Indiana Jones and the Great Circle (Machine Games/Bethesda Softworks) (с RT и DLSS/FSR/XeSS!)

Кратко о производительности в 3D-играх

Перед демонстрацией детальных тестов мы приводим краткие сведения о производительности семейства, к которому относится конкретный исследуемый ускоритель, а также его соперников. Всё это нами субъективно оценивается по шкале из семи градаций.

Игры без использования трассировки лучей (классическая растеризация):

В классических играх Radeon RX 9070 XT по производительности выходит на один уровень с GeForce RTX 4080, чуть обгоняет GeForce RTX 4070 Ti Super и Radeon RX 7900 XTX и чуть отстает от GeForce RTX 5070 Ti. Это позволяет получить высокий уровень комфорта в играх на максимальных настройках качества во всех разрешениях до 4K включительно.

Игры с использованием трассировки лучей и DLSS/FSR/XeSS:

В играх с активной трассировкой лучей и разными видами апскейлинга (FSR/XeSS) Radeon RX 9070 XT находится на одном уровне с GeForce RTX 4070 Ti, чуть выше GeForce RTX 4070 Super и весьма существенно опережает флагмана предыдущего поколения Radeon RX 7900 XTX. В разрешениях до 2.5K включительно можно получить хороший комфорт в играх на высоких настройках графики, а во многих играх приемлемая производительность будет и в 4K, однако в некоторых играх использование трассировки лучей надо сочетать с технологиями динамического масштабирования).

Результаты тестирования в 3D-играх

Стандартные результаты тестов без использования аппаратной трассировки лучей в разрешениях 1920×1080, 2560×1440 и 3840×2160

Black Myth: Wukong

Cyberpunk 2077 v.2.21

Senua’s Saga: Hellblade II

Call of Duty: Modern Warfare II

Alan Wake 2

Ratchet and Clank: Rift Apart

Ghost of Tsushima Director’s Cut

Hogwarts Legacy

Avatar: Frontiers of Pandora

Atomic Heart

Результаты тестов со включенной аппаратной трассировкой лучей и/или DLSS/FSR/XeSS в разрешениях 1920×1080, 2560×1440 и 3840×2160

Black Myth: Wukong, RT+DLSS/FSR/XeSS

Cyberpunk 2077 v.2.21, RT

Cyberpunk 2077 v.2.21, RT + DLSS/FSR

Senua’s Saga: Hellblade II, DLSS/FSR/XeSS

Alan Wake 2, RT

Alan Wake 2, RT + DLSS/FSR

Ratchet and Clank: Rift Apart, RT

Ratchet and Clank: Rift Apart, RT + DLSS/FSR/XeSS

Ghost of Tsushima Director’s Cut, DLSS/FSR/XeSS

Hogwarts Legacy, RT

Hogwarts Legacy, RT + DLSS/FSR/XeSS

Avatar: Frontiers of Pandora, RT

Avatar: Frontiers of Pandora, RT + DLSS/FSR

Atomic Heart, DLSS/XeSS

Indiana Jones and the Great Circle, RT

Indiana Jones and the Great Circle, RT + DLSS/FSR/XeSS

Желающие изучить наши результаты детально, пересчитать рейтинги, исходя из своих локальных розничных цен, могут скачать таблицу (Excel) здесь (ZIP-архив).

Рейтинг iXBT.com

Методика расчета рейтингов

Методика расчета базируется на усреднении (берется среднее геометрическое) величин производительности в каждом тесте.

Рейтинги iXBT и полезности рассчитываются по следующей формуле:

Рейтинг iXBT для игр без использования трассировки лучей

К_iXBT = (K^1⁄30) × (P_OSS) ⁄ K_A310 × 100

К_ПОЛ = K_iXBT ⁄ Price × 10000

где:

К — составляющая, учитывающая скорость работы карт:

К =	(G01_19xx × G01_25xx × G01_38xx) ×
	(G02_19xx × G02_25xx × G02_38xx) ×
	(G03_19xx × G03_25xx × G03_38xx) ×
	(G04_19xx × G04_25xx × G04_38xx) ×
	(G05_19xx × G05_25xx × G05_38xx) ×
	(G06_19xx × G06_25xx × G06_38xx) ×
	(G07_19xx × G07_25xx × G07_38xx) ×
	(G08_19xx × G08_25xx × G08_38xx) ×
	(G09_19xx × G09_25xx × G09_38xx) ×
	(G10_19xx × G10_25xx × G10_38xx) ×

Для того чтобы читателю было понятно, как взаимно соотносятся возможности карт, мы берем К_A310 (составляющую, учитывающую скорость работы Arc A310) за эталон и нормируем на нее показатели всех остальных ускорителей, получая рейтинги видеокарт относительно Arc A310. Для демонстрации разницы в процентах умножаем всё на 100.

Условные обозначения:

К_ПОЛ — рейтинг полезности (чем он выше, тем лучшe оценка карты)
К_iXBT — рейтинг iXBT.com (чем он выше, тем лучшe оценка карты)
G01 — G10 — производительность (FPS) тестовых играх 1 — 10 в соответствующих разрешениях:
- G01_19xx — 1920×1200
- G01_25xx — 2560×1440
- G01_38xx — 3840×2160
Price — цена видеокарты на конец отчетного месяца по данным прайс-листов некоторых популярных маркетплейсов (берется средняя цена)
P_OSS — оценка новых функциональных возможностей видеокарты (см. пояснения ниже)

Рейтинг iXBT для игр c использованием трассировки лучей, DLSS/FSR/XeSS

К_iXBT-RT = (K^1⁄30) × (P_OSS) ⁄ K_A310 × 100

К_ПОЛ-RT = K_iXBT-RT ⁄ Price × 10000

где:

К — составляющая, учитывающая скорость работы карт:

К =
	(G01_19xx × G01_25xx × G01_38xx) ×
	(G02_19xx × G02_25xx × G02_38xx) ×
	(G03_19xx × G03_25xx × G03_38xx) ×
	(G04_19xx × G04_25xx × G04_38xx) ×
	(G05_19xx × G05_25xx × G05_38xx) ×
	(G06_19xx × G06_25xx × G06_38xx) ×
	(G07_19xx × G07_25xx × G07_38xx) ×
	(G08_19xx × G08_25xx × G08_38xx) ×
	(G09_19xx × G09_25xx × G09_38xx) ×
(G10_19xx × G10_25xx × G10_38xx) ×

Условные обозначения:

К_ПОЛ — рейтинг полезности (чем он выше, тем лучшe оценка карты)
К_iXBT-RT — рейтинг iXBT.com (чем он выше, тем лучшe оценка карты)
G01 — G10 — производительность (FPS) тестовых играх 1 — 10 в соответствующих разрешениях с включенными технологиями RT/DLSS/FSR/XeSS:
- G01_19xx — 1920×1200
- G01_25xx — 2560×1440
- G01_38xx — 3840×2160
Price — цена видеокарты на конец отчетного месяца по данным прайс-листов некоторых популярных маркетплейсов (берется средняя цена)
P_OSS — оценка новых функциональных возможностей видеокарты (см. пояснения ниже)

Оценка P_OSS на данный момент равна 1 (зарезервирована на будущее).

Хотим выразить благодарность
Maxxx (maxm@online.sinor.ru),
Михаилу Сугакевичу (Mishail@newmail.ru)
Вячеславу Гордееву AKA Slaydev (sarz@dale.elektra.ru) и
Ruslan73 (http://forum.ixbt.com/users.cgi?id=info:Ruslan73)
dmitro13 (dmytro13@hotmail.com)
UnVial (lvg@pop.ioffe.rssi.ru)
Сергею Гайдукову (gsaf@sura.ru)
Михаилу Кузьмину (kuzmin@laser.ru)

за усовершенствование методики расчета рейтингов

Рейтинг ускорителей iXBT.com демонстрирует нам функциональность видеокарт друг относительно друга и представлен в двух вариантах:

Вариант рейтинга iXBT.com без включения RT

Рейтинг составлен по всем тестам без использования технологий трассировки лучей. Этот рейтинг нормирован по наиболее слабому ускорителю из группы карт — Arc A310 (то есть сочетание скорости и функций Arc A310 приняты за 100%). Рейтинги ведутся по 30 регулярно исследуемым нами акселераторам в рамках проекта Лучшая видеокарта месяца. В данном случае из общего списка выбрана группа карт для анализа, в которую входят Radeon RX 9070 XT и его конкуренты.

Рейтинг приведен для разрешения 2.5K.

№	Модель ускорителя	Рейтинг iXBT.com	Рейтинг полезности	Цена, руб.
05	Gigabyte Aorus RX 9070 XT, разгон до 3271 МГц/21 ГТ/с	1842	169	109 000
06	Gigabyte Aorus RX 9070 XT, 3100—3142 МГц/20 ГТ/с	1824	167	109 000
07	GeForce RTX 5070 Ti 16 ГБ, 2450—2790 МГц/28 ГТ/с	1818	173	105 000
08	RTX 4080 16 ГБ, 2505—2625 МГц/22,4 ГТ/с	1774	136	130 000
09	RX 9070 XT 16 ГБ, 2970—3090 МГц/20 ГТ/с	1754	167	105 000
10	RX 7900 XTX 24 ГБ, 2500—2990 МГц/20 ГТ/с	1722	145	119 000
12	RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 ГТ/с	1587	156	102 000

В обычных играх с растеризацией Radeon RX 9070 XT чуть-чуть обошел флагмана предыдущего поколения Radeon RX 7900 XTX и оказался на 10% быстрее, чем GeForce RTX 4070 Ti Super, но тоже совсем чуть-чуть отстал от GeForce RTX 4080, а GeForce RTX 5070 Ti оказался быстрее на 3,5%. Карта Gigabyte в силу фабрично повышенных частот работы обошла всех соперников.

Вариант рейтинга iXBT.com с включением RT/DLSS/FSR/XeSS

Рейтинг составлен по 10 тестам, в которых используется технология трассировки лучей и одновременно технология Nvidia DLSS, AMD FSR или Intel XeSS. Этот рейтинг нормирован по самому слабому ускорителю в данной группе — Arc A310 (то есть сочетание скорости и функций Arc A310 приняты за 100%).

Рейтинг приведен для разрешения 2.5K.

№	Модель ускорителя	Рейтинг iXBT.com	Рейтинг полезности	Цена, руб.
03	GeForce RTX 5070 Ti 16 ГБ, 2450—2790 МГц/28 ГТ/с	5818	554	105 000
06	RTX 4080 16 ГБ, 2505—2625 МГц/22,4 ГТ/с	4906	377	130 000
08	RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 ГТ/с	4466	438	102 000
09	Gigabyte Aorus RX 9070 XT, разгон до 3271 МГц/21 ГТ/с	4217	387	109 000
10	Gigabyte Aorus RX 9070 XT, 3100—3142 МГц/20 ГТ/с	4184	384	109 000
12	RX 9070 XT 16 ГБ, 2970—3090 МГц/20 ГТ/с	4020	383	105 000
15	RX 7900 XTX 24 ГБ, 2500—2990 МГц/20 ГТ/с	3423	288	119 000

В играх, где задействованы RT и технологии динамического масштабирования, ситуация для Radeon RX 9070 XT выглядит менее радужно, хотя флагмана предыдущего поколения Radeon RX 7900 XTX он опять же обошел на 17%.

Зато GeForce RTX 4070 Ti Super оказался быстрее на 11%, а GeForce RTX 5070 Ti — на 44%. Здесь сыграло роль активное использование DLSS с многокадровой генерацией в 4 играх из 10, а технология AMD FSR4 (аналог многокадровой генерации) пока еще не работает в тех же играх. Ждем нужного обновления для Ratchet & Clark).

Рейтинг полезности

Рейтинг полезности тех же карт получается, если показатель предыдущего рейтинга разделить на цены соответствующих ускорителей. Для расчета рейтинга полезности использованы розничные цены на март 2025 года.

Вариант рейтинга полезности без включения RT

Рейтинг приведен для разрешения 2.5K.

№	Модель ускорителя	Рейтинг полезности	Рейтинг iXBT.com	Цена, руб.
13	GeForce RTX 5070 Ti 16 ГБ, 2450—2790 МГц/28 ГТ/с	173	1818	105 000
17	Gigabyte Aorus RX 9070 XT, разгон до 3271 МГц/21 ГТ/с	169	1842	109 000
19	Gigabyte Aorus RX 9070 XT, 3100—3142 МГц/20 ГТ/с	167	1824	109 000
20	RX 9070 XT 16 ГБ, 2970—3090 МГц/20 ГТ/с	167	1754	105 000
23	RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 ГТ/с	156	1587	102 000
24	RX 7900 XTX 24 ГБ, 2500—2990 МГц/20 ГТ/с	145	1722	119 000
25	RTX 4080 16 ГБ, 2505—2625 МГц/22,4 ГТ/с	136	1774	130 000

В данном случае соперники в лице Radeon RX 9070 XT и GeForce RTX 5070 Ti идут ноздря в ноздрю, карта Gigabyte тоже от них практически не отличается.

Вариант рейтинга полезности с включением RT/DLSS/FSR/XeSS

Рейтинг приведен для разрешения 2.5K.

№	Модель ускорителя	Рейтинг полезности	Рейтинг iXBT.com	Цена, руб.
01	GeForce RTX 5070 Ti 16 ГБ, 2450—2790 МГц/28 ГТ/с	554	5818	105 000
08	RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 ГТ/с	438	4466	102 000
14	Gigabyte Aorus RX 9070 XT, разгон до 3271 МГц/21 ГТ/с	387	4217	109 000
16	Gigabyte Aorus RX 9070 XT, 3100—3142 МГц/20 ГТ/с	384	4184	109 000
17	RX 9070 XT 16 ГБ, 2970—3090 МГц/20 ГТ/с	383	4020	105 000
18	RTX 4080 16 ГБ, 2505—2625 МГц/22,4 ГТ/с	377	4906	130 000
26	RX 7900 XTX 24 ГБ, 2500—2990 МГц/20 ГТ/с	288	3423	119 000

Безусловно, пока технология AMD FSR4 не будет массово внедрена в игры, конкуренты из стана Nvidia окажутся более интересными, так как поддержкой DLSS с MFG обладают уже сотни игр (прежде всего благодаря приложению Nvidia, позволяющему включить MFG в играх, у которых имеется поддержка DLSS 3). А вот про GeForce RTX 4080 и Radeon RX 7900 XTX с их нынешними ценами можно уже забыть: они должны или сильно подешеветь, чтобы сверкнуть на закате своего существования, или пропасть с прилавков окончательно.

Выводы и сравнение энергоэффективности

Ускоритель Radeon RX 9070 XT (16 ГБ) позиционируется компанией AMD как продукт среднего уровня. Поэтому и рекомендованные розничные цены выставлены на уровне 600 долларов, хотя сейчас практически никто из партнеров AMD их не соблюдает — мы видим на прилавках такие карты по сильно завышенным ценам. Ранее среднеуровневые продукты из серии Radeon получали названия типа Radeon RX 5700 XT и Radeon RX 7700 XT, так что в данном случае напрашивалось название Radeon RX 9700 XT, но в AMD посчитали, что им выгоднее поменять систему названий и приблизить ее к той, которой пользуется конкурент Nvidia (GeForce RTX 4070, GeForce RTX 5070 и т. д.). В результате семерка поменяла свое место и мы получили Radeon RX 9070 XT.

Поколение 8000 и вовсе оказалось пропущено: после Radeon RX 7000 вышли сразу Radeon RX 9000. Это сделано, чтобы числовые обозначения поколения процессоров AMD и видеокарт на базе GPU того же производителя были одинаковыми: сейчас актуально поколение Ryzen 9000, поэтому и Radeon RX 9000.

Стоимость всех современных видеокарт — очень больная тема. Уже понятно, что рекомендованных розничных цен (MSRP) никто в ближайшей перспективе не увидит, даже с поправкой на налоги. Может быть, только ближе к выходу следующего поколения, но и то вряд ли. Это касается как видеокарт на базе Nvidia GeForce, так и аналогов на базе AMD Radeon.

Судите сами: 600 долларов — это на момент подготовки обзора примерно 51 тысяча рублей. Понятно, что цена без налогов, поэтому прибавляем 20% НДС, получаем 61 тысячу. И даже если учесть аппетиты торговых компаний, мы всё равно получаем не более 75 тысяч. А реальные цены на такие карты сейчас выше 100 тысяч (в редких случаях близки к 100 тысячам из-за локальных акций и скидок). Все партнеры AMD подняли отпускные цены на свою продукцию значительно выше MSRP.

Для нашего рейтинга полезности мы взяли за ориентир 105 тысяч рублей: по такой минимальной цене на момент подготовки обзора можно было реально найти Radeon RX 9070 XT на маркетплейсах. Для протестированной карты Gigabyte минимальная цена в то же время составляла 109 тысяч рублей (этот продукт относится к дорогому семейству Aorus).

Еще на примерах видеокарт на базе новых GPU Nvidia мы убедились, что в современных реалиях программная часть работы ускорителей становится всё более весомой, всё активнее использует имеющиеся наработки в области ИИ (нейронных сетей), а аппаратная часть GPU должна иметь нужные для быстрых вычислений блоки. Именно с этой целью AMD представила свою технологию FSR 4, которая в какой-то степени может являться аналогом Nvidia DLSS 4 (Multiframe Generation).

Она уже поддерживается во многих играх с FSR 3.1 при помощи переопределения в драйвере. Качество изображения при использовании новой версии масштабирования было значительно улучшено, стабильность изображения не доходит до уровня DLSS 4 с применением модели трансформера, но многие детали в кадре превосходят возможности предыдущей версии DLSS 3, что можно считать несомненным успехом. А вот по генерации кадров нет никаких улучшений: сохранилось удвоение частоты кадров при том же качестве, тогда как в Blackwell появилась уже многокадровая генерация. И хотя Nvidia до сих пор имеет некоторое преимущество и по качеству масштабирования и по генерации кадров, это преимущество с RDNA 4 значительно уменьшилось.

Наверное, не имеет смысла снова повторять, что Radeon RX 9070 XT не является флагманом. AMD с самого начала однозначно заявила, что на данном этапе (то есть в текущем поколении) они флагманские карты выпускать не будут. Судя по спросу на новые карты на западном рынке, компании удалось неплохо просчитать стратегию и получить приличную отдачу от выпуска среднеуровневых ускорителей в попытке захватить долю в самом массовом ценовом сегменте.

Если посмотреть на энергоэффективность, то Radeon RX 9070 XT по этому показателю ожидаемо находится где-то в середине списка.

Энергоэффективность

Компания AMD сделала приличный шаг вперед в архитектуре RDNA 4 сразу в нескольких важных областях, в которых их решения ранее сильно отставали от соперничающих с ними видеокарт Nvidia. Была значительно улучшена производительность трассировки лучей — в большинстве существующих игр с трассировкой лучей Radeon RX 9070 XT достиг как минимум уровня GeForce RTX 5070, хотя в сложных случаях с трассировкой пути отставание по эффективности RT-ядер всё еще остается. Новый GPU получил и аппаратные ИИ-ускорители, которые также несколько отстают по скорости и возможностям от аналогичных блоков Nvidia, но обеспечивают существенные улучшения в различных ИИ-нагрузках, включая поддержку новой версии технологии масштабирования FSR 4, помогающей повысить производительность.

Конкретная протестированная карта Gigabyte Aorus Radeon RX 9070 XT Elite 16G (16 ГБ) имеет крупные размеры 34×13 см и занимает 3 слота в системном блоке. Карта может потреблять до 340 Вт (официальный лимит AMD — 350 Вт) и имеет три 8-контактных разъема питания PCIe 2.0. Кулер тихий. У карты 4 видеовыхода: 2 HDMI 2.1b и 2 DisplayPort 2.1a — последний обеспечивает пропускную способность до 80 Гбит/с в режиме передачи UHBR 20 и позволяет подключить 8K-дисплей с частотой обновления 60 Гц по одному кабелю. Карта имеет стильный и симпатичный дизайн, снабжена фирменной подсветкой Halo, создающей красивые эффекты при вращении вентиляторов.

Еще раз отметим, что в классических играх Radeon RX 9070 XT может обеспечить высокий уровень комфорта в играх на максимальных настройках качества во всех разрешениях до 4K включительно. В играх с активной трассировкой лучей и разными видами апскейлинга (FSR/XeSS) Radeon RX 9070 XT позволит получить хороший комфорт в играх на высоких настройках графики в разрешениях до 2.5K включительно, а во многих играх приемлемая производительность будет и в 4K, однако в некоторых играх использование трассировки лучей надо сочетать с технологиями динамического масштабирования).

В номинации «Оригинальный дизайн» карта Gigabyte Aorus Radeon RX 9070 XT Elite 16G (16 ГБ) получила награду:

105 комментариев

Комментировать

Rivarez

31 марта 19:47

Такое ощущение, что AMD делает свои затычки с одной целью — чтобы все от них шарахались и покупали курткины видяхи. Куртка наверное платит своей племяннице за рекламу своих видях.

-19

Ответить

Yolanda

31 марта 19:53

Прогресс есть, всё же с 7000ой серии масса улучшений, и особенно наконец-то алгоритмы апскейла на базе нейронки FSR4. Кстати FSR тоже улучшают, в новых Ассасинах работает очень хорошо, впервые пожалуй, только тени двоятся, но это видимо баг, можно поправить, раньше багов везде была масса. А так конечно Нвидия впереди.

-6

КреейЗи

31 марта 20:23

Если только в ценах Нвидиа впереди…

Slaventus

31 марта 22:55

Нейронку им сделала Сони - потому и качество

-10

thorthon

01 апреля 04:22

И графику разработали заодно.

AlarmZone13

01 апреля 13:11

Бред конечно ты про нейронку написал.

01 апреля 15:51

я знал что пишу для гуглонеграмотных - поэтому снизу привел ссылку на статью. с твитом самой АМД https://wccftech.com/amd-fsr-4-confirmed-to-have-been-co-developed-with-sony/

-4

Sawaru

01 апреля 20:03

Так ты сам не грамотный лол.
«FSR 4 is looking fantastic! Excited for the co-development with Sony Interactive Entertainment on the models used for the FSR 4 upscaler.»
Ещё раз нейронку им не сделала сони. Черным по белому написано совместная разработка. И написано не model, а models, т.е. множественное число.
«Вот здесь Сони представляют проект Amethyst как их собственный»
«e have begun a deeper collaboration with AMD. For the project name we’re taking a hint from AMD’s red and PlayStation’s blue. The code name is Amethyst.»
«In going after this we’re combining the lessons AMD has learned from its multi-generation RDNA road map and SIE has learned from the custom work in PS5 Pro.»
Зачем же читать да?

Более того, смотрим
https://www.youtube.com/live/GZfFPI8LJrc?si=fF4BZ47pRn_moicz&t=1171
FSR 4 гибридная архитектура нейронки. Когда сони говорить только о свёрточной нейронке CNN. В FSR 4 же используется и CNN и элементы трансформера, за счёт которых и обеспечивается качество же.
CNN нужен в гибриде для облегчения модели. Т.к. сложность трансформера растёт квадратично с увеличением длинны последовательности.

Итого FSR 4 это совместная разработка AMD и SIE. А не только сони. При том кто и чем занимался не понятно, но скорее всего сони работали над свёрточной нейронкой. Часть трансформера похоже уже дело рук АМД.

01 апреля 20:43

Какого трансформера? Нет статей с описанием архитектуры.
А зная АМД они вполне могли назвать CNN with ATTENTION гибридной архитектурой.

02 апреля 10:55

Если что механизм внимания, как раз ключевой механизм Трансформеров.
а так пожалуйста читайте
https://www.researchgate.net/publication/371131911_Single-image_super-resolution_using_lightweight_transformer-convolutional_neural_network_hybrid_model
https://www.researchgate.net/publication/369557573_Incorporating_Transformer_Designs_into_Convolutions_for_Lightweight_Image_Super-Resolution
https://arxiv.org/pdf/2103.14030
https://www.sciencedirect.com/science/article/abs/pii/S1746809423007644

Ой что же мы видим, идея не нова и да не амд придумали модели называть гибридными.

01 апреля 20:44

Сони представляют проект Amethyst как их собственный https://videocardz.com/newz/sony-unveils-project-amethyst-next-gen-ai-enhanced-hardware-in-collaboration-with-amd

02 апреля 10:10

Когда читать научишься, тогда и пиши.
«представляют проект Amethyst как их собственный»
I have some very exciting news to share. We have begun a deeper collaboration with AMD. For the project name we're taking a hint from AMD's red and PlayStation's blue.. The code name is Amethyst

01 апреля 20:50

«сони работали над свёрточной нейронкой. Часть трансформера похоже уже дело рук АМД» — это даже не чушь. Эту ахинею ни на один глобус не натянуть.
А чтобы объяснить почему это чушь потребуется не один час.

-1

31 марта 23:03

AMD FSR 4, the latest version of the upscaling technology made by AMD, was co-developed with Sony. The news came in a tweet pushed by AMD itself, https://wccftech.com/amd-fsr-4-confirmed-to-have-been-co-developed-with-sony/

-2

m0ujp3k

01 апреля 01:10

А в консолях сони, простите, ускорители какого производителя стоят?..

01 апреля 02:38

А софт этим ускорителям, простите, кто пишет?

Микрософт

Skyner

01 апреля 10:32

> was co-developed with Sony
У Славика превратилась в «им сделала Сони». Ловкость рук и никакого мошенничества)

01 апреля 16:02

Нейронку вдвоем тренировать невозможно. FSR пишет сам АМД - что остается Сони?

01 апреля 17:36

Вот здесь Сони представляют проект Amethyst как их собственный https://videocardz.com/newz/sony-unveils-project-amethyst-next-gen-ai-enhanced-hardware-in-collaboration-with-amd

Ever

02 апреля 06:51

И что такое этот Аметист ты прочитал?

02 апреля 16:14

Что это проект использования ИИ в играх вообще, не только апскейл. И он не планируется быть эксклюзивом => изначально это для плойки делается => Сони

02 апреля 16:27

И каким образом это относится к твоим выдумкам «FSR4 сделала Сони»?

Ladios Sopp Live

01 апреля 11:45

То то Сани выкатили свой PSSR который слил FSR4 и теперь Черни говорит, что в 25-26 у них будет FSR4 (PSSR2), кстати, это говорит о возможности версии FSR4 для RDNA3

01 апреля 16:06

FSR 4 поддерживают только графические процессоры архитектуры RDNA 4 (в связи с расширением набора инструкций WMMA на данные FP8)

01 апреля 20:10

Бред, даже на тех процах, что стоят в боксе и пс4 это есть, причем боксы даже официально это в даташит записали, а там RDNA2 с небольшими бонусами. Ты путаешь доп ускорение с возможностью расчёта.

02 апреля 01:26

А теперь включаем мозги — пока шейдеры заняты рендером — где должно крутится перемножение матриц?

02 апреля 03:39

Ты посмотри на «картинки» архитектуры. Возможно сам сможешь ответить на свои вопросы.

02 апреля 04:31

Давай картинку 7900ХТХ и Fsr4 — посмотрю

02 апреля 18:08

ниже 2 ссылки

01 апреля 12:44

Так у тебя же в цитате написано, что FSR4 сделана AMD.

01 апреля 15:59

загоните статью в гуглопереводчик если все так плохо. Твит от АМД был: - "We’re proud to collaborate with PlayStation on Project Amethyst!" Вот этот самый Аметист - нейронка. Остальную часть АМД писала сама

02 апреля 06:46

Славантуз, не тормози. Ты раз за разом цитируешь про «мы сработали вместе с Сони», но в твоём горячем бреду у тебя это превращается в «им всё Сони сделала».

02 апреля 16:20

Одна группа кодеров пишет код FSR4 — а ИИ модель разрабатывается и тренируется отдельной командой. Ну и какая команда где?

02 апреля 16:28

Сейчас ты нам расскажешь, раз тебя так возбуждает эта тема.

Эд

31 марта 22:29

Ага, зелёные сейчас пря зэ бэст. Черные экраны, отваливающийся писиай, плавящиеся разъемы, бракованные чипы с недостающими блоками, томозящие старые игры, мизерный прирост производительности, дифицыт и конские цены. Наверняка еще что то забыл. Ощущеня вас явно подводят. Продажи новых амд карточек на данный момент раз в десять большн чем у нвидии, шарахаются аж пипец))

Kolbert

31 марта 23:04

Ощущения эти создаются амд фанатами и ими же распространяются, хомяки типа тебя в это с радостью верят, у меня не было ни одной проблемы с драйверами, у владельцев 4090, 5090 ничего не плавится, карты с недостающими блоками меняют

-13

dAlexis

01 апреля 19:13

Ага. И PhysX обратно включают и мор.. , тьфу физиономии вареньем намазывают. Верим, верим...

31 марта 23:59

В старшем сегменте у Амд 3%, с выходом 9000ой серии конечно больше будет, но даже занять 10% будет успех. Рыночек порешал. Проблем нет, 4080 даже работает в Пентиум 4!!! для смеха можно поставить, а всё работает.

-7

Аникей Сковородкер

01 апреля 21:25

В AGP?

01 апреля 22:08

PCI-E 1.0, Intel 975 чипсет, LGA 775.

Maratka

02 апреля 06:54

Драйвера тоже ставятся?
ПО, которое требует минимум SSE 4.1 без проблем работает?

01 апреля 18:57

Ага, покупайте куртку. Камень-ножницы-бумага - черный экран, оплавленный ра]ьем, недолитые ROP. Самоубеждайтесь дальше.

01 апреля 20:12

Людям зарабатывающии на мнение красных фанатов глубоко плевать. Всегда было и будет

02 апреля 06:53

То-то ты так рвёшься — ты же не зарабатываешь.

02 апреля 16:21

Кем бы я ни был — людям все равно плевать на тот хайп что вы тут раскручиваете

02 апреля 16:30

Чел, ты посмотри на кол-во комментов под этим обзором. Далеко не каждая карта такого удостаивается. Понятно, что значительную часть комментов тут сделали в том числе ты и прочие рвущиеся, но это так же подтверждает хайп вокруг этой карты. Была бы карта проходной — зелёные фанбойчики бы так не возбуждались и не рвались.

Наконец-то))
Дождались!

31 марта 21:02

В начале 200x у меня была видяха Sapphire Radeon 9600XT Fireblade. Тогда у Nvidia была линейка FX 5xxx. Прямо как сейчас, только тогда Radeon 9600, 9700 и 9800 рвали в клочья 5600 и 5800, особенно в новомодных шейдерах 2.0. То было золотое время для радеонов («радиков» — их так называли). К сожалению, сейчас ситуация прямо противоположная.

01 апреля 00:02

Да в шейдерах 2.0 Радеоны были мощнее, чем Geforce FX, но когда пошли шейдеры 2.0 уже вышли новые карты Radeon X800XT и Geforce 6800, которые реально тянули эти шейдеры в 1024*768, да и то впритык, а эти старые карты всё равно работали слабо.
А Radeon Х800XT быстрее почти в 4 раза, чем 9600.

45nm

01 апреля 11:34

Были ещё славные времена 1950XTX, 5850/5870
И можно вспомнить как выход 4850 и 4670 обрушил цены 9800gtx и 9600gt. Я в те времена в компьютерном магазине работал, бОльшая часть продаж ушла на них, и цены резко поползли вниз

Serpentus

01 апреля 18:21

1950 была проблемной из-за того, что кристаллы памяти на ней вообще не имели никакого охлаждения — радиатора на них не было, а вентилятор на них не дул (т.к. они с другой стороны находились). У меня побывали 2 таких карты. Первая от Palit проработала вообще меньше недели и сгорела. Сдал ее в магазин (сразу предложили вернуть деньги, сказав, что замучились менять по гарантии), купил в другом магазине более дорогой вариант от ASUS. Эта уже не сгорела, но после пары часов любой игры сваливалась в черный экран из-за перегрева. А в игре Titan Quest карта вообще перегревалась уже минут через 45. А если на паузу поставить, то и 20 минут хватало (тогда разработчики игр еще не просекли, что в меню надо делать ограничение на FPS). И, нет, вентиляция в корпусе у меня была хорошая.
Вот у 4850 проблем с перегревом не наблюдалось (в том же корпусе). Но не связанные с перегревом падения в черный экран изредка таки происходили, как и у 7870 потом. Где-то раз в несколько часов, что в общем казалось терпимым. А еще у всех этих карт были падения при скроллинге «тяжелого» видео в плеерах, причем довольно часто. Я даже думал, что это вообще у всех так, но потом купил GTX 1080 и понял, что это совсем не обязательно: вместо частых падений у нее при скроллинге очень-очень редко происходит долгий фриз на 5+ секунд, что, согласитесь, вообще не выглядит проблемой по сравнению с черным экраном.

Alex19

02 апреля 02:26

Спасибо за исторический экскурс.

Midosa 546063@ixbtforum

02 апреля 02:56

3 года владел вариантом от Пауэрколор - ничего из описанного и близко не было. Ни разу. Вообще никаких проблем или хлопот.

02 апреля 12:22

Забыл упомянуть - в корпусе был всего один вентилятор на вдув и один на выдув. Если в вашем корпусе такого не было - это вопрос к вашему умению пользоваться техникой.

01 апреля 18:04

Да, у меня была карта 9800 ХТ — реально хорошая.

Tim A

31 марта 21:41

Уф, много информации. Кто сразу вниз до выводов «мотает»? ;)

Дмитрий

31 марта 22:39

Когда просто обзор, можно и промотать. Но когда обзор не только видеокарты, но и про новую архитектуру — тогда читаю.

31 марта 22:54

У 9070 53.6 млрд трансисторов - больше чем у 5080 (45.6 млрд). Обсудим криворукость инженеров АМД?

IDDQD IDDQD

Одна из причин, почему у современных AMD-видеокарт (особенно на RDNA 2/RDNA 3) больше транзисторов, чем у аналогичных NVIDIA (на Ampere/Ada Lovelace), — это Infinity Cache.
Infinity Cache требует много транзисторов
В RDNA 2 (например, Navi 21 в RX 6900 XT) 128 МБ Infinity Cache занимает ~6–13 млрд транзисторов (из ~26.8 млрд общего числа).
В RDNA 3 (например, Navi 31 в RX 7900 XTX) 96 МБ Infinity Cache + улучшенная архитектура — общее число транзисторов ~58 млрд (у RTX 4090 — ~76 млрд, но там другой подход).
Почему NVIDIA обходится меньшим числом?
У NVIDIA нет Infinity Cache, вместо этого используется большая шина памяти + кэш L2 (например, у RTX 4090 — 72 МБ L2, но он менее ёмкий, чем у AMD).
NVIDIA сильнее оптимизирует плотность транзисторов (например, TSMC 4N у Ada Lovelace против 5/6nm у RDNA 3).

01 апреля 02:35

Какая разница? 9070 отстает от 5080 абсолютно во всех сценариях. Значит инженеры АМД не понимают куда их надо ставить

-9

qwz

01 апреля 09:24

5080 изначально больше чип, вы бы ещё i3 четырехядерный с 7950 сравнили

01 апреля 15:48

"5080 изначально больше чип" - а транзисторов меньше. на целых 8 млрд меньше У инженеров НВидия мозги лучше работают

02 апреля 19:34

«У инженеров НВидия мозги лучше работают»
А да? Тогда что же это меньшее кол-во транзисторов, на меньшей частоте занимают БОЛЬШЕ места, так ещё и жрут больше? И это при том, что у данной карты ещё и кеша не меньше.
И это при том, что высокая плотность усложняет повышение частот. Значит криворукие АМД смогли разработать более плотный, более высокочастотный, более энергоэффективный дизайн, а умные нвидиа не смогли?
Опять же зависимость частоты от потребления не линейна, а экспоненциальная.
При том тех процессы у них одного семейства.

И вот мы выяснили, что с инжерами обеих компаний никаких проблем нет, проблемы только у горемыки в комментариях, которому ну очень надо засрать не любимку.

cyberliberty

01 апреля 16:57

Она и не конкурент для 5080 даже в видении AMD

01 апреля 19:46

Именно. А транзисторов напихано в это видение на 15% больше

Так у Нвидии тоже кэши огромные, кэш это просто память и Infinity Cache тоже самое. В 4080 скажем 64МБ кэша, и даже в 4060 аж 32МБ.

MsmuAlligator

31 марта 23:15

Помнится ещё совсем недавно нам обещали ценовые войны и 9070 ХТ по $600… А теперь 105-109 тыс.р вроде как минимальная цена на маркетах 🤣

panvartan

01 апреля 00:38

И аппетит у нее как у 5080, короче хотели как 5070ti, а получился все равно 7900 XTX
ps Были слухи про 9070xtx на 32gb, был бы интересный прибор

01 апреля 02:36

Агрессивные запасы сьели агрессивные цены. Или наоборот

Хотаб

01 апреля 15:55

Надо понимать, что эти цены - особенности местных торгашей. У чайников цены раза в полтора ниже, а 5070ti только процентов на 30.

lxpcfc

01 апреля 05:31

109к за неё многовато, конечно, но за свою цену в ~70к на данный момент это лучшая карта по сочетанию фпс на шекель.

peoples

01 апреля 09:58

Откуда эта взятая с потолка цена?

01 апреля 11:33

Главное — верить.

В Беларусь с Европы или Чайны можно какую-нибудь нитро+ от сапфира даже дешевле привезти

02 апреля 02:27

Держите в курсе.

02 апреля 05:30

70к это чот около 780 баксов при курсе ~90. При «рекомендованной» цене 599 баксов.
Цена не с потолка, а именно адекватная за эту карту. За 120к прямо сейчас можно купить в днс в наличии 4080с. Там уже и длсс, и ртх и прочая лабуда будет, а сырая производительность выше.

01 апреля 11:42

Удивляет отсутствие Ai ускорителей в RDNA3 в таблице, когда как в спецификации указано 192 Ai ускорителя в 7900xtx…

01 апреля 13:08

Согласен. Ниже я написал об этом подробно.

01 апреля 12:36

Почему-то в ваших последних обзорах странно сильно расходятся данные карт, начиная с 4080 и выше в киберпанке RT, с указанными в обзоре https://www.ixbt.com/3dv/amd-radeon-rx-7900-xtx-review.html#n16 - с чего бы вдруг их производительность в этом обзоре и обзоре 5090 выросла аж на 30-50%? Было у 4090 32 фпс - стало 42. Было у 4080 22 фпс - стало 31. А у карт ниже 4080 всё осталось 1в1. Как так? Терзают сильные сомнения, видя такой небывалый рост производительности одних и тех же видеокарт Nvidia - и именно тех, которые обгоняли AMD до выхода 9070xt. А вот те, что не обгоняли - почему-то не улучшили свою производительность ни насколько.

Сергей Зарьянов

02 апреля 18:51

Божественный драйвер куртки, очевидно)

01 апреля 13:00

«Куда важнее другие изменения в блоках CU — например, в четвертом поколении RDNA появились свои «тензорные ядра» и у AMD, они назвали их ИИ-ускорителями (AI Accelerators).»
Вообще то они впервые появились в RDNA 3. К примеру, в Radeon RX 7900 XTX их 192 штуки, а в Radeon RX 7800 XT 120 штук. Данные взяты с официального сайта AMD. Они первого поколения, соответственно с поддержкой BF16, тогда как во втором поколении появилась поддержка FP8. Как в RDNA 3, так и в RDNA 4 ИИ ускорители являются матричными ядрами (WMMA). Об этом написано на сайте OpenGPU, под патронажем AMD.
P.S. В будущем AMD возможно добавит поддержку FSR 4 для RDNA 3 и RDNA 3.5. Технических ограничений нету. Да, будет хуже работать, но всё же лучше, чем FSR 3, так как будет задействовать ИИ ускорители.

01 апреля 13:38

Вообще-то там есть и то и другое, просто не ускоренное дополнительно. И производительности хватит у всего, что выше 7700. Для 7900xtx где 96CU будет около 122 tops (что подтверждается техдоком (FP16 (half) 122.8 TFLOPS (2:1)), для 7900xt — 84CU — 103 tops (у 2070 по докам где-то 126), а ведь длсс есть даже на 2050…

01 апреля 13:47

Не, даже меньше судя по вики. 2060 — 83, 2070 — 103, 2080 — 188 и 200 для титан.
Вот у 7600 наверно не хватит так как там около 44 tops получается…

01 апреля 17:10

есть то они может и есть - только нигде не задействованы. вообще. Технических ограничений - есть => FP8 нейронка

01 апреля 17:50

https://www.amd.com/en/products/graphics/radeon-ai.html

01 апреля 19:44

Rocm6 работает на шейдерах

01 апреля 20:05

FSR4 предположительно на INT8 )))

02 апреля 16:23

https://3dnews.ru/1120194/radeon-rx-9070-xt-protiv-geforce-rtx-5070-ti
Увы, в отличие от прошлых версий апскейлера, которые работали практически на любом железе, FSR 4 поддерживают только графические процессоры архитектуры RDNA 4 (в связи с расширением набора инструкций WMMA на данные FP8)

Ты этот бред везде будешь пихать? Ознакомся с архитектурой RDNA3:
https://www.hardwareluxx.de/images/cdn02/uploads/2022/Dec/swank_thread_af/amd-rdna3-breakout-021_1920px.jpeg
https://www.hardwareluxx.de/images/cdn02/uploads/2022/Dec/like_blockchain_0z/amd-rdna3-breakout-022_1920px.jpeg
Форматы FP на 50-180 % менее эффективны с точки зрения вычислений на выделенном оборудовании, чем формат INT. В Int8 RDNA3 выполняется только одна такая инструкция за такт, но по производительности у старших моделей находится в районе 3070Ti. Только у 7600 позорные 44tops. Все остальные легко справятся с задачей апскейла.
Сетки обученные на FP8 конвертятся на Int8.
https://arxiv.org/pdf/2303.17951

02 апреля 06:42

меня больше интересует, получиться ли положить FSR4 на тензорные ядра nVidia, в первую очередь — GF 3xxx и 2 xxx (4xxx и 5xxx очевидно и DLSS хватит).

02 апреля 16:24

меня больше интересует — какой идиот будет этим заниматься?

GalymOut 1066874@ixbtforum

01 апреля 13:01

ixbt в тестах 3Д постоянно использует неправомерный подход - для NV в разделе DLSS включает FG и даже MFG, а для AMD только FSR, но без FG (AMFM). И собирает результаты в одну таблицу! Оправдывает это тем, что раз игры не поддерживают FSR и AMFM, то и не включают их, а DLSS FG MFG поддерживают значит надо обязательно их включить! В итоге сравнивают не сравнимое. И игнорируют тех пользователей, что используют только апскейлеры, но отключают генерацию кадров.

01 апреля 13:59

Да тут уже вообще интересные вопросы (выше привёл пример со ссылкой): с выходом новых моделей радеон у старых нвидиа внезапно вырастает производительность аж до 50% - причём, именно у тех, которые обгоняли старых радеонов - и теперь по логике вещей те модели нвидиа должны начать отставать => но, о, чудо, внезапно происходит волшебство, и старые модели нвидиа опять начинают сильно обгонять новых моделей радеонов... Прикольно же.

01 апреля 20:21

Ну и в таблице производительности полнейший бред. В растре 9070xt выше 7900xtx, и 5070ti и 4080s и 5080. Предлагаю половину чемоданных игр от нвидии, такие как вуконг, 2077, АВ2, ну и ещё какую-нить заменить на Рокет лиг, спейсмарин 2, колду, хорайзн и тотал вор )))))

d0.1

02 апреля 15:40

Планируете в тесты добавить что-то кривое? Например 7 days to die, beamng, space engineers. Оно любой тестовый стенд нагнет.