Общая информация о Radeon RX 9070 XT
Наконец-то долгожданная серия Radeon RX 9000 вышла — в самом начале марта AMD выпустила свои новые видеокарты, основанные на графических процессорах архитектуры RDNA 4. Изначально планировалось не только анонсировать новые решения на CES 2025, но и выпустить их вскоре, но в последний момент AMD решила придержать их выпуск и посмотреть, что предложит рынку Nvidia со своими GeForce RTX 50. Сама архитектура RDNA 4 и некоторые детали о серии Radeon RX 9000 были частично раскрыты на выставке CES, но подробности и полные спецификации появились позже. Официально компания задержала запуск продаж, чтобы гарантировать больший объем видеокарт на начале запуска, но вряд ли они случайно вышли лишь после того, как конкурент выпустил все четыре видеокарты новой линейки, только тогда настала очередь и для Radeon RX 9070 XT и Radeon RX 9070.

С их выходом AMD окончательно перестала даже пытаться бороться за абсолютное лидерство по максимальной производительности GPU — они решили вовсе не делать соперников для GeForce RTX 5090 и даже GeForce RTX 5080. По словам представителей компании, они сосредоточились на более доступных GPU для более существенных по объему сегментов рынка, предпочтя достижение лучшего соотношения цены и скорости при разрешениях 1440p и 4K в ценовых сегментах до $700.
Две вышедшие модели видеокарт новой серии основаны на графическом процессоре Navi 48 — первом и единственном пока представителе новой графической архитектуры RDNA 4. Эта архитектура предназначена для обеспечения максимальной эффективности (производительности на площадь кристалла), чтобы оказаться примерно на уровне конкурирующих решений подсерии GeForce RTX 5070, и конкурировать с ними по всем параметрам. AMD заявила о значительном увеличении производительности на такт по сравнению с RDNA 3, а также о двукратном увеличении производительности аппаратных блоков трассировки лучей, что являлось главной проблемой для предыдущих решений компании. Такой же уровень ускорения относится к матричным вычислениям на ИИ-ускорителях, что обеспечило возможность внедрения масштабирования FSR 4, основанного на нейросетях, улучшающих качество изображения и производительность.
По сравнению с предыдущей архитектурой компании, в RDNA 4 больше всего улучшений было внедрено в аппаратные блоки трассировки лучей, но и ИИ-ускорители не обошли вниманием. Практически все вычислительные блоки получили свои усовершенствования для повышения производительности и эффективности, ИИ-ускорители получили поддержку новых типов данных с меньшей точностью, но большей производительностью, а блоки трассировки лучей стали значительно быстрее справляться с работой. Но хотя Nvidia перешла уже на память GDDR7 в своих новейших видеокартах, AMD продолжила использовать память «старого» стандарта — GDDR6, обеспечивающего максимальную производительность в 20 Гбит/с против 30 Гбит/с, но для улучшения эффективной пропускной способности в их графических процессорах есть специальный большой кэш Infinity Cache.

Radeon RX 9070 XT — это видеокарта для высокопроизводительного сегмента, которая предназначена для обеспечения комфортной игры в 4K-разрешении при любых графических настройках, которая в полтора раза опережает Radeon RX 6900 XT и на четверть быстрее GeForce RTX 3090 (почему-то для первых слайдов взяли такие старые GPU) по данным AMD. Рассматриваемая новинка имеет рекомендованную цену $600, что слегка больше, чем у GeForce RTX 5070, против которой выступает Radeon RX 9070 без индекса, но заметно ниже, чем у GeForce RTX 5070 Ti. Новая модель должна вернуть AMD к полноценной конкурентоспособности на игровом рынке, ведь сложилась такая ситуация, что более ранние серии Radeon RX 5000 и Radeon RX 6000 были достаточно продвинутыми и производительными для того, чтобы конкурировать с GeForce RTX 20 и GeForce RTX 30, при том, что трассировка лучей в те времена еще не была столь важной, а вот серия Radeon RX 7000 (RDNA 3) уже явно отставала от GeForce RTX 40 и по производительности и по возможностям. Так что в RDNA 4 требовалось повысить конкурентоспособность новой серии, улучшив положение компании на рынке.
Наверняка не все согласны с тем, что видеокарты по цене в $600 уже не считаются флагманскими решениями для энтузиастов, это сейчас скорее высокий средний уровень. А всё, что дешевле $300, вообще называется бюджетными решениями. Всё вокруг дорожает, видеокарты не исключение, и они стали намного дороже за последнее годы, как и всё остальное. Мало того, розничные цены в магазинах еще выше — рекомендованные цены для GPU среднего и высокого уровня не выдерживаются. А, учитывая то, что случилось с Intel Arc B580, можно предположить, что и сравнительно недорогие видеокарты также могут столкнуться с проблемами недостаточного предложения и завышенных цен — новые видеокарты Intel купить не так просто, и уж тем более — по рекомендованной цене. Сейчас только модели типа GeForce RTX 4060 и Radeon RX 7600 доступны по близким к рекомендованным розничным ценам, а всё более мощное продается дороже.
С доступностью видеокарт есть явные проблемы у всех производителей, немногочисленные поставки быстро распродаются, а имеющееся в продаже сильно переоценено. Причем, если раньше AMD сталкивалась с трудностями при переходе на новые графические процессоры из-за того, что предыдущее поколение еще долго оставалось на рынке, то теперь и решения серии Radeon RX 7000 во многом исчезли из продажи еще в декабре и январе, за исключением моделей нижнего уровня Radeon RX 7600 (XT), которые массово продаются по близким к рекомендованным ценам. Виноваты в ситуации и меньшие объемы выпуска новых решений и рост спроса на производительные решения — GeForce RTX 5090 так вообще сразу распродаются, как горячие пирожки, да еще и по значительно более высоким ценам, по сравнению с заявленной MSRP.
У остальных моделей дела получше, но тоже есть проблемы, как и у Radeon RX 9070 XT с Radeon RX 9070 — накопившийся спрос явно превышает предложение, и требуется еще много недель на исправление ситуации. В ближайшем же будущем можно ожидать продолжения недостаточности поставок и стабильно завышенных цен. И хотя AMD не продает так же много решений для высокопроизводительных вычислений, как Nvidia, часть ее ограниченного объема производства на TSMC, вероятно, также занята CPU и GPU, предназначенными для центров обработки данных — игроки не являются приоритетом ни для Nvidia ни для AMD, и рынок игровых видеокарт получает лишь то, что остается после ИИ и остальных вычислений. Эта отрасль стремительно растет, и игровые GPU сейчас являются менее приоритетными для всех производителей. Даже Ryzen 7 9800X3D принесет AMD больше денег, чем графический процессор для Radeon RX 9070 XT, а есть еще чипы для центров обработки данных: MI300X и MI350X, которые стоят значительно дороже игровых GPU. Но если компания хочет увеличить долю на рынке игровых решений, то им придется пожертвовать частью прибыли, увеличив выпуск игровых GPU.
Но хватит о плохом, давайте рассмотрим новинку во всех подробностях. Так как основой рассматриваемой сегодня модели видеокарты является новый графический процессор Navi 48 из высокопроизводительного рыночного сегмента, базирующийся на архитектуре RDNA четвертого поколения, которая тесно связана с архитектурами RDNA предыдущих версий, то перед прочтением статьи будет полезно ознакомиться и с нашими предыдущими материалами по видеокартам компании AMD:
- [30.01.23] AMD Radeon RX 7900 XTX: на основе карты Sapphire Radeon RX 7900 XTX
- [24.01.23] AMD Radeon RX 7900 XT: на основе карты XFX Radeon RX 7900 XT
- [21.11.20] AMD Radeon RX 6800 XT: компании AMD удается догнать флагманские решения конкурента, но не во всем

Графический ускоритель Radeon RX 9070 XT | |
---|---|
Кодовое имя чипа | Navi 48 |
Технология производства | 5 нм ( N4P TSMC) |
Количество транзисторов | 53,9 млрд |
Площадь ядра | 357 мм² |
Архитектура | унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др. |
Аппаратная поддержка DirectX | DirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2 |
Шина памяти | 256-битная: 4 независимых 64-битных контроллера памяти с поддержкой GDDR6 |
Частота графического процессора | до 2970 МГц |
Вычислительные блоки | 64 вычислительных блока CU, состоящих в целом из 4096 ALU для целочисленных расчетов и расчетов с плавающей запятой (поддерживаются форматы INT4, INT8, INT16, FP16, FP32 и FP64) |
Блоки трассировки лучей | 64 блока Ray Accelerator для расчета пересечения лучей с треугольниками и ограничивающими объемами BVH |
Блоки текстурирования | 256 блоков текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов |
Блоки растровых операций (ROP) | 16 широких блоков ROP на 128 пикселей с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра |
Поддержка мониторов | поддержка интерфейсов HDMI 2.1b и DisplayPort 2.1a |
Спецификации видеокарты Radeon RX 9070 XT | |
---|---|
Частота ядра (игровая/турбо) | 2400/2970 МГц |
Количество универсальных процессоров | 4096 |
Количество текстурных блоков | 256 |
Количество блоков блендинга | 128 |
Эффективная частота памяти | 20 ГГц |
Тип памяти | GDDR6 |
Шина памяти | 256 бит |
Объем памяти | 16 ГБ |
Пропускная способность памяти | 640 ГБ/с |
Вычислительная производительность (FP32) | до 48,7 терафлопс |
Теоретическая максимальная скорость закраски | 380 гигапикселей/с |
Теоретическая скорость выборки текстур | 760 гигатекселей/с |
Шина | PCI Express 5.0 x16 |
Разъемы | один HDMI 2.1b, три DisplayPort 2.1a |
Энергопотребление | до 304 Вт |
Дополнительное питание | два 8-контактных разъема |
Число слотов, занимаемых в системном корпусе | 2 |
Рекомендованная цена | $599 |
С серии Radeon RX 9000 компания решила изменить систему наименований, так как старая перестала соответствовать реальному положению дел. Если раньше Radeon RX 6800 XT была прямым соперником GeForce RTX 3080, то Radeon RX 7800 XT уже стал заметно медленнее GeForce RTX 4080 и даже уступал GeForce RTX 4070 Ti, да и серия Radeon RX 7900 не конкурировала с GeForce RTX 4090 даже близко — для решения этой странности (причиной которой была сама компания, впрочем) в AMD решили изменить наименование игровой линейки. Серию Radeon RX 8000 пропустили, чтобы быть на равных с CPU, и пока что выпустили лишь два продукта — Radeon RX 9070 XT и Radeon RX 9070, приблизив схему наименований к тому, что применяет Nvidia. И новое название рассматриваемой сегодня видеокарты говорит о том, что это решение уровня GeForce RTX 5070 и GeForce RTX 5070 Ti, хотя цена модели Radeon RX 9070 XT располагается между ними.
Соответственно, рассматриваемое сегодня решение превосходит GeForce RTX 5070 по цене и производительности, и приближается к GeForce RTX 5070 Ti, которая заметно дороже — $750 (пока что мы говорим исключительно о рекомендованных ценах). Любопытно также и то, что в серии Radeon RX 9000 вообще не будет решений для энтузиастов уровня GeForce RTX 5080 и выше, пока что в ней вообще есть еще только Radeon RX 9070 на основе этого же GPU, но в урезанном варианте — обзор этой видеокарты также вскоре выйдет у нас на сайте. Вероятно, на основе еще более урезанного по блокам (да и ширине шины памяти, наверняка) чипа Navi 48 будет сделана и еще не анонсированная модель Radeon RX 9060 XT.
Цена же Radeon RX 9070 XT начинается с $599, но это привычное по последним временам лукавство, по такой цене видеокарту можно было купить при должной удаче и сноровке только в западных магазинах на самом начале продаж, которые начались 6 марта, но ведь AMD сдвинула их начало с января на март якобы чтобы добиться лучшей доступности на рынке, что не очень хорошо получилось в итоге. Учитывая текущие условия, вообще не сильно важно, какую цену кто указывает в качестве рекомендованной розничной цены — по крайней мере, в краткосрочной перспективе, реальные всегда будут выше, а все карты первых партий быстро распродаются. В первые месяцы новых карт просто не хватает для удовлетворения спроса, во что обязательно вмешиваются спекулянты со своими наценками. Это можно было бы назвать повторением дефицита во время криптовалютного майнинга на GPU, но сейчас он несколько мягче и связан скорее с развитием ИИ-технологий.
Исходя из ширины шины видеопамяти в 256 бит, выбор ее объема у AMD был между 16 и 32 ГБ, и так как компания много говорит о важности большого объема видеопамяти для современных игр, то можно было предположить, что на быстрейшее решение новой линейки поставят уже 32 ГБ, так как предыдущий флагман уже снабжался 24 ГБ памяти. Но нет, так как Radeon RX 9070 XT отличается сравнительно низкой (в теории, по крайней мере) ценой, то AMD решила ограничиться объемом 16 ГБ. И это действительно оптимальное значение на сейчас, установка 32 ГБ обошлась бы куда дороже, и AMD логично решила ограничиться меньшим значением. Хотя многие считают, что объем видеопамяти является важным конкурентным преимуществом карт Radeon, и нужно было ставить больше памяти, прямо сейчас 32 ГБ не дали бы вообще никакого прироста, а ориентироваться на гипотетические игры будущего, которые выйдут лет через пять, было бы довольно странно.
В этот раз AMD решила не выпускать на рынок собственные варианты видеокарт серии Radeon RX 9070 (XT). То, что показано у них на слайдах — всего лишь графические изображения видеокарт самой AMD, и они действительно существуют в физическом воплощении, но лишь внутри компании. А на рынке таких продуктов именно производства AMD нет — все видеокарты серии Radeon RX 9070 будут производиться партнерами компании. Они получили очень разные тактовые частоты и уровни энергопотребления, а также системы охлаждения. Все видеокарты имеют разъем PCIe 5.0 x16, а стандартные варианты потребляют до 304 Вт энергии — это меньше, чем у предыдущего флагмана, но варианты производителей отличаются в том числе бо́льшим уровнем потребления.

Партнеры AMD сразу выпустили большое количество моделей с собственными дизайном, размерами, подсветкой и системами охлаждения, многие из них еще и фабрично разогнаны и имеют повышенные уровни энергопотребления и производительности. Многие производители выставили собственные рекомендованные цены на улучшенные Radeon RX 9070 XT, которые оказались куда выше $600 — эти решения имеют официальные рекомендованные цены порядка $750-$800, к которым нужно еще добавить пошлины, так что сейчас в эту игру с низкими рекомендованными ценами играют все — и Nvidia, и AMD, и Intel. Редкие модели Radeon RX 9070 XT изначально были доступны по $600, но в крайне ограниченных количествах, а остальные поставки уже идут по более высоким ценам.
Вполне вероятно, что AMD требует, чтобы у производителей в ассортименте была модель с заявленной ими рекомендованной розничной ценой, но не более того. Заставить их продавать по такой цене всё они не могут. Так как этих видеокарт мало производят и быстро продают, то у пользователя не остается других вариантов, кроме как купить разогнанную модель, которая на пару сотен долларов дороже. Так было с видеокартами Nvidia, ровно так же получилось и тут. Со временем, если предложение удовлетворит спрос, можно будет быстро снизить цены и на эти специальные варианты, но пока что все компании предпочитают получать дополнительную прибыль из-за недостаточного объема производства новинок.
Особенности архитектуры RDNA 4
Обе новые видеокарты серии Radeon RX 9000, которые выпустила AMD, основаны на чипе Navi 48 — он стал самым крупным GPU этого поколения, большего по сложности графического процессора компания выпускать не планирует. Модели Radeon RX 9070 XT и Radeon RX 9070 основаны на этом кристалле и разница лишь в том, что в первой применяется полная версия Navi 48, а вторая довольствуется урезанной по количеству блоков модификацией.
Одним из наиболее интересных изменений высокого уровня в новых графических процессорах стало то, что AMD отказалась от чиплетной организации GPU в случае Navi 48 и младшего Navi 44, который ожидается позднее. Navi 48, в отличие от Navi 31 и Navi 32, это обычный монолитный кристалл площадью 356,5 мм², содержащий впечатляющее количество транзисторов в 53,9 млрд., изготовленный тайваньской TSMC, а GPU из нескольких отдельных кристаллов с графикой и контроллерами памяти, как было в RDNA 3, в этом поколении не будет. Вероятно, таким образом AMD признает тот свой эксперимент не самым удачным — по крайней мере, на данный момент времени.

Кроме этого, AMD также перешли на улучшенный техпроцесс TSMC — с N5 на N4P, который обеспечивает небольшое увеличение производительности и эффективности по сравнению с N4 — улучшенным по отношению к базовому техпроцессу N5. Не очень понятно, насколько N4P сравним с 4N и 4NP — специализированными вариантами аналогичного техпроцесса для Nvidia, но есть предположение, что они довольно похожи друг на друга, так что тут особого преимущества ни у кого из конкурентов быть не должно.
Новый GPU по большинству базовых характеристик похож на Navi 32, но содержит заметно больше транзисторов — почти как Navi 31. Предыдущий топовый чип, на котором основан прошлый флагман Radeon RX 7900 XTX, имеет лишь на 8% больше транзисторов (57,8 млрд), несмотря на наличие в полтора раза большего количества блоков CU, больший кэш Infinity Cache и 384-битную шину памяти. При этом общая площадь кристалла Navi 31 составляет 529 мм², так что AMD очень сильно улучшила плотность размещения транзисторов в новом GPU. Из-за отказа от чиплетной организации и перехода на лучший техпроцесс, Navi 48 более чем на треть меньше топового чипа предыдущего семейства по площади, так как у последнего только основной кристалл производился по схожему 5 нм техпроцессу, а чиплеты с контроллерами памяти и кэшем использовали менее продвинутое полупроводниковое производство.
Один только чиплет GCD в Navi 32 в версии для Radeon RX 7800 XT с 60 CU-блоками был размером 200 мм², а все кристаллы вместе занимали 346 мм². Navi 48 при этом имеет схожую площадь 357 мм², и в конкурентах у него GB205 (GeForce RTX 5070) на 263 мм² и урезанный GB203 (GeForce RTX 5070 Ti) на 378 мм², что также совсем немногим больше. При том, что транзисторов в Navi 48 содержится аж 53,9 млрд, против 31,1 у GB205 и 45,6 у GB203, а по производительности Radeon RX 9070 XT находится скорее между GeForce RTX 5070 или 5070 Ti. Но еще раз отметим, что плотность размещения транзисторов у Navi 48 впечатляет, AMD с TSMC и их N4P смогли заметно обойти Nvidia, продукты которых используют специализированную версию 4N техпроцесса — хотя они оба 5 нм, но первый обеспечивает чуть лучшие характеристики.

Можно предположить, что серия Radeon RX 9070 должна быть довольно выгодной для AMD, так как размер кристалла Navi 48 аналогичен размеру кристалла Navi 32 в Radeon RX 7800 XT, и подсистема памяти приблизительно такая же. Но по скорости AMD сравнивает новинку даже не только с Radeon RX 7900 XT, но с и флагманским XTX. Хотя Radeon RX 9070 XT имеет меньше всего, чем Radeon RX 7900 XT: на 24% меньше вычислительных ядер, на 33% меньший кристалл, на 20% меньше кэш-памяти, объема и пропускной способности памяти, все равно ожидается, что новинка обеспечит как минимум ту же производительность — во многом благодаря архитектурным улучшениям, к рассмотрению которых мы и переходим.
Естественно, что обновленная архитектура RDNA 4 является в очередной раз измененной и доработанной архитектурой AMD, известной уже несколько поколений, но в ней появилось больше изменений, чем мы видели в предыдущих обновлениях. По своему общему строению решения RDNA 4 в виде единственного пока Navi 48 не особенно отличаются от RDNA 3, чип состоит из четырех шейдерных движков Shader Engine, в каждом из них есть по восемь процессоров, содержащих по два вычислительных блока Compute Unit (CU). В итоге это 64 укрупненных вычислительных блоков Compute Unit (CU), которые состоят из 4096 потоковых процессоров, что очень похоже по структуре на решения RDNA 3.

Всего Navi 48 содержит 4096 потоковых процессоров, 128 ИИ-ускорителей, 64 RT-ускорителей, 256 блоков TMU и 128 блоков ROP. Новый графический процессор с такими характеристиками и 256-битной шиной очень похож на условный Radeon RX 7800 XT, но AMD противопоставляет новый GPU скорее флагманскому Navi 31, который содержит в полтора раза больше потоковых вычислительных ядер — видимо, из-за многочисленных архитектурных улучшений и повышенной тактовой частоты новых решений. В новом флагмане линейки GPU работает на игровой частоте 2400 МГц, а турбо-частота доходит почти до 3 ГГц — 2970 МГц, если точнее.
В основе архитектуры RDNA 4 лежит улучшенный вычислительный блок CU с существенными улучшениями по эффективности, подсистеме памяти, динамическом распределении регистров и т. д. Каждый блок CU имеет два блока планировщика, управляющих регистровым файлом объемом 192 КБ, скалярным файлом регистров объемом 8 КБ, 32 блока FMA ALU, 32 блока FMA+INT ALU и 32 TLU для специальных функций. На схеме вычислительных блоков CU изменилось мало что, они имеют по два векторных блока SIMD32 для большего параллелизма, умеют выполнять две 32-битные векторные операции, а матричные блоки поддерживают FP16-вычисления с удвоенной производительностью. Скалярный блок поддерживает операции Float32, также была улучшена предвыборка инструкций.

Векторные и скалярные блоки имеют регистровые файлы объемом в 192 КБ и 8 КБ, кэш разделен на 16 КБ для скалярных блоков и 32 КБ для инструкций, есть и разделяемая память объемом в 128 КБ. В чипе есть также и 8 МБ L2-кэша, а в дополнение к нему кэш Infinity Cache объемом 64 МБ, но по нему ни о каких изменениях явно не было заявлено. Планировщик инструкций вычислительного блока поддерживает внеочередное исполнение инструкций, получил улучшенную предвыборку инструкций, появилось динамическое выделение регистров для шейдерных программ — они могут запрашивать и освобождать данные динамически, что позволяет улучшить эффективность использования регистрового файла.

Производительность растеризации, даже по данным самой AMD, улучшилась меньше всего, но это все равно до +40% к скорости RDNA 3 — по сравнению с удвоенной производительностью трассировки и даже еще большего ускорения ИИ-вычислений это кажется не слишком большим улучшением. Но особых деталей об улучшениях по растеризационной части нам дали не слишком много — да, RDNA 4 получила возможность запрашивать данные из памяти вне очереди, что AMD выделяет особенно как полезную для трассировки лучей функцию, это может помочь и при растеризации. Еще одно важное изменение — появление динамического выделения регистров, на что не были способны RDNA 3 и более ранние GPU, оно также может дать какой-то прирост, но неизвестно насколько заметный в реальном ПО.
Ускорение нейросетей
Куда важнее другие изменения в блоках CU — например, в четвертом поколении RDNA появились свои «тензорные ядра» и у AMD, они назвали их ИИ-ускорителями (AI Accelerators). Для этого специалисты компании перенесли часть аппаратных возможностей из вычислительной архитектуры CDNA 3 в RDNA 4. Теперь каждый блок CU может выполнить 512 операций с точностью FP16 без учета разреженности за такт, или 1024 операций INT4. ИИ-ускорителями также поддерживается структурированная разреженность матриц 4:2, которая позволяет удалять лишние данные и обрабатывать меньше данных в целом. Разреженность может пропускать до половины операций с перемножением на ноль, что потенциально удваивает производительность — эту функцию поддерживают графические процессоры Nvidia с серии GeForce RTX 30 и вычислительные чипы AMD семейства CDNA.

Базовая производительность для формата вычислений FP16 была увеличена в RDNA 4 вдвое, для разреженных матриц возможно еще одно удвоение и еще одно в случае использования формата FP8, который часто используют в ИИ-нагрузках — это уже до восьми раз большая производительность, по сравнению с RDNA 3. В результате получается до 389 TFLOPS вычислений FP16 (с учетом разреженности) и до 1557 TOPS вычислений с точностью INT4 и также с учетом разреженности.
AMD приводит пример того, как это сказывается на производительности при использовании нейросети Stable Diffusion XL, в которой Radeon RX 9070 XT сравнивалась с Radeon RX 7900 XT. По вычислительным блокам новинка отстает от более старого решения более чем на 30%, но Radeon RX 9070 XT показывает почти двукратную производительность от Radeon RX 7900 XT, так что этот прирост будет весьма полезен для всех задач ИИ и машинного обучения, включая масштабирование FSR 4. В других реальных задачах разница поменьше, конечно, но тоже немалая:

К слову, вскоре в шейдерах DirectX должна появиться поддержка кооперативных векторов (Cooperative Vectors), необходимая для нейронного рендеринга. Это новая функция, которая появится в Shader Model 6.9, по сути это аппаратное ускорение векторных и матричных операций при помощи аппаратных блоков — тензорных ядер у Nvidia, XMX-блоков у Intel и т. д. Она нужна для эффективной интеграции нейронного рендеринга в существующие графические конвейеры. Мы уже много писали о возможностях нейрорендеринга на примере предложений Nvidia GeForce, эту функциональность можно использовать для нейронного текстурного сжатия, что может значительно сократить использование видеопамяти при небольших потерях качества, улучшения качества рендеринга при трассировке пути при помощи умного шумоподавления, кэширования данных глобального освещения и даже полной генерации некоторых участков изображения при помощи ИИ — например, реалистичные человеческие лица.
Nvidia Neural Shading SDK будет поддерживать эти возможности, да и остальные производители наверняка присоединятся к этому многообещающему начинанию, благо, что аппаратные блоки для ускорения векторных и матричных операций есть теперь у всех производителей GPU. Хотя AMD не уточняла в подробностях, но решения архитектуры RDNA 4 должны иметь совместимость с будущим нейронного рендеринга в DirectX — этими самыми Cooperative Vectors, когда Microsoft окончательно стандартизирует нейронные шейдеры и возможность приложений использовать ИИ-ускорители, и они будут добавлены в графический API, то новые решения AMD также смогут реализовать эти возможности.
Улучшенная трассировка лучей
Не менее важные улучшения получили вычислительные блоки RDNA 4 и в плане аппаратной трассировки лучей. По данным AMD, специализированные блоки Ray Accelerator на 240% быстрее аналогичных ядер RDNA 2 — из-за многочисленных улучшений. Блоки аппаратной трассировки лучей получили удвоенную скорость тестирования пересечений луча с ограничивающими объемами и треугольниками — каждый ускоритель умеет обрабатывать их ровно вдвое больше. Если RDNA 3 умели тестировать за такт по четыре пересечения с боксом и лишь один с треугольником, то теперь эти значения выросли до 8 и 2. Хотя возможности RT-блоков в последних решениях Intel и Nvidia все равно больше — например, у Blackwell скорость по пересечениям с треугольником вдвое выше.

Есть и другие улучшения в Ray Accelerator: использование структуры BVH8 вместо BVH4 увеличивает производительность и снижает использование видеопамяти, объем структур BVH уменьшается. Новые RT-ядра поддерживают аппаратную трансформацию копий объектов (instance), что позволяет их копировать для сцены без дублирования в памяти, обрабатывая несколько образцов как один. В RDNA 4 также был изменен порядок операций при трассировке и обращения к памяти, шейдеры запрашивают данные из кэша без строгой очередности для улучшения общей эффективности, так как попадания и промахи в кэше меньше мешают друг другу. Но эти улучшения лишь немного повысили производительность ускорителей трассировки, а основной прирост дает удвоение производительности аппаратных движков пересечений:

Еще из совсем нового в аппаратной трассировке на RDNA 4 можно отметить новый вид BVH-структур в виде ориентированных ограничивающих объемов (Oriented Bounding Boxes — OBB), которые могут быть ориентированы не по глобальным осям сцены, а по оси объектов. Таким образом улучшается эффективность обхода BVH, что дает прирост скорости в 10% по данным AMD. Обычно используют ограничивающие объемы, расположенные в пространстве по глобальным осям сцены, но чаще всего геометрия объектов имеет другую форму, которая не очень хорошо вписывается в них — это приводит к лишней трате ресурсов при тестировании лучей. AMD предлагает вариант ориентированных по оси объекта ограничивающих объемов, чтобы ориентировать их ближе к форме объекта — это сокращает количество лучей, необходимых для расчетов. Изменение ориентации ограничивающих примитивов относительно оси объектов позволит снизить количество итераций при поиске пересечений.

Перечисленные улучшения повысили производительность RDNA 4 в трассировке и видеокарты AMD теперь уже не теряют слишком много производительности даже при сложной трассировке пути. Трассировка лучей на Radeon стала заметно лучше, чем в предыдущих поколениях RDNA, но конкуренты за эти годы ушли вперед. AMD постепенно улучшает характеристики своих RT-ядер, но и делает это не слишком оперативно. Некоторые новые возможности в RDNA 4 поддерживались еще в решениях архитектуры Turing главного конкурента, а некоторые до сих пор не получили аппаратной поддержки в Radeon. Например, аппаратная трансформация instance была в Turing, как и аппаратный обход BVH, которого так и нет в RDNA 4, по некоторым данным. Так что AMD хоть и приближается к Nvidia по производительности блоков трассировки лучей, но делает это уж слишком медленно — GeForce до сих пор лучше в этом деле. Но у AMD есть возможности быстро улучшить их GPU именно для сложных случаев типа трассировки пути, так как более простая трассировка не предъявляет особых требований к RT-блокам по их производительности. Пока обход дерева BVH в решениях AMD производится программно на обычных вычислительных SIMD-блоках, они проигрывают именно в тяжелых случаях трассировки, когда есть много расхождений лучей. При трассировке лучей для рассеянных отражений или глобального освещения лучи летят в разные стороны и сразу всему блоку SIMD нужно ждать завершения расчетов самых медленных лучей. Пока что даже в RDNA 4 не сделан полностью аппаратный обход, поэтому Radeon отстают в играх с трассировкой пути, а ведь он есть уже не только у Nvidia, но у Intel, Apple и даже в мобильных GPU.
Еще есть дополнительные функции, которые Nvidia давно продвигает, а та же AMD продолжает отставать от них и других производителей GPU по возможностям аппаратных блоков трассировки лучей. В частности, вскоре выйдет обновление DirectX Raytracing версии 1.2 с некоторыми важными улучшениями, направленными на увеличение производительности и эффективности. В частности это микрокарты непрозрачности (opacity micromaps — OMM) и переупорядочение выполнения шейдеров (shader execution reordering — SER) — динамическую группировку потоков инструкций для повышения когерентности обращений к памяти, что способно значительно повышать производительность при сложной трассировке, вроде трассировки пути. Они обеспечивают заметное повышение производительности при трассировке лучей в определенных условиях.
Микрокарты непрозрачности поддерживаются многими решениями Nvidia, они оптимизируют трассировку полупрозрачной геометрии, сокращая количество вызовов шейдеров, что дает улучшение производительности без потери качества. Переупорядочение выполнения шейдеров поддерживается чипами Nvidia и Intel и также обеспечивает повышение производительности рендеринга за счет интеллектуальной группировки выполнения шейдеров до двух раз в некоторых случаях. Пока что только графические процессоры Nvidia полностью поддерживают эти возможности, у Intel вроде бы есть SER и они планируют внедрить OMM в будущем, а вот по поводу уже вышедших решений AMD Radeon не очень понятно, будут ли они аппаратно поддерживать DXR 1.2. Зато в RDNA 4 есть функциональность Out of Order Memory, которая изменяет порядок получения данных из памяти, делая их независимым от очередности запросов.

Трассировка лучей и ускорение матричных операций чувствительны к скорости и задержкам памяти, поэтому AMD решила внести некоторые изменения и в систему управления памятью, внедрив внеочередную память — Out-of-Order Memory Queuing. Так как математические операции выполняются волнами (waves), то взаимные зависимости между этими волнами иногда приводят к пропуску запросов, так как очередь запросов памяти из одной волны ждет окончания работы другой волны. Это можно исправить при помощи внеочередного управления памятью, которое повышает в том числе и эффективность трассировки лучей. И скоро мы узнаем, как все улучшения и изменения на нее повлияли.
Другие архитектурные изменения
Кроме этого, в RDNA 4 была переработана часть иерархии кэша и памяти — тут снова обошлось без особых подробностей, но что-то они всё же сделали в Infinity Cache, раз он стал «третьего поколения», хотя его емкость всё так же составляет 64 МБ, как было в Radeon RX 7900 GRE и Radeon RX 7800 XT. Единственный явный плюс по сравнению с предыдущим поколением в том, что теперь кэш снова размещен на том же кристалле, что и остальные блоки, в отличие от чиплетов RDNA 3, и это должно обеспечивать меньшие задержки и более высокую пропускную способность кэша.
А вот что не изменилось в RDNA 4, так это тип и скорость памяти. Nvidia использовала в прошлом поколении GDDR6X (но она была эксклюзивом для них), в GeForce RTX 50 перешла уже на GDDR7-память, а AMD продолжает использовать GDDR6-память со скоростью 20 Гбит/с. В сочетании с 256-битной шиной памяти это дает пропускную способность в 640 ГБ/с, что уже меньше, чем у конкурентов — даже у GeForce RTX 5070 этот показатель выше — 672 ГБ/с, не говоря уже о 896 ГБ/с для GeForce RTX 5070 Ti. Но у графических процессоров AMD есть большой Infinity Cache кэш, повышающий эффективную пропускную способность памяти, и его столько же, что и в Radeon RX 7900 GRE и Radeon RX 7800 XT — 64 МБ. Возможно, именно он делает переход на GDDR7-память не столь критичным для Radeon, но нужно учитывать, что один из конкурентов Radeon RX 9070 XT имеет на 40% более высокую ПСП именно из-за более скоростной памяти (28 Гбит/с против 20 Гбит/с). Кроме этого, в GeForce RTX 5070 Ti есть кэш-память второго уровня тоже немалого объема — 48 МБ.
Уже первые решения RDNA 4 получили поддержку внешнего интерфейса PCIe 5.0, удваивающего пропускную способность по сравнению с более привычной версией 4.0. На практике даже в самых сложных нагрузках сложно заметить разницу, видимую лишь в синтетических тестах и некоторых ИИ-нагрузках. В играх же даже PCIe 3.0 при полной ширине разъема в x16 будет достаточно в большинстве случаев, но поддержка 5.0 позволит выпустить бюджетные чипы со сниженным количеством линий — до x8 точно, а может и до x4.
Нам осталось поговорить о движках обработки видеоданных и вывода данных. Новый движок вывода информации на дисплеи в Navi 48 получил долгожданные аппаратные обновления, снижающие энергопотребление в режиме простоя в многомониторных конфигурациях, также внедрена аппаратная очередь кадров, снижающая нагрузку на процессор и повышающая энергоэффективность, а планирование кадров улучшает синхронизацию. Есть в движке и возможность для аппаратного повышения резкости изображения — Radeon Image Sharpening (RIS), получившая вторую версию — это повышение резкости картинки на уровне драйвера, использующее разработки алгоритма CAS (Contrast Aware Sharpening).

Что касается возможностей именно вывода на дисплеи, то это современные разъемы DisplayPort 2.1a и HDMI 2.1b с максимальным битрейтом UHBR 13.5, что вдвое больше, чем у DisplayPort 1.4. Поддержка пропускной способности 54 Гбит/с (UHBR 13.5) означает возможность подключения 4K-дисплея одним кабелем — с частотой обновления до 240 Гц без использования сжатия видеопотока, а со сжатием Display Stream Compression можно использовать 4K при 480 Гц или 8K при 165 Гц. Но если в прошлом поколении у Radeon было преимущество перед аналогичными решениями Nvidia, ограниченными возможностями DisplayPort 1.4a, то теперь его нет. Более того, новые решения серии GeForce RTX 50 поддерживают версию DisplayPort 2.1b с пропускной способностью до 80 Гбит/с (UHBR 20) с лучшими характеристиками по выводу информации. Но это в теории, а в реальности отличие не дает особых преимуществ из-за крайней редкости мониторов с поддержкой таких возможностей.

В чипе Navi 48 есть два медиадвижка для работы с видеоданными (кодирования и декодирования), в этом они схожи с конкурентами Nvidia, имеющими по два блока NVEnc и NVDec. Новый медиадвижок AMD обеспечивает улучшение качества кодирования форматов H.264 и H.265 с низкими задержками, а при кодировании AV1 теперь поддерживаются B-кадры, что повышает эффективность при том же битрейте. AMD говорит, что качество кодирования H.264 (AVC) было увеличено до 25%, а H.265 (HEVC) — на 11%, и это хорошо, так как по качеству кодирования видео AMD до сих пор отставала от Intel и Nvidia, чьи решения дают близкое качество картинки, превосходящее предыдущие Radeon. Если говорить о производительности, то медиадвижок показывает на 50% более высокую скорость кодирования AV1 и VP9 по сравнению с предшественником при сокращенном использовании видеопамяти.
FSR 4 и программные технологии
В серии RDNA 4 и Radeon RX 9070 (XT) появилась поддержка новой версии технологии FidelityFX Super Resolution 4 (FSR 4) — она получила крупнейшее обновление со времен FSR 2, в этой версии появился новый метод масштабирования кадров на основе нейросетей, и FSR 4 технологически приблизился к DLSS 3. Новые графические процессоры также могут использовать ИИ-ускорители для шумоподавления при трассировке лучей и пути, а вот технология генерации дополнительных кадров была перенесена из FSR 3, похоже, и есть ли в ней какие-то улучшения — неизвестно.

FSR 4 будет существовать одновременно с FSR 3.1, и режим масштабирования без использования ИИ также останется. Пока что не очень понятно, как это будет работать, просто во всех играх с поддержкой FSR 3.1 можно будет использовать и более продвинутый алгоритм. FSR 4 же это не только масштабирование, алгоритм поддерживает и генерацию дополнительных кадров — также с участием ИИ-ускорителей в графических процессорах новой серии. AMD говорит о поддержке FSR 4 более чем в 30 играх на запуске серии Radeon RX 9070, а всего в этом году выйдет более 75 таких игр. Во многие игры поддержку добавили при помощи патчей, а в будущем выйдут и проекты с родной поддержкой новой технологии.

Новая версия FSR использует искусственный интеллект в работе и способна задействовать такие преимущества архитектуры, как FP8-вычисления с увеличенным темпом на ИИ-ускорителях. Модели переобучили, они работают быстрее и с лучшим качеством, а нового в FSR 4 то, что это уже не просто технология повышения разрешения, использующая информацию из предыдущих кадров, но работающая на основе нейросети. К сожалению, это же ограничивает применение FSR 4 — в теории и старшие решения могут поддерживать новую технологию, но нужна определенная производительность, гарантированно доступная на RDNA 4 из-за удвоения темпа FP8-вычислений. AMD говорит о том, что для работы FSR 4 нужна матричная производительность от 779 AI TOPS, и у Radeon RX 9070 XT с этим всё в порядке, но из-за этих требований пропало преимущество версии FSR 3, работающей на всех решениях AMD и даже на графических процессорах конкурентов. Новый же вариант ИИ-масштабирования работает пока исключительно на видеокартах архитектуры RDNA 4.

Вопрос качества FSR 4 в сравнении с DLSS требует отдельного тщательного рассмотрения, но что уже точно можно сказать по примерам самой AMD — качество картинки заметно увеличилось, FSR 4 отрисовывает многие детали даже более четко, чем рендеринг в родном разрешении. Это как минимум уровень DLSS 3, а местами новая технология AMD даже опередила своего конкурента... который еще чуть раньше выкатил DLSS 4 с дальнейшими улучшениями и поэтому снова ушел вперед, даже если не говорить о многокадровой генерации, а просто о качестве изображения, доступном на всей линейке GeForce RTX.
Улучшились и многие другие программные и программно-аппаратные инструменты. Под маркой Hypr-RX привычно собраны все решения по увеличению производительности: FSR, Radeon Anti-Lag, Radeon Boost и AMD Fluid Motion Frames (AFMF) — последний был улучшен и также предлагает более четкое изображение. FMF 2.1 обеспечивает улучшенное качество изображения и меньшие артефакты в виде ореолов, а инструмент повышения резкости изображения Radeon Image Sharpening был обновлен до второй версии. Функции повышения производительности Hypr-RX, работающие на уровне драйвера, могут быть полезными в некоторых случаях GPU недостаточной производительности, но вряд ли это справедливо для довольно мощных Radeon RX 9070 XT.

Что касается остальных программных улучшений, то можно отметить удобное приложение драйвера «AMD Software», в котором есть способ сообщения об ошибках и артефактах в играх — AMD Image Inspector, также представлен локальный чат-бот, работающий на ИИ-ускорителях — AMD Chat, утилиты потокового вещания для стримеров, удобное средство для запуска игр, аппаратное ускорение шумопонижения AMD Noise Suppression и многое другое.

AMD Chat — это чат-бот, специализирующийся на ответах на вопросы об оборудовании вашей системы, его можно спросить об условиях работы графического процессора, производительности и другом. Но стоит ли ради этого загружать 25 ГБ данных, если вы не планируете часто общаться с вашим ПК? Функция AI Apps Manager выдает список ПО, которые способны использовать ИИ-ускорители — из списка доступных для установки. Ну а Image Inspector помогает находить и сообщать об ошибках рендеринга и проблемах, связанных с GPU. Используя часть ресурсов GPU, эта функциональность может автоматически фиксировать ошибки рендеринга и отправлять их в AMD — любопытное нововведение и для самой компании это интересная возможность, но не очень понятно, как оно работает и будут ли этим пользоваться сами игроки.
Предварительная оценка производительности
Рассмотрим характеристики новой видеокарты AMD по сравнению с младшей моделью без индекса XT и близкими по позиционированию решениями из предыдущего поколения. По эффективной мощности Radeon RX 9070 XT близка сразу к Radeon RX 7900 XT и Radeon RX 7900 XTX, а по теоретическим характеристикам скорее ближе к Radeon RX 7900 GRE. По таблице как раз удобно прикинуть, насколько топовая модель нынешней линейки Radeon RX 9070 XT сопоставима с видеокартами прошлого поколения по пиковым характеристикам.
RX 9070 XT | RX 9070 | RX 7900 XTX | RX 7900 XT | RX 7900 GRE | |
---|---|---|---|---|---|
Модель GPU | Navi 48 | Navi 31 | |||
Техпроцесс | TSMC N4P | TSMC N5/N6 | |||
Площадь GPU, мм | 357 | 529 | |||
Блоки ALU | 4096 | 3584 | 6144 | 5376 | 5120 |
Блоки TMU | 256 | 224 | 384 | 336 | 320 |
Блоки ROP | 128 | 128 | 192 | 192 | 160 |
RT-ускорители | 64 | 56 | 96 | 84 | 80 |
ИИ-ускорители | 128 | 112 | - | - | - |
Кэш Infinity Cache, МБ | 64 | 96 | 80 | 64 | |
Турбо-частота, МГц | 2970 | 2520 | 2500 | 2400 | 2250 |
Объем памяти, ГБ | 16 | 24 | 20 | 16 | |
Скорость памяти, Гбит/с | 20 | 18 | |||
Шина памяти, бит | 256 | 384 | 320 | 256 | |
ПСП, ГБ/с | 640 | 960 | 800 | 576 | |
Энергопотребление, Вт | 304 | 220 | 355 | 300 | 260 |
Рекомендованная цена, $ | 600 | 550 | 1000 | 900 | 550 |
Видеокарта Radeon RX 9070 XT основана на полной версии кристалла Navi 48 и по своим характеристикам похожа на Radeon RX 7800 XT, но компания позиционирует ее для замены флагманской модели прошлого поколения — Radeon RX 7900 XTX. Чтобы добиться этого, по сравнению с этой видеокартой были значительно увеличены тактовые частоты новинки — и игровая и турбо, они составляют 2,40 ГГц и 2,97 ГГц, соответственно. Пиковая теоретическая производительность Radeon RX 7900 XTX с учетом частот всё еще на четверть выше, но это компенсируется улучшениями новой архитектуры, которая должна выгодно отличаться по эффективности.
Теоретически, Radeon RX 9070 XT имеет пиковую вычислительную скорость 48,7 TFLOPS для FP32-вычислений, и до 1557 TOPS для ИИ-ускорителей и формата INT4 (с разреженностью матриц). Предыдущее же флагманское решение Radeon RX 7900 XTX предлагает целых 61,4 TFLOPS для FP32, но лишь 123 TOPS для ИИ-вычислений в формате INT8. Так что не знаем пока про игры, но для ИИ-задач ситуация точно изменится. То же самое касается аппаратных блоков ускорения трассировки лучей — в RDNA 4 их производительность (скорость расчета пересечения лучей с треугольниками и лучей с ограничивающими объемами) по сравнению с RDNA 3 увеличилась вдвое, и 64 новых RT-блока в 9070 XT по производительности соответствуют не менее чем 128 RT-блокам RDNA 3 RT, но в Radeon 7900 XTX их лишь 96, так что даже без остальных архитектурных улучшений новый чип имеет на треть большую производительность при трассировке лучей. Но важны и другие характеристики, вроде пропускной способности и емкости памяти. Если Radeon RX 7900 XTX имеет 384-битную шину и 24 ГБ памяти, то у Radeon RX 9070 XT это 256-битный интерфейса и лишь 16 ГБ всё той же GDDR6-памяти с производительностью 20 Гбит/с, так что предыдущий флагман имеет в полтора раза большую пропускную способность и емкость памяти, что тоже может сказываться на итоговой производительности.
Но теоретические характеристики графических процессоров — это далеко не всё, что нужно принимать во внимание, на итоговую реальную производительность влияет и эффективность разных блоков и GPU в целом. Например, сравнительно новая видеокарта Intel Arc B580 имеет пиковые характеристики вроде вычислительной производительности хуже, чем было у предыдущего Arc A770 (14,6 TFLOPS против 19,7 TFLOPS), но в реальных тестах новый B580 более чем на 15% быстрее из-за решения проблем с низкой эффективностью использования имеющихся ресурсов. Но даже новые решения Intel всё еще уступают решениям AMD и Nvidia из предыдущих поколений, не говоря о новинках. В свою очередь, конкретно серия GeForce RTX 50 не слишком сильно улучшила эффективность и производительность по сравнению с предшествующей линейкой, а что получилось у Radeon RX 9000 мы скоро узнаем по собственным тестам.
А пока что посмотрим на данные AMD, по которым новая видеокарта Radeon RX 9070 XT получилась быстрее решения предыдущего поколения Radeon RX 7900 GRE в 11 играх с растеризацией и 9 играх с трассировкой лучей в среднем на 42% в 4K-разрешении и на 38% быстрее в 2560x1440. Если разделить эти показатели, то в растеризации будет 37% и 33% дополнительной производительности в 4K и 1440p, а в играх с трассировкой лучей это уже целых 53% и 49% в тех же разрешениях. Но это собственные подсчеты AMD, которые даны лишь для примерной прикидки. Чуть позже появилось и официальное сравнение и с конкурентом — по тестам компании, их новая Radeon RX 9070 XT уступает GeForce RTX 5070 Ti всего лишь 2%, а с трассировкой лучей AMD немного отстает.

Если верить этому сравнению, то Radeon RX 9070 XT и RDNA 4 — несомненный успех для AMD, они наконец-то смогли серьезно улучшить свою графическую архитектуру, устранив основные недостатки предыдущих — в RDNA 4 было усилено всё то, что требовало особого внимания, появились выделенные ИИ-ускорители и заметно ускорена аппаратная трассировка лучей. Почему этого пришлось ждать так долго — вопрос интересный. Вероятно, во времена RDNA 2 выход первых решений линейки GeForce RTX конкурента застал AMD врасплох, и они далеко не сразу смогли нагнать по функциональности своих соперников.
Зато теперь можно сказать, что AMD подтянулась к Nvidia по большому количеству параметров. В первую очередь по трассировке лучей — она всё еще отстает, но отрывы уже далеко не такие, как раньше. В новом GPU улучшена ИИ-производительность, что позволило внедрить поддержку FSR 4 — пусть в ней и нет многокадровой генерации, как у конкурента, но качество картинки было улучшено и в этом Radeon хоть и снова чуть-чуть не догнали GeForce, но разрыв также уменьшился. Это же касается и энергоэффективности — AMD подтянулась к Nvidia и по этому параметру, хотя решения последней продолжают быть лидерами, так как GeForce RTX 5070 Ti при полной нагрузке потребляет меньше энергии, чем Radeon RX 9070 XT.
Важно, что улучшения и новая функциональность хоть и привели к увеличению сложности GPU, но не площади кристалла — у AMD получилось удержать его во вменяемых рамках. Площадь Navi 48 равна 357 мм² — при том, что у Navi 31 один только основной кристалл имеет площадь в 300 мм². Если в RDNA 3 компания AMD упирала на то, что трассировка лучей и ИИ не очень нужны, то в RDNA 4 решили почти все основные моменты, связанные с отставанием от главного конкурента. Решения архитектуры RDNA 4 успешно конкурируют с Nvidia Blackwell и Intel Battlemage, хотя у последней пока что и нет видеокарт уровня Radeon RX 9070 (XT), да и у AMD еще не вышли менее дорогие и мощные GPU, но последнее уж точно вскоре произойдет.
Radeon RX 9070 XT действительно оказалась способна заменить Radeon RX 7900 XTX даже в играх без трассировки лучей. Пусть новинка и заметно медленнее теоретически, усовершенствования архитектуры позволили увеличить игровую производительность. В среднем, новый графический процессор условно среднего уровня даже обогнал предыдущего флагмана, но... сделать это же с тем же GeForce RTX 5070 Ti не смог. В играх с чистой растеризацией они близки, но включение трассировки дает преимущество решению Nvidia на 30%-60% в зависимости от сложности той самой трассировки. Да, теоретическая цена у Radeon RX 9070 XT ниже, чем у GeForce RTX 5070 Ti, но если вам важна производительность при трассировке (а сейчас она уже мало для кого совсем не важна), то выбор между Radeon RX 9070 XT и GeForce RTX 5070 Ti всё равно придется делать в пользу последней.
Технические улучшения RDNA 4 несомненны, но Radeon не стали функционально лучше GeForce. И если на новые решения Nvidia многие справедливо жалуются из-за невысокого прироста между поколениями, то у AMD дела хоть и лучше, но не слишком, ведь топовых решений в этом поколении AMD вообще не будет. Но самое главное, в чем Radeon RX 9070 XT потенциально лучше решений конкурента — это более выгодное соотношение цены и производительности. Если судить по рекомендованным ценам, то новинка AMD опережает и GeForce RTX 5070 и GeForce RTX 5070 Ti. Одна беда — на рынке по таким ценам видеокарты не найти, и GeForce RTX 5070 в реальности стоит дешевле той же Radeon RX 9070, хотя они равны по рекомендованным ценам. Так что смотреть нужно исходя из конкретной ситуации на данный момент. Главное, что Radeon RX 9070 XT стал более сильным конкурентом для игровых решений Nvidia, и это позволяет надеяться на дальнейший прогресс с обеих сторон. Но было бы очень неплохо, если бы у AMD появилось и настоящее флагманское решение — рынку нужен такой соперник, просто лучшим соотношением цены и производительности в среднем сегменте Nvidia не победить.
В остальном же — похоже, что изменение схемы наименования видеокарт для лучшего соответствия решениям конкурента вполне оправдалось — в разрешении 2560x1440 без трассировки лучей получился прирост производительности по сравнению с Radeon RX 7900 GRE примерно на треть, что пусть и не слишком много, но неплохо, особенно на уровне GeForce. Общая производительность Radeon RX 9070 XT без учета трассировки примерно соответствует GeForce RTX 5070 Ti, новая модель AMD находится примерно посередине между GeForce RTX 4070 Ti Super и GeForce RTX 4080 — это выше большинства ожиданий. При этом, новая видеокарта AMD этого поколения чуть не догнала флагман прошлого поколения — Radeon RX 7900 XTX, который остался на 3%-5% быстрее (без трассировки лучей, напомним). Также по энергоэффективности новый GPU не смог превзойти конкурентов Nvidia, но она немного улучшилась по сравнению с прошлым поколением Radeon.
Что же касается трассировки, то у AMD наконец-то получилось значительно увеличить ее производительность. По сравнению с RDNA 3 прирост производительности впечатляющий, но всё же Radeon RX 9070 XT отстает от GeForce RTX 5070 Ti, а вот GeForce RTX 5070 в среднем даже в играх с трассировкой медленнее — в том числе и из-за того, что у карты AMD целых 16 ГБ видеопамяти, а GeForce RTX 5070 имеет лишь 12 ГБ. Объем в 16 ГБ памяти является выигрышным, в некоторых играх в 4K-разрешении при трассировке лучей и генерации кадров уже не хватает 12 ГБ, а в будущем количество таких проектов лишь увеличится — игры всегда предъявляют всё более высокие требования к объему видеопамяти.
Важным делом стало и приближение последних поколений технологий DLSS и FSR по возможностям и качеству. Но если новинки Nvidia получили улучшенное качество масштабирования при помощи новых ИИ-моделей и многокадровую генерацию, то AMD еще только в самом начале этого процесса. Технология FSR 4 приблизилась к DLSS 3 по качеству и возможностям масштабирования и генерации кадров, но при этом потеряла важное преимущество в универсальности. Ведь FSR 4 полноценно работает только на решениях RDNA 4, а остальные видеокарты, включая предыдущие Radeon и всех конкурентов, этой поддержкой не обладают.
Если сравнивать Radeon RX 9070 (XT) с вышедшими чуть раньше решениями Nvidia GeForce RTX 50, то RDNA 4 содержит куда больше улучшений, по сравнению со слабо изменившейся Blackwell к Ada Lovelace. Но тут можно говорить как о том, что и Ada Lovelace на фоне RDNA 3 и RDNA 4 до сих пор хороша, а перспективные нововведения Blackwell скорее нацелены на будущее и возьмут свое тогда, когда начнут применяться в играх. В свою очередь, AMD любит просто улучшать сырую аппаратную производительность уже проверенных и точно полезных блоков. Наверное, самой важной новинкой в RDNA 4 стал увеличенный темп исполнения матричных вычислений, используемых в машинном обучении и нейросетях, но производительность ИИ-ускорителей в RDNA 4 также достигла лишь уровня видеокарт Nvidia пары поколений назад.
Но не будем принижать Radeon RX 9070 XT, по своей рекомендованной розничной цене — это действительно отличное предложение с производительностью выше, чем у Radeon RX 7900 XT из предыдущего поколения, также новинка лучше конкурирующей с ней GeForce RTX 5070 — она имеет больше памяти, обеспечивает более высокую производительность в растеризации и достаточную в трассировке, при стоимости лишь на $50 дороже. Да, у Nvidia есть всё же более эффективное аппаратное и более проработанное программное обеспечение, включая DLSS 4, которая явно превосходит FSR 4 и функционально и по распространенности — первая технология используется в гораздо большем количестве игр, а FSR 4 потеряла свое преимущество в универсальности. Но всё это имеет меньшее значение, чем реальные розничные цены.
Увы, многие модели Radeon RX 9070 XT партнеров компании продаются намного дороже объявленной цены — даже по собственным данным компаний, рекомендованные розничные цены на оригинальные варианты этой модели составляет $730-$750, что уже заметно больше стартовой цены в $600. И реальность показывает, что по ценам в магазинах Radeon RX 9070 XT пока что скорее ближе к Radeon RX 5070 Ti, чем к GeForce RTX 5070. И ближайший конкурент рассмотренной новинки именно GeForce RTX 5070 Ti, который предлагает чуть лучшую производительность при растеризации, всегда лучшую производительность при трассировке лучей, лучшую энергоэффективность и лучшую технологию повышения производительности (выше качество изображения и многокадровую генерацию). Так что нужно сравнивать реальные розничные цены, и если Radeon RX 9070 XT будет продаваться по цене на $150-$200 меньше GeForce RTX 5070 Ti, то в ней точно есть смысл. Если же разница в ценах меньше — решение Nvidia смотрится предпочтительнее.
На момент написания статьи в американских магазинах (Newegg, Amazon, B&H, Best Buy и т. д.) вообще не было в наличии видеокарт Radeon RX 9070 и Radeon RX 9070 XT, равно как и GeForce RTX 5090 и GeForce RTX 5080. Но GeForce RTX 5070 есть — при ценах, близких к рекомендованным (чуть выше), есть и GeForce RTX 5070 Ti, но уже с явно завышенными до $1000 ценами. На нашем рынке есть всё, кроме GeForce RTX 5090, пожалуй, но всё по завышенным ценам, и к рекомендованной ближе всего снова GeForce RTX 5070 — вероятно, Nvidia помогает начало продаж на несколько недель раньше. Сейчас ситуация сложнее обычного, если не брать майнинговое время с конца 2020 года, но почти каждый запуск видеокарт какое-то время проходит с дефицитом и завышенными ценами, и всё же есть вероятность, что к маю или июню поставки нормализуются — уж решения уровня GeForce RTX 5070 (Ti) и Radeon RX 9070 (XT) вряд ли широко используются нейросетевиками и должны появиться в широкой продаже уже по нормальным ценам.
На этих позитивных ожиданиях переходим к рассмотрению практических особенностей видеокарты Radeon RX 9070 XT в исполнении компании Gigabyte.
Особенности карты Gigabyte Aorus Radeon RX 9070 XT Elite 16G (16 ГБ)
Сведения о производителе: Компания Gigabyte Technology (торговая марка Gigabyte) основана в 1986 году в Китайской Республике (Тайвань). Штаб-квартира в Тайбэе/Тайвань. Изначально создавалась как группа разработчиков и исследователей. В 2004 году на базе компании был образован холдинг Gigabyte, в который вошли Gigabyte Technology (разработка и производство видеокарт и материнских плат для ПК); Gigabyte Communications (производство коммуникаторов и смартфонов под маркой GSmart (с 2006 г.
Объект исследования: серийно выпускаемый ускоритель трехмерной графики (видеокарта) Gigabyte Aorus Radeon RX 9070 XT Elite 16G 16 ГБ 256-битной GDDR6
Gigabyte Aorus Radeon RX 9070 XT Elite 16G 16 ГБ 256-битной GDDR6 | ||
---|---|---|
Параметр | Значение | Номинальное значение (референс) |
GPU | Radeon RX 9070 XT (Navi48) | |
Интерфейс | PCI Express x16 5.0 | |
Частота работы GPU (ROPs), МГц | BIOS P: 3100(Boost)—3142(Max) BIOS S: 3100(Boost)—3125(Max) | 2970(Boost)—3090(Max) |
Частота работы памяти (физическая, МГц (ПСП, ГТ/с)) | 2500 (20) | 2500 (20) |
Ширина шины обмена с памятью, бит | 256 | |
Число вычислительных блоков в GPU | 64 | |
Число операций (ALU/CUDA) в блоке | 64 | |
Суммарное количество блоков ALU/CUDA | 4096 | |
Число блоков текстурирования (BLF/TLF/ANIS) | 256 | |
Число блоков растеризации (ROP) | 128 | |
Число блоков Ray Tracing | 64 | |
Число тензорных блоков | 128 | |
Размеры, мм | 340×135×60 | 320×120×50 |
Количество слотов в системном блоке, занимаемые видеокартой | 3 | 3 |
Цвет текстолита | черный | черный |
Энергопотребление пиковое в 3D, Вт (BIOS P/BIOS S) | 340/340 | 350 |
Энергопотребление в режиме 2D, Вт | 18 | 18 |
Энергопотребление в режиме «сна», Вт | 4 | 4 |
Уровень шума в 3D (максимальная нагрузка), дБА (BIOS P/BIOS S) | 29,4/25,1 | 33,0 |
Уровень шума в 2D (просмотр видео), дБА | 18,0 | 18,0 |
Уровень шума в 2D (в простое), дБА | 18,0 | 18,0 |
Видеовыходы | 2×HDMI 2.1b, 2×DisplayPort 2.1a | 1×HDMI 2.1b, 3×DisplayPort 2.1a |
Поддержка многопроцессорной работы | нет | |
Максимальное количество приемников/мониторов для одновременного вывода изображения | 4 | 4 |
Питание: 8-контактные разъемы | 3 | 3 |
Питание: 6-контактные разъемы | 0 | 0 |
Питание: 16-контактные разъемы | 0 | 0 |
Вес карты с комплектом поставки (брутто), кг | 2,2 | 2,4 |
Вес карты чистый (нетто), кг | 1,55 | 1,7 |
Максимальное разрешение/частота, DisplayPort | 3840×2160@240 Гц, 7680×4320@120 Гц | |
Максимальное разрешение/частота, HDMI | 3840×2160@144 Гц, 7680×4320@120 Гц | |
Минимальная стоимость карт на базе Radeon RX 9070 XT | 105 000 рублей |
Память
Карта имеет 16 ГБ памяти GDDR6 SDRAM, размещенной в 8 микросхемах по 16 Гбит на лицевой стороне PCB. Микросхемы памяти SK Hynix (H56G42AS8DX014) рассчитаны на номинальную частоту работы в 2500 МГц (эффективная ПСП 20 ГТ/с, или 20 Гбит/с).
В случае GDDR7 физическую частоту надо умножать на 12: технология кодирования PAM3 (3 Pulse Amplitude Modulation) × 2 (двойная передача сигнала (DDR)) × 2 (два канала) = 12.
В случае GDDR6X физическую частоту надо умножать на 16: технология кодирования PAM4 (4 Pulse Amplitude Modulation) × 2 (двойная передача сигнала (DDR)) × 2 (два канала) = 16.
В случае GDDR6 физическую частоту надо умножать на 8: технология кодирования PAM2 (2 Pulse Amplitude Modulation) × 2 (двойная передача сигнала (DDR)) × 2 (два канала) = 8.
Особенности карты и сравнение с Gigabyte Radeon RX 7800 XT Gaming (16 ГБ)
Gigabyte Aorus Radeon RX 9070 XT Elite 16G (16 ГБ) | Gigabyte Radeon RX 7800 XT Gaming (16 ГБ) |
---|---|
вид спереди | |
![]() | ![]() |
вид сзади | |
![]() | ![]() |
Мы сравниваем Radeon RX 9070 XT с Radeon RX 7800 XT из предыдущего поколения по двум причинам: во-первых, компания AMD позиционирует Radeon RX 9070/XT как среднеуровневые решения, а во-вторых, ускоритель Radeon RX 7700 XT, для которого Radeon RX 9070 XT кажется логичным продолжением (наличие цифры 7 в названии) имеет 192-битную шину обмена с памятью, а не 256-битную.
Прекрасно видно, что, карты отличаются кардинально. Во-первых, сами графические ядра различаются по размерам как кристаллов, так и упаковок, во-вторых, совершенно иное расположение микросхем памяти вокруг GPU.
В традициях AMD ядро имеет зашифрованную числовую маркировку, произведено на 52-й неделе 2024 года (кристалл выполнен по техпроцессу TSMC N4P — по разным оценкам это 4 нм).
Суммарное количество фаз питания у карты Gigabyte Aorus Radeon RX 9070 XT Elite 16G — 17 (14+3).
Зеленым цветом отмечена схема питания ядра (14 фаз), красным — памяти (3 фазы).
У карты имеется два ШИМ-контроллера Monolithic Power Systems MP2868, они работают в паре и управляют обеими схемами питания.
В преобразователе питания ядра и микросхем памяти используются транзисторные сборки DrMOS — MP87993 той же компании MPS, рассчитанные на 90 А.
Выделенного контроллера для мониторинга (отслеживания напряжений и температур) нет, эта функция опять же в традициях AMD возложена на GPU.
Управление подсветкой у видеокарт Gigabyte осуществляется контроллером Holtek.
Карта имеет два режима работы, они заложены в двух вариантах BIOS, которые переключаются с помощью переключателя на переднем торце карты: P (performance / производительный) и S (silent / тихий). Разница между режимами заключается, по сути, только в оборотах вентиляторов, предел энергопотребления в обоих случаях составляет 350 Вт.
Штатные частоты памяти равны референсным значениям. А Boost-значение частоты работы ядра в обоих режимах BIOS P/BIOS S выше референсного на 4,3%. При этом максимальная частота GPU у карты Gigabyte выше референсной всего на 1,5%. Исследования показали, что карта Gigabyte продемонстрировала производительность в играх выше референсной на 3,3% (в среднем в разрешении 2.5K).
Энергопотребление карты Gigabyte в тестах доходило до 340 Вт (в обоих режимах BIOS P/S).
Лимит потребления можно поднять на 10%, поэтому мы попробовали ручной разгон, получив стабильную работу карты на частоте ядра 3271 МГц, при этом частота работы памяти не понималась выше 2605 МГц (речь о физической частоте), так что ПСП выросла не сильно — до 21 МТ/с. В итоге в среднем мы получили прирост производительности 4,6% в разрешении 2.5K.
Питание на карту Gigabyte подается через три 8-контактных разъема питания стандарта PCIe 2.0.
Отметим большие габариты данной карты, 34 см в длину, 13,5 см по высоте и 6 см толщиной. В результате видеокарта занимает 3 слота в системном блоке.
Карта имеет стандартный набор видеовыходов: два DP 2.1a и два HDMI 2.1b.
Управление работой карты обеспечивается с помощью фирменной программы Gigabyte Control Center.

Нагрев и охлаждение
Мы видим кулер со сквозным продувом хвостовой части радиатора. Основой СО является огромный многосекционный пластинчатый никелированный радиатор с тепловыми трубками, распределяющими тепло по ребрам радиатора.
8 трубок припаяны к большой медной никелированной пластине, которая охлаждает как ядро, так и микросхемы памяти. Для охлаждения преобразователей питания VRM имеются свои подошвы на радиаторе. Задняя пластина не только служит элементом защиты PCB, но и участвует в охлаждении тыльной стороны PCB в области ядра через термопрокладки.
В качестве термоинтерфейса для охлаждения микросхем памяти и преобразователей питания VRM используются так называемые жидкие термопрокладки (термогель). Это, по сути, одноразовый интерфейс, его можно использовать вторично, но потребуется ювелирная работа по формированию требуемых поверхностей для равномерного распределения.
Поверх радиатора установлен кожух с тремя вентиляторами ∅96 мм, имеющими по 7 лопастей и работающими на единой частоте вращения.
В традициях карт Gigabyte, средний вентилятор вращается в противоположную сторону, образуя с крайними вентиляторами «эффект шестеренок», помогающий бороться с турбулентностью воздушных потоков.
Остановка вентиляторов при малой нагрузке на видеокарту происходит, если температура GPU опускается ниже 50 градусов, а нагрев микросхем памяти ниже 85 градусов. При запуске ПК вентиляторы работают, однако после загрузки видеодрайвера идет опрос рабочей температуры, и они выключаются. Ниже есть видеоролик на эту тему.
Мониторинг температурного режима:
Режим BIOS P:
После прогона под нагрузкой максимальная температура ядра не превысила 64 градусов, а микросхем памяти — 90 градусов, что является хорошим результатом для карт такого уровня. Энергопотребление карты доходило до 340 Вт. Напомним, что предельный нагрев GDDR6 — 115 °C.
Мы засняли и ускорили в 50 раз 8-минутный прогрев
Максимальный нагрев наблюдался в области ядра, нижней части PCB около разъема PCIe, а также около разъема питания карты.


При ручном разгоне нагрев вырос незначительно (65/92 °C), однако потребление скакнуло до 375 Вт.
Режим BIOS S:
После прогона под нагрузкой максимальная температура ядра не превысила 68 градусов, микросхем памяти — 94 градуса, что также является нормальным результатом. Энергопотребление карты доходило до 340 Вт.
Шум
Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.
Режимы измерения:
- Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
- Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
- Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark
Оценка градаций уровня шума следующая:
- менее 20 дБА: условно бесшумно
- от 20 до 25 дБА: очень тихо
- от 25 до 30 дБА: тихо
- от 30 до 35 дБА: отчетливо слышно
- от 35 до 40 дБА: громко, но терпимо
- выше 40 дБА: очень громко
В режиме простоя в 2D температура была не выше 31 °C, вентиляторы не работали, уровень шума был равен фоновому — 18 дБА.
При просмотре фильма с аппаратным декодированием ничего не менялось.
Режим BIOS P:
В режиме максимальной нагрузки в 3D температура достигала 64/90 °C (ядро/память). Вентиляторы при этом раскручивались до 1890 оборотов в минуту, шум вырастал до 29,4 дБА: это всё еще тихо.
Аудиозапись шума — здесь. Спектрограмма шума:
Режим BIOS S:
В режиме максимальной нагрузки в 3D температура достигала 68/91 °C (ядро/память). Вентиляторы при этом раскручивались до 1525 оборотов в минуту, шум вырастал до 25,1 дБА: это тем более тихо, даже очень тихо.
Подсветка
Карта имеет подсветку в трех зонах.
Основной элемент подсветки — это фирменная подсветка вентиляторов Gigabyte Halo: светодиоды расположены на внутренней стороне кожуха по периметру каждого вентилятора. Совместно с вращающимися лопастями вентиляторов они образуют интересные световые эффекты.
Управление режимами подсветки, в том числе и ее отключением, осуществляется той же утилитой Gigabyte Control Center.
Имеется возможность сохранения выбранного режима в самой карте, то есть при желании можно настроить подсветку один раз и больше не запускать программу.
Отметим, что синхронизация подсветки возможна только с материнскими платами Gigabyte, но при этом выбор сценариев сокращается. Возможности синхронизации подсветки с иными материнскими платами нет.
Комплект поставки и упаковка
В комплекте поставки кроме карты и краткого руководства имеется еще разборная подставка под видеокарту с регулируемым по высоте упором, а также бонусная наклейка.




Тестирование: синтетические тесты
Мы провели тестирование новой модели видеокарты AMD со стандартными частотами в нашем наборе синтетических тестов. Он продолжает меняться, иногда добавляются новые тесты, а устаревшие постепенно убираются. Мы бы хотели добавить еще больше примеров с вычислениями, но с этим есть определенные сложности. Мы постоянно стараемся расширять и улучшать набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — напишите их в комментариях к статье или отправьте авторам.
Из более-менее новых бенчмарков мы начали использовать несколько дополнительных тестов для измерения производительности трассировки лучей и, а также технологий масштабирования разрешения и увеличения производительности: DLSS, FSR и XeSS. В качестве полусинтетических тестов у нас также используется набор подтестов из довольно популярного пакета 3DMark: Time Spy, Port Royal, DX Raytracing, Speed Way и др. А вот примеры приложений DirectX 11 и 12, входящие в различные SDK, пришлось убрать — последнее время они всё чаще давали некорректные результаты. Зато мы добавили тесты ИИ-нагрузок в виде нейросетевых вычислений.
Синтетические тесты проводились на следующих видеокартах:
- Radeon RX 9070 XT со стандартными параметрами (RX 9070 XT)
- Radeon RX 7900 XTX со стандартными параметрами (RX 7900 XTX)
- Radeon RX 7900 XT со стандартными параметрами (RX 7900 XT)
- GeForce RTX 5070 Ti со стандартными параметрами (RTX 5070 Ti)
- GeForce RTX 5070 со стандартными параметрами (RTX 5070)
Для анализа производительности видеокарты Radeon RX 9070 XT мы использовали две модели Radeon из предыдущего поколения — RX 7900 XTX и RX 7900 XT. Они обе основаны на топовом чипе Navi 31 в разных версиях, и именно против них выставляет новую модель сама AMD, считая, что новинка справится с уровнем производительности недавнего флагмана. Ну а если и не везде справится с самым топом, то уж со второй то моделью точно. Можно было бы добавить еще и RX 7900 GRE, но уж она то точно должна быть медленнее.
Конкурентов у рассматриваемой сегодня видеокарты и на рынке всего два — это пара моделей GeForce из совсем свежей линейки Nvidia GeForce RTX 50. Да, RTX 5070 стоит дешевле рассматриваемого Radeon, с ней конкурирует скорее младшая RX 9070, а вот RTX 5070 Ti уже явно дороже, и они расположены по цене по разные стороны от рассматриваемой сегодня модели, так что прямого сравнения не получится. Но обе эти видеокарты являются соперниками для RX 9070 XT, и по сравнению с ними будет видно, насколько в RDNA 4 смогли улучшить как производительность в целом, так и исправить основные недостатки RDNA 3.
Тестирование: игровые тесты
Конфигурация тестового стенда
Список инструментов тестирования
Во всех игровых тестах использовалось максимальное качество графики в настройках.
- Black Myth: Wukong (Game Science/Game Science)
- Cyberpunk 2077 (Софтклаб/CD Projekt RED), патч 2.21 (январь 2025 г.)
- Senua’s Saga: Hellblade II (Ninja Theory/Xbox Games)
- Call of Duty: Modern Warfare II (Infinity Ward/Activision) (без трассировки и DLSS/FSR/XeSS!)
- Alan Wake 2 (Remedy/Epic Games)
- Ratchet and Clank: Rift Apart (Insomniac Games/Sony/Софтклаб)
- Ghost of Tsushima Director’s Cut (Sucker Punch Productions/Sony Interactive)
- Hogwarts Legacy (Avalance Software/Warner Bros)
- Avatar: Frontiers of Pandora (Ubisoft)
- Atomic Heart (Mundfish/VK)
- Indiana Jones and the Great Circle (Machine Games/Bethesda Softworks) (с RT и DLSS/FSR/XeSS!)
Кратко о производительности в 3D-играх
Перед демонстрацией детальных тестов мы приводим краткие сведения о производительности семейства, к которому относится конкретный исследуемый ускоритель, а также его соперников. Всё это нами субъективно оценивается по шкале из семи градаций.
Игры без использования трассировки лучей (классическая растеризация):
В классических играх Radeon RX 9070 XT по производительности выходит на один уровень с GeForce RTX 4080, чуть обгоняет GeForce RTX 4070 Ti Super и Radeon RX 7900 XTX и чуть отстает от GeForce RTX 5070 Ti. Это позволяет получить высокий уровень комфорта в играх на максимальных настройках качества во всех разрешениях до 4K включительно.
Игры с использованием трассировки лучей и DLSS/FSR/XeSS:
В играх с активной трассировкой лучей и разными видами апскейлинга (FSR/XeSS) Radeon RX 9070 XT находится на одном уровне с GeForce RTX 4070 Ti, чуть выше GeForce RTX 4070 Super и весьма существенно опережает флагмана предыдущего поколения Radeon RX 7900 XTX. В разрешениях до 2.5K включительно можно получить хороший комфорт в играх на высоких настройках графики, а во многих играх приемлемая производительность будет и в 4K, однако в некоторых играх использование трассировки лучей надо сочетать с технологиями динамического масштабирования).
Результаты тестирования в 3D-играх
Стандартные результаты тестов без использования аппаратной трассировки лучей в разрешениях 1920×1080, 2560×1440 и 3840×2160
Результаты тестов со включенной аппаратной трассировкой лучей и/или DLSS/FSR/XeSS в разрешениях 1920×1080, 2560×1440 и 3840×2160
Желающие изучить наши результаты детально, пересчитать рейтинги, исходя из своих локальных розничных цен, могут скачать таблицу (Excel) здесь (ZIP-архив).
Рейтинг iXBT.com
Рейтинг ускорителей iXBT.com демонстрирует нам функциональность видеокарт друг относительно друга и представлен в двух вариантах:
- Вариант рейтинга iXBT.com без включения RT
Рейтинг составлен по всем тестам без использования технологий трассировки лучей. Этот рейтинг нормирован по наиболее слабому ускорителю из группы карт — Arc A310 (то есть сочетание скорости и функций Arc A310 приняты за 100%). Рейтинги ведутся по 30 регулярно исследуемым нами акселераторам в рамках проекта Лучшая видеокарта месяца. В данном случае из общего списка выбрана группа карт для анализа, в которую входят Radeon RX 9070 XT и его конкуренты.
Рейтинг приведен для разрешения 2.5K.
№ | Модель ускорителя | Рейтинг iXBT.com | Рейтинг полезности | Цена, руб. |
---|---|---|---|---|
05 | Gigabyte Aorus RX 9070 XT, разгон до 3271 МГц/21 ГТ/с | 1842 | 169 | 109 000 |
06 | Gigabyte Aorus RX 9070 XT, 3100—3142 МГц/20 ГТ/с | 1824 | 167 | 109 000 |
07 | GeForce RTX 5070 Ti 16 ГБ, 2450—2790 МГц/28 ГТ/с | 1818 | 173 | 105 000 |
08 | RTX 4080 16 ГБ, 2505—2625 МГц/22,4 ГТ/с | 1774 | 136 | 130 000 |
09 | RX 9070 XT 16 ГБ, 2970—3090 МГц/20 ГТ/с | 1754 | 167 | 105 000 |
10 | RX 7900 XTX 24 ГБ, 2500—2990 МГц/20 ГТ/с | 1722 | 145 | 119 000 |
12 | RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 ГТ/с | 1587 | 156 | 102 000 |
В обычных играх с растеризацией Radeon RX 9070 XT чуть-чуть обошел флагмана предыдущего поколения Radeon RX 7900 XTX и оказался на 10% быстрее, чем GeForce RTX 4070 Ti Super, но тоже совсем чуть-чуть отстал от GeForce RTX 4080, а GeForce RTX 5070 Ti оказался быстрее на 3,5%. Карта Gigabyte в силу фабрично повышенных частот работы обошла всех соперников.
- Вариант рейтинга iXBT.com с включением RT/DLSS/FSR/XeSS
Рейтинг составлен по 10 тестам, в которых используется технология трассировки лучей и одновременно технология Nvidia DLSS, AMD FSR или Intel XeSS. Этот рейтинг нормирован по самому слабому ускорителю в данной группе — Arc A310 (то есть сочетание скорости и функций Arc A310 приняты за 100%).
Рейтинг приведен для разрешения 2.5K.
№ | Модель ускорителя | Рейтинг iXBT.com | Рейтинг полезности | Цена, руб. |
---|---|---|---|---|
03 | GeForce RTX 5070 Ti 16 ГБ, 2450—2790 МГц/28 ГТ/с | 5818 | 554 | 105 000 |
06 | RTX 4080 16 ГБ, 2505—2625 МГц/22,4 ГТ/с | 4906 | 377 | 130 000 |
08 | RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 ГТ/с | 4466 | 438 | 102 000 |
09 | Gigabyte Aorus RX 9070 XT, разгон до 3271 МГц/21 ГТ/с | 4217 | 387 | 109 000 |
10 | Gigabyte Aorus RX 9070 XT, 3100—3142 МГц/20 ГТ/с | 4184 | 384 | 109 000 |
12 | RX 9070 XT 16 ГБ, 2970—3090 МГц/20 ГТ/с | 4020 | 383 | 105 000 |
15 | RX 7900 XTX 24 ГБ, 2500—2990 МГц/20 ГТ/с | 3423 | 288 | 119 000 |
В играх, где задействованы RT и технологии динамического масштабирования, ситуация для Radeon RX 9070 XT выглядит менее радужно, хотя флагмана предыдущего поколения Radeon RX 7900 XTX он опять же обошел на 17%.
Зато GeForce RTX 4070 Ti Super оказался быстрее на 11%, а GeForce RTX 5070 Ti — на 44%. Здесь сыграло роль активное использование DLSS с многокадровой генерацией в 4 играх из 10, а технология AMD FSR4 (аналог многокадровой генерации) пока еще не работает в тех же играх. Ждем нужного обновления для Ratchet & Clark).
Рейтинг полезности
Рейтинг полезности тех же карт получается, если показатель предыдущего рейтинга разделить на цены соответствующих ускорителей. Для расчета рейтинга полезности использованы розничные цены на март 2025 года.
- Вариант рейтинга полезности без включения RT
Рейтинг приведен для разрешения 2.5K.
№ | Модель ускорителя | Рейтинг полезности | Рейтинг iXBT.com | Цена, руб. |
---|---|---|---|---|
13 | GeForce RTX 5070 Ti 16 ГБ, 2450—2790 МГц/28 ГТ/с | 173 | 1818 | 105 000 |
17 | Gigabyte Aorus RX 9070 XT, разгон до 3271 МГц/21 ГТ/с | 169 | 1842 | 109 000 |
19 | Gigabyte Aorus RX 9070 XT, 3100—3142 МГц/20 ГТ/с | 167 | 1824 | 109 000 |
20 | RX 9070 XT 16 ГБ, 2970—3090 МГц/20 ГТ/с | 167 | 1754 | 105 000 |
23 | RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 ГТ/с | 156 | 1587 | 102 000 |
24 | RX 7900 XTX 24 ГБ, 2500—2990 МГц/20 ГТ/с | 145 | 1722 | 119 000 |
25 | RTX 4080 16 ГБ, 2505—2625 МГц/22,4 ГТ/с | 136 | 1774 | 130 000 |
В данном случае соперники в лице Radeon RX 9070 XT и GeForce RTX 5070 Ti идут ноздря в ноздрю, карта Gigabyte тоже от них практически не отличается.
- Вариант рейтинга полезности с включением RT/DLSS/FSR/XeSS
Рейтинг приведен для разрешения 2.5K.
№ | Модель ускорителя | Рейтинг полезности | Рейтинг iXBT.com | Цена, руб. |
---|---|---|---|---|
01 | GeForce RTX 5070 Ti 16 ГБ, 2450—2790 МГц/28 ГТ/с | 554 | 5818 | 105 000 |
08 | RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 ГТ/с | 438 | 4466 | 102 000 |
14 | Gigabyte Aorus RX 9070 XT, разгон до 3271 МГц/21 ГТ/с | 387 | 4217 | 109 000 |
16 | Gigabyte Aorus RX 9070 XT, 3100—3142 МГц/20 ГТ/с | 384 | 4184 | 109 000 |
17 | RX 9070 XT 16 ГБ, 2970—3090 МГц/20 ГТ/с | 383 | 4020 | 105 000 |
18 | RTX 4080 16 ГБ, 2505—2625 МГц/22,4 ГТ/с | 377 | 4906 | 130 000 |
26 | RX 7900 XTX 24 ГБ, 2500—2990 МГц/20 ГТ/с | 288 | 3423 | 119 000 |
Безусловно, пока технология AMD FSR4 не будет массово внедрена в игры, конкуренты из стана Nvidia окажутся более интересными, так как поддержкой DLSS с MFG обладают уже сотни игр (прежде всего благодаря приложению Nvidia, позволяющему включить MFG в играх, у которых имеется поддержка DLSS 3). А вот про GeForce RTX 4080 и Radeon RX 7900 XTX с их нынешними ценами можно уже забыть: они должны или сильно подешеветь, чтобы сверкнуть на закате своего существования, или пропасть с прилавков окончательно.
Выводы и сравнение энергоэффективности
Ускоритель Radeon RX 9070 XT (16 ГБ) позиционируется компанией AMD как продукт среднего уровня. Поэтому и рекомендованные розничные цены выставлены на уровне 600 долларов, хотя сейчас практически никто из партнеров AMD их не соблюдает — мы видим на прилавках такие карты по сильно завышенным ценам. Ранее среднеуровневые продукты из серии Radeon получали названия типа Radeon RX 5700 XT и Radeon RX 7700 XT, так что в данном случае напрашивалось название Radeon RX 9700 XT, но в AMD посчитали, что им выгоднее поменять систему названий и приблизить ее к той, которой пользуется конкурент Nvidia (GeForce RTX 4070, GeForce RTX 5070 и т. д.). В результате семерка поменяла свое место и мы получили Radeon RX 9070 XT.
Поколение 8000 и вовсе оказалось пропущено: после Radeon RX 7000 вышли сразу Radeon RX 9000. Это сделано, чтобы числовые обозначения поколения процессоров AMD и видеокарт на базе GPU того же производителя были одинаковыми: сейчас актуально поколение Ryzen 9000, поэтому и Radeon RX 9000.
Стоимость всех современных видеокарт — очень больная тема. Уже понятно, что рекомендованных розничных цен (MSRP) никто в ближайшей перспективе не увидит, даже с поправкой на налоги. Может быть, только ближе к выходу следующего поколения, но и то вряд ли. Это касается как видеокарт на базе Nvidia GeForce, так и аналогов на базе AMD Radeon.
Судите сами: 600 долларов — это на момент подготовки обзора примерно 51 тысяча рублей. Понятно, что цена без налогов, поэтому прибавляем 20% НДС, получаем 61 тысячу. И даже если учесть аппетиты торговых компаний, мы всё равно получаем не более 75 тысяч. А реальные цены на такие карты сейчас выше 100 тысяч (в редких случаях близки к 100 тысячам из-за локальных акций и скидок). Все партнеры AMD подняли отпускные цены на свою продукцию значительно выше MSRP.
Для нашего рейтинга полезности мы взяли за ориентир 105 тысяч рублей: по такой минимальной цене на момент подготовки обзора можно было реально найти Radeon RX 9070 XT на маркетплейсах. Для протестированной карты Gigabyte минимальная цена в то же время составляла 109 тысяч рублей (этот продукт относится к дорогому семейству Aorus).
Еще на примерах видеокарт на базе новых GPU Nvidia мы убедились, что в современных реалиях программная часть работы ускорителей становится всё более весомой, всё активнее использует имеющиеся наработки в области ИИ (нейронных сетей), а аппаратная часть GPU должна иметь нужные для быстрых вычислений блоки. Именно с этой целью AMD представила свою технологию FSR 4, которая в какой-то степени может являться аналогом Nvidia DLSS 4 (Multiframe Generation).
Она уже поддерживается во многих играх с FSR 3.1 при помощи переопределения в драйвере. Качество изображения при использовании новой версии масштабирования было значительно улучшено, стабильность изображения не доходит до уровня DLSS 4 с применением модели трансформера, но многие детали в кадре превосходят возможности предыдущей версии DLSS 3, что можно считать несомненным успехом. А вот по генерации кадров нет никаких улучшений: сохранилось удвоение частоты кадров при том же качестве, тогда как в Blackwell появилась уже многокадровая генерация. И хотя Nvidia до сих пор имеет некоторое преимущество и по качеству масштабирования и по генерации кадров, это преимущество с RDNA 4 значительно уменьшилось.
Наверное, не имеет смысла снова повторять, что Radeon RX 9070 XT не является флагманом. AMD с самого начала однозначно заявила, что на данном этапе (то есть в текущем поколении) они флагманские карты выпускать не будут. Судя по спросу на новые карты на западном рынке, компании удалось неплохо просчитать стратегию и получить приличную отдачу от выпуска среднеуровневых ускорителей в попытке захватить долю в самом массовом ценовом сегменте.
Если посмотреть на энергоэффективность, то Radeon RX 9070 XT по этому показателю ожидаемо находится где-то в середине списка.
Компания AMD сделала приличный шаг вперед в архитектуре RDNA 4 сразу в нескольких важных областях, в которых их решения ранее сильно отставали от соперничающих с ними видеокарт Nvidia. Была значительно улучшена производительность трассировки лучей — в большинстве существующих игр с трассировкой лучей Radeon RX 9070 XT достиг как минимум уровня GeForce RTX 5070, хотя в сложных случаях с трассировкой пути отставание по эффективности RT-ядер всё еще остается. Новый GPU получил и аппаратные ИИ-ускорители, которые также несколько отстают по скорости и возможностям от аналогичных блоков Nvidia, но обеспечивают существенные улучшения в различных ИИ-нагрузках, включая поддержку новой версии технологии масштабирования FSR 4, помогающей повысить производительность.
Конкретная протестированная карта Gigabyte Aorus Radeon RX 9070 XT Elite 16G (16 ГБ) имеет крупные размеры 34×13 см и занимает 3 слота в системном блоке. Карта может потреблять до 340 Вт (официальный лимит AMD — 350 Вт) и имеет три 8-контактных разъема питания PCIe 2.0. Кулер тихий. У карты 4 видеовыхода: 2 HDMI 2.1b и 2 DisplayPort 2.1a — последний обеспечивает пропускную способность до 80 Гбит/с в режиме передачи UHBR 20 и позволяет подключить 8K-дисплей с частотой обновления 60 Гц по одному кабелю. Карта имеет стильный и симпатичный дизайн, снабжена фирменной подсветкой Halo, создающей красивые эффекты при вращении вентиляторов.
Еще раз отметим, что в классических играх Radeon RX 9070 XT может обеспечить высокий уровень комфорта в играх на максимальных настройках качества во всех разрешениях до 4K включительно. В играх с активной трассировкой лучей и разными видами апскейлинга (FSR/XeSS) Radeon RX 9070 XT позволит получить хороший комфорт в играх на высоких настройках графики в разрешениях до 2.5K включительно, а во многих играх приемлемая производительность будет и в 4K, однако в некоторых играх использование трассировки лучей надо сочетать с технологиями динамического масштабирования).
В номинации «Оригинальный дизайн» карта Gigabyte Aorus Radeon RX 9070 XT Elite 16G (16 ГБ) получила награду:

«FSR 4 is looking fantastic! Excited for the co-development with Sony Interactive Entertainment on the models used for the FSR 4 upscaler.»
Ещё раз нейронку им не сделала сони. Черным по белому написано совместная разработка. И написано не model, а models, т.е. множественное число.
«Вот здесь Сони представляют проект Amethyst как их собственный»
«e have begun a deeper collaboration with AMD. For the project name we’re taking a hint from AMD’s red and PlayStation’s blue. The code name is Amethyst.»
«In going after this we’re combining the lessons AMD has learned from its multi-generation RDNA road map and SIE has learned from the custom work in PS5 Pro.»
Зачем же читать да?
Более того, смотрим
https://www.youtube.com/live/GZfFPI8LJrc?si=fF4BZ47pRn_moicz&t=1171
FSR 4 гибридная архитектура нейронки. Когда сони говорить только о свёрточной нейронке CNN. В FSR 4 же используется и CNN и элементы трансформера, за счёт которых и обеспечивается качество же.
CNN нужен в гибриде для облегчения модели. Т.к. сложность трансформера растёт квадратично с увеличением длинны последовательности.
Итого FSR 4 это совместная разработка AMD и SIE. А не только сони. При том кто и чем занимался не понятно, но скорее всего сони работали над свёрточной нейронкой. Часть трансформера похоже уже дело рук АМД.
А зная АМД они вполне могли назвать CNN with ATTENTION гибридной архитектурой.
а так пожалуйста читайте
https://www.researchgate.net/publication/371131911_Single-image_super-resolution_using_lightweight_transformer-convolutional_neural_network_hybrid_model
https://www.researchgate.net/publication/369557573_Incorporating_Transformer_Designs_into_Convolutions_for_Lightweight_Image_Super-Resolution
https://arxiv.org/pdf/2103.14030
https://www.sciencedirect.com/science/article/abs/pii/S1746809423007644
Ой что же мы видим, идея не нова и да не амд придумали модели называть гибридными.
«представляют проект Amethyst как их собственный»
I have some very exciting news to share. We have begun a deeper collaboration with AMD. For the project name we're taking a hint from AMD's red and PlayStation's blue.. The code name is Amethyst
А чтобы объяснить почему это чушь потребуется не один час.
У Славика превратилась в «им сделала Сони». Ловкость рук и никакого мошенничества)
ПО, которое требует минимум SSE 4.1 без проблем работает?
Дождались!
А Radeon Х800XT быстрее почти в 4 раза, чем 9600.
И можно вспомнить как выход 4850 и 4670 обрушил цены 9800gtx и 9600gt. Я в те времена в компьютерном магазине работал, бОльшая часть продаж ушла на них, и цены резко поползли вниз
Вот у 4850 проблем с перегревом не наблюдалось (в том же корпусе). Но не связанные с перегревом падения в черный экран изредка таки происходили, как и у 7870 потом. Где-то раз в несколько часов, что в общем казалось терпимым. А еще у всех этих карт были падения при скроллинге «тяжелого» видео в плеерах, причем довольно часто. Я даже думал, что это вообще у всех так, но потом купил GTX 1080 и понял, что это совсем не обязательно: вместо частых падений у нее при скроллинге очень-очень редко происходит долгий фриз на 5+ секунд, что, согласитесь, вообще не выглядит проблемой по сравнению с черным экраном.
Infinity Cache требует много транзисторов
В RDNA 2 (например, Navi 21 в RX 6900 XT) 128 МБ Infinity Cache занимает ~6–13 млрд транзисторов (из ~26.8 млрд общего числа).
В RDNA 3 (например, Navi 31 в RX 7900 XTX) 96 МБ Infinity Cache + улучшенная архитектура — общее число транзисторов ~58 млрд (у RTX 4090 — ~76 млрд, но там другой подход).
Почему NVIDIA обходится меньшим числом?
У NVIDIA нет Infinity Cache, вместо этого используется большая шина памяти + кэш L2 (например, у RTX 4090 — 72 МБ L2, но он менее ёмкий, чем у AMD).
NVIDIA сильнее оптимизирует плотность транзисторов (например, TSMC 4N у Ada Lovelace против 5/6nm у RDNA 3).
А да? Тогда что же это меньшее кол-во транзисторов, на меньшей частоте занимают БОЛЬШЕ места, так ещё и жрут больше? И это при том, что у данной карты ещё и кеша не меньше.
И это при том, что высокая плотность усложняет повышение частот. Значит криворукие АМД смогли разработать более плотный, более высокочастотный, более энергоэффективный дизайн, а умные нвидиа не смогли?
Опять же зависимость частоты от потребления не линейна, а экспоненциальная.
При том тех процессы у них одного семейства.
И вот мы выяснили, что с инжерами обеих компаний никаких проблем нет, проблемы только у горемыки в комментариях, которому ну очень надо засрать не любимку.
ps Были слухи про 9070xtx на 32gb, был бы интересный прибор
Цена не с потолка, а именно адекватная за эту карту. За 120к прямо сейчас можно купить в днс в наличии 4080с. Там уже и длсс, и ртх и прочая лабуда будет, а сырая производительность выше.
Вообще то они впервые появились в RDNA 3. К примеру, в Radeon RX 7900 XTX их 192 штуки, а в Radeon RX 7800 XT 120 штук. Данные взяты с официального сайта AMD. Они первого поколения, соответственно с поддержкой BF16, тогда как во втором поколении появилась поддержка FP8. Как в RDNA 3, так и в RDNA 4 ИИ ускорители являются матричными ядрами (WMMA). Об этом написано на сайте OpenGPU, под патронажем AMD.
P.S. В будущем AMD возможно добавит поддержку FSR 4 для RDNA 3 и RDNA 3.5. Технических ограничений нету. Да, будет хуже работать, но всё же лучше, чем FSR 3, так как будет задействовать ИИ ускорители.
Вот у 7600 наверно не хватит так как там около 44 tops получается…
Увы, в отличие от прошлых версий апскейлера, которые работали практически на любом железе, FSR 4 поддерживают только графические процессоры архитектуры RDNA 4 (в связи с расширением набора инструкций WMMA на данные FP8)
https://www.hardwareluxx.de/images/cdn02/uploads/2022/Dec/swank_thread_af/amd-rdna3-breakout-021_1920px.jpeg
https://www.hardwareluxx.de/images/cdn02/uploads/2022/Dec/like_blockchain_0z/amd-rdna3-breakout-022_1920px.jpeg
Форматы FP на 50-180 % менее эффективны с точки зрения вычислений на выделенном оборудовании, чем формат INT. В Int8 RDNA3 выполняется только одна такая инструкция за такт, но по производительности у старших моделей находится в районе 3070Ti. Только у 7600 позорные 44tops. Все остальные легко справятся с задачей апскейла.
Сетки обученные на FP8 конвертятся на Int8.
https://arxiv.org/pdf/2303.17951
История редактирования комментария