Обзор видеоускорителя AMD Radeon RX 9070 XT на основе карты Gigabyte Aorus Radeon RX 9070 XT Elite 16G (16 ГБ)

96

Оглавление

Общая информация о Radeon RX 9070 XT

Наконец-то долгожданная серия Radeon RX 9000 вышла — в самом начале марта AMD выпустила свои новые видеокарты, основанные на графических процессорах архитектуры RDNA 4. Изначально планировалось не только анонсировать новые решения на CES 2025, но и выпустить их вскоре, но в последний момент AMD решила придержать их выпуск и посмотреть, что предложит рынку Nvidia со своими GeForce RTX 50. Сама архитектура RDNA 4 и некоторые детали о серии Radeon RX 9000 были частично раскрыты на выставке CES, но подробности и полные спецификации появились позже. Официально компания задержала запуск продаж, чтобы гарантировать больший объем видеокарт на начале запуска, но вряд ли они случайно вышли лишь после того, как конкурент выпустил все четыре видеокарты новой линейки, только тогда настала очередь и для Radeon RX 9070 XT и Radeon RX 9070.

Изображение: AMD

С их выходом AMD окончательно перестала даже пытаться бороться за абсолютное лидерство по максимальной производительности GPU — они решили вовсе не делать соперников для GeForce RTX 5090 и даже GeForce RTX 5080. По словам представителей компании, они сосредоточились на более доступных GPU для более существенных по объему сегментов рынка, предпочтя достижение лучшего соотношения цены и скорости при разрешениях 1440p и 4K в ценовых сегментах до $700.

Две вышедшие модели видеокарт новой серии основаны на графическом процессоре Navi 48 — первом и единственном пока представителе новой графической архитектуры RDNA 4. Эта архитектура предназначена для обеспечения максимальной эффективности (производительности на площадь кристалла), чтобы оказаться примерно на уровне конкурирующих решений подсерии GeForce RTX 5070, и конкурировать с ними по всем параметрам. AMD заявила о значительном увеличении производительности на такт по сравнению с RDNA 3, а также о двукратном увеличении производительности аппаратных блоков трассировки лучей, что являлось главной проблемой для предыдущих решений компании. Такой же уровень ускорения относится к матричным вычислениям на ИИ-ускорителях, что обеспечило возможность внедрения масштабирования FSR 4, основанного на нейросетях, улучшающих качество изображения и производительность.

По сравнению с предыдущей архитектурой компании, в RDNA 4 больше всего улучшений было внедрено в аппаратные блоки трассировки лучей, но и ИИ-ускорители не обошли вниманием. Практически все вычислительные блоки получили свои усовершенствования для повышения производительности и эффективности, ИИ-ускорители получили поддержку новых типов данных с меньшей точностью, но большей производительностью, а блоки трассировки лучей стали значительно быстрее справляться с работой. Но хотя Nvidia перешла уже на память GDDR7 в своих новейших видеокартах, AMD продолжила использовать память «старого» стандарта — GDDR6, обеспечивающего максимальную производительность в 20 Гбит/с против 30 Гбит/с, но для улучшения эффективной пропускной способности в их графических процессорах есть специальный большой кэш Infinity Cache.

Изображение: AMD

Radeon RX 9070 XT — это видеокарта для высокопроизводительного сегмента, которая предназначена для обеспечения комфортной игры в 4K-разрешении при любых графических настройках, которая в полтора раза опережает Radeon RX 6900 XT и на четверть быстрее GeForce RTX 3090 (почему-то для первых слайдов взяли такие старые GPU) по данным AMD. Рассматриваемая новинка имеет рекомендованную цену $600, что слегка больше, чем у GeForce RTX 5070, против которой выступает Radeon RX 9070 без индекса, но заметно ниже, чем у GeForce RTX 5070 Ti. Новая модель должна вернуть AMD к полноценной конкурентоспособности на игровом рынке, ведь сложилась такая ситуация, что более ранние серии Radeon RX 5000 и Radeon RX 6000 были достаточно продвинутыми и производительными для того, чтобы конкурировать с GeForce RTX 20 и GeForce RTX 30, при том, что трассировка лучей в те времена еще не была столь важной, а вот серия Radeon RX 7000 (RDNA 3) уже явно отставала от GeForce RTX 40 и по производительности и по возможностям. Так что в RDNA 4 требовалось повысить конкурентоспособность новой серии, улучшив положение компании на рынке.

Наверняка не все согласны с тем, что видеокарты по цене в $600 уже не считаются флагманскими решениями для энтузиастов, это сейчас скорее высокий средний уровень. А всё, что дешевле $300, вообще называется бюджетными решениями. Всё вокруг дорожает, видеокарты не исключение, и они стали намного дороже за последнее годы, как и всё остальное. Мало того, розничные цены в магазинах еще выше — рекомендованные цены для GPU среднего и высокого уровня не выдерживаются. А, учитывая то, что случилось с Intel Arc B580, можно предположить, что и сравнительно недорогие видеокарты также могут столкнуться с проблемами недостаточного предложения и завышенных цен — новые видеокарты Intel купить не так просто, и уж тем более — по рекомендованной цене. Сейчас только модели типа GeForce RTX 4060 и Radeon RX 7600 доступны по близким к рекомендованным розничным ценам, а всё более мощное продается дороже.

С доступностью видеокарт есть явные проблемы у всех производителей, немногочисленные поставки быстро распродаются, а имеющееся в продаже сильно переоценено. Причем, если раньше AMD сталкивалась с трудностями при переходе на новые графические процессоры из-за того, что предыдущее поколение еще долго оставалось на рынке, то теперь и решения серии Radeon RX 7000 во многом исчезли из продажи еще в декабре и январе, за исключением моделей нижнего уровня Radeon RX 7600 (XT), которые массово продаются по близким к рекомендованным ценам. Виноваты в ситуации и меньшие объемы выпуска новых решений и рост спроса на производительные решения — GeForce RTX 5090 так вообще сразу распродаются, как горячие пирожки, да еще и по значительно более высоким ценам, по сравнению с заявленной MSRP.

У остальных моделей дела получше, но тоже есть проблемы, как и у Radeon RX 9070 XT с Radeon RX 9070 — накопившийся спрос явно превышает предложение, и требуется еще много недель на исправление ситуации. В ближайшем же будущем можно ожидать продолжения недостаточности поставок и стабильно завышенных цен. И хотя AMD не продает так же много решений для высокопроизводительных вычислений, как Nvidia, часть ее ограниченного объема производства на TSMC, вероятно, также занята CPU и GPU, предназначенными для центров обработки данных — игроки не являются приоритетом ни для Nvidia ни для AMD, и рынок игровых видеокарт получает лишь то, что остается после ИИ и остальных вычислений. Эта отрасль стремительно растет, и игровые GPU сейчас являются менее приоритетными для всех производителей. Даже Ryzen 7 9800X3D принесет AMD больше денег, чем графический процессор для Radeon RX 9070 XT, а есть еще чипы для центров обработки данных: MI300X и MI350X, которые стоят значительно дороже игровых GPU. Но если компания хочет увеличить долю на рынке игровых решений, то им придется пожертвовать частью прибыли, увеличив выпуск игровых GPU.

Но хватит о плохом, давайте рассмотрим новинку во всех подробностях. Так как основой рассматриваемой сегодня модели видеокарты является новый графический процессор Navi 48 из высокопроизводительного рыночного сегмента, базирующийся на архитектуре RDNA четвертого поколения, которая тесно связана с архитектурами RDNA предыдущих версий, то перед прочтением статьи будет полезно ознакомиться и с нашими предыдущими материалами по видеокартам компании AMD:

Изображение: AMD
Графический ускоритель Radeon RX 9070 XT
Кодовое имя чипа Navi 48
Технология производства 5 нм ( N4P TSMC)
Количество транзисторов 53,9 млрд
Площадь ядра 357 мм²
Архитектура унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX DirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2
Шина памяти 256-битная: 4 независимых 64-битных контроллера памяти с поддержкой GDDR6
Частота графического процессора до 2970 МГц
Вычислительные блоки 64 вычислительных блока CU, состоящих в целом из 4096 ALU для целочисленных расчетов и расчетов с плавающей запятой (поддерживаются форматы INT4, INT8, INT16, FP16, FP32 и FP64)
Блоки трассировки лучей 64 блока Ray Accelerator для расчета пересечения лучей с треугольниками и ограничивающими объемами BVH
Блоки текстурирования 256 блоков текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP) 16 широких блоков ROP на 128 пикселей с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторов поддержка интерфейсов HDMI 2.1b и DisplayPort 2.1a
Спецификации видеокарты Radeon RX 9070 XT
Частота ядра (игровая/турбо) 2400/2970 МГц
Количество универсальных процессоров 4096
Количество текстурных блоков 256
Количество блоков блендинга 128
Эффективная частота памяти 20 ГГц
Тип памяти GDDR6
Шина памяти 256 бит
Объем памяти 16 ГБ
Пропускная способность памяти 640 ГБ/с
Вычислительная производительность (FP32) до 48,7 терафлопс
Теоретическая максимальная скорость закраски 380 гигапикселей/с
Теоретическая скорость выборки текстур 760 гигатекселей/с
Шина PCI Express 5.0 x16
Разъемы один HDMI 2.1b, три DisplayPort 2.1a
Энергопотребление до 304 Вт
Дополнительное питание два 8-контактных разъема
Число слотов, занимаемых в системном корпусе 2
Рекомендованная цена $599

С серии Radeon RX 9000 компания решила изменить систему наименований, так как старая перестала соответствовать реальному положению дел. Если раньше Radeon RX 6800 XT была прямым соперником GeForce RTX 3080, то Radeon RX 7800 XT уже стал заметно медленнее GeForce RTX 4080 и даже уступал GeForce RTX 4070 Ti, да и серия Radeon RX 7900 не конкурировала с GeForce RTX 4090 даже близко — для решения этой странности (причиной которой была сама компания, впрочем) в AMD решили изменить наименование игровой линейки. Серию Radeon RX 8000 пропустили, чтобы быть на равных с CPU, и пока что выпустили лишь два продукта — Radeon RX 9070 XT и Radeon RX 9070, приблизив схему наименований к тому, что применяет Nvidia. И новое название рассматриваемой сегодня видеокарты говорит о том, что это решение уровня GeForce RTX 5070 и GeForce RTX 5070 Ti, хотя цена модели Radeon RX 9070 XT располагается между ними.

Соответственно, рассматриваемое сегодня решение превосходит GeForce RTX 5070 по цене и производительности, и приближается к GeForce RTX 5070 Ti, которая заметно дороже — $750 (пока что мы говорим исключительно о рекомендованных ценах). Любопытно также и то, что в серии Radeon RX 9000 вообще не будет решений для энтузиастов уровня GeForce RTX 5080 и выше, пока что в ней вообще есть еще только Radeon RX 9070 на основе этого же GPU, но в урезанном варианте — обзор этой видеокарты также вскоре выйдет у нас на сайте. Вероятно, на основе еще более урезанного по блокам (да и ширине шины памяти, наверняка) чипа Navi 48 будет сделана и еще не анонсированная модель Radeon RX 9060 XT.

Цена же Radeon RX 9070 XT начинается с $599, но это привычное по последним временам лукавство, по такой цене видеокарту можно было купить при должной удаче и сноровке только в западных магазинах на самом начале продаж, которые начались 6 марта, но ведь AMD сдвинула их начало с января на март якобы чтобы добиться лучшей доступности на рынке, что не очень хорошо получилось в итоге. Учитывая текущие условия, вообще не сильно важно, какую цену кто указывает в качестве рекомендованной розничной цены — по крайней мере, в краткосрочной перспективе, реальные всегда будут выше, а все карты первых партий быстро распродаются. В первые месяцы новых карт просто не хватает для удовлетворения спроса, во что обязательно вмешиваются спекулянты со своими наценками. Это можно было бы назвать повторением дефицита во время криптовалютного майнинга на GPU, но сейчас он несколько мягче и связан скорее с развитием ИИ-технологий.

Исходя из ширины шины видеопамяти в 256 бит, выбор ее объема у AMD был между 16 и 32 ГБ, и так как компания много говорит о важности большого объема видеопамяти для современных игр, то можно было предположить, что на быстрейшее решение новой линейки поставят уже 32 ГБ, так как предыдущий флагман уже снабжался 24 ГБ памяти. Но нет, так как Radeon RX 9070 XT отличается сравнительно низкой (в теории, по крайней мере) ценой, то AMD решила ограничиться объемом 16 ГБ. И это действительно оптимальное значение на сейчас, установка 32 ГБ обошлась бы куда дороже, и AMD логично решила ограничиться меньшим значением. Хотя многие считают, что объем видеопамяти является важным конкурентным преимуществом карт Radeon, и нужно было ставить больше памяти, прямо сейчас 32 ГБ не дали бы вообще никакого прироста, а ориентироваться на гипотетические игры будущего, которые выйдут лет через пять, было бы довольно странно.

В этот раз AMD решила не выпускать на рынок собственные варианты видеокарт серии Radeon RX 9070 (XT). То, что показано у них на слайдах — всего лишь графические изображения видеокарт самой AMD, и они действительно существуют в физическом воплощении, но лишь внутри компании. А на рынке таких продуктов именно производства AMD нет — все видеокарты серии Radeon RX 9070 будут производиться партнерами компании. Они получили очень разные тактовые частоты и уровни энергопотребления, а также системы охлаждения. Все видеокарты имеют разъем PCIe 5.0 x16, а стандартные варианты потребляют до 304 Вт энергии — это меньше, чем у предыдущего флагмана, но варианты производителей отличаются в том числе бо́льшим уровнем потребления.

Изображение: AMD

Партнеры AMD сразу выпустили большое количество моделей с собственными дизайном, размерами, подсветкой и системами охлаждения, многие из них еще и фабрично разогнаны и имеют повышенные уровни энергопотребления и производительности. Многие производители выставили собственные рекомендованные цены на улучшенные Radeon RX 9070 XT, которые оказались куда выше $600 — эти решения имеют официальные рекомендованные цены порядка $750-$800, к которым нужно еще добавить пошлины, так что сейчас в эту игру с низкими рекомендованными ценами играют все — и Nvidia, и AMD, и Intel. Редкие модели Radeon RX 9070 XT изначально были доступны по $600, но в крайне ограниченных количествах, а остальные поставки уже идут по более высоким ценам.

Вполне вероятно, что AMD требует, чтобы у производителей в ассортименте была модель с заявленной ими рекомендованной розничной ценой, но не более того. Заставить их продавать по такой цене всё они не могут. Так как этих видеокарт мало производят и быстро продают, то у пользователя не остается других вариантов, кроме как купить разогнанную модель, которая на пару сотен долларов дороже. Так было с видеокартами Nvidia, ровно так же получилось и тут. Со временем, если предложение удовлетворит спрос, можно будет быстро снизить цены и на эти специальные варианты, но пока что все компании предпочитают получать дополнительную прибыль из-за недостаточного объема производства новинок.

Особенности архитектуры RDNA 4

Обе новые видеокарты серии Radeon RX 9000, которые выпустила AMD, основаны на чипе Navi 48 — он стал самым крупным GPU этого поколения, большего по сложности графического процессора компания выпускать не планирует. Модели Radeon RX 9070 XT и Radeon RX 9070 основаны на этом кристалле и разница лишь в том, что в первой применяется полная версия Navi 48, а вторая довольствуется урезанной по количеству блоков модификацией.

Одним из наиболее интересных изменений высокого уровня в новых графических процессорах стало то, что AMD отказалась от чиплетной организации GPU в случае Navi 48 и младшего Navi 44, который ожидается позднее. Navi 48, в отличие от Navi 31 и Navi 32, это обычный монолитный кристалл площадью 356,5 мм², содержащий впечатляющее количество транзисторов в 53,9 млрд., изготовленный тайваньской TSMC, а GPU из нескольких отдельных кристаллов с графикой и контроллерами памяти, как было в RDNA 3, в этом поколении не будет. Вероятно, таким образом AMD признает тот свой эксперимент не самым удачным — по крайней мере, на данный момент времени.

Изображение: AMD

Кроме этого, AMD также перешли на улучшенный техпроцесс TSMC — с N5 на N4P, который обеспечивает небольшое увеличение производительности и эффективности по сравнению с N4 — улучшенным по отношению к базовому техпроцессу N5. Не очень понятно, насколько N4P сравним с 4N и 4NP — специализированными вариантами аналогичного техпроцесса для Nvidia, но есть предположение, что они довольно похожи друг на друга, так что тут особого преимущества ни у кого из конкурентов быть не должно.

Новый GPU по большинству базовых характеристик похож на Navi 32, но содержит заметно больше транзисторов — почти как Navi 31. Предыдущий топовый чип, на котором основан прошлый флагман Radeon RX 7900 XTX, имеет лишь на 8% больше транзисторов (57,8 млрд), несмотря на наличие в полтора раза большего количества блоков CU, больший кэш Infinity Cache и 384-битную шину памяти. При этом общая площадь кристалла Navi 31 составляет 529 мм², так что AMD очень сильно улучшила плотность размещения транзисторов в новом GPU. Из-за отказа от чиплетной организации и перехода на лучший техпроцесс, Navi 48 более чем на треть меньше топового чипа предыдущего семейства по площади, так как у последнего только основной кристалл производился по схожему 5 нм техпроцессу, а чиплеты с контроллерами памяти и кэшем использовали менее продвинутое полупроводниковое производство.

Один только чиплет GCD в Navi 32 в версии для Radeon RX 7800 XT с 60 CU-блоками был размером 200 мм², а все кристаллы вместе занимали 346 мм². Navi 48 при этом имеет схожую площадь 357 мм², и в конкурентах у него GB205 (GeForce RTX 5070) на 263 мм² и урезанный GB203 (GeForce RTX 5070 Ti) на 378 мм², что также совсем немногим больше. При том, что транзисторов в Navi 48 содержится аж 53,9 млрд, против 31,1 у GB205 и 45,6 у GB203, а по производительности Radeon RX 9070 XT находится скорее между GeForce RTX 5070 или 5070 Ti. Но еще раз отметим, что плотность размещения транзисторов у Navi 48 впечатляет, AMD с TSMC и их N4P смогли заметно обойти Nvidia, продукты которых используют специализированную версию 4N техпроцесса — хотя они оба 5 нм, но первый обеспечивает чуть лучшие характеристики.

Изображение: AMD

Можно предположить, что серия Radeon RX 9070 должна быть довольно выгодной для AMD, так как размер кристалла Navi 48 аналогичен размеру кристалла Navi 32 в Radeon RX 7800 XT, и подсистема памяти приблизительно такая же. Но по скорости AMD сравнивает новинку даже не только с Radeon RX 7900 XT, но с и флагманским XTX. Хотя Radeon RX 9070 XT имеет меньше всего, чем Radeon RX 7900 XT: на 24% меньше вычислительных ядер, на 33% меньший кристалл, на 20% меньше кэш-памяти, объема и пропускной способности памяти, все равно ожидается, что новинка обеспечит как минимум ту же производительность — во многом благодаря архитектурным улучшениям, к рассмотрению которых мы и переходим.

Естественно, что обновленная архитектура RDNA 4 является в очередной раз измененной и доработанной архитектурой AMD, известной уже несколько поколений, но в ней появилось больше изменений, чем мы видели в предыдущих обновлениях. По своему общему строению решения RDNA 4 в виде единственного пока Navi 48 не особенно отличаются от RDNA 3, чип состоит из четырех шейдерных движков Shader Engine, в каждом из них есть по восемь процессоров, содержащих по два вычислительных блока Compute Unit (CU). В итоге это 64 укрупненных вычислительных блоков Compute Unit (CU), которые состоят из 4096 потоковых процессоров, что очень похоже по структуре на решения RDNA 3.

Изображение: AMD

Всего Navi 48 содержит 4096 потоковых процессоров, 128 ИИ-ускорителей, 64 RT-ускорителей, 256 блоков TMU и 128 блоков ROP. Новый графический процессор с такими характеристиками и 256-битной шиной очень похож на условный Radeon RX 7800 XT, но AMD противопоставляет новый GPU скорее флагманскому Navi 31, который содержит в полтора раза больше потоковых вычислительных ядер — видимо, из-за многочисленных архитектурных улучшений и повышенной тактовой частоты новых решений. В новом флагмане линейки GPU работает на игровой частоте 2400 МГц, а турбо-частота доходит почти до 3 ГГц — 2970 МГц, если точнее.

В основе архитектуры RDNA 4 лежит улучшенный вычислительный блок CU с существенными улучшениями по эффективности, подсистеме памяти, динамическом распределении регистров и т. д. Каждый блок CU имеет два блока планировщика, управляющих регистровым файлом объемом 192 КБ, скалярным файлом регистров объемом 8 КБ, 32 блока FMA ALU, 32 блока FMA+INT ALU и 32 TLU для специальных функций. На схеме вычислительных блоков CU изменилось мало что, они имеют по два векторных блока SIMD32 для большего параллелизма, умеют выполнять две 32-битные векторные операции, а матричные блоки поддерживают FP16-вычисления с удвоенной производительностью. Скалярный блок поддерживает операции Float32, также была улучшена предвыборка инструкций.

Изображение: AMD

Векторные и скалярные блоки имеют регистровые файлы объемом в 192 КБ и 8 КБ, кэш разделен на 16 КБ для скалярных блоков и 32 КБ для инструкций, есть и разделяемая память объемом в 128 КБ. В чипе есть также и 8 МБ L2-кэша, а в дополнение к нему кэш Infinity Cache объемом 64 МБ, но по нему ни о каких изменениях явно не было заявлено. Планировщик инструкций вычислительного блока поддерживает внеочередное исполнение инструкций, получил улучшенную предвыборку инструкций, появилось динамическое выделение регистров для шейдерных программ — они могут запрашивать и освобождать данные динамически, что позволяет улучшить эффективность использования регистрового файла.

Изображение: AMD

Производительность растеризации, даже по данным самой AMD, улучшилась меньше всего, но это все равно до +40% к скорости RDNA 3 — по сравнению с удвоенной производительностью трассировки и даже еще большего ускорения ИИ-вычислений это кажется не слишком большим улучшением. Но особых деталей об улучшениях по растеризационной части нам дали не слишком много — да, RDNA 4 получила возможность запрашивать данные из памяти вне очереди, что AMD выделяет особенно как полезную для трассировки лучей функцию, это может помочь и при растеризации. Еще одно важное изменение — появление динамического выделения регистров, на что не были способны RDNA 3 и более ранние GPU, оно также может дать какой-то прирост, но неизвестно насколько заметный в реальном ПО.

Ускорение нейросетей

Куда важнее другие изменения в блоках CU — например, в четвертом поколении RDNA появились свои «тензорные ядра» и у AMD, они назвали их ИИ-ускорителями (AI Accelerators). Для этого специалисты компании перенесли часть аппаратных возможностей из вычислительной архитектуры CDNA 3 в RDNA 4. Теперь каждый блок CU может выполнить 512 операций с точностью FP16 без учета разреженности за такт, или 1024 операций INT4. ИИ-ускорителями также поддерживается структурированная разреженность матриц 4:2, которая позволяет удалять лишние данные и обрабатывать меньше данных в целом. Разреженность может пропускать до половины операций с перемножением на ноль, что потенциально удваивает производительность — эту функцию поддерживают графические процессоры Nvidia с серии GeForce RTX 30 и вычислительные чипы AMD семейства CDNA.

Изображение: AMD

Базовая производительность для формата вычислений FP16 была увеличена в RDNA 4 вдвое, для разреженных матриц возможно еще одно удвоение и еще одно в случае использования формата FP8, который часто используют в ИИ-нагрузках — это уже до восьми раз большая производительность, по сравнению с RDNA 3. В результате получается до 389 TFLOPS вычислений FP16 (с учетом разреженности) и до 1557 TOPS вычислений с точностью INT4 и также с учетом разреженности.

AMD приводит пример того, как это сказывается на производительности при использовании нейросети Stable Diffusion XL, в которой Radeon RX 9070 XT сравнивалась с Radeon RX 7900 XT. По вычислительным блокам новинка отстает от более старого решения более чем на 30%, но Radeon RX 9070 XT показывает почти двукратную производительность от Radeon RX 7900 XT, так что этот прирост будет весьма полезен для всех задач ИИ и машинного обучения, включая масштабирование FSR 4. В других реальных задачах разница поменьше, конечно, но тоже немалая:

Изображение: AMD

К слову, вскоре в шейдерах DirectX должна появиться поддержка кооперативных векторов (Cooperative Vectors), необходимая для нейронного рендеринга. Это новая функция, которая появится в Shader Model 6.9, по сути это аппаратное ускорение векторных и матричных операций при помощи аппаратных блоков — тензорных ядер у Nvidia, XMX-блоков у Intel и т. д. Она нужна для эффективной интеграции нейронного рендеринга в существующие графические конвейеры. Мы уже много писали о возможностях нейрорендеринга на примере предложений Nvidia GeForce, эту функциональность можно использовать для нейронного текстурного сжатия, что может значительно сократить использование видеопамяти при небольших потерях качества, улучшения качества рендеринга при трассировке пути при помощи умного шумоподавления, кэширования данных глобального освещения и даже полной генерации некоторых участков изображения при помощи ИИ — например, реалистичные человеческие лица.

Nvidia Neural Shading SDK будет поддерживать эти возможности, да и остальные производители наверняка присоединятся к этому многообещающему начинанию, благо, что аппаратные блоки для ускорения векторных и матричных операций есть теперь у всех производителей GPU. Хотя AMD не уточняла в подробностях, но решения архитектуры RDNA 4 должны иметь совместимость с будущим нейронного рендеринга в DirectX — этими самыми Cooperative Vectors, когда Microsoft окончательно стандартизирует нейронные шейдеры и возможность приложений использовать ИИ-ускорители, и они будут добавлены в графический API, то новые решения AMD также смогут реализовать эти возможности.

Улучшенная трассировка лучей

Не менее важные улучшения получили вычислительные блоки RDNA 4 и в плане аппаратной трассировки лучей. По данным AMD, специализированные блоки Ray Accelerator на 240% быстрее аналогичных ядер RDNA 2 — из-за многочисленных улучшений. Блоки аппаратной трассировки лучей получили удвоенную скорость тестирования пересечений луча с ограничивающими объемами и треугольниками — каждый ускоритель умеет обрабатывать их ровно вдвое больше. Если RDNA 3 умели тестировать за такт по четыре пересечения с боксом и лишь один с треугольником, то теперь эти значения выросли до 8 и 2. Хотя возможности RT-блоков в последних решениях Intel и Nvidia все равно больше — например, у Blackwell скорость по пересечениям с треугольником вдвое выше.

Изображение: AMD

Есть и другие улучшения в Ray Accelerator: использование структуры BVH8 вместо BVH4 увеличивает производительность и снижает использование видеопамяти, объем структур BVH уменьшается. Новые RT-ядра поддерживают аппаратную трансформацию копий объектов (instance), что позволяет их копировать для сцены без дублирования в памяти, обрабатывая несколько образцов как один. В RDNA 4 также был изменен порядок операций при трассировке и обращения к памяти, шейдеры запрашивают данные из кэша без строгой очередности для улучшения общей эффективности, так как попадания и промахи в кэше меньше мешают друг другу. Но эти улучшения лишь немного повысили производительность ускорителей трассировки, а основной прирост дает удвоение производительности аппаратных движков пересечений:

Изображение: AMD

Еще из совсем нового в аппаратной трассировке на RDNA 4 можно отметить новый вид BVH-структур в виде ориентированных ограничивающих объемов (Oriented Bounding Boxes — OBB), которые могут быть ориентированы не по глобальным осям сцены, а по оси объектов. Таким образом улучшается эффективность обхода BVH, что дает прирост скорости в 10% по данным AMD. Обычно используют ограничивающие объемы, расположенные в пространстве по глобальным осям сцены, но чаще всего геометрия объектов имеет другую форму, которая не очень хорошо вписывается в них — это приводит к лишней трате ресурсов при тестировании лучей. AMD предлагает вариант ориентированных по оси объекта ограничивающих объемов, чтобы ориентировать их ближе к форме объекта — это сокращает количество лучей, необходимых для расчетов. Изменение ориентации ограничивающих примитивов относительно оси объектов позволит снизить количество итераций при поиске пересечений.

Изображение: AMD

Перечисленные улучшения повысили производительность RDNA 4 в трассировке и видеокарты AMD теперь уже не теряют слишком много производительности даже при сложной трассировке пути. Трассировка лучей на Radeon стала заметно лучше, чем в предыдущих поколениях RDNA, но конкуренты за эти годы ушли вперед. AMD постепенно улучшает характеристики своих RT-ядер, но и делает это не слишком оперативно. Некоторые новые возможности в RDNA 4 поддерживались еще в решениях архитектуры Turing главного конкурента, а некоторые до сих пор не получили аппаратной поддержки в Radeon. Например, аппаратная трансформация instance была в Turing, как и аппаратный обход BVH, которого так и нет в RDNA 4, по некоторым данным. Так что AMD хоть и приближается к Nvidia по производительности блоков трассировки лучей, но делает это уж слишком медленно — GeForce до сих пор лучше в этом деле. Но у AMD есть возможности быстро улучшить их GPU именно для сложных случаев типа трассировки пути, так как более простая трассировка не предъявляет особых требований к RT-блокам по их производительности. Пока обход дерева BVH в решениях AMD производится программно на обычных вычислительных SIMD-блоках, они проигрывают именно в тяжелых случаях трассировки, когда есть много расхождений лучей. При трассировке лучей для рассеянных отражений или глобального освещения лучи летят в разные стороны и сразу всему блоку SIMD нужно ждать завершения расчетов самых медленных лучей. Пока что даже в RDNA 4 не сделан полностью аппаратный обход, поэтому Radeon отстают в играх с трассировкой пути, а ведь он есть уже не только у Nvidia, но у Intel, Apple и даже в мобильных GPU.

Еще есть дополнительные функции, которые Nvidia давно продвигает, а та же AMD продолжает отставать от них и других производителей GPU по возможностям аппаратных блоков трассировки лучей. В частности, вскоре выйдет обновление DirectX Raytracing версии 1.2 с некоторыми важными улучшениями, направленными на увеличение производительности и эффективности. В частности это микрокарты непрозрачности (opacity micromaps — OMM) и переупорядочение выполнения шейдеров (shader execution reordering — SER) — динамическую группировку потоков инструкций для повышения когерентности обращений к памяти, что способно значительно повышать производительность при сложной трассировке, вроде трассировки пути. Они обеспечивают заметное повышение производительности при трассировке лучей в определенных условиях.

Микрокарты непрозрачности поддерживаются многими решениями Nvidia, они оптимизируют трассировку полупрозрачной геометрии, сокращая количество вызовов шейдеров, что дает улучшение производительности без потери качества. Переупорядочение выполнения шейдеров поддерживается чипами Nvidia и Intel и также обеспечивает повышение производительности рендеринга за счет интеллектуальной группировки выполнения шейдеров до двух раз в некоторых случаях. Пока что только графические процессоры Nvidia полностью поддерживают эти возможности, у Intel вроде бы есть SER и они планируют внедрить OMM в будущем, а вот по поводу уже вышедших решений AMD Radeon не очень понятно, будут ли они аппаратно поддерживать DXR 1.2. Зато в RDNA 4 есть функциональность Out of Order Memory, которая изменяет порядок получения данных из памяти, делая их независимым от очередности запросов.

Изображение: AMD

Трассировка лучей и ускорение матричных операций чувствительны к скорости и задержкам памяти, поэтому AMD решила внести некоторые изменения и в систему управления памятью, внедрив внеочередную память — Out-of-Order Memory Queuing. Так как математические операции выполняются волнами (waves), то взаимные зависимости между этими волнами иногда приводят к пропуску запросов, так как очередь запросов памяти из одной волны ждет окончания работы другой волны. Это можно исправить при помощи внеочередного управления памятью, которое повышает в том числе и эффективность трассировки лучей. И скоро мы узнаем, как все улучшения и изменения на нее повлияли.

Другие архитектурные изменения

Кроме этого, в RDNA 4 была переработана часть иерархии кэша и памяти — тут снова обошлось без особых подробностей, но что-то они всё же сделали в Infinity Cache, раз он стал «третьего поколения», хотя его емкость всё так же составляет 64 МБ, как было в Radeon RX 7900 GRE и Radeon RX 7800 XT. Единственный явный плюс по сравнению с предыдущим поколением в том, что теперь кэш снова размещен на том же кристалле, что и остальные блоки, в отличие от чиплетов RDNA 3, и это должно обеспечивать меньшие задержки и более высокую пропускную способность кэша.

А вот что не изменилось в RDNA 4, так это тип и скорость памяти. Nvidia использовала в прошлом поколении GDDR6X (но она была эксклюзивом для них), в GeForce RTX 50 перешла уже на GDDR7-память, а AMD продолжает использовать GDDR6-память со скоростью 20 Гбит/с. В сочетании с 256-битной шиной памяти это дает пропускную способность в 640 ГБ/с, что уже меньше, чем у конкурентов — даже у GeForce RTX 5070 этот показатель выше — 672 ГБ/с, не говоря уже о 896 ГБ/с для GeForce RTX 5070 Ti. Но у графических процессоров AMD есть большой Infinity Cache кэш, повышающий эффективную пропускную способность памяти, и его столько же, что и в Radeon RX 7900 GRE и Radeon RX 7800 XT — 64 МБ. Возможно, именно он делает переход на GDDR7-память не столь критичным для Radeon, но нужно учитывать, что один из конкурентов Radeon RX 9070 XT имеет на 40% более высокую ПСП именно из-за более скоростной памяти (28 Гбит/с против 20 Гбит/с). Кроме этого, в GeForce RTX 5070 Ti есть кэш-память второго уровня тоже немалого объема — 48 МБ.

Уже первые решения RDNA 4 получили поддержку внешнего интерфейса PCIe 5.0, удваивающего пропускную способность по сравнению с более привычной версией 4.0. На практике даже в самых сложных нагрузках сложно заметить разницу, видимую лишь в синтетических тестах и некоторых ИИ-нагрузках. В играх же даже PCIe 3.0 при полной ширине разъема в x16 будет достаточно в большинстве случаев, но поддержка 5.0 позволит выпустить бюджетные чипы со сниженным количеством линий — до x8 точно, а может и до x4.

Нам осталось поговорить о движках обработки видеоданных и вывода данных. Новый движок вывода информации на дисплеи в Navi 48 получил долгожданные аппаратные обновления, снижающие энергопотребление в режиме простоя в многомониторных конфигурациях, также внедрена аппаратная очередь кадров, снижающая нагрузку на процессор и повышающая энергоэффективность, а планирование кадров улучшает синхронизацию. Есть в движке и возможность для аппаратного повышения резкости изображения — Radeon Image Sharpening (RIS), получившая вторую версию — это повышение резкости картинки на уровне драйвера, использующее разработки алгоритма CAS (Contrast Aware Sharpening).

Изображение: AMD

Что касается возможностей именно вывода на дисплеи, то это современные разъемы DisplayPort 2.1a и HDMI 2.1b с максимальным битрейтом UHBR 13.5, что вдвое больше, чем у DisplayPort 1.4. Поддержка пропускной способности 54 Гбит/с (UHBR 13.5) означает возможность подключения 4K-дисплея одним кабелем — с частотой обновления до 240 Гц без использования сжатия видеопотока, а со сжатием Display Stream Compression можно использовать 4K при 480 Гц или 8K при 165 Гц. Но если в прошлом поколении у Radeon было преимущество перед аналогичными решениями Nvidia, ограниченными возможностями DisplayPort 1.4a, то теперь его нет. Более того, новые решения серии GeForce RTX 50 поддерживают версию DisplayPort 2.1b с пропускной способностью до 80 Гбит/с (UHBR 20) с лучшими характеристиками по выводу информации. Но это в теории, а в реальности отличие не дает особых преимуществ из-за крайней редкости мониторов с поддержкой таких возможностей.

Изображение: AMD

В чипе Navi 48 есть два медиадвижка для работы с видеоданными (кодирования и декодирования), в этом они схожи с конкурентами Nvidia, имеющими по два блока NVEnc и NVDec. Новый медиадвижок AMD обеспечивает улучшение качества кодирования форматов H.264 и H.265 с низкими задержками, а при кодировании AV1 теперь поддерживаются B-кадры, что повышает эффективность при том же битрейте. AMD говорит, что качество кодирования H.264 (AVC) было увеличено до 25%, а H.265 (HEVC) — на 11%, и это хорошо, так как по качеству кодирования видео AMD до сих пор отставала от Intel и Nvidia, чьи решения дают близкое качество картинки, превосходящее предыдущие Radeon. Если говорить о производительности, то медиадвижок показывает на 50% более высокую скорость кодирования AV1 и VP9 по сравнению с предшественником при сокращенном использовании видеопамяти.

FSR 4 и программные технологии

В серии RDNA 4 и Radeon RX 9070 (XT) появилась поддержка новой версии технологии FidelityFX Super Resolution 4 (FSR 4) — она получила крупнейшее обновление со времен FSR 2, в этой версии появился новый метод масштабирования кадров на основе нейросетей, и FSR 4 технологически приблизился к DLSS 3. Новые графические процессоры также могут использовать ИИ-ускорители для шумоподавления при трассировке лучей и пути, а вот технология генерации дополнительных кадров была перенесена из FSR 3, похоже, и есть ли в ней какие-то улучшения — неизвестно.

Изображение: AMD

FSR 4 будет существовать одновременно с FSR 3.1, и режим масштабирования без использования ИИ также останется. Пока что не очень понятно, как это будет работать, просто во всех играх с поддержкой FSR 3.1 можно будет использовать и более продвинутый алгоритм. FSR 4 же это не только масштабирование, алгоритм поддерживает и генерацию дополнительных кадров — также с участием ИИ-ускорителей в графических процессорах новой серии. AMD говорит о поддержке FSR 4 более чем в 30 играх на запуске серии Radeon RX 9070, а всего в этом году выйдет более 75 таких игр. Во многие игры поддержку добавили при помощи патчей, а в будущем выйдут и проекты с родной поддержкой новой технологии.

Изображение: AMD

Новая версия FSR использует искусственный интеллект в работе и способна задействовать такие преимущества архитектуры, как FP8-вычисления с увеличенным темпом на ИИ-ускорителях. Модели переобучили, они работают быстрее и с лучшим качеством, а нового в FSR 4 то, что это уже не просто технология повышения разрешения, использующая информацию из предыдущих кадров, но работающая на основе нейросети. К сожалению, это же ограничивает применение FSR 4 — в теории и старшие решения могут поддерживать новую технологию, но нужна определенная производительность, гарантированно доступная на RDNA 4 из-за удвоения темпа FP8-вычислений. AMD говорит о том, что для работы FSR 4 нужна матричная производительность от 779 AI TOPS, и у Radeon RX 9070 XT с этим всё в порядке, но из-за этих требований пропало преимущество версии FSR 3, работающей на всех решениях AMD и даже на графических процессорах конкурентов. Новый же вариант ИИ-масштабирования работает пока исключительно на видеокартах архитектуры RDNA 4.

Изображение: AMD

Вопрос качества FSR 4 в сравнении с DLSS требует отдельного тщательного рассмотрения, но что уже точно можно сказать по примерам самой AMD — качество картинки заметно увеличилось, FSR 4 отрисовывает многие детали даже более четко, чем рендеринг в родном разрешении. Это как минимум уровень DLSS 3, а местами новая технология AMD даже опередила своего конкурента... который еще чуть раньше выкатил DLSS 4 с дальнейшими улучшениями и поэтому снова ушел вперед, даже если не говорить о многокадровой генерации, а просто о качестве изображения, доступном на всей линейке GeForce RTX.

Изображение: AMD
Изображение: AMD

Улучшились и многие другие программные и программно-аппаратные инструменты. Под маркой Hypr-RX привычно собраны все решения по увеличению производительности: FSR, Radeon Anti-Lag, Radeon Boost и AMD Fluid Motion Frames (AFMF) — последний был улучшен и также предлагает более четкое изображение. FMF 2.1 обеспечивает улучшенное качество изображения и меньшие артефакты в виде ореолов, а инструмент повышения резкости изображения Radeon Image Sharpening был обновлен до второй версии. Функции повышения производительности Hypr-RX, работающие на уровне драйвера, могут быть полезными в некоторых случаях GPU недостаточной производительности, но вряд ли это справедливо для довольно мощных Radeon RX 9070 XT.

Изображение: AMD

Что касается остальных программных улучшений, то можно отметить удобное приложение драйвера «AMD Software», в котором есть способ сообщения об ошибках и артефактах в играх — AMD Image Inspector, также представлен локальный чат-бот, работающий на ИИ-ускорителях — AMD Chat, утилиты потокового вещания для стримеров, удобное средство для запуска игр, аппаратное ускорение шумопонижения AMD Noise Suppression и многое другое.

Изображение: AMD

AMD Chat — это чат-бот, специализирующийся на ответах на вопросы об оборудовании вашей системы, его можно спросить об условиях работы графического процессора, производительности и другом. Но стоит ли ради этого загружать 25 ГБ данных, если вы не планируете часто общаться с вашим ПК? Функция AI Apps Manager выдает список ПО, которые способны использовать ИИ-ускорители — из списка доступных для установки. Ну а Image Inspector помогает находить и сообщать об ошибках рендеринга и проблемах, связанных с GPU. Используя часть ресурсов GPU, эта функциональность может автоматически фиксировать ошибки рендеринга и отправлять их в AMD — любопытное нововведение и для самой компании это интересная возможность, но не очень понятно, как оно работает и будут ли этим пользоваться сами игроки.

Предварительная оценка производительности

Рассмотрим характеристики новой видеокарты AMD по сравнению с младшей моделью без индекса XT и близкими по позиционированию решениями из предыдущего поколения. По эффективной мощности Radeon RX 9070 XT близка сразу к Radeon RX 7900 XT и Radeon RX 7900 XTX, а по теоретическим характеристикам скорее ближе к Radeon RX 7900 GRE. По таблице как раз удобно прикинуть, насколько топовая модель нынешней линейки Radeon RX 9070 XT сопоставима с видеокартами прошлого поколения по пиковым характеристикам.

RX 9070 XT RX 9070 RX 7900 XTX RX 7900 XT RX 7900 GRE
Модель GPU Navi 48 Navi 31
Техпроцесс TSMC N4P TSMC N5/N6
Площадь GPU, мм 357 529
Блоки ALU 4096 3584 6144 5376 5120
Блоки TMU 256 224 384 336 320
Блоки ROP 128 128 192 192 160
RT-ускорители 64 56 96 84 80
ИИ-ускорители 128 112 - - -
Кэш Infinity Cache, МБ 64 96 80 64
Турбо-частота, МГц 2970 2520 2500 2400 2250
Объем памяти, ГБ 16 24 20 16
Скорость памяти, Гбит/с 20 18
Шина памяти, бит 256 384 320 256
ПСП, ГБ/с 640 960 800 576
Энергопотребление, Вт 304 220 355 300 260
Рекомендованная цена, $ 600 550 1000 900 550

Видеокарта Radeon RX 9070 XT основана на полной версии кристалла Navi 48 и по своим характеристикам похожа на Radeon RX 7800 XT, но компания позиционирует ее для замены флагманской модели прошлого поколения — Radeon RX 7900 XTX. Чтобы добиться этого, по сравнению с этой видеокартой были значительно увеличены тактовые частоты новинки — и игровая и турбо, они составляют 2,40 ГГц и 2,97 ГГц, соответственно. Пиковая теоретическая производительность Radeon RX 7900 XTX с учетом частот всё еще на четверть выше, но это компенсируется улучшениями новой архитектуры, которая должна выгодно отличаться по эффективности.

Теоретически, Radeon RX 9070 XT имеет пиковую вычислительную скорость 48,7 TFLOPS для FP32-вычислений, и до 1557 TOPS для ИИ-ускорителей и формата INT4 (с разреженностью матриц). Предыдущее же флагманское решение Radeon RX 7900 XTX предлагает целых 61,4 TFLOPS для FP32, но лишь 123 TOPS для ИИ-вычислений в формате INT8. Так что не знаем пока про игры, но для ИИ-задач ситуация точно изменится. То же самое касается аппаратных блоков ускорения трассировки лучей — в RDNA 4 их производительность (скорость расчета пересечения лучей с треугольниками и лучей с ограничивающими объемами) по сравнению с RDNA 3 увеличилась вдвое, и 64 новых RT-блока в 9070 XT по производительности соответствуют не менее чем 128 RT-блокам RDNA 3 RT, но в Radeon 7900 XTX их лишь 96, так что даже без остальных архитектурных улучшений новый чип имеет на треть большую производительность при трассировке лучей. Но важны и другие характеристики, вроде пропускной способности и емкости памяти. Если Radeon RX 7900 XTX имеет 384-битную шину и 24 ГБ памяти, то у Radeon RX 9070 XT это 256-битный интерфейса и лишь 16 ГБ всё той же GDDR6-памяти с производительностью 20 Гбит/с, так что предыдущий флагман имеет в полтора раза большую пропускную способность и емкость памяти, что тоже может сказываться на итоговой производительности.

Но теоретические характеристики графических процессоров — это далеко не всё, что нужно принимать во внимание, на итоговую реальную производительность влияет и эффективность разных блоков и GPU в целом. Например, сравнительно новая видеокарта Intel Arc B580 имеет пиковые характеристики вроде вычислительной производительности хуже, чем было у предыдущего Arc A770 (14,6 TFLOPS против 19,7 TFLOPS), но в реальных тестах новый B580 более чем на 15% быстрее из-за решения проблем с низкой эффективностью использования имеющихся ресурсов. Но даже новые решения Intel всё еще уступают решениям AMD и Nvidia из предыдущих поколений, не говоря о новинках. В свою очередь, конкретно серия GeForce RTX 50 не слишком сильно улучшила эффективность и производительность по сравнению с предшествующей линейкой, а что получилось у Radeon RX 9000 мы скоро узнаем по собственным тестам.

Изображение: AMD
Изображение: AMD

А пока что посмотрим на данные AMD, по которым новая видеокарта Radeon RX 9070 XT получилась быстрее решения предыдущего поколения Radeon RX 7900 GRE в 11 играх с растеризацией и 9 играх с трассировкой лучей в среднем на 42% в 4K-разрешении и на 38% быстрее в 2560x1440. Если разделить эти показатели, то в растеризации будет 37% и 33% дополнительной производительности в 4K и 1440p, а в играх с трассировкой лучей это уже целых 53% и 49% в тех же разрешениях. Но это собственные подсчеты AMD, которые даны лишь для примерной прикидки. Чуть позже появилось и официальное сравнение и с конкурентом — по тестам компании, их новая Radeon RX 9070 XT уступает GeForce RTX 5070 Ti всего лишь 2%, а с трассировкой лучей AMD немного отстает.

Изображение: AMD

Если верить этому сравнению, то Radeon RX 9070 XT и RDNA 4 — несомненный успех для AMD, они наконец-то смогли серьезно улучшить свою графическую архитектуру, устранив основные недостатки предыдущих — в RDNA 4 было усилено всё то, что требовало особого внимания, появились выделенные ИИ-ускорители и заметно ускорена аппаратная трассировка лучей. Почему этого пришлось ждать так долго — вопрос интересный. Вероятно, во времена RDNA 2 выход первых решений линейки GeForce RTX конкурента застал AMD врасплох, и они далеко не сразу смогли нагнать по функциональности своих соперников.

Зато теперь можно сказать, что AMD подтянулась к Nvidia по большому количеству параметров. В первую очередь по трассировке лучей — она всё еще отстает, но отрывы уже далеко не такие, как раньше. В новом GPU улучшена ИИ-производительность, что позволило внедрить поддержку FSR 4 — пусть в ней и нет многокадровой генерации, как у конкурента, но качество картинки было улучшено и в этом Radeon хоть и снова чуть-чуть не догнали GeForce, но разрыв также уменьшился. Это же касается и энергоэффективности — AMD подтянулась к Nvidia и по этому параметру, хотя решения последней продолжают быть лидерами, так как GeForce RTX 5070 Ti при полной нагрузке потребляет меньше энергии, чем Radeon RX 9070 XT.

Важно, что улучшения и новая функциональность хоть и привели к увеличению сложности GPU, но не площади кристалла — у AMD получилось удержать его во вменяемых рамках. Площадь Navi 48 равна 357 мм² — при том, что у Navi 31 один только основной кристалл имеет площадь в 300 мм². Если в RDNA 3 компания AMD упирала на то, что трассировка лучей и ИИ не очень нужны, то в RDNA 4 решили почти все основные моменты, связанные с отставанием от главного конкурента. Решения архитектуры RDNA 4 успешно конкурируют с Nvidia Blackwell и Intel Battlemage, хотя у последней пока что и нет видеокарт уровня Radeon RX 9070 (XT), да и у AMD еще не вышли менее дорогие и мощные GPU, но последнее уж точно вскоре произойдет.

Radeon RX 9070 XT действительно оказалась способна заменить Radeon RX 7900 XTX даже в играх без трассировки лучей. Пусть новинка и заметно медленнее теоретически, усовершенствования архитектуры позволили увеличить игровую производительность. В среднем, новый графический процессор условно среднего уровня даже обогнал предыдущего флагмана, но... сделать это же с тем же GeForce RTX 5070 Ti не смог. В играх с чистой растеризацией они близки, но включение трассировки дает преимущество решению Nvidia на 30%-60% в зависимости от сложности той самой трассировки. Да, теоретическая цена у Radeon RX 9070 XT ниже, чем у GeForce RTX 5070 Ti, но если вам важна производительность при трассировке (а сейчас она уже мало для кого совсем не важна), то выбор между Radeon RX 9070 XT и GeForce RTX 5070 Ti всё равно придется делать в пользу последней.

Технические улучшения RDNA 4 несомненны, но Radeon не стали функционально лучше GeForce. И если на новые решения Nvidia многие справедливо жалуются из-за невысокого прироста между поколениями, то у AMD дела хоть и лучше, но не слишком, ведь топовых решений в этом поколении AMD вообще не будет. Но самое главное, в чем Radeon RX 9070 XT потенциально лучше решений конкурента — это более выгодное соотношение цены и производительности. Если судить по рекомендованным ценам, то новинка AMD опережает и GeForce RTX 5070 и GeForce RTX 5070 Ti. Одна беда — на рынке по таким ценам видеокарты не найти, и GeForce RTX 5070 в реальности стоит дешевле той же Radeon RX 9070, хотя они равны по рекомендованным ценам. Так что смотреть нужно исходя из конкретной ситуации на данный момент. Главное, что Radeon RX 9070 XT стал более сильным конкурентом для игровых решений Nvidia, и это позволяет надеяться на дальнейший прогресс с обеих сторон. Но было бы очень неплохо, если бы у AMD появилось и настоящее флагманское решение — рынку нужен такой соперник, просто лучшим соотношением цены и производительности в среднем сегменте Nvidia не победить.

В остальном же — похоже, что изменение схемы наименования видеокарт для лучшего соответствия решениям конкурента вполне оправдалось — в разрешении 2560x1440 без трассировки лучей получился прирост производительности по сравнению с Radeon RX 7900 GRE примерно на треть, что пусть и не слишком много, но неплохо, особенно на уровне GeForce. Общая производительность Radeon RX 9070 XT без учета трассировки примерно соответствует GeForce RTX 5070 Ti, новая модель AMD находится примерно посередине между GeForce RTX 4070 Ti Super и GeForce RTX 4080 — это выше большинства ожиданий. При этом, новая видеокарта AMD этого поколения чуть не догнала флагман прошлого поколения — Radeon RX 7900 XTX, который остался на 3%-5% быстрее (без трассировки лучей, напомним). Также по энергоэффективности новый GPU не смог превзойти конкурентов Nvidia, но она немного улучшилась по сравнению с прошлым поколением Radeon.

Что же касается трассировки, то у AMD наконец-то получилось значительно увеличить ее производительность. По сравнению с RDNA 3 прирост производительности впечатляющий, но всё же Radeon RX 9070 XT отстает от GeForce RTX 5070 Ti, а вот GeForce RTX 5070 в среднем даже в играх с трассировкой медленнее — в том числе и из-за того, что у карты AMD целых 16 ГБ видеопамяти, а GeForce RTX 5070 имеет лишь 12 ГБ. Объем в 16 ГБ памяти является выигрышным, в некоторых играх в 4K-разрешении при трассировке лучей и генерации кадров уже не хватает 12 ГБ, а в будущем количество таких проектов лишь увеличится — игры всегда предъявляют всё более высокие требования к объему видеопамяти.

Важным делом стало и приближение последних поколений технологий DLSS и FSR по возможностям и качеству. Но если новинки Nvidia получили улучшенное качество масштабирования при помощи новых ИИ-моделей и многокадровую генерацию, то AMD еще только в самом начале этого процесса. Технология FSR 4 приблизилась к DLSS 3 по качеству и возможностям масштабирования и генерации кадров, но при этом потеряла важное преимущество в универсальности. Ведь FSR 4 полноценно работает только на решениях RDNA 4, а остальные видеокарты, включая предыдущие Radeon и всех конкурентов, этой поддержкой не обладают.

Если сравнивать Radeon RX 9070 (XT) с вышедшими чуть раньше решениями Nvidia GeForce RTX 50, то RDNA 4 содержит куда больше улучшений, по сравнению со слабо изменившейся Blackwell к Ada Lovelace. Но тут можно говорить как о том, что и Ada Lovelace на фоне RDNA 3 и RDNA 4 до сих пор хороша, а перспективные нововведения Blackwell скорее нацелены на будущее и возьмут свое тогда, когда начнут применяться в играх. В свою очередь, AMD любит просто улучшать сырую аппаратную производительность уже проверенных и точно полезных блоков. Наверное, самой важной новинкой в RDNA 4 стал увеличенный темп исполнения матричных вычислений, используемых в машинном обучении и нейросетях, но производительность ИИ-ускорителей в RDNA 4 также достигла лишь уровня видеокарт Nvidia пары поколений назад.

Но не будем принижать Radeon RX 9070 XT, по своей рекомендованной розничной цене — это действительно отличное предложение с производительностью выше, чем у Radeon RX 7900 XT из предыдущего поколения, также новинка лучше конкурирующей с ней GeForce RTX 5070 — она имеет больше памяти, обеспечивает более высокую производительность в растеризации и достаточную в трассировке, при стоимости лишь на $50 дороже. Да, у Nvidia есть всё же более эффективное аппаратное и более проработанное программное обеспечение, включая DLSS 4, которая явно превосходит FSR 4 и функционально и по распространенности — первая технология используется в гораздо большем количестве игр, а FSR 4 потеряла свое преимущество в универсальности. Но всё это имеет меньшее значение, чем реальные розничные цены.

Увы, многие модели Radeon RX 9070 XT партнеров компании продаются намного дороже объявленной цены — даже по собственным данным компаний, рекомендованные розничные цены на оригинальные варианты этой модели составляет $730-$750, что уже заметно больше стартовой цены в $600. И реальность показывает, что по ценам в магазинах Radeon RX 9070 XT пока что скорее ближе к Radeon RX 5070 Ti, чем к GeForce RTX 5070. И ближайший конкурент рассмотренной новинки именно GeForce RTX 5070 Ti, который предлагает чуть лучшую производительность при растеризации, всегда лучшую производительность при трассировке лучей, лучшую энергоэффективность и лучшую технологию повышения производительности (выше качество изображения и многокадровую генерацию). Так что нужно сравнивать реальные розничные цены, и если Radeon RX 9070 XT будет продаваться по цене на $150-$200 меньше GeForce RTX 5070 Ti, то в ней точно есть смысл. Если же разница в ценах меньше — решение Nvidia смотрится предпочтительнее.

На момент написания статьи в американских магазинах (Newegg, Amazon, B&H, Best Buy и т. д.) вообще не было в наличии видеокарт Radeon RX 9070 и Radeon RX 9070 XT, равно как и GeForce RTX 5090 и GeForce RTX 5080. Но GeForce RTX 5070 есть — при ценах, близких к рекомендованным (чуть выше), есть и GeForce RTX 5070 Ti, но уже с явно завышенными до $1000 ценами. На нашем рынке есть всё, кроме GeForce RTX 5090, пожалуй, но всё по завышенным ценам, и к рекомендованной ближе всего снова GeForce RTX 5070 — вероятно, Nvidia помогает начало продаж на несколько недель раньше. Сейчас ситуация сложнее обычного, если не брать майнинговое время с конца 2020 года, но почти каждый запуск видеокарт какое-то время проходит с дефицитом и завышенными ценами, и всё же есть вероятность, что к маю или июню поставки нормализуются — уж решения уровня GeForce RTX 5070 (Ti) и Radeon RX 9070 (XT) вряд ли широко используются нейросетевиками и должны появиться в широкой продаже уже по нормальным ценам.

На этих позитивных ожиданиях переходим к рассмотрению практических особенностей видеокарты Radeon RX 9070 XT в исполнении компании Gigabyte.

Особенности карты Gigabyte Aorus Radeon RX 9070 XT Elite 16G (16 ГБ)

Сведения о производителе: Компания Gigabyte Technology (торговая марка Gigabyte) основана в 1986 году в Китайской Республике (Тайвань). Штаб-квартира в Тайбэе/Тайвань. Изначально создавалась как группа разработчиков и исследователей. В 2004 году на базе компании был образован холдинг Gigabyte, в который вошли Gigabyte Technology (разработка и производство видеокарт и материнских плат для ПК); Gigabyte Communications (производство коммуникаторов и смартфонов под маркой GSmart (с 2006 г.

Объект исследования: серийно выпускаемый ускоритель трехмерной графики (видеокарта) Gigabyte Aorus Radeon RX 9070 XT Elite 16G 16 ГБ 256-битной GDDR6

Gigabyte Aorus Radeon RX 9070 XT Elite 16G 16 ГБ 256-битной GDDR6
Параметр Значение Номинальное значение (референс)
GPU Radeon RX 9070 XT (Navi48)
Интерфейс PCI Express x16 5.0
Частота работы GPU (ROPs), МГц BIOS P: 3100(Boost)—3142(Max)
BIOS S: 3100(Boost)—3125(Max)
2970(Boost)—3090(Max)
Частота работы памяти (физическая, МГц (ПСП, ГТ/с)) 2500 (20) 2500 (20)
Ширина шины обмена с памятью, бит 256
Число вычислительных блоков в GPU 64
Число операций (ALU/CUDA) в блоке 64
Суммарное количество блоков ALU/CUDA 4096
Число блоков текстурирования (BLF/TLF/ANIS) 256
Число блоков растеризации (ROP) 128
Число блоков Ray Tracing 64
Число тензорных блоков 128
Размеры, мм 340×135×60 320×120×50
Количество слотов в системном блоке, занимаемые видеокартой 3 3
Цвет текстолита черный черный
Энергопотребление пиковое в 3D, Вт (BIOS P/BIOS S) 340/340 350
Энергопотребление в режиме 2D, Вт 18 18
Энергопотребление в режиме «сна», Вт 4 4
Уровень шума в 3D (максимальная нагрузка), дБА (BIOS P/BIOS S) 29,4/25,1 33,0
Уровень шума в 2D (просмотр видео), дБА 18,0 18,0
Уровень шума в 2D (в простое), дБА 18,0 18,0
Видеовыходы 2×HDMI 2.1b, 2×DisplayPort 2.1a 1×HDMI 2.1b, 3×DisplayPort 2.1a
Поддержка многопроцессорной работы нет
Максимальное количество приемников/мониторов для одновременного вывода изображения 4 4
Питание: 8-контактные разъемы 3 3
Питание: 6-контактные разъемы 0 0
Питание: 16-контактные разъемы 0 0
Вес карты с комплектом поставки (брутто), кг 2,2 2,4
Вес карты чистый (нетто), кг 1,55 1,7
Максимальное разрешение/частота, DisplayPort 3840×2160@240 Гц, 7680×4320@120 Гц
Максимальное разрешение/частота, HDMI 3840×2160@144 Гц, 7680×4320@120 Гц
Минимальная стоимость карт на базе Radeon RX 9070 XT 105 000 рублей

Память

Карта имеет 16 ГБ памяти GDDR6 SDRAM, размещенной в 8 микросхемах по 16 Гбит на лицевой стороне PCB. Микросхемы памяти SK Hynix (H56G42AS8DX014) рассчитаны на номинальную частоту работы в 2500 МГц (эффективная ПСП 20 ГТ/с, или 20 Гбит/с).

В случае GDDR7 физическую частоту надо умножать на 12: технология кодирования PAM3 (3 Pulse Amplitude Modulation) × 2 (двойная передача сигнала (DDR)) × 2 (два канала) = 12.

В случае GDDR6X физическую частоту надо умножать на 16: технология кодирования PAM4 (4 Pulse Amplitude Modulation) × 2 (двойная передача сигнала (DDR)) × 2 (два канала) = 16.

В случае GDDR6 физическую частоту надо умножать на 8: технология кодирования PAM2 (2 Pulse Amplitude Modulation) × 2 (двойная передача сигнала (DDR)) × 2 (два канала) = 8.

Особенности карты и сравнение с Gigabyte Radeon RX 7800 XT Gaming (16 ГБ)

Gigabyte Aorus Radeon RX 9070 XT Elite 16G (16 ГБ) Gigabyte Radeon RX 7800 XT Gaming (16 ГБ)
вид спереди
вид сзади

Мы сравниваем Radeon RX 9070 XT с Radeon RX 7800 XT из предыдущего поколения по двум причинам: во-первых, компания AMD позиционирует Radeon RX 9070/XT как среднеуровневые решения, а во-вторых, ускоритель Radeon RX 7700 XT, для которого Radeon RX 9070 XT кажется логичным продолжением (наличие цифры 7 в названии) имеет 192-битную шину обмена с памятью, а не 256-битную.

Прекрасно видно, что, карты отличаются кардинально. Во-первых, сами графические ядра различаются по размерам как кристаллов, так и упаковок, во-вторых, совершенно иное расположение микросхем памяти вокруг GPU.

В традициях AMD ядро имеет зашифрованную числовую маркировку, произведено на 52-й неделе 2024 года (кристалл выполнен по техпроцессу TSMC N4P — по разным оценкам это 4 нм).

Суммарное количество фаз питания у карты Gigabyte Aorus Radeon RX 9070 XT Elite 16G — 17 (14+3).

Зеленым цветом отмечена схема питания ядра (14 фаз), красным — памяти (3 фазы).

У карты имеется два ШИМ-контроллера Monolithic Power Systems MP2868, они работают в паре и управляют обеими схемами питания.

В преобразователе питания ядра и микросхем памяти используются транзисторные сборки DrMOS — MP87993 той же компании MPS, рассчитанные на 90 А.

Выделенного контроллера для мониторинга (отслеживания напряжений и температур) нет, эта функция опять же в традициях AMD возложена на GPU.

Управление подсветкой у видеокарт Gigabyte осуществляется контроллером Holtek.

Карта имеет два режима работы, они заложены в двух вариантах BIOS, которые переключаются с помощью переключателя на переднем торце карты: P (performance / производительный) и S (silent / тихий). Разница между режимами заключается, по сути, только в оборотах вентиляторов, предел энергопотребления в обоих случаях составляет 350 Вт.

Штатные частоты памяти равны референсным значениям. А Boost-значение частоты работы ядра в обоих режимах BIOS P/BIOS S выше референсного на 4,3%. При этом максимальная частота GPU у карты Gigabyte выше референсной всего на 1,5%. Исследования показали, что карта Gigabyte продемонстрировала производительность в играх выше референсной на 3,3% (в среднем в разрешении 2.5K).

Энергопотребление карты Gigabyte в тестах доходило до 340 Вт (в обоих режимах BIOS P/S).

Лимит потребления можно поднять на 10%, поэтому мы попробовали ручной разгон, получив стабильную работу карты на частоте ядра 3271 МГц, при этом частота работы памяти не понималась выше 2605 МГц (речь о физической частоте), так что ПСП выросла не сильно — до 21 МТ/с. В итоге в среднем мы получили прирост производительности 4,6% в разрешении 2.5K.

Питание на карту Gigabyte подается через три 8-контактных разъема питания стандарта PCIe 2.0.

Отметим большие габариты данной карты, 34 см в длину, 13,5 см по высоте и 6 см толщиной. В результате видеокарта занимает 3 слота в системном блоке.

Карта имеет стандартный набор видеовыходов: два DP 2.1a и два HDMI 2.1b.

Управление работой карты обеспечивается с помощью фирменной программы Gigabyte Control Center.

Панель управления вентиляторами
Панель автоматического разгона GPU
Панель выбора предустановленных режимов работы карты (с упором в энергоэффективность или производительность)
Панель ручных настроек работы карты

Нагрев и охлаждение

Мы видим кулер со сквозным продувом хвостовой части радиатора. Основой СО является огромный многосекционный пластинчатый никелированный радиатор с тепловыми трубками, распределяющими тепло по ребрам радиатора.

8 трубок припаяны к большой медной никелированной пластине, которая охлаждает как ядро, так и микросхемы памяти. Для охлаждения преобразователей питания VRM имеются свои подошвы на радиаторе. Задняя пластина не только служит элементом защиты PCB, но и участвует в охлаждении тыльной стороны PCB в области ядра через термопрокладки.

В качестве термоинтерфейса для охлаждения микросхем памяти и преобразователей питания VRM используются так называемые жидкие термопрокладки (термогель). Это, по сути, одноразовый интерфейс, его можно использовать вторично, но потребуется ювелирная работа по формированию требуемых поверхностей для равномерного распределения.

Поверх радиатора установлен кожух с тремя вентиляторами ∅96 мм, имеющими по 7 лопастей и работающими на единой частоте вращения.

В традициях карт Gigabyte, средний вентилятор вращается в противоположную сторону, образуя с крайними вентиляторами «эффект шестеренок», помогающий бороться с турбулентностью воздушных потоков.

Остановка вентиляторов при малой нагрузке на видеокарту происходит, если температура GPU опускается ниже 50 градусов, а нагрев микросхем памяти ниже 85 градусов. При запуске ПК вентиляторы работают, однако после загрузки видеодрайвера идет опрос рабочей температуры, и они выключаются. Ниже есть видеоролик на эту тему.

Мониторинг температурного режима:

Режим BIOS P:

После прогона под нагрузкой максимальная температура ядра не превысила 64 градусов, а микросхем памяти — 90 градусов, что является хорошим результатом для карт такого уровня. Энергопотребление карты доходило до 340 Вт. Напомним, что предельный нагрев GDDR6 — 115 °C.

Мы засняли и ускорили в 50 раз 8-минутный прогрев

Максимальный нагрев наблюдался в области ядра, нижней части PCB около разъема PCIe, а также около разъема питания карты.

При ручном разгоне нагрев вырос незначительно (65/92 °C), однако потребление скакнуло до 375 Вт.

Режим BIOS S:

После прогона под нагрузкой максимальная температура ядра не превысила 68 градусов, микросхем памяти — 94 градуса, что также является нормальным результатом. Энергопотребление карты доходило до 340 Вт.

Шум

Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.

Режимы измерения:

  • Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
  • Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
  • Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark

Оценка градаций уровня шума следующая:

  • менее 20 дБА: условно бесшумно
  • от 20 до 25 дБА: очень тихо
  • от 25 до 30 дБА: тихо
  • от 30 до 35 дБА: отчетливо слышно
  • от 35 до 40 дБА: громко, но терпимо
  • выше 40 дБА: очень громко

В режиме простоя в 2D температура была не выше 31 °C, вентиляторы не работали, уровень шума был равен фоновому — 18 дБА.

При просмотре фильма с аппаратным декодированием ничего не менялось.

Режим BIOS P:

В режиме максимальной нагрузки в 3D температура достигала 64/90 °C (ядро/память). Вентиляторы при этом раскручивались до 1890 оборотов в минуту, шум вырастал до 29,4 дБА: это всё еще тихо.

Аудиозапись шума — здесь. Спектрограмма шума:

Режим BIOS S:

В режиме максимальной нагрузки в 3D температура достигала 68/91 °C (ядро/память). Вентиляторы при этом раскручивались до 1525 оборотов в минуту, шум вырастал до 25,1 дБА: это тем более тихо, даже очень тихо.

Подсветка

Карта имеет подсветку в трех зонах.

Логотип на верхнем торце
Акриловая вставка на заднем торце
По ободам трех вентиляторов

Основной элемент подсветки — это фирменная подсветка вентиляторов Gigabyte Halo: светодиоды расположены на внутренней стороне кожуха по периметру каждого вентилятора. Совместно с вращающимися лопастями вентиляторов они образуют интересные световые эффекты.

Управление режимами подсветки, в том числе и ее отключением, осуществляется той же утилитой Gigabyte Control Center.

Имеется возможность сохранения выбранного режима в самой карте, то есть при желании можно настроить подсветку один раз и больше не запускать программу.

Отметим, что синхронизация подсветки возможна только с материнскими платами Gigabyte, но при этом выбор сценариев сокращается. Возможности синхронизации подсветки с иными материнскими платами нет.

Комплект поставки и упаковка

В комплекте поставки кроме карты и краткого руководства имеется еще разборная подставка под видеокарту с регулируемым по высоте упором, а также бонусная наклейка.

Тестирование: синтетические тесты

Мы провели тестирование новой модели видеокарты AMD со стандартными частотами в нашем наборе синтетических тестов. Он продолжает меняться, иногда добавляются новые тесты, а устаревшие постепенно убираются. Мы бы хотели добавить еще больше примеров с вычислениями, но с этим есть определенные сложности. Мы постоянно стараемся расширять и улучшать набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — напишите их в комментариях к статье или отправьте авторам.

Из более-менее новых бенчмарков мы начали использовать несколько дополнительных тестов для измерения производительности трассировки лучей и, а также технологий масштабирования разрешения и увеличения производительности: DLSS, FSR и XeSS. В качестве полусинтетических тестов у нас также используется набор подтестов из довольно популярного пакета 3DMark: Time Spy, Port Royal, DX Raytracing, Speed Way и др. А вот примеры приложений DirectX 11 и 12, входящие в различные SDK, пришлось убрать — последнее время они всё чаще давали некорректные результаты. Зато мы добавили тесты ИИ-нагрузок в виде нейросетевых вычислений.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon RX 9070 XT со стандартными параметрами (RX 9070 XT)
  • Radeon RX 7900 XTX со стандартными параметрами (RX 7900 XTX)
  • Radeon RX 7900 XT со стандартными параметрами (RX 7900 XT)
  • GeForce RTX 5070 Ti со стандартными параметрами (RTX 5070 Ti)
  • GeForce RTX 5070 со стандартными параметрами (RTX 5070)

Для анализа производительности видеокарты Radeon RX 9070 XT мы использовали две модели Radeon из предыдущего поколения — RX 7900 XTX и RX 7900 XT. Они обе основаны на топовом чипе Navi 31 в разных версиях, и именно против них выставляет новую модель сама AMD, считая, что новинка справится с уровнем производительности недавнего флагмана. Ну а если и не везде справится с самым топом, то уж со второй то моделью точно. Можно было бы добавить еще и RX 7900 GRE, но уж она то точно должна быть медленнее.

Конкурентов у рассматриваемой сегодня видеокарты и на рынке всего два — это пара моделей GeForce из совсем свежей линейки Nvidia GeForce RTX 50. Да, RTX 5070 стоит дешевле рассматриваемого Radeon, с ней конкурирует скорее младшая RX 9070, а вот RTX 5070 Ti уже явно дороже, и они расположены по цене по разные стороны от рассматриваемой сегодня модели, так что прямого сравнения не получится. Но обе эти видеокарты являются соперниками для RX 9070 XT, и по сравнению с ними будет видно, насколько в RDNA 4 смогли улучшить как производительность в целом, так и исправить основные недостатки RDNA 3.

Тесты 3DMark Vantage
Тесты Direct3D 12
Тесты трассировки лучей
Вычислительные тесты
Тесты технологий DLSS/XeSS/FSR

Тестирование: игровые тесты

Конфигурация тестового стенда

Конфигурация тестового стенда

Список инструментов тестирования

Во всех игровых тестах использовалось максимальное качество графики в настройках.

  • Black Myth: Wukong (Game Science/Game Science)
  • Cyberpunk 2077 (Софтклаб/CD Projekt RED), патч 2.21 (январь 2025 г.)
  • Senua’s Saga: Hellblade II (Ninja Theory/Xbox Games)
  • Call of Duty: Modern Warfare II (Infinity Ward/Activision) (без трассировки и DLSS/FSR/XeSS!)
  • Alan Wake 2 (Remedy/Epic Games)
  • Ratchet and Clank: Rift Apart (Insomniac Games/Sony/Софтклаб)
  • Ghost of Tsushima Director’s Cut (Sucker Punch Productions/Sony Interactive)
  • Hogwarts Legacy (Avalance Software/Warner Bros)
  • Avatar: Frontiers of Pandora (Ubisoft)
  • Atomic Heart (Mundfish/VK)
  • Indiana Jones and the Great Circle (Machine Games/Bethesda Softworks) (с RT и DLSS/FSR/XeSS!)

Кратко о производительности в 3D-играх

Перед демонстрацией детальных тестов мы приводим краткие сведения о производительности семейства, к которому относится конкретный исследуемый ускоритель, а также его соперников. Всё это нами субъективно оценивается по шкале из семи градаций.

Игры без использования трассировки лучей (классическая растеризация):

В классических играх Radeon RX 9070 XT по производительности выходит на один уровень с GeForce RTX 4080, чуть обгоняет GeForce RTX 4070 Ti Super и Radeon RX 7900 XTX и чуть отстает от GeForce RTX 5070 Ti. Это позволяет получить высокий уровень комфорта в играх на максимальных настройках качества во всех разрешениях до 4K включительно.

Игры с использованием трассировки лучей и DLSS/FSR/XeSS:

В играх с активной трассировкой лучей и разными видами апскейлинга (FSR/XeSS) Radeon RX 9070 XT находится на одном уровне с GeForce RTX 4070 Ti, чуть выше GeForce RTX 4070 Super и весьма существенно опережает флагмана предыдущего поколения Radeon RX 7900 XTX. В разрешениях до 2.5K включительно можно получить хороший комфорт в играх на высоких настройках графики, а во многих играх приемлемая производительность будет и в 4K, однако в некоторых играх использование трассировки лучей надо сочетать с технологиями динамического масштабирования).

Результаты тестирования в 3D-играх

Стандартные результаты тестов без использования аппаратной трассировки лучей в разрешениях 1920×1080, 2560×1440 и 3840×2160

Black Myth: Wukong
Cyberpunk 2077 v.2.21
Senua’s Saga: Hellblade II
Call of Duty: Modern Warfare II
Alan Wake 2
Ratchet and Clank: Rift Apart
Ghost of Tsushima Director’s Cut
Hogwarts Legacy
Avatar: Frontiers of Pandora
Atomic Heart

Результаты тестов со включенной аппаратной трассировкой лучей и/или DLSS/FSR/XeSS в разрешениях 1920×1080, 2560×1440 и 3840×2160

Black Myth: Wukong, RT+DLSS/FSR/XeSS
Cyberpunk 2077 v.2.21, RT
Cyberpunk 2077 v.2.21, RT + DLSS/FSR
Senua’s Saga: Hellblade II, DLSS/FSR/XeSS
Alan Wake 2, RT
Alan Wake 2, RT + DLSS/FSR
Ratchet and Clank: Rift Apart, RT
Ratchet and Clank: Rift Apart, RT + DLSS/FSR/XeSS
Ghost of Tsushima Director’s Cut, DLSS/FSR/XeSS
Hogwarts Legacy, RT
Hogwarts Legacy, RT + DLSS/FSR/XeSS
Avatar: Frontiers of Pandora, RT
Avatar: Frontiers of Pandora, RT + DLSS/FSR
Atomic Heart, DLSS/XeSS
Indiana Jones and the Great Circle, RT
Indiana Jones and the Great Circle, RT + DLSS/FSR/XeSS

Желающие изучить наши результаты детально, пересчитать рейтинги, исходя из своих локальных розничных цен, могут скачать таблицу (Excel) здесь (ZIP-архив).

Рейтинг iXBT.com

Методика расчета рейтингов

Рейтинг ускорителей iXBT.com демонстрирует нам функциональность видеокарт друг относительно друга и представлен в двух вариантах:

  1. Вариант рейтинга iXBT.com без включения RT

Рейтинг составлен по всем тестам без использования технологий трассировки лучей. Этот рейтинг нормирован по наиболее слабому ускорителю из группы карт — Arc A310 (то есть сочетание скорости и функций Arc A310 приняты за 100%). Рейтинги ведутся по 30 регулярно исследуемым нами акселераторам в рамках проекта Лучшая видеокарта месяца. В данном случае из общего списка выбрана группа карт для анализа, в которую входят Radeon RX 9070 XT и его конкуренты.

Рейтинг приведен для разрешения 2.5K.

Модель ускорителя Рейтинг iXBT.com Рейтинг полезности Цена, руб.
05 Gigabyte Aorus RX 9070 XT, разгон до 3271 МГц/21 ГТ/с 1842 169 109 000
06 Gigabyte Aorus RX 9070 XT, 3100—3142 МГц/20 ГТ/с 1824 167 109 000
07 GeForce RTX 5070 Ti 16 ГБ, 2450—2790 МГц/28 ГТ/с 1818 173 105 000
08 RTX 4080 16 ГБ, 2505—2625 МГц/22,4 ГТ/с 1774 136 130 000
09 RX 9070 XT 16 ГБ, 2970—3090 МГц/20 ГТ/с 1754 167 105 000
10 RX 7900 XTX 24 ГБ, 2500—2990 МГц/20 ГТ/с 1722 145 119 000
12 RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 ГТ/с 1587 156 102 000

В обычных играх с растеризацией Radeon RX 9070 XT чуть-чуть обошел флагмана предыдущего поколения Radeon RX 7900 XTX и оказался на 10% быстрее, чем GeForce RTX 4070 Ti Super, но тоже совсем чуть-чуть отстал от GeForce RTX 4080, а GeForce RTX 5070 Ti оказался быстрее на 3,5%. Карта Gigabyte в силу фабрично повышенных частот работы обошла всех соперников.

  1. Вариант рейтинга iXBT.com с включением RT/DLSS/FSR/XeSS

Рейтинг составлен по 10 тестам, в которых используется технология трассировки лучей и одновременно технология Nvidia DLSS, AMD FSR или Intel XeSS. Этот рейтинг нормирован по самому слабому ускорителю в данной группе — Arc A310 (то есть сочетание скорости и функций Arc A310 приняты за 100%).

Рейтинг приведен для разрешения 2.5K.

Модель ускорителя Рейтинг iXBT.com Рейтинг полезности Цена, руб.
03 GeForce RTX 5070 Ti 16 ГБ, 2450—2790 МГц/28 ГТ/с 5818 554 105 000
06 RTX 4080 16 ГБ, 2505—2625 МГц/22,4 ГТ/с 4906 377 130 000
08 RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 ГТ/с 4466 438 102 000
09 Gigabyte Aorus RX 9070 XT, разгон до 3271 МГц/21 ГТ/с 4217 387 109 000
10 Gigabyte Aorus RX 9070 XT, 3100—3142 МГц/20 ГТ/с 4184 384 109 000
12 RX 9070 XT 16 ГБ, 2970—3090 МГц/20 ГТ/с 4020 383 105 000
15 RX 7900 XTX 24 ГБ, 2500—2990 МГц/20 ГТ/с 3423 288 119 000

В играх, где задействованы RT и технологии динамического масштабирования, ситуация для Radeon RX 9070 XT выглядит менее радужно, хотя флагмана предыдущего поколения Radeon RX 7900 XTX он опять же обошел на 17%.

Зато GeForce RTX 4070 Ti Super оказался быстрее на 11%, а GeForce RTX 5070 Ti — на 44%. Здесь сыграло роль активное использование DLSS с многокадровой генерацией в 4 играх из 10, а технология AMD FSR4 (аналог многокадровой генерации) пока еще не работает в тех же играх. Ждем нужного обновления для Ratchet & Clark).

Рейтинг полезности

Рейтинг полезности тех же карт получается, если показатель предыдущего рейтинга разделить на цены соответствующих ускорителей. Для расчета рейтинга полезности использованы розничные цены на март 2025 года.

  1. Вариант рейтинга полезности без включения RT

Рейтинг приведен для разрешения 2.5K.

Модель ускорителя Рейтинг полезности Рейтинг iXBT.com Цена, руб.
13 GeForce RTX 5070 Ti 16 ГБ, 2450—2790 МГц/28 ГТ/с 173 1818 105 000
17 Gigabyte Aorus RX 9070 XT, разгон до 3271 МГц/21 ГТ/с 169 1842 109 000
19 Gigabyte Aorus RX 9070 XT, 3100—3142 МГц/20 ГТ/с 167 1824 109 000
20 RX 9070 XT 16 ГБ, 2970—3090 МГц/20 ГТ/с 167 1754 105 000
23 RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 ГТ/с 156 1587 102 000
24 RX 7900 XTX 24 ГБ, 2500—2990 МГц/20 ГТ/с 145 1722 119 000
25 RTX 4080 16 ГБ, 2505—2625 МГц/22,4 ГТ/с 136 1774 130 000

В данном случае соперники в лице Radeon RX 9070 XT и GeForce RTX 5070 Ti идут ноздря в ноздрю, карта Gigabyte тоже от них практически не отличается.

  1. Вариант рейтинга полезности с включением RT/DLSS/FSR/XeSS

Рейтинг приведен для разрешения 2.5K.

Модель ускорителя Рейтинг полезности Рейтинг iXBT.com Цена, руб.
01 GeForce RTX 5070 Ti 16 ГБ, 2450—2790 МГц/28 ГТ/с 554 5818 105 000
08 RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 ГТ/с 438 4466 102 000
14 Gigabyte Aorus RX 9070 XT, разгон до 3271 МГц/21 ГТ/с 387 4217 109 000
16 Gigabyte Aorus RX 9070 XT, 3100—3142 МГц/20 ГТ/с 384 4184 109 000
17 RX 9070 XT 16 ГБ, 2970—3090 МГц/20 ГТ/с 383 4020 105 000
18 RTX 4080 16 ГБ, 2505—2625 МГц/22,4 ГТ/с 377 4906 130 000
26 RX 7900 XTX 24 ГБ, 2500—2990 МГц/20 ГТ/с 288 3423 119 000

Безусловно, пока технология AMD FSR4 не будет массово внедрена в игры, конкуренты из стана Nvidia окажутся более интересными, так как поддержкой DLSS с MFG обладают уже сотни игр (прежде всего благодаря приложению Nvidia, позволяющему включить MFG в играх, у которых имеется поддержка DLSS 3). А вот про GeForce RTX 4080 и Radeon RX 7900 XTX с их нынешними ценами можно уже забыть: они должны или сильно подешеветь, чтобы сверкнуть на закате своего существования, или пропасть с прилавков окончательно.

Выводы и сравнение энергоэффективности

Ускоритель Radeon RX 9070 XT (16 ГБ) позиционируется компанией AMD как продукт среднего уровня. Поэтому и рекомендованные розничные цены выставлены на уровне 600 долларов, хотя сейчас практически никто из партнеров AMD их не соблюдает — мы видим на прилавках такие карты по сильно завышенным ценам. Ранее среднеуровневые продукты из серии Radeon получали названия типа Radeon RX 5700 XT и Radeon RX 7700 XT, так что в данном случае напрашивалось название Radeon RX 9700 XT, но в AMD посчитали, что им выгоднее поменять систему названий и приблизить ее к той, которой пользуется конкурент Nvidia (GeForce RTX 4070, GeForce RTX 5070 и т. д.). В результате семерка поменяла свое место и мы получили Radeon RX 9070 XT.

Поколение 8000 и вовсе оказалось пропущено: после Radeon RX 7000 вышли сразу Radeon RX 9000. Это сделано, чтобы числовые обозначения поколения процессоров AMD и видеокарт на базе GPU того же производителя были одинаковыми: сейчас актуально поколение Ryzen 9000, поэтому и Radeon RX 9000.

Стоимость всех современных видеокарт — очень больная тема. Уже понятно, что рекомендованных розничных цен (MSRP) никто в ближайшей перспективе не увидит, даже с поправкой на налоги. Может быть, только ближе к выходу следующего поколения, но и то вряд ли. Это касается как видеокарт на базе Nvidia GeForce, так и аналогов на базе AMD Radeon.

Судите сами: 600 долларов — это на момент подготовки обзора примерно 51 тысяча рублей. Понятно, что цена без налогов, поэтому прибавляем 20% НДС, получаем 61 тысячу. И даже если учесть аппетиты торговых компаний, мы всё равно получаем не более 75 тысяч. А реальные цены на такие карты сейчас выше 100 тысяч (в редких случаях близки к 100 тысячам из-за локальных акций и скидок). Все партнеры AMD подняли отпускные цены на свою продукцию значительно выше MSRP.

Для нашего рейтинга полезности мы взяли за ориентир 105 тысяч рублей: по такой минимальной цене на момент подготовки обзора можно было реально найти Radeon RX 9070 XT на маркетплейсах. Для протестированной карты Gigabyte минимальная цена в то же время составляла 109 тысяч рублей (этот продукт относится к дорогому семейству Aorus).

Еще на примерах видеокарт на базе новых GPU Nvidia мы убедились, что в современных реалиях программная часть работы ускорителей становится всё более весомой, всё активнее использует имеющиеся наработки в области ИИ (нейронных сетей), а аппаратная часть GPU должна иметь нужные для быстрых вычислений блоки. Именно с этой целью AMD представила свою технологию FSR 4, которая в какой-то степени может являться аналогом Nvidia DLSS 4 (Multiframe Generation).

Она уже поддерживается во многих играх с FSR 3.1 при помощи переопределения в драйвере. Качество изображения при использовании новой версии масштабирования было значительно улучшено, стабильность изображения не доходит до уровня DLSS 4 с применением модели трансформера, но многие детали в кадре превосходят возможности предыдущей версии DLSS 3, что можно считать несомненным успехом. А вот по генерации кадров нет никаких улучшений: сохранилось удвоение частоты кадров при том же качестве, тогда как в Blackwell появилась уже многокадровая генерация. И хотя Nvidia до сих пор имеет некоторое преимущество и по качеству масштабирования и по генерации кадров, это преимущество с RDNA 4 значительно уменьшилось.

Наверное, не имеет смысла снова повторять, что Radeon RX 9070 XT не является флагманом. AMD с самого начала однозначно заявила, что на данном этапе (то есть в текущем поколении) они флагманские карты выпускать не будут. Судя по спросу на новые карты на западном рынке, компании удалось неплохо просчитать стратегию и получить приличную отдачу от выпуска среднеуровневых ускорителей в попытке захватить долю в самом массовом ценовом сегменте.

Если посмотреть на энергоэффективность, то Radeon RX 9070 XT по этому показателю ожидаемо находится где-то в середине списка.

Энергоэффективность

Компания AMD сделала приличный шаг вперед в архитектуре RDNA 4 сразу в нескольких важных областях, в которых их решения ранее сильно отставали от соперничающих с ними видеокарт Nvidia. Была значительно улучшена производительность трассировки лучей — в большинстве существующих игр с трассировкой лучей Radeon RX 9070 XT достиг как минимум уровня GeForce RTX 5070, хотя в сложных случаях с трассировкой пути отставание по эффективности RT-ядер всё еще остается. Новый GPU получил и аппаратные ИИ-ускорители, которые также несколько отстают по скорости и возможностям от аналогичных блоков Nvidia, но обеспечивают существенные улучшения в различных ИИ-нагрузках, включая поддержку новой версии технологии масштабирования FSR 4, помогающей повысить производительность.

Конкретная протестированная карта Gigabyte Aorus Radeon RX 9070 XT Elite 16G (16 ГБ) имеет крупные размеры 34×13 см и занимает 3 слота в системном блоке. Карта может потреблять до 340 Вт (официальный лимит AMD — 350 Вт) и имеет три 8-контактных разъема питания PCIe 2.0. Кулер тихий. У карты 4 видеовыхода: 2 HDMI 2.1b и 2 DisplayPort 2.1a — последний обеспечивает пропускную способность до 80 Гбит/с в режиме передачи UHBR 20 и позволяет подключить 8K-дисплей с частотой обновления 60 Гц по одному кабелю. Карта имеет стильный и симпатичный дизайн, снабжена фирменной подсветкой Halo, создающей красивые эффекты при вращении вентиляторов.

Еще раз отметим, что в классических играх Radeon RX 9070 XT может обеспечить высокий уровень комфорта в играх на максимальных настройках качества во всех разрешениях до 4K включительно. В играх с активной трассировкой лучей и разными видами апскейлинга (FSR/XeSS) Radeon RX 9070 XT позволит получить хороший комфорт в играх на высоких настройках графики в разрешениях до 2.5K включительно, а во многих играх приемлемая производительность будет и в 4K, однако в некоторых играх использование трассировки лучей надо сочетать с технологиями динамического масштабирования).

В номинации «Оригинальный дизайн» карта Gigabyte Aorus Radeon RX 9070 XT Elite 16G (16 ГБ) получила награду:

105 комментариев
Комментировать
Такое ощущение, что AMD делает свои затычки с одной целью — чтобы все от них шарахались и покупали курткины видяхи. Куртка наверное платит своей племяннице за рекламу своих видях.
-19
Ответить
Прогресс есть, всё же с 7000ой серии масса улучшений, и особенно наконец-то алгоритмы апскейла на базе нейронки FSR4. Кстати FSR тоже улучшают, в новых Ассасинах работает очень хорошо, впервые пожалуй, только тени двоятся, но это видимо баг, можно поправить, раньше багов везде была масса. А так конечно Нвидия впереди.
-6
Ответить
Если только в ценах Нвидиа впереди…
5
Ответить
Нейронку им сделала Сони - потому и качество
-10
Ответить
И графику разработали заодно.
0
Ответить
Бред конечно ты про нейронку написал.
1
Ответить
я знал что пишу для гуглонеграмотных - поэтому снизу привел ссылку на статью. с твитом самой АМД https://wccftech.com/amd-fsr-4-confirmed-to-have-been-co-developed-with-sony/
-4
Ответить
Так ты сам не грамотный лол.
«FSR 4 is looking fantastic! Excited for the co-development with Sony Interactive Entertainment on the models used for the FSR 4 upscaler.»
Ещё раз нейронку им не сделала сони. Черным по белому написано совместная разработка. И написано не model, а models, т.е. множественное число.
«Вот здесь Сони представляют проект Amethyst как их собственный»
«e have begun a deeper collaboration with AMD. For the project name we’re taking a hint from AMD’s red and PlayStation’s blue. The code name is Amethyst.»
«In going after this we’re combining the lessons AMD has learned from its multi-generation RDNA road map and SIE has learned from the custom work in PS5 Pro.»
Зачем же читать да?

Более того, смотрим
https://www.youtube.com/live/GZfFPI8LJrc?si=fF4BZ47pRn_moicz&t=1171
FSR 4 гибридная архитектура нейронки. Когда сони говорить только о свёрточной нейронке CNN. В FSR 4 же используется и CNN и элементы трансформера, за счёт которых и обеспечивается качество же.
CNN нужен в гибриде для облегчения модели. Т.к. сложность трансформера растёт квадратично с увеличением длинны последовательности.

Итого FSR 4 это совместная разработка AMD и SIE. А не только сони. При том кто и чем занимался не понятно, но скорее всего сони работали над свёрточной нейронкой. Часть трансформера похоже уже дело рук АМД.

2
Ответить
Sl
Какого трансформера? Нет статей с описанием архитектуры.
А зная АМД они вполне могли назвать CNN with ATTENTION гибридной архитектурой.
0
Ответить
Если что механизм внимания, как раз ключевой механизм Трансформеров.
а так пожалуйста читайте
https://www.researchgate.net/publication/371131911_Single-image_super-resolution_using_lightweight_transformer-convolutional_neural_network_hybrid_model
https://www.researchgate.net/publication/369557573_Incorporating_Transformer_Designs_into_Convolutions_for_Lightweight_Image_Super-Resolution
https://arxiv.org/pdf/2103.14030
https://www.sciencedirect.com/science/article/abs/pii/S1746809423007644

Ой что же мы видим, идея не нова и да не амд придумали модели называть гибридными.

0
Ответить
Сони представляют проект Amethyst как их собственный https://videocardz.com/newz/sony-unveils-project-amethyst-next-gen-ai-enhanced-hardware-in-collaboration-with-amd
0
Ответить
Когда читать научишься, тогда и пиши.
«представляют проект Amethyst как их собственный»
I have some very exciting news to share. We have begun a deeper collaboration with AMD. For the project name we're taking a hint from AMD's red and PlayStation's blue.. The code name is Amethyst
0
Ответить
Sl
«сони работали над свёрточной нейронкой. Часть трансформера похоже уже дело рук АМД» — это даже не чушь. Эту ахинею ни на один глобус не натянуть.
А чтобы объяснить почему это чушь потребуется не один час.
-1
Ответить
AMD FSR 4, the latest version of the upscaling technology made by AMD, was co-developed with Sony. The news came in a tweet pushed by AMD itself, https://wccftech.com/amd-fsr-4-confirmed-to-have-been-co-developed-with-sony/
-2
Ответить
А в консолях сони, простите, ускорители какого производителя стоят?..
0
Ответить
А софт этим ускорителям, простите, кто пишет?
-4
Ответить
Микрософт
0
Ответить
> was co-developed with Sony
У Славика превратилась в «им сделала Сони». Ловкость рук и никакого мошенничества)
2
Ответить
Нейронку вдвоем тренировать невозможно. FSR пишет сам АМД - что остается Сони?
0
Ответить
Вот здесь Сони представляют проект Amethyst как их собственный https://videocardz.com/newz/sony-unveils-project-amethyst-next-gen-ai-enhanced-hardware-in-collaboration-with-amd
-2
Ответить
И что такое этот Аметист ты прочитал?
0
Ответить
Что это проект использования ИИ в играх вообще, не только апскейл. И он не планируется быть эксклюзивом => изначально это для плойки делается => Сони
0
Ответить
И каким образом это относится к твоим выдумкам «FSR4 сделала Сони»?
0
Ответить
То то Сани выкатили свой PSSR который слил FSR4 и теперь Черни говорит, что в 25-26 у них будет FSR4 (PSSR2), кстати, это говорит о возможности версии FSR4 для RDNA3
0
Ответить
FSR 4 поддерживают только графические процессоры архитектуры RDNA 4 (в связи с расширением набора инструкций WMMA на данные FP8)
0
Ответить
Бред, даже на тех процах, что стоят в боксе и пс4 это есть, причем боксы даже официально это в даташит записали, а там RDNA2 с небольшими бонусами. Ты путаешь доп ускорение с возможностью расчёта.
0
Ответить
А теперь включаем мозги — пока шейдеры заняты рендером — где должно крутится перемножение матриц?
0
Ответить
Ты посмотри на «картинки» архитектуры. Возможно сам сможешь ответить на свои вопросы.
0
Ответить
Давай картинку 7900ХТХ и Fsr4 — посмотрю
0
Ответить
ниже 2 ссылки
0
Ответить
Так у тебя же в цитате написано, что FSR4 сделана AMD.
3
Ответить
загоните статью в гуглопереводчик если все так плохо. Твит от АМД был: - "We’re proud to collaborate with PlayStation on Project Amethyst!" Вот этот самый Аметист - нейронка. Остальную часть АМД писала сама
-1
Ответить
Славантуз, не тормози. Ты раз за разом цитируешь про «мы сработали вместе с Сони», но в твоём горячем бреду у тебя это превращается в «им всё Сони сделала».
2
Ответить
Одна группа кодеров пишет код FSR4 — а ИИ модель разрабатывается и тренируется отдельной командой. Ну и какая команда где?
0
Ответить
Сейчас ты нам расскажешь, раз тебя так возбуждает эта тема.
0
Ответить
Ага, зелёные сейчас пря зэ бэст. Черные экраны, отваливающийся писиай, плавящиеся разъемы, бракованные чипы с недостающими блоками, томозящие старые игры, мизерный прирост производительности, дифицыт и конские цены. Наверняка еще что то забыл. Ощущеня вас явно подводят. Продажи новых амд карточек на данный момент раз в десять большн чем у нвидии, шарахаются аж пипец))
13
Ответить
Ощущения эти создаются амд фанатами и ими же распространяются, хомяки типа тебя в это с радостью верят, у меня не было ни одной проблемы с драйверами, у владельцев 4090, 5090 ничего не плавится, карты с недостающими блоками меняют
-13
Ответить
Ага. И PhysX обратно включают и мор.. , тьфу физиономии вареньем намазывают. Верим, верим...
0
Ответить
В старшем сегменте у Амд 3%, с выходом 9000ой серии конечно больше будет, но даже занять 10% будет успех. Рыночек порешал. Проблем нет, 4080 даже работает в Пентиум 4!!! для смеха можно поставить, а всё работает.
-7
Ответить
PCI-E 1.0, Intel 975 чипсет, LGA 775.
1
Ответить
Драйвера тоже ставятся?
ПО, которое требует минимум SSE 4.1 без проблем работает?
1
Ответить
Ага, покупайте куртку. Камень-ножницы-бумага - черный экран, оплавленный ра]ьем, недолитые ROP. Самоубеждайтесь дальше.
2
Ответить
Людям зарабатывающии на мнение красных фанатов глубоко плевать. Всегда было и будет
-1
Ответить
То-то ты так рвёшься — ты же не зарабатываешь.
2
Ответить
Кем бы я ни был — людям все равно плевать на тот хайп что вы тут раскручиваете
0
Ответить
Ev
Чел, ты посмотри на кол-во комментов под этим обзором. Далеко не каждая карта такого удостаивается. Понятно, что значительную часть комментов тут сделали в том числе ты и прочие рвущиеся, но это так же подтверждает хайп вокруг этой карты. Была бы карта проходной — зелёные фанбойчики бы так не возбуждались и не рвались.
0
Ответить
Наконец-то))
Дождались!
2
Ответить
В начале 200x у меня была видяха Sapphire Radeon 9600XT Fireblade. Тогда у Nvidia была линейка FX 5xxx. Прямо как сейчас, только тогда Radeon 9600, 9700 и 9800 рвали в клочья 5600 и 5800, особенно в новомодных шейдерах 2.0. То было золотое время для радеонов («радиков» — их так называли). К сожалению, сейчас ситуация прямо противоположная.
4
Ответить
Да в шейдерах 2.0 Радеоны были мощнее, чем Geforce FX, но когда пошли шейдеры 2.0 уже вышли новые карты Radeon X800XT и Geforce 6800, которые реально тянули эти шейдеры в 1024*768, да и то впритык, а эти старые карты всё равно работали слабо.
А Radeon Х800XT быстрее почти в 4 раза, чем 9600.
0
Ответить
Были ещё славные времена 1950XTX, 5850/5870
И можно вспомнить как выход 4850 и 4670 обрушил цены 9800gtx и 9600gt. Я в те времена в компьютерном магазине работал, бОльшая часть продаж ушла на них, и цены резко поползли вниз
1
Ответить
1950 была проблемной из-за того, что кристаллы памяти на ней вообще не имели никакого охлаждения — радиатора на них не было, а вентилятор на них не дул (т.к. они с другой стороны находились). У меня побывали 2 таких карты. Первая от Palit проработала вообще меньше недели и сгорела. Сдал ее в магазин (сразу предложили вернуть деньги, сказав, что замучились менять по гарантии), купил в другом магазине более дорогой вариант от ASUS. Эта уже не сгорела, но после пары часов любой игры сваливалась в черный экран из-за перегрева. А в игре Titan Quest карта вообще перегревалась уже минут через 45. А если на паузу поставить, то и 20 минут хватало (тогда разработчики игр еще не просекли, что в меню надо делать ограничение на FPS). И, нет, вентиляция в корпусе у меня была хорошая.
Вот у 4850 проблем с перегревом не наблюдалось (в том же корпусе). Но не связанные с перегревом падения в черный экран изредка таки происходили, как и у 7870 потом. Где-то раз в несколько часов, что в общем казалось терпимым. А еще у всех этих карт были падения при скроллинге «тяжелого» видео в плеерах, причем довольно часто. Я даже думал, что это вообще у всех так, но потом купил GTX 1080 и понял, что это совсем не обязательно: вместо частых падений у нее при скроллинге очень-очень редко происходит долгий фриз на 5+ секунд, что, согласитесь, вообще не выглядит проблемой по сравнению с черным экраном.
0
Ответить
Спасибо за исторический экскурс.
0
Ответить
3 года владел вариантом от Пауэрколор - ничего из описанного и близко не было. Ни разу. Вообще никаких проблем или хлопот.
0
Ответить
Забыл упомянуть - в корпусе был всего один вентилятор на вдув и один на выдув. Если в вашем корпусе такого не было - это вопрос к вашему умению пользоваться техникой.
0
Ответить
Да, у меня была карта 9800 ХТ — реально хорошая.
0
Ответить
Уф, много информации. Кто сразу вниз до выводов «мотает»? ;)
3
Ответить
Когда просто обзор, можно и промотать. Но когда обзор не только видеокарты, но и про новую архитектуру — тогда читаю.
5
Ответить
У 9070 53.6 млрд трансисторов - больше чем у 5080 (45.6 млрд). Обсудим криворукость инженеров АМД?
-1
Ответить
II
Одна из причин, почему у современных AMD-видеокарт (особенно на RDNA 2/RDNA 3) больше транзисторов, чем у аналогичных NVIDIA (на Ampere/Ada Lovelace), — это Infinity Cache.
Infinity Cache требует много транзисторов
В RDNA 2 (например, Navi 21 в RX 6900 XT) 128 МБ Infinity Cache занимает ~6–13 млрд транзисторов (из ~26.8 млрд общего числа).
В RDNA 3 (например, Navi 31 в RX 7900 XTX) 96 МБ Infinity Cache + улучшенная архитектура — общее число транзисторов ~58 млрд (у RTX 4090 — ~76 млрд, но там другой подход).
Почему NVIDIA обходится меньшим числом?
У NVIDIA нет Infinity Cache, вместо этого используется большая шина памяти + кэш L2 (например, у RTX 4090 — 72 МБ L2, но он менее ёмкий, чем у AMD).
NVIDIA сильнее оптимизирует плотность транзисторов (например, TSMC 4N у Ada Lovelace против 5/6nm у RDNA 3).
2
Ответить
Какая разница? 9070 отстает от 5080 абсолютно во всех сценариях. Значит инженеры АМД не понимают куда их надо ставить
-9
Ответить
5080 изначально больше чип, вы бы ещё i3 четырехядерный с 7950 сравнили
0
Ответить
"5080 изначально больше чип" - а транзисторов меньше. на целых 8 млрд меньше У инженеров НВидия мозги лучше работают
0
Ответить
«У инженеров НВидия мозги лучше работают»
А да? Тогда что же это меньшее кол-во транзисторов, на меньшей частоте занимают БОЛЬШЕ места, так ещё и жрут больше? И это при том, что у данной карты ещё и кеша не меньше.
И это при том, что высокая плотность усложняет повышение частот. Значит криворукие АМД смогли разработать более плотный, более высокочастотный, более энергоэффективный дизайн, а умные нвидиа не смогли?
Опять же зависимость частоты от потребления не линейна, а экспоненциальная.
При том тех процессы у них одного семейства.

И вот мы выяснили, что с инжерами обеих компаний никаких проблем нет, проблемы только у горемыки в комментариях, которому ну очень надо засрать не любимку.

0
Ответить
Она и не конкурент для 5080 даже в видении AMD
0
Ответить
Именно. А транзисторов напихано в это видение на 15% больше
0
Ответить
Так у Нвидии тоже кэши огромные, кэш это просто память и Infinity Cache тоже самое. В 4080 скажем 64МБ кэша, и даже в 4060 аж 32МБ.
0
Ответить
Помнится ещё совсем недавно нам обещали ценовые войны и 9070 ХТ по $600… А теперь 105-109 тыс.р вроде как минимальная цена на маркетах 🤣
4
Ответить
pa
И аппетит у нее как у 5080, короче хотели как 5070ti, а получился все равно 7900 XTX
ps Были слухи про 9070xtx на 32gb, был бы интересный прибор
-2
Ответить
Агрессивные запасы сьели агрессивные цены. Или наоборот
0
Ответить
Надо понимать, что эти цены - особенности местных торгашей. У чайников цены раза в полтора ниже, а 5070ti только процентов на 30.
-1
Ответить
109к за неё многовато, конечно, но за свою цену в ~70к на данный момент это лучшая карта по сочетанию фпс на шекель.
-1
Ответить
Откуда эта взятая с потолка цена?
1
Ответить
Главное — верить.
0
Ответить
В Беларусь с Европы или Чайны можно какую-нибудь нитро+ от сапфира даже дешевле привезти
0
Ответить
Держите в курсе.
-1
Ответить
70к это чот около 780 баксов при курсе ~90. При «рекомендованной» цене 599 баксов.
Цена не с потолка, а именно адекватная за эту карту. За 120к прямо сейчас можно купить в днс в наличии 4080с. Там уже и длсс, и ртх и прочая лабуда будет, а сырая производительность выше.
0
Ответить
Удивляет отсутствие Ai ускорителей в RDNA3 в таблице, когда как в спецификации указано 192 Ai ускорителя в 7900xtx…
1
Ответить
Согласен. Ниже я написал об этом подробно.
0
Ответить
Почему-то в ваших последних обзорах странно сильно расходятся данные карт, начиная с 4080 и выше в киберпанке RT, с указанными в обзоре https://www.ixbt.com/3dv/amd-radeon-rx-7900-xtx-review.html#n16 - с чего бы вдруг их производительность в этом обзоре и обзоре 5090 выросла аж на 30-50%? Было у 4090 32 фпс - стало 42. Было у 4080 22 фпс - стало 31. А у карт ниже 4080 всё осталось 1в1. Как так? Терзают сильные сомнения, видя такой небывалый рост производительности одних и тех же видеокарт Nvidia - и именно тех, которые обгоняли AMD до выхода 9070xt. А вот те, что не обгоняли - почему-то не улучшили свою производительность ни насколько.
4
Ответить
Божественный драйвер куртки, очевидно)
0
Ответить
Al
«Куда важнее другие изменения в блоках CU — например, в четвертом поколении RDNA появились свои «тензорные ядра» и у AMD, они назвали их ИИ-ускорителями (AI Accelerators).»
Вообще то они впервые появились в RDNA 3. К примеру, в Radeon RX 7900 XTX их 192 штуки, а в Radeon RX 7800 XT 120 штук. Данные взяты с официального сайта AMD. Они первого поколения, соответственно с поддержкой BF16, тогда как во втором поколении появилась поддержка FP8. Как в RDNA 3, так и в RDNA 4 ИИ ускорители являются матричными ядрами (WMMA). Об этом написано на сайте OpenGPU, под патронажем AMD.
P.S. В будущем AMD возможно добавит поддержку FSR 4 для RDNA 3 и RDNA 3.5. Технических ограничений нету. Да, будет хуже работать, но всё же лучше, чем FSR 3, так как будет задействовать ИИ ускорители.
0
Ответить
Вообще-то там есть и то и другое, просто не ускоренное дополнительно. И производительности хватит у всего, что выше 7700. Для 7900xtx где 96CU будет около 122 tops (что подтверждается техдоком (FP16 (half) 122.8 TFLOPS (2:1)), для 7900xt — 84CU — 103 tops (у 2070 по докам где-то 126), а ведь длсс есть даже на 2050…
0
Ответить
Не, даже меньше судя по вики. 2060 — 83, 2070 — 103, 2080 — 188 и 200 для титан.
Вот у 7600 наверно не хватит так как там около 44 tops получается…
0
Ответить
есть то они может и есть - только нигде не задействованы. вообще. Технических ограничений - есть => FP8 нейронка
0
Ответить
https://www.amd.com/en/products/graphics/radeon-ai.html
0
Ответить
Rocm6 работает на шейдерах
0
Ответить
FSR4 предположительно на INT8 )))
0
Ответить
https://3dnews.ru/1120194/radeon-rx-9070-xt-protiv-geforce-rtx-5070-ti
Увы, в отличие от прошлых версий апскейлера, которые работали практически на любом железе, FSR 4 поддерживают только графические процессоры архитектуры RDNA 4 (в связи с расширением набора инструкций WMMA на данные FP8)
0
Ответить
Ты этот бред везде будешь пихать? Ознакомся с архитектурой RDNA3:
https://www.hardwareluxx.de/images/cdn02/uploads/2022/Dec/swank_thread_af/amd-rdna3-breakout-021_1920px.jpeg
https://www.hardwareluxx.de/images/cdn02/uploads/2022/Dec/like_blockchain_0z/amd-rdna3-breakout-022_1920px.jpeg
Форматы FP на 50-180 % менее эффективны с точки зрения вычислений на выделенном оборудовании, чем формат INT. В Int8 RDNA3 выполняется только одна такая инструкция за такт, но по производительности у старших моделей находится в районе 3070Ti. Только у 7600 позорные 44tops. Все остальные легко справятся с задачей апскейла.
Сетки обученные на FP8 конвертятся на Int8.
https://arxiv.org/pdf/2303.17951
0
Ответить
меня больше интересует, получиться ли положить FSR4 на тензорные ядра nVidia, в первую очередь — GF 3xxx и 2 xxx (4xxx и 5xxx очевидно и DLSS хватит).
0
Ответить
меня больше интересует — какой идиот будет этим заниматься?
-1
Ответить
ixbt в тестах 3Д постоянно использует неправомерный подход - для NV в разделе DLSS включает FG и даже MFG, а для AMD только FSR, но без FG (AMFM). И собирает результаты в одну таблицу! Оправдывает это тем, что раз игры не поддерживают FSR и AMFM, то и не включают их, а DLSS FG MFG поддерживают значит надо обязательно их включить! В итоге сравнивают не сравнимое. И игнорируют тех пользователей, что используют только апскейлеры, но отключают генерацию кадров.
7
Ответить
Да тут уже вообще интересные вопросы (выше привёл пример со ссылкой): с выходом новых моделей радеон у старых нвидиа внезапно вырастает производительность аж до 50% - причём, именно у тех, которые обгоняли старых радеонов - и теперь по логике вещей те модели нвидиа должны начать отставать => но, о, чудо, внезапно происходит волшебство, и старые модели нвидиа опять начинают сильно обгонять новых моделей радеонов... Прикольно же.
1
Ответить
Ну и в таблице производительности полнейший бред. В растре 9070xt выше 7900xtx, и 5070ti и 4080s и 5080. Предлагаю половину чемоданных игр от нвидии, такие как вуконг, 2077, АВ2, ну и ещё какую-нить заменить на Рокет лиг, спейсмарин 2, колду, хорайзн и тотал вор )))))
3
Ответить
Планируете в тесты добавить что-то кривое? Например 7 days to die, beamng, space engineers. Оно любой тестовый стенд нагнет.
1
Ответить
Вернуть старый дизайн Подробнее