В свое время процессоры Ryzen на основе архитектуры Zen позволили компании AMD уйти от реноме производителя исключительно бюджетных вариантов. За прошедшие годы вышло несколько поколений Ryzen, и все они предлагали улучшенные возможности и прирост производительности, и при помощи освоения новых технологий производства и за счет своей уникальной чиплетной компоновки. Поколение Zen 4, вышедшее в 2022 году, отличилось переходом к техпроцессу 5 нм, но еще важнее то, что тогда внедрили новую платформу AM5 с поддержкой памяти DDR5 и PCIe 5.0. Процессоры серии Ryzen 7000 стали весьма выгодным приобретением и даже перехватили преимущество у Intel по многим параметрам за счет улучшений архитектуры и платформы в целом.
Естественно, что нового поколения Zen 5 все энтузиасты очень ждали, хотя было сразу понятно, что оно не будет таким же большим шагом вперед по сравнению с Zen 4. В случае семейства Ryzen 9000 мы получили улучшенную архитектуру самих вычислительных ядер, но сама платформа AM5 осталась неизменной. С момента запуска платформы с процессорами серии Ryzen 7000 два года назад мы уже знали, что Zen 5 будут поддерживаться еще тогда выпущенными системными платами на чипсетах X670E, X670, B650E и B650. Отсутствие необходимости в смене процессорного разъема — неплохой ход, притягивающий потенциальных покупателей, уставших от того, что в прошлом им нередко приходилось менять чуть ли не все комплектующие при переходе с одного CPU на другой. Поддерживать текущую платформу AMD планирует несколько лет — как минимум, до 2027 года, и это хорошая основа для привлечения пользователей стабильностью.
Первую информацию о новом семействе компания раскрыла еще в мае на тайваньской выставке Computex, достаточно подробно рассказав в том числе о новом семействе настольных процессоров Ryzen 9000 и мобильных решениях, которые в этот раз опередили с выходом на рынок своих старших собратьев. Настольное семейство уже традиционно состояло из первых четырех моделей для среднего и верхнего ценовых сегментов, которые были выпущены в продажу в августе. В архитектуре Zen 5 было улучшено большинство блоков в вычислительных ядрах по сравнению с Zen 4, улучшена подсистема кэширования, а двойные каналы выборки инструкций и их декодирования позволяют ядрам обрабатывать больше инструкций за такт по сравнению с одним каналом в Zen 4.
Мобильные процессоры Ryzen AI 300, основанные на архитектуре Zen 5, получили даже большее количество нововведений: разнородные вычислительные ядра, ускоритель нейросетей NPU, новое графическое ядро и т. д. К сожалению, серия настольных процессоров Ryzen 9000 перечисленным похвастать не может, и если отсутствие аппаратного ускорения нейросетевых задач понять можно — этими нагрузками в настольных ПК занимаются скорее куда более мощные графические ядра, а энергоэффективность их исполнения именно на CPU-ядрах стоит не на первом плане, да и разнородные ядра в настольных ПК кажутся сомнительным решением, но отсутствие остального не радует. Даже сам принцип построения новых процессоров не изменился, новые процессоры серии Ryzen 9000 всё так же основаны на одном или двух восьмиядерных чиплетах, содержащих по 6 или 8 однородных ядер. Не изменилось графическое ядро и контроллер DDR5, а ведь работу Zen с этой памятью трудно назвать эффективной на фоне решений конкурента.
Уже в июле AMD выпустила первые процессоры с архитектурой Zen 5, предназначенные для мобильного рынка — серия Ryzen AI 300. Раньше обычно выходили настольные решения и лишь потом мобильные, но в этот раз AMD изменила процесс вывода Zen 5 на рынок, выпустив сначала чипы для ноутбуков, затем Ryzen 7 9700X и Ryzen 5 9600X, и только потом пару топовых моделей Ryzen 9, наиболее мощную из которых мы и рассмотрим сегодня. Запуск процессоров с двумя кристаллами CCD занял несколько больше времени, чем планировалось, первоначальная дата запуска была передвинута по какой-то причине, и сначала вышли модели на базе одного кристалла, с 6 и 8 ядрами, а только затем флагманский Ryzen 9 9950X с 16 вычислительными ядрами и Ryzen 9 9900X с 12 ядрами.
И сегодня мы наконец-то познакомимся с наиболее производительной и дорогой моделью линейки — 16-ядерным процессором Ryzen 9 9950X, который заменяет на рынке модель 7950X. Соперником для новинки со стороны Intel пока что остается Core i9-14900K, вышедший на рынок еще в прошлом году, но ближе к окончанию текущего ожидается выход совершенно новых процессоров Intel, основанных на чиплетной компоновке, произведенных по современным техпроцессам, но отказавшихся от технологии одновременной многопоточности Hyper-Threading. Будущее сражение грозит быть интересным, ну а пока что рассматриваем имеющиеся флагманские модели двух компаний и определяем, насколько Zen 5 превосходит Zen 4 в различных нагрузках.
Семейство процессоров Ryzen 9000
Несмотря на то, что AMD говорит о Ryzen 9000 (кодовое наименование Granite Ridge) как о полностью новом поколении, принципиальные изменения в настольных Zen 5 зарыты глубоко внутри. Новые процессоры полностью совместимы с уже известной нам платформой Socket AM5, также используют привычную чиплетную организацию и даже частично основаны на тех же кристаллах — чиплет ввода-вывода IOD тут ровно тот же, что и у Ryzen 7000, так что встроенное графическое ядро, контроллер памяти и внешние интерфейсы в Ryzen 9000 точно такие же, что и у предшественников.
И всё бы хорошо, если бы в них не было явно слабых сторон и недостатков. Если GPU достаточно неплох (всё равно для серьезных применений его мало и требуется внешняя видеокарта), но и контроллер DDR5 тут тот же, и соединяются чиплеты между собой по той же схеме по 256-битной шине Infinity Fabric с теми же частотными параметрами — так что пропускная способность и этой шины и доступа ядер к памяти всё так же продолжит быть дополнительным барьером, не позволяющим получить преимущество от очень быстрой памяти DDR5, на что способны решения конкурента.
В плане контроллера памяти у Ryzen 9000 всё ровно так же — так как серия использует абсолютно тот же IOD-чиплет, что был в Ryzen 7000, а контроллер памяти расположен именно там. AMD говорит о том, что Ryzen 9000 получили поддержку DDR5-5600, но это ничего не меняет — этот контроллер и так способен стабильно работать на этой не слишком высокой частоте, а вот максимальная частота для синхронного режима 1:1 не изменилась — это 6000 МГц, так что толку от более скоростных модулей памяти DDR5 не будет и на Ryzen 9000. Возможно, разве что память DDR5-8000 при соотношении частот 1:2 окажется более производительной по сравнению с DDR5-6000 в некоторых случаях.
Получается, что в новых процессорах изменились только кристаллы CCD — чиплеты с вычислительными ядрами. Они всё так же включают по восемь ядер и по 32 МБ L3-кэша, но основаны на архитектуре Zen 5, и в этом — главное отличие Ryzen 9000 по сравнению с Ryzen 7000. Мы поговорим об архитектурных изменениях далее, но по данным AMD, новая архитектура обеспечивает прирост количества исполняемых за такт инструкций (показатель IPC) на 16%, что очень неплохо на уровне даже меньшей прибавки производительности при переходе от Zen 3 на Zen 4. Но есть вопросы к методике соответствующих расчетов, и мы сегодня еще проверим прирост самостоятельно.
Почему в чиплете снова лишь 8 ядер, если техпроцесс улучшился? Скорее всего, AMD не может выходить за рамки примерно 80 мм² на CCD-кристалл, и даже в варианте с ядрами Zen 4 запихнуть в такую площадь 16 ядер бы не получилось. Да и нет особого смысла в таком большом количестве ядер для настольного CPU пока что. AMD в этот раз не погналась за максимальным количеством ядер в борьбе с Intel с ее неоднородными ядрами. Использование старого кристалла ввода-вывода IOD из предыдущего поколения помогло AMD сэкономить на разработке, и всё внимание компании было сосредоточено на новых ядрах Zen 5.
Новые вычислительные кристаллы CCD изготавливаются с применением более продвинутого 4-нанометрового техпроцесса N4P тайваньской TSMC. Производитель заявляет значительные улучшения по сравнению с процессом 5 нм, используемым при производстве кристаллов Zen 4. В частности, 11% увеличения производительности, +22% по энергоэффективности и на 6% повышенной плотности транзисторов по сравнению с базовым N5. Разница тут скорее даже не в повышении частотных параметров, а улучшении энергоэффективности и увеличении плотности размещения транзисторов.
Так что не особенно удивительно, что частоты процессоров серии Ryzen 9000 не выросли и не превышают привычных 5,7 ГГц. Зато количество транзисторов в CCD-кристаллах увеличилось с 6,6 до 8,6 млрд., и при всех архитектурных улучшениях, о которых мы далее поговорим, CCD-кристалл Zen 5 имеет почти тот же размер, что и в Zen 4 — даже чуть меньше 71 мм². Возможно, что из-за улучшенной энергоэффективности для восьмиядерного Ryzen 7 9700X был сдвинут предел энергопотребления — до 65/88 Вт вместо 105/142 Вт у предшественника — 7700X. Но там есть один важный нюанс, на котором мы остановимся во время соответствующего обзора.
Пока что в семействе процессоров Ryzen 9000 анонсировали только четыре модели процессоров, отличающихся количеством вычислительных ядер: от 6 до 16 — как и в прошлом поколении. Рассматриваемый сегодня 16-ядерный процессор Ryzen 9 9950X является наиболее производительным и дорогим процессором семейства и имеет характеристики примерно на уровне флагмана прошлого поколения. Обратите внимание, что на слайдах AMD стыдливо не указывает базовые частоты новых CPU, этому есть причина.
Стремление к повышению энергоэффективности и снижению тепловыделения привело к тому, что новые процессоры получили даже более низкие базовые частоты по сравнению со своими предшественниками — все выпущенные модели Ryzen 9000 по этому показателю даже уступают соответствующим представителям серии Ryzen 7000! Это касается даже рассматриваемой нами сегодня флагманской модели — Ryzen 9 9950X заменяет Ryzen 9 7950X, предлагая те же 16 ядер с тем же объемом кэш-памяти, работающий при том же максимальном уровне энергопотребления, но на более низкой базовой частоте — она стала ниже на 200 МГц.
12-ядерная модель 9900X отстает по базовой частоте от 7900X уже на 300 МГц, а еще дальше становится еще хуже, но там хотя бы есть понятное объяснение в виде более низкого максимального потребления — восьмиядерный 9700X от 7700X отстает уже на 700 МГц, а 9600X — на все 800 МГц. Мы обязательно проверим Ryzen 7 9700X — не стал ли фатальным для него шаг назад по частотным характеристикам на фоне предшественника? Новые процессоры должны иметь преимущество по архитектуре и улучшенной энергоэффективности Zen 5, но достаточно ли этого? Для удобства основные характеристики объявленных моделей свели в таблицу (российских цен не существует, их определяет рынок, поэтому берем североамериканские):
Модель | Ядер и потоков | Базовая частота, ГГц | Турбо-частота, ГГц | L2-кэш, МБ | L3-кэш, МБ | TDP/PPT, Вт | Цена, USD |
---|---|---|---|---|---|---|---|
Ryzen 9 9950X | 16/32 | 4,3 | 5,7 | 16 | 64 | 170/230 | 649 |
Ryzen 9 9900X | 12/24 | 4,4 | 5,6 | 12 | 64 | 120/162 | 499 |
Ryzen 7 9700X | 8/16 | 3,8 | 5,5 | 8 | 32 | 65/88 | 359 |
Ryzen 5 9600X | 6/12 | 3,9 | 5,4 | 6 | 32 | 65/88 | 279 |
Флагманский процессор Ryzen 9 9950X использует два CCD-кристалла на 16 ядер и поддерживает исполнение 32 потоков, имеет 64 МБ L3-кэша, базовую частоту 4,3 ГГц и турбо-частоту в 5,7 ГГц — всё это близко к характеристикам Ryzen 9 7950X на базе Zen 4, есть отличия лишь по базовой частоте. Новая верхняя модель также имеет уровень типичного потребления в 170 Вт, соответствующий предыдущему флагману Ryzen 9 7950X — и в этом он отличается от остальных моделей новой линейки, которые изменили показатель TDP по сравнению со своими предшественниками из семейства Ryzen 7000. Хотя Ryzen 9 9900X — это также 12-ядерый процессор с турбо-частотой в 5,6 ГГц, как и заменяемый им Ryzen 9 7900X, но 9900X имеет показатель TDP всего лишь в 120 Вт, что заметно ниже уровня 170 Вт для предыдущей модели. Младшие модели с 8 и 6 ядрами также отличаются по уровням потребления от своих предшественников в меньшую сторону — их показатель TDP зачем-то ограничили на уровне 65 Вт.
Начальные цены на всю линейку Ryzen 9000 установлены на более низком уровне по сравнению с аналогичными процессорами серии Ryzen 7000. Рекомендованная розничная цена топового Ryzen 9 9950X составляет $649, что на $50 дешевле, чем была у Ryzen 9 7950X при его запуске в 2022 году. Ryzen 9 9900X также рекомендован к продаже по цене на $50 ниже, чем Ryzen 9 7900X — $499. Вспоминая то, что компании AMD пришлось довольно быстро снижать уровень цен на Ryzen 7000 почти сразу после их запуска, это решение кажется правильным ходом — AMD пересматривает свое ценообразование с каждым поколением в соответствии с рыночными реалиями.
Флагманский процессор Ryzen 9 9950X
Это 16-ядерный процессор для энтузиастов и игроков, которым нужен максимум производительности и возможностей. В отличие от мобильных процессоров Zen 5, все 16 ядер тут — полноценные Zen 5, работающие на сравнительно высокой частоте. AMD сделала определенные архитектурные улучшения ядер, повысила производительность кэш-памяти, но главным изменением стал новый 512-битный конвейер операций с плавающей запятой, о котором мы еще поговорим. Все эти улучшения в сочетании с высокими тактовыми частотами и применением более совершенного техпроцесса при производстве должны сделать Ryzen 9 9950X лучшим процессором для многопоточных задач, а вот с играми он вряд ли справится лучше специальных «игровых» моделей серии X3D прошлого поколения — сама AMD сразу дала это понять.
Процессор Ryzen 9 9950X поставляется в коробке, которая выглядит аналогично упаковке решений поколения Ryzen 7000, да и сам чип выглядит почти точно как более ранние процессоры для Socket AM5 — есть лишь мелкие изменения по компонентам на печатной плате. У нас на тесте была OEM-версия без коробки, так что есть фотографии только самого процессора:
Как и Ryzen 9 9900X, флагман отличается от двух других представленных CPU семейства тем, что использует два активных CCD-чиплета, каждый из которых содержит по восемь ядер Zen 5 и L3-кэш объемом в 32 МБ с общим доступом. Новые кристаллы CCD производятся с использованием 4-нанометрового техпроцесса N4P на тайваньских фабриках TSMC — в отличие от аналогичных чиплетов прошлого поколения, выпускаемых при помощи техпроцесса 5 нм. Благодаря этому новые кристаллы при схожей площади вместили 8,6 млрд. транзисторов — они были усложнены, чтобы повысить производительность Zen 5 при той же частоте. А вот кристалл ввода-вывода IOD у Ryzen 9 9950X ровно такой же, как у всех процессоров Ryzen 7000, он производится по 6-нанометровому техпроцессу и содержит двухканальный контроллер DDR5, встроенное графическое ядро на двух блоках CU архитектуры RDNA 3 и контроллер PCIe 5.0 на 28 линий.
Несмотря на переход на более совершенную технологию производства, базовая частота Ryzen 9 9950X по сравнению с 7950X даже снизилась на 200 МГц — она составляет 4,3 ГГц по сравнению с 4,5 ГГц у прошлого флагмана. Будем надеяться, что улучшения производительности на такт смогут компенсировать эту разницу. Впрочем, максимальная частота (турбо-частота) осталась на прежнем уровне в 5,7 ГГц. Да и в остальном отличий от Ryzen 9 9950X практически нет: L3-кэш имеет тот же общий объем в 64 МБ, L2-кэш по 1 МБ на ядро, а показатель потребления TDP установлен на том же уровне в 170 Вт.
В реальности разница по частотам Ryzen 9 9950X и Ryzen 9 7950X больше, чем может показаться по техническим характеристикам. Если брать многопоточные нагрузки вроде рендеринга, то при небольшом количестве потоков новый Ryzen 9 9950X работает даже на чуть более высокой частоте — в наших тестах новый 16-ядерник работал быстрее и при 8-12 потоках, а вот затем частота его ядер падала уже на 100 Гц ниже показателей прошлого флагмана. Скорее всего, так получается из-за того, что максимальный предел потребления 9950X установлен на более низком уровне, чем у 7950X. Хотя номинально для обоих показатель PPT (Package Power Tracking) установлен на одинаковое значение в 230 Вт, в реальных условиях новый CPU не превосходит предел в 200 Вт, что несколько сильнее ограничивает частоты вычислительных ядер при работе в условиях загрузки всех или почти всех ядер.
В плюсах неизменной платформы и отсутствие необходимости в обновлении систем охлаждения — как мы уже писали ранее, большинство кулеров для разъема AM4 подойдут и в случае процессорного разъема AM5. Единственное, что они должны использовать родное крепление и заднюю подложку самой AMD, а не свои собственные крепления, как это бывает в продвинутых системах.
AMD включает в процессоры встроенное графическое ядро, которое уже было в процессорах предыдущей серии — из-за использования того же кристалла IOD из Zen 4. Оно основано на архитектуре RDNA 2 и состоит всего лишь из двух вычислительных блоков CU, что эквивалентно 128 потоковым процессорам. Встроенный GPU обеспечивает лишь самые базовые 3D-возможности, достаточные для обычной офисной работы и интернета, зато поддерживает до четырех дисплеев и имеет мультимедийный движок для ускорения декодирования и кодирования видеоданных.
Встроенное в Ryzen 9000 видеоядро обеспечивает функции декодирования и кодирования видеоданных и вывода информации на дисплеи. В перечень поддерживаемых функций входит декодирование видео в форматах AV1, HEVC и H.264, а также кодирование видео в форматах HEVC и H.264. Важно еще и то, что эти блоки обработки видео доступны и при использовании дискретной графики, так как встроенное ядро AMD не отключается в таком случае, и все системы на основе процессоров под Socket AM5 обеспечивают неплохой набор по функциям обработки видеоданных вне зависимости от установленной внешней видеокарты.
Контроллер выводы информации в Ryzen 9000 позволяет выводить данные на четыре дисплея с разрешением 4K при частоте обновления 60 Гц. Поддерживается вывод по разъему HDMI 2.1 с максимальной скоростью передачи данных 48 Гбит/с и DisplayPort 2.0 UHBR10 со скоростью передачи данных до 40 Гбит/с, чего нет и у некоторых современных топовых видеокарт. Производители системных плат сами решают, как им использовать эти возможности, в виде портов DisplayPort или по USB-C. Все они также могут использоваться и в качестве видеовыходов для дискретных видеокарт в гибридном режиме.
Обновленные чипсеты платформы AM5
Вместе с процессорами серии Ryzen 9000, компания AMD представила и новую линейку чипсетов. Хотя новые процессоры совместимы и со старыми чипсетами 600-й серии, линейку чипсетов решили обновить. Ну, как обновить... Уже одно то, что кристалл ввода-вывода в новых CPU остался прежним с прошлого поколения Ryzen, говорит о том, что по возможностям подключения периферии, новые процессоры полностью аналогичны своим предшественникам.
Но на возможности платформы влияют и чипсеты, поэтому нужно рассмотреть и их. Компания AMD представила сразу четыре модели: X870E, X870, B850 и B840. X870E — флагманский чипсет линейки, предлагающий максимальные возможности, и он пришел на смену флагманскому чипсету прошлой линейки X670E. Отличий у них немного, мягко говоря, так как новый чипсет основан на двух точно таких же чипах Promontory 21, что и X670E. Так что особым изменениям тут взяться просто неоткуда, и по возможностям X870E весьма схож с X670E.
X870E | X870 | B850 | B840 | |
---|---|---|---|---|
PCIe от CPU на видеокарту |
5.0 | 4.0 (5.0 опция) |
4.0 | |
Всего линий PCIe от CPU |
24 | |||
Линий PCIe 4.0 от чипсета |
12 | 8 | - | |
Линий PCIe 3.0 от чипсета |
8 | 4 | 8 | |
Порты USB 3.2 | 8 (10 Гбит/с) + 2 (20 Гбит/с) или 4 (10 Гбит/с) |
4 (10 Гбит/с) + 1 (20 Гбит/с) или 2 (10 Гбит/с) |
2 (10 Гбит/с) + 2 (5 Гбит/с) |
|
Порты USB 2.0 | 12 | 6 |
Для системных плат на основе X870E обязательна поддержка интерфейса PCIe 5.0 для слота видеокарты и NVMe-накопителей, подключенных к процессору — как и в случае с предшествующей моделью. Основное отличие моделей на обновленном чипсете — поддержка двух портов USB 4, имеющих скорость до 40 Гбит/с, но она осуществлена при помощи внешнего контроллера ASMedia ASM4242, подключенного по четырем линиям PCIe 4.0, или к чипсету или к CPU — за счет одного из NVMe, а такие решения ранее существовали и на основе чипсетов прошлого поколения, просто теперь такая поддержка стала обязательной. Причем, обязательно именно само наличие контроллера, а производитель платы сам думает, к чему его подключить, к процессору или чипсету. Но фактически чипсет не изменился.
А вот в случае X870 уже есть изменения, и они довольно большие. Хотя по названию кажется, что X870 также является прямым последователем чипсета X670, но это не так — новая модель основана уже на одном чипе Promontory 21, в отличие от X670, и является скорее продолжателем дела чипсета B650E. Для системных плат на основе X870 также обязательна поддержка шины PCIe 5.0 для видеокарты и NVMe-накопителей.
Тут всего примерно вдвое меньше, чем в старшем X870E, а ключевое нововведение — также обязательная поддержка двух портов USB 4, реализованная тем же контроллером ASMedia. Это можно рассматривать и как недостаток, так как порты USB 4 могут отнять у чипсета сразу 4 линии PCIe 4.0, и к самому X870 можно будет подключить лишь один накопитель с интерфейсом PCIe 4.0 x4, даже у B650/B650E таких возможностей было больше. Впрочем, недостаток нивелируется тем, что еще два NVMe-накопителя в режиме PCIe 5.0 x4 можно подключить к самим процессорам Ryzen, а если нужно больше, то на дорогих платах могут использовать дополнительные PCIe-коммутаторы.
B850 — это среднеценовой чипсет линейки, который по характеристикам повторяет B650. Чипсет основан на всё том же чипе Promontory 21, поэтому и отличий между ним и X870 нет — и в этом случае можно реализовать порты USB 4. А вот что делать с разъемом видеокарты в этом случае решают производители системных плат, они могут использовать шину PCIe 5.0 или 4.0. Главное отличие от аналогичной модели прошлого поколения — тут можно разделить 16 линий для видеокарты на два слота по 8 линий.
Младшая модель чипсета B840 получила индекс B в названии, хотя это последователь бюджетного A620 из прошлой линейки чипсетов, да и характеристики у него такие же. По A620 мы помним, что сначала там использовался тот же чип Promontory 21 в урезанном виде, а позднее выпустили чипсет A620A с теми же характеристиками на упрощенном чипе Promontory 19. На нем же основан и чипсет B840. Разъем видеокарты и NVMe-накопители при подключении к процессору в B840 ограничены шиной PCIe 4.0, быстрых портов USB 4 и USB 3.2 Gen 2x2 тут нет. Также на платах с B840 не разрешен разгон процессора, в отличие от старших чипсетов линейки, хотя память разгонять можно.
Хорошо видно, что «новая» линейка чипсетов не стала по-настоящему новой — в основе чипсетов используются знакомые по прошлым решениям чипы, поэтому 95% их характеристик остались неизменными. Главное отличие новой серии — обязательная поддержка портов USB 4 на старших чипсетах X870 и X870E, а остальные изменения не стоят даже дополнительного упоминания. Можно добавить лишь то, что AMD также поддерживает производителей системных плат в их стремлении привнести другие новые возможности, вроде Wi-Fi 7, но это также осуществляется при помощи сторонних решений, в чипсетах для этого ничего нового нет. Так что если у пользователя уже есть AM5-плата, то ему не нужно бежать за новой.
Межъядерные задержки и программные особенности
Интересно, что для нового процессора нужен уже знакомый нам дополнительный драйвер — PPM Provisioning, который мы знаем по тестам Ryzen 9 7950X3D и 7900X3D — процессоров с двумя неоднородными чиплетами, один из которых имел дополнительный 3D-кэш. Тогда необходимость в драйвере объяснялась тем, что операционной системе нужно распределять работу на разнородные ядра, отключая некоторые из них. Именно этот драйвер отправляет игровые потоки на один чиплет с восемью ядрами, «паркуя» ядра второго кристалла. Играм ведь достаточно восьми ядер, а остальные можно выключить, и на Ryzen 9 7950X3D это вполне востребовано — дополнительный кристалл увеличивает L3-кэш лишь для одного чиплета с ядрами, а второй ограничен обычными 32 МБ, и его полное отключение логично. А для Ryzen 9 9950X этот драйвер нужен тоже для того же, но по иной причине, хотя и близкой — задержка доступа при передаче данных от одного ядра к другому для ядер, расположенных в разных CCD, стала слишком большой.
По какой-то неведомой причине, подобное межъядерное взаимодействие в Ryzen 9000 усложнилось, и задержки заметно выросли даже по сравнению с Ryzen 9 7950X, имеющим подобную же конфигурацию. Ядра одного и того же кристалла CCD через общий L3-кэш обмениваются данными с задержкой в 17-22 нс, а обмен между ядрами из разных CCD имеет куда более высокие задержки — 190-210 нс (у 7950X и 5950X было 75-80 нс). Поэтому неудивительно, что при работе ядер из двух чиплетов с одним набором данных это может вызывать некоторые проблемы. И именно игры (по крайней мере, их большую часть) спокойно можно перевести на меньшее количество ядер, реализовав программное отключение одного из CCD в Ryzen 9 9950X — ровно как в случае с Ryzen 9 7950X3D.
Все ядра многоядерных процессоров должны иметь доступ к памяти — каждое ядро имеет собственные кэши, и если одно ядро хочет прочитать данные, записанные другим ядром, внутренние соединения в процессоре должны выполнить передачу их из кэша в кэш. В Zen 5 всё так же достаточно быстра передача таких данных из кэша в кэш в пределах кластера на 8 ядер, но задержки между двумя кластерами повысились по сравнению с предыдущими поколениями — порядка 200 нс задержки между кластерами это почти так же много, как между сокетами на серверных платформах.
Причины роста межъядерных задержек для нас не очень понятны, на первый взгляд в Ryzen 9 9950X всё реализовано ровно так же, как и в прошлых CPU — шина Infinity Fabric та же, и даже чип ввода-вывода IOD тот же. Похоже, что проблема заключается в настройках, а не в самой архитектуре Zen 5, как поспешили заявить некоторые обзорщики. По сообщениям из прессы, обновленные версии прошивок для системных плат, основанные на AMD AGESA версии 1.2.0.2, должны предоставить как раз снижение межъядерных задержек в серии Ryzen 9000. По предварительным результатам, вместо 180-200 нс между CCD, новые версии BIOS обеспечили снижение задержек до 75-80 нс — ровно как у предыдущих поколений. Уже опробовавшие патч в деле пользователи сообщают о приросте производительности в бенчмарке Cinebench R23 на 400-600 очков, да и в CPU-Z и 3DMark CPU Profile наблюдаются приличные приросты. Так что со временем все обновят свои BIOS и проблема должна исчезнуть сама собой.
Но почему AMD сразу не нашла и не починила AGESA — вопрос интересный. Автор теста Y-Cruncher, который мы также применяем в своей методике, написал о том, что по его информации проблемы с увеличенными задержками были вызваны изменением неких параметров настройки для Zen 5, которые были якобы сделаны для улучшения результатов при реальных рабочих нагрузках, но затем в синтетических тестах с ними получились плохие результаты, и поэтому AMD решила изменить параметры и выпустила исправляющий патч. Как говорится: «Сомнительно, но ОКЕЙ».
Так что, драйвер PPM Provisioning уже не будет нужен с обновленным BIOS? Лучше бы так, потому что хотя он входит в состав пакета ПО для чипсета, для его работы требуется выполнение некоторых условий — включенный «игровой режим» (Game Mode) операционной системы и использование утилиты Microsoft Game Bar, которая предоставляет информацию о запуске игровых приложений. Правильная установка драйвера получается не всегда, иногда он некорректно встраивается в систему, и AMD даже рекомендует переустанавливать Windows при каждой смене процессора! Но куда проще проверить в том же Ryzen Master, что часть ядер с одного CCD паркуется при запуске игр, а драйвер PPM Provisioning присутствует в списке запущенных процессов в диспетчере задач. Но даже при этом всё это работает неидеально, ведь определение игр в Game Bar происходит на основе списка исполняемых файлов, в котором нет части не слишком широко распространенных проектов, и иногда он их не определяет.
Также добавим немного информации о патчах BIOS, версиях ОС и т. п., раз уж заговорили о программной части. Наверное, уже все знают, что в топовых процессорах Intel двух последних поколений была найдена нестабильность, вызванная некорректным управлением напряжением (смещение параметра Vmin, особенно при низких нагрузках). Сначала Intel упиралась, кивая на производителей системных плат, завышающих пределы напряжений и токов, но затем им пришлось признать проблему и в собственных алгоритмах. Для ее исправления они выпустили несколько версий микрокода для процессоров (0x125, 0x129 и 0x12B) и заставили производителей системных плат сделать выбор настроек по умолчанию Intel Default Profile — этот профиль включает ограничения по потреблению CPU самой Intel, меняя параметры питания на те, что установлены для моделей CPU по умолчанию. Для нас это мало что меняет, так как мы изначально выставляли настройки питания в BIOS на уровни, указанные Intel, и поэтому некоторые из результатов наших тестов были ниже, чем у коллег по цеху. Но мы всё же дополнительно обновили BIOS и тесты будут выполняться с применением профиля Intel Default, и по первым прикидкам, это может незначительно снизить производительность лишь в самых ресурсоемких задачах при многопоточной нагрузке.
Теперь что касается уже процессоров AMD: после того, как все западные издания протестировали новые процессоры, компания рассказала о том, что обзорщики всё сделали неправильно и поэтому не получили требуемых приростов, а вот в новой версии операционной системы Windows 11 24H2 якобы будет заметно увеличена производительность новых процессоров из-за специальных оптимизаций ядра под Zen 4 и Zen 5. Еще позже оказалось, что эти оптимизации работают и при установке опционального обновления KB5041587 и в версии системы 23H2. Вот ее мы и использовали в работе — хотя в наших собственных тестах особенно значительного прироста скорости не заметили.
Архитектурные изменения Zen 5
Наиболее полно задумки архитектуры Zen 5 реализованы не в настольных процессорах Ryzen 9000, а в мобильные решениях серии Ryzen AI 300 — чипах, предназначенных для ноутбуков. Впрочем, заложенный в Zen 5 задел скажется и на дальнейшем развитии архитектур компании — Zen 6 и Zen 7, в которых ожидаются значительные обновления, и не все изменения Zen 5 дадут улучшения эффективности прямо сейчас, многие из них нацелены больше на перспективу. В новой архитектуре вычислительных ядер обновили почти все ключевые области вычислительных ядер, включая блок предсказания ветвлений, различные кэши, конвейеры выборки и декодирования, механизм выполнения и загрузку/сохранение данных.
Конечно, архитектура Zen 5 всё так же основана на Zen 4, но большинство составляющих конвейера получили определенные изменения. Одно из важнейших улучшений претерпел блок предсказания ветвлений — он выдает меньшее количество неправильных предсказаний, также отметим увеличенный кэш первого уровня, больший стек адресов возврата, 16-канальную ассоциативность кэша операций по сравнению с 12-канальной в Zen 4, а также увеличение его пропускной способности на треть. Для кэша инструкций первого уровня улучшилась как пропускная способность, так и задержки, также были внедрены два независимых потока выборки и декодирования инструкций.
Значительные изменения внесли в аппаратную часть предсказания ветвлений — блоки выборки и декодирования разделили на две части для оптимизации многопоточного исполнения, планировщик был объединен и унифицирован, увеличена таблица трансляции адресов, как и кэш-память первого уровня — она ускорена и увеличена в объеме. В целом, все блоки Zen 5 способны одновременно исполнить большее количество инструкций по сравнению с Zen 4.
Компания AMD стремится обеспечить улучшение производительности на такт (IPC) с каждым новым поколением Zen, и между поколениями оно обычно составляло от 10 до 20%. В случае с Zen 5 компания объявила о примерном улучшении вычислительной скорости на 16% по сравнению с Zen 4. Треть этой прибавки обеспечивает увеличение количества исполнительных устройств, еще четверть прироста принесли изменения декодера и кэша микроопераций, а еще 25% дали изменения в системе кэширования. Остальная часть ускорения осталась за оптимизацией процесса предсказания переходов и предвыборки (предсказатель ветвлений и в Zen 4 был неплох, а в Zen 5 его сделали еще эффективнее), а также увеличением таблиц истории переходов и улучшением в отслеживании длинных ветвей кода.
Интересно, что AMD даже повышает эффективность технологии одновременного многопоточного исполнения SMT, тогда как Intel отказалась от аналогичной технологии в своей наиболее современной архитектуре, настольные решения на которой ожидаются ближе к концу года. Важным улучшением Zen 5 является ускоренная выборка инструкций — она стала двухпоточной, и L1-кэш инструкций при сохранении его размера может обрабатывать вдвое большее количество данных. Декодер инструкций также стал двойным и в два потока преобразовывает x86-инструкции во внутренние микрооперации — вместо декодирования шести инструкций за такт в Zen 4, новый декодер обрабатывает восемь инструкций. Новые ядра Zen 5 могут одновременно обрабатывать по восемь инструкций на всем протяжении конвейера — на это способны все блоки, тогда как в Zen 4 они работают максимум с шестью инструкциями одновременно. Также были увеличены: объем буфера переупорядочивания и целочисленный регистровый файл — всё это улучшает возможности параллельного исполнения инструкций.
Для обработки большего количества инструкций нужен увеличенный поток данных, так что в Zen 5 вырос объем L1-кэша данных — с 32 до 48 КБ. Эффективность L1-кэша выросла, а задержка осталась на уровне в 4 такта. Для L1-кэша увеличили и его пропускную способность — в Zen 5 он может выдавать четыре 64-байтных или принимать два 64-байтных блока за такт (у Zen 4 было 3 и 1 соответственно). Новое ядро имеет более высокую пропускную способность L1-кэша данных и по сравнению с конкурентом.
Но и это еще не всё — в Zen 5 быстрее работает и L2-кэш. Пропускная способность была улучшена, хотя он по прежнему имеет объем в 1 МБ на каждое ядро. AMD уверяет, что удвоила его ассоциативность и пропускную способность по сравнению с Zen 4 — при помощи вдвое более широкого соединения с L1-кэшем — 512-бит (64 байта) данных.
Возможности L3-кэша также чуть улучшили. Его скорость в чиплетных процессорах AMD ограничена возможностями шины Infinity Fabric, которая используется для получения данных из той части L3-кэша, который находится в другом CCD-чиплете. И хотя сама шина в Zen 5 не отличается от предыдущей реализации, но L3-кэш научился более гибкой работе. AMD также сохранила объем L3-кэша в 32 МБ для разделяемого между всеми ядрами CCD-чиплета, но они поработали над уменьшением задержек и Zen 5 может отслеживать до 320 промахов для этого уровня.
Требования к пропускной способности кэша постоянно возрастают — и ядер больше используется, и они становятся всё быстрее на такт. Подсистема кэш-памяти Zen 5 в целом выглядит отлично, хотя и раньше его иерархия была хороша, а теперь кэш стал еще производительнее. Все улучшения кэширования сделаны для повышения эффективности исполнительных устройств — минимизации их простоя. Так как количество блоков и их возможности в новой архитектуре выросло, нужно поддерживать это и скоростью получения данных.
Блок загрузки/сохранения также получил несколько улучшений для удовлетворения растущих требований со стороны блоков исполнения. Кэш данных первого уровня был увеличен до 48 КБ с 12 каналами — по сравнению с 32 КБ и 8 каналами у Zen 4, а также были проведены улучшения в каналах загрузки/сохранения с комбинацией из 4 загрузок и 2 сохранений за цикл. Четыре целочисленных канала загрузки могут объединяться в канал для работы с плавающей запятой.
Есть и другие изменения в архитектуре Zen 5 — целочисленная часть нового ядра состоит из шести арифметических блоков ALU и четырех адресных AGU, и из нового тут переход к единому планировщику для всех целочисленных портов, а ранее был набор отдельных планировщиков для каждого порта. В теории, новая реализация должна быть эффективнее, так как все исполнительные устройства получают инструкции из одной очереди.
У AGU-портов остались собственные планировщики. Они поддерживают 56 записей, а планировщик ALU — 88, тогда как раньше было комбинированное планирование трех по 24 записи ALU+AGU с выделенным планировщиком ALU на 24 записи. Регистровый файл содержит до 240 записей против 224 у Zen 4, а буфер очереди списания ROB содержит 448 записей по сравнению с 320 в Zen 4.
Очень большие изменения в Zen 5 произошли в блоках операций с плавающей запятой. Исторически компания AMD довольно консервативно улучшала возможности векторных расширений — например, процессоры Athlon обрабатывали 128-битные инструкции SSE как две 64-битные микрооперации долго время, и только в Phenom это изменилось. В Zen 4 уже наблюдался перелом тенденции, а Zen 5 еще пошел вперед еще дальше в отношении AVX512-инструкций. По сравнению с мобильными Zen 5 решениями, настольные CPU этой архитектуры имеют несколько больший транзисторный бюджет и площадь кристаллов на сами ядра и кэши, поэтому в настольной серии CPU используется более агрессивная реализация AVX-512, хотя в мобильных процессорах остался более консервативный подход.
По сравнению с мобильными ядрами Zen 5, настольные отличаются тем, что все записи векторного регистрового файла имеют размер 512 бит, исполнительные FP-блоки имеют полную ширину вектора 512 бит, операции сложения исполняются за два такта по сравнению с тремя тактами в Zen 4 и мобильных Zen 5, кэш данных может обрабатывать две 512-битные загрузки за цикл (Zen 4 и мобильный Zen 5 способны на одну такую загрузку), а также регистровый файл может содержать больше записей. Эти изменения делают настольные Zen 5 довольно мощными процессорами для нагрузок, оптимизированных для AVX-512.
Блок для работы с операциями с плавающей запятой имеет три планировщика (в Zen 4 их было два), исполнительные устройства FP-блока научились работе с 512-битными векторными регистрами — AVX512-инструкции обрабатываются процессором за один проход, а не разделяются на две 256-битные команды для отправки на исполнительные устройства.
Новый FPU имеет четыре конвейера выполнения с двумя каналами исполнения, L1-кэш данных получил специальный механизм для работы с 512-битными векторами — FP-блок способен загружать сразу два 512-битных вектора (вдвое больше, чем Zen 4) и делать одно 512-битное сохранение за такт. Так что FP-ядра Zen 5 должны быть до двух раз быстрее в задачах, использующих инструкции AVX-512, мы проверим это в синтетических тестах.
Многочисленные улучшения архитектуры Zen 5, оптимизации для эффективного многопоточного исполнения, улучшение предсказателя переходов и полноценная поддержка AVX-512 — довольно серьезные изменения по сравнению с Zen 4. Кажется, что оценка увеличения удельной производительности в 16% может быть близкой к истинному положению дел. Жаль только, что мощный потенциал Zen 5 может остаться не полностью востребованным именно в настольных процессорах серии Ryzen 9000. Ведь улучшениям подверглись только сами вычислительные блоки, архитектура самих ядер, но не высокоуровневая организация, поддержка более скоростной памяти и др. Изрядно подозреваем, что раскрыть все возможности Zen 5 пока не удастся — во многом из-за того же контроллера памяти, присоединенного ровно такой же Infinity Fabric к улучшенным вычислительным ядрам. Так что даже потенциальное удвоение темпа исполнения AVX-512 может оказаться не таким впечатляющим во многих случаях.
Самой AMD заявлено 16% увеличение производительности в расчете на такт, это среднее значение по сравнению с Zen 4 показывает улучшения в различных тестах, включающих 10% прироста в игре Far Cry 6, 17% при рендеринге в Cinebench и впечатляющие 21% в игре League of Legends. Ну а самое мощное заявление — улучшение на 35% в тесте Geekbench 5.4 AES-XTS, который использует VAES+ и AVX10/AVX512, что объясняет такой прирост скорости в случае с Zen 5. Скорее всего, в более типичных применениях разница будет несколько ниже — именно это мы сейчас и узнаем.
Тестирование производительности
Тестовые системы и условия
- Процессоры:
- AMD Ryzen 9 9950X (16 ядер/32 потока, 4,3—5,7 ГГц)
- AMD Ryzen 9 7950X (16 ядер/32 потока, 4,5—5,7 ГГц)
- AMD Ryzen 9 7950X3D (16 ядер/32 потока, 4,2—5,7 ГГц)
- AMD Ryzen 9 5950X (16 ядер/32 потока, 3,4—4,9 ГГц)
- Intel Core i9-14900K (8P+16E ядер/32 потока, 3,2—6,0 ГГц)
- Система охлаждения: AeroCool Mirage L360 (СЖО 3×120 мм, 2300/1800 об/мин)
- Системные платы:
- Gigabyte X670 Aorus Elite AX (AM5, AMD X670)
- ASRock X570 Taichi Razer Edition (AM4, AMD X570)
- ASRock Z790 LiveMixer (LGA1700, Intel Z790)
- Оперативная память:
- 32 ГБ (2×16 ГБ) DDR5-5200 CL40 G.Skill Ripjaws S5 (F5-5200U4040A16GX2-RS5W)
- 32 ГБ (2×16 ГБ) DDR5-6200 CL40 Patriot Viper Venom (PVV532G620C40K)
- 32 ГБ (2×16 ГБ) DDR4-3600 CL18 Thermaltake ToughRAM RGB (R009D416GX2-3600C18A)
- Видеокарта: Gigabyte GeForce RTX 4080 EAGLE OC 16 ГБ (GV-N4080EAGLE OC-16GD)
- Накопитель: Solidigm P41 Plus SSD 2 ТБ (SSDPFKNU020TZX1)
- Блок питания: Chieftec Polaris Pro 1300 (PPX-1300FC-A3) (80 Plus Platinum, 1300 Вт)
- Операционная система: Microsoft Windows 11 Pro (24H2)
Для тестирования процессоров мы взяли имеющиеся в наличии высокопроизводительные системные платы для каждой платформы и снабдили их достаточным объемом оперативной памяти, работающей на официально поддерживаемой всеми CPU частоте или близкой к ней — в зависимости от имеющихся в наличии модулей памяти. Для тестирования процессоров Ryzen 9 9950X, 7950X и Intel мы использовали память DDR5-5200 и DDR5-6200 (для игровых тестов с выбором XMP-профиля DDR5-6000 с задержками CL36), а старый процессор AMD с поддержкой DDR4 довольствовался тем же объемом памяти DDR4-3600.
Так как нам интересно сравнить не только топовые процессоры последних поколений AMD и Intel, мы также добавили к ним еще и процессор, который был флагманом AMD до появления платформы AM5 — Ryzen 9 5950X. А для корректного сравнения с топовыми представителями семейства Ryzen 7000 был взят не только обычный 7950X, но и «игровая» модель с дополнительным кэшем — Ryzen 9 7950X3D. Настройки памяти брались из XMP/EXPO-профилей, а ограничения процессоров по потреблению энергии — в соответствии с их спецификациями (а не настройкам производителей системных плат, которые могут отличаться).
В отличие от большинства прошлых игровых тестов с использованием уже устаревшей видеокарты Radeon RX 6800 XT, в этот раз мы использовали куда более мощную модель — GeForce RTX 4080. Высокая производительность графического ядра важна для игровых тестов, которые зачастую упираются именно в возможности GPU, поэтому нужно использовать максимум из имеющегося в наличии. И GeForce RTX 4080 обеспечила почти максимальный уровень производительности, чтобы раскрыть возможности процессоров.
Синтетические тесты
Производительность памяти и системы кэширования
Так как контроллер памяти в серии Ryzen 9000 не изменился, то было бы странно, если бы результаты тестов пропускной способности памяти отличались от того, что мы видели ранее. Но проверить нужно. Мы знаем, что до лучших процессоров Intel решениям AMD далеко — по упомянутым ранее причинам в виде дополнительного канала передачи данных между кристаллом IOD, в котором находится контроллер памяти, и кристаллами CCD с вычислительными ядрами. Поэтому эффективность контроллера памяти DDR5 у процессоров AMD несколько ниже, в чем можно убедиться по результатам тестов памяти и кэша из пакета AIDA64, который измеряет пропускную способность и задержки всех компонент подсистемы памяти. В этом тесте для всех процессоров использовались равные условия — режим DDR5-5200.
Хорошо видно, что результаты всех процессоров AMD очень близкие. А вот Core i9-14900K обходит их всех по пропускной способности, включая и сегодняшнего героя — процессор Ryzen 9 9950X, который явно проигрывает своему сопернику по пиковой пропускной способности, особенно при чтении данных, но и при их записи с копированием тоже. А вот по задержкам разница несущественная, они у Core i9-14900K и всех процессоров Ryzen близки.
RAM Read | RAM Write | RAM Copy | |
---|---|---|---|
Ryzen 9 9950X | 65771 | 69228 | 60878 |
Ryzen 9 7950X3D | 65363 | 68751 | 60715 |
Ryzen 9 7950X | 65940 | 70127 | 61148 |
Ryzen 9 5950X | 53680 | 52293 | 47472 |
Core i9-14900K | 82066 | 73264 | 74317 |
Процессоры платформы AM5 перешли на память DDR5 со значительно большей пропускной способностью подсистемы памяти, поэтому скачок от Ryzen 9 5950X получился заметным. Но старый CPU куда ближе к достижению теоретической ПСП по сравнению с более новыми CPU, так что эффективная пропускная способность памяти DDR5 у них действительно невелика — они достигли лишь 66 ГБ/с по сравнению с 82 ГБ/с при чтении у процессора Intel с этой же памятью. У рассматриваемого Ryzen 9 9950X пропускная способность примерно такая же, что и у 7950X и 7950X3D, что неудивительно.
В течение нескольких последних десятков лет рост вычислительной мощности значительно опережал увеличение производительности памяти, и поэтому процессоры использовали всё более сложные кэши, чтобы обеспечить повышение производительности и не упираться в возможности памяти. Сейчас процессоры Intel и AMD используют трехуровневую схему кэширования: каждое ядро получает небольшую кэш-память L1 и собственную же кэш-память второго уровня побольше, чтобы избавиться от высокой задержки L3. Последний уровень кэша имеет размер в несколько мегабайт и используется сразу несколькими ядрами. В их случае важны и задержки и пропускная способность.
L1 Latency | L2 Latency | L3 Latency | RAM Latency | |
---|---|---|---|---|
Ryzen 9 9950X | 0,7 | 2,5 | 10,6 | 77,8 |
Ryzen 9 7950X3D | 0,8 | 2,8 | 11,8 | 79,9 |
Ryzen 9 7950X | 0,7 | 2,6 | 9,4 | 75,8 |
Ryzen 9 5950X | 0,8 | 2,5 | 11,6 | 62,3 |
Core i9-14900K | 0,9 | 3,6 | 13,9 | 79,7 |
Подсистема кэширования Zen 5 в целом похожа на ту, что применялась в Zen 4, были улучшены некоторые параметры, в основном не связанные с задержками, а частоты флагманов двух последних поколений близки. В итоге у 9950X получились примерно такие же задержки для всех уровней кэша. Да и от 5950X они недалеко ушли по задержкам. А вот у топового процессора Intel задержки на всех уровнях (кроме памяти, которая одинаковая) явно выше, особенно хорошо это заметно по L2-кэшу.
Но кроме задержек доступа к кэшам, важна и их пропускная способность, особенно для векторизованного кода. И вот тут в Zen 5 были кое-какие изменения, связанные в том числе и с изменением возможностей вычислительных ядер, которые нужно поддержать и улучшением кэширования. В итоге, пропускная способность как минимум двух первых уровней кэш-памяти явно улучшилась. Рассмотрим тест пропускной способности всех уровней кэш-памяти из AIDA64.
L1 Read | L1 Write | L1 Copy | L2 Read | L2 Write | L2 Copy | L3 Read | L3 Write | L3 Copy | |
---|---|---|---|---|---|---|---|---|---|
Ryzen 9 9950X | 10469 | 5271 | 9941 | 3826 | 3505 | 3642 | 1498 | 1612 | 1391 |
Ryzen 9 7950X3D | 4818 | 2533 | 4981 | 2512 | 2309 | 2388 | 1413 | 1450 | 1370 |
Ryzen 9 7950X | 5174 | 2715 | 5367 | 2684 | 2560 | 2537 | 1698 | 1719 | 1660 |
Ryzen 9 5950X | 3974 | 2177 | 4436 | 2200 | 2078 | 2154 | 1066 | 1150 | 1092 |
Core i9-14900K | 6006 | 3638 | 8612 | 1489 | 664 | 1074 | 1851 | 658 | 1301 |
Наглядно видно, что кэш-память Ryzen 9 9950X на первых двух уровнях явно стала быстрее, чем у 7950X, и особенно по сравнению с 5950X. Если в прошлом поколении первые два уровня ускорились из-за увеличенной рабочей частоты Zen 4, то в Zen 5 явно сказались архитектурные изменения, и L1-кэш стал вдвое быстрее. Ускорение кэша второго уровня не такое значительное, но раза в полтора подняли и его пропускную способность, ну а L3-кэш изменился по сравнению с 7950X незначительно. И вот теперь конкурент в виде Core i9-14900K уже уступает флагманскому процессору AMD по всем фронтам, только чтение из L3-кэша у него осталось чуть быстрее.
Задержки от ядра к ядру
Количество вычислительных ядер в современных процессорах растет, им требуется взаимодействовать друг с другом, и при большом количестве ядер во многих CPU время доступа одного ядра к данным из другого частенько не является одинаковым. Мы говорим не только о чиплетных компоновках с понятными ограничениями, даже в монолитных кристаллах ядра зачастую использовали разные внутренние цепи передачи данных с разными задержками для дальних и ближних ядер. Особенно важны такие задержки в многопроцессорных системах, но и в однопроцессорных они также играют определенную роль. Тест задержек между ядрами MicroBenchX наглядно показывает, как расположены группы ядер в процессорах Ryzen (результаты Core i9-14900K приведены для иллюстрации отличий монокристального подхода).
Мы уже писали о явной проблеме процессоров Ryzen 9000 с двумя CCD выше — если процессор архитектуры Zen 4 по сравнению с задержками в Zen 3 отличается слабо, то в 9950X задержки при обращении к ядрам из разных CCD по какой-то причине выросли даже не вдвое, а еще больше — задержки между ядрами в пределах одного чиплета невелики, а при соединении с ядрами из другого чиплета они увеличиваются в разы (мы очень надеемся, что в последних прошивках это исправили).
Хотя и 9950X и 7950X даже используют одинаковую чиплетную организацию из двух 8-ядерных чиплетов и абсолютно одинакового IOD, но задержки между разными ядрами в разных частях CCD в случае 7950X составляют около 80 нс, а у 9950X — 200 нс и даже более. На этом фоне удивительно скорее то, насколько близки задержки между ядрами в 7950X по сравнению с 5950X — несмотря на то, что там и CCD-кристаллы другие и IOD иной. Впрочем, по процессорам Ryzen предыдущих серий мы знаем, что на снижении общей производительности в подавляющем большинстве случаев этот недостаток практически не сказывается.
Количество инструкций за такт — IPC
Компания AMD заявила об улучшении вычислительной производительности на такт на 16% по своим тестам, мы решили проверить это в еще одном тесте MicroBenchX, который для корректных измерений требует работы CPU на фиксированной частоте — мы зафиксировали работу всех ядер тестовых процессоров на уровне 4 ГГц — на подобную частоту способны все представленные модели. Разделили длинную диаграмму на две части и рассмотрим сначала тесты без AVX-512.
Как хорошо видно на диаграмме, в новой архитектуре Zen 5 явно улучшен темп инструкций, исполняемых за такт. Причем, в ряде случаев наблюдаются приросты довольно серьезные, хоть и далеко не всегда, а чаще в подтестах Integer 64 — в основном, это целочисленные тесты и лишь иногда деления с плавающей запятой. Но есть и тесты, где положение ухудшилось — впрочем, это смесь некая инструкций Zen FPU — вероятно, лучше оптимизированная для старых архитектур. В среднем же разница получилась порядка 14%. И хотя сравнивать с заявленными 16% некорректно, ведь это совсем разные вещи, можно констатировать, что улучшения в показателе IPC у архитектуры Zen 5 явно есть. И такое увеличение IPC в его привычном понимании — очень неплохо, если говорить именно о среднем темпе исполнения инструкций за такт.
Что касается сравнения с конкурентом (уже изрядно устаревшим), то у процессоров AMD и Intel всегда были свои явные сильные и слабые стороны, но в среднем разница между Ryzen 9 7950X и Intel Core i9-13900K (нет отличий от 14900K, это одинаковые CPU) была незначительной, а именно Ryzen 9 9950X сделал приличный рывок, явно обогнав и предшественников и соперника. За Intel остался буквально один подтест, так что подождем, что они подготовят в действительно новом поколении своих CPU. А нам осталось посмотреть на темп исполнения инструкций AVX-512, и сравнивать новый процессор AMD придется лишь с 7950X и стареньким Core i9-11900K, так как более свежие процессоры Intel не поддерживают этот набор инструкций.
Даже Ryzen 9 7950X выглядит сильно на фоне Core i9-11900K, но это уж слишком старый CPU конкурента, который вышел несколько лет назад и использует уже очень старый техпроцесс 14 нм. Более новые модели процессоров Intel с поддержкой AVX-512 предложили бы более высокий темп исполнения таких инструкций, но проверить это мы не можем, официальной поддержки AVX-512 все новые процессоры Intel лишены.
А вот что интересно, так это сравнение полной реализации поддержки AVX-512 в 9950X с «умеренной» реализацией в 7950X. Чисто в теории, разница может быть двукратной, и она действительно есть — в большинстве подтестов скорость действительно удвоилась — AMD не обманывает. Лишь один единственный случай (Sub AVX512 Integer) показал слабый прирост, и проблема может быть в недостатке возможностей кэша/памяти. В целом же, новый Zen 5 по пиковому темпу исполнения инструкций AVX-512 действительно стал вдвое быстрее Zen 4.
Синтетические тесты Sandra
Чисто синтетические тесты производительности из пакетов вроде Sandra и AIDA64 также могут быть интересны для оценки низкоуровневой производительности в специализированных задачах, хотя они и претендуют на некоторую универсальность.
CPU Overall | CPU Crypto | CPU Scientific | Neural Network High Precision | |
---|---|---|---|---|
Ryzen 9 9950X | 33,1 | 34,9 | 131,3 | 28,3 |
Ryzen 9 7950X3D | 27,2 | 34,0 | 129,6 | 31,9 |
Ryzen 9 7950X | 26,0 | 34,3 | 96,1 | 22,3 |
Ryzen 9 5950X | 17,1 | 22,3 | 56,5 | 13,6 |
Core i9-14900K | 22,5 | 41,1 | 105,5 | 19,1 |
Первая группа тестов показывает относительную производительность в разных задачах и некий общий счет (CPU Overall), вычисленный из всех результатов. По нему Ryzen 9 9950X занимает явное первое место, обойдя своего предшественника 7950X на 27%, а соперника в виде 14900K вообще почти в полтора раза! Результат мощный, хотя по отдельным подтестам видно, что в одном случае новый Ryzen проиграл устаревшему конкуренту Intel — в криптографическом тесте. Но в остальных подтестах преимущество новинки AMD весьма впечатляет, особенно в мультимедийных:
CPU Multi-media, Mpix/s | CPU Image Processing, Mpix/s | |
---|---|---|
Ryzen 9 9950X | 7455 | 2657 |
Ryzen 9 7950X3D | 3649 | 2522 |
Ryzen 9 7950X | 3769 | 2550 |
Ryzen 9 5950X | 2653 | 1206 |
Core i9-14900K | 2494 | 1595 |
Тесты показывают вычислительную производительность при обработке медиаданных, и тут Ryzen 9 9950X стал лучшим. Если в тесте обработки изображений прирост к 7950X оказался небольшим, то во втором синтетическом подтесте новинка ускорилась примерно вдвое! Похоже, что этот тест использует инструкции AVX-512, ведь как раз темп их исполнения возрос вдвое. Лучший процессор Intel в нем же отстал чуть ли не втрое, да и при обработке изображений — на целых 66%. Но не забываем, что это чисто синтетические тесты с определенной специализацией, которые лучше подходят для процессоров AMD. Рассмотрим тесты из еще одного универсального пакета.
Синтетические тесты AIDA64
Это также чисто синтетические тесты, которые показывают производительность в задачах с определенной специализацией. Например, CPU Queen использует целочисленные операции при решении классической шахматной задачи, а AES — скорость шифрования по одноименному криптографическому алгоритму:
CPU Queen | CPU AES | |
---|---|---|
Ryzen 9 9950X | 187898 | 702599 |
Ryzen 9 7950X3D | 198046 | 362800 |
Ryzen 9 7950X | 204598 | 381168 |
Ryzen 9 5950X | 160590 | 278900 |
Core i9-14900K | 168321 | 298916 |
Вот это поворот — пожалуй, первый тест, в котором новый флагман AMD даже уступил своему предшественнику. Похоже, что новинка сильнее зажата лимитом потребления энергии, сильнее снижает частоту и поэтому не догнала даже 7950X в подтесте Queen. Зато в AES она снова вдвое быстрее! Core i9-14900K показал результаты почти на уровне Ryzen 9 5950X, но в Queen он близок к рассматриваемому сегодня CPU.
CPU Photoworxx | CPU Zlib | CPU SHA3 | |
---|---|---|---|
Ryzen 9 9950X | 42049 | 2787 | 11238 |
Ryzen 9 7950X3D | 43923 | 2314 | 10678 |
Ryzen 9 7950X | 42233 | 2458 | 11026 |
Ryzen 9 5950X | 20443 | 1725 | 7132 |
Core i9-14900K | 48967 | 2493 | 8949 |
Первые два теста очередной диаграммы также используют целочисленные операции для вычислений над изображениями и при сжатии информации, а SHA3 — еще один криптографический алгоритм. В них процессоры Intel традиционно выглядят сильнее, особенно в тесте обработки изображений. Новый Ryzen 9 9950X в этот раз во всех подтестах примерно на уровне своего предшественника, преимущество у него есть только при сжатии Zlib. Core i9 быстрее всех при обработке фотографий (вероятно, сказывается более эффективный контроллер памяти), а в остальных тестах уступает новинке.
FPU Julia | FPU Mandel | FPU SinJulia | FP32 Raytrace | FP64 Raytrace | |
---|---|---|---|---|---|
Ryzen 9 9950X | 262495 | 139621 | 35078 | 92306 | 48944 |
Ryzen 9 7950X3D | 244712 | 130232 | 32142 | 58862 | 31808 |
Ryzen 9 7950X | 258887 | 136333 | 33315 | 63480 | 34092 |
Ryzen 9 5950X | 200288 | 110480 | 25648 | 33106 | 17504 |
Core i9-14900K | 178808 | 89769 | 20460 | 36690 | 19470 |
Самый многочисленный набор тестов из AIDA64 включает подтесты производительности операций с плавающей запятой, включая инструкции всех вариантов SSE и AVX/AVX2. Результаты процессоров AMD в этих тестах всегда были сравнительно высокими, даже Ryzen 9 5950X показывает производительность на уровне Core i9-14900K, ну а новый Ryzen 9 9950X везде стал явным лидером — заметно усиленный блок FP в Zen 5 сказывается. Преимущество над флагманом Intel серьезное, но в случае тестов трассировки лучей преимущество вообще близко к трехкратному! Что касается разницы между 9950X и 7950X, то по первым трем тестам (просто FPU) они не сильно отличаются, а в трассировке новый флагман более чем на 50% быстрее — спасибо вдвое более быстрому исполнению AVX512-инструкций.
Бенчмарк CPU-Z
Еще один синтетический тест, который мы решили включить в этот раздел — ближе всего он к тестам рендеринга и по нему также очень удобно сравнивать однопоточную и многопоточную производительность процессоров. В случае Zen 5 и Zen 4 использовался вариант теста AVX-512, который позволил немного увеличить производительность по сравнению с остальными CPU.
1T | 1T AVX2/AVX512 | |
---|---|---|
Ryzen 9 9950X | 284 | 1291 |
Ryzen 9 7950X3D | 250 | 964 |
Ryzen 9 7950X | 268 | 1039 |
Ryzen 9 5950X | 230 | 781 |
Core i9-14900K | 301 | 1385 |
По пиковой однопоточной производительности всегда были сильны процессоры Intel, что подтверждается и результатами теста CPU-Z — Core i9-14900K всё же быстрее нового Ryzen 9 9950X в таких условиях, что с использованием AVX, что без этих инструкций. Но разница между ними заметно сократилась. По сравнению с предшествующим Ryzen 9 7950X, новый топовый процессор AMD оказался на 24% быстрее в однопотоке с применением AVX — это очень неплохой результат с учетом того, что CPU ограничен возможностями контроллера памяти. Но нас больше интересует многопоточная нагрузка, которая должна быть усилена в новой модели процессора:
MT | MT AVX2/AVX512 | |
---|---|---|
Ryzen 9 9950X | 5660 | 23540 |
Ryzen 9 7950X3D | 5098 | 18926 |
Ryzen 9 7950X | 5313 | 20203 |
Ryzen 9 5950X | 4313 | 14200 |
Core i9-14900K | 5326 | 17660 |
И в этом случае мы видим очень хороший результат — если в обычном тесте без AVX-инструкций преимущество новинки над 7950X и 14900K не так уж велико — около 6%, то более производительный вариант теста принес 33% преимущества над самым быстрым Core i9 и почти 17% — над Ryzen 9 7950X. Довольно близко к заявленным компанией 16%. Пока что, если не учитывать результаты некоторых синтетических тестов из Sandra, то от 9950X можно ждать очень сильных результатов и в других многопоточных тестах нашего материала.
Синтетические тесты 3DMark
Это уже несколько более приближенные к практике и менее синтетические тесты (если можно так сказать), которые измеряют производительность систем в определенных типах прикладных задач в виде 3D-графики. Они выводят некое значение, показывающее вычислительную производительность в узкоспециализированной задаче — игровой производительности.
В подтесте 3DMark CPU Profile рассматриваемый Ryzen 9 9950X обгоняет своего предшественника примерно так же — на 17% в однопоточном режиме, а вот в многопоточном дела куда хуже — всего лишь около 4% прироста. Так получилось из-за более жесткого ограничения теплового пакета в новом процессоре для платформы AM5, благодаря чему Ryzen 9 7950X может удерживать чуть более высокую частоту при нагрузке на все ядра. Но преимущество у новинки на базе Zen 5 всё равно есть, и особенно хорошо, что в однопоточном тесте — ахиллесовой пяте процессоров AMD.
1T | MT | |
---|---|---|
Ryzen 9 9950X | 1311 | 17157 |
Ryzen 9 7950X3D | 1113 | 15002 |
Ryzen 9 7950X | 1113 | 16515 |
Ryzen 9 5950X | 943 | 13400 |
Core i9-14900K | 1288 | 17134 |
К слову о конкуренте — Core i9-14900K очень близок к сегодняшней новинке и в том случае, когда нагрузка лежит на одном ядре, и когда она распределена на все имеющиеся. Разница между лучшими CPU двух производителей в этом тесте несущественна — наглядный пример того, что 16 одинаковых ядер работают примерно так же эффективно, как и большее количество неоднородных. А ведь ранее однопоточная нагрузка всегда была сильной стороной процессоров Intel, что подтверждалось во всех тестах — теперь же AMD сравнялась с Intel, и это очень хорошо для игровых тестов.
Time Spy Extreme CPU | Time Spy CPU | Night Raid CPU | |
---|---|---|---|
Ryzen 9 9950X | 13263 | 15089 | 23166 |
Ryzen 9 7950X3D | 11742 | 15621 | 14491 |
Ryzen 9 7950X | 12648 | 15933 | 14732 |
Ryzen 9 5950X | 9585 | 12897 | 12288 |
Core i9-14900K | 13405 | 21997 | 24007 |
Еще три процессорных теста из 3DMark — это физические расчеты, умеющие использовать многопоточность, но с разной степенью эффективности. Преимущество новинки над Ryzen 9 7950X есть не всегда, но в Night Raid на удивление получилось очень много — скорее всего, работой в нем загружены не все вычислительные ядра, а в таких условиях Zen 5 быстрее. Однако, если сравнивать нового флагмана AMD с Core i9-14900K, то он на равных с 9950X в первом тесте, чуть-чуть быстрее в третьем и заметно лучше в Time Spy CPU. Так что можно ожидать, что хотя в игровой нагрузке 9950X должен приблизиться к 14900K, но последний может остаться впереди.
Рендеринг
Тесты рендеринга являются одними из самых сложных для современных процессоров из-за многопоточного характера нагрузки при трассировке лучей — современные процессоры при этом стараются поддерживать максимально возможную частоту, могут потреблять много энергии и сильно нагреваться. Компания AMD нередко использует бенчмарк Cinebench для сравнения производительности своих процессоров с решениями конкурента — подобные нагрузки при рендеринге лучше исполняются при большем количестве ядер и потоков, чем отличались ранние Ryzen по сравнению с конкурирующими CPU.
1T | MT | |
---|---|---|
Ryzen 9 9950X | 2280 | 43750 |
Ryzen 9 7950X3D | 1960 | 35910 |
Ryzen 9 7950X | 2030 | 37760 |
Ryzen 9 5950X | 1580 | 27900 |
Core i9-14900K | 2330 | 39820 |
Первый тест рендеринга показывает преимущество нового процессора архитектуры Zen 5 над моделью предыдущего поколения — в однопоточном режиме оно было на уровне 12%, а в многопоточном — те самые 16% (у AMD в слайдах было 17%, к слову). Что вполне соответствует обещаниям компании AMD, которая как раз и использует в том числе и Cinebench R23 для оценки роста относительной производительности.
Core i9-14900K в этом тесте всё же остался чуть быстрее в однопоточном варианте теста — процессоры Intel часто очень сильны в случае нагрузки с одним (или малым количеством) потоком, а вот то, что в многопотоке 9950X теперь впереди, радует очень сильно. Ведь конкурент отличается большим количеством ядер, пусть не все из них имеют одинаковые возможности. Подход AMD показал, что можно добиться преимущества и не раздувая количество ядер. Тем более, что процессор Intel потребляет заметно больше энергии — с чем мы еще разберемся ближе к концу нашего материала.
monster | junkshop | classroom | |
---|---|---|---|
Ryzen 9 9950X | 337,4 | 200,6 | 161,2 |
Ryzen 9 7950X3D | 281,9 | 170,2 | 133,7 |
Ryzen 9 7950X | 296,3 | 175,6 | 140,2 |
Ryzen 9 5950X | 211,1 | 131,5 | 98,8 |
Core i9-14900K | 279,7 | 165,5 | 129,1 |
Три тестовые сцены в Blender показывают несколько отличающиеся друг от друга результаты, но в целом и тут всё понятно — преимущество над Ryzen 9 7950X составило около 15%, да и конкурент в этот раз был повержен — новый Ryzen 9 9950X оказался быстрее Corei9-14900K на достаточно впечатляющие 20%-25%! При такой разнице в количестве вычислительных ядер и потреблении энергии это преимущество впечатляет еще больше. Наибольшая разница между протестированными процессорами наблюдается в случае самой сложной сцены — classroom.
Time | |
---|---|
Ryzen 9 9950X | 33 |
Ryzen 9 7950X3D | 36 |
Ryzen 9 7950X | 36 |
Ryzen 9 5950X | 46 |
Core i9-14900K | 36 |
Еще один тест рендеринга — Corona, измеряющий время, затрачиваемое на отрисовку одного кадра. Сразу три процессора (два представителя Ryzen 7000 и топовый Intel показали идентичный результат, а вот рассматриваемая сегодня модель Ryzen 9 9950X опередила их всех на 9% — несколько меньше, чем в предыдущих тестах, но тоже неплохо в качестве шага вперед для CPU новой вычислительной архитектуры.
Score | |
---|---|
Ryzen 9 9950X | 34240 |
Ryzen 9 7950X3D | 28032 |
Ryzen 9 7950X | 28870 |
Ryzen 9 5950X | 21200 |
Core i9-13900K | 27040 |
Ну и последний бенчмарк с 3D-рендерингом на сегодня — VRay, он измеряет скорость отрисовки изображений для трех сцен. Это единственный тест, в котором пришлось заменить результат Core i9-14900K показателем предыдущего флагмана Intel, так как тест не работал на более современном. Но разница между ними несущественная, так как мы тестируем процессоры с ограничениями по питанию, заданными самими производителями CPU, а оба флагмана Intel упираются в эти пределы.
В целом, результаты повторяют то, что мы видели в предыдущих тестах раздела — Ryzen позапрошлого поколения очень далек от современных процессоров, 7950X быстрее старого 5950X на 36% и побыстрее лучшего решения Intel. Но нас больше всего интересует то, насколько Ryzen 9 9950X смог ускориться — и это впечатляющие 19% — даже чуть больше заявленного AMD прироста. Флагман Intel медленнее новинки более чем на четверть, и это — при большем количестве вычислительных ядер и заметно большем потреблении энергии.
Работа с фото и видео
Тестовый раздел рассматривает несколько программ для обработки медиаданных — фотографий и видеороликов. Это уже вполне практические задачи, вроде экспорта сотни изображений высокого разрешения в формате RAW объемом около 3 ГБ в Adobe Lightroom Classic — подобными задачами на постоянной основе занимается большинство серьезных фотографов.
Time | |
---|---|
Ryzen 9 9950X | 15 |
Ryzen 9 7950X3D | 21 |
Ryzen 9 7950X | 19 |
Ryzen 9 5950X | 24 |
Core i9-14900K | 16 |
В прошлые разы мы отмечали, что в этом ПО процессоры Intel всегда быстрее соперников из стана AMD, что Core i9-12900K лучше справлялся по сравнению с Ryzen 9 5950X, что 13900K был быстрее чем 7950X. И вот у AMD вышел очередной флагман, заметно улучшивший показатели однопоточной производительности (как ни странно, в Lightroom важнее именно она) и сразу же опередил на секунду даже 14900K. Понятно, что нужно подождать более новых процессоров Intel, но результат для нового флагмана отличный. И по сравнению с 7950X из предыдущего поколения, новый CPU оказался примерно на четверть быстрее.
FPS | Time | |
---|---|---|
Ryzen 9 9950X | 17,6 | 199 |
Ryzen 9 7950X3D | 16,2 | 215 |
Ryzen 9 7950X | 16,8 | 206 |
Ryzen 9 5950X | 12,6 | 274 |
Core i9-14900K | 17,8 | 194 |
Следующий тест Handbrake — это пакет для конвертирования видеоданных в другие форматы. Мы использовали входной ролик формата H.264 и перекодировали его в формат H.265 — тоже довольно нередкая задача, встающая перед пользователями. Новый флагман Ryzen 9 9950X показал результат, очень близкий к Core i9-14900K, что не так плохо для этого теста, ну а своего предшественника архитектуры Zen 4 он опередил примерно на 8%, что несколько ниже наших ожиданий.
FPS | Time | |
---|---|---|
Ryzen 9 9950X | 5,8 | 43,3 |
Ryzen 9 7950X3D | 3,8 | 66,1 |
Ryzen 9 7950X | 4,0 | 63,5 |
Ryzen 9 5950X | 3,3 | 77,0 |
Core i9-14900K | 5,9 | 42,7 |
Второй тест перекодирования видеоданных — SVT-AV1, в нем видеоданные кодируются в формат AV1 — относительно новый открытый стандарт. В этом случае сравнительные результаты у сегодняшней новинки получились также очень близки к конкурирующему Core i9-14900K, и в этом случае практически равные результаты можно назвать сюрпризом — это приложение всегда было быстрее именно на Intel. Но архитектурные изменения, наверняка связанные с быстрым темпом исполнения AVX512-кода, позволили почти догнать флагманское решение Intel, чего давно не было. Ну и своего предшественника в виде 7950X новый топовый CPU обошел почти на 50% — отличный результат для Zen 5!
sec/frame | |
---|---|
Ryzen 9 9950X | 1,2 |
Ryzen 9 7950X3D | 1,8 |
Ryzen 9 7950X | 1,7 |
Ryzen 9 5950X | 4,3 |
Core i9-14900K | 2,2 |
Последний тест раздела — Topaz Video Enhance AI — улучшение качества видео с использованием возможностей нейросетей и искусственного интеллекта. Очень тяжелая вычислительная задача использует высококачественное увеличение разрешения по алгоритму Artemis High Quality с Full HD до 4K. И тут новая модель Ryzen 9 9950X раскрывает все свои возможности, используя ускоренный конвейер AVX-512. Если более чем 80% преимущества над Core i9-14900K можно было назвать ожидаемым, так как AMD тут всегда были быстрее, то более чем за 40% превосходства над Ryzen 9 7950X снова нужно благодарить архитектурные изменения вычислительных ядер Zen 5. Просто отличные результаты всего раздела для новинки.
Криптографические тесты
Еще один важный раздел тестирования производительности процессоров — криптографические задачи. Современные CPU умеют осуществлять шифрование больших объемов информации буквально на лету, и некоторые даже имеют поддержку специальных инструкций для распространенных алгоритмов, таких как AES. Первый тест — John The Ripper — свободное ПО для восстановления паролей по хешам, умеющее пользоваться всеми возможностями современных процессоров.
MD5 | DES | Blowfish | |
---|---|---|---|
Ryzen 9 9950X | 2856000 | 284893 | 60946 |
Ryzen 9 7950X3D | 2654000 | 242370 | 43636 |
Ryzen 9 7950X | 2892000 | 287641 | 45728 |
Ryzen 9 5950X | 2191000 | 225087 | 37746 |
Core i9-14900K | 2090000 | 207184 | 51718 |
Хорошо видно, что разница между новой моделью процессора AMD и предшествующим ему Ryzen 9 7950X сильно зависит от метода шифрования. В первых двух подтестах новинка даже... уступила старой модели на базе Zen 4 — предполагаем, что из-за большего упора в чуть меньший предел энергопотребления. Конкурирующий CPU Intel в этих тестах отстает от всех Ryzen, даже от старого 5950X. А вот третий тест (Blowfish) отличается от других — Ryzen 9 9950X в нем оказался сразу на 33% быстрее предшествующей модели процессора — 7950X. А соперник из стана Intel тут хоть и силен, но именно новый топовый Ryzen на базе Zen 5 смог одолеть его из-за архитектурных улучшений.
AES | Twofish | |
---|---|---|
Ryzen 9 9950X | 24,5 | 9,6 |
Ryzen 9 7950X3D | 26,6 | 7,2 |
Ryzen 9 7950X | 24,5 | 7,8 |
Ryzen 9 5950X | 16,2 | 6,2 |
Core i9-14900K | 29,5 | 8,0 |
VeraCrypt — программное обеспечение для шифрования на лету, использующее разные алгоритмы шифрования данных и умеющее использовать аппаратное ускорение шифрования на CPU. В тестах мы использовали буфер объемом 1 гигабайт и получили преимущество нового Ryzen 9 9950X над более старой аналогичной моделью лишь в подтесте Twofish — сразу на 23%, а вот в AES оба 16-ядерника последних поколений без кэша оказались равны. Что касается сравнения с конкурирующим Core i9-14900K, то процессор Intel оказался заметно быстрее новинки AMD в первом тесте и немного проиграл во втором.
SSE2 | AVX | AVX2/AVX512 | |
---|---|---|---|
Ryzen 9 9950X | 797 | 952 | 1562 |
Ryzen 9 7950X3D | 580 | 653 | 1127 |
Ryzen 9 7950X | 575 | 710 | 1188 |
Ryzen 9 5950X | 456 | 548 | 780 |
Core i9-14900K | 653 | 860 | 1175 |
Последний криптографический тест — cpuminer-opt. Это программа для майнинга на процессорах, она также использует криптографические вычисления и очень хорошо оптимизирована для исполнения на современных CPU. Для тестов мы выбрали алгоритм x25x, используемый в некоторых криптовалютах, и для сравнения брали лучший результат из нескольких оптимизированных вариантов майнера, использующих наборы инструкций: SSE2, AVX2, AVX-512, а также аппаратную поддержку AES и SHA.
И это еще один бенчмарк с хорошей оптимизацией под возможности Zen 5. Новый Ryzen 9 9950X опередил предшествующую ему модель прошлого поколения на величину от 31% до 38% в зависимости от используемых расширенных инструкций SSE2, AVX и AVX2/AVX512. Раньше Core i9-14900K лучше процессоров AMD справлялся с этой задачей, по крайней мере в режимах SSE2 и AVX, но теперь можно четко утверждать, что новый флагман стал лидером этого бенчмарка.
Сжатие и распаковка
Сжатие и распаковка данных в архивах известна большинству пользователей, как и наиболее яркие представители продвинутых современных архиваторов, одним из которых долгие годы является WinRAR. Мы воспользовались встроенным бенчмарком в архиватор, который измеряет максимальную скорость сжатия данных.
KB/s | |
---|---|
Ryzen 9 9950X | 54180 |
Ryzen 9 7950X3D | 58127 |
Ryzen 9 7950X | 54803 |
Ryzen 9 5950X | 39502 |
Core i9-14900K | 52688 |
Результаты WinRAR показали, что новый Ryzen 9 9950X не быстрее аналогичного процессора из предыдущего поколения, и в этом наверняка виновата не слишком производительная память DDR5 и не самый эффективный ее контроллер в процессорах AMD, и даже улучшения в системе кэширования ничего не изменили, ну а тактовая частота у процессоров близкая. Конкурирующий процессор Intel Core i9-14900K отстал от нового флагмана совсем немного, но Ryzen 9 9950X всё же победил.
Compress | Decompress | |
---|---|---|
Ryzen 9 9950X | 173,3 | 268,5 |
Ryzen 9 7950X3D | 176,2 | 258,5 |
Ryzen 9 7950X | 172,1 | 264,2 |
Ryzen 9 5950X | 88,9 | 218,1 |
Core i9-14900K | 164,8 | 228,0 |
Архиватор 7-zip может чуть менее популярен, но зато интересен поддержкой более эффективного и требовательного метода сжатия. В его случае результаты для Ryzen 9 9950X также получились не намного быстрее того, что мы видели у 7950X. Предполагаем упор в возможности памяти DDR5 и соответствующего контроллера. Что всё зависит от скорости памяти — понятно по сравнению их с Ryzen 9 5950X с DDR4. Core i9-14900K чуть уступает по скорости и сжатия и распаковки, так что номинально новинка быстрее. Но прироста у Zen 5 к Zen 4 при сжатии мы не получили совсем.
Математические тесты
Этот раздел будет довольно скудным — к условно математическим задачам мы отнесли Y-Cruncher — программу для вычисления числа пи. Особенный интерес для нас вызывает поддержка этой программой набора инструкций AVX-512, а также оптимизация этого ПО конкретно под Zen разных поколений. Проверяем, как это получилось у разработчиков:
1T | MT | |
---|---|---|
Ryzen 9 9950X | 111,8 | 22,1 |
Ryzen 9 7950X3D | 175,2 | 22,0 |
Ryzen 9 7950X | 171,4 | 21,9 |
Ryzen 9 5950X | 263,1 | 28,6 |
Core i9-14900K | 188,6 | 22,3 |
Мы протестировали вычисление миллиарда знаков числа Пи в однопоточном и многопоточном режимах, и остановимся на них отдельно. Со второй задачей Ryzen 9 9950X справился почти так же быстро, что и 7950X, а вот в однопоточном тесте новый CPU быстрее более чем в полтора раза! Неудивительно и сравнение с конкурирующим Core i9-14900K — они близки в многопотоке, но топовый Zen 5 гораздо быстрее в однопоточном режиме.
Похоже, что процессор Intel просто имеет очень большое количество вычислительных ядер, поэтому и быстрее при многопоточной нагрузке. А в Zen 5 серьезно ускорили именно сценарии с малым количеством потоков, поэтому новый CPU стал лидером этого бенчмарка. Более того, его автор утверждает, что Ryzen 9 9950X сильно ограничен возможностями памяти DDR5 и контроллера при исполнении оптимизированного под AVX-512 кода, и мог быть еще быстрее.
Раньше мы тестировали процессоры еще и во встроенном бенчмарке в MATLAB, но его сложно считать показательным тестом, так как он слишком устарел и проходит на современных CPU стремительно, а его результаты сильно плавают от одного прогона к другому — поэтому мы решили его убрать. Возможно, в следующий раз мы добавим какие-то актуальные задачи, связанные с машинным обучением, к примеру, ну а пока лучше посмотрите результаты раздела научных расчетов из нашей тестовой методики 2020 года, в которую входят тесты для пакетов LAMMPS, NAMD и MATLAB.
iXBT Application Benchmark 2020
В качестве дополнительных тестов мы прогнали и более привычный для вас тестовый набор из методики тестирования образца 2020 года, которая известна вам уже несколько лет. В ней применяются реальные приложения, лишь частично пересекающиеся с теми тестами, результаты которых вы видели в этом материале ранее.
Подробный анализ этих результатов традиционно оставляем вам, сами отмечаем лишь самые важные и любопытные моменты. В научных расчетах ранее лучше выступали процессоры Intel, но сегодняшняя новинка Ryzen 9 9950X не просто серьезно подтянулась к Core i9-14900K в этом наборе тестов, но и опередила его. А вот в задачах архивирования данных обойти флагмана Intel не получилось — преимущества над Ryzen 9 7950X тоже нет. В среднем же топовые процессоры AMD и Intel достаточно близки, даже при том, что 14900K вышел годом ранее и основан на довольно старой архитектуре.
Хорошо видно, что сравнительная производительность Ryzen 9 9950X сильно зависит от характера задачи. Новинка иногда показывает не слишком большой прирост по сравнению с предшественником, а иногда опережает его достаточно сильно — за счет немалых архитектурных изменений. В среднем же новый CPU быстрее своего предшественника лишь на 8%, и это заметно меньше и обещанных самой AMD 16%, а также куда меньше разницы между 7950X и 5950X — тогда прирост получился куда более ощутимым. Вероятно, наш подбор ПО для оценки производительности сильно отличается от набора AMD.
Что касается Core i9-14900K, то с ним сравнивать не так просто — в среднем он по скорости находится между 7950X и 9950X, и новый флагман AMD чуть быстрее. Но в каких-то приложениях лучше топовый процессор Intel, а средняя разница между ними не превышает и 4%. Есть случаи, вроде Topaz Video Enhance AI, в которых поддержка набора инструкций AVX-512 дает новому Ryzen 9 подавляющее преимущество, а есть сжатие данных в WinRAR и 7-zip, где уже Core i9 явно быстрее — из-за лучшего контроллера DDR5.
Игровая производительность
Мы еще выпустим отдельное исследование по теме игровой производительности, сравнив процессоры очень разного уровня по их скорости и цене, а сегодня просто оценим производительность нового флагмана AMD с парой процессоров X3D из прошлой серии, а также лучшим представителем конкурента — Core i9-14900K. В большинстве современных игр (кроме стратегий — это важное замечание) нет особой разницы между 8-ядерником и 16-ядерником с одинаковой частотой, и 7800X3D нередко оказывается быстрее и 7950X и 7950X3D, так как восемь быстрых ядер до сих пор вполне достаточны для большинства игр, а наиболее важной характеристикой CPU для игр остается производительность на такт, которой помогает и большой объем кэш-памяти.
У рассматриваемой сегодня топовой модели Ryzen 9 9950X сразу 16 быстрых ядер с улучшенной архитектурой, поэтом он точно должен быть лучше своих предшественников без дополнительного 3D-кэша, а вот с ними вряд ли поборется. Впрочем, не во всех играх есть и преимущество от большого объема кэша, в некоторых играх он ничего особенного не дает, а иногда бескэшевые модели даже имеют небольшое преимущество — уже из-за более высокочастотных ядер.
Рассмотрим вкратце усредненные данные по новому тестовому набору из 11 игр разных жанров, подробности из которых приведем позднее в отдельном материале по игровому тестированию CPU. А пока просто приведем список: Anno 1800, Civilization VI, Cyberpunk 2077, F1 2022, Far Cry 6, Hitman 3, Shadow of the Tomb Raider, Watch Dogs: Legion, The Talos Principle 2, Guardians of the Galaxy, The Callisto Protocol. Все игры имеют встроенные бенчмарки, и среди них есть как сравнительно новые, так и игры прошлого — как раз в таких условиях CPU обычно и проявляются, ведь упор в возможности GPU в старых играх ниже.
Средний FPS | Мин. FPS | Сред., % | Мин., % | |
---|---|---|---|---|
Ryzen 9 9950X (16C/32T) | 307,9 | 202,0 | 100% | 100% |
Ryzen 9 7950X3D (16C/32T) | 335,7 | 217,1 | 109% | 107% |
Ryzen 9 7950X (16C/32T) | 296,7 | 193,5 | 96% | 96% |
Ryzen 7 7800X3D (8C/16T) | 317,0 | 204,6 | 103% | 101% |
Core i9-14900K (8P+16E/32T) | 323,2 | 213,8 | 105% | 106% |
В этой статье достаточно лишь пяти процессоров, потому что мы не видим смысла сравнивать топовый CPU с заметно менее мощными решениями, и мы взяли лишь мощнейшие процессоры обоих производителей. Даже в разрешении Full HD при средних графических настройках только самые медленные и/или старые процессоры показывают заметно меньшую производительность по сравнению с лучшими CPU. Даже Core i3-12100 показывает примерно 60% от производительности Ryzen 9 9950X в играх, и это довольно много, учитывая возможности довольно медленного четырехъядерного процессора, выпущенного много лет назад. Но даже он обеспечивает среднюю частоту кадров более 180 FPS в таких условиях.
Что касается конкретно нового Ryzen 9 9950X и разницы между ним и 7800X3D с 7950X3D, то модели прошлого поколения с дополнительным 3D V-Cache тут ожидаемо впереди, хотя прирост скорости от дополнительного L3-кэша в играх получился разный. Но даже еще важнее то, что в нашем наборе игр есть те проекты, которые вообще не получили преимущества от большего кэша: Anno 1800 и Civilization VI — стратегии, как можно заметить. Из-за них в среднем 7800X3D даже немного уступил 7950X3D, а 9950X был лишь на 4% быстрее предшественника — это не обещанные 16%, и даже не 10% как в Far Cry 6 по данным AMD (у нас получилось ровно столько же). К сожалению для AMD, по всему нашему набору игр, Core i9-14900K оказался быстрее и восьмиядерника с 3D-кэшем и нового флагмана — из-за игр, которым важно большое количество вычислительных ядер или малое, но очень быстрых, а процессор Intel в этом деле универсален почти как 7950X3D, который является быстрейшим.
Средний FPS | Мин. FPS | Сред., % | Мин., % | |
---|---|---|---|---|
Ryzen 9 9950X (16C/32T) | 158,4 | 115,1 | 100% | 100% |
Ryzen 9 7950X3D (16C/32T) | 160,8 | 117,5 | 101% | 102% |
Ryzen 9 7950X (16C/32T) | 155,9 | 113,3 | 98% | 98% |
Ryzen 7 7800X3D (8C/16T) | 154,7 | 111,9 | 98% | 97% |
Core i9-14900K (8P+16E/32T) | 159,5 | 119,5 | 101% | 104% |
Если говорить о разрешении 2560×1440 при максимальном качестве рендеринга, то от разницы между представленными в таблице процессорами почти ничего не осталось — это буквально единицы процентов. Новый 16-ядерный флагман Ryzen 9 9950X показал производительность на 2% лучше чем 7950X, примерно так же обошел 7800X3D (из-за пары стратегий в списке тестовых игр, а также из-за улучшенной одноядерной производительности), хотя 7950X3D он всё еще проигрывает, но разница ужалась до 1%-2%. Мы вообще считаем, что можно считать все представленные таблице процессоры условно равными по игровой производительности в таких условиях. Да, Core i9-14900K стал победителем, как ни странно, но мы давно отмечали небольшое преимущество процессоров Intel именно при большем разрешении и качественной графике.
В любом случае, игровая производительность Ryzen 9 9950X находится на уровне, близком к максимальному — это один из самых производительных CPU на рынке, хоть и не лучший. В Zen 5 у AMD получилось заметно поднять однопоточную и малопоточную производительность, что всегда сказывается в играх, поэтому новый флагман заметно ближе к 7950X3D, чем 7950X. И всё же рассматриваемому процессору не хватает дополнительного кэша, который сделал бы его быстрейшим игровым процессором. Но это не так важно, так как в реальности играм хватает и процессоров уровня Ryzen 5 и Core i5, особенно для разрешений 2560×1440 и выше при высоких и максимальных настройках — разницы между слабейшим и быстрейшим CPU на практике вы просто не увидите. К примеру, всё тот же Core i3-12100 в этих условиях отстал от Ryzen 9 9950X всего на 26% — 117,7 FPS против 158,4 FPS. Разница хоть и заметная, но оба варианта вполне имеют право на жизнь.
Что касается встроенного графического ядра, то оно осталось неизменным с Ryzen 7000, поэтому и измерять тут особо нечего. Даже сама AMD говорит, что встроенный GPU не годится для серьезных игр, а может просто выводить несложное 2D/3D и кодировать/декодировать видеоданные. Как офисное решение оно подходит, конечно, но не более того — это примерно уровень встроенного GPU в конкурирующий Core i9-14900K. Впрочем, мы в любом случае исследуем производительность интегрированной графики в играх, просто несколько позже.
Энергопотребление и температура
Оценка энергопотребления современных процессоров дело непростое и странное, так как сейчас сложно что-то уверенно утверждать лишь по показателям потребления процессоров, установленным производителями. Пиковое энергопотребление процессоров обычно определяется расчетной тепловой мощностью — TDP (ну или PL1), и раньше эти значения устанавливались в настройках BIOS по умолчанию, и действительно означали именно пиковое энергопотребление CPU. Более того — иногда это и сейчас так же, но не в случае топовых моделей, в которых реализованы многочисленные функции повышения частот с разными названиями. Они позволяют выходить за пределы номинального энергопотребления, чаще всего на какое-то время, но иногда и неограниченно. И то, насколько далеко может зайти процессор за установленное производителем значение, зависит сразу от нескольких факторов: ограничитель потребления в турборежиме (PL2), изменяемых пределов пиковой частоты, температурных характеристик и так далее. И эти турборежимы могут доходить до потребления энергии, превышающего номинальные значения TDP вдвое и даже более. При этом, у AMD и Intel еще и разные определения лимитов потребления, отличающаяся работа турборежимов и лимитов, да и управляют всем этим процессоры разных производителей несколько иначе.
Судя по результатам наших тестов по пиковому потреблению, Ryzen 9 9950X способен на максимальное потребление порядка 200 Вт — что выше значения TDP в 170 Вт, установленного для него, но ниже ограничения Power Package Tracking (PPT) для системных плат AM5 при использовании с процессорами семейства Ryzen 7000, которое для TDP в 170 Вт должно составлять 230 Вт. Но 7950X потреблял на 10 Вт больше в том же режиме в наших тестах, а иногда и до 230 Вт, а вот 9950X как будто уперт точно в 200 Вт. Меньшие энергопотребление и нагрев подтверждаются в условиях многопоточной нагрузки, когда Ryzen 9 9950X потребляет 200 Вт ровно, а Ryzen 9 7950X чуть больше — 210 Вт. При этом, новинка греется лишь до 81 °C, а вот предшественник легко достигает максимума в 95 °C и даже начинает слегка тротлить, но к этому мы еще вернемся.
В практических задачах с однопоточной загрузкой новый процессор Ryzen 9 9950X работает на частоте до 5,6-5,7 ГГц — в зависимости от задачи. При средней нагрузке на четыре-восемь ядер частота падает до 5,3-5,4 ГГц и ниже — до 5,0-5,1. Минимальная частота при многопоточной нагрузке может составлять и 4,6 ГГц — в случае крайне тяжелой синтетической многопоточной нагрузки, вроде бенчмарков с рендерингом и синтетических вычислительных тестов.
В простое | Игра | Максимум | |
---|---|---|---|
Ryzen 9 9950X | 9 | 124 | 200 |
Ryzen 9 7950X3D | 19 | 75 | 134 |
Ryzen 9 7950X | 14 | 123 | 210 |
Ryzen 9 5950X | 25 | 117 | 202 |
Core i9-14900K | 8 | 172 | 253 |
Рассмотрим данные энергопотребления отдельно процессоров в трех разных сценариях — простой, игра и режим максимального потребления, в котором для создания нагрузки использовались Cinebench и Y-Cruncher. А в игровом режиме запускалась игра Hitman 3 с тестовой сценой Dartmoor, которая нагружает как видеокарту, так и центральный процессор системы. Без вычислительной нагрузки Ryzen 9 9950X стал несколько экономичнее предшественника — всего 9 Вт против 14 Вт, хотя это может быть связано и с параметрами обновленной прошивки. Этот показатель новинки близок к уровню потребления Core i9-14900K в простое.
Результаты показывают, что при серьезной многопоточной нагрузке процессор Ryzen 9 9950X способен потреблять не более 200 Вт, что явно меньше PPT в 230 Вт. Интересно, что Ryzen 9 7950X предыдущего поколения потребляет чуть больше. О топовом процессоре Intel не говорим — Core i9-14900K в самом требовательном режиме потребляет уже более 250 Вт, что делает его не самым энергоэффективным с учетом близкой производительности в большинстве задач, но мы это уже и так давно знаем.
В игровом режиме потребление всех процессоров заметно ниже — даже такая ресурсоемкая для CPU игра, как Hitman 3, не может заставить их потреблять больше 120—170 Вт. В игровых условиях флагманы AMD двух поколений очень близки — потребляют 123 Вт и 124 Вт и нагреваются до 63 °C и 67 °C — значения для 7950X и 9950X соответственно. То есть, тут уже новый CPU не смог порадовать меньшей температурой и потреблением. Но при этом он обеспечивает несколько большую производительность, так что энергоэффективность Ryzen 9 9950X в целом явно чуть улучшилась, он потребляет меньше энергии в пределе, работая на близкой температуре. Конкурент же в виде Core i9-14900K и тут выделяется худшей энергоэффективностью, став самым потребляющим CPU и в игровых условиях. Ну а 7950X3D просто рвет всех — он и холодный, быстрый и энергоэффективный одновременно.
В простое | Игра | Максимум | |
---|---|---|---|
Ryzen 9 9950X | 41 | 67 | 81 |
Ryzen 9 7950X3D | 39 | 72 | 85 |
Ryzen 9 7950X | 38 | 63 | 95 |
Ryzen 9 5950X | 33 | 61 | 81 |
Core i9-14900K | 32 | 76 | 102 |
Так как новый 16-ядерник использует иные CCD-чиплеты, произведенные по более совершенной технологии, это также способствовало и снижению температур. Так что неудивительно, что Ryzen 9 9950X оказался значительно «холоднее» Ryzen 9 7950X, особенно при большой вычислительной нагрузке. Это связано и с тем, что уровень максимального энергопотребления для новинки установлен на 200 Вт, а не 230 Вт — Ryzen 9 9950X нагревается куда меньше своего предшественника и его нагрев не доходит до максимально допустимых 95 °C — вероятно, более суровое ограничение максимального потребления было сделано именно для этого.
В простое температуры всех процессоров относительно близки, хотя новый Ryzen 9 9950X нагревается чуть больше предшественника. В играх проблем не будет — все процессоры греются умеренно, а вот в режиме максимальной многопоточной нагрузки процессоры ведут себя сильно по-разному — многие из них сразу упираются в температурный предел: 95 °C для Ryzen 9 7950X и 100 °C для Intel Core i9. К счастью, для нового старшего Ryzen это не проблема — он не достигает не только 95 °C, но нагрелся даже меньше чем 7950X3D с его 85 °C. Конечно, для флагмана всё равно рекомендуется использовать систему жидкостного охлаждения, но он предъявляет к системе охлаждения явно меньшие требования. В случае же предыдущего флагмана линейки даже производительные кастомные водянки не справлялись с задачей держать температуру ниже максимально возможного значения.
Осталось поговорить о разгоне. Для процессоров серии Ryzen 9000 была представлена новая функция Curve Shaper — она является частью AMD CBS, ее можно настроить в настройках BIOS или при помощи утилиты Ryzen Master. Curve Shaper позволяет изменять базовые кривые напряжения для более точной настройки напряжения в зависимости от рабочих нагрузок и частот. Возможности подобных функций позволяют лучше раскрыть такие модели процессоров, как Ryzen 7 9700X, имеющий более жесткие ограничения по потреблению (65 Вт) по сравнению с предшественником 7700X (105 Вт). Включение Precision Boost Overdrive (PBO) дает в таких случаях больший прирост производительности, так как увеличивает слишком зажатый предел потребления энергии. AMD заявляет о росте производительности на 15% для 9700X, а вот в случае 9950X ловить особенно нечего. Впрочем, того же самого можно достичь, изменив TDP с 65 Вт до 105 Вт в последних версиях прошивок.
В целом же, разгон Ryzen 9 9950X довольно прост — из-за разблокированного множителя. Ручной разгон всех ядер позволяет запуск множества несложных рабочих нагрузок до частоты примерно 5,3 ГГц, но самые тяжелые приложения будут работать примерно до 5,2 ГГц для всех ядер, что неплохо. Разгон с использованием PBO и Curve Optimizer работает как и на старых моделях. Новая функция Curve Shaper позволяет динамически регулировать напряжение Curve Optimizer в зависимости от частоты и температуры. Температурный предел по умолчанию всё так же составляет 95 °C и не может быть повышен, но при включении ручного разгона составляет 115 °C, как и раньше.
Что касается работы с памятью, то официальная поддержка была увеличена до DDR5-5600, а также была добавлена поддержка разогнанной памяти стандарта DDR5-8000. В таком случае делитель тактовой частоты между FCLK и MCLK становится на 1:2 при превышении частоты памяти предела в DDR5-6000. Как и в случае с предыдущими процессорами, можно попробовать принудительно установить делитель 1:1 до частот порядка DDR5-6400 — тут изменений нет. А вот поддержка DDR5-8000 реализована при помощи обновления AGESA, и она будет и для старых чипсетов серии 600. Пока что не очень понятно, будет ли DDR5-8000 с делителем 1:2 быстрее DDR5-6000 с делителем 1:1 на практике, но в целом возможность интересная.
Выводы
Серия процессоров AMD Ryzen 9000 основана на новой микроархитектуре Zen 5, которая улучшила производительность на такт и обеспечивает лучшую энергоэффективность, при этом оставаясь совместимой со всеми ранее выпущенными системными платами с Socket AM5. Ключевые особенности новой архитектуры включают двухконвейерную выборку, сочетающуюся с улучшенным предсказателем ветвлений, а сниженные задержки кэша инструкций и оптимизация его пропускной способности обеспечивают требуемый поток данных и более высокую скорость их обработки. В Zen 5 были улучшены и расширены возможности целочисленного выполнения, новое ядро отличается более продвинутой диспетчеризацией, повышенной пропускной способностью подсистемы кэширования, также были улучшены блоки предварительной выборки данных. На более высоком уровне между Zen 4 и Zen 5 особых изменений нет. Хотя кристалл ввода-вывода IOD в новых процессорах остался таким же, новые настольные процессоры с кодовым наименованием «Granite Ridge» базируются на новых кристаллах CCD — они имеют по восемь ядер и 32 МБ L3-кэша, но их вычислительные ядра стали сложнее, а изготовлены кристаллы по более совершенному техпроцессу 4 нм.
Главное, что улучшилось в Zen 5 — появился полный 512-битный конвейер для инструкций AVX-512. Хотя Zen 4 также поддерживает исполнение инструкций AVX-512, он использует двойной 256-битный путь данных, а Zen 5 имеет полный 512-битный конвейер для этих инструкций, что является давно ожидаемым архитектурным улучшением и удваивает теоретическую производительность в задачах, использующих соответствующие инструкции. В общем, изменения архитектуры Zen 5 достаточно хорошо подготовлены и обоснованы — AMD устранила такие ограничивающие факторы Zen 4, как файл регистров для FP-операций и емкость очереди сохранения. Хотя устранения одних ограничений всегда выявляют какие-то другие — для Zen 5 может являться ограничителем уже целочисленный регистровый файл. Вероятно, значительная часть прироста производительности Zen 5 пока что обусловлена сочетанием меньших задержек кэша и большей емкостью переупорядочивания, а не большей шириной ядра, которая может пригодиться в будущем.
AMD заслуживает похвалы за то, что они постоянно улучшают архитектуры: с момента выхода Golden Cove в 2021 году компания AMD выпустила Zen 4 и Zen 5, которые принесли существенные изменения. А вот ядра Raptor Cove конкурирующей Intel используют в основе именно Golden Cove при более высоких частотах с бо́льшим объемом кэша (есть лишь несколько незначительных улучшений, вроде агрессивной предвыборки, большей очереди микроопераций и удвоенной емкости L1-кэша инструкций), но основная структура не изменилась, и все изменения за эти годы нельзя назвать существенными по сравнению с тем, что сделала AMD. Поэтому даже там, где ранее первенствовала Intel, вроде AVX-512, улучшения Zen 5 могут серьезно сыграть в пользу последней. Инженеры AMD не остановились на создании просто более мощного FP-блока, они спроектировали две версии: для мобильных устройств и для настольных ПК — с оптимизацией по производительности и плотности. Так что AMD с инженерной точки зрения в последние несколько лет явно работает эффективнее Intel.
Есть в Zen 5 и компромиссы: целочисленный регистровый файл не стал достаточно большим, а увеличения тактовой частоты по сравнению с предыдущими поколениями и вовсе не произошло. Может быть, большинство улучшений по расширению ядра Zen 5 были преждевременными, ведь большая часть потенциала в производительности, предлагаемая более широким конвейером Zen 5, просто теряется из-за задержек и пропускной способности к внутренней памяти и при передаче по внешнему интерфейсу. Плохо, что не произошло улучшений по работе с памятью DDR5, ведь в сочетании с заметно более быстрой памятью Ryzen 9 9950X мог бы заметно превзойти Ryzen 9 7950X3D в нагруженных приложениях, особенно широко использующих AVX-512. Так что ждем развития успеха Zen 5, основа там заложена неплохая. Тот же дополнительный кэш может заметно изменить ситуацию, особенно если потеря тактовой частоты для ядер с таким кэшем не станет значительной. Если Zen 5 в варианте X3D сможет поддерживать высокие тактовые частоты, то прирост от дополнительного кэша будет даже больше, чем получилось у Zen 4.
К сожалению, сам по себе процессор Ryzen 9 9950X получился не совсем таким, каким его ждали многие, основывая свои ожидания на официальных заявлениях и оценках производительности самой AMD. Тактовые частоты нового CPU не выросли, новая топовая модель работает на максимальной частоте 5,7 ГГц, что соответствует параметрам Ryzen 9 7950X, а базовая частота даже немного ниже — 4,3 ГГц против 4,5 ГГц. Но компания уверяла, что Zen 5 — это большой шаг вперед со значительным повышением как однопоточной производительности, так и многопоточной. Оценка прироста вычислительной скорости в приложениях по сравнению с Ryzen 9 7950X менялась от 15% до 20% и даже более. Увы, реальность оказалась приземленнее: в многопоточных нагрузках новый флагман обеспечил повышение скорости в среднем на 7%-8% (в отдельных случаях — от 5% до 20%, и лишь очень редко выше), а прирост средней частоты кадров в играх и того меньше — в среднем всего 4% по нашим тестам.
И это при том, что производительность на такт из-за архитектурных улучшений порой действительно впечатляла — например, в некоторых криптографических тестах, в части научных задач, при обработке видеоданных — в основном с использованием оптимизированного под AVX-512 кода, который действительно серьезно ускорился. Предполагаемые причины небольшой разницы в остальных случаях мы объяснили еще в начале материала: при всех архитектурных улучшениях тактовые частоты ядер немного снизились, задержки межъядерного взаимодействия выросли более чем вдвое (но это вроде бы решили в последних версиях BIOS — мы еще не проверили), а максимальная скорость памяти осталась на уровне Ryzen 7000.
Так что топовая модель серии Ryzen 9000, как флагман архитектуры Zen 5, показала не столь ощутимый прирост в скорости по сравнению с тем, что получалось у AMD ранее. Переход к Ryzen 9000 видится скорее архитектурным обновлением, к которым приучила нас компания Intel в прошлых поколениях. Частично это объясняется и отсутствием прогресса в плане скорости оперативной памяти, ведь DDR5-6000 остается идеальным вариантом и для Ryzen 9000, в то время как на рынке существует память этого типа с куда большей частотой, но процессоры AMD не способны использовать все ее возможности из-за собственного строения и соединения между кристаллами. А низкая пропускная способность памяти точно ограничивает многие задачи с параллельной обработкой данных, использующие значительно возросшие возможности исполнения AVX512-кода.
В любом случае, в среднем по всем тестам Ryzen 9 9950X является самым быстрым настольным процессором. Разница бывает даже более существенной в наиболее требовательных приложениях, вроде рендеринга и научных вычислений. А по однопоточной производительности новая архитектура Zen 5 и вовсе весьма хороша, в некоторых задачах 9950X как минимум приблизился к 14900K, а то и побил его рекорды — так что прирост IPC действительно приличный. AMD реализовала полный 512-битный путь данных для AVX512-инструкций, это помогает достичь высокой производительности в приложениях, оптимизированных для их использования. Но обнаружились и несколько случаев со снижением производительности по сравнению с тем же 7950X. Если говорить о конкуренции с Intel, то Core i9-14900K также лишь на несколько процентов медленнее, зато имеет более низкую цену. Но у него есть свои проблемы, в частности заметно большее энергопотребление и потенциальные проблемы со стабильностью (вроде бы решенные при помощи обновления прошивок, но кто знает). Новому флагману нет равных в самых ресурсоемких задачах по созданию контента, и для самого мощного рабочего ПК он подходит идеально, превосходя и Ryzen 9 7950X/7950X3D, и Core i9-14900K. В среднем последний ему уступает лишь около 4%-5%, но именно в самых сложных применениях разница доходит до 10%-15%. Не говоря уже о возросшей энергоэффективности нового процессора: Ryzen 9 9950X потребляет всего лишь до 200 Вт по сравнению с 210-230 Вт у предшественника и 250-265 Вт у конкурента (и это еще при ограничениях самой Intel), что делает новинку самым энергоэффективным вариантом среди флагманов.
А вот для игрового применения Ryzen 9 9950X просто не имеет смысла, для этого лучше подойдут куда менее дорогие процессоры, вроде Ryzen 9 7950X3D или даже Ryzen 7 7800X3D. AMD сразу сказала, что процессоры Zen 5 не смогут превзойти игровую производительность X3D-серии, и наши игровые тесты это подтверждают. Впрочем, AMD заметно повысила игровую производительность по сравнению с Zen 4: 9950X превосходит процессоры без 3D-кэша, хотя в среднем разница не так уж велика даже в Full HD-разрешении при средней графике, не говоря о большей 3D-нагрузке. X3D-процессоры превосходят новинку по частоте кадров в играх до 5%-10%, Core i9-14900K быстрее новинки на 5%-6%, и даже Core i7-14700K очень близок к новому флагману по игровой производительности. Всё это в разрешении Full HD при средних настройках качества — условия, при которых мало кто играет. Если взять более высокое разрешение и максимальные настройки графики, то и вовсе можно довольствоваться Ryzen 7 7700X или Core i5-13600K, ведь потерю лишь 4%-7% частоты кадров вы компенсируете куда меньшей их ценой, а сэкономленные деньги лучше потратить на более производительную видеокарту, которая окажет куда большее влияние на комфорт в играх. И если Ryzen 9 9950X оказался очень хорошим вариантом для рабочих ПК, то игрокам он просто не нужен — лучше подождать выхода Ryzen 7 9800X3D.
Новый Ryzen 9 9950X потребляет меньше энергии при той же производительности по сравнению с предшественником, но разница не так уж велика. Потребление в играх или снизилось, или осталось на том же уровне при росте частоты кадров, так что новый CPU чуть энергоэффективнее и в них. С X3D-процессорами не сравнить, конечно, а вот с 14900K — запросто: энергопотребление 9950X примерно на 50 Вт ниже и в играх, и в приложениях. Это немало, но решающим фактором для покупки вряд ли является, куда важнее то, что процессор AMD стоит дороже, и чтобы отбить разницу в цене, ему придется отработать несколько лет. Некоторое снижение потребления не привело к пересмотру требований к охлаждению — всё так же крайне желательна система жидкостного охлаждения, хотя самые лучшие воздушные кулеры все-таки должны справляться с новым флагманом. Максимальная температура нагрева 9950X заметно ниже, чем у 7950X — у нас получилось 81 °C и 95 °C соответственно, но при разгоне жидкостное охлаждение остается обязательным.
Что касается остальных возможностей процессора и платформы, то интегрированное графическое ядро Ryzen 9 9950X не изменилось по сравнению с предыдущей серией, так как AMD решила использовать тот же кристалл ввода-вывода. Производительности встроенного GPU для неигровых задач вполне достаточно — офисные приложения и воспроизведение роликов работают отлично, а многим большего и не нужно. В играх производительность идентична производительности графики в Ryzen 7000, и эти решения не предназначены для серьезных игр, но они быстрее того, что предлагает Intel, и лучше совместимы с играми. AMD анонсировала новую серию чипсетов 800, и системные платы уже вышли, но по сути, единственным их нововведением стала поддержка USB 4 и Wi-Fi 7, которая реализована при помощи сторонних контроллеров и не является особенностью именно новых чипсетов. А остальные новые возможности, включая разгон и оптимизированную поддержку памяти DDR5, появятся и в существующих AM5-платах при помощи обновления BIOS. Это можно считать отличной новостью — AMD продолжает поддерживать Socket AM5 аж до 2027 года.
Настольная серия Ryzen 9000 полностью совместима с известной платформой Socket AM5, эти процессоры можно устанавливать в старые системные платы, так что они кажутся лишь небольшим обновлением процессоров Ryzen 7000, а не полностью новыми продуктами. Почему компания выбрала такой подход? Возможно, дело в том, что в настольных системах рыночная ситуация и так хороша для AMD. Их конкурент Intel многие годы уступает из-за очень высокого энергопотребления своих процессоров, которое вызвано технологическим отставанием — они до сих пор используют техпроцесс 10 нм, пусть и многократно улучшенный. А вот в ноутбуках у AMD дела далеко не столь хороши, так что неудивительно, что в этот раз они решили уделить больше внимания именно этому сегменту. А в настольных CPU можно лишь чуть-чуть ускорить решения прошлого поколения, ограничившись небольшими изменениями.
Рекомендованная цена Ryzen 9 9950X на старте была установлена на уровне $650, и он сейчас является самым дорогим процессором для настольных ПК. Пусть он еще и самый быстрый в приложениях при этом, но цена кажется завышенной и не совсем оправданной, так как отличия по сравнению с уже более дешевыми Ryzen 9 7950X(X3D) невелики. Да и Intel Core i9-14900K также является сильным конкурентом, будучи на $100 дешевле. Так что пусть Ryzen 9 9950X и очень хороший (и даже самый быстрый) процессор, который обеспечивает лучшую производительность в приложениях и отличную для игр, но по соотношению цены и производительности он уступает предыдущему поколению и конкуренту. И на данный момент ситуация обстоит так: если вам нужны и игры и требовательные приложения в меньшей степени, то тут идеально подойдут 7950X3D и 14900K (или даже 14700K), если одни приложения, то 7950X или 14900K, ну а если только игры, то нужно брать 7800X3D, который обойдется дешевле.
Можно еще подождать Ryzen 7 9800X3D ближе к концу года — он не превзойдет флагмана по производительности в приложениях, но игровая производительность точно должна улучшиться. Кроме этого, ждем и процессоров Intel Arrow Lake, которые будут иметь до восьми производительных ядер и 16 эффективных — для всех ожидается заметное улучшение производительности на такт, но зато новые процессоры лишатся поддержки Hyper-Threading и заметно потеряют в количестве одновременно исполняемых потоков. Будет очень интересно, насколько хорошо 24 ядра без поддержки одновременной многопоточности будут выглядеть на фоне 16 ядер и 32 потоков нового Ryzen 9 9950X, а также большего количества ядер Core i9 14900K — мы узнаем это до конца года.
В целом же, несмотря на все архитектурные нововведения, выход настольных процессоров на основе архитектуре Zen 5 кажется не самым удачным, а показатели флагмана — спорными. Главная беда тут в том, что новое поколение процессоров AMD предлагает меньшие улучшения прямо сейчас, чем ожидали от них пользователи на основе предварительных данных. Но сама архитектура вычислительных ядер действительно улучшилась, из-за всех изменений заметно выросла и производительность на такт — по показателю IPC ядра Zen 5 совершенно точно стали лучшими среди всех x86-совместимых CPU. Но одной улучшенной архитектуры ядер мало, у нового процессора есть явные проблемы и ограничители. Главный минус флагмана семейства Ryzen 9000, а вместе с ним и остальных моделей, в том, что они не отличаются от предшественников больше ничем — частоты не выросли, а даже снизились, количество ядер в процессорах и объем L2- и L3-кэшей остался неизменным. Кристалл IOD используется старый, контроллер памяти остался тот же, а именно в нем заключается главный недостаток Zen 4 (а теперь и Zen 5), не позволяющий повысить производительность из-за упора в пропускную способность памяти. Это и привело к не самым высоким приростам, расстроившим потенциальных покупателей. Возможно, что Ryzen 9000 с дополнительным 3D-кэшем покажут даже больший прирост производительности по сравнению с Ryzen 7000X3D из-за того, что Zen 5 упирается в возможности памяти еще больше предшественника — очень ждем таких процессоров.