Тестирование топовых HEDT-процессоров AMD Ryzen Threadripper 3960X и 3970X в сравнении с предшественниками и массовыми процессорами Ryzen

Тестируем AMD Ryzen 9 3950X: горячие во всех смыслах 16 ядер, полностью меняющие представление о десктопных процессорах

Тестируя в прошлом году (еще по старой версии методики) топовые процессоры для AMD AM4 и Intel LGA2066, мы пришли к парадоксальному на первый взгляд выводу: даже HEDT-решения Intel в лучшем случае обеспечивают паритет по производительности с Ryzen 9. Да и то — чаще с «младшим» Ryzen 9 3900X, а не 3950X. Понятно, что напрямую сравнивать HEDT-платформу с массовыми не совсем корректно: последние ограничены по поддерживаемым объемам памяти и подключению периферии. Однако ситуации, когда их возможностей достаточно — но требуется просто очень быстрый процессор, очень много. Если говорить о массовых компьютерах (что логично для массовой же платформы), то это чаще выполняется, чем наоборот. А тут после выхода Ryzen семейства 3000 лидерство AMD стало безоговорочным. Для конкуренции с LGA1151 хватало и Ryzen 7 — причем и выход LGA1200 радикально положение дел не сменил. Процессоры для LGA2066 пришлось радикально удешевить — в два-три раза. Но и это позволяет обеспечивать лишь условную конкурентоспособность — с кучей оговорок.

Попутно компания обновила и свою HEDT-платформу, которой в итоге конкурировать... просто не с кем. В отличие от АМ4, обеспечить здесь совместимость старых и новых решений не получилось — но и не требовалось. «Старые» решения для TR4 оказались «похоронены» все теми же Ryzen 9. От новой платформы TRX40 массовость не требуется — это нишевое решение, нацеленное на случаи, когда «мало», что АМ4 во всех проявлениях, что LGA2066. Соответственно, речь идет о самых дорогих и самых мощных процессорах, а также очень дорогих системных платах. Объективно дорогих — несколько десятков линий PCIe 4.0, не считая кучи прочих высокоскоростных интерфейсов «дешево» реализовать невозможно даже на этапе разводки текстолита. Соответствующим должно быть и прочее окружение — если для TR4 была выпущена хотя бы одна плата microATX, то в отношении TRX40 нет даже таких планов. Хотя технически задача не стала более сложной (более простой, впрочем, тоже), но теперь она лишена смысла: уровень функциональности и производительности (относительно) компактного компьютера с легкостью обеспечивается и АМ4, а более-менее полное использование возможностей TRX40 вне «гроба» все равно невозможно.

В общем, такое своеобразное решение, в возможность которого еще пару-тройку лет назад еще невозможно было даже поверить. Собственно, три года назад у AMD и «своей» HEDT-платформы не было — никакой, а не только лишь элитно-эксклюзивной. А чтоб понять, как мы дошли до жизни такой, стоит как раз и вернуться на три-четыре года назад. Или, даже, дальше. Кто за положением дел на рынке все эти годы следил внимательно, в следующих трех разделах ничего нового не найдет, так что может их просто пропустить.

Десктоп, «хай-енд» десктоп и все-все-все: разделяй и властвуй

Понятие «High-End Desktop» (HEDT) возникло ровно 10 лет назад. Ранее оно не требовалось, поскольку «high-end» получался и из обычной «десктопной» платформы, благо таковые одно время даже не слишком отличались от серверных. Положение изменилось в нулевые — когда производители научились «упаковывать» несколько процессорных ядер и прочие компоненты в один кристалл. Понятно, что для разных сегментов рынка нужна и разная обвязка — особенно если сравнивать, к примеру, портативные компьютеры (к тому моменту уже доминирующие на рынке ПК) и многопроцессорную систему. Первые обходились двумя-четырьмя ядрами, но в обязательном порядке снабжались GPU (благо использовать его можно и вместе с дискретным решением) и небольшим количеством интерфейсных линий для связи с периферией — таковой все равно было немного. И оперативной памяти — тоже, так что двухканального контроллера как хватало, так и хватает до сих пор. В серверном же сегменте «хватать» перестало очень давно, так что количество каналов пришлось увеличивать. Во-вторых, не нужна графика в каждом процессоре (благо их может быть и несколько) — зато нужно много ядер. Причем любое количество является недостаточным для части заказчиков — почему никуда и не делись многопроцессорные системы. Тоже, правда, сегментировались — система с двумя сокетами всегда проще, дешевле и компактнее, чем с большим их количеством. И сами процессоры проще — меньшую часть кристалла занимают линки для связи нескольких CPU в системе. Да и ядер в «младших» решениях может быть меньше, что тоже снижает цену. «Старшие» же должны снабжаться ими по максимуму — иначе бы и необходимости в объединении сил четырех-восьми процессоров не возникало. А это и требования к системе памяти увеличивает — ее нужно много и максимально-быстрой.

В итоге процессоры начали отдаляться друг от друга все дальше и дальше, но всех их требовалось много. Именно поэтому в Intel полностью разделили линейки физически — используя разные кристаллы. Настольные/мобильные процессоры как получили свои два или четыре ядра в 2006 году — так столько в них и оставалось до 2017. В серверных же моделях процессоров максимальное количество выросло с тех же четырех до 24. В процессе выяснилось, что кольцевая шина (которая как раз появилась именно в серверных восьмиядерных Nehalem-EX) нормально справляется с десятком ядер — но плохо масштабируется на большее их количество. Поэтому в старших моделях процессоров пришлось использовать две таких шины и коммутаторы, что куда сложнее и дороже одной. Вот и еще одна причина разделить линейки. Количество каналов памяти долгое время держалось на четырех, хотя уже очевидно было, что и с этим тоже что-то придется делать: не хватало на выросшее количество ядер. Одно дело, когда канал памяти «приходится» на одно-два ядра в массовых системах — и совсем другое, когда на каждом канале «висит» (и конкурирует за него) пять-шесть ядер.

Выделение HEDT стало недорогой альтернативой усложнению настольных процессоров. Действительно — массовые модели простые и дешевые, но достаточные для большинства пользователей. Кому мало ядер, памяти или линий PCIe — тем можно предложить младшие серверные модели. По сниженной, разумеется, цене — но чтоб при этом не конкурировали с «полноценными» на тех же кристаллах, можно отключить им поддержку многопроцессорных конфигураций, ЕСС, часть линий PCIe в самых дешевых моделях «порезать» и т. п. А топовый серверный сегмент тоже с легкостью разбивался на несколько линеек теми же методами: например, модели, рассчитанные на двухсокетные системы можно было продавать дешевле, чем пригодные для четырех- или восьми сокетов. Причем естественным путем: 2S/4S можно реализовать при наличии в процессоре двух линков QPI, а вот для восьми требуется третий. Но первых рынку требуется больше — значит для них выгодно иметь отдельный кристалл, а не «резать» старшие (по определению более дорогие). Хотя иногда приходилось делать и последнее — например, в части задач требуются огромные объемы памяти, но не слишком большое количество ядер. Разрабатывать и выпускать специальные кристаллы с большим количеством линков, но малым — ядер, дороже, чем «порезать» старшую модель по ядрам и продать немного дешевле.

В общем и целом, запомнить стоит буквально пару моментов. Во-первых, сегментация рынка — неизбежное следствие увеличения степени интеграции компонентов. Во времена Pentium 4 и Athlon все было просто: это одноядерные процессоры, к тому же, требующие для работы большого количества дополнительных микросхем. Следовательно, сами процессоры для разных сегментов рынка могут быть вообще одинаковыми — а все различия начинаются на уровне плат и чипсетов. Но как только последние «переехали» вовнутрь, да еще и количество ядер в старших и младших кристаллах начало отличаться на порядок — ситуация сильно осложнилась. А количество разных кристаллов — компромисс стоимости разработки (больше версий — дороже), производства (сложные кристаллы — дороже по себестоимости), логистики и планирования (нужно ж понимать — сколько и каких кристаллов потребуется через пару кварталов и давать соответствующие задания фабрикам). В принципе, в условиях отсутствия конкуренции за несколько лет в Intel систему отточили до блеска. Балансируя между разработкой своего кристалла под каждую задачу и чрезмерной сложностью выпускаемой продукции. Подходят массовому рынку «простые» процессоры с четырьмя ядрами, GPU, двухканальным контроллером памяти и 20-ю линиями PCIe? Значит, такие и должны выпускаться массово. На деле, даже отдельные двухъядерные кристаллы «выращивались» — их тоже требовалось много, так что снижение себестоимости на миллионных партиях не то, чем стоит пренебрегать. Нужно некоторым покупателям нечто большее, чем «типовой ПК»? Такой процессор тоже можно сделать — из младшего серверного. Кроме младших же, при этом требуются и «средние», и «старшие». Но уже в меньших количествах. Но себестоимость всех уже такова, что тоже обходиться одним кристаллом накладно — значит, нужно несколько.

AMD Epyc и Ryzen Threadripper: фланговый маневр

Могла ли AMD скопировать подход Intel? В принципе, могла. Правда вряд ли из этого вышло бы что-то хорошее. Во-первых, ко второй половине прошлого десятилетия компания окончательно превратилась в «бесфабричную», т. е. тесных связей между разработкой и производством уже не было, что мешало «подгонять» одно под другое. Во-вторых, копируя решения в лучшем случае можно лишь догнать оригинал (да и то — на практике все равно небольшое отставание бы сохранялось), но не стать лидером. Поэтому решение было асимметричным.

Как мы уже не раз писали, все силы компании были брошены на создание четырехъядерного «базового элемента» (CCX) и универсального масштабируемого интерфейса Infinity Fabric. Последняя не только была способна объединять CCX с GPU внутри кристалла (в первых мобильных и настольных APU) или два CCX для создания однокристального восьмиядерного процессора (что использовалось в первых настольных Ryzen), но и пригодна для связки нескольких таких восьмиядерных кристаллов на одной подложке процессора и для объединения двух таких «суперблоков» на одной плате. Обратим внимание — речь в любом случае шла лишь о восьми кристаллах в системе: просто в двух, а не в восьми сокетах. Лидерство формально осталось за Intel — технологии последней допускали создание системы со 192 процессорными ядрами и 32 каналами памяти (восемь старших Xeon E7), а у AMD речь шла лишь о 64 ядрах и 16 каналах. Однако подобные «монстрики» — слишком узкая ниша. Равно как и вообще многосокетные системы — что учитывают даже производители ПО, зачастую привязывая стоимость лицензий как раз к количеству сокетов, а не другим параметрам сервера. Поэтому актуальны одно- и двухпроцессорные системы — они относительно недороги, так что пользуются массовым спросом. Вот «недорого» Intel как раз мог предложить лишь 44 ядра и 8 каналов — против упомянутых 64 на 16. А еще более компактный односокетный вариант все равно давал 32 ядра и 8 каналов памяти.

На первый взгляд — все очень красиво. Если приглядеться — есть нюансы. В частности, такое «односокетное» решение, по сути, все равно эквивалентно четырехпроцессорной системе: например, потому что получаем мы не восьмиканальный контроллер памяти (как это рекламировалось), а четыре двухканальных. Доступ к «чужим» модулям памяти возможен — но не прямой, а через соответствующий процессор. В общем, Non-Uniform Memory Architecture (NUMA) в полный рост — даже при одном сокете, чего в платформах Intel до прошлого года не было (пока не появились 56-ядерные «склейки» Xeon Scalable с 12 каналами памяти). Прикладное ПО для серверов обычно под такие особенности адаптировано — именно потому, что там многопроцессорность «завелась» еще раньше многоядерности на одном кристалле, так что так себя вели и первые системы на Opteron. Массовые же программы особенностей NUMA как правило не учитывают.

С другой стороны, массовое ПО не слишком-то активно масштабировалось и по количеству ядер. Следовательно, «его» пользователям слишком много таковых и по сей день не слишком нужно. А кому нужно — те наверняка используют и соответствующие программы. Поэтому компания использовала тот же подход и в своей HEDT-платформе. Первой — термин родился в те годы, когда AMD в конкуренции на рынке высокой производительности не участвовало.

Ничего сложного со созданием Ryzen Threadripper на базе Epyc не было. Для унификации производства компания сохранила тот же разъем и то же исполнение процессоров: просто под крышкой устанавливались не четыре, а два кристалла. А «ненужные» контакты просто не разводились. С точки зрения логики это просто пара «четырехсокетных» процессоров в «двухсокетной» плате и не более. Но со всеми «прелестями» NUMA.

Которые, как и ожидалось, оказались не так уж и страшны. Для конкуренции с Threadripper Intel пришлось наступить на горло собственной песни — и выпустить HEDT Core i9 для LGA2066 не только на младшем (десятиядерном) кристалле, но и на среднем. И это всего лишь дало паритет по количеству ядер, но не по цене — 12/16-ядерные Ryzen Threadripper AMD спокойно могла продавать дешевле 1000 долларов и оставаться не в накладе, а у Intel в этот сегмент помещались как раз только младшие модели с числом ядер до 10. Производительность же сильно зависела от задач. Но многие программы отлично работали на всем — ускоряясь пропорционально количеству ядер (в первую очередь — всякое расчетное ПО, изначально «приученное» и к многосокетным системам). А рассчитанные на массовые процессоры временами отчаянно «тормозили» и на LGA2066 — поскольку архитектурно Skylake-X значительно отличался от настольного Skylake. В итоге конкуренция на массовом рынке так и осталась уделом «обычных» Ryzen и Core — и шла с переменным успехом до прошлого года. В HEDT же где-то привлекательнее смотрелись Ryzen Threadripper, где-то — Core. Но однозначного преимущества у вторых не было. А с учетом цен — не было и вовсе никакого.

Единственным сомнительным шагом было решение компании закрепить успех в 2018 году — и выпустить Ryzen Threadripper линейки WX. На первый взгляд все было просто и логично — раз уж в Intel решили освоить все ценовые позиции до $2000, пора сделать тоже самое. Но, поскольку, ничего нового к рефрешу Ryzen в AMD не заготовили, решать задачу пришлось в лоб: выпустив процессоры с четырьмя кристаллами (т. е. 24 и 32 ядра), но рассчитанные на старую «двухкристальную» периферию. В итоге два «процессора» в сборке просто... повисли в воздухе: не имея даже собственной памяти. К такому абсолютное большинство программ персонального назначения оказалось совсем не готово, так что топовый Ryzen Threadripper 2990WX лишь иногда обгонял «скромного трудягу» 2950X, но чаще от него отставал. При существенно более высоком энергопотреблении и цене. Т. е. у компании получилось такое вдвойне нишевое решение, которое имело смысл приобретать только под конкретные приложения — и точно зная зачем.

Но в целом обновление Threadripper вполне укладывалось в лозунг AMD того времени: Because we can! Компания действительно смогла продавать свои ядра дешевле, чем Intel — чем и пользовалась. Чего немного не хватало — «качества» самих ядер и их взаимодействия. Впрочем, это было общей проблемой Ryzen первых поколений — унаследованной и «сборками» из них. Общим стало и прошлогоднее решение проблемы.

Чиплеты и новые ядра

Первые процессоры на базе микроархитектуры Zen2 появились год назад, так что к данному моменту обсосаны уже со всех сторон. Поэтому на этих изменениях мы остановимся лишь кратко — свежа еще память.

Что касается ядер, то в первом приближении можно утверждать, что Zen2 уже ничем не уступает Skylake — в то время, как Zen/Zen+ больше были похожи на Haswell. Можно, конечно, возразить, что для этого AMD пришлось перейти на нормы 7 нм (при всей условности этих цифр), в то время, как Skylake это микроархитектура 2015 года и 14 нм техпроцесс. Но, вообще-то, ничего более нового массово у Intel до сих пор тоже нет — так что сами и виноваты.

А компоновка бывает разной. Вопреки иногда слышимым утверждениям, чиплеты вовсе не являются чем-то неотъемлемым от Zen2 — достаточно посмотреть на новые APU, сохранившие монолитный дизайн. Но там, где нужно много ядер, компания решилась на достаточно рискованный шаг — впервые с момента появления первых Athlon 64 вынеся контроллер памяти в отдельный кристалл. Туда же отправились и контроллеры PCIe и прочей периферии. Что это дало? Для моделей с числом ядер до восьми — по сути, ничего. Во всяком случае, ничего полезного с точки зрения производительности — просто не обязательно делать весь кристалл по тонким нормам. Однако 12 нм чиплет IOD для АМ4 поддерживает подключение не одного, а двух восьмиядерных CCD — что и дает возможность выпускать Ryzen 9 с двенадцатью и шестнадцатью ядрами. При этом, в отличие от старых Ryzen Threadripper, контроллеры памяти и периферии у них общие, а не раздельные. В общем, никакой NUMA — все просто и прозрачно для программного обеспечения.

Но выделение CCD (т. е. ядер и кэш-памяти) в отдельные кристаллы позволяет собирать не только процессоры для АМ4. Там-то компанию сдерживала совместимость со старыми решениями и ограниченные механические размеры — чего нет в Epyc и Threadripper. Просто берем другой IOD: с четырьмя каналами памяти, а не двумя, 64 линиями PCIe вместо 24 — и цепляем к нему четыре CCD. Получается 24/32-ядерный процессор — как WX-серия второго поколения, но без NUMA. А старшие IOD спокойно тянут и восемь CCD, что дает возможность объединить в одном сокете и 64 процессорных ядра: причем тоже с «нормальным» унифицированным доступом к памяти. В итоге такой процессор компания предлагает и в качестве настольного. Правда стоит Ryzen Threadripper 3990X почти четыре тысячи долларов, что делает его очень уж специфичным решением. Вот подобные по организации Epyc свое место в жизни точно найдут.

Впрочем (настало время для ложки дегтя) и «младшие» Ryzen Threadripper 3960X и 3970X к дешевым не относятся: их рекомендованные цены составляют $1399 и $1999. Но это объяснимо — в сегменте до 1000 долларов нормально «справляются» и Ryzen 9. Новый Threadripper — для тех, кому нужно самое-самое, и кто за ценой не постоит. Конкурировать ему не с кем — решения Intel для LGA2066 медленнее, да и не слишком-то дешевле, а Xeon W для LGA3647 — дороже (за исключением разве что W-3225 и W-3235, но это всего-то 8 или 12 ядер) и все равно не быстрее. Кроме того, платформа TRX40 выделяется количеством поддерживаемых линий PCIe 4.0 — учитывая, что пока еще большинство систем поддержки этого интерфейса лишены вовсе, особенность эксклюзивная. Насколько нужная всем и каждому — отдельный вопрос. Но познакомиться с ней подробно — не помешает. Тем более, что и более старые решения этой линейки мы по новой методике не тестировали, а это надо будет сделать и сохранить на будущее.

Участники тестирования

  AMD Ryzen Threadripper 3960X AMD Ryzen Threadripper 3970X
Название ядра Castle Peak Castle Peak
Технология производства 7/12 нм 7/12 нм
Частота ядра, ГГц 3,8/4,5 3,7/4,5
Количество ядер/потоков 24/48 32/64
Кэш L1 (сумм.), I/D, КБ 786/786 1024/1024
Кэш L2, КБ 24×512 32×512
Кэш L3, МиБ 128 128
Оперативная память 4×DDR4-3200 4×DDR4-3200
TDP, Вт 280 280
Количество линий PCIe 4.0 56 56

Главными героями сегодня будут Ryzen Threadripper 3960X и 3970X. В принципе, про них все сказано выше — это все те же Ryzen 3000, но отмасштабированные вверх. Не простым удвоением количества блоков — чип IOD остался в единственном числе (соответственно, контроллеры памяти и периферии для всех процессорных ядер общие), но удвоился «качественно». Откуда и, например, 56 доступных линий PCIe 4.0 — еще восемь уходит на связь с чипсетом, который стал более «навороченным», чем, даже X570, откуда и необходимость в расширении связки. В общей сложности платы для данной платформы имеют 72 линии PCIe 4.0, часть которых уходит на обычные «большие» слоты (например, можно установить три независимых друг от друга PCIe x16), часть — на разъемы M.2 (как минимум пару высокоскоростных SSD можно подключить прямо к процессору) — и еще остается на периферийные контроллеры, типа 10 Гбит/с Ethernet и т. п. «Бытовуха» в виде 12 портов USB3 Gen2 или 4 SATA также гарантировано обеспечивается связкой из процессора и чипсета. Поэтому, повторимся, даже в плане функциональности платформа аналогов на рынке не имеет. С этой точки зрения Intel LGA2066, например, является морально устаревшей — поскольку максимально обеспечивает лишь 72 линии PCIe и только 3.0. Но это в теории — на практике часть высокоскоростных портов чипсета изначально уйдет на USB3 Gen1 и SATA. Да еще и встроенной поддержки USB3 Gen2 нет — так что придется использовать дискретные контроллеры, без чего АМ4, TR4 и TRX40 спокойно обходятся. Ну а на массовых платформах Intel, типа LGA115x, процедура «впихивания» периферии в прокрустово ложе штатных возможностей всегда заставляла кусать локти от досады самого маркиза де Сада — и в LGA1200 это все унаследовано.

  AMD Ryzen 7 3800X AMD Ryzen 9 3900X AMD Ryzen 9 3950X
Название ядра Matisse Matisse Matisse
Технология производства 7/12 нм 7/12 нм 7/12 нм
Частота ядра, ГГц 3,9/4,5 3,8/4,6 3,5/4,7
Количество ядер/потоков 8/16 12/24 16/32
Кэш L1 (сумм.), I/D, КБ 256/256 384/384 512/512
Кэш L2, КБ 8×512 12×512 16×512
Кэш L3, МиБ 32 64 64
Оперативная память 2×DDR4-3200 2×DDR4-3200 2×DDR4-3200
TDP, Вт 95 105 105
Количество линий PCIe 4.0 20 20 20

Впрочем, определенные проблемы с конфигурированием возможны и в случае АМ4 — особенно если сэкономить и приобрести плату на «старом» чипсете. Но вопросы экономии сегодня нас не интересуют. Вернее, интересуют — но в разумной степени: когда минимальной планкой оказывается Ryzen 7/9 с платой на базе AMD X570. Периферийных возможностей такой связки достаточно для массового рынка, процессорные ядра одинаковые, компоновка их сходная — значит, нужно оценить, что дает простое «удвоение» процессора. В этом плане Ryzen 9 выглядят как раз как половинки новых Ryzen Threadripper — но мы решили добавить к числу испытуемых и старший (до недавнего времени) Ryzen 7 3800X. В нем один восьмиядерный блок — в 3950X два таких, но на том же IOD, а в 3970X — уже четыре, но «насаженных» на более мощное основание. Соответственно, эта тройка отлично подойдет для оценки масштабируемости архитектуры, причем по обоим фронтам: количеству ядер и усилению внешних интерфейсов (в первую очередь — памяти).

  AMD Ryzen Threadripper 2920X AMD Ryzen Threadripper 2950X AMD Ryzen Threadripper 2990WX
Название ядра Colfax Colfax Colfax
Технология производства 12 нм 12 нм 12 нм
Частота ядра, ГГц 3,5/4,3 3,5/4,4 3,0/4,2
Количество ядер/потоков 12/24 16/32 32/64
Кэш L1 (сумм.), I/D, КБ 768/384 1024/512 2048/1024
Кэш L2, КБ 12×512 16×512 32×512
Кэш L3, МиБ 32 32 64
Оперативная память 4×DDR4-2933 4×DDR4-2933 4×DDR4-2933
TDP, Вт 180 180 250
Количество линий PCIe 3.0 60 60 60

И, разумеется, мы никак не можем обойтись без Ryzen Threadripper предыдущего поколения. На деле платформа TR4 уже мертва с точки зрения AMD, но приобрести платы и процессоры пока можно. Иногда — даже (относительно) дешево. Стоит или нет — тут уж каждый решает для себя сам, но сравнить решения одного назначения нужно. Да и с массовыми платформами мы эти процессоры сравнивали только при использовании старой версии методики — вдруг после обновления системы и ПО они заблистают по-новому :)

Что касается прочего окружения, то разными были только системные платы и емкость оперативной памяти: поскольку мы устанавливаем один модуль в 8 ГБ на канал, «обиженной» тут оказалась платформа АМ4. А вот частоту решили использовать везде одинаковую — 3200 МГц. Для АМ4 и TRX40 она вообще штатная, а тестирование процессоров TR4 по данной версии методики будет первым и последним, так что для одного раза без дальнейших сравнений лучше сделать так.

Методика тестирования

Методика тестирования компьютерных систем образца 2020 года

Методика тестирования подробно описана в отдельной статье, а результаты всех тестов доступны в отдельной таблице в формате Microsoft Excel. Непосредственно в статьях же мы используем обработанные результаты: нормированные относительно референсной системы (Intel Core i5-9600K с 16 ГБ памяти, видеокартой AMD Radeon Vega 56 и SATA SSD) и сгруппированные по сферам применения компьютера. Соответственно, на всех диаграммах, относящихся к приложениям, безразмерные баллы — так что больше всегда лучше. А игровые тесты с этого года мы окончательно переводим в опциональный статус (причины чего разобраны подробно в описании тестовой методики), так что по ним будут только специализированные материалы. В основной линейке — только пара «процессорозависимых» игр в невысоком разрешении и среднем качестве — синтетично, конечно, но приближенные к реальности условия для тестирования процессоров не годятся, поскольку в таковых от них ничего не зависит.

iXBT Application Benchmark 2020

Выяснилось, что не все программы одинаково полезны: если на процессорах массового сегмента или, например, «старых» Threadripper вся тройка приложений ведет себя одинаково, отлично масштабируясь по количеству ядер, то на TRX40 это верно лишь для MediaCoder и HandBrake. VidCoder выдает явно неадекватные результаты: 3960X справился с заданием на уровне 3900X, а 3970X даже отстал от 3700X. Причем речь идет не о случайной ошибке — повторение тестов приводит к тем же результатам. И закономерному итогу. Который, впрочем, в абсолютных значениях такой, что и покритиковать-то не за что. Хотя и где все гладко 3960X, например обгоняет 3900X лишь в полтора раза, т. е. явно непропорционально увеличению количества ядер и всего остального. В общем, для этой платформы такие нагрузки слишком легкие, чтобы получить какой-то ощутимый эффект. Ну а старым HEDT-решениям ловить и вовсе нечего — для своего времени они были быстрыми, но это время давно ушло.

То, о чем мы говорили во вводной части — эти приложения нормально переваривают NUMA, так что тут и 2990WX выглядел неплохо. Но, опять же, во времена первых поколений Ryzen и тогдашних Core. А в семействе «3000» AMD увеличила темп выполнения операций с плавающей запятой вдвое. В итоге в 3D-рендере X-линейка TR4 целиком уступает даже Ryzen 9 3900X, а 3950X хватает, чтобы отправить в нокаут и WX-серию. Новые же Ryzen Threadripper возвышаются среди современных процессоров в гордом одиночестве: их просто сравнивать не с кем, поскольку ни у кого больше нет такого количества таких ядер.

WX слова доброго при такой нагрузке не заслуживают. Топовые решения для АМ4 явно упираются в систему памяти, неспособную прокормить 12-16 быстрых ядер. Хотя для того, чтобы обогнать процессоры для TR4 и этого хватило. А TRX40 — в очередной раз большой скачок. Модели, впрочем, не слишком отличаются друг от друга — потому что «уперлись» туда же в память. В итоге самым интересным выглядит 3960X, где все проблемы уже решены, а цена все еще в разумных пределах.

Та же самая проблема, что и в предыдущем случае. Удвоили параметры памяти — получили увеличение производительности. Но при минимальной разнице между процессорами: количество ядер тоже удвоили, так что их снова «слишком много» оказалось.

В этом сценарии же «страдает» только топовый 3970X — он слишком мощный, чтобы сохранять линейную зависимость производительности от количества ядер. И, как обычно, важно — каких именно ядер: «старые» 16 это лишь уровень новых 12. Да и то — при хорошем раскладе.

Поскольку бывает и плохой: когда вообще все определяется не ядрами фактически, а памятью и кэшем. В двух чиплетах последнего вдвое больше, чем в одном — но вдвое меньше, чем в четырех. А теперь смотрим на результаты и понимаем, что на этом фоне прочие факторы уже малозначимы. Если речь идет о процессорах с одинаковой архитектурой и одинаковой организацией: архиваторы это хороший пример программ, которых от NUMA просто тошнит.

И снова видим уже привычную картину: 3900X достаточно, чтобы «похоронить» TR4, но существенно увеличить производительность на той же АМ4 уже мешают ее особенности. «Расшиваем» узкое место — прыгаем на новый уровень. Где точно также останавливаемся.

И в общем — расклад сохраняется. Так что не удивительно, что компания не слишком продвигает Ryzen Threadripper 3990X: понятно, что это не несуразица уровня 2990WX, но процессор для очень специфических случаев. А вот позиция для чего-нибудь о 16 ядрах, но со «взрослым» окружением оставлена как специально. Причем пользы от такого будет больше, чем от так и канувшего в лету восьмиядерного Ryzen Threadripper 1900X, где пришлось резать ядра во всех CCX — есть ощущение, что в данном случае на тот же IOD можно было «повесить» и два чиплета, получив прекрасное технически решение. С другой стороны... Много на этом все равно вряд ли вышло сэкономить, так что «зазор» вполне возможно сократится, сжимаемый Zen3 снизу и снижением цены (вполне возможным) на 3960X сверху. Так будет даже интереснее с практической точки зрения.

Энергопотребление и энергоэффективность

За экстремальную производительность приходится расплачиваться и экстремальным энергопотреблением. Ничего неожиданного — если один CCD способен съесть под сотню ватт, то двум закономерно может потребоваться и под 200, а четырем... К счастью, не 400 — все-таки сортировка кристаллов есть и жесткая. Зато разные чипы IOD по-разному энергию потребляют, да и «прожорливость» плат разная. Так что в первую очередь претензии стоит предъявлять совсем не к максимальному уровню энергопотребления (хотя нам пришлось отремонтировать и немного модернизировать измерительный прибор — он отлично справлялся со всеми платформами, но не выдержал теплой встречи с TRX40) — он соответствует уровню производительности, да и по сравнению с предыдущими «четырехкристальниками» вырос лишь процентов на 20. А вот то, что даже при небольшой нагрузке типа файловых операций (которые мы используем как эталон) платформа «жрет» как АМ4 с восьмиядерным процессором на максимуме — уже печально. В общем, TRX40 даже не для тех случаев, когда изредка нужна высокая производительность — ей нужна постоянная нагрузка. Иначе не только пользы не будет, но и прямой вред даже.

Эффективность, конечно, пониже, чем у Ryzen 3000 для АМ4 (не забываем про IOD и прочее окружение), но не хуже, чем у решений Intel, например. И выше предыдущего поколения тоже. Не сравнивая с 2990WX даже — получается, что последний как правило просто бесцельно грел воздух.

Игры

Как уже было сказано в описании методики, сохранять «классический подход» к тестированию игровой производительности не имеет смысла — поскольку видеокарты давно уже определяют не только ее, но и существенным образом влияют на стоимость системы, «танцевать» нужно исключительно от них. И от самих игр — тоже: в современных условиях фиксация игрового набора на длительное время не имеет смысла, поскольку с очередным обновлением может измениться буквально все. Но краткую проверку в (пусть и) относительно синтетичных условиях мы проводить будем — воспользовавшись парой игр в «процессорозависимом» режиме.

Хотя на деле можно было и без краткой проверки обойтись, поскольку результат был предсказуем. Качественно все Ryzen 3000 сходные, количественно и Ryzen 7 3800X «переплевывает» запросы современных игр с запасом, так что дальнейшее наращивание «мощи» увеличивает только лишь этот запас — но ухудшиться результатам не с чего. А старые Ryzen Threadripper — это в первую очередь старая же архитектура, что уже существенно медленнее. Плюс детали реализации — тоже на пользу не идущие. Хотя поиграть с приличной видеокартой это не помешает — но выбирать эти модели для игрового компьютера не за чем. Новые — тоже. Хотя если игры — не главное, а просто желательное и регулярное применение, то собирать для них отдельный компьютер точно не нужно: «основной» справится не хуже, чем любая современная платформа. Но и не лучше, конечно.

Итого

Ощущения двоякие. С одной стороны, очевидно, что первая попытка принести в настольный (хотя бы условно-настольный) сегмент 25-30 ядер была фальстартом — а вот вторая стала успешной. При том, что каких-то три года назад немногим дешевле двух тысяч долларов продавался лишь десятиядерный Core i7-6950X, прогресс очевидный. С другой стороны и он уже снабжался четырехканальным контроллером памяти, а пропускная способность каждого канала с тех пор выросла совсем не в три раза. И иногда это уже мешает. В настольном сегменте — тоже мешает, но у Ryzen 9 эффект менее заметен: «нагрузить» работой 16 ядер проще. Выше их эффективность снижается, так что влияние других компонентов процессора растет. А с этим все и в 3960X на уровне, а у 3970X — не лучше, что делает выбор в пользу старшего в линейке процессора сомнительным (кто-то сказал «старший — это 3990X»? тем паче). Так что вырвавшись за пределы одного ограничения — «впечатались» в аналогичное на новом уровне.

Однако, как бы то ни было, платформа TRX40 (в целом) на сегодняшний день является самым производительным и функциональным решением, вообще пригодным для создания персональных компьютеров. Ничего равного нет — это эксклюзивное предложение. Не всем — но не всем такое и требуется. Так что не попавшие в целевую аудиторию могут порадоваться возможности приобрести хороший и быстрый компьютер на каком-нибудь Ryzen 7, а то и Ryzen 9 за цену одного лишь процессора Ryzen Threadripper: технологии AMD на сегодня позволяют удовлетворить покупателей с кошельком любой толщины и любыми (разумными) требованиями. В том числе и такими, для реализации которых действительно нужна новая платформа. А вот приобретать ее по принципу чтобы было — не стоит. Во-первых, дорого. Во-вторых, при отсутствии постоянных тяжелых нагрузок не слишком эффективно. Да, Zen2 отлично масштабируется, причем топовые решения на новой микроархитектуре уже никогда не уступают в производительности младшим. Но за это в их случае приходится расплачиваться высоким энергопотреблением — которое оправдано при «тяжелых» нагрузках, но избыточно при решении типовых задач персонального компьютера. В общем, платформа для работы — ресурсоемкой и постоянной. Хотя отлично справляется даже с играми. Но в качестве массового решения лучшей по-прежнему остается АМ4 — тоже, практически, вне конкуренции; в т. ч. и со стороны новой HEDT-платформы AMD.

Справочник по ценам

14 июля 2020 Г.