Введение
Прошел месяц с момента анонса процессоров AMD Epyc второго поколения. И сейчас — самое время для того, чтобы спокойно и без лишней спешки разобраться во всех нововведениях и рыночных перспективах этих CPU. Еще чуть раньше AMD запустила удачные настольные процессоры Ryzen на основе улучшенной микроархитектуры Zen 2, которые очень хорошо показали себя в тестах, завоевав внимание индустрии, но если компания хочет заработать на процессорах действительно большие деньги, то приходится обращать внимание и на рынок серверов.
В прошлый раз AMD завоевывала рынок серверных процессоров 64-битными процессорами Opteron в уже очень далеком 2004 году. С тех времен доля AMD на этом рынке скатывалась практически до нуля, но уже первое поколение процессоров Epyc на основе микроархитектуры Zen 1, позволило им набрать некоторое количество клиентов, хотя до той же Intel оставалось еще очень далеко. Анонс первого поколения процессоров Epyc в июле 2017 года начал новую страницу компании на этом рынке. Уже первые решения линейки предлагали большее количество вычислительных ядер, повышенную пропускную способность памяти и больше возможностей для подключения периферии, по сравнению с тогдашними конкурентами от Intel.
Но многие индустриальные игроки ждали чего-то еще более конкурентоспособного, и наконец-то дождались — второе поколение Epyc решило многие проблемы первого, перешло на самый совершенный техпроцесс, благодаря хитроумной компоновке обеспечив максимальное количество ядер (для x86-совместимых решений), а также предложило отличные возможности по поддержке оперативной памяти и внешних устройств, подключаемых по шине PCI Express. Второе поколение Epyc, известное под кодовым именем «Rome», и вышедшее совсем недавно, предлагает еще больше производительности вместе с некоторыми новыми возможностями.
Сегодняшние задачи нуждаются в высокопроизводительных вычислительных устройств для большого количества применений, в числе которых: облачные сервисы, виртуализация, машинное и глубокое обучение, анализ больших данных и т. д. Для решения этих вопросов современные серверы должны не только быть максимально производительными, но и масштабироваться в широких пределах, иметь не только низкую стоимость аппаратного обеспечения, но и минимально возможную совокупную стоимость владения. Также весьма важны вопросы безопасности — для серверов, обслуживающих организации и большое количество пользователей это особенно важно.
Неудивительно, что производители вычислительных решений агрессивно выводят на серверный рынок все новые и новые продукты на основе CPU и GPU, и определенное преимущество тут будет у тех, кто имеет продвинутые технические возможности и новые подходы по интеграции. Также очень важна и развитая экосистема, поддерживаемая этими компаниями. Выпуск первых решений Epyc открыл новую страницу для компании AMD, так как эти серверные процессоры предлагали более высокую производительность при меньшей цене, не говоря об ином уровне совокупной стоимости владения, по сравнению с конкурентами.
Новые серверные процессоры были неплохо приняты индустрией при всей ее консервативности и инерционности, было выпущено большое количество аппаратных решений с применением Epyc, они были поддержаны программно, в том числе и самыми популярными облачными платформами: Microsoft Azure, Amazon Web Services, Tencent Cloud, Baidu, Oracle Cloud и другими. Но серверные решения — это не самая стремительно меняющаяся индустрия, и для того, чтобы еще больше усилить продвижение Epyc в массы, было необходимо еще улучшать возможности этих процессоров. Чем AMD и занималась прошедшие два года, работая над вторым поколением семейства серверных процессоров Epyc.
Уже сейчас понятно, что серверные процессоры AMD Epyc второго поколения еще сильнее изменили картину на рынке, по сравнению с первым, и установили новые стандарты решений для современных центров обработки данных по производительности и стоимости эксплуатации. Новые серверные процессоры AMD обеспечивают высочайшую производительность в широком спектре задач, имея до 64 ядер на процессор. Epyc 7002 обеспечивают до двух раз большую производительность по сравнению с предыдущим поколением серверных процессоров компании, и на 25%-50% меньшую совокупную стоимость владения, по сравнению с конкурирующими продуктами.
Наиболее впечатляющим стал прирост количества ядер и многопоточной производительности — новинки более чем вдвое быстрее первого поколения Epyc, что важно в том числе и потому, что с их помощью можно использовать односокетные серверы там, где раньше использовались два процессора. И все это великолепие — в том же самом сокете и с небольшим ростом энергопотребления и тепловыделения. Новые CPU можно устанавливать в платформы первого поколения, хотя для поддержки части функциональности потребуется обновить BIOS системной платы, предназначенной для установки Epyc 7001. Но так как для серверных процессоров такой апгрейд не слишком распространен, то чаще всего будут приобретаться платформы второго поколения, раскрывающие все возможности Epyc 7002, такие как поддержка PCIe 4.0 с вдвое большей пропускной способностью, полезной для скоростных Ethernet-адаптеров и SSD-накопителей, например. Давайте поговорим обо всем поподробнее.
Техпроцесс и микроархитектурные улучшения
Сразу можно сказать, что новые процессоры Epyc 7002 стали первыми по многим показателям. В том числе, это первые 64-ядерные x86-совместимые процессоры, первые x86-совместимые, созданные с применением 7 нм техпроцесса, первые процессоры с поддержкой шины PCI Express 4.0, первые процессоры с поддержкой памяти стандарта DDR4-3200, и т. д. и т. п.
В свое время компания AMD сделала серьезную ставку на максимум инноваций: обязательный переход на 7 нм техпроцесс, многочисленные улучшения архитектуры, устраняющие основные недостатки и применение совершенно новых компоновочных решений. Все эти пункты сработали отлично, один только самый современный техпроцесс позволил получить вдвое большую плотность размещения транзисторов и вдвое меньшее потребление энергии при той же производительности, а заодно и прирост частоты примерно на четверть.
Инвестиции в разработку 7 нм решений для AMD оправдались с лихвой, что особенно хорошо заметно на фоне проблем главного конкурента с освоением примерно аналогичного по возможностям техпроцесса. Даже несмотря на то, что у TSMC и Intel очень разные «нанометры», и картинка выше слегка преувеличивает превосходство 7 нм над 10 нм, ранее преимущество всегда было за имеющей собственное производство компанией Intel, но теперь, за счет собственных инвестиций и совместной работы с тайваньской компанией TSMC, а также с учетом проблем конкурента с их полупроводниковым производством, AMD не просто сравнялась с соперником, но и вышла вперед — такого ранее еще не было!
Почему применяемый техпроцесс вообще столь важен? Да хотя бы уже потому, что он позволяет обеспечить более низкую себестоимость, а вместе с ней и снижение цены на продукцию. По мнению индустриальных аналитиков, современные 7-нм процессоры Epyc с многокристальной чиплетной компоновкой достигают уровня выхода годных кристаллов около 90%, в то время как Intel довольствуется более чем вдвое меньшей долей выхода годной продукции. С учетом разницы в техпроцессах (14 нм у Intel и 7 нм у AMD на TSMC), каждый процессор первой обходится раза в полтора дороже даже при том, что второй приходится платить сторонним производителям: TSMC и GlobalFoundries. Эти примерные прикидки недвусмысленно говорят о том, что ставка AMD оправдалась.
Однако новой технологией производства дело не ограничилось, в AMD решили исправить одну из явных проблем первого поколения архитектуры Zen — относительно низкое количество исполняемых инструкций за такт (IPC). Во многом именно за счет этого конкурент имел преимущество над решениями AMD в некоторых задачах из разных сфер применения. И в Zen 2 инженеры смогли добиться прироста в скорости вычислений при той же частоте на 15%, а если говорить о приросте в многопоточных вычислениях, то в типичных серверных задачах новый Epyc быстрее старого при прочих равных уже на 23%, и это — без учета удвоенного количества вычислительных ядер и большей рабочей частоты!
Каким образом этого достигли, что именно улучшили во второй версии Zen? Основные вопросы мы уже рассматривали в статье, посвященной выходу настольных процессоров Ryzen, а отдельные ядра в Epyc ничем от них не отличаются. В Zen 2 сделали массу микроархитектурных улучшений, по сравнению с Zen 1.
Если вкратце, то для увеличения производительности в новой микроархитектуре улучшили предсказание переходов (появился новый предсказатель переходов TAGE), слегка увеличили целочисленную производительность, увеличив буферы и улучшив планировщики, оптимизировали работу кэш-памяти первого уровня, практически удвоив ее пропускную способность, удвоили емкость L3-кэша и т. д. Кроме этого, в Zen 2 были добавлены некоторые новые инструкции.
Но все же самое важное изменение в Zen 2 — увеличение ширины блока операций с плавающей запятой с 128 до 256 бит. Благодаря этому улучшению, все процессоры архитектуры Zen 2 исполняют 256-битные AVX2-инструкции вдвое быстрее, по сравнению с первым поколением. То есть, в Zen 2 появилась поддержка выполнения двух AVX-256 инструкций за такт, что позволило AMD заявить о двукратном росте FP-производительности. Причем, в отличие от решений Intel, второе поколение Epyc не снижает частоты при выполнении AVX2 слишком сильно, а просто действует в рамках ограничений по энергопотреблению, установленных платформой.
Отметим также удвоенный объем кэш-памяти для декодированных микроопераций, что может снизить простои исполнительных блоков конвейера, а также улучшенное предсказание переходов при помощи нового TAGE-предсказателя и увеличенный объем буферов ветвлений первого и второго уровней. Эти изменения призваны снизить вероятность появления ошибок предсказания и увеличивают эффективность прогнозирования ветвления кода, повышая общую производительность.
В новых вычислительных ядрах появился третий блок генерации адресов (AGU), улучшающий доступ исполнительным устройствам к данным. Ширина шины кэш-памяти была увеличена вдвое, а объем кэш-памяти третьего уровня удвоен — его объем достиг 32 МБ на каждый чиплет. Это помогает ускорить обращение исполнительных устройств к данным. Были увеличены размеры очередей планировщиков и размер регистрового файла, повышающие эффективность исполнения многопоточного кода.
Дополнительное преимущество второе поколение Epyc получило при оптимизации энергоэффективности в виде улучшенного управления питанием, позволяющим получить максимально возможную турбо-частоту при разном количестве активных вычислительных ядер. То есть, как и в настольных Ryzen, даже фабричные частоты выжимают из CPU практически всю возможную производительность. Если говорить о конкретных цифрах, то при восьми активных ядрах тактовая частота топовой модели Epyc 7742 составляет 3,4 ГГц, при 16 падает до 3,33 ГГц, и плавно снижается до 3,2 ГГц для всех 64 ядер.
Отметим, что средняя однопоточная производительность Epyc 7002 в широком круге задач выросла даже несколько больше, чем на 15%, о которых заявила AMD, судя по тестам наших многочисленных коллег. И очень похоже, что с такими характеристиками и возможностями, решения AMD будут успешно сражаться не только на рынке настольных ПК, но и на рынке высокопроизводительных вычислений, где до сих пор царил Intel Xeon.
Чиплетная компоновка
Но все же самое главное, чем бьет конкурента новый серверный процессор AMD — инновационное компоновочное решение с использованием так называемых чиплетов — отдельных кристаллов, связанных быстрой шиной. Уже в первом поколении Epyc использовался не единый кристалл, а четыре отдельных, включающих в себя вычислительные ядра, контроллеры памяти и системы ввода-вывода, и все они были объединены быстрой шиной. Такой подход позволил обойти ограничения на размер единого кристалла и снизить себестоимость производства многоядерных CPU, ведь выход годных у маленьких кристаллов выше. Заодно повысилась масштабируемость, так как количество отдельных кристаллов, содержащих по несколько ядер, можно было варьировать в более широких пределах.
Но во втором поколении Epyc инженеры компании пошли еще дальше, применив второе поколение архитектуры AMD Infinity, оптимизированной для многоядерных вычислений. В первом поколении Epyc одним из спорных моментов была повышенная сложность решения: 32-ядерные процессоры содержали по четыре кристалла с 8 ядрами, каждый из которых имел по два канала памяти, а в двухпроцессорной конфигурации дела были еще хуже, ведь она приводила к сложностям при доступе к памяти из ядер в разных процессорах. Из-за этих проблем большое количество приложений показывало недостаточно высокую производительность даже при сравнительно большом количестве CPU-ядер.
Во втором поколении Epyc проблему решили при помощи центрального чиплета ввода-вывода, в котором содержатся все необходимые для работы контроллеры. Полная версия чипа состоит из восьми чиплетов Core Complex Die (CCD) и одного ядра ввода-вывода I/O Die (IOD). Все CCD соединены с центральным хабом при помощи высокоскоростных каналов Infinity Fabric (IF), и при их помощи получают данные из памяти и внешних PCIe-устройств, а также от соседних вычислительных ядер.
Каждый из CCD-чиплетов содержит по паре четырехъядерных блоков Core CompleX (CCX), которые также включают и 16 МБ L3-кэша. Получается, что топовый 64-ядерный Epyc состоит из 8 чиплетов CCD и 16 блоков CCX, которые обмениваются данными друг с другом при помощи центрального IOD-чиплета.
При этом разные чиплеты используют оптимальный техпроцесс для их производства: CPU-чиплеты производятся на фабриках TSMC с использованием техпроцесса 7 нм, а чиплет ввода-вывода — на GlobalFoundries с применением технологии 14 нм. Кристалл с вычислительными ядрами и кэш-памятью использует самый совершенный техпроцесс для того, чтобы снизить размер кристалла, максимизировать производительность при минимальном энергопотреблении, а чиплет с контроллерами памяти и PCIe не нуждается в столь радикальных мерах и вполне обходится обкатанным и проверенным техпроцессом. AMD называет такую упаковку гибридной мультиядерной системой-на-чипе (SoC).
Это полезно в том числе и потому, что схемы ввода-вывода сложнее производить на более тонких техпроцессах, и их перенос на давно и хорошо отлаженную технологию производства упрощает и удешевляет производство, ускоряя вывод решений на рынок. В результате такого подхода AMD получила значительно преимущество, производя сравнительно маленькие CCD-кристаллы по 7 нм с хорошим уровнем выхода годных.
Такой подход позволяет улучшить задержки при передаче данных, обеспечив гибкую и унифицированную архитектуру доступа к памяти. По сравнению с первым поколением еще более гибким стало масштабирование по количеству вычислительных ядер, ушла необходимость наличия подсистем ввода-вывода и контроллеров памяти в каждом из кристаллов, а главное — единый центральный чиплет ввода-вывода улучшил показатели неравномерного доступа к памяти (NUMA) при межкристальном взаимодействии.
Во втором поколении серверных процессоров Epyc было снижено количество узлов удаленной памяти NUMA. Если в первом поколении каждое ядро имело три возможных времени доступа к памяти, физически присоединенной к разным кристаллам процессора (к контроллерам памяти рассматриваемого кристалла, контроллеров в соседних кристаллах и контроллеров во втором чипе), то во втором поколении Epyc варианта лишь два: контроллеры памяти в текущем чиплете ввода-вывода и в соседнем.
Соответственно, время доступа в первом поколении Epyc может быть 90, 141 или 234 нс, а во втором — или 104 или 201 нс. И в среднем, задержки доступа к памяти при двухчиповой схеме были снижены на 14%-19%. Это улучшение очень важно, так как производительность в большинстве современных задач очень сильно зависит от работы подсистемы памяти, включая эффективность кэширования данных.
Чиплетная компоновка сработала отлично, этот шаг был фактически обязателен для дальнейшего увеличения количества ядер, и иная схема была бы куда менее выгодной. Конечно, монолитный кристалл обеспечил бы куда меньшие задержки как доступа к памяти, так и между вычислительными ядрами, но тогда вряд ли удалось бы увеличить количество ядер до 64 штук — для примера можно посмотреть на решения конкурента.
Есть один неприятный момент в схеме, принятой AMD. Если требуется доступ к данным в кэше, который принадлежит не к тому же CCX, но находящемся в том же кристалле CCD, то он будет таким же медленным (относительно), как и доступ к данным кэша вообще из другого кристалла. В таком случае, данные всегда будут проходить по шине IF в чиплет ввода-вывода и обратно — уже к нужному ядру.
Это не так страшно в реальности, так как каждое вычислительное ядро в составе CCX имеет по 4 МБ L3-кэша, что заметно больше, чем у конкурирующих процессоров Intel, и блоки предвыборки данных имеют куда больший объем для того, чтобы загрузить все необходимые данные. Хотя некоторые задачи, вроде приложений баз данных, могут пострадать, а относительно медленный обмен данными с центральным чиплетом снижает скорость синхронизации. И в некоторых тестах 28-ядерный Intel Xeon 8280 именно поэтому оказывался быстрее 32-ядерного Epyc 7601 из предыдущего поколения.
Возможно, есть и другие подобные задачи, но в большинстве случаев 16 МБ L3-кэша для каждых четырех ядер в составе CCX должно быть вполне достаточно. Больший объем L3-кэша в Epyc 7742 дает значительно меньшую задержку доступа при объеме данных между 4 и 16 МБ, по сравнению с аналогичным Epyc из предыдущего поколения, а также L3-кэш новых Epyc весьма быстр, по сравнению с решениями конкурента в Intel Xeon Platinum 8280, что подтверждают и синтетические тесты.
Сама по себе шина Infinity Fabric в Epyc второго поколения была ускорена, ее ширина выросла вдвое — с 256 до 512 бит. И задержки при пересылке данных между ядрами действительно заметно улучшились. Разные ядра процессора обмениваются данными на 25%-33% быстрее, и скорость обмена между ядрами в пределах одного блока CCX получается даже лучше, чем у конкурента с кольцевой шиной. Ускорение Infinity Fabric проявляется не только при пересылке данных между ядрами. Каждый блок CCX имеет собственную кэш-памятью третьего уровня в 16 МБ, и обращения через Infinity Fabric происходят, когда ядра одного блока CCX нуждаются в данных, находящихся в L3-кэше соседнего блока, не говоря уже о других чиплетах. Так что ускорение Infinity Fabric положительно сказалось на производительности в широком круге задач при активном доступе к данным.
Сама подсистема кэш-памяти в новых процессорах мало изменилась, кэш-память первого и второго уровней сохранила свой объем и организацию, а вот кэш третьего уровня был удвоен (16 МБ на каждые четыре ядра) за счет перехода на 7 нм техпроцесс, который позволил увеличить транзисторный бюджет для чиплетов. Увеличение объема L3-кэша стало в том числе причиной того, что в новых процессорах (и Epyc и Ryzen) контроллеры памяти теперь расположены в не рядом с вычислительными ядрами, а в отдельном чиплете ввода-вывода. Кэширование большого объема данных нужно для того, чтобы снизить задержки, когда вычислительные ядра простаивают в ожидании получения данных из памяти.
Рост объема кэш-памяти традиционно сопровождается некоторым увеличением ее задержек, но рост латентности L3-кэша в случае перехода от Zen 1 к Zen 2 оказался довольно небольшим. А задержки L1- и L2-кэша остались на прежнем уровне из-за отсутствия особых изменений. А вот L1-кэш стал быстрее, так как теперь он способен обслуживать два 256-битных чтения и одну 256-битную запись за такт, что вдвое больше, чем у Epyc первого поколения. И если скорость работы L1- и L2-кэша в новых процессорах архитектуры Zen 2 сопоставимы с параметрами кэш-памяти процессоров конкурента, то L3-кэш обеспечивает даже меньшие задержки по сравнению с кэшем процессоров Intel. Впрочем, не все так просто, и алгоритмы работы L3-кэша в процессорах разных производителей отличаются, как и их практическая эффективность.
А вот показатели задержек доступа к памяти во всех Zen 2 дают некоторый повод для беспокойства — по этим параметрам новинки оказываются даже несколько хуже предшественников, проигрывая по латентности памяти процессорам конкурента. Все дело в той самой чиплетной компоновке, которая разделила вычислительные ядра и контроллеры памяти. Чиплеты с вычислительными ядрами и L3-кэшем отделены от вынесенных в чиплет ввода-вывода контроллера памяти, контроллера шины PCI Express и других элементов. Между памятью и всеми процессорными ядрами появилось еще одно звено в виде шины Infinity Fabric. И хотя AMD утверждает, что она аналогична по характеристикам шине, связывающей пару CCX блоков внутри чиплета, вряд ли это не сказывается на задержках, возникающих при доступе к данным.
Но насколько хуже стала работа с памятью в новых серверных процессорах AMD? Увеличение задержек во всех процессорах Zen 2 по сравнению с процессорами прошлого поколения достигает 10%, да и реальная пропускная способность при записи в память несколько снизилась. Отделение контроллера памяти от вычислительных ядер не могло привести к другому результату, ведь именно для ускорения доступа к ней лет 15 назад переносили контроллер памяти из чипсета в CPU. В итоге, ПСП при чтении у новых Epyc действительно достаточно высока, а вот по скорости записи они уступают конкурентам от Intel. Это тем более неприятно, так как по скорости работы с памятью первые Epyc и так проигрывали решениям конкурента, а теперь ситуация в некоторых задачах может даже усугубиться.
Но все же новая организация доступа к памяти — это правильное решение. Ведь основное преимущество второго поколения Epyc перед первым состоит в том, что под него гораздо проще оптимизировать программное обеспечение. Каждый процессор (в двухпроцессорной конфигурации) имеет лишь одно возможное значение задержки доступа к памяти, так как каждое ядро имеет одинаковый путь ко всем каналам памяти. А в первом поколении Epyc было две области NUMA на каждый CPU, так как память в них присоединена к разным кристаллам. Так что в двухпроцессорной системе Epyc 7002 будет работать в традиционной NUMA-конфигурации, которую много лет знают программисты. И хотя в некоторых случаях доступ к памяти у Epyc 7001 и получается быстрее, топология первого поколения излишне сложна, и во многих других случаях задержки памяти возрастают, что сложно предсказать и оптимизировать в ПО. Конфигурация памяти Epyc 7002 с точки зрения ПО выглядит гораздо проще, что сократит время, требующееся для его оптимизации.
Основными задачами при разработке микроархитектуры Zen 2 было увеличение пропускной способности внутричиповых соединений, улучшенные возможности по присоединению внешних устройств (большое количество каналов PCIe 4.0), а также улучшенное масштабирование (возможность выпуска продуктов с разным количеством вычислительных ядер и каналов памяти). Процессоры Epyc 7002 совместимы с существующими платформами при межсокетном соединении на скорости в 10,7 ГТ/с, но на втором поколении платформ эта скорость вырастет до 18 ГТ/с, и таких соединений между процессорными разъемами может быть до четырех, что в результате дает пропускную способность до 202 ГБ/с.
Вообще, о внутреннем содержании чиплета ввода-вывода AMD рассказывает довольно мало. Во всех моделях Epyc он идентичен, поддерживая 128 линий PCIe 4.0 и 8 каналов памяти DDR4-3200 с коррекцией ошибок. Поддерживаются модули емкостью до 256 ГБ и рекомендуется равномерно заполнять все каналы одинаковым объемом и типом модулей, хотя в теории можно использовать даже один модуль памяти на всю систему, хотя смысла в этом нет никакого. Средняя задержка доступа к памяти для восьми каналов в рамках одного CPU составляет чуть больше 100 нс, а конкретные значения времени доступа зависят от частоты памяти и типа модулей. При использовании двух модулей на канал, максимальная скорость снижается с 3200 до 2933 или даже до 2666 МГц при наборе модулями большого объема.
Но при всех своих ограничениях и оговорках, улучшенная архитектура AMD Infinity обеспечила довольно высокие показатели по пиковой пропускной способности и объему памяти, а также характеристикам подсистемы ввода-вывода. Так, второе поколение Epyc поддерживает до 4 ТБ памяти стандарта DDR4-3200 при 8 каналах на каждый разъем, с пиковой ПСП до 204 ГБ/с на процессор. То есть, максимальная ПСП на двухпроцессорный сервер для Epyc 7002 получается 410 ГБ/с, тогда как у Epyc 7001 она была 340 ГБ/с, а у конкурирующих процессоров от Intel (Xeon Cascade Lake SP) — лишь 282 ГБ/с.
Другие технологии и новинки
С поддержкой шины PCI Express изменилось немногое, кроме поддерживаемой версии. Для ввода-вывода новым процессорам доступны 128 линий PCIe 4.0 на каждый разъем, с максимальной пропускной способностью в 512 ГБ/с. Модели Epyc 7002 стали первыми x86-совместимыми процессорами с такой поддержкой, когда все восемь x16 каналов на каждый CPU поддерживают удвоенную скорость передачи данных. 16-канальные соединения PCIe 4.0 можно разделить на несколько устройств, требующих меньшую пропускную способность.
Но хотя на каждый CPU есть по 128 линий PCIe 4.0, для двухсокетной системы это количество не увеличится, так как по 64 линии от каждого из CPU забирает связующая их Infinity Fabric (есть возможность получить и 192 линии, забрав часть у шины, связывающей процессоры — с соответствующими последствиями). Линии процессора разбиты на восемь групп по 16 штук, и каждая из них поддерживают разделение до x1, но с общим числом слотов на группу не выше восьми. Половина групп поддерживает переключение восьми линий PCIe в режим SATA3, и в общем получается поддержка до 32 штук SATA- или NVMe-накопителей.
Внедрение шины PCIe 4.0 не нужно недооценивать, ведь она дает удвоенную пропускную способность, важную для NVMe-накопителей и высокоскоростных соединений Infiniband. По данным AMD, обеспечивается вплоть до линейного масштабирования для производительности чтения и записи данных при помощи этих технологий, а для серверов это очень важно. 128 линий PCIe 4.0 с удвоенной пропускной способностью можно использовать для увеличения скорости передачи данных по сети при связи серверных кластеров друг с другом, а для других задач может быть полезной увеличение пропускной способности для связи с GPU- и TPU-ускорителями, предназначенными для ускорения обслуживания нейросетей. То же самое касается и быстрых NVMe-накопителей — с новыми процессорами можно получить довольно высокую плотность таких устройств.
На серверном рынке весьма важно обеспечение безопасности для всех клиентов, и тут AMD имеет явное преимущество перед конкурентом, в том числе если говорить о нашумевших угрозах Spectre, Meltdown, Foreshadow и прочих. Если первое поколение Epyc требовало обновления прошивки и поддержки защиты со стороны ОС, то второе поколение уже имеет в том числе и аппаратные элементы защиты от всех версий Spectre.
Важное обновление касается расширения возможностей шифрования оперативной памяти по алгоритму AES-128, которое практически не сказывается на производительности. Epyc 7002 имеет поддержку второго поколения технологии безопасной виртуализации Secure Encrypted Virtualization 2 (SEV2) и технологии шифрования памяти Secure Memory Encryption (SME). Для этого в чипы Epyc внедрен выделенный 32-битный микроконтроллер «AMD Secure Processor» в виде ARM Cortex-A5, который управляется собственной прошивкой и ОС и обеспечивает криптографическую функциональность.
Это выделенное ARM-ядро управляет криптографическими ключами и является невидимым для x86-ядер. При работе SME, позволяющей обезопаситься от атак неавторизованного доступа к памяти, вся память шифруется при помощи единого ключа прозрачно для пользовательских приложений, а технология SEV2 позволяет выбирать активный криптографический ключ для каждой виртуальной машины. Это используется для защиты виртуальных машин друг от друга, для чего используется отдельный криптографический ключ для главного гипервизора и по ключу для каждой виртуальной машины или их групп, изолируя гипервизор от гостевых виртуальных машин.
Поддержка этих технологий уже имеется в большом количестве серверных ОС, и отличие Epyc 7002 от первого поколения в значительно большем количестве поддерживаемых гостевых виртуальных машин (и одновременно используемых криптографических ключей, соответственно) — технология SEV2 обеспечивает шифрование для 509 уникальных виртуальных машин и совместима с существующей технологией виртуализации AMD-V. Особенностью реализации является прозрачность для аппаратных средств, обращающихся к памяти — все шифрование и дешифрование происходит на лету.
Интересно, что на возможностях серверных процессоров, связанных с обеспечением безопасности, сказалась активная работа AMD над заказными продуктами, включая решения для игровых консолей. Компания применяет опыт, полученный при разработке систем-на-чипе для игровых консолей, в том числе и при создании серверных процессоров. В частности, второе поколение Epyc стало более защищенными благодаря разработке чипов для игровых консолей Microsoft Xbox One и Sony PlayStation 4. Эти компании настояли, чтобы игры запускались в изолированном программном окружении, которое защищалось бы от пиратов при помощи аппаратного шифрования.
Линейка процессоров Epyc второго поколения
Самое время перейти к конкретным моделям новых процессоров. Главное, что их отличает друг от друга — разное количество вычислительных ядер. Так как в каждом из процессорных чиплетов содержится по восемь физических ядер, а CPU-чиплетов на чипе может быть до восьми, то в сумме на процессор приходится до 64 ядер. А в системе на основе двух сокетов их получится еще вдвое больше — до 128 ядер и до 256 потоков.
Подобная чиплетная компоновка позволяет гибко изменять число ядер на CPU, ведь всегда можно сделать конфигурацию с меньшим количеством чиплетов и меньшим количеством активных ядер в каждом чиплете. Компанией AMD было выпущено сразу несколько вариантов Epyc на основе 2, 4, 6 и 8 чиплетов по 8 ядер в каждом. Другие связанные с этим параметры меняются аналогично — объем кэш-памяти третьего уровня составляет по 32 МБ на чиплет, так как каждым четырем ядрам принадлежит блок объемом в 16 МБ, и даже если часть из этих ядер отключена, то объем L3-кэша остается полным.
Система наименований серверных процессоров AMD осталась неизменной с предыдущего поколения. Первая цифра 7 означает серию 7000, следующие две показывают относительное место по позиционированию и производительности (но напрямую не говорят об этом и не масштабируются в зависимости от производительности, например), а последняя означает поколение: 1 или 2. Также есть и дополнительный суффикс P, означающий принадлежность CPU к однопроцессорным — такие модели не работают в двухпроцессорных конфигурациях.
Итак, в целом AMD представила 19 новых серверных CPU, 13 из которых предназначены для двухпроцессорных конфигураций. Все эти процессоры отличаются лишь количеством вычислительных ядер, они имеют одинаковые характеристики по поддержке оперативной памяти (до 4 ТБ памяти стандарта DDR4-3200), а также по 128 полноскоростных линий PCIe 4.0, доступных для подключения внешних устройств.
Ядер / Потоков | Частота, ГГц | L3-кэш, МБ | TDP, Вт | Цена, $ | ||
---|---|---|---|---|---|---|
Базовая | Турбо | |||||
Epyc 7742 | 64/128 | 2,25 | 3,40 | 256 | 225 | 6950 |
Epyc 7702 | 64/128 | 2,00 | 3,35 | 256 | 200 | 6450 |
Epyc 7642 | 48/96 | 2,30 | 3,30 | 256 | 225 | 4775 |
Epyc 7552 | 48/96 | 2,20 | 3,30 | 192 | 200 | 4025 |
Epyc 7542 | 32/64 | 2,90 | 3,40 | 128 | 225 | 3400 |
Epyc 7502 | 32/64 | 2,50 | 3,35 | 128 | 180 | 2600 |
Epyc 7452 | 32/64 | 2,35 | 3,35 | 128 | 155 | 2025 |
Epyc 7402 | 24/48 | 2,80 | 3,35 | 128 | 180 | 1783 |
Epyc 7352 | 24/48 | 2,30 | 3,20 | 128 | 155 | 1350 |
Epyc 7302 | 16/32 | 3,00 | 3,30 | 128 | 155 | 978 |
Epyc 7282 | 16/32 | 2,80 | 3,20 | 64 | 120 | 650 |
Epyc 7272 | 12/24 | 2,90 | 3,20 | 64 | 120 | 625 |
Epyc 7262 | 8/16 | 3,20 | 3,40 | 128 | 155 | 575 |
Epyc 7252 | 8/16 | 3,10 | 3,20 | 64 | 120 | 475 |
Хотя топовая модель Epyc 7742 является самым дорогим решением компании AMD за все время, в целом можно сказать, что цены выставлены привлекательные — компания продолжает тренд выпуска продуктов, весьма выгодных по соотношению цены и производительности. И одним из самых удачных процессоров нам видится Epyc 7502, предлагающий 32 ядра, работающих на частоте 2,50—3,35 ГГц — всего лишь за $2600. По сравнению с Epyc 7601 за $4200 из первого поколения, новый процессор имеет столько же ядер, но он лучше во всем остальном: у него выше частота, более производительные ядра, больше кэш-памяти, лучше поддержка памяти и шины PCIe. При всем этом, новинка обойдется значительно дешевле.
То же самое можно увидеть и в других сегментах, а иногда преимущество даже заметнее: Epyc 7552 предлагает вдвое больше ядер при более высокой рабочей частоте, чем у Xeon Platinum 8260, а Epyc 7452 стоит дешевле, чем Xeon Gold 6242. Очень важно также и то, что в отличие от конкурента, AMD не урезала возможности дешевых процессоров. Даже самый дешевый 8-ядерный Epyc 7252 поддерживает до 4 ТБ памяти и имеет те же 128 линий PCIe 4.0 и все остальные технологии, так что на его основе можно сделать недорогие сервера с кучей подключенных к ним NVMe-накопителей, к примеру.
Что же касается однопроцессорных модификаций, которые могут быть выгоднее в определенных условиях, компания AMD предложила пять таких модификаций — они полностью соответствуют по возможностям своим двухпроцессорным аналогам, но стоят дешевле и имеют суффикс P в названии:
Ядер / Потоков | Частота, ГГц | L3-кэш, МБ | TDP, Вт | Цена, $ | ||
---|---|---|---|---|---|---|
Базовая | Турбо | |||||
Epyc 7702P | 64/128 | 2,00 | 3,35 | 256 | 200 | 4425 |
Epyc 7502P | 32/64 | 2,50 | 3,35 | 128 | 180 | 2300 |
Epyc 7402P | 24/48 | 2,80 | 3,35 | 128 | 180 | 1250 |
Epyc 7302P | 16/32 | 3,00 | 3,30 | 128 | 155 | 825 |
Epyc 7232P | 8/16 | 3,10 | 3,20 | 32 | 120 | 450 |
По характеристикам отлично видно, какой прирост в частоте AMD выжала из 7 нм техпроцесса. Так, все 16 ядер Epyc 7302P работают на частоте в 3 ГГц, тогда как для аналогичного Epyc 7351 она была ограничена значением 2,4 ГГц — при том же энергопотреблении в 155 Вт. И снова упомянем, что Epyc 7502P выглядит одним из самых выгодных решений, предлагая явные преимущества по сравнению с текущими двухпроцессорными системами, ведь у него высокая однопоточная производительность при 3,35 ГГц и относительно высокая частота для работы всех ядер — 2,5 ГГц.
При этом, по сравнению с аналогичными двухпроцессорными системами по общему количеству вычислительных ядер, такое решение обойдется дешевле в использовании и имеет более низкое энергопотребление в 200 Вт, а также поддерживает большой объем памяти (пусть даже в реальности это будет не 4 ТБ, а 1-2 ТБ из-за применения более распространенных модулей 64-128 ГБ) и предлагает богатые возможности по взаимодействию с внешними устройствами в виде 128 линий PCIe 4.0.
К слову, с совместимостью между платформами Epyc первого и второго поколения не все так просто, как хотелось бы. Хотя новинки используют действительно этот же процессорный разъем Socket P3, но на практике ставить новый CPU в старую платформу имеет не очень много смысла, так как и шина PCIe будет работать в режиме 3.0, и скорость памяти будет ограничена 2667 МГц, а при установке двух модулей на канал и того хуже — 1866—2400 МГц. Половина преимуществ потеряется.
Также есть еще один важный параметр в виде установленного значения энергопотребления — TDP. В линейке присутствуют процессоры с разными базовыми уровнями потребления (и тепловыделения), когда указана не одна величина, а дан диапазон. И, в зависимости от потребностей, можно настроить конкретный уровень потребления CPU, получив большее время работы на повышенных частотах при большем TDP, или наоборот — настроить процессор на лучшую энергоэффективность.
Хочется отметить, что за последние годы на рынке серверных процессоров не было таких мощных рывков. Epyc не просто предлагает схожее по однопоточной производительности решение, но с количеством ядер вдвое больше, чем у конкурентов. Вероятно, в AMD целились на конкуренцию со следующим поколением серверных процессоров Intel Xeon, а не с нынешним, поэтому результат и получился таким печальным для последних. По спецификациям новые Epyc весьма впечатляют — даже исходя из их «бумажных» характеристик можно уверенно сказать, что они действительно лидируют по производительности. Решения AMD имеют улучшенные вычислительные ядра, произведенные по наилучшему техпроцессу, да еще при большем их количестве.
Редко когда мы видели такие большие шаги вперед по всем фронтам. А ведь лишь несколько лет назад, во времена заката Opteron, у Intel были серверные процессоры вдвое-втрое производительнее, чем у AMD. Выход первого поколения Epyc вернул компанию на серверный рынок, те решения действительно были неплохими по соотношению цены и производительности, но уступали в задачах, в которых применялись операции с плавающей запятой (AVX). И вот теперь, во втором поколении AMD постаралась не просто исправить недостатки первого, но и стать лидером. Насколько хороши новинки в реальных применениях, не ограничивается ли дело теорией?
Оценка производительности
Еще по тестам настольных Ryzen мы знаем, что в синтетических тестах микроархитектура Zen 2 показала себя очень хорошо. Она обеспечивает прирост производительности вдвое в некоторых задачах (AVX2), хотя в редких случаях быстродействие и осталось на уровне Zen 1. Но в среднем, эффективность выполнения простых вычислений, хорошо распараллеливающихся и не слишком активно обращающихся к данным в оперативной памяти, для решений микроархитектуры Zen 2 не уступает по эффективности микроархитектуре Intel Skylake.
Неудивительно, что самые впечатляющие результаты новые Epyc показывают там, где используются операции с плавающей запятой, то есть AVX2, FMA3 и FMA4. Их исполнение в Zen 2 ускорилось вдвое, поэтому и результаты в таких тестах увеличились почти в два раза. С целочисленными вычислениями не было проблем и у первых Epyc, но их производительность в Zen 2 также немного подтянули — при помощи улучшений кэширования данных и декодирования инструкций. А вот там, где большую роль играет производительность подсистемы памяти (речь о задержках, а не пропускной способности), результаты не всегда однозначные. Но это, повторимся, касается в основном синтетических тестов.
Если говорить о производительности новых моделей Epyc 7002 по оценке самой компании AMD, то для начала нужно заметить, что исторически сложилась определенная временная динамика увеличения общей производительности по тестам SPECint, которая выглядит довольно плавной на графике:
Но так было ровно до появления второго поколения процессоров Epyc — резкий прирост количества ядер в новых процессорах привел к резкому скачку максимальной производительности и преимуществу над лучшим из имеющихся на рынке решением конкурента чуть ли не двукратному — причем, не в каком-то одном приложении, а сразу в нескольких разных тестах, в том числе целочисленном и с плавающей запятой:
Как видите, результаты серьезные. Даже если AMD где-то слегка преувеличила, подобные приросты впечатляют. Вполне естественно, что многие партнеры компании заинтересовались такими возможностями второго поколения их серверных CPU, ведь новинки позволят одновременно снизить стоимость обслуживания и повысить производительность в многочисленных задачах и применениях.
Судя по всему, это действительно так. В среднем, компания AMD оценивает преимущество над конкурентом где-то в 1,8-2,0 раза (есть задачи с 50% превосходства, но есть и удвоенная производительность) при сниженной совокупной стоимости владения на 25%-50%. Неудивительно, что многие партнеры компании сразу же выразили поддержку улучшенных процессоров Epyc и на словах и на деле.
В процессе длительной презентации второго поколения процессоров Epyc, на сцену выходили представители разных компаний. В частности, CTO компании HPE представил новые решения линейки ProLiant DL325, DL385 и Apollo 35, основанные на Epyc 7002 и доступные к заказу уже сейчас. Вместе со своими партнерами, компания AMD смогла побить большое количество мировых рекордов производительности в самых разных вычислительных сферах и номинациях.
Вышедшая на сцену директор из Twitter наглядно показала то преимущество, которое им обеспечили Epyc 7002. Об этом можно судить по голым цифрам: переход на новое поколение серверных CPU с текущей инфраструктуры (неназванной, но мы то понимаем!) позволил повысить количество вычислительных ядер на 40% (с 1240 ядер до 1792 ядер на стойку) при той же занимаемой площади, энергопотреблении и охлаждении. Да еще и совокупная стоимость владения снижается при этом на четверть.
Рассмотрим несколько более подробные данные о производительности имеющихся на рынке систем с двумя разъемами — по целочисленным тестам SPEC CPU 2017. Сравнение системы из пары процессоров AMD Epyc 7742 с парой Intel Xeon Platinum 8280L, показало почти двукратное преимущество новинок от AMD. Даже 32-ядерные модели линейки Epyc 7002 чуть быстрее лучших из конкурентов:
Компания уверяет, что их новые серверные решения побили более чем 80 рекордов производительности, среди которых четыре целочисленных бенчмарка и 11 тестов с плавающей запятой, шесть облачных приложений, 18 задач по анализу больших данных и так далее. А если брать Java-производительность, то преимущество самой мощной из серверных новинок AMD над конкурентом получается чуть меньше — порядка 70%-80%, что также весьма впечатляет.
Но что, собственно, означает эта повышенная производительность для клиентов? Может им не нужны системы быстрее, тогда они могут просто сэкономить на покупке и содержании процессоров. AMD дополнительно привела пример неназванного онлайн-ритейлера, который имел 60 серверов на двухсокетных Intel Xeon Platinum 8280 (по 56 ядер и 384 ГБ памяти на сервер), обеспечивающих требуемую производительность в 11 миллионов Java-операций в секунду. Переход на 33 двухсокетных сервера на базе Epyc 7742 (128 ядер и 1 ТБ памяти на сервер) позволил снизить количество серверов на 45%, уменьшив затраты на содержание примерно настолько же.
Подобные (весьма и весьма высокие) результаты по повышению производительности AMD приводит для очень разных задач, включая инженерные симуляции и структурный анализ, а также вычислительную гидродинамику — применения, весьма требовательные к мощности серверов:
В некоторых из задач заявлен прирост до 95% производительности, а иногда дело ограничивается скромными 58% (на самом деле это также весьма впечатляющий прирост). Многие крупные компании заинтересовались новинками, AMD объявила о сотрудничестве с компанией Cray, о которой не нужно дополнительно рассказывать. Их сотрудничество с Ок-Риджской лабораторией и министерством энергетики США заключается в создании мощнейшего суперкомпьютера Frontier, основанного на процессорах Epyc 7002.
Также Cray сотрудничает и с другими известными партнерами, в числе которых и команда Формулы 1 — Haas. Сотрудничество предполагает использование суперкомпьютера Cray CS500 на основе Epyc 7002 для задач вычислительной гидродинамики, которая все чаще применяется в Формуле 1 в качестве современной замены испытаниям моделей в аэродинамической трубе.
Немаловажно и снижение совокупной стоимости владения (TCO) при переходе на серверные процессоры Epyc второго поколения. По громкому заявлению компании AMD, новинки полностью изменяют экономику центров обработки данных (ЦОД). Особенно хорошо экономия заметна по односокетным системам, которые на 28% энергоэффективнее конкурирующих систем на базе Xeon Platinum 8280 и обеспечивают более высокую плотность размещения на серверную стойку.
Получается, что односокетный сервер на новых Epyc ничуть не хуже лучшего двухсокетного на Xeon (по целочисленной производительности и данным от AMD). Еще одним преимуществом может быть сниженная цена для ПО, стоимость которого оценивается по количеству разъемов (сокетов), а не ядер. Таких приложений не слишком много, и куда большее значение имеют богатые возможности Epyc 7002 по объему и пропускной способности памяти, а также количеству линий PCIe 4.0 — и в этом даже односокетный сервер от AMD не уступает двухсокетному конкуренту.
Иными словами, сервер с 2500 ядрами на основе двухсокетных Xeon с 8 ГБ памяти на ядро (виртуальную машину) может быть заменен вдвое меньшим количеством односокетных Epyc с теми же 2500 ядрами и 8 ГБ памяти на ядро. Они будут потреблять на 60% меньше энергии и могут снизить стоимость лицензий в случае расчета на количество сокетов (VMware vSphere Enterprise Plus). И общая совокупная стоимость владения, включая стоимость ПО, при этом снижается с $448 до $207 — на 54%.
Вообще, топовый 64-ядерный Epyc 7742 за $6950 (это немало, но посмотрите на цены конкурента) стоит почти вдвое дешевле, чем 28-ядерный Xeon Platinum 8280M, и при этом получается более чем вдвое быстрее последнего по показателю SPECrate 2017. Понятно, что по соотношению цены и скорости целочисленных вычислений он еще лучше — аж вчетверо!
Если говорить о других примерах конкуренции с Intel, то 16-ядерный Epyc 7282 с ценой в $650 соперничает на рынке с 8-ядерным Intel Xeon Silver 4215 за $794. Понятно, что в таких условиях процессор AMD вдвое быстрее по целочисленной производительности и в 2,5 раза лучше по соотношению цены к производительности. 2-ядерный Epyc 7452 за $2025 конкурирует с 12-ядерным Xeon Gold 6226 ($1776), и совершенно неудивительно, что по скорости и соотношению цена/производительность вдвое лучше получается именно новинка от AMD.
Как видите, на всех фронтах как минимум по целочисленной производительности налицо явное преимущество решений Epyc 7002. По соотношению цены и скорости вычислений новинки AMD примерно вдвое-вчетверо лучше решений конкурента — различных моделей Intel Xeon. Добавьте к этому лучшие возможности в виде большого количества линий PCIe 4.0 и заметно меньшую совокупную стоимость владения, и получится просто отличный продукт!
На практике процессоры Epyc лучше всего показывают себя в задачах чистой вычислительной производительности, вроде рендеринга. Так, пара топовых 64-ядерных Epyc 7742 показала близкий к рекордному результат в бенчмарке Cinebench R15, набрав более 11000 баллов. Практически такой же результат показан и на системе аж с четырьмя процессорами Intel Xeon Platinum 8180, но пара Epyc 7742 стоит $14000, а за четыре Platinum 8180 просят по официальным ценам уже $40000. Ну и энергии пара Epyc потребляет вдвое меньше. А в более современном тесте Cinebench R20 система на паре серверных флагманов от AMD установила абсолютный мировой рекорд, набрав 31833 балла.
Интересное сравнение сделали итальянские исследователи — система на лишь одном процессоре Epyc 7742 и парой ускорителей Radeon VII достигает той же производительности, что и японский суперкомпьютер NEC Earth-Simulator, введенный в эксплуатацию в 2002 году и остававшийся самым производительным до 2004 года — пиковая теоретическая равна 40,96 терафлопс, а достигнутая в Linpack — 35,86 терафлопс. Он использовал процессоры NEC с частотой 1 ГГц с общим количеством ядер в 5120 штук, а уровень энергопотребления был 3200 кВт. Современный же сервер на процессоре Epyc с парой мощных GPU потребляет на порядки меньше энергии, да и стоит явно дешевле, чем супер 15 лет назад. Понятно, что сравнение довольно условное, GPU не равны по возможностям CPU, но оно наглядно дает понять, как быстро развивается микроэлектроника.
Еще производительность серверных процессоров Epyc оценивалась в том числе в весьма популярном тесте Geekbench 4. Система из пары топовых процессоров Epyc 7742 с ценой в $13900 оказалась значительно быстрее четырех процессоров Intel Xeon Platinum 8180M, стоящих $52000. У Intel нет аналога топовому Epyc ни по цене, ни по количеству ядер, поэтому сравнивают примерно одинаковые по количеству ядер серверы на разных CPU. Четыре 28-ядерных Xeon Platinum 8180M (112 ядер и 224 потока) легко бьют лишь два Epyc 7742 (128 ядер и 256 потоков). Сервер AMD набрал в тесте Geekbench 4876 баллов в однопоточном тесте и 193554 балла в многопоточном, при том, что результат четырехпроцессорного сервера на Xeon (это был Dell PowerEdge R840) равен 4700 и 155050 баллов, соответственно.
То есть, даже по однопоточной производительности топовый Epyc оказался лучше, не говоря уже о большом количестве потоков. Разница может показаться не слишком большой, лишь до 25% в многопоточном тесте, но если учесть еще и стоимость CPU, то процессоры Epyc обходятся почти вчетверо дешевле процессоров Xeon, да еще и при большей производительности. И пусть бенчмарк Geekbench имеет не слишком много общего с большинством реальных задач, но в качестве синтетического теста для сравнения максимальной вычислительной производительности он вполне подходит.
Экосистема и поддержка индустрии
Экосистема AMD Epyc продолжает развиваться и расширяться благодаря более чем 60 партнерам, поддерживающим новое поколение процессоров сразу со дня анонса: это и производители вроде Gigabyte, и независимые поставщики Broadcom, Micron и Xilinx. Со стороны операционных систем поддержку оказывает компания Microsoft и несколько дистрибутивов Linux (Linux Canonical, RedHat и SUSE сотрудничали с AMD в рамках тестирования и сертификации). Сотрудничество со всеми этими компаниями помогло вдвое увеличить количество платформ, использующих процессоры Epyc второго поколения, по сравнению с первым.
В наше время никуда не деться без облачных сервисов, и компании, их предлагающие, вполне могут получить преимущество от новых Epyc. От Microsoft на мероприятии выступал глава подразделения Microsoft Azure Compute, который рассказал о новых решениях компании, использующих Epyc 7002 в виде виртуальных машин для высокопроизводительных вычислений и рабочих столов. В таких задачах, как дизайн микропроцессоров, вычислительная гидродинамика и метод конечных элементов, новые серверные процессоры показали прирост вычислительной скорости от 1,6 до 2,3 раз!
Список партнеров AMD, которые заинтересовались новинками и объявили поддержку процессоров Epyc второго поколения, довольно широк:
В рамках анонса новых Epyc, партнеры AMD объявили о сотрудничестве с компанией, связанном с применением процессоров Epyc 7002. Представитель компании Cray со сцены объявил о том, что метеорологическое агентство военно-воздушных сил США будет использовать систему Cray Shasta, использующую процессоры AMD Epyc второго поколения для предоставления информации о погодных условиях на планете и в космосе для ВВС и армии США.
Даже великая Google не устояла от соблазна, анонсировав не только Google Cloud на процессорах AMD Epyc, но и использование новых процессоров во внутренней инфраструктуре центров обработки данных компании, использующихся для собственных нужд. У компаний AMD и Google богатая история сотрудничества, их миллионный сервер в 2008 году был основан на чипе AMD, вот и в случае с Epyc 7002 они одними из первых используют самые современные платформы этой компании в своих центрах обработки данных.
Да и виртуальные машины, основанные на втором поколении Epyc, они также обещают запустить — с разной специализацией: сбалансированной по вычислительным ядрам и памяти для широкого круга задач, с высокой ПСП для специализированных вычислений вроде финансовых симуляций, прогнозирования погоды и т. д. Специалисты Google считают, что большинство задач, включающих офисные приложения и веб-серверы, получат лучшее соотношение цены и производительности именно на новых конфигурациях с Epyc 7002. Доступность таких виртуальных машин ожидается позднее в этом году.
Платформа Microsoft Azure также анонсировала новые виртуальные машины, предназначенные для рабочих нагрузок в области HPC, облачных удаленных рабочих столов и многофункциональных приложений — все на базе процессоров Epyc второго поколения. Предварительное ознакомление с такими приложениями доступно уже сейчас. Компании VMware и AMD объявили о сотрудничестве для обеспечения поддержки новых средств безопасности и других функций процессоров Epyc 7002 на платформе VMware vSphere.
Партнеры компании AMD, занимающиеся аппаратной частью, также показали на мероприятии готовые решения на основе новых Epyc второго поколения. Компании HPE и Lenovo анонсировали на мероприятии новые системы на базе представленных процессоров семейства Epyc 7002. Представитель Lenovo рассказал о новых платформах ThinkSystem SR655 и SR635, специально предназначенных для полного раскрытия потенциала Epyc 7002.
Эти системы являются идеальными решениями для использования в видео-инфраструктуре, виртуализации, программно-определяемых хранилищах данных и других применениях, в которых они показывают высокую энергоэффективность. Они стали доступными уже в августе, а вместе с AMD компания Lenovo побила 16 мировых рекордов производительности, включая самый энергоэффективный сервер (по тесту SPECpower_ssj 2008).
HPE также объявила о продолжении поддержки процессоров Epyc, в том числе широком ассортименте систем второго поколения, включая серверы HPE ProLiant DL385, HPE ProLiant DL325 Gen 10 и HPE Apollo 35, доступные со дня анонса. На мероприятии компания Dell показала новые оптимизированные для процессоров Epyc 7002 серверы, выпуск которых планируется в ближайшее время.
Еще несколько компаний представили вместе с анонсом новых Epyc свои продукты, основанные на платформе второго поколения, пусть уже и не со сцены. Компания Tyan показала сервер Transport SX TS65-B8036 формата 2U, подходящий для создания корпоративной системы хранения данных. Он имеет возможность установки одного процессора Epyc 7002, шестнадцати модулей памяти DDR4-3200 с установкой до 4 ТБ, поддержку двенадцати 3.5-дюймовых накопителей и четырех NVMe с фронтальным доступом, а также шесть слотов PCIe 4.0 x8.
Также была показана серверная системная плата Tomcat SX S8036 форм-фактора EATX, также предназначенная для одного процессора Epyc 7002 с потреблением до 225 Вт. Для установки оперативной памяти на ней есть шестнадцать разъемов DDR4-3200, восемь разъемов PCIe x8 SlimSAS, и по одному слоту PCIe x24 и PCIe x16. Можно задействовать до 20 подключений SATA, до 12 NVMe и пару M.2.
Представила новые продукты на основе платформы Epyc 7002 и компания ASRock Rack. Одним из новых решений стал сервер 2U4G-Epyc форм-фактора 2U, рассчитанный на установку одного процессора Epyc 7002. В этот сервер в качестве решения для высокопроизводительных вычислений можно установить четыре двухслотовых или восемь однослотовых ускорителей на основе GPU. Также анонсирован четырехузловой сервер высокой плотности формата 2U — 2U4N-F-ROME-M3. Каждый узел имеет по четыре 2,5-дюймовых отсека для накопителей SATA или NVMe, а также слоты PCIe x24 и PCIe x16 (почему-то указана версия 3.0, а не 4.0).
Была показана и пара серверных системных плат — первая из них ROMED8QM-2T, она предназначена для установки одного процессора Epyc 7002, имеет восемь слотов DDR-3200 для памяти, два 10-гигабитных сетевых порта, а также два слота PCIe 3.0 x16. Вторая модель ROMED8HM3 оптимизирована для многоузловых платформ, она также предлагает возможность установки одного Epyc 7002 и имеет восемь слотов DIMM, восемь портов SATA и пару M.2. Дополнительно на плате есть по одному разъему PCIe 4.0 x24 и PCIe 4.0 x16.
Не осталась в стороне и компания Asus, тоже представившая серверы и материнские платы, рассчитанные на установку процессоров AMD Epyc второго поколения. Они анонсировали двухпроцессорный стоечный сервер формата 2U — RS720A-E9-RS24-E. Он имеет 24 отсека для установки SATA и SAS накопителей и пары SSD M.2, семь полноразмерных слотов PCIe 3.0 x16, работающих на скорости x8 и один слот PCIe 3.0 x16 для низкопрофильной платы расширения.
Вторая новинка Asus — RS500A-E10-RS12-U. Это уже компактный 1U-сервер с возможностью установки одного процессора Epyc 7002 и 16 разъемов DDR4-3200 (до 2 ТБ памяти). Также в составе сервера предусмотрены 12 отсеков для накопителей NVMe, SATA, SAS и один M.2. Была представлена еще и серверная системная плата KRPA-U16 с 16 слотами DDR4-3200, поддержкой до 12 накопителей SATA и слотами PCIe в разных конфигурациях (PCIe4.0 x24, PCIe 4.0 x8, PCIe 3.0 x8, пара PCIe 3.0 x16).
Компания Supermicro показала новые серверы, в числе которых модель 1U-формата AS-1114S-WTRT, рассчитанная под различные задачи, вроде обработки баз данных. На плате есть один разъем для процессора Epyc второго поколения, а оперативной памяти DDR4 в восемь слотов можно установить до 2 ТБ. У платы есть пара 10-гигабитных сетевых контроллера и поддерживается установка до десяти 2,5-дюймовых накопителей и двух SSD формата М.2.
Кроме этого был анонсирован двухсокетный сервер AS-2124BT-HTR с поддержкой объема памяти до 4 ТБ и различными конфигурациями подсистемы хранения данных. Или односокетная модель AS-2014TP-HTR с одним процессором Epyc 7002 и поддержкой трех 3,5-дюймовых накопителей и одного SSD формата M.2.
Gigabyte также анонсировала целую линейку серверов для новой платформы Epyc 7002 — сразу 17 новых серверных платформ на этих процессорах. Они выпустили серверы общего назначения серии R, предлагаемые в форматах 1U и 2U. Также показали H242-Z11 — сервер формата 2U высокой плотности, допускающий установку четырех процессоров Epyc 7002 и отличающийся 32 разъемами для установки памяти, четырьмя 2,5-дюймовыми SSD-накопителями, восемью SSD M.2 и восемью низкопрофильными слотами PCIe x16.
Вторая представленная новинка — сервер G482-Z50, предназначенный для высокопроизводительных вычислений с ускорителями на основе GPU. Сервер позволяет установить пару процессоров Epyc 7002, 32 модуля памяти DDR4-3200 и до десяти графических ускорителей. Есть в нем и по два сетевых порта со скоростью в 10 гигабит и 1 гигабит. Также в систему может быть установлено до двенадцати 3,5-дюймовых накопителей SAS/SATA, восемь NVMe и два 2,5-дюймовых SSD-накопителя.
Заявлено, что серверы компании Gigabyte на новых процессорах Epyc второго поколения установили одиннадцать мировых рекордов производительности: 7 рекордов в тесте SPEC CPU 2017 и четыре в SPECjbb 2015. Рекорды Gigabyte превосходят не только показатели систем на основе других процессоров, но и показатели аналогичных систем на процессорах Epyc 7002 от конкурентов. Эти рекорды были установлены сервером RIG2-Z90 с двумя сокетами и односокетным сервером R272-Z30 — естественно, с установленными 64-ядерными процессорами топовой модели Epyc 7742.
В общем, поддержка со стороны партнеров AMD кажется довольно мощной — похоже, что они впечатлились возможностями новых Epyc 7002 и решили не просто попробовать эти решения в опытных образцах, но перевести на них как минимум часть своей инфраструктуры. Именно этого не хватало первому поколению Epyc, и есть большая надежда на то, что второе поколение действительно переломит ситуацию.
Кстати, а где новые Threadripper?
А что же с Ryzen Threadripper — процессорами, аналогичными Epyc с аппаратной точки зрения, но предназначенными для ниши высокопроизводительных настольных ПК? Будет ли выпущено очередное поколение с увеличенным количеством ядер, основанное на более удачной чиплетной компоновке? Официально глава AMD пообещала раскрыть подробности о новом поколении Threadripper до конца года, а из утечек известно, что такие решения давно тестируются как внутри компании, так и вне ее. В том числе проходил испытания 32-ядерный процессор с рабочей частотой в 3,6 ГГц, который в тестах опережал лучшую модель предыдущего поколения. Так что у почитателей Threadripper есть веские причины ждать новые CPU.
Компания AMD действительно готовится вскоре вывести на рынок новые процессоры Ryzen Threadripper третьего поколения, производные от Epyc Rome, которые могут иметь до 64 ядер, поддерживают восьмиканальную шину памяти и 128 линий PCIe 4.0. Впрочем, для HEDT-платформы могут изменить чиплет ввода-вывода, упростив решение для энтузиастов, оставив более функциональный вариант для конкуренции с процессорами Xeon W. Ведь для процессоров, ориентированных на энтузиастов и игроков, будет вполне достаточно и четырех каналов памяти и 64 линий PCIe 4.0, а вот линейке для рабочих станций могут понадобиться и более многофункциональные решения с поддержкой восьмиканального режима и 128 линиями PCIe 4.0. Похоже, что старшая версия процессоров Threadripper 3000 будет еще ближе к серверным процессорам Epyc.
Для поддержки третьего поколения HEDT-процессоров компании AMD, будет предлагаться три новых чипсета: TRX40, TRX80 и WRX80. TRX40 аналогичен X570, но с поддержкой четырехканальной памяти, а TRX80 и WRX80 используют полный набор ввода/вывода с восьмиканальной памятью и большим количеством линий PCIe. Многие компании уже практически готовы к выпуску системных плат на основе новых чипсетов, в частности у Asus подготовлены такие решения, как Prime TRX40-Pro и ROG Strix TRX40-E Gaming.
Главный вопрос заключается в том, когда именно AMD анонсирует серию Ryzen Threadripper 3000. Многие ожидают, что это произойдет 7 числа какого-то месяца, так как для AMD в этом году эта цифра очень примечательна, ибо перекликается с используемым 7 нм техпроцессом. Radeon VII выпустили 7 февраля, Ryzen 3000 и Radeon RX 5700 — 7 июля, Epyc 7002 — 7 августа, а новые Threadripper выйдут... пока что неизвестно когда. 7 сентября, когда проходила выставка IFA 2019 в Берлине, они не вышли и может быть их анонсируют еще одним-двумя месяцем позже — например, 7 ноября.
Что касается производительности будущих Threadripper, то тут есть чего ожидать. Совсем недавно в бенчмарке Geekbench 4 появились данные о не анонсированном 32-ядерном процессоре Ryzen Threadripper третьего поколения (кодовое имя Sharkstooth). Это еще инженерный образец с 32 ядрами и 64 потоками, а также с 128 МБ L3-кэша. В тесте Geekbench этот CPU оказался наиболее производительным среди HEDT-систем, набрав 5523 баллов в однопоточном и 68576 баллов в многопоточном режимах.
Сравните этот результат с 4800 и 36000 баллами для Ryzen Threadripper 2990WX и 5148 и 38000 баллами у Intel Xeon W-3175X. Мало того, в Windows-версии наблюдались какие-то проблемы с многопоточной частью теста, и на Linux результат был еще выше — аж 94772! Таким образом, еще не вышедший CPU от AMD показывает весьма впечатляющие результаты, и при не слишком задранной цене позволит компании потеснить продукцию Intel и в высокопроизводительных настольных системах.
Правда, у Intel уже зреет хоть и условный, но все же ответ. Длительное время Xeon W-3175X оставался единственным предложением HEDT на базе LGA 3647, но похоже, что скоро положение изменится. Судя по некоторым слухам, на рынке появится аналогичный 26-ядерный CPU с тактовой частотой до 4,1 ГГц. Также компания Intel может снизить цены на Xeon W-3175X, чтобы увеличить его привлекательность.
AMD показывает на своей странице в Twitter, как процессоры Ryzen Threadripper помогают в реальных задачах. Они опубликовали видеоролик о студии TourGigs, которая специализируется на видеосъемках музыкальных выступлений. Сейчас им все чаще приходится обслуживать прямые интернет-трансляции концертов, и системы на основе процессоров Ryzen Threadripper очень в этом деле помогают, обеспечивая необходимой вычислительной мощностью кодирование видеоданных. По словам представителей TourGigs, они используют Ryzen Threadripper 2950WX и 2990WX, и даже Threadripper второго поколения справляется с одновременной трансляцией нескольких потоков в разрешении 4K. Также сильно сокращается время, необходимое на копирование и обработку отснятого материала. Наверняка они очень заинтересованы в третьем поколении таких процессоров.
А пока такие процессоры нового поколения еще даже не анонсировали, компания Velocity Micro выпустила новые рабочие станции на основе серверных Epyc 7002 — в одно- и двухсокетной конфигурации, в том числе модели с 128 вычислительными ядрами, но в привычном десктопном форм-факторе. Эти системы являются одними из наиболее мощных рабочих станций в мире, особенно если мощь Epyc в них объединена с производительностью пары Nvidia Quadro RTX или AMD Radeon Pro. Чисто по процессорной производительности в операциях с плавающей запятой эти решения до четырех раз быстрее рабочих станций на Epyc первого поколения.
Рабочая станция ProMagix HD360A специализируется на многопоточных CPU-интенсивных задачах, для чего предполагает установку пары новых процессоров Epyc 7002, поддерживая до 128 ядер и 256 вычислительных потоков. Стоимость таких рабочих станций получается не самая гуманная (см. скриншот выше), конечно, но они будут востребованы среди инженеров, художников, дизайнеров, ученых, видеомонтажеров и так далее — всех тех, кому важно максимальное количество CPU-ядер для самых сложных вычислений.
Рыночные перспективы и выводы
Итак, процессоры Epyc второго поколения обеспечивают высокую производительность при весьма конкурентоспособной стоимости владения, оптимизируя рентабельность в корпоративных приложениях, виртуализации, облачных и высокопроизводительных вычислениях. Epyc 7002 предлагают уникальное сочетание рекордной производительности, наибольший объем памяти и высочайшую пропускную способность ввода-вывода. Все это способствует достижению максимально возможной производительности в высокопроизводительных вычислениях, а передовые технологии повышения безопасности обеспечивают защиту от различных атак на аппаратном уровне.
Главные отличия и преимущества новых моделей — применение улучшенных вычислительных ядер архитектуры Zen 2, чиплетная компоновка, позволившая повысить количество вычислительных блоков, а также применение самой продвинутой на сегодня технологии микроэлектронного производства — 7 нм. Тесное сотрудничество AMD с тайваньским контрактным производителем TSMC помогло существенно повысить производительность и снизить энергопотребление новых CPU. Конкурент производит чипы на собственных фабриках и вот уже несколько лет испытывает проблемы с освоением 10 нм техпроцесса, поставки первых продуктов на основе которого запланированы лишь на следующий год, а AMD старается воспользоваться неожиданным преимуществом, привлекая ряд крупных клиентов, ранее преданных продукции Intel.
В результате, у AMD получились решения с действительно рекордной производительностью и прорывной компоновкой, имеющие низкую цену и совокупную стоимость владения — компания подняла планку на невиданный уровень. Топовый процессор новой линейки Epyc содержит сразу 64 ядра, способных обсчитывать 128 вычислительных потока одновременно. При этом, их рабочая частота и количество исполняемых инструкций за такт достаточно велики, чтобы практически во всех условиях стать наиболее производительным x86-совместимым процессором! Когда такое было, что конкурирующая с ними компания Intel упускала соперника настолько далеко? Более того, у новых моделей Epyc 7002 есть и функциональные преимущества, такие как поддержка большого количества каналов PCI Express 4.0 на процессор, а также стандарта памяти DDR4-3200. А если кому-то и этого мало, то новые CPU предлагают продвинутые возможности по обеспечению безопасности в виде выделенного ARM-сопроцессора.
Удвоенное количество вычислительных ядер и удвоенная ПСП памяти, по сравнению с первым поколением Epyc, приводит к почти линейному приросту производительности в большом количестве серверных задач, и появление 64-ядерных процессоров на один разъем трудно переоценить. Задачи и запросы клиентов постоянно усложняются, а также появляются новые применения для вычислительных систем. И 64-ядерные процессоры Epyc 7002 имеют значительно большую производительность, чем конкурирующие с ними по цене Xeon. Хотя процессоры Intel поддерживают и большее количество разъемов, но односокетные системы на Epyc 7002 они вряд ли побьют. А для более требовательных применений у AMD есть решения, предназначенные для систем с двумя процессорными разъемами, имеющие преимущество не только по количеству ядер, но и по пропускной способности памяти и по объему кэш-памяти, весьма важной для некоторых задач.
Топовый серверный процессор Epyc 7742 при рендеринге в пакете Blender обеспечивает более чем на 70% большую производительность в наборе из тестов с различной масштабируемостью по количеству ядер, по сравнению с предыдущим флагманом в виде Epyc 7601, а в двухпроцессорной конфигурации пара Epyc 7742 почти на 60% быстрее своих предшественников в виде двух Epyc 7601. Если же брать сравнимые по количеству ядер процессоры Epyc двух поколений, то две 32-ядерные модели 7502 превосходят пару Epyc 7601 из первого поколения на 30%-40%, в зависимости от конфигурации (одно- или двухсокетной).
Если сравнивать с Intel Xeon с учетом цен, то ситуация становится еще интереснее. С нынешними ценами на процессоры конкурента, решения AMD явно доминируют, особенно если брать в расчет соотношение цены и производительности. Один Epyc 7742 с ценой в $6950 или пара Epyc 7502 за $5200 чуть опережают Intel Xeon Platinum 8280, стоящий около $10000. Процессоры семейства Epyc 7002 явно быстрее аналогичных решений Intel, особенно если речь идет о применениях вроде рендер-ферм, в которых новые серверные процессоры AMD опережают Xeon Platinum 8280 с большим запасом, да еще при меньшей цене.
Можно возразить, что потребление энергии процессорами Epyc 7002 несколько выше, чем у Intel Cascade Lake, но ведь и производительность у решений AMD тоже выше. И именно по энергоэффективности во втором поколении Epyc произошла очень большая прибавка, что неудивительно, учитывая применяемый 7 нм техпроцесс и улучшенную архитектуру Zen 2. В то время как конкурент продолжает страдать от проблем с освоением 10 нм производства. Сочетание успеха AMD и неудач Intel привели к тому, что линейка Epyc 7002 выглядит просто фантастически выгодной.
Их сравнение с лучшими из доступных на сегодня Intel Xeon выглядит как избиение младенца. Особенно в тех задачах, где очень важно именно количество ядер, в которых и топовый Epyc 7742 и 32-ядерные (да и другие младшие) модели могут быть весьма выгодными. Но это время не будет длиться вечно. Для реального давления на Intel у компании AMD есть порядка года, а потом у первой появятся новые решения, которые они уже поспешили анонсировать. Процессоры Cooper Lake могут удержать часть партнеров от перехода на AMD просто потому, что серверный рынок очень консервативен и инертен. И важнейшей задачей для AMD сейчас является выстраивание экосистемы, перенос ПО и его адаптация. Естественно, что с такой мощной аппаратной поддержкой интерес от потенциальных потребителей к Epyc второго поколения сильно вырос.
Аналитики прогнозируют увеличение доли рынка серверных процессоров AMD до 25% в ближайший десяток лет. Казалось бы, что этого слишком долго ждать, но это нормально для консервативного рынка корпоративных клиентов, ведь они долго «раскачиваются». AMD конкурирует с Intel за поставку чипов для ЦОД облачных сервисов, и они уже смогли привлечь Google и Twitter в качестве клиентов для новых процессоров Epyc. Причем, компания Google не просто использует процессоры Epyc второго поколения в своих ЦОД, но и вскоре предложит их сторонним разработчикам в качестве услуги по аренде облачных вычислений. Крупные клиенты AMD, включая Microsoft, Twitter, Google, HPE и Amazon, особо отметили возможность значительного снижения эксплуатационных расходов на содержание серверов на базе Epyc 7002 — до 25%-50%, по сравнению с решениями конкурента.
Да, Intel все еще остается основным поставщиком серверных процессоров, и продолжает доминировать, контролируя более 90% рынка, но AMD явно наступает, благодаря успешности серверных процессоров Epyc обоих поколений. И если доля серверного рынка у компании AMD в первом квартале текущего года была менее 3%, то во втором квартале она выросла до 5%. Но Intel пока что имеет настолько сильные позиции, что серьезно потеснить ее в ближайшее время не получится, нужны годы на постепенное увеличение своей доли рынка. Не нужно забывать и об экономических возможностях Intel — они могут временно поступиться высокой прибылью, заинтересовав партнеров скидками на оборудование и сервис. И даже при всех прелестях Epyc 7002 по цене и производительности, рынок просто не способен быстро перестроиться на решения другого поставщика.
Все это в AMD хорошо понимают, и уже на мероприятии по запуску Epyc 7002 представители компании рассказали о том, что они уже закончили проектирование следующего поколения серверных процессоров с кодовым именем «Milan», использующих ядра микроархитектуры Zen 3 и улучшенную технологию производства 7нм+ (по всей вероятности, использующую EUV-литографию), и сейчас работают уже над следующим поколением «Genoa» с ядрами Zen 4, о котором пока что мало что известно. Неплохая заявка на продолжение выпуска отличных серверных процессоров с преимуществами над конкурентом — индустрия и инвесторы любят, когда есть четкие планы. Есть шанс, что постепенно вода все-таки будет точить камень в виде консервативности рынка.
Конечно же, все не бросятся резко менять Xeon на Epyc. Рынок очень инерционный, и резких движений тут не делают. Тем более важно то, что AMD не только уже выпустила пару удачных поколений своих серверных процессоров, но и раскрыла планы на много лет вперед. Партнеры должны чувствовать, что выпуск новых решений, а также их поддержка не закончится в следующем году, и их инвестиции в Epyc в долгосрочной перспективе окупятся. Репутация в столь серьезном деле набирается не один год, и AMD пусть уже и не в начале своего пути, но еще и не на одном уровне с конкурентами.
Также не забываем, что конкурент все-таки анонсировал хоть и довольно условный, но все же ответ на Epyc в виде новых Xeon Platinum 9200. Это процессоры семейства Cooper Lake в формате LGA, включающие до 56 ядер, в отличие от 28-ядерных Cascade Lake-SP из серии Xeon Platinum 8200. Также системы на новых процессорах Cooper Lake получат более высокую пропускную способность памяти и будут поддерживать средства ускорения алгоритмов искусственного интеллекта. А вот выйдут новые CPU от Intel лишь в первом квартале следующего года.
Основой этих процессоров будут модели серии Intel Xeon Platinum 9200, анонсированные в апреле и доступные только в составе готовых систем. Например, процессор Intel Xeon Platinum 9282 с 56 ядрами и поддержкой 112 потоков, с базовой частотой в 2,6 ГГц и турбо-частотой в 3,8 ГГц. Процессор имеет кэш-память второго уровня объемом 77 МБ, поддерживает 40 линий PCIe и 12 каналов DDR4-2933. Проблема этих решений в том, что они выполнены по техпроцессу 14 нм и поэтому имеют высокое энергопотребление до 400 Вт. Epyc 7002 выглядит неплохо и на их фоне, а ведь даже еще непонятно, сколько новинки Intel будут стоить, учитывая, что Xeon Platinum 8280 стоит $10000.
В свете всего вышесказанного, рост доли AMD должен серьезно ускориться с выходом Epyc Rome, так как они серьезно опережают конкурирующие с ними Xeon по большинству важных параметров. Некоторые индустриальные аналитики прогнозируют скорый рост доли AMD аж до 15% к концу следующего года. Будем наблюдать за изменениями, ведь выход новых Epyc должен начать влиять на долю уже в следующем квартале, хотя AMD пока что еще в самом начале производства столь сложных чипов, и должна по-настоящему разогнаться чуть позже.
Подводя итог, в очередной раз отметим, что в своих новых серверных процессорах AMD предлагает в 1,5-2 раза большую многопоточную производительность, по сравнению с Xeon. А среди серверных решений нижнего ценового диапазона, да еще и односокетных моделей, конкуренции у некоторых Epyc нет вообще, они сильно быстрее и дешевле аналогов от Intel, да еще и предлагают больше возможностей по установке системной памяти и подключаемых по PCIe устройств. За смешные деньги по меркам этого рынка вы можете получить большое количество вычислительных ядер, практически не уступающих конкурирующим в однопоточной производительности.
Похоже, что чисто с технической точки зрения, AMD побила Intel на серверном рынке с большим преимуществом. Задачи, в которых новые Epyc уступают Xeon, весьма редки, а если учитывать разницу в стоимости, то найти их будет еще сложнее. Пока не готовы новые решения Intel, у них остается, по сути, один путь конкуренции — снижение цен на решения для самых важных клиентов. Им придется ждать появления 56-ядерной серии Xeon Platinum 9200, стиснув зубы. Да и то — 14-нанометровый Cooper Lake будет доступен избранным партнерам, и его цену публике вряд ли назовут. Если же говорить о еще более далекой перспективе в виде микроархитектуры Ice Lake, которая обещает прирост одноядерной производительности на 18%, восемь контроллеров памяти и 10 нм техпроцесс, то первые решения обещают еще позже — уже во второй половине 2020 года.
Так что поздравим компанию AMD с шикарными продуктами и очень серьезным ударом по позициям конкурента и в серверном сегменте. 64-ядерные чипы Epyc со всеми их возможностями предлагают такой скачок по производительности и функциональности, равных которому не было, возможно, вообще никогда ранее. Конечно, у решений Intel есть свои плюсы, такие как тесная интеграция с различными акселераторами и энергонезависимой памятью Intel Optane DC, но все это вещи сравнительно второстепенные. Так что главная задача Intel в ближайшее время — как-то удержать имеющихся и потенциальных партнеров от того, чтобы они обратили свое внимание на процессоры Epyc и начали инвестировать в эту платформу.
А AMD, в свою очередь, постарается убедить потенциальных клиентов сделать такой переход. Они довольно хитро действуют еще с первого поколения Epyc, сосредоточив усилия на продвижении своих решений для крупных поставщиков облачных услуг, снижая расходы на продвижение. Компания Intel имеет доминирующие позиции в ЦОД и прочные отношения с крупными производителями оборудования, но AMD старается перехватить инициативу. И так как отрасль давно нуждается в реальной конкуренции в том числе для сдерживания цен, то Epyc 7002 вполне может оправдать все ожидания, и добиться немалого успеха.
Новые процессоры AMD меняют серверную экосистему, предлагая производительность в односокетной конфигурации, достаточную для большинства нужд. Один процессор не означает каких-либо компромиссов по количеству вычислительных ядер, производительности и объему памяти, а также системам ввода-вывода. На основе единственного процессора Epyc 7002 можно создать высокоэффективный сервер со сниженной совокупной стоимостью владения. А если этого не хватает, то Epyc поддерживает и двухсокетные конфигурации с еще большим количеством CPU-ядер. Если это еще не эпическая победа, то очень сильная заявка на нее. Хотя и Intel еще рано списывать со счетов. В общем, борьба будет жаркой, и она только начинается.