Продолжаем серию тестов китайских процессоров. Все мы привыкли к настольным ПК и ноутбукам с процессорами Intel и AMD на основе архитектуры x86, но события последних лет с введением санкционных ограничений увеличили интерес и к менее распространенным процессорам, в том числе на основе других вычислительных архитектур, вроде рассмотренного в прошлый раз Loongson 3A6000. Не только китайские процессоры входят в зону наших интересов, существуют и ARM-процессоры для легких ПК и ноутбуков в исполнении Qualcomm, в том числе и под управлением операционной системы Windows 11 в специальной ARM-версии. Их мы еще рассмотрим при случае, а сегодня в обзоре тоже ARM, но китайской Huawei — Kirin 9000C. К слову, у китайцев на основе ARM есть еще и Phytium, и это решение также есть в наших планах.

Причин более широкого распространения процессоров с отличными от x86(-64) архитектурами сразу несколько, тут и сама ARM постепенно доросла до возможностей и мощностей, требуемых для создания полноценных настольных ПК и мощных мобильных решений, но также важно и то, что многие компании, включая китайские, в последние годы серьезно продвинулись в разработке и выпуске собственной микроэлектроники, включая универсальные и графические процессоры. Китай давно вкладывает значительные средства в собственные компании по проектированию и производству процессоров, приоритетом для них является снижение зависимости от западных полупроводников и достижение полной технологической самодостаточности — во многом из-за наложенных США санкций, запрещающих не только продажу некоторых западных микрочипов, но и запрет на передачу технологий их производства и даже само производство на фабриках главного микроэлектронного производства всего мира — тайваньской компании TSMC.
Мы уже многократно писали об этом, сейчас китайским компаниям попросту запрещен доступ к новейшим западным технологиям, что не просто замедлило разработку и производство их собственных микрочипов, но и отбросило их на несколько лет назад. Ведь даже чтобы просто повторить свои досанкционные процессоры, производимые тогда еще на мощностях TSMC, китайцам нужно освоить полупроводниковое производство со схожими параметрами, а это очень непросто. Хотя Китай находит альтернативные варианты развития технологий, инвестируя в собственные фабрики по производству микроэлектроники, они всё еще далеки по возможностям от лидеров мировой индустрии на данный момент. Тем не менее, китайское правительство постепенно заменяет процессоры Intel и AMD отечественными аналогами — хотя бы в государственных учреждениях и телекоммуникационной инфраструктуре. Компьютеры на основе китайских процессоров не только используют собственное аппаратное обеспечение, но и работают под управлением отечественных операционных систем, основанных на Linux.
Сегодня мы рассмотрим решение известной компании Huawei, предназначенное для настольных ПК — процессор Kirin 9000C. Точнее, даже однокристальную систему, так как чип содержит в себе практически всё для работы полноценного компьютера. Компания широко известна и по смартфонам и по компьютерам, но еще больше ее знают, как одну из крупнейших мировых компаний в сфере телекоммуникаций. Они давно проектируют и производят однокристальные системы на основе архитектуры ARM для своих решений, этим занимается дочерняя компания HiSilicon Technologies. Также они известны тем, что одними из первых в Китае попали под санкции США, ограничивающие доступ к западным рынкам и технологиям — это решение нанесло огромный ущерб доходам компании и разработкам. Если досанкционные ARM-процессоры Huawei для мобильных решений были одними из лучших в индустрии, они разрабатывали и собственные процессорные ядра для своих решений, включая серверные ARM-процессоры, то запрет использования производства TSMC привел к необходимости всё переделать под возможности техпроцессов китайской компании SMIC, которые пока что серьезно уступают по всем характеристикам.

К сожалению, Huawei закрыла публичный доступ к информации о своих решениях, и официальных данных по Kirin 9000C нет, этого решения нет на страницах веб-сайта компании вообще. Поэтому приходится основываться на выборочных знаниях о схожем процессоре Kirin 9000S, предполагая, что они близки друг к другу по своему внутреннему строению. Kirin 9000S производится на втором поколении 7-нанометрового производства китайской SMIC, имеет восемь ARM-ядер с поддержкой 12 потоков: одно супербыстрое ядро Taishan, три высокопроизводительных Taishan и еще четыре энергоэффективных ядра ARM Cortex-A510 в двух двухъядерных кластерах. Между 9000S и 9000C есть отличия по частоте суперъядра, в первом случае оно чуть быстрее, а во втором ограничено частотой 2,5 ГГц. Обе однокристальную системы отстают по производительности от выпущенного компанией ранее чипа Kirin 9000, для производства которого использовался более продвинутый 5-нанометровый техпроцесс тайваньской TSMC. Это явный шаг назад для компании, которая выпустила Kirin 9000 в 2020 году и использовала его в смартфонах и планшетах, а Kirin 9000S вышел только в 2023 году и использовался в смартфонах серии Huawei Mate 60 Pro и некоторых планшетах.
Так что Huawei потеряла около трех лет, если считать 9000 и 9000C/9000S примерно схожими по возможностям и производительности. Возможно, Kirin 9000C также отличается от Kirin 9000S отсутствием в этой однокристальной системе модемной части, ведь 5G-модем отъедает большую часть площади кристалла, но вряд ли Huawei сделала специальный кристалл исключительно для настольных ПК — скорее всего, модем в чипе просто отключили. Ну а самое интересное для нас то, что в новых SoC используются процессорные ядра Taishan, основанные не на решениях компании ARM, это собственный дизайн вычислительных ядер самой Huawei. Вероятно, основанный на их серверных ядрах Kunpeng. Ядра выделяются среди всех ARM тем, что поддерживают одновременную многопоточность — впервые для мобильных ARM-процессоров. Давайте разберемся во всем подробнее, насколько это вообще получится при полном отсутствии официальной информации.
Особенности процессора Kirin 9000C
Компания Huawei слегка запутала всех своей линейкой процессоров Kirin серии 9000, выпустив после исходного чипа сначала подверсии с суффиксами S, C и W, которые почти ничего общего с оригинальным Kirin 9000 не имели, а затем продолжили линейку моделями SoC, вплоть до 9010 и 9020. Сначала всё было логично, флагманская модель Kirin 9000 была анонсирована в далеком октябре 2020 года, она производилась на TSMC и на ней были основаны такие смартфоны как Mate 40 Pro, P50 Pro и Mate X2, а также планшет MatePad Pro 12.6. Но после того как американцы запретили китайцам использовать тайваньские мощности TSMC, нужно было делать уже что-то радикально иное, и такие процессоры сделали, зачем-то назвав их в том же духе: Kirin 9000S, 9000C и 9000W. И они на Kirin 9000 во многом не похожи, эти процессоры семейства произведены уже китайской компанией SMIC и отличаются от оригинального SoC далеко не только этим.
Напомним, оригинальный Kirin 9000 содержал одно ядро Cortex-A77 (3,13 ГГц), три Cortex-A77 (2,54 ГГц) и четыре Cortex-A55 (2,05 ГГц), интегрированное графическое ядро Mali-G78 MP24 (1536 ALU, 759 МГц, 2332 гигафлопс), NPU и ISP-ядра и производился по 5-нанометровой технологии тайваньской TSMC. Этой однокристальной системой поддерживается память LPDDR5/4X, а объем системного кэша равен 8 МБ. О новых же чипах той же серии Huawei не раскрывает вообще никакой информации — всё приходится добывать по крупицам из анализа других материалов, данных бенчмарков и прочих инструментов. Включая китайские источники, просмотр, чтение и анализ которых не так просты из-за особенностей языка и сложностей перевода. Так что в наших предположениях и допущениях вполне могут быть неточности.
Новые процессоры серии Kirin 9000 с суффиксами S и С также содержат по восемь ядер, но количество поддерживаемых ими потоков другое, так как производительные ядра имеют уже не дизайн ARM, а собственные разработки Huawei — предположительно, ядра Taishan V120. Точнее, кластер с энергосберегающими ядрами содержит четыре ARM Cortex-A510, работающих на частоте до 1,53 ГГц, а остальные используют собственный дизайн Huawei. Производство этих чипов налажено у китайской SMIC, которая не без труда наладила массовое 7-нанометровое производство с необходимыми характеристиками. Вероятно, выход годных кристаллов у них на данной стадии невелик, и Huawei не выкидывает бракованные кристаллы, не подходящие для топовых устройств, а урезает их возможности, ограничивая частоту, отключая часть ядер и какие-то другие блоки. Из больших кристаллов таким образом получаются упрощенные версии для смартфонов среднеценовой категории.

Есть большая вероятность, что Kirin 9000C очень похож на Kirin 9000S, и о нем мы знаем чуть больше — он используется в серии смартфонов Mate 60 (выпуска 2023 года), а также в Mate X5 и версиях планшетов MatePad Pro 11 2024 и MatePad Pro 13.2. Схема ядер в нем схожа с тем, что было в Kirin 9000: суперъядро Taishan V120 (2,62 ГГц) + 3 больших ядра Taishan V120 (2,15 ГГц) + 4 малых ядра Cortex-A510 (1,53 ГГц). Затем появился Kirin 9000S1 — в серии смартфонов Huawei Pura 70, вышедшей в начале 2024 года, Kirin 9000W в планшетах MatePad Pro 13.2 и MatePad Pro 11 (2024), а также Kirin 9000WL и Kirin 9000WE в планшете MatePad 11.5″ S.
Всё это почти одинаковые решения, отличающиеся отключенной модемной частью (вероятно, W указывает на Wi-Fi) и чем-то еще. А от модели 9000S все они отличаются лишь сниженной до 2,49 ГГц частотой суперъядра. Возможно, урезан также и кэш или еще какие-то блоки, об этом нет никакой информации. Также были выпущены процессоры 9000SL в Nova 12 Ultra и 8000 в Nova 12/Pro — у этих модификаций снижены частоты и/или отключены ядра. Таким образом, Huawei использует отбраковку больших кристаллов 9000S в недорогих смартфонах, а не менее сложные чипы, спроектированные и произведенные специально для менее дорогого сегмента.
А вот анонсированный еще позднее Kirin 9010 уже имеет отличия в самих ядрах, там уже используются Taishan V121 с увеличенным количеством некоторых внутренних блоков, кэшей и очередей по сравнению с Taishan V120. Усложнение ядра привело к снижению его частоты, и для чуть улучшенного суперъядра в Kirin 9010 она ограничена еще сильнее — уже на уровне 2,35 ГГц. Если пойти еще чуть дальше, то по-настоящему заметное улучшение произошло уже в больших ядрах совсем свежего Kirin 9020, анонсированного в ноябре 2024 года — его суперъядро работает на частоте 2,50 ГГц и имеет более широкий декодер (8-wide против 6-wide), вдвое больше FP-блоков, а также большее количество многих других блоков и буферов вычислительного ядра. Кроме этого, в этом SoC даже самые маленькие ядра заменены решениями собственного дизайна, а не взятыми у ARM. Но не будем забегать вперед, сегодня мы исследуем Kirin 9000C годичной давности, который, скорее всего, схож со столь же устаревшим Kirin 9000S, поэтому мы рассматриваем их возможности.

Так что имеем схему ядер Kirin 9000C в таком виде: суперъядро Taishan V120 (2,49 ГГц), 3 больших ядра Taishan V120 (2,15 ГГц) и 4 малых ядра Cortex-A510 (1,53 ГГц). Что касается кэш-памяти, то L2-кэша у средних ядер Taishan по 512 КБ, у суперъядра его уже 1 МБ, также есть по 256 КБ на каждую пару Cortex-A510, а кэша третьего уровня в чипе всего 4 МБ. Есть еще и общий системный кэш (SLC — System Level Cache) для доступа к данным от CPU и GPU ядер объемом в 4 МБ.
Судя по оценкам производительности Kirin 9000S в смартфонах и планшетах, большое суперъядро близко по производительности к Cortex-X1, но оно потребляет больше энергии и менее энергоэффективно по понятным причинам. Ядра средней мощности слегка уступают не самым новым Cortex-A710 из Snapdragon 8 Gen 1, а маленькие ядра Cortex-A510 близки к аналогичным ядрам из этого же SoC компании Qualcomm, которое было анонсировано еще в конце 2021 года. Получается, что Huawei по продвинутости ядер CPU из-за американских санкций откатился минимум на пару поколений назад и не менее чем на 2-3 года по времени.

Однокристальная система Kirin 9000S (предполагаем, что и 9000C) также содержит и встроенное графическое ядро HiSilicon Maleoon 910 — Huawei не предоставляет никакой информации о нем, известно лишь то, что в Kirin 9000S встроенная графика содержит 4 ядра, состоящих из 1024 блоков ALU, работающих на частоте 750 МГц, есть кэш-память объемом 1 МБ и обеспечивается поддержка графических и вычислительных API на уровне OpenGL ES 3.2, OpenCL 2.0, DirectX 12 и Vulkan 1.1. Похоже, что это GPU собственной разработки Huawei, но также вполне возможно, что это какая-то модификация Mali-G78 с меньшим количеством блоков, по сравнению с Kirin 9000.
Эта модель графического процессора ARM может содержать от 7 до 24 ядер и конфигурируемую кэш-память объемом от 512 КБ до 2 МБ, поддерживает все необходимые возможности API OpenGL ES 3.2, DirectX 12, OpenCL 2.0 и Vulkan 1.2, и по всему схожа с тем, что предлагает Huawei в Kirin 9000S/9000C. Но если Mali-G78 MP24 имеет 1536 ALU, частоту 759 МГц и дает 2332 гигафлопс производительности, то в Maleoon 910 есть лишь 1024 ALU, которые при частоте 750 МГц дают до 1536 гигафлопс для FP32-вычислений — в полтора раза меньше.

По производительности и энергоэффективности встроенный GPU в Kirin 9000S/9000C примерно соответствует Snapdragon 888 конца 2020 года, а более новый Snapdragon 8 Gen 1 их обоих опережает, не говоря уже о более новых чипах Qualcomm. Так что если по скорости CPU-ядер Kirin 9000S/9000C чуть быстрее того же Snapdragon 888, то по графике они примерно равны. И если для смартфонов и планшетов это еще более-менее нормально, то для ПК и ноутбуков на базе Windows 11 та же Qualcomm в этом году выпустила топовый чип Snapdragon X Elite с куда более впечатляющими характеристиками — 12 продвинутыми ядрами Oryon с большей производительностью на такт, повышенной до 3,4 ГГц частотой, 12 МБ L2-кэша, более чем вдвое большей пропускной способностью памяти и до трех раз более производительной графикой. Так что разница по скорости между этими решениями должна составлять несколько раз, и не факт, что она не будет увеличиваться — многое ведь зависит не от самой Huawei, а от возможностей полупроводникового производства SMIC, как мы уже говорили. Впрочем, Huawei продолжает понемногу улучшать линейку Kirin 9000 в меру своих сил, и это впечатляет, учитывая полностью собственную разработку последних модификаций.
Аппаратное обеспечение
Для проведения тестов производительности мы использовали готовую компактную систему на основе процессора Kirin 9000C — китайский мини-ПК всё той же Huawei, содержащий полный набор аппаратного обеспечения и предустановленную операционную систему. В 2024 году компания представила новейшие ПК моделей Qingyun W515x и W585x, основанные на процессоре Kirin 9000C. Серия Huawei Qingyun, ориентированная на коммерческих пользователей, была запущена еще в марте 2023 года, в ее составе предлагаются также ноутбуки, планшеты, принтеры и интеллектуальные экраны.
Qingyun W515x стал первым настольным ПК на основе этого процессора собственной разработки Huawei — компания нашла вариант для выпуска простеньких ПК после принятия санкций, запрещающих поставку им западных процессоров. Линейка Qingyun изначально включала модели настольных систем B730 и B530, использующих процессоры Intel Core 12-го поколения и Windows 11, а переход на Kirin 9000C и китайские ОС подчеркивает новую стратегию Huawei по снижению зависимости от внешних поставщиков и улучшению своих собственных технологий. Именно Qingyun W515x на Kirin 9000C и попала к нам в руки в варианте с 8 ГБ памяти и 256 ГБ твердотельным накопителем. И если накопитель легко заменить или дополнить, то с памятью не всё так просто — она же находится прямо на SoC и увеличить объем невозможно, что может сказаться на результатах наиболее требовательных приложений.


Система предназначена для компаний, использующих не особенно мощные системы в форм-факторе Micro-ATX с поддержкой низкопрофильных PCIe карт расширения. Модель имеет несколько конфигураций: 8 ГБ или 16 ГБ памяти могут сочетаться с накопителями в таких вариантах: 256 ГБ SSD, 256 ГБ SSD + 1 ТБ HDD, 512 ГБ SSD, а также 512 ГБ SSD + 1 ТБ HDD. W585x же имеет только вариант 8 ГБ ОЗУ + 256 ГБ SSD. Микросхемы памяти в стиле мобильных решений установлены прямо на однокристальной системе, возможна конфигурация с 8 ГБ или 16 ГБ памяти LPDDR5-6400 с 64-битной шиной. Один обязательный твердотельный накопитель SAMSUNG KLUEG4RHGB-B0E1 имеет интерфейс UFS, а еще один NVMe-накопитель можно установить в дополнительный разъем M.2. Также системная плата предлагает два порта SATA 3.0, один из которых занят оптическим DVD-RW устройством.
Обе модели Qingyun на основе Kirin имеют встроенную графику и предлагают достаточный набор разъемов. Наша система имеет спереди: один разъем USB-C, три разъема USB-A 3.2 Gen 1, совмещенный аудиоразъем 3,5 мм (наушники/микрофон), а сзади: разъем VGA и HDMI, четыре разъема USB-A 3.2 Gen 1, гигабитный разъем RJ45, разъем COM-порта, аудиоинтерфейс (микрофон, стереовыход, аудиовход). Есть аппаратная поддержка беспроводных сетей Wi-Fi 6 при помощи дополнительного модуля (поддерживаются стандарты IEEE 802.11a/b/g/n/ac/ax) и Bluetooth 5.2 (предустановленная ОС поддерживает только Bluetooth 4.2). Набор интерфейсов обеспечивает полноценную совместимость со всеми возможными периферийными устройствами.
Хотя на корпусе есть три низкопрофильных слота для установки карт расширения, но системная плата предлагает лишь один слот PCIe 3.0 x1, подходящий для низкопрофильных карт расширения. Дополняет ПК вполне достаточный блок питания невысокой мощности, а компактный корпус достаточно удобный и просторный для столь простой системы. В комплекте поставляется проводная клавиатура Huawei K100 и проводная же мышь Huawei M100. Полностью поддерживаются операционные системы: Kylin OS или Tongxin UOS Desktop — возможна предустановка одной из них на выбор.
Для охлаждения китайского процессора в версии для настольных ПК используется простая по современным меркам низкопрофильная система охлаждения, состоящая из невысокого алюминиевого радиатора и небольшого вентилятора, обеспечивающая низкий уровень шума и достаточную эффективность охлаждения. Такого кулера более чем достаточно для охлаждения Kirin 9000C, который не нагревался выше 67 °C при проведении наших тестов, если верить встроенному датчику и системе мониторинга, так что перегрев китайскому CPU грозит только в случае полного отсутствия системы охлаждения, и даже простой воздушный кулер отлично справляется с охлаждением протестированной однокристальной системы.
Из необычного по современным меркам у системы можно отметить разве что COM-порт, полезный в некоторых специфических применениях, вроде разработки ПО для различных контроллеров, что может быть актуально именно для китайского рынка. К сожалению, у платы довольно скудные возможности по настройке в BIOS Setup, никакого разгона и изменения важных для производительности параметров среди них нет, так что даже заходить в настройки смысла не имеет.
Программное обеспечение и впечатления от работы
Чисто теоретически Kirin 9000C может работать и под управлением специальной ARM-версии Windows 11, мы пока что не пробовали это сделать, а официально поддерживаются две специальные версии Linux: Kylin и уже известная нам по Loongson система UOS. Попавшая к нам система Huawei имеет предустановленную операционную систему Kylin на базе Linux, но мы использовали и уже известную для нас UOS, также имеющую в основе Linux. Очень кратко расскажем о своих впечатлениях от обеих систем и практическом их применении — применяемые в них оболочки визуально не особенно отличаются от других современных операционных систем.
Система Kylin начала разрабатываться в Китае еще в начале века, первые версии были основаны на FreeBSD и использовались китайскими военными и государственными организациями. Но в 2013 году они перешли на Ubuntu, с того времени система получила большее распространение и теперь предлагается для настольных ПК и ноутбуков широкого круга пользователей, существуют версии для x86-64 и ARM.
UOS — операционная система на базе дистрибутива Deepin, основанного на Debian, разработанная компанией UnionTech по заказу правительства КНР для замещения иностранных операционных систем. Есть варианты для настольных и для серверных систем, первые версии вышли еще в 2019 году. UOS также ориентирована на китайский рынок и предназначена для замены Microsoft Windows, поддерживает аппаратные платформы Zhaoxin, Loongson, Sunway, а также процессоры на базе архитектуры ARM. Есть и x86-64 версия.
В целом, для уже работавших с современными системами на основе Linux, UOS и Kylin выглядят узнаваемо. Мы уже писали, что некоторым неудобством в случае первой ОС является то, что для получения прав суперпользователя (root) необходимо зарегистрироваться при помощи телефона, электронной почты или мессенджера WeChat. Также может напрягать неполный перевод с китайского языка для части ПО, включая магазин приложений, но с этим можно жить — в крайнем случае придется перевести текст онлайн-переводчиком при помощи камеры мобильного телефона.
В составе обеих операционных систем есть практически всё самое необходимое для базовой работы, включая интернет-браузер, медиаплеер и магазин приложений. Обе системы выглядят современно и имеют все основные возможности, необходимые для обычного пользователя. Но при всем сходстве двух систем, между ними есть некоторая разница в производительности, связанная с отличиями в устройстве ОС и разной степенью оптимизации. В соответствующем разделе мы рассмотрим показатели, полученные на Kirin 9000C в обеих операционных системах, а пока что очень кратко расскажем о практическом впечатлении от работы на ПК Huawei на базе Kirin 9000C.
Магазины в обеих ОС достаточно продвинутые и предлагают ПО для разных применений, есть разделы по категориям, рейтингу и т. п., поддерживается автоматическое обновление, есть отзывы пользователей — всё как обычно. Но количество представленных в магазине программ не так велико, по сравнению с более популярными системами. Правда, в отличие от UOS на Loongson, тут есть полноценный офисный пакет — WPS Office, да еще в более новой версии, по сравнению с тем, что мы нашли в свое время для LoongArch64.
Это достаточно продвинутый офисный пакет, в нем есть всё необходимое для работы: редакторы текста и таблиц, программа для создания презентаций и т. п., и работать в нем на системе с Kirin 9000C вполне комфортно при выводе информации в разрешении Full HD, хотя с современными мощными x86-системами сравнивать не нужно, они в любом случае более отзывчивые и обновляют информацию на экране заметно плавнее. И всё же, работать и на системе с Kirin вполне можно. Единственное, что современные браузеры очень любят грузить память, и в них достаточно комфортно только при небольшом количестве открытых страниц, а 8 ГБ в тестовой системе — довольно мало, и система может стать не слишком отзывчивой при большой загрузке ОЗУ.
Кстати, производительность встроенного в Kirin 9000C видеоядра оказалась довольно близкой к тому, что мы видели на примере Loongson. В тесте GLmark2 при разрешении Full HD встроенный GPU в Loongson набирал в двухканальном режиме работы памяти 70 баллов, а GPU в Kirin — 88 в UOS и 74 в Kylin. Если рассматривать тест 2D-графики в утилите HardInfo, то это 1144 в UOS и 967 в Kylin против 4108 у Loongson. То есть многое зависит от ПО и степени оптимизации. В этом случае мы не пробовали установку дискретной видеокарты, так как не видим в этом особого смысла — в том числе из-за одного разъема PCIe x1.
А вот с чем у Kirin 9000C всё очень хорошо, так это с одной из распространенных задач современного ПК — просмотром видеороликов различных форматов в высоких разрешениях. Оно и неудивительно, ведь эта однокристальная система имеет в основе специализированные блоки для аппаратного ускорения декодирования видеоданных, разгружающие остальные компоненты системы — у Huawei есть большой опыт по таким блокам. И у нас как раз такая мобильная однокристальная система, которая официально поддерживает аппаратное ускорение декодирования видеоданных в наиболее востребованных форматах, поэтому никаких сложностей у Kirin 9000C с этой задачей возникнуть не могло — при существующей программной поддержке.
Предустановленные в ОС медиаплееры умеют декодировать 4K-ролики в разных форматах, включая H.265, загрузка CPU в этом случае плавает в районе 15%-25%, в зависимости от битрейта и формата видеоданных. Но в целом хорошо видно, что аппаратное ускорение декодирования видео есть, в отличие от того, что мы видели у системы на основе Loongson.
Учитывая всё это, мы предполагали, что и с проигрыванием потоковых роликов дела обстоят столь же хорошо, но это оказалось не совсем так, и дело даже не в загрузке процессорных ядер. Да, загрузка CPU даже при просмотре 4K-роликов на Youtube не превышала 40%, но пропуски кадров были довольно ощутимы. Хотя это отмечалось при FullHD и 60 FPS, но даже с этими пропусками рывков на глаз особых не было заметно, а с 30 FPS было еще лучше. В 4K же разрешении при 60 FPS смотреть ролики и вовсе не нужно, так как пропускается примерно каждый второй кадр, и вот тут уже плавного воспроизведения не получалось. Так что итог аналогичный тому, что мы сделали в обзоре Loongson — мощности Kirin 9000C также более-менее хватает для разрешения Full HD.
В целом же можно сказать, что обе системы (Kylin и UOS) вполне работоспособны, и могут обеспечить достаточный комфорт для нетребовательных пользователей при использовании ими несложных программных продуктов, не слишком больших документов и не слишком активной работе фоновых задач, занимающих большие объемы памяти. Впрочем, столь слабые системы на большее и не рассчитаны в принципе, так что значимым недостатком это назвать нельзя.
Тестирование производительности
Тестовые системы и условия
При тестировании мы использовали готовый китайский ПК на основе процессора Kirin 9000С, который содержит перечисленный выше набор аппаратного обеспечения, а остальные процессоры, взятые для сравнения, просто использовали подходящий для них набор комплектующих. Китайская однокристальная система Kirin 9000C имеет память стандарта LPDDR5-6400 объемом в 8 ГБ прямо на чипе, и поменять ее нет возможности. Также и никаких настроек частоты и таймингов памяти в настройках BIOS Setup нет, всё уже заранее выставлено и настроено.
Конкуренты для очередного китайского CPU, который вряд ли покажет высокую производительность, остались те же, что и в статье по Loongson. Поскольку решений вроде Core i3-10100 у нас давно нет в наличии, то мы взяли минимальную конфигурацию из имеющихся у нас систем на основе процессоров Intel и AMD: Core i3-12100 с памятью DDR5, а также «Ryzen 5 1500X». Последний мы «эмулировали» при помощи процессора Ryzen 7 1700, выставив в BIOS Setup режим 2+2 ядра, ведь в четырехъядерном процессоре Ryzen 5 1500X заблокирована как раз половина ядер, да не в одном блоке CCX, а отключены по паре ядер в каждом из них, что позволило процессору сохранить весь объем в 16 МБ L3-кэша, зато оставило узкое место в виде сниженной скорости передачи данных между ними по Infinity Fabric. Также для полноценной имитации четырехъядерного Ryzen первой серии мы выставили соответствующий лимит энергопотребления, и у нас получился практически полноценный Ryzen 5 1500X.


Для процессоров Ryzen и Core мы использовали имеющиеся тестовые системные платы и типичную для них память с настройками из XMP-профилей, а ограничения процессоров по потреблению энергии — в соответствии с их спецификациями. Также мы тестировали западные процессоры еще и при постоянной частоте 2,5 ГГц — отключив для Core i3-12100 все технологии повышения частоты вроде Turbo Boost и Thermal Velocity Boost, а также выставив лимит потребления ниже. То же самое сделали и с имитированным нами Ryzen 5 1500X, изменив его множитель для работы на постоянной частоте в 2,5 ГГц и отключив технологии повышения частоты, вроде Precision Boost Overdrive.


В итоге получились такие же CPU, но ядра которых всегда работают на частоте 2,5 ГГц — почти как максимальная частота у суперъядра процессора Huawei, хотя этот SoC имеет неоднородные ядра, которые работают на разной частоте. При помощи пары Core и Ryzen со сниженной до 2,5 ГГц частотой нам станет несколько понятнее, насколько хорошо справляются ARM-ядра китайского процессора с далеко не самыми новыми западными, но всё же достаточно производительными решениями Intel и AMD при работе на близкой тактовой частоте.
Если говорить о программной стороне вопроса, то мы тестировали Kirin 9000C и на UOS и на Kylin, хотя попавший к нам готовый ПК имел предустановленной операционной системой вторую из них. Чтобы все процессоры были в более-менее равных условиях, мы тестировали Ryzen 5 и Core i3 под управлением x86-совместимой версии UOS. Возможно, другие версии Linux и/или Windows для x86-64 процессоров дали бы лучшие результаты для x86-процессоров, это тоже нужно учитывать.
Выбор тестового ПО остался прежним — да, он далеко не идеален, но чтобы сравнивать Kirin 9000C с тем же Loongson 3A6000, других вариантов особо и не было — нужно, чтобы тесты и методики работали на CPU столь разных архитектур. Поэтому для сегодняшнего тестирования мы снова использовали пакет Phoronix Test Suite, использовав как можно большее количество тестов из него, в принципе работоспособных на всех трех архитектурах: LoongArch64, AArch64 и x86_64.
Это всё дается довольно непросто, какие-то тестовые пакеты не работоспособны на разных архитектурах, другие используют библиотеки и оптимизации исключительно для архитектуры x86-64, и даже не собираются на других. Даже если в коде нет жесткой привязки к архитектуре, то могут возникнуть проблемы со сборкой, отсутствием каких-то библиотек, и даже если их решить, то выбранное ПО всё равно может некорректно работать, или не выдавая результатов вовсе или завершая работу теста с ошибкой. В общем, запускали снова всё те же тесты из пакета Phoronix Test Suite, которые мы уже использовали в статье по Loongson — оценить производительность Kirin 9000C по ним вполне можно.
Синтетические тесты
Производительность памяти и системы кэширования
Как всегда, первым делом смотрим, насколько контроллер памяти и система кэширования получились эффективными у инженеров HiSilicon. К сожалению, привести тестовые процессоры к единым по параметрам памяти просто невозможно, поэтому использовались разные условия. Нужно просто помнить, что процессоры Huawei и Intel поддерживают память DDR5, а AMD и Loongson — лишь DDR4, причем китайский процессор заработал в двухканальном режиме у нас только в режиме DDR4-1866.
Первым будет тест пропускной способности подсистемы кэширования и оперативной памяти CacheBench — часть пакета LLCbench, которая измеряет пропускную способность при чтении, записи и в смешанном режиме чтения, изменения данных и их записи. Судя по предыдущим тестам, на результат больше влияет пропускная способность кэшей, чем оперативной памяти. Ну а существенной разницы между системами UOS и Kylin для Kirin 9000C мы не обнаружили, результаты для обеих ОС близкие.
К сожалению для китайцев, процессор Intel привычно выиграл во всех режимах, и это неудивительно — даже с применением не самой быстрой памяти DDR5-5200 в штатном режиме Core i3-12100 оказался чуть ли не вдвое быстрее по работе с кэшем и памятью по сравнению с Kirin 9000C, а вот Ryzen 5 1500X опередил рассматриваемый китайский CPU лишь в двух из трех подтестов, по чтению их результаты близки. Что касается сравнения Kirin и Loongson, то по чтению заметно быстрее 9000C, также чуть лучше он же в смешанном режиме, ну а в режиме записи процессоры равны.
Но такая разница с западными CPU отмечается лишь в режиме полной частоты Core i3-12100 и Ryzen 5 1500X, а с приведением ее к условным общим 2,5 ГГц, рассматриваемая однокристальная система Huawei по всем параметрам явно быстрее процессора AMD, и даже приведенный к частоте в 2,5 ГГц процессор Core i3 догнать получилось в двух из трех подтестов — так что результаты для Kirin довольно неплохие, он работает с кэшем явно лучше устаревшего Zen 1 и где-то на уровне бюджетного процессора Core 12-го поколения — но лишь на сниженной частоте.
Второй бенчмарк Memory BandWidth (MBW) — довольно простой тест пропускной способности оперативной памяти для операций копирования, в нем есть несколько режимов, отличающихся объемом данных и режимом копирования — мы выбрали объем в 128 МБ и 4 ГБ. В этом случае уже больше должна сказываться именно пропускная способность оперативной памяти, а не кэша. MBW менее синтетический, чем другие тесты, он имитирует операции популярного ПО, а другие тесты измеряют скорее пиковые показатели. В обеих ОС однокристальная система HiSilicon показала близкие результаты.
Сразу скажем, что нулевые показатели в последней колонке получились из-за недостатка памяти у системы на основе Kirin 9000C — у нее меньше памяти, чем у остальных систем: 8 ГБ против 16 ГБ, и для этого теста ее было недостаточно. По другим подтестам можно сказать, что вот тут Core i3-12100 уже не быстрейший, так как измеряется ПСП, а системы Intel и HiSilicon используют память DDR5, причем у Kirin 9000C она работает на более высокой частоте. Ryzen 5 1500X оказался явно медленнее китайского процессора, не говоря уже о Loongson, это объясняется памятью DDR4 у обоих.
RAMspeed — еще один тест производительности оперативной памяти, мы использовали два режима средней скорости передачи данных в двух форматах: целочисленном и с плавающей запятой. В этом тесте также важнее пропускная способность именно оперативной памяти, судя по разнице между режимами с одним и двумя каналами у Loongson. Разница между UOS и Kylin ожидаемо отсутствует.
К сожалению, использование памяти DDR5 не помогло Kirin 9000C опередить всех в этот раз, лидером стало полноскоростное решение Intel многолетней давности — Core i3-12100. Но разница между ним и китайским SoC не особенно велика, и это можно считать хорошим результатом для Kirin 9000C. Тем более, что Ryzen 5 1500X оказался значительно медленнее китайского процессора, а про отставшего более чем вдвое Loongson 3A6000 даже не говорим.
Ну и последний тест в этом разделе называется Stream — это еще один популярный бенчмарк для тестирования оперативной памяти, предлагающий четыре различных варианта измерения пропускной способности. Важное отличие бенчмарка Stream в том, что он стремится измерять пиковые показатели, а не ПСП в условиях, близких к реальному ПО.
Интересно, но именно тут Kirin 9000C пасует — китайский процессор не смог составить конкуренцию Core i3-12100, отставая от него до двух раз. Даже Ryzen 5 1500X смог опередить рассматриваемый процессор в режиме копирования, хотя в остальных Kirin оказался или близок к процессору AMD или даже чуть быстрее — но у него то память DDR4, которая уступает по теоретическим показателям. Так что еще один китайский процессор не догнал западные образцы по эффективности работы контроллера памяти, хотя у Huawei получилось явно лучше.
Синтетические и общие тесты
Чисто синтетические тесты производительности из различных пакетов могут быть интересны для оценки низкоуровневой производительности в специализированных задачах, хотя некоторые из них претендуют и на определенную универсальность. Эта группа тестов показывает относительную производительность CPU в разных применениях и сценариях.
Core-Latency — тест для измерения задержек между всеми комбинациями ядер процессора, показывает минимальное, среднее и максимальные значения. Больше всего интересны его результаты при чиплетной организации ядер или группировке ядер в блоки, а также в многопроцессорных системах, когда задержки между ядрами очень сильно отличаются. Межъядерные задержки Kirin 9000C при работе в двух ОС на удивление отличаются, но это может быть вызвано каким-то сбоем в UOS при запуске теста, так что принимаем за истинные показания в Kylin.
В отличие от Loongson 3A6000, отличия по задержкам между ядрами явно очень сильно отличаются. И хотя сам кристалл у Kirin тоже монолитный, организация неоднородных ядер привела к повышению максимальной и средней задержек до уровня многокристального Ryzen первого поколения, и даже чуть больше — если с минимальной задержкой всё отлично, она лучше только у монолитного Core i3-12100, то с максимальной (да и средней) задержкой всё плохо — худшие показатели среди всех протестированных CPU. Это не слишком удивительно при таком зоопарке разнородных ядер, которого нет у других CPU. Даже Ryzen 5 1500X с организацией из двух блоков CCX имеет несколько меньшие максимальные и средние задержки.
EEMBC CoreMark — это набор синтетических тестов для измерения производительности процессоров и микроконтроллеров, он был создан для замены старого известного теста Dhrystone. Содержит реализации алгоритмов поиска и сортировки данных, матричные операции, подсчет контрольной суммы и др. Результат отображается в виде единственного значения в количестве повторений за секунду, удобного для сравнения разных систем.
От скорости памяти результат зависит слабо, да и от операционной системы. Kirin 9000C в этом тесте явно побыстрее и Loongson 3A6000 и даже быстрее Ryzen 5 1500X, работающего даже на его полной частоте в 3,5 ГГц, так что Kirin справляется с задачей явно эффективнее процессора поколения Zen 1. А вот Core i3-12100 быстрее него, но лишь при стандартных частотах до 3,3 ГГц, а с 2,5 ГГц уже немного отстает. Другой китайский CPU показал заметно худший результат — на 30% ниже.
Swet — еще один синтетический тест производительности центральных процессоров и оперативной памяти, включая многоядерные и многопроцессорные системы. Результат выводится в виде количества операций в секунду. В прошлом тесте мы не заметили явного влияния скорости ОЗУ на результаты, равно как и нет разницы между используемыми операционными системами для Kirin.
Если сравнить разные процессоры, то рассматриваемый сегодня китайский CPU хоть и выглядит чуть лучше Loongson, но его результат в этом тесте почти вдвое хуже полноскоростного Ryzen 5 1500X и втрое медленнее Core i3-12100 на номинальной частоте, что весьма печально. Приведение частоты западных CPU к 2,5 ГГц дает Kirin 9000C приблизиться к Ryzen, но быстрейший в сравнении процессор Intel далек от них в любом случае. Мы уже предполагали, что тест может быть не слишком хорошо оптимизирован под архитектуры, отличные от x86 — возможно, это еще одно подтверждение.
HardInfo — встроенная утилита для просмотра информации о системе и оборудовании, а также мониторинга, в которую также входит несколько небольших тестов производительности, охватывающих широкий спектр задач, от трассировки лучей до криптографии. Некоторые результаты даны по времени исполнения, а другие приводятся в неких очках.
Вот тут особо радоваться нечему, в этом тесте Kirin 9000C явно выглядит не лучше Loongson 3A6000. Да, где-то HiSilicon побыстрее, но в среднем эти процессоры равны, зато в задаче трассировки лучей другой китайский процессор показал результат аж вдвое лучше Kirin — Loongson там быстрее Ryzen 5 1500X и на одном уровне с Core i3-12100, работающих на номинальной частоте! Немножко Kirin 9000C отыгрался в N-Queens — известной задаче по расстановке фигур на шахматной доске, в которой он оказался быстрее Loongson и всех остальных.
Неплохой результат Kirin показал в тесте CryptoHash (с Kylin был быстрее всех) и Fibonacci — с той же Kylin опередил Loongson, а также Ryzen 5 в номинале и Core i3 на сниженной до 2,5 ГГц частоте. А вот в FFT (вычисление дискретного преобразования Фурье) процессор Huawei выступил так себе, уступив Loongson и сильно проиграв Ryzen 5 1500X на номинальной частоте и Core i3-12100 даже при 2,5 ГГц. Так что в среднем Loongson 3A6000 и Kirin 9000C находятся примерно на одном уровне и близки к Ryzen 5 1500X на номинальных частотах, а Core i3-12100 быстрее обоих.
Это Java-версия тестового пакета научных вычислений SciMark 2.0, который включает различные тестовые алгоритмы, включая метод Монте-Карло, быстрое преобразование Фурье, метод последовательной сверхрелаксации Якоби, операции умножения над разреженными матрицами и LU-разложение матрицы. В этих тестах наблюдается некоторое влияние увеличенной ПСП для двухканального режима, но не для всех алгоритмов.
Модель однокристальной системы Kirin 9000C выступила в этом бенчмарке не очень сильно, даже если сравнивать с Loongson 3A6000, не говоря о старых процессорах AMD и Intel. Особенно далеко решению до полноскоростных версий Ryzen 5 1500X и Core i3-12100, хотя многое зависит от подтестов. В первом (комбинация нескольких) Kirin прилично проиграл Loongson и не достал до замедленных версий Ryzen и Core.
В методе последовательной сверхрелаксации Якоби и операциях умножения над разреженными матрицами, Kirin был чуть быстрее Loongson, но из западных CPU выиграл только у замедленного Ryzen 5 1500X. А уж в тесте LU-разложения матрицы рассматриваемый процессор проиграл сразу всем (процессору Loongson — больше двух раз), что снова говорит о зависимости от задачи и оптимизации приложения. Быстрое преобразование Фурье же далось Kirin лучше, чем Loongson. Так что многое зависит от ПО, но в целом китайские настольные процессоры близки по показателю IPC к изрядно устаревшему представителю семейства Zen 1, и даже до младшего процессора Core 12-го поколения не дотягивают.
Бенчмарк Stress-NG
Это специализированная утилита для проведения комплексного нагрузочного тестирования аппаратного обеспечения большим количеством различных тестов. Так как тестов в этом пакете очень много, мы решили представить эти результаты в более удобном табличном виде, включив только те из них, которые отработали на всех системах:
В этом тесте попадается большая разница между парой результатов процессора Kirin 9000C, работающего под управлением двух операционных систем: UOS и Kylin, что еще раз говорит о важности выбора в том числе и ОС. Разница в результатах была и в случае Loongson, и местами она довольно заметная — вплоть до полуторакратной в отдельных тестах. А иногда результаты необъяснимо сильно отличаются от других CPU — как с NMAP и NUMA, например. Вы можете проанализировать таблицу самостоятельно, мы отметим лишь некоторые моменты.
Если не брать сильно отличающиеся результаты, то нередко Kirin 9000С и Loongson 3A6000 довольно близки друг к другу, и в среднем близки к Ryzen 5 1500X в режиме сниженной до 2,5 ГГц тактовой частоты и даже к Core i3-12100 в этом же режиме, но процессор Intel на номинальной частоте всё же лучший и тут. Интересно, что если у Loongson больше всего провалов было в задачах, активно использующих матричные вычисления, где требуется использование специализированных SIMD-инструкций для достижения высокой производительности, то у Kirin 9000C в этих подтестах всё заметно лучше. Да и по сжатию данных и криптографии последний заметно быстрее, чем Loongson. Похоже, что этот тест не очень хорошо оптимизирован под соответствующие наборы инструкций Loongson, но использует их на x86 и ARM, поэтому и результаты такие.
Рендеринг
Тесты рендеринга являются одними из самых сложных для современных процессоров из-за многопоточного характера нагрузки при трассировке лучей — современные процессоры при этом стараются поддерживать максимально возможную частоту, потребляют максимум энергии и сильно нагреваются. Производители CPU нередко используют тесты рендеринга для сравнения производительности своих процессоров с решениями конкурента — подобные нагрузки при рендеринге лучше исполняются при большем количестве ядер и потоков.
Мы решили поместить на одну диаграмму результаты сразу четырех бенчмарков для измерения скорости рендеринга:
- AOBench — легковесный рендерер с использованием ambient occlusion, использующий разрешение 2048×2048 пикселей.
- C-Ray — простой многопоточный трассировщик лучей для тестирования производительности вычислений с плавающей запятой.
- POV-Ray — трассировщик лучей Persistence of Vision.
- Smallpt — небольшой рендерер с расчетом глобального освещения методом трассировки пути Монте-Карло, использующий многопоточность при помощи библиотеки OpenMP.
Пропускная способность памяти при рендеринге почти не сказывается, как и выбор операционной системы — разница между UOS и Kylin в большинстве тестов невеликая. Результаты процессора Kirin 9000C в тестах рендеринга оказались чуть лучше, чем у Loongson 3A6000, и это неплохо, так как этот китайский процессор хорошо с ними справляется. ARM-процессор выступил близко к уровню Core i3-12100 при частоте последнего в 2,5 ГГц, что показывает неплохой показатель количества инструкций за такт, а в половине тестов даже был близок и к Ryzen 5 1500X, работающему при номинальной частоте.
Core i3-12100 остался лучшим при работе в нормальном режиме работы с частотой до 3,3 ГГц, но при снижении частоты до 2,5 ГГц он уже не всегда выигрывал. Что касается Loongson, то он оказался быстрее только в тесте POV-Ray, а в остальных проиграл рассматриваемому сегодня Kirin 9000C. Так что результаты для последнего довольно хорошие, по показателю IPC он близок к хотя и устаревшим, но достаточно производительным процессорам западных компаний.
Работа с медиаданными
Очередной тестовый раздел рассматривает сразу несколько тестов по обработке медиаданных — фотографий и видеороликов. В основном это вполне практические задачи, вроде кодирования аудио- и видеоданных в специализированные форматы, а также более узкоспециализированные тесты синтеза речи. Подобными задачами нередко занимается большое количество пользователей, так что практические результаты этого раздела довольно важны.
Для начала мы протестировали сжатие аудиоданных в разные форматы: APE, FLAC и WavPack — все форматы специализируются в сжатии звука и подразумевают сжатие данных без потерь. Влияния пропускной способности оперативной памяти на результаты не отмечено, явная зависимость от скорости ОЗУ отсутствует. Есть разница между UOS и Kylin, но заметной она получилась только в одном тесте — FLAC.
В двух из трех тестов аудиокодирования Kirin 9000C оказался заметно лучше Loongson 3A6000, решение HiSilicon на ARM-архитектуре выиграло всегда, но в APE сильнее всего, да и более чем двукратное преимущество в FLAC впечатляет. Похоже, что под LoongArch в этом ПО просто нет специфических оптимизаций, так как они весьма слабо распространены. Если сравнивать Kirin с Ryzen и Core, то он быстрее первого в номинале в одном тесте и близок еще в одном, а второй всё же заметно быстрее китайца. Впрочем, кодирование аудио и не самая востребованная задача в современном мире, так как процесс сейчас происходит довольно быстро — рассмотрим другие тесты, связанные с обработкой звука.
На этой диаграмме видны результаты двух тестов, связанных с синтезом речи и обработкой звука. Google SynthMark — кроссплатформенный тест для измерения производительности CPU в различных нагрузках при обработке аудио в реальном времени. Тест использует модель полифонического синтезатора и измеряет задержку, джиттер и вычислительную пропускную способность. Во втором тесте eSpeak определяется время, необходимое для синтеза речи книги «The Outline of Science» при помощи улучшенного движка eSpeak-NG с выводом аудио в формате WAV.
Разница между UOS и Kylin есть, но не слишком большая. Смотрим на сравнительные результаты процессоров — первый тест показывает небольшое преимущество над Loongson 3A6000 — в тесте обработки аудиоданных в реальном времени Kirin 9000C оказался быстрее всех процессоров, кроме Core i3-12100, работающего на номинальной частоте, опередив Ryzen 5 1500X даже в номинале — очень хороший показатель.
В тесте синтеза речи дела чуть хуже, процессор HiSilicon побыстрее Loongson и на уровне с Ryzen 5 1500X в номинале. Понятно, что оба они чуть быстрее Core i3-12100 на 2,5 ГГц и медленнее его на 3,3 ГГц. Всё же с показателем количества исполняемых за такт инструкций у Kirin и тут всё хорошо, когда сделаны все необходимые оптимизации и используются специализированные инструкции для ускорения потоковой обработки. Но даже до полноскоростного Core i3 с вдвое меньшим количеством ядер китайскому процессору далековато.
Dav1d — это высокоскоростной программный декодер видеоданных в формате AV1. С его помощью мы протестировали время декодирования пары видеороликов в этом формате, которые отличаются лишь разрешением изображения: Full HD и 4K. На результатах заметно сказывается пропускная способность памяти, и у Kirin 9000C с LPDDR5 тут всё должно быть очень хорошо. Есть и небольшое преимущество UOS перед Kylin, это тоже нужно учитывать.
При декодировании видео формата AV1 мы видим явное превосходство над Loongson раза в полтора — у последнего есть явные проблемы отсутствия должной оптимизации и использования всех имеющихся специальных наборов инструкций, поэтому в пакете dAV1d он отстает. А вот Kirin 9000C справляется с задачей лучше, но всё же скорость декодирования оказалась лишь на уровне между 2,5 ГГц и 3,5 ГГц частотами Ryzen 5 1500X, что не слишком радует, так как Core i3-12100 на номинальной частоте более чем вдвое быстрее рассматриваемого китайского процессора. Нужно помнить, что при типичном использовании редко требуется одновременное декодирование нескольких 4K-роликов в формате AV1, так что типичному домашнему пользователю хватит и того, что дают китайские процессоры — но всё же они заметно слабее западных конкурентов.
Следующий тест — программное кодирование видеоданных на CPU в формат H.265 при помощи распространенного кодировщика x265. Используются также два разрешения: Full HD и 4K. При кодировании видеоданных для поддержания высокой производительности должны использоваться инструкции SIMD, вроде SSE, AVX, AVX2 и AVX-512 в случае x86-совместимых процессоров. И тут уже нет никаких высоких показателей FPS, а каждый кадр в секунду — на вес золота. Хотя на современных системах кодированием и декодированием видеоданных чаще занимается графический процессор, в случае отсутствия такой поддержки этим приходится заниматься центральному процессору. Влияния скорости памяти нет, а вот в Kylin OS этот тест по какой-то причине не заработал.
Мы писали в прошлом материале, что похоже на то, что в этом тесте отсутствуют оптимизации под архитектуру LoongArch, включая специализированные мультимедийные инструкции, и поэтому Loongson выглядит так бледно, уступая Core i3 и Ryzen 5 в разы. Ровно это же относится и к Kirin 9000C, ведь он показал скорость лишь чуть лучше. А если сравнивать сегодняшнего китайца с западными CPU, работающими на номинальных частотах, то разница между ними достигает нескольких раз, в зависимости от разрешения ролика. Процессор Intel тут заметно быстрее Ryzen, и он в 8-9 раз быстрее чем Kirin 9000C.
Рассмотрим даже еще более требовательный тест видеокодирования. VVenC — это быстрый и эффективный кодировщик видеоданных в формате H.266/VVC (Fraunhofer Versatile Video Encoder), использующий SIMD Everywhere (SIMDe) — библиотеку, обеспечивающую переносимую реализацию SIMD для различных платформ. К сожалению, в списке поддерживаемых платформ не значится Loongson, но есть ARM, так что если на x86-совместимых процессорах будут использоваться все виды наборов инструкций SSE и AVX, на ARM должны работать SIMD-ускоренные операции Neon, то у Loongson будут проблемы с производительностью.
Задача еще сложнее и без SIMD-инструкций тут делать просто нечего. Налицо разница между кодом, хорошо оптимизированным под x86-процессоры и более-менее работающим на ARM-ядрах, но еще в 2-2,5 раза хуже работающим на Loongson. Такое преимущество Kirin 9000C над другим китайцем не помогает приблизиться к западным CPU, они оторвались от решения Huawei в 6 раз, если сравнивать китайский процессор с Core i3-12100 на номинальной частоте, и в 3,3 раза по сравнению с полноскоростным Ryzen 5 1500X. Даже в замедленном режиме процессор AMD быстрее Kirin в 2,4 раза, а Core i3 и вовсе в 4 раза. Без хорошей оптимизаций под китайские CPU в различном ПО могут наблюдаться такие провалы не только у Loongson, но и у ARM-процессоров.
Обработка изображений
Этот раздел тестов во многом пересекается с предыдущим, но мы решили его выделить, так как он посвящен исключительно работе со статичными 2D-изображениями — их обработке, сжатии и распаковке в различных задачах.
G’MIC — это платформа для обработки цифровых изображений с открытым исходным кодом, предоставляющая возможности преобразования и обработки изображений в различных форматах. G’MIC предоставляет сотни алгоритмов и функций для обработки изображений, поддерживает многопоточность и может использовать OpenMP для ускорения вычислений при помощи распараллеливания нагрузки на несколько ядер. Результаты даны в секундах, требуемых для завершения каждого из трех тестов.
Зависимость от пропускной способности памяти в тесте есть, да и выбранная ОС немало влияет на результат — Kylin в этот раз явно побыстрее по скорости обработки изображений. Увы, результаты для Kirin 9000C явно не самые хорошие, особенно в тесте двумерной функции — по какой-то причине Kirin отстал в несколько раз даже от Loongson, хотя в двух остальных подтестах он примерно на его уровне.
Что касается западных CPU, то Ryzen 5 1500X, работающий на пониженной до 2,5 ГГц частоте, явно помедленнее, да и номинальная частота не дает опередить китайский SoC, кроме явно аномального подтеста 2D Function. И даже Core i3-12100 в замедленном варианте не так быстр, а близок к Kirin 9000C в двух из трех подтестов. Но если сравнивать CPU на их номинальных частотах, то китайский процессор уступает уже довольно много.
Следующий тест RSVG/librsvg — это библиотека по работе с векторной графикой в формате SVG. Бенчмарк замеряет время конвертации векторной графики в формат PNG (растеризация) — это довольно часто используемая задача в повседневной жизни, встречающаяся при просмотре современных сайтов, например. Понятно, что в тесте используется одна большая картинка, а в реальной жизни их много мелких, но суть одна.
И снова неудача — при растеризации векторной графики процессор Kirin 9000C также проявил себя хуже остальных, показав результат ниже Loongson даже при условии использования более быстрой ОС Kylin — разница между китайскими процессорами полуторакратная в лучшем случае. Ryzen 5 1500X и Core i3-12100, работающие на сниженной частоте опережают Kirin 9000C до двух раз, а более высокие частоты западных процессоров в номинале оставляют китайца в пыли — на 3,3 ГГц процессор Core i3 сразу втрое быстрее, а Ryzen 5 «всего» на 76%.
Рассмотрим еще один универсальный тест работы с изображениями. RawTherapee — это кроссплатформенная программа для каталогизации и обработки изображений с цифровых фотоаппаратов в формате RAW, аналог Adobe Photoshop Lightroom и Aperture с открытым кодом. В бенчмарке замеряется время обработки и конвертации RAW-файлов — то, чем довольно часто занимаются профессиональные фотографы.
Хотя в этом тесте Kirin 9000C и смотрится чуть предпочтительнее процессора Loongson, но 12% преимущества мало чего значат на фоне западных CPU. Оба китайских процессора подводит отсутствие должной оптимизации, судя по всему. Скорость конвертации RAW в RawTherapee оказалась хуже, чем у Ryzen 5 1500X на сниженной до 2,5 ГГц частоте, а Core i3-12100 при номинальных параметрах в 2,3 раза быстрее рассматриваемого сегодня процессора Huawei. Пока что в этом разделе ситуация печальная, причем это можно ощутить на практике, если каждый кадр вместо минуты будет обрабатываться две или даже две с половиной, при большом количестве фотографий это будет заметно.
Переходим к сжатию и распаковке изображений. tjbench — это бенчмарк для измерения производительности распаковки JPEG-файлов при помощи библиотеки libjpeg-turbo, оптимизированной с использованием SIMD-инструкций современных CPU-архитектур. Непонятно, насколько хорошо библиотека оптимизирована под ARM и LoongArch, хотя добавление поддержки SIMD-инструкций вроде бы сделано, судя по описанию программы.
И тут для Kirin 9000C результаты наконец-то явно лучше. Второй китайский процессор отстал почти вдвое, замедленный до 2,5 ГГц процессор AMD также позади, а Core i3-12100 на сниженной частоте идет на равных с творением HiSilicon. Понятно, что при номинальной частоте процессор Intel делает работу по конвертации JPEG-файлов еще на 75% быстрее, но то, что рассматриваемый сегодня китайский процессор справился с задачей так неплохо, говорит о неплохой программной оптимизации конкретно в этом случае. Подтверждается главный бич слабо распространенных решений — никогда не знаешь, в чем они будут быстры, а в чем нет.
Переходим к тестам кодирования изображений, которые заметно более требовательны. OpenJPEG — кодек для изображений формата JPEG 2000, и в одноименном тесте используется большое панорамное изображение в виде TIFF-файла объемом 717 МБ, которое конвертируется в формат JPEG2000. Время конвертации приведено на диаграмме в миллисекундах. Разница между операционными системами есть, в этот раз — в пользу UOS.
К сожалению, мы в очередной раз видим плохой результат по сравнению даже с Loongson 3A6000. Вероятно, это ПО лучше оптимизировано под его набор инструкций, чем под ARM, и Kirin 9000C в этом тесте уступил Loongson 20%. Ryzen 5 1500X, работающий при сниженной до 2,5 ГГц частоте, даже чуть медленнее Kirin, но при номинальных он явно сильнее. Про Core i3-12100 говорить нет смысла, он быстрее всех в номинальном режиме, а вот с приведением его к 2,5 ГГц и он сравнялся с рассматриваемым китайским процессором Huawei — получается, что по IPC в этом тесте всё не так уж плохо, скорее просто Loongson еще лучше. Рассмотрим результаты при других форматах сжатия.
Еще один тест сжатия изображений. Бенчмарк использует библиотеку Google libwebp для перекодирования изображения в формат WebP при помощи утилиты кодирования cwebp. На вход подается JPEG-файл с разрешением 6000×4000 пикселей и замеряется производительность его перекодирования в WebP — в мегапикселях за секунду. Разница между UOS и Kylin почти отсутствует, но первая ОС снова чуть быстрее.
С одной стороны, похоже, что условия для Kirin снова не самые приятные — оптимизация ПО под его аппаратные возможности не блещет. Но Kirin 9000C всё же почти вдвое быстрее Loongson в двух из трех подтестов, зато в наиболее сложном подтесте сжатия без потерь проигрывает ему в полтора раза, что довольно сложно объяснить — возможно, не хватает объема кэша или что-то вроде того. В целом же, в первых двух подтестах Kirin почти дотянулся до Ryzen 5 1500X при его замедлении до 2,5 ГГц, но номинальная частота делает разницу между этими CPU куда большей. Неудивительно, что Core i3-12100 еще быстрее, особенно на стандартной частоте — более чем вдвое.
Еще один тест, схожий с предыдущим — он использует библиотеку Google libwebp2 для кодирования изображения в формат WebP2, аналогично WebP из предыдущего теста, да и входной файл используется тот же. WebP2 — это экспериментальный формат, который находится в стадии разработки, он поддерживает 10-битный HDR-формат, более эффективное сжатие с потерями и улучшенное сжатие без потерь, а также полноценную поддержку многопоточности.
Ничего особенно нового можно было и не ждать, и в этом тесте Kirin 9000C всё так же чуть быстрее Loongson 3A6000. Если брать номинальные частоты западных CPU, то Core i3-12100 быстрее примерно вдвое, а Ryzen 5 1500X — раза в полтора. Но на частоте в 2,5 ГГц решение компании AMD убежало от рассматриваемого процессора Kirin уже не столь далеко, так что по IPC и тут наблюдается примерное равенство с Zen 1.
Ну и последний тест этого раздела — Etcpak — «самый быстрый компрессор ETC на планете», как заявляют его авторы, он максимально быстро сжимает текстуры в форматы ETC и S3. В качестве входного изображения используется текстура с разрешением 8K×8K, она сжимается при помощи одного вычислительного потока и в многопоточном формате. Разница между UOS и Kylin небольшая.
В прошлом материале мы отметили, что сжатие текстур этим пакетом на Loongson 3A6000 крайне медленное, налицо полное отсутствие оптимизации под вычислительную архитектуру LoongArch. А вот с ARM в виде Kirin 9000C всё явно лучше — решение Huawei быстрее раз в шесть! Но сравнивать героя сегодняшней статьи с Ryzen 5 1500X и Core i3-12100 просто нет смысла — при номинальных частотах они еще в два и четыре раза быстрее, соответственно. И даже снижение частоты до 2,5 ГГц оставляет западным представителям преимущество. Вот такое поведение может встречаться в неоптимизированном ПО при запуске на системах с китайскими CPU.
Криптографические тесты
Еще один важный раздел тестирования производительности процессоров — криптографические задачи. Современные CPU умеют осуществлять шифрование больших объемов информации на лету, и некоторые из них имеют поддержку специальных инструкций для наиболее распространенных алгоритмов шифрования, таких как AES.
Aircrack-ng — набор утилит, предназначенных для обнаружения Wi-Fi-сетей, перехвата передаваемого через них трафика, а для нас интереснее всего, что и для проверки стойкости ключей шифрования WEP и WPA/WPA2 (иными словами — перебора и взлома соответствующих ключей). В таких тестах важны количество вычислительных ядер и высокопроизводительная архитектура с максимальной тактовой частотой, а не кэш и быстрая память. Зависимость от применяемой ОС есть, но не слишком большая.
С оптимизацией набора утилит под архитектуру ARM, в отличие от LoongArch, всё довольно неплохо. Результаты Kirin 9000C более чем втрое выше, чем у Loongson 3A6000, и даже Ryzen 5 1500X на сниженной до 2,5 ГГц частоте уступил китайскому изделию. Впрочем, на своей номинальной частоте процессор AMD всё же чуть побыстрее чипа Huawei. А вот Core i3-12100 заметно быстрее всех, и рассматриваемый сегодня китайский CPU в 2,7 раза медленнее его в полноценном виде и в полтора — в слегка придушенном частотой.
Bork — маленькая кроссплатформенная утилита для шифрования файлов, написанная на Java. Тест измеряет количество времени, затрачиваемое на шифрование файла-примера. Не очень понятен метод шифрования, но аппаратное ускорение шифрования на поддерживающих эту возможность CPU не поддерживается, судя по всему. Влияние ОС получилось огромным — по какой-то причине именно под UOS результат Kirin 9000C получился чуть ли не вдвое хуже, чем под Kylin.
В случае этой утилиты Kirin 9000C смотрится уже похуже Loongson — есть подозрение, что бенчмарк одинаково плохо (или одинаково хорошо, но вряд ли) оптимизирован под все вычислительные архитектуры. Результат для Kirin вялый, китайский процессор оказался примерно на уровне процессора Ryzen 5 1500X, работающего на частоте в 2,5 ГГц, и уступил всем остальным, отстав от того же процессора Intel в номинале более чем в 2,3 раза.
Crypto++ — библиотека с открытым исходным кодом для C++, предназначенная для работы с различными криптоалгоритмами. Поддерживается большое количество алгоритмов, в случае x86-процессоров поддерживается расширение AES-NI, да и под возможности ARM наверняка сделали оптимизации, в отличие от Loongson. Мы использовали один общий результат для всех поддерживаемых тестовым ПО алгоритмов. Зависимость от применяемой ОС есть, но не слишком заметная.
Если сравнивать Kirin 9000C с Loongson 3A6000, то рассматриваемый сегодня китайский процессор более чем вдвое быстрее. И даже по сравнению с западными условными конкурентами есть чему порадоваться — китайский CPU в этом тесте опередил Ryzen 5 1500X, приторможенный до 2,5 ГГц и был почти на одном уровне с Core i3-12100 в тех же условиях. Полноценные же версии западных процессоров быстрее, но явное преимущество осталось только у Intel — он быстрее примерно в 1,75 раза.
Остался последний тест раздела — OpenSSL. Это криптографическая библиотека с открытым исходным кодом, хорошо известная из-за расширения SSL/TLS, используемого в веб-протоколе HTTPS. Она поддерживает большинство алгоритмов хеширования, шифрования и популярных криптографических стандартов, мы использовали два варианта: RSA4096 и SHA512, скорость в которых измеряется по-разному — в первом случае в количестве подписей в секунду, во втором — МБ/с. UOS в этот раз чуть быстрее, чем Kylin, но разница не драматическая.
Сразу видно, что производительность китайского CPU в этом случае явно хороша, особенно в SHA512. Рассматриваемая модель Kirin 9000C в первом подтесте вдвое быстрее Loongson и уступила только одному из западных процессоров в номинале — Core i3-12100 быстрее чуть ли не вдвое, зато Ryzen 5 1500X на равных даже с его родной частотой. А снижение частоты процессора AMD до 2,5 ГГц привело уже к победе Kirin.
Результаты во втором подтесте заметно лучше для обоих китайских CPU. Kirin тут явный лидер, он обошел на 17% даже Core i3-12100 на его фабричной частоте, а процессор Ryzen 5 1500X отстал и вовсе на весомые 73%. То есть в этом тесте с показателем IPC у Kirin всё очень хорошо, он быстрее Zen 1 и соперничает с Core 12-го поколения, пусть и далеко не с самой мощной моделью. Результаты в OpenSSL-бенчмарке можно назвать весьма удачными для рассмотренного CPU компании Huawei.
Сжатие и распаковка
Сжатие и распаковка данных в архивах известна большинству пользователей, как и наиболее яркие представители современных архиваторов. Мы воспользовались тестами некоторых из них, в том числе наиболее распространенными на системах Unix/Linux.
Gzip — популярный в Unix-системах формат сжатия без потерь методом Deflate (комбинация алгоритмов LZ77 и Хаффмана). Тест измеряет время сжатия двух копий исходных кодов ядра Linux 4.13. Судя по результатам в прошлых материалах, влияния пропускной способности памяти тут нет, а вот влияние применяемой ОС обнаружено, по крайней мере в случае с Kirin 9000C.
Китайский процессор справился с работой почти на уровне Loongson 3A6000, и даже если сравнивать с процессорами AMD и Intel на сниженной до 2,5 ГГц частоте, то Kirin где-то между Ryzen 5 1500X и Core i3-12100, так что с показателем IPC у него на том же уровне. Но нужно учесть то, что это устаревшие западные процессоры, но даже они на номинальной частоте быстрее. Kirin 9000C в таких условиях уже вдвое медленнее процессора Intel и на треть медленнее Ryzen 5 1500X.
Архиватор 7-zip весьма популярен на разных системах и интересен довольно эффективным и требовательным к вычислительной мощности методом сжатия. Еще он любопытен тем, что тест кроссплатформенный и его результаты вполне можно сравнивать и при использовании разных операционных систем. При сжатии обычно есть зависимость от пропускной способности памяти, а при распаковке она гораздо ниже. Разница между результатами в UOS и Kylin небольшая.
В этом тесте результаты рассматриваемого сегодня процессора Huawei можно назвать неплохими. Если говорить о сжатии, то китайский CPU справляется с работой на 12% быстрее Loongson, но аж на 70% хуже полноскоростного Core i3-12100. Лишь притормаживание последнего до 2,5 ГГц дает Kirin возможность приблизиться, но не догнать. А вот Ryzen 5 1500X куда ближе к китайцу даже при номинальной частоте — они почти равны в таких условиях, а по показателю IPC в этот раз Kirin заметно опережает этот процессор AMD.
Распаковка интереснее тем, что Kirin 9000C уже на 37% быстрее Loongson 3A6000, который уже и сам по себе быстрее процессоров AMD и Intel при работе на 2,5 ГГц частоте. Так что по показателю количества исполняемых за такт инструкций Kirin действительно неплох. И даже несмотря на его невысокую рабочую частоту, даже в номинальном режиме Core i3 отстает на 5%, а Ryzen 5 отстал на 23%, а это довольно много — отличный результат для Kirin!
Очередной тест сжатия измеряет время сжатия и распаковки образцового файла silesia.tar при помощи алгоритма сжатия LZ4, который относится к семейству методов сжатия LZ77 — это сжатие данных без потерь, ориентированное на высокую скорость сжатия и распаковки. Он сжимает с меньшей степенью сжатия, чем классический gzip, зато по скорости гораздо быстрее. Мы использовали в своих тестах уровень сжатия Level 9, сравнивая скорость сжатия и распаковки. Разницы между двумя ОС тут почти нет.
По скорости сжатия Kirin 9000C оказался ровно на уровне Loongson, и оба они быстрее Core i3-12100 и Ryzen 5 1500X, работающих на приведенной к 2,5 ГГц частоте, так что с показателем количества инструкций, исполняемых за такт, и у этого китайского CPU всё более-менее в порядке. Но из-за меньшей рабочей частоты и Kirin также проигрывает западным конкурентам, работающим в номинальном режиме, хотя отставание от процессора AMD невелико, но Core i3 аж на 61% быстрее.
Распаковка происходит значительно быстрее, и не зависит от пропускной способности ОЗУ, в отличие от сжатия, и Kirin 9000C уже немного быстрее Loongson. И поэтому чип HiSilicon не проиграл своим западным соперникам при одинаковой частоте для всех CPU — он на уровне Core i3 и чуть быстрее Ryzen 5. Ну а при номинальной частоте Core i3 более чем на 70% быстрее, а Ryzen 5 — на четверть.
Этот тест сжатия измеряет время для сжатия и распаковки всё того же файла-примера silesia.tar при помощи метода Zstd (Zstandard) — это алгоритм сжатия данных без потерь, разрабатываемый при поддержке Facebook, он сочетает словарный алгоритм сжатия данных типа LZ77 и эффективное энтропийное кодирование типа ANS, сходное с кодом Хаффмана. Для тестов мы использовали уровень сжатия Level 19 Long. Влияния ОС практически незаметно.
Рассматриваемый сегодня процессор Kirin 9000C показал производительность сжатия этого формата хуже, чем даже Loongson, и стал худшим в этом сравнении — и Core i3-12100 и Ryzen 5 1500X, работающие на частоте в 2,5 ГГц, впереди китайского решения. А так как рабочая частота у конкурентов еще и выше, то они выигрывают — процессор Intel на 73% быстрее, а AMD — на 42%. С распаковкой всё еще хуже, Kirin 9000C находится чуть ниже приторможенного решения AMD, а в номинальном режиме Ryzen быстрее на 44%, а Core — сразу в 2,3 раза.
Еще один известный формат сжатия — многопоточная реализация bzip2, реализация алгоритма Барроуза — Уилера. Сжимает большинство файлов эффективнее, но медленнее по сравнению с традиционными gzip и zip, а для нас важнее всего, что он работает с существенной нагрузкой на CPU и распараллелен в случае современной версии. Бенчмарк измеряет время сжатия и распаковки файла FreeBSD-13.0-RELEASE-amd64-memstick.img методом Parallel BZIP2. Есть явное влияние ПСП на скорость сжатия, да и производительность распаковки немного от нее зависит, а вот разница в результатах между ОС небольшая.
Дела Kirin 9000C в этом тесте примерно на уровне второго китайского CPU, но если при сжатии данных он впереди на 12% из-за быстрой памяти, то при распаковке уже отстает сразу на 24%. При работе западных процессоров на частоте в 2,5 ГГц, китайский SoC получше Ryzen 5 1500X, но медленнее Core i3-12100, не говоря уже о полноскоростной работе. Процессор Intel при его номинальной частоте сжимает файл ровно вдвое быстрее, да и Ryzen 5 1500X более чем на треть быстрее. Распаковка быстрее у Intel в те же два раза, а AMD — на 30%.
Последним тестом раздела будет просто время распаковки архива .tar.xz установочных файлов веб-браузера Mozilla Firefox 84.0. Небольшое влияние пропускной способности памяти на результат есть, как показали предыдущие тесты. А эти выявили возможность сильной зависимости от применяемой операционной системы — Kirin 9000C под управлением UOS показал результат чуть ли не вполовину хуже, чем с Kylin.
Firefox распаковывается на рассматриваемом китайском CPU медленнее всех, кроме Ryzen 5 1500X на сниженной частоте — тут они равны. Даже Loongson 3A6000 справился с распаковкой на 30% быстрее, не говоря о западных процессорах, которые быстрее вдвое в случае Core i3-12100 на полной частоте и на треть быстрее для Ryzen 5 1500X. При их работе на частоте 2,5 ГГц китайский Kirin 9000C чуть быстрее Ryzen, о чем мы уже писали, но всё так же уступает Core i3 — уже лишь 25%, но это более продвинутый западный CPU с памятью DDR5, важной при распаковке данных.
Компиляция и разработка
Раздел пусть и не слишком объемный, и даже не самый востребованный — вряд ли среди наших читателей велика доля разработчиков программного обеспечения, но всё же довольно интересный, так как ARM и других не-x86-архитектуры в настольных ПК сравнительно недавно появились в широком использовании, и определенный интерес к разработке ПО для них наверняка есть, особенно в том же Китае, который переходит на всё свое. Проверяем, как у очередного китайского CPU дела обстоят с компиляцией кода, сборкой приложений и другими задачами по теме разработки ПО.
Build2 — это кроссплатформенный набор инструментов для сборки кода C/C++. Первый тест раздела измеряет время установки набора инструментов для сборки Bulid2 из исходного кода. Влияния пропускной способности памяти на результаты тут нет, как мы поняли по прошлому исследованию, а вот от ОС время сборки сильно отличается — тут UOS оказалась более чем на четверть быстрее системы Kylin.
И если мы в прошлой статье писали, что Loongson 3A6000 нечем похвастать, то дела у Kirin 9000C не сильно лучше даже если не рассматривать провал сборки в Kylin. Однокристальная система Huawei лишь на 12% быстрее своего китайского собрата, а к западным процессорам они приближаются только если замедлить последних до уровня в 2,5 ГГц. Тогда Kirin 9000C оказывается чуть быстрее замедленного Ryzen 5 1500X, но всё равно сильно проигрывает даже приторможенному Core i3-12100. Так что в этом тесте скоростью Kirin не блещет, разница сильно увеличивается при работе условных западных соперников в их номинальных режимах, когда процессор Intel становится быстрее более чем вдвое быстрее, а решение AMD выигрывает 30%.
PyBench — тест общей производительности, вызывающий различные функции, реализованные с использованием Python. Подсчитывается общее время результатов теста для таких функций, как BuildinginFunctionCalls и NestedForLoops — общий результат дает приблизительную оценку средней производительности Python в системе. Снова налицо большая разница между UOS и Kylin, но теперь уже ощутимо быстрее вторая ОС.
Если рассматривать лучший из двух результатов, то Kirin 9000C не просто на уровне заторможенного Ryzen 5 1500X, но и на чуть-чуть обходит этот CPU при номинальных скоростях, что можно считать победой, хотя этой архитектуре AMD уже много лет. Еще один китайский процессор Loongson 3A6000 в этом тесте отстал от Kirin более чем на 40%, ну а Core i3-12100 и тут явно быстрее, даже на частоте 2,5 ГГц, а в обычном режиме снова более чем вдвое.
Завершают этот небольшой раздел сразу два теста времени компиляции: всех примеров из Eigen — библиотеки линейной алгебры C++ и Erlang — языка программирования и среды выполнения для масштабируемых программных систем реального времени. В этих бенчмарках просто замеряется время компиляции указанных проектов, оно выдается в секундах. Влияние ПСП тут присутствует, но оно невелико. А разница между двумя ОС в случае Kirin 9000C стала меньше, но осталась — в обоих случаях в пользу UOS.
Интересно, что даже в лучшем случае, Kirin 9000C лишь сравнялся с процессором Loongson по скорости компиляции только одного из проектов, проиграв во втором. Почти ровно на том же уровне оказалась замедленная до 2,5 ГГц версия Ryzen 5 1500X — очередной китайский процессор догнал по возможностям архитектуру Zen 1 и в этот раз. Но она позволяет CPU работать на куда более высокой частоте, и при номинальных параметрах процессор AMD на 35% быстрее рассматриваемого китайского. С Core i3-12100 всё как всегда, он заметно быстрее в режиме 2,5 ГГц частоты, и в 2—2,5 раза быстрее в номинале, а уж до уровня производительности современных западных CPU вообще очень далеко.
Высокопроизводительные вычисления
Не самый однозначный тестовый раздел. С одной стороны, именно высокопроизводительные вычисления и предъявляют больше всего требований к мощи процессоров, а с другой — вряд ли кто-то всерьез будет использовать процессор, предназначенный для настольных ПК начального уровня, в подобных задачах. Но у Huawei есть и серверные CPU той же архитектуры с большим количеством ядер, и по скорости настольного Kirin вполне можно прикинуть и то, что в принципе дает вычислительная архитектура компании, а не только модель CPU для настольных ПК.
Первый тест раздела Algebraic Multi-Grid (AMG) — параллельный алгебраический многосеточный решатель для линейных систем на неструктурированных сетках. На выходе тест дает некое значение, указывающее на итоговую производительность, и чем оно выше — тем выше скорость вычислений. Как и ожидалось от бенчмарков научных вычислений, на результат заметно влияет пропускная способность памяти. К сожалению, в Kylin многие тесты раздела отказались работать, выводя ошибку OpenMPI, так что в соответствующих строках будет красоваться ноль.
Kirin 9000C в первом тесте раздела показал скорость на уровне Loongson 3A6000, и это более чем вдвое ниже по сравнению даже с замедленным до 2,5 ГГц процессором Ryzen 5 1500X. Обоим китайским решениям по показателю количества выполняемых инструкций за такт в этом тесте хвастать нечем, даже при том, что Ryzen 5 и при работе на частоте 3,5 ГГц не особенно ускорился. Core i3-12100 тоже не сильно ускорился в номинальном режиме — возможно, есть упор в скорость работы с памятью, ну а мы констатируем то, что уже далеко не новый процессор Intel втрое быстрее китайского Kirin в этом тесте.
Тест High Performance Conjugate Gradient (HPCG) решает систему линейных алгебраических уравнений с разреженной квадратной матрицей большой размерности методом сопряженных градиентов с предобуславливателем Гаусса-Зейделя. Реализация алгоритма выполнена с использованием MPI и OpenMP, так что многоядерные CPU поддерживаются. В Kylin тест снова не заработал. В тесте также есть заметное влияние пропускной способности памяти, даже процессоры AMD и Intel при разной тактовой частоте показывают слабо отличающиеся показатели производительности.
Скорость работы рассматриваемой сегодня китайской однокристальной системы Kirin совсем не порадовала — да так, что даже Loongson 3A6000 оказался быстрее ровно вдвое. Так что дела во втором бенчмарке раздела еще хуже. Скорость Kirin 9000C в этом тесте в 6,7 раз ниже производительности Ryzen 5 1500X и более чем в 8 раз китайский процессор отстает от Core i3-12100 — такого печального результата мы совсем не ожидали! Правда, возможно, в этих тестах используется много памяти, а в системе с Kirin ее вдвое меньше, чем в других системах, и увеличить ее объем невозможно.
Возможно, в менее требовательных тестах к памяти процессор Huawei и покажет результаты получше. Бенчмарк Himeno — линейный решатель давления Пуассона, использующий точечный метод Якоби, который выдает результирующую производительность в мегафлопах. Тут также есть значительное влияние пропускной способности памяти, но не полный упор в нее — процессоры AMD и Intel при разной частоте показывают заметно отличающиеся результаты. Разницы между двумя ОС нет, этот тест в Kylin заработал.
В этот раз Kirin 9000C оказался на 17% быстрее чем Loongson 3A6000, и это — результат точно на уровне полноскоростного Ryzen 5 1500X, что очень неплохо — по сравнению с семейством Zen 1, еще один китайский процессор сработал неплохо. Но если посмотреть на результаты более нового Core i3-12100 с памятью DDR5, работающего на своей номинальной частоте, то снова получаем печальное отставание китайца в два раза ровно. Но при 2,5 ГГц они довольно близки, надо сказать, так что не всё так плохо.
Mocassin (Monte Carlo Simulations of Ionised Nebulae) — тест моделирования ионизированных туманностей методом Монте-Карло. Мы используем два варианта теста, один из которых сложнее и дольше выполняется, в результате получая время решения в секундах. Влияние ПСП есть, но не такое большое, как в предыдущих тестах, а система Kylin снова в пролете.
Увы, но в этом тесте рассматриваемая нами сегодня однокристальная система HiSilicon показала чуть ли не худшие результаты всего сравнения. Она оказалась в этом конкретном тесте в 5-6 раз медленнее Loongson — вероятнее всего, сказывается нехватка оперативной памяти в случае системы на основе Kirin 9000C со встроенными прямо на однокристальную систему микросхемами памяти в объеме 8 ГБ. Сравнение с западными процессорами также не имеет смысла, так как даже Loongson в этом тесте хорош — иногда даже быстрее Ryzen 5 1500X на его полной частоте в 3,5 ГГц. Core i3-12100 еще быстрее, но по сравнению с Loongson 3A6000 вовсе не в разы.
NAS Parallel Benchmarks (NPB) — тест, разработанный NASA для высокопроизводительных компьютерных систем, который использует несколько различных задач разной сложности и размера. Мы выбрали два варианта из предлагаемых бенчмарком, его результаты выдаются в виде количества операций в секунду (миллионов в секунду). Явное влияние ПСП есть только в первом подтесте, тест в системе Kylin не работает.
Можем лишь повторить написанное при анализе результатов предыдущего теста — Kirin 9000C подвел вдвое меньший объем ОЗУ, у нас вариант с 8 ГБ памяти, и расширить его мы не можем. Так что китайский процессор Kirin 9000C в 3D-варианте быстрого преобразования Фурье (3D FFT) показал даже еще более низкую производительность, чем Loongson и оказался во много раз медленнее Ryzen 5 1500X и Core i3-12100. Со вторым тестом Kirin справился лучше, показав вдвое хуже Loongson 3A6000, но до Ryzen 5 и Core i3 еще очень далеко, даже при их работе на пониженной частоте.
Parboil — набор тестов исследовательской группы Университета Иллинойса для измерения производительности вычислительных архитектур, сценарии Parboil поддерживают многопроцессорные среды OpenMP, OpenCL и CUDA — естественно, мы использовали только OpenMP-вариант в четырех подтестах. Везде подсчитывается время, потраченное на исполнение задачи. Влияние ПСП есть не во всех подтестах, но в некоторых оно значительное и дает весомую разницу в производительности. Под Kylin тест заработал в среднем получше, чем под UOS.
По сравнению с Loongson, скорость Kirin 9000C тут довольно неплохая, он явно быстрее в половине подтестов, да еще и чуть ли не вдвое, но Loongson 3A6000 в них не блистал по сравнению с западными CPU, оказавшись в 2,5-3 раза медленнее процессоров Ryzen 5 1500X и Core i3-12100, и даже снижение их частоты до 2,5 ГГц не особо приблизило их по скорости. Если не рассматривать пока MRI Gridding, то в остальных подтестах Kirin 9000C практически на уровне Ryzen 5 1500X при сниженной до 2,5 ГГц частоте, что неплохо. Понятно, что при полной рабочей частоте западные CPU быстрее, но кратная разница есть только в LBM...
И MRI Gridding, в котором Loongson 3A6000 вдруг оказался быстрее чем Core i3-12100 при работе на полной рабочей частоте, а вот Kirin 9000C сильно проиграл — около 5 раз. Похоже, в этом подтесте снова помешал недостаток в виде объема памяти 8 ГБ, иного объяснения у нас нет. Возможно, что тест некорректно исполняется на китайских процессорах, впрочем.
Rodinia — пакет для ускорения ресурсоемких приложений при помощи CUDA, OpenMP и OpenCL. Как и в предыдущем тесте, мы использовали только OpenMP-вариант — из-за принципиального отсутствия возможности ускорения вычислений на GPU. Результат четырех подтестов выводится в секундах, чем меньше время исполнения, тем лучше. Явное влияние ПСП на результаты наблюдалось в половине подтестов — первом и третьем, тест заработал на обеих ОС для Kirin.
Но конкретно в подтесте HotSpot3D выдавал ошибку в обеих операционных системах — похоже на нехватку памяти, но может и какие-то другие причины (Loongson там показал очень слабый результат, к примеру). Так что сравниваем Kirin 9000C с его условными соперниками в остальных подтестах. Два китайских процессора в этом тесте иногда близки друг к другу (LavaMD), иногда сильно выигрывает Kirin (Streamcluster), но иногда и Loongson (CFD), так что их сравнение не приносит однозначного результата.
Core i3-12100 и Ryzen 5 1500X же на своих номинальных частотах явно быстрее, порой сразу в несколько раз. Но всё же иногда рассматриваемый китайский CPU показывал скорость на уровне Ryzen, работающего при сниженной до 2,5 ГГц частоте, или даже быстрее его. Но в целом можно в очередной раз констатировать, что при относительно неплохом показателе IPC, китайскому процессору Kirin 9000C для полноценной конкуренции в основном не хватает частоты, как и тому же Loongson. Ну а в некоторых тестах есть большие недостатки производительности, указывающие на проблемы программной оптимизации под разные вычислительные архитектуры.
Молекулярная динамика
В общем-то, эти тесты также относятся к высокопроизводительным вычислениям, которые мы уже рассмотрели в предыдущем пункте (да и вычислительная гидродинамика частично и там тоже была), но мы решили вынести несколько тестов в отдельный подраздел, так как их получилось довольно много.
CloverLeaf — это тест гидродинамики по методу Лагранжа-Эйлера, используется версия OpenMP для многопоточных процессоров. Мы взяли самый простой расчет clover_bm, в результате работы теста выдается время на его исполнение в секундах. Влияние ПСП на результат теста ощутимое, а разница между двумя ОС в случае Kirin есть, но не слишком большая.
Kirin 9000C показал скорость явно выше, чем Loongson 3A6000 — более чем на 30%, что немало. Вероятнее всего, сказывается недостаток оптимизации ПО под специфические особенности второго китайского процессора. Рассматриваемый же сегодня Kirin 9000C, в свою очередь, оказался на 34% медленнее придушенного до 2,5 ГГц процессора Ryzen 5 1500X, а полноскоростная версия этого решения AMD более чем в полтора раза быстрее. Не говоря уже о процессоре Core i3-12100, который при номинальной частоте сразу в 2,5 раза производительнее рассматриваемой сегодня однокристальной системы Huawei.
Dolfyn — бенчмарк современных методов численного моделирования вычислительной гидродинамики (CFD). Тест измеряет время выполнения демонстрационных программ вычислительной гидродинамики, поставляемых в комплекте — выводится время, потраченное на расчеты. Влияние ПСП в этом тесте небольшое, в отличие от тактовой частоты CPU. Разница между UOS и Kylin есть, но небольшая.
И в этом тесте Kirin 9000C снова чуть быстрее Loongson — примерно на четверть, если брать более быструю систему Kylin. Если сравнивать Kirin с западными CPU на частоте в 2,5 ГГц, то китаец показал производительность почти на уровне замедленного Core i3-12100 то есть показатель количества исполняемых за такт инструкций у Kirin выше, чем у Zen 1 и почти на уровне возможностей процессора Intel. Но максимальная частота у него явно ниже, так как даже Ryzen 5 1500X в номинальном режиме чуть быстрее, ну а Core i3-12100 при родной частоте уже на 83% производительнее Kirin 9000C.
Large-scale Atomic/Molecular Massively Parallel Simulator (LAMMPS) — пакет для классической молекулярной динамики, применяемый для сложных расчетов. На многопроцессорных системах используется интерфейс MPI, который не заработал на системе Kylin. Для наших тестов мы выбрали модель Rhodopsin Protein. Влияние пропускной способности памяти в этом бенчмарке невелико, судя по результатам.
Очень странно, что процессор Kirin 9000C показывает очень низкий результат в этом тесте, в отличие от того же Loongson 3A6000, который выступил отлично. Рассматриваемая же в статье однокристальная система HiSilicon с ядрами архитектуры ARM показала худший результат в этом тесте, и если это не объясняется вдвое меньшим объемом памяти, то всё для Kirin довольно печально — он более чем вчетверо медленнее Loongson и более чем в 8 раз отстает от Core i3-12100 при работе на номинальных частотах.
Livermore Unstructured Lagrangian Explicit Shock Hydrodynamics (LULESH) — трехмерное неструктурированное гидродинамическое моделирование Лагранжа для решения стандартной аналитической задачи Седова. ПСП почти не сказывается на производительности и ее влиянием можно пренебречь. В системе Kylin и этот тест не заработал из-за ошибки OpenMPI, хотя в UOS всё в полном порядке.
Но и в этот раз китайский процессор оказался очень плох, и даже еще хуже — в 8 раз медленнее Loongson и Ryzen 5 1500X при условии работы последнего на частоте 2,5 ГГц, а полноскоростной Core i3-12100 быстрее в... 18 раз. Если в этом тесте по показателю количества инструкций за такт Loongson 3A6000 совсем не так плох, то Kirin 9000C просто провалился — будем считать, что снова сказался меньший (фиксированный для SoC) объем памяти.
Pennant — еще одно приложение для расчета гидродинамики неструктурированных сеток в двумерном представлении. Содержит два разных подтеста, выдает время их расчета в секундах. В этом случае влияние пропускной способности памяти на результаты довольно велико в обоих подтестах. Что касается операционных систем, то OpenMPI в Kylin снова не заработал, так что смотрим только на UOS.
Увы, продолжается история этого раздела с отвратительно низкими результатами Kirin 9000C. Даже Loongson по производительности в 3,4 раза быстрее, полноскоростной Ryzen 5 1500X в 5 раз производительнее рассматриваемого китайца, а Core i3-12100 быстрее вообще в 7-10 раз, в зависимости от подтеста. Так что в очередном тесте раздела процессор Huawei снова оказался худшим, а уж виноват в том недостаток памяти, оптимизации или какие-то другие проблемы — определить непросто.
Ну и последний бенчмарк раздела. Incompact3d — высокопроизводительный код на основе Fortran-MPI для решения системы уравнений Навье-Стокса для несжимаемой жидкости. Используем самый простой вариант со 129 ячейками на направление, результат выводится в потраченных на расчет секундах. Влияние ПСП достаточно велико, а система Kylin снова не позволила запустить тест из-за ошибки, связанной с OpenMPI.
Еще один тест с ужасными результатами Kirin 9000C. Этот китайский процессор, по крайней мере в его модификации с 8 ГБ памяти, просто не подходит для высокопроизводительных вычислений, и в частности в вычислительной гидродинамике — почти все тесты оказались провалены, как и этот. Kirin 9000C в этот раз был медленнее Loongson 3A6000 «всего» в 2,3 раза. Понятно, что западные CPU еще дальше впереди, и не только на своих стандартных частотах, но и в замедленных до 2,5 ГГц версиях. Core i3-12100 быстрее Kirin 9000C в 5 раз, а Ryzen 5 1500X «всего лишь» втрое — отставание слишком велико. При том, что указанные западные процессоры появились много лет назад, а в продаже совсем другие их поколения.
Машинное обучение
Мы не могли обойти и модную в наше время тему весьма ресурсоемких вычислений, связанных с машинным обучением. Теста в этом разделе будет всего два, но они интересны даже несмотря на то, что для подобных вычислений всё чаще используют куда эффективнее работающие в таких условиях графические процессоры, но и универсальные CPU находят свое применение.
NumPy (Numerical Python) — математическая библиотека с открытым исходным кодом для языка программирования Python. Она поддерживает многомерные массивы, включая матрицы, а также высокоуровневые математические функции по работе с многомерными массивами. В случае этого теста подвела уже система UOS, на которой наотрез отказался установиться бенчмарк. Но у нас есть результат в Kylin, который и рассмотрим.
В этом тесте результат уже куда лучше, чем у Loongson 3A6000 — рассматриваемый сегодня китайский ARM-процессор оказался почти вдвое быстрее своего собрата по стране происхождения. Более того, Kirin 9000C обогнал даже Ryzen 5 1500X, работающего на своей стандартной частоте. А вот справиться с полноскоростным Core i3-12100 не удалось, при 3,3 ГГц он быстрее почти на 60%. Зато придушенный до 2,5 ГГц процессор Intel находится как раз на уровне Kirin в тесте с матричными вычислениями, что весьма неплохо для последнего.
Это несколько лучше подходящий для раздела тест. TNN — высокопроизводительная кроссплатформенная платформа глубокого обучения с открытым кодом, созданная Tencent. Она хорошо масштабируется от мобильных устройств до мощных систем и серверов на основе GPU. Для простоты мы использовали лишь две модели из предлагаемых в бенчмарке четырех. На диаграмме дано время исполнения тестовых задачи, и Kylin справился с этим лучше UOS.
И во втором тесте раздела рассматриваемый процессор Kirin 9000C показал себя очень неплохо, обогнав Loongson сразу на 38%-42%. И это примерно на уровне Ryzen 5 1500X с номинальной частотой. Так что по уровню количества исполняемых за такт инструкций в этом тесте китайский CPU явно обогнал Zen 1. Да и Core i3-12100 при работе на частоте 2,5 ГГц лишь чуть быстрее в одном из подтестов. Хотя в обычном режиме процессор Intel уже почти вдвое быстрее, так что достать даже таких западных «старичков» не получилось. Но на фоне предыдущих разделов и такие результаты можно считать весьма удачными для Huawei.
Выводы
Исходя из результатов тестов и небольшой практики использования системы на основе Kirin 9000C, можно сказать, что очередной китайский процессор для настольных систем получился вполне работоспособным для довольно широкого круга задач домашних и рабочих ПК — довольно несложных, не требующих особой вычислительной мощности, вроде браузера, почты и офиса. Не более того, но и не менее. Компания Huawei в лице подразделения HiSilicon уже давно занимается разработкой однокристальных систем для мобильных решений, а какое-то время выпускает и серверные решения на основе архитектуры ARM, поэтому у них есть и опыт, и соответствующие возможности. Это дало им явные преимущества по выводу на рынок вполне проработанного и стабильного процессора для настольных систем, в том числе по сравнению с другими китайскими компаниями, выпускающими аналогичные решения.
Вычислительные ядра Taishan имеют архитектуру ARM, но не основаны на референсном дизайне одноименной компании, а используют собственные разработки Huawei. Они не самые продвинутые на рынке, но по эффективности и количеству исполняемых инструкций за такт примерно соответствуют уровню Zen первого поколения — в наших тестах Kirin 9000C зачастую был близок к Ryzen 5 1500X, работающему на частоте 2,5 ГГц. Так что производительности и возможностей этого китайского процессора вполне достаточно для большинства несложных задач, ведь те же процессоры Zen первого поколения работоспособны и применяются во многих системах и сейчас — но лишь там, где не требуется действительно высокая производительность. В высокопроизводительных вычислениях никто их не использует, а именно в таких тестах, к слову, Kirin 9000C оказался в числе отстающих. Хуже всего дела обстоят в слабо распространенном ПО из-за недостатка специфических оптимизаций — к примеру, если оно не использует дополнительные наборы инструкций, требуемые для достижения высокой производительности.
Назвать процессор Kirin 9000C отличным мы не можем, ведь по многим объективным причинам он находится примерно на уровне процессоров AMD и Intel нескольких поколений назад, да еще и далеко не топовых моделей соответствующих линеек. Если сравнивать рассмотренный CPU с самыми современными западными процессорами на сегодня, то заметное отставание будет наблюдаться и по количеству исполняемых инструкций за такт, особенно с учетом куда меньшей тактовой частоты. Впрочем, для начала и это уже неплохо, особенно учитывая условия, в которых оказались китайские компании. Для производства SoC используется далеко не самый продвинутый 7-нанометровый техпроцесс SMIC, пусть и в улучшенном варианте N+2, предположительно отличающемся более высокой плотностью размещения транзисторов. Это похуже 5-нанометрового техпроцесса тайваньской TSMC, который компания использовала до начала действия санкций, и заметно хуже более современных вариантов технологии, которые может предложить та же TSMC сейчас.
Но китайцам эта возможность уже недоступна. Более того, из-за санкций США компания SMIC не может закупить современное EUV-оборудование, важное для массового производства кремниевых пластин в больших объемах. Вероятно, они используют более старый вариант оборудования DUV при производстве, и чипы для Huawei, по западным оценкам, обходятся вполовину дороже, чем если бы они производились на TSMC близкой литографии — из-за более низкого выхода годных кристаллов и большей себестоимости производства в целом. Вероятно, следующие процессоры Kirin также массово производятся при помощи 7-нанометрового техпроцесса на SMIC, но еще более доработанного — условно, версия N+3 с еще большей плотностью транзисторов, чем в Kirin 9000C и 9010. Более продвинутые техпроцессы у китайцев также наверняка прорабатываются, но пока что не позволяют начать массовый выпуск продукции.
Предполагаем, что Kirin 9000C во многом похож на Kirin 9000S, а последний в чем-то даже превосходит своего предшественника Kirin 9000, почти близнеца по устройству, но более продвинутого по технологиям микроэлектронного производства. Однако по максимальной частоте и энергоэффективности Kirin 9000 явно недосягаем — это объясняется именно разницей между техпроцессами TSMC 5 нм и SMIC 7 нм. Вероятно, себестоимость массового производства китайских версий Kirin 9000 с буквенными индексами также выше, но для пользователей это не так важно. А для применения в ПК не особенно важна энергоэффективность, и хотя Kirin 9000S/C явно значительно хуже по этому параметру, но это было бы плохо скорее для смартфонов и ноутбуков, которым необходимо работать автономно. А вот что плохо и для настольных систем, так это менее производительное встроенное графическое ядро в Kirin 9000S/C — оно, по разным оценкам, на 20%-30% медленнее, чем в Kirin 9000. Вероятно, на 7 нм компания не смогла сделать GPU быстрее, но хотя у 9000S/C есть и другие недостатки даже по сравнению с моделью 9000 четырехлетней давности, это всё равно достаточно мощные процессоры для многих задач. Правда, для бытовых компьютеров мы бы советовали всё же выбрать конфигурацию с 16 ГБ встроенной памяти, ведь 8 ГБ хватает не везде, а выполнить модернизацию не получится.
Скорость универсальных вычислительных ядер в Kirin 9000C больше всего сдерживают низкие тактовые частоты: максимальная частота лучшего ядра процессора менее 2,5 ГГц, и пусть ядер тут уже восемь, а не четыре, как у Loongson, но половина из них — довольно хилые архитектурно энергоэффективные ядра с частотой лишь до 1,5 ГГц. Так что Kirin 9000C принципиально не способен конкурировать с мощными современными процессорами AMD и Intel, имеющими 16 ядер и более, работающих на частотах почти в 6 ГГц. Есть некоторая надежда на дальнейший прогресс в плане улучшения вычислительных ядер, ведь в мобильной версии Kirin 9020 уже применяется более новое ядро Taishan с лучшим показателем производительности на такт, но и ему сильно мешает недостаток тактовой частоты. А ее просто так не повысить, не ухудшив другие показатели — те же AMD и Intel долго работали над своими архитектурами для ее повышения, и не всегда это проходило удачно.
Еще сложнее — решение вопроса по отставанию китайцев по технологиям производства от западных компаний, но об этом мы уже говорили. Но даже это не главное, ведь тот же Ryzen 5 1500X выполнен еще по техпроцессу 14 нм, однако показывает производительность в среднем не хуже уровня Kirin 9000C, произведенного по 7-нанометровой технологии — даже при меньшем общем количестве ядер. Про Core i3-12100 и не говорим, этот четырехъядерный процессор Intel явно быстрее, а ведь в своей линейке это один из самых простых продуктов, есть еще и Core i9-12900K с большим количеством вычислительных ядер и более высокой тактовой частотой. Так что удел Kirin 9000C мало отличается от того, что мы определили в прошлой статье с рассказом о полностью китайском процессоре Loongson 3A6000: конкурировать с западными решениями они не могут, впереди еще очень много работы для достижения такого уровня. Остается лишь надеяться, что отставание китайцев будет сокращаться.
Причем, в отличие от ранее протестированного процессора Loongson, использующего полностью собственную вычислительную архитектуру LoongArch, у Kirin 9000C на основе архитектуры ARM встречается несколько меньше проблем в виде недостатка родных версий слабо распространенного ПО, но они всё же есть. Так что нужно обратить особое внимание и на программную часть — в том числе и на специфические оптимизации под ARM и конкретные ядра HiSilicon Taishan, ведь все их возможности наверняка еще не раскрыты в существующем ПО. В остальном же настольная платформа у Huawei вполне жизнеспособна, ее можно использовать в офисном и домашнем форматах, не предъявляющих сверхтребований к комфорту и производительности. Если устранить некоторые из существующих недостатков и продолжать усиливать ядра собственного дизайна, то системы на основе процессоров серии Kirin вполне способны стать подходящими и для использования в более ресурсоемких применениях.