Компания Nvidia уже представила те самые ускорители для ИИ, предназначенные для Китая, о которых мы говорили сегодня ранее.
Как и сообщалось, анонсировано три модели: HGX H20, L20 PCIe и L2 PCIe. Они довольно сильно отличаются друг от друга, а все параметры можно видеть в таблице.
Как видим, L20 и L2 основаны на игровой архитектуре Ada Lovelace, тогда как H20 является родственником H100, опираясь на архитектуру Hopper, специально разработанную для ускорителей для ИИ.
При этом по производительности при расчётах с одинарной точностью быстрее всех не H20, а L20. Но для ИИ часто важнее вычисления INT8, и вот тут H20 быстрее. Впрочем, даже ей далеко не то что до RTX 4090, а и до RTX 4080: 296 против 320 TFLOPS.
Что касается той самой производительности, из-за которой и H100, и RTX 4090 попали под запрет в рамках новых санкций США, напомним, показатель не должен превышать 4000 TOPS. Так вот у H100 речь идёт почти о 16 000 TOPS, у RTX 4090 это 5258 TOPS, а H20 предлагает лишь 2368 TOPS, что меньше, чем у RTX 4080.
Новые адаптеры партнёрам начнут отгружать уже в декабре.