Вот почему GeForce RTX 50 такие мощные. Nvidia раскрыла новые подробности об архитектуре

В том числе об изменениях в блоках SM

Компания Nvidia продолжает делиться подробностями о видеокартах GeForce RTX 50 после анонса и перед стартом продаж. К примеру, мы уже видели тесты RTX 5090 в Cyberpunk 2077, а теперь пришёл черёд новых данных об архитектуре Blackwell и GPU. 

Вот почему GeForce RTX 50 такие мощные. Nvidia раскрыла новые подробности об архитектуре
фото WCCF Tech

Новые графические процессоры производятся по нормам 4 нм, а топовый GPU содержит 92 млрд транзисторов, что чудовищно много для игровой видеокарты.  

Производительность в задачах ИИ достигает 4000 TOPS, но это благодаря поддержке вычислений FP4. Производительность блоков трассировки лучей равна 380 TFLOPS, а вот в режиме FP32 производительность составляет 125 TFLOPS.  

Другие заметные улучшения включают поддержку DisplayPort 2.1 (UHBR20), поддержку PCIe 5.0 и 4K NVDEC/NVENC с цветами 4:2:2. 

Сравнивая вычислительные блоки SM архитектуры Ada Lovelace с Blackewell, нужно вспомнить, что её в прошлом поколении было разделение FP32 на два блока, один из которых мог выполнять только вычисления FP32, а другой мог выполнять как FP32, так и INT32. В архитектуре Blackwell компания удвоила пропускную способность своего блока INT32, что может помочь ускорить различные рабочие нагрузки и выполнение шейдеров, а тензорные ядра пятого поколения также предлагают вышеупомянутую удвоенную пропускную способность. 

Переходя к усовершенствованиям трассировки лучей, ядра RT четвёртого поколения представляют различные новые возможности, такие как механизм пересечения кластеров треугольников, который заменяет предыдущий механизм пересечения треугольников, оптимизированный для мегагеометрии и способный гораздо эффективнее обрабатывать кластеры мегагеометрии и стандартной геометрии. 

Движок Mega Geometry также имеет новый формат сжатия Triangle Cluster, который может быть распакован с помощью встроенного в чип движка Blackwell. Наконец, есть новый блок Linerar Swept Spheres, который ускоряет рендеринг RTX Hair and Fur. В итоге новые ядра RT обеспечивают в восемь раз большую скорость пересечения треугольников лучей, одновременно уменьшая объем памяти на 25%. 

15 января 2025 в 21:54

Автор:

| Источник: WCCF Tech

Все новости за сегодня

Календарь

январь
Пн
Вт
Ср
Чт
Пт
Сб
Вс
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31