Новое поколение NVIDIA Maximus на базе архитектуры Kepler

7 августа 2012 на SIGGRAPH 2012 было представлено второе поколение платформы для рабочих станций NVIDIA Maximus, теперь на архитектуре Kepler. Этот материал написан по итогам пресс-брифинга с американской штаб-квартирой NVIDIA и официальной премьеры нового поколения Maximus на SIGGRAPH 2012, откуда велась прямая онлайн видео-трансляция всех проходящих мероприятий. Спешим успокоить читателей: сайт iXBT.com пока ещё не превратился в рупор корпоративного маркетинга, поэтому в данном материале не было использовано ни одно предложение из пресс-релиза. Все мысли автора предлагаются как дополнение к официальным материалам.

Итак, сразу скажем, что цифра 2 официально с Maximus second generation не используется, также как Quadro и Tesla на Kepler не меняются. Но их можно будет различить по букве K в маркировке карт, например, Quadro K5000, Tesla K20.

Напомним, первое поколение Maximus было представлено в ноябре 2011 года и базировалось на графической плате Quadro + одной или нескольких вычислительных платах Tesla (читайте наш разговор с Nvidia в статье iXBT.com: NVIDIA Quadro и Maximus). В первую очередь, NVIDIA Maximus предназначен для профессионального применения. Наибольшая отдача была зафиксирована в наиболее ресурсоёмких задачах, там где есть что считать, и время расчётов измеряется в часах: научные расчеты, моделирование и трассировка лучей в графике. Во втором поколении Maximus принципиальных изменений не произошло. Это по прежнему связка из графической и вычислительной плат, вероятно поэтому название осталось без изменений. Однако теперь технология или платформа Maximus продвигается более активно и более цельно. Если предыдущее поколение виделось в системе как две разные карты, с дублированием функции и даже необходимостью ручного управления (с чем мы столкнулись во время нашего первого практического знакомства), то сейчас на уровне драйверов неразбериха полностью преодолена даже в первом поколении. Второе поколение — это и вовсе не просто две карты, а единое законченное решение. Более того, благодаря системе сертификации можно будет спокойно покупать готовую рабочую станцию c Maximus и сразу начинать работать, безо всякой дополнительной настройки. О выходе рабочих станций с новым Maximus уже заявили HP, Dell, Lenovo и Fujitsu, плюс отечественные и зарубежные системные интеграторы и многочисленные партнеры Nvidia.

Период становления на ноги Maximus пройден. Из перспективного эксперимента Maximus превращается ни много ни мало в персональный вычислительный центр внутри обычной рабочей станции. В то, что раньше называлось supercomputer, а сейчас high performance computing. Принципиальное и качественное отличие Maximus от вычислительного центра — поддержка привычными прикладными приложениями, которые используют инженеры и дизайнеры, а не только самописный софт и ручная параллелизация задач, что могут себе позволить лишь программисты и ученые. Ничто, впрочем, не мешает любым разработчикам изучить API и использовать Maximus в своих собственных программах.

И ещё раз вернёмся к важному вопросу: в чём отличие Maximus от профессионального графического ускорителя Quadro? В эффективности решения задач, требующих значительных вычислений и одновременно с этим высококачественной визуализации результата. Если графический ускоритель нагрузить и 3D визуализацией, и расчётами, как это происходило до появления Maximus, то непременно скажется нехватка вычислительных ресурсов GPU, пропускной способности различных шин и нехватки объема памяти из-за конфликта интересов вычислительного и графического API (в типичном случае CUDA и OpenGL). Именно для решения этой проблемы и была выдвинута инициатива Maximus, где разделение на две карты повышает производительность от десятков процентов до нескольких раз, в зависимости от типа и масштаба выполняемой задачи. Более того, плата-вычислитель Tesla, созданная только для вычислений, с архитектурой Kepler раскрывается в полной мере. Помимо увеличившейся чистой скорости вычислений в GFlops, соотношение производительность на Ватт стало выше втрое. А, как известно, именно энергоэффективность — это единственное препятствие, которое сдерживает массовое распространение высокопроизводительных вычислений. Мегаваттная мощность и необходимость отвода огромного количества тепла — это отличительная черта всех суперкомпьютеров. В дополнение к этому, у больших вычислительных кластеров на базе CPU зачастую есть ограничения программной части специализированным ПО, которое призвано раскрыть уникальную архитектуру наиболее полно. Maximus дает перенос вычислений на уровень рабочих станций и ускорение расчётов на порядок. А это уже существенно меняет процесс работы с рабочей станцией, ведь вместо ожидания можно сделать больше полезной работы, например, увеличить количество создаваемых финальных вариантов. Конечно, Maximus никак не избежать адаптации под прикладное ПО на уровне драйверов, а прикладному ПО, 3D редакторам и прочим программам, необходимо также умение использования всех особенностей железа, если мы говорим о максимальной отдаче, а не просто о десятках процентов прироста скорости, которые автоматически получаются в существующих версиях. Ранний («бумажный») анонс Maximus как раз способствует активизации партнёров NVIDIA и дорелизной подготовки всего ПО, чтобы конечный потребитель не получил сырой продукт в момент старта продаж. Именно для этого введена программа сертификации ISV (партнёров, поставщиков ПО) и ведётся взаимная адаптация драйверов и прикладного ПО. Поддерживаемыми операционными системами Maximus объявлены Windows и Linux.

В настоящий момент существуют только мобильные Quadro Kepler, десктопные пока есть лишь в инженерных образцах, серийные изделия выйдут в октябре 2012. Tesla Kepler появится ещё позже, в декабре 2012. В анонсе делается упор на Quadro K5000 и Tesla K20. Однако со временем обновленная линейка моделей Kepler получит расширение как вверх, так и вниз. Это связано в первую очередь с тем, что в отдельных задачах мощность Quadro K5000 зачастую будет являться избыточной, а затраты неоправданно высокими. Мощный ускоритель Quadro K5000 является прямой заменой Quadro 5000, при той же самой цене (для рынка США $2249 MSRP).

Главные особенности NVIDIA Quadro K5000

количество текстур 1 миллион прямо в памяти видеокарты (Bindless Textures), что ранее было недоступно и требовало участия CPU
новое сглаживание FXAA, на смену MSAA (подробнее в статье iXBT.com о NVIDIA GK104)
новое сглаживание TXAA учитывает время (буква T от temporal), результат приближен к сглаживанию в кинематографическом рендеринге
увеличенный до 4 ГБ объем кадрового буфера
аппаратное кодирование в H.264, включая профили high и stereo
интерфейс PCIe-3 вдвое быстрее PCIe-2
Поддержка 4 мониторов на каждой карте K5000
Display Port 1.2 с максимальным разрешением 3840×2160

Главные особенности NVIDIA Tesla K20

втрое большая производительность на Ватт (SMX)
средства управления параллелизмом графический ядер (Dynamic Parallelism)
правильное взаимодействие с многоядерными CPU (Hyper-Q GPU)

В интернете размещены две живые демонстрации работы Kepler. В обоих случаях указывается, что это именно Maximus Kepler. В первом ролике V-Ray работает впечатляюще быстро, но явно не в максимальном качестве. Надо сказать, что рендеринг можно настраивать и получить гораздо более убедительный результат, немного пожертвовав «магией реального времени». Здесь же явно была цель показать именно скорость и работоспособность технологии уже сейчас. Делать какие-то выводы об окончательной производительности преждевременно, пока не будет финальных продуктов и релизных версий драйверов.

Interactive 3D rendering with Autodesk Maya, Chaos Group V-Ray RT 2.0 and NVIDIA Maximus

Computational Fluid Dynamics (CFD) with RTT DeltaGen, FluidDyna, and NVIDIA Maximus

Дополнительная информация находится на официальном сайте NVIDIA.

20 августа 2012 Г.

Максим Лядов

�� NVIDIA Maximus �� Kepler � ��

�� NVIDIA Maximus �� Kepler

7 �� 2012 �� SIGGRAPH 2012 �� NVIDIA Maximus, �� Kepler. �� -�� -�� NVIDIA � �� Maximus �� SIGGRAPH 2012, �� -�� . �� : �� iXBT.com �� , �� -��. �� .

��, �� , �� 2 �� Maximus second generation �� , �� Quadro � Tesla �� Kepler �� . �� K � �� , ��, Quadro K5000, Tesla K20.

��, �� Maximus �� 2011 �� Quadro + �� Tesla (�� Nvidia � �� iXBT.com: NVIDIA Quadro � Maximus). � �� , NVIDIA Maximus �� . �� , �� , � �� : �� , �� . �� Maximus �� . �� , �� . �� Maximus �� . �� , � �� (� �� ), �� . �� — �� , � �� . �� , �� c Maximus � �� , �� . � �� Maximus �� HP, Dell, Lenovo � Fujitsu, �� Nvidia.

�� Maximus ��. �� Maximus �� . � ��, �� supercomputer, � �� high performance computing. �� Maximus �� — �� , �� , � �� , �� . ��, ��, �� API � �� Maximus � �� .

� �� : � �� Maximus �� Quadro? � �� , �� . �� 3D ��, � ��, �� Maximus, �� GPU, �� -�� API (� �� CUDA � OpenGL). �� Maximus, �� , � �� . �� , ��-�� Tesla, �� , � �� Kepler �� . �� GFlops, �� . �, �� , �� — �� , �� . �� — �� . � �� , � �� CPU �� , �� . Maximus �� . � �� , �� , ��, �� . ��, Maximus �� , � �� , 3D �� , �� , �� , � �� , �� . �� («��») �� Maximus �� NVIDIA � �� , �� . �� ISV (��, �� ) � �� . �� Maximus �� Windows � Linux.

� �� Quadro Kepler, �� , �� 2012. Tesla Kepler �� , � �� 2012. � �� Quadro K5000 � Tesla K20. �� Kepler �� , �� . �� , �� Quadro K5000 �� , � �� . �� Quadro K5000 �� Quadro 5000, �� (�� $2249 MSRP).