7 августа 2012 на SIGGRAPH 2012 было представлено второе поколение платформы для рабочих станций NVIDIA Maximus, теперь на архитектуре Kepler. Этот материал написан по итогам пресс-брифинга с американской штаб-квартирой NVIDIA и официальной премьеры нового поколения Maximus на SIGGRAPH 2012, откуда велась прямая онлайн видео-трансляция всех проходящих мероприятий. Спешим успокоить читателей: сайт iXBT.com пока ещё не превратился в рупор корпоративного маркетинга, поэтому в данном материале не было использовано ни одно предложение из пресс-релиза. Все мысли автора предлагаются как дополнение к официальным материалам.
Итак, сразу скажем, что цифра 2 официально с Maximus second generation не используется, также как Quadro и Tesla на Kepler не меняются. Но их можно будет различить по букве K в маркировке карт, например, Quadro K5000, Tesla K20.
Напомним, первое поколение Maximus было представлено в ноябре 2011 года и базировалось на графической плате Quadro + одной или нескольких вычислительных платах Tesla (читайте наш разговор с Nvidia в статье iXBT.com: NVIDIA Quadro и Maximus). В первую очередь, NVIDIA Maximus предназначен для профессионального применения. Наибольшая отдача была зафиксирована в наиболее ресурсоёмких задачах, там где есть что считать, и время расчётов измеряется в часах: научные расчеты, моделирование и трассировка лучей в графике. Во втором поколении Maximus принципиальных изменений не произошло. Это по прежнему связка из графической и вычислительной плат, вероятно поэтому название осталось без изменений. Однако теперь технология или платформа Maximus продвигается более активно и более цельно. Если предыдущее поколение виделось в системе как две разные карты, с дублированием функции и даже необходимостью ручного управления (с чем мы столкнулись во время нашего первого практического знакомства), то сейчас на уровне драйверов неразбериха полностью преодолена даже в первом поколении. Второе поколение — это и вовсе не просто две карты, а единое законченное решение. Более того, благодаря системе сертификации можно будет спокойно покупать готовую рабочую станцию c Maximus и сразу начинать работать, безо всякой дополнительной настройки. О выходе рабочих станций с новым Maximus уже заявили HP, Dell, Lenovo и Fujitsu, плюс отечественные и зарубежные системные интеграторы и многочисленные партнеры Nvidia.
Период становления на ноги Maximus пройден. Из перспективного эксперимента Maximus превращается ни много ни мало в персональный вычислительный центр внутри обычной рабочей станции. В то, что раньше называлось supercomputer, а сейчас high performance computing. Принципиальное и качественное отличие Maximus от вычислительного центра — поддержка привычными прикладными приложениями, которые используют инженеры и дизайнеры, а не только самописный софт и ручная параллелизация задач, что могут себе позволить лишь программисты и ученые. Ничто, впрочем, не мешает любым разработчикам изучить API и использовать Maximus в своих собственных программах.
И ещё раз вернёмся к важному вопросу: в чём отличие Maximus от профессионального графического ускорителя Quadro? В эффективности решения задач, требующих значительных вычислений и одновременно с этим высококачественной визуализации результата. Если графический ускоритель нагрузить и 3D визуализацией, и расчётами, как это происходило до появления Maximus, то непременно скажется нехватка вычислительных ресурсов GPU, пропускной способности различных шин и нехватки объема памяти из-за конфликта интересов вычислительного и графического API (в типичном случае CUDA и OpenGL). Именно для решения этой проблемы и была выдвинута инициатива Maximus, где разделение на две карты повышает производительность от десятков процентов до нескольких раз, в зависимости от типа и масштаба выполняемой задачи. Более того, плата-вычислитель Tesla, созданная только для вычислений, с архитектурой Kepler раскрывается в полной мере. Помимо увеличившейся чистой скорости вычислений в GFlops, соотношение производительность на Ватт стало выше втрое. А, как известно, именно энергоэффективность — это единственное препятствие, которое сдерживает массовое распространение высокопроизводительных вычислений. Мегаваттная мощность и необходимость отвода огромного количества тепла — это отличительная черта всех суперкомпьютеров. В дополнение к этому, у больших вычислительных кластеров на базе CPU зачастую есть ограничения программной части специализированным ПО, которое призвано раскрыть уникальную архитектуру наиболее полно. Maximus дает перенос вычислений на уровень рабочих станций и ускорение расчётов на порядок. А это уже существенно меняет процесс работы с рабочей станцией, ведь вместо ожидания можно сделать больше полезной работы, например, увеличить количество создаваемых финальных вариантов. Конечно, Maximus никак не избежать адаптации под прикладное ПО на уровне драйверов, а прикладному ПО, 3D редакторам и прочим программам, необходимо также умение использования всех особенностей железа, если мы говорим о максимальной отдаче, а не просто о десятках процентов прироста скорости, которые автоматически получаются в существующих версиях. Ранний («бумажный») анонс Maximus как раз способствует активизации партнёров NVIDIA и дорелизной подготовки всего ПО, чтобы конечный потребитель не получил сырой продукт в момент старта продаж. Именно для этого введена программа сертификации ISV (партнёров, поставщиков ПО) и ведётся взаимная адаптация драйверов и прикладного ПО. Поддерживаемыми операционными системами Maximus объявлены Windows и Linux.
В настоящий момент существуют только мобильные Quadro Kepler, десктопные пока есть лишь в инженерных образцах, серийные изделия выйдут в октябре 2012. Tesla Kepler появится ещё позже, в декабре 2012. В анонсе делается упор на Quadro K5000 и Tesla K20. Однако со временем обновленная линейка моделей Kepler получит расширение как вверх, так и вниз. Это связано в первую очередь с тем, что в отдельных задачах мощность Quadro K5000 зачастую будет являться избыточной, а затраты неоправданно высокими. Мощный ускоритель Quadro K5000 является прямой заменой Quadro 5000, при той же самой цене (для рынка США $2249 MSRP).
Главные особенности NVIDIA Quadro K5000
- количество текстур 1 миллион прямо в памяти видеокарты (Bindless Textures), что ранее было недоступно и требовало участия CPU
- новое сглаживание FXAA, на смену MSAA (подробнее в статье iXBT.com о NVIDIA GK104)
- новое сглаживание TXAA учитывает время (буква T от temporal), результат приближен к сглаживанию в кинематографическом рендеринге
- увеличенный до 4 ГБ объем кадрового буфера
- аппаратное кодирование в H.264, включая профили high и stereo
- интерфейс PCIe-3 вдвое быстрее PCIe-2
- Поддержка 4 мониторов на каждой карте K5000
- Display Port 1.2 с максимальным разрешением 3840×2160
Главные особенности NVIDIA Tesla K20
- втрое большая производительность на Ватт (SMX)
- средства управления параллелизмом графический ядер (Dynamic Parallelism)
- правильное взаимодействие с многоядерными CPU (Hyper-Q GPU)
В интернете размещены две живые демонстрации работы Kepler. В обоих случаях указывается, что это именно Maximus Kepler. В первом ролике V-Ray работает впечатляюще быстро, но явно не в максимальном качестве. Надо сказать, что рендеринг можно настраивать и получить гораздо более убедительный результат, немного пожертвовав «магией реального времени». Здесь же явно была цель показать именно скорость и работоспособность технологии уже сейчас. Делать какие-то выводы об окончательной производительности преждевременно, пока не будет финальных продуктов и релизных версий драйверов.
Interactive 3D rendering with Autodesk Maya, Chaos Group V-Ray RT 2.0 and NVIDIA Maximus
Computational Fluid Dynamics (CFD) with RTT DeltaGen, FluidDyna, and NVIDIA Maximus
Дополнительная информация находится на официальном сайте NVIDIA.