OpenAI тестирует ПО Sora для генерации реалистичных видео из текстов и «оживления» изображений

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

Активно поддерживаемая Microsoft компания OpenAI, уже известная популярным ботом ChatGPT, готовит новый, революционный продукт Sora. Хотя разработки в сфере преобразования текстов в видео уже имеются, большой опыт стартапа, возможно, обеспечит ему преимущество на рынке.


Автор: OpenAI Источник: openai.com

Как сообщают в компании, сейчас новый ИИ проверяют на уязвимости. Более того, компания уже привлекла к сотрудничеству художников, дизайнеров и кинематографистов для получения откликов о работоспособности нового инструмента.

В OpenAI сообщают, что Sora уже может создавать довольно сложные сцены с многочисленными персонажами, поддержкой различных видов движений, а также точным отображением как объекта, так и фона. Более того, Sora может анимировать и статичные изображения.

Получивший невероятную популярность бот ChatGPT представили совсем недавно — в конце 2022 года, но он и ему подобные инструменты уже используются повсеместно. Генеративный ИИ способен сочинять письма и художественные тексты, стихотворения, и даже писать код. В скором времени появятся и коммерческие версии видео.

Конкуренцию OpenAI составляет признанная в России экстремистской Meta* с её моделью Emu — в компании намерены также конкурировать и с продуктами Microsoft, Google и Amazon, также активно развивающими ИИ-проекты.

Разработка Sora пока находится в процессе, компания подчёркивает, что модель может ошибаться при обработке некоторых пространственных деталей текстовых промптов, а также испытывает определённые трудности при попытках придерживаться определённых траекторий камеры.


OpenAI заявила, что разрабатываются и вспомогательные инструменты, позволяющие определить, что тот или иной видеоролик создали с помощью Sora. Более того, на её сайте подчёркивается, что специальные фильтры будут отклонять промпты, связанные с довольно востребованным гражданами контентом: видео для старшего возраста, сценами насилия, запросы на создание роликов с персонажами, похожими на медиаперсон и т. п.

При этом уже сегодня качество готовых видео не может не впечатлять — это уже мало похоже на робкие попытки первых генеративных ИИ-моделей создать видеоролики. С примерами можно ознакомиться на сайте компании. Не исключено, что в обозримом будущем даже простые пользователи при должном старании смогут создавать видеоконтент кинематографического качества.

  • * — Компания Meta (социальные сети Instagram и Facebook) - признана экстремистской организацией на территории Российской Федерации