«Читая» ваши мысли, искусственный интеллект теперь способен генерировать изображения

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

Новая технология на базе искусственного интеллекта может «читать» мысли. Это означает, что она может считывать ваши мозговые волны, определять, о чем вы думаете, и переводить их в изображение в очень высоком разрешении. Она настолько точна, что может даже улавливать формы и цвета. Исследователи из Высшей школы передовых биологических наук Университета Осаки в Японии использовали Stable Diffusion (стабильная диффузия), одну из самых известных систем искусственного интеллекта, генерирующих изображения.


Исследование, опубликованное в декабре прошлого года, состояло из показа различных изображений группе добровольцев. Эти изображения генерировали стимулы в активности мозга, которые ученые смогли зафиксировать благодаря сканированию с помощью МРТ. Полученная информация транслировалась с помощью семантических декодеров и, наконец, использовалась в качестве входных данных для создания окончательного изображения со стабильной диффузией.

Исследовательская группа утверждает, что она впервые использует инструмент генеративного искусственного интеллекта в качестве стабильной диффузии в эксперименте по «чтению» мыслей и созданию визуальных воссозданий активности мозга.

Как работает ИИ, который может «читать» мысли?

Команда Университета Осаки включила в публикацию своего исследования сравнение между изображениями, которые они показывали добровольцам, и теми, которые в конечном итоге были получены с помощью стабильной диффузии. Полученные изображения не совсем совпадают с оригиналами, но они воспроизводят большинство основных элементов. Например, формы, цвета и перспектива. Финальные картинки также различались между участниками, но это связано с тем, что у каждого человека свой способ интерпретации действительности.

Японской команде удалось «прочитать» мысли добровольцев не только благодаря искусственному интеллекту стабильной диффузии. В исследовании участвовали и другие ключевые процессы для преобразования активности мозга в данные, чтобы их можно было прочитать и использовать с помощью этого инструмента стабильной диффузии. Достоинством этого метода является упрощение создания графических представлений чрезвычайно высокого разрешения и семантической точности.

Исследователи признали, что в некоторых предыдущих исследованиях удалось получить изображения в высоком разрешении. Однако они объяснили, что это стало возможным после целого процесса «обучения и настройки» генеративных моделей, что является очень сложной задачей.


Университет Радбуда в Нидерландах, например, опубликовал в 2022 году, что им удалось обучить модель ИИ «читать» мысли. Метод был аналогичным. Они показывали разным участникам фотографии людей, генерировали информацию из МРТ-сканов и создавали новые изображения с помощью своей модели искусственного интеллекта.

Как работает искусственный интеллект Stable Diffusion?

Искусственный интеллект для «чтения» мыслей Университета Радбауд имел высокие требования по соответствию пола, возраста и позе людей на фотографиях. Но опять же, требовался «тренировочный» процесс, которого японская команда избежала благодаря стабильной диффузионной платформе, созданной компанией Stability AI.

Стабильная диффузия — это открытый исходный код, в отличие от аналогичных инструментов, таких как DALL-E. Она также имеет логику автоматического обучения: она предлагает все более точные результаты по мере использования.

Трио художников подали в суд на компанию в январе прошлого года за нарушение авторских прав «миллионов художников». В феврале этому примеру последовало американское фотоагентство Getty Images. Оно заверило, что Stable Diffusion использовала миллионы фотографий без разрешения агентства для создания своих изображений.