Эксперимент в виртуальной реальности: как мы учимся принимать решения, наблюдая за другими?

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

4 июня 2024, 21:54

В мире, где информация распространяется со скоростью света, умение ее фильтровать и использовать становится ключевым фактором успеха. Это особенно актуально для коллективных систем, будь то стаи животных, человеческие сообщества или робототехнические комплексы. Индивидуумы постоянно сталкиваются с дилеммой: полагаться на собственный опыт или следовать примеру успешных собратьев?

Игнорирование чужого опыта может привести к упущению ценных знаний, в то время как слепое подражание ограничивает самостоятельные исследования и грозит коллективной деградацией. Этот баланс между личным и социальным имеет первостепенное значение во множестве ситуаций: от поиска пищи в природе до разработки программного обеспечения.

Для изучения этих механизмов в действии, ученые разработали инновационный эксперимент, погружающий участников в виртуальную реальность, где им предстоит сообща искать ресурсы в условиях, имитирующих природные. Группы из четырех человек отправляются в виртуальный «замок» на поиски спрятанных монет, оснащенные «металлоискателями» и возможностью наблюдать за действиями друг друга.

Эксперимент в виртуальной реальности, иллюстрация

Автор: Designer

Виртуальный поиск: балансируя между индивидуализмом и коллективизмом

Участникам эксперимента предлагается два типа среды: в одном монеты распределены равномерно, в другом сконцентрированы в нескольких «богатых» местах. Теория игр, изучающая подобные сценарии, предполагает, что в условиях ограниченных ресурсов индивиды склонны «паразитировать», присоединяясь к тем, кто уже нашел «клад».

a Участники в группах по четыре человека искали круглые ресурсные пятна в квадратной среде. Металлоискатель загорался, когда они обнаруживали патч. Участники могли наблюдать друг за другом в режиме реального времени и принимать решение о присоединении к другим игрокам, обнаружившим заплату (эксплуатация игроков обозначается анимацией копания; см. аватар справа). b После того как участники обнаружили заплату или присоединились к другим, они начали добывать монеты в мини-игре, нажимая на символы монет, появляющиеся на экране с интервалом в 2 секунды. c Участники выполнили четыре раунда задания в экспериментальной схеме 2 x 2. Каждая группа провела два раунда в концентрированной среде (5 патчей с 48 монетами в каждом) и два раунда в распределенной среде (15 патчей с 16 монетами в каждом). Цветные точки и линии представляют собой снимки текущего положения четырех игроков, а также траектории их движения в течение последней минуты. В светло-зеленых патчах осталось меньше монет. Половина групп стимулировалась на групповом уровне, а половина — на индивидуальном. d Вычислительный подход использует переменные, зависящие от состояния, чтобы распределить участников по скрытым состояниям в каждый момент времени: «Индивидуальная разведка» (I; самостоятельный поиск ресурсных патчей) или «Социальная релокация» (S; использование социальной информации и приближение к успешным членам группы). Модель одновременно определяет вероятности перехода между скрытыми состояниями (поскольку «Эксплуатация» E известна, нам нужно только явно моделировать переходы между I и S). Мы моделируем (зависящее от времени) влияние предикторов состояния на вероятность прекращения разведки и перехода к социальному перемещению, PI->S. Изображения монет воспроизведены по лицензии Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) с сайта https://www.pngall.com/usd-crypto-coin-png.

Автор: Deffner, D., Mezey, D., Kahl, B. et al. Collective incentives reduce over-exploitation of social information in unconstrained human groups. Nat Commun 15, 2683 (2024). https://doi.org/10.1038/s41467-024-47010-3 CC-BY 4.0 Источник: www.nature.com

Однако, такая стратегия, выгодная для отдельного участника, может навредить коллективу в целом, ведь чрезмерное скопление искателей на одном участке ограничивает параллельный поиск новых ресурсов.

Для проверки этой гипотезы, ученые ввели два типа мотивации: индивидуальную, где вознаграждение зависит от личного успеха, и коллективную, где участники получают бонус за общий результат группы. Предполагалось, что коллективная мотивация снизит желание «паразитировать», так как участники будут заинтересованы в общем успехе, а не только в личной выгоде.

a Монеты, собранные в зависимости от условий стимулирования и среды (концентрированные — синим, распределенные — зеленым). Каждый кружок представляет один раунд на участника (n = 160 участников), более крупные заполненные точки представляют апостериорные средние (а также 90 %-ные HPDI) из байесовской многоуровневой модели Пуассона. b Различия в производительности между условиями стимулирования (положительные значения указывают на преимущество группового стимулирования), рассчитанные как вероятность эксплуатации патча в 1-минутных интервалах (апостериорные средние и 90 %-ные HPDI; n = 160). c Апостериорные коэффициенты скрафтинга (условные вероятности того, что игроки присоединятся к участку, где они наблюдали хотя бы одного члена группы, эксплуатирующей патч) в зависимости от условий стимулирования и среды. d Среднее количество монет, собранных одной особью, в зависимости от индивидуальных коэффициентов скрафтинга (с 90% HPDI; вверху; n = 160) и на группу в зависимости от плотности фуражиров (т.е, e (Среднее) количество монет за раунд на особь (вверху; n = 160) и группу (внизу; n = 40) в концентрированной и распределенной среде в зависимости от расстояния (стандартизированное среднее расстояние до других игроков). Линии и интервалы неопределенности показывают эффекты многоуровневых регрессий, учитывающих исходные различия между условиями стимулирования и индивидуальную и групповую изменчивость как интерцептов, так и наклонов (прозрачный текст, если 90% HPDI перекрывает 0).

Результаты эксперимента: индивидуальный успех vs коллективная эффективность

Результаты эксперимента подтвердили прогнозы: участники, мотивированные на коллективный результат, демонстрировали более стабильную эффективность вне зависимости от типа среды. Индивидуалисты же, наоборот, показывали худшие результаты в среде с концентрированными ресурсами, где их стремление «паразитировать» приводило к скоплению на одном участке и снижению эффективности поиска.

a Полные апостериорные распределения (прозрачные кривые) и 90%-ные HPDI (более темные области) для влияния различных предикторов состояния на вероятность того, что участники переключатся с индивидуального исследования на социальное перемещение в зависимости от окружения (концентрированное в синем, распределенное в зеленом) и условий стимулирования. В верхней строке показаны базовые вероятности переключения во всех ситуациях, в которых участники наблюдают (a) успешного игрока (игроков), в остальных строках — отклонения от этого ожидания на шкале логитов. b Успех (среднее количество собранных монет на одного человека; n = 160) в концентрированной (слева) и распределенной (справа) средах как функция веса решения на индивидуальном уровне. Линии и интервалы неопределенности показывают эффекты, полученные с помощью логнормальных регрессионных моделей, учитывающих различия в исходном успехе между условиями стимулирования (указано выше, прозрачный текст, если 90% HPDI перекрывает 0).

Помимо этого, ученые разработали специальную компьютерную модель, позволяющую анализировать скрытые механизмы принятия решений. Эта модель, основанная на принципах «скрытой марковской цепи», отслеживает изменения в поведении участников и выделяет два ключевых состояния: «индивидуальное исследование» и «социальное перемещение».

100 случайных выборок из апостериорного распределения (прозрачные линии), а также апостериорные средние (сплошные линии) для влияния различных предикторов состояния с течением времени в каждом раунде в зависимости от условий стимулирования и окружения (концентрированные — синим, распределенные — зеленым). В первом столбце показаны базовые вероятности переключения во всех ситуациях, в которых участники наблюдают (а) успешного игрока (игроков), в следующих столбцах — отклонения от этого ожидания в логитовой шкале.

Раскрывая механизмы принятия решений: роль социальных сигналов

Модель показала, что участники, мотивированные на коллективный результат, со временем начинали действовать более избирательно, используя социальную информацию только в тех случаях, когда она действительно полезна. Это позволило им избежать ловушки чрезмерного подражания и повысить эффективность коллективного поиска.

Веса регрессии гауссова процесса с временным лагом (включая 90% HPDI), предсказывающие успех коллективной кормежки (количество игроков, использующих участок) на основе (а) расстояния (среднее попарное расстояние между игроками) и (б) видимости (количество визуальных связей между членами группы, от 0, когда никто не смотрит на других, до 12, когда все смотрят на других) на разных временных интервалах в зависимости от условий стимулирования и среды (концентрированные — синий, распределенные — зеленый).

В заключении, исследование не только подтверждает прогнозы теоретических моделей, но и раскрывает сложные механизмы принятия решений в условиях коллективного взаимодействия.

Оказалось, что коллективная мотивация, в сочетании с грамотным использованием социальной информации, способствует повышению эффективности групповой деятельности. Эти результаты имеют значение не только для понимания поведения людей, но и для разработки эффективных стратегий управления коллективными системами в различных сферах, от робототехники до социальных сетей.

Как объяснить, что в эксперименте одиночки показывали лучшие результаты, чем группы, хотя коллективный разум считается более эффективным?

В данном эксперименте участники групп, мотивированные на индивидуальный успех, действовали эгоистично, стремясь «паразитировать» на чужих находках. Это приводило к скоплению на одном участке, конкуренции за ограниченный ресурс и снижению общей эффективности. Одиночки же, не отвлекаясь на социальную информацию, действовали более рационально, исследуя большую площадь.

Как можно использовать выводы исследования для оптимизации работы коллективов в реальном мире?

Выводы исследования подчеркивают важность коллективной мотивации и избирательного использования социальной информации. В компаниях, например, можно внедрять системы поощрения, стимулирующие сотрудничество и обмен опытом, а также создавать информационные фильтры, предотвращающие информационный перегруз и «эффект толпы».

Модель «скрытой марковской цепи» используется для анализа поведения животных. Как она может помочь в изучении социальных взаимодействий людей?

Модель «скрытой марковской цепи» позволяет выделить скрытые паттерны поведения, которые не всегда проявляются в явных действиях. В данном исследовании она помогла выявить два ключевых состояния участников: «индивидуальное исследование» и «социальное перемещение», а также проследить динамику перехода между этими состояниями под влиянием различных факторов.

Исследование проводилось в виртуальной реальности. Насколько его результаты применимы к реальному миру?

Виртуальная среда в данном эксперименте была максимально приближена к реальности: участники сталкивались с ограниченным полем зрения, физическими препятствиями и необходимостью принимать решения в условиях неопределенности. Поэтому полученные результаты, вероятно, отражают общие закономерности социального поведения, актуальные и для реального мира.