Как свет поможет вам выиграть в лотерею: новый квантовый алгоритм «бандита»

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Рассуждения | Оффтопик

Азартные игры и квантовая физика — на первый взгляд, это две совершенно разные области, которые не имеют ничего общего. Однако, недавнее исследование показало, что квантовые эффекты могут быть использованы для улучшения процесса принятия решений в ситуациях, где необходимо выбирать между несколькими вариантами с неизвестными вероятностями выигрыша. Такие ситуации называются задачами «бандита», по аналогии с игровыми автоматами, которые также называются «однорукими бандитами».

Автор: Bing image creator

Задача «бандита» — это тип задачи обучения с подкреплением, где агент должен принимать решения в неопределенной среде, чтобы получать награды. Каждое решение агента связано с определенной вероятностью получения награды, но эти вероятности не известны агенту заранее. Поэтому агент должен балансировать между исследованием разных вариантов, чтобы узнать их характеристики, и использованием того, что он уже знает, чтобы делать оптимальные выборы. Это называется дилеммой исследования-использования.

Задача «бандита» может быть применена к различным практическим сценариям, где необходимо оптимизировать стратегию выбора в условиях неопределенности. Например, задача «бандита» может быть использована для определения лучшего варианта рекламы для конкретного пользователя, для выбора лучшей стратегии в играх или для управления трафиком в сети.

Существует множество алгоритмов, которые пытаются решить задачу «бандита», используя различные подходы и эвристики. Одним из наиболее популярных алгоритмов является Q-обучение, которое основано на оценке ожидаемой награды для каждой пары состояние-действие. Q-обучение обновляет эти оценки на основе опыта агента и стремится к их сходимости к оптимальным значениям.

Однако, Q-обучение имеет ряд недостатков, таких как медленная скорость обучения, высокая чувствительность к шуму и нестабильность при работе в динамических средах. Кроме того, Q-обучение требует большого количества вычислительных ресурсов и памяти для хранения и обновления значений Q.

В этом контексте появляется интерес к использованию квантовых эффектов для улучшения процесса принятия решений в задаче «бандита». Квантовая физика предоставляет новые возможности для обработки информации, такие как параллелизм, суперпозиция, запутанность и интерференция. Эти эффекты могут быть использованы для ускорения вычислений, увеличения точности и надежности, а также для создания новых типов алгоритмов.

В недавнем исследовании ученые представили фотонный алгоритм «бандита», который использует квантовое вмешательство фотонов для улучшения процесса принятия решений. Они разработали модифицированный алгоритм Q-обучения «бандита», который тестируется в динамической среде, где агент должен перемещаться по сетке клеток с разными наградами. Они показали, что их алгоритм способен быстрее и точнее находить оптимальные значения Q для каждой пары состояние-действие, чем обычный алгоритм Q-обучения. Они также продемонстрировали, что их алгоритм может работать параллельно с несколькими агентами, избегая конфликтующих решений благодаря квантовому вмешательству фотонов.

Это исследование открывает новые горизонты для применения квантовых технологий к задачам обучения с подкреплением и азартным играм. Возможно, в будущем мы увидим квантовые казино, где игроки смогут делать лучшие ставки, используя свет.

Вот тут очень большая статья с формулами и графиками. В случае востребованности, сделаю перевод

Ничего не понятно, давай проще

Свет состоит из маленьких частиц, которые называются фотонами. Фотоны могут быть в разных состояниях, которые определяют их свойства, такие как цвет, яркость или поляризация. Фотоны могут также быть в квантовой суперпозиции, то есть в нескольких состояниях одновременно. Это значит, что фотон может представлять несколько вариантов выбора одновременно.

Когда фотоны проходят через специальные приборы, которые называются интерферометрами, они могут взаимодействовать друг с другом и изменять свои состояния. Это называется квантовым вмешательством. Квантовое вмешательство может производить разные результаты в зависимости от того, какие варианты выбора представляют фотоны. Эти результаты могут быть измерены и использованы для оценки вероятностей выигрыша каждого варианта.

Автор: Bing image creator

Например, представь, что ты хочешь купить лотерейный билет, и у тебя есть три автомата: А, Б и В. Каждый автомат имеет свою вероятность выдачи приза, но ты не знаешь эти вероятности. Ты можешь использовать свет, чтобы узнать их. Ты можешь сделать так, что один фотон представляет автомат А, другой фотон представляет автомат Б, а третий фотон представляет автомат В. Ты можешь отправить эти фотоны через интерферометры, которые заставят их взаимодействовать друг с другом и изменить свои состояния. Тогда ты можешь посмотреть на цвет и яркость фотонов и понять, какой автомат имеет больше шансов выдать приз. Например, если фотон, который представлял автомат А, стал красным и ярким, а другие фотоны стали тусклыми и серыми, то это значит, что автомат А имеет больше шансов выдать приз, чем автоматы Б и В. Таким образом, ты можешь выбрать лучший автомат и увеличить свои шансы на успех.

Инт-ферм-что?

Интерферометр лабораторный
Источник: biolight.ru

Интерферометры — это приборы, которые используют явление интерференции волн, обычно световых, для измерения различных параметров, таких как длина, показатель преломления, неровность поверхности и т. д. Интерференция — это когда две или более волны складываются друг с другом, создавая новую волну с измененной амплитудой и фазой. Интерферометры позволяют анализировать разность фаз между интерферирующими волнами, которая зависит от оптического пути, который они проходят.

Существует много типов интерферометров, которые отличаются по принципу работы, конструкции и области применения. Например, интерферометр Майкельсона состоит из полупрозрачного зеркала, которое разделяет пучок света на два луча, которые отражаются от двух других зеркал и снова объединяются на экране. Интерферометр Жамена состоит из двух параллельных стеклянных пластинок, между которыми проходит свет. Интерферометр Рождественского состоит из двух кристаллов с разной двойной преломлением, которые разделяют свет на две поляризованные волны.

Интерферометры широко используются в науке и технике для точных измерений и исследований. Например, интерферометры применяются для проверки качества оптических элементов и систем, для анализа спектров поглощения и излучения веществ, для создания телескопов с высоким разрешением в астрономии, для обнаружения гравитационных волн в физике и т. д.

Как можно создать квантовую суперпозицию состояний фотонов?

Автор: Bing image creator

Для создания квантовой суперпозиции состояний фотонов можно использовать различные методы, такие как лазеры, оптические волокна, поляризаторы, фазовые модуляторы и т. д. Один из способов состоит в том, чтобы использовать лазерный импульс, который проходит через полупрозрачное зеркало, которое разделяет его на два луча. Затем каждый луч проходит через поляризатор, который изменяет его поляризацию на определенный угол. После этого лучи снова объединяются на другом полупрозрачном зеркале, которое создает интерференцию между ними. В результате получается квантовая суперпозиция состояний фотонов с разными поляризациями.

Как можно измерить результаты квантового вмешательства фотонов?

Для измерения результатов квантового вмешательства фотонов можно использовать различные детекторы, такие как фотодиоды, фотомножители, аваланчные фотодиоды и т. д. Один из способов состоит в том, чтобы использовать два детектора, которые расположены на разных выходах интерферометра. Каждый детектор регистрирует количество фотонов, которые попадают на него, и выдает электрический сигнал. Затем эти сигналы анализируются с помощью компьютера, который вычисляет вероятности выигрыша каждого варианта выбора.

Как можно улучшить производительность фотонного алгоритма «бандита»?

Для улучшения производительности фотонного алгоритма «бандита» можно использовать различные стратегии, такие как адаптивный выбор параметров обучения, динамическое изменение количества фотонов и интерферометров, использование дополнительных квантовых ресурсов и т. д. Один из способов состоит в том, чтобы использовать алгоритм оптимизации гиперпараметров, который подбирает оптимальные значения скорости обучения и коэффициента исследования для каждой задачи «бандита». Это позволяет агенту более эффективно балансировать между исследованием и использованием своего знания.

Источник: https://scitechdaily.com/gambling-meets-quantum-physics-new-bandit-algorithm-uses-light-for-better-bets/#google_vignette

15 комментариев

Burkeno
Всего лишь перевод?
Сам не смог подобное написать?
102976506796884933242@google
Найди аналог и покажи мне
Burkeno
Аналог надо не искать в интернете, а самому писать!
102976506796884933242@google
Ну я тебе и говорю — ткни мне пальцем, где у меня копипаст
Burkeno
Источник: https://scitechdaily.com/gambling-meets-quantum-physics-new-bandit-algorithm-uses-light-for-better-bets/#google_vignette
102976506796884933242@google
Перейди по источнику и сравни объем и специфику данных
G
Так и не понял как ты посветишь фотоном на бандита однорукого и узнаешь что он выдаст?
102976506796884933242@google
Ну максимально простым языком говоря убрав все сравнения и аналогии — увидев массив комбинаций сразу, выигрышных в том числе, ты быстрее определишь, на каком автомате подкручен шанс, чем перебирая все комбинации по одному, дёргая за рычаг.
Я после работы ночью это пишу, и как-то в голове на тот момент не смог правильно сформулировать.
G
А кто тебе даст сразу все комбинации? Только по одной за раз
102976506796884933242@google
Фотоны могут также быть в квантовой суперпозиции, то есть в нескольких состояниях одновременно. Это значит, что фотон может представлять несколько вариантов выбора одновременно.
G
Это заведомо куета — ты будешь знать только то что ты проиграешь. А вот предсказание после неудач нескольких, что будет выигрыш то да. Но неудачи затратнее чем выигрыши иначе не выгодно будет делать казино
s
Avalanche = лавина, следовательно, лавинный фотодиод, а не «аваланчный».
109799430318398556977@google
Довольно интересно. Мне было бы интересно увидеть качественный перевод этой статьи…
117740950720926235689@google
Так и не понял главного. Как физические автоматы связаны с виртуальными представлениями в расчетах? Произвольно? Тогда, как при смене соответствий, будет сохраняться соответствие результатов?

Добавить комментарий

Сейчас на главной

Новости

Публикации

Обзор 7'' электронной книги ONYX BOOX Raphael с цветным дисплеем E-Ink Kaleido 3

5 июня компания ONYX BOOX начала продажи своей новой электронной книги Raphael в России. Этот тонкий ридер с 7-дюймовым цветным экраном E-Ink Kaleido 3 был назван в честь знаменитого художника...

Обзор беспроводных наушников-гарнитуры SuperEQ V16 от бренда Oneodio: баланс простоты и низкой стоимости

В поисках идеальных наушников для работы за компьютером, многие пользователи сталкиваются с проблемой выбора между качеством звука, комфортом ношения и функциональностью. Однако, беспроводные...

Обзор Kromix Colibri: беспроводной микрофон-монетка для смартфонов

Беспроводные микрофоны с креплением на магнитах наконец-то доступны не только в премиум-сегменте. Kromix Colibri — яркое тому доказательство. Вдобавок при цене около 6 500 руб здесь...

Уничтожаем конский щавель в огороде: проверенные способы

Дачники знают: сорняки — это настоящее испытание для терпения и умения. Они быстро заполоняют пространство, активно размножаются и беспощадно возвращаются каждый сезон. Среди этой...