Студенческий стартап разрабатывает очки IRL для глухих со скрытыми субтитрами

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

1 августа 2023, 10:30

Еще один отличный способ, которым дополненная реальность помогает уменьшить чувство изолированности от общества.

Том Прицки стал популярным на TikTok благодаря небольшому устройству дополненной реальности, которое будет расшифровывать ваши разговоры в режиме реального времени. Субтитры из реальной жизни, если хотите.

Прицкий вместе с соучредителем Мадхавом Лавакаре создали TranscribeGlass еще в 2021 году, чтобы глухим и слабослышащим людям не приходилось читать по губам.

Автор: Jason Carman

Рекламируя функцию, аналогичную той, которую старые Google Glass планировали предоставить потребителю, TranscribeGlass вместо этого добавляет небольшую приставку с дополненной реальностью сбоку от обычной пары очков, которая не только расшифровывает слова, произносимые человеком перед вами, но умудряется ловко игнорировать окружающие разговоры, которые в противном случае могли бы запутать транскрипцию.

Цель Притского смелая: «Решить проблему потери слуха». Он был основателем «первого в Стэнфорде клуба, посвященного защите интересов людей с нарушениями слуха», и ясно, что его страсть к технологиям росла вместе с усилиями на протяжении всей учебы, и теперь она объединяется здесь с TranscribeGlass.

В беседе с Джейсоном Карманом из Saturday Startup Stories он сказал, что «даже если вы дали кому-то идеальный слуховой аппарат, то он все равно может сломаться или звучать очень размыто и трудно для понимания».

Обходя эту проблему в целом, дизайн его и Лавакаре просто представляет пользователю транскрипцию сбоку экрана, поэтому он может сосредоточиться на разговоре, но при этом иметь возможность смотреть на человека, с которым он разговаривает.

Размер экрана немного мал, некоторые более длинные слова разбиты на две отдельные строки. Остается надеяться, что в конечном итоге они смогут изменить стиль шрифта.

Что действительно хорошо в этом проекте, так это то, что вы можете интегрировать его с чем угодно.

«Наша цель — быть независимыми от источника», — говорит Прицкий. — «Мы можем интегрировать любой API: Google Speech, Deepgram, Microsoft».

Ожидается, что окончательная модель с открытым исходным кодом и высокой доступностью будет стоить около 95 долларов, и технология постоянно совершенствуется.

Это, безусловно, то, за чем нужно следить, если вы относитесь к тому типу людей, которые в восторге от таких вещей, как тактильные костюмы, дающие глухим любителям концертов возможность испытать музыку.