Студенческий стартап разрабатывает очки IRL для глухих со скрытыми субтитрами

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

Еще один отличный способ, которым дополненная реальность помогает уменьшить чувство изолированности от общества.


Том Прицки стал популярным на TikTok благодаря небольшому устройству дополненной реальности, которое будет расшифровывать ваши разговоры в режиме реального времени. Субтитры из реальной жизни, если хотите.

Прицкий вместе с соучредителем Мадхавом Лавакаре создали TranscribeGlass еще в 2021 году, чтобы глухим и слабослышащим людям не приходилось читать по губам.

Автор: Jason Carman

Рекламируя функцию, аналогичную той, которую старые Google Glass планировали предоставить потребителю, TranscribeGlass вместо этого добавляет небольшую приставку с дополненной реальностью сбоку от обычной пары очков, которая не только расшифровывает слова, произносимые человеком перед вами, но умудряется ловко игнорировать окружающие разговоры, которые в противном случае могли бы запутать транскрипцию.

Цель Притского смелая: «Решить проблему потери слуха». Он был основателем «первого в Стэнфорде клуба, посвященного защите интересов людей с нарушениями слуха», и ясно, что его страсть к технологиям росла вместе с усилиями на протяжении всей учебы, и теперь она объединяется здесь с TranscribeGlass.

В беседе с Джейсоном Карманом из Saturday Startup Stories он сказал, что «даже если вы дали кому-то идеальный слуховой аппарат, то он все равно может сломаться или звучать очень размыто и трудно для понимания».


Обходя эту проблему в целом, дизайн его и Лавакаре просто представляет пользователю транскрипцию сбоку экрана, поэтому он может сосредоточиться на разговоре, но при этом иметь возможность смотреть на человека, с которым он разговаривает.

Размер экрана немного мал, некоторые более длинные слова разбиты на две отдельные строки. Остается надеяться, что в конечном итоге они смогут изменить стиль шрифта.

Что действительно хорошо в этом проекте, так это то, что вы можете интегрировать его с чем угодно.

«Наша цель — быть независимыми от источника», — говорит Прицкий. — «Мы можем интегрировать любой API: Google Speech, Deepgram, Microsoft».

Ожидается, что окончательная модель с открытым исходным кодом и высокой доступностью будет стоить около 95 долларов, и технология постоянно совершенствуется.

Это, безусловно, то, за чем нужно следить, если вы относитесь к тому типу людей, которые в восторге от таких вещей, как тактильные костюмы, дающие глухим любителям концертов возможность испытать музыку.