Сюдон Хуанг из Microsoft Research уже давно занимается вопросом синхронного транскрибирования речи в текст. Проще говоря – распознавания и перевода голоса в текстовую информацию, что позволит, как предполагается, упростить работу журналистов, писателей, студентов и многих других. И вот в мае на конференции вице-президент компании Гарри Шам продемонстрировал возможность транскрипции в PowerPoint, которая позволит буквально голосом набирать подписи к слайдам.
В целом, подобные системы – уже не новинка. Есть браузерные версии Trint (Великобритания) и SwiftScribe от Baidu (Китай), которые уже работают и предлагают услуги по транскрибированию.
Однако в команде Хуанг идёт работа над синхронным переводом голоса в текст, поскольку все существующие на сегодня системы работают с ранее записанным текстов. По словам специалиста, уже достигнут хороший прогресс и с хорошим качеством звука распознавание будет составлять около 100%.
Отметим, что в будущем такая система может заменить стенографистов.
tehnot.com