Голос – надважлива частина нашого суспільного життя: він з’єднує нас із друзями, сім’єю та всім світом довкіл. Тож коли людина з будь-яких причин втрачає здатність говорити – це стає для неї катастрофою.

Саме так вчені з Колумбійського університету (США) пояснюють мотивацію свого відкриття.

Винайдена технологія відстежує діяльність головного мозку, аналізує її та за допомогою систем штучного синтезу мови озвучує.

Науковці базуються на десятирічних дослідженнях мозку, які показали, що, коли людина говорить, думає, уявляє або чує якісь слова – у мозку виникає впізнавана модель активності.

Щоб навчити комп’ютерний алгоритм розпізнавати такі моделі активності, дослідники попросили пацієнтів слухати дикторів, які читали цифри від 0 до 9. Після декількох ітерацій програма навчилася розпізнавати, яка модель активності відповідає кожній із цифр.

Щоб озвучити отримані результати, залучили вокодер (інструмент для аналізу та синтезу звуків і мовлення).

Насамкінець голосовий робот озвучив послідовність чисел, про яку думали піддослідні. Щоб перевірити точність запису, доктор Месгарані та його команда доручили іншим людям послухати запис і повідомити, що вони почули.

Враховуючи усі аспекти дослідження, кінцева точність створеної системи становила 75%.

Навіщо це потрібно?

Вчені виділяють два напрями використання створеної технології:

  1. Допомога людям, що з будь-яких причин втратили здатність до вербальної комунікації.
  2. Створення комп’ютерних інтерфейсів, які будуть керуватися не кнопками чи голосом, а думками.

До цілком робочої системи науковцям ще далеко, але й наявний прототип корисніший за більшість схожих попередніх моделей. А саме наукове дослідження можна впевнено вважати проривом в аналізі роботи головного мозку.

Пишу про космос, мистецтво і технології так, щоб це було варто читати. Ведучий та сценарист Tokar.Review.

Коменти