Незабаром прийдуть ті часи, коли ми будемо питати комп’ютер «чи ти мене розумієш?» і отримувати ствердну відповідь. Ще один крок до цього зробили інженери з Microsoft Research. Вони розробили систему, яка може транскрибувати людську мову з тією ж точністю, що й ми. Частка помилок становить 5,1%. У людини цей показник варіюється від 5 до 6%.

Лише рік тому система розшифровувала мову з точністю 5,9%. Уже тоді цей результат вважали за історичне досягнення. Але науковці зробили нові заміри та з’ясували, що людське сприйняття ближче до 5%. Тому у Microsoft засукали рукави, щоб якомога швидше перевершити власний успіх.

І, як бачимо, їм це вдалося. Для цього вчені об’єднали згорткову нейрону мережу (CNN) та моделі довгої короткострокової пам’яті (LSTM). Щоб перевірити отримані результати, тестувальники використали Switchboard («Комутатор»). Це загальноприйнятий в індустрії мовний корпус, що складається із записів розмов кількох людей на певні теми. Під час транскрибування система розуміє контекст і тому робить менше помилок.

Для наочності інженери наводять дві фрази: «that’s not fair» («це несправедливо») та «that’s not fur» («це не хутро»). Співзвучність може збити систему з пантелику. Але тепер вона розуміє контекст і, якщо йдеться про азартні ігри, значить, правильним буде перший варіант. Якщо про одяг, то другий.

Але розробникам із Microsoft все ще є до чого прагнути.

«Паритету між людиною та програмою у розпізнаванні мови ми намагалися досягнути останні 25 років. Та, попри отриманий результат, певні проблеми залишаються. Нам потрібно продовжити роботу, щоб система краще працювала в умовах, коли навколо галас плюс мікрофон віддалений, або у людини сильний акцент, або у мові присутні слова, характерні для певного регіону», — зазначив Седонг Хонг, один зі співробітників Microsoft Research.

Таким чином, хоча розроблена технологія справді вражає, поки що вона не може зрівнятися з людиною у всіх можливих ситуаціях. Але з наступних слів пана Хонга можна зробити висновок, що недовго людина буде тішитися своєю перевагою:

«Ми багато працюємо над тим, щоб навчити комп’ютер не лише розшифровувати слова, а ще й розуміти їхній сенс. Перехід від транскрипції до усвідомлення — це наступний важливий рубікон у мовних технологіях».

Закінчив журфак у славному місті Запоріжжя. Сім років працював за фахом у місцевих газетах. 2013 року переїхав до не менш славетного міста Лева. Але це була не єдина зміна у житті – з того часу Інтернет став мені і за редакцію, і за газетні шпальти

Коменти