Apple розповіла про функції «Привіт, Siri» в блозі про машинне навчання

У липні Apple відкрила новий блог про машинне навчання та інші галузі, в якому фахівці можуть розповідати про свою роботу.


Сьогодні в ньому був опублікований новий запис про функцію «Привіт, Siri», яка служить для активації віртуального помічника. Запис опублікований командою Siri, і в ній докладно описано, як працює ця функція.


У співпроцесор руху вбудований розпізнавач мови, який активний постійно, тобто пристрій завжди слухає вас в очікуванні слів «Привіт, Siri». Коли пристрій чує ці слова, він сприймає подальшу мову вже як запит.

"Мікрофон в iPhone або Apple Watch перетворює ваш голос на звукові хвилі з частотою 16000 в секунду. Етап аналізу спектра перетворює потік хвиль на послідовність кадрів, кожен з яких описує звуковий спектр довжиною в 0.01 секунди. Приблизно двадцять кадрів за раз (0.2 секунди) перетворюються на акустичну модель, і кожна з них сортується по безлічі звукових типів мови, з яких складається сама фраза «Привіт, Siri», тиша та інша мова. Всього їх приблизно двадцять ".

Нейронна мережа використовується для того, щоб розпізнавати промову користувача, потім аналізувати її і розуміти, чи була вимовлена фраза «Привіт, Siri». Після того, як пристрій чує ці слова, підключається Siri і виконує запит.

Весь запис можна прочитати тут. Якщо вам цікаво, як працює Siri, то це точно варто зробити.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND