Алекса, Сірі і Google не розуміють слово, яке ви говорите

Діджитал 03 травня 2024

За останні кілька років такі голосові помічники, як Alexa, Google Assistant і Siri, пройшли довгий шлях. Але, незважаючи на всі їх поліпшення, їх стримує одне: вони вас не розуміють. Вони занадто сильно залежать від певних голосових команд.

Розпізнавання мови - це просто фокус
Голосові помічники не можуть вийти за рамки їх програмування
Голосові помічники - незвичайний командний рядок
Вузьке розуміння помічників по голосу обмежить зростання

Розпізнавання мови - це просто фокус

Голосові помічники вас не розуміють. У всякому разі, не зовсім. Коли ви говорите з Google Home або Amazon Echo, він по суті перетворює ваші слова в текстовий рядок, а потім порівнює їх з очікуваними командами. Якщо він знаходить точний збіг, то він слідує набору інструкцій. Якщо це не так, він шукає альтернативу тому, що робити, ґрунтуючись на інформації, яка у нього є, і якщо це не спрацює, ви отримуєте повідомлення про помилку, наприклад: "Вибачте, але я цього не знаю. Це трохи більше, ніж спритність магії рук, щоб змусити вас думати, що вона розуміє.

Він не може використовувати контекстні підказки, щоб зробити правильне припущення, або навіть використовувати розуміння схожих тем для обґрунтування своїх рішень. Неважко збити з пантелику і голосових помічників. Хоча ви можете запитати Алекса «Чи працюєте ви в АНБ?» І отримати відповідь, якщо ви запитаєте «Ви таємно є частиною АНБ?», Ви отримаєте відповідь «Я не знаю цього» (принаймні, на час написання)

Люди, які дійсно розуміють мову, не працюють так. Припустимо, ви питаєте людину: "Що це за кларваїн у небі? Той, який вигнутий і сповнений смугастих кольорів, таких як червоний, помаранчевий, жовтий і синій ". Незважаючи на те, що klarvain - вигадане слово, людина, яку ви запитали, ймовірно, зможе зрозуміти з контексту, що ви описуєте веселку.

У той час як ви можете стверджувати, що людина перетворює мову на ідеї, вона може застосувати знання і розуміння, щоб зробити відповідь. Якщо ви запитаєте людину, чи таємно вона працює на АНБ, вона дасть вам відповідь «так» або «ні», навіть якщо ця відповідь є брехнею. Людина не скаже «я цього не знаю» на таке питання. Те, що люди можуть брехати - це те, що приходить з реальним розумінням.

Голосові помічники не можуть вийти за рамки їх програмування

Голосові помічники в кінцевому рахунку обмежені запрограмованими очікуваними параметрами, і вихід за їх межі порушить процес. Цей факт показує, коли на гру приходять сторонні пристрої. Зазвичай, команда для взаємодії з ними дуже громіздка, що зводиться до того, щоб «сказати виробнику пристрою ввести необов'язковий аргумент». Точним прикладом може бути: «Скажіть Whirlpool, щоб призупинити сушку». Ще більш складний приклад - Женевська Алекса. вміння контролює деякі печі GE. Користувач скілла повинен пам'ятати, щоб «сказати Женеві», а не «сказати GE», а решту команди. І хоча ви можете попросити його розігріти духовку до 350 градусів, ви не можете виконати запит на підвищення температури ще на 50 градусів. Людина може дотримуватися цих прохань, хоча.

Amazon і Google дуже старанно працювали, щоб подолати ці перешкоди, і це видно. Якщо раніше для керування розумним замком потрібно було слідувати наведеній вище послідовності, тепер замість цього можна сказати «замкни вхідні двері». Алекса раніше плутала «розкажи мені собачий жарт», але попроси один сьогодні, і вона спрацює. Вони додали варіанти до команд, які ви використовуєте, але в кінцевому підсумку вам все одно потрібно знати, яку команду ви хочете сказати. Ви повинні використовувати правильний синтаксис, в правильному порядку.

І якщо ви думаєте, що це звучить дуже схоже на командний рядок, ви не помиляєтеся.

Голосові помічники - незвичайний командний рядок

Командний рядок обмежено для виконання простих завдань, але тільки якщо ви знаєте правильний синтаксис. Якщо ви вкажете правильний синтаксис і наберете dyr замість dir, у командному рядку з'явиться повідомлення про помилку. Ви можете використовувати псевдоніми для більш легкого запам'ятовування команд, але у вас є уявлення про те, якими були вихідні команди, як вони працюють і як ефективно використовувати псевдоніми. Якщо ви не витратите час на те, щоб вивчити всі входи і виходи з командного рядка, ви ніколи не отримаєте від цього багато чого.

Голосові помічники нічим не відрізняються. Ви повинні знати, як правильно вимовляти команду або задати питання. І вам потрібно знати, як створювати групи для Google і Alexa, чому угруповання ваших пристроїв має важливе значення і як називати ваші розумні пристрої. Якщо ви не виконаєте ці необхідні кроки, ви відчуєте розчарування, коли попросите свого голосового помічника відключити дослідження тільки для того, щоб запитати: «яке дослідження» слід відключити.

Навіть якщо ви використовуєте правильний синтаксис у правильному порядку, процес може завершитися помилкою. Або з неправильною відповіддю видається, або з несподіваним результатом. Два будинки Google в одному і тому ж будинку можуть показувати погоду для трохи різних місць, навіть якщо у них є доступ до одного і того ж інформації облікового запису користувача та інтернет-з'єднання.

У наведеному вище прикладі дається команда «Встановити таймер на півгодини». Центр Google Home створив таймер з ім'ям «Час», а потім запитав, як довго він повинен бути. І все ж повторення цієї ж команди тричі спрацювало правильно і створило 30-хвилинний таймер. Використання команди «Встановити таймер на 30 хвилин» працює коректно на більш послідовній основі.

У той час як спілкування з Google Home або Echo може бути більш плавним, під капотом голосові помічники і командні рядки працюють однаково. Можливо, вам не потрібно вивчати нову мову, але вам потрібно вивчити новий діалект.

Вузьке розуміння помічників по голосу обмежить зростання

Ніщо з цього не заважає голосовим помічникам, таким як Google Assistant і Alexa, працювати досить добре (хоча Cortana - це окрема історія). Google Assistant і Alexa і шукають питання в Інтернеті пристойно, хоча не дивно, що Google краще в пошуку і може відповісти на основні питання, такі як вимірювання вимірювань і проста математика. При правильно налаштованому розумному будинку і добре навченому користувачеві більшість команд розумного будинку будуть працювати так, як задумано. Але це сталося завдяки роботі та зусиллям, а не інтелектуальному розумінню.

Таймери і сигналізації раніше були спрощеними. З часом було додано найменування, потім додано можливість додавання часу до таймера. Вони перейшли від спрощеного до більш складного. Голосові помічники можуть відповісти на більше запитань, і кожен день приносить нові навички і функції. Але це не продукт саморозвитку, який походить від навчання і розуміння.

І ніщо з цього не забезпечує притаманної здатності використовувати те, що, як відомо, досягає невідомого. Для кожної команди і питання, які працюють, завжди буде три, які не працюють. Без прориву в штучному інтелекті, який дає людську здатність до розуміння, голосові помічники зовсім не є помічниками. Це просто голосові командні рядки - корисні в правильному сценарії, але обмежені тими сценаріями, які вони запрограмовані для розуміння.

Іншими словами: машини вчать речі, але не можуть їх зрозуміти.