У MIT створили розуміючого контекст робота

Навчання 16 листопада 2023

Інженери з Массачусетського технологічного інституту розробили робота, яким можна керувати за допомогою голосових команд, заданих «повсякденною» мовою. Крім цього, робот розуміє і запам'ятовує контекст команд і навколишніх об'єктів. Наприклад, таку роботу можна сказати, що в коробці, яку людина тримає в руках, знаходиться їжа. Після цього його можна буде просто попросити дати їжу, а не вказувати на конкретну коробку. Розробка була представлена на конференції зі штучного інтелекту IJCAI, її текстова версія доступна на сайті конференції, також про неї розповідає видання MIT News.

Комп'ютери і роботи вже вміють виконувати безліч складних завдань, і багато з них вони роблять ефективніше людей. Але, оскільки в повсякденному житті люди найчастіше спілкуються за допомогою абстрактних виразів, комп'ютерним системам буває складно інтерпретувати досить банальні, з точки зору людини, команди. Наприклад, навіть простий вираз «Підемо в сусідню кімнату» передбачає, що робот повинен зрозуміти, де знаходиться кімната і він сам, потім пройти в її бік, повертаючи і огинаючи перешкоди на своєму шляху.

Дослідники з MIT створили алгоритм під назвою ComText (скорочення від «commands in context»), який може запам'ятовувати різні властивості об'єктів і їх зв'язків з людьми або іншими об'єктами. Як зазначають дослідники, на відміну від багатьох інших роботів, він може формувати не тільки семантичну, а й епізодичну пам'ять.

Інженери займалися розробкою алгоритму, а в якості апаратного забезпечення вибрали популярного серед розробників робота Baxter з двома роборуками і камерами. Вони продемонстрували кілька прикладів завдань, які здатний виконувати робот. Наприклад, дослідники говорили йому, що коробка і консервна банка, які лежать на столі - це їх перекус. Робот заносив цю інформацію в свою базу даних, і надалі йому вже не обов'язково вказувати на конкретні об'єкти - коробку і банку, досить сказати йому «Візьми мій перекус».

Надалі дослідники планують навчити алгоритм розуміння більш абстрактних фактів і понять. Наприклад, якщо на столі лежать печива і цукор, а команда звучить як «Дай мені їжу», алгоритм повинен розуміти, що цукор не є безпосередньо їжею, а швидше її компонентом або добавкою.

Нещодавно дослідники з Університету Брауна розробили схожу систему. Вони створили алгоритм, який може розуміти рівень абстракції команд і правильно інтерпретувати як докладний поетапний опис дій, так і високоабстрактні команди, такі як «Віднеси стілець в іншу кімнату».

У MIT створили розуміючого контекст робота

Рулетики за 30 хвилин

Квітка з лука

Домашній святковий хліб

М'ясо в кокосовій підливі

Десерт «Малина у кольорі»

Лечо з томатним соком