Робота навчили акуратно розкидати банани по кошиках

Американські інженери розробили алгоритм для маніпуляторів, що дозволяє їм вчитися хапати банани та інші предмети, і кидати їх у задану точку. Під час роботи алгоритм розраховує параметри кидка за допомогою фізичного симулятора, а також нейромережі, яка вносить свої коригування, розповідають автори в блозі Google. Стаття з описом розробки опублікована на сайті Прінстонського університету.


Захоплення предметів - одна з найбільш швидко розвиваються областей робототехніки, напрацювання з якої можна застосовувати в сортуючих товар роботах та інших пристроях. Зазвичай після захоплення роботи акуратно перекладають предмет на інше місце. Однак це обмежує область їх роботи довжиною маніпулятора. Розширити область можна за допомогою кидка, однак це набагато більш складне завдання, що вимагає від робота розуміння механіки польоту після прискорення. Крім того, завдання ускладнюється тим, що на політ і місце приземлення предмета впливають не тільки параметри кидка, але і параметри самого предмета, які часто складно виміряти, такі як розташування центру мас.


Інженери під керівництвом Томаса Фанкхауса (Thomas Funkhouse) з Google і Прінстонського університету розробили алгоритм, що дозволяє роботам захоплювати і кидати довільні предмети в задану точку. Розробники вибрали незвичайний підхід і вирішили об'єднати захоплення і кидок в єдине завдання, тому що це тісно пов'язані між собою проблеми.

Під час роботи алгоритм отримує як вихідні дані знімок з камери глибини, розташованої над кошиком з предметами. На цьому знімку містяться дані як про колір, так і про глибину (відстані). Отримавши ці дані, алгоритм обробляє знімок за допомогою нейромережі, розмічаючи на ньому просторові ознаки. Паралельно з цим фізична симуляція дозволяє приблизно розрахувати швидкість, при якій робот повинен відпустити предмет, щоб він потрапив у потрібний кошик. Ці дані об'єднуються і подаються на дві інші нейромережі, які розраховують ймовірності успіху для різних захоплень і швидкості відпускання. Алгоритм повторює ці дії, повертаючи вихідний знімок на 16 кутів. В результаті робот виконує таке захоплення і відповідне йому прискорення, для якого була розрахована максимальна ймовірність успішного виконання.

Інженери створили самонавчальну систему, яка дає роботу завдання, а потім стежить за успішністю виконання. Після того, як робот розкидав предмети із загального кошика по дрібних кошиках, він може підняти раму і всі об'єкти скотяться назад. Таким чином робот навчився кидати незнайомі йому предмети в потрібні відсіки кошика з точністю 82,3 відсотка. На навчання у робота пішло близько десяти тисяч спроб.

Нещодавно в Японії пройшов конкурс ROBOCON, в якому змагалися розробники роботів, що кидають пляшки, частково заповнені водою. Як і у відомому челенджі, завдання роботів полягало в тому, щоб після приземлення пляшка приземлилася на плоску поверхню вниз дном і не впала.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND