Нейромережі навчили передбачати обійми і рукостискання

Американські вчені розробили алгоритм, який дозволив нейромережам передбачати дії людей при зустрічі. Результати роботи будуть представлені на Міжнародній конференції з комп'ютерного зору і розпізнавання образів () в Лас-Вегасі, популярно про розробку пише MIT News.


Співробітники Массачусетського технологічного інституту навчали штучний інтелект на відеозаписах з YouTube і серіалах «Офіс» і «Відчайдушні домогосподарки». Попередні підходи до машинного передбачення візуальних зображень включали аналіз окремих пікселів з подальшим попіксельним створенням фотореалістичного зображення-прогнозу, а також використання описів сцен, зроблених людьми. Науковий колектив розробив алгоритм нейромережевого машинного навчання, який працює з цілими фрагментами зображень (наприклад, набором пікселів, що представляють людське обличчя) і на підставі цього аналізує можливі версії того, як виглядатиме наступна сцена. При цьому за аналіз кожної дії персонажів відповідала окрема мережа алгоритму, а прогноз будувався за результатами їх спільної роботи.


Після навчання на 600 годинах відеозаписів систему перевірили на незнайомих для неї роликах. На першому етапі експерименту штучний інтелект повинен був за секунду до події передбачити, як персонажі поведуть себе при зустрічі: вдарять по руках, пожмуть їх, обіймуться або поцілуються. Йому вдалося впоратися з цим завданням у 43 відсотках випадків, що на сім відсотків вище результатів роботи наявних алгоритмів.

Потім системі демонстрували кадр відео і просили спрогнозувати, який предмет з'явиться на екрані через п'ять секунд. Вона впоралася з цим на 30 відсотків краще, ніж перед навчанням, проте дослідники зазначили, що її середній результат не перевищує 11 відсотків. Люди успішно виконували запропоновані штучному інтелекту завдання в 71 відсотку випадків.

За словами розробника Карла Вондрика (Carl Vondrick), точність алгоритму поки недостатня. Однак його наступні версії можна буде використовувати в різних цілях, таких як допомога роботам у плануванні дій або виклик екстрених служб при фіксації подій камерами спостереження.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND