Нова нейромережа зламала капчу

Розробники американської компанії Vicarious створили алгоритм, що ефективно розшифровує капчу - найпоширеніший на сьогоднішній день спосіб відрізнити людину від роботи. Такий алгоритм працює на основі комп'ютерного зору і рекурсивної кортикальної нейромережі, і може розшифрувати капчу на багатьох популярних інтернет-платформ, у тому числі PayPal і Yahoo. Роботу опубліковано в журналі.


Капча (CAPTCHA, розшифровується як Completely Automated Public Turing test to tell Comp^ and Humans Apart - повністю автоматизований публічний тест Тьюрінга для розрізнення комп'ютера і людини) використовується для того, щоб з'ясувати, хто намагається скористатися будь-яким сервісом: людина або якась програма для автоматизації дій в інтернеті. В основі капчі зазвичай лежить завдання, наприклад, розрізнити «плаваючі» літери, виділити слово на тлі або відзначити фотографії, які містять певний об'єкт. Для його вирішення людині достатньо наявних у неї знань про навколишній світ і базових навичок (наприклад, читання). Комп'ютеру, однак, для виконання подібного тесту потрібна величезна кількість даних. Він може розпізнати будь-які стандартні символи, але, наприклад, літери, що «пливуть», які зустрічаються йому вперше, - насилу. З іншого боку, для людини подібне завдання не становить великої проблеми; штучний інтелект, відповідно, повинен бути максимально розвинений (порівняно зі справжнім, людським інтелектом) для її вирішення.


Автори нової роботи, вчені з американської компанії Vicarious, що займається дослідженнями в області штучного інтелекту, представили нову нейромережу для розшифровки капчі. Така нейромережа отримала назву «рекурсивна кортикальна нейромережа» (англ. recursive cortical network, скорочено RCN). Для її створення використовувалися знання про обробку візуальної інформації людиною, а саме - про ефективний поділ об'єкта і фону, навіть у тому випадку, коли вони мають дуже схожу структуру. Нейромережа, таким чином, виділяє на загальному тлі контур об'єкта (наприклад, букви), і може робити це навіть у тому випадку, якщо частина об'єкта прихована за іншим.

Нейромережа була навчена на досить невеликій кількості зображень - близько 26 тисяч. Для порівняння, алгоритму розпізнавання капч на основі згорточної нейромережі потрібно кілька мільйонів зображень.

Для перевірки роботи нейромережі використовувалися дані з відкритого генератора капч Google - reCAPTCHA, які, за словами розробників, мають безліч достоїнств, основне з яких - порівняльна легкість розпізнавання для людей і складність для комп'ютерів. Крім того, для перевірки також були використані капчі Yahoo, PayPal і Botdetect.

Капча вважається вирішеною, якщо комп'ютеру вдалося розпізнати її в одному відсотку випадків - такий показник, однак, не позначає велику ефективність. Нова нейромережа змогла розшифрувати приклади з reCAPTCHA з точністю до 66,6 відсотків. Для порівняння, людина може розпізнати ті ж самі комбінації з точністю в 87 відсотків.

Алгоритм також показав кращу (порівняно з іншими алгоритмами, робота яких заснована на згорточних нейромережах) ефективність у розпізнаванні окремих символів: до 94,3 відсотків. Для порівняння, ефективність роботи згорточної нейромережі суттєво падає зі збільшенням візуальних відмінностей між навчальною та тренувальною вибірками.

Про те, що нова нейромережа здатна побити капчу з неймовірною для комп'ютера ефективністю, представники компанії повідомляли ще в 2013, чим викликали чимало скептицизму - особливо, від розробників reCAPTCHA. Ефективна робота їх алгоритму, однак, піднімає питання про поліпшення кібербезпеки і розробки нових засобів для захисту даних користувачів від штучного інтелекту.


Фахівці в галузі штучного інтелекту часто модифікують вже відомі і використовувані нейромережі для різних цілей. Так, наприклад, у нашій замітці ви можете прочитати про алгоритм на основі породжуючої змагальної нейромережі, який може створювати оригінальні твори мистецтва.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND