Вчені «навчили» комп'ютер передбачати хімічні властивості молекул

Вчені з Центру досліджень молекулярних механізмів старіння і вікових захворювань МФТІ розробили програмний пакет Knodle для визначення зв'язків і ступеня зв'язку в молекулах, який значно спрощує розробку нових ліків


Уявіть, що ви хочете створити ліки. Розробку лікарських препаратів із заздалегідь заданими властивостями називають драг-дизайном. Ліки, потрапивши в організм людини, повинні впливати на причину хвороби. На молекулярному рівні це порушення роботи якихось білків і генів їх кодуючих. У драг-дизайні це називають мішенню. Якщо ліки противірусні, то вони повинні якось заважати вірусам вбудовувати свій геном в людський. Тоді мішенню буде вже білок вірусу. Структура білка вірусу, що вбудовується, відома, і навіть відомо, яке місце у нього найважливіше - сайт зв'язування. Якщо вставити в це місце, в сайт зв'язування, «затичку» у вигляді певної молекули хімічної сполуки, то білок не зможе «вживитися» в геном людини, і вірус помре. Виходить, знаходиш «затичку» - буде у тебе ліки від хвороби.


Але як знайти потрібні молекули? Дослідникам тут на допомогу приходять величезні бази речовин. Для відбору беруться спеціальні програми, які використовуючи наближення квантової хімії оцінюють місце і силу з якою зможе причепитися молекула- «затичка» до білка. Але виявляється, що в базах є тільки форма речовини, а для адекватної оцінки цим програмам потрібна ще й інформація про стан всіх атомів і сполук в молекулі. Завданням визначення цих станів і займається розроблена дослідниками комп'ютерна система Knodle. За допомогою нових технологій можна звузити область пошуку з сотень тисяч речовин всього до сотні. Цю сотню вже перевірити і отримати, наприклад, Ралтегравір - ліки, які з 2011 року активно використовуються для профілактики ВІЛ.

Співробітник Лабораторії структурної біології рецепторів, пов'язаних з G білком, МФТІ Сергій Грудінін, аспірантка МФТІ Марія Кадукова і «навчений» ними комп'ютер

Зі школи всі звикли бачити органічні речовини як букви з паличками (структура речовини) і також розуміти, що насправді ніяких паличок немає. Адже кожна паличка - це зв'язок електронів, які підпорядковуються законам квантової хімії. У разі однієї простої молекули досвідчений хімік інтуїтивно відчуває, які повинні бути гібридизації (зі скількома сусідніми атомами він з'єднаний), і за кілька годин копіткої роботи з довідниками зможе відновити в ній всі зв'язки. Він може це робити, тому що бачив сотні і сотні схожих сполук і знає, що якщо кисень «ось так ось стирчить», то швидше за все він пов'язаний подвійним зв'язком. У своїй роботі аспірантка МФТІ Марія Кадукова і науковий співробітник лабораторії структурної біології рецепторів, пов'язаних з G білком, МФТІ Сергій Грудінін вирішили довірити цю інтуїцію комп'ютеру, використовуючи для цього технології машинного навчання.

Порівняйте «Твердий порожній предмет з ручкою, отвором зверху і подовженням збоку, в кінці якого теж отвір» і «Посудина для приготування чаю». І те й інше досить добре визначає, що таке чайник, але друге пояснення простіше і в нього більше віриться. Так само і в машинному навчанні, найкращий алгоритм навчання - це найпростіший з працюючих. Тому дослідники вибрали нелінійний метод опорних векторів (SVM), метод, який себе зарекомендував у розпізнаванні рукописного тексту і зображень. На вхід йому давали розташування сусідніх атомів, а на виході отримували гібридизацію.

Принцип дії пакунка Knodle

Гарне навчання вимагає безліч прикладів, і вчені склали їх з 7605 з'єднань з відомою структурою і станами атомів. "У цьому криється вирішальна сила розробленого пакету, оскільки при навчанні на більшій базі результат розпізнавання краще. Зараз Knodle знаходиться на крок попереду подібних собі програм: він допускає всього 3.9% помилок, тоді як найближчий конкурент 4.7% ", пояснює Марія Кадукова. І це не єдина перевага. Програмний комплекс легко змінювати під конкретне завдання. Наприклад, в даний момент Knodle не працює з речовинами, що містять метали, тому що ці сполуки відносно рідкісні. Але якщо виявиться, що ліки від Альцгеймера буде помітно ефективнішими, якщо в ньому буде метал, то для адаптації програми потрібно лише набрати базу з металевими сполуками. Тому залишається тільки здогадуватися, для якої невиліковної на даний момент хвороби знайдуть ліки, використовуючи цей інструмент.


COM_SPPAGEBUILDER_NO_ITEMS_FOUND