15 липня лондонська компанія DeepMind опублікувала код алгоритму, який може з максимальною точністю визначити тривимірну форму білків. Це — нейромережа AlphaFold 2, чий базовий функціонал вже описано у статті для Nature. Оскільки алгоритм має відкритий код, його досягнення можна буде масштабувати на ще потужніші та корисніші напрями в обчислювальній біології та медицині.

Навіщо визначати форму білків?

Ми складаємося з білків, а білки — з ланцюжків амінокислот. Складаючись у тривимірну форму, амінокислоти визначають функцію цих білків у наших клітинах. Десятиріччями науковці організовували різні експерименти — від рентгенівської кристалографії до кріоелектронної мікроскопії — щоб визначити структури білків. Усі методи були занадто складними й дорогими для того, аби якісно аналізувати всі білки.

На щастя, торік компанія DeepMind змогла розробити алгоритм, який точно передбачає структуру більшості білків, використовуючи тільки їхню послідовність, визначену ДНК. Розв’язання проблеми віком в півстоліття знайшов алгоритм AlphaFold 2. Точність була настільки високою, що після тематичного конкурсу (CASP) з передбачення структури білків співзасновник заявив, що «проблему певною мірою розв’язано».

Медіана точности передбачень на конкурсі CASP, у вимірі best-of-5. Джерело: Deepmind

Тепер науковці, користуючись надбаннями AlphaFold 2, намагатимуться перевершити успіх системи.

Чому це важливо?

Розуміння структури білків надважливе для створення ліків. Наразі всі способи моделювання структури білків складні та дорогі, як-от прискорювачі частинок або суперкомп’ютери. Тому штучний інтелект вже давно є фаворитом у розв’язанні цієї задачі. Донедавна нейромережі поступалися усім класичним методам розрахунку, особливо суперкомп’ютерам.

Але AlphaFold 2 створила новий тип нейромереж – евоформер. Це алгоритм, який описує структуру окремих сегментів білків тривимірним деревом графів. Себто математичною абстракцією з набору об’єктів, парно пов’язаних одне з одним. Евоформерна нейромережа поєднує їх, спираючись на вже відомі приклади, і поступово міняє структуру зв’язків, наближаючись до найсприятливіших умов.

Два приклади тривимірного моделювання білкових структур: експериментальна (зелена) і компутаційна AlphaFold 2 (синя). Джерело: Deepmind

По суті AlphaFold 2 — це поєднання кількох десятків таких евоформерів. Її вже випробували на молекулі Orf8, одному з найбентежніших компонентів SARS-CoV-2. Нейромережі вистачило пів години, щоб реконструювати тривимірну будову з максимальною точністю. Погрішність — 0,096 нанометра, майже втричі менша, аніж в суперкомп’ютера.

Коли DeepMind цілком опублікують всю супутню документацію та код AlphaFold 2, очікувано пришвидшиться дослідження усіх білків людського організму. А отже, створення нових ліків проти хвороб та інфекцій стане ще швидшим і ще доступнішим.

Читайте також:

Коменти