
Ботанчик
Ученые раскрывают секреты AlphaFold3 с помощью новой модели OpenFold3

Модель искусственного интеллекта под названием OpenFold3 способна предсказывать, как белки взаимодействуют с множеством других молекул. Показаны ленточные диаграммы, иллюстрирующие предсказания OpenFold3 о белках (синие) в сравнении с экспериментально определенными структурами (серые). Слева, человеческий белок PDE10, мишень для потенциальных новых лекарств от шизофрении, имеет внутри себя ингибирующую молекулу. Фактор регуляции интерферона 4, мишень для лечения множественной миеломы, соединяется с ДНК (вверху справа), и антитело захватывает другой белок (внизу справа).
Новая модель ИИ открывает "черный ящик" ведущего инструмента искусственного интеллекта для прогнозирования того, как белки будут взаимодействовать с небольшими молекулами, такими как лекарства.
Модель OpenFold3, запущенная 28 октября, представляет собой реконструкцию AlphaFold3 от Google DeepMind. Большой консорциум исследователей под руководством Мохаммеда Алькурайши из Колумбийского университета тщательно проанализировал код AlphaFold3 и создал факсимильную копию платформы искусственного интеллекта, которая предсказывает структуру белков в сочетании с другими молекулами, включая нуклеиновые кислоты и химические вещества в лекарствах. AlphaFold3 могут использовать только частные лица, некоммерческие организации или журналисты. Однако компании и любой другой пользователь могут использовать модель OpenFold3 с открытым исходным кодом в коммерческих целях, включая разработку лекарств.
Предсказание сочетания белков и молекул важно при разработке лекарств, “потому что так работает биология. Биология - это не белки в отдельности. Это биомолекулы, взаимодействующие друг с другом”, - говорит Вуди Шерман, основатель и директор по инновациям бостонской компании Psivant Therapeutics. Шерман также возглавляет исполнительный комитет OpenFold.
Белки - одни из самых трудолюбивых молекул в организме. Эффективность работы этих "рабочих лошадок" во многом зависит от их формы. AlphaFold2 решила проблему прогнозирования того, какую форму примут белки. Команда, разработавшая модель искусственного интеллекта, была удостоена Нобелевской премии по химии за это достижение в 2024 году. В AlphaFold3 были представлены взаимодействия с другими белками и молекулами.
Но, в отличие от AlphaFold2, DeepMind изначально не открывала код AlphaFold3 для изучения другими исследователями, по крайней мере, до тех пор, пока сотни ученых не подписали петицию, призывающую к прозрачности. “Трудно оценить вычислительный продукт, не видя исходной информации”, - говорит Стефани Ванкович, специалист по вычислительной структурной биологии из Университета Вандербильта, которая является соавтором петиции. По словам Ванкович, другим исследователям необходимо иметь этот код, чтобы проверить точность и надежность прогнозов и узнать, какие еще данные необходимы для улучшения модели.
Повторное создание AlphaFold2 дало создателям OpenFold представление о том, как работает искусственный интеллект, говорит она. AlphaFold2 был представлен как модель искусственного интеллекта, которая изучает, как сворачиваются белки, основываясь на их аминокислотных компонентах, но на самом деле она запоминает белковые структуры, которые видела ранее, и использует эти воспоминания для прогнозирования того, как могут выглядеть похожие белки, говорит Ванкович. Если заглянуть под колпак AlphaFold3, то можно получить аналогичное представление о паре белок-лекарство.
Другие команды пытались воспроизвести AlphaFold3 и “приблизились к этому, но не очень точно”, - говорит Ванкович.
Это связано с тем, что сложно воспроизвести тонкие приемы и настройки, которые есть в голове у создателей AlphaFold3, но не отражаются в коде или дополнительной информации, говорит Шерман. Некоторые из них являются техническими настройками, используемыми для определенных этапов расчета. “Никто этого не уточняет”, - говорит он. “Но детали важны, особенно когда вы имеете дело с большими моделями и большим количеством данных”. Команда OpenFold3 сделала все возможное, чтобы воспроизвести AlphaFold3, - говорит он, - но некоторые различия остаются.
Биология также имеет значение, говорит Шерман. В клетках белки окружены водой и ионами. Они вибрируют и движутся. Ничто из этого не запечатлено на статичных изображениях, созданных моделями искусственного интеллекта, или на лабораторных снимках кристаллизованных белков. Команда OpenFold3 надеется добавить в свою модель воду и динамичное движение, чтобы лучше отразить, как белки существуют в природе, говорит Шерман.
Еще до официального выпуска OpenFold3 был востребован фармацевтическими компаниями. Пять компаний объединились в рамках федеративной инициативы OpenFold3, чтобы обучить модель искусственного интеллекта на основе собственных данных и создать более мощный инструмент прогнозирования, сохранив при этом корпоративные секреты. 1 октября берлинская компания Apheris, управляющая платформой group, объявила о партнерстве.
"Только около 2 процентов белковых структур в общедоступных базах данных, на основе которых были изучены AlphaFold3 и OpenFold3, связаны с молекулами, обладающими лекарственными свойствами", - говорит Робин Рем, соучредитель и исполнительный директор Apheris. Фармацевтические компании имеют тысячи таких структур в своих базах данных.
По словам Рема, каждая компания в федерации разработает версию OpenFold3 для примерно 4000-8000 пар белок-лекарственное средство в своей собственной библиотеке. Apheris объединяет данные локально обученных ИИ в централизованную версию, которая содержит знания о том, как взаимодействуют около 20 000 белков и лекарственных препаратов, но не содержит собственных данных. Глобальная версия возвращается в каждую компанию для проведения еще одного раунда обучения и так далее.
Несмотря на расширение базы данных, кардинальных изменений в разработке лекарств пока ожидать не стоит, говорит Шерман. OpenFold3 - это “отправная точка”, - говорит он. “Это будет следующий этап, и еще один этап, и еще раз следующий, на котором мы действительно начнем замечать значимое влияние на разработку лекарств”.
Новости
источник
Комментариев нет:
Отправить комментарий