Открытая наука уступает закрытому бизнесу в гонке за новые лекарства.
Alphafold, система искусственного интеллекта, которая получила Нобелевскую премию за его прорыв в прогнозировании структуры белка, внезапно столкнулась с пределом: в нем отсутствуют данные. Н.д.Версия OVA — Alphafold 3 — обещает революционизировать разработку лекарств, поскольку она может моделировать взаимодействие белков с другими молекулами, включая сами лекарства. Но именно эти примеры вряд ли можно найти в входных данных.
База данных, на которой обучается алфафол, включает в себя сотни тысяч белковых структур из банка данных белка с открытым кодом (PDB). Однако большинство из них описывают взаимодействие белков с природными молекулами, такими как АТФ, а не лекарственные соединения. Это предотвращает разработку моделей в направлении, что особенно важно для фармацевтических компаний.
В ответ на эту проблему Крупные фармацевтические производители объединились в консорциуме для создания собственной версии II моделианалогично Alphafold, на основе конфиденциальных данных. Он будет включать в себя десятки тысяч структур, накопленных такими компаниями, как Abbvie, Johnson & Johnson, Sanofi и Boehringer Ingelheim. Эти данные до сих пор нигде не были опубликованы, и, по мнению исследователей, могут быть даже больше, чем содержание всего открытого PDB. Например, только Abbvie предоставляет более 9000 структур.
Новая модель будет основана на OpenFold 3 — открытый клон AlphaFold 3, который разработан учеными на основе общедоступных данных и должен быть выпущен в апреле. Google Deepmind, создатель оригинального алфалода, не участвует ни в этой инициативе, ни в своей дочерней компании изоморфной лаборатории, которая работает отдельно с Novartis и Eli Lilly.
Распределение конфиденциальных структур в консорциуме не планируется. Вместо этого платформа используется немецким стартапом Apheris, которая позволяет подготовленной модели непосредственно в инфраструктуре каждой компании, даже не обнаруживая данные других членов. По словам разработчиков, после обучения будет невозможно восстановить исходные структуры.
Пока не ясно, насколько будет улучшена точность прогнозов благодаря доступу к закрытым данным. Но эксперты отмечают, что даже небольшой прогресс, такой как увеличение вероятности правильного прогнозирования связывания лекарственного средства с белком с 20% до 50%, может изменить правила игры в фармацевтических препаратах.
Все еще Доступ к новой модели будет ограничен членами консорциумаНекоторые исследователи надеются, что компании все еще начнут делиться своими структурами с научным сообществом. В настоящее время только 6% всех данных PDB поступают от фармацевтических компаний. Но скептики напоминают нам, что об этом говорили в течение десятилетий — и за это время мало что изменилось.