AlphaFold这一革命性的诺贝尔奖获奖蛋白质结构预测工具正面临一个问题:数据即将耗尽。
David Baker、Demis Hassabis和John Jumper(从左到右)因开发出可以预测和设计蛋白质结构的计算工具而获得诺贝尔化学奖。
最新版本的人工智能模型AlphaFold 3被誉为药物研发领域的颠覆者,因为它能模拟蛋白质与其他分子(包括药物)的相互作用。但科学家指出,由于AlphaFold的基础数据(数十万公开的蛋白质结构)中缺乏这些相互作用的实例,该工具在制药公司最关注的应用领域仍受限制。
近日,由多家领先制药公司组成的联盟宣布计划利用其内部数据库中数千个目前保密的蛋白质结构,开发一款受AlphaFold 3启发的AI模型。这些数据将补充蛋白质数据库(Protein Data Bank, PDB)中已有的20多万个公开蛋白质结构。
“PDB中缺失的数据正是我们内部数据所包含的部分”,艾伯维计算药物发现负责人、参与该项目的John Karanicolas表示。该联盟名为“AI结构生物学联盟(AI Structural Biology Consortium)”。
AISB联盟是一项旨在帮助改变药物发现和开发的新型合作
来源:https://www.apheris.com/industries/aisb
该联盟的模型基于OpenFold 3,将于4月发布。但该模型仅限成员公司(包括艾伯维、强生、赛诺菲和勃林格殷格翰)使用,暂无向外界开放的计划。
开发AlphaFold的DeepMind未参与此项目且拒绝置评。其子公司Isomorphic Labs正将AlphaFold 3用于与诺华和礼来等药企的合作中。
AlphaFold通过蛋白质序列预测其3D结构的能力依赖于PDB中通过X射线晶体学等实验方法获得的海量蛋白质结构数据。Karanicolas指出,这些结构数据中虽包含相互作用分子,但多为ATP(细胞能量来源)等生物分子,而非药物化合物
。
哥伦比亚大学计算生物学家、OpenFold开发负责人Mohammed AlQuraishi表示,AlphaFold 3在预测蛋白质与潜在药物相互作用方面表现尚可,但“这仍是一个开放性问题”。
药企内部极少公开的蛋白质结构可能为此提供帮助。在药物开发过程中,企业通常会针对同一蛋白质与多种候选药物结合的结构进行测定。
罗格斯大学结构生物学家Stephen K. Burley称,这些专有蛋白质结构数据的完整规模尚不明确,但其总量可能与PDB相当甚至更大。仅艾伯维一家公司就为联盟的AI模型贡献了超过9,000个结构。AlQuraishi感叹道:“这些封闭数据库中的数据量令人震惊。”
为开发新模型,制药公司不会彼此共享实际蛋白质结构数据,也不会与AlQuraishi分享。取而代之的是,他们将使用柏林初创公司Apheris开发的平台,在数据不离开企业数字防火墙的前提下,利用专有数据对OpenFold 3进行再训练。Karanicolas强调,该模型无法通过逆向工程识别其训练所用的保密结构。
AlQuraishi表示,额外数据能否提升AlphaFold对蛋白质-药物相互作用的建模能力仍不明确。“关键问题在于提升幅度有多大?”他的团队将通过对比模型预测与实验结果来评估性能,并公开详细分析。
“无论结果积极或消极,这项实验都极具价值”
,他补充道。AlQuraishi指出,一些科学家和资助机构正计划建立类似药企的结构数据库以训练AI模型,而验证更多数据是否真正有用将至关重要。
田纳西州纳什维尔范德堡大学计算结构生物学家Stephanie Wankowicz表示:“仅凭制药公司的保密数据可能无法提升AlphaFold在蛋白质预测方面本已卓越的准确性。企业数据中蕴含的化学多样性或能“极大改善”药物相互作用的预测。”
加州大学旧金山分校药物化学家Brian Shoichet则质疑药企是否拥有足够数据推动AlphaFold实现重大突破。“他们能从这颗‘柠檬’中榨取的创新终究有限”
,他说道。
然而,Shoichet指出,即使小幅改进也可能极具价值,例如更精准预测药物是否会与特定蛋白质结合——这能间接反映药物有效性。他的团队正在进行“虚拟对接”实验:通过基于物理原理的软件,从数十亿化合物中筛选可能与目标蛋白质结合的候选分子,再通过实验室测试验证预测结果。“若20%的预测有效,我们已感欣慰。若能提升至50%,将是质的飞跃。”他解释道。
目前,联盟模型仅限成员使用,Karanicolas希望更多药企加入。他称,联盟计划先评估模型表现,再考虑向学术界开放
。Wankowicz更希望药企能从根本上公开更多结构数据。Burley指出,在PDB的23.3万个结构中,仅6%由制药公司提交。
Shoichet虽认同药企有充分理由应共享更多结构数据,但对实际进展不抱期待。“这类讨论我参与了30年,却从未实现过。如今我已不再提及此事。”
Burley则更乐观,他认为企业终将认识到开放带来的益处(如更强大的药物研发工具)。“在后AlphaFold 2和AlphaFold 3时代,企业会更愿意迈出这信念的飞跃。”
评论
加载更多