本文介绍一项由中南大学湘雅药学院曹东升教授团队和浙江大学药学院侯廷军教授团队合作在Journal of Medicinal Chemistry上发表的综述工作。该文详细阐述了MMPA在药物发现中的各类方法,并总结了MMPA在药物发现领域的近期应用,为化合物性质优化和药物合成工作提供这一方法的全局性视角,并为该领域的潜在发展方向提供了一定的思路。
MMPA的搜索算法主要分为三类:预定义转化方法(predefined transformation methods)、基于最大共有子结构的方法(maximum common substructure-based methods, MCS-based methods)和碎片+索引方法(fragmentation and indexing methods, F+I methods)。预定义方法包括一般的转化方法,如Drug Guru、Buy me Grease、LEATHERFACE、ThricePairs、THINK和RandSmi,以及包括基于断裂规则的方法,如反合成组合分析程序(RECAP)和反合成化学子结构的断裂(BRICS)。与预定义方法相比,MCS和F+I方法更常用于近期的MMPA研究。MCS算法利用团簇搜索方法在分子列表内进行成对比较,从而找到每对化合物之间具有最大原子数的共同亚结构。F+I方法通过分解每个分子并将所有枚举的碎片存储和索引到特定的文件的结构中,来识别共有的亚结构。与其他算法不同,F+I的计算随着分析分子数的增加而线性递增,它通过存储碎片表来实现。本文随后还介绍了MMPA搜索算法的详细内容和优缺点。
图1. MMPA中的最大共有同子结构方法和碎片+索引方法。
表1. MMPA搜索算法的分类。
MMPA中的重要参数包括化学结构描述符、化学上下文、统计学意义、数据可用性以及MMPA与QSAR的关系。
图2. MMPA中的重要参数,包括结构描述、化学上下文、统计学意义和数据可用性。
在MMPA中,分子表征的选择非常关键,它能够显著影响分子性质和生物活性变化规律的总结。2D结构表征简单有效,已被广泛应用于QSAR建模和相似性搜索;而3D结构表征可以更加准确地描述分子的空间结构,对微小结构差异更加敏感,有利于MMPA中的空间信息利用。3D MMPA的常见方法包括生成MMPs、能量最小化和确定影响化合物与目标口袋相互作用和产生活性的变化等步骤。然而,识别和比较活性分子的构象也使得3D结构的MMPA更加复杂。
MMPA中加入上下文信息至关重要,在很多情况下,忽略上下文信息可能会导致误导的转化规则,采用合适的上下文描述符可以使转化更加明显和显著。在MMPA中考虑分子上下文有多种方法,包括使用分子图和相应的SMILES(如WizePairs)来描述精确的环境,以及使用分子框架、指纹或药效团等抽象描述。其中,FMP方法将传统MMP方法与不太严谨的简化分子图结合起来,以提取上下文信息。在3D MMPA方法中,还可以包括变化片段周围的共价配体环境进行进一步分析,例如,VAMMPIRE方法可以生成3D构象并在蛋白质口袋中优化配体结构,以描述蛋白质-配体相互作用。此外,结合蛋白质口袋信息也可以更深入地了解作用机制,例如,Weber等人开发了VAMMPIRE工具,可以对蛋白质-配体相互作用进行建模。MMPA的上下文描述有助于提高转化的信息含量和分析结果的准确性,对于药物设计和优化具有重要意义。
在MMPA的应用中,统计估计方法是至关重要的,它可以帮助确定差异的可靠性和显著性。MMP数量的分布遵循Zipfian分布,说明只有少数的转化形成了特征分布。为了使MMPA的统计估计变得可理解,需要一组用于转化的定量估计参数,例如平均活性差异、平均标准误差(SEM)、95%置信区间(CI95)以及评估化学转化是否在一定置信水平上对效能产生正面或负面影响(统计显著性检验)。通常使用三种类型的显著性检验,包括多项式检验、Wilcoxon符号秩检验和配对t检验。
Kramer等人进行了系统研究,探索了配对t检验在MMPA中的应用。结果表明,如果该转化的先前数据充足且统计显著,则该转化的效果预测非常可靠且可转移。在统计研究中,有时两个新取代基团对一个化合物的影响值与它们独自对该化合物影响的加和值相去甚远,这被称为“非可加性”(Non-additivity)现象。某些物理化学性质,例如溶解度、渗透性和脂溶性,可能受到由于分子内氢键相互作用引起的非可加性效应的影响。非可加性分析能够估计实验值模糊范围的上限,同时也能识别潜在的SAR离群值和统计学意义显著的化合物集。它还能够暗示一些重要的结构特征,可以利用此改进合理的药物设计。
量化构效/构性关系分析(QSAR/QSPR)是一种基于配体的药物设计方法,用于确定化学结构和生物效应或化合物性质之间的关系,这方法更适合于研究一般趋势和预测目的。由于使用了分子描述符,QSAR/QSPR方法可能会出现信息丢失的情况。MMP则试图探究子结构对分子性质或活性的单独贡献。数据可溯源性和化学可解释性的优势使MMPA对药物化学家比QSAR建模“黑盒”产生的结果更具意义。为了更好地解决实验数据有限的问题,研究者们提出了MMPA-by QSAR的概念。QSAR-by-MMPA将MMPA与QSAR建模整合在一起,其中MMPA用作分子优化的导航,而QSAR预测则用作分子性质或活性结构转化的评估。MMPA-by-QSAR则是先用QSAR建模预测未标记的分子,再基于QSAR预测进行MMPA的结构转换分析。这两种方法可以结合起来解决分子优化问题,共用的关键结构对预测准确性起了很大作用。
系统的MMPA可以提取出有价值的化学转化规则,用于优化重要的ADMET参数,如溶解度、logD、口服暴露、血浆蛋白结合、CYP450抑制、hERG抑制、膜通透性、人肝微粒体表观内在清除率(HLM)等。
MMPA研究最初主要关注物理化学性质的变化。例如,GSK公司的研究总结了90个常用的亚结构,并证明变化的logD值通常与亚结构的变化对ADMET性质的影响有关。MMPA还应用于代谢研究,辉瑞公司研究了小取代基对HLM稳定性的影响以及苯基的代谢位点与HLM代谢的关系。MMPA还可以应用于小数据集的特定片段-属性关系的探索,如将小分子化合物分解成环、连接部分和R基,再对其进行分析。阿斯利康的一项MMPA研究结果表明,在药物发现中添加亲脂性取代基以提高目标亲和力也是有风险的,因为它可能会导致溶解度降低和P450抑制。
表2. MMPA在ADMET和效价优化中的应用。
MMPA也可以识别出几种特殊类型的转化,如活性悬崖和生物等构替换。活性悬崖是指结构相似的化合物在靶点结合亲和力上具有较大差异的现象。例如,通过分析R基和核心子结构对药效的影响,Wassermann等人确定了约250种存在活性悬崖的取代基,其中大多数转化则相对简单。活性悬崖的研究展示了SAR的不连续性和扩大化学空间探索的可能性。相反,生物等构替换是指通过将生物活性化合物中的一个化学基团替换为另一个后,新分子仍保持相似的生物活性。常见的生物等排数据库有Quantum Isostere数据库和商业BIOSTER数据库等。例如,Wassermann等人将MMPA应用于ChEMBL和DrugBank数据库,识别出了公开可用活性化合物的96种非冗余生物等排替换,其中约有一半是首次发现的。
混杂作用化合物()被定义为能够与各种大分子靶标形成非特异性相互作用的化合物,可能成为多药理学应用的潜在候选物。MMPA可用于研究小的化学取代对多个结合靶标产生显著变化的影响。例如,Dimova等人通过MMPA对超过15,000个化合物和100个序列无关的靶标进行了混杂性悬崖探索。作者观察到在给定结构环境中的一些单点取代对化合物的混杂作用产生了重大影响。Hu等人系统评估了来自DrugBank和ChEMBL的已批准药物和生物活性化合物之间的关系,他们将上市药物映射到ChEMBL时,发现有173个交互作用可以基于高置信度活性数据进行确认。这些发现对药物再定位有重要意义。
匹配分子集(MMS)利用MMP表将分子组织成分子集,集中各分子之间仅有一处基团存在差异。利用MMS的概念,可以根据一个MMS来确定另一个具有不同骨架但具有相应子结构改变的MMS,并能够估算出它相应的性质改变值,这一过程也被称为SAR迁移。通过SAR迁移等技术,可以进一步提高MMS方法的准确性和实用性。MMS方法已被证明在药物发现和优化中的应用前景广阔,可以为药物研究人员提供更多的可能性,以发现新的治疗药物。
5、MMPA的公共工具:Web服务器、软件和数据库
商业MMPA工具包括StarDrop、MOEsaic、OEMedChem Toolkit、MedChem Studio、MedChemia的MCPairs和Fuzzy MMP,公共工具包括LillyMol等。最初,MMP工具仅支持MMP搜索功能,但随着MMP搜索算法和大型公共数据库的发展,更有针对性的MMPA数据库被建立用于分子碎片化。MMP/MMS 相关的公共Web服务器、软件包和数据库见表3。
表3. MMP/MMS公共网络服务器、软件包和数据库。
MMPA在药物设计中的应用不仅局限于传统的优化规则总结,还可以用于骨架跃迁、分子图数据库构建、专项数据库构建和全新药物设计。例如,Green等人报道了一种自动化的全新设计系统BRADSHAW,其中将MMP转换规则应用于分子生成是其关键步骤。类似MMP概念的方法也被应用于基于SMILES的深度学习生成模型中,用于探索生物相关但化学新颖的类似分子。MMPA还可以有效地将具有相似结构特征的化合物聚类为类似物,在全新药物设计中具有重要的应用。尽管如此,MMPA仍然需要更多的自动化平台来集成和优化分子,以提高药物化学家的效率和准确性。
分子设计的挑战在于基于有限的实验经验而决定“下一步该做什么”,MMPA框架的提出允许将大量的性质变化进行总结并在分子设计中利用相关的转化规则。为了提升MMPA的效和实用性,作者提出以下建议,包括:(1)将MMPA与QSAR相结合,以用于未来QSAR模型预测和后续分析。(2)将MMPA概念应用于大分子设计。在过去的十年中,大多数MMPA研究主要集中在小分子的物理化学性质和生物活性分析上,而对于蛋白质、肽和核酸序列等宏分子的探索仍然不足。(3)推进MMPA用于分子优化的集成和自动化,包括MMP的自动提取、组织、应用、评估和循环。虽然MMP已经用于分子生成,但期望有更多深度学习方法和MMPA的组合。
图4. 理想的MMP自动化管道流程图。
本文首先讨论了MMPA的理论方面,包括搜索算法、重要参数以及MMPA和QSAR之间的关系等。此外,还系统地回顾了近期报道的基于MMPA的实际应用和公共工具。本文还详细讨论了MMPA在其他化学信息学工具和自动化管道中的应用,突显了MMP在药物设计中的重要性和实用性。最后,本文展望了MMPA研究的可能未来方向。MMPA技术不仅可以很好地加以利用,它甚至可以超越人类决策,成为药物设计者最有用的工具之一。未来我们将进一步完善基于MMPA的自动化多属性优化管道,并结合深度学习方法进行提升和补充。
内容来源:XYDrugs ,作者XYDrugs
责任编辑:胡静 审核人:何发
评论
加载更多