通过修改植物和微生物的基因组,合成生物学家可以设计出符合特定要求的生物系统,例如生产有价值的化合物、使细菌对光敏感或编程细菌细胞以侵入癌细胞。这一科学领域虽然只有几十年的历史,但却使大规模生产医疗药物成为可能,并展现了开发了非石化来源的化学品、燃料和材料的能力。
然而,合成生物学是劳动密集型的,且进展缓慢。从了解制造产品所需的基因,到让它们在宿主生物体内正常运作,最后让该生物体在大规模工业环境中茁壮成长,从而生产出足够的产品来满足市场需求,生物制造工艺的开发可能需要很多年的时间和数百万美元的投资。
劳伦斯伯克利国家实验室研究员赫克托·加西亚·马丁(Héctor García Martín)正在致力于通过应用人工智能和数学工具来加速和完善合成生物学研发领域。
García Martín:
我认为,我们在合成生物学中发现的制造可再生产品的障碍都源于一个非常基本的科学缺陷:我们无法预测生物系统。
许多合成生物学家可能不同意我的观点,并指出将工艺从毫升扩展到数千升的难度,或者提取足够高的产量以保证商业可行性的难度,甚至需要艰苦的文献搜索才能找到具有合适特性的合成分子。这些都是事实。但我相信它们都是我们无法预测生物系统的结果。
假设有人带着一个完美设计的 DNA 序列,让我们放入微生物中,这样它就能创造出我们所需的目标分子的最佳数量(例如,大规模(数千升)生产生物燃料需要几周时间才能合成并转化成细胞,商业规模生产需要三到六个月时间。这 6.5 个月和我们现在需要的约 10 年之间的区别在于,需要花一些时间来微调基因序列和培养条件。
例如,降低某个基因的表达以避免毒性积聚或增加氧气水平以加快生长,或降低某种基因的表达以避免毒素积聚或增加氧气水平以加快生长,以及降低某种基因的表达以避免毒素积聚或增加氧气水平以加快生长。我们不知道这些因素将如何影响细胞行为。如果我们能够准确预测,我们就能更有效地设计它们。
人工智能如何加速这些进程?您能举一些最近的工作例子吗?
García Martín:
我们正在使用机器学习和人工智能来提供合成生物学所需的预测能力。该方法不需要完全了解所涉及的分子机制,因此可以节省大量时间。通常,这些工具必须在庞大的数据集上进行训练,但合成生物学的数据量不如天文学等学科的数据量大,因此团队开发了独特的方法来克服这一限制。
例如,我们使用机器学习来预测选择哪些启动子(介导基因表达的 DNA 序列)可以获得最大生产力。我们还使用机器学习来预测最佳生产的正确生长培养基,预测细胞的代谢动力学,提高可持续航空燃料前体的产量,并预测如何设计功能性聚酮合酶(可以产生大量有价值的分子但难以预测的工程化酶)。
在许多情况下,我们需要自动化科学实验,以获得大量高质量数据,而这些数据是让人工智能方法真正发挥作用所必需的。例如,我们使用机器人液体处理器为微生物创建新的生长培养基并测试其有效性,我们还开发了微流控芯片,试图实现基因编辑的自动化。我正在积极与实验室的其他人(以及外部合作者)合作,创建合成生物学的自动驾驶实验室。
美国还有很多其他团体在做类似的工作吗?您认为这个领域会随着时间的推移而发展壮大吗?
García Martín:
在人工智能、合成生物学和自动化交叉领域拥有专业知识的研究团队数量非常少,尤其是在工业界之外。我想此处应特别推荐威斯康星大学的Philip Romero教授和伊利诺伊大学厄巴纳-香槟分校的赵惠民教授。
然而,鉴于这种技术组合可能产生巨大的社会影响(例如,在应对气候变化或生产新型治疗药物方面),我认为这个领域在不久的将来会发展得非常快。我参加过几个工作组、委员会和研讨会,包括国家安全委员会新兴生物技术专家会议,讨论了这些机会并正在起草提出积极建议的报告。
García Martín:
我认为,在合成生物学中大量应用人工智能和机器人/自动化技术可以将合成生物学的进程加快约 20 倍。我们可以在约 6 个月内(而不是约 10 年)创造出一种新的商业上可行的分子。如果我们想要实现循环生物经济——可持续利用可再生生物质(碳源)来产生能源、中间产品和最终产品,那么这一点就迫切需要。
与当前高度迭代和劳动密集型的过程(上箭头)相比,使用人工智能和自动化如何极大地加快研发流程(下箭头)。例如,合成生物基化学品1,3-丙二醇,需要575个人/年的工作。(资料来源:伯克利实验室)
目前,估计有 3,574 种高产量 (HPV) 化学品(美国每年生产或进口的化学品数量至少为 100 万磅)来自石化产品。一家名为 Genencor 的生物技术公司需要 575 人/年的工作来开发一种可再生途径,以生产其中一种广泛使用的化学品 1,3-丙二醇,这是一个典型的数字(如上图)。
如果我们假设设计一种生物制造工艺来取代这数千种化学品中的每一种的石油精炼工艺需要这么长时间,我们将需要约 2,000,000 人年。如果我们让所有估计的约 5,000 名美国合成生物学家(假设占美国所有生物科学家的 10%,这是一个高估)来研究这个问题,那么创造这种循环生物经济将需要约 371 年的时间。随着温度异常每年都在增加,我们实际上没有 371 年的时间。这些数字显然是快速的粗略计算,但它们给出了如果我们继续按照当前路径发展的话,数量级的概念。我们需要一种颠覆性的方法。
此外,这种方法将能够追求当前方法无法实现的更宏伟的目标,例如:为环境目的和人类健康设计微生物群落、生物材料、生物工程组织等。
García Martín:
伯克利实验室在过去二十年中对合成生物学进行了大量的投资,并展示了该领域的丰富专业知识。此外,伯克利实验室是“大科学”的发源地:大型团队、多学科科学,我认为这是合成生物学目前的正确道路。
自发现 DNA 以来,过去七十年中,通过单一研究人员的传统分子生物学方法取得了许多成就,但我认为未来的挑战需要一种多学科方法,包括合成生物学家、数学家、电气工程师、计算机科学家、分子生物学家、化学工程师等。
来源:
https://newscenter.lbl.gov/2024/05/30/synthetic-biology-with-artificial-intelligence-and-automation/
撰稿人 | 合成生物学与绿色
责任编辑 | 邵丽竹
审核人 | 何发
评论
加载更多