机器学习在生物制药上游工艺控制和模拟中的应用

2024-08-07

本文节选自来自澳大利亚 CSL 等的研究人员发表的文章“Applications of machine learning in antibody discovery, process development, manufacturing and formulation: Current trends, challenges, and opportunities”

虽然机器学习（ML）为生物制药领域做出了重大贡献，但其应用仍处于早期阶段，无法为基于质量源于设计的生物制药开发和生产提供直接支持，从而阻碍了从开发到生产的生物过程自动化的巨大潜力。然而，由于大规模生产数据的积累，基于机器学习的模型代替传统多元数据分析方法的采用显著增加。这一趋势主要是通过实施先进的过程分析技术来实时监控生物制药产物的过程变量和质量属性所推动的。鉴于生物产物设计、生物工艺开发和产物生产数据的复杂性和多维性，基于机器学习的方法越来越多地被用来实现准确、灵活和高性能的预测模型，以解决生物制药领域内部的分析、监测和控制问题。本文旨在全面回顾目前机器学习解决方案在单克隆抗体上游、下游和产品制剂工艺的设计、监测、控制和优化中的应用。最后，本文将深入讨论与生物工艺本身、过程数据以及机器学习模型在单克隆抗体工艺开发和生产中的使用相关的主要挑战。此外，文章还将提供对创新机器学习方法的采用和新数字生物制药解决方案开发的新趋势的进一步见解。

上游工艺的控制和模拟

生物制药产物的稳定质量在很大程度上依赖于生物过程的有效控制。在生物制药工厂中，生物反应器是至关重要的组成部分，需要优化的关键工艺参数之一是生物反应器中的营养物和代谢物浓度。因此，非常需要实现对生物反应器内细胞培养过程的精确控制。控制生物反应器最困难的方面是管理细胞生长，因为负责将原材料转化为新细胞和产物的细胞具有敏感性和复杂性。尽管如前文所示，监测能力取得了进步，但现在的主要挑战在于有效利用这些监测系统生成的数据来设计有效的控制策略。Mears等人将工艺控制分为两组。第一组包括离线控制策略，使用模型模拟或实验室规模的研究来测试和开发适当的工艺操作条件（例如温度、pH、压力、通气速率和搅拌器速度）、初始条件、安全约束和控制策略。第二组是在线工艺控制，它使用实时过程监控工具作为制定控制策略和操作条件的一个组成部分。

显然，在应用于工业规模生产之前，控制策略的性能和行为的模拟可以比实时执行更快。这是因为生物过程的动力学缓慢且复杂。例如，典型的哺乳动物细胞培养补料分批工艺可能需要 1 至 3 周，而灌流工艺可能需要长达 3 个月。通过模拟控制策略，可以在实际实施之前识别并纠正配置错误，从而节省时间并最大限度地降低控制失败的风险。模拟还可以用于测试不同的“假设”场景，并帮助开发现实的工艺模型，然后使用该模型来确定最佳操作条件。这样，机制模型比数据驱动模型具有更多优势，因为它是动态的、可预测的，并且能够表示培养的非线性行为。系统不需要大量的训练样本。因此，机制模型适用于模拟系统的开发和验证各种控制策略。

Goldrick等人开发了工业规模青霉素产物的半批次式生物反应器模拟模型，总规模为100,000L。该模型使用从真实工厂收集的历史数据进行了验证。该工艺模型采用第一原理数学模型来表示细胞生长、底物摄入和青霉素产生的机制。该模拟成功捕获了复杂的过程动态，并解释了与现代生物技术设施相关的常见故障。该模型还结合了时-变结构动力学模型，准确地表示了生物质和青霉素，以及工业规模培养工艺的主要过程变量。该模拟考虑了影响工业规模青霉素生产的各种环境因素，例如溶氧、粘度、温度、pH、溶解二氧化碳、氮气和苯乙酸。因此，模拟模型对于实施前测试不同的控制策略特别有价值。在后来的研究中，Goldrick等人证明了该模拟作为开发和测试可应用于生物制药工艺的新控制策略的基准工具的能力。作者通过在框架中添加模拟拉曼光谱装置来扩展所提出的工具。工业规模青霉素生产模拟的概况可以总结在图6中。该模拟工具能够在固定或操作员控制模式下运行，并生成每批次可用的所有在线、离线和拉曼光谱。通过使用这种模拟，作者设计了一种控制策略，旨在最大限度地提高青霉素的年产量，同时减少批次产量的可变性。该研究还通过模拟场景说明了对青霉素生产有影响的 CPP 和 CQA 的识别。作者展示了与当前 PID 控制回路相比，通过最小化 pH 和温度的变化来改进 pH 和温度控制策略。通过使用拉曼光谱装置记录的光谱，该研究证明了开发一种可以实时预测苯乙酸、生物量或青霉素浓度的软传感器的能力。此外，作者还制定了一种控制策略，确定每批的最佳收获时间，以最大限度地提高每年生产活动中青霉素的年产量。在另一项研究中， Oh 等人通过修改 Goldrick 等人提出的模拟模型，建立了青霉素生产的虚拟工厂。Oh 等人基于构建的模拟开发了双深度 Q 网络和模型预测控制之间的集成方法，以实现半批次式生物反应器的底物进料策略。Kim 等人通过模拟青霉素发酵容器，使用强化学习为补料分批生物反应器设计了一个两阶段最优控制框架，通过解决有关模型-工厂不匹配和实时干扰的问题，该框架可以很容易地在工业规模生产中实施。与青霉素的生产相比，哺乳动物细胞培养的工艺更加复杂。这些模拟方法可用于开发用于 mAb 生产的哺乳动物细胞培养生物反应器的模拟器。例如，Craven等人展示了成功使用非线性第一原理机制数学模型来模拟非线性模型预测控制，该模型可有效控制中国仓鼠卵巢哺乳动物细胞补料分批工艺中的生物反应器环境。该模拟器是根据 CPP 和 KPI 的历史离线测量结果进行调整的。然后，将离线模拟器与营养物和代谢物浓度值的实时监测数据相结合，通过动态调整生物反应器的营养物补料速率来制定控制策略，以将葡萄糖浓度维持在设定点以上。

与根据机制模型构建工艺模型的离线过程控制不同，先进的在线过程控制可以从实时过程监控中受益，而实时过程监控可以通过使用软传感器来获得。如果出现任何异常过程行为，实时故障检测能够执行纠正反馈或前馈控制机制，以确保最终产物质量。例如，多元光谱模型可以实时控制生物反应器中葡萄糖和乳酸浓度等过程变量。然而，仍然通过离线测量收集了大量可以作为控制基础的工艺信息，导致控制策略的时间延迟。除了 DO、pH 和温度之外，葡萄糖、氨的浓度和渗透压也是确定 mAb 糖基化模式的关键参数。为了开发更先进的控制策略，基于拉曼光谱等技术的光谱软传感器可用于实时量化这些附加变量。例如，基于使用拉曼光谱实时监测葡萄糖的反馈控制机制已使糖基化可变性减少了 50% 以上。因此，过程监控和先进的过程控制可以更深入地了解过程行为，从而持续保持产物质量。

图6 . 工业规模青霉素发酵模拟的输入和输出概述。

在生产中，一个重大挑战是如何有效地使用先进的监控工具。为了应对这一挑战，必须采用一种将监控硬件工具与数据分析建模方法相结合的集成方法。先进监控工具与多元数据分析的结合是构建软传感器的基础。文献中，有许多关于软传感器在过程监测和控制中的关键作用的综述论文。软传感器的使用可以实现及时的实时工艺数据，这不仅对于在工艺开发阶段生成工艺理解至关重要，而且对于在生产工艺中实现先进控制也至关重要。Vann 和 Sheppard提出了一个监控、数据分析、理解、策略设计和控制的集成框架，如图7所示。在此框架内，可以执行数据分析以生成工艺理解，从而能够将软传感器或预测模型与其它监控信息集成以设计高级控制策略。Vann 和 Sheppard通过实际实施证明了综合框架的有效性。该框架有助于提高最终产物滴度的批次间一致性，将可变系数从 8.49% 降低至 1.16%，从而能够及早预测工艺过程中可能出现的故障，并触发必要的行动来防止其发生，从而避免损失批次。

在当前大规模哺乳动物细胞培养的行业实践中，通常使用具有固定体积大补料的标准平台补料分批工艺。然而，大补料可导致较宽的葡萄糖浓度范围，这可影响工艺性能和产物质量属性，例如导致乳酸和氨的积累，这可增加细胞死亡率。较低的葡萄糖浓度可以降低葡萄糖消耗率、降低乳酸生成率并提高工艺 pH 值，从而导致碱添加量降低。因此，代谢物补给和控制的变化可能会对产物质量属性产生重大影响，例如峰值细胞计数、最终滴度以及特定的葡萄糖和乳酸消耗。一种策略是建立大补料方案，作为日常采样的一部分进行常规管理。另一种策略是设定一个确定的、连续的补料速率，而不考虑培养物反馈。虽然这些策略已被广泛使用，但它们不能满足细胞实际的营养消耗需求，可能导致副产物的积累和某些营养物质的消耗。可以实施适应性补料策略来解决这些问题。为了执行补料速率的自适应控制策略，需要从 PAT 工具获取实时数据。表8总结了机器学习在设计控制策略中的典型应用，主要集中在自适应性补料策略上。

图7. 用于监控、数据分析、理解、策略设计和控制的集成框架。

Berry等人提出了一种过程自动化系统的设计，该系统允许实时控制葡萄糖设定点。每天给予无葡萄糖营养补料，同时根据在线拉曼测量按需提供葡萄糖溶液。实施了两种反馈控制条件，一种将葡萄糖保持在恒定的低浓度，另一种以逐步的方式降低葡萄糖浓度。结果表明，与葡萄糖大补料方法相比，使用低目标浓度时糖化水平从 9% 降低至 4%，但在逐步条件下则没有。Domjan等人证明动态补料控制方法是将葡萄糖和谷氨酸等营养物质浓度维持在狭窄且低范围内的有效方法。作者表明，使用拉曼光谱的自动补料控制系统可以操纵细胞代谢，以乳酸作为主要碳源，从而导致中等毒性副产物的积累，并为细胞提供有利的环境。结果，与大补料实验相比，动态补料的两种培养物中的 VCD 增加，并且实现了延长的细胞活性，导致动态补料实验中收获滴度增加。

表8 . 总结机器学习模型在生物工艺控制中的典型应用。

ID	规模	类型	细胞	离线采样	输入参数	控制参数	控制策略	算法
1	10万升生物反应器	半批次	青霉素	每24小时一次	在线测量：温度、pH、DO、pCO₂、废气；离线测量：底物、苯乙酸、生物量、青霉素浓度、氮和粘度	底物流量、酸/碱流量、冷却剂流量、加热流量、水流量	根据阶段成本、终端成本和约束条件的最佳基质供给策略	使用 NMPC 进行强化学习
2	2L、3L生物反应器	补料分批	N/A	一天一次	离线测量：VCD、活性、Glc、Lac、Gln、Glu、NH₄、Na、K、Osm、滴度	Glc 和营养物补料量	在指定时间点的最佳补料策略，以最大限度地提高 VCD，同时最大限度地减少副产物	混合 FPM、ANN 和 LR
3	N/A	补料分批	青霉素	0.5小时	实时温度、pH、搅拌；离线测量：生物量、底物、青霉素、氢离子、DO、CO₂浓度、培养体积	底物、冷却水、酸和碱的进料流量	最大化最终生产率和产量的最佳进料轨迹	基于模型的强化学习
4	2L生物反应器	补料分批	CHO DG44	1-2次/天	拉曼；离线测量：VCD、pH、Glc、Lac、Glu、Gln、NH₄	Glc补料量和次数	基于实时葡萄糖浓度的动态补料策略	PLSR
5	3.5L生物反应器	补料分批	CHO	每天一次	扩增持续时间、扩增 VCD、扩增细胞年龄、DO_设定、pH_设定、pH、DO、pCO ₂、Glc、Lac、Glu、Gln、NH ₄、Osm、VCD	Glc补料速率	当 Glc 浓度低于 20 mM 时，触发补料以在补料后达到 Glc 浓度等于 30 mM	ANN + 质量平衡方程 + EKF
6	250 ml锥形瓶	补料分批	织线藻	一天一次	生物量、硝酸盐消耗量和 C-PC 浓度	每日补充营养	最大化批次结束时 C-PC 的产量	深度强化学习
7	N/A	补料分批	毕赤酵母	每秒	培养基的生物量和底物浓度	进料底物浓度	达到并维持 7.5 g/l 的底物浓度	部分监督强化学习，NMPC
8	AMBR-15 ml、7L、50L 生物反应器	补料分批	CHO	每天一次	在线测量：搅拌器转速、DO、最大饱和度DO、入口气体流量；离线测量：VCC、活性、Glc、Lac、滴度	Glc补料量	基于在线氧传输速率的在线葡萄糖高级工艺控制，以将 Glc 维持在可调节的设定点	数学方程
9	2L、30L、300L生物反应器	补料分批	大肠杆菌	30分钟	NIR、在线 DO、pH、搅拌、气流、温度；离线测量：氨基酸、葡萄糖、B 族维生素、细胞密度	诱导、气流、冷凝阀	在最佳 Glc 浓度和细胞密度下触发诱导；根据堵塞预测器的结果减少气体流量并打开冷凝阀以防止过滤器堵塞	主成分分析、PLSR、PID
10	1L生物反应器	补料分批	GS-NS0	每 6 小时	离线测量：Glc、Glu、精氨酸、天冬氨酸、天冬酰胺浓度；批次运行结束时的最终 mAb 浓度	Glc、Glu、精氨酸、天冬氨酸、天冬酰胺的进料流量	以 2 小时持续时间的脉冲引入培养基，以最大化最终的 mAb 浓度	单动力学模型
11	6.6L生物反应器	批次	酿酒酵母	–	生物质（使用 NIR）、DO、pH、温度、废气、酸/碱浓度、加热/冷却速率（每分钟）	抗生素添加、放气速率、搅拌速率、氮气添加	使用多元控制图发出的失控事件来触发系统进行控制	PCA、多块 PLSR、基于规则的专家系统
12	2L、80L生物反应器	补料分批	CHO DG44	每天一次	在线测量：pH、Glc、Lac；离线测量：总细胞、活细胞、活性、IgG、Glc、Lac	Glc 进料量和时间点	基于实时信号、电容和 pH 值的自适应补料策略	PLSR
13	5L、200L、315L生物反应器	补料分批	HEK293	每天一次	拉曼；离线测量：Glc、Lac、NH ₄、VCD、活性、产物滴度	Glc 进料量和时间点	基于拉曼光谱估计的 Glc 和 Lac 在线测量的自适应补料策略	PLSR
14	500 ml、1L、3L 摇瓶	补料分批	CHO DG44	2至4次/天	拉曼；离线测量：Glc、Lac、Osm、VCD、TCD、活性、IgG 滴度	Glc 进料设定点	当在线 Glc 浓度降至低于下死区（0.25 g/L ¡ 设定值）时，泵入 200 g/L 葡萄糖溶液	PLSR
15	500L生物反应器	灌流	CHO IGF-1	每 4 小时一次；一天一次	谷氨酸和甘露糖的实时气相层析-质谱法；离线测量：滴度、己糖和产物聚糖（每 4 小时）；生长、活性、Osm、Lac（每日）	% 高甘露糖	根据 NMPC 计算的甘露糖进料速率向培养基中添加或去除甘露糖	工艺数学模型、最小二乘回归
16	5L生物反应器	补料分批	每天一次	CHO、HEK	在线测量：Glc、Lac（使用BioPAT Trace系统）；离线测量：VCD、活性、pH、DO、pCO₂、Glc、Gln、Lac、NH₄、K、Na、Osm、mAb 浓度	复合补料添加、Glc 原液添加	动态补料策略，包括设定点控制（Glu ¡设定点，触发补料泵添加含有 Glu 的复杂营养补料）、全自动反馈控制以及基于实时 Glc 和 Lac 的自适应补料	反馈控制
17 号	15L生物反应器	补料分批	CHO 320	每天一次	拉曼；离线测量：Glc、Gln、Lac、NH ₄、VCD、活性	Glc 浓度固定设定点	使用 NMPC 和基于拉曼的 Glc 测量连续调整进料速率，以将整个培养工艺中的 Glc 浓度保持在 11 mM 的设定点	机制模型，PLS
18	3L生物反应器	补料分批	CHO	每天一次	在线电容；离线测量：VCC、活性、pH、NH ₄、Osm、DO、Ca、K、Na、Glu、Gln、Glc、Lac、氨基酸、维生素	培养基补料量	基于 VCD 或 Glc 浓度反馈的预测值以及补料培养基优化的动态补料	数学方程
19	1L、2L、180L、500、2500L生物反应器	补料分批	CHO K1	每天一次	离线测量：Glc、Lac 浓度、Osm、气体、pH、IVCD、滴度	Glc进料量	高端 pH 控制的葡萄糖输送导致最终滴度加倍	简单的阈值
20	2L、8L、24L生物反应器	补料分批	BHK-21A	6-12小时	离线测量：活细胞、Glc、Lac、Gln、NH ₄、丙氨酸、IgG 浓度	Glc 和 Gln 补料量	Glc 和 Gln 的最佳补料策略	动力学模型+人工神经网络

ACO：蚁群优化、ANN：人工神经网络、CHO：中国仓鼠卵巢、C-PC：蓝藻藻蓝蛋白、EKF：扩展卡尔曼滤波器、Glc：葡萄糖、Gln：谷氨酰胺、Glu：谷氨酸，GP：Gaussian Process，HEK：人胚胎肾，K：钾，Lac：乳酸，LR：线性回归，MPC：模型预测控制，Na：钠，NH4：氨，NIR：近红外光谱，NMPC：非-线性模型预测控制器，Osm：渗透压，PID：比例积分微分控制器，PCA：主成分分析，PLSR：偏最小二乘回归，FPM：第一原理模型，TCC：总细胞浓度，TCD：总细胞密度， VCC：活细胞浓度，VCD：活细胞密度。

尽管在实验室规模开发控制策略方面取得了初步积极成果，但将其转移到细胞培养生产工艺中仍面临着几个挑战，包括生物系统复杂、相互关联的性质、测量关键质量属性的困难，以及需要复杂的模型来捕获这些过程的非线性动力学。为了应对这些挑战，研究人员可以利用对细胞代谢的见解来制定有效的过程控制策略。例如，pH 值上升可能表明乳酸消耗，从而触发葡萄糖补料。为了支持闭环控制，与拉曼光谱等 PAT 工具集成的软传感器可以提供质量属性和性能指标的实时测量。值得注意的是，拉曼光谱已成功用于补料分批培养中的葡萄糖反馈控制。根据Narayanan等人的说法，用于 CPP 和 CQA 实时预测和控制的自适应动态控制算法的定义对于确保质量标准和 Pharma 4.0 的实现非常重要。此外，必须有一个考虑到所有工艺单元及其相关设备的监控系统。在这个方向上，已经有研究探索了各种有前途的方法来整合不同的单元并实现连续的生物生产。值得强调的是，随着行业继续向集成化和连续化操作发展，可靠的监控和数据采集系统作为基于先进工艺模型、数据分析和实时过程控制的接口至关重要，以充分利用其对工艺操作和自动化的影响。这些集成框架在单克隆抗体开发和生产工艺的监测和控制中仍然不太流行。

内容来源：生物工艺与技术

责任编辑：邵丽竹

审　　核：何发

机器学习在生物制药上游工艺控制和模拟中的应用

评论

热点文章