头图

细胞治疗产品 (CTP) 作为先进治疗药物 (ATMPs) 的重要组成部分,正为罕见病和疑难杂症患者带来希望。然而,其生产过程极易受到微生物的侵扰,微生物污染始终如阴霾般笼罩着这束希望之光。传统的无菌检测方法,如沿用半个世纪的 USP <71>(美国药典第 71 章记录的无菌检测法),在面对精准医疗的新需求时显得力不从心:长达两周的培养周期、繁琐的预处理步骤、依赖主观判断的浑浊度观察,不仅严重滞后于细胞制剂的短保质期,更可能因误判让患者暴露于感染风险之中。

随着细胞治疗产品的蓬勃发展,快速、准确地检测微生物污染变得愈发迫切。一种创新的检测方法 —— 机器学习辅助的紫外吸收光谱法应运而生,它将光学技术与强大的机器学习方法相结合,无需大量的训练数据,也不需要生长富集步骤,仅需少量样本就能在短短 30 分钟内输出检测结果,为细胞治疗产品的安全性提供了有力保障。

近日,新加坡-麻省理工学院研究联盟、新加坡 A*SRL 实验室、新加坡国立大学、美国麻省理工学院的联合研究团队,提出了一种结合紫外吸收光谱与机器学习的检测方法,能在 30 分钟内完成细胞培养上清液的微生物污染检测。该方法利用单类支持向量机 (one-class SVM) 解析紫外光谱中烟酰胺与烟酸的特征差异,在测试 7 种常见污染微生物时展现出 92.7% 的平均真阳性率,即便在排除烟酸代谢异常的供体样本后,真阴性率仍达到 92%,远超传统依赖经验判断的准确率。

相关研究成果以「Machine learning aided UV absorbance spectroscopy for microbial contamination in cell therapy products」为题,已发表于 Nature 旗下期刊 Scientific Reports。

图片

论文地址:
https://doi.org/10.1038/s41598-024-83114-y

关注「HyperAI超神经」公众号,后台回复「微生物污染监测」获取完整 PDF

开源项目「awesome-ai4s」汇集了 200 余篇 AI4S 论文解读,并提供海量数据集与工具:
https://github.com/hyperai/awesome-ai4s

利用商业光谱仪采集无菌 MSC 培养样本数据

在本次研究中,数据集的构建与分析紧密围绕间充质基质细胞 (MSC) 培养展开。鉴于 MSC 疗法在急性组织损伤、炎症性疾病及慢性退行性疾病治疗领域的广泛应用,研究团队选取其作为示范对象,利用商业光谱仪采集无菌 MSC 培养样本的吸收光谱,以此作为训练单类支持向量机 (one-class SVM) 模型的基础数据。研究采用异常检测策略,通过捕捉光谱特征差异,实现对细胞培养样本污染状态的预测,并基于烟酸 (NA) 与烟酰胺 (NAM) 代谢物光谱差异假设,探索 SVM 模型识别污染的潜在机制。

实验过程中,研究人员向供体 A 的 MSC 培养体系接种 10 CFU 大肠杆菌,成功在 21 小时检测到污染信号。经对比 7 家商业供体样本的检测性能,供体 A 在识别其他供体无菌样本时表现优异,因此被选定为初始训练数据来源。后续研究中,该方法不仅实现对 7 种微生物、低至 10 CFU 污染量的有效检测,还通过跨供体测试,验证了技术的稳健性。

为深入解析 SVM 模型性能,研究引入主成分分析 (PCA) 技术。以铜绿假单胞菌接种样本为研究对象——因其在液相色谱-质谱 (LC-MS) 检测中呈现最高 NA 浓度,通过 PCA 可视化训练数据集与污染样本分布,结果显示污染样本与灭菌样本在空间上显著分离,有效区分了无菌与污染状态。进一步分析主成分 1 (PC 1) 和主成分 2 (PC 2) 的载荷向量,并结合 100μg/mL NA 和 NAM 在 PBS 中的紫外吸收光谱归一化处理,直观呈现光谱特征与主成分的关联。

在模型稳健性验证环节,研究收集 6 位商业供体 (供体 B-G) 的废弃培养基及 PBS 灭菌样本,构建跨供体测试数据集。通过训练不同供体来源的 SVM 模型并交叉验证,发现基于供体 A 和 B 训练的模型预测准确率较高。对 418 个测试样本的分析显示,模型真正阳性率达 92.7%,检测限稳定维持在 10 CFU;但 77.7% 的真阴性率表明仍存在改进空间,其中供体 F 样本因 NA 水平异常导致的假阳性问题尤为突出,为后续优化模型对供体间代谢差异的适应性指明了方向。

机器学习辅助紫外吸收光谱法:以支持向量机为核心算法

为了让机器学习更好地助力微生物污染检测,该研究创新性地将其与紫外吸收光谱法相结合,提出了一种快速、灵敏且经济高效的微生物污染检测方法。该方法以支持向量机 (SVM) 为核心算法,通过分析细胞培养基的紫外吸收光谱特征,实现对微生物污染的精准识别。

在模型构建方面,研究人员采用了单类支持向量机,并选择了径向基函数 (Radial Basis Function, RBF) 作为核函数,设定 γ 值为 0.002,ν 值为 0.2。训练数据集由第 2、4、6 代的第 2 至第 7 天的供体 5,以及供体 8 的 PBS 掺入无菌样本组成,这些样本均被标记为 1,代表无菌状态。每个样本的吸光度值数据涵盖的波长范围是 237 nm 至 300 nm,以聚焦于烟酸 (NA) 和烟酰胺 (NAM) 的显著光谱特征,避免其他波段噪声干扰。所有样本在模型训练前均进行了均值中心化处理,以校正因仪器漂移等因素导致的光谱偏差,从而提高模型的准确性。

在模型验证与应用方面,机器学习辅助紫外吸收光谱法通过在供体 A 的 MSC 培养中加入 10 CFU 的大肠杆菌,在 9 小时到 24 小时之间,每隔 3 小时提取 3 次上清液样本,以展示该方法对低浓度污染物的检测能力。结果如下图所示,SVM 模型能够在 21 小时后准确预测样本受污染,总检测时间约为 21.5 小时。

图片
大肠杆菌加标样品的平均吸光度光谱

进一步地,研究将机器学习辅助紫外吸收光谱法与现有方法进行了比较。结果表明,机器学习辅助紫外吸收光谱法的检测时间 (TTD) 为 21 小时,与 USP <71> 测试(观察到浑浊需要 24 小时)和通过 LC-MS 计算 NA/NAM 比值的方法 (18 小时) 相当。但是,BacT/Alert® 3D 和 USP <71> 都需要训练有素的操作人员从细胞培养中提取样本并接种到各种生长富集培养基中。而紫外吸收光谱法的工作流程则相对简单,不需要额外接种到生长富集培养基中,也不需要额外的培养时间和样本制备,从而消除了观察到的生长富集接种步骤所需的额外资源和成本。

图片
SVM 模型对供体 A 的 80 个测量样本的预测准确率评估

为了确定所提出的机器学习辅助紫外吸收光谱法是否可以应用于其他微生物,研究人员使用供体 A 的 PBS 灭菌样本,将该方法应用于金黄色葡萄球菌 (S. aureus)、铜绿假单胞菌 (P. paraeruginosa)、枯草芽孢杆菌 (B. spizizenii)、产气荚膜梭菌 (C. sporogenes)、酵母如白色念珠菌 (C. albicans)、大肠杆菌 K-12 (E. coli) 以及痤疮丙酸杆菌 (C. acnes) 等其他微生长缓慢的生物种类的检测,检测限 (LoD) 低至 10 CFU。此外,研究还通过主成分分析 (PCA) 对 SVM 模型的性能进行了可视化分析,发现铜绿假单胞菌接种样本在 PCA 图中与 PBS 灭菌样本明显区分,表明模型能够有效捕捉光谱特征差异。

图片
供体 A 感染不同微生物种类的液相色谱-质谱研究

在模型稳健性研究方面,考虑到供体间的差异可能影响模型性能,研究人员收集了 6 位商业供体(供体 B-G)的废弃培养基样本,并制备了 PBS 灭菌样本。通过训练基于不同供体的 SVM 模型并评估其对其他供体样本的预测准确性,发现供体 A 和 B 的模型具有较高的平均预测率。因此,该研究后续基于供体 A 和 B 训练的 SVM 模型应用于其他 6 位供体的样本。研究结果表明,机器学习辅助紫外吸收光谱法实现了 92.7% 的真正阳性率,并且对于所测试的7种微生物,检测限 (LoD) 始终保持在 10 CFU。然而,模型的真正阴性率为 77.7%,假阳性样本主要来自供体 F,分析发现供体 F 样本中 NA 水平较高,这提示未来需要进一步优化模型以提高其对供体间差异的适应性。

图片
SVM 模型对不同供体的预测准确率评估

AI4S 赋能细胞治疗:科研、产业与政策协同并进

近年来,从科研到商业界,从实验室到产业化,细胞治疗产品 (CTP) 捷报频传。

在基础研究领域,同济大学 TJ-AI4S 团队在全球 AI 药物研发算法大赛中夺冠,其提出的分子特征延拓策略提升了模型的泛化能力,为 CTP 污染物分子指纹库的构建提供了新思路。北京邮电大学与北京大学合作开发的 UniBind 框架,通过多尺度图神经网络解析蛋白质相互作用,为研究 CTP 中细胞因子与微生物代谢物的动态关联提供了计算基础。
论文链接:
https://www.nature.com/articles/s41591-023-02483-5

此外,上海科技大学的团队开发了 CAR-Toner 平台,该平台利用 AI 算法优化 CAR 分子电荷分布,成功提升了细胞扩增效率并减少了批次差异。这一创新不仅提高了生产效率,还为 CTP 的标准化生产提供了新的技术支撑。
论文链接:
https://www.nature.com/articles/s41422-024-00936-1

产业界也捷报频传,复星凯瑞(上海)生物科技有限公司的 CAR-T 药物「奕凯达」在 2025 年实现了国内首次跨境供应,这背后是 AI 驱动的冷链物流管理系统,确保了细胞在极低温运输中的活性。此外,美国生物技术公司 A2 Bio 通过 AI 筛选通用供体细胞,实现了 CAR-T 药物的规模化预制,大幅降低了生产成本并缩短了治疗等待周期,为患者带来了更多的希望。

海外研究机构在 AI 赋能细胞治疗领域同样成果丰硕。2025 年,杜克大学生物医学工程团队开发了 PepPrCLIP 技术,基于 ESM-2 蛋白语言模型设计功能性短肽,为癌症精准治疗提供了新策略。IBM Watson Health 与斯坦福大学合作构建的 AI 预测模型,通过整合患者基因组、蛋白质组及临床多维度数据,将 CAR-T 治疗中细胞因子释放综合征 (CRS) 的预测准确率提升至 89%,助力临床提前干预高危患者。这些都为全球细胞治疗领域的发展注入了新的活力。

当前,AI4S 在 CTP 领域已经构建起从基础研究到临床应用的完整链条,但在数据标准化和跨机构协作机制等方面仍需进一步完善。展望未来,随着政策支持力度的加大和产学研的深度融合,AI4S 有望在 CTP 个性化制备、实时质量追溯、跨境物流优化等领域取得更大突破。

参考文章:
1.https://mp.weixin.qq.com/s/VZI7pm-kO7CxNJyrn9-qQw
2.https://mp.weixin.qq.com/s/0AoP5XSLOLzcTChQoIIfmw
3.https://mp.weixin.qq.com/s/Avu5SbLetCFBVUwnDybfsw
4.https://mp.weixin.qq.com/s/WoruStfCdYNDskAn_iFYtQ
5.https://www.nsfc.gov.cn/publish/portal0/tab1128/info90687.htm


超神经HyperAI
1.4k 声望8.8k 粉丝