近日,蓝鹊生物联合复旦大学、澳门大学在 Nature Communications 杂志发表研究文章 "Artificial intelligence-driven rational design of ionizable lipids for mRNA delivery",利用AI和虚拟筛选得到能够高效递送mRNA的脂质体新分子。
研究背景
脂质纳米颗粒(LNPs)已被证明在mRNA传递方面有效。其关键成分可电离脂质体传统上通过实验筛选来优化,过程效率低且成本高昂。本研究利用人工智能(AI)和虚拟筛选来促进可电离脂质体的合理设计,评估了近2000万个可电离脂质体,分别产生了三个和六个新分子。经过两轮迭代,最终得到一个脂质体分子的功效与脂质SM-102相似。
研究方法
- 使用AI驱动的计算机模拟和机器学习算法来预测和优化可电离脂质体的性能。
- 构建了一个包含多种可电离脂质体的数据库,并使用这些数据训练机器学习模型。
- 通过模拟不同脂质与mRNA的相互作用,评估其在体外和体内递送中的表现。
- 采用高通量筛选技术验证AI模型的预测结果,并进一步优化设计。
研究者将 Moderna、Acuitas、Protiva 各公司和其他学术机构发表的递送相关专利中的相关信息进行了提取和整理,构建了一个包含多种可电离脂质体的数据库,并使用这些数据训练机器学习模型。研究者提取的信息包括 LNP 配方、表观 pKa、脂质体结构等关键参数。
在 AI 模型训练过程中,研究者采用了 LightGMB 训练方式,基于与 MC3 比较的传递效率标准,采用分类模型,区分优于 MC3(阳性)和不如 MC3(阴性)的脂质。AI 根据脂质体化合物结构预测表观 pKa 和递送效率。研究者预测了 14 种可电离脂质体的递送效率,并合成了其中 9 种进行实验验证。
在本研究中,脂质虚拟筛选分为两个连续阶段进行,最终导致两批独立脂质的合成和评估。与 MC3 递送效率相当的,作为 Model 1 的筛选标准;达到 MC3 递送效率 2 倍,作为 Model 2 的筛选标准。下图显示了第一轮筛选的工作流程。

离子化脂质的结构由扩展连通性指纹(ECFP)表示,每个 ECFP 位对应脂质内的一个亚结构。ECFP 分数与 mRNA 递送效率相关。将高评分的脂质体进行结构相似性比较,找到关键的亚结构特征。然后将尾部和头部候选结构按照结构模式组合,穷尽地生成虚拟可电离脂质体库。

不过,这三种脂在实际检测中表现相对一般,递送效率只有一个接近 MC3 的水平。因此研究者又对模型重新进行了评估,重点关注含有乙醇胺头部基团的脂分子,在数据集中进行集中测试。另外,研究者还将阳性的判定标准提高到 MC 递送效率的 2 倍,构建了 Model 2,最终得到了 6 个候选分子,递送效率均超过 MC3,其中有 3 个达到或超过了 SM-102(Moderna 在 COVID-19 疫苗中使用的脂质体分子)的递送效率。

研究者们进行了一系列实验来测试筛选出了这 9 种脂质体与 MC3 和 SM-102 在性质上的异同。在体外实验中,测试了不同设计的可电离脂质体对 mRNA 的保护效果和细胞内转染效率,以及形成的 LNP 颗粒的各项指标等。
小结
这项工作将 AI 模型应用在预测 mRNA 传递效率和表观 pKa,可以加速可电离脂质体的筛选和设计。研究显示,通过 AI 模型的应用,不仅可以提高筛选效率,还能发现性能优异的新脂质,有的甚至接近现有最佳标准。此外,合理结合多种 AI 模型的重要性,以及 AI 模型与化学直觉和专家知识相结合的重要性在本研究中得以体现。
原文链接:https://doi.org/10.1038/s41467-024-55072-6


