生成式AI融入基因编辑研究
音乐创作、程序设计、视频生成……生成式人工智能(AI)技术、产品、服务的持续创新,正展现出其与各行业深度融合的无限潜力。最近,AI的应用场景再次拓展:近日,美国AI蛋白质设计公司Profluent宣布启动OpenCRISPRTM计划,并声称其成功使用AI生成的基因编辑器(称为OpenCRISPR-1)来编辑人类DNA。该公司表示,这是“世界上第一个开源的、AI生成的基因编辑器”,并且是“用AI从头开始设计的”。
“尝试用AI设计的生物系统来编辑人类DNA是一次科学上的挑战。”Profluent联合创始人兼首席执行官阿里·马达尼说,“我们的成功预示着未来AI将精确设计出一系列定制的疾病治疗方案。为了促进基因编辑领域创新,推动这一未来趋势,我们正在开源OpenCRISPRTM计划的产品。”这意味着OpenCRISPR-1编辑器是开放的,允许个人、学术实验室和公司免费试验该技术。
OpenCRISPR-1是一款由AI创造的基因编辑器,由类似Cas9的蛋白和导向RNA组成,完全基于Profluent公司的大型语言模型(LLMs)开发而成。正如大模型能够轻松生成一篇文章,Open-CRISPR可用于构建蛋白质。在Open-CRISPR的训练过程中,AI从大规模序列和生物背景中学习,生成了数百万种自然界中不存在的类似CRISPR蛋白,从而指数级扩展了几乎所有已知的CRISPR家族。这是基因编辑领域的一个重要里程碑,有望加快针对多种遗传病精准治疗的发展。
CRISPR这一基因编辑工具的灵感源自细菌和古菌等原核生物的适应性免疫机制,通过记录并剪切病毒基因组来保护细菌免受病毒感染。科学家通过对CRISPR-Cas系统的研究,开发出了强大的基因编辑工具,如CRISPRCas9。然而,大多数Cas9蛋白长度超过1000个氨基酸,总体设计空间包含20的1000次方个可能序列,通过实验探索所有可能的序列变异非常耗时。
Profluent公司采用AI大型语言模型,从头开始设计CRISPR组件,而非仅增强现有系统。该公司创建了包含510万个CRISPR-Cas蛋白质数据的数据集,训练AI模型并要求其创建可代替Cas9的潜在蛋白质。结果显示,AI系统在测试中的表现与Cas9相当,但显著降低了对脱靶位点的影响,提高了编辑的精确度。
Profluent尚未将这些合成基因编辑器进行临床试验,因此尚不清楚它们能否赶上或超过CRISPR的性能。但概念论证表明,AI模型能够编辑人类基因组。 (记者 张佳欣)
(编辑:索朗次仁)