首页 >科研 >研究报告
DeepMind 的 AlphaGenome 模型可预测基因变异功能,助力疾病研究
发布时间:2026/02/02

DNA 序列的微小变异可能改变生物体对环境的应答方式,或影响其疾病易感性。解析基因组序列变异的影响仍是一项研究难题,而位于蛋白质编码区外的非编码变异,因会引发多样的分子层面效应,其解析难度尤为突出。

 

曾研发出斩获诺贝尔奖的 AlphaFold 蛋白结构预测模型的谷歌 DeepMind 团队,近日在《自然》期刊发表了全新 DNA 序列模型 AlphaGenome。该模型实现了调控变异效应预测技术的升级,为解析基因组功能提供了新手段。

 

 

 

AlphaGenome 的应用场景包括新治疗靶点的筛选,以及具备特定调控功能的人工合成 DNA 的设计。研究团队指出,该模型尤其适用于研究具有潜在显著效应的罕见变异,例如引发孟德尔罕见病的各类变异。

 

伦敦大学学院教授、血液系统恶性肿瘤研究专家马克・曼苏尔博士表示:“解析不同非编码变异的生物学意义极具挑战性,规模化解析更是难上加难。这一工具将为相关研究补上关键一环,帮助我们建立更精准的关联,从而深入研究癌症等疾病的发病机制。”

 

AlphaGenome 可将长度达 100 万个碱基对的长链 DNA 序列作为输入,对表征调控活性的数千项分子特征进行预测,包括不同细胞类型和组织中基因的起始与终止位置、剪接位点、RNA 的合成水平以及 DNA 的可及性。

 

这种长序列背景对覆盖远端基因调控区域至关重要。此前的模型不得不在序列长度与解析精度之间做出取舍,这也限制了其可建模的分子检测维度范围。

 

在运算效率方面,有研究显示,AlphaGenome 通过对比突变序列与野生型序列的预测结果,可在 1 秒内完成某一基因变异对多种分子特征的影响评分。

 

脊髓性肌萎缩、部分类型的囊性纤维化等诸多罕见遗传病,均可能由 RNA 剪接异常引发。值得关注的是,AlphaGenome 可直接从 DNA 序列中对剪接连接区的位置及表达水平进行显性建模,为解析基因变异对 RNA 剪接的影响机制提供了更深入的研究视角。

 

斯隆 - 凯特琳纪念癌症中心首席研究员卡莱布・拉罗博士表示:“我们首次拥有了一款能在全基因组研究任务中,将长程序列背景、单碱基级解析精度与前沿预测性能融为一体的单一模型。”

 

该模型的训练数据来源于 ENCODE、GTEx、4D Nucleome 和 FANTOM5 等大型公共研究联盟,这些机构通过实验对数百种人类和小鼠的细胞类型及组织中的基因调控特征完成了检测与量化。

 

研究团队指出,在后续研究中,精准捕捉远距离调控元件的作用效应(例如与目标区域相距 10 万个 DNA 碱基的调控元件),仍是 AlphaGenome 目前的技术短板。另一项研究重点则是提升模型捕捉细胞与组织特异性调控模式的能力。

 

此外,AlphaGenome 目前仅能对单个基因变异的作用效果进行特征分析,尚未在个人基因组层面的预测中完成验证。同时,尽管该模型可预测基因变异引发的分子层面结果,但基因变异如何导致复杂性状或疾病的发生,还涉及发育调控、环境因素等更广泛的生物学过程,这些均超出了模型的直接研究范畴。

 

DeepMind 已开放 AlphaGenome 的非商业研究使用权限。