首页 >科研 >研究报告
介绍几个最新基因/变异解读实用资源
发布时间:2026/03/05

文献1. Het2Gene:一种基于异质图嵌入、表型驱动的基因优先级排序模型

 

摘要

 

孟德尔遗传病给全球公共健康带来了沉重负担。及早识别致病基因对于阻断疾病进展、研发靶向疗法至关重要。然而在临床实践中,从新一代测序(NGS)数据中诊断致病基因仍是一项耗时且极具挑战的工作。

 

尽管目前已开发出诸多以表型为驱动的计算模型(以基于图的方法为主)来辅助临床基因优先级排序,但这些模型仍存在诸多局限:它们往往忽略生物网络中固有的异质信息,且因过度关注疾病注释、忽视真实临床病例频次,导致关键的疾病患病率信息未被纳入考量。

 

为填补上述空白,我们提出了 Het2Gene 这一新型框架 —— 该框架采用权重感知的 Meta-path2Vec 算法,从异质图中学习具有信息价值的表型 - 基因嵌入特征。与现有忽略异质元路径语义的方法不同,Het2Gene 基于临床病例数据生成异质随机游走路径,并在游走过程中动态分配自适应权重,以此优先考虑具有生物学意义的关联关系,大幅提升候选基因的排序准确性。

 

通过两个基准数据集验证及额外的外部验证表明:相较于当前主流模型,Het2Gene 在致病基因优先级排序任务中表现更优,且具备稳健的跨数据集泛化能力。对基因评分的分析进一步显示,该模型有望揭示新的基因 - 疾病关联。

 

本研究的实现代码可通过网址 https://github.com/cskyan/Het2Gene 免费获取。

 

 

https://www.sciencedirect.com/science/article/abs/pii/S0010482526001046?via%3Dihub

 

文献2. Intolerome:一个用于死胎、妊娠丢失及新生儿死亡相关基因组变异优先级排序的精选数据库

 

作者:Yatsenko SA, 等

 

研究目的

 

新一代测序技术(NGS)在产前与新生儿基因组医学中的应用可实现明确诊断,并对临床决策与生育规划产生重要影响。尽管近年相关技术不断进步,但在无明显表型异常的病例(死胎、流产、新生儿死亡)中,对基因组 / 外显子测序所检出变异的解读仍面临挑战。

 

研究方法

 

为提高诊断准确性,本研究构建了致死基因集数据库(Intolerome Database),该精选数据库收录了 934 个人类生存必需基因,并系统整理了各基因的作用机制、表型、遗传方式、致死时间节点及相关文献依据。

 

研究结果

 

该致死基因集包含:

 

59 个(6.3%)与早 / 中孕期流产相关的基因

 

525 个(56.2%)与死胎 / 新生儿死亡相关的基因

 

350 个(37.5%)其变异可在产前 / 产后任一阶段导致致死结局的基因

 

其中 159 个常染色体显性基因记录为新发突变遗传模式;在 gnomADv4.1.0 数据库中,39 个常染色体隐性基因的杂合潜在致死变异在所有人群中携带频率≥1/100,提示其为妊娠丢失的重要遗传因素。

 

研究结论

 

Intolerome 为识别与解读与胎儿及新生儿死亡相关的基因组变异提供了综合性资源,可助力临床医师、实验室人员与研究者推进致死性遗传病的诊断与机制研究,并为其临床表型与遗传模式提供新见解。

 

 

https://www.gimjournal.org/article/S1098-3600(26)00864-6/abstract

 

 

https://rpldb.org/intolerome/

 

文献3. 一种可规模化解析 VUS 的方法

 

摘要

 

在约 4000 个疾病相关基因中,超过 90% 的错义变异为意义未明变异(VUS)。实验性变异效应检测可为致病性判定提供关键证据,并揭示疾病生物学机制,但绝大多数变异仍缺乏相关数据,临床转化也十分有限。

 

基因组变异对功能影响联盟(IGVF Consortium) 通过多重 assay 对 10 个基因的 62,215 个变异进行了实验检测,通过阵列式 assay 对 163 个基因的 1407 个变异进行检测;同时整理了来自社区的、覆盖另外 30 个基因的 193,139 条变异效应数据,并开发了自动化校正方法,将实验数据与变异效应预测结果转化为临床可用证据。

 

为减少现有 VUS,本研究构建了一套仅基于实验证据与预测证据的可规模化分析流程,可将这些基因中 16,115 个 VUS 的 75% 重新归类为致病变异或良性变异,错误率<1%。

 

为最大限度减少未来新增 VUS,我们对超过 90,000 个尚未观测到的变异进行分析:62% 已有足够证据可被 “预分类” 为致病性或良性。

 

我们利用 All of Us 项目对数据、证据体系及分类结果进行验证,并构建了交互式资源,以便临床使用校正后的数据。

 

综上,针对覆盖临床基因组 1% 的 40 个基因,本研究解析了绝大多数现有及未来可能出现的 VUS,证明系统性利用可规模化证据能够有力推动基因组医学发展。

 

注:本文为预印本,尚未经同行评议

 

 

https://www.biorxiv.org/content/10.64898/2026.02.14.705848v2