变异注释与优先级排序

快速概览

临床基因检测（WES/WGS）产生数万至数百万候选变异，核心挑战在于如何从中系统性地筛选出最可能与患者表型相关的致病变异。有效的优先级排序需要整合群体频率、功能影响、遗传模式和基因-表型匹配等多维证据，而非依赖单一分数。

多维证据框架优于单一分数：频率过滤、功能评估、遗传模式匹配、表型一致性需综合权衡
罕见性是必要条件而非充分条件：绝大多数罕见变异仍是良性或意义不明
优先级排序是连接原始数据与临床解释的桥梁，为 ACMG 分类提供高质量候选集

变异筛选的”漏斗”模型

从数万个原始变异到最终的致病变异，是一个层层筛选的过程：

第一步：粗筛

质量与频率过滤

排除测序质量差或在群体数据库（gnomAD）中高频出现的变异。

这是最高效的排除步骤。

第二步：精筛

功能影响评估

识别 LoF 变异，或使用 CADD/REVEL 等工具预测 missense 变异的破坏性。

关注变异对蛋白结构的潜在影响。

第三步：验证

遗传模式与家系验证

根据常显/常隐模式筛选，并验证变异是否与家系成员表型共分离。

de novo 变异是关键线索。

第四步：临床关联

表型匹配度分析

评估变异基因的已知功能是否能解释患者当前的 HPO 表型。

这是决定致病性的核心依据。

问题背景

全外显子测序（WES）通常产生 2-5 万个变异，全基因组测序（WGS）可达数百万个。面对这一数据规模，一个核心问题是：如何从这些候选变异中高效识别最可能与患者疾病相关的致病变异？

这一筛选过程的复杂性源于：

良性变异占绝对多数：即使在罕见病背景下，绝大多数变异也与当前表型无关；
证据维度多样：群体频率、功能影响、遗传模式、表型匹配、家系分离等证据需要综合评估；
单一度量的局限：任何单一分数（如 CADD）都无法同时捕捉频率、功能和表型匹配信息；
临床时效约束：需要在有限时间内给出可解释的结果，同时避免假阳性导致的过度治疗。

变异注释与优先级排序正是为解决这些问题而设计的系统性框架。

核心任务与流程

任务定义

变异注释与优先级排序发生在变异检测（variant calling）之后、ACMG 临床分类之前，其核心目标是：从海量候选中识别高置信度的致病变异候选集。

主要子任务包括：

子任务	功能	关键考量
变异注释	为每个变异添加功能、频率、临床等元信息	注释版本与参考基因组版本的一致性
初步过滤	基于基本标准（频率、质量）排除明显不相关变异	过滤阈值的遗传模式依赖性
优先级排序	按多维证据综合评分排序	避免单一分数主导，保持可解释性

为什么优先级排序至关重要

优先级排序是连接”原始变异数据”和”临床解释”的关键效率节点：

时间效率：聚焦有限资源于最值得分析的候选
质量控制：通过分层过滤减少假阳性进入下游分析
决策支持：为遗传咨询和临床报告提供证据基础

任务目标

变异注释与优先级排序通常要回答：

哪些变异值得进一步用 ACMG 框架详细分析？
哪些变异可以快速排除？
在多个候选变异中，哪个最可能是致病变异？
是否需要补充家系测序或功能实验来缩小候选范围？

输入输出

输入

VCF 文件（variant calling 的输出）；
患者表型信息（HPO terms、临床描述）；
家系信息（如父母是否测序、家系结构）；
参考基因组与注释版本；
疾病相关的基因列表（如已知致病基因 panel）。

输出

注释后的变异列表（包含频率、功能影响、临床证据等字段）；
过滤后的候选变异集；
按优先级排序的变异列表；
推荐进一步验证的变异或实验。

核心筛选维度

群体频率

罕见病场景下，常优先关注低频或极罕见变异：

gnomAD：提供不同人群的等位基因频率；
ExAC、1000 Genomes：其他频率数据库；
内部对照数据库：实验室积累的健康对照。

关键直觉：

对于常染色体显性遗传病，频率高于疾病预期发病率的变异通常可以排除；
对于隐性遗传病，携带者频率（heterozygous frequency）需要与疾病流行度匹配；
不同人群的频率差异很重要，不能简单用全球频率判断。

功能影响

根据变异类型判断其潜在破坏性：

Loss-of-function（LoF）: nonsense、frameshift、canonical splice site。在已知 LoF 机制的基因中优先级较高。
Missense: 氨基酸替换。需要结合预测工具和已知致病变异位置判断。
Inframe indel: 不改变阅读框的插入/缺失。影响取决于位置和保守性。
Synonymous: 同义突变。通常优先级较低，但可能影响剪接。
Non-coding: 内含子、调控区等。需要结合剪接预测或功能注释判断。

遗传模式

根据疾病的遗传模式筛选变异：

常染色体显性（AD）: 通常关注杂合变异。de novo 变异在散发病例中优先级高。
常染色体隐性（AR）: 关注纯合或复合杂合变异。需要父母验证。
X 连锁（X-linked）: 男性患者关注 X 染色体上的半合子变异，女性携带者可能表现为杂合。
线粒体遗传: 关注线粒体基因组变异，需考虑异质性水平。

基因-表型匹配

变异所在的基因是否与患者表型相关：

已知致病基因：该基因是否已被证实导致类似疾病？
HPO 匹配：基因的已知表型与患者的 HPO terms 是否一致？
基因约束性：pLI、LOEUF 等指标反映基因对变异的耐受程度；
表达模式：基因是否在相关组织或发育阶段表达？

文献和数据库证据

ClinVar: 临床变异数据库。需要关注 review status（如 expert panel reviewed）和冲突解释。
OMIM: 人类孟德尔遗传数据库，提供基因-疾病关联。
HGMD: 人类基因突变数据库（商业）。
gnomAD: 群体频率数据库，也提供约束性指标。

为什么不能只看单一分数

一个常见的错误是试图用单一分数（如 CADD、REVEL）排序所有变异。问题在于：

基因-表型不匹配：即使变异破坏性很强，如果基因与表型无关，仍不可能是致病变异；
遗传模式不匹配：在常染色体隐性病中，一个强破坏性的杂合变异也无法解释疾病；
家系分离不支持：如果变异在健康亲属中也存在，致病性证据会大幅削弱；
频率过高：即使预测分数很高，如果频率超过疾病预期，仍可能是良性多态性。

因此，优先级排序必须是多维证据的综合权衡，而不是单一维度的排序。

为什么多维框架优于单一分数

如果只用 CADD 分数排序，会面临以下根本性问题：

CADD 分数的语义不明确：CADD=20 意味着”该变异在 100 个模拟变异中排名前 1%“，但这不等于”致病概率 99%“。排名靠前的变异绝大多数仍是良性的。
不同基因的阈值不同：CADD=30 在某个高度约束的基因中可能很常见，而在另一个基因中可能极其罕见。单一阈值无法适应这种基因特异性。
缺失临床上下文：CADD 不考虑患者的表型、家系信息、疾病流行度等关键因素。一个 CADD=35 的变异，如果频率 1% 且疾病发病率 0.01%，实际上更可能是良性。
无法处理遗传模式：在隐性遗传病中，即使两个杂合变异的 CADD 都很高，如果它们不在同一个基因上，也无法解释疾病。

多维框架的优势在于：

分层过滤：先排除明显不相关的变异（频率过高、基因不匹配），再在剩余候选中精细排序
上下文感知：结合患者具体信息（表型、家系）调整优先级
可解释性：每个决策都有明确的生物学或临床依据，而不是黑箱分数

示例

假设一个 5 岁患儿表现为发育迟缓和癫痫，父母均健康。WES 检测到多个候选变异，我们需要通过优先级排序找到最可能的致病变异。

输入信息

患者表型：发育迟缓、癫痫（HPO: HP:0001250, HP:0001256）
家系：父母健康，已测序
检测方法：全外显子测序（WES）

决策链条：逐步过滤

第一步：频率过滤（排除明显良性变异）

变异	gnomAD 频率	决策	理由
基因A: chr1:123456 frameshift	0/251496	保留	极罕见，符合致病性必要条件
基因B: chr2:789012 missense	0.1% (251/251496)	排除	频率过高（BS1），远高于常显遗传病预期发病率
基因C: chr3:345678 synonymous	5%	排除	常见多态性（BA1）

第二步：功能影响评估（在保留的变异中）

变异	变异类型	预测工具结果	决策	理由
基因A frameshift	Loss-of-function	N/A（LoF 不需预测）	优先级↑	LoF 在已知 LoF 机制基因中强致病
其他候选（假设）	missense	CADD=15, REVEL=0.3	优先级↓	预测分数不高，破坏性弱

第三步：基因-表型匹配

基因 A：已知导致发育迟缓和癫痫综合征（OMIM: 612345）→ 高匹配
其他候选基因：与神经系统发育关联较弱或不明确 → 低匹配

第四步：遗传模式验证

基因 A 变异：父母均不携带 → de novo 确认（PS2）
这符合常染色体显性遗传模式（散发病例）

第五步：外部数据库交叉验证

ClinVar：该变异已被 expert panel 评审为 Pathogenic
HGMD：有 3 篇文献报道该变异致病

最终优先级排序

排名	变异	关键证据	ACMG 分类倾向
1	基因A frameshift	PVS1 + PS2 + PM2 + PP3 + ClinVar Pathogenic	Pathogenic
2	其他候选	证据不足或冲突	VUS 或 Benign

临床优先级的决策矩阵

在面对多个候选变异时，可以参考以下决策逻辑进行排序：

场景	推荐选择	原因
已知致病基因 + 高匹配表型 + LoF 变异	最高优先级	证据链条完整，极大概率为致病变异。
de novo 变异 + 神经发育表型 + 功能预测有害	高优先级	即使是非 LoF 变异，新发突变在神经系统疾病中意义重大。
罕见 missense + 弱表型相关基因 + 预测良性	低优先级/VUS	缺乏核心证据支持致病性，需更多家系或实验数据。

关键决策点说明

为什么频率过滤是第一步？
- 频率是最快、最可靠的排除标准。gnomAD 的 25 万样本量使得频率数据非常可靠，远高于任何预测工具。
为什么 frameshift 比 missense 优先级高？
- frameshift 是 loss-of-function，如果基因已知通过 LoF 致病，这是机制层面的确定性。
- missense 需要依赖预测工具和已知致病变异位置判断，不确定性更高。
为什么 de novo 如此重要？
- 在散发病例中，de novo 变异提供了遗传学层面的强证据，排除了父母携带但不表达的复杂情况。
- 这比单纯的”罕见”证据强得多，因为它直接指向新发突变。

对比：如果只用 CADD 分数排序

假设我们只用 CADD 分数排序：

基因B missense: CADD=35 → 排名第1
基因A frameshift: CADD 不适用（或默认值）→ 排名靠后

这会导致完全错误的优先级，因为：

CADD=35 的变异频率 0.1%，实际上更可能是良性
CADD 无法捕捉基因-表型匹配和遗传模式信息
CADD 对 LoF 变异的评估不充分

结论：多维框架通过分层过滤和上下文感知，能够正确识别基因A frameshift 为最可能的致病变异，而单一分数方法会误判。

与真实分析流程的连接

变异注释与优先级排序不是孤立步骤，它依赖：

Variant calling 质量：高质量的 VCF 是可靠注释的基础；
准确的表型收集：HPO terms 和临床描述直接影响基因-表型匹配；
合理的家系设计：父母测序可以显著提高过滤效率；
数据库更新：ClinVar、gnomAD 等数据库的更新会影响证据强度。

同时，它也是后续步骤的基础：

为 ACMG 分类提供候选变异集；
为遗传咨询提供排序后的解释重点；
为功能实验设计提供优先级指导。

参考资料

ClinGen Variant Curation Expert Panels
gnomAD browser
ACMG/AMP variant classification guidelines