【佳学基因检测】一文读懂基因检测技术及其发展方向
在大多数情况下,临床分子诊断技术仍然侧重于确定患者的潜在致病机制。佳学基因总结了适用于遗传性的基因型和核型的基因检测方法。通过直接基因检测,实验室寻找导致某种疾病的特定遗传变异,而间接性基因检测则是比较与感兴趣的性状相关但不会导致遗传疾病的DNA序列。
方法 |
共同点 |
稀有点 |
拷贝数 |
平衡倒置 |
重复扩展 |
分析型 |
分析型 |
回转 |
例子 |
||
突变 |
突变 |
变种 |
或易位 |
灵敏度‡§ |
特异性‡|| |
时间‡¶ |
|||||
连锁分析(通常是 STR) |
X |
|
|
|
|
低的 |
低的 |
低的 |
低的 |
历史家族突变 |
|
鱼 |
|
|
X |
|
X |
|
低的 |
低的 |
低的 |
低的 |
天使综合征 |
阵列 CGH 或虚拟核型分析 |
|
|
X |
X |
|
|
平均 |
平均 |
平均 |
平均 |
新的转诊或具有挑战性的诊断病例 |
全基因组 SNP 微阵列 |
X |
|
X |
|
|
|
低的 |
低的 |
低的 |
低的 |
|
目标 PCR |
X |
|
|
|
X |
高的 |
高的 |
低的 |
低的 |
囊性纤维化携带者检测 |
|
桑格基因测序 |
X |
X |
|
|
|
|
高的 |
高的 |
平均-高 |
平均 |
特雷彻柯林斯综合征诊断 |
Southern印迹或MLPA |
|
|
X |
|
|
X |
高的 |
高的 |
高的 |
低的 |
脆性 X 综合征 |
面板或通路测序 |
X |
X |
|
|
|
|
平均 |
低的 |
平均 |
平均 |
长 QT 综合征 |
WES 或 WGS |
X |
X |
|
|
|
低的 |
低的 |
高的 |
高的 |
需要诊断的新转诊或具有挑战性的病例 |
CGH:比较基因组杂交;FISH:荧光原位杂交;MLPA,多重连接依赖探针扩增;SNP:单核苷酸多态性;STR:短串联重复序列;WES:全外显子组测序;WGS,全基因组测序。
*可以检测家族突变或基因组重排。
‡这些列中的分类分配是主观的,根据所订购测试的上下文和进行测试的实验室而有所不同。提出“低”、“平均”和“高”是为了简化和比较平台。
§低,<80%;平均为80-98%;高,大于98%。
||低,<80%;平均为80-98%;高,大于98%。
低,<1周;平均1周1个月;高,超过1个月。
#不同实验室的测试成本差异很大;然而,这些估计是基于实验室抽样的测试费用,而不是消耗品成本或报销金额。低,低于400美元;平均400美元至2000美元;很高,超过2000美元。
**如果双亲都进行了基因分型,则可以通过任何方法检测单亲二体。然而,在没有亲本遗传样本的情况下,只有指定的方法才能检测单亲二体。
拷贝数变异检测在下一代测序应用中正在改进,但在WGS中比WES更有效,尽管它们在临床诊断中的可靠性有限。
技术的每一次转变都需要评估新诊断平台的质量和可行性。(表3定义了可用于评估诊断试验的术语。)分析有效性是衡量分子试验检测遗传或基因组变异的能力的指标,包括分析灵敏度(假阴性率)和分析特异性(假阳性率)。相比之下,临床有效性指的是测试预测是否存在临床状况的能力。
术语 |
定义 |
分子检测的并发症 |
计算 |
分析灵敏度 |
指具有阳性检测结果的基因型检测的比例(检测的假阴性率) |
等位基因脱落;优先放大;嵌合体 |
真阳性/(真阳性+假阴性) |
分析特异性 |
指没有基因型的检测结果为阴性的比例(检测的假阳性率) |
真阴性/(真阴性+假阳性) |
|
临床敏感性 |
指检测结果呈阳性的疾病患者比例(诊断的假阴性率) |
可变外显率;可变表现力 |
真阳性/(真阳性+假阴性) |
临床特异性 |
指检测结果为阴性的无病人群比例(诊断的假阳性率) |
真阴性/(真阴性+假阳性) |
|
阳性预测值 (PPV) |
指在检测结果为阳性的情况下,患者患病的可能性 |
真阳性/(真阳性+假阳性) |
|
负预测值 (NPV) |
指在检测结果为阴性的情况下,患者没有患病的可能性 |
真阴性/(真阴性+假阴性) |
|
临床效用 |
指测试对确定治疗、患者管理和计划生育的价值 |
取决于医疗保健系统和环境 |
根据支持使用和经济效益的报告主观确定 |
个人效用 |
指测试对个人和家庭选择的价值 |
取决于个人优势 |
从个人的角度主观确定 |
间接基因检测
尽管在资金充足的实验室中有大量新技术用于查找患者的致病变异,但间接方法在世界上资源更为有限的地区(因此占人口的相当一部分)的诊断中仍然发挥着重要作用;特别是,可以使用单核苷酸多态性(SNP)和短串联重复序列(STR)的连锁分析。经典的间接方法(例如,单链构象多态性(SSCP)、变性梯度凝胶电泳(DGGE)和异源双链分析)在美国已基本被淘汰,但这些技术仍然在资源有限的发展中地区得到高度应用。在某些情况下,间接测试可以通过缩小感兴趣区域来提供全基因组数据;这是一种在研究中常用的方法,以节省WGS的成本。此外,对于一些特殊应用,如无创产前检测(NIPT)和植入前基因诊断(PGD),从微量样本甚至单个细胞中扩增和区分STR的能力使微卫星连锁分析成为一种有吸引力的方法。
靶向等位基因特异性突变检测
扩增结合限制性消化、杂交或其他检测突变的方法仍然是临床分子诊断中最便宜和最可靠的方法。PCR突变检测的简单性使检测容量可以达到多个样本,并为检测变异提供了高置信度。例如,常见的致病性重复扩增,如脆性X综合征中的重复扩增,经常通过重复片段的直接扩增进行检测。这种方法非常适合于对常见变异进行简单的检测,例如用于对药物遗传学变异或因子V莱顿突变进行基因分型的Taqman®检测。等位基因特异性PCR的缺点当然是无法检测到任何未曾报道过的相关基因突变。尽管如此,这些方法仍然具有很高的价值,特别是在资源有限和/或无法获得先进仪器的实验室中,并且很可能仍然是临床分析的核心。
基因特异性Sanger测序
对于点突变和小变异的检测,双向桑格测序在过去十年被视为临床基因检测的“金标准”。这种直接方法具有很高的分析有效性,尽管长时间读取可能会降低碱基调用的质量,微小的样本可能会产生人为的PCR产品。直接测序一个或多个完整基因的基本价值是将候选基因的临床指征与分析的高灵敏度和特异性相结合的能力。例如,单个基因(即FGFR2)的集中测序可以以相当低的成本确认或排除阿佩特综合征的诊断,测序TCOF1将检测到Treacher-Collins综合征患者中高达90%的突变,而对已知导致努南综合征的六个基因(即PTPN11、SOS1、RAF1、NRAS、CBL和KRAS)的检测发现,30%的个体出现了突变,其临床特征提示努南综合症。随着全基因组技术分析有效性的提高,基因组测序可能会成为遗传分析的第一步,为候选基因桑格测序提供信息。值得注意的是,尽管桑格测序具有较高的分析有效性,但该方法的临床有效性取决于疾病的致病基因。桑格测序不能检测到大多数结构变化,因此单靠它不足对许多疾病进行诊断。
全基因组SNP微阵列基因检测
基于微阵列的基因分型可分为三种主要应用:用于检测结构异常的阵列比较基因组杂交(阵列CGH)(见下文讨论)、表型特异性SNP面板和全基因组SNP面板。学术和商业实验室的努力已经产生了表型特异性面板,其中包含已知驱动特定表型的等位基因,例如视网膜退化面板34,35。这种方法的实用性在于,一个低成本、快速的多基因询问实验可以提供高质量的分子诊断。然而,不断发现新的因果等位基因和基因,以及已知突变的可变外显率和表达36限制了该方法的临床有效性(表3)。
相比之下,大规模全基因组SNP基因分型提供了一个单一、经济高效的平台,可在一次测试中评估多种常见遗传疾病的风险,其中记录的相关性各不相同36–38。预测性和症状前测试可作为多种疾病的多重平台,包括某些癌症和药物遗传学测试,以及眼科、心脏和心血管疾病,肾脏和神经系统疾病(除其他外)。一些个人基因组公司现在向消费者提供商业化临床基因分型服务的版本,例如23andMe、Pathway Genomics和Navigenics的个人基因组服务,仅举一个例子。虽然这些测试是为消费者设计的,也可供消费者使用,因为分析测试是在临床(即CLIA认证的)实验室中进行的,这种全基因组SNP测试也可以由临床医生进行。通过全基因组单核苷酸多态性测试,特定位点的分析有效性较高(表3),但变异检测的有限范围限制了对基因组中预选点的分析。此外,大多数基于SNP的诊断是概率性的,而不是确定性的,具有可变的临床有效性40,因为阵列识别的变异范围有限。例如,年龄相关性黄斑变性(AMD;即CFH和HTRA1)的两个主要基因座上的常见等位基因纯合子在41-45之间具有很高的疾病概率值,并且由于一些SNP和吸烟46的纯合子的高相关性,可能导致患者管理中的行为改变,但该测试本身预测AMD的能力有限。较新的混合平台,如包含患者和对照个体中报告的所有已知编码变体的外显子组芯片,可能会提高识别与疾病状态相关的罕见和常见等位基因患者突变负荷的效率,尽管它们也可能具有有限的临床有效性39。
结构和染色体变异的基因检测
最近化学和显微镜技术的进步极大地提高了细胞遗传学的分辨率,最显著的是开发了多探针荧光原位杂交(FISH)和染色体CGH。撇开经济因素不谈,细胞遗传学方法在临床上逐渐被淘汰,取而代之的是SNP阵列CGH方法,该方法使用探针检测染色体和基因组重排,以及比FISH更精确、更小的基因组变异。根据设计和探针密度,阵列CGH可以提供从整个染色体到大小为几千个碱基的缺失和复制的检测准确度。阵列CGH提高了重排检测的灵敏度(平衡反转和易位除外)和检测单亲二体(UPD)的能力,其不能通过染色体CGH检测到。与此同时,分辨率的提高伴随着亚显微基因组重排检测的大量增加,这些重排对受试患者的临床表型的重要性尚不清楚。使用Ensembl资源(DECIPHER)的人类染色体不平衡和表型数据库和细胞基因组阵列国际标准联合会(ISCA联合会)等资源正在对可能影响剂量敏感基因拷贝数或破坏正常基因表达、导致疾病的亚微观缺失和复制进行分类列表。这些数据库提供了一个共同的库,用于帮助解释诊断学中发现的往往新颖且往往是从头开始的结构变化。即便如此,保存的表型数据的不均匀对此类数据库的实用性构成了重大限制。
同时,其他分子技术在检测不同大小和复杂度的亚染色体重排的能力方面也有了指数级的提高。Southern印迹法曾广泛用于结合限制性片段长度多态性(RFLP)进行分子诊断,但现在继续用于检测小的遗传变化以及不适合PCR扩增的大重复变异(例如,FMR1扩增)。然而,最近,多重连接依赖性探针扩增(MLPA)分析已在某些应用中取代了Southern印迹法。除了标准拷贝数变异(CNV),MLPA可以检测镶嵌突变以及甲基化状态。此外,MLPA可以用于确认FISH或CGH检测到的结构异常。然而,在大多数情况下,MLPA不能检测到平衡的基因组重排,如易位或倒位,这是一个很大的限制,考虑到人类遗传疾病中这些类型的事件的出现。佳学基因预计,对于某些类型的遗传损伤,如大三核苷酸扩增,经典的分子方法,包括Southern印迹和MLPA,仍将是首选的检测方法。
全基因组和全外显子组测序基因检测
NGS使用强大的大规模并行测序分析对许多感兴趣的基因进行测序,包括各种罕见和复杂疾病的全外显子组或全基因组。基因组测序前的靶向外显子捕获(即WES)有助于对基因组的大多数编码区进行有效分析,而WGS评估了几乎所有的人类基因组的常染色区(需要注意的是,在读取长度足够长以解析重复密集区之前,异色区将在一段时间内保持禁区)。WES已被证明是一种快速、准确的发现导致孟德尔紊乱的某些突变的方法。基因组测序成本的大幅下降使某些候选基因的试剂成本低于桑格测序的成本(这对于重点基因组尤其如此),使WES和WGS的应用经济可行。目前,WGS在临床上不可用,但可从选定的临床实验室获得WES。临床WES的解释是有限的,几乎没有可用于临床的报告结果。然而,各大学术中心的医学遗传学家现在经常为原因不明的遗传疾病提供咨询并要求进行WES。虽然这两种技术之间的选择主要是由成本决定的,至少在资金充足的领域,WGS将在未来几年取代WES。自然,与每一种颠覆性技术一样,WGS数据将对WES提出新的挑战,即解释可能导致患者表型遗传负荷的非编码变体。
在某些情况下,可以采用基于疑似综合征的靶向NGS方法,以最小化成本并最大限度地识别变异。
除了在WES和WGS中用于诊断和发现外,NGS还可用于检测甲基化状态、选择性剪接、小RNA、等位基因特异性表达,甚至单倍型和重排。尽管NGS尚未完全用于WES和WGS以外的应用,但NGS可能成为一系列其他“组学”应用的强大平台。
尽管有成本方面的考虑,但在临床环境中使用WES和WGS的主要实际障碍是该技术可靠检测突变缺失或存在的能力有限。不同的测序平台已被证明提供的是质量可变的结果,一些仪器在单个碱基调用时更准确,其他仪器覆盖更广泛的基因组,与WGS相比,包括特定基因组和整个外显子组可能具有更高的分析敏感性(即,它们具有更好的检测杂合变化的目标覆盖率),但限制了临床敏感性,这可能会将解释范围限制在编码病变。即使如此,目前也不可能从整个人类基因组,甚至是常染色体基因组中获得高质量的序列,这足以进行详尽的临床解释。
此外,为了有效地分析测序数据,WES和WGS诊断工作通常包括先证者和三人组中未患病的父母的测序,以在有关遗传模式的有限信息下有效地确定从头和遗传突变。由于目前的WES临床试验对从头和先前报告的变异的解释有限,一些临床WES实验室仅对先证者进行排序,并在父母基因信息中确认目标变异。尽管如此,获得生物亲属在解释遗传变异方面仍然很有价值。为了进一步完善大量数据,先证者和家庭成员的桑格测序确认测试是典型的。佳学基因认为,随着市场力量和临床需求推动该领域向前发展,WES和WGS的技术挑战将得到解决。然而,仍然存在严重的解释问题,这取决于初始基因组分析的范围。
综上所述,这些技术的经济和分析限制将限制WES和WGS成为鉴别诊断中有吸引力的第一步,需要二次确认,并可能在一段时间内通过其他方法进行平行测试。
(责任编辑:佳学基因)