**章 分子诊断概述
**节 分子诊断技术的过去、现在和未来
分子诊断( molecular diagnosis)是指应用分子生物学方法检测受试者样本遗传物质如脱氧核糖核酸(deoxyribonucleic acid,DNA)、核糖核酸(ribonucleic acid,RNA)等,发现受试者基因的变异、表达水平的变化或存在病原体核酸、型别及变异等现象,实现对疾病的预测、预防、诊断、治疗和预后判断等作用的技术。分子诊断结合了实验室医学与分子遗传学的知识和技术,得益于分子生物学和基因组技术领域的发展,在过去几十年发生了巨大的变革。人类基因组计划的完成揭示了疾病与基因组的密切关系。目前,利用第二代甚至第三代基因测序技术解密疾病相关的基因序列,为疾病的发生机制研究提供了重要信息,使医生不但可以评估疾病倾向,而且可以设计和实施准确的干预措施。随着人们对疾病与基因变异及基因多样性关系的认识逐步深入,对检测技术的要求也在逐步提高,单一的检测平台已无法满足目前的需求,多种技术相结合、超灵敏、高通量且自动化的分子诊断技术,在临床决策中的重要性日益凸显。
一、分子诊断技术发展的历史回顾
(一)分子诊断技术的起源
1949年鲍林及其同事将分子疾病的概念引入医学领域,发现β-珠蛋白链上一个氨基酸变化会导致镰状细胞贫血,奠定了分子诊断学的基础。随着互补脱氧核糖核酸(complementary deoxyribonucleic acid,cDNA)克隆和测序技术的出现,人们初步掌握了各种基因的一级序列,提供了DNA杂交探针的可能性,也为建立限制性片段长度多态性(restriction fragment length polymorphism,RFLP)分析的概念和应用提供了基础。1976年Kan等使用胎儿成纤维细胞中分离的DNA进行杂交,*次实现了地中海贫血(简称地贫)的产前诊断。同时,他们运用RFLP分析来确定非洲血统的镰状细胞等位基因。这一突破为苯丙酮尿症、囊性纤维化等其他遗传性疾病的诊断提供了技术手段。然而,当时一个*主要的技术瓶颈在于检测致病性突变只能通过构建个体基因组DNA文库克隆变异等位基因确定其核苷酸序列。许多人类珠蛋白基因突变就是通过这种方法得以识别。获得与遗传表型相关的基因变异序列之后,设计短寡核苷酸探针成为可能,这些寡核苷酸探针被用作DNA杂交试验Southern印迹法的等位基因特异性探针。这种实验设计很快被用于β地中海贫血突变的检测。然而,尽管世界各地的实验室做出了很多努力,但DNA水平的遗传性疾病分子诊断技术仍不成熟,由于当时技术操作过于烦琐、成本较高和易污染等问题,一直未能在临床实验室规模化开展。然而,仅过了几年,强大的分子生物学工具——聚合酶链反应(polymerase chain reaction,PCR)技术出现,分子诊断进入了黄金时代。
(二)PCR的时代革命
PCR技术的出现及其快速优化,极大地促进了分子诊断学发展,引发了分子诊断技术革命。由于显著缩短了对已知基因存在、表达或突变的检测时间,并且降低了常规分子诊断使用放射性元素的风险,提供了感染性疾病的病原检测和遗传性疾病的相关基因检测,使分子诊断真正进入了临床实验室。PCR技术为基于DNA扩增的许多核酸检测方案设计和发展奠定了基础。
随后,更多的基因突变检测方法相继问世和应用。根据等位基因突变的判别依据,这些技术大致可分为三类:
1. 以酶切为基础的方法 RFLP分析是历史上**个广泛使用的核酸检测方法,用限制性内切酶消化不同基因型的DNA后,产生的酶切片段在长度和数量上有差异。其分子基础是核苷酸序列出现碱基替换、插入、缺失、重排或点突变,导致限制性酶切位点缺失或获得。在遗传多态性研究中,常用于 RFLP分析的DNA分子主要有线粒体DNA(mitochondrial DNA,mtDNA)、核糖体DNA(ribosomal DNA,rDNA)、单拷贝基因及变异基因等,将这些 DNA用限制性内切酶消化,进行电泳印迹,再用DNA探针杂交,从而得到与探针同源的DNA序列酶切后在长度上的差异。对于特定基因和DNA片段,还可采用PCR技术将目的DNA扩增至百万倍后直接酶切观察,更为简便、经济和安全。
2. 以电泳为基础的方法 在变性或非变性条件下,基于突变等位基因的不同电泳迁移率,设计了大量用于筛选已知或未知突变的技术方法。单链构象多态性( single strand conformation polymorphism,SSCP)分析和异源双链分析( heteroduplex analysis,HDA)是*早用于检测基因组位点分子缺陷的方法。这两项技术与毛细管电泳相结合,提供了一个简单、快速的基因变异检测平台,操作成本低,容易自动化,可实现对患者 DNA的高通量分析。另外,变性梯度凝胶电泳( denaturing gradient gel electrophoresis,DGGE)和温度梯度凝胶电泳( temperature gradient gel electrophoresis,TGGE)也可用于变异等位基因检测。野生型和变异等位基因之间的电泳迁移率差异可以通过变性剂(如尿素和甲酰胺)的浓度或温度变化来展示。
3. 以固相固定技术为基础的方法 构成了目前大多数突变检测技术的基础,具有易于自动化的优势,被广泛用于高通量突变检测或筛选。1989年Saiki等开发了一种快速、准确、便捷的检测已知突变的方法——反向斑点杂交(reverse dot-blot,RDB),用于检测导致β地中海贫血的 HBB基因变异。其主要是将寡核苷酸结合到膜上,作为扩增 DNA的杂交靶点。这项技术的优点是可以用来检测单个个体的多种不同已知突变。然而,这种技术不能用于检测未知突变。已知序列的寡核苷酸被固定在适当载体的表面,主要利用荧光染料检测目标序列与微阵列的杂交。
虽然PCR技术的出现实现了真正意义上的分子诊断,但是上述方法也存在明显不足。例如,实验操作步骤多、时间长,开放性实验容易造成严重污染,检测灵敏度不高,检测通量不足等,限制了分子诊断技术的临床应用。
二、分子诊断技术的崛起——后基因组时代的分子诊断
1992年,日本学者Higuchi**次提出实时PCR的概念。为了实时看到PCR的整个过程,当时采用溴乙锭(ethidium bromide,EB)作为标记染料,在PCR反应的退火或延伸时检测掺入双链核酸中的EB含量,就能实时监控PCR反应进程,在普通PCR仪的基础上配备一个激发和检测装置,**台实时定量PCR仪就此诞生。1996年,美国应用生物系统公司( ABI)推出了实时荧光定量PCR仪,从此实现了实时荧光定量PCR(real-time .uorescent quantitative PCR,qPCR)的真正市场化。该技术将扩增和检测合二为一,显著缩短了检测时间,不仅非常准确和灵敏,而且由于检测过程无须开盖,有效避免了污染。目前,实时荧光定量 PCR技术在分子诊断中应用广泛,可用于已知病原体检测、药物基因检测和肿瘤的辅助诊断等,不仅成本低廉、检测速度快,而且可实现通量化、自动化,成为分子诊断实验室的**方案和*选方法。
临床检测和科学研究的某些场合,需要对多个样本的成千上万个分子进行检测,实时荧光定量PCR技术在检测通量化和自动化方面难以满足需求。而置于“方寸间”的DNA微阵列基因检测技术,则可以满足上述要求。DNA微阵列由成千上万个寡核苷酸以有序阵列的方式附着在固体芯片表面组成。靶标DNA样本经过PCR扩增杂交到芯片上。在高密度核酸探针阵列中,每个寡核苷酸都作为一个专一的探针,能够有效捕获样本中相应的核酸片段。通过高分辨率荧光扫描对杂交信号进行量化和计算机软件分析,以对样本的目标基因进行表达分析和变异分析。目前,该方法可在短时间内同时完成数十个样本成千上万个指标的检测分析,实现了高通量的快速检测需求。DNA微阵列基因检测技术可用于基因表达检测、突变检测、基因组多态性分析和基因文库作图等,为群体遗传研究、变异筛查和精准医学研究等提供了经济有效的解决方案。
自2001年2月人类基因组图谱及初步分析结果*次公布以来,随着对基因表达、变异、修饰等与疾病关联的深入探索,产生了海量的“疾病-基因”“基因-药物”关联数据和关系网络,这对分子检测和分析技术提出了前所未有的挑战。更高数量级的基因检测,更高灵敏度和准确性的检测技术,更高效、准确的信息学分析方法或软件,成为现代分子检测发展的需求。2005年开始,基因组技术得到了迅速改进,新的高通量检测技术更新换代,以Roche公司的454测序系统、Illumina公司的Solexa/HiSeq测序技术和ABI公司的Solid技术,以及随后出现的基于半导体芯片的测序技术 ——Ion Torrent为代表的高通量测序(又称二代测序, next-generation sequencing,NGS)技术陆续诞生。NGS技术显著降低了测序成本,同时大幅提高了测序速度,并保持了测序的高准确性。以前完成人类基因组的测序需要3年时间,而使用NGS技术仅需要1周。NGS可以对目标序列或者变异位点进行定性或者定量检测,具有极高的检测灵敏度和准确性,它既可以用于检测已知基因序列,也可以用于检测未知基因序列,比实时荧光定量PCR技术和基因微阵列等技术应用范围更广。
近10年NGS得到了广泛应用,特别是在临床医学方面。在遗传性疾病筛查上,NGS广泛应用于遗传性疾病辅助诊断、新生儿筛查、产前筛查、植入前筛查、携带者筛查等领域,为我国健康新生儿的出生和成长管理保驾护航。例如,遗传性耳聋,大约2/3的耳聋源于遗传因素,采用NGS技术筛查有助于早期诊断和干预;又如无创产前筛查( non-invasive prenatal testing,NIPT),是根据孕妇血浆中胎儿来源的游离DNA信息,筛查胎儿出现常见染色体非整倍体异常的风险,常用于筛查21三体、18三体和13三体综合征等,准确性高。采用NGS方法进行无创产前筛查,已在全国各大医院开展,成为一种常规的无创产前筛查手段。此外,NGS也应用于感染性疾病的检测和防控。NGS可对疑难、重症、特殊人群感染性疾病病原体及未知病原体进行快速鉴定,从而显著提高了临床医生对患者的诊疗决策速度,也提高了对流行性未知病原体的判断能力,有力保障了在突发性卫生事件中的决策速度。NGS还可以检测病原体耐药基因突变,可实时监控患者接受治疗过程中是否发生耐药,或者判断患者预后情况等。另外,在肿瘤领域,NGS应用于肿瘤的早期诊断、精准治疗的辅助诊断及肿瘤相关理论探索,可以提供肿瘤预防和早期筛查检测、肿瘤个体化治疗相关的驱动基因突变检测,进行肿瘤基因组学研究,探索肿瘤异质性、耐药性和肿瘤克隆进化过程及机制等。目前,各种基于NGS的肿瘤分子分型与预后、肿瘤用药敏感性或者耐药性预测模型、肿瘤治疗后监控等临床项目研究,正如火如荼地进行。
NGS的应用促进了疾病的分子诊断、个体化治疗及针对高危人群的疾病相关基因筛查和预防性管理,为分子诊断技术和市场的蓬勃发展带来了革命性的进步。截至2022年11月,我国已经批准17种基于NGS的肿瘤精准用药检测产品和无创产前筛查产品。而且,我国的国产测序仪和配套设备,也已经发展成为备受瞩目的产业,获得了国内外市场认可,有力地支撑着国内NGS市场的发展。
然而,NGS测序时需要通过PCR扩增构建文库,会出现扩增错误导致的测序质量问题,再加上测序序列的读长限制(通常小于500bp)问题,使得NGS技术仍具有一定的局限性。因此,能够测定更长的读长序列(*长可达10kbp),且无须复杂的文库构建过程的第三代测序(thirdgenerationsequencing,TGS)技术应运而生。