[共享]DNA测序技术
丁香园论坛
3513
利用DHPLC 基因扫描技术进行深入彻底的突变与SNP 筛查
Stan L Lilleberg
变性高效液相色谱(DHPLC)是一种新型遗传变异筛查技术,可用于单碱
基替换(或单核苷酸多态性),小片段缺失或插入等多种基因突变的检测。
DHPLC 基因扫描技术可在生殖细胞系和体细胞系中筛查遗传变异。而像特定位
点DNA甲基化状态的改变等遗传现象也可用在DHPLC基础上建立的方法来检
测。遗传变异的生物学效应是由突变基因的位置和特点决定的,而功能相关基
因突变的发现对相关药物的研发有很大的促进作用。本文将对DHPLC 技术在
突变检测领域的应用实例进行介绍和讨论;介绍的重点分别是致病基因突变位
点的确认,以及药物代谢和耐药性相关基因突变的检测。
关键词:候选基因,变性高效液相色谱,DNA甲基化,药物代谢,抗药性,
遗传变异,基因突变,遗传药理学,SNP 筛查,SNP 确认,体细胞变异。
缩略词
5-FU---5-氟尿嘧啶,AD---阿尔茨海默病,早老性痴呆,APP---淀粉样前体蛋白
AS ---安格尔曼综合征,快乐木偶综合征,BWS---贝-威综合征,CF---囊性纤维
化,CHF---充血性心衰,CMT---沙-马-图病,进行性神经性(腓骨)肌萎缩,
COX-2---环氧合酶-2,CP---慢性胰腺炎,DHPLC---变性高效液相色谱,DPD---
二氢嘧啶脱氢酶,EOAD---早发性阿尔茨海默病,GIST---胃肠道基质瘤,
LOAD---迟发性阿尔茨海默病,HCM---肥大性心肌病,MLST---多位点序列分
型,PCR---聚合酶链氏反应,PWS---普-威综合征,SNP---单核苷酸多态性,
TPMT---硫代嘌呤-S-甲基转移酶,VEGF---血管内皮生长因子
介绍
当今的基因技术革命已为医学和制药工业的发展开辟了新的途径。基因突
变和单核苷酸多态性(SNP)等DNA 序列变异的确定正在成为新药研发的重要
组成部分[1]。而许多功能基因组,临床诊断和遗传药理学研究中的重大发现也
是通过检测基因突变和SNP 实现的。分子遗传学的研究将对普通临床病症的分
子水平缺陷给予更好的解释,并最终促进针对这些缺陷的新疗法的产生。而遗
传变异研究在新药开发中最有意义的作用就是为药物治疗靶点的识别,描述和
确认提供信息支持[2]。
对一种可能的药物靶点进行遗传学分析可了解目的基因发生突变的程度。
对靶序列突变的分析描述是药物开发早期工作中的关键环节,它可为药物设计
提供最合适的突变靶点。而在药物靶点的确定过程中,遗传变异也可被用来证
明特定靶点与疾病表现型之间的关联。而特定靶基因突变与临床指征或标志之
间的正性关联将会对评估该药物靶点的临床相关性以及治疗价值提供强有力的
支持。这种遗传学分析通常在靶点确定过程的早期完成,为特定药物靶点的选
择提供证据支持。
遗传变异的分析在药物研发的后续过程中也有作用。例如在遗传药理学方
面,编码药物代谢酶类的基因发生突变等遗传因素可能影响受药个体对特定药
物的反应,进而影响该个体使用该药物的有效性和安全性[3]。遗传药理学的实
验数据可在药物研发和临床用药过程中起到辅助作用。此外,药物靶点本身以
及疾病相关基因的遗传变异也可对药物的治疗结果产生影响。这些遗传变异可
以成为有力的药效指标,也可以成为临床诊断和预后的标志物[4,5]。当深入
了解了各种疾病的遗传变异机理后,人们就可制定相应的治疗策略对这些疾病
进行正确的诊断和治疗了。
由上可知,遗传变异检测的作用不仅存在于药物靶点的识别和确定阶段,
而且贯穿于整个药物的研发过程中。因此,对编码特定药物靶点,疾病通道蛋
白,药物代谢酶类和耐药性相关蛋白的基因进行扫描,以便检测对药物疗效和
毒性有影响的SNP 和基因突变是很有必要的。这些基因序列的改变有可能对其
表达的蛋白质的结构和(或)功能以及表达水平具有深远的影响。
理想的突变和SNP 检测技术应当具有准确性和敏感性高,完全自动化,检
测成本低等特点。此外理想的检测技术在PCR 反应引物的修饰,反应试剂的搭
配,检测标记以及PCR 反应后处理等方面也应没有特殊的要求。变性高效液相
色谱(DHPLC),一种能够满足上述所有要求的新兴技术,已经逐渐发展成突
变检测的首选技术。DHPLC 这种准确高效的基因筛查技术的发展,极大地促进
了新的突变位点的发现,并对了解疾病发生发展机制,确定药物研发方向做出
了重要贡献。本文将对近年来利用DHPLC 技术确定基因序列突变的相关报道
进行介绍,并深入探讨这些发现的生物学意义。
利用DHPLC 技术检测遗传变异
DHPLC 技术可以通过温度调节的异源双链分析,自动检测单碱基替换,小
片段插入和缺失等基因序列的改变。关于DHPLC 技术的工作原理和应用范围,
在Xiao 和Oefner 的综述[6]中有详尽的介绍。DHPLC 基因突变筛查,就是利用
离子对反向液相色谱技术,通过独特的DNA分离基质,对特定的PCR 反应产物
进行分离(图1)。在待测样品部分变性和乙晴冲洗梯度呈线性增加的情况下,
带有突变序列的异源双链,与同源双链(野生型或阴性对照)相比,它们的柱保
留时间相对较短。因此,带有突变序列的样品呈现出异源和同源双链混合物的
峰型特点,而不含突变序列的样品则只有同源双链的峰型。出现与野生型或阴
性对照不同的DHPLC 冲洗结果,说明检测样品含有突变序列。DHPLC 技术为
确定带有突变序列的样品提供了一种简便而直观的途径,该种方法对生殖细胞
系和体细胞系的基因突变检测同样适用。
图一
图2 展示了利用DHPLC 技术检测DNA 序列变异,以及通过测序技术确定
特定的碱基改变的过程。整个实验流程非常简便。首先从合适的来源分离DNA
和RNA,然后通过PCR 或RT-PCR(模板为RNA)反应,扩增目的基因的特
定区域(即扩增子),扩增子一般包括一个外显子以及相应的外显子/内含子连接
区,
也有的扩增子包括启动子区域,或5’/3’非编码区域。在PCR 反应之后,可直接
利用DHPLC 技术对扩增子进行分析,无需再对PCR 产物进行预处理。利用自
动化的DHPLC 分离方法,目的扩增子可被彻底地扫描。最后如果DHPLC 识别
出含有突变的扩增子,那么就要用测序的方法来确定其突变类型,DHPLC 检测
结果没有改变的扩增子无需再进行测序。DHPLC 突变检测技术的另一个优点是
可以收集异源双链部分。这些部分含有等量的野生型和突变型等位基因,可为
接下来利用测序方法确定突变类型提供便利。由于在测序前进行DHPLC 筛查,
突变检测的总体效率和敏感性得到了大幅度的提高。本文将列举多篇利用
DHPLC 技术对生殖细胞系和体细胞系进行突变检测的报道。更多的DHPLC 相
关文献可在下面的两个网址中找到: http://www.transgenomic.com
http://insertion.standford.edu 前者可通过目的基因和疾病来搜索DHPLC 相关
文献,而后者是由Standford 基因组技术中心(USA)提供的。
图二:
DHPLC 突变检测技术的准确性
迄今为止,用于筛查疾病相关基因突变的方法有很多种。它们包括:单链
构象多态性(SSCP),构象敏感性凝胶电泳(CSGE),变性梯度凝胶电泳
(DGGE),双相基因扫描(TDGS),直接DNA 测序,基因芯片分析技术等。
在过去几年中陆续有报道指出,DHPLC 突变检测技术与其它方法相比,具有更
高的准确性和敏感性[6]。
最近有一项盲性研究,通过对BRCA1 基因进行突变筛查,将DHPLC 和其
它方法的准确性进行了比较[7]。结果只有DHPLC 技术从65 个样本中检测到了
全部58 种突变,检测结果与测序结果完全相符。这58 种突变包括38 种单碱基
替换,16 种碱基缺失,3 种碱基插入和1 种插入,缺失复合突变。这项研究证
明了DHPLC技术发现各种基因突变的能力。最重要的是这些突变中的40(71%)
种是以前从未被报道过的,有可能逃脱了其它基因分型诊断方法的检测。这项
研究结果为采用DHPLC 技术作为分子诊断方法提供了有力的支持。在另外一
项对整个囊性纤维化(CF)基因(CFTR)的筛查中,DHPLC 技术对73 个CF
病人的全部CFTR 突变的检出率为 100%[8]。另外还有一些研究结果表明
DHPLC 技术的突变检测准确率达到或接近100%。这些受检基因包括:X-连锁
眼白化病(OA1),威尔逊病(ATP7B),家族性腺瘤息肉病(APC),家族性癌
症综合征(PTEN, RET, VHL),常染色体显性多囊性肾病(PKD1, PKD2),血
友病A(因子Ⅷ),家族性高胆固醇血症(LDLR),黑色素瘤(INK4A),和退行
性非综合征式遗传性耳聋(GJB2)等。表1 中所罗列的是最近利用DHPLC 筛
查突变的基因。Stanford 基因组技术中心的网址
http://insertion.stanford.edu/dhplc_genes1.html, 提供全部或部分利用DHPLC
筛查突变的基因列表,并提供相关疾病和引用文献的介绍。
DHPLC 技术最适于对含有大量外显子的基因,以及多基因疾病相关基因进
行突变筛查。这些基因及其相关疾病的例子可在表1 中找到,而更加全面的介
绍可在www.mutationdiscovery.com 中找到。该网站对遗传突变研究者们免费
提供超过8600 个人类基因的基因组DNA 序列,以及在这些基因中已检测到的
突变信息。在这些信息基础上,该网站还提供用于筛查这些突变的PCR 和
DHPLC 的实验方案。
遗传异质性在很多复杂疾病中具有重要的意义,而DHPLC 技术是研究遗
传异质性疾病相关基因突变的理想方法。一项关于沙-马-图病(进行性神经性腓
骨肌萎缩)(CMT)相关基因突变的研究报道是对上述观点的最完整的阐述[9]。
作者将利用DHPLC 技术对168 个CMT患者进行的基因(PMP22, MPZ, GJB1,
EGR2)筛查结果与直接测序的结果进行了比较。所有以前报道过的突变DHPLC
无一漏筛,而DHPLC 检测出的某些新突变连测序技术都无法检测出。为了确
定这些新突变,作者通过收集DHPLC 异源双链部分,加大了样品中突变等位
基因的含量,从而通过测序确定了突变类型。对于某些多表型疾病,如感觉神
经性耳聋,色素性视网膜炎和外周神经疾病等,DHPLC 技术也是一种理想的方
法,因为它们都有大量的疾病相关位点需要进行基因突变筛查。
DHPLC 突变检测技术的敏感性:
体细胞基因突变
直到不久以前,直接测序仍然被认为是突变检测的“金标准”。然而现在
基因突变频率低于20%就很难用测序方法检测到,这已是公认的事实[10]。
DHPLC 技术是通过区分同源和异源双链来进行突变检测的。这种方法与直接
DNA 测序相比更有利于突变等位基因的识别(图1)。已有文献报道DHPLC 技术
可从待检样品中检测到占总基因量0.5-5%的突变等位基因,且实验重现性很好
[11,12,13,14]。近来有两篇报道表明DHPLC 技术可从发生低水平体细胞遗
传镶嵌现象的结节状硬化患者标本中检测到TSC1 和TSC2 基因突变,而该种突
变用测序法完全检测不到[11, 12]。更深入的研究表明这种基因突变存在于
6-15%的患者的外周血淋巴细胞中。
体细胞遗传镶嵌现象指的是在一个特定器官中出现具有不同遗传性状的多
个体细胞群落。这种现象可由DNA 突变,DNA 的修饰性改变,染色体异常或
自发性遗传突变逆转等因素引起。这种现象含有孟德尔式和非孟德尔式基因异
常,而它最典型的例子就存在于癌症的发生过程中。Youssoufian 和Pyeritz 在他
们的文章中对这种遗传镶嵌现象进行了详尽的总结[15]。 漏筛这种遗传镶嵌现
象所造成的突变会导致基因突变发生频率的报告不准确,也会使遗传诊断发生
疏漏。而这种现象的筛查对检测肿瘤组织中的体细胞基因突变和异种组织线粒
体DNA 中的致病基因突变也是非常重要的。近来有报道表明利用DHPLC 技术
可从白血病患者P53 基因的外显子中筛查出突变频率低于3%的基因突变[13]。
而在一项利用DHPLC 技术对整个线粒体基因组进行突变筛查的研究中,频率
高于0.5%的突变都可被检出[14]。还有许多检测各种肿瘤癌基因突变的文献报
道也对DHPLC 技术的敏感性给予了肯定,其中一些研究内容请见表2。
虽然肿瘤是一种遗传病这种观点早已是公认的事实,但特定的DNA 遗传改
变和抗癌药物疗效之间存在关联才刚刚被认识到。未知突变的检测对于了解上
述的关联至关重要,而DHPLC 正是实现这个目的合适的技术。例如在对肿瘤
发病机制的研究中,在新发现的基因中寻找突变非常重要。Lipkin 在文章[16]
中报道利用DHPLC 技术,发现一种新的DNA 错配修复基因MLH3 在25%的
受检结肠癌患者样品中发生了基因突变,而此前的两项利用其它敏感性和准确
性都较低的方法进行的研究都认为MLH3 与结肠癌易感性无关。由此可见,
DHPLC 技术的
敏感性和准确性确实拥有较大的优势。而Smith 在他的文献[17]中报道了利用
DHPLC 技术对已知和未知的疾病相关基因进行突变筛查的情况。在这项研究
中,DHPLC 技术被用来筛查绝大部分APC 和P53 基因,因为突变有可能分散
在这些基因中。实验结果表明DHPLC 技术作为一种基因突变预筛手段,可以
极大地提高测序的效率。
利用DHPLC 技术分析DNA 甲基化
DNA 修饰性因素(如DNA甲基化等)在基因表达调控中的作用非常重要。
许多看家基因和超过40%的组织特异性基因在他们的启动子区域拥有CpG岛结
构,该结构很容易发生甲基化,从而对基因转录调控产生影响[18,19]。这些
CpG 岛结构在发生DNA 修饰后,对DNA 编码的具体影响还有待证明;但 DNA
甲基化与基因沉默之间的确存在关联,这一点可从大多数受测基因(约80%)
中得到证实[20]。而余下的20%受检基因在甲基化后表达水平增强,这些基因都
在第一个内含子或编码区域中含有CpG 岛结构。
关于DNA 修饰性因素参与癌症发生和发展的证据越来越多,而启动子甲基
化确实对许多肿瘤抑制基因的转录产生负性影响[21]。DNA 修饰也与其它许多疾
病有关,例如BWS[22], PWS[23], AS[22] 等综合征。环境因素对DNA 甲基化有
直接的影响,例如维生素B12缺乏会引起叶酸代谢紊乱,以及DNA 甲基化状态的
改变,而在肿瘤组织中维生素水平也会影响DNA 甲基化状态[25]。因此检测CpG
岛甲基化对我们了解基因调控与疾病发生发展的关系非常重要。
了解特定疾病过程中甲基化状态的重要性极大地促进了精确描述和量化
DNA 甲基化的实验方法的发展。一些常规的甲基化检测方法,如DNA 测序,以及
其它基于凝胶和PCR 技术的甲基化检测方法,都是费时费力,不适于进行大样
本实验。
而最近有些的报道表明利用DHPLC 技术进行甲基化检测可以避免重蹈其它方法
的覆辙[26,27,28,29,30]。
Deng 在他的文章[26]中介绍了一种PCR 扩增亚硫酸盐修饰的CpG 岛,然
后利用DHPLC 技术同时检测扩增产物中的CpG 岛甲基化和SNP 的方法,并用这
种方法对多种细胞系和胃癌细胞系中hMLH1 启动子,以及环氧化酶2(COX2)
启动子的甲基化状态进行了检测[26]。这种亚硫酸盐-DHPLC 技术可对纯合与杂合
样本中的同源与异源CpG 岛结构进行快速的甲基化和SNP 检测和定量。这种方
法的另一个优点是在扩增片段中同时检测出CpG 位点和SNP。两项相似的实验
都使用甲基化特异性PCR 和DHPLC 技术来分析三种人类印记基因的甲基化状态,
这三种基因分别是:AS 和PWS 相关的SNRPN 基因,以及BWS 相关的LIT1 和H19
基因[27,28]。利用这项技术可以在患有PWS 婴儿的样品中检测到低水平的细
胞镶嵌现象,这充分证明了该项技术的敏感性[27]。这种变异水平很低的细胞
系(血中低于8%)
用传统的分子生物学方法根本无法检测到。而这种检测低水平细胞镶嵌的能力
对于以遗传镶嵌作为部分显型表现的各种孟德尔和非孟德尔式遗传疾病的临床
诊断和预后有着重要的意义[15]。
另外一种基于DHPLC 技术的方法也被用来检测特定位点的CpG 岛甲基化
[29,30]。这种方法利用亚硫酸盐处理的基因组DNA 的PCR 产物,将单核苷酸
引物延伸与DHPLC 分离技术相结合,来区分甲基化和非甲基化的CpG 岛。而有
些CpG 位点是在对引物延伸产物进行多链化之后再进行分析的。利用DHPLC 技
术可对特定CpG 位点的甲基化进行量化分析。而对于已经明确甲基化对基因调
控影响的特定序列,使用DHPLC 技术对其进行分析是非常合适的。
DHPLC 在SNP 发现和确定研究中的应用
候选基因筛查
人类基因组中众多的DNA 多态性以及SNP 对基因功能的影响决定了深入
了解候选效应蛋白的遗传变异状况是非常必要的。在构建一个候选疾病基因的
遗传变异图谱时,首先用经典方法确定一个低分辨率的遗传位点,接下来再根
据参照样品(野生型)和各种受检样品建立一个高分辨率的SNP 图谱[31]。为
了实现上述目标应该在目的基因区域确定SNP 的位置和类型,这需要PCR 扩增
基因组DNA,并进行测序分析。但是SNP 的实质只是对功能相关研究很重要,
而并非是构建遗传图谱的关键。DHPLC 突变筛查技术很好地适应了遗传变异研
究的这一特点,它只检测DNA 序列差异,并不确定差异的实质。
利用DHPLC-SNP 筛查技术来确定一个功能基因可以采取两种途径[32]。
第一种方法,收集大量的候选疾病基因的样品,然后利用DHPLC 对可能发生
功能性SNP 的编码序列进行筛查。这种方法的前提是与一种遗传病表现型相关
的基因中应有一个或多个疾病相关的突变位点,因此致病基因突变也应相对频
繁地出现在有相应的疾病表现型的样品中。而上述方法对筛查序列的限制也会
导致漏筛位于非编码调节区域的序列变异。在第二种相对全面的方法中,一个
基因的全基因组序列被系统地进行突变筛查。这样做的优点是在样本量充足的
情况下,漏筛功能性多态的几率较小。上述两种基于DHPLC 的方法都能极大
程度上降低SNP 筛查的工作量,进而对人类疾病相关遗传位点的构图产生重要
的影响。下面将简要介绍几篇利用DHPLC 技术进行SNP 筛查的文献报道。
充血性心衰
Lynch和他的同事们在文章[33]中表示充血性心衰(CHF)相关的G 蛋白和
下游信号传导通路蛋白的遗传变异信息存在极大的缺陷。在这项研究中,他们
检测了编码信号传导蛋白的基因,以确定新发现的和已报道的SNP 的发生频率。
通过DHPLC 和确证性双链DNA测序的方法,他们筛查了96-144 个CHF 病人
的9 个主要信号传导基因的56 个编码外显子,并且发现了17 个新的和8 个报
道过的同义SNP, 以及一个新的非同义SNP。由于对NCBI和Celera 数据库最
初的实验中漏筛了多个SNP 很感兴趣,他们又检测了10 个已报道过的非同义
SNP,结果在74-91 个CHF 病人样品中并未发现这些SNP。他们将实验结果与
NCBI 和Celera 的数据进行比较,发现数据库中56%的SNP 并未在他们的样品
中发现,而实验中发现的SNP 中的69%并不存在于数据库中。这项研究表明绝
对性地将现有数据库作为多态标记的来源,并只使用这些标记物会导致错误的
实验结果。另外一项最新的研究[34]表明SNP 数据库中关于25 个G 蛋白耦连受
体的数据只有32%能在样本量为60 的实验中被确证。这说明利用DHPLC 对现
有数据库中的SNP 数据进行确证是一种在更大规模实验前对标志物进行评估的
可靠方法。
神经精神疾病
基因编码区的SNP 可被用来做关联实验,以确定复杂疾病的遗传基础[35,
36]。而这种实验的成功与否极大程度上取决于疾病相关等位基因的频率以及它
们在不同种族人群中的分布[37]。如果待测序列的高危等位基因频率很低,那么
直接确定突变序列基因型的方法就不适用了。以往对基因的分析表明大多数基
因突变频率很低(<0.05),而且低于75 的样本量也会限制检测稀少等位基因的
能力[38]。最近有文献[39]介绍了一项研究,利用DHPLC 对神经精神疾病相关
的两个基因的编码区和剪接结合部的突变序列(频率很低)进行大样本量筛查
(n=450)。结果表明这两种基因,SLC6A4(编码5-羟色胺转运蛋白)和SLC18A2
(编码血管单胺转运蛋白),在等位基因变异的数目和频率方面存在明显的差
异。如果将这样的变异基因比较扩展到更大范围的基因中去,那么就有可能确
定特定形式的遗传变异与基因功能之间的关联。
阿尔茨海默病
阿尔茨海默病(AD)是一种渐进性神经退行性病变,它是由复杂的遗传和环
境因素共同造成的。一项成功的SNP 研究确定载脂蛋白E(APOE)基因(等
位基因4)是一个易感性位点,可能增大迟发性阿尔茨海默病(LOAD)的发病
几率[40]。到目前为止,这是唯一的被证实的LOAD 易感性标志。一项最近的
研究对位于12 号染色体的编码氧化低密度脂蛋白(LDL)受体1(OLR1)的基
因进行分析[41]。研究者利用DHPLC 对50 名AD 患者的全部OLR1 外显子和
内含子/外显子交界部位进行了突变序列筛查。结果有三种新的遗传变异被鉴别
出来,它们全部位于非编码区域。在对超过800 个LOAD 病例的基因型分析表
明上述的SNP 与AD 之间存在明显的关联,其中最重要的是位于非APOE4 区
域的3’-UTR SNP。关于遗传变异对早发性阿尔茨海默病(EOAD)和LOAD 已
有大量报道( 见阿尔茨海默病突变数据库
http://molgen-www.uia.ac.be/ADMutations/)。
例如编码淀粉样前体蛋白的基因(APP)和编码早老素的基因(PSEN1, PSEN2)
发生突变会通过改变γ-分泌酶活性一起少见的早发性阿尔茨海默病(EOAD)。
近来一种名为nicastrin(NCSTN)的跨膜糖蛋白被确定是γ-分泌酶复合物的一部
分,而后者可切割淀粉样前体蛋白(APP)[42]。NCSTN 被定位于1q23,一个
与LOAD 相关的区域。近来有一项研究利用DHPLC 对两名荷兰的EOAD 或
LOAD 患者进行了NCSTN 基因突变检测[43]。结果在NCSTN 基因中发现了14
种新的SNP,其中之一可能能增大EOAD 的发病几率。
心脏病
近来有大量的研究通过对突变序列的鉴别研究各种心脏疾病的相关基因。
家族性肥大性心肌病(HCM)是一种常见的常染色体遗传病,病变部位为心肌
小节。在9 种编码肌小节蛋白的基因中发现的突变已经证明与HCM 相关[44]。
最常见的突变基因是编码β-肌球蛋白重链的MYH7 基因,而功能相关性突变发
生在编码区域的5’端部分。近来有研究利用DHPLC 技术来筛查MYH7 基因编
码酶解肌球蛋白轻链(LMM)的编码区3’端部分。结果研究者发现了破坏MYH7
基因功能的突变[45],这说明只有进行全基因突变筛查才能保证正确的诊断。另
外超过1/3 的HCM 病例没有发现任何突变,无论是在已知的肌小节基因,还是
在与心脏能量稳态相关的其他基因中,结果都一样。利用DHPLC 技术对重症
HCM 家系的编码AMP依赖蛋白激酶的γ2 亚基的PRKAG2 基因进行的突变筛
查证明能量耗竭是心肌功能失常的主要成因[46]。近来对HCM 致病基因的遗传
异质性的深入研究[44,47]表明扩大对HCM 的遗传检测是非常有必要的。
近来还有许多关于其他心肌疾病的候选基因筛查研究。如对位于1q42-q43
的一些疾病相关基因进行DHPLC 突变筛查[48]。结果在一个患有致心律失常性
右心室心肌病2(ARVD2)的家系中发现了一种编码心脏ryanodine 受体(RYR2)
的基因突变。这些突变的识别为进行症前诊断提供了一个标志物,也为早期监
测和治疗干预提供了机会。这些发现也有可能促成更特异有效的药物干预。
自身免疫病和炎症
另一个焦点研究领域是筛查自身免疫病和炎症相关的基因突变。利用
DHPLC 技术,研究者已识别出了多种致病基因突变如PAPA 综合征(脓性无菌
性关节炎,坏疽性脓皮病和粉刺),和家族性复发性关节炎(FRA)(一种主要
影响皮肤和关节组织的早发性遗传病)的致病基因突变 [49]。而研究者指出这
些突变影响了正常炎症反应的信号传导通路,因此这类自身免疫病有可能与普
通的炎症性疾病如风湿性关节炎,炎性肠病等有相同或相似的病因。利用
DHPLC 技术,研究者也在编码胸腺特异性丝氨酸蛋白酶(PRSS16)的基因中
发现了一些SNP,这些基因变异位于HLA 复合体中,后者包含有多种免疫疾病
的相关基因[50]。这些基因突变中的一部分有生物学作用,有必要深入研究它们
的疾病相关性(如与糖尿病的关联)。
蛋白水解酶和它们的抑制剂在维持免疫系统稳态过程中发挥重要的作用。
因此这些蛋白的突变形式有可能产生显著的生物学后果。利用DHPLC 技术,
研究者在编码丝氨酸蛋白酶抑制物Kazal-5 蛋白(LEKT1)的SPINK5 基因中
发现了一组突变,而这种基因是一种常染色体隐性遗传皮肤病Netherton 综合征
的缺陷基因[51]。LEKT1 是第一个被发现参与免疫疾病的丝氨酸蛋白酶抑制物。
现已发现许多编码与LEKT1 类似的丝氨酸蛋白酶抑制物和激活物的基因突变
与疾病相关,如Kazal-1 胰蛋白酶抑制物与慢性胰腺炎(CP),以及组织蛋白酶
C 与牙周疾病等。
CP 是一种严重时可能危害生命的疾病。在过去的几年中,已有三种基因被
发现与CP 有关,它们是CFTR, PRSS1 和PST1[52]。近来有一项研究利用
DHPLC 技术在39 个病人中对上述三种基因的整个编码区域和剪接结合部位进
行突变状况的筛查[53]。结果表明约30%的受检者至少有一种基因发生一种突
变。但这不包括新发现的不普遍的基因突变,而这些突变中的一些还有可能具
有功能意义。只有三个病人至少有两种基因中发生了突变。这些少见的病例表
明在CP 易感性位点之间存在某种关联。这项研究也提供了一次对一种常见疾病
的不同基因突变的杂合状态进行研究的独特机会。
遗传变异研究在临床治疗中的意义
药物代谢和耐药性
遗传药理学是一种研究基因在个体对药物治疗和环境因素的生物学反应中
所起作用的学科。不同个体对药物反应存在固有的差异,一些常用药物在几种
重要疾病中的作用请见表3[54]。个体对药物的反应直接受个体的基因型和生活
形式的影响。确定个体的基因突变类型无论对科学家或临床医生来说都是一项
艰巨的任务。但是这种研究却可以区别可能与不可能发生药物反应的患者,以
及识别那些可能发生严重反应的高危患者。因此无论从用药的有效性或安全性
来说,对患者进行遗传实验,以预测他对一种特殊药物的反应十分有必要。这
种研究对将带有特定遗传药理学标记的患者分组进行临床实验也有很大的帮
助。
编码细胞色素,甲基转移酶等代谢酶类的基因多态性对药物反应有显著的
影响。这些酶类参与细胞对药物的吸收,分布,降解和清除等活动。因此确定
影响药物代谢的突变等位基因可以帮助临床医生预测患者对治疗的反应。
DPYD
一项介绍DHPLC 技术筛查编码二氢嘧啶脱氢酶(DPD)的基因DYPD 的
报道证明了识别突变等位基因的遗传药理学价值[55]。这种酶可以催化抗癌药物
5-氟尿嘧啶(5-FU)代谢的限速步骤。DPD 缺乏会导致5-FU 用药后的严重毒性,
因此在使用5-FU 进行化疗之前,确定癌症患者的DPD 遗传状态具有重要的价
值。然而DYPD 基因的复杂性和大小(23 个外显子,150-950kbp)使许多研究
者对研究DPD 缺乏的遗传基础望而却步。一项利用DHPLC 技术对上述基因的
筛查研究检测到全部21 个以前有报道的基因突变,并且鉴别出了纯合与杂合基
因型,证明DHPLC 是一种能够准确,敏感,低消耗地检测具有重要临床意义
的基因突变的方法。DHPLC 的所有这些特点对于以复杂基因(如DYPD)突变
筛查为目的的病人或自然人群研究是非常合适的
编码TPMT 的基因
巯基嘌呤S-甲基转移酶(TPMT)是一种位于细胞质,催化巯基嘌呤S-甲
基化的酶类。巯基嘌呤是一种免疫抑制剂,可被用来治疗急性淋巴细胞白血病
以及风湿性关节炎[56]。编码TPMT 的基因多态性对巯基嘌呤的代谢有严重的
影响,目前已有10 种影响表型的突变等位基因被识别出来[57]。一种利用
DHPLC 快速筛查TPMT相关突变的临床检测方法已经形成[58]。在一项相关研
究中,有98 份来自于正在接受或接受过巯基嘌呤治疗的人群的DNA 样品被用
来筛查TPMT突变。通过直接测序证实,DHPLC可以鉴别出样品中全部(100%)
突变等位基因。DHPLC 对TPMT 相关突变的评估是建立在清晰的洗脱结果基
础上的。如果拥有一套参照数据,DHPLC 的洗脱结果可被用来预测序列突变的
类型[59]。可见DHPLC 这种自动技术可被临床实验室用来确定TPMT 等基因
突变的基因型,以及筛查新的突变。
Imatinib
对从事药物研发基础研究的工作者来说,DHPLC 是一种有价值的辅助工具。
例如近来有研究表明在对白血病患者的治疗过程中,BCR-ABL 激酶激活位点的
基因区域的多种突变对酪氨酸激酶抑制剂Imatinib 的耐药性有影响[60]。这项重
要的发现对于确定需要改变治疗策略的耐药性水平有重大意义。Imatinib 的其它
目标以及酪氨酸激酶抑制剂的其它作用对象的耐药性机制可能与上述研究结果
相似。最近有一项研究利用DHPLC 技术对Imatinib 的一个作用对象c-kit 进行
了突变筛查[61]。研究结果显示不同时期的胃肠道基质瘤(GIST)都有c-kit 基
因突变。这些突变在早期良性的胃肠道基质瘤中存在率较高,这说明c-kit 在早
期GIST 发展中起作用。重要的是,这些带有突变的GIST 类型已被加入了
Imatinib 的适用范围中。虽然c-kit 并不是GIST 由良性转向恶性的标志,但它
却是有用的耐药性指标。可见准确而敏感的对酪氨酸激酶基因靶点的突变研究
能够在不存在类似耐药性的新型抗癌药物研发过程中起到辅助的作用。
VEGF
参与血管生成的基因也是目前深入研究的重要药物靶点。人类血管内皮生
长因子(VEGF)由肿瘤细胞分泌,以自分泌的形式作用于内皮细胞。最近有人
对人类结肠直肠癌中VEGF 的基因突变情况进行了研究[62]。结果发现了4 个剪
接结合部变异位点和6 个新的基因突变。这些突变可能在肿瘤-宿主反应的生物
多样性方面具有重要影响,也可能对药物靶点研究很有价值。
上面这些文献报道为识别和确定与发病危险性,药物反应和耐药性相关的
基因变异提供了理论和应用的介绍。而分析标志等位基因(基因型)和临床特
征(表现型)之间的关系对治疗策略的制定有重要的意义。相信在不久的将来,
对临床相关基因突变的准确识别能帮助医务工作者制定针对每个病人的独特治
疗方案,从而提高对疾病的治疗和控制水平。
总之,近几年来,DHPLC 技术飞速发展,利用DHPLC 对大量的疾病相关
基因突变进行筛查,如下表:
Table 1. Recent genes associated with inherited disorders scanned for mutations by
DHPLC.Transgenomic
Gene MIM
number1
Exons Disease Reference
ABCA4(ABCR) 601691 50 Macular degeneration 〔71〕
ADRB2 109690 Intron-less Asthma; chronic obstructive pulmonary disease;
CHF
〔33··,72〕
ALAP 145500 - Essential hypertension 〔73〕
ALG3 601110 - Congenital disorder of glycosylation 〔74〕
ALG6 604566 - Congenital disorder of glycosylation 〔74〕
APM1 605441 3 Type II diabetes 〔75〕
APOD 107740 5 Cardiovascular; lipid metabolism 〔76〕
ATPB7 606882 21 Wilson’s disease 〔77〕
CFTR(ABCC7) 602421 27 CF; idiopathic CP 〔8·,53,78,79〕
CHAC 200150 73 Chorea-acanthocytosis 〔80〕
CHX10 142993 5 Microphthalmia; anophthalmia 〔81〕
CLCN1 118425 23 Myotonia 〔82〕
CRB1 604210 11 Leber congenital amaurosis 〔83〕
CRX 602225 3 Leber congenital amaurosis 〔83〕
CPM1 603503 9 Congenital disorder of glycosylation 〔74〕
DPYD 274270 23 5-FU toxicity 〔55··〕
DRD2 126450 7 CMT disease 〔84〕
DRD3 126451 8 Schizophrenia 〔85〕
EGR2 129010 2 CMT disease 〔9··〕
F8C(Factor VIII) 306700 24 Hemophilia A 〔86,87〕
FBN1 134797 65 Marfan syndrome and related connective tissue
disorders
〔88,89〕
GAD2 138275 17 Type I diabetes 〔90〕
GJB1 304040 2 CMT disease 〔9··〕
GJB2 121011 2 Hereditary hearing loss 〔91,92〕
GNA11 139313 3 CHF 〔33··〕
GNAQ 600998 Intron-less CHF 〔33··〕
GNAS 139320 13 CHF 〔33··〕
Gene MIM
number1
Exons Disease Reference
GRIN1 138249 21 Schizophrenia 〔93〕
GRIN2A 138253 14 Schizophrenia 〔93〕
GRIN2B 138252 13 Schizophrenia 〔93〕
GRIN2C 138254 13 Schizophrenia 〔93〕
GRIN2D 602717 13 Schizophrenia 〔93〕
HBB 141900 3 ? -Thalassemia 〔94,95〕
HFE 235200 7 Hereditary hemochromatosis 〔96〕
HPRP3 601850 - Autosomal dominant retinitis pigmentosa 〔97〕
K9 144200 6 Epidermolytic palmoplantar keratoderma 〔98〕
KCNE1 176261 3 Congenital long QT syndrome (LQTS) 〔99〕
KCNE2 603796 1 Congenital LQTS 〔99〕
KCNH2 152427 15 Congenital LQTS 〔99〕
KCNJ10 602208 2 Type II diabetes 〔100〕
KCNQ1 192500 16 Congenital LQTS 〔99〕
KvLQT1 220400 - Jervell and Lange-Nielsen syndrome (JLSN1) 〔101〕
LDLR 143890 18 Familial hypercholesterolemia 〔102,103〕
LHCGR 152790 11 Leydig cell hypoplasia 〔104〕
LIPC 151670 9 Coronary artery disease 〔105〕
LPL 238600 10 Coronary atherosclerotic heart disease 〔105〕
MAG 159460 12 Multiple sclerosis 〔106〕
MAPK1 176948 8 CHF 〔33··〕
MC4R 155541 Intron-less Early-onset obesity 〔107〕
MIF 153620 3 Systemic-onset juvenile idiopathic arthritis 〔108〕
MLC1 605908 12 Schizophrenia 〔109〕
MPI 154550 - Congenital disorder of glycosylation 〔74〕
MPDU1 604041 7 Congenital disorder of glycosylation 〔74〕
MTM1 310400 15 X-Linked myotubular myopathy 〔110〕
MYH7 160760 39 Familial HCM 〔44,45〕
MYOC 601652 3 Open angle glaucoma; ocular hypertension 〔111〕
NAB1 600800 7 Peripheral neuropathy 〔112〕
NAB2 602381 7 Peripheral neuropathy 〔112〕
NCSTN 605254 17 AD 〔43〕
NTF3 162660 - Schizophrenia 〔113〕
OA1 300500 9 X-Linked ocular albinism 〔114〕
OPRM1 600018 3 Heroin addiction; idiopathic generalized epilepsy 〔115,116〕
PAX6 106210 14 Microphthalmia; anophthalmia; coloboma 〔81〕
PCDH8 603580 3 Schizophrenia 〔117〕
PKD1 601313 4 Autosomal dominant polycystic kidney disease
(PKD)
〔118〕
PKD2 173910 15 Autosomal dominant PKD 〔118〕
PKHD1 606702 67 Autosomal dominant PKD 〔119,120〕
PMM2 601097 8 Carbohydrate-deficient glycoprotein syndrome type
1A
〔74〕
PMP22 601097 3 CMT disease 〔9··〕
PRSS1 276000 5 Hereditary pancreatitis; idiopathic CP 〔53〕
PRSS16 607169 12 Autoimmunity 〔50〕
PTPN11 176876 14 Noonan syndrome; :ROPARD syndrome;
Cardiofaciocutaneous syndrome
〔121,122〕
RAB3A 179490 5 CHF 〔33··〕
RAB4 179511 8 CHF 〔33··〕
RAB5C 604037 5 CHF 〔33··〕
RAD 179503 8 CHF 〔33··〕
RPE65 180069 14 Leber congenital amaurosis 〔83〕
RPGRIP1 605446 15 Leber congenital amaurosis 〔83〕
SIX3 603714 2 Microphthalmia; anophthalmia; coloboma 〔81〕
SLC6A4 182138 13 Anxiety disorders 〔39··〕
SMN1 600354 8 Spinal muscular atrophy 〔123〕
SPINK1 167790 4 Idiopathic CP 〔53〕
SPINK5 605010 28 Netherton syndrome 〔51〕
SUOX 272300 3 Sulfocysteinuria 〔124〕
TGM2 190196 13 Maturith-onset diabetes (MODY) 〔125〕
TNFRSF1A 191190 10 Tumor necrosis factor receptor-associated periodic
syndrome
〔126〕
TSC1 605284 21 Tuberous sclerosis 〔11·,127〕
TSC2 191092 41 Tuberous sclerosis 〔11·,12·,127〕
VHL 193300 3 Hippel-Lindau disease 〔128〕
WFS1 606201 8 Wolfram syndrome 〔129〕
Table 2. Cancer genes recently scanned for mutations by DHPLC.Transgenomic
Gene MIM
number1
Exons Disease Reference
APC 175100 15 Colorectal cancer 〔17··,130-133〕
ATM 208900 62 Hereditary, sporadic breast and ovarian cancer 〔134〕
AXIN1 603816 10 Hepatocellular carcinoma 〔135〕
AXIN2 604025 2 Hepatocellular carcinoma 〔135〕
BRCA1 113705 23 Hereditary breast and ovarian cancer 〔7·,136,137〕
BRCA2 600185 28 Hereditary breast and ovarian cancer; sporadic
exocrine pancreatic cancer
〔136-138〕
CDH1 192090 16 Hereditary prostate cancer; sporadic ductal and
lobular breast cancer
〔139,140〕
CTNNB1 116806 16 Uveal melanoma; hepatocellular carcinoma 〔135,141〕
DBC2 - - Breast cancer 〔142〕
ELA2(NE) 130130 5 Lung cancer 〔143〕
FAM10A4 606796 - B-cell chronic lymphocytes leukemia 〔144〕
?-GCS - - Lung cancer 〔145〕
GSTP1 134660 7 Lung cancer 〔145〕
GSTM1 138350 8 Lung cancer 〔145〕
GSTT1 600436 5 Lung cancer 〔145〕
INK4A 600160 3 Melanoma 〔146〕
KIT 606764 21 GISTs 〔61··〕
K-ras 601599 6 Colorectal cancer 〔17··〕
MET 164860 21 Papillary renal carcinomas 〔147〕
MLH1 120436 19 Hereditary nonpolyposis colorectal cancer;
endometrial caricinoma
〔148,149〕
MLH3 604395 13 Colorectal cancer 〔16·〕
MSH2 120435 16 Hereditary nonpolyposis colorectal cancer;
endometrial caricinoma
〔148,149〕
MUTYH 604933 16 Hereditary nonpolyposis colorectal cancer 〔132,133〕
MYO18B Lung cancer 〔150〕
NBS1 602667 16 Acute lymphoblastic leukemia; colorectal
carcinoma
〔151〕
P14(ARF) 600160 3 Uveal melanoma 〔141〕
P15(INK4B) 600160 3 Uveal melanoma 〔141〕
P16(INK4A) 600160 3 Uveal melanoma 〔141〕
PTEN/MMAC1 601728 9 Endometrial carcinoma; neuroblastoma 〔148〕
RNASEL 180435 6 Prostate cancer 〔152〕
SMAD4 607010 13 Uveal melanoma; pancreatic cancer 〔141〕
TGFBR2 190182 7 Uveal melanoma 〔141〕
TP53(p53) 191170 11 Various cancers 〔13,17··,141〕
耐药性相关基因突变的微生物学识别和检测
随着耐药性微生物的大量出现,针对传染性病原体的治疗策略制定和药物
研发变得越来越难。抗微生物治疗面临挑战的一个重要原因就是缺乏能够准确
识别致病微生物和耐药基因的有效临床手段。然而近来发展起来的能识别病原
体和研究微生物抗药性的分子生物学方法又为抗微生物治疗和药物研发建立了
希望。下面将对利用DHPLC 技术,成功识别致病细菌以及细菌耐药性基因突
变的研究进行简要的总结。
从临床治疗的角度来看,准确确定致病微生物的种类具有重要的价值,它
可以保证用药的有效性。Hurtle 在他的文章[63]中指出DHPLC 技术能有效的识
别病原微生物。作者利用万能PCR 引物从多种细菌的转录16S 核糖体RNA 的
基因中产生出一条320-bp 的扩增片段。将这些来自不同种类细菌的扩增产物与
参照物混和后进行DHPLC 检测,会产生一个独特的色谱结果。而该结果可以
作为鉴定细菌种类的分子指纹。
在一场大范围疫情爆发中,从菌株水平确定病原菌是至关重要的。只有了
解了致病菌株才能正确选择抗菌药物。Shlush等指出将PCR, DHPLC 和多位点
序列分型(MLST)技术相结合可以从菌株水平识别病原菌[64]。MLST 技术利
用位于非连锁位点的管家基因来进行微生物分型[65]。研究人员PCR 扩增管家
基因区域,并将扩增产物与对照物混和。通过DHPLC 检测,产生每个管家基
因的特定的色谱结果[64]。实际上DHPLC 的分析能力在没有测序的情况下远远
超过MLST。
对已知和未知的耐药性基因突变的检测对于评估现有和新开发的抗生药物
至关重要。而DHPLC 可以准确地检测耐药性相关基因突变。一项筛查肠炎沙
门菌抗quinolone gyrA 基因突变的研究[66]表明,在准确性方面,DHPLC 远远
超过了其它检测单碱基突变的分子生物学方法,如单链构象多态性,和轻环
PCR-gyrA 杂交突变检测技术(GAMA)等。Hannachi-M’Zali 也在文章中[67]指
出DHPLC 是检测甲氧西林耐受的金黄色葡萄球菌的抗quinolone gyrA,gyrB,
grlA 和grlB 基因突变的有效方法。而Cooksey 则利用DHPLC 技术建立了抗结
核药耐受性相关基因突变筛查的常规方法[68]。上面的研究表明将DHPLC 与其
它分子生物学方法结合使用,可以了解引起耐药性的基因突变,从而促进特异
性药物的研发。
DHPLC 技术在微生物学研究中的应用并不仅限于细菌相关的工作。它也可
被用在真菌,病毒和寄生虫等研究领域,以识别微生物和检测抗药基因突变。
使用DHPLC 技术对抗生药物的研发由三点益处。第一,DHPLC 技术可以可靠
地从种属和菌株水平识别微生物,弥补传统的表型识别方法的缺陷。第二,
DHPLC 技术可以高度准确地检测耐药基因突变。第三,DHPLC 技术具有从混
合微生物群落中识别突变种类的能力。从异源混合物中检测遗传突变基因对于
监测感染过程中病原微生物耐药性的变化至关重要。上述观点的一个重要例证
是人免疫缺陷病毒1(HIV-1)的进化过程[69]。在活体标本中发现了由主要HIV-1
蛋白酶基因和少数突变基因组成的复杂的病毒准种。在没有选择压力的情况下,
耐药突变基因的出现频率低于野生型基因。而抗药选择可以使这种突变基因成
为主要基因型。这种关于HIV-1 病毒准种的分析可使研究者深入了解病毒进化
过程中病毒群落的复杂变化。但是这种病毒群落的分析是一项艰巨的任务,因
为低频率的突变很难通过测序检测到,亚克隆病毒PCR 产物的测序结果会偏向
频率高的突变类型[70]。DHPLC 等技术能提高检测少数耐药突变的能力,进而
促进HIV-1 等传染病的治疗。
结论
由于准确,敏感的DHPLC 突变检测技术的发展,新发现的基因突变数目
正在快速增长。DHPLC 突变检测技术对人类疾病发生,易感性和治疗相关基因
突变以及连锁标志物的识别做出了重要的贡献。由于环境,生物学和进化因素
等不同选择机制的使用,新发现的遗传等位基因将越来越多。而发现与肿瘤基
因,病原微生物的病毒因素,以及特定药物靶点相关的新的低水平的基因突变
将是一项持久性的任务。采用DHPLC 技术筛查基因突变,将会使这项任务更
好地进行,并促进高效的药物研究和开发。
致谢
在此我想感谢 Drs Joseph Breen, George Hong, Phillip Eastlake, Felix
Frueh 和Mario Noyer-Weiner 等对这篇文章的创作所付出的饱含思想性的努
力。我也想感谢Amanda Miller-Lindholm 和Carla Shaw-Bruha 对表1,2 的制
作所给予的帮助。
参考文献
Stan L Lilleberg
变性高效液相色谱(DHPLC)是一种新型遗传变异筛查技术,可用于单碱
基替换(或单核苷酸多态性),小片段缺失或插入等多种基因突变的检测。
DHPLC 基因扫描技术可在生殖细胞系和体细胞系中筛查遗传变异。而像特定位
点DNA甲基化状态的改变等遗传现象也可用在DHPLC基础上建立的方法来检
测。遗传变异的生物学效应是由突变基因的位置和特点决定的,而功能相关基
因突变的发现对相关药物的研发有很大的促进作用。本文将对DHPLC 技术在
突变检测领域的应用实例进行介绍和讨论;介绍的重点分别是致病基因突变位
点的确认,以及药物代谢和耐药性相关基因突变的检测。
关键词:候选基因,变性高效液相色谱,DNA甲基化,药物代谢,抗药性,
遗传变异,基因突变,遗传药理学,SNP 筛查,SNP 确认,体细胞变异。
缩略词
5-FU---5-氟尿嘧啶,AD---阿尔茨海默病,早老性痴呆,APP---淀粉样前体蛋白
AS ---安格尔曼综合征,快乐木偶综合征,BWS---贝-威综合征,CF---囊性纤维
化,CHF---充血性心衰,CMT---沙-马-图病,进行性神经性(腓骨)肌萎缩,
COX-2---环氧合酶-2,CP---慢性胰腺炎,DHPLC---变性高效液相色谱,DPD---
二氢嘧啶脱氢酶,EOAD---早发性阿尔茨海默病,GIST---胃肠道基质瘤,
LOAD---迟发性阿尔茨海默病,HCM---肥大性心肌病,MLST---多位点序列分
型,PCR---聚合酶链氏反应,PWS---普-威综合征,SNP---单核苷酸多态性,
TPMT---硫代嘌呤-S-甲基转移酶,VEGF---血管内皮生长因子
介绍
当今的基因技术革命已为医学和制药工业的发展开辟了新的途径。基因突
变和单核苷酸多态性(SNP)等DNA 序列变异的确定正在成为新药研发的重要
组成部分[1]。而许多功能基因组,临床诊断和遗传药理学研究中的重大发现也
是通过检测基因突变和SNP 实现的。分子遗传学的研究将对普通临床病症的分
子水平缺陷给予更好的解释,并最终促进针对这些缺陷的新疗法的产生。而遗
传变异研究在新药开发中最有意义的作用就是为药物治疗靶点的识别,描述和
确认提供信息支持[2]。
对一种可能的药物靶点进行遗传学分析可了解目的基因发生突变的程度。
对靶序列突变的分析描述是药物开发早期工作中的关键环节,它可为药物设计
提供最合适的突变靶点。而在药物靶点的确定过程中,遗传变异也可被用来证
明特定靶点与疾病表现型之间的关联。而特定靶基因突变与临床指征或标志之
间的正性关联将会对评估该药物靶点的临床相关性以及治疗价值提供强有力的
支持。这种遗传学分析通常在靶点确定过程的早期完成,为特定药物靶点的选
择提供证据支持。
遗传变异的分析在药物研发的后续过程中也有作用。例如在遗传药理学方
面,编码药物代谢酶类的基因发生突变等遗传因素可能影响受药个体对特定药
物的反应,进而影响该个体使用该药物的有效性和安全性[3]。遗传药理学的实
验数据可在药物研发和临床用药过程中起到辅助作用。此外,药物靶点本身以
及疾病相关基因的遗传变异也可对药物的治疗结果产生影响。这些遗传变异可
以成为有力的药效指标,也可以成为临床诊断和预后的标志物[4,5]。当深入
了解了各种疾病的遗传变异机理后,人们就可制定相应的治疗策略对这些疾病
进行正确的诊断和治疗了。
由上可知,遗传变异检测的作用不仅存在于药物靶点的识别和确定阶段,
而且贯穿于整个药物的研发过程中。因此,对编码特定药物靶点,疾病通道蛋
白,药物代谢酶类和耐药性相关蛋白的基因进行扫描,以便检测对药物疗效和
毒性有影响的SNP 和基因突变是很有必要的。这些基因序列的改变有可能对其
表达的蛋白质的结构和(或)功能以及表达水平具有深远的影响。
理想的突变和SNP 检测技术应当具有准确性和敏感性高,完全自动化,检
测成本低等特点。此外理想的检测技术在PCR 反应引物的修饰,反应试剂的搭
配,检测标记以及PCR 反应后处理等方面也应没有特殊的要求。变性高效液相
色谱(DHPLC),一种能够满足上述所有要求的新兴技术,已经逐渐发展成突
变检测的首选技术。DHPLC 这种准确高效的基因筛查技术的发展,极大地促进
了新的突变位点的发现,并对了解疾病发生发展机制,确定药物研发方向做出
了重要贡献。本文将对近年来利用DHPLC 技术确定基因序列突变的相关报道
进行介绍,并深入探讨这些发现的生物学意义。
利用DHPLC 技术检测遗传变异
DHPLC 技术可以通过温度调节的异源双链分析,自动检测单碱基替换,小
片段插入和缺失等基因序列的改变。关于DHPLC 技术的工作原理和应用范围,
在Xiao 和Oefner 的综述[6]中有详尽的介绍。DHPLC 基因突变筛查,就是利用
离子对反向液相色谱技术,通过独特的DNA分离基质,对特定的PCR 反应产物
进行分离(图1)。在待测样品部分变性和乙晴冲洗梯度呈线性增加的情况下,
带有突变序列的异源双链,与同源双链(野生型或阴性对照)相比,它们的柱保
留时间相对较短。因此,带有突变序列的样品呈现出异源和同源双链混合物的
峰型特点,而不含突变序列的样品则只有同源双链的峰型。出现与野生型或阴
性对照不同的DHPLC 冲洗结果,说明检测样品含有突变序列。DHPLC 技术为
确定带有突变序列的样品提供了一种简便而直观的途径,该种方法对生殖细胞
系和体细胞系的基因突变检测同样适用。
图一
图2 展示了利用DHPLC 技术检测DNA 序列变异,以及通过测序技术确定
特定的碱基改变的过程。整个实验流程非常简便。首先从合适的来源分离DNA
和RNA,然后通过PCR 或RT-PCR(模板为RNA)反应,扩增目的基因的特
定区域(即扩增子),扩增子一般包括一个外显子以及相应的外显子/内含子连接
区,
也有的扩增子包括启动子区域,或5’/3’非编码区域。在PCR 反应之后,可直接
利用DHPLC 技术对扩增子进行分析,无需再对PCR 产物进行预处理。利用自
动化的DHPLC 分离方法,目的扩增子可被彻底地扫描。最后如果DHPLC 识别
出含有突变的扩增子,那么就要用测序的方法来确定其突变类型,DHPLC 检测
结果没有改变的扩增子无需再进行测序。DHPLC 突变检测技术的另一个优点是
可以收集异源双链部分。这些部分含有等量的野生型和突变型等位基因,可为
接下来利用测序方法确定突变类型提供便利。由于在测序前进行DHPLC 筛查,
突变检测的总体效率和敏感性得到了大幅度的提高。本文将列举多篇利用
DHPLC 技术对生殖细胞系和体细胞系进行突变检测的报道。更多的DHPLC 相
关文献可在下面的两个网址中找到: http://www.transgenomic.com
http://insertion.standford.edu 前者可通过目的基因和疾病来搜索DHPLC 相关
文献,而后者是由Standford 基因组技术中心(USA)提供的。
图二:
DHPLC 突变检测技术的准确性
迄今为止,用于筛查疾病相关基因突变的方法有很多种。它们包括:单链
构象多态性(SSCP),构象敏感性凝胶电泳(CSGE),变性梯度凝胶电泳
(DGGE),双相基因扫描(TDGS),直接DNA 测序,基因芯片分析技术等。
在过去几年中陆续有报道指出,DHPLC 突变检测技术与其它方法相比,具有更
高的准确性和敏感性[6]。
最近有一项盲性研究,通过对BRCA1 基因进行突变筛查,将DHPLC 和其
它方法的准确性进行了比较[7]。结果只有DHPLC 技术从65 个样本中检测到了
全部58 种突变,检测结果与测序结果完全相符。这58 种突变包括38 种单碱基
替换,16 种碱基缺失,3 种碱基插入和1 种插入,缺失复合突变。这项研究证
明了DHPLC技术发现各种基因突变的能力。最重要的是这些突变中的40(71%)
种是以前从未被报道过的,有可能逃脱了其它基因分型诊断方法的检测。这项
研究结果为采用DHPLC 技术作为分子诊断方法提供了有力的支持。在另外一
项对整个囊性纤维化(CF)基因(CFTR)的筛查中,DHPLC 技术对73 个CF
病人的全部CFTR 突变的检出率为 100%[8]。另外还有一些研究结果表明
DHPLC 技术的突变检测准确率达到或接近100%。这些受检基因包括:X-连锁
眼白化病(OA1),威尔逊病(ATP7B),家族性腺瘤息肉病(APC),家族性癌
症综合征(PTEN, RET, VHL),常染色体显性多囊性肾病(PKD1, PKD2),血
友病A(因子Ⅷ),家族性高胆固醇血症(LDLR),黑色素瘤(INK4A),和退行
性非综合征式遗传性耳聋(GJB2)等。表1 中所罗列的是最近利用DHPLC 筛
查突变的基因。Stanford 基因组技术中心的网址
http://insertion.stanford.edu/dhplc_genes1.html, 提供全部或部分利用DHPLC
筛查突变的基因列表,并提供相关疾病和引用文献的介绍。
DHPLC 技术最适于对含有大量外显子的基因,以及多基因疾病相关基因进
行突变筛查。这些基因及其相关疾病的例子可在表1 中找到,而更加全面的介
绍可在www.mutationdiscovery.com 中找到。该网站对遗传突变研究者们免费
提供超过8600 个人类基因的基因组DNA 序列,以及在这些基因中已检测到的
突变信息。在这些信息基础上,该网站还提供用于筛查这些突变的PCR 和
DHPLC 的实验方案。
遗传异质性在很多复杂疾病中具有重要的意义,而DHPLC 技术是研究遗
传异质性疾病相关基因突变的理想方法。一项关于沙-马-图病(进行性神经性腓
骨肌萎缩)(CMT)相关基因突变的研究报道是对上述观点的最完整的阐述[9]。
作者将利用DHPLC 技术对168 个CMT患者进行的基因(PMP22, MPZ, GJB1,
EGR2)筛查结果与直接测序的结果进行了比较。所有以前报道过的突变DHPLC
无一漏筛,而DHPLC 检测出的某些新突变连测序技术都无法检测出。为了确
定这些新突变,作者通过收集DHPLC 异源双链部分,加大了样品中突变等位
基因的含量,从而通过测序确定了突变类型。对于某些多表型疾病,如感觉神
经性耳聋,色素性视网膜炎和外周神经疾病等,DHPLC 技术也是一种理想的方
法,因为它们都有大量的疾病相关位点需要进行基因突变筛查。
DHPLC 突变检测技术的敏感性:
体细胞基因突变
直到不久以前,直接测序仍然被认为是突变检测的“金标准”。然而现在
基因突变频率低于20%就很难用测序方法检测到,这已是公认的事实[10]。
DHPLC 技术是通过区分同源和异源双链来进行突变检测的。这种方法与直接
DNA 测序相比更有利于突变等位基因的识别(图1)。已有文献报道DHPLC 技术
可从待检样品中检测到占总基因量0.5-5%的突变等位基因,且实验重现性很好
[11,12,13,14]。近来有两篇报道表明DHPLC 技术可从发生低水平体细胞遗
传镶嵌现象的结节状硬化患者标本中检测到TSC1 和TSC2 基因突变,而该种突
变用测序法完全检测不到[11, 12]。更深入的研究表明这种基因突变存在于
6-15%的患者的外周血淋巴细胞中。
体细胞遗传镶嵌现象指的是在一个特定器官中出现具有不同遗传性状的多
个体细胞群落。这种现象可由DNA 突变,DNA 的修饰性改变,染色体异常或
自发性遗传突变逆转等因素引起。这种现象含有孟德尔式和非孟德尔式基因异
常,而它最典型的例子就存在于癌症的发生过程中。Youssoufian 和Pyeritz 在他
们的文章中对这种遗传镶嵌现象进行了详尽的总结[15]。 漏筛这种遗传镶嵌现
象所造成的突变会导致基因突变发生频率的报告不准确,也会使遗传诊断发生
疏漏。而这种现象的筛查对检测肿瘤组织中的体细胞基因突变和异种组织线粒
体DNA 中的致病基因突变也是非常重要的。近来有报道表明利用DHPLC 技术
可从白血病患者P53 基因的外显子中筛查出突变频率低于3%的基因突变[13]。
而在一项利用DHPLC 技术对整个线粒体基因组进行突变筛查的研究中,频率
高于0.5%的突变都可被检出[14]。还有许多检测各种肿瘤癌基因突变的文献报
道也对DHPLC 技术的敏感性给予了肯定,其中一些研究内容请见表2。
虽然肿瘤是一种遗传病这种观点早已是公认的事实,但特定的DNA 遗传改
变和抗癌药物疗效之间存在关联才刚刚被认识到。未知突变的检测对于了解上
述的关联至关重要,而DHPLC 正是实现这个目的合适的技术。例如在对肿瘤
发病机制的研究中,在新发现的基因中寻找突变非常重要。Lipkin 在文章[16]
中报道利用DHPLC 技术,发现一种新的DNA 错配修复基因MLH3 在25%的
受检结肠癌患者样品中发生了基因突变,而此前的两项利用其它敏感性和准确
性都较低的方法进行的研究都认为MLH3 与结肠癌易感性无关。由此可见,
DHPLC 技术的
敏感性和准确性确实拥有较大的优势。而Smith 在他的文献[17]中报道了利用
DHPLC 技术对已知和未知的疾病相关基因进行突变筛查的情况。在这项研究
中,DHPLC 技术被用来筛查绝大部分APC 和P53 基因,因为突变有可能分散
在这些基因中。实验结果表明DHPLC 技术作为一种基因突变预筛手段,可以
极大地提高测序的效率。
利用DHPLC 技术分析DNA 甲基化
DNA 修饰性因素(如DNA甲基化等)在基因表达调控中的作用非常重要。
许多看家基因和超过40%的组织特异性基因在他们的启动子区域拥有CpG岛结
构,该结构很容易发生甲基化,从而对基因转录调控产生影响[18,19]。这些
CpG 岛结构在发生DNA 修饰后,对DNA 编码的具体影响还有待证明;但 DNA
甲基化与基因沉默之间的确存在关联,这一点可从大多数受测基因(约80%)
中得到证实[20]。而余下的20%受检基因在甲基化后表达水平增强,这些基因都
在第一个内含子或编码区域中含有CpG 岛结构。
关于DNA 修饰性因素参与癌症发生和发展的证据越来越多,而启动子甲基
化确实对许多肿瘤抑制基因的转录产生负性影响[21]。DNA 修饰也与其它许多疾
病有关,例如BWS[22], PWS[23], AS[22] 等综合征。环境因素对DNA 甲基化有
直接的影响,例如维生素B12缺乏会引起叶酸代谢紊乱,以及DNA 甲基化状态的
改变,而在肿瘤组织中维生素水平也会影响DNA 甲基化状态[25]。因此检测CpG
岛甲基化对我们了解基因调控与疾病发生发展的关系非常重要。
了解特定疾病过程中甲基化状态的重要性极大地促进了精确描述和量化
DNA 甲基化的实验方法的发展。一些常规的甲基化检测方法,如DNA 测序,以及
其它基于凝胶和PCR 技术的甲基化检测方法,都是费时费力,不适于进行大样
本实验。
而最近有些的报道表明利用DHPLC 技术进行甲基化检测可以避免重蹈其它方法
的覆辙[26,27,28,29,30]。
Deng 在他的文章[26]中介绍了一种PCR 扩增亚硫酸盐修饰的CpG 岛,然
后利用DHPLC 技术同时检测扩增产物中的CpG 岛甲基化和SNP 的方法,并用这
种方法对多种细胞系和胃癌细胞系中hMLH1 启动子,以及环氧化酶2(COX2)
启动子的甲基化状态进行了检测[26]。这种亚硫酸盐-DHPLC 技术可对纯合与杂合
样本中的同源与异源CpG 岛结构进行快速的甲基化和SNP 检测和定量。这种方
法的另一个优点是在扩增片段中同时检测出CpG 位点和SNP。两项相似的实验
都使用甲基化特异性PCR 和DHPLC 技术来分析三种人类印记基因的甲基化状态,
这三种基因分别是:AS 和PWS 相关的SNRPN 基因,以及BWS 相关的LIT1 和H19
基因[27,28]。利用这项技术可以在患有PWS 婴儿的样品中检测到低水平的细
胞镶嵌现象,这充分证明了该项技术的敏感性[27]。这种变异水平很低的细胞
系(血中低于8%)
用传统的分子生物学方法根本无法检测到。而这种检测低水平细胞镶嵌的能力
对于以遗传镶嵌作为部分显型表现的各种孟德尔和非孟德尔式遗传疾病的临床
诊断和预后有着重要的意义[15]。
另外一种基于DHPLC 技术的方法也被用来检测特定位点的CpG 岛甲基化
[29,30]。这种方法利用亚硫酸盐处理的基因组DNA 的PCR 产物,将单核苷酸
引物延伸与DHPLC 分离技术相结合,来区分甲基化和非甲基化的CpG 岛。而有
些CpG 位点是在对引物延伸产物进行多链化之后再进行分析的。利用DHPLC 技
术可对特定CpG 位点的甲基化进行量化分析。而对于已经明确甲基化对基因调
控影响的特定序列,使用DHPLC 技术对其进行分析是非常合适的。
DHPLC 在SNP 发现和确定研究中的应用
候选基因筛查
人类基因组中众多的DNA 多态性以及SNP 对基因功能的影响决定了深入
了解候选效应蛋白的遗传变异状况是非常必要的。在构建一个候选疾病基因的
遗传变异图谱时,首先用经典方法确定一个低分辨率的遗传位点,接下来再根
据参照样品(野生型)和各种受检样品建立一个高分辨率的SNP 图谱[31]。为
了实现上述目标应该在目的基因区域确定SNP 的位置和类型,这需要PCR 扩增
基因组DNA,并进行测序分析。但是SNP 的实质只是对功能相关研究很重要,
而并非是构建遗传图谱的关键。DHPLC 突变筛查技术很好地适应了遗传变异研
究的这一特点,它只检测DNA 序列差异,并不确定差异的实质。
利用DHPLC-SNP 筛查技术来确定一个功能基因可以采取两种途径[32]。
第一种方法,收集大量的候选疾病基因的样品,然后利用DHPLC 对可能发生
功能性SNP 的编码序列进行筛查。这种方法的前提是与一种遗传病表现型相关
的基因中应有一个或多个疾病相关的突变位点,因此致病基因突变也应相对频
繁地出现在有相应的疾病表现型的样品中。而上述方法对筛查序列的限制也会
导致漏筛位于非编码调节区域的序列变异。在第二种相对全面的方法中,一个
基因的全基因组序列被系统地进行突变筛查。这样做的优点是在样本量充足的
情况下,漏筛功能性多态的几率较小。上述两种基于DHPLC 的方法都能极大
程度上降低SNP 筛查的工作量,进而对人类疾病相关遗传位点的构图产生重要
的影响。下面将简要介绍几篇利用DHPLC 技术进行SNP 筛查的文献报道。
充血性心衰
Lynch和他的同事们在文章[33]中表示充血性心衰(CHF)相关的G 蛋白和
下游信号传导通路蛋白的遗传变异信息存在极大的缺陷。在这项研究中,他们
检测了编码信号传导蛋白的基因,以确定新发现的和已报道的SNP 的发生频率。
通过DHPLC 和确证性双链DNA测序的方法,他们筛查了96-144 个CHF 病人
的9 个主要信号传导基因的56 个编码外显子,并且发现了17 个新的和8 个报
道过的同义SNP, 以及一个新的非同义SNP。由于对NCBI和Celera 数据库最
初的实验中漏筛了多个SNP 很感兴趣,他们又检测了10 个已报道过的非同义
SNP,结果在74-91 个CHF 病人样品中并未发现这些SNP。他们将实验结果与
NCBI 和Celera 的数据进行比较,发现数据库中56%的SNP 并未在他们的样品
中发现,而实验中发现的SNP 中的69%并不存在于数据库中。这项研究表明绝
对性地将现有数据库作为多态标记的来源,并只使用这些标记物会导致错误的
实验结果。另外一项最新的研究[34]表明SNP 数据库中关于25 个G 蛋白耦连受
体的数据只有32%能在样本量为60 的实验中被确证。这说明利用DHPLC 对现
有数据库中的SNP 数据进行确证是一种在更大规模实验前对标志物进行评估的
可靠方法。
神经精神疾病
基因编码区的SNP 可被用来做关联实验,以确定复杂疾病的遗传基础[35,
36]。而这种实验的成功与否极大程度上取决于疾病相关等位基因的频率以及它
们在不同种族人群中的分布[37]。如果待测序列的高危等位基因频率很低,那么
直接确定突变序列基因型的方法就不适用了。以往对基因的分析表明大多数基
因突变频率很低(<0.05),而且低于75 的样本量也会限制检测稀少等位基因的
能力[38]。最近有文献[39]介绍了一项研究,利用DHPLC 对神经精神疾病相关
的两个基因的编码区和剪接结合部的突变序列(频率很低)进行大样本量筛查
(n=450)。结果表明这两种基因,SLC6A4(编码5-羟色胺转运蛋白)和SLC18A2
(编码血管单胺转运蛋白),在等位基因变异的数目和频率方面存在明显的差
异。如果将这样的变异基因比较扩展到更大范围的基因中去,那么就有可能确
定特定形式的遗传变异与基因功能之间的关联。
阿尔茨海默病
阿尔茨海默病(AD)是一种渐进性神经退行性病变,它是由复杂的遗传和环
境因素共同造成的。一项成功的SNP 研究确定载脂蛋白E(APOE)基因(等
位基因4)是一个易感性位点,可能增大迟发性阿尔茨海默病(LOAD)的发病
几率[40]。到目前为止,这是唯一的被证实的LOAD 易感性标志。一项最近的
研究对位于12 号染色体的编码氧化低密度脂蛋白(LDL)受体1(OLR1)的基
因进行分析[41]。研究者利用DHPLC 对50 名AD 患者的全部OLR1 外显子和
内含子/外显子交界部位进行了突变序列筛查。结果有三种新的遗传变异被鉴别
出来,它们全部位于非编码区域。在对超过800 个LOAD 病例的基因型分析表
明上述的SNP 与AD 之间存在明显的关联,其中最重要的是位于非APOE4 区
域的3’-UTR SNP。关于遗传变异对早发性阿尔茨海默病(EOAD)和LOAD 已
有大量报道( 见阿尔茨海默病突变数据库
http://molgen-www.uia.ac.be/ADMutations/)。
例如编码淀粉样前体蛋白的基因(APP)和编码早老素的基因(PSEN1, PSEN2)
发生突变会通过改变γ-分泌酶活性一起少见的早发性阿尔茨海默病(EOAD)。
近来一种名为nicastrin(NCSTN)的跨膜糖蛋白被确定是γ-分泌酶复合物的一部
分,而后者可切割淀粉样前体蛋白(APP)[42]。NCSTN 被定位于1q23,一个
与LOAD 相关的区域。近来有一项研究利用DHPLC 对两名荷兰的EOAD 或
LOAD 患者进行了NCSTN 基因突变检测[43]。结果在NCSTN 基因中发现了14
种新的SNP,其中之一可能能增大EOAD 的发病几率。
心脏病
近来有大量的研究通过对突变序列的鉴别研究各种心脏疾病的相关基因。
家族性肥大性心肌病(HCM)是一种常见的常染色体遗传病,病变部位为心肌
小节。在9 种编码肌小节蛋白的基因中发现的突变已经证明与HCM 相关[44]。
最常见的突变基因是编码β-肌球蛋白重链的MYH7 基因,而功能相关性突变发
生在编码区域的5’端部分。近来有研究利用DHPLC 技术来筛查MYH7 基因编
码酶解肌球蛋白轻链(LMM)的编码区3’端部分。结果研究者发现了破坏MYH7
基因功能的突变[45],这说明只有进行全基因突变筛查才能保证正确的诊断。另
外超过1/3 的HCM 病例没有发现任何突变,无论是在已知的肌小节基因,还是
在与心脏能量稳态相关的其他基因中,结果都一样。利用DHPLC 技术对重症
HCM 家系的编码AMP依赖蛋白激酶的γ2 亚基的PRKAG2 基因进行的突变筛
查证明能量耗竭是心肌功能失常的主要成因[46]。近来对HCM 致病基因的遗传
异质性的深入研究[44,47]表明扩大对HCM 的遗传检测是非常有必要的。
近来还有许多关于其他心肌疾病的候选基因筛查研究。如对位于1q42-q43
的一些疾病相关基因进行DHPLC 突变筛查[48]。结果在一个患有致心律失常性
右心室心肌病2(ARVD2)的家系中发现了一种编码心脏ryanodine 受体(RYR2)
的基因突变。这些突变的识别为进行症前诊断提供了一个标志物,也为早期监
测和治疗干预提供了机会。这些发现也有可能促成更特异有效的药物干预。
自身免疫病和炎症
另一个焦点研究领域是筛查自身免疫病和炎症相关的基因突变。利用
DHPLC 技术,研究者已识别出了多种致病基因突变如PAPA 综合征(脓性无菌
性关节炎,坏疽性脓皮病和粉刺),和家族性复发性关节炎(FRA)(一种主要
影响皮肤和关节组织的早发性遗传病)的致病基因突变 [49]。而研究者指出这
些突变影响了正常炎症反应的信号传导通路,因此这类自身免疫病有可能与普
通的炎症性疾病如风湿性关节炎,炎性肠病等有相同或相似的病因。利用
DHPLC 技术,研究者也在编码胸腺特异性丝氨酸蛋白酶(PRSS16)的基因中
发现了一些SNP,这些基因变异位于HLA 复合体中,后者包含有多种免疫疾病
的相关基因[50]。这些基因突变中的一部分有生物学作用,有必要深入研究它们
的疾病相关性(如与糖尿病的关联)。
蛋白水解酶和它们的抑制剂在维持免疫系统稳态过程中发挥重要的作用。
因此这些蛋白的突变形式有可能产生显著的生物学后果。利用DHPLC 技术,
研究者在编码丝氨酸蛋白酶抑制物Kazal-5 蛋白(LEKT1)的SPINK5 基因中
发现了一组突变,而这种基因是一种常染色体隐性遗传皮肤病Netherton 综合征
的缺陷基因[51]。LEKT1 是第一个被发现参与免疫疾病的丝氨酸蛋白酶抑制物。
现已发现许多编码与LEKT1 类似的丝氨酸蛋白酶抑制物和激活物的基因突变
与疾病相关,如Kazal-1 胰蛋白酶抑制物与慢性胰腺炎(CP),以及组织蛋白酶
C 与牙周疾病等。
CP 是一种严重时可能危害生命的疾病。在过去的几年中,已有三种基因被
发现与CP 有关,它们是CFTR, PRSS1 和PST1[52]。近来有一项研究利用
DHPLC 技术在39 个病人中对上述三种基因的整个编码区域和剪接结合部位进
行突变状况的筛查[53]。结果表明约30%的受检者至少有一种基因发生一种突
变。但这不包括新发现的不普遍的基因突变,而这些突变中的一些还有可能具
有功能意义。只有三个病人至少有两种基因中发生了突变。这些少见的病例表
明在CP 易感性位点之间存在某种关联。这项研究也提供了一次对一种常见疾病
的不同基因突变的杂合状态进行研究的独特机会。
遗传变异研究在临床治疗中的意义
药物代谢和耐药性
遗传药理学是一种研究基因在个体对药物治疗和环境因素的生物学反应中
所起作用的学科。不同个体对药物反应存在固有的差异,一些常用药物在几种
重要疾病中的作用请见表3[54]。个体对药物的反应直接受个体的基因型和生活
形式的影响。确定个体的基因突变类型无论对科学家或临床医生来说都是一项
艰巨的任务。但是这种研究却可以区别可能与不可能发生药物反应的患者,以
及识别那些可能发生严重反应的高危患者。因此无论从用药的有效性或安全性
来说,对患者进行遗传实验,以预测他对一种特殊药物的反应十分有必要。这
种研究对将带有特定遗传药理学标记的患者分组进行临床实验也有很大的帮
助。
编码细胞色素,甲基转移酶等代谢酶类的基因多态性对药物反应有显著的
影响。这些酶类参与细胞对药物的吸收,分布,降解和清除等活动。因此确定
影响药物代谢的突变等位基因可以帮助临床医生预测患者对治疗的反应。
DPYD
一项介绍DHPLC 技术筛查编码二氢嘧啶脱氢酶(DPD)的基因DYPD 的
报道证明了识别突变等位基因的遗传药理学价值[55]。这种酶可以催化抗癌药物
5-氟尿嘧啶(5-FU)代谢的限速步骤。DPD 缺乏会导致5-FU 用药后的严重毒性,
因此在使用5-FU 进行化疗之前,确定癌症患者的DPD 遗传状态具有重要的价
值。然而DYPD 基因的复杂性和大小(23 个外显子,150-950kbp)使许多研究
者对研究DPD 缺乏的遗传基础望而却步。一项利用DHPLC 技术对上述基因的
筛查研究检测到全部21 个以前有报道的基因突变,并且鉴别出了纯合与杂合基
因型,证明DHPLC 是一种能够准确,敏感,低消耗地检测具有重要临床意义
的基因突变的方法。DHPLC 的所有这些特点对于以复杂基因(如DYPD)突变
筛查为目的的病人或自然人群研究是非常合适的
编码TPMT 的基因
巯基嘌呤S-甲基转移酶(TPMT)是一种位于细胞质,催化巯基嘌呤S-甲
基化的酶类。巯基嘌呤是一种免疫抑制剂,可被用来治疗急性淋巴细胞白血病
以及风湿性关节炎[56]。编码TPMT 的基因多态性对巯基嘌呤的代谢有严重的
影响,目前已有10 种影响表型的突变等位基因被识别出来[57]。一种利用
DHPLC 快速筛查TPMT相关突变的临床检测方法已经形成[58]。在一项相关研
究中,有98 份来自于正在接受或接受过巯基嘌呤治疗的人群的DNA 样品被用
来筛查TPMT突变。通过直接测序证实,DHPLC可以鉴别出样品中全部(100%)
突变等位基因。DHPLC 对TPMT 相关突变的评估是建立在清晰的洗脱结果基
础上的。如果拥有一套参照数据,DHPLC 的洗脱结果可被用来预测序列突变的
类型[59]。可见DHPLC 这种自动技术可被临床实验室用来确定TPMT 等基因
突变的基因型,以及筛查新的突变。
Imatinib
对从事药物研发基础研究的工作者来说,DHPLC 是一种有价值的辅助工具。
例如近来有研究表明在对白血病患者的治疗过程中,BCR-ABL 激酶激活位点的
基因区域的多种突变对酪氨酸激酶抑制剂Imatinib 的耐药性有影响[60]。这项重
要的发现对于确定需要改变治疗策略的耐药性水平有重大意义。Imatinib 的其它
目标以及酪氨酸激酶抑制剂的其它作用对象的耐药性机制可能与上述研究结果
相似。最近有一项研究利用DHPLC 技术对Imatinib 的一个作用对象c-kit 进行
了突变筛查[61]。研究结果显示不同时期的胃肠道基质瘤(GIST)都有c-kit 基
因突变。这些突变在早期良性的胃肠道基质瘤中存在率较高,这说明c-kit 在早
期GIST 发展中起作用。重要的是,这些带有突变的GIST 类型已被加入了
Imatinib 的适用范围中。虽然c-kit 并不是GIST 由良性转向恶性的标志,但它
却是有用的耐药性指标。可见准确而敏感的对酪氨酸激酶基因靶点的突变研究
能够在不存在类似耐药性的新型抗癌药物研发过程中起到辅助的作用。
VEGF
参与血管生成的基因也是目前深入研究的重要药物靶点。人类血管内皮生
长因子(VEGF)由肿瘤细胞分泌,以自分泌的形式作用于内皮细胞。最近有人
对人类结肠直肠癌中VEGF 的基因突变情况进行了研究[62]。结果发现了4 个剪
接结合部变异位点和6 个新的基因突变。这些突变可能在肿瘤-宿主反应的生物
多样性方面具有重要影响,也可能对药物靶点研究很有价值。
上面这些文献报道为识别和确定与发病危险性,药物反应和耐药性相关的
基因变异提供了理论和应用的介绍。而分析标志等位基因(基因型)和临床特
征(表现型)之间的关系对治疗策略的制定有重要的意义。相信在不久的将来,
对临床相关基因突变的准确识别能帮助医务工作者制定针对每个病人的独特治
疗方案,从而提高对疾病的治疗和控制水平。
总之,近几年来,DHPLC 技术飞速发展,利用DHPLC 对大量的疾病相关
基因突变进行筛查,如下表:
Table 1. Recent genes associated with inherited disorders scanned for mutations by
DHPLC.Transgenomic
Gene MIM
number1
Exons Disease Reference
ABCA4(ABCR) 601691 50 Macular degeneration 〔71〕
ADRB2 109690 Intron-less Asthma; chronic obstructive pulmonary disease;
CHF
〔33··,72〕
ALAP 145500 - Essential hypertension 〔73〕
ALG3 601110 - Congenital disorder of glycosylation 〔74〕
ALG6 604566 - Congenital disorder of glycosylation 〔74〕
APM1 605441 3 Type II diabetes 〔75〕
APOD 107740 5 Cardiovascular; lipid metabolism 〔76〕
ATPB7 606882 21 Wilson’s disease 〔77〕
CFTR(ABCC7) 602421 27 CF; idiopathic CP 〔8·,53,78,79〕
CHAC 200150 73 Chorea-acanthocytosis 〔80〕
CHX10 142993 5 Microphthalmia; anophthalmia 〔81〕
CLCN1 118425 23 Myotonia 〔82〕
CRB1 604210 11 Leber congenital amaurosis 〔83〕
CRX 602225 3 Leber congenital amaurosis 〔83〕
CPM1 603503 9 Congenital disorder of glycosylation 〔74〕
DPYD 274270 23 5-FU toxicity 〔55··〕
DRD2 126450 7 CMT disease 〔84〕
DRD3 126451 8 Schizophrenia 〔85〕
EGR2 129010 2 CMT disease 〔9··〕
F8C(Factor VIII) 306700 24 Hemophilia A 〔86,87〕
FBN1 134797 65 Marfan syndrome and related connective tissue
disorders
〔88,89〕
GAD2 138275 17 Type I diabetes 〔90〕
GJB1 304040 2 CMT disease 〔9··〕
GJB2 121011 2 Hereditary hearing loss 〔91,92〕
GNA11 139313 3 CHF 〔33··〕
GNAQ 600998 Intron-less CHF 〔33··〕
GNAS 139320 13 CHF 〔33··〕
Gene MIM
number1
Exons Disease Reference
GRIN1 138249 21 Schizophrenia 〔93〕
GRIN2A 138253 14 Schizophrenia 〔93〕
GRIN2B 138252 13 Schizophrenia 〔93〕
GRIN2C 138254 13 Schizophrenia 〔93〕
GRIN2D 602717 13 Schizophrenia 〔93〕
HBB 141900 3 ? -Thalassemia 〔94,95〕
HFE 235200 7 Hereditary hemochromatosis 〔96〕
HPRP3 601850 - Autosomal dominant retinitis pigmentosa 〔97〕
K9 144200 6 Epidermolytic palmoplantar keratoderma 〔98〕
KCNE1 176261 3 Congenital long QT syndrome (LQTS) 〔99〕
KCNE2 603796 1 Congenital LQTS 〔99〕
KCNH2 152427 15 Congenital LQTS 〔99〕
KCNJ10 602208 2 Type II diabetes 〔100〕
KCNQ1 192500 16 Congenital LQTS 〔99〕
KvLQT1 220400 - Jervell and Lange-Nielsen syndrome (JLSN1) 〔101〕
LDLR 143890 18 Familial hypercholesterolemia 〔102,103〕
LHCGR 152790 11 Leydig cell hypoplasia 〔104〕
LIPC 151670 9 Coronary artery disease 〔105〕
LPL 238600 10 Coronary atherosclerotic heart disease 〔105〕
MAG 159460 12 Multiple sclerosis 〔106〕
MAPK1 176948 8 CHF 〔33··〕
MC4R 155541 Intron-less Early-onset obesity 〔107〕
MIF 153620 3 Systemic-onset juvenile idiopathic arthritis 〔108〕
MLC1 605908 12 Schizophrenia 〔109〕
MPI 154550 - Congenital disorder of glycosylation 〔74〕
MPDU1 604041 7 Congenital disorder of glycosylation 〔74〕
MTM1 310400 15 X-Linked myotubular myopathy 〔110〕
MYH7 160760 39 Familial HCM 〔44,45〕
MYOC 601652 3 Open angle glaucoma; ocular hypertension 〔111〕
NAB1 600800 7 Peripheral neuropathy 〔112〕
NAB2 602381 7 Peripheral neuropathy 〔112〕
NCSTN 605254 17 AD 〔43〕
NTF3 162660 - Schizophrenia 〔113〕
OA1 300500 9 X-Linked ocular albinism 〔114〕
OPRM1 600018 3 Heroin addiction; idiopathic generalized epilepsy 〔115,116〕
PAX6 106210 14 Microphthalmia; anophthalmia; coloboma 〔81〕
PCDH8 603580 3 Schizophrenia 〔117〕
PKD1 601313 4 Autosomal dominant polycystic kidney disease
(PKD)
〔118〕
PKD2 173910 15 Autosomal dominant PKD 〔118〕
PKHD1 606702 67 Autosomal dominant PKD 〔119,120〕
PMM2 601097 8 Carbohydrate-deficient glycoprotein syndrome type
1A
〔74〕
PMP22 601097 3 CMT disease 〔9··〕
PRSS1 276000 5 Hereditary pancreatitis; idiopathic CP 〔53〕
PRSS16 607169 12 Autoimmunity 〔50〕
PTPN11 176876 14 Noonan syndrome; :ROPARD syndrome;
Cardiofaciocutaneous syndrome
〔121,122〕
RAB3A 179490 5 CHF 〔33··〕
RAB4 179511 8 CHF 〔33··〕
RAB5C 604037 5 CHF 〔33··〕
RAD 179503 8 CHF 〔33··〕
RPE65 180069 14 Leber congenital amaurosis 〔83〕
RPGRIP1 605446 15 Leber congenital amaurosis 〔83〕
SIX3 603714 2 Microphthalmia; anophthalmia; coloboma 〔81〕
SLC6A4 182138 13 Anxiety disorders 〔39··〕
SMN1 600354 8 Spinal muscular atrophy 〔123〕
SPINK1 167790 4 Idiopathic CP 〔53〕
SPINK5 605010 28 Netherton syndrome 〔51〕
SUOX 272300 3 Sulfocysteinuria 〔124〕
TGM2 190196 13 Maturith-onset diabetes (MODY) 〔125〕
TNFRSF1A 191190 10 Tumor necrosis factor receptor-associated periodic
syndrome
〔126〕
TSC1 605284 21 Tuberous sclerosis 〔11·,127〕
TSC2 191092 41 Tuberous sclerosis 〔11·,12·,127〕
VHL 193300 3 Hippel-Lindau disease 〔128〕
WFS1 606201 8 Wolfram syndrome 〔129〕
Table 2. Cancer genes recently scanned for mutations by DHPLC.Transgenomic
Gene MIM
number1
Exons Disease Reference
APC 175100 15 Colorectal cancer 〔17··,130-133〕
ATM 208900 62 Hereditary, sporadic breast and ovarian cancer 〔134〕
AXIN1 603816 10 Hepatocellular carcinoma 〔135〕
AXIN2 604025 2 Hepatocellular carcinoma 〔135〕
BRCA1 113705 23 Hereditary breast and ovarian cancer 〔7·,136,137〕
BRCA2 600185 28 Hereditary breast and ovarian cancer; sporadic
exocrine pancreatic cancer
〔136-138〕
CDH1 192090 16 Hereditary prostate cancer; sporadic ductal and
lobular breast cancer
〔139,140〕
CTNNB1 116806 16 Uveal melanoma; hepatocellular carcinoma 〔135,141〕
DBC2 - - Breast cancer 〔142〕
ELA2(NE) 130130 5 Lung cancer 〔143〕
FAM10A4 606796 - B-cell chronic lymphocytes leukemia 〔144〕
?-GCS - - Lung cancer 〔145〕
GSTP1 134660 7 Lung cancer 〔145〕
GSTM1 138350 8 Lung cancer 〔145〕
GSTT1 600436 5 Lung cancer 〔145〕
INK4A 600160 3 Melanoma 〔146〕
KIT 606764 21 GISTs 〔61··〕
K-ras 601599 6 Colorectal cancer 〔17··〕
MET 164860 21 Papillary renal carcinomas 〔147〕
MLH1 120436 19 Hereditary nonpolyposis colorectal cancer;
endometrial caricinoma
〔148,149〕
MLH3 604395 13 Colorectal cancer 〔16·〕
MSH2 120435 16 Hereditary nonpolyposis colorectal cancer;
endometrial caricinoma
〔148,149〕
MUTYH 604933 16 Hereditary nonpolyposis colorectal cancer 〔132,133〕
MYO18B Lung cancer 〔150〕
NBS1 602667 16 Acute lymphoblastic leukemia; colorectal
carcinoma
〔151〕
P14(ARF) 600160 3 Uveal melanoma 〔141〕
P15(INK4B) 600160 3 Uveal melanoma 〔141〕
P16(INK4A) 600160 3 Uveal melanoma 〔141〕
PTEN/MMAC1 601728 9 Endometrial carcinoma; neuroblastoma 〔148〕
RNASEL 180435 6 Prostate cancer 〔152〕
SMAD4 607010 13 Uveal melanoma; pancreatic cancer 〔141〕
TGFBR2 190182 7 Uveal melanoma 〔141〕
TP53(p53) 191170 11 Various cancers 〔13,17··,141〕
耐药性相关基因突变的微生物学识别和检测
随着耐药性微生物的大量出现,针对传染性病原体的治疗策略制定和药物
研发变得越来越难。抗微生物治疗面临挑战的一个重要原因就是缺乏能够准确
识别致病微生物和耐药基因的有效临床手段。然而近来发展起来的能识别病原
体和研究微生物抗药性的分子生物学方法又为抗微生物治疗和药物研发建立了
希望。下面将对利用DHPLC 技术,成功识别致病细菌以及细菌耐药性基因突
变的研究进行简要的总结。
从临床治疗的角度来看,准确确定致病微生物的种类具有重要的价值,它
可以保证用药的有效性。Hurtle 在他的文章[63]中指出DHPLC 技术能有效的识
别病原微生物。作者利用万能PCR 引物从多种细菌的转录16S 核糖体RNA 的
基因中产生出一条320-bp 的扩增片段。将这些来自不同种类细菌的扩增产物与
参照物混和后进行DHPLC 检测,会产生一个独特的色谱结果。而该结果可以
作为鉴定细菌种类的分子指纹。
在一场大范围疫情爆发中,从菌株水平确定病原菌是至关重要的。只有了
解了致病菌株才能正确选择抗菌药物。Shlush等指出将PCR, DHPLC 和多位点
序列分型(MLST)技术相结合可以从菌株水平识别病原菌[64]。MLST 技术利
用位于非连锁位点的管家基因来进行微生物分型[65]。研究人员PCR 扩增管家
基因区域,并将扩增产物与对照物混和。通过DHPLC 检测,产生每个管家基
因的特定的色谱结果[64]。实际上DHPLC 的分析能力在没有测序的情况下远远
超过MLST。
对已知和未知的耐药性基因突变的检测对于评估现有和新开发的抗生药物
至关重要。而DHPLC 可以准确地检测耐药性相关基因突变。一项筛查肠炎沙
门菌抗quinolone gyrA 基因突变的研究[66]表明,在准确性方面,DHPLC 远远
超过了其它检测单碱基突变的分子生物学方法,如单链构象多态性,和轻环
PCR-gyrA 杂交突变检测技术(GAMA)等。Hannachi-M’Zali 也在文章中[67]指
出DHPLC 是检测甲氧西林耐受的金黄色葡萄球菌的抗quinolone gyrA,gyrB,
grlA 和grlB 基因突变的有效方法。而Cooksey 则利用DHPLC 技术建立了抗结
核药耐受性相关基因突变筛查的常规方法[68]。上面的研究表明将DHPLC 与其
它分子生物学方法结合使用,可以了解引起耐药性的基因突变,从而促进特异
性药物的研发。
DHPLC 技术在微生物学研究中的应用并不仅限于细菌相关的工作。它也可
被用在真菌,病毒和寄生虫等研究领域,以识别微生物和检测抗药基因突变。
使用DHPLC 技术对抗生药物的研发由三点益处。第一,DHPLC 技术可以可靠
地从种属和菌株水平识别微生物,弥补传统的表型识别方法的缺陷。第二,
DHPLC 技术可以高度准确地检测耐药基因突变。第三,DHPLC 技术具有从混
合微生物群落中识别突变种类的能力。从异源混合物中检测遗传突变基因对于
监测感染过程中病原微生物耐药性的变化至关重要。上述观点的一个重要例证
是人免疫缺陷病毒1(HIV-1)的进化过程[69]。在活体标本中发现了由主要HIV-1
蛋白酶基因和少数突变基因组成的复杂的病毒准种。在没有选择压力的情况下,
耐药突变基因的出现频率低于野生型基因。而抗药选择可以使这种突变基因成
为主要基因型。这种关于HIV-1 病毒准种的分析可使研究者深入了解病毒进化
过程中病毒群落的复杂变化。但是这种病毒群落的分析是一项艰巨的任务,因
为低频率的突变很难通过测序检测到,亚克隆病毒PCR 产物的测序结果会偏向
频率高的突变类型[70]。DHPLC 等技术能提高检测少数耐药突变的能力,进而
促进HIV-1 等传染病的治疗。
结论
由于准确,敏感的DHPLC 突变检测技术的发展,新发现的基因突变数目
正在快速增长。DHPLC 突变检测技术对人类疾病发生,易感性和治疗相关基因
突变以及连锁标志物的识别做出了重要的贡献。由于环境,生物学和进化因素
等不同选择机制的使用,新发现的遗传等位基因将越来越多。而发现与肿瘤基
因,病原微生物的病毒因素,以及特定药物靶点相关的新的低水平的基因突变
将是一项持久性的任务。采用DHPLC 技术筛查基因突变,将会使这项任务更
好地进行,并促进高效的药物研究和开发。
致谢
在此我想感谢 Drs Joseph Breen, George Hong, Phillip Eastlake, Felix
Frueh 和Mario Noyer-Weiner 等对这篇文章的创作所付出的饱含思想性的努
力。我也想感谢Amanda Miller-Lindholm 和Carla Shaw-Bruha 对表1,2 的制
作所给予的帮助。
参考文献