SNP 检测方法及研究现状
互联网
SNP 是指基因组水平上由单个核苷酸的变异所引起的DNA 序列多态性,在群体中的发生频率不小于1 %。包括单个碱基的转换、颠换、插入和缺失等。所谓转换是指同型碱基之间的转换,如嘌呤与嘌呤( G2A) 、嘧啶与嘧啶( T2C) 间的替换;所谓颠换是指发生在嘌呤与嘧啶(A2T、A2C、C2G、G2T) 之间的替换。
依据排列组合原理,SNP 一共可以有6种替换情况,即A/ G、A/ T、A/ C、C/ G、C/ T 和G/ T ,但事实上,转换的发生频率占多数,而且是C2T 转换为主,其原因是Cp G的C 是甲基化的,容易自发脱氨基形成胸腺嘧啶T ,Cp G 也因此变为突变热点。
SNP 在动物基因组中分布广泛,每一个核苷酸发生突变的概率大约为10 - 9 。由于选择压力,SNP在单个基因、整个基因组中以及种群间的分布是不均匀的。SNP 在非编码区中要多于编码区,而且在编码区也是非同义突变(有氨基酸序列的改变) 的频率比其他方式突变的频率低得多。
而基因间,同一种基因中的编码SNP (coding SNP ,cSNP) 的数目也不相同,可从0~29 个不等。多项研究同时发现不同种族间SNPs 的数目也是不同的,非洲人群及非裔种族中SNPs 数量最多,而其他种群的SNPs 要少得多,因此通过比较亚群间等位基因的频率将有助于阐明种族的结构和进化。
人们对SNP 的研究方法进行了许多探索和改进。
SNP 分析技术按其研究对象主要分为两大类,即:
①对未知SNP 进行分析,即找寻未知的SNP 或确定某一未知SNP 与某遗传病的关系。
检测未知SNP 有许多种方法可以使用,如温度梯度凝胶电泳( TGGE) 、变性梯度凝胶电泳(DGGE) 、单链构象多态性(SSCP) 、变性的高效液相色谱检测(DHPLC) 、限制性片段长度多态性(RFL P) 、随机扩增多态性DNA(RAPD) 等,但这些方法只能发现含有SNP 的DNA 链,不能确知突变的位置和碱基类别,要想做到这一点,必须对那些含有SNP 的DNA 链进行测序。
②对已知SNP 进行分析,即对不同群体SNP遗传多样性检测或在临床上对已知致病基因的遗传病进行基因诊断。筛查已知SNP 的方法有等位基因特异寡核苷酸片段分析(ASO) 、突变错配扩增检验(MAMA) 、基因芯片技术(gene chips) 等。
由于人类基因工程的带动,许多物种都已开始了基因组的项目,并建立了大量数据库,比较这些来自不同实验室不同个体的序列,就可以检测到SNP。
目前,可供利用的公开SNP 网上资源主要包括:
①由美国国立卫生研究院( National Institutes of Health ,NIH) 提供的主要是与癌症和肿瘤相关的候选SNP 数据库: http :/ / cgap. nci. nih. gov/ GAI ;
②由NIH 开辟的适于生物医学研究的dbSNP 多态性数据 :http :/ / www. ncbi. nlm. nih. gov/ SNP ;
③德国的HGBAS 网站提供的人类SNP 数据库:http :/ / hgbas. Cgr. ki. sei 等。另外,日本建立了J STSNP 数据库:http : / / snp. Ims. utolkyo. ac. jp ;我国也于2001 年底启动了“863”计划,进行中华民族基因组SNP 系统目录的构建与研究 。
SNPs 研究现在正处于发展之中,虽然它有很好的前景,但目前仍存在不少问题。
1.复杂疾病相关分析中的问题
在Skok loster 举行的国际SNP及复杂基因分析会议上透露出许多问题 , 利用SNP 寻找致病基因的工作并不象最初想象的那样简单。
研究者除需要大量的SNPs,有时需要弄清被研究人群的历史,如他们的迁移模式等,在对心脏病危险因素L PL 基因的研究中, 由于减数分裂中的基因重组, 使SN P的关联分析很困难; Ro salind Harding 用SN P s 研究镰刀细胞贫血的B球蛋白基因时也遇到了困难,她认为研究者除依靠SN P 外,还需知道疾病的模式及被研究人群的历史。
2.技术问题
目前虽然有大量检测SNP 的方法, 但大都价格昂贵,速度较慢,这限制了其在法庭科学中的应用,所以迫切需要有低成本, 高生产率的新方法涌现。
3.SNP 命名问题
目前没有一个统一标准的命名方法, 这对于Y2SN P 来说尤为紧迫,由于不同SNP由不同实验室测定, 现在至少存在6 种不同的命名系统。