SNP 研究概述
互联网
SNPs是指DNA序列上发生的单个核苷酸碱基之间的变异,在人群中这种变异的发生频率至少大于1%, 它是基因组中存在的一种数量非常丰富的变异形式,占人类基因组中遗传多态性的90%以上。针对不同人种基因组的测序结果表明,在人类群体中存在大约1000万个SNP位点,在公共数据库中至少有500多万个SNPs已被报道,SNPs在基因组的分布密度达到每300-500个碱基就存在一个SNP。
1、SNPs检测技术的进展
随着分子生物学技术的飞跃发展, SNPs基因分型技术和方法不断涌现。虽然经典的一些检测SNPs的技术,如限制性片段长度多态性(restriction fragment length polymorphism, RFLP)和单链构象多态性(single-strand conformation polymorphism, SSCP)等技术仍在实践中广泛使用,但一些高灵敏度、高通量的基因分型方法日益受到重视。
这些检测技术包括:TaqMan探针法、SNPlex基因分型法、连接酶检测反应法(ligase detection reaction, LDR)、焦磷酸测序法、DNA芯片/阵列分析法、微球法(Illumina),以及质谱分析和温控高效液相色谱法,可以满足大样本及多SNPs位点的基因分型要求。
2、人类基因组单体型图
虽然人类基因组SNPs数量众多,但是染色体上相邻SNPs的等位位点倾向于以一个整体遗传给后代,这些位于染色体上某一区域的一组相关联的SNP等位位点被称作单体型(haplotype)。大多数染色体区域只有少数几个常见的单体型(每个具有至少5%的频率),它们代表了一个群体中的大部分多态性。一个染色体区域可以有很多SNP位点,但是少数几个标签SNPs(TagSNPs)就能够提供该区域内大多数的遗传多态模式。
人类基因组单体型计划通过对约100万个SNPs进行基因分型,拟构建人类DNA序列中多态位点的常见模式。人类基因组单体型图谱的逐渐绘制完成,提供了详尽的人类DNA序列的变异信息,对人类个体遗传背景的研究提供了强大的机遇和挑战。
3、生物信息学的发展
在功能基因组时代,不断产生的海量信息极大的促进了生物信息学这一新兴学科的发展。各大生物信息数据库存在的基因组全序列信息为SNPs的研究提供了极大的便利:例如通过再测序手段对SNPs的存在及频率信息进行确定,对不同人群进行SNPs的基因分型都需借助这些序列信息才能得以进行;同时,针对SNPs进行连锁分析、单体型构建以及标签SNPs寻找的生物信息软件也不断推出;而且,功能基因组学的发展甚至开始尝试对SNPs进行功能学预测,比如预测启动子SNPs位点与转录因子结合的改变,编码区SNPs对蛋白质的空间结构,生物功能的影响等,这对我们在浩繁的人类SNPs中选择潜在功能性的SNPs位点进行研究具有极大的帮助。
4、从SNPs的关联研究到功能学探讨
随着SNPs检测技术的进展,SNPs在人群中的检测日益得到广泛应用,特别是对于当前多基因复杂疾病如肿瘤、冠心病的遗传易感性的探讨,传统的以家系为基础的连锁分析在检测能力上已经有了明显的局限性,而病例-对照等易于开展的关联性研究方法有显著的优势。
因此,近几年探讨SNPs作为复杂性疾病的遗传标记的关联性研究大量涌现。
但是即使对于同一SNP位点与相同疾病的关联性研究,不同研究中心的结果往往也存在很大差异甚至完全相反];而且,与疾病具有显著关联的SNPs到底是发挥功能性作用,或者仅仅是与功能性SNPs相连锁的遗传标记失甚至二者只是某种联系上的假象,这都需要进行功能学研究来加以证实。
预计引起细胞功能学改变的SNPs在人类所有SNPs中只占极小一部分(约五万到二十五万个SNPs),大多仅仅在疾病发生过程中介导低度或中度的效果,主要包括分布在基因启动子区域可能发挥调节转录效应的SNPs(regular SNPs, rSNPs)和蛋白质编码区域引起编码氨基酸改变的SNPs(非同义SNPs或错义SNPs)。
当前分子生物学技术的进展推动了SNPs功能学研究的深入,如比较成熟的对于启动子区域SNPs功能学研究技术包括:
①报告基因转染技术,这一技术主要用于研究启动子SNPs对于mRNA转录效率的影响, 通过观察转录结局来判断SNPs是否具有功能。
②凝胶迁移滞后实验(electrophoretic mobility shift assays, EMSA),该技术通过在体外合成含SNPs位点的寡核苷酸与转录因子特异性结合,观察二者结合的强度和效率,但是该技术由于只是人工合成较短长度的寡核苷酸,没有考虑SNPs位点周围遗传背景环境的影响。
③染色质免疫沉淀分析(chromatin immunoprecipitation assay, ChiP),该技术通过超声将染色体碎片化,再将碎片化的核酸片段与转录因子结合, 然后通过PCR技术扩增观察判断二者结合的效率和强度。
当然,对于关联研究的结果的评价和验证需要综合SNPs所在序列信息、进化保守性的有无、人群遗传学、实验室功能学证据、暴露评价(如基因型-环境交互作用研究)和流行病学证据,如Rebbeck等根据上述综合证据把SNPs是否具有功能效应分为强支持功能显著性、中度支持功能显著性及无功能显著性三类。