候选基因关联研究与定位候选克隆
互联网
4211
候选基因关联研究与定位候选克隆
候选基因 关联研究主要是综合流行病学、病因学、组织表达特异性、功能分析及与已知功能基因的同源比较,搜寻可能与其发病有关的候选基因,进而确认基因内或邻近的引起这些基因功能或表达改变的突变,或与引起功能改变的突变形成连锁不平衡的多态进行关联研究。若是在定位区域内选择候选基因,即是位置候选克隆。可以说,候选基因关联研究是研究多基因疾病与遗传因素之间存在的可能致病通路的第一步。Ozaki等人在全基因组范围内随机选择了92 788个SNP(这些SNP分布于13 738个基因的外显子、内含子和调控区),进行全基因组关联研究,并结合功能研究发现LTA252A―G和10G―A与心肌梗死存在显著的相关性。这表明候选基因关联研究完全适合于多基因疾病易感基因定位研究,在无其他更为先进的技术策略的情况下,这是一个实用性的方法。
所选择的候选基因和SNP数目受研究经费、群体的大小、疾病病因学臆测的范围、统计学显著性水平等因素的影响。选择的第一步是从文献中查找所研究复杂疾病可能有关的危险因素或候选基因,确定疾病相关表型的遗传因素、遗传模式、外显率和相关基因数目以及定位克隆研究所定位的区域。其他如相关表型的生物学、病原学和病理模型,与疾病相关的组织和细胞的表达谱研究,模式动物,以及通过检查与疾病发病可能相关的病原微生物、致癌物质或环境因素而检测到的与这些因素有关的基因和蛋白质等,均能提供重要的信息。因此在选择候选基因时,结合这些信息,谨慎判断所选择的基因。鉴于多基因疾病的发病与多个系统有关,根据资料按各个系统选择基因,将有可能提高检出率。考虑到分型费用和各种多态在基因组内的分布密度,使候选基因内的SNP(包括启动子和内含子区SNP)成为候选基因关联研究中的首选。必须判定所选择的多态是否存在连锁不平衡,因为连锁不平衡的确定,有助于SNP选择的优化,并能为分析提供可能存在的单倍型的信息。如果位于单个基因内几个SNP存在连锁不平衡,可直接由其中一个SNP推断出它们的基因型,因而降低了分型的工作量,并且单倍型比单个SNP的统计学效率更高,该SNP就是上文所述的标签SNP。但目前对不同群体基因内的单倍型和基因组连锁不平衡方式知之甚少,因此那些基于连锁不平衡的关联检出率和单倍型预测率的假设尚需经过谨慎的评估。随着HapMap的完成,最终将可直接挑选那些标签SNP,不必再先进行SNP的检测。由于候选基因是主观选定的,候选基因关联研究带有一定的盲目性。
候选基因关联研究整个操作过程比较简单,基本过程如下:①根据文献报道,确定待研究的候选基因;②测序筛查候选基因的各种突变体(24份血样即可,其频率为5%的多态检出率可达到95%),或根据文献报道/公共数据库筛选该基因的多态;③基因多态性与疾病间的关联研究,最后还需进行疾病相关基因及其疾病相关多态的功能研究,以阐明基因变异导致发病的分子机制。
人类基因组完成图已公布,所有2万――2.5万个基因在染色体上的位置都已确定。通过上述定位所得的紧密连锁位点,即可得到该区段内所有的基因。根据病因学分析,组织表达特异性、功能分析及与已知功能基因的同源比较,可以选择若干基因作为突变分析的候选基因。如果连锁或连锁不平衡的区域比较小,且只包含少数基因,则此方法效果更好,并能探测到起微弱作用的基因。定位候选克隆的基本步骤与候选基因关联研究相似,所不同的是,定位候选克隆仅在定位区域内选择基因。