遗传统计分析
互联网
1963
遗传统计分析
以等位基因 方式表述与疾病易感性相关的多态,很少由单个SNP导致,大多是基因内几个SNP的组合即单倍型所引起。如ALOX5AP的单个SNP与心肌梗死均无相关性,但这些SNP组合形成的其中一个单倍型与冰岛人心肌梗死的高危存在相关,另一单倍型与英国人心肌梗死相关。多巴胺D3受体基因3个SNP单独与精神分裂症并不存在显著的相关性,但它们所形成的单倍型却与精神分裂症显著性相关,提示这些SNP存在交互或协同作用。
另一方面,一些单倍型的功能研究也显示,不同的单倍型对基因的表达或功能有不同的影响。HCAPl编码区5个常见SNP存在连锁不平衡,且G3045C(P<0.05)和A3087T(P<0.005)这2个SNP在原发性肝癌和正常人间存在显著差异。构建2种含这5个常见SNP位点单倍型的完整开发阅读框HCAPl的表达载体转染Hep3B,虽然HCAPl―N(含5个SNP位点的常见等位基因)和HCAPl―M(含5个SNP位点的低频率等位基因)均能显著降低集落形成和抑制细胞的生长,但HCAPl―N的作用明显高于HCAPl―M。这与HCAPl―M诱导Hep3B细胞生长相关基因的表达上调,而细胞凋亡和DNA修复有关基因表达下降有关。
事实上,不仅基因内多态位点存在交互作用,而且基因与基因、基因与环境之间也存在相互作用。如LTA和LGALS2基因属于同一通路,后者能调节前者的表达。关联研究显示这两个基因的一些SNP位点与心肌梗死的高危相关,提示LTA通路参与了心肌梗死的发病过程。由于多基因疾病发病机制复杂,遗传异质性强,涉及众多基因,并且基因与基因之间存在交互作用,从系统或通路水平上揭示这些基因与疾病的相关性,阐明发病机制,将是多基因疾病诊治的希望所在。
有鉴于此,目前在具体的分析方法上,日益强调了表型分型的重要性以及基因与基因间的相互作用,从单个SNP的分析,转向了多个SNP分析,包括单倍型分析和系统SNP分析。这里所说的系统SNP指的是一个或多个基因(包括不同染色体上的基因)的SNP集合,因此,系统SNP分析侧重于基因内或基因间SNP相互作用的分析。SNP的相互作用包括直接和间接作用。虽然有些基因在功能上相互独立,但SNP的同时存在增加了疾病的风险性,可能是以人们还没有认识的方式起作用。这些位点往往因效应微弱,一般的分析方法难以捡出。虽然单倍型分析能有效地降低分型的费用,并能获得局部的LD信息,因而提高了效率。但因为无法同时对不同染色体上的多态位点进行分析,致使上述提及的那些位点不能有效地被检出,遗漏了其他很多信息。而系统SNP分析不仅能对相互连锁关系的SNP进行处理,而且也能同时分析不同染色体上的不同基因的SNP,将能使统计学效率大大提高,从而增加了这些微弱效应易感位点的检出率。
由于系统SNP分析计算量大,以现今的技术尚难进行全基因组统计分析,目前倾向于对整个系统或通路中的多个基因进行分析。因此,通过按系统或通路进行关联研究,不仅大大降低了对数据分析的难度,而且也能从系统或通路水平上阐述其与疾病的相关性。系统SNP遗传统计分析技术的发展,则是这种策略得以成功实施的保障,目前国内外有多家实验室都在开发和完善系统SNP分析的软件。可以预料,结合单倍型等其他一些分析方法,系统SNP分析法将可以大大提高冠心病、原发性高血压、精神分裂症等多基因疾病的易感位点检出率。