定位克隆的核心是连锁分析技术
互联网
2212
定位克隆的核心是连锁分析技术
连锁是一种遗传 现象,是指当同一条染色体上的某些位点由于相距很近,在减数分裂过程中这些位点发生交换的概率较小,所以就有较多的机会连锁在一起,从亲代传递到子代。位点间的距离越近,在减数分裂过程中发生交换的可能性越小,位点间重组的概率就越小;相反,两位点越远,则越容易产生重组体。这是利用连锁分析将致病相关基因从染色体中搜寻出来的定位克隆基础,为疾病基因定位提供了有力的手段。鉴于致病相关基因及其邻近的遗传标记在世代传承过程中存在共分离或共遗传的现象,因此,通过对覆盖密度适当的遗传标记在家系中进行分型,以此找到与致病相关基因紧密连锁的某一遗传标记,从而确定该基因在染色体上的大体位置。在此基础上,在该染色体区域再使用覆盖密度更高的遗传标记作深入的连锁分析、单倍型分析或连锁不平衡分析,就可将致病相关基因确定在较小的区域。这样,就能对该区域内有限数目的基因进行筛选,确定致病相关基因。这种方法最适用于有多个患者的大家系研究,当前一些致病相关基因的发现主要也是通过家系连锁分析发现的。
由于人类基因组序列已知,一旦发现了与致病相关基因连锁的两侧遗传标记,根据遗传标记的具体位置,我们就可以知道定位区域内所有的基因。随后在该区域内选择候选基因直接进行测序,对所发现的SNP在患者和对照组进行分型并分析,搜寻致病相关基因。另一个方法是直接从公共数据库挑选候选基因编码区、调控区(包括内含子)中的SNP,进行连锁不平衡分析,确定致病相关基因。连锁分析其实就是一种计算的手段,通过数学模型,推断出那些具有统计学意义的与疾病共分离的基因组区段,而这些区段内很有可能含有易感位点。图1―2简明扼要地概述了通过家系寻找致病相关基因的基本过程。
定位克隆疾病相关基因的常规流程
定位克隆的核心是连锁分析技术,最为经典的一个例子是在1989年仅仅利用限制性片段长度多态性(restrictionfragmentlengthpolymorphism,RFLP)进行连锁基因定位(1inkagemapping),克隆了囊性纤维化的致病基因。要想取得连锁基因定位的成功。先决条件是所收集的家系成员疾病表型分型必须正确,需将表型评定的不确定性降至最低。连锁的推断过程基本上是一个统计过程,一旦混淆了研究群体中的患者.将会造成研究的偏差。因此,在诸如Huntington舞蹈病和囊性纤维化等诊断很明确、疾病与表型非常一致的孟德尔遗传病中,连锁基因定位取得了巨大的成功,并且通常能在接近理论人数最小值的情况下获得成功。而在那些存在诊断错误、遗传异质性、复杂性状或拟表型等情况下,特别是那些将不同疾病的患者或健康人员归人患病组,即使是大样本.其连锁分析也会失败。
有时也可利用一些相对简单的统计学纠正措施,或能从一些噪声中鉴定出连锁信号,成功的例子有乳腺癌的易感基因BRCAl。现已清楚,只有15%一20%有乳腺癌家族史的乳腺癌患者是因BRCAl或BRCA2引起。研究者结合此前的流行病学调查结果,发现在早发性乳腺癌患者中连锁信号大为提高。正由于研究者一开始并未注意到上述现象以及考虑到遗传异质性的问题,未能为BRCAl定位在17号染色体上的结果提供有力的统计学证据。随后正是因为注意到这些问题,成功地定位克隆了BRCAl。然而,采取一些纠正措施虽然能提高成功率,但有些致病相关基因的鉴定分离过程却颇费周折。遗传异质性、误诊和复杂性状等因素的存在必然增大研究难度,并通常可引起连锁分析的假阳性结果。倘若分析结果一开始就不明确,这时可应用其他合适的连锁分析方法,对这些结果重新进行分析,检测是否因一些不同表型(如发病年龄、临床症状)等因素所致。同时根据初次分析的结果,在另一批样本中验证是否系表型不同等因素所致。重复性是孟德尔遗传病以及多基因疾病的致病相关基因研究结果准确性的验证方法。
至今所找到的疾病相关基因,大多数是在单一简单的显性、共显性、隐性或X―连锁等孟德尔遗传病家系中所定位克隆的。如果有足够的家系材料,理论上连锁分析可以将致病相关基因定位至1―10cM的区域内,但这样的家系往往很难获得。通常的标准程序是连锁分析定位至5~locM后,再在该区域内选择分布密度更高的一套遗传标记,对原样本进行精细定位。但有时即使有足够多的微卫星或SNP等遗传标记可供利用,也很难进行精细定位,因为分辨率仍取决于发生交换的减数分裂的数量。在理想情况下(如囊性纤维化),研究对象中含疾病相关基因区域中的交换程度使得最终定位区域只含少数几个基因。而较为不利的情况是,最终定位的区域含有几百个基因,这样对疾病相关基因的鉴定造成很大的困难。
尽管理论上定位克隆不需知道疾病的生物学或基因功能方面的知识,但实际上定位区域内候选基因生物学功能的评价却是该策略很重要的一个环节。精细定位后,收集定位区域内各个基因的信息,倘若某个基因与疾病的病理过程相关,则这个基因就可列为候选基因。典型的例子是“功能明确候选基因策略”(well―informedcandidate gene)成功地定位克隆那些含有引起严重高血压或低血压的突变基因。但往往是定位克隆了疾病相关基因后,该基因与疾病之间的关系才被人所知,这也是定位克隆的目的所在。