大片段DNA拷贝数多态性
互联网
1214
大片段
DNA
拷贝数多态性
由于SNP在基因
组丰富及与疾病和药物疗效等的相关性,备受关注。但在基因组中除了SNP和短片段插入(缺失)外,尚存在大片段DNA拷贝数多态性(长度约几十kb或以上)。受到净化选择(purlfFngselection)的作用,这些大片段DNA中的基因较少。至今已发现的受大片段DNA多态性影响的基因约有300个,其中有些基因与一些复杂性状(complextraits)或疾病相关,如内源性和外源性物质代谢相关基因(如CYP2D6、UGT2B28、LUT2B17、CYP2A6、GSTTl和GSTMl等)、常染色体隐性遗传病基因(如STRC、FSHB、GCNT2和NEB等)、嗅觉受体基因(OR51A2和OR4FS)以及肿瘤相关基因(如DLEU7、TUSC3、BCASl、HIC2HE、LOHl2CRl等)等。通过功能分类分析和基因组基因平均分布情况比较发现,与免疫防御、感官知觉、细胞黏附和信号传导相关的基因显得特别易于缺失,而编码核酸结合蛋白和核酸代谢相关的基因缺失却很少见。大片段DNA拷贝数多态性与SNP相似,不同群体其频率和拷贝数存在差异。大片段DNA拷贝数多态性在基因组中的分布特征及其在不同群体中的差异,目前仍知之甚少,有待于进一步研究发现。
大片段DNA拷贝数的多态性主要影响这些片段中的基因功能,引起这些基因的重复(duplication)、部分或全基因缺失,从而导致基因表达或功能改变。已知多基因疾病是由多个微效基因共同作用的结果,因等位基因拷贝数不同而引起基因表达量的改变与调控区多态性导致易感基因表达量的改变相似,并且已发现的多态性大片段DNA中的基因本身与一些复杂性状或疾病相关,即大片段DNA拷贝数多态性可能参与了疾病的发病过程。这有可能是当前一些多基因疾病虽然定位了不少易感位点,但往往难以找到易感基因的原因之一。
自人类基因组序列草图公布以来,虽然对基因组DNA序列进行了重复研究,但大多停留在对几个数据库中的人类基因组序列进行分析,还未见有对大片段DNA拷贝数的多态性与疾病的相关性进行研究。这一方面固然是由于人类基因组序列公布不久,对大片段DNA拷贝数多态性所知有限,然而更为主要的是大片段DNA拷贝数多态性的检测目前尚缺乏十分有效的手段,主要依赖于测序和DNA芯片。尽管这两种技术目前已非常完善,但费用仍不低。利用大片段DNA拷贝数多态性搜寻疾病相关基因或群体研究,恐非一般的实验室所能承受,新的检测技术和生物信息学分析方法仍有待于发展。
最新研究显示,大片段DNA的缺失与SNP有共同的进化历史,检测与其连锁的SNP,将能有效地预测出大片段DNA的缺失。因此通过大规模的群体研究,寻找常见的大片段DNA拷贝数多态性,研究这些大片段DNA多态性在基因组的分布特征,并推断出检测这些常见大片段DNA拷贝数多态性的SNP集合,将有可能降低大片段DNA拷贝数多态性的检测费用。大片段DNA拷贝数多态性有可能是继SNP以后,基因组多态性的一个新的研究热点。