【求助】关于重叠基因
丁香园论坛
3428
近来看到关于重叠基因的资料,但是我看到很多资料有两种:
1. 重叠基因都是存在于病毒等简单的生物的基因组中,而像高等的生物等复杂生物基因组中不含有重叠基因
2.哺乳动物中的重叠基因(比较基因组)
信息来源:生物中国人 更新时间:2004-6-20 17:26:00
人的基因组有32亿左右碱基,但却只有约3万5千个编码蛋白的基因。按道理来说,每个基因应该可以“分到”比较多的长度,但是,令人不解的是,在哺乳动物基因组中存在大量的重叠基因(overlapping genes),为什么这些基因不分散开来而“重叠”在一起?
本文研究了人和小鼠1316对重叠基因,发现只有一小部分基因的重叠方式是严格相同的。
请参阅:Vamsi Veeramachaneni, Wojciech Makalowski, Michal Galdzicki, Raman *** and Izabela Makalowska(2004)Mammalian Overlapping Genes: The Comparative Perspective. Genome Research,14:280-286
3.人类基因组测序完成后,已发现人类基因组中仅有不到40000个基因,但是,目前已发现和测序的蛋白质有17万种以上。
所以说我很迷惑,在高等生物基因组中尤其是人中到底有无重叠基因?请高手尽快给予回答,谢谢!
1. 重叠基因都是存在于病毒等简单的生物的基因组中,而像高等的生物等复杂生物基因组中不含有重叠基因
2.哺乳动物中的重叠基因(比较基因组)
信息来源:生物中国人 更新时间:2004-6-20 17:26:00
人的基因组有32亿左右碱基,但却只有约3万5千个编码蛋白的基因。按道理来说,每个基因应该可以“分到”比较多的长度,但是,令人不解的是,在哺乳动物基因组中存在大量的重叠基因(overlapping genes),为什么这些基因不分散开来而“重叠”在一起?
本文研究了人和小鼠1316对重叠基因,发现只有一小部分基因的重叠方式是严格相同的。
请参阅:Vamsi Veeramachaneni, Wojciech Makalowski, Michal Galdzicki, Raman *** and Izabela Makalowska(2004)Mammalian Overlapping Genes: The Comparative Perspective. Genome Research,14:280-286
3.人类基因组测序完成后,已发现人类基因组中仅有不到40000个基因,但是,目前已发现和测序的蛋白质有17万种以上。
所以说我很迷惑,在高等生物基因组中尤其是人中到底有无重叠基因?请高手尽快给予回答,谢谢!
建议楼主暂时相信你手中更权威的那份资料吧。
读了这个文章,的确很有意思。
但是,这个文章的研究结果只能是已有分子生物学观念的一个补充,与原有的一些资料并不矛盾。
1.存在于病毒和原核生物的基因组中可能有重叠基因存在,由于原核基因的ORF内都没有内含子(Group II introns不位于ORF中),所以重叠基因就往往就意味着ORF的重叠。ORF的重叠会带来很多问题,比如编码区于转录起始和终止的干扰问题,ORF中密码子的干扰和限制问题等等,不利于基因的独立有序。所以原核生物中基因组越紧凑的基因组里出现重叠基因的情况才会更多。
2.哺乳动物细胞中的重叠基因虽然有各种各样的情况,但是35,000个编码蛋白的基因中只有1,000左右的基因有重叠现象,不到3%。这些基因的重叠情况与原核生物不同。66%的基因是尾对尾重叠的,也就是两个相反方向的基因polyA加尾信号和3'UTR区段相互重叠,不涉及编码序列。30.81%则是5'UTR区段发生了重叠。而即使是所谓编码区段发生重叠,也不过是相反方向的两条基因的外显子分别在另一条基因的内含子部分发生重叠,或是同样的外显子通过不同方式的启动或转录终止共用外显子(这种现象已为我们所熟知),都不会像病毒和原核生物中那样共用读码框,而是表现出一种在我看来有点像一条基因利用另一条基因的内含子作进化材料,还能保留基因表达产物的正确性而不会摧毁出发基因的功能。所以这也是可以理解的。
3.人类基因组中编码蛋白的基因估计也就在25,000-35,000左右,但是转录组中mRNA的种类通过Alternative splicing等方式可以远大于基因组的数量,而蛋白质组则因蛋白的加工成熟而导致蛋白质组数量的进一步扩大,在教科书GENES里有详细论述,可以参考。
从文献看的确是有重叠基因,但是与原核生物中的那些重叠基因是不相同的。
但是,这个文章的研究结果只能是已有分子生物学观念的一个补充,与原有的一些资料并不矛盾。
1.存在于病毒和原核生物的基因组中可能有重叠基因存在,由于原核基因的ORF内都没有内含子(Group II introns不位于ORF中),所以重叠基因就往往就意味着ORF的重叠。ORF的重叠会带来很多问题,比如编码区于转录起始和终止的干扰问题,ORF中密码子的干扰和限制问题等等,不利于基因的独立有序。所以原核生物中基因组越紧凑的基因组里出现重叠基因的情况才会更多。
2.哺乳动物细胞中的重叠基因虽然有各种各样的情况,但是35,000个编码蛋白的基因中只有1,000左右的基因有重叠现象,不到3%。这些基因的重叠情况与原核生物不同。66%的基因是尾对尾重叠的,也就是两个相反方向的基因polyA加尾信号和3'UTR区段相互重叠,不涉及编码序列。30.81%则是5'UTR区段发生了重叠。而即使是所谓编码区段发生重叠,也不过是相反方向的两条基因的外显子分别在另一条基因的内含子部分发生重叠,或是同样的外显子通过不同方式的启动或转录终止共用外显子(这种现象已为我们所熟知),都不会像病毒和原核生物中那样共用读码框,而是表现出一种在我看来有点像一条基因利用另一条基因的内含子作进化材料,还能保留基因表达产物的正确性而不会摧毁出发基因的功能。所以这也是可以理解的。
3.人类基因组中编码蛋白的基因估计也就在25,000-35,000左右,但是转录组中mRNA的种类通过Alternative splicing等方式可以远大于基因组的数量,而蛋白质组则因蛋白的加工成熟而导致蛋白质组数量的进一步扩大,在教科书GENES里有详细论述,可以参考。
从文献看的确是有重叠基因,但是与原核生物中的那些重叠基因是不相同的。
本文由丁香园论坛提供,想了解更多有用的、有意思的前沿资讯以及酷炫的实验方法的你,都可以成为师兄的好伙伴
师兄微信号:shixiongcoming