【求助】关于基因组测序
丁香园论坛
1873
我想问个这几天一直想不明白的事情。
现在人类基因组测序早就完成了,也开始了其它物种的测序,包括猴子---恒河猴,rhesus,这几天我查了猴子的几个基因,发现在它的序列里包括了一部分的N。这些N表示什么意思呢?是当时没有测出来?还是不能找到合适的样本,才测不出来的?
在哪里可以查到序列完全测出来的物种呢?就拿猴子来说,哪种猴子的序列是测全了的呢?
现在人类基因组测序早就完成了,也开始了其它物种的测序,包括猴子---恒河猴,rhesus,这几天我查了猴子的几个基因,发现在它的序列里包括了一部分的N。这些N表示什么意思呢?是当时没有测出来?还是不能找到合适的样本,才测不出来的?
在哪里可以查到序列完全测出来的物种呢?就拿猴子来说,哪种猴子的序列是测全了的呢?
N 应该是未定碱基的意思。例如ATGGundefined*GG。
谢谢了。。。
补充一下:不过我确实多次遇到从UCSC下载的数据有些含有未确定的N碱基,但在ENSEMBLE里能把具体碱基给替换过来。也就是说ENSEMBLE里的序列更少N碱基,更确定些。难道ENSEMBLE更新快些,知道清楚情况请详析!
我的序列就是UCSC里面下载的。
人类基因组做了这么多年,现在还有300个gaps呢,其他物种基因组中gaps多得你数不清,有时候N会代表这里是一个gap。
本文由丁香园论坛提供,想了解更多有用的、有意思的前沿资讯以及酷炫的实验方法的你,都可以成为师兄的好伙伴
师兄微信号:shixiongcoming