通过比较基因组学确定大基因组区域保守的非编码序列
互联网
2845
通过比较基因组学确定大基因组区域保守的非编码序列
基于一般的假设,在不相似序列中的保守区域极有可能具有一定的功能,保守的非编码序列
(conserved non―coding sequences,CNS)被认为是基因组中调控区域的高度可靠的候选者。CNS不仅在启动子的邻近区域找到,还发现存在于启动子相距一定距离的位点上,如增强子。因此,随着可利用的基因组的增加,比较基因组学在生物信息学领域迅速扩展。大的基因组序列的比较需要特异的序列比对算法,已有的工具BLAST、BLAT已不适应这个目的。现在已有不少相关工具可以利用,它们主要由两个不同的研究院开发,即Lawrence Berkeley Lab(LBL)和Lawrence Livermore Nat Lab(LLL)。
如果用户对人类基因中基因间的区域以及它的上游邻近基因感兴趣,得到这个区域的是使用UCSC Genome Brower。可以利用各种序列号(GenBank、RefSeq、EST、LocusLink)、HUGO基因符号以及基因组位置等在浏览区中进行来查询。当选择基因位置时一定要注意基因组装配的版本,如人类"hgl5"版本与UCSC 2003年4月的版本相同,但最新的"hgl7"则是对应于2004年5月的版本,是基于NCBI中人基因组的第35装配版。
如果通过序列进行查询(如cDNA序列),最好的方法是对UCSC进行BLAT查询,快速确定相关的基因组区域,最终在基因组浏览器中产生相关区域的图形。为了展示感兴趣的区域,用户可以针对序列左右移动,放大或缩小,或直接输入位置坐标。用户也可以写下位置坐标或利用浏览器窗口顶端的"DNA"连接来提取DNA序列。随后,可通过检索工具,利用两种输入类型中的一种进行比较基因组学研究。