基因组序列组装完整的和草图式的基因组测序
互联网
3119
基因组序列组装完整的和草图式的基因组测序
一旦鸟枪法测序阶段完成,所有的序列必须依据单一序列之间的相似性组装成连续序列。基因组中的重复区对于组装软件是重要的挑战。为协助解决这一问题,TIGR组装器(Sutton等,1995;Pop,Salzberg和Shumway,2002)确定了要进行组装的一组序列中的全部重复区,并且利用从单一克隆插入片段两端获得的正向和反向序列信息。如果重复区较克隆插入片段短,这个信号将与插入片段大小分布的信息共同指导以正确组装重复区。而且TIGR组装器的一种称为启动(jumpstart)的设计可协助结束程序,这一功能允许组装过程利用一组已经组装完毕的连续区段和新序列重新开始一轮组装。这大大方便了基因组结尾过程中为补齐间隙而进行大量重新组装的需要。
获得无间隙和经过编辑的人类病原体完整基因组序列是很有意义的,因为可以得到多组完整的基因,也有助于基因组组织、基因组比较和功能基因组的研究,包括微阵列(Fraser等,2002)的发展。一旦一种特定有机体的一个或两个基因组测序完成,物种的多样性就可以用微阵列通过比较基因组杂交(comparative genome hybridization,CGH)来估测(Tettelin等,2001;Smoot等,2002;Tettelin等,2002;Chan等,2003),或者建立感兴趣的其他菌株的序列草图,然后与参照基因组进行比较。在生成关于物种多样性的基因组规模信息时这两种方法都快速而且高效。