【共享】大规模基因组测序
丁香园论坛
2278
DNA测序技术上的快速发展,加快了我们对不同物种和生物体的基因组序列和结构的研究步伐。在已有GS 20的技术基础上,罗氏诊断公司和454公司不断加大创新投入,又于2007年推出了通量更大,读长更长,准确性更高的第二代基因组测序系统——Genome Sequencer FLX System (GS FLX),相信它的出现,必将掀起测序技术的进一步革命;对整个基因组学的研究将产生巨大的推动作用。GS FLX是世界上第一个可以提供超高通量基因组和长片段DNA测序的商业化系统设备,只需要一步简单的全基因组样品制备过程,就可以在7.5小时内获得超过1亿个碱基信息。避免了目前技术中的大规模自动化技术的使用;单个人工就可以在几天内而不是几个月的时间里完成样品的准备,序列测定和结果生成整个过程。通过建立在PicoTiterPlate上的大量平行测序,采用最先进的图像处理技术和独特的数据分析可以获取高质量的结果。
1)样品种类:GS FLX系统支持各种不同来源的样品序列测定:包括基因组DNA,PCR产物,BAC,cDNA,小分子RNA等等。
2)样品DNA打断:样品例如基因组DNA或者BAC等被打断成300-800 bp的片段;对于小分子的非编码RNA,这一步骤则不需要。短的PCR产物则可以利用GS融合引物进行扩增后直接进行步骤4)的工作。
3)衔接子连接:借助一系列标准的分子生物学技术,将A和B接头(3’和5’端具有特异性)连接到DNA片段上。接头也将在后继的纯化,扩增和测序步骤中用到。图中仅仅显示了后续步骤中要用到的单链的DNA片段。
4)一条DNA片段=一个磁珠:接头使成百上千条DNA片段结合到它们自己唯一的磁珠上,此磁珠被单个油水混合小滴包被后,在这个小滴里进行独立的扩增,而没有其他的竞争性或者污染性序列的影响;整个DNA片段进行平行扩增。
5)一个磁珠=一条读长:经过PCR扩增后,每个磁珠上的DNA片段拥有了成千上万个相同的拷贝。经过富集以后,这些片段仍然和磁珠结合在一起,随后就可以放入到PicoTiterPlate板中供后继测序使用了。
6)数据读取和分析工具:GS FLX系统 在7.5小时的运行当中可获得40多万个读长,读取超过1亿个碱基信息。GS FLX 系统提供三种不同的生物信息学工具对测序数据进行分析,适用于不同的应用:例如多达3 GB序列的重测序,对比已知参考序列进行的扩增产物差异分析,及 120 MB的从头测序工作等。
GS FLX系统的技术优势
GS FLX系统具备的卓越性能:
• 一个测序反应耗时7.5个小时,获得超过1亿个的碱基数据
• 单个序列的读长更长,平均可达到200-300碱基左右
• 通量更高,每个反应可以得到超过40万个序列读长,成本大大降低
• 读长超过200 bp时,单一读长的准确性可以超过99.5%
• 测序结果一致性超过99.99%
• 技术成熟,提供完整的解决方案
• 可以进行Pair-End 测序研究
完整的软件包是GS FLX系统的又一特色:
• 简单易用的图形用户界面,可以用来进行作图,拼接和扩增产物差异检测等研究。
• 利用项目管理软件工具,可以把多次测序反应得到的数据进行成组分析,并且可以添加已完成的测序反应数据来进行其他方面的分析
• 利用新一代的算法得到高度可信的结果-无论是碱基识别, 拼接和作图,还是差异分析,都是如此。
GS FLX系统的应用
自从2005年底GS 超高通量基因组测序系统问世以来,已经相继在世界上各大测序实验室成功落户。这项技术的第一个“试验品”就是来自有“DNA之父”之称的James D Waston,他向454公司提供了自己的血液样本。目前GS系统的用户在Nature,Science,PNAS等世界顶级的期刊杂志上已经发表了五十多篇的学术论文。
全基因组测序
多达120 Mb的未知基因组的测序
-生成基因组结构概图
-研究DNA序列的组织,分布和信息
-基因筛查:寻找新基因,定位和功能
-和其他基因组进行比较研究
1)样品种类:GS FLX系统支持各种不同来源的样品序列测定:包括基因组DNA,PCR产物,BAC,cDNA,小分子RNA等等。
2)样品DNA打断:样品例如基因组DNA或者BAC等被打断成300-800 bp的片段;对于小分子的非编码RNA,这一步骤则不需要。短的PCR产物则可以利用GS融合引物进行扩增后直接进行步骤4)的工作。
3)衔接子连接:借助一系列标准的分子生物学技术,将A和B接头(3’和5’端具有特异性)连接到DNA片段上。接头也将在后继的纯化,扩增和测序步骤中用到。图中仅仅显示了后续步骤中要用到的单链的DNA片段。
4)一条DNA片段=一个磁珠:接头使成百上千条DNA片段结合到它们自己唯一的磁珠上,此磁珠被单个油水混合小滴包被后,在这个小滴里进行独立的扩增,而没有其他的竞争性或者污染性序列的影响;整个DNA片段进行平行扩增。
5)一个磁珠=一条读长:经过PCR扩增后,每个磁珠上的DNA片段拥有了成千上万个相同的拷贝。经过富集以后,这些片段仍然和磁珠结合在一起,随后就可以放入到PicoTiterPlate板中供后继测序使用了。
6)数据读取和分析工具:GS FLX系统 在7.5小时的运行当中可获得40多万个读长,读取超过1亿个碱基信息。GS FLX 系统提供三种不同的生物信息学工具对测序数据进行分析,适用于不同的应用:例如多达3 GB序列的重测序,对比已知参考序列进行的扩增产物差异分析,及 120 MB的从头测序工作等。
GS FLX系统的技术优势
GS FLX系统具备的卓越性能:
• 一个测序反应耗时7.5个小时,获得超过1亿个的碱基数据
• 单个序列的读长更长,平均可达到200-300碱基左右
• 通量更高,每个反应可以得到超过40万个序列读长,成本大大降低
• 读长超过200 bp时,单一读长的准确性可以超过99.5%
• 测序结果一致性超过99.99%
• 技术成熟,提供完整的解决方案
• 可以进行Pair-End 测序研究
完整的软件包是GS FLX系统的又一特色:
• 简单易用的图形用户界面,可以用来进行作图,拼接和扩增产物差异检测等研究。
• 利用项目管理软件工具,可以把多次测序反应得到的数据进行成组分析,并且可以添加已完成的测序反应数据来进行其他方面的分析
• 利用新一代的算法得到高度可信的结果-无论是碱基识别, 拼接和作图,还是差异分析,都是如此。
GS FLX系统的应用
自从2005年底GS 超高通量基因组测序系统问世以来,已经相继在世界上各大测序实验室成功落户。这项技术的第一个“试验品”就是来自有“DNA之父”之称的James D Waston,他向454公司提供了自己的血液样本。目前GS系统的用户在Nature,Science,PNAS等世界顶级的期刊杂志上已经发表了五十多篇的学术论文。
全基因组测序
多达120 Mb的未知基因组的测序
-生成基因组结构概图
-研究DNA序列的组织,分布和信息
-基因筛查:寻找新基因,定位和功能
-和其他基因组进行比较研究