提问
提问
我要登录
|免费注册
点赞
收藏
wx-share
分享

基因克隆将基因组信息翻译成某种蛋白质组学信息

互联网

1204
基因克隆将基因组信息翻译成某种蛋白质组学信息
 
    将基因 组信息翻译成某种蛋白质组学有用信息的第一个界面是在表达的克隆阶段。通过普通数据库可以获得大量的有关基因组的信息。挖掘这些信息可以用来预测开放阅读框(open reading frame,ORF),这些ORF可以根据序列的相似性预测功能而后归类。但是为了验证这些假定蛋白,必须先完成一项困难的任务,即获得一个预测ORF的真实克隆,并将其转化为容易表达的形式。对于原核生物而言,设计从预测的ORF扩增引物和直接从基因组DNA扩增引物一样简单。然而对于绝大多数真核生物蛋白质来说,首先需要制备一个合适的cDNA文库,这一步经常是比较困难的,需谨慎预测,因为cDNA依赖于基因的活跃表达。例如,与细胞循环有关的基因、具有长编码区的基因或那些表达水平比较低的基因在没有特制文库和好运气时就很难被克隆。剪接的变化、克隆的多样性和其他突变都会导致多重扩增和变异,这使研究者必须面对一个选择,即哪个基因是与表达的目标真正相关的。
 
    此时最终的应用目标对做出决定很重要。功能活性、生物物理属性和免疫交叉活性将是第一个影响表达途径决定的因素。决定表达ORF的全长还是某一个区段与载体和表达体系的选择,同时也与成功的概率密切相关。生物信息学在蛋白质组学中的最好的应用是对蛋白质的分类和功能区的预测。很多蛋白都归于不同的功能分类,这些分类可以依据序列的相似性直接预测。因为可以获得大量的而且还在快速增加的结构信息,所以常常可以预测目标蛋白质结构中的结构域。很多工具,如DALI(Dietmann等,2001)、SCOP(Lo Conte等,2000)和CATH(Pearl等,2003)都是能够公开利用的达到这个目的的资源,在这个阶段区分结构域预测和功能域预测很重要。结构域预测和功能域预测有时候是重叠的,前者正是成功设计表达组合部件的关键。这些工具不是很精确的,甚至会因一个氨基酸的变化而导致目标可溶蛋白表达的成功或失败。可以结合经验和预测处理来充实设计,由此在结构域周围同时想象设计不同的变化,然后直接检验适当的表达性质。
 
    一旦鉴定并克隆了想得到的ORF,下一步就是将这个克隆转化成容易表达的序列。这方面有让人眼花缭乱的选择数量,而且所有选择都有其期望的优势和用途。不幸的是,蛋白质表达没有通用的万能剂。DNA技术只利用很少的DNA生物物理性质,而蛋白质组技术则与DNA技术不同,蛋白质组技术需要考虑很多性质,比如形状、稳定性、电荷和疏水性等。为了给出牢靠的度量标准,在纯化重组蛋白质时,纯化标签通常也包括在内,日常应用的标签有很多(Baneyx,1999;Kapust和Waugh,1999;Lesley,2001)。因为每一种方法都有其优势,基于同源重组的克隆方法大大促进了对各种表达选择的快速评价(Landy,1989;Liu等1998;Ghosh和VanDuyne,2002)。由于这些表达系统可在载体之间往返挪动,故此系统能够提供很大的方便,但是这些系统在载体设计方面也有局限,而且会经常导致无关序列与目标序列的融合。日常采用的是比较传统的克隆处理,利用的是具有位于下游8个碱基处的限制性位点的v载体。这种传统的克隆手段通过平行处理及简单PCR筛选来实现高通量,能够进行强有力的和普通的克隆处理,而且这种处理方式能够更深入地与商用的自动仪系统结合。
 
    不管克隆的处理手段如何,最终得到的克隆必须为了蛋白质表达而进行确认核对及重组。这种测序和格架(reracking)重组工作的任务对于单独一个克隆来说是微不足道的,但是在应用于蛋白质组时就变得复杂和昂贵了。绝大多数错误是由PCR使用的寡核苷酸引起的,而不是扩增反应本身引起的,后者可由校正酶进行。对每一个克隆进行克隆连接点的序列验证是非常必要的。    如何将上述手段应用于蛋白质组学有一个成功的范例,即有人对一个细菌蛋白质组进行了成功的处理,这个细菌蛋白质组是一项结构基因组研究计划的一部分(Lesley等,2002)。他们以并行和高通量的模式利用比较传统的克隆方法,在最小限度的人力资源和大约几个月时间内,将预测的海栖热袍菌Thermotogamaritima)蛋白质组的73%的序列克隆到了一个表达载体中,并进行了序列确认。
提问
扫一扫
丁香实验小程序二维码
实验小助手
丁香实验公众号二维码
关注公众号
反馈
TOP
打开小程序