SWATH技术——蛋白质组学的又一项革命
金开瑞生物
相关专题
蛋白质组
蛋白质组(proteome)一词是澳大利亚科学家Williams和Wilkins于1994年首先提出的,它是指一个细胞或一个组织基因组所表达的全部蛋白质总和,是对应于一个基因组的所有蛋白质构成的整体。
短短20年间,蛋白质组的研究取得了惊人的进展,这相当程度上要归功于质谱技术在蛋白质组中的应用和不断发展。同时,蛋白质组和基因组的发展是相辅相成的,凡是经过基因组测序的物种,都可以用质谱技术大规模鉴定其蛋白质组成。当前,比较主流的蛋白质组学研究方案当属LC-MS/MS系统, LC-MS/MS系统使一次实验鉴定上万个蛋白成为可能。
基于LC-MS/MS系统方案也叫shot-gun法,质谱的采集模式为DDA(Data Dependent Acquisition)。在这种模式下,质谱根据离子化的肽段母离子的强度,依次选择10到20个强度最大的离子进入串联质谱,进行进一步碎裂,然后经过与模板蛋白质数据库比较确认。这种方法无疑丢失了大量有用的肽段母离子信息。
此外,经过二级碎裂的二级谱图,在后期使用软件鉴定中也仅有少量谱图得到解析(约30%),大部分谱图依然得不到有效利用。由于质谱选择离子的随机性,造成鉴定的重复度较低,即同样的样品,同样的仪器,两次不同采集,其鉴定结果差别较大。又由于空间电荷效应的存在,大大限制了分析的动态范围,一些重要的低丰度蛋白得不到解析。
针对上述问题,瑞士苏黎世联邦理工学院的Ruedi Aebersold博士及其团队与AB-SCIEX公司联合推出了一项全新的质谱技术——SWATH(Sequential Windowed Acquisition of all Theoretical fragment ions)。
SWATH采集模式是一种新型的MS/MS扫描技术,它将扫描范围划分为以25 Dalton为间隔的一系列区间,通过超高速扫描来获得扫描范围内全部离子的所有碎片信息,是MS/MS-ALL技术的扩展。以蛋白质组学样品分析中常见的扫描范围400~1200为例,每25Dalton作为一个扫描间隔(SWATH),每个SWATH扫描时间设定为100ms,那么该扫描范围累计需要32个SWATH(1200-400/25=32),完成一次扫描仅需要3.2秒。
与传统的shot-gun技术相比,SWATH采集模式能够将扫描区间内所有的肽段母离子经过超高速扫描并进行二级碎裂,从而获得完整的肽段信息。因此,SWATH技术是一种真正全景式的、高通量的质谱技术。同时也解决了shot-gun鉴定较低重复度的缺点。
此外,借助先进的Triple-TOF 5600质谱系统,SWATH在定量上具有较高的准确度和动态范围。与传统的基于质谱定量方法不同,基于SWATH技术的定量方法直接构建二级碎片离子的XIC,曲线上的每一个点都有充分的质谱证据,大大增加了定量的准确度和可重现性。
科学家运用SWATH采集模式对酵母细胞全蛋白质的裂解液进行了分析,实验结果显示检测到蛋白质的丰度差异极大,跨越了4个数量级。而且该方法的灵敏度和动态范围与SRM分析水平相当。
2010年,AB-SCIEX公司推出Triple-TOF 5600系统,能够在一台仪器上“同时”达到高灵敏度、高分辨率、高质量准确度和高质谱图采集速度,而且还具备三重四极杆质谱级别的定量能力。
Triple-TOF 5600 是AB-SCIEX公司在三重四极杆质谱仪API 5500 和四极杆-飞行时间质谱仪QSTAR Elite(QqTOF)系统的基础上发展出的具备强大定性和定量能力的高分辨率质谱仪,成功地将三重四极杆和飞行时间质谱的最新技术合二为一,是第一台集高准确质量数、高分辨率、高扫描速率和高灵敏度为一体的系统。SWATH技术和TripleTOF 5600的完美结合让SWATH技术发挥到了极致。
使用SWATH技术研究蛋白质组学在国外已经有了不少应用。Ruedi实验室已经先后发表了4篇应用SWATH技术相关的paper。其中2013年9月在Nature method杂志上发表的利用亲和纯化结合SWATH技术(AP-SWATH MS研究蛋白相互作用的文章(Nature Methods 10,1239–1245(2013))非常值得借鉴。
SWATH MS技术的一大难题就是对复杂的质谱数据的解析。这是因为在SWAHT采集模式下,一个窗口中的所有母离子的全部碎片离子都呈现在了一张谱图中,使用传统的蛋白质质鉴定软件(如mascot等)不能有效解析这些谱图。
当前,一个比较可靠的算法被业界普遍认可,这个算法将SWATH数据的保留时间、碎片离子峰的形状、碎片离子的强度等信息分别与目标谱图库的对应信息做比较并打分(subscore),再使用半监督学习算法对每一个目标肽的所有子离子峰(trace)进行迭代训练、分类,然后线性合并这些subscore,得到一个总得分值。
为了评价结果的可靠性,该算法使用了一种类似传统蛋白质数据库检索的DECOY思想。目前使用这一算法分析SWATH数据的软件比较少,主要有skyline和openSWATH。
武汉金开瑞生物工程有限公司经过多年的研发,引进了AB Sciex 5600-plus平台,基于skyline软件自主开发了一套自动化SWATH数据分析流程,已成为目前国内第一家提供SWATH定量商业服务的公司。