全基因组序列信息中确定候选疫苗
互联网
1458
全基因组序列信息中确定候选疫苗
传统的开发亚单位疫苗的方法包括利用生化的、血清学的、遗传学的方法确定致病原的单个组分。最近开发出了一种高通量的鉴定疫苗的方法即反向疫苗法,它以从全基因组序列信息中鉴定候选疫苗为基础(Rappuoli,2000;Grandi,2001;Rappuoli,200la,b;Masignani,Rappuoli和Pizza,2002;Adu-Bobie等,2003)。这种方法已被应用于脑膜炎奈瑟菌(Neisseriameningitidis)(Pizza等,2000;Tettelin等,2000)、肺炎链球菌(Streptococcuspneumoniae)(Wizemann等,2001)、缺乳链球菌(Streptococcusagalactiae)(Tettelin等,2002)和炭疽杆菌(Bacillusanthracis)(Ariel等,2002)。另外一种旨在鉴定免疫学活性表位的基于基因组的方法也在金黄色葡萄球菌(Staphylococcusaureus)中有所应用(Etz等,2002)。部分应用案例在这本书里有单独的章节讨论,此处着重讲述在得到基因组序列后反向疫苗法的第一步。这一步要用到专门的生物信息学工具利用
计算机来鉴定有潜力的候选疫苗,随后通过实验对这些候选疫苗的特性进行研究。
对大多数的细菌致病原来说,那些可能为细菌引入一种保护性的免疫效应的蛋白质被定位在细胞的表面,因为在那里它们可以和寄主的免疫系统接触。小于100个氨基酸残基的蛋白质不大可能编码一个好的保护性抗原,因而不予考虑。
对一个致病原基因组的所有预测的蛋白质进行自动的系统扫描以寻找细胞表面定位的特征氨基酸模体。首先,选取那些暴露在细胞表面的蛋白质,或选取根据先前的实验研究已知为毒力因子的蛋白质(如功能属于“胞膜”或“发病”范畴的蛋白质成员),而那些具有胞质功能的蛋白质则不选。然后用Signal P(Nielsen等,1997)搜索信号肽基本模体,用丁opPred(Claros和vonHeijne,1994)搜索跨膜结构域。丢弃那些具有多于4个预测的跨膜结构域的蛋白质,它们可能完全埋在细胞膜里,因此难以和抗体结合,而且它们也很难在大肠杆菌中表达。
随后,选取那些符合来自PFam v3.1(Bateman等,2000)和TIGRFam(Haft等,2001)设定的细胞表面蛋白特征的隐性马尔科夫数学模型(HMM)的蛋白质。这些模体包括脂蛋白、胞外蛋白酶、革兰阳性细胞壁受体、革兰阴性外膜锚蛋白、溶血素、信号识别蛋白和伞毛。像寄主整联蛋白结合结构域(RGD)、胆碱结合结构域(WYY)这些没有HMM的短些的模体也要用经典模式匹配的方法搜索。PSORT程序(Nakai和Horton,1999)也可以根据上述的模体来预计一个蛋白质是否为暴露在细胞表面的蛋白质的概率。
另外,可以用Wordmatch(http://www.hgmp.mrc.aeuk/Software/EM―BOSS/Apps/#current)来鉴定含两个或更多重复氨基酸模体的蛋白质。重复的模体往往暗示了该蛋白质为和寄主相互作用的暴露在细胞表面的蛋白质。
对于一个2~4Mb的平均大小的原核基因组来说,通过这一组合分析得到的有潜力的候选疫苗名单通常包括500―800个蛋白质。
当得到某病原体的基因组序列多于一个时,可以利用比较基因组学的方法鉴定对于细菌株间保守的候选疫苗,这就增大了基于这些抗原制备的疫苗有效地防止该类疾病变异的可能性。另外一种评价株之间或亲缘关系很近的种之间保守性的方法是:从多种菌株的基因组DNA序列中用PCP,扩增方法选定候选疫苗基因。理想的做法是从所考虑的致病原的所有分离物中取样、测序、比较PCR产物(Pizza等,2000;Tettelin等,2002)。最后,整合基因组比较杂交CGH的结果(Tettelin等,2002)或寄主―致病原相互作用的表达研究(Gri―fantini等,2002)会提供更多的信息以选择能最终产生有效疫苗的基因。
通过利用全基因组序列数据来鉴定成百上千个有潜力的候选疫苗的方法,使疫苗学出现了一次革命。经典的方法只能鉴定少量的备选疫苗,这些备选的疫苗在数年后又常常被证明是不合适的。测序技术的进步使得能够快速产生人类致病原的全基因组序列(表3.1)。这一突破和生物信息学(旨在通过计算机模拟备选疫苗特征的大规模的高度自动化方法),为少数到目前为止还无有效对抗重大致病生物的疫苗开发提供了先进的手段和技术。人们期望反向疫苗法会变得越来越有效,应用越来越广泛,能够快速地提高人类的健康水平。