Nature Genetics:王艇团队从转座子中发现泛癌症新抗原
丁香学术
研究团队首先开发了一个新的算法 TEProF2(TE Promoter Finder 2),用于从转录组数据中识别从转座子开始拼接到基因的嵌合转录本(TE-gene chimeric transcripts,TETs)。
然后,研究团队把 TEProF2 应用到 TCGA 数据库中的 10357 个肿瘤和 729 个病人正常组织样本上,以全面剖析这些转录本在 33 种癌症类型中的表达。后续通过分析 TETs 在 GTEx 中 11686 个正常组织样本中的表达,筛选出 2297 个癌细胞特异的 TE-基因嵌合转录本(tumor-specific TE-gene chimeric transcripts,TS-TETs)。在 TCGA 分析的所有 10357 个肿瘤中,93.6% 的肿瘤至少表达了一个 TS-TET。此外,其中一些 TS-TETs 是高度普遍的,例如 L1P2_STK31 存在于 1576 个肿瘤样本中。这些转录本中有 1068 个被预测能编码嵌合蛋白或移码突变蛋白(tumor-specific TE-gene chimeric proteins,TS-TEPs)。因为这些蛋白是肿瘤特定转录本所翻译的,因此它们具有可以作为免疫疗法靶标的极大潜能。
图 1:TE-基因嵌合转录本示意图(左); 肿瘤特异性 TE-基因嵌合转录本筛选过程示意图(右)
随后,研究团队利用 CPTAC 提供的肿瘤蛋白质谱数据成功确认 TS-TEPs 在乳腺癌和卵巢癌肿瘤样本中的存在。此外,他们利用 4 个细胞系生成 HLA-pulldown 质谱数据,并从中识别到来自 TS-TEPs 的抗原。
最后,除了被呈递为抗原来激活免疫反应外,转座子与膜蛋白的嵌合蛋白可以标记在癌细胞外表面,从而作为免疫或靶向疗法针对的对象。作者利用了质谱、商业可购以及定制抗体来评估膜结合 TS-TEPs 的存在。
图 2:肿瘤特异性 TE-基因嵌合转录本 L1P2_STK31 示意图(左)TE 作为基因的替代启动子的转录组学证据(右)L1P2_STK31 翻译后的蛋白序列预测
该泛癌症研究发现了数百个多种癌症共享的、来自转座子(TEs)的肿瘤特异性转录本。它们有可能翻译出与 HLA 分子结合的肿瘤特异性抗原,也可能翻译为膜蛋白成为如 CAR-T 疗法的靶标。
这些新发现的转录本为设计更普适的癌症生物标志物和创新治疗方法方面提供了宝贵的资源。仅仅 20 个 TS-TEPs 的组合便可以帮助我们识别或靶向所分析的 10357 个肿瘤样本中的 67.4%。这意味着现成、普遍适用的癌症疫苗在不久的未来会成为可能,也为临床癌症治疗开辟了新的思路。TS-TETs 和 TS-TEPs 广泛扩大了现有癌症治疗疗法的候选标靶。
这项研究也存在一些不足。虽然 TS-TEPs 作为免疫疗法的目标很有前景,但该研究尚未证明它们在病人样本中的免疫原性。此外,此研究没有对其他来自非编码序列的抗原进行分析,这些抗原可能是除 TS-TEPs 之外有价值的共享抗原。最后,此研究表明,在识别来自转座子尤其是重复序列的抗原时,必须进行严格的过滤,以帮助减少脱靶效应。
综上所述,该研究通过开发新的算法,从大数据中深入剖析了 TE 基因嵌合转录本在 33 种不同癌症类型的表达,强调了它们作为癌症靶点的可能性,并为免疫疗法及肿瘤疫苗开发提供了大量可针对的潜在靶标。
王艇课题组的 Nakul Shah、张孝贤和梁永浩为论文共同第一作者。王艇教授是美国圣路易斯华盛顿大学遗传系 Sanford and Karen Loewentheil Distinguished Professor of Medicine,同时也是计算机科学与工程的教授,兼任 McDonnell Genome Institute 的科研主任。王艇教授长期领导大型国际项目例如 ENCODE,Roadmap,4DN,TaRGET 以及当前最新的人类泛基因组计划(Human Pangenome Project)和 IGVF(Impact of Genetics Variation on Function),Funding 多多。团队目前正在招聘博士后,欢迎联系(http://wang.wustl.edu/)。
论文链接:
https://doi.org/10.1038/s41588-023-01349-3