丁香实验_LOGO
登录
提问
提问
我要登录
|免费注册
丁香通
点赞
收藏
wx-share
分享

今日 Nature:人工智能结合微生物组,助力癌症的早期检测!

727

人体内存在着大量的微生物群落,这些微生物对我们的身体健康以及疾病的发生等各个方面都有深远的影响。近年来,关于肠道微生物的研究层出不穷,但针对肠道微生物以及癌症发生之间相关联系的研究并不系统。


图片来源:Nature


3 月 11 日发表在 Nature 杂志上的研究中,来自加州圣地亚哥的 Rob Knight 教授团队通过人工智能的手段分析了多种不同类型癌症患者体内肿瘤组织以及血液中的微生物 DNA、RNA 等相关标志物特征,这一研究将对癌症的临床诊断提供重要的帮助 1



背景介绍


癌症通常被认为是人类基因组异常引发的疾病。但是,最近的研究表明,微生物组对某些类型的癌症的发生也有重要影响 2。其中肠道微生物组对胃肠道相关癌症的发生影响甚重。尽管如此,微生物对不同类型癌症的影响的程度和以及其临床诊断意义仍然不太清楚。


由于在癌症基因组计划中很少考虑微生物组的影响,因此在收集,处理和测序过程中样品污染的可能性限制了这些研究。随着最近技术的进步以及研究者们对微生物影响的重视程度增加,污染物对样品微生物特征的影响越来越小,因此可以通过对微生物组的研究得到更加准确的信息并有助于临床诊断的进一步发展。


此前研究曾揭示了部分癌症样本中微生物的特征,包括胃腺癌中的 EBV 的分布以及子宫颈癌中 HPV 的分布,等3 - 4。然而,大多数癌症样本数据尚未得到针对性开发与利用。


对此,研究者们通过建立两个彼此交互的微生物检测系统,绘制了迄今为止最全面的癌症相关微生物组数据图谱,系统地测量并最大程度上减小了技术手段带来的差异以及样品污染的影响。之后,通过设计机器学习的工具,作者进一步识别并区分了癌症的类型以及微生物特征之间的相关性。



主要内容


为了分析与癌症相关的微生物组信息,作者收集了来自 TCGA 数据库中 10,481 名患者的 33 种癌症样本信息(4831 份全基因组测序样本以及 13285 份转录组测序样本,共计 18,116 份样品),并对其内部的微生物构成进行了检测与分析(见下图)


图片来源:Nature


此外,由于 TCGA 数据库中此前收集的数据没有排除微生物的污染风险,也没有覆盖健康人群的信息,因此作者使用微生物学标准手段对这些患者的血液样本进行了额外分析,从而排除可能存在的微生物污染。进一步,作者将血浆中微生物 DNA 的特征与临床上使用的无细胞肿瘤 DNA(ctDNA)分析进行比较测试。


在总计 6.4 x 1012 个测序样本中,共有 7.2% 被归类为非人源,其中 35.2%(占总度数 2.5%)为微生物(细菌、古菌或者病毒)。进一步,作者发现其中 12.5% 序列在此前已经被鉴定到「属」(Genus)级别。


由于此前研究发现序列数据存在明显的「批次效应」,即不同批次间的同一类型样本可能存在差异,因此会对解读上述信息造成干扰 5。对此,作者将离散的种群分布转变为对数型的,以百万级为单位的分布。结果表明,这种处理方式能够显著降低人为因素的干扰,并提高生物学的显著性。


通过使用归一化的数据,作者训练了「随机梯度促进机器学习模型(stochastic gradient-boosting ML)」来区分统一癌症类型的不同阶段以及在不同癌症类型之间的微生物序列信息差异。这一模型的性能很强,可以同时区分一种癌症与所有其它癌症,以及可以区分肿瘤与正常组织。


通过对八种常见的癌症类型及其不同发展阶段的样品进行分析,作者发现这一微生物序列差异在结肠癌,胃癌以及肾透明细胞癌的不同发展阶段十分明显,但对于其它物种癌症则没有体现出显著差异。因此,微生物的动态构成特征与癌症发展阶段的联系并不适用于所有类型的癌症。


由于对于特定类型癌症而言,微生物特征与癌症发展之间存在明显的相关性,因此作者试图了解两者之间是否存在生物学联系。通过对人类微生物组计划中来自 8 个身体部位的 217 个样本的数据进行贝叶斯微生物源跟踪算法(Bayesian microbial-source tracking algorithm)的训练。其中,粪便是最主要的样本来源部位。


分析结果表明,梭菌属细菌在胃肠道肿瘤的发生和发展中起着重要的作用,与正常样品,尤其是血液来源的正常样品相比,梭菌在原发肿瘤中丰度相对更高 。此外,泛癌分析还显示,胃肠癌样本(包括肿瘤组织以及相邻组织)中梭菌属细菌丰度均比正常组织要高。相反地,幽门螺杆菌在不同样本间则没有显著差异。


图片来源:Nature


在病毒分布特征方面,作者发现:头颈癌以及宫颈癌患者中,被诊断为 HPV 阳性以及 HPV 阴性的患者亚群中乳头瘤病毒属的整体丰度存在显著差异。此外,肝癌患者肿瘤组织中乙肝病毒的丰度也显著高于正常组织。上述患者血液样品中相关病毒的丰度则没有明显差异。


越来越多的证据表明,血液微生物 DNA(mbDNA)在癌症预测中具有临床意义,但是尚不清楚其适用程度如何 6。针对这一问题,作者分析了来自 TCGA 数据库的患者血液样品 WGS 数据,并通过机器学习工具进行分析。结果表明,基于血液微生物 DNA 可以区分多种类型的癌症(下图)


图片来源:Nature


进一步,作者比较了 「血液微生物 DNA」标签与传统血液「肿瘤 DNA」标签对于鉴定以及区分不同癌症类型的能力。结果表明,对于那些无法通过传统手段区分的癌症而言,血液微生物 DNA 能够起到较好的区分效果。


最后,作者利用血液微生物 DNA 检测手段对临床中出现的不同类型,不同阶段癌症患者的血液样本进行了分析(下图)。结果表明,这种手段能够较为准确地区分癌症患者与正常患者,以及区分不同类型癌症及其发展阶段。


图片来源:Nature



小结与讨论


总体而言,这一研究表明各种类型的癌症与特定微生物群之间存在广泛的关联。这些微生物特征似乎可以区分大多数类型的癌症其类型以及发展阶段,并且展现出癌症早期阶段血液检测的潜力。


当然,未来还需要更多的研究来确定这些「核酸分子」是否来自肿瘤微环境和血液中的活微生物,宿主细胞或裂解后的细菌。值得注意的是,目前的技术和生物学因素限制了对低丰度的微生物进行回顾型癌症测序数据的分析,因此该领域的发展将需要癌症生物学家和微生物学家之间的合作。


尽管如此,这一结果表明,新型的,基于微生物组的癌症诊断工具可能会为患者提供新的诊断方法。

<link />
提问
扫一扫
丁香实验小程序二维码
实验小助手
丁香实验公众号二维码
关注公众号
反馈
TOP
打开小程序