为什么 TCGA 数据显示 P53 是癌基因?
小张聊科研
关于抑癌基因 P53,相信大家没有不知道这个明星分子的了。
最近在课程的微信群里面,就有同学提出来一个问题:他用课程里面介绍的 Oncomine 和 KM plotter 这两个工具有一个重大发现:P53 是癌基因!因为 P53 在大部分的肿瘤里面是高表达的,而且高表达 P53 的病人预后更差。结果是这样的:
证据 1. P53 在肿瘤里面高表达 (与对照比较)
证据 2:高表达 P53 的肿瘤病人预后更差(总生存期 OS 更短)
他的内心 OS 是这样的:
下面我们来看一下原因: 这里的 P53 是突变型的 P53,而不是野生型的 P53!我们知道正常的野生型的 P53 是抑癌基因,而当 P53 突变后就变成了癌基因。
但是,在很多情况下,当我们不是特意去区分 P53 是野生型还是突变型的时候,我们检测的 P53 就是两者的总和,既有野生型的 P53,也有突变型的 P53,在大部分肿瘤里面高表达的是突变型的 P53,于是就出现了我们前面看到的情况。
从这个问题延伸出来,我们就会发现一个问题:当我们用表达谱芯片检测分子表达的时候,如果发现基因的表达有差异,还需要我们进一步检测具体是哪条 RNA,这里既要看是否是突变型,还要看一个基因转录出来的哪条 RNA 发挥功能,因为我们知道:在有些情况下,一个基因的转录出来的不同 RNA 功能是完全相反的(比如在 cell 杂志的这篇文章可能颠覆你对 lncRNA 的理解…… 一文中,基因 ASCC3 的两条 RNA 功能就是完全相反的);基因突变和非突变情况下,功能也可能是完全相反的(比如野生型 P53 和突变型 P53),这就是我们研究可变剪接和 SNP 或者基因突变的意义所在。
所以,当我们发现某个基因在疾病组高表达,但是发挥抑制疾病的功能时,就需要我们进一步检查这个基因转录本(转录出来的 RNA)的具体序列是哪一条,可能我们检测的 RNA 和干扰 / 过表达的 RNA 不是一条 RNA。