丁香实验_LOGO
登录
提问
提问
我要登录
|免费注册
丁香通
点赞
收藏
wx-share
分享

三个实例告诉你:不做实验,还可以挖掘数据库发表文章

丁香园

2628

今天小张就先介绍三篇最近很火的发文章的套路:不做实验,只挖掘数据库就发表文章。

第一篇:影响因子 1.7 分

第一篇是今年 5 月份刚发的文章,杂志是 Pathol Oncol Res,影响因子 1.7 分,研究团队是伊朗的科学家。

文章主要通过 cBioportal 对 TCGA 数据中肝癌的数据进行挖掘,结果找到了一条 lncRNA SNHG6 作为肝癌的分子标志物。结果如下:

感觉做了好多东西,其实就说了两件事:

  1. lncRNA SNHG6 等 3 条 lncRNA 在肝癌患者中基因组水平的改变和表达情况;

  2. lncRNA SNHG6 与患者预后相关;

关键是只用了一个 TCGA 使用工具:cBioportal,而这个工具使用起来也非常简单,就这么挖掘下数据库一篇 1.7 分的文章就发出来了。

第二篇:影响因子 3.2 分

这篇文章是国内团队 3 月底发的,杂志 International Journal of Molecular Sciences,影响因子 3.2,分数已经突破 3 分了,文章说的是通过生物信息学分析鉴定结直肠癌关键候选基因和信号通路。

下面我们看研究内容:

第一印象:图好漂亮,不过分析似乎有点太简单了吧。

第三篇:影响因子 5.1 分

今年 5 月 22 号发表,杂志是 Oncotarget,虽然 OT 被大家广为诟病,不过新影响因子出来还是保持住了 5 分大关,还略微升了那么一丢丢。文章说的是通过 RNA 测序和芯片数据挖掘研究异常表达的 lncRNA 在肺鳞癌中的临床意义,我们看看这篇是不是让我们对 OT 另眼相看:

首先通过 R 语言分析 TCGA 数据库中的差异表达 lncRNA,并用火山图展示:

(横过来的火山图还是火山图)

接下来,分别通过箱式图、ROC 曲线、KM 生存分析和与基因 FGFR1 的共表达分析展示 10 条最显著 lncRNA 的结果,四张图就是 4 个 fig:

再往下是 lncRNA 表达在不同病理参数分组下的表达差异:

还有通过 WGCNA 筛选基于 lncRNA-mRNA 共表达网络建立的 CNC(Coding-Non-Coding)Network:

接下来是这 10 条 lncRNA 在 TCGA 中的基因组变异、表达以及与预后的关系,用的工具还是 cBioportal。

B 图是不是跟文章 1 里面的很像?因为都是 cBioportal 做出来......

到这里就结束了吗?并没有!

以上只是基于 TCGA 的结果,还要验证呢:

好了,这篇 OT 的文章就算说完了,其中还有 7 个表我们没有没有放上来,不过总体来说,这篇 OT 用到了 TCGA 数据,GEO 以及自己验证的 12 对肺鳞癌样本,用到了 R 语言的 DESeq 包和 WGCNA 包,Cytoscape 软件以及 cBioportal 和 GEPIA 网站,图和表不少,而且图都很漂亮。

总结一下

第一篇 1.7 分的文章只用了 cBioportal 网站分析 TCGA 数据;

第二篇 3.2 分的文章主要对四个 GEO 的数据进行分析;

第三篇 5.1 分的文章整合了 TCGA、GEO 和自己的工作(虽然验证数量只有 12 对且只有 qPCR),用到的工具比较多分析的内容也多,更重要的是图很漂亮,图的排布也很整齐,要知道这是一个看脸的时代啊!

<link />
提问
扫一扫
丁香实验小程序二维码
实验小助手
丁香实验公众号二维码
关注公众号
反馈
TOP
打开小程序