1

7

分享

【GEO 应用】一篇时髦的生信文章是如何炼成的——检索篇

科研论文时间2022-07-15

728

随着公共网络数据的增多，测序数据分析技术的发展，我们可以利用的数据越来越多。很多时候，我们可以直接对公共数据库的数据进行分析，进而可以进行数据挖掘，得到的结果用来发表论文。

生信信息学文献复现

这篇《Identification of candidate biomarkers and analysis of prognostic values in ovarian caner by integrated bioinfomatics analysis》（PMID: 27757782. IF: 2.92 ）就是利用网络公共芯片数据对卵巢癌的发生进行的数据挖掘。

这种芯片数据分析的论文现在越来越多了。

下面，我们就根据这篇文献，帮大家分析一下这类文献是如何炼成的。

一、文章的基本脉络

通过阅读文献的材料方法我们可以发现，这篇文献的使用了 3 组数据，都是来自于 GEO 数据库。

之前没有接触过芯片数据的同学可能不知道 GEO 数据库是什么。简单来说，GEO 就是一个可以检索芯片数据的数据库。至于其中的 GSE36668 这样的编号，就类似于文献的 PMID 一样，为自身数据库给每个数据集自己的编码。

二、我们来试一下

1. 我们可以进入 GEO 数据库。（https://www.ncbi.nlm.nih.gov/gds/）

2. 检索关键词，可以是疾病（breast cancer），可以是芯片物种（human），也可以是定向检索 GSE 编码。我们检索 GSE36668，即可得到这个芯片的相关信息。

3. 点击进去之后我们可以看到关于这个芯片的详细信息，这样，这个芯片的信息就检索出来了。

这是第一步，那么对于这个芯片我们要怎么分析呢？

这篇文章里面用到的是「GEO2R」。这个工具是 GEO 数据库自己开发的专门用来分析芯片数据的在线的工具。

三、我们要怎么用呢？

1. 我们在刚才检索的到的界面往下拉即可发现有一个「GEO2R」的标志。

2. 点击「GEO2R」看到这个数据集里具体的数据信息。

3. 然后对分析的数据进行分组。按照文章的题目我们要分成肿瘤组和正常组。

4. 分好组后，点击 top250 即可看到这组数据集里面前 250 个最有差异的基因。点击「top250」。

5. 如下图显示为 top250 的结果。结果中我们可以看到所有探针的差异的 p 值及矫正 p 值，也可以看到基因名，还有 logFC。

6. 同样，我们可以点击「save all results」即可得到这个数据集中所有的结果。

7. 这样的话，我们只需要全选—复制—粘贴到 excel 里面就行了。

按照矫正的 P 值（adj. P < 0.05）及 logFC 的绝对值 >1 即代表有差异。

通过 GEO2R 我们就能得到了差异的基因。按照这个文献的数据，选了三个数据集取交集。

相关产品推荐

生信分析

￥1500

ITP/ITP蛋白//蛋白/Recombinant Drosophila melanogaster GEO11329p1 (ITP)重组蛋白

￥69

SCI发表,SCI润色服务中国期刊，sci润色编辑翻译发表，SCI论文一站式改写检索服务，SCI论文初步评估，sci论文投稿期刊，sci投稿杂志选择

询价

孟德尔随机,孟德尔随机化研究分析公司，孟德尔随机化生信分析文章选题，孟德尔随机化服务价格费用

￥100

生信分析｜生物信息学分析服务

询价

所属专题

专题KV图

生信分析入门

52 内容1662 订阅

相关问答

问

类器官培养 50 问-应用篇

4 回答 820 围观

问

关于GEO生信

1 回答 327 围观

问

Meta分析知网CNKI 检索是用主题还是篇关摘

3 回答 2244 围观

相关方法

核酸序列检索

2024-05-14

一、动物管理篇：小鼠常见异常行为

2023-02-01

脂筏的分离和应用

2024-05-14

推荐阅读

【GEO 应用】GEO2R 分析工具更新大解析！不会 R 也能做生信

【操作步骤】如何从零开始拆解一篇肿瘤生信文章，并化为己用

【课题设计】生信分析只能发「灌水」文章？

关于丁香通

公司信息

个人用户

企业机构

无忧采购轻松科研

无忧采购轻松科研

提问

扫一扫

丁香实验小程序二维码

实验小助手

丁香实验公众号二维码

扫码领资料

反馈

TOP

打开小程序