丁香实验_LOGO
登录
提问
我要登录
|免费注册
点赞
收藏
wx-share
分享

不会 python,不懂 R?教你一招快速分析基因表达谱

丁香园

2078

前几天学霸平台有一篇推文《这才是科研狗脱贫的王道》,开篇用一组气势磅礴的排比句道破生物科研狗脱贫的天机 ---- 生物信息学。


的确有师姐靠生物信息学发高分文章,也有师兄毕业进华大、博奥、华因康,持股分红薪资强,摇身一变,从此走上人生巅峰。


可是,作为科研狗,想要走上人生巅峰,首先你得能毕业。

<1>


说到生物信息学(bioinformatics),通常在处理高通量数据的过程中,我们往往需要借助一些表达谱信息进行比对分析,通过不同类型样本之间的比较,获得与疾病表型存在显著相关性的基因标识。


而这一系列过程中,不仅需要生物知识,而且需要懂信息,也就是会一门计算机语言,比如 python、R 语言等。


但是对于刚入门的科研狗,不会 python ,不懂 R 语言,怎么破?今天小编教你一招快速分析基因表达谱。



纳尼,你在逗我吗?对,你没看错,就是伟大而神奇的 NCBI 。惊不惊喜,意不意外?用好这个 Web 版工具,距离人生巅峰已经不远了。




<2>


你可能不知道,NCBI 为了让我们变得更傻瓜而变的更加智能,去年就已经把表达谱数据和基因数据 Gene 整合到一起。


我们只要在 NCBI 首页里,左边选择Gene,右边直接搜索expressioncategory ubiquitous expression就可以得到所有含有表达谱的基因:共 40963 个。


以比较常见的 MAPK1 基因为例,



点进去,乍一看是不是和原来没什么差别?不过仔细观察,差别还是有的——在基因的描述下面多了一行Expression


点击See more,会直接下拉到表达谱的柱状图上,对,你没有看错,就是已经给你分析好的柱状图:


从图中可以明显的看出 MAPK1 基因在不同组织里的表达程度,注意,在右上角有个details的按钮,点一下,就会直接链接到这里:


右上角有个「Download」按钮,我们可以点击就能直接下载这个柱状图所对应的样本 SRA 数据,是不是很惊喜?


这还没有完,这只是一部分数据,以 MAPK1 基因为例,总共有四个测序的数据在里面,可以通过下拉菜单来切换:


最后,One more thing,有时候可能你想要搜索基因在某种动物中的表达程度,比如小鼠的肝脏组织或者人类的肾脏组织。即要怎么样搜索你所关心的表达模式呢?


这个只要限定搜索关键词就可以了,下面我们还是以 MAPK1 基因为例,比如说: MAPK1 在小鼠肝脏组织的表达模式



输入「mouse[orgn] liver[expression/tissuesMPAK1」搜索到的是在小鼠(mouse[orgn])的肝脏组织(liver[expression/tissues])中有表达数据的与 MPAK1 基因相关的基因,共 34 个。


再比如: MAPK1 在人类肝脏组织的表达模式,包括已知互相作用基因有 247 个。



好好利用 NCBI 吧,它将是你走上人生巅峰的第一步,相信不久的我们,都会顺利毕业,升职加薪,走上人生巅峰。

提问
扫一扫
丁香实验小程序二维码
实验小助手
丁香实验公众号二维码
扫码领资料
反馈
TOP
打开小程序