不会 python,不懂 R?教你一招快速分析基因表达谱 | 实验时间
丁香园
前几天学霸平台有一篇推文《这才是科研狗脱贫的王道》,开篇用一组气势磅礴的排比句道破生物科研狗脱贫的天机----生物信息学。
的确有师姐靠生物信息学发高分文章,也有师兄毕业进华大、博奥、华因康,持股分红薪资强,摇身一变,从此走上人生巅峰。
可是,作为科研狗,想要走上人生巅峰,首先你得能毕业。
<1>
说到生物信息学(bioinformatics),通常在处理高通量数据的过程中,我们往往需要借助一些表达谱信息进行比对分析,通过不同类型样本之间的比较,获得与疾病表型存在显著相关性的基因标识。
而这一系列过程中,不仅需要生物知识,而且需要懂信息,也就是会一门计算机语言,比如 python、R 语言等。
但是对于刚入门的科研狗,不会 python ,不懂 R 语言,怎么破?今天小编教你一招快速分析基因表达谱。
纳尼,你在逗我吗?对,你没看错,就是伟大而神奇的 NCBI 。惊不惊喜,意不意外?用好这个 Web 版工具,距离人生巅峰已经不远了。
<2>
你可能不知道,NCBI 为了让我们变得更傻瓜而变的更加智能,去年就已经把表达谱数据和基因数据 Gene 整合到一起。
我们只要在 NCBI 首页里,左边选择「Gene」,右边直接搜索「expressioncategory ubiquitous expression」就可以得到所有含有表达谱的基因:共 40963 个。
以比较常见的 MAPK1 基因为例,
点进去,乍一看是不是和原来没什么差别?不过仔细观察,差别还是有的——在基因的描述下面多了一行「Expression」:
点击「See more」,会直接下拉到表达谱的柱状图上,对,你没有看错,就是已经给你分析好的柱状图:
从图中可以明显的看出 MAPK1 基因在不同组织里的表达程度,注意,在右上角有个「details」的按钮,点一下,就会直接链接到这里:
右上角有个「Download」按钮,我们可以点击就能直接下载这个柱状图所对应的样本 SRA 数据,是不是很惊喜?
这还没有完,这只是一部分数据,以 MAPK1 基因为例,总共有四个测序的数据在里面,可以通过下拉菜单来切换:
最后,One more thing,有时候可能你想要搜索基因在某种动物中的表达程度,比如小鼠的肝脏组织或者人类的肾脏组织。即要怎么样搜索你所关心的表达模式呢?
这个只要限定搜索关键词就可以了,下面我们还是以 MAPK1 基因为例,比如说: MAPK1 在小鼠肝脏组织的表达模式
输入「mouse[orgn] liver[expression/tissuesMPAK1」搜索到的是在小鼠(mouse[orgn])的肝脏组织(liver[expression/tissues])中有表达数据的与 MPAK1 基因相关的基因,共 34 个。
再比如: MAPK1 在人类肝脏组织的表达模式,包括已知互相作用基因有 247 个。
好好利用 NCBI 吧,它将是你走上人生巅峰的第一步,相信不久的我们,都会顺利毕业,升职加薪,走上人生巅峰。