是不是觉得DAVID数据库太low了,挖数据都懒得用,显得自己没见过什么事面一样……
这么多生信数据库,哪个数据库用得最多呢?其实排一下序,不难看出,生信数据库里,被用到最多的,不是GEO,不是TCGA,也不是什么KEGG。而是:
没错,DAVID……排名甚至都在GeneBank之上。这个数据库的引用率和索引量都很高:
DAVID主要用途其实就是聚类分析,由于是2003年的老数据库,也基本没多大的变化:
所以很多人其实都觉得DAVID有点low……
比DAVID好的工具其实有很多,比如这个“恩富[R”其实作为聚类工具的话,就能获得比DAVID更多的聚类信息。
和DAVID差不多,也是输入基因列表:
在GOterm上,“恩富[R”能整合更多的GO数据库:
Pathway分析也一样:
一般的这样的基因列表都是分析表达数据获得的,那基因的mRNA表达数据,上游调控应该是通过转录因子完成的,所以对于基因列表中共有的转录因子分析,其实也是在聚类分析中必不可少的:
“恩富[R”中也是通过不同的ChIP-Seq数据库的分析获得的这些结果,在列表中,鼠标停留在转录因子上,也会显示对应的列表中的靶基因:
除此之外,“恩富[R”还能分析不同细胞组织中的表达以及表达关系:
甚至是分析不同GSE中基因的高表达以及低表达的热图:
这些功能相对与DAVID这样的比较旧的数据库而言,分析获得的结果会更多,也能找到不同的提示。有兴趣就自己去尝试下吧……