洛噜啦噜啦嘞
最近做一个基因调控网络(对我来说最重要的部分是做贝叶斯网络的建模,但在数据的提取上我搞不清楚了)。拿到一些微阵列的数据后(ncbi上geo的,有txt和xml格式),我要做这个网络需要其中的那些信息呢?从我的角度来看我认为是找到1.有多少个基因 2.他们在一个时刻时候的状态(这个我就不是特别清楚),不止这个思路对么?
dxy_btpk2zd7
建议还是先看看GEO和基因表达的科普文章。GEO里的就是基因表达数据,有原始数据,有预处理过的。一般你最后拿到的应该是一个矩阵,行代表基因(通常会有2到5万),列是样本。你就从这个矩阵里挑基因出来,学习BN即可。当然,如何挑基因还是个很tricky的问题,也有很多方法。
关于重构基因调控网络,方法已经有很多。选取何种方法,关键取决于你想通过网络得到何种信息。BN十多年前就已经有所应用,听起来很fancy,但是在构建大规模的调控网络上目前没啥优势,样本量有限啊。
相关产品推荐