miRNA的识别预测方法
互联网
- 相关专题
- 解读miRNA (MicroRNA)
多个研究小组采用生物化学结合生物信息学的方法开展对miRNAs的研究工作。由于据推测都是由Dicer酶降解RNA得到的,21—25个碱基大小、有5’端磷酸基和3’羟基的RNA片断,有的实验室采用改良的定向克隆方法来筛选具有相同特征的小分子——筛选一定大小的RNA分子,连接到3’和5’的适配子(adapters),逆转录并通过PCR扩增、亚克隆并测序 。miRNA前体在基因组上的定位和聚类是通过向基因组数据库查询进行。这个方法有助于判断miRNAs是否是mRNAs、tRNAs、rRNAs等分子的降解产物。
有的实验室通过一种RNA folding program ’mfold’ 来判断C. elegans 和C. briggsae 之间的高度保守区域是否含有潜在的miRNA前体,然后用Northern Blots的方法来确定这些miRNAs是否真的表达了。
尽管有数百个miRNAs通过生化或者是生物信息学的方法被鉴别出来,已经鉴别出来的miRNAs只不过是沧海一粟,由于很多已经鉴别出来的miRNAs是从单个克隆中鉴别出来的,所以可以假设还有很多miRNAs在分离和鉴定过程中被“漏掉”了,测序 工作还远远不够。
生物信息学方法是依据在不同的物种 中,其成熟的miRNA 具有较大的序列同源性以及前体的茎环结构具有相当大的保守性这一特征在基因组数据库中搜索新的miRNA 基因。该方法根据比较基因组学原理并结合生物信息软件在已测序基因组中进行搜索比对,根据同源性的高低再进行RNA二级结构预测,将符合条件的候选miRNA与已经通过实验鉴定的miRNA分子进行比较分析,最终确定该物种miRNA的分布及数量。近年来随着miRNA预测方法的不断发展,人们发现的miRNA数量呈几何级数增长。这些预测方法从简单的序列比对搜索发展到现在的机器学习算法,程序设计越来越智能化,复杂化。
随着人miRNA基因转录出的pri-miRNA迅速加工成具有茎环结构的pre-miRNA,随后被切割成miRNA:miRNundefined双体,并被选择性地组合进核糖核酸沉默诱导复合体(RISC)并进行靶基因识别。在相似的物种 中,miRNA是很保守的;但在相距较远的物种间,miRNA又有一定的分歧,尤其体现在pre-miRNA上。这些miRNA功能作用机制的阐明为预测软件(表1.1)的研发提供了理论依据,但仍需要不断修补和完善。
程序名 | 适用方式 | 算法 | 输入序列 | 长度 | 涉及的程序 | 适用 |
miRscan | Web | N | 两物种比对序列 | <100bp | Blast | 线虫 |
miRseeker | Local | N | — | — | Mfold、AVID、Blast | 果蝇 |
ERPIN | Local/Web | — | Fasta序列、Fasta文件 | — | Blast | 动植物 |
Srnaloop | Local | N | Fasta序列 | — | RepeatMasker、Blast、RNAfold | 线虫 |
MIRFINDER | Local | SVM | 两物种比对序列 | — | RNAfold、RepeatMasker、PatScan、RNAVIZ | 植物 |
PalGrade | Local | SVM | 基因组序列 | — | RNAfold | 人 |
MiRAlign | Web | N | Fasta序列 | 50-300bp | RNAfold、ClustalW、RNAforester | 动植物 |
microHARVESTER | Web | N | pre-miRNA、miRNA | <450bp | RNAfold、Blast、T-Coffee | 植物 |
findMiRNA | Local | N | Fasta序列 | — | RNAfold、Blast、mfold | 拟南芥 |
miR-abela | Web | SVM | Fasta序列、Fasta文件 | <1000bp | RNAfold、SVMlight | 动物 |
BayesMiRNAfind | Web | NBS | Fasta序列 | <500Kbp | Mfold、BLAT | 动物 |
ProMiRⅡ | Local/Web | HMM | 序列(只包含A、G和C,T或U) | 70-150bp | RNAfold、Blast、pipeline vist、HMmiRNApairwise | 动物 |
Vmir | Local | — | 基因组序列 | <2Mbp | RNAfold、mFold | 病毒 |
RNAz+RNAmicro | Local | SVM | 多物种比对序列 | <400bp | RNAz、libSVM | 动物 |
Microprocessor SVM | Local/Web | SVM | Fasta序列 | <180bp | RNAfold、ScorePin、 Gist SVM | 动物 |