丁香实验_LOGO
登录
提问
我要登录
|免费注册
点赞
收藏
wx-share
分享

miRNA(微RNA)的发现、验证及靶基因研究

互联网

4777
相关专题
解读miRNA (MicroRNA)

1 实验方法识别MicroRNA

1.1 建立富集microRNA 的cDNA 文库

目前主要有两种构建富集microRNA 的cDNA 文库 的方法。

第一种方法是将一个组织中的全部RNA经变性聚丙烯酰胺凝胶电泳分离, 回收19~25 nt RNA小片段, 随后在这些小片段RNA的3'和5'端连上接头,逆转录后用与接头对应的引物进行PCR 扩增,随后将这些片段克隆至载体 以构建cDNA文库, 并对其每一个克隆进行测序[1]。

第二种方是利用15% 变性聚丙烯酰胺凝胶电泳从总RNA 中分离出16~28 nt小片段后, 用poly(A)聚合酶在小片段RNA的3'端进行多聚腺苷酸化反应。逆转录得到cDNA 后, 再在cDNA 的3' 端进行多聚鸟苷酸化反应, 随后进行PCR 扩增, 最后克隆建立cDNA 文库 并对克隆进行测序[2]。

随着科技的发展, 测序技术也不断进步, 例如Lu 等[3]利用大规模平行标记测序(MPSS)技术对小片段RNA 进行高效测序从而改进目前对单个克隆的测序。利用MPSS 技术, 一个标签序列可以一次性测出一段序列中的17个核苷酸序列, 测序过程包括标签库的建立、微珠与标签的连接、酶切连接反应等步骤。

1.2 基因芯片法

嵌合基因芯片使用高浓度探针体系, 几乎可以覆盖基因组中的每一个核苷酸。这个转录分析体系能够识别新的转录物, 包括microRNA 前体序列。然而嵌合基因芯片法对于microRNA分析不是最佳的方法, 因为大多数的探针可能不能与microRNA 或siRNA 序列配对。目前许多探针和微阵列都是特别为检测已知的microRNA而设计, 包括将microRNA序列用连接序列连接于微阵列, 而这些连接序列在基因组中是无同源性的[4]。这些microRNA 基因芯片可以用于检测特殊的序列, 也可以用于确定microRNA 在不同组织和不同物种间的表达情况, 以及分析与它们对应的靶序列的表达模式。

2 生物信息学方法识别microRNA

直接克隆法获得的大量microRNA 特征信息及多种模式生物基因组测序工作的相继完成使得全基因组搜索microRNA成为可能[5]。目前, 人们依据已知microRNA的特征信息及其对靶分子的作用方式建立了多种microRNA 的计算机识别方法。

2.1 利用序列和结构的保守性搜索microRNA

利用microRNA 序列和结构的保守性在全基因组范围内搜索microRNA是最常用的搜索方法, 即通过对microRNA及其成熟序列的一级和二级结构保守性分析寻找新的候选分子。一些实验室通过同源性搜索, 即利用microRNA在相关物种中的保守性开发设计软件搜索相关物种中的同源分子, 也有一些实验室通过研究和总结microRNA的二级结构特征设计软件搜索新的microRNA 候选分子。

一种典型的利用同源性搜索而设计的软件是srnaloop, 它是由哈佛大学医学院的Grad等利用microRNA的序列保守性和结构相似性设计的, 在线虫基因组中搜索到了214 个可能的microRNA 基因。Srnaloop 是一个类似于BLAST 的应用程序, 相比于BLAST, srnaloop支持更短的片段并排列成互补的碱基对(包括GU配对)。从srnaloop网站(http://arep.med.harvard.edu/microRNA/)可获取该软件详细信息并下载该软件。最近, 一些实验室开发了依赖比对在基因组中识别已知microRNA同系物的方法, 它们可以在序列和结构层次与已知microRNA进行比对寻找新的microRNA。例如Wang等开发了一种依靠序列和结构比对来寻找动物中的microRNA的计算机方法MiRAlign, 它比起之前的同源性搜索来说有两个主要的特点: 一是它能找到相对较远的同系物; 第二, 该软件考虑到更多的序列保守性特点。另外,Nam 等开发的ProMiR 是一种microRNA 序列和结构的统计学联合软件, 是一般microRNA预测方法的补充, 可以识别亲缘关系近或远的同系物。它可以在人类基因组中搜索无论强或弱的保守的茎环结构。ProMiR成功的检测到了与已知microRNA 基因不同的新的microRNA 基因, 经过RT-PCR 的验证, 人们发现这些新的23个基因中有9个(39%)能够在海拉细胞中表达]。Nam 等开发了ProMiR的升级版ProMiR II, 它整合了更多的microRNA特征, 如自由能数据库、G/C 比例、保守性得分、候选序列熵值等。

MiRscan是由Lim等依据与已知microRNA相似性开发、设计的。该软件分别在线虫和人类中预测了35个和107个新的microRNA, 其中许多都经过了实验验证。此软件需要先经过两种线虫C.elegans和 C. briggsae中已经确认的microRNA的驯化, 再利用其他发夹结构与这个驯化体系的相似性寻找这两个物种中其余的microRNA。MiRscan 在线地址为http://genes.mit.edu/mirscan/。加利福尼亚大学的Lai等开发的miRseeker不仅利用序列的保守性,还利用microRNA特殊的保守模式, 例如发夹结构的茎比环状序列更加保守等信息来识别microRNA。它将保守的内含子和基因间隔区序列附加于RNA 折叠和评估程序从而识别出保守的含有茎环结构的microRNA前体。他们利用miRSeeker 在果蝇中寻找到了48个microRNA, 其中24个经过了实验的验证。Berezikov 等[22]的系统阴影法是对miRSeeker的改进, 他们通过对10个灵长类物种中的122个microRNA进行测序后发现了microRNA基因的保守性特点。这种强保守性表现在microRNA发夹结构的茎上, 而在环上却有很大的变动, 这个特点已被用来跨物种预测新的microRNA。这些软件都是总结了已知microRNA 的序列和结构特征后, 将其应用于其他microRNA的预测, 另外Bonnet等证明microRNA的序列具有比tRNAs和rRNAs序列更低的自由能, 说明microRNA 二级结构的热力学稳定性也可以用来设计软件搜索microRNA。RNAz 软件结合热力学稳定性和二级结构的保守性来预测非编码RNA, 此软件成功地应用于在多个物种寻找microRNA 分子。

2.2 利用靶序列的保守性识别microRNA

利用同源性搜索microRNA 主要是在相近物种间搜索同源的microRNA。如果想要找出未曾发现的新microRNA就必须采用其他搜索策略, 例如利用靶序列的保守性搜索microRNA。在生物体内, 多个microRNA 可能作用于同一个mRNA靶分子, 另一方面, 同一个microRNA 也可能调控多个靶分子的表达。目前, 一些实验室利用靶序列潜在的保守性作为识别microRNA 的一个重要的依据。在成熟microRNA 中, 5' 区域2~8 位置的7个核苷酸被称为种子序列, 它们在与靶mRNA 结合中起着重要的作用。通过基因组系统比较分析法, Xie等在mRNA 的3'UTR 区发现了106 个保守的基序, 其中72个模体与大约一半的已知microRNA的5'端相结合组成6~8 bp的种子双螺旋。根据这一结果, 他们使用mRNA上完整的保守模体在人类中预测到了129个新的microRNA。同样的靶序列预测microRNA 方法也应用到了拟南芥、果蝇和线虫中。

findMicroRNA是Adai等利用单基因组方法设计的在拟南芥中搜索microRNA的软件, 它主要依赖植物microRNA与其靶序列紧密的互补性来识别候选microRNA。随后这个软件要进一步对这些候选microRNA成熟序列的相邻序列的互补性进行分析, 使得一个RNA内的茎环结构的组成和已知microRNA 前体结构保持一致。拟南芥基因组中有29399个转录本可以和27987个特定基因座相对应, 用此软件对其分析可以在基因间隔区内识别潜在的microRNA前体序列。

实验方法和计算机方法识别microRNA 各有优缺点。就实验法检测microRNA来看, 当microRNA在生物体内表达量低或在特定阶段表达时, 就很难检测到microRNA。一些microRNA 由于其自身的特性, 包括序列组成或转录后编辑或甲基化修饰而难以克隆。由于大多数内源siRNA 和microRNA 的低水平表达产生的低信号使得利用基因芯片技术鉴定microRNA也困难重重。近年来, 随着人类基因组和许多模式生物基因组测序工作的完成, 利用计算机搜索microRNA的方法逐渐普及, 但是利用生物信息学搜索出的新的microRNA 中有很多并非是真正的microRNA, 所以计算机搜索出的microRNA还需经过实验验证以最终确定其是否为真正的microRNA。另外, 对于一些序列上不是十分保守或二级结构特征不明显的新的microRNA, 使用计算机方法也难以检测到。综上所述, 只有将实验方法和计算机方法相结合起来, 才能在各种物种中准确找到尽可能多的新microRNA。

3 microRNA的实验验证

采用计算机方法预测或实验方法获得的microRNA还需要进一步进行实验验证, 只有能够在生物体内稳定存在的才能最终确定为microRNA。而microRNA 的验证是microRNA鉴别工作中的一个瓶颈, 因为microRNA表达量较低, 而目前的验证方法又不够灵敏。一般来说, 计算机搜索获得的microRNA 如果被证明存在大约22nt的成熟序列表达就可被认为是真正的microRNA。一般验证microRNA的方法主要可以分为两类: 能够确定成熟microRNA精确末端的方法和能证明其表达但不能识别其精确末端的方法[6]。

目前有多种方法可以用于验证microRNA, 在这里主要介绍两类验证microRNA 的实验方法。

(1)依赖杂交的实验方法。这类方法首先需要根据预测的microRNA的成熟序列设计探针, 这些特殊标记的探针可用于Northern杂交分析、引物延伸、基因芯片分析和原位杂交等方法验证microRNA的表达。Northern杂交法是目前验证microRNA 表达应用最广泛且有效的的方法, 它能够提供所预测microRNA的有关大小和表达信息。引物延伸分析法能够确定microRNA的5'末端,可作为Northern杂交的补充[7]。这种方法所用的引物比所预测的microRNA少几个核苷酸, 它被杂交至RNA 样品上, 并以RNA 为模板经逆转录酶延伸, 最后通过凝胶电泳检测延伸产物[8],但是通过这种方法只能识别microRNA的5'端。这种引物延伸法的相反的策略叫做RAKE微阵列法, 在这种方法中, RNA在微阵列上与探针杂交, 并作为引物经Klenow 酶延伸, 引物能延伸的RNA 即为表达的候选microRNA。RAKE 首先是为了研究已知microRNA的表达模式所设计的, 但是它可以高产量的确定所预测microRNA 的3' 端。

(2)依赖克隆的实验方法。例如依赖PCR 的定向克隆法, 该方法使用一对引物, 其中一个引物是能与5'接头互补的通用引物, 另一个引物与microRNA的3'区域相同, 这样有利于从小RNA 文库中扩增出特定的cDNA 克隆[4]。这种方法只能测定出microRNA的一个末端(5'端), 它具有较高灵敏度但是当不知道microRNA 成熟序列时却很难操作。另一种定向克隆的方法是根据候选microRNA的序列设计探针, 这些经生物素标记的探针与RNA 样品杂交后经筛选出阳性克隆构建文库并进行测序。这个方法的优点是可以推测出成熟microRNA 的完整序列[9]。

一些实验室正在研究开发microRNA识别和鉴定的综合软件, 将生物信息学预测、实验鉴定和表达验证相结合, 更为有效和准确的预测microRNA, 例如PalGrade软件就是集合了生物信息学预测、基因芯片分析以及直接序列克隆为一体的综合的microRNA 预测软件。PalGrade 由Bentwich 等[9]开发, 具体步骤如下: (1)在整个人类基因组中通过计算机方法搜索发夹结构; (2)对保守的、重复的和蛋白质编码区域的发夹结构进行注释; (3)利用热力学稳定性和结构特征对每一个发夹结构打分, 选出高分的已知的microRNA发夹和相对低分的基因组发夹; (4)通过高产microRNA基因芯片在不同组织(胎盘, 睾丸, 胸腺, 大脑和前列腺)中测定计算机预测的microRNA的表达; (5)对于在基因芯片中显示出强信号的microRNA基因使用一种新的定向序列克隆和测序的方法进行验证。他们应用这种软件克隆和测序出89个新的人类的microRNA。其中53个在灵长类动物中是不保守的。

目前, 有许多新的技术例如MPSS等方法逐渐应用于microRNA 的搜索中, 大规模的microRNA 识别鉴定已指日可待。值得注意的是, 单凭一种方法鉴定microRNA通常是不准确的, 因此需要将几种实验方法或计算机方法相结合起来, 才能更全面、更准确地寻找和鉴定出新的microRNA。

提问
扫一扫
丁香实验小程序二维码
实验小助手
丁香实验公众号二维码
扫码领资料
反馈
TOP
打开小程序