【共享】SiRNA序列的设计方法
丁香园论坛
7382
大量实验表明,针对同一靶基因的不同siRNA序列具有不同的沉默效率,为了能够运用RNAi技术更有效地沉默靶基因,需要在RNAi的第一步,也是其成功与否的关键环节―siRNA序列的设计方面进行更多的改进。本文将在以下几个方面探讨siRNA序列设计方面的最新研究进展,作为应用RNAi技术时的参考。
RNAi最终要通过siRNA片段与靶基因结合并使之降解,因此,确保高度同源于靶基因而绝无与其他基因同源的siRNA序列,是决定RNAi特异性的关键所在,也是siRNA设计的基本原则。从具有不同沉默效率的siRNA序列中筛选出高效的siRNA序列,需要经过严密的设计和不断的实验检验[1]。
1.siRNA序列在靶基因中的位置
从靶基因起始密码子AUG下游50~100个核苷酸开始搜寻理想的siRNA序列,越靠近靶基因的3′端,其基因沉默效果可能越好[2]。以前的研究表明:不要以5′非翻译区(5′UTR)和3′非翻译区(3′UTR)及起始密码子附近序列作为设计siRNA的模板,这些区域含有调节蛋白结合位点(如翻译起始复合物),调节蛋白可与RISC竞争结合siRNA序列,降低RNAi效应[3];也要避开外显子与外显子的交界区域和单核苷酸多形性(SNP)区域。最近,Yokota等发现在HCV(丙型肝炎病毒)基因组中,5′UTR是一个高度保守区,使之成为siRNA理想的靶点。运用RNAi技术作用于5′UTR或3′UTR序列,同样可引起靶基因沉默[4,5],这些发现使基因功能分析领域扩展到5′UTR和3′UTR内。
2. siRNA序列的起始碱基与长度
SiRNA序列最好为AA(N n)UU(N 代表任意碱基;n为碱基数目,在19~29 nt之间), NA(N n) UU和NA(N n) NN序列也可以。以前的研究表明,典型siRNA 的三大结构特征是:长度为21~23 nt;siRNA双链的3′端各有两个突出碱基;siRNA双链的5′端有磷酸基团。以AA?N19 标准设计的siRNA,在哺乳动物细胞中70%~80%可产生RNAi 作用。但是一些具有较小脱靶效应的siRNA序列不是以AA为起始的,所以现在不推荐以“AA为起始”作为选择标准之一[6]。最新研究表明[7,8] ,27 nt或29 nt的siRNA与21 nt siRNA相比:(1)其抑制活性可提高数倍以上;(2)不易于诱导干扰素反应和激活PKR;(3)一些基因对21 nt siRNA不敏感,但是可以被27 nt siRNA有效的抑制;(4)与21 nt SiRNA相比,27 nt SiRNA对靶基因的最大抑制率可在相对低的浓度下得到。另外,在选择siRNA 序列时,要考虑到所用启动子的类型。U6启动子要求转录产物的第一个碱基是G,正反义链均如此;H1启动子转录产物的第一位碱基为U、G、C均不影响基因的沉默效果[9]。
3 .siRNA 3′端突出碱基的选择
当siRNA 的3′端突出碱基为UU时,其基因抑制效率最高;但是3′端的突出碱基不能为G,因为RNase会降解以G为末尾的RNA 单链。Elbashir等[2]建议用dTdT取代3′端的2 个碱基突出,增强siRNA 双链复合体的稳定性。需要注意的是,由于双链siRNA中的正义链不参与对靶mRNA的识别,所以正义链的3′端突出碱基可以用dTdT替代,但是反义链3′端突出碱基必需与靶mRNA序列相同的。
4 .siRNA序列中G/ C含量的选择
在siRNA 序列中,G/C 含量的选择比确定以AA 为起始的序列更重要。具有均衡碱基含量(即G/C含量在30%~70% ) 的序列可以作为siRNA候选序列;而具有较低G/C含量(30%~52%)的siRNA序列,其沉默基因效果较好[10]。
5 .siRNA 中应避免连续的单一碱基和反向重复序列[10,11]
因为连续2个以上的G和C可以降低双链RNA 的内在稳定性,从而抑制RNAi作用[12];连续3个以上的U和A可能终止由RNA Polymerase III介导的转录[13]。siRNA序列中的重复序列或回文结构可能形成发夹状结构,这种结构的存在可以降低siRNA的有效浓度和沉默效率。
6 .siRNA双链的内在稳定性
siRNA反义链5’端具有较低的热稳定性,即反义链5’端的第一个碱基为A或U;siRNA正义链的5’端第一个碱基为G或C。因为siRNA解旋可能从富含A/U的反义链5’端有效的起始,有利于反义链与RISC的结合,而抑制正义链与RISC的结合[14]。
7. siRNA正义链的碱基偏爱性
以3’端具有2 个碱基突出的19 nt siRNA为例,正义链的第一位和第十九位碱基为A;正义链的第十位碱基为U;正义链的第十三位碱基不为G;正义链的第十九位碱基不为G或C时,siRNA 序列具有较高的基因沉默效率[10]。
8 .siRNA 序列的特异性
为了确保侯选siRNA 序列只沉默单一的靶基因, 侯选siRNA 序列应在美国NCBI (National Center for Biotechnology Information) 的EST 或Unigene 数据库进行BLAST 同源性比对。当siRNA 序列只同源于靶基因时,才可以用于下一步的基因功能研究。
9 .可能影响siRNA 效能的其他因素
RNA 结合蛋白的结合情况;mRNA 的二、三级结构;mRNA 的丰度、半衰期;以及所表达蛋白质的半衰期等等[15] 也可能影响siRNA的效能。有研究表明,与反义技术或核酶技术不同,在RNAi 过程中,靶mRNA 的二级结构对基因沉默的效果没有太大影响[16]为了使siRNA具有最大的靶向特异性,在条件允许的情况下应该尽可能的全面考虑。
10 .设计的siRNA序列数目
目前没有发现siRNA的干扰效率与mRNA中具体位置的关系,为确保对靶mRNA的有效抑制,针对每一个靶基因应该设计4条以上siRNA序列,进行化学合成后,通过实验筛选出沉默效率最高的siRNA 序列进行下一步的基因功能研究。
需要注意的是,有的siRNA序列在设计时没有遵守这些指导方针,实验证明也具有很高的干扰效应,这表明,我们只能根据上述指导方针设计出理论上具有较高沉默效应的siRNA序列,siRNA的最终活性需要用实验来验证 。