RAPD技术应用中的一些问题及对策
互联网
焦锋,楼程富
(浙江大学蚕学系,杭州 310029)
摘要:综述了RAPD技术的一些理论性问题,包括RAPD与其它分子标记技术相比的优点,影响结果重复性的因素,显性标记产生的原因,条带取舍的标准等。提出在实验中解决这些问题的一些方法:严格控制反应条件,采用单倍体和单剂量标记,系统学研究中要结合其它方法进行分析,定位基因时要选用合适的群体等。
1 RAPD技术原理及特点
1.1原理RAPD(Random Amplified Polymorphic DNA),即随机扩增多态性DNA技术,是由美国科学家Wiliams和Welsh于1990年分别研究提出的,又称任意引物PCR。它的应用是基于这样的一个推理:对于同一模板DNA,用同一引物扩增既可能得到相同的带谱(模板基因组间可能具有同源性),也可能得到不同的带谱。仅在某一特定模板中出现的条带就可作为该模板的分子标记。事实上,不同基因组DNA总是一定差异的,所以用RAPD就可以进行分子标记研究。理论上讲,在一定的扩增条件下,扩增的条带数取决于基因组的复杂性。对特定的引物,复杂性越高的基因组所产生的扩增条带数也越多。
90年代前期RAPD技术得到广泛的应用,几乎所有的作物都有这方面的研究报告。但随着研究的深入,人们发现该技术存在一定的缺陷,并对此作了一些探索。本文仅就RAPD技术的原理和应用中存在的理论性问题及一些改进措施的研究作一综述。
1.2 RPAD特点 与PCR相比,具有以下几个特点:①RAPD使用的是随机引物,不需要预先了解目的的基因和相应的序列。②操作简便,实验周期短,能在较短的时间筛选大量样品。③引物具有普遍适就性,适用于自动化操作分析。
与RFLP相比,具有以下特点:①RAPD分析只需要少量模板,一次扩增仅需20-100ng,这对于DNA量很少的材料进行基因组分析有利。比如对花粉粒、原生质体、种子等的DNA分析是切实可行的。②RAPD标记具有更大的随机性,亦有利于图谱的构建。对于DNA含量大的和多倍体物种,RFLP探针会与多倍体的多个片段杂交,所得到的混合指纹会对其它等位基因的阐明带来困难。而且由于DNA量较大,进行单拷贝的Southern杂交不很实际,至少需要很长的曝光时间,并且已知的探针数量有限。RAPD大大增加了可构建遗传图谱物种的数量。③无需借助于有伤害性的同位素,耗费的人力物力少。④灵敏度高。引物中的个别碱基的变化会引起扩增条带和强度的剧烈变化,这是RFLP所无法比拟的。⑤RAPD标记可以覆盖整个基因组,包括编码和非编码区,可以反映整个基因组的变化。⑥RAPD产物有大于50%的条带扩增于单拷贝区,经过克隆和序列分析后,可作为RFLP和原位杂交的探针,在基因定位、克隆及辅助选择育种中可以广泛应用。
2 RAPD技术本身存在的问题及对策
RAPD技术是由多种成分参加的生化反应,反应中各种成分均为微量,尽管其反应灵敏度高,但是影响因素较多,会出现重复性差等一些问题。为了得到较稳定的结果,各种反应参数必须事先优化选择,操作中每一步都必须小心谨慎,以防止出现差错。
2.1 温度 RAPD一般反应条件是:变性92-95℃,常用94℃,30-60s;延伸72℃,60-120s;退火35-37℃,30-60s。变性和延伸温度一般没有太大变化,而退火温度影响较大。退火温度低,引物和模板结合特异性较差,出现的条带可能增多;退火温度高,引物和模板结合特异性增加。有人提出,在寻找基因差异为目的的实验中,退火采用33-34℃效果更好。在优化方案中,退火温度可能要提高,以便降低背景,得到少而清晰的"带"。温度的梯度率也是十分重要的,特别是退火与延伸之间的梯度尤为重要。各种仪器的控温、升降温性能均有差别,一些仪器(如一些旧型号的仪器)在到达特定的温度前就开始计时,一些PCR仪显示的温度与实际温度会有差异。这些在设计程序和结果分析时有必要考虑,所以注明所用仪器的生产厂家、品牌、规格,就显得很有必要,对于同一批实验,注意控制在同样的温度条件下进行反应,结果才有可比性。
2.2反应物的影响 PCR扩增受多种成分的制约,产物仅在部分循环中呈指数式(2)增长,逐渐将达到一个平台期,模板是关键制约因素之一,RAPD产物取决于此,实验中非常精确的模板浓度是十分关键的一个步骤。浓度过低,分子碰撞机率低,偶然性大,扩增产物不稳定;浓度过高,会增加非专一性扩增产物。更重要的是,若循环数控制不好,引物过早消耗完,后面循环中,PCR扩增产物的3端会和原模板及每一次循环的扩增产物退火,造成不等长度的延伸。因此,如果原模板浓度过高,非专一性扩增产物就足以形成背景,这是高浓度模板造成弥散型产物的原因。相对而言,模板纯度影响不大,即反应液中蛋白质、多糖、RNA等大分子物质影响不大。理想的模板和引物浓度能产生多态性丰富、强弱带分明的RAPD图谱。引物3端的重要性似乎更大。此外,Mg+2浓度也影响反应的参数包括产物的特异性和引物二聚体的形成,人们在各自的实验中得出不同的结论,大约在1.5-4mmol/L范围内。总之,各种反应物的浓度应事先进行筛选优化。
2.3污染问题 实验中应设空白对照,因为引物、各种缓冲液和双蒸水都会造成污染。而且Taq酶也可能出现污染,给分析带来困难,所以必须设置对照以排除系统误差。并且,酶也尽可能优化。
2.4扩增条带的取舍 重复性问题 为了克服RAPD重复性差的问题,应设置重复实验。作为DNA多态性标记位点的条带是应该可重复的,重复性好是最重要的取舍指标,而带的强弱不应该作为取舍的指标。有学者认为带的强弱与其在基因组中的拷贝数有关。但据Thormann对十字花科植物分析,RAPD产物的强弱与该产物在基因组中的拷贝数无直接关系,而与引物及模板的同源性程度有关。分析一个位点时,要作全面分析,若某一个体的全部带均弱,其模板可能有问题(浓度、分子量);若某一个体的大部分带与其它个体强度一致,仅有一条或少数几条带弱,可能存在拷贝数差异。重复性不好的弱带(无规律出现的带)可能由非专一性扩增、产物间退火或其它人为因素造成,不能记录。
异源双链问题 Ayliffe研究亚麻锈病菌时发现F1代中出现的一条带在亲本中没有出现,进一步研究发现这一条带是由2个等位基因组成的异源双链形成的,这2个等位基因除中间插入的38bp的序列外,其余序列相同。这种条带可以在后代中遗传,在该研究中这种条带大约占0.16%。在蜜蜂的研究中也发现了相似的问题,这种条带可以用单链核酸酶将其消除。也可以将电泳温度提高到60℃以上,使异源双链变性,以消除其影响。
非孟德尔遗传的条带 Heun等分析认为,在显示多态性的非模糊条带中有92.5%的表现为孟德尔显性遗传,其余的条带不符合孟德尔遗传,分析认为可能由不同的序列组成。一般实验中大多采用符合孟德尔遗传的条带进行分析。在连锁图谱分析中,基因型错误可以部分消除,即在F1代或1:1混合物中没有出现的条带,在其父母本中应尽可能去掉。
同一条带的同源性问题 Thormann将RAPD产物标记作探针,杂交结果表明,与探针片断迁移率一致的带有时并不同源,这种情况仅发生在种间。并比较了RFLP和RAPD标记在种内和种间得出的结果,发现RFLP和RAPD标记在种内水平的结果完全吻合,但在种以上等级的结果相差甚远,这说明在电泳结果的同一个带中,有可能存在序列不同但分子量相同的几条带,RAPD无法检测。这种可能在种内较少发生,而这种间可能性较大,Castagna用RFLP和RAPD比较研究也得出了相同的结论。
2.5电泳分辨率问题 电泳时,基因组不同位置的扩增产物共同移动的可能性是有的,即不同分子量的扩增产物可能在电泳时没有分开而形成一条带,凝胶分离系统和基因组的亲缘关系有可能提高这种概率。一般而言,聚丙烯酰胺和银染的分辨效果比琼脂糖和溴化乙铵要高,用较长(可达到20cm)或浓度更高(2%)的琼脂糖凝胶有助于提高分辨率。当然,随着分辨率和灵敏度的提高,更可能出现实验误差。所以有人评述:最保险而简单的方法是用琼脂糖电脉分离而且只注意那些无疑而重发性高的带。但是,聚丙烯酰胺和银染所揭示的高信息量的多态性无疑可加快分子标记的鉴定过程。
2.6显性标记问题 RAPD标记来自于模板DNA的复制,经过30一40次循环,扩增条带数量理论上可达2。原模板中扩增位点是纯合还是杂合已无法判断,因为纯合位点的扩增条带只相当于杂合位点的2倍,电泳时无法检测到其差别。杂交中。如果亲本一方为纯合体,F1代就可以全部表现出该条带;如为杂合体,该条带在F1中应为l:l分离,即一半后代有该条带,而另一半则没有。当然来自于多拷贝区的条带分析更为复杂。
3、应用中存在的问题及策略
3.1遗传图谱构建的问题 RAPD是一种显性标记,符合孟德尔遗传定律,不能区分杂合型和纯合型,因此在遗传分析及遗传图谱的构建等一些方面受到限制。目前,在实践中,主要利用了以下2种方法。
①利用单倍体 利用胚乳进行RAPD分析,可以克服构建遗传图谱中这些困难。因为针叶树的胚乳是单倍体,记录了杂合的母本染色体组在减数分裂过程中的遗传事件,不存在杂合型,进行RAPD遗传分析时,与共显性标记具有同样的遗传行为,是天然的优良作图材料。现在已进行遗传图谱构建的有湿地松、欧洲赤松、火炬松、杨树、日本柳杉和桉树。但是由于缺乏细胞遗传学的研究,暂时还不能确定连锁群和染色体之间的对应关系。国内尹佟明等利用马尾松的胚乳构建了分子图谱。这种研究所采用的作图材料不具备永久性质,作为解决方法之一是将所取的材料进行培养。转化为永久性群体,利用半同胞群体进行数量性状基因定位(Quantitative trait locus,QTL)研究。另一个方法是与集团分离法(Bulked segregant analysis ,BSA)相结合,通过与目标性状连锁的标记在单倍体群体中的分离,在图谱上进行基因定位或找出与目标性状相连锁的其它标记。
②将RAPD条带作为单剂量标记 单剂量标记(Single-dose RAPD markers)是从两物种和其杂交产生F1代的分子标记中选择的。选择构建图谱用的标记有2个原则:A、它们必须在一个亲本中存在而在另一个亲本中不存在;B、它们在后代中必须以l:1分离。这种方法相当于一个杂合体和一个隐性纯合体的测交,称为双向假测交(Two-way pseudo-testcross)。在多倍体植物中,不论基因组是如何组成的(异源多倍体或同源多倍体),也不论材料的多倍性水平如何,单剂量的标记都相当于简单的等位基因(同源多倍体)或相当于二倍体基因座上的杂合等位基因(异源多倍体)。因此根据这些单剂量标记的连锁情况可以构建分子图谱。RAPD条带作为单剂量标记使那些基因组DNA含最大,世代周期长的乔木和多倍体植物的遗传图谱研究走出了几乎停滞的状态。Grattapagalia利用这种策略首先构建了巨桉和尾叶桉的分子连锁图谱。Conner利用这种策略构建了3个苹果品种的分子图谱。Mudge利用甘蔗及杂交后代的RAPD条带作为单剂量标记进行连锁分析构建了甜根子草的51个连锁群,并分析了其染色体组的数目。虽然这些连锁图谱是个体特异性的,但可以为数量性状定位提供框架结构,为标记辅助选择育种奠定基础。
3.2系统学研究中的问题 系统学是RAPD研究最为迅速的领域,许多作物都用RAPD作过亲缘关系分析,大部分结果和形态分类结果相类似,仅有少数例外。但是近年来,有人对其结果的可靠性提出不同的看法,主要有以下几点:
①由于引物的竞争性等,基因组的RAPD位点有时不能全部检出,造成假象上的差异。根据这种情况,可以认为,RAPD可以应用于种间乃至近缘属之间关系的研究,但有一定的局限性。因不同种度的扩增产物难以作同源性分析,只能作表征分析,从而只能从相似性或遗传距离上去分析亲缘关系。其结果可能与真实的系统关系相左。
②因RAPD在种间或属间的变异水平很高,取样代表性是一个较大的问题,即利用某一个体代表一个种或用一个种代表一个属都可能造成结果的偏差。因而,最好能找到群体特异或种特异性的条带。
③在表征分析中另一个值得注意的问题是一些RAPD产物的出现存在相关关系,即一个位点与另一个位点相连锁。若将这个差异单独计算,相当于对某一性状极度加权。
④在系统发育学分析中,因为RAPD条带具有显性的遗传特征,多态性信息量较低。如果其符合二歧分枝树的假定,就可以对变化的性状予以加权,并进行分析。但是许多植物的核基因组是有性的二倍体,而且它们的进化历史是网状分枝树,不便于分析。通常认为叶绿体、线粒体和有些细菌及真菌的病原体符合二歧分枝树的假定。但由于其基因组较小,没有重组,它们的信息量只相当于核基因组中具有多个等位基因的一个同工酶座位,这样估算的基因多样性值的标准差理论上会比有多个核基因蛋白座位得出的大。其非编码区在一些动物类群中的进化速度很快,因此做种上水平研究时将会影响结果的准确性,但种下水平影响较小。
⑤RAPD和农艺性状的系统分析比较说明,二者相差不大,没有出现相反的情况。而且RAPD比农艺性状提供了更多的遗传信息。
总之,用RAPD作系统分析应结合其它方法,结果才更有说服力。
3.3标记、定位目的基因 标记、定位目的基因是相对较为缓慢的一个领域,这是因为RAPD标记探测的是整个基因组的变化,包括编码区和非编码区,要和基因位点联系起来有一定的困难。一般的变异群体性状的变化涉及到基因组内较大的范围(微效多基因),RAPD不可能全部检出。而且RAPD检出的多态性又不一定是性状变异的标志(可能扩增于非编码区)。另一困难是RAPD扩增的特异性片段有些为重复序列,转化为RFLP探针有一定困难。据Grattapaglia用48个RAPD片段所作的杂交实验表明,有53%来自于低拷贝区(<10),20.4%来自于10~100拷贝区,18.4%来自于100一1000拷贝区,8.2%来自于高度重复区(>1000)。这只有通过筛选出与单拷贝区连锁的标记予以解决。如果RAPD标记和基因位点或性状不能联系起来,其实用价值就会大大降低。为此人们作了以下探索。
①利用易位系、回复突变系、等位基因系、近交重组系等特殊材料 从理论上讲,除目的基因及邻近区域外,其它部分完全一致。如果检测出多态性,差异必定在目的基因及邻近区中,也就是说RAPD标记在这个范围内与目的基因连锁。但是要获得这些材料比较困难,例如等位基因系需要回交20代,时间太长。RAPD分析中一般用近等位基因系NILs(Near isogenic lines),回交6代以上即可。回交6代时,供体DNA的比例为l/128,用RAPD找到的与目的基因连锁的标记与目的基因在距离上还相当远。
②集团分离法(BSA)对不存在上述特殊生物模型的群体,可采用这种方法。即利用F2分离群体为材料,根据目的基因的表型把F2群体分为2群(例如抗病的和不抗的),每一群中将各个体DNA等量混合,这样形成2个DNA混合池。在每个基因池中,不管群体性状如何,在目的基因的表型上都是一致的,2个群体之间,目的基因的表型都是相反的。因此,在2个群体之间完全不同、在每个群体之内各个体间又是完全相同的RAPD扩增产物即可认为是与目的基因连锁的RAPD标记。这种方法相当于把分析材料作为近等位基因系。
在找到合适的分子标记后,既可直接用于辅助选择育种(Molecule-marker assisted selection,MAS),也可通过对特异片段的分离和两端测序将之转换为序列标志位点(Sequence-tagged sites,STS)。从这个分子标记出发找到目的基因需经过几个步骤:A、用稀有切点内切酶将基因组DNA切成大片断DNA;B、用脉冲电泳分离大片断DNA;C、将大片断DNA克隆到YAC(Yeast artificial chromosome)中,建立YAC文库;D、以显示多态性的扩增产物为探针从YAC文库中调出含有该RAPD标记和与其连锁的目的基因的大片断DNA;E、以该RAPD标记为起点向目的基因进行染色体滑步或跳跃,以找到目的基因。Michelmore首先利用这种方法找到了莴苣抗性基因的标记,Koller等利用这种方法找到与苹果疮痂病抗性基因有关的分子标记。
③利用一套缺体一四体系或双端体系,以获得与目的基因连锁的标记引物进行扩增反应,然后进行原位杂交,确定特异性带在染色体上的位置。
这些工作在一些基础研究较多的领域或与人类关系较为密切的物种中进展较为迅速,比如小麦、水稻找到的RAPD分子标记已有许多。但林木等多年生植物研究进展稍迟滞,关键是缺乏合适的群体。
3.4纯度和外源基因检验问题 虽然由于RAPD条带的灵敏和重复性等问题,纯度检验研究还只停留在实验阶段。但已有的对大麦、玉米、大豆、棉花、小麦、水稻的实验表明,RAPD技术是鉴定品种的有效方法。相信其在纯度检验和专利保护方面会取得较为广泛的应用。
4、小结
每一种技术和方法都有其优势和缺陷,只有仔细研究,在实际运用中注意取长补短,就会发挥出其最大的作用,RAPD技术也是如此。对此进行的一系列研究会使RAPD技术日益成熟和完善,并在人类认识自然生命现象中发挥更大的作用。