基因芯片技术
互联网
随着人类基因组(测序)计划( Human genome project )的逐步实施以及分子生物学相关学科的迅猛发展,越来越多的动植物、微生物基因组序列得以测定,基因序列数据正在以前所未有的速度迅速增长。
然而 , 怎样去研究如此众多基因在生命过程中所担负的功能就成了全世界生命科学工作者共同的课题。为此,建立新型杂交和测序方法以对大量的遗传信息进行高效、快速的检测、分析就显得格外重要了。
基因芯片(又称 DNA 芯片、生物芯片)技术就是顺应这一科学发展要求的产物,它的出现为解决此类问题提供了光辉的前景。该技术系指将大量(通常每平方厘米点阵密度高于 400 )探针分子固定于支持物上后与标记的样品分子进行杂交,通过检测每个探针分子的杂交信号强度进而获取样品分子的数量和序列信息。
早在八十年代, Bains W. 等人 [1] 就将短的 DNA 片断固定到支持物上,借助杂交方式进行序列测定。但基因芯片从实验室走向工业化却是直接得益于探针固相原位合成技术和照相平板印刷技术的有机结合以及激光共聚焦显微技术的引入 [2] 。
它使得合成、固定高密度的数以万计的探针分子切实可行,而且借助激光共聚焦显微扫描技术使得可以对杂交信号进行实时、灵敏、准确的检测和分析。正如电子管电路向晶体管电路和集成电路发展是所经历的那样,核酸杂交技术的集成化也已经和正在使分子生物学技术发生着一场革命。
现在全世界已有十多家公司专门从事基因芯片的研究和开发工作,且已有较为成型的产品和设备问世。主要代表为美国 Affymetrix 公司。该公司聚集有多位计算机、数学和分子生物学专家,其每年的研究经费在一千万美元以上,且已历时六七年之久,拥有多项专例。
产品即将或已有部分投放市场,产生的社会效益和经济效益令人瞻目。
基因芯片技术由于同时将大量探针固定于支持物上,所以可以一次性对样品大量序列进行检测和分析,从而解决了传统核酸印迹杂交( Southern Blotting 和 Northern Blotting 等)技术操作繁杂、自动化程度低、操作序列数量少、检测效率低等不足。
而且,通过设计不同的探针阵列、使用特定的分析方法可使该技术具有多种不同的应用价值,如基因表达谱测定、实变检测、多态性分析、基因组文库作图及杂交测序等。
1 .基因芯片的主要类型
目前已有多种方法可以将寡核苷酸或短肽固定到固相支持物上。这些方法总体上有两种,即原位合成( in situ synthesis )与合成点样两种。支持物有多种如玻璃片、硅片、聚丙烯膜、硝酸纤维素膜、尼龙膜等,但需经特殊处理。
作原位合成的支持物在聚合反应前要先使其表面衍生出羟基或氨基(视所要固定的分子为核酸或寡肽而定)并与保护基建立共价连接;作点样用的支持物为使其表面带上正电荷以吸附带负电荷的探针分子,通常需包被以氨基硅烷或多聚赖氨酸等。
原位合成法主要为光引导聚合技术( Light-directed synthesis ),它不仅可用于寡聚核苷酸的合成,也可用于合成寡肽分子。光引导聚合技术是照相平板印刷技术( photolithography )与传统的核酸、多肽固相合成技术相结合的产物。
半导体技术中曾使用照相平板技术法在半导体硅片上制作微型电子线路。固相合成技术是当前多肽、核酸人工合成中普遍使用的方法,技术成熟且已实现自动化。二者的结合为合成高密度核酸探针及短肽阵列提供了一条快捷的途径。
以合成寡核苷酸探针为例,该技术主要步骤为:首先使支持物羟基化,并用光敏保护基团将其保护起来。每次选取择适当的蔽光膜( mask )使需要聚合的部位透光,其它部们不透光。这样,光通过蔽光膜照射到支持物上,受光部位的羟基解保护。
因为合成所用的单体分子一端按传统固相合成方法活化,另一端受光敏保护基的保护,所以发生偶联的部位反应后仍旧带有光敏保护基团。因此,每次通过控制蔽光膜的图案(透光与不透光)决定哪些区域应被活化,以及所用单体的种类和反应次序就可以实现在待定位点合成大量预定序列寡聚体的目的 [3 , 4] 。
该方法的主要优点是可以用很少的步骤合成极其大量的探针阵列。例如,合成 48 ( 65536 ) 个探针的 8 聚体寡核苷酸序列仅需 4 × 8=32 步操作, 8 小时就可以完成。而如果用传统方法合成然后点样,那么工作量的巨大将是不可思议的。同时,用该方法合成的探针阵列密度可高达到 106 /cm2 。不过,尽管该方法看来比较简单,实际上并非如此。主要原因是,合成反应每步产率比较低,不到 95% 。而通常固相合成反应每步的产率在 99% 以上 [5] 。因此,探针的长度受到了限制。而且由于每步去保护不很彻底,致使杂交信号比较模糊,信噪比降低。为此有人 [6] 将光引导合成技术与半异体工业所用的光敏抗蚀技术相结合,以酸作为去保护剂,使每步产率增加到 98% 。原因是光敏抗蚀剂的解离对照度的依赖是非线性的,当照度达到特定的阈值以上保护剂就会解离。所以,该方法同时也解决了由于蔽光膜透光孔间距离缩小而引起的光衍射问题,有效地提高了聚合点阵的密度。另据报导 [7] ,利用波长更短的物质波如电子射线去除保护可使点阵密度达到 1010 /cm2 。
除了光引导原位合成技术外,有的公司如美国 Incyte Pharmaceuticals 等使用压电打印法 (Piezoelectric printing) 进行原位合成。其装置与普通的彩色喷墨打印机并无两样,所用技术也是常规的固相合成方法。做法是将墨盒中的墨汁分别用四种碱基合成试剂所替代,支持物经过包被后,通过计算机控制喷墨打印机将特定种类的试剂喷洒到预定的区域上。冲洗、去保护、偶联等则同于一般的固相原位合成技术。如此类推,可以合成出长度为 40 到 50 个碱基的探针,每步产率也较前述方法为高,可达到 99% 以上。
尽管如此,通常原位合成方法仍然比较复杂,除了在基因芯片研究方面享有盛誉的 Affymetrix 等公司使用该技术合成探针外,其它中小型公司大多使用合成点样法。
后一方法在多聚物的设计方面与前者相似,合成工作用传统的 DNA 或多肽固相合成仪完成,只是合成后用特殊的自动化微量点样装置将其以比较高的密度涂布于硝酸纤维膜、尼龙膜或玻片上。支持物应事先进行特定处理,例如包被以带正电荷的多聚赖酸或氨基硅烷。现在已有比较成型的点样装置出售,如美国 Biodot 公司的点膜产品以及 Cartesian Technologies 公司的 PixSys NQ/PA 系列产品。前者产生的点阵密度可以达到 400/cm2 ,后者则可达到 2500/cm2 。
2.样品的准备及杂交检测
目前,由于灵敏度所限,多数方法需要在标记和分析前对样品进行适当程序的扩增,不过也有不少人试图绕过这一问题,如 Mosaic Technologies 公司引入的固相 PCR 方法,引物特异性强,无交叉污染并且省去了液相处理的烦琐; Lynx Therapeutics 公司引入的大规模并行固相克隆法 (Massively parallel solid-phase cloning) ,可在一个样品中同时对数以万计的 DNA 片段进行克隆,且无需单独处理和分离每个克隆。
显色和分析测定方法主要为荧光法,其重复性较好,不足的是灵敏度仍较低。目前正在发展的方法有质谱法、化学发光法、光导纤维法等。以荧光法为例,当前主要的检测手段是激光共聚焦显微扫描技术,以便于对高密度探针阵列每个位点的荧光强度进行定量分析。因为探针与样品完全正常配对时所产生的荧光信号强度是具有单个或两个错配碱基探针的 5-35 倍,所以对荧光信号强度精确测定是实现检测特异性的基础 [8] 。但荧光法存在的问题是,只要标记的样品结合到探针阵列上后就会发出阳性信号,这种结合是否为正常配对,或正常配对与错配兼而有之,该方法本身并不能提供足够的信息进行分辨。
对于以核酸杂交为原理的检测技术,荧光检测法的主要过程为:首先用荧光素标记扩增(也可以有其它放大技术)过的靶序列或样品,然后与芯片上的大量探针进行杂交,将未杂交的分子洗去(如果用实时荧光检测可省去此步 [9] )这时,用落射荧光显微镜或其它荧光显微装置对片基进行扫描,采集每点荧光强度并对其进行分析比较。前已述及,由于正常的 Watson-Crick 配对双链要比具有错配碱基的双链分子具有较高的热力学稳定性。所以,如果探针与样品分子在不位点配对有差异则该位点荧光强度就会有所不同,而且荧光信号的强度还与样品中靶分子的含量呈一定的线性关系。当然,由于检测原理及目的不同,样品及数据的处理也自然有所不同,甚至由于每种方法的优缺点各异以至于分析结果不尽一致。
3.基因芯片技术的主要应用
1998 年底美国科学促进会将基因芯片技术列为 1998 年度自然科学领域十大进展之一,足见其在科学史上的意义。现在,基因芯片这一时代的宠儿已被应用到生物科学众多的领域之中。它以其可同时、快速、准确地分析数以千计基因组信息的本领而显示出了巨大的威力。这些应用主要包括基因表达检测、突变检测、基因组多态性分析和基因文库作图以及杂交测序等方面。在基因表达检测的研究上人们已比较成功地对多种生物包括拟南芥( Arabidopsis thaliana ) [10,11] 、酵母 (Saccharomyces cerevisiae )[12,13] 及人 [15,16] 的基因组表达情况进行了研究,并且用该技术(共 157,112 个探针分子)一次性检测了酵母几种不同株间数千个基因表达谱的差异 [14] 。实践证明基因芯片技术也可用于核酸突变的检测及基因组多态性的分析,例如对人 BRCA Ⅰ基因外显子 11[17] 、 CFTR 基因[ 22 ] 、β - 地中海贫血 [24] 、酵母突变菌株间 [20] 、 HIV-1 逆转录酶及蛋白酶基因(与 Sanger 测序结果一致性达到 98% ) [21] 等的突变检测,对人类基因组单核苷酸多态性的鉴定、作图和分型 [19] ,人线粒体 16.6kb 基因组多态性的研究 [24] 等。将生物传感器与芯片技术相结合,通过改变探针阵列区域的电场强度已经证明可以检测到基因( ras 等)的单碱基突变 [26] 。此外,有人还曾通过确定重叠克隆的次序从而对酵母基因组进行作图 [25] 。杂交测序是基因芯片技术的另一重要应用。该测序技术理论上不失为一种高效可行的测序方法,但需通过大量重叠序列探针与目的分子的杂交方可推导出目的核酸分子的序列,所以需要制作大量的探针。基因芯片技术可以比较容易地合成并固定大量核酸分子,所以它的问世无疑为杂交测序提供了实施的可能性,这已为实践所证实 [27,28] 。
4.基因芯片技术的研究方向及当前面临的困难
尽管基因芯片技术已经取得了长足的发展,得到世人的瞩目,但仍然存在着许多难以解决的问题,例如技术成本昂贵、复杂、检测灵敏度较低、重复性差、分析泛围较狭窄等问题。这些问题主要表现在样品的制备、探针合成与固定、分子的标记、数据的读取与分析等几个方面。
样品制备上,当前多数公司在标记和测定前都要对样品进行一定程度的扩增以便提高检测的灵敏度,但仍有不少人在尝试绕过该问题,这包括 Mosaic Technologies 公司的固相 PCR 扩增体系以及 Lynx Therapeutics 公司提出的大量并行固相克隆方法,两种方法各有优缺点,但目前尚未取得实际应用。
探针的合成与固定比较复杂,特别是对于制作高密度的探针阵列。使用光导聚合技术每步产率不高( 95% ),难于保证好的聚合效果。应运而生的其它很多方法,如压电打压、微量喷涂等多项技术,虽然技术难度较低方法也比较灵活,但存在的问题是难以形成高密度的探针阵列,所以只能在较小规模上使用。最近我国学者已成功地将分子印章技术应用于探针的原位合成而且取得了比较满意的结果(个人通讯)。
目标分子的标记也是一个重要的限速步骤,如何简化或绕过这一步现在仍然是个问题。
目标分子与探针的杂交会出现一些问题:首先,由于杂交位于固相表面,所以有一定程度的空间阻碍作用,有必要设法减小这种不利因素的影响。 Southern 曾通过向探针中引入间隔分子而使杂交效率提高于了 150 倍。其次,探针分子的 GC 含量、长度以及浓度等都会对杂交产生一定的影响,因此需要分别进行分析和研究。
信号的获取与分析上,当前多数方法使用荧光法进行检测和分析,重复性较好,但灵敏仍然不高。正在发展的方法有多种,如质谱法、化学发光法等。基因芯片上成千上万的寡核苷酸探针由于序列本身有一定程度的重叠因而产生了大量的丰余信息。这一方面可以为样品的检测提供大量的验证机会,但同时,要对如此大量的信息进行解读,目前仍是一个艰巨的技术问题。
5.我国基因芯片的研究现状
目前,我国尚未有较成型的基因芯片问世,但据悉已有几家单位组织人力物力从事该技术的研制工作,并且取得了一些可喜的进展。这是一件好事,标志着我国相关学科与技术正在走向成熟。基因芯片技术是一个巨大的产业方向,我们国家的生命科学、计算机科学乃至精密机械科学的工作者们应该也可以在该领域内占有一席之地。但是我们应该充分地认识到,这不是一件轻易的事,不能够蜂拥而至,不能“有条件没有条件都要上”,去从事低水平重复性的研究工作,最终造成大量人力物力的浪费。而应该是有组织、有计划地集中具有一定研究实力的单位和个人进行攻关,这也许更适合于我国国情。
参考文献
1. Bains W et al. J-Theor-Biol 1998 Dec 7 ; 135(3) : 303-7
2. Stephen PA Foddor et al. Nature,364 : 555-6(1993)
3. Fodor SPA et al. Science 251, 767-773 (1991)
4. Pease AC et al. Proc. Natl. Acad. Sci. USA, 91, 5022- 5026 (1994)
5. McGall GH et al. J. American Chemical Society,119,5081-5094 (1997)
6. McGall G et al. Proc. Nat l. Acad. Sci. USA, 93, 13555 �13560 (1996)
7. Newman T H et al. J. Vac. Sci. Technol. B5, 88 (1987)
8. Pease AC et al. Proc. Natl. Acad. Sci., USA, 91, 5022-5026(1994)
9. Fodor SDA et al. Nature, 364, 555-6 (1993)
10. Schena M et al. Science 270(5235):467-470
11. Schena M et al. Bioessays 18:427-431
12. Shalon D et al. Genome Res. 6:639-645
13. DeRisi JL et al. Science 270:680-686
14. Winzeler EA et al. Science 281:1194-97(1998)
15. Schena M et al. Proc.Nat. Acad. Sci. USA 93:10614-10619
16. DeRisi JL et al. Fed.Am.Soc.Exp.Bio.11:1126
17. Hacia GH et al. Nat. Genet. 14:441-447
18. Chee M et al. Science 274(5287):610-14(1996)
19. Wang D G et al. Science 280(5366):1077-82(1998)
20. Shoemaker DD et al. Nat. Genet 14:450-456
21. Kozal MJ et al. Nature Medicine2:753-759
22. Cronin MT et al. Human Mut.7:244-255
23. Chee M et al. Science 274:610-613
24. Drobyshev A et al. Gene 188:45-52(1997)
25. Sapolsky RJ et al. Genomics 33 : 445-456
26. Sosnowski RG et al. Pro. Natl. Acad. Sci. USA 94: 1119-1123
27. Michael KL et al. Anal.Chem.1998,70:1242-1248
28. Pease AC et al. Proc. Nat. Acad. Sci. USA 91:5022-5026