生物芯片及其在基因体研究上的应用
互联网
生物芯片概论
DNA分子在大多数生物体中是以双股的型态存在(少数病毒、噬菌体除外)。在某些特殊生理状态下,例如:细胞分裂、基因表现等,双股DNA会解开变成单股,然后再回复成双股。而生物学家很早就把这单股DNA利用氢键结合成双股DNA分子的特性应用在生物相关的研究,称之为杂合反应(Hybridization)。从1965年,Gillespie和Spiegelman发表利用杂合反应筛选重组菌株后,有许多的实验技术,包括南方墨点(Southern blot)、北方墨点(Northern blot)、原位杂合(in situ Hybridization)、DNA序列分析(DNA Sequencing)、PCR(Polymerase Chain Reaction)甚至目前热门的生物芯片(DNA芯片),无一不是利用核酸杂合反应的原理。从这个历史的演进,也可看出生物芯片在基因体研究上的多元潜力。
生物芯片是先将已知有兴趣的单股DNA分子,称为探针DNA(probe DNA),利用化学共价结合或物理性吸附,固定在耐仑膜(nylon membrane)、玻璃或其它固态载体上。再利用一些实验技术从细胞或细菌复制、放大有兴趣的基因或DNA片段,称之为标的DNA(target DNA),并以荧光物质标定(label)。标的DNA和芯片上的探针DNA进行杂合反应后,若此细胞或细菌有表现植入芯片上的基因或DNA片段,就可在扫描仪上侦测到荧光亮点,我们就可以知道哪些基因有表现,哪些基因没有表现。从植入芯片上的探针DNA不同,可以分成两大类:一类是将单股cDNA(complementary DNA)植入芯片,称为cDNA芯片;另一类是把寡核甘酸序列(oligonucleotide)植入芯片,称之为寡核甘酸芯片(oligo chip)。这两类生物芯片性质不同,适用于不同的基因体研究,并且扩展了生物芯片应用的范围。
生物芯片在基因体研究上的应用
微小化并能同时快速大量的处理样品是生物芯片最大的优点,目前应用生物芯片研究的领域很广,如:基因表现、发现新基因、癌症分类、新药开发、单一核甘酸多型性(SNP,single nucleotide polymorphism)等。
1.基因表现
在生物芯片发展之前,大部分的研究者都仅局限在研究一个或数个基因的表现,这对于复杂的生物系统来说,无异是以管窥天。利用生物芯片,我们可以同时监看上百种甚至上千种基因的表现。Affymetrix公司所推出的Human Genome U95 Set包含了6000个以上的人类基因和EST片段,几乎含盖了所有人类的基因,利用此种生物芯片,可使我们对于生物体整个反应机制及讯号传递(signal transduction)有较完整的了解。
以癌症为例,癌症一直是人类十大死因之首。对于生物学家而言,它也是一个有趣而复杂的课题,为什么有些人会得癌症?有些不会?是什么原因造成一个正常细胞开始毫无约束的不断分裂?虽然目前已找到一些抑癌基因(tumor suppressor gene)和致癌基因(oncogene)。但癌症是由许多因素加在一起所造成的结果,我们很难断定什么致癌物一定会引起癌症,由于它牵涉许多基因的交互作用,因此至今连发生的原因都不甚明了,更遑论治疗了。生物芯片提供了一个很好的工具,告诉我们癌细胞和一个正常细胞到底有何不同。我们从正常细胞抽取其mRNA(messenger RNA)以反转录脢(reverse transcriptase)制造其互补DNA(cDNA)并用绿色荧光物质标定;同样地,从癌细胞抽出之mRNA制造其cDNA后,以红色荧光物质标定,将此两种标的DNA(此指cDNA)混合在同一芯片上做杂合反应,正常细胞表现较多的基因呈现绿点,而癌细胞表现较多的基因呈现红点,正常细胞和癌细胞表现相同的基因则呈现黄点。由此即可知道哪些基因在癌细胞中大量表现。此例中,ErbB2基因呈现红点,表示在乳癌细胞中此基因大量表现。
利用此种方法可应用在其它各种不同的研究领域,例如:Lockhart利用含有65000个寡核甘酸探针的生物芯片,分析老鼠T细胞中114个基因。发现在细胞激素(cytokine)的诱导下,有20种基因表现受到影响。Kevin等人利用6240个不同基因和EST片段的生物芯片,研究和果蝇蜕变(metamorphosis)有关的基因。Joseph利用含有6400个DNA片段的生物芯片,研究酵母菌从呼吸作用转变成发酵作用其中有关代谢的基因表现,当葡萄糖在培养液中逐渐减少时,大约有710个基因被诱发表现,1030个基因产物减少。
2.新基因的发现
由上可知,不论是癌细胞的表现、刺激T细胞的反应、果蝇发育、或是代谢途径的改变。这些生理现象都被复杂的基因所调控,牵涉到许多基因。以人类约有100000个基因来估算,我们知道其功能的基因不及5%,而真正知道其作用机制的,更是屈指可数。点在芯片上的探针DNA,有很多是我们还不清楚功能的,但当我们去看整个细胞的基因表现时,我们就可对那些功能不明,但被促进表现或抑制表现的一些基因做深入的研究,并推测它是参与那一条讯号传递路径(pathway)。以Joseph研究酵母菌代谢的实验为例,就发现了超过400个新的基因作用其中。
3.癌症的分类
传统上,病理学家依肿瘤的型态学加以分类,但此种分类法对于那些组织病理学相似,但病程和愈后迥异的癌症无法有效地区分。现在科学家可利用生物芯片来分类癌症,分子诊断不但能准确地区分相似的癌症,同时也让我们对于肿瘤的分子机制有更进一步的认识。
Golub在1999年科学杂志(Science)发表利用生物芯片来区分Acute Myeloid Leukemia(AML)和Acute Lymphoblastic Leukemia(ALL)。这两种血癌(Leukemia)在显微镜下型态很相似,但却需要完全不同的化学疗程。首先他们用6800个基因的芯片检视38个病人(其中27个被诊断为ALL而另11人则为AML),然后锁定了其中50个基因,这些基因包括了细胞表面抗原(cell surface antigen)、细胞周期蛋白(cell cycle protein)、细胞联系蛋白(cell adhesion protein)和一些酵素。这50个基因明显地在AML和ALL中表现不同。因此可用以区分AML和ALL。以生物芯片检测癌症不但是在癌症诊断学上的重大突破,同时也对癌症治疗、抑癌药物的开发等有重大的影响。
4.新药开发
开发新药的一般策略是找到和疾病有专一性的细胞标的物(通常是蛋白质),然后再筛选能抑制或竞争此蛋白质的分子—可能是蛋白质、核酸或是有机化合物等。然而这个方法受限于只能筛选已知的细胞标的物,而生物芯片可以加速确认疾病的专一性细胞标的物,并显示其病理学的作用途径。这些发现均能立即用在新药的开发上。例如:Her-2/neu在乳癌细胞中大量表现,它就有潜力成为新药的标的物,换句话说,我们可以找一些抑制Her-2/neu表现的分子—即为新药。此外,开发中的新药也可利用生物芯片来了解它的作用机制。
5.单一核甘酸多型性(SNP)
虽然同种生物其染色体差异极小,但平均1000个碱基对(base pair)就有一个发生突变,这些变异称为SNP,是造成每个人对药物的敏感性不同、血型不同等的原因。此外,SNP也和癌症、心血管疾病、自体免疫、糖尿病及阿兹罕默症等疾病有关,甚至于微生物的抗药性。所以SNP现在越来越受到重视,SNP协会,TSC(The SNP Consortium),于1999年4月打算花4,500万美金在两年内找出300,000种SNP,并建立数据库。
最近很多研究者想利用高密度的生物芯片来鉴别人类的SNP,Patrick等人则利用可通电流的半导体生物芯片来分辨人类甘露醣结合蛋白(Human Mannose Binding Protein,MBP)的SNP。MBP对于先天性免疫系统很重要,尤其是对于那些尚未发育完整免疫系统的儿童。此外,Affymetrix公司也发展出p53GeneChip,藉由设计一组含5种不同碱基序列的探针DNA,它能侦测出肿瘤抑制基因p53在特殊区域中,碱基序列的SNP(出现A或G);HIVGeneChip则能侦测出HIV-1Protease的变异。
未来21世纪最重要的生医研究工具
由美国主导的人类基因体计划(Human Genome Project)预计将在2003年解出人类所有23对染色体DNA序列,估计约有100000个基因,三亿个碱基对。工程之浩大,与1969年阿波罗登月计划同为近代人类伟大的成就之一。因为人类自350万年前演化至今,将第一次完整知道自己所携带的遗传密码,尤其是对于疾病的了解将有突破性的发展。除了人类基因体计划之外,目前已解出染色体DNA序列的生物超过了600种,包括了细菌、病毒、真核生物(果蝇、线虫、阿拉伯芥等)。每天都有新的DNA序列被解出,如此庞大的DNA序列对于我们而言,它犹如一本由A、T、G、C四个字母组成的天书,至于其内部所隐含的意义,就要靠生物信息学把它译码成我们看得懂得“基因”,更进一步,则需要生物芯片告诉我们基因在整个生物体内生理、病理或药理作用的调控,使我们对于生物有整个巨观的认识。
结语
生物芯片无疑的将在下一世纪成为最重要的生物医学研究工具,对于我们目前所知的基因调控、新药开发、疾病分类、及疾病诊断等,都将掀起重大的革命性影响。