DNA阵列格式
互联网
1189
DNA 阵列格式
科学领域中,能够彻底改变科研方式的科学突破或新技术不断地涌现。使人类进入基因组学时代的高通量DNA测序技术方面的进展就是这种科学突破的代表。在过去的几年里,人类得到了从人到细菌几十种生命体的基因组序列,而且新的基因组序列正以相当快的速度在累积。在这些研究成果的基础上,许多研究人员把他们的注意力转移到从分子水平上对复杂的生物系统进行研究的工作上来。而这种工作在以前是不可能进行的。这种系统生物学方法的作用在基因表达领域中尤为显著。在基因表达领域,包含某种生物体全部基因DNA探针的微阵列其实用性使得研究整个细胞的基因表达轮廓成为可能。但是,伴随着这种新的基因组研究方法也产生了新的挑战。其中最大的挑战是如何开发计算的方法,从而利用这些方法来分析和解释那些由基因组实验产生的海量数据。为了满足这种需要,生物学家和其他领域的科学家(主要是计算机科学家、统计学家和数学家)进行交流,取得了一些大的进展(Baldi和Hatfield,2002)。本章编者简要回顾了一下当今最流行的DNA微阵列平台,着重考查其实验设计和处理实验以及生物学变异的计算方法这两方面的内容。最后编者分析了以高度重复为特点的DNA微阵列数据集。这种数据集可以突出显示这种变异的来源,正是这种变异使DNA微阵列数据的分析复杂化了。
阵列技术可以将一组分子(比如DNA片段或蛋白质)与一个分子探针库的组合相互作用显示出来。其中最成熟的是DNA阵列技术,也叫做DNA芯片或生物芯片,因为它可以实时地测量活细胞中mRNA的表达水平。今天普遍使用的DNA阵列包含成百上千个已知序列有序排列好的独特DNA探针分子。在一块阵列上的DNA探针分子有两种基本来源。每一个单一的探针分子要么是在一个固相表面(通常为玻璃)分别合成,要么是由预合成的分子(寡核苷酸或PCR产物)直接固定在阵列平板(通常为玻璃载片或尼龙膜)上。