SNPs分析介绍
互联网
来自上海某研究所的某博士的研究课题是寻找导致某种疾病的相关基因,最近他获得了这一疾病的微卫星家族标记图谱,但是这种串联重复的微卫星位点并不能完全满足他的分析要求,因此他决定转向作单核苷酸多态性SNPs(single nucleotide polymorphism,发音为“snips”)基因分型。
确实,如果你的研究课题也是寻找易感基因,那么SNPs是一种比较而言可行而且高效的方法,这主要是因为它有几个优点: (1) SNPs在基因组中的分布(每500-1000个碱基就有一个标记)无论是比较于RFLP限制性片段长度多态性分析还是STR微卫星标记(6000-7000多个Markers),都要广泛得多;(2) SNP在人群中是二等位基因性的,在任何人群中其等位基因频率都可估计出来; (3) 与串联重复的微卫星位点相比,SNP是高度稳定的,尤其是处于编码区的SNP(cSNP),而前者的高突变率容易引起对人群的遗传分析出现困难;(4) 部分位于基因内部的SNP可能会直接影响产物蛋白质的结构或基因表达水平,因此,它们本身可能就是疾病遗传机制的候选改变位点;(5)易于进行自动化、规模化分析,缩短了研究时间。
这也就是为什么科学家才会花这么多的时间进行国际人类基因组单体型图谱计划的原因。然而虽然说各个厂家不断的推出满足不同需求的SNP基因芯片,检测系统等,简化了实验步骤也缩短了所需时间,但是就像前面提到的易博一样刚开始接触SNPs,是否觉得无从入手?如果您也是这样,那么可以先来回答下面4 个问题。
1.你需要多大的Scale?
不同的平台可以满足不同的SNPs要求,比如说对于在数千个样品中只有10或者更少的SNPs的时候,就可以选择ABI的TaqMan实时荧光 PCR(见ABI推出全新miRNA表达荧光定量产品-TaqMan)这个金字招牌;如果多于10,那么pyrosequencing(焦磷酸测序法,见 pyrosequencing工作原理)就可以用来分析100SNPS,而Sequenom公司的MassARRAY飞行质谱SNP检测系统则适合于 1,000以下SNPs高通量分析,至于10,000SNPs,Affymetrix的MegAllele探针试剂就比较适用了。目前 Affymetrix还推出了全新的人类基因组500K(25万)芯片,为SNPs分析再添一“重量级”工具。
不过有许多人认为在最开始进行基因分型的时候,还是先考虑下RFLP,因为SNP分析是一件费时费力又要运气的东西(这是因为限制性酶切位点的影响)。但是也有像牛津大学人类基因组Wellcome Trust 中心主任的Ioannis Ragoussis那样认为的:你可以尝试小数量样品和SNPs,这并是太贵。
2.你需要多少的Throughputs?
Throughputs简而言之就是指的样品分析的数量,影响因素主要包括采用的平台自动化水平、技术人员的熟练程度和人数,以及模式的可靠性。像 Affymetrix的GeneChip Scanner 3000 System理论上一天内可以处理48 Arrays(48个样品),但是实际上一个有一套这样的系统和一个技术人员的实验室平均一天也就能处理8个样品,那么如果要获得基本完备的数据需要2到 3天的时间。Illumina芯片公司提供的DNA-to-data cycle系统也是需要差不多同样的时间,但是单人每个cycle可以处理288个样品(3 × 96-well plates)。而ABI在继7700和5700荧光定量PCR仪之后特别为高通量而设计推出的7900 HT型荧光定量PCR仪则可以说是较好的解决了一些实验室对于样品高通量的要求��30分钟内可以进行384个TaqMan分析,一天可以完成48板 18,432个样品。除此之外,Sequenom公司的high-capacity Autoflux mass spectrometer也可以分析7,680个样品。这一具体的选择还是要看各个实验室的资金使用度和技术要求。
3.样品来源?
SNPs实验中样品来源与制备是很关键的一步,像有些生物体SNPs分析就不如人类SNPs分析来得方便,这是因为虽然许多生物体的序列已经被测出,但是不像许多人类疾病基因分析的全面,对于大多生物的变异与进化我们还并不了解,再加上一些实验室的样品是本实验室特有的,或者多态性状小,这些都造成SNPs分析的难度。一个最典型的证据就是NCBI有关人类的SNPs数据有1亿多个,而小鼠的SNPs只有50多万,线虫 Caenorhabditis elegans是1,065个。所以在准备进行SNPs分析之前要仔细考虑下数据的来源与分析完整性。
而SNP样品制备涉及的面就比较广,包括Genomic DNA纯化和PCR、标记等步骤,详细请见站在生物时代尖口 把握芯片技术至高点 。
4.准备投入的资金?
实验的资金是个不容忽视,甚至可以说是决定性的问题。在基因分型研究中,国内许多实验室常常认为主要需要的资金投入是在硬件设备这一块,然而实际上要进行SNPs分析,除了仪器设备,其它像前期样品处理费用这样的资金投入更加重要,也花费更多。因此准备投入资金的研究人员在进行预算的时候千万不能遗忘了这一方面,否则就有可能会眼看着研究就要出成果而被资金束缚。
目前生物信息学研究在发达国家较受到重视,政府资助也比较多,而国内在这方面还做的不到位,但由于像SNPs这样能针对人类致病基因展开研究的技术所存在的巨大商业利润使得一些大型制药公司和生物公司大规模向这些领域进军,所以国内的研究人员可以考虑从多方入手获得开展研究的机会。
另外,根据一项最近的国外调查表明将近40%SNP分型是在几个中心实验室和大型实验室(包括外包,即交给其它实验室完成和本身实验室实力雄厚)完成的,这也就是说国内的研究人员也可以考虑将自己的样品以同样的方式交给大型实验室节约资金,但是这样仍有数据保密性和样品制备后期分析等一些问题,研究者需要考虑清楚。