材料与仪器
步骤
一、须考虑的样本含量
0.5 cM 的遗传学距离转变为 0.005 的重组率,表明要发生 5 起重组事件,平均需要观察 1000 例 scoreable 减数分裂。根据泊松分布(假定重组事件间相互独立、互不干扰),那么在上述事例中,有约 56% 的可能性观察到至少 5 起重组事件,有约 88% 的可能性观察到至少 3 起重组事件。
二、重组频率的最大可能估计值和基因座顺序
1.两点和三点基因定位
采用可对精子分型数据进行完整统计学分析的计算机软件(TWOLOC 和 THREELOQ,对原始的两点和三点杂交的精子分型数据进行数学分析。
如果 PCR 扩增是完有效的(即样本中存在的每一个等位基因都可被检测到),在没有外源 DNA 污染和微量滴定板的每个孔中严格地只有一个单倍体精子的情况下,那么只有预期产生的亲本型和重组型精子类型可被观察到;然而,如同所有的实验数据,由精子分型产生的数据都存在误差。对于任一基因座,均可观察到一小部分同时没有或同时都有两个等位基因的精细胞。这可能是由于:单个精子中存在的单个等位基因的检出效率<100%、污染事件、样本中含有多个或不含精子,以及这些误差的不同组合。
TWOLOC 和 THREELOC 软件采用的计算机模型考虑到了这些误差。该软件可对以下四种参数进行估计并提供了它们的标准误差:效率;污染;重组率;包含0、1 或 2 种精子的样本率。此外,符合系数可详细说明邻近区间重组事件间的独立程度,THREELOC 可对符合系数做出估计从而分析干扰因素。两种程序均以表格的形式输入数据,内容包括所有观察到的精子单体型以及每种单体型被观察到的次数。除了一般模型外,还有一些对效率和污染参数存在不同假设的辅助模型,程序可在这些模型下进行分析。
TWOLOC 和 THREELOC 软件都可计算相位/顺序不同组合的最大似然。TWOLOC 和 THREELOC 软件被限制,不可以同时考虑超过三个位点。并且,来自每个精子供者个体的数据必须分开分析。
这里提及的计算机软件和文件都可从 Dr.KenLange 获得,生物统计学系,洛杉肌加州大学。
2.多点基因定位
对于精子分型数据进行多点基因定位的策略是由本来用于人类系谱数据遗传连锁分析的 MENDEL 程序发展而来的。如同 TWOLOC 和 THREELOC, 这一新版本考虑了实验误差,也对同样的四种参数(包括它们的标准误差)进行估计。此外,它还估计标记顺序和男性重组频率。父亲的基因型被当作捐赠者的实际基因型,并携带有指定的相位和顺序。假定其母亲在所有分析位点都是杂合的,并与程序的预期一致,而且每一个被分析精子都作为一个孩子来处理。精子(或孩子)的基因型包括了来自于精子捐赠者的等位基因组合。母亲的基因型和双亲的表型被当作无关。对 MENDEL 的改编使得通过分析联合若干不同个体的多个位点来构建一张多点连锁图谱成为可能,即使对任一精子捐赠者只有部分位点被成功分型。当对多个位点进行分型时须给定数据计算的复杂性,这一程序根据特定的相位/顺序组合,总是有条件地计算似然,并且不考虑干扰因素。它可结合来自捐赠者不同位点组合的分型数据进行分析。更为复杂的实验设计被运用到了该模型中,包括再次检验通过 PEP 获得的确定位点。这些方面在 MENDEL 文件中有更为全面的详述。该程序以表格的形式输人数据,内容包括每套微量滴定孔(或管)的结果,捐赠者单体型与假定母亲适合的单体型。
3.精子分型数据分析的策略方法
(1)小心注意单体型评分、数据输入及数据核对。由于单体型评分这项工作很冗长,因此推荐数据独立评分;并且任何偏差都应仔细研究。当出现不确定的案例时,须考虑采用 PEP 对精子重新分型(支持方案 4)。
(2)针对数据集,主要依据已分型位点数目和实验设计来选择适当的软件。
(3)采用 TWOLOC、THREELOC 或 MENDEL,通过对系统参数污染和效率的不同设定,测试由一般模型得来的若干不同辅助模型。最准确的模型(也就是一般模型)解释了每个基因座上的每个等位基因可变的污染程度和可变的扩增效率;然而,依照统计模型的一般性原则,对特定的模型最好不要过度参数化,因为这可能人为地导致数据与模型吻合良好。因此,最好是有可能存在的最简单的模型,它几乎能完整地说明数据。
从作者的实验和数瑪分析可以清楚地看到,针对重组频率的高分辨率的测量方法有赖于三个因素:提高微量滴定孔或管中等位基因的扩增效率和检出率;降低污染频率; 降低微量滴定孔或管中出现〇或多于 1 个精子的频率。不可避免的实验误差造成的信息丢失可以通过加大研究样本数来弥补。
三、连锁数据的直接分析
在一组紧密连锁的遗传标记序已知的情况下,通过比较不同区间内重组频率,采用 TWOLOC、THREELOC 或 MENDEL,那么就无需估计重组频率和关联的精子分型误差。反之,不同区间内的重组类型数目则能被直接计算和比较。考虑一个杂合子个体有四个紧密连锁的遗传标记 A、B、C 和 D, 并且已知顺序和相位 ABCD/abcd,BC 区间内的重组有待探讨。假定采用 PEP 对遗传标记 B 和 C 进行分型并且观察到了 Be 这一重组类型的精子。这可能是真实的重组事件也可能是分型出现的误差。如果采用 PEP 再对同一精子内的遗传标记 A 和 D 进行分型,那么就可以区分这些可能性了。如果发现精子有 ABcd 基因型,那么 BC 区间内被认为肯定发生了重组事件,但是 ABcD 基因型则不能起确认作用。可以计算任一区间内确认的重组类型的数目,并同其他区间内确认的重组类型的数目做比较。以这种方式,如携带有一重组热点的染色体片段可以被连续地分成越来越小的区间直到确定有热点活性的最小区间。
来源:丁香实验