dxy_iitpuzy7
图中11个位点组成的5种单倍型,但是每种单倍型每个位点只给出1个碱基,可是我的SNP位点是双等位基因,有杂合子也有纯合子,SPSS关联分析要知道样本数吧,只有1个G或A,是不管杂合还是纯合只要有G或A碱基的就可以算到样本里吗
dxyc42u
纯合子与杂合子应该区别对待,不能只看AG碱基
dxy_iitpuzy7
每个位点杂合子居多,去除的话,样本量很少
土井挞克树
你这个情况先不要管纯合杂合了,把GA碱基都进行计数
dxy_iitpuzy7
我有个问题是,我不是每个位点都具有所有样本,假如100个样本的话,有的位点上只有80个是分辨出基因型的,剩余20个是缺失值,这样的话假如单倍型1是GAC,分别对应位点是Site10,site11,site12。在site10上有100个基因型,但是在site11上只有80个,site12上85个。那算作单倍型的样本应该是同时在site10、11、12上都分辨出基因型的样本,任何一个位点上是缺失值,这个样本都不能计入是吗?
loveliufudan
在分析单核苷酸多态性(SNP)位点时,通常需要考虑杂合子和纯合子的信息。对于每个位点,不仅需要知道单个样本中的碱基,还需要知道杂合子和纯合子的存在情况。
根据您提供的序列示例,共有5个样本,每个样本包含11个位点。对于每个位点,您需要提供每个样本的碱基信息,包括杂合子和纯合子的基因型。
例如,在第一个样本中,如果某个位点是杂合子,应提供两个碱基,如G/A。如果某个位点是纯合子,只需要提供一个碱基,如G。对于每个样本,都应提供准确的基因型信息,以便进行关联分析。
关于SPSS关联分析,确实需要知道每个样本的基因型信息和样本数,以进行适当的分析和统计计算。样本数影响统计学上的可靠性和显著性分析。
总结而言,您需要提供每个样本的准确基因型信息,包括杂合子和纯合子的位点,并确保样本数足够进行关联分析。
相关产品推荐
相关问答