丁香实验_LOGO
登录
提问
我要登录
|免费注册

做SNP的统计分析流程是什么?

相关实验:实时荧光定量 PCR(realtime PCR)

user-title

hehe卓


wx-share
分享

4 个回答

user-title

小小翻车鱼

有帮助

以下是进行SNP统计分析的一般流程:

1. 数据准备:首先需要收集SNP芯片或者测序数据,并整理为可读取的格式。同时,需要收集表型数据,如病例与对照的临床信息等。

2. 数据质控:在分析之前需要进行数据质控,包括SNP和样本质量控制。对于SNP数据,可以检查基因型频率是否符合Hardy-Weinberg平衡,以及缺失数据和错误基因型的比例是否过高等。对于样本数据,可以检查样本是否存在批次效应和离群值等。

3. 基因型填充:对于缺失基因型的样本,可以进行基因型填充。常用的基因型填充方法包括最大似然估计法、贝叶斯估计法和最小二乘法等。

4. 关联分析:基于SNP基因型数据,可以进行关联分析。常用的关联分析方法包括逻辑回归、线性回归和广义线性模型等。在关联分析中,可以使用不同的模型来控制潜在的混杂因素,如年龄、性别、祖源等。

5. 基因多效性校正:在进行关联分析时,需要考虑基因多效性(即同一个SNP位点在不同基因上的作用)的影响。常用的基因多效性校正方法包括混合线性模型、EM算法和基于树的模型等。

6. 结果展示和评估:最后,需要展示关联分析的结果,如P值、置信区间、OR值和效应大小等。同时,需要评估结果的可信度,包括多重比较校正和样本量计算等。

user-title

此用户已注销

有帮助

1. 数据格式:将个体的生长性状(体重,体长等)与个体基因型数据导入Excel,建立文档。如图:

2. 导入SPSS软件:打开SPSS软件后点击File-OPEN


user-title

粥辰辰辰辰

有帮助

1、数据格式

目前,SNP的meta分析建议用stata完成,从Hardy-Weinberg检验到敏感性分析,都有一个完整的过程。一般来说,把数据整理成以下格式即可,其中,cases表示实验组,controls表示对照组。

2Hardy-Weinberg检验

由于基因分型错误,或者选择偏倚和不恰当的分层,可能会发生HWE偏倚。因此,在汇总数据之前,应在每项研究中检查HWE的拟合优度。使用stata识别低质量的研究,可以计算出HW-P值和调整后的HW-P值。从下表看,P均大于0.05,说明没有HWE偏倚

。3、遗传模型

给定两个等位基因(A,a),可能出现三种基因型(AA,Aa,aa)可以以不同方式产生不同的遗传模型。基于生物学遗传模型进行不同模型的评估。包括等位基因对比(A与a),隐性(AA与Aa + aa),显性(AA + Aa与aa)和超显性(Aa与AA + aa) )遗传模型以及成对比较(AA与aa,AA与Aa和Aa与aa的比较)。多次检验,使用Bonferroni方法调整P值。

4、异质性评估

异质性的评估可以采用多种指标进行,一般来说有tau^2,Q值,I^2以及P值的计算,假如存在异质性,则可以使用亚组分析来解决。

5、绘制森林图

用stata绘制森林图,可以绘制出7个模型的森林图

user-title

高山云初

有帮助

1.数据读取:通过扫描及读取芯片数据信息读取,获取杂交信号的相对强弱

2.数据标准化:数据标准化旨在除去数据中所包含的非生物学变化,这些变化可能来自实验的任何一步,包括芯片制作、RNA提纯、cDNA标记、DNA杂交、或者芯片扫描。

3.SNP分析:通过信号强度,标准化的等位基因强度比,标记之前的距离和B等位基因的群体频率等参数推断SNP数目和特定染色体的区域,给出有统计意义的SNP列表。

4.CNV/LOH分析:展示CNV在染色体上的分布情况及目标基因上所有CNV的分布及类型等位基因处于杂合时,会出现丢失或突变成另一个基因的趋势,称为杂合性缺失(LOH)。

5.COG/KOG功能注释及分类分析:对基因功能进行COG或KOG分类,通过COG分类可以对变化基因所调节的功能有直观和感性的认识,从而了解待研究因子对于生物功能的影响,并对后续生物学实验的进行提供指导作用。

6.GO Enrichment:对于得到的特定基因分类,采取DAVID、EasyGO等GO分析软件对所得基因进行功能富集分析,并得到可能的富集功能。

7.KEGG Pathway分析:基于KEGG等数据库,采取超几何分布检验等统计手段,得到显著富集的生物信号通路或者代谢通路。

 

提问
扫一扫
丁香实验小程序二维码
实验小助手
丁香实验公众号二维码
扫码领资料
反馈
TOP
打开小程序