你还傻傻分不清各种数据检验方法?| 统计
丁香园
在数据统计中不仅仅只有 t 检验!!
多数同学们区分不清各路检验大神(只能怪自己统计没学好),我们本次将各种检验一次性区分清,同时手把手教大家如何采用 SPSS 检测各项检验。
初级篇(两样本比较,u 检验和 t 检验)
u 检验(Mann-Whitney U)
情况 1: 当总体方差 σ2 已知,无论样本是大样本(n≥30)还是小样本(n<30),样本平均数的分布服从正态分布,用 u 检验进行两组数据的比较。
情况 2: 当总体方差 σ2 未知,但样本数 n≥30,此时两两比较仍用 u 检验。
例如,在一次跳远测试中,已知 32 位男生成绩和 32 位女生成绩,平均值中男生成绩略高于女生成绩,想要考察跳远成绩中是否与性别有关,因此,我们需要比较两组数据是否具有显著性差异。
样本数大于 30,因此,我们采用 u 检验,应用 SPSS 软件比较是否具有显著性。
首先,我们需要将男生组定义为 1,将女生组定义为 2;
打开 SPSS,将数据输入,在左下角「变量视图」中将标题分别改为「组别」和「成绩」;
点击「分析」,「非参数检验」,在「旧对话框」中选择「2 个独立样本」。
我们将学生的成绩添加入「检验变量列表」中,将组别加入「分组变量」中;
此时应该定义不同的组,点击「定义组」,在组 1 中输入「1」代表男生组成绩,组 2 中输入「2」代表女生组成绩;
检验类型中勾选「Mann-WhitneyU」,点击「确定」则可看到统计结果啦!
在显著性中我们可以看到,p 值为 0.017,有显著性差异,说明学生的跳远成绩确实与性别有关。
t 检验(Student's t test)
情况 1:当总体方差 σ2 未知,但样本数 n<30,此时两两比较用 t 检验;
T 检验分为单样本和双样本(双样本包括独立样本 T 检验和配对样本 T 检验)
(1)单独样本 T 检验用于进行样本所在总体均数与已知总体均数的比较;
(2)独立样本 T 检验用于两样本均数组间设计的比较(即对照组和实验组的比较)。
如评价抗肿瘤药对肿瘤细胞的杀伤作用,将实验分为两组,一组对照,另一组采用药物处理,观察处理后肿瘤细胞的生存率;
(3)配对样本 T 检验用于两样本均数组内设计的比较(即一个样本先后接受不同的处理后的比较)。
如一批学生分别接受为期三个月的记忆训练,比较训练前后对图形记忆的差异;
独立样本 T 检验应用最广泛,因此,我们以独立样本 T 检验为例,说明 SPSS 的操作。
而两样本在做 T 检验之前需要对方差齐性进行检验,此时,我们就需要用到 F 检验(F 检验是检验方差齐性)
例如评价化合物的抗肿瘤活性,测定药物处理后肿瘤细胞的生存率。我们将两组数据分组排列后输入 SPSS 中;
点击「分析」「比较均值」「单因素 ANOVA」
将「组别」放入因子中,将「存活率」放入因变量列表中,点击「选项」选择「方差同质性检验」,点击「继续」,确定后即可看到方差是否齐性。
在方差齐性检验中可看到显著性 >0.05,说明两组样本方差是齐的(p<0.05 时方差不齐),可直接采用 t 检验;
而如果两样本方差不齐,则应采用 t 检验或变量变换等方法(情况略显复杂~~)
回到数据输入界面,进行 t 检验,点击「分析」「比较均值」「独立样本 T 检验」
将「存活率」放入检验变量中,将「组别」放入分组变量中;
点击「定义组」,组 1 输入「1」代表对照组,组 2 输入「2」代表药物处理组,点击「继续」「确定」后即可看到 T 检验结果。
结果中可看到,方差相等的时候两组之间 p 值为 0.000,有显著性差异,说明化合物有显著的抗肿瘤效果!!
进阶篇(多组数据间两两比较,One-wayANOVA)
当三组及三组以上数据时,此时 u 检验和 t 检验均不适用,而应该用方差分析(ANOVA);
当多组数据中存在一个变量时,例如不同浓度之间对细胞分化的影响,或不同药物对肿瘤细胞的生存的影响等,此时应采用单因素方差分析(One-way ANOVA);
例如,我们用不同药物处理肿瘤细胞,比较化合物处理后肿瘤细胞的存活率,评价化合物抗肿瘤活性;
首先,我们需要将对不同组进行定义,1 表示对照组,2 表示化合物 1 处理组,3 表示化合物 2 处理组,4 表示化合物 3 处理组;
而在进行单因素方差分析前我们需要检验方差齐性,步骤同 t 检验中的 F 检验。
从 F 检验的结果可看出,p 为 0.001,有显著性差异,说明此时方差不齐。
接下来我们进行 One-way ANOVA 分析,点击「分析」「比较均值」「单因素 ANOVA」
我们将组别添加至因子中,将存活率添加至因变量列表中;
在「对比」中选择「多项式」,在「两两比较」中如果方差齐,则常选择「LSD」「Tukey」「Dunnett」等。
而我们此次方差不齐,则选择「Tamhane’s T2(M)」(具体哪种非参数检验则根据实验需要选择);
在「选项」中选择「描述性」,点击「确定」则可看到比较的结果。
结果中可以看到,每两组之间两两比较均有显著性差异,说明化合物有显著的抗肿瘤效果。
多因素方差分析(Two-wayANOVA)
当三组及三组以上数据且同时存在两个及两个以上变量时,为了考察两个及两个以上的变量对实验结果是否有影响,此时我们应该采用多因素方差分析(Two-wayANOVA)。
例如,我们考察不同浓度下给药时间不同是否对抗肿瘤药药效有差异;药物临床实验时给药后不同时间点不同性别的受试者血药浓度是否有差异等。
我们以不同周期下不同性别的小鼠体重是否有差异为例,说明多因素方差分析的运用。
我们可以直接将数据输入 SPSS 中,点击「分析」「一般线性模型」「单变量」
我们将「体重」添加至因变量中,分别将「周期」和「性别」放入固定因子中;
此外,只需点击「选项」,在选项中将三组因子添加至「显示均值」框中,在「输出」中将「描述统计」和「方差齐性检验」勾上;
点击「继续」「确定」,其余选项按照默认值不需改变即可。
在结果分析中,最主要的是「主体间效应的检验」,结果中我们可以看出,单个因子中不同周期和不同性别对小鼠体重有显著影响;
而在多因素中,不同周期下不同性别对小鼠体重呈现出显著影响。
总 结
两两比较,u 检验(n≥30 或方差已知 n<30),t 检验(方差未知且 n<30)
三组以上单变量比较,One-way ANOVA
三组以上两个及两个以上变量比较,Two-way ANOVA
F 检验比较方差齐性,t 检验和 ANOVA 分析之前应做 F 检验。