SPSS 卡方检验常见的 5 大误区,你踩过吗?
杏花开医学统计
卡方检验对原始数据有一定的要求,只有符合卡方检验前提条件的数据才可以使用卡方检验,否则,必须改用其他检验方法。因此,没有充分了解卡方检验的前提条件,就有可能进入卡方检验的误区,从而你导致统计结论不准确,对科研成果的准确性造成巨大影响。小编整理了小伙伴容易陷入的卡方检验 5 大误区,来瞅瞅你中招了没?
误区 1:总样本量低于 40,不能使用卡方检验
卡方检验的第一个前提条件是要求总样本量大于 40,如果总样本小于或者等于 40 时,卡方检验失效,要改用 Fisher 确切概率法。
误区 2:理论频数低于 5 的单元格个数超过 20%,不能使用卡方检验
以 SPSS 卡方检验输出结果为例:
上图详细讲述了为什么频数低于 5 的单元格的个数占比为 50%。卡方检验的第二个前提条件是要求理论频数低于 5 的单元格个数不超过 20%,如果超过了 20%,则卡方检验失效,要改用 Fisher 确切概率法。
误区 3:某一单元格出现了频数 0,不能使用卡方检验
当某一单元格出现 0 时,卡方检验失效,必须改用 Fisher 确切概率法,如下图所示:
实验组 0 人发生事件,改用 Fisher 确切概率法检验构成比的差异。
误区 4:被检验变量为等级资料时,不能使用卡方检验
例如,比较新药治疗组和传统治疗组的疗效等级的差异时,即被检验变量是等级资料,卡方检验失效。如下图所示:
因为卡方检验仅仅是比较两组疗效的构成比例,而单纯的比例检验并没有考虑比例中还含有等级递增的趋势,因此,对于被检验变量为等级资料的时候,应该选择秩和检验。
误区 5:配对资料,不能使用卡方检验
以上案例全部为两个独立组之间的差异比较,即独立样本的卡方检验。而医学研究中经常会有配对资料,例如,对同一批患者进行两种方法来诊断,诊断结果如下图:
如上图所示,对同一批患者进行两种方法诊断,属于配对样本,交叉表卡方检验失效,必须改用配对卡方检验(McNemar’s Test)