丁香实验_LOGO
登录
提问
我要登录
|免费注册
点赞
收藏
wx-share
分享

 X2检验

互联网

3143
网络
 

 

第二节 X 2 检验

  X 2 (称卡方)检验用途较广,但主要用于检验两个或两个以上样本率或构成比之间差别的显著性,也可检验两类事物之间是否存在一定的关系。

一、两个率的比较

  (一)X 2 检验的基本公式 下页末行的例3.1是两组心肌梗塞病人病死率的比较,见表3.5,其中对照组未用抗凝药。两组病人的病死率不同,抗凝药组为25.33%,对照组为40.8%。造成这种不同的原因可能有两种:一种是仅由抽样误差所致;另一种是两个总体病死率确实有所不同。为了区别这两种情况,应当进行X 2 检验。其基本步骤如下:

1.首先将资料写成四格表形式,如表3.6。

将每个组的治疗人数分为死亡与生存两部分,各占四格表中的一格,这些数字称为实际频数,符号为A,即实际观察得来的数字。

  2.建立检验假设 为了进行检验,首先作检验假设:两种疗法的两总体病死率相等,为35%(即70/200),记为H 0 :π 12 。即不论用或不用抗凝药,病死率都是35%,所以亦可以换一种说法:病死率与疗法无关。

  上述假设经过下面步骤的检验后,可以被接受也可以被拒绝。当H 0 被拒绝时,就意味着接受其对立假设即备择假设H 1 。此例备择假设为两总体病死率不相等,记为H 1 :π 1 ≠π 2

  因为我们观察的是随机现象,所以无论是接受或拒绝H 0 都冒有一定风险,即存在着错判的可能性。一般要求,当错误地被拒绝的概率α不超过一定的数值,如5%(或0.05),此值称为检验水准,记为α=0.05。

3.计算理论频数 根据“检验假设”推算出来的频数称理论频数,符号为T。计算方法如下:假设两总体病死率相同,都是35.0%,那么抗凝血组治疗75人,其死亡的理论频数应为75×35.0%=26.25人,而生存的理论频数为75-26.25=48.75人。用同样方法可求出对照组的死亡与生存的理论频数,前者为43.75人。后者为81.25人。 然后,把这些理论频数填入相应的实际频数格内,见表3.6括号内数字。

计算理论频数也可用下式(3.4)

  T RC =n R n C /N (3.4)

  式中,T RC 为R行与C列相交格子的理论频数,n R 为与计算的理论频数同行的合计数,n C 为与该理论频数同列的合计数,N为总例数。

  例如;表3.6第一行与第一列相交格子的理论频数(T 1 )为

  T 11 75×70/200=26.25

用两种方法计算,结果是相同的。

  4.计算χ 2 值,计算χ 2 值的基本公式为:

  X 2 =∑(A-T) 2 /t  (3.5)

式中,A为实际频数,T为理论频数,∑为求和符号。

  将表3.6里的实际频数与理论频数代入式(3.5)即求得χ 2 值。此例χ 2 =4.929。

  从式3.5中可看出,实际频数与理论频数之差(A-T)愈小,所得的χ 2 值就愈小,理论频数是根据检验假设推算出来的,若与实际频数相差不大,说明假设与实际情况符合,于是就接受H 0 ,认为两病死率无显著差别;反之,若(A-T)大,则χ 2 值亦大,说明假设与实际不符,就拒绝假设,认为两病死率有差别。但χ 2 值大还是小,要有一个比较的标准,要查χ 2 值表(附表1),查χ 2 值表前先要定自由度。

5.求自由度 自由度是数学上的一个名词。在统计中,几个数据不受任何条件(如统计量,即样本特征数)的限制,几个数据就可以任意指定,称为有几个自由度。若受到P个条件限制,就只有n-p个自由度了。例如在四格表中有四个实际频数,如没有任何条件限制,则4个数字都可任意取值,有4个自由度,当a+b,,c+d,a+c,b+d都固定后,在a、b、c、d四个实际频数中,只能有一个频数可任意指定了,因此,四格表的自由度为1。其计算公式为:

ν=(R-1)(C-1) (3.6)

式中,ν为自由度,R为横行数,C为纵列数。

四格表有2行和2列(注意:总计与合计栏不算在内)。因此ν=(2-1)(2-1)=1。

  6.求P值,作结论 根据自由度查χ 2 值表(附表1)。此表的左侧ν为自由度,表内数字χ 2 值,表的上端P是从同一总体中抽得此样本χ 2 值的概率。三者关系是:在同一自由度下,χ 2 值越大,从同一总体中抽得此样本的概率P值越小;在同一P值下,自由度越大,χ 2 值也越大。χ 2 值与概率P呈相反的关系。χ 2 检验的常用界值为:

  χ 2 <χ> 2 0.05() P>0.05 在α=0.05水准处接受H 0 ,差别不显著

  χ 2 0.05 ≤χ 2 <χ> 2 0.01() 0.05≥P>0.01 在α=0.05水准处拒绝H O ,接受H 1 ,差别显著

  χ 2 ≥χ 2 0 . 01() P≤0.01 在α=0.01水准处拒绝H O ,接受H 1 ,差别显著

  这里α是预定的检验水准。χ 2 0.05() 是当自由度为ν时与P=0.05相对应的χ 2 值,简称5%点,χ 2 0.01() 是与P=0.01相对应的χ 2 值,简称1%点。

  当ν=1时,χ 2 0.05(1) 3.84,χ 2 0.01(1) =6.63。本例自由度为1,求得χ 2 =4.929,介于3.84与6.63之间,或写成χ 2 0.05(1) <χ> 2 <χ> 2 0.01(1) 。由于与3.84对应的纵行P=0.05,与6.63对应的纵行P=0.01,因此与样本χ 2 =4.929相应的概率介于0.05与0.01之间,写成0.05>P>0.01。在α=0.05水准处拒绝H 0 ,接受H 1 ,两总体率不等。对照组的病死率较抗凝血组高。

  在α=0.05水准处拒绝H 0 ,说明若在同样情况下作100次判断,将有5次或不到5次的机会,将原没有差别的两总体率错判为有差别,或说这样判断犯I型错误的概率不超过5%。

下面将实例的检验步骤集中列出。

例3.1 两组心肌梗塞病人的病死率可见于表3.5,其中对照组未用抗凝药。抗凝血组病死率为25.33%,对照组为40.80%,问两组病死率有无显著差别?

表3.5 两组心肌梗塞病人病死率比较

组别 治疗人数 死亡人数 病死率(%) 抗凝血组 75 19 25.33 对 照 组 125 51 40.80 总 计 200 70 35.00

检验步骤如下:

1.将资料列成四格表形式,如表3.6。

表3.6 四格表式样

  死亡 生存 合计 抗凝血组 19(26.25) 56(48.75) 75 对照组 51(43.75) 74(81.25) 125 总 计 70 130 200

  2.H 0 :两疗法的总体病死率相同,即 π1

       

 

提问
扫一扫
丁香实验小程序二维码
实验小助手
丁香实验公众号二维码
关注公众号
反馈
TOP
打开小程序