多个率或多个构成比的比较
互联网
(一)2×K表的专用公式,前面已讨论了,两个率的比较用四格表专用公式计算χ 2 值较为简便。如果是多个率比较,就要列成2×K表。这里的K暂为所比较的组数,2为每个组内所划分的类型数。求χ 2 值时本可用基本公式计算,但以用下列专用公式为便:
(3.10) (3.11)
表3.9 2×K表形式之一
a
1
a 2 ┆ ┆ |
b
1
b 2 ┆ ┆ |
n
1
n 2 ┆ ┆ |
∑a i | ∑b i | N |
公式中符号的意义参阅表3.9,以上两个公式的计算结果是完全一样的。
例3.3 某地观察磺胺三甲氧吡嗪加增效剂(吡嗪磺合剂)预防疟疾复发的效果,用已知有抗疟疾复发效果的乙胺嘧啶和不投药组作对照,比较三组的疟疾复发率,资料如表3.10,问三组复发率有无显著差别?
表3.10 三个组的疟疾复发率
组别 |
观察例数 |
复发例数 |
复发率(%) |
吡嗪磺合剂
乙胺嘧啶 对照 |
1996 473 484 |
76 27 53 |
3.81
5.71 10.95 |
合计 |
2953 |
156 |
5.28 |
χ 2 检验步骤如下:
1.将表3.10资料写成2×K表形式,见表3.11。注意:这里必须把各组的观察例数分为复发和未复发两部分,这样表3.10就为写成2×3表。
表3.11 三个组疟疾复发率的比较
复发 | 未复发 | 合 计 | |
吡嗪磺合剂 | 76 | 1920 | 1996 |
乙胺嘧啶 | 27 | 446 | 473 |
对 照 | 53 | 431 | 484 |
合 计 | 156 | 2797 | 2953 |
2.H 0 :三个总体复发率相同
H 1 :三个总体复发率不全相同
α=0.05
3.求χ 2 值 将表3.11的数值代入式(3.10)(因为在表3.11中,各组的a值较小,计算较方便)得:
4.求自由度,确定P值,作结论
ν=(K-1)(2-1)=(3-1)(2-1)=2,查χ 2 值表得χ 2 0.01(2) =9.21,本例χ 2 =39.92>χ 2 0.01(2) ,P<0.01,在α=0.05的水准处拒绝H 0 ,接受H 1 ,即三个组的复发率有显著差别。
本例的结论是三个组的复发率有显著差别,因此,还需进一步说明三组中那两组有差别,可用四格表对每两个率进行假设检验。本例的检验结果是:吡嗪磺合剂与对照组比(P<0.01),乙胺嘧啶组与对照组比(P<0.01),而吡嗪磺合剂与乙胺嘧啶比(P>0.05),说明吡嗪磺合剂有预防疟疾复发的作用,其效果不低于乙胺嘧啶。
本例2×K表的2是指得发、未复发两项,K为比较的组数,K=3。如果比较组数只有2,而构成每组的项数则多于2,如甲状腺肿的型别构成可分为弥漫型、结节型、混合型三种。这类资料亦同样可用2×K表专用公式进行检验。这时把2作为比较组数,K作为项数,检验方法同上,表3.12是2×K表的另一种形式。
表3.12 2×K表形式之二
a 1 | a 2 | …… |
∑a
i
∑b i |
b 1 | b 2 | …… | |
n 1 | n 2 | …… | N |
例3.4,为研究不同地域甲状腺型别的构成有无显著差别,某省对两个县的居民进行甲状腺肿调查,得资料如表3.13,问甲乙两县各型甲状腺肿患者构成比有无显著判别?
表3.13 某省甲乙两县甲状腺肿患者型别构成比较
县名 | 弥漫型 | 结节型 | 混合型 | 合计 |
甲县 | 486 | 2 | 4 | 492 |
乙县 | 133 | 260 | 51 | 444 |
合计 | 619 | 262 | 55 | 936 |
检验步骤如下:
1.H 0 :两总体甲状腺肿型别构成相同
H 1: 两总体甲状腺肿型别构成不同
α=0.05
2.求χ 2 值, 将表3.13中的数值代入式3.10得:
3.求自由度,确定P值,作结论。
ν=(3-1)(2-1)=2,查χ 2 值表得χ 2 0.01(2) =9.21,本例,χ 2 =494.36,P<0.01,在α=0.05水准处拒绝H 0 ,接受H 1 ,甲、乙两县甲状腺肿型别构成有差别(P<0.01)。甲县以弥漫型为主,而乙县结节型较多,地域与患者的型别构成具有一定的关系。
此类资料经χ 2 检验作结论,如果不显著,说明两组资料的构成比来自同一总体,没有显著差别。如果结论显著,说明两组的构成比来自不同总体,差别有显著性。同时要指出两组构成的主要区别。
(二)R×C表的通用公式当资料的行数和列数都超过2时称R×C表。对此种资料作假设检验时,可用基本公式(3.5),但运算较繁,如果用R×C表的通用公式计算χ 2 值,较为简便。
(3.12)
式中,A ij 为i行第j列的实际频数,n i 为第i行的合计数,n j 为第j行列的合计数,N为总频数。
这个公式也系由基本公式(3.5)推导出来,式(3.12)也可用以求四格表、2×K表资料的X 2 值,故称通用公式,用此公式不需计算理论频数,与基本公式(3.5)相比,较为简便。
例3.5某院肝胆外科在手术中观察了 胆结石 的部位与类型得资料如表3.14,试分析两者间有无关系存在?
表3.14 胆结石 类型与部位的关系
结石部位 | 总例数 | 例 数 | 百 分 比 | ||||
胆固醇结石 | 胆红素结石 | 其它 | 胆固醇结石 | 胆红素结石 | 其它 | ||
胆囊 | 118 | 70 | 16 | 32 | 59.3 | 13.6 | 27.1 |
肝外胆管 | 75 | 12 | 39 | 24 | 16.0 | 52.0 | 32.0 |
肝内胆管 | 29 | 2 | 20 | 7 | 6.9 | 69.0 | 24.1 |
合计 | 222 | 84 | 75 | 63 | 37.8 | 33.8 | 28.4 |
检验步骤如下:
1.将表3.14资料写成R×C表形式,见表3.15.
表3.15 胆结石类型与部位的关系
结石部位 | 结构类型 | |||
胆固醇结石 | 胆红素结石 | 其它 | 合计 | |
胆囊 | 70 | 16 | 32 | 118 |
肝外胆管 | 12 | 39 | 24 | 75 |
肝内胆管 | 2 | 20 | 7 | 29 |
合计 | 84 | 75 | 63 | 222 |
2.H 0 :胆结石的类型与部位没有关系
H 1 :胆结石的类型与部位有关系
α=0.01
3.求χ 2 值 将表3.15数值代入式(3.12)得:
4.求自由度,确定P值,作结论。
ν=(3-1)(3-1)=4,查χ 2 值表得χ 2 0.01(4) =13.28,本例χ 2 =64.06<χ 2 0.01 。在α=0.01水准处拒绝H 0 ,接受H 1 ,胆结石类型与部位有显著关系存在(P<0.01),胆囊内以胆固醇结石居多,肝内、外胆管以胆红素结石为主。