第七章卡方检验
第七章卡方检验

二、两相关样本率检验(McNemar) 两相关样本率检验(
1.资料类型 1.资料类型 两个相关样本率资料又称配对计数资料,顾名思义, 两个相关样本率资料又称配对计数资料,顾名思义, 是采用配对设计,且结果以频数方式表达的资料, 是采用配对设计,且结果以频数方式表达的资料,见 例 7 -3 。 某抗癌新药的毒理研究中, 78只大鼠按性 例7-3某抗癌新药的毒理研究中,将78只大鼠按性 窝别、体重、年龄等因素配成39 39对 别、窝别、体重、年龄等因素配成39对,每个对子的 两只大鼠经随机分配,分别接受甲剂量和乙剂量注射, 两只大鼠经随机分配,分别接受甲剂量和乙剂量注射, 试验结果见表7 试验结果见表7-4。试分析该新药两种不同剂量的 毒性有无差异。 毒性有无差异。
P <α
理论频数太小的三种处理方法
1.增大样本量. 1.增大样本量. 增大样本量 2.删去理论频数太小的格子所对应的行或列。 2.删去理论频数太小的格子所对应的行或列。 删去理论频并理论频数太小的格子所相邻的行或列。 合并理论频数太小的格子所相邻的行或列
一、多个样本率的比较
例7-4用A、B、C三种不同方法分别处理新 生儿脐带,发生感染的情况见表7 生儿脐带,发生感染的情况见表7-6,试 比较3种不同方法的脐带感染率有无差异。 比较3种不同方法的脐带感染率有无差异。
三、多组百分比的比较
在某项疼痛测量研究中, 160例手术后疼痛 例7-6 在某项疼痛测量研究中,给160例手术后疼痛 的患者提供四种疼痛测量量表,即直观模拟量表( 的患者提供四种疼痛测量量表,即直观模拟量表( VAS),数字评估量表(NRS),词语描述量表( ),数字评估量表 ),词语描述量表 VAS),数字评估量表(NRS),词语描述量表(VDS ),面部表情疼痛量表 FPS) 面部表情疼痛量表( ),面部表情疼痛量表(FPS),患者首选的量表以 及患者的文化程度见表9 及患者的文化程度见表9-8,问患者首选疼痛量表与 文化程度是否有关? 文化程度是否有关?
第七章卡方检验

2.6525 1.5469
Mantel-Haenszel Chi-Square
Phi Coefficient Contingency Coefficient Cramer's V
1
2.6667
0.1025
-0.2887 0.2774 -0.2887
WARNING: 25% of the cells have expected counts less
解答问题的步骤
2.计算检验统计量。
A n( 1) n R nC
2
2 2 2 199 7 26 2 532( 1) 21.04 206 481 206 51 144 51
2
解答问题的步骤
3.查相应界值表,确定P值,下结论。
=(R-1)(C-1)=2,查附表8,
**三、专用公式计算
(A T) T
2 2
组别 A B 合计 结果 阳性 阴性 a b c d a+c b+d 合计 a+b c+d a+b+c+d=N
(ad bc) N (a b)(c d )(a c)(b d )
2 2
(99 21 5 75) 200 12.86 104 96 174 26 两公式比较:计算、应用、含义
一、2检验的基本思想(听懂)
组别 A B 合计
2
结果 阳性 阴性 a b c d a+c b+d
2
合计 a+b c+d a+b+c+d=N
(A T) T
实际频数:A 理论频数:TRC=nrnc/N
卡方检验

计数资料:又称为定性资料或无序分类变量资料,也称 名义变量资料,是将观察单位按某种属性或类别分组计 数,分别汇总各组观察单位数后而得到的资料,其变量 值是定性的,表现为互不相容的属性或类别。
计量资料:又称定量资料或数值变量资料,为观测每个 观察单位某项指标的大小而获得的资料。其变量值是定 量的,表现为数值大小,一般有度量衡单位(cm、mmhg、 次/分、单位等)。
2
(2 1)(2 1) 1
3. 确定P值,作出统计推断
查2界值表,得2 0.005,1=7.88, 2 > 2 0.005,1,P <0.005,按 = 0.05水准,拒绝H0 ,接受H1,差 异有统计学意义,可以认为两组的显效率不等
四格表资料2检验的条件
例:为比较西药与中药治疗慢性支气管炎的疗效,某医师将符合 研究标准的110例慢性支气管炎患者随机分为两组(两组具有可比 性),西药组86例,中药组24例。服药一个疗程后,观察患者的 疗效,结果见下表。根据显效率,该医师认为中西药治疗慢性支 气管炎的疗效有差别,中药组的疗效好于西药组
表1 中西药治疗慢性支气管炎的显效率
等级资料:将观察单位按某种属性或某个标志分组,然 后清点各观察单位个数得来。具有等级顺序。(-、+、++、 +++;治愈、好转、无效、死亡)
独立样本:一般情况下,比较两个(类)人之间的差异 就是独立样本。(实验组、控制组)
配对样本:1. 一个人的不同部位进行测试。2.前测后测 的情况属于相关样本(同一人先后测试a、b两种药物)。 3. 两个匹配样本的比较。(测试两人智力,控制语文成 绩相等)
组别 西药组 中药组 合 计 治疗人数 86 24 110 显效人数 35 18 53 显效率(%) 40.70 75.00 48.18
卡方检验

27
表7 - 8
三种疗法有效率的比较 合计 有效率(%) 有效率(%) 206 182 144 532 96.60 90.11 81.94 90.41
疗法 物理疗法组 药物治疗组 外用膏药组 合计
有效 199 164 118 481
无效 7 18 26 51
28
检验步骤1 检验步骤1-建立假设
H0:三种疗法的有效率相等
免疫荧光法 + -
合计
+
11(a)
12(b)
23
-
2(c)
33(d)
35
合计
13
45
58
20
检验步骤1 检验步骤1-建立假设
H0:两种方法的检测结果相同
H1:两种方法的检测结果不相同
确定检验水准:α = 0.05
21
检验步骤2 检验步骤2-计算检验统计量
(b-c)2 2 未校正计算公式: 未校正计算公式:χ = b+c
P<0.05
结论:在 α = 0.05水准上,拒绝H0,接受H1,可以认 结论: 水准上,拒绝H 接受H 为三种疗法的有效率不全相等(统计学结论),可 ),可 为三种疗法的有效率不全相等(统计学结论), 以认为三种疗法治疗周围性面神经麻痹的有效率有 差别(专业结论)。 差别(专业结论)。
31
多个样本构成比的比较
14
四格表专用公式: 四格表专用公式:
(A−T) χ =∑ T
2
2
2
(ad −bc) N χ = (a +b)(c + d)(a + c)(b + d)
2
(99×21−5×75) ×200 本 : = 例 χ =12.86 104×96×174×26
《卡方检验》课件

制作交叉表
确定交叉表的行列变量
根据研究目的和内容,选择合适的行列变量,构建交叉表。
制作交叉表
将分组后的数据按照行列变量制作成交叉表,以便于进行卡 方检验。
计算理论频数
确定期望频数
根据交叉表中的数据,结合各组 的概率计算期望频数。
计算理论频数
根据期望频数和实际频数计算理 论频数,为后续的卡方检验提供 依据。
计算卡方值
计算卡方值
使用卡方检验的公式计算卡方值,该 值反映了实际频数与理论频数的差异 程度。
自由度的确定
在计算卡方值时,需要确定自由度, 自由度通常为行数与列数的减一。
显著性水平的确定
选择显著性水平
显著性水平是衡量卡方值是否显著的指标,通常选择0.05或0.01作为显著性水 平。
判断显著性
根据卡方值和自由度,结合显著性水平判断卡方检验的结果是否显著,从而得 出结论。
3.84、6.63等),可以确定观测频数与期望频数之间的差异是否具有统
计学显著性。
02
卡方检验的步骤
收集数据
确定研究目的
制定调查问卷或收集程序
在开始收集数据之前,需要明确研究 的目的和假设,以便有针对性地收集 相关数据。
根据研究目的和内容,制定合适的调 查问卷或建立数据收集程序,确保数 据的完整性和准确性。
详细描述
例如,在市场调研中,我们可以通过卡方检验来分析不同年龄段、性别、职业等 人群对于某产品的态度或购买意愿是否有显著差异,从而为产品定位和营销策略 提供依据。
实际案例二:医学研究中的应用
总结词
在医学研究中,卡方检验常用于病例 对照研究和队列研究中的分类变量关 联性分析。
详细描述
例如,在病例对照研究中,我们可以 通过卡方检验来比较病例组和对照组 在某些基因型、生活方式或暴露因素 上的分布是否有统计学差异,从而探 讨病因或危险因素。
医学统计学--卡方检验

笃 学
精 业
修 德
厚 生
6
2 ( A T ) 2值的大小还取决于 个数的多少(严 T 2 ( A T ) 格地说是自由度 的大小)。由于各 皆是 T 2
正值,故自由度 愈大, 值也会愈大;所以只 2 值才能正确地反映 有考虑了自由度 的影响,
实际频数 A和理论频数 T 的吻合程度。检验时, 要根据自由度 查 2 界值表。当 2≥ 2时, P , ,
2 中,若拒绝无效假设
H0只能做出总的结论,但还不知道哪两
个率之间有差别。若想知道哪两个率之间
有差别,还要进行两两比较,本节介绍两
两比较的方法之一:行×列表的分割。
笃 学
精 业
修 德
厚 生
30
4.行×列表的分割 (一)多个实验组间的两两比较 由于要做重复多次的假设检验,需对第Ⅰ 类错误作校正,新的校正检验水准为:
第七章 掌握内容:
2 检 验
1.检验的基本思想和用途 2.成组设计四格表资料检验的计算及应用条件
3.配对设计四格表资料检验 4.行列表资料检验及应用时应注意的问题 5.频数分布拟合优度的检验 了解内容 1.四格表资料的Fisher精确概率法的基本思想 与检验步骤
笃 学 精 业 修 德 厚 生
2 检验是一种用途很广的假设检验方
处理组 1 2 属性 阳性 阴性 合计
合计
a (T11) c (T21) m1
b (T12) d (T22) m2
n1(固定值) n2(固定值) n
要想知道处理组1,2之间差别是否有统计学意义, 常用 2 检验统计量来作假设检验。
笃 学 精 业 修 德 厚 生
5
卫生统计学第七章卡方检验

卫⽣统计学第七章卡⽅检验⼀、题型:A1题号: 1 本题分数: 2四格表资料两样本率⽐较的χ2检验,正确的⼀项为A. χ2值为两样本率⽐较中u值B. P<α前提下,χ2值越⼤,越有理由拒绝H0C. χ2值⼤⼩与样本含量⽆关D. 每个格⼦的理论频数与实际频数的差值相等E. χ2检验只能进⾏单侧检验正确答案: B答案解析:根据专业知识确定四格表资料两样本率⽐较的χ2检验采⽤单侧检验或是双侧检验, (也可使⽤四格表专⽤公式),可以证明四格表计算得出的χ2值与正态近似法两率⽐较中u值的平⽅相等,其⼤⼩与样本含量有关,且每个格⼦的理论频数与实际频数的差的绝对值相等,P<α前提下,⾃由度⼀定时,χ2值越⼤,P值越⼩,越有理由拒绝H0,故答案为B。
做答⼈数:0做对⼈数:0所占⽐例: 0题号: 2 本题分数: 2下列能⽤χ2检验的是A. 成组设计的两样本均数的⽐较B. 配对设计差值的⽐较C. 多个样本频率的⽐较D. 单个样本均数的⽐较E. 多个样本均数的⽐较正确答案: C答案解析:χ2检验可⽤于率或构成⽐⽐较的假设检验中,不适宜于均数的⽐较。
做答⼈数:0做对⼈数:0所占⽐例: 0题号: 3 本题分数: 2⾏×列表的⾃由度是A. ⾏数-1B. 列数-1C. ⾏数×列数D. (⾏数-1)×(列数-1)E. 样本含量-1正确答案: D答案解析:⾏×列表中,⾏的⾃由度=⾏数-1,列的⾃由度=列数-1,⾏×列⼆维表资料的χ2统计量所对应的⾃由度=(⾏数-1)×(列数-1)。
做答⼈数:0做对⼈数:0所占⽐例: 0题号: 4 本题分数: 2四个百分率做⽐较,有⼀个理论数⼩于5,其他都⼤于5,则A. 只能做校正χ2检验B. 不能做χ2检验C. 直接采⽤⾏×列表χ2检验D. 必须先做合理的合并E. 只能做秩和检验正确答案: C答案解析:四个百分率做⽐较,资料可整理为4×2的⾏×列表,多个率⽐较的⾏×列表资料不适宜采⽤秩和检验,当满⾜⾏×列⼩于5,可直接进⾏χ2检验。
第七章 卡方检验

2 校正公式
2 ( ad bc n / 2)2 n
(a b)(c d)(a c)(b d)
2
( A T 0.5)2 T
例 7
例3- 7-3 将病情相似的淋巴系肿瘤患者随机分成两组,分别做单纯化疗与复合化疗,
两组的缓解率见表7-4。问两疗法的总体缓解率是否不同?
第一节 频数分布拟合优度2 检验
goodness of fit 2 test for frequency distribution
一、χ 2 分布
χ 2分布是一种连续型随机变量的概率分布。
若Zi ~ N (0,1)
,
则称
2
Z12
Z
2 2
Z
2 3
...Biblioteka Z2 v为服从自由度为v 的 2 分布。
观察频数A (2) 2 2 7 17 25 37 25 16 4 1
136(n)
概率P(X) (3)
0.00397 0.01809 0.05801 0.13110 0.20888 0.23468 0.18592 0.10386 0.04090 0.01135
1.000
理论频数T (4)=(3) ×n
27 18
v (3 1)(2 1) 2
P<0.025 , 拒绝H0 ,认为三种剂量镇痛效果有差别.
二、多个率之间两两比较—2 分割法
行×列表资料的2 检验只能得出总的结论:即各总体率或构成比之 间总的来说有差别,但不能说它们彼此之间都有差别。若要进一步解决 此问题,可用2 分割法( partitions of 2 method)。 2 分割原理: (1)n个相互独立的2 分割之和服从2 分布且2总= 2 分割1+ 2 分割2+… (2) ν总=ν分割1+ ν分割2+ … (3)最相近原则分割原表
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
=3.841, 2 < 2 0.05,1
,故不能拒绝H0 ,
不能认为两法的检出率有差异。
第三节 行列表的2检验
行列表包括2 2、R 2、2 C、R C表等。
A2
2 = n( nr nc - 1)
适用条件:不能有T 1,并且 1T <5的格子数不超过总格 子数的1/5。
+ 合计
两种血清学检验结果比较
乙
法
+
-
80(a) 31(c)
10(b) 11(d)
111
21
合计
90 42 132
解:H0:两法总体阳性检出率无差别,即B=C; H1:两法总体阳性检出率不同,即BC; =0.05
Tb=Tc=(b+c)/2,
则
(b - c)2
2 =
b+c
, =1
校正公式
(|b - c|-1)2 , =1
第七章 2检验 (Chi-square test)
用于:
– 对多个独立样本率的比较,也适用于两个率 的比较;
– 对多组构成比的比较; – 对按照两个变量分组的资料,检验此两变量
的关系; – 对频数分布做拟合优度检验。
第一节 四格表(fourfold table)资料的2检验
一.普通2检验
例 6.2
处理 洛赛克 雷尼替丁 合计
表6.2 两种药物治疗消化道溃疡效果
愈合 64 51 115
未愈合 21 33 54
合计 85 84 169
愈合率(%) 75.29 60.71 68.05
解 H0:1= 2; H1:1 2; =0.05
A:实际频数(actural frequency) T:理论频数(theoretical frequency)
×84,
T12 = 54 ×85,
169
T22 =
54 ×84, 169
TRC=
nRnC n
2 = (64- T11)2
T11
(21- T12)2 (51- T21)2
+
T12
+
T21
+
(33- T22)2 T22
=4.13 =(R-1)(C-1)=(2-1)(2-1)=1 2 1,0.05 =3.84, 2 >2 1,0.05 , P<0.05, 拒绝H0。
13(9.2) 12(10.6) 2(2.8) 44
10(7.6) 8(8.8) 2(2.2) 35
11(10.3) 23(11.9) 5(3.1) 49
43
53
14
219
年龄/岁 11-30 31-50 50以上 总和
治愈 67 32 10 109
显效 9 23 11 43
好转 10 20 23 53
同
2 = (20 25-10 7)2 62 =12.636
30 32 27 35
查表得P 0.005,按=0.025水准拒绝H0,接受H1,可以认为复方降压片的有效率显
著地高于安慰剂。
2.多组间的两两比较
´=
C2 k
例 对前例资料进行两两比较 ´= 0.05 =0.0167 3
2 = (35 10 - 5 20)2 70
40 30 55 15
=4.419
查表得P >0.025,按=0.0167水准不能拒绝H0,不能认为两药的疗效不同。
三.多个构成比的比较
例 欲了解女性血栓形成患者的血型分布是否与正常妇女有所不同,资料见 表,试分析血栓形成患者与正常妇女血型分布构成比有无差别?
(A-T)2 2 =
T
(通用公式)
2 分布的性质
2 分布为连续型分布, 2 自0至,永远大 于0。
2 分布同t分布、F分布一样,也是随自由度 的不同而形成簇状分布。 2 分布的形态随自 由度而变化,自由度越小,偏态越甚;自由度 越大,其分布越趋近于正态分布。
2 具有可加性。
简化公式: 2 =
(ad-bc)2n (a+b)(c+d)(a+c)(b+d)
ab cd
(四格表专用公式)
普通2检验适用条件: n40且所有T 5。
二. 2检验的校正公式
(|A-T|-0.5)2 2 =
T
(n40但有1T5)
简化公式: 2 =
(|ad-bc|-n/2)2n (a+b)(c+d)(a+c)(b+d)
P=
15! 10! 4! 21!
=0.1423
1! 14! 3! 7! 25!
将该表分解成若干种不同的情况,使得周边数不变:
确切概率法计算表(四格表周边合计数不变)
序号(i)
阳性
0 0
4
1 1
3
2 2
2
3 3
1
4 4
0
阴性
15 6 14 7 13 8 12 9 11 10
P1 P2 0.000 0.400 0.067 0.300 0.133 0.200 0.200 0.100 0.267 0.000
解: 甲法检出人数
140 0.65=91
乙法检出人数
140 0.55=77
甲、乙两法都检出人数 140 0.40=56
两法检出结果的比较
甲法 +乙法Fra bibliotek+
-
56
35
合计 91
-
21
28
49
合计
77
63
140
(35 - 21)2
2 =
35+21
= 3.500
按=0.05查表,得2 0.05,1
40 32 42 30
H1:复方哌唑嗪与安慰剂的有效率不 =31.500
查表得P 0.005,按=0.025水准拒绝H0,接受H1,可以认为复方哌唑嗪的有效率
显著地高于安慰剂。
(2)复方降压片与安慰剂的比较
组别
有效
无效
复方降压片
20
10
安 慰剂
7
25
合计
27
35
合计
30 32 62
H0:复方降压片与安慰剂的有效率相同; H1:复方降压片与安慰剂的有效率不
复方哌唑嗪与安慰剂比较的2 =31.500,复方降压片与安慰剂比较的
2 =12.636,按´=0.0167都应拒绝H0,结论同前。
在多组间的两两比较中,还需进行复方哌唑嗪与复方降压片的比较。
组别
有效
无效
合计
复方哌唑嗪 35
复方降压片 20
合计
55
5
40
10
30
15
70
H0:复方哌唑嗪与复方降压片的有效率相同; H1:复方哌唑嗪与复方降压片的有效率不同。
| P1-P2| 0.267 0.1 0.067 0.233 0.4
P(i)
0.1079
0.0166
极端情况的概率: P=P(0)+ P(4)= 0.1079+0.0166=0.1245 按=0.05水准不拒绝H0,尚不能认为两组发癌率有差别。
第二节 配对四格表资料的 2检验
例6.8 甲法
| P1-P2| 0.400 0.233 0.067 0.100 0.267
P(i) 0.0166 0.1423
0.1079
极端情况的概率: P=P(0)+P(1)+P(4)=0.0166+0.1423+0.1079=0.2668 按=0.05水准不拒绝H0,尚不能认为两型布氏病患者PHA反应阳性率有差别。
无效 5 4 5 14
总和 91 79 49 219
练习 某医院研究急慢性白血病与血型之间有无关系,资料见下 表,问白血病的种类与患者血型的型别之间有无关联性?
补充题:
用某种化学物质进行诱发肿瘤实验,实验组15只小白鼠中 4只发生癌变,对照组10只无1只发生癌变,问两组发癌率 有无差别?
确切概率法计算表(四格表周边合计数不变)
序号(i)
阳性
4 0
0
3 1
1
2 2
2
1 3
3
0 4
4
阴性
11 10 12 9 13 8 14 7 15 6
P1 P2 0.267 0 0.2 0.1 0.133 0.2 0.067 0.3 0 0.4
设两样本的差值 | P1-P2| =D,双侧检验取 | P1-P2| D 的各种组合的累计概率为双侧P值;单侧检验取 P1-P2 D或 P1-P2 - D的各种组合的累计概率为单侧P值。若两样本例数 相等,则 P1-P2 D和 P1-P2 - D的P值相等,可先计算一侧
P值,再乘以2得双侧检验的概率。
正常妇女与血栓形成者的血型分布表
分组
A型
B型
AB型
O型
合计
血栓形成组 32
8
正常妇女组 51
19
合计
83
27
10
9
59
12
70
152
22
79
211
H0:血栓形成患者与正常妇女血型分布构成比相同;H1:血栓形成患者与正常
妇女血型分布构成比不同; =0.05。
2 =211[322/(59 83) +82/(59 27)+ 102/(59 22)+ 92/(59 79) + 512/(152 83)+ 192/(152 27)+ 122/(152 22)+ 702/(152 79) -1]
P值在0~1之间,0表示完全无关,1表示完全相关。