第七章 卡方检验
第七章卡方检验

二、两相关样本率检验(McNemar) 两相关样本率检验(
1.资料类型 1.资料类型 两个相关样本率资料又称配对计数资料,顾名思义, 两个相关样本率资料又称配对计数资料,顾名思义, 是采用配对设计,且结果以频数方式表达的资料, 是采用配对设计,且结果以频数方式表达的资料,见 例 7 -3 。 某抗癌新药的毒理研究中, 78只大鼠按性 例7-3某抗癌新药的毒理研究中,将78只大鼠按性 窝别、体重、年龄等因素配成39 39对 别、窝别、体重、年龄等因素配成39对,每个对子的 两只大鼠经随机分配,分别接受甲剂量和乙剂量注射, 两只大鼠经随机分配,分别接受甲剂量和乙剂量注射, 试验结果见表7 试验结果见表7-4。试分析该新药两种不同剂量的 毒性有无差异。 毒性有无差异。
P <α
理论频数太小的三种处理方法
1.增大样本量. 1.增大样本量. 增大样本量 2.删去理论频数太小的格子所对应的行或列。 2.删去理论频数太小的格子所对应的行或列。 删去理论频并理论频数太小的格子所相邻的行或列。 合并理论频数太小的格子所相邻的行或列
一、多个样本率的比较
例7-4用A、B、C三种不同方法分别处理新 生儿脐带,发生感染的情况见表7 生儿脐带,发生感染的情况见表7-6,试 比较3种不同方法的脐带感染率有无差异。 比较3种不同方法的脐带感染率有无差异。
三、多组百分比的比较
在某项疼痛测量研究中, 160例手术后疼痛 例7-6 在某项疼痛测量研究中,给160例手术后疼痛 的患者提供四种疼痛测量量表,即直观模拟量表( 的患者提供四种疼痛测量量表,即直观模拟量表( VAS),数字评估量表(NRS),词语描述量表( ),数字评估量表 ),词语描述量表 VAS),数字评估量表(NRS),词语描述量表(VDS ),面部表情疼痛量表 FPS) 面部表情疼痛量表( ),面部表情疼痛量表(FPS),患者首选的量表以 及患者的文化程度见表9 及患者的文化程度见表9-8,问患者首选疼痛量表与 文化程度是否有关? 文化程度是否有关?
第七章卡方检验

2.6525 1.5469
Mantel-Haenszel Chi-Square
Phi Coefficient Contingency Coefficient Cramer's V
1
2.6667
0.1025
-0.2887 0.2774 -0.2887
WARNING: 25% of the cells have expected counts less
解答问题的步骤
2.计算检验统计量。
A n( 1) n R nC
2
2 2 2 199 7 26 2 532( 1) 21.04 206 481 206 51 144 51
2
解答问题的步骤
3.查相应界值表,确定P值,下结论。
=(R-1)(C-1)=2,查附表8,
**三、专用公式计算
(A T) T
2 2
组别 A B 合计 结果 阳性 阴性 a b c d a+c b+d 合计 a+b c+d a+b+c+d=N
(ad bc) N (a b)(c d )(a c)(b d )
2 2
(99 21 5 75) 200 12.86 104 96 174 26 两公式比较:计算、应用、含义
一、2检验的基本思想(听懂)
组别 A B 合计
2
结果 阳性 阴性 a b c d a+c b+d
2
合计 a+b c+d a+b+c+d=N
(A T) T
实际频数:A 理论频数:TRC=nrnc/N
卡方检验

计数资料:又称为定性资料或无序分类变量资料,也称 名义变量资料,是将观察单位按某种属性或类别分组计 数,分别汇总各组观察单位数后而得到的资料,其变量 值是定性的,表现为互不相容的属性或类别。
计量资料:又称定量资料或数值变量资料,为观测每个 观察单位某项指标的大小而获得的资料。其变量值是定 量的,表现为数值大小,一般有度量衡单位(cm、mmhg、 次/分、单位等)。
2
(2 1)(2 1) 1
3. 确定P值,作出统计推断
查2界值表,得2 0.005,1=7.88, 2 > 2 0.005,1,P <0.005,按 = 0.05水准,拒绝H0 ,接受H1,差 异有统计学意义,可以认为两组的显效率不等
四格表资料2检验的条件
例:为比较西药与中药治疗慢性支气管炎的疗效,某医师将符合 研究标准的110例慢性支气管炎患者随机分为两组(两组具有可比 性),西药组86例,中药组24例。服药一个疗程后,观察患者的 疗效,结果见下表。根据显效率,该医师认为中西药治疗慢性支 气管炎的疗效有差别,中药组的疗效好于西药组
表1 中西药治疗慢性支气管炎的显效率
等级资料:将观察单位按某种属性或某个标志分组,然 后清点各观察单位个数得来。具有等级顺序。(-、+、++、 +++;治愈、好转、无效、死亡)
独立样本:一般情况下,比较两个(类)人之间的差异 就是独立样本。(实验组、控制组)
配对样本:1. 一个人的不同部位进行测试。2.前测后测 的情况属于相关样本(同一人先后测试a、b两种药物)。 3. 两个匹配样本的比较。(测试两人智力,控制语文成 绩相等)
组别 西药组 中药组 合 计 治疗人数 86 24 110 显效人数 35 18 53 显效率(%) 40.70 75.00 48.18
卡方检验

27
表7 - 8
三种疗法有效率的比较 合计 有效率(%) 有效率(%) 206 182 144 532 96.60 90.11 81.94 90.41
疗法 物理疗法组 药物治疗组 外用膏药组 合计
有效 199 164 118 481
无效 7 18 26 51
28
检验步骤1 检验步骤1-建立假设
H0:三种疗法的有效率相等
免疫荧光法 + -
合计
+
11(a)
12(b)
23
-
2(c)
33(d)
35
合计
13
45
58
20
检验步骤1 检验步骤1-建立假设
H0:两种方法的检测结果相同
H1:两种方法的检测结果不相同
确定检验水准:α = 0.05
21
检验步骤2 检验步骤2-计算检验统计量
(b-c)2 2 未校正计算公式: 未校正计算公式:χ = b+c
P<0.05
结论:在 α = 0.05水准上,拒绝H0,接受H1,可以认 结论: 水准上,拒绝H 接受H 为三种疗法的有效率不全相等(统计学结论),可 ),可 为三种疗法的有效率不全相等(统计学结论), 以认为三种疗法治疗周围性面神经麻痹的有效率有 差别(专业结论)。 差别(专业结论)。
31
多个样本构成比的比较
14
四格表专用公式: 四格表专用公式:
(A−T) χ =∑ T
2
2
2
(ad −bc) N χ = (a +b)(c + d)(a + c)(b + d)
2
(99×21−5×75) ×200 本 : = 例 χ =12.86 104×96×174×26
《卡方检验》课件

制作交叉表
确定交叉表的行列变量
根据研究目的和内容,选择合适的行列变量,构建交叉表。
制作交叉表
将分组后的数据按照行列变量制作成交叉表,以便于进行卡 方检验。
计算理论频数
确定期望频数
根据交叉表中的数据,结合各组 的概率计算期望频数。
计算理论频数
根据期望频数和实际频数计算理 论频数,为后续的卡方检验提供 依据。
计算卡方值
计算卡方值
使用卡方检验的公式计算卡方值,该 值反映了实际频数与理论频数的差异 程度。
自由度的确定
在计算卡方值时,需要确定自由度, 自由度通常为行数与列数的减一。
显著性水平的确定
选择显著性水平
显著性水平是衡量卡方值是否显著的指标,通常选择0.05或0.01作为显著性水 平。
判断显著性
根据卡方值和自由度,结合显著性水平判断卡方检验的结果是否显著,从而得 出结论。
3.84、6.63等),可以确定观测频数与期望频数之间的差异是否具有统
计学显著性。
02
卡方检验的步骤
收集数据
确定研究目的
制定调查问卷或收集程序
在开始收集数据之前,需要明确研究 的目的和假设,以便有针对性地收集 相关数据。
根据研究目的和内容,制定合适的调 查问卷或建立数据收集程序,确保数 据的完整性和准确性。
详细描述
例如,在市场调研中,我们可以通过卡方检验来分析不同年龄段、性别、职业等 人群对于某产品的态度或购买意愿是否有显著差异,从而为产品定位和营销策略 提供依据。
实际案例二:医学研究中的应用
总结词
在医学研究中,卡方检验常用于病例 对照研究和队列研究中的分类变量关 联性分析。
详细描述
例如,在病例对照研究中,我们可以 通过卡方检验来比较病例组和对照组 在某些基因型、生活方式或暴露因素 上的分布是否有统计学差异,从而探 讨病因或危险因素。
医学统计学--卡方检验

笃 学
精 业
修 德
厚 生
6
2 ( A T ) 2值的大小还取决于 个数的多少(严 T 2 ( A T ) 格地说是自由度 的大小)。由于各 皆是 T 2
正值,故自由度 愈大, 值也会愈大;所以只 2 值才能正确地反映 有考虑了自由度 的影响,
实际频数 A和理论频数 T 的吻合程度。检验时, 要根据自由度 查 2 界值表。当 2≥ 2时, P , ,
2 中,若拒绝无效假设
H0只能做出总的结论,但还不知道哪两
个率之间有差别。若想知道哪两个率之间
有差别,还要进行两两比较,本节介绍两
两比较的方法之一:行×列表的分割。
笃 学
精 业
修 德
厚 生
30
4.行×列表的分割 (一)多个实验组间的两两比较 由于要做重复多次的假设检验,需对第Ⅰ 类错误作校正,新的校正检验水准为:
第七章 掌握内容:
2 检 验
1.检验的基本思想和用途 2.成组设计四格表资料检验的计算及应用条件
3.配对设计四格表资料检验 4.行列表资料检验及应用时应注意的问题 5.频数分布拟合优度的检验 了解内容 1.四格表资料的Fisher精确概率法的基本思想 与检验步骤
笃 学 精 业 修 德 厚 生
2 检验是一种用途很广的假设检验方
处理组 1 2 属性 阳性 阴性 合计
合计
a (T11) c (T21) m1
b (T12) d (T22) m2
n1(固定值) n2(固定值) n
要想知道处理组1,2之间差别是否有统计学意义, 常用 2 检验统计量来作假设检验。
笃 学 精 业 修 德 厚 生
5
卫生统计学第七章卡方检验

卫⽣统计学第七章卡⽅检验⼀、题型:A1题号: 1 本题分数: 2四格表资料两样本率⽐较的χ2检验,正确的⼀项为A. χ2值为两样本率⽐较中u值B. P<α前提下,χ2值越⼤,越有理由拒绝H0C. χ2值⼤⼩与样本含量⽆关D. 每个格⼦的理论频数与实际频数的差值相等E. χ2检验只能进⾏单侧检验正确答案: B答案解析:根据专业知识确定四格表资料两样本率⽐较的χ2检验采⽤单侧检验或是双侧检验, (也可使⽤四格表专⽤公式),可以证明四格表计算得出的χ2值与正态近似法两率⽐较中u值的平⽅相等,其⼤⼩与样本含量有关,且每个格⼦的理论频数与实际频数的差的绝对值相等,P<α前提下,⾃由度⼀定时,χ2值越⼤,P值越⼩,越有理由拒绝H0,故答案为B。
做答⼈数:0做对⼈数:0所占⽐例: 0题号: 2 本题分数: 2下列能⽤χ2检验的是A. 成组设计的两样本均数的⽐较B. 配对设计差值的⽐较C. 多个样本频率的⽐较D. 单个样本均数的⽐较E. 多个样本均数的⽐较正确答案: C答案解析:χ2检验可⽤于率或构成⽐⽐较的假设检验中,不适宜于均数的⽐较。
做答⼈数:0做对⼈数:0所占⽐例: 0题号: 3 本题分数: 2⾏×列表的⾃由度是A. ⾏数-1B. 列数-1C. ⾏数×列数D. (⾏数-1)×(列数-1)E. 样本含量-1正确答案: D答案解析:⾏×列表中,⾏的⾃由度=⾏数-1,列的⾃由度=列数-1,⾏×列⼆维表资料的χ2统计量所对应的⾃由度=(⾏数-1)×(列数-1)。
做答⼈数:0做对⼈数:0所占⽐例: 0题号: 4 本题分数: 2四个百分率做⽐较,有⼀个理论数⼩于5,其他都⼤于5,则A. 只能做校正χ2检验B. 不能做χ2检验C. 直接采⽤⾏×列表χ2检验D. 必须先做合理的合并E. 只能做秩和检验正确答案: C答案解析:四个百分率做⽐较,资料可整理为4×2的⾏×列表,多个率⽐较的⾏×列表资料不适宜采⽤秩和检验,当满⾜⾏×列⼩于5,可直接进⾏χ2检验。
第七章 卡方检验

2 校正公式
2 ( ad bc n / 2)2 n
(a b)(c d)(a c)(b d)
2
( A T 0.5)2 T
例 7
例3- 7-3 将病情相似的淋巴系肿瘤患者随机分成两组,分别做单纯化疗与复合化疗,
两组的缓解率见表7-4。问两疗法的总体缓解率是否不同?
第一节 频数分布拟合优度2 检验
goodness of fit 2 test for frequency distribution
一、χ 2 分布
χ 2分布是一种连续型随机变量的概率分布。
若Zi ~ N (0,1)
,
则称
2
Z12
Z
2 2
Z
2 3
...Biblioteka Z2 v为服从自由度为v 的 2 分布。
观察频数A (2) 2 2 7 17 25 37 25 16 4 1
136(n)
概率P(X) (3)
0.00397 0.01809 0.05801 0.13110 0.20888 0.23468 0.18592 0.10386 0.04090 0.01135
1.000
理论频数T (4)=(3) ×n
27 18
v (3 1)(2 1) 2
P<0.025 , 拒绝H0 ,认为三种剂量镇痛效果有差别.
二、多个率之间两两比较—2 分割法
行×列表资料的2 检验只能得出总的结论:即各总体率或构成比之 间总的来说有差别,但不能说它们彼此之间都有差别。若要进一步解决 此问题,可用2 分割法( partitions of 2 method)。 2 分割原理: (1)n个相互独立的2 分割之和服从2 分布且2总= 2 分割1+ 2 分割2+… (2) ν总=ν分割1+ ν分割2+ … (3)最相近原则分割原表
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3、确定 P 值,作出推断结论 以ν=1 查χ2界值表得:
2 0.05
3.84
2
2 0.05
,
P 0.05
拒绝H0,接受H1,可以认为· · · · · · · · · · · · · · · 不同。
2 2 0.05 ,
P 0.05
不拒绝H0,不可以认为 · · · · · · · · · · · · · · · · · · ·不同。
实际频数 ( A ) 理论频数 ( T ) 29 36×52.05%(38/73) = 18.74 7 36×47.95% (35/73) = 17.26 9 37×52.05%(38/73) = 19.26 28 37×47.95% (35/73) = 17.74
TRC=nRnC/ N
组别 中西结合 西药 合计
组别 中西结合 西药 合计
存活数 29 (18.74) 9 (19.26) 38
死亡数 7(17.26) 28(17.74) 35
合计 存活率(%) 36 80.56 37 24.32 73 52.05
18.74 19.26 = =0.5205 36 37 18.74 17.26 = =0.4932 38 35
两种治疗方法治疗心肌梗死的疗效
组别 中西结合 西药 合计
存活数 死亡数 29 7 9 28 38 35
合计 36 37 73
存活率(%) 80.56 24.32 52.05
一、χ2检验的基本思想
组别 中西结合 西药 合计 存活数 死亡数 29 7 9 28 38 35 合计 36 37 73 存活率(%) 80.56 24.32 52.05
第三节 行×列表资料的χ2检验
一、资料的基本形式
2×2表:两样本率的比较
组别 合计 率(%)
合计
R×2表:多个样本率的比较
组别 合计 率(%)
合计
2×C表:两样本构成比的比较
组别 合计 率(%)
合计
行×列表资料: (1)多个样本构成比的比较 (2)双向无序分类资料关联性检验
组别 合计 率(%)
2、选定检验方法、计算检验统计量
n = ,T min =
2
( ad bc n / 2)2 n (a b)(c d )(a c)(b d )
(ad bc)2 n 2 (a b)(c d )(a c)(b d )
(2 1) (2 1) 1
( A T )2 T
2
(b c) 2 bc
2
1
(b c 40)
2
( A T 0.5) 2 T
2
( b c 1) 2 bc
1
(b c 40)
H0:B=C,即两试剂检测结果一致 H1:B≠C,即两试剂检测结果不一致 α=0.05 (b+c) = (22+6) = 28<40
存活数 29 (18.74) 9 (19.26) 38
死亡数 7(17.26) 28(17.74) 35
合计 存活率(%) 36 80.56 37 24.32 73 52.05
18.74 + 17.26 = 36 = 29 + 7 19.26 + 17.74 = 37 = 9 + 28 18.74 + 19.26 = 38 = 29 + 9 17.26 + 17.74 = 35 = 7 +28 结论1: 理论频数的横向合计与纵向合计和实际频数的横向 合计与纵向合计相等。
2 2 ,
P P
拒绝H0,接受H1
,
2 2
不拒绝H0
样本率与样 本率的差别
H0成立
总体率与总 体率的差别
实际数与理 论数的差别
χ2 分布
P值
检验水准α
卡方值
自由度
卡方界值
卡方检验的基本思想
假设在H0成立的前提下,将两样本率的差别演绎为实际频数与理 论频数之间的差别 ,理论频数与实际频数的差值服从χ2分布, χ2 值是以理论频数为基础的相对误差,它反映出了实际频数与理论 频数的吻合程度(差别程度)。 χ2值越小,即理论频数与实际频 数的差值越小,两样本率差别越小,越有理由认为两总体率相等。 χ2值越大,即理论频数与实际频数的差值越大,两样本率差别越大, 越有理由认为两总体率不等。根据χ2分布和小概率事件原理将计算 所得的检验统计量与检验水准α=0.05 (0.01) 所对应的卡方界值进行 比较:
(2 1) (2 1) 1
以ν=1 查χ2界值表得:
2 0.05 3.84, 2 0.05 ,
p 0.05
拒绝H0,接受H1,可以认为两种治疗方法的存活率不同。
第二节 配对四格表资料的χ2检验
例:某检验师用甲乙两种HBsAg诊断试剂检测93份血清, 两次结果均为阳性的共45份,都是阴性的共20份,甲试 剂检测为阳性但乙试剂检测为阴性的22份,甲试剂检测 为阴性但乙试剂检测为阳性的6份,问两种试剂的检测 结果有无差别? 甲试剂
H1 :1 ≠ 2 ,即两种治疗方法的存活率不同 α=0.05
组别 中西结合 西药 合计
存活数 死亡数 29 7 9 28 38 35
合计 36 37 73
存活率(%) 80.56 24.32 52.05
n = 73 >40, T min = 35×36/73 = 17.26 >5
(ad bc)2 n 2 23.12 (a b)(c d )(a c)(b d )
合计
二、基本思想: 检验实际频数和理论频数的差别是否是由抽样 误差所引起的,也就是用样本率(或构成比)来推 断总体率(或构成比)。 三、应用条件: ① 不能有T<1的格子, ② T< 5的频数不能超过格子总数的1/5。
四、检验统计量的计算: 基本公式:
医学统计学
statistics of medicine
王俊明 wjm_2000@
河北北方学院预防医学教研室
第七章
2
检验
( Chi-square test )
第一节
四格表资料的χ2 检验
例:某医师研究中西医结合治疗心肌梗死疗效,结果 如下表。试分析两组不同疗法的患者生存率是否相 同。
2 2 , 2 2 ,
P P
拒绝H0,接受H1 不拒绝H0
二、四格表资料χ2 检验的应用条件
组别 甲 乙 合计 阳性数 29 (18.74) 9 (19.26) 38 阴性数 7(17.26) 28(17.74) 35 合计 阳性率(%) 36 80.56 37 24.32 73 52.05
因此:
①实际频数与理论频数的差别等价于两样本率的差别;
②对实际频数与理论频数差值的假设检验等价于对两样本 率差值的假设检验。
已经证明: 实际频数与理论频数的差值服从 基本公式是:
2分布,
(A T) T
2
2
(行数 1) (列数 1)
0.3 0.2 0.1 0.0 0
ν =1
ν =3
0.05
ν = 10
2
4
6
8
10
不同自由度的 2 分布曲线图
由此可见: χ2值是以理论频数为基础的相对误差,它反映出了实际 频数与理论频数的吻合程度(差别程度)。 χ2值越小,即理论频数与实际频数的差值越小,两样本 率差别越小,越有理由认为两总体率相等。 χ2值越大,即理论频数与实际频数的差值越大,两样本 率差别越大,越有理由认为两总体率不等。 判断标准:小概率事件原理,P = 0.05或0.01。 判断方法:用计算所得的检验统计量与检验水准α=0.05 (0.01) 所对应的卡方界值进行比较:
乙试剂
+
—
+
—
+
45
—
20
—
22
+
6
血清份数
甲试剂 乙试剂 血清份数
+
—
+
—
+
45
—
20
—
22
+
6
两种试剂检测结果比较
甲试剂 + 合计 乙试剂 + 45 (a) 6 (c) 51 22 (b) 20 (d) 42 合计 67 26 93
因为:两试剂的检测结果,a和d是一致的, b和c相反, 所以:两试剂的差值(差别)由b和c来反映, 现在:用B和C来表示b和c对应的数据。 依据H0得b、c的理论频数为:Tb= Tc=(b+c) /2,
2
( b c 1) 2 bc ( 22 6 1) 2 bc 8.04,
1
以ν=1
查χ2界值表得:
2 0.05
3.84,
P 0.05
拒绝H0,接受H1,可以认为两种试剂的检测结果有差别。
注 意
1、当a和d的数字都特别大,而b和c的数字都相对较小
时,即使配对四格表χ2检验结果有统计学意义,其实 际意义也不大,因此,配对四格表χ2检验一般用于样 本含量不太大的资料。 2、配对设计的四格表资料只能用配对的χ2检验,不能 随意转化为两组独立样本的χ2检验。
│29-18.74│= 10.26
│ 9-19.26│= 10.26
│ 7- 17.26│= 10.26
│28- 17.74│= 10.26
结论3: 各格子里的实际频数与理论频数的差别 (绝对值)相等,且∑(A-T) = 0。
经过这样的推导,已经把两样本率的差别演绎为实际频 数与理论频数之间的差别 : ①两样本率的差别越大,则实际频数与理论频数的差别 也越大; ②两样本率的差别越小,则实际频数与理论频数的差别 也越小; ③特别地:两样本率相等时,则实际频数与理论频数的 差值为0。