卫生统计学卡方检验共59页文档
卡方检验医学统计学

卡方检验医学统计学卡方检验是医学统计学中最常用的检验方法之一,它可用于测量两组数据之间的关联性。
在研究中,我们常常需要探究二者之间是否存在某种关联,卡方检验就是我们解决这个问题的利器。
卡方检验的原理卡方检验的原理是基于期望频数和实际频数的差异来检验两个变量之间的关系。
期望频数指的是在假设两个变量独立的情况下,我们可以根据样本量和其他条件,计算出不同组之间的理论值。
而实际频数则是实验中观察到的实际结果。
卡方检验的步骤如下:1.建立零假设和备择假设。
零假设指的是假设两个变量之间不存在任何关系,备择假设则是反之。
2.确定显著性水平 alpha,通常取值为0.05。
3.构建卡方检验统计量。
计算方法为将所有观察值与期望值的差平方后,再除以期望值的总和。
4.根据自由度和显著性水平,查卡方分布表得到 P 值。
5.如果 P 值小于显著性水平,拒绝零假设;否则无法拒绝零假设。
卡方检验的应用卡方检验可以应用于多个领域,其中医学统计学是最为常见的一个。
卡方检验可以用来分析两个疾病之间的相关性或者测量一种治疗方法的效果。
举个例子,某药厂要研发一种新的药物来治疗心脏病。
为了验证该药的疗效,实验组和对照组各50 人。
在 6 个月的治疗后,实验组和对照组中分别有 10 人和 15 人痊愈了。
卡方检验的作用就在于此时可以用来检验两组之间的差异是否具有统计学意义。
除了医学统计学之外,卡方检验在社会学、心理学、市场营销、物理等领域也都有广泛应用。
卡方检验的限制虽然卡方检验被广泛应用于各种实验和研究中,但它也有着自己的限制。
其中比较明显的一点就是对样本量有一定的要求。
当样本量较小的时候,期望频数的计算就会出现一定的误差,进而导致检验结果不准确。
此外,在面对非常态分布数据时,卡方检验也会出现问题。
当数据呈现正态分布时,卡方检验的准确性最高。
然而,实际上,很多数据都呈现出非正态分布,这时需要使用一些修正方法来解决。
卡方检验是医学统计学中最常用的统计方法之一,它可以用来测量两个变量之间的关联性。
《医学统计学》医统-第九章卡方检验

卡方值
当自由度ν确定后,χ2分布曲线下右侧尾部的面积 为α时,编辑课横件 轴上相应的χ2值记作χ2α,ν
查χ2界值表,得χ20.05,1=3.84,按α=0.05 水 准, 拒绝H0 , 接受H1 , P<0.05,可 以认为两组治疗原发性高血压的总体有 效率不同,即可认为吲达帕胺片治疗原 发性高血压是有效的。
医学统计学
第九章 2检验
公共卫生系 流行病与卫生统计学教研室
祝晓明
一、率
率(rate):率表示在一定空间或时间范围内 某现象的发生数与可能发生的总数之比,说明 某现象出现的强度或频度,通常以百分率 (%)、千分率(‰)、万分率(/万)、或 十万分率(/10万)等来表示。
你们班级的及格率,挂科率怎么算?
❖自由度ν愈大,χ2 值也会愈大;所以 只有考虑了自由度ν的影响,χ2 值才
能正确地反映实际频数A和理论频数T 的吻合程度。
检验的自由度取决于可以自由取值的格子数目,
而不是样本含量n。四格表资料只有两行两 列,ν=1,即在周边合计数固定的情况下,4个基
本数据当中只有一个可以自由取值。
编辑课件
检验步骤: 1.建立检验假设并确定检验水准 H0:π1=π2 即试验组与对照组的总体有效率相等 H1:π1≠π2 即试验组与对照组的总体有效率不等
2
(20 25.77)2
(24 18.23)2
(21 15.23)2
(5 10.77)2
8.40
25.77
18.23
15.23
10.77
(2 1)(2 1) 1
编辑课件
纵高
3.确定P 值,作出推断结论
0.5
0.4
0.3
自由度=1
第九讲 卫生统计学 卡方检验

例9-2:将病情相似的169名消化道溃疡患者随机分成两组, 分别用洛赛克与雷尼替丁两种药物治疗,4周后疗效见表92。问某两种药物治疗消化道溃疡的疗效有无差别?
表9-2 两种药物治疗消化道溃疡4周后疗效 疗 愈合 64 (57.84) 115 效 未愈合 21(27.16) 33 (26.84) 54
五年级
合计
5(2.33)
7
9(11.69)
35
14
42
35.71
16.67
(1)建立假设,确定检验水准 H0:π1=π2 H1:π1≠π2 α=0.05
(2)计算检验χχ2值 本例n=42,最小的理论数为:T21=(14×7)/42=2.33, 故对2 值作校正。
2
(3)确定P值
( 2 9 26 5 42 / 2) 2 42 7 35 28 14
2
(64 33 21 51) 2 169 2 4.13 85 84 115 54
(3)确定p值:
=(2-1)(2-1)=1,查2界值表得2 0.05(1) =3.84,因2 >3.84 , 故P<0.05。
(4)判断结果 在α=0.05水准上,因P<0.05,所以拒绝H0,接受H1, 说明两药疗效的差别具有统计学意义。
图9-1, 2分布的形状依赖于自由度υ的 大小,当自由度υ>2时,随着υ的增加,曲 线逐渐趋于对称,当自由度υ趋于∞时,2分 布逼近正态分布。各种自由度的2分布右侧尾 2 , 部面积为α时的临界值记为 列于附表8。
第二节
四格表资料的2检验
例9-1:用某中药预防流感,获得如下资料,问用药者 流感发病率是否不同于不用药者?
1、建立假设,确定检验水准 H0: b=c(两种检验方法的阳性概率相等) H1: b≠c(两种检验方法的阳性概率不相等)
医学统计学——卡方检验

• ⑵χ2分布具有可加性:如果两个独立的 随机变量X1和X2分别服从ν1和ν2的χ2分 布,那么它们的和(X1+X2)也服从(ν1+ ν2)的χ2分布。
χ2 界值
• ν确定后,如果分布曲线下右侧尾部的 面积为α时,则横轴上相应的χ2值就记 作χ2 α,ν ,即χ2界值。其右侧部分的 面积α表示:自由度为ν时, χ2值大 于界值的概率大小。χ2值与P值的对应 关系见χ2界值表(附表6)。χ2值愈大,P 值愈小;反之,χ2值愈小,P值愈大。
• T22=(c+d)×(1- PC)=(c+d)×(b+d)/n = 56×17/112=8.5
χ2检验的基本思想
• χ2检验实质上是检验A的分布与T的分 布是否吻合及吻合的程度,χ2越小,表
明实际观察次数与理论次数越接近。
• 若检验假设成立,则A与T之差不会很 大,出现大的χ2值的概率P是很小的, 若P≤α,就怀疑假设成立,因而拒绝 它;若P>α,则没有理由拒绝它。
不同自由度的χ2分布曲线图
图 8-1 不同自由度的χ2 分布曲线图
二、χ2检验的基本思想
• 例8-1 某中医院将112例急性肾炎 病人随机分为两组,分别用西药和 中西药结合方法治疗,结果见表8-1, 问两种方法的疗效有无差别?
表8-1 两种方法治疗急性肾炎的结果
组 别 治愈例数 未愈例数 合计 治愈率(%)
例8-2
• 某医师将门诊的偏头痛病人随机 分为两组,分别采用针灸和药物 两种方法治疗,结果见表8-3 , 问两种疗法的有效率有无差别?
两种疗法对偏头痛的治疗结果
疗 法 有效例数 无效例数 合计 有效率(%)
针 灸 33(30.15) 2(4.85) 35 94.29
医学统计学 4、卡方检验

地区 Eskdale Annandale 合计
A型 33 54 87
B型 6 14 20
O型 56 52 108
AB 型 5 5 10
合计
100 125 225
Page
22
练习题(作业)
见word文档
Page
23
Page
24
Thank you!
25
Page 12
Page
13
结合此例,SPSS演示配对设计2检验
例2 设有132份食品标本,把每份标本一分为二,分 别用两种检验方法作沙门菌检验,检验结果如表2所 示,试比较两种检验方法的阳性结果是否有差别? 表2 两种检验方法检验结果比较
乙法 甲法 + 合计 + 80 31 111 10 11 21 合计 90 42 132
合计
假设检验步骤: (1)建立检验假设,确定检验水准
H0:B=C,即A、B两种方法的总体检出率相同
H1:B≠C,即A、B两种方法的总体检出率不同 α=0.05 (2)计算检验统计量2值
当 b+c≥40,
2
b c
bc
2
当 b+c<40,
2
b c 1
bc
2
例3 用三种不同治疗方法治疗慢性支气管炎的疗效 如表3所示,试比较三种治疗方法治疗慢性支气管炎 的疗效。 表3 三种不同治疗方法治疗慢性支气管炎的疗效
组别 A药 B药 C药 合计 有效 35 20 7 62 无效 5 10 25 40 合计 40 30 32 102
Page 19
(五)Fisher确切概率法
表1 两种药物治疗消化道溃疡4周后疗效
《卫生统计学》卡方检验

α=0.05
界值表, 水准不拒绝H 查χ2界值表,P>0.05 ,按α=0.05水准不拒绝 0, 水准不拒绝 故尚不能认为甲法测定结果的概率分布与乙法测 定结果的概率分布不同。 定结果的概率分布不同。
完全随机设计两组频数分布χ 完全随机设计两组频数分布χ2检验
例7-3 将病情相似的淋巴系肿瘤患者随机分 成两组,分别做单纯化疗与复合化疗, 成两组,分别做单纯化疗与复合化疗,两组 的缓解率见表7-4, 的缓解率见表 ,问两疗法的总体缓解率是 否不同? 否不同? (1)建立检验假设 ) H0:π1= π2, 两法总体缓解概率相同 H1: π1≠π2 ,两法总体缓解概率不同 检验水准α 检验水准α=0.05
x
2
(18 − 2 −1) =
18 + 2
2
225 = = 11.25 20
ν=(2-1)(2-1)=1
P<0.05,按α=0.05水准拒绝 0,接受 1,差别 水准拒绝H 接受H , 水准拒绝 有统计学意义,可以认为, 有统计学意义,可以认为 两种培养基上白喉杆菌 生长的阳性概率不相等。 生长的阳性概率不相等。鉴于甲培养基阳性频率 为40/56=71.4%,乙培养基为 ,乙培养基为24/56=42.9%,可 , 以认为, 甲培养基阳性概率高于乙培养基。 以认为 甲培养基阳性概率高于乙培养基。
χ2检验基本思想
比较样本的实际频数 1. 比较样本的实际频数(actual frequency) 理论频数( frequency)之间的 与理论频数( theoretical frequency)之间的 吻合程度。
2.频数分布的拟合优度检验(goodness of 2.频数分布的拟合优度检验( 频数分布的拟合优度检验 test)。 fit test)。
医学统计学卡方检验

03 左侧概率为P =P1+ P2 + P3 =0.316 , 右侧概率为P =P3+ P4 + P5 + P6 =0.929,故单侧检验P值为0.316。
Part 02.
配对四格表资料的 检验
χ2
概述
计数资料的配对设计常用于两种检验方 法、培养方法、诊断方法的比较。 特点是对样本中各观察单位分别用两种 方法处理,然后观察两种处理方法的某 两分类变量的计数结果,整理为
的条件下,利用超几何分布
Fisher确切概率法的基本思想
(hypergeometric distribution)公式直接计算 表内四个格子数据的各种组合 的概率,然后计算单侧或双侧
“!”为阶乘符号, n !=1×2×…×n,0 !=1, ∑Pi=1。
累计概率,并与检验水准比较,
P( ab)( c 作! 出 a 是! 否db 拒! ) 绝cH! ( 0a d 的! ! 结 论n! 。c)( b!d)!
当T<1或n<40,四格表资料χ2检验结果 可能会有偏性,需采用Fisher确切检验 进行分析。该法由R. A. Fisher提出,且 直接计算概率,因此也叫Fisher确切概 率检验(Fisher’s exact probability test)。
四格表资料的Fisher确切概率法
在四格表周边合计数固定不变
否有差别?
⑴设H0 :π1=π2 ,即两药有效率相同;H1 : π1≠π2 α=0.05
⑵n>40,Tmin>5
2 5 5 2 . 1 7 2 8 1 1 9 . 8 3 2 2 3 3 9 . 8 3 2 2 3 8 . 1 2 8 6 . 48 5 . 1 7 81 . 8 3 23 . 8 3 28 . 18
医学统计学卡方检验

计算期望频数
2
根据独立性假设,计算预期的频数。
3
计算卡方值
根据观察频数和期望频数,计算卡方值。
判断显著性
4
根据卡方值和自由度,判断结果是否显著。
卡方检验的计算方法
卡方检验的计算方法主要包括计算卡方值、计算自由度以及查找临界值。 计算卡方值:
1. 计算每个组别的观察频数和期望频数之差的平方。 2. 将所有差的平方相加,得到卡方值。 计算自由度: • 自由度 = (行数 - 1) * (列数 - 1) 查找临界值:
卡方检验的应用范围和特点
卡方检验广泛应用于医学研究中,例如研究疾病与风险因素之间的关联性。 卡方检验的特点包括:
非参数检验
不依赖于总体的任何参数假设。
适用性广泛
可用于分析两个或释。
卡方检验的步骤
1
收集数据
收集观察到的数据,例如不同组别的频数。
根据自由度和显著性水平,在卡方分布表中查找对应的临界值。
案例分析:卡方检验在医学统计学中的应用
临床研究
通过卡方检验分析患者病情与治疗 效果之间是否存在关联性。
遗传研究
运用卡方检验检测基因型与表型之 间的关联性。
公共卫生
分析卡方检验数据以确定风险因素 与疾病之间的关联性。
结论和总结
卡方检验是一种强大的统计工具,可用于分析变量之间的关联性。 通过掌握卡方检验的原理、应用和计算方法,我们能更好地理解数据背后的 关系,并做出有针对性的决策。
医学统计学卡方检验
卡方检验是一种常用的统计方法,主要用于比较观察到的数据与期望值之间 是否存在显著差异。
卡方检验的原理和假设
卡方检验基于观察到的频数与期望频数之间的差异,用于判断变量之间是否存在关联性。 卡方检验的假设为: