雷静卫生统计学-第九章 卡方检验
合集下载
最新《卫生统计学》第七章 卡方检验(63P)-药学医学精品资料

Tb417 3 31 512.56
Tc814 3 91 661.56
Tc814 3 31 522 .4 . 4
2 (3 9 3.4 4 )2 4 (8 1.5 2 )2 6 (5 7 6.5 1 )2 6 (2 7 2.4 2 )2 4 3.4 44 1.5 26 6.5 16 2.4 24 3 .52
单纯治疗 61.56 22.44
84
73.3
合 计 96
35
131
73.3
T a 4 7 7.3 3 % 34.4T 4 b 4 2 7 .7 % 6 1 .5 2 . 6 T c 8 7 4 .3 % 3 6 1 .56T d 8 2 4 .7 % 6 2 2 .44
四格表的理论频数由下式求得 :
例7.2
表 1 131 例乳腺癌患者治疗后 5 年存活率的比较 处 理 存活数 死亡数 合计 存活率(%)
联合治疗
39
8 47
83.0
单纯治疗
57
27 84
67.9
合计
96
35 131
73.3
四格表(fourfold table)
➢ 表1 中间阴影部分的四个数据为基本数据,其余数据 均由此四个数据派生出来,故称此种资料为四格表 (fourfold table)资料。
➢ 多(R)个率的比较,其基本数据有R行2列,构成
R×2表,用以表述R个率的基本数据。R×2表的2
检验用于推断R个样本率各自所代表的总体率是否 相等。
多个样本率的比较的公式
2
(Ai Ti )2 Ti
2 n( A2 1)
nRnC
式中,A为第R行第C列对应的实际频数,nR为第R行的行合计,
医学统计学(6) 卡方检验[可修改版ppt]
![医学统计学(6) 卡方检验[可修改版ppt]](https://img.taocdn.com/s3/m/1fa7f822172ded630a1cb62f.png)
• 第3步:定义频数
• 选择数据→加权个案 • 例数→加权个案(频选择分析→非参数检验→ 卡方
• 中医证型→检验变量列表
• 第5步:结果解读
• 结果解读: x2=392.514, p=0.000,说明 原发性高血压患 者中医证型内部 构成不相同。
注意事项
➢进行拟合优度 x2 检验,一般要求有足够的 样本含量,理论频数不小于 5 。
卡方值的计算
➢卡方值的影响因素: • 1、格子数 • 2、实测值与理论值的差距
专用公式的推导
T11=(a+c)/(a+b+c+d)*(a+b) T12=(b+d)/(a+b+c+d)*(a+b) T21=(a+c)/(a+b+c+d)*(c+d) T22=(b+d)/(a+b+c+d)*(c+d)
• P(exact)=0.031?
四格表x2检验结果的选择
• 1)当n≥40,所有理论值≥ 5时,用 pearson卡方检验。
• 第5步:结果解读(2)
• 结果解读:x2=56.772,p=0.000
• 两种疗法治疗慢性支气管炎病人的治愈率的 差别有统计学意义
四格表x2检验结果的选择
• 1)当n≥40,所有理论值≥ 5时,用 pearson卡方检验。
• 2)当n≥40,但有理论频数1≤理论值<5 时,用连续校正的卡方检验;或者确切概 率法。
• 第5步:结果解读(1)
• 结果解读:甲药组的有效率为92.9%,乙药 组的有效率为64.3%。
• 第5步:结果解读(2)
• 结果解读:有2个格子的期望值小于5,不符 合卡方检验的条件。
卫生统计学卡方检验

卫生统计学卡方检验
26/94
(一) 多个样本率比较
例3 某研究者欲比较A、B、C 三种方案治疗轻、中度 高血压疗效,将年纪在50~70岁240例轻、中度高血压患 者随机等分为3组,分别采取三种方案治疗。一个疗程 后观察疗效,结果见表11.4。问三种方案治疗轻、中度 高血压有效率有没有差异?
卫生统计学卡方检验
卫生统计学卡方检验
29/94
④ 确定P值
υ=(3-1)(2-1)=2,查 2 界值表得P<0.01。
⑤ 下结论
因为P<0.01,按α=0.05水准,拒绝H0,接收 H1,差异有统计学意义。即可认为三种方案治疗轻 、
中度高血压有效率不等或不全等
卫生统计学卡方检验
30/94
例 某市重污染区、普通污染区和农村出生婴儿致畸情 况以下表,问三个地域出生婴儿致畸率有没有差异?
① 建立假设 H0:π1=π2 H1:π1≠π2
② 确定检验水准
α=0.05
③ 计算统计量 2 值
2(2 62-73 6-7 1/2 )27 12 .7 5 3 33 86 29
④ 确定P值
υ=(2-1) (2-1)=1,查 2界值表得P>0.05。
卫生统计学卡方检验
24/94
⑤ 下结论 因为P>0.05,按α=0.05水准,不拒绝H0,差 异无统计学意义。尚不能认为甲、乙两疗法对小 儿单纯性消化不良治愈率不等。
9/94
TRC
nR nC n
n R 为对应行累计
n C 为对应列累计
n 为总例数。
卫生统计学卡方检验
10/94
表1 两药治疗消化道溃疡4周后疗效
卫生统计学卡方检验
11/94
卫生统计学卡方检验

x1、x2……xk~N(μ,σ2)
uk
2
xi
分类资料为间断的,不连续分布。故计算的
2值不连续,对于四格表资料来说,当n≥40,且 有1≤T<5时,求出的概率可能偏小,因此需进
xi u u u i 1
2 2 1 2 2 2 k k
2
下右侧尾部面积为α时2 的界值;
0.0 0 1 2 3 4 5 2 6 7 8 9
4 2 值反映了理论频数和实际频数 10 的吻合程度;
Dec 1,2009
二、四格表的专用公式
对于四格表资料,通过推导可将式9-4转换 成四格表的专用公式:
组别 阳性数 阴性数 合计
I组
II组 合计
a
c a+c=n.1
合计 660 640 1300
患病率(%) 13.64 21.88 17.69
A: actual value 实际数
(A T) T
2
2
T: theoretical value 理论数
Dec 1,2009
如何求各个格子的理论数T?
• H0: 1=2= • 理论数T为假设的总合计率已知的条件下, 所估计的理论频数,在目前的情况下,将 样本现有的合计患病率作为总合计率的最 佳估计,即17.69%
Dec 1,2009
H0:=0 H1:>0 单侧=0.05 本例n=500,X=95,p=0.19,0=0.097, 得:
0.19 0.097 u 7.026 0.097 (1 0.097 ) / 500
因单u0.05=1.64, u>u0.05, p<0.05,按=0.05水准, 拒绝H0,接受H1
uk
2
xi
分类资料为间断的,不连续分布。故计算的
2值不连续,对于四格表资料来说,当n≥40,且 有1≤T<5时,求出的概率可能偏小,因此需进
xi u u u i 1
2 2 1 2 2 2 k k
2
下右侧尾部面积为α时2 的界值;
0.0 0 1 2 3 4 5 2 6 7 8 9
4 2 值反映了理论频数和实际频数 10 的吻合程度;
Dec 1,2009
二、四格表的专用公式
对于四格表资料,通过推导可将式9-4转换 成四格表的专用公式:
组别 阳性数 阴性数 合计
I组
II组 合计
a
c a+c=n.1
合计 660 640 1300
患病率(%) 13.64 21.88 17.69
A: actual value 实际数
(A T) T
2
2
T: theoretical value 理论数
Dec 1,2009
如何求各个格子的理论数T?
• H0: 1=2= • 理论数T为假设的总合计率已知的条件下, 所估计的理论频数,在目前的情况下,将 样本现有的合计患病率作为总合计率的最 佳估计,即17.69%
Dec 1,2009
H0:=0 H1:>0 单侧=0.05 本例n=500,X=95,p=0.19,0=0.097, 得:
0.19 0.097 u 7.026 0.097 (1 0.097 ) / 500
因单u0.05=1.64, u>u0.05, p<0.05,按=0.05水准, 拒绝H0,接受H1
第九讲 卫生统计学 卡方检验

结果与前相同。
例9-2:将病情相似的169名消化道溃疡患者随机分成两组, 分别用洛赛克与雷尼替丁两种药物治疗,4周后疗效见表92。问某两种药物治疗消化道溃疡的疗效有无差别?
表9-2 两种药物治疗消化道溃疡4周后疗效 疗 愈合 64 (57.84) 115 效 未愈合 21(27.16) 33 (26.84) 54
五年级
合计
5(2.33)
7
9(11.69)
35
14
42
35.71
16.67
(1)建立假设,确定检验水准 H0:π1=π2 H1:π1≠π2 α=0.05
(2)计算检验χχ2值 本例n=42,最小的理论数为:T21=(14×7)/42=2.33, 故对2 值作校正。
2
(3)确定P值
( 2 9 26 5 42 / 2) 2 42 7 35 28 14
2
(64 33 21 51) 2 169 2 4.13 85 84 115 54
(3)确定p值:
=(2-1)(2-1)=1,查2界值表得2 0.05(1) =3.84,因2 >3.84 , 故P<0.05。
(4)判断结果 在α=0.05水准上,因P<0.05,所以拒绝H0,接受H1, 说明两药疗效的差别具有统计学意义。
图9-1, 2分布的形状依赖于自由度υ的 大小,当自由度υ>2时,随着υ的增加,曲 线逐渐趋于对称,当自由度υ趋于∞时,2分 布逼近正态分布。各种自由度的2分布右侧尾 2 , 部面积为α时的临界值记为 列于附表8。
第二节
四格表资料的2检验
例9-1:用某中药预防流感,获得如下资料,问用药者 流感发病率是否不同于不用药者?
1、建立假设,确定检验水准 H0: b=c(两种检验方法的阳性概率相等) H1: b≠c(两种检验方法的阳性概率不相等)
例9-2:将病情相似的169名消化道溃疡患者随机分成两组, 分别用洛赛克与雷尼替丁两种药物治疗,4周后疗效见表92。问某两种药物治疗消化道溃疡的疗效有无差别?
表9-2 两种药物治疗消化道溃疡4周后疗效 疗 愈合 64 (57.84) 115 效 未愈合 21(27.16) 33 (26.84) 54
五年级
合计
5(2.33)
7
9(11.69)
35
14
42
35.71
16.67
(1)建立假设,确定检验水准 H0:π1=π2 H1:π1≠π2 α=0.05
(2)计算检验χχ2值 本例n=42,最小的理论数为:T21=(14×7)/42=2.33, 故对2 值作校正。
2
(3)确定P值
( 2 9 26 5 42 / 2) 2 42 7 35 28 14
2
(64 33 21 51) 2 169 2 4.13 85 84 115 54
(3)确定p值:
=(2-1)(2-1)=1,查2界值表得2 0.05(1) =3.84,因2 >3.84 , 故P<0.05。
(4)判断结果 在α=0.05水准上,因P<0.05,所以拒绝H0,接受H1, 说明两药疗效的差别具有统计学意义。
图9-1, 2分布的形状依赖于自由度υ的 大小,当自由度υ>2时,随着υ的增加,曲 线逐渐趋于对称,当自由度υ趋于∞时,2分 布逼近正态分布。各种自由度的2分布右侧尾 2 , 部面积为α时的临界值记为 列于附表8。
第二节
四格表资料的2检验
例9-1:用某中药预防流感,获得如下资料,问用药者 流感发病率是否不同于不用药者?
1、建立假设,确定检验水准 H0: b=c(两种检验方法的阳性概率相等) H1: b≠c(两种检验方法的阳性概率不相等)
医学统计方法之卡方检验PPT课件

3、查界值表,确定P值,做出推断结论
查χ2界值表,υ=6,χ20.05(6)=12.59, χ2 > χ20.05(1) ,则 P<0.05,在α=0.05的水准下,拒绝H0,认为三个不同地区 的人群血型分布总体构成比有差别。
.
38
二、多个样本率间多重比较
行×列表χ2检验的结果说明差异有统计学意义,需作两 两比较时,先调整α值,再进行率的两两比较。
配对检验公式推导:
bc
(+,)和(,+)两个格子中的理论频数均为
2
b c 40时
2
(AT)2(b b c )2 2(c b c)22
T
bc
bc
2
2
(b c)2
bc
~ 2 分布
同理可得b c 40时
1
校正公式: 2 (| A T | 0.5)2 (| b c | 1)2
表8-5 两种培养基的培养结果
B培养基
A培养基
+
-
合计
+
48
24
72
-
20
106
126
合计
68
130
198
A 培养基 B培养基
痰标本 1 2 3 4 5 6 7 8 9 10 11 12 13 14
结果统计
A培养基 + + + + + + + + + + -
B培养基 + + + + + + + -
合计
145 109 254 57.09
1.建立检验假设并确定检验水准
第九章 卡方检验 PPT课件

地区 城市
避孕方法 节育器 服避孕药 避孕套
153
33
165
农村 320
75
43
合计 473
108
208
其他 40 18 58
合计 431 518 949
2021/2/23
第七章 χ2检验χ2检验
27
(二)多分类情形— 2 × C列联表
2 × C列联表χ2检验的基本思想
2 × C列联表χ2检验公式
2
adbc
n22
n
abcdacbd
2021/2/23
第七章 χ2检验χ2检验
20
▪完全随机设计四格表资料χ2检验适用条件
当n≥40且Tmin ≥ 5时,χ2检验基本公式或四格表专用公式;
2 A TT2
2abc a d d b a c 2c nbd
当n≥40,1≤Tmin<5时,需对χ2值进行校正;
2021/2/23
第七章 χ2检验χ2检验
3
一、χ2分布和拟合优度检验
χ2分布(chi square distribution ) χ2分布的特征 χ2分布的图形形状取决于自由度ν χ2界值表
▪ 不同自由度ν下右侧尾部面积(概率)为α时临界值,
记为χ2 α,(ν)
▪ χ2界值表的特点 ▪ χ2界值表的作用
第九章 卡方检验 PPT课件
第九章 χ2检验
χ2检验(chi square test) 常用于分类变量资料的统计推断
χ2检验是以χ2分布和拟合优度检验为理论依 据的
2021/2/23
第七章 χ2检验χ2检验
2
第九章 χ2检验
χ2检验的用途
单个频数分布的拟合优度检验 完全随机设计两组或多组频数分布χ2检验 配对设计两组频数分布χ2检验 推断两个变量或特征之间有无关联性
最新【基础医学】第九章 卡方检验幻灯片课件

/611696569
表9-8 不同文化程度患者首选疼痛量表的类型
文 化 程 度
高 中 以 下 高 中
高 中 以 上 合 计
V AS 3(3.5) 0(1.6) 4(1.8)
7
首 选 测 痛 量 表
V DS
NRS
16(18.7) 10(8.6)
18(19.7) 9(9.0)
11(9.7)
12(10.2)
37
39
FPS 44(39.0) 18(17.8) 15(20.2)
时,一般不作校正。
例9-2 将116例癫痫患者随机分
为两组,一组70例接受常规加高压氧 治疗(高压氧组),另一组46例接受 常规治疗(常规组),治疗结果见表 7-4。问两种疗法的有效率有无差别?
表9-3 两种疗法治疗癫痫的效果
治 疗 方 法
治 疗 结 果
有 效
无 效
高 压 氧 组 66( 62.8)
四格表资料检验的专用公式
2
(adbc)2n
(ab)(ac)(bd)(cd)
2(331041039)218634.10
7243143114
(四)四格表资料检验的校正公式
c2
( AT 0.5)2 T
(|ad-bc|-n)2n
c2
=
2
(a+b)(c+d)(a+c)(b+d)
2 分布是一连续型分布,而四格
合 计
乙 剂 量
死 亡 (+ )
生 存 (- )
6( a) 3( c)
12( b) 18( d)
9
30
合 计
18 21 39
上述配对设计实验中,就每个对子而 言,两种处理的结果不外乎有四种可能:
表9-8 不同文化程度患者首选疼痛量表的类型
文 化 程 度
高 中 以 下 高 中
高 中 以 上 合 计
V AS 3(3.5) 0(1.6) 4(1.8)
7
首 选 测 痛 量 表
V DS
NRS
16(18.7) 10(8.6)
18(19.7) 9(9.0)
11(9.7)
12(10.2)
37
39
FPS 44(39.0) 18(17.8) 15(20.2)
时,一般不作校正。
例9-2 将116例癫痫患者随机分
为两组,一组70例接受常规加高压氧 治疗(高压氧组),另一组46例接受 常规治疗(常规组),治疗结果见表 7-4。问两种疗法的有效率有无差别?
表9-3 两种疗法治疗癫痫的效果
治 疗 方 法
治 疗 结 果
有 效
无 效
高 压 氧 组 66( 62.8)
四格表资料检验的专用公式
2
(adbc)2n
(ab)(ac)(bd)(cd)
2(331041039)218634.10
7243143114
(四)四格表资料检验的校正公式
c2
( AT 0.5)2 T
(|ad-bc|-n)2n
c2
=
2
(a+b)(c+d)(a+c)(b+d)
2 分布是一连续型分布,而四格
合 计
乙 剂 量
死 亡 (+ )
生 存 (- )
6( a) 3( c)
12( b) 18( d)
9
30
合 计
18 21 39
上述配对设计实验中,就每个对子而 言,两种处理的结果不外乎有四种可能:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
使用基本公式或四格表资料的专用公式;当
P时,改用四格表资料的Fisher确切概率法。
基本公式: 2
(AT)2 T
四格表专用公式 :2(ab)c((add )ba () c2cn)b (d)
2020/4/29
2.计算检验统计量
(2)当总例数 n40且只有一个格子 1T5
时:用检验的校正公式或改用四格表资料的 Fisher确切概率法。
∴对于等级资料(即有序分类资料),在比
较各处理组的效应有无差别时,应该用 秩和检验。 2检验只能说明各处理组结 构是否均衡,但不能很好的反映效应是 否有差别。
2020/4/29
五、配对R×R表资料的2 :
➢ 用两种检测方法同时对同一批样品进行测定, 测定结果用3个或3个以上的等级表示。
➢ 如表9-11 ➢ 其研究目的通常是分析两种检测方法测定结果
2020/4/29
(二)拟合优度检验
• 以例9-1为例
H 0 :总体分布为N(139.48,7.302)的正态分布 H 1 :总体分布不是N(139.48,7.302)的正态分布
0.05
2020/4/29
基本思想:表9-1
• 将变量x分割为k个组段,列成频数表的形式;
• 用Ai表示第i个组段的频数;
度为1的2分布,其概率密度曲线在(0,+∞)
区间上表现为L形,如图9-1中ν=1的曲线。
假设有ν个相互独立的标准正态分布的随机
变量Ζ1,Ζ2,…,Ζν,那么 12ห้องสมุดไป่ตู้ 22
的分布称为服从自由度为ν的2分布,记作
2
2020/4/29
2分布的特征: ➢当自由度ν>1时,随ν的增加, 曲线逐渐趋于对称; ➢当自由度趋于∞时,2分布逼近 正态分布。 2分布的临界值表,见P482附表8.
组别 单纯化疗
两种疗法缓解率比较
缓解
未缓解
2(4.8) 10(7.2)
合计 12
缓解率(%) 16.7
复合化疗 14(11.2) 14(16.8) 28
50.0
合计
16
24
40
40.0
2020/4/29
例1.某医院分别以中医和中西医结合两种疗法治 疗乙型脑炎患者238例,结果如下表。问两种治 疗方法的疗效有无差别?
c2
(AT0.5)2 T
c2=(a
(|ad-bn2)c2n|+)b(c+)d(a+)(bc+)d
2020/4/29
2.计算检验统计量 (3)当总例数 n40或 T 1时, 用四格表资料的Fisher确切概率法。
P161 例9.3
例1
2020/4/29
例9-3 将病情相似的淋巴瘤患者随机分为两组,分 别予以单纯化疗与复合化疗,问两疗法的总体 缓解率是否不同?
2020/4/29
R×C列联表资料的关联性分析(略)
小结: 1.完全随机设计四格表卡方检验 2.配对设计四格表卡方检验
讨论:P175 分析计算题 1.
2020/4/29
四、独立样本行×列表资料的2检验
应用: ➢ 多个样本率的比较 ➢ 两个或多个构成比(样本频率分布)
的比较
2020/4/29
其基本数据有以下3种情况:
➢ nR 为相应行的合计,nC 为相应列的合计
➢ n 为总例数
2020/4/29
2 (AT)2
T
求得χ2 值,按ν =(R - 1)(C - 1)
查附表8 χ2 界值表(P482),得P值。 同一自由度下,χ2值越大,
相应的概率P值越小。
2020/4/29
2.计算检验统计量
(1)当总例数 n40且所有格子的 T 5 时:
2020/4/29
注意:
➢ 两样本率比较的资料,既可用Ζ检验也可用
2 检验来推断两总体率是否有差别,且在不
校正的条件下两种检验方法是等价的,对同一
份资料有 2 2
2020/4/29
三、配对设计资料的2检验
• 配对设计的四格表资料,就是将含量为n 的一份随机样本同时按照两个二项分类 的属性进行交叉分类,形成2行2列的交 叉分类表。数据形式如下表:
分组
中医组 中西医 结合组
合计
乙型脑炎的两种疗法比较
治愈 未愈 合计 人数 人数
44
74
118
70
50
120
114 124 238
治愈率 (%) 37.3 58.3
47.9
2020/4/29
3.作出统计结论: 以 =1 查 2界值表,
若 P0.05,按 0.05检验水准拒绝H0, 接受H1 ,可认为两总体率不同; 若 P0.05,按 0.05检验水准不拒绝 H0 ,不能可认为两总体率不同。
例2.有56份咽喉涂抹标本,把每份标本依同样的 条件分别接种于两种白喉杆菌培养基上,观察白 喉杆菌生长情况,观察结果如下表。问两种培养 基的阳性结果有无差别?
两种白喉杆菌培养基培养效果比较
甲培养基
乙培养基
+
-
合计
+
22
18
40
-
2
14
16
合计
24
32
56
2020/4/29
2.两法检验结果有无关系(联): H0 :两法结果无关联 H1 :两法结果有关联
3.医学期刊中常见的:不论表中两个分类变量 是有序还是无序,均用卡方检验进行分析, 这种做法是不妥的,对于有序的R×C表资料 不宜用卡方检验。因为行×列表资料的检验 与分类变量的顺序无关,无论将任何两行( 或两列)频数互换,所得值皆不变,结论相 同。
2020/4/29
行×列表资料 2 检验的注意事项
α = 0.05
2
(ad b)c2n
(ab)c (d)a (c)b (d)
按ν=1 查χ2界值表得P值,下结论。
2020/4/29
➢ 在有关系的前提下,若须进一步分析关系的密
切程度时,可计算Pearson列联系数 r p
2 rp n 2
r p 取值范围在之间。0表示完全独立;
1表示完全相关;愈接近于0,关系愈不 密切;愈接近于1,关系愈密切。
• 用Pi表示在H0成立的条件下,样本值落在第i组段的 概率;
• Ti表示根据H0确定的理论频数, Ti=n Pi
• 计算
2
(Ai Ti)2 Ti
• 该2值近似地服从自由度为k-1的2分布。如果计算Ti 时有s个总体参数是用样本统计量代替的,此时自由
度为:ν=k-1-s
2020/4/29
• 按此自由度查附表8,确定概率P
的一致性,此时宜用一致性检验,或称kappa 检验;还可通过 T 检验(公式9-11)来判定两 变量的概率分布是否相同。
2020/4/29
➢完成课堂练习3 : 第6. 7.题
2020/4/29
2020/4/29
配对设计四格表的一般形式
方法1 阳性
方法2 阳性 阴性
a
b
合计 n1
阴性
c
d
n2
合计
m1
m2
n
2020/4/29
1.两法检验结果有无差别的检验:
(阳性检出率是否不同)
2 (b c)2
bc
ν=1
若观察频数b+c < 40,需对χ2值进行校正
2(b | c|1)2
bc
2020/4/29
多个样本率比较时,有R行2列,如表9-6的形式; 两个样本构成比比较时,有2行C列,如表9-7; 多个样本构成比比较,有R行C列,称为R×C表。 以上3种情况可统称为独立样本行×列表资料。
2020/4/29
行×列表资料检验的专用公式:
2 n(
A2 1)
nRnC
(行数-1)(列数-1)
例9.3;9.4
2020/4/29
行×列表资料 检2 验的注意事项
1.一般认为,行×列表中的理论频数不应小于1, 或 1T5 的格子数不宜超过格子总数的1/5。 若出现上述情况,可通过以下方法解决:①最 好是增加样本含量,使理论频数增大;②根据 专业知识,考虑能否删去理论频数太小的行或 列,能否将理论频数太小的行或列与性质相近 的邻行或邻列合并;③改用双向无序 R×C列 表的Fisher确切概率法。
0.05
2020/4/29
四格表2检验的基本思想:
➢ 作理论频数(T)与实际频数(A)之差的检验。
➢ 值2 反映了实际频数与理论频数吻合的程度。
➢ 基本公式:
2
(AT)2
T
2020/4/29
➢ T值是在假设H0 成立的条件下,求得的理论频数
TR C
nR .nC n
➢ TRC 表示R行C列的理论频数
分组
中医组 中西医 结合组
合计
乙型脑炎的两种疗法比较
治愈 未愈 合计 人数 人数
44
74
118
70
50
120
114 124 238
治愈率 (%) 37.3 58.3
47.9
2020/4/29
二、完全随机设计的四格表 2 检验
2检验的步骤: 1.建立检验假设
H 0 :1 ,2两总体率相等 H 1 :1 2,两总体率不等
2020/4/29
2检验的应用
1)单个样本分布的拟合优度检验 2)推断两个或多个总体率(或构成比)之间有无差
别; 3)配对设计的资料中,除可检验两者有无差别外,
还可推断两变量间有无相关关系。
2020/4/29
一、2分布和拟合优度检验
(一) 2分布:是一种连续型随机变量的概率分布。
如果Ζ服从标准正态分布,那么Ζ2服从自由
P时,改用四格表资料的Fisher确切概率法。
基本公式: 2
(AT)2 T
四格表专用公式 :2(ab)c((add )ba () c2cn)b (d)
2020/4/29
2.计算检验统计量
(2)当总例数 n40且只有一个格子 1T5
时:用检验的校正公式或改用四格表资料的 Fisher确切概率法。
∴对于等级资料(即有序分类资料),在比
较各处理组的效应有无差别时,应该用 秩和检验。 2检验只能说明各处理组结 构是否均衡,但不能很好的反映效应是 否有差别。
2020/4/29
五、配对R×R表资料的2 :
➢ 用两种检测方法同时对同一批样品进行测定, 测定结果用3个或3个以上的等级表示。
➢ 如表9-11 ➢ 其研究目的通常是分析两种检测方法测定结果
2020/4/29
(二)拟合优度检验
• 以例9-1为例
H 0 :总体分布为N(139.48,7.302)的正态分布 H 1 :总体分布不是N(139.48,7.302)的正态分布
0.05
2020/4/29
基本思想:表9-1
• 将变量x分割为k个组段,列成频数表的形式;
• 用Ai表示第i个组段的频数;
度为1的2分布,其概率密度曲线在(0,+∞)
区间上表现为L形,如图9-1中ν=1的曲线。
假设有ν个相互独立的标准正态分布的随机
变量Ζ1,Ζ2,…,Ζν,那么 12ห้องสมุดไป่ตู้ 22
的分布称为服从自由度为ν的2分布,记作
2
2020/4/29
2分布的特征: ➢当自由度ν>1时,随ν的增加, 曲线逐渐趋于对称; ➢当自由度趋于∞时,2分布逼近 正态分布。 2分布的临界值表,见P482附表8.
组别 单纯化疗
两种疗法缓解率比较
缓解
未缓解
2(4.8) 10(7.2)
合计 12
缓解率(%) 16.7
复合化疗 14(11.2) 14(16.8) 28
50.0
合计
16
24
40
40.0
2020/4/29
例1.某医院分别以中医和中西医结合两种疗法治 疗乙型脑炎患者238例,结果如下表。问两种治 疗方法的疗效有无差别?
c2
(AT0.5)2 T
c2=(a
(|ad-bn2)c2n|+)b(c+)d(a+)(bc+)d
2020/4/29
2.计算检验统计量 (3)当总例数 n40或 T 1时, 用四格表资料的Fisher确切概率法。
P161 例9.3
例1
2020/4/29
例9-3 将病情相似的淋巴瘤患者随机分为两组,分 别予以单纯化疗与复合化疗,问两疗法的总体 缓解率是否不同?
2020/4/29
R×C列联表资料的关联性分析(略)
小结: 1.完全随机设计四格表卡方检验 2.配对设计四格表卡方检验
讨论:P175 分析计算题 1.
2020/4/29
四、独立样本行×列表资料的2检验
应用: ➢ 多个样本率的比较 ➢ 两个或多个构成比(样本频率分布)
的比较
2020/4/29
其基本数据有以下3种情况:
➢ nR 为相应行的合计,nC 为相应列的合计
➢ n 为总例数
2020/4/29
2 (AT)2
T
求得χ2 值,按ν =(R - 1)(C - 1)
查附表8 χ2 界值表(P482),得P值。 同一自由度下,χ2值越大,
相应的概率P值越小。
2020/4/29
2.计算检验统计量
(1)当总例数 n40且所有格子的 T 5 时:
2020/4/29
注意:
➢ 两样本率比较的资料,既可用Ζ检验也可用
2 检验来推断两总体率是否有差别,且在不
校正的条件下两种检验方法是等价的,对同一
份资料有 2 2
2020/4/29
三、配对设计资料的2检验
• 配对设计的四格表资料,就是将含量为n 的一份随机样本同时按照两个二项分类 的属性进行交叉分类,形成2行2列的交 叉分类表。数据形式如下表:
分组
中医组 中西医 结合组
合计
乙型脑炎的两种疗法比较
治愈 未愈 合计 人数 人数
44
74
118
70
50
120
114 124 238
治愈率 (%) 37.3 58.3
47.9
2020/4/29
3.作出统计结论: 以 =1 查 2界值表,
若 P0.05,按 0.05检验水准拒绝H0, 接受H1 ,可认为两总体率不同; 若 P0.05,按 0.05检验水准不拒绝 H0 ,不能可认为两总体率不同。
例2.有56份咽喉涂抹标本,把每份标本依同样的 条件分别接种于两种白喉杆菌培养基上,观察白 喉杆菌生长情况,观察结果如下表。问两种培养 基的阳性结果有无差别?
两种白喉杆菌培养基培养效果比较
甲培养基
乙培养基
+
-
合计
+
22
18
40
-
2
14
16
合计
24
32
56
2020/4/29
2.两法检验结果有无关系(联): H0 :两法结果无关联 H1 :两法结果有关联
3.医学期刊中常见的:不论表中两个分类变量 是有序还是无序,均用卡方检验进行分析, 这种做法是不妥的,对于有序的R×C表资料 不宜用卡方检验。因为行×列表资料的检验 与分类变量的顺序无关,无论将任何两行( 或两列)频数互换,所得值皆不变,结论相 同。
2020/4/29
行×列表资料 2 检验的注意事项
α = 0.05
2
(ad b)c2n
(ab)c (d)a (c)b (d)
按ν=1 查χ2界值表得P值,下结论。
2020/4/29
➢ 在有关系的前提下,若须进一步分析关系的密
切程度时,可计算Pearson列联系数 r p
2 rp n 2
r p 取值范围在之间。0表示完全独立;
1表示完全相关;愈接近于0,关系愈不 密切;愈接近于1,关系愈密切。
• 用Pi表示在H0成立的条件下,样本值落在第i组段的 概率;
• Ti表示根据H0确定的理论频数, Ti=n Pi
• 计算
2
(Ai Ti)2 Ti
• 该2值近似地服从自由度为k-1的2分布。如果计算Ti 时有s个总体参数是用样本统计量代替的,此时自由
度为:ν=k-1-s
2020/4/29
• 按此自由度查附表8,确定概率P
的一致性,此时宜用一致性检验,或称kappa 检验;还可通过 T 检验(公式9-11)来判定两 变量的概率分布是否相同。
2020/4/29
➢完成课堂练习3 : 第6. 7.题
2020/4/29
2020/4/29
配对设计四格表的一般形式
方法1 阳性
方法2 阳性 阴性
a
b
合计 n1
阴性
c
d
n2
合计
m1
m2
n
2020/4/29
1.两法检验结果有无差别的检验:
(阳性检出率是否不同)
2 (b c)2
bc
ν=1
若观察频数b+c < 40,需对χ2值进行校正
2(b | c|1)2
bc
2020/4/29
多个样本率比较时,有R行2列,如表9-6的形式; 两个样本构成比比较时,有2行C列,如表9-7; 多个样本构成比比较,有R行C列,称为R×C表。 以上3种情况可统称为独立样本行×列表资料。
2020/4/29
行×列表资料检验的专用公式:
2 n(
A2 1)
nRnC
(行数-1)(列数-1)
例9.3;9.4
2020/4/29
行×列表资料 检2 验的注意事项
1.一般认为,行×列表中的理论频数不应小于1, 或 1T5 的格子数不宜超过格子总数的1/5。 若出现上述情况,可通过以下方法解决:①最 好是增加样本含量,使理论频数增大;②根据 专业知识,考虑能否删去理论频数太小的行或 列,能否将理论频数太小的行或列与性质相近 的邻行或邻列合并;③改用双向无序 R×C列 表的Fisher确切概率法。
0.05
2020/4/29
四格表2检验的基本思想:
➢ 作理论频数(T)与实际频数(A)之差的检验。
➢ 值2 反映了实际频数与理论频数吻合的程度。
➢ 基本公式:
2
(AT)2
T
2020/4/29
➢ T值是在假设H0 成立的条件下,求得的理论频数
TR C
nR .nC n
➢ TRC 表示R行C列的理论频数
分组
中医组 中西医 结合组
合计
乙型脑炎的两种疗法比较
治愈 未愈 合计 人数 人数
44
74
118
70
50
120
114 124 238
治愈率 (%) 37.3 58.3
47.9
2020/4/29
二、完全随机设计的四格表 2 检验
2检验的步骤: 1.建立检验假设
H 0 :1 ,2两总体率相等 H 1 :1 2,两总体率不等
2020/4/29
2检验的应用
1)单个样本分布的拟合优度检验 2)推断两个或多个总体率(或构成比)之间有无差
别; 3)配对设计的资料中,除可检验两者有无差别外,
还可推断两变量间有无相关关系。
2020/4/29
一、2分布和拟合优度检验
(一) 2分布:是一种连续型随机变量的概率分布。
如果Ζ服从标准正态分布,那么Ζ2服从自由