医学统计学 孙振球 第七章 卡方检验

合集下载

【卫生统计学-资料】_医学统计学课件--第七章_卡方检验

【卫生统计学-资料】_医学统计学课件--第七章_卡方检验

n R nC N
式中符号含义:
A:实际频数,表中实际 发生的阳性或阴性频数
T:理论频数,按某H0假 设计算理论上的阳性或阴 性频数
表7-1两组疗法降低颅内压有效率(%)
疗法 有效人数 无效人数 合计 有效率
试验组 99(90.48) 5(13.52) 104 95.2
对照组 75(83.52) 21(12.48) 96 78.1
无效数 合计 有效率%
5(A12) 104
21(A22) 96
26
200
95.20 78.13 87.00
问:两组有效率差别是否是抽样误差或是不同药
物的作用?
组别 +

四格表
甲 99 5
的数字
乙 75 21
Pearson 2 检验的基本公式
(公式7-1)
2 (AT)2
T
(公式7-3)
T RC
Expected=T
90.48 13.52 83.52 12.48
2 (A T )2
T
T=n ×π
2 (9990.48)2 (513.52)2 (7583.52)2 (2112.48)2 12.86
90.48
13.52
83.52
12.48
TRC
nR nC N
T11
104 174 200
表 100例高血压患者治疗后临床记录
编号
1 2 3 4
年龄 X1
37 45 43 59
性别 治疗组 舒张压 体温
X2 X3 X4 X5
男 A 11.27 37.5 女 B 12.53 37.0 男 A 10.93 36.5 女 B 14.67 37.8

医学统计学课件-卡方检验

医学统计学课件-卡方检验

联合治疗 39 34.44 8 12.56 47 73.3 单纯治疗 57 61.56 27 22.44 84 73.3
合计
96
35
131 73.3
Trc
nr nc n
理论频数= 84 73.3%
χ2检验的基本思想(1)
通过构造A与T吻合程度的统计量来反 映两样本率的差别!
实际数A
39
8
57
27
污染率 (%)

6
23
29
79.3

30
14
44
31.8

8
3
11
27.3
合计
44
40
84
47.6
理论数的计算
实际数A
6
23
29
30
14
44
8
3
11
44
40
84
(52.4%) (47.6%)
理论数T
15.2 13.8
23.0 21.0
5.8
5.2
T
nR
nC N
nR nC N
2值的计算
实际数A
χ2检验相关问题-应用条件
某矿石粉厂当生产一种矿石粉石时,在数天内即有 部分工人患职业性皮肤炎,在生产季节开始,随机 抽取15名车间工人穿上新防护服,其余仍穿原用的 防护服,生产进行一个月后,检查两组工人的皮肤 炎患病率,结果如表 ,问两组工人的皮肤炎患病 率有无差别?
χ2检验相关问题-应用条件
Total
When the variables are independent, the proportion in
both groups is close to the same size as the proportion

医学统计学孙振球(第三版)SAS程序及结果

医学统计学孙振球(第三版)SAS程序及结果

means a b c a*b a*c b*c; run; 4.卡方检验 input r c f @@; cards; proc freq; weight f; tables r*c/chisq expected; run; H0:π 1=π 2 H1:π 1>π 2, P右侧 H1:π 1<π 2,P左侧 Frequency频数 Expected期望值 Percent百分比 Row Pct行百分比 Col Pct列百分比 Chi-Square卡方 Likelihood Ratio Chi-Square似然 比卡方 Continuity Adj. Chi-Square连续 校正卡方 Mantel-Haenszel Chi-Square Phi Coefficient Contingency Coefficient列联系数 Cramer's V n≥40, 且所有T≥5, 用Chi-Square 1≤T<5,用Continuity Adj. Chi-Square n<40,或T<1用 Fisher's Exact Test χ2、χc2计算的P值与α很接近,改 用Fisher's 2)配对四格表 H0:b=c H1:b≠c proc freq; weight f; tables r*c/agree; run; McNemar's Test Statistic (S) Pr > S 一致性检验kappa值为0-0.4差 0.4-0.75一般0.75-1好 b+c≥40,用Chi-Square b+c <40 , 用 Continuity Adj. Chi-Square H1:π 1<π 2,P左侧 R*C列表资料 proc freq; tables r*c/chisq cmh exact nopercent nocol norow expected; weight f; run; 结果:Cochran-Mantel-Haenszel Statistics Nonzero Correlation双向有序 Row Mean Scores Differ列有序 General Association双向无序 分层χ2 input hospital trt effect f; cards; proc freq order=data; tables

最新《卫生统计学》第七章 卡方检验(63P)-药学医学精品资料

最新《卫生统计学》第七章 卡方检验(63P)-药学医学精品资料

Tb417 3 31 512.56
Tc814 3 91 661.56
Tc814 3 31 522 .4 . 4
2 (3 9 3.4 4 )2 4 (8 1.5 2 )2 6 (5 7 6.5 1 )2 6 (2 7 2.4 2 )2 4 3.4 44 1.5 26 6.5 16 2.4 24 3 .52
单纯治疗 61.56 22.44
84
73.3
合 计 96
35
131
73.3
T a 4 7 7.3 3 % 34.4T 4 b 4 2 7 .7 % 6 1 .5 2 . 6 T c 8 7 4 .3 % 3 6 1 .56T d 8 2 4 .7 % 6 2 2 .44
四格表的理论频数由下式求得 :
例7.2
表 1 131 例乳腺癌患者治疗后 5 年存活率的比较 处 理 存活数 死亡数 合计 存活率(%)
联合治疗
39
8 47
83.0
单纯治疗
57
27 84
67.9
合计
96
35 131
73.3
四格表(fourfold table)
➢ 表1 中间阴影部分的四个数据为基本数据,其余数据 均由此四个数据派生出来,故称此种资料为四格表 (fourfold table)资料。
➢ 多(R)个率的比较,其基本数据有R行2列,构成
R×2表,用以表述R个率的基本数据。R×2表的2
检验用于推断R个样本率各自所代表的总体率是否 相等。
多个样本率的比较的公式
2
(Ai Ti )2 Ti
2 n( A2 1)
nRnC
式中,A为第R行第C列对应的实际频数,nR为第R行的行合计,

医学统计学(6) 卡方检验

医学统计学(6) 卡方检验

•进一步的两两比较
•P<0.017才有 统计学意义!!
【例6】某中医院用三种治疗方法治疗413例糖尿病患者, 资料见表。为避免中医不同证型对疗效比较的影响,分 析3种疗法治疗的病人按3种中医分型的构成比有无差别?
SPSS软件操作
• 第1步:定义变量
• 第2步:输入 原始数据
• 第3步:定义频数 • 选择数据→加权个案 • 频数→加权个案(频 数变量)
CMH多维卡 方检验
• 第4步:x2检验(2) • 选择统计 量按钮 • 在交叉表: 统计量对 话框:勾 上卡方
• 第4步:x2检验(3) • 选择单元 格按钮 • 在交叉表: 单元显示 对话框: 勾上观察 值、百分 比:行、 列
• 第5步:结果解读(1)
• 结果解读:中西医组的治愈率为98.2%,西 医组的治愈率为74.0%。
【例4】某医师为研究乙肝免疫球蛋白预防胎儿宫内感 染HBV的效果,将33例HBsAg阳性孕妇随机分为预防 注射组和非预防组,结果见表。问两组新生儿的HBV总 体感染率有无差别?
• 第1步:定义变量
SPSS软件操作
• 第2步:输入 原始数据
• 第3步:定义频数 • 选择数据→加权个案 • 频数→加权个案(频 数变量)
医学统计学 (6 )
《中华医学杂志》对来稿统计学处理的有关要求
卡方检验(chi-square test)
• χ2检验是现代统计学的创始人之一,英国人 Karl . Pearson于1900年提出的一种具有广 泛用途的统计方法。 • 可用于两个或多个率间的比较,计数资料 的关联度分析,拟合优度检验等等。
关联性分析
列联系数的意义 • |rp|<0.4,关联程度低 • 0.4≤|rp|<0.7,关联程度中等 • |rp|≥0.7,关联程度高

《医学统计概论》第7章卡方检验Chi-square test

《医学统计概论》第7章卡方检验Chi-square test
(2) 当n≥40,有任一格1≤T<5时,可用Yates校正公式;
(3) 当n<40或有T<1时,用Fisher’s exact probability。
7.2 配对四格表资料的χ2检验
配对设计包括:(1)同一批样品用两种不同的处理方法;(2)观察 对象根据配对条件配成对子,同一对子内不同的个体分别接受不同的处理; (3)在病因和危险因素的研究中,将病人和对照按配对条件配成对子, 研究是否存在某种病因或危险因素。
表7-1 两组降低颅内压有效率的比较(P137)
组别
试验组 对照组 合计
有效
99 75 174
无效
5 21 26
合计
104 96 200
有效率(%)
95.20 (p1) 78.13 (p2) 87.00 (pc)
实际频数A (actual frequency) 理论频数T (theoretical frequency)
,
1
因为有一格1<T<5,且n>40时,所以应用连续性校
正χ2检验。
四、精确概率法(Fisher’s exact probability)
在无效假设成立的前提下且周边合计固定时,产生任意 一个四格表(i)的概率Pi 服从于超几何分布,其计算式为:
a b!c d !a c!b d !
Pi
a!b!c!d !n!
药物治疗组 164
18
182
外用膏药组 118
26
144
4.59
>0.0125 (NS)
合计
282
44
326
二、各实验组与同一对照组比 关键是检验水平的校正
'
2k 1
自学
7.6 双向有序分组资料的线性趋势检验

医学统计学:第七章 卡方检验

医学统计学:第七章 卡方检验
c2 检验是以c2 分布为理论依据,用途广 泛用途的统计方法。
c(chi)为希腊字母,音为 kai。
2021/5/11
第七章 卡方检验
5
c2检验
c2 检验的用途 (1)用于推断个总体率或构成比之间 有无差别; (2)推断多个总体或构成比之间有无 差别; (3)多个样本率比较的Χ2 分割; (4)两个分类变量间有无关联性; (5)频数分布的拟合优度检验。
某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地 塞米松(对照组)降低颅内压的疗效。将200例颅内 压增高症患者随机分为两组,结果见表7-1。
问两组降低颅内压的总体有效率有无差别?
红框内的资料(99、5、75、21)称为四格表(fourfold table)资料。
表7-1 两组降低颅内压有效率的比较
组别
2021/5/11
第七章 卡方检验
第一节 四格表资料 19
四格表c2检验专用公式
四格表c2检验专用公式:
用a、b、c、d表示四格表资料的4个实际频数。
c2
(ad bc)2 n
(a b)(c d )(a c)(b d )
91 21 5 752 200
12.86
104 96174 26
第四节行×列表的c2检验 第五节多个样本率比较的c2分割法
四、双向无序分类资料的独立性检验 五、双向有序分类资料的线性趋势检验
第六节有序分组资料的线性趋势检验
六、双向分类(属性相同)资料的一致性检验
第二节配对四格表资料的c2检验
七、第七节频数分布拟合优度c2检验 大纲 练习题 资料类型与c2检验
2021/5/11
c2值的大小还取决于自由度n的大小。
自由度n愈大, c2值也会愈大。

医学统计学--卡方检验

医学统计学--卡方检验
பைடு நூலகம்
笃 学
精 业
修 德
厚 生
6
2 ( A T ) 2值的大小还取决于 个数的多少(严 T 2 ( A T ) 格地说是自由度 的大小)。由于各 皆是 T 2
正值,故自由度 愈大, 值也会愈大;所以只 2 值才能正确地反映 有考虑了自由度 的影响,
实际频数 A和理论频数 T 的吻合程度。检验时, 要根据自由度 查 2 界值表。当 2≥ 2时, P , ,
2 中,若拒绝无效假设
H0只能做出总的结论,但还不知道哪两
个率之间有差别。若想知道哪两个率之间
有差别,还要进行两两比较,本节介绍两
两比较的方法之一:行×列表的分割。
笃 学
精 业
修 德
厚 生
30
4.行×列表的分割 (一)多个实验组间的两两比较 由于要做重复多次的假设检验,需对第Ⅰ 类错误作校正,新的校正检验水准为:
第七章 掌握内容:
2 检 验
1.检验的基本思想和用途 2.成组设计四格表资料检验的计算及应用条件
3.配对设计四格表资料检验 4.行列表资料检验及应用时应注意的问题 5.频数分布拟合优度的检验 了解内容 1.四格表资料的Fisher精确概率法的基本思想 与检验步骤
笃 学 精 业 修 德 厚 生
2 检验是一种用途很广的假设检验方
处理组 1 2 属性 阳性 阴性 合计
合计
a (T11) c (T21) m1
b (T12) d (T22) m2
n1(固定值) n2(固定值) n
要想知道处理组1,2之间差别是否有统计学意义, 常用 2 检验统计量来作假设检验。
笃 学 精 业 修 德 厚 生
5
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本例 n 78, 但T22 4.67,故用四格表 2 资料 检验的校正公式

2 c
( 46 8 6 18 78 / 2) 78
2
52 26 64 14
3.14
1,查 2 界值表得 0.05 P 0.10 。按
0.05检验水准不拒绝 H 0,尚不能认 为两种药物治疗脑血管疾病的有效率不等。
两法的一致率较高),b与c的数值相对较小时, 即便是检验结果有统计学意义,其实际意义往
往也不大。
105
35
检验步骤: H 0 : B C , H 1 : B C , 0.05
b c 12 2 14 40 ,用校正公式
c2
( 12 2 1) 2 12 2
检验的自由度取决于可以自由取值的格
2
子数目,而不是样本含量n。四格表资料只 有两行两列,=1,即在周边合计数固定的情 况下,4个基本数据当中只有一个可以自由 取值。 105 17
3. 假设检验步骤
(1) 建立检验假设,确定检验水平。
H0:π1=π2 即试验组与对照组降低颅内压的总体有效率相等 H1:π1≠π2 即试验组与对照组降低颅内压的总体有效率不相等
(2 1)( 2 1) 1
105 19
以 =1 查 附表 8 的 界 值表得
2
P 0.005 。按 0.05 检验水准拒绝 H 0 ,
接受 H 1 ,可以认为两组降低颅内压总体 有效率不等,即可认为异梨醇口服液降 低颅内压的有效率高于氢氯噻嗪+地塞 米松的有效率。
多个总体率或构成比之间有无差别
多个样本率的多重比较
两个分类变量之间有无关联性
频数分布拟合优度的检验。
检验统计量:
2
应用:计数资料
第一节 四格表资料的 检验
2
105
5
目的:推断两个总体率(构成比)是 否有差别 (和u检验等价)
要求:两样本的两分类个体数排列成四 格表资料
105
6
2 检验的基本思想 一、
α=0.05。
105 18
(2)求检验统计量值
T11 104 174/ 200 90.48 ,T12 104 90.48 13.52
T21 174 90.48 83.52 ,T22 26 13.52 12.48 。
(99 90.48) 2 (5 13.52) 2 (75 83.52) 2 (21 12.48) 2 2 90.48 13.52 83.52 12.48 12.86
105 30
例7-3 某实验室分别用乳胶凝集
法和免疫荧光法对58名可疑系统红斑
狼疮患者血清中抗核抗体进行测定,
结果见表7-3。问两种方法的检测结果 有无差别?
105 31
表7-3 两种方法的检测结果
免疫荧光法 + - 合计 乳胶凝集法 + 11(a) 2(c) 13 - 12(b) 33(d) 45 合计 23 35 58
2
n 40, T 5 ,专用公式;
n 40, 1 T 5,校正公式;
,直接计算概率。 n 40 或 T 1
2 连续性校正仅用于 1 的四格表资料,当 2
时,一般不作校正。
105 24
例7-2 某医师欲比较胞磷胆碱与
神经节苷酯治疗脑血管疾病的疗效, 将78例脑血管疾病患者随机分为两组, 结果见表7-2。问两种药物治疗脑血管
2
统计量 分布的连续性,则需行连续性
2
校正。
105 22
三、四格表资料检验的校正公式

2 c
( A T 0.5) T
2
n 2 (| ad - bc | - ) n 2 2 c = (a +b)(c + d )(a + c)(b+ d )
105 23
四格表资料 检验公式选择条件:
105
40
一、基本思想
在四格表周边合计数固定不变的条 件下,计算表内4个实际频数变动时的
各种组合之概率 P ;再按检验假设用 i 单侧或双侧的累计概率 P,依据所取
的检验水准 做出推断。
105 41
1.各组合概率Pi的计算 在四格表周边合计数 不变的条件下,表内4个实际频数 a,b,c,d 变 动的组合数共有“周边合计中最小数+1”个。 如例7-4,表内4个实际频数变动的组合数共 有9+1=10个,依次为:
第七章
检验
2
Chi-Square Test
105 1
Content
• test of fourfold data • 2 test of paired fourfold data • Fisher probabilities in fourfold data 2 • test of R×C table • Multiple comparison of sample rates 2 • test of goodness of fit
105
15
检验统计量 值反映了实际频数与理 论频数的吻合程度。
2
若检验假设H0:π1=π2 成立,四个格子的实际 频数A 与理论频数T 相差不应该很大,即统计量 2 值很大,即相对应的P 值很 不应该很大。如果 小,若 P ,则反过来推断A与T相差太大,超出 了抽样误差允许的范围,从而怀疑H0的正确性, 继而拒绝H0,接受其对立假设H1,即π1≠π2 。
检验统计量为
(b c) , 1 bc
2 2

2 c
( b c 1) bc
105
2
, =1
34
注意:
本法一般用于样本含量不太大的资料。因
为它仅考虑了两法结果不一致的两种情况(b, c),
而未考虑样本含量n和两法结果一致的两种情况 (a, d)。所以,当n很大且a与d的数值很大(即
疾病的有效率是否相等?
105 25
表7-2 两种药物治疗脑血管疾病有效率的比较
组别 胞磷胆碱组 神经节苷酯组 合计 有效 46 18 64 无效 6 8(4.67) 14 合计 52 26 78 有效率(%) 88.46 69.23 82.05
105
26
H 0 : 1 2 , H1 : 1 2 , 0.05
0.5 0.4 0.3
1
f ( 2 )
0.2 0.1 0 0 2 4
6
10
6
8
10
12
14
16

105
2
8
2. 检验的基本思想
2
例7-1 某院欲比较异梨醇口服液(试验组)和
氢氯噻嗪+地塞米松(对照组)降低颅内压的疗 效。将200例颅内压增高症患者随机分为两组,结
果见表7-1。问两组降低颅内压的总体有效率有无
( ν1+ν2 )的 分布,即 2
( X1 X ~ 2)
2 。
1 2
2 界值:当 确定后, 2 分布曲线下右侧尾部的 (3) 时,横轴上相应的 2 值,记作 , (见附表 8)。 2 面积为
2 值愈大,P 值愈小;反之, 2 值愈小,P 值愈大。
105 7
2
105 2
第一节 第二节 格表资料的
2 检验 配对四格表资料的
四格表资料的 Fisher 确切概率法 行×列表资料的 检验
2
多个样本率间的多重比较 有序分组资料的线性趋势检验(不讲) 频数分布拟合优度的 检验
2
105 3
目的:
推断两个总体率或构成比之间有无差别
105
32
上述配对设计实验中,就每个对子而 言,两种处理的结果不外乎有四种可能: ①两种检测方法皆为阳性数(a); ②两种检测方法皆为阴性数(d); ③免疫荧光法为阳性,乳胶凝集法为 阴性数(b); ④乳胶凝集法为阳性,免疫荧光法为 阴性数(c)。
105 33
其中,a, d 为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况。
105
10
本例资料经整理成图7-2形式,即有两 个处理组,每个处理组的例数由发生数和
未发生数两部分组成。表内有
99 5 75 21
四个
基本数据,其余数据均由此四个数据推算 出来的,故称四格表资料。
105 11
处理组 甲 乙 合 计
发生数
未发生数
合计 a+b c+d n
a c a+c
b d b+d
nR nC TRC n
式中,TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计
105 14
理论频数 T 是根据检验假设 H0 : 1 2 ,且用合 并率来估计 而定的。 如上例,无效假设是试验组与对照组降低颅内压的 总体有效率相等,均等于合计的有效率87%。那么 理论上,试验组的104例颅内压增高症患者中有效 者应为104(174/200)=90.48,无效者为 104(26/200)=13.52;同理,对照组的96例颅内压增 高症患者中有效者应为96(174/200)=83.52,无效者 为96(26/200)=12.48。
理论依据:超几何分布
(非 检验 的范畴)
2
105 38
例7-4 某医师为研究乙肝免疫球
蛋白预防胎儿宫内感染HBV的效果,将 33例HBsAg阳性孕妇随机分为预防注射 组和非预防组,结果见表7-4。问两组
新生儿的HBV总体感染率有无差别?
105
39
表7-4 两组新生儿HBV感染率的比较
相关文档
最新文档