分类资料统计推断

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
α= 0.05
H1 :1 2
计算统计量χ2值:
2
54 20 8 44
62 6498
2126 28
6.13
确定P值,作结论:
查χ2界值表中,υ=
1
时,
χ2 0.05,1
=
3.84
,
χ2 0.01,1
=
6.63
,
因而
0.05 >P >0.01 , 即 P<α, 因而拒绝 H0 , 接受 H1 , 可以认为两组溃疡
传统疗法 162
43
205
79.02
新疗法
121
13
134
90.30
合计
283
56
339
83.48
2 162 13 43 1212339 = 7.47
205 134 56 283
3、行×列表(R×C表)资料的χ2检验
行×列表资料即基本数据在四个以上,如多个率的比较,其基本数 据为R行×2列;两组构成比的比较,其基本数据为2行×C列;多组构 成比的比较,其基本数据为R行×C列。
计算统计量χ2值
2 n
A2 n R nC
1
2
808
120 190
2 438
2 70 190 370
98 169
2 438
2 71 169 370
96 170
2 438
2 74 170 370
124 279
2 438
2 155 279 370
1
= 18.17
确定P值,作结论:
查χ2界值表, 按υ=(R-1)(C-1)求得υ= 3,
四格表资料即基本数据只有四个,为两行两列,如 两个率的比较。
检验统计量专用计算公式为:
2
ad bc2 n
(a b)(c d)(a c)(b d)
1)]
,[υ=(R-1)(C-
式中a , b , c , d 分别代表四个实际频数,n 为总例数;υ 为自由度,R为行数,C为列数。
(1)四个表资料χ2检验实例 :
(2)两个样本率比较
检验统计量计算公式如下:
u
p1 p2
p0 (1 p0 )(1/ n1 1/ n2 )
u p1 p 2 (1/ n1 1/ n2 ) / 2 p0 (1 p0 )(1/ n1 1/ n2 )
式中P0为合并阳性率,P0 =(X1 + X2)/(n 1 + n 2 )
例3 某中药研究所试用某种草药预防流感,观察用药 组和对照组(未用药组)的流感发病率,结果如下表,问两 组的流感发病率是否不同?
愈合率差别显著,呋喃硝胺的愈合率高于甲氰咪胍。
(2)四格表资料χ2检验应用注意:
①当n>40,且任意T≥5时,可 直接使用 四格表专用公式。
②当n>40,且任意1<T<5时,应计算校正χ2值
,其计算公式
为:
ad bc n 2 n
2
2
(a b)(c d )(a c)(b d )
例5. 某医生欲比较胞磷胆碱与脑益嗪治疗脑动脉硬化的疗效,观
表1 用药组和对照组的流感发病率
组别 观察人数 发病人数 发病率(%)
用药组
100
14
14.0
对照组
120
30
25.0
合计
220
44
20.0
此为两大样本率的比较,可用u检验。
假设检验过程:

α= 0.05
计算统计量u值:
u
p1 p2 p0 (1 p0 )(1/ n1 1/ n2 )
2.031
u
0.14 0.25
地区 表9弥不漫同型地区地结方节性型甲状腺混肿合的型型别分布合计
某市 14791
4815
1509 21115
甲县
486
2
4
492
乙县
133
260
51
444
合计 15410
5077
1564 22051
检验方法同例10 。
P (1 P)
SP
n
Sp
0.25 (1 0.25) 0.0153 1.53 % 800
阳性率的95 % 可信区间为:
0.25 1.96 0.0153 , 0.25 1.96 0.0153
( 0.22 , 0.28 ) 或
25 % 1.96 1.53 % , 25 % 1.96 1.53 %
= 4.125 = u 2 ≈ (2.031)2
例7 某市对医院空气消毒监测,市级医院65个抽样点中52个 合格,合格率80 .00% ,乡镇医院53个抽样点中22个合格, 合格率41.51 % 。问城乡医院空气消毒合格率是否不同?
表5 城乡医院空气消毒合格率的比较
组 别 抽样点数 合格数 不合格数 合格率(%)

因而P <0.005 。按α=0.05水准,拒绝H0 ,可以认为不同人 群带菌率不同或不全相同。
例10 两个医院合作进行脑梗塞疗效试验中,各医院受试 病例的脑梗塞部位如表8所示,问两所医院病例的梗塞部位 的分布(构成比)是否不同?
表8 甲乙两医院病例的脑梗塞部位的分布
医院 皮层 基底节 混合型 合计
察结果如表3,问两种药物的疗效有无差别?
处理组
有表效3.
两种药物治疗脑动脉硬化的疗效
无效
合计
有效率(%)
胞磷胆碱
41(38.18) 3(5.82)
44
93.18
脑益嗪
18(20.82) 6(3.18)
24
75.00
合计
59
9
68
86.76
表3显示有一个理论频数T< 5,因此应用校正χ2检验。
(3)四格表资料χ2检验与 u 检验的关系
312 51 80
142 1980
1
=14.29
确定P值,作结论:
查χ2界值表, 按υ=(R-1)(C-1)求得υ=
2,
, 2 0.005, 2
10.60
因而P <0.005 。按α=0.05水准,拒绝H0 ,可以认为两所医院
病例的梗塞部位的分布(构成比)不同,因而可比性较差。
例11 某市和某两县进行地方性甲状腺肿普查,查出各 型患者如表9,问三地间地方性甲状腺肿的型别构成是否不 同?
例6 以例3资料作χ2检验,整理如表4:
表4 用药组和对照组的流感发病率的比较 组 别 观察人数 发病人数 未发病人数
用药组
100
14
86
对照组
120
30
90
合计
220
44
176
即两大样本率比较的χ2检验与 u 检验是等价的。
2 14 90 86 302 220
100 120 176 44
=
0.20 0.80 (1/100 1/120)
确定P值,作结论:
2可.5以7查5认8t为界, 因两值而组表发0中.病0,5率υ>=P不∞>同0时.,0,1用,u药则0.0组P5<发=α1病,.9拒率6绝低, uH于00.,对01接照=受组H,1, 说明该草药有预防流感的作用
三、χ2 检验
χ2检验(Chi-square test)用途极广,这里 仅介绍它在分类变量资料中用于推断两 个或两个以上总体率(或构成比)之间 有无差别或有无关联的分析方法。
例2 以往经验脑梗塞患者治疗三周的生活能力改善率为30 % ,某 医院用新疗法治疗38例的三周生活能力改善率为50 % ,能否认为新疗 法的改善率与以往不同?
此为样本率与总体率比较:且n p和 n(1-p) 都大于5,故用u检验。
设 H0 : 0
α= 0.05
H1 : 0
计算统计量u值:
u
X
n 0
分类资料的统计推断
一、率的抽样误差与标准误
抽样研究所得的率同样存在抽样误差, 描述其大小的指标是率的标准误(standard error of proportion),其计算公式如下:
当 已知时 p
(1)
n
当 未知时
SP
P (1 P) n
二、总体率的估计和率的u检验
1、总体率的估计:
总体率的估计有两种方法,一是正态分布法,二是 查表法。 ★正态分布法 适用于样本较大,且p和/或1-p都不太小, 如np和n(1-p)都大于5时。计算公式为:
1、χ2检验的基本思想
例4:某医生用国产呋喃硝胺治疗十二指肠球部溃疡,以甲氰咪胍 作对照组,结果如表5,问两种方法治疗效果有无差别?
表2. 两种药物治疗十二指肠球部溃疡的效果
处理组
愈合
未愈合
合计
愈合率(%)
呋喃硝胺组
54(48.2)
8 (13.8)
62
87.10
甲氰咪胍组
44 (49.8)
20 (14.2)
64
合计
98
28
126
68.75 77.78
设 H0 :1 2
H1 :1 2
α= 0.05 计算统计量χ2值: χ2值的基本公式为:
2
A T
T
2
式中A为实际频数,即所获资料中的基本数据;T为理论频数,是
根据检验假设H0推算得到的,TRC
nR nC n
,其中,n R为同行合计,n C
为同列合计,n为总例数。
χ2检验的基本思想体现在χ2值的基本公式中,即当H0成立时,实 际频数 A就与理论频数 T很接近,此时χ2值不会太大;反之,如若A与T
相差较大,就会计算得到一个较大的χ2值,当其超出一定范围时,就有
理由认为H0不成立。因此,实际上χ2值反映了实际频数与理论频数的 吻合程度。
2、四格表资料的χ2检验
当π或 1—π不太小,而n 足够大时,如nπ和n(1—π)大于 5 时,即可按正态近似法做假设检验。检验统计量为 u 值,计算公式如 下:
式中 n 为样本例数,X 为样本阳性数,样本率 p = X/n ;π0 为总体率; 0.5 为连续性校正数,当 n 较大时可以省去,而︱X— nπ︱≤ 0.5 时不 宜采用校正数。
甲 63
20
5
88
百度文库
乙 35
31
14
80
合计 98
51
19
168
采用R×C表资料χ2检验。
设 H0:两所医院病例的梗塞部位的总体分布(构成比)相同 H1:两所医院病例的梗塞部位的总体分布(构成比)不同 α= 0.05
计算统计量χ2值
2
168
632 9888
202 51 88
52 1988
352 9880
表7 某地流行性脑脊髓膜炎流行期不同人群带菌率
职 业 调查人数 阳性数 阴性数 阳性率(%)
工人
190
120
70
63.16
农民
169
98
71
57.99
服务员
170
96
74
56.47
中小学生
279
124
155
44.44
合计
808
438
370
54.21
采用R×C表资料χ2检验。
设 H0:四个人群带菌率相同,即 1 2 3 4 H1:四个人群带菌率不同或不全相同 α= 0.05
p u sp , p u sp
★查表法 适用于小样本。利用样本含量n和阳性数x查 “百分率的可信区间”表获得。
例1 检查居民800人粪便中蛔虫阳性200人,阳性率为25 %,试求 当地居民粪便蛔虫阳性率的95 % 可信区间和99 % 可信区间。
公式:
p u sp , p u sp
其中, 即:
0.5
p 0
1 2n
n 0 (1 0 )
0 (1 0 ) / n
本例︱X— nπ︱≤0.5 ,因此不宜用校正系数,故
19 380.30
0.50 0.30
u
38 0.30 0.70 0.30 0.70 / 38
= 2.69
确定P值,作结论:
查t界值表中,υ= ∞ 时,u 0.01 = 2.5758 , u 0.005 = 2.8070 , 因而 0.01 > P > 0.005 , 则 P<α, 拒绝H0, 接受H1, 可以认为新疗法的改善率 与以往不同,新疗法的改善率高于以往。
市级医院
65
52
13
80.00
乡镇医院
53
22
31
41.51
合计
118
74
44
62.71
采用χ2检验
2 52 31 13 222 118
65 53 44 74
= 18.50
例8 某医生用两种疗法治疗某病,结果如表6 ,问可 否认为新疗法优于传统疗法?
表6 两种疗法治疗某病治愈率比较
疗 法 治愈数 未治愈数 合计 治愈率(%)
例4:某医生用国产呋喃硝胺治疗十二指肠球部溃疡,以甲氰咪 胍作对照组,结果如表5,问两种方法治疗效果有无差别?
表2. 两种药物治疗十二指肠球部溃疡的效果
处理组
愈合
未愈合
合计 愈合率(%)
呋喃硝胺组
54
8
62
87.10
甲氰咪胍组
44
20
64
68.75
合计
98
28
126
77.78
假设检验过程:
设 H0 :1 2
检验统计量计算公式为:
1)]
2 n
A2 nR nC
1
,[υ=(R-1)(C-
其应用条件是 T < 5 的格子数不超过 1/5 和没有任意格的 T<1 。 如果出现上述情况应作如下处理:
①根本办法是增加观察例数,使各格基本数据增大;②将T较小的 行或列与性质相近的行或列作合理的合并。
例9 某地在流行性脑脊髓膜炎流行期间进行了带菌 调查,结果如表7,问不同人群带菌率是否不同?
( 22 % , 28 % )
同理可得阳性率的99 % 可信区间。
2、 率的u检验
(1)样本率与总体率比较
样本率与总体率(一般为理论值、标准值或经大量观察所得的稳 定值等)比较的目的,是推断样本所代表的未知总体率π与已知总体 率π0是否相等。
可选方法有直接计算概率法(用于π偏离 0.5 较远,且阳性数 X 较小作单侧检验时)和正态近似法。这里着重介绍正态近似法。
相关文档
最新文档