(精品)医学统计学课件:分类资料的统计推断

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
➢当b+c≤20时:计算确切概率
• H0:两种培养方法的结果相同,即总体B=C; • H1:两种培养方法的结果不同,即总体BC。 • =0.05。
2 ( 24 10 1)2 4.971
24 10
• 按 =1查2界值表,P<0.05。在 =0.05水准上拒绝H0 , 接受H1,差异有统计学意义;可认为两法培养阳性率不同,
u p1 p2 s p1 p2
pc
n1 N1
n2 N2
p1 p2
pc
1
pc
1 n1
1 n2
Page 13
两样本率比较的2检验
➢ 读作 chi 2 :卡方 ➢ 2检验(chi-square test) 是现
代统计学的创始人 Karl Pearson(1857-1936 )于1900 年提出的一种具有广泛用途 的统计方法 。

c c-x
d d+x
合计
a+c
b+d
合计 a+b c+d n
第四步:确定 P 值,下结论
• 由于四格表资料为双边固定形式,即假设行 合计与列合计均固定,所以四格表的自由度 ν=1
=行数-1列数-1
自由度为1 的2分布
0.5 0.4 0.3 0.2 0.1 0.0
自由度为2 的2分布
0.5 0.4 0.3 0.2 0.1 0.0
率事件。
0.05
3.84
❖ 本例 2 =1.41 < 3.84 得P > 0.05。
❖ 按 = 0.05水准不拒绝H0,差别无统计学意义。
故尚不能认为两组总体有效率不相同 。
基本思想概括
❖若H0成立,则四个格子的实际频数A与 理论频数T之差异纯系抽样误差所致, 故一般不会很大,2值也就不会很大;在 一次随机试验中,出现大的2值的概率P
组别
有效 无效 合计 有效率(%)
试验组
43(a) 10(b) 53 81.13
对照组
40(c) 16(d) 56 71.43
合计
83
26 109 76.15
四格表 (fourfold table)
理论频数 (theoretical frequence)
✓如果两个样本来自同一总体,则两组有效 率相同,则用合计的有效率作为总体率估 计值。
53 5683 26
四格表2的检验的应用条件:
n>40,T>5,用2; n>40,但1<T≤5,用校正2。
2 C
(| A T | 0.5)2 T
2 C
(| ad bc | n / 2)2 n (a b)(c d )(a c)(b d )
n ≤ 40,或T≤1,用Fisher精确概率计算法 。
2分布
0.5 0.4 0.3 0.2 0.1 0.0
自由度为1的2分布界值
0.5 0.4 0.3
0.05 0.2 0.1 0.0
3.84
❖由 2界值表查得 20.05,1 = 3.84 ,即理论上 如果H0成立,则2有95%的可能 在0~3.84 之间,2 >3.84的可能性只有0.05,是一小概
例 6.5
➢ 某医师在用蛙王露口服液治疗贫血的临床试验 中,将109名受试者随机分为两组,一组为试 验组,接受蛙王露口服液的治疗,结果为有效 43人,无效10人;另一组为对照组,接受复方 阿胶浆的治疗,结果为有效40人,无效16人, 问两组有效率有无差别?
例6.5
表 6.1 两药治疗贫血有效率的比较
是很小的。
❖因此,若根据实际样本资料求得一个很
小的P,且P≤ (检验水准),根据小概率
原理,就有理由怀疑H0的真实性,因而
拒绝它;若P>,则没有理由拒绝H0
四格表资料2检验专用公式
a
b
c
d
43 10 40 16
2
(ad bc)2 n
(a b)(c d )(a c)(b d )
2 109 (4316 4010)2 1.41
p u s p
总体率的区间估计 (二)
• 总体率( )95%的可信区间为:
p 1.96s p
• 总体率( ) 99%的可信区间为:
p 2.58s p
例6.2
• 从某地人群中随机抽取144人,检查乙型肝炎表面抗原 携带状况,阳性率为9.03%,求该地人群的乙型肝炎表 面抗原阳性率的95%可信区间。
6.5 配对两分类资料的比较
➢ 配对设计是医学研究中常用的设计方法之一,二 分类结果资料的配对研究常用于比较两种检验方 法、两种培养方法、两种提取方法等的差别。
➢ 配对四格表2检验,又称作McNemБайду номын сангаасr检验。
➢ 目的:通过单样本分析,推断两处理结果有无差 别。
配对四格表资料的2检验
两种血清学检验结果比较
衡量理论数与实际数的差别
2 ( A T )2
T
2 43 40.362 10 12.642 40 42.642 16 13.362 1.41
40.36
12.64
42.64
13.36
第四步:确定 P 值,下结论
表 四格表资料的基本形式
处理组
发生数
未发生数

a a+x
b b-x
43
10
40
16
理论数T
40.36 12.64 42.64 13.36
2检验的基本思想(2)
• 如果H0假设成立,则实际频数与理论频数应
该比较接近。差值A T 属于随机误差,用2
统计量表示:
2
( A T )2 ~ 2分布
T
H0成立时,实际数与理论数的差别不会很大,出现较大2值概率很小。 如果实际频数与理论频数相差较大, 2检验统计量超出了界值,则拒绝H0 。
2
109
282 37 56
92 37 53
182 38 56
202 38 53
102 34 56
242 34 53
1
15.556
v=2
自由度为2的2分布界值
0.5
0.4
0.3
0.2
0.1
=0.05
0.0
5.99
3个率比较的2检验步骤
P<0.005 按=0.05水准,拒绝H0 ,接受H1 差别 有统计学意义。 认为三种药物的虫卵阴转率不相同或不全 相同。
χt检2验检验
率的抽样误差
• 由于总体中个体变异的存在,在抽样过 程中产生的样本率与总体率的差异或样 本率间的差异 ,称为率的抽样误差。
率的标准误(SE of Rate)
• 率的抽样误差大小的衡量指标
1
p
n
p1 p
sp
n
总体率的区间估计 (一)
查表法
– n较小,如n≤50,特别是p接近0或1时 – 用样本含量n与阳性数X查附表7
若P≤ ,则拒绝H0; 若P> ,则尚无理由拒绝它。
第一步:建立检验假设
➢H0:两总体有效率相等,即1=2; ➢H1:两总体有效率不等,即12。
第二步:确定检验水准
➢ = 0.05 (双侧检验)
第三步:计算检验统计量
2 (AT)2
T
式中: A 为实际频数(actual frequency) T 为理论频数(theoretical frequency)
表6.8 两种白喉杆菌培养基培养结果比较
乙法
+

合计
甲法
合计
+

36
24
60
10
135
145
46
159
205
配对四格表的实际数与理论数
24(b) 10(c)
17 17
b+c>40:
2 (b c)2
(b c)
20<b+c≤40:
C2
( b c 1)2 (b c)
2
( Ai Ti )2 Ti
组别 试验组 对照组
合计
表6.2 表6.1资料理论频数的计算
有效 40.36 42.64
83
无效 12.64 13.36
26
合计 53 56 109
T11=53×83/109=40.36;T12=53×26/109=12.64 T21=56×83/109=42.64;T22=56×26/109=13.36。
基本思想
四格表精确概率的基本思想是:在四格表的周 边合计不变的条件下,用公式
a b!c d !a c!b d !
Pi
a!b!c!d!n!
直接计算表内四个数据的各种组合之概率。
6.4 多组率或构成比的比较
➢ 多(R)个率的比较,其基本数据有R行2列,构 成R×2表,用以表述R个率的基本数据。R×2
表的2检验用于推断R个样本率各自所代表的
总体率是否相等。
多个样本率的比较的公式
2 ( A T )2
T
2 n( A2 1) nR nC
多个率比较的2检验
【例6.8】某县防疫站观察三种药物驱钩虫的疗效, 在服药后7天得粪检钩虫卵阴转率(%)如下,问三 药疗效是否不同?
可能的结果 甲法
1

2

3

4

乙法 + - + -
频数 a b c d
表 配对设计两种方法结果比较
甲法
+ 合计
乙法
+
a
b
c
d
a+c
b+d
合计
a+b c+d a+b+c+d=n
➢配对设计的特点是对同一样本的每一份检品分别 用甲、乙两种方法处理,观察其阳性与阴性例数。
例6.10 有205份检验样品,每份分别接种于甲、乙两种 培养基上,培养结果见表6.8,试问两种培养基的结果有 无差别?
合计 83
26
109 76.15
Trc
nr nc n
理论频数=56 76.15%
四格表的理论频数由下式求得 :
nn
TRC
RC
n
式中:TRC为第R 行C 列的理论频数, nR为相应的行合计, nC为相应的列合计。
2检验的基本思想(1)
通过构造A与T吻合程度的统计量来反 映两样本率的差别!
实际数A
n 较大时,正态近似法
p
u
n 较小时,直接计算概率法
p (1 )
n
6.3 两样本率的比较
➢目的: 推断两总体率是否不等 ➢两样本率比较的u 检验(u test)
➢两样本率比较的2检验 (chi-square test)
两样本率的比较的u 检验
– 正态近似法
当n1, n2均较大,p1, p2, (1-p1), (1-p2)均不太小, 如n1p1, n2p2, n1(1-p1), n2(1-p2)均大于5时,可用u 检验。
sp 0.0903(1 0.0903 ) / 144 0.0239 2.39%
• 95%可信限为:9.03%±1.96×2.39% • 即该地人群的乙型肝炎表面抗原阳性率的95%可信区间
为:4.35%~13.71%。
样本率与总体率的比较
目的: 推断该样本所代表的未知总体率与已知的总 体率是否不等。
分类资料的统计推断
内容提要
➢ 率的标准误及区间估计 ➢ 样本率与总体率的比较
➢ 两样本率比较的2检验
➢ 多组率或者构成比的比较 ➢ 配对两分类资料的假设检验 ➢ Fisher精确概率法
简要回顾
分定类量资料
Example
统计描述
统计分析
参数估计 统计推断
假设检验
均率、数比、、标构准成差比 总体率均的数可的信可区信间区间
例6.1
• 有人调查29名非吸毒妇女,出狱时有1名HIV阳 性,试问HIV阳性率的95%的可信区间是多少?
• 本例 n=29,X=1,查附表7得0.1~17.8,即该HIV 阳性率的95%的可信区间为:0.1%~17.8%。
总体率的区间估计 (二)
正态近似法
– n足够大,p与1-p不太小,如np>5和n(1-p)>5 样本率p的抽样分布近似正态分布。
乙法培养阳性率高于甲法。
四格表的精确概率法
四格表资料观察例数若太小时,2检验因近似
程度较差,易导致分析的偏性(尤其是当所得 概率接近检验水准时),故宜用四格表的精确 概率法(exact probabilities in 22 table),即四
格表概率的直接计算法。本法不属2检验范畴, 但可作为四格表2检验应用上的补充。
✓在这样的假设前提下,可以计算各组理论 频数(theoretical frequency) T。
理论频数的计算
理论频数=53 76.15%
处理 试验组
有效 人数
理论 频数
无效 人数
理论 频数
合计 有效率 (%)
43 40.36 10 12.64 53 7861..1153
对照组 40 42.64 16 13.36 56 7761..1453
表 6.6 三种药物的虫卵阴转率的比较
药物
阴转例数 未阴转例数 合计 阴转率(%)
复方敌百虫片 28
9
37
75.7
纯敌百虫片
18
20
38
47.4
灭虫灵
10
24
34
29.4
合计
56
53
109
51.4
3个率比较的2检验步骤
H0: 1= 2 = 3 H1: 1, 2 , 3不等或不全相等 =0.05。
计算统计量:
2
(b b c)2 2
bc
(c b c)2 2
bc
(b c)2 (b c)
2
2
2 C
( Ai Ti 0.5)2 Ti
C2
(
b b c 0.5 )2 2 bc
(
c b c 0.5 )2 2 bc
(
b c 1 )2 (bc)
2
2
配对2检验的应用条件
➢当b+c>40时:直接计算2 ➢当20<b+c≤40时:计算2C
相关文档
最新文档