卫生学 10分类变量资料的统计推断PPT课件
最新卫生学6版PPT课件

第十章 分类变量资料的统计分析
(1) 第一节 分类变量资料的统计描述 第二节 分类变量资料的统计推断 第三节 χ2 检验
2
构成比的特点
(1) 各部分构成比之和等于1。 若因四舍五入造成构成比之和不等于1,则应进行适
当的调整,使其等于1。
(2) 当事物内部某一部分的构成比发生变化时,其它各部 分的构成比也会相应地发生变化。
上述数据为构成比,它并不说明40~59岁组肿瘤发 生情况最严重。只说明40~59岁组中因患肿瘤而死亡人 数在全部死亡人数中所占的比例比其它两个组要大。
◆频率指标才能说明某事物发生频率的高低。 三个年龄组的肿瘤发生率分别为12.35/十万、149.14/ 十万和341.5/十万,60岁以上的肿瘤发生率最高。
(三) 标准化率的计算步骤:
23
直接法计算标准化率
P ' ( N N i P i ) 或 P ' N N i P i 1 0 - 4
式中: P’ 为标化率, Ni 为第i组标准人口数,N为标准组总人口数, Ni /N为第i组标准人口构成比例。
例10-3 表10-3的资料已包括各年龄组的发病率,故选择直 接法计算标准化率,用甲、乙两地各年龄组人口数的合计 数作为共同的标准,采用(10-4)式计算标准化率,计算过 程见表10-4。
14
(二) 分析时构成比和率不能混淆
分析时常见的错误:以构成比代替率来说明问题。 ◆构成比说明事物内部各部分所占的比重或分布,不
能说明某现象发生的强度或频率大小。 例如,某地某年40岁以下、40~59岁和60岁以上三
个年龄组的人口中肿瘤死亡人数占全死亡原因的构成比 分别为21.9%、24.4%和9.4%。
该大学有240人获博士学位,356人获硕士学位,820人获 学士学位。 总人数为1416。获得各种学位人数的构成比:
实习十 分类变量资料的统计分析—卫生学第七版

实习十 分类变量资料的统计分析——卫生学第七版(P393-394)实习目的:1.掌握率、构成比、相对比的计算及应用;正确区分率和构成比。
2.熟悉率的标准化意义、基本思想及计算方法;掌握率的标准误、总体率可信区间估计方法及率的u 检验适用条件和方法。
3.掌握χ2检验基本思想;掌握一般四格表资料、配对资料及行×列表资料χ2检验各种公式的适用条件和检验方法。
5. 某地随机抽查了初中生300人,其中近视学生有71人,计算该地初中生近视眼患病率的标准误,并估计其总体率的95%置信区间。
P =71/300×100%=23.67%()n p p s P -=1 = ()3002367.012367.0- = 0.0245n 足够大时(n >50);样本率p 或1-p 均不太小时 [ 如n p 和n (1-p )均大于5 ],按正态分布原理估计总体率的可信区间。
总体率的95%的置信区间:P ± 1.96 S P = 0.2367 ± 1.96 ×0.0245 = 0.2367 ± 0.0480 = (18.87%, 28.47%)6. 根据以往经验,一般胃溃疡患者有20%发生胃出血症状。
现某医院观察65岁以上胃溃疡患者304例,有 31.6% 发生胃出血症状,问老年胃溃疡患者是否较易出血?分析:本题中样本率为31.6 %,np 和n (1-p )≥5,可认为呈近似正态分布,故可用 u 检验 ⑴ 建立检验假设H 0:老年胃溃疡患者和一般胃溃疡患者出血发生率相同,即π=π0。
H 1:中药和西药有效率不同,即π>π0。
单侧α= 0.05⑵ 计算检验统计量u 值np p u p)1(πππσπ--=-==304)2.01(2.02.0316.0-- = 5.056⑶ 确定P 值,做出统计推断 查U 界值表,u0005.0= 3.2905,u >u0005.0,p <0.0005,按α= 0.05水准,拒绝H 0,接受H 1,差异有统计学意义,可认为老年胃溃疡患者较易出血。
分类变量资料的推断ppt课件

推断两个样本所代表的总体率〔或
总体构成比〕是否相等。
根本公式:
(A - T) 2
2 = —————
T
专用公式:
( ad - bc) 2 n 2 = ————————————
(a + b)(c + d)(a + c)(b + d)
=1
甲乙两种疗法治疗肺癌生存率比较的四格表 常见心律失常心电图诊断的误区诺如病毒感染的防控知识介绍责任那些事浅谈用人单位承担的社会保险法律责任和案例分析现代农业示范工程设施红地球葡萄栽培培训材料
总体构成
比〕之间有
无差异,以及配对资料的
2. 2 检比验较的。根本思想
例: 甲乙两种疗法治疗肺癌的2年生存率
疗法 治疗人数 生存人数 2年生存率%
甲
46
22
47.83
乙
58
35
60.34
合计 104
57
54.81
两种疗法的2年生存率是否不同?
甲乙两种疗法治疗肺癌生存率比较的四格表 常见心律失常心电图诊断的误区诺如病毒感染的防控知识介绍责任那些事浅谈用人单位承担的社会保险法律责任和案例分析现代农业示范工程设施红地球葡萄栽培培训材料
两个率或构成比比较的四格表格式
方法 阳性数
阴性数
合计
甲
a
b
a+b
乙
c
d
c+d
合计
a+c
b+d
n
2 值、P 值与统计结论
2值
P值
统计结论
<
2
0.05( )
> 0.05
2
0.05( )
0.05
医学统计学--变量的分类与统计资料的类型 PPT课件

医学课件 18
二、统计学中的几个基本概念
• 研究单位:一个人 • 变量:红细胞数 • 同质:同某地、同2002年、同成年男子、 同正常。 总体:1)某地所有的正常成年男子 2)某地所有的正常成年男子的 红细胞数
医学课件
37
三、统计资料的类型
变量与统计资料的分类方法 1.概述 2.数值变量(numerical variable)和计量资料 (measurement data) 3.无序分类变量(unordered categories variable ) 和计数资料 (enumeration data) 4.有序分类变量(ordinal categories variable)和等 级资料(ranked data)
医学课件 19
二、统计学中的几个基本概念
• 1)有限总体(finite population):研究 单位数是有限的 • 例如:调查某地2002年正常成年男子的 红细胞数的正常值范围 • 2)无限总体(infinite population):研 究单位数是无限的 • 例如:高血压患者←无时间、空间限制。
Prop(2001.5~2011.5)=0.11, 结合Mendel历次报告的其它实 6 医学课件 验结果,每次都有如此好的吻合的概率约 10万分之4。
绪论 Introduction
讲授内容: 一、医学统计学的意义 二、统计学中的几个基本概念 三、统计资料的类型 四、医学统计工作的基本步骤 五、学习医学统计学应注意的问题
第十七章分类资料的统计推断

H0 :1=2,… H1 :12,… =0.05
(2)求检验统计量值
c2
a
ad bc n /
bc da
22 n
cb
d
251 7 27 60 / 22 60
32 28528
2.89 (2 1)(2 1) 1
(3) 确定P 值,作出推断结论
2 0.05,1
3.84
P>0.05….
• n ≥ 40,且Tmin ≥ 5时,用2检验基本公式和专用公式
• n≥ 40,但1≤Tmin<5时,用2检验校正公式 • n<40,或Tmin<1时,或P≈α用四格表Fisher确切概率法
校正公式:
2 c
( A T 0.5)2 T
( ad bc n)2 n
2 c
(a
b)(c
d )(a
阴性
b d
b+d
合计
a+b
c+d a+b + c+d
2
(ad bc)2 n
, 1
(a b)(c d )(a c)(b d )
为了不计算理论频数T, 可由基本公式推导出,直接由各 格子的实际频数(a、b、c、d)计算卡方值的公式:
基本公式abc
❖(3) 确定P 值,作出推断结论
查2界值表:
2 0.05,1
3.84
2 0.025,1
5.02
2 0.01,1
6.63
故P < 0.01,按=0.05的检验水准,拒绝 H0,接受H1,差别有统计学意义,可认为 女生的患病率高于男性。
二、四格表资料2检验的专用公式
组别 A组 B组
最新第十六章分类变量的统计介绍教学讲义PPT课件

医学统计学
第十六章 分类变量的统计分析 主讲:黄志碧
第一节 常用的相对数
对分类变量进行统计描述常采用相对数。
收集到的分类资料,首先表现为绝对数。 绝对数说明事物发生的实际水平,是进行统 计分析的基础,但不便于事物进行深入地分 析比较。
一、率
率(Rate)又称频率指标,是指在一定 时间内发生某现象的观察单位数与可能 发生该现象的总观察单位数之比。它说 明某现象发生的频率或强度。
率
发生某现象的观察单位数 可能发生该现象的观察单位总数
K
K为比例基数,可以是百分率(%)、千分率 (‰)、万分率(1/万)或十万分率(1/10万), 可根据习惯或使计算出的率保持一、二位整数。
习惯用法:
人口出生率、死亡率、自然增长率、婴 儿死亡率等采用千分率;
肿瘤的死亡率采用十万分率。
注意
计算率时,注意分母和时间。只有可 能发生某事件的观察单位才能做分母。时 间一般以年为间期,也有月、周等。
总
体
抽样误差
抽样
p
样 本
p
统计推断
1、率的抽样误差
在率的抽样研究中,由于总体中存在个 体变异,所以由抽样得到的样本率(P)与
总体率( )之间存在差异,这种差异称
抽样误差。 在抽样研究中,抽样误差是不可避免
的,但可以用统计方法计算或估计其大小。
总体均数=
标准差=σ
n , p1
n , p2 …
n , pn
医院
有转移
无转移
甲医院 710/755=0.940 45/755=0.060
乙医院 83/383=0.2167 300/383=0.7833
5、率或构成比的比较要做假设检验。
预防医学-分类变量的统计分析PPT

9
某正常人的白细胞分类计数构成比
白细胞分类 中性粒细胞 淋巴细胞 单核细胞 嗜酸粒细胞 嗜碱粒细胞
合计
分类计数 140 50 5 4 1 200
构成比(%) 70.0 25.0 2.5 2.0 0.5
100.0
10
构成比的特点
各组成部分的构成比之和 为100%。
特
点
事物内部某一部分构成比发生 变化,其它部分的构成比也相
20
第三节 率的标准化法
率的标准化的概念与基本思想:
为了消除相比较组间因内部构成不同对所比 较指标的影响,采用统一的标准构成对总率进行 调整,使算得的标准化率具有可比性,得出科学 的结论。
21
甲、乙两医院的治愈率
科别
住院人数
甲医院 乙医院
内科 1500
500
外科 500 传染病科 500
1500 500
前已算得 S p 00..000388,则其95%CI为:
p 1.96Sp = 0.90.±041.916.×960.003.0=0(880.(8401.022,280,.9508.085)72)
即该新药有效率95%置信区间为84.12%~95.88%。
43
2.查表法
如果n、p不满足上述条件(n≤50),可根据二 项分布的原理估计总体率的置信区间。
计算
构成比=
事物内部某一组成部分的观察单位数 事物内部所有组成部分的观察单位总数
100%
8
2000年某医院某病的住院人数和死亡人数
病情严重程度 住院人数 病死数 死亡构成(%) 病死率(%)
轻
300
12
26.7
4.0
中
350
《预防医学》分类变量资料的统计分析PPT

1
当 b+c <40 时 : 2 (| b c | 1)2 ,
bc
1
❖ 行×列(R×C)表资料的 2 检验
适用于成组设计的二项或多项分类资料 (1) 公式选用条件:不能有一个格子的 T < 1 ,且
1T5 的格子数不超过总格子 数的1/5
专用公式为: 2 n( A2 1) nr nc
分类变量资料的统计分析
一、 2 –test的主要用途
➢推断成组设计两个总体率或构成比有无差别 ➢推断配对设计两个总体率有无差别 ➢推断成组设计多个总体率或构成比有无差别 ➢双向有序分类资料的关联性检验(相关分析) ➢检验频数分布的拟合优度
二、 2 –test的基本原理 四格表资料 表1 两组人群尿棕色素阳性率比较
疗法 药物 安慰剂 合计
发生 不发生
合计
62 (58.62) 79 (82.38) 141
12 (15.38) 25 (21.62)
3774Biblioteka 104178发生率 (%) 43.97 32.43 35.96
实际频数Arc
列合计数nC
行合计数nr
理论频数Trc:Trc
nr nc n
周边合计数
四格表资料的一般形式
❖四格表资料的 2 检验
专用公式
适用于成组设计的二项分类资料
• 当 n40 且所有 T5 时: 2
(ad bc)2 n
(a b)(c d)(a c)(b d)
基本公式为: 2 (A T )2 T
• 当 n40 但有 1T<5 时: 2 (| ad bc | n / 2)2 n
1)增大样本例数使理论频数增大 (首选) 2)删去理论数太小的行或列 3)将理论数太小的行或列与性质相近的邻行或
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统统计计分分析析
统计描述
统计推断
内容
• 率的抽样分布 • 率的抽样误差与标准误 • 总体率的置信区间估计 • 两个率比较的U检验 • X2检验
要求
掌握: •U检验适用条件 •x2检验的用途、四格表资料(配对资料)的x2检验应 用条件 •行×列表资料的x2检验及其注意事项; 熟悉: •U检验计算方法 •x2检验计算方法 了解: •率的抽样分布、x2分布
P(2)=0.3087 P(3)=0.1323 P(4)=0.0283 P(5)=0.0024
• 二项分布的形状取决于π和n的大小,高 峰在m=np处。当p接近0.5时,图形是对 称的;p离0.5愈远,对称性愈差,但随着 n的增大,分布趋于对称。当n→∞时, 只要p不太靠近0或1,特别是当nP和n(1 -P)都大于5时,二项分布近似于正态分 布。
二、两样本率的比较
1、正态近似法
n足够大,p或1-p均不太小(np和n(1-p)均 大于5)。
up1p2
p1p2
Sp1p2
pc(1pc)(n11
1) n2
pc
X1 n1
X2 n2
例10-8
为了解某地小学生蛔虫感染率的城乡差异,抽样调查 了该地小学生,其中城镇小学生8207人,粪检蛔虫卵 阳性数701人,蛔虫感染率为8.54%,乡村小学生 14585人,粪检蛔虫卵阳性数2167人,蛔虫感染率为 14.86%,试比较该地小学生蛔虫感染率城乡之间有
问该院直肠癌患者围术期并发症发生率与一般情况 有无差异。
H0:π= π0 H1:π≠ π0 α=0.05
P=0.26
u p0
0.300.26
1.713
0(10) 0.3(10.3)
n
385
查t界值表中υ为∝对应的界值,得P> 0.05,按α=0.05水准,不拒绝H0,尚不 能认为该院认为该院直肠癌患者围术期 并发症发生率与一般情况不同
一、率的抽样分布
• 在医学领域中,有一些随机事件是只具有两种 互斥结果的离散型随机事件,称为二项分类变 量(dichotomous variable),如对病人治疗结 果的有效与无效,某种化验结果的阳性与阴性 ,接触某传染源的感染与未感染等。二项分布 (binomial distribution)就是对这类只具有两 种互斥结果的离散型随机事件的规律性进行描 述的一种概率分布。
1 n2
)
0.08540.1486
0.0046
0.1258(10.1258)
1 8207
145185
查t界值表中υ为∝对应的界值得, P< 0.01,按α=0.05水准,拒绝H0,接受H1, 可认为该人群HBV感染率有性别差异。
第三节 x2 检 验
卡方检验(Chi-square test )主要用于分 类资料的统计分析,研究的变量是分类变量, 而观察值以频数表示。
总体率95%的可信区间为:
查表法
p1.96sp
总体率99%的可信区间为:
正态近似法
p2.58sp
p1.96sp
例 试估计例10-6中结核菌素试验阳性 率的95%和99%的置信区间。 已知阳性率0. 3847,标准误为0.0116
( 0 .3 8 4 7 1 .9 6 0 .0 1 1 6 ) , ( 0 .3 8 4 7 1 .9 6 0 .0 1 1 6 ) 0 .3 6 2 0 ~ 0 .4 0 7 4
该方法可用于推断两个及多个总体率(或构 成比)之间有无差别、分类资料的关联度分 析以及频数分布的拟合优度检验等。
一 、x2 检验的基本思想 (chi-square test for fourfold data)
四格表x2检验的基本结构
发生数
未发生数
合计
A组
a
b
a+b
B组
c
d
c+d
合计
a+c
b+d
n
X2检验的基本思想
例10-9 某医生欲比较甲、乙两种药物对动脉 粥样硬化的疗效,甲药治疗71例,有 效52例,乙药治疗42例,有效39例。 问两种药物的有效率是否有差别?
P(X) n! X(1)(nX)
X!(nX)!
• 例10-5 已知①π=0.3,n=5; ②π=0.3, n=10; ③π=0.3,n=15; ④ π=0.5,n=10 。求阳性事件的概率并作概率分布图。
P (0) 5! 0.30(10.3 )(5 0)0.1681 0!(50)!
P (1 ) 5! 0.31(10.3)(5 1)0.3602 1!(51 )!
率的抽样分布特征:
1、为离散型分布 2、π为0.5时,呈对称分布 3、当n不断增大时,二项分布逐渐逼近正
态分布 • 当nP和n(1-P)都大于5时,二项分布近
似于正态分布。
二、率的抽样误差和总体率的估计
一、率的抽样误差和标准误(sampling error and standard error of rate)
p
(1)
n
sp
p(1 p) n
例
结核菌素试验阳性率,检测1773人,结核菌 属阳性者682人,阳性率为38.47%,试计算标准 误。
spp (1 n p )0 .3 8 4 7 1 (1 7 7 3 0 .3 8 4 7 )0 .0 1 1 6
适用于小样本资料
三、总体率的估ran和计t足( 分 间en)(够(n布 表1≤-大pe参5)s,0均pt数)i或,大mπ1于查a置-pt5均i二信)o不n项区太of小(np
无差H异0:。π1= π2 H1:π1≠ π2 α=0.05
本例:n1=8207,X1=701,P1=0.0854 n2=14585,X2=2167,P2=0.1486
pcX n1 1 n X 2287 20 01 7 1 24 15 68 750.1258
u
p1 p2
pc
(1
pc
)( 1 n1
( 0 .3 8 4 7 2 .5 8 0 .0 1 1 6 ) , ( 0 .3 8 4 7 2 .5 8 0 .0 1 1 6 ) 0 .3 5 4 8 ~ 0 .4 1 4 6
四、两率比较的u检验
一、样本率与总体率的比较
u p0 p0
p
0(10)
n
例10-7 一般情况下,直肠癌围术期并发症发生率 为30%,现某医院手术治疗了385例直肠癌患者, 围术期出现并发症有100例,并发症发生率为26%,