医学统计学第五章-定性资料的统计描述
医学统计学-3-定性资料统计描述

解决办法
分层比较 率的标准化法 多元统计分析方法
相对数比较时应注意其可比性(二)
在同一地区不同时期资料的相对数比较时,还 应注意其条件有无变化。 例如,不同时期的发病率比较时,应注意不同 时期疾病的登记制度、诊断水平以及平均人口 数的变化。
5、样本率或构成比进行比较时应作假设检验 由于样本率或构成比是样本指标,同样存 在着抽样误差。 在实际工作中,不能根据样本率或构成比 等相对数的数值大小轻易作出结论,应进 行样本率或构成比差异比较的假设检验。
一、相对数的概念
Question:
通过调查得到某年甲地区的小学生中流脑 发病63例,乙地区的小学生中流脑发病35 例。能否认为甲地流脑的发病严重程度高 于乙地? 绝对数63例和35例表示甲地发病比乙地多 28例,能否说明两地发病的严重程度呢?
假设甲地有小学生50051人,乙地有小学生 14338人,求出两地的发病率: 甲地发病率: 63/50051=1.26‰ 乙地发病率: 35/14388=2.44‰ 乙地区的发病率是甲地区的两倍多。 以上两个发病率为通过绝对数求得的相对 数,用来表示事物出现的频率或强度,便 于比较。
分类资料的统计描述
用率、构成比和相对比等指标来对分类资 料进行统计描述。 由两个有联系的指标之比组成,统称为相 对数。 常用相对数包括率、构成比和相对比。
二、常用相对数
1、率(rate)
又称频率指标。 某现象实际发生数与可能发生总数之比。 说明某现象发生的频率与强度:
某时期内实际发生某现象的观察单位数 率= ×比例基数(K) 同时期可能发生该现象的观察单位总数
三、标准组的选择
标准组应选择有代表性的、较稳定的、来自数 量较大的人群的指标作为标准。
例如世界的、全国的、全省的、本地区的或本 单位历年累计的数据等;
医学研究生医学统计学定性资料的统计描述

百分比(%) 33.33 20.00 13.33 26.67 6.67 100.00
针刺合谷治疗胃痛的效果
疗效 治愈
例数 59
百分 比
(%)
60.82
有效
23
23.71
无效
15
合计
97
15.46
100.0 0
治愈 有效 无效
二、定性资料的描述指标 ——相对数(Relative number)
相对数:两个有联系的指标(数值)之比
相对比 A B
A和B可以是绝对数、平均数,也可以是相对数 A和B的量纲可以相同,也可以不同 A和B彼此分离,互不重叠或包含
如:人口出生性别比;每千人口的医生数、每千 人口的病床数、每医生的门诊工作量、变异系 数等。
人口出生性别比国际上一般以每出生100个女
性人口相对应出生的男性人口的数值来表示。 一般在102~107之间。
频率型指标
某 病 病 死 率 = 同 同 年 年 某 患 病 该 死 病 亡 总 人 数 数 100 %频率型指标
发病率(incidence rate,IR)表示一定时期 内,在可能发生某病的一定人群中新发生某病 的强度。
患病率(prevalence rate, PR)又称为现患 率,指某时点上受检人数中现患某种疾病的频 率,患病率分为时点患病率(point prevalence rate)和期间患病率(period prevalence rate)。
医学研究生医学统计学定性资 料的统计描述
相关概念
定性资料是指将观察单位按照某种属性或类
别进行分组,然后计数各组的观察单位个数 所收集的资料。
根据变量类别之间是否有顺序、等级、大小 关系,分为无序分类变量资料和有序分类变 量资料。
医学统计学(第二版)思考与练习答案

离散程度指标四分位数间距= (mmol/L)
三、最佳选择题
1.B2. E3. B4.C5. D6.E7.A8.D9. D
四、综合分析题
1.解:输出结果
图4-4尿总砷的频数分布图
由图4-4可见,该资料集中位置偏向左侧,为正偏态分布,考虑作对数变换。
输出结果
图4-5尿总砷对数的频数分布图
2.样本均数的抽样分布的特点有:①各样本均数未必等于总体均数;②样本均数之间存在差异;③样本均数服从正态分布;④样本均数的变异范围较原变量的变异范围小;⑤随着样本含量的增加,样本均数的变异范围逐渐缩小。
3.标准差与标准误的区别在于:①计算公式:标准差为 ,标准误为 ;②统计学意义:标准差越小,说明个体值相对越集中,均数对数据的代表性越好;而标准误越小,说明样本均数的分布越集中,样本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大;③用途:标准差用于描述个体值的变异程度,标准误用于描述均数的抽样误差大小。
COPD患者的经常吸烟率比非COPD患者高26.69%
还需进一步对 作假设检验(见第十一章),若经检验有统计学意义,可以认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。
输出结果
2.解:
表5-4某地居民1998~2004年某病死亡率(1/10万)动态变化
年份
符号
死亡率
绝对增长量
发展速度
增长速度
累计
二、案例辨析题
该结论不正确。因为该医生所计算的指标是构成比,只能说明98例女性生殖器溃疡患者中,3种病原体感染所占的比重,不能说明女性3种病原体感染发生的频率或强度,该医生犯了以构成比代替率的错误。
三、最佳选择题
医学统计学重点总结

综合练习
三类资料
(1) 定量资料(quantitative data) 以定量值表达每个观察单位的某项观察指标, 如血脂、心率等。 特点:
① 各观察单位间只有量的差别; ② 数据间有连续性。
三类资料
(2) 定性资料(qualitative data) 以定性方式表达每个观察单位的某项观察指标, 如血型、性别等。 特点:
举例 血型(A、B、O、AB) 人群中某病发生与否(发生、不发生)
描述指标: 相对数
率 构成比 相对比
常用相对数(1)
率(rate),又称频率指标,说明某现 象发生的频率和强度。(强度相对数)
率 = 可 实 能 际 发 发 生 生 某 某 现 现 象 象 的 的 观 观 察 察 单 单 位 位 总 数 数 比 例 基 数
比 A B
四格表(fourfold table)的概念
a
b
c
d
这四个格子的频数是整个表的基本数据,其 余数据都是从这四个基本数据推算出来的,这 种资料称为四格表资料。
2检验的基本思想
如果H0假设成立,则实际频数( actual
frequency)与理论频数应该比较接近。
如果实际频数与理论频数相差较大,超出了
区别
r 没有单位,b有单位;所以,相关系数与单位无 关,回归系数与单位有关;
相关表示相互关系;回归表示依存关系; 对资料的要求不同:
当X和Y都是随机的,可以进行相关和回归分析; 当Y是随机的(X是控制的),理论上只能作回归而不能作相关分析
;
实验研究的基本要素
处理因素:作用于受试对象,要求在实验过 程中观察其处理的因素
两样本比较的秩和检验(基本原理) Wilcoxon符号秩和检验(基本原理)
医学统计学:定性数据统计描述、统计图表

表1 某社区不同性别人群肺癌情况
性别
检查人 有病人 死亡人 死亡率 发病率
数
数
数
(%) (%)
男
1050
6
3
50.0
0.6
女
950
3
2
66.7
0.3
合计
2000
9
5
58.4 0.45
▪ 请讨论: ▪ 1)该医生所选择的统计指标正确吗? ▪ 2)该医生对指标的计算方法恰当吗? ▪ 3)应该如何作适当的统计分析?
25.73
(1.35)
172
42
(24.42)
(149.14) (6.11)
(342)
32
(9.36)
(341.48) (36.50)
715
90
12.59
(53.86)
(4.28)
▪ 根据最后三栏结果作简要分析。
▪ 由第⑸栏:40~岁组恶性肿瘤死亡占总死亡比重最高,近1/4; 20~岁组次之,占19.05%;60~岁组恶性肿瘤死亡人数虽多, 但仅占总死亡的9.36%;0~岁组恶性肿瘤死亡占总死亡比重 最低,仅占2.90%。
3.常用统计图的适用资料及实施方法
图 形 适用资料
实施方法
直条图 组间数量对比 用直条高度表示数量大小
直方图
百分条 图
饼图
线图
散点图
箱式图
定量资料的分 布 构成比
构成比
定量资料演变 水平 双变量间的关 联 定量资料取值 范围
用直条的面积表示各组段的频数或频率
用直条分段的长度表示全体中各部分的构 成比 用圆饼的扇形面积表示全体中各部分的构 成比 线条位于横、纵坐标均为算术尺度的坐标 系 点的密集程度和形成的趋势,表示两现象 间的相关关系 用箱体、线条标志四分位数间距及中位数、 全距的位置
04-医学统计学定性数据的统计描述

人年发病率(/10万) 278.36 12.34 24.23
RR=278.36/12.34=22.56,说明EB病毒抗体阳性鼻咽癌发病率是抗体 阴性发病率的22.56倍。
相对比 比数比(odds ratio,OR),用于流行病学中病例对 照研究资料。
病例组的暴露比数 a / b ad OR 对照组的暴露比数 c / d bc
概 述
标准化率(standardization rate),是为了在比较两 个不同人群的患病率、发病率、死亡率等资料时,消 除内部构成(如年龄、性别、工龄、病程长短等)不 同而不能直接比较所产生的影响。 标准化率仅用于相互比较,不代表实际水平;当标 准构成不同时,标准化率一般也不相同。
标准化直接法的计算步骤 a、标准化直接法的计算方法
治愈率(cure rate),表示接受治疗的病人中治愈的频 率。
治愈病人数 治愈率 100% 接受治疗病人数
相对数的使用注意
a、区别构成比和频率 ★频率,强度相对数;构成比,结构相对数。 b、使用相对数时分母不宜过小 ★如分母太小,用绝对数表示,如“3例中死亡1例”。 c、注意相对数的可比性 ★研究对象要同质,方法要相同,观察时期要一致等。 d、考虑存在抽样误差 ★对总体进行推断应作统计学检验。
率的标准化
构成比 构成比(constituent ratio),表示某事物内部各组成 部分在整体中所占的比重。
构成比 某一组成部分的观察单位 数 100% 同一事物各组成部分的 观察单位总数
【例】
某医院某月各科室住院病人数及死亡人数 因病死亡人 死亡构成 科室 病人数 病死率(‰) 数 (%) 内科 350 25 31.25 71.43 外科 650 30 37.50 46.15 肿瘤科 120 20 25.00 166.67 妇产科 300 5 6.25 16.67 合计 1420 80 100.00 56.34
医学统计学第3版 第5章_定性资料的统计描述讲解

1 甲县
经济困难
1 乙县
没有必要
2 甲县
经济困难
2 乙县
经济困难
3 甲县
经济困难
3 乙县
经济困难
4 甲县
没有必要
4 乙县
经济困难
5 甲县
经济困难
5 乙县
没有时间
6 甲县
Байду номын сангаас经济困难
6 乙县
经济困难
7 甲县 8 甲县 9 甲县 10 甲县
经济困难 没有时间 没有时间 其它
7 乙县 8 乙县 9 乙县 10 乙县
[0,1]
常见率的实质
• 频率(frequency)
– 发生比例,即发生某事件的对象所占的比重 – 说明某事件在群体中的发生频度
• 速率(rate)
– 是单位时间内事件的发生频率 – 说明事件在群体中某时期内的发生强度
相对数的分类
• 根据含义或用途不同可以分为:
– 构成比(Proportion) –率
333
6
306
19
639
• 将观察对象按两个定性变量的类别交叉分 组,统计相应的频数形成的频数表,也叫 R×C表
– 行变量,有R个类别,一般存放处理因素 – 列变量,有C个类别,一般存放观测指标
绝对数
• 该变量某个类别在群体中的发生次数
– 与基数有关:观察总次数(或观察对象数)
• 不便于相互比较分析
– 构成比:将事物每个部分的构成比结合在一起, 说明事物的内部构成情况
–率
• 频率(发生比例):说明事物发生频度 • 速率:说明事物单位时间的发生强度或速度
– 比:说明事物间的对比关系或密度情况
应用相对数应注意的问题
卫生统计学复习题及参考答案

卫生统计学复习题及参考答案第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。
2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。
3、举例说明小概率事件的含义。
答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。
(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。
(4)整群抽样:优点是易于组织和操作大规模抽样调查;缺点是抽样误差大。
3、调查设计包括那些基本内容?答:(1)明确调查目的和指标(2)确定调查对象和观察单位(3)选择调查方法和技术(4)估计样本大小(5)编制调查表(6)评价问卷的信度和效度(7)制定资料的收集计划(8)指定资料的整理与分析计划(9)制定调查的组织措施4、调查表中包含那几种项目?答:(1)分析项目直接整理计算的必须的内容;(2)备查项目保证分析项目填写得完整和准确的内容;(3)其他项目大型调查表的前言和表底附注。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
就诊人数
50 40 0.0 4.0
6.0
16
第二节 应用相对数的注意事项
• 计算相对数分母不宜过小 。
• 正确区别构成比和率的意义 。
• 正确计算合计率 。 • 注意资料的可比性。 • 样本率(或构成比)的也存在抽样误差。 • 有些场合最好使用绝对数
问题的提出
某单位不同岗位职业疾病情况
岗位
A B
疾病人数
17 30
C
D 合计
73
27 147
C岗位的病例数最多,因此列为整改主要岗位!
问题的提出
某单位不同岗位职业疾病情况
岗位
A B
调查人数
74 64
疾病人数
17 30
患病率(%) 22.97 46.88
C
D 合计
183
43 364
73
27 147
n
平均增长速度=平均发展速度-1=
an -1 a0
第四节 率的标准化法
• 标准化法的意义和基本思想。 • 标准化率的计算。
• 应用标准化法的注意事项。
一、标准化法的意义
• 标准化法的基本思想是:采用某影响因素的统一标准构 成以消除构成不同对合计率的影响,使通过标准化后的 合计率具有可比性。
医大 性别 调查 人数 2000 2000 4000 吸烟 人数 216 5 221 吸烟率 (%) 10.80 0.25 5.53 调查 人数 1500 2500 4000 师大 吸烟 人数 180 30 210 吸烟率 (%) 12.00 1.20 5.25
直接法标准化率的计算
使用人口构成为标准直接法计算标准化治愈率(%)
病型
标准人 口构成 (Ni/N)
0.5 0.5
A疗法
原治愈率 (Pi) 85.0 65.0 分配治愈率 (Ni/N)Pi 42.5 32.5 原治愈率 (Pi) 85.0 65.0
B疗法
分配治愈率 (Ni/N)Pi 42.5 32.5
三. 平均速度指标
• 平均发展速度:各环比发展速度的几何均数,说 明某事物在一个较长时期中逐年平均发展变化的 程度。
n
平均发展速度=
an an 1 an 2 a1 …… an 1 an 2 an 3 a0
n
an a0
三. 平均速度指标
• 平均增长速度:各环比增长速度的平均数,说明 某事物在一个较长时期中逐年平均增长程度,计 算方法为各环比平均发展速度-1(注意:不可由计 算各期的环比增长速度的几何均数求得)。
轻型 重 型
合 计
1.0
—
75.0
—
75.0
直接法标准化率的计算
直接标注化法的使用
• 已知内部各组成的率(已有) • 可以计算内部各组成的率(已知率的分子与分母) • 标准人口数或人口构成的选择
• 大人群,稳定的通用标准:世界、全国、全省、某地区各组分的人口数或构成 • 比较人群的合并:将要比较的人群的各组分人口数合并,或计算多个人群各组分 的合并构成
医学统计学
Medical Statistics
第五章. 定性资料的统计描述
福建医科大学公共卫生学院 流行病学与卫生统计学系 林征 2016.2
主要内容
第一节 常用相对数指标
第二节 应用相对数的注意事项 第三节 动态数列及其应用 第四节 率的标准化法
分类资料
• 分类变量的取值为某种属性,例如: • 血型(A、B、O、AB) • 人群中某病发生与否(发生、不发生) • 性别(男性、女性) • 视力等级(差 、中、好) • 这些变量值无法直接进行统计运算,通常的做法是按照类别进行 统计汇总,分别计算每一个类别的观察单位数,即某个分类的频 数 • 将上述频数绘制成频数分布表
A疗法 病 型 病人数 轻型 重 型 合 计 80 120 200 治愈数 68 78 146 治愈率(%) 85.0 65.0 73.0 病人数 100 60 160 B疗法 治愈数 85 39 124 治愈率(%) 85.0 65.0 77.5
直接法标准化率的计算
使用人口数为标准直接法计算标准化治愈率(%)
• 任选待比较人群之一:选择待比较的任意一个人群,使用该人群的各组分的人口 数或构成
三、应用标准化法的注意事项
• 标准化法只适用于内部构成不同影响到总率(合计率) 且各组分的率“平行”变化,如果内部各组分的率存在 “交叉”,慎用标准化法。
• 由于选择的标准不同,算出的标准化率也不同,但比较 的结论趋势一致。 • 标准化后的标准化率,已经不再反映当时当地的实际水 平,它只表示两组相互比较的资料间的相对水平。 • 样本标准化率也存在抽样误差,也需要进行假设检验。
年份 2000 2001 2002 …… 2008 2009
符号 a0 a1 a2 …… a8 a9
死亡率 (1/千人) 32.2 30.0 29.2 …… 14.9 13.8
发展速度(%)
定基比
环比
? …… ……
?
2002年的定基发展速度=a2/a0=29.2/32.2=90.7%
2009年的环比发展速度=a9/a8=13.8/14.9=92.6%
男 女 合计
二、标准化率的计算
• 常用的标准化方法有直接法和间接法,二者的使用条件不同
• 直接法计算标准化率 : (1)选择年龄别人口数作标准时。
p' N i pi N
(2)选择年龄别人口构成作标准时。 Ni p ' ( ) pi N
直接法标准化率的计算
两种疗法治疗某病的治愈率比较
病型
标准 治疗人数 (Ni) 180 180 360 A疗法 原治愈率 (Pi) 85.0 65.0 预期治愈数 (NiPi) 153 117 270 原治愈率 (Pi) 85.0 65.0 B疗法 预期治愈数 (NiPi) 153 117 270
轻型 重 型 合 计
• 甲疗法标准化治愈率=270/360=75.0% 乙疗法标准化治愈率=270/360=75.0%
二. 速度
• 速度指标是说明事物发展动态的最主要指标,主要有 发展速度与增长速度。 • 定基发展速度:不同时期的发展水平与某一固定时期 水平之比,表示相对于某时期,当前水平已发展到几 倍;表明现象在一段时期内的总发展速度,因此也称 “总速度”。 • 环比发展速度:当前水平与前一时期水平之比,表明 现象逐期的发展程度;如果间隔仅为一年,该指标又 称为“年速度”。
三、相对比
三、相对比
三、相对比
1500非成年人首次吸烟情况与因气管炎症就诊的情况表
吸烟情况
吸烟 未吸烟 合计
就诊人数
50 40 90
随访人数
500 1000 1500
就诊率(%) 10.0 4.0
6.0
三、相对比
三、相对比
1500非成年人首次吸烟情况与因气管炎症就诊的情况表
吸烟情况
吸烟 未吸烟 合计
符号 a0 a1 a2 …… a8 a9
死亡率 (1/千人) 32.2 30.0 29.2 …… 14.9 13.8
增长速度(%)
定基比
环比
? …… ……
?
2002年的定基增长速度=(a2/a0)-1=90.7%-1= -9.3%
2009年的环比增长速度=(a9/a8)-1=92.6%-1= -7.4%
三. 平均速度指标
• 在分析事物动态发展时,我们使用环比速度反映 逐期的发展或增长速度;在一个较长的时期中, 其逐年的发展或增长快慢不尽相同,因此为了概 括说明事物在一段较长期间的变化速度,需要计 算各环比指标的速度平均数。
• 对应于环比发展与环比增长速度,平均速度指标 也有平均发展速度与平均增长速度。
一.绝对增长量
• 累计增长量:指定时期的指标与某一固定时期指标之 差(定基),说明一段时期内的总增长量。 • 逐期增长量:指定时期指标与之前固定(时间)间隔 指标之差(环比),说明本期比上期增长的绝对数量。 • 请注意:增长量可以是负数。 • 请注意:增长量与增长百分比含义不同,后者等于增 长量/基础水平。
体现疾病严重程度与医疗水平
1、率
二、构成比
二、构成比
某精神病医院2010与2012年精神病的住院情况比较
疾病 抑郁 精神分裂 神经质 其他 合计 2010年 病人数 20 140 20 20 200 构成比(%) 10.0 70.0 10.0 10.0 100.0 2012年 病人数 20 190 20 20 250 构成比(%) 8.0 76.0 8.0 8.0 100.0
第三节 动态数列及其应用
• 动态数列(dynamic series)是指按照一定的时间顺序, 将某事物的统计指标依次排列起来,以便于观察和比 较该事物在时间上的发展变化趋势,以及探寻现象的 发展规律 • 这些统计指标可以是绝对数、相对数或平均数 • 为了研究事物发展过程及其变化规律,我们还需要对 动态数列计算一系列指标;常用的指标有:发展水平、 绝对增长量、发展/增长速度、平均发展/增长速度
39.89
62.79 40.38
C岗位的情况不严重,但由于观测人数最多,所以相应的
病例数也最多!
第一节 常用相对数指标
• 相对数是分类资料的描述性统计指标,是两个有联系指 标之比。 • 常用相对数有率、构成比、相对比。
1、率
常用的率指标
体现病因因素的作用强度
体现疾病的负担
体现疾病对公众健康威胁 的严重程度
二. 速度
• 增长速度:即增长百分比,表明当前水平较基础水 平增长的程度;根据基础的定义,分为定基、环比 增长速度。 • 定基增长速度:定基比发展速度-1。 • 环比增长速度:环比发展速度-1。
• 如果发展速度小于1,则该指标相当于“下降速度”。