定性资料的统计描述

合集下载

医学统计学-3-定性资料统计描述

医学统计学-3-定性资料统计描述

解决办法
分层比较 率的标准化法 多元统计分析方法
相对数比较时应注意其可比性(二)
在同一地区不同时期资料的相对数比较时,还 应注意其条件有无变化。 例如,不同时期的发病率比较时,应注意不同 时期疾病的登记制度、诊断水平以及平均人口 数的变化。
5、样本率或构成比进行比较时应作假设检验 由于样本率或构成比是样本指标,同样存 在着抽样误差。 在实际工作中,不能根据样本率或构成比 等相对数的数值大小轻易作出结论,应进 行样本率或构成比差异比较的假设检验。
一、相对数的概念
Question:
通过调查得到某年甲地区的小学生中流脑 发病63例,乙地区的小学生中流脑发病35 例。能否认为甲地流脑的发病严重程度高 于乙地? 绝对数63例和35例表示甲地发病比乙地多 28例,能否说明两地发病的严重程度呢?
假设甲地有小学生50051人,乙地有小学生 14338人,求出两地的发病率: 甲地发病率: 63/50051=1.26‰ 乙地发病率: 35/14388=2.44‰ 乙地区的发病率是甲地区的两倍多。 以上两个发病率为通过绝对数求得的相对 数,用来表示事物出现的频率或强度,便 于比较。
分类资料的统计描述
用率、构成比和相对比等指标来对分类资 料进行统计描述。 由两个有联系的指标之比组成,统称为相 对数。 常用相对数包括率、构成比和相对比。
二、常用相对数
1、率(rate)
又称频率指标。 某现象实际发生数与可能发生总数之比。 说明某现象发生的频率与强度:
某时期内实际发生某现象的观察单位数 率= ×比例基数(K) 同时期可能发生该现象的观察单位总数
三、标准组的选择
标准组应选择有代表性的、较稳定的、来自数 量较大的人群的指标作为标准。
例如世界的、全国的、全省的、本地区的或本 单位历年累计的数据等;

定性资料的统计描述

定性资料的统计描述
2)分别计算“标准人口”的预期治愈人数 。
37
3)分别计算两种疗法的标准化治愈率 对于新治疗法,标准化治愈率为:
P 预期治愈人数之和 N P N 2 P2 380 1 1 100% 100% 47.5% 标准人口数 N 800
对于传统治疗法,标准化治愈率为:
P 预期治愈人数之和 N P N 2 P2 427 1 1 100% 100% 53.4% 标准人口数 N 800
11085例被访者中吸烟与否这个二分类变量。 描述一个二分类变量的分布只需一个频率就够了。
5
二、常用相对数指标
6
Hale Waihona Puke 一、构成比构成比(proportion):构成指标,表示某一事物内部各组成部 分的比重或分布,常用百分数表示。
某一组成部分的观察单位数 构成比 100% 同一事物各组成部分的观察单位总数
2
3
表5-1的第(1)栏“职业”是一个多分类变量,第(3)
栏显示本次调查的被访者不同职业的频率分布;表5-1的第
(5)栏是本次调查得到的吸烟者在不同职业的频率分布。 频率分布的特点是,定性变量各类别的频率之和为 100%。
4
(二) 二分类变量的频率分布
表5-2是一个二分类变量频率分布,它描述的是例5-1所调查的
total
21
四、常用动态数列指标及其应用
什么是动态数列?
动态数列(dynamic series)是按时间顺序将一系列统计指标(可以是
绝对数,相对数或平均数)排列起来,用以说明事物在时间上的变化和发
展趋势。
常用动态数列分析指标:绝对增长量
发展速度与增长速度 平均发展速度与平均增长速度

定性资料的统计描述

定性资料的统计描述


(二)强度型指标
例:某企业2003年有2839名职工,该企业每年都对 职工进行体检,这一年新发生高血压病人5 例,2003年的高血压发病率为多少?
(三)相对比型指标

概念:任何两个相关联的指标A,B之比。 计算公式: 口学中的出生性别比例: 男性人口/女性人口= 19456/18340 = 1.06, 即每出生1个女婴,就有1.06个男婴出生。
分母的近似计算
假定当年每位去世者平均活了半年,每位出生 者也平均活了半年,则有: 当年全人口存活的总人年数=年初人口数×1年-去世 人数×0.5+出生人数×0.5 或 当年全人口存活的总人年数=年终人口数×1年 +去世人数×0.5—出生人数×0.5
上面两个等式相加,便有 当年全人口存活的总人年数=(年初人口数+年终人 口数)/2×1年=当年平均人口数×1年 或 当年全人口存活的总人年数=当年年中人口数 × 1年
构成比的特点
1、各构成部分的相对数之和为100%;
2、构成比的各构成部分之间存在着相互影响。
二、常用的相对数指标
用频率分布全面反映一个定性变量外,有时也可 用其他相对数指标从某个侧面来描述定性变量。 常用相对数指标大致有三种类型: 频率;强度;相对比
(一)频率型指标


频率型指标:最常见,表示某现象发生 的频率大小。 计算公式:
2、A、B也可以是相对数,如甲、乙两地的恶性肿瘤死亡率
分别是89.2/10万和65.1/10万,
则甲地恶性肿瘤死亡率是乙地的89.2/65.1=1.37(倍)。
3、A、B 可以是性质相同的两个指标,如上例甲、乙两地恶 性肿瘤死亡率相比,
也可以是性质不同的两个指标,如某医院每张病床配备的
医生人数: 368名医生/2800个床位=0.13

定性资料统计描述

定性资料统计描述
OR P1 /(1 P1) P0 /(1 P0)
P1为病例组的暴露比例或在暴露状态下的发病率 P0为对照组的暴露比例或在非暴露状态下的发病率
Odds ratio
例4-4 母亲围孕期是否有发热或感冒病史与婴儿 神经血管畸形关系的病例对照研究的资料如下表 所示。试计算母亲围孕期是否有发热或感冒病史 引起婴儿神经血管畸形的比数比。
率某某 事事 物物 或或 现现 象 有 象 际 发 可 发 数 生 能 生 比 的 数 的 例 所实 基数
Rate
公式中的“比例基数”通常依据习惯而定。
需要注意的是,率在更多情况下是一个具有时间 概念的指标,即用于说明在某一段时间内某现象 发生的强度或频率,如出生率、死亡率、发病率 、患病率等,这些指标通常是指在1年时间内发 生的频率。
R R P1 P0
P1为暴露组的发病率;P0非暴露组的发病率。
Relative risk
例4-3 某地市区非吸烟女性饮酒者和不饮酒者 的肺癌发病资料如下表所示,试计算其相对危 险度。
表4-2 某地市区非吸烟女性饮酒者和不饮酒者的肺癌发病资料
饮酒与否
发病数 观察人年数 发病率(1/10万人年)

Odds ratio
四、标准化率
标准化率( standardization rate ):比较两个不 同人群的患病率、发病率、死亡率等资料时,为 消除其内部构成(如年龄、性别、工龄、病程长 短、病情轻重等)对率的影响,可以使用标准化 率。
Standardization rate
例4-5 试对下表资料计算甲乙两个医院的标准化
P0
b
b
d
1
P0
b
d
d
由OR计算公式可以得出

定性资料的统计描述

定性资料的统计描述

适用条件:已知被标化组人群年龄别人 口数、死亡总数. 计算公式:

r p P P SMR ni Pi
标准组年龄 别死亡率
被标化组年 龄别人口数
标准化死亡比(SMR)

SMR是观察人群死亡率与总人群(参照人群)
相比较的指标。

计算: SMR=实际死亡数/期望死亡数=D/E
期望死亡数:假定研究人群的年龄别死亡
45.4
SPSS进行标准化率的计算(1)



Transform Compute… Target Variable 框:sp Numeric Expression 框:p1+p2 OK
SPSS进行标准化率的计算(2)

Transform Compute… Target Variable 框:sc1 Numeric Expression 框: sp*c1/p1 OK Transform Compute… Target Variable 框:sc2 Numeric Expression 框: sp*c2/p2 OK
两样本标化率的比较应作假设检验

标准化法注意事项


各年龄组率若出现明显交叉,或非呈平行 变化趋势时,宜比较年龄组死亡率 一般情况下,直接法计算简便,易于了解, 更为常用;如原资料中有些年龄组人口过 少,致使年龄别死亡率波动较大时,宜用 间接法。
标准化率在SPSS中的实现(直接标化法)
表1 甲、乙两院某传染病治愈率/%的比较

率与标准的年龄别死亡率一样,理论上的
死亡人数。
计算标准化率的步骤



根据现有数据的条件选用直接法或间接法 选定标准:标准组应有代表性、稳定、数 据量较大的人群 应用公式计算 必要时,做假设检验

定性资料的统计描述

定性资料的统计描述

25
三、相对比
相对比是互不包含的两个有联系指标之比。 对比的两个指标可以性质相同,也可以性质 不同。 公式为:相对比型指标=A指标 / B指标
注意:在计算相对比中,甲、乙两个指标可 以是绝对数,也可以是相对数或平均数,可 以有不同的量纲,但是互不包含。
27
例: 某年某医院出生婴儿中,男性婴儿为 370人, 女性婴儿为358人,则出生婴儿的 性别比为多少? 性别比为:370 / 358 ×100﹪=103﹪ 说明该医院年每出生100名女婴儿,就有103 名男婴儿出生。
30
2.相对危险度(relative risk,RR)表示在两种相同 条件下某疾病发生的概率之比。即暴露组发病率 与非暴露组发病率的比值。 某地某年男性吸烟和非吸烟的冠心病死亡资料 分组 死亡人数 观察人年数 死亡率 (1/10万人年) 43248 10673 240.5 112.4
吸烟组 104 非吸烟组 12
36
某医院某年住院病人中胃癌患者占5%,则() A 5%是强度指标 B 5%是频率指标 C 5%是相对比指标 D 5%说明胃癌在住院病人 中的比重
37
2.使用相对数时分母不宜过小 某药物 甲治疗100人,50人有效,有效 率为50﹪。药物乙治疗5人,3人有效, 我们能否说乙药有效率为60 ﹪?能否说 乙药比甲药治疗效果好。
9
分娩方式 顺产 助产 顺产 顺产 顺产 剖宫产 顺产 剖宫产 顺产 顺产
妊娠结局 足月 足月 足月 早产 足月 足月 死产 足月 足月 足月
按年龄(2岁一组)与职业整理
年龄 18 20 22 24 26 28 30 32 34 36 38 40 合计 工人 2 9 28 50 50 34 11 14 4 2 3 0 207 管理人员 0 2 7 34 43 35 14 2 2 1 1 0 141 农民 0 6 10 28 25 10 11 3 5 1 1 2 102 商业服务 0 10 24 52 45 34 22 14 3 4 0 0 208

定性资料的统计描述

定性资料的统计描述

an: 报告期指标 a0:基期指标
增长速度:表示的是净增长量。
增长速度=发展速度-1
定基增长速度=定基发展速度-1
环比增长速度=环比发展速度-1
三、平均发展速度和平均增长速度
平均发展速度:各环比发展速度的几何均数, 说明某事物在一个较长时期中逐年平均增长 的程度。
平均发展速度=
n
an a0
平均增长速度:各环比增长速度的平均数, 说明某事物在一个较长时期中逐年平均增长 的程度。
如某专业杂志发文 “252例病毒性肝炎分析”
②不能用构成比的动态分析代替率的动态分析。 表 某市1980年和1990年5种传染病情况
疾病 痢疾 肝炎 流脑 麻疹 1980年
病例数 构成比(%) 病例数
1990年
构成比(%)
3604 1203 698 890 902
49.39 16.49 9.65 12.20 12.36
1、疾病统计资料来源:p40 2、疾病与死因分类 疾病命名: 第三 是给疾病起一个特定的名字,使之可区别 节 于其它疾病。(ICD-10)
疾病 统计 常用 指标
疾病分类:疾病分类是根据疾病的某些特征,按 照一定的编码规则对疾病进行统计分类的方法。

ICD是国际疾病分类英文 (International Classification


150
100.00
1
0%
33.33
20 40%
13.33 60%
26.67 80%
循环系统疾病
6.67 100%
传染病
20%
恶性肿瘤
呼吸系统疾病
消化系统疾病
某医院2001年住院病人5类疾病的死亡情况

定性资料的统计描述

定性资料的统计描述
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
某地居民年龄别癌肿患病情况统计
年龄组 (岁) (1) <30 30~ 40~ 50~ 60~ 总计 人口数 (2)
633000 570000 374000 143000 30250
1750250
癌肿病 人数 (3) 19 171 486 574 242 1492
×100%
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
例:
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
例:白细胞计数和分类构成比 构成比的两个特点: ⑴ 各组成部分的相对数之和为 100%; ⑵ 某一部分所占比重增大,其它部 分会相应地减少。
实际工作中,可用某一期间的平均 人口数来代表人口总数。当人口数 在一年中是均匀变动时,可用以下 两种计算方法:
年平均人口数 = 上年12月31 日人口数 + 本年12月31 日人口数 2
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
年中(7月1日零时)人口数代表全 年的平均人口数。
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
国际统一规定的统计人口数方法: ① 实际制——只统计标准时刻某地 实际存在的人口数(包括临时在 该地的人) ② 法定制——只统计某地的常住人 口数。
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
三、人口死亡统计
死亡统计资料是反映社会卫生状况和居 民健康水平的重要基础资料,也是制订 卫生工作计划、评价卫生服务效果的重 要依据。通过描述和分析不同地区、不 同人群(包括不同性别、不同年龄、不 同职业者)的死亡水平和各种死亡原因 的动态变化,反映社会经济、文化教 育、卫生服务对于居民健康的影响。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

同年内死亡人数 粗死亡率= 1000 0 00 当年平均人口数 1年
强度型指标(近似)
同年<1周岁死亡人数 婴儿死亡率= 1000 0 00 当年活产儿总数
频率型指标近似
同年孕产妇死亡数 孕产妇死亡率= 10万/10万 当年活产儿总数
相对比型指标
统计图表
人口统计指标
例:某医生治疗了4例支气管哮喘病患者, 其中3例有效,即报告有效率为75。
请问该说法是否正确?
某医院统计1985-1990年儿科住院病人疾病种类分 布情况见表:
表 某医院儿科住院病人疾病种类分布情况 疾病种类 先天性心脏病 病人数 250 % 23.8
风湿性心脏病
其它
750
2. 人时资料的描述—强度
流行病学随访研究中,不同个体被观察的时间长度各 不相同,常用人时总和表示被观察的人和时间的总和。 “强度”是流行病学、统计学术语。 ——单位时间内(如年、月、日等)某事件发 生的频率。
某事件发生的个体数 强度型指标 K ( 可能发生某事件的个体 数 时间)
强度型指标通常是指一段时间内的平均概率。如人 时发病率的分子是新发生的事件数,分母是人时 数(观察人数乘以时间)的总和,多用于大人群 长时间随访的资料。
常用的相对数指标大致有三种类型:
频率(relative frequency or proportion)
强度(intensity or rate) 相对比(relative ratio)
主要内容
1. 分类资料的描述—频率和频率分布
2. 人时资料的描述—强度
3. 复合指标—相对比 4. 相对数应用中需注意的问题
新发病例数 人时发病率 观察的人时总数 新发病例数 (折合的观察人数 ( )单 位 时 间 的 个 数 ) 院的院内感染调查中,5031名病 人共观察了127859人日(例均25.4日),其中 有596人在医院发生感染,请计算院内感染率。
596 院内感染率 100% 0.47 0 0日 127859
50
71.4
4.7
结论:我国少年儿童(18岁以下)的风湿性心脏病发 病率约为71.4%。
表 某社区高血压防治干预试验(5年)前后死亡原因变化表
死亡原因 充血性心力衰竭 脑血管病 尿毒症 干预前 23.2 39.6 12.2 干预后 4.3 23.2 9.8
冠状动脉病和心脏病猝死
其它死因 合计
17.1
甲地区流脑发病率:63/50051×1000‰= 1.26‰ 乙地区流脑发病率:35/14338×1000‰= 2.44‰
乙地区流脑流行比甲地区严重√
一、定性资料的频数分布
某医院2001年住院病人5类疾病的死亡情况 百分比(%) 疾病种类 死亡人数 50 33.33 恶性肿瘤 20.00 呼吸系统疾病 30 13.33 消化系统疾病 20 26.67 循环系统疾病 40 10 6.67 传染病 150 100.00 合计 无序分类变量资料
被观察者中实际发生阳 性事件的个体数 阳性率 K 被观察者中所有可能发 生阳性事件的个体总数
阳性率的本质是频率,它是对总体中阳性事件发生概率的 估计。
1.2 多分类资料的描述—频率分布
当事物有多于两种可能的结局时,常用频率分布 (即构成比)来描述结局的规律性。 特点: ⑴各结局的频率总和必为100%。 ⑵某一结局的频率变化必然导致其他部分的变化。
1.5
4.5
被观察者中发生的阳性 数 人时阳性率 K 所有个体尚处于阴性状 态的人时之和
甲方案:1/39.5×100% = 2.53%/年,
乙方案: 1/4.5×100% = 22.22%/年
3. 复合指标—相对比(ratio)
概念:是两个有关联的变量A与B之比,它表 示相对于B的一个(或十个、百个、千个等) 单位,A有多少个单位。或A是B的若干倍或几 分之几。
如某病的出院人数、治愈人数、死亡人数等。
绝对数反映一定条件下某种事物的规模或水平,是
计划或总结工作的依据。


绝对数通常不具有可比性。 因此需要在绝对数的基础上计算相对数。
例:调查得,某年小学生中流脑发病: 甲地区63例,乙地区35例。

甲地区流脑流行比乙地区严重 ×
如已知小学生总人数:甲地区50051人, 乙地区14338人,可算出两个发病率:
某病两种疗法的治愈率(%)的比较
西医疗法组 病例数 普通型 60 治愈数 治愈率 (%) 36 60 中西医结合疗法组 病例数 治愈数 治愈率 (%) 20 13 65
重型
爆发型 合计
20
20 100
8
4 48
40
20 48
60
20 100
27
5 45
45
25 45
两种疗法的病人在疾病类型的频率分布上不一致,可采用率 的标准化方法消除和控制疾病类型对结果的影响。
*注意指标计算时分子和分母的含义
1.分类资料的描述—频率和频率分布
1.1 二分类资料的描述—频率 当事物只有两种可能的结局时,常用频率来描述 结局的规律性。如存活与死亡、患病与未患病、 阳性与阴性等。 频率型指标是最常见的, 通常近似地反映某一事件 出现的机会大小,如发病概率、死亡概率等
实 际 发 生 某 事 件 的 个数 体 频率型指标 K 可 能 发 生 某 事 件 的 个总 体数
统计图表
一、医学人口统计常用指标
65岁及以上的人口数 老年(人口)系数= 100% 人口总数
频率型指标
14岁及以下人口数+65岁及以上人口数 总负担系数= 100% 15~64岁人口数
相对比型指标
人口老龄化的具体标准:
国际上通常把60岁以上的人口占总人口比例达 到10%,或65岁以上人口占总人口的比重达 到7%作为国家或地区是否进入老龄化社会的 标准。
60 20 20 100
36 8 4 48
60 40 20 48
20 60 20 100
13 27 5 45
65 45 25 45
x3 x1 x2 P1 , P2 , P3 n1 n2 n3 x1 x 2 x 3 P ( ) n1 n2 n3 P1 P2 P3 () P 3
建国以后我国老年人口系数(≥ 65 岁)的变化
老年人口 年份 系数 (%) 1949 1953 1959 1964 1975 1978 1982 4.10 4.41 4.90 3.54 4.80 4.80 4.91 1987 1990 1991 1992 1993 1994 1995 年份 系数 (%) 5.48 5.57 5.99 6.09 6.15 6.23 6.70 1996 1997 1998 1999 2000 —— —— 老年人口 年份 系数 (%) 6.94 7.04 7.43 7.63 6.96 —— —— 老年人口
nk 频率 k 100% n1 n2 nk
某医院2001年住院病人5类疾病的死亡情况 疾病种类 恶性肿瘤 呼吸系统疾病 消化系统疾病 循环系统疾病 传染病 合计 死亡人数 50 30 20 40 10 150 频率(%) 33.33 20.00 13.33 26.67 6.67 100.00
定性资料的统计描述
相关概念

定性资料是指将观察单位按照某种属性或类
别进行分组计数所收集的资料。 根据变量类别之间是否有顺序、等级、大小 关系,分为无序分类变量(名义变量)资料 和有序分类变量资料(等级资料)。 定性资料常见的数据形式是绝对数。



绝对数:调查研究和实验研究得到的定性 资料经过整理,清点数目得到的数值。
注意: 分子是分母的一部分; 分子分母量纲相同; 比例无量纲,取值在[0,1] K是比例基数,如100%,也可取为1000‰、1万/1 万和10万/10万等。习惯上保证计算结果的分 子有1-2位整数。
例:某妇产科医生记录了1402名临产母亲的妊娠情况, 结果足月产者1148例。
1148 足月产率 100% 81.88% 1402
例:某班有男生50人,女生20人,男生英 语四级通过率为80%,女生四级通过率为 100%,请问该班四级通过率为多少?
答案1:90%。 答案2:85.7%
相对数进行比较应注意可比性 1.观察对象是否同质,研究方法(如检测手 段、抽样方法)是否相同,观察的时间是否 一致等。 2.其他在专业上认为有意义的影响因素应接 近均衡。
注: 1982、1990、 2000 年的数据是根据 1982 年、 1990 年、 2000 人口普查数据,其余年份数据为人口变动 情况抽样调查推算数
同年内死亡人数 粗死亡率= 1000 0 00 当年全人口存活的总人年数
实践中,因为一年中不断有人去世,又不断有人出生, 分母的精确值很难得到。 假定当年每位去世者平均活了半年,每位出生者也平均活 了半年,则粗死亡率可近似地写成
平均每天有0.47%的病人在医院发生感染。
例2 某医院对同一疾病开展甲、乙两种手术治 疗,分别随机抽取100名患者评价复发率。已知 手术完成时间各不相同,而未复发患者的最后随 访时间均为2006年1月1日。限于篇幅,在下表中 仅给出部分数据,以说明此类资料的统计描述方 法。
两种手术方案的复发率比较(部分数据)

我国1981年第3次人口普查是108; 1989 年第4次人口普查是112;2000年第5次人口普 查高达116,在2008年甚至达到120.56的最高 值, 2012年出生人口性别比为117.7,远超国 际认同的可以容忍的最高警戒线107。
2.2.4 相对数应用中需注意的问题
1)分母数据一般不宜过小 2)防止概念混淆 3)正确合并估计频率(或强度)型指标 4)相对数进行比较应注意可比性
7.9 100.0
相关文档
最新文档