第3讲 定性资料的统计描述

合集下载

定性资料的统计描述课件

定性资料的统计描述课件
proportio
阳性率
被观察者中实际发生阳 性事件的个体数 被观察者中可能发生阳 性事件的个体总数
K
阳性率的本质是频率,它是对总体中阳性 事件发生概率的估计。
1.2 多分类资料的描述—频率分布
频率分布即构成比
当事物有多于两种可能的结局时,常用 频率分布来描述结局的规律性。
特点:
⑴各结局的频率总和等于100%。 ⑵某一结局的频率变化必然导致其它部 分的相应变化。
中性粒细胞
杆状核 0.04-0.5
1-5
分叶核 2-7
50-70
嗜酸粒细胞 0.05-0.5
0.5-5.0
嗜碱粒细胞 0-0.1
0-1
淋巴细胞 0.2-0.4
20-40
单核细胞 0.08-0.8
3-8
合计
4-10
100.00
某医院2019年住院病人5类疾病的死亡情况
疾病种类
死亡人数 频率(%)
恶性肿瘤
50
33.33
呼吸系统疾病
30
20.00
消化系统疾病
20
13.33
循环系统疾病
40
26.67
传染病
10
6.67
合计
150
100.00
2. 人时资料的描述—强度
流行病学随访研究中,不同个体被观察的时间长度经 常各不相同,因此常用人时数总和表示被观察的人和时 间的总和。
强度是流行病学、统计学术语。指单位时间内(如年、 月、日等)某事件发生的频率。
1994 6.23
-
-
1982
4.91
1995 6.70
-
-
注:1982、1990、2000 年的数据是根据 1982 年、1990 年、2000 人口普查数据, 其余年份数据为人口变动情况抽样调查推算数

研究生统计试讲内容 定性资料的统计描述

研究生统计试讲内容 定性资料的统计描述

例 如某地某年龄组男性吸烟和非吸烟的冠心病 死亡资料:
吸烟组
非吸烟组
死亡数
104
12
观察人年数
43248
10673
死亡率(1/10万人年) 240.5
19
112.4
3. 两个相对比之比
例如病例对照研究中的比值比(OR)
例 服用反应停与肢体缺陷关系病例对照研究的资料如下 所示:
表4 服用反应停与肢体缺陷关系病例对照研究
17
1. 两类个体例数之比
R=
A类发生的例数 B类发生的例数
如我国1982年人口普查的男性人口数为 519433369,女性488741919人,求人口数的男 女比例。
R=519433369 1.063 488741919
18
2. 两个率之比
R= P1 P2
RR= 240.5 2.139 112.4
1000
/1000
1.76人 /1000 人年
意味着平均每年有1.76‰的病人将新发高血压
16
(三)相对比型指标
相对比指标:任何两个相关联的变量A与B之比。 相对比型指标=A/B
表示相对于B的一个(或十个、百个、千个等) 单位,A有多少个单位。
A和B可以是绝对数、相对数和平均数。 A和B的量纲可以相同,也可以不同。 A和B互不包含。
43
表3-7 2001年我国部分市县 前五位主要疾病死亡专率及死亡原因构成

呼吸系统 137.42 22.46
脑血管病 112.60 18.95
恶性肿瘤 105.36 17.73
心脏病
77.72 13.08
损伤与中毒 63.69 10.72
城市 死亡专率 构成比

定性资料的统计描述

定性资料的统计描述
–总体内各组构成比的总和应为100%。 – 事物内部各组成部分构成呈此消彼长的局面。
鼻咽癌患者的血型构成 A B AB O 20% 26% 30% 24%
O 24.0%
A 20.0%
30.0% AB
26.0% B
表 5.1 某医院 2003 年各科室收治住院患者的构成情况
科别
病例数
构成比(%)
暴露或特征 病例组 对照组
合计
生饮自来水 未生饮自来水
22(a) 12(c)
255(b) 1194(d)
277(a+b) 1206((b+d)
1483(N)
比 值 比 ( O R ) 病 对 例 照 组 组 暴 暴 露 露 的 的 比 比 值 值 a b d c 2 5 2 5 2 // 1 1 1 2 9 4 8 .5 8
例2
某医院统计2019-2000年儿科心血管病房住 院病人疾病种类分布情况见表2:
表2 某医院儿科心血管病房住院病人
疾病种类分布情况
疾病种类
病人数 %
先天性心脏病
250
23.8
风湿性心脏病 其它
750
71.4
50
4.7
结论: 我国少年儿童(18岁以下)的风湿性心脏 病发病率约为71.4%
例3 :见表3
相 对 危 险 度 ( R R ) 非 一 一 线 线 作 作 业 业 工 工 人 人 发 发 病 病 率 率 ( ( p p 1 ) 2 ) 3 7 1 3 . . 2 5 5 3 / / 万 万 2 .3 5
p1=5/680=73.53/万 p2= 1/320= 31.25/万
16.49
1143
21.33

定性资料的统计描述幻灯片PPT

定性资料的统计描述幻灯片PPT

Standardization rate
1.标准化直接法的计算方法
P ' N 1 P 1N 2P 2N kP k N iP i
N
N
式中P’为标准化率,N1 , N2 ,…Nk为某一影响因素 (如病型、年龄等)标准构成的每层例数,P1 , P2 ,…Pk为原始数据中各层的率,N为标准构成的总
例数。上式也可写成:
Odds ratio
四、标准化率
标准化率( standardization rate ):比较两个不同 人群的患病率、发病率、死亡率等资料时,为消 除其内部构成(如年龄、性别、工龄、病程长短 、病情轻重等)对率的影响,可以使用标准化率 。
Standardization rate
例4-5 试对下表资料计算甲乙两个医院的标准化
定性资料的统计描述幻灯片PPT
本PPT课件仅供大家学习使用 请学习完及时删除处理 谢谢!
第四章 定性资料的统计描述
计量资料(定量资料) 统计资料类型:
计数资料(定性资料)
计数资料:先将研究对象按其性质或特征分类,再 分别计数每一类的例数。
描述定性资料的数据特征,通常需要计算相对数。 根据不同的研究目的,常用率、构成比、相对比等 指标来进行统计描述。
需要注意的是,分母中所规定的平均人口是指可 能会发生该病的人群。
Prevalence rate
2.患病率: 也称现患率,表示某一时点某人群人口 中患某病的频率,通常用来表示病程较长的慢性 病的发生或流行情况,其计算公式为
某 病 患 病 率 某 该 地 地 某 同 时 期 点 内 某 平 病 均 患 人 病 口 例 数 数 比 例 基 数
三、相对比
相对比( relative ratio ):相对比是A、B两个有关 联指标值之比,用以描述两者的对比水平,说明 A是B的若干倍或百分之几,通常用倍数或分数表 示。这两个指标可以是性质相同,如不同时期的 患病人数;也可以是性质不同,如体重与身高的 平方之比(体重指数,BMI)。其计算公式为

第三讲 定性资料的统计描述

第三讲 定性资料的统计描述

18
习题
1.某调查显示,某病患者100人,其中男性80人,女性 20人,分别占80%和20%,则结论为:
A.该病男性易得 B.该病女性易得 C.该病男女患病程度相等 D.该资料可以计算出男女性的患病率 E.尚不能得出有关患病情况的结论
2.某诊所称称专治某疑难杂症,其宣称“本诊所收治10 名患者,治愈8名,治愈率高达80%”,对此如何评 价?
6
1.频率型:

说明某现象发生的频率。用于反映某事物或现 象发生可能性大小,常称作率。率越高,事物 发生的可能性越大。
发生某现象的观察单位数 率 K 可能发生某现象的率、病死 率、治愈率。总体率用π表示,样本率用P表示。
7
2.结构型

构成指标,说明某一事物内部各组成部分所占 的比重,常以百分数表示。也称作构成比。
第二节 率的标准化

一、标准化的意义 率的标准化是为了在比较两个不同人群的 患病率、发病率、死亡率等资料时,消除 其内部构成(如年龄、性别、工龄、病程 长短等)的影响,使之具有可比性。
13
二、标准化率的计算—直接法



1.标准人口的选取方法: 选取一个包含比较各组的有代表性的、 较稳定的、数量较大的人口为标准。如 世界的、全国的、全省的或本单位历年 积累的数据。 取比较各组的各层例数的合计为标准。 从比较的各组中任选其一为标准。
某一部分的观察单位数 构成比 100% 同一事物各组成的观察单位总数


举例:300人中,A型血40人,B型血200人,O 型血40人,AB型血20人,那么B型占66.7%。 特点:各部分构成比之和为1
8
三、速率(rate)

强度型指标,与比率的最大区别是分母中含 有时间,反映单位时间内某事件出现的可能 性大小。多用于面向人群的出生、死亡和发 病资料的统计 。

(完整)定性资料的统计描述3精品PPT资料精品PPT资料

(完整)定性资料的统计描述3精品PPT资料精品PPT资料
死亡、迁移及常住人口婚姻状况变动、分居、合居、失踪、寻回、收养、认领等引起户口变动方面的登记。
二、描述人口学特征的常用指标
①实际制(de facto),即只统计标准时刻某地 粗死亡率(crude death rate,简记为CDR)
四、有关生育的常用统计指标 年平均人口数=1/2(上年底人口数+本年底人口数)
年平均人口数=1/2(上年底人口数+本年底人口数)
实际存在的人口数(包括临时在该地的人)。 在标准时刻以后出生的人不应计入,死亡的也不应扣除。
②法定制(de jure),只统计某地的常住人口。
一个国家或地区的人口,随时都有生有死, 有迁入和迁出,处于变动之中。因此,要确定一 个国家或地区的人口数量及各种构成,只能采用 某一时点的资料。按一般惯例,采用一年的中点, 即某年7月1日0时(或6月30日24时)作为标准时 刻来进行统计。例如,我国1990年人口普查结果 人口总数为1133682501人,这就是1990年7月1日0 时我国的人口总数。这一数字包括了在标准时刻 以前出生的人,但不包括标准时刻以前死亡的人; 在标准时刻以后出生的人不应计入,死亡的也不 应扣除。
(二)测量死亡水平的指标
• 1.粗死亡率(crude death rate,简记为CDR) • 2.年龄别死亡率(age-specific death rate简记为ASDR) • 3.婴儿死亡率(infant mortality rate,简记为IMR) • 4.5岁以下儿童死亡率(mortality under age 5) • 5.孕产妇死亡率(maternal mortality rate MMR) • 6.死因别死亡率(cause-specific death rate) • 7.死因构成

卫生统计学--定性资料的统计描述 ppt课件

卫生统计学--定性资料的统计描述  ppt课件
RR p1 p2
ppt课件
23
例9 某锡矿为了解一线作业对工人健康的影响,对 1000名新参加工作的工人进行了20年的追踪随访,结果 发现从事一线作业的680名工人有5人发生了肺癌,而从 事非一线作业的320名工人仅1人发生了肺癌。试估计该 锡矿一线作业对肺癌的相对危险度。
一线作业工人肺癌的发病率 p1 5 / 680 73.53 / 万 非一线作业工人肺癌的发病率 p2 1/ 320 31.25 / 万
相对比=
4.48 0.88
/ /
10万 10万
5.1
或相对比=
0.88 4.48
/ /
10万 10万
100%
19.64%
ppt课件
22
RR和OR
相对危险度(relative risk, RR) 是指暴露于某种危险因素 的观察对象的发病危险度与低暴露或非暴露的观察对象 的发病危险度之间的比值。常用于流行病学队列研究中 度量暴露的危险性大小。其计算可用暴露与低暴露或(非 暴露)于危险因素的累积发病率或发病密度(p)估计:
5.09 0 00
余类推。
总发病率=
1233 292605 1000 0 00
4.21 0 00
ppt课件
9
例2 一项有关COPD与吸烟的关系的研究,调查了某 医院1998~2000年收治的COPD患者356人,其中231人 有三十年及以上的经常吸烟史(日平均1支以上),同时调 查本院其它科室收治的同年龄组段的非COPD病人(无其 它呼吸系统疾患)479人,其中有三十年及以上的经常吸 烟史的183人,试计算并比较两组病人的吸烟率。
2007年的36.6/10万。
ppt课件
35
3. 疾病统计常用指标 ① 发病率

chapter3定性资料的统计描述PPT课件

chapter3定性资料的统计描述PPT课件
24
例 某地2003-2005年不同性别新生儿数见下表, 试计算该地不同年份新生儿性别比。
表 7 某地 2003-2005 年新生儿性别比
年 份 新生儿数 男性 女性 性别比
2003
90919 48636 42283 1.15
2004
109671 58908 50763 1.16
2005
125513 66814 58699 1.14
血型
1=A型,2=B型,3=AB 型,4=O型
父亲文化程度 1=文盲,2=小学,3=初 中,4=高中或中专,5=大 专及以上
10
定性资料的统计描述
表3 2010级某班同学性别的分布情况
性别 频数(N) 百分比(%)

54
42.5

73
57.5
合计
127
100.00
11
定性资料的统计描述
频数表
表3 2010级某班同学性别的分布情况
B型
27
21.30
AB型
18
14.20
O型
49
38.50
合计127Βιβλιοθήκη 100.00绝对数
相对数 14
频数图
频数
60 50 40 30 20 10
0 A型
B型
AB型
O型
图2 2010级某班同学血型分布情况
15
表5 2010级某班同学父亲文化程度的分布情况
父亲文化程度 频数
频率
累积频数 累积频率
文盲
0
0
Statistical Inference
Statistical Inference
Statistical description
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 计算公式 • 平均发展速度= 平均发展速度=
指标 分子 分母 基数 类 型 强度型(近似) 强度型(近似 ) 频率型(近似) 频率型(近似 ) 频率型(近似) 相对比 相对比 强度型(近似 ) 频率型(近似 ) 频率型(近似 )
粗死亡率 某年龄组死亡率 婴儿死亡率 新生儿死亡率 围生儿死亡率 5岁以下儿童死亡 率 孕产妇死亡率 某死因死亡率 某病病死率 比例死亡比
构成比(%) 构成比 30.24 25.71 16.42 27.63 100.00
1685 1433 915 1540 5573
恶性肿瘤 其他 合 计
• 对分组资料计算合计率时,不能简单地把各组率 取平均数,而应分别将分子和分母合计,再求出 合计率。例如,某医院消化内科上半年收治250例 胃溃疡患者,治愈200例,治愈率为80.0%;下半 年收治280例胃溃疡患者,治愈238例,治愈率为 85.0%。则该消化内科全年对胃溃疡的治愈率应该 是 200 + 238
• 在构成比指标中,某一组成部分构成比的 增减会影响到其他组成部分构成比的变化。 某地2000年和2005年慢性疾病的发病情况 如表5.4所示:
2000年 年 疾 病 病例数
呼吸系统疾 2671 1711 1964 8923 构成比(%) 构成比 28.88 29.93 19.18 22.01 100.00
1000‰ 1000‰ 1000‰ 1000‰ 1000‰ 1000‰ 10万/10 万 10万/10 万 100% 100%
疾病统计常用指标
指标 某病发病率 分子 时期内新发生的某病病 例数 时点现患疾病人数 分母 年平均人口数 ×1年 年 检查人口数 基数 10万/10 万 万 10万/10 万 万 10万/10 万 万 100% 100% 类型 强度型(近似 强度型 近似) 近似
第三讲 定性资料的统计描述
杨土保 教授 博士 中南大学公共卫生学院 流行病与卫生统计学系 2009-032009-03-06
主要内容
• 常用相对数及其应用 • 应用相对数的注意事项 • 动态数列及其应用 其 • 率的标准化
定性变量的分布特征
定性资料的频数分布
表3-1 某医院2001年住院病人5类疾病的死亡情况
死亡人数 疾病种类 恶性肿瘤 呼吸系统疾病 消化系统疾病 循环系统疾病 传染病 合计 50 30 20 40 10 150
百分比(%) 33.33 20.00 13.33 26.67 6.67 100.00
常用的相对数指标
相对数指标大致有三种类型: 相对数指标大致有三种类型: 频率( 频率(frequency) ) 构成比(proportion) 构成比 相对比(relative ratio) 相对比
同年内死亡人数 同年年龄组死亡人数 同年<1周岁死亡人数 同年<28天死亡人数 同年围生期死胎数+死 产数+<7天死亡人数 同年5岁以下儿童死亡 数 同年孕产妇死亡数 同年内某原因死亡人 数 同年某病死亡人数 同年某死因死亡数
年平均人口数×1年 同年年龄组平均人口数×1年 同年活产儿总数 同年活产儿总数 同年围生期死胎数+死产数+活 产数 同年活产儿总数 同年活产儿总数 同年平均人口数×1年 同年患该病总数 同年内死亡总数
例5.4 为了解新生儿的锌的营养状况,分别测量某 医院足月儿以及早产儿的脐血血清锌含量,结果 显示足月儿及早产儿的脐血血清锌含量的均数分 别为1.85 mg/L和1.41 mg/L,则该医院足月儿与早 产儿的脐血血清锌含量之比为1.85/1.41=1.31,即 该医院足月儿脐血血清锌含量是早产儿的1.31倍 在流行病学研究中,常用的相对危险度(RR)和比值 比(OR)都属于相对比指标。 相对危险度(relative risk, RR) 是指暴露于某种危 险因素的观察对象的发病危险度与低暴露或非暴 露的观察对象的发病危险度之间的比值:
速率 速率指标通常是指一段时间内的平均概率。 速率 强度是单位时段内某现象发生的频率。如 人时发病率的分子是新发生的事件数,分 母是人时数(观察人数乘以时间)的总和, 多用于大人群长时间随访的资料。
某事件发生的个体数 ×K 强度型指标 = ( ∑ 可能发生某事件的个体数 × 时间)
表3-4 人口死亡统计指标
例5.1 为研究吸烟与肺癌的关系,某医生收集 了2003~2005年286例住院肺癌患者的吸烟 史,吸烟的肺癌患者有166例,而同时期同 年龄段的1855名非肺癌患者中,吸烟的有 407例。试计算该资料中肺癌患者与非肺癌 患者的吸烟率。 • 由式(5.1),肺癌患者的吸烟率=166/286 × 100%=58.04% , 非肺癌患者吸烟率=407/1855 ×100%=21.94% ,肺癌患者 的吸烟率比非肺癌患者的吸烟率高36.1%。
发展速度与增长速度 发展速度(speed of development) :表示报 发展速度 告期指标的水平相当于基期水平的百分之 多少或若干倍; 增长速度(speed of increase) :表示的是净 增长速度 增加量。可计算定基比发展速度与环比发 展速度, 增长速度 = 发展速度% - 100% =发展速度-1。
某一组成部分的观察单位数 构成比 = × 100% 同一事物各组成部分的观察单位总数
构成比具有以下特点: 分子是分母的一部分, 构成比具有以下特点:① 分子是分母的一部分,各组成部分构成比数 值在0~1之间波动,各组成部分的构成比数值之和等于 或100%。② 之间波动, 值在 之间波动 各组成部分的构成比数值之和等于1或 。 事物内部各组成部分之间呈此消彼长, 事物内部各组成部分之间呈此消彼长,当其中某一组成部分构成比数 值增大, 值增大,其他组成部分构成比数值必然会减少
• 计算公式
an • 定基发展速度= a0
• 环比发展速度=
an a n−1
平均发展速度和平均增长速度 平均发展速度(average speed of development) :是各 环比发展速度的几何平均数,说明某事物 在一个较长时期中逐年平均发展变化的程 度。 平均增长速度(average speed of increase ) :是 平均增长速度 各环比增长速度的平均数,说明某事物在 一个较长的时期中逐年平均增长的程度。
时点患病率
频率型
期间患病率
时期现患疾病人数
检查人口数
频率型
治愈率 生存率
治愈人数 活满特定时期的人数
接受治疗人数 期初存活的人 数 检查人数
频率型 频率型
残疾患病率
残疾患者人数
100%
频率型
• 构成比 构成比(proportion)即比例,是指事物内 部某一组成部分观察单位数与同一事物各 组成部分的观察单位总数之比,用以说明 事物内部各组成部分所占的比重,常用百 分数表示。计算公式为:
暴露组发病率( p1 ) 相对危险度(RR) = 低暴露(或非暴露)组发病率( p2 )
比值比(OR) = 病例组暴露的比值 a / c ad = = 对照组暴露的比值 b / d bc
应用相对数应注意的事项 防止概念混淆, →防止概念混淆,分析时不能以构成比代替率 →计算相对数时分母应有足够数量 正确地合并估计频率(或强度) →正确地合并估计频率(或强度)型指标 相对数间的比较要具备可比性: →相对数间的比较要具备可比性:观察的对象是否同 研究的方法(如检测手段、抽样方法) 质,研究的方法(如检测手段、抽样方法)是 否相同,观察的时间是否一致等; 否相同,观察的时间是否一致等;被比较的总 体是否具有可比性: 体是否具有可比性:标准化 对相对数的统计推断:参数估计、 →对相对数的统计推断:参数估计、假设检验
250 + 280 × 100% = 82.6%
而不是(80%+85%)/2=82.5%。
动态数列及其应用
动态数列(dynamic series)是一系列按照时间顺序排列 动态数列 是一系列按照时间顺序排列 的统计指标(包括绝对数 相对数或平均数), 包括绝对数、 的统计指标 包括绝对数、相对数或平均数 ,用以反 映事物或现象在时间上的变化和发展趋势。 映事物或现象在时间上的变化和发展趋势。常用的动 态数列分析指标有: 态数列分析指标有:
• 在医学研究中这种情况也常出现,常见的 错误是采用门诊患者或住院患者的资料来 分析疾病与年龄、性别、职业等的关系, 这种资料所计算的相对数指标通常是构成 比,不能当作率来分析。例如,某医师根 据门诊资料分析慢性支气管炎与年龄的关 系,如表5.3所示:
年龄组(岁) 0~ 20~ 40~ 60~ 合计 患者人数 48 74 87 39 248 患者构成比(%) 19.4 29.8 35.1 15.7 100.0
某事件发生的个体数 频率型指标 = ×K 可能发生某事件的个体 数
分子是分母的一部分;无量纲,在0-1范围内 分子是分母的一部分;无量纲, 取值; 是比例基数,通常取为100% 100%, 取值;K是比例基数,通常取为100%,也可取为 1000‰、 /1万和10万/10万等 万和10 万等, 1000 、1万/1万和10万/10万等,根据习惯用法 来决定。如常见的发病率、患病率、病死率、 来决定。如常见的发病率、患病率、病死率、治 愈率等指标, 愈率等指标,都属于频率型指标
• 例5.3 某医院2003年各科室收治住院患者的 构成情况如表5.1所示。
科 别 内 科 外 科 妇 科 儿 科 合 计 850 1133 425 418 2826 病例数 30.08 40.09 15.04 14.79 100.00 构成比(%) 构成比
相对比
之比。 相对比型指标是指任何两个相关联的变量A与B之比。它表示相对 的一个(或十个、百个、千个等)单位, 有多少个单位。 于B的一个(或十个、百个、千个等)单位,A有多少个单位。A和B可 以是绝对数、相对数和平均数, 的量纲可以不同,也可相同, 以是绝对数、相对数和平均数,A和B的量纲可以不同,也可相同,但 A和B互不包含 相对比=A/B 相对比=A/B 最常见:男女性别比;每千人口的医生数、每千人口的病床数、 最常见:男女性别比;每千人口的医生数、每千人口的病床数、每 医生的门诊工作量
相关文档
最新文档