计数资料的统计描述
统计描述与统计推断

统计描述与统计推断统计的主要工作就是对统计数据进行统计描述和统计推断。
统计描述是统计分析的最基本内容,是指应用统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律进行测定和描述;而统计推断是指通过抽样等方式进行样本估计总体特征的过程,包括参数估计和假设检验两项内容。
(一)统计描述1.计量资料的统计描述计量资料的统计描述主要通过编制频数分布表、计算集中趋势指标和离散趁势指标以及统计图表来进行。
(1)集中趋势。
指频数表中频数分布表现为频数向某一位置集中的趋势。
集中趋势的描述指标:1)算术平均数。
直接法:x为观察值,n为个数加权法又称频数表法,适用于频数表资料,当观察例数较多时用。
f为各组段的频数。
2)几何平均数(geometric mean)。
几何平均数用符号G表示。
用于反映一组经对数转换后呈对称分布的变量值在数学上的平均水平。
直接法:加权法又称频数表法,当观察例数n较大时,可先编制频数分布表,用此法算几何平均数:3)百分位数(percentile )与中位数(median )。
百分位数是一种位置坐标,用符号x P 表示常用的百分位数有 2.5P 、5P 、50P 、75P 、95P 、97.5P 等,其中25P 、50P 、75P 又称为四分位数。
百分位数常用于描述一组观察值在某百分位置上的水平,多个百分位结合使用,可更全面地描述资料的分布特征。
中位数是一个特定的百分位数即50P ,用符号M 表示。
把一组观察值按从小到大(或从大到小)的次序排列,位置居于最中央的那个数据就是中位数。
中位数也是反映频数分布集中位置的统计指标,但它只由所处中间位置的部分变量值计算所得,不能反映所有数值的变化,故中位数缺乏敏感性。
中位数理论上可以用于任何分布类型的资料,但实践中常用于偏态分布资料和分布两端无确定值的资料。
其计算方法有直接法和频数表法两种。
直接法:当观察例数n 不大时,此法常用,先将观察值按大小次序排列,选用下列公式求M 。
医学统计学计数资料的统计描述(一)

医学统计学计数资料的统计描述(一)医学统计学计数资料的统计描述计数资料是医学研究中常见的数据类型,例如统计某种疾病的患病人数、治愈人数等。
如何对这些数据进行科学统计描述,成为了医学研究不可避免的问题。
一、计数资料的基本概念计数资料是指由离散数据组成的一种数据类型,这些数据仅取有限个数值,如某类疾病的患病人数(自然数)或治愈人数(非负整数)。
计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述极为重要。
二、计数资料的统计描述1. 频数频数是指计数资料中各取值出现的次数,常以小写字母n表示。
例如患病人数为0的样本数为n0,患病人数为1的样本数为n1,以此类推。
2. 频率频率是指频数与总样本数的比值,常以小写字母f表示。
例如患病人数为0的频率为f0=n0/n,患病人数为1的频率为f1=n1/n,以此类推。
频率可以体现每个取值在样本中的分布情况,是比较常用的统计指标,其和为1。
3. 百分比百分比是指频数与总样本数的比值乘以100,常以百分号表示。
例如患病人数为0的百分比为f0×100%,患病人数为1的百分比为f1×100%,以此类推。
4. 累计频率累计频率是指某一取值及其以下所有取值的频率之和,常以小写字母F 表示。
例如患病人数小于等于3的累计频率为F3=f0+f1+f2+f3。
累计频率可以体现小于等于某个取值的样本在总样本中所占比例。
三、总结计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述有益于研究者更加深入地了解样本的分布情况,进而提出相应的研究假设。
频数、频率、百分比和累计频率是计数资料的常用统计指标,可分析每个取值在样本中的分布情况和各个取值间的差异。
在实际研究中,研究者应根据实际情况选择合适的统计方法进行分析,以期得到更为科学的结论。
计数资料的统计描述

计数资料的统计描述第一节常用相对数一、绝对数定义:计数资料各类别的频数,即各分类事物的合计数。
如某病的出院人数、治愈人数、死亡人数等。
意义:绝对数反映出事物在某时、某地出现的实际水平,即实际发生的规模大小。
缺点:绝对数往往不便于互相比较。
例1:某乡两个村的调查结果为,甲村钩虫感染有150人,乙村钩虫感染有100人。
据此,我们只能说甲村钩虫感染较乙村多50人,但不能肯定甲村较乙村钩虫感染程度更为严重。
例2:甲、乙两个医院某病出院人数不同时,比较两医院该病的死亡人数没有意义。
例3:如04级七年制一、二大班学生人数不同时,比较两班医学统计学的及格人数没有意义。
二、相对数定义:两个有关的绝对数之比,统称为相对数。
意义:1.消除基数影响,便于事物间的比较。
2.给出事物发生频率(强度)的估计。
3.相对数是工作决策的依据。
常用的相对数指标•例5-1 某医院1998年在某城区随机调查了8589例60岁及以上老人,体检发现高血压患者为2823例。
高血压患病率为:(2823 / 8589 ) 100% = 32.87% 。
在实际工作中,“率”的应用非常广泛,如:发病率、死亡率、发生率、阳性率、患病率等。
当“率”的分母足够大时,常用“率”的大小表示某现象发生的概率。
第二节应用相对数的注意事项1. 计算相对数应有足够数量即分母不宜太小。
如果例数较少会使相对数波动较大。
如某种疗法治疗5例病人,5例全部治愈,则计算治愈率为5/5×100% =100%,若4例治愈,则治愈率为4/5×100% =80%,由100%至80%波动幅度较大,但实际上只有1例的变化。
•在临床试验或流行病调查中,各种偶然因素都可能导致计算结果的较大变化,因此例数很少的情况下最好用绝对数直接表示•但动物实验时,可以通过周密设计,严格控制实验条件,如毒理实验,每组用10只纯种小鼠也可以•分母到底多大才可以呢?要根据研究目的、研究指标而定2.不能以构成比代替率构成比是用以说明事物内部某种构成所占比重或分布,并不说明某现象发生的频率或强度,在实际工作中经常会出现将构成比指标按率的概念去解释的错误。
计数资料的描述和x2检验

(4)χ2界值
当自由度ν确定后,χ2分布曲线下右侧尾 部的面积为α时,横轴上相应的χ2值即为χ2
界值,表示为 χα2,ν 。
χ2界值可以通过查χ2界值表得到,当自 由度一定时,χ2值越大,P值越小;χ2值越 小,P值越大。
一、四格表资料的χ2检验
1。四格表资料(完全随机设计)
四格表的格式
分组 +
116
130
85
41
29
776
305
人口数
(ni)
241 315 175
农村 预期患病人数
( niPi)
51 145 115
58
42
789
353
④ 计算城乡两地的SMR及标准化患病率
城市SMR:
SMR = 322 = 1.05 305
城市标准化患病率: p ' = 42.1% ×1.05 = 44.2%
③ 求预期治愈人数
表5-5 直接法计算标准化率
标准治
甲疗法
病型 疗人数 原治愈率 预期治愈数
(Ni) (pi) ( Nipi)
普通型 400 60.0
240
乙疗法
原治愈率 预期治愈数
(pi)
65.0
( Nipi)
260
重型 400 35.0
140
41.7
167
合计 800
-
380
-
427
④ 计算甲、乙两种疗法的标准化治愈率
人工流产后 255
78
61.9
30.6
月经后
87
39
31.0
44.8
哺乳期
17
9
7.1
52.9
计数资料的统计描述与卡方检验

25
41 45 50 28 31
女
男 女 女 男 女
1.61
1.71 1.58 1.60 1.76 1.62
AB
A B O AB Oຫໍສະໝຸດ 正常异常 正常 异常 正常 正常
+
++ ++ ++ +++ +
农民
工人 工人 干部 干部 军人
3.92
3.49 5.48 6.78 7.10 5.24
1、频数表
部分原始数据
重 中 轻
800 200 100
合计 1100
1、标准化法的基本方法
• 方法1:采用标准人口构成与原始分组率, 计算标准化率,直接比较。 • 方法2:采用分组标准化率与原始人口,计 算标准化比,间接比较。
1)、直接法--标准人口
病情程度
例数
甲医院
感染数 160 20 5 185 感染率 例数 20% 10% 5% 16.8% 800 200 100 1100
计数资料的统计描述与卡方检验
四川大学华西医院 康德英
临床研究中计数资料来源、分类
• 本身设置为分类变量(PI/ECOT) • 从计量资料转化而来:
如评价降压疗效时,将舒张压降低值分为三类: <5mmHg 无效
5-10mmHg
10-20mmHg
有效
显效
Note:计量资料转化为计数资料,过程本身损 失信息,应慎重。
4、NNT
• NNT(Numbers Needed to Treat):为避免 一例不良事件发生而需要治疗的病例数.其 值为绝对危险度的倒数(1/AR) • 类似还有:NNH(Numbers Needed to Harm)。
计数资料的统计描述

高血压 172665
40
23.2
冠心病 172665
11
脑卒中 172665
253
6.4
率
146.5
风心病 172665
38
22.0
9
常用统计指标
发病率与患病率: 某时期某人群
发病率= 中新发病人次 K 同时期平均人口数
某一时点一定人群中 患病率= 现患某病新旧病例数 K
同期平均人口数
10
病死率与死亡率
某时期内因某病死亡人数
病死率=Biblioteka K同期患某病的病人数
某地某时期死亡人数
死亡率=
K
该地同期平均人口数
11
2.结构相对数——构成比
含义:指一事物内部结构相对某一组成部分 的观察单位数与该事物各组成部分的观察 单位总数之比,常用百分数表示。
计算:
构成比=
某一组成部分的观察单位数 100 同一事物各组成部分的观察单位总数 %
合计
74.61
44298
乙地预期发 病人数
3=1*2
26.93 46.35 45.53 59.9 44.75 8.54
232
28
标准化时应注意的问题
1. 应明确在对比两组(或多组)总率或总均数 时,若内部构成明显不同,影响总率的可比 性,需作标准化处理。
2. 相互比较的两组(或几组)资料的标准化率, 应选用同一标准;选用的标准不同,算得的 标准化率也不同。标准化率仅表明对比资料 间的相对水平,并不反映某时某地该现象发 生的实际水平。
287 64.79
18
标准化的意义:
• 其合计的差别之所以大,是由于两地人 群年龄构成不同。要正确比较甲、乙两 地的总发病率,需按照统一标准进行校 正,然后进行比较。
计数资料的统计描述

率同某期时可期能内发发生生某某现现象象的的观观察察单单位位总数数比例基数
式中比例基数,可以取100%、1000‰、 10万/10万…等。
常用的率有发病率、患病率、死亡率、 病死率、治愈率等。
例10-1 某医院1998年在某城区随机调查了 8589例60岁及以上老人,体检发现高血 压患者为2823例。
高血压患病率为: 2823 / 8589 100% = 32.87% 。
二、构成比(结构相对数)
构成比:表示事物内部某一部分的个体数 与该事物各部分个体数的总和之比,用 来说明各构成部分在总体中所占的比重 或位次。
通常以100%为比例基数。其计算公式为:
构成比
某一组成部分的观察单位数 同一事物各组成部分的观察单位总数
例10-2 某医院1990年和1998年住院病人死于五 种疾病的人数见表10-1。
表 10-1 某医院 1990 年和 1998 年住院病人五种疾病死亡人数和构成比
疾病构成
1990 年
1998 年
死亡人数 构成比(%)
死亡人数 构成比(%)
恶性肿瘤
58
30.53
40
26.85
循环系统疾病
44
23.16
﹡2、不能以构成比代替率
构成比是用以说明事物内部某种构成所 占比重或分布,并不说明某现象发生的 频率或强度。
统计描述是指选用适当的特征性统计指标
(即统计量)、合适的统计表、统计图正确地描
述资料的分布规律和数量特征。
计数资料的统计描述
常用相对数 应用相对数的注意事项 率的标准化法
一:常用相对数
计数资料常见的数据形式是绝对数,如某病的 出院人数、治愈人数、死亡人数等。
但绝对数通常不具有可比性:
计数资料的统计描述与统计推断

2 nnARn2C 1
(一) 多个样本率的比较:
表3.8 三种药物治疗高血压的疗效
处理
有效
无效
合计
有效率%
复方哌唑嗪 35
5
40
87.50
复方降压片 20
10
30
66.67
安慰剂
7
25
32
21.88
合计
62
40
102
60.78
38
H0:三种处理方法的有效率相等, 即π1= π2= π3 H1:三种处理方法的有效率不等或不全相等
某类死因构某 成同 年 比年 某死 类亡 死总 因人 死 1数 亡 0% 0人数
8
(二)疾病统计指标
某 病 发病 一率 定 该时 期期 间内 新可 病 发能 的 生 例发 平 的 数生 均 某 某 人 K病
某病患病率 某该时时点点某受病检现人患口病 K数例数
某
病
病死同 因率期 某某 病
死亡人数 病病 10人 % 0 数
29
31
(三)四格表χ2检验的专用公式
2
(ad b)c2n
(ab)c(d)a (c)b (d)
两组人群尿棕色素阳性率比较
组别
阳性数
阴性数
合计
铅中毒病人 对照组
29(a) 9(c)
7(b) 28(d)
36(a+b) 37(c+d)
合计
38(a+c)
35(b+d)
73(n)
阳性率(%) 80.56 24.32 52.05
712 142 185
61
1100
4
0.6
9
6.3
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二,结构相对数 —构成比(constituent ratio) 构成比(constituent
概念: 概念 : 说明某事物内部各组成部分所占的比 重或分布,又称构成比. 重或分布,又称构成比.
位数 某一组成部分的观察单 构成比= ×100% 同一事物各组成部分的 观察单位总数
计算公式: 计算公式:
10
(11.1+6.1+5.2+2.3+2.3)/5=5.4
常用统计指标
1. 发病率与患病率
某时期新发病人次 发病率= ×1000‰ 同时期平均人口数
调查时患某病人数 患病率= ×1000‰ 调查人数
11
常用统计指标
2. 病死率与死亡率
病死人数 病死率= ×100% 经治疗人数
某地某时期死亡人数 死亡率= ×1000‰ 该地同时期ence Rate) 缺乏各年龄组患病率
25
选择另一地区某年的50岁以上老年妇女原发性 选择另一地区某年的 岁以上老年妇女原发性 骨质疏松症的年龄组患病率P 骨质疏松症的年龄组患病率 i作为标准
用间接法计算标准化患病率( ) 用间接法计算标准化患病率(%)
年龄组 (岁) (1) ) 50~ 60~ 70~ 80 及以上 合计 标准患病率 人口数 城市 预期患病人数 人口数 农村 预期患病人数
基数: % 基数:100%. 构成比可相加 和等于100%. 比可相加, 构成比可相加,和等于 .
13
汉族不同年龄组孕妇携带HBsAg情况 情况 汉族不同年龄组孕妇携带
年龄 (岁) 岁 ≤20 21- - 26- - 31- - 36- - 合计 受检人数 36 985 999 263 44 2327 HBsAg 阳性人数 4 60 52 6 1 123 阳性构 成比(% 成比 %) 3.2 48.8 42.3 4.9 0.8 100.0 阳性率 (%) % 11.1 6.1 5.2 2.3 2.3 5.3
16
第二节 应用相对数的注意事项
17
⒈率与构成比要区分开. 率与构成比要区分开. ⒉分母要选择适当,要够大. 分母要选择适当,要够大. ⒊构成比可相加,和为100%; 构成比可相加,和为 ; 平均率不能由各组率相加后求平均. 平均率不能由各组率相加后求平均. 样本率或构成比的取得应遵循随机化原则, ⒋样本率或构成比的取得应遵循随机化原则, 内部构成不同要用标准化法处理. 内部构成不同要用标准化法处理. 构成比或率比较时, ⒌构成比或率比较时,不能凭表面数值大小下 结论,要考虑抽样误差,需作假设检验. 结论,要考虑抽样误差,需作假设检验.
第 5章
计数资料的统计描述
Statistical Description for Enumeration Data
第二军医大学卫生统计学教研室 张罗漫
1
讲课内容: 讲课内容:
第一节 常用相对数 第二节 应用相对数的注意事项 第三节 率的标准化法 第四节 动态数列及其分析指标
2
1998 年医学期刊中统计学方法的应用情况 年医学期刊中统计学方法的应用情况*
'
乙疗法 原治愈率 (pi) (5) ) 65.0 41.7 — 预期治愈数 (Nipi) (6) = (2)(5) 260 167 427∑Nipi
预期治愈数 (Nipi) (4)= (2)(3) ) 240 140 380∑Nipi
甲疗法标准化治愈率 乙疗法标准化治愈率
380 p= ×100%= 47.5% 53.8% 800
41.5% 42.5%
27
三,应用标准化时的注意事项
1.标准化法只适用于某因素两组内部构成不 标准化法只适用于某因素两组内部构成不 并有可能影响两组总率比较的情况. 同,并有可能影响两组总率比较的情况. 对于因其它条件不同而产生的不具可比性 的问题,标准化法不能解决. 的问题,标准化法不能解决. 2.由于选择的标准人口不同,算出的标准化 由于选择的标准人口不同, 由于选择的标准人口不同 率也不同.当比较几个标准化率时, 率也不同.当比较几个标准化率时,应采 用同一标准人口. 用同一标准人口.
4
概
念
1. 总量指标 — 绝对数 反映事物的规模和水平. 反映事物的规模和水平. 缺点:不利于保密,不可比. 缺点:不利于保密,不可比. 2. 相对指标 — 相对数 是两个有联系的数据的比值. 是两个有联系的数据的比值. 目的:将基数化为相同,便于比较. 目的:将基数化为相同,便于比较.
5
第一节 常用相对数
腮腺炎发病率 36 = ×100%= 20.57% 200 25
8
基数:可取百分率 基数:可取百分率(100%),千分率 % ,千分率(1000‰) 万分率(1/万 ,十万分率(1/10万)等. ,万分率 万),十万分率 万等 使计算结果保留1~ 位整数 位整数. 使计算结果保留 ~2位整数. 平均率不能由各组率相加后求平均, 平均率不能由各组率相加后求平均, 应为分子合计除以分母合计. 应为分子合计除以分母合计.
Pi
(2) ) 21.3 46.1 65.5 71.7 42.1
ni
(3) ) 354 251 130 41 776
ni Pi
(4)=(2)(3) 75 116 85 29 305
ni
(5) 241 315 175 58 789
niPi
(6)=(2)(5) 51 145 115 42 353
26
原发性骨质疏松症标准化患病比 原发性骨质疏松症标准化患病比SPR 标准化患病比
21
(一)直接法
选择人口数作标准 Ni:标准年龄别 人口数 选择人口构成比作标准 Pi:实际年龄别 Ni ××率 ××率 ' P = ∑ P i N:标准人口总数 : N
22
∑Ni P i P = N
'
选择治疗人数之和作标准
直接法计算标准化治愈率( ) 直接法计算标准化治愈率(%)
病型 (1) ) 普通型 重 型 合计 标准治 疗人数 (Ni) (2) ) 400 400 800(N) 甲疗法 原治愈率 (pi) (3) ) 60.0 35.0 —
18
第三节 率的标准化法
19
一,标准化法的意义和基本思想
表 5-4 甲,乙两种疗法治疗某病的治愈率比较 病 型 普通型 重 型 合 计 甲疗法 病人数 治愈数 治愈率 治愈率(%) 300 100 400 180 35 215 60.0 35.0 53.8 病人数 100 300 400 乙疗法 治愈数 65 125 190 治愈率(%) 治愈率 65.0 41.7 47.5
24
1998 年某省城乡女性原发性骨质疏松症患病率比较
年龄组 (岁) (1) ) 50~ 60~ 70~ 80 及以上 合计 调查人数 (2) ) 354 251 130 41 776 城市 患病人数 (3) ) … … … … 322 患病率( ) 患病率(%) (4) ) … … … … 41.5 调查人数 (5) ) 241 315 175 58 789 农村 患病人数 (6) ) … … … … 335 患病率( ) 患病率(%) (7) ) … … … … 42.5
20
二,标准化率的计算
标准化方法 1.直接法(被标化组有年龄别××率) 直接法(被标化组有年龄别××率 直接法 ×× 2.间接法(被标化组缺乏年龄别××率) 间接法(被标化组缺乏年龄别××率 缺乏年龄别×× 间接法 标准构成选择 1. 某一组的人口数或人口构成比; 某一组的人口数或人口构成比; 2. 两组之和的人口数或人口构成比; 两组之和的人口数或人口构成比; 3. 通用的或便于比较的标准. 通用的或便于比较的标准.
14
三,相对比(relative ratio) 相对比(relative
概念: 是两个有关的指标之比, 概念 : 是两个有关的指标之比 , 说明两者 的对比水平, 以倍数或百分数表示. 的对比水平, 以倍数或百分数表示. 计算公式: 计算公式:
甲指标 (×100% ) × 相对比= 乙指标
15
某年某医院出生婴儿中, ● 例:某年某医院出生婴儿中,男性婴儿为 370人, 女性婴儿为 人 女性婴儿为358人, 则出生婴儿性别 人 比例: 比例 女:男=1:370/358=1:1.03 : : ● 1978年国家卫生部颁布的综合性医院 年国家卫生部颁布的综合性医院 床位数与工作人员之比) 床工比 (床位数与工作人员之比): 1:1.3 张床位) : (≤300张床位) 张床位 1:1.4~1.5(300~450张床位) 张床位) : ~ ( ~ 张床位 1:1.6~1.7(≥450张床位) 张床位) : ~ ( 张床位
6
一,强度相对数—率 (rate) 强度相对数—
概念: 说明某现象在其可能发生的范围内 概念: 实际发生的频率或强度,又称率. 实际发生的频率或强度,又称率. 计算公式: 计算公式:
实际发生某现象的观察单位数 率= ×比例基数 可能发生某现象的观察单位总数
7
1999年某幼儿园有 名儿童患了腮腺炎, 年某幼儿园有36名儿童患了腮腺炎 年某幼儿园有 名儿童患了腮腺炎, 该幼儿园有200名儿童(其中 名儿童以 该幼儿园有 名儿童(其中25名儿童以 名儿童 前患过腮腺炎),该幼儿园儿童1999年腮 前患过腮腺炎),该幼儿园儿童 ),该幼儿园儿童 年腮 腺炎发病率是多少? 腺炎发病率是多少?
9
汉族不同年龄组孕妇携带HBsAg情况 情况 汉族不同年龄组孕妇携带
年龄 (岁) 岁 ≤20 21- - 26- - 31- - 36- - 合计 受检人数 36 985 999 263 44 2327 HBsAg 阳性人数 4 60 52 6 1 123 阳性构 成比(% 成比 %) 3.2 48.8 42.3 4.9 0.8 100.0 阳性率 (%) % 11.1 6.1 5.2 2.3 2.3 5.3