计数资料的统计描述
计数资料的统计描述

A.频率指标 B.构成指标 C.相对指标 D.动态数列
多选题
7.对两个总率进行标准化时,主要目的是
A.消除内部构成的差异 B.使其在实际水平下进行比较
D.使其在共同标准下进行比较 D.反映各自的实际水平
E.反映各自的相对水平
8.使用相对数时应注意
A.计算相对数的分母不宜太小 B.不要把比作率分析
C.资料要具有可比性 D.资料内部构成不同应进行标准化
E.对率和比的比较应进行假设检验
9.某医师用某新疗法治疗了2例肺癌病人,均治愈,该医师报道,他所采
用的新疗法治愈率为100%,你认为有些不妥,应建议该医生
A.增大样本含量 B.报告绝对数 C.进行有对照的临床试验
D.与国外研究资料对比 E.与历史资料对照
10.构成比的特点有
A.各部分的构成比之和为100% B.各部分的构成比之和为1 C.某部分比重的增减可影响其他部分 D.每部分的构成比可大于1
E.具体计算时,有时受尾数的影响,其总和不等于1
11.关于率,以下哪几项是错误的
A.反映某现象发生的频率或强度 B.反映某事物内部的构成
C.表示两个同类指标之比 D.表示某现象在时间上顺序排
列
E.又称为频率指标或强度指标
12.描述计数资料的主要指标是
A.构成比 B.平均数 C.率 D.相对比 E.标准差(二)论述题
1.某地某年肿瘤普查资料整理如下表。
请填补表中空缺,并分析讨论哪个
年龄组最易患肿瘤?哪个年龄组病人最多?
实习表4-1 某地某年肿瘤普查资料
年龄(岁)人口数肿瘤患者数构成比(%)患病率(1/万)。
医学统计学计数资料的统计描述(一)

医学统计学计数资料的统计描述(一)医学统计学计数资料的统计描述计数资料是医学研究中常见的数据类型,例如统计某种疾病的患病人数、治愈人数等。
如何对这些数据进行科学统计描述,成为了医学研究不可避免的问题。
一、计数资料的基本概念计数资料是指由离散数据组成的一种数据类型,这些数据仅取有限个数值,如某类疾病的患病人数(自然数)或治愈人数(非负整数)。
计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述极为重要。
二、计数资料的统计描述1. 频数频数是指计数资料中各取值出现的次数,常以小写字母n表示。
例如患病人数为0的样本数为n0,患病人数为1的样本数为n1,以此类推。
2. 频率频率是指频数与总样本数的比值,常以小写字母f表示。
例如患病人数为0的频率为f0=n0/n,患病人数为1的频率为f1=n1/n,以此类推。
频率可以体现每个取值在样本中的分布情况,是比较常用的统计指标,其和为1。
3. 百分比百分比是指频数与总样本数的比值乘以100,常以百分号表示。
例如患病人数为0的百分比为f0×100%,患病人数为1的百分比为f1×100%,以此类推。
4. 累计频率累计频率是指某一取值及其以下所有取值的频率之和,常以小写字母F 表示。
例如患病人数小于等于3的累计频率为F3=f0+f1+f2+f3。
累计频率可以体现小于等于某个取值的样本在总样本中所占比例。
三、总结计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述有益于研究者更加深入地了解样本的分布情况,进而提出相应的研究假设。
频数、频率、百分比和累计频率是计数资料的常用统计指标,可分析每个取值在样本中的分布情况和各个取值间的差异。
在实际研究中,研究者应根据实际情况选择合适的统计方法进行分析,以期得到更为科学的结论。
计数资料的统计描述

计数资料的统计描述第一节常用相对数一、绝对数定义:计数资料各类别的频数,即各分类事物的合计数。
如某病的出院人数、治愈人数、死亡人数等。
意义:绝对数反映出事物在某时、某地出现的实际水平,即实际发生的规模大小。
缺点:绝对数往往不便于互相比较。
例1:某乡两个村的调查结果为,甲村钩虫感染有150人,乙村钩虫感染有100人。
据此,我们只能说甲村钩虫感染较乙村多50人,但不能肯定甲村较乙村钩虫感染程度更为严重。
例2:甲、乙两个医院某病出院人数不同时,比较两医院该病的死亡人数没有意义。
例3:如04级七年制一、二大班学生人数不同时,比较两班医学统计学的及格人数没有意义。
二、相对数定义:两个有关的绝对数之比,统称为相对数。
意义:1.消除基数影响,便于事物间的比较。
2.给出事物发生频率(强度)的估计。
3.相对数是工作决策的依据。
常用的相对数指标•例5-1 某医院1998年在某城区随机调查了8589例60岁及以上老人,体检发现高血压患者为2823例。
高血压患病率为:(2823 / 8589 ) 100% = 32.87% 。
在实际工作中,“率”的应用非常广泛,如:发病率、死亡率、发生率、阳性率、患病率等。
当“率”的分母足够大时,常用“率”的大小表示某现象发生的概率。
第二节应用相对数的注意事项1. 计算相对数应有足够数量即分母不宜太小。
如果例数较少会使相对数波动较大。
如某种疗法治疗5例病人,5例全部治愈,则计算治愈率为5/5×100% =100%,若4例治愈,则治愈率为4/5×100% =80%,由100%至80%波动幅度较大,但实际上只有1例的变化。
•在临床试验或流行病调查中,各种偶然因素都可能导致计算结果的较大变化,因此例数很少的情况下最好用绝对数直接表示•但动物实验时,可以通过周密设计,严格控制实验条件,如毒理实验,每组用10只纯种小鼠也可以•分母到底多大才可以呢?要根据研究目的、研究指标而定2.不能以构成比代替率构成比是用以说明事物内部某种构成所占比重或分布,并不说明某现象发生的频率或强度,在实际工作中经常会出现将构成比指标按率的概念去解释的错误。
计数资料统计描述

常用的相对数: 一、率。 二、构统计描述
计数资料常见的数据形式是绝对数,如某病的 出院人数、治愈人数、死亡人数等。 但绝对数通常不具有可比性: 1、如甲、乙两个医院某病出院人数不同时,比 较两医院该病的死亡人数没有意义 2、如00级七年制一、二大班学生人数不同时, 比较两班医学统计学的及格人数没有意义 因此需要在绝对数的基础上计算相对数。
医学统计学---统计推断
EContent
Rate、constituent ratio and ratio Application of relative measurement Standardization rate Dynamic series 牛牛文档分享第一节 常用相对数
式中比例基数,可以取100%、1000‰、 10万/10万…等。 比例基数的选择主要根据习惯用法和使计 算的结果能保留1~2位整数,以便阅读。 例如患病率通常用百分率、婴儿死亡率用 千分率、肿瘤死亡享
第一节 常用相对数
构成比有两个特点: (1)说明同一事物的k个构成比的总和应 等于 100% ,即各个分子的总和等于分母。 ( 2 )各构成部分之间是相互影响的,某 一部分比重的变化受到两方面因素的影响。 其一是这个部分自身数值的变化,其二是 受其它部分数值变化的影响。 牛牛文档分享第一节 常用相对数
表 5-1 中, 1990 与 1998 年住院病人五种疾病死 因构成的总和均为100%。 1998年呼吸系统疾病死亡人数比1990 年少,但 构成比却比较接近;再看两年的循环系统疾病 死亡人数相同,而1998年的构成比却较1990年 高,这不能说明 1998 年循环系统疾病的病死严 重程度较1990年高。 死因构成比只能说明某病死亡人数在总死亡人 数中所占比重,如需要比较其病死的严重程度, 则要计算病死率。
计数资料的描述和x2检验

(4)χ2界值
当自由度ν确定后,χ2分布曲线下右侧尾 部的面积为α时,横轴上相应的χ2值即为χ2
界值,表示为 χα2,ν 。
χ2界值可以通过查χ2界值表得到,当自 由度一定时,χ2值越大,P值越小;χ2值越 小,P值越大。
一、四格表资料的χ2检验
1。四格表资料(完全随机设计)
四格表的格式
分组 +
116
130
85
41
29
776
305
人口数
(ni)
241 315 175
农村 预期患病人数
( niPi)
51 145 115
58
42
789
353
④ 计算城乡两地的SMR及标准化患病率
城市SMR:
SMR = 322 = 1.05 305
城市标准化患病率: p ' = 42.1% ×1.05 = 44.2%
③ 求预期治愈人数
表5-5 直接法计算标准化率
标准治
甲疗法
病型 疗人数 原治愈率 预期治愈数
(Ni) (pi) ( Nipi)
普通型 400 60.0
240
乙疗法
原治愈率 预期治愈数
(pi)
65.0
( Nipi)
260
重型 400 35.0
140
41.7
167
合计 800
-
380
-
427
④ 计算甲、乙两种疗法的标准化治愈率
人工流产后 255
78
61.9
30.6
月经后
87
39
31.0
44.8
哺乳期
17
9
7.1
52.9
计数资料的统计描述

率
236 458 447 584 735 458
7
发病率与患病率
指标 发病率 时点(时期) 时点(时期) 患病率 分子 时期内新发生的某病 时期内新发生的某病 新发生 病例数 时点(时期) 时点(时期)现患 疾病人数 分母 可能发病平均 人口数 检查人口数
8
病死率与死亡率
指标 病死率 死亡率 分子 时期内因某病 时期内因某病 死亡人数 死亡人数 某地某人群某时期内 的死亡人数 分母 同期患某病人数 该地同期 平均人口数
22
表 9 直接法计算甲乙两地标化死亡率(‰)
年龄 组 05204060合计
标准人口数 (Ni) 14100 18800 54300 10400 2400 100000(N)
甲地 原 死亡 预期死亡数 率 pi Nipi 57.2 807 3.6 68 5.3 288 12.1 126 40.0 96 16.19 1385
16
计算甲乙两地的平均死亡率? 计算甲乙两地的平均死亡率?
表 6 甲乙两地各年龄组人口数及死亡率(‰)
年龄 组 05204060合计
甲地 人口数 构成比(%) 死亡率 9300 18.6 57.2 12200 24.4 3.6 19000 38 5.3 7600 15.2 12.1 1900 3.8 40.0 50,000 100.0 16.19
乙地 原 死亡 预期死亡数 率 pi Nipi 72.9 1028 4.6 86 7.2 391 14.2 148 46.0 110 13.90 1763
23
2.间接标准化法的计算: 2.间接标准化法的计算:已知 间接标准化法的计算
r = P× SMR p′ = P ∑ni Pi
P:为标准总死亡率, 为标准总死亡率, r:为实际总死亡数, 为实际总死亡数, 为实际年龄别人口数, ni:为实际年龄别人口数, 为标准年龄别死亡率, Pi:为标准年龄别死亡率, 为预期死亡数, ∑niPi:为预期死亡数, 为标准化死亡比, SMR表示 表示。 r/∑niPi:为标准化死亡比,用SMR表示。
计数资料的统计描述

案例
《600例小儿烧伤休克期治疗分析》
600例烧伤患儿,210例早期有休克症状,其中 3岁以下者110例,占52%,3岁以上者100例, 占48%,年龄越小,休克发生率越高。
相对数
相对比 率 构成比
比(ratio) )
比又称相对比,是两个有关的指标之比,表示 对比指标间的数量关系,可用倍数或百分数表 示。 比=甲指标/乙指标(或×100%) / 100 甲、乙两个指标可以是绝对数,也可以是平均 数或率;可以性质相同,也可以性质不同。
各种疟疾的构成情况
1955年 类别 发病人数 恶性疟 间日疟 三日疟 合计 68 12 17 97 % 70 12 18 100 发病人数 21 12 17 50 % 42 24 34 100 1956年
相对数在应用中应注意的事项
计算相对数的分母一般不宜过小。样本量过小时计算 所得的相对数稳定性较差,受偶然性影响易产生较大 的误差。观察例数过小时应用绝对数表示。 正确区分率与构成比。构成比只能说明事物内部各组 成部分的构成或分布,并不能反映某现象发生的频率 或强度,分析资料时不要将构成比当率做解释。
急性脑出血病死率的比较
某省医院 患者 例数 1600 死亡 例数 255 病死率 (%) 15.9 患者 例数 920
某县医院 死亡 例数 101 病死率 (%) 11.0
ห้องสมุดไป่ตู้ 急性脑出血病死率的比较
某省医院 病情 患者 例数 100 500 1000 1600 死亡 例数 5 50 200 255 病死率 (%) 5 10 20 15.9 患者 例数 800 100 20 920 某县医院 死亡 例数 80 15 6 101 病死率 (%) 10 15 30 11.0
计数资料的统计描述与卡方检验

25
41 45 50 28 31
女
男 女 女 男 女
1.61
1.71 1.58 1.60 1.76 1.62
AB
A B O AB Oຫໍສະໝຸດ 正常异常 正常 异常 正常 正常
+
++ ++ ++ +++ +
农民
工人 工人 干部 干部 军人
3.92
3.49 5.48 6.78 7.10 5.24
1、频数表
部分原始数据
重 中 轻
800 200 100
合计 1100
1、标准化法的基本方法
• 方法1:采用标准人口构成与原始分组率, 计算标准化率,直接比较。 • 方法2:采用分组标准化率与原始人口,计 算标准化比,间接比较。
1)、直接法--标准人口
病情程度
例数
甲医院
感染数 160 20 5 185 感染率 例数 20% 10% 5% 16.8% 800 200 100 1100
计数资料的统计描述与卡方检验
四川大学华西医院 康德英
临床研究中计数资料来源、分类
• 本身设置为分类变量(PI/ECOT) • 从计量资料转化而来:
如评价降压疗效时,将舒张压降低值分为三类: <5mmHg 无效
5-10mmHg
10-20mmHg
有效
显效
Note:计量资料转化为计数资料,过程本身损 失信息,应慎重。
4、NNT
• NNT(Numbers Needed to Treat):为避免 一例不良事件发生而需要治疗的病例数.其 值为绝对危险度的倒数(1/AR) • 类似还有:NNH(Numbers Needed to Harm)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ni
(5) 241 315 175 58 789
ni Pi
(6)=(2)(5) 51 145 115 42 353
1) 选另一个地区某年的 50 岁以上老年妇女原发性骨质疏松症的年龄组患 病率 Pi 作为标准,见表 3-7 第(2)栏。 2) 按式(3-7)分别计算城乡两地的 SMR 及标准化患病率
表 3-7
年龄组 标准患病率
按式(5-12 )用间接法计算标准化患病率(%)
城市 人口数 预期患病人数 人口数 农村 预期患病人数
(岁) (1) 50~ 60~ 70~ 80 及以上 合计
Pi
(2) 21.3 46.1 65.5 71.7 42.1
ni
(3) 354 251 130 41 776
ni Pi
结构相对数 —构成比(constituent ratio) 概念:说明某事物内部各组成部分所占的比重或分布,又称构成比。 计算公式:
某部分的数量 某部分的比重(%)= -----------------------------------事物内部各部分数量的和
X 100%
基数:100%。 构成比可相加,和等于100%。
380 甲疗法标准化治愈率 p 100% 47.5% 800
乙疗法标准化治愈率 p 427 100% 53.4% 800
2.间接标准化法
选择年龄别死亡率作标准,
p P r P SMR ni Pi
(3-7)
式 (3-7)中 P 为标准总死亡率,r 为实际总死亡数, ni 为实际年龄别 人口数,Pi 为标准年龄别死亡率,ni 与 Pi 的乘积和 ni Pi 为预期死亡 数,r
(3)对比不同时期资料应注意客观条件是否相同。
6、 样本相对数的统计推断 在随机抽样的情况下, 从样本估计值推断总体的相对数应当考虑抽样误差,
不能仅凭数字表面差别的大小下结论,而应根据需要进行参数估计和假设检验。
第二节 粗率的标准化法
一、标准化法的意义和基本思想
比较两个(或两个以上)总体率时,如果两个总体的 内部构成有所差别(年龄、性别、病情等影响因素构
“标准人口构成”,以消除人口构
成不同对各组总率的影响,使算得的 标准化率具有可比性。
对比下表两种疗法的治愈率
表 3-4 病 型 普通型 重 型 合 计 病人数 300 100 400 甲、乙两种疗法治疗某病的治愈率比较 乙疗法 病人数 100 300 400 治愈数 治愈率(%) 65 125 190 65.0 41.7 47.5 60.0 35.0 53.8
(二)计算标准化率
1.直接标准化法
直接法标准化率: 选择年龄别人口数作标准,
p
N p
i
i
N
(3-5)
选择年龄别人口构成比作标准,
N p i N pi
(3-6)
Ni 为标准年龄别人口数, pi 为实际年龄别死亡率,N 为标准人口总数。 Ni /N 为标准年龄别人口构成比。
计数资料的统计描述
华中科技大学同济医学院 公共卫生学院 熊光练 2013年9月
基数数据(cardinal data)
可以使用某种尺度测出任何 两个数据的距离。基数数据 的均值和标准差都是有意义 的。 对于基数数据,如果零点是 任意的(零点意义不明确) 称为区间尺度数据。
区间尺度数据(interval scale data)
三、应用标准化的注意事项
• 1.标准化法应用广泛,可用于不同年龄、性
别、工种、病情的内部构成不同的标准化。
• 2.标准化率因选择的标准人口而不同。因此,
当比较几个标准化率时,应采用同一标准
人口。
• 3.标准化后的标准化率,已经不再反映当时
当地的实际水平,它只是表示相互比较的
资料间的相对水平。
• 4.两样本标准化率是样本值,存在抽样误差。
一、绝对增长量
• 绝对增长量是说明事物在一定时期增长的 绝对值。 • ①累计增长量:即报告期指标与基线期指
应用相对数时的注意事项 1、正确理解相对数的含义,常见问题是解释错误。
2、频率型指标的解释要紧扣总体与属性 3、计算相对数时分母应有足够数量 4、正确计算合计率 5、注意资料的可比性 在比较相对数时,除了要对比的因素(如不同的药物),其余的影响因素应尽 可能相同或相近。下列因素可能影响对比组之间的可比性: (1) 观察对象是否同质,研究方法是否相同,观察时间是否相等,以及地区、 周围环境、风俗习惯和经济条件是否一致或相近等。 (2) 观察对象内部结构是否相同,若两组资料的年龄、性别等构成不同。
优势相对数 ----比(ratio) 比是指两个有关联的指标A和B之比,简称比。A和B可以是性质相同, 也可以是性质不相同。通常以倍数或百分数(%)表示。
计算公式:
A 比=------- X 100% B 式中A、B指标可以是绝对数、相对数或平均数等。
两种相对比 对比指标: 指两个同类事物某种指标的比,说明一个数
比例尺度数据(ratio scale data)
零点固定(零点意义明确) 称为比例尺度数据。任何两 个数据的比值是有意义的。
可以排列次序,比较大小, 但是没有指定的数值。通常 的算数运算没有意义。 不同的数值代表的是类型, 而类型是没有次序的。
有序数据(ordinal data) 名义尺度数据(nominal scale data)
为另一个数的几倍或百分之几,两指标可是
绝对数、相对数或平均数。 如:2000年我国人口普查,男子65355 万人, 女子61228 万人,男女性别比为:1.0674 关系指标: 指两个相关的、但非同类事物的数量比。 如:某医院1995年医护人员为875人,同年 平均开放病床1436张,医护人员与病床数之 比为:(875 ÷ 1436) ×100=61(人),表示该 医院每100张病床平均配备61名医护人员。 病床与医护人员之比为:1436÷875=1.64, 表示每名医护人员平均负责1.64张病床。
相对数(Relative number):是两个有关联的数据之比,用以说明事物
的相对关系,便于对比分析。
常用的相对数指标很多,按联系的性质和说明的问题不同,主要分为: 率、构成、相对比三类。 数据粒度
不同工种调查对象白细胞减少症登记表 观察序号 年龄 性别 工种 „ 白细胞减少症 1 56 男 笨作业 „ 是 2 47 女 塑料作业 „ 否 3 25 男 化学药物 „ 否 „ „ „ „ „ „ 1123 59 男 放射作业 „ 是
趋势
动态指标 发展 动态数列
内 容
• 相对数
– 强度 – 分布 – 相对比
•
•
应用相对数时的注意事项
率的标准化法
– 标准化法的意义和基本思想 – 标准化率的计算
• •
应用标准化法的注意事项 动态数列及其指标
– 绝对增长量 – 发展速度与增长速度 – 平均发展速度和平均增长速度
•
医学上常用指标
相对数
城市原发性骨质疏松症标准化患病比SMR
322 1.05 305
城市原发性骨质疏松症标准化患病率p 42.1% 1.05 44.2%
335 农村原发性骨质疏松症标准化患病比SMR 0.95 353
农村原发性骨质疏松症标准化患病率p 42.1% 0.95 40.0%
表1. 不同工种调查对象白细胞减少症患者统计
调查对象 工种 笨作业 塑料作业 化学药物 放射作业 合计 例数 398 311 260 154 1123 百分比 (%) 35.4 27.7 23.2 13.7 100.0 患者 病例数 29 13 13 9 64 患病频 率( %) 百分比 (%) 45.3 20.3 20.3 14.1 100.0 7.3 4.2 5.0 5.8 5.7
• 选择标准构成的方法通常有三种:
• 1.两组资料中任选一组资料的人口数(或人口构成)作为
两者的“共同标准”。这种方法适用于直接法。 • 2.两组资料各部分人口之和组成的人口数(或人口构成) 作为两者的“共同标准”。这种方法适用于直接法。 • 3.另外选用一个通用的或便于比较的标准作为两者的“共 同标准”,如采用全国、全省或全地区的数据作为标准。 这种方法适用于直接法和间接法。
23:34:05
2
本质是事物的根本性质,是事物自身组成要素之间相对稳定的内在
联系,是由事物本身所具有的特殊矛盾构成的。组成事物的要素以及要素
之间的关系结构是事物本质存在的客观基础,一个事物和其他事物的本质 区别是由事物的各个特殊的组成要素及其关系结构决定的。
本质
=
要素
+
关系结构
计数资料
类别
,
数量
计数资料 --》性质 --》类别 --》数量 计数资料本质的描述维度
甲疗法 治愈数 治愈率(%) 180 35 215
二、标准化率的计算
• (一)标准化方法
• 1、直接法 如对死亡率的年龄构成标准化, 若已知各属性的率(如:年龄别死亡率,可采 用); • 2、间接法 若只有总死亡数和年龄别人口数而 缺乏各属性的率(如缺年龄别死亡率),或各 年龄组人口数较小,年龄别死亡率不稳定,宜 用间接法。
当样本含量较小时,比较两样本的标准化
率,需要作假设检验。
第三节 动态数列及其指标
• 动态数列(dynamic series) • 是按时间顺序排列的统计指标(可以为绝 对数,相对数或平均数),用以观察和比 较该事物在时间上的变化和发展趋势。 • 分析动态数列常用的指标有:绝对增长量、 发展速度与增长速度、平均发展速度与平 均增长速度。
n P 为标准化死亡比(standard mortality ratio,SMR),