计数资料的统计描述
计数资料的统计描述

A.频率指标 B.构成指标 C.相对指标 D.动态数列
多选题
7.对两个总率进行标准化时,主要目的是
A.消除内部构成的差异 B.使其在实际水平下进行比较
D.使其在共同标准下进行比较 D.反映各自的实际水平
E.反映各自的相对水平
8.使用相对数时应注意
A.计算相对数的分母不宜太小 B.不要把比作率分析
C.资料要具有可比性 D.资料内部构成不同应进行标准化
E.对率和比的比较应进行假设检验
9.某医师用某新疗法治疗了2例肺癌病人,均治愈,该医师报道,他所采
用的新疗法治愈率为100%,你认为有些不妥,应建议该医生
A.增大样本含量 B.报告绝对数 C.进行有对照的临床试验
D.与国外研究资料对比 E.与历史资料对照
10.构成比的特点有
A.各部分的构成比之和为100% B.各部分的构成比之和为1 C.某部分比重的增减可影响其他部分 D.每部分的构成比可大于1
E.具体计算时,有时受尾数的影响,其总和不等于1
11.关于率,以下哪几项是错误的
A.反映某现象发生的频率或强度 B.反映某事物内部的构成
C.表示两个同类指标之比 D.表示某现象在时间上顺序排
列
E.又称为频率指标或强度指标
12.描述计数资料的主要指标是
A.构成比 B.平均数 C.率 D.相对比 E.标准差(二)论述题
1.某地某年肿瘤普查资料整理如下表。
请填补表中空缺,并分析讨论哪个
年龄组最易患肿瘤?哪个年龄组病人最多?
实习表4-1 某地某年肿瘤普查资料
年龄(岁)人口数肿瘤患者数构成比(%)患病率(1/万)。
医学统计学计数资料的统计描述(一)

医学统计学计数资料的统计描述(一)医学统计学计数资料的统计描述计数资料是医学研究中常见的数据类型,例如统计某种疾病的患病人数、治愈人数等。
如何对这些数据进行科学统计描述,成为了医学研究不可避免的问题。
一、计数资料的基本概念计数资料是指由离散数据组成的一种数据类型,这些数据仅取有限个数值,如某类疾病的患病人数(自然数)或治愈人数(非负整数)。
计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述极为重要。
二、计数资料的统计描述1. 频数频数是指计数资料中各取值出现的次数,常以小写字母n表示。
例如患病人数为0的样本数为n0,患病人数为1的样本数为n1,以此类推。
2. 频率频率是指频数与总样本数的比值,常以小写字母f表示。
例如患病人数为0的频率为f0=n0/n,患病人数为1的频率为f1=n1/n,以此类推。
频率可以体现每个取值在样本中的分布情况,是比较常用的统计指标,其和为1。
3. 百分比百分比是指频数与总样本数的比值乘以100,常以百分号表示。
例如患病人数为0的百分比为f0×100%,患病人数为1的百分比为f1×100%,以此类推。
4. 累计频率累计频率是指某一取值及其以下所有取值的频率之和,常以小写字母F 表示。
例如患病人数小于等于3的累计频率为F3=f0+f1+f2+f3。
累计频率可以体现小于等于某个取值的样本在总样本中所占比例。
三、总结计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述有益于研究者更加深入地了解样本的分布情况,进而提出相应的研究假设。
频数、频率、百分比和累计频率是计数资料的常用统计指标,可分析每个取值在样本中的分布情况和各个取值间的差异。
在实际研究中,研究者应根据实际情况选择合适的统计方法进行分析,以期得到更为科学的结论。
计数资料的统计描述

计数资料的统计描述第一节常用相对数一、绝对数定义:计数资料各类别的频数,即各分类事物的合计数。
如某病的出院人数、治愈人数、死亡人数等。
意义:绝对数反映出事物在某时、某地出现的实际水平,即实际发生的规模大小。
缺点:绝对数往往不便于互相比较。
例1:某乡两个村的调查结果为,甲村钩虫感染有150人,乙村钩虫感染有100人。
据此,我们只能说甲村钩虫感染较乙村多50人,但不能肯定甲村较乙村钩虫感染程度更为严重。
例2:甲、乙两个医院某病出院人数不同时,比较两医院该病的死亡人数没有意义。
例3:如04级七年制一、二大班学生人数不同时,比较两班医学统计学的及格人数没有意义。
二、相对数定义:两个有关的绝对数之比,统称为相对数。
意义:1.消除基数影响,便于事物间的比较。
2.给出事物发生频率(强度)的估计。
3.相对数是工作决策的依据。
常用的相对数指标•例5-1 某医院1998年在某城区随机调查了8589例60岁及以上老人,体检发现高血压患者为2823例。
高血压患病率为:(2823 / 8589 ) 100% = 32.87% 。
在实际工作中,“率”的应用非常广泛,如:发病率、死亡率、发生率、阳性率、患病率等。
当“率”的分母足够大时,常用“率”的大小表示某现象发生的概率。
第二节应用相对数的注意事项1. 计算相对数应有足够数量即分母不宜太小。
如果例数较少会使相对数波动较大。
如某种疗法治疗5例病人,5例全部治愈,则计算治愈率为5/5×100% =100%,若4例治愈,则治愈率为4/5×100% =80%,由100%至80%波动幅度较大,但实际上只有1例的变化。
•在临床试验或流行病调查中,各种偶然因素都可能导致计算结果的较大变化,因此例数很少的情况下最好用绝对数直接表示•但动物实验时,可以通过周密设计,严格控制实验条件,如毒理实验,每组用10只纯种小鼠也可以•分母到底多大才可以呢?要根据研究目的、研究指标而定2.不能以构成比代替率构成比是用以说明事物内部某种构成所占比重或分布,并不说明某现象发生的频率或强度,在实际工作中经常会出现将构成比指标按率的概念去解释的错误。
计数资料的描述和x2检验

(4)χ2界值
当自由度ν确定后,χ2分布曲线下右侧尾 部的面积为α时,横轴上相应的χ2值即为χ2
界值,表示为 χα2,ν 。
χ2界值可以通过查χ2界值表得到,当自 由度一定时,χ2值越大,P值越小;χ2值越 小,P值越大。
一、四格表资料的χ2检验
1。四格表资料(完全随机设计)
四格表的格式
分组 +
116
130
85
41
29
776
305
人口数
(ni)
241 315 175
农村 预期患病人数
( niPi)
51 145 115
58
42
789
353
④ 计算城乡两地的SMR及标准化患病率
城市SMR:
SMR = 322 = 1.05 305
城市标准化患病率: p ' = 42.1% ×1.05 = 44.2%
③ 求预期治愈人数
表5-5 直接法计算标准化率
标准治
甲疗法
病型 疗人数 原治愈率 预期治愈数
(Ni) (pi) ( Nipi)
普通型 400 60.0
240
乙疗法
原治愈率 预期治愈数
(pi)
65.0
( Nipi)
260
重型 400 35.0
140
41.7
167
合计 800
-
380
-
427
④ 计算甲、乙两种疗法的标准化治愈率
人工流产后 255
78
61.9
30.6
月经后
87
39
31.0
44.8
哺乳期
17
9
7.1
52.9
计数资料的统计描述

案例
《600例小儿烧伤休克期治疗分析》
600例烧伤患儿,210例早期有休克症状,其中 3岁以下者110例,占52%,3岁以上者100例, 占48%,年龄越小,休克发生率越高。
相对数
相对比 率 构成比
比(ratio) )
比又称相对比,是两个有关的指标之比,表示 对比指标间的数量关系,可用倍数或百分数表 示。 比=甲指标/乙指标(或×100%) / 100 甲、乙两个指标可以是绝对数,也可以是平均 数或率;可以性质相同,也可以性质不同。
各种疟疾的构成情况
1955年 类别 发病人数 恶性疟 间日疟 三日疟 合计 68 12 17 97 % 70 12 18 100 发病人数 21 12 17 50 % 42 24 34 100 1956年
相对数在应用中应注意的事项
计算相对数的分母一般不宜过小。样本量过小时计算 所得的相对数稳定性较差,受偶然性影响易产生较大 的误差。观察例数过小时应用绝对数表示。 正确区分率与构成比。构成比只能说明事物内部各组 成部分的构成或分布,并不能反映某现象发生的频率 或强度,分析资料时不要将构成比当率做解释。
急性脑出血病死率的比较
某省医院 患者 例数 1600 死亡 例数 255 病死率 (%) 15.9 患者 例数 920
某县医院 死亡 例数 101 病死率 (%) 11.0
ห้องสมุดไป่ตู้ 急性脑出血病死率的比较
某省医院 病情 患者 例数 100 500 1000 1600 死亡 例数 5 50 200 255 病死率 (%) 5 10 20 15.9 患者 例数 800 100 20 920 某县医院 死亡 例数 80 15 6 101 病死率 (%) 10 15 30 11.0
统计学-计数资料的统计描述

实际死亡数 SMR = 预期死亡数 标化率 = SMR × 标准死亡率
注意事项
(1)标化率不能反映实际水平,只 能用 )标化率不能反映实际水平, 于比较; 于比较; (2)选用标准不同,标化率会改变,但 )选用标准不同,标化率会改变, 比较结果只有一个,不能改变; 比较结果只有一个,不能改变; (3)比较标化率,也要作显著性检验。 )比较标化率,也要作显著性检验。 (4)各小组率在比较的两组有波动时 不 )各小组率在比较的两组有波动时,不 宜进行标准化。 宜进行标准化。
儿童 成人 合计
100 50 150
40 45 85
40.0 90.0 56.7
50 100 150
10 80 90
20.0 80.0 60.0 Nhomakorabea又例1-5 见P18 又例
(2)间接法: )间接法: 各小组率不清楚时选用(只知道实际死亡人数 只知道实际死亡人数) 各小组率不清楚时选用 只知道实际死亡人数 标准选用标准发生率(如标准年龄别死亡率见 如标准年龄别死亡率见P19) 标准选用标准发生率 如标准年龄别死亡率见
死亡率 =
某年内的总死亡人数
× 1000‰
未被诊断为某病的病人数 漏诊率 = ×100% 确实为该病的病人数 确实不是某病的人数 误诊率 = ×100% 被诊断该病的病人数
相对比(ratio):反映指标间的相 相对比( ):反映指标间的相 ): 对水平。 对水平。
甲指标 相对比 = 乙指标
增加了/增加到 增加了 增加到 减少了/减少到 减少了 减少到 一成/两番 一成 两番
构成比(proportion):又称构成指 构成比( ):又称构成指 ): 标,表示事物或现象内部各组成部分 的比重或分布。 的比重或分布。
计数资料的统计描述与卡方检验

25
41 45 50 28 31
女
男 女 女 男 女
1.61
1.71 1.58 1.60 1.76 1.62
AB
A B O AB Oຫໍສະໝຸດ 正常异常 正常 异常 正常 正常
+
++ ++ ++ +++ +
农民
工人 工人 干部 干部 军人
3.92
3.49 5.48 6.78 7.10 5.24
1、频数表
部分原始数据
重 中 轻
800 200 100
合计 1100
1、标准化法的基本方法
• 方法1:采用标准人口构成与原始分组率, 计算标准化率,直接比较。 • 方法2:采用分组标准化率与原始人口,计 算标准化比,间接比较。
1)、直接法--标准人口
病情程度
例数
甲医院
感染数 160 20 5 185 感染率 例数 20% 10% 5% 16.8% 800 200 100 1100
计数资料的统计描述与卡方检验
四川大学华西医院 康德英
临床研究中计数资料来源、分类
• 本身设置为分类变量(PI/ECOT) • 从计量资料转化而来:
如评价降压疗效时,将舒张压降低值分为三类: <5mmHg 无效
5-10mmHg
10-20mmHg
有效
显效
Note:计量资料转化为计数资料,过程本身损 失信息,应慎重。
4、NNT
• NNT(Numbers Needed to Treat):为避免 一例不良事件发生而需要治疗的病例数.其 值为绝对危险度的倒数(1/AR) • 类似还有:NNH(Numbers Needed to Harm)。
计数资料的统计描述

高血压 172665
40
23.2
冠心病 172665
11
脑卒中 172665
253
6.4
率
146.5
风心病 172665
38
22.0
9
常用统计指标
发病率与患病率: 某时期某人群
发病率= 中新发病人次 K 同时期平均人口数
某一时点一定人群中 患病率= 现患某病新旧病例数 K
同期平均人口数
10
病死率与死亡率
某时期内因某病死亡人数
病死率=Biblioteka K同期患某病的病人数
某地某时期死亡人数
死亡率=
K
该地同期平均人口数
11
2.结构相对数——构成比
含义:指一事物内部结构相对某一组成部分 的观察单位数与该事物各组成部分的观察 单位总数之比,常用百分数表示。
计算:
构成比=
某一组成部分的观察单位数 100 同一事物各组成部分的观察单位总数 %
合计
74.61
44298
乙地预期发 病人数
3=1*2
26.93 46.35 45.53 59.9 44.75 8.54
232
28
标准化时应注意的问题
1. 应明确在对比两组(或多组)总率或总均数 时,若内部构成明显不同,影响总率的可比 性,需作标准化处理。
2. 相互比较的两组(或几组)资料的标准化率, 应选用同一标准;选用的标准不同,算得的 标准化率也不同。标准化率仅表明对比资料 间的相对水平,并不反映某时某地该现象发 生的实际水平。
287 64.79
18
标准化的意义:
• 其合计的差别之所以大,是由于两地人 群年龄构成不同。要正确比较甲、乙两 地的总发病率,需按照统一标准进行校 正,然后进行比较。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
病例所占的比例。
•
强调的是某人群中某时间断面上患病
者的比例。
2020年3月4日星期三
重庆医科大学卫生统计教研室
•患病率与发病率区别与联系
①本质含义不同 发病危险与现患频率 ②计算方法不同 分子差异 ③观察方式不同 纵向与断面 ④应用范围不同 急性与慢性
2020年3月4日星期三
重庆医科大学卫生统计教研室
2020年3月4日星期三
重庆医科大学卫生统计教研室
•
构成比常用来表示疾病或死亡的顺位、
位次或所占比重。
2020年3月4日星期三
重庆医科大学卫生统计教研室
二、 应用相对数的注意事项
1、构成比不能代替率: 构成比是用以说明事物内部某种构成
所占比重或分布,并不说明某现象发生的 频率或强度。
例:
2020年3月4日星期三
表 某医院1990年和1998年住院病人的 五种疾病死 亡人数和构 成比
疾病构成
1990年
1998年
—————————— ——————————
死亡人数 构成比(%) 死亡人数 构成比(%)
恶性肿瘤
58
30.53
循环系统疾病
44
23.16
呼吸系统疾病
37
19.47
消化系统疾病
19
10.00
传染病
32
2020年3月4日星期三
重庆医科大学卫生统计教研室
2、两个相对比之比: ------即病例对照研究的比数比或优势比、
交叉乘积比(odds ratio,简写OR)。
见P59 例7.3
2020年3月4日星期三
重庆医科大学卫生统计教研室
3、两个率之比: ------队列研究的相对危险度(relative risk, RR),也叫危险比(risk ratio,RR)。
计数资料的统计描述
2020年3月4日星期三
重庆医科大学卫生统计教研室
一、相对数的概念及计算
• 计数资料的变量值是定性的,对其观察结果的分 析比较常用率、构成比、相对比等统计指标描述。 这些指标都是由两个有联系的指标组成,又称相 对数(relative number)。
•
计数资料常见的数据形式是绝对数,如出院
2020年3月4日星期三
重庆医科大学卫生统计教研室
• 临床观察研究中常用的计数资料相对比: 1、两类个体例数之比:
R=
A类发生的例数 ————————
B类发生的例数
2020年3月4日星期三
重庆医科大学卫生统计教研室
• 如:
某年某医院出生婴儿中,男性婴儿 370人,女性婴儿358人,则出生婴儿性别 比例为370/358*100%=103%。说明该医院 该年每出生100名女婴儿,就有103名男性 婴儿出生,它反映了男性婴儿与女性婴儿 出生的对比水平。
出当地的医疗水平(可比性)。
2020年3月4日星期三
重医科大学卫生统计教研室
实例
2020年3月4日星期三
重庆医科大学卫生统计教研室
• 2、比(ratio):
• 也称相对比,是表示两个数相除所得的值,说明 两者的相对水平,常用倍数或百分数表示.
相对比
甲指标 乙指标
(或
100%)
例如:白/球比值
×K
通常以年为单位
2020年3月4日星期三
重庆医科大学卫生统计教研室
1、 发病率(incidence rate)
(1)公式
IR= 某期某人群中某病的新病例数 同期暴露人口数
➢
×K
新发/初次诊断 一人多次发病
2020年3月4日星期三
重庆医科大学卫生统计教研室
• 1、 发病率(incidence rate)
重庆医科大学卫生统计教研室
例 •
表 某地日光性皮炎的患病情况
• 年龄段
患病例数
• 0~ • 5~ • 10~ • 15~ • 20~ • 25~ • 30~ • 35~ • 40~ • 45 ~ • >50 • 合计
1
3
4
10
28
结论:25~30岁组
37
更容易患日光性皮
18
炎?
9
2
1
1
114
2、计算相对数应有足够数量
• 标准化法的基本思想:
采用某影响因素的统一标准构成以消 除构成不同对合计率的影响,使通过标准 化后的标准化合计率具有可比性。
2020年3月4日星期三
重庆医科大学卫生统计教研室
标准化率的计算 (一)标准化方法
直接法 间接法
2020年3月4日星期三
重庆医科大学卫生统计教研室
• 标准人口构成的选择方法: • 1、比较组的各层的合计 • 2、另选一个标准构成 • 3、其中的一组
• IR= 某期某人群中某病的新病例数 × K
•
同期暴露人口数
可能发生该病的人群
不可能发病
2020年3月4日星期三
重庆医科大学卫生统计教研室
• 1、 发病率(incidence rate)
• IR= 某期某人群中某病的新病例数 × K
•
同期暴露人口数
该时期的平均人口数
2020年3月4日星期三
重庆医科大学卫生统计教研室
两个有联系的指标之比。 构成比(constituent ratio )或( proportion):
比的分子是分母的一部分。
2020年3月4日星期三
重庆医科大学卫生统计教研室
率
率(rate):说明某现象发生的频率或强度。(每单 位time变化的瞬时测量值)
rate= 发生某现象的观察单位数 × K(比例系数) 可能发生某现象的观察单位总数
人数、治愈人数、死亡人数等,但绝对数通常不
具有可比性,需要在绝对数的基础上计算相对数。
2020年3月4日星期三
重庆医科大学卫生统计教研室
• 常用的相对数有: • 率(rate):
当比例与时间有关系时称为率(如发病率、患 病率、死亡率、病死率等)。 比(ratio) 或相对比(relative ratio) :
例:
———————————————————
标准治
甲疗法
乙疗法
病型 疗人数 —————————— ———————————
(Ni) 原治愈率 (%) 预期治愈数
原治愈率 (%) 预期治愈数
(1)
(pi)
(2)
(3)
(Ni pi)
(pi)
(4)=(2)(3)
(5)
(Ni pi)
(6)=(2)(5)
____________________________________________________________
见P59 例7.2
2020年3月4日星期三
重庆医科大学卫生统计教研室
3、构成比(constituent ratio or proportion)
说明某一事物内部各组成部分所占的比重或
分布。
构成比
某事物内部某一部分的数量 某事物内部的整体数量
100%
常以百分数表示。
2020年3月4日星期三
重庆医科大学卫生统计教研室
1996.1.1
1997.1.1
图1 1995~1998年某病三年间发病情况
1998.1.1
1、死亡率(mortality rate, death rate)
(1)公式
死亡率= 某人群某年总死亡人数 × K 该人群同年平均人口总数
死亡粗率 死亡专率
2020年3月4日星期三
重庆医科大学卫生统计教研室
2020年3月4日星期三
重庆医科大学卫生统计教研室
例:某疗法治疗肝炎
甲医院治疗150人,治愈30人,治愈率为20% 乙医院治疗100人,治愈30人,治愈率为30% 两个医院合计治愈率应该是: [(30+30)/(150+100)] * 100%=24% 若算为20%+30%=50%或(20%+30%)/ 2=25%,则 是错的。
重庆医科大学卫生统计教研室
2、病死率(fatality rate)
(1)公式
病死率 = 一定时内某病死亡人数 × 100% 同期确诊的某病病例数
2020年3月4日星期三
重庆医科大学卫生统计教研室
• (2)含义
• 表示一定时期内(通常为1年),患某 病的全部病人中因该病而死亡者的比例。
• (3)应用 • 它既表明疾病的严重程度,也可反映
普通型 300
180
60.0
100
65
65.0
重型
100
35
35.0
300 125
41.7
————————————————————————————————
合计
400
215
53.8
400 190
47.5
———————————————————————————————
2020年3月4日星期三
重庆医科大学卫生统计教研室
• 分子 观察期内新发生的病人; • 同一个体多次患病,应多次计数; • 发病时间较难确定的以初次诊断作为发病时间。 分母 应为易感人口,实际大样本调查多用平均人口。
• K 比例系数,可为1000‰ 万分率 10万分率 • 时间单位 年、季、月,常以年为单位 • (2)含义 • 表示一定期间内、一定人群中某病新病例出现的
• 患病率=发病率*病程
稳定
例:患病率=376/10万 发病率=30.7/10万
计算得:病程=12.2年
2020年3月4日星期三
重庆医科大学卫生统计教研室
• 例:某地1995年年初人口为2528人,1995~1998