计数资料的统计描述
计数资料的统计描述

A.频率指标 B.构成指标 C.相对指标 D.动态数列
多选题
7.对两个总率进行标准化时,主要目的是
A.消除内部构成的差异 B.使其在实际水平下进行比较
D.使其在共同标准下进行比较 D.反映各自的实际水平
E.反映各自的相对水平
8.使用相对数时应注意
A.计算相对数的分母不宜太小 B.不要把比作率分析
C.资料要具有可比性 D.资料内部构成不同应进行标准化
E.对率和比的比较应进行假设检验
9.某医师用某新疗法治疗了2例肺癌病人,均治愈,该医师报道,他所采
用的新疗法治愈率为100%,你认为有些不妥,应建议该医生
A.增大样本含量 B.报告绝对数 C.进行有对照的临床试验
D.与国外研究资料对比 E.与历史资料对照
10.构成比的特点有
A.各部分的构成比之和为100% B.各部分的构成比之和为1 C.某部分比重的增减可影响其他部分 D.每部分的构成比可大于1
E.具体计算时,有时受尾数的影响,其总和不等于1
11.关于率,以下哪几项是错误的
A.反映某现象发生的频率或强度 B.反映某事物内部的构成
C.表示两个同类指标之比 D.表示某现象在时间上顺序排
列
E.又称为频率指标或强度指标
12.描述计数资料的主要指标是
A.构成比 B.平均数 C.率 D.相对比 E.标准差(二)论述题
1.某地某年肿瘤普查资料整理如下表。
请填补表中空缺,并分析讨论哪个
年龄组最易患肿瘤?哪个年龄组病人最多?
实习表4-1 某地某年肿瘤普查资料
年龄(岁)人口数肿瘤患者数构成比(%)患病率(1/万)。
医学统计学计数资料的统计描述(一)

医学统计学计数资料的统计描述(一)医学统计学计数资料的统计描述计数资料是医学研究中常见的数据类型,例如统计某种疾病的患病人数、治愈人数等。
如何对这些数据进行科学统计描述,成为了医学研究不可避免的问题。
一、计数资料的基本概念计数资料是指由离散数据组成的一种数据类型,这些数据仅取有限个数值,如某类疾病的患病人数(自然数)或治愈人数(非负整数)。
计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述极为重要。
二、计数资料的统计描述1. 频数频数是指计数资料中各取值出现的次数,常以小写字母n表示。
例如患病人数为0的样本数为n0,患病人数为1的样本数为n1,以此类推。
2. 频率频率是指频数与总样本数的比值,常以小写字母f表示。
例如患病人数为0的频率为f0=n0/n,患病人数为1的频率为f1=n1/n,以此类推。
频率可以体现每个取值在样本中的分布情况,是比较常用的统计指标,其和为1。
3. 百分比百分比是指频数与总样本数的比值乘以100,常以百分号表示。
例如患病人数为0的百分比为f0×100%,患病人数为1的百分比为f1×100%,以此类推。
4. 累计频率累计频率是指某一取值及其以下所有取值的频率之和,常以小写字母F 表示。
例如患病人数小于等于3的累计频率为F3=f0+f1+f2+f3。
累计频率可以体现小于等于某个取值的样本在总样本中所占比例。
三、总结计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述有益于研究者更加深入地了解样本的分布情况,进而提出相应的研究假设。
频数、频率、百分比和累计频率是计数资料的常用统计指标,可分析每个取值在样本中的分布情况和各个取值间的差异。
在实际研究中,研究者应根据实际情况选择合适的统计方法进行分析,以期得到更为科学的结论。
计数资料的统计描述

计数资料的统计描述第一节常用相对数一、绝对数定义:计数资料各类别的频数,即各分类事物的合计数。
如某病的出院人数、治愈人数、死亡人数等。
意义:绝对数反映出事物在某时、某地出现的实际水平,即实际发生的规模大小。
缺点:绝对数往往不便于互相比较。
例1:某乡两个村的调查结果为,甲村钩虫感染有150人,乙村钩虫感染有100人。
据此,我们只能说甲村钩虫感染较乙村多50人,但不能肯定甲村较乙村钩虫感染程度更为严重。
例2:甲、乙两个医院某病出院人数不同时,比较两医院该病的死亡人数没有意义。
例3:如04级七年制一、二大班学生人数不同时,比较两班医学统计学的及格人数没有意义。
二、相对数定义:两个有关的绝对数之比,统称为相对数。
意义:1.消除基数影响,便于事物间的比较。
2.给出事物发生频率(强度)的估计。
3.相对数是工作决策的依据。
常用的相对数指标•例5-1 某医院1998年在某城区随机调查了8589例60岁及以上老人,体检发现高血压患者为2823例。
高血压患病率为:(2823 / 8589 ) 100% = 32.87% 。
在实际工作中,“率”的应用非常广泛,如:发病率、死亡率、发生率、阳性率、患病率等。
当“率”的分母足够大时,常用“率”的大小表示某现象发生的概率。
第二节应用相对数的注意事项1. 计算相对数应有足够数量即分母不宜太小。
如果例数较少会使相对数波动较大。
如某种疗法治疗5例病人,5例全部治愈,则计算治愈率为5/5×100% =100%,若4例治愈,则治愈率为4/5×100% =80%,由100%至80%波动幅度较大,但实际上只有1例的变化。
•在临床试验或流行病调查中,各种偶然因素都可能导致计算结果的较大变化,因此例数很少的情况下最好用绝对数直接表示•但动物实验时,可以通过周密设计,严格控制实验条件,如毒理实验,每组用10只纯种小鼠也可以•分母到底多大才可以呢?要根据研究目的、研究指标而定2.不能以构成比代替率构成比是用以说明事物内部某种构成所占比重或分布,并不说明某现象发生的频率或强度,在实际工作中经常会出现将构成比指标按率的概念去解释的错误。
计数资料统计描述

常用的相对数: 一、率。 二、构统计描述
计数资料常见的数据形式是绝对数,如某病的 出院人数、治愈人数、死亡人数等。 但绝对数通常不具有可比性: 1、如甲、乙两个医院某病出院人数不同时,比 较两医院该病的死亡人数没有意义 2、如00级七年制一、二大班学生人数不同时, 比较两班医学统计学的及格人数没有意义 因此需要在绝对数的基础上计算相对数。
医学统计学---统计推断
EContent
Rate、constituent ratio and ratio Application of relative measurement Standardization rate Dynamic series 牛牛文档分享第一节 常用相对数
式中比例基数,可以取100%、1000‰、 10万/10万…等。 比例基数的选择主要根据习惯用法和使计 算的结果能保留1~2位整数,以便阅读。 例如患病率通常用百分率、婴儿死亡率用 千分率、肿瘤死亡享
第一节 常用相对数
构成比有两个特点: (1)说明同一事物的k个构成比的总和应 等于 100% ,即各个分子的总和等于分母。 ( 2 )各构成部分之间是相互影响的,某 一部分比重的变化受到两方面因素的影响。 其一是这个部分自身数值的变化,其二是 受其它部分数值变化的影响。 牛牛文档分享第一节 常用相对数
表 5-1 中, 1990 与 1998 年住院病人五种疾病死 因构成的总和均为100%。 1998年呼吸系统疾病死亡人数比1990 年少,但 构成比却比较接近;再看两年的循环系统疾病 死亡人数相同,而1998年的构成比却较1990年 高,这不能说明 1998 年循环系统疾病的病死严 重程度较1990年高。 死因构成比只能说明某病死亡人数在总死亡人 数中所占比重,如需要比较其病死的严重程度, 则要计算病死率。
计数资料的描述和x2检验

(4)χ2界值
当自由度ν确定后,χ2分布曲线下右侧尾 部的面积为α时,横轴上相应的χ2值即为χ2
界值,表示为 χα2,ν 。
χ2界值可以通过查χ2界值表得到,当自 由度一定时,χ2值越大,P值越小;χ2值越 小,P值越大。
一、四格表资料的χ2检验
1。四格表资料(完全随机设计)
四格表的格式
分组 +
116
130
85
41
29
776
305
人口数
(ni)
241 315 175
农村 预期患病人数
( niPi)
51 145 115
58
42
789
353
④ 计算城乡两地的SMR及标准化患病率
城市SMR:
SMR = 322 = 1.05 305
城市标准化患病率: p ' = 42.1% ×1.05 = 44.2%
③ 求预期治愈人数
表5-5 直接法计算标准化率
标准治
甲疗法
病型 疗人数 原治愈率 预期治愈数
(Ni) (pi) ( Nipi)
普通型 400 60.0
240
乙疗法
原治愈率 预期治愈数
(pi)
65.0
( Nipi)
260
重型 400 35.0
140
41.7
167
合计 800
-
380
-
427
④ 计算甲、乙两种疗法的标准化治愈率
人工流产后 255
78
61.9
30.6
月经后
87
39
31.0
44.8
哺乳期
17
9
7.1
52.9
计数资料的统计描述

率
236 458 447 584 735 458
7
发病率与患病率
指标 发病率 时点(时期) 时点(时期) 患病率 分子 时期内新发生的某病 时期内新发生的某病 新发生 病例数 时点(时期) 时点(时期)现患 疾病人数 分母 可能发病平均 人口数 检查人口数
8
病死率与死亡率
指标 病死率 死亡率 分子 时期内因某病 时期内因某病 死亡人数 死亡人数 某地某人群某时期内 的死亡人数 分母 同期患某病人数 该地同期 平均人口数
22
表 9 直接法计算甲乙两地标化死亡率(‰)
年龄 组 05204060合计
标准人口数 (Ni) 14100 18800 54300 10400 2400 100000(N)
甲地 原 死亡 预期死亡数 率 pi Nipi 57.2 807 3.6 68 5.3 288 12.1 126 40.0 96 16.19 1385
16
计算甲乙两地的平均死亡率? 计算甲乙两地的平均死亡率?
表 6 甲乙两地各年龄组人口数及死亡率(‰)
年龄 组 05204060合计
甲地 人口数 构成比(%) 死亡率 9300 18.6 57.2 12200 24.4 3.6 19000 38 5.3 7600 15.2 12.1 1900 3.8 40.0 50,000 100.0 16.19
乙地 原 死亡 预期死亡数 率 pi Nipi 72.9 1028 4.6 86 7.2 391 14.2 148 46.0 110 13.90 1763
23
2.间接标准化法的计算: 2.间接标准化法的计算:已知 间接标准化法的计算
r = P× SMR p′ = P ∑ni Pi
P:为标准总死亡率, 为标准总死亡率, r:为实际总死亡数, 为实际总死亡数, 为实际年龄别人口数, ni:为实际年龄别人口数, 为标准年龄别死亡率, Pi:为标准年龄别死亡率, 为预期死亡数, ∑niPi:为预期死亡数, 为标准化死亡比, SMR表示 表示。 r/∑niPi:为标准化死亡比,用SMR表示。
计数资料的统计描述
案例
《600例小儿烧伤休克期治疗分析》
600例烧伤患儿,210例早期有休克症状,其中 3岁以下者110例,占52%,3岁以上者100例, 占48%,年龄越小,休克发生率越高。
相对数
相对比 率 构成比
比(ratio) )
比又称相对比,是两个有关的指标之比,表示 对比指标间的数量关系,可用倍数或百分数表 示。 比=甲指标/乙指标(或×100%) / 100 甲、乙两个指标可以是绝对数,也可以是平均 数或率;可以性质相同,也可以性质不同。
各种疟疾的构成情况
1955年 类别 发病人数 恶性疟 间日疟 三日疟 合计 68 12 17 97 % 70 12 18 100 发病人数 21 12 17 50 % 42 24 34 100 1956年
相对数在应用中应注意的事项
计算相对数的分母一般不宜过小。样本量过小时计算 所得的相对数稳定性较差,受偶然性影响易产生较大 的误差。观察例数过小时应用绝对数表示。 正确区分率与构成比。构成比只能说明事物内部各组 成部分的构成或分布,并不能反映某现象发生的频率 或强度,分析资料时不要将构成比当率做解释。
急性脑出血病死率的比较
某省医院 患者 例数 1600 死亡 例数 255 病死率 (%) 15.9 患者 例数 920
某县医院 死亡 例数 101 病死率 (%) 11.0
ห้องสมุดไป่ตู้ 急性脑出血病死率的比较
某省医院 病情 患者 例数 100 500 1000 1600 死亡 例数 5 50 200 255 病死率 (%) 5 10 20 15.9 患者 例数 800 100 20 920 某县医院 死亡 例数 80 15 6 101 病死率 (%) 10 15 30 11.0
计数资料的统计描述与卡方检验
25
41 45 50 28 31
女
男 女 女 男 女
1.61
1.71 1.58 1.60 1.76 1.62
AB
A B O AB Oຫໍສະໝຸດ 正常异常 正常 异常 正常 正常
+
++ ++ ++ +++ +
农民
工人 工人 干部 干部 军人
3.92
3.49 5.48 6.78 7.10 5.24
1、频数表
部分原始数据
重 中 轻
800 200 100
合计 1100
1、标准化法的基本方法
• 方法1:采用标准人口构成与原始分组率, 计算标准化率,直接比较。 • 方法2:采用分组标准化率与原始人口,计 算标准化比,间接比较。
1)、直接法--标准人口
病情程度
例数
甲医院
感染数 160 20 5 185 感染率 例数 20% 10% 5% 16.8% 800 200 100 1100
计数资料的统计描述与卡方检验
四川大学华西医院 康德英
临床研究中计数资料来源、分类
• 本身设置为分类变量(PI/ECOT) • 从计量资料转化而来:
如评价降压疗效时,将舒张压降低值分为三类: <5mmHg 无效
5-10mmHg
10-20mmHg
有效
显效
Note:计量资料转化为计数资料,过程本身损 失信息,应慎重。
4、NNT
• NNT(Numbers Needed to Treat):为避免 一例不良事件发生而需要治疗的病例数.其 值为绝对危险度的倒数(1/AR) • 类似还有:NNH(Numbers Needed to Harm)。
计数资料的统计描述
高血压 172665
40
23.2
冠心病 172665
11
脑卒中 172665
253
6.4
率
146.5
风心病 172665
38
22.0
9
常用统计指标
发病率与患病率: 某时期某人群
发病率= 中新发病人次 K 同时期平均人口数
某一时点一定人群中 患病率= 现患某病新旧病例数 K
同期平均人口数
10
病死率与死亡率
某时期内因某病死亡人数
病死率=Biblioteka K同期患某病的病人数
某地某时期死亡人数
死亡率=
K
该地同期平均人口数
11
2.结构相对数——构成比
含义:指一事物内部结构相对某一组成部分 的观察单位数与该事物各组成部分的观察 单位总数之比,常用百分数表示。
计算:
构成比=
某一组成部分的观察单位数 100 同一事物各组成部分的观察单位总数 %
合计
74.61
44298
乙地预期发 病人数
3=1*2
26.93 46.35 45.53 59.9 44.75 8.54
232
28
标准化时应注意的问题
1. 应明确在对比两组(或多组)总率或总均数 时,若内部构成明显不同,影响总率的可比 性,需作标准化处理。
2. 相互比较的两组(或几组)资料的标准化率, 应选用同一标准;选用的标准不同,算得的 标准化率也不同。标准化率仅表明对比资料 间的相对水平,并不反映某时某地该现象发 生的实际水平。
287 64.79
18
标准化的意义:
• 其合计的差别之所以大,是由于两地人 群年龄构成不同。要正确比较甲、乙两 地的总发病率,需按照统一标准进行校 正,然后进行比较。
第3讲 计量资料与计数资料的统计描述
1、计量资料 (measurement data)
用仪器、工具等测量方法获得的数据,又称数值变量。 特点:有计量单位,如患者的身高(cm),体重(kg),血压(kPa)等.
2、计数资料 (count data)
按某种属性分类计数后得到的数据,又称无序分类变量,有二分 类和多分类两种情形.
366
28 34
35
10
34
78
57
248
30 11
14
11
22
39
17
114
32 14
2
3
14
24
3
60
34
4
2
5
3
12
2
28
36
2
1
1
4
5
1
14
38
3
1
1
0
2
1
8
40
0
0
2
0
0
0
2
合计 207
141
102
208 537 206 1401
2、常用相对数指标
计数资料常用的数据形式是绝对数,如某病的出院人数,治愈人数 等.但绝对数不具可比性,需要计算相对数.
2、三线表
表号 标题(包括何时、何地、何事)
横标目的 总标目 横标目
┋
总标目
纵标目 纵标目
××× ×××
××
××
总 标 目(单位)
纵标目
纵标目
××. ×× ××. ××
×. ×× ×. ××
┋ ┋ 合计
┋ ┋ ×××
┋ ┋ ×××
┋ ┋ ×:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5. 样本率(或构成比)同样 存在抽样误差,故应进行样本率 (或构成比)差别的假设检验。
第三节 率的标准化法
一、标准化法的意义和基本思想
➢ 标准化法 当两组资料内部构成不同,且各小组 率亦明显不同时,不能直接比较两个合计率,而 须采用统一的标准校正后方能比较,这种采用统 一的内部构成,然后计算标准化率的方法,称为 标准化法。
➢ 标准化法的基本思想 采用某影响因素的统一标 准构成以消除构成不同对合计率的影响,使通过 标准化后的标准化合计率具有可比性。
计数资料的统计描述
第一节 常用相对数 第二节 应用相对数的注意事项 第三节 率的标准化法 第四节 动态数列及其分析指标
计数资料(分类资料): 总体:有限或无限个定性(分类)变量值
样本:从总体中抽取的n个定性(分类)变量值
整理为:分类个体数,即:计数资料频数表
绝对数
相对数即两个有联系的指标之比,分为强度 相对数和结构相对数两种。
n1 n2
例如 用某疗法治疗肝炎,甲医
院治疗150人,治愈30人,治愈率为 20%;乙医院治疗100人,治愈30人, 治愈率为30%。两个医院合计治愈率 应该是[(30+30)/(150+100)] ×100% =24%。
(1)观察对象是否同质,研究方法是否相同, 观察时间是否相等,以及地区、周围环境、风俗习 惯和经济条件是否一致或相近等。
相对比=甲乙指指标标 (100%)
式中两指标可以是绝对数、相对数或平均数。
例5-3 某年某医院出生婴儿中,男性
婴 儿 为 370 人 , 女 性 婴 儿 为 358 人 , 则 出生婴儿性别比例为370/358= 1.03, 说明该医院该年每出生100名女婴儿, 就有103名男性婴儿出生,它反映了男 性婴儿与女性婴儿出生的对比水平。
高血压病人
5
例,高血压发病率为
5 2839
1000‰ = 1.76‰ 。
1.意义:表示事物内部某一部分的个体数 与该事物各部分个体数的总和之比,用来说明 各构成部分在总体中所占的比重或分布,又称 为构成比或百分比。
构成比
某一组成部分的观察单位数 同一事物各组成部分的观察单位总数
100%
设某事物个体数的合计由A1,A2,···, Ak个部分组成,构成比的计算为
率
某时期内发生某现象的观察单位数 同期可能发生某现象的观察单位总数
比例基数
*:比例基数的选择: 习惯用法
使计算的结果能保留1~2位整数,以便阅读。 例如患病率通常用百分率、婴儿死亡率用千分率、
肿瘤死亡率以十万分率表示。
例 5-1 某企业 2003 年有 2839 名职工,该
企业每年都对职工进行体检,这一年新发生
表5-1 某医院五种疾病死亡人数和构成比
疾病构成
1990 年 死亡人数 构成比(%)
恶性肿瘤
58
循环系统疾病
44
呼吸系统疾病
37
消化系统疾病
19
传染病
32
30.53 23.16 19.47 10.00 16.84
合计
190
100.00
1998 年 死亡人数 构成比(%)
40
26.85
44
29.53
年龄组(岁) 患者人数
患者构成比(%)
0~
9
3.8
10~
36
15.3
20~
34
14.4
30~
37
15.7
40~
45
19.1
50~
39
16.5
60~
21
8.9
70~
15
6.3
合计
236
100.0
例如 某医师对口腔门诊不同年龄龋齿患病情况
( 表 5-3 ) 进 行 了 分 析 , 得 出 40~49 岁 组 患 病 率 高 , 0~9岁组和70岁及以上组患病率低的错误结论。
2. 计算相对数分母不宜太小
如果例数较少会使相对数波动较大。如某种疗 法治疗5例病人5例全部治愈,则计算治愈率为 5/5×100% =100%,若4例治愈,则治愈率为 4/5×100% =80%,由100%至80%波动幅度较大, 但实际上只有1例的变化。
若 p1 X1 n1 , p2 X 2 n2 则合计率p X1 X 2
29
19.46
18
12.08
18
12.08
149
100.00
(1)说明同一事物的k个构成比的总和应等于
100%,即各个分子的总和等于分母。
(2)各构成部分之间是相互影响的,某一部分 比重的变化受到两方面因素的影响。其一是这个 部分自身数值的变化,其二是受其它部分数值变 化的影响。
即两个有关指标之比,说明两指标间的比例 关系。两个指标可以是性质相同,如不同时期发 病数之比;也可以性质不同,如医院的门诊人次 与病床数之比。通常以倍数或百分数(%)表示, 计算公式为
1. 不能以构成比代率
表5-2 已婚育龄妇女不同情况下放环失败率的比较
放环情况 放环人数 失败人数 失败人数比(%) 失败率(%)
(1) (2) (3)
(4)
(5)
人工流产后 255
78
61.9
30.6
月经后
87
39
31.0
44.8
哺乳期
17
9
7.1
52.9
合计
359
126
诊龋齿患者年龄构成
构成比1
A1 A1+A2 +Ak
100%
构成比2
A2 A1+A2 + + Ak
100%
·
·
·
构成比k
Ak A1+A2 + + Ak
100%
k个构成比的合计应为100%。
例5-2 某医院1990年和1998年住院病人死
于五种疾病的人数见表5-1。1990年因五种疾病死 亡的人数共190人,其中死于恶性肿瘤者58人, 恶性肿瘤死亡人数占五种疾病死亡人数的构成比 为58/190×100%=30.53%。同理可分别计算出 1990年和1998年循环系统疾病、呼吸系统疾病等 死亡占五种疾病死亡人数的构成比,结果见下表。
常用相对数指标有比、比例和率三种:
比(ratio):两个有关指标之比; ➢ 比例(proportion):比的分子是分母的一部分; ➢ 率(rate):与时间有关系的比例。
第一节 常用相对数
1.意义:说明某现象发生的频率或强度, 又称为率。常以百分率(%)、千分率 ( ‰ ) 、 万 分 率 ( 1/ 万 ) 、 十 万 分 率 (1/10万)等表示。