计数资料的统计描述解析
医学统计学计数资料的统计描述(一)

医学统计学计数资料的统计描述(一)医学统计学计数资料的统计描述计数资料是医学研究中常见的数据类型,例如统计某种疾病的患病人数、治愈人数等。
如何对这些数据进行科学统计描述,成为了医学研究不可避免的问题。
一、计数资料的基本概念计数资料是指由离散数据组成的一种数据类型,这些数据仅取有限个数值,如某类疾病的患病人数(自然数)或治愈人数(非负整数)。
计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述极为重要。
二、计数资料的统计描述1. 频数频数是指计数资料中各取值出现的次数,常以小写字母n表示。
例如患病人数为0的样本数为n0,患病人数为1的样本数为n1,以此类推。
2. 频率频率是指频数与总样本数的比值,常以小写字母f表示。
例如患病人数为0的频率为f0=n0/n,患病人数为1的频率为f1=n1/n,以此类推。
频率可以体现每个取值在样本中的分布情况,是比较常用的统计指标,其和为1。
3. 百分比百分比是指频数与总样本数的比值乘以100,常以百分号表示。
例如患病人数为0的百分比为f0×100%,患病人数为1的百分比为f1×100%,以此类推。
4. 累计频率累计频率是指某一取值及其以下所有取值的频率之和,常以小写字母F 表示。
例如患病人数小于等于3的累计频率为F3=f0+f1+f2+f3。
累计频率可以体现小于等于某个取值的样本在总样本中所占比例。
三、总结计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述有益于研究者更加深入地了解样本的分布情况,进而提出相应的研究假设。
频数、频率、百分比和累计频率是计数资料的常用统计指标,可分析每个取值在样本中的分布情况和各个取值间的差异。
在实际研究中,研究者应根据实际情况选择合适的统计方法进行分析,以期得到更为科学的结论。
计数资料的统计描述

计数资料的统计描述第一节常用相对数一、绝对数定义:计数资料各类别的频数,即各分类事物的合计数。
如某病的出院人数、治愈人数、死亡人数等。
意义:绝对数反映出事物在某时、某地出现的实际水平,即实际发生的规模大小。
缺点:绝对数往往不便于互相比较。
例1:某乡两个村的调查结果为,甲村钩虫感染有150人,乙村钩虫感染有100人。
据此,我们只能说甲村钩虫感染较乙村多50人,但不能肯定甲村较乙村钩虫感染程度更为严重。
例2:甲、乙两个医院某病出院人数不同时,比较两医院该病的死亡人数没有意义。
例3:如04级七年制一、二大班学生人数不同时,比较两班医学统计学的及格人数没有意义。
二、相对数定义:两个有关的绝对数之比,统称为相对数。
意义:1.消除基数影响,便于事物间的比较。
2.给出事物发生频率(强度)的估计。
3.相对数是工作决策的依据。
常用的相对数指标•例5-1 某医院1998年在某城区随机调查了8589例60岁及以上老人,体检发现高血压患者为2823例。
高血压患病率为:(2823 / 8589 ) 100% = 32.87% 。
在实际工作中,“率”的应用非常广泛,如:发病率、死亡率、发生率、阳性率、患病率等。
当“率”的分母足够大时,常用“率”的大小表示某现象发生的概率。
第二节应用相对数的注意事项1. 计算相对数应有足够数量即分母不宜太小。
如果例数较少会使相对数波动较大。
如某种疗法治疗5例病人,5例全部治愈,则计算治愈率为5/5×100% =100%,若4例治愈,则治愈率为4/5×100% =80%,由100%至80%波动幅度较大,但实际上只有1例的变化。
•在临床试验或流行病调查中,各种偶然因素都可能导致计算结果的较大变化,因此例数很少的情况下最好用绝对数直接表示•但动物实验时,可以通过周密设计,严格控制实验条件,如毒理实验,每组用10只纯种小鼠也可以•分母到底多大才可以呢?要根据研究目的、研究指标而定2.不能以构成比代替率构成比是用以说明事物内部某种构成所占比重或分布,并不说明某现象发生的频率或强度,在实际工作中经常会出现将构成比指标按率的概念去解释的错误。
计数资料的统计描述

率
236 458 447 584 735 458
7
发病率与患病率
指标 发病率 时点(时期) 时点(时期) 患病率 分子 时期内新发生的某病 时期内新发生的某病 新发生 病例数 时点(时期) 时点(时期)现患 疾病人数 分母 可能发病平均 人口数 检查人口数
8
病死率与死亡率
指标 病死率 死亡率 分子 时期内因某病 时期内因某病 死亡人数 死亡人数 某地某人群某时期内 的死亡人数 分母 同期患某病人数 该地同期 平均人口数
22
表 9 直接法计算甲乙两地标化死亡率(‰)
年龄 组 05204060合计
标准人口数 (Ni) 14100 18800 54300 10400 2400 100000(N)
甲地 原 死亡 预期死亡数 率 pi Nipi 57.2 807 3.6 68 5.3 288 12.1 126 40.0 96 16.19 1385
16
计算甲乙两地的平均死亡率? 计算甲乙两地的平均死亡率?
表 6 甲乙两地各年龄组人口数及死亡率(‰)
年龄 组 05204060合计
甲地 人口数 构成比(%) 死亡率 9300 18.6 57.2 12200 24.4 3.6 19000 38 5.3 7600 15.2 12.1 1900 3.8 40.0 50,000 100.0 16.19
乙地 原 死亡 预期死亡数 率 pi Nipi 72.9 1028 4.6 86 7.2 391 14.2 148 46.0 110 13.90 1763
23
2.间接标准化法的计算: 2.间接标准化法的计算:已知 间接标准化法的计算
r = P× SMR p′ = P ∑ni Pi
P:为标准总死亡率, 为标准总死亡率, r:为实际总死亡数, 为实际总死亡数, 为实际年龄别人口数, ni:为实际年龄别人口数, 为标准年龄别死亡率, Pi:为标准年龄别死亡率, 为预期死亡数, ∑niPi:为预期死亡数, 为标准化死亡比, SMR表示 表示。 r/∑niPi:为标准化死亡比,用SMR表示。
计数资料的统计描述

案例
《600例小儿烧伤休克期治疗分析》
600例烧伤患儿,210例早期有休克症状,其中 3岁以下者110例,占52%,3岁以上者100例, 占48%,年龄越小,休克发生率越高。
相对数
相对比 率 构成比
比(ratio) )
比又称相对比,是两个有关的指标之比,表示 对比指标间的数量关系,可用倍数或百分数表 示。 比=甲指标/乙指标(或×100%) / 100 甲、乙两个指标可以是绝对数,也可以是平均 数或率;可以性质相同,也可以性质不同。
各种疟疾的构成情况
1955年 类别 发病人数 恶性疟 间日疟 三日疟 合计 68 12 17 97 % 70 12 18 100 发病人数 21 12 17 50 % 42 24 34 100 1956年
相对数在应用中应注意的事项
计算相对数的分母一般不宜过小。样本量过小时计算 所得的相对数稳定性较差,受偶然性影响易产生较大 的误差。观察例数过小时应用绝对数表示。 正确区分率与构成比。构成比只能说明事物内部各组 成部分的构成或分布,并不能反映某现象发生的频率 或强度,分析资料时不要将构成比当率做解释。
急性脑出血病死率的比较
某省医院 患者 例数 1600 死亡 例数 255 病死率 (%) 15.9 患者 例数 920
某县医院 死亡 例数 101 病死率 (%) 11.0
ห้องสมุดไป่ตู้ 急性脑出血病死率的比较
某省医院 病情 患者 例数 100 500 1000 1600 死亡 例数 5 50 200 255 病死率 (%) 5 10 20 15.9 患者 例数 800 100 20 920 某县医院 死亡 例数 80 15 6 101 病死率 (%) 10 15 30 11.0
计数资料的统计描述和推断PPT课件

详细描述
介绍假设检验的基本原理和方法,通过具体实例演示如何进 行计数资料的假设检验,包括提出假设、选择检验方法、确 定样本量、收集数据、计算检验统计量等步骤,说明假设检 验在数据分析中的意义和作用。
偏态”。
相对频数
各组的频数与数据总数 的比值,反映各组频数 在数据分布中的相对地
位。
描述性统计指标
01
02
03
04
计数
数据点的数量,即数据的规模 。
百分比
某一数据值占总数据值的比例 ,用于描述数据的相对大小。
比率
两个数据值的相对大小,用于 描述数据的相对位置。
中位数
将数据从小到大排列后,位于 中间位置的数据值,用于描述
报告结果
清晰地报告假设检验的结果,包括使用的统计量、显著 性水平、p值以及结论。
04 方差分析
方差分析的基本思想
方差分析是通过比较不同组别数据的 离散程度和平均水平,来检验各组之 间的差异是否显著的一种统计方法。
方差分析的基本思想是将总变异分解 为组间变异和组内变异,并比较两者 的大小,以判断各组之间是否存在显 著差异。
多元线性回归分析
多元线性回归分析涉及多个自变量和 一个因变量,并假定因变量和自变量 之间存在线性关系。
多元线性回归分析的步骤与一元线性 回归分析类似,但需要更多的计算和 统计方法来处理多个自变量之间的关 系和交互作用。
多元线性回归分析的目的是通过多个 自变量来预测因变量的值,并给出预 测值的范围和精度。
案例二:参数估计实例分析
总结词
通过实例演示如何利用参数估计方法对总体率或总体均数进行估计,比较不同估 计方法的优缺点。
计数资料的统计描述

高血压 172665
40
23.2
冠心病 172665
11
脑卒中 172665
253
6.4
率
146.5
风心病 172665
38
22.0
9
常用统计指标
发病率与患病率: 某时期某人群
发病率= 中新发病人次 K 同时期平均人口数
某一时点一定人群中 患病率= 现患某病新旧病例数 K
同期平均人口数
10
病死率与死亡率
某时期内因某病死亡人数
病死率=Biblioteka K同期患某病的病人数
某地某时期死亡人数
死亡率=
K
该地同期平均人口数
11
2.结构相对数——构成比
含义:指一事物内部结构相对某一组成部分 的观察单位数与该事物各组成部分的观察 单位总数之比,常用百分数表示。
计算:
构成比=
某一组成部分的观察单位数 100 同一事物各组成部分的观察单位总数 %
合计
74.61
44298
乙地预期发 病人数
3=1*2
26.93 46.35 45.53 59.9 44.75 8.54
232
28
标准化时应注意的问题
1. 应明确在对比两组(或多组)总率或总均数 时,若内部构成明显不同,影响总率的可比 性,需作标准化处理。
2. 相互比较的两组(或几组)资料的标准化率, 应选用同一标准;选用的标准不同,算得的 标准化率也不同。标准化率仅表明对比资料 间的相对水平,并不反映某时某地该现象发 生的实际水平。
287 64.79
18
标准化的意义:
• 其合计的差别之所以大,是由于两地人 群年龄构成不同。要正确比较甲、乙两 地的总发病率,需按照统一标准进行校 正,然后进行比较。
计数资料的统计分析

2.多个样本率的比较 例10.6(P184) H0:3种疗法的有效率相同 H1:3种疗法的有效率不相同或不全相同 χ2=8.143 ν=2 χ20.01=9.21 χ20.05=5.99
R╳C列联表的统计分析
不同形式的资料,适用于不同的统计分析方法:
1.行、列变量均无序——χ2检验 检验多个率或构成比之间的差别有 无统计学意义 2.行、列变量之一有序——Kruskal-Wallis 3.行、列变量皆有序——Jonckheere-Terpstra 对于2和3的两种情况,如果使用χ2检验,则检验的 是各行的构成比是否不同,反映的行列变量之间有 无关系,并不能检验出行列变量之间是否存在某种 趋势。
行、列之一有序的R╳C列联表:
K-W 检验的计算步骤: 1.计算各列的平均秩次(rank mean)。 (n1+1)/2 (j=1)
Rmi=
n
k 1
j 1
k
(n j 1) / 2(j=2,3,)
2.计算各行之秩和(rank sum) c RSi= xij RM i
j 1
3. H 12
计数资料的统计分析
实例
例1 两组雌鼠,伺以高蛋白和低蛋白饲料,8周后记录
各鼠的体重增加量(克),数据如下:
高蛋白组
低蛋白组
134 146 104 119 124
70 118 101 85 107
161 107
132 94
83 113 129
97 123
例2 某种基因型在糖尿病病人和非病人分布如下表
T (63 65.34) 2 (16 13.66) 2 (47 44.66) 2 (7 9.34) 2 65.34 13.66 44.66 9.34 1.192
第3讲 计量资料与计数资料的统计描述

1、计量资料 (measurement data)
用仪器、工具等测量方法获得的数据,又称数值变量。 特点:有计量单位,如患者的身高(cm),体重(kg),血压(kPa)等.
2、计数资料 (count data)
按某种属性分类计数后得到的数据,又称无序分类变量,有二分 类和多分类两种情形.
366
28 34
35
10
34
78
57
248
30 11
14
11
22
39
17
114
32 14
2
3
14
24
3
60
34
4
2
5
3
12
2
28
36
2
1
1
4
5
1
14
38
3
1
1
0
2
1
8
40
0
0
2
0
0
0
2
合计 207
141
102
208 537 206 1401
2、常用相对数指标
计数资料常用的数据形式是绝对数,如某病的出院人数,治愈人数 等.但绝对数不具可比性,需要计算相对数.
2、三线表
表号 标题(包括何时、何地、何事)
横标目的 总标目 横标目
┋
总标目
纵标目 纵标目
××× ×××
××
××
总 标 目(单位)
纵标目
纵标目
××. ×× ××. ××
×. ×× ×. ××
┋ ┋ 合计
┋ ┋ ×××
┋ ┋ ×××
┋ ┋ ×:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•
例:某地1995年年初人口为2528人,1995~1998 年某病三年间发病情况见图,期间无死亡、迁走或 拒绝检查者。
发病 病程
1995.1.1
1996.1.1
1997.1.1
1998.1.1
图1 1995~1998年某病三年间发病情况
1、死亡率(mortality rate, death rate)
•
× K
同期平均人口数
=开始时点上的患病率+该期间内发病率
2018年10月21日星期日
重庆医科大学卫生统计教研室
• (2)含义
• • 指某特定时间内总人口中,某病新旧 病例所占的比例。 强调的是某人群中某时间断面上患病 者的比例。
2018年10月21日星期日
重庆医科大学卫生统计教研室
•患病率与发病率区别与联系
不可能发病
× K
可能发生该病的人群
2018年10月21日星期日
重庆医科大学卫生统计教研室
• 1、 发病率(incidence rate)
• IR= • 某期某人群中某病的新病例数 同期暴露人口数
该时期的平均人口数
× K
2018年10月21日星期日
重庆医科大学卫生统计教研室
• 分子 观察期内新发生的病人; • • 同一个体多次患病,应多次计数; 发病时间较难确定的以初次诊断作为发病时间 。
比的分子是分母的一部分。
2018年10月21日星期日
重庆医科大学卫生统计教研室
率
率(rate):说明某现象发生的频率或强度。(每单 位time变化的瞬时测量值)
rate= 发生某现象的观察单位数 × K(比例系数) 可能发生某现象的观察单位总数
K=100% 1000‰ 万分率 10万分率
2018年10月21日星期日
重庆医科大学卫生统计教研室
•
• •
常用的率:
发病率与患病率 死亡率与病死率
2018年10月21日星期日
重庆医科大学卫生统计教研室
• 1、 发病率(incidence rate) • (1)公式 • • IR= 某期某人群中某病的新病例数 同期暴露人口数 × K
通常以年为单位
2018年10月21日星期日 重庆医科大学卫生统计教研室
2018年10月21日星期日
重庆医科大学卫生统计教研室
• 临床观察研究中常用的计数资料相对比:
1、两类个体例数之比: A类发生的例数 R = ———————— B类发生的例数
2018年10月21日星期日
重庆医科大学卫生统计教研室
2、病死率(fatality rate)
(1)公式
病死率 = 一定时内某病死亡人数 × 100% 同期确诊的某病病例数
2018年10月21日星期日
重庆医科大学卫生统计教研室
• (2)含义
• 表示一定时期内(通常为1年),患 某病的全部病人中因该病而死亡者的比例。 它既表明疾病的严重程度,也可反 映出当地的医疗水平(可比性)。
计数资料的统计描述
2018年10月21日星期日
重庆医科大学卫生统计教研室
一、相对数的概念及计算
• 计数资料的变量值是定性的,对其观察结果的分 析比较常用率、构成比、相对比等统计指标描述。 这些指标都是由两个有联系的指标组成,又称相 对数(relative number)。
• 计数资料常见的数据形式是绝对数,如出院 人数、治愈人数、死亡人数等,但绝对数通常不 具有可比性,需要在绝对数的基础上计算相对数。
①本质含义不同 ②计算方法不同 ③观察方式不同 ④应用范围不同 发病危险与现患频率 分子差异 纵向与断面 急性与慢性
2018年10月21日星期日
重庆医科大学卫生统计教研室
• 患病率=发病率*病程
稳定
例:患病率=376/10万
发病率=30.7/10万
计算得:病程=12.2年
2018年10月21日星期日 重庆医科大学卫生统计教研室
1、 发病率(incidence rate)
(1)公式
IR=
某期某人群中某病的新病例数 × K 同期暴露人口数
新发/初次诊断
一人多次发病
2018年10月21日星期日
重庆医科大学卫生统计教研室
• 1、 发病群中某病的新病例数 同期暴露人口数
2018年10月21日星期日
重庆医科大学卫生统计教研室
2、 患病率 (prevalence rate),又称现患 率
(1)公式
时点患病率 = 某时点某病的新旧病例数 (一个月内) 当日人口数
× K
相当于一个时间端面 一般不超过一个月 2018年10月21日星期日 重庆医科大学卫生统计教研室
• 期间患病率 = 某期间某病的新旧病例数
2018年10月21日星期日
重庆医科大学卫生统计教研室
• 常用的相对数有:
• 率(rate): 当比例与时间有关系时称为率(如发病率、患 病率、死亡率、病死率等)。 比(ratio) 或相对比(relative ratio) :
两个有联系的指标之比。
构成比(constituent ratio )或( proportion):
(1)公式
死亡率=
某人群某年总死亡人数 × K 该人群同年平均人口总数
死亡粗率
死亡专率
2018年10月21日星期日
重庆医科大学卫生统计教研室
• (2)含义 • 指在一定期间内总死亡人数与该人群同期平 均人口数之比。 • (3)应用 • 用于衡量某一时期、某一地区人群死亡危险 性大小。 • ◆ 该死亡率又称粗死亡率。 • 死亡专率(specific death rate) • 按某一特定疾病、性别、年龄而计算的死亡 率,称为疾病别、性别,年龄别死亡专率。
分母 • K
应为易感人口,实际大样本调查多用平均人口。 比例系数,可为1000‰ 万分率 10万分率
• 时间单位 年、季、月,常以年为单位 • (2)含义 • 表示一定期间内、一定人群中某病新病例出现的 频率。
重庆医科大学卫生统计教研室
• 2018 强疾病发生的危险性 年10月21日星期日
发病率
• 可分年龄、性别、职业、民族、种 族、婚姻状况、病因等分别计算,即发病 专率
重庆医科大学卫生统计教研室
• (3)应用 •
2018年10月21日星期日
实例
2018年10月21日星期日
重庆医科大学卫生统计教研室
• 2、比(ratio): • 也称相对比,是表示两个数相除所得的值,说明 两者的相对水平,常用倍数或百分数表示.
甲指标 相对比 (或 100%) 乙指标
例如:白/球比值