第六章 计数资料的统计描述

合集下载

计数资料的统计描述

计数资料的统计描述

A.频率指标 B.构成指标 C.相对指标 D.动态数列
多选题
7.对两个总率进行标准化时,主要目的是
A.消除内部构成的差异 B.使其在实际水平下进行比较
D.使其在共同标准下进行比较 D.反映各自的实际水平
E.反映各自的相对水平
8.使用相对数时应注意
A.计算相对数的分母不宜太小 B.不要把比作率分析
C.资料要具有可比性 D.资料内部构成不同应进行标准化
E.对率和比的比较应进行假设检验
9.某医师用某新疗法治疗了2例肺癌病人,均治愈,该医师报道,他所采
用的新疗法治愈率为100%,你认为有些不妥,应建议该医生
A.增大样本含量 B.报告绝对数 C.进行有对照的临床试验
D.与国外研究资料对比 E.与历史资料对照
10.构成比的特点有
A.各部分的构成比之和为100% B.各部分的构成比之和为1 C.某部分比重的增减可影响其他部分 D.每部分的构成比可大于1
E.具体计算时,有时受尾数的影响,其总和不等于1
11.关于率,以下哪几项是错误的
A.反映某现象发生的频率或强度 B.反映某事物内部的构成
C.表示两个同类指标之比 D.表示某现象在时间上顺序排

E.又称为频率指标或强度指标
12.描述计数资料的主要指标是
A.构成比 B.平均数 C.率 D.相对比 E.标准差(二)论述题
1.某地某年肿瘤普查资料整理如下表。

请填补表中空缺,并分析讨论哪个
年龄组最易患肿瘤?哪个年龄组病人最多?
实习表4-1 某地某年肿瘤普查资料
年龄(岁)人口数肿瘤患者数构成比(%)患病率(1/万)。

医学统计学计数资料的统计描述(一)

医学统计学计数资料的统计描述(一)

医学统计学计数资料的统计描述(一)医学统计学计数资料的统计描述计数资料是医学研究中常见的数据类型,例如统计某种疾病的患病人数、治愈人数等。

如何对这些数据进行科学统计描述,成为了医学研究不可避免的问题。

一、计数资料的基本概念计数资料是指由离散数据组成的一种数据类型,这些数据仅取有限个数值,如某类疾病的患病人数(自然数)或治愈人数(非负整数)。

计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述极为重要。

二、计数资料的统计描述1. 频数频数是指计数资料中各取值出现的次数,常以小写字母n表示。

例如患病人数为0的样本数为n0,患病人数为1的样本数为n1,以此类推。

2. 频率频率是指频数与总样本数的比值,常以小写字母f表示。

例如患病人数为0的频率为f0=n0/n,患病人数为1的频率为f1=n1/n,以此类推。

频率可以体现每个取值在样本中的分布情况,是比较常用的统计指标,其和为1。

3. 百分比百分比是指频数与总样本数的比值乘以100,常以百分号表示。

例如患病人数为0的百分比为f0×100%,患病人数为1的百分比为f1×100%,以此类推。

4. 累计频率累计频率是指某一取值及其以下所有取值的频率之和,常以小写字母F 表示。

例如患病人数小于等于3的累计频率为F3=f0+f1+f2+f3。

累计频率可以体现小于等于某个取值的样本在总样本中所占比例。

三、总结计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述有益于研究者更加深入地了解样本的分布情况,进而提出相应的研究假设。

频数、频率、百分比和累计频率是计数资料的常用统计指标,可分析每个取值在样本中的分布情况和各个取值间的差异。

在实际研究中,研究者应根据实际情况选择合适的统计方法进行分析,以期得到更为科学的结论。

计数资料的统计描述

计数资料的统计描述

计数资料的统计描述第一节常用相对数一、绝对数定义:计数资料各类别的频数,即各分类事物的合计数。

如某病的出院人数、治愈人数、死亡人数等。

意义:绝对数反映出事物在某时、某地出现的实际水平,即实际发生的规模大小。

缺点:绝对数往往不便于互相比较。

例1:某乡两个村的调查结果为,甲村钩虫感染有150人,乙村钩虫感染有100人。

据此,我们只能说甲村钩虫感染较乙村多50人,但不能肯定甲村较乙村钩虫感染程度更为严重。

例2:甲、乙两个医院某病出院人数不同时,比较两医院该病的死亡人数没有意义。

例3:如04级七年制一、二大班学生人数不同时,比较两班医学统计学的及格人数没有意义。

二、相对数定义:两个有关的绝对数之比,统称为相对数。

意义:1.消除基数影响,便于事物间的比较。

2.给出事物发生频率(强度)的估计。

3.相对数是工作决策的依据。

常用的相对数指标•例5-1 某医院1998年在某城区随机调查了8589例60岁及以上老人,体检发现高血压患者为2823例。

高血压患病率为:(2823 / 8589 ) 100% = 32.87% 。

在实际工作中,“率”的应用非常广泛,如:发病率、死亡率、发生率、阳性率、患病率等。

当“率”的分母足够大时,常用“率”的大小表示某现象发生的概率。

第二节应用相对数的注意事项1. 计算相对数应有足够数量即分母不宜太小。

如果例数较少会使相对数波动较大。

如某种疗法治疗5例病人,5例全部治愈,则计算治愈率为5/5×100% =100%,若4例治愈,则治愈率为4/5×100% =80%,由100%至80%波动幅度较大,但实际上只有1例的变化。

•在临床试验或流行病调查中,各种偶然因素都可能导致计算结果的较大变化,因此例数很少的情况下最好用绝对数直接表示•但动物实验时,可以通过周密设计,严格控制实验条件,如毒理实验,每组用10只纯种小鼠也可以•分母到底多大才可以呢?要根据研究目的、研究指标而定2.不能以构成比代替率构成比是用以说明事物内部某种构成所占比重或分布,并不说明某现象发生的频率或强度,在实际工作中经常会出现将构成比指标按率的概念去解释的错误。

计数资料的统计描述ppt课件

计数资料的统计描述ppt课件
100.0
第二节
计数资料的统计描述
三、率(Rate)
率(Rate)又称频率指标,是指在一定时间
内发生某现象的观察单位数与可能发生该现
象的总观察单位数之比。它说明某现象发生
的频率或强度。
2018/11/26
第二节
计数资料的统计描述
发生某现象的观察单位数 率 K 可能发生该现象的观察单位总数
K为比例基数,可以是百分率(%)、千分率 (‰)、万分率(1/万)或十万分率(1/10万), 可根据习惯或使计算出的率保持一、二位整数。
第二节
例 13-13
计数资料的统计描述
表13-8 HBsAg阳性性别年龄别构成比 年龄组(岁) 01020304050≥60 合计 男 阳性数 26 96 50 47 22 8 5 254 构成比/% 10.2 37.8 19.7 18.5 8.7 3.1 2.0 100.0 阳性数 29 51 40 49 21 4 2 196 女 构成比/% 14.8 26.0 20.4 25.0 10.7 2.0 1.0 100.0
女性阳性数 女性阳性数 男性构成比 100% 女性构成比 100% 254 254 196 2018/11/26

第二节
计数资料的统计描述
构成比两个特点:
1)一组构成比之和等于100%或1;
2)某部分构成增加或减少,则其它部分构成就相 应减少或增加。
某地1998年与2000年几种主要急性传 染病情况如表。某医师根据此资料中 痢疾与乙脑由1998年的44.2%与3.4% 分别增加到2000年的51.9%和5.2%, 认为该地2000年痢疾与乙脑的发病率 升高了,值得注意!你的看法如何? 为什么?
2018/11/26

计数资料的统计描述

计数资料的统计描述


236 458 447 584 735 458
7
发病率与患病率
指标 发病率 时点(时期) 时点(时期) 患病率 分子 时期内新发生的某病 时期内新发生的某病 新发生 病例数 时点(时期) 时点(时期)现患 疾病人数 分母 可能发病平均 人口数 检查人口数
8
病死率与死亡率
指标 病死率 死亡率 分子 时期内因某病 时期内因某病 死亡人数 死亡人数 某地某人群某时期内 的死亡人数 分母 同期患某病人数 该地同期 平均人口数
22
表 9 直接法计算甲乙两地标化死亡率(‰)
年龄 组 05204060合计
标准人口数 (Ni) 14100 18800 54300 10400 2400 100000(N)
甲地 原 死亡 预期死亡数 率 pi Nipi 57.2 807 3.6 68 5.3 288 12.1 126 40.0 96 16.19 1385

16
计算甲乙两地的平均死亡率? 计算甲乙两地的平均死亡率?
表 6 甲乙两地各年龄组人口数及死亡率(‰)
年龄 组 05204060合计
甲地 人口数 构成比(%) 死亡率 9300 18.6 57.2 12200 24.4 3.6 19000 38 5.3 7600 15.2 12.1 1900 3.8 40.0 50,000 100.0 16.19
乙地 原 死亡 预期死亡数 率 pi Nipi 72.9 1028 4.6 86 7.2 391 14.2 148 46.0 110 13.90 1763
23
2.间接标准化法的计算: 2.间接标准化法的计算:已知 间接标准化法的计算
r = P× SMR p′ = P ∑ni Pi
P:为标准总死亡率, 为标准总死亡率, r:为实际总死亡数, 为实际总死亡数, 为实际年龄别人口数, ni:为实际年龄别人口数, 为标准年龄别死亡率, Pi:为标准年龄别死亡率, 为预期死亡数, ∑niPi:为预期死亡数, 为标准化死亡比, SMR表示 表示。 r/∑niPi:为标准化死亡比,用SMR表示。

计数资料的统计描述和推断PPT课件

计数资料的统计描述和推断PPT课件
通过实例演示计数资料假设检验的步骤和方法,包括提出假 设、选择检验方法、确定样本量、收集数据、计算检验统计 量等。
详细描述
介绍假设检验的基本原理和方法,通过具体实例演示如何进 行计数资料的假设检验,包括提出假设、选择检验方法、确 定样本量、收集数据、计算检验统计量等步骤,说明假设检 验在数据分析中的意义和作用。
偏态”。
相对频数
各组的频数与数据总数 的比值,反映各组频数 在数据分布中的相对地
位。
描述性统计指标
01
02
03
04
计数
数据点的数量,即数据的规模 。
百分比
某一数据值占总数据值的比例 ,用于描述数据的相对大小。
比率
两个数据值的相对大小,用于 描述数据的相对位置。
中位数
将数据从小到大排列后,位于 中间位置的数据值,用于描述
报告结果
清晰地报告假设检验的结果,包括使用的统计量、显著 性水平、p值以及结论。
04 方差分析
方差分析的基本思想
方差分析是通过比较不同组别数据的 离散程度和平均水平,来检验各组之 间的差异是否显著的一种统计方法。
方差分析的基本思想是将总变异分解 为组间变异和组内变异,并比较两者 的大小,以判断各组之间是否存在显 著差异。
多元线性回归分析
多元线性回归分析涉及多个自变量和 一个因变量,并假定因变量和自变量 之间存在线性关系。
多元线性回归分析的步骤与一元线性 回归分析类似,但需要更多的计算和 统计方法来处理多个自变量之间的关 系和交互作用。
多元线性回归分析的目的是通过多个 自变量来预测因变量的值,并给出预 测值的范围和精度。
案例二:参数估计实例分析
总结词
通过实例演示如何利用参数估计方法对总体率或总体均数进行估计,比较不同估 计方法的优缺点。

计数资料的统计描述

计数资料的统计描述

高血压 172665
40
23.2
冠心病 172665
11
脑卒中 172665
253
6.4

146.5
风心病 172665
38
22.0
9
常用统计指标
发病率与患病率: 某时期某人群
发病率= 中新发病人次 K 同时期平均人口数
某一时点一定人群中 患病率= 现患某病新旧病例数 K
同期平均人口数
10
病死率与死亡率
某时期内因某病死亡人数
病死率=Biblioteka K同期患某病的病人数
某地某时期死亡人数
死亡率=
K
该地同期平均人口数
11
2.结构相对数——构成比
含义:指一事物内部结构相对某一组成部分 的观察单位数与该事物各组成部分的观察 单位总数之比,常用百分数表示。
计算:
构成比=
某一组成部分的观察单位数 100 同一事物各组成部分的观察单位总数 %
合计
74.61
44298
乙地预期发 病人数
3=1*2
26.93 46.35 45.53 59.9 44.75 8.54
232
28
标准化时应注意的问题
1. 应明确在对比两组(或多组)总率或总均数 时,若内部构成明显不同,影响总率的可比 性,需作标准化处理。
2. 相互比较的两组(或几组)资料的标准化率, 应选用同一标准;选用的标准不同,算得的 标准化率也不同。标准化率仅表明对比资料 间的相对水平,并不反映某时某地该现象发 生的实际水平。
287 64.79
18
标准化的意义:
• 其合计的差别之所以大,是由于两地人 群年龄构成不同。要正确比较甲、乙两 地的总发病率,需按照统一标准进行校 正,然后进行比较。

计数资料的统计描述

计数资料的统计描述

率同某期时可期能内发发生生某某现现象象的的观观察察单单位位总数数比例基数
式中比例基数,可以取100%、1000‰、 10万/10万…等。
常用的率有发病率、患病率、死亡率、 病死率、治愈率等。
例10-1 某医院1998年在某城区随机调查了 8589例60岁及以上老人,体检发现高血 压患者为2823例。
高血压患病率为: 2823 / 8589 100% = 32.87% 。
二、构成比(结构相对数)
构成比:表示事物内部某一部分的个体数 与该事物各部分个体数的总和之比,用 来说明各构成部分在总体中所占的比重 或位次。
通常以100%为比例基数。其计算公式为:
构成比
某一组成部分的观察单位数 同一事物各组成部分的观察单位总数
例10-2 某医院1990年和1998年住院病人死于五 种疾病的人数见表10-1。
表 10-1 某医院 1990 年和 1998 年住院病人五种疾病死亡人数和构成比
疾病构成
1990 年
1998 年
死亡人数 构成比(%)
死亡人数 构成比(%)
恶性肿瘤
58
30.53
40
26.85
循环系统疾病
44
23.16
﹡2、不能以构成比代替率
构成比是用以说明事物内部某种构成所 占比重或分布,并不说明某现象发生的 频率或强度。
统计描述是指选用适当的特征性统计指标
(即统计量)、合适的统计表、统计图正确地描
述资料的分布规律和数量特征。
计数资料的统计描述
常用相对数 应用相对数的注意事项 率的标准化法
一:常用相对数
计数资料常见的数据形式是绝对数,如某病的 出院人数、治愈人数、死亡人数等。
但绝对数通常不具有可比性:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学
statistics of medicine
王俊明 wjm_2000@
河北北方学院预防医学教研室
第六章
计数资料的统计描述

计数资料的基本形式是绝对数, 如某地区高血压患者人数,某单位A型血人数。 在进行比较的时候,绝对数通常说明不了全部问题。 问:怎么办? 答:在绝对数的基础上计算相对数,再进行比较。
甲乙两种疗法治疗某病的治愈率比较
甲疗法 病人数 治愈数 治愈率 (%) 300 180 60.0 普通型 100 35 35.0 重型 400 215 53. 8 合计 病型 乙疗法 病人数 治愈数 治愈率 (%) 100 65 65.0 300 125 41.7 400 190 47.5
从合计看,甲疗法的治愈率高于乙疗法; 从类型看,乙疗法的治愈率高于甲疗法; 自相矛盾! 为什么? 两种疗法所选的人群病型构成不同。 怎么办? 按照统一标准进行校正,然后进行比较。
n
总体率未知
Sp
p(1 p ) n
2、率的区间估计 ①近似正态法: 当n >50,且 np与n(1-p)均大于5时,样本率p近似正 态分布,总体率的(1-α)可信区间为: p u/2 Sp 例:从河北北方学院随机抽查了100名参加全国英语四级 考试的学生,通过考试的学生共有90名,计算该校学 生英语四级通过率的95%可信区间。

一、常用相对数
1、率 描述某现象发生的频率或强度,又叫强度相对数。 计算公式:
率=

某时期内发生某种现象的观察单位数 ×k 同期可能发生某种现象的观察单位总数

K是比例基数,通常取100%、1000‰、1万/1万和10万 /10万等,根据习惯用法来确定。 总体率用π,样本率用 p 表示。 例:全班100名同学(观察单位)某课程考试优秀者 (发生现象)5名, 优秀率为5%。
乙地区 预期患 调查人数 病人数 241 51 315 145 175 115 58 42 789 353
甲地区标化患病比 SMR = 322/305 = 1.05 甲地区标化患病率 42.1%×1.05 = 44.2% 乙地区标化患病比 SMR = 335/353 = 0.95
乙地区标化患病率 42.1%×0.95 = 40.0%
90 p 0.9 100 Sp 0.9(1 0.9) 0.03 100
np 100 0.9 90,
n(1 p) 100 0.1 10
u
0.05/ 2
1.96
(90% 1.96 0.03)
95.88%)
(84.12%,
②查表法: 当n ≤50时用。 例:随机抽查了河北北方学院学生40名,其中中共党员9 名,求该校学生党员百分率的95%可信区间。 查附表, n = 40,X = 9纵横交叉处上行的区间值(11~38) 即为其95%可信区间 ( 11%,38% )。 附表中只给出了X ≤ n/2部分,当X > n/2时,以n 和(n – X ) 查表,然后用100减去所查到的区间值即为所求区 间值。 例:求学生中非党员百分率的95%可信区间。 (62%, 89%)
乙疗法标化治愈率 = 427/800 = 53.4%
类型二 :
年龄 50~ 60~ 调查 人数 354 251 甲地区 患病 患病率 (%) 人数 … … … … 调查 人数 241 315 乙地区 患病 患病率 (%) 人数 … … … …
70~ 80~
合计
130 41 776
… … 322
… … 41.5
4、进行样本相对数比较时要注意可比性。 两个要求: ①除了研究因素(比较因素)以外,研究方法以及其它 条件要尽可能的相同或相近,也就是:在相同的条件 下比较才有意义。 ②观察对象内部的影响因素(性别、年龄等),各组内 部构成要相同。 5、样本率(或构成比)的比较,不但要随机抽样,还 应当做假设检验(后边讲述)。
已知: ①各个类别的观察例数 ②每个类别中的阳性例数(如治愈人数等)
病型
普通型 重型 合计
标准治 疗人数 400 400 800
甲疗法
乙疗法
原治愈 率(%) 60.0
35.0 ―
预期治 愈数 240
140 380
原治愈率 (%)
65.0 41.7 ―
预期治 愈数 260
167 427
甲疗法标化治愈率 = 380/800 = 47.5%
2、构成比 描述事物内部某一部分个体与该事物各部分个体的总和 之比,用来说明各构成部分在总体中所占的比重,又叫 结构相对数。比例基数通常取100%。计算公式:
构成比=
某一组成部分的观察单位数
同一事物各组成部分的观察单位总数
×100%
注意:各组成部分的构成比之和为100% 。
例:全班200名同学其中男96名,女104名。按照生 源地统计,河北68名,四川44名,上海12名,山 西36名,内蒙古40名,分别计算该班同学的性别、 生源地构成比。
175 58 789
… … 335
… … 42.5
已知: ①各类别的观察例数 ②阳性总例数(如治愈人数等),即各类别中的阳性 数未知
甲地区 年龄 标准患 病率 调查人数 预期患 病人数 50~ 21.3 354 75 60~ 46.1 251 116 70~ 65.5 130 85 80~ 71 41 29 42.1 776 305 合计
某班同学性别构成比
性别 男 女 合计 人数 96 104 200 构成比(%) 48 52 100
某班同学生源地构成比
地区 河北 四川 上海 山西 内蒙古 合计 人数 68 44 12 36 40 200 构成比 34 22 6 18 20 100
3、相对比 是指两个有联系的指标之比,是描述两个有关联指标的 对比水平的指标,用以说明甲是乙的若干倍或百分之几。 计算公式: 相对比= 甲指标 乙指标 (或100%)
2、标准不同得到的标化值不同。 3、内部各小组率有明显交叉时,不宜标准化,应分小组 比较。
4、标化后的数值再不反映实际水平。
5、如果对样本率进行标准化,标准化后的率同样存在抽 样误差,两样本标准化率的比较还应作假设检验。
五、率的抽样误差与区间估计
1、率的标准误
总体率已知
p
(1 )
三、率的标准化法
1、标准化的意义和基本思想 标准化的原因: 当两组资料进行比较时,如果其内部不同小组率有明 显差别,而且两组内部构成也明显不同 ,直接比较不 合理,需要进行标准化后再进行比较。
标准化的意义和基本思想: 统一内部构成,使资料具有可比性。
2、标准化率的计算
方法: ①直接法 ③有代表性的
注意: (1)甲、乙两指标可以是性质相同也可以不同 (2)甲、乙两指标可以是绝对数,也可以是相对数 (3)通常有以下三种情况:
①绝对数的比: 一附院病床数与二附院病床数的比 (性质相同) 医护人员数量与病床数的比 ( 性质不相同) ②率的比: 在流行病学的队列研究中,暴露组与非暴露组某病的 发病率之比,即RR值。 ③两个相对比的比: 在流行病学的病例对照研究中,病例组与对照组的暴 露比值之比,即OR值。
学习要点

概念解释: 率,构成比,相对比。
方法应用:计数资料的统计描述,率的区间估计。

课后思考题
1、如何正确使用相对数。
推荐阅读书目
1、孙振球. 《医学统计学》第二版,人民卫生出版社, 2005 年 2、方积乾. 《卫生统计学》第五版 . 人民卫生出版社, 2003年 3 、徐勇勇. 《医学统计学》第二版 . 高等教育出版社, 2004年 4、余松林. 《医学统计学》 . 人民卫生出版社, 2002年
二、使用相对数时应注意的问题
1、计算率的时候分母不宜太小,应大于30,否则用绝 对数比较好,但是在动物实验中,如果设计周密,经 过严格控制实验因素,精选研究对象,用20只甚至10 只也可以计算反应率、死亡等指数。 2、要明确各个相对指标的意义以及它们之间的联系与 区别,使用时要合理选用,不能以此替彼。常见的错 误:用构成比代替率。 3、观察单位数不等的几个率,不能直接相加求其总率 (平均率)。
SMR
标准化死亡比(standard mortality ratio),被标化人群 的死亡率与标准组人群死亡率的比值,在流行病学中 常用。
当 SMR > 1,说明被标化人群的死亡率高于标准组 当 SMR < 1,说明被标化人群的死亡率低于标准组
四、应用标准化时的注意事项
1、标准化法只适用于某因素的内部构成不同,并有可能 影响到合计率比较的情况。
3、标准化率的计算方法选择及计算过程
类型一 :
甲疗法
病人数 治愈数 治愈率 (%) 180 60.0 普通型 300 重型 合计 100 400 35 215 35.0 53. 8 病型
乙疗法
病人数 治愈数 治愈率 (%) 100 65 65.0 300 400 125 190 41.7 47.5
相关文档
最新文档