卫生统计学第7版方积乾主编定性资料的统
2018精选版卫生统计学第7版 方积乾主编 课件第二章 定量资料的统计描述-精心整理

8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~
血清铁含量(μ mol/L)
6~
8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~
血清铁含量(μ mol/L)
图2-2 120名健康成年男子血清铁含量(μmol/L)分布
努力
30 25 20
数据如下。试编制血清铁含量的频率分布表。
努力
频率表的编制步骤如下:
1. 计算极差 (range, R),亦称全距,即最大值与最小值之差。本例最 大值为29.64,最小值为7.42,故R=29.64-7.42=22.22 (μmmo/L)。
2. 确定组段数与组距(class interval)
靠近的整数作为组距,本例取i=2。
6~ 8~ 10~ 12~ 14~ 16 ~ 18 ~ 20 ~ 22 ~ 24 ~ 26 ~ 28~30
1 3 6 8 12 20 27 18 12 8 4 1
120
0.83 2.50 5.00 6.67 10.00 16.67 22.50 15.00 10.00 6.67 3.33 0.83
100.00
最大值。注意各组段不能重合,每组段只写出下限,如6~,8~,最后
一个组段可包括其上限值,如本例28~30。 4. 列表 清点各组的频数,计算频率、累积频率数和累计频率。
努力
表2-2 120名正常成年男子血清铁含量(μmmo/L)频率分布 组段 (1) 频数 (2) 频率(%) (3) 累计频数 (4) 累计频率(%) (5)
检查次数 (1) 0 1 2 3 4 5 >5 频数 (2) 4 7 11 13 26 23 12 频率(%) (3) 4.2 7.3 11.5 13.5 27.1 24.0 12.5 累计频数 (4) 4 11 22 35 61 84 96 累计频率(%) (5) 4.2 11.5 22.9 36.5 63.5 87.5 100.0
《卫生统计学》第七版勘误内容:

《卫生统计学》第七版勘误内容:《卫生统计学》第七版勘误内容:2012-11-7序号章节号、页码行数错误写法正确写法备注第3章第三节、年龄别生育率同年某年龄组活年龄别生育率同年某年龄组活产1 27产数同年某年龄组平均妇女数数同年某年龄组平均妇女数×1P41×1年1000‰ 强度型(近似) 年1000‰ 相对比型第3章第三节、因别死亡率,某病病死率和死因因别死亡率,某病病死率和死因构2 23构成等成比等 P42第3章第七节、会改变各直条长短的比例图会改变各直条长短的比例 3 9P53第3章中英文续表中Figure 3-5描述的第14 worker’s workers’ 结果报告,P55 行第3章第十节、5 14 2006 a3 8792458 2006 a3 8792459 P58第3章第十节、实验3-3 绘制线图和半对数线实验3-3 绘制线图和半对数线图 6 31图根据表3-10的资料?????? 根据表3-14的资料?????? P58第3章第十节、7 8 23 vaxis=axis1 haxis=axis2 23 vaxis=axis1haxis=axis3 P59第3章第十节、8 14 vaxis=axis1 haxis=axis3 29 vaxis=axis2haxis=axis3 P59第4章P63 第14行又,该实验为有放回的实验该实验又为有放回的实验 9 第5章P97 表5-4合计一行的频率漏掉频率的合计100.0 10 100.0第6章P112 第1行和第11行得到的F值一个是四位,一个是F的值保留两位小数两个F值的小数点11三位位数不一致第7章P138 第三行表7-11 表7-12 12第9章P172 这类资料的特点是……无法精确这类资料的特点是……无法精确测13 5-6测量等特点。
量等。
第9章P172 16行秩和秩 14序号章节号、页码行数错误写法正确写法备注第9章P174 一、两组连续性变量资料的秩和一、两组连续型变量资料的秩和检15 14检验验第9章,P181 表下12,13行三个四个 16 第9章,P186 13行π 删去π 在186页表9-11下17第三行第9章,P188 3行 18 a3 D09_03 第9章,P188 9行 19 a4 D09_04 第9章,P189 7行 20 a5 D09_05 第9章,P189 程序中的1行 DATA D09_06ab; DATA D09_06ab(drop=i n1 n2); 21 第9章,P189 程序中的19行 IF j=.THEN DELETE ; IF j=1THEN output; 22 第9章,P189 程序中的20行 ELSE IF j=2 THEN DELETE ; 删除第20行的语句 23第9章,P189 程序中的25行 IF j=.THEN DELETE ; IF j=1THEN output; 24 第9章,P189 程序中的26行 ELSE IF j=1 THEN DELETE ; 删除第26行的语句25第9章,P190 小结的第二行先天性删去“先天性” 26第9章,P190 32(倒数5) 。
最新统计学方积乾 第七版 第二章 定量资料的统计描述课后练习题答案资料

第2章 定量资料的统计描述案例2-1(P27)答:该资料为一正常人群发汞值的检测结果,已整理成频率分布表(P27)。
统计描述时应首先考察资料的分布规律,通过频率(频数)分布表(表2-9 P27)和直方图(图2-3 P14)可以看出,此238人发汞值的频数分布呈正偏态分布,即观察值绝大多数集中在发汞值较小的组段。
对偏态分布,选用算术均数和标准差进行统计描述是不恰当的。
应选用中位数描述该市居民发汞平均水平,选用四分位间距描述居民发汞值变异度,计算如下:25507523.5(23825%20) 4.7(mol/kg)6625.5(23850%86) 6.6(mol/kg)6027.5(23875%146)8.9(mol/kg)48(%)x x L x iP L n x f f P u P u P u =+?==+?==+?==+?S离散程度指标:四分位间距=P75-P25=8.9-4.7=4.2umol/kg。
故该市居民发汞平均水平为6.6 umol/kg,离散度为4.2umol/kg,思考与练习(P31)1.答:(1)某年某地120例6-7岁正常男童胸围测量结果(cm)的频数分布Group Frequency Percent Cumulative Percent49.0- 1 .8 .850.0- 4 3.3 4.251.0- 8 6.7 10.852.0- 6 5.0 15.853.0- 19 15.8 31.754.0- 18 15.0 46.755.0- 14 11.7 58.356.0- 26 21.7 80.057.0- 10 8.3 88.358.0- 9 7.5 95.859.0- 4 3.3 99.261.0-62.0 1 .8 100.0Total 120 100.0(2)(3) 利用频数分布表数据计算均数和标准差0149.5161.56623.01112055.19(cm)fX X f∑=∑⋯⨯++⨯==⋯++=(4)………..S 2.33(cm)=255075153.0(12025%19)53.58(cm)19155.0(12050%56)55.29(cm)14156.0(12075%70)56.77((cm)26%)x x L x i P L n f f P x P P ==+?==+?==+?=+?S2.答:该资料最大值为一不确定值,根据此特点,宜用中位数和四分位间距进行统计描述.M=16.5(天) P25=15(天) P75=20(天) Q=20-15=5(天)3.答:根据资料中血凝抑制抗体滴度指标呈等比数列变化的特点,计算其平均滴度应选用几何均数,由于是频数表资料,故用加权法计算几何均数。
方积乾《卫生统计学》5_1寿命表(第七版)

年龄别生存概率 :x岁尚存者在今后n年内的生存概率
px 1qx
精选ppt课件
13
简略寿命表的编制的编制
列6:寿命表尚存人数 l x
寿命表人口在x岁时的尚存人数 l x表示活满x岁 的人数
列7:死亡人数 d x
表示在( x, xn)期间死亡的人口数
寿命表人口:假想有同时出生的一代人,人 数为 l 0
5~ 102502 47 0.000459 0.002290 98956 227 494212 7070870 71.45
10~ 151494 49 0.000323 0.001616 98729 160 493247 6576657 66.61
15~ 182932 48 0.000262 0.001311 98570 129 492525 6083411 61.72
4 P 1 1~组的平均人口
精选ppt课件
11
简略寿命表的编制
列4:年龄别死亡率m x
某年龄组人群在一年内的平均死亡率, 根 据年龄组的年平均人口数计算
mx
Dx Px
m x 是指( x,xn )岁年龄组内的死亡率 n m x
由于0~岁组的死亡率变化较大, 用死亡率计算时不够稳 定, 通常任其空置。
精选ppt课件
15
简略寿命表的编制
列8:生存人年数 L x
x岁尚存者在今后n年内的生存人年数
Lx
nlx
lxn 2
L 55(l5 2l1)05(9
8 9 95 8)6 7 42994 2
2
婴儿组的生存人年数根据0岁组死亡者的平均存
活年数计算: L0l1a0d0
Байду номын сангаас
8a 50 岁系以经上验者性:常L数85,可ml88查55 表得
卫生统计学:第3章 定性资料的统计描述

1.单位时间内某现象发生的频率
强度
发生某现象的观察数 (可能发生该现象的观察单位数
时间)
K
式中:K为比例基数,常以百分率(%)、千分率(‰)、
万分率(1/万)、十万分率(1/10万)表示, 原则: ⑴使计算结果至少保留1~2位整数。
⑵习惯:医学资料中某些指标的比例基数是固定的。
11
例3-2 某企业2003年有2839名工人,该企业每年对 职工进行体检,这一年新发生高血压病人5例,
26
间接法
应用条件: 已知发生总数及各组观察单位数,及标准率 计算公式:
p' p r
N i Pi
27
例3-6 某地观察了吸烟者与不吸烟者各年龄组人数如下表。 同时观察期内吸烟者中有432人死于肺癌,不吸烟者中有210 人死于肺癌,试计算吸烟者与不吸烟者的标准化死亡率。
表3-6 两组肺癌死亡率(1/10万)的标化(间接法)
(3)如不计算标准化率,而分别比较各组的率, 也可得出正确结论,但不能比较总率的大小。
(4)两样本标准化率是样本值,存在抽样误差, 应作假设检验。检验方法比较麻烦。
30
4、标准化法使用注意事项
(1)标准化法是采用统一标准人口年龄构成,以 消除混杂因素的影响;
(2)标准化后的率并不表示某地实际水平,只能 表明相对水平;
100.67
不吸烟者
观察人年 数Ni2
预期死亡 人数Ni2Pi
189370
13.33
104762
26.92
60043
65.00
80%27540100% 72.69
14532
65.67
396247
243.61
28
卫生统计学第7版方积乾主编课件第二章定量资料的统计描述

2020/6/24
11
正偏态(右偏态)
负偏态(左偏态)
2.观察资料的集中趋势和离散趋势 3.便于发现某些特大或特小的可疑值 4.便于进一步计算统计指标和作统计处理
2020/6/24
12
第二节 描述集中趋势的统计指标
医学定量资料中,描述集中趋势的统计指标主要有 算术均数、几何均数和中位数。 一、算术均数(arithmetic mean)
本例
X X 31.26 3.9075 (U/L) n8
2020/6/24
14
2.频率表法 当变量值的个数较多时,在编制频率表 的基础上,应用加权法计算均数的近似值。
X fX 0 fX 0
f
n
公式中,f 为各组段的频数,X0为各组段的组中值, X0=(组段上限+组段下限)/2。
例2-4 X fX 0 2228 18.57 (μmmo/L) f 120
2020/6/24
2
统计描述是用统计图表、统计指标来描述资料的分布 规律及其数量特征的。
第一节 频率分布表与频率分布图
医学研究资料变量值的个数较多时,对个变量值出现的 频数或频率列表即为频数分布表或频率分布表(frequency distribution table),简称频数表或频率表。
2020/6/24
2020/6/24
5
二、连续型定量变量的频率分布
例2-2 抽样调查某地120名18~35岁健康男性居民血清铁含量(μmmo/L),数 据如下。试编制血清铁含量的频率分布表。
2020/6/24
6
频率表的编制步骤如下:
1. 计算极差 (range, R),亦称全距,即最大值与最小值之差。本例最 大值为29.64,最小值为7.42,故R=29.64-7.42=22.22 (μmmo/L)。
卫生统计学第7版

卫生统计学第7版卫生统计学(本科预防)(第7版) 目录第一章绪论第一节医学中统计思维的进化第二节统计学与公共卫生互相推动第三节统计学的若干概念第四节目标与方法第二章定量变量的统计描述第一节频率分布表与频率分布图第二节描述平均水平的统计指标第三节描述变异程度的统计指标第四节描述分布形态的统计指标第五节统计表和统计图第六节统计内容的报告与中英文表达第七节案例讨论第八节计算机实验第九节小结第三章定性变量的统计描述第一节定性变量的频率分布第二节常用相对数指标第三节医学人口统计常用指标第四节疾病统计常用指标第五节粗率的标准化法第六节动态数列及其指标第七节定性变量统计图第八节中英文结果报告第九节案例讨论第十节计算机实验第十一节小结第四章常用概率分布第一节二项分布第二节Poisson分布第三节正态分布第四节中英文结果报告第五节案例讨论第六节计算机实验第七节小结第五章参数估计基础第一节抽样分布与抽样误差第三节多个样本均数的两两比较第四节方差分析的前提条件和数据变换第五节中英文结果报告第六节案例讨论第七节计算机实验第八节小结第八章χ2检验第一节独立样本四格表资料的χ2检验第二节多个独立样本R×c列联表资料的χ2检验第三节配对设计资料的χ2检验第四节列联表资料的确切概率法第五节χ2检验用于拟合优度检验第六节中英文结果报告第七节案例讨论第八节计算机实验第九节小结第九章基于秩次的非参数检验第一节配对设计资料的符号秩和检验第二节两组独立样本比较的秩和检验第三节多组独立样本比较的秩和检验第四节随机区组设计资料的秩和检验第五节多个样本问的多重比较第六节中英文结果报告第七节案例讨论第八节计算机实验第九节小结第十章两变量关联性分析第一节线性相关第二节秩相关第三节分类变量的关联性分析第四节中英文结果报告第五节案例讨论第六节计算机实验第七节小结第十一章简单线性回归第一节线性回归第二节线性回归的应用第三节残差分析第四节非线性回归第五节中英文结果报告第六节案例讨论第七节计算机实验第八节小结第十二章多重线性回归与相关第一节多重线性回归的概念及其统计描述第二节多重线性回归的假设检验第三节复相关系数与偏相关系数第四节自变量筛选第五节多重线性回归的应用第六节中英文结果报告第七节案例讨论第八节计算机实验第九节小结第十三章医学研究的统计学设计第一节统计设计的基本要素第二节统计设计的基本原则第三节误差来源及其控制方法第四节资料统计分析第五节中英文结果报告第六节案例讨论第七节计算机实验第八节小结第十四章实验研究的设计与分析第一节实验设计中的对照设置和随机分组方法第二节常用实验设计方案与统计分析第三节样本含量的估算第四节中英文结果报告第五节案例讨论第六节计算机实验第七节小结第十五章临床试验设计与分析第一节临床试验概述第二节临床试验设计的原则第三节临床试验设计的基本类型第四节统计分析计划第五节临床试验中的三种试验类型第六节样本量估算第七节中英文结果报告第八节案例讨论第九节计算机实验第十六章观察性研究的实施与分析第一节观察性研究概述第二节横断面研究的实施与分析第二三节病例对照研究的实施与分析第四节队列研究的实施与分析第五节中英文结果报告第六节案例讨论第七节计算机实验第八节小结第十七章寿命表第一节基本概念第二节简略现时寿命表的编制第三节去死因寿命表的编制第四节健康期望寿命表的编制第五节寿命表有关指标及其分析第六节其他相关指标简介第七节中英文结果报告第八节案例讨论第九节计算机实验第十八章logistic回归分析第一节logistic回归模型第二节logistic回归的参数估计及假设检验第三节条件logistic回归模型第四节logistic回归的样本含量估算第五节logistic回归的应用及注意的问题第六节中英文结果报告第七节案例讨论第八节计算机实验第九节小结第十九章生存分析第一节生存分析基本概念第二节生存曲线的估计第三节生存曲线的比较第四节Cox回归第五节中英文结果报告第六节案例讨论第七节计算机实验第八节小结第二十章meta分析第一节meta分析概述第二节meta分析的统计方法第三节meta分析的偏倚第四节中英文结果报告第五节案例讨论第六节计算机实验第七节小结附录附录一软件简介(见随书光盘)附录1—1SAS简介附录1—2EpiData简介附录二统计学指南(见随书光盘)附录2—1CONSOR Tstatement的清单和流程图附录2—2STROB Estatement的清单附录2—3PRISM Astatement的清单和流程图附录三统计用表附录四重要定理证明(见随书光盘)中英文名词对照索引。
卫生统计学第7版 方积乾主编 课件第三章 定性资料的统计描述.

四、
应用相对数时的注意事项
1.计算相对数时分母一般不宜过小。 2.分析时不能以构成比代替率。
表3-3 不同工种的白细胞减少症患者构成比与患病率
工种 (1)
苯作业 塑料作业 化学药物 放射作业 合计
调查人数 (2)
389 311 260 154 1114
患病人数 (3)
29 13 13 9 64
⑴观察对象是否具有同质性。
⑵观察对象在各组的内部构成是否相同。对于总率的比较 应注意标准化。 ⑶对比不同时间的资料是否具有可比性。 5.对样本率(或构成比)的比较做假设检验。
2019/2/7 10
第二节 医学人口统计常用指标
医学人口统计(medical demography)是从卫生保健的 角度研究和描述人口数量、分布、结构、变动及其规律, 研究人口与卫生事业发展的相互关系,是卫生统计学的重
婚情况表、节育情况表和育龄妇女年龄别出生情况表。 3.人口调查 调查方法有普查和抽样调查。我公从1953年到2010年 先后进行了6次人口普查,2010年11月1日零时全国总人口数 为1370536875人 ,男:女=0.5127:0.4873
2019/2/7 12
二、描述人口学特征的常用指标
1.人口数(population size) 口数。
构成比(%) (4)
45.3 20.3 20.3 14.1 100.0
患病率(%) (5)
7.5 4.2 5.0 5.8 5.7
2019/2/7
9
3.对观察单位数不等的几个率,不能直接相加求其总率。
4.在比较相对数时应注意可比性。 影响率或构成比变化的因素很多,除了研究因素(即比较 的因素)外,其余的影响因素应尽可能相同或相近,即在相 同条件下比较才有意义。通常应注意: