6第二章 集中趋势的统计描述(新版预防医学)

合集下载

2统计描述(集中趋势的描述)

2统计描述(集中趋势的描述)

4.13 4.28 4.91 3.95 4.23
2.78 3.26 3.18 5.08 3.57
4.26 3.50 3.68 4.53 4.83
3.58 2.70 4.83 3.92 3.52
4.34 4.61 3.87 3.58 3.84
4.84 4.75 3.95 5.35 4.50
4.41 2.91 3.91 3.84 3.96
第三章: 统计描述
一、数值变量资料的统计描述
1、频数分布 2、集中趋势的统计描述 3、离散趋势的统计描述 4、正态分布及其应用
二、分类变量资料的统计描述
2
概述 :
统计描述:用适当的统计图(表)和统计指 标来描述资料的分布规律及其数量特征. 资料性质
离散型:变量取值可以列举,如心跳、脉搏 连续型:变量取值不能明确列举,如血糖
1.描述频数分布的 类型 (1)对称分布 : (2) 偏态分布
25 20
人数
15
Æ µ Ê ý
10 5
0
2.45
3.05
3.65
4.25
4.85
5.45
6.10
Ñ ª Ç å × Ü µ ¨¹ Ì ´ ¼ £ ¨mmol/L£ ©
Í ¼ 2 - 1 101 à û Õ ý ³ £ ³ É Ä ê Å ® Ó ×Ñ ª Ç å Ü ×µ ¨¹ Ì ´ ¼ µ Ä Æ µ Ê ý Ö ·² ¼
4.34 4.61 3.87 3.58 3.84
4.84 4.75 3.95 5.35 4.50
4.41 2.91 3.91 3.84 3.96
4.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.71 3.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28 4.06 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26

医学统计学(课件)集中趋势

医学统计学(课件)集中趋势

众数
众数是数据中出现次数最多的 数值。
在描述分类数据时,众数是非 常重要的指标,可以反映主要 群体的特征。
在描述连续数据时,众数可能 不是唯一的,此时可以使用众 数区间来描述数据的集中趋势 。
02
集中趋势的测量方法
算术平均数
算术平均数是最常用的集中趋势测量 方法,它是将一组数值相加后除以数 值的数量,得到平均值。
适用范围
众数适用于数据分布较为 离散的情况,但在数据分 布较均匀时,其代表性可 能较差。
计算简单
众数的计算方法相对简单 ,易于操作。
04
集中趋势在医学中的应用
诊断疾病
诊断疾病时,医生通常会收集患者的症状和体征数据,并利用集中趋势指标来分 析这些数据。例如,平均值可以帮助医生了解患者的平均病情状况,从而做出准 确的诊断。
映数据的中心位置。
03
集中趋势的优缺点
平均数的优缺点
总结性
平均数能够概括说明一组数 据的总体“平均水平”或“ 集中趋势”。
敏感性
平均数对数据中的异常值比 较敏感,容易受到极端值的 影响。
计算简单
平均数的计算方法简单易懂 ,易于操作。
适用范围
平均数适用于数据量较大且 分布较均匀的情况,但在数 据分布不均或存在异常值时 ,其代表性可能较差。
平均数适用于数据分布较为对称的情况,如果数据分布偏态,则使用中位数或众数 可能更合适。
中位数
中位数是一组数据按大小顺序排 列后,位于中间位置的数值。
如果数据量是奇数,中位数就是 中间那个数;如果数据量是偶数 ,中位数是中间两个数的平均值

中位数主要用于描述偏态分布的 数据,因为中位数不受极端值的 影响,更能反映数据的中心趋势

口腔助理医师-综合笔试-预防医学-第二单元医学统计学方法

口腔助理医师-综合笔试-预防医学-第二单元医学统计学方法

口腔助理医师-综合笔试-预防医学-第二单元医学统计学方法[单选题]1.常用的表示一组同质观察值的平均水平的指标包括,除了A.几何均数B.百分位数C.中位数D.均数E.标准(江南博哥)差正确答案:E参考解析:集中趋势指标是用于描述一组同质观察值的平均水平或集中位置的指标。

平均数是描述数值变量资料集中趋势的一类应用最广泛的指标体系。

常用的平均数包括:算术均数、几何均数与中位数和百分位数。

而标准差是反映一组观察值的离散程度。

掌握“定量资料的统计描述”知识点。

[单选题]5.变异系数表示A.平均水平B.对称分布C.离散趋势D.相对变异度E.集中趋势正确答案:D参考解析:变异系数用CV表示,用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。

意义:值越大,意味着相对于均数而言,变异程度越大。

掌握“定量资料的统计描述”知识点。

[单选题]6.不属于变异指标的是A.中位数B.标准差C.全距D.四分位间距E.变异系数正确答案:A参考解析:离散趋势指标是反映一组同质观察值的变异程度。

常用的描述变异程度的统计指标包括极差、四分位数间距、方差、标准差和变异系数。

掌握“定量资料的统计描述”知识点。

[单选题]7.统计表中的数字用什么表示A.阿拉伯数字B.希腊数字C.罗马数字D.中文数字E.以上均错误正确答案:A参考解析:统计表的数字用阿拉伯数字表示。

掌握“统计表和统计图”知识点。

[单选题]8.关于统计表纵标目的说法,错误的是A.研究事物的指标B.纵标目又称宾辞C.列在表的上方D.表达结果与主辞呼应E.按其发生频率的大小顺序来排列正确答案:E参考解析:统计表的标目:有横标目和纵标目,纵标目是研究事物的指标,又称宾辞,列在表的上方,其表达结果与主辞呼应。

当主辞的标志不止一个时,可将部分主辞与宾辞复合。

标目的正确安排可使读者自左向右顺利阅读。

掌握“统计表和统计图”知识点。

[单选题]9.关于统计表横标目的叙述,错误的说法是A.横标目又称主辞B.通常置于表的左侧C.研究事物的指标D.按其发生频率的大小顺序来排列E.研究事物的对象正确答案:C参考解析:统计表的标目:有横标目和纵标目,横标目又称主辞,是研究事物的对象,通常置于表的左侧,一般按其发生频率的大小顺序来排列,使其重点突出和对比鲜明,或按事物的自然顺序排列。

预防医学笔记【分章节】

预防医学笔记【分章节】

预防医学彩色笔记【分章节】第一章绪论一、预防医学的概述1.以环境-人群-健康为模式,以个体和确定的群体为主要对象。

2.三级预防策略:第一级预防:疾病的因子---病因预防、根本性预防第二级预防:三早---早发现,早诊断,早治疗第三级预防:已患病者,促康复3、任何疾病都应强调第一级预防。

第二章医学统计学方法一、基本概念和基本步骤(一)统计学中的几个基本概念1.同质:除实验因素外,影响被研究指标的非实验因素相同。

变异:同质基础上被研究个体之间的差异。

总体:同质的个体所构成的全体。

样体:从总体中抽取部分个体所组成。

误差:观测值和真实值之间的差别。

主要有①系统误差:仪器或标准不符等造成,可影响原始资料准确性,必须克服。

②随机测量误差:各种偶然因素造成同一对象多次结果不一致,应采取措施尽量控制在一定范围。

③抽样误差:总体抽样得到某变量值的统计量和总体参数之间的差别。

概率:描述随机事件(如发病)发生可能性大小的度量,常用P表示。

P值0-1,P≤0.05或P<0.01---小概率事件。

P≤0.05为事物差别有统计学意义;P<0.01为事物差别有高度统计学意义。

变量:观察对象的特征或指标;测量的结果为变量值。

(二)统计工作的基本步骤:设计--基础、最关键;收集、整理、分析资料。

二、数值变量数据的统计描述频数表:组数通常选择8-15之间;组距=(最大值-最小值)/组数;必须包含全部数据,一个数据只能归属某一组,实际组段在每组中只包含下限。

(一)集中趋势指标1.算术均数:μ---总体均数。

样本均数--χ,正态或近似正态分布。

2.几何均数:G表示。

同一组观察值的几何均数总是小于它的算数均数。

3.中位数:M;奇数---中间;偶数---中间两个数的平均值。

4.百分位数:P x;从小到大分成100等分,分割界限上的数值就是百分位数。

(二)离散趋势指标离散二距方标差,正态标准差最佳,偏态四分数最佳1.极差/全距:R---最大值和最小值之差。

第二章 集中趋势的统计描述

第二章  集中趋势的统计描述

间值的平均值。
样 本 中 位 数 的 计 算 公 式
1)直接法:
该公式适用于原始数据资料
当 n 为奇数时 当 n 为偶数时
2)频数表法:
该公式适用于频数表资料
LM , iM , fM分别为M 所在组段的下限、组距和频数,fL为M 所
在组段之前各组段的累积频数。
2013-9-23 29
1,3,7,55,100,中位数为多少?
5.95 5.34 4.44 .. .. .. .. 4.01 .. .. .. ..
4.46 4.70 4.94 .. . . . . .. . . . . 4.89 4.89 .. .. .. .. . . . .
4.57 . 4.81 . 5.05 . .. .. . . .. .. . . 4.62. 4.62. .. . . . .. .. . .
累积频率(%)
4.3 31.1 57.6 72.5 85.4 92.1 96.5
M
2.20~
2.50~ 2.80~ 3.10~ 合计
14
4 3 1 630
622
626 629 630 -
98.7
99.4 99.8 100.0 -
2013-9-23
31
• 中位数的适用条件
– 当资料呈明显的偏态分布 – 资料一端或两端无确定数值
X min 3.82, X max 5.95
2013-9-23 8
解题步骤:
极差:
R 5.95 3.82 2.13 k 10 i 2.13 /10 0.21 3.80 ~;4.00 ~;4.20 ~;...5.80 ~ 6.00
组数:
组距: 组段:

2023年专升本考试大纲 《预防医学》考试要求

2023年专升本考试大纲 《预防医学》考试要求

《预防医学》考试要求I、考试性质为挑选专科生中优秀的学生进入普通高等学校专升本学生,特举办此考试。

该考试所包含的内容将大致稳定,试题形式多种,具有对学生把握课程的较强识别、区分能力。

II、考试内容及要求第一篇流行病学第一章绪论掌握流行病学定义及流行病学定义的诠释,流行病学的应用。

熟悉流行病学的原理。

了解流行病学发展史,流行病学的特点,流行病学与其他学科的关系,流行病学的展望。

第二章疾病的分布掌握疾病分布的概念。

熟悉疾病频率测量指标,描述疾病流行强度的常用术语。

了解疾病人群分布、地区分布和时间分布的特征与变化规律。

第三章描述性研究掌握描述性研究的概念、种类、用途;现况研究的概念及特点;普查、抽样调查的概念、用途。

熟悉生态学研究、个案调查、病例报告、病例分析的概念、用途;现况调查实施步骤、数据分析、常见偏倚及控制方法。

了解调查表的编制;生态学研究的方法和局限性。

第四章队列研究掌握队列研究的定义、基本原理和方法,队列研究的设计与资料整理分析,包括累计发病率、发病密度、相对危险度、归因危险度及人群归因危险度等指标的计算方法及其流行病学意义。

熟悉队列研究的特点、研究类型;队列研究的偏倚及其控制方法;队列研究的优缺点。

了解队列研究的实施步骤、样本大小的估计、随访方法、人年的计算、率的显著性检验。

第五章病例对照研究掌握病例对照研究的基本原理;匹配的原理和方法;病例与对照的来源与选择;资料整理和数据分析的基本方法;OR的含义及其在病例对照研究中的意义;。

熟悉病例对照研究的一般步骤;分层分析的概念及应用,病例对照研究中常见的偏倚及其控制方法;病例对照研究的优点及局限性。

了解实施病例对照研究应注意的问题。

第六章实验流行病学掌握实验流行病学的定义、基本特点、流行病学实验的类型:临床试验、现场试验、社区试验。

熟悉实验流行病学研究与队列研究优缺点的比较。

了解实验流行病学研究优缺点和应注意的问题。

第七章筛检掌握筛检的定义、评价筛检试验真实性的指标的计算及意义。

卫生统计学--集中趋势的统计描述(第一节 频数分布)

卫生统计学--集中趋势的统计描述(第一节 频数分布)

脉搏组段
(1) 56~ 59~ 62~ 65~ 68~ 71~ 74~ 77~ 80~ 83~85
合计
组中值(Xi)
(2)
57.5 60.5 63.5 66.5 69.5 72.5 75.5 78.5 81.5 84.5
频数, fi (3)
2 5 12 15 25 26 19 15 10 1
N=∑f 130
料,特别是服从对数正态分布资料
第二节 集中趋势的描述
(三) 中位数 11个大鼠存活天数:
4,10,7,50,3,15,2,9,13,60, 70 平均存活天数? 1、中位数(median)
第二章 集中趋势的 统计描述
第一节 频数分布
第一节 频数分布
一、数值变量的频数分布 1、频数:即变量值的个数 2、频数表:同时列出观察指标的可能取值区间
及其在各区间出现的频数。 3、频数分布通常用频数分布表和频数分布图来
表示。 注意:了解频数分布是分析资料的第一步。 (一)频数分布表(frequency table)
之间,尤以组段的人数71~(次/分)最多。 且上下组段的频数分布基本对称。
3.便于发现一些特大或特小的可疑值
组段
频数 f
(1)
(2)
2.30~
12.60~02.90~03.20~
0
3.50~
17
3.80~
20
4.10~
17
4.40~
12
4.70~
9
5.00~
0
5.30~
0
5.60~5.90
8
合计
图 2-1 130 名 正 常 成 年 男 子脉搏的 频 数 分 布
第一节 频数分布

集中趋势的统计描述

集中趋势的统计描述

正态曲线下面积的分布规律
曲线下横轴上的总面积为100%或1。 下面是应用较多的三个区间的面积分布规 律。 (1)正态分布区间(-,+)下的面积,即 范围的面积占总面积为68.27%; (2)正态分布区间(-1.96,+1.96),即 1.96范围的面积占总面积为95.00%; (3)正态分布区间(-2.58,+2.58),即 2.58范围的面积为99.00%。(如图1-2)
式中,Σ是求和的符号 。
例题
例 14-1 10名12岁男孩身高(cm)分别为 125.5,126.0,127.0,128.5,147.0, 131.0,132.0,141.5.0,122.5,140.0。 求平均数。
X X n 125.5 126 ... 122.5 140 132.1 10
二、四分位间距
(inter-quartile range)
四分位间距是两个特定的百分位数之 差,即第75百分数P75(上四分位数QU)和 第25百分位数P25(下四分位数QL)之差, 用Q表示,适用于任何分布的计量资料, 尤其适用于偏态分布的资料.
Q= QU - QL
四分位间距比全距稳定,但仍然未 考虑到每个观察值的变异。
[例1-6]调查某地107名正常人尿铅含量 (mg/L)结果列于下表,计算中位数: 本例,第3组的累计频数为65,超过n/2= 53.5,即第3组为本组。
i n 4 107 M L fL 29 36 10.41(m g/ L) f2 65 2
(四)百分位数(percentile)
百分位数是一种位置指标,用PX表示。 百分位数是一个有序数列百等分的 分割值。第50百分位数(P50)也就是中位 数,中位数是一个特定的百分位数。 计算百分位数的计算公式为:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

173.6 181.5 175.0 173.2 166.9 169.1 175.7 173.6 165.9 177.9
173.7 170.5 177.7 174.5 172.7 166.8 178.8 167.2 174.0 171.1
177.8 176.4 171.4 173.7 172.2 172.0 169.1 170.7 170.2 179.3

f lg X
(5)=(2)×(4) 0.6021 1.8062 7.2246 15.0510 28.8992 16.8576 12.0410 5.4186
87.9003
G lg 1( f lg X ) lg 1(87.9003 ) lg 1(1.758006 ) 57
f
50
3、注意: 计算几何均数时观察值中不能有0; 一组观察值中不能同时有正值和负值。
172.6 170.7 178.3 177.9 175.2 166.1 164.6 174.8 170.9 175.9
1.求全距
R =183.5-162.9=20.6(cm)
2.定组段和组距 (1)一般设8~13个组段 ,常用全距的1/10取整做组距。
i= 20.6/10=2.06 取整,组距为2 (2)上限、下限、组距 (3)第一组段应包括全部观察值中的最小值;最末组段
(三)中位数 1、定义:一组观察值按由小到大的顺序排列后位次居中的数值。 2、适用:任何分布;偏态分布资料;频数分布的一端或两端无
确切数据资料。 3、计算: 直接法:用于样本含量较小的资料。将观察值由小到大排列
n 为奇数时, n 为偶数时,
(二)几何均数
1、适用:对数正态分布资料 ;观察值之间呈倍数或近似倍 数变化(等比关系)的资料 。
2、计算: 直接法:
G n X1X2 Xn
G lg1(lg X1 lg X 2 lg X n ) lg1( lg X )
n
n
例2.4 有6份血清的抗体效价为1:10,1:20,1:40,1:80, 1:80,1:160, 求其平均效价。
三、频数表的用途 1、揭示资料分布类型和分布特征,以便选取适当的统
计方法; 2、便于进一步计算指标和统计分析; 3、便于发现某些特大或特小的可疑值。
第二节 平均数
(集中趋势的描述)
描述一组同质观察值平均水平或中心位置的指标有均 数、几何均数、中位数、众数、调和均数等。本节仅 介绍常用的均数、几何均数和中位数。
表2-2 50名麻疹易感儿童平均抗体滴度计算表
抗体滴度 (1) 1:4 1:8 1:16 1:32 1:64 1:128 1:256 1:512
合计
人数f
(2) 1 2 6 10 16 8 5 2
50
滴度倒数X
(3) 4 8 16 32 64
128 256 512

lg X
(4) 0.6021 0.9031 1.2041 1.5051 1.8062 2.1072 2.4082 2.7093
(一)均数
1、适用:正态或近似正态分布的数值变量资料
2、计算:
直接法:
X X X1 X2 Xn
n
n
例2.2 某地随机抽取10名18岁健康男大学生身高(cm)分 别为168.7,178.4,170.0,170.4,172.1,167.6,172.4, 170.7,177.3,169.7,求平均身高。
应包括全部观察值中的最大值 3.列出频数表
f
表2-1 某地100名18岁男大学生身高(cm)的频数表
x
身高组段
频数
组中值
(1)
(2)
(3)
162
1
163
164
4
165
166
7
167
168
12
169
170
18
171
172
24
173
174
8
7
179
180
3
181
182184
第二章 集中趋势的统计描述
统计分析 :1、统计描述: (1)根据研究目的和资料类型,分为数值变量资 料和分类变量资料的统计描述 (2)描述形式: 描述性指标 统计图(表) 2、统计推断
第一节 频数分布 一、频数表的编制
例2.1 某地2004年抽样调查了100名18岁男大学生的身高 (cm),资料如下,试编制频数表。
1
183
合计
100

二、频数分布的特征 频数分布的两个重要特征:集中趋势和离散程度 频数分布分类:对称分布和偏态分布 1、对称分布:频数分布的集中位置在中间,左右两侧大致 对称 2、偏态分布是指频数分布不对称,集中位置偏向一侧: (1)正偏态分布:集中位置偏向数值小的一侧 (2)负偏态分布:集中位置偏向数值大的一侧
180.3 170.8 162.9 173.4 168.0 168.4 175.5 174.7 169.5 183.5
173.1 171.8 179.0 173.9 172.7 166.2 170.8 171.8 172.1 168.5
173.0 180.7 174.9 172.9 172.3 172.8 171.7 167.3 178.2 175.5
173.6 165.8 173.6 175.3 173.8 164.4 174.5 174.3 168.3 175.0 171.9 168.6 173.5 168.6 171.2 177.1 168.5 178.7 171.3 176.1
168.7 178.4 170.0 170.4 172.1 167.6 172.4 170.7 177.3 169.7
G lg1( lg X ) lg 1(lg10 lg 20 lg160) lg 1(1.6522) 45
n
6
加权法:
G
lg 1(
f1
lg
X1
f2 lg X 2 f1 f2 fk
fk
lg
Xk
)
lg 1(f lg f
X
)
例2.5 某地区50名麻疹易感儿童接种麻疹疫苗1个月后, 测其血凝抑制抗体滴度,如表2-2中(1)、(2)栏, 求平均抗体滴度。
X X 168.7 178.4 169.7 171.73 (cm)
n
10
加权法 :
X
f1X1 f2 X 2 fk X k f1 f2 fk
fX f
例2.3 计算例2.1中表2-1 资料的平均身高。
X
fX f
1631
165 4 1 4
1
1831
17270 100
172.70
(cm)
相关文档
最新文档