第02章 集中趋势的统计描述
统计学--第二章统计数据的描述PPT课件

统计先是思维而后才是数学
.
41
例:组中值计算
按周加工零件数 分组
80以下 80—90 90—100 100—110 110—120 120—130 130以上 合计
组中值
75 85 95 105 115 125 135 ——
录取 未录取 报考人数
工程系
男生 女生
300
100
300
100
600
200
财经系
男生 女生
50
100
150
300
200
400
工程系:男女录取比率50%,财经系:男女录取比率25%。
说明的问题:对数据 1.要从不同的角度进行分析; 2.要注意结构或是权数的影响。
统计先是思维而后才是数学
.
5
2.1 统计数据的整理
按周加工零件数分组 80—90 90—100 100—110 110—120 120—130 合计
次数(频数) 3
7 13 5 2
30
频率(%) 10
23.33 43.33 16.67 6.67 100
统计先是思维而后才是数学
重合组限、闭口组限
.
31
对于重合组限的形式,为解决“不重”的 问题,统计分组时习惯上规定“上组限不 在内”,即当相邻两组的上下限重叠时, 恰好等于其一组上限的变量值不算在本组 内,而计算在下一组内。
1. 按一定顺序将数据排列,以发现一些明显的特征或趋 势,找到解决问题的线索
2. 排序有助于对数据检查纠错,以及为重新归类或分组 等提供依据
3. 在某些场合,排序本身就是分析的目的之一 4. 排序可借助于计算机完成
《卫生统计学II》(专升本)学习指导

《卫生统计学》(本)学习指导刘仁权(Liurq@、64286391)一、课程总说明(一)课程介绍统计学是一门研究数据的收集、整理、分析的科学。
卫生统计学是一门运用统计学原理和方法研究医药卫生工作中数据的收集、整理、分析的科学。
卫生统计学是医学体系的重要分支,是医学院校学生的必修课程。
随着医学的发展,作为医学科学研究方法学的卫生统计学已逐渐为广大医药卫生工作者所认识、所接受,并广为应用。
通过本课程的学习,可以掌握卫生统计学的基本概念、基本理论和基本方法,掌握收集、整理和分析资料的基本知识和方法,可以培养运用这些知识,对医药卫生工作中的数据进行统计处理的能力。
(二)教材、光盘和计算器在本课程的学习中,指定教材和课件光盘都很重要,同学们一定要准备好指定教材和课件光盘,并准备一个计算器或使用计算机Windows附件中的计算器。
1.课件光盘:北京大学医学网络教育学院多媒体网络课件《卫生统计学》光盘2张,主讲:刘仁权。
光盘中是按教材《医学统计学》(第4版,主编:马斌荣)第一章至第十章内容详细讲解的全程授课视频录像。
2.现在指定教材:《医学统计学》(第6版)主申:马斌荣,主编:李康、贺佳;人民卫生出版社(2013年3月)。
本教材是卫生部“十二五”规划教材、全国高等医药教材建设研究会“十二五”规划教材,是“十二五”普通高等教育本科国家级规划教材。
说明:课件光盘是以前录制的,当时的教材是《医学统计学》(第4版),现在已经没有第4版教材出售了,同学们现在拿到的教材是第6版。
不过两版教材内容基本相同,只是换了例题的数据,但解题过程完全相同。
同学们要注意,本课程比较难,大家要认真观看我教学光盘中的讲课录像,安照光盘的顺序和内容,对照教材学习。
为了方便同学们学习,下面的表格是课件光盘、第6版教材内容的比较。
说明2:光盘中“第七章相对数及其应用”是独立的,可以象教材那样提前学习,不影响其他章节的学习。
3.计算器:准备一个计算器或使用计算机Windows附件中的计算器。
《统计学(第二版)》电子课件 第2章 数据的描述

《统计学》第2章数据的描述
2-19
抽样调查
抽样调查(sampling survey):是从研究对 象的总体中随机抽取一部分个体作为样 本进行调查,并根据调查结果来推断总 体数量特征的一种非全面调查方法。
抽样调查的特点:经济性好、实效性强、 适应面广、准确性高。
2021/8/7
《统计学》第2章数据的描述
2021/8/7
《统计学》第2章数据的描述
2-30
【例2.2】
——条形图的绘制
图2.1 30名教师职称分布条形图
2021/8/7
《统计学》第2章数据的描述
2-31
【例2.3】
——饼图的绘制
(数据文件为)根据表资料, 用SPSS绘制 饼图。
解:打开数据文件example2.1.sav;
选择→“图形”→点击“旧对话框 (L)”→“饼图(E)”→在“图表中的 数据为”中选“个案组摘要(G)→点击 “定义”→ 在“分区的表征”中选中“个 案数(N)”→将“职称”选入“定义分区 (B)”→点击“确定”,可得图。
100.00
2021/8/7
《统计学》第2章数据的描述
2-36
组距分组中的几个基本概念
组限:每个组两端的数值。分为上限和 下限。
组距:一个组的上限与下限两端的距 离。
全距:所有变量值中最大值与最小值 之差 。
组中值:每个组的上限与下限的中点 值。
2021/8/7
《统计学》第2章数据的描述
2-37
数据的计量尺度 数据的类型
2021/8/7
《统计学》第2章数据的描述
2-4
数据的计量尺度
按照对现象计量程度的不同,可以将数据 计量尺度分为四种,即:定类尺度、定序 尺度、定距尺度、定比尺度。
第2章 描述性统计课件

第三节 离散程度的指标
4.变异系数(Coefficient of Variation) 简记为CV,它是标准差与均数之比,用百分数表达。
➢比较不同对象时,用不同的线条或颜色 表示,并要附图例说明。图例写在图的 下面或图的右上角。
• 几种常用的统计图 ➢直条图 (bar graph)
直条图用等宽直条的长短来表示相互独 立的各指标的数值大小。 适用于相互独立的、无连续关系的间断 性资料的比较。
种类:单式直条图和复式直条图
直条图的绘制要点
=4.959
二、几何均数(Geometric Mean)
常用对数计算,公式如下: LogG=∑logX/n
再查反对数得出G。 列成频数表时计算公式如下:
LogG=∑flogX/Σf 适用条件: 1.成倍数关系的资料。
2.明显正偏态分布的资料。
二、几何均数(Geometric Mean)
例3.3 6例钩端螺旋体病人的潜伏期分别为7, 10, 12, 14, 18, 20天, 求其平均潜伏期。
x=
=鍈x/n
适用于服从正态分布的资均数
x为每个组段的组中值, f为相应组段的频数。
原理:将落在某一组段内的观察值都视为
组中值。
本例: =(4.0×4+4.2×5+……+5.8×3)/120
=595.8/120=4.965
如用原始观察值计算有 =(5. 195+5.070+……+5.010)/120
《集中趋势》PPT课件_OK

完成次数 频数f
频率(%)
累计频数 累计频率(%)
(1)
(2)
(3)
(4)
(5)
2
3
2.94
3
2.94
3
7
6.86
10
9.80
4
16
15.69
26
25.49
5
33
32.35
59
57.84
6
24
23.53
83
81.37
7
14
13.73
97
95.10
8
4
3.92
101
99.02
9 合计
1 102
0.98 100.00
编制频数表步骤流程图
23
人 40 数
30
频数分布特征
20
10
0
124
132
140
148
156
164
图 某市120名12岁男童身高的频数分布
24
第二节 集中趋势统计指标
平均数:描述一组变量值集中位置的特征值,用来说明
某种现象或事物数量的平均水平
• 算术均数 • 几何均数 • 中位数
25
一、算术均数: 简称均数,用 X表示(样本均数)
3
定量资料的统计描述
• 统计表-频数分布表 • 统计图-频数分布图 • 统计指标 • 集中趋势:均数、几何均数、中位数 • 离散趋势:极差、四分位间距、方差、标准
差、变异系数
4
表 1 100例高血压患者治疗后临床记录
编号 年龄 性别 治疗组 舒张压 体温 疗效 1 37 男 A 11.27 37.5 显效 2 45 女 B 12.53 37.0 有效 3 43 男 A 10.93 36.5 有效 4 59 女 B 14.67 37.8 无效 …… 100 54 男 B 16.80 37.6 无效
02 第2章定量资料统计描述(85页)

fX 2 158 4 160 2 162 X 160 f 242
简 历
返回总目录 返回章目录 第16页 结束
第2章 定量资料的统计描述
简 历
返回总目录
返回章目录 第17页
结束
第2章 定量资料的统计描述
计算结果
fX 17168 X 143.07 f 120
结束
第2章 定量资料的统计描述
简 历
返回总目录
返回章目录 第12页
结束
第2章 定量资料的统计描述
第二节 集中趋势的描述
1、集中趋势 :代表一组同质变量值的集中趋势
或平均水平。它是指一组平均指标。
2、常用的平均数有算术均数、几何均数和中位数。
3、另外还有:众数,调和平均数和调整均数等。
简 历
返回总目录
返回总目录
返回章目录 第7页
结束
第2章 定量资料的统计描述
例2.1 某年某市120名12岁健康男孩身高资料如表2-1,试编制频数分布表。
简 历
返回总目录
返回章目录 第8页
结束
第2章 定量资料的统计描述
一、频数分布表的编制 编制步骤 : 1. 计算全距 (range): 一组变量值最大值和最小值之 差称为全距(range),亦称极差,常用R表示。 2. 确定组距(class interval): 组距用i表示; 3. 划分组段: 每个组段的起点称组下限,终点称组上 限。一般分为8~15组。 ; 4. 统计频数: 将所有变量值通过划记逐个归入相应组 段 ; 5.频率与累计频率: 将各组的频数除以n所得的比值被 称为频率。累计频率等于累计频数除以总例数。
。
简 历
返回总目录
返回章目录 第35页
统计学(第四版)袁卫 庞皓 贾俊平 杨灿 (02)第2章 统计数据的描述(袁卫)

n
2. 各变量值与平均数的离差平方和最小
(x
i 1
5 - 36
i
x ) min
2
统计学
STATISTICS
几何平均数
统计学
STATISTICS
几何平均数
(geometric mean)
n 个变量值乘积的 n 次方根 2. 适用于对比率数据的平均 3. 主要用于计算平均增长率 4. 计算公式为
QM
25%
QU
2. 不受极端值的影响 3. 主要用于顺序数据,也可用于数值型数据, 但不能用于分类数据
5 - 27
统计学
STATISTICS
四分位数
(位置的确定)
n 1 QL 位置 4 Q 位置 3(n 1) U 4 n QL 位置 4 Q 位置 3n U 4
去掉大小两端的若干数值后计算中间数 据的均值 2. 在电视大奖赛、体育比赛及需要人们进行 综合评价的比赛项目中已得到广泛应用 3. 计算公式为
1.
x
5 - 41
x( n 1) x( n 2) x( n n ) n 2 n
1 2
n 表示观察值的个数;α表示切尾系数,0
f
i
i i
样本平均数
5 - 34
f
i 1
i
统计学
STATISTICS
加权平均数 (例题分析)
x
x f
i 1 k
k
i i
f
i 1
i
3110 103.67 (件) 30
5 - 35
统计学
STATISTICS
平均数
02定量数据的统计描述(医学统计学)

累积频率(%)
4.3
31.1
57.6
M
72.5 85.4 92.1 96.5 98.7 99.4 99.8
100.0 -
思考
三组白鼠体重情况 甲组:26 28 30 32 34 乙组:24 27 30 33 36 丙组:27 28 28 32 35
X甲 X乙 X丙
三组体重的离散程度?
方差( variance )是将离均差平方和再取平均, 即
平均数(average):描述一组变量值的集中位置或 平均水平的指标。
常用的平均数有(算术平)均数、几何(平)均数、中 位数。
不同的分布使用不同的平均数。
一、算术均数
应用:主要适用于单峰对称分布或偏斜度不 大的资料,尤其适合正态分布资料。
例2-3 测得8只正常大白鼠总酸性磷酸酶含量(U/L) 为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。 试求其算术均数。
变异系数(coefficient of variation):用于对均数相
差较大或单位不同的几组观察值的变异程度进行比较。
例3.3 测得某地成年人舒张压均数为77.5mmHg,标准差 10.7mmHg;收缩压均数为122.9mmHg,标准差为 17.1mmHg。试比较舒张压和收缩压的变异程度。
例: 某地120名7岁男孩身高的均数为 123.10cm,标准差为4.71cm;体重均数为 22.29kg,标准差为2.26kg,比较其变异度。
频数
27 169 167
94 81 42 28 14
4 3 1 630
累积频数
27 196 363 457 538 580 608 622 626 629 630