第六章 变异度指标讲解
6第六讲 变异指标

10 20 40 30 8
550 1300 3000 2550 760
-21 -11 -1 9 19
441 121 1 81 361
4410 2420 40 2430 2888
合
计 ——
108
8160
第六讲 变异指标
——
——
12188
步骤:(同上)数据代到公式中:
δ=
∑(X-X)2· f
=
12188 108
第六讲 变异指标
全距的优点:在于计算简便,意义明 确,它是测量变异指标的简便方法。在实 际工作中,可用于工业产品质量的检查和 控制,(如产品强度、硬度、浓度、长度 等差距的波动程度。) 全距的缺点:它只考虑了两个极端值 的情况,因此计算的结果,只能说明标志 值的变动范围。却不能反映数列中各个标 志值的差异程度,因此,用全距测定离散 趋势,只是一种粗略的方法。(尤其在分 组情况下,全距更难准确地反映标志值的 变异程度。)一般在时间性很强的情况下 应用。
第六讲 变异指标
以上三个组学生年龄差异程度不同, 这样用平均数(20岁)分别代表每个组年 龄的一般水平,其代表性对每个组来说必 然不同。
平均年龄(20岁)对丙组具有完全的代表性; 对乙组的代表性比对甲组的代表性要大。
由此看出,用来表明离散趋势的变异 指标,是衡量平均指标代表性的尺度。
第六讲 变异指标
计算结果表明,甲组学生年龄标准差 比乙组大,其平均年龄20岁,对乙组的代 表性比对甲组的代表性大。 (也可说:计算结果表明,甲组学生年 龄的离散趋势比乙组大,因此,乙组学生 的年龄较甲组学生的年龄均匀。) 如果掌握的是分组资料,计算其标准 差要用加权式。
第六讲 变异指标
例2、某厂工人工资分组情况如下
第六章 标志变动度

由于所给资料不同,平均差可分为简单平均差和 加权平均差两种。 1.简单平均差 2.加权平均差
1.简单平均差
当资料未分组时,采用简单平均差的方法 计算。 计算公式为: 简单平均差=
举例
x x n
甲、乙两班组平均工资均为900元 例:某车间两个班组工人工资如 下
甲班组 xx 600乙班组 甲班组平均差 离差绝对值 ( 工资额 离差 离差绝对值 工资额 离差 120 元) n 5 x- x ︳x- x ︳ ︳x- x ︳ x x x- x
7.32
11.11
甲
乙
本章作业
一、完成《统计学习指导书》本章所有 习题。 二、登陆国家统计局网站: 阅读说明我国国民经济和社会发展 的平均指标,了解平均指标的使用。
第一节标志变异指标概述
说明总体各单位某一数量标志值的差异程度的指 标,在统计中称为标志变异指标。 它反映总体各单位标志值的差异程度,所以标志 变异指标又称为标志变动度。 标志变动度弥补了平均指标不能全面描述总体标 志值分布特征的不足,从另一方面说明和深入 描述总体的特征。 标志变动度的作用主要表现在: 举例 1.反映平均数代表性的大小 2.反映生产和其他经济活动的均衡性
企业 全年生产计划完 各季度完成全年计划的百分比(%) 成百分比(%) 一 二 三 四
甲企业
乙企业
100
100
10
25
20
25
30
25
40
25
第二节标志变动度的种类
统计中常用的主要有全距、平均差、标准 差和标准差系数。
一全距 二平均差
三标准差
四标准差系数
一全距
全距是一个数列中最大值与最小值之差,它可以说明总体 单位数量标志的变动程度。 全距 = 极大值 - 极小值 一般说来,全距大,标志变动度就大,平均数的代表性就 小;全距小,标志变动度就小,则平均数的代表性就大。 例如:某车间甲乙两个班组工人日产量资料如下: 甲组:12、13、15、17、17、18、19、19、20、20 乙组:8、12、12、12、14、14、18、24、28、28
统计学变异指标

季度总供货计 划执行结果
一月
二月
三 月
甲厂 100
32 34 34
乙厂 100
20 30 50
观察:哪个厂供货比较均衡?
三、变异指标的计算方法
(一)变异指标的种类(数值) 绝对指标(与原变量值名数相同)
全距 平均差 标准差
相对指标(表现为无名数)
全距 系数
平均差 系数
标准差 系数
分类:全距 平均差 标准差 变异系数
0
0
1
27
2
28
3
24
—
-39
X
85
2
X
85
2
f
10 10
9
90
4
76
1
50
0
0
1
27
4
56
9
72
—
371
σ
X A d
2
f
f
X A d
f 2 d
f
371 39 2 d 14.85(公斤) 165 164
85 245 135 195 660
平均差: A.D.
X X
f
f
660 100
6.6(公斤)
3.平均差的特点
优点:不易受极端数值的影响,能较好地反映全
部单位标志值的实际差异程度;平均差弥补了全距 之不足,它考虑了所有的标志值。
缺点:用绝对值的形式消除各标志值与算术平均数离
差的正负值问题,不便于数学处理和参与统计分析运算。
3.标准差的作用
1、反映某总体各单位某种标志值的离散程度;
第六章 变异度指标

x 乙组:x = ∑n
=
160 5
计算平均差
x x 甲班组: A. D n x x 乙班组: A. D n
= 26÷5=5.2 (件)
= 44÷5=8.8 (件)
甲班组工人日产量的平均差小于乙班组的 ∴甲班组工人平均日产量的代表性大于乙班组
200
按日产量分组 (公斤) 20—30 30—40 40—50 50—60
合 计
计算过程: 按日产量分组 工人数f (公斤) 20—30 10 30—40 70 40—50 90 50—60 30 合 计 200 组中 日产总 x xf 值x 量xf 25 250 170 35 2450 490 45 4150 270 55 1650 390 — 8400 1320
平均日产量: 平均差:
xf x f
8400 42公斤 200
x x f 1320 A D = =6.(公斤) 6 200 f
3、平均差的优缺点
优点:平均差是根据全部数值计算的,受极端
值影响较全距小。 缺点:由于采取绝对值的方法消除离差的正负 号,应用较少。
练习:根据资料计算工人的平均日产量和平均差
2、加权平均差
x xf 计算公式: A D f
应用条件:资料经过分组,各组次数不同。
计算步骤: (1)计算算术平均数
x
x x (3)计算绝对值乘以次数 x x f
(2)计算离差的绝对值
(4)根据公式计算平均差
举例:
某车间200名工人日产量资料如下, 计算其平均差。 工人数 f 10 70 90 30
二、四分位差1、定义:四分位数中间来自个分位数之差, 一般以Q表示。
第六章 变异度指标

σ
= δ
+ σ
i
组间方差 平均组内方差
总方差: 所计算的方差。 总方差:变量值对其算术平均数 X 所计算的方差。
X → 总(体)平均数 Σ( xi X ) 2 2 σ = → n n → 总体单位数
[例] 11个工人的日产量(件)分别为: 例 个工人的日产量( 分别为: 个工人的日产量 15,17,19,20,22,22,23,23,25,26,30。试求其总方差。 。试求其总方差。
方差及标准差的作用 方差及标准差的作用
σ =5
σ =10
是非标志的均值及标准差
其值仅表现为具有某种特征 或不具有某种特征两种情况的标 志称为是非标志,也称交替标志。 志称为是非标志,也称交替标志。
性别: 性别:男、女(非男) 非男)
1 0 1 0
产品质量:合格、 产品质量:合格、不合格
具有某种标志 总体单 的总体单位数 位总数
是非标志的均值及标准差
不具有某种标志 的总体单位数
N = N1 + N 0
N1 = N
∑f
f1
=P
N0 f0 = =Q N ∑f
P +Q =1
是非标志的均值及标准差
是非标志的均值: 是非标志的均值: f x = ∑ x = 1× P + 0 × Q = P ∑f 是非标志的标准差: 是非标志的标准差:
变异系数
以上介绍的各种变异度指标都是用绝对数表示的, 以上介绍的各种变异度指标都是用绝对数表示的,而 且都和平均数有相同单位, 且都和平均数有相同单位,它们的大小不仅受各单位 标志值变异程度的影响, 标志值变异程度的影响,还受各单位标志值平均水平 的影响, 的影响,因此在统计研究中分析不同现象间的总体差 异程度或同类现象但不同平均水平不同总体 的变异度 时就不能直接采用前面的变异程度指标中的一种作为 对比分析,而应采用变异系数作比较分析。 对比分析,而应采用变异系数作比较分析。 变异系数(离散系数):数列的离散水平指标与数列 变异系数(离散系数):数列的离散水平指标与数列 ): 均值的比值。反映总体各单位标志值变异的相对程度, 均值的比值。反映总体各单位标志值变异的相对程度, 通常以百分数表示。 通常以百分数表示。
变异指标讲稿

一、变异指标概念
1、含义:总体各单位变量值(标志值)差异程度的指标, 即反映分配数列中各标志值的变动范围或离差程度的综合 指标,也叫标志变动度,简称变异指标。
2、作用:
1)可以衡量平均数代表性高低 变异指标值越大平均数代表新越低 变异指标值越小平均数代表新越高
2)可以衡量各单位变量值差异程度
变异指标值越大对应变量值差异越大 变异指标值越小对应变量值差异越小
8
80以上
4
合计
20
要求:计算平均成绩、极差
总离差:各单位变量值与与算术平均数离差 之和
算术平均数数学性质有:各单位变源自值与 与算术平均数离差之和等于0,
分析:各单位变量值与与算术平均数离差 之和等于0的原因。
先计平均值再计平均差
先计平均值再计平均差
先计平均值再计平均差
练习
先计平均值再计平均差
个更高? 问题二:三个公司员工工资那个员工之间差异更大?
平均指标可以描述总体各单位变量分布的集 中趋势,(掩盖了各单位变量值的差异)代 表值有算术平均数、调和平均数、几何平均 数、中位数、众数;
而描述总体各单位变量分布的离中趋势就需 要另一类指标,就是变异指标(也称标志变 异度)
向中间靠拢 向两边发散
3、资料如下所示: 按成绩分组(分) 人数(人)
20—40
2
40—60
6
60—80
8
80-100
4
合计
20
要求:计算平均成绩、极差
2、资料如下所示:
按产量分组(件) 人数(人)
5
2
6
6
7
8
8
4
合计
20
要求:计算平均产量、极差 4、资料如下所示:
标志变异指标

第六章标志变异指标一、本章重点1.平均指标描述的是总体的集中趋势,而标志变异指标描述的是总体的离中趋势。
它们从两方面来反映总体的分布特征。
其作用首先是衡量平均指标代表性大小的一种尺度,其次还可以反映社会经济活动过程的均衡性与协调性,第三是抽样方案设计的基本因素之一。
2.全距、全距系数;四分位差、四分位差系数;平均差、平均差系数是测定标志变异程度的最简便的方法。
但由于其数理依据欠科学,在反映标志差异程度方面代表性较差。
3.标准差与标准差系数是反映标志差异程度的主要指标。
它比前面介绍的其它指标都科学。
标准差就是标志值与其算术平均数离差的平方的算术平均数的平方根。
标准差系数是标准差与其算术平均数之比,是反映标志差异程度方面目前最科学的统计指标之一。
4.要掌握是非标志的平均数与标准差的计算。
是非标志的最大值是0.25。
二、难点释疑1.全距、四分位差、平均差、标准差在反映标志变异程度方面各有优缺点。
前者计算简单、反映生动鲜明,但是不准确。
标准差比较准确,但计算过程复杂。
2.标准差系数的应用。
为了对比和分析不同平均水平总体的标志差异程度,就需要使用标准差系数。
它是标志变异的相对指标。
它既消除了变量数列差异的影响,也消除了变量数列水平的影响。
三、练习题(一)填空题1.平均指标说明分布数列中变量值的(),而标志变异指标则说明变量值的()。
2.()反映总体各单位某一数量标志值的共性,也叫集中趋势。
()可以反映他们之间的差异性,也叫()。
3.标志变异指标是衡量()的尺度,它还可以表明生产过程的()或其它经济活动过程的()。
4.标志变动度与平均数的代表性成()。
5.全距是总体中单位标志值的()与()之差。
6.如果资料为组距数列,全距可以用()和()之差来近似地表示全距,他比实际的全距( )。
7.全距受( )的影响最大。
8.是非标志的平均数为( ),标准差为( )。
9.标准差的大小不仅取决于变量值之间( )大小,还取决于( )高低。
第6章 变异度指标

C.动差法
动差--矩. 原点的K阶动差,以Mk表示.
xf 一 阶 原 点 动 差 M 1= ∑ f
∑
一 阶 中 心 动 差 M 1=
∑
( x x) f =0 ∑ f
二 阶 原 点 动 差 M 2= 三 阶 原 点 动 差 M 3= 四 阶 原 点 动 差 M 4=
∑
x f ∑ f x f ∑ f x4 f ∑ f
采用动差法计算偏态系数. 例 采用动差法计算偏态系数.
日产量( 日产量(件) 50以下 50以下 50-60 5060-70 6070-80 7080-90 8090-100 90100-110 100110以上 110以上 合计 工人数( 工人数(人) 组中值x 组中值x 11 13 70 120 50 30 5 1 300 45 55 65 75 85 95 105 115
A. 偏度=算术平均数-众数 若偏度>0,则右偏;若偏度<0,则左偏
众数, 众数,中位数和平均数的关系图示
均值 = 中位数= 众数
均值 中位数 众数
众数 中位数 均值
对称分布
左偏分布
右偏分布
B.偏态系数--用于比较不同的分布数列 B.偏态系数--用于比较不同的分布数列 偏态系数--
偏态系数SKp公式为:
3
2
( x x)2 f 二 阶 中 心 动 差 M 2= ∑ f
∑
∑
( x x )3 f 三 阶 中 心 动 差 M 3= ∑ f
∑
∑
( x x)4 f 四 阶 中 心 动 差 M 4= ∑ f
∑
常采用三阶中心动差作为测定偏度的依据 偏态系数为:
α=
m
σ
3 3
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
解:第一步:求出第一个四分位数和第三个四分位数的位次:
Q1的位次
n
1 4
12 1 4
3.25
Q3的位次
3(n 4
1)
9.75
第二步:求出第一个四分位数和第三个四分位数,得到四分 位数
Q1
ห้องสมุดไป่ตู้22 2
24
23
Q3
30 32 2
31
Q Q3 Q1 31 23 8
显然,只了解变量的集中趋势是不够的!
第一节 变异度指标
一、变异度指标的概念
变异度指标又称标志变动度指标,是综合反 映总体各单位标志值及其分布的差异程度的 指标。
如:七个人的工资分别为:320元,320元, 400元,400元,500元,500元,2000元。
平均工资为634.29元(平均指标 ,集中趋势) 最高和最低之差为1680元(变异度指标,内
三、变异度指标的种类 1、全距 2、四分位差 3、平均差 4、标准差 5、方差 6、离散系数 7、偏度 8、峰度
第二节 变异度指标的计算
一、全距(极差) 1、全距是总体各单位标志值中最大值与最小值之差,又称
极差。 全距 R=最大值-最小值 R xmax xmin
二、四分位差
1、四分位差是四分位数中间两个分位之差。 四位差Q=第三个四分位数Q3—第一个四分位数Q1 实质上是两端各去掉四分之一的数据以后的极差,表示占全
部数据一半的中间数据的离散程度。四分位差越大,表示数 据离散程度越大。
2、适用条件:四分位差是一种顺序统计量,适用于定序数 据和定量数据。尤其是当用中位数来测度数据集中趋势时。
三、学习重点和难点
本章的重点是标准差、离散系数的计算;难点是偏 度与峰度的计算,以及如何正确的运用标准差和离 散系数来判别社会经济现象的代表性。
四、授课课时:4-6学时
变量数列1 变量数列2
___
X
一则笑话
如果你一只脚放在摄氏 1 度的水里,另一只脚放在 摄氏 79 度的水里,平均水温 40 度,你一定感觉很 舒服 ?
--
X X
520 320 120 180 680 1180 --
XX f
2600 3200 2400 1260 3400 3540 16400
n
A.D
| xi x | fi
i 1 n
fi
16400 328元 50
i 1
四、方差和标准差
1. 方差(Variance)
引例
“平均”这个词往往是“算术平均值”的简称。这是 一个很有用的统计学的度量指标。然而,如果有少数几 个很大的数,“平均值”就会给人错误的印象。例如, 有一个人在一条平均只有1.2米的河中淹死了,而成人的 身高一般都会超过1.5米。那么,为什么一条平均深度只 有1.2米的河却会淹死人?原因是这条河深浅不同,这个 人是在一个2米多深的陷坑处沉下去的。
三、平均差
1、平均差是总体各单位标志值对其算术平数的离 差绝对值的算术平均数。反映各个数据与其均值的 平均差距,通常以A.D表示。计算公式为:
未分组数据
已分组数据
n
| xi x | A.D i1
n
n
| xi x | fi A.D i1
n
fi
i 1
平均差含义清晰,能全面地反映数据的离散程度。 但取离差绝对值进行平均,数学处理上不够方便, 在数学性质上也不是最优的。
3、优缺点:计算简单,意义清楚,在一定程度上对极差的 一种改进,避免了极端值的干扰。但反映现象的差异程度较 粗略和不全面,实用价值甚小。
全距和四分位 差均只使用部 分数据进行计
算。
例题:某车间12个工人,其日产量按数量大小依次排列如下: 10,20,22,24,25,26,27,28,30,32,34,35,求 其四分位差。
计算月工资水平的平均差
月工资X 800 1000 1200 1500 2000 2500 合计
员工数f 5 10 20 7 5
3
50
计算月工资水平的平均差
月工资X 800 1000 1200 1500 2000 2500 合计
员工数f 5 10 20 7 5 3 50
X X
-520 -320 -120 180 680 1180
部差异,离中趋势)。
二、变异度指标的作用 1、衡量平均数的代表性。变异度指标值与平均数
的代表性大小成反比。变异度指标值(离散程度) 越大,平均数的代表性就越小。 如有三个生产小组,有5人每日产量如下: 甲组:24 24 24 24 24 乙组:20 22 25 26 27 丙组:10 20 25 30 35 2、衡量现象变动的离散程度、稳定性和均衡程度。 变异度指标越小,现象变动的稳定性和均衡程度越 高。 3、计算抽样误差和确定样本容量的依据。
对于总体数据而言,极差也就是变量变化的范围或幅度大小。 组距数列中,极差≈最高组的上限-最低组的下限。 在总体中任何两个单位的标志值之差都不可能超过极差,即
xi x j R,其中i j
2、优缺点:计算简便、含义直观、容易理解。反映现象的 差异程度较粗略,未考虑数据的中间分布情况,不能充分说 明全部数据的差异程度。
第六章 变异度指标
一、基本内容
第一节 变异度指标的意义
变异度指标的概念、变异度指标的作用、变异度 指标的种类
第二节 变异度指标的计算
全距、四分位差、平均差、标准差和方差、离散 系数
第三节 偏度与峰度
偏度、峰度;偏度和峰度的简捷计算及应用
二、学习目的与要求
通过对本章的学习,使同学们明确变异度指标的概 念、种类和作用,变异度指标和平均指标的区别, 掌握各种变异度指标的计算方法。
(一)全距计算
例 6.1
日产量X 工人数f
R X X 20
3
21
4
max min
22
5
23 6 26 20
24
5
25
26
4 3
6件
∑
30
例 6.2
X分组
f
30-40
1
40-50
3
50-60
8
60-70
4
70-80
2
∑
R X max X min 80 30 50