第六章-变异指标

合集下载

第六章 变异度指标讲解

第六章 变异度指标讲解

解:第一步:求出第一个四分位数和第三个四分位数的位次:
Q1的位次

n
1 4

12 1 4

3.25
Q3的位次

3(n 4
1)

9.75
第二步:求出第一个四分位数和第三个四分位数,得到四分 位数
Q1

ห้องสมุดไป่ตู้22 2
24

23
Q3

30 32 2

31
Q Q3 Q1 31 23 8
显然,只了解变量的集中趋势是不够的!
第一节 变异度指标
一、变异度指标的概念
变异度指标又称标志变动度指标,是综合反 映总体各单位标志值及其分布的差异程度的 指标。
如:七个人的工资分别为:320元,320元, 400元,400元,500元,500元,2000元。
平均工资为634.29元(平均指标 ,集中趋势) 最高和最低之差为1680元(变异度指标,内
三、变异度指标的种类 1、全距 2、四分位差 3、平均差 4、标准差 5、方差 6、离散系数 7、偏度 8、峰度
第二节 变异度指标的计算
一、全距(极差) 1、全距是总体各单位标志值中最大值与最小值之差,又称
极差。 全距 R=最大值-最小值 R xmax xmin
二、四分位差
1、四分位差是四分位数中间两个分位之差。 四位差Q=第三个四分位数Q3—第一个四分位数Q1 实质上是两端各去掉四分之一的数据以后的极差,表示占全
部数据一半的中间数据的离散程度。四分位差越大,表示数 据离散程度越大。
2、适用条件:四分位差是一种顺序统计量,适用于定序数 据和定量数据。尤其是当用中位数来测度数据集中趋势时。

变异指标的概念和作用

变异指标的概念和作用

变异指标的概念和作用
变异指标是反映总体各单位标志值的差异程度或离散程度指标。

它们是总体数量特征的另一个方面的数学描述。

要进一步掌握和描述变量分布的数量特征就需要计算变量的离中趋势的代表值(变异指标),它是与变量分布集中趋势的代表值(平均指标)相辅相成共同反映变量分布规律的一对对立统一的数量代表值
统计学中的标志变异指标的作用:衡量平均数代表性的大小;反映社会经济活动过程的均衡性;表明生产过程中的节奏性;说明变量的离中趋势;测定集中趋势指标的代表性。

标志变异指标是综合反映总体各单位标志值之间差异程度的一种统计指标。

标志变异指标与平均指标是一个问题的两个方面,是相辅相成的。

平均指标将总体各单位标志值之间的差异抽象化,反映了这些标志值的一般水平,说明了变量数列中变量值的集中点或集中趋势; 而标志变异指标可以反映变量值的离中趋势,说明总体各单位标志值之间的差异大小或变异程度。

扩展资料
测量标志变异的主要指标有极差、平均差、方差、标准差和标志变动系数等。

极差,又称为全距,是总体单位中变量的最大值与最小值之差,一般用R表示;
平均差,平均差是总体各单位的标志值与其平均数的离差绝对值的算术平均数。

它能反映总体各单位标志值的变动程度。

其计算有两种形式,简单平均差和加权平均差;
标准差,标准差是总体各单位标志值与平均数离差平方的算术平均数的平方根。

它是最常用、最重要的标志变异指
标,是反映标志变动度最合理的指标。

离散系数,离散系数是指全距、平均差和标准差与其算术平均数的比值,分别称为极差系数、平均差系数和标准差系数,其中标准差系数是应用最广的一种。

第六章 变异指标

第六章 变异指标

计算方法
可得到:全距系数, 可得到:全距系数,平均差系数 ,标准差系数 使用最多的是标准差系数. 使用最多的是标准差系数. 标准差系数 V = σ
σ x
例题3:已知甲乙两个班组工人生产资料如下: 例题3
甲 日产量 (件) 5 7 9 10 13 合计 班 工人数 (人) 6 10 12 8 4 40 乙 日产量 (件) 8 12 14 15 16 合计 班 工人数 (人) 11 14 7 6 2 40
甲班: x = 甲班
= 8.5(件) 件 = 11.9(件) 件
σ =
∑x f ∑f
2
∑ xf ∑ f
2
甲班: 甲班 σ = 2.22(件) 件 乙班: σ = 2.69(件) 乙班 件
2 .22 = × 100 % = 26 .12 % 8 .5 2 .69 = × 100 % = 22 .61 % 11 .9
要求: 要求:比较一下哪个班组工人的平均日 产量的代表性高? 产量的代表性高?
解题过程如下: 解题过程如下:
甲 日产量 工人数 班 乙 班 工人数 日产量
x
5 7 9 10 13 合 计
f
6 10 12 8 4 40
xf
30 70 108 80 52 340
x f
150 490 972 800 676 3088
3,计算变异系数:
ν
σ
=
σ

甲班: 甲班: ν σ 乙班: 乙班: ν σ
∵乙班变异系数小于甲班
∴乙班工人的平均日产量代表性高. 乙班工人的平均日产量代表性高.

∑|x-x| D = n


计 算 方 法
加权平均差公式: 加权平均差公式:

第六章 变异度指标

第六章    变异度指标
∑x 甲组:x = n = 160 5 = 32(件) = 32(件)
x 乙组:x = ∑n
=
160 5
计算平均差
x x 甲班组: A. D n x x 乙班组: A. D n
= 26÷5=5.2 (件)
= 44÷5=8.8 (件)
甲班组工人日产量的平均差小于乙班组的 ∴甲班组工人平均日产量的代表性大于乙班组
200
按日产量分组 (公斤) 20—30 30—40 40—50 50—60
合 计
计算过程: 按日产量分组 工人数f (公斤) 20—30 10 30—40 70 40—50 90 50—60 30 合 计 200 组中 日产总 x xf 值x 量xf 25 250 170 35 2450 490 45 4150 270 55 1650 390 — 8400 1320
平均日产量: 平均差:
xf x f
8400 42公斤 200
x x f 1320 A D = =6.(公斤) 6 200 f
3、平均差的优缺点
优点:平均差是根据全部数值计算的,受极端
值影响较全距小。 缺点:由于采取绝对值的方法消除离差的正负 号,应用较少。
练习:根据资料计算工人的平均日产量和平均差
2、加权平均差
x xf 计算公式: A D f

应用条件:资料经过分组,各组次数不同。
计算步骤: (1)计算算术平均数
x
x x (3)计算绝对值乘以次数 x x f
(2)计算离差的绝对值
(4)根据公式计算平均差
举例:
某车间200名工人日产量资料如下, 计算其平均差。 工人数 f 10 70 90 30
二、四分位差1、定义:四分位数中间来自个分位数之差, 一般以Q表示。

第六章 变异度指标

第六章 变异度指标

σ
= δ
+ σ
i
组间方差 平均组内方差
总方差: 所计算的方差。 总方差:变量值对其算术平均数 X 所计算的方差。
X → 总(体)平均数 Σ( xi X ) 2 2 σ = → n n → 总体单位数
[例] 11个工人的日产量(件)分别为: 例 个工人的日产量( 分别为: 个工人的日产量 15,17,19,20,22,22,23,23,25,26,30。试求其总方差。 。试求其总方差。
方差及标准差的作用 方差及标准差的作用
σ =5
σ =10
是非标志的均值及标准差
其值仅表现为具有某种特征 或不具有某种特征两种情况的标 志称为是非标志,也称交替标志。 志称为是非标志,也称交替标志。
性别: 性别:男、女(非男) 非男)
1 0 1 0
产品质量:合格、 产品质量:合格、不合格
具有某种标志 总体单 的总体单位数 位总数
是非标志的均值及标准差
不具有某种标志 的总体单位数
N = N1 + N 0
N1 = N
∑f
f1
=P
N0 f0 = =Q N ∑f
P +Q =1
是非标志的均值及标准差
是非标志的均值: 是非标志的均值: f x = ∑ x = 1× P + 0 × Q = P ∑f 是非标志的标准差: 是非标志的标准差:
变异系数
以上介绍的各种变异度指标都是用绝对数表示的, 以上介绍的各种变异度指标都是用绝对数表示的,而 且都和平均数有相同单位, 且都和平均数有相同单位,它们的大小不仅受各单位 标志值变异程度的影响, 标志值变异程度的影响,还受各单位标志值平均水平 的影响, 的影响,因此在统计研究中分析不同现象间的总体差 异程度或同类现象但不同平均水平不同总体 的变异度 时就不能直接采用前面的变异程度指标中的一种作为 对比分析,而应采用变异系数作比较分析。 对比分析,而应采用变异系数作比较分析。 变异系数(离散系数):数列的离散水平指标与数列 变异系数(离散系数):数列的离散水平指标与数列 ): 均值的比值。反映总体各单位标志值变异的相对程度, 均值的比值。反映总体各单位标志值变异的相对程度, 通常以百分数表示。 通常以百分数表示。

标志变异指标

标志变异指标

第六章标志变异指标一、本章重点1.平均指标描述的是总体的集中趋势,而标志变异指标描述的是总体的离中趋势。

它们从两方面来反映总体的分布特征。

其作用首先是衡量平均指标代表性大小的一种尺度,其次还可以反映社会经济活动过程的均衡性与协调性,第三是抽样方案设计的基本因素之一。

2.全距、全距系数;四分位差、四分位差系数;平均差、平均差系数是测定标志变异程度的最简便的方法。

但由于其数理依据欠科学,在反映标志差异程度方面代表性较差。

3.标准差与标准差系数是反映标志差异程度的主要指标。

它比前面介绍的其它指标都科学。

标准差就是标志值与其算术平均数离差的平方的算术平均数的平方根。

标准差系数是标准差与其算术平均数之比,是反映标志差异程度方面目前最科学的统计指标之一。

4.要掌握是非标志的平均数与标准差的计算。

是非标志的最大值是0.25。

二、难点释疑1.全距、四分位差、平均差、标准差在反映标志变异程度方面各有优缺点。

前者计算简单、反映生动鲜明,但是不准确。

标准差比较准确,但计算过程复杂。

2.标准差系数的应用。

为了对比和分析不同平均水平总体的标志差异程度,就需要使用标准差系数。

它是标志变异的相对指标。

它既消除了变量数列差异的影响,也消除了变量数列水平的影响。

三、练习题(一)填空题1.平均指标说明分布数列中变量值的(),而标志变异指标则说明变量值的()。

2.()反映总体各单位某一数量标志值的共性,也叫集中趋势。

()可以反映他们之间的差异性,也叫()。

3.标志变异指标是衡量()的尺度,它还可以表明生产过程的()或其它经济活动过程的()。

4.标志变动度与平均数的代表性成()。

5.全距是总体中单位标志值的()与()之差。

6.如果资料为组距数列,全距可以用()和()之差来近似地表示全距,他比实际的全距( )。

7.全距受( )的影响最大。

8.是非标志的平均数为( ),标准差为( )。

9.标准差的大小不仅取决于变量值之间( )大小,还取决于( )高低。

第6章 变异度指标

第6章 变异度指标

C.动差法
动差--矩. 原点的K阶动差,以Mk表示.
xf 一 阶 原 点 动 差 M 1= ∑ f

一 阶 中 心 动 差 M 1=

( x x) f =0 ∑ f
二 阶 原 点 动 差 M 2= 三 阶 原 点 动 差 M 3= 四 阶 原 点 动 差 M 4=

x f ∑ f x f ∑ f x4 f ∑ f
采用动差法计算偏态系数. 例 采用动差法计算偏态系数.
日产量( 日产量(件) 50以下 50以下 50-60 5060-70 6070-80 7080-90 8090-100 90100-110 100110以上 110以上 合计 工人数( 工人数(人) 组中值x 组中值x 11 13 70 120 50 30 5 1 300 45 55 65 75 85 95 105 115
A. 偏度=算术平均数-众数 若偏度>0,则右偏;若偏度<0,则左偏
众数, 众数,中位数和平均数的关系图示
均值 = 中位数= 众数
均值 中位数 众数
众数 中位数 均值
对称分布
左偏分布
右偏分布
B.偏态系数--用于比较不同的分布数列 B.偏态系数--用于比较不同的分布数列 偏态系数--
偏态系数SKp公式为:
3
2
( x x)2 f 二 阶 中 心 动 差 M 2= ∑ f


( x x )3 f 三 阶 中 心 动 差 M 3= ∑ f


( x x)4 f 四 阶 中 心 动 差 M 4= ∑ f

常采用三阶中心动差作为测定偏度的依据 偏态系数为:
α=
m
σ
3 3

统计学变异指标

统计学变异指标
四、变异指标
一、变异指标的概念
概念:综合反映总体各单位标志值的差异程度
或离散程度。变异指标越大,表明数据越分散、 不集中;变异指标越小,表明数据越集中, 变动范围越小。变异指标反映现象总体总单位变
量分布的离中趋势。
一、变异指标的概念
变异指标(标志变动度), 它是反映总体中各单位标 志值差异程度的综合指标。
3.标准差的作用
1、反映某总体各单位某种标志值的离散程度;
2、用于比较不同总体数值的均衡性或平均数的 代表性;
在两个总体或两组数据平均数相等时,要比较其平均 数代表性大小,这时:
标准差较大的总体,其标志变异程度也较大, 平均数的代表性较小,或社会经济活动过程的 均衡性或稳定性较差;反之,则相反。
评价:标准差是表示一组数据离散程度的最好指 标,是统计分析中最常用的差异量。 标准差具备一个良好的差异量应具备的条件,如: 反应灵敏,有公式严密确定,简明易懂,适合代数运 算等等。 标准差表示一组数据的离散程度,须注意必须是 同一类数据(即同一种测量工具的测量结果),而且 被比较样本的水平比较接近。
0
0
1
27
2
28
3
24

-39

X

85
2

X

85
2
f
10 10
9
90
4
76
1
50
0
0
1
27
4
56
9
72

371
σ
X A d
2
f

f

X A d
f 2 d
f
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

6
8 12 14
11
14 7 6 2
15 16
90
32 476
合 计 40
第四章 综合指标
1、计算工人平均日产量:
340 = 8.5(件) xf x 40 f 乙班: x 476 = 11.9(件) 40 2、计算日产量的标准差:
甲班: x

x f f
2
xf f
3 3
标准差的简捷计算
目的: 避免离差平方和计算过程的出现 变量值平方 的平均数
X X
2

N
2
变量值平均 数的平方
2
简单标准差 加权标准差


X
2
X N

2
X f f
Xf f

2
大象 500kg
1
二班成绩的标准差系数为:
2
表性比二班大。
例:
已知甲乙两个班组工人日产资料如下:
甲 班 日产量 工人数 (件) (人) 5 6 7 10 9 12 10 8 13 4 合计 40 乙 班 日产量 工人数 (件) (人) 8 11 12 14 14 7 15 6 16 2 合计 40
要求:比较一下哪个班组工人的平均日 产量的代表性高?
P Q N1 N0 N
具有某种标志表现的 单位数所占的成数
不具有某种标志表现 的单位数所占的成数
N
N 且有 P Q 1
N

N0
N1 N 0 N 1 N N N
是非标志总体的指标
均 值
XP
Xf f
1 N1 0 N 0 N1 P N N
2 2 2
解:
250 208 950 20 1045900 X 522 .95元 2000 2000
m i 1 i
X X A D f 950 522.95 20 2000
277893 .6 138.95元 2000
全距 分位差
以平均数为比较标准来说明标志的变异情况
平均差
平均差系数
方差
标准差
标准差系数 峰度 偏度
以正态分布为标准说明分配数 列偏离情况的指标
《统计学》第六章
变异指标
第二节
一、全距
全距、分位差和平均差
指所研究的数据中,最大值与最小值之差, 又称极差。
R X max X min
最大变量值或最 最小变量值或最 高组上限或开口 低组下限或开口 组假定上限 组假定下限
即该公司职工月工资的平均差为138.95元。
平均差的特点
优点:不易受极端数值的影响,能综合
反映全部单位标志值的实际差异程度;
缺点:用绝对值的形式消除各标志值与
算术平均数离差的正负值问题,不便于 作数学处理和参与统计分析运算。 一般情况下都是通过计算另一种标志 变异指标——标准差,来反映总体内 部各单位标志值的差异状况
解题过程如下:
甲 日产 量 班 工人 数 xf 乙 班
x
5
f
x2 f
日产 工人 量 数
x
f
xf
88
98 168
x2 f
704 1372
2016 1350 512 5954
7 9
10 13
合计
30 150 10 70 490 12 108 972 8 80 800 4 52 676 40 340 3088
是非标志总体
是非标志 指总体中全部单位只具有“是” 或“否”、“有”或“无”两种 表现形式的标志,又叫交替标志
为研究是非标志总体的数量特征,令
分组 具有某一属性 不具有某一属性 合计 单位数 N1 N0
N
变量值 1 0 —
成数
指是非标志总体中具有某种表现或 不具有某种表现的单位数占全部总 体单位总数的比重
某班三名同学三门课程的成绩如下:
单位:分
课程 语文 数学 英语 总成绩 平均成绩 学生 甲 乙 丙 60 65 55 65 65 65 70 65 75 195 195 195 65 65 65
请比较三名同学学习成绩的差异。
《统计学》第六章
变异指标
第一节 离中趋势
变异指标的基本理论 指总体中各单位标志值背离 分布中心的规模或程度,用 标志变异指标来反映。
《统计学》第六章
变异指标
平均差系数
V AD A D 100﹪ X
《统计学》第六章
变异指标
第三节
一、标准差
标准差和标准差系数
计算公式:
是各个数据与其算术平均数的离差平方 的算术平均数的开平方根,用 来表示; 2 标准差的平方又叫作方差,用 来表示。
⑴ 简单标准差——适用于未分组资料
解:
250 208 950 20 1045900 X 522 .95元 2000 2000


250 522.952 208 950 522.952 20
2000 56386595 .01 167.9元 2000
即该公司职工月工资的标准差为167.9元。
《统计学》第六章
变异指标
【学习目标】通过本章的学习和习题演算,掌握 变异指标的意义和作用;标准差和标准差系数的计算 和应用。了解变异指标的分布特性;极差、平均差和 四分位差的概念、计算公式和特点;分布的偏度与峰 度。 第一节 第二节 第三节 第四节 第五节 变异指标的基本理论 全距、分位差和平均差 标准差和标准差系数 偏度和峰度 变异指标的应用
解:R X max X min 110 10 90 10
计算该公司该季度计划完成程度的全距。 120 80 40 ﹪
全距的特点
优点:计算方法简单、易懂;
缺点: ①易受极端数值的影响,不能全
面反映所有标志值差异大小及分布状况, 准确程度差; ②受个别极端值的影响过于显著, 不 符合稳健性和耐抗性的要求 往往应用于生产过程的质量控制中
A D X1 X X N X N
X
i 1
N
i
X
N
第 i 个单位 的变量值
总体单 位总数
总体算术 平均数
【例A】某售货小组5个人,某天的销售额 分别为440元、480元、520元、600元、750 元,求该售货小组销售额的平均差。
解:
440 480 520 600 750 2790 X 558 元 5 5 N Xi X 440 558 750 558 i 1 A D N 5 468 93.6元 5
即该售货小组5个人销售额的平均差为93.6元。
⑵ 加权平均差——适用于分组资料
A D X 1 X f1 X m X f m f1 f m
X
i 1
m
i
X fi
i
f
i 1
m
第 i 组的变量 值或组中值
平均差系数
V AD
第 i 组变量值 总体算术 平均数 出现的次数

2
甲班: σ = 2.22(件) 乙班: σ = 2.69(件)
3、计算变异系数:


x
2.22 100 % 26.12% 甲班: 8.5 2.69 100 % 22.61% 乙班: 11.9
∵乙班变异系数小于甲班 ∴乙班工人的平均日产量代表性高。
【例】某年级一、二两班某门课的平均成绩分 别为82分和76分,其成绩的标准差分别为15.6 分和14.8分,比较两班平均成绩代表性的大小。
解: 一班成绩的标准差系数为:
15.6 V 1 100 ﹪ 100 ﹪ 19.02 ﹪ 82 X1 14.8 V 2 100 ﹪ 100 ﹪ 19.47 ﹪ 76 X2 因为 V 1 V 2 ,所以一班平均成绩的代
5 5

X
N i 1
i
X

2
N

440 5582 750 5582
5
60080 109.62元 5
即该售货小组销售额的标准差为109.62元。 (比较:其销售额的平均差为93.6元)
⑵ 加权标准差——适用于分组资料

X
m i 1
i m
X fi

2
fi

i 1
第 i 组的变量 第 i 组变量值 总体算术 值或组中值 出现的次数 平均数
【例B】计算下表中某公司职工月工资的标准差。
X 职工人数(人)f 月工资(元) 组中值(元) 250 208 300以下 350 314 300~400 450 382 400~500 550 456 500~600 650 305 600~700 750 237 700~800 850 78 800~900 950 20 900以上 — 2000 合计
一、离中趋势的涵义
反映统计数据差异程度的综 合指标,也称为标志变动度
变异指标值越大,平均指标的代表性越小; 反之,平均指标的代表性越大
测定离中趋势的意义
用来衡量和比较平均数代表性的大小;
用来反映社会经济活动过程的均衡性和
节奏性;
用来衡量风险程度。
例如:某车间有两个生产小组,各有7名 工人,各人日产量如下:
甲组:20,40,60,70,80,100,120
乙组:67,68,69,70,71,72,73
X 甲 X乙 70件
供货计划完成百分比(%) 季度总供 货计划执 行结果 甲 厂 乙 厂 100 100
1月
32 20
2月
34 30
相关文档
最新文档