第六章变异指标
第六章 变异度指标讲解

解:第一步:求出第一个四分位数和第三个四分位数的位次:
Q1的位次
n
1 4
12 1 4
3.25
Q3的位次
3(n 4
1)
9.75
第二步:求出第一个四分位数和第三个四分位数,得到四分 位数
Q1
ห้องสมุดไป่ตู้22 2
24
23
Q3
30 32 2
31
Q Q3 Q1 31 23 8
显然,只了解变量的集中趋势是不够的!
第一节 变异度指标
一、变异度指标的概念
变异度指标又称标志变动度指标,是综合反 映总体各单位标志值及其分布的差异程度的 指标。
如:七个人的工资分别为:320元,320元, 400元,400元,500元,500元,2000元。
平均工资为634.29元(平均指标 ,集中趋势) 最高和最低之差为1680元(变异度指标,内
三、变异度指标的种类 1、全距 2、四分位差 3、平均差 4、标准差 5、方差 6、离散系数 7、偏度 8、峰度
第二节 变异度指标的计算
一、全距(极差) 1、全距是总体各单位标志值中最大值与最小值之差,又称
极差。 全距 R=最大值-最小值 R xmax xmin
二、四分位差
1、四分位差是四分位数中间两个分位之差。 四位差Q=第三个四分位数Q3—第一个四分位数Q1 实质上是两端各去掉四分之一的数据以后的极差,表示占全
部数据一半的中间数据的离散程度。四分位差越大,表示数 据离散程度越大。
2、适用条件:四分位差是一种顺序统计量,适用于定序数 据和定量数据。尤其是当用中位数来测度数据集中趋势时。
第六章 变异指标

计算方法
可得到:全距系数, 可得到:全距系数,平均差系数 ,标准差系数 使用最多的是标准差系数. 使用最多的是标准差系数. 标准差系数 V = σ
σ x
例题3:已知甲乙两个班组工人生产资料如下: 例题3
甲 日产量 (件) 5 7 9 10 13 合计 班 工人数 (人) 6 10 12 8 4 40 乙 日产量 (件) 8 12 14 15 16 合计 班 工人数 (人) 11 14 7 6 2 40
甲班: x = 甲班
= 8.5(件) 件 = 11.9(件) 件
σ =
∑x f ∑f
2
∑ xf ∑ f
2
甲班: 甲班 σ = 2.22(件) 件 乙班: σ = 2.69(件) 乙班 件
2 .22 = × 100 % = 26 .12 % 8 .5 2 .69 = × 100 % = 22 .61 % 11 .9
要求: 要求:比较一下哪个班组工人的平均日 产量的代表性高? 产量的代表性高?
解题过程如下: 解题过程如下:
甲 日产量 工人数 班 乙 班 工人数 日产量
x
5 7 9 10 13 合 计
f
6 10 12 8 4 40
xf
30 70 108 80 52 340
x f
150 490 972 800 676 3088
3,计算变异系数:
ν
σ
=
σ
甲班: 甲班: ν σ 乙班: 乙班: ν σ
∵乙班变异系数小于甲班
∴乙班工人的平均日产量代表性高. 乙班工人的平均日产量代表性高.
�
∑|x-x| D = n
特
点
计 算 方 法
加权平均差公式: 加权平均差公式:
统计学变异指标ppt课件

乙 丙 丁戊 520 600 700 850 平均奖金
标志值(变量值) = 626(元)
平均指标说明总体各单位变量值分布的集中趋势; 变异指标说明总体各单位变量值分布的离中趋势或分散程度。
离中趋势的概念: 指总体中各单位标志值背离分布中心(平均数)的
程度,也就是总体各单位标志值之间差异程度,用标志 变异指标反映其大小。
数据1: 1、 2、 3、 4、 5 数据2: 10、20、 30、40、50
显然,这两组数据的差别程度相同,而它们水平不同或平 均数不同,这时就不能用绝对指标(标准差)比 较它们的差异程度大小。
这时就要计算离散系数指标来比较它们之间的差别程度 大小。
变异系数
如果两个数列平均水平不同,或两个数列标志值 的计量单位不同时,要比较其数列的变动度(即比较 其数列平均数的代表性大小),怎么办?
V
X
100﹪
在实际工作中运用最为广泛的是标准差系数指标。
注意:标准差与标准差系数的不同应用条件:
在比较两个不同数列(总体)标志变异程度大小 (或说明其平均数代表性大小)时,当其平均水平相 同时,可直接计算标准差进行比较;当其平均水平不 相同(或其计量单位不同)时,需消除平均水平不同 或计量单位不同的影响,计算标准差系数进行比较。
—
-39
X 85 2 X 85 2 f 10 10
9
90
4
76
1
50
0
0
1
27
4
56
9
72
—
371
σ
X A d
2
f
f
X A d
f 2 d
f
371 39 2 d 14.85(公斤) 165 164
《统计基础与方法》习题06

第六章标志变异指标一、本章重点1.平均指标描述的是总体的集中趋势,而标志变异指标描述的是总体的离中趋势。
它们从两方面来反映总体的分布特征。
其作用首先是衡量平均指标代表性大小的一种尺度,其次还可以反映社会经济活动过程的均衡性与协调性,第三是抽样方案设计的基本因素之一。
2.全距、全距系数;四分位差、四分位差系数;平均差、平均差系数是测定标志变异程度的最简便的方法。
但由于其数理依据欠科学,在反映标志差异程度方面代表性较差。
3.标准差与标准差系数是反映标志差异程度的主要指标。
它比前面介绍的其它指标都科学。
标准差就是标志值与其算术平均数离差的平方的算术平均数的平方根。
标准差系数是标准差与其算术平均数之比,是反映标志差异程度方面目前最科学的统计指标之一。
4.要掌握是非标志的平均数与标准差的计算。
是非标志的最大值是0.25。
二、难点释疑1.全距、四分位差、平均差、标准差在反映标志变异程度方面各有优缺点。
前者计算简单、反映生动鲜明,但是不准确。
标准差比较准确,但计算过程复杂。
2.标准差系数的应用。
为了对比和分析不同平均水平总体的标志差异程度,就需要使用标准差系数。
它是标志变异的相对指标。
它既消除了变量数列差异的影响,也消除了变量数列水平的影响。
三、练习题(一)填空题1.平均指标说明分布数列中变量值的(),而标志变异指标则说明变量值的()。
2.()反映总体各单位某一数量标志值的共性,也叫集中趋势。
()可以反映他们之间的差异性,也叫()。
3.标志变异指标是衡量()的尺度,它还可以表明生产过程的()或其它经济活动过程的()。
4.标志变动度与平均数的代表性成()。
5.全距是总体中单位标志值的()与()之差。
6.如果资料为组距数列,全距可以用()和()之差来近似地表示全距,他比实际的全距()。
7.全距受()的影响最大。
8.是非标志的平均数为(),标准差为()。
9.标准差的大小不仅取决于变量值之间()大小,还取决于()高低。
6第六讲 变异指标

②变异指标可以衡量平均指标的代表 性。平均指标作为总体各单位标志值一般 水平的代表——(即它是一个代表值)其 代表性的高低,要取决于变异指标——即 各单位标志值的差异程度。
二者关系为:
变异指标越大,平均指标的代表性越小, 变异指标越小,平均指标的代表性越大, 变异指标为零,平均指标具有完全代表性。
算术平均数(X) 众数(Mo) 它们有一个共同的特征—— 中位数(Me) 都是代表值,用它来反映总体的一般水平或集中 趋势。平均指标消除了各单位标志值的差异情况 但事实上,客观事物中的这种差异(别)又是客 观存在的。(例如:教师工资有多有少,学生分 数有高有低,)标志值之间的这种差异在统计学 上叫做离散趋势,那么这种差异到低有多大呢, 即离散的程度如何呢?这必须要由变异指标来测 定。
55 65
10 30
550 1950
-17 -7
289 49
2890 1470
70-80
80-90 合计
75
85 ——
40
20 100
3000
1700 7200
第六讲 变异指标
3
13 ——
9
169 ——
360
3380 8100
步骤:1)计算组中值,求平均数
2)计算各个标志值与算术平均数的离差 X-X 3)将各项离差加以平方,并乘以次数(X-X)2f 4)把数据代入公式中。
10 70 90 30
25 35 45 55
250 2450 4050 1650
-17 -7 3 13
17 7 3 13
170 490 270 390
合计
200
—
8400
—
40
统计学 第六章 平均指标和标志变异指标概论

哪名运动员的发挥更稳定?
最会的比赛结果是: 中国运动员郭文珺凭借决赛的稳定发挥,以总成绩492.3环 夺得金牌; 预赛排在第1名的俄罗斯运动员纳塔利娅·帕杰 林娜以总成绩498.1环获得银牌; 预赛排在第4名的格鲁吉 亚运动员妮诺·萨卢克瓦泽以总成绩487.4环的成绩获得铜 牌; 而预赛排在第3名的蒙古运动员卓格巴德拉赫·蒙赫珠 勒仅以479.6环的成绩名列第8名
学习目标
● 理解平均指标的意义和作用 ● 掌握数值平均数的计算方法 ● 掌握位置平均数含义﹑适用范围及计算 ● 能运用标志变异指标进行平均数 代表性的对比分析
学习重点
1、平均数和强度相对数的区别;算数平均数的特点 2、数值平均数的计算 3、众数的定义、计算及特点 4、中位数的定义、计算及特点 5、四分位数的确定 6、能运用标志变异指标进行平均数代表性的对比分析
x x1 x2 x3 xn x
n
n
四、加权算术平均数
例2 某车间20名工人加工某种零件资料:
按日产量分 工人数(人)f 日产总量 xf 组(件)x
14
2
28
求平均日产量?
15
4
60
16
8
128
平均日产量 319 20
17
5
85
16件
18
1
18
合计
20
319
Байду номын сангаас
四、加权算术平均数
1、根据单项数列计算加权算术平均数
计算公式:
n
x
x1 f1 x2
f2 x3 f3 xn
n
fn
xi
i1 n
fi
fi
fi
i1
i1
第六章 变异度指标

x 乙组:x = ∑n
=
160 5
计算平均差
x x 甲班组: A. D n x x 乙班组: A. D n
= 26÷5=5.2 (件)
= 44÷5=8.8 (件)
甲班组工人日产量的平均差小于乙班组的 ∴甲班组工人平均日产量的代表性大于乙班组
200
按日产量分组 (公斤) 20—30 30—40 40—50 50—60
合 计
计算过程: 按日产量分组 工人数f (公斤) 20—30 10 30—40 70 40—50 90 50—60 30 合 计 200 组中 日产总 x xf 值x 量xf 25 250 170 35 2450 490 45 4150 270 55 1650 390 — 8400 1320
平均日产量: 平均差:
xf x f
8400 42公斤 200
x x f 1320 A D = =6.(公斤) 6 200 f
3、平均差的优缺点
优点:平均差是根据全部数值计算的,受极端
值影响较全距小。 缺点:由于采取绝对值的方法消除离差的正负 号,应用较少。
练习:根据资料计算工人的平均日产量和平均差
2、加权平均差
x xf 计算公式: A D f
应用条件:资料经过分组,各组次数不同。
计算步骤: (1)计算算术平均数
x
x x (3)计算绝对值乘以次数 x x f
(2)计算离差的绝对值
(4)根据公式计算平均差
举例:
某车间200名工人日产量资料如下, 计算其平均差。 工人数 f 10 70 90 30
二、四分位差1、定义:四分位数中间来自个分位数之差, 一般以Q表示。
第六章 变异度指标

σ
= δ
+ σ
i
组间方差 平均组内方差
总方差: 所计算的方差。 总方差:变量值对其算术平均数 X 所计算的方差。
X → 总(体)平均数 Σ( xi X ) 2 2 σ = → n n → 总体单位数
[例] 11个工人的日产量(件)分别为: 例 个工人的日产量( 分别为: 个工人的日产量 15,17,19,20,22,22,23,23,25,26,30。试求其总方差。 。试求其总方差。
方差及标准差的作用 方差及标准差的作用
σ =5
σ =10
是非标志的均值及标准差
其值仅表现为具有某种特征 或不具有某种特征两种情况的标 志称为是非标志,也称交替标志。 志称为是非标志,也称交替标志。
性别: 性别:男、女(非男) 非男)
1 0 1 0
产品质量:合格、 产品质量:合格、不合格
具有某种标志 总体单 的总体单位数 位总数
是非标志的均值及标准差
不具有某种标志 的总体单位数
N = N1 + N 0
N1 = N
∑f
f1
=P
N0 f0 = =Q N ∑f
P +Q =1
是非标志的均值及标准差
是非标志的均值: 是非标志的均值: f x = ∑ x = 1× P + 0 × Q = P ∑f 是非标志的标准差: 是非标志的标准差:
变异系数
以上介绍的各种变异度指标都是用绝对数表示的, 以上介绍的各种变异度指标都是用绝对数表示的,而 且都和平均数有相同单位, 且都和平均数有相同单位,它们的大小不仅受各单位 标志值变异程度的影响, 标志值变异程度的影响,还受各单位标志值平均水平 的影响, 的影响,因此在统计研究中分析不同现象间的总体差 异程度或同类现象但不同平均水平不同总体 的变异度 时就不能直接采用前面的变异程度指标中的一种作为 对比分析,而应采用变异系数作比较分析。 对比分析,而应采用变异系数作比较分析。 变异系数(离散系数):数列的离散水平指标与数列 变异系数(离散系数):数列的离散水平指标与数列 ): 均值的比值。反映总体各单位标志值变异的相对程度, 均值的比值。反映总体各单位标志值变异的相对程度, 通常以百分数表示。 通常以百分数表示。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对分组资料,不能确知最大值和最小值,求全距 用最大组的上限减去最小组的下限
组距
f
150~156
3
156~162
9
162~168
25
168~174
34
174~180
20
180~186
7
186~192
1
192~198
1
合计
100
运用上 述方法计 算左边数 列的全距
11
对于开口组: 最高组的上限=最高组的下限+邻组的组距 最低组的下限=最低组的上限-邻组的组距
N
5
=
X2 (
X )2
27151
365
2
10.06
N
N
5 5
X
(X X)
(X X )2
72
-1
1
81
8
64
86
13
169
69
-4
16
57
-16
256
365
标准差是方差的正平方根。 方差和标准差即克服平均差带有绝 对值的缺点,又保留其综合平均的优点。
23
一、总体方差和标准差
• 1. 对于未分组资科
(X X )2
N
XHale Waihona Puke (X )2NN
24
求72、81、86、69、57这些数字的标准差。
X X 365 73.0
N5
(X X )2 506 10.06
平均差是离差绝对值的算术平均数 (mean deviation)。
15
1.对于未分组资料 A ·D= X X
N
2.对于分组资料
A
·D=
f X
f
X
3.平均差的性质
在受抽样变动、极端值影响,处理不确定组
距方面均同于算术平均数;不适于代数运算,其 理论意义不易阐述。
16
[例1] 试分别以算术平均数为基准, 求85,69,69,74,87,91,74这 些数字的平均差。
Q • D Q3 Q1 2
求下组成绩的四分位差:
请大家
计算一下, 看能否算对
78 80 82 85 89 87 90 86 79 88 84 81
14
三、 平均差(Mean absolute deviation)
要测定变量值的离中趋势,尤其是要测 定各变量值相对于平均数的差异情况,一 个很自然的想法就是计算各变量值与算术 平均数的离差。
• 变异指标 用以反映总体各单位标志值的变
动范围或参差程度,与平均指标相对应,从 另一个侧面反映了总体的特征。
5
例如有A、B、C、D四组学生各5人的成 绩如下:
A组:60 ,60,60,60,60 B组:58,59,60,61,62 C组:40,50,60,70,80 D组:80,80,80,80,80
7
二、标志变异指标的作用
• 1.标志变异指标是评价平均数代表性的依据。 • 2.标志变异指标可用来反映社会经济活动过
程的均衡性和稳定性。标志变异指标值小, 说明社会经济活动过程的均衡性和稳定性 好,反之则差。 • 3.标志变异指标还是抽样调查中计算抽样误 差和抽样数目的依据。
8
第二节 极差、分位差、平均差和异众比率
19
• 1. 变异系数 绝对离势统计量与其算术平均数的比
率,用V表示。变异系数是最具有代表性的 相对离势。
20
• 全距系数
全距系数是众数据的 全距与其算术平均数之 比,其计算公式是
VR
R X
• 平均差系数
平均差系数是众数据 的平均差与其算术平均 数之比,其计算公式是
VAD
R X
21
2. 异众比率
所谓异众比率,是指非众数的频数与总体单位 数的比值,用V·R来表示
其中:fM o
V R V fMo N
为众数的频数;N
是总体单位数
异众比率能表明众数所不能代表的 那一部分变量值在总体中的比重。
22
第三节 方差和标准差(standard deviation)
方差是各变量值对其算术平均数的离 差平方的算术平均数。
第六章离中趋势—— 标志变异指标
1
学习目的:
理解标志变异指标的意义和作用;掌握 各种标志变异指标的性质和计算方法。
2
•主要内容: •第一节:变异指标的意义和作用 •第二节:极差、分位差、平均差和异众比率 •第三节:方差和标准差 •第四节:偏度与峰度
3
第一节 变异指标的意义和作用
一、标志变异的概念 • 标志变异指标也称标志变动度,是反映总体各单
x 78.4
• X X =7.9 N
17
[例2] 试以算术平均数为基准,求下表所示数据 的平均差。
组距
f
150~156
3
156~162
9
162~168
25
168~174
34
174~180
20
180~186
7
186~192
1
192~198
1
合计
100
计算左 边数列的 平均差
18
四、异众比率
上述各种反映离中趋势的变异指标,都 具有和原资料相同的计算单位,称绝对离 势。但欲比较具有不同单位的资料的参差 程度,或比较单位虽相同而均值不相同的 资料的参差程度,离势的绝对指标则很可 能导致某些错误结论。所以,我们还得了 解和学习相对离势。
12
极差优缺点:
优点:
计算简单、 直观。
缺点:
(1)受极端值影响大; (2) 没有量度中间各个单位间 的差异性,数据利用率 低,信息丧
失严重;
(3)受抽样变动影响大,大样 本全距比小样本全距大。
13
二、四分位差(Quartile deviation) 第三四分位数和第一四分位数的半距。
避免全距受极端值影响大的缺点。
一、极差(Range)
极差(R):最大值和最小值之差。 也叫全距。全距越大,表示变动越大。
R =Xmax– Xmin
9
[例] 求74,84,69,91,87,74,69这些 数字
的全距。 [解] 把数字按顺序重新排列:69,69,
74, 74,84,87,91,显然有
R =Xmax– Xmin =91—69=22
数据显示:平均数相同,离势可能不同; 平均数不同,离势可能相同。
6
变异指标如按数量关系来分有以下两类; • 凡用绝对数来表达的变异指标,统称绝对离势;
主要有极差、平均差、四分位差、 标准差等。
• 凡用相对数来表达的变异指标,统称相对离势; 主要有异众比率、标准差系数、平均差 系数和一些常用的偏态系数。
位标志值之间差异程度的综合指标。 • 平均指标把总体各单位数量标志值间的差异抽象
化了,反映现象的一般水平,表明事物的集中趋 势。但被抽象化了的各单位标志值之间的差异究 竟有多大,平均指标的代表性又如何,这需要计 算标志变异指标来测定。
4
• 所谓离中趋势,是指数列中各变量值之间 的差距和离散程度。
• 离势小,平均数的代表性高; • 离势大,平均数代表性低。