实用统计学第五章
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章差异分析
第一节差异分析的概念和作用
一.什么是差异分析
差异分析就是研究不同个体或不同条件下的数值差异大小。在经济分析中,常用来分析个人收的差异、投资风险、经营风险、财务风险、稳定性等。
二.差异分析的作用
(一)说明平均数的代表性
平均数作为总体某一数据代表数值,其代表性取决于总体各单位数据值的差异程度。总体各单位数据值的差异程度。总体各单位数据值的差异大,说明该总体的平均数的代表差;总体各单位数据值差异小,则说明该平均数的代表性好。
例如,某车间两个小组工人的月工资资料如下:(单位:元)
甲组:800 900 1000 1100 1200
乙组:900 950 1000 1050 1100
这两个小组工人的月平均工资都是1000元,但各组工人工资的差异程度不同:甲组工人工资每人相差100元,乙组只相差50元。因而,这两具小组工人的平均工资所具有的代表性也不同:甲组各工人工资额的差异较大,其平均数的代表性就差;乙组各工人工资额的差异较小,其平均数的代表性就强。
(二)反映均衡性、稳定性
差异分析可以反映均衡性、稳定性,差异愈小,说明事物的稳定性和均衡性越好;差异越大,说明事物的稳定性和均衡性越差。因此运用差异分析可以考察经济发展的稳定性、生产的稳定性、个人收入水平的均衡性等。
如对某一新品种种子作试验,除确定这一品种作物所达到的平均亩产水平外,还要研究它在生产中的稳定程度。如果这一品种在不同试验田的亩产比较接近,差异程度较小,说明该品种产量具有稳定性,标志着该品种为优良品种,可以推广种植。否则推广价值将受到不利影响。
(三)反映经济风险
风险就是收益的不稳定性,如果收益差异大,就说明收益不稳定,也就是风险大;如果收益差异小,说明收益稳定,就是风险小。差异分析常用来分析投资风险、经营风险等。
(四)衡量估计误差大小
估计误差包括以样本估计总体的误差和预测值与实际值的误差,估计误差的大小分析,就是用差异分析指标来衡量的。估计值与实际值差异越大,估计的准
67
确性越差。
第二节差异分析的方法
常用的差异分析方法有:全距、平均差、标准差、标准离差率等,最常用的是标准差和标准离差率。以下分别加以介绍
一、全距
(一)全距的概念和计算
全距又称极差,它是数据最大值和最小值之差,用以说明数据变动范围的大小。
全距=最大值-最小值
[例5-1]某车间有两个生产小组,都是七名工人,各人日产产品件数如下:甲组:20、40、60、70、80、100、120
乙组:67、68、69、70、71、72、73
甲组日产量全距=120-20=100(件)
乙组日产量全距=73-67=6(件)
从计算可以看出,甲组工人日产量差异大于乙组工人日产量。全距愈小,反映数据愈集中,差异也就愈小;全距愈大,反映变量值愈分散,则差异愈大。
对于根据组距数列求全距,可以用最高组的上限与最低组的下限之差,求全距的近似值。
(二)全距的特点
全距的优点在于计算方便,意义明确。它是差异分析的最简便方法。在实际工作中,全距可用于工业产品质量的检查和控制。在通常的生产条件下,产品质量性能指标如强度、硬度、浓度、尺寸等的差距总是在一定的范围内波动,如果差距超过了一定范围,就说明生产可能出现了问题,必须采取措施。但全距这个指标很粗略,它只考虑数据的两个极端数值的差异,而不管中间数据值的差异情况,因而不介于全面反映数据值的差异程度。
二、平均差
(一)平均差的概念和计算
平均差是各数据值与其平均数的差异绝对值的平均数,又称平均离差。表示平均差异水平。
计算平均差时,由于掌握的资料不同,平均差的计算分为两种情况:
1.根据原始数据计算
在根据原始数据计算时,采用简单平均法。其方法为:
68
69
AD=n
x x ∑-
[例5-2]以[例5-1]所举的甲、乙两组式人日产量为例。说明平均差的计算方法。计算见表5-1。
表 5-1
AD 甲=71.257180
=(件) AD
乙
=71.17
12=(件) 这就是说,在甲、乙两组工人平均日产量相等(都等于70件)的情况下,甲组的平均差明显大于乙组,说明甲组工人日产量水平差异大于乙组。
2.根据分组资料计算
在数据经过分组后,形成分布数列,就应采取加权平均法,其方法为:
AD=
∑∑-f
f x x
[例5-3]某车间200个工人按日产量分组编成分布数列,计算平均差见表
5-2。
70
42200
8400
==
=
∑∑f
xf x (公斤) AD=
∑-f
f x x =
6.6200
1320
=(公斤)
表5-2
计算结果表明,200个工人各自日产量与平均日产量平均差异为6.6公斤。 (二)平均差的特点
平均差是根据全部数据值计算出来的,所以对全部数据值的差异有充分的代表性。但平均差计算由于采用取离差绝对值的方法来达到防止正负离差抵消,因而不适合数学方法的应用,所以在统计分析中较少使用。
三、标准差
(一)标准差的概念和计算
标准差是各个数据值与其平均数的离差平方的平均数的平方根,又称均方差,通常用σ表示。标准差的平方即方差。标准差实际上是平均差的另一种算
法。标准差是测定数据差异大小最常用的指标。其计算方法根据资料的不同也有
两种:
1.根据原始资料计算
根据原始资料计算时,采用简单平均法,计算方法为: n
x x 2
∑-=
)(σ
[例5-4]仍以[例5-1]甲、乙两组工人日产量资料为例,计算标准差如表