第一节 数据集中趋势的测度

合集下载

2012年经济师测试中级经济基础预习讲义 集中趋势的测度

2012年经济师测试中级经济基础预习讲义 集中趋势的测度

2012年经济师测试中级经济基础预习讲义集中趋势的测度第二十二章数据特征的测度第一节集中趋势的测度集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。

集中趋势的测度,主要包括:位置平均数----众数、中位数等数值平均数----算术平均数和几何平均数等(一)、众数1、涵义:众数是一组数据中出现频数最多的那个数值,用M0表示。

2、用众数反映集中趋势,非常直观,不仅适用于品质数据,也适用于数值型数据。

众数是一个位置代表值,不受极端值的影响,抗干扰性强。

(二)中位数1、涵义:把一组数据按从小到大的顺序进行排列,位置居中的数值叫做中位数,用Me表示。

中位数将数据分为两部分,其中一半的数据小于中位数,另一半数据大于中位数。

2、中位数计算:根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,n为数据的个数,其公式为: n为奇数:中位数位置是,该位置所对应的数值就是中位数数值。

n为偶数:中位数位置是介于和( +1)之间,中位数数值就是所对数值和( +1)所对应数值的算术平均数。

具体计算见教材例题:3、中位数主要用于顺序数据,也适用于数值型数据,但不适用于分类数据,中位数也是一(三)算术平均数1、涵义:算术平均数是全部数据的算术平均,又称均值,用表示。

是集中趋势中最主要的测度值。

主要适用于数值型数据,但不适用于品质数据。

2、计算公式(1)简单算术平均数简单算术平均数主要用于处理未分组的原始数据。

简单算术平均数的计算公式为:(2)加权算术平均数加权算术平均数主要用于处理经分组整理的数据。

加权算术平均数的计算公式为:Xi——各组的组中值fi——各组的频数3、计算和运用算术平均数注意事项:(1)算术平均数同时受到两个因素的影响:各组数值的大小、各组分布频数的多少。

频数在算术平均数中起着权衡轻重的作用。

(2)算术平均数易受极端值的影响。

极端值的出现,会使平均数的真实性受到干扰。

集中趋势的度量

集中趋势的度量

第五章数据分布特征的描述第一节集中趋势指标概述一、集中趋势指标及其特点集中趋势(Central tendency),是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是要寻找数据一般水平的代表值或是心值。

在现象的同质总体中,各个单位的标志值是不尽相同的。

如果我们的目的是要对总体的数量水平有一个概括地、一般地认识,显然不能用某一单位的标志值表示。

统计平均数就是用来反映总体的一般水平和集中趋势的指标。

通俗的理解就是,在不变更总体总量的情况下,对总体内的全部标志值进行“截长补短”,使得总体各单位拥有同一水平的数量表现,这个同一水平的数量表现就是平均数,即集中趋势指标。

统计平均数有两个重要的特点:第一,平均数是一个代表值,表示被研究总体的一般水平。

例如,某企业职工的工资水平有高有低,有的职工月工资1680元,有的职工月工资1900元,有的职工月工资1870元,有的职工月工资2200元,等等。

若根据该企业各个职工月工资额综合计算出职工月平均工资为1860元,那么,1860元就是一个代表值。

它反映了该企业职工月工资的—般水平。

第二,平均数把被研究总体各单位的标志值的数量差异抽象化了。

例如,某企业职工的月平均工资为1860元,但是各个职工的工资水平有高有低,高于1860元的工资和低于1860元的工资互相抵消了,从而得出平均工资1860元。

由此可见,平均工资(1860元)已把各职工月工资水平的差别抽象化了。

二、集中趋势指标的作用集中趋势指标——统计平均数,在统计研究中被广泛应用,平均数的作用可以归纳为以下几点:1.利用平均数对比不同总体的一般水平。

平均数可以用来对同类现象在各单位、各部门、各地区之间进行比较,以说明生产水平的高低或经济效果的好坏。

例如,要比较不同的生产企业生产水平的好坏,仅对比企业的产品总产量是不足以说明问题的,因为产品总产量受到企业规模大小的影响。

要比较,需要计算各企业生产人员的平均产品产量,即劳动生产率,并分析不同的生产条件,才能做出正确的判断。

中级经济师-经济基础知识-基础练习题-第二十四章描述统计-一、集中趋势的测度

中级经济师-经济基础知识-基础练习题-第二十四章描述统计-一、集中趋势的测度

中级经济师-经济基础知识-基础练习题-第二十四章描述统计-一、集中趋势的测度[单选题]1.某小学六年级8个班的学生人数由少到多依次为34人、34人、34人、34人、36人、36人、37人、37人(江南博哥),其中位数为()。

A.34B.35C.36D.37正确答案:B参考解析:此题考查集中趋势测度值,已排序,居中的是34人36人,则中位数是(34+36)÷2=35人。

[单选题]5.下面一组数据为9个家庭在2017年的人均月收入数据(单位:元):750、780、850、960、1080、1250、1500、1650、2000,则中位数为()元,均值为()元。

A.750,1250B.1080,1202.2C.1500,1080D.2000,1500正确答案:B参考解析:本题考查集中趋势的测度。

先把上述数据按顺序排列,由于有9个数据,是奇数,中位数的位置为(9+1)/2=5,中位数是1080元。

均值=(750+780+850+960+1080+1250+1500+1650+2000)/9=1202.2(元)。

[单选题]6.某直辖市下辖8个县,每个县的面积如下(单位:平方公里):1455、2019、912、1016、1352、1400、1792、2000,则该直辖市下辖县面积的中位数是()。

A.1400B.1455C.1427.5D.1428正确答案:C参考解析:本题考查中位数的具体应用。

把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫作中位数。

Me=(1400+1455)÷2=1427.5[单选题]7.下面是抽样调查的10个学生的考试分数等级,分别为:不及格,中,中,良,良,良,良,优,优,优。

这10个学生分数的众数为()。

A.优B.中C.良D.不及格正确答案:C参考解析:此题考查集中趋势测度值中的众数。

众数是指一组数据中出现次数(频数)最多的变量值,题目中良的出现次数最多,所以应为良。

数据分布特征的描述

数据分布特征的描述

该项活动中,每月都有数据统计及分析以用来进 行该项活动旳调整与实施。
如:有一组有关病人进入“救济”活动旳时间长 度旳数据:
67个样本:时间长度从1天到185天。
除了对该组数据进行频数方面旳描述和分析外, 下面旳统计措施在描述数据分布特征及分析方面也很 主要:
均值(mean):35.7天; 中位数(median):17天; 众数(Mode):1天
X Me Mo 当分布右偏时(阐明存在极端大旳值)
X Me Mo
3、在偏斜度适度旳情况下,不论是左偏还是右偏,中位数
与算术平均数之差约等于众数与算术平均数之差旳1/3,即有如
下经验公式:
Me
X
1 3 (M O
X)
众数、中位数和均值旳应用场合
• 众数、中位数和均值都是对数据集中趋势旳测度,
1、均值由全部数据计算,包括了全部数据旳信息,具有良 好旳数学性质,当数据接近对称分布时,具有很好旳代表性; 但对于偏态分布,其代表性较差。
Graduates Monthly Graduates Monthly Graduates Monthly
Salary($)
Salary($)
Salary($)
1
2350
5
2255
9
2440
2
2450
6
2210
10
2852
3
2550
7
2390
11
2428
4
2380
8
2630
12
2380
未分组时旳算术平均值为:2440
一、均值(Mean)
均值就是一组数据旳平均值(average value),用来测 度中心位置(central location)。

中级经济师-经济基础、第二十三章描述统计-第一节集中趋势的测度及第二节离散程度的测度(一)

中级经济师-经济基础、第二十三章描述统计-第一节集中趋势的测度及第二节离散程度的测度(一)

第二十三章描述统计【本章内容讲解】对统计数据特征的测度,主要从三个方面进行:一是分布的集中趋势,反映数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的偏态和峰度,反映数据分布的形状。

第一节、集中趋势的测度【本节知识点】1.均值的计算及适用范围2.中位数的计算及适用范围3.众数的含义及适用范围【本节内容精讲】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。

集中趋势均值也就是平均数,就是数据组中所有数值的总和除以该组数值的个数。

【提示1】它是集中趋势中最主要的测度值,是一组数据的重心所在,解释了一组数据的平均水平。

【提示2】均值主要适用于数值型数据,但不适用于分类数据和顺序数据。

【提示3】均值易受极端值的影响,极端值会使得均值向极大值或极小值方向倾斜,使得均值对数据组的代表性减弱。

【例题1:2014年单选题】在某城市2014年4月空气质量检测结果中,随机抽取6天的质量指数进行分析。

样本数据分别是:30、40、50、60、80和100,这组数据的平均数是()。

A. 50B. 55C. 60D. 70【答案】C【解析】均值即位平均数,本题均值=(30+40+50+60+80+100)/6=60【知识点二】中位数1.含义:把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫做中位数。

中位数将数据分为两部分,其中一半的数据小于中位数,另一半数据大于中位数。

2.计算: 根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,n 为数据的个数,其公式为: (1)n 为奇数:中位数位置是21 n ,该位置所对应的数值就是中位数数值。

(2)n 为偶数:中位数位置是介于2n 和(2n +1)之间,中位数就是这两个位置对应的数据的均值。

3.适用:中位数主要用于顺序数据,也适用于数值型数据,但不适用于分类数据,中位数不受极端值的影响,抗干扰性强。

第四章 综合指标(下)(平均指标和变异指标)

第四章  综合指标(下)(平均指标和变异指标)

x) 0
③、各变量值与算术平均数的离差平方和最小
2 ( x x ) min i i 1 n
2、调和平均数 (倒数平均数 Harmonic mean) (1)、定义:调和平均数是变量值倒数的算术平均数 的倒数,又称倒数平均数。 从数学意义上来说,是一种独立的平均指标;在统计 实践中,大多数情况下是将调和平均数作为算术平均数 的变形来使用的。
(三)、平均指标的作用
1、用于不同总体的同类现象的对比分析; 2、作为判断事物的标准和制定生产定额的依据;
3、利用平均指标进行推算和预测,深入统计研究分析 。
二、数值平均数与位置平均数
(一)、数值平均数
1、算术平均数 (1)、算术平均数的基本形式 定义:总体各单位的标志总量与其相对应的 单位总数之比,是集中趋势最重要的一种测度值。 算术平均数=总体标志总量/总体单位总量
(2)、是非标志的平均数
是非标志:将总体全部单位划分为具有某种特征和 不具有某种特征两组的分组标志。
如:产品质量分“合格”与“不合格”;性别分 “男”和“女”等
其标志表现只有“是”与“非”两种结果,将其数 量化,通常以“1”代表“是”,以“0”代表“非”。 设全部总体单位数为N,“是”的单位数为“N1”, “非”的单位数为“N0”。则N=N1+N0。
440 1300 900 2640
xf 2640 X 66 (件) f 40
以组中值作为各组标志值的代表值,是假定各组 变量值在组内分布是均匀的,组中值等于组平均数,而 实际上不一定如此。因此,用组中值计算的算术平均数 是一个近似值,但此平均数对总体仍然具有足够的代表 性,实际工作中广泛运用。
一、平均指标的含义、特点和作用
(一)、平均指标的含义

中级经济师考试辅导经济基础知识24

中级经济师考试辅导经济基础知识24

第四部分统计——第二十四章描述统计考情分析:年份单选题多选题合计2016年2题2分2题4分6分2015年4题4分2题4分8分本章重点:1.集中趋势的测度指标:均值、中位数和众数。

2.离散程度的测度指标:方差、标准差和离散系数。

3.分布形态的测度:偏态系数、标准分数。

4.变量相关关系的分类、散点图、相关系数。

知识点一:集中趋势的测度1.均值。

均值也叫做平均数,就是数据组中所有数值的总和除以该组数值的个数。

设一组数据为X1,X2,…,X n,平均数`X的计算公式为:【注意1】:均值主要适用于数值型数据,但不适用于分类和顺序数据。

【注意2】:均值容易受到极端值的影响,极端值会使得均值向极大值或极小值方向倾斜,使得均值对数据组的代表性减弱。

2.中位数。

把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫做中位数,用M e表示:【注意1】:中位数是一个位置代表值,主要用于顺序数据和数值型数据,但不适用于分类数据。

【注意2】:中位数的优点是不受极端值的影响,抗干扰性强。

3.众数:指一组数据中出现次数(频数)最多的变量值。

适用于描述分类数据和顺序数据,不适用于定量数据。

【注意】:有些情况下可能出现双众数、多众数或者没有众数,难以描述数据的集中趋势。

总结:均值VS中位数VS众数:指标适用特点均值定量变量利用全部信息,受极端值影响如有明显极端值,则代表性差中位数顺序变量和定量变量没有充分利用全部信息,不受极端值影响适用于分布不对称的数据众数分类变量和顺序变量没有充分利用全部信息,不受极端值影响适用于分布明显呈偏态的数据【例题·单选题】在对数据集中趋势的测度中,适用于偏斜分布的数值型数据的是()。

A.中位数B.均值C.标准差D.方差『正确答案』A『答案解析』本题考查中位数。

中位数主要适用于顺序数据,也适用于数值型数据,但不适用于分类数据,中位数不受极端值的影响,抗干扰性强,尤其适用于收入这类偏斜分布的数值型数据。

1统计学-数据的描述性分析

1统计学-数据的描述性分析

③ 对某些不具有数学特点或不能用数字测定的 现象,可用中位数求其一般水平。
负偏 注: (1)中位数总是介于众数和平均数之间.
正偏
(2) 皮尔逊经验法则 分布在轻微偏斜的情况下,众数、中位数和算术平均 数数量关系的经验公式为:
x M o 3( x M e )
根据卡尔· 皮尔逊经验公式,还可以推算出:

(1).各变量值与均值的离差之和等于零.
x
n i =1
n i
i
x =0

(2).各变量值与均值的离差平方和最小.
x
i =1
x = min

2
△ 算术平均数的特点
算术平均数适合用代数方法运算,因此运用 比较广泛; 易受极端变量值的影响,使 X 的代表性变小; 受极大值的影响大于受极小值的影响; 当组距数列为开口组时,由于组中值不易确 定,使 X 的代表性也不很可靠;同时要求各单位 标志值在组内是均匀分布的,此时各组的平均数正好 等于它的组中值。故用组中值计算得出来的平均数只 能是一个近似值。
总体均值常用X 或 表示,样本均值常用 x 表示,样本均值 的计算公式: 简单算术平均数:
x1 x2 xn x n n
x
x
i 1
n
i
加权算术平均数:
x
i 1 n
n
i
fi
i
f
权数的意义和作用
• 权数:各组次数(频数)的大小所对应的标志值对平均数 的影响具有权衡轻重的作用. • 当各组的次数都相同时,即当 f1 =f 2 =f3 = =f n 时: 加权算术平均数就等于简单算术平均数.
2.中位数(Median)
中位数是一组数据按一定顺序排列后,处于中间位置 上的变量
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表4.6
1.5 1.0 1.8 合计
某餐馆蔬菜采购情况
采购金额(元) 200 400 150 750
200 400 150 750 1.15(元/千克) 200 400 150 650 1.5 1.0 1.8
蔬菜价格(元/千克)
解:
蔬菜的平均采购价格
互动地带
4-13
第一节
xw w x w w

xw w x x w w
4-10
例4.5 某公司15个销售网点销售年度计划完成 情况分布如表4.5所示,试求公司平均销售计划完 成程度。
表4.5
计划完成程度(%) 95-100 100-110 110-120 合计
某公司年度销售计划分布表
4-15
第一节
f
数据集中趋势的测度
f f
x
1. 唯一众数 2. 复众数
x
3. 无众数
x
图4.1 确定众数的三种情况
在组距数列中,由于原始数据的信息丢失较多,由组距数列计算众 数的取值与实际值的差距可能是很大的。
4-16
第一节
数据集中趋势的测度
一 、中位数(median)
也叫中数或中值,是变量值的排序中位置居中的数 值。 中位数把全部数列分成了两部分,每一部分都包含了 50%的数据,其中一部分比中位数小,另一部分比中位 数大。 例如,在处理快艇的5次实验数据中,得到最大速度 值(单位:m/s)的排序结果为:27 30 31 33 35 。显然,31位于这5个数据排位的中间,它就是快艇 最大时速的中位数。 测度中位数的前提条件是数据必须能够排序大小 。因此, 定类数据不能计算中位数。 对一个特定的数列,中位数是必然存在的唯一确定值。
组中值 (%) 95 105 115 — 网点数 (个) 5 8 2 10 计划销售额 (万元) 1000 8000 1000 145
解:计划完成程度乘以计划销售额等于实际销售额,并 能汇总求和,得到公司实际销售总额。因此,计划销售额指 标应当是我们所要确定的权数w,代入公式计算如下:
xw 95% 1000 105% 8000 115% 1000 10500 105(%) 1000 8000 1000 10000 w
表4.8 某市50户居民消费品支出情况累计分布表
频数(户) 5 1 8 10 12 7 4 3 50 以下累计频数(户) 5 6 14 24 36 43 47 50 — 按户消费品支出分组(元) 1600~1800 1800~2000 2000~2200 2200~2400 2400~2600 2600~2800 2800~3000 3000以上 合计
总体或样本某一标志总 量 算术平均值 总体或样本容量
4-2
第一节
数据集中趋势的测度
x
i 1 N
由原始数据计算算术平均值:简单算术平均法
x1 x 2 x3 x N N
i

N
i x1 x 2 x3 x n x i 1 n n 表示总体均值;表示样本算术平均值;总体 x 式中,
31 34 29 32 35 38 34 30 29 32 31 26 381 31.75(分钟 ) 12 12
互动地带
4-4
第一节
数据集中趋势的测度
x
i 1
由单值式变量数列计算算术平均值:加权算术 平均法 K
x1 f 1 x 2 f 2 x K f K f1 f 2 f K
第四章 数据分布特征的测度
学习目的: 熟悉数据集中趋势测度的主要指标的含义和应 用条件,熟练掌握算术平均值的计算方法; 熟悉数据离散程度主要测度指标的含义,熟练 掌握标准差和变异系数的计算和应用; 了解数据的偏态和峰度的含义及其测度方法。
4-1
第一节
数据集中趋势的测度
数据的集中趋势(central tendency) 是指某一总体或样本的数据向某一中心值集 中或靠拢的趋势。 一 、算术平均值(arithmetical mean) 也叫算术平均数,简称平均数、均值或均数 (mean),是指总体或样本中平均每一个体的 某一标志数值,因而表现为总体或样本的某一 标志总量与总体或样本的容量的比值,它的基 本计算公式如下:
平均零件加工合格率 4 95% 97% 96% 98%
4-14
96.5%互动地带
第一节
数据集中趋势的测度
一 、众数(mode) 也叫众值,是在数据集中出现频数最多或频率 最大的数据值。 众数的测度适用于任何种类(分类数据、数值数据) 的数据。 众数的大小不受极端值大小的影响。 对于原始数据,用定义求众数 : 1.编制单值式变量数列 2.频数最大的组的变量值即众数 对于一个数据集,众数的测算结果会出现三种情 况:唯一一个众数;多个众数;无众数。
4-11
第一节

数据集中趋势的测度
调和平均:算术平均的另一种形式 当已知各组总量指标C(=xf,或=xw)和变量x时, 可用调和平均法计算分组数据的均值:
xw c w c

x
xw c w c x
x
4-12
例4.6 某餐馆采购员,一天内在三个集市采购的同 一种蔬菜的数据如表 4.6 所示,求该采购员当天采 购的这种蔬菜的平均价格。
x
n
容量为N;样本容量为 n。
4-3
第一节
数据集中趋势的测度
例4.1 某工厂加工某种零件的12名工人完成工作所需的时 间(计量单位:分钟)为 31 34 29 32 35 38 34 30 29 32 31 26 试计算这组数据平均数。 解:这是一组由12名工人所组成的总体数据,它的平均 数计算如下:
计算午餐的近似平均账单金额如下:
4-9
解:首先,计算各组的组中值,见表中内容。然后,
x
m
i 1
k
i
fi
n

2080 104(元) 20
第一节
数据集中趋势的测度
权数含义的推广 在组距数列中只要一个指标与变量值的乘积等 于组的总量指标,而且各组的总量指标能够加总求 和,那么这个指标就可以作为权数计算分组数据的 算术平均值。因此,用广义权数计算均值的公式为:
2710、2755、2850 2880、2880、2890 2920、2940、2950 3050、3130、3325
最小值
箱形图(box plot) 是用图示形式表达五数概括法的图形 。绘制方法是,首先找出最 小值、下四分位数、中位数、上四分位数和最大值5个数值在坐标上 的位置,然后连接相邻的两个四分位数画出两个箱子,再将两个极 端值与两个箱子连接。
起重吨位分组的数据如表4.1所示。求这10台起重 机械的平均吨位。
表4.1
起重机吨位(吨) x 40 25 10 5 合计
某货场起重机械分布表
频数(台) f 1 2 4 3 10 起重总量(吨) xf 40 50 40 15 145
解:这10台起重机械的平均吨位的计算如下:
40 1 25 2 10 4 5 3 145 14.5(吨) 1 2 4 3 10
i
3. 确定或计算各分位数的值。如果 i 不是整数,则向上取整,用比 i 大的下一个整数代表第 p 个分位数;如果 i 是整数,则第 p 个分位 数是 i 第项和第 (i 1) 项数值的算术平均值。
4-20
k
n
p 1,2,3,, k 1
第一节
五数概括法
数据集中趋势的测度
利用3个四分位数再加上最大值和最小值2个总共5个数值就能够 简单地概括出一组数据分布的特征,用于分析数据的方法 。 例4.10 某行业业务经理每月起薪的抽样调查资料的排序如下:(单位: 元)2710、2755、2850、2880、2880、2890、2920、2940、 2950、3050、3130、3325 。 解:首先把数据按照由小到大进行排序,再确定最小值、下四分位数、 中位数、上四分位数和最大值,如下所示:
1 (xn xn ) 1 2 2 2
f
2
ቤተ መጻሕፍቲ ባይዱ
位次上的变量值所在的组 )。
f
4-18
Me L
2
CF f
d
例4.8 某月对某市50户居民抽样调查得到的消费品支出资料如表 4.8所示。试计算这50户被调查居民家庭消费品支出额的中位数。 解:计算以下累计频率,中位数的位次为 50/2 = 25。2400~2600 组为中位数组。L=2400元,d =2600元-2400元=200元, f =12户,累 计至中位数组下限的频数CF=24户 。代入公式计算中位数为:
推论:对于定序数据,经排序后用1、2、3…或 0、1、2…等定义数据值,可计算定序数据的均值. 互动地带 4-7
x= p
第一节
数据集中趋势的测度
由组距数列计算算术平均值 :加权算术平均法 K K mi f i mi f i K f i 1 i 1 K mi i N N i 1 f i i 1 或 m f m f f x m n n f x i 是第 i 组的组中值; f i 是 i 组的频数,称为权 式中, k 数;是样本的分组数; K是总体的分组数 。 由组距数列计算的算术平均值是一个近似值。
k k i 1 k i i i 1 i i k i i 1 i i 1 i
4-8
例4.3 某餐馆午餐账单金额的频数分布见表 4.3所示,试计算该餐馆午餐的平均账单金额。
表4.3 账单金额 (元) 70以下 70-90 90-110 110-130 130-150 150以上 合计 某餐馆午餐账单金额的频数分布 组中值m (元) 60 80 100 120 140 160 — 频数 f (笔) 2 6 4 4 2 2 20 收入 m f (元) 120 480 400 480 280 320 2080
相关文档
最新文档