24章 数据特征的测度
数据分布特征的测度—使用Excel方法

某中学初二(一)班数据分布特征的测度使用excel 方法数据特征的测度众数 中位数 四分位数平均数亠、集中趋势1、众数(mode )— 一组数据中出现次数最多的变 量值.分类数据众数偏态 峰态异众比率 极差 方差 离散系数制作:用frequency 函数求出语文成绩的频数一求 出各个分数段的比例一各个分数段的百分比.原始数据:原始数据一众数・xls2、中位数(median )-排序后处于中间位置上的值解:这里的变量为“成绩 分数段”,这是个分类变 量,不同的分数段就是变 量值。
所调查的初二一班 60人 中,60-69这个分数段的人 数最多,为23人,占全班 人数的38.33%,因此众数 为“ 60-69这一分数段”。
即:M=60-69这一分数段制作:对语文成绩进行降序排列一根据计算公式求得中位数/插入median函数求得中位数要求得这60名学生语文成绩的中位数有2种方法:方法一:1、首先对学生的语文成绩进行降序排列。
2、由于学生人数为偶数,所以位置计算公式二错误!位置=错误!—错误!= 30。
5语文成绩中位数=错误!= 68方法二:插入median函数一求得语文成绩中位数。
原始数据-中位数:原始数据一中位数。
XlS3、四分位数(quartile)—排序后处于25%和75%位置上的值.要求得这60名学生语文成绩的中位数有2种方法: 方法一:1、首先对学生的语文成绩进行升序排列。
2、由于学生人数为偶数,所以位置计算公式为:Q 位置二错误!=错误!= 15.25Q位置二错误!=错误!= 45。
75Q= 61+0.75 X( 62-61 ) =61。
75Q= 78+0。
25 X( 78—78) =78方法二:使用函数QUARTILE求出语文成绩的四分位数xls 原始数据一四分位数:原始数据-四分位数。
4、平均数(mean)加权平均数一初二(一)班语文总评成绩总评成绩=错误!原始数据一平均数:原始数据一平均数。
中级经济师经济基础习题讲解 (24)

第二十四章描述统计【单项选择】将数值减去均值所得的差除以标准差,所得的统计量为()。
A.相关系数B.标准分数C.方差D.偏态系数『正确答案』B『答案解析』本题考查分布形态的测度。
标准分数可以给出数值距离均值的相对位置,用于比较不同分布的变量值。
标准分数=(数值-均值)÷标准差。
均值是70,方差是16,数据是78,该数据的标准分数是()。
A.2B.0.5C.1D.5『正确答案』A『答案解析』本题考查标准分数的计算。
标准分数是用数值减去均值所得的差除以标准差。
所以标准分数=(78-70)/4=2。
下列统计量中,适用于分析两个定量变量间相互关系的是()。
A.离散系数B.标准分数C.相关系数D.偏态系数『正确答案』C『答案解析』本题考查相关系数。
相关系数是度量两个变量间相关关系的统计量。
根据下面的变量X和变量Y的散点图,可以看出这两个变量的Pearson相关系数r的取值范围是()。
A.r≤-1B.0≤r<1C.r≥1D.-1≤r<0『正确答案』D『答案解析』本题考查散点图与相关关系。
若-1≤r<0,表明变量X和Y之间存在负线性相关关系。
根据2015年某城市金融业和制造业各2000人的年薪样本数据来比较这两个行业从业人员年薪的离散程度,应采用的统计量是()。
A.标准分数B.相关系数C.变异系数D.偏态系数『正确答案』C『答案解析』本题考查离散系数。
离散系数也称为变异系数或标准差系数,即标准差与均值的比值,主要用于不同类别数据离散程度的比较。
下列统计量中,适用于描述分类数据集中趋势的是()。
A.均值B.众数C.中位数D.变异系数『正确答案』B『答案解析』本题考查集中趋势的测度。
众数适于描述分类数据和顺序数据的集中趋势,不适用于定量数据。
根据经验法则,服从对称钟形分布的标准分数在[-3,3]范围内的概率是()。
A.95%B.50%C.68%D.99%『正确答案』D『答案解析』本题考查标准分数。
对于服从对称的钟形分布的标准分数,68%的标准分数在[-1,+1]范围内,约有95%的标准分数在[-2,+2]范围之内,约有99%的标准分数在[-3,+3]范围之内。
中级经济师 (经济基础)第二十四章

中级经济师第二十四章描述统计中级经济师、经济师、经济基础、中级职称、经济师课件、经济师真题知识点1:集中趋势的测度【单选题】在某企业中随机抽取7名员工来了解该企业上半年职工请假情况,这7名员工2013年上半年请假天数分别为:1,5,3,10,0,7,2。
这组数据的中位数是()。
A.OB.3C.4D.10{答案·解析]B 中位数是指把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫作中位数。
将题目中的一组数据排序:0 1,2,3 5 7,10。
位置居中的数值为3 。
知识点2:离散程度的测度【单选题】离散系数主要用于不同类别数据离散程度的比较,其计算公式是()之比。
A.标准差与其相应的算数平均数B.标准差与其相应的中位数C.算数平均数与其相应的方差D.标准差与其相应的几何平均数【答案·解析】A 离散系数主要用于不同类别数据离散程度的比较,其计算公式是CV=芒,即标准差与均值比值。
知识点3:分布形态的测度【多选题】某企业员工年收入数据分布的偏态系数为30. 则,该组数据的分布形态为A.右偏B.左偏C.轻度偏斜D.严重偏斜E.中度偏斜【答案·解析】AD 偏态系数取决于离差三次方的平均数与标准差三次方的比值。
如果偏态系数等于0,说明数据的分布是对称的;如果偏态系数为正值,说明分布为右偏的,取值在0和0.5之间说明轻度右偏取值在0.5和1之间说明中度右偏取值大于1说明严重右偏;如果偏态系数为负值,说明分布为左偏取,值在0和一05. 之间说明轻度左偏,取值在一05. 和-1之间说明中度左偏,取值小于一l说明严重左偏。
偏态系数的绝对值越大,说明数据分布的偏斜程度越大。
知识点4:变量间的相关关系【多选题】按相关的程度,两个变量之间的关系可以分为( ) 0A.完全相关B.正相关C.不完全相关D.不相关E.负相关【答案·解析】ACD 按变量间的相关程度可分为完全相关、不完全相关、不相关。
中级经济师-经济基础知识-基础练习题-第二十四章描述统计-一、集中趋势的测度

中级经济师-经济基础知识-基础练习题-第二十四章描述统计-一、集中趋势的测度[单选题]1.某小学六年级8个班的学生人数由少到多依次为34人、34人、34人、34人、36人、36人、37人、37人(江南博哥),其中位数为()。
A.34B.35C.36D.37正确答案:B参考解析:此题考查集中趋势测度值,已排序,居中的是34人36人,则中位数是(34+36)÷2=35人。
[单选题]5.下面一组数据为9个家庭在2017年的人均月收入数据(单位:元):750、780、850、960、1080、1250、1500、1650、2000,则中位数为()元,均值为()元。
A.750,1250B.1080,1202.2C.1500,1080D.2000,1500正确答案:B参考解析:本题考查集中趋势的测度。
先把上述数据按顺序排列,由于有9个数据,是奇数,中位数的位置为(9+1)/2=5,中位数是1080元。
均值=(750+780+850+960+1080+1250+1500+1650+2000)/9=1202.2(元)。
[单选题]6.某直辖市下辖8个县,每个县的面积如下(单位:平方公里):1455、2019、912、1016、1352、1400、1792、2000,则该直辖市下辖县面积的中位数是()。
A.1400B.1455C.1427.5D.1428正确答案:C参考解析:本题考查中位数的具体应用。
把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫作中位数。
Me=(1400+1455)÷2=1427.5[单选题]7.下面是抽样调查的10个学生的考试分数等级,分别为:不及格,中,中,良,良,良,良,优,优,优。
这10个学生分数的众数为()。
A.优B.中C.良D.不及格正确答案:C参考解析:此题考查集中趋势测度值中的众数。
众数是指一组数据中出现次数(频数)最多的变量值,题目中良的出现次数最多,所以应为良。
数据分布特征的测定实验心得

数据分布特征的测定实验心得1、变量集中趋势的测定变量在不同个体或不同时间条件下具体表现出来的数据是不同的,不过众多个体的数据常常会呈现出在⼀定范围内围绕某个中⼼⽽波动的分布特征。
衡量数据集中趋势的指标有两类:⼀类是数值平均数,包括算数平均数、调和平均数、⼏何平均数;另⼀类是位置代表值,根据数据所处位置直接观察或根据与特定位置有关的部分数据来确定的代表值,主要有众数和中位数。
测定集中趋势指标的作⽤主要是:1)反映变量分布的集中趋势和⼀般⽔平;2)可⽤来⽐较同⼀现象在不同空间或不同阶段的发展⽔平;3)可⽤来分析现象之间的依存关系。
1)数值平均数a、算术平均数(arithmeticmean),即均值(mean):将⼀组数据的总和除以这组数据的项数所得的结果。
2)位置平均数a、众数(mode)是⼀组数据中出现频数最多、频率最⾼的变量值。
众数代表的是最常见的、最普遍的状况,是对现象集中趋势的度量。
众数既可度量定量变量(数值型数据)的集中趋势,也可⽤来测度定性变量(⾮数值型数据)的集中趋势。
b、中位数(median)是将数据从⼩到⼤排序后位置居中的数值,奇数取中间,偶数取中间两个数值的平均数。
总结:算术平均数是数值平均数,和中位数⼀样在任何⼀组数据中都存在且是唯⼀的。
算术平均数受数据中极端值的影响,⽽众数和中位数则不受极端值的影响。
算术平均和众数、中位数三者之间的数量关系取决于数据分布的偏斜(⾮对称)程度:对于呈现单峰分布特征的数据,如果分布是对称,则三者相等;如分布是左偏(负偏),数据中的极⼩值会使算术平均数偏向较⼩的⼀⽅,极⼩值⼤⼩不影响中位数,但其所占项数会影响数据的中间位置从⽽略使中位数偏⼩,众数则完全不受极⼩值⼤⼩和位置的影响,所以是众数⼤于中位数⼤于算术平均数;如果分布式右偏(正偏),则反之。
2、变量离散程度的测定数据的集中趋势和离散程度是数据分布最基本的两⼤特征。
集中趋势反映了数据聚集的中⼼所在,数据的离散程度说明数据之间差异程度的⼤⼩。
数据特征的测度

数据特征的测度1.集中趋势的测度众数:⼀组数据中出现次数最多的变量值;它是⼀个位置代表值,特点是不受数据中极端值的影响中位数:是⼀组数据按⼀定顺序排序后,处于中间位置上的数值。
当数值个数为奇数时,取中间位置的数;当数值个数为偶数时,取中间位置两个数的均值。
它将全部数据等分成两部分,也是⼀个位置代表值,其特点是不受极端值的影响,在研究收⼊分配时很有⽤单选(2004年试题):2003年,某市下辖六个县的棉花种植⾯积按规模由⼩到⼤依次为800公顷、900公顷、1100公顷、1400公顷、1500公顷、3000公顷,这六个县棉花种植⾯积的中位数是()公顷。
A,1450B,1250C,1100D,1400答案:B解析:变量值⼀共有6个,偶数个,中位数为最中间两个数的平均数,即第三和第四个数的平均数,为1/2*(1100+1400)= 1250。
算术平均数:也称均值,是全部数据的算术平均。
它是集中趋势的最主要测度值。
简单均值:等于所有数值相加之和 / 数值个数;加权均值:(各组组中值*各组频数) / 频数之和。
均值是⼀组数据的重⼼所在,是数据误差相互抵消后的必然结果,反映出事物必然性的数量特征。
其缺点是容易受极端值的影响⼏何平均数:将⼀组中n个数据连乘后再开n次⽅。
是适⽤于特殊数据的⼀种平均数,主要⽤于计算⽐率或速度的平均。
实践中,主要⽤于计算社会经济现象的平均发展速度2.离散程度的测度标准差:各变量与其均值离差平⽅和的平均数的平⽅根,它是数测量数据离散程度的最主要⽅法,也是实际中应⽤最⼴泛的离散程度测度值。
在对社会经济现象进⾏分析是主要使⽤标准差。
例:⼀组5个数据, 1、2、3、4、5,求其标准差。
解:先求均值等于(1+2+3+4+5)/ 5 =3;再求离差,分别为:(1-3)=-2,(2-3)=-1,(3-3)=0,(4-3)=1,(5-3)=2。
离差平⽅,分别为:4,1,0,1,4。
离差平⽅和等于4+1+0+1+4=10离差平⽅和的平均数:10/5=2,所以⽅差为2把2开平⽅,即得标准差。
中级经济基础知识-数据特征的测度(精选试题)
中级经济基础知识-数据特征的测度1、下列离散程度的测度值中,能够消除变量值水平和计量单位对测度值影响的是()。
A.标准差B.离散系数C.方差D.极差2、中位数()A.不是平均数B.是一种趋势值C.是一种位置平均数D.是一种位置3、什么反映数据远离其中心值的趋势A.集中趋势B.离散程度C.标准差系数D.偏态和峰度4、下面一组数据为9个家庭的人均月收入数据(单位:元):700、780、850、960、1080、1300、1500、1650、1800,中位数为()。
A.700B.960C.1080D.18005、数据的离散程度越小,集中趋势的测度值对该组数据的代表性()。
A.越好B.越差C.不变D.不确定6、某学校学生的平均年龄为15岁,标准差为2岁;该学校老师的平均年龄为30岁,标准差为3岁。
比较该学校年龄的离散程度,则()。
A.教师年龄的离散程度大一些B.学生年龄的离散程度大一些C.学生年龄和教师年龄的离散程度相同D.教师年龄的离散程度是学生年龄离散程度的1.5倍7、下面是抽样调查的9个家庭住房面积(单位:平方米):657585909098105120210,这9个家庭住房面积的众数为()。
A.75B.85C.90D.1508、一组数据向某一中心值靠拢的程度称为()。
A.峰度B.偏态C.离散程度D.集中趋势9、以下属于位置平均数的是()。
A.众数B.极差C.几何平均数D.算术平均数10、下列数据特征的测度值中,受极端值影响的是()。
A.众数B.中位数C.位置平均数D.加权算术平均数11、下列指标中,用于描述数据集中趋势,并且易受极端值影响的是()。
A.极差B.众数C.中位数D.算术平均数12、对分组数据计算加权算术平均数时,其平均数值会受到()等因素的影响。
A.组内极差B.极端值C.组内标准差D.各组数值大小E.各组频数多少13、关于位置平均数,下列说法正确的是()。
A.位置平均数包括众数、中位数等B.位置平均数不是集中趋势的测度指标C.位置平均数包括算术平均数和几何平均数等D.位置平均数是根据全部数据计算出来的平均数E.位置平均数是按数据的大小顺序或出现频数的多少确定的集中趋势的代表值14、离散程度的测度指标主要包括()。
数据特征的测度
第一节 第二节 第三节 第四节
集中趋势指标 离散趋势指标 偏态与峰度 位次指标
第一节 集中趋势指标
描述数据集中趋势或中心位置的量数,统 称为集中趋势指标,主要包括:
(一)平均数
(二)中位 (三)众数
集中趋势指标
平均数
Ƅ 算术平均数 Ƅ 几何平均数
Ƅ 倒数平均数
频数(人)
3 5 8 14 10 6 4 50
该单位50名工人的月平均工资为多少?
表3:某单位50工人的月工资分组表 月工资
110以下 110——115 115——120 120——125 125——130 130——135 135以上 合计
频数(人)
3 5 8 14 10 6 4 50
该单位50名工人的月平均工资为多少?
Ƅ 切尾平均数
集中趋势指标
中位数
将数据按顺序排列 后,处于中间位置 的数据。
众数 指数列中出现次数 最多的数据。
(一)平均数 1、算术平均数
算术平均数:一列数据之和除以数据个数的商。 算术平均数=数据之和/和数个数
x1 x2 xn X n x x n
X
i 1
n
n
xi n
加权均值的影响因素:各组变量值;各组权 数(即频数)。
表1:某单位20工人的月工资分组表
月工资 500 700 800 850 900 950 1200 合计 频数(人) 1 3 4 5 4 2 1 20
该单位20名工人的月平均工资为多少?
表2:某单位50工人的月工资分组表 月工资
100 110 115 120 125 130 150 合计
表4:某市50个家庭住房分组表
2018年中级经济师经济基础-精讲班-24第二十四章-描述统计
第二十四章描述统计【历年分值】8分【知识权重】6分左右一、集中趋势的测度(均值中位数众数)二、离散程度的测度(方差标准差离散系数)三、分布形态的测度(偏态系数标准分数)四、变量间的相关分析变量间的相关关系:完全相关不完全相关不相关散点图:表示变量间的关系相关系数(Pearson相关系数):度量线性相关关系对于数据分布特征的测度主要分为三个方面:一是分布的集中趋势,反映数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据之间的差异程度,也能反映中心值对数据的代表程度; 三是分布的偏态,反映数据分布的不对称性。
一、集中趋势的测度集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。
集中趋势的测度也就是寻找数据水平的代表值或中心值。
1.均值均值也叫作平均数,就是数据组中所有数值的总和除以该组数值的个数。
①均值是集中趋势中最主要的测度值,它是一组数据的重心所在,解释了一组数据的平均水平。
②主要适用于数值型数据,但不适用于分类数据和顺序数据。
③均值易受极端值的影响,极端值会使得均值向极大值或极小值方向倾斜,使得均值对数据组的代表性减弱。
【例题:单选题】在某城市2014年4月空气质量检测结果中,随机抽取6天的质量指数进行分析。
样本数据分别是:30、40、50、60、80和100,这组数据的平均数是()。
A. 50B. 55C. 60D. 70答案:C均值即平均数,均值=(30+40+50+60+80+100)/6=602.中位数把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫做中位数(Me)。
中位数将数据分为两部分,其中一半的数据小于中位数,另一半数据大于中位数。
(1)计算:先对数据进行排序,然后确定中位数的位置,n 为数据的个数,其公式为:①n 为奇数:中位数位置是21 n ,该位置所对应的数值就是中位数数值。
②n 为偶数:中位数位置是介于2n 和(2n +1)之间,中位数就是这两个位置对应的数据的均值。
中级经济师经济基础知识第24章单选题
中级经济师《经济基础知识》第二十四章课后练习【单选题】下列指标中,应采用算术平均方法计算平均数的是()。
A. 企业年销售收入B. 男女性别比C. 国内生产总值环比发展速度D. 人口增长率【答案】A【解析】考核集中趋势的测度。
本题用排除法选择,几何平均数的主要用途:(1)对比率、指数等进行平均(2)计算平均发展速度。
【单选题】集中趋势的测试,主要包括()。
A. 方差和标准差B. 众数和离散系数C. 标准分数D. 中位数和众数【答案】D【解析】集中趋势的测试,主要包括:均值、中位数、众数和均值、中位数和众数的比较及适用范围。
【单选题】()的测度值是对数据一般水平的一个概括性变量,它对一组数据的代表程度,取决于该组数据的()。
A. 集中趋势;离散程度B. 离散程度;集中程度C. 极差;组距D. 方差;算术平均数【答案】A【解析】集中趋势的测度值是对数据一般水平的一个概括性变量,它对一组数据的代表程度,取决于该数据的离散程度。
【单选题】一家连锁酒店8个分店某月的营业额(单位:万元)为:60、60、70、80、80、70、70、65,那么这8个分店月营业额的中位数为()。
A. 60B. 65C. 70D. 80【答案】C【解析】中位数首先要将数据进行排列,从小到大排列的结构时60,60,65,70,70,70,80,80,则中位数第4个数和第5个数的均值,即(70+70)/2=70【单选题】2010年某省8个地市的财政支出(单位:万元)分别为:59000,50002,65602,66450,78000,78000,78000,132100这组数据的中位数是()万元。
A. 78000B. 72225C. 66450D. 75894【答案】B【解析】对数据进行排序后是:50002,59000,65602,66450,78000,78000,78000,132100所以中位数的位置是第4个和第5个数据的平均数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对统计数据特征的测度,主要从三个方面进行:(1)分布的集中趋势;(2)分布的离散程度:(3)分布的偏态和峰度
一、集中趋势的测度
集中趋势的测度,主要包括位置平均数和数值平均数。
位置平均数是指按数据的大小顺序或出现频数的多少确定的集中趋势的代表值,主要有众数、中位数等;
数值平均数是指根据全部数据计算出来的平均数,主要有算术平均数、几何平均数等。
(一)众数
一组数据中出现频数最多的那个数值,用M0表示。
用众数反映集中趋势,不仅适用于品质数据,也适用于数值型数据。
众数是一个位置代表值,不受极端值的影响,抗干扰性强。
(二)中位数
把一组数据按从小到大的顺序进行排列,位置居中的数值叫做中位数,用表示。
根据未分组数据计算中位数时:(1)对数据进行排序;(2)确定中位数的位置,其公式为:中位数位置=;(3)确定中位数的具体数值。
当n为奇数时:
当n为偶数时:
中位数主要用于顺序数据,也适用于数值型数据,但不适用于分类数据。
中位数也是一个位置代表值,不受极端值的影响,抗干扰性强。
【例题·单选题】下面是抽样调查的l0个家庭住房面积(单位:平方米):
55 75 75 75 90 92 98 105 120 150
这10个家庭住房面积的众数为()。
A.91
B.75
C.90
D.150
『正确答案』B
(三)算术平均数
全部数据的算术平均,又称均值,用表示。
算术平均数是集中趋势最主要的测度值。
它主要适用于数值型数据,但不适用于品质数据。
1.简单算术平均数
主要用于处理未分组的原始数据。
【例题·单选题】(2007年)某连锁超市6个分店的职工人数有小到大排序后为57人、58人、58人、60人、63人、70人,其算术平均数、众数分别为()。
A.59、58
B.61、58
C.61、59
D.61、70
『正确答案』B
『答案解析』算术平均数=(57+58+58+60+63+70)/6=61;众数为58。
2.加权算术平均数
主要用于处理经分组整理的数据。
(组中值与频数的乘积之和,除以各组频数之和,即以各组的频数作为权数)
计算时先计算组中值,之后再计算加权算术平均数。
计算和运用算术平均数须注意:(1)算术平均数同时受到两个因素的影响:各组数值的大小;各组分布频数的多少。
(2)算术平均数易受极端的影响。
(四)几何平均数
n个观察值连乘积的n次方根就是几何平均数。
简单的几何平均数的计算公式
熟悉几何平均数的主要用途:(1)对比率、指数等进行平均;(2)计算平均发展速度。
集中趋势的测度总结
【例题1·单选题】一组数据向某一中心值靠拢的倾向称为()。
A.集中趋势
B.离散程度
C.偏态
D.峰度
『正确答案』A
【例题2·单选题】(2004年)以下属于位置平均数的是()。
A.几何平均数
B.算术平均数
C.众数
D.极差
『正确答案』C
【例题3·单选题】一组数据中出现频数最多的那个数值称为()。
A.中位数
B.极值
C.众数
D.平均数
『正确答案』C
【例题4·单选题】(2005、2006年、2007年)下列集中趋势中,适用于品质数据的是()。
A.众数
B.简单算数平均数
C.标准差
D.加权算术平均数
『正确答案』A
【例题5·单选题】(2008年)下列数据特征的测度值中,受极端值影响的是()。
A.中位数
B.众数
C.加权算术平均数
D.位置平均数
『正确答案』C
【例题6·多选题】几何平均数的主要用途是()。
A.确定分组组数
B.确定组距
C.对比率、指数等进行平均
D.计算组中值
E.计算平均发展速度
『正确答案』CE
【例题7·多选题】(2008年)下列统计指标中,可以采用算术平均数方法计算平均数的有()。
A.产品产量
B.可支配收入
C.产品合格率
D.销售额
E.考试分数
二、离散程度的测度
离散程度是指数据之间的差异程度或频数分布的分散程度。
集中趋势的测度值对一组数据的代表程度,取决于该组数据的离散水平。
数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。
离散程度的测度,主要包括极差、方差和标准差、离散系数等。
(一)极差
极差是最简单的变异指标,是总体或分布中最大的标志值与最小的标志值之差,又称全距,用R表示。
极差反映的是变量分布的变异范围或离散幅度,在总体中任何两个单位的标志值之差都不可能超过极差。
极差仅仅取决于两个极端值的水平,不能反映其间的变量分布情况,同时易受极端值的影响。
【例题1·单选题】(2010年)根据下表所列我国1998年至2003年人口数及构成情况,l998年至2003年我国男性人口占年底总人口比重的极差是()。
A.0.38%
B.0.25%
C.51.25%
D.51.63%
『正确答案』A
『答案解析』男性所占比重的最大值为51.63%,最小值为51.25%,极差
=51.63%-51.25%=0.38%。
(二)标准差和方差
标准差:总体所有单位标志值与其平均数离差之平方的平均数的平方根,用表示。
标准差与方差是应用最广泛的统计离散程度的测度方法。
(三)离散系数
极差、标准差和方差等都是反映数据分散程度的绝对值。
为消除变量值水平高低和计量单位不同对离散程度测定值的影响,需要计算离散系数。
离散系数:也称标准差系数,它是一组数据的标准差与其相应的算术平均数之比,是测度数据离散程度的相对指标,用表示,其计算公式要掌握。
离散系数主要是用于比较不同组别数据的离散程度。
离散系数大的说明数据的离散程度也就大,离散系数小的说明数据的离散程度也就小。
【例题1·多选题】总体或分布中最大的标志值与最小的标志值之差称为()。
A.离散系数
B.极差
C.方差
D.全距
E.标准差
『正确答案』BD
【例题2·单选题】(2008年)标准差系数是一组数据的标准差与其相应的()之比。
A.算术平均数
B.极值
C.众数
D.几何平均数
『正确答案』A
【例题3·单选题】(2009年)离散系数比标准差更适用于比较两组数据的离散程度,这是因为离散系数()。
A.不受极端值的影响
B.不受数据差异程度的影响
C.不受变量值水平或计量单位的影响
D.计算更简单
『正确答案』C
集中程度和离散程度的测度
【例题1·单选题】(2009年)下列指标中,用于描述数据集中趋势,并且易受极端值影响的是()。
A.算术平均数
B.中位数
C.众数
D.极差
『正确答案』A
『答案解析』中位数和众数都不受极端值的影响,极差描述数据离散程度
【例题2·单选题】测度数据离散程度的相对指标有()。
A.标准差
B.离散系数
C.方差
D.极差
『正确答案』B
【例题3·多选题】(2009年)适于测度顺序数据的指标有()。
A.离散系数
B.中位数
C.众数
D.均值
E.标准差
『正确答案』BC
『答案解析』众数适用于各类数值,中位数适用顺序数据和数值型数据。