贾俊平《统计学》(第5版)课后习题-第4章 数据的概括性度量【圣才出品】
统计学第五版(贾俊平)课后习题答案 (1)

中位数位置
30 1 2
15.5 , M e
272
2
273
272.5 。
(2) QL 位置
30 4
7.5
, QL
258 2
261
259.5 。
QU 位置
3 30 4
22 .5 , QU
284 291 287.5 。 2
(3) s
n
(xi x)2
i 1
n 1
13002.7 21.17 。 30 1
4.2 172.1
0.024 ;
幼儿组身高的离散系数: vs
2.5 71.3
0.035 ;
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离
散程度相对较大。
4,11(1)应该从平均数和标准差两个方面进行评价。在对各种方法的离散程度进
行比较时,应该采用离散系数。
(2)下表给出了用 Excel 计算一些主要描述统计量。
550
18
9900
600 以上
650
11
7150
合计
—
120
k
x
Mi fi
i 1
51200
426.67 。
n
120
51200
标准差计算过程见下表:
按利润额分组 组中值 M i 企业数 fi (M i x)2 (M i x)2 fi
200~300
250
19
31212.3
593033.5
300~400
2 (25 1)
0.77 。
(5)分析:从众数、中位数和平均数来看,网民年龄在 23~24 岁的人数占多数。 由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右
统计学(第五版)贾俊平-课后思考题和练习题答案(完整版)

统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)第一部分思考题第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
统计学(第五版)贾俊平-课后思考题和练习题答案(完整版)

统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)第一部分思考题第一章思考题1。
1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1。
2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1。
3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据.它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的.实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1。
7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
贾俊平《统计学》考研真题(含复试)与典型习题详解(数据的概括性度量)【圣才出品】

2.统计学期中考试非常简单,为了评估简单程度,教师记录了 9 名学生交上考试试卷
的时间如下(分钟)
33 29
45 60 42 19 52 38 36[东北财经大学
2012 研]
(1)这些数据的极差为( )。
A.3.00
B.-3.00
C.41.00
D.-41.00
【答案】C
【解析】数据按从小到大排序结果如下:
A.0.38
B.0.40
C.0.54
D.2.48
【答案】A
【解析】离散系数也称为变异系数,它是一组数据的标准差与其相应的平均数之比。其
计算公式为: vs
s x
。得到 vs
22.85 0.38 。 12.45
9.已知某工厂生产的某零件的平均厚度是 2 厘米,标准差是 0.25 厘米。如果已知该 厂生产的零件厚度为正态分布,可以判断厚度在 1.5 厘米到 2.5 厘米之间的零件大约占 ( )。[浙江工商大学 2011 研]
圣才电子书 十万种考研考证电子书、题库视频学习平台
5.随机变量 X 的方差为 2,随机变量 Y=2X,那么 y 的方差是( )。[中央财经大学 2011 研]
A.1 B.2 C.4 D.8 【答案】D
【解析】Var(cX ) c2Var(X ) 22 2 8
7.设 X1,X2,…,X n 为随机样本,则哪个统计量能较好地反映样本值的分散程度( )。
[中山大学 2012 研] A.样本平均 B.样本中位数 C.样子书
【答案】C
十万种考研考证电子书、题库视频学习平台
【解析】集中趋势是指 一 组 数 据 向 某 一 中 心 值 靠 拢 的 程 度 ,它 反 映 了 一 组 数 据 中 心
统计学第五版课后答案(贾俊平)之欧阳理创编

第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:StatisticsMissing0Mean9.60Median10.00Mode10Std. Deviation 4.169Percentiles25 6.255010.007512.504.2下:单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄看,中位数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:为分组情况下的概率密度曲线: 分组:1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=62、确定组距:组距=( 最大值 最小值)÷ 组数=(4115)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)4.3 某银行为缩短顾客到银行办理业务等待的时间。
【单位】统计学贾俊平第五版分章习题及答案

【关键字】单位《统计学》分章习题及答案(贾俊平,第五版)主编:杨群目录习题部分第1章导论一、单项选择题1.指出下面的数据哪一个属于分类数据()A.年龄B.工资C.汽车产量D.购买商品的支付方式(现金、信用卡、支票)2.指出下面的数据哪一个属于顺序数据()A.年龄B.工资C.汽车产量D.员工对企业某项制度改革措施的态度(赞成、中立、反对)3.某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的人均收入4.了解居民的消费支出情况,则()A.居民的消费支出情况是总体B.所有居民是总体C.居民的消费支出情况是总体单位D.所有居民是总体单位5.统计学研究的基本特点是()A.从数量上认识总体单位的特征和规律B.从数量上认识总体的特征和规律C.从性质上认识总体单位的特征和规律D.从性质上认识总体的特征和规律6.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。
这里的“月收入”是()A.分类变量B.顺序变量C.数值型变量D.离散变量7.要反映我国工业企业的整体业绩水平,总体单位是()A.我国每一家工业企业B.我国所有工业企业C.我国工业企业总数D.我国工业企业的利润总额8.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。
这里的参数是()A.1000个消费者B.所有在网上购物的消费者C.所有在网上购物的消费者的平均消费额D.1000个消费者的平均消费额9.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2006年城镇家庭的人均收入数据属于()A.分类数据B.顺序数据C.截面数据D.时间序列数据10.一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。
统计学第五版课后答案(贾俊平)

第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:Statistics10Missing 0Mean 9.60Median 10.00Mode 10Std. Deviation 4.169Percentiles 25 6.2550 10.0075单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652(4)计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=62、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。
统计学第五版课后答案(贾俊平)之欧阳歌谷创编

第四章统计数据的概括性度量欧阳歌谷(2021.02.01)4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:Statistics10Missing 0Mean 9.60Median 10.00Mode 10Std. Deviation 4.169Percentiles 25 6.2550 10.00754.2 随机抽取单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄从频数看出,众数Mo 有两个:19、23;从累计频数看,中位数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:为分组情况下的概率密度曲线: 分组:1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=62、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:4.3 某银行为缩短顾客到银行办理业务等待的时间。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第4章 数据的概括性度量
一、思考题
1.一组数据的分布特征可以从哪几个方面进行测度?
答:数据分布的特征可以从三个方面进行测度和描述:
(1)分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;
(2)分布的离散程度,反映各数据远离其中心值的趋势;
(3)分布的形状,反映数据分布的偏态和峰态。
2.怎样理解平均数在统计学中的地位?
答:平均数也称为均值,它是一组数据相加后除以数据的个数得到的结果。
平均数在统计学中具有重要的地位,是集中趋势的最主要测度值,它主要适用于数值型数据,而不适用于分类数据和顺序数据。
3.简述四分位数的计算方法。
答:首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数值就是四分位数。
四分位数的位置确定方法如下:设下四分位数为L Q ,上四分位数为U Q ,根据四分位数的定义有:
14
L n Q +=位置()
314
U n Q +=位置如果位置是整数,四分位数就是该位置对应的值;如果是在0.5的位置上,则取该位
置两侧值的平均数;如果是在0.25或0.75的位置上,则四分位数等于该位置的下侧值加上按比例分摊位置两侧数值的差值。
4.对于比率数据的平均为什么采用几何平均?
答:几何平均数是指n 个变量值乘积的n
次方根,称为几何平均数。
其计算公式为:
G ==比率数据属于相对数,它不能如绝对数那样对其进行累加,而只能对其进行连乘,比如工厂年产量去年比前年的年增长率为10%,今年比去年的增长率为20%,那么今年对前年的相对增长率为(1+10%)×(1+20%)—1。
而不能用(1+10%)+(1+20%)—1来计算,这样累加的结果是没有实际意义的,因此对于比率数据,在对其计算平均数的时候,就不能像计算一般的平均数那样计算,而要用几何平均数的计算公式计算。
实际上,几何平均数也可以看做是均值的一种变形。
只要对其计算公式两边取对数,则其公式的形式变为算术平均数的公式形式。
5.简述众数、中位数和平均数的特点和应用场合。
答:(1)众数的特点如下:①其优点是不受极端值的影响;②其缺点是具有不惟一性。
一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。
众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。
众数主要适合作为分类数据的集中趋势测度值。
(2)中位数是一组数据中间位置上的代表值,不受数据极端值的影响。
当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择。
中位数主要适合作为顺序数据的集中趋势测度值。
(3)平均数是对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。
当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等,这时则应选择平均数作为集中趋势的代表值。
平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。
因此当数据为偏态分布,特别是当偏斜程度较大时,可以考虑选择中位数或众数,这时它们的代表性要比平均数好。
6.简述异众比率、四分位差、方差或标准差的应用场合。
答:(1)异众比率主要用于衡量众数对一组数据的代表程度。
异众比率越大,说明非众数组的频数占总频数的比重越大,众数的代表性就越差;异众比率越小,说明非众数组的频数占总频数的比重越小,众数的代表性越好。
异众比率主要适合测度分类数据的离散程度,当然,对于顺序数据以及数值型数据也可以计算异众比率。
(2)四分位差主要用于测度顺序数据的离散程度。
对于数值型数据也可以计算四分位差,但不适合分类数据。
(3)方差或标准差能较好地反映出数据的离散程度,是实际中应用最广泛的离散程度测度值。
方差开方后即得到标准差。
与方差不同的是,标准差是具有量纲的,它与变量值的计量单位相同,其实际意义要比方差清楚。
因此,在对实际问题进行分析时更多地使用标准差。
7.标准分数有哪些用途?
答:变量值与其平均数的离差除以标准差后的值称为标准分数。
也称标准化值或z分
数。
设标准分数为z 。
则有
i i x x
z s -=标准分数给出了一组数据中各数值的相对位置。
在对多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。
标准分数具有平均数为0、标准差为1的特性。
实际上,z 分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数据分布的形状,而只是将该组数据变为平均数为0,标准差为1。
8.为什么要计算离散系数?
答:方差和标准差是反映数据分散程度的绝对值,其数值的大小一方面受原变量值本身水平高低的影响,也就是与变量的平均数大小有关,变量值绝对水平高的,离散程度的测度值自然也就大,绝对水平小的离散程度的测度值自然也就小;另一方面,它们与原变量值的计量单位相同。
采用不同计量单位计量的变量值,其离散程度的测度值也就不同。
因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的。
为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。
9.测度数据分布形状的统计量有哪些?
答:测度数据分布形状的统计量有以下两种:
(1)偏态,如果一组数据的分布是对称的,则偏态系数等于0;如果偏态系数明显不等于0,表明分布是非对称的。
若偏态系数大于1或小于-1,被称为高度偏态分布;若偏
态系数在0.5~1或-1~-0.5之间,被认为是中等偏态分布;偏态系数越接近0,偏斜程度就越低。
(2)峰态,通常是与标准正态分布相比较而言的。
如果一组数据服从标准正态分布,则峰态系数的值等于0;若峰态系数的值明显不等于0,则表明分布比正态分布更平或更尖,通常称为平峰分布或尖峰分布。
二、练习题
1.一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:
2 4 7 10 10 10 12 12 14 15
要求:
(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:(1)10名销售人员5月份销售的汽车数量中,销售10台汽车的人数最多,为3人,因此众数M 0=10。
中位数位置=
1101 5.522n ++==,所以1010102e M +==(台)。
平均数12415969.61010
n i
i x x n =+++====∑L (台)(2)由题中数据可得:
10 2.544
L n Q ===位置即L Q 在第2个数值(4)和第3个数值(7)之间0.5的位置上。
因此
47 5.52
L Q +==(台)由于33107.544
U n Q ⨯===位置,即U Q 在第7个数值(12)和第8个数值(12)之间0.5的位置上,因此
1212122U Q +=
=(台)(3)由平均数9.6x =
可得:
4.2s =
=
==
(4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。
2.随机抽取25个网络用户,得到他们的年龄数据如表4-1所示。
表4-1 网络用户的年龄数据
单位:周
岁
19
1529252423
213822183020191916。