统计学高教第三版课后习题答案
统计学(第三版课后习题答案

Hah 和网速是无形的1:各章练习题答案2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.02.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
2.5 (1)属于数值型数据。
(2)分组结果如下:分组 天数(天)-25~-20 6 -20~-15 8 -15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计60(3)直方图(略)。
2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
(2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散,且平均成绩较A 班低。
2.82.9 L U 。
(2)17.21 s (万元)。
2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
统计学第三版答案

第1章统计和统计数据第2章 1.1 指出下面的变量类型。
(1)年龄。
(2)性别。
(3)汽车产量。
(4)员工对企业某项改革措施的态度(赞成、中立、反对)。
(5)购买商品时的支付方式(现金、信用卡、支票)。
详细答案:(1)数值变量。
(2)分类变量。
(3)数值变量。
(4)顺序变量。
(5)分类变量。
1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。
(1)这一研究的总体是什么?样本是什么?样本量是多少?(2)“月收入”是分类变量、顺序变量还是数值变量?(3)“消费支付方式”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。
(2)数值变量。
(3)分类变量。
1.3 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有的网上购物者”。
(2)分类变量。
1.4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?详细答案:(1)分层抽样。
(2)100。
第2章用图表展示数据(3)帕累托图如下:(4)饼图如下:2.2 为确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进行测试,所得数据如下:710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100(2)直方图如下:从直方图可以看出,灯泡使用寿命的分布基本上是对称的。
(3)茎叶图如下茎叶数据个数65 1 8 266 1 4 5 6 8 567 1 3 4 6 7 9 668 1 1 2 3 3 3 4 5 5 5 8 8 9 9 14 690 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 26(2 )雷达图如下:从雷达图可以看出,甲班成绩为优良的人数高于乙班,说明甲班的考试成绩好于乙班。
统计学高教课后习题标准答案

统计学高教课后习题标准答案————————————————————————————————作者:————————————————————————————————日期:第一章1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
3.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品(2)变量:口味(如可用10分制表示)(3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。
(4)从匹配样本的观察值中推断两品牌口味的相对好坏。
第二章、统计数据的描述思考题1描述次数分配表的编制过程答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。
统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。
2.解释洛伦兹曲线及其用途答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。
统计学(第三版课后习题答案

18.29(元);原因:尽管两个企业的单位成本相同,但单位
成本较低的产品在乙企业的产量中所占比重较大,因此拉低了
总平均成本。
2.11 =426.67(万元);(万元)。
2.12 (1)(2)两位调查人员所得到的平均身高和标准差应该差不
多相同,因为均值和标准差的大小基本上不受样本大小的影
响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因
错误。
6.5 (1)检验统计量,在大样本情形下近似服从标准正态分布;
Hah 和网速是无形的
1:各章练习题答案
2.1 (1) 属于顺序数据。
(2)频数分布表如下:
服务质量等级评价的频数分布
服务质 家庭数 频率%
量等级 (频率)
A
14
14
B
21
21
C
32
32
D
18
18
E
15
15
合计 100
100
(3)条形图(略)
2.2 (1)频数分布表如下:
40个企业按产品销售收入分组表
幼儿组身高的离散系数:;
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿
组身高的离散程度相对较大。
2.15 下表给出了一些主要描述统计量,请读者自己分析。
方法
方法
方法
A
B
C
平均 165.6 平均 128.73 平均 125.53
中位
中位
中位
数 165 数 129 数 126
众数 164 众数 128 众数 126
为样本越大,变化的范围就可能越大。
2.13 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于
统计学第三版答案

第1章统计和统计数据第2章1。
1 指出下面的变量类型。
(1) 年龄。
(2)性别。
(3)汽车产量。
(4) 员工对企业某项改革措施的态度(赞成、中立、反对)。
(5) 购买商品时的支付方式(现金、信用卡、支票).详细答案:(1)数值变量。
(2)分类变量。
(3)数值变量.(4)顺序变量。
(5)分类变量。
1。
2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡.(1)这一研究的总体是什么?样本是什么?样本量是多少?(2)“月收入”是分类变量、顺序变量还是数值变量?(3) “消费支付方式”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。
(2)数值变量。
(3)分类变量。
1。
3 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?(2) “消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有的网上购物者"。
(2)分类变量。
1。
4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?详细答案:(1)分层抽样。
(2)100。
第2章用图表展示数据(3)帕累托图如下:(4)饼图如下:2.2 为确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进行测试,所得数据如下:710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100(2)直方图如下:从直方图可以看出,灯泡使用寿命的分布基本上是对称的. (3)茎叶图如下茎叶数据个数65 1 8 266 1 4 5 6 8 567 1 3 4 6 7 9 668 1 1 2 3 3 3 4 5 5 5 8 8 9 9 14 690 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 26(2 )雷达图如下:从雷达图可以看出,甲班成绩为优良的人数高于乙班,说明甲班的考试成绩好于乙班。
《统计学》第三版习题答案

《统计学》第4章习题参考答案与答疑答案与答疑加入时间:2008-10-21 17:53:07点击:10494.1 (1)M o=10(台);Me=10(台);Mean=9.6(台)(2)Q L=5.5 ;Q U=12(3)s=4.2(台)(4)左偏分布4.2 (1)M o=19(岁);M o=23(岁);Me=23(岁)(2)Q L=19; Q U=26.5(3)Mean=24(岁);s=6.65(岁)(4)SK=1.08;KU=0.77(5)样本数据的均值为24岁,但标准差较大,说明网民年龄之间差异较大.从偏态和峰度系数来看,网民年龄呈现右偏尖峰分布.4.3 (1)略;(2)Mean=7(分钟); s=0.714(分钟)(3)由于均值不同,采用V进行比较:V1=0.274,V2=0.102(4)选择第二种(Mean小,V2<V1)分类变量4.4 (1)Mean=274.1(万元);(2)略;(3)s=21.174.5 Mean甲=19.41(元);Mean乙=18.29(元);由于单位成本较低的产品在乙企业中占的比重比较大,拉低了总平均成本.4.6 Mean=426.67(万元);s=116.48(万元);SK=0.203;KU=-0.6884.7(1)MEAN大体相同;(2)S大体相同;(3)较大样本的研究人员机会更多.4.8(1)Vmale=0.08;Vfemale=0.1(2)Mean male=132(磅);s male=11(磅);Mean female=110(磅);s female=11(磅);(3)68%.(4)95%4.9 Z A=1 Z B=0.5,A项更理想一些.(思路:标准分数)4.10 周一和周六(思路:标准分数)4.11 (1)离散系数,由于数据水平高低不同;(2)V adult=0.024 ;V child=0.0354.12 略4.13 略《统计学》第5章习题参考答案与答疑答案与答疑加入时间:2008-10-30 9:15:45点击:7765.1 (1)Ω=[0,100](2)Ω=N(3)Ω=﹛10,11,12,13,14,....﹜5.2 P(A∩B)=0.305.3 P(B)=2/95.4 7/125.5 (1)P(AB)=0.56;(2)P(A∪B)=0.94;(3)P=0.385.6 P=0.725.7 P=2/35.8 P初中=5/11 ;P高中=28/555.9 P A=0.25 ;P B=0.115.10 P(x=0)=1/4;P(x=1)=1/2;P(x=2)=1/45.11(1)P(x=100)=0.001;P(x=10)=0.01;P(x=1)=0.2;P(x=0)=0.789;(2)E(X)=0.45.12 (1)θ=2;(2)E(X)=3/2;(3)D(X)=3/205.13 1/645.14 2/3e5.15 k=λ-1 或k=λ5.16 (1)0.7;(2)1/25.17 ≤3985.18 (1)0.93 (2)0.39。
统计学第三版答案

第1章统计和统计数据第2章 1.1 指出下面的变量类型。
(1)年龄。
(2) 性别。
(3)汽车产量。
(4)员工对企业某项改革措施的态度(赞成、中立、反对).(5) 购买商品时的支付方式(现金、信用卡、支票)。
详细答案:(1)数值变量.(2)分类变量。
(3)数值变量.(4)顺序变量。
(5)分类变量.1。
2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡.(1)这一研究的总体是什么?样本是什么?样本量是多少?(2)“月收入"是分类变量、顺序变量还是数值变量?(3)“消费支付方式"是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有IT从业者",样本是“所抽取的1000名IT从业者”,样本量是1000。
(2)数值变量。
(3)分类变量.1。
3 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”.(1)这一研究的总体是什么?(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有的网上购物者"。
(2)分类变量。
1。
4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?详细答案:(1)分层抽样.(2)100。
第2章用图表展示数据第3章用统计量描述数据3.1 随机抽取25个网络用户,得到他们的年龄数据如下(单位:周岁):计算网民年龄的描述统计量,并对网民年龄的分布特征进行综合分析。
详细答案:网民年龄的描述统计量如下:从集中度来看,网民平均年龄为24岁,中位数为23岁.从离散度来看,标准差在为6。
65岁,极差达到26岁,说明离散程度较大。
从分布的形状上看,年龄呈现右偏,而且偏斜程度较大.3.2 某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验.一种是所有顾客都进入一个等待队列;另一种是顾客在3个业务窗口处列队3排等待。
统计学第三版答案

第1章统计和统计数据第2章 1.1 指出下面的变量类型。
(1)年龄。
(2)性别。
(3)汽车产量。
(4)员工对企业某项改革措施的态度(赞成、中立、反对)。
(5)购买商品时的支付方式(现金、信用卡、支票)。
详细答案:(1)数值变量。
(2)分类变量。
(3)数值变量。
(4)顺序变量。
(5)分类变量。
1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。
(1)这一研究的总体是什么?样本是什么?样本量是多少?(2)“月收入”是分类变量、顺序变量还是数值变量?(3)“消费支付方式”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。
(2)数值变量。
(3)分类变量。
1.3 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有的网上购物者”。
(2)分类变量。
1.4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?详细答案:(1)分层抽样。
(2)100。
第2章用图表展示数据(3)帕累托图如下:(4)饼图如下:2.2 为确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进行测试,所得数据如下:710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100(2)直方图如下:从直方图可以看出,灯泡使用寿命的分布基本上是对称的。
(3)茎叶图如下茎叶数据个数65 1 8 266 1 4 5 6 8 567 1 3 4 6 7 9 668 1 1 2 3 3 3 4 5 5 5 8 8 9 9 14 690 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 26(2 )雷达图如下:从雷达图可以看出,甲班成绩为优良的人数高于乙班,说明甲班的考试成绩好于乙班。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
vs =
方法 A 平均 中位数 众数 标准偏差 极差 最小值 最大值 165.6 165 164 2.13 8 162 170
方法 B 平均 中位数 众数 标准偏差 极差 最小值 最大值 128.73 129 128 1.75 7 125 132
方法 C 平均 中位数 众数 标准偏差 极差 最小值 最大值 125.53 126 126 2.77 12 116 128
k
∑(x −万元)
s=
i =1
k
∑f
i =1
i
−1
13(1)离散系数,因为它消除了不同组数据水平高低的影响。
4 .2 = 0.024 172.1 (2)成年组身高的离散系数: ; 2 .3 vs = = 0.032 71.3 幼儿组身高的离散系数: ; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高 的离散程度相对较大。 14 .表给出了一些主要描述统计量
( )
( )
( )
(z ) 答:以估计总体均值时样本容量的确定公式为例: n = α / 2
2
σ2
E2
样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比。 练习题: 2. 解:由题意:样本容量为 n = 49 (1) 若 σ = 15, σ x =
σ 15 = = 2.143 n 49 σ = 1.96* 2.143 = 4.20028 n
σ2 , n
σ2 ⎛ N −n⎞ ⎟ n ⎜ ⎝ N −1 ⎠
因此不重复抽样下的标准差小于重复抽样下的标准差,两者相差一个调整系数 3.解释中心极限定理的含义 答:在抽样推断中,中心极限定理指出,不论总体服从何种分布,只要其数学期 望和方差存在,对总体进行重复抽样时,当样本容量充分大,样本均值趋近于正 态分布。中心极限定理为均值的抽样推断奠定了理论基础。
23 98877766555554443332100 7 00113449 8 7 6655200 8 123345 6 6 632220 9 011456 6 0 10 000 3 (3) A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比 A 班分散, 且平均成绩较 A 班低 8. 箱线图如下:(特征请读者自己分析)
某管理局下属 40 个企分组表 企业数(个) 11 11 9 9 40 频率(%) 27.5 27.5 22.5 22.5 100.0 先进企业 良好企业 一般企业 落后企业 合计
按销售收入分组(万元)
3 采用等距分组 全距=49-25=24 n=40 取组距为 5,则组数为 24/5=4.8 取 5 组
服务质量等级评价的频数分布 服务质量等级 A B C D E 合计 条形图(略) 家庭数(频率) 14 21 32 18 15 100 频率% 14 21 32 18 15 100
2 (1)采用等距分组:
n=40 全距=152-88=64 取组距为 10 组数为 64/10=6.4 取 6 组 频数分布表如下: 40 个企业按产品销售收入分组表 按销售收入分组 企业数 频率 (万元) (个) (%) 100 以下 5 12.5 向上累积 企业数 5 频率 12.5 向下累积 企业数 40 频率 100.0
15
14 14
Frequency 10
10
8
8 7
5
4
0 -30
-20
-10 tempture
0
10
7 (1)茎叶图如下:
A班 数据个数 树 叶 树茎 B班 树叶 数据个数
0 1 2 11
4 97 97665332110
3 4 5 6
59 0448 122456677789 011234688
2 4 12 9
频数分布表: 按销售额分组(万元) 25-30 30-35 35-40 40-45 45-50 合计
频数(天数) 4 6 15 9 6 40
15
15
Frequency 10
9
6
6
5
4
0
25
30
35 sales
40
45
50
4. .(1)排序略。
(2)频数分布表如下: 100 只灯泡使用寿命非频数分布 按使用寿命分组(小时) 灯泡个数(只) 650~660 660~670 670~680 680~690 690~700 700~710 710~720 720~730 730~740 740~750 合计 直方图(略)。 (3)茎叶图如下: 6518 6614 6713 6811 6900 7000 7100 5 4 2 1 1 2 6 6 3 1 1 2 8 7 3 1 2 3 2 5 6 14 26 18 13 10 3 3 100 频率(%) 2 5 6 14 26 18 13 10 3 3 100
(2) α = 0.05, E = zα / 2
σ σ ⎞ ⎛ x = 120, ⎜ x − zα / 2 , x + zα / 2 ⎟ = (120 − 4.20028,120 + 4.20028 ) (3) 若 n n⎠ ⎝ = (115.7997,124.20028 )
9 3 1 2 3
4 2 3 5
5 2 4 6
5 2 5 7
5 3 6 7
8 3 6 8
8 4 6 8
9 9 4 5 5 6 6 6 7 7 8 8 8 8 9 9 7 7 8 8 8 9 9
7201 2 2 5 6 7 8 9 9 7335 6 7414 7
5 等距分组 n=65 全距=9-(-25)=34 取组距为 5,组数=34/5=6.8, 取 7 组 频数分布表: 按气温分组 天数 -25 --- -20 8 -20 --- -15 8 -15 --- -10 10 -10 --- -5 14 -5 --0 14 0 --5 4 5 --- 10 7 65 合计
=19.41(元),
∑m
乙企业平均成本 x2 =
i =1 3
2i
m1i ∑ i =1 x2 i
=18.29(元);
原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占 比重较大,因此拉低了总平均成本。
k
11. x =
∑x f
i =1 k
i i
426.67(万元);
i
∑f
i =1
第二章、统计数据的描述
思考题 1 描述次数分配表的编制过程 答:分二个步骤: (1) 按照统计研究的目的,将数据按分组标志进行分组。 按品质标志进行分组时, 可将其每个具体的表现作为一个组,或者几个表现合并 成一个组,这取决于分组的粗细。 按数量标志进行分组,可分为单项式分组与组距式分组 单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间) 作 为一个组。 统计分组应遵循“不重不漏”原则 (2) 将数据分配到各个组,统计各组的次数,编制次数分配表。 2.解释洛伦兹曲线及其用途 答:洛伦兹曲线是 20 世纪初美国经济学家、统计学家洛伦兹根据意大利经济学 家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。 洛伦兹 曲线可以观察、分析国家和地区收入分配的平均程度。 3. 一组数据的分布特征可以从哪几个方面进行测度? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。 常
统计学 第一章 1. 什么是统计学?怎样理解统计学与统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学与统计数据 存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对 统计数据的研究, 离开了统计数据, 统计方法以致于统计学就失去了其存在意义。 2.简要说明统计数据的来源 答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学 实验, 在社会经济管理领域, 主要通过统计调查方式来获得, 如普查和抽样调查。 间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。 3.简要说明抽样误差和非抽样误差 答: 统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中 各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用 样本推断总体时所产生的误差,它是不可避免的,但可以控制的。 4.答: (1)有两个总体:A 品牌所有产品、B 品牌所有产品 (2)变量:口味(如可用 10 分制表示) (3)匹配样本:从两品牌产品中各抽取 1000 瓶,由 1000 名消费者分别打 分,形成匹配样本。 (4)从匹配样本的观察值中推断两品牌口味的相对好坏。
95 85
75
65
55 45
Min-Max 25%-75% Median value
35
9.(1) x =274.1(万元);Me =272.5 ;QL=260.25;QU =291.25。 (2) s = 21.17 (万元)。
3
10.甲企业平均成本 x1 =
∑m
i =1 3
3
1i
m1i ∑ i =1 x1i
用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和 峰度系数。 4 怎样理解均值在统计中的地位? 答: 均值是对所有数据平均后计算的一般水平的代表值, 数据信息提取得最充分, 具有良好的数学性质, 是数据误差相互抵消后的客观事物必然性数量特征的一种 反映, 在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地 位。受极端数值的影响是其使用时存在的问题。 5 对比率数据的平均,为什么采用几何平均? 答: 比率数据往往表现出连乘积为总比率的特征,不同于一般数据的和为总量的 性质,由此需采用几何平均。 6. 简述众数、中位数和均值的特点和应用场合。 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数 据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易 计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影响, 但 数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。 7 为什么要计算离散系数? 答: 在比较二组数据的差异程度时,由于方差和标准差受变量值水平和计量单位 的影响不能直接比较,由此需计算离散系数作为比较的指标。 练习题: 1. 频数分布表如下: