统计学课后习题参考答案.doc

统计学课后习题参考答案.doc
统计学课后习题参考答案.doc

思考题与练习题

参考答案

【友情提示】请各位同学完成思考题和练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行!

第一章绪论

思考题参考答案

1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。

2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。

3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。

练习题参考答案

一、填空题

1.调查。

2.探索、调查、发现。

3. 目的。

二、简答题

1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。

2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题;

②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。

3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。

三、案例分析题

1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学

课程的平均成绩;定性数据:姓名;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。

2.(1)总体:广州市大学生;单位:广州市的每个大学生。(2)如果调查中了解的是价格高低,为定序尺度;如果调查中了解的是商品丰富、价格合适、节约时间,为定类尺度。(3)广州市大学生在网上购物的平均花费。(4)是用统计量作为参数的估计。(5)推断统计。

3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)4 0%;(6)30%。

第二章收集数据

思考题参考答案

1.二手数据的特点主要有:易获得;成本低;快速获得;相关性差;时效性差和可靠性低。对于任何一项研究,首先想到有没有现成的二手数据可用,实在没有或有但无法使用时才进行原始数据的收集。

2.普查的特点有:一次性的;规定统一的标准时点调查期限;数据一般比较准确,规范化程度较高;使用范围比较窄;调查质量不易控制;工作量大,花费大,组织工作复杂;易产生重复和遗漏现象等特点。

抽样调查的特点有:经济性好;实效性强;适应面广;准确性高。

3.两者不能替代。两者的目的不同,调查对象不同,组织方式不同。经济普查的“全面”包括所有经济体,比如个体户,而全面统计报表中的“全面”是相对的,只有注册为公司或企业并具有一定经济规模的经济体,才是调查对象,并不包括个体经营户。

4.略。

练习题参考答案

一、判断题

1.×

2.×

3.√

4.√

5.×

6.√

7.√

8.√

9.×10.√

二、单项选择题

1.C

2.B

3.C

4.A

5.D

6.C

三、略。

第三章整理和显示数据

思考题答案

1.因为收集的数据符合数据通常要求后,往往杂乱无章,不可用,所以有必要对数据进行整理。

2.比如市场营销专业。为了解各种不同饮料在市场的占有率情况,于是采用了问卷调查方法,得到相关的数据结果,整理成如下所示频数分布表和复式条形图来显示结果。

3.洛伦茨曲线的思想是洛伦茨曲线图是用人口累计率与收入累计率绘出散点图,并用平滑曲线来连接这些散点,以此来描述一国财富或收入分配状况的统计工具。其一般为一条向下弯曲的曲线,偏离45度角直线越小,表明该社会收入分配状况的平等化程度越高,偏离45度角直线越大,表明该社会收入分配状况的平等化程度越低。

练习题参考答案

一、单选题

1.C 2.D 3.

A 二、简答题

1.数值型数据的统计分组方法有两种,一种是单变量值分组,一种是组距分组。单变量值分组就是将一个变量值作为一组,总体中有几个不同的变量值就分几个组,适合于离散型变量,且适合变量值较少的情况。组距式分组是将变量值的一个区间作为一组,适合于连续变量和变量值较多的离散型变量情况。

2.(1)70应为第四组,因为是遵循“上组限不在内”的原则。70只能作为下限值放在第四组。

(2)91没有被分入组内,是违背了“不重不漏”的原则。

三、实操题

1.(1)上面数据属于分类型数据

(2)频数分布表如下表所示:

类别频数比例百分比(%)

A100.2525

B90.22522.5

C70.17517.5

D60.1515

E80.2020(3)条形图如下所示

饼图如下所示

2.

2.(1)Excel中得到的频数分布表

贷款数分组

频数频率(%)向上累计频率

(%)

500以下61515

500~1000164055

1000~150082075

1500~200061590

2000以上410100

合计40100–(2)在Excel中绘制的频率直方图

在Excel中绘制的累计频率分布图

(3)钟型右偏分布。3.最低温度的茎叶图

最低温度Stem-and-Leaf Plot

Frequency Stem& Leaf

3.00 3 . 789

6.00 4. 002334

4.00 4 . 5677

8.00 5 . 00011233

2.00 5 . 59

2.00 6 . 13

4.00 6 . 5678

1.00 7 . 4

Stem width: 10 Each leaf: 1 case(s)

第四章 数据分布的数字特征

思考题参考答案

1.典型案例5中解决问题的科学家是日本质量管理学家田口玄一教授。解决的结果是:田口玄一教授发现:当产品质量数据服从以最佳位置m 为中心的正态分布2

[,(3)]N m T 时,产品质量高。

2.3σ质量管理原则的基本思想: 3σ质量管理中的最佳位置m 与平均数重合,3T 与标准差重合,产品质量数据的分布与正态分布重合,此时的产品质量最高。其中3σ质量代表了较高的对产品质量要求的符合性和较低的缺陷率。它把产品质量值的期望作为目标,并且不断超越这种期望,企业从3σ开始,然后是4σ、5σ、最终达到6σ。

对做人、做事的启示是:找到做人或做事的最佳目标,然后尽一切努力不断地靠近此目标,从而达到最佳状态。

3.3σ质量管理原则大到能拯救和强大一个国家,小到能拯救和强大自己。生活中,每个人都有自己的目标,目标或大或小,可能会有很多,但这些目标不可能全部实现,我们需要根据自己的实际情况选择一个合适的、最有可能实现的目标(最佳目标),然后尽一切努力,心无旁骛地、不断地靠近此目标,继而达到理想状态。

4.煮饭的水位有一个最佳刻度值(最优目标),水位越靠近这个刻度值,则煮出的 饭口感越好;水位越远离这个刻度值,则煮出的饭口感越差。即水位越向该刻度值(最优目标)靠拢则煮出的饭口感越好,这也体现了3σ质量管理原则的思想。

练习题参考答案

一、单选题

1.B 2.C 3.B 4.D 5.D 6.C 二、判断题

1.× 2.× 3.√ 4.√ 5.√ 三、计算题

1.(1)161o M =;161.5e M =;160.27i

x

x n

=≈∑

(2)=

7.54L n Q =位置;3=22.54

U n

Q =位置

153153167168

=

153;167.522

L U Q Q ++∴=== (3

)9.06s =

(4)因为是单峰分布,且满足e x M <,所以该组数据近似左偏分布。

2.(1)因为该题中产品销售额和销售利润两组数据的变量值水平不同,所以比较产品销售额和销售利润的差异应该选用离散系数这个统计量。

(2)因为1584i

x x n

=

=∑

;1290.91s =

2

38.21i

x

x n

=

=∑

;224.02s =

所以 111290.910.4981584s s v x =

=≈ 222

24.020.628638.21s s v x ==≈

因为12s s v v <,所以销售利润这组数据的差异大。

3.(1)假定数据对称分布,判断数据的百分比问题应该用经验法则。因为新员工的平均得分是85分,标准差是5分,所以可以判断75~95分正好对应着均值±2倍的标准差范围,根据经验法则可知大约有95%的数据落在此范围内。

(2)假定员工得分的分布未知,判断数据的百分比问题应该用切比雪夫不等式。因为新员工的平均得分是85分,标准差是5分,所以可以判断75~95分正好对应着均值±2倍的标准差范围,根据切比雪夫不等式(21

-1k

,其中k 为标准差前的倍数)可知至少有75%的数据落在此范围内。

4.根据题意,应用标准分数来比较。 第一学期小明微积分的标准分数:;2570

801111=-=-=

s x x z 第二学期小明微积分的标准分数:;5.110

65

802222=-=-=

s x x z 因为21z z >,所以小明第一学期的微积分成绩更理想。

5.(1)84400105580i i

i

x f

x f

=

=

=∑∑甲 85000106380i i i

x f x f ===∑∑乙

因为x x <甲乙,所以供应商乙的灯泡寿命更长。

(2

)因为258.4765s =

≈甲

261.6283s =

≈乙

所以258.47650.24501055s s v x =

=

≈甲甲甲

261.6283

0.24611063s s v x ==≈乙乙乙

因为s s v v <甲乙

,所以可知供应商甲灯泡寿命更稳定。

(3)因为是分组数据,所以偏态系数

0262.098.17268850452250

33-≈-=s a SK =

甲 1553.05.1790829125.27820313

3≈=s

a SK =乙 峰态系数

6940.034463593014510292898123-4

4-≈-=s

a K =

0109.034685315855314005004883-4

4-≈-=s a K =

(4)从(3)可知:00262.0<-≈甲SK ,可知供应商甲的灯泡使用寿命分布是左偏分布,但偏斜程度较小;01553.0>≈乙SK ,可知供应商乙的灯泡使用寿命分布是右偏分布,但由于SK SK >乙甲,所以供应商乙灯泡寿命的偏斜程度比供应商甲的要大;

06940.0<-≈甲K ,可知数据是扁平分布,即数据较分散;

00109.0<-≈乙K ,可知数据是扁平分布,但因乙甲K K <,所以供应商甲的灯泡寿命分

布要比乙的分散。

(5)因为甲的偏斜程度比乙小,且偏态系数的值比较接近于0,所以供应商甲的灯泡寿命分布可以看作是近似对称分布,所以甲的平均寿命代表性更强。又由于s s v v <甲乙,即

供应商甲灯泡寿命更稳定,所以,选择供应商甲的灯泡更好些。 四、案例分析

从平均数的意义及计算范围上解释通即可。(开放式,答案不唯一)

第五章 抽样分布

思考题参考答案

1. 这种做法的理论依据是统计量X 和2

S 的抽样分布。因为X μμ=,

2

2X

n

σσ=

,即X

的平均数为μ,方差随着n 的增大越来越小,从而X 的取值越来越向着μ靠拢,故用X 去估计μ理论依据成立。同理,2

S 的平均数为2

σ,方差随着n 的增大越来越小,从而2

S 的取值越来越向着2

σ靠拢,故用2

S 去估计2

σ理论依据成立。

2. 比如:(1)哈佛大学每年收到7000个优秀学生的入学申请,申请表中包含了大量申

请人的信息,现入学主管需要知道一些基本信息比如SAT 平均成绩,于是抽取一个样本容量为50的样本,以此样本的SAT 平均成绩来估算7000人的平均成绩。(2)为估计广州市大瓶装纯水市场的市场容量,计算各品牌纯水的知名度,以及覆盖率,抽取一定数量的大瓶装纯水,计算其数字特征,以此估算全市情况。

练习题参考答案

一、判断题

1.√ 2.√ 3.× 4.√ 5.× 二、单项选择题

1.C 2.A 3.D 4.A 5.C 6.B 7.B 8.B 三、案例分析题

(213,4.5918)X N :。若是不重复抽样,方差需要用系数()1)N n N --进行修正,

从而抽样分布是:2(,

)1

N n

X N n N σμ--:。

第六章 参数估计

思考题参考答案

1.矩估计法基本思想是,用样本原点矩作为总体原点矩的估计。最大似然方法的基本思想是,在估计θ?取值的可能范围内,挑选使样本观测值出现概率达到最大的θ?

作为参数θ的估计。

2.对同一参数,用不同的估计方法,可以得到不同的估计量,那个估计方法更好呢?

3.构造参数的置信区间时,要权衡以下两个方面,一是估计量的精度要求,二是估计量的可靠性程度。所谓精度要求就是要把估计误差控制在一定的范围内,我们用极限误差

2

??1

2θθ-=

?来反映。△越小,表示估计的精度越高;△越大,表示估计的精度越低。极限

误差的大小要根据研究目的和研究对象的变异程度来确定。

练习题参考答案

一、单选题

1.C 2.C 3.A 4. B 5. D 二、判断题

1. √

2. ×

3. √

4. ×

5. × 三、计算题

1.根据已知:,093.2)1(%,951,9,48,202/=-=-===n t s x n αα则:

即在置信度95%下,此次抽样得该邮箱每周平均收到邮件数的区间估计为(44,53)封。 2.

,

96.1,6.0,8.4,50025.0====z s x n

n

s z x 2

/αμ)

97.4,63.4(50

6.096.18.4=?

=μ,

即在95%置信水平下,此次抽样得该批电子元件平均厚度的区间估计为(4.63,4.97)cm 。 3.已知

96

.1%,951,14.2,9,15.02==-===-

a z x n ασ

n z x a

σ

2

±-

=21.4±0.098=(21.0302,21.498),

即在95%置信度下,此次抽样得该批零件平均长度的区间估计为(21.302,21.498)cm 之间。

4.样本比例:

48.010048

1===

n n p ,5)1(5≥-≥p n np 和,所以

09992.048.0100)48.01(48.0248.0)1(2μμμ=-?=-?

n p p z p α

]

32.52,68.43[20

9903.248)

1(2/=?

±=-±n

s n t x α

=(38.01%,57.99%)

即在95.45%概率保证程度下,此次抽样得该校学生成绩在80分以上比重的区间估计为(38.01%,57.99%)之间。

第七章 假设检验

思考题参考答案

1. 区间估计中区间事件的逆是小概率事件和小概率原理。

2. 明确的陈述作为原假设,不明确的陈述作为备择假设。

3. t -检验是事后控制,σ3质量管理原则是按先给出的产品设计进行操作,

是事前控制。

练习题参考答案

一 、单选题

1. C

2. C

3. A

4. B

5. A 二 、判断题

1. √

2. ╳

3. ╳

4. √ 三、计算题

1. 根据题意生产的零件是否符合标准要求,即加工某零件的标准口径的均值是否为20毫米,因此采用双侧检验。 (1)建立假设:

0:20H μ= 1:20H μ≠

(2)确定检验统计量,并计算检验统计量值

因为0=20 =0.3 =20.5 n=36x μσ,所以采用Z 检验统计量。

10

x z =

==

(3)给定显著性水平,并查表,得到拒绝域

0.05α=,拒绝域为/20.025 1.96α≥==z z z

(4)判断

因为/2=10α>z z ,z 落入了拒绝域,所以拒绝0H ,即此次抽样认为生产的零件不符合标准要求。

2. 根据题意,要检验体院男生安静时心率与普通成年人的心率有无差异,即平均数是否达到72次/min ,因此采用双侧检验。 (1)建立的假设为:

0:72

H μ=

1:72

H μ≠

(2)确定检验统计量,并计算检验统计量值 已知

072μ=,64n =,68x =, 6.4s =,0.01α=,因为是大样本,所以采用Z 检验

统计量。

5

x z =

==-

(3)给定显著性水平,并查表,得到拒绝域

0.01α=,拒绝域为/20.005 2.58α≥==z z z

(4)判断 因为

/2

z z α>,z 落入拒绝域,所以拒绝0H ,即此次抽样体院男生安静时心率与普通

成年人的心率有差异。 3. (1)建立假设:

0:1020H μ≤ 1:1020H μ>

(2)确定检验统计量,并计算检验统计量值

因为正态总体,0=1020 =100 =1080 n=16x μσ,所以采用Z 检验统计量。

2.4

x z =

==

(3)给定显著性水平,并查表,得到拒绝域

0.05α=,拒绝域为: 0.05 1.645α≥==z z z

(4)判断

因为z z α>,z 落入拒绝域,所以拒绝0H ,即此次抽样认为这批产品的寿命有显著提高。

4.根据题意,要检验机器是否正常工作,即袋装糖重是否为0.5千克,因此采用双侧检验。

(1)建立的假设为:

0:0.5

H μ=

1:0.5

H μ≠

(2)确定检验统计量,并计算检验统计量值 因为正态总体,

00.5μ=,

,9n =,σ未知,所以采用t 统计量,

1

0.512

n

i

i x

x n

==

=∑,009.01

)(9

1

2

=--=

∑=n x x

s i i

4309.0012

.09

09.05.0512.00==-=-=

n u x t σ

(3)给定显著性水平,并查表,得到拒绝域

0.05α=,拒绝域为: 306.2)1(2=-≥n t t α

(4)判断

因为)1(4-≥=n t t α,t 落入拒绝域,所以拒绝

H ,即认为机器不正常。

5.根据题意,要决定如何处理这批货物,也就是该百货商店要不要收这批货物,由次品率是否超过3%来决定,因此采用单侧检验。

(1)建立的假设为:

0:3%

H π≤

1:3%

H π>

(2)确定检验统计量,并计算检验统计量值 已知

03%π=,4100=p =4%,0.05α=,采用z 检验统计量。

1%

=0.581.71%

-=

=

=

p z

(3)给定显著性水平,并查表,得到拒绝域,

0.05α=,拒绝域为: 0.05 1.645α≥==z z z

(4)判断

因为αz z <,z 不落入拒绝域,所以不能拒绝0H ,即此次抽样认为可接受这批货物。 6. (1)建立假设:

σ=20:5000H σ≠21:5000H

(2)确定检验统计量,并计算检验统计量值 已知σ=205000 =2

9200s

=26n

χσ--?=

=

=2

2

2

0(1)(261)9200

465000

n s

(3)(3)给定显著性水平的值,查得2

χ分布表,并得出拒绝域

α=0.05 查2χ分布表,得到αχχ-==220.0252

(n 1)(25)40.6465

α

χχ--==2

20.975(1)

2

(n 1)(25)13.1197,得到拒绝域为:

222/20.005(1)=(25)=40.6465αχχχ>-n ,或222

1/20.995(1)=(25)=13.1197αχχχ-<-n

(4)判断 因为αχ

χ>2

22

,2χ落入拒绝域,所以拒绝0H ,即此次抽样认为这批电池的寿命的

波动性较以往有显著的变化。 四、案例分析题

1.第Ⅰ类错误是该供应商提供的这批炸土豆片的平均重量的确大于60g ,但检验结果却提供证据支持店方倾向于认为其质量少于60g 。

2.第Ⅱ类错误是该供应商提供的这批炸土豆片的平均重量其实少于60g ,但检验结果却却没有提供足够的证据支持店方发现这一点,从而拒收这批产品。

3.连锁店的顾客们看重第Ⅱ类错误,而供应商更看重第Ⅰ类错误。

第八章 相关与回归分析

思考题参考答案

1.使残差的平方和达到最小来估计参数。

2.误差项零均值,误差项同方差,误差项无序列相关,解释变量与误差项不相关,误差项服从正态分布。

3.高尔顿,发现是:矮于父辈平均身高父亲的儿子、高于父辈平均身高父亲的儿子都有“回归”到父辈平均身高的趋势。

4.三个年度的诺贝尔经济学奖。

练习题参考答案

一、计算题

解法一:计算中间结果为:5.703147)()(=-=--∑∑y x n y x y y x x i i i i ,75.534=x ,75.869=y ,5.835769)(2

=-∑x x i ,5.691519)(2

=-∑y y i ,

(1)计算相关系数 r =

∑∑∑----2

2

)()

()

()(y y

x x

y y x x i

i

i i

=0.9249

显著相关检验:检验统计量 2

2

9249

.011-=

-=

r

t =5.9587,

α=0.05下,查t 分布表,得拒绝域:︱t ︱≥t α/2(n -2)=2.447

t 落入拒绝域,拒绝H 0,表明工业增加值y 与生产性固定资产年均价值x 之间存在显著正线性相关关系。

(2)确定直线回归方程

2

1

)

()()(?∑∑---=x x y y x x i

i i

β=0.841

86.419??1

0=-=x y ββ 直线回归方程为:x y

841.086.419?+= 1?β=0.84的解释:生产性固定资产年均价值每增加一万元,工业增加值平均增加1

?β=0.84万元,符合经济学理论,具有经济含义。

(3)=)?(1

β

S S

222?()(1)()i i i y y r y y -=--∑∑,所以,t =

=)?(/?11ββS 5.9587,查t 分布表,得拒绝域:)2(2/-≥n t t α=2.447,t 落入拒绝域,拒绝H 0,说明工业增加值y 与生产性固定资产x 有显著的线性关系。

(4)确定生产性固定资产为x 0=1100万元时,工业增加值的估计值:

0?y

=419.6+0.841×1100=1344.7(万元) 在置信度95%(α=0.05),工业增加值个别值0y 的区间预测。

)2(?2/0-n t y αμS ∑--++2

2

0)

()(11x x x x n i

1344.7 2.447129.078=?m (956.92,1732.48) 即生产性固定资产为x =1100万元时,工业增加值个别值0y 置信度95%的预测区间为(964.68,1724.72)万元。

解法二:计算中间结果为:

因为∑∑-=-222

)(x n x x x i i ,所以22

2)(x n x x x i i +-=∑∑=3123430,同理,

22

2

)

(y n y y y i

i

+-=∑∑=6743240,∑x i =4278, ∑y i =6958,∑x i y i =4423938,n =8

(1)计算相关系数 9249.0)

()

(2

22

2=---=

∑∑∑∑∑∑∑i i

i i

i

i i i y y n x x n y x y x n r

显著相关检验:检验统计量 2

2

9249

.011-=

-=

r

t =5.9587,

α=0.05下,查t 分布表,得拒绝域:︱t ︱≥t α/2(n -2)=2.447

t 落入拒绝域,表明工业增加值y 与生产性固定资产年均价值x 之间存在显著正线性相关关系。

(2)确定直线回归方程

84.0)

(?2

2

1

=--=∑∑∑∑∑i i

i i i i x x n y x y x n β

86.419??1

0=-=x y ββ 余下同解法一。

二、案例分析题

由图8-4结果,

(1)计算城镇居民人均可支配收入x 和城镇居民人均生活消费支出y 的相关系数,x 与y 正相关,故r ===99801.02R 0.999。

显著相关检验:检验统计量 99801

.012

35999.0122

--=

--=

r n r t =128.73,

α=0.05下,查t 分布表,得拒绝域:︱t ︱≥t α/2(n -2)=2.035

t 落入拒绝域,表明城镇居民人均可支配收入x 和城镇居民人均生活消费支出y 之间存在显著正线性相关关系。

(2)确定直线回归方程:1?β=0.67,0

?β=134.91 直线回归方程为:x y

67.091.134?+= 理论意义检验:0

?β=134.91的解释:表示城镇居民没有可支配收入时,人均生活消费估计平均为134.91元(以1978年为不变价);1?β=0.67的解释:城镇居民人均可支配收入x 每增加一元,城镇居民人均生活消费支出y 平均增加1

?β=0.67元(以1978年为不变价),符合经济学理论,具有经济含义。

(3)一级检验

拟合优度检验:判定系数2

R =0.998,说明总离差平方和的99.8%被样本回归直线所解释,因此样本回归线对样本观察点的拟合优度很高。

线性关系检验:t =128.73,查t 分布表,得拒绝域:)2(2/-≥n t t α=2.035,t 落入拒绝域,说明城镇居民人均可支配收入x 与城镇居民人均生活消费支出y 有显著的线性关系。 (4)确定城镇居民人均可支配收入为x 0=6860万元时,城镇居民人均生活消费支出y 0

的估计值:

0?y

=134.91+0.67×6860=4731.11(元) 在置信度95%(α=0.05),城镇居民人均生活消费支出个别值0y 的区间预测。

)2(?2/0-n t y αμS ∑--+

+2

20)()(11x x x x n i =(4629.97, 4832.25) 即城镇居民人均可支配收入为x =6860元(以1978年为不变价)时,城镇居民人均生活消费支出个别值0y 置信度95%的预测区间为(4629.97, 4832.25)元(由于运算量很大,建议使用EXCEL 软件进行中间过程的运算)。

第九章 时间序列分析

思考题参考答案

1. 给出时间序列分析的基本思想及作用。

从典型案例10有时间序列分析的基本思想和作用:应用时间序列分析方法,可发现社会经济现象的发展变化规律,分析其长期发展趋势,为更好决策提供依据。 (1)可描述被研究现象的发展过程、历史状态和结果;

(2)可分析被研究现象的增加量、发展速度、趋势,探索其发展变化的规律;

(3)利用时间序列数据可建立计量模型,进行现象变动的趋势分析和预测,为更好的决策提供依据;

(4)将不同但又相互联系的时间序列进行对比分析,可以研究同类现象在不同国家、地区之间的联系以及发展变化的差别。

2. 列举日常生活中时间序列应用的例子

时间序列数据在实际中有着广泛的应用,如经济学、金融学、医学、生物学、人口学、生态学、教育学、历史研究等。如分析股票的价格走势是时间序列在金融学的一个重要应用,利用时间序列的分析方法,找出股票的价格走势,并由此预测未来价格的变化情况,可为股票投资决策提供依据;记载生物生长过程的各项指标,分析生物各阶段生长的规律,可为生物的疾病预防等提供预测;利用时间序列分析方法分析历史事件,可以发现很多历史事件的出现有着类似的规律,可为人们研究历史提供一个有益的角度。

3. 为什么平均发展速度的计算要用几何平均数? 由于各期环比发展速度的基数不同,不能用各期环比发展速度相加后计算平均发展速度,也不能采用相对数时间序列计算序时平均数的方法计算平均发展速度。其假定各期环比发展速度y i /y i -1=平均发展速度G ,这样来消除环比发展速度的差异,计算平均发展速度。平均发展速度的计算有几何平均法和累计法。几何平均法计算平均发展速度着眼于最末一期的水平,故又称为“水平法”。如果关心现象在最后一期应达到的水平时,采用水平法计算平均发展速度比较合适。几何平均法较为简单直观,既便于各种速度之间的推算,也便于预测未来某期的水平,因此有着广泛的应用。

练习题参考答案

一、判断分析题

1.(1)不是;(2)是;(3)是;(4)是;(5)不是

2.(1)时期数据;(2)时期数据;(3)时点数据;(4)时点数据 二、计算题

1. 解:该公司1月的平均在职人数=(610+612)/2=611人, 2月的平均在职人数=(612+620)/2=616人, 3月的平均在职人数=(620+640)/2=630人。

所以:第一季度的平均在职人数=(611+616+630)/3=619人。

(即:第一季度的平均在职人数=142640

6206122

610-+

++=619人)

2. 解:该公司全年的月平均人数

3.解:该家庭这5年的平均恩格尔系数=

5

73600

630005900055500526005

%

2873600%3363000%3559000%3855500%4052600++++?+?+?+?+? =6

.2083560740

=34.3%

(或

73600

63000590005550052600%

2873600%3363000%3559000%3855500%4052600++++?+?+?+?+?

=

303700

104178

=34.3%)

4.解:该企业这4人均GDP 的平均数

=4

261

2532432344410

261430253420243400234+++?+?+?+?

=

75

.247102865

=415.20元

(或=

261

253243234410

261430253420243400234+++?+?+?+?

=

991

411460

=415.20元)

5. 解:该企业2015年第二季度的人均产量=平均每月总产量/平均每月工人数。

由于月末工人数是时点数据,按照间隔相等的时点时间序列的平均发展水平的计算公式,得到2015年第二季度每月的平均工人数分别为(120+130)/2=135人,(130+140)/2=135人,(140+150)/2=145人。

对应的2015年第二季度每月的产量分别为2050×125=256250件,2030×135=274050件,2080×145=301600件,所以:

平均工人数为(125+135+145)/3=135人

平均每月产量=(256250+274050+301600)/3=277300件。

所以,该企业2015年第二季度的人均产量=277300/135=2054.07≈2054件。

6.解:线图:

特点:从图中可以看出,该地区2001年-2013年的个人实际可支配收入整体呈现上升趋势,但上升速度较慢,其中在2005年、2007年和2011年较前一年有小幅度下降。

(2)速度分析

(3)平均增长速度=2.25%

预测2015年年产值=343*(1+2.25%)=350.72

预测2016年年产值=343*(1+2.25%)2=358.61

第十章指数分析

思考题参考答案

1.利用pq相加的对比有意义,如果消费者买同样多的报告期商品q1,报告期花的钱∑p1q1比基期花的钱∑p0q1多(少),则价格涨(跌),其中q取报告期的原因是价格p为质量指标,这样分析的现实性更强。

2.先综合,后对比。先综合,就是将复杂现象总体中不能直接加总的不同度量现象,如不同使用价值的多种商品构成的总体,通过同度量因素的加入,转化为同度量现象,过渡到能够加总、综合的价值指标;后对比,就是将转化为同度量现象的两个时期的价值指标进行对比,并且用来对比的两个时期的价值指标中所加入的同度量因素必须令其固定在同一时期的水平上。这样,对比结果得出的总指数就是所要研究的现象综合变动的程度。

3.因为销售额指数=价格指数×销售量指数,故用价格指数和销售量指数,可从相对数、绝对数方面分析它们的变动对销售额变动的影响。

练习题参考答案

一、单选题

1. D

2. B

3. A

4. A

5. D

6. B

7. D

8.B

9. A 10. D

二、判断题

1. √

2. ×

3. ×

4. √

5. ×

6.×

7. ×

8. √

9. ×10. √

三、计算题

1.解:

统计学计算题例题

第四章 1. 某企业1982年12月工人工资的资料如下: 要求:(1)计算平均工资;(79元) (2)用简捷法计算平均工资。 2. 某企业劳动生产率1995年比1990年增长7%,超额完成计划2%,试确定劳动生产率计划增长数。7%-2%=5% 3. 某厂按计划规定,第一季度的单位产品成本比去年同期降低8%。实际 执行结果,单位产品成本较去年同期降低4%。问该厂第一季度产品单位成本计划的完成程度如何?104.35%( (1-4%)/(1-8%)*100%=96%/92%*100%=104.35%结果表明:超额完成4.35%( 104.35%-100%)) 4. 某公社农户年收入额的分组资料如下:

要求:试确定其中位数及众数。中位数为774.3(元)众数为755.9(元) 求中位数: 先求比例:(1500-720)/(1770-720)=0.74286 分割中位数组的组距:(800-700)*0.74286=74.286 加下限700+74.286=774.286 求众数: D1=1050-480=570 D2=1050-600=450 求比例:d1/(d1+d2)=570/(570+450)=0.55882 分割众数组的组距:0.55882*(800-700)=55.882 加下限:700+55.882=755.882 5.1996年某月份某企业按工人劳动生产率高底分组的生产班组数和产量资料如下: 64.43(件/人) (55*300+65*200+75*140+85*60)/(300+200+140+60) 6.某地区家庭按人均月收入水平分组资料如下:

根据表中资料计算中位数和众数。中位数为733.33(元) 众数为711.11(元) 求中位数: 先求比例:(50-20)/(65-20)=0.6667 分割中位数组的组距:(800-600)*0.6667=66.67 加下限:600+66.67=666.67 7.某企业产值计划完成103%,比去年增长5%。试问计划规定比去年增长 多少?1.94% (上年实际完成1.03/1.05=0.981 本年实际计划比上年增长 (1-0.981)/0.981=0.019/0.981=1.937%) 8.甲、乙两单位工人的生产资料如下: 试分析:(1)哪个单位工人的生产水平高? (2)哪个单位工人的生产水平整齐? % 3.33V %7.44V /8 .1x /5.1x ====乙甲乙甲人)(件人)(件9.在 计算平均数里,从每个标志变量中减去75个单位,然后将每个差数 缩小10倍,利用这个变形后的标志变量计算加权算术平均数,其中各个变量的权数扩大7倍,结果这个平均数等于0.4个单位。试计算这个平均标志变量的实际平均数,并说明理由。79 10.某地区1998~1999年国内生产总值资料如下表:(单位:亿元)

统计学原理计算题试题及答案(最新整理)

电大专科统计学原理计算题试题及答案 计算题 1某单位40名职工业务考核成绩分别为 68 89 8884 86 87 75 73 72 68 75 82 9758 81 54 79 76 95 76 71 60 9065 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60 — 70分为及格,70 — 80分为中,80 — 90 分为良,90 — 100分为优。 要求: (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)分析本单位职工业务考核情况。 解:(1) (2)分组标志为”成绩",其类型为" 的开放组距式分组,组限表示方法是重叠组限; (3)本单位的职工考核成绩的分布呈两头小,中间大的”正态分布”的形态, 说明大多数职工对业务知识的掌握达到了该单位的要求。 2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下 价格(元/斤) 甲市场成交额(万元) 乙市场成交量(万斤) 品种

试问哪一个市场农产品的平均价格较高?并说明原因 解:先分别计算两个市场的平均价格如下: 甲市场平均价格 X m 5.5 1.375 (元 /斤) m/x 4 乙市场平均价格 X xf 5.3 1.325 (元 / 斤) f 4 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场 平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同 3. 某车间有甲、乙两个生产组,甲组平均每个工人的日产量为 36件, 标准差为9.6件;乙组工人日产量资料如下:

统计学作业答案

1. 一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该 电信的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务 的大客户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前 好。试在95%的置信水平下对大客户中认为营业厅现在的服务质量较两年前 好的比率进行区间估计。 4.据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房 者中本地人购房比率p 的区间估计,在置信水平为10%下,其允许误差E = 0.08。则: (1)这80名受访者样本中为本地购房者的比率是多少? (2)若显著性水平为95%,则要保持同样的精度进行区间估计,需要调查 多少名购房者。 解:这是一个求某一属性所占比率的区间估计的问题。根据已知n =30,2 /αz =1.96,根据抽样结果计算出的样本比率为%30309?==p 。 总体比率置信区间的计算公式为: ()n p p z p ?1??2/-±α 计算得: ()n p p z p ?1??2/-±α=30%()30 %301%3096.1-??± =(13.60%,46.40%) 5、某大学生记录了他一个月31天所花的伙食费,经计算得出了这个月平均每天 花费10.2元,标准差为2.4元。显著性水平为在5%,试估计该学生每天平 均伙食费的置信区间。 解:由已知:=x 10.2,s =2.4,96.1025.0=z ,则其置信区间为: 314 .296.12.10025.0?±=±n s z x =〔9.36,11.04〕。 该学生每天平均伙食费的95%的置信区间为9.36元到11.04元。

6、据一次抽样调查表明居民每日平均读报时间的95%的置信区间为〔2.2,3.4〕 小时,问该次抽样样本平均读报时间t 是多少?若样本量为100,则样本标准 差是多少?若我想将允许误差降为0.4小时,那么在相同的置信水平下,样 本容量应该为多少? 解:样本平均读报时间为:t = 24.32.2+=2.8 由()96 .121002.24.322.24.305.0?-=?-==s n s z E =3.06 2254 .006.396.122 22205.02=?=?=E s z n 7、某电子邮箱用户一周内共收到邮件56封,其中有若干封是属于广告邮件,并 且根据这一周数据估计广告邮件所占比率的95%的置信区间为〔8.9%, 16.1%〕。问这一周内收到了多少封广告邮件。若计算出了20周平均每周收 到48封邮件,标准差为9封,则其每周平均收到邮件数的95%的置信区间 是多少?(设每周收到的邮件数服从正态分布) 解:本周收到广告邮件比率为:p =2 161.0089.0+=0.125 收到广告邮件数为:n ×p =56×0.125=7封 根据已知:x =48,n =20,s =9,093.2)19(025.0=t ()199 093.24819025.0?±=±n s t x =[43.68,52.32] 8、为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅 办理该业务的柜台办理每笔业务的时间,随机记录了15名客户办理业务的时间,测得平均办理时间为t =12分钟,样本标准差为s =4.1分钟,则: (1)其95%的置信区间是多少? (2)若样本容量为40,而观测的数据不变,则95%的置信区间又是多少? 解:(1)根据已知有()145.214025.0=t ,n =15,t =12,s =4.1。 置信区间为:()151 .4145.21214025.0?±=±n s t t =〔9.73,14.27〕

统计学计算题例题及计算分析

计算分析题解答参考 1.1.某厂三个车间一季度生产情况如下: 计算一季度三个车间产量平均计划完成百分比和平均单位产品成本。 解:平均计划完成百分比=实际产量/计划产量=733/(198/0.9+315/1.05+220/1.1) =101.81% 平均单位产量成本 X=∑xf/∑f=(15*198+10*315+8*220)/733 =10.75(元/件) 1.2.某企业产品的有关资料如下: 试分别计算该企业产品98年、99年的平均单位产品成本。 解:该企业98年平均单位产品成本 x=∑xf/∑f=(25*1500+28*1020+32*980)/3500 =27.83(元/件) 该企业99年平均单位产品成本x=∑xf /∑(m/x)=101060/(24500/25+28560/28+48000/32) =28.87(元/件) 年某月甲、乙两市场三种商品价格、销售量和销售额资料如下: 1.3.1999 解:三种商品在甲市场上的平均价格x=∑xf/∑f=(105*700+120*900+137*1100)/2700 =123.04(元/件) 三种商品在乙市场上的平均价格x=∑m/∑(m/x)=317900/(126000/105+96000/120+95900/137) =117.74(元/件) 2.1.某车间有甲、乙两个生产小组,甲组平均每个工人的日产量为22件,标准差为 3.5件;乙组工人日产量资料:

试比较甲、乙两生产小组中的哪个组的日产量更有代表性? 解:∵X 甲=22件 σ甲=3.5件 ∴V 甲=σ甲/ X 甲=3.5/22=15.91% 列表计算乙组的数据资料如下: ∵x 乙=∑xf/∑f=(11*10+14*20+17*30+20*40)/100 =17(件) σ乙= √[∑(x-x)2 f]/∑f =√900/100 =3(件) ∴V 乙=σ乙/ x 乙=3/17=17.65% 由于V 甲<V 乙,故甲生产小组的日产量更有代表性。 2.2.有甲、乙两个品种的粮食作物,经播种实验后得知甲品种的平均产量为998斤,标准差为162.7斤;乙品种实验的资料如下: 试研究两个品种的平均亩产量,确定哪一个品种具有较大稳定性,更有推广价值? 解:∵x 甲=998斤 σ甲=162.7斤 ∴V 甲=σ甲/ x 甲=162.7/998=16.30% 列表计算乙品种的数据资料如下:

统计学计算例题及答案

计算题例题及答案: 1、某校社会学专业同学统计课成绩如下表所示。 社会学专业同学统计课成绩表 学号成绩学号成绩学号成绩101023 76 101037 75 101052 70 101024 91 101038 70 101053 88 101025 87 101039 76 101054 93 101026 78 101040 90 101055 62 101027 85 101041 76 101056 95 101028 96 101042 86 101057 95 101029 87 101043 97 101058 66 101030 86 101044 93 101059 82 101031 90 101045 92 101060 79 101032 91 101046 82 101061 76 101033 80 101047 80 101062 76 101034 81 101048 90 101063 68 101035 80 101049 88 101064 94 101036 83 101050 77 101065 83 要求: (1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。

(2)对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率。答案: (1)考试成绩由低到高排序: 62,66,68,70,70,75,76,76,76,76,76,77,78,79, 80,80,80,81,82,82,83,83,85,86,86,87,87,88, 88,90,90,90,91,91,92,93,93,94,95,95,96,97, 众数:76 中位数:83 平均数: =(62+66+……+96+97)÷42 =3490÷42 =83.095 (2) 按成绩 分组频数频率(%) 向上累积向下累积 频数频率(%) 频数频率(%) 60-69 3 7.143 3 7.143 42 100.000 70-79 11 26.190 14 33.333 39 92.857 80-89 15 35.714 29 69.048 28 66.667

统计学原理(第五版)》习题计算题答案详解

《统计学原理(第五版)》习题计算题答案详解 第二章 统计调查与整理 1. 见教材P402 2. 见教材P402-403 3. 见教材P403-404 第三章 综合指标 1. 见教材P432 2. %86.12270 25 232018=+++= 产量计划完成相对数 3. 所以劳动生产率计划超额%完成。 4. %22.102% 90% 92(%)(%)(%)=== 计划完成数实际完成数计划完成程度指标 一季度产品单位成本,未完成计划,还差%完成计划。 5. %85.011100%8% 110% 1=?++==计划完成数实际完成数计划完成程度指标计划完成数;所以计划完成数实际完成数标因为,计划完成程度指%105%103= = 1.94%%94.101% 103% 105,比去年增长解得:计划完成数==()得出答案)将数值带入公式即可以计算公式, 上的方程,给大家一个很多同学都不理解也可以得出答案,鉴于(根据第三章天)。 个月零天(也即是个月零(月)也就是大约)(上年同季(月)产量达标季(月)产量超出计划完成产量 达标期完成月数计划期月数超计划提前完成时间达标期提前完成时间完成计划的时间万吨。根据公式:提前多出万吨,比计划数万吨产量之和为:季度至第五年第二季度方法二:从第四年第三PPT PPT 6868825.8316-32070 -7354-60--3707320181718=+=+=+==+++()天完成任务。个月零 年第四季度为止提前(天),所以截止第五)(根据题意可设方程:万吨完成任务。天达到五年第二季度提前万吨。根据题意,设第万吨达到原计划,还差万吨产量之和为:季度至第五年第一季度方法一:从第四年第二6866891 -91*20)181718(1916707016918171816=++++=+++x x x

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

统计学练习题——计算题

统计学练习题——计算题 1、某企业工人按日产量分组如下: 单位:(件) 试计算7、8月份平均每人日产量,并简要说明8月份比7月份平均每人日产量变化的原因。 7月份平均每人日产量为:37360 13320 == = ∑∑f Xf X (件) 8月份平均每人日产量为:44360 15840 == = ∑∑ f Xf X (件) 根据计算结果得知8月份比7月份平均每人日产量多7件。其原因是不同组日产量水平的工人所占比重发生变化所致。7月份工人日产量在40件以上的工人只占全部工人数的40%,而8月份这部分工人所占比重则为66.67%。

2、某纺织厂生产某种棉布,经测定两年中各级产品的产量资料如下: 解: 2009年棉布的平均等级= 250 10 3 40 2 200 1? + ? + ? =1.24(级) 2010年棉布的平均等级= 300 6 3 24 2 270 1? + ? + ? =1.12(级) 可见该厂棉布产品质量2010年比2009年有所提高,其平均等级由1.24级上升为1.12级。质量提高的原因是棉布一级品由80%上升为90%,同时二级品和三级品分别由16%及4%下降为8%及2%。

试比较和分析哪个企业的单位成本高,为什么? 解: 甲企业的平均单位产品成本=1.0×10%+1.1×20%+1.2×70%=1.16(元) 乙企业的平均单位产品成本=1.2×30%+1.1×30%+1.0×40%=1.09(元) 可见甲企业的单位产品成本较高,其原因是甲企业生产的3批产品中,单位成本较高(1.2元)的产品数量占70%,而乙企业只占30%。

统计学计算题答案..

第 1 页/共 12 页 1、下表是某保险公司160名推销员月销售额的分组数据。书p26 按销售额分组(千元) 人数(人) 向上累计频数 向下累计频数 12以下 6 6 160 12—14 13 19 154 14—16 29 48 141 16—18 36 84 112 18—20 25 109 76 20—22 17 126 51 22—24 14 140 34 24—26 9 149 20 26—28 7 156 11 28以上 4 160 4 合计 160 —— —— (1) 计算并填写表格中各行对应的向上累计频数; (2) 计算并填写表格中各行对应的向下累计频数; (3)确定该公司月销售额的中位数。 按上限公式计算:Me=U- =18-0.22=17,78 2、某厂工人按年龄分组资料如下:p41 工人按年龄分组(岁) 工人数(人) 20以下 160 20—25 150 25—30 105 30—35 45 35—40 40 40—45 30 45以上 20 合 计 550 要求:采用简捷法计算标准差。《简捷法》 3、试根据表中的资料计算某旅游胜地2004年平均旅游人数。P50 表:某旅游胜地旅游人数 时间 2004年1月1日 4月1日 7月1日 10月1日 2005年1月1 日 旅游人数(人) 5200 5000 5200 5400 5600 4、某大学2004年在册学生人数资料如表3-6所示,试计算该大学2004年平均在册学生人数. 时间 1月1日 3月1日 7月1日 9月1日 12月31日 在册学生人数(人) 3408 3528 3250 3590 3575

应用统计学练习题(含答案)

应用统计学练习题 第一章绪论 一、填空题 1.统计工作与统计学的关系是__统计实践____和___统计理论__的关系。 2.总体是由许多具有_共同性质_的个别事物组成的整体;总体单位是__总体_的组成单位。 3.统计单体具有3个基本特征,即__同质性_、__变异性_、和__大量性__。 4.要了解一个企业的产品质量情况,总体是_企业全部产品__,个体是__每一件产品__。 5.样本是从__总体__中抽出来的,作为代表_这一总体_的部分单位组成的集合体。 6.标志是说明单体单位特征的名称,按表现形式不同分为__数量标志_和_品质标志_两种。 7. 8.统计指标按其数值表现形式不同可分为__总量指标__、__相对指标_和__平均指标__。 9.指标与标志的主要区别在于: (1)指标是说明__总体__特征的,而标志则是说明__总体单位__特征的。 (2)标志有不能用__数量__表示的_品质标志_与能用_数量_表示的_数量标志_,而指标都是能用_数量_表示的。 10.一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和__统计分析__4个阶段。 二、单项选择题 1.统计总体的同质性是指(A)。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志或数量标志 D.总体各单位具有若干互不相同的品质标志属性或数量标志值 2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D)。

A.全部工业企业 B.800家工业企业 C.每一件产品 D.800家工业企业的全部工业产品 3.有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为(A)。 A.200家公司的全部职工 B.200家公司 C.200家公司职工的全部工资 D.200家公司每个职工的工资 4.一个统计总体( D)。 A.只能有一个标志 B.可以有多个标志 C.只能有一个指标 D.可以有多个指标 5.以产品等级来反映某种产品的质量,则该产品等级是(C)。 A.数量标志 B.数量指标 C.品质标志 D.质量指标 6.某工人月工资为1550元,工资是( B )。 A.品质标志 B.数量标志 C.变量值 D.指标 7.某班4名学生金融考试成绩分别为70分、80分、86分和95分,这4个数字是( D)。 A.标志 B.指标值 C.指标 D.变量值 8.工业企业的职工人数、职工工资是(D)。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 9.统计工作的成果是(C)。 A.统计学 B.统计工作 C.统计资料 D.统计分析和预测 10.统计学自身的发展,沿着两个不同的方向,形成(C)。 A.描述统计学与理论统计学 B.理论统计学与推断统计学 C.理论统计学与应用统计学 D.描述统计学与推断统计学

统计学期末考试试题(含答案)

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是( C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有( B)个变量 A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意 D盲目 7.总体标准差未知时总体均值的假设检验要用到( A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、 1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括( ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有( BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有( ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中( BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位 D、每台设备是调查单位 E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有( ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错) 5、区间估计就是直接用样本统计量代表总体参数。(错) 6、在假设检验中,方差已知的正态总体均值的检验要计算Z统计量。(错)

《统计学》计算题型与参考答案

《统计学》计算题型 (第二章)1.某车间40名工人完成生产计划百分数(%)资料如下:9065 100 102 100 104 112 120 124 98 110110 120 120 114 100 109 119 123 107 110 99 132 135 107 107 109 102 102 101 110 109 107 103 103 102 102 102 104 104 要求: (1)编制分配数列;(4分) (2)指出分组标志及其类型;(4分) (3)对该车间工人的生产情况进行分析。(2分) 解答: (1)

(2)分组标志:生产计划完成程度 类型:数量标志 (3)从分配数列可以看出,该计划未能完成计划的有4人,占10%,超额完成计划在10%以内的有22人,占55%,超额20%完成的有7人,占17.5%。反映该车间,该计划完成较好。 (第三章)2.2005年9份甲、乙两农贸市场某农产品价格和成交量、成交额资料如下: 试问哪一个农贸市场农产品的平均价格较高?(8分)并分析说明原因。(2分) 解答: (1)x 甲=∑∑m x m 1=24 8.41 6.36.314.24.21246.34.2?+?+?++=30/7=4.29(元) x 乙= ∑∑f xf = 1 241 8.426.344.2++?+?+?=21.6/7=3.09(元) (2)原因分析:甲市场在价格最高的C 品种成交量最高,而乙市场是在最低的价格A 品种成交量最高,根据权数越大其对应的变量值对平均数的作用越大的原理,可知甲市场平均价格趋近于C ,而乙市场平均价格却趋近于A ,所以甲市场平均价格高于乙市场平均价格。

统计学课程作业及答案2

统计学作业2 单项选择题 第1题某地区有10万人口,共有80个医院。平均每个医院要服务1250人,这个指标是()。 A、平均指标 B、强度相对指标 C、总量指标 D、发展水平指标 答案:B 第2题某企业2002年工业总产值比1992年增长了3倍,则该公司1992-2002年间工业总产值平均增长速度为() A、11.61% B、14.87% C、13.43% D、16.65% 答案:A 第3题某工业企业的某种产品成本,第一季度是连续下降的。1月份产量750件,单位成本20元;2月份产量1000件,单位成本18元;3月份产量1500件,单位成本15元。则第一季度的平均成本为()。 A、17.67 B、17.54 C、17.08 D、16.83 答案:C 第4题已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应该采用()。 A、简单算术平均数 B、加权算术平均数 C、加权调和平均数 D、几何平均数 答案:C

第5题如果分配数列把频数换成频率,那么方差()。 A、不变 B、增大 C、减小 D、无法预期变化 答案:A 第6题某厂5年的销售收入如下:200万、220万、250万、300万、320万,则平均增长量为()。 A、120/5 B、120/4 C、320/200的开5次方 D、320/200的开4次方 答案:B 第7题直接反映总体规模大小的指标是()。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 答案:C 第8题计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 答案:C 多项选择题 第9题下列统计指标属于总量指标的是()。 A、工资总额

统计学计算题例题学习资料

统计学计算题例题

第四章 1. 某企业1982年12月工人工资的资料如下: 要求:(1)计算平均工资;(79元) (2)用简捷法计算平均工资。 2. 某企业劳动生产率1995年比1990年增长7%,超额完成计划2%,试确定劳动生产率计划增长数。 7%-2%=5% 3. 某厂按计划规定,第一季度的单位产品成本比去年同期降低8%。实际 执行结果,单位产品成本较去年同期降低4%。问该厂第一季度产品单位成本计划的完成程度如何?104.35%( (1-4%)/(1-8%)*100%=96%/92%*100%=104.35%结果表明:超额完成4.35%(104.35%-100%)) 4. 某公社农户年收入额的分组资料如下:

要求:试确定其中位数及众数。中位数为774.3(元)众数为755.9(元) 求中位数: 先求比例:(1500-720)/(1770-720)=0.74286 分割中位数组的组距:(800-700)*0.74286=74.286 加下限700+74.286=774.286 求众数: D1=1050-480=570 D2=1050-600=450 求比例:d1/(d1+d2)=570/(570+450)=0.55882 分割众数组的组距:0.55882*(800-700)=55.882 加下限:700+55.882=755.882 5.1996年某月份某企业按工人劳动生产率高底分组的生产班组数和产量资料如 下: 率。64.43(件/人)

(55*300+65*200+75*140+85*60)/(300+200+140+60) 6.某地区家庭按人均月收入水平分组资料如下: 根据表中资料计算中位数和众数。中位数为733.33(元) 众数为711.11(元) 求中位数: 先求比例:(50-20)/(65-20)=0.6667 分割中位数组的组距:(800-600)*0.6667=66.67 加下限:600+66.67=666.67 7.某企业产值计划完成 103%,比去年增长5%。试问计划规定比去年增长 多少?1.94% (上年实际完成1.03/1.05=0.981 本年实际计划比上年增长 (1-0.981)/0.981=0.019/0.981=1.937%) 8.甲、乙两单位工人的生产资料如下:

统计学练习题及答案

2014统计学练习题及答案 一判断题 1、某企业全部职工的劳动生产率计划在去年的基础上提高8%,计划执行结果仅提高4%,则劳动生产率的任务仅实现一半。(错) 2、在统计调查中,调查标志的承担者是调查单位。( 错) 3、制定调查方案的首要问题是确定调查对象。( 错) 4、正相关指的就是因素标志和结果标志的数量变动方向都是上升的。( 错) 5、现象之间的函数关系可以用一个数学表达式反映出来。(对) 6.上升或下降趋势的时间序列,季节比率大于1,表明在不考虑其他因素影响时,由于季.的影响使实际值高于趋势值,(对) 7.特点是“先对比,后综合。”(错 8.隔相等的时点数列计算平均发展水平时,应用首尾折半的方法。( 错) 9.均数指数的计算特点是:先计算所研究对象各个项目的个体指数;然后将个体指数进行加权平均求得总指数。( 错) 10.和样本指标均为随机变量。( 错) 11.距数列中,组数等于数量标志所包含的变量值的个数。(对) 12.中值是各组上限和下限之中点数值,故在任何情况下它都能代表各组的一般水平。( 错) 13.标志和数量标志都可以用数值表示,所以两者反映的内容是相同的。(错) 14.变异度指标越大,均衡性也越好。( 对) 15.于资料的限制,使综合指数的计算产生困难,就需要采用综合指数的变形公式平均数指数。( 错) 16.计量是随机变量。(对) 17.数虽然未知,但却具有唯一性。(错) 18.标和数量标志都可以用数值表示,所以两者反映的内容是相同的(错) 19.以经常进行,所以它属于经常性调查(错) 20.样本均值来估计总体均值,最主要的原因是样本均值是可知的。()答案未 21.工业普查中,全国工业企业数是统计总体,每个工业企业是个体。(错) 22.标志的承担者,标志是依附于个体的。(对) 23.志表明个体属性方面的特征,其标志表现只能用文字来表现,所以品质标志不能转化为统计指标。(错) 24.标和数量标志都可以用数值表示,所以两者反映的内容是相同的。(错) 25.计指标都是用数值表示的,所以数量标志就是统计指标。(错) 26.标及其数值可以作为总体。(错) 27.润这一标志可以用定比尺度来测定。(错) 28.统计学考试成绩分别为55分,78分,82分,96分,这4个数字是数量指标。(错) 29.术学派注重对事物性质的解释,而国势学派注重数量分析。(错) 30.是统计研究现象总体数量的前提。(对) 31.析中,平均发展速度的计算方法分水平法和方程两种。(错) 32.数值越大,说明相关程度越高:同理,相关系数的数值越小,说明相关程度越低(对 33.志是总体同质性特征的条件,而不变标志是总体差异性特征的条件。(错) 34.度具有另外三种尺度的功能。(对) 35.民旅游意向的问卷中,“你最主要的休闲方式是什么?”,这一问题应归属于事实性问题

教育统计学课后练习参考答案

教育统计学课后练习参考答案 第一章 1、教育统计学,就是应用数理统计学的一般原理和方法,对教育调查和教育实验等途径所获得的数据资料进行整理、分析,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。 教育统计学既是统计科学中的一个分支学科,又是教育科学中的一个分支学科,是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看,教育统计学属于教育科学体系的一个方法论分支;从学科性质来看,教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理,计算出简单明白的统计量数来描述庞大的资料,以显示其分布特征的统计方法。 推断统计又叫分析统计,它根据统计学的原理和方法,从我们所研究的全体对象(即总体)中,按照等可能性原则采取随机抽样的方法,抽出总体中具有代表性的部分个体组成样本,在样本所提供的数据的基础上,运用概率理论进行分析、论证,在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,这类现象称为随机现象。 随机现象具的特点: (1)一次条件完全相同的实验有多种可能的结果(这样的实验称为随机实验); (2)在实验之前不能确切知道哪种结果会发生; (3)在相同的条件下可以重复进行这样的实验。 4、总体,也叫做母体或全域,是指具有某种共同特征的个体的总和。 当所研究的总体数量非常大时,可以从总体中抽取其中一部分个体来观测,由此来推断总体的信息,从总体中抽出的这部分个体就称为样本,它是用以表征总体的个体的集合。 通常将样本中样本个数大于或等于30个的样本称为大样本,小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后,仍放回原总体,然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数,简称参数。反映样本特征的量数叫做样本统计量,简称统计量。 参数是总体的真正数值,是固定的常量,理论上应该通过计算总体中全部个体的数值而获得,但由于总体中个体的数量通常很大,总体参数往往很难获得,在统计分析中一般通过样本的数值来估计。在进行推断统计时,就是根据样本统计量来推断总体相应的参数。 第二章 1、按照数据的来源,可分为计数数据和度量数据;按照数据的取值情况,可分为间断性数据和连续性数据;按照数据的测量水平,可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了;表的层次要清晰;主谓分明。 4、连续性数据:(2),(3);间断性数据:(1),(4)。 5、略 6、(1)50;(2)75;(3)34;(4)5;(5)45

统计学计算习题

第四章 六、计算题 月工资(元) 甲单位人数(人) 乙单位人数比重(%) 400以下 400~600 600~800 800~1000 1000以上 4 25 84 126 28 2 8 30 42 18 合 计 267 100 工资更具有代表性。 1、(1) 430025500267 x f x f ?+?+ == = ∑∑甲工资总额 总人数 3002%5008%7003%f x x f =? =?+?+?+ ∑∑乙 (2) 计算变异系数比较 ()2 x x f f σ-=∑∑甲甲 甲甲 () 2 x x f f σ-∑∑乙乙 乙乙 V x σσ= 甲 甲 甲 V x σσ= 乙乙乙 根据V σ甲 、V σ乙 大小判断,数值越大,代表性越小。 甲品种 乙品种 田块面积(亩) 产量(公斤) 田块面积(亩) 产量(公斤) 1.2 0.8 1.5 1.3 600 405 725 700 1.0 1.3 0.7 1.5 500 675 375 700 4.8 2430 4.5 2250 假定生产条件相同,试研究这两个品种的收获率,确定那一个品种具有稳定性和推广价值。 2、(1) 收获率(平均亩产) 2430 528.254.8 x = ==甲总产量总面积 2250 5004.5 x = =乙 (2) 稳定性推广价值(求变异指标) 2 2 2 2 600405725700506 1.25060.8506 1.5506 1.31.20.8 1.5 1.34.8 σ???????? -?+-?+-?+-? ? ? ? ?? ???????=甲

2 2 2 2 500675375700500 1.0500 1.35000.7500 1.51.0 1.30.7 1.54.5 σ???????? -?+-?+-?+-? ? ? ? ?? ???????=乙 求V σ甲 、V σ乙 ,据此判断。 8.某地20个商店,1994年第四季度的统计资料如下表4-6。 表4-6 按商品销售计划完成情 况分组(%) 商店 数目 实际商品销售额 (万元) 流通费用率 (%) 80-90 90-100 100-110 110-120 3 4 8 5 45.9 68.4 34.4 94.3 14.8 13.2 12.0 11.0 试计算 (1)该地20个商店平均完成销售计划指标 (2)该地20个商店总的流通费用率 (提示:流通费用率=流通费用/实际销售额) 8、(1) () 101%1 % f f x = = =?∑∑ 20实际销售额计划销售额 实际销售额 计划完成 (2) 据提示计算:2012.7%x = 品 种 价格 (元/公斤) 销售额(万元) 甲市场 乙市场 甲 乙 丙 0.30 0.32 0.36 75.0 40.0 45.0 37.5 80.0 45.0 13、提示:= 销售额 平均价格销售量 企业序号 计划产量(件) 计划完成程度(%) 实际一级品率 (%) 1 2 3 4 5 350 500 450 400 470 102 105 110 97 100 98 96 90 85 91

应用统计学试题及答案

北京工业大学经济与管理学院2007-2008年度 第一学期期末应用统计学 主考教师 专业:学号:姓名:成绩: 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一.单选题(每题2分,共20分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设 备 2.一组数据的均值为20, 离散系数为, 则该组数据的标准差为 A 50 B 8 C D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为

A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053- 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –% C. –% D. % 6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -表示 A. 时间每增加一个单位,产品成本平均增加个单位 B. 时间每增加一个单位,产品成本平均下降个单位 C. 产品成本每变动一个单位,平均需要年时间 D. 时间每减少一个单位,产品成本平均下降个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公

斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x=70件,σ=件乙车间: x=90件, σ=件哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何

相关文档
最新文档