统计学：在经济管理领域的应用曾五一朱平辉答案

思考与练习

第一章

1.1判断题：

(1)错、(2)错、(3)错、(4)对、(5)错、(6)错、(7)错、(8)对

1.2 答：民族是定类尺度数据；教育程度是定序尺度数据；人口数、信教人数、进出口总额是定距尺度数据；经济增长率是定比尺度数据。

1.3选择题：

(1)社会经济统计学的研究对象是：

(2)属于不变标志的有:（ A ）

属于数量标志的有：（ B、C ）

(3)A

1.4 答：例如考察全国人口的情况，全国所有的人为统计总体，而每个人就是总体单位。每个人都有许多属性和特征，比如民族、性别、文化程度、年龄、身高、体重等，这些就是标志。其中，性别、民族和文化程度是品质标志，年龄、身高、体重等则是数量标志；而指标是说明统计总体数量特征的，用以说明全国人口的规模如人口总数等指标就是数量指标，而用以说明全国人口某一方面相对水平的相对量指标和平均量指标如死亡率、出生率等指标就是质量指标，质量指标通常是在数量指标的派生指标。

1.5（略）

第二章

2．1：（略）

2．2：（1）B （2）D （3）C

020

100

居民户累计（%）

月收入（金融资产）累计（%）

茎叶图：茎叶

8 9

9 直方图、折线图与曲线图:

由上图可以看出，工人完成个人生产定额属于钟形分布。累计曲线图:

010********

100

110

120

130

140

150

160

生产定额

累计频数

020*********累计频率

第三章

3．1（略） 3．2 （1）B ；（2）B 、C ；（3）A 、C ；；（4）C 。 3．3 13.7元/件

3．4解：)(.x m m x 元甲3751=∑∑= )(.f xf

x 元乙3251=∑∑= 3．5

解：（1）平均利率=

%.%

%%%%8155

2418151210=++++

存款额=（元）1790815510001000=??+%.

（2）平均利率=

%......697151524118115112111=-????

存款额=（元））（207356971511000=+?

3．6解： =-=?????

? ?

?∑-∑===22

221004*********)(n

x n x n i i

i i

σ0.5275

=σ0.7263

3．7：偏度06190.-=α

；峰度59930.-=β

3．8解： 358149946345499.x ..x ====乙乙甲甲，；，σσ；甲品种更有推广价值。

3．9：（1）平均为24.71厘米；（2）众数24.86厘米，中位数24.96厘米；（3）极差24厘米，平均差4.45厘米，标准差5.42厘米。

3．10解：优秀率%..%p 713512750152===σσ

合格率%.%

p 30090902===σσ

第四章

4．1（1）C ；（2）A ；（3）C ；（4）C

4．2（1）A 、B 、C 、D （2）A 、B 、C 、E （3）A 、B 、C 、E

4．3（1）pr.=0.3;(2) pr.= 0.466667 4．4 pr.= 0.872

4．5（1） pr.=0.19705;(2)pr.=0.00035

4．6设三个车间分别记为A1、A2、A3，是次品记为B 。则有：

p(A1)=25% P(B|A1)=5% p(A1|B)=0.362319 p(A2)=35% p(B|A2)=4% p(A2|B)=0.405797 p(A3)=40% p(B|A3)=2% p(A3|B)=0.231884

与p(A1|B)、p(A3|B)比，p(A2|B)最大，来自乙车间的可能性最大。

第五章

5.1 (1)ABCDE ；(2)ABDE;(3)C; (4)B

5.2答：因为类型抽样的样本平均数标准差与组间方差无关，决定于组内方差的平均水平；整群抽样的样本平均数标准差与组内方差无关，决定于组间方差大小。所以类型抽样在分组时应尽量提高组间方差，降低组内方差，具体来说，就是使类型抽样的各部分内部单位差异尽可能地小，不同类型间的差异尽可能地大。而整群抽样在分组时为了降低样本平均数标准差，应该设法降低群间方差，可通过提高群内方差方法达到降低群间方差目的。因此，类型抽样与整群抽样对总体进行分组的要求刚好是相反的。

5.3 由于()

μ=X E ，样本均值的期望与总值差异为0，样本平均数是总体均值的无偏估计。样本平均数的标准差反映这个无偏估计量本身的波动程度，这个标准差越小，估计量的代表性越强，产生较大偏误的可能性越小；标准差越大，估计量的代表性越差，产生较大偏误的可能性越大。因此，抽样平均数的标准差从整体上反映估计的误差大小，成为该抽样的误差指标。从这个意义上我们建立起平均数与总体均值的内在联系，应用中就是利用样本平均数估计总体平均数的这种内在联系，通过样本平均数去估计总体平均数。

5.4答：

.)(F .)x (P 275222150610=-=≥

%.).(F )x (P 6581331600560==<≤

5.5设这家灯泡制造商的灯泡的寿命为x ，则)120,700(~2

N x 。

从而：)10,700(~2

N x ，不再购买意味着样本平均数小于等于680小

时。所求概率Pr. =)2()10

700

68010700(

)680(-≤=-≤-=≤z P x P x P =0.02275

第六章

6．1 (1) D ；(2) A ;(3) B ; (4) B 6．2（1）A 、C 、D 、E

（2）A 、C 、E （3）A 、B 、C 6．3

(1) N=1500,n=50，样本平均数=560，样本标准差=32.77629806。

由于总体标准差未知，可使用样本标准差替代。则重复抽样标准差： ()

4.63550

77629806

.32==

≈

S n

X x σσ。

(2) 由题意得0455.0=α，2

αz =2，月平均工资560=X 。所以[]

X x X X σσμ2,2+-∈=[494.45, 625.55 ] 6．4

(1)已知X =4小时，n =100，σ=1.5小时，α=5%。96.1025.02

==z z α

由于样本容量在地区居民人数中所占的比重太小，重复与不重复抽样效果相差不大，按重复抽样计算，区间估计是：

29.04100

.196.142

±=?

±=±n

z X σ

因此，95%置信度估计该地区内居民每天看电视的平均时间在 3.71到4.29个小时之间。

（2）要求极限误差等于27分钟，即Δ=0.45小时。这时概率度：

3100

.145

.0==?

z σ

查表知置信度=99.73% 6.5

(1)合格品率：P=190/200?100%=95%

抽样平均误差：n

p p p )

1()(-=δ=0.015 (2)

]

19601840[]2000%982000%92[%]

98%92[%3%95%100015.02%95)(2

2/02275.02/，，：合格品数量的置信区为，：合格品率的置信区间为=??±=??±=±==p Z P Z Z δαα

(3)

64.87)(8764.01,54.1%31.2%100015.0%

31.2)(2/2/2/==-==??==?z F Z Z p Z αδααα查表得

6．6

（1）学生身高的区间估计[169，175.1]（cm ） (2) 学生身高的区间估计[169.28，175.38]（cm ）

第七章

7.1(1) B ; (2) B; (3) C; (4) C 7.2(1)A 、B 、D (2) A 、C 、D 、E 7．3

800:,800:0100≠=μμH H (双侧检验)。

检验统计量n

x t /0

σμ-=

。

查出α＝0.05和0.01两个水平下的临界值(df=n-1=15)为2.131和

2.947。

667.116

/60800

820=-=

t 。因为t <2.131<2.947，所以在两个水平下都接

受原假设。 7.4

假设检验为10000:,10000:10>=μμH H （右侧检验）。 n=100可近似采用正态分布的检验统计量n

x z /0

σμ-=

。查出α＝0.01

水平下的反查正态概率表得到临界值2.34到2.36之间（因为表中给出的是双侧检验的接受域临界值，因此本题的单侧检验显著性水平应先乘以2，再查到对应的临界值）。计算统计量值3100

/50010000

10150=-=

z 。因为

z=3>2.36(>2.34)，所以拒绝原假设，认为彩电无故障时间有显著增加。 7.5

（1）3200:,3200:10>=μμH H （右侧检验）。

3300=X ，s=450，n=50>30，作大样本处理，检验统计量n

s x z /0μ-=

。α

＝0.05，αz =1.65。计算统计量值50

/45032003300-=z =1.571348。因为z<αz ，

所以样本没有显示新生儿体重有显著增加。

（2）p 值＝1-P （z< 1.571348）=1-0.941949=0.05805>α=0.05. 接受原假设，样本证据显示新生儿体重没有显著增加。 7．6

01:12,:12H H μμ=≠

当

为真时，选择检验统计量

(0,1)

X U N =

查表，0.97512

1.96u

u α-

4.69 1.96u =

==>

因此，在0.05的显著性水平下，可以拒绝原假设，认为平均加油量并

非12加仑。

(2)计算(1)的p -值。解答：检验的p 值为

{ 4.69}2[1(4.69)]2(10.999998699)20.00000130.00000

P u φ>=-=-=?=

由于 p α>，所以拒绝原假设。

(3)以0.05的显著性水平来说，是否有证据说明少于20%的驾车者购买无铅汽油？

解答：

01:0.2,:0.2H p H p ≥<

p=0.19

当0H 为真时，选择p

p P

U μ-=

为统计量趋近于标准正态；

查表，在显著性水平为0.05的情况下，

10.95 1.64

u u α--=-=-

0.039p μ=

0.190.2

0.256 1.640.039

u -=

=->-

因此，在显著性水平为0.05的情况下，不能拒绝原假设，没有证据说明少于20%的驾车者购买无铅汽油。

(4)计算(3)的p -值。

解答：检验的p 值为{0.256}(0.256)P u φ<-=-=0.4 由于 p α<，所以不能拒绝原假设。

(5)在加油量服从正态分布假设下，若样本容量为25，计算(1)和(2)。解答：

01:12,:12H H μμ=≠

当

为真时，选择检验统计量

(0,1)

X U N =

查表，0.97512

1.96u

u α-

2.34 1.96u =

==>

因此，在0.05的显著性水平下，可以拒绝原假设，认为平均加油量并

非12加仑。

并且，检验的p 值为

{ 2.34}2[1(2.34)]2(10.9904)20.00960.0192

P u φ>=-=-=?=

由于 p α>，所以拒绝原假设。 7.7

解：假设检验为%40:%,40:10<=p H p H 。采用成数检验统计量

100

()n

p p p

P z /1--=

。查出α＝0.05水平下的临界值为1.64和1.65之间。计

算统计量值()-0.577200

/4.014.040

.038.0≈--=

z ， z ＝-0.577>-1.64，所以接

受原假设。单侧检验的p 值为0.48和0.476之间。显然p 值>0.05，所以接受原假设。 7.8

解：05038200

200400

.%,P ,n %,===

==αρ %:H %,:H 404010<≥ρρ

5801000

)

(P z -==--=

ρρρ

6451.z -=α，0H 接受,z z α>

7.9 解：

n+个数＝6 n-个数＝ 4 n 个数＝10 临界值＝9 因为6<9，所以认为南段和北段含铁量无显著差异。 7.10

101

102

103

由表可知，Z=1.97575>1.96，且p 值=0.048<0.05，所以可以拒绝原假设。 7.11

解：因为A (8个)，AA(4个)，AAA(2个)，AAAAA(1个)，B(7个)，BB(6个)，BBBB(1个)。n1=27，n2=23。假设检验H 0:样本为随机样本，H 1:样本为

非随机样本。求出游程总和。R 1=15，R 2

=14，R=29。

因为()84.25150

272122121=+??=++=

n n n n R E ，

()()()

()() 3.4761505050502327223272122212

21212121≈-??-????=-++--=

n n n n n n n n n n σ

构造统计量()

909.0476

.384

.2529≈-=

R E R z 。

由于α=0.05的临界值为1.96， z=0.909<1.96，所以接受原假设。 7.12

解：0H ：2

1σσ=，1H ：2

1σσ≠；检验统计量是：

)24,25(~22

1F S S F =

F= 5.285714，相应=2

αF 2.257412。拒绝0H ，认为两总体方差差异显著。

资深人员的作用相对稳定，管理人员存在较大差别（结合所了解资料进一步阐述）。 7.13

104

解：0H ：性别与偏好不相关；1H ：性别与偏好相关。

2 =6.12，p-值= 0.04683<0.05。拒绝原假设，认为性别与偏好相关。

第八章

8.1(1)D 、(2)B 、(3)A 8．2(1)A 、B 、C 、D 、E

(2)A 、B 、C 、D

8.3 离差平方和分解是：SST=SSA+SSB+SSAB+SSE 。

相对应于SST 、SSA 、SSB 、SSAB 和SSE 的自由度分别是rnm-1、r-1、n-1、(r-1)(n-1)和rn(m-1)。 8.4

解：方差分析表：

差异源 SS

F P-value

F crit

组间 2678.25 3 892.75 6.172861 0.008819 3.4903

组内 1735.5 12 144.625 总计 4413.75 15

由于P 值=0.008819<0.05,所以肥料对农作物的收获量有显著的作用。

8.5

方差分析表：

差异源 SS

P-value

F crit

组间 127.1022 2 63.55111 3.09084 0.11949 5.143249 组内 123.3667 6 20.56111 总计 250.4689 8

由于p 值=0.11949>0.05,所以品种检验对产量没有显著影响。

105

8.6方差分析表：

差异源 SS

P-value

F crit

行（地区） 191.0667 4 47.76667 1.7019 0.241868 3.837854 列(包装) 74.13333 2 37.06667 1.320665 0.31943 4.458968 误差 224.5333 8 28.06667

总计 489.7333 14

由于行(地区)因素的p 值=0.241868>0.05,所以地区对销售量也没有显

著影响。同理，列(包装)因素的p 值=0.31943>0.05，所以，包装对销售量没有显著影响。 8.7

方差分析差异源SS df

MS F P-value F crit

行10.5333325.2666670.0923710.912725 4.45897列161.0667440.266670.7062260.6096963.837853误差456.1333857.01667总计

627.7333

上表中列是工人，行是设备。从P-value 可知，无论是工人还是设备对产量都没有显著影响。

第九章

9.1

（1）BCD;(2)C;(3)C;(4)ABD

9.2 证明：

教材中已经证明2

?β是现行无偏估计量。此处只要证明它在线性无偏估计量中具有最小方差。设∑=t

t Y a 2~β为2β的任意线性无偏估计量。

106

21212)()()~

(ββββββ=++=++=∑∑∑∑t t t t t t t t u E a X a a u X E a E 也即，作为2β的任意线性无偏估计量，必须满足下列约束条件：

∑=0t

；且∑=1t t X a

又因为2

var σ=t Y ，所以：

∑∑∑===2

222var var )~var(t t t t t a Y a Y a σβ ∑∑∑∑∑∑∑∑∑∑∑∑∑-+---

=-----+--+---=--+---

222

222222

222

2)(1

])

([])(][)([2])([)(])([])

()([X X X X X

X a X X X

X X X X X a X X X X X X X X a X X X

X X X X

X a t t t t t

t t t t t t t t t t t t t t σσσσσσ 分析此式：由于第二项∑-2

)

(1X X t σ是常数，所以)~

var(2β只能通

过第一项∑∑---

])

([X X X

X a

t t t

σ的处理使之最小化。明显，只有当 ∑--=2

)

(X X X X a t t t 时，)~var(2β才可以取最小值，即： )?var()

(1)~

var(min 22

2βσβ=-=∑X X t 所以，2?β是总体回归系数2

β的最优线性无偏估计量.

9.3 解：

107

（1）7863.073.42505309.334229)

())((?2

==---=∑∑X X X X Y Y t

t t

3720.4088.647*7863.08.549??2

1=-=-=X Y ββ 因此，X Y 7863.03720.40+=，其中，0.7863为边际成本，表示销售

收入每增加一个单位，销售成本平均增加0.7863单位。40.3720为固定销售成本，表示当没有销售收入的情况下仍要花费的销售成本。

（2）∑∑∑----=

)

()(]))(([

Y Y X X X X Y Y r t

999834.025

.262855*73.42505309.3342292

又

6340.43)()1(222

=--=∑∑Y Y r e

，可得

回归误差标准差0889.22

=-=∑n e S t

（3）003204.073

.4250530889

.2)(2

∑X X

S S t

4120.245003204

.07863

.0?2

2?==

βββS t

查ｔ分布表可知：显著水平为５％，自由度为10的双侧ｔ检验的临界值是 2.228。以上计算的ｔ值远远大于此临界值,所以拒绝原假设,接受备择假设，即认为销售收入对销售成本的影响是非常显著的。（4）把X =800代入模型，得

41.6998007863.01212.42=?+=Y （万元） ef S =∑--+

()(1X X

X X S t

f n

108

=73

.425053)88.647800(12110889.22

+? =2.2282

查ｔ分布表可知：显著水平为５％，自由度为10的双侧ｔ检验的临界值是2.228。因此，当销售收入为800万元时，置信度为95 ％的销售成本的预测区间如下：

669.41-2.228×2.2282≤Ｙf ≤669.41+2.228×2.2282 即664.45（万元）≤Ｙf ≤674.37（万元）

9.4 解：

(1) 0273.0)472(28158954.1347202.8039)

x (x n y x xy n

=-??-?=-?-=∑∑∑∑∑β,

0727.09

4720273.0913.54x ?y ?2

1=?-=-=ββ Y=0.0727+0.0273x (2)

∑∑∑∑--=xy ?y ?y

e 2

ββ

=?-?-=02.8030273.054.130727.09788.220.071996

9724.0(13.54)-22.978890.071996

91)

y -(y e

=??-

=∑∑

（3）相关系数 9861.09724.0r == ｔ＝

=-?=

--9724

.0179861.0122

n r 15.7044≥2.365

所以，拒绝原假设。可以得出身高与体重存在显著相关关系的结论。

(4) 010285.07

071996

.02

-n e S 2

∑

应用统计学试题及答案解析

6．对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= －1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位 B. 时间每增加一个单位,产品成本平均下降1.75个单位 C. 产品成本每变动一个单位,平均需要1.75年时间 D. 时间每减少一个单位,产品成本平均下降1.75个单位 7．某乡播种早稻5000亩，其中20％使用改良品种，亩产为600 公斤，其余亩产为500 公斤，则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x =70件,σ=5.6件乙车间: x =90件, σ=6.3件哪个车间日加工零件的离散程度较大: A 甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间

应用统计学试题及答案

应用统计学试题及答案 LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】

二、单项选择题（每题1分，共10分） 1．重点调查中的重点单位是指( ) A.处于较好状态的单位 B.体现当前工作重点的单位 C.规模较大的单位 D.在所要调查的数量特征上占有较大比重的单位 2．根据分组数据计算均值时，利用各组数据的组中值做为代表值，使用这一代表值的假定条件是（）。 A．各组的权数必须相等 B．各组的组中值必须相等 C．各组数据在各组中均匀分布 D．各组的组中值都能取整数值 3．已知甲、乙两班学生统计学考试成绩：甲班平均分为70分，标准差为分；乙班平均分为75分，标准差为分。由此可知两个班考试成绩的离散程度（） A.甲班较大 B.乙班较大 C.两班相同 D.无法作比较 4．某乡播种早稻5000亩，其中20%使用改良品种，亩产为600公斤，其余亩产为500公斤，则该乡全部早稻平均亩产为（）公斤公斤公斤公斤 5．时间序列若无季节变动，则其各月（季）季节指数应为（） A.100% % % % 6．用最小平方法给时间数列配合直线趋势方程y=a+bt，当b＜0时，说明现象的发展趋势是（） A.上升趋势 B.下降趋势 C.水平态势 D.不能确定 7．某地区今年和去年相比商品零售价格提高12%，则用同样多的货币今年比去年少购买（）的商品。 8．置信概率表达了区间估计的（） A.精确性 B.可靠性 C.显着性 D.规范性 9．H 0:μ=μ ，选用Z统计量进行检验，接受原假设H 的标准是（） A.|Z|≥Z α B.|Z|-Z α 10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下，你认为哪个回归方程可能是正确的（） A.y=125-10x =-50+8x =150-20x =-15-6x 三、多项选择题（每题2分，共10分） 1．抽样调查的特点有（）。 A．抽选调查单位时必须遵循随机原则 B．抽选出的单位有典型意义 C．抽选出的是重点单位 D．使用部分单位的指标数值去推断和估计总体的指标数值 E．通常会产生偶然的代表性误差，但这类误差事先可以控制或计算 2.某种产品单位成本计划比上年降低5%，实际降低了4%，则下列说法正确的是（） A.单位成本计划完成程度为80% B. 单位成本计划完成程度为% C.没完成单位成本计划 D.完成了单位成本计划 E.单位成本实际比计划少降低了1个百分点 3．数据离散程度的测度值中，不受极端数值影响的是（） A.极差 B.异众比率 C.四分位差 D.标准差 E.离散系数

应用统计学试题和答案分析

六、计算题：（要求写出计算公式、过程，结果保留两位小数，共4题，每题10分） 1、某快餐店对顾客的平均花费进行抽样调查，随机抽取了49名顾客构成一个简单随机样本，调查结果为：样本平均花费为元，标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间；（φ（2）=）49=n 是大样本，由中心极限定理知，样本均值的极限分布为正态分布，故可用正态分布对总体均值进行区间估计。已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据，得该快餐店顾客的总体平均花费数额%的置信区间为（，） 3 要求：①、利用最小二乘法求出估计的回归方程；②、计算判定系数R 。附：10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题解 ① 计算估计的回归方程： ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为：y ) =+x ② 计算判定系数： 4 计算下列指数：①拉氏加权产量指数；②帕氏单位成本总指数。 4题解： ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题（每小题1分，共10题） 1、我国人口普查的调查对象是，调查单位是。 2、___ 频数密度 =频数÷组距，它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用饼图条图图来显示。 4、某百货公司连续几天的销售额如下：257、276、297、252、238、310、240、236、265，则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元，2005年3季度完成的GDP=36亿元，则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%，职工人数增加了2%，则该企业工资总额增长了 % 。 7、对回归系数的显着性检验，通常采用的是 t 检验。 8、设置信水平=1-α，检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲＞σ乙，x 甲＞x 乙，由此可推断 ( )