统计学:在经济管理领域的应用 曾五一 朱平辉 答案
思考与练习
第一章
1.1判断题:
(1)错、(2)错、(3)错、(4)对、(5)错、(6)错、(7)错、(8)对
1.2 答:民族是定类尺度数据;教育程度是定序尺度数据;人口数、信教人数、进出口总额是定距尺度数据;经济增长率是定比尺度数据。
1.3选择题:
(1)社会经济统计学的研究对象是:
A.
(2)属于不变标志的有:( A )
属于数量标志的有:( B、C )
(3)A
1.4 答:例如考察全国人口的情况,全国所有的人为统计总体,而每个人就是总体单位。每个人都有许多属性和特征,比如民族、性别、文化程度、年龄、身高、体重等,这些就是标志。其中,性别、民族和文化程度是品质标志,年龄、身高、体重等则是数量标志;而指标是说明统计总体数量特征的,用以说明全国人口的规模如人口总数等指标就是数量指标,而用以说明全国人口某一方面相对水平的相对量指标和平均量指标如死亡率、出生率等指标就是质量指标,质量指标通常是在数量指标的派生指标。
1.5(略)
第二章
2.1:(略)
2.2:(1)B (2)D (3)C
89
90
020
40
60
80
100
20
40
60
80
100
居民户累计(%)
月收入(金融资产)累计(%)
茎叶图:茎叶
8 9
10
11
12
13
14
15
7
2
6
2
8
8
5
3
2
3
7
6
7
3
3
4
8
4
4
5
5
5
6
5
5
7
7
7
7
7
7
9
8
8
8
9
9 直方图、折线图与曲线图:
91
92
由上图可以看出,工人完成个人生产定额属于钟形分布。 累计曲线图:
010********
90
100
110
120
130
140
150
160
生产定额
累计频数
020*********累计频率
第三章
3.1(略) 3.2 (1)B ;(2)B 、C ;(3)A 、C ;;(4)C 。 3.3 13.7元/件
3.4解:)(.x m m x 元甲3751=∑∑= )(.f xf
x 元乙3251=∑∑= 3.5
解:(1)平均利率=
%.%
%%%%8155
2418151210=++++
存款额=(元)1790815510001000=??+%.
(2)平均利率=
%......697151524118115112111=-????
存款额=(元))(207356971511000=+?
%.
93
3.6解: =-=?????
? ?
?∑-∑===22
1
1
221004*********)(n
x n x n i i
n
i i
σ0.5275
=σ0.7263
3.7:偏度06190.-=α
;峰度59930.-=β
3.8解: 358149946345499.x ..x ====乙乙甲甲,;,σσ;甲品种更有推广价值。
3.9:(1)平均为24.71厘米;(2)众数24.86厘米,中位数24.96厘米;(3)极差24厘米,平均差4.45厘米,标准差5.42厘米。
3.10解: 优秀率%..%p 713512750152===σσ
合格率%.%
p 30090902===σσ
第四章
4.1(1)C ;(2)A ;(3)C ;(4)C
4.2(1)A 、B 、C 、D (2)A 、B 、C 、E (3)A 、B 、C 、E
4.3(1)pr.=0.3;(2) pr.= 0.466667 4.4 pr.= 0.872
4.5(1) pr.=0.19705;(2)pr.=0.00035
4.6设三个车间分别记为A1、A2、A3,是次品记为B 。 则有:
p(A1)=25% P(B|A1)=5% p(A1|B)=0.362319 p(A2)=35% p(B|A2)=4% p(A2|B)=0.405797 p(A3)=40% p(B|A3)=2% p(A3|B)=0.231884
与p(A1|B)、p(A3|B)比,p(A2|B)最大,来自乙车间的可能性最大。
第五章
94
5.1 (1)ABCDE ;(2)ABDE;(3)C; (4)B
5.2答:因为类型抽样的样本平均数标准差与组间方差无关,决定于组内方差的平均水平;整群抽样的样本平均数标准差与组内方差无关,决定于组间方差大小。所以类型抽样在分组时应尽量提高组间方差,降低组内方差,具体来说,就是使类型抽样的各部分内部单位差异尽可能地小,不同类型间的差异尽可能地大。而整群抽样在分组时为了降低样本平均数标准差,应该设法降低群间方差,可通过提高群内方差方法达到降低群间方差目的。因此,类型抽样与整群抽样对总体进行分组的要求刚好是相反的。
5.3 由于()
μ=X E ,样本均值的期望与总值差异为0,样本平均数是总体均值的无偏估计。样本平均数的标准差反映这个无偏估计量本身的波动程度,这个标准差越小,估计量的代表性越强,产生较大偏误的可能性越小;标准差越大,估计量的代表性越差,产生较大偏误的可能性越大。因此,抽样平均数的标准差从整体上反映估计的误差大小,成为该抽样的误差指标。从这个意义上我们建立起平均数与总体均值的内在联系,应用中就是利用样本平均数估计总体平均数的这种内在联系,通过样本平均数去估计总体平均数。
5.4答:
%
.)(F .)x (P 275222150610=-=≥
%.).(F )x (P 6581331600560==<≤
5.5设这家灯泡制造商的灯泡的寿命为x ,则)120,700(~2
N x 。
从而:)10,700(~2
N x ,不再购买意味着样本平均数小于等于680小
时。所求概率Pr. =)2()10
700
68010700(
)680(-≤=-≤-=≤z P x P x P =0.02275
95
第六章
6.1 (1) D ;(2) A ;(3) B ; (4) B 6.2(1)A 、C 、D 、E
(2)A 、C 、E (3)A 、B 、C 6.3
(1) N=1500,n=50,样本平均数=560,样本标准差=32.77629806。
由于总体标准差未知,可使用样本标准差替代。则重复抽样标准差 : ()
4.63550
77629806
.32==
≈
=
n
S n
X x σσ。
(2) 由题意得0455.0=α,2
αz =2,月平均工资560=X 。 所以[]
X x X X σσμ2,2+-∈=[494.45, 625.55 ] 6.4
(1)已知X =4小时,n =100,σ=1.5小时,α=5%。96.1025.02
==z z α
由于样本容量在地区居民人数中所占的比重太小,重复与不重复抽样效果相差不大,按重复抽样计算,区间估计是:
29.04100
5
.196.142
±=?
±=±n
z X σ
α
因此,95%置信度估计该地区内居民每天看电视的平均时间在 3.71到4.29个小时之间。
(2)要求极限误差等于27分钟,即Δ=0.45小时。这时概率度 :
3100
5
.145
.0==?
=
n
z σ
查表知置信度=99.73% 6.5
96
(1)合格品率:P=190/200?100%=95%
抽样平均误差:n
p p p )
1()(-=δ=0.015 (2)
]
19601840[]2000%982000%92[%]
98%92[%3%95%100015.02%95)(2
2/02275.02/,,:合格品数量的置信区为,:合格品率的置信区间为=??±=??±=±==p Z P Z Z δαα
(3)
%
64.87)(8764.01,54.1%31.2%100015.0%
31.2)(2/2/2/==-==??==?z F Z Z p Z αδααα查表得
6.6
(1)学生身高的区间估计[169,175.1](cm ) (2) 学生身高的区间估计[169.28,175.38](cm )
第七章
7.1(1) B ; (2) B; (3) C; (4) C 7.2(1)A 、B 、D (2) A 、C 、D 、E 7.3
800:,800:0100≠=μμH H (双侧检验)。
检验统计量n
x t /0
σμ-=
。
查出α=0.05和0.01两个水平下的临界值(df=n-1=15)为2.131和
97
2.947。
667.116
/60800
820=-=
t 。因为t <2.131<2.947,所以在两个水平下都接
受原假设。 7.4
假设检验为10000:,10000:10>=μμH H (右侧检验)。 n=100可近似采用正态分布的检验统计量n
x z /0
σμ-=
。查出α=0.01
水平下的反查正态概率表得到临界值2.34到2.36之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。计算统计量值3100
/50010000
10150=-=
z 。因为
z=3>2.36(>2.34),所以拒绝原假设,认为彩电无故障时间有显著增加。 7.5
(1)3200:,3200:10>=μμH H (右侧检验)。
3300=X ,s=450,n=50>30,作大样本处理,检验统计量n
s x z /0μ-=
。α
=0.05,αz =1.65。计算统计量值50
/45032003300-=z =1.571348。因为z<αz ,
所以样本没有显示新生儿体重有显著增加。
(2)p 值=1-P (z< 1.571348)=1-0.941949=0.05805>α=0.05. 接受原假设,样本证据显示新生儿体重没有显著增加。 7.6
01:12,:12H H μμ=≠
98
当
H
为真时,选择检验统计量
(0,1)
X U N =
查表,0.97512
1.96u
u α-
==
4.69 1.96u =
==>
因此,在0.05的显著性水平下,可以拒绝原假设,认为平均加油量并
非12加仑。
(2)计算(1)的p -值。 解答:检验的p 值为
{ 4.69}2[1(4.69)]2(10.999998699)20.00000130.00000
P u φ>=-=-=?=
由于 p α>,所以拒绝原假设。
(3)以0.05的显著性水平来说,是否有证据说明少于20%的驾车者购买无铅汽油?
解答:
01:0.2,:0.2H p H p ≥<
p=0.19
当0H 为真时,选择p
p P
U μ-=
为统计量趋近于标准正态;
查表,在显著性水平为0.05的情况下,
10.95 1.64
u u α--=-=-
0.039p μ=
==
99
0.190.2
0.256 1.640.039
u -=
=->-
因此,在显著性水平为0.05的情况下,不能拒绝原假设,没有证据说明少于20%的驾车者购买无铅汽油。
(4)计算(3)的p -值。
解答:检验的p 值为{0.256}(0.256)P u φ<-=-=0.4 由于 p α<,所以不能拒绝原假设。
(5)在加油量服从正态分布假设下,若样本容量为25,计算(1)和(2)。 解答:
01:12,:12H H μμ=≠
当
H
为真时,选择检验统计量
(0,1)
X U N =
查表,0.97512
1.96u
u α-
==
2.34 1.96u =
==>
因此,在0.05的显著性水平下,可以拒绝原假设,认为平均加油量并
非12加仑。
并且,检验的p 值为
{ 2.34}2[1(2.34)]2(10.9904)20.00960.0192
P u φ>=-=-=?=
由于 p α>,所以拒绝原假设。 7.7
解:假设检验为%40:%,40:10<=p H p H 。采用成数检验统计量
100
()n
p p p
P z /1--=
。查出α=0.05水平下的临界值为1.64和1.65之间。计
算统计量值()-0.577200
/4.014.040
.038.0≈--=
z , z =-0.577>-1.64,所以接
受原假设。单侧检验的p 值为0.48和0.476之间。显然p 值>0.05,所以接受原假设。 7.8
解:05038200
76
200400
.%,P ,n %,===
==αρ %:H %,:H 404010<≥ρρ
5801000
.n
)
(P z -==--=
ρρρ
6451.z -=α,0H 接受,z z α>
7.9 解:
n+个数=6 n-个数= 4 n 个数=10 临界值=9 因为6<9,所以认为南段和北段含铁量无显著差异。 7.10
101
102
103
由表可知,Z=1.97575>1.96,且p 值=0.048<0.05,所以可以拒绝原假设。 7.11
解: 因为A (8个),AA(4个),AAA(2个),AAAAA(1个),B(7个),BB(6个),BBBB(1个)。n1=27,n2=23。假设检验H 0:样本为随机样本,H 1:样本为
非随机样本。求出游程总和。R 1=15,R 2
=14,R=29。
因为()84.25150
23
272122121=+??=++=
n n n n R E ,
()()()
()() 3.4761505050502327223272122212
21212121≈-??-????=-++--=
n n n n n n n n n n σ
构造统计量()
909.0476
.384
.2529≈-=
-=
σ
R E R z 。
由于α=0.05的临界值为1.96, z=0.909<1.96,所以接受原假设。 7.12
解:0H :2
22
1σσ=,1H :2
22
1σσ≠; 检验统计量是:
)24,25(~22
2
1F S S F =
F= 5.285714,相应=2
αF 2.257412。拒绝0H ,认为两总体方差差异显著。
资深人员的作用相对稳定,管理人员存在较大差别(结合所了解资料进一步阐述)。 7.13
104
解:0H :性别与偏好不相关;1H :性别与偏好相关。
2 =6.12,p-值= 0.04683<0.05。拒绝原假设,认为性别与偏好相关。
第八章
8.1(1)D 、(2)B 、(3)A 8.2(1)A 、B 、C 、D 、E
(2)A 、B 、C 、D
8.3 离差平方和分解是:SST=SSA+SSB+SSAB+SSE 。
相对应于SST 、SSA 、SSB 、SSAB 和SSE 的自由度分别是rnm-1、r-1、n-1、(r-1)(n-1)和rn(m-1)。 8.4
解:方差分析表:
差异源 SS
df
MS
F P-value
F crit
组间 2678.25 3 892.75 6.172861 0.008819 3.4903
组内 1735.5 12 144.625 总计 4413.75 15
由于P 值=0.008819<0.05,所以肥料对农作物的收获量有显著的作用。
8.5
方差分析表:
差异源 SS
df
MS
F
P-value
F crit
组间 127.1022 2 63.55111 3.09084 0.11949 5.143249 组内 123.3667 6 20.56111 总计 250.4689 8
由于p 值=0.11949>0.05,所以品种检验对产量没有显著影响。
105
8.6方差分析表:
差异源 SS
df
MS
F
P-value
F crit
行(地区) 191.0667 4 47.76667 1.7019 0.241868 3.837854 列(包装) 74.13333 2 37.06667 1.320665 0.31943 4.458968 误差 224.5333 8 28.06667
总计 489.7333 14
由于行(地区)因素的p 值=0.241868>0.05,所以地区对销售量也没有显
著影响。同理,列(包装)因素的p 值=0.31943>0.05,所以,包装对销售量没有显著影响。 8.7
方差分析差异源SS df
MS F P-value F crit
行10.5333325.2666670.0923710.912725 4.45897列161.0667440.266670.7062260.6096963.837853误差456.1333857.01667总计
627.7333
14
上表中列是工人,行是设备。从P-value 可知,无论是工人还是设备对产量都没有显著影响。
第九章
9.1
(1)BCD;(2)C;(3)C;(4)ABD
9.2 证明:
教材中已经证明2
?β是现行无偏估计量。此处只要证明它在线性无偏估计量中具有最小方差。设∑=t
t Y a 2~β为2β的任意线性无偏估计量。
106
2
21212)()()~
(ββββββ=++=++=∑∑∑∑t t t t t t t t u E a X a a u X E a E 也即,作为2β的任意线性无偏估计量,必须满足下列约束条件:
∑=0t
a
;且∑=1t t X a
又因为2
var σ=t Y ,所以:
∑∑∑===2
222var var )~var(t t t t t a Y a Y a σβ ∑∑∑∑∑∑∑∑∑∑∑∑∑-+---
=-----+--+---=--+---
=2
222
22
222222
222
22
2
2)(1
])
([])(][)([2])([)(])([])
()([X X X X X
X a X X X
X X X X X a X X X X X X X X a X X X
X X X X
X a t t t t t
t t t t t t t t t t t t t t σσσσσσ 分析此式:由于第二项∑-2
2
)
(1X X t σ是常数,所以)~
var(2β只能通
过第一项∑∑---
22
2
])
([X X X
X a
t t t
σ的处理使之最小化。明显,只有当 ∑--=2
)
(X X X X a t t t 时,)~var(2β才可以取最小值,即: )?var()
(1)~
var(min 22
2
2βσβ=-=∑X X t 所以,2?β是总体回归系数2
β的最优线性无偏估计量.
9.3 解:
107
(1)7863.073.42505309.334229)
())((?2
2
==---=∑∑X X X X Y Y t
t t
β
3720.4088.647*7863.08.549??2
1=-=-=X Y ββ 因此,X Y 7863.03720.40+=,其中,0.7863为边际成本,表示销售
收入每增加一个单位,销售成本平均增加0.7863单位。40.3720为固定销售成本,表示当没有销售收入的情况下仍要花费的销售成本。
(2)∑∑∑----=
2
2
2
2
)
()(]))(([
Y Y X X X X Y Y r t
t
t
t
999834.025
.262855*73.42505309.3342292
==
又
6340.43)()1(222
=--=∑∑Y Y r e
t
,可得
回归误差标准差0889.22
2
=-=∑n e S t
e
(3)003204.073
.4250530889
.2)(2
?
2
==
-=
∑X X
S S t
e
β
4120.245003204
.07863
.0?2
2
?
2?==
=
βββS t
查t分布表可知:显著水平为5%,自由度为10的双侧t检验的临界值是 2.228。以上计算的t值远远大于此临界值,所以拒绝原假设,接受备择假设,即认为销售收入对销售成本的影响是非常显著的。 (4)把X =800代入模型,得
41.6998007863.01212.42=?+=Y (万元) ef S =∑--+
+
2
2
1)
()(1X X
X X S t
f n
108
=73
.425053)88.647800(12110889.22
-+
+? =2.2282
查t分布表可知:显著水平为5%,自由度为10的双侧t检验的临界值是2.228。因此,当销售收入为800万元时,置信度为95 %的销售成本的预测区间如下:
669.41-2.228×2.2282≤Yf ≤669.41+2.228×2.2282 即664.45(万元)≤Yf ≤674.37(万元)
9.4 解:
(1) 0273.0)472(28158954.1347202.8039)
x (x n y x xy n
?2
2
2
2
=-??-?=-?-=∑∑∑∑∑β,
0727.09
4720273.0913.54x ?y ?2
1=?-=-=ββ Y=0.0727+0.0273x (2)
∑∑∑∑--=xy ?y ?y
e 2
1
2
2
ββ
=?-?-=02.8030273.054.130727.09788.220.071996
9724.0(13.54)-22.978890.071996
91)
y -(y e
1r
2
2
2
2
=??-
=-
=∑∑
(3) 相关系数 9861.09724.0r == t=
=-?=
--9724
.0179861.0122
r
n r 15.7044≥2.365
所以,拒绝原假设。可以得出身高与体重存在显著相关关系的结论。
(4) 010285.07
071996
.02
-n e S 2
2
==
=
∑
应用统计学试题及答案解析
北京工业大学经济与管理学院2007-2008年度 第一学期期末 应用统计学 主考教师 专业: 学号: 姓名: 成绩: 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一.单选题(每题2分,共20分) 1. 在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2. 一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分 比为 A. –5% B. –4.76% C. –33.3% D. 3.85%
6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位 B. 时间每增加一个单位,产品成本平均下降1.75个单位 C. 产品成本每变动一个单位,平均需要1.75年时间 D. 时间每减少一个单位,产品成本平均下降1.75个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公 斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x =70件,σ=5.6件 乙车间: x =90件, σ=6.3件 哪个车间日加工零件的离散程度较大: A 甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间
应用统计学试题及答案
应用统计学试题及答案 LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】
二、单项选择题(每题1分,共10分) 1.重点调查中的重点单位是指( ) A.处于较好状态的单位 B.体现当前工作重点的单位 C.规模较大的单位 D.在所要调查的数量特征上占有较大比重的单位 2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。 A.各组的权数必须相等 B.各组的组中值必须相等 C.各组数据在各组中均匀分布 D.各组的组中值都能取整数值 3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为分;乙班平均分为75分,标准差为分。由此可知两个班考试成绩的离散程度() A.甲班较大 B.乙班较大 C.两班相同 D.无法作比较 4.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为() 公斤公斤公斤公斤 5.时间序列若无季节变动,则其各月(季)季节指数应为() A.100% % % % 6.用最小平方法给时间数列配合直线趋势方程y=a+bt,当b<0时,说明现象的发展趋势是() A.上升趋势 B.下降趋势 C.水平态势 D.不能确定 7.某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年少购买()的商品。 8.置信概率表达了区间估计的() A.精确性 B.可靠性 C.显着性 D.规范性 9.H 0:μ=μ ,选用Z统计量进行检验,接受原假设H 的标准是() A.|Z|≥Z α B.|Z|
应用统计学试题和答案分析
六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为元,标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区 间;(φ(2)=)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额%的置信区间为(,) 3 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 。 附:10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为:y ) =+x ② 计算判定系数: 4 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数
= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 % 。 7、对回归系数的显着性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲>σ乙,x 甲>x 乙,由此可推断 ( )
应用经济统计学SPSS分析报告
中国计量学院 应用经济统计学 基于SPSS的试卷命题质量评估与成绩分析
摘要:衡量教学质量的方法之一是对试卷及成绩进行科学、准确的评估。SPSS 统计软件能够对相关数据进行量化分析,得出更准确、严谨的结论,为教师改进教学手段、提高教学质量提供依据及科学指导。 关键词:SPSS;试卷评估;成绩分析 考试是一种最有效、最常见的测量学生学习成绩和检查教师教学效果的重要方法,也是筛选高质量试题的有效手段,通过对试卷分析,不但可以使教师发现教学中的薄弱环节,有助于对教学内容进行调整,对教学方法进行革新,对后续教学提出合理化的建议,而且有助于管理者掌握试卷的质量、教师的教学质量和学生的学习情况,从而有效地对教学加以监督和调整,提高教学水平和学生学习质量。鉴于目前多数教师凭借经验出题,不仅不能保证试卷应有的质量,不能全面客观地检测学生的学习效果,而且由于缺乏必要的简单统计知识,对考试结果不能做出正确的解释,致使考试结果中蕴藏的大量信息白白浪费。 SPSS (Statistical Product and Service Solutions)是世界上最早采用图形菜单驱动界面的统计软件,易于使用,能全面综合地阐述统计分析的全过程。它最突出的特点就是操作界面简单,输出结果美观。用户只要掌握一定的Windows 操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务。是非专业统计人员的首选统计软件。利用SPSS 进行试卷命题质量评估及成绩分析,能客观有效地对其进行评价,结果以统计表格及图形输出,使评价结果一目了然,方便教师的阅读及分析,以便寻求改进教学效果的手段。 本文以一次真实测试样本成绩为例,介绍利用SPSS11.5进行平均分﹑标准差﹑频数分布等相关因素与教学质量的关系的分析方法。 质量分析所用的测试数据来源于某市小学生二年级教学质量检测成绩,包括10所县镇小学和农村中心校,285名学生。通过研究,可以比较城镇和乡村学生的成绩差异情况,分析城乡差异以及教育公平问题,为教师改进教学提供建议。
应用统计学:参数估计习题及答案
简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公
顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下: 试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差
应用统计学试题和答案
《统计学》模拟试卷(一) 一、填空题(每空1分,共10分) 1、依据统计数据的收集方法不同,可将其分为____________数据和_____________数据。 2、收集的属于不同时间上的数据称为 数据。 3、设总体X 的方差为1,从总体中随机取容量为100的样本,得样本均值x =5,则总体均值的置信水平为99%的置 信区间_________________。(Z 0.005=2.58) 4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP 年度化增长率为 。 5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 ,中位数为 。 6、判定系数的取值围是 。 7、设总体X ~) ,(2 σμN ,x 为样本均值,S 为样本标准差。当σ未知,且为小样本时, 则n s x μ -服从自由度为n-1的___________________分布。 8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有 个。 二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号。每小题1分,共14分) 1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( ) ①、应用统计学 ②、描述统计学 ③、推断统计学 2、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数 ( ) ①、扩大2倍 ②、减少到1/3 ③、不变 3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31. 则最大艇速的均值 的无偏估计值为 ( ) ①、32.5 ②、33 ③、39.6 4、某地区粮食作物产量年平均发展速度:1998~2000年三年平均为1.03,2001~2002年两年平均为1.05,试确定1998~2002五年的年平均发展速度 ( ) 5、若两个变量的平均水平接近,平均差越大的变量,其 ( ) ①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高 6、对正态总体均值进行区间估计时,其它条件不变,置信水平α-1越小,则置信上限与置信下限的差( ) ①、越大 ②、越小 ③、不变 7、若某总体次数分布呈轻微左偏分布,则成立的有 ( ) ①、x > e M >o M ②、x
应用统计学练习题(含答案)
应用统计学练习题 第一章绪论 一、填空题 1.统计工作与统计学的关系是__统计实践____和___统计理论__的关系。 2.总体是由许多具有_共同性质_的个别事物组成的整体;总体单位是__总体_的组成单位。 3.统计单体具有3个基本特征,即__同质性_、__变异性_、和__大量性__。 4.要了解一个企业的产品质量情况,总体是_企业全部产品__,个体是__每一件产品__。 5.样本是从__总体__中抽出来的,作为代表_这一总体_的部分单位组成的集合体。 6.标志是说明单体单位特征的名称,按表现形式不同分为__数量标志_和_品质标志_两种。 7. 8.统计指标按其数值表现形式不同可分为__总量指标__、__相对指标_和__平均指标__。 9.指标与标志的主要区别在于: (1)指标是说明__总体__特征的,而标志则是说明__总体单位__特征的。 (2)标志有不能用__数量__表示的_品质标志_与能用_数量_表示的_数量标志_,而指标都是能用_数量_表示的。 10.一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和__统计分析__4个阶段。 二、单项选择题 1.统计总体的同质性是指(A)。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志或数量标志 D.总体各单位具有若干互不相同的品质标志属性或数量标志值 2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D)。
A.全部工业企业 B.800家工业企业 C.每一件产品 D.800家工业企业的全部工业产品 3.有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为(A)。 A.200家公司的全部职工 B.200家公司 C.200家公司职工的全部工资 D.200家公司每个职工的工资 4.一个统计总体( D)。 A.只能有一个标志 B.可以有多个标志 C.只能有一个指标 D.可以有多个指标 5.以产品等级来反映某种产品的质量,则该产品等级是(C)。 A.数量标志 B.数量指标 C.品质标志 D.质量指标 6.某工人月工资为1550元,工资是( B )。 A.品质标志 B.数量标志 C.变量值 D.指标 7.某班4名学生金融考试成绩分别为70分、80分、86分和95分,这4个数字是( D)。 A.标志 B.指标值 C.指标 D.变量值 8.工业企业的职工人数、职工工资是(D)。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 9.统计工作的成果是(C)。 A.统计学 B.统计工作 C.统计资料 D.统计分析和预测 10.统计学自身的发展,沿着两个不同的方向,形成(C)。 A.描述统计学与理论统计学 B.理论统计学与推断统计学 C.理论统计学与应用统计学 D.描述统计学与推断统计学
《应用统计学》练习试题和答案解析
《应用统计学》本科 第一章导论 一、单项选择题 1.统计有三种涵义,其基础就是( )。 (1)统计学 (2)统计话动 (3)统计方法 (4)统计资料 2.一个统计总体( )。 (1)只能有个标志 (2)只能有一个指标 (3)可以有多个标志 (4)可以有多个指标 3.若要了解某市工业生产设备情况,则总体单位就是该市( )。 (1)每一个工业企业 (2)每一台设备 (3)每一台生产设备 (4)每一台工业生产设备 4.某班学生数学考试成绩分刷为65分、71分、80分与87分,这四个数字就是( )。 (1)指标 (2)标志 (3)变量 (4)标志值 5.下列属于品质标志的就是( )。 (1)工人年龄 (2)工人性别 (3)工人体重 (d)工人工资 6.现要了解某机床厂的生产经营情况,该厂的产量与利润就是( )。 (1)连续变量 (2)离散变量 ()3前者就是连续变量,后者就是离散变量 (4)前者就是离散变量,后者就是连续变量 7.劳动生产率就是( )。 (1)动态指标 (2)质量指标 (3)流量指标 (4)强度指标 8.统计规律性主要就是通过运用下述方法经整理、分析后得出的结论( )。 (1)统计分组法 (2)大量观察法 (3)练台指标法 (4)统计推断法 9.( )就是统计的基础功能。 (1)管理功能 (2)咨询功能 (3)信息功能 (4)监督功能 10.( )就是统计的根本准则,就是统计的生命线。 (1)真实性 (2)及时件 (3)总体性 (4)连续性 11.构成统计总体的必要条件就是( )。 (1)差异性 (2)综合性 (3)社会性 (4)同质性 12.数理统计学的奠基人就是( )。 (1) 威廉·配第 (2)阿亭瓦尔 (3)凯特勒 (4)恩格尔 13.统汁研究的数量必须就是( )。 (1)抽象的量 (2)具体的量 (3)连续不断的量 (4)可直接相加量 14.数量指标一般表现为( )。 (1)平均数 (2)相对数 (3)绝对数 (1)众数 15.指标就是说明总体特征的.标志则就是说明总体单位特征的,所以( )。 (1)指标与标志之同在一定条件下可以相互变换 (2)指标与标志都就是可以用数值表示的 (3)指标与标志之间不存在戈系 (4)指标与标志之间的关系就是固定不变的 答案:一、1(2) 2(4)3(4)4(4)5(2)6(4)7(2)8(2)9(3)10(1)11(4)12(3)13(2)14(3)15(1) 二、1× 2× 3√ 4× 5√ 6× 7√ 8× 9√ 10× 11× 12× 二、判析题 l.统计学就是一门研究现象总体数量方面的方法论科学,所以它不关心、也不考虑个别现象的数量特征。 ( ) 2.三个同学的成绩不同.因此仃在三个变量 ( ) 3.统计数字的具体性就是统讣学区别于数学的根本标志。 ( ) 4.统计指标体系就是许多指标集合的总称。 ( ) 5.一般而言,指标总就是依附在总体上,而总体单位则就是标志的直接承担者。( ) 6.统计研究小的变异就是指总体单位质的差别。 ( ) 7.社会经济统计就是在质与量的联系中.观察与研究社会经济现象的数量方面。( ) 8.运用大量观察法必须对研究对象的所有单位进行观察调查。( )
应用统计学试题及答案1
北京工业大学经济与管理学院2007-2008 年度 第一学期期末应用统计学 主考教师 专业:学号:姓名:成绩: 1C2B3A4C5B6B7A8A9C10C 一.单选题(每题 2 分,共 20 分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2.一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A50B8C0.02D4 3.某连续变量数列,其末组为“ 500 以上”。又知其邻组的组中值为 480,则末组的组中值为 A 520 B 510 C 530 D 540 4.已知一个数列的各环比增长速度依次为5%、7%、 9%,则最后一期的定基增长速度为 A .5%× 7%× 9% B. 105% × 107%× 109% C.(105%× 107%× 109%)- 1 D. 3 105%107%109%1 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品 ,则物价增 (减 )变化的百分比为 A. –5% B. –4.76% C. –33.3% 6.对不同年份的产品成本配合的直线方程为 D. 3.85% ? y 280 1.75x ,回归系数b=-1.75表示 A.时间每增加一个单位,产品成本平均增加 1.75 个单位 B.时间每增加一个单位,产品成本平均下降 1.75 个单位 C. 产品成本每变动一个单位,平均需要 1.75 年时间 D. 时间每减少一个单位,产品成本平均下降 1.75 个单位 7.某乡播种早稻5000 亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8. 甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间 : x =70 件,=5.6 件乙车间 :x =90件,=6.3 件 哪个车间日加工零件的离散程度较大: A 甲车间 B.乙车间 C.两个车间相同 D.无法作比较 9.根据各年的环比增长速度计算年平均增长速度的方法是
应用统计学试题和答案分析
六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==?n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4) 附: 10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 179005 1 2 =∑=i x i 1043615 1 2 =∑=i y i 424305 1 =∑=y x i i i 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β ==-??-?290 217900572129042430554003060 =0.567 =-= ∑∑n x n y ββ 1 0144.2 – 0.567×58=111.314 估计的回归方程为:y =111.314+0.567x ② 计算判定系数: