统计学考试试题.doc
统计学考试范围
一、不定项选择题(10× 1 分=10 分)
1. 统计研究对象的特点包括(C)。
A、总体性 B 、具体性 C 、总体性和具体性 D 、同一性
2. 描述统计和推断统计的之间的关系是( A )。
A、前者是后者的基础 B 、后者是前者的基础 C 、两者没有关系D、两这互为基础
3. 统计学发展过程中经历的主要学派有(ABCD )。
A 政治算术学派
B 国势学派
C 数理统计学派
D 社会统计学派
4. 下列标志中属于品质数据的有(AC )。
A 企业的经济类型
B 劳动生产率
C 企业所属的行业
D 企业的负债总额
5. 社会经济统计的研究对象是( C )。
A、抽象的数量特征和数量关系 B 、社会经济现象的规律性
C、社会经济现象的数量特征和数量关系
D、社会经济统计认识过程的规律和方法
6. 总体的变异性是指( B )。
A.总体之间有差异B、总体单位之间在某一标志表现上有差异
C.总体随时间变化而变化D、总体单位之间有差异
7. 工业企业的设备台数、产品产值是( D )。
A、连续变量 B 、离散变量
C.前者是连续变量,后者是离散变量
D、前者是离散变量,后者是连续变量
8. 统计研究运用的方法包括(ABCDE )
A、大量观察法 B 、统计分组法 C 、综合指标法 D 、统计模型法 E 、归纳推断法
9. 社会经济统计学研究对象的特点可概括为(ABC )
A、社会性 B 、数量性 C 、总体性 D 、同质性 E 、变异性
10. 下列各项中,属于连续型变量的有(ACD )
A、基本建设投资额 B 、岛屿个数
C、国民生产总值
D、居民生活费用价格指数
11. 统计调查是进行资料整理和分析的( A )。
A、基础环节
B、中间环节
C、最终环节
D、必要补充
12.调查几个重要铁路枢纽,就可以了解我国铁路货运量的基本情况和问题,这种调查属于
(B)。
A、普查 B 、重点调查 C 、典型调查D、抽样调查
13.在对总体现象进行分析的基础上,有意识地选择若干具有代表性的单位进行调查研究,
这种调查方法是(B)。
A、抽样调查
B、典型调查
C、重点调查
D、普查
14. 对一批商品进行质量检验,最适宜采用的方法是(
A、全面调查
B、抽样调查
C、典型调查 D 、重点调查
15. 普查是一种(ABE)
B )。
A、专门组织的调查 B 、一次性调查
C、经常性调查 D 、非全面调查 E 、全面调查
16.( C )是统计的基础功能
A 管理功能B咨询功能
17.我国人口普查采用的是(C信息功能
C)
D监督功能
A .直接观察法
B .报告法
18. 抽样调查抽取样本时必须遵守的原则是(C .采访法
A)
D .被调查者自填法
A 随机性原则
B 灵活性原则
C 可靠性原则
D 准确性原则
19. 将统计数据按着某一标志分组的结果表现为(
A ) A. 组内同质性,组间差异性。 B.
组内差异性,组间同质性。 C. 组内同质性,组间同质性。 D.
组内差异性,组间差异性。 20. 下列指标中反映离散程度的指标是(
ABCD
)。
A 标准差
B 标准差系数
C 全距
D 平均差
21. 在下列描述数据集中趋势的指标中,不易受极端值影响的有( AD
)。
A 中位数
B 调和平均数
C 几何平均数
D 众数
22. 影响标准差大小的因素包括( ABC )。 A 变量值水平的高低
B 变量值之间的差异程度的大小
C 变量值计量单位的变化
D 变量值的个数
23. 在对两组数据的差异程度进行比较时,一般不能直接加以比较的离散程度指标是
(
ACD
A 平均差
)。
B 离散系数
C 标准差
D 方差
二、填空题( 10× 1.5 分 =15 分)
1. 实验组和随机组的产生应遵循 随机原则 ,而且应该 匹配 。
2. 统计学是 收集 、 处理 、分析、 并 解释 的科学。
3. 不同类型的数据, 所采取的处理方式和方法是不同的: 对分类数据和顺序数据主要是做 分类整理 ;对数值型数据则主要是做 分组整理。
4. 统计表的构成有下面这几个部分:
表头、行标题、列标题、数字资料
和表外附加 。
5. 统计表中的数据一般是 右对齐 ,对于小数应按 小数点对齐 ,且小数点的位数 应统一 。
6. 平均数也称均值 (mean), 是最常用的 集中趋势 测度值 , 易受 极端值 的影响 . 主要适
用于 数值型数据 ,但不适用于 分类数据 和 顺序数据
。 7. 偏态 (skewness) 是对分布的
偏斜方向
和 偏斜程度
的测度。
8. 峰态 (kurtosis) 是对分布 尖峭 或平缓程度的 测度 .
9. 影响方差或标准差数值大小有 2 个方面的原因 : 这组数据的 平均数大小 和这组数据的 计量单位 。 三、名词解释( 5×3 分 =15 分)
1. 分层抽样
分层抽样指将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、 随机地抽取样本;例如将一个小区的的人按照年龄分层进行抽样。
2. 抽样框误差
抽样框误差是指由于抽样框不完善造成的统计推论的误差。 3. 异众比率
异众比率又称作离异比率或变差比,指非众数组的频数占总频数的比例。 4. 充分统计量
充分统计量是指统计量充分利用了样本所含末知参数的全部信息的情况。 5. 自由度
一组数据中可以自由取值的数据的个数叫做自由度。
四、简答题(3× 5 分 =15 分)
1.试比较截面数据和时间序列数据,并举例说明
截面数据是在相同或者近视相同的时间点上收集的数据,这类数据通常是在不同的空间
上获得的,用于描述现象在某一刻的变化情况。比如 2002 年我国各地区的国内生产总值数据;时间序列数据是在不同时间上收集到的数据,这类数据是按时间顺序收集到的,用于描述现象虽时间变化的情况。例如 2000-2005 年我国的国内生产总值数据就是时间序列数据。
2.试比较直方图与条形图的差别
首先,条形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用
面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,
因此其高度与宽度均有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。
3. 试比较置信水平和显著性水平
置信水平和置信度应该是一样的,就是变量落在置信区间的可能性,“置信水平”就是相信变量在设定的置信区间的程度,是个0~1 的数,用 1-α表示。置信区间,就是变量的一个范围,变量落在这个范围的可能性是就是1-α。
显著性水平就是变量落在置信区间以外的可能性,“显著”就是与设想的置信区间不一样,用α表示。
显然,显著性水平与置信水平的和为 1。显著性水平为 0.05 时,α =0.05,1-α =0.95如果置信区间为( -1,1),即代表变量 x 在( -1, 1)之间的可能性为 0.95。
4.简述小概率事件和小样本事件的异同
概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。
样本容量较小的事件称为小样本事件。
不同点 : 小概率事件发生的概率较小,同时小样本事件的样本容量较小;
相同点 : 小概率事件与小样本事件均为难于发生的事件。
5.简述假设检验的流程
(1)提出原假设 H0 和备择假设 H1 ;▽原假设用
=、 =<或 >=表示,记为 H0 ;
▽与原假设对立的假设称备择假设,记为H1 ,用=、 =<或 >=表示。
(2)确定检验统计量及其分布 ; ▽用于检验假设
的统计量称为检验统计量;
▽根据 H0 及相应条件选择适当的统计量,并确定统计量的分布。
(3) 规定显著性水平;
▽ H0 为真时,拒绝H0 的概率称为显著性水平,用表示;
▽值由研究者事先规定,通常取0.1, 0.05 和 0.01。
(4)确定 H0 的拒绝域(或接受域)
(5)作出统计决策;
根据样本数据计算统计量取值时,当统计量取值落在拒绝域,则拒绝H0 ,否则就接受H0 。
五、计算题(3× 15 分 =45 分)
1.设 X~N(5, 32),求以下概率:
(1) P(X 10);(2) P(2< X <10)
解:X
Z
(1)
X 5 10 5
P(X 10)P
3 3
X 5
(1.67) 0.9525
P 1.67
3
(2)
P(2 X 10) P 2 5 X 5 10 5
3 3 3
P
X 5
1
3
1.67 (1.67) ( 1) 0.7938
2.( P173 6.1)调节一个装瓶机使其对每个瓶子的灌装量均值为盎司,通过观察这台装
瓶机对每个瓶子的灌装量服从标准差 1.0 盎司的正态分布。随机抽取由这台机器灌装的9 个瓶子形成一个样本,并测定每个瓶子的灌装量。试确定样本均值偏离总体均值不超过0.3 盎司的概率。
解:总体方差知道的情况下,均值的抽样分布服从
N , 2
的正态分布,由正态分布,n
标准化得到标准正态分布: z= x
n
~ N 0,1 ,因此,样本均值不超过总体均值的概率P
为:
P x 0.3
x 0.3
= P
0.3 x 0.3
= P
n n 1 9 n 1 9
= P 0.9 z 0.9 =2 0.9 -1,查标准正态分布表得0.9 =0.8159
因此,P x 0.3 =0.6318
3.(P203 7.11)某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g 。现从某
天生产的一批产品中按重复抽样随机抽取50 包进行检查,测得每包重量 ( 单位: g) 如下:每包重量( g)包数
96~98 2
98~100 3
100~102 34
102~104 7
104~106 4
合计
50
已知食品包重量服从正态分布,要求: (1)确定该种食品平均重量的
95%的置信区间。
解:大样本,总体方差未知,用
z 统计量
z x
N 0,1
s
n
样本均值 =101.4,样本标准差 s=1.829
置信区间:
s s x z 2
, x z 2
n
n
1
=0.95, z 2 = z 0.025 =1.96
s s x z 2
, x z 2
n
n
=
101.4 1.96
1.829
,101.4 1.96 1.829
=( 100.89, 101.91)
5050
(2)如果规定食品重量低于 l00g 属于不合格,确定该批食品合格率的
95%的置信区间。
解:总体比率的估计
大样本,总体方差未知,用
z 统计量
p N 0,1
z
p 1 p n
样本比率 =(50-5) /50=0.9 置信区间:
p z
2
p 1
n
p
, p
z
2
p 1
n
p
1
=0.95, z 2 = z 0.025 =1.96
p z
p 1 p
p 1 p 2
n , p z 2
n
= 0.9 1.96 0.9 1
0.9
0.9 1 0.9
50
,0.9 1.96
=(0.8168,0.9832)
50
4.( P204 7.20)顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因
素有关,比如,银行业务员办理业务的速度,顾客等待排队的方式等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等
待的时间更短,银行各随机抽取 10 名顾客,他们在办理业务时所等待的时间
(单位:分
钟) 如下:
方式 1 6.5 6.6 6.7 6.8 7.1 7.3 7.4 7.7 7.7 7.7 方式 2
4.2
5.4
5.8
6.2
6.7
7.7
7.7
8.5
9.3
10
要求:
(1)构建第一种排队方式等待时间标准差的 95%的置信区间。
解:估计统计量
n 1 S 2
2
n 1
2
~
经计算得样本标准差 s 22 =3.318 置信区间:
n
1 S 2
2
n
1 S 2
2 n 1
2 2
n
1 2
1
1
=0.95, n=10, 2
n
1 =
2 9 =19.02, 2 2 n 1 = 2 9 =2.7
2
0.025
1
0.975
n
1 S 2
n 1 S 2
9 0.2272 9 0.2272
2
2
n
1 , 2
n
1
= 19.02 ,
=( 0.1075, 0.7574)
12
2.7
因此,标准差的置信区间为(
0.3279, 0.8703)
(2)构建第二种排队方式等待时间标准差的
95%的置信区间。
解:估计统计量
n 1 S 2
2
n 1
2
~
经计算得样本标准差 s 12 =0.2272 置信区间:
n
1 S 2
2
n
1 S 2
2 n 1
2
2
n
1 2
1
1
=0.95, n=10, 2
n 1 =
2
=19.02,
2
2 n 1
2
9 =2.7
2
0.025
9
1
=
0.975
n
1 S 2
n 1 S 2
9 3.318 , 9 3.318
2
2
n
1 , 2
n
1
= =( 1.57, 11.06)
12
19.02 2.7
因此,标准差的置信区间为( 1.25, 3.33)
(3)根据 (1) 和(2) 的结果,你认为哪种排队方式更好
?
第一种方式好,标准差小!
5.( P242 8.1)已知某炼铁厂的含碳量服从正态分布N (4.55,0.108 2),现在测定了 9 炉
铁水,其平均含碳量为 4.484.如果估计方差没有变化,可否认为现在生产的铁水平均含碳量
为 4.55(0.05 )。
检验一个正态总体的均值,总体方差已知,双侧检验
解:建立原假设及备择假设:
H0 :4.55;H1 :4.55
x 0
服从标准正态分布。
如果原假设为真,则 Z
n
给定显著性水平0.05,查标准正态分布表,得临界值
Z / 2Z0.025 1.96。
所以,拒绝域为( -,-1.96)和( 1.96,+)。
4.484 4.55
Z 1.83
0.108/ 9
Z 1.83 1.96
所以,不拒绝原假设,即认为现在生产的铁水平均含碳量为 4.55。
6.( P242 8.6)某厂家在广告中声称,该厂生产的汽车轮胎在正常行驶条件下超过目前的平
均水平 25000 公里。对一个由 15 个轮胎组成的随机样本做了试验,得到样本均值和标准差分
别为 27000 公里和 5000 公里。假定轮胎寿命服从正态分布,问该铁厂厂家的广告是否
真实(0.05)?
解:检验一个正态总体的均值,总体方差未知,右侧检验
H0 :25000;H 1 :25000
x 0 t(n-1) 。
如果原假设为真,则 t
n
S
给定显著性水平0.05,查 t 分布表,得临界值
t(n 1) t0.05(14) 1.7709。
所以,拒绝域为( 1.7709,+ )。
t27000 25000 1.549
5000/ 15
t 1.549 1.7709
所以,不拒绝原假设,即认为该厂家的广告是不真实的。
7.( P243 8.8)随机抽取 9 个单位,测得结果分别为:
8559668135 57 5563 66
以0.05 H 0 :
2
100, H 1 100 。
的显著性水平对下述假设进行检验:
解:一个总体的方差检验
H0 : 2 100;H1 : 2 100
如果原假设为真,则2 (n 1)s2
~ 2 (n 1)。
2
给定显著性水平0.05,查2分布表,得
2 (n 1) 2 (8) 。
0.05 15.5073
所以,拒绝域为( 15.5073, )。
S2 215.75
2
8 215.75
100
17.26
2
17.26 15.5073
所以,拒绝原假设,即认为总体方差大于100。