应用统计学试题和答案

应用统计学试题和答案
应用统计学试题和答案

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分)

1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。

已知:8.2,6.12==S x 0455.0=α

则有: 202275

.02==Z Z α 平均误差=4.07

8.22==n S 极限误差8.04.0222=?==?n

S Z α

据公式

x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4)

3

附:1080512)(=∑-=i x x i

8.392512)(=∑-=i y y i 58=x 2.144=y

17900512=∑=i x i 104361512=∑=i y i 4243051=∑=y x i i i

3题 解 ① 计算估计的回归方程:

∑∑∑∑∑--=)(221x x n y x xy n β ==-??-?290

217900572129042430554003060=0.567 =-=∑∑n x n y ββ 10144.2 – 0.567×58=111.314

估计的回归方程为:y =111.314+0.567x

② 计算判定系数:

22

2122()0.56710800.884392.8

()x x R y y β-?===-∑∑

4

计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。

4题 解:

① 拉氏加权产量指数

= 100000 1.1445.4 1.13530.0 1.08655.2111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数=11100053.633.858.5100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑

模拟试卷(二) 一、填空题(每小题1分,共10题)

1、我国人口普查的调查对象是 ,调查单位是

2、___ 频数密度

=频数÷组距,它能准确反映频数分布的实际状况。

3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。

4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数

6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 7.1% 。

7、对回归系数的显著性检验,通常采用的是 t 检验。

8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p

1、 具有我国国籍并在我国境内长住的人(指自然人)、每一个人

2、 频数密度 6、7.1%

3、 饼图、条形 7、t

4、 286.5 8、P<α

5、 44% 9、16

二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号内。每小题1分,共

14分)

1、研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( )

①、应用统计学 ②、描述统计学 ③、推断统计学

2、若某总体次数分布呈轻微左偏分布,则成立的有 ( )

①、x > e M >o M ③、x >o M >e M

3>σ,x 甲>x 乙,由此可推断 ( )

②、甲组x 的代表性高于乙组

4、通常所说的指数是指 ( )

①、个体指数 ②、动态相对数 ③、复杂现象总体综合变动的相对数

5、抽样误差大小 ( )

①、不可事先计算,但能控制 ②、能够控制,但不能消灭 ③、能够控制和消灭

6、某人持有一种股票,连续三年皆获益,但三年的收益率皆不同,要计算这三年的平均收益率应采用的方法为

( )

①、算术平均数 ②、中位数 ③、几何平均数

7、某企业生产属连续性生产,为了检查产品质量,在每天生产过程中每隔一小时抽取一件产品进行检验.这种抽样方式是 ( )

①、简单随机抽样 ②、分层抽样 ③、等距抽样

8、在假设检验中,若500:,500:10<≥μμH H ,则此检验是 ( )

①、左侧检验 ②、右侧检验 ③、双侧检验

9、季节指数刻画了时间序列在一个年度内各月或季的典型季节特征。在乘法模型中,季节指数是以其平均数等于什么为条件而构成的? ( )

①、100% ②、400% ③、1200%

10、某专家小组成员的年龄分别为29,45,35,43,45,58,他们年龄的中位数为 ( )

①、45 ②、40 ③、44

11、若直线回归方程中的回归系数1

?β为负数,则 ( ) ①、r 为0 ②、r 为负数 ③、r 为正数

12、当分布数列中各变量值的频率相等时 ( ) ①、该数列众数等于中位数 ②、该数列众数等于算术均值 ③、该数列无众数

13、某次考试学生的考试成绩X 近似服从正态分布,()64,78~N X ,则可认为有大约68.26%的学生考试成绩分

布的范围是 ( )

①、(70,80) ②、(70,86) ③、(62,94)

14、某班有40名学生,其中男女学生各占一半,则该班学生的成数方差为 ( )

①、50% ②、25% ③、20%

⑴写出原假设及备择假设;

⑵写出SST ,SSA ,SSE ,e A T f f f ,,,MSA ,MSE ,n 以及P 值;

⑶判断因素A 是否显著。

答案 ⑴ 原假设 3210:μμμ==H

备择假设 ()3,2,1:1=i H i μ不全等

⑵ SST=0.001245 SSA=0.001053 SSE=0.000192 14=T f 2=A f 12

=e f MSA=0.000527 MSE=0.000016 15=n

P 值=1.34E-05

⑶ F 值=32.91667>()88529.312,2=αF

拒绝原假设,因素A 显著。

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分)

1、某小区居民共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。

(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95.45%(

Z α/2=2)

(2)如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查?(设边际误差E=0.08)

1题 解:

(1) n = 50 p = 32/50 =64%

E=()2213.58%64%13.58%50.42%,77.58%αZ ==±置信区间为即 ()()()22222120.80.2

(2)1000.08p p n E αZ -??===

应抽取100户进行调查。

2

(18=0.5时误差均方=3847.31,平滑系数α=0.3时误差均方=5112.92,问用哪一个平滑系数预测更合适?

2题 解:

1099

988210988

2(1)(1)(1)(1)(1)0.56600.50.5644(10.5)555.19629.80F Y F F Y F F Y Y F αααααααα=+-=+-=+-+-=?+??+-?=∴

(2)平滑系数α=0.5时误差均方=3847.31<平滑系数

α=0.3时误差均方=5112.92

∴ 用平滑系数α=0.5预测更合适。

3、某汽车生产商欲了解广告费用x 对销售量y 的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:

①求A 、B 、C 的值;②销售量的变差中有多少是由于广告费用的变动引起的?

③销售量与广告费用之间的相关系数是多少?④写出估计的回归方程并解释回归系数的实际意义。⑤检验

线性关系的显著性 (a =0.05)

3题 解

(1)A=SSR / 1=1422708.6 B=SSE / (n-2)=220158.07/10=22015.807

C=MSR / MSE=1422708.6/22015.807=64.6221

(2)21422708.6086.60%1642866.67

SSR R SST === 表明销售量的变差中有88.60%是由于广告费用的变动引起的。

(3)0.93R ===

(4)估计的回归方程:

?363.6891 1.420211y

x =+ 回归系数1

? 1.420211β=表示广告费用每增加一个单位,销售量平均增加1.420211个单位。 (5)检验线性关系的显著性:

H 0 :01=β

∵Significance F=2.17E-09<α=0.05

∴拒绝H 0,, 线性关系显著。

4、某企业三种产品的出口价及出口量资料如下:

(1)计算拉氏出口量指数;(2)计算帕氏出口价指数

4题 解:

01001101100828010001206596000(1)121.21%1008080800120607920015082140100012065160100(2)166.77%100828010001206596000q p

p q I p q p q I p q ?+?+?=

===?+?+??+?+?====?+?+?∑∑∑∑

统计学试卷及答案(三)

一、 判断题

1.统计学是一门方法论科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。

( )

2.统计研究的过程包括数据收集、数据整理、分析数据和解释数据四个阶段。( )

3.统计数据误差分为抽样误差和非抽样误差。( )

4.按所采用的计量尺度不同,可以将统计数据分为时间序列数据和截面数据( )

5.用来描述样本特征的概括性数字度量称为参数。( )

6.如果数据呈左偏分布,则众数、中位数和均值的关系为:均值<中位数<众数。( )

7.通过散点图可以判断两个变量之间有无相关关系。( )

8.所有可能样本均值的数学期望等于总体均值。( )

9.影响时间序列的因素可分为:长期趋势、季节变动、循环波动和不规则变动四种。( )

10.狭义的统计指数是用来说明那些不能直接加总的复杂现象综合变动的一种特殊相对数。( )

二、单项选择题1.D 2.C 3.B 4.C 5.B 6.C 7.A 8.C 9.B 10.B 11.B 12.C 13.C 14.B 15.B

1.为了估计全国高中生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中样本是( )。

A 100所中学

B 20个城市

C 全国的高中生

D 100所中学的高中生

2.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2005年城镇家庭的人均收入数据。这一数据属于( )。

A 分类数据

B 顺序数据

C 截面数据

D 时间序列数据

3.某连续变量数列,其首组为50以下。又知其邻近组的组中值为75,则首组的组中值为( )

A 24

B 25

C 26

D 27

4.两组数据相比较( )。

A 标准差大的离散程度也就大

B 标准差大的离散程度就小

C 离散系数大的离散程度也就大

D 离散系数大的离散程度就小

5.在下列指数中,属于质量指数的是( )。

A 产量指数

B 单位产品成本指数

C 生产工时指数

D 销售量指数

6.定基增长速度与环比增长速度的关系为( )。

A 定基增长速度等于相应的各个环比增长速度的算术和

B 定基增长速度等于相应的各个环比增长速度的连乘积

C 定基增长速度等于相应的各个环比增长速度加1后的连乘积再减1

D 定基增长速度等于相应的各个环比增长速度的连乘积加1(或100%)

7.某企业报告期产量比基期增长了10%,生产费用增长了8%,则其产品单位成本降低了( )。

A 1.8%

B 2.5%

C 20%

D 18%

8.用简单随机重复抽样方法抽取样本单位,如果要使抽样标准差降低50%,在其他条件不变的情况下,则样本容量需要扩大到原来的( )。

A 2倍

B 3倍

C 4倍

D 5倍

9.如果变量x 和变量y 之间的相关系数为﹣1,这说明两个变量之间是( )。

A 低度相关关系

B 完全相关关系

C 高度相关关系

D 完全不相关

10.合理施肥量与农作物亩产量之间的关系是( )。

A 函数关系

B 相关关系

C 没有关系

D 正比例关系

11.在回归分析中,描述因变量y 如何依赖自变量x 和误差项ε的方程称为( )。

A 回归方程

B 回归模型

C 估计的回归方程

D 理论回归方程

12.平均指标是用来反映一组数据分布的( )的指标。

A 相关程度

B 离散程度

C 集中程度

D 离差程度

13.在正态总体方差已知时,在小样本条件下,总体均值在1-α 置信水平下的置信区间可以写为( )。

A n z x 22σα±

B n t x σα2±n s z x 22α± 14.在其他条件不变的情况下,降低估计的置信水平,其估计的置信区间将( )。

A 变宽

B 变窄

C 保持不变

D 无法确定

15.在同等条件下,重复抽样误差和不重复抽样误差相比( )。

A 两者相等

B 前者大于后者

C 前者小于后者

D 无法判断

三、 多项选择题

1.按计量尺度不同,统计数据可分为三类即( )

A 时间序列数据

B 实验数据

C 分类数据

D 顺序数据

E 数值型数据

2.统计调查方案的内容包括( )。

A 确定调查目的

B 确定调查对象和调查单位

C 设计调查项目和调查表

D 调查所采用的方式和方法

E 调查时间及调查组织和实施的具体细则

3.反映分类数据的图示方法包括( )。

A 条形图

B 直方图

C 圆饼图

D 累积频数分布图

E 茎叶图

4.具有相关关系的有( )。

A 工号和工作效率

B 受教育程度与收入水平

C 子女身高和父母身高

D 收入水平与消费量

E 人口与物价水平

5.下列属于时期数列的有( )。

A 某商店各月库存数

B 某商店各月的销售额

C 某企业历年产品产量

D 某企业某年内各季度产值

E 某企业某年各月末人数

1.CDE

2. ABCDE

3.AC

4.BCD

5.BCD

五、计算分析题

1.从一个正态总体中随机抽取样本容量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值95%的置信区间。(已知365.2)18(025.0=-t )。(12分)

1.解:已知n=8,总体服从正态分布,σ未知,样本抽样分布服从t 分布 365.2)18(025.0=-t

1080

800

===∑n x x

46.31)

(2=--=∑n x x s

89.28

46.3365.22=?==n s t E α

置信下限=10-2.89=7.11

置信上限=10+2.89=12.89

总体均值μ的95%的置信区间为 [7.11,12.89]

2.已知某企业连续5年钢产量资料如下:

试根据上表资料填出表中数字。(注意没有的数字划“—”,不准有空格)(10分)

3.某商场出售三种商品销售资料如下表所示:(14分)

试计算:(1)三种商品销售额总指数;(2)三种商品的价格综合指数;(3)三种商品的销售量综合指数;(4)分析销售量和价格变动对销售额影响的绝对数和相对数。(注:计算结果保留2位小数)4.某地区1991—1995年个人消费支出和收入资料如下:(14分)

要求:(1)计算个人收入与消费支出之间的相关系数,说明两个变量之间的关系强度;

(2)用个人收入作自变量,消费支出作因变量,求出估计的直线回归方程,并解释回归系数的实际意义。

(3)当个人收入为100万元时预测该地区的消费支出为多少?(注:计算结果保留4位小数)

答案:

统计学试卷(三)标准答案

一、判断题(在题后的括号里正确划“√”、错误划“×”,每题1分,共计10分)

1.√ 2.√ 3. √ 4. × 5. × 6. √ 7. √ 8. √ 9. √ 10. √

五、计算分析题(本题共50分)

2.已知某企业连续五年钢产量资料如下:

3.某企业三种产品的销售资料如下表所示:

相对数:商品销售额指数%84.16028500458400011===∑∑q p q p K pq

绝对数:元)

(1734028500458400011=-=-∑∑q p q p (2)价格综合指数%54.11739000

458401011===∑∑q p q p 元)(684039000458401011=-=-∑∑q p q p

(3)相销售量综合指数%84.13628500

390000001===∑∑p q p q 元)(1050028500390000

001=-=-∑∑p q p q (4)综合分析

160.84%=136.84%*117.54%

17340(元)=10500(元)+3840(元)

从相对数上看:三种商品销售额报告期比基期提高了60.84%,是由于销售价格的提高是销售额提高了17.54%和由于销售量的增加使销售额提高了36.84%两因素共同影响的结果。从绝对值上看,报告期比基期多销售17340元,由于销售价格的提高而使销售额增加6840元和由于销售量的提高是销售额增加10500元两因素共同影响的结果。

4.某地区1991-1995年个人消费支出和收入资料如下:

9872.0)345244615)(385301135(345385271125])(][)([222222=-?-??-?=---=∑∑∑∑∑∑∑y y n x x n y

x xy n r 8.09872.0>=r ,所以两个变量之间为高度相关。

(2)设估计的值直线回归方程为 x y ∧∧∧+=10ββ

1688.1)(221=--=

∑∑∑∑∑∧x x n y x xy n β 9976.205

3851688.1534510-=?-=-=∑∑∧

∧n x n y ββ ∴ x y 1688.19976.20+-=∧

回归系数1.1688说明当个人收入增加1个万元时,消费支出平均增加1.1688万元。

(3)当100=x 万时,8824.951001688.19976.20y =?+-=∧

相关主题
相关文档
最新文档