432统计学历年考研真题

432统计学历年考研真题
432统计学历年考研真题

南京大学2016年攻读硕士学位研究生入学考试试题

考试科目:统计学科目代码:432 考试时间:月日(注:特别提醒所有答案一律写在答题纸上,直接写在试题或草稿纸上的无效!)———————————————————————————————

一、名词解释

1、估计量,并举例说明

2、描述性统计分析和推断性统计分析,并举例说明

3、数量指数和质量指数,并举例说明

4、流量指标、存量指标,并举例说明

5、点估计与区间估计

二、选择题

1、在计算增长率的平均数时,通常采用()

A.简单平均数

B.调和平均数

C.算术平均数

D.几何平均数

2、各变量值与其()的离差之和等于零 C

A.中位数

B.众数

C.均值

D.标准差

3、下列数字特征中,度量随机变量取值的离散程度的是()

A.期望值

B.方差

C.协方差

D.相关系数

4、若两个随机变量X、Y相互不独立,则下列等式中正确的只有()

A. E(XY)=E(X)E(Y)

B. E(X+Y) = E(X) + E(Y)

C. D(X+Y)=D(X)+D(Y)

D. Cov(X,Y) = 0

5、下列叙述正确的是()

A. 样本均值的抽样分布于总体的分布无关

B. 样本均值的抽样分布与样本容量无关

C. 样本均值的抽样分布与总体的分布有关

D. 样本均值的分布总是服从正态分布

6、下列叙述中正确的是()

A. 样本均值的期望值总是等于总体均值

B. 只有在非重复抽样的条件下,样本均值的期望值才等于总体均值

C. 只有在重复抽样的条件下,样本均值的期望值才等于总体均值

D. 样本均值总是等于总体均值

7、下列叙述中不正确的是() A. 样本均值的方差与抽样方法有关

B. 在重复抽样的条件下,样本均值的方差等于总体方差的1/n

C. 在重复抽样的条件下和非重复抽样的条件下,样本均值的方差不同

D. 在非重复抽样的条件下,样本均值的方差等于总体方差的1/n

8、一本书排版后,一校时出现的平均错误处数为200,标准差为400。随机抽取排版后的一本书稿,出现错误的处数不超过230的概率是( ) A. 0.93 B.0.80 C.0.85 D.0.75

9、以样本均值为估计量对总体均值进行区间估计,且总体方程已知,则如下说法正确的是() A. 95%的置信区间比90%的置信区间宽 B. 样本容量较小的置信区间较小

C. 相同置信水平下,样本量大的区间较大

D. 样本均值越小,区间越大

10、在线性回归方程i i X Y ?+=87.253.48

中,2.87说明()

A. X 每增加一个单位,Y 肯定会增加2.87个单位

B. X 每增加一个单位,Y 平均会增加2.87个单位

C. X 平均增加一个单位,Y 会增加2.87个单位

D. X 平均增加一个单位,Y 肯定会增加2.87个单位

11、回归方程的可决系数值越大,则回归线()

A. 越接近于Y 的总体平均值

B. 越接近于Y 的样本观察值

C. 越接近于Y 的预测值

D. 越接近于Y 的估计值

12、要通过移动平均法消除季节变动,则移动平均项数N()

A. 应选择奇数

B. 应选择偶数

C. 应和季节周期长度一样

D. 可以任意取值

13、用“趋势删除法”测定季节变动,适合于()

A. 有增长趋势的季节序列

B. 呈水平趋势的季节序列

C. 有趋势和循环的季节序列

D. 各种季节序列

14、下面属于数量指数的是:

A.

∑∑1

011q

p q p B.

∑∑0

11q

p q p C.

∑∑0

1q

p q p D.

∑∑0

10q

p q p

15、如果价格指数降低后,原来的开支可多购得10%的商品,则价格指数应为

A. 90%

B. 110%

C. 91%

D. 无法判断

16、若产量增加5%,单位成本本期比基期下降5%,则生产总费用()

A. 增长

B. 减少

C. 没有变动

D. 不能确定

三、计算题(共38分)

1、为了解某银行营业厅办理某业务的办事效率,调查人员观察了解该银行营业厅办理该业务的柜台办理每笔业务的时间,随机纪录了15名客户办理业务的时间,测得平均办理时间t为12分钟,样本标准差s为4.1分钟,则

(1)该业务办理时间95%的置信区间是多少?(3 分)(2)若样本容量为40,而观测的数据不变,则该业务办理时间95%的置信区间是多少?(3 分)

2、某种生产线的感冒冲剂规定每包重量为12克,超重或过轻都是严重问题。从过去的资料得知σ是0.6克,质检员每两小时抽取25包冲剂称重检验,并作出是否停工的决策。假定产品质量服从正态分布。

(1)建立适当的原假设和备选假设(2 分)

(2)在α=0.05时,该检验的决策准则是什么?(3 分)

(3)如果x=12.25克,你将采取什么行动?(3 分)

(4)如果x=11.95克,你将采取什么行动?(3 分)

3、已知某地区1997年的农副产品收购总额为360亿元,1998年比上年的收购总额增长12%,农副产品收购价格总指数为105%,试考虑,1998年逾1997年对比:

(1)农民因教师农副产品共增加多少收入?(3 分)(2)农副产品收购量增加了百分之几?农民因此增加了多少收入?(3 分)(3)由于农副产品收购价格提高5%,农民又增加了多少收入?(3 分)(4)验证以上三方面分析的结论能否保持协调一致。(3 分)

4、一家人寿保险公司某险种的投保人数有20000人,据测算被保险人一年中的死亡率为万分之5。保险费每人50元。若一年中死亡,则保险公司赔付保险金额50000元。试求未来一年该保险公司将在该项保险中(这里不考虑保险公司的其它费用):

(1)至少获利50万元的概率;(3 分)(2)亏本的概率;(3 分)(3)支付保险金额的均值和标准差。(3 分)

参考答案

二、选择题

1 D

2 C

3 B

4 B

5 C

6 A

7 D

8 C

9 A

10 B 11 B 12 C 13 A 14 D 15 C 16 B

三、计算题

1、第1计算题

(1)t0.025(14)=2.145,n = 15,t=12,s = 4.1

]27.14,73.9[15

1.4145.212)14(025.0=?

±=?

±=n

s t t

(2)]27.13,73.10[15

1.496.112025.0=?±=?±=n

s z t

2、第2计算题

(1)12:;12:10≠≠μμH H

(2)检验问题属于小样本问题,因为标准差σ已知,因此构造检验统计量如下:

n

x z /0

σμ-=

,取α=0.025时,临界值 z 0.025=1.96。因此拒绝域|z|>1.96

(3)x =12.25克,08.225

/6.01225.12/0

=-=

-=n

x z σμ,由于|z|=2.08>1.96,拒绝原假设,应该对

生产线进行停工检查 (4)x =11.95克,42.025

/6.01295.11/0

-=-=

-=

n

x z σμ

由于|z|=0.42<1.96,不能拒绝原假设,照常生产

3、第3计算题

(1)360*12%=43.2

(2)112%/105%=106.67%; 360*6.67%=24 (3)360*106.67%*5%=19.2

(4)106.67%*105%=112%; 24+19.2= 43.2 显然协调一致

4、第4计算题

设被保险人死亡数=X ,X ~B (20000,0.0005)。

(1)收入=20000×50(元)=100万元。要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过10人。所求概率为:P(X ≤10)=0.58304。 (2)当被保险人死亡数超过20人时,保险公司就要亏本。所求概率为: P(X >20)=1-P(X ≤20)=1-0.99842=0.00158 (3)支付保险金额的均值=50000×E (X )

=50000×20000×0.0005(元)=50(万元)

支付保险金额的标准差=50000×σ(X )

=50000×(20000×0.0005×0.9995)1/2=158074(元)

南京大学2015年攻读硕士学位研究生入学考试试题

考试科目:统计学 科目代码:432 考试时间: 月 日

(注:特别提醒所有答案一律写在答题纸上,直接写在试题或草稿纸上的无效!)

——————————————————————————————— 一、简答题(共30分,每小题6分)

1、什么是相关性分析?什么是回归分析?

2、时间序列由哪几部分组成?有几种方法计算趋势项?

3、什么是统计抽样?有哪几种抽样类型?各举例说明

4、什么是绝对量指标?什么是相对量指标?举例说明

5、反映数据集中程度的数字特征有哪些?反映数据离散程度的数字特征有哪些?

二、选择题(共30分,每小题2分)

1、某股票在2000年-2003年的年收益率分别是4.5%、2.1%、25.5%和1.9%,该股票在这四年的平均收益率为()

A. 7.821%

B. 8.079%

C. 8.5%

D. 7.5%

2、下列叙述正确的是()

A. 众数可以用于数值型数据

B. 中位数可以用于分类数据

C. 几何平均数可以用于顺序数据

D. 均值可以用于分类数据

3、设一随机变量X 的分布函数为

????

??

?≤<≤<≤<≤=4

30

.1328.0213.011.0)(x x x x x F ,则}32{≤

A. 0.3

B. 0.4

C. 0.5

D. 0.8

4、设X 为一离散型随机变量,xi 为X 的任意一个取值,则下列关系中错误的是() A. 0)(≥i x P B.

1)(=∑i

x P C. 0)()]([2>-∑i i

x P X E x

D.

1)(=∑i

i

x P x

5、一本书排版后,一校时出现的平均错误处数为200,标准差为400.随机抽取排版后的一本书

稿,出现错误的处数介于190~210之间的概率是( ) A .0.50 B. 0.68 C. 0.90 D. 0.38

6、当置信水平一定时,置信区间的宽度() A. 随着样本容量的增大而减少 B. 随着样本容量的增大而增大 C .与样本容量大小无关

D. 与样本容量的平方根成正比

7、如果两个变量的协方差小于0,则二者的相关系数必定是() A. 正相关 B. 负相关 C. 高度相关 D. 不相关 8、在一元回归模型中,作了t 检验后再作F 检验

A .无意义 B. 与t 检验的结论相同 C. 与t 检验的结论不同 D.与可决系数的结论不同 9、研究长期趋势的目的在于() A. 认识现象随时间演变的趋势和规律 B. 分析和确定报告期水平 C. 研究趋势变动的经济效果 D. 分析趋势产生的原因

10、对于包含四个构成因素(T,S,C,I)的时间序列,以原始序列各项数值除以移动平均值(其平均项数与季节周期长度相等)后所得比率() A. 只包含趋势因素 B. 只包含不规则因素

C. 消除了趋势和循环因素

D. 消除了趋势和不规则因素 11、下面属于价格指数的是: A.

∑∑0

11q

p q p B.

∑∑1

011q

p q p C.

∑∑0

11

1q

p q p D.

∑∑0

10q

p q p

12、某地区商品零售总额比上年增长20%,扣除价格因素实际增长11%,则可推断该地区的物价指数为()

A. 9%

B. 8.1%

C. 109

D. 108.1

13、时间序列的长期趋势拟合为指数曲线t t

ab Y =?时,若b=0.75,表明该事件序列( ) A. 每期增长速度为75% B. 每期发展速度为175%

C. 逐期增长速度为25%

D. 逐期下降25% 14、下面的说法正确的是( ) A. 原假设正确的概率为α

B. 如果原假设被拒绝,就可以证明备选假设是正确的

C. 如果原假设未被拒绝,也不能证明原假设是正确的

D. 如果原假设未被拒绝,就可以证明原假设是正确的

15、从服从正态分布的无限总体中抽取容量为n 的样本,当样本容量n 增大时,样本均值的标准差( )

A. 增加

B. 不变

C. 减小

D. 无法确定

三、计算题(共40分)

1、某大学生纪录了自己一个月31天的伙食费,经计算得出了这个月平均每天花费10.2元,标准差为2.4元。若显著性水平为95%,试估计该学生每天平均伙食费的置信区间。 (5分)

2、电视机显像管批量生产的质量标准是平均使用寿命为1200小时,标准差为300小时。某电视机厂宣称其生产的显像管质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均寿命为1245小时,能否说该厂的显像管质量显著的高于规定标准呢? (1)给出上述检验的原假设和备选假设 (2分)

(2)构造适当的检验统计量,并进行假设检验,分析可能会犯的错误(α=0.05)(4分) (3)若要拒绝原假设,样本平均寿命至少要达到多少,此时可能会犯哪类错误,大小如何?(4分)

3、某汽车制造厂2003年产量为30万辆。

(1)若规定2004-2006年年产量递增速度不低于6%,其后的年递增速度不低于5%,2008年该厂汽车产量将达到多少? (3分)

(2)若规定2013年汽车产量在2003年的基础上翻一番,2004年的增长速度可望达到7.8%,问以后9年应以怎样的速度增长才能达到预定目标? (3分)

(3)若规定2013年汽车产量在2003年的基础上翻一番,并要求每年保持7.4%的增长速度,问能提前多少时间达到预定目标? (3分)

4

(15分)

参考答案

一、见参考书

二、选择题 1 B 2 A 3 C 4 D 5 D 6 A 7 B 8 B 9 A

10 C 11 B 12 D 13 D 14 C 15 C

三、计算题 1、解

已知:96.1,4.2,2.10025.0===z s x ,置信区间

]04.11,36.9[31

4.296.12.1002

5.0=?

±=?

±=n

s z x

2、解

(1)1200:;1200:10>≤μμH H

(2)检验问题属于大样本问题,因此构造检验统计量如下:

n

x z /0

σμ-=

由题知:1245,100,300,12000====x n σμ,检验统计量的z 值:z=1.5

取α=0.05时,拒绝域为z>z α=z 0.05=1.645。因为z=1.5<1.645故落入接受域,这说明没有充分理由认为该厂的显像管质量明显高于规定的标准。

(3)由(2)分析知,拒绝域为z>z α=z 0.05=1.645,这要求

645.1/0

=>-=

ασμz n

x z 则有

35.1249100

300*

645.11200645.10=+=?

+>n

x σ

μ

这说明只有样本均值达到1249.35以上时,才有充分利用认为该厂的显像管质量显著高于规定的标准,这时我们犯错误的概率为0.05

3、解

(1)30*1.063*1.052=30*1.3131=39.393万辆

(2)%11.71078.1/21)078.1*30/()2*30(99=-=- (3)设按7.4%的增长速度n 年可翻一番,则有 1.074n=60/30=2 N=log2/log1.074=9.71

0.29*12=3.5,即提前大约3个半月达到翻一番预定目标。

4、解:设产品单位成本为 x ,产量为f ,则总成本为xf ,

由于:平均成本x =

xf f

∑∑=

总成本

总产量

,而已知数据中缺产量f 的数据,

又因个别产品产量f =

该产品成本该产品单位成本=xf

x

从而 x =

xf xf x

∑∑,于是得:

甲企业平均成本=

xf xf x ∑∑=

210030001500

210030001500

152030++++=19.41(元),

乙企业平均成本=xf xf x

∑∑=

325515001500

325515001500

152030

++++=18.29(元),

对比可见,甲企业的总平均成本较高。

南京大学2014年攻读硕士学位研究生入学考试试题

考试科目:统计学科目代码:432 考试时间:月日(注:特别提醒所有答案一律写在答题纸上,直接写在试题或草稿纸上的无效!)

———————————————————————————————

一、名词解释(共30分,每小题6分)

1、统计量,并举例说明

2、什么是数据信息的误差?它主要有哪两种形式

3、统计表的构成有哪些部分,并举例说明

4、算术平均数,中位数,众数的适用范围是什么

5、测定季节变动的方法有哪几类

二、选择题(共30分,每小题2分)

1、与概率抽样相比,非概率抽样的缺点是()

A.样本统计量的分布是确定的

B.无法使用样本的结果对总体相应的参数进行推断

C.调查的成本比较高

D.不适合于探索性的研究

2、指出下面的陈述中哪一个是错误的()

A. 抽样误差只存在于概率抽样中

B. 非抽样误差只存在于非概率抽样中

C. 无论是概率抽样还是非概率抽样都存在非抽样误差

D. 在全面调查中也存在非抽样误差

3、样本或总体中各不同类别数值之间的比值是()

A.频数

B.频率

C.比例

D.比率

4、将某企业职工的月收入依次分为2000元以下、2000~3000元、3000~4000元、4000~5000元、5000元以上几个组,最后一组的组中值近似为()

A. 5000元

B. 7500元

C. 5500元

D. 6500元

5、下列叙述正确的是()

A. 如果计算每个数据与平均数的离差,则这些离差的总和总是等于0

B. 如果考试成绩的分布是对称的,平均数为75,标准差为12 ,则考试成绩在63~75分之间的

比例大约为95%

C. 平均数与中位数相等

D. 中位数大于平均数

6、已知一批产品的次品率为4%,从中有放回的抽取5个,则5个产品中没有次品的概率为() A. 0.815 B. 0.170 C. 0.014 D. 0.999

7、某厂家生产的灯泡寿命的均值为60小时,标准差为4小时,如果随机从中抽取30只灯泡进行检测,则样本均值() A. 抽样分布的标准差为4小时 B. 抽样分布近似等同于总体分布 C. 抽样分布的中位数为60小时

D. 抽样分布近似等同于正态分布,均值为60小时

8、当样本量一定时,置信区间的宽度( )

A. 随着置信系数的增大而减小

B. 随着置信系数的增大而增大

C. 与置信系数无关

D. 与置信系数的平方成反比

9、随机抽取一个n=100的样本,计算得到x =60,s=15,要检验假设65:;65:10≠=μμH H 检验的统计量为()

A. -3.33

B. 3.33

C. -2.36

D. 2.36

10、在某城市,家庭每天的平均消费额为90元,从该城市中随机抽取15个家庭组成一个随机样本,得到样本均值为84.5元,标准差为14.5元。在α=0.05的显著性水平下,检验假设

90:;90:10≠=μμH H ,得到的结论是()

A. 拒绝H0;

B. 不拒绝H0

C. 可以拒绝也可以不拒绝H0

D. 可能拒绝也可能不拒绝H0

11、如果相关系数r=0,则表明两个变量之间()

A. 相关程度很低

B. 不存在任何关系

C. 不存在线性相关关系

D. 存在非线性相关关系

12、某种股票的价格周二上涨了10%,周三上涨了5%,两天累计上涨了() A. 15% B. 15.5% C. 4.8% D. 5%

13、某地区农民家庭的年平均收入2004年为1500元,2005年增长了8%,那么2005年与2004年相比,每增长1个百分点增加的收入额为() A. 7元 B. 8元 C. 15元 D. 40元

14、某地区商品零售总额比上年增长20%,扣除价格因素实际增长11%,则可推断该地区的物价指数为( )

A.9%

B.8.1%

C. 109%

D. 108.1%

15、设p 为商品价格,q 围殴销售量,则指数

∑∑1

011q

p q p 的经济意义是综合反映( )

A. 计算期销售量的规模

B. 计算期价格总水平

C. 销售量规模的变动程度

D. 价格总水平的变动程度

三、计算题(共40分,每小题10分)

1、某种纤维原有的平均强度不超过6克,现希望通过改进工艺来提高其平均强度。研究人员测得了100个关于新纤维的强度数据,发现其均值为6.35。假定纤维强度的标准差仍保持为1.19不变,在5%的显著性水平下对该问题进行假设检验。

(1) 选择检验统计量并说明其抽样分布是什么样的? (2) 检验的拒绝规则是什么?

(3)计算检验统计量的值,你的结论是什么?

2、表中给出y 对2x 和3x 回归的结果:

离差来源 平方和(SS ) 自由度(df ) 平方和的均值(MSS ) 来自回归(ESS ) 65965 来自残差(RSS ) 总离差(TSS ) 66042 14

(1) 该回归分析中样本容量是多少? (2) 计算RSS ;

(3) ESS 和RSS 的自由度是多少? (4) 计算可决系数和修正的可决系数;

(5) 怎样检验2x 和3x 对y 是否有显著影响?根据以上信息能否确定2x 和3x 各自对y 的

贡献为多少?

3、某地区国内生产总值在1991—1993年平均每年递增12%,1994--1997年平均每年递增10%,1998--2000年平均每年递增8%。试计算:

(1)该地区国内生产总值在这10年间的发展总速度和平均增长速度;

(2)若2000年的国内生产总值为500亿元,以后平均每年增长6%,到2002年可达多少? (3)若2002年的国内生产总值的计划任务为570亿元,一季度的季节比率为105%,则2002年一季度的计划任务应为多少?

4、给出某市场上四种蔬菜的销售资料如下表:

⑵再用帕氏公式编制四种蔬菜的销售量总指数和价格总指数;

⑶比较两种公式编制出来的销售量总指数和价格总指数的差异。

参考答案 二、选择题 1 B 2 B 3 D

4 C

5 A

6 A

7 D

8 B 9 C

10 B 11 C 12 B 13 C 14 D 15 D

(1)),

(~2

n

N x σμ

(2)H0:μ≤6;H1:μ>6

(3)6449

.1)

1,0(~/=-ασμ

z N n x ,z=2.94>1.6449,拒绝原假设,接受备选假设

2、(1)该回归分析中样本容量是14+1=15;

(2)计算RSS =66042-65965=77;

ESS 的自由度为k-1=2,RSS 的自由度 n -k =15-3=12;

(3)计算:可决系数 2

65965/660420.9988R ==

修正的可决系数

2151

1(10.9988)0.9986153R -=-

?-=-

(4)检验X 2和X 3对Y 是否有显著影响

/(1)65965/232982

5140.11

/()77/12 6.4166ESS k F RSS n k -=

===-

(5) F 统计量远比F 临界值大,说明X 2和X 3联合起来对Y 有显著影响,但并不能确定X 2

和X 3各自对Y 的贡献为多少。

3、 (1)发展总速度%12.259%)81(%)101(%)121(3

4

3

=+?+?+

平均增长速度=

%9892.91%12.25910=-

(2)8.561%)61(5002

=+?(亿元)

(3)平均数∑====415

.142457041j j y y (亿元),

2002年一季度的计划任务:625.1495.142%105=?(亿元)。

4、设销售量为q ,价格为p ,则价值量指标、数量指标、质量指标三者关系为: 销售额=销售量×价格 qp = q × p

于是,对已知表格标注符号,并利用Excel 计算各综合指数的构成元素如下:

于是代入相应公式计算得: ⑴用拉氏公式编制总指数为: 四种蔬菜的销售量总指数 1000

2124

104.16% , 2039.2

q q p L q p

=

=

=∑∑

四种蔬菜的价格总指数 010

2196.8

107.73%2039.2

p q p L q p

=

=

=∑∑

⑵ 用帕氏公式编制总指数:

四种蔬菜的销售量总指数为 11

01

2281

103.83% 2196.8

q q p P q p

=

=

=∑∑

四种蔬菜的价格总指数为 111

2281

107.39%2124

p

q p P q p

=

=

=∑∑ ⑶ 比较两种公式编制出来的销售量总指数和价格总指数,可见:拉氏指数>帕氏指数 在经济意义上,拉氏指数将同度量因素固定在基期。销售量总指数说明消费者为保持与基期相同的消费价格,因调整增减的实际购买量而导致实际开支增减的百分比;价格总指数说明消费者为购买与基期相同数量的四种蔬菜,因价格的变化而导致实际开支增减的百分比。

帕氏指数将同度量因素固定在计算期。销售量总指数说明消费者在计算期购买的四种蔬菜,因销售量的变化而导致实际开支增减的百分比;价格总指数说明消费者在计算期实际购买的四种蔬菜,因价格的变化而导致实际开支增减的百分比。

相关主题
相关文档
最新文档