统计学导论课后答案兼历年真题(1)

统计学导论课后答案兼历年真题(1)
统计学导论课后答案兼历年真题(1)

《统计学导论》课后习题部分参考解答

第一章

一、判断题

1.答:错。统计学和数学具有不同的性质特点。数学撇开具体的对象,以最一般的形式研究数量的联系和空间形式;而统计学的数据则总是与客观的对象联系在一起。特别是统计学中的应用统计学与各不同领域的实质性学科有着非常密切的联系,是有具体对象的方法论。

3.答:错。实质性科学研究该领域现象的本质关系和变化规律;而统计学则是为研究认识这些关系和规律提供合适的方法,特别是数量分析的方法。

5.答:错。描述统计不仅仅使用文字和图表来描述,更重要的是要利用有关统计指标反映客观事物的数量特征。

7.答:错。不少社会经济的统计问题属于无限总体。例如要研究消费者的消费倾向,消费者不仅包括现在的消费者而且还包括未来的消费者,因而实际上是一个无限总体。

二、单项选择题 1. A; 3.A。

三、分析问答题

1.答:定类尺度的数学特征是“=”或“≠”,所以只可用来分类,民族可以区分为汉、藏、回等,但没有顺序和优劣之分,所以是定类尺度数据。;定序尺度的数学特征是“>”或“<”,所以它不但可以分类,还可以反映各类的优劣和顺序,教育程度可划分为大学、中学和小学,属于定序尺度数据;定距尺度的主要数学特征是“+”或“-”,它不但可以排序,还可以用确切的数值反映现象在两方面的差异,人口数、信教人数、进出口总额都是定距尺度数据;定比尺度的主要数学特征是“?”或“÷”,它通常都是相对数或平均数,所以经济增长率是定比尺度数据。

3.答:如考察全国居民人均住房情况,全国所有居民构成统计总体,每一户居民是总体单位,抽查其中5000户,这被调查的5000户居民构成样本。

第二章

一、单项选择题 1.C; 3.A。二、多项选择题 1.A.B.C.D; 3.A.B.C.

三、简答题

1.答:这种说法不对。从理论上分析,统计上的误差可分为登记性误差、代表性误差和推算误差。无论是全面调查还是抽样调查都会存在登记误差。而代表性误差和推算误差则是抽样调查所固有的。这样从表面来看,似乎全面调查的准确性一定会高于统计估算。但是,在全面调查的登记误差特别是其中的系统误差相当大,而抽样调查实现了科学化和规范化的场合,后者的误差也有可能小于前者。我国农产量调查中,利用抽样调查资料估算的粮食产量数字的可信程度大于全面报表的可信程度,就是一个很

有说服力的事例。

3.答:这种分组方法不合适。统计分组应该遵循“互斥性原则”,本题所示的分组方式违反了“互斥性原则”,例如,一观众是少女,若按以上分组,她既可被分在女组,又可被分在少组。 四、计算题

解(1)次(频)数分布和频率分布数列。

第三章

一、

单项选择题 1. D ; 3.B ; 5. A 。

二、判断分析题

1.答:均值。呈右偏分布。由于存在极大值,使均值高于中位数和众数,而只有较少的数据高于均值。

3.答:峰度系数48

.03%)

10100(3480034

4

4

=-?=

-=σ

m K ,属于尖顶分布。

5.答:为了了解房屋价格变化的走势,宜选择住房价格的中位数来观察,因为均值受极端值影响;如果为了确定交易税率,估计相应税收总额,应利用均值,因为均值才能推算总体有关的总量。

三、计算题

1.解:基期总平均成本=1800

12001800

7001200600+?+?=660

报告期总平均成本=

1600

24001600

7002400600+?+?=640

总平均成本下降的原因是该公司产品的生产结构发生了变化,即成本较低的甲企业产量占比上升而成本较高的乙企业产量占比相应下降所致。

(6)C B A ;(7)C

B A

C B A C B A ++

3.答:A 表示没有次品;B 表示次品不超过一件。

二、计算题

1.解:设A 、B 、C 分别表示炸弹炸中第一军火库、第二军火库、第三军火库这三个事件。于是,P (A )=0.025 P (B )=0.1 P (C )=0.1 又以D 表示军火库爆炸这一事件,则有,D=A+B+C 其中A 、B 、C 是互不相容事件(一个炸弹不会同时炸中两个或两个以上军火库)

∴P (D )=P (A )+P (B )+P (C )=0.025 + 0.1+ 0.1=0.225 3.解:设A 表示这种动物活到20岁、B 表示这种动物活到25岁。

∵B ?A ∴B=AB ∴P (B|A )=

()(A P AB P =

)()(A P B P =8

.04.0=0.5

5.解:设 B 1={第一台车床的产品};B 2={第二台车床的产品};A={合格品}。 则 P (B 1)=

3

2 P (B 2)=

3

1 P (A|B 1)=1-0.03=0.97 P (A|B 2)=1-0.02=0.98

由全概率公式得:

P (A )= P (B 1)* P (A|B 1)+ P (B 2)* P (A|B 2)=

3

2*0.97+

3

1*0.98=0.973

E (X )=i i p x ∑ =2*

36

1+3*

36

2+4*

36

3+5*

36

4+6*

36

5+7*

36

6+8*

36

5+9*

36

4+10*

36

3+11*

36

2+12*

36

1=36

252=7

V (X )=[()]i 2

i p X E -x ∑

=()

2

72-*36

1+()273-*36

2+()

2

74-*

36

3+()275-*36

4+()276-*

36

5+()2

77-*

36

6+()278-*

36

5+()279-*

36

4+

()

2

710

-*

36

3+()

2

711

-*

36

2+()

2

712

-*

36

1

=36

210=5.833

17.解:050

C

50

00.0510.05)

(-+150

C

49

10.0510.05)

(-=0.0769+0.2025=0.2794

三、证明题

因)()(1

=-

=-j j i i X n

X D X X D

)1(

1∑

≠=-

-=n

i

j j j

i n

X X n

n D

2

2

2

2

1)1(σσ

n

n n n -+

-=

2

1

σn

n -=

第五章

一、

单项选择题 (1)BC ; (3)A ; (5)AC 。

二、计算题 1.解:

样本平均数 X =425

X S

S

8.488 2.1916=

=

29

1537520

7.解:

2

(40)

0.975

24.433χ=,2(40)

0.025

59.342χ=,置信度为0.95的置信区间为:

()()22

1122

212(1)(1),n n n S n S ααχχ---??-- ? ???

=2240124012,(97.064,235.747)59.34224.433??

??=

??? 9.解:

()

()

22

2

2

22

2

2

11500 1.960.25(10.25)115000.05 1.960.25(10.25)

P N z P P n N z P P α

α

-???-=

=

?+-?+??-

241.695=

应抽取242户进行调查。

第六章

(3)确定临界值和拒绝域

Z 0.025=1.96

∴拒绝域为 (][)+∞-∞-,96.196.1, (4)做出检验决策

∵Z =2.222> Z 0.025=1.96

检验统计量的样本观测值落在拒绝域。

∴拒绝原假设H0,接受H1假设,认为该县六年级男生体重的数学期望不等于60公斤。α=0.01时

(1)提出假设:

H0:μ=60

H1:μ≠60

(2)构造检验统计量并计算样本观测值

在H0:μ=60成立条件下:

∴拒绝原假设H0,接受H1假设,即能够推翻所作的猜测。

7.解:

(1)提出假设:

H0:μ1=μ 2

H1:μ1≠μ 2

(2)构造检验统计量并计算样本观测值

在H0成立条件下:

Z=

2

2

21

2

1

21n s n s y y +

-=

200

20

200

25

62672

2

+

-=2.209

(3)确定临界值和拒绝域

Z 0.025=1.96

∴拒绝域为 (][)+∞-∞-,96.196.1,

(4)做出检验决策

m=2 n 1=26 n 2=24 n=50 ?∑1y =11122 ?∑2y =10725 ??∑y = 21847

2

1y ?∑=4930980 2

2y ?∑=5008425 2

y ??∑=9939405

组间变差 SSR=∑

=?m

1

i i i 2y n -n 2y

?

?

=26* 2

26

11122)(+24*2

24

10725)(

-50*2

50

21847)(

=9550383.76-9545828.18 =4555.58

组内变差 SSE=∑

m

n 2

ij i

y -∑?m

i i 2

y n

=

α=?1

i i i ?

?=11*2

11

5492)

+15*2

15

6730)(

+12*2

12

5070)

+12*2

12

4555

)(

-50*

2

50

21847)

=9632609.568-9545828.18

=86781.388

组内变差

SSE=∑

==m

1

i n 1

j 2

ij i

y -∑=?m

1

i i i 2

y n =9939405-9632609.568=306795.432

(3)构造检验统计量并计算样本观测值

F=

)

/()1/(m n SSE m SSR --=

)

450/(432.306795)14/(388.86781--=4.3372

(4)确定临界值和拒绝域

F 0.05(3,46)=2.816

∴拒绝域为:[)+∞,816.2

(5)做出检验决策

=

α

∑∑∑

∑∑∑∑

-+---

=-----

+--+---

=2

2

2

2

2

2

2

2

2

2

22

2

2

2

)

(1

])

([]

)

(][

)

([2])([)

(])([X X

X X

X

X a X X X

X X X X

X a X X

X X X X X X a

t

t

t t t t t t t t

t t t t

t

t

σ

σ

σ

σ

σ

分析此式:由于第二项∑-2

2

)

(1

X X

t

σ

是常数,所以)~

var(2β只能通过第一项

∑---

2

2

2

])

([X X

X

X a t

t t σ

的处理使之最小化。明显,只有当 ∑--=

2

)

(X X

X

X a t

t t 时,)~

var(2β才可以

取最小值,即:

)?var()

(1

)~

var(min 2

2

2

2βσ

β=-=∑X X

t

所以,2?β是标准一元线性回归模型中总体回归系数2β的最优线性无偏估计量。

(1)回归分析的Excel 操作步骤为:

步骤一:首先对原先Excel 数据表作适当修改,添加“滞后一期的消费”数据到表中。 步骤二:进行回归分析

选择“工具” →“数据分析” →“回归”,在该窗口中选定自变量和因变量的数据区域,最后点击“确定”完成操作:

得到回归方程为:

12640.04471.07965.466-++=t t t C Y C

(2)从回归分析的结果可知:

随机误差项的标准差估计值:S =442.2165

修正自由度的决定系数:Adjusted R Squares =0.9994 各回归系数的t 统计量为:

3533.31

?=βt ;6603.152

?=βt ;9389.43

?=βt

F 统计量为16484.6,远远大于临界值3.52,说明整个方程非常显著。 (3)预测

使用Excel 进行区间估计步骤如下: 步骤一:构造工作表

0 H 1 :广告前后销售量有变化

符号及秩次的确定见表。

检验统计量R=21.5。当α=0.05,n=9时,查表得9,0.055R =,R=21.5>5,因此不能拒绝原假设H 0,说明广告宣传没有扩大销售量。

(3)列表

(4)构造检验统计量并计算样本观测值

2

)50(χ=∑

n

I

2

i i E -V )

(=0.9528

=R

记d ()

∑∑-+∑=∑∑-=i

i i i i

i i S R S R S R d 22

2

2

2

从而得到

()2

6

)

12)(1(2

12

222

∑-

++=

∑∑

∑∑-+=

i

i

i

i

i i d n n n d

S

R S R

将其代入式(2)得到

()()

12

1

4

126

)12)(1(2

2

2

-+-

∑-

++=

n

n n n d n n n r i s =(

)

1

612

2

-∑-

n

n d i

证毕。

第九章

一、选择题 1.C 3.B 5.C 二、判断分析题 1.正确; 3.正确。

5.错误。前10年的平均增长速度为7.177%,后4年的平均增长速度为8.775%。这14年间总的增长速度为180%(即2004年比1990年增长180%)。

一阶自回归模型预测的结果为:

84.9205918083754.02228.1517?26=?+=y

第十章

一、选择题 1.D ; 3.A ; 5.B ; 7.D ; 9.C 。 二、判断分析题

1.实际收入水平只提高了9.1%(=120%/110%-100%)。

3.不正确。对于总指数而言,只有当各期指数的权数固定不变时,定基指数才等于相应环比指数的连乘积。

5.同度量因素与指数化指标的乘积是一个同度量、可加总的总量。同度量因素具有权衡影响轻重的作用,故又称为权数。平均指数中的权数一般是基期和报告期总量(总值),或是固定的比重权数。

7.将各因素合理排序,才便于确定各个因素固定的时期;便于指标的合并与细分;也便于大家都按统一的方法进行分析,以保证分析结果的规范性和可比性。“连锁替代法”适用于按“先数量指标、后质量指标”的原则对各个因素进行合理排序的情况。

三、计算题

本(

125.07%=115.45%×108.34%,6.5692=4.3846+2.1846(元)。

产品质量变化体现在产品的等级结构变化方面,因此,根据结构影响指数可知,质量变化使总平均价格上升8.34%,即提高了2.1846元,按报告期销售量计算,质量变化使总收入增加了28400(元),即:

2.1846(元)×130(百件)=284 (百元)=28400(元)

第十一章

一、选择题1.A.B.C.D。 3. B.C。

二、计算题

1.解:

(1)根据最大的最大收益值准则,应该选择方案一。 (2)根据最大的最小收益值准则,应该选择方案三。

(3)在市场需求大的情况下,采用方案一可获得最大收益,故有: 400),(max 1=θi i

a Q

在市场需求中的情况下,采用方案二可获得最大收益,故有: 200),(max 2=θi i

a Q

(1) 根据现有信息,生产该品种的期望收益为41.5万元大于不生产的期望收益,因此可生产。 (2) 自行调查得出受欢迎结论的概率=0.65*0.7+0.35*0.30=0.56,

市场欢迎的后验概率=0.65*0.7/0.56=0.8125

期望收益值=(77*0.8125 -33*0.1875)0.56+(-3*0.44) =30.25万元

自行调查的可靠性不高,并要花费相应的费用,其后验分析最佳方案的期望收益值小于先验分析最佳方案的期望收益,所以不宜采用该方案。

(3) 委托调查得出受欢迎结论的概率=0.65*0.95 +0.35*0.05 =0.6825

市场欢迎的后验概率= 0.65*0.95 /0.6825=0.9744

期望收益=(75*0.9744 -35*0.0256)0.6825 +(-5*0.3175)=47.67万元

委托调查虽然要付出较高的费用,但比较可靠,其后验分析最佳方案的期望收益大于先验分析最佳方案的期望收益,所以应采用该方案。

第十二章

一、判断题 1.错;3.错;5.对

二、计算题

3.

(2)题中所示5个指标中,每天污水处理量、BOD S去除率、悬浮物去除率三项指标为正指标;处理1吨污水消耗空气量、去除1公斤BOD S耗电量两项指标为逆指标。

根据相对化处理公式:正指标:/i i m x x x '=,逆指标:/i m i x x x '=

123、4 5 6、 7850,2000,1250,1630,则中位数为( ): A 、1020;B 、960;C 、1080;D 、950

8、一位投资者持有一种股票,在2000年、2001年、2002年、2003年和2004年收益率分别为4.2%、2%、

20%、15%、6%,则该投资者在这五年的平均收益率为: A 、9.44%; B 、9.23%; C 、9.12%; D 、9.52%;

9、某企业某种产品上年实际成本为450元,本年计划降低4%,实际降低3.5%,则成本降低计划超额完成程度为( )

A 、1.053%;

B 、98.96%;

C 、1%;

D 、1.042%;

《统计学概论》计算题参考答案解析

《统计学概论》习题解答 第二章 统计数据的搜集、整理与显示 10. 某银行网点连续40天客户人数如下表,根据上表进行适当分组,编制频数分布数列并绘制直方图 470 250 290 470 380 340 300 380 430 400 460 360 450 370 370 360 450 440 350 420 350 290 460 340 300 370 440 260 380 440 420 360 370 440 420 360 370 370 490 390 (1)资料排序: 440 430 420 420 420 400 390 380 380 380 370 370 370 370 370 370 360 360 360 360 (2)分组类型—连续组距式分组; (3)组距: (4)组限: 250、290、330、370、410、450、490 某银行网点40天接待客户分布表 40322.31240lg d += () 户40602.1322.31240 ≈?+=()人240250490=-=R

2 4 6 8 10 12 250 290 330 370 410 450 490 530 某银行网点40天接待客户分布直方图 客户 天

第三章 统计分布的数值特征 【7】某大型集团公司下属35个企业工人工资变量数列如下表所示: 月 工 资(元) 企 业 数 比 重(%) ∑? f f x 分 组 组中值x (个) ∑f f 600以下 550 5 10 55.0 600—700 650 8 25 162.5 700—800 750 10 30 225.0 800—900 850 7 20 170.0 900以上 950 5 15 142.5 合 计 — 35 100 755.0 试计算该企业平均工资。(注:比重——各组工人人数在工人总数中所占的比重) 【解】 该集团公司职工的平均工资为755元/人。 【8】某地甲、乙两个农贸市场三种主要水果价格及销售额资料见下表 品 种 价 格 (元/千克) 甲 市 场 乙 市 场 销售额 (万元) 销量 比重 销售额 (万元) 销量 比重 (万千克) (%) (千克) (%) x m x m f = ∑f f m x m f = ∑f f 甲 2.0 80 40 44.5 60 300 000 30.0 乙 3.0 90 30 33.3 120 400 000 40.0 丙 2.5 50 20 22.2 75 300 000 30.0 合 计 — 220 90 100.0 255 1 000 000 100.0 试计算比较该地区哪个农贸市场水果平均价格高?并说明原因。 解: ()千克元甲市场水果平均价格44.2000900000 2002== ()千克元乙市场水果平均价格55.20000001000 5502== 甲市场以较低价格销售的水果所占的比重比乙市场以相同价格销售的水果的比重大,反之,正好情况相反,故甲市场水果的平均价格较低。 【10】根据某城市500户居民家计调查结果,将居民户按其食品开支占全部消费开支的比重(即恩格 尔系数)分组后,得到如下的频数分布资料: 恩格尔系数 ( % ) 户 数 向上累计户数 x f (户%) 分 组 组中值( % ) (户) (户) x f ∑f 20以下 15 6 6 0.90 20—30 25 38 44 9.50

统计学导论第二版习题详解

统计学导论(第二版)习题详解 第一章 一、判断题 一、判断题 1.统计学是数学的一个分支。 答:错。统计学和数学都是研究数量关系的,两者虽然关系非常密切,但两个学科有不同的性质特点。数学撇开具体的对象,以最一般的形式研究数量的联系和空间形式;而统计学的数据则总是与客观的对象联系在一起。特别是统计学中的应用统计学与各不同领域的实质性学科有着非常密切的联系,是有具体对象的方法论。。从研究方法看,数学的研究方法主要是逻辑推理和演绎论证的方法,而统计的方法,本质上是归纳的方法。统计学家特别是应用统计学家则需要深入实际,进行调查或实验去取得数据,研究时不仅要运用统计的方法,而且还要掌握某一专门领域的知识,才能得到有意义的成果。从成果评价标准看,数学注意方法推导的严谨性和正确性。统计学则更加注意方法的适用性和可操作性。 2.统计学是一门独立的社会科学。 答:错。统计学是跨社会科学领域和自然科学领域的多学科性的科学。 3.统计学是一门实质性科学。 答:错。实质性的科学研究该领域现象的本质关系和变化规律;而统计学则是为研究认识这些关系和规律提供数量分析的方法。 4.统计学是一门方法论科学。 答:对。统计学是有关如何测定、收集和分析反映客观现象总体数量的数据,以帮助人们正确认识客观世界数量规律的方法论科学。 5.描述统计是用文字和图表对客观世界进行描述。 答:错。描述统计是对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用信息。描述统计不仅仅使用文字和图表来描述,更重要的是要利用有关统计指标反映客观事物的数量特征。 6.对于有限总体不必应用推断统计方法。 答:错。一些有限总体,由于各种原因,并不一定都能采用全面调查的方法。例如,某一批电视机是有限总体,要检验其显像管的寿命。不可能每一台都去进行观察和实验,只能应用抽样调查方法。 7.经济社会统计问题都属于有限总体的问题。 答:错。不少社会经济的统计问题属于无限总体。例如要研究消费者的消费倾向,消费者不仅包括现在的消费者而且还包括未来的消费者,因而实际上是一个无限总体。 8.理论统计学与应用统计学是两类性质不同的统计学。 答:对。理论统计具有通用方法论的性质,而应用统计学则与各不同领域的实质性学科有

医学统计学第七版课后答案及解析知识分享

医学统计学第七版课后答案及解析

医学统计学第七版课后答案 第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析

统计学概论课后答案 统计指数习题解答

第八章 对比分析与统计指数思考与练习 一、选择题: 1.某企业计划要求本月每万元产值能源消耗率指标比去年同期下降5%,实际降低了%,则该项计划的计划完成百分比为( d )。 a. % b. % c. % d. % 2.下列指标中属于强度相对指标的是( b )。 a..产值利润率 b.基尼系数 c. 恩格尔系数 d.人均消费支出 3.编制综合指数时,应固定的因素是(c )。 a .指数化指标 b.个体指数 c.同度量因素 d.被测定的因素 4.指出下列哪一个数量加权算术平均数指数,恒等于综合指数形式的拉氏数量指标指数(c )。 a . 1 010p q p q k q ∑∑;b. 1 111p q p q k q ∑∑;c. 000p q p q k q ∑∑; d. 101p q p q k q ∑∑ 5.之所以称为同度量因素,是因为:(a )。 a. 它可使得不同度量单位的现象总体转化为数量上可以加总; b. 客观上体现它在实际经济现象或过程中的份额; c. 是我们所要测定的那个因素; d. 它必须固定在相同的时期。 6.编制数量指标综合指数所采用的同度量因素是(a ) a . 质量指标 b .数量指标 c .综合指标 d .相对指标 7.空间价格指数一般可以采用( c )指数形式来编制。 a .拉氏指数 b.帕氏指数 c.马埃公式 d.平均指数 二、问答题: 1.报告期与基期相比,某城市居民消费价格指数为110%,居民可支配收入增加了20%,试问居民的实际收入水平提高了多少? 解:(1+20%)/110%-100%=%-100%=%

2.某公司报告期能源消耗总额为万元,与去年同期相比,所耗能源的价格平均上升了20%,那么按去年同期的能源价格计算,该公司报告期能源消耗总额应为多少? 解:÷(1+20%)=24万元 3.编制综合指数时,同度量因素的选择与指数化指标有什么关系?同度量因素为什么又称为权数?它与平均指数中的权数是否一致? 解:(略) 4.结构影响指数的数值越小,是否说明总体结构的变动程度越小?一般说来,当总体结构发生什么样的变动时,结构影响指数就会大于1。可结合具体事例来说明。 解:(略) 5.为什么在多因素指数分析中要强调各因素的排列顺序?“连锁替代法”是否适用于任一种排序的多因素分析? 解:(略) 6.某厂工人分为技术工和辅助工两类,技术工人的工资水平大大高于辅助工。最近,该厂一位财务人员对全厂工人的平均工资变动情况进行了动态对比,他发现与上年相比,全厂工人的平均工资下降了5%。而另一人则通过分析认为,全厂工人的工资水平并没有下降,而实际上工人的工资平均提高了5%。你认为这两人的分析结论是否矛盾?为什么? 解:不矛盾。前者依据的是可变构成指数的计算结果;后者依据的是固定构成指数的计算结果。 三、计算题 1. 某企业生产A、B两种产品,报告期和基期产量、出厂价格资料如下 要求:(1)用拉氏公式编制产品产量和出厂价格指数;(2)用帕氏公式编制产品产量和出厂价格指数;(3)比较两种公式编制的产量和销售量指数的差异。 解:(1)产品出厂量的拉氏指数:

医学统计学第七版课后答案及解析

医学统计学第七版部分课后答案及解析 第二章 1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean)。几何均数一般用G表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用M表示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓“开口”资料,是指数据的一端或者两端有不确定值。 百分位数(percentile)是一种位置指标,以P X表示,一个百分位数P X将全部观察值分为两个部分,理论上有X%的观察值比P X小,有(100-X)%观察值比P X大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、 及变异系数,尤以方差和标准差最为常用。 极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏; 2.不稳定。 四分位数间距(inter-quartile range)就是上四分位数与下四分位数之差,即:Q=Q U-Q L,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反映资料的离散程度。 方差(variance)和标准差(standard deviation)由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance,CV)亦称离散系数(coefficient of dispersion),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3.答:常用的相对数指标有:比,构成比和率。 比(ratio),又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百分之几,它是对比的最简单形式。其计算公式为比=A/B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千

统计学导论-曾五一课后习题复习资料

统计学导论习题参考解答 第一章(15-16) 一、判断题 1.答:错。统计学和数学具有不同的性质特点。数学撇开具体的对象,以最一般的形式研究数量的联系和空间形式;而统计学的数据则总是与客观的对象联系在一起。特别是统计学中的应用统计学与各不同领域的实质性学科有着非常密切的联系,是有具体对象的方法论。 2.答:对。 3.答:错。实质性科学研究该领域现象的本质关系和变化规律;而统计学则是为研究认识这些关系和规律提供合适的方法,特别是数量分析的方法。 4.答:对。 5.答:错。描述统计不仅仅使用文字和图表来描述,更重要的是要利用有关统计指标反映客观事物的数量特征。 6.答:错。有限总体全部统计成本太高,经常采用抽样调查,因此也必须使用推断技术。 7.答:错。不少社会经济的统计问题属于无限总体。例如要研究消费者的消费倾向,消费者不仅包括现在的消费者而且还包括未来的消费者,因而实际上是一个无限总体。 8.答:对。 二、单项选择题 1.A; 2.A; 3.A; 4.B。 三、分析问答题

1.答:定类尺度的数学特征是“=”或“≠”,所以只可用来分类,民族可以区分为汉、藏、回等,但没有顺序和优劣之分,所以是定类尺度数据。;定序尺度的数学特征是“>”或“<”,所以它不但可以分类,还可以反映各类的优劣和顺序,教育程度可划分为大学、中学和小学,属于定序尺度数据;定距尺度的主要数学特征是“+”或“-”,它不但可以排序,还可以用确切的数值反映现象在两方面的差异,人口数、信教人数、进出口总额都是定距尺度数据;定比尺度的主要数学特征是“?”或“÷”,它通常都是相对数或平均数,所以经济增长率是定比尺度数据。 2.答:某学生的年龄和性别,分别为20和女,是数量标志和品质标志;而全校学生资料汇总以后,发现男生1056,女生802人,其中平均年龄、男生女生之比都是质量指标,而年龄合计是数量指标。数量指标是个绝对数指标,而质量指标是指相对指标和平均指标。品质标志是不能用数字表示的标志,数量标志是直接可以用数字表示的标志。 3.答:如考察全国居民人均住房情况,全国所有居民构成统计总体,每一户居民是总体单位,抽查其中5000户,这被调查的5000户居民构成样本。 第二章(45-46) 一、单项选择题 1.C; 2.A; 3.A。 二、多项选择题 1.A.B.C.D; 2.A.B.D; 3.A.B.C.

《统计学概论》第八章课后练习题答案

《统计学概论》第八章课后练习答案 一、思考题 1.什么是相关系数?它与函数关系有什么不同?P237- P238 2.什么是正相关、负相关、无线性相关?试举例说明。P238- P239 3.相关系数r的意义是什么?如何根据相关系数来判定变量之间的相关系数?P245 4.简述等级相关系数的含义及其作用?P250 5.配合回归直线方程有什么要求?回归方程中参数a、b的经济含义是什么?P256 6.回归系数b与相关系数r之间有何关系?P258 7.回归分析与相关分析有什么联系与区别?P254 8.什么是估计标准误差?这个指标有什么作用?P261 9.估计标准误差与相关系数的关系如何?P258-P264 10.解释判定系数的意义和作用。P261 二、单项选择题 1.从变量之间相互关系的方向来看,相关关系可以分为()。A.正相关和负相关B.直线关系与曲线关系 C.单相关和复相关D.完全相关和不完全相关 2.相关分析和回归分析相比较,对变量的要求是不同的。回归分析中要求()。

A.因变量是随机的,自变量是给定的B.两个变量都是随机的 C.两个变量都不是随机的D.以上三个答案都不对 3.如果变量x与变量y之间的相关系数为-1,这说明两个变量之间是()。 A.低度相关关系B.完全相关关系 C.高度相关关系D.完全不相关 4.初学打字时练习的次数越多,出现错误的量就越少,这里“练习次数”与“错误量”之间的相关关系为()。 A.正相关B.高相关 C.负相关D.低相关 5.假设两变量呈线性关系,且两变量均为顺序变量,那么表现两变量相关关系时应选用()。 A.简单相关系数r B.等级相关系数r s C.回归系数b D.估计标准误差S yx 6.变量之间的相关程度越低,则相关系数的数值()。A.越大B.越接近0 C.越接近-1 D.越接近1 7.下列各组中,两个变量之间的相关程度最高的是()。A.商品销售额和商品销售量的相关系数是0.9

医学统计学第七版课后答案及解析

练习题答案 第一章医学统计中的基本概念 练习题 一、单向选择题 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 A.收缩压测量值 B.脉搏数 C.住院天数 D.病情程度 E.四种血型 4. 随机误差指的是 A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. 系统误差 C. 过失误差 D. 记录误差 E.仪器故障误差 答案: E E D E A 二、简答题 1.常见的三类误差是什么?应采取什么措施和方法加以控制? [参考答案] 常见的三类误差是:

(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校 正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。 (2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正, 但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素 造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳 压器、恒温装置等措施,从而达到控制的目的。 (3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本 均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引 起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。 2.抽样中要求每一个样本应该具有哪三性? [参考答案] 从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。 (1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。 (2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。 (3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测 总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出 其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生 困难,所以应以“足够”为准。需要作“样本例数估计”。 3.什么是两个样本之间的可比性? [参考答案] 可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。 (马斌荣) 第二章集中趋势的统计描述 练习题 一、单项选择题 1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是

统计学概论练习题及参考答案

统计学概论练习题及参考答案 20XX年《统计学概论》练习题 一、单项选择题 1.统计学的两大基本) A.统计资料的收集和分析B.理论统计和运用统计C.统计预测和决策D.描述统计和推断统计2.下面的变量中哪一个属于分类变量() A.年龄B.工资C.汽车产量D.付款方式(现金、信用卡、支票)3.下面哪一个图形最适合描述结构性问题() A.条形图B.饼图C.直方图D.折线图4.统计分组后,应使()A.组B.组D.组) A.众数B.中位数C.四分位数D.平均数 6.根据经验,当算术平均数小于中位数且小于众数时,次数分布为() A.对称分布B.右偏分布C.左偏分布D.右偏或左偏分布 7.对两个总体分布进行变异性比较,当它们的平均数不等,计量单位不同时,需要计算()比较。 A.标准差系数B.标准差C.平均差D.方差8.当原假设正确,按检验规则却拒绝了原假设,则犯了() A.取伪错误B.检验错误C.第Ⅰ类错误D.第Ⅱ类错误 9.每一吨铸铁成本yc(万元)和铸件废品率x(%)变动的回归方程为:,这意味着() A.废品率每增加1%,成本每吨增加64万元B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8万元D.废品率每增加1%,则每吨成本为56万元10.将总体全部单位按照某个标志分组,再从各类型组中随机抽取一定单位组成样本,这种抽样是() A.随机抽样B.等距抽样C.分层抽样D.整群抽样11.根据经验,当算术平均数大于中位数且大于众数时,钟形分布为() A.对称分布B.右偏分布C.左偏分布D.负偏分布12.正态总体,总体方差σ2未知,小样本(n<30)的情况下,总体均值μ的置信度为1-α的置信区间为() A. 2 2 ) B. 2 2 Sn )

统计学原理第七版李洁明-课后选择判断题习题及答案

) 统计学原理第七版李洁明-课后选择判断题习题及答案 一、单项选择题 1.统计有三种含义,其基础是()。 (1)统计学(2)统计活动(3)统计方法(4)统计资料 2.一个统计总体()。 (1)只能有一个标志(2)只能有一个指标(3)可以有多个标志(4)可以有多个指标3.下列变量中,()属于离散变量。 (1)一包谷物的重量(2)一个轴承的直径(3)在过去一个月中平均每个销售代表接触的期望客户数(4)一个地区接受失业补助的人数 < 4.某班学生数学考试成绩分别为65分、71分、80分和87分,这四个数字是()。(1)指标(2)标志(3)变量(4)标志值 5.下列属于品质标志的是()。 (1)员工年龄(2)员工性别(3)员工体重(4)员工工资 6.现要了解某机床企业的生产经营情况,该企业的产量和利润是() (1)连续变量(2)离散变量(3)前者是连续变量,后者是离散变量 (4)前者是离散变量,后者是连续变量

7.劳动生产率是() | (1)动态指标(2)质量指标(3)流量指标(4)强度指标 8.统计规律性主要是通过运用()方法经整理、分析后得出的结论(1)统计分组法(2)大量观察法(3)综合指标法(4)统计推断法 9.()是统计的基础功能。 (1)管理功能(2)咨询功能(3)信息功能(4)监督功能 10.()是统计的根本准则,是统计的生命线。 (1)真实性(2)及时性(3)总体性(4)连续性 11.构成统计总体的必要条件是() 《 (1)差异性(2)综合性(3)社会性(4)同质性 12.数理统计学的奠基人是()。 (1)威廉·配第(2)阿亨瓦尔(3)凯特勒(4)恩格尔 13.统计研究的数量必须是()。 (1)抽象的量(2)具体的量(3)连续不断的量(4)可直接相加的量14.最早使用统计学这一学术用语的是() (1)政治算术学派(2)社会统计学派(3)国势学派(4)数理统计学派

《统计学概论》习题解答

《统计学概论》习题解答 第三章 统计分布的数值特征 【7】某大型集团公司下属35个企业工人工资变量数列如下表所示: 月 工 资(元) 企 业 数 比 重(%) ∑ ? f f x 分 组 组中值x (个) ∑f f 600以下 550 5 10 55.0 600—700 650 8 25 162.5 700—800 750 10 30 225.0 800—900 850 7 20 170.0 900以上 950 5 15 142.5 合 计 — 35 100 755.0 试计算该企业平均工资。(注:比重——各组工人人数在工人总数中所占的比重) 【解】 该集团公司职工的平均工资为755元/人。 【8】某地甲、乙两个农贸市场三种主要水果价格及销售额资料见下表 品 种 价 格 (元/千克) 甲 市 场 乙 市 场 销售额 (万元) 销量 比重 销售额 (万元) 销量 比重 (万千克) (%) (千克) (%) x m x m f = ∑f f m x m f = ∑f f 甲 2.0 80 40 44.5 60 300 000 30.0 乙 3.0 90 30 33.3 120 400 000 40.0 丙 2.5 50 20 22.2 75 300 000 30.0 合 计 — 220 90 100.0 255 1 000 000 100.0 试计算比较该地区哪个农贸市场水果平均价格高?并说明原因。 解: ()千克元甲市场水果平均价格44.2000900000 2002== () 千克元乙市场水果平均价格44.2000 0001000 5502== 甲市场以较低价格销售的水果所占的比重比乙市场以相同价格销售的水果的比重大,反之,正好 情况相反,故甲市场水果的平均价格较低。 【10】根据某城市500户居民家计调查结果,将居民户按其食品开支占全部消费开支的比重(即恩格 尔系数)分组后,得到如下的频数分布资料: 恩格尔系数 ( % ) 户 数 向上累计户数 x f (户%) 分 组 组中值( % ) (户) (户) x f ∑f

统计学第一章课后习题及答案

第一章 练习题 一、单项选择题 1.统计的含义有三种,其中的基础是() A.统计学B.统计方法 C.统计工作D.统计资料 2.对30名职工的工资收入进行调查,则总体单位是() A.30名职工B.30名职工的工资总额 C.每一名职工D.每一名职工的工资 3.下列属于品质标志的是() A.某人的年龄B.某人的性别 C.某人的体重D.某人的收入 4.商业企业的职工人数,商品销售额是() A.连续变量B.离散变量 C.前者是连续变量,后者是离散变量D.前者是离散变量,后者是连续变量5.了解某地区工业企业职工的情况,下列哪个是统计指标() A.该地区每名职工的工资额B.该地区职工的文化程度 C.该地区职工的工资总额D.该地区职工从事的工种 二、多项选择题 1.社会经济统计的特点,可概括为() A.数量性B.同质性 C.总体性D.具体性 E.社会性 2.统计学的研究方法是() A.大量观察法B.归纳推断法 C.统计模型法D.综合分析法 E.直接观察法 3.下列标志哪些属于品质标志() A.学生年龄B教师职称C企业规模D企业产值 4.下列哪些属于离散型变量 A年龄B机器台数C人口数D学生成绩 5.总体,总体单位,标志,指标这几个概念间的相互关系表现为() A.没有总体单位就没有总体,总体单位也离不开总体而独立存在 B.总体单位是标志的承担者 C.统计指标的数值来源于标志 D.指标是说明统计总体特征的,标志是说明总体单位特征的 E.指标和标志都能用数值表现 6.指标和标志之间存在着变换关系,是指() A.在同一研究目的下,指标和标志可以对调 B.在研究目的发生变化时,指标有可能成为标志

统计学第四版第七章课后题最全答案

第七章 练习题参考答案 (1)已知σ=5,n=40,x =25,α=, z 2 05.0= 样本均值的抽样标准差 σ x =n σ= 79.0405 = (2)估计误差(也称为边际误差)E=z 2 α n σ =*= (1)已知σ=15,n=49,x =120,α=, z 2 05.0= (2)样本均值的抽样标准差 σ x =n σ= =4915 估计误差E= z 2 α n σ=* =4915 (3)由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±*=±,即(,) (1)已知σ=85414,n=100,x =104560,α=, z 05.0= 由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±* =100 85414±.144即(,) (1)已知n=100,x =81,s=12, α=, z 1.0= 由于n=100为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=±* =100 12±,即(,) (2)已知α=, z 2 05.0= 由于n=100为大样本,所以总体均值μ的95%的置信区间为: n s x z 2 α±=±* =100 12±,即(,) (3)已知α=, z 2 01.0= 由于n=100为大样本,所以总体均值μ的99%的置信区间为:

n s x z 2 α±=±* =100 12±,即(,) (1)已知σ=,n=60,x =25,α=, z 05.0= 由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±* =60 .53±,即(,) (2)已知n=75,x =,s=, α=, z 02.0= 由于n=75为大样本,所以总体均值μ的98%的置信区间为: n s x z 2 α±=± =75 9.823±,即(,) (3)已知x =,s=,n=32,α=, z 2 1.0= 由于n=32为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=± =32 74.90±,即(,) (1)已知:总体服从正态分布,σ=500,n=15,x =8900,α=,z 2 05.0= 由于总体服从正态分布,所以总体均值μ的95%的置信区间为: n x z σ α2 ±=±* =15 500±,即(,) (2)已知:总体不服从正态分布,σ=500,n=35,x =8900,α=, z 2 05.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的95%的置信区间为: n x z σ α2 ±=±* =35 500±,即(,) (3)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=, z 1.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=±* =35 500±,即(,) (4)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=, z 2 01.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的99%的置信区间

《统计学概论》期末试题B卷

《统计学概论》期末试题B卷 姓名: 学号: 考试时间: 年月日 注意事项:1.请在答题卡填涂并作答,本试卷上作答视为无效; 2.本试卷满分100分,考试时间120分钟。 一、单项选择题(每小题2分,本题共20分。每小题只有一个选项符合题意,请选择正确答案。) 1.欲使数量指标的算术平均法指数成为数量指标综合法指数的变形,其权数必须是( ) A. B. C. D.W 2.一定置信度下的抽样极限误差是指用样本指标估计总体指标时产生的抽样误差的() A.实际最大值 B.实际最小值C.可能范围 D.实际范围3.同一数量的货币,今年购买的商品数量较去年减少3.7%,是因为商品价格()A.上升3.8422% B.上升3.568个百分点 C.上升3.7% D.上升3.7个百分点 4.在年度时间数列中,不可能存在( ) A.长期趋势 B.季节变动C.循环变动 D.不规则变动 5.多指标综合评价的基础是( ) A.指标体系的组成B.不同指标的同度量化C.数学方法 D.计分方法 6.当=0.8时,下列说法正确的是()。 A.80%的点都密集在一条直线的周围 B.两变量为高度正线性相关 C.两变量线性密切程度是= 0.4时的两倍 D.80%的点高度相关 7.对于某总体按一种数量标志分组,则() A.只能编制一种变量数列 B.可以进行复合分组 C.可能编制多种变量数列 D.可能编制品质数列 8.要通过移动平均消除季节变动,则移动平均项数K() A.应选择奇数B.应选择偶数 C.应和季节周期长度一致 D. 可任意取值 9.某企业劳动生产率计划提高5%,实际提高10%,则劳动生产率计划完成程度为() A.104.76% B.95.45% C.94.74% D.200% 10.一个时间数列中如果没有季节变动,则在乘法模型中季节变动相对数应为( ) A.0 B.1 C.4 D.12

贾俊平统计学 第七版 课后思考题

第一章导论 1.什么是统计学? 统计学是搜集、处理、分析、解释数据并从中得出结论的科学。 2.解释描述统计与推断统计。 描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。推 断统计研究的是如何利用样本数据来推断总体特征的统计方法。 3.统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可 以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据 和时间序列数据。 4.解释分类数据、顺序数据和数值型数据的含义。 分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的 数值。 5.举例说明总体、样本、参数、统计量、变量这几个概念。 总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合, 参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。 6.变量可分为哪几类? 变量可分为分类变量、顺序变量和数值型变量。分类变量是说明书屋类别的一个名 称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序 数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。 7.举例说明离散型变量和连续型变量。 离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断 开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。 第二章数据的搜集 1.什么是二手资料?使用二手资料需要注意些什么? 与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二 手资料。使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用 时要注明数据来源。 2.比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么 情况下适合采用非概率抽样。 概率抽样:指遵循随机原则进行的抽样,总体中每一个单位都有一定的机会被选入 样本。当用样本对总体进行估计时,要考虑每个单位样本被抽中的概率。技术含量 和成本都比较高。如果调查目的在于掌握和研究对象总体的数量特征,得到总体参 数的置信区间,就使用概率抽样。 非概率抽样:指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求, 采用某种方式从总体中抽取部分单位对其进行实施调查。操作简单、时效快、成本

《统计学概论》第七章课后练习题答案

《统计学概论》第七章课后练习题答案 一、思考题 1.抽样推断的意义和作用是什么? 2.抽样推断的特点是什么? 3.为什么抽样调查要遵循随机原则? 4.总体参数与样本统计各有什么特点? 5.为什么区间估计比点估计优越? 6.抽样平均误差的定义是什么?它有什么重要意义? 7.影响抽样平均误差的因素有哪些? 8.优良估计量的衡量标准有哪些? 9置信区间、置信度、概率度之间的关系怎样? 10.区间估计的原理是什么? 11.为什么说在n固定的情况下参数区间估计的精确度和可靠性是此消彼长的?12.怎样同时改善区间估计的精确度和可靠性? 13.影响抽样极限误差的因素有哪些? 14.怎样正确理解抽样极限误差的概念? 15.确定样本容量的因素有哪些? 16.抽样方案设计的基本原则是什么? 17.怎样理解类型抽样的原理和意义? 18.等距抽样的原理和意义是什么? 19.整群抽样的原理以及与类型抽样的区别是什么? 二、单项选择题 1.以()为基础理论的统计调查方法是抽样调查法。 A.高等代数B.微分几何 C.概率论D.博弈论 2.典型调查与抽样调查的相同之处为()。 A.均遵守随机原则B.以部分推断总体 C.误差均可估计D.误差均可控制 3.抽样推断必须遵守的首要原则是()。 A.大量性原则B.随机原则

C.可比性原则D.总体性原则4.既可进行点估计又可进行区间估计的是()。 A.重点调查B.典型调查C.普查D.抽样调查5.误差可以计算并加以控制的是()。 A.抽样调查B.普查 C.典型调查D.重点调查6.()可以对于某种总体的假设进行检验。 A.回归分析法B.抽样推断法C.综合指数法D.加权平均法7.以下正确的是()。 A.总体指标与样本指标均为随机变量 B.总体指标与样本指标均为常数 C.总体指标是常数而样本指标是随机变量 D.总体指标是随机变量而样本指标是常数 8.总体属性变量平均数恰等于()。 A.1-P B.P C.P(1-P)D.) P? 1 (P 9.总体属性变量的方差等于()。 A.1-P B.P C.P(1-P)D.) 1 P? (P 10.点估计的理论依据是()。 A.中心极限定理B.抽样分布定理C.小数定律D.大数定律11.频率稳定性的必要条件是()。 A.同质性B.大量性C.随机性D.社会性12.样本指标的标准差就是()。 A.抽样极限误差B.抽样平均误差

统计学导论课后答案兼历年真题(1)

《统计学导论》课后习题部分参考解答 第一章 一、判断题 1.答:错。统计学和数学具有不同的性质特点。数学撇开具体的对象,以最一般的形式研究数量的联系和空间形式;而统计学的数据则总是与客观的对象联系在一起。特别是统计学中的应用统计学与各不同领域的实质性学科有着非常密切的联系,是有具体对象的方法论。 3.答:错。实质性科学研究该领域现象的本质关系和变化规律;而统计学则是为研究认识这些关系和规律提供合适的方法,特别是数量分析的方法。 5.答:错。描述统计不仅仅使用文字和图表来描述,更重要的是要利用有关统计指标反映客观事物的数量特征。 7.答:错。不少社会经济的统计问题属于无限总体。例如要研究消费者的消费倾向,消费者不仅包括现在的消费者而且还包括未来的消费者,因而实际上是一个无限总体。 二、单项选择题 1. A; 3.A。 三、分析问答题 1.答:定类尺度的数学特征是“=”或“≠”,所以只可用来分类,民族可以区分为汉、藏、回等,但没有顺序和优劣之分,所以是定类尺度数据。;定序尺度的数学特征是“>”或“<”,所以它不但可以分类,还可以反映各类的优劣和顺序,教育程度可划分为大学、中学和小学,属于定序尺度数据;定距尺度的主要数学特征是“+”或“-”,它不但可以排序,还可以用确切的数值反映现象在两方面的差异,人口数、信教人数、进出口总额都是定距尺度数据;定比尺度的主要数学特征是“?”或“÷”,它通常都是相对数或平均数,所以经济增长率是定比尺度数据。 3.答:如考察全国居民人均住房情况,全国所有居民构成统计总体,每一户居民是总体单位,抽查其中5000户,这被调查的5000户居民构成样本。 第二章 一、单项选择题 1.C; 3.A。二、多项选择题 1.A.B.C.D; 3.A.B.C. 三、简答题 1.答:这种说法不对。从理论上分析,统计上的误差可分为登记性误差、代表性误差和推算误差。无论是全面调查还是抽样调查都会存在登记误差。而代表性误差和推算误差则是抽样调查所固有的。这样从表面来看,似乎全面调查的准确性一定会高于统计估算。但是,在全面调查的登记误差特别是其中的系统误差相当大,而抽样调查实现了科学化和规范化的场合,后者的误差也有可能小于前者。我国农产量调查中,利用抽样调查资料估算的粮食产量数字的可信程度大于全面报表的可信程度,就是一个很

统计学第五章课后题及答案解析

第五章 练习题 一、单项选择题 1.抽样推断的目的在于() A.对样本进行全面调查B.了解样本的基本情况 C.了解总体的基本情况D.推断总体指标2.在重复抽样条件下纯随机抽样的平均误差取决于() A.样本单位数B.总体方差 C.抽样比例D.样本单位数和总体方差 3.根据重复抽样的资料,一年级优秀生比重为10%,二年级为20%,若抽样人数相等时,优秀生比重的抽样误差() A.一年级较大B.二年级较大 C.误差相同D.无法判断 4.用重复抽样的抽样平均误差公式计算不重复抽样的抽样平均误差结果将()A.高估误差B.低估误差 C.恰好相等D.高估或低估 5.在其他条件不变的情况下,如果允许误差缩小为原来的1/2 ,则样本容量() A.扩大到原来的2倍B.扩大到原来的4倍 C.缩小到原来的1/4D .缩小到原来的1/2 6.当总体单位不很多且差异较小时宜采用() A.整群抽样B.纯随机抽样 C.分层抽样D.等距抽样 7.在分层抽样中影响抽样平均误差的方差是() A.层间方差B.层内方差 C.总方差D.允许误差二、多项选择题 1.抽样推断的特点有() A .建立在随机抽样原则基础 上 B.深入研究复杂的专门问 题 C .用样本指标来推断总体指 标 D.抽样误差可以事先计算 E .抽样误差可以事先控制 2.影响抽样误差的因素有() A .样本容量的大小B.是有限总体还是无限总 体 C .总体单位的标志变动度D.抽样方法 E .抽样组织方式 3.抽样方法根据取样的方式不同分为() A .重复抽样 B .等距抽样 C .整群抽样 D .分层抽样 E .不重复抽样 4.抽样推断的优良标准是() A .无偏性 B .同质性 C .一致性 D .随机性 E .有效性 5.影响必要样本容量的主要因素有() A . 总体方差的大小B.抽样方法

相关文档
最新文档