统计学第七章、第八章课后题答案

统计学复习笔记

第七章 参数估计

一、 思考题

1. 解释估计量和估计值

在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。

根据一个具体的样本计算出来的估计量的数值称为估计值。 2. 简述评价估计量好坏的标准

(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。

(2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。

(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。

3. 怎样理解置信区间

在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。

4. 解释95%的置信区间的含义是什么

置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。

不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。

5. 简述样本量与置信水平、总体方差、估计误差的关系。

1. 估计总体均值时样本量n 为

2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=

▪ 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所

需要的样本量越大;

▪ 与总体方差成正比,总体的差异越大,所要求的样本量也越大;

▪ 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接

受的估计误差的平方越大,所需的样本量越小。

二、 练习题

1. 从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。

1) 样本均值的抽样标准差x x

σ等于多少? 2) 在95%的置信水平下,估计误差是多少?

解: 1) 已知σ = 5,n = 40, = 25

∵ ∴x σx σ

= 5 /√40≈ 0.79 2) 已知

∵ ∴ 估计误差 E = 1.96×5÷√40≈1.55

2. 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。

1) 假定总体标准差为15元,求样本均值的抽样标准误差。

2) 在95%的置信水平下,求估计误差。 3) 如果样本均值为120元,求总体均值µ的95%的置信区间。 解:1)已知σ = 15,n = 49

∵ x n

x n x σσ=α2n z E σα2=n x n x σσ=n

x n x σσ=

∴x σx σ

= 15÷√49 = 2.14 2)已知

∵ ∴ 估计误差 E = 1.96×15÷√49 ≈ 4.2

3)已知 = 120

∵ 置信区间为

±E ∴ 其置信区间 = 120±4.2

3. 从一个总体中随机抽取n =100的随机样本,得到

=104560,假定总体标准差σ = 85414,试构建总体均值µ的95%的置信区间。

解: 已知n =100, =104560,σ = 85414,1-α=95% ,

由于是正态总体,且总体标准差已知。总体均值μ在1-α置信水平下的置信区间为

104560 ±1.96×85414÷√100

= 104560 ±16741.144

4. 从总体中抽取一个n =100的简单随机样本,得到 =81,s=12。要求:

1) 构建µ的90%的置信区间。

2) 构建µ的95%的置信区间。

3) 构建µ的99%的置信区间。

解:由于是正态总体,但总体标准差未知。总体均值μ在1-α置信水α2n z E σα2=x x x x 2α()28.109,44.10192.336.1052510

96.136.1052=±=⨯±=±n z x σ

αx

平下的置信区间公式为

81±

×12÷√100 = 81±×1.2

1)1-α=90%, 1.65 其置信区间为 81 ± 1.98

2)1-α=95% ,

其置信区间为 81 ± 2.352

3) 1-α=99%, 2.58

其置信区间为 81 ± 3.096

5. 利用下面的信息,构建总体均值的置信区间。

1) = 25,σ = 3.5,n =60,置信水平为95%

2) =119,s =23.89,n =75,置信水平为98%

3) =3.149,s =0.974,n =32,置信水平为90%

解:∵ ∴ 1) 1-α=95% ,

其置信区间为:25±1.96×3.5÷√60

= 25±0.885

2) 1-α=98% ,则α=0.02, α/2=0.01, 1-α/2=0.99,查标准正态分布表,可知: 2.33

其置信区间为: 119±2.33×23.89÷√75

= 119±6.345

x x x 22未知αα)(22未知或σσααn

s z x n z x ±±

3) 1-α=90%, 1.65

其置信区间为:3.149±1.65×0.974÷√32

= 3.149±0.284

6. 利用下面的信息,构建总体均值µ的置信区间:

1) 总体服从正态分布,且已知σ = 500,n = 15,

=8900,置信水平为95%。

解: N=15,为小样本正态分布,但σ已知。则1-α=95%,

。其置信区间公式为 ∴置信区间为:8900±1.96×500÷√15=(8646.7 , 9153.2)

2) 总体不服从正态分布,且已知σ = 500,n = 35, =8900,置信水平为95%。

解:为大样本总体非正态分布,但σ已知。则1-α=95%,

。其置信区间公式为 ∴置信区间为:8900±1.96×500÷√35=(8733.9 9066.1

) 3) 总体不服从正态分布,σ未知,n = 35,

=8900,s =500,置信水平为90%。

解:为大样本总体非正态分布,且σ未知,1-α=90%,

1.65。 其置信区间为:

8900±1.65×500÷√35=(8761 9039)

4) 总体不服从正态分布,σ未知,n = 35, =8900,s =500,置信水平为99%。

2α()28.109,44.10192.336.105251096.136.1052=±=⨯

±=±n z x σαx x 2α()28.109,44.10192.336.105251096.136.1052=±=⨯

±=±n z x σαx x

解:为大样本总体非正态分布,且σ未知,1- =99%, 2.58。

其置信区间为:8900±2.58×500÷√35=(8681.9 9118.1)

7.某大学为了解学生每天上网的时间,在全校7500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时)(略)。求该校大学生平均上网时间的置信区间,置信水平分别为90%

解:先求样本均值:= 3.32

再求样本标准差:

置信区间公式:

8.从一个正态总体中随机抽取样本量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值µ的95%置信区间。解:本题为一个小样本正态分布,σ未知。

先求样本均值:= 80÷8=10

再求样本标准差:= √84/7 = 3.4641

于是 , 的置信水平为的置信区间是

,

已知,n = 8,则,α/2=0.025,查自由度为

n-1 = 7的分布表得临界值 2.45

所以,置信区间为:10±2.45×3.4641÷√7

9.某居民小区为研究职工上班从家里到单位的距离,抽取了由16

个人组成的一个随机样本,他们到单位的距离分别是:10,3,14,8,

6,9,12,11,7,5,10,15,9,16,13,2。假设总体服从正态分

布,求职工上班从家里到单位平均距离的95%的置信区间。

解:小样本正态分布,σ未知。已知,n = 16,,则, α/2=0.025,查自由度为n-1 = 15的分布表得临界值 2.14 样本均值=150/16=9.375

再求样本标准差:= √253.75/15 ≈4.11

于是 , 的置信水平为的置信区间是

,

9.375±2.14×4.11÷√16

10.从一批零件是随机抽取36个,测得其平均长度是149.5,标准差是1.93。

1)求确定该种零件平均长度的95%的置信区间。

2)在上面估计中,你使用了统计中的哪一个重要定理?请解释。解:1)这是一个大样本分布。已知N=36,= 149.5,S =1.93,

x

1-α=0.95,。

其置信区间为:149.5±1.96×1.93÷√36 2)中心极限定理论证:如果总体变量存在有限的平均数和方差,那么,不论这个总体的分布如何,随着样本容量的增加,样本均值的分布便趋近正态分布。在现实生活中,一个随机变量服从正态分布未必很多,但是多个随机变量和的分布趋于正态分布则是普遍存在的。样本均值也是一种随机变量和的分布,因此在样本容量充分大的条件下,样本均值也趋近于正态分布,这为抽样误差的概率估计理论提供了理论基础。

11.某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克,现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量如下:(略)

已知食品包重服从正态分布,要求:

1)确定该种食品平均重量的95%的置信区间。

2)如果规定食品重量低于100克属于不合格,确定该批食品合格率的95%的置信区间。

解:1)本题为一个大样本正态分布,σ未知。已知N=50,µ=100,1-α=0.95,。

①每组组中值分别为97、99、101、103、105,即此50包样本平均值= (97+99+101+103+105)/5 = 101

②样本标准差为:

=√{(97-101)²×2+(99-101)²×3+(101-101)²×34+(103-101)²×7+(105-101)²×4}÷(50-1)≈ 1.666

③其置信区间为:101±1.96×1.666÷√50

2)∵不合格包数(<100克)为2+3=5包,5/50 = 10%(不合格率),即P = 90%。

∴该批食品合格率的95%置信区间为:

= 0.9 ±1.96×√(0.9×0.1)÷50= 0.9 ±1.96×0.042

12.假设总体服从正态分布,利用下面的数据构建总体均值μ的99%的置信区间。(略)

解:样本均值

样本标准差:

尽管总体服从正态分布,但是样本n=25是小样本,且总体标准差未

知,应该用T统计量估计。1-α=0.99,则α=0.01, α/2=0.005,查自由度为n-1 =24的分布表得临界值 2.8

的置信水平为的置信区间是,

13.一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18个员工,得到他们每周加班的时间数据如下(单位:小时):(略)

假定员工每周加班的时间服从正态分布,估计网络公司员工平均每周加班时间的90%的置信区间。

解:① N = 18 < 30,为小样本正态分布,σ未知。

②样本均值= 244/18 = 13.56

样本标准差:=

③ 1-α= 90%,α= 0.1,α/2= 0.05,则查自由度为n-1 = 17的分布表得临界值 1.74

④的置信水平为的置信区间是,

14.利用下面的样本数据构建总体比例丌的置信区间:

1)n =44,p = 0.51 ,置信水平为99%

2)n =300,p = 0.82 ,置信水平为95%

3)n =1150,p = 0.48,置信水平为90%

解:1)1-α= 99%,α= 0.01,α/2= 0.005,1-α/2= 0.995,查标准正态分布表,则 2.58

2)1-α=95%,

3)1-α=90%, 1.65

分别代入

15.在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机,其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。

解:1)置信水平90%,1-α=90%, 1.65,N = 200,P = 23%。

代入

2)置信水平95%,1-α=95%,,N = 200,P = 23%。代入

16.一位银行的管理人员想估计每位顾客在该银行的月平均存款额。他假设所有顾客月存款额的标准差为1000元,要求的估计误差在200元以内,置信水平为99%。应选取多大的样本?

解:已知 1-α = 99%,则 2.58。E = 200,σ= 1000元。

则 N = (²×σ²)÷E²= (2.58²×1000²)÷200²≈167 (得数应该是166.41,不管小数后是多少,都向上进位取整,因此至少是167人)

17.要估计总体比例丌,计算下列条件下所需的样本量。

1)E=0.02,丌=0.40,置信水平96%

2)E=0.04,丌未知,置信水平95%

3)E=0.05,丌=0.55,置信水平90%

解:1)已知 1-α = 96%,α/2 =0.02 ,则 2.06

N = {²×丌(1-丌)}÷E²=2.06²×0.4×0.6÷0.02²≈2547

2)已知 1-α = 95%,α/2 =0.025 ,则 1.96

丌未知,则取使丌(1-丌)最大时的0.5。

N = {²×丌(1-丌)}÷E²=1.96²×0.5×0.5÷0.04²≈601

3)置信水平90%,1- =90%, 1.65,

N = {²×丌(1-丌)}÷E²=1.65²×0.55×0.45÷0.05²≈270

18.某居民小区共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞同,18户反对。

1)求总体中赞成该项改革的户数比例的置信区间(α=0.05)2)如果小区管理者预计赞成的比例能达到80%,估计误差

不超过10%,应抽取多少户进行调查(α=0.05)

解:1)

已知N=50,P=32/50=0.64,α=0.05,α/2 =0.025 ,则 1.96 置信区间:P±√{P(1-P)/N}= 0.64±1.96√0.64×0.36/50 = 0.64±1.96×0.48/7.07=0.64±0.133

2)已知丌=0.8 , E = 0.1, α=0.05,α/2 =0.025 ,则 1.96 N= ²丌(1-丌)/E²= 1.96²×0.8×0.2÷0.1²≈62

19.根据下面的样本结果,计算总体标准差σ的90%的置信区间:1)=21,S=2,N=50

2)=1.3,S=0.02,N=15

3)=167,S=31,N=22

解:1)大样本,σ未知,置信水平90%,1-α=90%, 1.65 21±1.65×2÷√50

2)小样本,σ未知,置信水平90%,1-α=90%,则查自由度为n-1 = 14的分布表得临界值 1.761

, = 1.3±1.761×0.02÷√15

3) 大样本, σ未知,置信水平90%,1-α=90%, 1.65

167±1.65×31÷√22

20.题目(略)

1)构建第一种排队方式等待时间标准差的95%的置信区间

2)构建第二种排队方式等待时间标准差的95%的置信区间

3)根据1)和2)的结果,你认为哪种排队方式更好?

解:本题为小样本正态分布,σ未知,应用公式

,

置信水平95%,1- =95%,则查自由度为n-1 = 9的分布表得临界值 2.31

1)= 7.15,

= √2.045/9≈0.48

其置信区间为7.15±2.31×0.48÷√10

2) = 7.15

= √0/9 = 0

其置信区间为7.15±0

4)第二种排队方式更好.

(19题是对总体方差的估计,应该用卡方统计量进行估计,20题是对两个总体参数的估计,这二种类型老师未讲,不是本次考试的内容,不能用Z统计量像估计总体均值和比例那样去估计,具体内容见书上P188――P194)

第八章

一、思考题

1.假设检验和参数估计有什么相同点和不同点?

解:参数估计与假设检验是统计推断的两个组成部分。

相同点:它们都是利用样本对总体进行某种推断。

不同点:推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法,总体参数μ在估计前是未知的。而在假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。

2.什么是假设检验中的显著性水平?统计显著是什么意思?

解:显著性水平用α表示,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,即假设检验中犯弃真错误的概率。它是由人们根据检验的要求确定的。

(我理解的统计学意义,统计显著是统计上专用的判定标准,指在一定的概率原则下,可以承认一种趋势或者合理性达到的程度,达到为统计上水平显著,达不到为统计上水平不显著)

3.什么是假设检验中的两类错误?

解:弃真错误(α错误):当原假设为真时拒绝原假设,所犯的错误成为第I类错误,又称为弃真错误。犯第I类错误的概率常记作α。

取伪错误(β错误):当原假设为假时没有拒绝原假设,所犯的错误称为第II类错误,又称取伪错误。犯第II类错误概率常记作β。

发生第I类错误的概率也常被用于检验结论的可靠性度量。假设检验中犯第I类错误的概率被称为显著性水平,记作α。

4.两类错误之间存在什么样的数量关系?

在样本容量n一定的情况下,假设检验不能同时做到犯α和β两类错误的概率都很小。若减小α错误,就会增大犯β错误的机会;若减小β错误,也会增大犯α错误的机会。要使α和β同时变小只有增大样本容量。但样本容量增加要受人力、经费、时间等很多因素的限制,无限制增加样本容量就会使抽样调查失去意义。因此假设检验需要慎重考虑对两类错误进行控制的问题。

5.解释假设检验中的P值。

解:如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值。也称为观察到的显著性水平。

P值是反映实际观测到的数据与原假设H0之间不一致程度的一个概率值。P值越小,说明实际观测到的数据与H0之间不一致程度就越大。

6.显著性水平与P值有何区别?

解:α(显著性水平)是一个判断的标准(当原假设为真,却被拒绝的概率),而P是实际统计量对应分位点的概率值(当原假设为真时,所得到的样本观察结果或更极端结果出现的概率)。

可以通过α计算置信区间,然后与统计量进行比较判断,也可以通过统计量计算对应的p值,然后与α值比较判断。

7.假设检验依据的基本原理是什么?

解:假设检验利用的是小概率原理,小概率原理是指发生概率很小的随机事件在一次试验中是几乎不可能发生的。根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。

8.你认为在单侧检验中原假设和备择假设的方向应该如何确定?

解:假设问题有两种情况,一种是所考察的数值越大越好(左单侧检验或下限检验),临界值和拒绝域均在左侧;另一种是数值越小越好(右单侧检验或上限检验),临界值和拒绝域均在右侧。

二、练习题

1.已知某炼铁厂的含碳量服从正态分布N(4.55,0.108²),现在测定了9炉铁水,其平均含碳量为4.484。如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为4.55(α=0.05)?

解: 已知μ0=4.55,σ²=0.108²,N=9,=4.484,

这里采用双侧检验,小样本,σ已知,使用Z 统计。

假定现在生产的铁水平均含碳量与以前无显著差异。则,

H 0:μ=4.55 ;H 1 :μ≠4.55

α=0.05,α/2 =0.025 ,查表得临界值为

1.96

计算检验统计量: = (4.484-4.55)/(0.108/√9) = -1.833

决策:∵Z 值落入接受域,∴在α=0.05的显著性水平上接受H 0。

结论:有证据表明现在生产的铁水平均含碳量与以前没有显著差异,可以认为现在生产的铁水平均含碳量为4.55。

2. 一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。已知该元件寿命服从正态分布,σ=60小时,试在显著性水平0.05下确定这批元件是否合格。

解: 已知N=36,σ=60,=680,μ0=700

这里是大样本,σ已知,左侧检验,采用Z 统计量计算。 提出假设:假定使用寿命平均不低于700小时

H 0:μ≥700

H 1: μ < 700

α = 0.05,左检验临界值为负,查得临界值: -Z 0.05=-1.645

n

x Z / σ - =

μ0

计算检验统计量: = (680-700)/(60/√36) = -2

决策:∵Z 值落入拒绝域,∴在α=0.05的显著性水平上拒绝H 0,接受H 1

结论:有证据表明这批灯泡的使用寿命低于700小时,为不合格产品。

3. 某地区小麦的一般生产水平为亩产250公斤,其标准差是30公斤。现用一种化肥进行试验,从25个小区抽样,平均产量为270公斤。这种化肥是否使小麦明显增产(α=0.05)?

解:已知μ0 =250,σ = 30,N=25,=270

这里是小样本分布,σ已知,用Z 统计量。右侧检验,α =0.05,则Z α=1.645

提出假设:假定这种化肥没使小麦明显增产。

即 H 0:μ≤250

H 1: μ>250

计算统计量:

Z = (-μ0)/(σ/√N )= (270-250)/(30/√25)= 3.33 结论:Z 统计量落入拒绝域,在α =0.05的显著性水平上,拒绝H 0,接受H 1。

决策:有证据表明,这种化肥可以使小麦明显增产。

n x Z / σ - =

μ0

4. 糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量(单位:千克)如下:(略)

已知包重服从正态分布,试检验该日打包机工作是否正常。(α =0.05)

解:已知N=9,这里是小样本正态分布,σ未知,双侧检验,采用t 统计量,自由度为N-1=8。α =0.05,则T α/2=2.37 = 99.98

≈1.22

提出假设,假设打包机工作正常:

即 H 0:μ= 100

H 1: μ≠100

计算统计量:

= (99.98-100)/( 1.22/√9)≈-0.049 结论:∵t 值落入接受域,∴在α=0.05的显著性水平上接受H 0 决策:有证据表明这天的打包机工作正常。

5. 某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取50袋,发现有6袋低于250克。若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(α=0.05)? - = n

s x t μ0

统计学第七章、第八章课后题答案

统计学复习笔记 第七章 参数估计 一、 思考题 1. 解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2. 简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3. 怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌.在公布调查结果时给出被调查人数是负责任的表现.这样则可以由此推算出置信度(由后面给出的公式),反之亦然. 4. 解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率.也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0。95的概率覆盖总体参数. 5. 简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 22 22)(E z n σα=n z E σα2=

统计学第七章,第八章课后题目解析

统计学复习笔记 第七章 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。

4. 解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。 5. 简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 ? 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所 需要的样本量越大; ? 与总体方差成正比,总体的差异越大,所要求的样本量也越大; ? 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接 受的估计误差的平方越大,所需的样本量越小。 二、 练习题 1. 从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。 1) 样本均值的抽样标准差等于多少? 2) 在95%的置信水平下,估计误差是多少? x x σ其中: 2222α222)(E z n σα=n z E σα2=

统计学第七章、第八章课后题答案.doc

统计学复习笔记 第七章 一、 思考题 1. 解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2. 简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3. 怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4. 解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。 5. 简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=

统计学第七章、第八章课后题答案

] 统计学复习笔记 第七章 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 " (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4.解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。 5.| 6.简述样本量与置信水平、总体方差、估计误差的关系。 1.估计总体均值时样本量n为

2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大; 与总体方差成正比,总体的差异越大,所要求的样本量也越大; 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。 ) 二、 练习题 1. 从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。 1) 样本均值的抽样标准差x x σ等于多少 2) 在95%的置信水平下,估计误差是多少 解: 1) 已知σ = 5,n = 40, = 25 ∵ ∴ x σx σ = 5 /√40 ≈ ) 2) 已知 ∵ ∴ 估计误差 E = ×5÷√40 ≈ 2. 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。 1) 假定总体标准差为15元,求样本均值的抽样标准误差。 其中: 2 2 22 α2 222)(E z n σα= n z E σα2 =x n x n x σ σ=α2n z E σ α 2=

统计学课后答案

第一章总论 2. 统计有几种涵义?各种涵义的关系如何? 统计的三种涵义是指统计工作、统计资料及统计学。统计工作是统计的实践活动,统计资料是统计工作的成果,统计学是统计实践活动的科学总结,反过来又指导统计实践。 8. 什么是统计总体、总体单位?总体和单位的关系如何? 统计总体是指客观存在的,在同一性质基础上结合起来的许多个别事物的整体。构成统计总体的每个基本单位或元素称为总体单位。总体和单位的关系:(1)总体是由单位构成的;(2)总体和总体单位不是固定不变的,而是随着统计任务的不同,可以变换位置;(3)统计总体与总体单位是互为存在条件地联结在一起的,没有总体单位,总体也就不存在了。 10. 什么是标志?标志有几种?分别举例说明。 标志是说明总体单位特征的名称。标志有品质标志与数量标志之分。品质标志表示事物的质的特征,是不能用数值表示的,如人的性别、工人的工种等。数量标志表示事物的量的特征,是可以用数值表示的,如人的年龄、企业的产值等。 第二章统计调查 1. 调查对象、调查单位以及填报单位的关系是什么?试举例说明。 调查对象是需要调查的那些社会经济现象的总体。调查单位是调查对象中所要调查的具体单位,是调查项目的直接承担者,它可能是全部总体单位,也可能是其中的一部分。填报单位是负责向上报告调查内容的单位,又称报告单位。 调查对象和调查单位在同一次调查中是包含和被包含的关系。确定调查对象是要划清所要研究的总体界限,确定调查单位是要明确调查标志有谁来承担。填报单位和调查单位有联系也有区别,二者有时一致,有时不一致。 如工业企业设备普查,调查对象是工业企业设备,调查单位是每台设备,填报单位是每个工业企业。 2. 什么是统计调查?它有哪些分类? 统计调查是按照预定的统计任务,运用科学的调查方法,有计划有组织地向客观实际搜集统计资料的过程。 按调查对象包括范围的不同,可以分为全面调查和非全面调查;按调查登记时间的连续性,分为经常性调查和一次性调查;按调查组织方式分为统计报表制度和专门调查;按搜集资料的方法可分为直接观察法、报告法、采访法。 5. 普查和全面统计报表都是全面调查,两者能否互相代替? 普查和全面统计报表都是全面调查,但它们是两种不同的调查方式方法,各有不同的特点和作用。普查是一次性调查,它所包含的单位和指标可以更全面,分组更详细,能搜集到全面报表不能或不宜取得的资料。但是普查花费的人财物力和时间较

统计学(贾5)课后练答案(7-8章)

第七章 参数估计 7。1 (1) x σ= = (2) 2x z α∆==1.96=1.5495 7。2 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (1)假定总体标准差为15元,求样本均值的抽样标准误差。 x σ= = =2。143 (2)在95%的置信水平下,求估计误差。 x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=1。96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。 置信区间为: 2x z x z αα⎛-+ ⎝ =()120 4.2,120 4.2-+=(115。8,124.2) 7。3 2 2 x z x z αα⎛-+ ⎝ =104560±。856,121301.144) 7.4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。 要求: 大样本,样本均值服从正态分布:2,x N n σμ⎛⎫ ⎪⎝⎭或2,s x N n μ⎛⎫ ⎪⎝⎭ 置信区间为: 22x z x z αα⎛ -+ ⎝ ,。2 (1)构建μ的90%的置信区间。 2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(79。03,82.97) (2)构建μ的95%的置信区间。 2z α=0.025z =1。96,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(78.65,83.35) (3)构建μ的99%的置信区间。 2z α=0.005z =2.576,置信区间为:()81 2.576 1.2,81 2.576 1.2-⨯+⨯=(77.91,84.09) 7。5 (1) 2x z α±=25 1.96±(24。114,25。886) (2) 2x z α±=119.6 2.326±=(113。184,126。016) (3) 2x z α±=3.419 1.645±(3.136,3。702) 7.6 (1) x z α±=8900 1.96±=(8646。965,9153。035) (2) 2x z α±=8900 1.96±=(8734.35,9065.65) (3) 2x z α±=8900 1.645±=(8761。395,9038。605)

《统计学》(贾俊平第七版)课后题及答案-统计学 贾俊平第七版

第一章导论 1.什么是统计学? 统计学是搜集、处理、分析、解释数据并从中得出结论的科学。 2.解释描述统计与推断统计。 描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。推断统计研究的是如何利用样本数据来推断总体特征的统计方法。 3.统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。 4.解释分类数据、顺序数据和数值型数据的含义。 分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。 5.举例说明总体、样本、参数、统计量、变量这几个概念。 总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。 6.变量可分为哪几类? 变量可分为分类变量、顺序变量和数值型变量。分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。 7.举例说明离散型变量和连续型变量。 离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。 第二章数据的搜集 1.什么是二手资料?使用二手资料需要注意些什么? 与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。 2.比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么 情况下适合采用非概率抽样。 概率抽样:指遵循随机原则进行的抽样,总体中每一个单位都有一定的机会被选入样本。当用样本对总体进行估计时,要考虑每个单位样本被抽中的概率。技术含量和成本都比较高。如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样。 非概率抽样:指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽取部分单位对其进行实施调查。操作简单、时效快、成本

统计学课后题答案

统计学复习笔记 第七章参数估计 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)—致性:是指随着样本量的增大,点估计量的值越来越接近被估总体 的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。 置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4.解释95%勺置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95% (的区间)

包含参数。

不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。 5.简述样本量与置信水平、总体方差、估计误差的关系。 1.估计总体均值时样本量n为 (z 2)2 2 E z n P—其中:E z2* 2.样本量n与置信水平1- a、总体方差工、估计误差E之间的关系为 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的 样本量越大; 与总体方差成正比,总体的差异越大,所要求的样本量也越大; 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估 计误差的平方越大,所需的样本量越小。 二、练习题 1.从一个标准差为5的总体中采用重复抽样方法抽出一个样本量 为40的样本,样本均值为25。 1)样本均值的 抽样标准差x等于多少 解: 1 )已知(T = 5 ,n 二40,= 25

统计学(贾5)课后练答案(7-8章)

第七章参数估计 7.1 (1) =0。7906 (2)==1。5495 7。2 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (1)假定总体标准差为15元,求样本均值的抽样标准误差。=2。143 (2)在95%的置信水平下,求估计误差。 ,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t= 因此,=1.96×2。143=4。2 (3)如果样本均值为120元,求总体均值的95%的置信区间. 置信区间为:==(115.8,124.2) 7.3 ==(87818.856,121301。144) 7.4 从总体中抽取一个n=100的简单随机样本,得到=81,s=12。 要求: 大样本,样本均值服从正态分布:或 置信区间为:,==1。2 (1)构建的90%的置信区间. ==1.645,置信区间为:=(79。03,82.97) (2)构建的95%的置信区间。 ==1。96,置信区间为:=(78。65,83.35) (3)构建的99%的置信区间. ==2.576,置信区间为:=(77。91,84.09) 7.5 (1)==(24.114,25.886) (2)==(113。184,126.016) (3)==(3.136,3。702) 7。6 (1)==(8646.965,9153.035) (2)==(8734。35,9065。65) (3)==(8761。395,9038。605) (4)==(8681。95,9118.05) 7.7 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36人,调 解: (1)样本均值=3。32,样本标准差s=1.61 =0。9,t===1.645,==(2。88,3。76) =0。95,t===1。96,==(2。79,3.85) =0.99,t===2.576,==(2。63,4.01) 7。8 ==(7.104,12.896) 7。9 某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:km)分别是: 10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2 假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。 解:小样本,总体方差未知,用t统计量 均值=9。375,样本标准差s=4。11,=0。95,n=16,==2。13 置信区间: ==(7.18,11.57) 7。10 (1)==(148。8695,150.1305) (2)中心极限定理

《统计学基础》1-8章答案

第一章一、1.统计工作,统计资料,统计学 2.统计设计,统计调查,统计整理.总体,个体 3.每一个人,品质,数量.社会经济现象总体数量方面 4.大量观察法,分组法,综合指标法.数量指标,质量指标,平均数 5.连续,离散.指标名称,指标数值 6.总体,数量标志二、BBBBDCBBCBB 三、ABE. BCE. CDE. BCE. ABE. BE. AE. BCDE. BCE四、XXXXJJXJX 砧--4第一早 一、1.准确性.及时性,完整性 2.全面调查,非全面调查 3.该地区工业企业所有职工,该地区工业企业每一名职工,该地区每一个工 业企业。 4.有意识,随机 5.普查,全面统计报表,重点调查,典型调查,抽样调查。 6.重点 7.专[的,一次性,全面的二、BBDCCBDCD 三,BDE. ABDE. ACD. ABD. BE. ACE四、XXXXXVXVVX 第三章一,1.等距,不等距 2.组限,组中值. 675. 175 3.组中值,均匀.单项式分组,组距式分组 4.品质数列,变量数列二,ABCCCBDDAC 三,ACD. ABCDE. CDE. BCE. BCDE. 四,XJXJJXXX五,1.6000, 8000, 6500, 630, 28.48%, 1000, 9500,第七组,72.53% 2. DABC第四章 一,1.时期指标.时点指标 3.结构相对指标.算术平均数 4.动态相对指标.强度相对指标 5.强度相对指标.强度相对指标 6结构相对指标.众数 二,CDAAA CBBBC CCABA三,CE. BDE. ADE. ABDE. AB. BD. ABCD. AB. ACD. BCD. ABCD. AB 四,XXJXXJXXXJ五,1 .略 2. 105. 5% 3.2540, 2680, 2609. 09 4.4 5. 8%, 41.49%, 45. 2%123. 04 元/件,117. 74 5.98. 9%, 5 6.51%%=12.86乐勿=12乐乙具有代表性。 第五章一、1.时间,指标数值 2.各环比发展速度,水平法,累计法 3.6.67% 4.7.18% 5.2661.47 亿元 二,三, 四,xxq〈xWx五,1. 29.33万元

相关主题
相关文档
最新文档