区间估计

区间估计
区间估计

38

第二节 区间估计

一、区间估计的概念和步骤

点估计用一个确定的值去估计未知的参数,具有较大的风险。因为估计量来自于一个随机抽取的样本,结果也就带有随机性。样本估计量刚好等于所估计的总体参数的可能性极小。但是如果说所估计的总体参数就落在估计值附近,即所估计的总体参数就落在以点估计所得到的估计值为中心的某一个小区间内,那就比较有把握了。这种方法就是区间估计法。

在第四章中我们已经知道,一个足够大样本的均值的抽样分布是正态的,并且所抽到的样本均值落在总体均值的两侧x σ±范围内的概率是0.683,落在总体均值

±2σx 范围内的概率是0.955,落在总体均值3±σx 范围内的概率是0.997等等。由此

可见,我们可以按照概率来估计总体均值是落在某一区间范围内的。我们把这种对总体均值的估计称作区间估计。从上述说明可以看到:

1. 如果所估计的区间越大,参数被包含在该区间内的概率就越大。

2. 如果样本的方差越小,则在相同的概率下区间估计所得到的结果就越短。 一般地,设θ为总体的一个未知参数,θθ12,分别为由一组样本所确定的对θ的两个估计量,对于给定的10<<α,若P(θθθ12≤≤)=1-α,则称区间[θθ12,]为置信度是1-α的置信区间。θθ12,分别为置信区间的下限和上限。1-α称为置信度或置信概率,表示区间估计的可靠度。α称为置信度水平。

常用的置信度有 0.80,0.90,0.95 0.99等。一般来说,对于估计要求比较精确的问题,置信程度也要求高一些,在社会经济现象中,通常采用95%就可以了。置信度反过来也表示可能犯错误的概率。如置信度为95%,则犯错误的概率就为1-95%=5%。这一概率也就是置信度水平α,也可理解为风险率或风险水平。

图5-2 根据不同样本所得到的置信度为95.5%的置信区间

39

需要指出的是,P(θθθ12≤≤)=1-α不应理解为θ落在某一固定区间的概率。因为这里θ是一个参数,而不是随机变量,而θθ12,是根据抽样的结果计算出来的,因此,[θθ12,]是一个随机区间。即每一个样本都可产生一个估计区间[θθ12,],因此,上述概率1-α可以理解为随机区间[θθ12,]中包括参数θ的概率。

图5-2表示根据不同样本所得到的置信度为95.5%的置信区间与总体均值的位置关系。从所有样本得到的置信区间中有95.5%的区间将包括总体均值,因此可以说所得到的估计区间包括总体均值具有95.5%的置信度。

二、单个总体参数的区间估计

(一)正态总体,方差已知,总体均值的区间估计 根据第四章关于样本均值分布的结果,有

x n

σ~N(0,1)

在给定了估计置信度为1-α时,我们有 ()

P X Z x -

我们可以根据这一原理用样本均值来推断总体均值的区间估计值。若样本的均值为x ,同时若规定置信度为1-α,则总体均值的区间估计的公式是 P x Z n

x Z n -?

<<+?

??

?

?

?=-αασ

μσα//221 这一置信区间的估计可以用图5-3来表示。

上述估计公式仅适用于无限总体的情形,对于有限总体的不放回抽样来说,如果总体规模为N ,样本大小为n ,则区间估计的公式中还需要乘上一个修正系数1

--N n

N 。因此,总体均值的区间估计的公式就变为

ασ

μσαα-=???

?

?

?--?+<<--?-1112/2/N n N n

Z x N n N n Z x P

图5-3 置信度为1-α的置信区间

从上述说明中我们可以总结出对于正态总体,方差已知,总体均值的区间估计的步骤如下:

1. 计算出样本的统计量并确定该统计量的抽样分布。例如,若总体是正态的,

40

那么样本均值也必然服从正态分布。

2. 根据研究的目的确定置信度或置信度水平α大小。按照要求的置信度或置信度水平α查出相应的系数2/αZ 。

3. 计算样本均方差,即抽样的标准误σ

σ

x

n

=

4. 最后把上述数据代入公式,得到区间估计的结果。 其实,这些步骤也同样适用于其他类型的区间估计问题。 (二)非正态总体,方差未知,大样本,总体均值的区间估计

实际中所遇到的总体,往往不一定服从正态分布,而且总体方差也是未知的。在这种情况下要推断总体均值,就要借助于中心极限定理,这需要抽取足够大的样本。这样样本均值仍服从正态分布。此时尽管总体方差未知,但当样本足够大时,一般当30>n 时,我们可用样本标准差来代替总体标准差,直接把S 代入上式中的σ就可以了。

(三)正态总体、方差未知,用小样本对总体均值的区间估计

在总体方差未知的情况下,如果抽取的样本30≤n 就必须采用其他的估计办法。我们已知

x s n

服从t 分布,其自由度为n-1。因此我们就可以利用t 分布来进行估计。此时

αμα-=???

?

???

≤-12/n s t x P 与前面同样地,上述估计公式仅适用于无限总体的情形,对于有限总体来说,如

果总体规模为N ,样本大小为n ,不放回抽样的情形,则区间估计公式中也还需要乘上一个修正系数

1

--N n

N 。 (四)总体比例的区间估计

根据第四章关于样本比例p 分布的结果,我们有

()??

?

?

?n P P P N p -1,

~ 若样本的比例为p ,同时规定估计的置信度为1-α,则总体比例的区间估计的

公式就是 ()ααα-=???

?

?

?-?+<<-?

-11)1(2/2/n P P Z p P n P P Z p P 这里有一个问题,就是在确定总体比例的置信区间时要用到P 本身,而P 又恰恰

是待估值。但由点估计理论我们知道,样本比例p 是总体比例P 的无偏估计,于是在

估计样本比例的方差

()n

P P -1时,直接用样本比例p 代替总体比例P 。只要样本容量n 足够大,并且满足np 和()n p 1-都大于5就可以保证结果是可靠的。最后,得到总体

α

μαα-=???? ?

?+≤≤-12/2/n s t x n s t x P

41

比例的置信区间为: ()ααα-=???

?

?

?-?+<<-?

-11)

1(2/2/n p p Z p P n

p p Z p P 当然对于有限总体不放回抽样的情形,也同样需要乘上一个修正系数1

--N n

N 。 (五)正态总体方差的区间估计

在第四章关于χ2

分布的结果中我们介绍过,来自正态总体的一组样本的方差和总体方差之比服从于χ2

分布,即

()n S -12

2

σ

~()χ

2

1n -

于是对于给定的置信度1-α,我们可以利用χ2

分布的特性,查表得到()χα/22

1n -和()χα122

1--/n ,则有

()()()αχσχαα-=??

????-≤-≤--11112

2/2

222/1n S n n P ()()()()P n S n n S n --≤≤--??????=--11

1112222

2122χσχααα//

于是总体方差σ2

的区间估计为

()()()()n S n n S n ----????

??-11112222122χχαα//,

三、两个总体参数的区间估计

(一)两总体均值之差的区间估计

1. 两个正态总体,方差已知,大样本

从两个总体中所抽取的样本都是大样本,并且两个总体的方差已知时,则两个样本均值之差也服从正态分布。此时 ()2121μμ-=-x x E ,

σ

σσx x n n 12

21

21

2

22

-=

+

因此,()

???? ?

?+?--22

2

1212121,~n n N x x σσμμ。 由此可以得到,在置信度水平为1-α的情况下,μμ12-的置信区间为

()()x x Z n n x x Z n n 122

121222122121222--+-++?????

?

??αασσσσ//, 2. 两正态总体,方差未知,但相等,大样本

两个样本都为大样本时,两样本均值之差也服从正态分布,由于假设两总体方差相等,但未知,需要根据样本方差进行估计。由于样本方差具有随机性,一般地

42

S S 122

2

≠,因此,合并推算总体方差 σ合

2=n s n s n n 11222

2

12

++,

所以,两个样本均值之差的抽样分布的方差为

σσ合

21

22

1211222

212122221

11n n n n n s n s n n s n s n +

=+?? ???++?? ???=

+, 于是,对两总体均值之差估计的置信区间为

()()

???

?

????+?+-+?--2211222/212211222/21,n s n s Z X X n s n s Z X X αα。

3. 两正态总体,方差未知但相等,小样本

根据上一章的结果,总体方差未知时,我们用样本的方差代替总体的方差,由于

小样本,相应的统计量不再服从正态分布而服从t 分布。由于σσ12

22=,则如大样本时一样,应将两个样本合并起来代替总体方差。即 ()()S

n S n S n n 合

2

112222

12112

=

-+-+-

其自由度为n n 122+-,则两总体差的区间估计结果为

()()

???

?????+

?+-+?--22122/2122122/21,n s n s t x x n s n s t x x 合

合合合αα。

(

)

()

???

??

?+?+-+?--212/21212/2111,11n n s t x x n n s t x x 合合αα

(二)两总体比例之差的区间估计

根据两个样本比例之差的抽样分布,两个样本比例之差的均值为两个总体比例之差。两个样本比例之差的方差为 σp p p q n p q n 122

11122

2

-=

+

当两个比例的样本容量为大样本时,两个比例之差也服从正态分布,所以当置信

度为1-α时,两总体比例之差21P P -的置信区间为:

()()???

?

???

?

+?±-+?

±-2

2

21112/2122

21112/21,n q p n q p Z p p n q p n q p Z p p αα (三)两正态总体方差比的区间估计

根据第四章所介绍的F 分布的结果,来自于两个正态分布总体的总体方差和样本方差σ12

和σ22

,S 12

和S 22

所构成的统计量

()F S S F n n =?--122222

1

2

1211σσ~, 故对于给定的置信度水平α,我们可以从F 分布表查得置信区间的临界值: ()F n n 12

1211---α,和()F n n α2

1211--,

43

从而()()ααα

-=??

? ??--<<---11,11,12122121n n F F n n F P

于是()()ασσαα-=?

??

?????--?<<--?

-11,111,112121222

122212122221n n F S S n n F S S P 最后我们得到σσ1

22

2的置信度为1-α的置信区间为

()()?

??

?????--?--?

-1,11,1,112121222

12122221n n F S S n n F S S αα

置信区间与置信水平样本量的关系

置信区间与置信水平、样本量的关系 置信区间与置信水平、样本量的关系(2008-10-28 08:39:39)标签:置信区间与置信水平教育分类:数学相关 置信水平Confidence level 置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。 一、置信区间的概念 置信区间又称估计区间,是用来估计参数的取值范围的。常见的52%-64%,或8-12,就是置信区间(估计区间)。置信区间是按下列三步计算出来的: 第一步:求一个样本的均值 第二步:计算出抽样误差。 人们经过实践,通常认为调查: 100个样本的抽样误差为±10% 500个样本的抽样误差为±5% 1,200个样本时的抽样误差为±3% 第三步:用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。 举例说明: 美国Gallup(盖洛普)公司就消费者对美国产品质量的看法,对美国、德国和日本三国共计3,500名消费者(每个国家约1,200名)分别进行了调查,调查结果:有55%的美国人认为美国产品质量好,而只有26%的德国人和17%的日本人持同样看法。抽样误差为±3%,置信水平为95%。则这三个国家消费者的置信区间分别为: 国别样本均值抽样误差置信区间 美国55% ±3% 52%-58% 德国26% ±3%23%-29% 日本17% ±3%14%-20% 二、关于置信区间的宽窄 窄的置信区间比宽的置信区间能提供更多的有关总体参数的信息。 假设全班考试的平均分数为65分,则 置信区间间隔宽窄度表达的意思 0-100分100 宽等于什么也没告诉你 30-80分50 较窄你能估出大概的平均分了(55分) 60-70分10 窄你几乎能判定全班的平均分了(65分)

Excel求置信区间的方法

应用Excel求置信区间 一、总体均值的区间估计 (一)总体方差未知 例:为研究某种汽车轮胎的磨损情况,随机选取16只轮胎,每只轮胎行驶到磨坏为止。记录所行驶的里程(以公里计)如下: 假设汽车轮胎的行驶里程服从正态分布,均值、方差未知。试求总体均值μ的置信度为的置信区间。 步骤:

1.在单元格A1中输入“样本数据”,在单元格B4中输入“指标名称”,在单元格C4中输入“指标数值”,并在单元格A2:A17中输入样本数据。 2.在单元格B5中输入“样本容量”,在单元格C5中输入“16”。 3.计算样本平均行驶里程。在单元格B6中输入“样本均值”,在单元格C6中输入公式:“=AVERAGE(A2,A17)”,回车后得到的结果为。

4.计算样本标准差。在单元格B7中输入“样本标准差”,在单元格C7中输入公式:“=STDEV(A2,A17)”,回车后得到的结果为。 5.计算抽样平均误差。在单元格B8中输入“抽样平均误差”,在单元格C8中输入公式:“=C7/SQRT(C5)” ,回车后得到的结果为。 6.在单元格B9中输入“置信度”,在单元格C9中输入“”。 7.在单元格B10中输入“自由度”,在单元格C10中输入“15”。 8.在单元格B11中输入“t分布的双侧分位数”,在单元格C11中输入公式:“ =TINV(1-C9,C10)”,回车后得到α=的t分布的双侧分位数t=。 9.计算允许误差。在单元格B12中输入“允许误差”,在单元格C12中输入公式:“=C11*C8”,回车后得到的结果为。

10.计算置信区间下限。在单元格B13中输入“置信下限”,在单元格C13中输入置信区间下限公式:“=C6-C12”,回车后得到的结果为。 11.计算置信区间上限。在单元格B14中输入“置信上限”,在单元格C14中输入置信区间上限公式:“=C6+C12”,回车后得到的结果为。 (二)总体方差已知 仍以上例为例,假设汽车轮胎的行驶里程服从正态总体,方差为10002,试求总体均值μ的置信度为的置信区间。

参数估计练习题

第七章参数估计练习题 一.选择题 1. 估计量的含义是指() A. 用来估计总体参数的统计量的名称 B. 用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体取值 2.一个95%的置信区间是指() A. 总体参数有95%的概率落在这一区间内 B. 总体参数有5%的概率未落在这一区间内 C. 在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数。 D. 在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数。 %的置信水平是指() A. 总体参数落在一个特定的样本所构造的区间内的概率是95% B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95% C.总体参数落在一个特定的样本所构造的区间内的概率是5% D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5% 4. 根据一个具体的样本求出的总体均值的95%的置信区间() A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C. 一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 5. 当样本量一定时,置信区间的宽度() A.随着置信水平的增大而减小 B. .随着置信水平的增大而增大 C.与置信水平的大小无关D。与置信水平的平方成反比 6. 当置信水平一定时,置信区间的宽度() A.随着样本量的增大而减小 B. .随着样本量的增大而增大 C.与样本量的大小无关D。与样本量的平方根成正比 7. 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与 总体参数的离差越小越好。这种评价标准称为() A.无偏性 B. 有效性 C. 一致性 D. 充分性 8. 置信水平(1-α)表达了置信区间的() A.准确性 B. 精确性 C. 显着性 D. 可靠性 9. 在总体均值和总体比例的区间估计中,边际误差由()A.置信水平决定 B. 统计量的抽样标准差确定 C. 置信水平和统计量的抽样标准差 D. 统计量的抽样方差确定 10. 当正态总体的方差未知,且为小样本条件下,估计总体均值使用的分布是() A.正态分布 B. t 分布 C.χ2分布 D. F分布

统计学——参数估计

第8 讲参数估计 本讲的主要内容 8.1 参数估计的一般问题 8.2 一个总体参数的区间估计 8.3 两个总体参数的区间估计 8.4 样本量的确定 学习目标 1.估计量与估计值的概念 2.点估计与区间估计的区别 3.评价估计量优良性的标准 4.一个总体参数的区间估计方法 5.两个总体参数的区间估计方法 6.样本量的确定方法 8.1 参数估计的一般问题 8.1.1 估计量与估计值 估计量与估计值(estimator & estimated value) 1.估计量:用于估计总体参数的随机变量 如样本均值,样本比例, 样本方差等 例如: 样本均值就是总体均值m 的一个估计量 2.参数用θ表示,估计量用表示 3.估计值:估计参数时计算出来的统计量的具体值 如果样本均值?x=80,则80就是m的估计值 8.1.2 点估计与区间估计 点估计 (point estimate) 1.用样本的估计量的某个取值直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计 2.无法给出估计值接近总体参数程度的信息 ⑴虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值 ⑵一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量 区间估计 (interval estimate) 1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到 2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在75~85之间,置信水平是95% 区间估计的图示

置信区间的解释及求取

置信区间的解释及求取-学习了解 95%置信区间(Confidence Interval,CI):当给出某个估计值的95%置信区间为【a,b】时,可以理解为我们有95%的信心(Confidence)可以说样本的平均值介于a到b之间,而发生错误的概率为5%。 有时也会说90%,99%的置信区间,具体含义可参考95%置信区间。 置信区间具体计算方式为: (1) 知道样本均值(M)和标准差(ST)时: 置信区间下限:a=M - n*ST; 置信区间上限:a=M + n*ST; 当求取90% 置信区间时n=1.645 当求取95% 置信区间时n=1.96 当求取99% 置信区间时n=2.576 (2) 通过利用蒙特卡洛(Monte Carlo)方法获得估计值分布时: 先对所有估计值样本进行排序,置信区间下限:a为排序后第lower%百分位值; 置信区间上限:b为排序后第upper%百分位值. 当求取90% 置信区间时 lower=5 upper=95; 当求取95% 置信区间时lower=2.5 upper=97.5 当求取99% 置信区间时lower=0.5 upper=99.5 当样本足够大时,(1)和(2)获取的结果基本相等。 参考资料:http://140.116.72.80/~smallko/ns2/confidence_interval.htm Confidence Limits: The range of confidence interval 附MATLAB 求取置信区间源码: %%% 置信区间的定义90%,95%,99%-------Liumin 2010.04.28 clear clc sampledata=randn(10000,1); a=0.01; %0.01 对应99%置信区间,0.05 对应95%置信区间,0.1 对应90%置信区间 if a==0.01 n=2.576; % 2.576 对应99%置信区间,1.96 对应95%置信区间,1.645 对应90%置信区间 elseif a==0.05 n=1.96; elseif a==0.1 n=1.645; end %计算对应百分位值 meana=mean(sampledata); stda=std(sampledata); sorta=sort(sampledata); %对数据从小到大排序 leng=size(sampledata,1); CIa(1:2,1)=[sorta(leng*a/2);sorta(leng*(1-a/2))]; %利用公式计算置信区间 CIf(1:2,1)=[meana-n*stda;meana+n*stda];

第4章总体参数估计讲解

◎第4章参数估计 ※一、单一总体的参数估计※ ●(一)估计的含义 ●估计:人人都做过。如: ?上课时,你会估计一下老师提问你的概率有多大? ?当你去公司应聘时,会估计你被录用的可能性是多少??推销员年初时要估计今年超额完成任务的概率有多大?◎估计量:用来估计总体参数的样本统计量。如:算术平均数、中位数、标准差、方差等。 ●估计的可能性与科学性:数理统计证明,一个“优良”的样本统计量应具备以下特征: (1)、无偏性。样本估计量的期望值应等于总体参数。无系统偏差。 (2)、有效性。与离散度相联系。在多个无偏估计量中,方差最小的估计量最有效。 (3)、一致性。随着样本容量的增加,可以使估计量越来越靠近总体参数。 (4)、充分性。估计量能够充分利用有关信息,中位数和众数不具备这一点。 ※估计的类型包括:

1、 点估计:只有一个取值。 就 是总体平均数μ的点估计值。 2、区间估计:给出取值范围(值域)。见PPT ▲两种估计类型哪一种更科学? ※ 区间估计的优点在于:它在给出估计区间时, 还可以给予一个“可信程度”。例如:销售经理想 估计一下明年的出口总值,甲估计是53万美元,乙估计 是50—56万美元之间,并可以确切地说“有95%的把握”。 显然后者的可信程度大于前者。那么,50—56万美元之 间的范围是如何计算的?“有95%的把握”是什么意思? 【引例】:某食品进出口公司向东南亚出口一批花生制品,管 理人员从中抽取50包作为样本,计算其平均数为250克。另 外,合同规定总体标准差为6克。 如果问这批花生制品的平均重量,可用样本平均数作为总 体平均数的最佳估计量:250克。但这是远远不够的,在许多 时候,管理人员还想了解“这个估计值的平均误差是多少?” “总体平均数可能落入样本平均数上、下多大范围内?”“ 这 个估计值的可靠程度是多少?” 〖1〗由于n=50,根据中心极限定理可作图: n=50,σ=6 〖2〗抽样平均误差:8485.0506 ===n x σσ

案例:置信度的计算(二项分布)

案例:置信度的计算(二项分布) 应用背景:数字通信系统中的许多元件都必须满足一项有关误码率()(εP )的最低规范。对于一个给定系统,在输入端送入某种预定形式的比特流,然后检测其输出,通过与输入相 比较可以估测出()(εP ) 。输出与输入之间的任何一个差错均视为一次误码。检测到的错误位数(ε)与已经传送的总位数(n )之比即为误码率(),其表示是真实误码率()(?εP )(εP )的估计,估计的准确度随传送位数的增加而改进。其关系可表示为: )()(?εε εP n P n ??→?=+∞ → [1] 重要的是,必须传送、测试足够数目的比特数才能保证是)(?εP )(εP 的合理近似,所以,对于合理限制的测试时间,我们有必要知道完成一个统计有效的测试所需的最少位数。 分析: 在许多场合,我们仅仅需要验证)(εP 是否好于某预定标准。换句话说,只要证明)(εP 比某一上限低即可。例如,许多通信系统要求)(εP 达到或更好(上限为)。统计学中有关加以上限的置信度概念可以用来推测,在某个量化的可信度前提下,真实1010?1010?)(εP 低于规定上限。这种方法带来的主要好处,就是容许你在测试时间和测试精度之间进行折衷。 问题的解决: (1)统计置信度的定义 统计置信度定义为,经过一系列试验,某事件的实际概率优于规定水平的几率(该定义中的实际概率是指,有限次测量所得概率在试验次数趋向无限时的极限值)。应用于)(εP 估计,统计置信度可重新阐述为,(基于n 位传送中检测到ε个错误)真实)(εP 优于规定水平γ(如)的概率。用数学语言表示为: 1010? },|)({n P P CL εγε<= 其中,CL 为置信度。由定义,CL 为概率,因此其在 取值。 ]1,0[计算出统计置信度之后就可以讲,我们有百分之CL 的把握相信,)(εP 优于γ。另外一种表达,如果我们多次重复测量误码率,并对每个测量周期重复计算n P εε=)(?,那么可以预 测,有百分之CL 的优于)(?εP γ。

参数的区间估计

实验三:参数的区间估计 【实验目的】 1.用EXCEL、SPSS进行区间估计,利用计算机软件解决推断统计的问题; 2.如何使用EXCEL进行区间估计。 【实验内容】 参看课本第七章,“软件应用”并完成以下内容: 1.课后作业第16小题,写出置信区间。 由于数据量大,请参EXCEL7.16数据。 列1 列2 平均746.5129 平均778.1324 标准误差19.33632 标准误 差 35.80015 中位数738.5 中位数737 众数1018 众数600 标准差294.5221 标准差295.2156 方差86743.26 方差87152.24 峰度-0.60571 峰度-0.19912 偏度0.08518 偏度0.219081 区域1344 区域1358 最小值99 最小值135 最大值1443 最大值1493 求和173191 求和52913 观测数232 观测数68 置信区间 -111.369 48.12979 由上表可知:有95%的把握认为男女持卡人的信用卡账户余额均值之差在-111.369~48.12979之间。但是所求置信区间包含0,说明我们没足够的理由认为男女信用卡余额之间存在显著差异。 2.根据第七章的案例研究,完成第五小题。 数据参照第七章案例研究数据,另见EXCEL。

手动豪华售价 平均11.94621 标准误差0.131426 中位数11.78617 众数#N/A 标准差0.974681 方差0.950003 峰度-0.45919 偏度0.163266 区域 4.476654 最小值9.858664 最大值14.33532 求和657.0415 观测数55 11.68861 12.2038 由上表可知:有95%把握认为手动豪华的售价在11.68861~12.2038之间。手动豪华库存时间 平均 4.490909 标准误差0.441815 中位数 4 众数 1 标准差 3.276588 方差10.73603 峰度-0.75323 偏度0.616596 区域12 最小值0 最大值12 求和247 观测数55 3.624952 5.356866 由上表可知:有95%把握认为手动豪华的库存时间在3.625~5.357之间。【实验心得】

区间估计和误差计算

(二)区间估计 区间估计是指用样本指标、抽样误差和概率所构造的区间以估计总体指标存在的可能范围。 在进行区间估计的时候,根据所给定的条件不同,总体平均数和总体成数的估计有两条模式可供选择: 第一套:给定置信度要求,去推算抽样误差的可能范围。 第二套:根据已给定的抽样误差范围,求出概率保证程度。 1. 总体平均数的区间估计 按照第一套模式,根据置信度F t ()的要求,估计极限抽样误差的可能范围)(???或p x ,并指出估计区间(置信区间)。具体步骤是: (1)抽取样本,并根据调查所得的样本单位标志值,计算样本平均数x ;计算样本标准差;在大样本下用以代替总体标准差推算抽样平均误差μ。 (2)根据给定的置信度F t ()的要求,查《正态分布概率表》,求得概率度t 值。 (3)根据概率度t 和抽样平均误差μx 计算极限抽样误差的可能范围μx x t =?,并据以计算置信区间的上下限。 例14 麦当劳餐馆在7周内抽查49位顾客的消

费额(元)如下,求在概率95%的保证下,顾客平均消费额的置信区间。 15 24 38 26 30 42 18 30 25 26 34 44 20 35 24 26 34 48 18 28 46 19 30 36 42 24 32 45 36 21 47 26 28 31 42 45 36 24 28 27 32 36 47 35 22 24 32 46 26 第一步:根据样本计算样本平均数和标准差: x x n ==∑32 (元) S n x x ==-∑2 945().(元),用样本标准差代替总体 标准差σ=945.(元) 样本平均误差 x n μσ ===94549135..(元)

区间估计

38 第二节 区间估计 一、区间估计的概念和步骤 点估计用一个确定的值去估计未知的参数,具有较大的风险。因为估计量来自于一个随机抽取的样本,结果也就带有随机性。样本估计量刚好等于所估计的总体参数的可能性极小。但是如果说所估计的总体参数就落在估计值附近,即所估计的总体参数就落在以点估计所得到的估计值为中心的某一个小区间内,那就比较有把握了。这种方法就是区间估计法。 在第四章中我们已经知道,一个足够大样本的均值的抽样分布是正态的,并且所抽到的样本均值落在总体均值的两侧x σ±范围内的概率是0.683,落在总体均值 ±2σx 范围内的概率是0.955,落在总体均值3±σx 范围内的概率是0.997等等。由此 可见,我们可以按照概率来估计总体均值是落在某一区间范围内的。我们把这种对总体均值的估计称作区间估计。从上述说明可以看到: 1. 如果所估计的区间越大,参数被包含在该区间内的概率就越大。 2. 如果样本的方差越小,则在相同的概率下区间估计所得到的结果就越短。 一般地,设θ为总体的一个未知参数,θθ12,分别为由一组样本所确定的对θ的两个估计量,对于给定的10<<α,若P(θθθ12≤≤)=1-α,则称区间[θθ12,]为置信度是1-α的置信区间。θθ12,分别为置信区间的下限和上限。1-α称为置信度或置信概率,表示区间估计的可靠度。α称为置信度水平。 常用的置信度有 0.80,0.90,0.95 0.99等。一般来说,对于估计要求比较精确的问题,置信程度也要求高一些,在社会经济现象中,通常采用95%就可以了。置信度反过来也表示可能犯错误的概率。如置信度为95%,则犯错误的概率就为1-95%=5%。这一概率也就是置信度水平α,也可理解为风险率或风险水平。 图5-2 根据不同样本所得到的置信度为95.5%的置信区间

3-第7章统计学参数估计练习题(20200627170347)

第7章参数估计 练习题 一、填空题(共10题,每题2分,共计20分) 1 ?参数估计就是用_________ 去估计____________ 。 2?点估计就是用_____________ 的某个取值直接作为总体参数的 _____________ 。 3. ______________________ 区间估计是在的基础上,给出总体参数估计的一个区间范围,该区间 通常由样本统计量加减___________ 得到。 4. 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的 比例称为___________ ,也成为_____________ 。 5. __________________________________________________________ 当样本量给定时,置信区间的宽度随着置信系数的增大而__________________________ ;当置信水 平固定时,置信区间的宽度随着样本量的增大而_____________ 。 6. 评价估计量的标准包含无偏性、 ___________ 和____________ 。 7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计 的可靠程度,就会___________ 置信区间的宽度;如要缩小置信区间的宽度,又不降 低置信程度,就要____________ 样本量。 8. 估计总体均值置信区间时的估计误差受总体标准差、 ___________ 和___________ 的影响。 9?估计方差未知的正态总体均值置信区间用公式_____________ ;当样本容量大于等于30时,可以用近似公式__________ 。 10?估计正态总体方差的置信区间时,用___________ 分布,公式为___________ 。 二、选择题(共10题,每题1分,共计10分) 1 ?根据一个具体的样本求出的总体均值的95%勺置信区间()。 A. 以95%勺概率包含总体均值 B. 有5%勺可能性包含总体均值 C?一定包含总体均值

正态总体参数的区间估计

第19讲 正态总体参数的区间估计 教学目的:理解区间估计的概念,掌握各种条件下对一个正态总体的均值和方差进行 区间估计的方法。 教学重点:置信区间的确定。 教学难点:对置信区间的理解。 教学时数: 2学时。 教学过程: 第六章 参数估计 §6.3正态总体参数的区间估计 1. 区间估计的概念 我们已经讨论了参数的点估计,但是对于一个估计量,人们在测量或计算时,常不以得到近似值为满足,还需估计误差,即要求知道近似值的精确程度。因此,对于未知参数θ,除了求出它的点估计?θ外,我们还希望估计出一个范围,并希望知道这个范围包含参数θ真值的可信程度。 设?θ为未知参数θ的估计量,其误差小于某个正数ε的概率为1(01)αα-<<,即 ?{||}1P θθεα -<=- 或 αεθθεθ-=+<<-1)??(P 这表明,随机区间)?,?(εθεθ+-包含参数θ真值的概率(可信程度)为1α-,则这个区间)?,?(εθεθ+-就称为置信区间,1α-称为置信水平。 定义 设总体X 的分布中含有一个未知参数θ。若对于给定的概率1(01)αα-<<,存在两个统计量1112(,,,)n X X X θθ= 与2212(,,,)n X X X θθ= ,使得 12{}1P θθθα <<=-

则随机区间12(,)θθ称为参数θ的置信水平为1α-的置信区间,1θ称为置信下限,2θ称为置信上限,1α-称为置信水平。 注(1)置信区间的含义:若反复抽样多次(各次的样本容量相等,均为n ),每一组样本值确定一个区间12(,)θθ,每个这样的区间要么包含θ的真值,要么不包含θ的真值。按伯努利大数定理,在这么多的区间中,包含θ真值的约占100(1)%α-,不包含θ真值的约仅占100%α。例如:若0.01α=,反复抽样1000次,则得到的1000个区间中,不包含θ真值的约为10个。 (2)置信区间的长度表示估计结果的精确性,而置信水平表示估计结果的可靠性。对于置信水平为1α-的置信区间12(,)θθ,一方面置信水平1α-越大,估计的可靠性越高;另一方面区间12(,)θθ的长度(2)ε越小,估计的精确性越好。但这两方面通常是矛盾的,提高可靠性通常会使精确性下降(区间长度变大),而提高精确性通常会使可靠性下降(1α-变小),所以要找两方面的平衡点。 在学习区间估计方法之前,我们先介绍标准正态分布的α分位点概念。 设 () ~0,1X N ,若 z α 满足条件 { },01 P X z α αα>=<<,则称点z α为标准正态分布的α分位点。例如求0.01z 。按照α分位点定义,我们有 {}0.010.01P X z >=,则{}0.010.99P X z ≤=,即0.01()0.99z φ=。查表可得0.01 2.327z =. 又 由()x ?图形的对称性知1z z αα-=-。下面列出了几个常用的z α值: 2. 正态总体均值μ的区间估计 设已给定置信水平为1α-,总体()2~,X N μσ,12,,,n X X X 为一个样本,2 ,X S 分别是样本均值和样本方差。

相关文档
最新文档