第7章 参数估计
第7章 参数估计

该 种 灯 泡 平 均 使 用 寿 命 的 置 信 区 间 为 1476.8h ~ 1476. 1503. 1503.2h
总体比例的区间估计
总体比例的区间估计
1. 假定条件
总体服从二项分布 可以由正态分布来近似
2.
使用正态分布统计量 z
3. 总体比例π在1-α置信水平下的置信区间为 置信水平下的置信区间为
7.1 参数估计的一般问题
7.1.1 估计量与估计值 7.1.2 点估计与区间估计 7.1.3 评价估计量的标准
估计量与估计值
估计量与估计值
(estimator & estimated value)
1. 估计量:用于估计总体参数的随机变量
如样本均值,样本比例, 如样本均值,样本比例, 样本方差等 例如: 例如: 样本均值就是总体均值µ 的一个估计量
置信区间
(confidence interval) interval)
1. 由样本统计量所构造的总体参数的估计区间称为 置信区间 2. 统计学家在某种程度上确信这个区间会包含真正 的总体参数,所以给它取名为置信区间 3. 用一个具体的样本所构造的区间是一个特定的区 间,我们无法知道这个样本所产生的区间是否包 含总体参数的真值
总体比例的区间估计
(例题分析) 例题分析)
【 例 】 某城市想 要估计下岗职工 中女性所占的比 例 , 随机地抽取 了 100 名 下 岗 职 工 , 其中 65人为 其中65 人为 女性职工。 女性职工 。 试以 95% 的置信水平 95% 估计该城市下岗 职工中女性比例 的置信区间 解:已知 n=100,p=65% , 1-α = 95%, 100, 65% 95% zα/2=1.96
总体均值的区间估计
概率论与数理统计第7章参数估计PPT课件

a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,
第七章 参数估计

第三节 总体均数估计
估计总体平均数的步骤: 估计总体平均数的步骤: X与S 1、 计算样本 2、 计算 σ X 3、 确定置信水平或显著性水平并查表 4、计算置信区间 5、解释总体平均数的置信区间
一、正态估计法 , σ2已知 、
1、前题条件: 、前题条件:
总体正态, n不论大小 总体正态, n不论大小
点估计与区间估计的比较
定义: 定义
直接以样本统计量(数轴上的一个点) 点估计 :直接以样本统计量(数轴上的一个点) 作为总体参数的估计值
区间估计:按一定概率要求, 区间估计:按一定概率要求,根据样本统计量估 计总体参数可能落入的范围的一种统计方法。 计总体参数可能落入的范围的一种统计方法。也 就是说整体参数所落的有把握的范围 整体参数所落的有把握的范围。 就是说整体参数所落的有把握的范围。
D=0.95时 时
75.7 ≤ µ ≤ 81.3
5、解释:用样本1估计,总体的平均数落在 、解释:用样本1估计, 73.6-82.4之间的可能性为95%, 之间的可能性为95% 73.6-82.4之间的可能性为95%,超出这一范 围的可能性为5% 5%。 围的可能性为5%。 用样本2估计,总体的平均数落在76.7 80.3之 76.7用样本2估计,总体的平均数落在76.7-80.3之 间的可能性为95% 落在75.7 81.3的可能性为 95%, 75.7间的可能性为95%,落在75.7-81.3的可能性为 99%。 99%
X ± 2.58σ X
置信限:就是总体参数所落区间的上下界限。 置信限:就是总体参数所落区间的上下界限。即
X − 1.96σ X ≤ µ ≤ X + 1.96σ X
置信下限 置信上限
标准误
标准误(中心极限定理 ) 标准误(中心极限定理3)
概率论 第七章 参数估计

L( ) max L( )
称^为
的极大似然估计(MLE).
求极大似然估计(MLE)的一般步骤是:
(1) 由总体分布导出样本的联合概率分布 (或联合密度);
(2) 把样本联合概率分布(或联合密度)中自变 量看成已知常数,而把参数 看作自变量, 得到似然函数L( );
(3) 求似然函数L( ) 的最大值点(常常转化 为求ln L( )的最大值点) ,即 的MLE;
1. 将待估参数表示为总体矩的连续函数 2. 用样本矩替代总体矩,从而得到待估参
数的估计量。
四. 最大似然估计(极大似然法)
在总体分布类型已知条件下使用的一种 参数估计方法 .
首先由德国数学家高斯在1821年提出。 英国统计学家费歇1922年重新发现此
方法,并首先研究了此方法的一些性质 .
例:某位同学与一位猎人一起外出打猎.一只 野兔从前方窜过 . 一声枪响,野兔应声倒下 .
p值 P(Y=0) P(Y=1) P( Y=2) P(Y=3) 0.7 0.027 0.189 0.441 0.343 0.3 0.343 0.441 0.189 0.027
应如何估计p?
若:只知0<p<1, 实测记录是 Y=k
(0 ≤ k≤ n), 如何估计p 呢?
注意到
P(Y k) Cnk pk (1 p)nk = f (p)
第七章 参数估计
参数估计是利用从总体抽样得到的信息 估计总体的某些参数或参数的某些函数.
仅估 计一 个或 几个 参数.
估计新生儿的体重
估计废品率
估计降雨量
估计湖中鱼数
…
…
参数估计问题的一般提法:
设总体的分布函数为 F(x, ),其中为未 知参数 (可以是向量).从该总体抽样,得样本
第7章参数估计

31 100
假定A品牌袋装大米的重量服从正态分布,现随机抽取13袋大 米,测得其重量(单位:千克)分别为 ⎛ ⎞ 24, 24.2, 24.4, 24.6, 24.7, ⎝ 24.8, 25, 25.1, 25.1, 25.2, ⎠ 25.3, 25.4, 25.6. 分别计算该品牌袋装大米的重量的均值,及重量的标准差 的95%的置信区间。
4. 整理后,得到未知参数������的置信区间
参数估计的基本原理 点估计 区间估计 一个总体参数的区间估计 总体均值的区间估计 总体比例的区间估计 总体方差的区间估计 两个总体参数的区间估计 两个总体均值之差的区间估计 两个总体比例之差的区间估计 两个总体方差之比的区间估计 样本量������的确定 估计总体均值是样本量的确定 估计总体比例时是样本量的确定
一家食品生产企业以生产袋装食品为主,每天的产量大约 为8000袋左右。按规定每袋的重量应为100g。为了对产品质量进 行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符 合要求。现从某天生产的一批食品中随机抽取25袋,测得每袋重 量如下所示: 112.5 102.6 100 116.6 136.8 101 107.5 123.5 95.4 102.8 103 95 102 97.8 101.5 102 108.8 101.6 108.6 98.4 100.5 115.6 102.2 105 93.3
正态总体,������未知,因此应用公式①,即 ������ 2 ������ 2 方差的置信区间为[ ������(2������−(1) , ������2(������−1) ], ������ − 1) ( ������ −1) ������/2 1−������/2 √︂ √︂ ������ 2 ������ 2 标准差的置信区间为[ ������(2������−(1) , ������2(������−1) ]。 ������−1) (������−1)
概率第7章 参数估计

Gauss
Fisher
基本思想
甲.乙两人比较射击技术,分别射击目标一次,甲中而乙未中, 可以认为:甲射击技术优于乙射击技术. 事件A发生的概率为0.1或0.9,观察一次,事件A发生了, 可以认为:事件A发生的概率为0.9. 实际问题(医生看病、公安人员破案、技术人员进行质量 检验等)尽管千差万别,但他们具有一个共同的规律,即在 获得了观察资料之后,给参数选取一个数值,使得前面的观 察结果出现的可能性最大. 最大似然估计就是通过样本值 x1 , , x n 等数求得总体的 分布参数,使得 X1 ,, X n 取值为 x1 , , x n 的概率最大.
i
L( ) L( x1 , , x n ; ) f ( x i ; ),
i 1
n
的最大值,这里 ( )称为样本的似然函数 L .
ˆ 若 L( x 1 , , x n ; ) max L( x 1 , , x n ; )
ˆ 则称 ( x1 , , xn )为 的极大似然估计值 .
i
xi
在得到观测值 x1 , x 2 , , x n 的前提下,自然 应当选取使得 n
f ( x ; )dx
i i 1
i
达到最大的 值作为未知参数 的估计值.
因为当未知参数 等于这个值时,出现给 定的那个 样本观测值的可能性最 大.
但 dxi 不随 而变,故只需考虑:
3.期望和方差的点估计 在实际中,常常以样本均值作为总体均值的 点估计,以样本方差作为总体方差的点估计. 期望的点估计: (1)无偏性 1 n 选择估计量 X X i n i 1 (2)样本容量越大,估计值 越有效 方差的点估计:
第7章参数估计
x 1 0
f P 1-p
x
xf f
1 p 0 (1 p) p (1 p)
p
2 (x x)2 f (1 p)2 p (0 p)2 (1 p)
f
p (1 p)
似然函数常简记为L或 L 1,2, ,k
未知参数的函数。
38
若有 ˆi (x1, x2,..., xn ) i 1, 2, k 使得
L x1, x2,..., xn;ˆ1, ˆ 2,
, ˆ k
max L (1 ,2 , ,k )
x1, x2,..., xn; 1, 2,
, k
则 ˆi (X1, X2,..., Xn) 为参数θi的极大似然估计量。
中选出一个使样本观察值出现的概率为最大的 ˆ 作
为θ的估计量。
称 ˆ 为θ 的极大似然估计量。
37
2.似然函数的数学表达式
设X1,X2,…Xn是取自总体X的一个样本,样本的联合密度 (连续型)或联合分布律 (离散型)为 :
f (x; 1,2 , , k )
定义似然函数为:
n
L L x1,..., xn; 1, 2, , k f xi; 1, 2, , k i 1 x1, x2 ,..., xn 给定的样本观察值
§7.1.4抽样误差
1.误差:调查结果与实际值之间的差异 抽样调查中的误差
登记性误差(非抽样误差) 误差代表性误差随系机统误误差差((抽非样抽误样差误)差)
2.抽样误差—由于抽样的随机性而产生的 样本指标对总体指标的代表性误差。抽样误 差可以计算并加以控制,但不可以避免。
概率论与数理统计-参数估计
第七章 参数估计
例:
引言
设总体 X 是服从参数为 的指数分布,其中参数
未 知 ,
0 .X1 ,,
X
是总体
n
X
的一个样本,
我们的任务是根据样本,来估计 的取值,从
而估计总体的分布.
这 是 一 个 参 数 估 计 问 题.
第七章 参数估计
§1 点估计 §2 估计量的评选标准 §3 区间估计
第七章 参数估计 §1 点估计
2
令
A1
A2
, (
2
1)
.
第七章 参数估计
例6(续)
解此方程组,得
§1 点估计
ˆ
A1 2 A2 A12
,
ˆ
A2
A1 A12
.
ˆ X 2 ,
即
B2
ˆ X .
B2
其中 B2
1 n
n i 1
Xi X
2 为样本的二阶中心矩.
第七章 参数估计(第二十二讲) 三、 极大似然法
§1 点估计
1
第七章 参数估计
例6(续)
EX 2 x 2 f
x dx x 2
x 1e x dx
0
§1 点估计
2 2 x ( e 2)1 x dx
2 0 2
2 2
1 2
1
2
因此有
EX
,
EX
2
1 .
⑵ 在不引起混淆的情况下,我们统称估计量
与估计值为未知参数 的估计.
第七章 参数估计
二、 矩估计法
§1 点估计
设X为连续型随机变量,其概率密度为
f ( x;1 ,, k ), X为离散型随机变量,其分布列为
第7章 参数估计(小结与典型例题选讲)
估计量, 这个估计量称为矩估计 . 量
最大似然估计量
得到样本值 x1 , x2 ,, xn 时 , 选取使似然函数L( )
ˆ 取得最大值的 作为未知参数 的估计值, ˆ 即 L( x1 , x2 , , xn ; ) max L( x1 , x2 , , xn ; ).
( 其中 是 可能的取值范围)
P{ ( X 1 , X 2 ,, X n ) ( X 1 , X 2 ,, X n )} 1 ,
则称随机区间( , ) 是 的置信水平为1 的置信 区间, 和 分别称为置信水平为 的双侧置信 1 区间的置信下限和置信 上限, 1 为置信水平.
其中 Sw2
n1S12 n2 S2 2 , Sw Sw2 . n1 n2 2
1 2. 两个总体方差比 2 的置信区间 2 (1)总体均值 1 , 2 为已知的情况.
2
1 2 的一个置信水平为 1 的置信区间 2
2
m m 2 2 n ( X i 1 ) n ( X i 1 ) 1 1 i n1 . , i n1 F (m, n) F (m, n) m (Y j 2 ) 2 1 /2 m (Y j 2 ) 2 /2 j 1 j 1
ˆ Var[ p ] p(1 p) , 2 n ln f ( x; p) E p n
1 n ˆ 对于参数 p 的无偏估计量 p X X i , n i 1
1 n 1 n ˆ ] Var X i 2 Var[ X i ] Var[ p n i 1 n i 1
i 1
n
L( )称为样本似然函数 .
07心理统计学-第七章 参数估计
犯错误的概率,常用α(或p)表示。则1-α为置信 度。(显著性水平越高表示的是α值越小,即犯错误的可
能性越低) α为预先设定的临界点,常用的如.05、.01、.001;p 为检验计算所得的实际(犯错误)概率。
第一节 点估计、区间估计与标准误
三、区间估计与标准误
3、区间估计的原理与标准误
转换成比率为
p
n
p, SE p
n
pq n
同理可得公式7-17。自习[例7-12、例7-13]
1、从某地区抽样调查400人,得到每月人均文化消费为 160元。已知该地区文化消费的总体标准差为40元。试 问该地区的每月人均文化消费额。(α=.05,总体呈正态
分布)
2、上题中总体方差未知,已知Sn-1=44元。 3、已知某中学一次数学考试成绩的分布为正态分布,总 体标准差为5。从总体中随机抽取16名学生,计算得平 均数为81、标准差为Sn=6。试问该次考试中全体考生成 绩平均数的95%置信区间。 4、上题中总体方差未知,样本容量改为17人。 5、假定智商服从正态分布。随机抽取10名我班学生测 得智商分别为98、102、105、105、109、111、117、 123、124、126(可计算得M=112,Sn≈9.4),试以95% 的置信区间估计我班全体的智商平均数。 返回
值表,求tα /2(df)。
5、计算置信区间CI。
σ2已知,区间为M-Zα /2 SE <μ< M+Zα /2 SE;
σ2未知,区间为M-tα /2(df)SE <μ< M+tα /2(df)SE。
6、对置信区间进行解释。
二、σ2已知,对μ的区间估计(Z分布,例7-1 & 2) 三、σ2未知,对μ的区间估计(t分布,例7-3 & 4)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章 参数估计教学目的:了解参数估计的类型;理解参数估计的意义与原理;掌握点估计与区间估计方法。
教学重点:点估计、区间估计的原理;总体平均数估计的步骤与方法 教学时数:6学时当在研究中从样本获得一组数据后,如何通过这组数据信息,对总体特征进行估计,也就是如何从局部结果推论总体的情况,称为总体参数估计。
参数估计有两类,一类是用一个具体的值(根据样本数据计算出来的)来代替总体的参数,如用样本平均数代替总体均值,用样本标准差S n-1代替总体标准差,这种参数估计称为点估计;另一类是根据样本信息给出总体参数的可能范围,他不能精确地指出总体参数用哪一个值来代替,但它能以极大的概率保证总体参数落入这个范围,牺牲精确性获得可靠性,这类参数估计称为区间估计。
第一节 点估计、区间估计与标准误一、点估计的定义指在进行参数估计时,直接以一个特定值(一般常用样本统计量的值)作为总体参数的估计值。
二、良好估计量的标准用样本统计量作为总体参数的估计值,总是有一定的偏差,一个好的估计量应具备经下的一些特性:1.无偏性指一切可能样本的统计量的值与总体参数的偏差的平均值为0,称无偏估计量,否则,称有偏估计量。
无偏性更精确的表述为:若样本的某个统计量的均值等于该被估计的总体参数,则该样本统计量是无偏的。
其直观意义是无系统偏差。
如X 、Md 、Mo 都是μ的无偏估计量。
如2S 就不是2σ的无偏估计量,21-n S 才是2σ的无偏估计量。
2.有效性指当总体参数的无偏估计量不只一个时,无偏估计变异小者的有效性高。
直观意义是取值比较稳定、可靠。
如A 、B 都是总体参数的无偏估计量,则哪一个的方差较小,就较有效。
如平均数、中数、众数都是无偏估计量,但只有平均数最有效,其方差为n 2σ,而样本中的任一个数据作为估计值,其方差为2σ3.一致性指当样本容量无限增大时,估计值越来越接近它所估计的参数。
μ-=i i X d 则∑∑-=-=μμN X N X d i i )( 即ndX i∑=-μ所以当∞→n 时0→∑ndi即μ→X 此外有∞→n 时,221σ→-n S4.充分性指一个容量为n 的样本统计量,是否充分地反映了全部n 个数据所反映总体的信息。
三、区间估计与标准误点估计方便、简单,但总是存在误差,其误差大小及可靠程度无法得知,区间估计可克服此缺点。
区间估计是根据样本信息给出总体参数的可能范围。
(一)区间估计的定义是根据样本统计量,利用抽样分布的原理,在一定的可靠程度上,估计出总体参数所在的范围,即以数轴上的一段距离表示未知参数可能落入的范围。
(二)置信区间与显著性水平设有一随机变量X 服从正态分布,则随机抽取的样本的平均数),(~2nN x σμ,若要求用样本平均数估计总体平均数达到95%的可靠度。
根据正态分布理论和抽样分布理论可知,任一样本的平均数落在总体均值左右1.96个标准差的范围内的概率为95%,反之,任一样本平均数左右1.96个标准差范围内可能包含总体均值的可能性为95%。
即95.096.1=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-n X P σμ这里所用的标准差是样本平均数的标准差,它等于总体标准差的n 分之一。
所以{}05.0195.096.196.1-==+<<-n X n X P σμσ这里以估计总体均值为例来说明了区间估计的原理。
在这里的概率95%称为置信度,即有多大可能包含总体参数,反映了推断总体参数落在某一区间的可靠程度;那么1-95%=5%即是构造出来的置信区间没有能把总体的参数包含在内的概率,它是构造置信区间犯错误的可能性大小,一般称为显著性水平,用α表示,显然显著性水平要求是一很小的概率,而置信度应该是一个较大的概率。
样本平均数左右1.96个标准差的范围]96.1,96.1[n X n X σσ+-称为总体均值的置信度为0.95的置信区间,即可能包含总体参数的区域,也就是区间估计要找的范围;区间左右端点分别称为下置信限和上置信限。
例:通过对某校一年级学生的期末成绩的抽样调查,以0.95的概率估计μ在78.5~85.7分之间,这就是区间估计。
可以说是以0.95的置信度(或在0.05的显著性水平上)估计该校一年级学生的期末成绩的置信区间为[78.5, 82.7],这一估计的正确率为95%,可能犯错误的概率是5%。
↓↓⇒置信度区间 一般α取0.05或0.01 ↑↓⇒↓⇒精度区间X SE ↓↑⇒X SE n故可通过增大n ,来缩小置信区间,但又加大工作量。
(二)区间估计的原理与标准误区间估计是根据样本分布理论,用样本分布的标准误(SE)计算区间长度,解释总体参数落入某置信区间可能的概率。
某种统计量在抽样分布上的标准差,称为标准误。
标准误用来衡量抽样误差。
标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。
因此,标准误是统计推断可靠性的指标。
进行区间估计的关键是找出一个合适的统计量,以及这个统计量抽样分布的状态、标准误。
区间估计包括两个问题,一是成功估计的概率,二是估计范围的大小,即精度大小。
第二节 总体平均数的估计下面分几种具体情况讨论:1.总体平均数的区间估计以取自该总体的样本平均数为基础,根据样本平均数的分布理论对总体平均数进行的估计,最后用概率所界定的区间范围来说明它的不确定性。
(1)总体方差已知时A . 总体分布为正态,无论n 的大小,),(~2nN x σμB . 总体分布为非正态,但n >30时,抽样分布可近似看作正态,),(~2nN x σμ以上两种情况可以正态分布来对总体平均数进行估计,否则不能进行估计。
),(~2nN x σμ )1,0(~N n X Z σμ-=∴ ααα-=⎭⎬⎫⎩⎨⎧≤≤-122Z Z Z P ασμσαα-=⎭⎬⎫⎩⎨⎧+≤≤-122n Z X n Z X P即总体平均数的置信度为α-1的置信区间为⎥⎦⎤⎢⎣⎡+-n Z X n Z X σσαα22, 例1.已知某市6岁正常男童体重的总体方差为6.55公斤,从该市随机抽取15名6岁男童测体重,平均数为20.4公斤,求总体平均数的95%和99%的置信区间。
解:一般认为儿童的身高、体重、智力等的发展符合正态分布66.01555.6===nSE X σ96.1205.0=Z 58.2201.0=Z所以μ的95%的置信区间为nZ X nZ X σμσ205.0205.0+≤≤- 即69.2111.19≤≤μμ的99%的置信区间为nZ X nZ X σμσ201.0201.0+≤≤- 即1.227.18≤≤μ例2:某校历史考试成绩σ=5,从中随机抽取49名学生,平均分为85,试推论μ。
解: σ=5,成绩分布未知,但n>30,故符合条件,可进行推论71.0495===nSE X σ定置信水平为0.95,则μ的95%的置信区间为nZ X nZ X σμσ205.0205.0+≤≤- 即4.866.83≤≤μ(2)总体方差未知时总体方差未知时,用21-n S 作2σ的估计值,实现对μ的估计 A .当),(~2σμN x 时,无论n 大小,均有)1(~1---n t n S x μ成立。
B .总体为非正态,只有当n>30时,才有)1(~1---n t n S x μ成立,也可视为近似服从N (0,1) 除此之外,不能进行估计总体μ的置信度为1-α的置信区间为⎥⎦⎤⎢⎣⎡-+----1,1)1(2)1(2n St X n S t X n n αα例1:从某市制取20名7岁女童测量其身高,经测量,这20名7岁女童的平均身高为116cm ,S=5cm ,试求该市7岁女童的平均身高为μ的95%和99%的置信区间。
解:总体方差未知,但女童身高可以确定为服从正态分布 故)1(~1---n t n S x μ 查表知:当α=0.05时,)19(205.0t =2.293当α=0.01时,)19(201.0t =2.861所以μ的置信度为95%的置信区间为[113.59, 118.41] μ的置信度为99%的置信区间为[112.71, 119.29]例2:某校进行一次数学考试,从中抽取40名学生,平均分为82, 标准差为7分,求μ的95%和99%的置信区间。
解:总体方差未知,总体分布也难于保证正态,但n>30 故仍有)1(~1---n t n S x μ df=n-1=39,表中没有,可近似取40,查表知:当α=0.05时,)40(205.0t =2.021 当α=0.01时,)40(201.0t =2.704所以μ的置信度为95%的置信区间为[79.74, 84.26] μ的置信度为99%的置信区间为[78.97, 85.03]总结:计算步骤为①计算平均数、标准差,②计算平均数标准误,③确定显著性水平,④根据样本平均数的抽样分布,确定查何种统计表,⑤计算置信区间,⑥解释总体平均数的置信区间。
第三节 标准差与方差的区间估计一、标准差的区间估计估计总体标准差的步骤与估计总体平均数的步骤大致相同。
但有两点需要说明:1.从抽样分布的讨论已知,样本标准差的抽样分布在n>30时为渐近正态分布,总体标准差可依正态分布来估计。
当n<30时,总体标准差则无法估计。
2.置信区间为:⎥⎦⎤⎢⎣⎡+-----n S Z S n S Z S n n n n 2,2121121αα例: 某区一次英语统考中,随机抽取40名考生,计算其英语成绩的标准差为15.6,试求该区英语统考成绩总标准差的95%和99%的置信区间。
解:由题意知,由样本标准差估计总体标准差,且n>30,可依正态分布估计。
77.194.88.158039406.152121==⨯=-⨯==-n n n S n S SE n S 95%的置信区间:05.1915.12:,77.196.16.1577.196.16.15≤≤⨯+≤≤⨯-σσ即 99%的置信区间。
17.2003.11:,7.158.26.1577.158.26.15≤≤⨯+≤≤⨯-σσ即 二、方差的区间估计方差的区间估计与平均数相同,首先要确定它们的抽样分布,然后才能据此确定置信区间)1(~222-n nS χσ (要求总体服从正态分布)αχσχαα-=⎪⎪⎭⎫ ⎝⎛≤≤---12)1(2222)1(21n n nS P 2)1(21222)1(22---≤≤n n nS nS ααχσχ 即2σ的置信度为1-α的置信区间为⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡---2)1(2122)1(22,n n nS nS ααχχ 例:在某市进行的一次智力测验中,随机n=20名12岁学生,方差为72.25,求总体方差的95%和99%的置信区间。