第七章 参数估计
合集下载
概率论与数理统计第7章

x 0 , x 0 ,x 1 ,x 2 ,
,x n 为 总 体 X
的 一 个 样 本 ,则 未 知 参 数 的 矩 估 计 ˆ _ _ _ _ _ _ _ _ _ _ _ .
这个例子所作的推断已经体现了极大似然法 的基本思想 .
最大似然估计原理:
设X1,X2,…Xn是取自总体X的一个样本,样 本的联合密度(连续型)或联合分布律 (离散型)为
f (x1,x2,… ,xn ; ) .
当给定样本X1,X2,…Xn时,定义似然函数为:
L() f (x1, x2 ,…, xn; )
得
pˆ1Βιβλιοθήκη nn i 1xix
即为 p 的最大似然估计值 .
从而 p 的最大似然估计量为
p ˆ(X1,
1n ,Xn)ni1Xi X
求最大似然估计(MLE)的一般步骤是:
(1) 由总体分布导出样本的联合分布率(或联 合密度);
(2) 把样本联合分布率 ( 或联合密度 ) 中自变
量看成已知常数,而把参数 看作自变量,得到似然 函数L();
要求:领会
2.2 估计量的有效性、相合性, 要求:领会
3.区间估计
3.1 置信区间的概念,
要求:领会
3.2 求单个正态总体均值和方差的置信区间,要求:简单应用
参数估计
现在我们来介绍一类重要的统计推断问题
参数估计问题是利用从总体抽样得到的信息来估计总体 的某些参数或者参数的某些函数.
估计新生儿的体重
1 p
n
pxi (1p)1xi
i1
n
n
xi
n xi
pi1 (1p) i1
n
n
xi
n xi
L(p)pi1 (1p) i1
概率论与数理统计第7章参数估计PPT课件

5
a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,
a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,
概率论 第七章 参数估计

L( ) max L( )
称^为
的极大似然估计(MLE).
求极大似然估计(MLE)的一般步骤是:
(1) 由总体分布导出样本的联合概率分布 (或联合密度);
(2) 把样本联合概率分布(或联合密度)中自变 量看成已知常数,而把参数 看作自变量, 得到似然函数L( );
(3) 求似然函数L( ) 的最大值点(常常转化 为求ln L( )的最大值点) ,即 的MLE;
1. 将待估参数表示为总体矩的连续函数 2. 用样本矩替代总体矩,从而得到待估参
数的估计量。
四. 最大似然估计(极大似然法)
在总体分布类型已知条件下使用的一种 参数估计方法 .
首先由德国数学家高斯在1821年提出。 英国统计学家费歇1922年重新发现此
方法,并首先研究了此方法的一些性质 .
例:某位同学与一位猎人一起外出打猎.一只 野兔从前方窜过 . 一声枪响,野兔应声倒下 .
p值 P(Y=0) P(Y=1) P( Y=2) P(Y=3) 0.7 0.027 0.189 0.441 0.343 0.3 0.343 0.441 0.189 0.027
应如何估计p?
若:只知0<p<1, 实测记录是 Y=k
(0 ≤ k≤ n), 如何估计p 呢?
注意到
P(Y k) Cnk pk (1 p)nk = f (p)
第七章 参数估计
参数估计是利用从总体抽样得到的信息 估计总体的某些参数或参数的某些函数.
仅估 计一 个或 几个 参数.
估计新生儿的体重
估计废品率
估计降雨量
估计湖中鱼数
…
…
参数估计问题的一般提法:
设总体的分布函数为 F(x, ),其中为未 知参数 (可以是向量).从该总体抽样,得样本
第七章 参数估计

第七章 参数估计
1、正态总体、方差已知或非正态总体,大样本 当总体服从正态分布且方差已知时,或者总体不是正态分布但是大样本时,样本 均值的抽样分布均为正态分布,其数学期望为总体均值u,方差为Ϭ2/n。而样本均 值经过标准化以后的随机变量则服从标准正态分布,即 Z=(x-u)/(Ϭ/n0.5)~N(0,1) 根据上式和正态分布的性质可以得出总体均值u在1-α置信水平下的置信区间为: xα+是(-)事Z(α先/2)所(Ϭ确/n定0.5的)。而其一中个,概x率+Z值(α/2,) (Ϭ也/n称0.为5)为风置险信值上,限是,总x体-Z均(α/2值) (Ϭ不/包n0.含5)为在置置信信下区限间,的 概是率估;计1总- 体α称均为值置时信的水估平计,误Z差(α/。2) 是标准正态分布右侧面积为α/2的z值;Z(α/2) (Ϭ/n0.5) 也即是说,总体均值的置信区间由两个部分构成:点估计值和描述估计量精度的 +(-)值,这个+(-)值称为估计误差。
第七章 参数估计
在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
其中,区间的最小值称为置信下限,最大值称为置信上限。
由于统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名 为置信区间。原因是:如果抽取了许多不同的样本,比如说抽取100个样本,根据 每一个样本构造了一个置信区间,这样,由100个样本构造的总体参数的100个置 信区间中,有95%的区间包含了总体参数的真值,而5%则没有包含,则95%这个值 称为置信水平。一般,如果将构造置信区间的步骤重复多次,置信区间中包含总 体参数真值的次数所占的比例称为置信水平,也称为置信度或置信系数。
自然使用估计效果最好的那种估计量。什么样的估计量才算一个好的估计量呢? 统计学家给出了评价估计量的一些标准,主要包括以下几个:
第七章-参数估计

的标准 • 1.无偏性 • 无偏估计量:用多个样本的统计量作为总体参数 的估计值,其偏差的平均数为0。
X 0
• 2.有效性
• 当总体参数的无偏估计不止一个统计量时,无偏
估计变异小者有效性高,变异大者有效性低,即 方差越小越好。
9 0.286 9 0.286 2 23.6 1.73
0.11 2 1.49
• 【例7-7】
• n=31,sn-1=5问的0.95置信区间?
• 解:先求方差的置信区间,当df=30,查χ2表,
2 0.025 47
2 0.975 16.8
2 30 52 30 5 2 47 16.8
正态分布,即Z0.05/2=1.96。
5 0.635 2 31
• 0.95的置信区间为:
5 1.96 0.635 5 1.96 0.635
3.76 6.24
• 二、方差的区间估计
• 根据χ2分布:
2
X X
2
2
2 2 n 1 sn ns 1
第七章 参数估计
思 考
• 例8-1:从某市随机抽取小学三年级学生50名,测 得平均身高为 140cm ,标准差 4 。试问该市小学 三年级学生的平均身高大约是多少?
例8-2:某教师用韦氏成人智力量表测80 名高三学生,M=105。试估计该校高三 学生智商平均数大约为多少?
什么是参数估计
当在研究中从样本获得一组数据后,如何通过 这组数据信息,对总体特征进行估计,也就是 如何从局部结果推论总体的情况,称为总体参 数估计。 • 参数估计: 样本 统计量
• 【例7-2】
• 有一个49名学生的班级,某学科历年考试成绩的
X 0
• 2.有效性
• 当总体参数的无偏估计不止一个统计量时,无偏
估计变异小者有效性高,变异大者有效性低,即 方差越小越好。
9 0.286 9 0.286 2 23.6 1.73
0.11 2 1.49
• 【例7-7】
• n=31,sn-1=5问的0.95置信区间?
• 解:先求方差的置信区间,当df=30,查χ2表,
2 0.025 47
2 0.975 16.8
2 30 52 30 5 2 47 16.8
正态分布,即Z0.05/2=1.96。
5 0.635 2 31
• 0.95的置信区间为:
5 1.96 0.635 5 1.96 0.635
3.76 6.24
• 二、方差的区间估计
• 根据χ2分布:
2
X X
2
2
2 2 n 1 sn ns 1
第七章 参数估计
思 考
• 例8-1:从某市随机抽取小学三年级学生50名,测 得平均身高为 140cm ,标准差 4 。试问该市小学 三年级学生的平均身高大约是多少?
例8-2:某教师用韦氏成人智力量表测80 名高三学生,M=105。试估计该校高三 学生智商平均数大约为多少?
什么是参数估计
当在研究中从样本获得一组数据后,如何通过 这组数据信息,对总体特征进行估计,也就是 如何从局部结果推论总体的情况,称为总体参 数估计。 • 参数估计: 样本 统计量
• 【例7-2】
• 有一个49名学生的班级,某学科历年考试成绩的
概率论与数理统计-参数估计

第七章 参数估计
例:
引言
设总体 X 是服从参数为 的指数分布,其中参数
未 知 ,
0 .X1 ,,
X
是总体
n
X
的一个样本,
我们的任务是根据样本,来估计 的取值,从
而估计总体的分布.
这 是 一 个 参 数 估 计 问 题.
第七章 参数估计
§1 点估计 §2 估计量的评选标准 §3 区间估计
第七章 参数估计 §1 点估计
2
令
A1
A2
, (
2
1)
.
第七章 参数估计
例6(续)
解此方程组,得
§1 点估计
ˆ
A1 2 A2 A12
,
ˆ
A2
A1 A12
.
ˆ X 2 ,
即
B2
ˆ X .
B2
其中 B2
1 n
n i 1
Xi X
2 为样本的二阶中心矩.
第七章 参数估计(第二十二讲) 三、 极大似然法
§1 点估计
1
第七章 参数估计
例6(续)
EX 2 x 2 f
x dx x 2
x 1e x dx
0
§1 点估计
2 2 x ( e 2)1 x dx
2 0 2
2 2
1 2
1
2
因此有
EX
,
EX
2
1 .
⑵ 在不引起混淆的情况下,我们统称估计量
与估计值为未知参数 的估计.
第七章 参数估计
二、 矩估计法
§1 点估计
设X为连续型随机变量,其概率密度为
f ( x;1 ,, k ), X为离散型随机变量,其分布列为
第7章 参数估计(小结与典型例题选讲)

估计量, 这个估计量称为矩估计 . 量
最大似然估计量
得到样本值 x1 , x2 ,, xn 时 , 选取使似然函数L( )
ˆ 取得最大值的 作为未知参数 的估计值, ˆ 即 L( x1 , x2 , , xn ; ) max L( x1 , x2 , , xn ; ).
( 其中 是 可能的取值范围)
P{ ( X 1 , X 2 ,, X n ) ( X 1 , X 2 ,, X n )} 1 ,
则称随机区间( , ) 是 的置信水平为1 的置信 区间, 和 分别称为置信水平为 的双侧置信 1 区间的置信下限和置信 上限, 1 为置信水平.
其中 Sw2
n1S12 n2 S2 2 , Sw Sw2 . n1 n2 2
1 2. 两个总体方差比 2 的置信区间 2 (1)总体均值 1 , 2 为已知的情况.
2
1 2 的一个置信水平为 1 的置信区间 2
2
m m 2 2 n ( X i 1 ) n ( X i 1 ) 1 1 i n1 . , i n1 F (m, n) F (m, n) m (Y j 2 ) 2 1 /2 m (Y j 2 ) 2 /2 j 1 j 1
ˆ Var[ p ] p(1 p) , 2 n ln f ( x; p) E p n
1 n ˆ 对于参数 p 的无偏估计量 p X X i , n i 1
1 n 1 n ˆ ] Var X i 2 Var[ X i ] Var[ p n i 1 n i 1
i 1
n
L( )称为样本似然函数 .
07心理统计学-第七章 参数估计

犯错误的概率,常用α(或p)表示。则1-α为置信 度。(显著性水平越高表示的是α值越小,即犯错误的可
能性越低) α为预先设定的临界点,常用的如.05、.01、.001;p 为检验计算所得的实际(犯错误)概率。
第一节 点估计、区间估计与标准误
三、区间估计与标准误
3、区间估计的原理与标准误
转换成比率为
p
n
p, SE p
n
pq n
同理可得公式7-17。自习[例7-12、例7-13]
1、从某地区抽样调查400人,得到每月人均文化消费为 160元。已知该地区文化消费的总体标准差为40元。试 问该地区的每月人均文化消费额。(α=.05,总体呈正态
分布)
2、上题中总体方差未知,已知Sn-1=44元。 3、已知某中学一次数学考试成绩的分布为正态分布,总 体标准差为5。从总体中随机抽取16名学生,计算得平 均数为81、标准差为Sn=6。试问该次考试中全体考生成 绩平均数的95%置信区间。 4、上题中总体方差未知,样本容量改为17人。 5、假定智商服从正态分布。随机抽取10名我班学生测 得智商分别为98、102、105、105、109、111、117、 123、124、126(可计算得M=112,Sn≈9.4),试以95% 的置信区间估计我班全体的智商平均数。 返回
值表,求tα /2(df)。
5、计算置信区间CI。
σ2已知,区间为M-Zα /2 SE <μ< M+Zα /2 SE;
σ2未知,区间为M-tα /2(df)SE <μ< M+tα /2(df)SE。
6、对置信区间进行解释。
二、σ2已知,对μ的区间估计(Z分布,例7-1 & 2) 三、σ2未知,对μ的区间估计(t分布,例7-3 & 4)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的 分布
**给定置信度1- ,可查t 分布表确定临界值t / 2 (n 1)
从而总体均 n
, x t / 2
S n1 n
)
其中,Sn1 (x) 即为抽样平均误差
n
t / 2
S n1 n
x
即为抽样允许误差
上式也可表示为: x x
x
x
例题应用
解题过程(一)
已知: n =25, =0.05
样本均值
x 1 2 3 6 5 8 7 8 9 1 5(小时) 25
样本方差
s2 (1- 5) 2 2 (3 - 5)2 6 (5 - 5)2 8 (7 - 5)2 8 (9 - 5) 2 1 25 -1
=4.33
(1)查 t 分布表知 =0.05时,临界t值 / 2 (n 1)
一、点估计
(一)概念
2.矩估计
矩估计法是用样本的矩去估计总体的矩,从而获得总 体有关参数的估计量的方法。矩是指以期望值为基础 定义的数字特征,如数学期望、方差、协方差等
由于区间估计所表示的是一个可能的范围,而不是一 个绝对可靠的范围。就是说,推断全及指标在这个范 围内只有一定的把握程度。用数学的语言讲,就是有 一定的概率。
第七章 参数估计
7.1 点估计 7.2 区间估计
一、点估计
(一)概念
1.点估计
设总体随机变量的分布函数已知,但它的一个或多 个参数未知,若从总体中抽取一组样本观察值,以该 组数据来估计总体参数,就称为参数的点估计
例如,在全部产品中,抽取100件进行仔细检 查,得到平均重量x=1002克,合格率p=98%, 我们直接推断全部产品的平均重量X=1002克, 合格率P=98%。
2.063 9,因此,
抽样平均误差 (x) Sn1 4.33 0.416
n
25
t0.025=(25 1)
抽样允许误差
x
t / 2
S n 1 n
2.0639
0.416
0.859
解题过程(二)
(2)总体均值置信度为95%的置信区间为:
(
x t / 2
S n1 n
, x t / 2
x
x
=(
,
30.38)30.2 0.1764 30.2 0.1764
)= (30.02,
即我们可以以95%的概率保证该厂零件平均长度在
30.02厘米到30.38厘米之间
2.总体方差未知时总体均值的区间估计
**总体方差 2 未知,可以以样本方差S 2 代替,但新的统
计量不服从标准正态分布,而是服从自由度为n -1 t
解:点估计法是用样本指标直接作为总体指标的代表 值,所以,全部电子元件的平均耐用时间即为4 340小 时;总体合格率为98%
7.2 区间估计
(一)区间估计的概念
根据样本统计量以一定的可靠程度去估计总体参数 值所在的范围或区间,是抽样估计的主要方法
(二)抽样估计的置信度与精确度
1.置信度:表示区间估计的可靠程度或把握程度,
[例7-4] 从某市高中生中按不重复抽样方法随机抽取25 名调查每周收看电视的时间,分组资料见下表:
每周看电视时间(小时) 2 以下 2—4 4—6 6—8 8—10 合计
学生人数(人) 2 6 8 8 1 25
要求:(1)计算抽样平均误差和抽样允许误差
(2)估计该市全体高中生每周平均看电视时间的置 信区间(给定的显著性水平为0.05)
例题应用
[例7-3] 某厂生产的零件长度服从正态分布,从该 厂生产的零件中随机抽取25件,测得它们的平均长 度为30.2厘米。已知总体标准差 =0.45厘米 要求:(1)计算抽样平均误差和抽样允许误差
(2)估计零件平均长度的可能范围( =0.05)
已知: X ~,N( ),0.452=30.2,x =25, n
2.抽样估计的精确度:用置信区间的大小即抽样极
限/允许误差来表示
3.抽样估计的置信度与精确度的矛盾关系
在样本容量和其他条件一定的情况下,
若希望抽样估计有较高的可靠度,则必须扩大置信区 间,即必须降低估计的精确度
若希望抽样估计有较高的精确度,即置信区间范围缩 小,则必须降低估计的把握度
即:抽样估计要求的把握度越高,则抽样允许误差越 大,精确度越低;反之则相反
**思考:在抽样调查中,如何同时提高抽样估计的精 确度和把握度?
区间估计的应用
(一)总体均值的区间估计
1.总体方差已知时
当 X ~ N( ,2 )时,来自该总体的简单随机样本x1 , x2 , , xn
的样本均值服从数学期望为 、方差 2 为的正态分布,将样本均值统计 量 x 标准化,得到 Z 统计量
也即所估计的区间包含总体参数真实值的可能性大小,
一般以1- 表示。其中 表示显著性水平,即某一小
概率事件发生的临界水平 置信度通常采用三个标准:
(1)显著性水平=0.05,即1- =0.95
(2)显著性水平=0.01,即1- =0.99 (3)显著性水平=0.001,即1- =0.999
(二)抽样估计的置信度与精确度 **
一、点估计
(二)矩估计法的评价
优点: 一、 计算简便直观,一般不考虑抽样误差和可靠程
度 二、适用于对估计准确与可靠程度要求不高的情况
局限性: 一、它要求总体矩存在 二、不能充分利用估计时已掌握的有关总体分布的
信息
(三)应用例题
[例7-1] 某厂对所生产的电子元件抽取5%进行抽样调查, 计算出样本的平均耐用时间为4 340小时,样本合格率 为98%。根据矩估计法原理,估计该厂所生产的电子 元件的平均耐用时间和合格率。
Z x ~ N (0,1) / n
根据区间估计的定义,在给定的显著性水平 下,总体均值 在
1- 的置信度下的置信区间为:
(
x Z /2 n
,x Z / 2
n
),即x x
x
x
其中, (x)
误差 n
即抽样平均误差 ,Z / 2
n
x
即抽样允许
1.总体方差已知时总体均值的区间估计
1- =0.95
解题过程
(1)抽样平均误差
(x) 0.45 0.09
n 25
查标准正态分布表可知在 =0.05时,Z / 2 =1.96,所以,
抽(样2允)许总误体差均值的x 置 Z信 /区2 间n 为 1:.96 0.09 0.1764
(
x Z /2
n
,x Z / 2
n
)(=x , x )
**给定置信度1- ,可查t 分布表确定临界值t / 2 (n 1)
从而总体均 n
, x t / 2
S n1 n
)
其中,Sn1 (x) 即为抽样平均误差
n
t / 2
S n1 n
x
即为抽样允许误差
上式也可表示为: x x
x
x
例题应用
解题过程(一)
已知: n =25, =0.05
样本均值
x 1 2 3 6 5 8 7 8 9 1 5(小时) 25
样本方差
s2 (1- 5) 2 2 (3 - 5)2 6 (5 - 5)2 8 (7 - 5)2 8 (9 - 5) 2 1 25 -1
=4.33
(1)查 t 分布表知 =0.05时,临界t值 / 2 (n 1)
一、点估计
(一)概念
2.矩估计
矩估计法是用样本的矩去估计总体的矩,从而获得总 体有关参数的估计量的方法。矩是指以期望值为基础 定义的数字特征,如数学期望、方差、协方差等
由于区间估计所表示的是一个可能的范围,而不是一 个绝对可靠的范围。就是说,推断全及指标在这个范 围内只有一定的把握程度。用数学的语言讲,就是有 一定的概率。
第七章 参数估计
7.1 点估计 7.2 区间估计
一、点估计
(一)概念
1.点估计
设总体随机变量的分布函数已知,但它的一个或多 个参数未知,若从总体中抽取一组样本观察值,以该 组数据来估计总体参数,就称为参数的点估计
例如,在全部产品中,抽取100件进行仔细检 查,得到平均重量x=1002克,合格率p=98%, 我们直接推断全部产品的平均重量X=1002克, 合格率P=98%。
2.063 9,因此,
抽样平均误差 (x) Sn1 4.33 0.416
n
25
t0.025=(25 1)
抽样允许误差
x
t / 2
S n 1 n
2.0639
0.416
0.859
解题过程(二)
(2)总体均值置信度为95%的置信区间为:
(
x t / 2
S n1 n
, x t / 2
x
x
=(
,
30.38)30.2 0.1764 30.2 0.1764
)= (30.02,
即我们可以以95%的概率保证该厂零件平均长度在
30.02厘米到30.38厘米之间
2.总体方差未知时总体均值的区间估计
**总体方差 2 未知,可以以样本方差S 2 代替,但新的统
计量不服从标准正态分布,而是服从自由度为n -1 t
解:点估计法是用样本指标直接作为总体指标的代表 值,所以,全部电子元件的平均耐用时间即为4 340小 时;总体合格率为98%
7.2 区间估计
(一)区间估计的概念
根据样本统计量以一定的可靠程度去估计总体参数 值所在的范围或区间,是抽样估计的主要方法
(二)抽样估计的置信度与精确度
1.置信度:表示区间估计的可靠程度或把握程度,
[例7-4] 从某市高中生中按不重复抽样方法随机抽取25 名调查每周收看电视的时间,分组资料见下表:
每周看电视时间(小时) 2 以下 2—4 4—6 6—8 8—10 合计
学生人数(人) 2 6 8 8 1 25
要求:(1)计算抽样平均误差和抽样允许误差
(2)估计该市全体高中生每周平均看电视时间的置 信区间(给定的显著性水平为0.05)
例题应用
[例7-3] 某厂生产的零件长度服从正态分布,从该 厂生产的零件中随机抽取25件,测得它们的平均长 度为30.2厘米。已知总体标准差 =0.45厘米 要求:(1)计算抽样平均误差和抽样允许误差
(2)估计零件平均长度的可能范围( =0.05)
已知: X ~,N( ),0.452=30.2,x =25, n
2.抽样估计的精确度:用置信区间的大小即抽样极
限/允许误差来表示
3.抽样估计的置信度与精确度的矛盾关系
在样本容量和其他条件一定的情况下,
若希望抽样估计有较高的可靠度,则必须扩大置信区 间,即必须降低估计的精确度
若希望抽样估计有较高的精确度,即置信区间范围缩 小,则必须降低估计的把握度
即:抽样估计要求的把握度越高,则抽样允许误差越 大,精确度越低;反之则相反
**思考:在抽样调查中,如何同时提高抽样估计的精 确度和把握度?
区间估计的应用
(一)总体均值的区间估计
1.总体方差已知时
当 X ~ N( ,2 )时,来自该总体的简单随机样本x1 , x2 , , xn
的样本均值服从数学期望为 、方差 2 为的正态分布,将样本均值统计 量 x 标准化,得到 Z 统计量
也即所估计的区间包含总体参数真实值的可能性大小,
一般以1- 表示。其中 表示显著性水平,即某一小
概率事件发生的临界水平 置信度通常采用三个标准:
(1)显著性水平=0.05,即1- =0.95
(2)显著性水平=0.01,即1- =0.99 (3)显著性水平=0.001,即1- =0.999
(二)抽样估计的置信度与精确度 **
一、点估计
(二)矩估计法的评价
优点: 一、 计算简便直观,一般不考虑抽样误差和可靠程
度 二、适用于对估计准确与可靠程度要求不高的情况
局限性: 一、它要求总体矩存在 二、不能充分利用估计时已掌握的有关总体分布的
信息
(三)应用例题
[例7-1] 某厂对所生产的电子元件抽取5%进行抽样调查, 计算出样本的平均耐用时间为4 340小时,样本合格率 为98%。根据矩估计法原理,估计该厂所生产的电子 元件的平均耐用时间和合格率。
Z x ~ N (0,1) / n
根据区间估计的定义,在给定的显著性水平 下,总体均值 在
1- 的置信度下的置信区间为:
(
x Z /2 n
,x Z / 2
n
),即x x
x
x
其中, (x)
误差 n
即抽样平均误差 ,Z / 2
n
x
即抽样允许
1.总体方差已知时总体均值的区间估计
1- =0.95
解题过程
(1)抽样平均误差
(x) 0.45 0.09
n 25
查标准正态分布表可知在 =0.05时,Z / 2 =1.96,所以,
抽(样2允)许总误体差均值的x 置 Z信 /区2 间n 为 1:.96 0.09 0.1764
(
x Z /2
n
,x Z / 2
n
)(=x , x )