北邮概率论与数理统计参数估计的评选标准 (7.3)

合集下载

概率论与数理统计第7章参数估计PPT课件

概率论与数理统计第7章参数估计PPT课件
5
a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,

7.3估计量的评选标准

7.3估计量的评选标准

第12页
例7 设总体期望为 E( X )= , 方差 D( X )= 2
( X 1 , X 2 ,, X n )
(1)设常数 为总体X 的一个样本。
1 ci i 1,2, , n. n
n
c
i 1
n
i
1.
证明
(2) 证明
ˆ1 ci X i 是 的无偏估计量
i 1
由前面例子 可知,
x0 X 与 n min{X 1 , X 2 , , X n }都
0 为常数
是 的无偏估计量,问哪个估计量更有效? 2 解 D(X ) , D(n min{ X 1 , X 2 ,, X n }) 2 n
所以, X 比
n min{X1, X 2 ,, X n } 更有效。
k
特别地, 样本均值 X 是总体期望 E( X ) 的无偏估计量
1 n 2 样本二阶原点矩 A2 X i 是总体二阶 n i 1 2 原点矩 2 E ( X ) 的无偏估计量。
例2 设总体 X 的期望 E( X )与方差 D( X )存在,
第4页
n i 1n 1 2 2 S ( X X ) (2) 是 D( X ) 的无偏估计量。 i n 1 i 1 n 1 n 1 证 (X i X )2 X i2 X 2 n i 1 n i 1
第23页
n 1 1 n 2 2 2 又 B2 ( X i X ) ( X i 2 X i X X ) n i 1 n i 1
1 n 2 X i X 2 A2 X 2 , n i 1
( A2是样本二阶原点矩 )
由大数定律知,
1 n 2 A2 X i 依概率收敛于E ( X 2 ), n i 1 1 n X X i 依概率收敛于E ( X ), n i 1

北邮概率论与数理统计区间估计(7.4)

北邮概率论与数理统计区间估计(7.4)

§7.4 区间估计参数的区间估计与参数的点估计一样,是参数估计的重要方法。

参数的点估计给出了一个具体值,但这个具体值不会是参数的精确值,而是一个近似值。

尽管近似的精度可以用均方误差给出评估,但我们还是无法知道估计值与真值相差多少。

区间估计在一定程度上解决了这个问题。

区间估计就是通过两个统计量及覆盖概率给出参数的另一种形式的估计。

当有样本值后,可以把未知参数估计在一定的范围内,并且可以给出这种估计的可信程度。

在某些具体问题中区间估计可能比点估计更具实用价值,并且区间估计还是度量点估计精度的最直观的方法。

因此区间估计是一种应用非常广泛的估计形式。

7.4.1 区间估计的概念设θ是未知参数,n x x x ,...,,21是样本,所谓区间估计就是要找两个统计量),...,,(ˆˆ21n L L x x x θ=θ和),...,,(ˆˆ21n U U x x x θ=θ,使得),...,,(ˆ21n L x x x θ),...,,(ˆ21n U x x x θ<,并构造一个随机区间)ˆ,ˆ(U L θθ,在有了样本值后把θ估计在区间)ˆ,ˆ(U L θθ内。

由于样本的随机性,随机区间)ˆ,ˆ(U L θθ覆盖θ有一定的概率,自然要求随机区间)ˆ,ˆ(U L θθ覆盖θ的概率)ˆˆ(UL P θθθ<<尽可能大,但这必然导致区间长度增大,而过长的区间又会导致给出的区间估计无意义。

为解决此矛盾,Neyman 建议采取一种折中方案:在使得覆盖θ的概率达到一定要求的前提下,寻找“精确度”尽量高的区间估计. 因此我们把)ˆ,ˆ(U L θθ覆盖θ的的概率事先指定,这就引入置信区间的概念。

定义 设θ是总体的一个参数,假设有两个统计量),...,,(ˆˆ21n L L x x x θ=θ和),...,,(ˆˆ21n U U x x x θ=θ,若对任意Θ∈θ,有 )ˆˆ(UL P θθθ<<α-≥1 则称随机区间),ˆ(U L θθ为θ的置信水平为α-1的置信区间,UL θθ,ˆ分别称为θ的置信水平为α-1的(双侧)置信下限和置信上限。

7.3 估计量的评选标准

7.3 估计量的评选标准
第三节
估计量的评选标准
一、问题的提出 二、无偏性 三、有效性 四、相合性参数, 对于同一个参数 用不同的估计方法求出的 估计量可能不相同. 估计量可能不相同 问题 (1)对于同一个参数究竟采用哪一个估计量好? (1)对于同一个参数究竟采用哪一个估计量好? 对于同一个参数究竟采用哪一个估计量好 (2)评价估计量的标准是什么? (2)评价估计量的标准是什么? 评价估计量的标准是什么 本节介绍几个常用标准. 本节介绍几个常用标准.
ˆ θ 是 θ 的无偏估计量 .
无偏估计的实际意义: 无系统误差. 无偏估计的实际意义: 无系统误差.
例1 设总体 X 的 k 阶矩 µ k = E ( X k ) ( k ≥ 1)存在 ,
试证明不论 的一个样本, 又设 X 1 , X 2 ,L, X n 是 X 的一个样本,
1 n k 总体服从什么分布 , k 阶样本矩 Ak = ∑ X i 是 n i =1
才能显示出优越性, 这在实际中往往难以做到, 才能显示出优越性, 这在实际中往往难以做到, 因此, 因此, 在工程中往往使用无偏性和有效性这 两个标准. 两个标准.
k 阶总体矩 µ k 的无偏估计 .
证 因为 X 1 , X 2 ,L, X n 与 X 同分布, 同分布, 故有 即
E ( X ik ) = E ( X k ) = µ k ,
i = 1,2,L, n.
1 n k E ( Ak ) = ∑ E ( X i ) = µ k . n i =1
故 k 阶样本矩 Ak 是 k 阶总体矩 µ k 的无偏估计 .
都是 θ 的无偏估计量 ,
ˆ ˆ ˆ ˆ 若有 D(θ1 ) ≤ D(θ 2 ) , 则称 θ1 较 θ 2 有效 .
四、相合性

概率论与数理统计--- 估计量的评选标准

概率论与数理统计--- 估计量的评选标准


15
例3 设总体 X 的均值和方差均存在 ,nX1, „, Xn 是总体 X 的样本, C1 , C2 ,„ ,Cn 为不全相同且满足 C i 1 的任一组常数,
证明: (1) 样本的线性函数 Ci X i 是总体均值 的无偏估计量 ; i 1 n n 1 X 较 C X 有效. (2) 总体均值的无偏估计量 X n i i i i 1 i 1 n n n 证(1) E ( C i X i ) C i EX i C i
24
譬如,在估计湖中鱼数的问题中, 若我们根据一个 实际样本得到鱼数 N 的极大似然估计为 1000 条.
但实际上, N 的真值可能大于 1000 条, 也可能小于1000条. 若我们能给出一个区间, 在此区间内我们合 理地相信 N 的真值位于其中, 这样对鱼数的估计就有 把握多了.
也就是说, 我们希望确定一个尽可能小的区间, 使我们能以 • 比较高的可靠程度相信它包含真参数值.
i 1 j 1
n
m
解:(1) E(T)=an+bm =(na+mb) 当na+mb=1时, E(T)=
此时,T是的无偏估计
(2) D(T)=a2n+b24m
1 na 2 na 4m( ) m 2 4(1 na ) 2 na m 8n(1 na ) dD 0 0 2na 令 m da 4 (4n+m)a=4 a 4n m D(a)>0 此时D(T)最小,即T最有效 4 1 a , b 4n m 4n m
定义:设ˆ (X1,X2,…,Xn)为的估计量,若E(ˆ) 存在,且有 ˆ E ( ) , 则称ˆ 为的无偏估计量

概率论与数理统计 7.3 区间估计

概率论与数理统计 7.3 区间估计

不依赖于未知参数 ;
(3) 对给定的置信水平 1 , 确定 = 1 ,
5
一般是选取满足
2 (4) 由不等式 1 < g < 2 解出 的置信区间
( 1 , 2 ) .
P{ g 1 } = P{ g 2 } =
中, 分别独立抽取一些样品, 测得蓄电池的电
容量为 甲: 144, 141, 138, 142, 141, 143, 138, 137; 乙: 142, 143, 139, 140, 138, 141, 140, 138, 140, 136 设两个工厂生产的蓄电池电容量分别服从正态 分布 N( μ1 ,σ12), N( μ2 ,σ22) . 求 σ12/σ22 的 95% 的置信区间
[2.18, 9.52]
18
二 、两个正态总体 N( μ1 ,σ12), N( μ2 ,σ22) 的情况 (一) 两个总体均值差 μ1 μ2 的置信区间: 1、两个总体的方差 σ12 , σ22已知:
由于 X
12 N 1 , , Y n1
2 2 N 2 , , n2
引言
前面我们介绍了点估计的概念。点估计只是给出 了未知参数值的近似值。人们常常不满足于得到近 似值,还需要知道估计的误差是多少?即参数的一个 估计范围,还希望知道该范围覆盖参数真值的可信
程度。这种范围的估计称为区间估计。
1
7. 3 区间估计
定义7.6:
设 是总体的一个参数, ( X 1 , X 2 , , X n )是
由于
故有
2 S12 S2

2 1
2 2
F ( n1 1 , n2 1) ,
2 2 S S 1 2 P F ( n1 1 , n2 1) < 2 < F ( n1 1 , n2 1) 2 1 1 2 2 2

概率论与数理统计 7.2(参数的区间估计)

概率论与数理统计 7.2(参数的区间估计)

常将该对称区间写成较短的形式: X z 2 n
7.2.2 正态总体均值的区间估计 当然,(7.7)式中的不等式不是唯一的,取两个对称 的分位点 –z/2 和 z/2 是为了使两点之间的长度最小, 从而保证了所得置信区间的精度最大. 2. 2未知时, 的置信区间
1. 已知时,2的置信区间
由于X~N(,2),所以 取枢轴量
n 2
Xi 2 ~ ( n), i 1
n
2
n X 1 2 2 i 2 X i i 1 i 1
由于 2概率密度不是对称的,对给定的置信水平1 – ,不容易找到最短的置信区间,习惯上仍取对称形
2未知时,不能再用
区间的枢轴量,因为其中含有另一个未知参数2. 考虑到S2是2的无偏估计,可以用S2代替2, 由定理6.3知 X ~ t ( n 1),
S/ n
X Z 作为求 的置信 / n
所以,可以选用 T
X 作为枢轴量. S/ n
7.2.2 正态总体均值的区间估计
第三节 区间估计
前面,我们讨论了参数点估计. 它 是用样本算得的一个值去估计未知参数. 但是,点估计值仅仅是未知参数的一个 近似值。 点估计缺点
它没有反映出这个近似值的误差范围, 还有可信度. 区间估计正好弥补了点估计的这个缺陷 .
7.2.1 区间估计的一般步骤
定义7.5 设X1,X2,…,Xn为总体X的一个样 本,θ为总体X的未知参数,对给定的(0,1),如 果有两个统计量 ˆ1 ˆ1 ( X1 , X 2 ,, X n )和
本相互独立,其样本均值分别记为 X 和 Y ,其样本方 差分别记为S12和S22. 我们来研究参数1 – 2的区间估计. 1. 12和22已知时,1–2的置信区间 由定理6.4知

概率论与数理统计 7.2 估计量的评选标准

概率论与数理统计 7.2 估计量的评选标准
若 1 比 2有效, 即指在样本容量 n 相同的条件下,
1 的观察值比 2 的更密集在真值 的附近,
也就是 1 比 2 更理想 .
兰州交通大学博文学院 10
例2:设总体 X 的方差存在且大于零, E(X)=μ , 设 (X1 , X2) 是X的一个样本, 则
1 = X 和 2 = X1 均为 的无偏估计量,
总体 X 的均值为 μ , 方差为 σ 2 , 证明:
(1) 样本平均数 X 是 的无偏估计量 ;
(2) 样本方差 S 2是 2的无偏估计量 ,
2 样本方差 Sn 不是 2 的无偏估计量.
解 (1) 由于 E ( X i ) = E ( X ) = , ( i = 1, 2,
, n)


nபைடு நூலகம்
4 2
D(
i 1
n
( X i 0 )2
2
2 4 ) 2 2n n n
兰州交通大学博文学院 17
4
三、相合性: 1、定义7.5:
设 n = n ( X1 , X 2 ,
, X n ) 是 的一个估计量,
若对任何一个 ε > 0 , 有
lim P { n > } = 0 ,
所以 S 2 是 2 的无偏估计量.
n 1 2 由于 E( Sn ) = E ( ( X i X )2 ) n i =1
n1 2 = E S n
n1 = E( S 2 ) n n1 2 = n
2 所以 Sn 不是 2 的无偏估计量. 可是
兰州交通大学博文学院 8
2 n 1 2 2 2 = + ( + ) n n 1 i =1 n
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

§7.3 估计量的评选标准由点估计提法可以看出,估计的概念相当广泛,并且用不同的估计方法往往会得出不同的估计.如果不对估计的好坏加以明确,估计是没有意义的.评价估计量的优劣并不简单,这首先需要明确衡量优良性的标准.这些标准不是唯一的,也不是绝对的.从不同角度出发可以提出不同的标准.下面我们讨论评价估计优劣的一些常用的标准. (一)均方误差同一参数的估计有多种,那么什么样的估计算是好的甚至是最好的?这就涉及优良性标准.从直观上看,估计量与被估计量越接近越好.当我们用)(ˆX θ估计θ时,评价该估计好坏的一个自然的度量是|)(ˆ|θθ-X ,但由于θ是未知的,样本又具有随机性,因而这种自然度量在实际中是不可行的,为了消除随机性的影响,可以考虑对它求平均|)(ˆ|θθ-X E ,出于数学处理上的方便,最常用的标准是由下式给出的均方误差.2))(ˆ()ˆ(θθθθ-=X E MSE 例7.3.1设n X X ,,1 为来自正态总体),(2σμN 的简单随机样本, (1) 若μ已知,考虑2σ的两个估计量:∑=---=n i i X n 1221)(11ˆμσ,∑=-=n i i X n 1220)(1ˆμσ, 求这两个估计量的均方误差,并比较它们的大小; (2)若μ未知,考虑2σ的两个估计量:∑=---=n i i X X n 1221)(11ˆσ,∑=-=n i i X X n 1220)(1ˆσ, 求这两个估计量的均方误差, 并比较它们的大小.解:(1)先求20ˆσ的均方误差,由于220)ˆ(σσ=E ,所以])([1)ˆ()ˆ(1222022∑=-==n i i X D n D M S E μσσσ, 又∑=-ni iX122)(1μσ~)(2n χ,故n XD ni i2])(1[122=-∑=μσ,即得4122])([σμn X D ni i =-∑=,从而知nMSE 4202)ˆ(2σσσ=,或])([1)ˆ()ˆ(1222022∑=-==ni i X D n D MSE μσσσ n X D nni i 41222)(1σμ=-=∑=, (这里用到了:若X ~),(2σμN ,则⎩⎨⎧-=-为奇数,为偶数,k k k X E k k0,!)!1()(σμ从而422)(σμ=-X D )再求21ˆ-σ的均方误差,}])({)1(1)ˆ(212222212∑=-+---=ni i n X E n MSE σσμσσ 424122)1(12}])([{)1(1σσμ-+=+--=∑=n n X D n ni i , 易见对任意的02>σ,总有>-)ˆ(212σσMSE )ˆ(202σσMSE , 思考题:考虑∑=-+=n i i kX k n 122)(1ˆμσ(k 为整数),计算)ˆ(22k MSE σσ并找出k 为何值时均方误差最小.(2)先求21ˆ-σ的均方误差,由于221)ˆ(σσ=-E ,所以 ])([)1(1)ˆ()ˆ(12221212∑=----==ni i X X D n D MSE σσσ又∑=-ni i X X122)(1σ~)1(2-n χ,故)1(2])(1[122-=-∑=n X XD ni iσ, 即得412)1(2])([σ-=-∑=n X X D ni i ,从而知12)ˆ(4212-=-n MSE σσσ,再求20ˆσ的均方误差,}])1()({1)ˆ(21222222∑=----=ni i n X X E n MSE σσσσ 42412212}])([{1σσn n X X D n ni i -=+-=∑=, 易见对任意的02>σ,总有>-)ˆ(212σσMSE )ˆ(202σσMSE . 思考题:考虑∑=-+=n i i kX X k n 122)(1ˆσ(k 为整数),计算)ˆ(22k MSE σσ并找出k 为何值时均方误差最小.(二) 无偏性均方误差可分解成两部分:2))(ˆ()ˆ(θθθθ-=X E MSE 2ˆˆ]-)(E [)(r Va θθθ+= 若偏差0ˆ==θθθ-)(E )b(,那么均方误差就等于方差.这样的估计量叫做无偏估计量.因此有如下义.定义 设θ为待估参数,参数空间为Θ,),,,(ˆˆ21nX X X θθ=为θ的估计量,若对于任意Θ∈θ,总有θθθ=)ˆ(E , 则称),,,(ˆˆ21n X X X θθ=为θ的无偏估计量,或者说),,,(ˆˆ21n X X X θθ=作为θ的估计量具有无偏性.又若0=∞→)b(lim n θ,称θˆ是θ的渐近无偏估计.例7.3.2 设总体X 的均值为μ,方差为2σ,n X X ,,1 是来自该总体的简单随机样本.则(i )样本均值X 为总体均值μ的无偏估计; (ii )样本均值2S 为总体均值2σ的无偏估计;思考题:样本标准差S 是否是总体标准差σ的无偏估计?如果不是,在正态模型下如何修改使之为无偏估计.例7.3.3 设n X X ,,1 是来自总体),(2σμN 的简单随机样本,求解下面问题(1)2σ的两个常用估计量∑=-=n i i nX X n S 122)(1,∑=--=n i i X X n S 122)(11中哪个是无偏估计?(2) 若22bS X a T +=为2μ的无偏估计,确定b a ,. 解:(1)略(2) 2222222)()1()()()(σμσσμna b a b n a S bE X aE T E ++=++=+=, 由无偏性定义知 对2,σμ∀,有 222)(μσμ=++na b a 从而得nb a 1,1-==。

对估计而言,无偏性的要求是否一定要遵守以及无偏性的实际价值如何,这还必须结合具体问题的实际情况去考察.无偏性体现了一种频率思想,只有在大量重复使用时,无偏性才会体现其价值.例如,要估计某批产品的合格品率θ,从中抽取n 件产品进行检验,其中合格品件数为X ,那么n X /是θ的无偏估计.然而对一次具体的观察值x 而言,n x /与θ丝毫不差几乎是不可能的,但凭此具体的观察值x ,其接近程度无法知晓,此时无偏性显得没有多大意义.如果问题改为某一工厂每天都对其生产的产品进行抽检,若假定生产过程是稳定的,那估计的无偏性要求便是合理的,比如每天都用n X /估计θ,对一天而言,该估计可能偏大也可能偏小,但在一段较长时期内,把各天的估计再进行平均,那么正负偏差就会在很大程度上得以抵消,其平均会在θ周围作微小波动.总之我们不要把无偏性要求看得过重,无偏性是大量重复使用同一估计量时应尽量满足的要求,但根据现有数据进行一次性估计时不必要求什么无偏性. (三) 有效性对于不同的无偏估计量的均方误差的比较,就是比较其方差.因此有如下定义.定义 设)X ,,X n 1 (θθˆˆ=和)X ,,X n 1 (θθ~~=为θ的两个无偏估计,若对于任意Θ∈θ,总有)(Var )(Var θθ~ˆ≤.且至少有一个Θ∈θ,使得)(Va r )(Va r θθ~ˆ<,我们称θˆ比θ~更有效.例7.3.4 设总体X 的均值为μ,方差为2σ,n X X ,,1 是来自该总体的简单随机样本.则对于任意满足11=∑=ni i a 的一组实数n a ,,a ,a 21,∑=ni i i X a 1都是总体均值μ的无偏估计,且此类无偏估计中, 样本均值X 的方差最小.例7.3.5 设n X X ,,1 来自该均匀总体),0(θU 的样本,(1)证明:X 2ˆ=θ,)(1~n X nn +=θ均为θ的无偏估计; (2)比较以上两个估计量的有效性. (四) 相合性估计量是与相本容量有关的,假设用统计量),,(ˆˆ1nn X X θθ=估计θ,其接近程度(当然这里首先要明确接近程度的衡量标准,比如均方误差)一般来说与n 与θ都有关系.对某个固定的n ,接近程度只与θ有关且不可能对所有的Θ∈θ都任意小,但当∞→n 时,通常可以做到这一点.为此就需要考察当∞→n 时统计量的性质,在统计学中把这方面的性质叫做大样本性质.下面介绍的相合性就是大样本性质.定义 设),,(ˆˆ1nn X X θθ=是θ的估计,如果当∞→n 时,有 θθPn →ˆ,则称nθˆ为θ的相合估计. 相合性讨论涉及概率论中极限定理的内容,这部分的知识我们学得不多,这里就不详细讨论了,只给出几个结论:1. ),,(ˆˆ1n n X X θθ=是θ的估计,其均方误差为2)ˆ()ˆ(θθθθ-=nn E MSE ,若当∞→n 时,Θ∈∀→θθθ,0)ˆ(MSE ,则),,(ˆˆ1nn X X θθ=是θ的相合估计.2.设总体X 的k 阶矩k k X E μ=)(存在,n X X ,,1 是来自该总体的简单随机样本,则样本的k 阶矩∑=n i ki X n 11是总体的k 阶矩k μ的相合估计.3.若nθˆ是为θ的相合估计,)(g θ是连续函数,则)(g n θˆ是)(g θ的相合估计.例 设总体X ~),1(θB ,n X X ,,1 是来自该总体的样本,那么XX-1是θθθ-=1)(g 的相合估计.。

相关文档
最新文档