最小方差无偏估计

合集下载

第2.3节 最小方差无偏估计和有效估计

第2.3节  最小方差无偏估计和有效估计

X n )T 是 , X n )是g( )
( 2)
f ( x; ) 存在且对中一切 有 f ( x; ) f ( x; )dx dx ,





T ( x1 , x2 ,
, xn ) L( x , )dx1dx2 , xn ) L( x , )dx1dx2
未知参数,X ( X1 , X 2 ,
, X n )T 是来自总体X的一 , X n )是的充分统计

个样本,如果T T ( X 1 , X 2 ,
ˆ是的任一无偏估计,记 ˆ * E ( ˆ |T) 量,
则有 ˆ* , E ˆ * D ˆ, D
, ,
x( n )
n I( 0, ) ( x( n) )
其中I( 0, ) ( x) 1当0 x , 显然X( n)是的充分统计量
又由于X( n)的分布密度为
n n1 nx f X( n ) ( x ) 0 0 x 其他
利用完备分布族定义可以验证该分布族具有完备性. 又由于
dxn dxn


T ( x1 , x2 ,
n
其中L( x , ) f ( xi ; );
i 1
ln f ( X ; ) 2 (3) I ( ) E ( ) 0 ( g ' ( ))2 则对一切 ,有 D(T ( X )) ,其中 nI ( ) ( g ' ( ))2 为罗-克拉美下界,I ( )称为Fisher信息量。 nI ( ) 1 特别是当g( ) 时,有 D(T ( X )) . nI ( )
'

第六章第三节 最小方差无偏估计

第六章第三节 最小方差无偏估计
(2) 根据定理4, 若g( ) 的无偏估计量T 的方差VarT
达到下界, 则T必为g( ) 的最小方差无偏估计. 但
是它不一定存在,也就是说,C-R不等式有时给出的 下界过小.
(3)当等号成立时, T 为达到方差下界的无偏估计, 此时称T 为g(θ)的有效估计。 有效估计一定是 UMVUE.(反之不真)
(2) I()的另一表达式为
I
(
)
E(
2
ln p(x; 2
)
),
(若
2
p(x; 2
)
存在)
例3 设总体为Poisson分布,即
p(x; ) x e , x 0,1, 2.....
x!
则 I ( ) 1 .
例4 设总体为指数分布Exp(1/θ),即
p(x; ) 1 exp{ x}, x 0, 0.
(1)是实数轴上的一个开区间
(2) 支撑S {x | p(x; ) 0}与无关;
(3) p(x; ) 存在且对中一切 有
p(x; )dx
p( x; )
dx
(4) E( ln p(x; ))2 存在
则称
I
(
)
def
E(
ln
p(x;
)
)2
为总体分布的Fisher信息量.
注:
(1)I(θ)越大,总体分布中包含未知参数的信息越多。
估计. 反之,却不一定成立.
由此, 求证T是g()的有效估计的步骤为:
(1) 验证T是g( )的无偏估计,即E(T ) g( );
第六章第三节
最小方差无偏估计
一、Rao-Blackwell定理 二、最小方差无偏估计 三、 Cramer-Rao不等式

最小方差无偏估计

最小方差无偏估计

是其样本,T=T(x1, x2 , …, xn )是 的充分统计量,则
对 的任一无偏估计
,令 ,
则 也是 的无偏估计,且
定理6.3.2说明:如果无偏估计不是充分统计 量的函数,则将之对充分统计量求条件期 望可以得到一个新的无偏估计,该估计的 方差比原来的估计的方差要小,从而降低 了无偏估计的方差。换言之,考虑 的估 计问题只需要在基于充分统计量的函数中 进行即可,该说法对所有的统计推断问题 都是正确的,这便是所谓的充分性原则。
(5) 期望
存在;则称
为总体分布的费希尔(Fisher) 信息量。
费希尔信息量是数理统计学中一个基本概念, 很多的统计结果都与费希尔信息量有关。如 极大似然估计的渐近方差,无偏估计的方差
的下界等都与费希尔信息量I( )有关。I( )的 种种性质显示,“I( )越大”可被解释为总 体分布中包含未知参数 的信息越多。
一个无偏估计,
存在,且对一切∈Θ ,
微分可在积分号下进行,则有
➢ 上式称为克拉美-罗(C-R)不等式;
➢ [g’(θ)]2/(nI( ))称为g( )的无偏估计的方差 的C-R下界,简称g( )的C-R下界。
➢ 特别,对 的无偏估计 ,有
;
➢ 如果等号成立,则称 T=T(x1, …, xn) 是
g( )的有效估计,有效估计一定是UMVUE。
例6.3.3 设总体为泊松分布P()分布,则
于是
例6.3.4 设总体为指数分布,其密度函数为 可以验证定义6.3.2的条件满足,且 于是
定理6.3.4(Cramer-Rao不等式)
设定义6.3.2的条件满足,x1, x2 , …, xn 是来自
该总体的样本,T=T(x1, x2 , …, xn )是g( )的任

第2.3节 最小方差无偏估计和有效估计

第2.3节  最小方差无偏估计和有效估计

例1(p54例2.20) 设X ( X1 , X 2 ,
, X n )T 是来自总
*2 体( , 2 )的一个样本,已知X 和Sn 是 和 2 的无偏 *2 估计,证明X 和Sn 分别是 和 2 的MVUE .
证 设L( X )满足EL( X ) 0, 则

因而
L exp{


Βιβλιοθήκη T ( x1 , x2 ,
, xn ) L( x , )dx1dx2 , xn ) L( x , )dx1dx2
dxn dxn




T ( x1 , x2 ,
n
其中L( x , ) f ( xi ; );
i 1
ln f ( X ; ) 2 (3) I ( ) E ( ) 0 ( g( ))2 则对一切 ,有 D(T ( X )) ,其中 nI ( ) ( g( ))2 为罗-克拉美下界,I ( )称为Fisher 信息量。 nI ( ) 1 特别是当g( ) 时,有 D(T ( X )) . nI ( )
定理2.9 设总体X的分布函数为F ( x , ), 是
未知参数,X ( X1 , X 2 ,
, X n )T 是来自总体X的一 , X n )是的充分完备
*
个样本,如果T T ( X1 , X 2 ,
ˆ是的任一无偏估计,记 ˆ E ( ˆ |T) 统计量,
ˆ *是的唯一的MVUE . 则
1
ˆ( X )] 2 E{[ L( X ) EL( X )][( ˆ( X ) E ˆ( X )]} D[ L( X )] D[ ˆ( X )] D[ ˆ( X )] D[ L( X )] D[

§2.3 最小方差无偏估计与充分统计量(发)

§2.3  最小方差无偏估计与充分统计量(发)
n n n n
这个分布依赖于未知参数p,这说明样本中关 于p 的信息没有完全包含在统计量S 中. 因而 S X 1 X 2 (n 2)不是参数p 的充分统计量.
注:对例1而言 T1 ( X 1 , X 2 , X 3 ,, X n ), T2 ( X 1 X 2 , X 3 ,, X n ) Tn 1 ( X i , X n ),
P{ X 1 x1 , X 2 x2 ,, X n xn | X k n}
P{ X 1 x1 , X 2 x2 ,, X n xn } . P{ X i k }
P{ X 1 x1 }P{ X 2 x2 } P{ X n xn } P { X i k } p xi (1 p)n xi 1 , xi k , k , xi k , k k nk C n p (1 p) Cn 0, 其他. 0, 其他. 显然该条件分布与p无关,因而X 是p的充分统计量. 对S X 1 X 2 (n 2). 由于它只用了前面两个样本 观测值,显然没有包含样本中所有关于的信息,在 给定S的取值s后,对任意的一组x1 ,, xn ( x1 +x2 =s ).有
X 1 x1 ,, X n xn T t
P ( X 1 x1 ,, X n xn | T t ) P (T t ; ) h( x1 ,, xn ) g( t , ) 其中g( t , ) P (T t ; ),而 h( x1 ,, xn ) P ( X 1 x1 ,, X n xn | T t ) 与 无关. 必要性得证. 充分性,由于 P (T t ; ) ( x1 ,, xn ):T t P ( X 1 x1 ,, X n xn ; ) ( x1 ,, xn ):T t g( t , )h( x1 ,, xn ) 对任给( x1 ,, xn )和 t 满足( x1 ,, xn ) A( t ), 有

最小方差无偏估计

最小方差无偏估计

最小方差无偏估计⏹最小方差无偏估计的定义⏹RBLS定理⏹计算实例1. 最小方差无偏估计的定义对于未知常数的估计不宜采用最小均方估计,但可以约束偏差项为零的条件下,使方差最小。

定义:最小方差无偏估计定义为约束估计是无偏的条件下,使方差{}{}22ˆˆˆˆ()[()]()minVar E E E θ=θ-θ=θ-θ→估计的均方误差为22ˆˆˆˆ(){[]}()[()]Mse E Var E θ=θ-θ=θ+θ-θ偏差项估计方差在前面讨论的有效估计量是无偏的,且方差达到CRLB,所以有效估计量是最小方差无偏估计。

如果有效估计量不存在,如何求最小方差无偏估计呢?这时可利用RBLS定理求解。

2. RBLS(Rao-Blackwell-Lehmann-Scheffe)定理如果是一个无偏估计、是一个充分统计量,那么是:(1) θ的一个可用的估计(a valid estimator);(2) 无偏;(3) 对所有的θ,方差小于等于的方差。

θ()T z ˆ(|())E T θ=θz θ如果充分统计量是完备的,则是最小方差无偏估计。

()T z ˆ(|())E T θ=θz 完备: 只存在唯一的T (z)的函数,使其无偏。

例1:高斯白噪声中未知常数的估计0,1,...,1i iz A w i N =+=-iw 其中是均值为零、方差为σ2高斯白噪声序列。

求最小方差无偏估计。

解:首先找一个无偏估计,很显然是无偏。

1A z =其次,求A 的充分统计量,由前面的例题可知,是A 的充分统计量。

1()N i i T z -==∑z 3. 计算举例接着求条件数学期望()ˆ|()AE A T =z 由高斯随机变量理论:1(|)()(,)(())(())E x y E x Cov x y Var y y E y -=+-2()~(,)T N NA N σz 而1121100(,())()N N i i i i Cov A T E z A z NA E w w --==⎧⎫⎧⎫⎛⎫=--==σ⎨⎬⎨⎬ ⎪⎩⎭⎝⎭⎩⎭∑∑z ()11221001ˆ|()()N N i i i i A E A T A N z NA z N ---==⎛⎫==+σσ-= ⎪⎝⎭∑∑z由于完备的充分统计量只存在一个唯一的函数使其无偏,所以最小方差无偏估计量也可以通过下面的方法求解:假定T(z)是完备的充分统计量,那么ˆ(())g T θ=z 在刚才的例题中,10()N ii T z -==∑z 2.1.3 计算举例例2: 假定观测为其中为独立同分布噪声,且,求均值θ=β/2的最小方差无偏估计。

最小方差无偏估计UMVUE

最小方差无偏估计UMVUE
i 1
ˆ (t )=E (1 | T t ), 其中t xi
t (t 1)

= T (T 1)
n( n 1)
n ( n 1)
为θ的无偏估计.且 Var ( ) Var ( 1 )
二、最小方差无偏估计
ˆ 定义: 设 是的一个无偏估计量, 若对于的任一方差 存在的无偏估计量 , 都有 ˆ Var ( ) Var ( ) , ˆ 则称 是 的一致最小方差无偏估计, 记为UMVUE.

的微分可在积分号下进行,即

i 1
n g ( ) T ( x1 , x2 ,, xn ) ( p( xi ; ))dx1 dxn i 1
n T ( x1 , x2 ,, xn )[ ln( p( xi ; ))] i 1
n
而 x ln p( x, ) ln ,

d 1 x d ln p( x, ) 2
2
2
2
1 X I ( ) E ln p( X , ) E 2
例7 ( x1 , x2 ,, xn )是P( )( 0)的一个样本, 证明 : x是 的有效估计
证明 : 因为x是样本均值, 故, E x EX , x是的U .E Var ( X ) Var ( x) n n
总体X的分布律为 : P{ X x}
(1)I(θ)越大,总体分布中包含未知参数的信息越多。 (2) I()的另一表达式为
2 ln p( x; ) I ( ) E ( ), 2 2 p( x; ) ( 存在,满足正则条件) 2

2-3 最小方差无偏估计和有效估计

2-3 最小方差无偏估计和有效估计
2 n
由定理 2.9
ˆ E(X |T ) X
ˆ 2 E (Sn | T ) Sn
2 2


分别是
2 和 惟一的最小方差无偏估计。
13
例 2.21
设 ( X1 , X 2 ,, X n ) 是来自总体 X 服从区间 (0, )
上均匀分布的一个样本。求 的最小方差无偏估计。
由式(2.19)得
ˆ1 | T ) E ( ˆ2 | T )] 0 ,对一切 。 E [ E (
由于T 是完备统计量,由定义 1.5 得
ˆ1 | T ) E ( ˆ2 | T )) 1,对一切 , P ( E (
ˆ * E ˆ1 | T 是 的最小方差无偏估计。
ˆ1 ( X ) D[ L( X ) ˆ ( X )] DL( X ) D ˆ( X ) D ˆ ( X ) E ˆ ( X )] 2 E [ L( X ) EL( X )][
ˆ ( X ) D ˆ( X ) , DL( X ) D
ˆ( X ) 是 的 MVUE。 故
是 的最小方差无偏估计。
16
1.最小方差无偏估计提供了一种优良的估计, 然而一个更深入的问题是:无偏估计的方差是否可 以任意小?如果不可以,那么它的下界是多少?这 个下界等否达到?
2. 要直接验证某个估计量是最小方差无偏估计量 是困难的. 若能求出无偏估计中方差的下界, 而且又 能说明参数 的一切无偏估计中存在某个估计 的 方差能达到这个下界,那么 就是 的最小方差无 偏估计. 下面给出一个判别准则:
即 的 充 分 偏 估 计 是 惟 一 的 。 再 由 定 理 2.8 知 ,
11
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

xi 2

5s
2
,
ϕ

=0
,所以
1 n
n i =1
xi 2
− 5s2

µ 2 − 4σ 2 的ቤተ መጻሕፍቲ ባይዱ小方差无偏估计。
7.
设总体的概率函数为
p(x;θ
)
,满足定义
6.3.1
的条件,若二阶导数
∂2 ∂θ 2
p(x;θ ) 对一
切的θ ∈ Θ 存在,证明费歇信息量
I (θ ) = −E( ∂2 ln p(x;θ )) ∂θ 2
2.3 节 最小方差无偏估计 内容概要
1、一致最小方差无偏估计
设θˆ 是θ 的一个无偏估计,如果对另外任意一个θ 的无偏估计θ~ ,在参数空间 Θ = {θ}
上都有
Varθ (θˆ) ≤ Varθ (θ~)
则称θˆ 是θ 的一致最小方差无偏估计,简记为 UMVUE。
2、判断准则
设 θˆ = θ (x1, , xn ) 是 θ 的 一 个 无 偏 估 计 , Var(θˆ) < ∞ 。 如 果 对 任 意 一 个 满 足
分为 0 的项,有
∫ ∫ ∑ ( ) ∑ ∞ −∞
ϕ x ⋅ ∞ n 2
−∞ i=1 i
2πσ 2
−n 2
exp

1 2σ
2
n i=1
xi2
+
nx σ2
µ

nµ 2 2σ 2


dx1
dxn = 0
∑ ( ) n
这表明 E(ϕ ⋅ xi2 ) = 0 ,由此可得到 E s2ϕ = 0 ,因而
注意到 g = E(gˆ | T ) ,这说明
E ( g − g ) T = E(g T ) − E E ( g T ) T = E(g T ) − E ( g T ) = 0 ,
于是
E[( g − g )( g −θ )] = E{E ( g − g )( g −θ ) T } = E{( g −θ ) E ( g − g ) T } = 0
则称该期望 I (θ ) 为总体分布的费歇 (Fisher) 信息量。
如果二阶导数对一切θ ∈ Θ 都存在,则 I (θ ) 还可用下式计算
I

)
=
−E

∂2 ∂θ 2
ln
p
(
x;θ
)

5、常用分布的费歇信息量。
二点分布 b(1,p) 的费歇信息量 I ( P) = [P(1− ]P) −1
泊松分布 p (λ ) 的费歇信息量 I (λ ) = λ −1
指数分布 Exp (λ ) 的费歇信息量 I (λ ) = λ 2
正态分布 N ( µ,1) 的费歇信息量 I ( µ ) = 1
( ) ( ) 正态分布 N
0,σ 2
的费歇信息量 I
σ2
=1 2σ 4
( ) ( ) 正态分布 N µ,σ 2 的费歇信息量(信息矩阵) I µ,σ 2 = 1/σ 2 0
因而 MSE ( gˆ ) = E ( gˆ − g )2 + MSE ( g ) ≥ MSE ( g )
2. 证明:若θˆ 是θ 的 UMVUE,则对任一满足 Eθ (ϕ(x)) = 0 且 0 < Varθ (ϕ(x)) < ∞ 的 ϕ(x) 有
Covθ (θˆ,ϕ(x)) = 0 , θ ∈ Θ
∑ 解:(1)
上题已经证明了 x
和 s2
=
1 n −1
n
( xi
i=1
− x )2
分别是 µ
和σ 2 的UMVUE ,则
由本节习题 3 知 3x + 4s2 是 3µ + 4σ 2 的最小方差无偏估计。
( ) (2)对任意一个 0 的无偏估计ϕ (即 Eϕ = 0 )有 Cov x 2,ϕ = 0 (见本节第 5 题证
以获得一个新的无偏估计θ = E(θˆ | T ) ,且方差比原估计的方差要小;
考虑θ 的估计时,只需要在其充分统计量的函数中寻找即可,该说法对所有统计推
断都是正确的。这便是充分性原则。
4、费歇信息量 I (θ )
设总体的概率函数 p(x;θ ),θ ∈ Θ 满足下列条件:
(1)参数空间 Θ 是直线上的一个开区间;
(2)支撑 S = {x : p(x;θ ) > 0}与θ 无关;
(3)导数 ∂ p(x;θ ) 对一切θ ∈ Θ 都存在; ∂θ
∫ ∫ (4)对 p(x;θ ) ,积分与微分运算可交换次序,即 ∂ ∞ p(x;θ )dx = ∞ ∂ p(x;θ )dx
∂θ −∞
−∞ ∂θ
1
(5)期望 I (θ ) = E[ ∂ ln p(x;θ )]2 存在 ∂θ

p
(
x;θ
)
dx
=
E

∂2
ln p ( x;θ
∂θ 2
)


∫ ∫ ∏ Eϕ = ∞ −∞

n
ϕ⋅
−∞ i =1
1 2π σ
exp −
( xi − µ )2
2σ 2
dx1
dxn = 0

∫ ∫ ( ) ∑ ∞ −∞
∞ −∞
ϕ⋅
2πσ 2
−n 2
exp

1 2σ
2
n i =1
xi2
+
nx σ2
µ

nµ 2 2σ 2


dx1
∂ ln p ( x;θ )
证:记 Sθ =
∂θ
,则
ESθ
=
∫∞ −∞
p
(
1 x;θ
)

∂p
( x;θ
∂θ
)

p ( x;θ
) dx
=
∫∞ −∞
∂p ( x;θ
∂θ
)
dx
=
∂ ∂θ
∫∞ −∞
p ( x;θ ) dx
=
0
所以 ∂ESθ = 0 。另一方面, ∂θ
6
∫ ∫ ( ) ∂ESθ = ∂
∂θ ∂θ
由上题结论有 C ov (Ti ,φ ) = 0, i = 1, 2 ,于是 E (aT1 + bT2 ) = aθ1 + bθ2 Cov (aT1 + bT2 ,φ ) = aC ov (T1,φ ) + bC ov (T2 ,φ ) = 0
因此 aT1 + bT2 是 aθ1 + bθ2 的 UMVUE。
+
nx σ2
µ

nµ 2 2σ 2


dx1
dxn
∫ ∫ ( ) ∑ ∞
− −∞
∞ −∞
nx σ2

nµ σ2
ϕ

2πσ 2

n 2
exp

1 2σ
2
n i =1
xi2
+
nx σ2
µ

nµ 2σ
2 2

dx1
dxn = 0
( ) 由此可以得到 E x 2ϕ = 0 ,下一步,将(*)式两端对σ 2 求导,略去几个前面已经指出积
∞ −∞

p
(
x;θ
)
dx
=
∞∂ −∞ ∂θ
Sθ ⋅ p ( x;θ ) dx
∫=

−∞
∂Sθ ∂θ

p ( x;θ
)+


∂p ( x;θ )
∂θ
dx
=
∫∞ −∞
∂2
ln p ( x;θ
∂θ 2
)

p
(
x;θ
)
dx
+
∫∞ −∞


ln
p ( x;θ
∂θ
)
2
3
Varθ0 (θ ) = Eθ0 (θ + bϕ(x) −θ )2 = Eθ0 (θ −θ )2 + b2Eθ0 (ϕ(x))2 + 2bEθ0 ((θ −θ )ϕ(x)) = Varθ0 (θ ) + b2Varθ0 (ϕ(x)) + 2ab < Varθ0 (θ ) 这与θˆ 是θ 的 UMVUE 矛盾,这就证明了对参数空间 Θ 中任意的θ 都有 Covθ (θˆ,ϕ(x)) = 0 , 也即定理 6.3.3 的逆也对。由此我们知道,条件“对任意满足 Eθ (ϕ(x)) = 0 的 ϕ(x) 有 Covθ (θˆ,ϕ(x)) = 0 ”是“θˆ 是θ 的 UMVUE”的充分必要条件。 3.设T1,T2 分别是θ1,θ2 的 UMVUE,证明:对任意的(非零)常数 a, b , aT1 + bT2 是 aθ1 + bθ2 的 UMVUE。 证:由于T1,T2 分别是θ1,θ2 的 UMVUE,故 ETi = θi ,且对任意一个φ(x) ,满足 Eφ = 0 ,
0
1/(2σ 4 )
6、C-R 不等式
设T
=
T (x1,…,
xn ) 是未知参数
g(θ ) 的一个无偏估计,若
g
'(θ )
=
∂g(θ ) ∂θ
存在,则在费
歇信息量 I (θ ) 也存在的条件下有
Var(T ) ≥ [g '(θ )]2 /(nI (θ ))
上式称为克拉美-罗(C-R)不等式,[g '(θ )]2 /(nI (θ )) 称为 g(θ ) 的无偏估计的方差的 C-R 下界,简称 g(θ ) 的 C-R 下界。特别,对θ 的无偏估计θˆ ,有Var(θˆ) ≥ (nI (θ ))−1 。
相关文档
最新文档