第二章参数估计理论_2

合集下载

数理统计: 参数估计方法

数理统计: 参数估计方法
23
引例
设总体 X 服从参数为 的指数分布, 未知,
X1 , X 2 , , X n 是来自X的样本, x1 , x2 , , xn 是
相应的样本值,求 的矩估计量和矩估计值.
解 因为 E( X ) 所以 用样本矩替换总体矩, 得 的矩估计量
ˆ

1 n
n i 1
Xi

X
(
x)

1

e

x

,
x0
0,
其他.
但参数 未知。已知参数的取值范围,记为 。
给出样本的一组观察值,如何推断总体的分布?
【思路】给出 的估计,则得到对总体分布的推断。
【方法】根据一定的原则,从 中找到一个值(点) 作为的 估计。
点估计
2
点估计定义
设总体 X 的分布函数 F ( x; ) 的形式为已知,
的估计量.
4
二、估计量的评选标准 1. 无偏性
定义 若 X1, X 2 ,, X n 为总体 X 的一个样本,
是包含在总体 X 的分布中的待估参数, 若估计量ˆ ˆ( X1 , X 2 ,, X n )的数学期望 E(ˆ) 存在, 且对于任意 有
E(ˆ) 则称ˆ 是 的无偏估计量,否则称为有偏的.
(2) lim S 2 2 a.s. (强大数定律) n
即样本方差是总体方差2的强相合估计, 也是相合估计.
12
C. 样本标准差
其观察值:
S
S2
1 n1
n i 1
Xi

X
2
;
s
1 n1
n i 1
( xi

第二章多元正态分布的参数估计

第二章多元正态分布的参数估计

就是剔除了 X2 Xk1, , X p 得(线性)影响之后,Xi和
Xj之间得协方差。
给定X2时Xi 和Xj得偏相关系数(partial correlation
coefficient)定义为: ij k1, , p
ij k1, , p
,
ii k1, , p jj k1, , p
其中 Σ11 2 ij k1, , p 。
μ12
μ1
Σ12
Σ
1 22
x2 μ2
Σ112
Σ11
Σ12
Σ
1 22
Σ
21
μ1·2和Σ11·2分别就是条件数学期望和条件协方差矩
阵,Σ11·2通常称为偏协方差矩阵。
这一性质表明,对于多元正态变量,其子向量得条件分布仍
就是(多元)正态得。
例5 设X~N3(μ, Σ),其中
1
16 4 2
μ
0 2
μ(1) μ(2)
11 Σ 21
31
12 22 32
13 23 33
Σ11
Σ
21
Σ12
22

X (1)
X1
X
2
~
N2 ( μ(1) ,
Σ11)
其中
μ (1)
1
2
Σ11
11 21
12
22
在此我们应该注意到,如果 X ( X1, X 2 , , X p ) 服从 p
aX
(0,1,
0)
X
2
X2
~
N (aμ, aΣa)
X3
1

(0,1,
0)
2
2
3
11 12 aΣa (0,1, 0) 21 22

第二章 多元正态分布及参数的估计

第二章   多元正态分布及参数的估计

27
北大数学学院
第二章 多元正态分布及参数的估计
§2.2 多元正态分布的定义与基本性质—简单例子
y BxB


0 0 1
1 0 0
100 110
1 2 0
003 100
0 0 1
1 0 0



1 0 1
2 0 1
003 100
2
北大数学学院
第二章 多元正态分布及参数的估计
目录
§2.1 随机向量 §2.2 多元正态分布的定义与
基本性质
§2.3 条件分布和独立性 §2.4 随机矩阵的正态分布 §2.5 多元正态分布的参数估计
3
北大数学学院
第二章 多元正态分布及参数的估计
§2.1 随 机 向
本课程所讨论的是多变量总体.把 p个随机变量放在一起得
第二章 多元正态分布及参数的估计
§2.2 多元正态分布性质2的推论
例2.1.1
f (x1, x2
()X1,X212)的e联 12合( x12密 x22度) [1函数x为1 x2e

1 2
(
x12

x22
)
]
我们从后面将给出的正态随机向量的联合密
度函数的形式可知, (X1,X2)不是二元正态随机向 量.但通过计算边缘分布可得出:
本节有关随机向量的一些概念(联合分布, 边缘分布,条件分布,独立性;X的均值向量,X 的协差阵和相关阵,X与Y的协差阵)要求大家 自已复习.
三﹑ 均值向量和协方差阵的性质 (1) 设X,Y为随机向量,A,B为常数阵,则
E(AX)=A·E(X) E(AXB)=A·E(X)·B
6

第二章参数估计

第二章参数估计

第二章 参数估计【学习目标】1、掌握矩估计的替代原则;会求已知分布中未知参数的矩估计(值)2、熟练掌握极大似然估计的思想及求法3、估计量的评价标准:无偏性、有效性、相合性的定义4、统计量的无偏性的判断;两个无偏估计的有效性判断;会用Fisher 信息量及c-R 下界进行统计量的UMVUE 充分性判断5、掌握区间估计的定义6、单个正态总体均值的区间估计(包括方差已知、方差未知);单个正态总体方差的区间估计(包括均值已知、均值未知)7、两个正态总体均值差的区间估计(方差未知);两个正态总体方差比的区间估计 8、单侧置信区间的求法 【典型例题讲解】例1、设1,,n X X 是来自均匀分布(,1)U θθ+的总体的容量为n 的样本,其中θ-∞<<+∞为未知参数,试证:θ的极大似然估计量不止一个,例如1(1)ˆXθ=,2()ˆ1n X θ=-,3(1)()11ˆ()22n XXθ=+-都是θ的极大似然估计。

解:(,1)U θθ+分布的密度函数为11()0x f x θθ≤≤+⎧=⎨⎩其他似然函数(1)()11()0n x x L θθθ≤≤≤+⎧=⎨⎩其他由于在(1)()1n x x θθ≤≤≤+上()L θ为常数,所以凡是满足:(1)()ˆˆ1n x x θθ≤≤≤+的ˆθ均为θ的极大似然估计。

从而(1)1(1)ˆX θ=满足此条件,故1(1)ˆX θ=是θ的极大似然估计;(2)由于()(1)1n X X -≤,故2()(1)()2ˆˆ11n n X X X θθ=-≤≤=+,所以2()ˆ1n Xθ=-为θ的极大似然估计;(3)由于()(1)1n X X -≤,故(1)()(1)12n X X X +-≤,(1)()()12n n X X X ++≥,从而有3(1)()(1)()(1)()31111ˆˆ()()12222n n n XXXXXXθθ=+-≤≤≤++=+,故3ˆθ也为θ的极大似然估计。

应用数理统计第二章

应用数理统计第二章
ˆ = ⎡ rs ⎤ . N ⎢ ⎥ ⎣x⎦

例2.1.11 总体 X ~ U (θ,θ +1) , θ 是未知参数, X1,…,Xn 是一组样本,求θ 的极大似然估计。 解. 总体的密度函数为: f(x,θ ) = 1, θ < x1,…,xn < θ +1 显然不能对参数 θ 求导,无法建立似然方程 注意到这个似然函数不是 0 就是 1 ,利用 顺序统计量,把似然函数改写成如下形式:
f(x,θ ) = 1, θ < x(1) <… < x(n) < θ +1 因此只要 θ < x(1) 并且 x(n) < θ +1 同时满足, 似然函数就可以达到极大值 1 。 所以 U (θ,θ +1) 中参数θ 的极大似然估计 可以是区间 ( x(n) - 1 ,x(1) ) 里的任意一个点 。 说明 MLE 可以不唯一,甚至有无穷多个 同理,总体 U (a,b) 左右端点 a 、b 的MLE 分别就是两个极值统计量 x(1) 、x(n) 。
k =1
n
注意这里总体参数 θ 是一个向量 (µ,σ2 ) , 因此对于似然函数取对数后分别对 µ,σ2 求导, 建立对数似然方程组:
1
σ

2
(x − µ) = 0 n + 1 2(σ 2 )2 ( xk − µ )2 = 0 ∑
k =1 n
2σ 2
解方程组得到正态总体两个参数的MLE
ˆ µ=X
1 n n−1 2 ˆ σ 2 = ∑ ( X k − X )2 = S n k =1 n
⎛ N ⎞ ∑ xk nN − ∑ xk L ( x ,θ ) = [ ∏ ⎜ ⎟ ] p (1 − p ) ⎝ xk ⎠
这里每一个 xk = 0、1、…、N 中的某个值

2多元正态分布及参数估计

2多元正态分布及参数估计
或表达为
定X (2) X ,, X f x (2) 0 r 1 p 2





的条件下,
f x | x
(1)
(2)

f 2 x (2)
12
f x
4、独立性
设 X 1 , X 2 , , X p 是 p 个随机变量, Xi的分布函数记为 Fi(xi)
(i=1,2,…,p); F ( x1 , x2 ,, x p ) 是 ( X 1 , X 2 ,, X p ) ' 的联合分布
C OV X , Y X D X D D Y Y C OV Y , X
21
第二章 多元正态分布及参数的估计
§2.1 随 机 向 量
三﹑ 协方差阵的性质 (1) 设X,Y为随机向量(矩阵) D(AX+b)=A· D(X)· A' COV(AX,BY)=A· COV(X,Y)· B'
17
2、协方差矩阵
协方差定义为
Cov X , Y E ( X E ( X ))(Y E (Y ))
ห้องสมุดไป่ตู้
若Cov(X,Y)=0,则称X和Y不相关。 两个独立的随机变量必然不相关,但两个不相关的 随机变量未必独立。 当X=Y时,协方差即为方差,也就是
Cov X , X Var X D ( X ) 和Y Y ,Y ,,Y X X 1 , X 2 ,, X p 1 2 q 的协方差矩
19
X和Y的协方差矩阵与Y和X的协差阵互为转置关系,即有 若COV(X,Y)=0,则称X和Y不相关。 两个独立的随机向量必然不相关,但两个不相关的随机向量未必独 立。 X=Y时的协差阵COV(X,X)称为X的协差阵,记作D(X),即

第二章 参数估计

第二章 参数估计

0


x 2de
x

2xe
x
dx

2

xde
x
0
x
0
0
2 e dx 2 2
0
9
例4:设X1, … , Xn为取自 N ( , 2 ) 总体的
样本,求参数 , 2 的矩估计。
: E( X ) D( X ) 2 E( X 2 ) [E( X )]2
极大似然法是由德国数学家G.F.Gauss在1821年提 出的.然而这个方法通常归于英国统计学家 R.A.Fisher,因为他在1912年里发现了这一方法,并 且首先研究了这种方法的性质.
设总体的密度函数为f(x,θ), θ为待估参数,θ∈Θ,Θ
为参数空间.当给定样本观察值 x (x1, x2 , xn )后,f(x,
以随便给的,所以根据统计思想建立各种点估计方法
和评价点估计的好坏标准便是估计问题的研究中心.
这里先介绍三个常用的标准:无偏性、有效性和一致
性.
1
有效性
^
^
设 i i ( X1,, X n ), i 1, 2分别是参数 的两个无偏估计,
^
^
^
^
若D 1 D 2 至少有一个n使 成立 , 则称 1比 2 有效.
总体k阶矩 样本k阶矩
k E(Xk )
Ak

1 n
n i 1
X
k i
的矩估计量是
约定:若


是未知参数的矩估计,则u()的矩
估计为u(


),
6
例2、:设X1, … , Xn为取自参数为的指数分布 总体的样本,求的矩估计。

参数估计2

参数估计2

n
e n
i
x !
i 1 n i 1
ii ) ln L( x1 , x 2 ,..., x n ; ) xi ln n ln xi !
i 1
xi ln L( x1 , x2 ,...,xn ; ) i 1 n 0 iii)令 : 1 n iv)解之得 : xi x为 的极大似然估计值 , n i 1 1 n X i X 为 的极大似然估计量 . n i 1
(1)正态分布N (u, 2 ) (2)指数分布Z ( ) (3)均匀分布U (a, b) (4)二项分布B(n, p) (3)泊松分布 ( ) 试求其中未知参数的矩 估计. 解 : (1)
因为X ~ N ( , 2 ), E ( X ) , D( X ) 2 故有 X ,
注2
若 为 的矩估计量, g ( )为 的连续函数, 亦称g ( )为g ( )
2 2 例如S n 为总体方差D( X )的矩估计量, 则S n S n 为标准差 D( X )


的矩估计量. 的矩估计量.
例1.1
设X 1 , X 2 ,..., X n为来自正态总体 X 的样本, X的分布为
i 1 n n
( X为连续型)
(1.4) (1.5)

L( x1 , x2 ,..., xn ) PX i xi ;
i 1
( X为离散型)
达到最大值

L( x1 , x2 ,..., xn ; ) max L( x1 , x2 ,..., xn ; )

(1) 利用求导法求极大然估 计步骤 i )建立似然函数: L( x1 , x 2 ,..., x n ; 1 , 2 ,..., r ) f ( xi ; 1 , 2 ,..., r )
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
MAP A
⎡ 1 p ( x A) p A ( A) = exp ⎢ − 2 2 (2πσ w )N / 2 ⎣ 2σ w 1
⎤ ⎡ ( A − μ A )2 ⎤ 1 exp ⎢ − ∑ [ x(n) − A] ⎥ ⋅ ⎥ 2 2 2σ A ⎦ n =0 ⎣ ⎦ 2πσ A
N −1 2
上式两边取对数,并对A求导使导数等于零得: ˆ AMAP
——最大后验概率(MAP)估计与MLE的关系
∂ ln p (θ ) = 0 ∂θ
⇒ ∂ ⎡ ln p ( x θ ) ⎤ = 0 ⎦ ∂θ ⎣ 似然函数
ˆ ⇒ θ = arg max p (θ x )
θ
∂ ⇒ ∂θ ∂ ⇒ ∂θ ∂ ⇒ ∂θ
当 θ 服从均匀分布,采用 均匀损失函数的Bayes估计 ln p (θ x ) = 0 (MAP)与最大似然估计 (MLE)等价! ⎡ln p ( x θ ) + ln p(θ ) − ln p ( x ) ⎤ = 0 ⎣ ⎦ 当 θ 服从均匀分布
⎬ ˆ −θ > δ ⎪ θ ⎭
ˆ θ −θ < δ ⎫ ⎪
ˆ Cunif ( θ , θ ) p ( x ,θ )dxdθ ∫ p(θ x ) = p ( x θ ) p(θ ) = p( x ) p ( x θ ) p (θ )
ˆ ⇒ θ = arg max p (θ x )
θ
ˆ ⇒ θ = arg max p ( x θ ) p(θ )
Bayes 估计(6)
1 ⎡ 1 N −1 2⎤ 1 − A2 / 2 exp ⎢ − ∑ [ x(n) − A] ⎥ e N /2 (2π ) ⎣ 2 n=0 ⎦ 2π p( A x ) = 1 ⎡ 1 N −1 2⎤ 1 − A2 / 2 ∫(2π )N / 2 exp ⎢ − 2 ∑ [ x(n) − A] ⎥ 2π e dA n=0 ⎣ ⎦
Bayes 估计(2)
因此,在Bayes估计中,假设所要估计的参数θ 是一个随机变量, Bayes估计的是该随机参数的一次实现的值。 ˆ 那么估计的均方误差mse(θ )定义为: ˆ ˆ mse(θ )=∫∫ (θ − θ ) 2 p ( x ,θ )dxdθ ˆ ∂mse(θ ) ∂ ˆ = ∫∫ (θ − θ ) 2 p ( x ,θ )dxdθ ⇒ ˆ ˆ ∂θ ∂θ 令其等于零 ∂ ˆ (θ − θ ) 2 p ( x ,θ )dxdθ=0 ˆ ∫∫ ∂θ ˆ ⇒ θ=g ( x ) 可以实现。 ⇒
2 2 σA σA 1 N −1 = 2 ∑ x ( n) + σ 2 + σ 2 / N μ A 2 σ A + σ w / N N n =0 A w
Bayes 估计(11)
最大后验概率估计 ˆ arg min Runif = E{Cunif ( θ ,θ )}
θˆ
p (θ x ) p( x ) = p( x θ ) p(θ )
当N趋于无穷时,估计子均方误差mse趋于零,相当于要求其 偏差和方差均趋于零,这时称该估计子为一致估计。 最小方差无偏估计器(MVU):对于确定性参数的估计,最理 想的情况是设计一个无偏估计器,使其估计方差最小,称MVU。
确定性参数与随机参数估计
确 定 性 参 数 的估计: ( x ; θ ) p 其中: θ 是一个确定性(非随机变量)但未知需要估计的参数 p ( x ; θ ) 是一个与 θ 有关的观测向量 x的概率密度函数 ( PDF ) 随机 参数的估计: ( x , θ ) p 其中: θ 是一个随机变量,且未知需要估计的参数 p ( x , θ ) 是一个与 θ 有关的观测向量 x和参数 θ 的 联 合 PDF p ( x , θ )= p ( x θ ) p (θ ) = p (θ x ) p ( x ) p ( x θ )是 θ 取 值 情 况 下 x的 条 件 PDF p (θ x )是 x取值情况下 θ 的条件 PDF 先验概率 后验概率

Bayes 估计(4)
ˆ θ = ∫ θ p(θ x )dθ = E{θ x} 说明最小均方误差准则下的Bayes估计为:已知一个 观测向量x条件下的参数θ的条件期望值(条件均值)。后验均值
通常情况下,后验概率p(θ x ) 不容易获得,因此常用下式
p (θ x ) = p ( x θ ) p (θ ) p( x ) = p ( x θ ) p (θ )
∫ p( x
A) p A ( A) dA
1 ⎡ 1 N −1 2⎤ 1 − A2 / 2 exp ⎢ − ∑ [ x ( n ) − A] ⎥ e N /2 (2π ) ⎣ 2 n=0 ⎦ 2π = 1 ⎡ 1 N −1 2⎤ 1 − A2 / 2 ∫ (2π )N / 2 exp ⎢ − 2 ∑ [ x ( n) − A] ⎥ 2π e dA n=0 ⎣ ⎦
p(θ x ) = 0
最大似然估计(MLE)(1)
基本思想:在对被估计量没有任何先验知识的情况下, 利用已知的若干观测值来估计该参数。
似然函数定义: 考 虑 N 个 样 本 x1 ,..., x N , 或 用 随 机 向 量 x = ( x1 ,..., x N ) 表 示 。 设联合条件分布密度函数 f ( x θ )= f ( x1,..., x N θ ) 存 在 且 有 界 。 将 其 视 为 真 实 参 数 θ的 函 数 , 称 之 为 似 然 函 数 。
ˆ 最大似然估计——使似然函数最大的估计θ,即 ˆ θ = arg max p( x
常取对数似然函数作为似然函数 (θ) ln p ( x θ ) = L 此时,最大似然估计由 ∂ L(θ ) = 0 ∂θ 求得。
最大似然估计(MLE)(3)
最大似然估计的性质 1. 最大似然估计一般不是无偏的,但偏差可以通过对估 计值乘以一个合适常数消除。 2. 最大似然估计是一致估计。 3. 最大似然估计给出优效估计,如果存在的话。 4. 对于大的样本点数,最大似然估计为一高斯分布。
Bayes 估计(1)
ˆ 在经典的确定性参数估计中,利用均方误差mse(θ )最小化,可能得不到 可实现的估计器。因为θ 是确定量,不参与概率空间的运算,即 ˆ ˆ mse(θ )= (θ − θ ) 2 p( x;θ )dx

ˆ ∂mse(θ ) ∂ ˆ = ∫ (θ − θ ) 2 p( x;θ ) dx ⇒ ˆ ˆ ∂θ ∂θ 令其等于零 ∂ ˆ ⇒ (θ − θ ) 2 p ( x;θ )dx=0 ˆ ∂θ ∫ ˆ ⇒ θ=g (θ ) 其中包含了待估计的参数,因此无法实现。
θ
∫ p( x θ ) p(θ )dθ
ˆ ⇒ θ = arg max [ln p ( x θ ) + ln p(θ )]
θ
例: 设观测值x(n) = A + w(n), n = 0,..., N − 1, ⎡ ( A − μ A )2 ⎤ p A ( A) = exp ⎢ − ⎥, 2 2 2σ A ⎦ 2πσ A ⎣ 1 1
仍为高 斯分布
⎡ 1 ( N + 1)1/ 2 NX 2 ⎤ exp ⎢ − ( N + 1)( A − ) ⎥ = 1/ 2 N +1 ⎦ (2π ) ⎣ 2
1 X= N
∑ x ( n)
n =0
N −1
NX NX ˆ ∴ A = E ( A x )=∫ Ap ( A x )dA = = N +1 N +1
Bayes 估计(7)
矢量情况
⎡ E{θ1 x} ⎤ ⎢ ⎥ ˆ = E{θ x} = ⎢ E{θ 2 x} ⎥ θ ⎢ ⎥ ⎢ ⎥ ⎢ E{θ N −1 x}⎥ ⎣ ⎦
Bayes 估计(8)
其它损失函数的情况
均匀损失函数
⎧0 ⎪ ˆ Cunif ( θ , θ ) = ⎨ ⎪1 ⎩ ⎬ ˆ θ −θ > δ ⎪ ⎭
∫ p( x θ ) p(θ )dθ
θx
此时,MMSE Bayes估计得到的最小均方误差为 ˆ Bmse(θ )= [ E (θ x ) − θ ]2 p ( x ,θ )dxdθ = C
∫∫
Cθ x为θ的条件协方差。
Bayes 估计(5)
例: 设观测值 x ( n ) = A + w( n ), n = 0,..., N − 1, 其中 w( n )为零均值 AWGN,方差为1,且估计量 A服从零均值方差 1 − a2 / 2 p A (a ) = e 为1的高斯分布,即 , 求参数A的估计 2π 1 ⎡ 1 N −1 2⎤ exp ⎢ − ∑ [ x ( n ) − A] ⎥ 解: p ( x A) = N /2 (2π ) ⎣ 2 n=0 ⎦ p ( A x )= p ( x A) p A ( A)
Bayes 估计(10)——最大后验概率(MAP)估计的例子
2 其中w(n)为零均值AWGN,方差为σ w,且估计量A服从如下高斯分布,
求参数A的MAP的Baye估计。
⎡ 1 N −1 2⎤ exp ⎢ − 2 ∑ [ x(n) − A] ⎥ 解: p ( x A) = 2 N /2 (2πσ w ) ⎣ 2σ w n =0 ⎦ ˆ A = arg max [ln p ( x A) + ln p( A)]
ML
1 N −1 1 N −1 ˆ E{ AML } = E{ ∑ x(n)} = E{ ∑ [ A + w(n) ]} N n =0 N n =0 1 N −1 ˆ = A + E{ ∑ w(n)} = A ⇒ AML是无偏估计 N n =0
∂2 −N 由上次课例题得知: ln f ( x A ) = 2 2 σ ∂A ⎡ ∂2 ⎤ N ⇒ I ( A ) = − E ⎢ 2 ln f ( x A ) ⎥ = 2 ⎣ ∂A ⎦ σ σ2 1 ˆ ˆ ⇒ var( A ) = E {( A − A ) 2 ≥ = I ( A) N ∂ ˆ ln f ( x A ) = K ( A )( A − A ), 而 事 实 上 , 有 等号成立条件是 ∂A 1 N −1 ∂ ln f ( x A )= 2 ∑ [ x ( n ) − A ] σ n=0 ∂A =
相关文档
最新文档