第3.4节 经验贝叶斯估计讲解

合集下载

通俗易懂讲解贝叶斯定理

通俗易懂讲解贝叶斯定理

通俗易懂讲解贝叶斯定理转⾃:https:///sdutacm/article/details/509389570. 前⾔这是⼀篇关于贝叶斯⽅法的科普⽂,我会尽量少⽤公式,多⽤平⽩的语⾔叙述,多举实际例⼦。

更严格的公式和计算我会在相应的地⽅注明参考资料。

贝叶斯⽅法被证明是⾮常 general 且强⼤的推理框架,⽂中你会看到很多有趣的应⽤。

1. 历史托马斯·贝叶斯(Thomas Bayes)同学的详细⽣平在。

以下摘⼀段 wikipedia 上的简介:所谓的贝叶斯⽅法源于他⽣前为解决⼀个“逆概”问题写的⼀篇⽂章,⽽这篇⽂章是在他死后才由他的⼀位朋友发表出来的。

在贝叶斯写这篇⽂章之前,⼈们已经能够计算“正向概率”,如“假设袋⼦⾥⾯有N个⽩球,M个⿊球,你伸⼿进去摸⼀把,摸出⿊球的概率是多⼤”。

⽽⼀个⾃然⽽然的问题是反过来:“如果我们事先并不知道袋⼦⾥⾯⿊⽩球的⽐例,⽽是闭着眼睛摸出⼀个(或好⼏个)球,观察这些取出来的球的颜⾊之后,那么我们可以就此对袋⼦⾥⾯的⿊⽩球的⽐例作出什么样的推测”。

这个问题,就是所谓的逆概问题。

实际上,贝叶斯当时的论⽂只是对这个问题的⼀个直接的求解尝试,并不清楚他当时是不是已经意识到这⾥⾯包含着的深刻的思想。

然⽽后来,贝叶斯⽅法席卷了概率论,并将应⽤延伸到各个问题领域,所有需要作出概率预测的地⽅都可以见到贝叶斯⽅法的影⼦,特别地,贝叶斯是机器学习的核⼼⽅法之⼀。

这背后的深刻原因在于,现实世界本⾝就是不确定的,⼈类的观察能⼒是有局限性的(否则有很⼤⼀部分科学就没有必要做了——设想我们能够直接观察到电⼦的运⾏,还需要对原⼦模型争吵不休吗?),我们⽇常所观察到的只是事物表⾯上的结果,沿⽤刚才那个袋⼦⾥⾯取球的⽐⽅,我们往往只能知道从⾥⾯取出来的球是什么颜⾊,⽽并不能直接看到袋⼦⾥⾯实际的情况。

这个时候,我们就需要提供⼀个猜测(hypothesis,更为严格的说法是“假设”,这⾥⽤“猜测”更通俗易懂⼀点),所谓猜测,当然就是不确定的(很可能有好多种乃⾄⽆数种猜测都能满⾜⽬前的观测),但也绝对不是两眼⼀抹⿊瞎蒙——具体地说,我们需要做两件事情:1. 算出各种不同猜测的可能性⼤⼩。

Bayes(贝叶斯)估计

Bayes(贝叶斯)估计


参数作为随机变量
• 条件分布: p(x1,x2,..xn | )
精选完整ppt课件
几个学派(3)
• 信念学派:
• 带头人:Fisher
• 观点:概率是频率

主观不是概率,而是信念度

参数不是随机变量,仅是普通变量
• 似然函数: L( | x1,x2,..xn)
精选完整ppt课件
批评1:置信区间
后验风险:
• Bayesian风险与后验风险
(L(,)p(x|) ()d)dx
• 后验分析最小=>Bayesian风险最小
精选完整ppt课件
两种常用损失函数:
• 平方损失:
L(,)()2
– 最小Bayesian风险估计:后验期望
• 点损失:
L(a,
)
0,|
a
|
1,|
a
|
– 最大后验密度估计
精选完整ppt课件
• 3、联合分布密度->条件分布密度
• p(x1,x2,..xn | ), 是随机变量
• 4、确定的先验分布() • 5、利用Bayesian公式求后验分布密度 • 6、使用后验分布做推断(参数估计、假设检验)
精选完整ppt课件
例1:两点分布b(1,p)的
• 1. 联合分布:p(x|)nxx(1)nx
• 使得 h ( |r ) p (x |)* ( )与先验分布同类型
• 若p(x|)服从正态分布,选正态分布 • 若p(x|)服从两点分布,选Beta分布 • 若p(x|)服从指数分布,选逆Gamma分布
精选完整ppt课件
Bayes统计推断问题
• 参数估计:
– 点估计 – 区间估计

贝叶斯估计

贝叶斯估计
我们可能在观测数据之前就有一些主观观 点或真正的先验知识。
但是,通常我们并没有真正的先验知识或 者我们在贝叶斯估计时想更客观些,这时 可以选择无信息的先验(noninformative prior)。
或者可以从数据估计先验。这被称为经验
贝叶斯(empirical Bayes)。
H
26
反对贝叶斯学派的观点
后验分布( x1, x2 , …, xn )的计算公式就
是用密度函数表示的贝叶斯公式。它是用
总体和样本对先验分布( )作调整的结果,
贝叶斯统计的一切推断都基于后验分布进 行。
H
14
6.4.3 贝叶斯估计
基于后验分布( x1, x2 , …, xn )对 所作的
贝叶斯估计有多种,常用有如下三种:
➢ 使用后验分布的密度函数最大值作为 的 点估计,称为最大后验估计;
概率描述的是主观信念的程度,而不是频率 。这样除了对从随机变化产生的数据进行概 率描述外,我们还可以对其他事物进行概率 描述。
可以对各个参数进行概率描述,即使它们是 固定的常数。
为参数生成一个概率分布来对它们进行推导 ,点估计和区间估计可以H 从这些分布得到 6
批评1:置信区间
置信区间:
解释:区间[u1,u2]覆盖u的概率
观点:概率就是频率
参数就是参数
联合分布密度:p(x1,x2,..xn ; )
H
3
频率学派的观点
统计学更多关注频率推断
到目前为止我们讲述的都是频率(经典的)统计学
概率指的是相对频率,是真实世界的客观属性。
参数是固定的未知常数。由于参数不会波动,因 此不能对其进行概率描述。
统计过程应该具有定义良好的频率稳定性。如: 一个95%的置信区间应覆盖参数真实值至少95% 的频率。

概率论中的贝叶斯定理解析

概率论中的贝叶斯定理解析

概率论中的贝叶斯定理解析贝叶斯定理是概率论中非常重要的一条定理。

它可以用来更新我们对事件的估计和概率。

贝叶斯定理是一个非常强大的工具,可以在许多领域得到应用,如医学、金融、自然语言处理等。

一、贝叶斯定理是什么贝叶斯定理是指在已知某个事件发生的条件下,我们可以计算出另一个相关事件的概率。

换句话说,它可以帮助我们更新关于某个事件的概率估计。

公式:P(A|B) = P(B|A) * P(A) / P(B)其中,P(A)是事件A的先验概率,即我们在未观察到B的情况下对A的概率估计;P(B)是事件B的先验概率;而P(A|B)是在已知B发生的情况下对A的概率估计,叫做后验概率;P(B|A)是在A发生的情况下对B的概率估计,叫做似然概率。

二、贝叶斯定理的应用1.医学诊断在医学领域,贝叶斯定理被广泛应用于疾病诊断。

在医生做出病情判断之前,一般先为病人做一些检验,根据这些检验的结果再判断是否出现某种病症。

这些检验有时往往是有误差的,可能会出现假阳性或假阴性的情况。

这时贝叶斯定理可以帮助医生更好地做出诊断。

例如,对于一个病人来说,有70%的可能性是患有某种病,30%的可能性是健康的。

我们希望通过某些检测手段来确认这个病人是否真的患有这种病。

我们先假设这个测试方法的准确性是95%,即对于那些患病的人,这个测试会在95%的情况下给出正确的结果;对于那些健康的人,也有95%的概率正确地给出结果。

现在假设在这个测试中,这个病人得到了阳性结果。

那么,我们利用贝叶斯定理可以计算出这个病人患病的概率是多少?首先,我们需要计算出阳性结果的概率:P(阳性结果) = P(阳性结果|患病) * P(患病) + P(阳性结果|健康) * P(健康)P(阳性结果) = 0.95 * 0.7 + 0.05 * 0.3 = 0.665然后,我们可以利用贝叶斯定理来计算出患病的概率:P(患病|阳性结果) = P(阳性结果|患病) * P(患病) / P(阳性结果)P(患病|阳性结果) = 0.95 * 0.7 / 0.665 = 0.953即,这个病人患病的概率是95.3%。

《贝叶斯估计》PPT课件

《贝叶斯估计》PPT课件

其中
B(
,
)
( )( ) ( )
,确定的随机变量
X
的分布称为贝塔分
布,记为beta(, )
贝塔分布beta(, ) 的均值 E( X )

方差Var( X
)
(
)2 (
1)
当 1时,贝塔分布退化整为理[p0p,1t ] 区间上的均匀分布。
19
信息验前分布
例 设事件 A 的概率为 ,为了估计 而作 n 次独立观察,其中事件 A 出现的次数为 X ,显然, X 服从二项分布 b(n, ) ,即
科全书》(数学卷)
整理ppt
3
第一章先验分布与后验分布
统计学有两个主要学派:频率学派与贝叶斯学派. 它们之间有异同,贝叶斯统计是在与经典统计的争 论中发展起来,主要的争论有: 1.未知参数可否作为随机变量? 2.事件的概率是否一定的频率解释? 3.概率是否可用经验来确定?
……….
§1.1 先介绍三种信息的概念
如今在概率、数理统计学中以贝叶斯姓氏命名的有贝叶斯
公式、贝叶斯风险、贝叶斯决策函数、贝叶斯决策规则、贝叶
斯估计量、贝叶斯方法、贝叶斯统计等等.
整理ppt
2
贝叶斯方法(Bayesian approach )
• 贝叶斯方法是基于贝叶斯定理而发展起来用于系 统地阐述和解决统计问题的方法(Samuel Kotz和 吴喜之,2000)。
第二步是从总体分布 p(x | ' ) 产生一个样本 x (x1, xn ) ,
这个样本是具体的,人们能看得到的,此样本 x 发生的概) p(xi | ') i 1
这个联合密度函数是综合了总体信息和样本信息,常称
为似然函数,记为 L( ') 。

《贝叶斯估计》PPT课件

《贝叶斯估计》PPT课件

前面的分析总结如下:人们根据先验信息对参数θ
已有一个认识,这个认识就是先验分布π (θ )。通
过试验,获得样本。从而对θ 的先验分布进行调整,
调整的方法就是使用上面的贝叶斯公式,调整的结
果就是后验分布 ( x1,。, xn后) 验分布是三种信息 的综合。获得后验分布使人们对θ 的认识又前进一
1)
,
x

0,1, n
( x)
(n 2)
x (1 )nx ,0 1
(x 1)(n x 1)

X ~ Be(x 1, n x 1)
9
贝叶斯统计学首先要想方设法先去寻求θ的先验分布。 先验分布的确定大致可分以下几步: 第一步,选一个适应面较广的分布族作先验分布族, 使它在数学处理上方便一些,这里我们选用β分布族
步,可看出,获得样本的的效果是把我们对θ的认识
由π(θ)调整到 应建立在后验分布
( 。x1,所,以xn)对θ的统计推断就 ( 的x1,基础, xn上) 。
7
例1 设事件A(产品为废品)的概率为 ,即P(A) 。 为了估计 而作n次独立观察,其中事件A出现次数
为X,则有X服从二项分布 b(n, )
第三章 贝叶斯估计
§3.1贝叶斯推断方法 一 、统计推断中可用的三种信息
美籍波兰统计学家耐(E.L.Lehmann1894~1981) 高度概括了在统计推断中可用的三种信息:
1.总体信息,即总体分布或所属分布族给我们 的信息。譬如“总体是指数分布”或“总体是正 态分布”在统计推断中都发挥重要作用,只要有 总体信息,就要想方设法在统计推断中使用。
假设Ⅱ 当给定θ后,从总体p(x|θ)中随机抽取一个样 本X1,…,Xn,该样本中含有θ的有关信息。这种信 息就是样本信息。

贝叶斯估计

信号的参数估计一般指参数在观测时间内不随时间变化,故是静态估计。

若被估计参量是随机过程或非随机的未知过称,则称为波形估计或状态估计,波形估计或状态估计是动态估计。

3。

2贝叶斯估计贝叶斯估计是基于后验概率分布(posterior distribution)的一类估计方法,其中后验概率分布中采用了先验信息(prior information )。

所谓先验信息,是指已知待估计参数的概率密度函数0()p θ,不管θ是随机变变量或是未知的固定常数。

而后验概率分布具有下面的形式,00()(|)(),1(|)()p c p X p c p X p d θθθθθθ*==⎰.注意两点:1,0()p θ不必满足标准化条件,即0()1p d θθ=⎰,但是0()p θ必须是非负的,并且0102()()p p θθ代表似真比(ratio of plausibility ),若0102()()1p p θθ>,则说明在1θ和2θ两个值之间我们更倾向于1θ为真值;2,()p θ*实际上就是(|)p X θ,是通过试验得到数据X 以后θ的概率密度函数,仅当()1p d θθ=⎰时有明确的含义.下面讨论中,()p θ代表0()p θ,(|)p X θ代表()p θ*。

类似于信号检测中的问题,贝叶斯估计在参数估计中对于不同的估计结果赋予了不同的代价值,然后求解平均代价最小的情况。

估计误差为θθ-,我们只关心估计误差的代价,于是代价函数()()c c θθθ-=,是估计误差的单变量函数。

典型的代价函数有三种:⑴ 平方型()2()c θθθ=-,它强调了大误差的影响 ⑵ 绝对值()c θθθ=-,给出了代价随估计误差成比例增长 ⑶ 均匀型()10c θεθεθε>⎧=⎨⎩-<<这种代价函数给出了估计误差绝对值大于某个值时,代价等于常数,而估计误差绝对值小于某个值时,代价等于零.在贝叶斯估计中,要求估计误差引起的代价的平均值最小。

贝叶斯定理解析

贝叶斯定理解析贝叶斯定理是概率论中一项重要的理论,它可以用来计算在已知一些先验信息的情况下,某个事件的后验概率。

这个定理的应用范围非常广泛,从数据分析到机器学习,都可以看到贝叶斯定理的影子。

本文将对贝叶斯定理进行详细解析,并介绍一些其相关的应用。

一、贝叶斯定理的基本公式贝叶斯定理是基于条件概率推导而来的,它的基本公式如下所示:P(A|B) = (P(B|A) * P(A)) / P(B)在这个公式中,P(A|B)表示在已知事件B发生的条件下,事件A发生的概率。

P(B|A)表示在事件A发生的条件下,事件B发生的概率。

P(A)和P(B)分别表示事件A和事件B发生的概率。

二、贝叶斯定理的应用举例为了更好地理解贝叶斯定理的应用,我们将通过一个简单的问题来说明。

假设有一家医院,该医院的1000名病人中,100人感染了某种罕见疾病。

而这种疾病的检测准确率为99%。

现在,如果一个病人的检测结果呈阳性,那么他实际上感染这种疾病的概率是多少?根据贝叶斯定理的公式,我们可以将这个问题表示为:P(感染疾病|阳性) = (P(阳性|感染疾病) * P(感染疾病)) / P(阳性)其中,P(感染疾病|阳性)表示在检测结果为阳性的条件下,病人实际上感染疾病的概率。

P(阳性|感染疾病)表示在感染疾病的条件下,检测结果为阳性的概率。

P(感染疾病)表示病人感染疾病的概率。

P(阳性)表示检测结果为阳性的概率。

根据题目中提供的信息,P(阳性|感染疾病)为0.99,P(感染疾病)为100/1000=0.1,即10%。

而P(阳性)的计算稍微复杂一些,需要考虑两种情况:检测结果为真阳性(病人实际上感染了疾病并被正确检测出来)和检测结果为假阳性(病人实际上未感染疾病但被错误地检测出来)的概率。

根据提供的信息,病人实际上感染疾病的概率为100/1000=0.1,即10%。

而检测结果为真阳性的概率为 P(真阳性) = P(感染疾病) * P(阳性|感染疾病) = 0.1 * 0.99 = 0.099。

高中数学的解析概率与统计中的贝叶斯定理

高中数学的解析概率与统计中的贝叶斯定理解析概率与统计是高中数学中的一个重要内容,其中涉及了许多概率和统计的概念和方法。

而在解析概率与统计的学习中,贝叶斯定理是一个非常关键的概念。

本文将对贝叶斯定理的原理和应用进行详细阐述。

一、贝叶斯定理的基本概念与原理贝叶斯定理是基于条件概率的一种计算方法,其基本概念和原理可以通过以下公式来表示:P(A|B) = P(B|A) * P(A) / P(B)其中,P(A|B)表示在事件B发生的条件下,事件A发生的概率;P(B|A)表示在事件A发生的条件下,事件B发生的概率;P(A)和P(B)分别表示事件A和事件B的概率。

贝叶斯定理的原理可以通过以下推导来理解:假设已知事件A发生的情况下,事件B发生的概率为P(B|A),而事件A发生的概率为P(A);同时,根据全概率公式,事件B的概率可以表示为P(B) = P(A) * P(B|A) + P(A') * P(B|A'),其中A'表示事件A不发生的情况下;那么,根据条件概率的定义,可以得到P(A|B) = P(B|A) * P(A) / P(B)。

二、贝叶斯定理的应用举例贝叶斯定理在实际问题中有着广泛的应用,下面将通过一个实例来说明其应用过程。

假设某地区的患某种疾病的发病率为1%,并且医生利用一种新的检测方法对该疾病进行检测。

据统计,如果一个人患该疾病,那么该检测方法能够正确识别的概率为99%;而对于一个健康人来说,该检测方法误判为患病的概率为5%。

现在有一个人通过该检测方法得出阳性结果,请问这个人患该疾病的概率是多少?解答:设事件A表示该人患该疾病,事件B表示该人通过检测方法得到阳性结果。

已知P(A) = 1%,P(B|A) = 99%,P(B|A') = 5%。

根据贝叶斯定理,可以计算该人患该病的概率P(A|B) = P(B|A) *P(A) / (P(B|A) * P(A) + P(B|A') * P(A'))= 0.99 * 0.01 / (0.99 * 0.01 + 0.05 * 0.99)≈ 0.99 * 0.01 / (0.99 * 0.01 + 0.05 * 0.99)≈ 0.99 * 0.01 / (0.99 * 0.01 + 0.0495)≈ 0.99 * 0.01 / 0.0995≈ 0.0099 / 0.0995≈ 0.099≈ 9.90%因此,通过该检测方法得到阳性结果的人患该疾病的概率约为9.90%。

贝叶斯估计 PPT

B(1,)的一个样本,试寻求的共轭先验分布?
解 其似然函数为
n
n
n
q(x| )
xi(1)1xi i 1xii(1)n i 1xi
i 1
n x( 1 ) n n x g n ( t|) g 1 ,
其 中 g n ( t |) t( 1 ) n t , 选 取 f () 1 , 则
注 1、贝叶斯估计是使贝叶斯风险达到最小的决策 函数.
2、不同的先验分布,对应不同的贝叶斯估计
2、贝叶斯点估计的计算 平方损失下的贝叶斯估计
定理3.2 设 的先验分布为 ( )和损失函数为
L(,d)(d)2
则 的贝叶斯估计

d * (x ) E (|X x ) h (|x )d
其 中 h (|x ) 为 参 数 的 后 验 分 布 .
π (1 ) 0 .4 π (2 ) 0 .6
这两个概率是经理的主观判断(也就是先验概率), 为了得到更准确的信息,经理决定进行小规模的试验, 实验结果如下:
A:试制5个产品,全是正品,
由此可以得到条件分布:
p ( A |1 ) ( 0 . 9 ) 5 0 . 5 9 0 p ( A |2 ) ( 0 . 7 ) 5 0 . 1 6 8
t (1)n t
D f{1t (1)n td :n1 ,2,L,t0,1 ,2,L} 0
显然此共轭分布族为 分布的子族,因而,两点
分布的共轭先验分布族为 分布. 常见共轭先验分布
总体分布
参数
共轭先验分布
二项分布
成功概率p
分布 ( , )
泊松分布
均值
分布 ( )
指数分布
均值的倒数
分布 ( )
正态分布 (方差已知)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

总体分布
参数
共轭先验分布
二分布
成功概率p
分布(,)
泊松分布
均值
分布()
指数分布
均值的倒数
分布()
正态分布 (方差已知)
正态分布(均 值已知)
均值 方差²
正态分布N(,²) 倒分布
二、参数经验贝叶斯估计
1、贝叶斯风险的定义
由第一小节内容可知,给定损失函数以后,风 险函数定义为
当X与都是离散型随机变量时,贝叶斯风险为
R(d ) E(R( ,d ))
g(x){ L( , d( x))h( | x)}
x

注 由上述计算可以看出,贝叶斯风险为计算两次 期望值得到,即
R(d ) E(E (L( , d( X )))
此风险大小只与决策函数d有关,而不再依赖 参数. 因此以此来衡量决策函数优良性更合理
在先验分布G( )未知时,如何计算
dG
(x)

(x
1)mG ( x mG ( x)
1)
由于历史样本X1, X2 , Xn均是从分布mG ( x)中抽取的独立
样本,故由这些样本可以对mG ( x)估计,根据泊松分布特
性可以得到mG ( x)的估计为
mˆ G ( x1, x2 ,
1
,
xn ,
x)
i 1
例4(p126例4.10) 设( X1, X2 , , Xn )T 是来自总体
B(1, )的一个样本,试寻求的共轭先验分布?
解 其似然函数为
n
n
q( x | )
n
xi (1 )1 xi
xi
n xi
i1 i (1 ) i1
i 1
nx (1 )nnx gn (t | ) 1,
其中参数向量为 (1,2 , , p ).
注 定理表明,正定二次损失下,的贝叶斯估计
不受正定矩阵Q的选取干扰,表现出其稳健性.
证 在二次损失下,任一个决策函数向量d(x)= (d1( x), d2 ( x), , dn ( x))T的后验风险为
E[(d )T Q(d ) | x] E[((d d* ) (d* ))T Q((d d * ) (d * )) | x] 又由于E(d* | x) 0,因而 E[(d )T Q(d ) | x] (d d * )T Q(d d * ) E[(d * )T Q(d * ) | x]


L( , d( x))h( | x)dx,

L(i , d( x))h(i | x),
i
为连续型随机变量, 为离散型随机变量.
注 如果存在一个决策函数,使得
R(d* | x) inf R(d | x), d D d
则称此决策为后验风险准则下的最优决策函数,或称
为贝叶斯(后验型)决策函数。
[E( | x) d( x)][ E( | x)]h( | x)d
[E( | x) d( x)][E( | x) E( | x)] 0
因而 [ d( x)]2 h( | x)d [ E( | x)]2 h( | x)d [E( | x) d( x)]2 h( | x)d
定理4.4 设参数为随机向量,先验分布为() 和损失函数为二次损失函数
L( , d ) (d )T Q(d )
其中Q为正定矩阵,则的贝叶斯估计为后验分布
h(|x)的均值向量,即
d*( x) E( | x)


E(1
|
x)

E( p | x)
定理4.6 设的先验分布为()和损失函数为
如何计算经验贝叶斯估计dn dn ( X | X1, , Xn )
经验贝叶斯估计dn dn ( X | X1, , Xn )的计算方法:
(1)根据贝叶斯估计风险函数的定义可知dn dn( X | X1, , Xn )的风险为
RG (dn | X1, , Xn )

[


L( , dn( x
非参数经验贝叶斯估计 参数经验贝叶斯估计
一、非参数经验贝叶斯估计
1、问题引入 例1(p109例3.20) 设随机变量X服从泊松分布,
p( x | ) x e x ,
x!
( x 0,1, 2, ; 0)
设参数的先验分布为G( ),则X的边缘分布为
mG ( x)
e x x dG( ),
|
x1 ,
x2 ,
xn ) p( x | )dx]dG( )
注:此结果包含了X1,
Xn , 而X1,
X
为随机变量,
n
因而,该风险仍包含有随机性,需要对此风险再求
一次期望,即
(2)计算期望,可得
RG* (dn ) E(RG (dn | X1, , Xn ))
RG (dn | X1, , Xn )mG ( x1, x2 , , xn )dx1dx2 dxn
[ E( | x)]2 h( | x)d [E( | x) d( x)]2 h( | x)d


2[ E( | x)][E( | x) d( x)]h( | x)d
又因为 E( | x) h( | x)d 则 [ E( | x)][E( | x) d( x)]h( | x)d
R( , d ) E (L( , d( X ))
L( , d( x))q( x | )dx

此积分仍为的函数,在给定的先验分布()时,定义
R(d ) E (R( , d ))
R( , d )π( )d

为决策函数d在给定先验分布()下的贝叶斯风险,简 称为d的贝叶斯风险.
显然,当d*( x) E( | x) a.s时,R(d )达到最小.
定理4.3 设的先验分布为()和损失函数为加 权平方损失
L( , d ) ( )( d )2
则的贝叶斯估计为
d*( x) E(( ) | x) E(( ) | x)
证明略,此证明定理4.2的证明类似.
(2) 0 gn(t | ) f ( )d

D f
{
gn (t | ) f ( ) gn (t | ) f ( )d
:
n 1, 2,
}
是共轭先验分布族,其中
n
q( x | ) p( xi | ) gn(t | )h( x1, x2 , , xn )
0 x!
( x 0,1, 2, )
对于先验分布G( ),在平方损失下,可求得的
贝叶斯估计为

p( | x)dG( x)
dG( x) E( | x)
0
0 p( | x)dG( x)
1 x1e dG( x)
x! 0
1 xe dG( x)
证 首先对贝叶斯风险做变换
min R(d ) min m( x){ [ d( x)]2 h( | x)d }dx


max a.s [ d( x)]2 h( | x)d
又因为
[ d( x)]2 h( | x)d
[ E( | x) E( | x) d( x)]2 h( | x)d

n

{( 1
x1
,
x2 ,
, xn中等于x的个数) 1}
用mˆ G ( x1, x2 , , xn , x)代替mG ( x), 可得其经验贝叶斯估计量为
dn(X | X1, X2,
,
Xn)

(
X
1)mˆ G ( X mˆ G ( X )
1)
例3(p110例3.21) 设随机变量X的分布密度为
p( x | )
1
( x )2
e2
2
的先验分布为G( ), (a, b) (, ).在平方损失下,
的贝叶斯估计为
dG ( x)

x

mG' ( x) mG ( x)
由于密度函数比较难估计,我们可以选用非参数密度
估计法(如核估计,最近邻密度估计),得到mˆ G ( x)
2、贝叶斯风险的计算 当X与都是连续性随机变量时,贝叶斯风险为
R(d ) E(R( , d )) R( , d )π( )d L( , d( x))q( x | )π( )dxd L( ,d( x))h( | x)g(x)dxd g(x){ L( , d( x))h( | x)d }dx
x! 0 ( x 1)mG ( x 1)
mG ( x)
如果先验分布 G(x)未知,该 如何计算?
2、经验贝叶斯决策函数 当先验分布未知时,如何利用历史资料(经验资
料)( X1, X 2 , , X n )T 的信息得到最优贝叶斯估计? 定义3.11 任何同时依赖于历史样本( X1, X2 , , Xn )T 和当前样本X的决策函数dn dn ( X | X1, , Xn )称为 经验贝叶斯决策函数
1、贝叶斯点估计 定义4.6 若总体X的分布函数F(x,)中参数为随机 变量,()为的先验分布,若决策函数类D中存在 一个决策函数使得对决策函数类中的任一决策函数 均有
R(d* ) inf R(d ), d D dD
则称d*( X )为参数的贝叶斯估计量
注 1、贝叶斯估计是使贝叶斯风险达到最小的决策 函数.
于是可以得到的经验贝叶斯估计为
dn( X | X1, X2 ,
,
Xn)

X
相关文档
最新文档