7.2 估计量的优良性准则
电子科大概率论C7-2估计量的优良性准则

03
CATALOGUE
估计量的选择与优化
最小方差估计量
最小方差估计量(MVE)是最优的线性无偏估计 量,其方差达到所有无偏估计量中的最小值。
在多元线性回归模型中,最小二乘估计量是最小 方差估计量的一个特例。
最小方差估计量的优良性准则包括无偏性、一致 性和有效性。
贝叶斯估计量
01 贝叶斯估计量基于贝叶斯定理,通过先验概率和 似然函数来计算后验概率。
点估计量
用一个单一的值来估计未知参数。
贝叶斯估计量
基于贝叶斯定理,利用先验信息和样本信息 来估计未知参数。
02
CATALOGUE
估计量的优良性准则
无偏性准则
总结词
无偏性准则要求估计量应无系统地偏 离其真实值。
详细描述
无偏性准则是指估计量的数学期望值 应等于被估计的参数值。也就是说, 多次使用该估计量得到的平均值应该 接近于真实参数值,没有系统性偏差 。
电子科大概率论c72估计量的优良性准 则
目录
• 估计量的定义与性质 • 估计量的优良性准则 • 估计量的选择与优化 • 估计量的应用场景与实例分析 • 估计量优良性准则的局限性与未来发展方
向
01
CATALOGUE
估计量的定义与性质
估计量的定义
01
估计量:用于估计未知参数的统计量。
02
估计量是样本的函数,依赖于样本观测值。
基于机器学习的估计量优化方法
机器学习算法在数据分析和预测方面具有强大的能力,可以 应用于估计量的优化。通过机器学习算法,可以自动地选择 最优的估计量并进行参数优化。
基于机器学习的估计量优化方法需要充分考虑数据的特性和 模型的复杂性,以确保优化结果的准确性和可靠性。同时, 还需要注意避免过度拟合和欠拟合等问题。
7.2估计量评价标准

设 θ = θ (X 1 , ,X n )是 未知参数 θ 的估计量, P→ θ, 即 若θ P(| θ - θ |≥ ε ) = 0
lim
n→ ∞
则称 θ 是 θ 的一致性估计量。
已知0<p<1,求p的 例4.设 X 1, , X n ~ B ( m , p ),已知 设 求 的 极大似然估计,并讨论所求估计量的一致性。 极大似然估计,并讨论所求估计量的一致性。
设 θ ( X1,, Xn)是未知参数 θ 的估计量,若 的估计量,
E(θ ) = θ
则称 θ 为 θ 的无偏估计 .
无偏性是对估计量的一个常见而重要的要求 . 无偏性的实际意义是指没有系统性的偏差 . 例如, 例如 , 用样本均值作为总体均值的估计 虽无法说明一次估计所产生的偏差, 时,虽无法说明一次估计所产生的偏差,但 这种偏差随机地在0的周围波动 的周围波动, 这种偏差随机地在 的周围波动 , 对同一统 计问题大量重复使用不会产生系统偏差 .
常用的几条标准是: 常用的几条标准是: 1.无偏性 . 2.有效性 . 3.一致性 .
1.无偏性 . 估计量是随机变量, 估计量是随机变量,对于不同的样本值 会得到不同的估计值 . 我们希望估计值在未 知参数真值附近摆动, 知参数真值附近摆动,而它的期望值等于未 知参数的真值. 知参数的真值 这就导致无偏性这个标准 .
例3、设总体X ~ N (1, σ ), 其中参数σ 未知,σ > 0, ( X 1 ,......, X n )为来自总体X的样本(n > 1)。考虑σ 的 两个估计量:) σ 1 (1 (2) σ 2
^ 2 ^ 2 ___ 2 1 n =S = ∑(Xi X ) n 1 i =1 2 2
2
第二节 估计量的优良性准则

E
(
X
2 i
)
nE( X
2 )
n
1
1
n(
2
2)
n
2
n
2
2.
前面两节中,我们曾用矩法和极大似然法
分别求得了正态总体 N(μ, σ2) 中参数σ2 的估计,
均为
ˆ 2
1 n
n
(Xi
i1
X
)2.
很显然,它不是σ2 的无偏估计。这正是我们为 什么要将其分母修正为 n-1,获得样本方差 S2 来估计 σ2 的理由。
X1,X2,…,Xn为来自总体X 的随机样本,记 X与 S 2分别为样本均值与样本方差,即
X
1 n
n
i1
X
i
,
S2
n
1
1
n
i1
(
X
i
X
)2.
则 E(X) , E(S2) 2.
即样本均值和样本方差分别是 总体均值 和总体方差的无偏估计。
证明:因为X1, X2, …, Xn 独立同分布,且 E(Xi )=μ , 所以
证 先计算方差
Var[ X1 (1 )X2]
2Var( X1) (1 )2Var( X2 )
(2 2 2 1) 2
由于
f ( ) 2( 1 )2 1
22
对任意实数, 1,f ( ) 1 ,
2
2
当 1 时, f ( )取最小值 1,
2
2
即样本均值 X 比样本的其他所有线性函数
虑 的如下两个估计的优劣:
ˆ X ,
ˆ i
1 n 1
n j 1
X
j.
ji
解 显然两个估计都是 的无偏估计.但是
72点估计的优良性标准精

第二节点估计的优良性标准首先说明一下问题的提出,介绍以下三种评价标准:1、无偏性2、有效性3、相合性一、问题的提出从前一节可以看到,对于同一个参数,用不同的估计方法求出的估计量可能不相同,如第一节的例4和例1() •而且,很明显,原则上任何统计屋都可以作为未知参数的估计虽.问题(1)对于同一个参数究竞采用哪一个估计量好?(2)评价估计量的标准是什么?您下面介绍几个常用标准.在介绍估计量的评选标准之前,我们必须强调指出:评价一个估计量的好坏,不能仅仅依据一次试验的结果,而必须由多次试验结果来衡量.这是因为估计量是样本的函数,是随机变量•因此,由不同的观测结果,就会求得不同的参数估计值•因此一个好的估计,应在多次试验中体现出优良性.二、常用的几条标准是:1・无偏性2.有效性3・一致性(相合性)这里我们重点介绍前面两个标准・1、无偏性若x「*2,…,为总体X的一个样本,0^0是包含:在总体X的分布中的待估参数,(<9是&的取值范若估计量%0"显2,…,乙)的数学期望E(0)存在,且对于任意0e®有E(0) = 4则称0是0的无偏估计量定义的合理性我们不可能要求每一次由样本得到的估计值与真值都相等,但可以要求这些估计值的期望与真值相等.无偏性的实际意义是指没有系统性的偏差・例如,用样本均值作为总体均值的估计时,虽无法说明一次估计所产生的偏差,但这种偏差随机地在0的周围波动,对同一统计问题大量重复使用不会产生系统偏差.例2、对于均值“,方差都存在的总体■若均为未知,则肝的估计量却=2工电-*)'是有偏的(即不是无偏估计).证材=If X;-*2= A *2,因为E(A2) = x/2 = a2+//\2 又因为E(X2) = D(X)+[E(X)]2 =穴 +//, n所以E(&2) = E(A2-X2)=E(A2)-E(X2)例3、设总体X服从参数为0的指数分布,概率密度护,“°,[0, 其他其中参数0>0,又设…,X”是来自总体X的样本,试证X 和“Z =/i[min(X1,X2, .,XJ]都是0 的无偏估计.证明因为E(X) = E(X) = 0,所以X是0的无偏估计量2、有效性比较参数0的两个无偏估计量A和玄,如果在样本容疑〃相同的情况下,&的观察值在真值0的附近较玄更密集,则认为&较玄有效・由于方差是随机变量取值与其数学期望的偏离程度.所以无偏估计以方差小者为好.设0严&…,乙)与玄=玄(乙,禺,…,X”) 都是&的无偏估计量若有则称内较玄有效.3、一致性(相合性)若3 = 3(X“X2,・・・,X”)为参数啲估计量若对于任t^€0,当“TOO时,8(八*2,…,X“)依概率收敛于仇则称4为0的一致估计量一致性只是在样本容量非常大的时候才显现出优势,在实际问题中常常使用无偏性、有效性这两个标准.中未知参数0的极大似然估计量不是无偏估计.K 解U 因为®的极大似然估计用为0 = max{X }0,0<x<^, x>6.0 = mix[X,]的分布函数为 \<i^no, z<o, 巧⑵= [F(z)f = ^7,0<z"1,z>0.b故其概率密度为练习:试证明均匀分布 0, 0 < ,v < 0, 其它 厶⑵彳歹0, 0 < Z 5 09其它,而总体分布函数E@) = jS(zMz 衣/z + l 从而,j不是。
电子科大概率论C7_2 估计量的优良性准则

电子科技大学
估计量的优良性准则
19.2.10
可见,一个参数的无偏估计可以有很多.
无偏估计只能保证估计无系统误差:
ˆ ) 0 E (
θ
ˆ 的取值在θ及其附近越密集越好, 希望 θ
其方差应尽量小.
2)
3 2 D(Y ) E (Y ) E (Y ) , 80 3 2 2 2 D( Z ) E ( Z ) E ( Z ) , 80 4 D( Y ) D(4 Z ) 3
2 2
4 即 max X i 比 2 4 min X i 的方差小 . 3 1 i 3 1 i 3
19.2.10
证明 S2 是σ2 的无偏估计量
例1 设总体的方差 D(X)=σ2 >0,则样本方差S2
是σ2的无偏估计. 证
( n 1) S ( X i X ) X i nX 2
2 2 2 i 1 i 1 n n
( n 1) E ( S 2 ) E ( X i 2 ) nE ( X 2 )
估计量的优良性准则
19.2.10
§7.2 估计量的优良性准则 对于总体的一个参数,可用各种不同的方法去 估计它,因此一个参数的估计量不唯一. 如 X~U(0,θ) ,θ的矩法估计量为 2 X , 极大似然估计量为 max{ X i }
1 i n
在众多的估计量中选哪一个更好?
选取的标准是什么? 三个常用准则:无偏性、有效性、相合性.
1 n 2 D X i n 1 n 2 P X i 2 i 1 2 n i 1
§7.2点估计的评价标准

智商
组别
甲组
人数
n
6
智商平均数
x
78
Ch7-70
样本标准差
s
19
乙 组 46
99
16
由此结果推断母亲嗜酒是否影响下一
代的智力?若有影响,推断其影响程度有 多大?
提示 前一问题属假设检验问题
后一问题属区间估计问题
f
(x;θ )
=
⎧1
⎪⎨θ
−x
eθ
x > 0,
θ > 0 为常数
⎪⎩ 0
x≤0
( X1, X 2 ,", X n ) 为 X 的一个样本
证明 X 与 n min{X1, X 2 ,", X n} 都是θ 的无偏
估计量
证
X ~ E⎜⎝⎛θ1 ⎟⎠⎞
E(X ) =θ
故 E(X ) = E(X ) = θ
解
D(X)
=θ2
n
,D(nmin{X1,
X2,",
Xn})
=θ 2
所以,X 比n min{ X1, X 2 ,", X n} 更有效.
Ch7-58
例6 设总体 X,且 E( X )=μ , D( X )=σ 2
( X1, X 2 ,", X n )为总体 X 的一个样本
∑ (1)
设常数
ci
≠1 n
− lnθ
−
x
θ
Ch7-64
⎡∂
⎢⎣∂θ
ln
f
( x,θ
)
⎤ ⎥⎦
2
=
⎢⎣⎡−
1
θ
+x
θ2
⎤2 ⎥⎦
2估计量的优良性准则

而
n ˆ 2
n1
S2
1 n1
n i1
(Xi
X)2,
即S2是2的无偏,估 故计通S常 2作 取 2的估.计
第7章 参数估计
例3 设总体X服从[0,]上的均匀分布,参数
0,X 1,X 2, ,X n是来 X 的 自 样本2X ,试
是 的无偏估计量.
证 因为
E(2X)2E(X)2E(X)
E ( X ) , V a r ( X ) 2 , 且 和 2 都 未 知 , 试证
ˆ2
1n ni1(Xi
X)2不是
2 的无偏估计量。
证 ˆ2n 1i n 1(X iX )2=n 1i n 1X i2X 2
2
=A2 X ,
E (A 2)2E (X 2)2 2,
7.2 估计量的优良性准则
无偏性 有效性 相合性 小结 思考与练习
第7章 参数估计
希望估计量的值接近被估参数的真值,但 估计量是随机变量,对于不同的样本值就会得 到不同的估计值.需要考察估计量的期望、方 差等数字特征. 估计量的评选标准
无偏性
有效性
第7章 参数估计
相合性
一、无偏性
设 ˆ ( X 1 , X 2 ,, X n ) 是 未 知 参 数 的 估 计 量 ,
第7章 参数估计
例4 证明 样本标准差 S 不是总体标准
差 的无偏估计.
证 因 E(S2)2,
所以, V a r(S ) [E (S )]2 2,
由 Var(S)0, 知
[E (S )]22 V a r(S ) 2 ,
因此,E(S), 故S 不是 的无偏估计.
第7章 参数估计
7-2估计量的评选标准

所以 ˆ 2 是有偏的.
由于
1 n n 1 2 2 E (Xi X ) n n i 1
n 1 n 2 2 E (Xi X ) n 1 n i 1
所以 即
1 n 2 2 E ( X X ) i n 1 i 1
1 n 2 2 ( X X ) S 是 σ 无偏估计 i n 1 i 1
ˆ2 同理可证明(2) E
由此可知, 一个参数可以有不同的无偏估计量.
例2 若总体 X 的均值 , 方差 2 均为未知, 证明
n 1 ˆ 2 ( X i X ) 2 不是 2 的 无偏估计. 估计量 n i 1
往证
ˆ E
2
2
2
回顾
n
EX , DX
1 1 1 ( X 1 X 2 ) ( DX 1 DX 2 ) θ2 2 2 4
1 2 ˆ D 3 DX θ 3
1 4 5 ˆ D 4 DX 1 DX 2 θ2 9 9 9
因而, D ˆ3 D ˆ2 D ˆ4 D ˆ1
练习 X 1 , X 2 为总体 N ( ,1) 的样本,比较下列无偏估
练习
1. 证明 S 不是 的无偏估计量 .
提示 2 E S 2 DS ( ES ) 2 ( ES ) 2 ES
2.设总体 X 的均值 µ 与方差σ2均为未知参数, X1,X2为样本.
证明 (1)
1 ( X 1 X 2 ), 2 2 1 X 1 X 2 1.7 X 1 0.7 X 2 3 3
ˆ 与 ˆ 都是 的无偏估计量, 若有 定义 设 1 2 ˆ ) D( ˆ ), 则称 ˆ 较 ˆ 有效. D( 1 2 1 2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
电子科技大学
#
估计量的优良性准则
Dec-10
证明 S2 是σ2 的无偏估计量 例7.2.2 设总体的方差 D(X)=σ2 >0,则样本 , 方差S 的无偏估计. 方差 2 是σ2的无偏估计 证
(n −1)S = ∑( Xi − X) = ∑ Xi − nX 2
2 2 2 i =1 i =1
n 2 2
证明无偏性判断有效性(1) 证明无偏性判断有效性 证明无偏性判断有效性(2) 证明无偏性判断有效性 和S2 分别是μ和σ2 的最小方差无偏估计 X
电子科技大学
估计量的优良性准则
Dec-10
3. 相合性 无偏性: 无偏性:反映估计量相对待估参数有无系 统偏差. 统偏差 有效性: 有效性:在无偏类中反映估计量相对待估 参数的偏离程度. 参数的偏离程度. 例7.2.5 问题: 问题:在“偏差性”和“离散性”两者 偏差性” 离散性” 兼顾的原则下建立估计量为“最优”准则 兼顾的原则下建立估计量为“最优”准则.
电子科技大学
估计量的优良性准则
Dec-10
的相合估计量; X 是μ的相合估计量; S2 和M2 都是 2的相合估计量 都是σ 的相合估计量.
部分证明
电子科技大学
估计量的优良性准则
Dec-10
例7.2.1 设总体的方差 D(X)=σ2 >0,有 ,
1 E( X) = E( ∑Xi ) = E( X) = µ n i=1 1 2 2 2 2 2 E( X ) = D( X) +[E( X)] = σ + µ ≠ µ n
2
θ2
ˆ ˆ . θ2比θ1更有效
2 ˆ) D(θ2 3n 而且 lim = = 0. 2 n→∞ D θ ) (n + 1) (n + 2) (ˆ 1
#
电子科技大学
估计量的优良性准则
Dec-10
相合估计量. 相合估计量
1 n 2 例7.2.6 设 X~N(0,σ2), 证明 ∑ Xi 是σ2 的 n i =1
1 ∴E(Z) = 3 ∫ z ⋅ (θ − z) dz = θ 4 θ 0
2
3
θ
从而,
4 E( m Xi ) = E(4m Xi ) = θ , ax in 3 1≤i≤3 1≤i ≤3
电子科技大学
估计量的优良性准则
Dec-10
4 ax 4 in . 即 m Xi 和 m Xi 都是 的无偏估计 θ 3 1≤i≤3 1≤i ≤3
1≤i ≤3
都是θ的无偏估计; 都是 的无偏估计; 的无偏估计 2) 上述两个估计量中哪个的方差最小? 上述两个估计量中哪个的方差最小? 分析: 要判断估计量是否是无偏估计量, 分析: 要判断估计量是否是无偏估计量, 需要计算统计量的数学期望. 需要计算统计量的数学期望.
电子科技大学
估计量的优良性准则
有偏估计量
θ2 4 ˆ 又 D(θ1 ) = D(2X) = D( X) = , n 3n nθ 2 ˆ D(θ2 ) = D(m {Xi }) = ax 2 1≤i ≤n (n + 1) (n + 2)
电子科技大学
估计量的优良性准则
Dec-10
ˆ D(θ2 ) =
nθ ˆ = D(θ1 ), < (n + 1)2 (n + 2) 3n
ˆ D(µ) = D(∑ci Xi = σ )
i =1
n
2
∑
i=1
n
i=1
2 ci
σ ≤ ,
2
利用拉格朗日乘数法求条件极值, 利用拉格朗日乘数法求条件极值,令
电子科技大学
估计量的优良性准则
Dec-10
从联立方程组 ∂L ) ∂c = 2ci − λ = 0; (i = 1,2,L, n i n ∑ci = 1. i =1
电子科技大学
估计量的优良性准则
Dec-10
注意: 注意:
1 n M2 = ∑( Xi − X)2不是 2的无偏估计 σ n i =1
1 n n −1 2 2 QM2 = ∑( Xi − X ) = S n i =1 n i= n −1 2 ⇒ E(M2 ) = σ n
1 n E σ 已知 ( X ) = µ时, ∑( Xi − µ)2是 2的无偏估计 n i=1
ˆ E(θn ) = E[T( X1 , X2 ,..., Xn )] = θ
ˆ 称 θn 为θ的无偏估计量. 若 的无偏估计量. ˆ lim b = lim[E(θ ) −θ ] = 0
n→∞ n n→∞ n
ˆ 则称 θn 为θ的渐进无偏估计量. 的渐进无偏估计量.
电子科技大学
估计量的优良性准则
Dec-10
1 n 2 D ∑Xi n 1 n 2 i=1 2 = P ∑Xi −σ ≥ ε ≤ 2 n i=1 ε
2)
3 2 QD(Y ) = E(Y ) − E(Y ) = θ , 80 3 2 2 2 D(Z) = E(Z ) − E(Z) = θ , 80 4 ∴D( Y ) ≤ D(4Z) 3
2 2
4 ax θ in . 即 m Xi 比 ˆ2 = 4m Xi 的方差小 3 1≤i≤3 1≤i ≤3
#
电子科技大学
Dec-10
令
Y = maxXi ,
1≤i ≤3
Z = minXi
1≤i ≤3
先求X与 的概率密度函数, 证 1) 先求 与Y 的概率密度函数, 已知分布函数
0, x < 0; x FX ( x) = , 0 ≤ x <θ; θ 1, x ≥θ .
电子科技大学
估计量的优良性准则
参数的无偏估计量不惟一. 参数的无偏估计量不惟一 无偏估计只能保证估计无系统误差: 无偏估计只能保证估计无系统误差:
ˆ E(θ −θ ) = 0
电子科技大学
估计量的优良性准则
Dec-10
θ
ˆ 的取值在θ及其附近越密集越好 及其附近越密集越好, 希望 θ 的取值在 及其附近越密集越好,
其方差应尽量小. 其方差应尽量小 ˆ ˆ 定义7.2.2 设θ1( X1, X2 ,..., Xn )和θ2( X1, X2,..., Xn) 定义 的无偏估计量, 都是未知参数θ的无偏估计量,若
估计量的优良性准则
Dec-10
例7.2.4 证明
ˆ µ = ∑ci Xi , ci ≥ 0,
i=1
n
∑ci = 1,
i =1
n
X 是无偏估计量, 是其中最有效估计量. 是无偏估计量, 是其中最有效估计量. n n 证 ˆ E(µ) = E(∑ci Xi) E( X)∑ci =E( X), =
i=1
#
电子科技大学
估计量的优良性准则
Dec-10
例7.2.5 设X~U(0,θ) ,θ的矩法估计量为 的矩法估计量为 ˆ ˆ ax θ = 2X ,极大似然估计量为 θ = m {X }.
1
2 1≤i ≤n i
ˆ 有 E(θ1 ) = E(2X ) = θ ,
ˆ ) = E(m {X }) = nθ E(θ2 ax i 1≤i ≤n n+1
电子科技大学
估计量的优良性准则
n 2
Dec-10
Xi 1 n 2 σ2 令 Y = ∑ ~ χ 2 (n), 则 ∑Xi = Y , n i =1 n i =1 σ
σ 2 1 n 2 Y ∴D ∑Xi = D n n i =1
估计量的优良性准则
Dec-10
§7.2 估计量的优良性准则 对于总体的参数, 对于总体的参数,可用各种不同的方法去 估计它,因此一个参数的估计量不唯一. 估计它,因此一个参数的估计量不唯一 如 X~U(0,θ) ,θ的矩法估计量为 的矩法估计量为 , 2X
ax 极大似然估计量为 m {Xi }
1≤i ≤n
ˆ ˆ D(θ1 ) ≤ D(θ2 ), ∀θ ∈Ω
( ). θ θ 称 ˆ1比 ˆ2有效 优效
电子科技大学
估计量的优良性准则
Dec-10
ˆ 的无偏估计, 设 θ0是θ的无偏估计,如果对θ的任何一个
无偏估计量 θ 都有 ˆ
ˆ ˆ D(θ0 ) ≤ D(θ ), θ ∈Ω
ˆ 的最小方差无偏估计量. 称 θ0为θ的最小方差无偏估计量.
Dec-10
F ( y) = P{Y ≤ y} = P{max Xi ≤ y} Y
= P{X1 ≤ y, X2 ≤ y, X3 ≤ y} = P{ X1 ≤ y}⋅ P{X2 ≤ y}⋅ P{X3 ≤ y}
= [FX ( y)]
3
1≤i ≤3
′ fY ( y) = FY ( y) = 3[F( y)] fY ( y)
2
3 y 2 ⋅ ( ) , 0 ≤ y ≤ θ; ∴ fY ( y) = θ θ 0 , else.
电子科技大学
估计量的优良性准则
Dec-10
E(Y ) =
θ 3 ∫0
3
θ
3 y dy = θ , 4
3
2 3 z ⋅ 1 − , 0 ≤ z ≤ θ , 同理可得 fZ (z) = θ θ else 0 ,
证明相合性常用到切比雪夫不等式 切比雪夫不等式; 分析 1) 证明相合性常用到切比雪夫不等式 2) 这里计算方差较难, 可以先化为χ2 这里计算方差较难 分布, 再利用卡方分布的性质计算. 分布 再利用卡方分布的性质计算 证
1 n 2 1 n E ∑Xi = ∑E( Xi2 ) = E( X 2 ) = σ 2 , n n i =1 i=1
∴E(S ) = σ .
2 2