概率论第十九讲极大似然估计法
极大似然估计法

《概率论与数理统计》极大似然思想一般地说,事件A 与参数Θ∈θ有关,θ取值不同,则)(A P 也不同.若A 发生了,则认为此时的θ值就是θ的估计值.这就是极大似然思想.看一例子:例1、设袋中装有许多黑、白球,不同颜色球的数量比为3:1,试设计一种方法,估计任取一球为黑球的概率P .分析:易知P 的值无非是1/4或3/4.为估计P 的值,现从袋中有放回地任取3只球,用X 表示其中的黑球数,则),3(~P b X .按极大似然估计思想,对P 的取值进行估计.解:对P 的不同取值,X 取3,2,1,0=k 的概率可列表如下:X 0 1 2 341=P 6427 6427 649 64143=P641 64964276427故根据极大似然思想即知:⎪⎩⎪⎨⎧===3,2,431,0,41ˆk k P .在上面的例子中,P 是分布中的参数,它只能取两个值:1/4或3/4,需要通过抽样来决定分布中参数究竟是1/4还是3/4.在给定了样本观测值后去计算该样本出现的概率,这一概率依赖于P 的值,为此需要用1/4、3/4分别去计算此概率,在相对比较之下,哪个概率大,则P 就最象那个.二、似然函数与极大似然估计1、离散分布场合:设总体X 是离散型随机变量,其概率函数为);(θx p ,其中θ是未知参数.设n X X X ,,,21 为取自总体X 的样本.n X X X ,,,21 的联合概率函数为∏=ni i X p 1);(θ,这里,θ是常量,n X X X ,,,21 是变量.若我们已知样本取的值是n x x x ,,,21 ,则事件},,,{2211n n x X x X x X === 发生的概率为∏=ni i x p 1);(θ.这一概率随θ的值而变化.从直观上来看,既然样本值n x x x ,,,21 出现了,它们出现的概率相对来说应比较大,应使∏=ni i x p 1);(θ取比较大的值.换句话说,θ应使样本值n x x x ,,,21 的出现具有最大的概率.将上式看作θ的函数,并用)(θL 表示,就有:∏===ni i n x p x x x L L 121);();,,,()(θθθ (1)称)(θL 为似然函数.极大似然估计法就是在参数θ的可能取值围Θ,选取使)(θL 达到最大的参数值θˆ,作为参数θ的估计值.即取θ,使);,,,(max )ˆ;,,,()(2121θθθθnn x x x L x x x L L Θ∈== (2) 因此,求总体参数θ的极大似然估计值的问题就是求似然函数)(θL 的最大值问题.这可通过解下面的方程0)(=θθd dL (3) 来解决.因为L ln 是L 的增函数,所以L ln 与L 在θ的同一值处取得最大值.我们称)(ln )(θθL l =为对数似然函数.因此,常将方程(3)写成:0)(ln =θθd L d (4) 方程(4)称为似然方程.解方程(3)或(4)得到的θˆ就是参数θ的极大似然估计值.如果方程(4)有唯一解,又能验证它是一个极大值点,则它必是所求的极大似然估计值.有时,直接用(4)式行不通,这时必须回到原始定义(2)进行求解.2、连续分布场合:设总体X 是连续离散型随机变量,其概率密度函数为);(θx f ,若取得样本观察值为n x x x ,,,21 ,则因为随机点),,,(21n X X X 取值为),,,(21n x x x 时联合密度函数值为∏=ni i x f 1);(θ.所以,按极大似然法,应选择θ的值使此概率达到最大.我们取似然函数为∏==ni i x f L 1);()(θθ,再按前述方法求参数θ的极大似然估计值.三、求极大似然估计的方法1、可通过求导获得极大似然估计:当函数关于参数可导时,常可通过求导方法来获得似然函数极大值对应的参数值.例2、设某工序生产的产品的不合格率为p ,抽n 个产品作检验,发现有T 个不合格,试求p 的极大似然估计.分析:设X 是抽查一个产品时的不合格品个数,则X 服从参数为p 的二点分布),1(p b .抽查n 个产品,则得样本n X X X ,,,21 ,其观察值为n x x x ,,,21 ,假如样本有T 个不合格,即表示n x x x ,,,21 中有T 个取值为1,T n -个取值为0.按离散分布场合方法,求p 的极大似然估计.解:(1)写出似然函数:∏=--=ni x x i i P p p L 11)1()((2)对)(p L 取对数,得对数似然函数)(p l :∑∑==--+-=--+=ni i ni i i p p x p n p x p x p l 11)]1ln([ln )1ln()]1ln()1(ln [)((3)由于)(p l 对p 的导数存在,故将)(p l 对p 求导,令其为0,得似然方程:0)1(11)111(1)(11=-+--=-++--=∑∑==ni i n i i x p p p n p p x p n dp p dl (4)解似然方程得:x x n pni i ==∑=11ˆ (5)经验证,在x p =ˆ时,0)(22<dpp l d ,这表明x p =ˆ可使似然函数达到最大(6)上述过程对任一样本观测值都成立,故用样本代替观察值便得p 的极大似然估计为:X p=ˆ 将观察值代入,可得p 的极大似然估计值为:nTx p==ˆ,其中∑==ni i x T 1.若总体X 的分布中含有多个未知参数k θθθ,,,21 时,似然函数L 是这些参数的多元函数),,(1k L θθ .代替方程(3),我们有方程组),,2,1(0)(ln k i L i==∂∂θ,由这个方程组解得kθθθˆ,,ˆ,ˆ21 分别是参数k θθθ,,,21 的极大似然估计值.例3、设某机床加工的轴的直径与图纸规定的中心尺寸的偏差服从),(2σμN ,其中2,σμ未知.为估计2,σμ,从中随机抽取100=n 根轴,测得其偏差为10021,,,x x x .试求2,σμ的极大似然估计.分析:显然,该问题是求解含有多个(两个)未知参数的极大似然估计问题.通过建立关于未知参数2,σμ的似然方程组,从而进行求解.解:(1)写出似然函数:212222)(2212)(2)2(21),(σμσμπσσπσμ∑===---=--∏ni i i x n ni x ee L(2)写出对数似然函数:21222)(21)2ln(2),(∑=---=n i i x n l μσπσσμ(3)将),(2σμl 分别对2σμ、求偏导,并令它们都为0,得似然方程组为:⎪⎪⎩⎪⎪⎨⎧=-+-=∂∂=-=∂∂∑∑==0)(212),(0)(1),(1242221222ni i ni i x n l x l μσσσσμμσμσμ (4)解似然方程组得:x =μˆ,∑=-=ni i x x n 122)(1ˆσ (5)经验证2ˆ,ˆσμ使),(2σμl 达到极大, (6)上述过程对一切样本观察值成立,故用样本代替观察值,便得2,σμ的极大似然估计分别为:X =μˆ,2122)(1ˆn n i i S X X n =-=∑=σ.2、不可通过求导方法获得极大似然估计:当似然函数的非零区域与未知参数有关时,通常无法通过解似然方程来获得参数的极大似然估计,这时可从定义(2)出发直接求)(θL 的极大值点.例4、设总体X 服从均匀分布),0(θU ,从中获得容量为n 的样本n X X X ,,,21 ,其观测值为n x x x ,,,21 ,试求θ的极大似然估计.分析:当写出其似然函数)(θL 时,我们会发现)(θL 的非零区域与θ有关,因而无法用求导方法来获得θ的极大似然估计,从而转向定义(2)直接求)(θL 的极大值.解:写出似然函数:⎩⎨⎧≤≤≤=-其它场合,00,)()()1(θθθn n x x L 为使)(θL 达到极大,就必须使θ尽可能小,但是θ不能小于)(n x ,因而θ取)(n x 时使)(θL 达到极大,故θ的极大似然估计为:)(ˆn X =θ. 进一步,可讨论估计θˆ的无偏性: 由于总体),0(~θU X ,其密度函数与分布函数分别为:⎪⎩⎪⎨⎧<<=其它,00,1)(θθx x p ,⎪⎩⎪⎨⎧≥<<≤=θθθx x x x x F ,10,0,0)(,从而)(ˆn X =θ的概率密度函数为:θθθ<<==--y ny y p y F n p nn n 0,)()]([11ˆ θθθθθθθ≠+====⎰⎰1)()()ˆ(0ˆ)(n ndy ny dy y yp X E E nnn 这说明θ的极大似然估计)(ˆn X =θ不是θ的无偏估计,但对θˆ作一修正可得θ的无偏估计为:)(11ˆn X nn +=θ. 通过修正获得未知参数的无偏估计,这是一种常用的方法.在二次世界大战中,从战场上缴获的纳粹德国的枪支上都有一个编号,对最大编号作一修正便获得了德国生产能力的无偏估计.综上,可得求极大似然估计值的一般步骤.四、求极大似然估计的一般步骤1、由总体分布导出样本的联合概率函数(或联合密度);2、把样本联合概率函数(或联合密度)中自变量看成已知常数,而把参数θ看作自变量,得到似然函数)(θL ;3、求似然函数)(θL 的最大值点(常转化为求对数似然函数)(θl 的最大值点);4、在最大值点的表达式中,用样本值代入就得参数的极大似然估计值.五、极大似然估计的不变性求未知参数θ的某种函数)(θg 的极大似然估计可用极大似然估计的不变原则,证明从略.定理(不变原则)设θˆ是θ的极大似然估计,)(θg 是θ的连续函数,则)(θg 的极大似然估计为)ˆ(θg . 例5、设某元件失效时间服从参数为λ的指数分布,其密度函数为0,);(≥=-x e x f x λλλ,λ未知.现从中抽取了n 个元件测得其失效时间为n x x x ,,,21 ,试求λ及平均寿命的极大似然估计.分析:可先求λ的极大似然估计,由于元件的平均寿命即为X 的期望值,在指数分布场合,有λ1)(=X E ,它是λ的函数,故可用极大似然估计的不变原则,求其极大似然估计.解:(1)写出似然函数:∑===-=-∏ni iix nni x eeL 11)(λλλλλ(2)取对数得对数似然函数:∑=-=ni i x n l 1ln )(λλλ(3)将)(λl 对λ求导得似然方程为:0)(1=-=∑=ni i x n d dl λλλ(4)解似然方程得:xxnni i1ˆ1==∑=λ经验证,λˆ能使)(λl 达到最大,由于上述过程对一切样本观察值成立,故λ的极大似然估计为:X1ˆ=λ; 根据极大似然估计的不变原则,元件的平均寿命的极大似然估计为:X X E ==λˆ1)(. 五、小结1、极大似然估计的思想;2、求解未知参数极大似然估计的一般步骤;3、极大似然估计的不变原则.。
极大似然法原理

极大似然法原理在统计学中,极大似然法是一种常用的参数估计方法。
它的原理是基于已知数据集的情况下,通过寻找最大概率使模型参数最接近真实值。
接下来,我们将围绕极大似然法原理进行分步骤的阐述。
第一步,定义似然函数。
似然函数是指在已知数据集的情况下,模型参数的取值所产生的概率。
假设我们要估计一个二项分布模型的参数p,数据集中有n个实例,其中有m个成功实例(成功实例概率为p)。
那么这个模型的似然函数可以表示为:L(p;m,n) = C(n,m) * p^m * (1-p)^(n-m)其中,C(n,m)表示从n个实例中选择m个成功的组合数。
这个式子中,p取值不同,所对应的似然函数值也不同。
第二步,求解极大化似然函数的参数值。
在求解参数值时,我们要找到一个能使似然函数取到最大值的p值。
这个过程可以通过求解似然函数的导数为零来实现。
即:dL/dp = C(n,m) * [m/(p)] * [(n-m)/(1-p)] = 0这个式子中,p的值是可以求出来的,即为p = m / n。
这个p值被称为最大似然估计值,意味着在该值下,似然函数取值最大。
这个值也是对真实参数值的一个良好估计。
第三步,检验极大似然估计值的可靠性。
为了检验极大似然估计值的可靠性,我们需要进行假设检验。
通常我们会计算一个置信区间,如果实际参数值在置信区间内,那么我们就认为估计值是可靠的。
置信区间可以通过计算似然函数的二阶导数来得到。
即:d^2L/dp^2 = -C(n,m) * [m/(p^2)] * [(n-m)/((1-p)^2)]计算得到极大似然估计值的二阶导数在该参数值下是负数。
根据二阶导数的符号,可以确定p = m / n是最大值,同时也可以计算出该置信区间的范围。
在这个过程中,我们还需要参考似然比值,以便更好地确定参数估计值。
综上所述,极大似然法是统计学中重要的一种参数估计方法。
它的原理在求解模型参数时非常实用,能够帮助我们更好地估计真实值,从而使得我们的模型更加准确。
极大似然估计

研究历史
极大似然估计方法是求估计的另一种方法,1821年首先由德国数学家s(高斯)提出,但是这个方法通常被归 功于英国的统计学家er(罗纳德·费希尔),他在1922年的论文On the mathematical foundations of theoretical statistics, reprinted in Contributions to Mathematical Statistics (by er), 1950, J. Wiley & Sons, New York中再次提出了这个思想,并且首先探讨了这种方法的一些性质.极大似然估计这一 名称也是费希尔给的。这是一种仍然得到广泛应用的方法。
谢谢观看
极大似然估计,只是一种概率论在统计学的应用,它是参数估计的方法之一。说的是已知某个随机样本满足 某种概率分布,但是其中具体的参数不清楚,参数估计就是通过若干次试验,观察其结果,利用结果推出参数的 大概值。极大似然估计是建立在这样的思想上:已知某个参数能使这个样本出现的概率最大,我们当然不会再去 选择其他小概率的样本,所以干脆就把这个参数作为估计的真实值。
当然极大似然估计只是一种粗略的数学期望,要知道然函数估计值的一般步骤: (1)写出似然函数; (2)对似然函数取对数,并整理; (3)求导数 ; (4)解似然方程。 2.利用高等数学中求多元函数的极值的方法,有以下极大似然估计法的具体做法: (1)根据总体的分布,建立似然函数 ; (2)当 L关于可微时,(由微积分求极值的原理)可由方程组 : 定出,称以上方程组为似然方程. 因为 L与有相同的极大值点,所以也可由方程组
1.若总体X为离散型,其概率分布列为 其中为为未知参数。设是取自总体的样本容量为n的样本,则的联合分布律为。又设的一组观测值为,易知样 本取到观测值的概率为 这一概率随的取值而变化,它是的函数,称为样本的似然函数。 2.若总体X为连续型,其概率密度函数为,其中为未知参数。设是取自总体的样本容量为n的简单样本,则的 联合概率密度函数为。又设的一组观测值为,则随机点落在点的邻边(边长分别为的n维立方体)内的概率近似地 为。 考虑函数 同样,称为样本的似然函数。 极大似然估计法原理就是固定样本观测值,挑选参数使 这样得到的与样本值有关,称为参数的极大似然估计值,其相应的统计量称为的极大似然估计量。极大似然 估计简记为MLE或。
极大似然估计

a* = m { X1 , X2 ,L Xn } in , b =m ax{ X1 , X2 ,L Xn } ,
*
是取自总体X的一个样本 例5设X1,X2,…Xn是取自总体 的一个样本 设 θ xθ −1 , 0 < x < 1 X ~ f ( x) = 其中θ >0, 的极大似然估计. 求θ 的极大似然估计 解:似然函数为
i =1 n
求导并令其为0 求导并令其为
d ln L(θ ) n n = + ∑ln xi =0 dθ θ i =1
从中解得
θ * = −n
∑ln x
i =1
n
i
即为θ 的MLE .
是取自总体X的一个样本 例6 设X1,X2,…Xn是取自总体 的一个样本
1 −( x−µ ) θ e , x≥µ X ~ f ( x) = θ θ , µ为未知参数 0, 其它
的极大似然估计.(注 我们把σ 看作一个参数) 的极大似然估计.(注:我们把σ2看作一个参数) .(
解:
似然函数L(µ,σ ) = ∏ f ( xi , µ,σ )
2 2 i =1
n
=∏
i =1
n
− 1 e 2πσ
( xi −µ )2 2σ
2
= (2πσ) e
n − 2
−
1 2σ 2
∑
i=1
n
( xi −µ )2
n i i=1
x!
e
−λ
x = 0,1,2,L
i
i =1
i =1
xi !
似然方程为
1 n ∂ log L(λ) = −n + ∑ xi = 0 λ i =1 ∂λ
极大似然估计及其性质

极大似然估计及其性质一、极大似然估计 设联合密度函数为12(;),'()k f Y θθθθθ=则似然函数为似然函数(;)(;)L Y f Y θθ==为使关于θ的似然函数最大化,求θ的一个估计ˆθ,使获得的已观测到的样本值的概率自大化,即最大似然估计量(MLE )。
定义对数似然函数为ln l L =则l l LL θθ∂∂=∂∂ 最大化l 的ˆθ值也会最大化L ,l 对θ的导数(;)s Y θ称作得分,将得分定义为0,即可解出(MLE )ˆθ,即(;)0ls Y θθ∂==∂ 二、MLE 的性质 1、一致性。
ˆlim()P θθ= 2、渐进正态性。
1ˆ~(,())N I θθθ- 式中()I θ为信息矩阵2()'l l l I E E θθθθθ⎡⎤'⎡⎤∂∂∂⎛⎫⎛⎫⎢⎥==- ⎪⎪⎢⎥∂∂∂∂⎢⎥⎝⎭⎝⎭⎣⎦⎣⎦ 当θ是一个k 维向量时,lθ∂∂表示k 个偏导数组成的列向量,即12k l l l l θθθθ∂⎛⎫∂ ⎪ ⎪∂∂ ⎪∂= ⎪∂ ⎪ ⎪∂ ⎪∂⎝⎭ 而lθ∂∂的二阶导数为 222211212222212*'k k k k k kl l l ll l l θθθθθθθθθθθθ⎛⎫∂∂∂ ⎪∂∂∂∂∂⎪⎪∂= ⎪∂∂⎪ ⎪∂∂∂ ⎪ ⎪∂∂∂∂∂⎝⎭ 3、渐进有效性。
2ˆ)(0,)d N θθσ-−−→4、不变性。
如果ˆθ是θ的MLE ,()g θ是θ的连续函数,则ˆ()g θ是()g θ的MLE 。
5、得分的均值为0,方差为()I θ。
三、线性模型的极大似然估计 设2~(0,)Y XB UU N σ=+U 的多元正态密度函数为21()(')2221()(2)U U n f U eσπσ-=Y 关于X 的多元条件密度为(,)()U f Y X f U Y∂=∂ UY∂∂是由U 中元素关于Y 中元素的偏导数组成的n n ⨯矩阵转换成的行列式的绝对值,并且为恒等矩阵。
极大似然估计方法

极大似然估计方法极大似然估计(Maximum Likelihood Estimation,MLE)方法是一种用于估计参数的统计方法,它基于观测到的样本数据,通过选择最大化观测数据出现的概率的参数值来估计未知参数。
极大似然估计是概率论和统计学中最重要的方法之一,广泛应用于各个领域的数据分析与建模中。
极大似然估计方法的核心思想是基于某一参数下观测数据出现的概率,选择使得这个概率最大的参数值。
具体而言,给定一个观测数据集合X,其来自于一个具有参数θ的概率分布,我们要估计未知参数θ的值。
极大似然估计的目标是找到一个参数值θ^,使得给定θ^条件下观测数据集合X出现的概率最大。
数学上,极大似然估计可以通过最大化似然函数来求解。
似然函数是一个参数的函数,表示给定某个参数θ下观测数据出现的概率。
似然函数的定义如下:L(θ|X) = P(X|θ)数的函数,表示给定某个参数θ下观测数据出现的概率。
极大似然估计的目标是寻找一个参数θ^,使得似然函数最大化,即:θ^ = arg max L(θ|X)为了方便计算,通常将似然函数转化为其对数形式,即对数似然函数:l(θ|X) = log L(θ|X)本文将主要介绍如何利用极大似然估计来估计参数。
具体而言,将分为两个部分:首先是介绍极大似然估计的理论基础,包括似然函数和对数似然函数的定义,以及如何通过最大化似然函数来估计参数;其次是通过一个实际的例子,展示如何使用极大似然估计来求解参数。
理论基础似然函数是极大似然估计的核心概念之一。
似然函数是一个参数的函数,表示给定某个参数θ下观测数据出现的概率。
似然函数的定义如下:L(θ|X) = P(X|θ)数的函数,表示给定某个参数θ下观测数据出现的概率。
似然函数的值越大,则表示给定参数θ的取值越可能产生观测数据X。
对数似然函数是似然函数的对数变换,通常在实际计算中会更加方便。
它的定义如下:l(θ|X) = log L(θ|X)对数似然函数和似然函数存在着一一对应关系,因此在求解参数时,两者等价。
极大似然估计

1) 构 造 似 然 函L(数) :
n
n
L()P(xi )(离散型 , ) L()f(xi )(连续型 ; )
i1
i1
2)取对数 lnL: ();
3)令 dlnL0;
d
4)解似然方程 的得 极大似然ˆ估 . 计量
说明:若似然方程(组)无解,或似然函数不可导, 此法失效,改用其它方法.
例1 设总体X 的密度函数为
fxx1,
0,
0x1, 其 它 .
其中未知, 1, X1,,Xn
是从该总体抽取样 的本 一. 个
试求的极大似然估计.
解: 似然函数为
L
n
n i1
xi
1 ,
ln Lnln 1 nln xi i1
d ln L
d
n
n
lnxi
i1
令:dlnL 0,
d
得似然方程为 nin1lnxi 0,
由前面知和2的极大似然估计量 为分别
ˆX, ˆ2n 1i n1(Xi X)2
所以A的极大似然估计量为
A ˆ ˆ1.64ˆ5X1.645n 1i n1(Xi X)2.
例6:设X1, … , Xn为取自参数为的指 数分布总体的样本,a>0为一给定实数。
求p=P{X<a}的极大似然估计
解: pP {X a }ae x d x 1 e a 0
解得 ˆ n n ,
ln xi
i1
由似然方程解不出的似然估计时,可由定
义通过分析直接推求。事实上
MLE
满足
L(ˆML)E m aL(x)
例3:设X1, … , Xn为取自 U(0,) 总体的样本, >0未知, 求参数 的极大似然估计。
极大似然估计的原理和思想

极大似然估计的原理和思想
极大似然估计是统计学上常用的参数估计方法之一,其原理和思想可以概括为以下两点:
1. 最大化似然函数:似然函数表示了观察到某一样本所取得的结果出现的概率。
极大似然估计的思想是通过调整参数的取值,使得观察到的样本的似然函数达到最大化。
换句话说,极大似然估计希望通过选择最合适的参数取值,使得观察到的结果出现的概率最大化。
2. 假设样本独立同分布:极大似然估计的原理基于多个独立同分布的样本。
换句话说,极大似然估计假设每个样本的出现都是独立的,且每个样本的生成过程都是相互独立的。
通过将多个样本的似然函数进行乘积,可以得到所有样本的似然函数。
然后,通过最大化整体样本集的似然函数,来估计参数的取值。
总的来说,极大似然估计的原理和思想是通过选择合适的参数取值,使得观察到的样本出现的概率最大化。
通过对样本的独立同分布假设,并最大化样本集的似然函数,可以得到最优的参数估计值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
f (x1, ) f (x2, ) f (xn, )
记为
或
L(x1, x2,, xn, ) L( )
xi u1,u2, ,
称 L( ) 为样本的似然函数 i 1,2, ,n,
极大似然法的思想
选择适当的 = ˆ ,使L( )取最大值, 即
注2 未知参数可以不止一个, 如1,…, k
设X 的密度(或分布)为 f (x,1, ,k )
则定义似然函数为
L(x1, , xn;1, ,k ) n
L(1, ,k ) f (xi ,1, ,k ) i1
xi , i 1, 2, , n (1, ,k )
若 L(x1, , xn;1, ,k ) 关于1, …, k可微,则称
r
L( x1 ,
x2 ,,
xn ;1, 2 ,, k
)
0
r 1,2,,k
为似然方程组
若对于某组给定的样本值 x1, x2,…, xn, 参数 ˆ1,ˆ2,,ˆk 使似然函数取得最大值, 即
L(x1, , xn;1, ,k )
(1
max
,2 ,,k
{L(
)
x1
,
x2
,,
xn
;1
,
2
,,
k
)}
则称 1, ,k 为1,…, k 的极大似然估计值
显然,
ˆr g(x1, x2,, xn )
称统计量
r 1,2,,k
ˆr g( X1, X 2,, X n ) r 1,2,,k
为1, 2,…, k 的极大似然估计量
例7 设总体 X ~ N (, 2), x1, x2,…, xn 是 X 的样本值, 求 , 2 的极大似然估计.
解 L(x1, x2 ,, xn; , 2 )
n
i1
1
2
e
(
xi 2 2
)2
1
n
n i1
( xi )2 2 2
en
(2 )2 ( 2)2
ln
L
n
i1
(
xi
2
2
)2
n ln(2
2
)
n 2
ln(
2
)
似然 方程ln L 12 Nhomakorabean
(xi
i1
)
0
组为
(
2 ) ln
L
1
2( 2 )2
n
(xi
i1
)2
n
2(
2)
0
ˆ mle
)
x1,
x2
,,
xn
;1,
2
,,
k
)}
若 L是 1, ,k的可微函数,解似然方程组
r
L( x1 ,
x2 ,,
xn;1,2,,k ) 0
r 1,2,,k
可得未知参数的极大似然估计值 ˆ1,ˆ2 ,,ˆk 然后, 再求得极大似然估计量.
若 L不是1, ,k的可微函数, 需用其它 方法求极大似然估计值. 请看下例:
1 n
n
xi
i1
x
2
mle
1 n
n
(xi
i1
x)2
, 2 的极大似然估计量分别为
1 n
n
Xi X ,
i 1
1 n
n
(Xi
i1
X
)2
Sn2
极大似然估计方法
1) 写出似然函数 L
2)求出 ˆ1,ˆ2,,ˆk , 使得
L(x1, x2,, xn;ˆ1,ˆ2,,ˆk )
(1
max
,2 ,,k
{L(
L(x1, x2,, xn,ˆ)
max{ f (x1, ) f (x2, ) f (xn, )}
称这样得到的 ˆ g(x1, x2,, xn )
为参数
的极大似然估计值
简记ˆmle
称统计量 g(X1, X 2,, X n )
为参数 的极大似然估计量简记ˆMLE
注1 若 X 连续, 取 f (xi, )为Xi 的密度函数 n 似然函数为 L( ) f (xi , ) i 1
例8 设 X ~ U (a,b), x1, x2,…, xn 是 X 的一个 样本值, 求 a , b 的极大似然估计值与极大
似然估计量.
解 X 的密度函数为
f
( x; a,
b)
b
1
a
,
axb
0, 其它
似然函数为
L(
x1
,
x2
,,
xn
;
a,
b)
(b
1 a)
n
,
a xi b, i 1,2,,n
第十九讲 极大似然估计法、 估计量优劣的标准
教学目的: 1.讲解极大似然估计法; 2.讲解评价估计量优劣的三个标准。
教学内容: 第六章,§ 6.1-2;§ 6.2。。
极大似然估计法
思想方法:一次试验就出现的 事件有较大的概率
例如: 有两外形相同的箱子,各装100个球 一箱 99个白球 1 个红球 一箱 1 个白球 99个红球
0,
其它
似然函数只有当 a < xi < b, i = 1,2,…, n 时 才能获得最大值, 且 a 越大, b 越小, L 越大.
令 xmin = min {x1, x2,…, xn} xmax = max {x1, x2,…, xn}
取 aˆ xmin , bˆ xmax
则对满足 a xmin xmax b 的一切 a < b ,
现经过一次试验,事件
( X1 x1, X 2 x2,, X n xn )
发生了, 则 p 的取值应使这个事件发生 的概率最大.
在容许范围内选择 p ,使L(p)最大 注意到,ln L(p)是 L 的单调增函数,故若
某个p 使ln L(p)最大, 则这个p 必使L(p)最大。
n
n
dlnL
现从两箱中任取一箱, 并从箱中任取一球, 结果所取得的球是白球. 问: 所取的球来自哪一箱? 答: 第一箱.
例6 设总体 X 服从0-1分布,且P (X = 1) = p, 用极大似然法求 p 的估计值.
解 总体 X 的概率分布为
P( X x) px (1 p)1x , x 0,1
设 x1, x2,…, xn为总体样本X1, X2,…, Xn 的样本值,
i1
xi
n
i1
xi
令
0
dp p 1 p
pˆ
1 n
n i1
xi
x
所以
d
2lnL
dp2
n
xi
i1
p2
n
n xi
i1
(1 p)2
0
pˆ x 为所求 p 的估计值 .
一般, 设 X 为离散型随机变量, 其分布律为
P(X x) f (x, ), x u1,u2,,
则样本 X1, X2,…, Xn的概率分布为
则 P(X1 x1, X2 x2,, Xn xn )
n
n
xi
n xi
p i1 (1 p) i1 L( p)
xi 0,1,i 1,2,,n
对于不同的 p , L (p)不同, 见右下图
Lp
0.01 0.008 0.006 0.004 0.002
p
pˆ0.2 0.4 0.6 0.8 1
都有
1 (b a)n
( xmax
1 xmin )n
故 aˆ xmin , bˆ xmax