ch07第7章 参数估计

合集下载

七章参数估计

七章参数估计

用表格表示如下:
参数 条件
1-α 的置信区间
2 1
,
2 2
已知
1 2
1 2
未知
[X YHale Waihona Puke u22 1m
2 2
n
,
X
Y
u
2
12
2 2
]
mn
[ X Y t S
2
1 m
1 n
,
X
Y
t
2
S
1 1] mn
2 1
22
1, 2
未知
S12 S22
F / 2 (m
1 1,
n
1)
,
S12 S22
1 F1 / 2 (m 1, n
P(ˆ1 ˆ2 ) 1
则称随机区间(ˆ1,ˆ2 )是的置信度为1的置信 区 间,ˆ1和ˆ2分 别 称 为 置 信 度 为1 的 置 信 上 限 和 置 信 下 限 , 1 称 为 置 信 度(置 信 水 平)。
说明
1、置信区间的定义中,统计量ˆ1,ˆ2 满足条件P(ˆ1 ˆ2 ) 1即可,

r
(1
,
2
,,
k
)
EX
r
Ar
1 n
n i1
Xr i
r 1,2,, k
的解ˆi (X1, X 2,, X n )为i (i 1,2,, k)的矩估计量。
说明 样本原点矩依概率收敛于相应的总体原点 矩, 而样本矩的连续函数依概率收敛于相应的 总体矩的连续函数,所以所有的矩估计都有依 概率收敛这一性质(相合性)。
的 概 率 比 较 大, 即 似 然 函 数 的 值 比 较 大。
对似然函数而言, x1,x2, ,xn是常数,它是参数

第七章 参数估计 内 容 提 要

第七章 参数估计 内 容 提 要

σ 2 已 U = X − µ ~ N (0,1)
µ知
σ 2 /n
σ2未

t = X − µ ~ t(n −1) S/ n
(X − Zα ⋅ σ , X + Zα ⋅ σ )
2
n
2
n
( X − tα (n − 1) ⋅ S , X + tα (n − 1) ⋅ S )
2
n
2
n
σ2
µ 未知
χ 2 = ( n − 1) S 2 ~ χ 2 ( n − 1) σ2
2
2
所以方差σ 2 的置信度为 0.99 的置信区间为:
⎜⎛ 592 , 592 ⎟⎞ ,即(26.96,440.48); ⎝ 21.955 1.344 ⎠
均方差σ 的置信度为 0.99 的置信区间为:
⎜⎜⎝⎛
592 , 21.955
592 1.344
⎟⎟⎠⎞
,即(5.19,20.99).
【例 4】设有两个正态总体, X
计.
分析:证明无偏性,可直接按定义: E(θˆ) = θ 进行证明. 证明:由 D(θˆ) = E(θˆ2 ) − (Eθˆ)2 ,及 E(θˆ) = θ (由题意), 而 D(θˆ) > 0 ,可以得出 E(θˆ2 ) = D(θˆ) + (Eθˆ)2 = θ 2 + D(θˆ) ≠ θ 2 , 因此,θˆ 2 不是θ 2 的无偏估计.
2
均未知,故取统计量
(n
− 1)S σ2
2
~
χ 2 (n − 1) ,从而得σ 2 、
σ 置信度为1 − α 的置信区间分别为
4
⎜⎛ ⎜ ⎝
(n − 1)S 2

chap7参数估计.ppt

chap7参数估计.ppt

若p的可供选择的估计值有许多,仍应选择发生概率最大的 p
作为p的估计,这就是极大似然估计的思想。
极大似然估计的原理(教材p180-181)
设总体X的概率密度函数族为f(x; ) (或概率分布函数族为
P(X=x)=p(x ; ) ),。
设 (x1,x2, ,xn ) 为任一组样本观察值(一组抽象的数),则
求的矩估计值和极大似然估计值。
说明:1. 本题中因 P(X= xi )无一般表达式,故不能先求极大
似然估计量,再将样本观察值代入求极大似然估计值。
2. 本题处理思想在解决实际问题时很有用。
极大似然估计的性质:若 为总体X中未知参数的极大似
然估计量,u=u( ) 有单值反函数 = (u),则u( )是u( ) 的
k
k次着n火k天数 75 90 54 22
6
2
1 =
250
1) 试用矩估计法估计参数; 2) 试用极大似然估计法估计参数; 3) 试求P(X=0)的极大似然估计值。
例2(2002年数学三考研试题填空题)
设总体X的概率密度为 f (x;
)
e
, ( x ) 0,
若x 若x
, .
而 X1,X 2, ,X n 是来自总体X的简单随机样本,则未知
大似然估计值。
求L()的极大值 :
通过
d
ln
L(
)
0,求出

d
说明:1. 因为L()是样本观察值的函数(此时样本观察值不变),
故求出的 一般也是样本观察值的函数。
2. 由于 d ln L( ) 0 只是lnL()取极值的必要条件,从理论上
d
来说,还应验证lnL( ) lnL(), 对所有样本观察值都

ch7参数估计

ch7参数估计
估计值 .
问题是:
使用什么样的统计量去估计 µ ?
可以用样本均值;
可以用别的统计量 .
二、寻求估计量的方法 1. 矩估计法 2. 最大似然法 3. 最小二乘法 4. 贝叶斯方法 ……
这里我们主要介绍前面两种方法 .
1. 矩估计法
矩估计法是英国统计学家K.皮尔逊 最早提出来的 . 由辛钦定理 ,
( ) μ2 = E = X 2 D( X ) + [E( X )]2
(b − a)2 =
+ (a + b)2
12
4

a + b =2μ1
b= − a
12( μ2 − μ12 )
解得
a = μ1 − 3( μ2 − μ12 ) b = μ1 + 3( μ2 − μ12 )
于是 a , b 的矩估计量为
而全部信息就由这100个数组成 .
据此,我们应如何估计 µ 和 σ 呢 ?
为估计µ :
我们需要构造出适当的样本的函数 T(X1,X2,…Xn) , 每当有了样本,就代入该函数中算出一个值,用来
作为 µ 的估计值 .
T(X1,X2,…Xn) 称为参数 µ 的点估计量, 把样本值代入T(X1,X2,…Xn) 中,得到 µ 的一个点
基本思想:最大似然原理
若一试验有若干个可能结果, 现做一试验, 若事件A 发生了,而导致A发生的原因很多,在 分析导致结果A的原因时,使结果A发生的概率最 大的原因,推断为导致结果A发生的真实原因。
最大似然估计 就是在一次抽样中,若得到观测值
则选取 使得当
作为 的估计值, 时,样本出现的概率最大。
解:设
x(1)
m= in( x1 ,, xn ), x(n)

统计学(西财版) 第7章参数估计

统计学(西财版) 第7章参数估计
1 n
设总体X的分布的函数的形式为已知(如正态分布、泊松 分布等),但它的一个或多个参数未知,借助总体X的一 个样本来估计总体未知参数的值的问题,称为参数的 点估计问题。
统计学-ch7 suyl 6
如何寻找样本统计量?
有很多方法都可以用来构造样本统 计量,比如矩估计法、极大似然估计法、 最小二乘估计法、顺序统计量法…… 这里,我们主要介绍矩估计法和极 大似然估计法。
X
i 1
n
k
i
8
矩估计法的基本思想就是:
把样本矩作为相应的总体矩的估计量 样本均值
X
X
i 1
n
i
是一阶样本矩,
n 总体均值E(X)是一阶 总体矩。
将 X 作为E(X)的估计量的做法, 就是把一阶样本矩
作为一阶总体矩的估计量. 推广这种做法,把二阶样本矩作为二阶总体矩的估计量,
把三阶样本矩作为三阶总体矩的估计量,…… .
x / n 1310 1207 ... 1462 =1345.63(小时) u i 80 i 1 2 2
n
ˆ S
2
2
1010 1345.63
...... 1462 1345.63 =15388.85 80
统计学-ch7

S 2 124.05 (小时)
X ik / n去估计总体的K阶原点矩,即 分别用样本的k阶原点矩i 1
n


1 n k k 1 , 2 ..., k X i n i 1
统计学-ch7
i 1, 2, k
suyl 10
上式确定了包含个未知参数的个方程式,即有下列方程 组 1 n E( X ) n X i i 1 (6.2)

第七章参数估计资料

第七章参数估计资料

第七章 参数估计参数估计是数理统计研究的主要问题之一.假设总体X ~N (μ,σ2),μ,σ2是未知参数,X 1,X 2,…,X n 是来自X 的样本,样本值是x 1,x 2,…,x n ,我们要由样本值来确定μ和σ2的估计值,这就是参数估计问题,参数估计分为点估计(Point estimation )和区间估计(Interval estimation).第一节 点估计所谓点估计是指把总体的未知参数估计为某个确定的值或在某个确定的点上,故点估计又称为定值估计.定义7.1 设总体X 的分布函数为F (x ,θ),θ是未知参数,X 1,X 2,…,X n 是X 的一样本,样本值为x 1,x 2,…,x n ,构造一个统计量(X 1,X 2,…,X n ),用它的观察值 (x 1,x 2,…,x n )作为θ的估计值,这种问题称为点估计问题.习惯上称随机变量(X 1,X 2,…,X n )为θ的估计量,称(x 1,x 2,…,x n )为的估计值.构造估计量(X 1,X 2,…,X n )的方法很多,下面仅介绍矩法和极大似然估计法. 1.矩法矩法(Moment method of estimation )是一种古老的估计方法.它是由英国统计学家皮尔逊(K .Pearson )于1894年首创的.它虽然古老,但目前仍常用.矩法估计的一般原则是:用样本矩作为总体矩的估计,若不够良好,再作适当调整. 矩法的一般作法:设总体X ~F (X ;θ1,θ2,…,θl )其中θ1,θ2,…,θl 均未知. (1) 如果总体X 的k 阶矩μk =E (X k ) (1≤k ≤l)均存在,则μk =μk (θ1,θ2,…,θl ),(1≤k ≤l ).(2) 令⎪⎪⎩⎪⎪⎨⎧.),,,(,),,,(,),,,(2122121211l l l l l A A A θθθμθθθμθθθμ其中A k (1≤k ≤l )为样本k 阶矩.求出方程组的解,ˆ,,ˆ,ˆ21l θθθ 我们称),,,(ˆˆ21n k k X X X θθ=为参数θk (1≤k ≤l )的矩估计量, ),,,(ˆˆ21nk k x x x θθ=为参数θk 的矩估计值. 例7.1 设总体X 的密度函数为:f (x )=⎩⎨⎧-><<+.,0),1(,10,)1(其他αααx x其中α未知,样本为(X 1,X 2,…,X n ),求参数α的矩法估计.解 A 1=X .由μ1=A 1及μ1=E (X )=21)1()(1++=+=⎰⎰+∞∞-ααααx x x x x xf d d , 有21++=ααX ,得121ˆ--=X X α.例7.2 设X ~N (μ,σ2),μ,σ2未知,试用矩法对μ,σ2进行估计. 解⎪⎪⎩⎪⎪⎨⎧======∑∑==.1)(,1)(12222111ni i ni i X n A X E X n A X E μμ 又 E (X )=μ, E (X 2)=D (X )+(EX )2=σ2+μ2,那么 .1ˆˆ,ˆ2222S nn A X -=-==μσμ. 例7.3 在某班期末数学考试成绩中随机抽取9人的成绩.结果如下:解 设X 为该班数学成绩,μ=E (X ),σ2=D (X ))558994(919191+++==∑= i i x x =75;2/19122)(819898⎥⎦⎤⎢⎣⎡-⋅=∑=i i x x s =12.14.⎪⎪⎩⎪⎪⎨⎧======∑∑==.91)(,91)(9122229111i i i i X A X E X A X E μμ 由于E (X 2)=D (X )+(EX )2=σ2+μ2,那么,2222228ˆˆˆ,().9X A A x S μσμ==-=-= 所以,该班数学成绩的平均分数的矩估计值x =μˆ=75分,标准差的矩估计值298ˆs =σ=12.14. 作矩法估计时无需知道总体的概率分布,只要知道总体矩即可.但矩法估计量有时不惟一,如总体X 服从参数为λ的泊松分布时,X 和B 2都是参数λ的矩法估计.2.极(最)大似然估计法极大似然估计法(Maximum likelihood estimation)只能在已知总体分布的前提下进行,为了对它的思想有所了解,我们先看一个例子.例7.4 假定一个盒子里装有许多大小相同的黑球和白球,并且假定它们的数目之比为3∶1,但不知是白球多还是黑球多,现在有放回地从盒中抽了3个球,试根据所抽3个球中黑球的数目确定是白球多还是黑球多.解 设所抽3个球中黑球数为X ,摸到黑球的概率为p ,则X 服从二项分布P {X =k }=k3C p k(1-p )3-k, k =0,1,2,3.问题是p =1/4还是p =3/4?现根据样本中黑球数,对未知参数p 进行估计.抽样后,共有4种可能结果,其概率如表7-1所示.表7-1P {X =1}=9/64,这时我们就会选择p =1/4,即黑球数比白球数为1∶3.因为在一次试验中,事件“1个黑球”发生了.我们认为它应有较大的概率27/64(27/64>9/64),而27/64对应着参数p =1/4,同样可以考虑X =0,2,3的情形,最后可得p =⎪⎩⎪⎨⎧==.3,2,43,1,0,41时当时当x x(1) 似然函数在极大似然估计法中,最关键的问题是如何求得似然函数(定义下文给出),有了似然函数,问题就简单了,下面分两种情形来介绍似然函数. (a ) 离散型总体设总体X 为离散型,P {X =x }=p (x ,θ),其中θ为待估计的未知参数,假定x 1,x 2,…,x n 为样本X 1,X 2,…,X n 的一组观测值.P {X 1=x 1,X 2=x 2,…,X n =x n }=P {X 1=x 1}P {X 2=x 2}…P {X n =x n }=p (x 1,θ)p (x 2,θ)…p (x n ,θ) =∏=ni ix p 1),(θ.将∏=ni ix p 1),(θ看作是参数θ的函数,记为L (θ),即 L (θ)=∏=ni ix p 1),(θ. (7.1)(b ) 连续型总体设总体X 为连续型,已知其分布密度函数为f (x ,θ),θ为待估计的未知参数,则样本(X 1,X 2,…,X n )的联合密度为:f (x 1,θ)f (x 2,θ)…f (x n ,θ)=∏=ni ix f 1),(θ.将它也看作是关于参数θ的函数,记为L (θ),即L (θ)=∏=ni ix f 1),(θ. (7.2)由此可见:不管是离散型总体,还是连续型总体,只要知道它的概率分布或密度函数,我们总可以得到一个关于参数θ的函数L (θ),称L (θ)为似然函数.(2) 极大似然估计极大似然估计法的主要思想是:如果随机抽样得到的样本观测值为x 1,x 2,…,x n ,则我们应当这样来选取未知参数θ的值,使得出现该样本值的可能性最大,即使得似然函数L (θ)取最大值,从而求参数θ的极大似然估计的问题,就转化为求似然函数L (θ)的极值点的问题,一般来说,这个问题可以通过求解下面的方程来解决0)(=θθd d L . (7.3)然而,L (θ)是n 个函数的连乘积,求导数比较复杂,由于ln L (θ)是L (θ)的单调增函数,所以L (θ)与ln L (θ)在θ的同一点处取得极大值.于是求解(7.3)可转化为求解0)(=θθd dln L .(7.4)称ln L (θ)为对数似然函数,方程(7.4)为对数似然方程,求解此方程就可得到参数θ的估计值.如果总体X 的分布中含有k 个未知参数:θ1,θ2,…,θk ,则极大似然估计法也适用.此时,所得的似然函数是关于θ1,θ2,…,θk 的多元函数L (θ1,θ2,…,θk ),解下列方程组,就可得到θ1,θ2,…,θk 的估计值,⎪⎪⎪⎩⎪⎪⎪⎨⎧=∂∂=∂∂=∂∂.0),,,(ln ,0),,,(ln ,0),,,(ln 21221121k k k k L L L θθθθθθθθθθθθ (7.5) 例7.5 在泊松总体中抽取样本,其样本值为:x 1,x 2,…,x n ,试对泊松分布的未知参数λ作极大似然估计.解 因泊松总体是离散型的,其概率分布为:P {X =x }=λλ-e !x x,故似然函数为:L (λ)=∏∏==∑--⋅⋅==ni ni i x nixx x ni ii11!1!1λλλλee. ln L (λ)=11ln ln (!)nniii i n x x λλ==-+-∑∏,∑=+-=ni i x n 11)ln(λλλd d . 令λλd d ln =0,得: ∑=+-ni i x n 11λ=0.所以x x n ni i L ==∑=11ˆλ,λ的极大似然估计量为X L =λˆ(为了和λ的矩法估计区别起见,我们将λ的极大似然估计记为Lλˆ). 例7.6 设一批产品含有次品,今从中随机抽出100件,发现其中有8件次品,试求次品率θ的极大似然估计值.解 用极大似然法时必须明确总体的分布,现在题目没有说明这一点,故应先来确定总体的分布.设 X i =,100,,2,1,0,1 =⎩⎨⎧i ,i ,i 次取正品第次取次品第则X i 服从两点分布: 表7-212100p (x i ,θ)=P {X i =x i }=θ xi (1-θ)1-xi ,x i =0,1,故似然函数为:L (θ)=∑-∑=-==-=-∏1001100110010011)1()1(i ii i i ix x i x x θθθθ由题知:∑=1001i ix =8,所以 L (θ)=θ8(1-θ)92. 两边取对数得:ln L (θ)=8ln θ+92ln (1-θ).对数似然方程为:θθθθ--=1928)(ln d d L =0.解之得θ=8/100=0.08.所以Lθˆ=0.08. 例7.7 设x 1,x 2,…,x n 为来自正态总体N (μ,σ2)的观测值,试求总体未知参数μ,σ2的极大似然估计.解 因正态总体为连续型,其密度函数为f (x )=222)(21σμσ--x eπ,所以似然函数为:L (μ,σ2)=⎭⎬⎫⎩⎨⎧--⎪⎭⎫ ⎝⎛=⎭⎬⎫⎩⎨⎧--∑∏==n i i nni i x x 122122)(21exp 212)(exp 21μσσσμσππ ln L (μ,σ2)=∑=----n i i x n n 1222)(21ln 22ln 2μσσπ. 故似然方程组为:⎪⎪⎩⎪⎪⎨⎧=-+-=∂∂=-=∂∂∑∑==.0)(212),(ln ,0)(1),(ln 124222122ni i ni i x n L x L μσσσσμμσμσμ 解以上方程组得:⎪⎪⎩⎪⎪⎨⎧=-=-===∑∑∑===.ˆ)(1)(1,12121221B x x n x n x x n ni i n i i ni i μσμ 所以 ⎩⎨⎧==.ˆ,ˆ22B X Lσμ例7.8 设总体X 服从[0,θ]上的均匀分布,X 1,X 2,…,X n 是来自X 的样本,求θ的矩法估计和极大似然估计.解 因为E (X )=θ/2,令X =E (X ),得.2ˆX =矩θ 又 f (x )=⎪⎩⎪⎨⎧≤≤.,0,0,1其他θθx所以L (θ)=nθ1,0≤x i ≤θ.要L (θ)最大,θ必须尽可能小,又θ≥x i ,i =1,2,…,n ,所以{}ini L X ≤≤=1max ˆθ.第二节 估计量的评价标准设总体X 服从[0,θ]上的均匀分布,由上节例7可知ˆ2X θ=矩,{}1ˆmax L i i nX θ≤≤ 都是θ的估计,这两个估计哪一个好?下面我们首先讨论衡量估计量好坏的标准问题.1.无偏性定义7.2 若估计量(X 1,X 2,…,X n )的数学期望等于未知参数θ,即:ˆ()E θθ=, (7.6) 则称ˆθ为θ的无偏估计量(Non -deviation estimator ).估计量ˆθ的值不一定就是θ的真值,因为它是一个随机变量,若ˆθ是θ的无偏估计,则尽管ˆθ的值随样本值的不同而变化,但平均来说它会等于θ的真值.例7.9 设X 1,X 2,…,X n 为总体X 的一个样本,E (X )=μ,则样本平均数11nii X X n ==∑是μ的无偏估计量.证 因为E (X )=μ,所以E (X i )=μ,i =1,2,…,n ,于是1111()()n ni i i i E X E X E X n n ==⎛⎫== ⎪⎝⎭∑∑=μ.所以X 是μ的无偏估计量.例7.10 设有总体X ,E (X )=μ,D (X )=σ2,(X 1,X 2,…,X n )为从该总体中抽得的一个样本,样本方差S 2及二阶样本中心矩B 2=11()ni i X X n =-∑是否为总体方差σ2的无偏估计?解 因为E (S 2)=σ2,所以S 2是σ2的一个无偏估计,这也是我们称S 2为样本方差的理由.由于B 2=21n S n -, 那么 E (B 2)=2211()n n E S n nσ--=, 所以B 2不是σ2的一个无偏估计.还需指出:一般说来无偏估计量的函数并不是未知参数相应函数的无偏估计量.例如,当X ~N (μ,σ2)时,X 是μ的无偏估计量,但2X 不是μ2的无偏估计量,事实上:22222()()().E X D X E X nσμμ⎡⎤=+=+≠⎣⎦2.有效性对于未知参数θ,如果有两个无偏估计量1ˆθ与2ˆθ,即E (1ˆθ)=E (2ˆθ)=θ,那么在1ˆθ,2ˆθ中谁更好呢?此时我们自然希望对θ的平均偏差E (ˆθ-θ)2越小越好,即一个好的估计量应该有尽可能小的方差,这就是有效性.定义7.3 设1ˆθ和2ˆθ都是未知参数θ的无偏估计,若对任意的参数θ,有 D (1ˆθ)≤D (2ˆθ), (7.7) 则称1ˆθ比2ˆθ有效. 如果1ˆθ比2ˆθ有效,则虽然1ˆθ还不是θ的真值,但1ˆθ在θ附近取值的密集程度较2ˆθ高,即用1ˆθ估计θ精度要高些. 例如,对正态总体N (μ,σ2),11ni i X X n ==∑,X i 和X 都是E (X )=μ的无偏估计量,但D (X )=2nσ≤D (X i )=σ2,故X 较个别观测值X i 有效.实际当中也是如此,比如要估计某个班学生的平均成绩,可用两种方法进行估计,一种是在该班任意抽一个同学,就以该同学的成绩作为全班的平均成绩;另一种方法是在该班抽取n 位同学,以这n 个同学的平均成绩作为全班的平均成绩,显然第二种方法比第一种方法好.3.一致性无偏性、有效性都是在样本容量n 一定的条件下进行讨论的,然而(X 1,X 2,…,X n )不仅与样本值有关,而且与样本容量n 有关,不妨记为n ,很自然,我们希望n 越大时,n 对θ的估计应该越精确.定义7.4 如果n 依概率收敛于θ,即∀ε>0,有{}ˆlim 1,nn P θθε→∞-<=,(7.8) 则称ˆnθ是θ的一致估计量(Uniform estimator ). 由辛钦大数定律可以证明:样本平均数X 是总体均值μ的一致估计量,样本的方差S 2及二阶样本中心矩B 2都是总体方差σ2的一致估计量.第三节 区间估计1.区间估计的概念上节我们介绍了参数的点估计,假设总体X ~N (μ,σ2),对于样本(X 1,X 2,…,X n ),ˆX μ=是参数μ的矩法估计和极大似然估计,并且满足无偏性和一致性.但实际上X =μ的可能性有多大呢?由于X 是一连续型随机变量,P {X =μ}=0,即ˆμ=μ的可能性为0,为此,我们希望给出μ的一个大致范围,使得μ有较高的概率在这个范围内,这就是区间估计问题.定义7.5 设1ˆθ(X 1,X 2,…,X n )及2ˆθ (X 1,X 2,…,X n )是两个统计量,如果对于给定的概率1-α(0<α<1),有:P {1ˆθ<θ<2ˆθ}=1-α, (7.9) 则称随机区间(1ˆθ,2ˆθ)为参数θ的置信区间(Confidence interval ),1ˆθ称为置信下限,2ˆθ称为置信上限,1-α叫置信概率或置信度(Confidence level).定义中的随机区间(1ˆθ,2ˆθ)的大小依赖于随机抽取的样本观测值,它可能包含θ,也可能不包含θ,(7.9)式的意义是指(1ˆθ,2ˆθ)以1-α的概率包含θ.例如,若取α=0.05,那么置信概率为1-α=0.95,这时,置信区间(1ˆθ,2ˆθ)的意义是指:在100次重复抽样中所得到的100个置信区间中,大约有95个区间包含参数真值θ,有5个区间不包含真值θ,亦即随机区间(1ˆθ,2ˆθ)包含参数θ真值的频率近似为0.95. 例7.11 设X ~N (μ,σ2),μ未知,σ2已知,样本X 1,X 2,…,X n 来自总体X ,求μ的置信区间,置信概率为1-α.解 因为X 1,X 2,…,X n 为来自X 的样本,而X ~N (μ,σ2),所以uX ~N (0,1),对于给定的α,查附录中表2可得上分位点2z α,使得2P z α⎫<⎬⎭=1-α,即22P X z X z ααμ⎧-<<+⎨⎩=1-α. 所以μ的置信概率为1-α的置信区间为22X z X z αα⎛-+ ⎝. (7.10) 由(7.10)式可知置信区间的长度为22z α,若n 越大,置信区间就越短;若置信概率1-α越大,α就越小,2z α就越大,从而置信区间就越长.2.正态总体参数的区间估计由于在大多数情况下,我们所遇到的总体是服从正态分布的(有的是近似正态分布),故我们现在来重点讨论正态总体参数的区间估计问题.在下面的讨论中,总假定X ~N (μ,σ2),X 1,X 2,…,X n 为其样本. (1) 对μ的估计 分两种情况进行讨论.(a ) σ2已知此时就是例7.11的情形,结论是:μ的置信区间为22X z X z αα⎛-+ ⎝, 置信概率为1-α.(b ) σ2未知当σ2未知时,不能使用(7.10)式作为置信区间,因为(7.10)式中区间的端点与σ有关,考虑到S 2=211()1n ii X X n =--∑是σ2X σ换成S 得 TX ~t (n -1).对于给定的α,查附录中t 分布表4可得上分位点t σ/2(n -1),使得2(1)P t n α⎫<-⎬⎭=1-α,即22(1)(1)P X t n X t n ααμ⎧⎫-<<+-⎨⎬⎩⎭=1-α.所以μ的置信概率为1-α的置信区间为22(1),(1)X t n X t n αα⎛⎫-- ⎪⎝⎭. (7.11)由于=,S 0μ的置信区间也可写成22(1),(1)X t n X t n αα⎛⎫-- ⎪⎝⎭.(7.12) 例7.12 某车间生产滚珠,已知其直径X ~N (μ,σ2),现从某一天生产的产品中随机地抽出6个,测得直径如下(单位:毫米)14.6 15.1 14.9 14.8 15.2 15.1试求滚珠直径X 的均值μ的置信概率为95%的置信区间.解 111(14.615.114.914.815.215.1)6n i i x x n ===+++++∑=14.95,s 0=, t α/2(n -1)=t 0.025(5)=2.571,所以2(t n α-=2.571=0.24, 置信区间为(14.95-0.24,14.95+0.24),即(14.71,15.19),置信概率为95%.σ2的置信区间我们只考虑μ未知的情形.此时由于S 2=211()1n i i X X n =--∑是σ2的无偏估计,我们考虑22(1)n S σ-,由于222(1)~(1)n S n χσ--,所以,对于给定的α,2122222(1)(1)(1)n S P n n ααχχσ-⎧⎫--<<-⎨⎬⎩⎭=1-α. 即22222221(1)(1)(1)(1)n S n S P n n αασχχ-⎧⎫--⎪⎪<<⎨⎬--⎪⎪⎩⎭=1-α.所以σ2的置信区间为2222221(1)(1),(1)(1)n S n S n n ααχχ-⎛⎫-- ⎪ ⎪--⎝⎭(7.13) 或222200221,(1)(1)nS nS n n ααχχ-⎛⎫ ⎪ ⎪--⎝⎭, 其中S 02=211()ni i X X n =-∑. 例7.13 某种钢丝的折断力服从正态分布,今从一批钢丝中任取10根,试验其折断力,得数据如下:572 570 578 568 596576 584 572 580 566试求方差的置信概率为0.9的置信区间.解 因为111(572570566)10n i i x x n ===+++∑ =576.2,s 02=2211n i i x x n =-∑=71.56,α=0.10,n -1=9,查附表得:2220.05(1)(9)n αχχ-==16.919,2220.951(1)(9)n αχχ--==3.325,22021071.56(1)16.919ns n αχ⨯=-=42.30, 220211071.56(1) 3.325ns n αχ-⨯=-=215.22.所以,σ2的置信概率为0.9的置信区间为(42.30,215.22).以上仅介绍了正态总体的均值和方差两个参数的区间估计方法.在有些问题中并不知道总体X 服从什么分布,要对E (X )=μ作区间估计,在这种情况下只要X 的方差σ2已知,并且样本容量n 很大,X 准正态分布N (0,1),因而μ的置信概率为1-α的近似置信区间为22X z X z αα⎛-+ ⎝.小 结参数估计问题分为点估计和区间估计.设θ是总体X 的待估计参数.用统计量ˆθ=ˆθ(X 1,X 2,…,X n )来估计θ称ˆθ是θ的估计量,点估计只给出未知参数θ的单一估计.本章介绍了两种点估计的方法:矩估计法和极大似然估计法.矩法的做法:设总体X ~F (X ;θ1,θ2,…,θl )其中θk (1≤k ≤l )为未知参数. (1) 求总体X 的k (1≤k ≤l )阶矩E (x k ); (2) 求方程组112112(,,,)(),(,,,)().l l l l l E X A E X A μθθθμθθθ==⎧⎪⎨⎪==⎩的一组解1ˆθ,2ˆθ,…, ˆl θ,那么ˆk θ=ˆk θ (X 1,X 2,…,X n )(1≤k ≤l)为k 的矩估计量. ˆkθ(x 1,x 2,…,x n )为θk 的矩估计值. 极大似然估计法的思想是若已观察到样本值为(x 1,x 2,…,x n ),而取到这一样本值的概率为P =P (θ1,θ2,…,θl ),我们就取θk (1≤k ≤l )的估计值使概率P 达到最大,其一般做法如下:(1) 写出似然函数L =L (θ1,θ2,…,θl )当总体X 是离散型随机变量时,L =121(;,,,)nili P x θθθ=∏ ,当总体X 是连续型随机变量时L =121(;,,,)nili f x θθθ=∏ ,(2) 对L 取对数ln L =121ln (;,,,)nili f x θθθ=∑ ,(3) 求出方程组ln kLθ∂∂=0, k =1,2,…,l . 的一组解ˆk θ=ˆk θ (x 1,…,x n ) (1≤k ≤l )即k 为未知参数θ的极大似然估计值,ˆkθ=(X 1,X 2,…,X n )为θk 的极大似然估计量.在统计问题中往往先使用极大似然估计法,在此法使用不方便时,再用矩估计法进行未知参数的点估计.对于一个未知参数可以提出不同的估计量,那么就需要给出评定估计量好坏的标准.本章介绍了三个标准:无偏性、有效性、一致性.重点是无偏性.点估计不能反映估计的精度,我们就引人区间估计.设θ是总体X 的未知参数,1ˆθ,2ˆθ均是样本X 1,X 2,…,X n 的统计量,若对给定值α(0<α<1)满足P (1ˆθ<θ<2ˆθ)=1-α,称1-α为置信度或置信概率,(1ˆθ,2ˆθ)为θ的置信度为1-α的置信区间.参数的区间估计中一个典型、重要的问题是正态总体X (X ~N (μ,σ2))中μ或σ2的区间估计,其置信区间如表7-3所示.高(置信区间长度越小),可靠度越低;反之亦然.在实际中,应先固定可靠度,再估计精度.重要术语及主题矩估计量 极大似然估计量估计量的评选标准:无偏性、有效性、一致性, 参数θ的置信度为(1-α)的置信区间, 单个正态总体均值、方差的置信区间.习 题 七1.设总体X 服从二项分布b (n ,p ),n 已知,X 1,X 2,…,X n 为来自X 的样本,求参数p 的矩法估计.2.设总体X 的密度函数f (x ,θ)=22(),0,0,.x x θθθ⎧-<<⎪⎨⎪⎩其他X 1,X 2,…,X n 为其样本,试求参数θ的矩法估计.3.设总体X 的密度函数为f (x ,θ),X 1,X 2,…,X n 为其样本,求θ的极大似然估计.(1) f (x ,θ)=,0,0,0.e x x x θθ-⎧≥⎨<⎩(2) f (x ,θ)=1,01,0,.x x θθ-⎧<<⎨⎩其他5.随机变量X 服从[0,θ]上的均匀分布,今得X 的样本观测值:0.9,0.8,0.2,0.8,0.4,0.4,0.7,0.6,求θ的矩法估计和极大似然估计,它们是否为θ的无偏估计.6.设X 1,X 2,…,X n 是取自总体X 的样本,E (X )=μ,D (X )=σ2,2ˆσ =k 1211()n i i i XX -+=-∑,问k 为何值时2ˆσ为σ2的无偏估计. 7.设X 1,X 2是从正态总体N (μ,σ2)中抽取的样本112212312211311ˆˆˆ;;;334422X X X X X X μμμ=+=+=+ 试证123ˆˆˆ,,μμμ都是μ的无偏估计量,并求出每一估计量的方差. 8.某车间生产的螺钉,其直径X ~N (μ,σ2),由过去的经验知道σ2=0.06,今随机抽取6枚,测得其长度(单位mm )如下:14.7 15.0 14.8 14.9 15.1 15.2 试求μ的置信概率为0.95的置信区间.9.总体X ~N (μ,σ2),σ2已知,问需抽取容量n 多大的样本,才能使μ的置信概率为1-α,且置信区间的长度不大于L ? 10.设某种砖头的抗压强度X ~N (μ,σ2),今随机抽取20块砖头,测得数据如下(kg ·cm -2): 64 69 49 92 55 97 41 84 88 9984 66 100 98 72 74 87 84 48 81 (1) 求μ的置信概率为0.95的置信区间. (2) 求σ2的置信概率为0.95的置信区间. 11.设总体X ~f (x )=(1),01;10,.x x θθθ⎧+<<>-⎨⎩其中其他X 1,X 2,…,X n 是X 的一个样本,求θ的矩估计量及极大似然估计量. (1997年研考)12.设总体X ~f (x )= 36(),0;0,.xx x θθθ⎧-<<⎪⎨⎪⎩其他X 1,X 2,…,X n 为总体X 的一个样本 (1) 求θ的矩估计量;(2) 求ˆ()D θ. (1999研考) 13.设某种电子元件的使用寿命X 的概率密度函数为f (x ,θ)= 2()2,0;0,.e x x x θθ--⎧>⎨≤⎩其中θ(θ>0)为未知参数,又设x 1,x 2,…,x n 是总体X 的一组样本观察值,求θ的极大似然估计值. (2000研考)估计值和极大似然估计值. (2002研考)15.设总体X 的分布函数为F (x ,β)=1,,0,.x xx ββααα⎧->⎪⎨⎪<⎩其中未知参数β>1,α>0,设X 1,X 2,…,X n 为来自总体X 的样本(1) 当α=1时,求β的矩估计量;(2) 当α=1时,求β的极大似然估计量;(3) 当β=2时,求α的极大似然估计量. (2004研考) 16.从正态总体X ~N (3.4,62)中抽取容量为n 的样本,如果其样本均值位于区间(1.4,5.4)内的概率不小于0.95,问n 至少应取多大?2/2()d zt z t ϕ-=⎰17. 设总体X 的概率密度为f (x ,θ)=,01,1,12,0,.x x θθ<<⎧⎪-≤<⎨⎪⎩其他 其中θ是未知参数(0<θ<1),X 1,X 2,…,X n 为来自总体X 的简单随机样本,记N 的样本值x 1,x 2,…,x n 中小于1的个数.求: (1) θ的矩估计;(2) θ的最大似然估计. (2006研考)。

数理统计第七章 参数估计

数理统计第七章 参数估计
第七章 参数估计
点估计 估计量的评价标准 充分性与完备性 区间估计 正态总体参数的区间估计

7.1 点估计
一、参数估计的概念
定义 设X1, … , Xn是总体X的一个样本,其概率函 数为f(x; ), 。其中为未知参数, 为参数空间, f (x; )可表示分布律或密度函数. 若统计量g(X1, … , Xn)
随机误差 系统误差
二、无偏性
设 ( X 1 , , X n )为的估计量, 若E 则称 是的无偏估计量.
易知,样本均值和样本方差分别是总体均值和总体 方差的无偏估计。事实上,
1 n 1 n E ( X ) E ( X i ) EX i E ( X ), n i 1 n i 1
显然,根据均方误差准则,最小方差无偏估计是无偏估计 类中最好的估计。那么,如何寻求最小方差无偏估计呢?究 竟方差小到什么程度才可达到最小值呢?
罗—克拉美不等式给出了无偏估计的方差下界。 2.罗—克拉美(Rao-Cramer)不等式 定理7.2.1 设总体X为连续型随机变量,密度函数为f(x; ), 为未知参数, ,X1, …, Xn为来自该总体得一个样本。 T(X1, …, Xn)为可估计函数g( )的无偏估计量。如果满足下列 正则条件: ln f ( X ; ) 2 (1) I ( ) E[ ] 0; f ( X ; ) f ( X ; ) (2) 存在, 且有 f ( x; )dx dx,
MLE
三、有效性
1. 最小方差无偏估计
ˆ ˆ 设i i ( X 1 ,, X n ), i 1, 2分别是参数 的两个 ˆ ˆ ˆ ˆ 无偏估计, 若D1 D 2 , 则称1比 2有效.

(07)第7章 参数估计

(07)第7章  参数估计

标准正态分布
标准正态分布
t (df = 13)
t 分布
x
t 分布与标准正态分布的比较
7 - ‹#›
t (df = 5)
z
t
不同自由度的t分布
作者:贾俊平,中国人民大学统计学院
统计学STATISTICS (第六版)
总体均值的区间估计
(例题分析)
【例】已知某种灯泡的寿命服从正态分布,现从一批 灯泡中随机抽取16只,测得其使用寿命(单位:h)如 下。建立该批灯泡平均使用寿命95%的置信区间
如果不是正态分布,可由正态分布来近似 (n 30)
使用正态分布统计量 z
z x - ~ N (0,1) n
3. 总体均值 在1- 置信水平下的置信区间为
7 - ‹#›
x z 2 n
或 x z 2
s ( 未 知)
n
作者:贾俊平,中国人民大学统计学院
统计学STATISTICS (第六版)
总体均值的区间估计
数据计算得x : 3 9 .5 s, 7 .7 7
总体均值 在1- 置信水平下的置信区间为
x z 2
s 39.5 1.645 7.77
n
36
39.5 2.13
37.37,41.63
投保人平均年龄的置信区间为37.37岁~41.63岁
7 - ‹#›
作者:贾俊平,中国人民大学统计学院
统计学STATISTICS (第六版)
7.2 一个总体参数的区间估计
7.2.1 总体均值的区间估计 7.2.2 总体比例的区间估计 7.2.3 总体方差的区间估计
7 - ‹#›
作者:贾俊平,中国人民大学统计学院
统计学STATISTICS (第六版)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

n 39.5 2.13
x z
s
2
39.5 1.645
7.77 36
37.37,41.63
投保人平均年龄的置信区间为37.37岁~41.63岁
7 - 29
精品教材
统计学
总体均值的区间估计
(正态总体、2未知、小样本)
7 - 30
精品教材
总体均值的区间估计
(小样本)
精品教材
统计学
参数估计在统计方法中的地位
统计方法
描述统计 推断统计
参数估计
7-4
假设检验
精品教材
统计学
总体
统计推断的过程
样 本
样本统计量
例如:样本均 值、比例、方 差
7-5
精品教材
统计学
7.1 参数估计的一般问题
一. 估计量与估计值 二. 点估计与区间估计 三. 评价估计量的标准
7-6
精品教材
25袋食品的重量
112.5
102.6 100.0 116.6 136.8 7 - 26
101.0
107.5 123.5 95.4 102.8
103.0
95.0 102.0 97.8 101.5
102.0
108.8 101.6 108.6 98.4
100.5
115.6 102.2 105.0 93.3
1. 总体数据的离散程度,用 来测度
2. 样本容量, X n
3. 置信水平 (1 - ),影响 z 的大小
7 - 17
精品教材
统计学
评价估计量的标准
7 - 18
精品教材
统计学
无偏性
(unbiasedness)
无偏性:估计量抽样分布的数学期望等于被 估计的总体参数
ˆ P( )
无偏 有偏

如果样本均值 x =80,则80就是的估计值
7-8

二战中的 点估计
精品教材
统计学
点估计与区间估计
7-9
精品教材
统计学
参数估计的方法
估 计 方 法



区间估计
矩估计法 顺序统计量法 最大似然法 最小二乘法
7 - 10
精品教材
统计学
点估计
(point estimate)
1. 用样本的估计量直接作为总体参数的估计 值
精品教材
统计学
总体均值的区间估计
(例题分析)
解:已知X~N(,102),n=25, 1- = 95%,z/2=1.96。根 据样本数据计算得:x 105.36 总体均值在1-置信水平下的置信区间为
n 105.36 3.92
x z

2
105.36 1.96
10 25
总体服从二项分布 可以由正态分布来近似
2.
使用正态分布统计量Z P Z ~ N (0,1) P(1 P) n 3. 总体比例在1-置信水平下的置信区间为
P z 2
7 - 36
(1 )
n
或 P z 2
P(1 - P) ( 未知时) n
精品教材
统计学
总体比例的区间估计
精品教材
统计学
第 7 章 参数估计
作者:中国人民大学统计学院
7-1
贾俊平
精品教材
统计学
7.1 7.2 7.3 7.4
第 7 章 参数估计
参数估计的一般问题 一个总体参数的区间估计 两个总体参数的区间估计 样本容量的确定
7-2
精品教材
统计学
1. 2. 3. 4. 5. 6.
7-3
学习目标
估计量与估计值的概念 点估计与区间估计的区别 评价估计量优良性的标准 一个总体参数的区间估计方法 两个总体参数的区间估计方法 样本容量的确定方法
7 - 25
精品教材
统计学
总体均值的区间估计
(例题分析)
【例】一家食品生产企业以生产袋装食品为主,为对产量质 量进行监测,企业质检部门经常要进行抽检,以分析每袋重 量是否符合要求。现从某天生产的一批食品中随机抽取了25 袋,测得每袋重量如下表所示。已知产品重量的分布服从正 态分布,且总体标准差为10克。试估计该批产品平均重量的 置信区间,置信水平为95%

我们只能是希望这个区间是大量包含总体参数真 值的区间中的一个,但它也可能是少数几个不包 含参数真值的区间中的一个
7 - 15
精品教材
统计学
置信区间与置信水平
均值的抽样分布
/2
x
1-
/2
x
(1 - ) % 区间包含了
X
% 的区间未包含
7 - 16
精品教材
统计学
影响区间宽度的因素
2
7 - 23
精品教材
统计学
总体均值的区间估计
(正态总体、2已知,或非正态总体、大样本)
7 - 24
精品教材
统计学
1. 假定条件

总体均值的区间估计
(大样本)
总体服从正态分布,且方差(2) 未知 如果不是正态分布,可由正态分布来近似 (n 30)
2. 使用正态分布统计量Z X Z ~ N (0,1) n 3. 总体均值 在1-置信水平下的置信区间为 S X z 2 或 X z 2 ( 未知) n n
总体服从正态分布,且方差(2) 未知 小样本 (n < 30)
t X S n ~ t (n 1)
统计学
1. 假定条件

2. 使用 t 分布统计量 3. 总体均值 在1-置信水平下的置信区间为 S X t 2 n
7 - 31
精品教材
统计学
t 分布
分布是类似正态分布的一种对称分布,它通常要比正 态分布平坦和分散。一个特定的分布依赖于称之为 自由度的参数。随着自由度的增大,分布也逐渐趋 于正态分布
101.44,109.28
该食品平均重量的置信区间为101.44克~109.28克之
7 - 27ຫໍສະໝຸດ 精品教材统计学总体均值的区间估计
(例题分析)
【例】一家保险公司收集到由36投保个人组成的随 机样本,得到每个投保人的年龄(周岁)数据如下表。 试建立投保人年龄90%的置信区间
36个投保人年龄的数据
n 1490 13.2
x t

2
1490 2.131
24.77 16
1476.8,1503.2
该种灯泡平均使用寿命的置信区间为1476.8小时~ 1503.2小时
7 - 34
精品教材
统计学
总体比例的区间估计
7 - 35
精品教材
统计学
1. 假定条件


总体比例的区间估计
7 - 41
精品教材
统计学
总体方差的区间估计
(例题分析)
例如:用样本均值直接作为总体均值的估计 例如:用两个样本均值之差直接作为总体均 值之差的估计
2. 没有给出估计值接近总体参数程度的信息
3. 点估计的方法有矩估计法、顺序统计量法 、最大似然法、最小二乘法等
7 - 11
精品教材
统计学
1. 2.
区间估计
(interval estimate)
在点估计的基础上,给出总体参数估计的一个区间 范围,该区间由样本统计量加减抽样误差而得到的 根据样本统计量的抽样分布能够对样本统计量与总 体参数的接近程度给出一个概率度量
标准正态分布
标准正态分布
t (df = 13)
t 分布
t (df = 5)
Z
t 分布与标准正态分布的比较
X
不同自由度的t分布
t
7 - 32
精品教材
统计学
总体均值的区间估计
(例题分析)
【例】已知某种灯泡的寿命服从正态分布,现从一 批灯泡中随机抽取16只,测得其使用寿命(小时)如下 。建立该批灯泡平均使用寿命95%的置信区间
ˆ P( )
较大的样本容量
B A
较小的样本容量
7 - 21

ˆ
统计学 7.2 一个总体参数的区间估计
一. 总体均值的区间估计 二. 总体比例的区间估计 三. 总体方差的区间估计
精品教材
7 - 22
精品教材
统计学
一个总体参数的区间估计
总体参数 均值 比例 方差
符号表示
样本统计量

X


2
P
S

7 - 14
精品教材
统计学
置信区间
(confidence interval)
1. 由样本统计量所构造的总体参数的估计区间称 为置信区间 2. 统计学家在某种程度上确信这个区间会包含真 正的总体参数,所以给它取名为置信区间 3. 用一个具体的样本所构造的区间是一个特定的 区间,我们无法知道这个样本所产生的区间是 否包含总体参数的真值
A
B
7 - 19

ˆ
精品教材
统计学
有效性
(efficiency)
,有更小标准差的估计量更有效
ˆ P( )
ˆ1 的抽样分布
有效性:对同一总体参数的两个无偏点估计量
B A
ˆ2 的抽样分布
ˆ
7 - 20

精品教材
统计学
一致性
(consistency)
一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数
25袋食品的重量 112.5 102.6 100.0 116.6 136.8 101.0 107.5 123.5 95.4 102.8 103.0 95.0 102.0 97.8 101.5 102.0 108.8 101.6 108.6 98.4 100.5 115.6 102.2 105.0 93.3
相关文档
最新文档