第七章 参数估计
第七章参数估计

第七章参数估计对给定的统计问题,在建立了统计模型以后,我们的任务就是依据样本对未知总体进行各种推断,参数估计是统计推断的重要内容之一。
本章主要介绍进行参数估计的方法及其评价等。
7.1 点估计方法参数估计,就是要从样本出发去构造一个统计量作为总体中某未知参数的一个估计量。
若总体X的分布函数的形式为已知,但它的一个或多个参数未知,则由总体X的一个样本去估计总体未知参数的值的问题就是参数的点估计问题。
例如,某钢筋厂日生产某种型号钢筋10000根,为了要得知这批钢筋的强度,质量检察员从中抽取50跟进行检查。
如何从抽查的50根钢筋强度的数据去估计整批钢筋强度的平均值?这就是参数估计要解决的问题。
在实际问题中,我们常常以统计量作为总体X的期望值的估计量。
设总体X的分布函数为F (x,θ ),其中θ 为未知参数。
X1,X2, (X)为总体X的一个样本。
点估计的问题就是由样本构造一个统计量作为未知参数θ 的一个估计量。
若x1,x2,…,xn是样本观察值,则代入估计量中即可以得到一个关于参数θ 的估计值。
在不致混淆的情况下,我们把估计量或估计值简称为估计。
构造估计的方法很多,下面介绍三中常用的方法。
7.1.1 频率替换法假定在n次实验中,事件A发生了n A次,(n A / n)为A发生的频率,设P (A ) = p (0< p<1),则由概率论的大数定律:频率(n A / n)依概率收敛于事件A 发生的概率p,即对任意ε >0,成立,于是,当n较大时,(n A / n)与p非常接近,自然地取(n A / n)作为p的估计,.这种由频率估计相应的概率而得到的估计量的方法称为频率替换法。
例1 估计一批产品的次品率p。
设产品只区分正品与次品,分别以X取0和1表示产品为正品和次品,所以总体X服从参数为p的(0-1)分布,即p为未知的待估参数。
令事件A表示“产品为次品”,则p = P (A) = P (X=1)。
7 参数估计

3个抽样实验结果图示
均数
均数
5. 15 5. 36 5. 57 5. 77 5. 98 6. 19
频数 100 150 200 250 300 350 400 450 50 0
n = 30; SX = 0.0920
均数
3. 71 3. 92 4. 12 4. 33 4. 54 4. 74 4. 95 5. 15 5. 36 5. 57 5. 77 5. 98 6. 19
t= X −µ X −µ = SX S/ n t变 换
σX
N(0,1) 0 t(ν) (
X
0
t 分布与正态分布的比较
t 分布:形状与 分布:形状与N(0,1)相似, 相似, 相似 分布中间较小, 但t分布中间较小,两侧较大。 分布中间较小 两侧较大。
随着v增大, 分布逼近 随着 增大,t分布逼近 增大 分布逼近N(0,1); ; v ∞时,t分布演变成 时 分布演变成 分布演变成N(0,1)。 。
参数估计
parameter estimation
统计学
统计描述
统计推断
参数估计
假设检验
总体、 总体、个体和样本
总体(population):调查研究的事物或现象的全体 个体(item unit):组成总体的每个元素 样本(sample):从总体中所抽取的部分个体 样本容量(sample size):样本中所含个体的数量
总体参数
µ、σ、π
可信区间(confidence interval, CI) 可信区间
可信区间
均 数
率
方差
σ2 未知
σ2 已知
总体均数的估计
点估计: 点估计:point estimation 区间估计: 区间估计:interval estimation 样本统计量 点估计) (点估计)
概率论与数理统计第7章

x 0 , x 0 ,x 1 ,x 2 ,
,x n 为 总 体 X
的 一 个 样 本 ,则 未 知 参 数 的 矩 估 计 ˆ _ _ _ _ _ _ _ _ _ _ _ .
这个例子所作的推断已经体现了极大似然法 的基本思想 .
最大似然估计原理:
设X1,X2,…Xn是取自总体X的一个样本,样 本的联合密度(连续型)或联合分布律 (离散型)为
f (x1,x2,… ,xn ; ) .
当给定样本X1,X2,…Xn时,定义似然函数为:
L() f (x1, x2 ,…, xn; )
得
pˆ1Βιβλιοθήκη nn i 1xix
即为 p 的最大似然估计值 .
从而 p 的最大似然估计量为
p ˆ(X1,
1n ,Xn)ni1Xi X
求最大似然估计(MLE)的一般步骤是:
(1) 由总体分布导出样本的联合分布率(或联 合密度);
(2) 把样本联合分布率 ( 或联合密度 ) 中自变
量看成已知常数,而把参数 看作自变量,得到似然 函数L();
要求:领会
2.2 估计量的有效性、相合性, 要求:领会
3.区间估计
3.1 置信区间的概念,
要求:领会
3.2 求单个正态总体均值和方差的置信区间,要求:简单应用
参数估计
现在我们来介绍一类重要的统计推断问题
参数估计问题是利用从总体抽样得到的信息来估计总体 的某些参数或者参数的某些函数.
估计新生儿的体重
1 p
n
pxi (1p)1xi
i1
n
n
xi
n xi
pi1 (1p) i1
n
n
xi
n xi
L(p)pi1 (1p) i1
概率论与数理统计第7章参数估计PPT课件

a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,
第七章 参数估计

第三节 总体均数估计
估计总体平均数的步骤: 估计总体平均数的步骤: X与S 1、 计算样本 2、 计算 σ X 3、 确定置信水平或显著性水平并查表 4、计算置信区间 5、解释总体平均数的置信区间
一、正态估计法 , σ2已知 、
1、前题条件: 、前题条件:
总体正态, n不论大小 总体正态, n不论大小
点估计与区间估计的比较
定义: 定义
直接以样本统计量(数轴上的一个点) 点估计 :直接以样本统计量(数轴上的一个点) 作为总体参数的估计值
区间估计:按一定概率要求, 区间估计:按一定概率要求,根据样本统计量估 计总体参数可能落入的范围的一种统计方法。 计总体参数可能落入的范围的一种统计方法。也 就是说整体参数所落的有把握的范围 整体参数所落的有把握的范围。 就是说整体参数所落的有把握的范围。
D=0.95时 时
75.7 ≤ µ ≤ 81.3
5、解释:用样本1估计,总体的平均数落在 、解释:用样本1估计, 73.6-82.4之间的可能性为95%, 之间的可能性为95% 73.6-82.4之间的可能性为95%,超出这一范 围的可能性为5% 5%。 围的可能性为5%。 用样本2估计,总体的平均数落在76.7 80.3之 76.7用样本2估计,总体的平均数落在76.7-80.3之 间的可能性为95% 落在75.7 81.3的可能性为 95%, 75.7间的可能性为95%,落在75.7-81.3的可能性为 99%。 99%
X ± 2.58σ X
置信限:就是总体参数所落区间的上下界限。 置信限:就是总体参数所落区间的上下界限。即
X − 1.96σ X ≤ µ ≤ X + 1.96σ X
置信下限 置信上限
标准误
标准误(中心极限定理 ) 标准误(中心极限定理3)
概率论 第七章 参数估计

L( ) max L( )
称^为
的极大似然估计(MLE).
求极大似然估计(MLE)的一般步骤是:
(1) 由总体分布导出样本的联合概率分布 (或联合密度);
(2) 把样本联合概率分布(或联合密度)中自变 量看成已知常数,而把参数 看作自变量, 得到似然函数L( );
(3) 求似然函数L( ) 的最大值点(常常转化 为求ln L( )的最大值点) ,即 的MLE;
1. 将待估参数表示为总体矩的连续函数 2. 用样本矩替代总体矩,从而得到待估参
数的估计量。
四. 最大似然估计(极大似然法)
在总体分布类型已知条件下使用的一种 参数估计方法 .
首先由德国数学家高斯在1821年提出。 英国统计学家费歇1922年重新发现此
方法,并首先研究了此方法的一些性质 .
例:某位同学与一位猎人一起外出打猎.一只 野兔从前方窜过 . 一声枪响,野兔应声倒下 .
p值 P(Y=0) P(Y=1) P( Y=2) P(Y=3) 0.7 0.027 0.189 0.441 0.343 0.3 0.343 0.441 0.189 0.027
应如何估计p?
若:只知0<p<1, 实测记录是 Y=k
(0 ≤ k≤ n), 如何估计p 呢?
注意到
P(Y k) Cnk pk (1 p)nk = f (p)
第七章 参数估计
参数估计是利用从总体抽样得到的信息 估计总体的某些参数或参数的某些函数.
仅估 计一 个或 几个 参数.
估计新生儿的体重
估计废品率
估计降雨量
估计湖中鱼数
…
…
参数估计问题的一般提法:
设总体的分布函数为 F(x, ),其中为未 知参数 (可以是向量).从该总体抽样,得样本
第七章 参数估计

第七章 参数估计
1、正态总体、方差已知或非正态总体,大样本 当总体服从正态分布且方差已知时,或者总体不是正态分布但是大样本时,样本 均值的抽样分布均为正态分布,其数学期望为总体均值u,方差为Ϭ2/n。而样本均 值经过标准化以后的随机变量则服从标准正态分布,即 Z=(x-u)/(Ϭ/n0.5)~N(0,1) 根据上式和正态分布的性质可以得出总体均值u在1-α置信水平下的置信区间为: xα+是(-)事Z(α先/2)所(Ϭ确/n定0.5的)。而其一中个,概x率+Z值(α/2,) (Ϭ也/n称0.为5)为风置险信值上,限是,总x体-Z均(α/2值) (Ϭ不/包n0.含5)为在置置信信下区限间,的 概是率估;计1总- 体α称均为值置时信的水估平计,误Z差(α/。2) 是标准正态分布右侧面积为α/2的z值;Z(α/2) (Ϭ/n0.5) 也即是说,总体均值的置信区间由两个部分构成:点估计值和描述估计量精度的 +(-)值,这个+(-)值称为估计误差。
第七章 参数估计
在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
其中,区间的最小值称为置信下限,最大值称为置信上限。
由于统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名 为置信区间。原因是:如果抽取了许多不同的样本,比如说抽取100个样本,根据 每一个样本构造了一个置信区间,这样,由100个样本构造的总体参数的100个置 信区间中,有95%的区间包含了总体参数的真值,而5%则没有包含,则95%这个值 称为置信水平。一般,如果将构造置信区间的步骤重复多次,置信区间中包含总 体参数真值的次数所占的比例称为置信水平,也称为置信度或置信系数。
自然使用估计效果最好的那种估计量。什么样的估计量才算一个好的估计量呢? 统计学家给出了评价估计量的一些标准,主要包括以下几个:
概率论与数理统计-参数估计

第七章 参数估计
例:
引言
设总体 X 是服从参数为 的指数分布,其中参数
未 知 ,
0 .X1 ,,
X
是总体
n
X
的一个样本,
我们的任务是根据样本,来估计 的取值,从
而估计总体的分布.
这 是 一 个 参 数 估 计 问 题.
第七章 参数估计
§1 点估计 §2 估计量的评选标准 §3 区间估计
第七章 参数估计 §1 点估计
2
令
A1
A2
, (
2
1)
.
第七章 参数估计
例6(续)
解此方程组,得
§1 点估计
ˆ
A1 2 A2 A12
,
ˆ
A2
A1 A12
.
ˆ X 2 ,
即
B2
ˆ X .
B2
其中 B2
1 n
n i 1
Xi X
2 为样本的二阶中心矩.
第七章 参数估计(第二十二讲) 三、 极大似然法
§1 点估计
1
第七章 参数估计
例6(续)
EX 2 x 2 f
x dx x 2
x 1e x dx
0
§1 点估计
2 2 x ( e 2)1 x dx
2 0 2
2 2
1 2
1
2
因此有
EX
,
EX
2
1 .
⑵ 在不引起混淆的情况下,我们统称估计量
与估计值为未知参数 的估计.
第七章 参数估计
二、 矩估计法
§1 点估计
设X为连续型随机变量,其概率密度为
f ( x;1 ,, k ), X为离散型随机变量,其分布列为
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
练习 设总体X ~ e( ), X 1 , X 2 ,..., X n 是来自该 1 总体的一组样本,求的矩估计。
1 2 总体X的概率密度为f ( x, ) e , 0是未知 2 参数, ( X 1 ,, X n )是一组样本,求的矩估计.
解: 1 ( ) EX 0 1 2 ( ) EX x e dx 2 2 2 1 n 2 1 n 2 ˆ 令 2 2 X n 解得 Xn n i 1 2n i 1
称为样本的似然函数. 他是样本的联合密度函 数在一个观察值( x1 ,..., xn )处的函数值.
注:对似然函数而言, 它是待估参数的函数. 而样本是不变的.
对于离散型的总体X , 设它的分布律为 P{ X x} p( x; ), 其中 (1 , 2 , , s )
1 nI ( )
其中,I ( ) E[ ln f ( X , )] 2 , f ( X , )为总体概率分布。 I ( )称为Fisher 信息数。
ˆ ˆ 定义:为的任一无偏估计量,若D( )
1 , nI ( )
ˆ 则称为的有效估计量(达到方差界的无偏估计量) . 1 ˆ ˆ 若 lim D( ) 1, 则称为的渐近有效估计量. n nI ( )
解:EX , EX 2 DX ( EX ) 2 2 2 .
EX X 令 2 1 n 2 2 2 2 EX DX ( EX ) n X i i 1 ˆ X 解得 2 1 n 2 1 n X i ( X )2 ( X i X )2 ˆ n i 1 n i 1
对于给定的样本 X 1, X 2 , X n的 观测值( x1 , x2 ,..., xn ), 我们把 L( x1, x2 , xn ; ) p(X i xi ) p(xi ; )
i 1 i 1 n n
称为样本的似然函数.
统计分析是基于样本的随机性考虑的,因此, 我们 在似然函数中用( X 1 ,..., X n ). ˆ 定义 : 如果似然函数L( X 1, X 2 , X n ; )在取最大值, 即 ˆ ˆ L( ) L( X , X , X ; ) max L( X , X , X ; )
例5. 设X1, , X n为参数都未知的正态总体N ( , 2 ) 的一个样本, 证明X, S 为 , 的效估计。
2 n 2
( X )2 2 2
证明:f ( X ; , 2 )
1
1 2
e
1 ( X )2 2 ln f ln( ) ln 2 2 2 2
k E(X k ) g k (1 , 2 , s ).
1 n k P Ak Xi k , n i 1
1 n k 用样本矩A k X i 来代替 k , 得到方程组 : n i 1 k (1 ,..., k ) Ak , k 1,2,..., s.
练习. 设总体X ~ N(0, 2 ) 2 未知, 设X1 , X 2 , X n 是来自该总体的一组样本, 求 2的极大似然估计, 并证明它为无偏估计.
2 最小方差无偏估计
定义 : 设( X 1 , X 2 , , X n )是来自总体的一组样本, ˆ ( X , , X )是的无偏估计量, 若满足:
1 n
ˆ (1) E , , ˆ ˆ ˆ ˆ (2) D( ) D( ), 这里 ( X 1 , X 2 , , X n )为
的任意一个无偏估计量。
ˆ ˆ 则称 ( X 1 , X 2 , , X n )是的最小方差无偏估计量。
ˆ 克拉美 罗不等式:D( )
例2. 设总体X服从B( N , p)分布, p 1未知, 0 ( X 1 , X 2 ,..., X n )是一组来自总体的样本,求 p的矩估计。
解: 1 EX Np, 令 X ˆ 1 Np X可解得p N
例3.总体X ~ U [a, b], a, b未知, 1 , X 2 ,, X n )为来自总体 (X 的一组样本,求a, b的矩估计。
ˆ ˆ ˆ 解方程组求解出1 , 2 , , s .
例1. 设总体X ~ N( , 2 ), 但 , 2均未知, 设X1 , X 2 , X n 是来自该总体的一组样本, 求 , 2的极大似然估计.
解:)似然函数 (1 L( X 1 , , X n ; , )
(4)解方程组得 X ,
1 n ˆ ( X i X )2 n i 1
2
例2. 设总体X服从参数为的泊松分布, ( X 1 , X 2 ,..., X n )是一组来自总体的样本,求
的极大似然估计。
解:)似然函数 (1 L( X 1 , , X n ; )
解该方程组得 : ˆ j h(A 1 , A 2 , As ), j 1,2, , s ˆ 称 j为参数 j矩估计.
例1. 设总体X ~ N( , 2 ), , 2均未知, (X1 , X 2 , X n ) 从总体中抽取的一组样本, 求 , 2的矩估计.
第七章 参数估计
本章将学习: 1.点估计方法 a: 矩估计法; b: 最大似然估计法; c: 估计量的评选标准. 2.区间估计法:以正态分布总体为主.
§1. 点估计
一. 问题的提法:
设总体X的分布函数F(x; )的形式为已知, 是未 知参数, X 1 , X 2 , , X n 是X的一个样本。
ˆ (1)定义 : 设是的估计量, 如果当样本的容量 ˆ n 时, 依概率收敛于 , 即对 0,
n
ˆ lim P 1,
ˆ 则称 为的相合估计量.
如果D( X )存在, 则 X 是的相合估计量.
例6. 设X1, , X n为参数都未知的正态总体N ( , 2 ) 的一个样本, X, S 2 为 , 2的极大似然估计.证明它们 n 为相合估计。
1 无偏性:
ˆ ˆ (1)定义 : 若估计量 ( X 1 , , X n )的数学期望E ( )存在, 且对于 , 有 ˆ E ( ) , ˆ 则称是的无偏估计量.
(2)例子
X 是的无偏估计.
S2是σ2的无偏估计量.
(3) 有偏估计向无偏估计的转化。
例1:X 1 , X 2 ,, X n 是来自U [0, ]的一组样本, 构造的无偏估计量。
ˆ (4)解得 X
练习 设总体X ~ e( ), X 1 , X 2 ,..., X n 是来自该 总体的一组样本,求的极大似然估计。
例3. 设X服从[0,]区间上的均匀分布, 求的极大 似然估计和矩估计量.
解:)似然函数 (1 1 n , max{ X 1 , , X n } (定义域) L( X 1 , , X n ; ) 0, 其它
如何根据样本的信息去推断总体的分 布,现在就是推断参数 的值?
ˆ 点估计就是构造一个统计量 ( X 1 , X 2 , X n )估计 ˆ 未知参数 , 称 ( X , X , , X )为的估计量,.
1 2 n
二. 矩估计法:
设总体X ~ F(x; 1 , 2 , s ), 则X的k阶原点矩
ln f 2 1 1 1 2 2 I ( ) E[ ] E[ 2 ( X )] 4 E ( X ) 2
1 2 D( X ), 所以X是的有效估计。 nI ( ) n
作业 2 3 5 7 10 11 13 14 15
3 相合估计(一致估计):
ab a 2 ab b 2 解: 1 (a, b) EX , 2 ( a, b ) E ( X 2 ) 2 3
ab 令 1 (a, b) X 2 a 2 ab b 2 1 n 2 2 ( a, b) Xi 3 n i 1
3 n 3 n ˆ ˆ 解方程组得a X ( X i X )2 ,b X ( X i X )2 n i 1 n i 1
i 1 n
Xi
X i!
e
X i n 1 ( ) i 1 e i 1 X i !
n
n
n 1 (2) ln L ln( ) ln X i n i 1 i 1 X 程 Xi n 0 i 1
2 2 | x|
| x|
三. 极大似然估计方法:
设连续型的总体X ~ f (x; ), 其中 (1 , 2 , s ) 是未知参数, x1 , x2 ,..., xn 为一组样本,
L( x1, x2 , xn ; ) f ( xi ; )
i 1 n
1
ˆ ˆ 似然估计为 g( ).
例4. 设X1, , X n为参数都未知的正态总体N ( ,1)的一 个样本, 试求P{X t}的极大似然估计.
X- t- n n } ( n (t - )) 1 1 是的减函数, 有反函数. 解 P{X t} P{
§2. 估计量的评选标准
显然不能通过建立似然方程求得极大似然估计,L作为θ 的 函数当θ=max{X1,…Xn}时取得最大值,由极大似然估计的 定义可得
ˆ max{ X 1 , X n }
极大似然估计的性质:
设的函数 g( ), 具有单值反函数 g ( ), ˆ N , 又设是的极大似然估计, 则 g( )的极大
证明:由于 n 1
2 S n ~ 2 (n 1),所以
2
2 4 2 2 ES n 2 , DS n .由切比雪夫不等式, 对任意 0有 n 1