第七章参数估计

合集下载

概率论第七章 第1节

概率论第七章 第1节

根据样本概率最大原则,m的估计值为3。
最大似然估计法原理
一般地,不仿设总体X是离散型分布X~p(x,θ),如果 X1,X2,…,Xn是来自这个总体的一个随机样本,x1,x2,…,xn 是这个随机样本的样本值,则这个样本发生的概率为:
记这个概率为θ的函数:
16
最大似然估计法原理
如果在一次抽样中样本值x1,x2,…,xn出现了,我们就认为 它之所以出现是因为它发生的概率最大导致的。因此我们 就选择能使这个概率最大的那个θ作为θ的估计值,这就 是极大似然估计法。 “样本值概率最大原则”
矩估计法理论依据
命题2:设总体X的l=1,2,…,k阶矩存在即E(Xl)=μk,则l阶样 本矩A1,A2,…,Ak的连续函数g(A1,A2,…,Ak)也依概率收敛于总 体矩的连续函数即
根据这两个命题,我们使用如下方法来进行矩估计: (1)用样本矩A1,A2,…,Ak来估计总体矩; (2)用样本矩的连续函数g(A1,A2,…,Ak)来估计总体矩的连续 函数g(μ1,μ2,…,μk)。
砍掉充分小的dxi,记这 个概率为θ的函数:
30
连续型总体中参数 θ的似然函数!
最大似然估计值 最大似然估计量
怎样求最大值点?
基于此通常先取对数,再求最大值点。
化成求 对数似 然函数 的最大 值点!
如果对数似然函数二阶可导,并且概率 密度函数是单峰函数,则驻点就是最大 值点!通过求一阶导数能得驻点:
第七章 参数估计
1、什么是参数估计? 当总体的分布类型已知,但其中仍有未知参数。比如总体 X服从参数μ,σ2的正态分布,但μ,σ2未知。但是我们 能根据来自总体X的一个简单随机样本X1,X2,…,Xn通过适 当的方法对这些未知参数进行估计,得到它的一个近似值 或近似区间。 2、参数估计有哪些形式? (1)点估计:矩估计法、极大似然估计法。 (2)区间估计:正态总体下区间估计法。

概率论与数理统计第7章参数估计PPT课件

概率论与数理统计第7章参数估计PPT课件
5
a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,

第七章 参数估计

第七章   参数估计

第三节 总体均数估计
估计总体平均数的步骤: 估计总体平均数的步骤: X与S 1、 计算样本 2、 计算 σ X 3、 确定置信水平或显著性水平并查表 4、计算置信区间 5、解释总体平均数的置信区间
一、正态估计法 , σ2已知 、
1、前题条件: 、前题条件:
总体正态, n不论大小 总体正态, n不论大小
点估计与区间估计的比较
定义: 定义
直接以样本统计量(数轴上的一个点) 点估计 :直接以样本统计量(数轴上的一个点) 作为总体参数的估计值
区间估计:按一定概率要求, 区间估计:按一定概率要求,根据样本统计量估 计总体参数可能落入的范围的一种统计方法。 计总体参数可能落入的范围的一种统计方法。也 就是说整体参数所落的有把握的范围 整体参数所落的有把握的范围。 就是说整体参数所落的有把握的范围。
D=0.95时 时
75.7 ≤ µ ≤ 81.3
5、解释:用样本1估计,总体的平均数落在 、解释:用样本1估计, 73.6-82.4之间的可能性为95%, 之间的可能性为95% 73.6-82.4之间的可能性为95%,超出这一范 围的可能性为5% 5%。 围的可能性为5%。 用样本2估计,总体的平均数落在76.7 80.3之 76.7用样本2估计,总体的平均数落在76.7-80.3之 间的可能性为95% 落在75.7 81.3的可能性为 95%, 75.7间的可能性为95%,落在75.7-81.3的可能性为 99%。 99%
X ± 2.58σ X
置信限:就是总体参数所落区间的上下界限。 置信限:就是总体参数所落区间的上下界限。即
X − 1.96σ X ≤ µ ≤ X + 1.96σ X
置信下限 置信上限
标准误
标准误(中心极限定理 ) 标准误(中心极限定理3)

概率论 第七章 参数估计

概率论  第七章 参数估计

L( ) max L( )
称^为
的极大似然估计(MLE).
求极大似然估计(MLE)的一般步骤是:
(1) 由总体分布导出样本的联合概率分布 (或联合密度);
(2) 把样本联合概率分布(或联合密度)中自变 量看成已知常数,而把参数 看作自变量, 得到似然函数L( );
(3) 求似然函数L( ) 的最大值点(常常转化 为求ln L( )的最大值点) ,即 的MLE;
1. 将待估参数表示为总体矩的连续函数 2. 用样本矩替代总体矩,从而得到待估参
数的估计量。
四. 最大似然估计(极大似然法)
在总体分布类型已知条件下使用的一种 参数估计方法 .
首先由德国数学家高斯在1821年提出。 英国统计学家费歇1922年重新发现此
方法,并首先研究了此方法的一些性质 .
例:某位同学与一位猎人一起外出打猎.一只 野兔从前方窜过 . 一声枪响,野兔应声倒下 .
p值 P(Y=0) P(Y=1) P( Y=2) P(Y=3) 0.7 0.027 0.189 0.441 0.343 0.3 0.343 0.441 0.189 0.027
应如何估计p?
若:只知0<p<1, 实测记录是 Y=k
(0 ≤ k≤ n), 如何估计p 呢?
注意到
P(Y k) Cnk pk (1 p)nk = f (p)
第七章 参数估计
参数估计是利用从总体抽样得到的信息 估计总体的某些参数或参数的某些函数.
仅估 计一 个或 几个 参数.
估计新生儿的体重
估计废品率
估计降雨量
估计湖中鱼数


参数估计问题的一般提法:
设总体的分布函数为 F(x, ),其中为未 知参数 (可以是向量).从该总体抽样,得样本

第七章 参数估计

第七章 参数估计

第七章 参数估计
1、正态总体、方差已知或非正态总体,大样本 当总体服从正态分布且方差已知时,或者总体不是正态分布但是大样本时,样本 均值的抽样分布均为正态分布,其数学期望为总体均值u,方差为Ϭ2/n。而样本均 值经过标准化以后的随机变量则服从标准正态分布,即 Z=(x-u)/(Ϭ/n0.5)~N(0,1) 根据上式和正态分布的性质可以得出总体均值u在1-α置信水平下的置信区间为: xα+是(-)事Z(α先/2)所(Ϭ确/n定0.5的)。而其一中个,概x率+Z值(α/2,) (Ϭ也/n称0.为5)为风置险信值上,限是,总x体-Z均(α/2值) (Ϭ不/包n0.含5)为在置置信信下区限间,的 概是率估;计1总- 体α称均为值置时信的水估平计,误Z差(α/。2) 是标准正态分布右侧面积为α/2的z值;Z(α/2) (Ϭ/n0.5) 也即是说,总体均值的置信区间由两个部分构成:点估计值和描述估计量精度的 +(-)值,这个+(-)值称为估计误差。
第七章 参数估计
在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
其中,区间的最小值称为置信下限,最大值称为置信上限。
由于统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名 为置信区间。原因是:如果抽取了许多不同的样本,比如说抽取100个样本,根据 每一个样本构造了一个置信区间,这样,由100个样本构造的总体参数的100个置 信区间中,有95%的区间包含了总体参数的真值,而5%则没有包含,则95%这个值 称为置信水平。一般,如果将构造置信区间的步骤重复多次,置信区间中包含总 体参数真值的次数所占的比例称为置信水平,也称为置信度或置信系数。
自然使用估计效果最好的那种估计量。什么样的估计量才算一个好的估计量呢? 统计学家给出了评价估计量的一些标准,主要包括以下几个:

第七章-参数估计

第七章-参数估计
的标准 • 1.无偏性 • 无偏估计量:用多个样本的统计量作为总体参数 的估计值,其偏差的平均数为0。
X 0
• 2.有效性
• 当总体参数的无偏估计不止一个统计量时,无偏
估计变异小者有效性高,变异大者有效性低,即 方差越小越好。
9 0.286 9 0.286 2 23.6 1.73
0.11 2 1.49
• 【例7-7】
• n=31,sn-1=5问的0.95置信区间?
• 解:先求方差的置信区间,当df=30,查χ2表,
2 0.025 47
2 0.975 16.8
2 30 52 30 5 2 47 16.8
正态分布,即Z0.05/2=1.96。
5 0.635 2 31
• 0.95的置信区间为:
5 1.96 0.635 5 1.96 0.635
3.76 6.24
• 二、方差的区间估计
• 根据χ2分布:
2
X X


2
2
2 2 n 1 sn ns 1
第七章 参数估计
思 考
• 例8-1:从某市随机抽取小学三年级学生50名,测 得平均身高为 140cm ,标准差 4 。试问该市小学 三年级学生的平均身高大约是多少?

例8-2:某教师用韦氏成人智力量表测80 名高三学生,M=105。试估计该校高三 学生智商平均数大约为多少?
什么是参数估计
当在研究中从样本获得一组数据后,如何通过 这组数据信息,对总体特征进行估计,也就是 如何从局部结果推论总体的情况,称为总体参 数估计。 • 参数估计: 样本 统计量
• 【例7-2】
• 有一个49名学生的班级,某学科历年考试成绩的

概率论与数理统计-参数估计

概率论与数理统计-参数估计

第七章 参数估计
例:
引言
设总体 X 是服从参数为 的指数分布,其中参数
未 知 ,
0 .X1 ,,
X
是总体
n
X
的一个样本,
我们的任务是根据样本,来估计 的取值,从
而估计总体的分布.
这 是 一 个 参 数 估 计 问 题.
第七章 参数估计
§1 点估计 §2 估计量的评选标准 §3 区间估计
第七章 参数估计 §1 点估计
2

A1
A2
, (
2
1)
.
第七章 参数估计
例6(续)
解此方程组,得
§1 点估计
ˆ
A1 2 A2 A12
,
ˆ
A2
A1 A12
.
ˆ X 2 ,

B2
ˆ X .
B2
其中 B2
1 n
n i 1
Xi X
2 为样本的二阶中心矩.
第七章 参数估计(第二十二讲) 三、 极大似然法
§1 点估计
1
第七章 参数估计
例6(续)
EX 2 x 2 f
x dx x 2
x 1e x dx
0
§1 点估计
2 2 x ( e 2)1 x dx
2 0 2
2 2
1 2
1
2
因此有
EX
,
EX
2
1 .
⑵ 在不引起混淆的情况下,我们统称估计量
与估计值为未知参数 的估计.
第七章 参数估计
二、 矩估计法
§1 点估计
设X为连续型随机变量,其概率密度为
f ( x;1 ,, k ), X为离散型随机变量,其分布列为

统计学第七章、第八章课后题答案

统计学第七章、第八章课后题答案

统计学复习笔记第七章 参数估计一、 思考题1. 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。

估计量也是随机变量。

如样本均值,样本比例、样本方差等。

根据一个具体的样本计算出来的估计量的数值称为估计值。

2. 简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。

(2)有效性:是指估计量的方差尽可能小。

对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。

(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。

3. 怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。

置信区间的论述是由区间和置信度两部分组成。

有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。

因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。

在公布调查结果时给出被调查人数是负责任的表现。

这样则可以由此推算出置信度(由后面给出的公式),反之亦然。

4. 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。

也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。

不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。

5. 简述样本量与置信水平、总体方差、估计误差的关系。

1. 估计总体均值时样本量n 为2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=▪ 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;▪ 与总体方差成正比,总体的差异越大,所要求的样本量也越大;▪ 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 e 2πσ
( xi − µ)2 − 2σ2
L( µ, σ ) = Π
2
n
i =1
1 e 2πσ
( xi − µ)2 − 2σ2
于是
1 2 −n 2 −n 2 = (2π ) (σ ) exp[− 2 2σ

i =1 n i =1
n
( xi − µ ) ]
2
n n 1 2 LnL = − ln(2π ) − ln σ − 2 2 2 2σ
为估计 µ : 我们需要构造出适当的样本的函数 T(X1,X2,…Xn) , 每当有了样本,就代入该函数中算出一个值, 每当有了样本,就代入该函数中算出一个值,用来 作为 µ的估计值 . T(X1,X2,…Xn) 称为参数 µ 的点估计量, 点估计量, 的一个点 把样本值代入T(X1,X2,…Xn) 中,得到 µ 的一个点 把样本值代入 估计值 .

1 n P X = ∑Xi E( X ) = µ → n i=1 1 n k P Ak = ∑Xi E( Xk ) = µk (k = 1,2,L ) → n i=1
P g( A , A2 ,L, Ak ) g( µ1, µ2 ,L, µk ) → 1
其中 g 为连续函数 .
这表明 , 当样本容量很大时 , 在统计上 , 可以用 这一事实导出矩估计法. 用样本矩去估计总体矩 . 这一事实导出矩估计法 定义 用样本原点矩估计相应的总体原点矩 , 又 用样本原点矩的连续函数估计相应的总体原点矩的 连续函数, 这种参数点估计法称为矩估计法 . 连续函数 这种参数点估计法称为矩估计法 矩估计法的具体做法如下: 矩估计法的具体做法如下 设总体的分布函数中含有k个未知参数 设总体的分布函数中含有 个未知参数 θ1,θ2 ,L,θk, 那么它的前k阶矩 那么它的前 阶矩 µ1, µ2 ,L, µk , 一般
ˆ L(θ ) = m L(θ ) ax
ˆ 而相应的统计量 称 θ θ 的最大似然估计值 . 而相应的统计量 为 $ θ( X1,K, Xn ) 称为 θ 的最大似然估计量 .
θ
两点说明: 两点说明: 1、求似然函数L( θ ) 的最大值点,可以应用 、求似然函数 的最大值点, 微积分中的技巧。由于ln(x)是 x 的增函数 lnL(θ) 微积分中的技巧。由于 是 的增函数, 与L( θ )在 θ的同一值处达到它的最大值,假定θ 在 的同一值处达到它的最大值, 是一实数, 是一实数,且lnL( θ)是 θ 的一个可微函数。通过 是 的一个可微函数。 求解方程: 求解方程:
µ1 = E( X ) = µ
µ2 = E X 2 = D( X ) + [E( X )]2 = σ2 + µ2
( )
总体矩
解得
µ = µ1
2 σ2 = µ2 − µ1
µ, σ2 的矩估计量为 于是
µ= A = X 1
1 n 2 1 n σ2 = A2 − A2 = ∑Xi − X 2= ∑( Xi − X )2 1 n i=1 n i=1
ln L( p) = ∑xi ln( p) + (n − ∑xi ) ln( 1− p)
i=1 i=1
n
n
求导并令其为0, 对p求导并令其为 , 求导并令其为
n d ln L( p) 1 n 1 = ∑xi − (n − ∑xi )=0 dp p i=1 1− p i=1

1 n ˆ p = ∑xi = x n i=1
的最大似然估计和矩估计. 求θ的最大似然估计和矩估计 的最大似然估计和矩估计 解: 当x1,x2,…xn为样本值时, 用求导方法无法最终确定 θ. 似然函数为 用定义直接来求 .
L(θ ) =
1
要使L(θ)达到最大,θ应最小,但它小不过 (n) , 达到最大, 应最小 但它小不过x 应最小, 要使 达到最大 故θ的最大似然估计为 θ = x(n) 的最大似然估计为 $ $ 另一方面,由于 由于EX=θ/2, 故矩估计为 θ = 2x 另一方面 由于 两者不同! 两者不同
2. 最大似然法
它是在总体类型已知条件下使用的一种参数估 计方法 . 高斯在 它首先是由德国数学家高斯 它首先是由德国数学家高斯在 1821年提出的 . 然而 这个方法常 年提出的 然而,这个方法常 归功于英国统计学家费歇 归功于英国统计学家费歇 . 费歇在 费歇在1922年重新发现了这 年重新发现了这 一方法, 一方法,并首先研究了这种方法 的一些性质 .
最大似然原理: 最大似然原理: 如果一个随机试验有若干 种可能的条件.若在一次试验中,结果A出现, 种可能的条件.若在一次试验中,结果A出现, 则一般认为试验条件对A出现有利.也就是说, 则一般认为试验条件对A出现有利.也就是说, 在试验的诸多可能条件中,认为使事件A 在试验的诸多可能条件中,认为使事件A发生 的概率最大的那种条件成立. 的概率最大的那种条件成立.
µ2 = E X
( ) = D( X) +[E( X)]
2
a+b 2
2
(b − a)2 (a + b)2 = + 12 4

a + b = 2µ1 2 b − a = 12( µ2 − µ1 )
2 a = µ1 − 3( µ2 − µ1 )
解得
b = µ1 + 3( µ2 − µ )
例5
2 2 设总体 X ~N( µ, σ ) , µ, σ 未知 . x1 ,K, xn
是来自 X 的样本值 , 试求 µ, σ2的最大似然估计量 . 解 X 的概率密度为
f ( x) = 1 2πσ e
− ( x−µ )2 2σ 2
, −∞< x < ∞
似然函数为
L( µ, σ ) = Π
2
n
i =1
L(p)= f (x1, x2,…, xn; p )
0 1 Xi ~ 1− p p
= ∏ p (1− p)
xi i=1
n
1−xi
n−∑xi ∑xi = pi=1 (1− p) i=1
n−∑xi ∑xi L( p) = pi=1 (1− p) i =1
n n
n
n
对数似然函数为 对数似然函数为:
ˆ θj = θj ( A , A ,L, Ak ) 1 2
j=1,2,…,k
矩估计量的观察值称为矩估计值 矩估计量的观察值称为矩估计值 .
例2
设总体 X 在 [ a , b ] 上服从均匀分布 ,
a , b 未知 . X1,K, Xn是来自 X 的样本 , 试求 a , b 的矩估计量 . 解 µ1 = E( X ) =
可以得到 θ的MLE .
d ln L(θ ) =0 dθ
是向量, 若θ 是向量,上述方程必须用方程组代替 . 2、用上述求导方法求参数的 、用上述求导方法求参数的MLE有时行不 有时行不 通,这时要用最大似然原理来求 .
下面举例说明如何求最大似然估计 例4 设X1,X2,…Xn是取自总体 X~B(1, p) 的一个 样本,求参数 的最大似然估计量 的最大似然估计量. 样本,求参数p的最大似然估计量 解:似然函数为: 似然函数为
即为 p 的最大似然估计值 . 最大似然估计量为 从而 p 的最大似然估计量为
1 n ˆ p( X1 ,K Xn ) = ∑Xi = X , n i =1
求最大似然估计(MLE)的一般步骤是: 的一般步骤是: 求最大似然估计 的一般步骤是 (1) 由总体分布导出样本的联合分布律 或联 由总体分布导出样本的联合分布律(或联 合密度); 合密度 (2) 把样本联合分布律 或联合密度 ) 中自变 把样本联合分布律( 量看成已知常数,而把参数 看作自变量,得到 得到似然 量看成已知常数 而把参数 θ 看作自变量 得到似然 函数L( 函数 θ); (3) 求似然函数 θ) 的最大值点 常常转化为 求似然函数L( 的最大值点(常常转化为 的最大值点) 的最大值点 ; 求ln L( θ)的最大值点 ,即 θ 的MLE; (4) 在最大值点的表达式中 用样本值代入就 在最大值点的表达式中, 得参数的最大似然估计值 得参数的最大似然估计值 .
二、寻求估计量的方法 1. 矩估计法 2. 极大似然法 3. 最小二乘法 4. 贝叶斯方法 ……
这里我们主要介绍前面两种方法 .
1. 矩估计法
矩估计法是英国统计学家K.皮尔逊 矩估计法是英国统计学家 皮尔逊 最早提出来的 . 由辛钦定理 , 有限, 若总体 X 的数学期望 E( X ) = µ 有限 则有
个参数的函数,记为 记为: 都是这 k 个参数的函数 记为:
µi = µi (θ1,θ2 ,L,θk )
从这 k 个方程中解出
i=1,2, … ,k j=1,2,…,k
θj = θj ( µ1, µ2 ,L, µk )
那么用诸 µi 的估计量 Ai 分别代替上式中的诸 µi , 即可得诸 θj 的矩估计量 :
第一节 参数的点估计
点估计概念 求估计量的方法
一、点估计概念
例1 已知某地区新生婴儿的体重 X ~ N µ, σ ,
(
2
)
( µ, σ 未知 )

个体重数据 随机抽查100个婴儿 ,得100个体重数据 个婴儿 随机抽查
10,7,6,6.5,5,5.2, …
据此, 据此,我们应如何估计 µ 和 σ 呢 ?
样本矩
矩法的优点是简单易行 并不需要事先知道总体 矩法的优点是简单易行,并不需要事先知道总体 是简单易行 是什么分布 . 缺点是 , 当总体类型已知时, 没有充分利用分 缺点 是 当总体类型已知时 , 一般场合下,矩估计量不具有唯一性 布提供的信息 . 一般场合下 矩估计量不具有唯一性 . 其主要原因在于建立矩法方程时, 其主要原因在于建立矩法方程时,选取哪些总体 矩用相应样本矩代替带有一定的随意性 .
相关文档
最新文档