第七章 参数估计

合集下载

第七章参数估计

第七章参数估计

第七章参数估计对给定的统计问题,在建立了统计模型以后,我们的任务就是依据样本对未知总体进行各种推断,参数估计是统计推断的重要内容之一。

本章主要介绍进行参数估计的方法及其评价等。

7.1 点估计方法参数估计,就是要从样本出发去构造一个统计量作为总体中某未知参数的一个估计量。

若总体X的分布函数的形式为已知,但它的一个或多个参数未知,则由总体X的一个样本去估计总体未知参数的值的问题就是参数的点估计问题。

例如,某钢筋厂日生产某种型号钢筋10000根,为了要得知这批钢筋的强度,质量检察员从中抽取50跟进行检查。

如何从抽查的50根钢筋强度的数据去估计整批钢筋强度的平均值?这就是参数估计要解决的问题。

在实际问题中,我们常常以统计量作为总体X的期望值的估计量。

设总体X的分布函数为F (x,θ ),其中θ 为未知参数。

X1,X2, (X)为总体X的一个样本。

点估计的问题就是由样本构造一个统计量作为未知参数θ 的一个估计量。

若x1,x2,…,xn是样本观察值,则代入估计量中即可以得到一个关于参数θ 的估计值。

在不致混淆的情况下,我们把估计量或估计值简称为估计。

构造估计的方法很多,下面介绍三中常用的方法。

7.1.1 频率替换法假定在n次实验中,事件A发生了n A次,(n A / n)为A发生的频率,设P (A ) = p (0< p<1),则由概率论的大数定律:频率(n A / n)依概率收敛于事件A 发生的概率p,即对任意ε >0,成立,于是,当n较大时,(n A / n)与p非常接近,自然地取(n A / n)作为p的估计,.这种由频率估计相应的概率而得到的估计量的方法称为频率替换法。

例1 估计一批产品的次品率p。

设产品只区分正品与次品,分别以X取0和1表示产品为正品和次品,所以总体X服从参数为p的(0-1)分布,即p为未知的待估参数。

令事件A表示“产品为次品”,则p = P (A) = P (X=1)。

概率论第七章 第1节

概率论第七章 第1节

根据样本概率最大原则,m的估计值为3。
最大似然估计法原理
一般地,不仿设总体X是离散型分布X~p(x,θ),如果 X1,X2,…,Xn是来自这个总体的一个随机样本,x1,x2,…,xn 是这个随机样本的样本值,则这个样本发生的概率为:
记这个概率为θ的函数:
16
最大似然估计法原理
如果在一次抽样中样本值x1,x2,…,xn出现了,我们就认为 它之所以出现是因为它发生的概率最大导致的。因此我们 就选择能使这个概率最大的那个θ作为θ的估计值,这就 是极大似然估计法。 “样本值概率最大原则”
矩估计法理论依据
命题2:设总体X的l=1,2,…,k阶矩存在即E(Xl)=μk,则l阶样 本矩A1,A2,…,Ak的连续函数g(A1,A2,…,Ak)也依概率收敛于总 体矩的连续函数即
根据这两个命题,我们使用如下方法来进行矩估计: (1)用样本矩A1,A2,…,Ak来估计总体矩; (2)用样本矩的连续函数g(A1,A2,…,Ak)来估计总体矩的连续 函数g(μ1,μ2,…,μk)。
砍掉充分小的dxi,记这 个概率为θ的函数:
30
连续型总体中参数 θ的似然函数!
最大似然估计值 最大似然估计量
怎样求最大值点?
基于此通常先取对数,再求最大值点。
化成求 对数似 然函数 的最大 值点!
如果对数似然函数二阶可导,并且概率 密度函数是单峰函数,则驻点就是最大 值点!通过求一阶导数能得驻点:
第七章 参数估计
1、什么是参数估计? 当总体的分布类型已知,但其中仍有未知参数。比如总体 X服从参数μ,σ2的正态分布,但μ,σ2未知。但是我们 能根据来自总体X的一个简单随机样本X1,X2,…,Xn通过适 当的方法对这些未知参数进行估计,得到它的一个近似值 或近似区间。 2、参数估计有哪些形式? (1)点估计:矩估计法、极大似然估计法。 (2)区间估计:正态总体下区间估计法。

概率论与数理统计第7章参数估计PPT课件

概率论与数理统计第7章参数估计PPT课件
5
a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,

chap7参数估计.ppt

chap7参数估计.ppt

若p的可供选择的估计值有许多,仍应选择发生概率最大的 p
作为p的估计,这就是极大似然估计的思想。
极大似然估计的原理(教材p180-181)
设总体X的概率密度函数族为f(x; ) (或概率分布函数族为
P(X=x)=p(x ; ) ),。
设 (x1,x2, ,xn ) 为任一组样本观察值(一组抽象的数),则
求的矩估计值和极大似然估计值。
说明:1. 本题中因 P(X= xi )无一般表达式,故不能先求极大
似然估计量,再将样本观察值代入求极大似然估计值。
2. 本题处理思想在解决实际问题时很有用。
极大似然估计的性质:若 为总体X中未知参数的极大似
然估计量,u=u( ) 有单值反函数 = (u),则u( )是u( ) 的
k
k次着n火k天数 75 90 54 22
6
2
1 =
250
1) 试用矩估计法估计参数; 2) 试用极大似然估计法估计参数; 3) 试求P(X=0)的极大似然估计值。
例2(2002年数学三考研试题填空题)
设总体X的概率密度为 f (x;
)
e
, ( x ) 0,
若x 若x
, .
而 X1,X 2, ,X n 是来自总体X的简单随机样本,则未知
大似然估计值。
求L()的极大值 :
通过
d
ln
L(
)
0,求出

d
说明:1. 因为L()是样本观察值的函数(此时样本观察值不变),
故求出的 一般也是样本观察值的函数。
2. 由于 d ln L( ) 0 只是lnL()取极值的必要条件,从理论上
d
来说,还应验证lnL( ) lnL(), 对所有样本观察值都

第七章 参数估计

第七章   参数估计

第三节 总体均数估计
估计总体平均数的步骤: 估计总体平均数的步骤: X与S 1、 计算样本 2、 计算 σ X 3、 确定置信水平或显著性水平并查表 4、计算置信区间 5、解释总体平均数的置信区间
一、正态估计法 , σ2已知 、
1、前题条件: 、前题条件:
总体正态, n不论大小 总体正态, n不论大小
点估计与区间估计的比较
定义: 定义
直接以样本统计量(数轴上的一个点) 点估计 :直接以样本统计量(数轴上的一个点) 作为总体参数的估计值
区间估计:按一定概率要求, 区间估计:按一定概率要求,根据样本统计量估 计总体参数可能落入的范围的一种统计方法。 计总体参数可能落入的范围的一种统计方法。也 就是说整体参数所落的有把握的范围 整体参数所落的有把握的范围。 就是说整体参数所落的有把握的范围。
D=0.95时 时
75.7 ≤ µ ≤ 81.3
5、解释:用样本1估计,总体的平均数落在 、解释:用样本1估计, 73.6-82.4之间的可能性为95%, 之间的可能性为95% 73.6-82.4之间的可能性为95%,超出这一范 围的可能性为5% 5%。 围的可能性为5%。 用样本2估计,总体的平均数落在76.7 80.3之 76.7用样本2估计,总体的平均数落在76.7-80.3之 间的可能性为95% 落在75.7 81.3的可能性为 95%, 75.7间的可能性为95%,落在75.7-81.3的可能性为 99%。 99%
X ± 2.58σ X
置信限:就是总体参数所落区间的上下界限。 置信限:就是总体参数所落区间的上下界限。即
X − 1.96σ X ≤ µ ≤ X + 1.96σ X
置信下限 置信上限
标准误
标准误(中心极限定理 ) 标准误(中心极限定理3)

概率论 第七章 参数估计

概率论  第七章 参数估计

L( ) max L( )
称^为
的极大似然估计(MLE).
求极大似然估计(MLE)的一般步骤是:
(1) 由总体分布导出样本的联合概率分布 (或联合密度);
(2) 把样本联合概率分布(或联合密度)中自变 量看成已知常数,而把参数 看作自变量, 得到似然函数L( );
(3) 求似然函数L( ) 的最大值点(常常转化 为求ln L( )的最大值点) ,即 的MLE;
1. 将待估参数表示为总体矩的连续函数 2. 用样本矩替代总体矩,从而得到待估参
数的估计量。
四. 最大似然估计(极大似然法)
在总体分布类型已知条件下使用的一种 参数估计方法 .
首先由德国数学家高斯在1821年提出。 英国统计学家费歇1922年重新发现此
方法,并首先研究了此方法的一些性质 .
例:某位同学与一位猎人一起外出打猎.一只 野兔从前方窜过 . 一声枪响,野兔应声倒下 .
p值 P(Y=0) P(Y=1) P( Y=2) P(Y=3) 0.7 0.027 0.189 0.441 0.343 0.3 0.343 0.441 0.189 0.027
应如何估计p?
若:只知0<p<1, 实测记录是 Y=k
(0 ≤ k≤ n), 如何估计p 呢?
注意到
P(Y k) Cnk pk (1 p)nk = f (p)
第七章 参数估计
参数估计是利用从总体抽样得到的信息 估计总体的某些参数或参数的某些函数.
仅估 计一 个或 几个 参数.
估计新生儿的体重
估计废品率
估计降雨量
估计湖中鱼数


参数估计问题的一般提法:
设总体的分布函数为 F(x, ),其中为未 知参数 (可以是向量).从该总体抽样,得样本

第七章 参数估计

第七章 参数估计

第七章 参数估计
1、正态总体、方差已知或非正态总体,大样本 当总体服从正态分布且方差已知时,或者总体不是正态分布但是大样本时,样本 均值的抽样分布均为正态分布,其数学期望为总体均值u,方差为Ϭ2/n。而样本均 值经过标准化以后的随机变量则服从标准正态分布,即 Z=(x-u)/(Ϭ/n0.5)~N(0,1) 根据上式和正态分布的性质可以得出总体均值u在1-α置信水平下的置信区间为: xα+是(-)事Z(α先/2)所(Ϭ确/n定0.5的)。而其一中个,概x率+Z值(α/2,) (Ϭ也/n称0.为5)为风置险信值上,限是,总x体-Z均(α/2值) (Ϭ不/包n0.含5)为在置置信信下区限间,的 概是率估;计1总- 体α称均为值置时信的水估平计,误Z差(α/。2) 是标准正态分布右侧面积为α/2的z值;Z(α/2) (Ϭ/n0.5) 也即是说,总体均值的置信区间由两个部分构成:点估计值和描述估计量精度的 +(-)值,这个+(-)值称为估计误差。
第七章 参数估计
在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
其中,区间的最小值称为置信下限,最大值称为置信上限。
由于统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名 为置信区间。原因是:如果抽取了许多不同的样本,比如说抽取100个样本,根据 每一个样本构造了一个置信区间,这样,由100个样本构造的总体参数的100个置 信区间中,有95%的区间包含了总体参数的真值,而5%则没有包含,则95%这个值 称为置信水平。一般,如果将构造置信区间的步骤重复多次,置信区间中包含总 体参数真值的次数所占的比例称为置信水平,也称为置信度或置信系数。
自然使用估计效果最好的那种估计量。什么样的估计量才算一个好的估计量呢? 统计学家给出了评价估计量的一些标准,主要包括以下几个:

概率论与数理统计-参数估计

概率论与数理统计-参数估计

第七章 参数估计
例:
引言
设总体 X 是服从参数为 的指数分布,其中参数
未 知 ,
0 .X1 ,,
X
是总体
n
X
的一个样本,
我们的任务是根据样本,来估计 的取值,从
而估计总体的分布.
这 是 一 个 参 数 估 计 问 题.
第七章 参数估计
§1 点估计 §2 估计量的评选标准 §3 区间估计
第七章 参数估计 §1 点估计
2

A1
A2
, (
2
1)
.
第七章 参数估计
例6(续)
解此方程组,得
§1 点估计
ˆ
A1 2 A2 A12
,
ˆ
A2
A1 A12
.
ˆ X 2 ,

B2
ˆ X .
B2
其中 B2
1 n
n i 1
Xi X
2 为样本的二阶中心矩.
第七章 参数估计(第二十二讲) 三、 极大似然法
§1 点估计
1
第七章 参数估计
例6(续)
EX 2 x 2 f
x dx x 2
x 1e x dx
0
§1 点估计
2 2 x ( e 2)1 x dx
2 0 2
2 2
1 2
1
2
因此有
EX
,
EX
2
1 .
⑵ 在不引起混淆的情况下,我们统称估计量
与估计值为未知参数 的估计.
第七章 参数估计
二、 矩估计法
§1 点估计
设X为连续型随机变量,其概率密度为
f ( x;1 ,, k ), X为离散型随机变量,其分布列为
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
p 380 400 ´ 100% 95%
p
P (1 P )
n

95%( 1 95%)
400
1.09%
在概率 95.45%的保证下,全及一级品 率: P p ± p ~ 95% ±2 ´ 1.19% 92.82% × 97.18%

n
, xZ

/2
n
)= (x x , x x ) )= (30.02,
=( 30.2 0.1764 30.38)
30.2 0.1764

即我们可以以95%的概率保证该厂零件平均长度在 30.02厘米到30.38厘米之间
2.总体方差未知时总体均值的区间估计
S 代替,但新的统 **总体方差 2 未知,可以以样本方差 n -1 t 计量不服从标准正态分布,而是服从自由度为 的 分布
( x t / 2
S n 1 n S n 1 n
, x t / 2

= (x x , x x ) =(5-0.859,5+0.859) =(4.14,5.86) 即我们可以以95%的把握保证该市高中生每周平 均看电视时间在4.14到5.86小时之间。
(二)总体比例的区间估计
一、点估计
(二)矩估计法的评价
优点:
一、 计算简便直观,一般不考虑抽样误差和可靠程
度 二、适用于对估计准确与可靠程度要求不高的情况 局限性: 一、它要求总体矩存在 二、不能充分利用估计时已掌握的有关总体分布的 信息
(三)应用例题
[例7-1] 某厂对所生产的电子元件抽取5%进行抽样调 查,计算出样本的平均耐用时间为4 340小时,样本合 格率为98%。根据矩估计法原理,估计该厂所生产的电 子元件的平均耐用时间和合格率。
例题分析
[例7-4] 某厂对一批产成品按不重复抽样方法随机抽选 200件进行质量检测,其中一等品160件,试以90%的概 率估计一等品率的范围 已知:p 160 80 % ,1- =90%, n =200
200
查表知: Z / 2 =1.645 计算得样本比例的抽样平均误差为:
( p)
练习1: 某农场进行小麦产量的抽样调查,该农场小麦播 种面积为10 000亩,采用不重复的简单随机抽样从中 选100亩作为样本,进行实割实测,得到样本的平均亩 产量为400千克,样本标准差为12千克。则:
n N 100 10000 ( 2 ) 若以概率 95.45%(t 2) 保证,该农场 10000 亩小麦的平均 亩产量的可能范围为: X x ± x 400 ±2 × 1 .19 397 .62 ~ 40 2.38( 千克 ) (3) 若以概率 99.73%(t 3) 保证,该农场 10000 亩小麦的平均 亩产量的可能范围为: X 400 ±3 × 1 .19 396 .43 ~ 40 3.57( 千克 )
区间估计的应用
(一)总体均值的区间估计
1.总体方差已知时 2 X ~ N ( 当 ,
x1 , x2 ,, xn )时,来自该总体的简单随机样本
的样本均值服从数学期望为 、方差 2 为的正态分布,将样本均值统计 量 x 标准化,得到 Z 统计量
Z
1-
x
的置信度下的置信区间为:
2
t / 2 (n 1) =0.05时,临界值
4.33 0.416 25
t 0.025= (25 1)
抽样平均误差 ( x) Sn1
n
抽样允许误差 x t / 2
S n 1 2.0639 0.416 0.859 n
解题过程(二)
(2)总体均值置信度为95%的置信区间为:
(1 ) x
2
(1
n
)
12
2
(1
100
) 1 .19 ( 千克 )
练习2: 某机械厂日产某种产品8 000件,现采用纯随机不 重复抽样方式(按重复抽样公式计算),从中抽取400件 进行观察,其中有380件为一级品,试以概率95.45%的 可靠程度推断全部产品的一级品率及一级品数量的范 围。则:抽样一级品率:
2
t / 2 (n 1) ,可查t 分布表确定临界值 **给定置信度1-
从而总体均值的置信区间为:
( x t
其中,
S n 1 n ( x)
S n1
/2
n
S n1 , x t / 2 n

即为抽样平均误差
即为抽样允许误差
t / 2
S n 1 n
x
上式也可表示为:
x Z / 2 根据区间估计的定源自,在给定的显著性水平n
, x Z / 2
/ n
~ N (0,1)
下,总体均值



n
),即 x x x x

n
/2
其中, 误差
n
( x)
即抽样平均误差 , Z

即抽样允许
x
1.总体方差已知时总体均值的区间估计
(二)抽样估计的置信度与精确度 **
2.抽样估计的精确度:用置信区间的大小即抽样极
限/允许误差来表示
3.抽样估计的置信度与精确度的矛盾关系
在样本容量和其他条件一定的情况下, 若希望抽样估计有较高的可靠度,则必须扩大置信区 间,即必须降低估计的精确度 若希望抽样估计有较高的精确度,即置信区间范围缩 小,则必须降低估计的把握度 即:抽样估计要求的把握度越高,则抽样允许误差越 大,精确度越低;反之则相反 **思考:在抽样调查中,如何同时提高抽样估计的精 确度和把握度?
例题应用
[例7-3] 某厂生产的零件长度服从正态分布,从该 厂生产的零件中随机抽取25件,测得它们的平均长度 为30.2厘米。已知总体标准差 =0.45厘米 要求:(1)计算抽样平均误差和抽样允许误差 =0.05) (2)估计零件平均长度的可能范围(
0.452 ), x =30.2, n =25, 已知: X ~ N ( , 1- =0.95
解题过程(一) 已知: n =25,
样本均值 样本方差
x
=0.05
1 2 3 6 5 8 7 8 9 1 5(小时 ) 25
=4.33 (1)查 t 分布表知 2.063 9,因此,
(1- 5)2 2 (3 - 5) 2 6 (5 - 5) 2 8 (7 - 5) 2 8 (9 - 5)2 1 s 25 - 1
x x x x
例题应用 [例7-4] 从某市高中生中按不重复抽样方法随机抽取
25名调查每周收看电视的时间,分组资料见下表:
每周看电视时间(小时) 2 以下 2—4 4—6 6—8 8—10 合计 学生人数(人) 2 6 8 8 1 25
要求:(1)计算抽样平均误差和抽样允许误差 (2)估计该市全体高中生每周平均看电视时间 的置信区间(给定的显著性水平为0.05)
**在大样本下,样本比例的分布趋近于均值为 P 差为 P (1 P )
n
、方
的正态分布。因此,给定置信度1-
,查正态分布
表得 Z / 2
,则样本比例的抽样极限误差为:
p Z / 2 ( p)
所以,总体比例的置信度为1-
的置信区间为:
p p P p p
也即所估计的区间包含总体参数真实值的可能性大小, 一般以1- 表示。其中 表示显著性水平,即某一小 概率事件发生的临界水平 置信度通常采用三个标准: (1)显著性水平=0.05,即1- =0.95 (2)显著性水平=0.01,即1- =0.99 (3)显著性水平=0.001,即1- =0.999
解题过程
(1)抽样平均误差
( x)
n 0.45 25 0.09
Z / 2 =1.96,所以, 查标准正态分布表可知在 =0.05时,
抽样允许误差 Z 1.96 0.09 0.1764 /2 x n (2)总体均值的置信区间为: (
x Z / 2
第七章
参数估计
7.1 点估计
7.2 区间估计
一、点估计
(一)概念
1.点估计 设总体随机变量的分布函数已知,但它的一个或多 个参数未知,若从总体中抽取一组样本观察值,以该 组数据来估计总体参数,就称为参数的点估计
例如,在全部产品中,抽取100件进行仔细检 查,得到平均重量 x=1002 克,合格率 p=98% , 我们直接推断全部产品的平均重量 X=1002 克, 合格率P=98%。
解:点估计法是用样本指标直接作为总体指标的代表 值,所以,全部电子元件的平均耐用时间即为4 340小 时;总体合格率为98%
7.2 区间估计
(一)区间估计的概念
根据样本统计量以一定的可靠程度去估计总体参数 值所在的范围或区间,是抽样估计的主要方法
(二)抽样估计的置信度与精确度 1.置信度:表示区间估计的可靠程度或把握程度,
一、点估计
(一)概念
2.矩估计 矩估计法是用样本的矩去估计总体的矩,从而获得总 体有关参数的估计量的方法。矩是指以期望值为基础 定义的数字特征,如数学期望、方差、协方差等
由于区间估计所表示的是一个可能的范围,而不是一 个绝对可靠的范围。就是说,推断全及指标在这个范 围内只有一定的把握程度。用数学的语言讲,就是有 一定的概率。
p(1 p) n 80% (1 80%) 2.83% 200
p Z / 2 ( p) 1.645 2.83% 4.655% 抽样极限误差为:
所以,该批产品的一等品比例的置信区间为:
80% 4.655 % P 80% 4.655 %
即这批产品的一等品率在75.35% 到84.66% 之间。
相关文档
最新文档