叶宏概率统计6.3
点估计的评价标准

第三讲点估计的评价标准副教授主讲教师叶宏在前两讲中我们介绍了两种点估计法,发现了点估计的不唯一性,即对于同一个未知参数,不同的方法得到的估计量可能不同,于是提出问题:应该选用哪一种估计量?用何标准来评价一个估计量的好坏?常用标准(1) 无偏性(3) 一致性(2) 有效性这一讲我们介绍估计量是随机变量,对于不同的样本值会得到不同的估计值. 我们希望估计值在未知参数真值附近摆动,而它的期望值等于未知参数的真值. 这就导致无偏性这个标准.(1) 无偏性θθ=)ˆ(E 则称为的无偏估计.θˆθ),,(ˆ1n X X θ设是未知参数的估计量,若θ.真值∙∙∙∙∙∙∙∙∙∙∙∙∙∙),,,(21n X X X 是总体X 的样本,证明: 不论X 服从什么分布(但期望存在),是k μ的无偏估计量.证∑∑====n i k i n i k i k X E n X n E A E 11)(1)1()(例设总体X 的k 阶矩)(k k X E =μ存在,因而ni X E k k i ,,2,1)( ==μ由于k k n n μμ=⋅⋅=1∑==n i k i k X n A 11特别地样本二阶矩∑==n i i X n A 1221是总体二阶矩是总体期望E ( X ) 的X 样本均值无偏估计量)(22X E =μ的无偏估计量例设总体X 的期望与方差存在,X 的样本为),,,(21n X X X (1) 不是D ( X )的无偏估计; ∑=-=n i i n X X n S 122)(1(2) 是D ( X ) 的无偏估计. ∑=--=n i i X X n S 122)(11原样本方差样本修正方差2221)(σσ≠-=nn S E n ()22σ=S E 2221lim ()lim n n n n E S nσσ→∞→∞-==是D ( X )的渐进无偏估计2n S无偏估计以方差小者为好, 这就引进了有效性的概念12ˆˆ,θθ一个参数往往有不止一个无偏估计, 若θ都是参数的无偏估计量,我们可以比较的大小来决定谁更优.21)ˆ(θθ-E 和22)ˆ(θθ-E 211)ˆ()ˆ(θθθ-=E D 由于222)ˆ()ˆ(θθθ-=E D (2) 有效性(2) 有效性D ( )< D ( )2ˆθ1ˆθ则称较有效.2ˆθ1ˆθ都是参数的无偏估计量,若有),,(ˆ11n X X θ),,(ˆˆ122n X X θθ==1ˆθ设和θ*1ˆˆ()()D D θθ≤*ˆθ是的任一无偏估计.θ则称为的最小方差无偏估计.θθˆ若321232111254131ˆ)(31ˆX X X X X X ++=++=μμ都是μ的无偏估计量1ˆμ最有效例如X ~ N ( μ,σ2) ,样本是.,,321X X X μμμ==)ˆ()ˆ(21E E 22217225)ˆ(31)ˆ(σμσμ=<=D D 推广i n i i X c ∑==1ˆμ是μ的无偏估计量X X c i ni i 中∑==1ˆμ最有效11n i i c ==∑当时ˆlim ()1n P θθε→∞-<=则称θˆ是参数θ的一致(或相合)估计量.(3) 一致性(相合性)即,0>∀ε一致性估计量仅在样本容量n 足够大时,才显示其优越性.定义设是总体参数θ),,,(ˆˆ21n X X X θθ=θˆ的估计量. 若n →∞时, 依概率收敛于θ,关于一致性的常用结论样本k 阶矩是总体k 阶矩的一致性估计量由大数定律可证明矩法得到的估计量一般为一致估计量为方便鉴别有效性,引进定理: 1lim (),lim ()(,,0)n n nn n n n X X E D θθθθθθ→∞→∞=== 设是未知参数的估计量,若定理 n θθ则是的一个相合估计量.212221~(,),,,1()1n n i i X N X X X S X X n μσσ==--∑ 设总体是的样本则是的一致例估计量.22211()1ni i S X X n σ==--∑是的一致估计量.证明2222(1)(1)1,2(1)n S n S E n D n σσ⎛⎫⎛⎫--=-=- ⎪ ⎪⎝⎭⎝⎭()222lim (),lim 0n n E S D S σ→∞→∞⇒==222(1)~(1)n S n χσ-- ()()42222,1E S D S n σσ=∴=-由卡方分布性质知。
概率论与数理统计A,教学大纲

概率论与数理统计A,教学大纲第一篇:概率论与数理统计A,教学大纲概率论与数理统计AProbability & Statistics A课程编码:09A00210 学分:3.5 课程类别:专业基础课计划学时:56其中讲课:56 实验或实践:0 上机:0 适用专业:部分理工类、经济、管理类学院各专业,主要有信息学院、机械学院、电气自动化、土建学院、资环学院、商学院、物理学院等。
推荐教材:杨殿武苗丽安主编,《概率论与数理统计》,科学出版社,2014年;参考书目:浙江大学盛骤主编,《概率论与数理统计》,高等教育出版社,2009年;吴赣昌主编,《概率论与数理统计》,中国人民大学出版社,2006年。
课程的教学目的与任务本课程是大部分理工科、管理、经济类各专业的专业基础课程,课程内容侧重于讲解概率论与数理统计的基本理论与方法,同时在教学中结合各专业的特点介绍性地给出在各领域中的具体应用。
课程的任务在于通过本课程的学习,要使学生获得:随机事件与概率、一元与多元随机变量及其分布、随机变量的数字特征;、数理统计的基本概念、参数估计与假设检验等方面的基本概念、基本理论和基本运算技能,培养学生抽象思维能力、逻辑推理能力以及运用数学知识分析问题和解决随机问题的能力,提高学生的数学素质和解决实际问题的能力。
课程的基本要求(一)概率论基础掌握古典概型、几何概型的计算;掌握全概率公式及贝叶斯公式的运用及独立性。
(二)随机变量及其分布掌握一维离散型和连续型随机变量的概率分布的计算及一维随机变量的函数的分布。
(三)多维随机变量及其分布1、掌握二维离散型随机变量的概率分布及二维连续型随机变量的概率密度的性质。
2、掌握二维离散和连续型随机变量的边缘分布和随机变量的独立性及二维随机变量的函数的分布。
(四)随机变量的数字特征1、掌握数学期望、方差的性质及运算;掌握六种常见分布的数学期望和方差。
2、掌握协方差及相关系数的性质及相关性。
考研数学一概率统计讲义参考书目

《考研数学一概率统计讲义参考书目》一、引言在考研数学一科目中,概率统计是一个重要的部分。
掌握好概率统计知识对于考研数学一的学习至关重要。
为了更好地学习概率统计,参考一些优质的讲义和参考书目是必不可少的。
在本文中,我将为大家推荐一些值得参考的概率统计讲义和书目,并对它们进行全面评估,以便帮助大家更好地理解和掌握概率统计知识。
二、深度和广度的要求在选择讲义和书目时,我们不仅要考虑内容的深度,还要考虑其广度。
因为概率统计这一科目涉及的知识非常广泛,深度和广度并重才能更好地帮助我们学习和掌握这一领域的知识。
三、推荐的参考书目1.《概率论与数理统计》(第四版)王金喜2.《概率论与数理统计教程》(第三版)吴喜丰、刘燕华3.《数理统计学》(第二版)苏镇宇4.《概率论与数理统计》(第五版)郝成秋、顾孟迪四、全面评估(1)《概率论与数理统计》(第四版)王金喜这本讲义从概率论和数理统计的基本概念开始,逐步深入,结构清晰,适合初学者。
但在部分内容的深度方面可能不够,建议结合其他书目进行学习。
(2)《概率论与数理统计教程》(第三版)吴喜丰、刘燕华该教程内容广泛,深度适中,适合广大学生参考。
但在一些难度较大的问题上可能需要额外的拓展和讨论。
(3)《数理统计学》(第二版)苏镇宇这本书在数理统计方面的内容比较突出,但概率论方面的内容可能有所欠缺。
建议结合其他书目进行学习,以便全面掌握概率统计知识。
(4)《概率论与数理统计》(第五版)郝成秋、顾孟迪该书深入浅出,内容全面,适合学习者从简到繁地掌握概率统计知识。
在内容上对概率统计的深度和广度都有较好的覆盖,是一本值得推荐的参考书目。
五、总结和回顾通过对以上书目的评估,我们可以看出每本书都有其优点和不足之处。
在学习概率统计这一科目时,我们应该多方参考,结合自身情况选择适合自己的学习材料。
要注重概率统计知识的深度和广度,从简到繁地逐步学习,以便更好地掌握这一领域的知识。
六、个人观点和理解对于概率统计这一科目,我个人认为要注重理论与实践相结合。
叶宏工程硕士第5章-1

1
3. 二维连续型随机变量
定义 设二维 r.v.( X ,Y )的分布函数为 F(x ,y),若存在非负可积函数 f (x,y) ,
使得对于任意实数 x , y 有
F ( x, y )
f (u, v)dvdu
x
y
则称( X ,Y ) 为二维连续型 r.v. f (x,y) 为( X ,Y ) 的联合概率密度函数 简称概率密度函数简记 p.d.f.
x x
y y=x y=x2 o 1 x
1 0
1 4
常用连续型二维随机变量分布
区域G 上的均匀分布,记作U ( G )
G 是平面上的有界区域, 面积为 A 若r.v.( X ,Y ) 的联合 d.f. 为
1 / A , ( x, y ) G f ( x, y ) 其他 0,
则称( X ,Y )服从区域G上的均匀分布
1, 若第 1次取出的是红球 X 0 , 若第 1次取出的是白球
1, 若第 2 次取出的是红球 Y 0 , 若第 2 次取出的是白球
, .
, .
(1)有放回抽样
X
0
Y
0
4 25 6 25
1
6 25 9 25
1
(2)不放回抽样
X
0
Y
0
2 15 4 15
1
4 15 5 15
F (x0 , y0) = F (x0 , y0 + 0 )
2. 二维离散型 r.v.及其概率分布 定义 若二维 r.v.(X ,Y )所有可能的取值
为有限多个或无穷可列多个, 则称 (X ,Y ) 为二维离散型 r.v.
要描述二维离散型 r.v.的概率特 性及其与每个 r.v.之间的关系常用其 联合分布律和边缘分布律
切比雪夫不等式与大数定律

第六讲切比雪夫不等式与大数定律主讲教师叶宏副教授概率论与数理统计的研究内容是随机现象的统计规律性,而随机现象的规律性是通过大量的重复试验才呈现出来的.研究大量的随机现象,常常采用极限方法,利用极限定理进行研究. 极限定理的内容很广泛,其中最重要的有两种:大数定律与中心极限定理.设随机变量X 的期望E (X )与方差D (X )存在,则对于任意实数ε> 0,2)()|)((|εεX D X E X P ≤≥-切比雪夫不等式或2)(1)|)((|εεX D X E X P -≥<-理论价值证明大数定律等等实用价值估计概率例已知正常男性成人血液中,每一毫升白细胞数平均是7300,均方差是700 . 利用切比雪夫不等式估计每毫升白细胞数在5200~9400之间的概率.解:设每毫升白细胞数为X ,则EX =7300, DX =7002≤P (5200 X 9400)≤= P (-2100 X -E (X ) 2100)≤≤= P ( |X -E (X )| 2100)≤≤=P (5200-7300 X -7300 9400-7300)≤2)2100()(1X D -≥98911=-=估计每毫升白细胞数在5200~9400之间的概率不小于8/92)(1)|)((|εεX D X E X P -≥<-2)()|)((|εεX D X E X P ≤≥-22140.5{6}_____X Y P X Y +≥≤例设随机变量和的数学期望分别为-和,方差分别为和,而相关系数为-,则{6}{()()6}P X Y P X Y E X Y +≥=+-+≥由切比雪夫不等式()()()220,E X Y E X E Y +=+=-+=解: ()()()2cov(,)D X Y D X D Y X Y +=++()()2()()3XY D X D Y D X D Y ρ=++=2()1612D X Y +≤=大数定律大量的随机现象中平均结果的稳定性大数定律的客观背景:大量抛掷硬币正面出现频率伯努利大数定律设n A 是n 次独立重复试验中事件A 发生的次数, p 是每次试验中A 发生的概率,则0>∀ε有0lim =⎪⎭⎫ ⎝⎛≥-∞→εp n n P A n 或1lim =⎪⎭⎫ ⎝⎛<-∞→εp n n P A n 依概率收敛频率p伯努利大数定律的意义理论价值给概率的统计定义提供了理论依据在概率的统计定义中, 事件A发生的频率“稳定于”事件A在一次试验中发生的概率实用价值如命中率等在n足够大时, 可以用频率近似代替p. 这种稳定称为依概率稳定.切比雪夫大数定律且具有相同的数学期望和方差,2,1,)(,)(2===k X D X E k k σμ则0>∀ε有01lim 1=⎪⎭⎫ ⎝⎛≥-∑=∞→εμn k k n X n P 或11lim 1=⎪⎭⎫ ⎝⎛<-∑=∞→εμn k kn X n P ,,,,21n X X X 相互独立,设随机变量序列辛钦大数定律且具有数学期望(),1,2,k E X k μ==,,,,21n X X X 相互独立同分布,设随机变量序列当n 足够大时, 算术平均值几乎是一常数.具有相同数学期望和方差的独立随机变量序列的算术平均值依概率收敛于数学期望.算术均值数学期望近似代替可被定理的意义平均数法则12~(2),(,,),,1_______n n i X E X X n Y X n→∞=∑ 例设总体为其简单随机样本则时依概率收敛于12,,,n X X X 因为独立同分布,22212,,,n X X X 所以也独立同分布,22()i i i E X DX EX =+()2111=()422+=因此根据大数定律有∑==n i i n X n Y 121依概率收敛于21.2i EX =。
这就是概率论与数理统计-山东大学

例1 给出一组随机试验及相应的样本空间
1 {0,1,2,3}
E1 : 投一枚硬币3次,观察正面出现的次数
有限样本空间
E2 :观察总机每天9:00~10:00接到的电话次数 2 {0,1,2,3,, N }
E3 : 观察某地区每天的最高温度与最低温度
3 {( x, y) T1 x y T2 }
试验结果不止一个,但能明确所有的结果 试验前不能预知出现哪种结果
样本空间—— 随机试验E 所有可能的结果 组成的集合称为样本空间 记为 样本空间的元素, 即E 的直接结果, 称为
样本点(或基本事件) 常记为 , = {}
随机事件 —— 的子集, 记为 A ,B ,… 它是满足某些条件的样本点所组成的集合.
无限样本空间
其中T1,T2分别是该地区的最低与最高温度
基本事件 —— 仅由一个样本点组成的子集 它是随机试验的直接结果,每次试验必定发 生且只可能发生一个基本事件. 复合事件 ——由若干个基本事件组成的随 机事件. 必然事件——全体样本点组成的事件,记 为, 每次试验必定发生的事件. 不可能事件——不包含任何样本点的事件, 记为 ,每次试验必定不发生的事件.
A B
A1 , A2 ,, An 的积事件 ——
Ai
i 1
n
A1 , A2 ,, An , 的积事件 ——
Ai
i 1
5. 事件的差
—— A 与B 的差事件
A B
A B
A B
A B 发生
事件 A 发生,但 事件 B 不发生
6. 事件的互斥(互不相容)
AB —— A 与B 互斥
二.概率统计的研究内容
随机现象是不是没有规律可言? 否!
概率统计
i 1 i 1 n n 1i j n
P( Ai Aj )
n 1
1i j k n
P( Ai Aj Ak ) (1)
右端共有 2 n
n
P( A1 A2 An )
1 项.
例1.设有50件产品,其中有3件不合格品,从中 任取4件,求至少有一件不合格品的概率.
92 P( A | B) 0.98 94 92 P( B | A) 0.97 95
由条件概率的定义:
P( AB) P B A P( A)
若已知P(A), P(B|A)时, 可以反过来求P(AB). 乘法公式
(2) 乘法公式
利用条件概率求积事件的概率即乘法公式
P( AB) P( A) PB A ( P( A) 0) P( AB) P( B) P A B ( P( B) 0)
B
AB A
P ( A) P ( B AB)
又因
AB B
S
A ( B AB)
再由性质 3得证 .
推广: P( A B C ) P( A) P( B) P(C ) P( AB) P( AC ) P( BC ) P ( ABC ) 一般:
为事件 A 发生的条件下事件 B 发生的 条件概率. 同理
P ( AB) P ( A | B) P ( B)
称为在事件B发生的条件下事件A的
条件概率.
性质
条件概率也是概率, 故具有概率的性质:
非负性
规范性 可列可加性
P( B A) 0 P( A) 1
P Bi A PBi A i1 i1
概率论与数理统计A第6章
几个常见统计量
样本平均值
样本方差
它反映了总体 方差的信息
X
1 n
n i1
Xi
它反映了 总体均值 的信息
S2n11in1(Xi X)2
n1 1i n1Xi2nX2
样本标准差 S n1 1i n1(Xi X)2
样本k阶原点矩
Ak
1 n
n i1
Xik
k=1,2,…
样本k阶中心矩
Mk
1 n n i1
(1)
(n1)S2
2
~2(n1)
(2) X与S2独立 .
n取不同值时 (n 1)S 2
2
的分布
推论1 (样本均值的分布)
设X1,X2,…,Xn是取自正态总体 N(,2)
的样本, X和S2 分别为样本均值和样本方差,
则有
X ~t(n1)
Sn
证由定 1、 2理 t,分布的定义可得
X~N(0,1), n
X ~ N(,2) n
即 X~N(0,1) n
X ~ N(,2) X ~ N(0,1) n n
请注意 : 在已知总体,2时, 可用本定理计算样 本均值X.
n取不同值时样本
均值 X 的分布
定理 5 (样本方差的分布)
设X1,X2,…,Xn是来自正态总体 N(,2)的样本,
X和S2分别为样本均值和样本方差, 则有
的 点 t ( n ) 为 t ( n ) 分 布 的 上 分 位 数 。 如 图 所 示 .
t ( n )
t分布的上分位点的性质: t1(n)t(n)
t分 布 的 左 侧 分 位 点 t(n)可 查 表 求 得 , 例 t0.975(15)6.262.
当n45时,对于常 的 用值 的,可用正态近
中心极限定理
则对于任意实数 x ,
limP
n k1
Xk
n
x1
t2
x e 2 dt (x)
n
n
2
n
注
X k n
记 Yn k 1 n
lim
n
PYn
x
(x)
Yn
1 n
n
Xk
k 1
/ n
即 n 足够大时,Y n 的分布函数近似于标准正态的分布函数
近似
n
Xk 近似服从 N (n , n 2 )
观察表明,如果一个量是由大量相互独 立的随机因素的影响所造成,而每一个因素 在总影响中所起的作用不大. 则这种量一般 都服从或近似服从正态分布.
定 列维-林德伯格中心极限定理
理 一
[ 独立同分布的中心极限定理 ]
设随机变量序列 X1, X 2 ,, Xn ,
独立同E分(X布k ) ,且有, D期(X望k 和) 方 差2 :0 , k 1,2,
定 棣莫弗-拉普拉斯中心极限定理 理 二 [ 二项分布以正态分布为极限分布 ]
设 Y n ~ B( n , p) , 0 < p < 1, n = 1,2,…
则对任一实数 x,有
lim P
n
Yn np np(1 p)
x
1
2
t2
x
e 2 dt (x)
即 n 足够大时,
Y n ~ N (np , np(1-p)) (近似)
谢 谢!
第四章 随机变量的数字特征 第七讲 中心极限定理
主讲教师 叶宏 副教授
大家好,这一讲我们介绍中心极限定理。
大家知道,正态分布是概率统计中最重要 的分布,不仅自身应用广泛,而且在特殊条件 下,可以用作其他分布的近似分布,中心极限 定理就描述了这一现象。
[农学]叶宏工程硕士第4次_OK
(2) f (x, y) 2F xy
fX (x) FX (x)
fY ( y) FY( y)
(3) 法1: P( X ,Y ) G f (x, y)dxdy
G
法2:利用分布函数
P(0.1 X , 0.1 Y ) 1 FX (0.1) FY (0.1) F (0.1, 0.1)
16
5.3 条件分布
f
X
x
3x
1 0
x
4
0 x 1 其它
o
y=x2 1x
11
同理,随机变量Y 的边缘密度函数为
fY ( y)
f (x, y)dx
y
fY
y
3 y 2 0,
,
0 y 1 其它
y=x2
o
1x
12
例
设二维随机变量X,
Y ~
N
1,
2,
12,
2,
2
试求X 及Y 的边缘密度函数.
解:X, Y 的联合密度函数为
解
fX Y (x y)
f (x, y) fY ( y)
1
e 1 2(1
2
)
(
x1 12
)2
2
(
x
1)( y 1 2
2
)(
y
2
2 2
)2
21 2 1 2
1
e
(
y2
2
2 2
)2
2 2
27
1
e
212
1 (1
2
)
(
x
1
)
1 2
(
y
2
)
21 1 2
f
X
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n 1 i 1
样本修正方差
E S
2
2
一个参数往往有不止一个无偏估计, 若 我们可以 ˆ1和ˆ2都是参数 的无偏估计量, 比较 E (ˆ1 )2 和 E (ˆ2 )2 的大小来决定二者 谁更优 . 由于
ˆ ˆ D(1 ) E (1 )2 ˆ ˆ D( 2 ) E ( 2 )2
1. 置信区间定义 设 是 一个待估参数,给定 0,
若由样本X1,X2,…Xn确定的两个统计量 ˆ ˆ ˆ ˆ 1 1 ( X1, X 2 ,, X n ), 2 2 ( X1, X 2 ,, X n ) (ˆ1 ˆ2 ) 满足
ˆ ˆ P(1 2 ) 1 ˆ ˆ 则称区间 [1 , 2 ]是 的置信水平(置信度、
(P140.5) 设总体 X 的密度函数为
x 1 e f ( x ; ) 0
x 0, x0
0 为参数
X 1 , X 2 ,, X n 为 X 的一个样本.
求 的极大似然估计量, 并判断它是否无 偏估计量. n 1 解 由似然函数 L( )
真值
ˆ 设 ( X1,, X n )是未知参数 的估计量,若
ˆ E ( )
ˆ 则称 为 的无偏估计 .
例 设总体 X 的 k 阶矩 k E ( X )存在 ( X 1 , X 2 , , X n ) 是总体X 的样本,
k
证明: 不论 X 服从什么分布(但期望存在), 1 n 则 Ak X ik 是 k 的无偏估计量. n i 1 证 由于 E ( X ik ) k i 1,2, , n 因而
n
u 2 ]
(2) 方差 2未知 , 的置信区间
S S [X t 2 (n 1), X t 2 (n 1)] n n
推导 选取枢轴量
X T ~ t (n 1) S n
P{| T | t 2 (n 1)} 1
X P{| | t 2 (n 1)} 1 S n
1 ˆ 1 ( X 1 X 2 X 3 ) 3 1 1 5 ˆ 2 X 1 X 2 X 3 3 4 12
都是 的无偏估计量
1 2 25 2 ˆ ˆ D( 1 ) D( 2 ) 3 72 ˆ 1 最有效
推广
结论(P141.8) 设 E( X )= , D( X )= 2
2
估计量
例 设总体 X 的期望 与方差存在, X 的 样本为 ( X 1 , X 2 , , X n ) ,
1 n (1) S n2 ( X i X ) 2 不是 D( X )的无偏估计; n i 1
n 1 2 2 E (S ) 样本方差 n n 1 2 S ( X i X ) 2是 D( X ) 的无偏估计. (2)
i 1
i 1 n 1
C (2 2 02 ) C (n 1)2 2
n 1 1 当C 时, C ( X i 1 X i ) 2为 2的无偏估计 2(n 1) i 1
i 1
n 1
P141 .7 设 X 1 , X 2 , , X n 是取自P ( )的样本,证明X , 1 n S 2= ( X i X ) 2 和aX (1 a ) S 2 (0 a 1) n 1 i 1 都是 的无偏估计.
寻找未知参数的 一个良好估计. 有了分布,就可以求出 U取值于任意区间的概率.
寻找一个待估参数和 估计量的函数 ,要求 其分布为已知.
对于给定的置信水平(大概率), 根据U的分布, 确定一个区间, 使得U取值于该区间的概率为 置信水平.
对给定的置信水平 1 , 查正态分布表得 u 2 , 使
(ci2 c 2 ) n ci2 j
i 1
n
1 c n i 1
2 i
n
1 2 ˆ D( X ) D( ) n
结论
算术均值比加权均值更有效.
(3) 一致性(相合性)
定义 设 ˆ ˆ( X 1 , X 2 , , X n ) 是总体参数
ˆ 的估计量. 若n 时, 依概率收敛于 ,
前面,我们讨论了参数点估计. 它 是用样本算得的一个值去估计未知参数. 但是,点估计值仅仅是未知参数的一个 近似值,它没有反映出这个近似值的误 差范围,使用起来把握不大. 区间估计 正好弥补了点估计的这个缺陷 .
§6.2
区间估计
引例 已知 X ~ N ( ,1),
的无偏、有效点估计为 X
常数 随机变量 不同样本算得的 的估计值不同, 因此除了给出 的点估计外, 还希望根 据所给的样本确定一个随机区间, 使其 包含参数真值的概率达到指定的要求.
X ~ P( ) E( X ) D( X )
E( X ) E( X )
E ( S ) D( X )
2
E[aX (1 a) S 2 ] aE( X ) (1 a) E ( S 2 ) [a (1 a)]
§6.2
区间估计
2. 寻找参数 的一个良好的点估计 T (X1,X2,…Xn) 3. 寻找一个待估参数 和估计量T的函数 S(T, ),且其分布为已知.
称S(T, )为枢轴量.
4. 对于给定的置信水平1 ,根据S(T, ) 的分布,确定常数a, b,使得 P(a ≤S(T, )≤b)= 1 5. 对“a≤S(T, )≤b”作等价变形,得到如下 形式: ˆ ˆ
概率统计
主讲教师 叶宏
§6.1 参数的点估计
4.点估计的评价标准 对于同一个未知参数,不同的方法得到 的估计量可能不同,于是提出问题: 应该选用哪一种估计量? 用何标准来评价一个估计量的好坏? (1) 无偏性
常用 标准
(2) 有效性 (3) 一致性
(1) 无偏性 估计量是随机变量,对于不同的样本值 会得到不同的估计值 . 我们希望估计值在未 知参数真值附近摆动,而它的期望值等于未 知参数的真值. 这就导致无偏性这个标准 . .
D(ˆ) D(ˆ* )
ˆ ( X1,, X n ) 是未知参数 的无偏估计量,
ˆ* 是 的任一无偏估计.
ˆ 则称 为 的最小方差无偏估计.
(也称最佳无偏估计)
例如 X ~ N( , 2 ) ,样本是 X 1 , X 2 , X 3 .
ˆ ˆ E(1 ) E(2 )
X P{| | u 2 } 1 n
为什么 这样取?
1
P{ X
从中解得
n
u
2
u 2 X
n
u
u 2 } 1
2
于是所求 的 置信区间为
[X
n
u 2 , X
n
u 2 ]
也可简记为
X
n
u 2
从例1解题的过程,我们归纳出求置 信区间的一般步骤如下: 1. 明确问题, 是求什么参数的置信区间? 置信水平 1 是多少?
i 1 i 1
n
n
(2)
ˆ ) ci2 D( X i ) 2 ci2 D(
n n 1 ci ci2 2 ci c j i 1 1i j n i 1
n
n
i 1 2
i 1
ci2
i 1
n
1i j n
1 1 k k E ( Ak ) E ( X i ) E ( X i ) n i 1 n i 1 1 n k k n
n
n
特别地 样本均值 X 是总体期望 E( X ) 的
无偏估计量
1 2 样本二阶原点矩 A2 X i 是总体 n i 1
n
二阶原点矩 2 E ( X ) 的无偏
P{1 2 } 1
ˆ ˆ 则 [1 , 2 ]就是 的置信度为1 的置信区间.
可见,确定区间估计很关键的是要寻找 一个待估参数 和估计量T 的函数S(T, ), 且S(T, )的分布为已知, 不依赖于任何未知 参数 (这样我们才能确定一个大概率区间). 而这与总体分布有关,所以,总体分布的 形式是否已知,是怎样的类型,至关重要.
置信概率)为 1 的置信区间.
ˆ1和ˆ2 分别称为置信下限和置信上限.
2.求置信区间的步骤
例 设X1,…Xn是取自N ( , 2 )的样本, 2已知,
求参数 的置信水平为1 的置信区间.
明确问题:求什么参数的置信区间? 置信水平是多少?
解
选 的点估计为X X 取 U n
ˆ 故 E ( ) E ( X ) E ( X )
它是 的无偏估计量.
P141 .6 设 X 1 , X 2 , , X n 是取自总体N ( , 2 )的样本,求 C 的值,使 S 2=C ( X i 1 X i ) 2 是 2的无偏估计.
i 1 n 1
S P{ X t 2 (n 1) X n S [X t 2 (n 1), X n S t 2 (n 1)} 1 n S t 2 (n 1)] n
即 0,
ˆ lim P( ) 0
n
ˆ 则称 是参数 的一致(或相合)估计量.
一致性估计量仅在样本容量 n足够大时,才显示其优越性.
关于一致性的常用结论
样本 k 阶矩是总体 k 阶矩的一致性估计量
由大数定律证明
矩法得到的估计量一般为一致估计量 在一定条件下, 极大似然估计具有一致性
解
E[C ( X i 1 X i ) 2 ] C E[( X i 1 X i ) 2 ]