《数理统计》第7章_基于截尾样本的.
概率论与数理统计 第7章

一、基本概念 二、基于截尾样本的最大似然估计 三、小结
一、基本概念
1. 寿命分布的定义
产品寿命T 是一个随机变量,它的分布称为寿 产品寿命 是一个随机变量 它的分布称为寿 命分布. 命分布
2. 完全样本的定义
将随机抽取的 n 个产品在时间 t = 0 时, 同时 投入试验直到每个产品 都失效 . 记录每一个产 品的失效时间 , 这样得到的样本 (即由所有产品 的失效时间 0 ≤ t1 ≤ t 2 ≤ ⋯ ≤ t n 所组成的样本 )
利用这一样本估计未知 参数 θ (产品的平均寿命 ).
在时间区间 [0, t m ] 有 m 个产品失效 , 有 n − m 个产品的寿命超过 t m .
估计θ , 利用最大似然估计法来
为了确定似然函数, 观察上述结果出现的概率. 为了确定似然函数, 观察上述结果出现的概率.
产品在(ti , ti + dti ] 失效的概率近似地为 f (ti )dti = e θ dti , i = 1, 2,⋯, m. 1
又因为 E ( X ) = D( X ) + [ E ( X )] =
2 2
σ
2
n
+ µ 2,
所以 E (σ 2 ) = E ( A2 − X 2 ) = E ( A2 ) − E ( X 2 ) ˆ
n −1 2 ˆ σ ≠ σ 2 , 所以 σ 2 是有偏的. = n n 若以 乘 σ 2 , 所得到的估, 若 X 1 , X 2 ,⋯, X n 为总体 X 的一个样本,
θ ∈ Θ 是包含在总体 X 的分布中的待估参数 , (Θ 是 θ 的取值范围 )
ˆ 若估计量θ = θ( X1, X2 ,⋯, Xn ) 的数学期望 ˆ ˆ E(θ ) 存在, 且对于任意θ ∈Θ 有E(θ ) = θ , 则称 ˆ θ 是θ 的无偏估计量.
数理统计7:矩法估计(MM)、极大似然估计(MLE),定时截尾实验

数理统计7:矩法估计(MM)、极⼤似然估计(MLE),定时截尾实验在上⼀篇⽂章的最后,我们指出,参数估计是不可能穷尽讨论的,要想对各种各样的参数作出估计,就需要⼀定的参数估计⽅法。
今天我们将讨论常⽤的点估计⽅法:矩估计、极⼤似然估计,它们各有优劣,但都很重要。
由于本系列为我独⾃完成的,缺少审阅,如果有任何错误,欢迎在评论区中指出,谢谢!⽬录Part 1:矩法估计矩法估计的重点就在于“矩”字,我们知道矩是概率分布的⼀种数字特征,可以分为原点矩和中⼼矩两种。
对于随机变量X⽽⾔,其k阶原点矩和k阶中⼼矩为a_k=\mathbb{E}(X^k),\quad m_k=\mathbb{E}[X-\mathbb{E}(X)]^k,特别地,⼀阶原点矩就是随机变量的期望,⼆阶中⼼矩就是随机变量的⽅差,由于\mathbb{E}(X-\mathbb{E}(X))=0,所以我们不定义⼀阶中⼼矩。
实际⽣活中,我们不可能了解X的全貌,也就不可能通过积分来求X的矩,因⽽需要通过样本(X_1,\cdots,X_n)来估计总体矩。
⼀般地,由n个样本计算出的样本k阶原点矩和样本k阶中⼼矩分别是a_{n,k}=\frac{1}{n}\sum_{j=1}^{n}X_j^k,\quad m_{n,k}=\frac{1}{n}\sum_{j=1}^{n}(X_j-\bar X)^k.显然,它们都是统计量,因为给出样本之后它们都是可计算的。
形式上,样本矩是对总体矩中元素的直接替换后求平均,因此总是⽐较容易计算的。
容易验证,a_{n,k}是a_k的⽆偏估计,但m_{n,k}则不是。
特别地,a_{n,1}=\bar X,m_{n,2}=\frac{1}{n}\sum_{j=1}^{n}(X_j-\bar X)^2=\frac{n-1}{n}S^2\xlongequal{def}S_n^2,⼀阶样本原点矩就是样本均值,⼆阶样本中⼼矩却不是样本⽅差,⽽需要经过⼀定的调整,这点务必注意。
概率论与数理统计总复习

概率论与数理统计总复习1、研究和揭示随机现象 统计规律性的科学。
随机现象:是在个别试验中结果呈现不确定性,但在大量重复试验中结果又具有统计规律性的现象。
2、互斥的或互不相容的事件:A B φ⋂=3、逆事件或对立事件:φ=⋂=⋃B A S B A 且4、德∙摩根律:B A B A ⋂=⋃,B A B A ⋃=⋂5、在相同的条件下,进行了n 次试验,在这n 次试验中,事件A 发生的次数A n 称为事件A 发生的频数,比值/A n n 称为事件A 发生的频率,并记为()n f A 。
6、概率的性质(1)非负性:(A)0P ≥; (2)规范性:(S)1P =;(3)有限可加性:设A 1,A 2,…,A n ,是n 个两两互不相容的事件,即A i A j =φ,(i ≠j), i , j =1, 2, …, n , 则有∑==ni i n A P A A P 11)()...((4)()0P φ=;(5)单调不减性:若事件A ⊂B ,则P(B)≥P(A) (6)对于任一事件A ,P(A)≤1 (7)差事件概率:对于任意两事件A 和B ,()()()P B A P B P AB -=-(8)互补性(逆事件的概率):对于任一事件A ,有 P(A )=1-P(A) (9)加法公式:P(A ⋃B)=P(A)+P(B)-P(AB))()()()()()()()(321323121321321A A A P A A P A A P A A P A P A P A P A A A P +---++=⋃⋃7、古典概型中的概率: ()()()N A P A N S =①乘法原理:设完成一件事需分两步, 第一步有n 1种方法,第二步有n 2种方法, 则完成这件事共有n 1n 2种方法。
例:从甲、乙两班各选一个代表。
②加法原理:设完成一件事可有两类方法,第一类有n 1种方法,第二类有n 2种方法,则完成这件事共有n 1+n 2种方法。
广义指数分布参数基于截尾样本在序约束下的极大似然估计

( S c i e n c eCo l l e g e 。 Li a o n i n gUn i v e r s i t yo f T e c h n o l o g y , J i n z h o u1 21 0 0 1 , Ch i n a)
o r d r e we re d i S C U s s e d , wi h t s i mu l a t i o n r e s u l t s g i v e n .
Ke y w o r d s : g e n ra e l i z e d e x p o n e n i t a l d i s t r i b ti u o n ; s i mp l e i t e r a t i v e me t h o d ; E M a l g o r i t m ; h
Ma x i m um Li k e l i h o o d Es t i ma t i o n o f Pa r a me t e r s o f Ge n e r a l i z e d Ex p o n e n ia t l Di s t r i b u i t o n Ba s e d o n Ce n s o r e d S a mp l e s u n d e r Or d e r Re s t r i c t i o n s
e s t i a t m i o s n o f p a r a e t m rs e o f k g e n e r a l i z e d e x p o n e n t i a l d i s t r i b u t i o s n b a s d e o n c e n s o r e d s a mp l e s u n d e r
概率论与数理统计-第七章

但是参数 参数估计
, 未知。希望通过抽样估计之。
点估计 —— 给出参数的估计值。
区间估计 —— 给出参数的估计范围
3
§1 参数的点估计
用样本( X1, X2, …, Xn ),对每个未知参数 θi , ( i = 1, 2, …, k) 构造出一个统计量,
作为对参数 θi 的估计。该统计量称为 θi 的估计量。
抽出样本(X1, X2, …, Xn )。求证:对任何总体分布,
证明:X1, X2, …, Xn 独立,且与X同分布
28
例10:对服从均匀分布U(0, b)的总体X,讨论参数 b 的矩估计和极大似然估计的无偏性。 解: 由前面U(a, b)分布的a和b的估计量: (1) 矩估计
令 a=0
是
无偏估计!
xi , 故的取值范围最大不超过x min x1 , x2 ,
另一方面,L , 1n e
1
, xn
xi i 1
n
n
是的增函数,取到最大值时,L达到最大。
故 X 1 min X1 , X 2 ,
dlnL 令 n 12 d
29
(2) 极大似然估计
令 a=0
不是无偏估计
30
纠偏方法
如果 满足 ,则新的估计量 , 是无偏估计!
例9中:对服从均匀分布U(0, b)的总体X,参数 b 极大似然估计 不是无偏估计。
由于
是一个修正的极大似然估计,是无偏估计。
31
2.有效性 在没有系统误差的前题下,还希望估计量的 随机误差尽量小(对给定的样本容量n)!
推荐三本概率论和数理统计的参考书: (1)《数理统计学简史》, 陈希孺 (2)《概率论札记》, 梁昌洪
7.2截尾的极大似然估计-PPT课件

d ln L ( ) 0, 解 得 d s(t m ) ˆ m 其 中 s( t m ) t1 t 2 t m ( n m )t m
概率统计
基于截尾样本的最大似然估计
0 t 1 t 2 t n, 称 为 完 全 样 本 。 二 截
尾 样 本 , ( 1 )定 时 截 t 0时 同 时 投 入 t0停止,停止时共有 随机抽取的 n
t 1 , t 2 , , t m ( 0 t 1 t 2 t m t 0 ), 进行到有 m (事先 得到样本 t1 , t 2 , ,
设产 品的 寿命 分布 是指 数分 布,其概 率密 度为 1 t / e , t0 f (t ) t0 0, 0未知 。设有 n 个产 品投 入定 时截 尾试 验,截尾 时间 为 t 0,得定 时 截尾 样本 0 t 1 t 2 t m t 0。故似 然函 数为 L ( ) 1
第二节基于截尾样本的最大似然估计
产品寿命 T 是一个随机变量,它的 为了对寿命分布进行统 寿命数据。 实验方法:一完全样本 t 0时 , 同 时 投 入 试 验 , 直 尾样本,假设将随机抽 试验,试验进行到实现 m 个产品失效,得到样本 称为定时截尾样本。 个产品在时间 规定的截尾数 ,将随机抽取的 n 个产品在时间 到样本 到每个产品都失效,得 取的 n 个产品在时间 规定的截尾时间 分布称为寿命分布。 试验,取得 计推断,则需通过寿命
( 2 )定 数 截 尾 样 本 , 假 设 将
t 0时 同 时 投 入 试 验 , 试 验 m n )个产品失效时停止,
概率论与数理统计浙大四版 第七章 第七章3讲
参数 (这样我们才能确定一个大概率区间).
而这与总体分布有关,所以,总体分布的 形式是否已知,是怎样的类型,至关重要.
这里,我们主要讨论总体分布为正态 的情形. 若样本容量很大,即使总体分布 未知,应用中心极限定理,可得总体的近 似分布,于是也可以近似求得参数的区间 估计.
第四节
区间估计
引言
前面,我们讨论了参数点估计. 它 是用样本算得的一个值去估计未知参数. 但是,点估计值仅仅是未知参数的一个 近似值,它没有反映出这个近似值的误 差范围,使用起来把握不大. 区间估计 正好弥补了点估计的这个缺陷 .
也就是说,我们希望确定一个区间,使我
们能以比较高的可靠程度相信它包含真参
内. 这里有两个要求:
1. 要求 以很大的可能被包含在区间[ˆ1,ˆ2]
内,就是说,概率P{ˆ1ˆ2}要尽可能大.
即要求估计尽量可靠.
2. 估计的精度要尽可能的高. 如要求区间 长度 ˆ2 ˆ1 尽可能短,或能体现该要求的其 它准则.
可靠度与精度是一对矛盾, 一般是在保证可靠度的条件下
尽可能提高精度.
P {ˆ1ˆ2}1
称区间 [ˆ1,ˆ2]为 的 置信水平为1 的
置信区间.
寻找置信区间的方法,一般是从确定 误差限入手.
我们选取未知参数的某个估计量 ˆ,根
据置信水平1 ,可以找到一个正数 ,
使得 P{ˆ||}1
称 为ˆ 与之间的误差限 .
只要知道 ˆ 的概率分布,确定误差限并不难.
由不等式 |ˆ | 可以解出 :
S(T, ),且其分布为已知.
称S(T, )为枢轴量.
《数理统计》第7章§2基于截尾样本的最大似然估计.
第七章
参数估计
§2 基于截尾样本的最大似然估计
2/4
预先规定好试验时间 0 T 随机取 n 件产品,从 t 0 时刻开始进行试验, 到截尾 开始时间 截尾时间 时刻 t T 试验停止,依次记录下失效时间和失效个数 ,从而 获得定时截尾样本
0 t1 t 2 t m T
第七章 参数估计
s(180) 115 119 172 (50 15) 180 8550
115,119,131,138,142,147,148,155, 158,159,163,166,167,170,172
求得 的最大似然估计值为
ˆ 8550 570 (小时) 15
t
3/4
设产品寿命服从指数分布,其概率密度为
1 e ,t 0 f (t ) 0 , t0 定时截尾时间为 T . 任取 n 件产品进行寿命试验,截尾 样本为 0 t1 t m T . 试求平均寿命 的最大似然估计. 似然函数为 任一产品在时刻 (t i , t i dt ] 失效的概率近似为
1e dt (i 1, , m) L( ) n m令 T 的概率为 件产品寿命超过 t1 tm ( n m )T lnL m n m ( n m ) T t 1 0 2 e T e dt 似然函数 求得 的最大似然估计为 故截尾样本观察值出现的概率近似为 s (T ) ˆ t1 t m ( n m )T ( n m )T ti m m 1e t m 1 e m e dt1dtm C d C i 总试验时间 n n 为 . t t ( n m ) T 其中 s(T ) 1 m m i 1
概率论与数理统计第七章
13
二、最大似然估计法
是在总体类型已知条件下使用的一种参数估计方法 . 它首先是由德国数学家高斯在 1821年提出的 ,
然而,这个方法常归功于英国 统计学家费歇 . 费歇在1922年重新发现了这一 方法,并首先研究了这种方法 的一些性质 .
Gauss
Fisher
信息管理学院 徐晔
选择适当的 i , i 1,2,, m
使得样本 ( X 1, X 2 ,, X n ) 作为一个随机变量,得 到观察值 ( x1, x2 ,, xn ) 的可能性最大。
信息管理学院 徐晔
17
当总体 X 为离散型随机变量时,样本 ( X 1 , X 2 ,, X n ) 是一个 n 维离散型随机变量,所谓得到样本观察值 ( x1 , x2 ,, xn ) 实际上就是联合概率事件
14
最大似然估计法的基本思想
先看一个简单例子:
某位同学与一位猎人一起外出打猎 .
一只野兔从前方窜过 .
只听一声枪响,野兔应声倒下 .
如果要你推测, 是谁打中的呢? 你会如何想呢?
信息管理学院 徐晔
15
你就会想,只发一枪便打中,猎人命中的概率 一般大于这位同学命中的概率. 看来这一枪是猎人 射中的 . 这个例子所作的推断已经体现了最大似然估计 法的基本思想 .
信息管理学院 徐晔
18
n
当总体 X 为连续型随机变量时,样本 ( X 1 , X 2 ,, X n ) 是一个 n 维连续型随机变量,所谓得到样本观察值 ( x1 , x2 ,, xn ) 实际上就是值对于一个极小的 ,联合 概率事件
A ( x1 X 1 x1 , x2 X 2 x2 ,, xn X n xn )
定时截尾寿命实验与定数截尾实验下的最大似然估计法
长,由于时间和财力的限制,我们不可能得到完全样本,于是就考虑截尾寿命试验.
常用的ቤተ መጻሕፍቲ ባይዱ种截尾寿命试验:
一种是定时截尾寿命试验。假设将随机抽取的 n 个产品在时间 t=0 时同时投入试
验,试验进行到事先规定的截尾时间 t0 停止.如试验截止时共有 m 个产品失效,它们
的失效时间分别为
0 ≤ t1 ≤ t2 ≤ L ≤ tm ≤ t0 ,
应于样本 X 1 , X 2 ,L, X n 的一个样本值,则似然函数为
n
n
∏ L( p) =
n
p xi (1 −
p)1− xi
=
∑ xi p i=1 (1 −
∑ n− xi p) i=1 ,
i =1
n
n
∑ ∑ 于是 ln L( p) = xi ln p + (n − xi ) ln(1 − p) .
考虑函数
n
∏ f (xi ;θ ) dxi
i =1
n
∏ L(θ ) = L( x1, x2 ,L, xn ;θ ) = f (xi ;θ ) i =1
同样称 L(θ ) 为样本的似然函数.
最大似然估计法的方法:
固 定 样 本 观 察 值 x1, x2 ,L, xn , 在 θ 取 值 的 可 能 范 围 内 Θ 挑 选 使 似 然 函 数
这一概率随θ 的取值而变化,它是θ 的函数,称 L(θ ) 为样本的似然函数.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
怎样根据截尾样本估计产品平均寿命
第七章 参数估计
§2 基于截尾样本的最大似然估计 3/4
设产品寿命服从指数分布,其概率密度为
定时截尾时间为
f (t) 1 et ,t 0
0 , t 0
任T.取 件产n 品进行寿命试验,截尾样本
为 0 t1 tm T. 试求平均寿命 的最大似然估计.
0
似然函数
nm)T
dt1 dtm
i 1
第七章 参数估计
§2 基于截尾样本的最大似然估计 4/4
设电池寿命服从指数分布,其概率密度为
f (t) 1 et ,t 0
0 , t 0
任取50只进行定时截尾寿命试验,截尾时间为180小时. 试验进行到规定时间时共有15只失效,其失效时间分别为
115,119,131,138,142,147,148,155, 158,159,163,166,167,170,172
§2 基于截尾样本的最大似然估计 1/4
随机取 n件产品,从 t 时 0刻开始进行试验 依次记录下失效时间,从而获得样本
0 t1 t2 tn
则产品的平均寿命估计值是
完全样本
ˆ t
1 n
n
ti
i 1
获得完全样本的时间周期较长,花费
较大,在实际中很难实现.
第七章 参数估计
§2 基于截尾样本的最大似然估计 2/4
预先规定好试验时间 0 T 随机取 件n产品,从 时t 刻0开始进行试验, 到截尾 时刻 t 试T 验停止,依次记录下失效时开间始和时失效间个数截,尾从时而间获 得定时截尾样本
0 t1 t2 tm T
预先规定好失效个数 m 随机取 n (n 件m产) 品,从 时t刻试开0验始停进止行时试验, 到出现 m个产品失效时试验停止,产依品次失记效录个下数失效时间,从而 获得定数截尾样本
单位:小时.试求电池平均寿命 的 最大似然估计值. 本题中 n 50, m 15,T 180
s(180) 115 119 172 (50 15)180 8550
求得 的最大似然估计值为 ˆ 8550 570 (小时)
15
第七章 参ቤተ መጻሕፍቲ ባይዱ估计
似任然一函产数品为在时刻 (ti,ti 失dt效] 的概率近似为
L( )
1
e
ti
dt
(i 1,, m)
求其n 得中m故令s件的(TC截产)最nm尾品大te1样寿似(n本命lm然n)观LT超估t察mm过计T值1(m1为Tne的出etˆt概现imt1dd)tt率的Tis(mn为T为概Cm)n总mt率m12试e近m(e(验n似nt1m时为)mT间)tTm.(