从几个次序统计量出发的二参数Weibull分布的参数估计

从几个次序统计量出发的二参数Weibull分布的参数估计
从几个次序统计量出发的二参数Weibull分布的参数估计

Ξ第4卷 第1期

2005年3月 

 

太原师范学院学报(自然科学版)

JOURNA L OF T AIY UAN TE ACHERS C O LLEGE(Natural Science Edition)

 V ol.4N o.1

 Mar.2005

从几个次序统计量出发的二参数Weibull

分布的参数估计

郭德怀

(江苏财经职业技术学院,江苏淮安223001)

〔摘要〕 从两个或三个次序统计量出发,讨论了二参数Weibull分布的参数估计问题,在实际数据的缺失、删失、截尾等情况下,为可靠性试验的数据处理提供了一种有效的估计方法.

〔关键词〕 次序统计量;二参数Weibull分布;参数估计

〔文章编号〕 167222027(2005)0120004204 〔中图分类号〕 O213;T B114〔文献标识码〕A

设产品寿命T~Weibull(η,γ),其分布函数为

F T(t)=1-exp-

t

η

1

γ

,η>0,γ>0,t>0.(1)

记μ=lnη,则Tη1

γ

服从标准指数分布;X=1n T服从极值分布(也称对数Weibull分布),其分布函数为

F X(χ)=1-exp-exp

χ-μ

γ,

γ>0,-∞<μ<+∞.(2)

再令Y=X-μ

γ=ln

T

η

1

γ

,则Y服从标准极值分布,其分布函数为

F Y(y)=1-exp(-e y) .(3)

设有来自二参数Weibull分布的样本量为N的样本T1,T2,…,T N,T(1)≤T(2)≤…≤T(N)为其次序统计量,则相应的X(1)≤X(2)≤…≤X(N)可看作是来自极值分布的样本量为N的样本的次序统计量,Y(1)≤Y(2)≤…≤Y(N)可看作是来自标准极值分布的样本量为N的样本的次序统计量.

1 形状参数的估计

Murthy和S wartz从N个失效样本中两个次序统计量出发,提出了形状参数γ的无偏估计,根据次序统计量的选择准则,在使估计量的方差达到最小的条件下,渐进效率在70%左右[1].他们还运用此统计量在Weibull分布的刻度参数未知时进行了γ的假设检验.本文从三个次序统计量出发,导出γ的估计,并得到相对效率的公式.

若有次序观测值t(m)与t(l),1≤l

Y=ln t(m)-ln t(l)

(4)

易知Y的分布与未知参数无关.令

γ^=ln t(m)-ln t(l)

2E(Y)

(5)

显然,γ^为γ的无偏估计,由Y的构造不难推出

Ξ收稿日期:2003212230

作者简介:郭德怀(19652),男,湖南长沙人,江苏财经职业技术学院高级讲师,主要从事概率统计的研究.

E (Y )=2A

∑l -1i =0

∑m -l -1

j =0C

ij

14ρb ln ρ+1

ρ(6)

E (Y 2

)=2A

∑l -1i =0

∑m -l -1

j =0

C

ij

1

4ρb

2

g (ρ)(7)

其中,A =N !(l -1)!(m -l -1)!(N -m )!,g (χ)=∑∞

k =1(-1k

2)(-1χ)k ,ρ=N +j -m +1

b ,b =m -l +i +j ,C ij =(-1)i +j l -1i m -j -1j

.类似的,若有三个次序观测值t (1),t (m ),t (n ),1≤l

Y 1=

ln t (n )-ln t (m )2γ,Y 2=ln t (m )-ln t (l )

,

(8)

则Y ,Y 2的联合分布是完全确定的.令

γ^=ln t (n )-ln t (m )2E (Y 1)?n -m n -l +ln t (m )-ln t (l )2E (Y 2)?

m -l n -l

(9)

显然,E (

γ^

)=γ,并且γ^

γ的分布是完全确定的,其方差Var γ

^

γ也是可求的.下面从标准极值分布出发导出Var

γ^γ的公式.记α=n -m n -l ,β=m -l

n -l

,则γ^

=ln t (n )-ln t (m )2E (Y 1)?α+ln t (n )-ln t (m )2E (Y 1)?

β,从而 γ^

γ=α2E (Y 1)?ln t (n )-μγ+β2E (Y 2)-α2E (Y 1)?ln t (m )-μγ-β

2E (Y 2)

?ln t (l )-μγ.

前面已指出,ln t (n )-μ

γ

可看作是来自标准极值分布的容量为N 的第n 个次序样本,以Y (i )记来自标准极值分布的容量为N 的第i 个样本,则

γ^

γ=α2E (Y 1)?Y (n )+β2E (Y 2)-α2E (Y 1)?Y (m )-β

2E (Y 2)?Y (l ).(10)于是

Var γ^

γ=a 2

4E 2(Y 1)

?Var Y (n )+β2E (Y 2)-α2E (Y 1)2

?Var Y (m )

+

β

2

4E 2(Y 2)

Var Y (l )+

αE (Y 1)β

2E (Y 2)

-

α2E (Y 1)C ov Y (n ),Y (m )-α

2E (Y 1)?β

2E (Y 2)

C ov Y (n ),Y (l )-β2E (Y 2)

2E (Y 1)?β

2E (Y 2)

C ov Y (m ),Y (l ).

(11)

由于标准极值分布不含任何未知参数,其次序样本的期望、方差、协方差均为常数,而E (Y 1),E (Y 2)的公式与(6)是一致的,因而Var γ

^

γ完全可求.

将γ^的方差与最小方差线性无偏估计的方差作比较,从而给出γ^的效率,以γB 记γ的BLUE ,则AE ff (γ^)=Var

γ^

B

γVar

γ

^

γ

,其中Var γ^B

γ可参见文献[2].此处我们求出了N =20时的标准极值分布的各次序统计量的期望值、方差值、协方差值,并计算出截尾数为4的相对效率,结果如表1、表2所示.

5

 第1期 郭德怀:从几个次序统计量出发的二参数Weibull 分布的参数估计

表1 N =20时次序统计量的数字特征

T able 1 Figure character of order statistics when N =20

i

期望值

方差

协方差

i 12

34

1-3.573941.6439312-2.545080.6456520.629963-2.020730.3953930.493160.308854

-1.65535

0.28453

4

0.41837

0.26201

0.20511

表2 N =20,r =4的相对渐进效率(形状参数)

T able 2 Relative asymptotic effectiveness when N =20,r =4

所采用的次序统计量:i

估计量γ

^

γ的方差

相对渐进效率

1,2,30.4808365.74%1,2,40.3521989.75%1,3,40.4887564.67%2,3,4

0.85920

36.78%

注意到无论是在(5)式还是(9)式中,若把ln t (i )看作次序样本实现值,则γ^

都是ln t (i )(i =1,2,…,N )的线性函数,且其系数和为0.受此启发,假设有部分观测到的次序样本和部分未观测到的缺失次序样本,则可由观测到的部分次序样本出发构造的线性无偏估计

γ^

=

3

βi ln t (i )

.(12)

其中∑3

指对那些观测到的次序样本求和,∑3

βi =0.另外也可将(12)写成

γ

^

γ=

3

βi ln t (i )-μ

γ

=

3

βi Y (i )

.(13)

由此,γ

^

γ的分布与未知参数无关,其方差可计算,不过在βi 的选择上还应使γ

^成为γ的无偏估计.2 刻度参数的估计

由于极值分布中μ=ln η,因此可将刻度参数η的估计转化为对μ的估计.由变换Y =ln t -μ

η,可自然地给出μ^=ln t (l )-E (Y (l ))γ^,Y (l )为标准极值分布的第l 个次序统计量.显然,E (μ^)=μ,μ^随着γ^

的形式

变化而变化,不妨以(5)式代入,因此,μ^

是从两个次序统计量出发的估计量.于是,

Var μ^γ=Var μ^-μγ=Var Y (l )-E (Y (l ))

γ^γ=

Var Y (l )-E (Y (1))(Y (m )-Y (l ))

2E (Y )

=Var

1+

E (Y (l ))2E (Y )

Y (l )-

E (Y l )

2E (Y )Y

(m )

=

1+

E (Y (l ))2E (Y )

2

Var (Y (l ))+

E (Y (l ))2E (Y )

2

Var (Y (m ))-21+

E (Y (l ))2E (Y )E (Y (l ))

2E (Y )

C ov (Y (1),Y (m )),

C ov (μ^

^

)=C ov (ln t (l )-E (Y (l ))γ^

,γ^

)=γ2

C ov Y (l ),E (Y (l ))Y (m )-Y (l )2E (Y ),

Y (m )-Y (l )

2E (Y )=

γ2C ov 1+E (Y (l ))

2E (Y )Y (l )-

E (Y (l ))2E (Y )Y (m ),-Y (l )2E (Y )+

Y (m )

2E (Y )

=

r 2

-

1+

E (Y (l ))2E (Y )12E (Y )

Var (Y (l ))-E (Y (l ))2E (Y )12E (Y )Var (Y (m ))+

1+

E (Y (l ))2E (Y )12E (Y )

+

E (Y (l ))2E (Y )1

2E (Y )C ov (Y (l ),Y (m )).6太原师范学院学报(自然科学版) 第4卷 

有了以上两个公式,下面来求μ^的渐进效率(以BLUE或G LUE作比较).以μ^B记μ的BLUE,则

AE ff(μ^)=Var(

μ^

B

γ)

Var(

μ^

γ)

=

A r,N

Var(

μ^

γ)

,其中A r,N可在文献[2]中查得,r为截尾数.取N=20,r=4,可得如表

3所示的结果.

表3 N=20,r=4的相对渐进效率(刻度参数)

T able.3 Relative asymptotic effectiveness when N=20,r=4

所采用的次序统计量:i估计量γ^

γ

的方差相对渐进效率

1,27.0323417.02%

1,31.9823460.40%

1,41.7123470.54%

2,32.5947646.14%

2,41.8762463.38%

3,43.8647230.99%

参考文献:

[1] Murthy V K,S wartz G B.Estimation of W eibull parameters from tw o2order statistics[M].Ohio:Wright2Patters on Air F orce Base,1974

[2] 第四机械工业部标准化研究所.可靠性试验用表[M].北京:国防工业出版社,1978

Estimation of Tw o2parameter Weibull P arameters

Using Several Order Statistics

G uo Dehuai

(Jiangsu Finance and Economics C ollege of V ocational T echnology,Huaian223001,China)

〔Abstract〕 The problem of the parameter estimation of tw o2parameter weibull distribution is discussed using tw o or three order statistics.In practice we often need to deal with im plement data,especially in reliability statistics.It provides an effective method for estimating the parameter of Weibull distribution.

〔K ey w ords〕 order statistics;tw o2parameter Weibull distribution;parameter estimation 7

 第1期 郭德怀:从几个次序统计量出发的二参数Weibull分布的参数估计

Weibull分布

Weibull分布(韦伯分布) (2006-07-04 22:04:01) 转载 分类:学习 Weibull分布,又称韦伯分布、韦氏分布或威布尔分布,由瑞典物理学家WallodiWeibull于1939年引进,是可靠性分析及寿命检验的理论基础。 Weibull分布能被应用于很多形式,包括1参数、2参数、3参数或混合Weibull。3参数的该分布由形状、尺度(范围)和位置三个参数决定。其中形状参数是最重要的参数,决定分布密度曲线的基本形状,尺度参数起放大或缩小曲线的作用,但不影响分布的形状。 另外,通过改变形状参数可以表示不同阶段的失效情况;也可以作为许多其他分布的近似,如,可将形状参数设为合适的值近似正态、对数正态、指数等分布。形状参数通常在[1,7]间取值。

一般由W(α,β)表示2个参数的Weibull分布,其分布函数为: ,其中x>0,α、β>0。 可以看出有两个参数α、β,其中β为形状参数,α为尺度参数。若取β为1,则F(x)为指数分布。 Weibull分布的概率密度函数(pdf)为:。 Weibull双参数的PDF分布见上图。(自己做的,有点粗糙) 下面我们以其pdf图看Weibull分布各参数的作用。 下图是形状参数β对pdf的影响(α固定): 下图为尺度参数α对pdf的影响(β固定),横轴为变量x,纵轴为f(x):

另外,由于Weibull分布可以近似表示其他别的分布,eg,β=1时,F(x)为指数分布。将其用到复杂网络中,则此时对应指数网络?当β逐渐增大时,是不是对应分布极不均匀的无尺度网络?这样的话可以通过调整一个参数构造不同的网络? 而**人的层次故障节点动态模型就是因此而引入Weibull分布(1参数)的吧?这样的话,β大的网络发生层次故障的规模比较大就可以理解了。再继续深入分析。

(完整版)统计学习题答案第5章参数估计

第5章 参数估计 ●1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,允许误差是多少? 解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差 x σσ5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×0.7906=1.5496。 ●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差; (5) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 x σσ15=2.1429 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为 α/2 x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。 ●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5

第二章 多元正态分布及参数的估计汇总

第二章多元正态分布及参数的估计 在多元统计分析中,多元正态分布占有相当重要的地位.这是因为许多实际问题涉及到的随机向量服从正态分布或近似服从正态分布;当样本量很大时,许多统计量的极限分布往往和正态分布有关;此外,对多元正态分布,理论与实践都比较成熟,已有一整套行之有效的统计推断方法.基于这些理由,我们在介绍多元统计分析的种种具体方法之前,首先介绍多元正态分布的定义、性质及多元正态分布中参 数的估计问题. 目录 §2.1 随机向量 §2.2 多元正态分布的定义与基本性质 §2.3 条件分布和独立性 §2.4 多元正态分布的参数估计 §2.1 随机向量 本课程所讨论的是多变量总体.把p个随机变量放在一起得X=(X1,X2,…,Xp)′为一个p维随机向量,如果同时对p维总体进行一次观测,得一个样品为p维数据.常把n个样品排成一个n×p矩阵,称为样本资料阵.

?? ? ? ?? ??'''= ?????? ??=)()2()1(2 1 2222111211n np n n p p X X X x x x x x x x x x X def =(X 1,X 2,…,X p ) 其中 X(i)( i =1,…,n)是来自p 维总体的一个样品. 在多元统计分析中涉及到的都是随机向量,或是多个随机向量放在一起组成的随机矩阵. 本节有关随机向量的一些概念(联合分布,边缘分布,条件分布,独立性;X 的均值向量,X 的协差阵和相关阵,X 与Y 的协差阵)要求大家自已复习. 三﹑ 均值向量和协方差阵的性质 (1) 设X ,Y 为随机向量,A ,B 为常数阵,则 E(AX )=A·E(X ), E(AXB )=A·E(X )·B D(AX)=A·D(X)·A' COV(AX,BY)=A·COV(X,Y)·B' (2) 若X,Y 相互独立,则COV(X,Y)=O;反之不成立. 若COV(X,Y)=O,我们称X 与Y 不相关.故有: 两随机向量若相互独立,则必不相关;

参数估计在实际问题中当所研究的总体分布类型已知但分布

第六章 参数估计 在实际问题中, 当所研究的总体分布类型已知, 但分布中含有一个或多个未知参数时, 如何根据样本来估计未知参数,这就是参数估计问题. 参数估计问题分为点估计问题与区间估计问题两类. 所谓点估计就是用某一个函数值作为总体未知参数的估计值;区间估计就是对于未知参数给出一个范围,并且在一定的可靠度下使这个范围包含未知参数. 例如, 灯泡的寿命X 是一个总体, 根据实际经验知道, X 服从),(2σμN , 但对每一批灯泡而言, 参数2,σμ是未知的,要写出具体的分布函数, 就必须确定出参数. 此类问题就属于参数估计问题. 参数估计问题的一般提法: 设有一个统计总体, 总体的分布函数为),(θx F , 其中θ为未知参数(θ可以是向量). 现从该总体中随机地抽样, 得一样本 n X X X ,,,21 , 再依据该样本对参数θ作出估计, 或估计参数θ的某已知函数).(θg 第一节 点估计问题概述 内容分布图示 ★ 引言 ★ 点估计的概念 ★ 例1 ★ 评价估计量的标准 ★ 无偏性 ★ 例2 ★ 例3 ★ 有效性 ★ 例4 ★ 例5 ★ 例6 ★ 相合性 ★ 例7 ★ 例8 ★ 内容小结 ★ 课堂练习 ★ 习题6-1 内容要点: 一、点估计的概念 设n X X X ,,,21 是取自总体X 的一个样本, n x x x ,,,21 是相应的一个样本值. θ是总体分布中的未知参数, 为估计未知参数θ, 需构造一个适当的统计量 ),,,,(?2 1 n X X X θ 然后用其观察值 ),,,(?21n x x x θ 来估计θ的值. 称),,,(?21n X X X θ为θ的估计量. 称),,,(?21n x x x θ为θ的估计值. 在不致混淆的情况下, 估计量与估计值统称为点估计,简称为估计, 并简记为θ?. 注: 估计量),,,(?21n X X X θ是一个随机变量, 是样本的函数,即是一个统计量, 对不同的样本值, θ的估计值θ?一般是不同的. 二、评价估计量的标准 从例1可见,参数点估计的概念相当宽松, 对同一参数,可用不同的方法来估计, 因而得到不同的估计量, 故有必要建立一些评价估计量好坏的标准. 估计量的评价一般有三条标准:

weibull分布资料

ZZ】关于Weibull分布(2008-11-05 15:01:16) 标签:杂谈分类:ImageProcessing 以下是从文献上看到的: 以下是https://www.360docs.net/doc/3718934598.html,/s/blog_54c7e90e010005og.html Weibull分布,又称韦伯分布、韦氏分布或威布尔分布,由瑞典物理学家Wallodi Weibull 于1939年引进,是可靠性分析及寿命检验的理论基础。

Weibull分布能被应用于很多形式,包括1参数、2参数、3参数或混合Weibull。3参数的该分布由形状、尺度(范围)和位置三个参数决定。其中形状参数是最重要的参数,决定分布密度曲线的基本形状,尺度参数起放大或缩小曲线的作用,但不影响分布的形状。 另外,通过改变形状参数可以表示不同阶段的失效情况;也可以作为许多其他分布的近似,如,可将形状参数设为合适的值近似正态、对数正态、指数等分布。形状参数通常在[1,7]间取值。 一般由W(α,β)表示2个参数的Weibull分布,其分布函数为:,其中x>0,α、β>0。 可以看出有两个参数α、β,其中β为形状参数,α为尺度参数。若取β为1,则F(x)为指数分布。 Weibull分布的概率密度函数(pdf)为:。 Weibull双参数的PDF分布见上图。(自己做的,有点粗糙) 下面我们以其pdf图看Weibull分布各参数的作用。 下图是形状参数β对pdf的影响(α固定): 下图为尺度参数α对pdf的影响(β固定),横轴为变量x,纵轴为f(x): 另外,由于Weibull分布可以近似表示其他别的分布,eg,β=1时,F(x)为指数分布。将其用到复杂网络中,则此时对应指数网络?当β逐渐增大时,是不是对应分布极不均匀的无尺度网络?这样的话可以通过调整一个参数构造不同的网络? 而**人的层次故障节点动态模型就是因此而引入Weibull分布(1参数)的吧?这样的话,β大的网络发生层次故障的规模比较大就可以理解了。再继续深入分析。 Weibull分布(韦伯分布)(2006-07-04 22:04:01) 分类:学习

《统计学》名词解释及公式

第1章统计与统计数据 一、学习指导 统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。 概念:统计学,描述统计,推断统计。 统计在工商管理中的应用。 统计的其他应用领域。 概念:分类数据,顺序数据,数值型数据。 不同数据的特点。 概念:观测数据,实验数据。 概念:截面数据,时间序列数据。 统计数据的间接来源。 二手数据的特点。 概念:抽样调查,普查。 数据的间接来源。 数据的收集方法。 调查方案的内容。 概念。抽样误差,非抽样误差。 统计数据的质量。 概念:总体,样本。 概念:参数,统计量。

概念:变量,分类变量,顺序变量,数值 型变量,连续型变量,离散型变量。 二、主要术语 1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。 2.描述统计:研究数据收集、处理和描述的统计学分支。 3.推断统计:研究如何利用样本数据来推断总体特征的统计学分支。 4.分类数据:只能归于某一类别的非数字型数据。 5.顺序数据:只能归于某一有序类别的非数字型数据。 6.数值型数据:按数字尺度测量的观察值。 7.观测数据:通过调查或观测而收集到的数据。 8.实验数据:在实验中控制实验对象而收集到的数据。 9.截面数据:在相同或近似相同的时间点上收集的数据。 10.时间序列数据:在不同时间上收集到的数据。 11.抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推 断总体特征的数据收集方法。 12.普查:为特定目的而专门组织的全面调查。 13.总体:包含所研究的全部个体(数据)的集合。 14.样本:从总体中抽取的一部分元素的集合。 15.样本容量:也称样本量,是构成样本的元素数目。 16.参数:用来描述总体特征的概括性数字度量。 17.统计量:用来描述样本特征的概括性数字度量。 18.变量:说明现象某种特征的概念。 19.分类变量:说明事物类别的一个名称。 20.顺序变量:说明事物有序类别的一个名称。 21.数值型变量:说明事物数字特征的一个名称。

统计学参数估计练习题

第7章参数估计 练习题 一、填空题(共10题,每题2分,共计20分) 1.参数估计就是用_______ __去估计_______ __。 2. 点估计就是用_______ __的某个取值直接作为总体参数的_______ __。3.区间估计是在_______ __的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减_______ __得到。 4. 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为_______ __,也成为_______ __。 5.当样本量给定时,置信区间的宽度随着置信系数的增大而_______ __;当置信水平固定时,置信区间的宽度随着样本量的增大而_______ __。 6. 评价估计量的标准包含无偏性、_______ __和_______ __。 7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计的可靠程度,就会_______ __置信区间的宽度;如要缩小置信区间的宽度,又不降低置信程度,就要_______ __样本量。 8. 估计总体均值置信区间时的估计误差受总体标准差、_______ __和_______ __的影响。 9. 估计方差未知的正态总体均值置信区间用公式_______ __;当样本容量大于等于30时,可以用近似公式_______ __。 10. 估计正态总体方差的置信区间时,用_____ __分布,公式为______ __。 二、选择题(共10题,每题1分,共计10分) 1.根据一个具体的样本求出的总体均值的95%的置信区间 ( )。 A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D. 要么包含总体均值,要么不包含总体均值 2.估计量的含义是指( )。 A. 用来估计总体参数的统计量的名称

Poisson分布的参数估计

Poisson 分布的参数估计 作者:高晨 指导老师:戴林送 摘要 泊松分布是概率统计学科中一种重要的离散分布,在参数估计这块,对点估计,矩估计,最大似然 估计以及近似的区间估计等,该文中对泊松分布的相关知识,包括其性质,参数的相关估计,研究了泊松分布的一些性质,参数的估计,以及一些在生活中的简单应用。 关键词 P o i s s o 分布 参数估计 性质 简单应用 1 引言 Poisson 分布是离散型随机变量X 作为大量试验中稀有事件出现的频数的概率分布的数学模型,其中X 可能取值为0,1,2,……而取各个值的概率为: {},0,1,2! k e P x k k k λ λ-== = 其中0λ>是常数,称X 服从参数为λ的泊松~(;)X P k x . 1.1相关定义 1. 离散型随机变量X 的函数分布律{},0,1,2k k P X x P k === ,若级数1k k k x p ∞ =∑绝 对收敛,称级数 1 k k k x p ∞ =∑为随机变量X 的数学期望[]E x , []E x =1k k k x p ∞ =∑. 2. 定理:Y 是随机变量X 的函数,(),(Y g x g =是连续函数),X 是离散型随机变量, 若 1 ()k k k g x p ∞ =∑绝对收敛,则 [][()]E Y E g x ==1 ()k k k g x p ∞ =∑. 3. 随机变量X ,若2{[()]}E X E X -存在,则称2{[()]}E X E X -为X 的方差,记 为()D x 或()Var x ,即 ()D x =()Var x =2{[()]}E X E X -.

应用统计学:参数估计习题及答案

简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25

公顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下: 试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差

统计学——参数估计

第8 讲参数估计 本讲的主要内容 8.1 参数估计的一般问题 8.2 一个总体参数的区间估计 8.3 两个总体参数的区间估计 8.4 样本量的确定 学习目标 1.估计量与估计值的概念 2.点估计与区间估计的区别 3.评价估计量优良性的标准 4.一个总体参数的区间估计方法 5.两个总体参数的区间估计方法 6.样本量的确定方法 8.1 参数估计的一般问题 8.1.1 估计量与估计值 估计量与估计值(estimator & estimated value) 1.估计量:用于估计总体参数的随机变量 如样本均值,样本比例, 样本方差等 例如: 样本均值就是总体均值m 的一个估计量 2.参数用θ表示,估计量用表示 3.估计值:估计参数时计算出来的统计量的具体值 如果样本均值?x=80,则80就是m的估计值 8.1.2 点估计与区间估计 点估计 (point estimate) 1.用样本的估计量的某个取值直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计 2.无法给出估计值接近总体参数程度的信息 ⑴虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值 ⑵一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量 区间估计 (interval estimate) 1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到 2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在75~85之间,置信水平是95% 区间估计的图示

统计学名词解释

名词解释: 医学统计学:用统计学的原理和方法研究生物医学问题的一门学科。 变量(variable):观察单位的某项特征 变量值(value of variable):变量的观察结果(测量值) 总体(population):是根据研究目的确定的同质的观察单位的全体,确切的说是同质的所有的观察单位某种变量值的集合。 样本(sample)从总体中随机抽取部分由代表性的观察单位,其测量值的集合称为样本。 随机抽样(random sample):按随机化原则从总体中抽取部分观察单位的过程。 同质(homogeneity):是针对被研究指标来讲,其影响因素相同。简单地理解就是指对研究指标影响大约可以控制的主要因素应尽可能相同。 变异(variation):指在自然地状态下,个体测量结果在同质基础上的差异。 等级资料(ordinal data):将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位称为等级资料,如患者的治疗结果可分为治愈,好转,有效,无效,死亡。有序变量(定性变量的一种)。 概率(probability):是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大,0

随机误差(random error):排除了系统误差后的尚存的误差,受多种因素影响,使观察值不按照方向性和系统性而随机的变化,误差变量一般服从正态分布,可以通过统计处理来估计。 系统误差(system error):由于受试对象,研究者,仪器设备,研究方法等非实验因素影响等确定性原因造成,有一定倾向性或规律性的误差,可以避免。 随机变量(random variable):是指取值不能事先确定的观察结果,不能用一个正常数来表示,每个变量的取值服从特定的概率分布。 参数(parameter):根据总体分布特征而计算的总体统计指标。 统计量(statistic):由总体中随机抽取样本而计算的相应样本指标。 频数表(frequency table):将各变量值及其相应的频数列出表格形式,用来表示一批数据各观察值出现的频繁程度。 算术均数(arithmetic mean):描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X表示。 几何均数(geometric mean):描述对数正态分布或数据呈倍数变化资料的水平,记为G. 中位数(median),将一组观察值由小到大排列,n为奇数时取位次居中的变量值,为偶数时,取位次居中的两个变量的平均值。 极差(range):又称全距,为最大值与最小值之差,用于资料的粗略分析,计算简便但稳定性较差。符号R. 百分位数(percentile):将n个观察值从小到大依次排列,再把它们的位次转化为百分位。

相关文档
最新文档