第18讲参数的点估计判别估计量好坏的标准(精)

第18讲参数的点估计判别估计量好坏的标准(精)
第18讲参数的点估计判别估计量好坏的标准(精)

第18讲 参数的点估计 判别估计量好坏的标准

教学目的:理解参数点估计的概念,掌握矩估计法和最大似然估计法。了解无偏性、

有效性及一致性等估计量优劣的评价标准,了解样本均值与样本方差作为总体均值与总体方差估计量的无偏性和一致性。

教学重点:参数点估计的矩估计法和最大似然估计法。 教学难点:参数点估计的最大似然估计法。 教学时数: 2学时。 教学过程:

第六章 参数估计

§6.1参数的点估计

设总体X 服从某已知分布,如()2,N μσ,()e θ,()πλ等,但是其中的一个或多个参数为未知,怎样根据抽取的样本估计未知参数的值,就是参数的点估计问题。

定义 设总体X 的分布中含有未知参数θ,从总体X 中抽取样本12,,

,n X X X ,构

造某个统计量12?(,,,)n X X X θ作为参数θ的估计,则称12?(,,,)n X X X θ为参数θ的点估计量;若样本12,,,n X X X 的观测值为12,,

,n x x x ,则称12

?(,,,)n x x x θ为参数θ的点

估计值。

例如,人的身高()2~,X N μσ,一个样本为12,,

,n X X X ,则()11

n X X X n

=

++为

n 个人的平均身高,近似认为总体均值μ为X ,即?X μ

=。用X 来估计μ,这里?μ不是真值,而是估计值。

若总体的分布中含有m (m>1)个未知参数,则需构造m 个统计量作为相应m 个未知参数的点估计量。下面介绍两种常用的求未知参数点估计量的方法。

1.矩估计法

(1)总体k 阶原点矩()k

E X ,样本k 阶原点矩 1

1n k

i i X n =∑,1,2,

k =;

(2)总体k 阶中心矩()k

E X E X -????,样本k 阶中心矩()1

1n

k i i X X n =-∑,1,2,k =。

用相应的样本矩来估计总体矩,如()?E X X =,()()21

1?n

i i D X X X n ==-∑等。同样由于()()()2

2

[]D X E X E X =-,故有()()()22221

1???[]n

i

i D X E X E X X X n ==-=-∑。 例1 设()2~,X N μσ,()E X μ=,()2D X σ=,一个样本为12,,

,n X X X 。则

()11??n i i E X X X n μ

====∑, ()()2211??n i i D X X X n σ===-∑或221

1n i i X X n =-∑。 例2 设~X ()P λ,()E X λ=,一个样本为12,,

,n X X X ,则

()??E X X λ

==1

1n

i i X n ==∑ 例3 设~X ()e θ, ()E X θ= ,一个样本为12,,

,n X X X ,则

?X θ=1

1n

i

i X n ==∑ 若~X 1e λ?? ???,则有()()()1111?, , ?E X E X X E X λλ

λ====。 由于参数θ可以由其总体的各阶原点矩表示出来,即

()()()(

)

2,,

,k g E X E X E X θ=

此时,用样本原点矩来估计总体原点矩代入上面的函数中就可以得到参数θ的估计,

()()()(

)

221

111????,,,,,

,n n k k i i i i g E X E X E X g X X X n n θ

==??== ???

∑∑ 因此,求θ的矩估计的关键就在于找出关系()()()()

2,,

,k g E X E X E X θ=。

例4 设~X (),U a b ,一个样本为12,,,n X X X ,求参数,a b 的矩估计。

解 因为

()()()()()()()22

2 2123a b E X b E X a E X a b a D X D X +?

=?=-??

?--?

=?=??

()

(

) a E X b E X =-=

(

)

??a E X X ==- ()

??b E X X =2. 最大似然估计法

设总体X 的一个样本为(12,,

,n X X X )

,由样本的独立性可得 ()()()

()()12121,,

,n

n n i i f x x x f x f x f x f x ===∏

其中();f x θ为总体X 的分布密度函数,θ为未知参数。设()12?,,,n h X X X θ=是θ的

点估计量,则()12?,,,n h X X X θ=取样本值12,,

,n x x x 的概率应最大,于是我们选取?

θ使得12,,

,n x x x 最可能出现,步骤如下:

(1)令()()121,,

,;n

n i i L f x x x f x θ===∏

(2)()1

ln ln ;n

i i L f x θ==∑

(3)(ln )0L θ

'= (4)求出最大值点0θ,则0

?θθ=。 例 5 设~X ()e θ, ()E X θ= ,一个样本为12,,

,n X X X ,其观测值为

12,,,n x x x ,求θ的最大似然估计。 解

(1)令()1

1

111

1

;n

i

i

i x n n

x i n

i i L f x e

e

θ

θ

θθθ

=-

-

==∑===

∏∏

(2)1

1

ln ln n

i i L n x θθ

==--

(3)2211

11(ln )n n

i i i i n n L x x θ

θθθθ==????'=---=-+ ? ?????∑∑ (4)令(ln )0L θ

'=,则211

11

10, , n

n

n

i i i i i i n

x n x x n θθθθ===-+===∑∑∑。故 1

1?n

i

i X X n θ===∑ §6.2 判别估计量好坏的标准

上一节我们学习了两种参数点估计的方法,它们是矩估计法和最大似然估计法。对于同一个未知参数,用不同的估计法得到的点估计量一般是不相同的,那么哪一个估计量更好呢?为此我们需要建立判别估计量好坏的标准,而参数θ的所谓“最佳估计量”

),,,(?21n

X X X θ应当是在某种意义下最接近于θ。 最佳估计量),,,(?21n X X X θ应具有下列性质: (1) 无偏性

若?θ=),,,(?21n

X X X θ的数学期望E (?θ)=θ,则称?θ是参数θ的无偏估计量。 设样本观测值为n x x x ,,,21 ,则称),,,(?21n

x x x θ为参数θ的无偏估计值。

例 6 设总体X 的均值()E X μ=,方差2

)(σ=X D ,证明样本均值1

1n

i i X X n ==∑是

总体均值μ的无偏估计量。

证 因为样本n X X X ,,,21 相互独立,且与总体X 服从相同分布,所以有

2)(,)(σμ==i i X D X E n i , ,2 ,1 =

由于

()()111

111111n n n

n i i i i i i i E X E X E X E X n n n n n n μμμ====????=====?= ? ?????∑∑∑∑

所以样本均值X 是总体均值μ的无偏估计量。

(2)有效性

设1?θ=),,,(?211n X X X θ与2

?θ=),,,(?212n X X X θ都是参数θ的无偏估计量,若 )?(1θD <)?(2

θD 则称1?θ较2

?θ有效。 有效估计量:当样本容量n 一定时,若θ的所有无偏估计量中,?θ的方差()

?D θ

最小,则称?θ是参数θ的有效估计量。

例7 证明样本均值X 作为总体均值μ的估计量较个别样本i X (n i , ,2 ,1 =)有效。 证 由例1知,X 与i X 都是总体均值μ的无偏估计量,即

(),E X μ=(),i E X μ=n i , ,2 ,1 =

∑∑====n

i i n i i X D n

X n D X D 1

2

1)(1

)1()(=n n n 22

21σσ=,而2)(σ=i X D ,n i , ,2 ,1 = 所以当2≥n 时,()()i D X D X <,故样本均值X 作为总体均值μ的估计量较个别样本

i X (n i , ,2 ,1 =)有效。

例8 从总体X 中抽取样本321,,X X X ,证明下列三个统计量

632?3211

X X X ++=θ,442?3212X X X ++=θ,3

33?3213

X X X ++=θ 都是总体均值()E X μ=的无偏估计量,并确定哪个估计量更有效。

证 μμμμθ=++=++=6

32)632()?(3211

X X X E E μμμμθ=++=++=4

42)442()?(3212

X X X E E

μμμμθ=++=++=3

33)333()?(3213

X X X E E 所以三个统计量都是总体均值μ的无偏估计量。

22

223211

72

283694)632()?(σσσσθ=++=++=X X X D D

2

222321272

2716164)442()?(σ

σσσθ=++=++=X X X D D 22

223213

72

24999)333()?(σσσσθ=++=++=X X X D D 由于2372

24)?(σθ=D 的值最小,所以3

?θ是三个估计量中最有效估计量。 (3)一致性

若对于任意给定的正数ε,有 lim n →∞

P (?n θθε-<)=1, 则称?n

θ是参数θ的一致估计量。

例9 设总体X 的均值()E X μ=, 方差2)(σ=X D ,证明样本均值X 是总体均值

μ的一致估计量。

证 因为样本n X X X ,,,21 相互独立,且与总体X 服从相同的分布,所以

2)(,)(σμ==i i X D X E ,n i , ,2 ,1 =

于是,由切比雪夫定理知:

lim n →∞P ()()

1111 lim P X-1n n

i i n i i X E X n n εμε→∞==??-<=<= ???

∑∑ 所以X 是μ的一致估计量。

对于未知参数θ的估计量,我们可以运用无偏性、有效性、一致性来判断其优劣, 以便选择出较好的估计量。

点估计的评价标准

第三讲点估计的评价标准 副教授 主讲教师叶宏

在前两讲中我们介绍了两种点估计法,发现了点估计 的不唯一性,即对于同一个未知参数,不同的方法得到的 估计量可能不同,于是提出问题: 应该选用哪一种估计量?用何标准来评价一个估计量的好坏? 常用 标准(1) 无偏性(3) 一致性(2) 有效性 这一讲我们介绍

估计量是随机变量,对于不同的样本值会得到不同的估计值. 我们希望估计值在未知参数真值附近摆动,而它的期望值等于未知参数的真值. 这就导致无偏性这个标准. (1) 无偏性 θ θ=)?(E 则称为的无偏估计.θ ?θ),,(?1n X X θ设是未知参数的估计量,若 θ.真值 ???????????? ??

),,,(21n X X X 是总体X 的样本, 证明: 不论X 服从什么分布(但期望存在), 是k μ的无偏估计量. 证∑∑====n i k i n i k i k X E n X n E A E 11)(1)1()(例设总体X 的k 阶矩)(k k X E =μ存在, 因而n i X E k k i ,,2,1)( ==μ由于k k n n μμ=??=1∑==n i k i k X n A 1 1特别地 样本二阶矩∑==n i i X n A 1 221是总体二阶矩是总体期望E ( X ) 的X 样本均值无偏估计量 )(2 2X E =μ的无偏估计量

例设总体X 的期望与方差存在,X 的样本为) ,,,(21n X X X (1) 不是D ( X )的无偏估计; ∑=-=n i i n X X n S 1 2 2)(1(2) 是D ( X ) 的无偏估计. ∑=--=n i i X X n S 1 2 2)(11原样本方差样本修正方差 2 221)(σσ≠-=n n S E n () 2 2 σ =S E 2 221lim ()lim n n n n E S n σσ →∞→∞-==是D ( X )的渐进无偏估计2n S

评价估计量好坏的标准

毕业论文 题目:评价估计量好坏的标准 作者: 指导教师: 职称:副教授 院系:理学院数学系 专业:信息与计算科学 班级:2009级01班 日期:2013年06月

评价估计量好坏的标准 摘要:未知参数的估计通常有很多种,一个好的估计量应该在多次观测中,其观测值围绕被估计参数的真值摆动。人们总是希望估计量能代替真实参数,为正确评价估计量,要建立判别估计量好坏的标准.根据不同的要求,评价估计量可以有各种各样的标准。所以,对于一个估计量的优良性进行判别显得尤为重要。本文主要总结估计量优良性的若干判别准则,如无偏性、有效性、一致性、一致最小方差无偏估计、均方误差,这些常见的判别方法被我们所学习和使用,但是都只是在理论上具有可行性,而在实际生活学习和使用中,并没有人对这些常见的判别方法给出实用性的充分证明。通过本文的研究,进一步了解了估计量优良性的一些判别准则,为今后更好地学习与应用估计量打下了基础。 关键词:无偏性;一致性;有效性;一致最小方差无偏估计;均方误差

The evaluation criterion of the criterion of estimation Abstract: estimates of the unknown parameters usually has many kinds, a good estimation should be in multiple observations, the observations on the true values of parameters are estimated to swing. People always want to replace the real parameter estimation, estimation is evaluated correctly, to establish discriminant estimation quality standards. According to different requirements, evaluation estimator can have a variety of standard. So, is very important for a good estimate of the amount of discrimination is. This paper summarizes the estimator optimality criteria, such as unbiasedness, efficiency, consistency, uniformly minimum variance unbiased estimator, mean square error, these common discriminant method is we have to learn and use, but are only is feasible in theory, but in real life, to learn and use, no one of these discriminant and give a practical method of common fully proved. Through this research, the further understanding of the estimator and benign some criteria, for further study and application of estimation of foundation. Keywords: unbiased; consistency; effectiveness; the uniformly minimum variance unbiased estimate; mean square error

(完整版)统计学习题答案第5章参数估计

第5章 参数估计 ●1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,允许误差是多少? 解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差 x σσ5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×0.7906=1.5496。 ●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差; (5) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 x σσ15=2.1429 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为 α/2 x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。 ●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5

6.2点估计的评价标准 (1)

6.2点估计的评价标注 我们已经看到,点估计有各种不同的求法,为了在不同点估计间进行比较选择,就必须对各种点估计的好坏给出评价标准. 数理统计中给出了众多的估计量评价标准,对同一估计量实用不同的评价标准可能会得到完全不同的结论,因此在评价某一个估计好坏时首先要说明是在哪一个标准下,否则所论好坏则毫无意义. 但不管怎么说,有一个基本标准时所有的估计都应该满足的,它是衡量一个估计是否可行的必要条件,这就是估计的相合性,我们就从相合性开始。 6.2.1 相合性 我们知道,点估计是一个统计量,因此它是一个随机变量,在样本量一定的条件下,我们不可能要求它完全等同于参数的真实取值。但如果我们有足够的观测值,根据格里文科定理,随着样本量的不断增大,经验分布函数逼近真实分布函数,因此完全可以要求估计量随着样本量的不断增大而逼近参数真值,这就是相合性,严格定义如下: 定义6.2.1 设θ∈Θ为未知参数, ()12,,,n n n x x x θθ∧∧ =是θ的一个估计量, n 是样本容量,若对任何一个0ε>,有 () ?lim 0n n P θθε→∞ ->= 则称?n θ为参数θ的相合估计。 相合性被认为是对估计的一个最基本的要求,如果一个估计量,在样本量不 断增大时,它都不能把被估参数估计到任意指定的精度,那么这个估计值是很值得怀疑的。通常,不满足相合性要求的估计一般不予考虑。证明估计的相合性一般可应用大数定律或直接由定义来证。 若把依赖于样本量n 的估计量?n θ看作一个随机变量序列,相合性就是?n θ依概率收敛于θ,所以证明估计的相合性可应用依概率收敛的性质以及各种大数定律。 例6.2.1 设12,, x x 是来自正态总体()2 ,N μσ的样本,则有辛钦大数定律 及依概率收敛的性质知: x 是μ的相合估计; *2s 是2σ相合估计; 2s 也是2σ的相合估计。 由此可见参数的相合估计不止一个。 在判断估计的相合性时下述两个定理是很有用的。 定理 6.2.1 设()12,, ,n n n x x x θθ∧∧ =是θ的一个估计量,若 ??lim ()lim ()0,n n n n E Var θθθ→+∞ →+∞ ==, 则?n θ是θ的相合估计。

第二章 多元正态分布及参数的估计汇总

第二章多元正态分布及参数的估计 在多元统计分析中,多元正态分布占有相当重要的地位.这是因为许多实际问题涉及到的随机向量服从正态分布或近似服从正态分布;当样本量很大时,许多统计量的极限分布往往和正态分布有关;此外,对多元正态分布,理论与实践都比较成熟,已有一整套行之有效的统计推断方法.基于这些理由,我们在介绍多元统计分析的种种具体方法之前,首先介绍多元正态分布的定义、性质及多元正态分布中参 数的估计问题. 目录 §2.1 随机向量 §2.2 多元正态分布的定义与基本性质 §2.3 条件分布和独立性 §2.4 多元正态分布的参数估计 §2.1 随机向量 本课程所讨论的是多变量总体.把p个随机变量放在一起得X=(X1,X2,…,Xp)′为一个p维随机向量,如果同时对p维总体进行一次观测,得一个样品为p维数据.常把n个样品排成一个n×p矩阵,称为样本资料阵.

?? ? ? ?? ??'''= ?????? ??=)()2()1(2 1 2222111211n np n n p p X X X x x x x x x x x x X def =(X 1,X 2,…,X p ) 其中 X(i)( i =1,…,n)是来自p 维总体的一个样品. 在多元统计分析中涉及到的都是随机向量,或是多个随机向量放在一起组成的随机矩阵. 本节有关随机向量的一些概念(联合分布,边缘分布,条件分布,独立性;X 的均值向量,X 的协差阵和相关阵,X 与Y 的协差阵)要求大家自已复习. 三﹑ 均值向量和协方差阵的性质 (1) 设X ,Y 为随机向量,A ,B 为常数阵,则 E(AX )=A·E(X ), E(AXB )=A·E(X )·B D(AX)=A·D(X)·A' COV(AX,BY)=A·COV(X,Y)·B' (2) 若X,Y 相互独立,则COV(X,Y)=O;反之不成立. 若COV(X,Y)=O,我们称X 与Y 不相关.故有: 两随机向量若相互独立,则必不相关;

参数估计在实际问题中当所研究的总体分布类型已知但分布

第六章 参数估计 在实际问题中, 当所研究的总体分布类型已知, 但分布中含有一个或多个未知参数时, 如何根据样本来估计未知参数,这就是参数估计问题. 参数估计问题分为点估计问题与区间估计问题两类. 所谓点估计就是用某一个函数值作为总体未知参数的估计值;区间估计就是对于未知参数给出一个范围,并且在一定的可靠度下使这个范围包含未知参数. 例如, 灯泡的寿命X 是一个总体, 根据实际经验知道, X 服从),(2σμN , 但对每一批灯泡而言, 参数2,σμ是未知的,要写出具体的分布函数, 就必须确定出参数. 此类问题就属于参数估计问题. 参数估计问题的一般提法: 设有一个统计总体, 总体的分布函数为),(θx F , 其中θ为未知参数(θ可以是向量). 现从该总体中随机地抽样, 得一样本 n X X X ,,,21 , 再依据该样本对参数θ作出估计, 或估计参数θ的某已知函数).(θg 第一节 点估计问题概述 内容分布图示 ★ 引言 ★ 点估计的概念 ★ 例1 ★ 评价估计量的标准 ★ 无偏性 ★ 例2 ★ 例3 ★ 有效性 ★ 例4 ★ 例5 ★ 例6 ★ 相合性 ★ 例7 ★ 例8 ★ 内容小结 ★ 课堂练习 ★ 习题6-1 内容要点: 一、点估计的概念 设n X X X ,,,21 是取自总体X 的一个样本, n x x x ,,,21 是相应的一个样本值. θ是总体分布中的未知参数, 为估计未知参数θ, 需构造一个适当的统计量 ),,,,(?2 1 n X X X θ 然后用其观察值 ),,,(?21n x x x θ 来估计θ的值. 称),,,(?21n X X X θ为θ的估计量. 称),,,(?21n x x x θ为θ的估计值. 在不致混淆的情况下, 估计量与估计值统称为点估计,简称为估计, 并简记为θ?. 注: 估计量),,,(?21n X X X θ是一个随机变量, 是样本的函数,即是一个统计量, 对不同的样本值, θ的估计值θ?一般是不同的. 二、评价估计量的标准 从例1可见,参数点估计的概念相当宽松, 对同一参数,可用不同的方法来估计, 因而得到不同的估计量, 故有必要建立一些评价估计量好坏的标准. 估计量的评价一般有三条标准:

§7.2 点估计的评价标准

§7.2 点估计的评价标准 同一参数可以有几种不同的估计,这时就需要判断采用哪一种估计为好的问题。另一方面,对于同一个参数,用矩法和极大似然法即使得到的是同一个估计, 也存在衡量这个估计优劣的问题。估计量的评选标准就是:评价一个估计量“好”与“坏”的标准。评价一个估计量的好坏, 不能仅仅依据一次试验的结果, 而必须由多次试验结果来衡量. 因为估计量是样本的函数, 是随机变量. 故由不同的观测结果, 就会求得不同的参数估计值. 因此一个好的估计, 应在多次重复试验中体现出其优良性. 估计量的评价一般有三条标准:1. 无偏性;2. 有效性;3. 相合性(一致性) 一.无偏性 估计量是随机变量, 对于不同的样本值会得到不同的估计值. 一个自然的要求是希望估计值在未知参数真值的附近, 不要偏高也不要偏低. 由此引入无偏性标准. 定义1 设),,(?1n X X θ是未知参数θ的估计量, 若,)?(θθ=E 则称θ?为θ的无偏估计量. 若?()E θ θ≠称?θ为有偏估计量,?()E θθ-并称为估计量 ?θ的偏差.如果?θ是有偏估计量,??lim (),n E θθθθ→∞ =但,则称是的渐近无偏估计量 注: 无偏性是对估计量的一个常见而重要的要求, 其实际意义是指估计量没有 系统偏差,只有随机偏差. 在科学技术中, 称θθ -)?(E 为用θ?估计θ而产生的系统误差. 定理1 设12,,n X X X 为取自总体X 的样本,总体X 的均值为μ, 方差为2σ.则 (1) 样本均值X 是μ的无偏估计量; (2) 样本方差2S 是2σ的无偏估计量; (3) 样本二阶中心矩221 1()n i i B X X n ==-∑是2σ的不是无偏估计量.,是渐近无偏估计量 证明:(1)因为 12,,n X X X 独立同分布,且()i E X μ=所以 11 111()()n n i i i i E X E X E X n n n n μμ==??===?=∑∑???? 故X 是μ的无偏估计量; (2)因 2222221111111()2()111n n n n i i i i i i i i S X X X X X nX X nX n n n ====????=-=-+=-∑∑ ???---???? ∑∑ 注意到 2 2222222()()[()],()()[()], i i i E X D X E X n E X D X E X σμσμ=+=+=+=+ 于是,有 22 222222111()()()().11n i i E S E X nE X n n n n n σσμμσ=??????=-=+-+=∑?? ?????--????

《统计学》名词解释及公式

第1章统计与统计数据 一、学习指导 统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。 概念:统计学,描述统计,推断统计。 统计在工商管理中的应用。 统计的其他应用领域。 概念:分类数据,顺序数据,数值型数据。 不同数据的特点。 概念:观测数据,实验数据。 概念:截面数据,时间序列数据。 统计数据的间接来源。 二手数据的特点。 概念:抽样调查,普查。 数据的间接来源。 数据的收集方法。 调查方案的内容。 概念。抽样误差,非抽样误差。 统计数据的质量。 概念:总体,样本。 概念:参数,统计量。

概念:变量,分类变量,顺序变量,数值 型变量,连续型变量,离散型变量。 二、主要术语 1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。 2.描述统计:研究数据收集、处理和描述的统计学分支。 3.推断统计:研究如何利用样本数据来推断总体特征的统计学分支。 4.分类数据:只能归于某一类别的非数字型数据。 5.顺序数据:只能归于某一有序类别的非数字型数据。 6.数值型数据:按数字尺度测量的观察值。 7.观测数据:通过调查或观测而收集到的数据。 8.实验数据:在实验中控制实验对象而收集到的数据。 9.截面数据:在相同或近似相同的时间点上收集的数据。 10.时间序列数据:在不同时间上收集到的数据。 11.抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推 断总体特征的数据收集方法。 12.普查:为特定目的而专门组织的全面调查。 13.总体:包含所研究的全部个体(数据)的集合。 14.样本:从总体中抽取的一部分元素的集合。 15.样本容量:也称样本量,是构成样本的元素数目。 16.参数:用来描述总体特征的概括性数字度量。 17.统计量:用来描述样本特征的概括性数字度量。 18.变量:说明现象某种特征的概念。 19.分类变量:说明事物类别的一个名称。 20.顺序变量:说明事物有序类别的一个名称。 21.数值型变量:说明事物数字特征的一个名称。

统计学参数估计练习题

第7章参数估计 练习题 一、填空题(共10题,每题2分,共计20分) 1.参数估计就是用_______ __去估计_______ __。 2. 点估计就是用_______ __的某个取值直接作为总体参数的_______ __。3.区间估计是在_______ __的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减_______ __得到。 4. 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为_______ __,也成为_______ __。 5.当样本量给定时,置信区间的宽度随着置信系数的增大而_______ __;当置信水平固定时,置信区间的宽度随着样本量的增大而_______ __。 6. 评价估计量的标准包含无偏性、_______ __和_______ __。 7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计的可靠程度,就会_______ __置信区间的宽度;如要缩小置信区间的宽度,又不降低置信程度,就要_______ __样本量。 8. 估计总体均值置信区间时的估计误差受总体标准差、_______ __和_______ __的影响。 9. 估计方差未知的正态总体均值置信区间用公式_______ __;当样本容量大于等于30时,可以用近似公式_______ __。 10. 估计正态总体方差的置信区间时,用_____ __分布,公式为______ __。 二、选择题(共10题,每题1分,共计10分) 1.根据一个具体的样本求出的总体均值的95%的置信区间 ( )。 A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D. 要么包含总体均值,要么不包含总体均值 2.估计量的含义是指( )。 A. 用来估计总体参数的统计量的名称

Poisson分布的参数估计

Poisson 分布的参数估计 作者:高晨 指导老师:戴林送 摘要 泊松分布是概率统计学科中一种重要的离散分布,在参数估计这块,对点估计,矩估计,最大似然 估计以及近似的区间估计等,该文中对泊松分布的相关知识,包括其性质,参数的相关估计,研究了泊松分布的一些性质,参数的估计,以及一些在生活中的简单应用。 关键词 P o i s s o 分布 参数估计 性质 简单应用 1 引言 Poisson 分布是离散型随机变量X 作为大量试验中稀有事件出现的频数的概率分布的数学模型,其中X 可能取值为0,1,2,……而取各个值的概率为: {},0,1,2! k e P x k k k λ λ-== = 其中0λ>是常数,称X 服从参数为λ的泊松~(;)X P k x . 1.1相关定义 1. 离散型随机变量X 的函数分布律{},0,1,2k k P X x P k === ,若级数1k k k x p ∞ =∑绝 对收敛,称级数 1 k k k x p ∞ =∑为随机变量X 的数学期望[]E x , []E x =1k k k x p ∞ =∑. 2. 定理:Y 是随机变量X 的函数,(),(Y g x g =是连续函数),X 是离散型随机变量, 若 1 ()k k k g x p ∞ =∑绝对收敛,则 [][()]E Y E g x ==1 ()k k k g x p ∞ =∑. 3. 随机变量X ,若2{[()]}E X E X -存在,则称2{[()]}E X E X -为X 的方差,记 为()D x 或()Var x ,即 ()D x =()Var x =2{[()]}E X E X -.

应用统计学:参数估计习题及答案

简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25

公顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下: 试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差

统计学——参数估计

第8 讲参数估计 本讲的主要内容 8.1 参数估计的一般问题 8.2 一个总体参数的区间估计 8.3 两个总体参数的区间估计 8.4 样本量的确定 学习目标 1.估计量与估计值的概念 2.点估计与区间估计的区别 3.评价估计量优良性的标准 4.一个总体参数的区间估计方法 5.两个总体参数的区间估计方法 6.样本量的确定方法 8.1 参数估计的一般问题 8.1.1 估计量与估计值 估计量与估计值(estimator & estimated value) 1.估计量:用于估计总体参数的随机变量 如样本均值,样本比例, 样本方差等 例如: 样本均值就是总体均值m 的一个估计量 2.参数用θ表示,估计量用表示 3.估计值:估计参数时计算出来的统计量的具体值 如果样本均值?x=80,则80就是m的估计值 8.1.2 点估计与区间估计 点估计 (point estimate) 1.用样本的估计量的某个取值直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计 2.无法给出估计值接近总体参数程度的信息 ⑴虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值 ⑵一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量 区间估计 (interval estimate) 1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到 2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在75~85之间,置信水平是95% 区间估计的图示

参数的点估计、估计量的评价标准以及参数的区间估计讲义

第七章参数估计 内容介绍 本章主要内容是参数的点估计、估计量的评价标准以及参数的区间估计等. 内容讲解 引言: 本章将讨论统计推断,所谓统计推断就是由样本来推断总体. 当总体的某个参数未知时,用样本来对它进行估计,就是参数估计. 至于参数,目前没有准确的定义,只有一些具体的参数,本书指出三类参数: ①分布中含有的未知参数θ; ②θ的函数; ③分布的各种特证数。 § 7.1点估计 1.点估计定义:设x1,x2,…x n是总体X的一个样本,θ是它的未知参数,用一个关于x1,x2,…x n的 统计量的取值作为θ的估计值,称为θ的点估计. 2.点估计的两种常用方法 (1)替换原理和矩法估计 ① 替换原理:替换原理常指如下两句话:一是:用样本矩替换总体矩;二是:用样本矩的函数替换相应的总体矩的函数. ② 矩估计的方法:根据替换原理,用样本矩或样本矩的函数对总体的矩或矩的函数进行估计。例如: 用样本均值估计总体均值E(X),即;

用样本二阶中心矩估计总体方差,即; 用事件A的频率估计事件A的概率等. 例题1. P146 【例7-1】对某型号的20辆汽车记录其每5L汽油的行驶里程(km),观测数据如下: 29.8 27.6 28.3 27.9 30.1 28.7 29.9 28.0 27.9 28.7 28.4 27.2 29.5 28.5 28.0 30.0 29.1 29.8 29.6 26.9 【答疑编号12070101】 (2)概率函数p(x;θ)已知时未知参数的矩法估计 设总体具有已知的概率函数p(x;θ1,…,θk),(θ1,…,θk)是未知参数或参数向量,x1,…,x n是样本,假定总体的k阶原点矩μk存在,则对所有的j(0

估计量的评价标准

第二节 估计量的评价标准 设总体X 服从[0,θ]上的均匀分布,由上节例7可知?2X θ=矩,{}1?max L i i n X θ≤≤ 都是θ的估计,这两个估计哪一个好?下面我们首先讨论衡量估计量好坏的标准问题. 1.无偏性 定义7.2 若估计量(X 1,X 2,…,X n )的数学期望等于未知参数θ,即: ?()E θ θ=, (7.6) 则称?θ为θ的无偏估计量(Non -deviation estimator ). 估计量?θ的值不一定就是θ的真值,因为它是一个随机变量,若?θ是θ的无偏估计,则尽管?θ的值随样本值的不同而变化,但平均来说它会等于θ的真值. 例7.9 设X 1,X 2,…,X n 为总体X 的一个样本,E (X )=μ,则样本平均数11n i i X X n ==∑是μ的无偏估计量. 证 因为E (X )=μ,所以E (X i )=μ,i =1,2,…,n ,于是 11 11()()n n i i i i E X E X E X n n ==??== ???∑∑=μ. 所以X 是μ的无偏估计量. 例7.10 设有总体X ,E (X )=μ,D (X )=σ2,(X 1,X 2,…,X n )为从该总体中抽 得的一个样本,样本方差S 2 及二阶样本中心矩B 2=11()n i i X X n =-∑是否为总体方差σ2的无偏估计? 解 因为E (S 2)=σ2,所以S 2是σ2的一个无偏估计,这也是我们称S 2为样本方差的理由.由于 B 2= 21n S n -, 那么 E (B 2)=2211()n n E S n n σ--=, 所以B 2不是σ2的一个无偏估计. 还需指出:一般说来无偏估计量的函数并不是未知参数相应函数的无偏估计量.例如,当X ~N (μ,σ2)时,X 是μ的无偏估计量,但2 X 不是μ2的无偏估计量,事实上: 22222()()().E X D X E X n σμμ??=+= +≠??

统计学名词解释

名词解释: 医学统计学:用统计学的原理和方法研究生物医学问题的一门学科。 变量(variable):观察单位的某项特征 变量值(value of variable):变量的观察结果(测量值) 总体(population):是根据研究目的确定的同质的观察单位的全体,确切的说是同质的所有的观察单位某种变量值的集合。 样本(sample)从总体中随机抽取部分由代表性的观察单位,其测量值的集合称为样本。 随机抽样(random sample):按随机化原则从总体中抽取部分观察单位的过程。 同质(homogeneity):是针对被研究指标来讲,其影响因素相同。简单地理解就是指对研究指标影响大约可以控制的主要因素应尽可能相同。 变异(variation):指在自然地状态下,个体测量结果在同质基础上的差异。 等级资料(ordinal data):将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位称为等级资料,如患者的治疗结果可分为治愈,好转,有效,无效,死亡。有序变量(定性变量的一种)。 概率(probability):是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大,0

随机误差(random error):排除了系统误差后的尚存的误差,受多种因素影响,使观察值不按照方向性和系统性而随机的变化,误差变量一般服从正态分布,可以通过统计处理来估计。 系统误差(system error):由于受试对象,研究者,仪器设备,研究方法等非实验因素影响等确定性原因造成,有一定倾向性或规律性的误差,可以避免。 随机变量(random variable):是指取值不能事先确定的观察结果,不能用一个正常数来表示,每个变量的取值服从特定的概率分布。 参数(parameter):根据总体分布特征而计算的总体统计指标。 统计量(statistic):由总体中随机抽取样本而计算的相应样本指标。 频数表(frequency table):将各变量值及其相应的频数列出表格形式,用来表示一批数据各观察值出现的频繁程度。 算术均数(arithmetic mean):描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X表示。 几何均数(geometric mean):描述对数正态分布或数据呈倍数变化资料的水平,记为G. 中位数(median),将一组观察值由小到大排列,n为奇数时取位次居中的变量值,为偶数时,取位次居中的两个变量的平均值。 极差(range):又称全距,为最大值与最小值之差,用于资料的粗略分析,计算简便但稳定性较差。符号R. 百分位数(percentile):将n个观察值从小到大依次排列,再把它们的位次转化为百分位。

相关文档
最新文档