参数估计

参数估计
参数估计

第九章参数估计

第一节点估计

点估计的概念·总体参数合理估计的标准(无偏性、一致性、有效性)

第二节区间估计

抽样估计的精确性和可靠性·抽样平均误差与概率度·区间估计的步骤及大样本总体均值的区间估计

第三节其他类型的置信区间

σ未知,小样本总体均值的区间估计·总体成数的区间估计·总体方差的区间估计

第四节抽样平均误差

简单随机抽样的抽样平均误差·分层抽样的抽样平均误差·整群抽样的平均抽样误差·系统抽样的抽样平均误差

第五节样本容量的确定

影响样本容量的因素·抽样条件与样本容量的确定

一、填空

1.参数估计,即由样本的指标数值推断总体的相应的指标数值,它包括点估计和()。

2.对总体均值求置信区间的方法是:从()起向两侧展开一定倍数()的抽样平均误差(),并估计 很可能就包含在这个区间之内。

3.假设在某省抽样调查的1600名城镇待业人员中有1024名青年,则待业人员中青年占比重的0.95 置信区间为()。

4.在其他条件不变得情况下,如果允许误差缩小为原来的1/2,则样本容量将增加为原来的()。

二、单项选择

1.如果统计量的抽样分布的均值恰好等于被估计的参数之值,那么这一估计便可以认为是()估计。

A 有效

B 一致

C 无偏

D 精确

2.虽然随机样本和总体之间存在一定的误差,但当样本容量逐渐增加时,统计量越来越接近总体参数,满足这种情况,我们就说该统计量对总体参数是一个()的估计量。

A 有效

B 一致

C 无偏

D 精确

3.估计量的()指统计量的抽样分布集中在真实参数周围的程度。

A 有效性

B 一致性

C 无偏性

D 精确性

4.用简单随机重复抽样方法抽样,如果要使抽样误差降低50%,则样本容量需要扩大到原来的()。

A 2倍

B 3倍

C 4倍

D 5倍

5.除抽样误差X σ外,影响允许误差X Δ大小的因素还有( )。

A 总体标准差

B 样本标准差

C 推断估计的把握程度

D 随机因素。 6.在用样本指标推断总体指标时,把握程度越高则( )。

A 误差范围越小

B 误差范围越大

C 抽样平均误差越小

D 抽样平均误差越大

三、多项选择

1.在统计中,为了确定每一种估计究竟如何,就必须掌握以下标准( )。

A 无偏性

B 精确性

C 一致性

D 有效性

E 权变性 2.对于大样本,置信区间的大小主要由( )这两个量所决定。

A Z

B μ C

σ D E(X)

3.影响抽样误差的因素有( )。

A 总体标志变异程度

B 样本标志值的大小

C 样本容量

D 抽样方法

E 抽样方式

4.影响样本容量大小的因素有( )。

A 总体标准差大小

B 允许误差的大小

C 置信度

D 抽样方法

E 抽样方式

5.在其他条件不变的情况下,抽样极限误差的大小与置信度的关系是( )。

A 抽样极限误差范围越大,置信度越大

B 成正比关系

C 抽样极限误差范围越小,置信度越小

D 成反比关系

E 抽样极限误差范围越大,置信度越小 6.分层抽样误差的大小主要取决于( )。

A 总体标志值的变异程度

B 各层内标志值的变异程度

C 各层间标志值得变异程度

D 各层样本容量的大小

E 各层样本容量的分配方法 7.在概率度一定的条件下,( )。

A 置信区间越大,应抽取的单位数越多

B 置信区间越小,应抽取的单位数越多

C 抽样估计的效度要求越高,应抽取的单位数越少

D 抽样估计的效度要求越低,应抽取的单位数越少

E 应抽取的单位数也是确定的

四、名词解释

1.点估计 2.区间估计 3.置信区间

五、判断题

1.就参数估计而言,在精确性和可靠性两因素之中,精确性是矛盾的主要方面。 ( ) 2.抽样平均误差X σ可以认为是决定区间估计信度的关键因素。 ( ) 3.进行区间估计,置信水平总是预先给定的。 ( ) 4.在参数估计中,概率度的大小由显著性水平α所决定,它可以认为是决定区间估计信度的关键因素。 ( )

5.可以对置信水平作如下解释:“总体参数落在置信区间的概率是(1-α)”。 ( )

六、计算题

1.已知初婚年龄服从正态分布,根据21个人的抽样调查有:5.23=X (岁),3=S (岁),求置信水平为95%的初婚年龄的置信区间。(已知t 0。05(21) =1.721、t 0。05(20) =1.725、t 0。025(21) =2.080、t 0,025(20) =2.086)。

2.某工厂妇女从事家务劳动时间服从正态分布N (μ,2

66.0)。根据36人的随机抽样调查,每天平均从事家务劳动时间X 为:X =2.65小时。求μ的双侧置信区间(置信度取0.95和0.99两种)。

3.根据某地100户的随机抽查,其中有60户拥有电冰箱,求该地区拥有电冰箱成数P 的置信区间(置信度为0.95)。

4.某工厂根据200名青年职工的抽样调查,得知其中有60%参加各种形式的业余学习。求青年职工参加业余学习成数的区间估计。(置信水平取0.90)

5.电视台要调查电视观众收看电视剧《渴望》的收视率。问在95%的置信度下,允许误差%5+,问样本容量需要多大才能最大限度地满足调查要求?

试以0.95的置信度估计该企业职工的月平均工资收入所在范围。

7.某食品公司所生产的牛肉干中,随机抽7盒,称得各盒重量如下:9.6、10.2、9.8、10.0、10.4、9.8、10.2。如牛肉干盒重量近似于正态分布,求置信水平为95%的情况下,牛肉干盒平均重量的置信区间是多少?

8.从某校随机地抽取81名女学生,测得平均身高为163厘米,标准差为6.0厘米,试求该校女生平均身高95%的置信区间。

9.如果认为该市农民工参保率是35%,若要求在95%的置信水平上保证这一比例的估计误差不超过6%,试问调查的样本容量应该有多大?

10.若某一居民小区中住房拥有者的比例近似0.75,那么建立总宽度为0.03 的95%的置信区间,需要多大样本?若住房拥有者的比例改为0. 5,那么建立总宽度为0.03 的95%的置信区间,又需要多大样本?

11. 已知总体X服从正态分布N(100,32),1X,2X,…n X是正态总体X的样本,X为样本均值,若概率P{X≤101}≥0.95,问样本容量n至少应取多大?

七、问答题

1.简述统计量成为总体参数的合理估计的三个标准。

2.简述在参数估计中准确性和可靠性的辨正统一的关系。

参考答案

一、填空

1.区间估计

2.点估计值X 、Z

3.X σ

4.〔61.648%,66.352% 〕

5.4倍

二、单项选择

1. C

2. B

3.A

4.C

5.C

6.B

三、多项选择

1.ACD

2.AC

3.ACDE

4.ABCDE

5.ACD

6.BDE

7.BC

四、名词解释

1.点估计

所谓点估计,就是根据样本数据算出一个单一的估计值,用它来估计总体的参数值。 2.区间估计 所谓区间估计,就是计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上,确定总体参数的所在范围或区间。

3.置信区间

置信区间就是我们为了增加参数被估计到的信心而在点估计两边设置的估计区间。

五、判断题

1.( √ )

2.( × )

3.( √ )

4.( √ )

5.( × )

六、计算题

1. 【2

2.10,24.90】

已知α=0.05,t 0,025(20) =2.086,

1-n S =1

213-=0.67 X ±2

/αt 1

-n S

=23.5±2.086?0.67=23.5±1.39762 置信区间为22.10和24.90之间 2. 【2.4344,2.8656】、【2.3662,2.9338】 已知α=0.05,2/αz =1.96,X -2/αZ n S ≤μ≤X +2/αZ n S

,2.65±1.96?36

66.0=【2.4344,2.8656】

已知α=0.01,2/αz =2.58,-2/αZ n S ≤μ≤+2/αZ n S ,2.65±2.58?36

66.0=【2.3662,2.9338】

3. 【0.5040,0.6960】

已知α=0.05,2/αz =1.96,置信区间为

(∧

p -2

/αZ n pq ,∧

p +2/αZ n pq

)0.6±1.96?100

4.0*6.0=【0.5040,0.6960】 4. 【0.5428,0.6572】

5. 【384,样本取整数400】

6. 【355.6,363.6】 【338.5,380.6】 N=

∑f =50,X =

∑∑f

fX =359.6, S =()

N

X X ∑-2

=76,

X -2

/αZ n S ≤μ≤X +2/αZ n

S ,(已知α=0.05,2/αz =1.96,)359.6±1.96

50

76=【338.5,380.6】

7. 【9.74,10.24】

【9.74,10.26】

X =

N

X ∑=7

2.108.94.10108.92.106.9++++++=10

S =

()

N

X X ∑-2

=0.262,已知α=0.05,)6(2/αt =2.4469

(-X 2

/αt 1-n S

,+X 2

/αt 1-n S

) =10±2.4469?1

7262.0-=【9.74,10.26】 8. 【161.7,164.3】

9. 【971】 10.【3201】【4268】 11. 109.89 np=100,npq=9,

q=0.09,则p=0.91,所以n=

91

.0100

=109.89 七、问答题

1. 简述统计量成为总体参数的合理估计的三个标准。 估计量如果具有无偏性、一致性和有效性这三个要求或标准,就可以认为这种统计量是总体参数的合理估计或最佳估计。 (1)无偏性

如果统计量的抽样分布的均值恰好等于被估计的参数之值,那么这一估计便可以认为是

无偏估计。

(2)一致性

虽然随机样本和总体之间存在一定的误差,但当样本容量逐渐增加时,统计量越来越接近总体参数,满足这种情况,我们就说该统计量对总体参数是一个一致的估计量。

(3)有效性

估计量的有效性指统计量的抽样分布集中在真实参数周围的程度。如果估计是无偏的,就可以用估计量的标准差来量度这种集中程度。标准差越小,估计量的有效性越高。

总而言之,如果一个估计量满足无偏性、一致性和有效性这三条准则,就可称其为最佳估计量。数理统计知识证明,只要样本容量大一些,用样本均值作为总体均值的估计量,总能满足上述三个标准,所以可以认为这是质量很高的点估计。

2.简述在参数估计中准确性和可靠性的辨正统一的关系。

精确性和可靠性(即效度和信度)在抽样估计中是相互矛盾的两个方面。两者的对立统一,停留在经验描述水平上是无法真正讲清楚的。这就要从参数估计的角度(而不仅仅是从假设检验的角度)来运用概率论。粗略地讲,效度和信度是成反比的。当精确程度达到最大而可信程度达到最小时,就过渡到了点估计。但若仔细分析不难发现,在参数估计中对效度和信度的要求并不是并重的。由于复杂系统内部事物矛盾运动的客观统计规律性,我们可以做点估计,即使这时估计区间为零,但估计对总体仍有一定的代表性。我们却不可以将估计区间任意放大,这样获得的可靠性对统计推论将没有任何意义。所以就此而言,在精确性和可靠性两因素之中,精确性是矛盾的主要方面。

参数估计精讲及经典案例

第21讲 参数估计习题课 教学目的:1. 通过练习使学生进一步掌握矩估计和最大似然估计的计算方法; 2. 通过练习使学生理解无偏性和有效性对于评价估计量标准的重要性; 3. 通过练习使学生进一步掌握正态总体参数的区间估计和单侧置信限。 教学重点:矩估计和最大似然估计,无偏性与有效性,正态总体参数的区间估计。 教学难点:矩估计,最大似然估计,正态总体参数的区间估计。 教学时数:2学时。 教学过程: 一、知识要点回顾 1. 矩估计 用各阶样本原点矩n k i i 1 1x n k V ==∑ 作为各阶总体原点矩k EX 的估计,1,2,k = 。若有参 数2g(,(),,)k E X E X E X θ= ()(),则参数θ的矩估计为 n n n 2i=1i=1i=1 111?(,,,)k i i i X X X n n n θ=∑∑∑ 。 2. 最大似然估计 似然函数1()(;)n i i L f x θθ==∏,取对数ln[()]L θ,从 ln() d d θθ =0中解得θ的最大似然估计θ?。

3. 无偏性,有效性 当θθ=?E 时,称θ?为θ的无偏估计。 当21?D ?D θθ<时,称估计量1?θ比2 ?θ有效。 5. 两个正态总体均差值的区间估计 当21σ和2 2σ已知时,12μμ-的置信水平为1α-的置信区间为 当21σ和22σ未知时,12μμ-的置信水平为1α-的置信区间为 二 、典型例题解析 1.设,0()0, 0x e x f x x θθ-?>=?≤? ,求θ的矩估计。

解 ,0 dx xe EX x ?+∞ -=θθ设du dx u x x u θ θ θ1 ,1 ,= = = 则0 0011 1()0()u u u EX ue du ue e du e θθθθ+∞+∞--+∞ --+∞????==-+=+-??? ?????=θ 1 故1EX θ= ,所以x 1?=θ 。 2. 设总体X 在[]b a ,上服从均匀分布,求a 和b 的矩估计。 解 由均匀分布的数学期望和方差知 1 ()()2 E X a b =+ (1) 21()()12 D X b a =- (2) 由(1)解得a EX b -=2,代入(2)得2)22(121a EX DX -=, 整理得2)(3 1 a EX DX -=,解得 ()()a E X b E X ?=?? =?? 故得b a ,的矩估计为 ??a x b x ?=-??=+?? 其中∑=-=n i i x x n 1 22 )(1?σ 。 3.设总体X 的密度函数为(;)! x e f x x θ θθ-= ,求θ的最大似然估计。 解 设)!)...(!)(!(),()(2111n n x n i i x x x e x f L n i i θ θ θθ-=∑===∏,则 1 1 ln ()()ln ln(!)n n i i i i L x n x θθθ===--∑∑ 11 ln ()11?0, n n i i i i d L x n x x d n θθθθ===-===∑∑

参数估计教程

目录 参数估计 ________________________________________________________________________________ 3 第一节抽样推断的基本概念与原理 ________________________________________________________ 3 一、抽样推断的特点和作用 _____________________________________________________________ 3 二、重复抽样与不重复抽样 _____________________________________________________________ 4 三、抽样误差与抽样平均误差 ___________________________________________________________ 4 四、抽样推断的理论基础 _______________________________________________________________ 6 五、参数估计的基本步骤 _______________________________________________________________ 7 第二节参数估计中的点估计 ______________________________________________________________ 7 一、总体参数的点估计 _________________________________________________________________ 7 二、点估计量的优良标准 _______________________________________________________________ 7 第三节参数估计中的区间估计 ____________________________________________________________ 8 一、参数估计的精度与抽样平均误差计算 _________________________________________________ 8 二、参数估计的误差范围与概率度 _______________________________________________________11 三、总体参数的区间估计 ______________________________________________________________ 12 第四节抽样组织方式及其参数估计 _______________________________________________________ 13 一、简单随机抽样 ____________________________________________________________________ 13 二、分层抽样 ________________________________________________________________________ 14 三、机械抽样 ________________________________________________________________________ 16 四、整群抽样 ________________________________________________________________________ 16 第五节必要样本容量的确定 _____________________________________________________________ 17 一、平均数的必要样本容量 ____________________________________________________________ 17 二、成数的必要样本容量 ______________________________________________________________ 18 三、影响必要样本容量的因素 __________________________________________________________ 19 习题 ___________________________________________________________________ 错误!未定义书签。

第二章 参数估计

第二章 参数估计 一、填空题 1、总体X 的分布函数为);(θx F ,其中θ为未知参数,则对θ常用的点估计方法有 , 。 2、设总体X 的概率密度为 (),(;)0, x e x f x x θθ θθ--?≥=?

该总体的一个样本,设用矩法求得

μ的估计量为1?μ 、用极大似然法求得μ的估计量为2?μ,则1?μ=2?μ。 _________________ 8、?n θ是总体未知参数θ的相合估计量的一个充分条件是_______ . 解:??lim (), lim Var()0n n n n E θθθ→∞ →∞ ==. 9、已知1021,,x x x Λ是来自总体X 的简单随机样本,μ=EX 。令 ∑∑==+=10 7 6 181?i i i i x A x μ ,则当=A 时,μ?为总体均值μ的无偏估计。 10、 设总体()θ,0~U X ,现从该总体中抽取容量为10的样本,样本值为 0.51.30.61.7 2.21.20.81.5 2.01.6, , , , , , , , , 则参数θ的矩估计为 。 11、 设1?θ与2?θ都是总体未知参数θ的估计,且1?θ比2?θ有效,则1?θ与2?θ的期望与方差满足_______ . 解:1212 ????()(), ()()E E D D θθθθ=<. 12、设1?θ和2?θ均是未知参数θ的无偏估计量,且)?()?(2221θθE E >,则其中的统计量 更有效。 13、在参数的区间估计),(21θθ中,当样本容量n 固定时,精度12θθ-提高时,置信度α-1 。 14、设n X X X ,,,21Λ是来自总体)1,(~μN X 的样本,则μ的置信度为0.95的置信区间为 。 15、设n X X X ,,,21Λ是来自总体),(~2σμN X 的样本,其中2σ未知,则μ的置

(整理)参数估计方法.

第七章 参数估计 第一节 基本概念 1、概念网络图 {}???? ??? ?? ???????????????????→??????单正态总体的区间估计区间估计一致性有效性无偏性估计量的评选标准极大似然估计矩估计点估计从样本推断总体

2、重要公式和结论

例7.1:设总体),(~b a U X ,求对a, b 的矩估计量。 例7.2:设n x x x ,,,,21 是总体的一个样本,试证 (1);21 10351321x x x ++= ∧ μ (2);12541313212x x x ++=∧μ (3).12 143313213x x x -+=∧μ 都是总体均值u 的无偏估计,并比较有效性。 例7.3:设n x x x ,,,,21 是取自总体),(~2 σμN X 的样本,试证 ∑=--=n i i x x n S 1 22 )(11 是2 σ的相合估计量。

第二节 重点考核点 矩估计和极大似然估计;估计量的优劣;区间估计 第三节 常见题型 1、矩估计和极大似然估计 例7.4:设0),,0(~>θθU X ,求θ的最大似然估计量及矩估计量。 例7.5:设总体X 的密度函数为 ?????≥=--. , 0,1)(/)(其他μθ θμx e x f x 其中θ>0, θ,μ为未知参数,n X X X ,,,21 为取自X 的样本。试求θ,μ的极大似然估计量。 2、估计量的优劣 例7.6:设n 个随机变量n x x x ,,,21 独立同分布, ,)(11,1,)(1 22 12 1∑∑==--===n i i n i i x x n S x n x x D σ 则 (A )S 是σ的无偏估计量; (B )S 是σ的最大似然估计量; (C )S 是σ的相合估计量; (D )x S 与2 相互独立。 例7.7:设总体X 的密度函数为 ?????<<-=, , 0,0),(6)(3 其他θθθx x x x f n X X X ,,,21 是取自X 的简单随机样本。 (1) 求θ的矩估计量∧ θ;

参数估计案例

大学生综合素质成绩分析 参与者:李艳 起止时间:2016.5.13-2016.5.21 学习目的: (1)掌握参数估计的统计方法,能够针对具体的数据进行实际运用 (2)深入挖掘数据,结合数据特点选择恰当的统计方法进行分析 (3)熟练使用excel 进行数据分析,并结合具体背景给出合理解释 (4)掌握统计分析报告的撰写方法 调查研究背景与现实意义 大学生是备受关注的群体,这些年轻人日后必定承担着很多责任。所以社会也很关注高校对大学生的培养。如今大学生的培养状况如何呢?高校的培养方案是否还需改进呢?让我们一起来研究一下大学生的学习状况。 调查方案的设计 数据分析 1,数据的基本信息 序号 综合素质分 性别 序号 综合素质分 性别 1 82.54 男 26 75.4 男 2 81.57 女 27 75.38 男 3 81.44 女 28 74.93 男 4 80.83 女 29 74.49 女 5 80.29 男 30 74.44 女 6 80.25 女 31 74.43 男 抽样 整理数据 总结 分析数据

7 80.14 男32 74.28 男 8 80.05 男33 73.88 男 9 79.61 女34 73.67 男 10 79.44 女35 73.21 女 11 79.22 女36 72.34 男 12 78.55 男37 72.32 女 13 78.26 女38 72.16 女 14 77.93 女39 71.64 女 15 77.9 男40 71.12 男 16 77.69 男41 70.7 女 17 77.53 女42 69.87 女 18 77.16 男43 69.87 女 19 77.09 女44 69.48 男 20 77.09 女45 68.09 男 21 76.86 女46 67.84 女 22 76.59 女47 67.26 男 23 76.53 男48 66.68 男 24 76.08 男49 64.55 男 25 75.63 女50 64.25 男 分组人数女生男生 60-65 2 0 2 65-70 7 3 4 70-75 14 7 7 75-80 19 11 8 80-85 8 4 4

参数估计练习题

第七章参数估计练习题 一.选择题 1. 估计量的含义是指() A. 用来估计总体参数的统计量的名称 B. 用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体取值 2.一个95%的置信区间是指() A. 总体参数有95%的概率落在这一区间内 B. 总体参数有5%的概率未落在这一区间内 C. 在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数。 D. 在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数。 %的置信水平是指() A. 总体参数落在一个特定的样本所构造的区间内的概率是95% B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95% C.总体参数落在一个特定的样本所构造的区间内的概率是5% D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5% 4. 根据一个具体的样本求出的总体均值的95%的置信区间() A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C. 一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 5. 当样本量一定时,置信区间的宽度() A.随着置信水平的增大而减小 B. .随着置信水平的增大而增大 C.与置信水平的大小无关D。与置信水平的平方成反比 6. 当置信水平一定时,置信区间的宽度() A.随着样本量的增大而减小 B. .随着样本量的增大而增大 C.与样本量的大小无关D。与样本量的平方根成正比 7. 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与 总体参数的离差越小越好。这种评价标准称为() A.无偏性 B. 有效性 C. 一致性 D. 充分性 8. 置信水平(1-α)表达了置信区间的() A.准确性 B. 精确性 C. 显着性 D. 可靠性 9. 在总体均值和总体比例的区间估计中,边际误差由()A.置信水平决定 B. 统计量的抽样标准差确定 C. 置信水平和统计量的抽样标准差 D. 统计量的抽样方差确定 10. 当正态总体的方差未知,且为小样本条件下,估计总体均值使用的分布是() A.正态分布 B. t 分布 C.χ2分布 D. F分布

统计学——参数估计

第8 讲参数估计 本讲的主要内容 8.1 参数估计的一般问题 8.2 一个总体参数的区间估计 8.3 两个总体参数的区间估计 8.4 样本量的确定 学习目标 1.估计量与估计值的概念 2.点估计与区间估计的区别 3.评价估计量优良性的标准 4.一个总体参数的区间估计方法 5.两个总体参数的区间估计方法 6.样本量的确定方法 8.1 参数估计的一般问题 8.1.1 估计量与估计值 估计量与估计值(estimator & estimated value) 1.估计量:用于估计总体参数的随机变量 如样本均值,样本比例, 样本方差等 例如: 样本均值就是总体均值m 的一个估计量 2.参数用θ表示,估计量用表示 3.估计值:估计参数时计算出来的统计量的具体值 如果样本均值?x=80,则80就是m的估计值 8.1.2 点估计与区间估计 点估计 (point estimate) 1.用样本的估计量的某个取值直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计 2.无法给出估计值接近总体参数程度的信息 ⑴虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值 ⑵一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量 区间估计 (interval estimate) 1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到 2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在75~85之间,置信水平是95% 区间估计的图示

参数估计和假设检验案例(精)

参数估计和假设检验案例 案例一:工艺流程的检测 某公司是一家为客户提供抽样和统计程序方面建议的咨询公司,这些建议可以用来监控客户的制造工艺流程。在一个应用项目中,一名客户向该公司提供了一个样本,该样本由工艺流程正常运行时的 800个观测值组成。这些数据的样本标准差为 0.21;因为有如此多的样本数据,因此,总体标准差被假设为 0.21。然后,该公司建议:持续不断地定期抽取容量为 30的随机样本以对工艺流程进行检测。 通过对这些新样本的分析,客户可以迅速知道,工艺流程的运行状况是否令人满意。当工艺流程的运行状况不能令人满意时,可以采取纠正措施来解决这个问题。设计规格要求工艺流程的均值为 12,该公司建议采用如下形式的假设检验。 H 0 :12 H 1 :12 只要 H 0被拒绝,就应采取纠正措施。 下表为第一天运行新的工艺流程的统计控制程序时,每隔一小时收集的样本数据。

μ=μ≠ 问题: 1、对每个样本在 0.01的显著性水平下进行假设检验,并且确定,如果需要

Z0.005=2.58 2、 4、讨论将显著性水平改变为一个更大的值时的影响?如果增加显著性水平, 哪种错误或误差将增加? 显著性水平增加,置信区间减小,误差减小。 案例二:计算机辅助教学会使完成课程的时间差异缩小吗? 某课程引导性教程采用一种个性化教学系统, 每位学生观看教学录像, 然后给以程式化的教材。每位学生独立学习直至完成训练并通过考试。人们关心的问题是学生完成训练计划的进度不同。有些学生能够相当快地完成程式化教材, 而另一些学生在教材上需要花费较长的时间,甚至需要加班加点才能完成课程。学的较快的学生必须等待学得较慢的学生完成引导性课程才能一起进行其他方面的训练。 建议的替代系统是使用计算机辅助教学。在这种方法中, 所有的学生观看同样的讲座录像,然后每位学生被指派到一个计算机终端来接受进一步的训练。μ= 在整个教程的自我训练过程中,由计算机指导学生独立操作。 为了比较建议的和当前的教学方法, 刚入学的 122名学生被随机地安排到这两种教学系统中。 61名学生使用当前程式化教材, 而另外 61名学生使用建议的计算机辅助方法。记录每位学生的学习时间(小时 ,如表所示。

参数估计和假设检验案例

参数估计和假设检验案例 案例一:工艺流程的检测 某公司是一家为客户提供抽样和统计程序方面建议的咨询公司,这些建议可以用来监控客户的制造工艺流程。在一个应用项目中,一名客户向该公司提供了一个样本,该样本由工艺流程正常运行时的800个观测值组成。这些数据的样本标准差为0.21;因为有如此多的样本数据,因此,总体标准差被假设为0.21。然后,该公司建议:持续不断地定期抽取容量为30的随机样本以对工艺流程进行检测。 通过对这些新样本的分析,客户可以迅速知道,工艺流程的运行状况是否令人满意。当工艺流程的运行状况不能令人满意时,可以采取纠正措施来解决这个问题。设计规格要求工艺流程的均值为12,该公司建议采用如下形式的假设检验。 μ=μ≠ H0 :12 H1 :12 只要H0被拒绝,就应采取纠正措施。 下表为第一天运行新的工艺流程的统计控制程序时,每隔一小时收集的样本数据。

问题: 1、对每个样本在0.01的显著性水平下进行假设检验,并且确定,如果需要 Z0.005=2.58 2、 μ= 4、讨论将显著性水平改变为一个更大的值时的影响?如果增加显著性水平, 哪种错误或误差将增加? 显著性水平增加,置信区间减小,误差减小。 案例二:计算机辅助教学会使完成课程的时间差异缩小吗? 某课程引导性教程采用一种个性化教学系统,每位学生观看教学录像,然后给以程式化的教材。每位学生独立学习直至完成训练并通过考试。人们关心的问题是学生完成训练计划的进度不同。有些学生能够相当快地完成程式化教材,而另一些学生在教材上需要花费较长的时间,甚至需要加班加点才能完成课程。学的较快的学生必须等待学得较慢的学生完成引导性课程才能一起进行其他方面的训练。 建议的替代系统是使用计算机辅助教学。在这种方法中,所有的学生观看同样的讲座录像,然后每位学生被指派到一个计算机终端来接受进一步的训练。

第4章总体参数估计讲解

◎第4章参数估计 ※一、单一总体的参数估计※ ●(一)估计的含义 ●估计:人人都做过。如: ?上课时,你会估计一下老师提问你的概率有多大? ?当你去公司应聘时,会估计你被录用的可能性是多少??推销员年初时要估计今年超额完成任务的概率有多大?◎估计量:用来估计总体参数的样本统计量。如:算术平均数、中位数、标准差、方差等。 ●估计的可能性与科学性:数理统计证明,一个“优良”的样本统计量应具备以下特征: (1)、无偏性。样本估计量的期望值应等于总体参数。无系统偏差。 (2)、有效性。与离散度相联系。在多个无偏估计量中,方差最小的估计量最有效。 (3)、一致性。随着样本容量的增加,可以使估计量越来越靠近总体参数。 (4)、充分性。估计量能够充分利用有关信息,中位数和众数不具备这一点。 ※估计的类型包括:

1、 点估计:只有一个取值。 就 是总体平均数μ的点估计值。 2、区间估计:给出取值范围(值域)。见PPT ▲两种估计类型哪一种更科学? ※ 区间估计的优点在于:它在给出估计区间时, 还可以给予一个“可信程度”。例如:销售经理想 估计一下明年的出口总值,甲估计是53万美元,乙估计 是50—56万美元之间,并可以确切地说“有95%的把握”。 显然后者的可信程度大于前者。那么,50—56万美元之 间的范围是如何计算的?“有95%的把握”是什么意思? 【引例】:某食品进出口公司向东南亚出口一批花生制品,管 理人员从中抽取50包作为样本,计算其平均数为250克。另 外,合同规定总体标准差为6克。 如果问这批花生制品的平均重量,可用样本平均数作为总 体平均数的最佳估计量:250克。但这是远远不够的,在许多 时候,管理人员还想了解“这个估计值的平均误差是多少?” “总体平均数可能落入样本平均数上、下多大范围内?”“ 这 个估计值的可靠程度是多少?” 〖1〗由于n=50,根据中心极限定理可作图: n=50,σ=6 〖2〗抽样平均误差:8485.0506 ===n x σσ

第八章 参数估计

第八章参数估计 一、思考题 1.什么是参数估计?参数估计有何特点? 2.评价估计量优劣的准则是什么? 3.什么是点估计、区间估计?二者有何联系和区别? 4.确定必要的抽样数目有何意义?必要抽样数目受哪些因素影响? 二、练习题 (一)填空题 1.参数估计的方法有_________和_________。 2.若样本方差(s n21-)的期望值等于总体方差(σ2),则称s n21-为σ2的____________估计量 3.总体参数的估计区间是由_________和_________组成。 4.允许误差是指与的最大绝对误差范围。 5.如果总体平均数落在区间960~1040内的概率是95%,则抽样平均数是 ______,允许误差是______。 6.在同样的精度要求下,不重复抽样比重复抽样需要的样本容量。 x=5,7.设总体X的方差为1,从总体中随机取容量为100的样本,得样本均值 =2.58) 则总体均值的置信水平为99%的置信区间_____________。(Z 0.005 (二)判断题 1( )参数估计就是用样本统计量去估计总体的参数。 2( )随机抽样是参数估计的前提。 3( )参数估计的抽样误差可以计算和控制。 4( )估计量的数学期望等于相应的总体参数值,则该估计量就被称为相应总体参数的无偏估计量。 5( )区间估计就是根据样本估计量以一定的置信度推断总体参数所在的区间范围。

6( )样本统计量n x x s ∑-=22)(是总体参数2σ的无偏估计量。 7( )估计量的有效性是指估计量的方差比其它估计的方差小。 8( )点估计是以样本估计量的实际值直接作为相应总体参数的估计值。 9( )抽样估计的置信水平就是指在抽样指标与总体参数构造的置信区间中, 包含总体参数真值的区间所占的比重。 10( )样本容量一定时,置信区间的宽度随置信水平的增大而减小。 (三)单选题 1.极限误差是指样本统计量和总体参数之间( )。 A.抽样误差的平均数 B.抽样误差的标准差 C.抽样误差的可靠程度 D.抽样误差的最大可能范围 2.参数估计的主要目的是( )。 A.计算和控制抽样误差 B. 为了深入开展调查研究 C.根据样本统计量的数值来推断总体参数的数值 D. 为了应用概率论 3.参数是指基于( )计算的指标值。 A.样本 B.某一个样本 C.多个样本 D.总体 4.总体参数很多,就某一参数(如均值)而言,它的取值( )。 A.是唯一的 B.不是唯一的 C.随样本的变化而变化 D.随抽样组织形式的变化而变化 5.样本统计量很多,就某一统计量(如均值)而言,它的取值( )。 A.是唯一的 B.随样本的变化而变化 C.由总体确定 D.由抽样的组织形式唯一确定 6.以样本均值x 估计正态总体的均值μ时,如果总体方差2σ已知,这时将会需要查阅( )。 A.正态分布表 B.标准正态分布表 C.t 分布表 D.2χ分布表 7.以样本均值x 估计正态总体的均值μ时,如果总体方差2σ未知,这时将会需要查阅( )。

参数估计方法

参数估计的方法 矩法 一、矩的概念 矩(moment )分为原点矩和中心矩两种。对于样本n y y y ,,, 21,各观测值的k 次方的平均值,称为样本的k 阶原点矩,记为k y ,有∑==n i k i k y n y 1 1,例如,算术 平均数就是一阶原点矩;用观测值减去平均数得到的离均差的k 次方的平均数称为样本的k 阶中心矩,记为k y y ) (-或k μ ?,有∑-= -=n i k i k y y n y y 1 ) (1)(,例如,样本 方差 ∑-=n i i y y n 1 2 ) (1就是二阶中心矩。 对于总体N y y y ,,, 21,各观测值的k 次方的平均值,称为总体的k 阶原点矩,记为)(k y E ,有∑= =N i k i k y N y E 1 1)(;用观测值减去平均数得到的离均差的k 次方 的平均数称为总体的k 阶中心矩,记为 ] )[(k y E μ-或 k μ,有 ∑-= -=N i k i k y N y E 1 ) (1])[(μμ。 二、矩法及矩估计量 所谓矩法就是利用样本各阶原点矩来估计总体相应各阶原点矩的方法,即 ∑= =n i k i k y n y 1 1→)(k y E (8·6) 并且也可以用样本各阶原点矩的函数来估计总体各阶原点矩同一函数,即若 ))(,),(),((k y E y E y E f Q 2= 则 ),,,(k y y y f Q 2?= 由此得到的估计量称为矩估计量。 [例8.1] 现获得正态分布),(2σμN 的随机样本n y y y ,,, 21,要求正态分布),(2σμN 参数μ和2σ的矩估计量。 首先,求正态分布总体的1阶原点矩和2阶中心矩: ?=?? ? ???--? =?=∞ +∞-∞ +∞-μσμσπdy y y dy y yf y E 2 2 exp 2)(21)()( (此处?? ? ???--2 2exp σμ2)(y 表示自然对数底数e 的?? ? ???--2 2σμ2)(y 的指数式,即] [2)(22 σμ--y e )

参数估计与假设检验案例

参数估计与假设检验案例 一、案例的背景和现实意义 上海五洲信息咨询公司市场部刘经理新世纪第一天上班,刚走进办公室还来不及与同事们互祝新年问候,办公桌上的传真机就响了,这是一份来自美国Lion投资公司的委托书,委托书上的文字十分简单:“2001年10月,美国Lion公司的品牌香槟酒将进入中国市场,现需了解上海市场的有关情况,委托业务费用10万美元。”随后是Lion酒的产品介绍。刘经理一看兴奋得差一点跳了起来:这是等待已久的项目,其收人也十分可观。在与同事们庆祝之后,刘经理陷入了思考,委托书上的要求看似简单,但这是一个十分棘手的项目,如果稍有疏忽不仅将影响到公司的声誉和发展前景,搞得不好还有可能丢了自己的饭碗。想到这,刘经理马上召集部门的业务骨干,共商对策。一个多小时的紧张讨论,一个颇为周全的企划方案跃人桌面:这是一个十分典型的市场调查和抽样推断的案例,了解市场有关情况,意味着需掌握洋酒的市场价格、需求量、消费群体、产品市场定位、促销手段、同类产品的市场占有率、销售情况、广告宣传以及消费者的心态、未来洋酒需求能力的推断、潜在用户挖掘的可能性等等。做好这个项目,关键是切入口的确定。应该说,刘经理做市场调查是熟门熟路,然而洋酒的市场调查,其调查对象与其他调查的不一样。对于上海销售的除从法国进口的某些葡萄酒及香槟以外,诸如轩尼诗、人头马、拿破仑、路易十六等品牌,由于其昂贵的价格,市场消费群体并不大,销量也十分有限。为此,刘经理与同事们反复论证,最后决定,首先拟订一个周密的市场调查方案,然后分头作市场调查及数据处理,最后完成这一项目。 目前中国正处于经济体制的转轨时期,信息资料的搜集也由过去单一的统计报表制度转向了“以周期性普查为基础,经常性的抽样调查为主体,其他调查形式为补充”的调查体制,向市场直接索取资料,将会成为了解市场、获得信息的主要手段,如何完成这一过程,怎样着手做市场调查,最终根据市场信息对未来市场走势作出判断和推测,就显得十分重要和具有现实意义。 二、案例所依托的客体与现状及操作过程

参数的区间估计

实验三:参数的区间估计 【实验目的】 1.用EXCEL、SPSS进行区间估计,利用计算机软件解决推断统计的问题; 2.如何使用EXCEL进行区间估计。 【实验内容】 参看课本第七章,“软件应用”并完成以下内容: 1.课后作业第16小题,写出置信区间。 由于数据量大,请参EXCEL7.16数据。 列1 列2 平均746.5129 平均778.1324 标准误差19.33632 标准误 差 35.80015 中位数738.5 中位数737 众数1018 众数600 标准差294.5221 标准差295.2156 方差86743.26 方差87152.24 峰度-0.60571 峰度-0.19912 偏度0.08518 偏度0.219081 区域1344 区域1358 最小值99 最小值135 最大值1443 最大值1493 求和173191 求和52913 观测数232 观测数68 置信区间 -111.369 48.12979 由上表可知:有95%的把握认为男女持卡人的信用卡账户余额均值之差在-111.369~48.12979之间。但是所求置信区间包含0,说明我们没足够的理由认为男女信用卡余额之间存在显著差异。 2.根据第七章的案例研究,完成第五小题。 数据参照第七章案例研究数据,另见EXCEL。

手动豪华售价 平均11.94621 标准误差0.131426 中位数11.78617 众数#N/A 标准差0.974681 方差0.950003 峰度-0.45919 偏度0.163266 区域 4.476654 最小值9.858664 最大值14.33532 求和657.0415 观测数55 11.68861 12.2038 由上表可知:有95%把握认为手动豪华的售价在11.68861~12.2038之间。手动豪华库存时间 平均 4.490909 标准误差0.441815 中位数 4 众数 1 标准差 3.276588 方差10.73603 峰度-0.75323 偏度0.616596 区域12 最小值0 最大值12 求和247 观测数55 3.624952 5.356866 由上表可知:有95%把握认为手动豪华的库存时间在3.625~5.357之间。【实验心得】

第三章参数估计

第三章参数估计 重点: 1.总体参数与统计量 2.样本均值与样本比例及其标准误差 难点: 1.区间估计 2.样本量的确定 知识点一:总体分布与总体参数 统计分析数据的方法包括:描述统计和推断统计(第一章) 推断统计是研究如何利用样本数据来推断总体特征的统计学方法,包括参数估计和假设检验两大类。 总体分布是总体中所有观测值所形成的分布。 总体参数是对总体特征的某个概括性的度量。通常有 总体平均数(μ) 总体方差(σ2) 总体比例(π) 知识点二:统计量和抽样分布 总体参数是未知的,但可以利用样本信息来推断。

统计量是根据样本数据计算的用于推断总体的某些量,是对样本特征的某个概括性度量。 统计量是样本的函数,如样本均值()、样本方差(s2)、样本比例(p)等。 构成统计量的函数中不能包括未知因素。 由于样本是从总体中随机抽取的,样本具有随机性,由样本数据计算出的统计量也就是随机的。统计量的取值是依据样本而变化的,不同的样本可以计算出不同的统计量值。 [例题·单选题]以下为总体参数的是( ) a.样本均值b.样本方差 c.样本比例d.总体均值 答案:d 解析:总体参数是对总体特征的某个概括性的度量。通常有总体平均数、总体方差、总体比 例题·判断题:统计量是样本的函数。 答案:正确 解析:统计量是样本的函数,如样本均值()、样本方差()、样本比例(p)等。构成统计量的函数中不能包括未知因素。 [例题·判断题]在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的、唯一的。 答案:错误 解析:作为推断对象的总体是唯一的,但作为观察对象的样本不是唯一的,不同的样本可以计算出不同的统计量值。。

定量分析方法案例(1)

案例1. 中国的消费函数 本案例以中国的收入与消费的总量数据为基础,建立中国消费函数,以说明定量分析方法所遵循的一般步骤。 一、理论或经验总结 凯恩斯的绝对收入假说:随着人们收入水平的增加,消费增加;但消费增加的幅度小于收入增加的幅度;收入与消费之间存在着稳定的函数关系。 从而有 )(Y f C = 线性形式: Y C 10ββ+= (101<=

三、数据收集与整理 有关中国的总量消费资料如下: 中国的GDP与总消费的一组数据(1990——2000,亿元) 中国的GDP与总消费的散点图如下:

四、估计模型 根据上述数据,运用OLS 进行参数估计,从而得到估计模型。回归结果如下: Y C *593.0141.0?+= Se Stat t - Value p - .000 9968.02=R , Se of Regression = 五、检验模型 1. 经济意义检验: 0 < MPC = < 1 2. 统计检验: 9968.02=R ,说明拟合优度非常高; Stat t -=,表明收入对消费的影响非常显著。 六、应用模型 1. 预测:中国2002年的GDP 为亿元,代入回归方程得到2002年总消费的估计值为亿元(2002年的实际总消费为亿元)。 2. 政策评价:由MPC =,可以计算出财政支出乘数为: 46.211 =-= MPC m 从而,政府支出每增加1亿元人民币,GDP 增加大约亿元。 进一步,还可计算对就业的影响等。 案例2

经典参数估计方法(3种方法)

经典参数估计方法:普通最小二乘(OLS)、最大似然(ML)和矩估计(MM) 普通最小二乘估计(Ordinary least squares,OLS) 1801年,意大利天文学家朱赛普.皮亚齐发现了第一颗小行星谷神星。经过40天的跟踪观测后,由于谷神星运行至太阳背后,使得皮亚齐失去了谷神星的位置。随后全世界的科学家利用皮亚齐的观测数据开始寻找谷神星,但是根据大多数人计算的结果来寻找谷神星都没有结果。时年24岁的高斯也计算了谷神星的轨道。奥地利天文学家海因里希.奥尔伯斯根据高斯计算出来的轨道重新发现了谷神星。高斯使用的最小二乘法的方法发表于1809年他的著作《天体运动论》中。法国科学家勒让德于1806年独立发现“最小二乘法”,但因不为世人所知而默默无闻。勒让德曾与高斯为谁最早创立最小二乘法原理发生争执。1829年,高斯提供了最小二乘法的优化效果强于其他方法的证明,因此被称为高斯-莫卡夫定理。 最大似然估计(Maximum likelihood,ML) 最大似然法,也称最大或然法、极大似然法,最早由高斯提出,后由英国遗传及统计学家费歇于1912年重新提出,并证明了该方法的一些性质,名称“最大似然估计”也是费歇给出的。该方法是不同于最小二乘法的另一种参数估计方法,是从最大似然原理出发发展起来的其他估计方法的基础。虽然其应用没有最小二乘法普遍,但在计量经济学理论上占据很重要的地位,因为最大似然原

理比最小二乘原理更本质地揭示了通过样本估计总体的内在机理。计量经济学的发展,更多地是以最大似然原理为基础的,对于一些特殊的计量经济学模型,最大似然法才是成功的估计方法。 对于最小二乘法,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得模型能最好地拟合样本数据;而对于最大似然法,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该是使得从模型中抽取该n组样本观测值的概率最大。 从总体中经过n次随机抽取得到的样本容量为n的样本观测值,在任一次随机抽取中,样本观测值都以一定的概率出现。如果已经知道总体的参数,当然由变量的频率函数可以计算其概率。如果只知道总体服从某种分布,但不知道其分布参数,通过随机样本可以求出总体的参数估计。 以正态分布的总体为例,每个总体都有自己的分布参数期望和方差,如果已经得到n组样本观测值,在可供选择的总体中,哪个总体最可能产生已经得到的n组样本观测值呢?显然,要对每个可能的正态总体估计取n组样本观测值的联合概率,然后选择其参数能使观测值的联合概率最大的那个总体。将样本观测值联合概率函数称为变量的似然函数。在已经取得样本观测值的情况下,使似然函数取极大值的总体分布参数所代表的总体具有最大的概率取得这些样本观测值,该总体参数即是所要求的参数。通过似然函数极大化以求得总体参数估计量的方法被称为极大似然法。

自回归模型的参数估计案例

自回归模型的参数估计案例 案例一: 建立中国长期货币流通量需求模型。中国改革开放以来,对货币需求量(Y)的影响因素,主要有资金运用中的贷款额(X)以及反映价格变化的居民消费者价格指数(P)。 长期货币流通量模型可设定为 120e t t t t P Y X βμββ=+++ (1) 其中,e t Y 为长期货币流通需求量。由于长期货币流通需求量不可观测,作局部调整: 11()e t t t t Y Y Y Y δ---=- (2) 其中,t Y 为实际货币流通量。 将(1)式代入(2)得短期货币流通量需求模型: 0121(1)t t t t t Y X P Y δβδβδβδδμ-=+++-+ 表1中列出了1978年到2007年我国货币流通量、贷款额以及居民消费者价格指数的相关数据。 表1 年份 货币流通量Y (亿元) 居民消费者价格指数P (1990年=100) 贷款额X (亿元) 1978 212.0 46.2 1850.0 1979 267.7 47.1 2039.6 1980 346.2 50.6 2414.3 1981 396.3 51.9 2860.2 1982 439.1 52.9 3180.6 1983 529.8 54.0 3589.9 1984 792.1 55.5 4766.1 1985 987.8 60.6 5905.6 1986 1218.4 64.6 7590.8 1987 1454.5 69.3 9032.5

1988 2134.0 82.3 10551.3 1989 2344.0 97.0 14360.1 1990 2644.4 100.0 17680.7 1991 3177.8 103.4 21337.8 1992 4336.0 110.0 26322.9 1993 5864.7 126.2 32943.1 1994 7288.6 156.7 39976.0 1995 7885.3 183.4 50544.1 1996 8802.0 198.7 61156.6 1997 10177.6 204.2 74914.1 1998 11204.2 202.6 86524.1 1999 13455.5 199.7 93734.3 2000 14652.7 200.6 99371.1 2001 15688.8 201.9 112314.7 2002 17278.0 200.3 131293.9 2003 19746.0 202.7 158996.2 2004 21468.3 210.6 178197.8 2005 24031.7 214.4 194690.4 2006 27072.6 217.7 225347.2 2007 30375.2 228.1 261690.9 对局部调整模型0121(1)t t t t t Y X P Y δβδβδβδδμ-=+++-+运用OLS 法估计结果如图1: 图1 回归估计结果 由图1短期货币流通量需求模型的估计式: 1202.50.03577.45570.7236t t t t Y X P Y -=-+++

相关文档
最新文档