统计学第5章 参数估计
合集下载
统计学课件第5-7章概率分布、抽样分布及参数估计剖析.

第5、6、7章
概率分布、抽样分布及参数估计
Probability Distributions & Sampling Distributions
& Parameter Estimation
Wednesday, January 16, 2019
Statistical Research Office
1
本部分主要研究的问题有:
● 遵循随机性原则 --- 体现在在每一层抽选中;
● 每一层内应包含足够多的个体;
● 在同等条件下,抽样误差要小于简单随机抽 样和系统抽样的抽样误差。
Wednesday, January 16, 2019 Statistical Research Office 12
Wednesday, January 16, 2019
Statistical Research Office
7
●
常用的随机抽样组织方式
► 简单随机抽样(Simple random sampling)
►分层随机抽样(Stratified sampling)
►系统随机抽样(Systematic sampling)
►整群随机抽样 (Cluster sampling) 常用的随机抽样方法: ►重复抽样 (Sampling with replacement) ►不重复抽样(Sampling without replacement)
8
Wednesday, January 16, 2019
Statistical Research Office
★ 简单随机抽样 -定义:从总体中,按照随机的原则,使得总体 中每个个体都有同等被选中的机会,而先后抽 出的n个个体作为一个容量为n的样本。
概率分布、抽样分布及参数估计
Probability Distributions & Sampling Distributions
& Parameter Estimation
Wednesday, January 16, 2019
Statistical Research Office
1
本部分主要研究的问题有:
● 遵循随机性原则 --- 体现在在每一层抽选中;
● 每一层内应包含足够多的个体;
● 在同等条件下,抽样误差要小于简单随机抽 样和系统抽样的抽样误差。
Wednesday, January 16, 2019 Statistical Research Office 12
Wednesday, January 16, 2019
Statistical Research Office
7
●
常用的随机抽样组织方式
► 简单随机抽样(Simple random sampling)
►分层随机抽样(Stratified sampling)
►系统随机抽样(Systematic sampling)
►整群随机抽样 (Cluster sampling) 常用的随机抽样方法: ►重复抽样 (Sampling with replacement) ►不重复抽样(Sampling without replacement)
8
Wednesday, January 16, 2019
Statistical Research Office
★ 简单随机抽样 -定义:从总体中,按照随机的原则,使得总体 中每个个体都有同等被选中的机会,而先后抽 出的n个个体作为一个容量为n的样本。
管理统计学第5章

总体(累积)概率分布曲线F(x)不一定 是连续的。 例如,有限(累积)概率分布曲线F(x)是 阶跃式的。
随着样本数 n 的增大, 样本分布会越来越接 近 于 总 体 分 布 。
5.1.4 格利文科定理
定理 :设总体X的分布函数为F(x), 样本分布函数
Fn(x),则对于任何实数x,有
n x
研究多指标时,就是多维随机变量,或称随机向量。
2. 总体(母体)
3. 总体分布(母体分布)
取直径为随机变量X,通常服从正态分布。这个分布,就称为 “生产线上生产出来的零件的直径”这个总体的分布。
5.1.2 随机样本与样本观察值 (样本数据) 1. 随机样本
每个个体被抽取到的机会(概率)均等。
F (m, n)
x
5.2.3 由一般正态分布的随机样本构 成的若干重要统计量的分布
例1 从总体 N ( 52,6.32 ) 中随机抽取
一容量为 36 的样本,求样本均值 X 落在
50.8 到 53.8 之间的概率。
X ~ N (0, 1) , 解:n 36, 52, 6.3 。由 / n
解:由题意可知, X1+X2+…+X9~N(0,9×16),
1 2 2 1 ( Y ) ~ ( 16 ) 则 i Yi ~ N (0,1), i 1,2, ,16 i 1 3 3 X1 X 2 X 9 从而 2 2 2
Y1 Y2 Y16 1 ( X1 X 2 X 9 ) 3 4 ~ t (16) 16 1 2 ( Yi ) i 1 3 16
p 0.46 0.5 0.46 P( p 0.5) P( ) 0.0352 0.0352 P( Z 1.136) 1 P( Z 1.136) 1 (1.136 ) 0.128
统计学

2
s n
还可以进一步推断相应总量指标的区间范围。 还可以进一步推断相应总量指标的区间范围。
2、总体比率的区间估计 、
由定理知:在大样本下, 由定理知:在大样本下,样本比率的分 1 布趋近于 N ( P, P(1 − P)) n 给定置信度 1 − α ,查正态表的 Zα , 2 样本比例的抽样极限误差为
2 2 2 2
~ F (n1 − 1, n2 − 1)
得方差比 σ 12 / σ 22 的置信度为1 − α 的置信区间为
1 s12 s12 ( 2 , 2 s2 Fα ( n1 − 1, n2 − 1) s2 F
2 1−
1 ) α ( n1 − 1, n2 − 1)
2
例题:见书 页例11 例题:见书150页例 页例 练习:研究由机器A和机器 生产的钢管的内径, 和机器B生产的钢管的内径 练习:研究由机器 和机器 生产的钢管的内径, 随机抽取A生产的管子 生产的管子18只 测得样本方差0.34 随机抽取 生产的管子 只,测得样本方差 平方毫米,抽取B生产的管子 生产的管子13只 平方毫米,抽取B生产的管子13只,测得样本 方差0.29平方毫米。设两样本相互独立,且设 平方毫米。 方差 平方毫米 设两样本相互独立, 由A、B生产的管子内径分别服从正态分布 、 生产的管子内径分别服从正态分布 2 2 N ( µ1 ,σ 1 ), N ( µ 2 ,σ 2 ) µ i ,σ i 均未知。 均未知。 这里的 试求方差比的置信度为0.90的置信区间。 的置信区间。 试求方差比的置信度为 的置信区间
s 小样本) n (小样本)
综述: 综述:总体均值的置信度为 1 − α 的置信区间 表示为: 表示为:x − ∆ x ≤ µ ≤ x + ∆ x 其中: 其中: σ s ∆ ≈ Zα 大样本下: 大样本下: x = Z α σ ( x) = Z α
s n
还可以进一步推断相应总量指标的区间范围。 还可以进一步推断相应总量指标的区间范围。
2、总体比率的区间估计 、
由定理知:在大样本下, 由定理知:在大样本下,样本比率的分 1 布趋近于 N ( P, P(1 − P)) n 给定置信度 1 − α ,查正态表的 Zα , 2 样本比例的抽样极限误差为
2 2 2 2
~ F (n1 − 1, n2 − 1)
得方差比 σ 12 / σ 22 的置信度为1 − α 的置信区间为
1 s12 s12 ( 2 , 2 s2 Fα ( n1 − 1, n2 − 1) s2 F
2 1−
1 ) α ( n1 − 1, n2 − 1)
2
例题:见书 页例11 例题:见书150页例 页例 练习:研究由机器A和机器 生产的钢管的内径, 和机器B生产的钢管的内径 练习:研究由机器 和机器 生产的钢管的内径, 随机抽取A生产的管子 生产的管子18只 测得样本方差0.34 随机抽取 生产的管子 只,测得样本方差 平方毫米,抽取B生产的管子 生产的管子13只 平方毫米,抽取B生产的管子13只,测得样本 方差0.29平方毫米。设两样本相互独立,且设 平方毫米。 方差 平方毫米 设两样本相互独立, 由A、B生产的管子内径分别服从正态分布 、 生产的管子内径分别服从正态分布 2 2 N ( µ1 ,σ 1 ), N ( µ 2 ,σ 2 ) µ i ,σ i 均未知。 均未知。 这里的 试求方差比的置信度为0.90的置信区间。 的置信区间。 试求方差比的置信度为 的置信区间
s 小样本) n (小样本)
综述: 综述:总体均值的置信度为 1 − α 的置信区间 表示为: 表示为:x − ∆ x ≤ µ ≤ x + ∆ x 其中: 其中: σ s ∆ ≈ Zα 大样本下: 大样本下: x = Z α σ ( x) = Z α
卫生统计学七版 第五章参数估计基础电子教案

P0.05
第三节 总体均数及总体概率的估计
一、参数估计的基础理论
参数估计区 点间 估估 计计
对总体参数估计 称的 为范 置围 信区C间( I , co用 nfidenicneterv)al
表示,其置信1度 )为,(一般取置95信 %,度即为取 为0.05,此区
间的较小值称为 限置 ,信 较下 大值称为 限置 。信 一上 般进行双 区侧 间的估计。
卫生统计学七版 第五ຫໍສະໝຸດ 参数估 计基础第一节 抽样分布与抽样误差
一、样本均数的抽样分布与抽样误差
……
x15 .55 1 sx0.9617
样本均数的标准差越,大抽样误差就越大
样本均数的标准差称标为准误
x
n
sx
s n
sx称为标准误估计值,简也称标准误
标准误与标准差成正比 ,与样本含量成反比
标准误越大,抽样误差越大。
2、正态近似法
当已知时X: u
n
当未知但n足够大时X:u0.05
s n
X1.96 s n
或:X1.96s X
例5-3(P95) 某医生于2000年在某市随机抽取90名 19岁的健康男大学生,测量了他们的身高,得样本均数 为172.2cm,标准差为4.5cm,试估计该市2000年19岁健 康男性大学生平均身高的95%置信区间 。
对任意分布,在样本含量足够大时,其样本均数的分布都 近似正态分布,且样本均数的均数等于原分布的均数。
二、样本频率的抽样分布与抽样误差
总体率的标准误:
p
(1 )
n
率的标准误的估计值:
sp
p(1 p) n
标准误大抽样误差就大。
第二节 t分布
一、t分布的概念
统计学(李荣平)2014-5

P{t>tα(n)}= h(t;n)dt
t (n)
的数tα(n)为t(n)分布的上α分为点。 例:查表求:t0.05(8), t0.95(8)
o
t (n)
第一节 抽样分布
(三)F 分布
设 U ~ 2(n1 ),V ~ 2(n2 ), 且设 U,V 独立,则称随机变量
F U / n1 V / n2
保证质量,规定σ≤0.6mm时,认为生产过程处于良好控制
状态。为此,每隔一定时间抽取20个零件作为一个样本,并
计算样本方差S2。若P{S2≥c } ≤0.01(此时σ=0.6mm),
则认为生产过程失去控制,必须停产检查,问:
(1)C为何值时,S2≥c的概率才小于或等于0.01? (2)若取得的一个样本的标准差S=0.84,生产过程是
第五章 抽样分布与参数估计
主
第一节 抽样分布
要 内
第二节 参数点估计
容
第三节 区间估计
第一节 抽样分布
一、随机样本
总体与个体:试验全部可能的观测值叫总体;试验的 每一个观测值叫个体。
样本容量与样本个数:样本中包含的单位数叫样本容 量;从一个总体中可能抽取多少个样本叫样本个数。
总体容量:总体中所包含的个体数。 有限总体和无限总体:总体容量可数的称有限总体, 不可数的称无限总体。 重置抽样(重复抽样)和无重置抽样(不重复抽样)
X
1 n
n i 1
Xi
为样本均值;称统计量
S 2
1 n1
n i1
(Xi
X )2
为 样本方差 ,称统计量 S
S2
1n
( X X ) 2 为样本标准差 ;统计量
n 1 i1 i
管理统计学第5参数估计

S2
1 n 1
n i 1
(Xi
X )2
二、极大似然估计法
先考察两个简单的例子。
【例3.4】某同学与一位男猎人一起外出打 猎,只见一只野鸡在前方窜过,只听一声 枪响,野鸡被他们两人中某一位一枪命中, 试推测这一发命中的子弹是谁打的,答案 是简单的,既然只发一枪且命中,而男猎 人的命中的概率一般大于这位同学命中的 概率,因此可以认为这一枪是男猎人射中 的。
直观上觉得P=3/4(即箱子中黑球数为3) 更可信,因为当P=1/4时抽到这样一个具 体样本的概率为1/43/41/4=3/64,当 P=3/4时,抽到这样一个具体样本的概率为 3/41/43/4=9/64,由于9/64>3/64,因 此在观察到上述样本中的三个球的颜色之
后,觉得P=3/4更可信,即你倾向于认为
计量 ˆ(x1, x2,, xn ) ,称为参数 的极大似
然估计量。
由定义3.1可知,求总体参数 的极大似然
估计值ˆ 的问题,就是求似然函数
L( )的极大值问题。在L( )可微时, 要使L( )取极大值 必须满足
dL
d
0
(3.1)
从上式可解得 的极大似然估计值。
由于lnL( )与L( )有相同的极值点,
化中求出相应的 值来,这个值就是 的
一个估计值。于是,我们可以给出极大似 然估计的定义。
定义3. 1 设总体的概率密度为 f (x, ) ,其
中 是未知参数,x1,x2,…,xn为X的
一组样本观察值。若能求得观察值的某个
函数 ˆ (x1, x2, x3,, xn) ,使得似然函数取极大 值,即L(x1, x2,, xn,ˆ) maxL(x1, x2,, xn,),则称ˆ 为 的一个极大似然估计值,其相应的统
《统计学》第5章 假设检验

假设。原假设通常用H0 表示,也称为“零假设”;备择假设指的是当原
假设不成立时,即拒绝原假设时备以选择的假设,通常用H1 表示。备择
假设和原假设互斥,如在例5.1中,原假设是“2022 年全国城市平均
PM2.5 浓度与2018 年相比没有显著差异”,那么备择假设就是“2022
年全国城市平均PM2.5 浓度与2018 年相比存在显著差异”。相应的统计
小越好。但是,在一定的样本容量下,减少犯第I类错误的概率,就会
使犯第II类错误的概率增大;减少犯第II类错误的概率,会使犯第I类
错误的概率增大。增加样本容量可以使犯第I类错误的概率和犯第II类
错误的概率同时减小,然而现实中资源总是有限的,样本量不可能没有
限制。因此,在给定的样本容量下,必须考虑两类可能的错误之间的权
易被否定,若检验结果否定了原假设,则说明否定的理由是充分的。
第四章 参数估计
《统计学》
16
5.1 假设检验的基本原理
(四) P值法
假设检验的另一种常用方法是利用P值(P-value) 来确定检验决策。P值
指在原假设0 为真时,得到等于样本观测结果或更极端结果的检验统计
量的概率,也被称为实测显著性水平。P值法的决策规则为:如果P值大
1.96) 中。这里−1.96和1.96 称为临界值,区间(−1.96, 1.96) 两侧的
区域则被称为拒绝域。基于样本信息,可以计算得到相应的z检验统计量
值,已知ҧ = 46,0 = 53, = 14 , n = 100 = −5
14/10
第四章 参数估计
《统计学》
14
5.1 假设检验的基本原理
犯第I 类(弃真) 错误的概率 也称为显著性水平(Significance level),
假设不成立时,即拒绝原假设时备以选择的假设,通常用H1 表示。备择
假设和原假设互斥,如在例5.1中,原假设是“2022 年全国城市平均
PM2.5 浓度与2018 年相比没有显著差异”,那么备择假设就是“2022
年全国城市平均PM2.5 浓度与2018 年相比存在显著差异”。相应的统计
小越好。但是,在一定的样本容量下,减少犯第I类错误的概率,就会
使犯第II类错误的概率增大;减少犯第II类错误的概率,会使犯第I类
错误的概率增大。增加样本容量可以使犯第I类错误的概率和犯第II类
错误的概率同时减小,然而现实中资源总是有限的,样本量不可能没有
限制。因此,在给定的样本容量下,必须考虑两类可能的错误之间的权
易被否定,若检验结果否定了原假设,则说明否定的理由是充分的。
第四章 参数估计
《统计学》
16
5.1 假设检验的基本原理
(四) P值法
假设检验的另一种常用方法是利用P值(P-value) 来确定检验决策。P值
指在原假设0 为真时,得到等于样本观测结果或更极端结果的检验统计
量的概率,也被称为实测显著性水平。P值法的决策规则为:如果P值大
1.96) 中。这里−1.96和1.96 称为临界值,区间(−1.96, 1.96) 两侧的
区域则被称为拒绝域。基于样本信息,可以计算得到相应的z检验统计量
值,已知ҧ = 46,0 = 53, = 14 , n = 100 = −5
14/10
第四章 参数估计
《统计学》
14
5.1 假设检验的基本原理
犯第I 类(弃真) 错误的概率 也称为显著性水平(Significance level),
统计学习题05

答案:CDE
2.下面哪些是影响必要样本容量的因素()。
A.总体各单位标志变异程度B.允许的极限误差大小
C.推断的可靠程度D.抽样方法和抽样组织方式
E.样本均值和样本统计量
答案:ABCD
3.评价估计量是否优良的常用标准有( )。
A.无偏性B.有效性
C.准确性D.一致性
E.随机性
答案:ABC
4.点估计( )。
[参考答案]
28.306
2.现有一大批种子,为了估计其发芽率,随机抽取400粒进行发芽试验。结果有15粒每发芽。试以90%的置信度估计这批种子的发芽率。
[参考答案]
[ 0.95 , 0.97 ]
3.设总体X服从参数 的泊松分布,其概率分布率为 ,
x=0,1,2,……试求参数 的极大似然估计量及矩估计量。
A.求每晚睡眠时间总体均值的点估计。
B.假定总体是正态分布,求总体均值的点估计的95%置信区间。
[参考答案]
A.6.86,B.[6.54 , 7.18]
5.在某地方选举进行以前展开的民意测验表明,在随机抽取的121名居民中有65名支持某候选人,试求该候选人支持率的信赖区间。( =5%)
[参考答案]
0.54-0.089=0.451
答案:C
21.已知σ2的1-α置信区间为,该区间也可表示为()。
(D)以上答案都不正确
答案:B
二、多项选择题
1.在区间估计中,如果其他条件保持不变,置信度与精确度之间存在下列关系( )。
A.前者愈低,后者也愈低B. 前者愈高,后者也愈高
C. 前者愈低,后者愈高D.前者愈高,后者愈低
E. 两者呈相反方向变化
3.在进行参数估计时,我们并不是直接用一个个的具体样本之来估计、推断总体参数,而是根据样本构造出一些特定的量,用这些特定量来估计总体参数,这些根据样本构造的特定量就称为样本统计量。在估计过程中,我们把用来推估总体参数的样本统计量称为估计量。
2.下面哪些是影响必要样本容量的因素()。
A.总体各单位标志变异程度B.允许的极限误差大小
C.推断的可靠程度D.抽样方法和抽样组织方式
E.样本均值和样本统计量
答案:ABCD
3.评价估计量是否优良的常用标准有( )。
A.无偏性B.有效性
C.准确性D.一致性
E.随机性
答案:ABC
4.点估计( )。
[参考答案]
28.306
2.现有一大批种子,为了估计其发芽率,随机抽取400粒进行发芽试验。结果有15粒每发芽。试以90%的置信度估计这批种子的发芽率。
[参考答案]
[ 0.95 , 0.97 ]
3.设总体X服从参数 的泊松分布,其概率分布率为 ,
x=0,1,2,……试求参数 的极大似然估计量及矩估计量。
A.求每晚睡眠时间总体均值的点估计。
B.假定总体是正态分布,求总体均值的点估计的95%置信区间。
[参考答案]
A.6.86,B.[6.54 , 7.18]
5.在某地方选举进行以前展开的民意测验表明,在随机抽取的121名居民中有65名支持某候选人,试求该候选人支持率的信赖区间。( =5%)
[参考答案]
0.54-0.089=0.451
答案:C
21.已知σ2的1-α置信区间为,该区间也可表示为()。
(D)以上答案都不正确
答案:B
二、多项选择题
1.在区间估计中,如果其他条件保持不变,置信度与精确度之间存在下列关系( )。
A.前者愈低,后者也愈低B. 前者愈高,后者也愈高
C. 前者愈低,后者愈高D.前者愈高,后者愈低
E. 两者呈相反方向变化
3.在进行参数估计时,我们并不是直接用一个个的具体样本之来估计、推断总体参数,而是根据样本构造出一些特定的量,用这些特定量来估计总体参数,这些根据样本构造的特定量就称为样本统计量。在估计过程中,我们把用来推估总体参数的样本统计量称为估计量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总体均值的区间估计
(小样本的估计)
【例5-2】一家食品生产企业以生产袋装食品为主,为对产量 质量进行监测,企业质检部门经常要进行抽检,以分析每袋 重量是否符合要求。现从某天生产的一批食品中随机抽取了 25袋,测得每袋重量如下表所示。已知产品重量的分布服从 正态分布,且总体标准差为10克。试估计该批产品平均重量 的置信区间,置信水平为95%
5 - 11
2020-4-8
统计学
STATISTICS (第五版)
区间估计的图示
5 - 12
2020-4-8
统计学
STATISTICS (第五版)
置信水平
(confidence level)
1. 将构造置信区间的步骤重复很多次,置 信区间包含总体参数真值的次数所占的 比例,也称置信度
2. 表示为 (1 -
为是总体参数未在区间内的比例
3. 常用的置信水平值有 99%, 95%, 90%
相应的 为0.01,0.05,0.10
5 - 13
2020-4-8
统计学
STATISTICS (第五版)
置信区间的表述
(confidence interval)
1. 由样本估计量构造出的总体参数在一定置信水平 下的估计区间
32
16
3~6小时
35
17.5
6~9小时
33
16.5
9~12小时
29
14.5
12小时以上
71
35.5
合计
200
100
平均上网时间为8.58小时,标准差为0.69小时。全校学生每周 的平均上网时间是多少?每周上网时间在12小时以上的学生比 例是多少?你做出估计的理论依据是什么?
5-6
2020-4-8
第 5 章 参数估计
5 - 10
2020-4-8
统计学
STATISTICS (第五版)
区间估计
(interval estimate)
1. 在点估计的基础上,给出总体参数估计的一个估计 区间,该区间由样本统计量加减估计误差而得到
2. 根据样本统计量的抽样分布能够对样本统计量与总 体参数的接近程度给出一个概率度量
比如,某班级平均分数在75~85之间,置信水平是95%
统计学
STATISTICS (第五版)
学习目标
参数估计的基本原理 点估计与区间估计 评价估计量优良性的标准 一个总体参数的区间估计方法 两个总体参数的区间估计方法 样本量的确定方法
5-4
2020-4-8
统计学
STATISTICS (第五版)
大学生每周上网花多少时间?
➢ 为了解学生每周上网花费的时间,中国人民大学公 共管理学院的4名本科生对全校部分本科生做了问 卷调查。调查的对象为中国人民大学在校本科生, 调查内容包括上网时间、途径、支出、目的、关心 的校园网内容,以及学生对收费的态度,包括收费 方式、价格等
➢ 问卷调查由调查员直接到宿舍发放并当场回收。对 四个年级中每年级各发60份问卷,其中男、女生各 30份。共收回有效问卷共200份。其中有关上网时 间方面的数据经整理如下表所示
5-5
2020-4-8
统计学
STATISTICS (第五版)
大学生每周上网花多少时间?
回答类别
人数(人)
频率(%)
3小时以下
2
样本统计量
x p s2
2020-4-8
统计学
STATISTICS (第五版)
总体均值区间的一般表达式
1. 总体均值的置信区间是由样本均值加减估计误差 得到的
2. 估计误差由两部分组成:一是点估计量的标准误 差,它取决于样本统计量的抽样分布。二是估计 时所要的求置信水平为时,统计量分布两侧面积 为的分位数值,它取决于事先所要求的可靠程度
3. 总体均值在置信水平下的置信区间可一般性地表 达为
样本均值±分位数值×样本均值的标准误差
5 - 26
2020-4-8
统计学
STATISTICS (第五版)
总体均值的区间估计
(大样本的估计)
1. 假定条件
总体服从正态分布,且方差(2) 已知
如果不是正态分布,可由正态分布来近似 (n 30)
2. 统计学家在某种程度上确信这个区间会包含真正 的总体参数,所以给它取名为置信区间
3. 如果用某种方法构造的所有区间中有95%的区间 包含总体参数的真值,5%的区间不包含总体参数 的真值,那么,用该方法构造的区间称为置信水 平为95%的置信区间。同样,其他置信水平的区 间也可以用类似的方式进行表述
2. 估计量:用于估计总体参数的统计量的名称
如样本均值,样本比例,样本方差等
例如: 样本均值就是总体均值 的一个估计量
3. 参数用 表示,估计量用 ˆ 表示
4. 估计值:估计参数时计算出来的统计量的具体值
如果样本均值 x =80,则80就是 的估计值
5-9
2020-4-8
统计学
STATISTICS (第五版)
10 25
105.36 3.92
101.44,109.28
该食品平均重量的置信区间为101.44g~109.28g
5 - 32
2020-4-8
统计学
STATISTICS (第五版)
总体均值的区间估计
(小样本的估计)
【例5-3】已知某种灯泡的寿命服从正态分布,现从 一批灯泡中随机抽取16只,测得其使用寿命(单位:h) 如下。建立该批灯泡平均使用寿命95%的置信区间
5.2 一个总体参数的区间估计
5.2.1 总体均值的区间估计 5.2.2 总体比例的区间估计 5.2.3 总体方差的区间估计
5.2 一个总体参数估计的区间估计 5.2.1 总体均值的区间估计
统计学
STATISTICS (第五版)
一个总体参数的区间估计
总体参数 均值 比例 方差
5 - 25
符号表示
5.1 参数估计的基本原理
5.1.1 点估计与区间估计 5.1.2 评价估计量的标准
5.1 参数估计的基本原理 5.1.1 点估计与区间估计
统计学
STATISTICS (第五版)
估计量与估计值
(estimator & estimated value)
1. 参数估计(parameter estimation)就是用样本统计 量去估计总体的参数
统计学 数据分析
(方法与案例)
作者 贾俊平
统计学
STATISTICS (第五版)
统计名言
不象其他科学,统计从来不打算使 自己完美无缺,统计意味着你永远 不需要确定无疑。
—— Gudmund R.Iversen
5-2
2020-4-8
第 5 章 数值变量的推断—参数估计
5.1 参数估计的基本原理 5.2 一个总体参数的区间估计 5.3 两个总体参数的区间估计 5.4 样本量的确定
3. 区间估计总是要给结论留点儿余地
5 - 18
2020-4-8
5.1 参数估计的基本原理 5.1.2 评价估计量的标准
统计学
STATISTICS (第五版)
无偏性
(unbiasedness)
无偏性:估计量抽样分布的数学期望等于被 估计的总体参数
5 - 20
2020-4-8
统计学
STATISTICS (第五版)
5 - 14
2020-4-8
统计学
STATISTICS (第五版)
置信区间的表述
(confidence interval)
1. 总体参数的真值是固定的,而用样本构造的区 间则是不固定的,因此置信区间是一个随机区 间,它会因样本的不同而变化,而且不是所有 的区间都包含总体参数
2. 实际估计时往往只抽取一个样本,此时所构造 的是与该样本相联系的一定置信水平(比如95%) 下的置信区间。我们只能希望这个区间是大量 包含总体参数真值的区间中的一个,但它也可 能是少数几个不包含参数真值的区间中的一个
1. 使用一个较大的置信水平会得到一个比较宽的置信区 间,而使用一个较大的样本则会得到一个较准确(较 窄)的区间。直观地说,较宽的区间会有更大的可能 性包含参数
2. 但实际应用中,过宽的区间往往没有实际意义
比如,天气预报说“在一年内会下一场雨”,虽然这很有 把握,但有什么意义呢?另一方面,要求过于准确(过窄) 的区间同样不一定有意义,因为过窄的区间虽然看上去很 准确,但把握性就会降低,除非无限制增加样本量,而现 实中样本量总是有限的
2. 一个特定的区间总是“包含”或“绝对不包含”参数 的真值,不存在“以多大的概率包含总体参数”的问 题
3. 置信水平只是告诉我们在多次估计得到的区间中大概 有多少个区间包含了参数的真值,而不是针对所抽取 的这个样本所构建的区间而言的
4. 正确的表述:计算置信水平为95%的置信区间是一种 方法,该方法使得区间以95%的概率覆盖总体参数
5 - 16
2020-4-8
统计学
STATISTICS (第五版)
点估计值
置信区间的表述
(95%的置信区间)
☺ 我没有抓住参数!
从均值为185的总体中抽出n=10的20个样本构造出的20个置信区间
5 - 17
2020-4-8
统计学
STATISTICS (第五版)
置信区间的表述
(confidence interval)
有效性
(efficiency)
有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效
5 - 21
2020-4-8
统计学
STATISTICS (第五版)
一致性
(consistency)
一致性:随着样本量的增大,估计量的 值越来越接近被估计的总体参数