第8章区间估计
第8章 参数估计

f
x,
x 1 0
求参数 的极大似然估计.
0 x 1,
其它
解 设 X1, X 2 ,L , X n为来自总体的样本, 则似然函数为
L n x1x2L xn 1 ,
取对数后有:
nபைடு நூலகம்
ln L nln 1ln xi, i1
上式对 求导, 并令其为零, 则有
解之得
dln L
d
n
n i1
h X1, X2,L , Xn , 通过样本观测值 x1, x2,L , xn 所对应的估计值
h x1, x2,L , xn
作为总体参数的估) 计值. 记作
h x1, x2,L , xn .
点估计的意义: 在数轴上表示一个点.
区间估计的含义是: 依据样本来估计未知参数的某一 范围.
区间估计的具体实现: 由样本构造两个统计量:
h1 X1, X2,L , Xn , h2 X1, X2,L , Xn ,
再由观测值 x1, x2 ,L , xn 得到具体的区间
h1 x1, x2,L , xn , h2 x1, x2,L , xn ,
以此区间作为未知参数的区间估计.
二、两种常用点估计
下面讨论两种常用的点估计方法: 矩估计和极大似然 估计.
例5 设 X1, X 2 ,L X n 是取自于总体的一个样本, 其中
X : R0, , 因
1
E
X
2
,
因此 21 的矩估计为2 X .
例6 设 X1, X 2 ,L X n 是取自于总体的一个样本, X 的
密度函数为
f
x
1
x
,
0,
求 的矩估计. 这里 1.
第8章_假设检验8.4_置信区间与假设检验之间的关系

例1 设 X ~ N ( , 1), 未知, 0.05, n 16,
且由一样本算得 x 5.20 ,
于是得到参数 的一个置信水平为 0.95 的置信 1 1 区间 ( x z0.025 , x z0.025 ) 16 16
(5.20 0.49, 5.20 0.49) (4.71, 5.69 ).
反之 ,为要求出参数 的置信水平为 1 的 置信区间 ,
要先求出显著水平为 的检验假设
H 0 : 0 , H1 : 0 , 的接受域 : 0
( , ) 是参数的一个置信水平为1 的置信区间
2. 置信区间与单边检验之间的对应关系
(1)置信水平为 1 的单侧置信区间
(, ) 与显著水平为 的左边检验问题 H 0 : 0 , H1 : 0 有类似的对应关系.
若已求得单侧置信区间 (, ),
则当 0 (, ) 时接受 H0 ;
当 0 (, ) 时拒绝 H0 .
第四节 置信区间与假设检验之间 的关系
一、置信区间与双边检验之间的对应关系 二、 置信区间与单边检验之间的对应关系 三、小结
区间估计与假设检验的联系
1.区间估计与假设检验都是根据样本信息对总体参 数进行推断,都是以抽样分布为理论依据,都是 建立在概率基础上的推断,推断结果都有一定的 可信程度或风险。 2.对同一问题的参数进行推断,二者使用同一样本、 同一统计量、同一分布,因而二者可以相互转换。 区间估计问题可以转换成假设问题,假设问题也 可以转换成区间估计问题。区间估计中的置信区 间对应于假设检验中的接受区域,置信区间以外 的区域就是假设检验中的拒绝域。
单侧置信区间 (4.79, ), 单侧置信下限 4.79.
第八章 参数估计

−
σ
即置信区间为[1446.16,2553.84] 显然我们有95%的把我说,总体平均值在1446.16 ~ 2553.84分之间
四、
σ
未知且大样本时总体平均数的区间估计
σ 未知但样本容量 n > 30 即大样本时,可用标准
正态分布近似地当作 t 分布,故此时的总体平均 数置信区间为
x ± zα sx
§8.2 总体平均数的区间估计
一、 样本取自总体方差已知的正态分布
如果总体服从正态分布 N ( µ , σ 2 ) ,且 σ 2 已知时, 且 已知时, 总体平均数的置信区间为: 总体平均数的置信区间为:
x ± z
α
2
σ
x
总体平均数区间估计的步骤: 总体平均数区间估计的步骤:
(1)确定置信水平,即可靠性或把握程度。一般来说对于估 确定置信水平,即可靠性或把握程度。 确定置信水平 计要求比较精确的话,置信程度也要求高些, 计要求比较精确的话,置信程度也要求高些,在社会经济 现象中通常用95% 现象中通常用 %就可以了 (2)根据置信度并利用标准正态分布表确定 z 值 根据置信度并利用标准正态分布表确定
二、 样本取自总体方差已知的非正态分布 在很多情况下,总体为非正态分布, 在很多情况下,总体为非正态分布,但由中心极限 定理, 足够大, 定理,当样本容量 n 足够大,无论总体服从什么分 的抽样分布将近似服从正态分布, 布, x 的抽样分布将近似服从正态分布,故可以用
x ± z α σ x 公式来近似求出总体平均的置信区间。 公式来近似求出总体平均的置信区间。
2
例8 − 2某职业介绍所的职员从某一职业的1000名申请者 中采用不重复抽样方式随机抽取了200名申请者,借此 估计1000名申请者考试的平均成绩,已知由200名申请者 构成的样本平均分 x = 78分,由已往经验已知总体方差 为90,但该职员不知总体服从何种分布,试求µ的90% 的置信区间?
统计学题库

第五、六、七章:抽样推断1.总体分布、样本分布、抽样分布总体分布:总体中各个数据的分布样本分布:样本中各个数据的分布抽样分布:样本统计量的概率分布总体的分布通过直方图观察,但一般不可能得到所有的数据,也就不能直接观察到总体分布。
只要知道总体的分布类型和反映总体分布特征的参数就能够满足需要。
样本分布也称为经验分布,样本来源于总体,会包含总体的信息和特征,特别当样本容量较大时,样本的分布会很接近总体分布,但样本是随机抽取的,一般与总体分布有一定差异。
抽样分布是说明样本分布特征的统计量的分布,对它的理解是建立在反复抽样的基础上,样本是随机抽取的,不同的样本会有不同的统计量值,一个总体可以有很多个不同的样本,这样一个统计量就会有很多不同的取值,这些不同值的分布就是抽样分布。
由于在实践中对于同一总体我们不会反复抽取很多样本,因此,抽样分布一般不能直接观察到,仅是一种理论分布。
抽样分布揭示了样本统计量与总体参数的内在联系,为统计推断提供了理论基础。
2.总体单位与抽样单位、样本容量与样本可能数目3.统计量、总体参数及统计量的标准化统计量是样本数据的函数,在实际抽样之前,由于是样本随机的,统计量也是随机的,但在抽取样本之后,样本已经确定,统计量也就是确定的,不包含任何未知变量。
总体参数是说明统计总体的数据特征值,一般是确定但未知的,是待估计的。
统计量的标准化是统计推断的必要过程,是将具体的统计量转化为已知分布的统计量,转化以后就可以确定一定区间的概率。
4.统计误差、抽样误差、抽样标准误差与抽样边际误差统计误差是统计调查得到的值与客观实际值之间的差异。
包括抽样误差和非抽样误差。
非抽样误差又称工作误差或调查误差,是指调查登记过程中由于登记、过录、计算等原因引起的误差。
在全面调查和非全面调查中都有可能存在。
抽样误差也称为随机误差,是指在坚持了随机抽样的情况下,由于样本的随机性造成样本统计量与总体参数的差异。
样本是随机的,样本的统计量也是随机的,而总体参数是唯一的,因而抽样误差也是随机的。
概率论和数理统计(第三学期)第8章参数估计

由契比雪夫不等式,有
P( S 2 ES2
n
n
)
DS
2
n
=
2 4
2 n 1 2
即 lim P( S 2 ES2 ) 0
n
n
n
(n 1)S 2
E
2
n n 1
ES2 2 n
故 lim P( S 2 2 ) 0
n
n
§8.3 参数的区间估计
定义
设是总体的未知参数,若 (1 1
6
S~2 1 1.20 0.162 0.85 0.162 0.30 0.162 6 0.45 0.162 0.82 0.162 0.12 0.162 1 1.042 0.692 0.142 0.612 0.982 0.282 6 1 2.99 6 0.498 2
n
p xi
1
p
1 xi
xi p i1
1
p
n
n xi
i1
i 1
n
令y xi,得: i 1 ln Lxi , p y ln p n yln1 p
由对数似然方程
d ln L y n y 0 dp p 1 p
解得
p
y n
1 n
n i 1
xi
x
因为这是惟一的解,所 以p的极大似然估计值为
二、顺序统计量法
定义
1
, 2
,
,
为总体
n
的一个样本,将它
们按大小次序排列,取 居中的一个数 (若n为偶
数时,则取居中两数的 平均值)记为~,称~为
样本中位数。
即
~
k
1
,
1 2
k
管理统计学习题参考答案第八章

第八章1. 解:(1)假设检验的基本思想是,样本平均数与总体平均数出现差异不外乎两种可能:一是改革后的总体平均长度不变,但由于抽样的随机性使样本平均数与总体平均数之间存在抽样误差;二是由于工艺条件的变化,使总体平均数发生了显著的变化。
因此,可以这样推断:如果样本平均数与总体平均数之间的差异不大,未超出抽样误差范围,则认为总体平均数不变;反之,如果样本平均数与总体平均数之间的差异超出了抽样误差范围,则认为总体平均数发生了显著的变化。
根据样本平均数的抽样分布定理,有x Z σx μ±=或Z /σμx x ≤-。
当0=Z 时,表明样本均值等于总体均值,即μx =;当Z 很大时,表明样本均值离总体均值很远,即∆很大。
后一种情况是小概率事件。
在正常情况下,小概率事件是不会发生的,那么在一次抽样中小概率事件居然发生了,我们就有理由认为样本均值是不正常的,它与原总体相比,性质已经发生变化,应该拒绝接受原假设。
(2)假设检验的一般步骤包括:① 提出原假设和备择假设;对每个假设检验问题,一般可同时提出两个相反的假设:原假设和备择假设。
原假设又称零假设,是正待检验的假设,记为H 0;备择假设是拒绝原假设后可供选择的假设,记为H 1。
原假设和备择假设是相互对立的,检验结果二者必取其一。
接受H 0,则必须拒绝H 1;反之,拒绝H 0则必须接受H 1。
② 选择适当的统计量,并确定其分布形式;不同的假设检验问题需要选择不同的统计量作为检验统计量。
在例中,我们所用的统计量是Z ,在H 0为真时,N Z ~(0,1)。
③选择显著性水平α,确定临界值;显著性水平表示H 0为真时拒绝H 0的概率,即拒绝原假设所冒的风险,用α表示。
假设检验就是应用了小概率事件实际不发生的原理。
这里的小概率就是指α。
但是要小到什么程度才算小概率? 对此并没有统一的标准。
通常取α=0.1,0.05,0.01。
给定了显著性水平α,就可由有关的概率分布表查得临界值,从而确定H 0的接受区域和拒绝区域。
统计学区间估计详细讲解

2
x求解。若 x已知,则
x
即:
n
20
2 的正态分布。
x ~ N (82,2 )
STAT 8.1.2抽样误差的概率表述
x ~ N (82,22 )由概率论可知,
Z x
有以下关系式成立:
一般称,
x
服从标准正态分布,即, Z ~ N (0,1)
P(
x
1 为置信度,可靠程度等,反映估计结果的可信程度。若
STAT 8.1.3计算区间估计:已知时的大样本情况 在CJW公司的例子中,样本均值产生的抽样误差是3.92或更小 的概率是0.95。因此,可以构建总体均值的区间为,
x , x 82 3.92,82 3.92
x x
78.08,85.92
由于,从一个总体中抽取到的样本具有随机性,在一次偶然的 抽样中,根据样本均值计算所的区间并不总是可以包含总体均 值,它是与一定的概率相联系的。如下图所示:
抽样误差
x= x
(实际未知)
STAT 要进行区间估计,关键是将抽样误差 区间可表示为:
x x 此时,可以利用样本均值的抽样分布对抽样误差的大小进行 描述。
上例中,已知,样本容量n=100,总体标准差 20 ,根据 中心极限定理可知,此时样本均值服从均值为 ,标准差为
x , x
本章难点
1、一般正态分布标准正态分布; 2、t分布; 3、区间估计的原理; 4、分层抽样、整群抽样中总方差的分解。
8.1总体均值的区间估计(大样本n>30)
点估计的缺点:不能反映估计的误差和精确程度
STAT
区间估计:利用样本统计量和抽样分布估计总体参数的可能区 间 【例1】CJW公司是一家专营体育设备和附件的公司,为了监控 公司的服务质量, CJW公司每月都要随即的抽取一个顾客样本 进行调查以了解顾客的满意分数。根据以往的调查,满意分数 的标准差稳定在20分左右。最近一次对100名顾客的抽样显示, 满意分数的样本均值为82分,试建立总体满意分数的区间。 8.1.1抽样误差 抽样误差:一个无偏估计与其对应的总体参数之差的绝对值。
区间估计与假设检验

"### 参数的区间估计与假设检验之间的区别
参数的区间估计和假设检验从不同的角度回答同一问 题, 它们的统计处理是相通的。 但是它们之间又有区别, 体现 以下三点: 第一, 参数估计解决的是多少 (或 范 围 ) 问题, 假设检验 则判断结论是否成立。前者解决的是定量问题, 后者解决的 是定性问题。 第二, 两者的要求各不相同。区间估计确定在一定概率 保证程度下给出未知参数的范围。 而假设检验确定在一定的 置信水平下, 未知参数能否接受已给定的值。 第三, 两者对问题的了解程度各不相同。进行区间估计 之前不了解未知参数的有关信息。 而假设检验对未知参数的 信息有所了解, 但作出某种判断无确切把握。 因而在实际应用中,究竟选择哪种方法进行统计推断, 需要根据实际问题的情况确定相应的处理方法。 否则将会产
" 拒 绝 域 为 +)J.)0!+#)(-- , 查表 %’#$#"4" 统计量 0’ ,)"" ’ & , %
得 0"$":’!$"(: , 计 算 得 0’)($A::A. 由 此 可 见 统 计 量 的 值 未 落 入 拒绝域中, 因而接受原假设, 认为符合设计要求。
(9!
统计与决策 !""# 年 # 月 (下)
上述关系虽就一特例而言, 但也有普遍意义。由区间估 计可以很容易构造检验函数。 下面来说明怎样由检验函数构 造区间估计。 设 # 是问题
生不同的结论, 做出错误的统计推断。 例 ! 测试某个品牌的汽车的百公里耗油量,假设在正 常的情况下汽车百公里耗油量服从正态分布, 路况以及驾驶 员的技术符合正常要求。现对该批汽车进行测试, 随机选取
+&".!-。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 解:依题意, 95%, Z 2 1.96, 9.65, E 2 可得 2 2
9.65 n ( Z 2 ) 2 1.96 2 89.43 E 2
2 2
将以上结果取下一个整数(90)即为必要的样本容量。
STAT
说明:
由于总体标准差 下方法取得 的值。
STAT 8.1.4计算区间估计:未知时的大样本情况 在大多数的情况下,总体的标准差都是未知的。根据抽样 分布定理,在大样本的情况下,可用样本的标准差s作为总体标 准差的点估计值,仍然采用上述区间估计的方法进行总体参数 的估计。
未知时的大样本下的区间估计
x Z
2
n
式中,( )为置信系数; 1
取的样本大小是否合适?能不能用一个更大的样本进行估计?
二是能否将估计的误差在缩小一点?比如,估计平均重量时估 计误差不超过3克,估计合格率时误差不超过10%。三是总体平 均重量的方差是多少?因为方差的大小说明了生产过程的稳定 性,过大或过小的方差都意味着应对生产过程进行调整。
STAT
本章重点
1、抽样误差的概率表述; 2、区间估计的基本原理; 3、小样本下的总体参数估计方法; 4、样本容量的确定方法;
2
x
Z 2 ) 1
事先给定一个置信度,则可根据标准正态分布找到其对应的临 界值 Z 。进而计算抽样误差
x x Z 2 x
STAT 若,1 抽样误差
95%
则查标准正态分布表可得,1.96* 2 3.92
n Z 2
n ( Z 2 ) 2
2
E2
STAT 【例4】在以前的一项研究美国租赁汽车花费的研究中发现,租 赁一辆中等大小的汽车,其花费范围为,从加利福尼亚州的奥 克兰市的每天36美元到康涅狄格州的哈特福德市的每天73.50美 元不等,并且租金的标准差为9.65美元。假定进行该项研究的组 织想进行一项新的研究,以估计美国当前总体平均日租赁中等 大小汽车的支出。在设计该项新的研究时,项目主管指定对总 体平均日租赁支出的估计误差边际为2美元,置信水平为95%。
即(37.37,41.63)岁。
(3)90%的置信区间为39.5 ±2.13
注意
(1)置信系数一般在抽样之前确定,根据样本所建立的区间能 包含总体参数的概率为
(2)置信区间的长度(准确度)在置信度一定的情况下,与样 本容量的大小呈反方向变动,若要提高估计准确度,可以扩大 样本容量来达到。
STAT
通常,称该区间为置信区间,其对应的置信水平为 1
置信区间的估计包含两个部分:点估计和描述估计精确度的 正负值。也将正负值称为误差边际或极限误差,反映样本估计量 与总体参数之间的最大误差范围。 总结:已知时的大样本下的区间估计
x Z
2
式中,( )为置信系数; 1
n
Z 2为在标准正态分布的右 侧尾部中所提供的面积 的Z值。 为 2
x
s
n
15
2
53.87
样本标准差 误差边际
( x x)
n 1
651.73 6.82 14
s 6.82 x t 2 2.145* 3.78 n 15
即(50.09,57.65)天。
95%的置信区间为
53.87 ±3.78
STAT
8.3确定样本容量
此时抽样误差的意义可表述为:以样本均值为中心的±3.92 的区间包含总体均值的概率是95%,或者说,样本均值产生的抽 样误差是3.92或更小的概率是0.95。 常用的置信度还有90%,95.45%,99.73%,他们对应的临 界值分别为1.645,2和3,可以分别反映各自的估计区间所对应 的精确程度和把握程度。
根据表1的数据,质检科估计出该天生产的食品每袋的平均 重量在101.38~109.34克之间,其中,估计的可信程度为95%, 估计误差不超过4克。产品的合格率在96.07%~73.93%之间,其 中,估计的可信程度为95%,估计误差不超过16%。
STAT 质检报告提交后,企业高层领导人提出几点意见:一是抽
第八章
区间估计
STAT
教学重点
教学过程
教学总结
实践中的统计
STAT
一家食品生产企业以生产袋装食品为主,每天的产量约为
8000袋左右。按规定每袋的重量应不低于100克,否则即为不合
格。为对产量质量进行检测,企业设有质量检查科专门负责质 量检验,并经常向企业高层领导提交质检报告。质检的内容之 一就是每袋重量是否符合要求。 由于产品的数量大,进行全面的检验是不可能的,可行的
Z 2为在标准正态分布的右 侧尾部中所提供的面积 的Z值。 为 2
STAT
【例2】
斯泰特怀特保险公司每年都需对人寿保险单进行审 查,现公司抽取36个寿保人作为一个简单随即样本,得到关于、 投保人年龄、保费数量、保险单的现金值、残废补偿选择等项 目的资料。为了便于研究,某位经理要求了解寿险投保人总体 平均年龄的90%的区间估计。
本章难点
1、一般正态分布标准正态分布; 2、t分布; 3、区间估计的原理; 4、分层抽样、整群抽样中总方差的分解。
8.1总体均值的区间估计(大样本n>30)
点估计的缺点:不能反映估计的误差和精确程度
STAT
区间估计:利用样本统计量和抽样分布估计总体参数的可能区 间 【例1】CJW公司是一家专营体育设备和附件的公司,为了监控 公司的服务质量, CJW公司每月都要随即的抽取一个顾客样本 进行调查以了解顾客的满意分数。根据以往的调查,满意分数 的标准差稳定在20分左右。最近一次对100名顾客的抽样显示, 满意分数的样本均值为82分,试建立总体满意分数的区间。 8.1.1抽样误差 抽样误差:一个无偏估计与其对应的总体参数之差的绝对值。
8.2总体均值的区间估计:小样本的情况
在小样本的情况下,样本均值的抽样分布依赖于总体的抽样分 布。我们讨论总体服从正态分布的情况。
总体标准差已知 x服从正态分布 小样本n 30 总体标准差未知 x服从t分布( s )
t分布的图形和标准正态分布的图形类似,如下图示:
STAT
STAT 8.1.3计算区间估计:已知时的大样本情况 在CJW公司的例子中,样本均值产生的抽样误差是3.92或更小 的概率是0.95。因此,可以构建总体均值的区间为,
x , x 82 3.92,82 3.92
x x
78.08,85.92
由于,从一个总体中抽取到的样本具有随机性,在一次偶然的 抽样中,根据样本均值计算所的区间并不总是可以包含总体均 值,它是与一定的概率相联系的。如下图所示:
100
2
x求解。若 x已知,则
x
即:
n
20
2 的正态分布。
x ~ N (82,2 )
STAT 8.1.2抽样误差的概率表述
x ~ N (82,22 )由概率论可知,
Z x
有以下关系式成立:
一般称,
x
服从标准正态分布,即, Z ~ N (0,1)
x
P(
1 为置信度,可靠程度等,反映估计结果的可信程度。若
s x Z 2 n
假定总体服从正态分布;
式中,( )为置信系数; 为样本的标准差; 2为在 1 s t
自由度为(n - 1 )的t分布的右侧尾部中所提 供的面积为 的t值。 2
STAT 【例3】谢尔工业公司拟采用一项计算机辅助程序来培训公司的 维修支援掌握及其维修的操作,以减少培训工人所需要的时间。 为了评价这种培训方法,生产经理需要对这种程序所需要的平 均时间进行估计。以下是利用新方对15名职员进行培训的培 训天数资料。
标准正态分布 t分布(自由度为20) t分布(自由度为10)
0 图2标准正态分布与t分布的比较
STAT 在t分布中,对于给定的置信度,同样可以通过查表找到其对 应的临界值 t ,利用临界值也可计算区间估计的误差边际
2
s t 2 n
因此,总体均值的区间估计在总体标准差未知的小样本情况下 可采用下式进行:
职员 1 2 3 4 5 时间 52 44 55 44 45 职员 6 7 8 9 10 时间 59 50 54 62 46 职员 11 12 13 14 15 时间 54 58 60 62 63
根据上述资料建立置信度为95%的总体均值的区间估计。 (假定培训时间总体服从正态分布)。
STAT 解:依题意,总体服从正态分布,n=15(小样本),此时 总体方差未知。可用自由度为(n-1)=14的t分布进行总体均值 的区间估计。 x 52 44 55 63 样本平均数
投保人 年龄 投保人 年龄 投保人 年龄 投保人 年龄
1 2 3 4 5 6 7 8 9
32 50 40 24 33 44 45 48 44
10 11 12 13 14 15 16 17 18
47 31 36 39 46 45 39 38 45
19 20 21 22 23 24 25 26 27
27 43 54 36 34 48 23 36 42
图1 根据选择的在 x1 、x2 、x3 位置的样本均值建立的区间
STAT
x 的抽样分布
x 2
95%的所有x的值
3.92 3.92
x1
基于x2 3.92的 区间
基于x1 3.92的 区间
x3
x2
基于x3 3.92的区间(该区间不包含)
STAT 上图中,有95%的样本均值落在阴影部分,这个区域的样本 均值±3.92的区间能够包含总体均值。 因此,总体均值的区间的含义为,我们有95%的把握认为, 以样本均值为中心的±3.92的区间能够包含总体均值。