52第5章第2节区间估计
高等数学 第5章 第二节 定积分的性质 中值定理

(2)记 f ( x) e x2 x , x 0,2 , 则 f ( x) e x2 x 2x 1 ,
令 f ( x) 0, 得唯一驻点 x 1 ,
2
又
f
(
1
)
e
1 4
,
f (0) 1, f (2) e 2 ,
2
1
所以 m e 4 , M e 2
1
e 4 2 0
y gx
推论1 若 f x gx, x a, b,
y
则
b
a
f xdx
b
a
g
x
dx
a b.
推论 2
b
a
f
xdx
b
a
f xdx
(a b).
性质6 (估值不等式)
y f x
O xa
xbx
设 M max f x, m min f x, 则
x[ a ,b ]
x[ a ,b ]
mb
a
b
a
f
xdx
加性
c
b
c
a f ( x)dx a f ( x)dx b f ( x)dx
b
a
f ( x)dx
c
a
c
f ( x)dx b
f ( x)dx
c
a
b
f ( x)dx c
f ( x)dx
1
性质4
b
b
1dx dx b a
a
a
性质5
若 f x 0, x a,b,
则
b
a
f
xdx
0
a b.
M b
a
a b.
如
计量经济学第5章假设检验

假设检验中的小概率原理
假设检验中的小概率原理
什么小概率? 1. 在一次试验中,一个几乎不可能发生的事
件发生的概率 2. 在一次试验中小概率事件一旦发生,我们
就有理由拒绝原假设 3. 小概率由研究者事先确定
5-17
假设检验中的小概率原理
由以往的资料可知,某地新生儿的平均体重为3190克,从今年的新生儿中随机 抽取100个,测得其平均体重为3210克,问今年新生儿的平均体重是否为 3190克(即与以往的体重是否有显著差异)?
决策:
在 = 0.05的水平上拒绝H0
结论:
有证据表明新机床加工的零件 的椭圆度与以前有显著差异
5-56
2 已知均值的检验
(P 值的计算与应用)
第1步:进入Excel表格界面,选择“插入”下拉菜单 第2步:选择“函数”点击 第3步:在函数分类中点击“统计”,在函数名的菜单下选
与原假设对立的假设 表示为 H1
5-12
确定适当的检验统计量
什么检验统计量?
1.用于假设检验决策的统计量 2.选择统计量的方法与参数估计相同,需考虑
是大样本还是小样本 总体方差已知还是未知
检验统计量的基本形式为 Z X 0 n
5-13
规定显著性水平(significant level)
(P-value)
1. 是一个概率值
2. 如果原假设为真,P-值是抽样分布中大
于或小于样本统计量的概率
左侧检验时,P-值为曲线上方小于等于检
验统计量部分的面积
右侧检验时,P-值为曲线上方大于等于检
验统计量部分的面积
3. 被称为观察到的(或实测的)显著性水平
5-44
双侧检验的P 值
第2节 区间估计

2
~ (n 1)
2
在给定的置信度1 下,由
P{12 2 (n 1) 2 22 (n 1)} 1
得
2 的置信区间为:
2 (n 1) S 2 (n 1) S , 2 2 (n 1) 1 (n 1) 2 2
即 P X u X u 1 n 2 n 2 置信度为1 的置信区间是 ( X u , X u )
n
2
n
2
例1 包糖机某日开工包了12包糖,称得重量(单 位:克)分别为506,500,495,488,504,486,505,
2 ( n 1) S n 11 0.04 2 0.0224 2 (n 1) 19.675
故所求置信区间为: (0.0224, 0.0962)
二、两个正态总体均值差与方差比的置信区间 1、二总体均值差
1 2 的区间估计
2 X ~ N ( 1 , 12 ), Y ~ N ( 2 , 2 ) 设两总体
n2
n2
Yi 2
2
) 2 ~ 2 ( n2 )
1 故F
1
2 1 i 1 n2
(X
i
n1
i
1 )
2
2
n1 ~F (n1 , n2 ) n2
( , ) 即是 的置信度为 1 的置信区间
正态总体参数的区间估计
一、单总体均值与方差的区间估计
二、双总体均值差与方差比的区间估计
三、小结
一、单正态总体均值与方差的区间估计 1.单总体均值 的置信区间 X ~ N ( , 2 ), 2 已知时 (1)设
第五章 参数估计

1
X 2 t n1 n2 2
2
2 Sp
n1
n2
X
1
X 2 z
2
2 S12 S 2 n1 n2
2 Sp
2 2 n1 1S1 n2 1S 2
n1 n2 2
20
例题:
分别在城市1和城市2中随机抽取n1=400, n2=500的职工进行调查,经计算两城市职工的 平均月收入及标准差分别为X1=1650元,
22
思考题:
一个研究机构做了一项调查,以确定稳定的吸 烟者每周在香烟上的消费额。他们抽取49位固 定的吸烟者,发现均值为20元,标准差5元。
1.总体均值的点估计是多少?
2.总体均值μ的95%置信区间是什么?
23
思考题解答:
1.总体均值的点估计是20元。
2.总体均值μ的95%置信区间: 随机变量X表示每周香烟消费额,由题意可知,X=20, S=5,1-α=0.95,α=0.05;n=49 属于大样本,σ 未知以S估计。总体均值μ的95%置信区间为
P z Z z 1 2 2
P L U 1
X P z z 1 2 2 n
Step3:将上面等式进行等价变换即可。
P L U 1
第五章 参数估计
第五章 参数估计
利用样本数据对总体特征进行推断,通常在以下 两种情况下进行:
当总体分布类型已知(如:正态),根据样本数据对 总体分布的未知参数进行估计或检验。参数估 计或参数检验。(如:μ或σ为何?) 当总体分布类型未知或知道很少,根据样本数据 对总体的未知分布的形状或特征进行推断。非参 数检验。(如:是否正态分布?是否随机?)
第5章__抽样推断

抽样误差的影响因素
(1)总体各单位标志变异程度。 (2)样本容量的大小。 (3)抽样方法。 (4)抽样的组织形式。
四、抽样极限误差
含义:
抽样极限误差指在进行抽样估计时,根据研究对象的变 异程度和分析任务的要求所确定的样本指标与总体指标 之间可允许的最大误差范围。
计算方法:
它等于样本指标可允许变动的上限或下限与总体指标 之差的绝对值。
则:
x
n
10 1(公斤) 100
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例题二解 已知: N 2000, n 400, x 4800, 300
则:
x
n
300 15(小时) 400
x
2 1 n
3002 1
400
13.42(小时)
n N
-20
400
-15
225
-5
25
0
0
-15
225
-10
100
0
0
5
25
-5
25
0
0
10
100
15
225
0
0
5
25
15
225
20
400
0
2000
样本平均数的平均数( x )
x
样本可能数目
960 16
60元
所以 (x) X
样抽样平均误差x
x (x)2
样本可能数目
2000 11.18元 16
四个工人工资分别为40、50、70、80元
抽样平均误差 x
n
15.81 11.18元 2
关于区间估计6页word文档

(1) P值是:1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。
2) 拒绝原假设的最小显著性水平。
3) 观察到的(实例的) 显著性水平。
4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。
(2) P 值的计算:一般地,用X 表示检验的统计量,当H0 为真时,可由样本数据计算出该统计量的值C ,根据检验统计量X 的具体分布,可求出P 值。
具体地说:左侧检验的P 值为检验统计量X 小于样本统计值C 的概率,即:P = P{ X < C}右侧检验的P 值为检验统计量X 大于样本统计值C 的概率:P = P{ X > C}双侧检验的P 值为检验统计量X 落在样本统计值C 为端点的尾部区域内的概率的2 倍: P = 2P{ X > C} (当C位于分布曲线的右端时) 或P = 2P{ X< C} (当C 位于分布曲线的左端时) 。
若X 服从正态分布和t分布,其分布曲线是关于纵轴对称的,故其P 值可表示为P = P{| X| > C} 。
计算出P 值后,将给定的显著性水平α与P 值比较,就可作出检验的结论:如果α > P 值,则在显著性水平α下拒绝原假设。
如果α ≤ P 值,则在显著性水平α下接受原假设。
在实践中,当α = P 值时,也即统计量的值C 刚好等于临界值,为慎重起见,可增加样本容量,重新进行抽样检验。
整理自:区间估计区间估计(Interval Estimation)[编辑]什么是区间估计区间估计就是以一定的概率保证估计包含总体参数的一个值域,即根据样本指标和抽样平均误差推断总体指标的可能范围。
它包括两部分内容:一是这一可能范围的大小;二是总体指标落在这个可能范围内的概率。
区间估计既说清估计结果的准确程度,又同时表明这个估计结果的可靠程度,所以区间估计是比较科学的。
用样本指标来估计总体指标,要达到100%的准确而没有任何误差,几乎是不可能的,所以在估计总体指标时就必须同时考虑估计误差的大小。
区间估计和误差计算

(二)区间估计区间估计是指用样本指标、抽样误差和概率所构造的区间以估计总体指标存在的可能范围。
在进行区间估计的时候,根据所给定的条件不同,总体平均数和总体成数的估计有两条模式可供选择: 第一套:给定置信度要求,去推算抽样误差的可能范围。
第二套:根据已给定的抽样误差范围,求出概率保证程度。
1. 总体平均数的区间估计按照第一套模式,根据置信度F t ()的要求,估计极限抽样误差的可能范围)(∆∆∆或p x ,并指出估计区间(置信区间)。
具体步骤是:(1)抽取样本,并根据调查所得的样本单位标志值,计算样本平均数x ;计算样本标准差;在大样本下用以代替总体标准差推算抽样平均误差μ。
(2)根据给定的置信度F t ()的要求,查《正态分布概率表》,求得概率度t 值。
(3)根据概率度t 和抽样平均误差μx 计算极限抽样误差的可能范围μxx t =∆,并据以计算置信区间的上下限。
例14 麦当劳餐馆在7周内抽查49位顾客的消费额(元)如下,求在概率95%的保证下,顾客平均消费额的置信区间。
15 24 38 26 30 42 1830 25 26 34 44 20 3524 26 34 48 18 28 4619 30 36 42 24 32 4536 21 47 26 28 31 4245 36 24 28 27 32 3647 35 22 24 32 46 26第一步:根据样本计算样本平均数和标准差:x x n ==∑32 (元) S n x x ==-∑2945().(元),用样本标准差代替总体标准差σ=945.(元) 样本平均误差 x n μσ===94549135..(元)第二步:根据给定的置信度F t ()=95%,查概率表得t =196. 第三步:根据概率度t 和抽样平均误差推算抽样极限误差的可能范围。
65.235.196.1=⨯==∆μxx t (元) 将μxx ,的值代入区间估计公式 )(65.34)(35.2965.23265.232元元≤≤+≤≤-+≤≤-∆∆X X x X x xx计算结果表明,以95%的概率保证,麦当劳餐馆顾客消费额在29.35~34.65元之间。
统计学第五章

2-分布
(性质和特点)
• 1. 期望为:E(2)=n,
•
方差为:D(2)=2n(n为自由度)
• 2. 可加性:
•
若U和V为两个独立的2分布随机变量,
U~2(n1),V~2(n2),则U+V这一随机变量服从 自由度为n1+n2的2分布
• 3. 当 n 时, 2分布的极限分布是正态
分布
不同自由度的2-分布
(central limit theorem)
从均值为,方差为 2的一个任意总体中抽取容量
为n的样本,当n充分大时,样本均值的抽样分布近 似服从均值为μ、方差为σ2/n的正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
x
中心极限定理
(2)系统抽样的评价 ——操作上简便易行 ——如果总体是按有关标志进行排列的话,可以提 高样本的代表性,改进抽样精度 ——对估计量方差的估计比较困难
4、整群抽样(cluster random sampling) (1)整群抽样的概念
整群抽样是指将总体分成群,从中随机抽取 若干群,群中的所有单位构成样本
E(x)
2 x
2
n
样本比例的分布
(proportion)
1. 总体(或样本)中具有某种属性的单位与全部单位 总数之比
– 不同性别的人与全部人数之比
– 合格品(或不合格品) 与全部产品总数之比
2. 总体比例可表示为
N0 或 1 N1
N
N
3. 样本比例可表示为
4.
p n0 或 1 p n1
2. 一种理论概率分布
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对给定的置信水平 1-α ,若取λ1和λ2使得
从而得置信区间的区间长为 X X ( 2 1 ) 。 1 2
江苏师范大学
第 5 章 参数估计与假设检验
§5.2 区间估计
第4页
定义5.2.1 设 (X1, …, Xn )为来自总体X 的样本,θ是总体 X 分布中的一个未知参数,θ∈Θ。对给定的α( 0<α<1),假设有两 个统计量
L L ( X1, ,和 Xn)
U U ( X1, ,使得 , Xn)
率越小越好,可认为置信下限为 0 ,人们关心的往往是置信上限。
本节目录
本章目录
江苏师范大学
第 5 章 参数估计与假设检验
§5.2 区间估计
第7页
§5.2.2 枢轴量法
求未知参数θ的置信区间的最常用的方法是枢轴量法,其一般步骤为: 第一步:选取θ的一个较优的点估计 ; 第二步:围绕 构建一个仅依赖样本(X1, …, Xn )和θ的函数 G = G ( X1, …, Xn ;θ ) , 且 G 的分布已知(不依赖于θ)。 像 G = G ( X1, …, Xn ;θ) 这样的函数(即仅依赖样本(X1, …, Xn )和未知参 数θ的函数,且其分布已知。)称为枢轴量。 第三步:对给定的置信水平 1-α ,确定λ1和λ2使得 P (λ1≤G ( X1, …, Xn ;θ)≤λ2) = 1-α。 第四步:将不等式λ1≤G ( X1, …, Xn ;θ)≤λ2变形为 L ( X 1 , , X n ) ≤ ≤ U ( X 1 , , X n ) , 即得θ的置信水平为1-α的置信区间 [ L ( X1, , X n ), U ( X1, , X n。 )]
P( L ( X1 ,
, X n ) ≤ ≤ U ( X1 ,
, X n )) 1 , .
则称随机区间 [ L ( X1, , X n ), U ( X1, , X n )] 为θ的置信水平为1-α的置 θ的置信下限和置信上限。 分别称为 U 对任一 ( x1, … , xn ) ,由于样本的随机性, [ L ( x1 , , xn ), U ( x1, , xn )] 能否盖 住未, X n ), U ( X1, , X n )] 能 盖住未知参数θ的概率尽可能大些;同时也希望 [ L ( X1, , X n ), U ( X1, , X n )] 的 信区间, 和 L
X P ≤ ≤ 2 1 n 1, X 由于 1 ≤ 2 ≤ ≤ X 1 , ≤2 X n n n
对给定的置信水平 1-α ,若取λ1和λ2使得
从而得置信区间的区间长为 X X ( 2 1 ) 。 1 2
导出θ的置信水平为1-α的置信区间。
本节目录
本章目录
江苏师范大学
第 5 章 参数估计与假设检验
§5.2 区间估计
第9页
§5.2.3 正态总体参数的置信区间
设 X ~ N( µ ,σ2),( X1, X2, … , Xn ) 为取自总体 X 的样本。 ⑴ 方差σ2 已知时均值 µ 的置信区间 由于 µ 的矩估计和最大似然估计均为 X ,故取 X X U ~ N (0,1) 作为 µ 的点估计,围绕 X 构建枢轴量并确定其分布: n
度。为此我们引入区间估计的概念。
本节目录
本章目录
江苏师范大学
第 5 章 参数估计与假设检验
§5.2 区间估计
第3页
§5.2.1 区间估计的概念
设(X1, … , Xn )为来自总体X 的样本,θ是总体X 分布中的一个未知参数,
所谓区间估计就是要找两个统计量 L L ( X1, , X n ) 和 U U ( X1, , X n ), 且 L U ,在得到样本观察值 ( x1, … , xn ) 之后,就可以得到一个区间
n n n
所以,应取 [λ1,λ2 ] = [ uα/2, u1-α/2 ] = [ - u1-α/2, u1-α/2 ] ,即 µ 的置信水平为 1 α的置信区间为
。 X u , X u 1 2 1 2 n n
本节目录 本章目录
这时置信区间的 区间长最短! 江苏师范大学
定义5.2.1 设 (X1, …, Xn )为来自总体X 的样本,θ是总体 X 分布中的一个未知参数,θ∈Θ。对给定的α( 0<α<1),假设有两 个统计量
L L ( X1, ,和 Xn)
U U ( X1, ,使得 , Xn)
P( L ( X1 ,
, X n ) ≤ ≤ U ( X1 ,
区间长度尽可能短些。 一般来说,要使得“随机区间能盖住未知参数θ的概率”尽可 能大,则必然导致 “随机区间的长度” 增大。为解决此矛盾,先给定 “随机区间能 盖住未知参数θ的概率”的要求,这就产生了置信区间的概念。
本节目录 本章目录
对任一 ( x1, … , xn ) ,由于样本的随机性, [ L ( x1 ,
n n n
所以,应取 [λ1,λ2 ] = [ uα/2, u1-α/2 ] = [ - u1-α/2, u1-α/2 ] ,即 µ 的置信水平为 1 α的置信区间为
。 X u , X u 1 2 1 2 n n
本节目录 本章目录
这时置信区间的 区间长最短! 江苏师范大学
n n n
所以,应取 [λ1,λ2 ] = [ uα/2, u1-α/2 ] = [ - u1-α/2, u1-α/2 ] ,即 µ 的置信水平为 1 α的置信区间为
。 X u , X u 1 2 1 2 n n
本节目录 本章目录
这时置信区间的 区间长最短! 江苏师范大学
本节目录
本章目录
江苏师范大学
第 5 章 参数估计与假设检验
§5.2 区间估计
第6页
解决未知参数θ的区间估计问题,关键是确定θ的置信水平为 1-α的置信区间。有了置信区间,将样本值( x1, … , xn )代入置信 区间而得到的区间称为置信区间的值,也简称为置信区间。 在一些实际问题中,人们感兴趣的可能是未知参数的一个置 信下限或一个置信上限。譬如,产品的寿命越大越好,可认为置 信上限为 +∞,人们关心的往往是置信下限;又如,产品的次品
第 5 章 参数估计与假设检验
§5.2 区间估计
第 11 页
§5.2.3 正态总体参数的置信区间
设 X ~ N( µ ,σ2),( X1, X2, … , Xn ) 为取自总体 X 的样本。 ⑵ 方差σ2 未知时均值 µ 的置信区间 由于 µ 的矩估计和最大似然估计均为 X ,故取 X X U ~ N (0,1) 作为 µ 的点估计,围绕 X 构建枢轴量并确定其分布: n
第 5 章 参数估计与假设检验
§5.2 区间估计
第1页
§5.2 区间估计目录
§5.2.1 §5.2.2 区间估计的概念 枢轴量法
§5.2.3
§5.2.4
正态总体参数的置信区间
大样本情形的近似置信区间
本章目录
江苏师范大学
第 5 章 参数估计与假设检验
§5.2 区间估计
第2页
§5.2 区间估计
参数的点估计,即用一个点去估计未知参数。估计 量的无偏性、有效性以及相合性从各个不同角度描述了 点估计量的合理性,但点估计不能直接提供其估计的精
区间长度尽可能短些。 一般来说,要使得“随机区间能盖住未知参数θ的概率”尽可 能大,则必然导致 “随机区间的长度” 增大。为解决此矛盾,先给定 “随机区间能 盖住未知参数θ的概率”的要求,这就产生了置信区间的概念。
本节目录 本章目录
江苏师范大学
第 5 章 参数估计与假设检验
§5.2 区间估计
第5页
, X n )) 1 , .
则称随机区间 [ L ( X1, , X n ), U ( X1, , X n )] 为θ的置信水平为1-α的置 信区间, 和 L θ的置信下限和置信上限。 分别称为 U
定义5.2.1说明随机区间能盖住未知参数θ的概率为1-α ,在满 足这一要求下,随机区间 些为好。 的区间长度短 [ L ( X1, , X n ), U ( X1, , X n )]
本节目录 本章目录
江苏师范大学
第 5 章 参数估计与假设检验
§5.2 区间估计
[ L ( X1 ,
第8页
注:确定λ1和λ2时,还要注意变形后的区间 的长度是否比较短些?
X (n)
, X n ), U ( X1,
, X n )]
例5.2.1 设总体X 服从[0,θ]上的均匀分布,其中θ>0为未知参数, (X1, …, Xn )(n≥2)是取自 X 的样本,试利用 解
X P ≤ ≤ 2 1 n 1, X 由于 1 ≤ 2 ≤ ≤ X 1 , ≤2 X n n n
对给定的置信水平 1-α ,若取λ1和λ2使得
从而得置信区间的区间长为 X X ( 2 1 ) 。 1 2
第 5 章 参数估计与假设检验
§5.2 区间估计
第 10 页
§5.2.3 正态总体参数的置信区间
设 X ~ N( µ ,σ2),( X1, X2, … , Xn ) 为取自总体 X 的样本。 ⑴ 方差σ2 已知时均值 µ 的置信区间 由于 µ 的矩估计和最大似然估计均为 X ,故取 X X U ~ N (0,1) 作为 µ 的点估计,围绕 X 构建枢轴量并确定其分布: n