总体参数区间估计(6)讲解

合集下载

7.8 两个正态总体参数的区间估计

2 1

2 2
)

1
nm
因此，均值差1−2的置信水平1−α的置信区间为
(( X Y ) z 2

2 1
n

2 2
m
,(X
Y
)
z
2

2 1

2 2
)
nm
两个正态总体参数的区间估计
2.均值差1−2的置信区间（方差12 =22 = 2，但 2 未知情形）
易知 ( X Y ) (1 2 ) ( X Y ) (1 2 ) ~ N (0,1)
枢轴量 T X Y (1 2 ) ~ t(n m 2)
S 1 n 1 m
根据 t分布的性质，取分位数tα/2 (n+m−2) 有
P{|
X Y (1 2 )
S 1 n 1 m
|
t
2(n

m

2)}

1
因此，均值差1−2的置信水平1−α置信区间为
2
(2n)=
2 0.05
(18)=28.869,12
2 (2n)

2 0.95
(18)

9.39
计算得：2nX 1062 1/λ 的置信水平为0.90的置信区间为 ( 1062 , 1062) (36.787,113.099)
28.869 9.39
两个正态总体参数的区间估计
2
,

2 2
m
)
由正态分布的性质可得
X
Y
~
N (1

2
,

2 1

总体参数的区间估计

三、总体参数的区间估计
图5-10 “探索”对话框
图5-11 “探索:统计量”对话框
三、总体参数的区间估计
单击“统计量”按钮，弹出“探索：统计量”对话框，如图5-11所示。该对话框中有如下四个复选框：（1）描述性：输出均值、中位数、众数、标准误、方差、标准差、极小值、极大值、全距、四分位距、峰度系数和偏度系数的标准误差等。此处能够设置置信区间，默认为90%(α=0.1),可根据需要进行调整。（2）M 最大似然确定数。（3）界外值：输出五个最大值和五个最小值。（4）百分位数：输出第5%、10%、25%、50%、75%、90%、95%位数。
三、总体参数的区间估计
【例5-17】某餐馆随机抽查了50位顾客的消费额（单位：元）为 18 27 38 26 30 45 22 31 27 26 35 46 20 35 24 26 34 48 19 28 46 19 32 36 44 24 32 45 36 21 47 26 28 31 42 45 36 24 28 27 32 36 47 53 22 24 32 46 26 27 在90%的概率保证下，采用点估计和区间估计的方法推断餐馆顾客的平均消费额。解：执行“分析”→“描述统计”→“探索”命令，打开“探索”对话框。由于本例只有消费额一个变量，且需要对消费额进行探索性分析，故选中左侧列表框中的“消费额”选项，将其移入“因变量列表”框中，如图5-10所示。
解：已知n=31,α=0.01,=10.2;σ=2.4,z0.005=2.58，由于总体方差已知，为大样本，可以利用式（5-23）来进行计算。
即（9.088，11.312 该学生每天的伙食费在显著性水平为99%时的置信区间为（ 9.088，11.312）。

概率论与数理统计实训06讲解

函数说明
二项分布的最大似然估计返回水平的参数估计和置信区间泊松分布的最大似然估计返回水平的参数和置信区间正态分布的最大似然估计返回水平的期望、方差和置信区间均匀分布的最大似然估计返回水平的参数估计和置信区间指数分布的最大似然估计返回水平的参数估计和置信区间
expfit
例 1 产生 100 行2 列服从区间(10, 12)上的均匀分布的随机数, 计算区间端点“a”和“b”的极大似然估计值, 求出置信度为0.95 的这两个参数的置信区间.
解在命令窗口中输入: r = unifrnd(10, 12, 100, 2); [ahat, bhat, aci, bci] = unifit(r)
调用形式
binofit (X, N) [PHAT, PCI] = binofit (X, N, ALPHA) poissfit (X) [LAMBDAHAT, LAMBDACI]= poissfit (X,) normfit (X, ALPHA) [MUHAT, SIGMAHAT, MUCI, SIGMACI] = normfit (X, ALPHA) unifit (X, ALPHA) [AHAT, BHAT, ACI, BCI] = unifit (X, ALPHA) expfit (X) [MUHAT, MUCI] = expfit (X, ALPHA)
基本数学原理:

样本数字特征法 1 用样本均值 x n x 作为总体均值EX的估计值；用样本方差 S n 1 1 ( x x ) 作为总体方差DX的估计值。在Matlab中，样本x = [x1, x2,…, xn]，则样本均值：mx = 1/n*sum (x) 样本方差：S2 = 1/(n-1)*sum ((x-mx).^2)

统计学区间估计详细讲解

100
2
x求解。若 x已知，则
x

即：
n
20
2 的正态分布。
x ~ N (82,2 )
STAT 8.1.2抽样误差的概率表述
x ~ N (82,22 )由概率论可知，
Z x
有以下关系式成立：
一般称，
x
服从标准正态分布，即， Z ~ N (0,1)
P(
x
1 为置信度，可靠程度等，反映估计结果的可信程度。若
STAT 8.1.3计算区间估计：已知时的大样本情况在CJW公司的例子中，样本均值产生的抽样误差是3.92或更小的概率是0.95。因此，可以构建总体均值的区间为，
x , x 82 3.92,82 3.92
x x
78.08,85.92
由于，从一个总体中抽取到的样本具有随机性，在一次偶然的抽样中，根据样本均值计算所的区间并不总是可以包含总体均值，它是与一定的概率相联系的。如下图所示：
抽样误差
x= x
（实际未知）
STAT 要进行区间估计，关键是将抽样误差区间可表示为：
x x 此时，可以利用样本均值的抽样分布对抽样误差的大小进行描述。
上例中，已知，样本容量n=100,总体标准差 20 ，根据中心极限定理可知，此时样本均值服从均值为，标准差为
x , x
本章难点
1、一般正态分布标准正态分布； 2、t分布； 3、区间估计的原理； 4、分层抽样、整群抽样中总方差的分解。
8.1总体均值的区间估计（大样本n>30）
点估计的缺点：不能反映估计的误差和精确程度
STAT
区间估计：利用样本统计量和抽样分布估计总体参数的可能区间【例1】CJW公司是一家专营体育设备和附件的公司，为了监控公司的服务质量， CJW公司每月都要随即的抽取一个顾客样本进行调查以了解顾客的满意分数。根据以往的调查，满意分数的标准差稳定在20分左右。最近一次对100名顾客的抽样显示，满意分数的样本均值为82分，试建立总体满意分数的区间。 8.1.1抽样误差抽样误差：一个无偏估计与其对应的总体参数之差的绝对值。

概率论与数理统计第6章参数区间估计2,3节

n
E(X
k
)

E(X
k)
i1
i1
二、有效性
未知参数的无偏估计量不是唯一的.
设 ^1 和 ^2 都是参数的无偏估计量,
θˆ 1
θˆ 2
集中
分散
蓝色是采用估^ 计量 1 , 用 14 个样本值得到的 14 个估计值. 紫色是采用估^ 计量 2 , 用 14 个样本值得到的 14 个估计值.
若limD(ˆ)0，则ˆ是的一致估 . 计量 n
回顾例子.设总体X的概率密度为
f(x)6x3 (x),0x;
0, 其他
X1, X2,…, Xn 是取自总体X 的简单随机样本, (1) 求的矩估计量 ˆ；
(2) 求ˆ的方差D(ˆ).
解：矩估计 ˆ量 2X. D(ˆ)4D(X)4D(X)2
若滚珠直径服从正态分布X ~ N( , 2), 并且已知 = 0.16(mm),求滚珠直径均值的置信水平为95%
的置信区间.
解：由上面求解的置信水平为1- 的置信区间
Xσn 0 uα/,2 Xσn 0 uα/2
已 n 知 1,0 0 0 .1,6 0 .0,5 x110i110xi 14.92,
若进行n次独立重复抽样，得到n个样本观测值,
每个样本观测个值随确机(定 ˆ1区 ,ˆ2一 )间 .那么
每个区间的可真能，或值包不含包的含真 , 值
根据伯努利大数定理, 在这n个随机区间中,
包含真值1 的 0(1 0 约 )% 占 ,不包含 10 的 % 0. 约
便得 k的到最大似 ˆk(X 1,然 X 2, ,估 X n).计
第二节判别估计量好坏的标准

总体参数的区间估计

因为
ˆ (1 P ˆ) P SP ˆ n
0.1 (1 0.1) 0.0077 1500
上一张下一张主页Fra bibliotek退出
所以该地区老年人结核病患病率ρ 的95%、 99%置信区间为：
0.1 1.96 0.0077 0.1 1.96 0.0077
0.1 2.58 0.0077 0.1 2.58 0.0077
越高。
上一张下一张主页退出
常用的置信度为95%和99%，故由（5-13）
式可得总体平均数μ 的95%和99%的置信区间如
下：
（ x t 0.05 S x x t 0.05 S5-14 x ）（ 5-15 ） x t 0.01S x x t 0.01 S x
P( x t a S x x t a S x ) 1 a
称为置信半径； ta S x
（5-13）式称为总体平均数μ 置信度为1-a的置
信区间。其中
x和 ta S x
分别称为置信下限和置信上限；置信上、下限 x ta S x
之差称为置信距，置信距越小，估计的精确度就
ˆ 其中， P 为样本百分数，为样本百分数标准 S ˆ P
误，的计算公式为： SP ˆ
SP ˆ ˆ (1 P ˆ P ) 5-18）（ n
上一张下一张主页退出
【例5.10】调查某地1500老年人，患结核病
的有150人，求该地区老年人结核病患病率的
95%、99%置信区间。
ˆ ，采用正态分布近似法求由于>1000， >1% P 置信区间。
上一张下一张主页退出

总体参数的区间估计公式

总体参数的区间估计公式在进行区间估计时，我们首先需要收集到一个样本，并根据样本对总体参数进行估计。

然后根据样本的统计量，结合分布的性质和抽样方法，建立置信区间。

设总体参数为θ，我们希望得到它的置信水平为1-α的置信区间。

置信水平表示我们对总体参数的估计的可信程度，一般常用的置信水平有90%、95%和99%等。

参数估计的方法有很多，具体的方法选择取决于总体参数的性质、样本的大小以及其他假设条件。

常见的参数估计方法有：1.总体均值的区间估计：假设总体呈正态分布，样本大小为n，则总体均值的区间估计公式为：[样本均值-Z值（α/2）*总体标准差/√(n),样本均值+Z值（α/2）*总体标准差/√(n)]其中Z值（α/2）为标准正态分布的分位数，可以从标准正态分布表中查得。

2.总体比例的区间估计：假设总体为二项分布，样本大小为n，成功的次数为x，则总体比例的区间估计公式为：[样本比例-Z值（α/2）*√(样本比例*(1-样本比例)/n),样本比例+Z值（α/2）*√(样本比例*(1-样本比例)/n)]其中Z值（α/2）为标准正态分布的分位数，可以从标准正态分布表中查得。

3.总体方差的区间估计：假设总体呈正态分布，样本大小为n，则总体方差的区间估计公式为：[(n-1)*样本方差/卡方分布（α/2）,(n-1)*样本方差/卡方分布（1-α/2])]其中卡方分布是用于描述自由度为n-1的卡方随机变量的概率分布，可以从卡方分布表中查得。

以上是常见的总体参数区间估计公式，这些公式是根据统计学理论推导而来的，适用于不同情况下的参数估计。

在实际应用中，我们根据具体问题和假设条件选择适当的参数估计方法，计算置信水平的区间估计，从而对总体参数进行估计和推断。

第六章参数值的估计

第六章参数值的估计第一节参数估计的一般问题一、估计量与估计值参数估计就是用样本统计量去估计总体参数，如用X 估计μ，用S2估计2σ，用p 估计π等。

总体参数可以笼统地用一个符号θ表示。

参数估计中，用来估计总体参数的统计量的名称，称为估计量，用θ表示，如样本均值、样本比例等就是估计量。

用来估计总体参数时计算出来的估计量的具体数值，叫做估计值。

二、点估计与区间估计——参数估计的两种方法 1、点估计用样本估计量θ的值直接作为总体参数θ的估计量值。

2、区间估计它是在点估计基础上，给出总体参数估计的一个区间，由此可以衡量点估计值可靠性的度量。

这个区间通常是由样本统计量加减抽样误差而得到。

以样本均值的区间估计来说明区间估计原理：根据样本均值的抽样分布可知，重复抽样或无限总体抽样情况下，样本均值，由此可知，样本均值落在总体均值两侧各为一个标准误差范围内的概率为0.6827，两个标准误差范围0.9545，三个标准误差范围0.9973，并可计算出样本均值落在μ的两侧任何一个标准误差范围内的概率（根据已知的μ，σ计算）。

但实际估计时，μ是未知的，因而不再是估计样本均值落在某一范围内的概率，而只能根据已设定的概率计算这个范围的大小。

例如：约有95%的样本均值会落在距μ的两个标准误差范围内，即约有95%的样本均值所构造的两个标准误差的区间会包括μ。

在区间估计中，由样本统计量所构造的总体参数的估计区间，称为置信区间，区间的最小值为置信下限，最大值为置信上限。

例如，抽取了1000个样本，根据每个样本构造一个置信区间，其中有95％的区间包含了真实的总体参数，而5%的没有包括，则称95％为置信水平／置信系数。

构造置信区间时，可以用所希望的值作为置信水平，常用的置信水平是90％，95％，99％，见下表：α称为显著性水平，表示用置信区间估计的不可靠的概率，1-为置信水平。

如何解释置信区间：如用95%的置信水平得到某班学生考试成绩的置信区间为（60，80），即在多次抽样中有95%的样本得到的区间包含了总体真实平均成绩，（60，80）这个区间有95%的可能性属于这些包括真实平均成绩的区间内的一个。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

3、总体均值在1-置信水平下的置信区
间为
（三）总体均值的区间估计
1、大样本、未知 2、使用正态分布统计量Ｚ
Z X ~ N (0,1) n
3、总体均值在1-置信水平下的置信区
间为
【例】某市交通部门为了对城市的环境进行监测，定期公布该市居民每天小汽车的里程数，抽取了36个居民作为一个简单随机样本，得到资料如下。试构造该市居民每天小汽车里程数的总体均值的95%的置信区间。
p 为 P的无偏、有效、一致估计量。
第二节单个总体均值和比率的区间估计
一、总体均值的区间估计：大样本（n≥30）的情形
总体标准差已知总体标准差未知
二、总体均值的区间估计：小样本（n＜30）的情形三、总体比率的区间估计
区间估计
1. 在点估计的基础上，给出总体参数估计的一个区间范围，该区间由样本统计量加减抽样误差而得到的
第一节参数估计的基本问题第二节单个总体均值和比率的区间估计第三节样本容量的确定第四节两个总体均值和比率差异的区间估计第五节分层抽样、整群抽样和等距抽样的区
间估计
案例导入
STAT
一家食品生产企业以生产袋装食品为主，每天的产量约为 8000袋左右。按规定每袋的重量应不低于100克，否则即为不合格。为对产量质量进行检测，企业设有质量检查科专门负责质量检验，并经常向企业高层领导提交质检报告。质检的内容之一就是每袋重量是否符合要求。
x
一般称，1 为置信度，可靠程度等，反映估计结果
的可信程度。若事先给定一个置信度，则可根据标准
正态分布找到其对应的临界值 Z 。进而计算抽样误
2
差
x

x
Z 2
x
（三）总体均值的区间估计
1、大样本、已知 2、使用正态分布统计量Ｚ
Z X ~ N (0,1) n
或推断。
通常，把用来估计总体特征的样本指标叫估计量或统计量，待估计的总体指标叫总体参数。
1、它在逻辑上运用归纳推理而不是演绎推理。
特 2、在方法上运用不确定的概率估计方法，而不点是运用确定的数学分析方法。
3、抽样估计存在抽样误差。
点估计
从总体中抽取一个随机样本，计算与总体参数相应的样本统计量，然后把该统计量视为总体参数的估计值，称为参数的点估计。
总体均值的区间估计
1、总体服从正态分布、小样本、未知
2、使用t分布统计量
t x ~ t(n 1)
sn
3、总体均值在1-置信水平下的置信区
间为
x t 2
s n
【例】谢尔工业公司拟采用一项计算机辅助程序来培训公司的维修职员掌握及其维修的操作，以减少培训工人所需要的时间。为了评价这种培训方法，生产经理需要对这种程序所需要的平均时间进行估计。以下是利用新方对１５名职员进行培训的培训天数资料。
量更有效。
P(ˆ)
ˆ1 的抽样分布
B
A
ˆ2 的抽样分布

ˆ
一致性
• 一致性：随着样本容量的增大，估计量的值越来越接近被估计的总体参数。
P(ˆ) 较大的样本容量
B
较小的样本容量
A

ˆ
抽样估计量的优良标准
数理统计证明：
x 为 X的无偏、有效、一致估计量；

S
为
n 1
的无偏、有效、一致估计量；
（2）误差边际 x x 32 50 40 36 39.5
n
36
x
Z 2

n
总体标准差（未知）
样本标准差 s
样本标准差
s

(
x

2
x)
7.77
误差边际
n 1

x

Z 2

Z
n
2
s 1.645 * 7.77 2.13
优点简单，具体明确
缺点
无法控制误差，仅适用于对推断的准确程度与可靠程度要求不高的情况

x的抽样分布

点估计的最大好处：给出确定的值点估计的最大问题：无法控制误差
估计值的优良标准
问题：
x
不是那第一一，个我统m们计e为量什来么估以计这某一个个总而体
参数？
mo
估计第值二的，优如良果标有两准个：以上的统计无量估偏可计以结性用果、来是有估否效计一性某致个？、总是一体否致参一性数个，统其计
3.78 15
95%的置信区间为
53.87 ±3.78 即（50.09，57.65）天。
三、总体比率的区间估计
1、样本比例近似服从正态分布
n 30, np 5, n(1 p) 5
2、使用正态分布统计量 z z p ~ N (0,1)
p(1 p)
n
3、总体比例在1-置信水平下的置信区间为
分析：区间点估计误差边际
解： n 90（ 2 大样本）， 1 95%，Z 1.96 2
（1）样本比例 p m 397 0.44 n 902
（2）误差边际
p(1 p)
0.44 0.56
P

Z 2

1.96 n
0.0324 902
（3）95%的置信区间0.44 ±0.0324 即（0.4076，0.4724）。
职员１２３４５
时间５２４４５５４４４５
职员６７８９１０
时间５９５０５４６２４６
职员１１１２１３１４１５
时间５４５８６０６２６３
根据上述资料建立置信度为９５％的总体均值的区间估计。（假定培训时间总体服从正态分布）。
解：依题意，总体服从正态分布，ｎ＝１５（小样本），此时
一致性估计量将在概率意义下越来越接近
于总体真实值
若越大越小，则称为的一致估计量

limP( ) 1 n
无偏性
• 无偏性：估计量抽样分布的数学期望等于被估计的总体参数。
P(ˆ)
无偏
A
有偏
B
ˆ

有效性
• 有效性：与离散度相联系。对同一总体参数的两个无偏点估计量，有更小标准差的估计
居民
1 2 3 4 5 6 7 8 9
汽车里程数
32 50 40 24 33 44 45 48
汽车里程数
47 31 36 39 46 45 39 38 45
居民
19 20 21 22 23 24 25 26 27
汽车里程数
27 43 54 36 34 48 23 36 42
第6章总体参数估计 STAT
本章重点 1、单个总体均值的区间估计； 2、样本容量的确定； 3、两个总体均值之差的区间估计。
本章难点 1、小样本情形下总体参数的区间估计； 2、其他组织形式总体参数的区间估计及样本容量的确定。
第一节参数估计的基本问题
也叫抽样估计，就是根据样本指
参数估计标数值对总体指标数值作出估计
解：依题意，1 95%,Z 1.96, 2000, 200 2
可得
n
(z )2 2
2
E2
1.962 20002 2002
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
一、总体均值的区间估计
STAT
大样本（n≥30）的情形
【例】Duotu公司是一家专营体育设备和附件的公司，为了监控公司的服务质量，Duotu公司每月都要随即的抽取一个顾客样本进行调查以了解顾客的满意分数。根据以往的调查，满意分数的标准差稳定在20 分左右。最近一次对100名顾客的抽样显示，满意分数的样本均值为80分，试建立总体满意分数的区间。
居民
28 29 30 31 32 33 34 35 36
汽车里程数
34 39 34 35 42 53 28 49 39
分析：区间估计包括两个部分——点估计和误差边际，只需分别求出即可到的总体的区间估计。
解：已知
（1）样本的汽车里程数
n 3（6 大样本）， 1 90%，Z 1.645 2
由于产品的数量大，进行全面的检验是不可能的，可行的办法是抽样，然后用样本数据估计平均每袋的重量。质检科从某天生产的一批食品中随机抽取了25袋，下表是对每袋食品重量的检验结果。（假定该种袋装食品重量服从正态分布。）
案例导入
STAT
25袋食品的重量（克）
112.5 102.6 100.0 116.6 136.8
n
36
（3）90%的置信区间为39.5 ±2.13 即（37.37，41.63）里。
注意
（1）置信系数一般在抽样之前确定，根据样本所建立的区间能包含总体参数的概率为
（2）置信区间的长度（准确度）在置信度一定的情况下，与样本容量的大小呈反方向变动，若要提高估计准确度，可以扩大样本容量来达到。
二、总体均值的区间估计
101.0 107.5 123.5 95.4 102.8
103.0 95.0 102.0 97.8 101.5
102.0 108.8 101.6 108.4 98.4
100.5 115.6 102.2 105.0 93.3
根据表中数据，质检科估计出该天生产的食品每袋的平均
重量在101.57～109.14克之间，其中，估计的可信程度为95%，
量要优于另一个？
抽样估计量的优良标准
设为待估计的总体参数，为样本统计量，则的优良标准为：
无偏性指样本指标的均值应等于被估计的总体指标

总体参数区间估计(6)讲解

7.8 两个正态总体参数的区间估计

总体参数的区间估计

概率论与数理统计实训06讲解

统计学区间估计详细讲解

概率论与数理统计第6章参数区间估计2,3节

总体参数的区间估计

总体参数的区间估计公式

第六章 参数值的估计

第六章参数值的估计