总体均值的区间估计

合集下载

区间估计

区间估计

常见形式
间估计的区间上、下界通常形式为:“点估计±误差” “总体均值”的区间估计
总体均值:μ 总体方差:σ 样本均值:x =(1/n)×Σ(Xi) 样本方差:s =(1/(n-1))×Σ(Xi-x)^2 符号假设置信水平:1-α 显著水平:α
已知n个样本数据Xi (i=1,2,...,n),如何估计总体的均值? 首先,引入记号: 区间估计σ'=σ/sqrt(n) s'=s/sqrt(n) 然后,分情况讨论: 情况1 小样本(n<30),σ已知,此时区间位于 x ± z(α/2)×σ' 情况2 小样本(n<30),σ未知,此时区间位于 x ± t(α/2)×s' 区间估计情况3 大样本(n≥30),σ已知,此时区间位于 x ± z(α/2)×σ' 情况4 大样本(n≥30),σ未知,此时区间位于 x ± z(α/2)×s' 其中, z(α/2)表示:正态分布的水平α的分位数 t(α/2)表示:T分布的水平α的分位数
置信区间
区间估计有时,对所考虑的置信区间(或上、下限)加上某种一般性限制,在这个前提下寻找最优者。无偏 性是经常用的限制之一,如果一个置信区间(上、下限)包含真值θ的概率,总不小于包含任何假值θ┡的概率, 则称该置信区间(上、下限)是无偏的。同变性(见统计决策理论)也是一个常用的限制。
求置信区间的方法 最常用的求置信区间及置信上、下限的方法有以下几种。

费希尔把这个等式解释为:在抽样以前,对于θ落在区间内的可能性本来一无所知,通过抽样,获得了上述 数值,它表达了统计工作者对这个区间的"信任程度",若取b)=-α=uα/2,则得到区间,其信任程度为 1-α。即 当用上述区间作为θ的区间估计时,对于“它能包含被估计的θ”这一点可给予信任的程度为1-α。

两个总体均值之差的区间估计公式

两个总体均值之差的区间估计公式

两个总体均值之差的区间估计公式引言在统计学中,我们经常需要估计两个总体均值之间的差异。

这有助于我们理解两个总体的差异程度,并在实际应用中做出相应的决策。

本文将介绍两个总体均值之差的区间估计公式,帮助读者理解如何进行参数估计。

一、独立样本均值差的区间估计当我们有两个独立的样本,且每个样本的观测值满足正态分布时,我们可以使用独立样本均值差的区间估计公式。

假设我们有两个样本的均值分别为$\b ar{X}_1$和$\ba r{X}_2$,样本大小分别为$n_1$和$n_2$,样本标准差分别为$s_1$和$s_2$。

那么两个总体均值之差的区间估计公式为:$$\l ef t(\b ar{X}_1-\b ar{X}_2\ri gh t)\p mt_{\a lp ha/2}\s q rt{\fr ac{s_1^2}{n_1}+\fr a c{s_2^2}{n_2}}$$其中,$t_{\al ph a/2}$是自由度为$n_1+n_2-2$的$t$分布上的临界值,$\al ph a/2$为显著性水平的一半。

二、配对样本均值差的区间估计当我们有一对配对的样本,例如同一组人在不同时间的观测,或同一组物体在不同条件下的观测时,我们可以使用配对样本均值差的区间估计公式。

假设我们有一对配对样本的均值差为$\b ar{D}$,样本大小为$n$,样本标准差为$s_D$。

那么配对样本均值差的区间估计公式为:$$\b ar{D}\pm t_{\a l ph a/2}\f ra c{s_D}{\sq rt{n}}$$其中,$t_{\al p h a/2}$是自由度为$n-1$的$t$分布上的临界值,$\al ph a/2$为显著性水平的一半。

三、示例应用为了更好地理解两个总体均值之差的区间估计公式,我们通过一个示例来说明其应用。

假设我们想要比较两个不同药物在降低血压上的效果。

我们随机选择了两组患者,并对每一组患者分别施用不同的药物。

第十九讲 正态总体均值及方差的区间估计

第十九讲 正态总体均值及方差的区间估计

第十九讲 正态总体均值及方差的区间估计1. 单个正态总体方差的区间估计设总体),(~2σμN X , ),,(21n X X X 为来自X 的一个样本,已给定置信度(水平)为α-1,求2σ的置信区间。

①当μ已知时,由于),(~2σμN X i ,因此,)1,0(~N X i σμ-(,2,1=i n , )。

由2χ分布的定义知:∑=-ni i n X 1222)(~)(χσμ,据)(2n χ分布上α分位点的定义,有:αχσμχαα-=<-<∑=-1)}()()({21222122n X n P ni i从而αχμσχμαα-=⎪⎪⎭⎪⎪⎬⎫-<<⎪⎪⎩⎪⎪⎨⎧--=-∑∑1)()()()(2112221222n X n X P ni i ni i 故2σ的置信度为α-1的置信区间为:⎪⎪⎪⎪⎭⎫ ⎝⎛---==∑∑)()(,)()(211221222n X n X ni i n i i ααχμχμ ②当μ未知时,据抽样分布有:)1(~)1(222--n S n χσ类似以上过程,得到第七章 参数估计第5节 正态总体均值及方差的区间估计单个正态总体均值的区间估计 ①当2σ已知时,μ的置信水平为α-1的置信区间为:⎪⎪⎭⎫ ⎝⎛±2ασz n X (5.1) ②当2σ未知时,μ的置信水平为α-1的置信区间为⎪⎪⎭⎫ ⎝⎛-±)1(2n t n S X α.(5.4)注意:当分布不对称时,如2χ分布和F 分布,习惯上仍然取其对称的分位点,来确定置信区间,但所得区间不是最短的。

αχσχαα-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧--<<---1)1()1()1()1(21222222n S n n S n P 2σ的置信度为α-1的置信区间为:⎪⎪⎭⎫⎝⎛-----)1()1(,)1()1(2122222n S n n S n ααχχ σ的置信度为α-1的置信区间为:⎪⎪⎪⎭⎫ ⎝⎛-----)1()1(,)1()1(2122222n S n n S n ααχχ 例2 有一大批袋装糖果, 现从中随机地取出16袋, 称得重量(以克计)如下:506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496 设袋装糖果的重量近似地服从正态分布, 求总体标准差σ的置信水平为0.95的置信区间.解:总体均值μ未知,σ的置信度为α-1的置信区间为:⎪⎪⎪⎭⎫ ⎝⎛-----)1()1(,)1()1(2122222n S n n S n ααχχ 此时,,975.021,025.02,05.0=-==ααα16=n ,查表得,488.27)15(025.0=χ,262.6)15(975.0=χ由给出的数据算得.4667.382=s 因此,σ的一个置信度为0.95的置信区间为(4.58,9.60).2. 两个正态总体均值差的区间估计设总体),(~),,(~222211σμσμN Y N X ,且X 与Y 相互独立,),,(21m X X X 来自X 的一个样本,),,,(21n Y Y Y 为来自Y 的一个样本,且设2221,,,S S Y X 分别为总体X 与Y 的样本均值与样本方差,对给定置信水平α-1,求21μμ-的一个置信区间。

正态总体均值的区间估计

正态总体均值的区间估计
标准差为σ,那么X的取值范围可以通过 μ±Zα/2σ来估计,其中Zα/2是标准正态分布
的下α/2分位数。
实例二
总结词
在未知总体标准差的情况下,可以使用样本标准差来估 计总体均值的区间。
详细描述
当总体标准差未知时,我们可以使用样本标准差来代替总 体标准差进行区间估计。具体来说,对于一个样本容量为n 的随机样本,其样本均值和样本标准差分别为和s。根据中 心极限定理,当样本容量n足够大时,样本均值近似服从正 态分布,其均值和标准差分别为μ和s/√n。因此,可以使 用μ±Zα/2s/√n来估计总体均值的置信区间。
实例三:小样本下的总体均值区间估计
总结词
在小样本情况下,可以使用t分布的性质来估计总体均 值的区间。
详细描述
当样本容量n较小时,样本均值的标准误差较大,使用 正态分布进行区间估计可能不准确。此时可以使用t分布 进行区间估计。具体来说,对于一个自由度为n-1的t分 布,其上侧分位数记为tα/2(n-1),那么可以使用 μ±tα/2(n-1)s/√n来估计总体均值的置信区间。与正态 分布相比,t分布的尾部更厚,因此在小样本情况下更为 稳健。
THANKS
感谢观看
理论依据
许多统计方法和模型都以正态分布为基础。
实际应用
在自然科学、社会科学和工程领域中,许多 现象都可以用正态分布来描述和分析。
03
总体均值的区间估计方法
样本均值和样本标准差
样本均值
表示样本数据的平均水平,计算公式 为 $bar{x} = frac{1}{n} sum_{i=1}^{n} x_i$,其中 $n$ 是样 本数量,$x_i$ 是每个样本值。
区间估计的应用
区间估计在统计学、经济学、社会学等领域有着广泛的应用。例如,在市场调查中,通过 抽样调查得到样本数据,然后利用区间估计方法估计总体市场占有率或平均价格等指标。

总体参数的区间估计

总体参数的区间估计

三、总体参数的区间估计
图5-10 “探索”对话框
图5-11 “探索:统计量”对话框
三、总体参数的区间估计
单击“统计量”按钮,弹出“探索:统计量”对话框,如图5-11所示。 该对话框中有如下四个复选框: (1)描述性:输出均值、中位数、众数、标准误、方差、标准差、极小值 、极大值、全距、四分位距、峰度系数和偏度系数的标准误差等。此处能够设 置置信区间,默认为90%(α=0.1),可根据需要进行调整。 (2)M 最大似然确定数。 (3)界外值:输出五个最大值和五个最小值。 (4)百分位数:输出第5%、10%、25%、50%、75%、90%、95%位数 。
三、总体参数的区间估计
【例5-17】 某餐馆随机抽查了50位顾客的消费额(单位:元)为 18 27 38 26 30 45 22 31 27 26 35 46 20 35 24 26 34 48 19 28 46 19 32 36 44 24 32 45 36 21 47 26 28 31 42 45 36 24 28 27 32 36 47 53 22 24 32 46 26 27 在90%的概率保证下,采用点估计和区间估计的方法推断餐馆顾客的平均消 费额。 解:执行“分析”→“描述统计”→“探索”命令,打开“探索”对话框。由于本例只 有消费额一个变量,且需要对消费额进行探索性分析,故选中左侧列表框中的“消 费额”选项,将其移入“因变量列表”框中,如图5-10所示。
解:已知n=31,α=0.01,=10.2;σ=2.4,z0.005=2.58,由于总 体方差已知,为大样本,可以利用式(5-23)来进行计算。
即(9.088,11.312 该学生每天的伙食费在显著性水平为99%时的置信区间为( 9.088,11.312)。

区间估计法估测总体平均值

区间估计法估测总体平均值

区间估计法估测总体平均值
区间估计是一种统计方法,可以用来估计总体参数的值,其中之一是总体平均值。

区间估计法估测总体平均值的过程如下:
首先,我们需要收集一个来自总体的简单随机样本,并计算样本平均值$\bar{x}$ 和样本标准差$s$。

然后,我们可以使用以下公式来计算总体平均值$\mu$ 的区间估计:
$$ \bar{x} \pm t_{\alpha/2} \frac{s}{\sqrt{n}} $$
其中,$n$ 是样本容量,$t_{\alpha/2}$ 是自由度为$n-1$ 的$t$ 分布表中$\alpha/2$ 处的t 值。

$\alpha$ 是置信水平,通常取0.95 或0.99。

上述公式表示,我们可以通过样本平均值$\bar{x}$ 加减一个误差范围来估计总体平均值$\mu$。

误差范围的计算方法是:$t_{\alpha/2} \frac{s}{\sqrt{n}}$。

其中,$t_{\alpha/2}$ 表示在给定置信水平下,自由度为$n-1$ 的$t$ 分布表中的t 值,$s$ 是样本标准差,$\sqrt{n}$ 是样本容量的平方根。

最后,我们可以得到置信水平为$\alpha$ 的总体平均值的区间估计为:
$$ (\bar{x} - t_{\alpha/2} \frac{s}{\sqrt{n}},\ \bar{x} + t_{\alpha/2}
\frac{s}{\sqrt{n}}) $$
这个区间包含了总体平均值$\mu$ 的真实值的可能性为$1-\alpha$,其中$\alpha$ 是在计算过程中预先指定的置信水平。

7.5正态总体均值与方差的区间估计

7.5正态总体均值与方差的区间估计

1)
1,

P
X
S n t / 2 (n 1)
X
S n
t
/
2
(n
1)
1
,
于是得 的置信度为 1 的置信区间
X
S n
t
/
2
(n
1)
.
例1 有一大批糖果, 现从中随机地取16袋, 称得
重量(克)如下:
506 508 499 503 504 510 497 512
514 505 493 496 506 502 509 496
2
2
/
2
(n
1)
1,

(n 1)S 2
P
2
/
2
(
n
1)
2
(n 1)S 2
2 1
/
2
(n
1)
1 ,
于是得方差 2 的置信度为1 的置信区间
(n
2 /
1)S 2(n
2
1)
,
(n
2 1
/2
1)S 2 (n 1)
.
进一步可得:
标准差 的一个置信度为1 的置信区间
n 1S ,
只要n1和n2都很大(实用上 50即可), 则有
1 2的一个置信度为1 的近似置信区间
X
Y
z / 2
S12 n1
S22 n2
.
(3)
2 1
22
2,
但 2 为未知,
1 2的一个置信度为1 的置信区间
X Y t / 2(n1 n2 2)Sw
1 n1
1 n2
.
其中
Sw2
2. 两个总体方差比 12 的置信区间 22

总体均值的区间估计公式

总体均值的区间估计公式

2.总体均值的区间估计
总体均值的区间估计公式: S X ± Z (1-α) √n 其中X为样本平均数,S为样本标准差, Z(1-α) 为置 信度是1-α所对应的 Z 值. n为样本规模.
计算练习:
调查某单位的工资情况,随机抽取900名工人作 为样本,调查得到他们的月平均工资为186元,标准 差为42元,求95%得置信度下,全单位职工的月平均 工资的置信区间是多少.
42 1.96× √900
Z 检验表
P≤ 0.10 0.05 0.02 0.01 │Z│≥ 一端 1.29 1.65 2.06 2.33 二端 1.65 1.96 2.33 2.58
3.总体百分数的区间估计
总体百分数的区间估计公式为: P(1—p) P±Z(1-α)
n
这里,P为样本的百分比 。 例题: 从某工厂随机抽取400名工人进行调查,结 果表明女工的比例为 20%现在要求在90%的置 信度下,估计全厂工人中女工比例的置信区间。
1.假设检验的依据

假设检验所依据的是概率论中的“小概率
原 理”即“小概率事件在一次观察中不可能出现的 原 理”,但是如果现实的情况恰恰是在一次观察中小 概率事件出现了,应该如何判断呢? 一种意见认为该事件的概率仍然很小 ,只不 过偶然被遇上了, 另一种则是怀疑和否定该事件的概率未必很 小,即认为该事件本身就不是一种小概率事件,而
3.假设检验的步骤:
①建立虚无假设和研究假设通常将原假 设作为虚无假设. ②根据需要选择适当的显著性水α(即 小概率的大小).通常α=0.05或α=0.01等. ③根据样本数据计算出统计值,并根据显 著性水平查出对应的临界值. ④将临界值与统计值进行比较,以判定是 接受虚无假设还是接受研究假设.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
为 p(xi , ) .又设 x1, x2, , xn 为一组样本值,
令 i1
n
L( ) L(x1, x2 ,, xn , ) p(xi , ), i 1
称 L(θ)为样本的似然函数.
(1)
若有ˆ ˆ(x1, x2 ,, xn ) ,使得对一切 ,有 L(ˆ) L( )
解 令 即
整理得
1 2

E(X ) a b , 2
E( X 2 ) D( X ) E( X )2

(b a)2 12

(a b)2 4

1 A1, 2 A2 ,
a

b 2

A1

1 n
n i 1
Xi

X,


(b

a)
2
12
(Xi

X
)2.
注 此例说明,无论总体 X 服从什么分
布,样本均值 X 都是总体均值 的矩估计量, 样本二阶中心矩就是总体方差 2 的矩估计
量.
例5 某厂生产一批铆钉,现要检验铆钉头部直径,从这批产品中随机抽 取12只,测得头部直径(单位:mm)如下:
13.30 13.38 13.40 13.43 13.32 13.48 13.54 13.31 13.34 13.47 13.44 13.50

1 (1, 2 ,, k )


1 n
n i 1
Xi,


2
(
1
,
2
,,
k
)

1 n
n i 1
X
2 i
,

k (1, 2 ,, k )


1 n
n i 1
X
k i

从上述方程组中解出1, 2 ,, k ,分别记作
ˆ1 ˆ1 ( X1, X 2 ,, X n ), ˆ2 ˆ2 ( X1, X 2 ,, X n ),

ˆk ˆk ( X1, X 2 ,, X n ).
以此作为未知参数 1, 2 ,, k 的估计量,称为矩估计量.
如果样本观察值为( x1, x2, …,xn ),则
得未知参数 1, 2 ,, k 的矩估计值为
ˆ1 ˆ1 (x1, x2 ,, xn ), ˆ2 ˆ2 (x1, x2 ,, xn ),
令 1 A1 ,即


1 n
n i 1
Xi

X,
得 的矩估计量为 ˆ X .
例2 设总体 X 服从参数为 的指数分布,其
概率密度为
ex , x 0,
f (x) 0 , x 0,
其中 0 为未知,又设 X1, X 2 ,, X n 为 X 的 样本,求 的矩估计量.
(Xi

X )2
,
3
n
n i 1
(Xi

X)2 .
例4 设总体 X 的均值为 ,方差为 2, 且 0,但 与 均未知,又设总体 X 的一 个样本为(X1, X2 , , Xn),求 与 2的矩估
计量.
解 1 E( X ) ,
2 E( X 2 ) D( X ) E( X )2 2 2

ˆk ˆk (x1, x2 ,, xn ).
上述估计未知参数的方法就叫做矩估计法.
例1 设总体 X 服从参数为 的泊松分布,其中 >0 为未知,又设X1, X2, …,Xn为 X 的样本,求 的矩估计量.
解 X ~ (), E(X ) , 即1 E(X ) ,

12

A1, A 2,




A1
2

2
1 n

n i 1
A2
X
i
1 n
X,
n
X
i 1
2 i
.
解此方程组得到 与 2 的矩估计量为
ˆ A1 X ,
ˆ 2

A2
A12
1 n
n i1
X
2 i

X
2

1 n
n i1

(13.38 13.41)2

( 13.50
13.41)2
0.0059 .
三、极大似然估计法
1.设总体X为离散型随机变量,其分布律为
PX xk p(xk , ), k 设 X1, X2, ,
Xn为n来自 X 的样本,则 X1, X2,,Xn 的联合分布律

(a b)2 4

A2

1 n
n i 1
X
2 i
,
a b 2A1,
b a
12( A2 A12 ) .
于是得到 a、b 的矩估计量为 aˆ A1 3( A2 A12 ) X
bˆ A1 3( A2 A12 ) X
3
n
n i 1
设铆钉头部直径这一总体 X 服从正态分布 N ( , 2 ) ,试求 与 2 的矩估计
值.
解 由例4可得
ˆ x 1 ( 13.30 13.38 13.50 ) 13.41, 12
ˆ
2

1 12
12 i1
( xi

x
)2

1 [(13.3113.41)2 12
成立,则称 ˆ ˆ(x1, x2,, xn ) 为θ的极大( 或最大 )似然估计值,相应的统
计量 ˆ ˆ(X1, X2,, Xn称) 为θ的极大( 或最大 )似然估计量.
我们规定,使得 dL( ) 0的 ˆ就是θ的
d
极大似然估计值.由于ln x是单增函数,所以
与 L( ) 有ln 相L(同 )的驻点,因此只需从

由于1

E(X )
1

,

,1 A1

1 1 n
n i1 X i X ,
因此得到 的矩估计量为 ˆ 1 .
X
例3 设总体 X 在区间 [a, b] 上服从均匀分
布,a 与 b 为未知,X1 ,X2 ,,Xn是来自总体
X 的样本,求 a 与 b 的矩估计量.
d ln L( ) 0 d
(2)
中解出 ˆ 就是θ的极大似然估计值,称方程 (2)为极大似然方程.
例6 设总体 X ~ ( ),X1, X2 , … , Xn 为总体
X 的样本,求 的极大似然估计量.
解 设样本值为x1, x2 , …, xn. 由于 X 的分布律为
相关文档
最新文档