第四讲总体均数的参数估计
合集下载
第四讲参数估计PPT课件

0.50
均数 的均 数
4.99
5.00
均数标准差
0.2212 0.1580
5.00 0.0920
n
0.2236 0.1581 0.0913
由表1可见,从同一总体中随机抽取样本含 量n=10的若干样本,各样本算得的样本均 数并不等于相应的总体均数,且各样本均 数也不完全相同。这种由于随机抽样而造 成的来自同一总体的样本均数之间及样本 均数与相应的总体均数之间的差异,称之 为均数的抽样误差。
总体均数可信区间的计算
Hale Waihona Puke 总体均数可信区间的计算 需考虑: (1)总体标准差 是否已知, (2)样本含量n的大小 通常有两类方法: (1)t分布法
(2)u分布法
1. 单一总体均数的可信区间 (1) 未 知 : 按 t 分 布 。
双 侧 1 可 信 区 间 则 为 :
X t 2 , S X < X t 2 , S X ( X t S 2 , X , X t 2 , S X )
由于样本均数与相应的总体均数之间存在着 差异,由数理统计推理可知:从正态总体中 随机抽取样本含量为n的样本,每抽取一个 样本可计算一个样本均数,重复100次抽样可 得到100个样本均数。
这些样本均数服从均数为
,方差为
2 x
的正态分布.其中 x 为样本均数的总
体标准差,计算公式为: / n X
2. 两总体均数之差的可信区间: 从相 等,但 不等的两个正态总体 N(1, 2)和 N(2, 2)进行随机抽样。则两总体均数之差
( 1 2 )的双侧1 可信区间为
(X 1X2)t/2,SX1X2
( n 1 1 ) ( n 2 1 ) n 1 n 2 2
S X1X 2
均数 的均 数
4.99
5.00
均数标准差
0.2212 0.1580
5.00 0.0920
n
0.2236 0.1581 0.0913
由表1可见,从同一总体中随机抽取样本含 量n=10的若干样本,各样本算得的样本均 数并不等于相应的总体均数,且各样本均 数也不完全相同。这种由于随机抽样而造 成的来自同一总体的样本均数之间及样本 均数与相应的总体均数之间的差异,称之 为均数的抽样误差。
总体均数可信区间的计算
Hale Waihona Puke 总体均数可信区间的计算 需考虑: (1)总体标准差 是否已知, (2)样本含量n的大小 通常有两类方法: (1)t分布法
(2)u分布法
1. 单一总体均数的可信区间 (1) 未 知 : 按 t 分 布 。
双 侧 1 可 信 区 间 则 为 :
X t 2 , S X < X t 2 , S X ( X t S 2 , X , X t 2 , S X )
由于样本均数与相应的总体均数之间存在着 差异,由数理统计推理可知:从正态总体中 随机抽取样本含量为n的样本,每抽取一个 样本可计算一个样本均数,重复100次抽样可 得到100个样本均数。
这些样本均数服从均数为
,方差为
2 x
的正态分布.其中 x 为样本均数的总
体标准差,计算公式为: / n X
2. 两总体均数之差的可信区间: 从相 等,但 不等的两个正态总体 N(1, 2)和 N(2, 2)进行随机抽样。则两总体均数之差
( 1 2 )的双侧1 可信区间为
(X 1X2)t/2,SX1X2
( n 1 1 ) ( n 2 1 ) n 1 n 2 2
S X1X 2
总体均数的估计和t检验

它不受样本大小和样本变异性的影响,是衡量数据分布中心位
03
置的重要参数。
总体均数的点估计
点估计(Point Estimation):使用 样本统计量来估计总体参数的方法。
样本均数(Sample Mean):作为总 体均数的点估计量,它是从样本数据 中计算得出的平均值。
总体均数的区间估计
要点一
区间估计(Interval Estimation)
根据t统计量的显著性,得出配对观测值之 间是否存在显著差异的结论。
配对样本t检验的应用
01
比较同一受试者在不同时间点的生理指标或心理指 标是否存在显著差异。
02
比较同一受试者在不同条件下的行为表现是否存在 显著差异。
03
比较不同治疗方法的效果是否存在显著差异。
04
CHAPTER
两独立样本t检验
两独立样本t检验的概念
它适用于在实验设计时将观测值配对的情况,例如同一受试者在不同时间 点或不同条件下获得的观测值。
配对样本t检验的目的是检验两组配对观测值的均值是否存在显著差异。
配对样本t检验的步骤
1. 数据收集
收集两组配对观测值的数据,确保数据来源可靠、准确。
2. 数据整理
将数据整理成适合进行t检验的表格形式,包括配对观测值的编 号、观测值、差值等。
两独立样本t检验是用来比较 两个独立样本的总体均数是否
有显著差异的统计方法。
它适用于两个独立样本,且 每个样本的观察值相互独立,
不受其他因素的影响。
两独立样本t检验的前提假设 是:两个样本的总体均数相等, 且每个样本的观察值服从正态
分布。
两独立样本t检验的步骤
01
02
03
总体均数的估计ppt课件

11
1. 样本均数的均数μ 与个体观察值的均数μ相等 x μ =μ x
2. 样本均数间存在变异(抽样误差),其变异程度 较个体值的小
σ σ=
xn
3. 来自正态分布总体的样本均数满足正态分布
x~N μ ,σ 2 xx
12
13
样本均数的均数为m证明*
E
x
E
x n
样本号
样本含量(n=10)
1 161.1 173.7 173.7 167.3 162.2 162.2 166.6 166.6 157.4 157.4 164.82
2 166.8 159.1 159.1 166.1 173.3 173.3 169.1 169.1 165.2 165.2 166.63
3 157.4 174.0 172.3 175.8 166.6 182.1 163.1 159.4 159.4 177.3 168.74
xi
27
t分布的概率密度函数*
若随机变量t满足以下概率密度函数,则称
t满足自由度为v的t分布:
f (t)
(v -1)! 2
v ( v - 2
)!
1
t2 v
- v1 2
2
28
t分布曲线是单峰的,且关于t = 0对称,这一特 征与标准正态分布很相似
0.4
(标准正态分布)
为了与个体的标准差相互区别,样本均数的标准差又称 为样本均数的标准误,简称标准误或理论标准误
反映了样本均数间的离散程度,如果标准误很大,则不 同的样本均数间参差不齐,同时样本均数的分布范围较 大,也反映了样本均数与总体均数间的差异可能较大, 因而标准误反映均数抽样误差的大小
1. 样本均数的均数μ 与个体观察值的均数μ相等 x μ =μ x
2. 样本均数间存在变异(抽样误差),其变异程度 较个体值的小
σ σ=
xn
3. 来自正态分布总体的样本均数满足正态分布
x~N μ ,σ 2 xx
12
13
样本均数的均数为m证明*
E
x
E
x n
样本号
样本含量(n=10)
1 161.1 173.7 173.7 167.3 162.2 162.2 166.6 166.6 157.4 157.4 164.82
2 166.8 159.1 159.1 166.1 173.3 173.3 169.1 169.1 165.2 165.2 166.63
3 157.4 174.0 172.3 175.8 166.6 182.1 163.1 159.4 159.4 177.3 168.74
xi
27
t分布的概率密度函数*
若随机变量t满足以下概率密度函数,则称
t满足自由度为v的t分布:
f (t)
(v -1)! 2
v ( v - 2
)!
1
t2 v
- v1 2
2
28
t分布曲线是单峰的,且关于t = 0对称,这一特 征与标准正态分布很相似
0.4
(标准正态分布)
为了与个体的标准差相互区别,样本均数的标准差又称 为样本均数的标准误,简称标准误或理论标准误
反映了样本均数间的离散程度,如果标准误很大,则不 同的样本均数间参差不齐,同时样本均数的分布范围较 大,也反映了样本均数与总体均数间的差异可能较大, 因而标准误反映均数抽样误差的大小
医学统计学总体均数的估计和假设检验

3.106
3.055
3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845 2.750 2.704 2.678 2.626
2.58
3.497
3.428
3.372 3.326 3.286 3.252 3.222 3.197 3.174 3.153 3.030 2.971 2.937 2.871 2.8070
t x
sX
统计量是t的分布就是t分布。
t分布的特征: ① 以0为中心,左右对称呈单峰分布; ② t分布是一簇曲线,分布参数为自由度υ。 ③ t分布的形状与样本例数n有关,高峰比正态分
布略低,两侧尾部翘得比正态分布略高。越大, 曲线越近正态分布,当ν=∞时,t分布即为z分布。 由于t分布是一簇曲线,为了便于应用,统计学 家编制了表4-4-1 t界值表。
3)与例数的关系不同:当样本含量足够大时,标准 差趋向稳定。而标准误随例数的增大而减小,甚至趋 向于0。若样本含量趋向于总例数,则标准误接近于0。
联系;二者均为变异指标,如果把总体中各样本均 数看成一个变量,则标准误可称为样本均数的标准差。 当样本含量不变时,均数的标准误与标准差成正比。 两者均可与均数结合运用,但描述的内容各不相同。
活量的95%的可信区间。
本例n=5, =4,t0.05,4=2.776
x t0.05sx =2.44±2.776×0.33/ 5 =2.03~2.85(L)
该地17岁女中学生肺活量均数的95%可信区间为2.03L~2.85L。
例4-4-3 由例4-2-1 101名30~49岁健康男子血清总 胆固醇 X 4.735mmol·L-1,S=0.88 mmol·L-1,求该 地健康男子血清总胆固醇值均数的95%可信区间。
第九章第四节总体均数估计

置信区间的数值是随样本观察值而变化的, 它们能否包含总体均数是个随机事件,例 如建立100个置信区间,若有95个包含总体 均数,我们则称全部区间包含总体均数的 概率为95%。
置信区间有两个要素
• 准确度:反映在置信度(1-)的大小上,即可信区间
包含总体均数的理论概率,从准确度的角度看,愈 接近1愈好,如可信度99%比95%好。 • 精密度:反映在置信区间的长度上,即长度愈小愈 好。 在样本含量固定的情况下,二者是相互矛盾的,若 提高了置信度,准确性就增强,置信区间势必变宽, 精密度下降。
第九章
第四节 总体参数估计与假设检验
参数估计:指用样本指标(统计量)估计总体指标 (参数)。
参数估计: 点估计(point estimation) 区间估计(interval estimation)
点估计:用样本统计量直接作为总体参数的点估计值。
例如:用 、 直x 接作s为 、 的估计值。
方法虽然简单,没有考虑抽样误差,当抽取的样 本不同时对总体参数的点估计值也可能不同。
P(t / 2, t t / 2, ) 1
置信度
confidence level
P(t / 2,
X
sX
t / 2, ) 1
•
X s
在
t
/ 2,
到
t
/ 2,
之间的概率为1-
X
t / 2,
X
sX
t / 2,
t /2, sX X t /2, sX
X t /2, sX X t /2, sX
例 11名18岁男大学生身高均数资料得,
=1X72.25cm, S=3.31cm,试估计
该地18岁男大学生身高总体均数?
总体均数的估计

总体均数的估计
总体
随机抽样
推断
样本
参数估计 统计推断 统计分析 统计描述 假设检验
参数估计
用样本指标估计总体指标称为参
数估计,是统计推断的一个重要 方面。
总体均数估计的两种方法
点估计 区间估计
点估计
是直接用样本统计量直接作为
总体参数的估计值.
点估计的缺点
没有考虑抽样误差,无法评价估计
-1
0
1
2
3
4
5
图6.4自由度分别为1、5、∞的t分布
t分布的特征
t分布是一簇曲线。 t分布以0为中心,左右对称。 其形态变化与自由度的大小有关。自由度 越小,则t值越分散,曲线越低平;自由度 逐渐增大时, t 分布逐渐逼近 u 分布 ( 标准正 态分布);当=∞时,t分布即为u分布。
标准误
标准误
的计算:
X
n
标准误
的估计值
s sX n
影响标准误大小的因素
X 的大小与成正比
X 与样本含量n的平方根成反比
抽样误差越小,表明样本均数与
总体均数越接近,即用样本均数 估计总体均数的可靠性越大;反 之,抽样误差越大,则用样本均 数估计总体均数的可靠性越小。
X X t sX s n
(式6.3 )
同理,如果抽取例数 n=15 时,仍 能得到一条t分布曲线,因此,当n 变化时,就可以得到不同的 t 分布 曲线,如图6.4:
0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 -5
5
1
-4
Hale Waihona Puke -3-2 附表3的横标目为自由度,纵标目为
第四章总体均数的估计和t检验

——并不是做一次抽样求得可信区间包括μ 并不是做一次抽样求得可信区间包括μ的概率是0.95 的概率是0.95,对一次抽样而言 0.95,对一次抽样而言
只有两种可能,要么可信区间包含μ 只有两种可能,要么可信区间包含μ,要么不包含μ ,要么不包含μ。
95%可信区间 95%可信区间
X 公式 区间范围 估计错误的概率 ± t 0 .05 / 2 ,ν S x
本次试验结果:95%的概率保证区间 包含了µ ,有5% 的可能区间未包含µ
12
总体均值的置信区间
(σ2已知) 已知)
1.假定条件
总体服从正态分布,且总体方差(σ2)已知 如果不是正态分布,可以由正态分布来近似 (n>30)
2.使用正态分布统计量u
x−µ u= ~ N ( 0 ,1) σ n
3.总体均值 µ 在95%置信水平下的置信区间为
18
可信区间的解释
95%可信区间 95%可信区间: %可信区间:从总体中作随机抽样,例如 作100次抽样 100次抽样,每个样本可算出一个可信区间, 次抽样,每个样本可算出一个可信区间, 得100个可信区间 100个可信区间,平均有 个可信区间,平均有95 ,平均有95个可信区间包括 95个可信区间包括μ (估计正确) 估计正确),只有5 ,只有5个可信区间不包括μ(估计 错误) 错误)。
α/2
Pa/2
σ xx
1-α
α/2
µ
P1-
X
a/2
9
正态曲线下的面积规律
95% 2.5% 2.5%
µ-1.96σ
µ
µ+1.96σ
10
中心极限定理
中心极限定理:设从均数为 中心极限定理:设从均数为µ,方差为σ 2的一个任 意总体中抽取容量为 n 的样本,当 n 充分大时,样 本均数的抽样分布近似服从均数为 μ 、方差为 σ2/n的正态分布 σ σx = n 一个任意分
只有两种可能,要么可信区间包含μ 只有两种可能,要么可信区间包含μ,要么不包含μ ,要么不包含μ。
95%可信区间 95%可信区间
X 公式 区间范围 估计错误的概率 ± t 0 .05 / 2 ,ν S x
本次试验结果:95%的概率保证区间 包含了µ ,有5% 的可能区间未包含µ
12
总体均值的置信区间
(σ2已知) 已知)
1.假定条件
总体服从正态分布,且总体方差(σ2)已知 如果不是正态分布,可以由正态分布来近似 (n>30)
2.使用正态分布统计量u
x−µ u= ~ N ( 0 ,1) σ n
3.总体均值 µ 在95%置信水平下的置信区间为
18
可信区间的解释
95%可信区间 95%可信区间: %可信区间:从总体中作随机抽样,例如 作100次抽样 100次抽样,每个样本可算出一个可信区间, 次抽样,每个样本可算出一个可信区间, 得100个可信区间 100个可信区间,平均有 个可信区间,平均有95 ,平均有95个可信区间包括 95个可信区间包括μ (估计正确) 估计正确),只有5 ,只有5个可信区间不包括μ(估计 错误) 错误)。
α/2
Pa/2
σ xx
1-α
α/2
µ
P1-
X
a/2
9
正态曲线下的面积规律
95% 2.5% 2.5%
µ-1.96σ
µ
µ+1.96σ
10
中心极限定理
中心极限定理:设从均数为 中心极限定理:设从均数为µ,方差为σ 2的一个任 意总体中抽取容量为 n 的样本,当 n 充分大时,样 本均数的抽样分布近似服从均数为 μ 、方差为 σ2/n的正态分布 σ σx = n 一个任意分
4-总体均数的估计

x1 , s1
7
x2 , s2 x3 , s3
…………
x 1 , x 2 , x 3 ,...... x k ~ N ( µ ,
《医学基础统计》第四章总体均数的估计
σ
2
x k , sk
)
2010.09.21
n
1.1
抽样误差 sampling error
o 由于个体差异的存在,在抽样过程中产 生的样本统计量与相应的总体参数之间的 差异称为抽样误差; o 由于生物间的个体差异客观存在,故在 抽样研究中抽样误差无法避免; o 数理统计表明,抽样误差有规律可循。
2010.09.21
2.2
U值-标准正态变换
前提条件为,当σ x已知, u =
U值 ≥1.64 ≥1.96 ≥2.58 & & & ≤-1.64 ≤-1.96 ≤-2.58
x −μ
σx
正态分布曲线下面积 10% 5% 1%
P425,附表1 标准正态分布曲线下面积的分布表
21
《医学基础统计》第四章总体均数的估计
o总体均数的点估计为:104.89 o总体均数的95%可信区间为: 以 95 %的把握保证总 体 均 值 在 104.26 ~ 104.89 ± 1.980 × 0.32 105.52之间 = (104.26,105.52)
以 99 %的把握保证总 o总体均数的99%可信区间为: 体 均 值 在 104.05 ~ 104.89 ± 2.617 × 0.32 105.73之间 = (104.05,105.73)
30
《医学基础统计》第四章总体均数的估计 2010.09.21
四、总体均数估计的SAS编程
31
《医学基础统计》第四章总体均数的估计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
推断统计的基本原理(A)
抽样分布
三种分布: 总体分布:总体内个体数值的频数分布 样本分布:样本内个体数值的频数分布 抽样分布:某一种统计量的概率分布 例子: 将某市600名学生数学竞赛的分数作为一个总体,其600个考分的 频数分布是___;若从中随机抽出40个考分为样本,这40个考 分的频数分布是____;若将所抽到的40个考分计算其均数及 标准差后还回总体,再随机抽40个考分,计算其均数及标准 差……这样反复进行下去,就获得n=40的一切可能样本的平均 数与标准差,若将这一切可能个样本的平均数及标准差分别进行 频数分布,就形成一个实验性的平均数抽样分布及标准差的抽样 分布。
估计量
参数估计中,把要估计参数称为待估参数 ,把用来 估计参数的统计量称为估计量,用 表示;把计算出 来的值作为估计量的值,称为估计值,也用 表示。 于是,参数估计就成了待估参数、估计量和估计值之 间的关系。用数学语言来概括,就是:设总体X服从F (x),该总体有参数 ,现根据自该总体的样本 (X1,X2,…Xn)构造出一个估计量 去估计 ,估计 值 由样本的一组观察计算得出。
该总体的一个容量为n的简单随机样本,则样本 均数 X 亦服从正态分布,且总体均数与样本均数、 总体方差与样本均数的方差之间存在以下关系:
X
2 X
n
2
定理3
设总体X具有总体均数μ与方差σ 2,当样本容量n趋于无
穷大时,则样本均数 X 的分布趋于正态分布,且样本的
数学期望(即均数) X ,样本均数的方
X / n
例:
某类产品的强度服从正态分布,其总体均数
为100,总体标准差为5。现从该总体中抽取 一个容量为25的简单随机样本,求这一样本 的样本均数介于99-101的概率。
解:根据定理3,当 X 99 时
Z X 99 100 5/ 25 1
/
n
当 X 101 时, Z X 101 100 5/ 25 1
推断统计的基本原理
例示:
假设某次心理学测验中5名被试的得分分别是120
分,125分,130分,135分和140分。若将这5名 被试看作是一个总体,从中抽取2名被试作为样 本,则样本均数的抽样分布如何?
____________________________ 被试编号 1 2 3 4 5 测验得分(Xi) 120 125 130 135 140 次数(f) 1 1 1 1 1 概率(P) .20 .20 .20 .20 .20
心理与教育统计学
第四讲 推断统计 席居哲
内容提要
推断统计的基本原理
抽样分布
参数估计 假设检验
总体均数的参数估计与假设检验
总体均数之差的参数估计与假设检验 总体方差及比例的参数估计与假设检验
推断统计的基本原理
问题:
若要了解全国15岁青少年的智力发展状况,该如
何做?
(1)全测? (2)猜测? (3)部分施测?估计?
/
n
查表 3 得: P {99 X 101 } P { 1 X 1} 2 . 34134 . 68268
有限总体修正系数
在不放回抽样(不重复抽样)时,比如检验
灯泡 定理4:
设总体X的总体平均数为μ,方差σ 2,
(X1,X2,…,Xn)是以不放回的抽样形式从该总体 中抽取的一个容量为n的简单随机样本,则样本 均数 X 的平均数与方差分别为(在n/N≥.05时才 需要;若n/N<.05则可以省略该系数):
点估计:用某一样本统计量的值来估计相应总体参数
的值叫总体参数的点估计。(无偏性,有效性,一致 性) 区间估计:以样本统计量的抽样分布(概率分布)为 理论依据,按一定概率的要求,由样本统计量的值估 计量估计总体参数的所在范围,称为总体参数的区间 估计
参数估计
参数估计和假设检验是统计推断的基本任务
X
2 X
N n N 1
n
2
例:
某公司2000个产品的强度服从正态分布,其
总体均数为100,总体标准差为5。现从该总 体中不放回地抽取400个产品作为样本,求样 本均数的均数和方差。
推断统计的基本原理(B)
参数估计
在解决实际问题时,往往没有条件事不需要计算
出总体的参数,这就需要研究者根据样本资料进 行合理的分析,对总体参数作出科学的估计 根据样本统计量对相应总体参数所作的估计叫总 体参数估计。总体参数估计分点估计与区间估计。
差x
2
2
n
, 即 X N ( , / n )。这个定理又称为中心极限定理。
2
要指出的是,在小样本的情况下,中心极限定理不一定
成立,不能保证抽自非正态分布总体的样本均数服从正 态分布。 在样本均数服从正态分布的情况下,我们可以用下
面的公式将转换成标准正态分布 Z X X X
当总体σ 未知,总体呈正态分布,样本容量无论
大小时,或者当总体σ 未知,总体虽不呈正态分 布,但样本容量较大(n>30)时,样本平均数与 总体平均数离差统计量均呈t分布。总体平均数 的置信区间可按t分布,用σ 的估计值计算。
Z分布
这里是 自由度 (df)
S为总体标准差的估计值 同等的表示还有:
参数估计的基本思想是:
设总体X服从分布F(x),该总体有参数 ,自总 体中抽取一个样本(X1,X2,…,Xn),此时可 以根据以下两种方法估计 :
(1)根据样本的观察值计算出一个与 相应的 估计值,用这个估计值直接作为对参数 这种方法称为参数的点估计 的估计。
(2)根据样本的观察值计算出两个估计量
__________________________________________
则:
2
X
N
120 125 130 135 140 5 X
2
130
X
50
N
(1)抽样分布与统计量
不难发现:样本均数的均数
X 正好等于总体平均数 , 样本均数的方差 X 等于总体方差
区间估计小结
区 间 估 计 小 结
练习
P.115
参数的区间估计
设总体X有待估参数θ ,(X1,X2,…,Xn)是
抽自该总体的一个容量为n的简单随机样本。 现建立两个统计量
ˆ1和 ˆ2,且 ˆ1 ˆ2, 为一给定概率,称作显
1 为置信水平,若关系式 而称区间( 著性水平, P {ˆ1 ˆ2 } 1 成立,
t X
x/
n 1
x 为样本的标准差
等等
利用t分布进行参数区间估计的通式
例子
从某小学三年级随机抽取12名学生阅读能力
得分为28,32,36,22,34,30,33,25, 31,33,29,26。试估计该校三年级阅读能 力总体均数在95%和99%的置信区间。
提示:要先查t(11).05和t(11).01的值。
ˆ1 , ˆ2)为参数 的置信水平 1 下的区间 ˆ1和 ˆ2 分别称为置信区间的下
置
估计或置信区间。 信限和上置信限。
以总体均 数为例说 明总体参 数区间估 计做法
即1- α , 置信水平 (.95); 而α为 显著性水平 (.05)
参数的区间估计(1)
σ已知条件下总体平均数的区间估计
当总体σ 为已知,总体呈正态分布,样本容量n
无论大小时,或者当总体σ 已知,虽总体不呈正 态分布,但样本容量大(n>30)时,样本均数与 总体均数的离差统计量均呈正态分布。总体均数 可按Z分布,用已知σ 计算
例:σ 已知时总体均数的区间估计
某小学10岁全体女童身高历年来标准差为
6.25cm,现从该校随机抽25名10岁女童,平 均身高为134.2cm,试估计该校10岁全体女 童平均身高的95%和99%的置信区间。
可表示为:Zα/2
通式为: P { X Z /
2
n X Z /
2
n}
即总体均数在 X Z / 2
1 的置信水平下的置信区 n , X Z /
2
间为
n
参数的区间估计(2)
σ未知条件下总体均数的区间估计
(4)充分性:一个估计量充分地利用了样本提供的所有 有关待估参数的信息,就称其为充分估计量
点估计
点估计有许多具体的方法,如矩法、最大似然法、最 小平方法和贝叶斯估计法等。下面以最简单的矩法为 例。 矩法的基本思想就是用样本统计量直接作为相对应的 总体参数的估计量 [例]从总体X中抽取一个容量为5的样本,其观察值是: 100,120,105,122,111。求总体平均数与总体方差的点估 计值。
2
的
2
1 n
我们就得到如下定理:
定理1
设总体X服从分布F(x),(X1,X2,…,Xn)是抽自
该总体的一个简单随机样本,则总体均数μ 与样 本均数 X 、总体方差σ 2(或标准差σ )与样本均 2 数的方差 (或标准差 X <又称标准误>)之间存 X 在下述关系:
X X
2,用区间( 1, 2)作为参数
1和
可能的取值范围,
并指出参数落在这一区间的概率。即区间估计
判断估计量的优劣标准
(1)无偏性
根据抽样分布原理,样本平均数的数学期望 (即平均数) ,故 作为总体平均数的 估计量时,是一个无偏估计量。但样本方差S2n 却是一个有偏估计量,若要使其无偏,则须用 其另一种算法S2,有时标记为S2n-1即: