第四章统计推断:估计与假设检验-72页PPT资料
合集下载
第4章参数估计和假设检验ppt课件

SPSS输出结果(数据:tv.xls) 操作:分析->描述统计->探索
均值 均值的 95% 置信区间
5% 修整均值 中值 方差 标准差 极小值 极大值
下限 上限
统计量 27.191 25.530 28.852 26.977 26.500 70.104 8.3728
9.5 50.3
标准 误
.8373
0.217(1 0.217) 0.217 1.645
995 0.217 0.0215
结论:我们有90%的把握认为悉尼青少年中每 天都抽烟的青少年比例在19.55%~23.85%之间。
中央财经大学统计学院 26
SPSS的计算结果
均值
在SPSS中将 “是否吸烟”
均值的 90% 置信区间
输入为取值为1 5% 修整均值
中央财经大学统计学院 2
点估计
点估计: 用估计量的数值作为总体参数的估 计值。
一个总体参数的估计量可以有多个 。例如, 在估计总体方差时,
n
(xi x)2 和
i 1
n 都可以作为估计量。
n
(xi x)2
i 1
n 1
中央财经大学统计学院 3
点估计量的常用评价准则:无偏性
无偏性:估计量的数学期望与总体待估参 数的真值相等: E(ˆ)
P(X )
B
较小的样本容量
A
X
中央财经大学统计学院 6
区间估计
根据事先确定的置信度1 - 给出总体参数 的一个估计范围。
置信度1 - 的含义是:在同样的方法得到 的所有置信区间中,有100(1- )% 的区间 包含总体参数。
抽样分布是区间估计的理论基础。
置信区间
总体均数的估计和假设检验PPT课件

5、t’检验
当方差不齐时,两小样本均数的比较用t’
检验。 检验统计量:t'
x1 x2 s12 s22 n1 n2
临界值:
t'
s2 x1
t ,v1
s2
s2 x2
s2
t ,v2
x1
x2
如果t’ >t’α,则P<α,则拒绝原假设。
6、z检验
当样本含量较大时,可用z检验来进行
两样本均数的比较。它是用于两大样本均 数的比较,目的是推断两总体均数是否相 同。所用公式:
4、成组t检验
(3) 资料要求:两样本来自正态或近似正态 分布,并且两组总体方差相等。
(4) 对数正态分布的资料,在进行t检验时,
要先把数据进行对数转换,用对数值作为
新变量进行成组t检验。
4、成组t检验
(4) 公式: H0: μ1= μ2 H1:μ1 ≠ μ2
t x1 x2 s
x1 x2
(1) 小样本资料的估计(未知)
P(t ,<t<t , ) 1
由1-αx时 t,,计( 算sn )总<体<均x数的t,可( 信sn区)可间得的到通当式可为信:度
即:x
t
,
s x
例2:试求例1中该地1岁婴儿血红蛋白平 均值的95%的可信区间。
s
由ν于 =nn= -215=,24s=,11α.取9g双/L尾, 0s.x 05,n查t2界.3值8 g表/ L得:
准差s2=1.626 mg/dl,配对t检验结果,t =-
3.098,P<0.05,故认为脑病病人尿中类固醇排出 量高于正常人。
表3 正常人和脑病病人尿中类固醇排出量 (mg/dl)
正常人
2.90 5.41 5.48 4.60 4.03 5.10 4.97 4.24 4.37 3.05 2.78脑ຫໍສະໝຸດ 病人差别是由抽样误差引起的。
第四章 统计推断 ppt课件

H0:μ≤ μ0=30(cm),即该棉花品种纤维长度达不到 纺织品生产的要求。 HA:μ>μ0
24
单尾检验
假设:
(one-sided test)
H0 : ≤0 HA : > 0
返回 H0 : ≥0 HA : < 0
0.95 0.05 0.05 0.95
接受区 1.64
-1.64 接受区
否定区
右尾检验
由于处理效应τ = μ- μ0 无法计算,统
计推断只能从第(2)种可能性出发,即假设处 理效应不存在,试验表型效应全为试验误差。
然后再计算该假设出现的概率,最后依概 率的大小判断假设是否成立,从而推断处理效 应是否存在(反证法)。这就是统计假设测验 的基本思想。
12
二 、假设检验的步骤
例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),
(3)检验
x
x n 4.421 s
x2
(x)2
n
0.267
n1
(tn1
x
sx
0.9 4
t 0.05(9) =2.262
P>0.05
在0.05显著水平上,接受H0,否定HA;
认为该次抽样所测结果与多年平均值无显著差别,
属于随机误差。
45
二、两个样本平均数 的假设检验
例:
x
0
1262 x
2
n
24040 6
x- 136-126
u= x
=
√40
= 1.581
u >1.96
0.025
0.95
0.025
0 -1.96x
0
0+1.96x
否定区
24
单尾检验
假设:
(one-sided test)
H0 : ≤0 HA : > 0
返回 H0 : ≥0 HA : < 0
0.95 0.05 0.05 0.95
接受区 1.64
-1.64 接受区
否定区
右尾检验
由于处理效应τ = μ- μ0 无法计算,统
计推断只能从第(2)种可能性出发,即假设处 理效应不存在,试验表型效应全为试验误差。
然后再计算该假设出现的概率,最后依概 率的大小判断假设是否成立,从而推断处理效 应是否存在(反证法)。这就是统计假设测验 的基本思想。
12
二 、假设检验的步骤
例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),
(3)检验
x
x n 4.421 s
x2
(x)2
n
0.267
n1
(tn1
x
sx
0.9 4
t 0.05(9) =2.262
P>0.05
在0.05显著水平上,接受H0,否定HA;
认为该次抽样所测结果与多年平均值无显著差别,
属于随机误差。
45
二、两个样本平均数 的假设检验
例:
x
0
1262 x
2
n
24040 6
x- 136-126
u= x
=
√40
= 1.581
u >1.96
0.025
0.95
0.025
0 -1.96x
0
0+1.96x
否定区
绪论四统计推断:估计与假设检验

原理:矩估计法是一种 步骤 基于样本矩与总体矩相 等的原理进行参数估计 的方法。通过计算样本 的一阶矩(均值)和二 阶矩(方差)等统计量, 可以构造出总体参数的 估计量。
03
04
05
计算样本的一阶矩和二 阶矩等统计量;
根据样本矩与总体矩相 等的原理,构造出总体 参数的估计量;
对估计量进行求解,得 到参数的估计值。
统计推断目的
通过对样本数据的分析,得出关于总 体的结论,为决策提供依据。
总体与样本关系
总体
研究对象的全体个体组成的集合。
样本
从总体中随机抽取的一部分个体组成的集合。
样本与总体的关系
样本是总体的一个子集,通过样本可以对总 体进行推断。
参数估计与非参数估计
参数估计
在已知总体分布类型的情况下,对总体分布中的参数进行估计的方法。包括点估计和区间估计。
点估计优良性评价标准
无偏性
指估计量的期望值等于被估计的 总体参数,即估计量在多次重复 抽样下的平均值等于总体参数的 真实值。
有效性
指在同样满足无偏性的条件下, 具有更小方差的估计量被认为是 更有效的。有效性可以通过比较 不同无偏估计量的方差来评价。
一致性
指随着样本量的增加,点估计量 的值逐渐趋近于总体参数的真实 值。一致性是评价点估计量长期 稳定性和可靠性的重要标准。
确定方法
通常根据研究者的经验和实际情况来设定显著性水平。常见的显著性水平有0.01、0.05和0.1等。在设定显著性 水平时,需要权衡第一类错误和第二类错误(即错误地接受原假设)的风险。
05 单个正态总体参数假设检 验
单个正态总体均值检验
01
零假设与备择假设
02
检验统计量
《统计假设检验》PPT课件

两均数差异越大,β值越小。
精选ppt
18
如何选择合适的α值
若一个试验耗费大,可靠性要求高,不允许反复,那么α值 应取小些;当一个试验结论的使用事关重大,容易产 生严重后果,如药物的毒性试验,α值亦应取小些。
对于一些试验条件不易控制,试验误差较大的试验,可将α 值放宽到0.1,甚至放宽到0.25。
在提高显著水平,即减小α值时,为了减否定小域犯Ⅱ型错误的概 否率定,域可适当增大接样受本域含量。增大样本含量可以同时降 低犯两类错误的可能性。
精选ppt
17
意两 图类
错 误 示
两类错误间的关系:
如图所示,图中左边曲线是H0为真时,x1 x2的分布密度曲
线;右边曲线是HA为真时,x1 的x2分布密度曲线( 1) 2
犯Ⅱ型错误可能性β的大小与α取值的大小、两均数差 异大小等因素有关:
当α值变小时, β值变大;反之亦然,也就是说Ⅰ型 错误α的降低必然伴随着Ⅱ型错误β的升高 ;
精选ppt
3
第一节 显著性检验的基本原理
一、显著性检验的意义
二、两种假设
三、显著水平与两类错误
四、双侧检验与单侧检验
五、显著性检验的基本步骤
精选ppt
4
一、显著性检验的意义
(一)为什么要进行显著性检验? 例1
某实验要求实验动物平均体重μ=10.00g, 现有
实验动物10只,平均体重 =x 10.23g, 已知总体
n
10
4.∵ HA: μ≠μ0,当∣u∣ >u0.025时拒绝H0 查正态分布表得,u0.025=1.96。 5. 做出推断及生物学解释:
∵ ∣u∣ <u0.025 ,P>0.05, ∴接受H0:μ=μ0 ,即可以认为这10只动物抽自总
第四章 统计推断3PPT课件

u x
x
其中平均数标准误为:
x
n
由于假设H0:μ=μ0,故:
x
u
0
x
由于总体标准差不易求得,若为大样本, 可以用样本标准差估计总体标准差,则样 本平均数的标准误及u值为:
sx
s n
x
u
0
sx
如果实得 u u ,则否定H0,接受HA。当
时 u u ,接受H0。
大样本平均数的检验
❖ 例4.1 ❖ 解题思路:总体标准差已知,故采用u双尾检
本例利U分 用布 了来|u估 |2.5计 6的 2 尾区概率, u检所 验以 。称
ux0 称为检验统计量。 / n
3 双侧检验与单侧检验
在例一里,HA 备 :择 0。 假 HA实 设际 是上包 0含 或 0这两种情水 况平 ,的 此拒 时 ( , 绝 u/域 2] 为
和 [u/2,)。
这种利用两的 个检 尾验 部称 进作 行 双 双侧 侧检 检验 验的 。
首先对样本所 作在 一的 假总 设体 。假 药设 剂喷 的洒 玉了 米单
总体平与 均原 数来的玉米 体单 平穗 均 0之重 数 间总 没有真实 即=0。也就是说表 x面 0)差 是异 由( 抽样误 。差造成
0被称为零假设 设或 ,无 记 H0效 :为 假 0.
所谓“零”就是指处理(药剂) 没有效果
H0是待检验的假 可设 能, 被它 接有 受, 被也 否有 定可 。 因此,需要设 立定 的一 假个 设对 ,称 设为 。备择假
验 ❖ 检验步骤: ❖ 无效假设H0:1=2.即新育苗方法与常规育
苗方法所育鱼苗体长相同 ❖ 备择假设HA:12即新育苗方法与常规育
苗方法所育鱼苗体长不相同
❖ 选取显著水平α=0.05
统计推断与假设检验

统计推断与假设检验
目录页
Contents Page
1. 统计推断基础概念 2. 假设检验流程介绍 3. 假设检验基本原理 4. 检验统计量选择 5. 显著性水平与决策 6. 第一类错误与第二类错误 7. 功效与样本大小 8. 实际应用案例分析
统计推断与假设检验
统计推断基础概念
统计推断基础概念
▪ 统计推断的定义和重要性
卡方统计量的选择
1.卡方统计量适用于分类数据的拟合优度检验和独立性检验。 2.在选择卡方统计量时,需要确保样本数据频数符合期望频数的要求,且每个单元格的期望频数不 小于5。
检验统计量选择
▪ F统计量的选择
1.F统计量适用于检验两个或多个总体方差是否相等。 2.在选择F统计量时,需要确保数据呈正态分布或近似正态分布,且各组样本大小相同或相近 。
总结
1.显著性水平与决策是统计推断和假设检验的核心内容,需要 深入理解其概念和原理。 2.合理的实验设计、增加样本量和严格的质量控制是提高决策 准确性的关键方法。 3.随着科技的发展,统计推断和假设检验将发挥越来越重要的 作用,需要不断更新知识和技术以适应未来的挑战。
统计推断与假设检验
第一类错误与第二类错误
统计推断与假设检验
功效与样本大小
功效与样本大小
▪ 功效的定义与重要性
1.功效是实验或研究能够正确检测到真实效应的概率,反映了 研究的可靠性。 2.高的功效可以增加研究结论的可信度,减少假阴性结果的风 险。 3.在设计和规划研究时,需要考虑期望的功效水平以及影响功 效的各种因素。
▪ 影响功效的因素
1.统计推断是从样本数据推断总体特征的过程。 2.统计推断在科学研究、数据分析、决策制定等领域有广泛应用。 3.正确的统计推断能够保证结论的有效性和可靠性。
目录页
Contents Page
1. 统计推断基础概念 2. 假设检验流程介绍 3. 假设检验基本原理 4. 检验统计量选择 5. 显著性水平与决策 6. 第一类错误与第二类错误 7. 功效与样本大小 8. 实际应用案例分析
统计推断与假设检验
统计推断基础概念
统计推断基础概念
▪ 统计推断的定义和重要性
卡方统计量的选择
1.卡方统计量适用于分类数据的拟合优度检验和独立性检验。 2.在选择卡方统计量时,需要确保样本数据频数符合期望频数的要求,且每个单元格的期望频数不 小于5。
检验统计量选择
▪ F统计量的选择
1.F统计量适用于检验两个或多个总体方差是否相等。 2.在选择F统计量时,需要确保数据呈正态分布或近似正态分布,且各组样本大小相同或相近 。
总结
1.显著性水平与决策是统计推断和假设检验的核心内容,需要 深入理解其概念和原理。 2.合理的实验设计、增加样本量和严格的质量控制是提高决策 准确性的关键方法。 3.随着科技的发展,统计推断和假设检验将发挥越来越重要的 作用,需要不断更新知识和技术以适应未来的挑战。
统计推断与假设检验
第一类错误与第二类错误
统计推断与假设检验
功效与样本大小
功效与样本大小
▪ 功效的定义与重要性
1.功效是实验或研究能够正确检测到真实效应的概率,反映了 研究的可靠性。 2.高的功效可以增加研究结论的可信度,减少假阴性结果的风 险。 3.在设计和规划研究时,需要考虑期望的功效水平以及影响功 效的各种因素。
▪ 影响功效的因素
1.统计推断是从样本数据推断总体特征的过程。 2.统计推断在科学研究、数据分析、决策制定等领域有广泛应用。 3.正确的统计推断能够保证结论的有效性和可靠性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x 这种方法最常见的应用是用样本平均数 估计总体数 学期望,用样本方差S2估计总体的方差。 矩法比较直观,求估计量时有时也比较直接,但它求
出的估计量往往不够理想。
矩法点估计的例题
例4-1 某灯泡厂某天生产了一大批灯泡,从中抽取了10 个进行寿命试验,获得数据如下(单位:小时),问该 天生产的灯泡的平均寿命是多少?
xx, dx
0
x
1dx
1
0
xd
x
1
1 2
2
02
又在矩法下ˆ x
x
2
,ˆ 2x
二、点估计方法
(2)最大似然法(Maximum Likelihood Estimation) a、一个重要的事实
不同的总体会产生不同的样本,对于某一特定的样本, 在不了解产生它的总体究竟为何物的观察者眼中,它来 自一些总体的可能性要比来自另一些总体的可能性大, 即一些总体更容易产生出我们所观察到的样本。
无偏性的定义
如E 果 θ ˆθ成立θ ˆ为 ,参 称 θ的 数 无偏估 θ ˆ具 计 有 , 无 亦 如E 果 θ ˆθ,θ ˆ称 为 θ的有偏估B 计 i aE , sθ ˆ-θ。 其偏差
θˆ 的概率
点估计量是一个随机变量,因为其值随样本的不同而不 同。
常用的点估计方法有三种:矩法、最大似然法、最小二 乘法。
对同一样本根据三种方法估计同一参数,所获得的估计 结果可能互不相同。然而由于各种建立原则的合理性, 所以三种方法在研究中都经常使用。
二、点估计方法
(1)矩法
矩法是求估计量最古老的方法。具体作法是:以一样 本矩作为相应总体矩的估计量; 以样本矩的函数作为 相应的总体矩同样函数的估计量。
则似然函数
Lx1, x2
x
n
;
n
Pxi;
i 1
d、最大似然法的定义和估计方法
定义 如果L(x1, x2,…,xn;θ)在^处达到最大值,则称^ 是θ
的最大似然估计。 为了取得的最大似然估计,必须使似然函数L达到最
大值。由于对数函数是单增的,L达到最大亦即LnL达到最 大。这样使LnL达到最大来估计为计算带来了许多方便。
4.2 点估计及估计量的特征
一、点估计的含义
所谓点估计就是给出被估计参数的一个特定的估计值。 例如随机变量X服从某一未知均值和方差的正态分布,若
有来自该正态Hale Waihona Puke 体的一随机样本,则这些样本数据的平
均值就为总体的均值ux的点估计值, XX为i /n点估计量。
4.2 点估计及估计量的特征
一、点估计的含义
4.1 统计推断的含义
统计推断研究的是总体与来自总体的样本之间的关系, 根据来自总体的样本对总体的种种特征做出判断。
参数估计和假设检验是统计推断的两个孪生分支 参数估计问题包括点估计(point estimation)和区间
估计(interval estimation). 假设检验包括置信区间法和显著性检验
根据拉格朗日定理,对未知参数求条件极值,令LnL 对 的一阶导数等于0,即dLnL/d =0 ==>得到似然方程, 所求的^就是似然方程中的解。
注意:
当不只一个参数需要估计时,应将LnL分别对不 同参数求偏导,然后解似然方程组
最大似然估计法对方差的估计往往是有偏估计 量,以后对线性模型估计时也是如此。
二、点估计方法
(3)最小二乘法 (Least Square Estimation Method)
最小二乘法是计量经济学中应用最广泛的一种估计方 法。
这是本课程研究的重点问题,在以后各章中将详尽地 阐述它的原理、步骤、特性和优越处。
三 点估计量的特征
所谓估计量的特性指的是衡量一个统计量用以 估计总体参数的好坏标准。
对于离散型变量,就是要选择^使p(x1)p(x2)…p(xn)最大。 (连乘——表示一次独立地抽取各个样本观察值)
对于连续型变量,就是要选择^使(x1)(x2)...(xn)最大。注 意(xi)是随机变量在xi附近取值的概率,相当于离散型的p(xi)。
c、似然法函数
设为连续型随机变量,它 的分布函数是 F x; ,分布密
度函数是 x; ,其中 是未知参数。由于样本 的独立性,则
样本 x1, x2 xn 的联合分布分布密度是 :
Lx1, x2
x
n
;
n
x
i
;
i 1
由于每一取定的样本值 x1, x2 xn 是常数,所以 L可以看
成参数 的函数,称 L为样本的似然函数。
设为离散型随机变量,它 的概率函数 P xi Pxi ; ,
举例说假定我们抽取到(x1,x2,……,x8),知道它来自 正态总体,且总体的方差是了解的,但是总体的均值未 知。如下图所示。
概 率 分布B
分布A
x x6 x2 x3 x4 x5 x6 x7 x8
假定样本不是来自B就是来自A。如果样本来自B,观察 到它的可能性非常小;真正的母体若是A,得到样本的 可能性很大。显然我们宁愿承认样本来自A。是样本
“替”我们“选择”了A。
b、最大似然法的概念
上述事实诱导我们宁愿作出这样的抉择:将样本最容易来自 的总体当作产生样本的总体。
现在要根据从总体中抽取得到的样本(x1,……,xn)对总体中的 未知数进行估计。最大似然法是选择这样的估计量^作为 的估计值,以便使观察结果(x1,……,xn)出现的可能性(概率) 最大。
抽样序号 1 2 3 4 5 6 7 8 9 10 寿命(小时) 1050 1100 1080 1120 1200 1250 1040 1130 1300 1200
计算得样本算术平均数=1147,作为总体数学期望的估计值
例2若样本x1, xn取自均匀分布
x,
1
0
0 x
其它
问在矩法下是多少?
x
点估计量的一些统计性质
(1)线性;(2)无偏性;(3)有效性; (4)最优线性无偏估计量(BLUE); (5)一致性
(1)线性
若估计量是样本观察值的线性函数,则称该估计量是 线性估计量
样本均值是一个线性估计量
(2)无偏性
无偏性的直观意义
根据样本推得的估计值和真值可能不同,然而如果 有一系列抽样依据同一估计方法就可以得到一系列估 计值,很自然会要求这些估计的期望值与未知参数的 真值相等。这就是无偏性的概念,无偏性的直观意义 是:样本估计量的数值在真值周围摆动,即无系统误 差。
出的估计量往往不够理想。
矩法点估计的例题
例4-1 某灯泡厂某天生产了一大批灯泡,从中抽取了10 个进行寿命试验,获得数据如下(单位:小时),问该 天生产的灯泡的平均寿命是多少?
xx, dx
0
x
1dx
1
0
xd
x
1
1 2
2
02
又在矩法下ˆ x
x
2
,ˆ 2x
二、点估计方法
(2)最大似然法(Maximum Likelihood Estimation) a、一个重要的事实
不同的总体会产生不同的样本,对于某一特定的样本, 在不了解产生它的总体究竟为何物的观察者眼中,它来 自一些总体的可能性要比来自另一些总体的可能性大, 即一些总体更容易产生出我们所观察到的样本。
无偏性的定义
如E 果 θ ˆθ成立θ ˆ为 ,参 称 θ的 数 无偏估 θ ˆ具 计 有 , 无 亦 如E 果 θ ˆθ,θ ˆ称 为 θ的有偏估B 计 i aE , sθ ˆ-θ。 其偏差
θˆ 的概率
点估计量是一个随机变量,因为其值随样本的不同而不 同。
常用的点估计方法有三种:矩法、最大似然法、最小二 乘法。
对同一样本根据三种方法估计同一参数,所获得的估计 结果可能互不相同。然而由于各种建立原则的合理性, 所以三种方法在研究中都经常使用。
二、点估计方法
(1)矩法
矩法是求估计量最古老的方法。具体作法是:以一样 本矩作为相应总体矩的估计量; 以样本矩的函数作为 相应的总体矩同样函数的估计量。
则似然函数
Lx1, x2
x
n
;
n
Pxi;
i 1
d、最大似然法的定义和估计方法
定义 如果L(x1, x2,…,xn;θ)在^处达到最大值,则称^ 是θ
的最大似然估计。 为了取得的最大似然估计,必须使似然函数L达到最
大值。由于对数函数是单增的,L达到最大亦即LnL达到最 大。这样使LnL达到最大来估计为计算带来了许多方便。
4.2 点估计及估计量的特征
一、点估计的含义
所谓点估计就是给出被估计参数的一个特定的估计值。 例如随机变量X服从某一未知均值和方差的正态分布,若
有来自该正态Hale Waihona Puke 体的一随机样本,则这些样本数据的平
均值就为总体的均值ux的点估计值, XX为i /n点估计量。
4.2 点估计及估计量的特征
一、点估计的含义
4.1 统计推断的含义
统计推断研究的是总体与来自总体的样本之间的关系, 根据来自总体的样本对总体的种种特征做出判断。
参数估计和假设检验是统计推断的两个孪生分支 参数估计问题包括点估计(point estimation)和区间
估计(interval estimation). 假设检验包括置信区间法和显著性检验
根据拉格朗日定理,对未知参数求条件极值,令LnL 对 的一阶导数等于0,即dLnL/d =0 ==>得到似然方程, 所求的^就是似然方程中的解。
注意:
当不只一个参数需要估计时,应将LnL分别对不 同参数求偏导,然后解似然方程组
最大似然估计法对方差的估计往往是有偏估计 量,以后对线性模型估计时也是如此。
二、点估计方法
(3)最小二乘法 (Least Square Estimation Method)
最小二乘法是计量经济学中应用最广泛的一种估计方 法。
这是本课程研究的重点问题,在以后各章中将详尽地 阐述它的原理、步骤、特性和优越处。
三 点估计量的特征
所谓估计量的特性指的是衡量一个统计量用以 估计总体参数的好坏标准。
对于离散型变量,就是要选择^使p(x1)p(x2)…p(xn)最大。 (连乘——表示一次独立地抽取各个样本观察值)
对于连续型变量,就是要选择^使(x1)(x2)...(xn)最大。注 意(xi)是随机变量在xi附近取值的概率,相当于离散型的p(xi)。
c、似然法函数
设为连续型随机变量,它 的分布函数是 F x; ,分布密
度函数是 x; ,其中 是未知参数。由于样本 的独立性,则
样本 x1, x2 xn 的联合分布分布密度是 :
Lx1, x2
x
n
;
n
x
i
;
i 1
由于每一取定的样本值 x1, x2 xn 是常数,所以 L可以看
成参数 的函数,称 L为样本的似然函数。
设为离散型随机变量,它 的概率函数 P xi Pxi ; ,
举例说假定我们抽取到(x1,x2,……,x8),知道它来自 正态总体,且总体的方差是了解的,但是总体的均值未 知。如下图所示。
概 率 分布B
分布A
x x6 x2 x3 x4 x5 x6 x7 x8
假定样本不是来自B就是来自A。如果样本来自B,观察 到它的可能性非常小;真正的母体若是A,得到样本的 可能性很大。显然我们宁愿承认样本来自A。是样本
“替”我们“选择”了A。
b、最大似然法的概念
上述事实诱导我们宁愿作出这样的抉择:将样本最容易来自 的总体当作产生样本的总体。
现在要根据从总体中抽取得到的样本(x1,……,xn)对总体中的 未知数进行估计。最大似然法是选择这样的估计量^作为 的估计值,以便使观察结果(x1,……,xn)出现的可能性(概率) 最大。
抽样序号 1 2 3 4 5 6 7 8 9 10 寿命(小时) 1050 1100 1080 1120 1200 1250 1040 1130 1300 1200
计算得样本算术平均数=1147,作为总体数学期望的估计值
例2若样本x1, xn取自均匀分布
x,
1
0
0 x
其它
问在矩法下是多少?
x
点估计量的一些统计性质
(1)线性;(2)无偏性;(3)有效性; (4)最优线性无偏估计量(BLUE); (5)一致性
(1)线性
若估计量是样本观察值的线性函数,则称该估计量是 线性估计量
样本均值是一个线性估计量
(2)无偏性
无偏性的直观意义
根据样本推得的估计值和真值可能不同,然而如果 有一系列抽样依据同一估计方法就可以得到一系列估 计值,很自然会要求这些估计的期望值与未知参数的 真值相等。这就是无偏性的概念,无偏性的直观意义 是:样本估计量的数值在真值周围摆动,即无系统误 差。