假设检验的基本方法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(显著性水平与拒绝域 )
抽样分布
置信水平
1 - 接受域
拒绝域
H0值 观察到的样本统计量
临界值
样本统计量
右侧检验
(显著性水平与拒绝域 )
抽样分布
置信水平
1 - 接受域
拒绝域
H0值 临界值
样本统计量
第二节 假设检验的应用
一、总体方差已知时的均值检验 二、总体方差未知时的均值检验 三、总体比例的假设检验 四、总体方差的检验
第七章 假设检验
第一节 假设检验的几个基本问题 第二节 假设检验的基本方法 第三节 假设检验的应用
第一节 假设检验的几个基本问题
一、假设检验的概念 二、假设检验的步骤 三、假设检验中的小概率原理 四、假设检验中的两类错误 五、双侧检验和单侧检验
假设检验的概念与思想
什么是假设?
对总体参数的一种看法
假设检验的过程
(提出假设→抽取样本→作出决策)
总体
提出假设
我认为人口的平均 年龄是50岁
作出决策
拒绝假设!
别无选择.
☺☺ ☺
☺☺ ☺☺
☺☺
抽取随机样本
☺X均=值20☺
假设检验的步骤
▪ 提出原假设和备择假设 ▪ 确定适当的检验统计量 ▪ 规定显著性水平 ▪ 计算检验统计量的值 ▪ 作出统计决策
提出原假设和备择假设
(双尾 Z 检验)
一个总体的检验
一个总体
均值
比例
方差
Z 检验
t 检验
Z 检验
(单尾和双尾) (单尾和双尾) (单尾和双尾)
2检验
(单尾和双尾)
总体均值的检验
(检验统计量)

z 检验
Z X 0 n
总体 是否已知?

大 样本容量
n
z 检验
Z X 0
Sn

用样本标 准差S代替
t 检验
t X 0 Sn
均值的双尾 Z 检验 (计算结果)
H0: = 0.081 检验统计量:
H1: 0.081 = 0.05
z x 0 0.076 0.081 2.83 n 0.025 200
n = 200 临界值(s): z 1.96 决策:Z=-2.83〈-1.96
拒绝 H0
.025
2
拒绝 H0
为原假设H0。或者说,把希望(想要)证 明的假设作为备择假设 3. 先确立备择假设H1
单侧检验
(原假设与备择假设的确定)
例如,采用新技术生产后,将会使产品的 使用寿命明显延长到1500小时以上
• 属于研究中的假设 • 建立的原假设与备择假设应为

H0: 1500 H1: 1500
例如,改进生产工艺后,会使产品的废品
.025
拒绝H0
结论:
在5%显著水平下表明新机床
-1.96 0 1.96 Z
加工的零件的椭圆度与以前有 显著差异
总体方差已知时的均值检验 (单尾 Z 检验)
均值的单尾 Z 检验
(2 已知)
1. 假定条件
总体服从正态分布 若不服从正态分布,可以用正态分布来
近似 (n30)
2. 备择假设有<或>符号 3. 使用z-统计量
被称为显著性水平
2. 第二类错误(取伪错误)
– 原假设为假时接受原假设 – 第二类错误的概率为(Beta)
假设检验中的两类错误
(决策结果)
H0: 无罪 假设检验就好像一场审判过程
统计检验过程
陪审团审判
H0 检验
裁决 无罪
实际情况
无罪
有罪
正确
错误
决策 接受H0
实际情况
H0为真 1-
H0为假
第二类错 误()
个错误的原假设的概率,这个概率被称为检验 能力,也被称为检验的势或检验的功效(power) 3. 可解释为正确地拒绝一个错误的原假设的概率
双侧检验和单侧检验
双侧检验与单侧检验 (假设的形式)
假设
研究的问题 双侧检验 左侧检验 右侧检验
H0
= 0
0
0
H1
≠0
< 0
> 0
双侧检验
(原假设与备择假设的确定)
均值的单尾Z检验
(计算结果)
H0: 1000
检验统计量:
H1: < 1000 = 0.05 n = 100
z x 0 960 1000 2 n 20 100
临界值(s): z 1.645 决策:Z=-2〈-1.645
拒绝域
拒绝H0
结论:
-1.645 0
在5%显著水平下,这批灯泡
z x 0 ~ N (0,1) n
均值的单尾 Z 检验
(提出假设)
左侧:H0: 0 H1:< 0 右侧:H0: 0 H1: > 0
拒绝 H0
拒绝 H0
0
Z
必须是显著地 低于 0,大
的值满足H0 ,不能拒绝
0
Z
必须显著地大于0,小的
值满足 H0 ,不能拒绝
均值的单尾Z检验
(实例)
【例】某批发商欲从生产厂家购进一批灯泡, 根据合同规定,灯泡的使用寿命平均不能低于 1000小时。已知灯泡使用寿命服从正态分布, 标准差为20小时。在总体中随机抽取100只灯 泡,测得样本均值为960小时。批发商是否应该 购买这批灯泡? (=0.05)
– 总体参数包括总体均值、
比例、方差等
– 分析之前必需陈述
我认为我们班统计学 成绩平均是75分
什么是假设检验?
1. 概念
– 事先对总体参数或分布形式作出某种假设 – 然后利用样本信息来判断原假设是否成立
2. 类型
– 参数假设检验 – 非参数假设检验
3. 特点
– 采用逻辑上的反证法 – 依据统计上的小概率原理
双侧检验
(显著性水平与拒绝域 )
抽样分布
拒绝域 /2
1 - 接受域
置信水平 拒绝域 /2
临界值
H0值
样本统计量 临界值
双侧检验
(显著性水平与拒绝域 )
抽样分布
拒绝域 /2
1 - 接受域
置信水平 拒绝域 /2
临界值
H0值 临界值 样本统计量
双侧检验
(显著性水平与拒绝域 )
抽样分布
拒绝域 /2
1 - 接受域
2. 步骤
– 从统计角度陈述问题 ( = 4) – 从统计角度提出相反的问题 ( 4)
必需互斥和穷尽
– 提出原假设 ( = 4) – 提出备择假设 ( 4)
有 符号
双侧检验
(例子)
该企业生产的零件平均长度是4厘米吗? (属于决策中的假设)
提出原假设: H0: = 4 提出备择假设: H1: 4
影响 Байду номын сангаас错误的因素
1. 总体参数的真值
随着假设的总体参数的减少而增大
2. 显著性水平
当 减少时增大
3. 总体标准差
当 增大时增大
4. 样本容量 n
当 n 减少时增大
检验能力
(power of test)
1. 拒绝一个错误的原假设的能力
2. 根据 的定义, 是指没有拒绝一个错误的原 假设的概率。这也就是说,1- 则是指拒绝一
什么是原假设?(Null Hypothesis)
1. 待检验的假设,又称“0假设”
2. 如果错误地作出决策会导致一系列后果
3. 总是有等号 , 或
4. 表示为 H0
– H0: 某一数值
– 指定为 = 号, 或
为什么叫 0假设
– 例如, H0: 3190(克)
提出原假设和备择假设
均值的双尾 Z 检验 (2 已知)
1. 假定条件
– 总体服从正态分布
– 若不服从正态分布, 可用正态分布来近似 (n30)
2. 原假设为:H0: =0;备择假设 为:H1: 0
3. 使用z-统计量
z x 0 ~ N (0,1) n
均值的双尾 Z 检验
(实例)
【例】某机床厂加工一种零件,根据经验知道, 该厂加工零件的椭圆度近似服从正态分布,其总 体 均 值 为 0 = 0 . 0 8 1 mm , 总 体 标 准 差 为 = 0.025 。今换一种新机床进行加工,抽取n=200 个零件进行检验,得到的椭圆度为0.076mm。 试问新机床加工零件的椭圆度的均值与以前有无 显著差异?(=0.05)
基本思想
•小概率原理:如果对总体的某种假设是真实的,那么不利于 或不能支持这一假设的事件A(小概率事件) 在一次试验中几乎不可能发生的;要是在一次 试验中A竟然发生了,就有理由怀疑该假设的 真实性,拒绝这一假设。
总体
抽样
(某种假设)
检验
(接受)
小概率事件 未发生
样本 (观察结果)
(拒绝) 小概率事件 发生
置信水平 拒绝域 /2
临界值
H0值 临界值
样本统计量
双侧检验
(显著性水平与拒绝域 )
抽样分布
拒绝域 /2
1 - 接受域
置信水平 拒绝域 /2
临界值
H0值 临界值
样本统计量
单侧检验
(原假设与备择假设的确定)
检验研究中的假设
1. 将所研究的假设作为备择假设H1 2. 将认为研究结果是无效的说法或理论作
Z
的使用寿命低于1000小时
均值的单尾Z检验
(实例)
【例】根据过去大量资料,某厂生产的灯泡
的使用寿命服从正态分布N~(1020,1002)。 现从最近生产的一批产品中随机抽取16只, 测得样本平均寿命为1080小时。试在0.05 的显著性水平下判断这批产品的使用寿命是否 有显著提高?(=0.05)
1. 双侧检验属于决策中的假设检验。也就是说,
不论是拒绝H0还是接受H0,我们都必需采 取相应的行动措施
2. 例如,某种零件的尺寸,要求其平均长度为
10厘米,大于或小于10厘米均属于不合格
3. 建立的原假设与备择假设应为
H0: 10 H1: 10
双侧检验
(确定假设的步骤)
1. 例如问题为: 检验该企业生产的零件 平均长度为4厘米
1. 是大样本还是小样本 2. 总体方差已知还是未知
3. 检验统计量的基本形式为
标准化检验统计量
点估计量 — 假设值 点估计量的抽样标准差
规定显著性水平
什么是显著性水平? 1. 是一个概率值 2. 原假设为真时,拒绝原假设的概率
– 被称为抽样分布的拒绝域
3. 表示为 (alpha)
– 常用的 值有0.01, 0.05, 0.10
4. 由研究者事先确定
作出统计决策
1. 计算检验的统计量
2. 根据给定的显著性水平,查表得出相应 的临界值Z或Z/2
3. 将检验统计量的值与 水平的临界值进
行比较 4. 得出接受或拒绝原假设的结论
假设检验中的两类错误 (决策风险)
假设检验中的两类错误
1. 第一类错误(弃真错误)
– 原假设为真时拒绝原假设 – 会产生一系列后果 – 第一类错误的概率为
率降低到2%以下
• 属于研究中的假设 • 建立的原假设与备择假设应为

H0: 2% H1: 2%
单侧检验
(原假设与备择假设的确定)
检验某项声明的有效性
1. 将所作出的说明(声明)作为原假设 2. 对该说明的质疑作为备择假设 3. 先确立原假设H0
– 除非我们有证据表明“声明”无效,否则 就应认为该“声明”是有效的
单侧检验
(原假设与备择假设的确定)
例如,某灯泡制造商声称,该企业所生 产的灯泡的平均使用寿命在10000小时 以上
▪ 除非样本能提供证据表明使用寿命在 10000小时以下,否则就应认为厂商的 声称是正确的
▪ 建立的原假设与备择假设应为 H0: 10000 H1: 10000
单侧检验
(例子)
一个总体的检验
一个总体
均值
比例
方差
Z 检验
t 检验
Z 检验
(单尾和双尾) (单尾和双尾) (单尾和双尾)
2检验
(单尾和双尾)
检验的步骤
陈述原假设 H0 陈述备择假设 H1 选择显著性水平 选择检验统计量
选择n
给出临界值 搜集数据 计算检验统计量 进行统计决策 表述决策结果
总体方差已知时的均值检验
什么是备择假设?(Alternative Hypothesis)
1. 与原假设对立的假设 2. 总是有不等号: , 或 3. 表示为 H1
– H1: <某一数值,或 某一数值 – 例如, H1: < 3910(克),或 3910(克)
确定适当的检验统计量
什么检验统计量? 1. 用于假设检验问题的统计量 2. 选择统计量的方法与参数估计相同,需考虑
单侧检验
(显著性水平与拒绝域 )
抽样分布
拒绝域
1 - 接受域
置信水平
临界值
H0值
样本统计量
左侧检验
(显著性水平与拒绝域 )
抽样分布
置信水平
拒绝域
1 - 接受域
临界值
H0值
样本统计量
观察到的样本统计量
左侧检验
(显著性水平与拒绝域 )
抽样分布
拒绝域
1 - 接受域
置信水平
临界值
H0值
样本统计量
右侧检验
有罪
错误
正确
拒绝H0
第一类错 误()
功效(1-)
错误和 错误的关系
和的关系就像 翘翘板,小就 大, 大就小
你不能同时减 少两类错误!
基本原则:力求在控制α前提下减少β
α—显著性水平,取值:0.1, 0.05, 0.01等
如果犯I类错误损失更大,为减少损失,α值取 小;
如果犯II类错误损失更,α值取大。
该批产品的平均使用寿命超过10000小时吗? (属于检验声明的有效性,先提出原假设)
提出原假设: H0: 10000 选择备择假设: H1: 10000
单侧检验
(例子)
学生中经常上网的人数超过25%吗?
(属于研究中的假设,先提出备择假设)
提出原假设: H0: 25 选择备择假设: H1: : 25
相关文档
最新文档