第5章 假设检验
计量经济学第5章假设检验

假设检验中的小概率原理
假设检验中的小概率原理
什么小概率? 1. 在一次试验中,一个几乎不可能发生的事
件发生的概率 2. 在一次试验中小概率事件一旦发生,我们
就有理由拒绝原假设 3. 小概率由研究者事先确定
5-17
假设检验中的小概率原理
由以往的资料可知,某地新生儿的平均体重为3190克,从今年的新生儿中随机 抽取100个,测得其平均体重为3210克,问今年新生儿的平均体重是否为 3190克(即与以往的体重是否有显著差异)?
决策:
在 = 0.05的水平上拒绝H0
结论:
有证据表明新机床加工的零件 的椭圆度与以前有显著差异
5-56
2 已知均值的检验
(P 值的计算与应用)
第1步:进入Excel表格界面,选择“插入”下拉菜单 第2步:选择“函数”点击 第3步:在函数分类中点击“统计”,在函数名的菜单下选
与原假设对立的假设 表示为 H1
5-12
确定适当的检验统计量
什么检验统计量?
1.用于假设检验决策的统计量 2.选择统计量的方法与参数估计相同,需考虑
是大样本还是小样本 总体方差已知还是未知
检验统计量的基本形式为 Z X 0 n
5-13
规定显著性水平(significant level)
(P-value)
1. 是一个概率值
2. 如果原假设为真,P-值是抽样分布中大
于或小于样本统计量的概率
左侧检验时,P-值为曲线上方小于等于检
验统计量部分的面积
右侧检验时,P-值为曲线上方大于等于检
验统计量部分的面积
3. 被称为观察到的(或实测的)显著性水平
5-44
双侧检验的P 值
第5章 假设检验

计量经济学讲义
22
读者或许发现:前面讨论的置信系数( 1- a) 就是1减去“犯第一类错误的概率a”,因此, 95%的置信系数表示接受零假设犯第一类 错误的概率至多为5%。 简言之, 5%的置信水平与95%的置信系数 的意义相同。
2011-2-22
计量经济学讲义
23
2011-2-22
计量经济学讲义
0 0
2011-2-22
计量经济学讲义
21
假设检验的标准或古典方法是:给定某一 水平的a,比如0 . 0 1或0 . 0 5,然后使检 验的功效最大,也即使b最小。这个求解过 程很复杂,有兴趣的同学可以参阅有关参 考书。 需要指出的是:在实际中,古典方法仅仅 给出了a值,而没有过多考虑b值。
2011-2-22
24
2011-2-22
计量经济学讲义
25
显著性检验
2011-2-22
计量经济学讲义
26
显著性检验
显著性检验(test of significance approach) 是一种两者择一的假设检验,但它却是完 备的。 显著性检验是一种较为简洁的假设检验方 法。 我们仍通过P/E一例说明这种检验方法的一 些基本要点。
2011-2-22 计量经济学讲义 36
显著水平的选择与p值
2011-2-22
计量经济学讲义
37
显著水平的选择与p值
假设检验的古典方法的不足之处在于选择a 的任意性。虽然一般常用的a值有1%、5% 和1 0%,但是这些值并不是固定不变的。 前面指出,只有在检查犯第一类错误和第 二类错误后果的时候,才选择相应的a 。 在实践中,最好是用p值(即,概率值),p 值(p value)也称为统计量的精确置信水平。 它可定义为拒绝零假设的最低置信水平。
第五章-假设检验与回归分析

件,得到拒绝域;
步骤 4:明确或计算样本均值 x ,得到U 变量的观测值 u x 0 n 0
若观测值 u 落入拒绝域,则拒绝零假设 H 0 ,即接受备择假设 H1 ,
否则不能拒绝零假设 H 0 。
第五章 假设检验与回归分析 例1、 已知某面粉自动装袋机包装面粉,每袋面粉重量 Xkg
服从正态分布 N(25,0.02) ,长期实践表明方差 2 比较稳定,从
第五章 假设检验与回归分析
U 检验的步骤:
步骤 1:提出零假设 H 0 : 0 与备择假设 H1 ;
步骤 2:明确所给正态总体标准差 0 值、样本容量 n 的
值,当零假设 H 0 成立时,构造变量
U X 0 n ~ N(0,1) 0
第五章 假设检验与回归分析
步骤 3:由所给检验水平 的值查标准正态分布表求出对应 的双侧分位数 u 的值或上侧分位数 u 的值,构造小概率事
u
2
0.05, u 1.96 ,
2
第五章 假设检验与回归分析
x 0 n
12.5 12 1 100
5 u
2
1.96
故拒绝 H0 ,即认为产品平均质量有显著变化。
小结与提问:
理解假设检验的基本原理、概念;掌握假设检验的步骤。
课外作业:
P249 习题五 5.01, 5.02,5.03。
0.10,再在表中第一列找到自由度 m n 1 7 1 6 ,
其纵横交叉处的数值即为对应的 t 分布双侧分位数 t 1.943
2
,使得概率等式
PT 1.943 0.10
成立。这说明事件 T 1.943是一个小概率事件,于是得到
拒绝域
t 1.943
第五章 假设检验与回归分析
第5章 假设检验

两类错误与显著性水平
两类错误
假设检验的依据是:小概率事件在一次试验中
很难发生. 但“很难发生”不等于“不发生”, 因而 假 假设检验是由局部推断总体,并且 设检验所作出的结论有可能是错误的. 这种错误
是在给定检验水平的前提下进行 有两类: (1)推断,接受还是拒绝原假设完全取 当原假设H0为真, 观察值却落入拒绝域, 而 决于样本值, 因此所作检验可能导 作出了拒绝H0的判断, 称为第Ⅰ类错误, 又叫弃真 致两类错误的产生
小 结
•构造一个统计量来决定是“接受原假设,拒绝备选假 设”,还是“拒绝原假设,接受备选假设”。
•对不同的问题,要选择不同的检验统计量。检验统计 量确定后,就要利用该统计量的抽样分布以及由实际 问题中所确定的显著性水平,来进一步确定检验统计 量拒绝原假设的取值范围,即拒绝域:
– 在给定的显著性水平α下,检验统计量的可能取值范围被 分成两部分:小概率区域与大概率区域。小概率区域就是 概率不超过显著性水平α的区域,是原假设的拒绝区域; 大概率区域是概率为1-α的区域,是原假设的接受区域。
检验统计量与拒绝域
检验统计量
(test statistic)
1. 根据样本观测结果计算得到的,并据以对 检验统计量实际上是总体参数的点估计量, 原假设和备择假设作出决策的某个样本统 由于其随机性,需要进行标准化后,才能用 计量 作检验的标准,以反映点估计量与假设的总体
参数相比,相差多少个标准差 2. 对样本估计量的标准化结果 – 原假设H0为真
–
H0 :μ = 某一数值
指定为符号 ≤, =或≥ – 例如, H0 :μ =10cm
–
备择假设
(alternative hypothesis)
统计学导论 科学出版社 第五章 假设检验

右侧检验
或
H1 : µ > µ0
H1 : µ > µ0
确定适当的检验统计量
什么检验统计量? 什么检验统计量?
用于假设检验问题的统计量 选择统计量的方法与参数估计相同, 选择统计量的方法与参数估计相同,需考虑
是大样本还是小样本 总体方差已知还是未知
检验统计量的基本形式为
z= x − µ0
σ
n
选择显著性水平α,确定临界值
☺
☺ ☺ ☺ ☺ ☺ ☺ ☺ ☺
抽取随机样本
均值 ☺ ☺ X = 20
假设检验的基本思想
抽样分布
这个值不像我 们应该得到的 样本均值 ... ... 因此我们拒 绝假设 µ = 50
... 如果这是总 体的真实均值 20
µ = 50 H0
样本均值
假设检验应用举例
例1:抽样检验食品包装机工作是否正常 : 例2:由样本推断产品次品率是否超标 : 例3:研究黑人儿童是否有民族意识 : 例4:检验电池寿命波动性是否有显著变化 : 5: 例5:判断男女职工看电视时间是否有显著差异 例6:检验新工艺是否比旧工艺更好 : 例7:研究生活习惯是否影响血压 : 例8:检验两次地震间的天数是否服从指数分布 : 例9:比较两公司进货次品率,作出进货决策 :比较两公司进货次品率,
3、特点 、
采用逻辑上的反证法 依据统计上的小概率原理
第一节 假设检验的基本原理
一. 假设检验的一般思想 二. 假设检验的步骤 三. 假设检验的两类错误
假设检验的过程
(提出假设→抽取样本→作出决策) 提出假设→抽取样本→作出决策)
提出假设 作出决策
拒绝假设! 拒绝假设 别无选择. 别无选择
总体
(05)第5章 假设检验1

临界值: t0.05(35)=1.6896
拒绝H0
0.05
检验统计量:
t x 0 5275 5200 3.75
s / n 120 36
t0.05 (35) 1.6896
决策:拒绝H0 结论: 改良后的新品种产量有显著 提高
6 - 33 0 1.6896 z
6-7
统计学
STATISTICS
一个假设检验的例子
P112—【例3.33】
一个汽车电池制造商声称其最好的电池寿命的分布 为均值54个月,标准差为6个月。假设某一消费 组织决定购买50个这种电池作为样本检验电池的 寿命,以核实这一声明。
(1)假设这个制造商之所言是真实的,试描 述这50个电池样本的平均寿命的抽样分布。
STATISTICS
5.1 假设检验的基本原理
一、假设的陈述 二、显著性水平 三、统计量与拒绝域 四、利用P值进行决策
统计学
STATISTICS
5.1.1 假设的陈述
现实生活中,人们经常要对某个“假设”作出判断, 确定它是真的还是假的。在研究领域,研究者在 检验一种新的理论时,首先要提出一种自己认为 是正确的看法,即假设。
1 (1.53) 1 0.9370 0.0630
说明在显著性水平为0.05下不能判定汽车电池的 平均寿命不到54个月。但在显著性水平为0.1下可 以判定汽车电池的平均寿命不到54个月。
6 - 12
统计学
STATISTICS
原假设与备择假设
统计学
STATISTICS
原假设
(null hypothesis)
备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
《统计学》第5章 假设检验

假设不成立时,即拒绝原假设时备以选择的假设,通常用H1 表示。备择
假设和原假设互斥,如在例5.1中,原假设是“2022 年全国城市平均
PM2.5 浓度与2018 年相比没有显著差异”,那么备择假设就是“2022
年全国城市平均PM2.5 浓度与2018 年相比存在显著差异”。相应的统计
小越好。但是,在一定的样本容量下,减少犯第I类错误的概率,就会
使犯第II类错误的概率增大;减少犯第II类错误的概率,会使犯第I类
错误的概率增大。增加样本容量可以使犯第I类错误的概率和犯第II类
错误的概率同时减小,然而现实中资源总是有限的,样本量不可能没有
限制。因此,在给定的样本容量下,必须考虑两类可能的错误之间的权
易被否定,若检验结果否定了原假设,则说明否定的理由是充分的。
第四章 参数估计
《统计学》
16
5.1 假设检验的基本原理
(四) P值法
假设检验的另一种常用方法是利用P值(P-value) 来确定检验决策。P值
指在原假设0 为真时,得到等于样本观测结果或更极端结果的检验统计
量的概率,也被称为实测显著性水平。P值法的决策规则为:如果P值大
1.96) 中。这里−1.96和1.96 称为临界值,区间(−1.96, 1.96) 两侧的
区域则被称为拒绝域。基于样本信息,可以计算得到相应的z检验统计量
值,已知ҧ = 46,0 = 53, = 14 , n = 100 = −5
14/10
第四章 参数估计
《统计学》
14
5.1 假设检验的基本原理
犯第I 类(弃真) 错误的概率 也称为显著性水平(Significance level),
第五章 假设检验(1)

关于平均数差异的显著性检验
一、两个总体都是正态分布,两个总体方差都已知。 (一)两个样本相互独立:(独立样本的Z检验) (二)两个相关样本:(相关样本的Z检验) 二、两个总体都是正态分布,两总体方差都未知。 (一)两个样本相互独立: 1.两个总体方差一致(独立样本的t检验) 2.两个总体方差不等,(柯克兰--柯克斯检验) (二)两个相关样本: 1.相关系数未知(相关样本的t检验) 2.相关系数已知(相关样本的t检验)
总体平均数的假设检验例题2
某心理学家认为一般司机的视反应时平均175毫 秒,有人随机抽取36名汽车司机作为研究样本进 行了测定,结果平均值为180毫秒,标准差25毫秒. 能否根据测试结果否定该心理学家的结论.(假定 人的视反应时符合正态分布)
X
总体平均数的假设检验例题3
某省进行数学竞赛,结果分数的分布不是正态, 总平均分43.5.其中某县参加竞赛的学生 168人,平均分45.1,标准差18.7,该县平均分 与全省平均分有否显著差异?
课堂练习4
医学上测定,正常人的血色素应该是每100毫升13克, 某学校进行抽查,37名学生血色素平均值为12.1克/ 毫升,标准差是1.5克/毫升,试问该校学生的血色素 是否显著低于正常值 ?
课堂练习5
12名被试作为实验组,经过训练后测量深度知觉,结 果误差的平均值为4厘米,标准差为2厘米;另外12名 被试作为控制组不加任何训练,测量结果,误差的平 均值为6.5厘米,标准差为2.5厘米,问训练是否明显 减小了深度知觉的误差?
例
某数学教育家随机抽取49名高一学生进行 ****教学法的教学改革实验研究。已知这些 学生原来所在的总体数学的平均水平为80分, 标准差为10分。经过一学期的教学改革实验 之后,这49名学生在统考中的数学平均成绩 为83分。问:教学改革是否改变了学生的数 学水平。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章、假设检验
思考题
1.1.理解原假设与备择假设的含义,并归纳常见的几种建立原假设与备择假设的原则.
答:原假设通常是研究者想收集证据予以反对的假设;而备择假设通常是研究者想收集证据予以支持的假设。
建立两个假设的原则有:
(1)原假设和备择假设是一个完备事件组。
(2)一般先确定备择假设。
再确定原假设。
(3)等号“=”总是放在原假设上。
(4)假设的确定带有一定的主观色彩。
(5)假设检验的目的主要是收集证据来拒绝原假设。
2.第一类错误和第二类错误分别是指什么?它们发生的概率大小之间存在怎样的关系?
答:第I类错误指,当原假设为真时,作出拒绝原假设所犯的错误,其概率为α。
第II类错误指当原假设为假时,作出接受原假设所犯的错误,其概率为β。
在其他条件不变时,α增大,β减小;β增大,α减小。
3.什么是显著性水平?它对于假设检验决策的意义是什么?
答:假设检验中犯第一类错误的概率被称为显著性水平。
显著性水平通常是人们事先给出的一个值,用于检验结果的可靠性度量,但确定了显著性水平等于控制了犯第一错误的概率,但犯第二类错误的概率却是不确定的,因此作出“拒绝原假设”的结论,其可靠性是确定的,但作出“不拒绝原假设”的结论,其可靠性是难以控制的。
4.什么是p值?p值检验和统计量检验有什么不同?
答:p值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。
P值常常作为观察到的数据与原假设不一致程度的度量。
统计量检验采用事先确定显著性水平α,来控制犯第一类错误的上限,p
值可以有效地补充α提供地关于检验可靠性的有限信息。
p值检验的优点在于,
它提供了更多的信息,让人们可以选择一定的水平来评估结果是否具有统计上的显著性。
5.什么是统计上的显著性?
答:一项检验在统计上是显著的(拒绝原假设),是指这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的。
显著性的意义在于“非偶然的
练习题
3.解(1)第一类错误是,供应商提供的炸土豆片的平均重量不低于60克,但店方拒收并投诉。
(2)第二类错误是,供应商提供的炸土豆片的平均重量低于60克,但店方没有拒收。
(3)顾客会认为第二类错误很严重,而供应商会将第一类错误看得较严重。
4.解:提出假设 02:6,:6H H μμ≤>
已知 1.19,100,0.05n σα===
(1)
检验统计量为()60,1a x Z N σ
-= (2) 拒绝规则是:若Z z α>,拒绝0H ;否则,不拒绝0H
(3) 由 6.35x =
得:0.056.356 2.94 1.64Z z -==>=,拒绝0H ,认为改进工艺能提高其平均强度。
5解: 设μ为如今每个家庭每天收看电视的平均时间(小时)
需检验的假设为:01: 6.70,: 6.70H H μμ≤ 调查的样本为:200,7.25, 2.5n x s ===
大样本下检验统计量为:0.55*14.14 3.112.5x z ==== 在0.01的显著性水平下,右侧检验的临界值为0.01 2.33z =
因为 2.33z >,拒绝0H ,可认为如今每个家庭每天收看电视的平均时间增加了
6. 解:提出假设 2222201:0.75,:0.75TV VCR TV H H σσσ≤=>
已知:230,2,0.05n s α===
检验统计量()()2220.0522129*21032942.5570.75
VCR n s χχσ-===>= 拒绝0H ,可判定电视使用寿命的方差显著大于VCR
7. 解:提出假设:012112:5,:5H H μμμμ-=-≠
120.02,100,50n n α===,独立大样本,则检验统计量为:
514.810.45 5.1458x x z ----===- 而0.01z =2.33 因为/2z z α>,拒绝0H ,平均装配时间之差不等于5分钟
8. 解:匹配小样本 提出假设:01:,:a b a b H H μμμμ≤> 由计算得:0.625, 1.302,8,0.05d d s n α===
=,检验统计量为
()0.051.35777 1.8946d t t ===<=,不拒绝0H ,不能认为广告提高了潜在购买力的平均得分。
9. 解:提出假设:012112:,:H H ππππ≥<
已知:1122197301288,0.684,367,0.82,0.1288367
n p n p α======= 大样本,则检验统计量为: 112212288*0.684367*0.820.76288367
p n p n p n n ++===++
4.0476z =
==- 而0.1 1.29z =,因为0.1z z <-,拒绝0H ,可认为信息追求者消极度假的比率显著小于非信息追求者。
10. 解:提出假设:2222012112
:,:H H σσσσ=≠ 由题计算得:112225,0.221,22,0.077n s n s ====
检验统计量为:22
12220.2218.23760.077
s F s ===,而()0.02524,21 2.37F = ()/2121,1F F n n α>--,所以拒绝0H ,认为两种机器的方差存在显著差异。