第5章 假设检验
合集下载
计量经济学第5章假设检验

5-15
假设检验中的小概率原理
假设检验中的小概率原理
什么小概率? 1. 在一次试验中,一个几乎不可能发生的事
件发生的概率 2. 在一次试验中小概率事件一旦发生,我们
就有理由拒绝原假设 3. 小概率由研究者事先确定
5-17
假设检验中的小概率原理
由以往的资料可知,某地新生儿的平均体重为3190克,从今年的新生儿中随机 抽取100个,测得其平均体重为3210克,问今年新生儿的平均体重是否为 3190克(即与以往的体重是否有显著差异)?
决策:
在 = 0.05的水平上拒绝H0
结论:
有证据表明新机床加工的零件 的椭圆度与以前有显著差异
5-56
2 已知均值的检验
(P 值的计算与应用)
第1步:进入Excel表格界面,选择“插入”下拉菜单 第2步:选择“函数”点击 第3步:在函数分类中点击“统计”,在函数名的菜单下选
与原假设对立的假设 表示为 H1
5-12
确定适当的检验统计量
什么检验统计量?
1.用于假设检验决策的统计量 2.选择统计量的方法与参数估计相同,需考虑
是大样本还是小样本 总体方差已知还是未知
检验统计量的基本形式为 Z X 0 n
5-13
规定显著性水平(significant level)
(P-value)
1. 是一个概率值
2. 如果原假设为真,P-值是抽样分布中大
于或小于样本统计量的概率
左侧检验时,P-值为曲线上方小于等于检
验统计量部分的面积
右侧检验时,P-值为曲线上方大于等于检
验统计量部分的面积
3. 被称为观察到的(或实测的)显著性水平
5-44
双侧检验的P 值
假设检验中的小概率原理
假设检验中的小概率原理
什么小概率? 1. 在一次试验中,一个几乎不可能发生的事
件发生的概率 2. 在一次试验中小概率事件一旦发生,我们
就有理由拒绝原假设 3. 小概率由研究者事先确定
5-17
假设检验中的小概率原理
由以往的资料可知,某地新生儿的平均体重为3190克,从今年的新生儿中随机 抽取100个,测得其平均体重为3210克,问今年新生儿的平均体重是否为 3190克(即与以往的体重是否有显著差异)?
决策:
在 = 0.05的水平上拒绝H0
结论:
有证据表明新机床加工的零件 的椭圆度与以前有显著差异
5-56
2 已知均值的检验
(P 值的计算与应用)
第1步:进入Excel表格界面,选择“插入”下拉菜单 第2步:选择“函数”点击 第3步:在函数分类中点击“统计”,在函数名的菜单下选
与原假设对立的假设 表示为 H1
5-12
确定适当的检验统计量
什么检验统计量?
1.用于假设检验决策的统计量 2.选择统计量的方法与参数估计相同,需考虑
是大样本还是小样本 总体方差已知还是未知
检验统计量的基本形式为 Z X 0 n
5-13
规定显著性水平(significant level)
(P-value)
1. 是一个概率值
2. 如果原假设为真,P-值是抽样分布中大
于或小于样本统计量的概率
左侧检验时,P-值为曲线上方小于等于检
验统计量部分的面积
右侧检验时,P-值为曲线上方大于等于检
验统计量部分的面积
3. 被称为观察到的(或实测的)显著性水平
5-44
双侧检验的P 值
管理统计学:第5章_假设检验

华南理工大学精品课程
统计显著性
3. 一项检验在统计上是“显著的”,意思是指: 这样的(样本)结果不是偶然得到的,或者说, 不是靠机遇能够得到的。
– 拒绝原假设,表示这样的样本结果并不是
偶然得到的;不拒绝原假设(拒绝原假设的 证据不充分) ,则表示这样的样本结果只 是偶然得到的。
华南理工大学精品课程
解:研究者抽检的意图是倾向于证
实这种洗涤剂的平均净含量并不符
绿叶 洗涤剂
合说明书中的陈述。建立的原假设
和备择假设为
H0 : 500
华南理工大学精品课程
H1 : < 500
500g
例题分析
【例】一家研究机构估计,某城市中家庭拥有汽车 的比例超过30%。为验证这一估计是否正确,该 研究机构随机抽取了一个样本进行检验。试陈 述用于检验的原假设与备择假设。
华南理工大学精品课程
双侧检验与单侧检验
假设 原假设
表5-1 假设检验的基本形式
双侧检验
单侧检验 左侧检验 右侧检验
H0 : μ =μ0 H0: 0 H0: 0
备择假设 H1 :μ≠μ0 H1: μ<μ0 H1 :μ>μ0
华南理工大学精品课程
2、两类错误与显著性水平
假设检验中的两类错误 1. 第Ⅰ类错误(弃真错误)
解:研究者想收集证据予以证明 的假设应该是“生产过程不正常 ”。建立的原假设和备择假设为
H0 : 10cm H1 : 10cm
华南理工大学精品课程
例题分析
【例】某品牌洗涤剂在它的产品说明书中声称:平 均净含量不少于500g。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设
统计显著性
3. 一项检验在统计上是“显著的”,意思是指: 这样的(样本)结果不是偶然得到的,或者说, 不是靠机遇能够得到的。
– 拒绝原假设,表示这样的样本结果并不是
偶然得到的;不拒绝原假设(拒绝原假设的 证据不充分) ,则表示这样的样本结果只 是偶然得到的。
华南理工大学精品课程
解:研究者抽检的意图是倾向于证
实这种洗涤剂的平均净含量并不符
绿叶 洗涤剂
合说明书中的陈述。建立的原假设
和备择假设为
H0 : 500
华南理工大学精品课程
H1 : < 500
500g
例题分析
【例】一家研究机构估计,某城市中家庭拥有汽车 的比例超过30%。为验证这一估计是否正确,该 研究机构随机抽取了一个样本进行检验。试陈 述用于检验的原假设与备择假设。
华南理工大学精品课程
双侧检验与单侧检验
假设 原假设
表5-1 假设检验的基本形式
双侧检验
单侧检验 左侧检验 右侧检验
H0 : μ =μ0 H0: 0 H0: 0
备择假设 H1 :μ≠μ0 H1: μ<μ0 H1 :μ>μ0
华南理工大学精品课程
2、两类错误与显著性水平
假设检验中的两类错误 1. 第Ⅰ类错误(弃真错误)
解:研究者想收集证据予以证明 的假设应该是“生产过程不正常 ”。建立的原假设和备择假设为
H0 : 10cm H1 : 10cm
华南理工大学精品课程
例题分析
【例】某品牌洗涤剂在它的产品说明书中声称:平 均净含量不少于500g。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设
第五章-假设检验与回归分析

2
件,得到拒绝域;
步骤 4:明确或计算样本均值 x ,得到U 变量的观测值 u x 0 n 0
若观测值 u 落入拒绝域,则拒绝零假设 H 0 ,即接受备择假设 H1 ,
否则不能拒绝零假设 H 0 。
第五章 假设检验与回归分析 例1、 已知某面粉自动装袋机包装面粉,每袋面粉重量 Xkg
服从正态分布 N(25,0.02) ,长期实践表明方差 2 比较稳定,从
第五章 假设检验与回归分析
U 检验的步骤:
步骤 1:提出零假设 H 0 : 0 与备择假设 H1 ;
步骤 2:明确所给正态总体标准差 0 值、样本容量 n 的
值,当零假设 H 0 成立时,构造变量
U X 0 n ~ N(0,1) 0
第五章 假设检验与回归分析
步骤 3:由所给检验水平 的值查标准正态分布表求出对应 的双侧分位数 u 的值或上侧分位数 u 的值,构造小概率事
u
2
0.05, u 1.96 ,
2
第五章 假设检验与回归分析
x 0 n
12.5 12 1 100
5 u
2
1.96
故拒绝 H0 ,即认为产品平均质量有显著变化。
小结与提问:
理解假设检验的基本原理、概念;掌握假设检验的步骤。
课外作业:
P249 习题五 5.01, 5.02,5.03。
0.10,再在表中第一列找到自由度 m n 1 7 1 6 ,
其纵横交叉处的数值即为对应的 t 分布双侧分位数 t 1.943
2
,使得概率等式
PT 1.943 0.10
成立。这说明事件 T 1.943是一个小概率事件,于是得到
拒绝域
t 1.943
第五章 假设检验与回归分析
件,得到拒绝域;
步骤 4:明确或计算样本均值 x ,得到U 变量的观测值 u x 0 n 0
若观测值 u 落入拒绝域,则拒绝零假设 H 0 ,即接受备择假设 H1 ,
否则不能拒绝零假设 H 0 。
第五章 假设检验与回归分析 例1、 已知某面粉自动装袋机包装面粉,每袋面粉重量 Xkg
服从正态分布 N(25,0.02) ,长期实践表明方差 2 比较稳定,从
第五章 假设检验与回归分析
U 检验的步骤:
步骤 1:提出零假设 H 0 : 0 与备择假设 H1 ;
步骤 2:明确所给正态总体标准差 0 值、样本容量 n 的
值,当零假设 H 0 成立时,构造变量
U X 0 n ~ N(0,1) 0
第五章 假设检验与回归分析
步骤 3:由所给检验水平 的值查标准正态分布表求出对应 的双侧分位数 u 的值或上侧分位数 u 的值,构造小概率事
u
2
0.05, u 1.96 ,
2
第五章 假设检验与回归分析
x 0 n
12.5 12 1 100
5 u
2
1.96
故拒绝 H0 ,即认为产品平均质量有显著变化。
小结与提问:
理解假设检验的基本原理、概念;掌握假设检验的步骤。
课外作业:
P249 习题五 5.01, 5.02,5.03。
0.10,再在表中第一列找到自由度 m n 1 7 1 6 ,
其纵横交叉处的数值即为对应的 t 分布双侧分位数 t 1.943
2
,使得概率等式
PT 1.943 0.10
成立。这说明事件 T 1.943是一个小概率事件,于是得到
拒绝域
t 1.943
第五章 假设检验与回归分析
第5章假设检验(1)

乙
0.7 –1.6 –0.2 –1.2 –0.1 3.4 3.7 0.8 0.0 2.0
哪种安眠药的疗效好?
⑵如果将试验方法改为对同一组10个病人,每人分别服用 甲、乙两种安眠药作对比试验,试验结果仍如上表,此时结 论如何?
思考
以上两种试验方法是否存在本质区别?
4
【案例 4】民意调查问题
在美国大选前,两个民意调查机构在各自独立进行的一 次民意调查中,分别各调查了1000个选民。其中甲样本中 候选人甲的支持率为51%,乙样本中候选人乙的支持率为 48%。
估计, 故应使用 X 来构造检验 的统计量。
可以证明,当 H0 为真时,统计量
t X 0 ~t (n-1)
S/ n
8
4. 给定一个小概率 ,称为显著性水平
显著性水平 是当 H0 为真时,检验结果拒绝 H0 的概率
(犯“弃真”错误的概率)。
也即当检验结果拒绝 H0 时,不犯错误的概率为 1-, 此时就可以有 1- 的可信度接受备择假设 H1。
思考
能否据此作出在全体选民中甲的支持率高于乙的
结论?
5
【案列5】如何选定财务预警指标?
如何建立有效的财务预警模型,是当前理论界和企业都非常关 注的一个热点课题。
要建立财务预警模型,首先就需要在众多财务指标中筛选出对 即将陷入财务危机的企业具有先期预兆的指标。
科学的研究方法:运用统计方法进行实证分析。 以下是可以运用的基本分析思路之一: ⑴确定危机企业的标准:如“破产”、“债务违约”、“ST” 等。 ⑵根据最近某年的数据,将上市公司分为“危机企业”和“非 危机企业”(最好分行业)两类样本。 ⑶对每一个要分析的财务指标,比较之前若干年(1~3年)两类 企业该指标的平均值之间是否存在显著差异。 ⑷若存在显著差异,说明该指标对即将陷入财务危机的企业具 有先期预报功能,可以作为财务预警模型中的变量;否则就不能 作为财务预警模型中的变量。
第5章 假设检验

两类错误与显著性水平
两类错误
假设检验的依据是:小概率事件在一次试验中
很难发生. 但“很难发生”不等于“不发生”, 因而 假 假设检验是由局部推断总体,并且 设检验所作出的结论有可能是错误的. 这种错误
是在给定检验水平的前提下进行 有两类: (1)推断,接受还是拒绝原假设完全取 当原假设H0为真, 观察值却落入拒绝域, 而 决于样本值, 因此所作检验可能导 作出了拒绝H0的判断, 称为第Ⅰ类错误, 又叫弃真 致两类错误的产生
小 结
•构造一个统计量来决定是“接受原假设,拒绝备选假 设”,还是“拒绝原假设,接受备选假设”。
•对不同的问题,要选择不同的检验统计量。检验统计 量确定后,就要利用该统计量的抽样分布以及由实际 问题中所确定的显著性水平,来进一步确定检验统计 量拒绝原假设的取值范围,即拒绝域:
– 在给定的显著性水平α下,检验统计量的可能取值范围被 分成两部分:小概率区域与大概率区域。小概率区域就是 概率不超过显著性水平α的区域,是原假设的拒绝区域; 大概率区域是概率为1-α的区域,是原假设的接受区域。
检验统计量与拒绝域
检验统计量
(test statistic)
1. 根据样本观测结果计算得到的,并据以对 检验统计量实际上是总体参数的点估计量, 原假设和备择假设作出决策的某个样本统 由于其随机性,需要进行标准化后,才能用 计量 作检验的标准,以反映点估计量与假设的总体
参数相比,相差多少个标准差 2. 对样本估计量的标准化结果 – 原假设H0为真
–
H0 :μ = 某一数值
指定为符号 ≤, =或≥ – 例如, H0 :μ =10cm
–
备择假设
(alternative hypothesis)
统计学导论 科学出版社 第五章 假设检验

右侧检验
或
H1 : µ > µ0
H1 : µ > µ0
确定适当的检验统计量
什么检验统计量? 什么检验统计量?
用于假设检验问题的统计量 选择统计量的方法与参数估计相同, 选择统计量的方法与参数估计相同,需考虑
是大样本还是小样本 总体方差已知还是未知
检验统计量的基本形式为
z= x − µ0
σ
n
选择显著性水平α,确定临界值
☺
☺ ☺ ☺ ☺ ☺ ☺ ☺ ☺
抽取随机样本
均值 ☺ ☺ X = 20
假设检验的基本思想
抽样分布
这个值不像我 们应该得到的 样本均值 ... ... 因此我们拒 绝假设 µ = 50
... 如果这是总 体的真实均值 20
µ = 50 H0
样本均值
假设检验应用举例
例1:抽样检验食品包装机工作是否正常 : 例2:由样本推断产品次品率是否超标 : 例3:研究黑人儿童是否有民族意识 : 例4:检验电池寿命波动性是否有显著变化 : 5: 例5:判断男女职工看电视时间是否有显著差异 例6:检验新工艺是否比旧工艺更好 : 例7:研究生活习惯是否影响血压 : 例8:检验两次地震间的天数是否服从指数分布 : 例9:比较两公司进货次品率,作出进货决策 :比较两公司进货次品率,
3、特点 、
采用逻辑上的反证法 依据统计上的小概率原理
第一节 假设检验的基本原理
一. 假设检验的一般思想 二. 假设检验的步骤 三. 假设检验的两类错误
假设检验的过程
(提出假设→抽取样本→作出决策) 提出假设→抽取样本→作出决策)
提出假设 作出决策
拒绝假设! 拒绝假设 别无选择. 别无选择
总体
第五章 假设检验

6观察到的样本统计量 - 31
样本统计量
统计学
STATISTICS
显著性水平和拒绝域
(右侧检验 )
置信水平 拒绝H 拒绝H0
抽样分布
α
1-α
0
6 - 32
样本统计量 临界值
统计学
STATISTICS
决策规则
1. 给定显著性水平α,查表得出相应的临界 值zα或zα/2, tα或tα/2 2. 将检验统计量的值与α 水平的临界值进行 比较 3. 作出决策 双侧检验: 统计量I 临界值,拒绝H 双侧检验:I统计量I > 临界值,拒绝H0 左侧检验: 临界值,拒绝H 左侧检验:统计量 < -临界值,拒绝H0 右侧检验: 临界值,拒绝H 右侧检验:统计量 > 临界值,拒绝H0
6 - 23
统计学
STATISTICS
显著性水平和拒绝域 (双侧检验 )
置信水平 拒绝H 拒绝H0 1-α
抽样分布
拒绝H 拒绝H0
α/2
α/2
临界值
6 - 24
0
临界值
样本统计量
统计学
STATISTICS
显著性水平和拒绝域 (双侧检验 )
置信水平 拒绝H 拒绝H0 1-α
抽样分布
拒绝H 拒绝H0
H0:µ = 某一数值 指定为 = 号,即 ≤ 或 ≥ 例如, 3190( 例如, H0:µ = 3190(克)
6-9
统计学
STATISTICS
什么是备择假设 什么是备择假设
(alternative hypothesis)
1. 研究者想收集证据予以支持的假设 研究者想收集证据予以支持的假设 2. 也称“研究假设” 也称“研究假设” 3. 总是有符号 ≠, < 或 > 4. 表示为 H1 H1 : µ <某一数值,或µ >某一数值 某一数值, 例如, 例如, H1 : µ < 10cm,或µ >10cm 10cm, 10cm
样本统计量
统计学
STATISTICS
显著性水平和拒绝域
(右侧检验 )
置信水平 拒绝H 拒绝H0
抽样分布
α
1-α
0
6 - 32
样本统计量 临界值
统计学
STATISTICS
决策规则
1. 给定显著性水平α,查表得出相应的临界 值zα或zα/2, tα或tα/2 2. 将检验统计量的值与α 水平的临界值进行 比较 3. 作出决策 双侧检验: 统计量I 临界值,拒绝H 双侧检验:I统计量I > 临界值,拒绝H0 左侧检验: 临界值,拒绝H 左侧检验:统计量 < -临界值,拒绝H0 右侧检验: 临界值,拒绝H 右侧检验:统计量 > 临界值,拒绝H0
6 - 23
统计学
STATISTICS
显著性水平和拒绝域 (双侧检验 )
置信水平 拒绝H 拒绝H0 1-α
抽样分布
拒绝H 拒绝H0
α/2
α/2
临界值
6 - 24
0
临界值
样本统计量
统计学
STATISTICS
显著性水平和拒绝域 (双侧检验 )
置信水平 拒绝H 拒绝H0 1-α
抽样分布
拒绝H 拒绝H0
H0:µ = 某一数值 指定为 = 号,即 ≤ 或 ≥ 例如, 3190( 例如, H0:µ = 3190(克)
6-9
统计学
STATISTICS
什么是备择假设 什么是备择假设
(alternative hypothesis)
1. 研究者想收集证据予以支持的假设 研究者想收集证据予以支持的假设 2. 也称“研究假设” 也称“研究假设” 3. 总是有符号 ≠, < 或 > 4. 表示为 H1 H1 : µ <某一数值,或µ >某一数值 某一数值, 例如, 例如, H1 : µ < 10cm,或µ >10cm 10cm, 10cm
第5章_假设检验

面向21世纪 课程教材
第五章
假设检验
第二节
某研究者估计本市居民家庭电脑拥有率为30%。现随机调查了200个家庭,其 中68家拥有电脑。试问研究估计是否可信?( =10%) 提出假设:原假设:Ho:P=0.3; 备择假设:Ha:p≠0.3
样本比例 P=m/n=68/200=0.34 由于样本容量相当大,因此可近似采用Z检验法 p p0 0.34 0.3 z 1.194 p (1 p ) 0.34 0.66 n 200
面向21世纪 课程教材
第五章
假设检验
第二节
2.方差检验过程 (1)提出原假设Ho和备择假设Ha。
2 H0 : 2 0
2 Ha : 2 0
(2)构造检验统计量:
(n 1) s 2
2
~
2
(n-1)
2 2分布。 在Ho成立的条件下,统计量 服从自由度为n-1的
(3)确定显著性水平。 (4)规定决策规则。 在双侧检验的情况下,拒绝区域在两侧,如果检验统计量大于右侧临界 值,或小于左侧临界值,则拒绝原假设。若是单侧检验,拒绝区域分布 在一侧,具体左侧还是右侧,可根据备择假设Ha的情况而定。 (5)进行判断决策。
面向21世纪 课程教材
第五章
假设检验
第二节
某厂采用自动包装机分装产品,假定每包重量报从正态分 布,每包标准重量为1000克,某日随机抽查9包,测得样本 平均重量为986克,标准差为24克,试问在0.05的检验水平 上,能否认为这天自动包装机工作正常?
;H 根据题意,提出假设: H0 : 1000 1: 1000
面向21世纪 课程教材
第二节 总体均值、比例和 方差的假设检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计量经济学讲义
22
读者或许发现:前面讨论的置信系数( 1- a) 就是1减去“犯第一类错误的概率a”,因此, 95%的置信系数表示接受零假设犯第一类 错误的概率至多为5%。 简言之, 5%的置信水平与95%的置信系数 的意义相同。
2011-2-22
计量经济学讲义
23
2011-2-22
计量经济学讲义
0 0
2011-2-22
计量经济学讲义
21
假设检验的标准或古典方法是:给定某一 水平的a,比如0 . 0 1或0 . 0 5,然后使检 验的功效最大,也即使b最小。这个求解过 程很复杂,有兴趣的同学可以参阅有关参 考书。 需要指出的是:在实际中,古典方法仅仅 给出了a值,而没有过多考虑b值。
2011-2-22
24
2011-2-22
计量经济学讲义
25
显著性检验
2011-2-22
计量经济学讲义
26
显著性检验
显著性检验(test of significance approach) 是一种两者择一的假设检验,但它却是完 备的。 显著性检验是一种较为简洁的假设检验方 法。 我们仍通过P/E一例说明这种检验方法的一 些基本要点。
2011-2-22 计量经济学讲义 36
显著水平的选择与p值
2011-2-22
计量经济学讲义
37
显著水平的选择与p值
假设检验的古典方法的不足之处在于选择a 的任意性。虽然一般常用的a值有1%、5% 和1 0%,但是这些值并不是固定不变的。 前面指出,只有在检查犯第一类错误和第 二类错误后果的时候,才选择相应的a 。 在实践中,最好是用p值(即,概率值),p 值(p value)也称为统计量的精确置信水平。 它可定义为拒绝零假设的最低置信水平。
0
X
1
X
2011-2-22
计量经济学讲义
33
2011-2-22
计量经济学讲义
34
在实践中,是用置信区间法还是用显著性 检验法,主要是取决于个人的选择与习惯。 在置信区间方法中,我们对真实参数指定 一个似乎合理的区间值,并查明参数假设值 是落在该区间内还是落在区间外。 如果落在区间内,我们就不拒绝零假设, 但若落在区间外,则能够拒绝零假设。
2011-2-22
计量经济学讲义
5
假设检验
假设就是“为了调查或讨论的目的,我们 认为某件事是正确的”( w e b s t e r’s) 或是“基于某种原因之上的假定,或为了 进一步调查而基于某些已知事实的一个出 发点。”(牛津英汉词典)
2011-2-22
计量经济学讲义
6
继前面的例子:假设真实的u 取某一特定 值,比如u =1 3。现在我们的任务就是去 “检验”这个假设。
计量经济学讲义
12
置信区间法
根据表4 - 1提供的样本数据计算出样本均值为11 . 5。从 4 . 3节讨论中,我们知道样本均值服从均值为uX,方差为 o2/2的正态分布。但是由于真实的方差是未知的,所以用 样本方差来代替,在这种情况下,样本均值服从t分布, 见式( 4 - 3)。 根据t分布,我们得到uX的一个95%的置信区间: t 95%
2011-2-22 计量经济学讲义 32
单边检验(one-tail test)或双边检验(two-tail test) 在P/E一例中,H :u = 1 3,H :u < 1 3。 那么如何检验这个假设呢? 单边检验与前面讨论过的双边检验类似, 只是在单边检验中,仅仅需要决定统计量 单一的临界值,而不是两个临界值,
同样的原因,假定零假设H :u = 12,在这 种情况下,根据不等式( 4 - 7),我们应该 不拒绝这个零假设。
0 X
但是表4 - 1这个样本很可能不是来自均值 为12的正态总体。因而,我们会犯第二类 错误,也即取伪错误。
2011-2-22
计量经济学讲义
18
我们想尽可能减小这两种错误。但是,不 幸的是,对于任一给定样本,我们不可能 同时做到犯这两种错误的概率都很小。
2011-2-22
计量经济学讲义
19
解决这一问题的古典方法是假定在实际中 第一类错误比第二类错误更严重(由统计学 家Neyman和Pearson提出的)。 因此,先固定犯第一类错误的概率在一个 很低的水平上,比如说0 . 0 1或0 . 0 5,然 后在考虑如何减小犯第二类错误的概率。
2011-2-22
2011-2-22 计量经济学讲义 38
我们用一个例子来说明。已知,当自由度为2 0时, 计算得到t值为3 . 5 5 2。根据附录A中t分布表, 求出得此t值的概率值( p值)为0 . 0 01(单边的)或 0 . 0 0 2(双边的)。也即在0 . 0 0 1(单边)或( 0 . 0 0 2双边)水平下,t值是统计显著的。 在零假设:真实的P/E值为1 3下,我们得到t值为 -3 . 5。 P(t<-3 . 5)=0.000 5 这就是t统计量的p值。计量经济学讲义 Nhomakorabea20
犯第一类错误的概率通常用符号a表示,称 为显著水平, b犯第二类错误的概率用符 号表示。则: 第一类错误= a=犯弃真错误的概率 第二类错误= b=犯取伪错误的概率 不犯第二类错误的概率( 1- b);也就是说, 当H 为假时,拒绝H ,称为检验的功效 ( power of test)。
0 X
这是否意味着样本不是来自于均值为13的正态总 体呢?或许事实的确如此。 别忘了不等式(4 - 7)的置信区间的置信度仅为 95%而并非100%。如果真的如此,那么拒绝H : u = 13,就可能犯错误。在这种情况下,我们说 犯了第一类错误。也即弃真错误
0 X
2011-2-22
计量经济学讲义
17
1
X
H : u <13 ,也称为单边备择假设。
1
X
H : u ≠1 3,称为双边备择假设。
1
X
2011-2-22
计量经济学讲义
8
零假设和备择假设有不同的表述方式。 例如,零假设H :u ≥1 3 , 备择假设H :u < 1 3。
0 X 1 X
2011-2-22
计量经济学讲义
9
为了检验零假设(与备择假设),我们根据样 本数据(比如,根据表4 - 1得到的样本平均 P/E值11 . 5)以及统计理论建立判定规则来 判断样本信息是否支持零假设。 如果样本信息支持零假设,我们就不拒绝 H ,但如果不支持零假设,则拒绝H ,在 后一种情况下,我们接受备择假设,H 。
X X
如何检验该假设呢?—也即是接受还是拒 绝该假设?
2011-2-22
计量经济学讲义
7
用假设检验的语言,类似u = 1 3的假设称为零
X
假设。通常用符号H 表示。因而,H : u = 1 3。
0 0
X
零假设通常与备择假设成对出现。用符号H 表示 备择假设,备择假设有以下几种形式:
1
H : u >13 ,称为单边备择假设。
0 0 1
2011-2-22
计量经济学讲义
10
如何建立判定规则呢?有两个互补的方法: ( 1)置信区间法( 2)显著性检验法。 我们将通过P/E一例来阐述这两种方法。这 里, H :u = 13
0 X
H :u ≠13 (双边假设)
1 X
2011-2-22
计量经济学讲义
11
置信区间法
2011-2-22
0 X
简言之,如果参数值超过上临界值或低于下临界 值,那么就拒绝零假设。现在就会清楚为什么接 受区域的边界称为临界值。因为它们是接受或拒 绝零假设的分界线。
2011-2-22 计量经济学讲义 15
第一类错误和第二类错误:一个偏离
2011-2-22
计量经济学讲义
16
在P/E一例中,我们拒绝H :u = 13,因为样本均 值X= 11.5 看似与零假设不一致,
2011-2-22
计量经济学讲义
27
2011-2-22
计量经济学讲义
28
2011-2-22
计量经济学讲义
29
2011-2-22
计量经济学讲义
30
2011-2-22
计量经济学讲义
31
用显著性检验的语言,经常遇到下面两个术语: ( 1 ) 检验(统计量)是统计显著的。 ( 2 ) 检验(统计量)是统计不显著的。 当我们说检验是统计显著的,一般是指能够拒绝 零假设,即观察到的样本值与假设值不同的概率 非常小,小于(犯第一类错误的概率)。同样的, 当我们说检验是统计不显著的,是指不能拒绝零 假设。在此情况下,观察到的样本值与假设值不 同可能受抽样影响较大(即观察到的样本值与真实 值不同的概率大于)。 当拒绝零假设时,我们就说是统计显著的,当不 能拒绝零假设时,就说不是统计显著的。
2011-2-22 计量经济学讲义 2
在统计推断中,提出这样一个问题:根据50支股票的平 均P/E值,能否说这个P/E值就是总体的1 758支股票的平 均P/E值呢? 换句话说,如果令X表示一支股票的P/E值,X表示5 0支 股票的平均P/E值( ),我们能否得知总体的均值, E(X)呢? 统计推断的实质就是从样本值(X)归纳出总体值E(X)的过 程。 X就称为总体平均P/E[也即E(X)]的估计量,E(X)称为总体 参数
10.63≤ uX ≤12.36 (近似值) (4 - 7)
置信区间提供了在某一置信度下(比如95%)真实的uX取值 范围。因此,如果这个区间不包括零假设中的值,比如 uX =13,那么我们会拒绝零假设吗?答案是肯定的。我 们以95%的置信度拒绝该零假设。
2011-2-22 计量经济学讲义 13
从上面的讨论中,可以清楚地看到置信区 间与假设检验密切相关。 用假设检验的语言,不等式(4 - 7)描述的置 信区间称为接受区域(acceptance region), 接受区域以外的称为零假设的临界区域 (critical region)或拒绝区域(region of rejection)。接受区域的上界和下界称为临 界值(critical values)。