(05)第5章 假设检验

合集下载

第5章 假设检验

第5章 假设检验

计量经济学讲义
22
读者或许发现:前面讨论的置信系数( 1- a) 就是1减去“犯第一类错误的概率a”,因此, 95%的置信系数表示接受零假设犯第一类 错误的概率至多为5%。 简言之, 5%的置信水平与95%的置信系数 的意义相同。
2011-2-22
计量经济学讲义
23
2011-2-22
计量经济学讲义
0 0
2011-2-22
计量经济学讲义
21
假设检验的标准或古典方法是:给定某一 水平的a,比如0 . 0 1或0 . 0 5,然后使检 验的功效最大,也即使b最小。这个求解过 程很复杂,有兴趣的同学可以参阅有关参 考书。 需要指出的是:在实际中,古典方法仅仅 给出了a值,而没有过多考虑b值。
2011-2-22
24
2011-2-22
计量经济学讲义
25
显著性检验
2011-2-22
计量经济学讲义
26
显著性检验
显著性检验(test of significance approach) 是一种两者择一的假设检验,但它却是完 备的。 显著性检验是一种较为简洁的假设检验方 法。 我们仍通过P/E一例说明这种检验方法的一 些基本要点。
2011-2-22 计量经济学讲义 36
显著水平的选择与p值
2011-2-22
计量经济学讲义
37
显著水平的选择与p值
假设检验的古典方法的不足之处在于选择a 的任意性。虽然一般常用的a值有1%、5% 和1 0%,但是这些值并不是固定不变的。 前面指出,只有在检查犯第一类错误和第 二类错误后果的时候,才选择相应的a 。 在实践中,最好是用p值(即,概率值),p 值(p value)也称为统计量的精确置信水平。 它可定义为拒绝零假设的最低置信水平。

第5章-假设检验课后习题解答

第5章-假设检验课后习题解答

第五章假设检验一、选择题1.单项选择题(1)将由显著性水平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性水平的 1 /2,这是(B )。

A.单侧检验B.双侧检验C.右单侧检验D.左单侧检验(2)检验功效定义为(B )。

A.原假设为真时将其接受的概率B.原假设不真时将其舍弃的概率C.原假设为真时将其舍弃的概率D.原假设不真时将其接受的概率(3)符号检验中,(+)号的个数与(-)号的个数相差较远时,意味着(C )。

A.存在试验误差(随机误差)B.存在条件误差C.不存在什么误差D.既有抽样误差,也有条件误差(4)得出两总体的样本数据如下:甲:8,6,10,7,8;乙:5,11,6,9,7,10秩和检验中,秩和最大可能值是(C )。

A.15B.48C.45D.662.多项选择题(1)显著性水平与检验拒绝域的关系是(ABD )。

A.显著性水平提高(α变小),意味着拒绝域缩小B.显著性水平降低,意味着拒绝域扩大C.显著性水平提高,意味着拒绝域扩大D.显著性水平降低,意味着拒绝域扩大化E.显著性水平提高或降低,不影响拒绝域的变化(2)β错误(ACDE )。

A.是在原假设不真实的条件下发生的B.是在原假设真实的条件下发生的C.决定于原假设与实际值之间的差距D.原假设与实际值之间的差距越大,犯β错误的可能性就越小E.原假设与实际值之间的差距越小,犯β错误的可能性就越大二、计算题1.某牌号彩电规定无故障时间为10000 小时,厂家采取改进措施,现在从新批量彩电中抽取100 台,ο n500 100ο n60 16 测得平均无故障时间为 10150 小时,标准差为 500 小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)?解:假设检验为H 0:μ0=10000,H 1:μ0<10000(使用寿命应该使用单侧检验)。

n =100 可近似采用x - μ0正态分布的检验统计量z =。

查出α=0.01 水平下的反查正态概率表得到临界值 2.34 到 2.36 之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以 2,再查到对应的临界值)。

统计学概论05

统计学概论05

5-18

总体标准差未知时对总体均值检验经常用t统 计量: X 0
t s n ~ t (n 1)

但是,在大样本场合(样本容量n大于30时), t-统计量与标准正态分布统计量近似,通常用 z检验代替t检验。
5-19
总体成数的检验

当样本容量较大时,下列统计量服从标准正 态分布:
z p n
5-26



z检验的p-值: z0 检验统计量为z统计量的p-值计算公式, 表示 检验统计量的抽样数据,则p-值的计算方法 如下: 如果:H 1 , 0 p-值=2 pz z0 如果:H 1 , 0 p-值= pz z 0 如果:H 1 , 0 p-值= pz z 0
5-11
二、参数检验

参数检验都是先对样本所属总体的性质作出 若干的假定,或对总体的分布形状加以限定, 然后对总体的有关参数情况进行统计假设检 验。因此,参数检验又称为限定分布检验。 如在总体服从正态分布条件下,对其均值进 行检验。下面通过具体例子来说明参数检验 方法。
5-12

在例1中,按历史资料,总体的标准差是4毫 升。我们通过检验总体均值是否等于250毫升, 来判断饮料厂商是否欺骗了消费者。程序如 下:
5-6

构造一个统计量来决定是“接受原假设,拒绝备选 假设”,还是“拒绝原假设,接受备选假设”。对 不同的问题,要选择不同的检验统计量。检验统计 量确定后,就要利用该统计的分布以及由实际问题 中所确定的显著性水平,来进一步确定检验统计量 拒绝原假设的取值范围,即拒绝域。在给定的显著 性水平α下,检验统计量的可能取值范围被分成两部 分:小概率区域与大概率区域。小概率区域就是概 率不超过显著性水平α的区域,是原假设的拒绝区域; 大概率区域是概率为1-α的区域,是原假设的接受区 域。

管理统计学:第5章_假设检验

管理统计学:第5章_假设检验
华南理工大学精品课程
统计显著性
3. 一项检验在统计上是“显著的”,意思是指: 这样的(样本)结果不是偶然得到的,或者说, 不是靠机遇能够得到的。
– 拒绝原假设,表示这样的样本结果并不是
偶然得到的;不拒绝原假设(拒绝原假设的 证据不充分) ,则表示这样的样本结果只 是偶然得到的。
华南理工大学精品课程
解:研究者抽检的意图是倾向于证
实这种洗涤剂的平均净含量并不符
绿叶 洗涤剂
合说明书中的陈述。建立的原假设
和备择假设为
H0 : 500
华南理工大学精品课程
H1 : < 500
500g
例题分析
【例】一家研究机构估计,某城市中家庭拥有汽车 的比例超过30%。为验证这一估计是否正确,该 研究机构随机抽取了一个样本进行检验。试陈 述用于检验的原假设与备择假设。
华南理工大学精品课程
双侧检验与单侧检验
假设 原假设
表5-1 假设检验的基本形式
双侧检验
单侧检验 左侧检验 右侧检验
H0 : μ =μ0 H0: 0 H0: 0
备择假设 H1 :μ≠μ0 H1: μ<μ0 H1 :μ>μ0
华南理工大学精品课程
2、两类错误与显著性水平
假设检验中的两类错误 1. 第Ⅰ类错误(弃真错误)
解:研究者想收集证据予以证明 的假设应该是“生产过程不正常 ”。建立的原假设和备择假设为
H0 : 10cm H1 : 10cm
华南理工大学精品课程
例题分析
【例】某品牌洗涤剂在它的产品说明书中声称:平 均净含量不少于500g。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设

第5章假设检验(1)

第5章假设检验(1)


0.7 –1.6 –0.2 –1.2 –0.1 3.4 3.7 0.8 0.0 2.0
哪种安眠药的疗效好?
⑵如果将试验方法改为对同一组10个病人,每人分别服用 甲、乙两种安眠药作对比试验,试验结果仍如上表,此时结 论如何?
思考
以上两种试验方法是否存在本质区别?
4
【案例 4】民意调查问题
在美国大选前,两个民意调查机构在各自独立进行的一 次民意调查中,分别各调查了1000个选民。其中甲样本中 候选人甲的支持率为51%,乙样本中候选人乙的支持率为 48%。
估计, 故应使用 X 来构造检验 的统计量。
可以证明,当 H0 为真时,统计量
t X 0 ~t (n-1)
S/ n
8
4. 给定一个小概率 ,称为显著性水平
显著性水平 是当 H0 为真时,检验结果拒绝 H0 的概率
(犯“弃真”错误的概率)。
也即当检验结果拒绝 H0 时,不犯错误的概率为 1-, 此时就可以有 1- 的可信度接受备择假设 H1。
思考
能否据此作出在全体选民中甲的支持率高于乙的
结论?
5
【案列5】如何选定财务预警指标?
如何建立有效的财务预警模型,是当前理论界和企业都非常关 注的一个热点课题。
要建立财务预警模型,首先就需要在众多财务指标中筛选出对 即将陷入财务危机的企业具有先期预兆的指标。
科学的研究方法:运用统计方法进行实证分析。 以下是可以运用的基本分析思路之一: ⑴确定危机企业的标准:如“破产”、“债务违约”、“ST” 等。 ⑵根据最近某年的数据,将上市公司分为“危机企业”和“非 危机企业”(最好分行业)两类样本。 ⑶对每一个要分析的财务指标,比较之前若干年(1~3年)两类 企业该指标的平均值之间是否存在显著差异。 ⑷若存在显著差异,说明该指标对即将陷入财务危机的企业具 有先期预报功能,可以作为财务预警模型中的变量;否则就不能 作为财务预警模型中的变量。

第5章 假设检验

第5章 假设检验

两类错误与显著性水平
两类错误
假设检验的依据是:小概率事件在一次试验中
很难发生. 但“很难发生”不等于“不发生”, 因而 假 假设检验是由局部推断总体,并且 设检验所作出的结论有可能是错误的. 这种错误
是在给定检验水平的前提下进行 有两类: (1)推断,接受还是拒绝原假设完全取 当原假设H0为真, 观察值却落入拒绝域, 而 决于样本值, 因此所作检验可能导 作出了拒绝H0的判断, 称为第Ⅰ类错误, 又叫弃真 致两类错误的产生
小 结
•构造一个统计量来决定是“接受原假设,拒绝备选假 设”,还是“拒绝原假设,接受备选假设”。
•对不同的问题,要选择不同的检验统计量。检验统计 量确定后,就要利用该统计量的抽样分布以及由实际 问题中所确定的显著性水平,来进一步确定检验统计 量拒绝原假设的取值范围,即拒绝域:
– 在给定的显著性水平α下,检验统计量的可能取值范围被 分成两部分:小概率区域与大概率区域。小概率区域就是 概率不超过显著性水平α的区域,是原假设的拒绝区域; 大概率区域是概率为1-α的区域,是原假设的接受区域。
检验统计量与拒绝域
检验统计量
(test statistic)
1. 根据样本观测结果计算得到的,并据以对 检验统计量实际上是总体参数的点估计量, 原假设和备择假设作出决策的某个样本统 由于其随机性,需要进行标准化后,才能用 计量 作检验的标准,以反映点估计量与假设的总体
参数相比,相差多少个标准差 2. 对样本估计量的标准化结果 – 原假设H0为真

H0 :μ = 某一数值
指定为符号 ≤, =或≥ – 例如, H0 :μ =10cm

备择假设
(alternative hypothesis)

(05)第5章 假设检验1

(05)第5章 假设检验1
= 0.05,
临界值: t0.05(35)=1.6896
拒绝H0
0.05
检验统计量:
t x 0 5275 5200 3.75
s / n 120 36
t0.05 (35) 1.6896
决策:拒绝H0 结论: 改良后的新品种产量有显著 提高
6 - 33 0 1.6896 z
6-7
统计学
STATISTICS
一个假设检验的例子
P112—【例3.33】
一个汽车电池制造商声称其最好的电池寿命的分布 为均值54个月,标准差为6个月。假设某一消费 组织决定购买50个这种电池作为样本检验电池的 寿命,以核实这一声明。
(1)假设这个制造商之所言是真实的,试描 述这50个电池样本的平均寿命的抽样分布。
STATISTICS
5.1 假设检验的基本原理
一、假设的陈述 二、显著性水平 三、统计量与拒绝域 四、利用P值进行决策
统计学
STATISTICS
5.1.1 假设的陈述
现实生活中,人们经常要对某个“假设”作出判断, 确定它是真的还是假的。在研究领域,研究者在 检验一种新的理论时,首先要提出一种自己认为 是正确的看法,即假设。
1 (1.53) 1 0.9370 0.0630
说明在显著性水平为0.05下不能判定汽车电池的 平均寿命不到54个月。但在显著性水平为0.1下可 以判定汽车电池的平均寿命不到54个月。
6 - 12
统计学
STATISTICS
原假设与备择假设
统计学
STATISTICS
原假设
(null hypothesis)
备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验

05.假设检验

05.假设检验

1.原假设和被择假设:原假设通常是指研究者想收集证据予以反对的假设,也称为零假设,H0。

被择假设通常是研究者想收集证据予以支持的假设,也称研究假设,H1。

原则:原假设和被择假设是一个完备的事件组,而且相互独立;在建立假设时,通常是先确立原假设,再确立被择假设;在假设检验中,“=”一般都放在原假设上;假设内容具有一定的主观色彩,不同的研究者建立截然相反的假设也是合理的;假设检验的目的主要是收集证据来拒绝原假设,原假设最初被假设是成立的;假设检验的结论通常有两种:“拒绝原假设”和“不拒绝原假设”。

不拒绝原假设≠接受原假设。

2.检验统计量:检验统计量必须为标准化后的统计量,可以反映点估计量与假设的总体参数相比相差多少个标准差,同时必须为随机变量,根据观测结果不同,具体数值也不同。

检验统计量可以用来建立一个准则,根据这个准则和计算得到的检验统计量值可以为研究者判断和决策提供依据。

3.两类错误:第一类错误是指原假设为真而拒绝原假设;第二类错误是原假设为假时,没有拒绝原假设。

只有当原假设被拒绝时,才会犯第一类错误α;只有当原假设未被拒绝时,才会犯第二类错误β。

两类错误概率存在的关系是:当α增大时,β减小;当β增大时,α减小。

4.显著性水平:假设检验中犯第一类错误的概率被称为显著性水平。

显著性水平常被用于检验结论可靠性的度量。

意味着“非偶然性”。

如果样本提供的证据拒绝原假设,则表明检验的结果实现自主的,如果不拒绝原假设,则表明检验的结果是不显著的。

5.P值:如果原假设H0为真时,所得到的样本结果会像实际观测结果那样极端或更极端的概率,称为P值。

P值是关于数据的概率,告诉我们,在某个总体的许多样本中,某一类数据出现的经常程度,是当原假设正确时,得到观测数据不可能的程度。

作为显著性的测量工具,P值越小,检验的结果越显著。

6.统计学上的显著性是指样本结果不是偶然得到的。

7.单侧检验与双侧检验的区别;双侧检验中,原假设为“=”,而被择假设为“≠”,其显著性的边界值一般有两个,确定的拒绝域分布在抽样分布的两侧;而单侧检验中的被择假设一般为“<”或“>”,拒绝与分布在左侧或者右侧。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

决策规则
1. 给定显著性水平,查表得出相应的临界 值z或z/2, t或t/2 2. 将检验统计量的值与 水平的临界值进行 比较 3. 作出决策
– – –
5 - 25
双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
5 - 32
总体均值的检验( 2 已知) 统计学
STATISTICS
(例题分析)
检验统计量:
• H0 : = 255 • H1 : 255 = 0.05 • n = 40
拒绝 H0
0.025
z
x 0

n

255.8 255 5 40
1.01
决策:
不拒绝H0
拒绝 H0
2. 先确定备择假设,再确定原假设
3. 等号“=”总是放在原假设上
4. 因研究目的不同,对同一问题可能提出不同 的假设(也可能得出不同的结论)
5 - 13
统计学
STATISTICS
双侧检验与单侧检验
统计学
STATISTICS
双侧检验与单侧检验
1. 备择假设没有特定的方向性,并含有符号 “”的假设检验,称为双侧检验或双尾 检验(two-tailed test) 2. 备择假设具有特定的方向性,并含有符号 “>”或“<”的假设检验,称为单侧检验或 单尾检验(one-tailed test)
5 - 18
统计学
STATISTICS
显著性水平
(significant level)
• 1. 是一个概率值
• 2. 原假设为真时,拒绝原假设的概率
– 被称为抽样分布的拒绝域
• 3. 表示为 (alpha)
– 常用的 值有0.01, 0.05, 0.10
• 4. 由研究者事先确定
5 - 19
– 总体参数包括总体均值、比率、方差等 – 分析之前必需陈述
5-5
统计学
STATISTICS
什么是假设检验?
(hypothesis test)
1. 先对总体的参数(或分布形式)提出某种假 设,然后利用样本信息判断假设是否成 立的过程 2. 有参数检验和非参数检验 3. 逻辑上运用反证法,统计上依据小概率 原理
STATISTICS
统计学 假设检验步骤的总结
1. 陈述原假设和备择假设 2. 从所研究的总体中抽出一个随机样本
3. 确定一个适当的检验统计量,并利用样本数据 算出其具体数值
4. 确定一个适当的显著性水平,并计算出其临界 值,指定拒绝域 5. 将统计量的值与临界值进行比较,作出决策
– –
5 - 26

n
~ N (0,1)
未知:z
2
x 0 s n
~ N (0,1)
5 - 31
统计学
STATISTICS
总体均值的检验( 2 已知)
(例题分析)
双侧检验
• 【例】一种罐装饮料采用自动 生产线生产,每罐的容量是 255ml,标准差为5ml。为检验 每罐容量是否符合要求,质检 人员在某天生产的饮料中随机 抽取了40罐进行检验,测得每 罐平均容量为255.8ml。取显著 性水平=0.05 ,检验该天生产 的饮料容量是否符合标准要求?
(单尾和双尾)
2检验
(单尾和双尾)
5 - 28
统计学
STATISTICS
总体均值的检验
统计学
STATISTICS
总体均值的检验
(大样本)
统计学
STATISTICS
总体均值的检验
(大样本)

1.假定条件

2. 使用z检验统计量
已知:z
2
正态总体或非正态总体大样本(n30)
x 0
右侧检验
5 - 37
总体均值的检验( 2 未知) 统计学
STATISTICS
(例题分析)
检验统计量:
• H0 : 5200 • H1 : > 5200 = 0.05 • n = 36
拒绝H0 0.05
z
5275 5200 120 36
3.75
决策:
拒绝H0 (P = 0.000088 < = 0.05)
6. 用Excel进行检验
5-2
统计学
STATISTICS
5.1 假设检验的基本问题
一、假设的陈述 二、两类错误与显著性水平 三、统计量与拒绝域 四、利用P值进行决策
统计学
STATISTICS
假设的陈述
统计学
STATISTICS
什么是假设?
(hypothesis)
• 对总体参数的具体数值所作的陈述
5 - 34
0.98
1.12 1.23 0.99
1.10
1.12 0.74 1.45
1.12
0.95 1.50 1.24
1.03
1.02 0.50 1.01
1.16
1.13 0.59 2.03
1.98 1.11
1.70 1.17
1.97 1.54
2.37 1.12
0.91 1.08
1.38 1.23
0.025
结论:
样本提供的证据表明:该天生 产的饮料符合标准要求
-1.96
5 - 33
0
1.96
z
统计学
STATISTICS
总体均值的检验( 2 未知)
(例题分析)
50个零件尺寸的误差数据 (mm) 1.26 1.13 1.19 0.96 1.31 1.06 0.97 1.00 1.81 0.94
– – 备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
5 - 15
统计学 双侧检验与单侧检验 STATISTICS (假设的形式)
假设
原假设 备择假设
双侧检验
单侧检验 左侧检验 右侧检验
H0 : = 0 H0 : 0 H0 : 0 H1 : ≠0 H1 : < 0 H1 : > 0
解:研究者想收集证据予以支持的假设是“该 城市中家庭拥有汽车的比率超过30%”。建立 的原假设和备择假设为 H0 : 30% H1 : 30%
5 - 12
统计学
STATISTICS
提出假设
(结论与建议)
1. 原假设和备择假设是一个完备事件组,而且 相互对立
– 在一项假设检验中,原假设和备择假设必有一 个成立,而且只有一个成立
• 【例】一种机床加工的零件 尺寸绝对平均误差为1.35mm。 生产厂家现采用一种新的机 床进行加工以期进一步降低 误差。为检验新机床加工的 零件平均误差与旧机床相比 是否有显著降低,从某天生 产的零件中随机抽取50个进 行检验。利用这些样本数据, 检验新机床加工的零件尺寸 的平均误差与旧机床相比是 否有显著降低? (=0.01)
解:研究者想收集证据予以证明的假设 应该是“生产过程不正常”。建立的原 假设和备择假设为
5 - 10
H0 : 10cm
H1 : 10cm
统计学
STATISTICS
提出假设
(例题分析)

【例】某品牌洗涤剂在它的产品说明书中声称: 平均净含量不少于500克。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设
检验统计量
(test statistic)
1. 根据样本观测结果计算得到的,并据以对原 假设和备择假设作出决策的某个样本统计量 2. 对样本估计量的标准化结果
– – 原假设H0为真 点估计量的抽样分布
点估计量 — 假设值 标准化检验统计量 点估计量的抽样标准差
5 - 22
3. 标准化的检验统计量
结论:
改良后的新品种产量有显著提高
5 - 38
0
1.645
z
总体均值的检验(z检验) 统计学 STATISTICS (P 值的图示)
抽样分布
拒绝H0 1-
0.05
P值
0 1.645
5 - 39
P = 0.000088 计算出的样本统计量=3.75
统计学
STATISTICS
总体均值的检验
(大样本检验方法的总结)
5-9
统计学
STATISTICS
提出假设
(例题分析)

【例】 一种零件的生产标准是直径应为10cm,为 对生产过程进行控制,质量监测人员定期对一台加 工机床检查,确定这台机床生产的零件是否符合标 准要求。如果零件的平均直径大于或小于10cm, 则表明生产过程不正常,必须进行调整。试陈述用 来检验生产过程是否正常的原假设和被择假设
统计学
STATISTICS
第 5 章 假设检验
• 5.1 假设检验的基本问题 • 5.2 一个总体参数的检验 • 5.3 两个总体参数的检验
5-1
统计学
STATISTICS
学习目标
1. 假设检验的基本思想和原理
2. 假设检验的步骤 3. 一个总体参数的检验 4. 两个总体参数的检验
5. P值的计算与应用
5-8
统计学
STATISTICS
备择假设
(alternative hypothesis)
1. 研究者想收集证据予以支持的假设
2. 也称“研究假设” 3. 总是有符号 , 或 4. 表示为 H1


H1 : <某一数值,或 某一数值 例如, H1 : < 10cm,或 10cm
统计学 显著性水平和拒绝域 STATISTICS (双侧检验 )
相关文档
最新文档