5 假设检验

合集下载

假设检验的5个步骤

假设检验的5个步骤

假设检验的5个步骤假设检验的5个步骤包括问题陈述、建立假设、选择统计检验方法、计算检验统计量和做出决策。

在进行假设检验之前,首先要明确问题陈述。

即要明确研究目的是什么,需要验证的假设是什么。

通常假设检验分为原假设(H0)和备择假设(H1)。

原假设是默认的假设,备择假设是要验证的假设。

在问题陈述中,需要清楚地表明要验证的假设是什么。

接着是建立假设。

根据问题陈述,确定原假设和备择假设。

原假设通常是无效果、无影响、无差异的假设,备择假设则是要验证的假设,通常是有效果、有影响、有差异的假设。

建立假设是假设检验的基础,也是进行后续统计分析的前提。

选择统计检验方法是假设检验的第三步。

根据研究问题的性质和假设的设定,选择适当的统计检验方法。

常用的统计检验方法包括t检验、方差分析、卡方检验、回归分析等。

选择合适的统计检验方法是假设检验的关键,只有选择合适的方法才能得到可靠的检验结果。

接下来是计算检验统计量。

根据选择的统计检验方法,计算相应的检验统计量。

检验统计量是根据样本数据计算出来的一个数值,用于衡量样本数据与假设的偏离程度。

检验统计量的计算是假设检验的核心,根据检验统计量的大小和显著性水平,来做出假设的验证和决策。

最后是做出决策。

根据计算出的检验统计量和设定的显著性水平,做出决策是否拒绝原假设。

如果检验统计量的计算结果落在拒绝域内,即显著性水平的临界值之外,就拒绝原假设,接受备择假设;如果检验统计量的计算结果落在接受域内,即显著性水平的临界值之内,就接受原假设。

做出决策是假设检验的最终步骤,也是检验结果的呈现和解释。

计量经济学第5章假设检验

计量经济学第5章假设检验
5-15
假设检验中的小概率原理
假设检验中的小概率原理
什么小概率? 1. 在一次试验中,一个几乎不可能发生的事
件发生的概率 2. 在一次试验中小概率事件一旦发生,我们
就有理由拒绝原假设 3. 小概率由研究者事先确定
5-17
假设检验中的小概率原理
由以往的资料可知,某地新生儿的平均体重为3190克,从今年的新生儿中随机 抽取100个,测得其平均体重为3210克,问今年新生儿的平均体重是否为 3190克(即与以往的体重是否有显著差异)?
决策:
在 = 0.05的水平上拒绝H0
结论:
有证据表明新机床加工的零件 的椭圆度与以前有显著差异
5-56
2 已知均值的检验
(P 值的计算与应用)
第1步:进入Excel表格界面,选择“插入”下拉菜单 第2步:选择“函数”点击 第3步:在函数分类中点击“统计”,在函数名的菜单下选
与原假设对立的假设 表示为 H1
5-12
确定适当的检验统计量
什么检验统计量?
1.用于假设检验决策的统计量 2.选择统计量的方法与参数估计相同,需考虑
是大样本还是小样本 总体方差已知还是未知
检验统计量的基本形式为 Z X 0 n
5-13
规定显著性水平(significant level)
(P-value)
1. 是一个概率值
2. 如果原假设为真,P-值是抽样分布中大
于或小于样本统计量的概率
左侧检验时,P-值为曲线上方小于等于检
验统计量部分的面积
右侧检验时,P-值为曲线上方大于等于检
验统计量部分的面积
3. 被称为观察到的(或实测的)显著性水平
5-44
双侧检验的P 值

5假设检验

5假设检验

5.4.4影响检验功效的因素
• 以单组样本均数z检验为例
x x
z
0
0
x / n
1.总体参数间的差异;
2.个体差异(标准差);
3.样本含量n;
4.检验水准。
•上述四个因素中,总体参数的差异 、 总体标准差 、检验水准通常是相对固 定的,可以人为调整的因素主要是样本含 量n。所以在检验功效不够大的情况下, 可以通过增加样本含量提高检验功效。
• 例 若通过以往大规模调查,已知某 地婴儿出生体重均数为3.20kg,标准 差为0.39kg,今随机调查得25名难产 儿平均出生体重为3.42kg,问出生体 重与难产是否有关?假定难产儿出生 体重的标准差与一般儿童相同。
由于个体差异的存在,即使从同一总体中
严格的随机抽样, 也并不完全相同。
x1、x2、x3、x4、
n足够大,且和(1-)均不太小,如 n与n(1- )均5。
z p0 p
p0 0 (1 0 )
n
例 某地区随机抽取传染科工作人员150名,作 关于乙型肝炎的血清学检查,其中阳性者35名, 已知当地人群的阳性概率为17.00%,问当地传 染科工作人员的阳性概率是否高于一般人群的 阳性概率?
∣t∣≥t0.01/2 , P≤0.01 有高度统计学意义
表 z 值、p 值与差别的意义的关系
z值
P 值 差别的意义
∣z∣<z0.05/2 P>0.05 无统计学意义 ∣z∣≥z0.05/2 P≤0.05 有统计学意义 ∣z∣≥z0.01/2 P≤0.01 有高度统计学意义
5.3 单组样本资料的检验
如: x
=2.821
z
0
x
3.确定概率P。根据自由度和样本检验统计量, 确定概率P。

第五章-假设检验与回归分析

第五章-假设检验与回归分析
2
件,得到拒绝域;
步骤 4:明确或计算样本均值 x ,得到U 变量的观测值 u x 0 n 0
若观测值 u 落入拒绝域,则拒绝零假设 H 0 ,即接受备择假设 H1 ,
否则不能拒绝零假设 H 0 。
第五章 假设检验与回归分析 例1、 已知某面粉自动装袋机包装面粉,每袋面粉重量 Xkg
服从正态分布 N(25,0.02) ,长期实践表明方差 2 比较稳定,从
第五章 假设检验与回归分析
U 检验的步骤:
步骤 1:提出零假设 H 0 : 0 与备择假设 H1 ;
步骤 2:明确所给正态总体标准差 0 值、样本容量 n 的
值,当零假设 H 0 成立时,构造变量
U X 0 n ~ N(0,1) 0
第五章 假设检验与回归分析
步骤 3:由所给检验水平 的值查标准正态分布表求出对应 的双侧分位数 u 的值或上侧分位数 u 的值,构造小概率事
u
2
0.05, u 1.96 ,
2
第五章 假设检验与回归分析
x 0 n
12.5 12 1 100
5 u
2
1.96
故拒绝 H0 ,即认为产品平均质量有显著变化。
小结与提问:
理解假设检验的基本原理、概念;掌握假设检验的步骤。
课外作业:
P249 习题五 5.01, 5.02,5.03。
0.10,再在表中第一列找到自由度 m n 1 7 1 6 ,
其纵横交叉处的数值即为对应的 t 分布双侧分位数 t 1.943
2
,使得概率等式
PT 1.943 0.10
成立。这说明事件 T 1.943是一个小概率事件,于是得到
拒绝域
t 1.943
第五章 假设检验与回归分析

第5章 假设检验

第5章 假设检验

两类错误与显著性水平
两类错误
假设检验的依据是:小概率事件在一次试验中
很难发生. 但“很难发生”不等于“不发生”, 因而 假 假设检验是由局部推断总体,并且 设检验所作出的结论有可能是错误的. 这种错误
是在给定检验水平的前提下进行 有两类: (1)推断,接受还是拒绝原假设完全取 当原假设H0为真, 观察值却落入拒绝域, 而 决于样本值, 因此所作检验可能导 作出了拒绝H0的判断, 称为第Ⅰ类错误, 又叫弃真 致两类错误的产生
小 结
•构造一个统计量来决定是“接受原假设,拒绝备选假 设”,还是“拒绝原假设,接受备选假设”。
•对不同的问题,要选择不同的检验统计量。检验统计 量确定后,就要利用该统计量的抽样分布以及由实际 问题中所确定的显著性水平,来进一步确定检验统计 量拒绝原假设的取值范围,即拒绝域:
– 在给定的显著性水平α下,检验统计量的可能取值范围被 分成两部分:小概率区域与大概率区域。小概率区域就是 概率不超过显著性水平α的区域,是原假设的拒绝区域; 大概率区域是概率为1-α的区域,是原假设的接受区域。
检验统计量与拒绝域
检验统计量
(test statistic)
1. 根据样本观测结果计算得到的,并据以对 检验统计量实际上是总体参数的点估计量, 原假设和备择假设作出决策的某个样本统 由于其随机性,需要进行标准化后,才能用 计量 作检验的标准,以反映点估计量与假设的总体
参数相比,相差多少个标准差 2. 对样本估计量的标准化结果 – 原假设H0为真

H0 :μ = 某一数值
指定为符号 ≤, =或≥ – 例如, H0 :μ =10cm

备择假设
(alternative hypothesis)

5.假设检验,t检验

5.假设检验,t检验
2
计算统计量
t
d 0 Sd / n

0.0033 0 0.01497/ 12
0.771
自由度 ν =n-1=12-1=11. 查附表2(t临界值表),双侧 t0.40,11 = 0.876, 则P>0.40,在α =0.05水平上不能拒绝H0。所以尚不能 认为两种方法法测定结果不同。
例3 某儿科采用静脉注射人血丙种球蛋白治疗 小儿急性毛细支气管炎。用药前后患儿血清中免 疫球蛋白IgG(mg/dl)含量如表所示。试问用药 前后IgG有无变化?
(3)确定P 值,作出推断结论 以 35, t 2.138 查t界值表,因 t0.05/ 2,35 2.138 t0.02/ 2,35 故双尾概率0.02<P <0.05,按 0.05 水准,拒绝 H 0 , 接受 H1 。结合本题,可认为从事铅作业的男性工人平 均血红蛋白含量低于正常成年男性。
如果不拒绝 H 0 ,表达为:尚不能认为
二、配对样本均数t检验
(非独立两样本均数t检验)
目的:比较检验两相关样本均数所代表的未知总体均数 是否有差别 配对设计(paired design)是将受试对象按某些重要特征 相近的原则配成对子,每对中的两个个体随机地给予两 种处理。应用配对设计可以减少实验的误差和控制非处 理因素,提高统计处理的效率。 主要形式: (1) 同一对象的两个部位分别接受不同处理;或同一样品分 成两份,分别接受不同处理 (2) 将受试对象按特征相似的每两个对象配成一对,同对的 两个对象分别接受不同处理 (3) 同一受试对象处理(实验或治疗)前后的结果比较
、三十年代Neyman和Pearson建立了
统计假设检验问题的数学模型。

假设检验概念:先对总体参数或分布作 出一个假设,然后利用样本信息来判断 原假设是否合理,即判断样本信息与原 假设差异是否有统计学意义,从而决定 应接受或否定原假设。

《统计学》第5章 假设检验

《统计学》第5章 假设检验
假设。原假设通常用H0 表示,也称为“零假设”;备择假设指的是当原
假设不成立时,即拒绝原假设时备以选择的假设,通常用H1 表示。备择
假设和原假设互斥,如在例5.1中,原假设是“2022 年全国城市平均
PM2.5 浓度与2018 年相比没有显著差异”,那么备择假设就是“2022
年全国城市平均PM2.5 浓度与2018 年相比存在显著差异”。相应的统计
小越好。但是,在一定的样本容量下,减少犯第I类错误的概率,就会
使犯第II类错误的概率增大;减少犯第II类错误的概率,会使犯第I类
错误的概率增大。增加样本容量可以使犯第I类错误的概率和犯第II类
错误的概率同时减小,然而现实中资源总是有限的,样本量不可能没有
限制。因此,在给定的样本容量下,必须考虑两类可能的错误之间的权
易被否定,若检验结果否定了原假设,则说明否定的理由是充分的。
第四章 参数估计
《统计学》
16
5.1 假设检验的基本原理
(四) P值法
假设检验的另一种常用方法是利用P值(P-value) 来确定检验决策。P值
指在原假设0 为真时,得到等于样本观测结果或更极端结果的检验统计
量的概率,也被称为实测显著性水平。P值法的决策规则为:如果P值大
1.96) 中。这里−1.96和1.96 称为临界值,区间(−1.96, 1.96) 两侧的
区域则被称为拒绝域。基于样本信息,可以计算得到相应的z检验统计量
值,已知ҧ = 46,0 = 53, = 14 , n = 100 = −5
14/10
第四章 参数估计
《统计学》
14
5.1 假设检验的基本原理
犯第I 类(弃真) 错误的概率 也称为显著性水平(Significance level),

第5章_假设检验

第5章_假设检验

面向21世纪 课程教材
第五章
假设检验
第二节
某研究者估计本市居民家庭电脑拥有率为30%。现随机调查了200个家庭,其 中68家拥有电脑。试问研究估计是否可信?( =10%) 提出假设:原假设:Ho:P=0.3; 备择假设:Ha:p≠0.3
样本比例 P=m/n=68/200=0.34 由于样本容量相当大,因此可近似采用Z检验法 p p0 0.34 0.3 z 1.194 p (1 p ) 0.34 0.66 n 200
面向21世纪 课程教材
第五章
假设检验
第二节
2.方差检验过程 (1)提出原假设Ho和备择假设Ha。
2 H0 : 2 0
2 Ha : 2 0
(2)构造检验统计量:
(n 1) s 2

2
~

2
(n-1)
2 2分布。 在Ho成立的条件下,统计量 服从自由度为n-1的
(3)确定显著性水平。 (4)规定决策规则。 在双侧检验的情况下,拒绝区域在两侧,如果检验统计量大于右侧临界 值,或小于左侧临界值,则拒绝原假设。若是单侧检验,拒绝区域分布 在一侧,具体左侧还是右侧,可根据备择假设Ha的情况而定。 (5)进行判断决策。
面向21世纪 课程教材
第五章
假设检验
第二节
某厂采用自动包装机分装产品,假定每包重量报从正态分 布,每包标准重量为1000克,某日随机抽查9包,测得样本 平均重量为986克,标准差为24克,试问在0.05的检验水平 上,能否认为这天自动包装机工作正常?
;H 根据题意,提出假设: H0 : 1000 1: 1000

面向21世纪 课程教材
第二节 总体均值、比例和 方差的假设检验
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

11
无效假设(原假设)
(null hypothesis)
1. 2. 3. 4. 研究者想收集证据予以反对的假设 又称“0假设” 总是有符号 表示为 H0
H0 : = 某一数值 指定为符号 = 例如, H0 : 10cm

12
备择假设
(alternative hypothesis)
28
(3) 检验水准 ,称显著性水准,是预先规 定的概率值,它确定了小概率事件的标准。 在实际工作中常取 = 0.05。可根据不同研 究目的给予不同设置。
29
2. 计算检验统计量
根据变量和资料类型、设计方 案、统计推断的目的、是否满足特
定条件等(如数据的分布类型)选
择相应的检验统计量。
30
3. 确定P值
9
【例】某医生测量了 36 名从事铅作 业男性工人的血红蛋白含量,算得它 们 的 均 数 为 130.83ug/L , 标 准 差 为 25.74ug/L。问从事铅作业男性工人的 血红蛋白是否不同于正常成年男性的 平均值140ug/L?
10
假设检验的主要过程
1、利用反证法思想建立检验假设。包括H0 和H1两种。 2、利用一定的统计方法求出H0成立的概率 P值的大小; 3、结合小概率事件的原理做出统计推断, 即H0是否成立。
23
双侧检验的P 值
/2
拒绝H0
1/2 P 值
/2
拒绝H0
1/2 P 值
临界值
计算出的样本统计量
24
0
临界值
Z
计算出的样本统计量
左侧检验的P 值
抽样分布
拒绝H0
置信水平

1-
P值
临界值
25
0
样本统计量
计算出的样本统计量
右侧检验的P 值
抽样分布
置信水平 拒绝H0 1-

P值
0
26
临界值
1. 研究者想收集证据予以支持的假设 2. 也称“研究假设”
3. 总是有符号 , 或
4. 表示为 H1


H1 : <某一数值,或 某一数值
例如, H1 : < 10cm,或 10cm
13
(例题分析)
【例】 某医生测量了 36名从事铅作业男性工人的血红 蛋白含量,算得它们的均数为130.83ug/L,标准差 为 25.74ug/L 。问从事铅作业男性工人的血红蛋白 是否不同于正常成年男性的平均值140ug/L?
22
与界值结合进行决策
1. 给定显著性水平,查表得出相应的临界 值z或z/2, t或t/2 2. 将检验统计量的值与 水平的临界值进行 比较 3. 作出决策

双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0

我认为这种新药的疗效 比原有的药物更有效!
总体参数包括总体均 值、比例、方差等 分析之前必须陈述

4
什么是假设检验?
(hypothesis test)
1. 先对总体的参数(或分布形式)提出某种假设, 然后利用样本信息判断假设是否成立的过程 。 2. 即利用样本信息,根据一定的概率水准,推 断样本指标与总体指标、不同样本指标之间 的差别有无意义的统计分析方法。
41
检验效能
(power of test)
1. 拒绝一个错误的原假设的能力 2. 根据 的定义, 是指没有拒绝一个错 误的原假设的概率。这也就是说,1- 则 是指拒绝一个错误的原假设的概率,这 个概率被称为检验能力 ,也被称为检验的 势或检验的功效(power) 3. 可解释为正确地拒绝一个错误的原假设 的概率
和 的关系就像 翘翘板,小 就 大, 大 就小
你要同时减少两类 错误的惟一办法是 增加样本容量!


40
两类错误的控制
1. 一般来说,对于一个给定的样本,如果犯第Ι类错误 的代价比犯第Ⅱ类错误的代价相对较高,则将犯第 Ⅰ类错误的概率定得低些较为合理;反之,如果犯 第Ι类错误的代价比犯第Ⅱ类错误的代价相对较低, 则将犯第Ⅰ类错误的概率定得高些 2. 一般来说,发生哪一类错误的后果更为严重,就应 该首要控制哪类错误发生的概率。但由于犯第Ι类错 误的概率是可以由研究者控制的,因此在假设检验 中,人们往往先控制第Ι类错误的发生概率
2. 被称为观察到的(或实测的)显著性水平 3. P值一般是根据检验统计量并结合特定的分 布类型及其界值估计所得。主要用于与显著 性检验水准进行比较后进行决策。
21
检验统计量
(test statistic)
1. 根据样本观测结果计算得到的,并据以对原 假设和备择假设作出决策的某个样本统计量
2. 统计量的计算是对通过特定的检验方法计算 出来的。常见的检验方法包括 T 检验、 F 检 验、卡方检验等。 3. 检验方法的选择与研究目的、资料类型、设 计方案、统计方法的应用条件及样本量大小 等因素有关。
计算出的样本统计量
5.3 假设检验的步骤
27
1、建立检验假设,确定检验水准
(1)无效假设又称零假设,记为 H0; (2)备择假设又称对立假设,记为 H1。
对于检验假设,须注意:
① 检验假设是针对总体而言,而不是针对样本; ② H0 和 H1 是相互联系,对立的假设,后面的结论是 根据 H0 和 H1 作出的,因此两者不是可有可无,而是 缺一不可;
36
5.4 假设检验中的两类错误
37
假设检验中的两类错误
1. 第Ⅰ类错误(弃真错误)

原假设为正确时拒绝原假设 第Ⅰ类错误的概率记为

被称为显著性水平
2. 第Ⅱ类错误(取伪错误)


原假设为错误时未拒绝原假设 第Ⅱ类错误的概率记为 (Beta)


38
假设检验中的两类错误
(决策结果)
33
例3-5 某医生测量了36名从事铅作业男性工人的血 红 蛋 白 含 量 , 算 得 其 均 数 为 130.83g/L , 标 准 差 为 25.74g/L 。问从事铅作业工人的血红蛋白是否不同于正 常成年男性平均值140g/L?
(1)建立检验假设,确定检验水准
H0: =0 =140g/L,即铅作业男性工人平均血红 蛋白含量与正常成年男性平均值相等 H1: ≠0=140g/L,即铅作业男性工人平均血红 蛋白含量与正常成年男性平均值不等
1. 3.
有参数检验和非参数检验 逻辑上运用反证法,统计上依据小概率原理
5
5.2 假设检验的基本思想
6
假设检验的基本思想
提出假设 作出决策
拒绝假设 别无选择!
总体
我认为人口的平 均年龄是50岁


抽取随机样本
7
均值 x = 20
假设检验的基本思想
抽样分布
这个值不像我 们应该得到的 样本均值 ...
显著性检验水准 实际上也是事先规定的小概率事件
的概率大小。常取05或0.01。
假如我们选择=0.05,样本数据能拒绝原假设的证据
18
要强到:当H0正确时,这种样本结果发生的频率不超 过 5% ;如果我们选择 =0.01 ,就是要求拒绝 H0 的证 据要更强,这种样本结果发生的频率只有1%
16
双侧检验与单侧检验
(假设的形式)
以总体均值的检验为例
假设
原假设
双侧检验
H0 : =0
单侧检验
左侧检验
H0 : 0
右侧检验
H0 : 0
备择假设
17
H1 : ≠0
H1 : <0
H1 : >0
显著性检验水准
(significant level)
1. 是事先规定的对假设成立与否做出决策的根据。即 我们可以在事先确定用于拒绝无效假设H0的证据必 须强到何种程度。也就是对如果拒绝 H0 ,可能犯 错误的概率 P 值进行事先规定。而这个 P 值就叫显 著性检验水准,常用表示
=0.05
(2)计算检验统计量
本例 n=36, X =130.83g/L,S=25.74g/L,
0 =140g/L。按公式
130.83 140 t 2.138, 36 1 35 25.74 36
35
(3)确定P值,作出推断结论
以=35、 t 2.138 2.138 查附表 2 的 t 界 值表,因 t0.05/ 2,35 <2.138 < t0.02 / 2,35 ,故双尾概 率 0.02<P<0.05。按 = 0.05 水准,拒绝 H0, 接受 H1,有统计学意义。结合本题可认为从 事铅作业的男性工人平均血红蛋白含量低于 正常成年男性。
试进行研究假设的陈述。 H0 : H1 :
14
建立假设需注意的问题
1. 无效假设和备择假设是一个完备事件组,而 且相互对立

在一项假设检验中,无效假设和备择假设必有 一个成立,而且只有一个成立
2. 先确定备择假设,再确定原假设
3. 等号“=”总是放在原假设上
4. 因研究目的不同,对同一问题可能提出不同 的假设(也可能得出不同的结论)
;不拒绝原假设( 拒绝原假设的证据不充分 ) ,则表示 这样的样本结果只是偶然得到的
20
P 值 (P-value)
1. 如果原假设为真,所得到的样本结果会像实 际观测结果那么极端或更极端的概率

P值告诉我们:如果原假设是正确的话,我们 得到目前这个样本数据的可能性有多大,如果 这个可能性很小,就应该拒绝原假设
15
双侧检验与单侧检验
1. 备择假设没有特定的方向性,并含有符号 “ ”的假设检验,称为双侧检验或双尾 检验(two-tailed test) 2. 备择假设具有特定的方向性,并含有符号 “>”或“<”的假设检验,称为单侧检验或 单尾检验(one-tailed test)
相关文档
最新文档