第五章假设检验
教育与心理统计学 第五章 假设检验考研笔记-精品

假设检验中的小概率原理[一级][16J]
假设检验的基本思想是概率性质的反证法,即其基本思想是基于〃小概率事件在一次实验中不可能发生”这一原理。首先假定虚无假设为
真,在虚无假设为真的前提下,如果小概率事件在一次试验中出现,则表明〃虚无假设为真"的假定是不止确的,因为假定小概率事件在
一次试验中是不可能出现的,所以也就不能接受虚无假设,应当拒绝零假设。若没有导致小概率事件出现,那就认为"虚无假设为真”的
假定是正确的,也就是说要接受虚无假设。假设推断的依据:小概率事件是否出现,这是对假设作出决断的依据。
检验的假设
Ho为真
真实情况
检验的事件发生的概率在99%或95%的范围内
检验的事件发生的概率在5%或1%以内
错误的概率,其前提是“Ho为假
②它们都是在做假设检验的统计决策时可能犯的错误,决策者同时面临犯两种错误的风险,因此都极力想避免或者减少它们,但由于在忠
体间真实差异不变情况下,它们之间是一种此消彼长的关系,即a大时,0小;c(和B不能同时减少。
③在其他条件不变的情况下,不可能同时减小或增大两种错误的发生可能,常用的办法是固定a的情况下尽可能减小B,比如通过增大样本
若进行假设检验时总体的分布形态已知,需要对总体的未知参数进行假设检验,称其为参数假设检验。
(三)非参数检验[一级]
若对总体分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验,通常称为非参数假设检验。
(四)小概率事件和显著性水平
(1)假设推断的依据就是小概率原理
小概率事件:通常情况下,将概率不超过0.05(即5%)的事件当作“小概率事件",有时也定为概率不超过0.01(即1%)或0.001(0.1%\
第五章-假设检验与回归分析

件,得到拒绝域;
步骤 4:明确或计算样本均值 x ,得到U 变量的观测值 u x 0 n 0
若观测值 u 落入拒绝域,则拒绝零假设 H 0 ,即接受备择假设 H1 ,
否则不能拒绝零假设 H 0 。
第五章 假设检验与回归分析 例1、 已知某面粉自动装袋机包装面粉,每袋面粉重量 Xkg
服从正态分布 N(25,0.02) ,长期实践表明方差 2 比较稳定,从
第五章 假设检验与回归分析
U 检验的步骤:
步骤 1:提出零假设 H 0 : 0 与备择假设 H1 ;
步骤 2:明确所给正态总体标准差 0 值、样本容量 n 的
值,当零假设 H 0 成立时,构造变量
U X 0 n ~ N(0,1) 0
第五章 假设检验与回归分析
步骤 3:由所给检验水平 的值查标准正态分布表求出对应 的双侧分位数 u 的值或上侧分位数 u 的值,构造小概率事
u
2
0.05, u 1.96 ,
2
第五章 假设检验与回归分析
x 0 n
12.5 12 1 100
5 u
2
1.96
故拒绝 H0 ,即认为产品平均质量有显著变化。
小结与提问:
理解假设检验的基本原理、概念;掌握假设检验的步骤。
课外作业:
P249 习题五 5.01, 5.02,5.03。
0.10,再在表中第一列找到自由度 m n 1 7 1 6 ,
其纵横交叉处的数值即为对应的 t 分布双侧分位数 t 1.943
2
,使得概率等式
PT 1.943 0.10
成立。这说明事件 T 1.943是一个小概率事件,于是得到
拒绝域
t 1.943
第五章 假设检验与回归分析
第五章假设检验

5.1.1 假设检验基本原理
假设检验的原理是逻辑上的反证法和统计上的小概 率原理 反证法:当一件事情的发生只有两种可能A和B, 如果能否定B,则等同于间接的肯定了A。 小概率原理:发生概率很小的随机事件在一次实 验中是几乎不可能发生的。
概率小到多小才算是“小”?通常用显
8.7 - 9
=
= 3.162
2.5 10
5.1.1 假设检验基本原理
3)确定拒绝域 • 在检验统计量抽样分布的尾部(1侧或2侧)中划定 一小概率区域,一旦计算的检验统计量的实际值落 入此区域,就否定原假设,接受备择假设。 • 这个小概率也称为显著性水平,用 表示 • 通常取 =5%或 =1%
双侧检验
单侧检验 左侧检验 右侧检验
H0 : = 0 H0 : 0 H0 : 0
备择假设
H1 : 0 H1 : < 0 H1 : > 0
5.1.2 假设检验相关概念
• 例(续) –左侧检验
1)假设: H0: 9, HA: < 9
2)检验统计量:同双侧检验, z = -3.162
5.1 假设检验的基本问题
5.1.1 假设检验基本原理
假设:对总体的某些未知的或不完全知道的性质所 提出的待考察的命题。
假设检验:对假设成立与否做出的推断。
5.1.1 假设检验基本原理
问题的提出 – 例 :某猪场称该场的猪在体重为100kg时的平均背膘厚度 为9mm。 – 问题:此说法是否正确?有4种可能性(假设)
概率论与数理统计
主讲:孟丽丽
概率部分 第一章 概率论基本概念 第二章 随机变量及其分布
统计部分 第三章 统计基础知识 第四章 参数估计 第五章 假设检验 第六章 方差分析 第七章 相关与回归
第五章 假设检验

Di
4.1 3.8
1.0
4.2
5 15.3 12.0
3.3
6 13.9 14.7 -0.8
7 20.0 18.1 1.9
8 16.2 13.8 2.4
9 15.3 10.9 4.4
作业(以下任选一道)
1、查阅近两年的心理学和教育学权威杂志各一套(例 如,可查阅这几个年度的《心理学报》和《教育研究》 各一套),对其论文中使用的统计方法进行一项描述
(两个样本的“t”检验) 五、相关系数的显著性检验 六、方差差异的显著性检验
假设检验的一般步骤
(1)建立虚无假设和备择假设
双侧检验为:H0:µ=µ0
H1:µ‡µ0
单侧检验为:H0:µ<=µ0 或 H0:µ>=µ0
H1:µ>µ0 或 H1:µ<µ0
(2)寻找合适的统计量及其抽样分布,并计算统计量
T’=-1.929;SE2=3.468;t’ a/2=2.049
练习题5
对9个被试进行两种夹角(15o,30o)的缪 勒—莱依尔错觉实验结果如下,问两种夹角的 情况下错觉量是否有 显著差异?
被试 1
2
3
4
15o 14.7 18.9
17.2 15.4
30o 10.6 15.1
16.2 11.2
Z1.84;SE1.793
两类错误
H0为真
接受H0 拒绝H0
正确 α错误
前提 H0为假 β错误 正确
总体平均数的假设检验例题1
全区统一考试物理平均分μo=50,标准差σo=10.某 校的一个班(n=41)平均成绩 X =52.5.问该班成 绩与全区平均成绩差异是否显著.
(总体正态,总体方差已知)
第五章假设检验

Hypothesis test
(二)P值假设检验的步骤 值假设检验的步骤
14
Hypothesis test
(一)假设检验中的两类错误 实际情况
决策结果 不拒绝H0 拒绝H0
H0为真 √ type I error
H0为伪 type II error √
•第Ⅰ类错误:指原假设为真,却拒绝原假设而犯的 类错误:指原假设为真,
错误, 错误,即弃真错误 发生概率为α 发生概率为α •第Ⅱ类错误:原假设为假时,未拒绝原假设而犯 第 类错误:原假设为假时, 的错误, 的错误,即取伪错误 发生概率为β 发生概率为β 15
27
Hypothesis test
3、利用P值决策的优点: 利用P 决策的优点: 直接给出了拒绝原假设犯第一类错误的真实概率; 直接给出了拒绝原假设犯第一类错误的真实概率; 避免了不同检验问题用同一个显著性水平; 避免了不同检验问题用同一个显著性水平; 当前计算机软件通常可以直接输出检验统计量的P值, 当前计算机软件通常可以直接输出检验统计量的P 免于查表, 免于查表,可直接判定
例如,针对特效药治愈率假定 例如,针对特效药治愈率假定H0 :θ≥97% 医疗周期假定H0 :t≤2个月 个月 服药后病情稳定情况H0 :d=2人 人
7
Hypothesis test
(2)备择假设(alternative hypothesis) 备择假设(alternative
★研究者收集证据想予以支持的假设 研究者收集证据想予以支持 予以支持的假设 ★表示为H1 ★表示形式:≠, >或<某一假定数值 表示形式:
Hypothesis test
4、决策规则 给定显著性水平α 给定显著性水平α,查统计量的对应分布表得出相 应的临界值。 应的临界值。 临界值通常取正值, 临界值通常取正值,应结合假设形式准确确定分布 中的临界值和拒绝域。 中的临界值和拒绝域。 将检验统计量的值与临界值进行比较 给出决策结果。 给出决策结果。 双侧检验: 统计量的值| 临界值, 双侧检验:|统计量的值|>临界值,则拒绝H0 左侧检验:统计量的值<临界值, 左侧检验:统计量的值<临界值,则拒绝H0 右侧检验:统计量的值>临界值, 右侧检验:统计量的值>临界值,则拒绝H0
《统计学》第5章 假设检验

假设不成立时,即拒绝原假设时备以选择的假设,通常用H1 表示。备择
假设和原假设互斥,如在例5.1中,原假设是“2022 年全国城市平均
PM2.5 浓度与2018 年相比没有显著差异”,那么备择假设就是“2022
年全国城市平均PM2.5 浓度与2018 年相比存在显著差异”。相应的统计
小越好。但是,在一定的样本容量下,减少犯第I类错误的概率,就会
使犯第II类错误的概率增大;减少犯第II类错误的概率,会使犯第I类
错误的概率增大。增加样本容量可以使犯第I类错误的概率和犯第II类
错误的概率同时减小,然而现实中资源总是有限的,样本量不可能没有
限制。因此,在给定的样本容量下,必须考虑两类可能的错误之间的权
易被否定,若检验结果否定了原假设,则说明否定的理由是充分的。
第四章 参数估计
《统计学》
16
5.1 假设检验的基本原理
(四) P值法
假设检验的另一种常用方法是利用P值(P-value) 来确定检验决策。P值
指在原假设0 为真时,得到等于样本观测结果或更极端结果的检验统计
量的概率,也被称为实测显著性水平。P值法的决策规则为:如果P值大
1.96) 中。这里−1.96和1.96 称为临界值,区间(−1.96, 1.96) 两侧的
区域则被称为拒绝域。基于样本信息,可以计算得到相应的z检验统计量
值,已知ҧ = 46,0 = 53, = 14 , n = 100 = −5
14/10
第四章 参数估计
《统计学》
14
5.1 假设检验的基本原理
犯第I 类(弃真) 错误的概率 也称为显著性水平(Significance level),
第五章假设检验与回归分析

第五章假设检验与回归分析本章主要介绍了假设检验和回归分析两种统计方法。
一、假设检验假设检验是通过收集样本数据来对总体参数的假设进行推断的一种统计方法。
假设检验的步骤如下:1.建立原假设和备择假设:原假设是需要进行检验的参数的假设值,备择假设是对原假设的一种否定或补充。
通常将备择假设设置为我们要验证的假设。
2.收集样本数据:根据样本数据进行统计分析,并计算出检验统计量。
3.确定显著性水平:显著性水平是拒绝原假设的最大错误概率,通常取0.05或0.014.计算拒绝域的临界值:根据显著性水平和自由度,在统计表中查找检验统计量的临界值。
5.比较检验统计量和临界值:如果检验统计量落在拒绝域内,则拒绝原假设,否则接受原假设。
二、回归分析回归分析是一种用于研究两个或多个变量之间关系的统计方法。
它可以用来建立一个变量对另一个变量的预测模型。
回归分析的步骤如下:1.收集数据:根据需要收集自变量和因变量的数据。
2.建立模型:选择适当的回归模型,将自变量和因变量进行数学表达。
3.估计参数:使用最小二乘法等方法,对模型参数进行估计。
4.检验模型:通过检验模型的显著性水平,确定模型是否合理。
5.利用模型:使用估计的模型来进行预测和分析。
回归分析可以分为简单线性回归和多元线性回归两种。
简单线性回归是指只有一个自变量和一个因变量之间的关系,多元线性回归是指有多个自变量和一个因变量之间的关系。
回归分析的应用非常广泛,可以用于市场营销、财务管理、经济预测等领域。
通过回归分析,可以找到影响因变量的主要因素,并对未来的变化进行预测。
总之,假设检验和回归分析是统计学中两种重要的方法。
假设检验用于对总体参数的假设进行验证,回归分析用于研究变量之间的关系。
这两种方法在实际应用中具有广泛的价值。
第五章 假设检验

0.05
结论:
改良后的新品种产量有显著提高
0
1.645
z
总体均值的检验
(大样本检验方法的总结)
假设 双侧检验 H0 : =0 H1 : 0 左侧检验 H0 : 0 H1 : <0 右侧检验 H0 : 0 H1 : >0
假设形式
已知:
统计量
z
0
临界值
样本统计量
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0 1-
/2
/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0 1-
/2
/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
拒绝H0 置信水平
第 5章 假设检验
5.1 假设检验的基本问题 5.2 总体均值的检验 5.3 总体比例的检验
假设检验在统计方法中的地位
统计方法
推断统计
描述统计
参数估计
假设检验
5.1 假设检验的基本问题
是否法国人的地理知识要比美国 人丰富?
1988年7月28日的纽约时报上刊登了一篇有关 人们地理知识的文章。这篇文章中描述了一个 由国家地理协会委托GalluP公司所做的研究结 果。研究者们从一些国家抽取许多成年人并请 他们鉴别在一个地图上的16个地方(包括13个 国家、中非、波斯湾和太平洋);然后把每个 人答对的个数加起来。 四个国家的样本中答对的个数的均值为:美国 6.9;墨西哥 8.2;大不列颠 9.0;法国 9.2。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章假设检验本章介绍假设检验的基本概念以及参数检验与非参数检验的主要方法。
通过学习,要求:1.掌握统计检验的基本概念,理解该检验犯两类错误的可能;2. 熟练掌握总体均值与总体成数指标的各种检验方法;包括:z 检验、t 检验和p- 值检验;4. 掌握基本的非参数检验方法,包括:符号检验、秩和检验与游程检验; 5. 能利用Excel 进行假设检验。
第一节假设检验概述一、假设检验的基本概念假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。
假设检验与区间估计结合起来,构成完整的统计推断内容。
假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。
本章分别讨论这两类检验方法。
进行假设检验,首先要对总体的分布函数形式或分布的某些参数做出假设,然后再根据样本数据和“小概率原理” ,对假设的正确性做出判断。
这种思维方法与数学里的“反证法” 很相似,“反证法”先将要证明的结论假设为不正确的,作为进一步推论的条件之一使用,最后推出矛盾的结果,以此否定事先所作的假设。
反证法所认为矛盾的结论,也就是不可能发生的事件,这种事件发生的概率为零,该事件是不能接受的现实。
其实,我们在日常生活中,不仅不肯接受概率为0 的事件,而且对小概率事件,也持否定态度。
比如,虽然偶尔也有媒体报导陨石降落的消息,但人们不必担心天空降落的陨石会砸伤自己。
所谓小概率原理,即指概率很小的事件在一次试验中实际上不可能出现。
这种事件称为“实际不可能事件” 。
小概率的标准是多大?这并没有绝对的标准,一般我们以一个所谓显著性水平 a 0<加1)作为小概率的界限,a的取值与实际问题的性质有关。
所以,统计检验又称显著性检验。
下面通过一个具体例子说明假设检验是怎样进行的。
【例5-1】消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。
包装上标明的容量为250毫升。
消费者协会从市场上随机抽取50盒该品牌纸包装饮品,测试发现平均含量为248毫升,小于250毫升。
这是生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢?上述例子中,消费者协会实际要进行的是一项统计检验工作,检验总体平均容量是否等于包装上注明的250 毫升。
即,检验总体平均=250 是否成立。
这就是一个原假设(null hypothesis) ,通常用H 0表示,即:H 0:=250与原假设对立的是备选假设( alternative hypothesis) H 1,备选假设是在原假设被否定时另一种可能成立的结论。
备选假设比原假设还重要,这要由实际问题来确定,一般把期望出现的结论作为备选假设。
上例中可能的备选假设有三种:第一种:如果消费者协会希望知道的是,该品牌饮料的平均容量是否为标明的250毫升,则Hi :工250第二种:如果消费协会希望知道该品牌饮料的平均容量是否少于标明的250毫升,则Hl: <250第三种:如果消费者协会希望知道该品牌饮料的平均容量是否大于标明的250毫升,则H i: >250由于备选假设不同,可将假设检验分为双侧(边、尾)检验(two tailed test),和单侧(边、尾)检验(one tailed test)。
对此,我们在后面将进一步说明。
原假设与备选假设确定之后,我们要构造一个统计量来决定是“接受原假设,拒绝备选假设”,还是“拒绝原假设,接受备选假设”。
对不同的问题,要选择不同的检验统计量。
检验统计量确定后,就要利用该统计的分布以及由实际问题中所确定的显著性水平,来进一步确定检验统计量拒绝原假设的取值范围,即拒绝域。
在给定的显著性水平a下,检验统计量的可能取值范围被分成两部分:小概率区域与大概率区域。
小概率区域就是概率不超过显著性水平a的区域,是原假设的拒绝区域;大概率区域是概率为1- a的区域,是原假设的接受区域。
如果样本统计量落入拒绝域,我们就拒绝原假设,接受备选假设,认为样本数据支持备选假设的结论;如果样本统计量落入接受区域,我们就接受原假设,认为没有充分证据证明备选假设结论为真。
请注意,我们这里使用的判断语气比较委婉,原因是:拒绝域是小概率区域,按小概率原理应该拒绝原假设,但是,小概率事件不是完全不可能事件,还是有可能发生的;接受区域是大概率区域,大概率事件也不是必然事件。
无论是接受原假设还是拒绝原假设,都有产生判断失误的可能。
因此,不宜将统计检验的结论过于绝对化。
二、两种类型的错误统计假设检验是通过比较检验统计量的样本数值,作出决策。
统计量是随机变量,据之所作的判断不可能保证百分之百的正确。
一般来说,决策结果存在以下四种情形:原假设是真实的,判断结论是接受原假设,这是一种正确的判断;原假设是不真实的,判断结论是拒绝原假设,这也是种正确的判断;原假设是真实的,判断结论是拒绝原假设,这是一种产生“弃真错误”的判断;原假设是不真实的,判断结论是接受原假设,这又是一种产生“取伪错误”的判断。
以上四种判断可归纳为下列表格形式:表5-1 统计决策表类错误”。
无论是第一类错误还是第二类错误,都是检验结论失真的表现,都是应尽可能地加以避免的情形,如果不能完全避免,也应该对其发生的概率加以控制。
第一类错误产生的原因是:在原假设为真的情况下,检验统计量不巧刚好落入小概率的拒绝区域。
因此,犯第一类错误的概率大小就等于显著性水平的大小,即等于a。
我们可以通过控制显著性水平大小的方式,来控制犯第一类错误的可能性大小。
a定的越小,犯第一类错误的可能性就越小,例如a=0.05,表示犯第一类错误的可能性为5% , 100次判断中,产生弃真性错误的次数是 5次;进一步降低显著性水平,取 a =0.01 ,这时犯第一类错误的 概率下降为1%。
所以统计学上,又称第一类错误为a 错误。
第二类错误是“以假为真”的错误,即把不正确的原假设,当做正确的而将它接受了的 错误。
犯第二类错误大小的概率记为 3,因此,统计学上称第二类错误为 B 错误。
犯第二类错误的概率与犯第一类错误的概率是密切相关的,在样本一定条件下,a 小,3就增大;a 大,3就减小。
为了同时减小 a 和3只有增大样本容量,减小抽样分布的离散性,这样才【例5-2】按照法律,在证明被告有罪之前应先假定他是无罪的。
也就是原假设是 H 。
:被告无罪;备选假设 H !:被告有罪。
法庭可能犯的第一类错误是:被告无罪但判他有罪; 第二类错误是:被告有罪但判他无罪。
犯第一类错误的性质是“冤枉了好人”,第二类错误 的性质是“放过了坏人”。
为了减小“冤枉好人”的概率,应尽可能接受原假设,判被告无 罪,这就有可能增大了“放过坏人”的概率;反过来,为了不“放过坏人”,增大拒绝原假 设的概率,相应地就又增加了“冤枉好人”的可能性,这就是a 与3的关系。
当然,这只是 在“一定的证据下”的两难选择。
如果进一步收集有关的证据,在充分的证据下,就有可能 做到既不冤枉好人,又不放过坏人。
在现有证据不充分的条件下,法庭控制两类错误概率的 实践是:按案件的性质决定首先要控制哪一类错误的概率,如果案件将来对社会危害大, 就 要控制少犯第二类错误的概率,免得放过的坏人继续危害社会;如果案件对社会没有什么大 的危害,不妨“放他一马”,免得冤枉了好人,影响当事人“一生的前程” 。
三、检验功效检验效果好与坏,与犯两类错误的概率都有关。
一个有效的检验首先是犯第一类错误的 概率a 不能太大,否则的话,就经常产生弃真现象;另外,3错误就是取伪的错误,在犯第 一类错误概率得到控制的条件下, 犯取伪错误的概率也要尽可能地小,或者说,不取伪的概 率1- 3应尽可能增大。
1- 3越大,意味着当原假设不真实时,检验判断出原假设不真实的概 率越大,检验的判别能力就越好;1- 3越小,意味着当原假设不真实时,检验结论判断出原 假设不真实的概率越小, 检验的判别能力就越差。
可见1- 3是反映统计检验判别能力大小的 重要标志,我们称之为检验功效或检验力。
前面分析说明,第一类错误和第二类错误是一对矛盾体,在其他条件不变时,减小犯第 一类错误的可能性, 势必增加犯第二类错误的可能性;增大第一类错误的可能性, 又能减小 犯第二类错误的可能性。
可见a 的大小,影响到 3的大小,进而影响到1- 3的大小。
犯第一 类错误的概率或检验的显著性水平a 是影响检验力的一个重要因素。
在其他条件不变下, 显 著性水平a 增大,3随之减小,检验功效就增强。
可见取 a =0.1时比取0=0.01时,检验的功效强,检验力大。
我们在统计检验中,一般都是首先控制犯第一类错误的概率, 也就是显著性水平 a 都尽量取较小的值,尽量避免犯弃真的错误,在其他条件不变时,3就增大,检验的功效就减弱。
该如何来调和这一对相互对抗的矛盾呢?惟一的办法就是增大样本容量,因为增加样本容量能够既保证满足较小的a需要,同时又能减小犯第二类错误的概率B,抵消检验功效的衰减。
可见样本容量大小是影响检验功效大小的一个重要因素,可通过增大样本容量方法提高检验功效。
然而,实际上样本容量n的增加也是有限制的,兼顾a与B很困难,这时,鉴于a风险一般比B风险重要,首先考虑的还是控制a风险。
影响检验功效大小的另一因素是原假设与备选假设间的差异程度。
如果这两个假设间的差异是非常明显的,这时原假设不真而取伪的可能性就减小,即B就减小,检验功效就大。
否则的话,就较难通过检验把原假设与备选假设区分开来,影响检验功效的提高。