统计学原理:第8章 假设检验
第8 假设检验(共80张PPT)

8.1 8.2 8.3 8.4
假设检验的根本问题 一个总体参数的检验 两个总体参数的检验 假设检验中的其他问题
我认为该企业生产的零件的平
均长度为4厘米!
什么是假设? 对总体 参数的一种看法
总体参数包括总 体均值、比例、方 差等
举例说明假设检验的根本思路
某单位职工上月平均收入为210元,这个 月的情况与上月没有大的变化,我们设想平均 收入还是210元.
样本均值的抽样分布
置信水平
拒绝域
1-
接受域
临界值
H0
样本统计量
如果备择假设具有符号“>〞,拒绝域位于抽样分 布的右侧,故称为右侧检验
样本均值的抽样分布
置信水平
1- 接受域
拒绝域
H0
样本统计量
临界值
请判断它们的拒绝域:
〔1〕假设检验的假设为H0:m=m0 ,H1: m≠m0,那么拒绝域为〔 〕。
〔2〕假设检验的假设为H0:m≥m0 ,H1: m < m0,那么拒绝域为〔 〕。
〔3〕假设检验的假设为H0:m≤m0 ,H1: m > m0,那么拒绝域为〔 〕。
检验统计量:Z > Z;
Z > Z/2 或Z <-Z/2 ;
Z <-Z
决策规那么
给定显著性水平 ,查表得出相应的临界 值 将检验统计量的值与 水平下的临界值进 行比较 双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0 得出拒绝或不拒绝原假设的结论
H0:m=10 H1:m≠10
例 6.2
某品牌洗涤剂在它的产品说明书中声称:平均 净含量不少于500g。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设。
第8章假设检验

二、两均数比较的u检验
完全随机设计中两组计量资料的比较
观察性研究中分别从两个总体中随机抽取两个计 量资料样本进行比较,且两组的样本含量n1和n2要 求等于或大于30 基本原理:在H0成立的条件下,即两样本是从 同一总体随机抽取的,其均数之差可以大于0,或小 于0,围绕0分布。 差值 X1 X 2 服从均数为 1 2 0,标准差(两均数 差的标准误)为 S X X 的正态分布
0
所代表的未知总体均数记作μ;检验的目的是推断μ与μ0
是否有差别
u
X 0 S/ n
例 8 –2
n 85
S 5.3cm
X 171.2cm
168.5cm
1. 建立假设、确定检验水准α。
H 0 : 168.5 (与1995年相比,2003年当地20岁应征男青年的身 高没有变化)
2
p
的正态分布
统计量:
u p 0 p 0 0 (1 0 ) / n
p
例8 – 4
π0 =8.5% ,n=1000,p=5.5%
1.建立假设,确定检验水准。 H0:π=8.5% H1:π< 8.5% 单侧检验,α=0.05。 2.计算检验统计量u值
0.055 0.085 u 3.402 0.085(1 0.085) /1000
2. 样本数据不要求一定服从正态分布总体。
2. 两总体方差相等(方差齐性,即 12 22 )。
3. 理论上要求:单样本是从总体中随机抽取,两样本为随 机分组资料;观察性资料要求组间具有可比性,保证因果 推论的合理性。
一、单样本均数的u检验
样本均数与总体均数比较,总体均数指已知的理论值、 标准值或经过大量观察所得到的稳定值,记作 ;样本
概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
教育与心理统计学第八章:假设检验

临界值
H0值
样本统计量
左侧检验示意图
(显著性水平与拒绝域 )
抽样分布
置信水平
拒绝域
1- 接受域
临界值
H0值
样本统计量
观察到的样本统计量
右侧检验示意图 (显著性水平与拒绝域 )
抽样分布
置信水平
1- 接受域
拒绝域
H0值 观察到的样本统计量
临界值
样本统计量
双侧检验原假设与备择假设的确定
▪ 双侧检验属于决策中的假设检验。即不论是拒绝H0还 是接受H0,都必需采取相应的行动措施。
1、原假设真实, 并接受原假设,判断正确; 2、原假设不真实,且拒绝原假设,判断正确; 3、原假设真实, 但拒绝原假设,判断错误; 4、原假设不真实,却接受原假设,判断错误。
假设检验是依据样本提供的信息进行判断,有犯错误 的可能。所犯错误有两种类型:
第一类错误是原假设H0为真时,检验结果把它当成不 真而拒绝了。犯这种错误的概率用α表示,也称作α错 误(αerror)或弃真错误。
型错误
β错误(取伪错误) 1-β(正确决策)
要使犯这两类错误的概率α 和β都尽可能小, α也不能定
的过低 。
在一般研究中,我们总是控制犯型错误
为什么???
假设检验中人们普遍执行同一准则:首先控制弃真错误(α错 误)。假设检验的基本法则以α为显著性水平就体现了这一原
则。
两个理由: 统计推断中大家都遵循统一的准则,讨论问题会比较方便。
0.076mm。试问新机床加工零件 的椭圆度均值与以前有无显著差
异?(=0.05)
属于决策中 的假设!
解:已知:X0=0.081mm, =.25,n=200,
x 0.076
北京工业大学《概率论与数理统计》课件 第8章 正态总体均值的假设检验

在数理统计中,把 “ X 的均值 μ =10” 这样
的一个欲检验的假设称为 “原假设” 或 “零 假设”,记成 “ H0:μ =10”。这里的“H”是 从英文“ hypothesis ”的字头而来,“ 0 ” 是从 “null”或“zero” 含义而生。
该检验称为两样本 t 检验。
说明
上面,我们假定 12=22。当然,这是个 不得已而强加上去的条件。因为,如果不加 这个条件,就无法使用简单易行的 t 检验。
在实用中,只要我们有理由认为12和22 相差不是太大,就可使用上述方法。通常的 做法是:如果方差比检验未被拒绝(见下节), 就认为12和22相差不是太大。
又如:考察一项新技术对提高产品质量是 否有效,就把新技术实施前后生产的产品质量
指标分别看成正态总体 N(1, 12)和 N(2, 22)。
这时,所考察的问题就归结为检验这两个正态
总体的均值 1和 2是否相等的问题。
设X1, X2, …, Xm与Y1, Y2, …, Yn 分别为抽
自正态总体 N(1, 12) 和N(2, 22) 的样本,记
的大小检验 H0 是否
成立。
合理的做法应该是:找出一个界限 c,
这里的问题是:如何确定常数 c 呢? 细致地分析:根据定理 6.3.1,有
于是,当原假设 H0:μ =10 成立时,有
为确定常数 c,我们考虑一个很小的正数, 如 =0.05。当原假设H0:μ =10 成立时,有
于是,我们就得到如下检验准则:
即新技术或新配方对提高产品质量确实有效。
单边检验 H0: μ =μ0 ‹–› H1: μ >μ0
现代心理与教育统计学 第八章-假设检验(张厚粲)

p值 >0.05 ≤0.05 ≤0.01
显著性 不显著 显著 极显著
符号表示
* **
虽然我们比较习惯取α=0.05和α=0.01,但也可以取其 它的显著性水平值,如0.005或0.001。
三、假设检验中的两类错误
(一)定义
错误(I型错误): H0为真时却被拒绝,弃真错误; 错误是 指虚无假设本身是正确的,但由于抽样的随机性而使 检验值落入了拒绝虚无假设的区域,致使我们作出了 拒绝虚无假设的结论,
正解:
1、提出零假设和备择假设 备择假设:用H1表示,即研究假设,希望证实的假设。 H1 : 1 0 (该班智力水平确实与常模有差异) 1100 零假设:用H0表示,即虚无假设、原假设、无差异假 设。 H0: 1=0 1 =100
2、确定适当的检验统计量
用于假设检验问题的统计量称为检验统计量。与参数 估计相同,需要考虑:
又或者是样本统计量与总体参数之间存在真实的差异, 是一种有差假设,用H1表示。 3.表达方式,如:
H1: X 0 或 X ;1 2 或 1 2 0 。
(二)虚无假设
1.研究人员为了证实研究假设是真的而利用概率论的 反证法所进行的假设,即从研究假设的反面进行假设。
第八章 假设检验
李金德
第一节 假设检验的原理 第二节 平均数的显著性检验 第三节 平均数差异的显著性检验 第四节 方差的差异检验 第五节 相关系数的显著性检验 第六节比率的显著性检验
第一节 假设检验的原理
在统计学中,通过样本统计量得出的差异做出一般性 结论,判断总体参数之间是否存在差异,这种推论过 程称作假设检验(hypothesis testing)
β μ0
统计学-第八章 假设检验

假设 原假设
双侧检验
单侧检验
左侧检验 右侧检验
H0 : m =m0 H0 : m m0 H0 : m m0
备择假设 H1 : m ≠m0 H1 : m <m0 H1 : m >m0
三、假设检验的程序---
4.例题分析
[例8.1] 某品牌洗衣粉在它的产品说明书中声称:平 均净含量不少于1250克。从消费者的利益出发,有关研 究人员要通过抽检其中的一批产品来验证该产品制造商 的说明是否属实。试写出用于检验的原假设与备择假设。
2.接受域:概率P>的区域,为大概率区域,称之 为原假设的接受区域。
3.拒绝域:概率P≤的区域,为小概率区域,称之 为原假设的拒绝区域。
三、假设检验的程序---
1.拒绝原假设H1 原则:临界值
2.接受原假设H0 原则:临界值
检验统计值的绝 对值大于临界值;
检验统计值的绝 对值小于临界值;
假设 H0为真实 H0为不真实
接受H0 判断正确
采伪错误()
拒绝H0 弃真错误()
判断正确
四、假设检验中的两类错误
第I类()错误和第II类()错误的关系
和的关系就像 翘翘板,小就 大, 大就小。
你要同时减少两类 错误的惟一办法是 增加样本容量!
关乎决策:三个与其
与其,人为地把显著性水平固定按某一水平上,不 如干脆选取检验统计量的P值;
第二节 一个正态总体的假设检验
二、均值m的假设检验
3.给出显著性水平(0.01、0.05或0.1)
4.确定接受域和拒绝域(以双侧检验为例)
2已知:当Z Z 2
,则拒绝原假设,反之则接受H0;
统计假设检验的原理和步骤是什么

统计假设检验的原理和步骤是什么
假设检验是一种统计推断方法,用于判断样本数据是否支持某个假设,并进行统计显著性推断。
原理:
假设检验的原理基于概率统计学,它通过比较观察到的样本数据与一个假设模型之间的差异,来做出关于总体参数的推断。
假设检验从概率的角度出发,将观察到的样本结果与被试验的假设进行比较,进而得出是否拒绝原假设的结论。
步骤:
1. 建立原假设(H0)和备择假设(H1):
原假设通常是关于总体参数的断言,备择假设是对原假设的否定或补充。
2. 选择显著性水平(α):
显著性水平表示对原假设不正确的容忍度,通常选取0.05或0.01作为显著性水平。
3. 计算检验统计量:
根据样本数据计算出特定的检验统计量,如Z值、t值等。
检验统计量的选择取决于样本量和总体分布的已知信息。
4. 确定拒绝域:
拒绝域是一组可能的观测结果,如果样本数据的检验统计量落在拒绝域内,则在给定显著性水平下拒绝原假设。
5. 计算p值:
p值是指当原假设为真时,观察到的统计量比原假设更"极端"的概率。
p值可以用来判断是否拒绝原假设,一般小于显著性水平α时拒绝原假设。
6. 得出统计结论:
根据检验统计量和p值,结合显著性水平,对原假设进行推断,判断是否拒绝原假设,得到统计结论。
总结:
假设检验是一种用于进行统计推断的方法,它通过假设与观察到的样本数据的比较,进行显著性推断。
假设检验的步骤包括建立原假设和备择假设、选择显著性水平、计算检验统计量、确定拒绝域、计算p值、得出统计结论。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8 - 12
统计学
STATISTICS (第五版)
假设检验中的两类错误 (决策风险)
8 - 13
统计学
STATISTICS
(第五版)
假设检验中的两类错误
1. 第一类错误(弃真错误)
原假设为真时拒绝原假设 第一类错误的概率为
被称为显著性水平
2. 第二类错误(取伪错误)
原假设为假时接受原假设 第二类错误的概率为
8 - 11
统计学
STATISTICS
(第五版)
什么是假设检验?
(hypothesis testing)
1. 事先对总体参数或分布形式作出某种假 设,然后利用样本信息来判断原假设是 否成立
2、采用逻辑上的反证法,依据统计上的小 概率原理
小概率原理:发生概率很小的随机事件在一 次试验中是几乎不可能发生的。
常用的 值有0.01, 0.05, 0.10
4. 由研究者事先确定
8 - 18
统计学
STATISTICS
(第五版)
作出统计决策
1. 计算检验的统计量
2. 根据给定的显著性水平,查表得出相应
的临界值z或z/2, t或t/2
3. 将检验统计量的值与 水平的临界值进
行比较
4. 得出拒绝或不拒绝原假设的结论
5、作出统计决策
因为(Z0.975 1.96) (Z 2.5),所以在显著性水平0.0.5的情况下拒绝H0
8 - 20
认为与1989年相比,1990年新生儿的体重有显著差异
统计学
STATISTICS (第五版)
利用P值进行决策
8 - 21
统计学
STATISTICS
(第五版)
什么是P 值?
(P-value)
STATISTICS
(第五版)
什么是假设?
(hypothesis)
对总体参数的的数值所作的一种陈述
总体参数包括总体均值、比例、方差等
分析之前必需陈述
统计的语言是用一个等式或不等式表示问题的原 假设,不表示它是既定事实,仅是假设。
8 -7
统计学
STATISTICS
(第五版)
假设问题的提出例题8.1
是大样本还是小样本 总体方差已知还是未知
3. 检验统计量的基本形式为
Z X 0
8 - 17
n
统计学
STATISTICS
(第五版)
规定显著性水平
(significant level)
什么是显著性水平? 1. 是一个概率值 2. 原假设为真时,拒绝原假设的概率
被称为抽样分布的拒绝域
3. 表示为 (alpha)
8 -4
统计学
STATISTICS
(第五版)
8.1 假设检验的基本问题
8.1.1 假设问题的提出 8.1.2 假设的表达式 8.1.3 两类错误 8.1.4 假设检验的流程 8.1.5 利用P值进行决策 8.1.6 单侧检验
8 -5
统计学
STATISTICS (第五版)
假设问题的提出
8 -6
统计学
8 - 15
统计学
STATISTICS
(第五版)
双侧检验为例图示说明
/ 2 拒绝
/ 2 拒绝
1/2 P 值
1/2 P 值
临界值
计算出的样本统计量
H0值
Z
临界值
计算出的样本统计量
8 - 16
统计学
STATISTICS
(第五版)
确定适当的检验统计量
什么是检验统计量? 1. 用于假设检验决策的统计量 2. 选择统计量的方法与参数估计相同,需考虑
1. 待检验的假设,又称“0假设”
2. 研究者想收集证据予以反对的假设
3. 总是有等号 , 或
4. 表示为 H0
H0: 某一数值 指定为 = 号,即 或 例如, H0: 3190(克)
8 -9
统计学
STATISTICS
(第五版)
提出原假设和备择假设
什么是备择假设?(alternative hypothesis)
(第五版)
第 8 章 假设检验
8.1 假设检验的基本问题 8.2 一个总体参数的检验 8.4 检验问题的进一步说明
8 -3
统计学
STATISTICS
(第五版)
学习目标
1. 了解假设检验的基本思想 2. 掌握假设检验的步骤 3. 对实际问题作假进行假设检验
统计学
STATISTICS
(第五版)
第 8 章 假设检验
8 -1
统计学
STATISTICS
(第五版)
参数估计和假设检验
相同点:利用样本对总体进行推断 不同点:
参数估计中是利用样本统计量估计总体参数; 假设检验是先对参数真值进行假设,然后利用 样本信息检验假设成立与否。
8 -2
统计学
STATISTICS
1. 是一个概率值,被称为观察到的(或实测 的)显著性水平,H0 能被拒绝的最小值
2. 如果原假设为真,所得到的样本观测结果 出现的概率。
8 - 22
统计学
STATISTICS (第五版)
由统计资料得知,1989年某地新生 儿的平均体重为3190克,
现从1990年的新生儿中随机抽取100 个,测得其平均体重为3210克,
问1990年的新生儿与1989年相比, 体重有无显著差异?
8 -8
统计学
STATISTICS
(第五版)
提出原假设和备择假设
什么是原假设?(null hypothesis)
(Beta)
对于一定量的样 本量,不能同时 使犯两类错误的 概率都很小。此 消彼长。
要使犯两类错误 的概率都变小, 只能是增加样本 量。
8 - 14
统计学
STATISTICS
(第五版)
假设检验的流程
▪ 1、提出假设 ▪ 2、确定适当的检验统计量
▪ 3、规定显著性水平 ▪ 4、计算检验统计量的值 ▪ 5、作出统计决策
8 - 19
统计学例题8.1 1、提出假设
STATISTICHS 0: 3190(克) H1: 3190(克)
(第五版)
2、确定适当的检验统计量 Z X 0 n
3、规定显著性水平(0.05 )Z0.025=-1.96 Z0.975=-1.96
4、计算检验统计量的值 Z X 0 3210 3109 2.5 n 80 100
1. 与原假设对立的假设,也称“研究假设”
2. 研究者想收集证据予以支持的假设总是有不 等号: , 或
3. 表示为 H1
H1: <某一数值,或 某一数值 例如, H1: < 3910(克),或 3910(克)
8 - 10
统计学
STATISTICS
(第五版)
提出原假设和备择假设
原假设与备择假设互斥, 肯定原假设,意味着放弃备择假设; 否定原假设,意味着肯定备择假设。