假设检验的基本问题
第六章 假设检验1

二,假设检验的过程
1,提出假设 3,作出决策
拒绝假设 别无选择
总体
我认为人口的 平均年龄是50 50岁 平均年龄是50岁
2,抽取随机样本
均值 X = 20
二,假设检验的过程 假设检验的具体步骤: 假设检验的具体步骤: 第一,提出原假设 第一,提出原假设(null hypothesis)和备择假设 和备择假设 (alternative hypothesis); ; 第二,确定合适的检验统计量; 第二,确定合适的检验统计量; 第三,规定显著性水平 ; 第三,规定显著性水平α; 第四,根据数据计算检验统计量的实现值; 第四,根据数据计算检验统计量的实现值; 第五,统计决策. 第五,统计决策.
原假设
(null hypothesis)
1. 2. 3. 4. 研究者想收集证据予以反对的假设 又称"0假设" 总是有符号 =, ≤ 或 ≥ 表示为 H0
– – –
H0 : = 某一数值 指定为符号 =,≤ 或 ≥ ≤ 例如, H0 : = 10cm
备择假设
(alternative hypothesis)
什么是P 值?
(P-value)
1.p值(p-value)是在零假设下, 1.p值(p-value)是在零假设下,检验统计量取其实现 是在零假设下 值及(沿着备择假设的方向)更加极端值的概率. 值及(沿着备择假设的方向)更加极端值的概率.
第五章假设检验

Hypothesis test
(二)P值假设检验的步骤 值假设检验的步骤
14
Hypothesis test
(一)假设检验中的两类错误 实际情况
决策结果 不拒绝H0 拒绝H0
H0为真 √ type I error
H0为伪 type II error √
•第Ⅰ类错误:指原假设为真,却拒绝原假设而犯的 类错误:指原假设为真,
错误, 错误,即弃真错误 发生概率为α 发生概率为α •第Ⅱ类错误:原假设为假时,未拒绝原假设而犯 第 类错误:原假设为假时, 的错误, 的错误,即取伪错误 发生概率为β 发生概率为β 15
27
Hypothesis test
3、利用P值决策的优点: 利用P 决策的优点: 直接给出了拒绝原假设犯第一类错误的真实概率; 直接给出了拒绝原假设犯第一类错误的真实概率; 避免了不同检验问题用同一个显著性水平; 避免了不同检验问题用同一个显著性水平; 当前计算机软件通常可以直接输出检验统计量的P值, 当前计算机软件通常可以直接输出检验统计量的P 免于查表, 免于查表,可直接判定
例如,针对特效药治愈率假定 例如,针对特效药治愈率假定H0 :θ≥97% 医疗周期假定H0 :t≤2个月 个月 服药后病情稳定情况H0 :d=2人 人
7
Hypothesis test
(2)备择假设(alternative hypothesis) 备择假设(alternative
★研究者收集证据想予以支持的假设 研究者收集证据想予以支持 予以支持的假设 ★表示为H1 ★表示形式:≠, >或<某一假定数值 表示形式:
Hypothesis test
4、决策规则 给定显著性水平α 给定显著性水平α,查统计量的对应分布表得出相 应的临界值。 应的临界值。 临界值通常取正值, 临界值通常取正值,应结合假设形式准确确定分布 中的临界值和拒绝域。 中的临界值和拒绝域。 将检验统计量的值与临界值进行比较 给出决策结果。 给出决策结果。 双侧检验: 统计量的值| 临界值, 双侧检验:|统计量的值|>临界值,则拒绝H0 左侧检验:统计量的值<临界值, 左侧检验:统计量的值<临界值,则拒绝H0 右侧检验:统计量的值>临界值, 右侧检验:统计量的值>临界值,则拒绝H0
假设检验PPT课件

【学习目标】通过对本章的学习,掌握假设检验的概念和 类型、假设检验的两类错误和假设检验的一般步骤;重点掌握 单个总体均值的检验和比率的检验。
第一节 假设检验的基本问题 第二节 △ 假设检验的应用
假设检验
第一节 假设检验的基本问题
一、假设检验的概念 二、假设检验的两类错误 三、假设检验的类型 四、假设检验的类型一般步骤
假设检验
第一节 假设检验的基本问题
什么小概率?
1.在一次试验中,一个几乎不可能发生的事件发生的概率; 2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假 设; 3.小概率由研究者事先确定。
假设检验
第一节 假设检验的基本问题
二、假设检验的两类错误(决策风险)
(一) 第一类错误 第一类错误,亦称拒真(弃真)错误。是指当原假设为 真时,但由于样本的随机性使样本统计量的具体值落入 了拒绝区域,这时所作的判断是拒绝原假设。 犯第一类错误的概率亦称拒真概率,它实质上就是前面
t
986 1000 24
2.333>
t n 1 2.1315
16
2
所以接受 H1,即这天包装机工作不正常。
假设检验
第二节 假设检验的应用
二、单个总体比率(成数)的假设检验
比率P是平均数的一种特殊形式,因而前面讲的平均 数检验理论都适用于总体比率P的假设检验,只是估计量 的形式略有不同。
【例4】我国出口的参茸药酒畅销于某国市场。据以往调查, 购买此种酒的顾客中40岁以上的男子占50%。经营该药酒 的进出口公司经理关心这个比率是否发生了变化,于是, 委托一个咨询机构进行调查,这个咨询机构从众多购买该 药酒的顾客中随机抽取了400名进行调查,结果有210名为 40岁以上的男子。试问在0.05的显著水平上,能否认为购 买此种药酒的顾客中40岁以上男子所占比率变化了?
第8章 假设检验

ˆ H0 : 0 ˆ H :
0 0
备择
假设
研究者想收集证据予以支持的假设。
1. 与原假设对立的假设 2. 总是有, 或 3. 表示为 H1
例如:
ˆ H0 : 0 ˆ H0 : 0 ˆ H :
0 0
ˆ H1 : 0 ˆ H1 : 0 ˆ H :
拒绝 H0
.025
拒绝 H0
.025
t
ta
2 . 262 /2
-2.262
0
2.262
t
不拒绝原假设,没有证据表明该供 货商提供的配件是不符合要求的。
二、总体比例的检验
大样本
p ~ N(,
(1 )
n
)
设假设的总体比例为0,总体比例的检验统计量为:
z
p 0
0 (1 0 )
拒绝 H0
.025
拒绝 H0
.025
-1.96
0
1.96
Z
由于是双侧检验,拒绝域在左右两侧,所以临界值为:
z za / 2 1.96
在显著性水平a=0.05上不拒绝原假设,表明样本提供的证据还 不足以推翻原假设,因此,没有证据表明该天生产的饮料不符
合标准要求。
【例】某批发商欲从生产厂家购进一批灯泡,根据 合同规定,灯泡的使用寿命平均不能低于1000小时。 已知灯泡使用寿命服从正态分布,标准差为20小时。 在总体中随机抽取100只灯泡,测得样本均值为960 小时。批发商是否应该购买这批灯泡? (a=0.05)
n
假设
双侧检验
左侧检验
右侧检验
假设形式
H0 : 0 H1 : 0
第五章 假设检验

0.05
结论:
改良后的新品种产量有显著提高
0
1.645
z
总体均值的检验
(大样本检验方法的总结)
假设 双侧检验 H0 : =0 H1 : 0 左侧检验 H0 : 0 H1 : <0 右侧检验 H0 : 0 H1 : >0
假设形式
已知:
统计量
z
0
临界值
样本统计量
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0 1-
/2
/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0 1-
/2
/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
拒绝H0 置信水平
第 5章 假设检验
5.1 假设检验的基本问题 5.2 总体均值的检验 5.3 总体比例的检验
假设检验在统计方法中的地位
统计方法
推断统计
描述统计
参数估计
假设检验
5.1 假设检验的基本问题
是否法国人的地理知识要比美国 人丰富?
1988年7月28日的纽约时报上刊登了一篇有关 人们地理知识的文章。这篇文章中描述了一个 由国家地理协会委托GalluP公司所做的研究结 果。研究者们从一些国家抽取许多成年人并请 他们鉴别在一个地图上的16个地方(包括13个 国家、中非、波斯湾和太平洋);然后把每个 人答对的个数加起来。 四个国家的样本中答对的个数的均值为:美国 6.9;墨西哥 8.2;大不列颠 9.0;法国 9.2。
应用统计学7假设检验

应用统计学第九章假设检验朱佳俊博士Applied Statistics 第一节假设检验的基本问题一、假设检验的基本概念对总体的概率分布或分布参数作出某种“假设”,根据抽样得到的样本观测值,运用数理统计的分析方法,检验这种“假设”是否正确,从而决定接受或拒绝“假设”,这就是本章要讨论的假设检验问题。
1、假设定义为一个调研者或管理者对被调查总体的某些特征所做的一种假定或猜想。
是对总体参数的一种假设。
常见的是对总体均值或比例和方差的检验;在分析之前,被检验的参数将被假定取一确定值。
2、假设检验(hypothesis test)(1)概念–事先对总体参数或分布形式作出某种假设–然后利用样本信息来判断原假设是否成立(2)类型–参数假设检验–非参数假设检验(3)特点–采用逻辑上的反证法–依据统计上的小概率原理... 因此我们拒绝假设 =20... 如果这是总体的真实均值样本均值μ= 50抽样分布H0这个值不像我们应该得到的样本均值...203、假设检验的基本思想小概率原理是假设检验的基本依据,即认为小概率事件在一次试验中几乎是不可能发生的。
当进行假设检验时,先假设H 0正确,在此假设下,若小概率事件A出现的概率很小,例如P (A )=0.01,经过取样试验后,A 出现了,则违反了上述原理,我们认为这是一个不合理的结果。
4、小概率原理5、原假设和备择假设(1)原假设(null hypothesis)研究者想收集证据予以支持的假设也称“研究假设”总是有符号≠, <或>表示为H 1–H 1 :μ<某一数值,或μ>某一数值–例如, H 1 :μ< 10cm ,或μ>10cm(2)备择假设(alternative hypothesis)研究者想收集证据予以支持的假设也称“研究假设”总是有符号≠, <或>表示为H1–H1 :μ<某一数值,或μ>某一数值–例如, H1 :μ< 10cm,或μ>10cm6、双侧检验与单侧检验(1)备择假设没有特定的方向性,并含有符号“≠”的假设检验,称为双侧检验或双尾检验(two-tailed test)(2)备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailed test)–备择假设的方向为“<”,称为左侧检验–备择假设的方向为“>”,称为右侧检验双侧检验与单侧检验(假设的形式)单侧检验H1: μ> μ0H1:μ< μ0H1: μ≠μ0备择假设H: μ≤μ0H: μ≥μ0H: μ= μ0原假设右侧检验左侧检验双侧检验假设二、假设检验中的两类错误与显示性水平1、假设检验中的两类错误(1)第Ⅰ类错误(弃真错误)–原假设为真时拒绝原假设–第Ⅰ类错误的概率记为α•被称为显著性水平(2)第Ⅱ类错误(取伪错误)–原假设为假时未拒绝原假设–第Ⅱ类错误的概率记为β(Beta)2、显著性水平(significant level)(1)是一个概率值(2)原假设为真时,拒绝原假设的概率–被称为抽样分布的拒绝域(3)表示为α(alpha)–常用的α值有0.01, 0.05, 0.10(4)由研究者事先确定三、检验统计量与拒绝域(一)检验统计量(test statistic)1、根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量2、对样本估计量的标准化结果–原假设H为真–点估计量的抽样分布点估计量的抽样标准差假设值—点估计量标准化检验统计量=3.标准化的检验统计量显著性水平和拒绝域(双侧检验)抽样分布临界值临界值α/2α/2 样本统计量拒绝H 0拒绝H 01 -α1 -置信水平显著性水平和拒绝域(单侧检验)0临界值α样本统计量拒绝H 0抽样分布1 -α置信水平(二)决策规则1、给定显著性水平α,查表得出相应的临界值z α或z α/2,t α或t α/22、将检验统计量的值与α水平的临界值进行比较3、作出决策–双侧检验:I 统计量I > 临界值,拒绝H 0–左侧检验:统计量< -临界值,拒绝H 0–右侧检验:统计量> 临界值,拒绝H 0四、利用P 值进行决策(一)什么是P 值(P -value)1、在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率–双侧检验为分布中两侧面积的总和2、反映实际观测到的数据与原假设H 0之间不一致的程度3、被称为观察到的(或实测的)显著性水平4、决策规则:若p 值<α, 拒绝H 0双侧检验的P 值α/ 2α/ 2Z拒绝H 0拒绝H 0临界值计算出的样本统计量计算出的样本统计量临界值1/2 P 值1/2 P 值临界值α样本统计量拒绝H 0抽样分布1 -1 -α置信水平计算出的样本统计量P 值左侧检验的P 值临界值α拒绝H 0抽样分布 1 -1 -α置信水平计算出的样本统计量P 值右侧检验的P 值五、假设检验步骤1、陈述原假设和备择假设2、从所研究的总体中抽出一个随机样本3、确定一个适当的检验统计量,并利用样本数据算出其具体数值4、确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5、将统计量的值与临界值进行比较,作出决策–统计量的值落在拒绝域,拒绝H 0,否则不拒绝H 0–也可以直接利用P 值作出决策第二节一个总体参数的检验z 检验(单尾和双尾)z 检验(单尾和双尾)t 检验(单尾和双尾)t 检验(单尾和双尾)z 检验(单尾和双尾)z 检验(单尾和双尾)χ2 检验(单尾和双尾)χ2 检验(单尾和双尾)均值均值一个总体一个总体比率比率方差方差是z 检验x z nμσ−=否z 检验ns x z 0μ−=一、总体均值的检验σ是否已知小样本容量n大σ是否已知否t 检验ns x t 0μ−=是z 检验nx z σμ0−=(一)总体均值的检验(大样本)•1.假定条件–正态总体或非正态总体大样本(n ≥30)2.使用z 检验统计量σ2已知:σ2未知:)1,0(~0N nx z σμ−=)1,0(~0N nsx z μ−=1、总体均值的检验(σ2已知)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml ,标准差为5ml 。
假设检验的基本问题

假设检验的基本问题一、什么是假设检验原假设H 0是接受检验的假设。
备择假设H 1是当原假设被否定时另一种可成立的假设。
原假设和备择假设相互对立,在任何情况下只能有一个成立。
二、假设检验中的小概率事件假设检验的基本思想——根据小概率的原理,可以做出是否接受原假设的决定。
小概率原理:指发生概率很小的随机事件在一次试验中几乎不可能发生的。
E : 据报载,某商店为搞促销,对购买一定数额商品的顾客给予一次摸球中奖的机会,规定从装有红、绿两色球各10个的暗箱中连续摸10次(摸后放回),若10次都是摸得绿球,则中大奖。
某人按规则去摸10次,皆为绿球,商店认定此人作弊,拒付大奖,此人不服,最后引出官司。
所谓“小概率事件”,究竟多大概率为小概率事件?在一个问题中,通常是指定一个正数10,<<αα,认为概率不超过α的事件是在一次试验中不会发生的事件,这个α称为显著性水平(Level of significance)。
通常可选取α=0.01,0.05,0.10等。
下面我们用假设检验的语言来模拟商店的推断:10提出假设:0H :此人未作弊;1H :此人作弊。
20 构造统计量,并由样本算出其具体值:统计量取为10次摸球中摸中绿球的个数N .由抽样结果算出N=1030求出在H 0下统计量N 的分布,构造对H 0不利的小概率事件。
40给定显著性水平α,确定临界值。
50得出结论。
在这些步骤中,关键的技术问题是确定一个适当的用以检验假设的统计量,这个统计量至少应该满足在H 0成立的情况下,其抽样分布易于计算(查到)。
在统计量选定以后,便可构造出由该统计量T 描述某个显著性水平下的一小概率事件{αB T ∈},我们称使得这一小概率事件发生的样本空间的点的全体 });,,,(:),,,{(2121αθB X X X T X X X V n n ∈X ∈=为H 0的否定域或拒绝域,最后的检验即是判断所给的样本是否落在V 内。
第五章 假设检验1

假设。设总体参数θ 的假设值为θ0 ,那么原假设记为:
H0:θ = θ0 它表示总体参数值与其假设值之间没有显著差异。
是其所要遵循的基本原则。由抽样分布理论可知,若原假设 H0 成立,则样本统
计值与总体参数假设值偏差很大的事件是一个小概率事件。倘若在一次抽样中, 样本统计值与总体参数假设值相差很大,那么在原假设成立的条件下,就是出现 了一个小概率事件。一旦出现小概率事件,就要怀疑原假设的正确性,从而否定 原假设。若一次抽样的样本统计值与总体参数假设值相差不大,那么就没有理由 拒绝原假设,也就只好接受原假设。
的,就要否定原假设,即 X ≠ 0.04 ;如果这种差异由随机抽样的偶然性引起,那
么这种差异就是不显著的,就不能否定原假设,即应认为 X = 0.04 。因此,假设
检验的实质就是样本信息是否有充分的理由来否定原假设。必须指出的是,我们 不是根据样本的结果去判断原假设与备择假设哪一个更有可能正确,这两个假设
“用什么标准来判断一项显著性检验的应用是正确的还是不正确的呢?” ——J.尼曼
第五章 假设检验
本章介绍假设检验的基本原理和一些常见的假设检验。具体要求:①正确理 解假设检验的含义与种类;②熟知如何建立原假设和备择假设,以及两者的意义; ③掌握假设检验的判断规则和基本步骤;④掌握一些常见的假设检验;⑤正确理
Hale Waihona Puke 形式,其构造公式为Z
=
θˆ −θ SE(θˆ)
或t
=
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设检验的基本问题
一、什么是假设检验
原假设H 0是接受检验的假设。
备择假设H 1是当原假设被否定时另一种可成立的假设。
原假设和备择假设相互对立,在任何情况下只能有一个成立。
二、假设检验中的小概率事件
假设检验的基本思想——根据小概率的原理,可以做出是否接受原假设的决定。
小概率原理:指发生概率很小的随机事件在一次试验中几乎不可能发生的。
E : 据报载,某商店为搞促销,对购买一定数额商品的顾客给予一次摸球中奖的机会,规定从装有红、绿两色球各10个的暗箱中连续摸10次(摸后放回),若10次都是摸得绿球,则中大奖。
某人按规则去摸10次,皆为绿球,商店认定此人作弊,拒付大奖,此人不服,最后引出官司。
所谓“小概率事件”,究竟多大概率为小概率事件?在一个问题中,通常是指定一个正数10,<<αα,认为概率不超过α的事件是在一次试验中不会发生的事件,这个α称为显著性水平(Level of significance)。
通常可选取α=0.01,0.05,0.10等。
下面我们用假设检验的语言来模拟商店的推断:
10
提出假设:0H :此人未作弊;1H :此人作弊。
20 构造统计量,并由样本算出其具体值:
统计量取为10次摸球中摸中绿球的个数N .由抽样结果算出N=10
30
求出在H 0下统计量N 的分布,构造对H 0不利的小概率事件。
40
给定显著性水平α,确定临界值。
50
得出结论。
在这些步骤中,关键的技术问题是确定一个适当的用以检验假设的统计量,这个统计量至少应该满足在H 0成立的情况下,其抽样分布易于计算(查到)。
在统计量选定以后,便可构造出由该统计量T 描述某个显著性水平下的一小概率事件{αB T ∈},我们称使得这一小概率事件发生的样本空间的点的全体 });,,,(:),,,{(2121αθB X X X T X X X V n n ∈X ∈=
为H 0的否定域或拒绝域,最后的检验即是判断所给的样本是否落在V 内。
因此,设计一个检验,本质上就是找到一个恰当的否定域V ,使得在0H 下,它的概率:a H V P 0)()|(≤=或 依据小概率原理推断可能会犯错误!
检验的原理是“小概率事件在一次试验中不发生”,以此作为推断的依据,决定是接受H 0或拒绝H 0.但是这一原理只是在概率意义下成立,并不是严格成立的,即不能说小概率事件在一次试验中绝对不可能发生。
仍以上例来说,尽管按统计推断结论,认为摸球人作弊,但事实上也完全可能没有作弊。
当摸奖人事实上的确是未作弊的话,商店的统计推断就犯了错误。
三、第一类错误、第二类错误与显著水平
第一类错误(弃真错误):原假设H 0本来为真,却错误地否定
了。
(属于弃真错误)
第二类错误(取伪错误):原假设H 0非真,但做出接受H 0的选择。
(属于取伪错误)
犯两错误的概率:在假设检验中,犯第一类错误的概率记为α,α也称为显著性水平。
犯Ⅱ类错误的概率记为β。
人们自然希望犯这两类错误的概率越小越好。
但对于一定的样本容量n ,两类错误有相反的关系,减小α会引起β增大,减少β会引起α增大。
可能带来的后果越严重,危害越大的一类错误,在假设检验中作为首要的控制目标!它是谁呢? 假设检验中,遵守首先控制犯α错误原则大家都在执行这样一个原则。
α
β 对H 0的行动 H 0是真的 H 1是真的
你的 态度 接受H 0 你正确
你犯第二类错误β 拒绝H 0
你犯第一
类错误α 你正确
原因是:原假设是什么常常是明确的,而替换假设常常是模糊的。
所以,人们常把最关心的问题作为原假设提出,将较严重的错误放到了α,这就能够在假设检验中对α错误实施有效控制。
假设检验中犯两类错误的概率如下图所示:
µ=µ0 µ0 (a )
µ=µ1>µ0
µ1 (b )
注意:
(1)在假设检验中,原假设0H 与备选假设1H 的地位不对等。
检验推断是“偏向”原假设,而“歧视”备选假设的。
在应用中一定要慎重提出原假设。
(2)对于0H 的否定是有力的,且 越小,小概率事件越难于发生,一旦发生了,这种否定就越有力,也就越能说明问题。
综上所述,处理参数的假设检验问题的步骤如下:
β
α
接受H 0 拒绝H 0
(1)根据实际问题的要求,给出原假设和备择假设;
(2)给定显著性水平α0和样本容量n;
(3)确定检验统计量以及拒绝域的形式;
(4)按P{当H0为真拒绝H0}≤α0求出拒绝域;
(5)取样,根据样本观察值做出决策,是接受H0还是拒绝H0。
四、SPSS中假设检验的判定原则
在SPSS系统中,所有的假设检验(包括非参数检验)都只要求使用者记住(必须记住!)检验的原假设H0是什么,并且按照以下的准则去判断是否应该接受原假设:
若sig>α0,则接受原假设H0;若sig<α0,则拒绝原假设H0。
One-Sample T Test过程检验单个变量的均值是否与给定的常数之间存在差异。
该过程对每个检验变量给出的统计量有:均值、标准差和均值的标准误。
该过程计算每个数据值与总体均值之间差的平均值,进行该差值为0的t检验及计算该差值的置信区间,用户可以指定检验的显著性水平。
(如:0.05)
〖练习〗数据文件“公司职工.sav”,试检验假设:
H0:平均受教育年限μ=13 H1:μ≠13
H0:平均受教育年限μ=13.5 H1:μ≠13.5
H0:平均当前薪金μ=13.5 H1:μ≠13.5
H0:平均年龄μ=40 H1:μ≠40。