第六章 假设检验(Hypothesis test)
第六章 假设检验2006

第六章参数假设检验假设检验(test of hypothesis)亦称显著性检验(test of statistical significance),就是先对总体的参数或分布做出某种假设,如假设两个总体均数相等,总体服从正态分布或两总体分布相同等,然后用适当的统计方法计算某检验统计量,根据检验统计量的大小来推断此假设应当被接受或拒绝,它是统计推断的另一重要方面。
假设检验可以分为两类:一类是已知总体分布类型,对其未知总体参数的假设作假设检验,称为参数检验(parametric test),主要讨论总体参数(均值、方差、总体率等)的检验;另一类是对未知总体分布类型的总体假设作假设检验,称为非参数检验(non-parametric test),主要包括总体分布形式的假设检验、随机变量独立性的假设检验等。
本章主要介绍有关总体参数(均值、方差、总体率等)的参数检验问题。
第一节假设检验的基本概念一、假设检验问题及基本原理(一)假设检验问题我们先来看个具体的例子。
例6.1某药厂用自动包装机包装葡萄糖,按规定每袋葡萄糖的标准重量为500克,若已知包装机包装的每袋葡萄糖重量服从正态分布,且按以往标准知总体方差σ2=6.52,某日开工后,为检验包装机工作是否正常,随机抽取6袋葡萄糖,测得其平均重量x=504.5(克),问该日自动包装机包装的平均重量是否还是500克?某日随机抽取的6袋葡萄糖的平均重量x=504.5(克),与标准重量500克相比差4.5克,造成该差异的原因有两种可能:①这日自动包装机工作正常,其包装的总体平均重量μ=500克,此6袋葡萄糖的平均重量这一样本均值与总体均值不同,是随机抽样误差造成的;②这日自动包装机工作不正常,其包装的总体平均重量μ≠500克,故从此总体中随机抽取的6袋葡萄糖的平均重量与标准重量存在实质性差异,而不仅仅是抽样误差造成的。
上述两种可能是相互对立的、互不相容的,究竟哪一种可能是对的,可用假设检验的方法来判断。
假设检验(Hypothesis

假设检验(Hypothesis Test)假设检验是数理统计中按照⼀定的假设条件由样本推断总体的⼀种⽅法,因此假设检验也成为“显著性检验(Test of statistical significant)”,是研究样本与样本之间、样本与总体之间的误差是由抽样误差引起的还是本质误差的统计推断⽅法。
它的基本思想是在假设成⽴的条件下,根据某个统计⽅法(如Z检验、卡⽅检验等)的⽅法估计输⼊数据的统计特性,根据统计特性和输⼊数据的分布估计假设成⽴的概率⼤⼩,如果⼩于某⼀个预先设定的“显著性⽔平(significant level)”则说明假设不成⽴,反之则说明假设成⽴。
假设检验所定义的假设成为零假设,数学上⼀般写成H0(念:H-nought)。
与H0对⽴的假设,即对⽴假设,也称为备择假设。
由于我们对于假设的判断是基于概率统计所作出的判断,那么我们就很有可能(⼀定的概率)做出错误的判断。
错误分两种,第⼀类错误为H0假设成⽴,但是我们却认为它不成⽴,第⼆类错误是说H0不成⽴,但是我们却认为它成⽴。
⼀般⽽⾔,第⼀类错误更难为⼈所忍受,所以在判断时,允许犯这种错误的可能性必须要极低——即犯第⼀类错的事件应该是⼀个⼩概率事件。
假设检验就是基于这种⼩概率原理,即事先确定的作为判断的标准,即允许犯错的⼩概率标准,这种⼩概率标准就是统计学上定义的“显著性⽔平-α”,如果根据假设计算出来的概率⼩于这个显著性⽔平,则拒绝原假设,反之,如果⼤于这个标准,则承认原假设。
因此,⼀般把1-α称为“置信区间”或者“接收区间”,⼩于α的区间称为“拒绝区间”。
举个例⼦来说明,⼀个⼈被控诉犯罪,陪审团根据现有的条件做出对这个⼈有罪还是⽆罪的判断。
事实上,陪审团就是进⾏⼀个假设检验。
假设H0:被告⽆罪假设H1:被告有罪当然,陪审团现在还不知道哪个假设是成⽴的,他们必须根据控辩双⽅的证词做出判断,判断的结果只有两种,⼀种是被告⽆罪释放,⼀种是被告罪名成⽴。
06.假设检验基础

个统计量落入区域 拒绝域 是个小概率事件。
如果该统计量的实测值落入拒绝域,也就是说,
H0 成立下的小概率事件发生了,那么就认为H0
不可信而否定它。否则我们就不能否定H0 (只
好接受它).
假设检验的基本步骤:
1. 建立检验假设,确定检验水准;
H0:零假设、无效假设。是与研究假设有关的、被推断特 征某种确定的关系; H1:备择假设、对立假设。是被推断总体特征的另一种关 系或状况,与H0既有联系又互相对立。 检验水准,将小概率事件具体化,即规定概率不超过 就是小概率。
应用条件:差值服从正态分布!
假设检验的步骤
1. 建立检验假设,确定检验水准;
H 0 : d 0, H 1 : d 0,
0.05(双侧)
2. 计算统计量;
d 0 ~ t , n 1 Sd n
t
X 0 X 0 t , n 1 SX S n
假设检验
——通过对假设作出取舍抉择来达到解决问题的目的
A.东北某县儿童囱门闭和月龄的总体均数与北方一般儿
童的均数相等无差异假设、零假设 H0(null hypothesis)
B.东北某县儿童囱门闭和月龄的总体均数与北方一般儿
童的均数不相等对立假设、备择假设H1(alternative
hypothesis)
单样本t检验
One sample t-test
试验设计
一组样本均数(代表未知总体均数)与已知总 体均数(一般为理论值、标准值或经过大量
观察所得稳定值等)的比较。
X 0 X 0 t , n 1 SX S n
应用条件:样本来自正态分布的总体 且为随机样本!
例:根据大量调查,已知健康成年男子的脉
第6章假设检验

H0: 1000
H1: 1000
27
All rights reserved
南审数统学院
双侧检验和单侧检验(续)
研究的问题
假设
双侧检验 H0 H1 = ≠ 左侧检验 < 右侧检验 >
28
All rights reserved
建立的原假设与备择假设应为 H0: 10 H1: 10
23
All rights reserved
南审数统学院
双侧检验和单侧检验(续)
单侧检验
备择假设具有特定的方向性,并含有符号“>”或 “<”的假设检验,称为单侧检验或单尾检验(onetailed test) 备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
14
All rights reserved
假设的陈述(续)
南审数统学院
零假设的提出
所假设的总体参数值为研究者认为不对的总 体参数值 实质:科学研究中的保守主义 比如:新的工艺或技术没有造成任何改变, 新药没有任何疗效,变量间没有联系
15
All rights reserved
假设的陈述(续)
24
All rights reserved
南审数统学院
双侧检验和单侧检验(续)
例析:
一项研究表明,采用新技术生产后,将会使产品的 使用寿命明显延长到1500小时以上。检验这一结论 是否成立 研究者总是想证明自己的研究结论(寿命延长) 是正确的 备择假设的方向为“>”(寿命延长) 建立的原假设与备择假设应为 H0: 1500 H1: 1500
(卫生统计学)第六章 假设检验基础

药前后患儿血清中免疫球蛋白IgG(mg/dl)含量
编号 1 2 3 4 5 6 7 8 9 10 11 12
用药前 1206.4 921.69 1294.08 945.36 721.36 692.32 980.01 691.01 910.39 568.56 1105.52 757.43
用药后 1678.44 1293.36 1711.66 1416.70 1204.55 1147.30 1379.59 1091.46 1360.34 1091.83 1728.03 1398.86
目的
H0
H1
双侧检验 是否μ1≠μ2
μ1=μ2
μ1≠μ2
单侧检验 是否μ1>μ2
μ1=μ2
μ1>μ2
或是否μ1<μ2
μ1=μ2
μ1<μ2
返回
选定检验方法和计算检验统计量
要根据研究设计的类型和统计推断的目的选用不同的检验方法。如 成组设计的两样本均数的比较用t检验(小样本)或Z检验(大样本), 两样本方差的比较用F检验。
(卫生统计学)第六章 假设检验基础
第一节、假设检验的概念与原理 一、假设检验的思维逻辑
1.小概率原理 小概率事件在一次随机试验中几乎是不可能发生
2.假设检验处理问题的特点 ⑴从全局的范围,即从总体上对问题作出判断 ⑵不可能对总体的每个个体均作观察
二、假设检验步骤
例6-1 已知北方农村儿童前囟门闭合月龄为14.1月。某研究者从东北某县抽取36名 儿童,得囟门闭合月龄均值为14.3月,标准差为5.08月。问该县儿童前囟门闭合月 龄的均数是否大于一般儿童?
四、方差齐性检验 homogeneity of variance test
Chapter 6 假设检验

α/2
拒绝H0
1-α 接受H0
α/2
拒绝H0
II类(取伪):即P(接受H0|
),常为ß
6.4单侧检验问题
单侧问题:一批产品,供给方称其平均寿命 不小于1000小时。抽样,验证是否可信 标准值为“效益”类:越大越好 标准值为“成本费用”类:越小越好 难点:如何定
368 gm.
H0: m = 368 H1: m 368
Steps of Hypothesis Test 假设检验的步骤 提出原假设H0与备选假设H1; 选择检验统计量;
给定显著性水平α,确定拒绝域;
由样本值计算统计量的值;
作判断,确定接受还是拒绝H0。
H0: m = 386 H1: m 386
又Za=1.96,-Za=-1.96(临界点) 由1.25>-1.96 故接受H0,即认为可以相信已达标
2: H0: μ μ 0 =1000 H1: μ > μ 0 =1000 有统计量:
Z =
X m
1010 1000 = = 1Байду номын сангаас25 80 n 100
又Za=1.646 故应取H0,即认为未能达标
思考:如何处理为好?如何理解矛盾的结论?
区间估计
对m无先验信息
假设检验
有经验值或标准值
抽样定区间
理论严格
抽样看是否差不多
不严格,不能避免犯错误
3、对
的进一步理解
“=”表示差异不大、不明显、差不多; “≠”表示有显著差异。 这里的“=”与“≠”仅有形式上等与不 等的逻辑互补关系,但只能借其形式表达 “差不多”与“差异显著”两种倾向。
假设检验

假设检验假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。
具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。
常用的假设检验方法有u—检验法、t检验法、χ2检验法(卡方检验)、F—检验法,秩和检验等。
中文名假设检验外文名 hypothesis test提出者 K.Pearson 提出时间 20世纪初1、简介假设检验又称统计假设检验(注:显著性检验只是假设检验中最常用的一种方法),是一种基本的统计推断形式,也是数理统计学的一个重要的分支,用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
[1]2、基本思想假设检验的基本思想是小概率反证法思想。
小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。
反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设成立。
[2] 假设是否正确,要用从总体中抽出的样本进行检验,与此有关的理论和方法,构成假设检验的内容。
设A是关于总体分布的一项命题,所有使命题A成立的总体分布构成一个集合h0,称为原假设(常简称假设)。
使命题A不成立的所有总体分布构成另一个集合h1,称为备择假设。
如果h0可以通过有限个实参数来描述,则称为参数假设,否则称为非参数假设(见非参数统计)。
如果h0(或h1)只包含一个分布,则称原假设(或备择假设)为简单假设,否则为复合假设。
对一个假设h0进行检验,就是要制定一个规则,使得有了样本以后,根据这规则可以决定是接受它(承认命题A正确),还是拒绝它(否认命题A正确)。
第六章 假设检验

Ha : u≠3190(克) (有符号 , 或 )
2、Ha为备择假设,表示1990年新生儿与1989年新
生儿体重有明显差异。也可表达为:
Ha:u ≠ m0 或 Ha:u- m0 ≠0
6.1 假设检验的基本概念
提出假设 (结论与建议)
第Ⅰ类错误的概率的条件下,尽可能使犯第Ⅱ类
错误的概率减小。
6.2 一个总体参数的检验
1. 总体均值的检验 2. 总体比例的检验
第四章 概率论与抽样分布
6.2 一个总体参数的检验
总体均值的检验
(检验样本是否来自某已知总体均值的总体)
第四章 概率论与抽样分布
6.2 一个总体参数的检验
总体均值的检验( 2 已知)
H0 :m 1.35 Ha :m <1.35 = 0.01
n = 50 临界值(c):
拒绝H0 0.01
-2.33 0
检验统计量:
z 1.3152 1.35 2.6061 0.365749 50
决策:
拒绝H0
结论:
新机床加工的零件尺寸的平均误 差与旧机床相比有极显著的降低
z
6.2 一个总体参数的检验
6.2 一个总体参数的检验
显著性水平和拒绝域
抽样分布
(左侧检验 )
置信水平
拒绝H0
1 -
临界值
H0 样本统计量
第四章 概率论与抽样分布
6.2 一个总体参数的检验
显著性水平和拒绝域
抽样分布
(左侧检验 )
置信水平
拒绝H0
1 -
临界值
H0
样本统计量
第四章 概率论与抽样分布
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
H0:
Back 11
二、接受域和拒绝域
假设设定之后,我们需要一个判别标准,判断拒绝或 接受H0。利用“小概率原理”,指发生概率很小的随机 事件,在一次试验中几乎是不可能发生的。如果发生 了,就可以拒绝提出的原假设。
例如:有一个厂商声称其产品的合格品率很高,可以达到 99%,则从一批产品(100件)中随机抽取1件,该件是次品 的概率就非常小,只有1%。
平均数的差异性 t 检验
主讲人:朱
丹
假设检验
你相信他们的说法吗? 你要如何去证明这些说法 是正确或是错误?
对总体参数、分布形式、相互关系等提出假 设,然后利用样本数据来判断该假设论述的 合理性。
• 假设来西藏旅游的外国旅客平均消费支出8000元。 • 有人提出拉萨市民人均月收入是2500元。 • 有人提出西藏大学学生的平均IQ测验分数是110。
足以拒绝它而已。
故常用“拒绝H0”或“不拒绝H0”的表述方式。
Back 22
第二节 单一总体均值的假设检验
单一总体,关于定量数据的检验。
西藏外国旅客平均旅游消费支出5000元? 经管学院毕业生平均起薪为每月2500元? 女性消费者每年在化妆品的平均支出3500元? 2010级统计学平均成绩为70分?
Back 16
三、两类错误
弃真错误
如前例,厂商声称产 品合格率是99%。100 件中确实只有1件次品。 进行抽样时,刚好1次 被抽到次品,这种错 误称弃真错误(第Ⅰ 类错误),错误概率 是1%(α)。
取伪错误
厂商声称产品合格率 是99%,实际上仅有 90%,表示100件中有 10件次品。为了检验 厂商宣称是否真实, 我们随机抽取20件产 品,结果都是合格品, 于是我们推断厂商宣 称是真实的。犯第二 类错误,错误概率β。
Back 21
计算的检验统计量数值
六、正确表述统计决策结果
统计决策得出:拒绝或不拒绝H0。
“不拒绝H0”不等同于“接受H0”
“不拒绝H0”只是说明根据现有样本不能认为H0
有问题,但重新抽取一个样本就有可能推翻H0。
如果说成“接受H0”,就等于认为H0在任何条件
下都是成立的。
没能拒绝H0,只是表示现有样本提供的证据还不
Back 17
四、假设检验的步骤
Step1:提出原假设 H0 和备择假设 H1
例如:H0:μ=μ0;H1:μ≠μ0
Step2:确定显著性水平α
是决策中的风险。主观确定。 α一般取0.05或0.01。
18
四、假设检验的步骤
Step3:选择检验统计量(Test Statistic)
假设检验也是从抽样分布出发,借由样本数据
Back5
一、建立假设
原假设/虚无假设(null hypothesis):H0
研究者要收集证据予以反对的假设。 将研究结果无效的说法作为原假设。
设定总体参数等于某一数值。
认为两个或两个以上总体参数相等。
H0:μ=2500 H 0 : μ 1 = μ2
OR
H0:μ≥2500 (收入)
计算检验统计量的数值进行推断。
确定H0为真时,检验统计量服从的抽样分布。
• 例如:总体服从正态分布,且σ已知,则构 造检验统计量Z,在H0为真的情况下,有
X 0 Z ~ N 0,1 n
可以确定临界值,构 造拒绝域和接受域。
19
四、假设检验的步骤
Step4:计算检验统计量的数值
根据样本数据计算检验统计量的数值。
此时,H0:员工满意度和性别无关
7
一、建立假设
备择假设(alternative hypothesis) :H1
研究者要收集证据予以支持的假设。 将研究结果有效的假设作为备择假设。
与原假设对立,是要研究的问题。
强调差异或方向性。
例如,某品牌洗涤剂的产品, H1:μ<500
例如, H1:员工满意度和性别有关
检验统计量所有可能取值分两为部分,可以拒绝H0 的检验统计量取值的集合称拒绝域。反之,称接受 域,不拒绝H0。划分的数值称临界值。
接受域的区间概率1-α,拒绝域的区间概率α。
如何定义接受域和拒绝域?
13
双侧假设检验的拒绝域定义:
H0:μ=μ0; H1:μ≠μ0
•只要μ>μ0或μ<μ0,二者 之一成立,就可以否定H0。
31 Back
3.小样本的正态总体,σ未知
检验统计量:
X t ~ t n 1 S n
临界值
z
右侧检验图
×
右侧假设检验拒绝域在右边, 左侧假设检验拒绝域在左边。 右侧检验拒绝域:Z
0 0
Z
Back 15
左侧检验拒绝域: Z
Z
三、两类错误
以样本统计量推论总体参数,因为样本数据具随机性, 存在判断正确和错误的四种概率:
判 断 接受 H 0 拒绝 H 0
实
际
1 (正确判断) (弃真错误)
统计软件给出检验统计量的数值时,一般都给出该 检验统计量数值的p值。
以Zobs表示Z统计量的观测值: 双侧检验時p值=P(|Z|≥ Zobs) 右侧检验时p值=P(Z≥ Zobs)
p值/2
p值/2
α/2
-1.96
1 -α
α/2
1.96(临界值)
以p值进行假设检验: p值>α,接受H0 p值<α ,拒绝H0
23
第二节 单一总体均值的假设检验
1. 大样本
2. 小样本的正态总体,σ已知
3. 小样本的正态总体,σ未知
假设检验步骤相同,主要区别在于选择适当的 检验统计量,以利确定临界值和定义拒绝域。
Back 24
1.大样本
检验统计量:
X Z ~ N 0,1 n
X Z ~ N 0,1 S n
在H0为真的情况下,构造检验统计量:
X Z ~ N (0,1) n
由样本数据计算检验统计量的数值:
69 65 Z 4 10 100
决策规则(如图),如果 Z>Z0.05 拒绝H0
z 0.05 1.64
Z 4 Z0.05 1.64
因为检验统计量Z的数值落在拒绝域,所以拒绝H0。 证据显示,参加培训后可以提高词汇记忆任务的成绩。
(1会计,2企管,统计学成绩)
“等号”始终在H0。
6
一、建立假设
例如:你对某品牌洗涤剂的产品标签中声称: “平均净含量不低于500克”,感到质疑。
你想要证实“平均净含量不足500克”。即你想
要推翻的是μ≥500克,要证实μ<500克。
此时,H0:μ≥500
例如:你研究认为员工满意度和性别有关,你 想要以样本数据来支持你的论点。
由样本数据计算检验统计量的数值:
554 500 Z 2.16 100 16 决策规则(如图),如果 Z>Z0.01 拒绝H0
z 0.01 2.33
Z 2.16 Z0.01 2.33
因为检验统计量Z的数值落在接受域,所以不拒绝H0。 证据显示,参加辅导班对学生的SAT分数没有影响。
z
×
2
×
z
2
z
2
•它有两个拒绝域,两个临界值, 每个拒绝域的概率α/2 。 •在抽样分布两端各α/2位置上 确定拒绝域边界的临界值。
临界值
拒绝域: Z Z 0 or
2
Z 0 Z
2
14
样本数据计算出来的统计量Z0落在拒绝域,则拒绝H0 。
单侧假设检验的拒绝域定义:
•单侧检验有一个拒绝域,一个 临界值,拒绝域的概率α 。 •在抽样分布某一端的α位置上 确定拒绝域边界的临界值。
8
一、建立假设
H0和H1是互斥的,主要有三种情况:
双侧或双尾假设检验(two-tailed test)
H0:μ=2500 ,H1:μ≠2500 ≤2500 ,H1:μ>2500
单侧或单尾假设检验(one-tailed test)
右侧假设检验: H0:μ
左侧假设检验:
H1: μ ≥2500 ,H1:μ<2500
如果有人对用户说:灯泡的平均使用寿命低于1600hr。 此时,用户要研究的是μ是否会小于1600hr。
提出假设:
H0:μ=1600; H1:μ<1600
10
思考题:
想要检验女性职员平均体重是否大于55公 斤,如何提出原假设和备择假设?
H0:μ=55; H1:μ>55 μ≦55;H1:μ>55
或
Step5:建立决策准则,进行判断
根据α值和抽样分布,确定临界值。
将检验统计量的数值与临界值相比较,做出
是否拒绝H0的判断。
或以检验统计量计算p值,确定是否拒绝H0 。
Back 20
五、p值(p-value)
p值:H0为真时,由样本数据给出的犯第Ⅰ类错误 的概率的精确数值(观察到的显著性水平)。
为检验此论述,进行随机抽样调查, 以样本数据检验此假设是否成立。
2
假设检验
Байду номын сангаас
产生假设检验的原因大致有两个:
当对总体参数的真实性感到怀疑,需要通过 样本来考察其正确与否时,往往借助于假设 检验做出判断(决策)。 当对变量间存在某种关系的证据(平均值之 差、方差之比等)怀疑时,也会要求进行假 设检验。
3
第六章 假设检验
第一节 假设检验原理 第二节 单一总体均值的假设检验 第三节 两个总体均值差的假设检验 第四节 总体比例与方差的假设检验 第五节 SPSS在假设检验中的应用