第八讲 假设检验
第8 假设检验(共80张PPT)

8.1 8.2 8.3 8.4
假设检验的根本问题 一个总体参数的检验 两个总体参数的检验 假设检验中的其他问题
我认为该企业生产的零件的平
均长度为4厘米!
什么是假设? 对总体 参数的一种看法
总体参数包括总 体均值、比例、方 差等
举例说明假设检验的根本思路
某单位职工上月平均收入为210元,这个 月的情况与上月没有大的变化,我们设想平均 收入还是210元.
样本均值的抽样分布
置信水平
拒绝域
1-
接受域
临界值
H0
样本统计量
如果备择假设具有符号“>〞,拒绝域位于抽样分 布的右侧,故称为右侧检验
样本均值的抽样分布
置信水平
1- 接受域
拒绝域
H0
样本统计量
临界值
请判断它们的拒绝域:
〔1〕假设检验的假设为H0:m=m0 ,H1: m≠m0,那么拒绝域为〔 〕。
〔2〕假设检验的假设为H0:m≥m0 ,H1: m < m0,那么拒绝域为〔 〕。
〔3〕假设检验的假设为H0:m≤m0 ,H1: m > m0,那么拒绝域为〔 〕。
检验统计量:Z > Z;
Z > Z/2 或Z <-Z/2 ;
Z <-Z
决策规那么
给定显著性水平 ,查表得出相应的临界 值 将检验统计量的值与 水平下的临界值进 行比较 双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0 得出拒绝或不拒绝原假设的结论
H0:m=10 H1:m≠10
例 6.2
某品牌洗涤剂在它的产品说明书中声称:平均 净含量不少于500g。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设。
概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
假设检验一般概念

x 400 k 时接受原假设H0;
(1)
x 400 k 时拒绝原假设H0接受备择假设H1
(2)
进一步,由于当H0为真时,有
u x400 ~N(0,1) 25/ n
1 |u|要构x造一40个0具有明确k分布的统计量,可将(1)、(2)式转化为
25/ n 25/ n
2 |u|时接x受原40假0设H0 k
2. 拒绝域与接受域 称是检验水平或显著性水平,它是我们
制定检验标准的重要依据。常数u/2把标准正态分布密度曲线下
的区域分成了两大部分,其中一部分
(x1,x2, ,xn)uu/2
称为H0的拒绝域或否定域, 当样本点落入拒绝域时,我们便拒 绝原假设H0(同前述(6)式),另一部分
(x1,x2, ,xn)uu/2
(1)根据问题的要求提出假设,写明原假设H0和备择假设H1的
具体内容。
(2)根据H0的内容,建立(或选取)检验统计量并确定其分布。 (3)对给定(或选定)的显著性水平 ,由统计量的分布查表 或计算确定出临界值,进而得到H0的拒绝域和接受域。
(4)由样本观察值计算出统计量的值。
(5)做出推断:当统计量的值满足“接受H0的条件”时就接受 H0,否则就拒绝H0接受H1 。
u
2
时接受原假设H0 (5)
时拒绝原假设H0,接受备择假设 H1 (6)
分析(5)、(6)两式,可以这 样认为:
拒绝H0,是因为以H0成立 为出发点进行推理时,得到 了不合情理的结论,使小概 率事件在一次试验中发生了。
接受H0,是因为以H0成立 为出发点进行推理时,未发 现异常。
这就是带有概率特征的反证 法,认为小概率事件在一次 试验中不可能发生。
H0:X服从泊松分布;H1:X不服从泊松分布.
概率论与数理统计课件第八章假设检验01

P C p (1 p) 0.306 0.3
1 1 12 11
这不是 小概率事件, 没理由拒绝原假设。在不 准备继续抽样的情况下,作出接受原假设的决 定, 即该批产品可以出厂.
5
例2: 一条新建的南北交通干线全长10公里.公路 穿过一个隧道(长度忽略不计),隧道南面3.5公里, 北面6.5公里. 在刚刚通车的一个月中, 隧道南 发生了3起交通事故, 而隧道北没有发生交通事 故,能否认为隧道南的路面更容易发生交通事故? 分析: 用p表示一起交通事故发生在隧道南的概 率.则p=0.35表示隧道南北的路面发生交通事故 的可能性相同.p>0.35表示隧道南的路面发生交 通事故的概率比隧道北的路面发生交通事故的 概率大. ------为了作出正确的判断, 先作一个假设
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大. 做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043. 于是, 我们判断正确的概率是1-0.043=95.7%
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设 H0: p=0.35, 及其备择假设 H1: p>0.35.
再作一个备择假设
H1 : p 0.04
在H0成立时
3 3 12 9
p 0.04 代入
4
P C p (1 p) 0.0097 0.01
这是 小概率事件, 一般在一次试验中是不会发 生的, 现一次试验竟然发生, 故可认为原假设不 成立, 即该批产品次品率p>0.04 , 则该批产品不 能出厂.
第八讲 单总体假设检验

0
❖ 双边:
0 x
❖ 3)统计量
z
0
❖ 4)拒绝域
n
z z ❖ 单边: 右~ z 左~ z
z z ❖ 双边: z 或 z
2
2
(二)方差未知
❖
1)原假设
H 0 :
0
❖ 2)备择假设 H 1
❖ 单边: 或
0
0
❖ 双边:
❖
3)统计量
0
x
x
t
0
0 ~ tn 1
效 。 0.05
❖ 2、原有资料:某市居民彩电拥有率为60%, 现抽样100户,彩电拥有率为62%,问,能否
认为彩电拥有率有所增长? 0.05
第二节 小样本假设检验
❖ 一、单正态总体均值检验 ❖ (一)方差已知:
H ❖ 1)原假设 0 : 0
❖ 2)备择假设 H 1
❖ 单边:
或
0
水稻亩产标准差不超过去年数值75公斤?
x
s
❖ 4)拒绝域
n
❖ 单边: 右~ t t
❖ 双边: t t 或 2
左~ t t
t t 2
例:
❖ 1、某厂职工去年月收入服从正态分布,平均为570 元,标准差为8元,今年实行新的分配政策,抽样 10人,结果如下:575 560 565 580 585 586 575 582 570 570。问平均收入是否所有明显改变?
❖ 2、某产品重量服从正态0.0分5布,现随机抽取6件,测
得重量为(公斤):36.4 38.2 36.6 36.9 37.8 37.6。能否认为该产品的平均重量为37公斤?
0.05
二、单正态总体方差检验
❖ 检验步骤:
《概率论与数理统计》课件第八章 假设检验

统计学 第8章 假设检验 教学课件ppt

确定适当的检验统计量
什么是检验统计量?
1. 用于假设检验决策的统计量
原假设H0为真 点估计量的抽样分布 (样本均值、样本方差)
比较 3. 作出决策
双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
利用 P 值 进行决策
什么是P 值?
(P-value)
P值告诉我们: 如果原假设是正确的话,我们得到得到样本观察 结果或更极端结果出现的可能性有多大,如果这 个可能性很小,就应该拒绝原假设
因此,如果在一次抽样中竟然出现了满足
X 0 / n
ห้องสมุดไป่ตู้
的 u /2
X
那么我们就有理由怀疑原假设H0的正确性了,因此会拒
绝H0 。
由于 | U |
X 0 / n
u 2
是一个小概率事件.
故我们可以取拒绝域为:
W: | U | u 2
如果由样本值算得该统计量的实测值落入区域 W,则拒绝H0 ;否则,不能拒绝H0 .
1、生产已不正常
2、生产正常:但属于小概率事件,一次抽样中几乎 不可能发生
因此:在原假设成立(生产正常)的情况下, 若发生小概率事件,则我们有充分的理由怀 疑原假设已不成立。
因此若H0为真,即 0 时,
X
0
/ n
u /2
是一个小概率事件:1%、5%、10%
而小概率事件在一次试验中基本上不应该发生 。
第八讲 心理统计学-假设检验

1422:16
零假设和相应的研究假设
零假设
3年级学生的ABC记忆 考试的平均成绩和5年 级学生的平均成绩没有 差异。
由社区长期照料老人的 效率和由家庭长期照料 老人的效果没有差异。
无方向研究假设
有方向研究假设
3年级学生的ABC记忆 3年级学生的ABC记忆 考试的平均成绩不同于 考试的平均成绩低于5 5年级学生的平均成绩。 年级学生的平均成绩。
¾需要考虑的条件
总体分布 总体方差 样本容量
46
¾1.总体正态分布,总体方差已知; ¾2.总体正态分布,总体方差未知; ¾3.总体非正态分布。
47
1.总体正态分布,总体方差已知
¾ 大样本和小样本的检验方法与步骤是相同 的。都是用样本平均数分布的标准误差按 正态分布去计算Z值。
¾ 检验方法:Z检验。
1622:16
¾ 举例:某班级进行瑞文智力测验,结果平均分X =100,已知瑞文测验的常模μ0=100;σ0= 16,问该班智力水平(不是这一次测验结果) 是否确实与常模水平有差异。
¾ 样本分布理论:多次抽样,得到多次测验的结 果的总平均为μ
¾ 检验目的是证明H1 :μ≠ μ0
17
二、假设检验的步骤
第1步:提出虚无和对立假设 第2步:确定适当的检验统计量 第3步:规定显著性水平 第4步:计算检验统计量的值 第5步:做出统计决策
1822:16
3
第一步 提出假设
¾定义
虚无假设(H0 ):原假设、无差假设、零假设 对立假设(H1 ):备择假设,研究假设
¾例子 测量女大学生是否有性别歧视的倾向
IV. 作为好的研究者,我们的工作是解释观察到的差异时消除偶然 性因素,并评价其他可能导致群体差异的因素
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
其中常数 k由Eθ (ϕ ( x )) = Pθ { L( x ) ≥ k } = α确定,
0 0
这是因为 Pθ { L( x ) = k } = 0。这说明此种情形下
0
的拒绝域具有形式 W = { x:L( x ) ≥ k }。
c
域就建立起一一对应关系。 域就建立起一一对应关系。 为了确定拒绝域, 为了确定拒绝域,往往根据问题的直观背
为真时, 景,寻找合适的统计量T ( x ),当H 0为真时,要
能由统计量 T ( x )确定出拒绝域 W ,这样的统 称为检验统计量 计量T ( x ) 称为检验统计量(Test Statistic)。 为了便于描述拒绝域及数学理论上的需要, 为了便于描述拒绝域及数学理论上的需要, 有必要引入函数 1, x ∈W , ϕ ( x) = 0, x ∉W 它是拒绝于上的示性函数,称其为检验函数 它是拒绝于上的示性函数,称其为检验函数。 检验函数。 当ϕ ( x ) = 1时拒绝 H 0,当ϕ ( x ) = 0时接受 H 0。 这 种检验函数也称为非随机化的, 种检验函数也称为非随机化的, 而随机化的检 验函数的定义是: 验函数的定义是:在[0,1]上取值的样本的函数
β (θ ) = Pθ { x ∉W } = 1 − Pθ { x ∈W }, θ ∈ Θ1 .
定义8.1 一个检验的功效(Power)定义为当 H 0假 定义 一个检验的功效 的概率, 时拒绝 H 0的概率,即 γ (θ ) = Pθ { x ∈W } = 1 − β (θ ), θ ∈ Θ1 . 而第一类错误和功效可以看成函数 g (θ ) = Pθ { x ∈W } = Eθ (ϕ ( x )), θ ∈ Θ 的不同取值,这个函数称为功效函数。 的不同取值,这个函数称为功效函数。 功效函数
1
θ ∈Θ 0
是密度函数或分布率, 其中 p( x ,θ )是密度函数或分布率, L( x )是统计
的检验称为似然 量。 对较大 L( x )拒绝原假设 H 0的检验称为似然 比检验(Likelihood Ratio Test)。 比检验 。
在这节, 在这节,我们先讨论简单原假设对简单备择 假设的检验问题, 假设的检验问题, 下节讨论较复杂的检验问题。 下节讨论较复杂的检验问题。 设统计模型为 { Pθ ,θ ∈ Θ},其中Θ = {θ 0 ,θ 1 }, 即参数空间仅包含两个参数, 即参数空间仅包含两个参数,所考虑的检验问 题为
0
(2) ) (3) )
且检验 ϕ ( x )是水平为 α的MPT。
(2) 如果ϕ ( x )是水平为 α的MPT,则必存在
常数k ≥ 0, 使得ϕ ( x )满足式( 2)。 进一步若 ϕ的功
效满足 Eθ (ϕ ( x )) < 1, 则ϕ ( x )也满足式( 3)。
1
引理的证明可参看《高等统计学》 郑忠国 郑忠国)。 引理的证明可参看《高等统计学》(郑忠国 。 注: (1) L( x )为连续随机变量时, MPT的 为连续随机变量时, ) 当 的 检验统计量可取为非随机化的形式 检验统计量可取为非随机化的形式
当θ ∈ Θ 0时,g (θ ) = α (θ ); 而当 θ ∈ Θ1时, g (θ ) = γ (θ )。
(Power Function)
检验的水平 固定时, 当样本容量 n 固定时,要减少犯第一类错 误的概率,就会增大犯第二类错误的概率; 误的概率,就会增大犯第二类错误的概率;反 若要减少犯第二类错误的概率, 之,若要减少犯第二类错误的概率,就会增大 犯第一类错误的概率。 犯第一类错误的概率。即就是说当样本容量固 定时,不可能同时减少犯两类错误的概率, 这 定时,不可能同时减少犯两类错误的概率, 是一对不可调和的矛盾。 是一对不可调和的矛盾。 Neyman-Pearson检验原理就是控制犯第一 检验原理就是控制犯第一
检验定义如下。 检验定义如下。
设ϕ ∗ ( x )是水平为 α 定义8.2 在检验问题 中, 在检验问题(1)中 定义 的检验, 的检验, 如果对任一水平为 α的检验 ϕ ( x ),有 Eθ (ϕ ∗ ( x )) ≥ Eθ (ϕ ( x ))
1 1
成立, 成立,则称ϕ ∗ ( x )是水平为 α的 最优功效检验, 最优功效检验,
二、 Neyman-Pearson 引理
考虑检验问题 设统计模型为 { Pθ ,θ ∈ Θ}, H 0:θ ∈ Θ 0, H 1:θ ∈ Θ1 定义似然比 其中Θ = Θ 0 U Θ1。定义似然比(Likelihood Ratio)为 sup{ p( x ,θ )} θ ∈Θ L( x ) = , sup{ p( x ,θ )}
Pθ { x ∈W } = Eθ (ϕ ( x )) ≤ α , θ ∈ Θ 0
的检验函数类中, 的检验函数类中,寻找使得功效
Eθ (ϕ ( x )) = Pθ { x ∈W } (θ ∈ Θ1 )
尽可能大的检验函数。 尽可能大的检验函数。
对给定的 α ∈ [0,1],若检验 ϕ ( x )对所有的 θ ∈ Θ 0,满足Eθ (ϕ ( x )) ≤ α , 则称ϕ ( x )是一个水 是一个水 的检验。 平( Level)为 α 的检验。 根据这个定义, 根据这个定义, 水平不唯一。 水平不唯一。若 ϕ ( x )是水平 ϕ 的检验, 为 α 的检验, 则对任何满足 α < α ′ ≤ 1的α ′ , ( x ) 的检验。 也是水平为α ′ 的检验。称 sup{ Eθ (ϕ ( x )),θ ∈ Θ 0 } 真实水平。 为检验 ϕ ( x ) 的大小(Size)或真实水平。 实用上当提到一个检验的水平时, 实用上当提到一个检验的水平时,一般是 指它的真实水平。 指它的真实水平。
这样一个检验就等同于将样本空间分成 两个互不相交的子集 W 和W c,当x ∈W时就拒 绝 H 0,认为备择假设 H 1成立;当x ∈W c时就接 成立;
(Rejection Region) 为接受域(Acceptance Region)。 这样检验和拒绝
拒绝域, 成立。 受H 0,认为 H 0成立。 称 W 为拒绝域, 称 W
H 0:θ = θ 0, H 1:θ = θ 1
(1) )
比较两个检验 ϕ 1 ( x )和ϕ 2 ( x ) 的优劣的一个自然 的准则就是比较它们功效的大小。 的准则就是比较它们功效的大小。
若
Eθ (ϕ 1 ( x )) ≥ Eθ (ϕ 2 ( x )),
1 1
则称检验 ϕ 1 ( x )不比检验 ϕ 2 ( x )差,或检验 ϕ 1 ( x ) 比检验 ϕ 2 ( x )好。根据这点我们有所谓最优的
(Most Powerful Test)
简记为MPT。Biblioteka 。 简记为对于检验问题(1), 似然比为 对于检验问题 , p( x ,θ 1 ) L( x ) = , p( x ,θ 0 ) 规定: 规定:当p( x ,θ 0 ) = 0, p( x ,θ 1 ) > 0时,L( x ) = ∞, 当p( x ,θ 0 ) = p( x ,θ 1 ) = 0时,L( x ) = 0. 下面的N-P引理不但彻底解决了检验问题(1) 下面的N-P引理不但彻底解决了检验问题(1) 的 引理不但彻底解决了检验问题 检 MPT的存在问题, 而且还给出了构造 的存在问题, 的存在问题 而且还给出了构造MPT检 验的方法。 虽然这个引理仅针对检验问题(1), 验的方法。 虽然这个引理仅针对检验问题 , 但它对解决复合假设检验问题最优检验的存在 起到非常重要的作用。 起到非常重要的作用。
第八讲 假设检验
一、基本概念 二、Neyman-Pearson 引理 三、一致最优势检验
一、基本概念
在自然科学和社会科学等中, 在自然科学和社会科学等中,常常要对某 些重要问题做出回答: 些重要问题做出回答:是或否。如月球比地球 早形成吗? 一种新药对某种病有效吗? 早形成吗? 一种新药对某种病有效吗? 某种 股票会张吗? 新推出的电视节目收视率高吗? 股票会张吗? 新推出的电视节目收视率高吗? 等等。为了回答这些问题, 等等。为了回答这些问题,我们需要对感兴趣 的问题进行试验或观察获得相关数据, 的问题进行试验或观察获得相关数据,根据这 些数据决定是 些数据决定是或否的过程称为假设检验。 的过程称为假设检验。 假设检验
(Hypothesis Testing)
在这节,给出一般的Neyman-Pearson假设 在这节,给出一般的 假设 检验构架。 检验构架。 原假设和备择假设
是统计模型, 设{ Pθ ,θ ∈ Θ}是统计模型,关于总体 X的分 即 的推测, 布或关于参数θ 的推测, H:θ ∈ Θ ⊂ Θ 称为
假设, 假设,其中 Θ 是 Θ 的非空真子集。 的非空真子集。 在一个假设检验中,常涉及两个假设。 在一个假设检验中,常涉及两个假设。所 要检验的假设称为原假设 零假设, 原假设或 要检验的假设称为原假设或零假设, 记为H 0 。
ϕ ( x )。在随机化检验时,有了样本 x 后,计算 在随机化检验时, ϕ ( x ), 依ϕ ( x )为成功概率做 Minomial试验, 若 试验,
成功就拒绝 H 0, 否则接受 H 0。
两类错误、 两类错误、功效和功效函数 由于样本时随机的, 由于样本时随机的, 进行检验时可能犯 两类错误, 两类错误,其一是当 H 0为真时,却拒绝 H 0, 为真时, 称为第一类错误 第一类错误, 称为第一类错误, 其概率为 α (θ ) = Pθ { x ∈W }, θ ∈ Θ 0 . 称为第二类 为假时, 其二是当 H 0为假时,却接受 H 0, 称为第二类 错误, 错误,其概率为
(Neyman-Pearson引理 引理) 引理
就检验问题(1), 引理8.1 就检验问题 ,对给定 α ∈ (0,1),有 引理 (1) 存在常数 k ≥ 0及检验 1, 当L( x ) > k时 , ϕ ( x) = 0, 当L( x ) < k时 Eθ (ϕ ( x )) = α . 满足