第七章假设检验

合集下载

第七章 假设检验

第七章 假设检验
5 2 1 c 0 .0 5 3
5 c 0 .9 7 5 3
5 3
c 1 .9 6

所以
c 1 . 176

总目录
上一页
下一页
返回
退出
§7.2 参数假设检验 本节我们介绍母体ξ的分布是正态分布的几种显著性
{ ( x1 , x 2 , , x n ) : u ( x1 , x 2 , , x n ) u0 }
总目录 上一页 下一页 返回 退出
构造检验统计量
设 则
U
1 , 2 , , 25
是取自母体ξ的一组子样,
x1 , x 2 , , x 25
是子样观测值
1500
51.5 53.5 5 3
总目录
上一页
下一页
返回
退出
t-检验例题7.3(3-2)
假设母体服从正态分布,
检验假设
H 0 : 0 65
H 1 : 0 65
由子样算得
Sn
*
x 4 5 .0 6
n
n 1
1
( xi x )
2
5 .8 1 8
i 1
给定显著水平α=0.05,查自由度为99的t分布表得
xiaobugs
第七章 假设检验
第七章目录 §7.1 假设检验的基本思想和概念 §7.2 参数假设检验 §7.3 正态母体参数的置信区间 §7.4 非参数假设检验 (简介) *§7.5 奈曼-皮尔逊基本引理 和一致最优势检验 (略)
总目录
上一页
下一页
返回
退出
§7.1 假设检验的基本思想和概念 名词解释:

课程释疑7 第七章 假设检验

课程释疑7  第七章 假设检验

并未受到控制, 犯第二类错误的概率 β 并未受到控制,因此接受 H0 而 犯错误的可能性无法预料。 犯错误的可能性无法预料。
Байду номын сангаас
另一方面, 另一方面,仅仅凭一次试验的结果没有被拒绝的假设 从人们的心理上是不放心的,一般需要继续做试验, 从人们的心理上是不放心的,一般需要继续做试验,重 新取得数据作检验,根据多次试验的结果再作结论。 新取得数据作检验,根据多次试验的结果再作结论。 问8.3:同一问题及同一批数据,如使用不同的显著水平 :同一问题及同一批数据, 其检验结果是否不同? 其检验结果是否不同? 不同的显著水平下,检验的结论可能是不同的。 答:不同的显著水平下,检验的结论可能是不同的。 下是不能拒绝的, 例如可能在水平 α = 0.05下是不能拒绝的,而在 下被拒绝。 水平α = 0.10 下被拒绝。
问 8.4:一个显著水平 α 的检验的第一类错误概率与水 : 这两个概念有何差别? 平 α ,这两个概念有何差别? 这是两个不同的概念, 答:这是两个不同的概念,第一类错误概率与具体的检 验有关, 检验, 验有关,同一问题可以有不止一个水平α 检验,他们具 有不同的第一类错误概率,但是有一个共同点,就是第 有不同的第一类错误概率,但是有一个共同点, 一类错误概率都不超过 α 。水平 α 则是所有可能的水 检验的第一类错误概率的上界。 平 α 检验的第一类错误概率的上界。因此水平α 与具体 检验无关。 检验无关。
第七章 假设检验
问8.1:两类错误概率能否同时控制得很小? :两类错误概率能否同时控制得很小? 固定时,做不到。一般地说, 答:当样本容量 n 固定时,做不到。一般地说,当第 小时, 就显大, 一类错误概率α 小时,第二类错误概率 β 就显大,
1 的检验为例: 以下以正态总体 N (µ ,) 的参数 µ 的检验为例:

《概率论与数理统计》第七章假设检验.

《概率论与数理统计》第七章假设检验.

《概率论与数理统计》第七章假设检验.第七章假设检验学习⽬标知识⽬标:理解假设检验的基本概念⼩概率原理;掌握假设检验的⽅法和步骤。

能⼒⽬标:能够作正态总体均值、⽐例的假设检验和两个正态总体的均值、⽐例之差的假设检验。

参数估计和假设检验是统计推断的两种形式,它们都是利⽤样本对总体进⾏某种推断,然⽽推断的⾓度不同。

参数估计是通过样本统计量来推断总体未知参数的取值范围,以及作出结论的可靠程度,总体参数在估计前是未知的。

⽽在假设检验中,则是预先对总体参数的取值提出⼀个假设,然后利⽤样本数据检验这个假设是否成⽴,如果成⽴,我们就接受这个假设,如果不成⽴就拒绝原假设。

当然由于样本的随机性,这种推断只能具有⼀定的可靠性。

本章介绍假设检验的基本概念,以及假设检验的⼀般步骤,然后重点介绍常⽤的参数检验⽅法。

由于篇幅的限制,⾮参数假设检验在这⾥就不作介绍了。

第⼀节假设检验的⼀般问题关键词:参数假设;检验统计量;接受域与拒绝域;假设检验的两类错误⼀、假设检验的基本概念(⼀)原假设和备择假设为了对假设检验的基本概念有⼀个直观的认识,不妨先看下⾯的例⼦。

例7.1 某⼚⽣产⼀种⽇光灯管,其寿命X 服从正态分布)200 ,(2µN ,从过去的⽣产经验看,灯管的平均寿命为1550=µ⼩时,。

现在采⽤新⼯艺后,在所⽣产的新灯管中抽取25只,测其平均寿命为1650⼩时。

问采⽤新⼯艺后,灯管的寿命是否有显著提⾼?这是⼀个均值的检验问题。

灯管的寿命有没有显著变化呢?这有两种可能:⼀种是没有什么变化。

即新⼯艺对均值没有影响,采⽤新⼯艺后,X 仍然服从)200 ,1550(2N 。

另⼀种情况可能是,新⼯艺的确使均值发⽣了显著性变化。

这样,1650=X 和15500=µ之间的差异就只能认为是采⽤新⼯艺的关系。

究竟是哪种情况与实际情况相符合,这需要作检验。

假如给定显著性⽔平05.0=α。

在上⾯的例⼦中,我们可以把涉及到的两种情况⽤统计假设的形式表⽰出来。

第7章 假设检验

第7章  假设检验

第七章假设检验实例:一项新的减肥产品在广告中声称:服用该产品的第一周内,参加者的体重平均至少可以减轻8磅。

现随机抽取40位服用该减肥产品的样本,结果显示:样本的体重平均减少7磅,标准差为3.2磅。

假定显著性水平为0.05.问:该广告是否是属实的?消费者该不该信赖它呢?有人说大学中男生的学习成绩比女生好。

现从一个学校中随机抽取了25名男生和16名女生,对他们进行同样题目的测试,测试结果表明,男生的平均成绩为82分,标准差为10分;女生的平均成绩为78分,标准差为7分。

假定显著性水平为0.05,问:调查数据能否支持该人的结论?回答这些问题我们需要进行假设检验!一、假设检验的基本问题(一)假设检验的定义假设检验—也称显著性检验,它是先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。

(二)假设检验的基本思想假设检验的基本思想即小概率事件原理。

小概率事件原理——即小概率事件在一次试验中是几乎不可能发生的。

也就是说,如果提出的总体的某个假设是真实的,那么不利于或不可能支持这一假设的小概率事件A在一次试验中几乎是不可能发生的,要是在一次试验中事件A发生了,我们就有理由怀疑这一假设的真实性,并拒绝这一假设。

(三)假设检验的基本形式假设:1、原假设:通常将研究者想收集证据予以反对的假设,也称为零假设,用H0表示。

2、备择假设:通常将研究者想收集证据予以支持的假设,或称为研究假设,用H1表示。

根据备择假设有无特定的方向,可将假设检验的形式分为双侧检验和单侧检验。

(1)双侧检验——备择假设没有特定的方向性,并含有符号“”的假设检验;(2)单侧检验——备择假设具有特定的方向性,并含有符号“<”或“>”的假设检验; 在单侧检验中,根据研究者感兴趣的方向不同: 左侧检验:研究者感兴趣的备择假设方向为“<”的假设检验;右侧检验:研究者感兴趣的备择假设方向为“>”的假设检验。

单侧检验单侧检验左侧检验右侧检验假设检验的表达式假设原假设备择假设双侧检验00:θθ=H 01:θθ≠H 00:θθ≥H 01:θθ<H 00:θθ≤H 01:θθ>H例1:消费者协会接到消费者投诉,指控某品牌纸包装茶叶存在重量不足,有欺骗消费者之嫌。

第七章 假设检验

第七章  假设检验

第七章假设检验第一节假设检验的基本知识一、假设陈述1、原假设/虚无假设:用H表示,常常是根据已有资料得出的,稳定、保守的经验性看法,没有充分根据是不会被推翻的。

2、备选假设/研究假设:与原假设对立的假设,用H1表示,经过抽样调查后,获得证据希望予以支持的假设。

二、假设检验的基本原理——小概率原理小概率原理:一次观察中小概率事件被认为不可能发生;如果一次观察出现了小概率事件,合理的想法应该是否定原有事件具有小概率的说法。

小概率原理在假设检验中的运用:抽取一个样本并计算出检验统计量,如果在原假设成立的条件下这个统计量几乎不可能发生,则拒绝原假设而接受备选假设。

反之,如果计算出的统计量发生的可能性不太小,则接受原假设。

即在原假设下,检验统计量是小概率事件则拒绝原假设。

例1:某市场有100位摊贩,根据以往统计,其中非本地居民占10%,现随机抽取10人调查,发现5个都不是本地人,则原有统计结果是否成立?解:H:100人中10个是非本地人。

计算在原假设成立的情况下,抽取5人都是非本地人的概率:P= C105 C905/C10010<10-4可见,出现5名非本地人的结果概率极其小,但一次实验就出现了,所以怀疑原假设的真实性,拒绝原假设。

三、拒绝域与显著性水平1、显著性水平α,在原假设成立条件下,统计检验中规定的小概率的数量界限,常用的有α=0.10,0.05,0.01。

2、接受域和拒绝域根据原假设画出统计量的分布,以Z分布为例。

如果把拒绝原假设的小概率α事件定在分布的右侧尾部,则右侧面积代表的概率即显著性水平,Zα是临界值。

如果检验统计量值Z>Zα,则应拒绝原假设;如Z<Zα,则接受原假设。

以Zα为临界值,左边为接受域,右边为拒绝域。

也可把α定在左边或两边。

α1、双边检验如果拒绝域放在抽样分布的两侧,每侧拒绝域的概率分别为α/2,假设抽样本分布以0为对称,则P(|Z|>Z α/2)= α;双边检验的假设如下:H 0: μ=μ0H 1: μ≠-Z α/2 Z α/2如果检验统计量|Z|>Z α/2,则拒绝原假设,否则接受。

第七章假设检验

第七章假设检验

u
u,
















H

0
➢3型问题(右侧检验)
由 关 系 式 ( 7.2.1) 和 标 准 正 态 分 布 上 侧 分 位
数 定 义 , 对 于 给 定 的 , 存 在 u, 使 得
P
X
/
n
u
如 果 H 0成 立 , 即

0


U
X
0
/n
X / n
X
0
/n
u
u
2
P
0
/n
u
2
0
/ n
P
0
/n
u
2
0
/n
1 u 2
/
0
n
u 2
/
0
n
1 u
2
/
0
n
1 u
2
/
0
n
2u2
/ n0u2
/ n0
这表明该检验误 的大 两小 类 与 错 0密切相关
➢2型问题(左侧检验)
由关系式(7.2.1)和标准正态分布下侧分位X /n Nhomakorabeau
P U
u
P
X
/
n
u
所 以 , 如 果 检 验 统 计 量 U X 0 地 实 现 u满 足 / n
u u, 小 概 率 事 件 在 一 次 试 验 中 发 生 , 否 定 H 0;
u
u,





第七章假设检验

第七章假设检验

k
,
n
也就是说,事件“|
U
|
z
”2
2
2
是一个小概率事件.
由标准正态分布的上分位点的定义知:
k z 2 ,
17
故可以取拒绝域为 W: | U | z 2
如果由样本值算得该统计量的实测值落
入区域W,则拒绝H0 ;否则,不能拒绝H0 .
这是因为,如果H0 是对的,那么衡量差 异大小的某个统计量落入区域 W(拒绝域) 是 个小概率事件. 如果该统计量的实测值落入 W,也就是说, H0 成立下的小概率事件发生 了, 那么就认为H0不可信而否定它. 否则就不 能否定H0 (只好接受它).
n
体N (, 2 )的样本. 且设是已知常数.
12
现在要检验的假设是:
H0 : 0 (0 355),
它的对立假设是:
H1 : 0,
在实际工作中, 往往把不轻易 否定的命题作 为原假设.
称H0为原假设(或零假设); 称H1为备选假设(或对立假设). 那么,如何判断原假设H0 是否成立呢?
13
H0 : 新技术未提高效益,H1 : 新技术提高效益.
30
•假设检验 —基本概念
原 把需要检验的
假 假设称为原假
关于总体
假 设
分布的某 个命题
设 设,记为H0.
备 在拒绝原假设后,可供 择 选择的一个命题称为
假 备择假设,它是原假设
设 的对立假设,记为H1.
31
•假设检验 —基本概念
检验统计量 用于判断原假设成立与否的统计量
P{第二类错误}= P{接受H0|H0不真}= .
26
•假设检验的两类错误
显著性水平 为犯第一类错误的概率.

第7章 假设检验

第7章  假设检验
备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
双侧检验与单侧检验
(假设的形式)
单侧检验
左侧检验
H0 : 0
假设
双侧检验
H0 : = 0 H1 : ≠0
右侧检验
H0 : 0
原假设
备择假设
H1 : < 0 H1 : > 0
什么是假设检验?
(hypothesis test) 1. 先对总体的参数(或分布形式)提出某种假设, 然后利用样本信息判断假设是否成立的过程 2. 有参数检验和非参数检验 3. 逻辑上运用反证法,统计上依据小概率原理
原假设
(null hypothesis) 1. 2. 3. 研究者想收集证据予以反对的假设 又称“0假设” 总是有符号 , 或 4. 表示(0,1)
总体均值的检验( 2 已知)
(例题分析)
【例】一种罐装饮料采用自动生 产线生产,每罐的容量是 255ml, 标准差为 5ml 。为检验每罐容量 是否符合要求,质检人员在某天 生产的饮料中随机抽取了40罐进 行检验,测得每罐平均容量为 255.8ml。取显著性水平 =0.05 ,检验该天生产的饮料 容量是否符合标准要求?
两类错误与显著性水平
假设检验中的两类错误
1. 第Ⅰ类错误(弃真错误)
原假设为真时拒绝原假设 第Ⅰ类错误的概率记为
被称为显著性水平
2. 第Ⅱ类错误(取伪错误)
原假设为假时未拒绝原假设 第Ⅱ类错误的概率记为 (Beta)


假设检验中的两类错误
(决策结果)
H0: 无罪
0
临界值
样本统计量
决策规则
1. 给定显著性水平,查表得出相应的临界值 z或z/2, t或t/2 2. 将检验统计量的值与 水平的临界值进行比 较 3. 作出决策
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
自由度df = 1,p−value为0.903. 因此可以认为这些数据服从Mendel第一定律。 Fisher基于Mendel试 验的所有数据,发现其数据与理论值符合的太好,p − value = 0.99993,但这么好的拟合在几万 次试验中才发生一次,因而Fisher断定数据可能有伪造的嫌疑[注1]。
(O − E)2 ,
E
这个统计量中每项的分母的选取有点讲究, 我们可以这样粗略地解释: 假设 ni 服从 Poisson 分布, 则 ni 的均值和方差均为 npi, 从而 (ni − npi)/√npi 的极限分布为标准正态分布, 因此 χ2 近 似为 k 个服从自由度为 1 的 χ2 分布的随机变量之和, 由于 ki=1(ni − npi) = 0, 故这 k 个随机变 量满足一个约束, 从而 χ2 的自由度为 k − 1. 事实上, 可以严格地证明, 在一定的条件下, χ2 的极
自由度为 k − 1 的 χ2 分布, R. A. Fisher 发现自由度应该等于 k − 1 减去估计的独立参数的个数
H0 : π1 = 0.75, π2 = 0.25
解: 在Mendel第一定律(H0)下,黄色和绿色的个数期望值为 µ1 = nπ1 = 8023 ∗ 0.75 = 6017.25, µ2 = nπ2 = 8023 ∗ 0.25 = 2005.75 2
则Pearson χ2统计量为 Z = (O − E)2 = (6022 − 6017.25)2/6017.25 + (2001 − 2005.75)2/2005.75 = 0.015 E
理论频数 np1 np2 · · · npk
观测频数 n1 n2 · · · nk
由大数定律知, 在零假设成立时, ni/n 依概率收敛于 pi, 故理论频数 npi 与观测频数 ni 接近.
而检验统计量取为
χ2 = k (ni − npi)2 .
i=1
npi
1
简单地, 就是
χ2 =
其中 O 为观测频数, E 为期望频数.
i
第七章 假设检验
7.3 拟合优度检验
前面的假设检验基本上是在假定总体是正态的条件下做的, 但是这个假设本身不一定成立, 需 要收集样本 (X1, · · · , Xn) 来检验它. 一般地, 检验
H0 : X服从某种分布 可以采用 Karl Pearson 提出的 χ2 拟合优度检验.
7.3.1 离散总体情形
H0 : P (X ∈ a1) = p1, · · · , P (X ∈ ak) = pk.
这类问题只提零假设而不提对立假设, 相应的检验方法称为拟合优度检验. 显然, 在零假设下, 各 类别的理论频数分别为 np1, · · · , npk, 将理论频数和观测频数列于下表:
类别
a1 a2 · · · ak
解: 该问题设计的总体是一个有 6 个类别的离散总体, 记出现六个面的概率分别为 p1, · · · , p6, 则 零假设可以表示为
H0 : pi = 1/6, i = 1, · · · , 6.
在零假设下, 理论频数都是 100, 故检验统计量 χ2 的取值为
(97 − 100)2 (104 − 100)2 (82 − 100)2 (110 − 100)2 (93 − 100)2 (114 − 100)2
7.3.2 列联表的独立性和齐一性检验 . . . . . . . . . . . . . . . . . . . . . . . . . . 4
7.3.3 连续总体情形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
目录
第七章 假设检验
1
7.3 拟合优度检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
7.3.1 离散总体情形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
限分布就是自由度为 k − 1 的 χ2 分布, 但其证明超出本课程的要求范围.
下面给出一个例子来说明拟合优度检验的应用.
例 7.3.1. 有人制造一个含 6 个面的骰子, 并声称是均匀的. 现设计一个实验来检验此命题: 连续 投掷 600 次, 发现出现六面的频数分别为 97, 104, 82, 110, 93, 114. 问能否在显著性水平 0.2 下 认为骰子是均匀的?
(2) 理论分布含若干未知参数的情形
当理论总体总含有未知的参数时, 理论频数 npi 一般也与这些参数有关, 此时应该用适当的估 计如极大似然估计代替这些参数以得到 pi 的估计 pˆi, 得到的统计量记为
χ2 = k (ni − npˆi)2 .
i=1
npˆi
拟合优度检验的提出者 Karl Pearson 最初认为在零假设下, 检验统计量的 χ2 的极限分布仍等于
(1) 理论分布不含未知参数的情形 设某总体 X 服从一个离散分布, 且根据经验得知总体落在类别 a1, · · · , ak 的理论频率分别
为 p1, · · · , pk, 现从该总体抽得一个样本量为 n 的样本, 其落在类别 a1, · · · , ak 的观测数分别为 n1, · · · , nk. 感兴趣的问题是检验理论频率是否正确, 即下面假设是否正确:
+
+
+
+
+
= 6.94,
100
100
1ห้องสมุดไป่ตู้0
100
100
100
跟自由度为 6 − 1 = 5 的 χ2 分布的上 0.05 分位数 χ25(0.2) ≈ 7.29 比较, 不能拒绝零假设, 即可在 显著性水平 0.2 下认为骰子是均匀的.
例 7.3.2. 孟德尔(Mendel)豌豆杂交试验。纯黄和纯绿品种杂交,因为黄色对绿色是显性的,在Mendel第 一定律(自由分离定律)的假设下,二代豌豆中应该有75%是黄色的,25%是绿色的。在产生的n = 8023个二代豌豆中,有n1 = 6022个黄色, n2 = 2001个绿色。我们的问题是检验这些这批数据是 否支持Mendel第一定律,要检验的假设是
相关文档
最新文档