第三章假设检验

合集下载

3[1].1假设检验初述,二类错误

3[1].1假设检验初述,二类错误

第三章 假设检验3.1 假设检验 两类错误(1)假设检验(hypothesis test ) 假设检验是统计推断的另一类重要问题,是概率意义下的一种反证法。

一般,当母体X 的分布完全未知,或只知其形式而不知其参数时,为推断母体的有关特性,提出针对母体的某项假设;再对母体进行抽样,依据子样值对所提假设做出接受或拒绝的决策。

(2)决策依据——实际推断原理 小概率事件在一次试验中几乎不发生。

若抽样结果是小概率事件在这一次试验中发生了,就有理由怀疑假设的正确性,从而做出拒绝原假设的决策;否则接受原假设。

例 3.1.1 某饮料厂在自动流水线上装饮料,每瓶的重量(单位:克))10,(~2μN X ,正常生产情况下500=μ,一段时间后,为检查机器工作是否正常,抽取9个样品,称重后算得494=x ,试问:此时自动流水线的工作是否正常?解:①提出假设母体)10,(~2μN X ,其中μ未知,在母体上作原假设0H 和备择假设(或称对立假设)1H 如下:↔==500:00μμH 500:01=≠μμH ②构造检验统计量X ∴的值应与μ很接近,想到用X 的值来检验原假设0H .当原假设成立时,10),,(~0200=σσμN X ,故),(~200n N X σμ,从而)1,0(~/10500/000N n X n X U H -=-=σμ(3-1)③给定小概率,找出拒绝域取小概率02.0=α,则有2αu 使}{2αα=≥u U P (3-2)}{2αu U ≥是一个小概率事件,如果一次抽样的结果是这一小概率事件发生了,则认为原假设不合理,应予拒绝。

即应取拒绝域}),,,{(221αu U x x x W n ≥= }),,,{(221ασμu n X x x x n ≥-= (3-3)④做出决策 这时,494=x ,5000=μ,9,100==n σ,8.1=∴U ;02.0=α,33.201.02==u u α,故2αu U <,∴应接受0H ,即认为机器工作正常.注:①假设检验又称为差异显著性检验;②假设检验是具有概率性质的反证法;③拒绝H的说服力强,接受0H的说服力不强;④α越小,拒绝H的说服力越强。

多元统计分析第三章假设检验与方差分析

多元统计分析第三章假设检验与方差分析

多元统计分析第三章假设检验与⽅差分析第3章多元正态总体的假设检验与⽅差分析从本章开始,我们开始转⼊多元统计⽅法和统计模型的学习。

统计学分析处理的对象是带有随机性的数据。

按照随机排列、重复、局部控制、正交等原则设计⼀个试验,通过试验结果形成样本信息(通常以数据的形式),再根据样本进⾏统计推断,是⾃然科学和⼯程技术领域常⽤的⼀种研究⽅法。

由于试验指标常为多个数量指标,故常设试验结果所形成的总体为多元正态总体,这是本章理论⽅法研究的出发点。

所谓统计推断就是根据从总体中观测到的部分数据对总体中我们感兴趣的未知部分作出推测,这种推测必然伴有某种程度的不确定性,需要⽤概率来表明其可靠程度。

统计推断的任务是“观察现象,提取信息,建⽴模型,作出推断”。

统计推断有参数估计和假设检验两⼤类问题,其统计推断⽬的不同。

参数估计问题回答诸如“未知参数θ的值有多⼤?”之类的问题,⽽假设检验回答诸如“未知参数θ的值是0θ吗?”之类的问题。

本章主要讨论多元正态总体的假设检验⽅法及其实际应⽤,我们将对⼀元正态总体情形作⼀简单回顾,然后将介绍单个总体均值的推断,两个总体均值的⽐较推断,多个总体均值的⽐较检验和协⽅差阵的推断等。

3.1⼀元正态总体情形的回顾⼀、假设检验在假设检验问题中通常有两个统计假设(简称假设),⼀个作为原假设(或称零假设),另⼀个作为备择假设(或称对⽴假设),分别记为0H 和1H 。

1、显著性检验为便于表述,假定考虑假设检验问题:设1X ,2X ,…,n X 来⾃总体),(2σµN 的样本,我们要检验假设100:,:µµµµ≠=H H (3.1)原假设0H 与备择假设1H 应相互排斥,两者有且只有⼀个正确。

备择假设的意思是,⼀旦否定原假设0H ,我们就选择已准备的假设1H 。

当2σ已知时,⽤统计量nX z σµ-=在原假设0H 成⽴下,统计量z 服从正态分布z )1,0(~N ,通过查表,查得)1,0(N 的上分位点2αz 。

课件-数理统计与多元统计 第三章 假设检验 3.2构造检验统计量的似然比方法

课件-数理统计与多元统计 第三章 假设检验 3.2构造检验统计量的似然比方法
n
( xi x)2
i 1
2
1
n
t2 2
n
1
其中 t x ,
s/ n
s2
1 n1
n i 1
( xi
x )2
由于( x1, x2 ,L , xn )是t的偶函数,且在t 0
时严格递增,故可取H0的拒绝域为
W (x1, x2,K , xn ) | |t | C
10
在原假设H0: 0为真时,已知
此似然函数L( )的值是在参数为真时,从样
本获得观察值x1, x2 ,L , xn的一种度量。
2
对于假设检验问题:
H0 : 0; H1 : 1 定义此检验问题的似然比函数:
sup L(; x1, x2 ,K , xn )
( x1,
x2 ,K
,
xn )
1
sup
L( ;
x1 ,
x2 ,K
,
xn )
0 n
n
sup f ( xi; )
f ( xi ;ˆ1 )
1 i1 n
i1 n
sup f ( xi; )
f ( xi ;ˆ0 )
0 i 1
i 1
3
其中ˆ0是限定参数空间0时的极大似然估计, ˆ1是限定参数空间1时的极大似然估计。
n
因此,
f
(
xi
;ˆ0
)是当H
真时,样本获得观测值
0
i 1
t X ~ t(n 1) S/ n
由P|t | t/2(n 1) 得临界值
C t /2 (n 1) 故得此似然比检验的拒绝域为:
W (x1, x2,K , xn ) | |t | t/2(n 1)

《数理统计》第三章 假设检验

《数理统计》第三章 假设检验
一个正态总体均值假设检验( 检验 检验) 一个正态总体均值假设检验(t检验)
P328
P329
第三章 1.2 参数假设检验Parameter hypothesis testing
一个正态总体方差的假设检验
第三章 1.2 参数假设检验Parameter hypothesis testing
一个正态总体方差的假设检验
两个正态总体方差比的假设检验 两个正态总体方差比的假设检验 方差比
两个正态总体方差比的假设检验 两个正态总体方差比的假设检验 方差比
P393
P393
第三章 1.2 参数假设检验Parameter hypothesis testing
两个正态总体均值,方差的假设检验举例 两个正态总体均值,方差的假设检验举例
第三章 1.2 参数假设检验Parameter hypothesis testing
一个正态总体均值的假设检验( 检验 检验) 一个正态总体均值的假设检验(U检验)
第三章 1.2 参数假设检验Parameter hypothesis testing
一个正态总体均值的假设检验( 检验) 一个正态总体均值的假设检验(U检验)表示
两个正态总体均值差假设检验举例 两个正态总体均值差假设检验举例
第三章 1.2 参数假设检验Parameter hypothesis testing
两个正态总体均值差假设检验举例 两个正态总体均值差假设检验举例
两个正态总体方差比的假设检验
第三章 1.2 参数假设检验Parameter hypothesis testing
总体分布函数的假设检验
1.3 非参数假设检验(Non-Parameter hypothesis testing) 非参数假设检验 Parameter

第三章 假设检验

第三章    假设检验

第三章 假设检验一、填空题1、在假设检验中,第一类错误(即弃真错误)是 。

2、在假设检验中,第二类错误(即取伪错误)是 。

3、在假设检验中,βα,分别为犯第一类错误和第二类错误的概率,n 为样本容量,则有当n 固定时,βα, ; 当n 增大时,βα, 。

4、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ=H 01:μμ≠H ,所采用的检验统计量为 。

5、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ=H 01:μμ≠H ,拒绝域为 。

6、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≥H 01:μμ<H ,所采用的检验统计量为 。

7、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≥H 01:μμ<H ,拒绝域为 。

8、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≤H 01:μμ>H ,所采用的检验统计量为 。

9、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≤H 01:μμ>H ,拒绝域为 。

10、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中μ未知,则对于假设2020:σσ=H 2021:σσ≠H ,所采用的检验统计量为 。

11、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中μ未知,则对于假设2020:σσ=H 2021:σσ≠H ,拒绝域为 。

12、检验一个总体X 服从正态分布,可用的方法有(给出两种方法即可) 。

13、设某个假设检验问题的拒绝域为W ,且当原假设H 0成立时,样本值12(,,,)n X X X 落入W 的概率为0.15,则犯第一类错误的概率为_____________________。

第三章(3) 假设检验

第三章(3) 假设检验

解:H0 : 0.5, H1 : 0.5
n=16 ,0.05 ,t (15) 1.753
t x 0 s* 0.56 0.5 2 >1.753 n 0.12 16
否定H0
即该服务系统工作不正常
42/27
(三)关于方差的检验
1、检验假设 H0: ,H1:
42/31
ns 选取 = 2 0
2
2
ns2 当2= 2 b时,否定H0 0
当2 b时,不能否定H0
42/32
例6 葡萄酒厂用自动装瓶机装酒,每瓶规定重量为500克,标 准差不超过10克,每天定时检查。某天抽得9瓶,测得平均重 量为x 499克,标准差为s* 16.03克。假设瓶装酒的重量服从 正态分布。问这台机器工作是否正常?(=0.05)
H0 : EX 0.5, H1 : EX 0.5
样本平均值X 0.6
由于
X 0.5 0.1 0.224

DX 0.25 0.224 n 100 0.05
不能否定H0
42/10
二、参数检验
☆8
42/11
参数检验
• 参数估计与参数检验都利用样本的信 息
估计量 样本 信息 样本 统计量 检验统计量 参数检验 参数估计
解:
提出假设 H0:2 0.1082 ,H1:2 0.1082
n5 0.05
*2
s 0.2282
*2
查表可得
a=0.484
2
b=11.1
ns (n 1)s 4 0.2282 17.83 >11.1 2= 2 2 2 0 0 0.108
否定H0,即方差不能认为是0.1082

第三章假设检验

第三章假设检验
8
假通设常反证法与概率反证法的假区设别
命题H0为真
命题H0为真
逻辑推理 出现矛盾?
N
某一定理. 定律.公理
Y
H0为假
区别
构造小概率 原理
N
H0为假
H0真假 待定
逻辑推理←→似然推理 似然推理的结论可能出错
H0为真
9
例1 设总体X~ N( μ, σ2 ), σ=0.06,现从总体中抽取容量为 10的样本,算得样本均值50.02 ,问总体的均值μ是否等于 50?(取=0.05)
错误在于:在H0成立的前提下,这样取小概率事 件A不合理.
本例中使小概率事件A发生的所有10维样本值向量构
成的集合为: 称D为假设H0的拒绝域. 一般
若拒绝接受H0 样本观测值(x1,x2,…,xn ) ∈D
则称D为假设H0的拒绝域
11
总结上述处3理数问假题设的思检想验与问方法题,的可步得骤检验参数
若用H0表示”μ=50”,用H1表示其对立面,即”μ ≠50”,则问题等价于检验H0 μ=50是否成立,若H0 不成立,则H1 μ ≠50成立.
3
问题2 某种疾病,不用药时其康复率为θ0,现发明 一种新药(无不良反应),为此抽查n位病人用新药 的治疗效果,设其中有s人康复,根据这些信息,能 否断定“该新药有效”?
7
反证法的关键是通过推理,得到一个与常理(定理、 公式、原理)相违背的结论.“概率反证法”依据的 是“小概率原理”.那么多小的概率才算小概率呢? 这要由实际问题的不同需要来决定.以后用符合α记 小概率,一般取α=0.1,0.05等.在假设检验中,若 小概率事件的概率不超过α,则α称 α为检验水平或 显著性水平.
假设检验:利用样本对假设的真假进行判断. 参数假设检验:在总体的概率分布已知情形下,对分 布中的未知参数作假设并进行检验. 非参数假设检验:若总体的分布未知,对总体的分 布形成或参数作假设并进行检验.

数理统计 (研究生课程) :第三章 假设检验

数理统计 (研究生课程) :第三章  假设检验
(1) 差异可能是由抽样的随机性引起的,称为 “抽样误差”或 随机误差 这种误差反映偶然、非本质的因素所引起的随机波动。然 而,这种随机性的波动是有一定限度的, (2) 如果差异超过了这个限度,则我们就不能用 抽样的随机性来解释了.
必须认为这个差异反映了事物的本质差别,即反映 了生产已不正常.
这种差异称作 “系统误差”
正确
第二类错误
人们总希望犯这两类错误的概率越小越好,但 对样本容量一定时,不可能使得犯这两类错误的 概率都很小。 往往是先控制犯第一类错误的概率在一定限度 内,再考虑尽量减小犯第二类错误的概率。
即: 较小的 (0,1) 使得 P{拒绝H0|H0为真}≤ ,
然后减小P{接受H0|H0不真} 犯两类错误的概率:
如发现不正常,就应停产,找出原因,排除 故障,然后再生产;如没有问题,就继续按规定 时间再抽样,以此监督生产,保证质量.
很明显,不能由5罐容量的数据,在把握不大 的情况下就判断生产 不正常,因为停产的损失是 很大的.
当然也不能总认为正常,有了问题不能及时 发现,这也要造成损失.
如何处理这两者的关系,假设检验面对的就 是这种矛盾.
如果H0不成立,但统计量的实测 值未落入否定域,从而没有作出否定 H0的结论,即接受了错误的H0,那就 犯了“以假为真”的错误 . “取伪错误” 这两类错误出现的可能性是不可能排除的。 原因在于:由样本推导总体
假设检验的两类错误
实际情况 H0为真 H0不真 第一类错误 正确
决定 拒绝H0 接受H0
在上面的例子的叙述中,我们已经初步介绍 了假设检验的基本思想和方法 .
基于概率反证法的逻辑的检验: 如果小概率事件在一次试验中居然发生, 我们就以很大的把握否定原假设.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章假设检验3.2 —种元件,要求其使用寿命不低于1000 (小时),现在从一批这种 元件中随机抽取25件,测得其寿命平均值为950 (小时)。

已知这种元 件寿命服从标准差 100(小时)的正态分布,试在显著水平0.05下确定这批元件是否合格 解:提出假设:H 。

:1000, H i : 1000构造统计量:此问题情形属于u 检验,故用统计量:u=此题中:x 950 0100 n=25代入上式得:拒绝域:V= 本题中: u u 10.05 u 0.95 1.64 即, u U 0.95拒绝原假设H 。

认为在置信水平0.05下这批元件不合格。

3.4某批矿砂的五个样品中镍含量经测定为(%):3.25 3.27 3.24 3.26 3.24 设测定值服从正态分布,问在 0.01下能否接受假设,这批矿砂的镍含量为3.25? 解:n=5;x=zeros(1, n);x=[3.25 3.27 3.24 3.26 3.24]; x1=sum(x)/n; x2=0; for i=1: nx2=x2+(x(1,i)-x1)A 2;1000=950-1000 100 25 2.5endx2=x2/n; S=sqrt(x2);提出假设:H 0: J 0 3.25 H 1 : 1构造统计量:本题属于1 2未知的情形,可用t 检验,即取检验统计量为:-X — S .n 1本题中,X 3.252, S=0.0117,代入上式得:否定域为:V 二 t>t (n 1)1— 2本题中, 0.01,t 0.995(4) 4.6041Qt t1 - 2接受H 0,认为这批矿砂的镍含量为 3.25。

3.5确定某种溶液中的水分,它的10个测定值X 0.452%, SS 百本题中,X 0.452% 代入上式得:拒绝域为:拒绝H °1 H 0: 0.5% (ii)H 0 : 0.04%_3.252-3.25_0.0117 -F10.3419设总体为正态分布N(,2),试在水平5%检验假设:H 1 : 0.5%H 1 : 0.0.4%(i)构造统计量:本文中未知,可用t 检验。

取检验统计量为t=°452%-0.5% -4.11430.035% J0-1V= 本题中, t >t 1- (n 1) 0.05n=10t 0.95(9) 1.8331 t4.1143n=50.035%,t= S=0.035%曰(ii )构造统计量: 未知,可选择统计量2nS 22"0.035% n=10 0 0.04%否定域为:本题中,12(n 1)Q 212(n 1)接受H 。

3.8用重量法和比色法两种方法测定平炉炉渣中 SiO 2的含量,得如下 结果重量法:n=5 次测量,X 20.5%,S 0.206% 比色法:n=5 次测量,Y 21.3%,S 20.358%假设两种分析法结果都服从正态分布,问 (i ) 两种分析方法的精度()是否相同? (ii )两种分析方法的均值()是否相同?( 0.01解: (i )提出原假设:H o : 1 2H 1 : 1 2对此可采用统计量口(门 2 "S 'F=2吐(n 1 1)S 2在H o 下,F: F (m 1, n 2 1),我们可取否定域为V= F<F (n-i 1, n 2 1) U F>F g 1, n 2 1)1 —2 2此时 P ( V H 0)= 0.01 本题中,n,5, x 20.5%, =0.206%本题中,S 代入上式得:10(°.035%)27.6563(0.04%)2V=12(n 1) fa®) 16.919n15, y 21.3%, 0=0.358%代入上式得:2 2n 1(n21)3 5 (5 1)(0.206%)F= 2n2(m 1)S2 5 (5 1) (0.358%)1F o.oo",5)=149^ 0.0669F o』95(5, 5) =14.94由于F0.005(5, 5)VF<F0.995(5, 5)接受H。

即无明显差异。

(ii)提出假设:H0: 1 2H| :1 2这种未知的场合,用统计量1 2 _其中S2— (X i X)2S;—(Y Y)2m i 1 n2 i 1在H0成立时,t服从自由度为n n2 2的t分布<否定域为:V= t t1 ((A! n2 2))1 —2此时P( V H°)= 0.01本题中,n 5, x 20.5%, 0=0.206%g 5, y 21.3%, 0=0.358%代入上式得:t= ne 2(m n2 2) (X Y)V n1 n2 JmS2 n2S;5 5 (5 5 2) _________ (20.5%_21.3%) _____N 5 5& (0.206%)2 5 (0.358%)2=-3.8737t (n1 n2 2) 10.995(8) 3.35541-—2Q t t1 (n, n2 2)1-—2拒绝H0,即差距显著。

3.9设总体X : N( ,4), X1,K ,X16为样本,考虑如下检验问题:H0: 0 H1: 1(i) 试证下述三个检验(否定域)犯第一类错误的概率同为V i二{2才-1.645}V2= 1.50 2X 2.125V3= 2X 1.96 或2X 1.96(ii) 通过计算他们犯第二类错误的概率,说明哪个检验最好? 解:P x V H00.05X即,P U ------------ U 0.975 0.051~2这里H。

:0P 冈2*1.96 0.05V12X 1.645X 0P 2X 1.645 P 1.645 ( 1.645) 1石=1-0.95=0.05P(V3H0)=1-P 2X 1.96 2(1 (1.96)) 0.05 (ii)犯第二类错误的概率=P -V H1V1: 1=P 2X 1.645 1=0.05 (1.645)V2 1.50 2X 2.125 1.50 2.120P V2 H0 (2.215) (1.50)V 2X 1.96 或2X 1.96n0.98 0.93 0.051.962X 1.96i 1nP i 20X i =P0.355 1 (0.355) 0.36nV 2: 2 1 P 1.50 2X 2.1251X 1=1-P 3.50 4.125•匚=1- (4.125)+ (3.50)=1V 3: 3 P 2X| 1.961X 1 =P 0.04 3.96n= (3.96)- (0.04)=0.99996092-0.516=0.48396092 V 出现第二类错误的概率最小,即V 最好。

3.10 一骰子投掷了 120次,得到下列结果:问这个骰子是否均匀? ( 0.05)解:1本题原假设为: H ° : p 16这里 n=120,nP j 20本题采用的统计量为 Pearson k(n i 叩J 2i 1np i代入数据为:km npJ 2( 23-20)( 26-20)L (15-20)=4 8i=1,2, L ,6 2统计量即,221(k-1) = 0(5) =11.071由于2 1(k-1)所以接受H o即认为这个是均匀的。

3.11某电话站在一小时内接到电话用户的呼唤次数按每分钟记录 的如下表:试问这个分布能看作为泊松分布吗? ( =0.05)解:检验问题为:kH o :P(x k) — 参数为 k!已知的最大似然估计X np 0 § 1卫 L 6*丄60 60 60P X 7 1 P X 6 0 =0.6145(下面为MATLAB 编程计算程序。

)P F3巳F6耳P X 0P X 1 P X 2 P X 3 P X 4 P X 5 P X 620e 20!1 22 e 1! 22e 2 2! 23e 2 3! 24e 2 4! 25e 2 5! 26e 2 6!e 2 0.1353 2* e 2 0.2707 2* e 2 0.2707 1.5* e 2 0.2030 2 2 *e 2 0.0902 3 4 2* e 2 0.0361 15 4 2 *e 2 0.0120457* — L 60k(n i np)2 (8 60*0.1353) (16 60*0.2707)i 1np i 60*0.1353 60*0.2707(1 60*0.0120)2 60*0 .0120由于 1 (k-1 ) = 0.95 (5) =1 1.071 Q 21(k-1 )接受H 0,即分布可以看作为泊松分布。

n=60; p=zeros(1,7);p=[exp(-2) exp(-2)*2 exp(-2)*2 exp(-2)*1.5 exp(-2)*(2⑶ exp(-2)*(4/15) exp(-2)*(8/90)]; nn=zeros(1,7); nn=[8 16 17 10 6 2 1]; sum=0; for i=1:7sum=sum+(( nn (1,i)-n*p(1,i))A 2)/( n*p(1,i)); end sumsum = 0.6145是否可认为这批滚珠直径服从正态分布? ( 0.05)解:设X 为滚球的直径,其分布函数为F(x),则检验问题为xH 0:F(x)()在H 。

成立的条件下,参数,2的最大似然估计为 =15.078, 20.183315.0 15.8 15.2 15.1 15.9 14.7 14.8 15.5 15.6 15.3 15.1 15.3 15.0 15.6 15.7 14.8 14.5 14.2 14.9 14.9 15.2 15.0 15.3 15.6 15.1 14.9 14.2 14.6 15.815.2 15.9 15.2 15.0 14.9 14.8 14.5 15.1 15.5 15.515.115.1 15.0 15.3 14.7 14.5 15.5 15.0 14.7 14.6 14.2 3.13从一批滚珠中随机抽取了 50个,测得他们的直径为(单位:mm ):p p P 2 P14.6-15.078 0.4282(14.8 15.078)0.4282(15.1 15.078)(0.4282)(-1.1163) 0.1321 (-1.1163) (-0.6492) (-0.6492)(0.0514)(-1.1163) 0.1260 (-0.6492) 0.2624P4 (-0-6492) (0.7520) (0.0514) 0.2535P5 1 P l P2 P3 P4 0.22602(k-m-1 ) = :.95(2)=5.991 Q 2I. (k-m-1 ) =5.9911接受H 0,认为滚珠直径服从正态分布。

相关文档
最新文档