数理统计——假设检验
概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
概率论与数理统计-假设检验

14
若
取伪的概率较大.
15
/2
0.12 0.1
0.08 0.06 0.04 0.02
/2 H0 真
60 62.5 65 67.5 70 72.5 75
0.12 0.1
0.08 0.06 0.04 0.02
H0 不真
67.5 70 72.5 75 77.5 80 82.5
16
现增大样本容量,取n = 64, = 66,则
41
两个正态总体
设 X ~ N ( 1 1 2 ), Y ~ N ( 2 2 2 )
两样本 X , Y 相互独立, 样本 (X1, X2 ,…, Xn ), ( Y1, Y2 ,…, Ym ) 样本值 ( x1, x2 ,…, xn ), ( y1, y2 ,…, ym )
显著性水平
42
(1) 关于均值差 1 – 2 的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布拒绝域 Nhomakorabea1 – 2 = 1 – 2
1 – 2 1 – 2 <
1 – 2 1 – 2 > ( 12,22 已知)
43
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
1 – 2 = 1 – 2
拒绝域
1 – 2 1 – 2 <
1 – 2 1 – 2 >
12, 22未知
12
=
2 2
其中
44
(2)
关于方差比
2 1
/
2 2
的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
数理统计:假设检验

二 假设检验的思路、步骤和术语
由长期实践可知,标准差较稳定,设 15, 则 X ~ N (, 152 ), 其中未知.
1. 提出两个对立假设
H0 : 0 500
H1 : 0
原假设或零假设
备择假设
利用已知样本作出判断:是接受假设H0(拒绝假 设H1), 还是拒绝假设H0(接受假设H1). 如果作出的判 断是接受H0, 则认为 0 500 , 即认为机器工作是 正常的, 否则, 认为是不正常的.
13
2. 选择适当的统计量,称为检验统计量,
原则是 1°其中含着总体X的均值 好的估计 X ,
2° H0为真时,检验统计量分布确定。
因为 X是 的无偏估计量,
检验统计量
若 H0 为真, 则| x 0 | 不应太大,
当H0为真时, X ~ N (0 , 2 n),
Z X 0 ~ N (0,1), / n
P{拒绝H0 H0为真} (按“=”具体计算)
以假当真: 当μ≠500时,X 取值落在500附近的可能也存 在,此时将接受H0,认为μ=500,于是犯了取伪错误,称 为第二类错误,犯第Ⅱ类错误的概率
P{接受H0 H0不真}
23
两类错误的关系
以下述检验为例:X~N(, 2), 已知, 未知
率不超过 ,而犯第ⅠI类错误的概率无法控制。
25
【注】假设检验的结果与显著性水平α的大小有关: α越小越不易拒绝H0. 就引例而言:
当α=0.05时,则 临界值z /2 z0.025 1.96,
z x 0 2.2 1.96, 落入拒绝域 / n
于是拒绝 H0, 认为包装机工作不正常.
在实例中若取定 0.05,则 k z / 2 z0.025 1.96,
假设检验的基本概念与应用

假设检验的基本概念与应用假设检验是数理统计学的一种重要方法,用于验证一个假设是否成立。
在科学研究、工程技术和社会经济等领域都得到了广泛应用。
本文将介绍假设检验的基本概念和应用。
一、基本概念1. 假设假设是对某个事物性质、规律等的一种猜测或假设。
在假设检验中,我们通常将这个猜测称为零假设,表示我们要验证的假设是无效的、错误的或不成立的。
而对立假设则表示与零假设相反的另一种情况。
2. 检验统计量检验统计量是根据样本数据计算出来的一个数值,用于确定零假设是否成立或应予以拒绝的标准。
在假设检验中,我们选择一个检验统计量,对样本数据进行计算,并与一个参照分布进行比较,从而判断假设是否成立。
3. 显著性水平显著性水平是做出假设检验决策时所允许的犯错误的概率。
通常,我们需要在显著性水平α 的置信水平下进行假设检验。
一般常用的显著性水平有 0.05 和 0.01。
4. P 值P 值是指在零假设成立的条件下,得到或更极端观测结果的概率。
P 值越小,表示得到这个结果的概率越小,从而更有可能拒绝零假设。
二、应用实例为了更好地理解假设检验的应用,我们可以通过一个实例来进行说明。
假设有一个医院想研究新型药物对癌症患者的治疗效果,现在他们进行了一项测试,选取了两组患者,其中一组使用新型药物,另一组使用传统药物。
需要进行假设检验,以确定新型药物的治疗效果是否比传统药物更好。
零假设:新型药物的治疗效果不比传统药物更好。
对立假设:新型药物的治疗效果比传统药物更好。
假设检验步骤:1. 确定显著性水平。
假定采用 0.05 级别的显著性水平。
2. 收集数据。
选取两组患者,其中一组使用新型药物,另一组使用传统药物。
对每一组患者的治疗效果进行测量,并记录数据。
3. 计算检验统计量。
在本例中,我们选择比较两组患者的平均治疗效果的差异。
计算公式为:t = (x1-x2)/ (s/√n)其中 x1 和 x2 分别表示两组患者的平均治疗效果,s 表示标准误差,n 表示样本容量。
《概率论与数理统计》第七章假设检验.

《概率论与数理统计》第七章假设检验.第七章假设检验学习⽬标知识⽬标:理解假设检验的基本概念⼩概率原理;掌握假设检验的⽅法和步骤。
能⼒⽬标:能够作正态总体均值、⽐例的假设检验和两个正态总体的均值、⽐例之差的假设检验。
参数估计和假设检验是统计推断的两种形式,它们都是利⽤样本对总体进⾏某种推断,然⽽推断的⾓度不同。
参数估计是通过样本统计量来推断总体未知参数的取值范围,以及作出结论的可靠程度,总体参数在估计前是未知的。
⽽在假设检验中,则是预先对总体参数的取值提出⼀个假设,然后利⽤样本数据检验这个假设是否成⽴,如果成⽴,我们就接受这个假设,如果不成⽴就拒绝原假设。
当然由于样本的随机性,这种推断只能具有⼀定的可靠性。
本章介绍假设检验的基本概念,以及假设检验的⼀般步骤,然后重点介绍常⽤的参数检验⽅法。
由于篇幅的限制,⾮参数假设检验在这⾥就不作介绍了。
第⼀节假设检验的⼀般问题关键词:参数假设;检验统计量;接受域与拒绝域;假设检验的两类错误⼀、假设检验的基本概念(⼀)原假设和备择假设为了对假设检验的基本概念有⼀个直观的认识,不妨先看下⾯的例⼦。
例7.1 某⼚⽣产⼀种⽇光灯管,其寿命X 服从正态分布)200 ,(2µN ,从过去的⽣产经验看,灯管的平均寿命为1550=µ⼩时,。
现在采⽤新⼯艺后,在所⽣产的新灯管中抽取25只,测其平均寿命为1650⼩时。
问采⽤新⼯艺后,灯管的寿命是否有显著提⾼?这是⼀个均值的检验问题。
灯管的寿命有没有显著变化呢?这有两种可能:⼀种是没有什么变化。
即新⼯艺对均值没有影响,采⽤新⼯艺后,X 仍然服从)200 ,1550(2N 。
另⼀种情况可能是,新⼯艺的确使均值发⽣了显著性变化。
这样,1650=X 和15500=µ之间的差异就只能认为是采⽤新⼯艺的关系。
究竟是哪种情况与实际情况相符合,这需要作检验。
假如给定显著性⽔平05.0=α。
在上⾯的例⼦中,我们可以把涉及到的两种情况⽤统计假设的形式表⽰出来。
概率论与数理统计第八章假设检验

为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
数理统计 (研究生课程) :第三章 假设检验

必须认为这个差异反映了事物的本质差别,即反映 了生产已不正常.
这种差异称作 “系统误差”
正确
第二类错误
人们总希望犯这两类错误的概率越小越好,但 对样本容量一定时,不可能使得犯这两类错误的 概率都很小。 往往是先控制犯第一类错误的概率在一定限度 内,再考虑尽量减小犯第二类错误的概率。
即: 较小的 (0,1) 使得 P{拒绝H0|H0为真}≤ ,
然后减小P{接受H0|H0不真} 犯两类错误的概率:
如发现不正常,就应停产,找出原因,排除 故障,然后再生产;如没有问题,就继续按规定 时间再抽样,以此监督生产,保证质量.
很明显,不能由5罐容量的数据,在把握不大 的情况下就判断生产 不正常,因为停产的损失是 很大的.
当然也不能总认为正常,有了问题不能及时 发现,这也要造成损失.
如何处理这两者的关系,假设检验面对的就 是这种矛盾.
如果H0不成立,但统计量的实测 值未落入否定域,从而没有作出否定 H0的结论,即接受了错误的H0,那就 犯了“以假为真”的错误 . “取伪错误” 这两类错误出现的可能性是不可能排除的。 原因在于:由样本推导总体
假设检验的两类错误
实际情况 H0为真 H0不真 第一类错误 正确
决定 拒绝H0 接受H0
在上面的例子的叙述中,我们已经初步介绍 了假设检验的基本思想和方法 .
基于概率反证法的逻辑的检验: 如果小概率事件在一次试验中居然发生, 我们就以很大的把握否定原假设.
概率论与数理统计参数假设检验

μ=μ0=70
显然统计量的值t = -1.4在接受域内,所以接受H0,即可以认 为全体考生平均分为70分.
《概率统计》
返回
下页
结束
例2. 一种元件,要求使用寿命不得低于1000小时,现在从一批这种元件中随 机抽取25件,测得其使用寿命的平均值为950小时,已知该元件寿命服从标准 差σ=100小时的正态分布,试在显著性水平α=0.05下确定这批元件是否合 格.
| U |> u , U> uα , U<- uα
2
时拒绝H0,认为μ1与μ2有显著差异.
《概率统计》
返回
下页
结束
2、
2 1
,
2 2
均未知,但
2 1
=
2 2
时(t 检验)
当H0成立时,选统计量 t (n11)S12(X n2 Y1)S2 2(11)~t(n1n22)
n1n22
n1 n2
由样本计算出 t 值且对应于 α 查得临界值:
由样本观察值计 算统计量的值
第五步,作出统计推断.
统计量的值在接受域 内,则接受H0 ;在拒
绝域内,则拒绝H0
《概率统计》
返回
下页
结束
§8.2 正态总体均值的检验
一、单个正态总体均值μ的假设检验
设 X ~N(μ , σ2 ), X1,X2,…,Xn; μ0为已知数.
H0 : μ= μ0 ,
H1 : μ≠ μ0 (双侧)
结束
二、两个正态总体均值差的假设检验
设 X ~ N (μ1,σ12)
记 n X s2
1
1
则
2
X
~
N(1 ,
1
n
)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n=length(A);
c=sum(A)/n;
B=A-c;
C=B.*B;
S=sum(C);
s=sqrt(S);
t=tinv(a/2,n-1);
T=(c-u)*sqrt(n)/s;
ifT>=t
d=1;
else
d=0;
end
end
结果粘贴:
C1=A-c1;
C2=B-c2;
D1=C1.*C1;
D2=C2.*C2;
S1=sum(D1);
S2=sum(D2);
f1=min(finv(1-a/2,n1-1,n2-1),finv(a/2,n1-1,n2-1));
f2=max(finv(1-a/2,n1-1,n2-1),finv(a/2,n1-1,n2-1));
程序代码:
function[ d ] = kaf( A,B,a )
%UNTITLED2 Summary of this function goes here
% Detailed explanation goes here
n1=length(A);
n2=length(B);
c1=sum(A)/n1;
c2=sum(B)/n2;
F=S1/S2;
ifF>=f1|F<=f2
S=((n1-1)*S1+(n2-1)*S2)/(n1+n2-2);
T=(c1-c2)/(S*sqrt(1/n1+1/n2));
t=tinv(1-a/2,n1+n2-2);
T
ifT>=0
T=T;
else
T=-T;
end
ifT<t
d=1;
else
d=0;
end
z=norminv(a/2);
Z=(c-u)*sqrt(n)/s;
ifz<Z
d=1;
else
d=0;
end
end
结果粘贴:
3
解:假设检验: : , : ;
由于方差未知,故选择检验统计量
所以其拒绝域为
而统计量为|T|=
所以接受
程序代码:
function[ d ] = kaf( A,u,a )
%UNTITLED2 Summary of this function goes here
else
d=0;
end
end
结果粘贴:
4、
解:假设检验: : , : ;
由题意可知,此题为左侧检验,且方差未知,故采用检验统计量
其拒绝域为:
而统计量
所以接受
程序代码:
function[ d ] = kaf( A,u,a )
%UNTITLED2 Summary of this function goes here
1、
解:由题意可知,样本数据来自于服从指数分布的总体
假设检验: : , : ;
其拒绝域的形式为:
统计量为
所以拒绝 ,所以不能够认为这批货物平均寿命不低于1100h
程序代码:
function[ d ] = kaf( A,T,a )
%UNTITLED2 Summary of this function goes here
% Detailed explanation goes here
n=length(A);
c=sum(A)/n;
B=A-c;
C=B.*B;
S=sum(C);
s=sqrt(S);
t=tinv(1-a/2,n-1);
T=(c-u)*sqrt(n)/s;
ifT>0
T=T;
else
T=-T;
end
ifT<t
d=1;
5、
解:设甲机床 ,乙机床
因为此题不知道,两机床的方差是否相等,所以先对 作假设检验
(1)假设检验: : , :
选取统计量
ห้องสมุดไป่ตู้由题目所给数据可得
而由题目假设知
显然0.4539<0.7091<4.0260
所以应接受
即可以认为两者方差是相等的
(2)假设检验: , ;
由(1)知用t检验
拒绝域为:
其中
所以
所以拒绝原假设,故两机床加工的轴有显著的差异。
% Detailed explanation goes here
n=length(A);
c=sum(A)/n;
x=chi2inv(1-a,n);
X=2*n*c/T;
ifx<X
d=1;
else
d=0;
end
end
当d=1时表示接受 ,当d=0时表示拒绝
结果粘贴:
2、
解:假设检验: : , : ;
因为本题是左侧检验问题,故其拒绝域为:
else
fprintf('无法检验')
end
结果粘贴:
而统计量Z= -3.9754<-1.96
所以拒绝
程序代码:function[ d ] = kaf( A,u,a,s )
%UNTITLED2 Summary of this function goes here
% Detailed explanation goes here
n=length(A);
c=sum(A)/n;