概率论与数理统计假设检验

合集下载

概率论与数理统计课件：假设检验

假设检验
首页返回退出
五、假设检验的两类错误
由于样本具有随机性，因此，当我们利用样本判断时，可能会犯两类错误：
所作决策
真实情况
(未知)
样本未落入拒绝域样本落入拒绝域
接受H0
拒绝H0
H0为真
正确
第一类错误
H0不真
第二类错误
正确
第一类(弃真): 第二类(取伪):
假设检验
P{拒绝H0|H0为真}= , P{接受H0|H0不真}= .
(α=0.05)
解：正态总体X~N(μ，σ2)，已知σ=2
要检验的假设为
H0 : 40, H1 : 40
选择检验统计量
Z X 0 ~ N (0,1) / n
假设检验
首页返回退出
解：正态总体X~N(μ，σ2)，已知σ=2
要检验的假设为
H0 : 40, H1 : 40
选择检验统计量
由样本数据计算，得 x 100.104 计算统计量Z的观测值，得
Z 100.104 100 0.658 1.96 0.5 / 10
没有落入拒绝域
结论：不拒绝原假设，认为内径的值符合设计要求.
假设检验
首页返回退出
要检验的假设为
H0 : 100, H1 : 100
（2）未知σ2 ，选择检验统计量
没有落入拒绝域
结论：不拒绝原假设，认为内径的值符合设计要求.
假设检验
首页返回退出
例2 某厂生产的固体燃料推进器的燃烧率服从正态分布X~N(40，22)，现在采用技术研发部设计的新方法生产了一批推进器，随机测试25只，测得燃烧率的样本均值为 x 41.25 ，假设在新方法下σ=2，问用新方法生产的推进器的燃烧率是否有显著的提高？

概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题，本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式，并利用样本值确定了一个估计值，认为参数真值。

由于参数是未知的，只是一个假设（假说，假想），它可能是真，也可能是假，是真是假有待于用样本进行验证（检验）.下面我们先对几个问题进行分析，给出假设检验的有关概念，然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg，每天开工时，需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( )．某日开工后，抽取了8袋，如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立？请看以下几个问题：问题1引号内的命题可能是真，也可能是假，只有通过验证才能确定．如果根据抽样结果判断它是真，则我们接受这个命题，否则就拒绝接受它，此时实际上我们接受了“机器工作不正常”这样一个命题．若用H0表示“”，用H1表示其对立面，即“”，则问题等价于检验H0：是否成立，若H0不成立，则H1：成立．一架天平标定的误差方差为10-4(g2)，重量为的物体用它称得的重量X服从N( )．某人怀疑天平的精度，拿一物体称n次，得n 个数据，由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立？问题2记H0: =10-4，H1: ，则问题等价于检验H0成立，还是H1成立．某种电子元件的使用寿命X服从参数为的指数分布，现从一批元件中任取n个，测得其寿命值（样本），如何判定“元件的平均寿命不小于5000小时”这个命题是否成立？记问题3则问题等价于检验H0成立，还是H1成立．某种疾病，不用药时其康复率为，现发明一种新药（无不良反应），为此抽查n位病人用新药的治疗效果，设其中有s人康复，根据这些信息，能否断定“该新药有效”？记问题4则问题等价于检验H0成立，还是H1成立．自1965年1月1日至1971年2月9日共2231天中，全世界记录到震级4级及以上的地震共计162次，问相继两次地震间隔的天数X是否服从指数分布？问题5记服从指数分布，不服从指数分布．则问题也等价于检验H0成立，还是H1成立．在很多实际问题中，我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断，数理统计学中将这些有待验证的陈述或命题称为统计假设，简称假设．如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。

概率论和数理统计假设检验课件

随机变量的分类
随机变量的分布函数
描述随机变量取值范围的函数，其值域为[0,1]。
离散型随机变量和连续型随机变量。
数理统计基础
参数估计
参数估计的概念
参数估计是根据样本数据推断总体参数的过程。
点估计
通过样本数据直接得到一个具体的数值作为总体参数的估计值。
区间估计
根据样本数据计算出一个区间，该区间包含总体参数的可能性较高。
假设检验与回归Байду номын сангаас析的比较
目的和方法不同
假设检验的主要目的是判断一个或多个零假设是否成立，而回归分析是通过建立数学模型来描述
因变量和自变量之间的关系。
应用场景不同
假设检验常用于检验关于参数的假设是否成立，而回归分析则广
泛应用于预测和解释数据。
侧重点不同
假设检验侧重于参数的点估计和推断，而回归分析侧重于描述和
详细描述
在两独立样本的假设检验中，我们需要确保两组样本是相互独立的，然后使用适当的统计量来比较两组样本的平均值或比例。常见的两独立样本假设检验包括t检验、Z检验和卡方检验等。
两相关样本的假设检验
总结词
两相关样本的假设检验是用来比较两个相关样本的平均值或比例是否相等。
详细描述
在两相关样本的假设检验中，我们需要确保两组样本是相关的，然后使用适当的统计量来比较两组样本的平均值或比例。常见的两相关样本假设检验包括配对t检验和威尔科克森符号秩检验等。
预测变量之间的关系。
习题与思考题
基础概念题
题目1
假设检验的基本概念是什么？请简述其步骤。
题目4
什么是第一类和第二类错误？如何避免它们？
题目2

概率论与数理统计-假设检验

设
14
若
取伪的概率较大.
15
/2
0.12 0.1
0.08 0.06 0.04 0.02
/2 H0 真
60 62.5 65 67.5 70 72.5 75
0.12 0.1
0.08 0.06 0.04 0.02
H0 不真
67.5 70 72.5 75 77.5 80 82.5
16
现增大样本容量,取n = 64, = 66,则
41
两个正态总体
设 X ~ N ( 1 1 2 ), Y ~ N ( 2 2 2 )
两样本 X , Y 相互独立, 样本 (X1, X2 ,…, Xn ), ( Y1, Y2 ,…, Ym ) 样本值 ( x1, x2 ,…, xn ), ( y1, y2 ,…, ym )
显著性水平
42
(1) 关于均值差 1 – 2 的检验
原假设备择假设检验统计量及其在
H0
H1
H0为真时的分布拒绝域 Nhomakorabea1 – 2 = 1 – 2
1 – 2 1 – 2 <
1 – 2 1 – 2 > ( 12，22 已知)
43
原假设备择假设检验统计量及其在
H0
H1
H0为真时的分布
1 – 2 = 1 – 2
拒绝域
1 – 2 1 – 2 <
1 – 2 1 – 2 >
12, 22未知
12
=
2 2
其中
44
(2)
关于方差比
2 1
/
2 2
的检验
原假设备择假设检验统计量及其在
H0
H1
H0为真时的分布

《概率论与数理统计》第七章假设检验.

《概率论与数理统计》第七章假设检验.第七章假设检验学习⽬标知识⽬标：理解假设检验的基本概念⼩概率原理；掌握假设检验的⽅法和步骤。

能⼒⽬标：能够作正态总体均值、⽐例的假设检验和两个正态总体的均值、⽐例之差的假设检验。

参数估计和假设检验是统计推断的两种形式，它们都是利⽤样本对总体进⾏某种推断，然⽽推断的⾓度不同。

参数估计是通过样本统计量来推断总体未知参数的取值范围，以及作出结论的可靠程度，总体参数在估计前是未知的。

⽽在假设检验中，则是预先对总体参数的取值提出⼀个假设，然后利⽤样本数据检验这个假设是否成⽴，如果成⽴，我们就接受这个假设，如果不成⽴就拒绝原假设。

当然由于样本的随机性，这种推断只能具有⼀定的可靠性。

本章介绍假设检验的基本概念，以及假设检验的⼀般步骤，然后重点介绍常⽤的参数检验⽅法。

由于篇幅的限制，⾮参数假设检验在这⾥就不作介绍了。

第⼀节假设检验的⼀般问题关键词：参数假设；检验统计量；接受域与拒绝域；假设检验的两类错误⼀、假设检验的基本概念（⼀）原假设和备择假设为了对假设检验的基本概念有⼀个直观的认识，不妨先看下⾯的例⼦。

例7.1 某⼚⽣产⼀种⽇光灯管，其寿命X 服从正态分布)200 ,(2µN ，从过去的⽣产经验看，灯管的平均寿命为1550=µ⼩时，。

现在采⽤新⼯艺后，在所⽣产的新灯管中抽取25只，测其平均寿命为1650⼩时。

问采⽤新⼯艺后，灯管的寿命是否有显著提⾼？这是⼀个均值的检验问题。

灯管的寿命有没有显著变化呢？这有两种可能：⼀种是没有什么变化。

即新⼯艺对均值没有影响，采⽤新⼯艺后，X 仍然服从)200 ,1550(2N 。

另⼀种情况可能是，新⼯艺的确使均值发⽣了显著性变化。

这样，1650=X 和15500=µ之间的差异就只能认为是采⽤新⼯艺的关系。

究竟是哪种情况与实际情况相符合，这需要作检验。

假如给定显著性⽔平05.0=α。

在上⾯的例⼦中，我们可以把涉及到的两种情况⽤统计假设的形式表⽰出来。

概率论和数理统计假设检验

① H0 := 0 ② H0 : = 0 ③ H0 : = 0
检验统计量T
X 0 S n
~ t ( n 1) —t检验法
H1 : ≠ 0 H1 : > 0 H1 : < 0
T t ( n 1);
2
T t ( n 1) T t ( n 1)
要问：两总体的均值是否有显著的差别？应设 H0：1=2，H1： 1≠2——双边检验要问：总体X的均值是否显著比总体Y的均值大？应设 H0：1 ≤ 2，H1：1——单边检验 2
四、方法的步骤
13
回顾引例的解题过程 1、根据问题的要求，提出假设H0和备择假设H1。
（它的分布应不含任何未知参数，而且可以查出或算出它的分位点。）
原假设 8
二、常用的术语
备择假设
解: 今假设H0 ：=0=0.5，且记H1 ：≠0=0.5，
由于X～N(0， 2),故 X ~ N ( 0 , 2 n) 当H0为真时， X 0 检验统计量进而: U ~ N (0,1) 检 n 验水对于给定的 =0.05，有
U X Y
21
1
n1
2

2 2
~
N (0,1)
n2
作为检验统计量——U检验法。两总体X与Y的方差 12、22未知，但12=22= 2，用
T S X Y 1 1 n1 n2 ~ t ( n1 n2 2)
拒绝域
双侧检验的拒绝域取在两侧; 单边检验的拒绝域中不等式的取向与备择假设H1中不等式的取向完全一致。
例2 在正常情况下,某工厂生产的灯泡的寿命X服从正态分布,今
测得10个灯泡寿命为: 19 1490,1440,1680,1610,1500,1750,1550,1420,1800,1580 问能否认为该工厂生产的灯泡寿命 0=1600 (=0.05)?

概率论和数理统计假设检验

05
非参数假设检验
Wilcoxon秩和检验
总结词
用于检验两个独立样本是否来自同一分布，特别是当样本量较小或总体分布未知时。
详细描述
Wilcoxon秩和检验通过将每个样本的观测值替换为其在所有观测值中的秩，然后比较两组的秩和来进行检验。如果两个样本来自同一分布，则它们的秩和应该接近相等。
THANKS
感谢观看
确定检验水准
根据研究目的和样本量等因素，确定检验水准，如α和β。
计算统计量
根据数据和选择的统计方法，计算出相应的统计量。
选择合适的统计方法
根据数据类型和假设，选择合适的统计方法进行检验。
单侧与双侧检验
单侧检验
只考虑一个方向的假设检验，如只考虑增加或只考虑减少。
双侧检验
同时考虑两个方向的假设检验，即同时考虑增加和减少。
检验效能
检验效能是指假设检验能够正确拒绝一个错误假设的能力。在给定样本大小的情况下，提高检验效能可以提高假设检验的准确性。
假设检验的误用与避免
误用
假设检验的误用通常包括不恰当的假设、错误的解读、过度推断等。这些错误可能导致错误的结论，影响科学研究的可靠性和有效性。
避免方法
为了避免假设检验的误用，研究者应确保假设合理、解读准确，并避免过度推断。同时，应采用多种方法进行验证，以提高研究的可靠性和准确性。
方差齐性检验
01
方差齐性检验
用于检验两组数据或多个组数据的方差是否具有齐性。常见的方差齐性检验方法包括Bartlett检验、Levene检验等。
02
总结词
方差齐性检验是假设检验中的重要步骤，它有助于判断不同组数据之间是否存在显著差异。

概率论与数理统计第八章假设检验

当总体分布函数完全未知或只知其形式、但不知其参数的情况，为推断总体的性质，提出某些关于总体的假设。
为判断所作的假设是否正确, 从总体中抽取样本, 根据样本的取值, 按一定的原则进行检验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验总体均值、均值差的检验总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本，构造一个检验统计量T 和检验法则：若与T的取值有关的一个小概率事件W发生，则否定H0，否则接受H0，而且要求
P(W|H0)
此时称W为拒绝域，整为理课检件验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

H0 ： ? ? ? 0 H1 ： ? >? 0
z ? x ? ?0 ?n
? 未知： z ? z1? ? / 2
t ? x ? ?0
sn
z ? ? z1? ?
z ? z1? ?
t ? t1? ? / 2
P??
t ? ? t1??
拒绝H0
t ? t1??
一、总体标准差已知时的单个正态总体均值的 U检验
s/ n
假设
单侧检验双侧检验
左侧检验右侧检验
原假设 H0 : ? = ? 0 H0 : ? ? ? 0 H0 : ? ? ? 0
备择假设 H1 : ? ≠? 0 H1 : ? < ? 0 H1 : ? > ? 0
双侧检验
抽样分布
置信水平
拒绝H0
? /2
1 -?
拒绝H0
? /2
0 临界值
样本统计量临界值
在Matlab中U检验法由函数ztest来实现。调用格式如下
[H , P,CI , zval] ? ztest( X, ? 0 ,? ,? ,Tail )
·[h,sig]=ztest(x,m,sigma,alpha,tail) ·h=ztest(x,m,sigma) ·h=ztest(x,m,sigma,alpha) ·[h,sig,ci]=ztest(x,m,sigma,alpha,tail) 命令[h,sig,ci]＝ztest(x,m,sigma,alpha,tail)表示通过tail 指定值控制可选择假设的类型, 以显著性水平为alpha 检验, 标准差为sigma 的正态分布样本x 的均值是否为m. 返回值h＝l表示在显著性水平为alpha 时拒绝原假设; h＝0 表示在显著水平为alpha 时不拒绝原假设. 返回值sig 为Z 的样本数据在x 的均值为 m 的原假设下较大或者在统计意义下较大的概率值. ci 返回置信度为100(1-alpha)%的真实均值的置信区间.
当Tail=0时，备择假设为“ ? ? ? 0 ”；
当Tail=1时，备择假设为“ ? ? ? 0”；
当Tail=-1时，备择假设为“ ? ? ? 0 ”；
当H=0表示接受原假设；当H=1表示拒绝原假设。
例 1、某切割机正常工作时，切割的金属棒的长度服从正态分布
N (100,4) .
从该切割机切割的一批金属棒中随机抽取
总体：
X
~
N(?
,?
2 0
)
样本： X1, X2 , , Xn
假设：
H0 : ? ? ?0, H0 : ? ? ?0, H0 : ? ? ?0,
H1 : ? ? ? 0 . H1 : ? ? ? 0 H1 : ? ? ? 0
? ztest函数调用格式： h = ztest(x,m,sigma) h = ztest(...,alpha) h = ztest(...,alpha,tail) h = ztest(...,alpha,tail,dim) [h,p] = ztest(...) [h,p,ci] = ztest(...) [h,p,ci,zval] = ztest(...)
是否成立 , 以决定是接受还是否定原假设 H 0. 假设检验的判断和结论是根据样本做出的 , 故具有“概率性” , 从而要犯判断上的错误 ——弃真错误和取伪错误 . 假设检验分为参数假设检验和总体分布假设检验两类 . ? 由样本数据来做出拒绝和接受原假设的判断 , 计算量是相当大的 . 下面我们用 MATLAB 软件来解决这一问题 .
抽样分布
拒绝H0
?
置信水平
1 -?
临界值
0
样本统计量
观察到的样本统计量
抽样分布
置信水平
拒绝H0
1-?
?
0 观察到的样本统计量
样本统计量临界值
假设假设形式
统计量
拒绝域 P 值决策
双侧检验
H0 ： ? =? 0 H1 ： ? ? ? 0
? 已知：
左侧检验
右侧检验
H0 ： ? ? ?0 H1 ： ? <? 0
15 根，测得它们的长度（单
位： mm ）如下：
97 102 105 112 99 103 102 94 100 95 105 98 102 100 103. 假设总体方差不变，试检验该切割机工作是否正常，即总体均值是否等于
100mm ？取显著性水平 ? ? 0.05 .
>> x = [97 102 105 112 99 103 102 94 100 95 105 98 102 100 103]; % 调用ztest函数作总体均值的双侧检验， % 返回变量h，检验的p值，均值的置信区间muci，检验统计量的观测值zval >> [h,p,muci,zval] = ztest(x,100,2,0.05) % 调用ztest函数作总体均值的单侧检验 >> [h,p,muci,zval] = ztest(x,100,2,0.05,'right')
我认为这种新药的疗效比原有的药物更有效!
2
构造假设选择统计量并计算确定? 作出决策
总体
??
??பைடு நூலகம்
? ??
??
提出假设
我认为人口的平均年龄是 50岁
作出决策拒绝假设
别无选择!
抽取随机样本
??均x =值20?
? 1. 问题背景 ? 假设检验是统计推断的基本问题之一 , 主要是确定关于样本总体特征的判断是否合理 . ? 其基本思想是 , 按照一定的规则 (即检验准则 ), 根据样本信息对所做出的原假设 H 0 判断
? 2. 实验目的与要求 ? (1) 掌握 MATLAB 工具箱中关于假设检验的有关操作命令 ; ? (2) 熟练掌握对单个正态总体均值、方差的假设检验 ; ? (3) 掌握对两个正态总体均值、方差有关的假设检验 ; ? (4) 掌握两个未知总体分布类型对均值是否相等的假设检验 ; ? (5) 掌握对单个总体是否服从正态分布的假设检验 ; ? (6) 掌握对单个总体是否服从指定的理论分布的假设检验 .
? 求解参数假设检验问题的步骤 : ? (1) 根据问题提出合理的原假设 H 0和备择假设H 1 ; ? (2) 给定显著性水平 α , 一般取较小的正数 , 如
0.05,0.01 等;
? (3) 选取合适的检验统计量及确定拒绝域的形式 ; ? (4) 令P{当H 0为真拒绝H 0}<= α , 求拒绝域; ? (5) 由样本观察值计算检验统计量的值 , 并做出决策:
拒绝H 0或接受H 0 .
(1) ? 已知：
设 x1 , x2 , , xn 是来自正态总体X的一个简单随机样
? 本，样本均值为
x?
1 n
n i?1
xi ，根据单个总体的抽样分布结
论，选用统计量
z ? x ? ? 0 ~ N (0,1) ?n
(2) ? 未知：
选用统计量：
t ? x ? ? 0 ~ t(n ? 1)

概率论与数理统计假设检验

概率论与数理统计课件：假设检验

概率论与数理统计(8)假设检验

概率论和数理统计假设检验课件

概率论与数理统计-假设检验

《概率论与数理统计》第七章假设检验.

概率论和数理统计 假设检验

概率论和数理统计假设检验

概率论与数理统计第八章假设检验

概率论和数理统计假设检验