数理统计假设检验
概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
概率论与数理统计-假设检验

14
若
取伪的概率较大.
15
/2
0.12 0.1
0.08 0.06 0.04 0.02
/2 H0 真
60 62.5 65 67.5 70 72.5 75
0.12 0.1
0.08 0.06 0.04 0.02
H0 不真
67.5 70 72.5 75 77.5 80 82.5
16
现增大样本容量,取n = 64, = 66,则
41
两个正态总体
设 X ~ N ( 1 1 2 ), Y ~ N ( 2 2 2 )
两样本 X , Y 相互独立, 样本 (X1, X2 ,…, Xn ), ( Y1, Y2 ,…, Ym ) 样本值 ( x1, x2 ,…, xn ), ( y1, y2 ,…, ym )
显著性水平
42
(1) 关于均值差 1 – 2 的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布拒绝域 Nhomakorabea1 – 2 = 1 – 2
1 – 2 1 – 2 <
1 – 2 1 – 2 > ( 12,22 已知)
43
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
1 – 2 = 1 – 2
拒绝域
1 – 2 1 – 2 <
1 – 2 1 – 2 >
12, 22未知
12
=
2 2
其中
44
(2)
关于方差比
2 1
/
2 2
的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
数理统计:假设检验

二 假设检验的思路、步骤和术语
由长期实践可知,标准差较稳定,设 15, 则 X ~ N (, 152 ), 其中未知.
1. 提出两个对立假设
H0 : 0 500
H1 : 0
原假设或零假设
备择假设
利用已知样本作出判断:是接受假设H0(拒绝假 设H1), 还是拒绝假设H0(接受假设H1). 如果作出的判 断是接受H0, 则认为 0 500 , 即认为机器工作是 正常的, 否则, 认为是不正常的.
13
2. 选择适当的统计量,称为检验统计量,
原则是 1°其中含着总体X的均值 好的估计 X ,
2° H0为真时,检验统计量分布确定。
因为 X是 的无偏估计量,
检验统计量
若 H0 为真, 则| x 0 | 不应太大,
当H0为真时, X ~ N (0 , 2 n),
Z X 0 ~ N (0,1), / n
P{拒绝H0 H0为真} (按“=”具体计算)
以假当真: 当μ≠500时,X 取值落在500附近的可能也存 在,此时将接受H0,认为μ=500,于是犯了取伪错误,称 为第二类错误,犯第Ⅱ类错误的概率
P{接受H0 H0不真}
23
两类错误的关系
以下述检验为例:X~N(, 2), 已知, 未知
率不超过 ,而犯第ⅠI类错误的概率无法控制。
25
【注】假设检验的结果与显著性水平α的大小有关: α越小越不易拒绝H0. 就引例而言:
当α=0.05时,则 临界值z /2 z0.025 1.96,
z x 0 2.2 1.96, 落入拒绝域 / n
于是拒绝 H0, 认为包装机工作不正常.
在实例中若取定 0.05,则 k z / 2 z0.025 1.96,
假设检验(Hypothesis

假设检验(Hypothesis Test)假设检验是数理统计中按照⼀定的假设条件由样本推断总体的⼀种⽅法,因此假设检验也成为“显著性检验(Test of statistical significant)”,是研究样本与样本之间、样本与总体之间的误差是由抽样误差引起的还是本质误差的统计推断⽅法。
它的基本思想是在假设成⽴的条件下,根据某个统计⽅法(如Z检验、卡⽅检验等)的⽅法估计输⼊数据的统计特性,根据统计特性和输⼊数据的分布估计假设成⽴的概率⼤⼩,如果⼩于某⼀个预先设定的“显著性⽔平(significant level)”则说明假设不成⽴,反之则说明假设成⽴。
假设检验所定义的假设成为零假设,数学上⼀般写成H0(念:H-nought)。
与H0对⽴的假设,即对⽴假设,也称为备择假设。
由于我们对于假设的判断是基于概率统计所作出的判断,那么我们就很有可能(⼀定的概率)做出错误的判断。
错误分两种,第⼀类错误为H0假设成⽴,但是我们却认为它不成⽴,第⼆类错误是说H0不成⽴,但是我们却认为它成⽴。
⼀般⽽⾔,第⼀类错误更难为⼈所忍受,所以在判断时,允许犯这种错误的可能性必须要极低——即犯第⼀类错的事件应该是⼀个⼩概率事件。
假设检验就是基于这种⼩概率原理,即事先确定的作为判断的标准,即允许犯错的⼩概率标准,这种⼩概率标准就是统计学上定义的“显著性⽔平-α”,如果根据假设计算出来的概率⼩于这个显著性⽔平,则拒绝原假设,反之,如果⼤于这个标准,则承认原假设。
因此,⼀般把1-α称为“置信区间”或者“接收区间”,⼩于α的区间称为“拒绝区间”。
举个例⼦来说明,⼀个⼈被控诉犯罪,陪审团根据现有的条件做出对这个⼈有罪还是⽆罪的判断。
事实上,陪审团就是进⾏⼀个假设检验。
假设H0:被告⽆罪假设H1:被告有罪当然,陪审团现在还不知道哪个假设是成⽴的,他们必须根据控辩双⽅的证词做出判断,判断的结果只有两种,⼀种是被告⽆罪释放,⼀种是被告罪名成⽴。
概率论与数理统计第八章假设检验

为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
假设检验

1 假设检验的一般问题1.1假设检验的定义假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
1.2 参数估计与假设检验统计推断是由样本的信息来推测母体性能的一种方法,它又可以分为两类问题,即参数估计和假设检验,它们都是利用样本对总体进行某种推断,然而推断的角度不同。
参数估计是通过样本统计量来推断总体未知参数的取值范围,以及作出结论的可靠程度,总体参数在估计前是未知的。
而在假设检验中,则是预先对总体参数的取值提出一个假设,然后利用样本数据检验这个假设是否成立,如果成立,我们就接受这个假设,如果不成立就拒绝原假设。
当然由于样本的随机性,这种推断只能具有一定的可靠性。
实际生产和科学实验中,大量的问题是在获得一批数据后,要对母体的某一参数进行估计和检验。
例如,我们对45钢的断裂韧性作了测定,取得了一批数据,然后要求45钢断裂韧性的平均值,或要求45钢断裂韧性的单侧下限值,或要求45钢断裂韧性的分散度(即离散系数),这就是参数估计的问题。
又如,经过长期的积累,知道了某材料的断裂韧性的平均值和标准差,经改进热处理后,又测得一批数据,试问新工艺与老工艺相比是否有显著差异,这就是假设检验的问题。
这样可以看出,参数估计是假设检验的第一步,没有参数估计,也就无法完成假设检验。
1.3假设检验的基本思想假设检验的基本思想是小概率反证法思想。
小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。
反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。
1.4假设检验的基本概念1.4.1原假设和备择假设为了对假设检验的基本概念有一个直观的认识,不妨先看下面的例子。
例 1 某厂生产一种日光灯管,其寿命X 服从正态分布)200 ,(2μN ,从过去的生产经验看,灯管的平均寿命为1550=μ小时,。
数理统计学中的参数估计和假设检验

数理统计学中的参数估计和假设检验在现代统计学中,参数估计和假设检验是非常重要的概念。
这些概念互相关联,但是又有不同的应用。
在此,我们将讨论这两个概念的基本原则以及它们在现实生活中的应用。
参数估计可以被描述为研究一组数据的基本特征。
通过这个过程,我们试图推断出这个数据集的平均值、标准差和其他的参数。
这些参数会充当我们对整个数据集的总体特征的代表,是基于样本数据和概率等数学方法来实现的。
数理统计学中有两种常见的参数估计方法:点估计和区间估计。
点估计法指的是通过现有的样本数据,确定整体数据集的一个参数值。
这个参数值是一个点,代表了这个总体数据的典型特征。
例如,一个统计学家可能会利用一个样本数据集的均值来估计整个数据集的均值。
这个方法非常简单,但是也有缺点,因为单个点可能不能完整地反映出整个总体的信息。
相对于点估计方法,区间估计法则是根据样本数据并结合概率论提供一个充分范围内的参数估计值。
以信心水平的方式,给出估计结果的范围和信心度。
这样的区间被称为可信区间,其中的参数值处于一定的置信度内,一般用百分之几的置信度表示。
例如,一个样本数据的均值在一定的置信度下是x到y之间的。
区间估计法是一种更加准确的方法,因为它允许我们知道参数值的变化范围,而不仅仅是一个单点。
但是,这种技术会带来更多的复杂性,需要一些基本的统计技能。
另一方面,假设检验则是一种帮助我们确定一个假设是否正确的方法。
这个方法通常用于对两个数据组的统计分析中,并且可以用于比较一个数据集的平均值是否等于一个已知的值。
简单说就是,假设检验能够让我们确定样本数据是否足够代表总体,并且也让我们确认样本数据能否代表以前的观测和研究。
在假设检验中,我们制定一个假设被称为研究假设,并组对比之前已知的信息,提出一个对立假设。
之后,我们会挑选一个随机样本并采取测量行动。
我们利用这个测量行动来确定样本数据是否属于已知的总体比例,或者是否对研究假设做出了支持。
如果样本数据足够代表总体,并且不同于已知的比例,则我们可以拒绝研究假设并接受对立假设。
概率论与数理统计教案假设检验

概率论与数理统计教案-假设检验第一章:假设检验概述1.1 假设检验的定义与作用引导学生理解假设检验的基本概念解释假设检验在统计学中的重要性1.2 假设检验的基本步骤介绍假设检验的基本步骤,包括建立假设、选择显著性水平、计算检验统计量、确定决策规则和给出结论1.3 假设检验的类型解释单样本假设检验、两样本假设检验和方差分析等不同类型的假设检验第二章:单样本假设检验2.1 单样本Z检验介绍单样本Z检验的适用场景和条件解释Z检验的计算方法和步骤2.2 单样本t检验介绍单样本t检验的适用场景和条件解释t检验的计算方法和步骤2.3 单样本秩和检验介绍单样本秩和检验的适用场景和条件解释秩和检验的计算方法和步骤第三章:两样本假设检验3.1 两样本t检验介绍两样本t检验的适用场景和条件解释两样本t检验的计算方法和步骤3.2 两样本秩和检验介绍两样本秩和检验的适用场景和条件解释两样本秩和检验的计算方法和步骤3.3 配对样本t检验介绍配对样本t检验的适用场景和条件解释配对样本t检验的计算方法和步骤第四章:方差分析4.1 方差分析的适用场景和条件解释方差分析的适用场景和条件,包括完全随机设计、随机区组设计和析因设计等4.2 方差分析的计算方法介绍方差分析的计算方法,包括总平方和、组间平方和和组内平方和的计算4.3 方差分析的判断准则解释F检验的判断准则和显著性水平的确定第五章:假设检验的扩展5.1 非参数检验介绍非参数检验的概念和适用场景解释非参数检验的计算方法和步骤5.2 假设检验的优化方法介绍自助法和贝叶斯方法等假设检验的优化方法5.3 假设检验的软件应用介绍使用统计软件进行假设检验的方法和技巧第六章:卡方检验6.1 卡方检验的基本概念介绍卡方检验的定义和作用解释卡方检验在分类数据分析中的应用6.2 拟合优度检验解释拟合优度检验的概念和计算方法举例说明拟合优度检验在实际中的应用6.3 独立性检验解释独立性检验的概念和计算方法举例说明独立性检验在实际中的应用第七章:诊断性统计与效果量分析7.1 诊断性统计的概念介绍诊断性统计的定义和作用解释诊断性统计在教学评估中的应用7.2 效果量的计算方法介绍效果量的定义和计算方法解释不同效果量指标的含义和应用7.3 效果量分析的实际应用举例说明效果量分析在教学研究中的具体应用第八章:多重比较与事后检验8.1 多重比较的概念介绍多重比较的定义和作用解释多重比较在实验数据分析中的应用8.2 事后检验的方法介绍事后检验的概念和计算方法解释不同事后检验方法的原理和应用8.3 多重比较与事后检验的实际应用举例说明多重比较与事后检验在实际研究中的应用第九章:贝叶斯统计与贝叶斯推断9.1 贝叶斯统计的基本概念介绍贝叶斯统计的定义和特点解释贝叶斯统计与经典统计的区别9.2 贝叶斯推断的计算方法介绍贝叶斯推断的计算方法和步骤解释贝叶斯推断在实际中的应用9.3 贝叶斯统计软件应用介绍使用贝叶斯统计软件进行数据分析的方法和技巧第十章:假设检验的综合应用与案例分析10.1 假设检验在医学研究中的应用举例说明假设检验在医学研究中的具体应用10.2 假设检验在社会科学研究中的应用举例说明假设检验在社会科学研究中的具体应用10.3 假设检验在商业数据分析中的应用举例说明假设检验在商业数据分析中的具体应用重点和难点解析重点环节1:假设检验的定义与作用假设检验是统计学中的核心内容,理解其定义和作用对于后续的学习至关重要。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
问题3 某教育研究部门想研究大学生毕业后参加工作的表现 是否与上学的地区有关,为此调查了毕业一年后工作的大学 生800人。按东南、西南、西北、东北四个地区各200人进行 调查,然后请工作单位对它们的表现给予评价:
实际频数
(vi npi )2
2=
2 另 一 方 面 , ( 2 ) = 5 . 9 9 1 0 . 9 5
1 2 1 9 1 9 6 5 0 8 3 . 9 2 6 . 5 2
结论:拒绝H0,顾客的喜爱存在差异。
例2 检查产品质量时,每次抽取10个产品检验,共 抽取100次。得下表:
a0, a 不妨设X为连续,将X的取值区间[a, b]进行m等分, 1,..., a m
统计区间[ai, ai+1)上的样本频数vi , 表示实际频数,又计算
在 H 下 0 p P { a X a } F ( a ) F ( a ) i i i 1 0 i 1 0 i
np
2 另 一 方 面 , ( 2 ) = 5 . 9 9 1 0 . 9 5
vi2 = 100 1 0 1 . 7 1 0 0 1 . 7 i 1 npi
假设检验(2)
——非参数检验
问题的提出: 1. 推断一组数据的分布; 2. 两组数据是否相关,是否独立; 3. 两组数据是否有显著差异; ……
一、某些实际问题
问题1 某超市为了调查顾客对三种品牌矿泉水的喜好比
例,以便为下一次进货提供决策,随机观察了150名
购买者,并记录下他们所买的品牌,统计数据如下:
归纳问题:
( 1 ) H : X ~ F ( x ) ,H : X 不 服 从 分 布 F ( x ) 0 0 1 0
( 2 ) H : X 与 Y 独 立 ,H : X 与 Y 不 独 立 0 1
( 3 ) H : F ( x ) F ( x ) ,H : F ( x ) F ( x ) 01 2 1 1 2
二、卡方拟合检验
在 H 下 , 理 论 频 数 为 n p , 设 A 中 实 际 频 数 为 v , 0 i i i
在 H 下 , 实 际 频 数 v 与 理 论 频 数 n p 应 相 差 不 大 。 0 i i
皮尔逊提出如下统计量:
2 ( v np ) i 2 = i npi i1 r
问次品数是否服从二项分布?( =0.05)
H : X ~ B ( 1 0 ,) p ,H : X 不 服 从 B ( 1 0 ,) p 0 1
首先对参数p进行估计。
X 1 10 1 1 100 ˆ p ˆ 矩 估 计 : X 1 0 p ivi 0.1 ˆ p xi 10 1000 i0 10 100 i1
问顾客对这三种矿泉水的喜好是否存在显著差异?
1 1 H : ppp , H : 至 少 一 个 比 例 超 过 0 1 2 3 1 3 3
问题2 某超市的库存管理员需要掌握商品的库存规律, 以便制定某商品的库存计划。为此,库存管理员统计 了一年中每周需求量:
问每周需求量是否服从正态分布?
H : 工 作 表 现 与 地 区 独 立 , H : 工 作 表 现 与 地 区 不 独 立 0 1
问题4 某饮料厂家采用两种不同配方推出两种新的饮料,现 抽取了10位消费者,让他们分别品尝两种饮料并加以评分, 从不喜欢到喜欢,其分数表示为1~10,评分结果如下:
问两种饮料评分是否有显著差异?
H :( F x ) F ( xH ) , 11 :( F x ) F ( x ) 0 1 2 2
2 ( v n p ) 2 2 i i 并 且 , = ~( n 1 )( 在 H 下 ) 0 n p i 1 i r
2 2 H0的拒绝域为: K { ( r 1 ) } 0 1
二、卡方拟合检验
2. 分布的卡方拟合检验
:( F x ) F ( xH ) , 1 :( F x ) F ( x ) 设 样 本 X ,, X 来 自 总 体 F ( x ) ,H 0 0 0 1 n
二、卡方拟合检验
注意: 1. 卡方统计量的另一种表达式:
=
2 i 1 m
vi2 n np i
2. 卡方拟合检验主要用于大样本场合,要求各类的观测 频数不小于5,因此往往需要把一些相邻类合并达到
要求。
3. 区间的划分具有人为性。
问题1
问顾客对这三种矿泉水的喜好是否存在差异?
1 1 H : ppp ,H : 至 少 一 个 比 例 超 过 0 1 2 3 1 3 3
2 ( v n p ) 2 i i 在 H 下 , 理 论 频 数 为 n p , 构 造 统 计 量 = 0 i n p i 1 i m
2 ( v n p ) 2 i i 并 且 , = ~ ( n 1l ) n p i 1 i 其 中 , l 为 分 布 F ( x ) 中 未 知 参 数 个 数 。 0 2 m
二、卡方拟合检验
1. 分类数据的卡方检验 收集分类数据的目的是分析在各类中数据的分布。 以问题1为例。设矿泉水品牌为X,
1 X ~ p1 2 p2 3 p3
问题的提出:假设某项指标X被分成r类: A 1, A 2,..., A r
H : A 类 所 占 的 比 例 为 p , i 1 , 2 , . . . , r 0 i i
列表计算:
1 0 p 0 . 9 0 . 3 4 8 7 0
9 p 1 0 0 . 1 0 . 9 0 . 3 8 7 4 1 2 2 8 p C 0 . 10 . 9 0 . 1 9 3 7 2 1 0
v
2 i i
p 1 ppp . 0 5 7 4 3 0 1 2 0