数理统计--第八章假设检验
概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
概率论与数理统计第八章假设检验

为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
统计学-第八章 假设检验

假设 原假设
双侧检验
单侧检验
左侧检验 右侧检验
H0 : m =m0 H0 : m m0 H0 : m m0
备择假设 H1 : m ≠m0 H1 : m <m0 H1 : m >m0
三、假设检验的程序---
4.例题分析
[例8.1] 某品牌洗衣粉在它的产品说明书中声称:平 均净含量不少于1250克。从消费者的利益出发,有关研 究人员要通过抽检其中的一批产品来验证该产品制造商 的说明是否属实。试写出用于检验的原假设与备择假设。
2.接受域:概率P>的区域,为大概率区域,称之 为原假设的接受区域。
3.拒绝域:概率P≤的区域,为小概率区域,称之 为原假设的拒绝区域。
三、假设检验的程序---
1.拒绝原假设H1 原则:临界值
2.接受原假设H0 原则:临界值
检验统计值的绝 对值大于临界值;
检验统计值的绝 对值小于临界值;
假设 H0为真实 H0为不真实
接受H0 判断正确
采伪错误()
拒绝H0 弃真错误()
判断正确
四、假设检验中的两类错误
第I类()错误和第II类()错误的关系
和的关系就像 翘翘板,小就 大, 大就小。
你要同时减少两类 错误的惟一办法是 增加样本容量!
关乎决策:三个与其
与其,人为地把显著性水平固定按某一水平上,不 如干脆选取检验统计量的P值;
第二节 一个正态总体的假设检验
二、均值m的假设检验
3.给出显著性水平(0.01、0.05或0.1)
4.确定接受域和拒绝域(以双侧检验为例)
2已知:当Z Z 2
,则拒绝原假设,反之则接受H0;
《概率论与数理统计》课件第八章 假设检验

《概率论与数理统计》第八章1假设检验的基本概念

2. 从某批矿砂中,抽取10样本,检验这批砂矿的含 铁量是否为3%?
双侧检验 H0 : 0 3%, H1 : 3%
3.某学校学生英语平均分65分, 先抽取某个班的平均 分,看该成绩是否显著高于全校整体水平?
单侧检验 H0 : 0 65, H1 : 65
0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常?
分析 以 和 分别表示这一天袋装糖的净重
总体X 的均值和标准差,
由长期实践表明标准差比较稳定, 我们就设
0.015,于是 X ~ N(, 0.0152 ),这里 未知. 问题 问题是根据样本值判断 0.5 还是 0.5 .
所
以,原假
设H
不正确
0
。
对于这两种解释,哪种解释比较合理呢?
我们需要判断以上两种假设谁对谁错,并给出判断的理由
以上例子属于参数检验(parametric test) 的问题,(如针对总体均值,总体方差等参数的假 设检验)。
另外还有非参数检验(Nonparametric test) 的问题,如关于总体服从某种分布(如正态分布, 泊松分布)的假设检验。
4. 拒绝域与临界点
拒绝域W1: 拒绝原假设 H0 的所有样本值 (x1, x2, ···, xn)所组成的集合.
W1 W1 :拒绝原假设H0的检验统计量的取值范围.
临界点(值):拒绝域的边界点(值) (相应于检验统计量的值).
如: 在前面例4中,拒绝域 {u :| u | u / 2 }.
5. 双边备择假设与双边假设检验
之 下 做 出 的.
2. 检验统计量
第八章 假设检验

x z2
x z2 /
s n
上例,我们用求置信区间的方法,来判断 原假设是否合理。 大样本下满足中心极限定理,样本均值的 抽样分布服从正态分布,从而有置信区间:
x z2 s 24 =986 1.96 n 40
假设检验的步骤
1.确定原假设和备选假设 2.选择检验统计量 3.指定检验的显著性水平 4.建立拒绝原假设的规则 5.收集样本数据,计算检验统计量的值 6.将检验统计量的值域拒绝规则的临界值比较, 以决定是否拒绝原假设。或者,由检验统计量 的值计算p值,利用p值确定是否拒绝原假设。
x 2.92 3 z 2.67 / n 0.18 / 6
x z ~ N (0,1) / n
根据显著性水平α=0.01,对应的拒绝域面积为 0.01,临界值为-2.33 Z<-2.33,所以拒绝H0,即可认为没听咖啡的容量 不足3磅。 统计证据支持对HILLTOP咖啡重量不足采取投诉措 施。
(978.56,993.44)该区间不包含u0=1000, 因此我们拒绝原假设H0.检验表明,该包 装机未能正常工作。
总体均值的检验:小样本情形
小样本下,已知总体为正态分布,我们考 虑以下两种情况: 1.总体方差已知 2.总体方差未知 在总体方差已知的情况下,即使样本容量 较小,但样本平均数的抽样分布总是以平 均值 为均值,以 x 为标准差的正态分 布。因此其检验过程和检验统计量同大样 本情形。
拒绝域为α/2 拒绝域为α/2
z / 2
拒绝域
0
z / 2
概率论与数理统计第八章假设检验习题解答

1.[一]某批矿砂的5个样品中的镍含量,经测定为(%)3.25 3.27 3.24 3.26 3.24。
设测定值总体服从正态分布,问在α = 0.01下能否接受假设:这批矿砂的含镍量的均值为3.25.解:设测定值总体X~N (μ,σ 2),μ,σ 2均未知步骤:(1)提出假设检验H 0:μ=3.25; H 1:μ≠3.25 (2)选取检验统计量为)1(~25.3--=n t nS X t(3)H 0的拒绝域为| t |≥).1(2-n t α(4)n=5, α = 0.01,由计算知01304.0)(11,252.3512=--==å=i iX Xn S x查表t 0.005(4)=4.6041, )1(343.0501304.025.3252.3||2-<=-=n t t α(5)故在α = 0.01下,接受假设H 02.[二] 如果一个矩形的宽度ω与长度l 的比618.0)15(21»-=l ω,这样的矩形称为黄金矩形。
这种尺寸的矩形使人们看上去有良好的感觉。
现代建筑构件(如窗架)、工艺品(如图片镜框)、甚至司机的执照、商业的信用卡等常常都是采用黄金矩型。
下面列出某工艺品工厂随机取的20个矩形的宽度与长度的比值。
设这一工厂生产的矩形的宽度与长短的比值总体服从正态分布,其均值为μ,试检验假设(取α = 0.05)H 0:μ = 0.618H 1:μ≠0.6180.693 0.749 0.654 0.670 0.662 0.672 0.615 0.606 0.690 0.628 0.668 0.611 0.606 0.609 0.601 0.553 0.570 0.844 0.576 0.933. 解:步骤:(1)H 0:μ = 0.618; H 1:μ≠0.618 (2)选取检验统计量为)1(~618.0--=n t nS X t(3)H 0的拒绝域为| t |≥).1(2-n t α (4)n=20 α = 0.05,计算知0925.0)(11,6605.01121=--===åå==ni ini ix xn S xnx ,)1(055.2200925.0618.06605.0||,0930.2)1(22-<=-==-n t t n t αα(5)故在α = 0.05下,接受H 0,认为这批矩形的宽度和长度的比值为0.6183.[三] 要求一种元件使用寿命不得低于1000小时,今从一批这种元件中随机抽取25件,测得其寿命的平均值为950小时,已知这种元件寿命服从标准差为σ =100小时的正态分布。
概论论与数理统计:第八章假设检验(浙大第四版)

χ2 =
(n − 1) s 2
σ 02
, 拒 绝 域 为 {χ >
2
2 χα (n − 1)} , 由
3
n = 9, s = 0.007, χ 02.05 (8) = 15.504 ,算得 χ 2 = 15.68 > 15.504, 因此拒绝原假设 H 0 ,即认
为这批导线的标准差显著地偏大. 6、解 设枪弹甲、乙的速度分别为 x, y ,并设 x ~ N ( μ1 , σ 1 ), y ~ N ( μ 2 , σ 2 ) .
x−y 1 1 + n1 n2
其中
2 sw =
2 (n1 − 1) s12 + (n2 − 1) s 2 n1 + n2 − 2
拒绝域为 C = ⎨| t |≥ t α (n1 + n 2 − 2)⎬ .
⎧ ⎩
⎫ ⎭
2
由于 n1 , n 2 很大,故有 t 0.025 (218) ≈ z 0.025 = 1.96 将 x = 2805, y = 2680, 以上数据代入上式 计算可得 | t |= 8.206 > 1.96 ,故拒绝原假设 H 0 ,可以认为两个总体的平均值有显著差异, 即 两种枪弹在速度方面有显著差异. 综上所述,两种枪弹在速度方面有显著差异但在均匀性方面没有显著差异. 7、解 设马克吐温与思诺特格拉斯的小品文中由 3 个字母组成的词的比例分别为 x, y ,并且 由题意可设 x ~ N ( μ1 , σ ) , y ~ N ( μ 2 , σ ) ,本题是在显著性水平 α = 0.05 下检验假设:
⎧ ⎩
⎫ ⎭
2
已 知 n1 = 8, n 2 = 10 , 查 表 得 t 0.025 (16) = 2.1199, , 经 计 算 得 , x = 0.2319, s1 = 0.01456,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设检验
R } ,其概率就是检验水平α,通常我们取α=0.05,有时也
提出零假设 H0; 选择统计量 K; 对于检验水平α查表找分位数λ; 由样本值 x1 , x 2 , , x n 计算统计量之值 K;
将 K 与 进行比较,作出判断:当 | K 两类错误:
| (或 K ) 时否定 H ,否则认为 H 相容。
所以此检验问题的拒绝域为
x 0 sቤተ መጻሕፍቲ ባይዱ n
t (n 1) 。
2
由条件得到 n 9 , x 13.2, s 4.0,
t
x 10 s/ n
2.4> t 0.025 (8)=2.3060
(2)取检验统计量
2
(n 1) S 2
2
,则
2
(n 1) S 2
变小,则 变大。取定 要想使 变小,则必须增加样本容量。
在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平α。α大小的选取应根据实际 情况而定。当我们宁可“以假为真” 、而不愿“以真当假”时,则应把α取得很小,如 0.01,甚至 0.001。 反之,则应把α取得大些。 例:原假设 H 0 不真时,作出接受 H 0 的决策,称为犯第 出拒绝 H 0 的决策,称为犯第
0 0
第一类错误:当 H0 为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定 H0。这时,我 们把客观上 H0 成立判为 H0 为不成立(即否定了真实的假设) ,称这种错误为“以真当假”的错误或第一类 错误,记 为犯此类错误的概率,即 P{否定 H0|H0 为真}= ; 此处的α恰好为检验水平。 第二类错误:当 H1 为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受 H0。这时,我 们把客观上 H0。不成立判为 H0 成立(即接受了不真实的假设) ,称这种错误为“以假当真”的错误或第二类 错误,记 为犯此类错误的概率,即 P{接受 H0|H1 为真}= 。 两类错误的关系: 人们当然希望犯两类错误的概率同时都很小。但是,当容量 n 一定时, 变小,则 变大;相反地,
2 (8)=15.507 x 0.05 2 (8)=17.535 x 0.025 2 (8)=2.180 x 0.975
t 0.025 (8)=2.3060 t0.05(8)=1.8595
t0.025(9)=1.8331 解 (1)取检验统计量
t
X 0 S/ n
,则它服从 t (n 1) ,
检验方差
2
2 0 是否成立需要利用( C
)
A 标准正态分布 C 自由度为 n 的 分布
2
B 自由度为 n-1 的 t 分布 D 自由度为 n-1 的 分布
2
设服用某种药物一定份量使病人每分钟脉搏增加的次数 X 近似服从正态分布 N (μ,σ2),均 值μ、 方差σ2 均未知, 今抽查 9 个病人, 测得每分钟增加脉搏的次数样本均值为 13.20, 样 本标准差为 4.0 (1) 试取α=0.05,检验假设 H0:μ=10 H1:μ 10; (2) 求σ的置信度为 0.95 的置信区间. 备用数据:x2 分布、t 分布的上侧α分位数
2
2 (n 1) ,从而
P{ P{
1 2
2
(n 1)
(n 1) S 2
2
2 (n 1)} 1 2
(n 1) S 2 (n 1) S 2 2 } 1 2 (n 1) 2 (n 1)
2 1 2
所以σ的置信度为 0.95 的置信区间为(2.701793,
0.0816 < t 0.01 (15) 2.947,
所以接受 H 0 , 即整批灯泡的平均使用寿命为 2000 小时.
0 / n
u u1 u u1 | t | t
1
2
(n 1)
未知
2
H 0 : 0 H 0 : 0
T
x 0 S/ n
t (n 1)
t t1 (n 1) t t1 (n 1)
例题:
.设总体
X ~ N ( , 2 ) ,且 已知,
《概率论与数理统计》
第八章
基本思想: 假设检验的统计思想是, 概率很小的事件在一次试验中可以认为基本上是不会发生的, 即小概率原理。 为了检验一个假设 H0 是否成立。 我们先假定 H0 是成立的。 如果根据这个假定导致了一个不合理的事件 发生,那就表明原来的假定 H0 是不正确的,我们拒绝接受 H0;如果由此没有导出不合理的现象,则不能拒 绝接受 H0,我们称 H0 是相容的。与 H0 相对的假设称为备择假设,用 H1 表示。 这里所说的小概率事件就是事件 {K 取 0.01 或 0.10。 基本步骤: 假设检验的基本步骤如下: (i) (ii) (iii) (iv)
7.66261).
2、 从一批灯泡中抽取 16 个灯泡的随机样本, 算得样本均值 x =1900 小时, 样本标准差 s=490 小时,以α=1%的水平,检验整批灯泡的平均使用寿命是否为 2000 小时? (附:t0.05(15)=2.131,t0.01(15)=2.947,t0.01(16)=2.921,t0.05(16)=2.120) 解 假设 H 0 : 0 2000 , H1 : 0 2000 , 取检验统计量
类错误,原假设 H 0 为真时,作
类错误.
单正态总体均值和方差的假设检验 条件 零假设 统计量 对应样本 函数分布 否定域(拒绝域)
H 0 : 0
已知
2
| u | u U x 0
N(0,1)
1
2
H 0 : 0 H 0 : 0 H 0 : 0
t
X 0 S/ n
~ t (n 1)s 490 ,则 t x 0 s/ n
X 0 S/ n
~ t (n 1) ,
所以此检验问题的拒绝域为
t (n 1) .
2
由条件 n 16 , x 1900 , s 490 , 得到
t1
x 10 s/ n