第8章 假设检验
概率论与数理统计 第8章

现在的问题就是要判别新产品的寿命是服从 μ >1500 的
正态分布,还是服从 μ ≤1500的正态分布? 若是前者,我们 就说新产品的寿命有显著性提高;若是后者,就说新产品的 寿命没有显著性提高。
定义 1 将对总体提出的某种假设称为原假设,记为 H 0 ; 将与原假设矛盾的假设称为备择假设,记为 H 1 。
在例 8-1 中,我们把涉及的两种情况用假设的形式表示
出来,第一个假设 μ ≤1500 表示采用新工艺后产品平均寿命没 有显著性提高,第二个假设 μ >1500 表示采用新工艺后产品平
均寿命有显著性提高。第一个假设为原假设,即“ H 0 :μ
定义 8 给定犯第一类错误的概率不大于 α 所作的假设 检验称为显著性检验,称 α 为显著性水平。 例 8-2 某车间用一台包装机包装食盐,每袋食盐的净 重是一个随机变量,它服从正态分布。当包装机正常时,其 均值为 0.5kg ,标准差为 0.015kg 。某日开工后为检查包装 机工作是否正常,随机地抽取它所包装的食盐 9 袋,称得样 本均值 ������ X =0. 511kg ,问在显著性水平 α =0.05 下,这 天包装机工作是否正常。
由于无论是第一类错误还是第二类错误都是作假设检验 时的随机事件,因此在假设检验中它们都有可能发生。我们 当然希望尽可能使犯两类错误的概率都很小,但一般来说, 当样本的容量固定时,若刻意地减少犯一类错误的概率,则 犯另一类错误的概率往往会增大。若要使两类错误的概率都 减小,就需增大样本的容量。在给定样本容量的情况下,我 们总是对犯第一类错误的概率加以控制,使它不大于 α , 而不关心犯第二类错误的概率 β是增大了还是减小了,这样 的假设检验就是显著性检验。
第八章、假设检验

第八章、假设检验一、应用题:1.某工厂正常情况下生产的电子元件的使用寿命2~(1600,80)X N ,从该工厂生产的一批电子元件中抽取9个,测得它们使用寿命的平均值为1540(小时),如果使用寿命的标准差σ不变,能否认为该工厂生产的这批电子元件使用寿命的均值μ=1600(小时)? (附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(8) 1.86,(8) 2.31u u t t α===== )2..某工厂正常情况下生产的电子元件的使用寿命2~(1600,80)X N ,从该工厂生产的一批电子元件中抽取9个,测得它们使用寿命的平均值为1540(小时),如果使用寿命的标准差σ不变,能否认为该工厂生产的这批电子元件使用寿命显著降低?(附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(8) 1.86,(8) 2.31u u t t α===== )3.已知电子工厂生产的某种电子元件的平均寿命为3000(h ),采用新技术试制一批这种电子元件,抽样检查16个,测得这批电子元件的使用寿命的样本均值x =3100(h ),样本标准差 s =170(h ),设电子元件的使用寿命服从正态分布,问:试制的这批电子元件的使用寿命是否有显著提高?(附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(15) 1.753,(15) 2.13u u t t α===== )4.某车间用一台包装机包装葡萄糖,规定标准为每袋0.5kg ,设包装机实际生产的每袋重量服从正态分布,且长期经验知标准差σ=0.015不变,某天开工后,为了检查包装机是否正常,随机抽取了9袋,测得它们样本均值为x =0.509 kg ,能否认为这天的包装机的工作正常?(附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(8) 1.86,(8) 2.31u u t t α===== )5. 某车间用一台包装机包装葡萄糖,规定标准为每袋0.5kg ,包装机实际生产的每袋重量服从正态分布,某天开工后,为了检查包装机是否正常,随机抽取了9袋,测得它们样本均值为x =0.509 kg ,样本标准差s = 0.015 kg ,能否认为这天的包装机工作正常? (附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(8) 1.86,(8) 2.31u u t t α===== )6.某装置的平均工作温度据制冷厂商称不高于190℃,今从一个有16台装置构成的随机样本测得平均工作温度的平均值和标准差分别为195℃和8℃,根据这些数据能否说明装置的平均的工作温度比制造厂商所说的要高?(附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(15) 1.753,(15) 2.13u u t t α===== )7.已知某铁厂铁水含碳量服从正态分布N (4.55,0.1082),现测定了9炉铁水,其平均含碳量为4.484,如果方差没有变化,可否认为现在生产之铁水平均含碳量仍为4.55? (附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(8) 1.86,(8) 2.31u u t t α===== )8.有一批枪弹出厂时,其初速度200~(,)v N μσ,其中0μ=950米/秒,经较长储存,取9发进行测试,测得其样本均值x =928,据经验0σ=10可认为保持不变,问能否认为这批枪弹的初速度v 显著降低?(附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(8) 1.86,(8) 2.31u u t t α===== )9. 有一批枪弹出厂时,其初速度200~(,)v N μσ,其中0μ=950米/秒,0σ=10,经较长储存,取9发进行测试,测得其样本均值x =928,样本标准差s=10,问能否认为这批枪弹的初速度v 显著降低?(附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(8) 1.86,(8) 2.31u u t t α===== )10.设在一批木材中抽取100根,测其小头直径的样本均值x =11.2cm ,已知标准差0σ=2.6 cm ,问能否认为这批木材小头的平均直径在12 cm 以上?(附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(99) 1.66,(15) 1.99u u t t α===== )11. 设在一批木材中抽取100根,测其小头直径的样本均值x =11.2cm ,样本标准差s=2.6 cm ,问能否认为这批木材小头的平均直径在12 cm 以上?(附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(99) 1.66,(99) 1.99u u t t α===== )12.已知某厂生产的维尼纶纤度服从正态分布,标准差σ=0.048,某日抽取5跟纤维,测得纤度为1.32,1.55,1.36,1.40,1.44,问这天的维尼纶的均方差σ是否有显著变化? (附:检验水平0.050.0250.950.97522220.05,(4)9.49,(4)11.1,(4)0.711,(4)0.484α=χ=χ=χ=χ=)13.某厂生产的保险丝规定保险丝熔化时间的方差不能超过400,今从一批产品中抽取25个,测得其熔化的样本方差s 2=388.58,若该熔化时间服从正态分布,问这批产品是否合格?(附: 0.050.0250.950.97522220.05,(24)36.4,(24)39.4,(24)13.8,(24)12.4α=χ=χ=χ=χ= )14.为检测两架光测高温计所确定的温度读数之间有无显著差异,设计一个试验:用两架仪器同时对一组10只热炽灯丝做观测,测得它们的样本均值与样本方差分别为x =1169,y =1178,2x s =51975.21,2y s =50517.33,试确定两架温度计所测温度有无显著变化? (附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(18) 1.734,(18) 2.10u u t t α=====)15.甲、乙两台机床生产同一型号的滚珠,现从两台机床生产的产品中抽出8个和9个测得其样本均值和样本方差分别为 x =15.01,2x s =0.09554,y =14.99,2y s =0.0611,能否认为乙机床加工精度比甲机床高?(附:检验水平0.050.050.05,(7,8) 3.5,(8,9) 3.23F F α=== )16.某种物品在处理前与处理后分别抽取7个和8个样品,测得其样本均值和样本方差分别为x =0.24,2x s =0.0091,y =0.13,2y s =0.0039,能否认为处理后含脂量显著降低?(附:检验水平0.050.0250.050.0250.05, 1.645, 1.96,(13) 1.771,(13) 2.16u u t t α===== )17.已知学生的学习成绩服从正态分布,从某班的高等数学测试成绩表中抽取5人,数据如下: 60,65,70,75,80,能否认为该班的高等数学测试的平均成绩为75分。
Geitel第八章 假设检验习题解答

常无显著差异. 9. 美国民政部门对某种住宅区住户的消费情况进行的调查报告中抽出 9 户样本,其每年 开支除去税款和住宅费用外,依次为:4.9,5.3,6.5,5.2,7.4,5.4,6.8,5.4,6.3(单位: 千元) .假设所有住户消费数据的总体服从正态分布.若给定 0.05 ,试问:所有住户消 费数据的总体方差
从而确定拒绝域: 39.364 或 12.401 , S 404.77
2 2
2
计算统计量 的观测值
2
2
24 * 404.77 24.2862, 2.40 24.862 39.364 400
所以统计量 的观测值 落入拒绝域, 则接受 H 0 , 即认为这天保险丝融化时间分散度域通
故统计量 T 的观测值落入接受域, 于是接受 H 0 ,即不能认为元件的寿命对于 225 小时。 8. 某电工器材厂生产一种保险丝,测量其熔化时间,假定熔化时间服从正态分布,依通 常情况方差为 =400,今从某天产品中抽取容量为 25 的样本,测量其熔化时间并计算得
2
x 62.24, s 2 404.77 ,问这天保险丝熔化时间分散度与通常有无显著差异?( 0.05)
X 1 nS 2 n 1 n
n 1X ~ t (n 1) S
现在测定了 9 炉铁水, 其平 2. 已知某炼铁厂铁水含碳量服从正态分布 N ( 4.55,0.108 ) , 均含碳量为 4.484,如果估计方差没有变化,可否认为现在生产的铁水含碳量仍为 4.55? . ( 0.05 ) 解 检验假设: H 0 : 0 4.55 , H1 : 4.55
H1 : A B
当 H 0 为真时,选择检验统计量 U
习题第8章

第8章 假设检验本章教学基本要求1.理解显著性假设检验的基本思想,了解其检验过程中产生的两种错误。
2.掌握单个正态总体的均值和方差的假设检验方法。
8.1 假设检验的基本概念主要知识归纳1 显著性假设检验的基本思想与基本步骤:(1)提出假设0H 称为原假设,同时也可提出其对立假设1H ,也叫做备择假设,检验的目的就是接受或是拒绝0H .(2) 假定原假设成立,选择合适的统计量并确定其分布.(3) 给定一个小概率α,α称为显著性水平,规定小概率事件是不可能事件. (4)依据样本计算,如果使得小概率事件发生则拒绝原假设,否则接受原假设. 2 两种错误: 如果原假设正确,而拒绝了它,则检验方案犯了“弃真”错误,称为第一类错误. 犯第一类错误的概率恰好就是小概率事件发生的概率α,即{}0H H P α=为真拒绝;而如果原假设本来是错误的,按照检验方案,由于样本观察随即特性导致最终接受了它,此时检验方案犯了“取伪”错误,称为第二类错误.记其概率为β,即{}0H H P β=为假接受. 8.2 单个正态总体参数假设检验一 主要知识归纳设总体),(~2σμN X ,n X X X ,,,21 为总体的样本,2,S X 分别为样本均值与样本方差,给定显著性水平α,1.提出假设00:μμ=H ,01:μμ≠H若2σ已知, 选取统计量nX Z /0σμ-=,则参数μ的拒绝域为:2Z Z α=≥;若2σ未知,选取统计量nS X T /0μ-=,则参数μ的拒绝域为:)1(/20-≥-=n t nS X T αμ2.当μ未知,提出假设2020:σσ=H ,2021:σσ≠H选取统计量2022)1(σχS n -=,则2σ拒绝域为⎭⎬⎫⎩⎨⎧->⎭⎬⎫⎩⎨⎧-<-)1()1(2222212n n ααχχχχ 二 基础练习1.设总体),,(~2σμN X 12,,,n X X X 为来自总体的样本,当μ和2σ未知时,则(1)检验假设00:μμ=H ;(2)检验假设2020:σσ=H 应选择怎样的统计量?2.打包机装糖入包,每包的标准重量为100kg ,每天开工后,要检验所装糖包的总体期望值是否合乎标准(100kg )。
概率论与数理统计第八章假设检验习题解答

1.[一]某批矿砂的5个样品中的镍含量,经测定为(%)3.25 3.27 3.24 3.26 3.24。
设测定值总体服从正态分布,问在α = 0.01下能否接受假设:这批矿砂的含镍量的均值为3.25.解:设测定值总体X~N (μ,σ 2),μ,σ 2均未知步骤:(1)提出假设检验H 0:μ=3.25; H 1:μ≠3.25 (2)选取检验统计量为)1(~25.3--=n t nS X t(3)H 0的拒绝域为| t |≥).1(2-n t α(4)n=5, α = 0.01,由计算知01304.0)(11,252.3512=--==å=i iX Xn S x查表t 0.005(4)=4.6041, )1(343.0501304.025.3252.3||2-<=-=n t t α(5)故在α = 0.01下,接受假设H 02.[二] 如果一个矩形的宽度ω与长度l 的比618.0)15(21»-=l ω,这样的矩形称为黄金矩形。
这种尺寸的矩形使人们看上去有良好的感觉。
现代建筑构件(如窗架)、工艺品(如图片镜框)、甚至司机的执照、商业的信用卡等常常都是采用黄金矩型。
下面列出某工艺品工厂随机取的20个矩形的宽度与长度的比值。
设这一工厂生产的矩形的宽度与长短的比值总体服从正态分布,其均值为μ,试检验假设(取α = 0.05)H 0:μ = 0.618H 1:μ≠0.6180.693 0.749 0.654 0.670 0.662 0.672 0.615 0.606 0.690 0.628 0.668 0.611 0.606 0.609 0.601 0.553 0.570 0.844 0.576 0.933. 解:步骤:(1)H 0:μ = 0.618; H 1:μ≠0.618 (2)选取检验统计量为)1(~618.0--=n t nS X t(3)H 0的拒绝域为| t |≥).1(2-n t α (4)n=20 α = 0.05,计算知0925.0)(11,6605.01121=--===åå==ni ini ix xn S xnx ,)1(055.2200925.0618.06605.0||,0930.2)1(22-<=-==-n t t n t αα(5)故在α = 0.05下,接受H 0,认为这批矩形的宽度和长度的比值为0.6183.[三] 要求一种元件使用寿命不得低于1000小时,今从一批这种元件中随机抽取25件,测得其寿命的平均值为950小时,已知这种元件寿命服从标准差为σ =100小时的正态分布。
贾俊平版统计学课件 第8章

▽与原假设对立的假设称备择假设,记为 H1 ,用 、 或 表示。 对于新生儿体重的例子,可以表示为
H 0 : 3190
H1 : 3190
(2)确定检验统计量及其分布
▽用于检验假设的统计量称为检验统计量
▽根据 H 0 及相应条件选择适当的统计量,并确定统计量
的分布 对于新生儿体重的例子,可利用 x 0 构造检验统计量. 若新生儿体重为正态分布 N ( , 2 ) ,且 已知,则在 H 0 为真 时,用 z 作为检验统计量,并且
H 0 : 3190 H1 : 3190
并已知 x 3210, 80, n 100 ,则
z0 x 0
n
3210 3190 80 100
2.5
于是
p 2Pz z0 2 0.00621 0.01242
双侧检验的P值
/ 2
/ 2 拒绝
▽犯第二类错误的概率为 。
表8-1 假设检验中各种可能结果的概率
实际情况
H 0 为真 H 0 不真
决策
接受 H 0
1
拒绝 H 0
1
假设检验中的两类错误(决策结果)
H0: 无罪
假设检验就好像一场审判过程 统计检验过程
陪审团审判
实际情况 裁决 无罪 无罪 有罪 正确 错误 有罪 错误 正确 接受H0 拒绝H0 决策
若p-值 /2, 不能拒绝 H0 若p-值 < /2, 拒绝 H0
8.1.6 假设检验的形式
研究的问题 假设
双侧检验
H0 H1
左侧检验
右侧检验
= 0 ≠0
第八章 假设检验 (《统计学》PPT课件)
第二节 一个正态总体的假设检验
一、正态总体
设总体X ~ N(m, 2),抽取容量为n的样本 x1, x2, xn
样本均值 X 与方差S2 计算公式分别为:
2
1 n 1
n i1
(xi
X)
我们将利用上述信息,来检验关于未知参数均值 和方差的假设。
总体参数
均值
方差
总体方差已知
z 检验
(单尾和双尾)
总体方差已知
t 检验
(单尾和双尾)
2 检验
(单尾和双尾)
第二节 一个正态总体的假设检验
二、均值m的假设检验
1.H0:m=m0
2.选择检验统计量:
2已知: Z X m0 ~ N(0,1)
/ n
2未知:
小样本: t X m0 ~ t(n 1)
这个值不像我 们应该得到的 样本均值 ...
...因此我们拒绝 原假设μ=50
... 如果这是总 体的假设均值
60
μ=80
H0
样本均值
第一节 假设检验概述
三、假设检验的程序
一个完整的假设检验过程,通常包括以下几个步骤:
首先,设立原假设H0与备选假设H1; 第二步,构造检验统计量,并根据样本观察数据
小样本:当 t t
2
,则拒绝原假设,反之则接受H0;
5.得出结论。
二、均值m的假设检验
6.例题分析
[例8.3] 某广告公司在广播电台做流行歌曲磁带广告 ,它的插播广告是针对平均年龄为21岁的年轻人的,标 准差为16。这家广告公司经理想了解其节目是否为目标 听众所接受。假定听众的年龄服从正态分布,现随机抽 取400多位听众进行调查,得出的样本结果为x 25 岁S2,18 。以0.05的显著水平判断广告公司的广告策划是否符合 实际?
第八章 假设检验(分布拟合检验)
这些试验及其它一些试验, 这些试验及其它一些试验,都显 示孟德尔的3: 理论与实际是符合的 理论与实际是符合的. 示孟德尔的 1理论与实际是符合的 这本身就是统计方法在科学中的一项 这本身就是统计方法在科学中的一项 重要应用. 重要应用
用于客观地评价理论上的某个结论是 否与观察结果相符, 否与观察结果相符,以作为该理论是 否站得住脚的印证. 否站得住脚的印证 Nhomakorabea或
k f i2 n fi χ 2 = ∑ − pi = ∑ −n i =1 pi n i =1 npi
2
统计量
χ
2
的分布是什么? 的分布是什么
皮尔逊证明了如下定理: 皮尔逊证明了如下定理 若原假设中的理论分布F(x)已经完全给 已经完全给 若原假设中的理论分布 定,那么当n → ∞ ,统计量 时 的分布渐近(k-1)个自由度的 χ 分布 个自由度的 分布. 的分布渐近 如果理论分布F(x)中有 个未知参数需用 中有r个未知参数需用 如果理论分布 中有 相应的估计量来代替,那么当 相应的估计量来代替, 时,统 n →∞ 计量 2的分布渐近 (k-r-1)个自由度的 2 个自由度的 分 χ χ 布.
2 2
如果根据所给的样本值 X1,X2, …,Xn算得 2 的实测值落入拒绝域, 统计量 χ 的实测值落入拒绝域,则拒绝原假 否则就认为差异不显著而接受原假设. 设,否则就认为差异不显著而接受原假设
皮尔逊定理是在n无限增大时推导出来 皮尔逊定理是在 无限增大时推导出来 无限 因而在使用时要注意n要足够大 要足够大, 的,因而在使用时要注意 要足够大,以及 npi 不太小这两个条件 不太小这两个条件 这两个条件. 根据计算实践,要求 不小于 不小于50, 根据计算实践,要求n不小于 ,以及 npi 都不小于 5. 否则应适当合并区间,使 否则应适当合并区间, npi满足这个要求 .
概率与数理统计第8章--假设检验与方差分析
第8章假设检验与方差分析【引例】重庆啤酒股份有限公司(以下简称重庆啤酒)于1990年代初斥巨资开始乙肝新药的研发,其股票被视作“生物医药”概念股受到市场热捧。
尤其是2010~2011年的两年间,在上证指数大跌1/3的背景下,重庆啤酒股价却从23元左右飙升最高至元,但公司所研制新药的主要疗效指标的初步统计结果于2011年12月8日披露后,股价连续跌停,12月22日以元报收后停牌。
2012年1月10日重庆啤酒公告详细披露了有关研究结论,复牌后股价又遭遇连续数日下跌,1月19日跌至元。
此公告明确告知:“主要疗效指标方面,意向性治疗人群的安慰剂组与 600μg组,及安慰剂组与εPA-44 900μg组之间,HBeAg/抗HBe 血清转换在统计意义上均无差异”。
通俗地说,用药与不用药(安慰剂组)以及用药多与少(900μg组与600μg 组),都没有明显差异,这意味着该公司研制的乙肝新疫苗无效。
有关数据如表所示:表乙肝新疫苗的应答率注:εP A-44为治疗用(合成肽)乙型肝炎疫苗简称。
上表数据显示,两个用药组的应答率都高于安慰剂组的应答率,但为什么说“在统计意义上均无差异”为什么说这个结论表示乙肝新疫苗无效什么叫“在统计意义上无差异”如何根据样本数据作出统计意义上有无差异的判断解答这些问题就需要本章所要介绍的假设检验。
现实中,人们经常需要利用样本信息来判断有关总体特征的某个命题是真还是伪,或对某个(些)因素的影响效应是否显著作出推断,所以假设检验和方差分析有着广泛的应用。
例如,在生物医学领域,判断某种新药是否比旧药更有效;在工业生产中,根据某批零件抽样检查的信息来判断整批零件的质量是否符合规格要求;在流通领域,鉴别产品颜色是否对销售量有显著影响等等。
这些分析研究都离不开假设检验或方差分析。
假设检验与方差分析的具体方法很多,研究目的和背景条件不同,就需采用不同的方法。
本教材介绍假设检验与方差分析的基本原理和一些基本方法。
第八章假设检验
第八章 假设检验2007.410. 设总体X 服从正态分布(,1)N μ,12,,,n x x x 为来自该总体的样本,x 为样本均值,s 为样本标准差,欲检验假设H 0∶μ=μ0,H 1∶μ≠μ0,则检验用的统计量是( ) A.n/s x 0μ- B.)(0μ-x n C.10-μ-n /s x D.)(10μ--x n23. 设样本12,,,n x x x 来自正态总体(,9)N μ,假设检验问题为H 0∶μ=0,H 1∶μ≠0,则在显著性水平α下,检验的拒绝域W=___________。
24. 设0.05是假设检验中犯第一类错误的概率,H 0为原假设,则P {拒绝H 0|H 0真}=___________。
2007.710.设总体2(,)XN μσ,12,,n X X X 为来自该总体的一个样本,X 为样本均值,S 2为样本方差.对假设检验问题:H 0:μ=μ0↔H 1:μ≠μ0,在2σ未知的情况下,应该选用的检验统计量为( ) A .n X σμ0- B .10--n X σμ C .n SX 0μ-D .10--n SX μ25.设总体2(,)XN μσ,12,,n X X X 为来自该总体的一个样本. 对假设检验问题2200:H σσ=2210:H σσ↔≠,在μ未知的情况下,应该选用的检验统计量为___________.2007.109.在假设检验问题中,犯第一类错误的概率α的意义是( ) A .在H 0不成立的条件下,经检验H 0被拒绝的概率 B .在H 0不成立的条件下,经检验H 0被接受的概率 C .在H 0成立的条件下,经检验H 0被拒绝的概率 D .在H 0成立的条件下,经检验H 0被接受的概率27.假设某校考生数学成绩服从正态分布,随机抽取25位考生的数学成绩,算得平均成绩61=x 分,标准 差s=15分.若在显著性水平0.05下是否可以认为全体考生的数学平均成绩为70分?(附:t 0.025(24)=2.0639)2008.130. 假设某城市购房业主的年龄服从正态分布,根据长期统计资料表明业主年龄2(35,5)XN 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章 假设检验教学目的:理解假设检验的一般原理和步骤;掌握平均数的显著性检验;平均数差异显著性检验;方差差异的检验。
教学重点:假设检验的一般原理;平均数的显著性检验;平均数差异显著性检验;方差差异的检验等假设检验方法与步骤。
教学时数:(8学时)假设检验是指先对总体提出某项假设(对总体参数或分布所作的某一假设),然后利用从总体中抽样所得的样本信息,根据一定概率来检验所提的假设是否正确,从而做出接受或拒绝的决策。
假设检验是推断统计中最重要的内容。
假设检验包括参数检验和非参数检验。
若进行假设检验时总体的分布形式书籍,需要对总体的未知参数进行假设检验,称其为参数检验;若对总体分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验,通常称之为非参数检验。
本章是假设检验方法中检验目的最简单、思想方法最具有共性,统计计算最直接的一种方法。
假设检验的内容繁多,但不管其检验目的如何变化,也不管其抽样分布如何不同,具体的计算方法如何有别,假设检验的基本思想都是一样的。
要学会各种具体的统计假设检验,首先必须掌握其基本思想方法。
第一节 假设检验的基本思想与方法一、原理与概念通过一个具体例子引入:某学科考试成绩历来都是服从正态分布的,总平均数一直维持在60分的水平上,总体标准差为15,1998年10月实行新的教学方法后,某研究者希望检验一下这次的总体水平是否还是60分,他随机抽取了一个n=120的样本,算得平均数为63,问这次该科考试的总平均是否还是60分?初看这个例子,样本平均数为63,μ=60,似乎可马上得出“不是”的结论,但这样简单地分析是错误的,因为我们不忘记抽样是有误差的,即使该学科这次考试的总体平均数还是60分,从中抽取一个样本,其平均数恰好为60分的可能性是很小的,因而就因为平均数不等于60,而否定总体μ=60的简单分析是错误的。
但反过来,就因为抽样是有误差的,因此就认为这3分之差是误差也无充分理由。
这3分之中,也可能有着真实的差异。
如何判断呢?根据抽样分布理论,样本均值处在以总体均值为均值,以总体方差的n 分之一为方差的正态分布中,所以到底这次考试的总体均值在60分之上还是之下仍不知道,因此这种顺推的办法是行不通的。
既然顺推行不通,我们进行反证,先假设这次该科考试的总平均还是60分,然后检验这一假设的正确性。
根据抽样分布理论,63分就处在总体均值60分n X Z σμ0-==2.09处,而在正态分布中,Z=1.96以上的概率为0.05,故若总体均值为60分,则一次抽样就抽到平均数为63分的概率是一小概率事件,则认为是不可能发生的。
例:有人调查早期教育对儿童智力发展的影响,从受过良好早期的儿童中随机抽取70人进行韦氏儿童智力测验(常模μo =100,σo =15),结果样本平均数为103.3,能否认为受过良好早期教育的儿童智力高于一般水平。
[分析] 1、首先,要明确这里的总体和样本指的是什么?总体,所有受过良好早期教育的儿童;样本,被选中的那70名受过良好早期教育的儿童。
2、常模(μo =100,σo =15)指的是什么? 常模是指所有儿童的智力平均水平,就是这里所说的“一般水平”,给出的目的是把它当作一个标准,让它与受过良好早期教育的儿童的平均智力(总体均值)进行比较。
3、现在,要进行比较的两个事物中的一方清楚了,但另一方呢?——即受过良好早期教育的儿童的平均智力是多少呢?我们不知道它的确切值,只知道70名受过良好早期教育儿童的平均智商103.3分,要是103.3与那个我们不知道的总体均值之间有什么直接联系问题也就解决了!根据抽样分布理论,样本均值处在以总体均值为均值,以总体方差的n 分之一为方差的正态分布中,所以倒底103.3在总体均值之上还是之下我们仍然不知道,因此这种顺推的办法是行不通的。
4、我们再回到问题“受过良好早期教育的儿童的平均智力(总体均值)与常模比较大小”这个问题上来,既然我们顺推行不通,我们进行反证,我们去证明假设“受过良好早期教育的儿童的平均智力(总体均值)等于常模均值100”会是怎样的情况呢?要是这样,根据抽样分布理论,样本均值103.3就处在“总体均值”以上的Z=1.84个标准差单位处,而在正态分布中,Z=1.645以上的概率是5%,所以在前面的假设下(总体均值为100),一次抽样就抽到一个平均数为103.3的样本是一个发生可能性很小的事件,而我们常常认为“小概率事件在一次抽样中是不可能发生的”,所以在总体均值为100的情况下,一次抽样就抽到一个平均数为103.3的样本是有矛盾的,因此我们所做的假设是不成立的。
(一)假设从上例可看出,假设检验的前提是建立假设,也称研究假设,是根据已知理论或事实对现象所作的假定性说明。
例如,有人观察到这样一个事实:那些患临床抑郁症的人在12月底到2月初更容易患病。
于是有人提出假设认为这是一个心理现象,是放假的结果,因为病人都希望在假期能过得愉快和充实,但这种愿望往往不能完全实现,因此他们的抑郁症就容易引发。
另外有人认为是物理现象,因为冬天缺乏太阳光。
这就是假设。
假设必须进行验证,才能承认或否认它。
检验的方法往往是进行实验或调查,然后再进行统计。
用统计术语来描述假设就称为统计假设。
假设是科学研究中广泛使用的一种方法,如天文学史上的日心说,宇宙发生史上的大爆炸说,地球形成史上的冷凝说等等。
统计假设检验中使用的假设有两种,一种称为虚无假设,又称原假设或零假设,另一种称为备择假设,二者相互是对立的。
原假设往往是研究者根据样本信息期望拒绝的假设(无差异假设),以H 0表示,备择假设与原假设相互排斥,是研究者根据样本信息期望证实的假设(有差异假设),以H 1表示。
一般将含有“=”的列为H 0。
在假设检验中,假设都是成对出现的,其中第一个为原假设,第二个为备择假设,二者从形式上看是同时出现的,缺一不可,从逻辑上看是非此即彼的,二者不可能同时成立,也不可能同时不成立。
对于上例,H 0:μ=μ0,H 1:μ≠μ0,在H 0成立的情况下,根据抽样分布的理论,有)1,0(~0N X Z n σμ-= 由X 的实际值可求出Z 的实际值,Z 0=2.19,P <0.05,这是一个小概率事件,可认定假设是不成立的。
假设检验:是用抽样出来的随机样本来检验样本所代表的总体的有关特征,它的基本思想是小概率反证法思想。
当总体分布形式已知时,可以事先根据有关资料对这些参数作一个假设(H o ),然后在此基础上构造适当的统计(要求在H o 下无未知量,和有精确的分布规律),并依据样本信息进行计算,在一定的概率(95%或99%)下进行推理,并最终判别假设(H o )的合理性,即在H o 和H 1间作出选择。
(二)检验统计量上例中Z 就称为检验统计量,它是根据检验目的和抽样分布而设计的,专门用于统计假设检验的,在其计算中要应用到与所检验参数相应的样本统计量。
如检验两总体的平均数是否有差异,则要应用两样本平均数;检验两总体方差是否有差异,就要用到两样本方差。
检验统计量的设计要根据抽样分布,只有这样,才能找到它的概率分布形态,也才能考察它的取值概率。
如抽样分布是正态分布,计算的就是正态分布的Z 分数;抽样分布是t 分布,计算的就是t 分布的t 分数。
(三)小概率事件0≤P ≤1 不可能事件 必然事件如果某一事件的P 小于事先规定的水平,就称为小概率事件。
如规定P=0.01,在正常人群中随机抽取一人智商高于140以上的P<0.01一般,人们对小概率事的发生感到吃惊,如中奖、商场抽奖都是自己的员工等,甚至怀疑在哪个环节出了错。
小概率事件原理即认为小概率事件不可能在一次抽样中不可能发生。
如990个红球和10个白球,从中随机抽取一个,一般猜是红。
虽然小概率事件毕竟不是不可能事件,还会发生,但就整个判断决策来说,猜红球的决策是正确的,这种决策思维方法就是小概率事件原理。
如一公认是小概率的事件竟然在一次随机抽样中发生了,有很大的可能是某个环节出了差错,我们必须去查找它的原因。
小概率事件是否出现,是对假设作决断的根据。
上例即是假定原假设成立的情况下,来考察样本统计量的值在以μ为中心的抽样分布上的出现的P 如何,如P 大,则保留原假设,否则,拒绝原假设。
(四)假设检验的思想方法――带有概率值保证的反证法反证法是大家熟悉的一种逻辑推理证明方法。
正面推论难,从反面证明否命题的荒谬却往往事半功倍。
如证a>b,却设a ≤b ,推论出错误的结果,或与已知不符合的结果。
假设检验从逻辑过程来看也是一种反证法。
(详述)所谓带有概率值保证是指上述的假设检验是根据小概率事件原理做出的,而根据小概率事件原理作决策是一种科学正确的决策方法,但并不能保证每次的决策都是正确的,只是犯错误的概率P 很小,而且是我们可以控制的。
它与数学反证法的区别:一是数学反证法结论是百分之百的正确,二是数学反证法如最终推不出错误,反证法无意义,而假设检验不然,过程仍成立,只是结论不同而已,“无充分理由拒绝原假设”,即承认原假设,如仍感到怀疑,则要重新抽样。
(五)显著性水平样本统计量的值究竟在以总体μ为中心的抽样分布上出现的P 小到什么程度才算小概率事件发生了?这是由研究者对于假设检验的结论所要达到的可靠性程度所决定的。
统计学中一般规定两种水平0.05和0.01。
如研究者在0.05的水平上对假设进行检验,那么只要样本统计量的值在抽样分布上出现的P 小于0.05,就认为小概率事件发生了,应拒绝原假设。
统计学中把这种拒绝原假设的P 值称为显著性水平。
也即统计推断时可能犯错误的概率。
即决策中的风险。
显著性水平↑(↓α),越不易拒绝0H ,可靠性↑显著性水平↓(↑α),越容易拒绝0H ,可靠性↓(六)接受区域和拒绝区域二、单侧检验与双侧检验前面所做的假设为H o :μ=μo H 1:μ≠μo ,所关心的问题是,μ与μo 是否有差异,并不关心是大是小,因此,这种检验方法则在μo 两端都需要一个临界点,把临界点以外的区域作为拒绝域。
这时,若显著性水平为0.05,则两端的拒绝域的面积比例各为0.025。
这种只强调差异而不强调方向性的检验为双侧检验。
而如:某高校参加同专业的统一考试,随机抽查64份试卷,由此求得平均成绩为69分,标准差为9.5分,已知该校全体考生成绩分布服从正态分布,且总平均分为65分,问该高校考生的平均成绩是否显著地高于全体考生的平均水平?在此例中,它提出的是μ>65是否成立。
当然,仅从成绩来看,69分比64分高,但我们需要了解的是,这种高5分的差异是来自抽样误差还是系统误差,所以这时的假设应为H 0:μ≤65, H 1:μ>65,若接受Ho ,就意味着该校考生水平不高于全体考生的平均水平;反之,则是高于平均水平。