单个正态总体均值的检验两个正态总体均值差的检验小结布
假设检验_精品文档

解:根据题意构造假设:
H0 : 0 21mg H1 : 0
[H, P,CI ] ttest(X ,M ,,Tail)
Matlab求解: x=[16 22 21 20 23 21 19 15 13 23 17 20 29 18 22 16 25]; [H,P,CI]=ttest(x,21,0.025,-1)
Matlab命令求解:
H0 : 0
H1 : 0
x=[0.56 0.53 0.55 0.55 0.58 0.56 0.57 0.57 0.54];
[H,P,CI,zval]=ztest(x,0.53,0.015,0.05,0) 输出:
H= 1 P = 9.6426e-008 CI = 0.5469 0.5665 zval = 5.3333
例7 设有甲、乙两种零件彼此可以代用,但乙零件比家零 件制造简单,造价低,经过试验获得它们的抗压强度数据 如下表(单位:kg/cm2) 甲种零件 88 87 92 90 91 乙种零件 89 89 90 84 88 87
已知甲、乙两种零件的抗压强度分别服从正态总体 N (1, 2 ) 和 N (2 , 2 ),问能否保证抗压强度质量下,用乙种零件代
[H, P,CI ] ttest(X ,M ,,Tail)
例5 按行业规定,某食品每100g中维生素(Vc)的含量不少于 21mg,设Vc含量的测定值总体X服从正态分布,现从生产的 这批食品中随机抽取17个样品,测得如下每100g食品中Vc的 含量(单位:mg)为: 16 22 21 20 23 21 19 15 13 23 17 20 29 18 22 16 25
[h,sig,ci,zval]=ztest(X,0.5,0.015,0.05,0)
概率论与数理统计 8-2

H 0 : µ ≤ µ 0 = 225, H 1 : µ > 225,
取 α = 0.05, n = 16, x = 241.5, s = 98.725 0.6685 t0.05 (15) = 1.7531 > t = s/ n
故接受 H 0 , 认为元件的平均寿命不 大于 225小时.
n = 15,
x = 10.48, α = 0.05, s = 0.237,
x − µ 0 10.48 − 10.5 t = = t分布表 = 0.327, s/ n 0.237 / 15 查表得 tα / 2 ( n − 1) = t 0.025 (14) = 2.1448 > t = 0.327, 故接受 H 0 , 认为金属棒的平均长度 无显著变化 .
n2 = 10,
y = 79.43, s2 = 2.225,
2
且s
2 w
(10 −1)s + (10 −1)s = = 2.775, 10 + 10 − 2
2 1 2 2
查表可知 t0.05 (18) = 1.7341,
查表8.1知其拒绝域为 查表 知其拒绝域为 t ≤ − tα ( n1 + n2 − 2). x− y = −4.295, 因为 t = 1 1 sw + 10 10
某切割机在正常工作时, 例1 某切割机在正常工作时 切割每段金属棒的 平均长度为10.5cm, 标准差是 标准差是0.15cm, 今从一批产 平均长度为 品中随机的抽取15段进行测量 其结果如下: 段进行测量, 品中随机的抽取 段进行测量 其结果如下 10.4 10.6 10.1 10.4 10.5 10.3 10.3 10.2
根据第六章 第六章§ 定理四 定理四知 当H 0为真时, 根据第六章§2定理四知,
实验7 假设检验(一)

实验7 假设检验(一)一、实验目的:1.掌握重要的参数检验方法(单个总体的均值检验,两个总体的均值检验,成对样本的均值的检验,两个总体方差的检验,二项分布总体的检验);2.掌握若干重要的非参数检验方法(Pearson拟合优度 2检验,Kolmogorov-Smirnov单样本和双样本检验)。
二、实验内容:练习:要求:①完成练习并粘贴运行截图到文档相应位置(截图方法见下),并将所有自己输入文字的字体颜色设为红色(包括后面的思考及小结),②回答思考题,③简要书写实验小结。
④修改本文档名为“本人完整学号姓名1”,其中1表示第1次实验,以后更改为2,3,...。
如文件名为“09张立1”,表示学号为09的张立同学的第1次实,法1Alt,即完法2:图标,工具。
)1.2.H0:H1:alternative hypothesis: true mean is not equal to 22595 percent confidence interval:172.3827 211.9173sample estimates:mean of x192.15P=0.002516<0.05,拒绝原假设,认为油漆工人的血小板计数与正常成年男子有差异3.(习题5.2)已知某种灯泡寿命服从正态分布,在某星期所生产的该灯泡中随机抽取10 只,测得其寿命(单位:小时)为1067 919 1196 785 1126 936 918 1156 920 948求这个星期生产出的灯泡能使用1000小时以上的概率。
解:源代码及运行结果:(复制到此处,不需要截图)> x<-c(1067, 919, 1196, 785, 1126, 936, 918, 1156, 920, 948)> p<-pnorm(1000,mean(x),sd(x))> 1-p[1] 0.4912059结论:这个星期生产出的灯泡能使用1000小时以上的概率为0.49120594.(习题5.3)为研究某铁剂治疗和饮食治疗营养性缺铁性贫血的效果,将16名患者按年龄、体重、病程和病情相近的原则配成8对,分别使用饮食疗法和补充铁剂治疗的方法,3个月后测得两种患者血红资白如下表所示,问两种方法治疗后的患者血红蛋白有无差异?H0:H1:5.,分别测试验组与对照组空腹腔血糖下降值(mmol/L)(1)检验试验组和对照组的的数据是否来自正态分布,采用正态性W检验方法(见第3章)、Kolmogorov-Smirnov检验方法和Pearson拟合优度 2检验;解:提出假设:H0:认为国产四类新药阿卡波糖股嚢与拜唐苹股嚢对空腹血糖的降糖效果不同H1:认为国产四类新药阿卡波糖股嚢与拜唐苹股嚢对空腹血糖的降糖效果相同①正态性W检验方法源代码及运行结果:(复制到此处,不需要截图)>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.6 0,2.50,6.00,-1.4)> shapiro.test(x)Shapiro-Wilk normality testdata: xW = 0.9699, p-value = 0.7527>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3②结论:试验组p=0.9771>0.05,对照组p=0.9368>0.05,所以检验试验组和对照组的的数据是来自正态分布③Pearson拟合优度 2检验源代码及运行结果:(复制到此处,不需要截图)>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.6 0,2.50,6.00,-1.4)> A<-table(cut(x,br=c(-6,-3,0,3,6,9)))> p<-pnorm(c(-3,0,3,6,9),mean(x),sd(x))> p> p<-c(p[1],p[2]-p[1],p[3]-p[2],p[4]-p[3],1-p[4])> p> chisq.test(A,p=p)Chi-squared test for given probabilitiesdata: AX-squared = 0.56387, df = 4, p-value = 0.967Warning message:In chisq.test(A, p = p) : Chi-squared近似算法有可能不准>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3 .10,1.70,-2.00)> B<-table(cut(y,br=c(-2,1,2,4,7)))> p<-pnorm( c(-2,1,2,4,7),mean(y),sd(y))> p> p(2H0:H1:t = -0.64187, df = 38, p-value = 0.5248alternative hypothesis: true difference in means is not equal to 095 percent confidence interval:-2.326179 1.206179sample estimates:mean of x mean of y2.065 2.625结论:p=0.5248>0.05,不拒绝原假设,两组数据均值没有差异②方差不同模型源代码及运行结果:(复制到此处,不需要截图)>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.6 0,2.50,6.00,-1.4)>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3 .10,1.70,-2.00)> t.test(x,y)Welch Two Sample t-testdata: x and yt = -0.64187, df = 36.086, p-value = 0.525alternative hypothesis: true difference in means is not equal to 095 percent confidence interval:(3解:提出假设:H0:试验组与对照组的方差相同H1:试验组与对照组的方差不相同源代码及运行结果:(复制到此处,不需要截图)>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.6 0,2.50,6.00,-1.4)>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3 .10,1.70,-2.00)> var.test(x,y)F test to compare two variancesdata: x and yF = 1.5984, num df = 19, denom df = 19, p-value = 0.3153alternative hypothesis: true ratio of variances is not equal to 195 percent confidence interval:0.6326505 4.0381795sample estimates:ratio of variances1.598361结论:p= 0.3153>0.05,不拒绝原假设,试验组与对照组的方差相同6.(习题5.5)为研究某种新药对抗凝血酶活力的影响,随机安排新药组病人12例,对照组病人10例,(1(2(3解:(1H0:H1:H0:H1:> y<-c(162, 172 ,177 ,170 ,175, 152 ,157 ,159, 160 ,162)> ks.test(y,"pnorm",mean(y),sd(y))One-sample Kolmogorov-Smirnov testdata: yD = 0.22216, p-value = 0.707alternative hypothesis: two-sidedWarning message:In ks.test(y, "pnorm", mean(y), sd(y)) :Kolmogorov - Smirnov检验里不应该有连结(2)检验两组样本方差是否相同;提出假设:H0:两组样本方差相同H1:两组样本方差不相同源代码及运行结果:(复制到此处,不需要截图)> x<-c(126,125,136,128,123,138,142,116,110,108,115,140)> y<-c(162, 172 ,177 ,170 ,175, 152 ,157 ,159, 160 ,162)> var.test(x,y)F test to compare two variancesdata: x and yF = 1.9646, num df = 11, denom df = 9, p-value = 0.32alternative hypothesis: true ratio of variances is not equal to 1(3H0:H1:7.靠,随机抽选了400名居民,发现其中有57人是老年人。
正态总体的假设检验

n
(Xi μ)2
P { i1
σ
2 0
χ
2 1
α 2
(
n)}
P{
i 1
σ
2 0
χ
2
α
(
n)}
α
2
所以拒绝域为: W
{
χ2
χ
2 1
α 2
(
n)
,χ
2
χ
2
α
(n)
}
2
2. μ未知时,总体方差σ2的假设检验 χ2 检验法
类型 原假设 备择假设
H0
H1
检验统计量
双边 检验
σ2
σ
2 0
σ2
得s=0.007欧姆.设总体服从正态分布,参数均未知,
问在显著性水平α=0.05下,能否认为这批导线的
标准差显著地偏大?
解: s2 0.0072 0.0052
原假设 H 0 : σ 2 0.0052,备择假设 H1 : σ 2 0.0052
检验统计量: χ 2 (n 1)S 2
σ2
拒绝域:
第二节 正态总体的假设检验
一、单一正态总体均值μ的假设检验
二、单一正态总体方差σ2的假设检验 三、两个正态总体均值的假设检验 四、两个正态总体方差的假设检验
一、单一正态总体均值μ的假设检验
设总体X~N (, 2). X1 , X2 , … , Xn是取自X的样本,
样本均值 X样,本方差S2
1.已知
T t(α n 1)
例1. 设某次考试的考生的成绩服从正态分布,从中随
机地抽取36位考生的成绩,算得平均成绩为66.5分,标 准差为15分,问在显著性水平0.05下,是否可以认为在 这次考试中全体考生的平均成绩为70分?
均值检验(T检验)规范

T检验的类型
数据 类型 连 续 数 据
比较内容
工具
一组数据的平均值与目标值相比较
两组数据的平均值相比较
两组成对数据的平均值相比较(或当数据 匹配时,比较两组平均值)
双样本T检验
双样本T检验
例子:某炼铁厂烧结为了提高烧结矿质量(烧结 矿强度),新进一种富矿粉,在烧结生产进行配 加试验,采用了两种配料方案A和B,在生产试 验时,除配料方案不同外,其他条件尽可能做到 相同,各生产6天得到烧结矿强度数据。且认为 两组数据来自相互独立的正态总体。问A和B方 案烧结矿质量好?
3、正态性检验
单样本T检验
百分比
面粉重量 的概率图
正态
99 均值 20.09
标准差 0.1371
95
N
30
90
AD 0.465
P 值 0.236
80
70
60 50 40 30
20
10 5
1
19.7 19.8 19.9 20.0 20.1 20.2 20.3 20.4
面粉重量
进行T检验
单样本T检验
单样本 t 检验 检验平均值 = 零(与 > 零) 计算功效的平均值 = 零 + 差值 Alpha = 0.05 假定标准差 = 0.137
样本 差值 数量 目标功效 实际功效 0.087 29 0.95 0.954539 0.087 23 0.90 0.904048 0.087 17 0.80 0.805185
双样本T检验
总体均值的假设检验

总体均值的假设检验一、正态总体均值的检验设n X X X ,,, 21为总体),(2σμN 的一个容量为n 的样本. 1.方差2σ已知,μ的检验——u 检验法. 当202σσ=已知时,假设检验问题:0100μμμμ≠=:;:H H . 选择检验统计量nX U /00σμ-=,当0H 成立时,)1,0(~N U .给定显著性水平α,由标准正态分布分位点的定义, 有αα=>}|{|2/u U P ,故拒绝域}{}{}|{|2/2/2/αααu U u U u U W >-<=>= ,这种利用服从正态分布的检验统计量的检验方法称为u 检验法.有时我们只关心总体的均值是否增大(或减小).比如,经过工艺改革后,产品的质量(如材料的强度)比以前是否提高,此时我们要研究的是新工艺下总体的均值μ是小于等于原来的均值0μ,还是大于0μ,即检验假设 0100μμμμ>≤:;:H H . 可以证明,在显著性水平α下,上述假设检验问题和检验假设0100μμμμ>=:;:H H 有相同的拒绝域,因此,遇到形如00μμ≤:H 的检验问题,可归结为后一个假设检验问题讨论. 类似地,形如0100μμμμ<≥:;:H H 的检验问题, 可归结为检验假设 0100μμμμ<=:;:H H .这都是单边检验问题.给定显著性水平α,求得的临界值点是上α分位点或上α-1分位点.例1 某厂生产的某种钢索的断裂强度X 服从),(2σμN ,其中40=σ(kg/cm 2),现从这批钢索中抽取容量为9的样本,测得断裂强度的平均值x 较以往正常生产的μ大20(kg/cm 2),设总体方差不变,问在1.00=α下,能否认为这批钢索质量有显著提高?解 依题意,检验假设0100μμμμ>≤:;:H H , 由于40=σ已知,选择检验统计量nX U /0σμ-=因为0H 中的μ全部都比1H 中的μ要小,从直观上看,当0H 成立时,X 的取值x 不应比μ大很多,若偏差0μ-x 过大,则拒绝0H 而接受1H .因为 0100μμμμ>=:;:H H 的拒绝域为}{αu U W >=, 故在显著性水平1.00=α下原假设的拒绝域为}{}{0nu X u U W σμαα+>=>=.本题中,9=n ,40=σ,200=-μx ,33.201.0=u , 计算U 的值33.25.1/0<=-=nx u σμ因此在显著性水平1.00=α下不能拒绝0H ,即认为这批钢索质量没有显著提高.2.方差2σ未知,μ的检验——t 检验法. 检验假设0100μμμμ≠=:;:H H .因为2σ未知,而样本方差2S 是总体方差2σ的无偏估计量,用S 代替σ. 选择检验统计量 nS X T /0μ-=,当0H 成立时,)1(~-n t T .给定显著性水平α,由t 分布分位点的定义, 有αα=->)}1(|{|2/n t T P ,故拒绝域)}1({)}1({)}1(|{|2/2/2/->--<=->=n t T n t T n t T W ααα , 这种利用服从t 分布的检验统计量的检验方法称为t 检验法.例2 某切割机工作正常时,切割每段金属棒的平均长度为10.5cm .今在某段时间内随机地抽取15段进行测量,其结果如下(cm):10.4 10.6 10.1 10.4 10.5 10.3 10.3 10.2 10.9 10.6 10.8 10.5 10.7 10.2 10.7问此段时间内该机工作是否正常(5.00=α)?假设金属棒长度服从正态分布.解 依题意,检验假设0100.510μμμμ≠==:;:H H , 由于2σ未知,故选择检验统计量nS X T /0μ-=.在0H 下,)1(~-n t T ,15=n .给定显著性水平5.00=α,查t 分布表, 得临界值1448.2)14()1(025.02/==-t n t α,故拒绝域)}1(|{|2/->=n t T W α.由已知条件可得48.102.15715111=⨯==∑=n i i x n x056.0784.0141)(11122=⨯=--=∑=n i ix x n s 故2366.0=s .计算统计量的值3274.015/2366.05.1048.10/0-=-=-=ns x t μ因为)1(||2/-<n t t α,所以接受0H ,认为切割机工作正常.例3 设木材的小头直径),(~2σμN X ,12≥μcm 为合格,今抽出12根测得小头直径的样本均值为2.11=x cm ,样本方差为44.12=s cm 2,问该批木材是否合格(5.00=α)?解 依题意,检验假设010012μμμμ<=≥:;:H H ,选择检验统计量nS X T /0μ-=.在假设0100μμμμ<=:;:H H 下,)1(~-n t T ,12=n .给定显著性水平5.00=α,查t 分布表,得临界值7959.1)11()1(05.0==-t n t α,故拒绝域)}1({--<=n t T W α,也是假设010012μμμμ<=≥:;:H H 的拒绝域. 由于2.11=x ,44.12=s ,计算统计量的值3094.212/44.1122.11/0-=-=-=ns x t μ因为)1(--<n t t α,故拒绝0H ,认为该批木材是不合格的. 二、正态总体方差的检验——2χ检验法设n X X X ,,, 21为来自总体),(2σμN 的一个样本,检验假设 20212020σσσσ≠=:;:H H .1.均值μ已知. 因为)1,0(~N X i σμ-,n i ,,2,1 =,则选取检验统计量∑∑==-=⎪⎪⎭⎫ ⎝⎛-=ni ini i XX 12201202)(1μσσμχ.当0H 成立时,)(~22n χχ,给定显著性水平α,由2χ分布表分位点的定义,有αχχχχαα=><-))}(())({(22/222/12n n P ,故得拒绝域)}({)}({22/222/12n n W ααχχχχ><=- .2.均值μ未知.因为X 是总体均值μ的无偏估计量,用X 代替μ.选择检验统计量202122)1(σσχS n XX ni i -=⎪⎪⎭⎫ ⎝⎛-=∑=. 当0H 成立时,)1(~22-n χχ,给定显著性水平α,由2χ分布表分位点的定义,有αχχχχαα=->-<-))}1(())1({(22/222/12n n P故得拒绝域)}1({)}1({22/222/12->-<=-n n W ααχχχχ .类似地,在μ已知和μ未知时,可以求出检验假设20212020σσσσ>≤:;:H H 和20212020σσσσ<≥:;:H H的拒绝域.例如,在μ未知时,检验假设2020σσ≤:H 的拒绝域为)}1({22->=n W αχχ.上述检验所用的检验统计量均服从2χ分布,称这种检验方法为2χ检验法例4 某无线电厂生产的一种高频管,其中一指标服从正态分布),(2σμN ,今从一批产品中抽取8只管子,测得指标数据:68 43 70 65 55 56 60 72(1) 总体均值60=μ时,检验228=σ(取5.00=α); (2) 总体均值μ未知时,检验228=σ(取5.00=α). 解 本题是在显著性水平5.00=α下,检验假设2021220208σσσσ≠==:;:H H ,这里8=n .(1) 60=μ已知时临界值35.517)8()(2025.022/==χχαn ,80.12)8()(2975.022/1==-χχαn ,而检验统计量的值359.10663641)(811222=⨯=-=∑=ni i x μχ, 由于)()(22/222/1n n ααχχχ<<-,故接受0H .(2) μ未知时临界值13.016)7()1(2025.022/==-χχαn ,90.61)7()1(2975.022/1==--χχαn ,而125.614898111=⨯==∑=n i i x n x ,875.652)()1(122=-=-∑=ni i x x s n ,检验统计量的值2012.1075.86526412=⨯=χ, 由于)1()1(22/222/1-<<--n n ααχχχ,故接受0H .§8.3 两个正态总体参数的假设检验设121n X X X ,,, 为总体),(~112σμN X 的一个样本,221n Y Y Y ,,, 为总体),(~222σμN Y 的一个样本.∑==1111n i i X n X 和∑==2121n i iYn Y 分别是两个样本的样本均值,∑=--=112121)(11n i i X X n S 和∑=--=212222)(11n i i Y Y n S 是相应的两个样本方差.设这两个样本相互独立..一、两个正态总体均值的检验考虑检验假设 211210μμμμ≠=:;:H H . 1.方差21σ与22σ已知——u 检验法. 选取 22212121)()(n n Y X U σσμμ+---=.当0H 成立时,检验统计量)1,0(~222121N n n YX U σσ+-=.给定显著性水平α,由标准正态分布表分位点的定义,有αα=>}|{|2/u U P ,故拒绝域}{}{}|{|2/2/2/αααu U u U u U W >-<=>= .例1 设从甲乙两场所生产的钢丝总体X ,Y 中各取50束作拉力强度试验,得1208=x ,1282=y ,已知801=σ,942=σ,请问两厂钢丝的抗拉强度是否有显著差别(5.00=α)?解 本题是在显著性水平5.00=α下, 检验假设211210μμμμ≠=:;:H H , 这里5021==n n .选取检验统计量222121n n YX U σσ+-=.给定显著性水平05.0=α,查标准正态分布表,得临界值96.1025.02/==u u α,故拒绝域}|{|2/αu U W >=.由于1208=x ,1282=y ,801=σ,942=σ, 计算检验统计量的值2392.450/)(2221-=+-=σσy x u .由于2/||αu u >,故拒绝0H ,认为两厂钢丝的抗拉强度有显著差别. 2.方差21σ与22σ未知,但2221σσ=——t 检验法.选取 212111)()(n n S Y X T w+---=μμ.这里2)1()1(21222211-+-+-=n n S n S n S w .当0H 成立时,检验统计量)2(~112121-++-=n n t n n S Y X T w.给定显著性水平α,由t 分布表分位点的定义, 有αα=-+>)}2(|{|212/n n t T P ,故拒绝域)}2({)}2({212/212/-+>-+-<=n n t T n n t T W αα .例2 某烟厂生产两种香烟,独立地随机抽取样本容量相同的烟叶标本测其尼古丁含量的毫克数,分别测得:甲种香烟:25 28 23 26 29 22 乙种香烟:28 23 30 25 21 27假定尼古丁含量都服从正态分布且具有公共方差,在显著性水平5.00=α下,判断两种香烟的尼古丁含量有无显著差异?解 检验假设211210μμμμ≠=:;:H H ,这里621==n n ..525=x ,67.625=y ,7386.21=s ,3267.32=s ,0469.3=w s . 选取检验统计量2111n n S Y X T w+-=.给定显著性水平5.00=α,查t 分布表,得临界值2281.2)10()2(025.0212/==-+t n n t α,故拒绝域)}2(|{|212/-+>=n n t T W α.计算统计量的值0949.00469.33)667.255.25(1121-=⨯-=+-=n n s y x t w.由于)2(||212/-+<n n t t α,故接受0H ,认为两种香烟的尼古丁含量无显著差异. 二、两个正态总体方差的检验——F 检验法 考虑检验假设 2221122210σσσσ≠=:;:H H . 1.均值1μ与2μ已知.因为)(~)(11212121211n Xn i iχμσχ∑=-=,)(~)(12212222222n Yn i iχμσχ∑=-=,选取221222211211222121/)(1/)(1//21σμσμχχ∑∑==--==n i i n i i Y n X n n n F . 当0H 成立时,检验统计量),(~)(1)(1211222121121n n F Y n X n F n i i n i i ∑∑==--=μμ.给定显著性水平α,由F 分布分位点的定义,有ααα=><-))},(()),({(212/212/1n n F F n n F F P , 故得拒绝域)},({)},({212/212/1n n F F n n F F W αα><=- . 2.均值1μ与2μ未知.因为)1(~)1()(112212111221211--=-=∑=n S n X X n i i χσσχ,)1(~)1()(122222221222222--=-=∑=n S n Y Yn i iχσσχ,选取22222121222121//)1/()1/(σσχχS S n n F =--=.当0H 成立时,检验统计量)1,1(~212221--=n n F S S F .给定显著性水平α,由F 分布分位点的定义,有ααα=-->--<-))}1,1(())1,1({(212/212/1n n F F n n F F P , 故得拒绝域)}1,1({)}1,1({212/212/1-->--<=-n n F F n n F F W αα .例3某烟厂生产两种香烟,独立地随机抽取样本容量相同的烟叶标本测其尼古丁含量的毫克数,分别测得:甲种香烟:25 28 23 26 29 22 乙种香烟:28 23 30 25 21 27假定尼古丁含量都服从正态分布且具有公共方差,在显著性水平5.00=α下,判断两种香烟的尼古丁含量的方差是否相等? 解 考虑检验假设2221122210σσσσ≠=:;:H H . 由于两个正态总体的均值都未知,选取检验统计量)1,1(~212221--=n n F S S F .给定显著性水平α,查F 分布表,得两个临界值:15.7)5,5()1,1(025.0212/==--F n n F α1399.015.71)5,5(1)5,5()1,1(025.0975.0212/1====---F F n n F α,故得拒绝域}15.7{}1399.0{><=F F W . 计算统计量的值6777.03267.37386.2222221===s s F .由于15.71399.0<<F , 故接受0H ,认为两种香烟的尼古丁含量的方差也无显著差异.§8.4 非正态总体参数的大样本检验本节讨论一般总体参数的检验.设总体X 的均值为μ,方差为2σ, n X X X ,,, 21为总体X 的一个样本.由中心极限定理可知,当样本容量n 足够大时,nX U /σμ-=近似地服从标准正态分布.因此,我们可以用正态分布去近似.如果对均值μ进行检验,方差2σ未知时,可以用样本方差2S 代替2σ;如果对方差2σ进行检验,均值μ未知时,可以用样本均值X 代替μ.下面举两个例子.例1 设某段高速公路上汽车限速为104.6km/h ,现检验85辆汽车的样本,测出的平均车速为106.7km/h ,已知总体标准差为.413=σ km/h ,但不知总体是否服从正态分布.在显著性水平50.0=α下,试检验高速公路上的汽车是否比限制速度104.6km/h 显著地快?解 依题意,检验假设0100.6104μμμμ>=≤:;:H H , 由于.413=σ已知,n =85足够大, 选择检验统计量nX U /0σμ-=近似地服从)10(,N .其拒绝域}{αu U W >=,其中65.105.0==u u α. 计算U 的值449.4185/4.136.1047.106=-=u ,由于αu u <,因此接受0H ,没有理由认为高速公路上的汽车比限制速度104.6km/h 显著地快.例2 为比较甲乙两种小麦植株的高度(单位:cm),分别抽得甲、乙小麦各100穗,在相同条件下进行高度测定,算得甲乙小麦样本均值和样本方差分别为28=x ,8.3521=s ,26=y ,3.3222=s ,问这两种小麦的株高有无显著差异(50.0=α)?解 依题意,检验假设 211210μμμμ≠=:;:H H , 选取 22212121)()(n n Y X U σσμμ+---=,这里两个方差用样本方差代替.当0H 成立时, 检验统计量 222121n Sn S Y X U +-=近似地服从)1,0(N .给定显著性水平05.0=α,查附表3,得临界值96.1025.02/==u u α, 得拒绝域}|{|2/αu U W >=.计算U 的值4236.21003.328.352628=+-=u ,由于αu u >,因此拒绝0H ,认为这两种小麦的株高有显著差异.当总体服从(0-1)分布),1(p b 时,由于只有一个参数p ,总体均值p 和方差)1(p p -均只与p 有关,这时对参数p 进行假设检验时,检验统计量可以直接用样本和参数p 表示出来.例3 某厂有一批产品须经检验后方可出厂.按规定二级品率不得超过10%,从中随机抽取100件产品进行检查,发现有二级品14件,问这批产品是否可以出厂(50.0=α)?解 这里n =100,14.0=x .检验假设01001.0p p H p p H >=≤:;:, 选取检验统计量 np p p X U )1(000--=,U 近似地服从)1,0(N .由显著性水平50.0=α,可以得到拒绝域}{αu U W >=,其中65.105.0==u u α,计算U 的值333.31100.90.10.104.10=⨯-=u ,由于αu u <,因此接受0H ,认为这批产品二级品率没有超过10%,可以出厂.§8.5 分布的拟合检验前几节的检验都是参数的检验.实际问题中,有时需要对分布作出假设,进行检验.本节只介绍一种分布的检验方法——皮尔逊2χ检验法,它只适合于大样本的情形,一般要求样本容量50≥n .设总体X 的分布函数为)(x F ,)(0x F 为一个已知的分布函数,n X X X ,,, 21为总体X 的一个样本,我们来检验关于总体分布的假设)()()()(0100x F x F H x F x F H ≠=:;:.一、基本原理2χ检验法的基本思想是:将随机试验的所有可能结果的全体分成k 个两两互不相容的事件k A A A ,,, 21,在n 次试验中,将i A 发生的次数i f 叫做i A 发生的频数,如果0H 为真,则由大数定律,在n 次试验中(n 足够大),i A (k i ,,, 21=)出现的实际频率nf i与理论频率)(i i A P p =(可由分布函数)(0x F 算出)不应相差很大.基于这种想法,皮尔逊构造了统计量∑=-=ki i i i np np f 122)(χ或∑=-=ki i i i p n p n f 122ˆ)ˆ(χ, 其中i p ˆ是由)(ˆ0x F 计算出来的理论频率,)(ˆ0x F 是)(0x F 中未知参数估计出后的分布函数,并证明了如下定理:定理1 若n 足够大,当0H 成立时,统计量2χ总是近似地服从自由度为1--r k 的2χ分布,其中r 是已知的分布函数)(0x F 中未知参数的个数.直观上看,2χ值表示实际观测结果与理论期望结果的相对差异的总和,当它的取值大于临界值时,应拒绝0H . 二、检验步骤如果)(0x F 为不带有未知参数的已知分布,皮尔逊2χ检验法的具体步骤如下: (1) 将总体X 的值域划分成k 个不交的区间i A (k i ,,, 21=),使得每个区间包含的理论频数满足5≥i np ,否则将区间适当调整; (2) 在0H 成立时,计算各理论频率即概率i p 的值:)()()(100--==i i i i y F y F A P p ,k i ,,, 21=.这里1-i y 与i y 为区间i A 的端点,即](1i i i y y A ,-=;(3) 数出i A 中含有样本值的个数,即i A 的频数i f ,并计算统计量∑=-=ki ii i np np f 122)(χ 的值2χ;(4) 由2χ分布,对于给定的显著性水平α,找出临界值)1(2-k αχ; (5) 判断:若)1(22->k αχχ,则拒绝0H ,否则可接受0H . 如果总体X 是离散型的,则假设0H 相当于假设总体X 的概率分布00}{i i p x X P H ==:, ,,21=i .如果总体X 是连续型的,则假设0H 相当于)()(00x f x f H =:,这里)(x f 为总体的概率密度.例1 至1984年底,南京市开办有奖储蓄以来,13期兑奖号码中诸数码的频数汇总如表8.1:表8.1试检验器械或操作方法是否有问题(50.0=α).解 设抽取的数码为X ,它可能的取值为0~9,如果检验器械或操作方法没有问题,则0~9出现是等可能的,即检验假设 1010=i p H :,9210,,,, =i ,这里}{i X P p i ==. 依题意知k =10,令}{i A i =,9210,,,, =i ,n =350,则理论频数35=i np .57.61935688)(922==-=∑=i i i i np np f χ给定显著性水平5.00=α,查2χ分布表,得临界值9.16)9()1(205.02==-χχαk .由于19.675>16.9,故拒绝0H ,即认为器械或操作方法有问题.如果)(0x F 为带有未知参数的已知分布,未知参数为r θθθ,,, 21,这时用这r 个未知参数的极大似然估计量r θθθˆˆˆ21,,, 来代替)(0x F 中的参数r θθθ,,, 21,得到分布函数)(ˆ0x F ,然后建立统计量∑=-=ki i i i p n p n f 122ˆ)ˆ(χ, 这里i p ˆ是由)(ˆ0x F 计算出来的理论频率,再用以上检验步骤进行检验,但此时检验统计量2χ近似服从)1(2--r k χ分布(这里k >r +1).例2 某高校对100名新生的身高(厘米)做了检查,把测得的100个数据按由大到小的顺序排列,相同的数合并得表8.2:表8.2试问,在显著性水平5.00=α下是否可以认为学生身高X 服从正态分布? 解 这里n =100,我们来检验假设222)(021)(σμσπ--=x ex f H :,+∞<<∞-x ,这里)(x f 为正态分布),(2σμN 的概率密度,设其分布函数为)(x F ,μ与0>σ为未知参数.先求μ与2σ的极大似然估计值μˆ,2ˆσ: 33.1661ˆ1==∑=n i i x n μ, 06.28)ˆ(1ˆ212=-=∑=μσn i i x n . 设服从正态分布)ˆ,ˆ(2σμN 的随机变量为Y ,分布函数为)(ˆy F .按照分组要求,每个小区间的理论频数i pn ˆ不应小于5,因此我们将数据分成了7个组,使得每组的实际频数不小于5,各计算结果如下表8.3所示.表8.3中第3列i pˆ的计算如下: )(ˆ)(ˆ}{ˆ11---=≤<=i i i i i y F y F y Y y P p ,7210,,,, =i , 例如,}06.2833.1665.164ˆˆ06.2833.1665.161{}5.1645.161{ˆ3-≤-<-=≤<=σμY P Y P p1837.0)911.0()345.0(=-Φ--Φ=.给定显著性水平5.00=α,查2χ分布表,得临界值488.9)4()127()1(205.0205.02==--=--χχχαr k .由于1.8843<9.488,故接受0H ,即认为学生身高服从正态分布.。
正态总体均值的假设检验

假设检验
正态总体均值的假设检验
1.1 单个正态总体均值的假设检验
3.大样本单个正态总体均值的检验
设总体为 X ,它的分布是任意的,方差 2 未知, X1 ,X2 , ,Xn 为 来自总体 X 的样本,H0 : 0( 0 已知).当样本容量 n 很大( n 30 )
时,无论总体是否服从正态分布,统计量 t X 0 都近似服从正态分 S/ n
解 依题意,建立假设 由于 2 未知,故选取统计量
H0 : 0 72,H1 : 72 . t X 0 , S/ n
已知 0.05 ,故此检验问题的拒绝域为
W t | | t |
x 0
s/ n
t
/
2
(n
1)
.
又知 n 26,x 74.2,s 6.2,查表得 t /2 (25) t0.025 (25) 2.06 ,则有 | t | x 0 74.2 72 1.81 2.06 , s/ n 6.2/ 26
解 依题意,建立假设 由于 2 未知,取检验统计量
H0 : 0.8,H1 : 0.8 .
t X 0 ~ t(n 1) , S/ n
已知 0.05 ,故此检验问题的拒绝域为
W t | t x 0 s/ n
t (n 1) .
又知 n 16 ,x 0.92,s 0.32 ,查表得 t0.05 (16 1) t0.05 (15) 1.75,则有 t x 0 0.92 0.8 1.50 1.75 , s/ n 0.32/ 16
假设检验 H0 : 0 ,H1 : 0 的拒绝域为 W {t | t t (n 1)}.
(7-8) (7-9)
假设检验
正态总体均值的假设检验
1.1 单个正态总体均值的假设检验
单个正态总体均值的检验两个正态总体均值差的检验小结布

,当 未知时,关于 的单边检验得拒绝域在课本
P153-154附表中已给出。
t t 上述利用 统计量得出的检验法称为 检验法。在实际中,正态总体的方差常
为未知,所以我们常用
t 检验法来检验关于正态总体均值的检验问题。
X 例1 某种电子元件的寿命 (以小时计)服从正态分布,
16只元件的寿命如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170
取显著性水平为 ,现在来求这个问题的拒绝域.
因为 中的 全部都比 中的要小,从直观上看,
较合理的检验法应是:若观测值 与 的差
过分大,即
, 则我们拒绝 而接受 ,
因此拒绝域的形式为
(k 待定).
由标准正态分布的分布函数
P{拒绝
为真 }
的单调性得到
所以要控制 P{拒绝
为真} ,只需
令
即得
,从而得检验问题 的拒绝域为
即
这与上节得到的检验问题
比较正态总体
在方差
的拒绝域是一致的。 已知时,对均值 的两种检验问题
和
我们看到尽管两者原假设 的形式不同,实际意义也不一样,但对于相同 的显著性水平它们的拒绝域是相同的。因此遇到形如
的检验问题,可归结为
来讨论。对于下面将要讨论的有关正态总体的参数的检验也有类似的结果。
2. 未知,关于 的检验(t检验)
一、单个总体
均值 的检验
1. 已知,关于 的检验(u检验)
在上一小节中已讨论过正态总体
,当
已知时关于
的检验问题.在这些检验问题中,我们都是利用 在为真时服从
分布
的统计量
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
H0 : 0, H1 : 0
和
H0 : 0, H1 : 0
数理统计
我们看到尽管两者原假设 H0 的形式不同,实际
意义也不一样,但对于相同的显著性水平它们的
拒绝域是相同的。因此遇到形如
H0 : 0, H1 : 0 的检验问题,可归结为
因为
H
中的
0
全部都比 H1中的要小,从直观上看,
较合理的检验法应是:若观测值 x与0的差 x 0
过分大,即 x 0 k , 则我们拒绝H0 而接受 H1,
因此拒绝域的形式为 x 0 k(k 待定).
数理统计
由标准正态分布的分布函数 ( x)的单调性得到
P{拒绝 H0
2.775,t0.05 (18)
1.7341,
故拒绝域为
xy
t sw
1 1 t0.05 (18) 1.7341, 10 10
现在由于样本观察值t=-4.295<-1.7341,所以拒绝
H
,
0
即认为建议的新操作方法较原来的方法为优。
三、小结
数理统计
在这一节中我们学习了正态总体均值的检验 法, 有以下两种 :单个正态总体 均值的检验以及 两个正态总体均值差的检验 .
令
( k )
n
即得 k ( n)z,从而得检验问题
H0
:
ቤተ መጻሕፍቲ ባይዱ
0
,
H1
:
x00 n
的拒绝域为
z
即
x 0 ( n)z
数理统计
这与上节得到的检验问题H0 : 0, H1 : 0 的拒绝域是一致的。
比较正态总体 N( , 2 ) 在方差 2 已知时,对均值
的单边检验得拒绝域在课本P153-154附表中已给出。
数理统计
上述利用 t 统计量得出的检验法称为 t 检验法。在
实际中,正态总体的方差常为未知,所以我们常用
t 检验法来检验关于正态总体均值的检验问题。
数理统计
例1 某种电子元件的寿命 X(以小时计)服从正态
分布,, 2均未知。现测得16只元件的寿命如下:
特别引起注意的是,在这里假设两总体的方差是相
等的。
数理统计
现在来求检验问题:
H0 : 1 2 , H1 : 1 2 .
( 为已知常数)的拒绝域,取显著性水平为
0.05 引用下述 t 统计量作为检验统计量:
t (x y)
sw
1 1
n1
n2
其中
四、布置作业
概率与统计
数理统计
sw2
(n1
1)s12 (n2 1)s22 n1 n2 2
数理统计
当 H0 为真时,已知 t t(n1 n2 2)与单个总体
的 t 检验法相仿,其拒绝域的形式为
t (x y) k.
sw
11 n1 n2
P{拒绝 H0 H0为真}
=
(x P { 1 2
sw
y)
11 n1 n2
k}
数理统计
可得 k t (n1 n2 2). 于是得拒绝域为
(x y)
t sw
1 1 t (n1 n2 2). n1 n2
关于均值差的其它两个检验问题的拒绝域在书附表
中给出。常用的是 0 的情况。
当两种正态总体的方差均为已知时,我们可
解:需要检验假设 H0 : 1 2 0, H1 : 1 2 0.
分别求出标准方法和新方法的样本均值和样本方差
如下:
n1 10, x 76.23, s12 3.325, n2 10, y 79.43, s22 2.225.
数理统计
又,
sw2
(10 1)s12 (10 1)s22 10 10 2
设 x1, x2 , , xn是来自正态总体X 的样本,
由于 2 未知,现在不能利用 x 0 来确定拒绝
域了。
n
数理统计
s 注意到 2是 2 的无偏估计,我们用 s 来代
替 ,采用 t x 0 作为检验统计量。当
sn
t x 0
过分大时就拒绝
H
,
0
拒绝域的
sn
形式为
中,我们都是利用 H 0在为真时服从 N (0,1)分布
的统计量 x 0 来确定拒绝域。这种检验法常称
为 u 检验法。
n
数理统计
下面还将给出一个有用的结果:
我们看到,如将例2中需要检验的问题写成以下的 形式,看来更为合理:
H0 : 0, H1 : 0
取显著性水平为 ,现在来求这个问题的拒绝域.
H0 : 0, H1 : 0 来讨论。对于下面将要讨论的有关正态总体的参 数的检验也有类似的结果。
数理统计
2. 2 未知,关于 的检验(t检验)
设总体 X N ( , 2 ),其中 , 2未知,我们来
求检验问题 H0 : 0, H1 : 0
的拒绝域(显著性水平为 )。
t
x 0
sn
t (n 1)
现在n=16, t0.05(15) 1.7531. 又算得 x 241.5, s 98.7259
即得
t x 0 0.6685 1.7531.
sn
t不落在拒绝域,故接受 寿命不大于225小时。
H
0
,即认为元件的平均
数理统计
二.两个正态总体均值差的检验(t 检验)
数理统计
第二节 正态总体均值的假设 检验
单个正态总体 均值的检验 两个正态总体均值差的检验 小结 布置作业
数理统计
一、单个总体N( , 2)均值 的检验
1. 2已知,关于 的检验(u检验)
在上一小节中已讨论过正态总体 N( , 2), 当 2
已知时关于 0的检验问题.在这些检验问题
t x 0 k
sn
已知当
H
为真时,
0
x s
0
n
t(n 1),故由
P {拒绝
H0
H
0为真}=
P 0
{
x 0
sn
k}
,
数理统计
得 k t 2 (n 1) , 即拒绝域为
t
x 0
sn
t 2 (n 1)
对于正态总体 N ( , 2 ) ,当 2未知时,关于
新方法 79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1
数理统计
设这两个样本相互独立,且分别来自正态总
体 N (1, 2 ) 和 N (2 , 2 ) , 1, 2 , 2 均未
知。问建议的新操作方法能否提高得率?
(取 0.05 )
159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 问是否有理由认为元件的平均寿命大于225(小时 )?
数理统计
解: 按题意需检验
H0 : 0 225, H1 : 225.
取 0.05。由表8.1知检验问题的拒绝域为
我们还可以用t检验法检验具有相同方差的两个 正态总体均值差的假设。
设 x1, x2 , , xn1是来自正态总体 N (1, 2 )的样本
,y1, y2 , , yn2是来自正态总体 N (2, 2 ) 的样本且
设两样本独立。又分别记它们的样本均值为 x , y,
记样本方差为s12 , s22。设 1, 2 , 2 均为未知,要
用u检验法来检验两正态总体均值差的假设问题。
数理统计
例2 在平炉进行一项试验以确定改变操作方法的 建议是否会增加钢的得率,试验是在同一只平炉上 进行的。每炼一炉钢时除操作方法外,其它条件都 尽可能做到相同。先用标准方法炼一炉,然后用建 议的新方法炼一炉,以后交替进行,各炼了10炉, 其得率分别为
标准方法 78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3
H
为真
0
}
P (x 0 k ) 0
P 0
(x
n
0 k
) n
1
(
(
0
k
) n
)
0
(
(0
n
k
)
) 0
( 0 (0 k)) ( k )
n
n
数理统计
所以要控制 P{拒绝 H0 H0为真} ,只需