总体均值的假设检验

合集下载

假设检验的几种方法

假设检验的几种方法

假设检验的几种方法假设检验是统计学中常用的一种技术。

它可以帮助人们查看样本数据是否具有代表性,并据此作出关于总体数据的推断。

假设检验的目的是对一个关于总体的假设进行检验,看样本数据是否支持这个假设,或者是否应该拒绝这个假设。

假设检验方法的选择取决于所要检验的问题,而统计学家通常会使用以下四种方法:1. Z检验Z检验适用于大样本,即样本数量大于30个,总体标准差已知的情况下。

它用于检验给定样本均值是否与总体均值相等,或两个样本均值是否相等。

该检验将样本均值与总体均值之间的差异量标准化,得到标准差,从而得出样本和总体均值之间的关系。

2. t检验t检验适用于小样本情况,即样本数量少于30个,总体标准差未知,并且样本符合正态分布。

它用于检验给定样本均值是否与总体均值相等,或两个样本均值是否相等。

该检验将样本均值与总体均值之间的差异量标准化,得出t值,然后与t分布表中相应值比较,从而得出样本和总体均值之间的关系。

3.单尾检验单尾检验是针对所检验的问题的方向(即是大于还是小于)进行的检验。

它根据所研究的问题,将给定样本的假设分为单尾和双尾假设。

单尾检验用于检验一个样本是否比另一个样本更高(或更低),并估计差异的显著性。

4.双尾检验双尾检验用于检验给定样本均值是否与一个已知总体值相等,或者检验两个样本之间的差异是否显著。

它提供了一种可靠的方法,用于估算样本均值与总体均值之间的差异,并考虑标准误差的影响。

总之,假设检验方法的选择应该取决于分析者要研究的问题。

在尽可能保持样本数据的准确性的情况下,正确选择假设检验方法可以提高数据分析的效果。

第58讲 两个正态总体参数假设检验(比较两个正态总体均值的检验)

第58讲  两个正态总体参数假设检验(比较两个正态总体均值的检验)

第58讲:两个正态总体参数的假设检验(比较两个正态总体均值的检验)例1:通常认为男女的脉搏率是没有显著差异的. 现在随机地抽取年龄都是25岁的16位男子和13位女子, 测得他们的脉搏率如下:男: 61, 73, 58, 64, 70, 64, 72, 60, 65, 80, 55,72, 56, 56, 74, 65,女: 83, 58, 70, 56, 76, 64, 80, 68, 78, 108,76, 70, 97.问题:假设男女脉搏率都是服从正态分布, 这些数据能否认为男女脉搏率的均值相同?()()12221212122221,,,,,,,,,,,n n X X X N Y Y Y N X Y S S μσμσ∙∙∙ 12假设:是来自的样本是来自的样本,两样本相互独立.并记,分别为两样本的均值和方差.()012112.:,:,H H μμμαμ=≠检验假设显著水平22121.σσ当和已知时2212012,.~(0X Y X Y C H X Y N n n σσ∙--≥∙-+ 检验统计量拒绝域形式 当成立时,,).221212σσ-=+X YZ n n 记: 2α≥--Z z z 则检验拒绝域为:检验{}00002212122(1(),.σσ-=≥=-Φ-=+H P P Z z z x yz n n 其中:222122.σσσ当==但未知时2σ首先利用合样本给出参数的无偏估计量()()22112221211 .2wn S n SS n n -+-=+-1211-=+w X Y T S n n 可取检验统计量为:()21212211wX Y T t n n S n n α-=≥+-+检验拒绝域为:{}{}00120012||||2(2)||11--=≥=+-≥-=+H w P P T t P t n n t x yt P s n n 其中为::值——两样本精确t检验22123.σσ≠当且未知时221212.-=+X Y T S S n n 取检验统计量为:22221212.S S σσ以样本方差分,别代替,{}{}000||||2||,--=≥=≥H P P T t P Z P t 值为:(1)当两个样本量都很大时,利用中心极限定理{}/2||α≥T z 检验的拒绝域为:0221212~(01).-=+x y Z N t s sn n 其中: ,,12min(1,1),=--k n n (2)当两个样本为小样本时都很大时,统计量近似服从t 分布,自由度为22211222222112212(//)(/)(/)11+=+--S n S n k S n S n n n 或更精确的近似自由度{}/2||()α≥T t k 检验的拒绝域为: {}{}000||||2()||.--=≥=≥H P P T t P t k t P 值为: t ——两样本近似检验22112212221201,~(,),~(,),16,13,65.31,75.69,56.36,211.40,.X Y X N Y N n n x y s s H H μσμσμμμμ=======≠1212检验假设在例1中设分别表示男女的脉搏率,由已知数据计得:,::算221256.36,211.40,s s t ==注意到相差很大,采用不等方差的检验法,结论:拒绝原假设,认为男女脉搏率的均值不相同。

第七章假设检验

第七章假设检验
第七章 假设检验
第一节 第二节 检验 假设检验的一般问题 总体均值, 总体均值,比例和方差的假设
学习目标
1. 了解假设检验的基本思想 2. 掌握假设检验的步骤 3. 能对实际问题作假设检验
第一节 假设检验的一般问题
一,假设检验的概念 二,假设检验的步骤 三,假设检验中的小概率原理 四,假设检验中的两类错误 五,双侧检验和单侧检验
拒绝域 置信水平
α
1-α 接受域 H0值 样本统计量
临界值
6,右侧检验(显著性水平与拒绝域 ) 右侧检验( 抽样分布
置信水平 拒绝域 1-α 接受域 H0值 观察到的样本统计量 样本统计量
α
临界值
抽样分布
1-α 接受域 H0值
置信水平 拒绝域
α
临界值
样本统计量
第二节 总体均值,比例和方差的假设检验
1,原假设为真时拒绝原假设 , 2,会产生一系列后果 , 3,第一类错误的概率为α ,第一类错误的概率为α
被称为显著性水平 第二类错误(取伪错误) (二)第二类错误(取伪错误)
1,原假设为假时接受原假设 , 2,第二类错误的概率为β ,第二类错误的概率为β
(三)列表
H0: 无罪
假设检验就好 像一场审判过程
2,确定假设的步骤 例如问题为: 检验该企业生产的零件平均长度为4厘米 步骤: (1)从统计角度陈述问题 ( = 4) 1 (2)从统计角度提出相反的问题 ( ≠ 4) 必需互斥和穷尽 (3)提出原假设 ( = 4) (4)提出备择假设 ( ≠ 4) 有 ≠ 符号
3,双侧检验(例子) 双侧检验(例子)
1,原假设与备择假设是一个完整事件组. 2,通常先确定备择假设,再定原假设. 3,等号总放在原假设. 4,两者的选择本质上带有主观色彩. 5,假设检验的目的主要是收集证据拒绝原 假设.

6 假设检验

6 假设检验




常用的α 值为0.01, 0.05, 0.1
由研究者事先确定。
拒绝域 1/2 1 - 接受域
拒绝域 1/2
临界值
H0
临界值
假设检验的步骤

根据问题要求提出 原假设(H0 )和备择假设(H1); 确定适当的检验统计量及相应的抽样分布;

计算检验统计量的值;

选取显著性水平,确定原假设的接受域和拒绝域; 作出统计决策。

举例2

某品牌洗发水在产品说明书中称:平均净含 量不少于500ml。相关机构要通过抽检其中 一批产品来验证是否属实。试陈述用于检验
的原假设和备择假设。

设该品牌洗发水的平均净含量真值是μ。 如果μ<500,表明说明书的内容不属实。

H0 :μ ≥ 500 (净含量符合说明书)
H1 :μ < 500 (净含量不符合说明书)
举例3

一家研究机构估计,某城市中家庭拥有汽车 的比率超过30%。为验证这一估计是否正确, 该机构随机抽取了一个样本进行检验。试陈
述用于检验的原假设和备择假设。

设该城市家庭拥有汽车的比率真值是 p。 研究者想收集证据予以证明:比率不超过30% H0 :p ≤ 30% (比率不超过30%)

H1 :p > 30% (比率超过30%)
例题

一种罐装饮料每罐的容量是255ml,标准差是
5ml。为检验每罐容量是否符合要求,质检人员
在某天的产品中随机抽取40罐进行检验,测得平 均容量为255.8ml。取显著性水平 =0.05,检 验该天生产的饮料容量是否符合标准要求。

设饮料的平均容量为μ。 H0 :μ = 255 (容量符合要求) H1 :μ≠255 (容量不符合要求)

概率论与数理统计02-82.2 两个正态总体均值的检验_70

概率论与数理统计02-82.2 两个正态总体均值的检验_70

第八章假设检验第二节正态总体均值的假设检验2. 两个正态总体在寿命问题中提出了两个正态总体均值是否相等的假设012:H μμ=112:H μμ≠这种情形经常发生在当研究对象的外界条件发生了改变时,判断研究对象是否受到了这种影响.检验统计量如何构造呢?例3对用两种不同热处理方法加工的金属材料做抗拉强度试验,得到的试验数据如下:方法Ⅰ:31,34,29,26,32,35,38,34,30,29,32,31方法Ⅱ:26,24,28,29,30,29,32,26,31,29,32,28设两种热处理加工的金属材料的抗拉强度都服从正态分布,且方差相等.比较两种方法所得金属材料的平均抗拉强度有无显著差异().05.0=α).,(),,(2221σμσμN N 解:记两总体的正态分布为.:,:211210μμμμ≠=H H 本题是要检验假设关键问题在于找到拒绝域12k μμ->X Y k->121212()()~(2),11w X Y t n n S n n μμ---+-+222112212(1)(1)2w n S n S S n n -+-=+-其中12221212()()~(0,1)X Y N n n μμσσ---+).,(),,(2221σμσμN N 解:记两总体的正态分布为.:,:211210μμμμ≠=H H 本题是要检验假设1212~(2)11w X Y T t n n S n n -=+-+检验统计量为21212||(2)11w x y t t n n S n n α-=≥+-+拒绝域为,1221==n n ,75.31=x .67.28=y ,25.112)1(211=-s n ,64.66)1(222=-s n .85.2=w s .647.26185.2|67.2875.31|11||||21=-=+-=n n s y x t w 计算统计值074.2)22()2(025.0212==-+t n n t α查t 分布表,得/212||(2)t t n n α>+-统计判决:由于故拒绝H 0.即认为两种热处理方法加工的金属材料的平均抗拉强度有显著差异.解:休息一下吧。

假设检验PPT课件

假设检验PPT课件
假设检验
【学习目标】通过对本章的学习,掌握假设检验的概念和 类型、假设检验的两类错误和假设检验的一般步骤;重点掌握 单个总体均值的检验和比率的检验。
第一节 假设检验的基本问题 第二节 △ 假设检验的应用
假设检验
第一节 假设检验的基本问题
一、假设检验的概念 二、假设检验的两类错误 三、假设检验的类型 四、假设检验的类型一般步骤
假设检验
第一节 假设检验的基本问题
什么小概率?
1.在一次试验中,一个几乎不可能发生的事件发生的概率; 2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假 设; 3.小概率由研究者事先确定。
假设检验
第一节 假设检验的基本问题
二、假设检验的两类错误(决策风险)
(一) 第一类错误 第一类错误,亦称拒真(弃真)错误。是指当原假设为 真时,但由于样本的随机性使样本统计量的具体值落入 了拒绝区域,这时所作的判断是拒绝原假设。 犯第一类错误的概率亦称拒真概率,它实质上就是前面
t
986 1000 24
2.333>
t n 1 2.1315
16
2
所以接受 H1,即这天包装机工作不正常。
假设检验
第二节 假设检验的应用
二、单个总体比率(成数)的假设检验
比率P是平均数的一种特殊形式,因而前面讲的平均 数检验理论都适用于总体比率P的假设检验,只是估计量 的形式略有不同。
【例4】我国出口的参茸药酒畅销于某国市场。据以往调查, 购买此种酒的顾客中40岁以上的男子占50%。经营该药酒 的进出口公司经理关心这个比率是否发生了变化,于是, 委托一个咨询机构进行调查,这个咨询机构从众多购买该 药酒的顾客中随机抽取了400名进行调查,结果有210名为 40岁以上的男子。试问在0.05的显著水平上,能否认为购 买此种药酒的顾客中40岁以上男子所占比率变化了?

检验理论的知识点总结

检验理论的知识点总结一、概述检验理论是统计学中的一个重要分支,它研究如何根据样本数据对总体特征进行推断。

在实际应用中,人们往往需要对总体进行估计、对总体假设进行检验和对总体进行质量控制,这些都需要利用检验理论进行分析。

二、基本概念1. 总体和样本总体是指研究对象的全体,它是一系列相互联系、相互影响的个体的集合。

而样本是从总体中抽取出的一部分个体,它的特征通常代表了总体的一些特征。

2. 参数和统计量参数是总体的某个特征的数字度量,如总体均值、总体标准差等;而统计量是样本的某个特征的数字度量,如样本均值、样本标准差等。

在检验理论中,我们往往需要利用样本统计量对总体参数进行推断。

3. 假设检验假设检验是检验理论中的一个重要概念,它用于检验总体参数的某个特定值的假设是否成立。

假设检验分为单侧检验和双侧检验,分别用于检验总体参数是否大于(小于)某个特定值或者不等于某个特定值。

4. 显著性水平和P值显著性水平是在假设检验中用来表示拒绝原假设的临界值,通常取0.01、0.05或0.10等。

P值是在假设检验中用来表示原假设成立的概率,P值越小说明原假设越不成立。

5. Z检验和T检验Z检验和T检验是常用的假设检验方法,其中Z检验用于总体方差已知的情况,T检验用于总体方差未知的情况。

它们都可以用来进行总体均值的假设检验。

6. 卡方检验和F检验卡方检验和F检验是用于检验总体方差的假设检验方法,其中卡方检验用于总体方差是否符合某个特定的分布,F检验用于比较两个总体方差是否相等。

三、基本原理1. 假设检验过程假设检验过程一般包括如下几个步骤:提出原假设和备择假设、选择适当的检验统计量、确定显著性水平、计算P值、做出统计决策。

2. 假设检验的两类错误在假设检验中,可能会犯两类错误,即α错误和β错误。

α错误是拒绝了一个真实的原假设,β错误是接受了一个不成立的原假设。

假设检验的目标是控制这两类错误的概率。

3. 抽样分布抽样分布指的是在给定总体参数的情况下,样本统计量的分布规律。

假设检验完整版


几个重要的分布介绍 标准正态分布 定义: 设 X1,X2,......Xn相互独立, 都服从标准正态分布N(0,1), 则称 随机变量χ2=X12+X22+......+Xn2所服从的分布为自由度为 n 的χ2 分布.
几个重要的分布介绍
几个重要的分布介绍
双侧检验与单侧检验的假设形式
假设 原假设
计算检验统计量值:
t 986 1000 1.75 24 9
∵t值落入接受域,∴在 a =0.05的显著性水平上 接受H0
例四(和spss结合)
正常人的脉搏平均 数为72次/分。现测得15名患者的脉搏:71,55,76,68,
72,69,56,70,79,67,58,77,63,66,78 试问这15名患者的脉搏与正
描述统计
推断统计
参数估计 假设检验
假设检验一般问题
1、假设问题的提出和基本思想 2、几个重要的分布介绍 3、双侧检验和单侧检验 4、假设检验的步骤 5,总体均值的检验 6,举例
假设问题的提出
根据1989年的统计资料,某地女性新生儿的平均体重为 3190克,现从1990年的女性新生儿中随机抽取30人,测得 其平均体重为3210克,问1990年的女性新生儿和1989年的 新生儿相比,体重有无显著性差异?
显著性为0.088>0.05,接受原假设,无明显差异。
态分布,其总体均值为X0=0.081mm,总体标准差为 =0.025 。今换一 种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度均值为
0.076mm。试问新机床加工零件的椭圆度均值与以前有无显著差异?(a=
0.05)
解:已知:X0=0.081mm, =0.025,n=200,

应用统计学第7章 假设检验



μp
(1 )
σp
n
7.3 几种常见的假设检验
• p的抽样分布接近于 正态分布,所以检
验统计量是ZSTAT 值:
p的假设检验
Z STAT

nπ 5和 n(1-π) 5
π(1 π)
n
nπ < 5或 n(1-π) < 5
本章不讨论
7.3 几种常见的假设检验
关于总体比例,可建立如下假设:
提出原假设和备择假设 选择显著性水平 确定检验统计量 建立决策准则 做出决策
7.2 假设检验的五个步骤
7.2.1提出原假设和备择假设 原假设,H0
检验的声称或断言
例:在美国每个家庭平均有3台电视机
(H0 : μ 3)
是总体参数,不是样本统计量
H0 : μ 3
H0 : X 3
7.2 假设检验的五个步骤
的假设检验
σK已n知own (Z 检验)
检验统计量是:
σ Un未kn知own (t 检验)
7.3 几种常见的假设检验
根据抽样分布原理,当总体服从正态分布N(μ,2)时,那
么从中抽取(重复抽样)容量为n 的样本,其样本均值
服从正态分布
N , 2 / n ,而统计量
Z
x
服从标
准正态分布。
n
对于双侧检验,对给定的显著性水平α,当
解:由题意知,这是左单侧检验问题,可建立如下假设:
H0 : 0.9
H1 : 0.9
样本比例
p 82 0.82 ,检验统计量的值为:
100
Z
p
= 0.82 0.9 2.67
(1 )
0.9 0.1
n
100

假设检验


能应该落在根据该总体平均值和标准差计算的0 能应该落在根据该总体平均值和标准差计算的0点附
原假设x=μ,双尾检验. 原假设x=μ x=
左侧阴影区域累计概率 α / 2
右侧阴影区域累计概率 α / 2
C1
非拒绝区域,累计 频率95%或99%
C2
拒绝区域
Байду номын сангаас
t
拒绝区域
原假设x≤μ,单尾检验 原假设x≤μ x≤
多组计量资料均值比较不能用t 检验
对于多组计量资料, 对于多组计量资料, 如果用两均数比较的t 检验来比较组间的差异, 会加大犯α错误的 检验来比较组间的差异, 会加大犯 错误的 概率,从而可能把本无差别的两个总体均数 概率, 判为有差别。 判为有差别。 多组均数之间的比较可以采用方差分析( 多组均数之间的比较可以采用方差分析( F 检验) 检验) 。
SPSS的检验过程是按双尾进行的计算。 SPSS的检验过程是按双尾进行的计算。对单尾检验 的检验过程是按双尾进行的计算 只需将sig.值除以2即可。 sig.值除以 ,只需将sig.值除以2即可。 对于同一个问题, 对于同一个问题,采用双尾检验结果比单尾检验犯 错误的概率小50% 50%。 α错误的概率小50%。
② ③ ④
t检验操作步骤(续) 检验操作步骤( 检验操作步骤

在选项(Options)对话窗中了个独立样本均 在选项(Options)对话窗中了个独立样本均 (Options) 值之差置信区间( Interval) 值之差置信区间(Confidence Interval) 的可靠性选择框中,系统默认值为95%,用 的可靠性选择框中,系统默认值为95%, 95% 户也可以另行指定。 户也可以另行指定。 在缺失值( Values)处理方法栏, 在缺失值(Missing Values)处理方法栏, 系统默认为在分析中删除带有缺失值的观测 在检验中样本规模可能是变化的。 量,在检验中样本规模可能是变化的。 Ok。 Ok。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

总体均值的假设检验一、正态总体均值的检验设n X X X ,,, 21为总体),(2σμN 的一个容量为n 的样本. 1.方差2σ已知,μ的检验——u 检验法. 当202σσ=已知时,假设检验问题:0100μμμμ≠=:;:H H . 选择检验统计量nX U /00σμ-=,当0H 成立时,)1,0(~N U .给定显著性水平α,由标准正态分布分位点的定义, 有αα=>}|{|2/u U P ,故拒绝域}{}{}|{|2/2/2/αααu U u U u U W >-<=>= ,这种利用服从正态分布的检验统计量的检验方法称为u 检验法.有时我们只关心总体的均值是否增大(或减小).比如,经过工艺改革后,产品的质量(如材料的强度)比以前是否提高,此时我们要研究的是新工艺下总体的均值μ是小于等于原来的均值0μ,还是大于0μ,即检验假设 0100μμμμ>≤:;:H H . 可以证明,在显著性水平α下,上述假设检验问题和检验假设0100μμμμ>=:;:H H 有相同的拒绝域,因此,遇到形如00μμ≤:H 的检验问题,可归结为后一个假设检验问题讨论. 类似地,形如0100μμμμ<≥:;:H H 的检验问题, 可归结为检验假设 0100μμμμ<=:;:H H .这都是单边检验问题.给定显著性水平α,求得的临界值点是上α分位点或上α-1分位点.例1 某厂生产的某种钢索的断裂强度X 服从),(2σμN ,其中40=σ(kg/cm 2),现从这批钢索中抽取容量为9的样本,测得断裂强度的平均值x 较以往正常生产的μ大20(kg/cm 2),设总体方差不变,问在1.00=α下,能否认为这批钢索质量有显著提高?解 依题意,检验假设0100μμμμ>≤:;:H H , 由于40=σ已知,选择检验统计量nX U /0σμ-=因为0H 中的μ全部都比1H 中的μ要小,从直观上看,当0H 成立时,X 的取值x 不应比μ大很多,若偏差0μ-x 过大,则拒绝0H 而接受1H .因为 0100μμμμ>=:;:H H 的拒绝域为}{αu U W >=, 故在显著性水平1.00=α下原假设的拒绝域为}{}{0nu X u U W σμαα+>=>=.本题中,9=n ,40=σ,200=-μx ,33.201.0=u , 计算U 的值33.25.1/0<=-=nx u σμ因此在显著性水平1.00=α下不能拒绝0H ,即认为这批钢索质量没有显著提高.2.方差2σ未知,μ的检验——t 检验法. 检验假设0100μμμμ≠=:;:H H .因为2σ未知,而样本方差2S 是总体方差2σ的无偏估计量,用S 代替σ. 选择检验统计量 nS X T /0μ-=,当0H 成立时,)1(~-n t T .给定显著性水平α,由t 分布分位点的定义, 有αα=->)}1(|{|2/n t T P ,故拒绝域)}1({)}1({)}1(|{|2/2/2/->--<=->=n t T n t T n t T W ααα , 这种利用服从t 分布的检验统计量的检验方法称为t 检验法.例2 某切割机工作正常时,切割每段金属棒的平均长度为10.5cm .今在某段时间内随机地抽取15段进行测量,其结果如下(cm):10.4 10.6 10.1 10.4 10.5 10.3 10.3 10.2 10.9 10.6 10.8 10.5 10.7 10.2 10.7问此段时间内该机工作是否正常(5.00=α)?假设金属棒长度服从正态分布.解 依题意,检验假设0100.510μμμμ≠==:;:H H , 由于2σ未知,故选择检验统计量nS X T /0μ-=.在0H 下,)1(~-n t T ,15=n .给定显著性水平5.00=α,查t 分布表, 得临界值1448.2)14()1(025.02/==-t n t α,故拒绝域)}1(|{|2/->=n t T W α.由已知条件可得48.102.15715111=⨯==∑=n i i x n x056.0784.0141)(11122=⨯=--=∑=n i ix x n s 故2366.0=s .计算统计量的值3274.015/2366.05.1048.10/0-=-=-=ns x t μ因为)1(||2/-<n t t α,所以接受0H ,认为切割机工作正常.例3 设木材的小头直径),(~2σμN X ,12≥μcm 为合格,今抽出12根测得小头直径的样本均值为2.11=x cm ,样本方差为44.12=s cm 2,问该批木材是否合格(5.00=α)?解 依题意,检验假设010012μμμμ<=≥:;:H H ,选择检验统计量nS X T /0μ-=.在假设0100μμμμ<=:;:H H 下,)1(~-n t T ,12=n .给定显著性水平5.00=α,查t 分布表,得临界值7959.1)11()1(05.0==-t n t α,故拒绝域)}1({--<=n t T W α,也是假设010012μμμμ<=≥:;:H H 的拒绝域. 由于2.11=x ,44.12=s ,计算统计量的值3094.212/44.1122.11/0-=-=-=ns x t μ因为)1(--<n t t α,故拒绝0H ,认为该批木材是不合格的. 二、正态总体方差的检验——2χ检验法设n X X X ,,, 21为来自总体),(2σμN 的一个样本,检验假设 20212020σσσσ≠=:;:H H .1.均值μ已知. 因为)1,0(~N X i σμ-,n i ,,2,1 =,则选取检验统计量∑∑==-=⎪⎪⎭⎫ ⎝⎛-=ni ini i XX 12201202)(1μσσμχ.当0H 成立时,)(~22n χχ,给定显著性水平α,由2χ分布表分位点的定义,有αχχχχαα=><-))}(())({(22/222/12n n P ,故得拒绝域)}({)}({22/222/12n n W ααχχχχ><=- .2.均值μ未知.因为X 是总体均值μ的无偏估计量,用X 代替μ.选择检验统计量202122)1(σσχS n XX ni i -=⎪⎪⎭⎫ ⎝⎛-=∑=. 当0H 成立时,)1(~22-n χχ,给定显著性水平α,由2χ分布表分位点的定义,有αχχχχαα=->-<-))}1(())1({(22/222/12n n P故得拒绝域)}1({)}1({22/222/12->-<=-n n W ααχχχχ .类似地,在μ已知和μ未知时,可以求出检验假设20212020σσσσ>≤:;:H H 和20212020σσσσ<≥:;:H H的拒绝域.例如,在μ未知时,检验假设2020σσ≤:H 的拒绝域为)}1({22->=n W αχχ.上述检验所用的检验统计量均服从2χ分布,称这种检验方法为2χ检验法例4 某无线电厂生产的一种高频管,其中一指标服从正态分布),(2σμN ,今从一批产品中抽取8只管子,测得指标数据:68 43 70 65 55 56 60 72(1) 总体均值60=μ时,检验228=σ(取5.00=α); (2) 总体均值μ未知时,检验228=σ(取5.00=α). 解 本题是在显著性水平5.00=α下,检验假设2021220208σσσσ≠==:;:H H ,这里8=n .(1) 60=μ已知时临界值35.517)8()(2025.022/==χχαn ,80.12)8()(2975.022/1==-χχαn ,而检验统计量的值359.10663641)(811222=⨯=-=∑=ni i x μχ, 由于)()(22/222/1n n ααχχχ<<-,故接受0H .(2) μ未知时临界值13.016)7()1(2025.022/==-χχαn ,90.61)7()1(2975.022/1==--χχαn ,而125.614898111=⨯==∑=n i i x n x ,875.652)()1(122=-=-∑=ni i x x s n ,检验统计量的值2012.1075.86526412=⨯=χ, 由于)1()1(22/222/1-<<--n n ααχχχ,故接受0H .§8.3 两个正态总体参数的假设检验设121n X X X ,,, 为总体),(~112σμN X 的一个样本,221n Y Y Y ,,, 为总体),(~222σμN Y 的一个样本.∑==1111n i i X n X 和∑==2121n i iYn Y 分别是两个样本的样本均值,∑=--=112121)(11n i i X X n S 和∑=--=212222)(11n i i Y Y n S 是相应的两个样本方差.设这两个样本相互独立..一、两个正态总体均值的检验考虑检验假设 211210μμμμ≠=:;:H H . 1.方差21σ与22σ已知——u 检验法. 选取 22212121)()(n n Y X U σσμμ+---=.当0H 成立时,检验统计量)1,0(~222121N n n YX U σσ+-=.给定显著性水平α,由标准正态分布表分位点的定义,有αα=>}|{|2/u U P ,故拒绝域}{}{}|{|2/2/2/αααu U u U u U W >-<=>= .例1 设从甲乙两场所生产的钢丝总体X ,Y 中各取50束作拉力强度试验,得1208=x ,1282=y ,已知801=σ,942=σ,请问两厂钢丝的抗拉强度是否有显著差别(5.00=α)?解 本题是在显著性水平5.00=α下, 检验假设211210μμμμ≠=:;:H H , 这里5021==n n .选取检验统计量222121n n YX U σσ+-=.给定显著性水平05.0=α,查标准正态分布表,得临界值96.1025.02/==u u α,故拒绝域}|{|2/αu U W >=.由于1208=x ,1282=y ,801=σ,942=σ, 计算检验统计量的值2392.450/)(2221-=+-=σσy x u .由于2/||αu u >,故拒绝0H ,认为两厂钢丝的抗拉强度有显著差别. 2.方差21σ与22σ未知,但2221σσ=——t 检验法.选取 212111)()(n n S Y X T w+---=μμ.这里2)1()1(21222211-+-+-=n n S n S n S w .当0H 成立时,检验统计量)2(~112121-++-=n n t n n S Y X T w.给定显著性水平α,由t 分布表分位点的定义, 有αα=-+>)}2(|{|212/n n t T P ,故拒绝域)}2({)}2({212/212/-+>-+-<=n n t T n n t T W αα .例2 某烟厂生产两种香烟,独立地随机抽取样本容量相同的烟叶标本测其尼古丁含量的毫克数,分别测得:甲种香烟:25 28 23 26 29 22 乙种香烟:28 23 30 25 21 27假定尼古丁含量都服从正态分布且具有公共方差,在显著性水平5.00=α下,判断两种香烟的尼古丁含量有无显著差异?解 检验假设211210μμμμ≠=:;:H H ,这里621==n n ..525=x ,67.625=y ,7386.21=s ,3267.32=s ,0469.3=w s . 选取检验统计量2111n n S Y X T w+-=.给定显著性水平5.00=α,查t 分布表,得临界值2281.2)10()2(025.0212/==-+t n n t α,故拒绝域)}2(|{|212/-+>=n n t T W α.计算统计量的值0949.00469.33)667.255.25(1121-=⨯-=+-=n n s y x t w.由于)2(||212/-+<n n t t α,故接受0H ,认为两种香烟的尼古丁含量无显著差异. 二、两个正态总体方差的检验——F 检验法 考虑检验假设 2221122210σσσσ≠=:;:H H . 1.均值1μ与2μ已知.因为)(~)(11212121211n Xn i iχμσχ∑=-=,)(~)(12212222222n Yn i iχμσχ∑=-=,选取221222211211222121/)(1/)(1//21σμσμχχ∑∑==--==n i i n i i Y n X n n n F . 当0H 成立时,检验统计量),(~)(1)(1211222121121n n F Y n X n F n i i n i i ∑∑==--=μμ.给定显著性水平α,由F 分布分位点的定义,有ααα=><-))},(()),({(212/212/1n n F F n n F F P , 故得拒绝域)},({)},({212/212/1n n F F n n F F W αα><=- . 2.均值1μ与2μ未知.因为)1(~)1()(112212111221211--=-=∑=n S n X X n i i χσσχ,)1(~)1()(122222221222222--=-=∑=n S n Y Yn i iχσσχ,选取22222121222121//)1/()1/(σσχχS S n n F =--=.当0H 成立时,检验统计量)1,1(~212221--=n n F S S F .给定显著性水平α,由F 分布分位点的定义,有ααα=-->--<-))}1,1(())1,1({(212/212/1n n F F n n F F P , 故得拒绝域)}1,1({)}1,1({212/212/1-->--<=-n n F F n n F F W αα .例3某烟厂生产两种香烟,独立地随机抽取样本容量相同的烟叶标本测其尼古丁含量的毫克数,分别测得:甲种香烟:25 28 23 26 29 22 乙种香烟:28 23 30 25 21 27假定尼古丁含量都服从正态分布且具有公共方差,在显著性水平5.00=α下,判断两种香烟的尼古丁含量的方差是否相等? 解 考虑检验假设2221122210σσσσ≠=:;:H H . 由于两个正态总体的均值都未知,选取检验统计量)1,1(~212221--=n n F S S F .给定显著性水平α,查F 分布表,得两个临界值:15.7)5,5()1,1(025.0212/==--F n n F α1399.015.71)5,5(1)5,5()1,1(025.0975.0212/1====---F F n n F α,故得拒绝域}15.7{}1399.0{><=F F W . 计算统计量的值6777.03267.37386.2222221===s s F .由于15.71399.0<<F , 故接受0H ,认为两种香烟的尼古丁含量的方差也无显著差异.§8.4 非正态总体参数的大样本检验本节讨论一般总体参数的检验.设总体X 的均值为μ,方差为2σ, n X X X ,,, 21为总体X 的一个样本.由中心极限定理可知,当样本容量n 足够大时,nX U /σμ-=近似地服从标准正态分布.因此,我们可以用正态分布去近似.如果对均值μ进行检验,方差2σ未知时,可以用样本方差2S 代替2σ;如果对方差2σ进行检验,均值μ未知时,可以用样本均值X 代替μ.下面举两个例子.例1 设某段高速公路上汽车限速为104.6km/h ,现检验85辆汽车的样本,测出的平均车速为106.7km/h ,已知总体标准差为.413=σ km/h ,但不知总体是否服从正态分布.在显著性水平50.0=α下,试检验高速公路上的汽车是否比限制速度104.6km/h 显著地快?解 依题意,检验假设0100.6104μμμμ>=≤:;:H H , 由于.413=σ已知,n =85足够大, 选择检验统计量nX U /0σμ-=近似地服从)10(,N .其拒绝域}{αu U W >=,其中65.105.0==u u α. 计算U 的值449.4185/4.136.1047.106=-=u ,由于αu u <,因此接受0H ,没有理由认为高速公路上的汽车比限制速度104.6km/h 显著地快.例2 为比较甲乙两种小麦植株的高度(单位:cm),分别抽得甲、乙小麦各100穗,在相同条件下进行高度测定,算得甲乙小麦样本均值和样本方差分别为28=x ,8.3521=s ,26=y ,3.3222=s ,问这两种小麦的株高有无显著差异(50.0=α)?解 依题意,检验假设 211210μμμμ≠=:;:H H , 选取 22212121)()(n n Y X U σσμμ+---=,这里两个方差用样本方差代替.当0H 成立时, 检验统计量 222121n Sn S Y X U +-=近似地服从)1,0(N .给定显著性水平05.0=α,查附表3,得临界值96.1025.02/==u u α, 得拒绝域}|{|2/αu U W >=.计算U 的值4236.21003.328.352628=+-=u ,由于αu u >,因此拒绝0H ,认为这两种小麦的株高有显著差异.当总体服从(0-1)分布),1(p b 时,由于只有一个参数p ,总体均值p 和方差)1(p p -均只与p 有关,这时对参数p 进行假设检验时,检验统计量可以直接用样本和参数p 表示出来.例3 某厂有一批产品须经检验后方可出厂.按规定二级品率不得超过10%,从中随机抽取100件产品进行检查,发现有二级品14件,问这批产品是否可以出厂(50.0=α)?解 这里n =100,14.0=x .检验假设01001.0p p H p p H >=≤:;:, 选取检验统计量 np p p X U )1(000--=,U 近似地服从)1,0(N .由显著性水平50.0=α,可以得到拒绝域}{αu U W >=,其中65.105.0==u u α,计算U 的值333.31100.90.10.104.10=⨯-=u ,由于αu u <,因此接受0H ,认为这批产品二级品率没有超过10%,可以出厂.§8.5 分布的拟合检验前几节的检验都是参数的检验.实际问题中,有时需要对分布作出假设,进行检验.本节只介绍一种分布的检验方法——皮尔逊2χ检验法,它只适合于大样本的情形,一般要求样本容量50≥n .设总体X 的分布函数为)(x F ,)(0x F 为一个已知的分布函数,n X X X ,,, 21为总体X 的一个样本,我们来检验关于总体分布的假设)()()()(0100x F x F H x F x F H ≠=:;:.一、基本原理2χ检验法的基本思想是:将随机试验的所有可能结果的全体分成k 个两两互不相容的事件k A A A ,,, 21,在n 次试验中,将i A 发生的次数i f 叫做i A 发生的频数,如果0H 为真,则由大数定律,在n 次试验中(n 足够大),i A (k i ,,, 21=)出现的实际频率nf i与理论频率)(i i A P p =(可由分布函数)(0x F 算出)不应相差很大.基于这种想法,皮尔逊构造了统计量∑=-=ki i i i np np f 122)(χ或∑=-=ki i i i p n p n f 122ˆ)ˆ(χ, 其中i p ˆ是由)(ˆ0x F 计算出来的理论频率,)(ˆ0x F 是)(0x F 中未知参数估计出后的分布函数,并证明了如下定理:定理1 若n 足够大,当0H 成立时,统计量2χ总是近似地服从自由度为1--r k 的2χ分布,其中r 是已知的分布函数)(0x F 中未知参数的个数.直观上看,2χ值表示实际观测结果与理论期望结果的相对差异的总和,当它的取值大于临界值时,应拒绝0H . 二、检验步骤如果)(0x F 为不带有未知参数的已知分布,皮尔逊2χ检验法的具体步骤如下: (1) 将总体X 的值域划分成k 个不交的区间i A (k i ,,, 21=),使得每个区间包含的理论频数满足5≥i np ,否则将区间适当调整; (2) 在0H 成立时,计算各理论频率即概率i p 的值:)()()(100--==i i i i y F y F A P p ,k i ,,, 21=.这里1-i y 与i y 为区间i A 的端点,即](1i i i y y A ,-=;(3) 数出i A 中含有样本值的个数,即i A 的频数i f ,并计算统计量∑=-=ki ii i np np f 122)(χ 的值2χ;(4) 由2χ分布,对于给定的显著性水平α,找出临界值)1(2-k αχ; (5) 判断:若)1(22->k αχχ,则拒绝0H ,否则可接受0H . 如果总体X 是离散型的,则假设0H 相当于假设总体X 的概率分布00}{i i p x X P H ==:, ,,21=i .如果总体X 是连续型的,则假设0H 相当于)()(00x f x f H =:,这里)(x f 为总体的概率密度.例1 至1984年底,南京市开办有奖储蓄以来,13期兑奖号码中诸数码的频数汇总如表8.1:表8.1试检验器械或操作方法是否有问题(50.0=α).解 设抽取的数码为X ,它可能的取值为0~9,如果检验器械或操作方法没有问题,则0~9出现是等可能的,即检验假设 1010=i p H :,9210,,,, =i ,这里}{i X P p i ==. 依题意知k =10,令}{i A i =,9210,,,, =i ,n =350,则理论频数35=i np .57.61935688)(922==-=∑=i i i i np np f χ给定显著性水平5.00=α,查2χ分布表,得临界值9.16)9()1(205.02==-χχαk .由于19.675>16.9,故拒绝0H ,即认为器械或操作方法有问题.如果)(0x F 为带有未知参数的已知分布,未知参数为r θθθ,,, 21,这时用这r 个未知参数的极大似然估计量r θθθˆˆˆ21,,, 来代替)(0x F 中的参数r θθθ,,, 21,得到分布函数)(ˆ0x F ,然后建立统计量∑=-=ki i i i p n p n f 122ˆ)ˆ(χ, 这里i p ˆ是由)(ˆ0x F 计算出来的理论频率,再用以上检验步骤进行检验,但此时检验统计量2χ近似服从)1(2--r k χ分布(这里k >r +1).例2 某高校对100名新生的身高(厘米)做了检查,把测得的100个数据按由大到小的顺序排列,相同的数合并得表8.2:表8.2试问,在显著性水平5.00=α下是否可以认为学生身高X 服从正态分布? 解 这里n =100,我们来检验假设222)(021)(σμσπ--=x ex f H :,+∞<<∞-x ,这里)(x f 为正态分布),(2σμN 的概率密度,设其分布函数为)(x F ,μ与0>σ为未知参数.先求μ与2σ的极大似然估计值μˆ,2ˆσ: 33.1661ˆ1==∑=n i i x n μ, 06.28)ˆ(1ˆ212=-=∑=μσn i i x n . 设服从正态分布)ˆ,ˆ(2σμN 的随机变量为Y ,分布函数为)(ˆy F .按照分组要求,每个小区间的理论频数i pn ˆ不应小于5,因此我们将数据分成了7个组,使得每组的实际频数不小于5,各计算结果如下表8.3所示.表8.3中第3列i pˆ的计算如下: )(ˆ)(ˆ}{ˆ11---=≤<=i i i i i y F y F y Y y P p ,7210,,,, =i , 例如,}06.2833.1665.164ˆˆ06.2833.1665.161{}5.1645.161{ˆ3-≤-<-=≤<=σμY P Y P p1837.0)911.0()345.0(=-Φ--Φ=.给定显著性水平5.00=α,查2χ分布表,得临界值488.9)4()127()1(205.0205.02==--=--χχχαr k .由于1.8843<9.488,故接受0H ,即认为学生身高服从正态分布.。

相关文档
最新文档