第6章 假设检验

合集下载

第六章 假设检验2006

第六章 假设检验2006

第六章参数假设检验假设检验(test of hypothesis)亦称显著性检验(test of statistical significance),就是先对总体的参数或分布做出某种假设,如假设两个总体均数相等,总体服从正态分布或两总体分布相同等,然后用适当的统计方法计算某检验统计量,根据检验统计量的大小来推断此假设应当被接受或拒绝,它是统计推断的另一重要方面。

假设检验可以分为两类:一类是已知总体分布类型,对其未知总体参数的假设作假设检验,称为参数检验(parametric test),主要讨论总体参数(均值、方差、总体率等)的检验;另一类是对未知总体分布类型的总体假设作假设检验,称为非参数检验(non-parametric test),主要包括总体分布形式的假设检验、随机变量独立性的假设检验等。

本章主要介绍有关总体参数(均值、方差、总体率等)的参数检验问题。

第一节假设检验的基本概念一、假设检验问题及基本原理(一)假设检验问题我们先来看个具体的例子。

例6.1某药厂用自动包装机包装葡萄糖,按规定每袋葡萄糖的标准重量为500克,若已知包装机包装的每袋葡萄糖重量服从正态分布,且按以往标准知总体方差σ2=6.52,某日开工后,为检验包装机工作是否正常,随机抽取6袋葡萄糖,测得其平均重量x=504.5(克),问该日自动包装机包装的平均重量是否还是500克?某日随机抽取的6袋葡萄糖的平均重量x=504.5(克),与标准重量500克相比差4.5克,造成该差异的原因有两种可能:①这日自动包装机工作正常,其包装的总体平均重量μ=500克,此6袋葡萄糖的平均重量这一样本均值与总体均值不同,是随机抽样误差造成的;②这日自动包装机工作不正常,其包装的总体平均重量μ≠500克,故从此总体中随机抽取的6袋葡萄糖的平均重量与标准重量存在实质性差异,而不仅仅是抽样误差造成的。

上述两种可能是相互对立的、互不相容的,究竟哪一种可能是对的,可用假设检验的方法来判断。

第6章 假设检验

第6章 假设检验

×
样本均数 分布未知
样本均数服从 t分布
( X-t / 2 ( ) .S X, X+t / 2 ( ) .S X )

样本均数服从 正态分布

N ( , 2 / n)
N ( , S 2 / n)
( X-u / 2 . X, X+u / 2 . X )
( X-u / 2 .S X, X+u / 2 .S X )
时,当P值在检验水准α 附近时,应慎重做结论。

α 是犯Ⅰ型错误的最大概率,P是犯Ⅰ型错误的实际概率。
3.假设检验的统计意义

假设检验的实际意义

不管是接受还是拒绝零假设都未必有实际意义; 拒绝零假设时,即使P值很小,总体之间差异可能很小,不具有
实际意义;

接受零假设时,不代表总体之间没有差异,可能由于样本量过 小,“证据不足”,“补充证据”后,仍可能拒绝零假设;
样本均数 分布未知
×
样本均数服从 正态分布
Ⅳ N
σ 已知? Y
u
X
X
X X / n S/ n
样本均数服从 t分布
样本均数服从 正态分布
N ( , / n)
2

N ( , S 2 / n)
样本均数与总体 均数比较 (大样本:u检验) (小样本:?检验)
两样本均数比较

若小概率事件发生了,则我们犯了经验主义错误;
因为小概率事件发生可能性为α ,则我们犯经验主义错 误的概率为α ,这种错误称为Ⅰ型ห้องสมุดไป่ตู้误。

若小概率事件没有发生,接受零假设时,还是有可能犯错
误,这时候错误是教条主义,称为Ⅱ型错误。

统计学第六章假设检验

统计学第六章假设检验

10
即 z 拒绝域,没有落入接受域,所以没有足够理由接受原假设H0, 同
时,说明该类型电子元件的使用寿命确实有了显著的提高。
第六章 假设检验
1. 正态总体均值的假设检验
(2) 总体方差 2 未知的情形
双侧举例:【例 6-6】某厂用生产线上自动包装的产品重量服从正态
分布,每包标准重量为1000克。现随机抽查9包,测得样本平均重量为
100个该类型的元件,测得平均寿命为102(小时), 给定显著水平α=0.05,
问,该类型的电子元件的使用寿命是否有明显的提高?
解:该检验的假设为右单侧检验 H0: u≤100, H1: u>100
已知 z z0.05 1.645
zˆ x u0 n 100 (102 100 ) 2 1.645
986克,样本标准差是24克。问在α=0.05的显著水平下,能否认为生产线
工作正常? 解:该检验的假设为双侧检验 H0: u=0.5, H1: u≠0.5
已知 t /2 (n 1) t0.025 (9 1) 2.306, 而 tˆ x u 986 1000 1.75 可见 tˆ 1.75 2.306
设H0, 同时,说明该包装机生产正常。
其中 P( Z 1.8) 1 P( Z 1.8) 1 0.9281 0.0719 0.05。
第六章 假设检验
单侧举例:【例 6-4】某电子产品的平均寿命达到5000小时才算合格,
现从一批产品中随机抽出12件进行试验,产品的寿命分别为
5059, 3897, 3631, 5050, 7474, 5077, 4545, 6279, 3532, 2773, 7419, 5116
的显著性水平=0.05,试测算该日生产的螺丝钉的方差是否正常?

第六章 假设检验

第六章 假设检验
8
依据实际问题,建立原假设 H和0 备选假设 H1
确定检验统计量,确定该统计量的抽样分布
给定显著性水平α,查表得临界值,因此确定拒绝 的区H间0 范围(拒绝域)
据样本观察值计算统计量,
做出决策是接受原假设 H,0 还是拒绝原假设 H 0
9
H真0 实 不H 0 真实
接受 H 0
拒绝 H 0
40
一个假设检验问题的结论是简单的,给定显著性 水平,不是拒绝原假设,就是接受原假设,但是 有可能存在如下情况:在显著性水平α=0.05时拒 绝了原假设,但在显著性水平α=0.01下保留原假 设。因为降低显著性水平会导致拒绝域缩小,这 样原来落在α=0.05的拒绝域中的检验统计量的观 察值有可能落在α=0.01到接受域中。由此提出p值检验。
42
(一)z检验的p-值:
检验统计量为z统计量的p-值计算公式,z 0表示检
验统计量的抽样数据,则p-值的计算方法如下:
如果: H 1 , 0p-值=
pz z0
如果: H 1 , 0p-值= 如果: H 1 ,0 p-值=
p z z0 p z z0
例6:利用p-值检验重新检验例1。 解: 第一、第二步与例1完全相同,故省略之。 第三步:计算样本统计的数值。 样本平均数 X 2,48n=50,代入检验统计量得:
26
解:此题为右侧检验。 第一步,建立假设
H0 : , 100 H1 : 100
第二步,确定检验统计量及其分布
z X 0 ~ N 0,1
n
第三步,确定临界值,右单侧检验临界值 α=0.05,查标准正态分布表得临界值:
显著性水z平
z=1.645,拒绝域是z>1.645。
27

第6章 假设检验

第6章 假设检验

三、假设检验中的相关概念
(一)原假设和备择假设 1、原假设和备择假设的定义



原假设:假设检验中,通常将所要检验的假 设称为原假设,也称为零假设,用H0表示。 备择假设:原假设的对立假设称为备择假设 或备选假设,用H1表示。

例如:设μ 0为总体均值μ 的某一确定值。
0
1.检验总体均值μ 是否等于某一确定值μ
2、原假设和备择假设的形式
(双侧检验和单侧检验)

若原假设是总体参数等于某一数值,

如H0:μ=μ0 ;H1:μ≠μ0。
这种假设检验称为双侧检验 若原假设是总体参数大于等于或小于等于某一数值, 如H0:μ≥μ0 ;H1:μ<μ0 或H0 :μ≤μ0 ;H1:μ>μ0

这种假设检验称为单侧检验。又分为左侧检验和右侧检验。
一、总体均值的检验
(一)提出假设
1. 双侧检验:H0 : m =m0;H1 : m m0
2. 3.
左侧检验:H0 : m m0;H1 : m <m0 右侧检验:H0 : m m0 ;H1 : m >m0
一、总体均值的检验
(二)选择检验统计量,并确定其分布形式

样本容量n
否 是
小(正态总体)
设检验。
一、什么是假设检验


参数假设检验 指对总体分布函数中的未知参数提出某种 假设,然后利用样本信息对所提的假设进 行检验并做出判断的过程。 非参假设检验 指对总体分布函数形式等的假设进行检验 的过程。
参数假设检验实例
例1:某公司进口一批钢筋,根据要求,钢筋的 平均拉力强度不能低于2000克,而供货商强 调其产品的平均拉力强度已达到了这一要求, 这时需要进口商对供货商的说法是否真实作出 判断。进口商可以先假设该批钢筋的平均拉力 强度不低于2000克,然后用样本的平均拉力 强度来检验假设是否正确。

卫生统计学课件_第六章_假设检验

卫生统计学课件_第六章_假设检验
16
公式:t
自由度:对子数 - 1
适用条件:两组配对计量资料。 例题:p. 34, 例8
三、两个小样本均数比较的 t 检验
▲目的:由两个样本均数的差别推断两样本
所代表的总体均数间有无差别。 ▲计算公式及意义: t 统计量: 自由度:n1 + n2 –2
18
▲ 适用条件:
(1)已知/可计算两个样本均数及它们的标准差 ;
38
(2)当不能拒绝
II 类错误的概率 β 值的两个规律:
1. 当样本量一定时, α 愈小, 则 β 愈大,反之…; 2.当 α 一定时, 样本量增加, β 减少.
39
4. 正确理解P值的意义, P值很小时“拒绝H0 ”,P值的
大小不要误解为总体参数间差异的大小; 拒绝H0 只是说 差异不为零。 统计学中的差异显著或不显著,和日常生活中所说的差 异大小概念不同. (不仅区别于均数差异的大小,还区别 于均数变异的大小)
统计推断
用样本信息推论总体特征的过程。
包括:
参数估计: 运用统计学原理,用从样本计算出来的统计
指标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差
别对样本所代表的总体间是否存在着差别做出判断。
第一节
▲显著性检验;
假设检验
▲科研数据处理的重要工具;
▲某事发生了:
是由于碰巧?还是由于必然的原 因?统计学家运用显著性检验来 处理这类问题。
45
41
是非判断: ( )1.标准误是一种特殊的标准差,其 表示抽样误差的大小。 ( )2.N一定时,测量值的离散程度越 小,用样本均数估计总体均数的抽样误差 就越小。 ( )3.假设检验的目的是要判断两个样 本均数的差别有多大。

第六章 假设检验

第六章 假设检验

,接受 H 1 。表明在
第二节 总体均值的假设检验
(二)总体为非正态分布或分布未知 当总体分布为非正态分布且大样本时,检验的 X 统计量为 Z
0
/
n

在“原假定成立”的条件下,只要样本容量充分 大(一般习惯上要求 n≥30),它近似服从标准正 态分布。 如果标准差σ未知,只需用样本标准差S作为它 的估计量代替式中的 σ即可,这时检验统计量为

检验统计量服从t分布与其服从标准正态分布的检验结论判断方法一致
例6.3 某厂购买了一台新的生产机器,生产零件的长度规定为10厘米。为了 检验机器的性能是否良好,质检员随机抽取了25件产品,测得其平均长度为9.8厘 米,标准差为0.4厘米。假设生产的零件长度服从正态分布,问在显著性水平 =0.05时,该机器的性能是否良好。 2 解:设 X 表示该机器生产零件的长度,则有 X ~ N (, ),样本容量n=25,样本 均值 x =9.8厘米,样本标准差 s 0.4 厘米。根据问题提出的假设为: H0 : 0 =10厘米; H 1 : 0 =10厘米 这是一个双侧检验问题,因为总体服从正态分布但总体方差未知,用检验的小 样本数据检验,故当 H 0 成立时,检验统计量为: x 0
t
s n
规定显著性水平为 =0.05,查表得到临界值 t / 2(24) 2.064 ,所以原假设的否 定域为:t 2.064 。 计算检验统计量的值: t x 0 9.8 10 2.5
s 0.4 n 100
因为 |-2.5|=2.5>2.064,落在否定域,所以否定 H 0 显著性水平 =0.05时,不能说该机器的性能良好。 互动地带 6-11
第Ⅱ类错误,也称取伪错误 本来是非真的,却根据检验统计量的值把它给接受了。 发生这种错误的概率通常用 表示,即 P(接受H 0 / H 0非真) 在样本容量一定时,犯两种错误的风险是彼此消长的。两者要同时得到控制只 有增加样本容量。在样本容量受限时,通常根据研究问题的性质决定重点控制 第一类错误的风险还是控制第二类错误的风险。

第六章假设检验

第六章假设检验
当我们把真实的原假设当成假的加以拒绝, 称为第一类错误,也称弃真错误、α错误,犯 第一类错误的概率就是显著性水平α;当我们 把不真实的原假设当作真的加以接受,称为第 二类错误,也称取伪错误、β错误,犯第二类 错误的概率是不确定的。
α也称为生产者风险:在生产者将产品售给消费者时,通常 要进行产品的质量检验,原假设总是产品是合格的,但是检验 时生产者总是担心把合格品检验为不合格品,也就是第一类错 误α,所以α也称为生产者风险。 β也称为消费者风险:在消费者一方总恐怕把不合格品检验 不出来而当作合格品接受,因而β也称为消费者风险。
(二)未知总体分布及总体方差,大样本 1.检验总体均值的统计量
(三)总体为正态分布、方差未知、小样本 1. 检验统计量
2. 拒绝域的临界值 可以根据双侧检验还是单侧检验来确定拒绝域的 临界值。当为双侧检验,显著性水平a时,临界值 为 ;当为右侧检验时,显著性水平a,监界值 为 ;当为左侧检验时,显著性水平为a,临界值 为- 。
备择假设,常用H1表示。即原假设被否定之 后而采取的逻辑对立假设。
(二)检验统计量
有了两个假设,就要根据数据来对他们进行判 断。数据的代表是作为其函数的统计量,对样 本数据进行加工并用来判断是否接受原假设的统计 量称作检验统计量 统计量最常用的是Z统计量、t统计量。
统计量的选择要根据研究的参数及其估计量 的分布、抽样的方式、总体方差是否已知等多种 因素来确定
第四步:确定决策规则。拒绝或没有拒绝原假设的决 策是建立在由样本数据来进行统计检验并将其与假设 的抽样分布比较。抽样分布被分成两个部分,拒绝域 和非拒绝域。如果原假设是真实的,那么统计检验不 可能落入拒绝域。因此,如果统计检验落入了拒绝域, 我们拒绝原假设;否则,我们不能拒绝它。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2
2
n2 7.5 2 / 120 6.3 2 / 153 0.8533
u
X1 X 2 s X1X 2

139.9 143.7 0.8533
4.4353 u 0.05 2.58
P<0.01,差别有统计学意义,可认为该市1993年12岁男童平均身高比1973年高。
假设检验应注意的问题
t 检 验
样本均数与总体均数的比较

目的:推断该样本是否来自某已知总体; 样本均数代表的总体均数与0是否相等。

总体均数0一般为理论值、标准值或经大量观察所得并为人们接
受的公认值、习惯值。

解决思路:

区间估计

判断样本信息估计的总体均数之可信区间是否覆盖已知的 总体均数0 ?若不覆盖,则可推断该样本并非来自已知均 数的总体。
样本信息不支持H0,便拒绝之并接受H1,否则不拒绝H0 。
假设检验的基本步骤

建立假设 确定检验水准 计算检验统计量 计算概率P 结论

当P≤ 时,拒绝H0,接受H1,差别有统计学意义。
当P> 时,不拒绝H0,差别尚无统计学意义。
不论,拒绝拒绝H0,还是不拒绝H0都可能范错误。
同?
μ0 =132(g/L)
n=25
? =
μ
X 150 ( g / L) S 16.5( g / L)
已知总体
未知总体

目的:推断病人的平均血红蛋白(未知总体均
数)与正常女性的平均血红蛋白(已知总体均
数0)间有无差别
μ =μ0 ?
X 0 150 132 18

手头样本对应的未知总体均数 μ等于已知总体均数μ0,
在两个样本均数比较时,若两组样本含量都很大,可用u检验,其计 算公式为:
X1 X 2 u s X 1 X 2
X1 X 2 s12 n1 s 2 2 n2
u为标准正态离差,按正态分布界定P值并作出结论 。
例6.5 某市于1973年和1993抽查部分12岁男童对其发育情况进行评估, 其中身高的有关资料如下,试比较这两个年度12岁男童身高均数有无 差别。
配对设计的形式

自身配对

同一对象接受两种处理,如同一标本用两种方法进行检验, 同一患者接受两种处理方法;

异体配对

将条件相近的实验对象配对,并分别给予两种处理。

若两处理因素的效应无差别,差值d的总体均
数d应该为0,故可将该检验理解为样本均数 与总体均数d =0的比较

差值均数的大小及其抽样误差反应因素的效应

允许误差。医学研究中一般取=0.05 。

检验水准实际上确定了小概率事件的判断标准。
选定检验方法计算检验统计量
(计算样本与总体的偏离)
t

X 0 s n
统计量t表示,在标准误的尺度下,样本均数与总体 均数0的偏离。这种偏离称为标准t离差。

根据抽样误差理论,在H0假设前提下,统计量t服 从自由度为n-1的t分布,即t值在0的附近的可能性 大,远离0的可能性小,离0越远可能性越小。
H0:d=0,两仪器检验结果相同; H1:d≠0,两仪器检验结果不同。
双侧 =0.05。
t
d sd n
ห้องสมุดไป่ตู้
17.17 40.33/ 12
1.48
按 = n-1=12-1=11查t值表,得t0.20,11=1.363,t0.10,11=1.796,
t0.10,11>t>t0.20,11,则0.20>P>0.10,差别无统计学意义,尚
H1 :1≠2 ,正常人与病毒性肝炎患者的转铁蛋白含量不等。 双侧 =0.05。
t
271.89 235.21 163.3679 1 12 1 15
7.402
=n1+n2-2=12+15-2=25
按自由度 25 查附表 2 , t 界值表得 t0.001,25=3.725 , t > t0.001,25 , P < 0.001 ,差别 有统计学意义,可以认为病毒性肝炎患者的转铁蛋白含量较低。
差别仅仅是由于抽样误差所致;

除抽样误差外,病人与正常人存在本质上的差异
建立假设 (在假设的前提下有规律可循)

零假设(null hypothesis),记为H0

H0:=132,病人与正常人的平均血红蛋白含量相等;

备择假设(alternative hypothesis),记为H1

H1:≠132,病人与正常人的平均血红蛋白含量不等。
结论(根据小概率原理作出推断)

在H0成立的前提下出现现有差别或更大差别的可能性P(| t | ≥5.4545)小于0.05,是小概率事件,即现有样本信息不支持H0。 抉择的标准为:


当P≤ 时,拒绝H0,接受H1

当P> 时,不拒绝H0

本例P<0.05,按 =0.05的水准,拒绝H0,接受H1,差别有统计 学意义。认为该病女性患者的Hb含量高于正常女性的Hb含量。
两组乳猪脑组织钙泵含量( g/g) 实验组 0.2755 0.2545 0.1800 0.3230 0.3113 0.2955 0.2870 差值 d 0.0795 -0.0545 0.1330 0.0400 0.0431 0.0495 0.0180 0.3086 d2 0.006320 0.002970 0.017689 0.001600 0.001858 0.002450 0.000324 0.033211

t值越小,越利于H0假设 t值越大,越不利于H0假设
t
X 0 s n

150 132 16.5 25
5.4545
计算概率P(与统计量t值对应的概率)

在H0成立的前提下,获得现有这么大的标准t
离差以及更大离差 的可能性。
P=P(|t|≥5.4545) ?
按 =25-1=24查附表2t界值表
1973 年:n1=120 =139.9cm s1=7.5cm; 1993 年:n2=153 =143.7cm s2=6.3cm。
H0 :1=2,即该市两个年度12岁男童平均身高相等; H1 :1≠2,即该市两个年度12岁男童平均身高不等。
双侧 =0.05。
s X 1 X 2 s1 n1 s 2
假设检验中需注意的几个问题

建立假设

“假设”是对总体特征的表述 H0与H1并非并列,而是以H0为主
H0与H1的表述随资料性质、分析目的和检验方法而定。
假设检验中需注意的几个问题

验证假设

各种检验方法都以统计量的分布为依据 检验统计量与H0密切相关:H0条件下产生了检验统计量t的概率分


反证法推理 :在H0条件下,抽得现有样本统计量的概率(P)很小, 就认为样本数据与H0假设有矛盾,且这种矛盾不能用抽样误差来
解释,所以可认为该样本来自H1假设,则接收H1;反之……。

判断水准 必须事先确定,一般取0.05。 P值

P值是决策的依据 P≤0.05 及其意义:首先P不指H0成立之可能,而是指从H0假设总体中 随机抽到差别至少等于现有差别的机会。
例6.2 现用两种测量肺活量的仪器对12名妇女测得最大呼气率 (PEER)(L/min),资料如表6.1,问两种方法的检测结果有无差别?
表 6.1 被测者号 (1) 1 2 3 4 5 6 7 8 9 10 11 12 合计 用两种方法对 12 名妇女的最大呼气率检测结果(L/min) Wright 法 (2) 490 397 512 401 470 415 431 429 420 275 165 421 Mini 法 (3) 525 415 508 444 500 460 390 432 420 227 268 443 差值 d (4)=(3)-(2) 35 18 -4 43 30 45 -41 3 0 -48 103 22 206 d2 (5) 1225 324 16 1849 900 2025 1681 9 0 2304 10609 484 21426
两样本均数比较的t检验

有些研究的设计既不能自身配对,也不便异体配对, 而只能把独立的两组相互比较。例如手术组与非手术 组、新药组与对照组。两个样本均数比较的目的在于 推断两个样本所代表的两总体均数1和2是否相等。
X1 X 2 t s X1X 2
s X 1 X 2 sc
2
1 1 n n 2 1
假设检验的意义

得到关于总体的结论 如本例假设检验的意义在于分辨手头样本所代表的未

知总体和已知总体是否为同一总体,换句话说,即分
辨手头样本是否为已知总体的一个随机样本。
假设检验的基本思想

“反证法”的思想 先根据研究目的建立假设,从H0假设出发,先假设它是正确的, 再分析样本提供的信息是否与H0有较大矛盾,即是否支持H0,若

其中H0假设比较单纯、明确,在H0 下若能 弄清抽样误差的分布规律,便有规律可循。 而H1假设包含的情况比较复杂。因此,我 们着重考察样本信息是否支持H0假设(因 为单凭一份样本资料不可能去证明哪个假设 是正确的,哪一个不正确)。
确定检验水准 (确定最大允许误差)
设定检验水准的目的就是确定拒绝假设H0时的最大
H0:d=0,即两组乳猪脑组织钙泵含量相等; H1:d>0,即对照组乳猪脑组织钙泵含量高于实验组。 单侧 =0.05。
t d sd n 0.0441 0.05716 7 2.0412
按= n-1=7-1=6查t界值表,得单侧t0.05,6=1.943,t>t0.05,6, 则P<0.05,差别有统计学意义,可以认为脑缺氧可造成钙泵 含量的降低。
相关文档
最新文档