第六章假设检验

合集下载

第六章 假设检验2006

第六章 假设检验2006

第六章参数假设检验假设检验(test of hypothesis)亦称显著性检验(test of statistical significance),就是先对总体的参数或分布做出某种假设,如假设两个总体均数相等,总体服从正态分布或两总体分布相同等,然后用适当的统计方法计算某检验统计量,根据检验统计量的大小来推断此假设应当被接受或拒绝,它是统计推断的另一重要方面。

假设检验可以分为两类:一类是已知总体分布类型,对其未知总体参数的假设作假设检验,称为参数检验(parametric test),主要讨论总体参数(均值、方差、总体率等)的检验;另一类是对未知总体分布类型的总体假设作假设检验,称为非参数检验(non-parametric test),主要包括总体分布形式的假设检验、随机变量独立性的假设检验等。

本章主要介绍有关总体参数(均值、方差、总体率等)的参数检验问题。

第一节假设检验的基本概念一、假设检验问题及基本原理(一)假设检验问题我们先来看个具体的例子。

例6.1某药厂用自动包装机包装葡萄糖,按规定每袋葡萄糖的标准重量为500克,若已知包装机包装的每袋葡萄糖重量服从正态分布,且按以往标准知总体方差σ2=6.52,某日开工后,为检验包装机工作是否正常,随机抽取6袋葡萄糖,测得其平均重量x=504.5(克),问该日自动包装机包装的平均重量是否还是500克?某日随机抽取的6袋葡萄糖的平均重量x=504.5(克),与标准重量500克相比差4.5克,造成该差异的原因有两种可能:①这日自动包装机工作正常,其包装的总体平均重量μ=500克,此6袋葡萄糖的平均重量这一样本均值与总体均值不同,是随机抽样误差造成的;②这日自动包装机工作不正常,其包装的总体平均重量μ≠500克,故从此总体中随机抽取的6袋葡萄糖的平均重量与标准重量存在实质性差异,而不仅仅是抽样误差造成的。

上述两种可能是相互对立的、互不相容的,究竟哪一种可能是对的,可用假设检验的方法来判断。

[理学]第6章 假设检验

[理学]第6章 假设检验

显著性水平α(significant level)
• 原假设为真时,拒绝原假设的概率
• 抽样分布的拒绝域
• 常用的 值有0.01, 0.05, 0.10 • 由研究者事先确定 • 显著性水平表示总体中某一类数据出现的经常程度
• 假如我们选择=0.05,样本数据能拒绝原假设的证据要 强到:当H0正确时,这种样本结果发生的频率不超过 5%;如果我们选择=0.01,就是要求拒绝H0的证据要 更强,这种样本结果发生的频率只有1% • significant(显著的)一词的意义在这里并不是“重要 的”,而是指“非偶然的”

双侧检验与单侧检验
• 双侧检验 备择假设无特定的方向性,含有符号“”的假设检验, 称为双侧检验(two-tailed test) • 单侧检验 备选假设有特定的方向性,含有符号“>”或“<”的假设 检验,称为单侧检验(one-tailed test)
以总体均值的检验为例
假设
原假设 备选假设
双侧检验
练习 假设的陈述
• 1.一种罐装饮料采用自动生产线生产,每罐的容量 是255ml。为检验每罐容量是否符合要求,质检人 员在某天生产的饮料中随机抽取了40罐进行检验, 测得每罐平均容量为255.8ml。检验该天生产的饮 料容量是否符合标准要求? • 解:这批饮料每罐平均容量的的真值为μ,需检验 假设 H0:μ=255 饮料容量符合要求 H1:μ≠255 饮料容量不符合要求
假设检验的过程和逻辑
• 提出原假设μ=100s和备择假设,至于是否显著,依检验结 果而定 • 有了原假设,根据数据的代表x=105.4s来对它进行判断 • 数据的代表是样本的函数,在检验中被称为检验统计量 • 根据原假设和检验统计量的分布,看看统计量的数据实现值 是否属于原假设下的小概率事件 • 如果的确是小概率事件,那么就有可能拒绝零假设,或者说 “该检验显著” • 否则说“没有足够证据拒绝零假设”,或者“该检验不显著”

第06章 假设检验

第06章 假设检验
双侧检验: 统计量 临界值,拒绝H 统计量I 双侧检验:I统计量 > 临界值,拒绝 0 左侧检验: 临界值, 左侧检验:统计量 < -临界值,拒绝 0 临界值 拒绝H 右侧检验: 临界值,拒绝H 右侧检验:统计量 > 临界值,拒绝 0
Chap 06-28
什么是p值 什么是 值(p-Value)? )
Chap 06-24
假设检验中的小概率原理
什么小概率? 什么小概率? 1. 在一次试验中,一个几乎不可能发生的事件 在一次试验中, 发生的概率 2. 在一次试验中小概率事件一旦发生 , 我们就 在一次试验中小概率事件一旦发生, 有理由拒绝原假设 小概率由研究者事先确定, 3. 小概率由研究者事先确定 , 这里的小概率就 是指显著性水平α 是指显著性水平α
解:研究者抽检的意图是倾向于证实这 种洗涤剂的平均净含量并不符合说明书 中的陈述。 中的陈述。建立的原假设和备择假设为
H0 : µ ≥ 500
H1 : µ < 500
500g 500g
Chap 06-14
提出假设(例题3) 提出假设(例题 )
一家研究机构估计, 例:一家研究机构估计,某城市中家庭拥有汽车的 比例超过30 30% 为验证这一估计是否正确, 比例超过 30 % 。 为验证这一估计是否正确 , 该研究 机构随机抽取了一个样本进行检验。 机构随机抽取了一个样本进行检验。试陈述用于检 验的原假设与备择假设。 验的原假设与备择假设。
假设检验在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
Chap 06-5
什么是假设? 什么是假设?
假设( 假设(hypothesis) ) 是对总体参数的具体 数值所作的陈述。例如: 数值所作的陈述。例如:

统计学-思想方法与应用(袁卫等)第六章假设检验

统计学-思想方法与应用(袁卫等)第六章假设检验

6.2.1假设检验中的p值
• 在统计软件的输出中,通常只输出p-值,而由用户 去决定p-值是多少时拒绝原假设。
– 需要注意的是,p-值是由数据决定的,显著性水平 a是 由用户决定的,而不是由计算机给出的。比如确定a =0.05,而假定所得到的p-值等于0.001。这时如果采用p值作为新的显著性水平,即新的a =0.001,于是就可以 说,在显著性水平为0.001时拒绝原假设。这样,拒绝原 假设时犯错误的概率实际只是千分之一,而不是原来的 所表明的百分之五。 – 根据数据产生的p-值来减少 的值以展示结果的精确性总 是没有害处的。这好比一个身高180厘米的男生,可能愿 意被认为高于或等于180厘米,而不愿意说他高于或等于 155厘米,虽然这第二种说法数学上没有丝毫错误。
6.3显著性水平
• 通常认为显著性水平0.05是一个合理的风 险。 • 显著性水平0.05的意思是:在零假设正确 的情况下进行100次抽样,会有5次错误地 拒绝了零假设。
6.3显著性水平
• 图6.2显示了显著性水平在大学毕业生薪水 调查的那个问题中是如何被应用的。
6.3显著性水平
• 图6.3中用图示说明了双边和单边假设检验。图中分别 显示了何时具有双边备择假设的零假设被拒绝;何时 具有单边备择假设的零假设被拒绝。这两种情况的显 著性水平都等于0.05。




6.1 作为一个问题的假设
• 调查数据显示,2010年各城市的本科生平均起薪前 三名分别为上海3367元,深圳 3153元,北京 2993元 (注:数据来自于网络)。从该数据可以看出,深 圳的大学毕业生平均起薪比北京高160元,上海比深 圳高214元。 • 来自上海和深圳的总体均值差异是否为零?在两个 样本中,均值差为3367-3153=214。即平均起来,每 个在上海就业的大学毕业生的薪水比在深圳的毕业 生高214元。 • 当然,即使两个城市的总体均值没有差异,我们也 不能指望两个样本均值相同。因为两个随机样本都 会受抽样变化的影响。但是这个变化所能造成的差 异也许不足以大到可以解释214元这样的差距。

第六章 假设检验(2)

第六章 假设检验(2)
假设检验与方差分析上节小结:假设检验
1、单样本双边假设检验步骤如下
第一步:建立假设
H 0 : 0 H1 : 0
n≥30时,其服从正态分布
第二步:设统计量为
X 0
在H 0成 立 的 条 件 下
X 0 在H 0成立的条件下 t ~ t (n 1) t N (0,1) 或 t s n n
假设检验与方差分析
(2)设定允许的抽样误差水平
a 0.10时,临界值Z 1.28 (0.10显著水平的单边检验 )
(3)计算两比例间差异的估计标准差
S p m f 1 1 P1 P nm n f P n m Pm n f P f nm n f
设统计量为
H1 : 0
H 0成立的条件下 在 Z ~ N (0,1)
Z
x 0
n 由给定的显著水平a=0.05确定临界值,Z0.05=-1.645
( x)

确定拒绝域和接受域
z Za 1.645 接 受 H1 拒 绝 H0 z Za 1.645 , 没 有 理 由 拒 绝 H0
( x)
确定拒绝域和接受域
z>Za 1.645 , 拒 绝 H0, 接 受 H1 z<Za 1.645 , 没 有 理 由 拒 绝 H0
1 a 0.95
a 0.05
Za 1.645
x
接受域
拒绝域
假设检验与方差分析
3、单个样本左单边假设检验
若提出原假设和备选假设:
H0 : 0
所以本例 S p m f
45 0.58 71 0.41 P 0.48 45 71 1 1 0.48 1 0.48 0.10 45 71

第六章 假设检验

第六章 假设检验
n
t 检验 t x 0
sn
小样本,总体方差未知,必须使用 t 检验
设 X~N( , 2 ), 2 未知,X1, X2, ···, Xn 为总体
X 的样本,给定水平 ,原假设为 H0: =0 ( 0为某一给定值)
当 H0 为真时,统计量
t X 0 ~t (n -1)
S/ n
1. H1:≠0 (双边检验) 当 H0 为真时,
判决 无辜
实际情况
实际情况
无辜
有罪
决策 H0 真 H0 假
没有拒绝
Correct Error
H0
1-
Type II Error ( )
有罪
Error Correct
拒绝 H0
Type I Error
()
(1 - )
两类错误的关系
两个错误有反向的关系
H0:μ=μ0
H1:μ=μ1
β
0
t(n-1)
x
拒绝域
2 2/2 (n 1)

2
2 1
/
2
(n
1)
2 2 (n 1)
2
2 1
(n
1)
26
卡方检验的拒绝域
f (x)
/2
1-
/2
0
2 1
/
2
(n
1)
2/2 (n 1) x
双边检验
f (x)
1-
f (x)
1-
012 (n 1)
x
0
2 (n 1) x
左边检验
右边检验
27
案例 2 解答:
某台加工缸套外径的机床,正常状态下所加工缸套外 径的标准差应不超过 0.02 mm,现从所生产的缸套中随 机抽取了 9 个,测得外径的样本标准差为 S = 0.03 mm。

应用统计学 第六章 假设检验

由度为v的t分布,v的计算公式为:
v (s12
s12 n1
s22 n2
2
n1)2 (s22 n2 )2
n1 1
n2 1
(6-13)
31
第三节 两个总体参数的检验
第 六 章


检 验
这时,检验统计量t的计算公式为:
t (x1 x2 ) (1 2 )
s12 s22 n1 n2
10
第一节 假设检验的基本问题
第 六 章
假 设
(五) 根据样本数据计算检验统计量的值


在提出原假设和备择假设,选取适当显著性水平 和检验统计量以后,接下来就要根据样
本观测值计算检验统计量的值,具体计算方法将在本章第二节进行详细介绍。例如,例6-1中检
验统计量的值为:
z x 0 2.21 2 2.67
t x 0 (6-3)
s/ n
18
第二节 一个总体参数的检验
第 六 章

综上所述,不同情况下总体均值的检验统计量如表6-3所示。



19
第二节 一个总体参数的检验
第 六 章
二、总体比例的检验

设 检
在实际应用中,常常需要检验总体比例是否为某个假设值 0 。例如,检验某课程的
验 考试通过率、产品的合格率、种子的发芽率等,民意调查中也经常用到总体比例检验。
样本条件下,要求总体服从正态分布,且总体标准差 已知时,可以使用z统计量。当
总体标准差 已知时,z统计量的计算公式为:
z x 0 / n
(6-1)
15
第二节 一个总体参数的检验
第 六 章 假 设 检 验
16

统计学原理第6章:假设检验


当P>α时,不拒绝原假设。
16/63
3. 假设检验的两类错误
(1)两类错误的含义
实际情况 决策结论 H0为真
第六章 假设检验
H0为假 第Ⅱ类错误(取伪错误)(概 率为 )
不拒绝H0
正确决策(概率为

拒绝H0
第Ⅰ类错误(弃真错误)(概 率为 )
正确决策(概率为

17/63
3. 假设检验的两类错误
3. 假设检验的两类错误 4. 假设检验与参数估计的关系
3/63
1. 假设检验的基本思想
(1)假设检验的概念
假设就是对总体参数所提出的陈述。
参数假设检验 非参数假设检验
第六章 假设检验
(2)假设检验的核心问题
是如何利用样本信息进行推断或检验,基本依据是概率原理, 小概率原理即为小概率事件在一次实验中几乎是不可能发生 的,如果小概率事件在一次实验中便发生了,则我们有理由 拒绝所做的假设。
0.05、 0.01 0.10、
13/63
2. 假设检验的步骤
(4)确定检验规则,进行统计决策
临界值规则
第六章 假设检验
临界值规则是根据检验统计量的取值与给定显著性水平下
的临界值进行对比进行统计决策的方法。
双侧检验:检验统计量的值>右侧统计量的值,或检验 统计量的值<左侧临界值,拒绝原假设; 左侧检验:检验统计量的值<左侧临界值,拒绝原假设。 右侧检验:检验统计量的值>右侧临界值,拒绝原假设。
第六章
假设检验
学习目标
第一节 假设检验的基本原理

假设检验的相关概念和基本步骤
第二节 单总体参数的假设检验 第三节 两总体参数的假设检验

第六章 假设检验


,接受 H 1 。表明在
第二节 总体均值的假设检验
(二)总体为非正态分布或分布未知 当总体分布为非正态分布且大样本时,检验的 X 统计量为 Z
0
/
n

在“原假定成立”的条件下,只要样本容量充分 大(一般习惯上要求 n≥30),它近似服从标准正 态分布。 如果标准差σ未知,只需用样本标准差S作为它 的估计量代替式中的 σ即可,这时检验统计量为

检验统计量服从t分布与其服从标准正态分布的检验结论判断方法一致
例6.3 某厂购买了一台新的生产机器,生产零件的长度规定为10厘米。为了 检验机器的性能是否良好,质检员随机抽取了25件产品,测得其平均长度为9.8厘 米,标准差为0.4厘米。假设生产的零件长度服从正态分布,问在显著性水平 =0.05时,该机器的性能是否良好。 2 解:设 X 表示该机器生产零件的长度,则有 X ~ N (, ),样本容量n=25,样本 均值 x =9.8厘米,样本标准差 s 0.4 厘米。根据问题提出的假设为: H0 : 0 =10厘米; H 1 : 0 =10厘米 这是一个双侧检验问题,因为总体服从正态分布但总体方差未知,用检验的小 样本数据检验,故当 H 0 成立时,检验统计量为: x 0
t
s n
规定显著性水平为 =0.05,查表得到临界值 t / 2(24) 2.064 ,所以原假设的否 定域为:t 2.064 。 计算检验统计量的值: t x 0 9.8 10 2.5
s 0.4 n 100
因为 |-2.5|=2.5>2.064,落在否定域,所以否定 H 0 显著性水平 =0.05时,不能说该机器的性能良好。 互动地带 6-11
第Ⅱ类错误,也称取伪错误 本来是非真的,却根据检验统计量的值把它给接受了。 发生这种错误的概率通常用 表示,即 P(接受H 0 / H 0非真) 在样本容量一定时,犯两种错误的风险是彼此消长的。两者要同时得到控制只 有增加样本容量。在样本容量受限时,通常根据研究问题的性质决定重点控制 第一类错误的风险还是控制第二类错误的风险。

(卫生统计学)第六章 假设检验基础


药前后患儿血清中免疫球蛋白IgG(mg/dl)含量
编号 1 2 3 4 5 6 7 8 9 10 11 12
用药前 1206.4 921.69 1294.08 945.36 721.36 692.32 980.01 691.01 910.39 568.56 1105.52 757.43
用药后 1678.44 1293.36 1711.66 1416.70 1204.55 1147.30 1379.59 1091.46 1360.34 1091.83 1728.03 1398.86
目的
H0
H1
双侧检验 是否μ1≠μ2
μ1=μ2
μ1≠μ2
单侧检验 是否μ1>μ2
μ1=μ2
μ1>μ2
或是否μ1<μ2
μ1=μ2
μ1<μ2
返回
选定检验方法和计算检验统计量
要根据研究设计的类型和统计推断的目的选用不同的检验方法。如 成组设计的两样本均数的比较用t检验(小样本)或Z检验(大样本), 两样本方差的比较用F检验。
(卫生统计学)第六章 假设检验基础
第一节、假设检验的概念与原理 一、假设检验的思维逻辑
1.小概率原理 小概率事件在一次随机试验中几乎是不可能发生
2.假设检验处理问题的特点 ⑴从全局的范围,即从总体上对问题作出判断 ⑵不可能对总体的每个个体均作观察
二、假设检验步骤
例6-1 已知北方农村儿童前囟门闭合月龄为14.1月。某研究者从东北某县抽取36名 儿童,得囟门闭合月龄均值为14.3月,标准差为5.08月。问该县儿童前囟门闭合月 龄的均数是否大于一般儿童?
四、方差齐性检验 homogeneity of variance test
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档