第六章 假设检验

合集下载

第6章 假设检验

第6章 假设检验

×
样本均数 分布未知
样本均数服从 t分布
( X-t / 2 ( ) .S X, X+t / 2 ( ) .S X )

样本均数服从 正态分布

N ( , 2 / n)
N ( , S 2 / n)
( X-u / 2 . X, X+u / 2 . X )
( X-u / 2 .S X, X+u / 2 .S X )
时,当P值在检验水准α 附近时,应慎重做结论。

α 是犯Ⅰ型错误的最大概率,P是犯Ⅰ型错误的实际概率。
3.假设检验的统计意义

假设检验的实际意义

不管是接受还是拒绝零假设都未必有实际意义; 拒绝零假设时,即使P值很小,总体之间差异可能很小,不具有
实际意义;

接受零假设时,不代表总体之间没有差异,可能由于样本量过 小,“证据不足”,“补充证据”后,仍可能拒绝零假设;
样本均数 分布未知
×
样本均数服从 正态分布
Ⅳ N
σ 已知? Y
u
X
X
X X / n S/ n
样本均数服从 t分布
样本均数服从 正态分布
N ( , / n)
2

N ( , S 2 / n)
样本均数与总体 均数比较 (大样本:u检验) (小样本:?检验)
两样本均数比较

若小概率事件发生了,则我们犯了经验主义错误;
因为小概率事件发生可能性为α ,则我们犯经验主义错 误的概率为α ,这种错误称为Ⅰ型ห้องสมุดไป่ตู้误。

若小概率事件没有发生,接受零假设时,还是有可能犯错
误,这时候错误是教条主义,称为Ⅱ型错误。

统计学第六章假设检验

统计学第六章假设检验

10
即 z 拒绝域,没有落入接受域,所以没有足够理由接受原假设H0, 同
时,说明该类型电子元件的使用寿命确实有了显著的提高。
第六章 假设检验
1. 正态总体均值的假设检验
(2) 总体方差 2 未知的情形
双侧举例:【例 6-6】某厂用生产线上自动包装的产品重量服从正态
分布,每包标准重量为1000克。现随机抽查9包,测得样本平均重量为
100个该类型的元件,测得平均寿命为102(小时), 给定显著水平α=0.05,
问,该类型的电子元件的使用寿命是否有明显的提高?
解:该检验的假设为右单侧检验 H0: u≤100, H1: u>100
已知 z z0.05 1.645
zˆ x u0 n 100 (102 100 ) 2 1.645
986克,样本标准差是24克。问在α=0.05的显著水平下,能否认为生产线
工作正常? 解:该检验的假设为双侧检验 H0: u=0.5, H1: u≠0.5
已知 t /2 (n 1) t0.025 (9 1) 2.306, 而 tˆ x u 986 1000 1.75 可见 tˆ 1.75 2.306
设H0, 同时,说明该包装机生产正常。
其中 P( Z 1.8) 1 P( Z 1.8) 1 0.9281 0.0719 0.05。
第六章 假设检验
单侧举例:【例 6-4】某电子产品的平均寿命达到5000小时才算合格,
现从一批产品中随机抽出12件进行试验,产品的寿命分别为
5059, 3897, 3631, 5050, 7474, 5077, 4545, 6279, 3532, 2773, 7419, 5116
的显著性水平=0.05,试测算该日生产的螺丝钉的方差是否正常?

第六章 假设检验

第六章 假设检验
8
依据实际问题,建立原假设 H和0 备选假设 H1
确定检验统计量,确定该统计量的抽样分布
给定显著性水平α,查表得临界值,因此确定拒绝 的区H间0 范围(拒绝域)
据样本观察值计算统计量,
做出决策是接受原假设 H,0 还是拒绝原假设 H 0
9
H真0 实 不H 0 真实
接受 H 0
拒绝 H 0
40
一个假设检验问题的结论是简单的,给定显著性 水平,不是拒绝原假设,就是接受原假设,但是 有可能存在如下情况:在显著性水平α=0.05时拒 绝了原假设,但在显著性水平α=0.01下保留原假 设。因为降低显著性水平会导致拒绝域缩小,这 样原来落在α=0.05的拒绝域中的检验统计量的观 察值有可能落在α=0.01到接受域中。由此提出p值检验。
42
(一)z检验的p-值:
检验统计量为z统计量的p-值计算公式,z 0表示检
验统计量的抽样数据,则p-值的计算方法如下:
如果: H 1 , 0p-值=
pz z0
如果: H 1 , 0p-值= 如果: H 1 ,0 p-值=
p z z0 p z z0
例6:利用p-值检验重新检验例1。 解: 第一、第二步与例1完全相同,故省略之。 第三步:计算样本统计的数值。 样本平均数 X 2,48n=50,代入检验统计量得:
26
解:此题为右侧检验。 第一步,建立假设
H0 : , 100 H1 : 100
第二步,确定检验统计量及其分布
z X 0 ~ N 0,1
n
第三步,确定临界值,右单侧检验临界值 α=0.05,查标准正态分布表得临界值:
显著性水z平
z=1.645,拒绝域是z>1.645。
27

第六章--假设检验基础课件

第六章--假设检验基础课件
两样本所属总体方差相等且两总体均为正态分布
H 0 : 1 2H 1 :1 2 ( 单 1 2 或 侧 1 2 )
当H0成立时,检验统计量:
t X1X2 ~t, n1n22
Sc2n 11n12
第六章 假设检验基础
Sc2
n1
1S12 n2 1S22
n1 n2 2
X1 X1 2 X2 X2 2 n1 n2 2
第六章 假设检验基础
55、作出推断结论:当P≤时,结论为 按所取检验水准α拒绝H0,接受H1,差异有 统计学显著性意义。如果P> ,结论为按 所取检验水准α不拒绝H0,差异无统计学显 著性意义。其间的差异是由抽样误差引起
的。
第六章 假设检验基础
1.建立检验假设
原 假 设 H0:0 14.1 备 择 假H设1 :0(单 侧 ) 检 验 水 准: 0.05
第六章 假设检验基础
检验假设为:
H 0 : d 0H 1 :d 0 ( 单 d 0 或 侧 d 0 )
当H0成立时,检验统计量:
td0 ~t, n1
Sd n
第六章 假设检验基础
表6第-1二用节药前t后检患儿验血清中免疫球蛋白IgG(mg/dl)含量
二、序号配对设计资用料药前的t 检验 用药后
n1 20, X1 17.15,S1 1.59,n1 34, X2 16.92,S2 1.42
Sc2
n1
1S12 n2 1S22
n1 n2 2
2011.592 3411.422
20342
2.2 0
t X1 X2 17.1516.92 0.550
Sc2
1 n1
1 n2
2.20 1 1 20 34
得治疗前后舒张压(mmHg)的差值(前–后)如下表。问新药和标准药的疗效

卫生统计学课件_第六章_假设检验

卫生统计学课件_第六章_假设检验
16
公式:t
自由度:对子数 - 1
适用条件:两组配对计量资料。 例题:p. 34, 例8
三、两个小样本均数比较的 t 检验
▲目的:由两个样本均数的差别推断两样本
所代表的总体均数间有无差别。 ▲计算公式及意义: t 统计量: 自由度:n1 + n2 –2
18
▲ 适用条件:
(1)已知/可计算两个样本均数及它们的标准差 ;
38
(2)当不能拒绝
II 类错误的概率 β 值的两个规律:
1. 当样本量一定时, α 愈小, 则 β 愈大,反之…; 2.当 α 一定时, 样本量增加, β 减少.
39
4. 正确理解P值的意义, P值很小时“拒绝H0 ”,P值的
大小不要误解为总体参数间差异的大小; 拒绝H0 只是说 差异不为零。 统计学中的差异显著或不显著,和日常生活中所说的差 异大小概念不同. (不仅区别于均数差异的大小,还区别 于均数变异的大小)
统计推断
用样本信息推论总体特征的过程。
包括:
参数估计: 运用统计学原理,用从样本计算出来的统计
指标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差
别对样本所代表的总体间是否存在着差别做出判断。
第一节
▲显著性检验;
假设检验
▲科研数据处理的重要工具;
▲某事发生了:
是由于碰巧?还是由于必然的原 因?统计学家运用显著性检验来 处理这类问题。
45
41
是非判断: ( )1.标准误是一种特殊的标准差,其 表示抽样误差的大小。 ( )2.N一定时,测量值的离散程度越 小,用样本均数估计总体均数的抽样误差 就越小。 ( )3.假设检验的目的是要判断两个样 本均数的差别有多大。

第六章假设检验

第六章假设检验
当我们把真实的原假设当成假的加以拒绝, 称为第一类错误,也称弃真错误、α错误,犯 第一类错误的概率就是显著性水平α;当我们 把不真实的原假设当作真的加以接受,称为第 二类错误,也称取伪错误、β错误,犯第二类 错误的概率是不确定的。
α也称为生产者风险:在生产者将产品售给消费者时,通常 要进行产品的质量检验,原假设总是产品是合格的,但是检验 时生产者总是担心把合格品检验为不合格品,也就是第一类错 误α,所以α也称为生产者风险。 β也称为消费者风险:在消费者一方总恐怕把不合格品检验 不出来而当作合格品接受,因而β也称为消费者风险。
(二)未知总体分布及总体方差,大样本 1.检验总体均值的统计量
(三)总体为正态分布、方差未知、小样本 1. 检验统计量
2. 拒绝域的临界值 可以根据双侧检验还是单侧检验来确定拒绝域的 临界值。当为双侧检验,显著性水平a时,临界值 为 ;当为右侧检验时,显著性水平a,监界值 为 ;当为左侧检验时,显著性水平为a,临界值 为- 。
备择假设,常用H1表示。即原假设被否定之 后而采取的逻辑对立假设。
(二)检验统计量
有了两个假设,就要根据数据来对他们进行判 断。数据的代表是作为其函数的统计量,对样 本数据进行加工并用来判断是否接受原假设的统计 量称作检验统计量 统计量最常用的是Z统计量、t统计量。
统计量的选择要根据研究的参数及其估计量 的分布、抽样的方式、总体方差是否已知等多种 因素来确定
第四步:确定决策规则。拒绝或没有拒绝原假设的决 策是建立在由样本数据来进行统计检验并将其与假设 的抽样分布比较。抽样分布被分成两个部分,拒绝域 和非拒绝域。如果原假设是真实的,那么统计检验不 可能落入拒绝域。因此,如果统计检验落入了拒绝域, 我们拒绝原假设;否则,我们不能拒绝它。

第六章 假设检验

第六章 假设检验
绝原假设。这时需要选择另一个假设,这个假设 就是备择假设。即:
Ha : u≠3190(克) (有符号 , 或 )
2、Ha为备择假设,表示1990年新生儿与1989年新
生儿体重有明显差异。也可表达为:
Ha:u ≠ m0 或 Ha:u- m0 ≠0
6.1 假设检验的基本概念
提出假设 (结论与建议)
第Ⅰ类错误的概率的条件下,尽可能使犯第Ⅱ类
错误的概率减小。
6.2 一个总体参数的检验
1. 总体均值的检验 2. 总体比例的检验
第四章 概率论与抽样分布
6.2 一个总体参数的检验
总体均值的检验
(检验样本是否来自某已知总体均值的总体)
第四章 概率论与抽样分布
6.2 一个总体参数的检验
总体均值的检验( 2 已知)
H0 :m 1.35 Ha :m <1.35 = 0.01
n = 50 临界值(c):
拒绝H0 0.01
-2.33 0
检验统计量:
z 1.3152 1.35 2.6061 0.365749 50
决策:
拒绝H0
结论:
新机床加工的零件尺寸的平均误 差与旧机床相比有极显著的降低
z
6.2 一个总体参数的检验
6.2 一个总体参数的检验
显著性水平和拒绝域
抽样分布
(左侧检验 )
置信水平
拒绝H0
1 -
临界值
H0 样本统计量
第四章 概率论与抽样分布
6.2 一个总体参数的检验
显著性水平和拒绝域
抽样分布
(左侧检验 )
置信水平
拒绝H0
1 -
临界值
H0
样本统计量
第四章 概率论与抽样分布

贾俊平统计学第6章假设检验

贾俊平统计学第6章假设检验

正态分布
01
正态分布是一种常见的概率分布 ,其概率密度函数呈钟形曲线, 具有对称性、连续性和可加性等 性质。
02
正态分布广泛存在于自然界和人 类社会中,许多随机变量都服从 或近似服从正态分布。
t分布
t分布是正态分布在自由度不同时的 另一种表现形式,其形状与正态分布 相似,但尾部概率不同。
在假设检验中,t分布在样本量较小或 总体标准差未知时常常被用来代替正 态分布进行统计分析。
界值,判断是否拒绝原假设。
双侧Z检验
总结词
双侧Z检验是用于检验一个总体均数是否与已知值存在显著差异的统计方法。
详细描述
双侧Z检验的步骤与单侧Z检验类似,但需要计算双尾Z值,并根据临界值判断是否拒绝原假设。例如,要检验某 产品的质量是否合格,可以提出原假设为产品质量合格,备择假设为产品质量不合格,然后通过计算Z值和临界 值,判断是否拒绝原假设。
03
样本统计量与抽样分布
样本均值和样本方差
样本均值
表示样本数据的平均水平,计算公式为 $bar{x} = frac{1}{n}sum_{i=1}^{n} x_i$,其中 $n$ 为样本容量, $x_i$ 为第 $i$ 个样本数据。
样本方差
表示样本数据的离散程度,计算公式为 $S^2 = frac{1}{n-1}sum_{i=1}^{n} (x_i - bar{x})^2$,其中 $S^2$ 为样本方差,$bar{x}$ 为样本均值。
假设检验的逻辑
小概率事件原理
如果一个事件在多次试验中发生的概 率很小,那么在一次试验中该事件就 不太可能发生。
反证法
先假设原假设成立,然后根据样本数 据和统计原理,推导出与已知事实或 概率相矛盾的结论,从而拒绝原假设 。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

用区间估计法进行假设检验
当我们依据样本数据按照区间估计法,估计出待检验参数的置信区间时, 如果估计的区间与原假设一致,则不能拒绝原假设;如果与备择假设一 致,则拒绝原假设。 以总体均值µ的假设检验为例:对于双侧检验,如果参数 1 − α 的双侧置信
区间[ x -zα / 2σ x, + zα / 2σ x ]包含了则接受原假设,否则拒绝原假设;对于单侧检 x 验,如果参数的1− 2α 双侧置信区间 [ x - zα σ x , x + zα σ x ]包含了,则接 受原假设,否则拒绝原假设 。
0
检验统计量服从t分布与其服从标准正态分布的检验结论判断方法一致
例6.3 某厂购买了一台新的生产机器,生产零件的长度规定为10厘米。为了 检验机器的性能是否良好,质检员随机抽取了25件产品,测得其平均长度为9.8厘 米,标准差为0.4厘米。假设生产的零件长度服从正态分布,问在显著性水平 α =0.05时,该机器的性能是否良好。 2 解:设 X 表示该机器生产零件的长度,则有 X ~ N (µ , σ ),样本容量n=25,样本 均值 x =9.8厘米,样本标准差 s = 0.4 厘米。根据问题提出的假设为: H0 : = µ 0 =10厘米; H1 : ≠ µ 0 =10厘米 µ µ 这是一个双侧检验问题,因为总体服从正态分布但总体方差未知,用检验的小 样本数据检验,故当 H 0 成立时,检验统计量为: x−µ
6-4
第一节 假设检验的基本问题
接受域和否定域的关系图 (以总体均值的假设检验为例) 1. 双侧检验 否定域在左右两侧 2. 左侧检验 否定域在左侧 3. 右侧检验 否定域在右侧
四、假设检验的步骤
1. 建立统计假设 包括原假设 H 备择假设 0 H1 2. 确立合适的检验统计量, 确定其分布 3. 规定显著性水平 4. 根据样本观测值计算检验 统计量的取值 5. 均值的假设检验
一、 一个总体均值的假设检验 (一)总体为正态总体 1。总体为正态总体且方差已知 检验所使用的检验统计量为
Z
=
X
− µ n
0
H 在“假定 0 成立”的条件下,它服从标准正态分布。 检验结论按下列方法作出: 1.若采用双侧检验,即 H 0 : µ = µ 0 ; H 1 : µ ≠ µ 0,则检验的双侧临界值(分位数)为-Z α / 2 和Z α / 2 。当Z > Z α / 2 时,拒绝原假设;反之,接受原假设。 2.若采用左侧检验,即 H0 : µ ≥ µ0; H1 : µ < µ0 ,则检验的左侧临界值(分位数)为- Z 。当 α 时 Z < − Z α ,拒绝原假设;反之,接受原假设。 3. 若采用右侧检验,即 H 0 : µ ≤ µ0 ; H 1 : µ > µ0 ,则检验的右侧临界值(分位数)为Z α 。当 Z > Z α 时,拒绝原假设;反之,接受原假设。 互 < 4.当p 值(p -value) α 时,拒绝原假设;反之,接受原假设。 5. 当如果µ 的双侧置信区间[ x ± zα / 2σ x ]包含了则接受原假设,否则拒绝原假设;对于单侧检验, 动 如果µ的双侧置信区间 [ ± ]包含了,则接受原假设,否则拒绝原假设 。 zα σ x x 地
n 100 因为2>1.645,落在否定域,所以否定 H 0 ,接受 H1 。通过对样本数据 观察表明管理人员的估计是不准确的。
互动地带 6-13
第二节 总体均值的假设检验
二、两个总体均值相等的假设检验 (一)两个总体为正态分布,方差已知 从两个方差已知的正态总体中分别抽取容量为 n1和 n2 的两个简单随机样本,且这两个样本相互独立。两个总 体均值之差 µ − µ 的假设检验所使用的检验统计量为
6-5
第一节 假设检验的基本问题
做出检验决策的方法 1. 临界值法 将计算求得的检验统计量的观测值与计算或查表得到的临界值相比较,看其 是否落在否定域。如果落入否定域说明对检验统计量只进行一次实验,小概率事 件就发生了,从而违背了小概率原理,故拒绝原假设,而接受备择假设;如果观 测值落入接受域,则说明进行一次实验大概率事件发生,为正常情况,则没有理 由拒绝原假设,只有承认原假设。 2. p值法 p值就是在给定的原假设为真时,样本结果出现的概率。在统计量的分布图中, 值表示从统计量的观测值起向假设检验的拒绝域方向扩展的面积,即概率的值。 以总体均值的假设检验为例,Z为假设检验所用的统计量,z0为根据样本均值 计算的检验统计量的观测值,对于右侧检验,p值=p(z≥z0);对于左侧检验,p 值=p(z≤z0);对于双侧检验,当z0>0时,值=2p(z≥z0);当z<0时,值=2p (z≤z0)。 在给定的显著性水平下,用p值法进行假设检验,无论是单侧检验还是双侧检 验,也不论检验的否定域的所在位置,只使用一个单一规则进行决策,即比较p值 与显著性水平的大小,如果p值< ,则拒绝原假设;如果p值≥ ,则不能拒绝原 α α 假设。
Z =
6-12
X − µ0 S / n
例6.4 某停车场管理人员估计周末汽车的平均停靠时间不超过90分钟。 现抽查100辆汽车,测得平均停靠时间为96分钟,标准差为30分钟。规定显著 性水平 α =0.05,通过这些数据能否说明管理人员的估计是准确的。 解:设X表示每辆汽车停靠的时间,已知样本容量n=100,样本均值 x = 96 分钟,样本标准差 s = 30 分钟。根据问题提出的假设为: µ H0 : ≤ 90 ; H 1 :µ > 90 这是一个右侧检验问题。虽然总体的分布未知,但由于样本容量很大 n=100,近似服从正态分布,且可用样本标准差来估计,故检验统计量为: x − µ0 Z = s n 规定显著性水平为 α =0.05,查表得到临界值 Z 0.05 = 1.645 ,所以原假设 H0的否定域为 :Z > 1.645 。 x − µ0 96 − 90 Z= = =2 计算检验统计量的值: s 30
6-1
第六章
假设检验
学习目的: 1.明确假设检验的含义,理解假设检验的 基本思想,掌握假设检验的一般形式和基本步 骤,理解两类错误,明确假设检验与区间估计 的关系。 2.掌握不同条件下总体均值、总体比例以 及总体方差的假设检验的方法,并能运用这些 方法解决实际问题。
6-2
第一节 假设检验的基本问题
t=
0
s n
规定显著性水平为α =0.05,查表得到临界值 tα / 2(24) = 2.064 ,所以原假设的否 定域为:t > 2.064 。 计算检验统计量的值: t = x − µ 0 = 9 . 8 − 10 = − 2 . 5
s 0 .4 n 100
因为 |-2.5|=2.5>2.064,落在否定域,所以否定 H0 显著性水平 α =0.05时,不能说该机器的性能良好。 互动地带 6-11
互动地带
6-8
第一节 假设检验的基本问题
五、假设检验与区间估计的关系 二者联系
假设检验和区间估计是统计推断两种基本方式,它们之间在一定条 件下可以相互转换。对同一实例的参数推断,两者用的是同一个样本, 同一个统计量,同一种分布,因而可由区间估计问题转换成假设检验问 题,也可由假设检验问题转换成区间估计问题。
6-6
P值示意图
6-7
第一节 假设检验的基本问题
四、两类错误 假设检验的 四种情况
接受H 0
拒绝H 0
H 0为真
正确决策 第Ⅰ类型错误
H 0 非真
α
第Ⅱ类型错误 正确决策
β
第Ⅰ类错误,也称弃真错误 本来是真的,却根据检验统计量的值把它给否定了。 发生这种错误的概率通常用 α 表示,即 α = P (拒绝H 0 / H 0为真)

第Ⅱ类错误,也称取伪错误 本来是非真的,却根据检验统计量的值把它给接受了。 发生这种错误的概率通常用 β 表示,即 β = P ( 接受 H 0 / H 0 非真) 在样本容量一定时,犯两种错误的风险是彼此消长的。两者要同时得到控制只 有增加样本容量。在样本容量受限时,通常根据研究问题的性质决定重点控制 第一类错误的风险还是控制第二类错误的风险。
举例6.2 举例
σ

6-10
第二节 总体均值的假设检验
2。总体为正态分布且方差未知 总体为正态分布且方差未知时,用样本方差S 2作为 2 的估计量,用S 代 σ 替 ,这时检验统计量为 X − µ0 σ t = S / n H 0 成立”时,服从自由度为n-1的t 分布。 在“假定 检验统计量为t的检验结论按下列方法作出: 1.若采用双侧检验,则检验的双侧临界值为-tα / 2和 tα / 2。当 t > tα / 2 时,拒 绝原假设;反之,接收原假设。 2.若采用左侧检验,则检验的左侧临 界值为- tα 。当时 t < −tα ,拒绝原假设;反之,接收原假设。 3. 若采用 右侧检验,则检验的右侧临界值为 tα 。当 t > tα 时,拒绝原假设;反之, <α 接收原假设。 4.当 值 p 时,拒绝原假设;反之,接收原假设。5. 当总体均值的置信区间包含µ 时,接受原假设;反之,拒绝原假设。
,接受 H 1 。表明在
第二节 总体均值的假设检验
(二)总体为非正态分布或分布未知 当总体分布为非正态分布且大样本时,检验的 X − µ 统计量为 Z =
0
σ /
n
在“原假定成立”的条件下,只要样本容量充分 大(一般习惯上要求 n≥30),它近似服从标准正 态分布。 如果标准差σ未知,只需用样本标准差S作为它 的估计量代替式中的 σ即可,这时检验统计量为
一、假设检验的含义 假设检验 假设检验(hypothesis test),就是根据已掌握的资料对一个 总体参数是否等于某一个数值,某一随机变量是否服从某种概率 分布的假设,然后根据所取得的样本资料,利用一定的统计方法 计算出有关检验的统计量,依据一定的概率原则,以较小的风险 来判断估计数值与总体数值(或估计分布与实际分布)是否存在 显著差异,是否应当接受原假设的一种检验方法 。 假设检验是进行科学决策的有力工具。互动地带 参数假设检验 是指在总体的分布形式已知的条件下,对总体参数的某一假设 进行的检验 。 非参数假设检验 是指在总体分布未知时,对其分布的具体形式、特征值等信息 进行的假设检验。
相关文档
最新文档