第六章假设检验(上)

合集下载

数理统计:假设检验

数理统计:假设检验
12
二 假设检验的思路、步骤和术语
由长期实践可知,标准差较稳定,设 15, 则 X ~ N (, 152 ), 其中未知.
1. 提出两个对立假设
H0 : 0 500
H1 : 0
原假设或零假设
备择假设
利用已知样本作出判断:是接受假设H0(拒绝假 设H1), 还是拒绝假设H0(接受假设H1). 如果作出的判 断是接受H0, 则认为 0 500 , 即认为机器工作是 正常的, 否则, 认为是不正常的.
13
2. 选择适当的统计量,称为检验统计量,
原则是 1°其中含着总体X的均值 好的估计 X ,
2° H0为真时,检验统计量分布确定。
因为 X是 的无偏估计量,
检验统计量
若 H0 为真, 则| x 0 | 不应太大,
当H0为真时, X ~ N (0 , 2 n),
Z X 0 ~ N (0,1), / n
P{拒绝H0 H0为真} (按“=”具体计算)
以假当真: 当μ≠500时,X 取值落在500附近的可能也存 在,此时将接受H0,认为μ=500,于是犯了取伪错误,称 为第二类错误,犯第Ⅱ类错误的概率
P{接受H0 H0不真}
23
两类错误的关系
以下述检验为例:X~N(, 2), 已知, 未知
率不超过 ,而犯第ⅠI类错误的概率无法控制。
25
【注】假设检验的结果与显著性水平α的大小有关: α越小越不易拒绝H0. 就引例而言:
当α=0.05时,则 临界值z /2 z0.025 1.96,
z x 0 2.2 1.96, 落入拒绝域 / n
于是拒绝 H0, 认为包装机工作不正常.
在实例中若取定 0.05,则 k z / 2 z0.025 1.96,

第六章 假设检验1

第六章 假设检验1
1. 给定显著性水平α,查表得出相应的临界值 α 查表得出相应的临界值z 或zα/2, tα或tα/2 2. 将检验统计量的值与α 水平的临界值进行比较 3. 作出决策 – 双侧检验:I统计量 > 临界值,拒绝 0 双侧检验: 统计量 临界值,拒绝H 统计量I – 左侧检验:统计量 < -临界值,拒绝 0 左侧检验: 临界值, 临界值 拒绝H – 右侧检验:统计量 > 临界值,拒绝 0 右侧检验: 临界值,拒绝H
二,假设检验的过程
1,提出假设 3,作出决策
拒绝假设 别无选择
总体
我认为人口的 平均年龄是50 50岁 平均年龄是50岁
2,抽取随机样本
均值 X = 20
二,假设检验的过程 假设检验的具体步骤: 假设检验的具体步骤: 第一,提出原假设 第一,提出原假设(null hypothesis)和备择假设 和备择假设 (alternative hypothesis); ; 第二,确定合适的检验统计量; 第二,确定合适的检验统计量; 第三,规定显著性水平 ; 第三,规定显著性水平α; 第四,根据数据计算检验统计量的实现值; 第四,根据数据计算检验统计量的实现值; 第五,统计决策. 第五,统计决策.
原假设
(null hypothesis)
1. 2. 3. 4. 研究者想收集证据予以反对的假设 又称"0假设" 总是有符号 =, ≤ 或 ≥ 表示为 H0
– – –
H0 : = 某一数值 指定为符号 =,≤ 或 ≥ ≤ 例如, H0 : = 10cm
备择假设
(alternative hypothesis)
什么是P 值?
(P-value)
1.p值(p-value)是在零假设下, 1.p值(p-value)是在零假设下,检验统计量取其实现 是在零假设下 值及(沿着备择假设的方向)更加极端值的概率. 值及(沿着备择假设的方向)更加极端值的概率.

应用统计学6-假设检验(1)

应用统计学6-假设检验(1)

t 检验
(单边和双边)
χ2检验
(单边和双边)
名称 条件
H0
统计量及其分布
拒绝域 |u| >u1-α/2 u >u1-α u < - u1-α |t| >tα/2 t >tα t < -tα
2 χ 2 > χα / 2 ( n − 1)或
0 u 总体 µ ≤ µ0 2 检 方差σ 均 验 已知 µ ≥ µ 0 值 检 验 t 总体 µ = µ 0 µ ≤ µ0 2 检 方差σ 验 未知 µ ≥ µ 0
正确
α 错误和 β 错误的关系
当H0、H1给定,n固定时,无法同时使α和β变小 α和β的关系就像翘翘板,α小β就大, α大β就小
β α
使α、β 同时变小的办法就是增大样本容量。
“不能拒绝H0”
一般地说,哪一类错误所带来的后果越严重,危害越大, 在假设检验中就应当把哪一类错误作为Fra bibliotek要的控制目标。
通常β不易计算,所以通常我们 主要控制α,尽量减小β
µ ≥ µ0 µ < µ0
µ ≤ µ0 µ > µ0
双边检验
抽样分布
拒绝域 α/2
H0 :µ = µ0
H1 :µ ≠ µ0
置信水平 拒绝域 1-α α/2 接受域 H0值
临界值
临界值
左单边检验
抽样分布
拒绝域
H0 :µ ≥ µ0
H1 :µ < µ0
置信水平
α
1-α 接受域 H0值
临界值
右单边检验
由于α 事先确定,所以拒绝H0 是有说服力的, 而β通常未知,所以如果我们决定“接受H0 “,我们并不 确定这个决策的置信度,所以通常我们不采用“接受H0 “的说法,而是采用“不能拒绝H0 “的说法。

第6章假设检验

第6章假设检验

第6章假设检验一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为小时,标准差为小时。

据报道,10年前每天每个家庭看电视的平均时间是小时。

取显着性水平,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”?详细答案:,=,,拒绝,如今每个家庭每天收看电视的平均时间显着地增加了。

为监测空气质量,某城市环保部门每隔几周对空气烟尘质量进行一次随机测试。

已知该城市过去每立方米空气中悬浮颗粒的平均值是82微克。

在最近一段时间的检测中,每立方米空气中悬浮颗粒的数值如下(单位:微克):根据最近的测量数据,当显着性水平时,能否认为该城市空气中悬浮颗粒的平均值显着低于过去的平均值详细答案:,=,,拒绝,该城市空气中悬浮颗粒的平均值显着低于过去的平均值。

安装在一种联合收割机的金属板的平均重量为25公斤。

对某企业生产的20块金属板进行测量,得到的重量数据如下:假设金属板的重量服从正态分布,在显着性水平下,检验该企业生产的金属板是否符合要求?详细答案:,,,不拒绝,没有证据表明该企业生产的金属板不符合要求。

在对消费者的一项调查表明,17%的人早餐饮料是牛奶。

某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。

为验证这一说法,生产商随机抽取550人的一个随机样本,其中115人早餐饮用牛奶。

在显着性水平下,检验该生产商的说法是否属实详细答案:,,,拒绝,该生产商的说法属实。

某生产线是按照两种操作平均装配时间之差为5分钟而设计的,两种装配操作的独立样本产生如下结果:操作A操作B=100=50====对=,检验平均装配时间之差是否等于5分钟。

详细答案:,=,,拒绝,两种装配操作的平均装配时间之差不等于5分钟。

某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。

样本中每个人都分别在看过该产品的新的电视广告之前与之后打分。

潜在购买力的分值为0~10分,分值越高表示潜在购买力越高。

原假设认为“看后”平均得分小于或等于“看前”平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分。

第6章 假设检验

第6章 假设检验

×
样本均数 分布未知
样本均数服从 t分布
( X-t / 2 ( ) .S X, X+t / 2 ( ) .S X )

样本均数服从 正态分布

N ( , 2 / n)
N ( , S 2 / n)
( X-u / 2 . X, X+u / 2 . X )
( X-u / 2 .S X, X+u / 2 .S X )
时,当P值在检验水准α 附近时,应慎重做结论。

α 是犯Ⅰ型错误的最大概率,P是犯Ⅰ型错误的实际概率。
3.假设检验的统计意义

假设检验的实际意义

不管是接受还是拒绝零假设都未必有实际意义; 拒绝零假设时,即使P值很小,总体之间差异可能很小,不具有
实际意义;

接受零假设时,不代表总体之间没有差异,可能由于样本量过 小,“证据不足”,“补充证据”后,仍可能拒绝零假设;
样本均数 分布未知
×
样本均数服从 正态分布
Ⅳ N
σ 已知? Y
u
X
X
X X / n S/ n
样本均数服从 t分布
样本均数服从 正态分布
N ( , / n)
2

N ( , S 2 / n)
样本均数与总体 均数比较 (大样本:u检验) (小样本:?检验)
两样本均数比较

若小概率事件发生了,则我们犯了经验主义错误;
因为小概率事件发生可能性为α ,则我们犯经验主义错 误的概率为α ,这种错误称为Ⅰ型ห้องสมุดไป่ตู้误。

若小概率事件没有发生,接受零假设时,还是有可能犯错
误,这时候错误是教条主义,称为Ⅱ型错误。

统计学第六章假设检验

统计学第六章假设检验

10
即 z 拒绝域,没有落入接受域,所以没有足够理由接受原假设H0, 同
时,说明该类型电子元件的使用寿命确实有了显著的提高。
第六章 假设检验
1. 正态总体均值的假设检验
(2) 总体方差 2 未知的情形
双侧举例:【例 6-6】某厂用生产线上自动包装的产品重量服从正态
分布,每包标准重量为1000克。现随机抽查9包,测得样本平均重量为
100个该类型的元件,测得平均寿命为102(小时), 给定显著水平α=0.05,
问,该类型的电子元件的使用寿命是否有明显的提高?
解:该检验的假设为右单侧检验 H0: u≤100, H1: u>100
已知 z z0.05 1.645
zˆ x u0 n 100 (102 100 ) 2 1.645
986克,样本标准差是24克。问在α=0.05的显著水平下,能否认为生产线
工作正常? 解:该检验的假设为双侧检验 H0: u=0.5, H1: u≠0.5
已知 t /2 (n 1) t0.025 (9 1) 2.306, 而 tˆ x u 986 1000 1.75 可见 tˆ 1.75 2.306
设H0, 同时,说明该包装机生产正常。
其中 P( Z 1.8) 1 P( Z 1.8) 1 0.9281 0.0719 0.05。
第六章 假设检验
单侧举例:【例 6-4】某电子产品的平均寿命达到5000小时才算合格,
现从一批产品中随机抽出12件进行试验,产品的寿命分别为
5059, 3897, 3631, 5050, 7474, 5077, 4545, 6279, 3532, 2773, 7419, 5116
的显著性水平=0.05,试测算该日生产的螺丝钉的方差是否正常?

第六章--假设检验基础课件

第六章--假设检验基础课件
两样本所属总体方差相等且两总体均为正态分布
H 0 : 1 2H 1 :1 2 ( 单 1 2 或 侧 1 2 )
当H0成立时,检验统计量:
t X1X2 ~t, n1n22
Sc2n 11n12
第六章 假设检验基础
Sc2
n1
1S12 n2 1S22
n1 n2 2
X1 X1 2 X2 X2 2 n1 n2 2
第六章 假设检验基础
55、作出推断结论:当P≤时,结论为 按所取检验水准α拒绝H0,接受H1,差异有 统计学显著性意义。如果P> ,结论为按 所取检验水准α不拒绝H0,差异无统计学显 著性意义。其间的差异是由抽样误差引起
的。
第六章 假设检验基础
1.建立检验假设
原 假 设 H0:0 14.1 备 择 假H设1 :0(单 侧 ) 检 验 水 准: 0.05
第六章 假设检验基础
检验假设为:
H 0 : d 0H 1 :d 0 ( 单 d 0 或 侧 d 0 )
当H0成立时,检验统计量:
td0 ~t, n1
Sd n
第六章 假设检验基础
表6第-1二用节药前t后检患儿验血清中免疫球蛋白IgG(mg/dl)含量
二、序号配对设计资用料药前的t 检验 用药后
n1 20, X1 17.15,S1 1.59,n1 34, X2 16.92,S2 1.42
Sc2
n1
1S12 n2 1S22
n1 n2 2
2011.592 3411.422
20342
2.2 0
t X1 X2 17.1516.92 0.550
Sc2
1 n1
1 n2
2.20 1 1 20 34
得治疗前后舒张压(mmHg)的差值(前–后)如下表。问新药和标准药的疗效

第6章 假设检验

第6章  假设检验

2
2
n2 7.5 2 / 120 6.3 2 / 153 0.8533
u
X1 X 2 s X1X 2

139.9 143.7 0.8533
4.4353 u 0.05 2.58
P<0.01,差别有统计学意义,可认为该市1993年12岁男童平均身高比1973年高。
假设检验应注意的问题
t 检 验
样本均数与总体均数的比较

目的:推断该样本是否来自某已知总体; 样本均数代表的总体均数与0是否相等。

总体均数0一般为理论值、标准值或经大量观察所得并为人们接
受的公认值、习惯值。

解决思路:

区间估计

判断样本信息估计的总体均数之可信区间是否覆盖已知的 总体均数0 ?若不覆盖,则可推断该样本并非来自已知均 数的总体。
样本信息不支持H0,便拒绝之并接受H1,否则不拒绝H0 。
假设检验的基本步骤

建立假设 确定检验水准 计算检验统计量 计算概率P 结论

当P≤ 时,拒绝H0,接受H1,差别有统计学意义。
当P> 时,不拒绝H0,差别尚无统计学意义。
不论,拒绝拒绝H0,还是不拒绝H0都可能范错误。
同?
μ0 =132(g/L)
n=25
? =
μ
X 150 ( g / L) S 16.5( g / L)
已知总体
未知总体

目的:推断病人的平均血红蛋白(未知总体均
数)与正常女性的平均血红蛋白(已知总体均
数0)间有无差别
μ =μ0 ?
X 0 150 132 18

手头样本对应的未知总体均数 μ等于已知总体均数μ0,
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

9
(一)提出假设

包括原假设和备择假设。 原假设(Null Hypothesis)——待检验的假设,也称 为零假设,用 H0表示。 备择假设(Alternative Hypothesis )——也称对 立假设,与原假设内容完全相反的假设。准备在拒 绝原假设后应接受的假设。用 H1表示。对某个问题 提出了原假设,也就同时给出了备择假设。
30
利用 P 值进行决策
若p-值 ,不能拒绝 H0 若p-值 < , 拒绝 H0
31
P值与的关系显著性水平(图)
32
第二节 正态总体参数的检验
对正态总体均值的检验
一、总体方差已知时—— z 检验法 二、总体方差未知时—— t 检验法
对正态总体方差的检验
三、小样本时—— 卡方检验法
33
一、方差已知时对正态总体均值的检验——z检 验法
抽样分布

(1 -
临界值
HO的值
样本统计量
HO的拒绝区域
HO的不能拒绝区域
20
(四)计算检验统计量的值

根据样本资料计算出检验统计量 的观察值。
(五)作出检验结论
• 将检验统计量的值与 水平的临 界值进行比较,看其是否落在了 拒绝区内,从而得出接受或拒绝 原假设的结论。
21
三、假设检验中的两类错误
第六章 假设检验与方差分析
1
实际中的假设检验问题

产品自动生产线工作是否正常; 某种新生产方法是否会降低产品成本; 治疗某疾病的新药是否比旧药疗效更高; 厂商声称产品质量符合标准,是否可信; 学生考试成绩是否服从正态分布…
※ 假设检验——事先作出关于总体参数、分布形式 、相互关系等的命题,然后通过样本信息来判断该命 题是否成立。可分为: 参数检验和非参数检验。
2
第一节 假设检验的一般问题
一、假设检验的基本思想 二、假设检验的步骤 三、两类错误
3
一、假设检验的基本思想
例1. 某工厂规定产品次品率不超过4%,今天从 1000件产品中抽出10件,有4件次品,问这批产品能 否出厂(=整批产品的次品率P是否低于4% )? 提出假设:P≤4% 决策思路:
如果这一假设成立,则根据二项分布理论可算得:出现所 抽样本的概率小于1‰,即在次品率为4%的总体中抽出10 件产品有4件次品的概率是小于1 ‰ 。 这种可能性极小,但在一次抽样中发生了,显然不合理。 这种不合理性源于推论的假设前提,故上述假设不能接 受。即这批产品不能出厂。


原假设的提出应该本着“保守”或“不轻易拒绝”的原 则。
10
假设的三种形式:
0 H 0 : o , H 1 : 0 0

双侧检验 左侧检验 右侧检验
单侧检验
严格地讲,单侧检验中原假设应该用 “ ≤ ” 或 “ ≥ ” 表 示,且必须包括 “=” 。但实际检验时,只取其边界 值,该值能够拒绝,其它值更有理由拒绝。
7
假设检验必须以有关的 抽样分布理论为依据。
这样的值在一次观 察中出现的可能性 很小,... 如果这个值是 总体参数真值
在抽样观察中 出现这样的值 则很正常...
样本 观察值
总体参数 的假设值
样本估计量
8
二、假设检验的步骤
(一)提出原假设和备择假设 (二)确定检验统计量及其分布 (三)规定显著性水平 (四)计算检验统计量的值 (五)作出统计决策
13
14
15
(二)确定检验统计量及其分布

检验统计量是用于假设检验问题的统计量;检验 统计量及其分布是假设检验的具体理论依据。 选择统计量的方法与参数估计相同:

• •

是大样本还是小样本 总体方差已知还是未知
常用的检验统计量有:Z、t、卡方、F统计量 等。如:
Z
xX

n
~ N (0,1)
29
P值的计算
单侧检验中,P值通常为统计量分布曲线从检验 统计量的观察值到拒绝区域这一侧的面积。 设检验的统计量为ξ,c是计算得出的检验 统计量的值。
• 左侧检验时,P值= • 右侧检验时,P值=

P{ξ c } P{ξ c }
双侧检验中,P值=单侧P值的2倍。即: P值=2P{ξ≥c },当 c 在右侧时; 或: P值=2P{ξ≤c },当 c 在左侧时。
37
H
0
: X 10
H
1
: X 10
x X Z ~ N ( 0 ,1 ) n
由=0.05 查标准正态分布表得临界值
Z / 2 Z 0 .025 1 .96
x X 9 . 8 10 Z0 3 . 33 / n 0 . 6 / 100
因为 Z 3.33 Z / 2 1.96 故拒绝原假设,接 受备择假设,即每袋大米的重量有显著变 化,所以不能接受这种包装线。

Z检验法——利用服从标准正态分布的 Z
统计量进行假设检验的方法。 对总体均值的Z检验,主要适用于:

• 若总体呈正态分布,且总体方差已知时; • 若总体非正态分布, 但 n 30 时可近似采用Z
检验
34


H0:
X X0
;H1:
X (or or ) X 0 ,
根据抽样分布理论,总体方差已知时,对均值 的检验统计量为:
• 选择检验统计量 Z • 给定显著性水平1%,查临界值Zα/2=2.58 • 计算检验统计量的观察值: z =-26 • 比较检验统计量的值|z|和临界值,作出结论——
拒绝原假设。
36
例,某公司引进一自动包装线包装大米, 设计规格为每袋大米10公斤,标准差4为 0.6公斤。随机抽取100袋大米,调查表 明:每袋大米平均重量为9.8公斤。在α为 5%的显著水平下,该自动包装线可否接 受?
28

P值表示所观察到的样本对原假设的支持 程度。

P值越大,在原假设为真的情况下,样本出现 的概率越大,出现这样的样本不是小概率事 件,说明原假设不能拒绝。反之, P值越小, 在原假设为真的情况下,样本出现的概率越 小,出现这样的样本属于小概率事件,而实际 却正好抽到了这样的样本,说明原假设不能成 立,应拒绝原假设。
1.第一类错误( “弃真”或“拒真” 错误) 原假设为真时拒绝原假设(例1,当产品本来合格时) 犯第一类错误的概率为 被称为显著性水平)
Prob (拒绝H0 / H0为真)=
2.第二类错误(“取伪”或“采伪”错误)
原假设不真时接受原假设
例如,产品销售方承诺次品率<2%,这是假的。但买方检验 时作出了信任卖方的错误结论,购买了本来不合格的产 品. 第二类错误的概率为
Prob(接受H0 / H0不真)=
22
决策结果与两类错误
实际情况 决策 H0为真 第一类错误 (拒真) ( 接受H0 正确 (1 – ) H0为不真
拒绝H0
正确 (1- 第二类错误 (采伪) (
23
和 的关系
在检验中人们总希望犯两类错误的可能性都 很小,然而,在其它条件不变的情况下, 和 不可能同时减小,就象交易中买卖双方各自承担 的风险一样。

视两类错误所产生的后果轻重而定
• •

当犯第一类错误的后果严重时,则希望尽可能不犯第一 类错误,宁愿犯第二类错误,此时α宜小。 当犯第二类错误的后果严重时,则希望尽可能不犯第二 类错误,宁愿犯第一类错误,此时α不宜太小
事前对原假设的信念
• 对原假设越有信心,则越小;反之则越大
26
影响 错误的因素
11
12
单侧检验
有些情况下,我们关心的假设问题带有方向性, 有两种情况:一种是我们所考察的数据越大越 好,如产品的使用寿命、利润率等;另一种是我 们所考察的数据越小越好,如废品率、单位成本 等。这时检验的拒绝区域在分布的左侧或右侧。 如果我们提出的原假设是μ≥ 0 或μ≤ 0
H 0 :μ ≥ 0 ——左侧检验(下限检验) H 0 :μ≤ 0 ——右侧检验(上限检验)
ቤተ መጻሕፍቲ ባይዱ
反证法带有概率性质

判断是否合理的依据统计上的小概率原理, 并非严格的逻辑证明。
6
假设检验中的小概率原理
• • • • •
小概率事件:发生概率很小的随机事件 小概率原理:小概率事件在一次试验(观察) 中几乎不可能发生。 什么样的概率才算小概率? 研究者事先确定(根据决策的风险或要求的 把握程度来决定),没有统一的界定标准。 假设检验中把这个概率称为检验的 “显著性水 平”,用 表示。
4

例2. 某零件原平均长度为4 cm,标准差为0.02 cm。进 行工艺改革后,抽取样本:n=100,平均长度 =3.948。 问:改革后的零件长度是否有显著变化( = 零件平均长 度是否为4 cm )?
假设:改革后 x =4, 根据抽样分布理论,有:
x ~ N ( X , / n ), 即: Z ( x X ) /( / n ) 26 Z


α和β的关系 就好比翘翘板
24

一般说,哪一类错误带来的后果越严重、 危害越大,就应该作为首要的控制目标. 在假设检验中,一般都首先控制第一类错 误,也即控制α.

• 大家都遵守这个原则,讨论问题比较方便; • 最主要的原因是:原假设是什么非常明确,而
备择假设往往是模糊的。
25
确定α时应考虑的因素
1
: X 1000
x X Z ~ N ( 0 ,1 ) n
由=0.05 查标准正态分布表得临界值 Z / 2 Z 0 . 025 1 . 96
x X 1050 1000 Z0 2 .5 n 100 / 25
相关文档
最新文档