(08)第8章 假设检验

合集下载

第8章假设检验

第8章假设检验

二、两均数比较的u检验
完全随机设计中两组计量资料的比较
观察性研究中分别从两个总体中随机抽取两个计 量资料样本进行比较,且两组的样本含量n1和n2要 求等于或大于30 基本原理:在H0成立的条件下,即两样本是从 同一总体随机抽取的,其均数之差可以大于0,或小 于0,围绕0分布。 差值 X1 X 2 服从均数为 1 2 0,标准差(两均数 差的标准误)为 S X X 的正态分布
0
所代表的未知总体均数记作μ;检验的目的是推断μ与μ0
是否有差别
u
X 0 S/ n
例 8 –2
n 85
S 5.3cm
X 171.2cm
168.5cm
1. 建立假设、确定检验水准α。
H 0 : 168.5 (与1995年相比,2003年当地20岁应征男青年的身 高没有变化)

2
p
的正态分布
统计量:
u p 0 p 0 0 (1 0 ) / n
p
例8 – 4
π0 =8.5% ,n=1000,p=5.5%
1.建立假设,确定检验水准。 H0:π=8.5% H1:π< 8.5% 单侧检验,α=0.05。 2.计算检验统计量u值
0.055 0.085 u 3.402 0.085(1 0.085) /1000
2. 样本数据不要求一定服从正态分布总体。
2. 两总体方差相等(方差齐性,即 12 22 )。
3. 理论上要求:单样本是从总体中随机抽取,两样本为随 机分组资料;观察性资料要求组间具有可比性,保证因果 推论的合理性。
一、单样本均数的u检验
样本均数与总体均数比较,总体均数指已知的理论值、 标准值或经过大量观察所得到的稳定值,记作 ;样本

概率论与数理统计第8章(公共数学版)

概率论与数理统计第8章(公共数学版)
则犯弃真错误的概率为
P (弃真)
P(拒 绝H0
|
H

0
真)
P(
A
|
H

0
真)
小概率事件发生的概率就是犯弃真错误的概率
越大,犯第一类错误的概率越大, 即越显著. 故在检验中,也称为显著性水平
20
2.第二类错误:纳伪错误




设H

0



的, 但






了Hቤተ መጻሕፍቲ ባይዱ
0
此时我们便犯了“纳伪”错误,也称为第二类错误
统计量观测值 u 57.9 53.6 2.27 6 10
该批产品次品率 p 0.04 , 则该批产品不能出厂.
11
若从一万件产品中任意抽查12件发现1件次品
p 0.04 代入
取 0.01,则 P12(1) C112 p1(1 p)11 0.306 0.01
这不是小概率事件,没理由拒绝原假设,从而接受 原假设, 即该批产品可以出厂.
13
例2 某厂生产的螺钉,按标准强度为68/mm2, 而实际
称其中的一个为原假设,也称零假设或基本假设 记 为H0 称另一个为备择假设,也称备选假设或对立假设 记为H1 一般将含有等号的假设称为原假设
7
二、假设检验的基本原理
假设检验的理论依据是“小概率原理” 小概率原理:如果一个事件发生的概率很小,那么在一 次实验中,这个事件几乎不会发生. 如: 事件“掷100枚均匀硬币全出现正面”
(三)对给定(或选定)的显著性水平 ,由统计
量的分布查表确定出临界值,进而得到H0的拒绝域 和接受域.

第8章_假设检验8.4_置信区间与假设检验之间的关系

第8章_假设检验8.4_置信区间与假设检验之间的关系

例1 设 X ~ N ( , 1), 未知, 0.05, n 16,
且由一样本算得 x 5.20 ,
于是得到参数 的一个置信水平为 0.95 的置信 1 1 区间 ( x z0.025 , x z0.025 ) 16 16
(5.20 0.49, 5.20 0.49) (4.71, 5.69 ).
反之 ,为要求出参数 的置信水平为 1 的 置信区间 ,
要先求出显著水平为 的检验假设
H 0 : 0 , H1 : 0 , 的接受域 : 0
( , ) 是参数的一个置信水平为1 的置信区间
2. 置信区间与单边检验之间的对应关系
(1)置信水平为 1 的单侧置信区间
(, ) 与显著水平为 的左边检验问题 H 0 : 0 , H1 : 0 有类似的对应关系.
若已求得单侧置信区间 (, ),
则当 0 (, ) 时接受 H0 ;
当 0 (, ) 时拒绝 H0 .
第四节 置信区间与假设检验之间 的关系
一、置信区间与双边检验之间的对应关系 二、 置信区间与单边检验之间的对应关系 三、小结
区间估计与假设检验的联系
1.区间估计与假设检验都是根据样本信息对总体参 数进行推断,都是以抽样分布为理论依据,都是 建立在概率基础上的推断,推断结果都有一定的 可信程度或风险。 2.对同一问题的参数进行推断,二者使用同一样本、 同一统计量、同一分布,因而二者可以相互转换。 区间估计问题可以转换成假设问题,假设问题也 可以转换成区间估计问题。区间估计中的置信区 间对应于假设检验中的接受区域,置信区间以外 的区域就是假设检验中的拒绝域。
单侧置信区间 (4.79, ), 单侧置信下限 4.79.

第八章 假设检验

第八章 假设检验

解:研究者抽检的意图是倾向于证实这 种洗涤剂的平均净含量并不符合说明书 中的陈述 。建立的原假设和备择假设为 H0 : m 500 H1 : m < 500
500g
左侧检验
H0:u 500
抽样分布
拒绝域
(显著性水平与拒绝域 ) H1:u < 500
置信水平

1- 接受域 H0值 样本统计量

【例1】一种零件的生产标准是直径应为10cm,为 对生产过程进行控制,质量监测人员定期对一台加 工机床检查,确定这台机床生产的零件是否符合标 准要求。如果零件的平均直径大于或小于10cm,则 表明生产过程不正常,必须进行调整。试陈述用来 检验生产过程是否正常的原假设和被择假设
解:研究者想收集证据予以证明的假设应 该是“生产过程不正常”。建立的原假设 和备择假设为 H0 : m 10cm H1 : m 10cm
双侧检验的接受域和拒绝域
抽样分布
拒绝域 /2 1- /2 接受域 置信水平 拒绝域
临界值
H0值
临界值
样本统计量
双侧检验的接受域和拒绝域
抽样分布
拒绝域 /2 1- 接受域 H0值 样本统计量 置信水平 拒绝域 /2
临界值
临界值
提出假设(例题分析)

【例2】某品牌洗涤剂在它的产品说明书中声称: 平均净含量不少于500克。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验证 该产品制造商的说明是否属实。试陈述用于检验 的原假设与备择假设
-1.645
0
U
【例】根据过去大量资料,某厂生产的
灯泡的使用寿命服从正态分布N(1020, 1002)。现从最近生产的一批产品中随机 抽取16只,测得样本平均寿命为1080小 时。试在0.05的显著性水平下判断这批产 品的使用寿命是否有显著提高?(=0.05)

(08)第8章 假设检验

(08)第8章  假设检验

是大样本还是小样本 总体方差已知还是未知
3. 检验统计量的基本形式为 X 0 Z n 8 - 13
作者:徐刚,河南城建学院数理系
统计学
STATISTICS
规定显著性水平
(significant level)
(第五版)
什么是显著性水平? 1. 是一个概率值
2. 原假设为真时,拒绝原假设的概率
决策:
在 = 0.05的水平上拒绝H0
结论:
有证据表明这批灯泡的使用 寿命有显著提高
作者:徐刚,河南城建学院数理系
8 - 36
0
1.645
Z
统计学
STATISTICS
2 未知大样本均值的检验
(例题分析)
单侧检验
(第五版)
【例】某电子元件批量生产的 质量标准为平均使用寿命 1200 小时。某厂宣称他们采用一种 新工艺生产的元件质量大大超 过规定标准。为了进行验证, 随机抽取了 100 件作为样本, 测得平均使用寿命 1245 小时, 标准差 300 小时。能否说该厂 生产的电子元件质量显著地高 于规定标准? (=0.05)
(第五版)
拒绝
1/2 P 值
临界值
计算出的样本统计量
8 - 18
H0值
临界值
Z
计算出的样本统计量
作者:徐刚,河南城建学院数理系
统计学
STATISTICS
左侧检验的P 值
置信水平
(第五版)
抽样分布
拒绝域

1-
P值
临界值 计算出的样本统计量 8 - 19
H0值
样本统计量
作者:徐刚,河南城建学院数理系
左侧检验时,P-值为曲线上方小于等于检 验统计量部分的面积 右侧检验时,P-值为曲线上方大于等于检 验统计量部分的面积

统计学第8章假设检验

统计学第8章假设检验

市场调查中常用的假设检验方法包括T检验、Z检验和卡方 检验等。选择合适的检验方法需要考虑数据的类型、分布 和调查目的。例如,对于连续变量,T检验更为适用;对于 分类变量,卡方检验更为合适。
医学研究中假设检验的应用
临床试验
在医学研究中,假设检验被广泛应用于临床试验。研究 人员通过设立对照组和实验组,对不同组别的患者进行 不同的治疗,然后收集数据并使用假设检验来分析不同 治疗方法的疗效。
03 假设检验的统计方法
z检验
总结词
z检验是一种常用的参数检验方法,用于检验总体均值的假设。
详细描述
z检验基于正态分布理论,通过计算z分数对总体均值进行检验。它适用于大样本 数据,要求数据服从正态分布。z检验的优点是简单易懂,计算方便,但前提假 设较为严格。
t检验
总结词
t检验是一种常用的参数检验方法,用于检验两组数据之间的差异。
卡方检验
总结词
卡方检验是一种非参数检验方法,用于 比较实际观测频数与期望频数之间的差 异。
VS
详细描述
卡方检验通过计算卡方统计量来比较实际 观测频数与期望频数之间的差异程度。它 适用于分类数据的比较,可以检验不同分 类之间的关联性。卡方检验的优点是不需 要严格的假设前提,但结果解释需谨慎。
04 假设检验的解读与报告
详细描述
t检验分为独立样本t检验和配对样本t检验,分别用于比较两组独立数据和同一组数据在不同条件下的 差异。t检验的前提假设是小样本数据近似服从正态分布。t检验的优点是简单易行,但前提假设需满 足。
方差分析
总结词
方差分析是一种统计方法,用于比较两个或多个总体的差异。
详细描述
方差分析通过分析不同组数据的方差来比较各组之间的差异。它适用于多组数据的比较,可以检验不同因素对总 体均值的影响。方差分析的前提假设是各组数据服从正态分布,且方差齐性。

管理定量分析课程第8章:假设检验

管理定量分析课程第8章:假设检验

判决
无罪 有罪
陪审团审判
真实的情况
无罪
有罪
判决正确
判决错误
判决错误
判决正确
结论
未拒绝原假设 拒绝原假设
假设检验 总体参数的实际情况
原假设为真 备择假设为真 结论正确 第二类错误 第一类错误 结论正确
11
假设检验中犯Ⅰ型错误的概率,称为显著性水平(level of significance),即指当零假设实际上是正确时,检验统计量落
7
又如:教育部要检验2012年录取的大学新生平均身高是否 达到了170cm标准,这样需要提出原假设(H0):2012
年大学新生(总体)的平均身高(µ )是170cm。为了检
验这个假设是否正确,需要根据随机取样的原则,从2012 年的大学新生总体中选取样本并计算样本的平均高度,以 此来检验原假设的正确性。
8
假设检验一般分为参数假设检验和非参数假设检验两种类型。参 数假设检验对变量的要求较为严格,适合于等距变量和比率变量 ,非参数假设检验对变量的要求较为自由,既适合于等距变量和 比率变量,也适用于类别变量和顺序变量。
变量测量层次
分类(nominal)变 量
数学性(interval)变量
4
一、假设与假设检验
假设是科学研究中广泛应用的方法,它是根据已知理 论与事实对研究对象所作的假定性说明。统计学中的 假设一般专指用统计学术语对总体参数所做的假定性 说明。在进行任何一项研究时,都需要根据已有的理 论和经验事先对研究结果作出一种预想的假设。这种 假设叫科学假设,在统计学上称为研究假设。对这种 研究假设进行证实或证伪的过程叫假设检验。
非参数检验是一种与总体分布状况无关的检验方法,它不 依赖于总体分布的形式。

第8章假设检验含答案

第8章假设检验含答案
答案:C
5.在假设检验中,拒绝实际上不成立的H0假设是( ) 。
A、 犯第I类错误 B、 犯第II类错误 C、 推断正确 D、 A,B都有可能
答案:C
6.α=0.05, t>t0.05,ν,统计上可认为()。
A、两总体均数差别无显著意义 B、两样本均数差别无显著意义
C、两总体均数差别有显著意义D、两样本均数差别有显著意义
答案:A
3.在假设检验中,由于抽样偶然性,接受了实际上不成立的H0假设,则( )。
A、 犯第I类错误 B、 犯第II类错误 C、 推断正确 D、 A,B都有可能
答案:B
4.在假设检验中,接受了实际上成立的H0假设,则( )。
A、 犯第I类错误 B、 犯第II类错误 C、 推断正确 D、 A,B都有可能
9.假设检验中,显著性水平表示()。
A、P{接受 | 为假} B、P{拒绝 | 为真}
C、置信度为D、无具体含义
答案:B
11.在对总体参数的假设检验中,若给定显著性水平(0<<1),则犯第一类错误的概率为()。
A.1-B、C、/2 D、不能确定
答案:B
12.对某批产品的合格率进行假设检验,如果在显著性水平=0.05下接受了零假设,则在显著性水平=0.01下()。
C、样本量太大容易引起检验结果显著
D、样本量太小容易引起检验结果显著
答案:BC
13.以下问题可以用Z检验的有( )。
A、正态总体均值的检验,方差已知
B、正态总体均值的检验,方差未知
C、大样本下总体均值的检验
D、正态总体方差的检验
答案:AC
14.对总体均值进行检验,影响检验结论的因素有( )
A、显著性水平B、样本量n
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

8-3
统计学
STATISTICS
8.1 假设检验的基水平 8.1.3 统计量与拒绝域
8-4
统计学
STATISTICS
假设的陈述
8-5
统计学
STATISTICS
什么是假设? 什么是假设?
(hypothesis) hypothesis)
我认为这种新药的疗效 比原有的药物更有效! 比原有的药物更有效!
8 - 15
H1 : µ > 30%
统计学
STATISTICS
提出假设
(结论与建议) 结论与建议)
1. 原假设和备择假设共同构成一个完备事件组 ,而且相互对立
在一项假设检验中, 在一项假设检验中, 原假设和备择假设必有一 个成立, 个成立,而且只有一个成立
2. 一般经验:先确定备择假设,再确定原假设 一般经验:先确定备择假设, 3. 因研究目的不同,对同一问题可能提出不同 因研究目的不同, 的假设(也可能得出不同的结论) 的假设(也可能得出不同的结论) 4. 等号“=”总是放在原假设上 等号“
3. 当不拒绝原假设时
并未给出明确的结论 不能说原假设是正确的, 不能说原假设是正确的,也不能说它不是正确的 例如, 当不拒绝H 例如, 当不拒绝H0:µ=10,我们并未说它就是10 10,我们并未说它就是10 , 但也未说它不是 10。 我们只能说样本提供的证 但也未说它不是10 。 据还不足以推翻原假设 据还不足以推翻原假设
什么是小 概率?
8 - 25
统计学
STATISTICS
检验统计量与拒绝域
8 - 26
统计学
STATISTICS
检验统计量
(test statistic) statistic)
1. 根据样本观测结果计算得到的,并据以对原 根据样本观测结果计算得到的, 假设和备择假设作出决策的某个样本统计量 2. 是对样本估计量的标准化结果 3. 标准化的检验统计量
备择假设的方向为“< 备择假设的方向为“<”,称为左侧检验 备择假设的方向为“> 备择假设的方向为“>”,称为右侧检验
8 - 18
统计学
STATISTICS
双侧检验与单侧检验
(假设的形式) 假设的形式)
单侧检验 左侧检验
H0 : µ ≥ µ0
假设
原假设 备择假设
双侧检验
H0 : µ = µ0 H1 : µ ≠µ0
抽样分布
拒绝H 拒绝H0
α /2
α /2
临界值
8 - 29
0
临界值
检验统计量
观察到的样本统计量
统计学
STATISTICS
显著性水平和拒绝域
(双侧检验 )
置信水平 拒绝H 拒绝H0 1-α
抽样分布
拒绝H 拒绝H0
α /2
α /2
临界值
8 - 30
0
临界值
检验统计量
观察到的样本统计量
统计学
STATISTICS
点估计量—假设值 标准化的检验统计量= 点估计量的抽样标准差
8 - 27
统计学
STATISTICS
显著性水平和拒绝域
(双侧检验 )
置信水平 拒绝H 拒绝H0 1-α
抽样分布
拒绝H 拒绝H0
α/2
α/2
临界值
8 - 28
0
临界值
检验统计量
统计学
STATISTICS
显著性水平和拒绝域
(双侧检验 )
置信水平 拒绝H 拒绝H0 1-α
我认为人口的平 均年龄是50 50岁 均年龄是50岁
总体

☺ ☺ ☺ ☺ ☺ ☺ ☺ ☺
抽取随机样本
8-9
均值 ☺ ☺x = 20
统计学
STATISTICS
原假设与备择假设
8 - 10
统计学
STATISTICS
原假设
(null hypothesis)
1. 研究者想收集证据予以反对的假设 究者想收集证据予以反对 反对的假设 2. 又称“0假设” 又称“0 3. 表示为 H0
显著性水平和拒绝域
(右侧检验 )
置信水平 拒绝H 拒绝H0 1-α
抽样分布
α
0 观察到的样本统计量
8 - 35
检验统计量 临界值
统计学
STATISTICS
显著性水平和拒绝域
(右侧检验 )
置信水平 拒绝H 拒绝H0 1-α
抽样分布
α
0
8 - 36
临界值
检验统计量
观察到的样本统计量
统计学
STATISTICS
4. 由研究者事先根据研究目的和研究对象 的特点确定(根据实际情况) 的特点确定(根据实际情况)
8 - 24
统计学
STATISTICS
假设检验中的小概率原理
什么是小概率? 什么是小概率? 1. 在一次试验中 , 一个几乎不可能发生的 在一次试验中, 事件发生的概率 2. 在一次试验中小概率事件一旦发生 , 我 在一次试验中小概率事件一旦发生, 们就有理由拒绝原假设 3. 小概率由研究者事先确定
你不能同时减 少两类错误! 少两类错误
β α
8 - 23
统计学
STATISTICS
显著性水平α
(significant level) level)
1. 是一个概率值 2. 原假设为真时,拒绝原假设的概率
被称为抽样分布的拒绝域
3. 表示为 α (alpha)
常用的 α 值有0.01, 0.05, 0.10 值有0.01,
决策规则
1. 给定显著性水平α,查表得出相应的临界 值zα或zα/2, tα或tα/2 2. 将检验统计量的值与α 水平的临界值进 行比较 3. 作出决策
双侧检验:I检验统计量I 双侧检验:I检验统计量I > 临界值,拒绝 H0 左侧检验:检验统计量 临界值,拒绝H 左侧检验:检验统计量 < -临界值,拒绝H0 右侧检验:检验统计量 临界值,拒绝H 右侧检验:检验统计量 > 临界值,拒绝H0
8 - 16
统计学
STATISTICS
双侧检验与单侧检验
8 - 17
统计学
STATISTICS
双侧检验与单侧检验
1. 备择假设没有特定的方向性,并含有符号 “≠”的假设检验,称为双侧检验或双尾 检验(two检验(two-tailed test) 2. 备择假设具有特定的方向性,并含有符号 “>”或“<”的假设检验,称为单侧检验或 >”或“<”的假设检验,称为单侧检验或 单尾检验(one单尾检验(one-tailed test)
8 - 14
H0 : µ ≥ 500
H1 : µ < 500
500g
统计学
STATISTICS
提出假设
(例题分析) 例题分析)
【 例 】 一家研究机构估计, 某城市中家庭拥有汽车 一家研究机构估计, 的比例超过30% 为验证这一估计是否正确, 的比例超过 30% 。 为验证这一估计是否正确 , 该研究机构随机抽取了一个样本进行检验。 该研究机构随机抽取了一个样本进行检验 。 试 陈述用于检验的原假设与备择假设 解:研究者想收集证据予以支持的假 设是“该城市中家庭拥有汽车的比例 超过30%” 超过30%”。建立的原假设和备择假设 为 H0 : µ ≤ 30%
解 : 研究者想收集证据予以证明的 假设应该是“ 生产过程不正常” 假设应该是 “ 生产过程不正常 ” 。 建立的原假设和备择假设为 H0 : µ = 10cm 10cm
8 - 13
H1 : µ ≠ 10cm 10cm
统计学
STATISTICS
提出假设
(例题分析) 例题分析)
【 例 】 某品牌洗涤剂在它的产品说明书中声称:平 均净含量不少于500克 从消费者的利益出发, 均净含量不少于500克。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。 证该产品制造商的说明是否属实 。 试陈述用于 检验的原假设与备择假设 解 : 研究者抽检的意图是倾向于证 绿叶 实这种洗涤剂的平均净含量并不符 洗涤剂 合说明书中的陈述 。建立的原假设 和备择假设为
8-7
统计学
STATISTICS
假设检验的基本思想
抽样分布
这个值不像我 们应该得到的 样本均值 ...
... 因此我们拒 绝假设 µ = 50
... 如果这是总 体的真实均值 20
8-8
µ = 50 H0
样本均值
统计学
STATISTICS
假设检验的过程
提出假设 作出决策
拒绝假设 别无选择! 别无选择
8 - 37
统计学
STATISTICS
假设检验结论的表述
8 - 38
统计学
STATISTICS
假设检验结论的表述
1. 假设检验的目的就在于试图找到拒绝原假设, 假设检验的目的就在于试图找到拒绝原假设, 而不在于证明什么是正确的 2. 拒绝原假设时结论是清楚的
例如, 例如,H0:µ=10,拒绝H0时,我们可以说µ≠10 10,拒绝H 我们可以说µ≠10
2. 第Ⅱ类错误(取伪错误) 类错误(取伪错误)
原假设为假时未拒绝原假 设 第Ⅱ类错误的概率记为 β (Beta)
8 - 21
α
β
统计学
STATISTICS
假设检验中的两类错误
(决策结果) 决策结果)
假设检验就好像一场审判过程
H0: 无罪
统计检验过程
陪审团审判 实际情况 裁决 无罪 无罪 有罪
8 - 22
显著性水平和拒绝域
(左侧检验 )
置信水平
相关文档
最新文档