第八章假设检验
合集下载
第8章假设检验

二、两均数比较的u检验
完全随机设计中两组计量资料的比较
观察性研究中分别从两个总体中随机抽取两个计 量资料样本进行比较,且两组的样本含量n1和n2要 求等于或大于30 基本原理:在H0成立的条件下,即两样本是从 同一总体随机抽取的,其均数之差可以大于0,或小 于0,围绕0分布。 差值 X1 X 2 服从均数为 1 2 0,标准差(两均数 差的标准误)为 S X X 的正态分布
0
所代表的未知总体均数记作μ;检验的目的是推断μ与μ0
是否有差别
u
X 0 S/ n
例 8 –2
n 85
S 5.3cm
X 171.2cm
168.5cm
1. 建立假设、确定检验水准α。
H 0 : 168.5 (与1995年相比,2003年当地20岁应征男青年的身 高没有变化)
2
p
的正态分布
统计量:
u p 0 p 0 0 (1 0 ) / n
p
例8 – 4
π0 =8.5% ,n=1000,p=5.5%
1.建立假设,确定检验水准。 H0:π=8.5% H1:π< 8.5% 单侧检验,α=0.05。 2.计算检验统计量u值
0.055 0.085 u 3.402 0.085(1 0.085) /1000
2. 样本数据不要求一定服从正态分布总体。
2. 两总体方差相等(方差齐性,即 12 22 )。
3. 理论上要求:单样本是从总体中随机抽取,两样本为随 机分组资料;观察性资料要求组间具有可比性,保证因果 推论的合理性。
一、单样本均数的u检验
样本均数与总体均数比较,总体均数指已知的理论值、 标准值或经过大量观察所得到的稳定值,记作 ;样本
第八章假设检验

原假设
H0
6. 假设检验的一般步骤
第一步 提出待检验的原假设H 0和对 立假设 H1 ; 第二步 选择检验统计量,并找出在假设 H0 成立条件下 ,该统计量所服从的概率分布; 第三步 根据所要求的显著性水平α 和所 选取的统计量,查概率分布临界值表,确定临界 值与否定域; 第四步 将样本观察值代入所构造的检验 统计量中,计算出该统计量的值,若该值落入否 定域,则拒绝原假设H 0 ,否则接受原假设H 0 .
2 (4)将样本观测值代入,得 =16.79 >14.449 故拒绝原假设.即认为方差不是0.1122.
i 1
4.未知期望μ,σ2的(单侧)假设检验: (1)提出原假设和备择假设: H0: σ2 ≤σ02; H1: σ2 >σ02
2 ( n 1 ) S 2 (2)选择统计量 2 0
解:由题意得:用简便方法测得有害气体含量X~N(μ,22), 假设 H0: μ=23, 若H0成立,则 若取α=0.05,则 P{|U|>z1-α/2}=α, 即: P{|U|>1.96}=0.05,
X U ~ N(0,1) / n
在假设成立的条件下,|U|>1.96为概率很小事件,一般认为: 小概率事件在一次实验中是不会发生的,
假设检验 μ=23,σ2=22
例8.1.3.用精确方法测量某化工厂排放的气体中有害气 体的
含量服从正态分布N(23,22),现用一简便方法测量6次得一组数据
23,21,19,24,18,18(单位:十万分之一),若用简便方法测得有害气体含量 的方差不变,问用该方法测得有害气体含量的均值是否有在假设检验中,否定原假设的理由是小概率事件在一次试 验中出现了,但小概率事件并不是不会出现,只是出现的可 能性较小,即出现的概率不超过很小的正数 ,
第八章 假设检验

Z X 0 n
规定显著性水平
(significant level) ❖ 什么是显著性水平? ❖ 1. 是一个概率值
❖ 2. 原假设为真时,拒绝原假设的概率
被称为抽样分布的拒绝域
❖ 3. 表示为 (alpha)
常用的 值有0.01, 0.05, 0.10
❖ 4. 由研究者事先确定
作出统计决策
3. 最初被假设是成立的,之后根据样本数据确定是否 有足够的证据拒绝它
4. 总是有符号 , 或
H0 : = 某一数值 H0 : 某一数值 H0 : 某一数值
例如, H0 : 10cm
备择假设
(alternative hypothesis)
1. 也称“研究假设”,研究者想收集证据予以支持的 假设(期望出现的结论作为备选假设),用H1或Ha表 示
学习目标
假设检验的基本思想和原理 假设检验的步骤 一个总体参数的检验 两个总体参数的检验 P值的计算与应用 用Excel进行检验
正常人的平均体温是37oC吗?
37.1 36.9 36.9 37.1 36.4
➢ 当问起健康的 成年人体温是
36.9
36.6
36.2
36.7
36.9
多 少 时 , 多 数 37.6 36.7 37.3 36.9 36.4
的饮料容量是否符合标准要求?
双侧检验
总体均值的检验( 2 已知)
(例题分析-大样本)
❖ H0 : = 255 ❖ H1 : 255 ❖ = 0.05
❖ n = 40 ❖ 临界值(c):
拒绝 H0
0.025
拒绝 H0
0.025
-1.96 0 1.96 z
检验统计量:
zx0 25.852551.01 n 5 40
规定显著性水平
(significant level) ❖ 什么是显著性水平? ❖ 1. 是一个概率值
❖ 2. 原假设为真时,拒绝原假设的概率
被称为抽样分布的拒绝域
❖ 3. 表示为 (alpha)
常用的 值有0.01, 0.05, 0.10
❖ 4. 由研究者事先确定
作出统计决策
3. 最初被假设是成立的,之后根据样本数据确定是否 有足够的证据拒绝它
4. 总是有符号 , 或
H0 : = 某一数值 H0 : 某一数值 H0 : 某一数值
例如, H0 : 10cm
备择假设
(alternative hypothesis)
1. 也称“研究假设”,研究者想收集证据予以支持的 假设(期望出现的结论作为备选假设),用H1或Ha表 示
学习目标
假设检验的基本思想和原理 假设检验的步骤 一个总体参数的检验 两个总体参数的检验 P值的计算与应用 用Excel进行检验
正常人的平均体温是37oC吗?
37.1 36.9 36.9 37.1 36.4
➢ 当问起健康的 成年人体温是
36.9
36.6
36.2
36.7
36.9
多 少 时 , 多 数 37.6 36.7 37.3 36.9 36.4
的饮料容量是否符合标准要求?
双侧检验
总体均值的检验( 2 已知)
(例题分析-大样本)
❖ H0 : = 255 ❖ H1 : 255 ❖ = 0.05
❖ n = 40 ❖ 临界值(c):
拒绝 H0
0.025
拒绝 H0
0.025
-1.96 0 1.96 z
检验统计量:
zx0 25.852551.01 n 5 40
第八章 假设检验

式中r即量表X和Y的相关系数。 Z检验
公式8-6
Z X X S
Z
8-6
( X 1 X 2 ) ( 1 2 ) SEDX
Z
DX SE DX
12 22 1 2 SEDX 2r n n n n
[例8-7] 1、分析 2、假设检验的步骤 1、根据问题要求,提出虚无假设和备择假 设 2、选择适当的检验统计量 3、规定显著性水平 4、计算检验统计量的值 5、做出决策
二、总体正态分布、总体方差未知 由于总体方差未知,要用其无偏估计量 sn 1 来代替σ0。这时临界比率的分布服从t 分布,因而总体方差未知时所进行的检验 称作t检验。
抑郁自评量表分析
实 例 分 析: 请您分析一下男女生 的抑郁状况是否存在差异?
评定标准
评定采用1--4制记分,评定时间为过去一 周内。 把各题的得分相加为粗分,粗分乘以1.25, 四舍五入取整数即得到标准分。抑郁评定 的临界值为T分50,分值越高,抑郁倾向越 明显。
公 式 8-2
X X Z S
8-2
X 0 t s n 1
[例8-4] 1、分析 2、假设检验的步骤 1、根据问题要求,提出虚无假设和备择假 设 2、选择适当的检验统计量 3、规定显著性水平 4、计算检验统计量的值 5、做出决策
Z检验又叫大样本检验,t检验又叫小样本检 验。
分析:增加的5分,可能由于随机抽样引起, 也可能由于抛锚式教学法确实比原来的教 学法好,前者称为随机误差,后者称为系 统误差。
三、假设检验中的小概率原理 假设检验中的小概率原理:小概率事件在一次试 验中几乎是不可能发生的。 为了检验虚无假设,首先假定虚无假设为真。 在虚无假设为真的前提下,如果导致违反逻辑或 违背人们常识和经验的不合理现象出现,则表明 “虚无假设为真”的假定是不正确的,也就不能 接受虚无假设。
第八章 假设检验

广 东 工 业 大 学
上页
下页
返回
1、原假设与备择假设 H0 2、原理
H1
小概率原理:小概率事件在一次试验中是不太会发生的。 (1)提出假设 H 0 (2)在假设 H 0 成立的条件下,构造一个小概率事件A, (3)根据样本值判断:
若在这一次试验中小概率事件A发生了,则拒绝假设 H 0 ,
若在这一次试验中小概率事件A未发生,则接受假设 H 0 .
广 东 工 业 大 学
上页
下页
返回
显著性水平 3、接受域与拒绝域
P{ A} P{样本落入区域 } R
拒绝域: R 接受域: R 4、两类错误
第一类错误: 弃真
小概率
样本点落入R:拒绝 H 0
样本点落入 R : 接受 H 0
犯第一类错误的概率:
H 0 正确,但拒绝了它。
第二类错误: 采伪
工 业 大 学
上页
下页
返回
二、假设检验的思想方法 假设检验的基本思想实质上是带有某种概率性质的反证 法。为了检验一个假设是否正确,首先假设该假设正确,然 后根据抽取到的样本对假设作出接受或拒绝的决策。如果样 本观察值导致了不合理的现象发生,就应拒绝假设,否则应 该接受假设。
假设检验中所谓“不合理”,并非逻辑中的绝对矛盾,而 是基于人们的实践活动中广泛采用的原则,即小概率事件在一 次试验中是几乎不发生的。但概率小到什么程度才能算作“小 概率事件”?显然,“小概率事件”的概率越小,否定原假设 就越有说服力。 广
上页
广 东 工 业 大 学
下页
返回
例1 某砖厂生产的砖其抗拉强度X服从正态分布 N ( ,1.21) ,今从 该厂产品中随机抽取6块,测得其平均抗拉强度为31.13.试检验 这批砖的平均抗拉强度为32.5是否成立,取显著性水平 0.05. 解: 提出原假设 H 0 : 0 32.5 双边检验: 单边检验:
第八章 假设检验

2
(一)问题的提出
例1.1 体重指数BMI是目前国际上常用的衡量人体胖 瘦程度以及是否健康的一个标准. 专家指出, 健康 成年人的BMI 取值应在 18.55- 24.99 之间.某种 减肥药广告宣称, 连续使用该种减肥药一个星期便 可达到减肥的效果.为了检验其说法是否可靠,随机 抽取9位试验者(要求BMI 指数超过25,年龄在20-25 岁女生),
x 0.522 0.465, 依然拒绝H0;
那么,拒绝H0的最小的值 是多少?最小的显 著水平又是多少?
(一)问题的提出
先让每位女生记录没有服用减肥药前的体重, 然后 让每位女生服用该减肥药, 服药期间, 要求每位女 生保持正常的饮食习惯, 连续服用该减肥药1周后, 再次记录各自的体重.测得服减肥药前后的体重差 值X(服药前体重-服药后体重) (单位: kg): 1.5,0.6,-0.3,1.1,-0.8,0,2.2,-1.0,1.4 设X~N(μ,0.36), μ未知,根据目前的样本资料能否 认为该减肥药广告中的宣称是可靠的?
n i1
Xi
~
N(,
1 ), n
H0 : 0, H1 : 1( 0 ), 拒绝域:X c.
P1 (X c)
P0 (X c)
0
c
1
犯两类错误的 概率相互制约
11
例1.1中,犯第I类错误的概率
(c) P{拒绝H0|H0是真的} P{X c| 0}
P{ X c | 0} / n / n
例1.2 一种饼干的包装盒上标注净重200g,假 设包装盒的重量为定值,且设饼干净重服从N (μ,σ2), μ, σ2均未知.现从货架上取来3盒,称 得毛重(单位:g)为 233,215,221,根据这 些数据是否可以认为这种包装饼干的标准差超 过6g?
(一)问题的提出
例1.1 体重指数BMI是目前国际上常用的衡量人体胖 瘦程度以及是否健康的一个标准. 专家指出, 健康 成年人的BMI 取值应在 18.55- 24.99 之间.某种 减肥药广告宣称, 连续使用该种减肥药一个星期便 可达到减肥的效果.为了检验其说法是否可靠,随机 抽取9位试验者(要求BMI 指数超过25,年龄在20-25 岁女生),
x 0.522 0.465, 依然拒绝H0;
那么,拒绝H0的最小的值 是多少?最小的显 著水平又是多少?
(一)问题的提出
先让每位女生记录没有服用减肥药前的体重, 然后 让每位女生服用该减肥药, 服药期间, 要求每位女 生保持正常的饮食习惯, 连续服用该减肥药1周后, 再次记录各自的体重.测得服减肥药前后的体重差 值X(服药前体重-服药后体重) (单位: kg): 1.5,0.6,-0.3,1.1,-0.8,0,2.2,-1.0,1.4 设X~N(μ,0.36), μ未知,根据目前的样本资料能否 认为该减肥药广告中的宣称是可靠的?
n i1
Xi
~
N(,
1 ), n
H0 : 0, H1 : 1( 0 ), 拒绝域:X c.
P1 (X c)
P0 (X c)
0
c
1
犯两类错误的 概率相互制约
11
例1.1中,犯第I类错误的概率
(c) P{拒绝H0|H0是真的} P{X c| 0}
P{ X c | 0} / n / n
例1.2 一种饼干的包装盒上标注净重200g,假 设包装盒的重量为定值,且设饼干净重服从N (μ,σ2), μ, σ2均未知.现从货架上取来3盒,称 得毛重(单位:g)为 233,215,221,根据这 些数据是否可以认为这种包装饼干的标准差超 过6g?
概率论与数理统计第八章假设检验

当总体分布函数完全未知或只知其形式、但 不知其参数的情况,为推断总体的性质,提出 某些关于总体的假设。
为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
统计学-第八章 假设检验

验和单侧检验。以总体均值μ 的检验为例:
假设 原假设
双侧检验
单侧检验
左侧检验 右侧检验
H0 : m =m0 H0 : m m0 H0 : m m0
备择假设 H1 : m ≠m0 H1 : m <m0 H1 : m >m0
三、假设检验的程序---
4.例题分析
[例8.1] 某品牌洗衣粉在它的产品说明书中声称:平 均净含量不少于1250克。从消费者的利益出发,有关研 究人员要通过抽检其中的一批产品来验证该产品制造商 的说明是否属实。试写出用于检验的原假设与备择假设。
2.接受域:概率P>的区域,为大概率区域,称之 为原假设的接受区域。
3.拒绝域:概率P≤的区域,为小概率区域,称之 为原假设的拒绝区域。
三、假设检验的程序---
1.拒绝原假设H1 原则:临界值
2.接受原假设H0 原则:临界值
检验统计值的绝 对值大于临界值;
检验统计值的绝 对值小于临界值;
假设 H0为真实 H0为不真实
接受H0 判断正确
采伪错误()
拒绝H0 弃真错误()
判断正确
四、假设检验中的两类错误
第I类()错误和第II类()错误的关系
和的关系就像 翘翘板,小就 大, 大就小。
你要同时减少两类 错误的惟一办法是 增加样本容量!
关乎决策:三个与其
与其,人为地把显著性水平固定按某一水平上,不 如干脆选取检验统计量的P值;
第二节 一个正态总体的假设检验
二、均值m的假设检验
3.给出显著性水平(0.01、0.05或0.1)
4.确定接受域和拒绝域(以双侧检验为例)
2已知:当Z Z 2
,则拒绝原假设,反之则接受H0;
假设 原假设
双侧检验
单侧检验
左侧检验 右侧检验
H0 : m =m0 H0 : m m0 H0 : m m0
备择假设 H1 : m ≠m0 H1 : m <m0 H1 : m >m0
三、假设检验的程序---
4.例题分析
[例8.1] 某品牌洗衣粉在它的产品说明书中声称:平 均净含量不少于1250克。从消费者的利益出发,有关研 究人员要通过抽检其中的一批产品来验证该产品制造商 的说明是否属实。试写出用于检验的原假设与备择假设。
2.接受域:概率P>的区域,为大概率区域,称之 为原假设的接受区域。
3.拒绝域:概率P≤的区域,为小概率区域,称之 为原假设的拒绝区域。
三、假设检验的程序---
1.拒绝原假设H1 原则:临界值
2.接受原假设H0 原则:临界值
检验统计值的绝 对值大于临界值;
检验统计值的绝 对值小于临界值;
假设 H0为真实 H0为不真实
接受H0 判断正确
采伪错误()
拒绝H0 弃真错误()
判断正确
四、假设检验中的两类错误
第I类()错误和第II类()错误的关系
和的关系就像 翘翘板,小就 大, 大就小。
你要同时减少两类 错误的惟一办法是 增加样本容量!
关乎决策:三个与其
与其,人为地把显著性水平固定按某一水平上,不 如干脆选取检验统计量的P值;
第二节 一个正态总体的假设检验
二、均值m的假设检验
3.给出显著性水平(0.01、0.05或0.1)
4.确定接受域和拒绝域(以双侧检验为例)
2已知:当Z Z 2
,则拒绝原假设,反之则接受H0;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
2、建立假设
σX =
σ
n
=
15 70
= 1.793
Z=
X −µ
σX
=
103.3 − 100 = 1.84 1.793
H 0: µ1 ≤ µ H 1 : µ1 f µ
4、统计决策
教育效果显 著吗? 著吗?
Z = 1.84 f 1.645
接受 H 1,拒绝 H 0
5
统计差异显著 与效果显著
1、统计学的效果显著只是根据统计的概率判断 是否差异显著 某心理学家认为一般汽车司机的视反应时间平均 175毫秒 175毫秒, 毫秒,有人随机抽取36 有人随机抽取36名汽车司机作为研究样本 36名汽车司机作为研究样本 进行了测定, 进行了测定,结果平均值为180 结果平均值为180毫秒 180毫秒, 毫秒,标准差20 标准差20毫 20毫 2、效果是否显著是要根据专业的标准来判断的 秒。能否根据测试结果否定该心理学家的结论假定 人的视反应时符合正态分布) 人的视反应时符合正态分布) 3、平均数变化很小, 平均数变化很小,只要样本容量足够大, 只要样本容量足够大,统计 差异就会显著。 差异就会显著。
双侧检验
2 2、 、建立 建立 假设 假设
H 0: µ1 = µ 0 H 1: µ1 ≠ µ 0
计算过程
σX =
3 计算检验 3、 、计算检验 检验 统计量 统计量
σ
n
=
10 41
= 1.562
Z=
X −µ
σX
52.5 − 50 = = 1.6 1.562
【例8-2】有人从受过良好教育的儿童中随机抽 取 70 人 进 行 韦 氏 儿 童 智 力 测 验 , 结
有罪
错误
正确
第一类错 功效(1 功效(1(1-β) 误(α)
2
α 大 ,β 小; β大,α小
α +β
良好教育的 IQ分布
1
1- α 与 1-β 谁重要呢
1-β最重要, 最重要,它是检验 真实差异的能力, 真实差异的能力,因此 又称作统计检验力
f(x)
一般 IQ分布
C
β
100
α 130
x
β错误的影响 因素与控制 1 2 3 4 5 α 大,β 小 σ 大 α n 大 β 大 ,β 小 , ,β 小 大, 大, β 小
X −µ SE X
4
计算过程
1 1、 、条件 条件 分析 分析
σ 已知, 总体正态, 总体正态, 已知,用正态法, 用正态法,
2
例8-1全区统考物理 µ0 = 50分, σ = 10分 。某 校一个班 n = 41, X = 52.5分 。试问该班物理 成绩与全区平均成绩差异是否显著? 成绩与全区平均成绩差异是否显著?
检验方法
• 定义: 定义:拒绝性概率值置于理 论分布的两尾 • 使用: 使用:结果或方向不确定时 • 意义: 意义:只推论有无差异不推 论差异方向
• 定义: 定义:拒绝性概率值置于理 论分布的一尾。 论分布的一尾。包括左尾检 验与右尾检验 • 使用: 使用:结果或方向确定时 • 意义: 意义:即推论有无差异, 即推论有无差异,亦 推论方向
′ = tα
2 2 tα (SE + SE ) X X
1 2
tα ' =
SE × t1(α ) + SE
2 X1
× t 2(α )
各样本显著性水 平对应的自由度 临界值。 临界值 。
2 2 SE + SE X X
1
2
2 2 SE X + SE X 1 2
(t1 (α ) = t 2 (α ) =t α , df = n − 1)
(二)两总体正态, 两总体正态,两总体方差未知, 两总体方差未知,用t 检验
1.独立样本 1.独立样本, 独立样本,方差 齐性、 齐性、n 不同
SE DX =
σ 12
n1
+
2 σ2
n2
1 2 1 + = σ0 n1 n 2
2.独立样本 2.独立样本, 独立样本,方差 齐性、 齐性、n 相同
计算过程
1、条件分析 计算过程
总体正态, 未知, ,n>30,可用近似正态 总体正态, σ 2未知 或t 分布法, 分布法,双侧检验
2、建立假设
t=
X − µ 180 − 175 = = 1.18 SE X 4.226
H 0: µ1 = µ 0 H 1: µ1 ≠ µ 0
4、统计决策
df = 36 − 1 = 35, t 0.05 = 2.03
S n −1
σ 2未知 未知, , σ2 n>30 n>30
SE X =
S n
不论 不论σ σ2 2已知 已知未 未 知 知, , n>30 n>30
σ
X
=
σ
n
Z' =
SE X = S n
t=
X −µ SE X
当n<30时 30时,只能 用t分布 ,不能 用近似正态分布
Z' =
X −µ SE X
当n<30时 30时,不能 用t分布近似正态 分布
抽样分布
假设检验的步骤
右尾检验
置信水平 提出研究 假设和虚 无假设 确定合适的检验 统计量: 统计量:Z还是 t、还是F等
拒绝域 1-α
α
规定显著 性水 平: 0.05还是 0.01
接受域 H0值 临界值 观察到的样本统计量 量的值 作出统 计决策 检验统计
样本统计量
第二节 平均数显著性检验
总体正态
总体非正态, 总体非正态 ,σ 2 未知, 未知 , n>30, 用近似正态 法,双侧检验
2、建立假设
X 的学生168 的学生168人 168人,
= 45.1, S = 18.7
该县平均分与全省平均分有无差异? 该县平均分与全省平均分有无差异?
H 0: µ1 = µ 0 H 1: µ1 ≠ µ 0
6
2
3、计算检验统计量 计算检验统计量
SE X =
S n −1
=
25 36 − 1
= 4.226
p f 0.05
接受 H 0 ,拒绝 H 1
计算过程
1、条件分析
某省进行数学竞赛, 某省进行数学竞赛 , 分布不是正态, 分布不是正态 , 总平均分43.5 总平均分 43.5分 43.5 分 。 其中某县参加竞赛
计算过程
3、计算检验统计量 计算检验统计量
第三节 双总体均数之差的检验
双总体均数之差的检验: 双总体均数之差的检验:是对样本平 均数与总体平均数之间的差异进行检
SE X =
S n
=
18.7 168
= 1.443
Z' =
X − µ 45.1 − 43.5 = = 1.11 1.443 SE X
验。又称作为平均数差异显著性检验
1
研究假设与虚 假设 类型
•参数假设检验
什么是假设检验
• 研究假设( 研究假设(备择假设): 备择假设): 实验人员希望证实的假设 • 符号:
虚无假设( 虚无假设(零假设) 零假设) 与研究假设对立的 假设 符号: 符号: H 0 内容: 内容:假设两者之间不存在 真实差异 表示方法: 表示方法:
哪种教学法 的教学效果 更好? 更好? 表8-1 接受不同教学法的学生考 接受不同教学法的学生考试得分表 学生考试得分表
被试 A教学法 B教学法
1 85 67
2 76 71
3 77 73
4 74 76
5 82 79
6 88 82
7 99 84
假设检验在统计方法中的地位
第一节 假设检验的原理
• 统计方法
2 S12 + S 2 n −1
2 Sp =
2 2 (n1 − 1) S n − 1 + (n 2 − 1) S n −1 1 2
(n1 − 1) + (n 2 − 1)
2 2 n1S n + n2 S n 1 1 1 2 • + n1 + n2 − 2 n1 n2
=
2 2 n1 S n + n2 S n 1 2
平均数的显著性检验: 平均数的显著性检验:是对样本平均 数与总体平均数之间的差异进行检验 置信水平 拒绝域 α/2 1-α 接受域 拒绝域 α/2
σ
σ2已知 , n n不论大小 不论大小
X
=
σ
n
Z=
样本平均数 临界值
X −µ
H0值 临界值
σX
抽样分布
总体正态
总体非正态
SE X =
σ 未知 未知, σ2 2未知, , n n不论大小 不论大小
•非参数假设检验
H1
定义
•事先对总体参数或
• 内容: 内容:假设两者之间存在真 实差异 • 表示方法: 表示方法:
基本原理
分布形式作出某种 假设,然后利用样本 •采用逻辑上的反证法
假设检验
•统计上的小概率原理
µ1 ≠ µ 0 或
µ 2 f µ1
µ1 = µ 0
或
µ 2 ≤ µ1
信息来判断虚无假 设是否成立
假设检验的过程 假设检验的基本思想
(提出假设→ 提出假设→抽取样本→ 抽取样本→作出决策) 作出决策)
提出假设 人的平均智商 为100
抽样分布
总体
策 作出决 设 拒绝假
这个值不像我 们应该得到的 样本均值 ... ... 如果这是总 体的真实均值
... 因此我们拒 因此我们拒 绝假设 绝假设 µ µ = 50
n1 + n2 − 2
2、建立假设
σX =
σ
n
=
15 70
= 1.793
Z=
X −µ
σX
=
103.3 − 100 = 1.84 1.793
H 0: µ1 ≤ µ H 1 : µ1 f µ
4、统计决策
教育效果显 著吗? 著吗?
Z = 1.84 f 1.645
接受 H 1,拒绝 H 0
5
统计差异显著 与效果显著
1、统计学的效果显著只是根据统计的概率判断 是否差异显著 某心理学家认为一般汽车司机的视反应时间平均 175毫秒 175毫秒, 毫秒,有人随机抽取36 有人随机抽取36名汽车司机作为研究样本 36名汽车司机作为研究样本 进行了测定, 进行了测定,结果平均值为180 结果平均值为180毫秒 180毫秒, 毫秒,标准差20 标准差20毫 20毫 2、效果是否显著是要根据专业的标准来判断的 秒。能否根据测试结果否定该心理学家的结论假定 人的视反应时符合正态分布) 人的视反应时符合正态分布) 3、平均数变化很小, 平均数变化很小,只要样本容量足够大, 只要样本容量足够大,统计 差异就会显著。 差异就会显著。
双侧检验
2 2、 、建立 建立 假设 假设
H 0: µ1 = µ 0 H 1: µ1 ≠ µ 0
计算过程
σX =
3 计算检验 3、 、计算检验 检验 统计量 统计量
σ
n
=
10 41
= 1.562
Z=
X −µ
σX
52.5 − 50 = = 1.6 1.562
【例8-2】有人从受过良好教育的儿童中随机抽 取 70 人 进 行 韦 氏 儿 童 智 力 测 验 , 结
有罪
错误
正确
第一类错 功效(1 功效(1(1-β) 误(α)
2
α 大 ,β 小; β大,α小
α +β
良好教育的 IQ分布
1
1- α 与 1-β 谁重要呢
1-β最重要, 最重要,它是检验 真实差异的能力, 真实差异的能力,因此 又称作统计检验力
f(x)
一般 IQ分布
C
β
100
α 130
x
β错误的影响 因素与控制 1 2 3 4 5 α 大,β 小 σ 大 α n 大 β 大 ,β 小 , ,β 小 大, 大, β 小
X −µ SE X
4
计算过程
1 1、 、条件 条件 分析 分析
σ 已知, 总体正态, 总体正态, 已知,用正态法, 用正态法,
2
例8-1全区统考物理 µ0 = 50分, σ = 10分 。某 校一个班 n = 41, X = 52.5分 。试问该班物理 成绩与全区平均成绩差异是否显著? 成绩与全区平均成绩差异是否显著?
检验方法
• 定义: 定义:拒绝性概率值置于理 论分布的两尾 • 使用: 使用:结果或方向不确定时 • 意义: 意义:只推论有无差异不推 论差异方向
• 定义: 定义:拒绝性概率值置于理 论分布的一尾。 论分布的一尾。包括左尾检 验与右尾检验 • 使用: 使用:结果或方向确定时 • 意义: 意义:即推论有无差异, 即推论有无差异,亦 推论方向
′ = tα
2 2 tα (SE + SE ) X X
1 2
tα ' =
SE × t1(α ) + SE
2 X1
× t 2(α )
各样本显著性水 平对应的自由度 临界值。 临界值 。
2 2 SE + SE X X
1
2
2 2 SE X + SE X 1 2
(t1 (α ) = t 2 (α ) =t α , df = n − 1)
(二)两总体正态, 两总体正态,两总体方差未知, 两总体方差未知,用t 检验
1.独立样本 1.独立样本, 独立样本,方差 齐性、 齐性、n 不同
SE DX =
σ 12
n1
+
2 σ2
n2
1 2 1 + = σ0 n1 n 2
2.独立样本 2.独立样本, 独立样本,方差 齐性、 齐性、n 相同
计算过程
1、条件分析 计算过程
总体正态, 未知, ,n>30,可用近似正态 总体正态, σ 2未知 或t 分布法, 分布法,双侧检验
2、建立假设
t=
X − µ 180 − 175 = = 1.18 SE X 4.226
H 0: µ1 = µ 0 H 1: µ1 ≠ µ 0
4、统计决策
df = 36 − 1 = 35, t 0.05 = 2.03
S n −1
σ 2未知 未知, , σ2 n>30 n>30
SE X =
S n
不论 不论σ σ2 2已知 已知未 未 知 知, , n>30 n>30
σ
X
=
σ
n
Z' =
SE X = S n
t=
X −µ SE X
当n<30时 30时,只能 用t分布 ,不能 用近似正态分布
Z' =
X −µ SE X
当n<30时 30时,不能 用t分布近似正态 分布
抽样分布
假设检验的步骤
右尾检验
置信水平 提出研究 假设和虚 无假设 确定合适的检验 统计量: 统计量:Z还是 t、还是F等
拒绝域 1-α
α
规定显著 性水 平: 0.05还是 0.01
接受域 H0值 临界值 观察到的样本统计量 量的值 作出统 计决策 检验统计
样本统计量
第二节 平均数显著性检验
总体正态
总体非正态, 总体非正态 ,σ 2 未知, 未知 , n>30, 用近似正态 法,双侧检验
2、建立假设
X 的学生168 的学生168人 168人,
= 45.1, S = 18.7
该县平均分与全省平均分有无差异? 该县平均分与全省平均分有无差异?
H 0: µ1 = µ 0 H 1: µ1 ≠ µ 0
6
2
3、计算检验统计量 计算检验统计量
SE X =
S n −1
=
25 36 − 1
= 4.226
p f 0.05
接受 H 0 ,拒绝 H 1
计算过程
1、条件分析
某省进行数学竞赛, 某省进行数学竞赛 , 分布不是正态, 分布不是正态 , 总平均分43.5 总平均分 43.5分 43.5 分 。 其中某县参加竞赛
计算过程
3、计算检验统计量 计算检验统计量
第三节 双总体均数之差的检验
双总体均数之差的检验: 双总体均数之差的检验:是对样本平 均数与总体平均数之间的差异进行检
SE X =
S n
=
18.7 168
= 1.443
Z' =
X − µ 45.1 − 43.5 = = 1.11 1.443 SE X
验。又称作为平均数差异显著性检验
1
研究假设与虚 假设 类型
•参数假设检验
什么是假设检验
• 研究假设( 研究假设(备择假设): 备择假设): 实验人员希望证实的假设 • 符号:
虚无假设( 虚无假设(零假设) 零假设) 与研究假设对立的 假设 符号: 符号: H 0 内容: 内容:假设两者之间不存在 真实差异 表示方法: 表示方法:
哪种教学法 的教学效果 更好? 更好? 表8-1 接受不同教学法的学生考 接受不同教学法的学生考试得分表 学生考试得分表
被试 A教学法 B教学法
1 85 67
2 76 71
3 77 73
4 74 76
5 82 79
6 88 82
7 99 84
假设检验在统计方法中的地位
第一节 假设检验的原理
• 统计方法
2 S12 + S 2 n −1
2 Sp =
2 2 (n1 − 1) S n − 1 + (n 2 − 1) S n −1 1 2
(n1 − 1) + (n 2 − 1)
2 2 n1S n + n2 S n 1 1 1 2 • + n1 + n2 − 2 n1 n2
=
2 2 n1 S n + n2 S n 1 2
平均数的显著性检验: 平均数的显著性检验:是对样本平均 数与总体平均数之间的差异进行检验 置信水平 拒绝域 α/2 1-α 接受域 拒绝域 α/2
σ
σ2已知 , n n不论大小 不论大小
X
=
σ
n
Z=
样本平均数 临界值
X −µ
H0值 临界值
σX
抽样分布
总体正态
总体非正态
SE X =
σ 未知 未知, σ2 2未知, , n n不论大小 不论大小
•非参数假设检验
H1
定义
•事先对总体参数或
• 内容: 内容:假设两者之间存在真 实差异 • 表示方法: 表示方法:
基本原理
分布形式作出某种 假设,然后利用样本 •采用逻辑上的反证法
假设检验
•统计上的小概率原理
µ1 ≠ µ 0 或
µ 2 f µ1
µ1 = µ 0
或
µ 2 ≤ µ1
信息来判断虚无假 设是否成立
假设检验的过程 假设检验的基本思想
(提出假设→ 提出假设→抽取样本→ 抽取样本→作出决策) 作出决策)
提出假设 人的平均智商 为100
抽样分布
总体
策 作出决 设 拒绝假
这个值不像我 们应该得到的 样本均值 ... ... 如果这是总 体的真实均值
... 因此我们拒 因此我们拒 绝假设 绝假设 µ µ = 50
n1 + n2 − 2