统计学__假设检验(第五章)_(1)_2

合集下载

统计学概论05

统计学概论05

5-18

总体标准差未知时对总体均值检验经常用t统 计量: X 0
t s n ~ t (n 1)

但是,在大样本场合(样本容量n大于30时), t-统计量与标准正态分布统计量近似,通常用 z检验代替t检验。
5-19
总体成数的检验

当样本容量较大时,下列统计量服从标准正 态分布:
z p n
5-26



z检验的p-值: z0 检验统计量为z统计量的p-值计算公式, 表示 检验统计量的抽样数据,则p-值的计算方法 如下: 如果:H 1 , 0 p-值=2 pz z0 如果:H 1 , 0 p-值= pz z 0 如果:H 1 , 0 p-值= pz z 0
5-11
二、参数检验

参数检验都是先对样本所属总体的性质作出 若干的假定,或对总体的分布形状加以限定, 然后对总体的有关参数情况进行统计假设检 验。因此,参数检验又称为限定分布检验。 如在总体服从正态分布条件下,对其均值进 行检验。下面通过具体例子来说明参数检验 方法。
5-12

在例1中,按历史资料,总体的标准差是4毫 升。我们通过检验总体均值是否等于250毫升, 来判断饮料厂商是否欺骗了消费者。程序如 下:
5-6

构造一个统计量来决定是“接受原假设,拒绝备选 假设”,还是“拒绝原假设,接受备选假设”。对 不同的问题,要选择不同的检验统计量。检验统计 量确定后,就要利用该统计的分布以及由实际问题 中所确定的显著性水平,来进一步确定检验统计量 拒绝原假设的取值范围,即拒绝域。在给定的显著 性水平α下,检验统计量的可能取值范围被分成两部 分:小概率区域与大概率区域。小概率区域就是概 率不超过显著性水平α的区域,是原假设的拒绝区域; 大概率区域是概率为1-α的区域,是原假设的接受区 域。

教育与心理统计学 第五章 假设检验考研笔记-精品

教育与心理统计学  第五章 假设检验考研笔记-精品
把出现小概率的随机事件称为小概率事件。
假设检验中的小概率原理[一级][16J]
假设检验的基本思想是概率性质的反证法,即其基本思想是基于〃小概率事件在一次实验中不可能发生”这一原理。首先假定虚无假设为
真,在虚无假设为真的前提下,如果小概率事件在一次试验中出现,则表明〃虚无假设为真"的假定是不止确的,因为假定小概率事件在
一次试验中是不可能出现的,所以也就不能接受虚无假设,应当拒绝零假设。若没有导致小概率事件出现,那就认为"虚无假设为真”的
假定是正确的,也就是说要接受虚无假设。假设推断的依据:小概率事件是否出现,这是对假设作出决断的依据。
检验的假设
Ho为真
真实情况
检验的事件发生的概率在99%或95%的范围内
检验的事件发生的概率在5%或1%以内
错误的概率,其前提是“Ho为假
②它们都是在做假设检验的统计决策时可能犯的错误,决策者同时面临犯两种错误的风险,因此都极力想避免或者减少它们,但由于在忠
体间真实差异不变情况下,它们之间是一种此消彼长的关系,即a大时,0小;c(和B不能同时减少。
③在其他条件不变的情况下,不可能同时减小或增大两种错误的发生可能,常用的办法是固定a的情况下尽可能减小B,比如通过增大样本
若进行假设检验时总体的分布形态已知,需要对总体的未知参数进行假设检验,称其为参数假设检验。
(三)非参数检验[一级]
若对总体分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验,通常称为非参数假设检验。
(四)小概率事件和显著性水平
(1)假设推断的依据就是小概率原理
小概率事件:通常情况下,将概率不超过0.05(即5%)的事件当作“小概率事件",有时也定为概率不超过0.01(即1%)或0.001(0.1%\

医学统计学假设检验

医学统计学假设检验

❖ 例如,根据大量调查,已知正常成年男性 平均脉搏数为72次/分,现随机抽查了20名 肝阳上亢成年男性病人,其平均脉搏为84 次/分,标准差为6.4次/分。问肝阳上亢男 病人的平均脉搏数是否较正常人快?
❖ 以上两个均数不等有两种可能:
第一,由于抽样误差所致;
第二,由于肝阳上亢的影响。
例如
已知正常成年男子脉搏平均为72 次/分,现随机检查20名慢性胃炎所致 脾虚男病人,其脉搏均数为75次/分, 标准差为6.4次/分,问此类脾虚男病人 的脉搏快于健康成年男子的脉搏?
2、假设检验的目的
判断是由于何种原因造成的不同,以做出决策。
3、假设检验的原理
反证法:当一件事情的发生只有两种可能A和B,为了肯
定其中的一种情况A,但又不能直接证实A,这时否定另一 种可能B,则间接的肯定了A。
概率论(小概率) :如果一件事情发生的概率很小,那
么在进行一次试验时,我们说这个事件是“不会发生的”。 从一般的常识可知,这句话在大多数情况下是正确的,但是 它一定有犯错误的时候,因为概率再小也是有可能发生的。
α是在统计推断时,预先设定的一个小概率值,是当H0 为真时,允许错误地拒绝H0的概率。
双侧与单侧检验界值比较
(2) 选定适当的检验方法,计算检验
统计量值 t 检验 Z 检验
❖ 设计类型 ❖ 资料的类型和分布 ❖ 统计推断的目的 ❖ n的大小 ❖ 如完全随机设计实验中,已知样本均数
与总体均数比较,n又不大,可用t检验, 计算统计量t值。
(1)建立假设,选定检验水准:
假设两种:一种是检验假设,假设差异完全由抽样误差造 成,常称无效假设,用H0表示。另一种是和H0相对立的备 择假设,用H1表示。假设检验是针对H0进行的。

统计学导论 科学出版社 第五章 假设检验

统计学导论  科学出版社 第五章 假设检验

右侧检验

H1 : µ > µ0
H1 : µ > µ0
确定适当的检验统计量
什么检验统计量? 什么检验统计量?
用于假设检验问题的统计量 选择统计量的方法与参数估计相同, 选择统计量的方法与参数估计相同,需考虑
是大样本还是小样本 总体方差已知还是未知
检验统计量的基本形式为
z= x − µ0
σ
n
选择显著性水平α,确定临界值

☺ ☺ ☺ ☺ ☺ ☺ ☺ ☺
抽取随机样本
均值 ☺ ☺ X = 20
假设检验的基本思想
抽样分布
这个值不像我 们应该得到的 样本均值 ... ... 因此我们拒 绝假设 µ = 50
... 如果这是总 体的真实均值 20
µ = 50 H0
样本均值
假设检验应用举例
例1:抽样检验食品包装机工作是否正常 : 例2:由样本推断产品次品率是否超标 : 例3:研究黑人儿童是否有民族意识 : 例4:检验电池寿命波动性是否有显著变化 : 5: 例5:判断男女职工看电视时间是否有显著差异 例6:检验新工艺是否比旧工艺更好 : 例7:研究生活习惯是否影响血压 : 例8:检验两次地震间的天数是否服从指数分布 : 例9:比较两公司进货次品率,作出进货决策 :比较两公司进货次品率,
3、特点 、
采用逻辑上的反证法 依据统计上的小概率原理
第一节 假设检验的基本原理
一. 假设检验的一般思想 二. 假设检验的步骤 三. 假设检验的两类错误
假设检验的过程
(提出假设→抽取样本→作出决策) 提出假设→抽取样本→作出决策)
提出假设 作出决策
拒绝假设! 拒绝假设 别无选择. 别无选择
总体

第5章t检验

第5章t检验

3.5
12.25
10
15.0
8.0
7.0
49.20
Байду номын сангаас
11
13.0
6.5
6.5
42.25
12
10.5
合计
9.5
1.0
1.00
39(d)
195(d2)
H0:d=0, H1:d0, 0.05。
自由度计算为 ν=n-1=n-1=12-1=11,
查附表2,得t0.05(11) = 2.201,
t0.01(11) = 3.106,本例t > t0.01(11), P < 0.01,差别有统计学意义,拒绝H0,接受H1,
应的总体方差相等(方差齐性) u 检验:1.大样本
2.样本小,但总体标准差已知
➢t检验 样本均数与总体均数比较的t检验 配对设计资料比较的t检验 两独立样本均数比较的t检验
➢样本均数与总体均数的比较的t检验,亦 称单样本t检验(one sample t test) 。
➢用于从正态总体中获得含量为n的样本, 算得均数和标准差,判断其总体均数μ 是否与某个已知总体均数μ0相同。
可认为两种方法皮肤浸润反应结果的差别有 统计学意义。
查表,t与自由度为9(10-1)时的t界值进行比 较,得到0.01<p<0.05。
P=2*[1-CDF.T(2.434,9)]
CDF.T(quant, df)。数值。返回 t 分布(指定自由度为 df)中的 值将小于 quant 的累积概率。
SPSS软件操作
• 第一步:以“血尿素氮” 为变量名,建立变量
t
df
Sig. (2-tailed) Difference Lower

《统计学》第5章 假设检验

《统计学》第5章 假设检验
假设。原假设通常用H0 表示,也称为“零假设”;备择假设指的是当原
假设不成立时,即拒绝原假设时备以选择的假设,通常用H1 表示。备择
假设和原假设互斥,如在例5.1中,原假设是“2022 年全国城市平均
PM2.5 浓度与2018 年相比没有显著差异”,那么备择假设就是“2022
年全国城市平均PM2.5 浓度与2018 年相比存在显著差异”。相应的统计
小越好。但是,在一定的样本容量下,减少犯第I类错误的概率,就会
使犯第II类错误的概率增大;减少犯第II类错误的概率,会使犯第I类
错误的概率增大。增加样本容量可以使犯第I类错误的概率和犯第II类
错误的概率同时减小,然而现实中资源总是有限的,样本量不可能没有
限制。因此,在给定的样本容量下,必须考虑两类可能的错误之间的权
易被否定,若检验结果否定了原假设,则说明否定的理由是充分的。
第四章 参数估计
《统计学》
16
5.1 假设检验的基本原理
(四) P值法
假设检验的另一种常用方法是利用P值(P-value) 来确定检验决策。P值
指在原假设0 为真时,得到等于样本观测结果或更极端结果的检验统计
量的概率,也被称为实测显著性水平。P值法的决策规则为:如果P值大
1.96) 中。这里−1.96和1.96 称为临界值,区间(−1.96, 1.96) 两侧的
区域则被称为拒绝域。基于样本信息,可以计算得到相应的z检验统计量
值,已知ҧ = 46,0 = 53, = 14 , n = 100 = −5
14/10
第四章 参数估计
《统计学》
14
5.1 假设检验的基本原理
犯第I 类(弃真) 错误的概率 也称为显著性水平(Significance level),

医学统计学-假设检验概述

医学统计学-假设检验概述

二、假设检验应注意的问题
假设检验利用小概率反证法思想,从问题对立面 (H0)出发间接判断要解决的问题(H1)是否成立。在H0 成立的条件下计算检验统计量,获得P值来判断。当P ≤,就是小概率事件。
小概率事件原理:小概率事件在一次抽样中发生 的可能性很小,如果它发生了,则有理由怀疑H0,认 为H1成立,该结论可能犯的错误。
当不拒绝H0时,没有拒绝实际上不成立的H0,这 类错误称为Ⅱ类错误(“存伪”),其概率大小用β 表示。
假设检验中的两类错误
客观实际
拒绝H0
不拒绝H0
H0成立 第Ⅰ类错误(α) 推断正确(1- α)
H0不成立 推断正确(1- β) 第Ⅱ类错误(β)
α与β的关系: 当样本量一定时, α愈小, 则β愈大,反之α愈大,
距法
理论上:
• 总体偏度系数1=0为对称,1>0为正偏态,1<0为负偏态; • 总体峰度系数2=0为正态峰,2>0为尖峭峰,2<0为平阔峰。 • 只有同时满足对称和正态峰两个条件时,才能认为资料服从
假设检验概述
第五章 假设检验概述
第一节 假设检验的分类、论证方法与步骤 一、假设检验的分类 二、假设检验的论证方法 三、假设检验的步骤
第二节 假设检验的两类错误和注意事项 一、Ⅰ型错误和Ⅱ型错误 二、应用假设检验的注意事项
第三节 正态性检验与数据转换 一、正态性检验 二、数据转换
第四节 例题和SPSS电脑实验
P>:不拒绝H0 ,还不能认为差异有统计学意义… P:拒绝H0,接受H1 ,差异有统计学意义…
第二节 假设检验的两类错 误和注意事项
一、Ⅰ型错误和Ⅱ型错误
1. Ⅰ型错误: 当拒绝H0时,可能拒绝了实际上成立的H0,这

第五章-回归模型的假设检验

第五章-回归模型的假设检验

步骤二:计算F值
回归平方和
Yˆ Y
F
解释变量数 残差平方和
=
k
uˆ 2
样本数 解释变量数 1 n k 1
1
决定系数 决定系数
样本数 解释变量数 解释变量数
1
=
R2 1 R2
n
k k
1[计算式]
步骤三:计算出来的F值,服从自由度(分子,分母)=(k,n k 1)
的F分布,将其与F分布表中的到的F值(判定值)相比较,进行显著
自由度调整后的决定系数:
2
R 1
n 1
1 R2 =1 10 1 1 0.98358 0.97889
n k 1
10 2 1
(3)根据公式,
F R2 n k 1 = 0.98358 10 2 1 209.7 1 R2 k 1 0.98358 2
根据F分布表,1%的显著性水平下自由度为(分子,分母)=(k=2,n k 1=7)
单侧检验,根据t分布表,得:
tˆ =4.816 3.499
tˆ1 =16.383 2.998
tˆ2 =19.094 2.998
放弃原假设(H0 : 0, H0 : 1 0, H0 : 2 0),估计出来的回归系数
在1%的显著性水平上显著。
结构变化的F检验
• 结构变化的F检验,也称为Chow test,用于检验经济 分析中的一个重要问题--“是否存在结构变化”。基 本步骤如下:
Yˆ 2.267718 0.247759 X1 1.296761X 2 回归系数的符号条件也得到满足。
解答(2)(3)
(2)根据公式,
决定系数:
R2 = ˆ1SY1 ˆ2SY 2 = 0.247759 46+ 1.296761 17 0.98358
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

右侧检验:统计量 > 临界值,拒绝H0
(2)假设检验中的两类错误
第一类错误(弃真错误)
原假设为真时,拒绝原假设
会产生一系列后果 第一类错误的概率为,被称为显著性水平
假设检验的结果 不一定正确!
第二类错误(取伪错误)
原假设为假时,接受原假设 第二类错误的概率为
原假设抽样分布
α
µ0
接受域 (原假设为真)
第五章 假设检验 ۩ ۩ 假设检验的基本原理 假设检验的步骤
۩
۩
一个总体参数的检验
利用p 值进行假设检验
总体参数
推断估计
抽样分布
参数估计
随机原则
统计量
假设检验
检验
假设检验在统计方法中的地位:
统计方法
描述统计法 推断统计法
参数估计
假设检验
正常人的平均体温是37oC吗?
当问起健康的成年人体温是多少时,多数人的回 答是37oC!这似乎已经成了一种共识……以下是一 位研究人员测量的50个健康成年人的体温数据。
一、假设检验的基本原理
1. 假设检验(hypothesis test)
1° 先对总体参数(或分布形式)提出某种假设,再利用样
本信息判断假设是否成立 2°参数检验——总体的分布形式已知; 非参数检验 3°逻辑上运用反证法,统计上依据小概率原理! 小概率是在一次试验中,一个几乎不可能发生的事 件发生的概率; 在一次试验中小概率事件一旦发生,我们就有理由
根据样本数据,计算的平均值为36.8oC,标准差为0.36oC 根据参数估计方法,健康成年人平均体温的95%的置信区 间为(36.7,36.9) 研究人员发现这个区间内并没有包括37oC! 因此,提出了“不应该再把37oC作为正常人体温的一个 有任何特定意义的概念”
我们应该放弃“正常人的平均体温是37oC”这个共识吗?
解:研究者想收集证据予以证明的假设应该是“生产过程不
正常”。建立的原假设和备择假设为:
H0 : 10cm
H1 : 10cm
<提出假设>
【例2】某品牌洗涤剂在它的产品说明书中声称:平均净含
量不少于500克,从消费者的利益出发,有关研究人员 要通过抽检其中的一批产品来验证该产品制造商的说明
×
1-
Region of Non rejection Region of Rejection

H0
临界值
观察到的样本统计量
统计量决策规则:
1°给定显著性水平,查表得出相应的临界值Z或Z/2 , tα 或 tα/2 2°将检验统计量的值与 水平的临界值进行比较 3°作出决策
双侧检验:|统计量| > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0
床生产的零件是否符合标准要求。若零件的平均直径大于或
小于10cm,则表明生产过程不正常,必须进行调整。试陈述 用来检验生产过程是否正常的原假设和备择假设。
解:研究者想收集证据予以证明的假设应该是“生产过程不
正常”。建立的原假设和备择假设为:
H0 : 10cm
H1 : 10cm
双侧检验:
是否属实。试陈述用于检验的原假设与备择假设。
解: 研究者抽检的意图是倾向于证实这种洗涤剂的平均
净含量并不符合说明书中的陈述。
建立的原假设和备择假设为:
H0 : 500
【例3】一家研究机构估计,某城市中家庭拥有汽车的比例超 过30%。为验证这一估计是否正确,该研究机构随机抽取 了一个样本进行检验。试陈述用于检验的原假设与备择 假设。
解:研究者想收集证据予以支持的假设是“该城市中家庭拥
有汽车的比例超过30%”。
建立的原假设和备择假设为:
H0 : 30%
H1 : 30%
提出假设(小结):
1°原假设和备择假设是一个完备事件组,而且相互 对立 <互斥互补> 2°先确定备择假设,再确定原假设 3°等号“=”总是放在原假设上
拒绝原假设
2. 假设检验的基本思想
抽样分布
这个值不像我们应 该得到的样本均值 ...
因此,我们 拒绝假设 =50!
如果这是总体 的真实均值
20
= 50 H0
样本均值
3.假设检验的过程(提出假设→抽取样本→作出决策)
提出假设
我认为人口的 平均年龄是50岁
总体
作出决策
拒绝假设!

第一类错误(弃真错误)
弃真错误:原假设为真, 却落在拒绝域内被拒绝。
x
拒绝域
扩大拒绝域( α 变大),第
原假设抽样分布
一类错误可能性变大;反之,为
α
µ0
防止弃真错误,就要缩小α 。
x
拒绝域
原假设:
1-α
µ0
接受域
α
拒绝域
1-β
备择假设:
β
µ1
拒绝域
接受域
研究者总是希望能做出正确的决策,但由于决策是
H0 :无罪
陪审团审判 裁决 无罪 有罪 实际情况 无罪 正确 错误 有罪 错误 正确 接受H0 拒绝H0
放过坏人
H0 检验
决策
实际情况 H0为真 H0为假
正确决策 第二类错 误() 1– 第一类错 正确决策 误() (1-)
冤枉好人
两类错误的控制:
对于一个给定的样本,如果犯第一类错误的代价比犯
拒绝H0

1-
Region of Non rejection
临界值
H0
观察到的样本统计量
【例3】一家研究机构估计,某城市中家庭拥有汽车的比例超 过30%。为验证这一估计是否正确,该研究机构随机抽取 了一个样本进行检验。试陈述用于检验的原假设与备择 假设。
解:研究者想收集证据予以支持的假设是“该城市中家庭拥
H1 : 某一数值 H1 : 某一数值 H1 : < 某一数值
<提出假设>
【例1】一种零件的生产标准直径为10cm,为对生产过程进行控 制,质量监测人员定期对一台加工机床检查,来确定这台机 床生产的零件是否符合标准要求。若零件的平均直径大于或 小于10cm,则表明生产过程不正常,必须进行调整。试陈述 用来检验生产过程是否正常的原假设和备择假设。
建立在样本信息的基础之上,而样本又是随机的,因而 就有可能犯错误; 原假设和备择假设不能同时成立,决策的结果要么 拒绝H0 ,要么不拒绝H0 。决策时总是希望当原假设正确
时,没有拒绝它;当原假设不正确时拒绝它,但实际上
很难保证不犯错误


是针对原假设 H0 说的!
假设检验中的两类错误(决策结果)
假设检验就好像 一场审判过程 统计检验过程
建立的原假设和备择假设为:
H0 : 500
H1 : < 500
左侧检验:
抽样分布
Region of Rejection

置信水平
拒绝H0

1-
Region of Non rejection
临界值
H0
观察到的样本统计量
左侧检验:
抽样分布
Region of Rejection
×
置信水平
2. 确定适当的检验统计量
1°用于假设检验问题的统计量
2°选择统计量的方法与参数估计相同,需考虑:
是大样本 or 小样本 总体方差已知 or 未知
3. 规定显著性水平(significant level)
1°是一个概率值
2°原假设为真时,拒绝原假设的概率
<抽样分布的拒绝域>
3°表示为
常用的 值有0.01,0.05,0.10
计量,现代检验中人们直接使用由统计量
算出的犯第一类错误的概率,即所谓的 P
有汽车的比例超过30%”。
建立的原假设和备择假设为:
H0 : 30%
H1 : 30%
右侧检验:
抽样分布
置信水平 拒绝H0

1-
Region of Non rejection Region of Rejection

H0
临界值
观察到的样本统计量
右侧检验:
抽样分布
置信水平 拒绝H0
抽样分布 拒绝H0
Region of Rejection

置信水平 拒绝H0
/2
1-
Region of Non rejection
Region of Rejection
/2
临界值
H0
临界值
观察到的样本统计量
双侧检验:
抽样分布 拒绝H0
Region of Rejection
×
置信水平 拒绝H0
37.1 36.9 37.6 36.1 37.1 37.0 36.6 36.1 36.7 36.8 36.9 36.6 36.7 37.1 36.2 36.7 37.2 37.1 37.2 37.0 36.9 36.2 37.3 36.6 36.3 36.9 36.4 37.0 36.3 37.0 37.1 36.7 36.9 36.5 37.5 37.0 36.6 36.6 37.1 36.1 36.4 36.9 36.4 36.7 36.9 37.1 37.3 36.9 36.7 37.0
抽取随机样本
X = 20
均值
二、假设检验的步骤
1. 提出原假设和备择假设 2. 确定适当的检验统计量 3. 规定显著性水平 4. 计算检验统计量的值 5. 作出统计决策
1. 提出假设
1°原假设(null hypothesis)
研究者收集证据,指的是待检验的假设,用H0表示
统计学涵义是指参数没有变化或变量之间没有关系 起初被假设是成立的,后面根据样本数据确定是否 有足够的证据拒绝它 总是有符号 , ,
相关文档
最新文档