假设检验基础教材

合集下载

水文水资源教材-实用水文统计-假设检验

水文水资源教材-实用水文统计-假设检验

第五节 非参数的假设检验
一、分布的假设检验 提出原假设
H0 : F (x; ) F0 (x;0 );H1:F (x; ) F0 (x; )
式中θ为分布参数,可以已知,也可以未知。
检验统计假设:
1、
x1 x2 …
xk-2 xk-1
2、统计样本点落在各区间的数目mi;
3、根据分布函数F0(x;θ)计算在n次试验中,X 的值落在各个子区间中的理论频数νi:

r
2
n
2
t
2
r
2
则否定域为 r r 。临界值见附表10。
例 设(X,Y)为二维正态分布,试检验X与Y的 相关系数ρ=0。(α=0.05)
xi
10
62
32
34
49
54
yi
535.9 1085.5 848.9 789.4 991.6 1117.5
xi
34
27
57
36
41
50
yi
967.0 862.8 1161.3 695.8 890.1 1122.1
i1 j1
npi. p. j
服从自由度为rk-1的 2 分布。
一般 pi. 和
代替,则
p. j
未知,常用它们的极大似然估计
ni. n
r
2
k
(nij
ni.n. j )2 n
n(
r
k
ni2j 1)
i1 j1
ni.n. j
n n i1 j1 i. . j
统计量
2
n
服从自由度为( r-1)(
k-1)的
列联表
Y
X
1
2

第六讲假设检验基础优秀课件

第六讲假设检验基础优秀课件

7
42
70
28
784
8
45
45
0
0
9
25
50
25
625
10
55
80
25
625
11
51
60
9
81
12
59
60
1
1
合计
128
2740
H0:d=0,干预前后血红蛋白差值的总体均数为零 H1:d≠0, =0.05。
t d 10.670 3.305 sd n 11.18/ 12
按 = n-1=11,查t值表,则0.01<P<0.005,拒绝H0,
• (1)检验假设:又称无效假设、零假设、原假设,是从反证法
思想提出的。
H0 :0
• (2)备择假设:拒绝H0时而被接受的假设,与H0对立。有三种 情况: H1:0 双侧检验 H1:0 单侧检验
H1:0 单侧检验
2.单、双侧的选择:由专业知识来确定。
3.检验水准:α,又称显著性水准,是小概率事件的概率。通 常取0.05。
可认为健康干预前后该地区儿童血红蛋白量有变化。
三、两独立样本t检验
▲目的:由两个样本均数的差别推断两样本所代表 的总体均数间有无差别。
▲计算公式及意义:
t
s 自由X度1X:2 n1
X1 X2 s
+sc2Xn12 X–2n211
1 n2
sc2
(n11)s12(n21)s22 n1n22
▲ 适用条件:
例7-2 健康教育干预三个月前后血红蛋白(%)
表 6.1 用两种方法对 12 名妇女的最大呼气率检测结果(L/min)
序号

第五章假设检验

第五章假设检验
31
Hypothesis test
(二)P值假设检验的步骤 值假设检验的步骤
14
Hypothesis test
(一)假设检验中的两类错误 实际情况
决策结果 不拒绝H0 拒绝H0
H0为真 √ type I error
H0为伪 type II error √
•第Ⅰ类错误:指原假设为真,却拒绝原假设而犯的 类错误:指原假设为真,
错误, 错误,即弃真错误 发生概率为α 发生概率为α •第Ⅱ类错误:原假设为假时,未拒绝原假设而犯 第 类错误:原假设为假时, 的错误, 的错误,即取伪错误 发生概率为β 发生概率为β 15
27
Hypothesis test
3、利用P值决策的优点: 利用P 决策的优点: 直接给出了拒绝原假设犯第一类错误的真实概率; 直接给出了拒绝原假设犯第一类错误的真实概率; 避免了不同检验问题用同一个显著性水平; 避免了不同检验问题用同一个显著性水平; 当前计算机软件通常可以直接输出检验统计量的P值, 当前计算机软件通常可以直接输出检验统计量的P 免于查表, 免于查表,可直接判定
例如,针对特效药治愈率假定 例如,针对特效药治愈率假定H0 :θ≥97% 医疗周期假定H0 :t≤2个月 个月 服药后病情稳定情况H0 :d=2人 人
7
Hypothesis test
(2)备择假设(alternative hypothesis) 备择假设(alternative
★研究者收集证据想予以支持的假设 研究者收集证据想予以支持 予以支持的假设 ★表示为H1 ★表示形式:≠, >或<某一假定数值 表示形式:
Hypothesis test
4、决策规则 给定显著性水平α 给定显著性水平α,查统计量的对应分布表得出相 应的临界值。 应的临界值。 临界值通常取正值, 临界值通常取正值,应结合假设形式准确确定分布 中的临界值和拒绝域。 中的临界值和拒绝域。 将检验统计量的值与临界值进行比较 给出决策结果。 给出决策结果。 双侧检验: 统计量的值| 临界值, 双侧检验:|统计量的值|>临界值,则拒绝H0 左侧检验:统计量的值<临界值, 左侧检验:统计量的值<临界值,则拒绝H0 右侧检验:统计量的值>临界值, 右侧检验:统计量的值>临界值,则拒绝H0

概率论与数理统计教案第八章

概率论与数理统计教案第八章
其中, 是已知常数.试求拒绝域 .
例8为比较新老品种的肥料对作物的效用有无显著差别,选用了各方面条件差不多的10个地块种上此作物.随机选用其中5块施上新肥料,而剩下的5块施上老肥料.等到收获时观察到施新肥的地块,平均年产333(单位:千斤),样本方差为32,施老肥的地块平均年产330,样本方差为40.假设作物产量服从正态分布,检验新肥是否比老肥效用上有显著提高(显著性水平 ).
点面朝上
1
2
3
4
5
6
出现次数
23
26
21
20
15
15
在 水平下,请问,这颗骰子是否是均匀的
例2在某细纱机上进行断点率测定,测验锭子总数为440,测得断头次数记录如下表:
每锭断头数
0
1
2
34Βιβλιοθήκη 5678
锭数(实测)
269
112
38
19
3
1
0
0
3
试问在显著性水平 下能否认为锭子的断头数服从泊松分布
例3某高校研究在校学生的体重,现随机抽取了100位学生,测得他们的体重(单位:kg)为
检验参数
原假设与备择假设
检验统计量
拒绝域
方差
已知
;
当 时,

;
;
未知
;
当 时,

;
;
3、两个正态总体均值差的假设检验问题可汇总如下表
检验参数
抽样分布
检验统计量
拒绝域
均值差
已知
;
当 时,
;
;
未知
;
当 时,
;
;
4、两个正态总体方差比的假设检验问题可汇总如下表

假设检验PPT课件

假设检验PPT课件
假设检验
【学习目标】通过对本章的学习,掌握假设检验的概念和 类型、假设检验的两类错误和假设检验的一般步骤;重点掌握 单个总体均值的检验和比率的检验。
第一节 假设检验的基本问题 第二节 △ 假设检验的应用
假设检验
第一节 假设检验的基本问题
一、假设检验的概念 二、假设检验的两类错误 三、假设检验的类型 四、假设检验的类型一般步骤
假设检验
第一节 假设检验的基本问题
什么小概率?
1.在一次试验中,一个几乎不可能发生的事件发生的概率; 2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假 设; 3.小概率由研究者事先确定。
假设检验
第一节 假设检验的基本问题
二、假设检验的两类错误(决策风险)
(一) 第一类错误 第一类错误,亦称拒真(弃真)错误。是指当原假设为 真时,但由于样本的随机性使样本统计量的具体值落入 了拒绝区域,这时所作的判断是拒绝原假设。 犯第一类错误的概率亦称拒真概率,它实质上就是前面
t
986 1000 24
2.333>
t n 1 2.1315
16
2
所以接受 H1,即这天包装机工作不正常。
假设检验
第二节 假设检验的应用
二、单个总体比率(成数)的假设检验
比率P是平均数的一种特殊形式,因而前面讲的平均 数检验理论都适用于总体比率P的假设检验,只是估计量 的形式略有不同。
【例4】我国出口的参茸药酒畅销于某国市场。据以往调查, 购买此种酒的顾客中40岁以上的男子占50%。经营该药酒 的进出口公司经理关心这个比率是否发生了变化,于是, 委托一个咨询机构进行调查,这个咨询机构从众多购买该 药酒的顾客中随机抽取了400名进行调查,结果有210名为 40岁以上的男子。试问在0.05的显著水平上,能否认为购 买此种药酒的顾客中40岁以上男子所占比率变化了?

第七章 假设检验基础()精品PPT课件

第七章 假设检验基础()精品PPT课件

差值
1 1206.44
1678.44
472.00
2
921.69
1293.36
Hale Waihona Puke 371.673 1294.08
1711.66
417.58
4
945.36
1416.70
471.34
5
721.36
1204.55
483.19
6
692.32
1147.30
454.97
7
980.01
1379.59
399.58
➢ 买小米手机吗? 对手机评价:适合(买)、不适合(不买)
➢ 国庆节去八里沟怎样吗? 对景区的评价:好玩(去)、不好玩(不去)
所有的决策都遵循相同的基本模式
陈述多种可供选择的方案(假设) 收集支持这些方案的证据 根据证据的强弱做出决策 根据决定执行某种行为
统计学中的假设检验也是一种决策过程,同样遵循 这一基本模式。
研究结果可供选择的结论(目前的假设)有哪些?
1.该县儿童总体平均闭合月龄与一般儿童没有差异 2.该县儿童总体平均闭合月龄迟于一般儿童
两种假设在统计上的含义
抽样研究存在抽样误差!!
样本1
总体 均数=14.1
样本2
X1 14.3 X2 14.0
从总体1中抽样
样本1 X1 14.3
µ1=14.1
样本2 X2 14.0
s/ n 5.08/ 36
自由度:
n 1 3 6 1 35
3.确定P值
P值的定义 如果H0成立的条件下,出现统计量目
前值及更不利于H0的数值的概率。
直观地看:就是统计量对应分布曲线下 的尾部面积。
通过查表可以得到 对应统计量的尾部 面积,即P值

个和两个总体平均数的假设检验

个和两个总体平均数的假设检验
由该总体抽取量 了为 一 n1的个样含本, 样本平均X1数 ,为 样本方S1差 2;为
设第二个总体为 的 2, 平方 均差 数 22为 ,
由该总体抽取量 了为 n一 2的个 样含 本, 样本平均X2数 ,为 样本方S2差 2;为
1,X 1
2,X 2
1 2?
X1 X2 ?
5. 2 两个总体平均数的比较
1.配对实验设计:
指先将实验单位按配对的要求两两配对,然后 将每一个对子内的两个实验单位独立随机地分配到 两个处理组中。
配对的要求是,配成对子的两个实验单位的初 始条件应尽量一致,不同实验对子之间,实验单位 的初始条件可以有差异。
每一个对子就是实验的一次重复。
我们将实验单位分为两组的方式称为配对实验 设计。
3. 配对实验的检验步骤:
(1)无效假设H0 :μd=μ1-μ2 =0 备择假设HA :μd≠0,即μ1-μ2 ≠0
配对实验时,两组的实验单位数即两个样本的观 察值数目相等,n1=n2。但是反过来,两个样本 观察值相等的实验则不一定是配对实验。
判断配对实验的根据不是两个样本的观察值是否 相等,而是分组的方式。
在配对实验设计中,由于实验单位是两两配对的, 因此观察值也是两两配对的。
2.实验结果表示为:
处理
1 2
F
S12 S22
查F表,确定临界值,接 受或者拒绝H0
如果检验结果不显著,接受零假设σ12=σ22, 那么还按照前一种t检验进行检验。
如果检验结果显著,接受备择假设σ12 ≠ σ22,
那么按照下面的t检验方法进行检验。
tX1X2 X1X2 X1X2
s x1x2
s2 s2
x1
x2
s12/n1s22/n2

第六章--假设检验基础课件

第六章--假设检验基础课件
两样本所属总体方差相等且两总体均为正态分布
H 0 : 1 2H 1 :1 2 ( 单 1 2 或 侧 1 2 )
当H0成立时,检验统计量:
t X1X2 ~t, n1n22
Sc2n 11n12
第六章 假设检验基础
Sc2
n1
1S12 n2 1S22
n1 n2 2
X1 X1 2 X2 X2 2 n1 n2 2
第六章 假设检验基础
55、作出推断结论:当P≤时,结论为 按所取检验水准α拒绝H0,接受H1,差异有 统计学显著性意义。如果P> ,结论为按 所取检验水准α不拒绝H0,差异无统计学显 著性意义。其间的差异是由抽样误差引起
的。
第六章 假设检验基础
1.建立检验假设
原 假 设 H0:0 14.1 备 择 假H设1 :0(单 侧 ) 检 验 水 准: 0.05
第六章 假设检验基础
检验假设为:
H 0 : d 0H 1 :d 0 ( 单 d 0 或 侧 d 0 )
当H0成立时,检验统计量:
td0 ~t, n1
Sd n
第六章 假设检验基础
表6第-1二用节药前t后检患儿验血清中免疫球蛋白IgG(mg/dl)含量
二、序号配对设计资用料药前的t 检验 用药后
n1 20, X1 17.15,S1 1.59,n1 34, X2 16.92,S2 1.42
Sc2
n1
1S12 n2 1S22
n1 n2 2
2011.592 3411.422
20342
2.2 0
t X1 X2 17.1516.92 0.550
Sc2
1 n1
1 n2
2.20 1 1 20 34
得治疗前后舒张压(mmHg)的差值(前–后)如下表。问新药和标准药的疗效
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

AA
BB
2.从两个总体中随机抽取两个样本,两样本信息不同,推
断两总体信息是否不同。 A



2020/4/15
38
完全随机设计类型(两种形式)
例8.3 例8.4 例8.6
例 某医院用某新药与常规药治疗婴幼儿贫血,将20名贫
血患儿随机等分两组,分别接受两种药物治疗,测得血
红蛋白增加量(g/L)如下,问新药与常规药的疗效有无
②检验水准α=0.05
③ t 4 3 4.7140 50 1 49
1.5 / 50 ④⑤查拒界绝值零表假,设自,由接度受近备似择取假设50,,可可以得认到为“P新疗0法.0使0患1者锻炼持续时间的平均增加
量不等于常规疗法的3分钟”
2020/4/15
13
建立假设,确定单双侧检验 确定检验水准
2020/4/15
34
配对设计t检验可解决的问题
d 0
d ? 0
2020/4/15
35
配对设计t检验的假设检验步骤
H0:μd=0 H1: μd≠0 α=0.05
t d 0 : t( ), n 1
Sd / n
查ν=n-1的t界值表,确定P值
P≤α
拒绝H0,接受H1
2020/4/15
作出推断结论
2020/4/15
5
? 0
0 X 0是由抽样误差所致
0 X 0是由两总体异质性所致
2020/4/15
6
假设检验的基本步骤
1. 建立假设(H0和H1) ,确定单双侧检验 2. 确定检验水准α 3. 选择检验方法,计算检验统计量 4. 确定 P 值 5. 作出推断结论
2020/4/15
2020/4/15
24
例3 测得25例女性患者的血红蛋白(Hb),其均数为 150 (g/L),,标准差为16.5 (g/L)。而当地正常成年女性 的Hb均数为132 (g/L),问该病女性患者的Hb含量是否 与正常女性Hb含量不同?
2020/4/15
25
单样本设计t检验可解决问题
X 0
? 0
体重配成7对,一组为对照组,一组为脑缺氧模型组。试比较两
乳猪组编号动物脑1 组织钙2泵的含量3 有无差4别? 5
6
7
对照组
0.3550 0.2000 0.3130 0.3630 0.3544 0.3450 0.3050
试验组
0.2755 0.2545 0.1800 0.3230 0.3113 0.2955 0.2870
2020设检验步骤
H0:μ=μ0 H1: μ≠μ0
(双侧)
μ>μ0或μ<μ0 (单侧)
α=0.05
t X 0 : t( ), n 1
S/ n
查ν=n-1的t界值表,确定P值
P≤α
拒绝H0,接受H1
2020/4/15
作出推断结论
P>α
不能拒绝H0
27
单样本设计t检验的适用条件
编号
1
2
3
4
5
6
7
8
9
10
11
12
Wright 490 397 512 401 470 415 431 429 420 275 165 421 法
Mini法 525 415 508 444 500 460 390 432 420 227 268 443
差值d
35 18 -4
43 30 45
-41 3
2020/4/15
4
例7.2 某医生研究一种新的治疗充血性心力衰竭的方法。 对50位心功能在2~3级之间的成年男性患者进行4周的 治疗,考察其疗效。评价疗效的一个指标是锻炼持续时 间的增加量(分钟)。以前常规的治疗方法能使患者的锻 炼持续时间平均增加3分钟。该医生通过50位接受新方 法治疗的患者的数据算得锻炼持续时间平均增加4分钟, 标准差为1.5分钟。该新疗法使患者锻炼持续时间的平均 增加量是否多于常规疗法的3分钟?
假设检验基础
流行病与卫生统计学教研室
2020/4/15
1
假设检验的概念和基本原理
生活实例
某商家宣称:他的一大批鸡蛋“坏蛋率为1%”。 为了对这批鸡蛋的质量作出判断,某质量监督员从 中随机抽取5个作检查,结果4个为好蛋,1个为变 质蛋。 根据此结果,作为质量监督员如何评价鸡蛋的质量? 为什么?
2020/4/15
P>α
不能拒绝H0
36
配对设计t检验的适用条件
➢独立性 ➢正态性
2020/4/15
37
(三) 完全随机设计t检验(两独立样本t检验)
(two independent samples t-test)
完全随机设计类型(两种形式)
1.从同一个同体中随机抽取两个样本,分别采用两种不同
的处理,比较不同处理结果是否有差异。
单样本设计的t检验 配对设计的t检验 完全随机设计(成组设计)的t检验
2020/4/15
22
每种不同设计类型的t检验均主要从以下四个方面介绍:
1. 设计类型 2. 可解决的问题 3. 假设检验步骤 4. 适用条件
2020/4/15
23
(一)单样本设计的t检验one-sample t-test
单样本设计
及大于现有样本统计量值的概率。 怎样确定P值:构造的检验统计量服从相应的分布,查 相应分布界值表确定P值。 一般双侧检验查双侧界值,单侧检验查单侧界值。
2020/4/15
11
5.作出推断结论
P与检验水准α相比作出推断结论
P≤ α,拒绝H0,接收H1
(在H0成立的前提下,一次随机抽样发生了小概率事件)
7
1. 建立假设(H0和H1) ,确定单双侧检验
建立假设(H0和H1)
H0 零假设或原假设(null hypothesis)
通常为两总体参数相等或服从某分布;
H1 备择假设(alternative hypothesis)
通常为两总体参数不相等或不服从某分布;
确定单双侧检验
由研究目的及专业知识所决定 从备择假设H1 看: H1:μ≠μ0(μ>μ0和μ< μ0)
9
3.选择检验方法,计算检验统计量
应根据研究目的、资料类型、设计类型及样本含量大小 等因素选择合适的假设检验方法; 在H0成立的前提下,由样本已知信息构造检验统计量; 通常根据构造的检验统计量来命名假设检验方法。
2020/4/15
10
4.确定 P 值
P值的含义:由H0所规定的总体作随机抽样,获得等于
例8.1 例2 已知中学一般男生的心率平均值为74次/分钟,为了
研究经常参加体育锻炼的中学生心脏功能是否与一般 的中学生相同,在某地区中学随机抽取常年参加体育 锻炼的男生16名,测量他们的心率,结果分别为55、 72、58、57、70、75、72、69、61、67、69、73、59、 71、53、69。请作统计推断。
2020/4/15
16
一 、假设检验的两类错误
第Ⅰ类错误与第Ⅱ类错误的概念 将假设检验的结果与实际情况相比: 第Ⅰ类错误(typeⅠerror):H0为真时,拒绝H0 第Ⅱ类错误(type Ⅱ error) : H0不真时,不拒绝H0
2020/4/15
17
实际情况
推断结论和两类错误 检验结果
拒绝H0
P> α,不能拒绝H0
(在H0成立的前提下,一次随机抽样没有发生小概率事件,没有充 足的理由拒绝H0 )
2020/4/15
12
例7-2的假设检验的基本步骤
①H0:μ=3
(新疗法使患者锻炼持续时间的平均增加量等于常规疗法的3分钟 )
H1:μ≠3
(新疗法使患者锻炼持续时间的平均增加量不等于常规疗法的3分钟 )
差值d
0.0795 -0.0545 0.1330 0.0400 0.0431 0.0495 0.0180
2020/4/15
30
配对设计的设计形式
例2 为了研究孪生兄弟的出生体重是否与其出生顺序有关,共收 集了15对孪生兄弟的出生顺序和出生体重,数据如下:
编号 1
23
4
5
6
7
8
9
10 11 12 13 14 15
先出生 2.79 3.06 2.34 3.41 3.48 3.23 2.27 2.48 3.03 3.07 3.61 2.69 3.09 2.98 2.65
后出生 2.69 2.89 2.24 3.37 3.50 2.93 2.24 2.55 2.82 3.05 3.58 2.66 3.20 2.92 2.60
H1 : 0 (双侧检验 two-sides test) H1 : 0或 0 (单侧检验 one-sided test)
2020/4/15
8
2.确定检验水准α(size of a test)
检验水准α:为预先规定的小概率事件的标准 通常取值0.05或0.01 可根据研究目的进行调整
2020/4/15
选定检验方法,计算检验统计量
确定P值
P≤α
作出推断结论
P>α
拒绝H0,接受H1
2020/4/15
不能拒绝H0
14
第三节 两类错误及检验效能
假设检验的两类错误 假设检验的功效
2020/4/15
15
一 、假设检验的两类错误
假设检验是根据有限的样本信息对总体作 推断,不论做出那种推断结论,都有可能发生 错误。
配对设计常见的设计形式 异体配对 同一样品,采用两种不同处理 同体配对 自身前后或左右配对
2020/4/15
29
配对设计的设计形式
1. 异体配对:将两个不同的受试对象(按主要非处理因素)配成 特征相近的对子,同对的两个受试对象随机接受两种不同的处 理。
相关文档
最新文档