研究生应用数理统计假设检验演讲稿.ppt
合集下载
统计假设检验法研讨PPT课件( 42页)

统计数与参数之间的差异 是误差的概率大,假设成 立的概率大,接受假设。
某一实际的统计数落入小概率区间
统计数与参数之间的差异是误差 的概率小,假设成立的概率小, 否定假设假设。
例:多年的统计结果显示,某小麦品种的千粒重x~N(36,22),我们 在某地区选择9块地在小麦生长中后期喷施KH2PO4,千粒重的平均 值为 x 37g ,问喷施KH2PO4是否提高了小麦的千粒重。
小概率区间(否定区间)
95%
1.96nx1.96n
361.962 x361.962
9
9
34.69x37.31
x1.96n x1.96n
x361.962
x361.962
9
9
x34.69
x37.31
3、判断实际的样本平均数落入大概率区间还是小概率区间。
统计假设检验
在科学研究中,先提出假设,然后计算假设成立的概率大小, 如果假设成立的概率大,则接受假设,如果假设成立的概率 小,则否定假设。
假设处理间的效应不存在,统计数 与参数之间的差异全为误差引起
在假设成立的基础上,计算统计数的大概率区间 (置信区间)和小概率区间(否定区间)
某一实际的统计数落入大概率区间
12
n 1 n 2
4、原总体方差 12 22 未知
S 1 2 1 2 S 2 2 2 2
S
x1x2
x1x2
(x 1 x 2)x 1 x 2(x 1 x 2) (12)(x 1 x 2) (12) n 1 3 0N (0 ,1 )
22
x 1 x 2~N (x 1 x2, x 2 1 x2)N (12,n 1 1n 2 2)
Z(x 1x2)x 1 x2(x 1x2) (12)(x 1x2) (12)~N (0 ,1 )
某一实际的统计数落入小概率区间
统计数与参数之间的差异是误差 的概率小,假设成立的概率小, 否定假设假设。
例:多年的统计结果显示,某小麦品种的千粒重x~N(36,22),我们 在某地区选择9块地在小麦生长中后期喷施KH2PO4,千粒重的平均 值为 x 37g ,问喷施KH2PO4是否提高了小麦的千粒重。
小概率区间(否定区间)
95%
1.96nx1.96n
361.962 x361.962
9
9
34.69x37.31
x1.96n x1.96n
x361.962
x361.962
9
9
x34.69
x37.31
3、判断实际的样本平均数落入大概率区间还是小概率区间。
统计假设检验
在科学研究中,先提出假设,然后计算假设成立的概率大小, 如果假设成立的概率大,则接受假设,如果假设成立的概率 小,则否定假设。
假设处理间的效应不存在,统计数 与参数之间的差异全为误差引起
在假设成立的基础上,计算统计数的大概率区间 (置信区间)和小概率区间(否定区间)
某一实际的统计数落入大概率区间
12
n 1 n 2
4、原总体方差 12 22 未知
S 1 2 1 2 S 2 2 2 2
S
x1x2
x1x2
(x 1 x 2)x 1 x 2(x 1 x 2) (12)(x 1 x 2) (12) n 1 3 0N (0 ,1 )
22
x 1 x 2~N (x 1 x2, x 2 1 x2)N (12,n 1 1n 2 2)
Z(x 1x2)x 1 x2(x 1x2) (12)(x 1x2) (12)~N (0 ,1 )
应用统计方法——假设检验.ppt

2020/10/13
6
假设检验也可分为参数检验(Parametric test)和非参数检验(Nonparametric test)。当总 体分布形式已知,只对某些参数做出假设,进 而做出的检验为参数检验;对其它假设做出的 检验为非参数检验。如例 3.1 中,总体是两点 分布,只需对参数 P 做出假设检验,这是参数检 验问题,而例 3.2 则是非参数检验的问题。与 估计问题稍不同的是,一般来说非参数检验同 参数检验一样,在实际中经常要用到,因此, 我们准备花一定的篇幅分别加以介绍。
2020/10/13
10
下面我们用假设检验的语言来模拟商店的推断: 10 提出假设: H 0 :此人未作弊; H1 :此人作弊。 这里 H 0 称为原假设(Null hypothesis), H1 称为备选假 设 (Alternative hypothesis) 或 对 立 假 设 (Opposite hypothesis),备选假设也可以不写。 20 构造统计量,并由样本算出其具体值:
2020/10/13
4
Example 3.2 某研究所推出一种感冒特效新药,为证 明其疗效,选择 200 名患者为志愿者。将他们均分为
两组,分别不服药或服药,观察三日后痊愈的情况,
得出下列数据。
痊愈者 未痊愈者 合计
未服药者 48
ቤተ መጻሕፍቲ ባይዱ
52 100
服药者 56
44 100
合 计 104
96 200
问新药是否确有明显疗效?
2020/10/13
5
这个问题就不存在估计什么的问题。从数据来看,新 药似乎有一定疗效,但效果不明显,服药者在这次试验中 的情况比未服药者好,完全可能是随机因素造成的。对于 新药上市这样关系到千万人健康的事,一定要采取慎重的 态度。这就需要用一种统计方法来检验药效,假设检验就 是在这种场合下的常用手段。具体来说,我们先不轻易地 相信新药的作用,因此可以提出假设“新药无效”,除非 抽样结果显著地说明这假设不合理,否则,将不能认为新 药有明显的疗效。这种提出假设然后做出否定或不否定的 判断通常称为显著性检验(Significance test)。
研究生应用数理统计假设检验PPT文档共47页

谢谢!
研究生应用数理统计假设检验
6、法律的基础有两个,而且只有两个……公平和实德
8、法律就是秩序,有好的法律才有好的秩序。——亚里士多德 9、上帝把法律和公平凑合在一起,可是人类却把它拆开。——查·科尔顿 10、一切法律都是无用的,因为好人用不着它们,而坏人又不会因为它们而变得规矩起来。——德谟耶克斯
61、奢侈是舒适的,否则就不是奢侈 。——CocoCha nel 62、少而好学,如日出之阳;壮而好学 ,如日 中之光 ;志而 好学, 如炳烛 之光。 ——刘 向 63、三军可夺帅也,匹夫不可夺志也。 ——孔 丘 64、人生就是学校。在那里,与其说好 的教师 是幸福 ,不如 说好的 教师是 不幸。 ——海 贝尔 65、接受挑战,就可以享受胜利的喜悦 。——杰纳勒 尔·乔治·S·巴顿
《假设检验》PPT课件

2008-2009
样本统计量 临界值
抽样分布
2008-2009
1 -
置信水平 拒绝H0
0
样本统计量
临界值
✓决策规则
1. 给定显著性水平,查表得出相应的临 界值z或z/2, t或t/2
2. 将检验统计量的值与 水平的临界值进 行比较
3. 作出决策
双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
H1 : <某一数值,或 某一数值
例如, H1 : < 10cm,或 10cm
2008-2009
➢提出假设
【例】一种零件的生产标准是直径应为10cm,为对生产过
程进行控制,质量监测人员定期对一台加工机床检查, 确定这台机床生产的零件是否符合标准要求。如果零件 的平均直径大于或小于10cm,则表明生产过程不正常, 必须进行调整。试陈述用来检验生产过程是否正常的原 假设和备择假设
2008-2009
❖利用P值进行决策
➢什么是P 值(P-value)
1. 在原假设为真的条件下,检验统计量的观察值 大于或等于其计算值的概率 双侧检验为分布中两侧面积的总和
2. 反映实际观测到的数据与原假设H0之间不一致 的程度
3. 被称为观察到的(或实测的)显著性水平 4. 决策规则:若p值<, 拒绝 H0
2008-2009
第6章 假设检验
统计研究目的
统计设计
推
断
客观
统
统
分
现象
计
计
析
数量
调
整
表现
查
理
描 述
样本统计量 临界值
抽样分布
2008-2009
1 -
置信水平 拒绝H0
0
样本统计量
临界值
✓决策规则
1. 给定显著性水平,查表得出相应的临 界值z或z/2, t或t/2
2. 将检验统计量的值与 水平的临界值进 行比较
3. 作出决策
双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
H1 : <某一数值,或 某一数值
例如, H1 : < 10cm,或 10cm
2008-2009
➢提出假设
【例】一种零件的生产标准是直径应为10cm,为对生产过
程进行控制,质量监测人员定期对一台加工机床检查, 确定这台机床生产的零件是否符合标准要求。如果零件 的平均直径大于或小于10cm,则表明生产过程不正常, 必须进行调整。试陈述用来检验生产过程是否正常的原 假设和备择假设
2008-2009
❖利用P值进行决策
➢什么是P 值(P-value)
1. 在原假设为真的条件下,检验统计量的观察值 大于或等于其计算值的概率 双侧检验为分布中两侧面积的总和
2. 反映实际观测到的数据与原假设H0之间不一致 的程度
3. 被称为观察到的(或实测的)显著性水平 4. 决策规则:若p值<, 拒绝 H0
2008-2009
第6章 假设检验
统计研究目的
统计设计
推
断
客观
统
统
分
现象
计
计
析
数量
调
整
表现
查
理
描 述
数理统计之假设检验ppt课件

z2 z0.025 1.96;
x0
575.2570
5.2 102.0551.96
n 8 10
8
这说明小概率事件竟在一次试验中发生了,
故拒绝H0,可以接受H1。 即认为折断力大小有差别
完整版PPT课件
15
已知 X~N(,2), 2 已知,检验假设
H 0: 0 H 1: 0的过程分为六个步骤:
由样本算得 x543.5, s27.582 查表 t2(n1)t0.02 (4 5)2.776 这里 |t||543549|1.77t0.02(54)2.776
7.58/ 5 接受H0。新罐的平均爆破压力与过去无显著差别。
完整版PPT课件
31
例6 某工厂生产一种螺钉,标准要求是长度是32.5毫米,
假设的决定。 ❖ 基本思想(规则或前提)
小概率事件在一次试验中几乎不会发生。
完整版PPT课件
4
带概率性质的反证法 通常的反证法设定一个假设以后,如果出现的 事实与之矛盾,(即如果这个假设是正确的话,出现 一个概率等于0的事件)则绝对地否定假设.
带概率性质的反证法的逻辑是: 如果假设H0是正确的话,一次试验出现一个 概率很小的事件,则以很大的把握否定假设H0.
❖ 2 在H0成立的前提下,选择合适的统计量,这个统 计量要包含待检的参数,并求得其分布;
❖ 3 给定显著性水平 ,按分布写出小概率事件及其
概率表达式;
❖ 4 由样本计算出需要的数值;
❖ 5 判断小概率事件是否发生,是则拒绝,否接受
完整版PPT课件
9
二 单个正态总体参数的假设检验
一、总体均值 的假设检验
2
z x
2
完整版PPT课件
《假设检验》PPT课件 (2)

1.943 1.895 1.860 1.833 1.812
2.447 2.365 2.306 2.262 2.228
3.143 2.998 2.896 2.821 2.764
1.721 1.717 1.714 1.711 1.708
2.080 2.074 2.069 2.064 2.060
2.518 2.508 2.500 2.492 2.485
配对设计定量资料的t检验
配对设计是研究者为了控制可能存在的主要的非处理 因素而采用的一种实验设计方法。
自身配对
同一对象接受两种处理,如同一标本用两种方法进行检验, 同一患者接受两种处理方法;
异体配对
将条件相近的实验对象配对,并分别给予两种处理。
精选课件ppt
26
配对t 检验
首先求出各对数据间的差值d
精选课件ppt
12
建立假设
零假设(null hypothesis),记为H0
H0:=0;
备择假设(alternative hypothesis),记为H1
H1:≠0。
精选课件ppt
13
确定检验水准 (Significance Level)
一般取=0.05
小概率事件的判断标准
精选课件ppt
有可能得到手头的结果(不是小概率),故 根据现有的样本无法拒绝事先的假设(没 理由)
精选课件ppt
8
假设检验的基本思想
提出一个假设(H0); 如果假设成立,会得到现在的结果吗?
两种: 1) 得到现在的结果可能性很小(小概率)
拒绝H0 2) 有可能得到现在的结果(不是小概率)
没有理由拒绝H0
精选课件ppt
10
例4.4:
假设检验完整版PPT课件

H0 : 335ml H1 : 335ml
消费者协会接到消费者投诉,指控品牌纸包装 饮料存在容量不足,有欺骗消费者之嫌。包装 上标明的容量为250毫升。消费者协会从市场上 随机抽取50盒该品牌纸包装饮品进行假设检验。 试陈述此假设检验中的原假设和备择假设。
解:消费者协会的意图是倾向于证实饮料厂包装 饮料小于250ml 。建立的原假设和备择假设为
显著性水平和拒绝域
(右侧检验 )
抽样分布
置信水平
1-
拒绝H0
0 观察到的样本统计量
样本统计量 临界值
显著性水平和拒绝域
(右侧检验 )
抽样分布
置信水平
1-
拒绝H0
0
样本统计量
临界值
第一节 假设检验概述
1、假设检验的基本思想 2、假设检验的步骤 3、两类错误和假设检验的规则
三、两类错误和假设检验的规则
(单侧检验 )
抽样分布
置信水平
拒绝H0
1-
拒绝域 临界值
0 接受域
样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
置信水平
拒绝H0
1-
临界值
0
样本统计量
观察到的样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
置信水平
拒绝H0
1-
临界值
0
观察到的样本统计量
样本统计量
•【例2】一种罐装饮料采用自动生产线生产,每罐的容量 是255ml,标准差为5ml,服从正态分布。换了一批工人后, 质检人员在某天生产的饮料中随机抽取了16罐进行检验,
一个总体的检验
一个总体
消费者协会接到消费者投诉,指控品牌纸包装 饮料存在容量不足,有欺骗消费者之嫌。包装 上标明的容量为250毫升。消费者协会从市场上 随机抽取50盒该品牌纸包装饮品进行假设检验。 试陈述此假设检验中的原假设和备择假设。
解:消费者协会的意图是倾向于证实饮料厂包装 饮料小于250ml 。建立的原假设和备择假设为
显著性水平和拒绝域
(右侧检验 )
抽样分布
置信水平
1-
拒绝H0
0 观察到的样本统计量
样本统计量 临界值
显著性水平和拒绝域
(右侧检验 )
抽样分布
置信水平
1-
拒绝H0
0
样本统计量
临界值
第一节 假设检验概述
1、假设检验的基本思想 2、假设检验的步骤 3、两类错误和假设检验的规则
三、两类错误和假设检验的规则
(单侧检验 )
抽样分布
置信水平
拒绝H0
1-
拒绝域 临界值
0 接受域
样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
置信水平
拒绝H0
1-
临界值
0
样本统计量
观察到的样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
置信水平
拒绝H0
1-
临界值
0
观察到的样本统计量
样本统计量
•【例2】一种罐装饮料采用自动生产线生产,每罐的容量 是255ml,标准差为5ml,服从正态分布。换了一批工人后, 质检人员在某天生产的饮料中随机抽取了16罐进行检验,
一个总体的检验
一个总体
第四章 假设检验 《数理统计学》PPT课件

4.2.3 用p值作判断
表4.2.2对4个不同的显著性水平α分别列出相应的拒绝域和所 下的结论。
4.2.3 用p值作判断
定义4.2.1 在一个假设检验问题中,拒绝原假设H0的最小显 著性水平称为p值。
利用p值和给定的显著性水平α可以建立如下判断法则:
● 若α≥p值,则拒绝原假设H0; ● 若α<p值,则接受原假设H0。 例4.2.4 任一检验问题的p值可用相应检验统计量的分布(如标准正 态分布、t分布等)算得。
由样本到总体的推理称为统计推断。英国统计学 家R.A.费希尔认为常用的统计推断有三种基本形式, 它们是
● 抽样分布; ● 参数估计,又可分为点估计与区间估计; ● 假设检验,又可分为参数检验与非参数检验。 其中抽样分布与参数估计在前几章已有叙述,今后 还会不断补充。从这一章开始将叙述假设检验,并讨 论假设检验与区间估计,确定样本量之间的关系。
假设检验是统计学中最具特色的部分,其统计味甚浓。 从建立假设,寻找检验统计量,构造拒绝域(或计算p值), 直到最后作出判断等各个步骤上都能体现多种统计思想 的亮点。假设检验的思维方式也独具一格,从其他数学 分支学不到这种判断问题的思路。不犯错误、不冒风险 的判断是不存在的,问题在于设法控制犯错误的概率。
4.1.3 势函数
定义4.1.2 设检验问题
H0: θ∈Θ0, H1: θ∈Θ1 的拒绝域为W,则样本观察值x=(x1,x2,…,xn)落在拒绝域 W内的概率称为该检验的势函数,记为
g(θ)=Pθ(x∈W), θ∈Θ0∪Θ1⊂Θ
(4.1.8)
例4.1.3 某厂制造的产品长期以来不合格品率不超过0.01。 某天开工后,为检验生产过程是否稳定,随机抽检了 100件产品,发现其中有2件不合格品。试在0.10水平 上判断该天生产是否稳定。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
原假设为H0,T是检验 统计量,其观测值为t,H0的拒绝域为W , 则称如下定义的p值为原假设H0的检验的p值. 若W {T :T c},
定义1:“假设”是对总体参数的一种推断。 我们称 H为0 原假 设(null hypothesis)(或零假设);原假设的反面 H1 称为备择
假设(alternative hypothesis).
定义2:称 为检验水平,通常取0.1,0.05,0.01等。用它
来衡量原假设值. 5.判断:若统计量的观察值落在W中,就拒绝 H 0非此即彼的结论有一个令人 遗憾之处:结论不能反映由当前信息 拒绝(或接受)原假设理由的是否充分。 如拒绝域为(-,4.994][5.00016,+), 检验统计量的值为4.8,拒绝原假设.但依据 4.8<4.998得出结论理由是否勉强?对此最好 有一个数量上的刻画.------"检验的p值".
如果假设真,那么X : N (310,122 10)
我们看到 X与X 相比期望相同,而波动程度较小,即 X 的取
值更加集中在310附近。这样,已知的样本观察值的均值 x 落
在310附近的概率应该是比较大的。
为了方便衡量,我们X 310 : N (0,1)
时,随机地抽取10块地,测得每块的实际亩产量为 x1, x2 ,L , x10
计算出 x
1 10
10 i 1
xi
320千克,如果一直早稻产量 X
服从正态
分布 N (,122 ) ,试问所估产量是否正确?
解:由于亩产量X : N (,122 ), 0 310 ,故可产生两个假设:
H0 : 0 310, H1 : 310
时,随机地抽取10块地,测得每块的实际亩产量为 x1, x2 ,L , x10
计算出 x
1 10
10 i 1
xi
320千克,如果一直早稻产量 X
服从正态
分布 N (,122 ) ,试问所估产量是否正确?
解:由于亩产量X : N (,122 ), 0 310 ,故可产生两个假设:
H0 : 0 310, H1 : 310
Chapter 4 假设检验
§1假设检验的基本思想精品1定义1 总体的分布类型已知,对未知参数作出 假设,用总体中的样本检验此项假设是否成 立,就称为参数假设检验。
定义2 对总体分布函数的形式作出假设,用总 体中的样本检验此项假设是否成例1 买荔枝。小贩说他的荔枝是糯米糍,你信吗?怎么办?
9
例3.1.4设总体X~N(, 2),已知 2,只能取两个值 0和1,并且设0 1,现从总体中抽取容量为的样本X1, X2,L ,Xn ,试在显著性水平下,检验假设
H0:=0, H1:=1.
当样本容量给定时,、是相互制约的,无法同时变小, 若要、同时变小,只有增N-P原则:即在控制犯第一类错误
的条件下,寻求使犯第二类错误的概率 尽量小的检验。
一般检验的做法是:选择一个检验,使得当H0为真时,拒绝
H0犯错误的概率小于。因此拒绝原假设必须有充分的理由,
而备择假设是当原假设被拒绝后才能被接受,这就决定了原 假设和备择假设不是处于平等的地位,原假设受到保护。
定义3:由 P{| U | k } 确定出的 k 称为临界值。
{U
|| U
|
k
}称为H0的拒绝域;{U
||
U
|
k
}称为H
的接受域;
0
这样,当某个 x 落在 H0的拒绝域内时我们就拒绝原假设on Regions
拒绝域
拒绝域
1 -
/2 临界值
接受域 /2
几个原则:a)已存在的结论作为原假设;b)将 后果严重的错误作为第一类错误;c)要得到的 某个结论,其逆命题作为原假设。精品11三、假设检验的步骤
1.提出假设:根据问题,提出原假设H0和备择假设H1. 2.找统计量:根据假设内容,找出相应的统计量U 及其分布.
3.求临界值,确定拒绝域.给定显著性水平 ,由 P(|U | k ) 或P(|U | <k ) 1-,求出k,确定拒绝域W
如果假设真,那么X : N (310,122 10)
我们看到 X与X 相比期望相同,而波动程度较小,即 X 的取
值更加集中在310附近。这样,已知的样本观察值的均值 落 在310附近的概率应该是比较大的。
为了方便衡量,我们据长势估计平均亩产量为310千克,收割
吃一个尝一尝!如果真就买,不真就走开。
这一做法就含有假设检验的思想。 首 先,假设小贩所言为真(原假设); 第二步,吃一个(抽取样本,做检验); 第三步,买或不买(根据样本和统计理论 作出判断并采取据长势估计平均亩产量为310千克,收割
12 / 10
我们知道 u0.05/2 1.96, 即P{U 1.96} 0.05
将 x 代入,发现 u x 310 320 310 2.64 1.96
12 / 10 12 / 10
这说明,按照假设,x 落在了X 的分布当中远离310的地方。
也就是说,小概率事件发生了! 小概率原理:小概率事件在一次试验中是不太可能发生的。 现在,小概率事件却发生了,怎么办?说明了什么? 我们认为,是假设错了!或者说:假设不真。 这样,我们拒绝 H0, 而接受 H1,即 4 (两类错误)
实际情况 (未知)
H0成立
当(x1,L , xn ) W 接受H0
判断正确
当(x1,L , xn ) W 拒绝H0
犯第Ⅰ类错误(弃 真),P(拒绝H0| H0 为真)≤α
H0不成立
犯第Ⅱ类错误(纳伪) 判断正确 P(
定义1:“假设”是对总体参数的一种推断。 我们称 H为0 原假 设(null hypothesis)(或零假设);原假设的反面 H1 称为备择
假设(alternative hypothesis).
定义2:称 为检验水平,通常取0.1,0.05,0.01等。用它
来衡量原假设值. 5.判断:若统计量的观察值落在W中,就拒绝 H 0非此即彼的结论有一个令人 遗憾之处:结论不能反映由当前信息 拒绝(或接受)原假设理由的是否充分。 如拒绝域为(-,4.994][5.00016,+), 检验统计量的值为4.8,拒绝原假设.但依据 4.8<4.998得出结论理由是否勉强?对此最好 有一个数量上的刻画.------"检验的p值".
如果假设真,那么X : N (310,122 10)
我们看到 X与X 相比期望相同,而波动程度较小,即 X 的取
值更加集中在310附近。这样,已知的样本观察值的均值 x 落
在310附近的概率应该是比较大的。
为了方便衡量,我们X 310 : N (0,1)
时,随机地抽取10块地,测得每块的实际亩产量为 x1, x2 ,L , x10
计算出 x
1 10
10 i 1
xi
320千克,如果一直早稻产量 X
服从正态
分布 N (,122 ) ,试问所估产量是否正确?
解:由于亩产量X : N (,122 ), 0 310 ,故可产生两个假设:
H0 : 0 310, H1 : 310
时,随机地抽取10块地,测得每块的实际亩产量为 x1, x2 ,L , x10
计算出 x
1 10
10 i 1
xi
320千克,如果一直早稻产量 X
服从正态
分布 N (,122 ) ,试问所估产量是否正确?
解:由于亩产量X : N (,122 ), 0 310 ,故可产生两个假设:
H0 : 0 310, H1 : 310
Chapter 4 假设检验
§1假设检验的基本思想精品1定义1 总体的分布类型已知,对未知参数作出 假设,用总体中的样本检验此项假设是否成 立,就称为参数假设检验。
定义2 对总体分布函数的形式作出假设,用总 体中的样本检验此项假设是否成例1 买荔枝。小贩说他的荔枝是糯米糍,你信吗?怎么办?
9
例3.1.4设总体X~N(, 2),已知 2,只能取两个值 0和1,并且设0 1,现从总体中抽取容量为的样本X1, X2,L ,Xn ,试在显著性水平下,检验假设
H0:=0, H1:=1.
当样本容量给定时,、是相互制约的,无法同时变小, 若要、同时变小,只有增N-P原则:即在控制犯第一类错误
的条件下,寻求使犯第二类错误的概率 尽量小的检验。
一般检验的做法是:选择一个检验,使得当H0为真时,拒绝
H0犯错误的概率小于。因此拒绝原假设必须有充分的理由,
而备择假设是当原假设被拒绝后才能被接受,这就决定了原 假设和备择假设不是处于平等的地位,原假设受到保护。
定义3:由 P{| U | k } 确定出的 k 称为临界值。
{U
|| U
|
k
}称为H0的拒绝域;{U
||
U
|
k
}称为H
的接受域;
0
这样,当某个 x 落在 H0的拒绝域内时我们就拒绝原假设on Regions
拒绝域
拒绝域
1 -
/2 临界值
接受域 /2
几个原则:a)已存在的结论作为原假设;b)将 后果严重的错误作为第一类错误;c)要得到的 某个结论,其逆命题作为原假设。精品11三、假设检验的步骤
1.提出假设:根据问题,提出原假设H0和备择假设H1. 2.找统计量:根据假设内容,找出相应的统计量U 及其分布.
3.求临界值,确定拒绝域.给定显著性水平 ,由 P(|U | k ) 或P(|U | <k ) 1-,求出k,确定拒绝域W
如果假设真,那么X : N (310,122 10)
我们看到 X与X 相比期望相同,而波动程度较小,即 X 的取
值更加集中在310附近。这样,已知的样本观察值的均值 落 在310附近的概率应该是比较大的。
为了方便衡量,我们据长势估计平均亩产量为310千克,收割
吃一个尝一尝!如果真就买,不真就走开。
这一做法就含有假设检验的思想。 首 先,假设小贩所言为真(原假设); 第二步,吃一个(抽取样本,做检验); 第三步,买或不买(根据样本和统计理论 作出判断并采取据长势估计平均亩产量为310千克,收割
12 / 10
我们知道 u0.05/2 1.96, 即P{U 1.96} 0.05
将 x 代入,发现 u x 310 320 310 2.64 1.96
12 / 10 12 / 10
这说明,按照假设,x 落在了X 的分布当中远离310的地方。
也就是说,小概率事件发生了! 小概率原理:小概率事件在一次试验中是不太可能发生的。 现在,小概率事件却发生了,怎么办?说明了什么? 我们认为,是假设错了!或者说:假设不真。 这样,我们拒绝 H0, 而接受 H1,即 4 (两类错误)
实际情况 (未知)
H0成立
当(x1,L , xn ) W 接受H0
判断正确
当(x1,L , xn ) W 拒绝H0
犯第Ⅰ类错误(弃 真),P(拒绝H0| H0 为真)≤α
H0不成立
犯第Ⅱ类错误(纳伪) 判断正确 P(