第八章 假设检验(分布拟合检验)

合集下载

假设检验一般概念

假设检验一般概念

x 400 k 时接受原假设H0;
(1)
x 400 k 时拒绝原假设H0接受备择假设H1
(2)
进一步,由于当H0为真时,有
u x400 ~N(0,1) 25/ n
1 |u|要构x造一40个0具有明确k分布的统计量,可将(1)、(2)式转化为
25/ n 25/ n
2 |u|时接x受原40假0设H0 k
2. 拒绝域与接受域 称是检验水平或显著性水平,它是我们
制定检验标准的重要依据。常数u/2把标准正态分布密度曲线下
的区域分成了两大部分,其中一部分
(x1,x2, ,xn)uu/2
称为H0的拒绝域或否定域, 当样本点落入拒绝域时,我们便拒 绝原假设H0(同前述(6)式),另一部分
(x1,x2, ,xn)uu/2
(1)根据问题的要求提出假设,写明原假设H0和备择假设H1的
具体内容。
(2)根据H0的内容,建立(或选取)检验统计量并确定其分布。 (3)对给定(或选定)的显著性水平 ,由统计量的分布查表 或计算确定出临界值,进而得到H0的拒绝域和接受域。
(4)由样本观察值计算出统计量的值。
(5)做出推断:当统计量的值满足“接受H0的条件”时就接受 H0,否则就拒绝H0接受H1 。
u
2
时接受原假设H0 (5)
时拒绝原假设H0,接受备择假设 H1 (6)
分析(5)、(6)两式,可以这 样认为:
拒绝H0,是因为以H0成立 为出发点进行推理时,得到 了不合情理的结论,使小概 率事件在一次试验中发生了。
接受H0,是因为以H0成立 为出发点进行推理时,未发 现异常。
这就是带有概率特征的反证 法,认为小概率事件在一次 试验中不可能发生。
H0:X服从泊松分布;H1:X不服从泊松分布.

第八章 假设检验

第八章 假设检验

广 东 工 业 大 学
上页
下页
返回
1、原假设与备择假设 H0 2、原理
H1
小概率原理:小概率事件在一次试验中是不太会发生的。 (1)提出假设 H 0 (2)在假设 H 0 成立的条件下,构造一个小概率事件A, (3)根据样本值判断:
若在这一次试验中小概率事件A发生了,则拒绝假设 H 0 ,
若在这一次试验中小概率事件A未发生,则接受假设 H 0 .
广 东 工 业 大 学
上页
下页
返回
显著性水平 3、接受域与拒绝域
P{ A} P{样本落入区域 } R
拒绝域: R 接受域: R 4、两类错误
第一类错误: 弃真
小概率
样本点落入R:拒绝 H 0
样本点落入 R : 接受 H 0
犯第一类错误的概率:
H 0 正确,但拒绝了它。
第二类错误: 采伪
工 业 大 学
上页
下页
返回
二、假设检验的思想方法 假设检验的基本思想实质上是带有某种概率性质的反证 法。为了检验一个假设是否正确,首先假设该假设正确,然 后根据抽取到的样本对假设作出接受或拒绝的决策。如果样 本观察值导致了不合理的现象发生,就应拒绝假设,否则应 该接受假设。
假设检验中所谓“不合理”,并非逻辑中的绝对矛盾,而 是基于人们的实践活动中广泛采用的原则,即小概率事件在一 次试验中是几乎不发生的。但概率小到什么程度才能算作“小 概率事件”?显然,“小概率事件”的概率越小,否定原假设 就越有说服力。 广
上页
广 东 工 业 大 学
下页
返回
例1 某砖厂生产的砖其抗拉强度X服从正态分布 N ( ,1.21) ,今从 该厂产品中随机抽取6块,测得其平均抗拉强度为31.13.试检验 这批砖的平均抗拉强度为32.5是否成立,取显著性水平 0.05. 解: 提出原假设 H 0 : 0 32.5 双边检验: 单边检验:

第八章拟合优度检验

第八章拟合优度检验

142 149 142 137 134 144 146 147 140 142
140 137 152 145
解 为粗略了解数据的分布情况,先画出直方图。
步骤如下: 1.找出数据的最小值、最大值为126、158,取区 间[124.5, 159.5],它能覆盖[126, 158]; 2.将区间[124.5, 159.5]等分为7个小区间,小区间的 长度Δ=(159.5-124.5)/7=5, Δ称为组距,小区 间的端点称为组限,建立下表:
Y 50 31 26
17
10
8
6
6
8
试检验相继两次地震间隔天数 X 服从指数分布.
解 所求问题为: 在水平 0.05下检验假设
H0 : X 的概率密度
f
(
x)
1
x
e
,
0,
x 0, x 0.
由于在 H0 中参数 未具体给出, 故先估计 .
由最大似然估计法得 ˆ x 2231 13.77,
A5 :19.5 x 24.5 10
A6 : 24.5 x 29.5 8
A7 : 29.5 x 34.5 6
A8 : 34.5 x 39.5 A9 : 39.5 x
6
8
pˆ i
npˆ i
fi2 / npˆi
0.2788 45.1656
55.3519
0.2196 35.5752
27.0132
A7 :154.5 x
npˆ i
0.73
4.36 5.09
14.72
26.21
23.61
11.22
3.15 14.37
fi2 / npˆi
4.91
6.79 41.55 24.40 10.02 =87.67

第八章__假设检验(分布拟合检验)

第八章__假设检验(分布拟合检验)

2 0.05
(1)
=3.841
由于统计量 2的实测值
=2 0.4158<3.841,
未落入否定域.
故认为试验结果符合孟德尔的3:1理论.
这些试验及其它一些试验,都显 示孟德尔的3: 1理论与实际是符合的. 这本身就是统计方法在科学中的一项 重要应用.
用于客观地评价理论上的某个结论是否 与观察结果相符,以作为该理论是否站 得住脚的印证.
Σ
fi
pˆ i
npˆ i
50 0.2788 45.1656
npˆ i fi (npˆi fi )2 / npˆi
-4.8344 0.5175
31 0.2196 35.5752
ቤተ መጻሕፍቲ ባይዱ
4.5752 0.5884
26 0.1527 24.7374
-1.2626 0.0644
17 0.1062 17.2044
按 =0.05,自由度为4-1-1=2查 2 分布表得
2 0.05
(2)=5.991
由于统计量 2 的实测值
2=2.43<5.991,
未落入否定域.
故认为每年发生战争的次数X服从 参数为0.69的泊松分布.
例2. 我们以遗传学上的一项伟大发现为 例说明统计方法在研究自然界和人类社会的规 律性时,是起着积极的、主动的作用.
第八章 假设检验(续)
§4. 分布拟合检验
在前面的课程中,我们已经了解了假 设检验的基本思想,并讨论了当总体分布为 正态时,关于其中未知参数的假设检验问 题.
然而可能遇到这样的情形,总体服从何 种理论分布并不知道,要求我们直接对总体 分布提出一个假设 .
例1. 从1500到1931年的432年间,每年 爆发战争的次数可以看作一个随机变量,椐统 计,这432年间共爆发了299次战争, 数据如下:

第八章 假设检验

第八章  假设检验
2
(一)问题的提出
例1.1 体重指数BMI是目前国际上常用的衡量人体胖 瘦程度以及是否健康的一个标准. 专家指出, 健康 成年人的BMI 取值应在 18.55- 24.99 之间.某种 减肥药广告宣称, 连续使用该种减肥药一个星期便 可达到减肥的效果.为了检验其说法是否可靠,随机 抽取9位试验者(要求BMI 指数超过25,年龄在20-25 岁女生),
x 0.522 0.465, 依然拒绝H0;
那么,拒绝H0的最小的值 是多少?最小的显 著水平又是多少?
(一)问题的提出
先让每位女生记录没有服用减肥药前的体重, 然后 让每位女生服用该减肥药, 服药期间, 要求每位女 生保持正常的饮食习惯, 连续服用该减肥药1周后, 再次记录各自的体重.测得服减肥药前后的体重差 值X(服药前体重-服药后体重) (单位: kg): 1.5,0.6,-0.3,1.1,-0.8,0,2.2,-1.0,1.4 设X~N(μ,0.36), μ未知,根据目前的样本资料能否 认为该减肥药广告中的宣称是可靠的?
n i1
Xi
~
N(,
1 ), n
H0 : 0, H1 : 1( 0 ), 拒绝域:X c.
P1 (X c)
P0 (X c)
0
c
1
犯两类错误的 概率相互制约
11
例1.1中,犯第I类错误的概率
(c) P{拒绝H0|H0是真的} P{X c| 0}
P{ X c | 0} / n / n
例1.2 一种饼干的包装盒上标注净重200g,假 设包装盒的重量为定值,且设饼干净重服从N (μ,σ2), μ, σ2均未知.现从货架上取来3盒,称 得毛重(单位:g)为 233,215,221,根据这 些数据是否可以认为这种包装饼干的标准差超 过6g?

概率论与数理统计第八章假设检验

概率论与数理统计第八章假设检验
当总体分布函数完全未知或只知其形式、但 不知其参数的情况,为推断总体的性质,提出 某些关于总体的假设。
为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.

《概率论与数理统计》课件第八章 假设检验

《概率论与数理统计》课件第八章 假设检验
假设检验是统计学中一种重要的推断方法,其理论依据为小概率原理。小概率原理指的是,在一次试验中,小概率事件几乎不会发生。在假设检验中,如果原假设为真,那么出现小概率率性质的反证法,它允许我们在一定程度上接受或拒绝关于总体参数或分布的假设。假设检验在统计学中有着广泛的应用,尤其是在单个及两个正态总体的均值和方差的检验中。通过这些检验,我们可以根据样本数据对总体的特性进行推断,从而作出科学的决策。需要注意的是,任何检验方法都不能完全排除犯错误的可能性,但假设检验通过控制犯第一类错误的概率,即错误地拒绝真实假设的概率,来确保推断的可靠性。在实际应用中,我们还需要根据具体情况选择合适的显著性水平,以平衡犯两类错误的概率。

概率论GL8.3

概率论GL8.3
概 率 论 与 数 理 统 计
第八章 假设检验
§8.3 分布拟合检验
概 率 进行讨论的。在实际应用中,总体分布常常是未知的, 论 与 所以要对总体分布的假设进行检验,这就是分布拟合 数 2 检验法。 检验.本节仅介绍 理 统 计
上节中各检验法都是在总体分布形式为已知的前提下
8.3.1 离散型情形
26 11
0.194 0.163
19.4 16.3
6.6 -5.3
2.245 1.723
9
0.114 0.069
11.4 6.9
-2.4 2.1
0.505 0.639
概 率 论 与 数 理 统 计
9
2 1
2 1 0
0.036 0.017
0.007 0.003 0.002
3.6 1.7
0.7 0.3 0.2 6.2815 -0.5 0.0385
故在水平 0.05 下接受 H 0 ,即认为样本来自泊松分布,
也就是说认为理论上的结合是符合实际的。
概 率 论 与 数 理 统 计
例2 研究混凝土抗压强度 X 的分布,已测得 200 件混凝土试件的抗压强度以分组的形式列如下表 (1kgf=9.8N):
j
压强区间kgf/cm2 190~200 200~210 210~220 220~230 230~240 240~250
频率逐渐稳定在 p j 的附近,它们之间的差异,在统计意义 下将越来越小。
所以,样本中出现 j 的频数 n j 和理论频数 np j 之间
概 率 皮尔逊(Pearson)提出的使用统计量 论 r ( n np ) 2 与 j 2 j 数 np j j 1 理 一般来说, 统 来衡量实际频数 n j 与理论频数 np j 的差异程度。 计 若 H 0 为真,且实验的次数又是足够多的,则这种差异即 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

这些试验及其它一些试验, 这些试验及其它一些试验,都显 示孟德尔的3: 理论与实际是符合的 理论与实际是符合的. 示孟德尔的 1理论与实际是符合的 这本身就是统计方法在科学中的一项 这本身就是统计方法在科学中的一项 重要应用. 重要应用
用于客观地评价理论上的某个结论是 否与观察结果相符, 否与观察结果相符,以作为该理论是 否站得住脚的印证. 否站得住脚的印证 Nhomakorabea或
k f i2 n fi χ 2 = ∑ − pi = ∑ −n i =1 pi n i =1 npi
2
统计量
χ
2
的分布是什么? 的分布是什么
皮尔逊证明了如下定理: 皮尔逊证明了如下定理 若原假设中的理论分布F(x)已经完全给 已经完全给 若原假设中的理论分布 定,那么当n → ∞ ,统计量 时 的分布渐近(k-1)个自由度的 χ 分布 个自由度的 分布. 的分布渐近 如果理论分布F(x)中有 个未知参数需用 中有r个未知参数需用 如果理论分布 中有 相应的估计量来代替,那么当 相应的估计量来代替, 时,统 n →∞ 计量 2的分布渐近 (k-r-1)个自由度的 2 个自由度的 分 χ χ 布.
2 2
如果根据所给的样本值 X1,X2, …,Xn算得 2 的实测值落入拒绝域, 统计量 χ 的实测值落入拒绝域,则拒绝原假 否则就认为差异不显著而接受原假设. 设,否则就认为差异不显著而接受原假设
皮尔逊定理是在n无限增大时推导出来 皮尔逊定理是在 无限增大时推导出来 无限 因而在使用时要注意n要足够大 要足够大, 的,因而在使用时要注意 要足够大,以及 npi 不太小这两个条件 不太小这两个条件 这两个条件. 根据计算实践,要求 不小于 不小于50, 根据计算实践,要求n不小于 ,以及 npi 都不小于 5. 否则应适当合并区间,使 否则应适当合并区间, npi满足这个要求 .
2 2
根据这个定理, 根据这个定理,对给定的显著性水平α , 2 2 查χ 分布表可得临界值 χα ,使得
P(χ > χα ) = α
2 2
得拒绝域: 得拒绝域
χ > χα (k −1) (不需估计参数 不需估计参数) 不需估计参数
2 2
估计r χ > χα (k − r −1) (估计 个参数 估计 个参数)
( fi − npi ) χ =∑ npi i=1
k 2
2
是k个近似正态的变量的平方和 个近似正态的变量的平方和. 个近似正态的变量的平方和 这些变量之间存在着一个制约关系: 这些变量之间存在着一个制约关系:
npi 2 2 渐近(k-1)个自由度的 χ 分布 故统计量 χ 渐近 个自由度的 分布.
i=1
假设检验( 第八章 假设检验(续)
§4. 分布拟合检验 在前面的课程中, 在前面的课程中,我们已经了解了假 设检验的基本思想, 设检验的基本思想,并讨论了当总体分布 为正态时, 为正态时,关于其中未知参数的假设检验 问题 . 然而可能遇到这样的情形, 然而可能遇到这样的情形,总体服从何 种理论分布并不知道, 种理论分布并不知道,要求我们直接对总体 分布提出一个假设 .
实测频数
fi − npi
理论频数
标志着经验分布与理论分布之间的差异的大小. 标志着经验分布与理论分布之间的差异的大小
皮尔逊引进如下统计量表示经验分布 与理论分布之间的差异: 与理论分布之间的差异 在理论分布
( fi − npi ) 2 χ =∑ npi i=1
k
k
2
已知的条件下, 已知的条件下 npi是常量
年的432年间 年间, 例1. 从1500到1931年的 年间,每年爆 到 年的 发战争的次数可以看作一个随机变量,椐统计, 发战争的次数可以看作一个随机变量,椐统计 年间共爆发了299次战争 数据如下: 次战争, 这432年间共爆发了 次战争 数据如下 年间共爆发了
战争次数X 战争次数 发生 X次战争的年数 次战争的年数 223 0 142 1 48 2 15 3 4 4
又如, 又如,某钟表厂对生产的钟进行精确性检 抽取100个钟作试验,拨准后隔 小时 个钟作试验, 查,抽取 个钟作试验 拨准后隔24小时 以后进行检查,将每个钟的误差(快或慢) 以后进行检查,将每个钟的误差(快或慢) 按秒记录下来. 按秒记录下来
问该厂生产的钟的误差是否服从正态 分布? 分布?
解决这类问题的工具是英国统计学家 K.皮尔逊在 皮尔逊在1900年发表的一篇文章中引进 皮尔逊在 年发表的一篇文章中引进 2 检验法. 的所谓 χ 检验法 这是一项很重要的工作,不少人 这是一项很重要的工作, 把它视为近代统计学的开端. 把它视为近代统计学的开端
在概率论中,大家对泊松分布产生的一 在概率论中, 般条件已有所了解,容易想到,每年爆发战 般条件已有所了解,容易想到, 争的次数, 争的次数,可以用一个泊松随机变量来近似 也就是说, 描述 . 也就是说,我们可以假设每年爆发战 争次数分布X近似泊松分布 近似泊松分布. 争次数分布 近似泊松分布 现在的问题是: 现在的问题是: 上面的数据能否证实X 上面的数据能否证实 具有 泊松分布的假设是正确的? 泊松分布的假设是正确的?
让我们回到开始的一个例子, 让我们回到开始的一个例子,检验每 年爆发战争次数分布是否服从泊松分布. 年爆发战争次数分布是否服从泊松分布 根据观察结果, 根据观察结果,得参数 λ 的极大似然估计为 提出假设H 提出假设 0: X服从参数为λ 的泊松分布 服从参数为
ˆ λ = X =0.69
按参数为 的泊松分布, 按参数为0.69的泊松分布,计算事件 的泊松分布 计算事件X=i 的 概率p p 概率 i , i的估计是 −0.69 i , ˆ pi = e 0.69 i ! i=0,1,2,3,4 将有关计算结果列表如下: 将有关计算结果列表如下
孟德尔

黄色纯系
… 子一代 子二代
绿色纯系
根据他的理论,子二代中 根据他的理论,子二代中, 黄、绿之比 近似为3:1, 近似为 , 他的一组观察结果为: 他的一组观察结果为: 黄70,绿27 , 近似为2.59:1,与理论值相近. ,与理论值相近 近似为
由于随机性,观察结果与 总有些差 由于随机性,观察结果与3:1总有些差 距,因此有必要去考察某一大小的差异是否 已构成否定3:1理论的充分根据 理论的充分根据, 已构成否定 理论的充分根据,这就是如 下的检验问题. 下的检验问题 检验孟德尔的3:1理论 检验孟德尔的 理论: 理论 提出假设H0: p1=3/4, p2=1/4 提出假设 这里,n=70+27=97, k=2, 这里, 理论频数为: 理论频数为: np1=72.75, np2=24.25 实测频数为70, 实测频数为 ,27.
日至1971年2月9日共 日共2231天 例3. 自1965年1月1日至 年 月 日至 年 月 日共 天 记和5级以上的 中,全世界纪录到里氏震级4记和 级以上的 全世界纪录到里氏震级 记和 地震162次,统计如下 次 地震
相继两次地震间 0-4 隔的天数xi 出现的频数f 出现的频数 i 50 10-14 5-9 31 26 15-19 17 10 20-24 25-29 8 6 30-34 35-39 6 8(1) ≥40
例2. 我们以遗传学上的一项伟大发现为例 说明统计方法在研究自然界和人类社会的规律 性时,是起着积极的、主动的作用. 性时,是起着积极的、主动的作用 奥地利生物学家孟德尔进行了长 达八年之久的豌豆杂交试验, 达八年之久的豌豆杂交试验 并根据 试验结果,运用他的数理知识 运用他的数理知识, 试验结果 运用他的数理知识 发现了 遗传的基本规律. 遗传的基本规律
战争次数 x 实测频数 fi
ˆ pi ˆ n pi
0 1 2 223 142 48 0.58 0.31 0.18 216.7 149.5 51.6
3 15 0.01 12.0
4 4 0.02 2.16

14.16 ( fi − npi )2 0.183 0.376 0.251 1.623 2.43 npi 的组予以合并, 次及4次 将n pi<5的组予以合并,即将发生 次及 次 ˆ 的组予以合并 即将发生3次及 战争的组归并为一组. 战争的组归并为一组 因H0所假设的理论分布中有一个未知 参数,故自由度为4-1-1=2. 参数,故自由度为

k
pi ( fi − npi )
=0
尚未完全给定的情况下, 在F(x)尚未完全给定的情况下,每个未知 尚未完全给定的情况下 参数用相应的估计量代替, 参数用相应的估计量代替,就相当于增加一个 制约条件,因此,自由度也随之减少一个. 制约条件,因此,自由度也随之减少一个. 若有r个未知参数需用相应的估计量来代 个未知参数需用相应的估计量来代 自由度就减少r个 替,自由度就减少 个. 渐近(k-r-1)个自由度的 χ 分布 此时统计量 χ 渐近 个自由度的 分布.
2
( fi − npi ) χ =∑ npi i =1
k 2
2
为了便于理解, 为了便于理解,我们对定理作一 点直观的说明. 点直观的说明
在理论分布F(x)完全给定的情况下,每个pi 完全给定的情况下,每个 在理论分布 完全给定的情况下 都是确定的常数. 棣莫佛- 都是确定的常数 由棣莫佛-拉普拉斯中心极 限定理, 充分大时 渐近正态, 限定理,当n充分大时,实测频数 fi 渐近正态, 充分大时, 因此
K.皮尔逊 皮尔逊
χ2检验法是在总体 的分布未知时, 检验法是在总体 的分布未知时, 是在总体X 根据来自总体的样本, 根据来自总体的样本,检验关于总体分 布的假设的一种检验方法. 布的假设的一种检验方法
检验法对总体分布进行检验时 对总体分布进行检验时, 使用 χ 检验法对总体分布进行检验时,
2
检验假设H 若在H 在用 χ2检验法 检验假设 0时,若在 0下 分布类型已知,但其参数未知, 分布类型已知,但其参数未知,这时需要先 用极大似然估计法估计参数,然后作检验. 用极大似然估计法估计参数,然后作检验 分布拟合的 χ 检验法 的基本原理和步 骤如下: 骤如下
相关文档
最新文档