分布函数的假设检验
正态分布均值的假设检验

VS
详细描述
在单样本均值假设检验中,我们首先需要 确定一个期望的均值,然后计算样本的均 值。通过比较这两个值,我们可以判断样 本均值是否显著地偏离了期望的均值。常 用的统计量包括z分数和t分数,用于评估 样本均值与已知期望值之间的差异是否具 有统计学上的显著性。
双样本均值的假设检验
总结词
双样本均值的假设检验是检验两个独立样本的均值是否存在显著差异。
详细描述
在双样本均值假设检验中,我们需要比较两个独立样本的均值。通过计算两组样本的均值,并比较这两个值,我 们可以判断两个样本的均值是否存在显著差异。常用的统计量包括t检验和z分数,用于评估两个样本均值之间的 差异是否具有统计学上的显著性。
配对样本均值的假设检验
总结词
配对样本均值的假设检验是检验两个相关样本的均值是否存在显著差异。
Part
0(H0)
样本数据来自的总体均值等于某一固 定值。
备择假设(H1)
样本数据来自的总体均值不等于该固 定值。
选择合适的检验统计量
• 常用的检验统计量有t统计量、Z统计量等,根据具体情况选择合适的统计量。
确定显著性水平
• 显著性水平(α):在假设检验中,原假设为真但被拒绝 的概率,通常取值在0.01至0.05之间。
正态分布在统计学中的重要性
基础性
正态分布是统计学中最重要的概 率分布之一,许多统计方法和理 论都基于正态分布。
广泛应用性
正态分布在自然和社会科学领域 都有广泛的应用,如生物学、医 学、经济学、心理学等。
理论依据
正态分布在统计学中提供了理论 依据,许多统计推断和决策方法 都基于正态分布的性质和假设。
1 2
判断假设是否成立
通过假设检验,可以判断一个假设是否成立,从 而为进一步的研究或决策提供依据。
概率与统计中的抽样分布与假设检验

概率与统计中的抽样分布与假设检验概率与统计是一门研究随机事件及其规律的学科,其中抽样分布与假设检验是概率与统计学中至关重要的概念。
本文将介绍抽样分布的概念及其重要性,并探讨假设检验的原理和应用。
一、抽样分布在统计学中,抽样是指从总体中选取一部分样本进行观察和测量,通过对样本的分析和推断,得出对总体特征的结论。
而抽样分布则是在多次抽取样本的基础上得到的一组统计量的概率分布。
抽样分布的重要性在于它为统计推断提供了理论基础。
根据中心极限定理,当样本容量足够大时,样本均值的抽样分布近似服从正态分布。
这意味着通过对样本数据的分析,我们可以对总体特征进行合理的推断和估计。
二、假设检验假设检验是概率与统计学中常用的分析方法,用于检验关于总体参数的某种假设。
它基于样本数据,通过比较样本统计量与假设值之间的差异,来判断是否拒绝或接受某个假设。
假设检验的基本步骤包括:1. 建立原假设(H0)和备择假设(H1):原假设通常是关于总体特征的某种陈述,而备择假设则是与原假设相对立的假设。
2. 选择适当的检验统计量:根据具体问题选择合适的统计量进行计算和分析。
3. 确定显著性水平(α):显著性水平是进行假设检验时预先设定的一个界限,用来判断是否拒绝原假设。
通常将显著性水平设定为0.05或0.01。
4. 计算检验统计量的观察值:通过对样本数据进行计算,得到实际的检验统计量的值。
5. 判断检验统计量的观察值是否落在拒绝域内:拒绝域是指在显著性水平下,根据分布函数得到的一组临界值。
如果观察值落在拒绝域内,则拒绝原假设;否则,接受原假设。
6. 得出结论:根据判断结果,对于原假设的合理性进行结论。
假设检验在实际问题中有着广泛的应用。
例如,在医学研究中,可以使用假设检验来判断新药物是否对疾病有显著疗效;在工商管理中,可以使用假设检验来判断某种市场策略是否能够提高销售业绩。
总结:概率与统计中的抽样分布与假设检验是概率与统计学的重要概念。
概率论与数理统计第八章假设检验

为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
统计学中的正态分布与假设检验公式整理

统计学中的正态分布与假设检验公式整理正态分布是统计学中一种重要的概率分布,广泛应用于各个领域的数据分析和模型建立中。
而假设检验则是统计学中常用的一种方法,用于对假设的真实性进行验证。
本文将对正态分布和假设检验的公式进行整理,并讨论其在统计学中的应用。
一、正态分布正态分布,又称为高斯分布,是一种连续概率分布。
它的概率密度函数的数学表达式为:f(x) = (1 / (σ * √(2π))) * e^(-((x - μ)^2 / (2 * σ^2)))其中,f(x)表示在取值为x的点的概率密度,μ表示正态分布的均值,σ表示正态分布的标准差。
正态分布的均值决定了分布的中心位置,标准差则决定了分布的形状。
正态分布具有许多重要性质,例如:1. 标准正态分布:当均值μ为0,标准差σ为1时,得到的正态分布称为标准正态分布。
其概率密度函数为:φ(x) = (1 / √(2π)) * e^(-x^2 / 2)标准正态分布在实际应用中经常用于转换其他正态分布为标准化分布,方便计算和比较。
2. 正态性检验:统计学中经常需要判断一组数据是否符合正态分布。
常用的正态性检验方法包括Kolmogorov-Smirnov检验、Shapiro-Wilk检验等。
这些方法都是基于样本数据与理论正态分布的差异来进行判断。
3. 中心极限定理:中心极限定理是统计学中一条非常重要的定理,它指出,对于任意一组具有有限方差的独立随机变量,其样本均值的分布在样本量趋于无穷时,逼近于正态分布。
二、假设检验假设检验是统计学中用于验证某个假设是否成立的一种方法。
在假设检验过程中,我们需要提出一个原假设(H0)和一个备择假设(H1),然后通过数据分析来判断是否支持原假设。
1. 假设检验的步骤:(1) 建立假设:根据实际问题和研究目的,提出原假设和备择假设。
(2) 选择显著性水平:显著性水平α是控制拒绝原假设的错误概率。
一般常用的显著性水平有0.05和0.01。
正态分布假设检验

正态分布假设检验一、概述正态分布假设检验是统计学中常用的一种方法,用于判断一个数据集是否符合正态分布。
正态分布是指在统计学中,当数据集的频率分布呈钟形曲线时,称其为正态分布。
正态分布在实际应用中非常广泛,因为许多自然现象都遵循这种分布规律。
对于一个数据集而言,如果它符合正态分布,则可以使用一系列的统计方法进行进一步的研究和分析。
二、检验方法1. 假设检验假设检验是指通过样本数据来推断总体参数的方法。
在正态分布假设检验中,我们需要对总体均值和标准差进行假设检验。
具体而言,我们需要提出原假设和备择假设两个假设:原假设:样本数据符合正态分布;备择假设:样本数据不符合正态分布。
在进行实际计算时,我们需要根据样本数据来计算出样本均值和标准差,并使用这些数据来推断总体均值和标准差是否符合正态分布。
2. 正态概率图正态概率图是判断一个数据集是否符合正态分布的常用方法之一。
它通过将数据集的分位数与正态分布的分位数进行比较,来判断数据集是否符合正态分布。
具体而言,正态概率图将数据集的每个值按照从小到大的顺序排列,并计算出每个值对应的标准化值(即该值与样本均值之间的差除以样本标准差)。
然后,将这些标准化值按照从小到大的顺序排列,并绘制在图表上。
如果数据集符合正态分布,则这些标准化值应当近似于一个直线。
3. 偏度和峰度检验偏度和峰度是用来描述一个数据集形态特征的指标。
在正态分布中,偏度为0,峰度为3。
因此,在进行正态分布假设检验时,我们可以通过计算样本偏度和峰度来判断样本是否符合正态分布。
具体而言,如果样本偏度和峰度与正态分布相差不大,则可以认为样本符合正态分布。
三、实例演示以下是一个实例演示,在Python中使用scipy库进行正态分布假设检验:```pythonimport numpy as npfrom scipy import stats# 生成100个随机数data = np.random.normal(0, 1, 100)# 进行正态性检验k2, p = stats.normaltest(data)alpha = 0.05# 输出检验结果print("p = {}".format(p))if p < alpha:print("数据不符合正态分布")else:print("数据符合正态分布")```在上述代码中,我们首先生成了一个包含100个随机数的数据集。
第七章假设检验

k
,
n
也就是说,事件“|
U
|
z
”2
2
2
是一个小概率事件.
由标准正态分布的上分位点的定义知:
k z 2 ,
17
故可以取拒绝域为 W: | U | z 2
如果由样本值算得该统计量的实测值落
入区域W,则拒绝H0 ;否则,不能拒绝H0 .
这是因为,如果H0 是对的,那么衡量差 异大小的某个统计量落入区域 W(拒绝域) 是 个小概率事件. 如果该统计量的实测值落入 W,也就是说, H0 成立下的小概率事件发生 了, 那么就认为H0不可信而否定它. 否则就不 能否定H0 (只好接受它).
n
体N (, 2 )的样本. 且设是已知常数.
12
现在要检验的假设是:
H0 : 0 (0 355),
它的对立假设是:
H1 : 0,
在实际工作中, 往往把不轻易 否定的命题作 为原假设.
称H0为原假设(或零假设); 称H1为备选假设(或对立假设). 那么,如何判断原假设H0 是否成立呢?
13
H0 : 新技术未提高效益,H1 : 新技术提高效益.
30
•假设检验 —基本概念
原 把需要检验的
假 假设称为原假
关于总体
假 设
分布的某 个命题
设 设,记为H0.
备 在拒绝原假设后,可供 择 选择的一个命题称为
假 备择假设,它是原假设
设 的对立假设,记为H1.
31
•假设检验 —基本概念
检验统计量 用于判断原假设成立与否的统计量
P{第二类错误}= P{接受H0|H0不真}= .
26
•假设检验的两类错误
显著性水平 为犯第一类错误的概率.
概率与统计中的分布和假设检验
概率与统计中的分布和假设检验概率与统计是现代科学中不可或缺的工具。
通过概率与统计的方法,我们可以对数据进行分析、推断和决策。
其中,分布和假设检验是概率与统计中最重要的概念之一。
本文将探讨分布和假设检验的基本原理和应用。
一、分布在概率与统计中,分布是指随机变量可能取值的集合及其对应的概率。
随机变量可以是离散型的,也可以是连续型的。
离散型随机变量的取值是有限的或可数的,例如掷骰子的点数;而连续型随机变量的取值是无限的,例如身高、体重等。
1. 离散型分布离散型分布是指随机变量取值为离散值的分布。
常见的离散型分布有伯努利分布、二项分布、泊松分布等。
- 伯努利分布是最简单的离散型分布,它的随机变量只有两个可能的取值,通常用0和1表示。
例如,抛一枚硬币的结果可以用伯努利分布来描述,其中0表示正面,1表示反面。
伯努利分布的概率质量函数为P(X=k) = p^k(1-p)^(1-k),其中p表示事件发生的概率。
- 二项分布是多次独立重复进行伯努利试验的结果。
例如,抛n次硬币,正面朝上的次数可以用二项分布来描述。
二项分布的概率质量函数为P(X=k) = C(n, k) * p^k * (1-p)^(n-k),其中C(n, k)表示从n个元素中选取k个元素的组合数。
- 泊松分布用于描述单位时间或单位面积内随机事件发生的次数。
例如,单位时间内接到的电话数量可以用泊松分布来描述。
泊松分布的概率质量函数为P(X=k) = (lambda^k * e^(-lambda)) / k!,其中lambda表示单位时间(单位面积)内事件发生的平均次数。
2. 连续型分布连续型分布是指随机变量取值为连续值的分布。
常见的连续型分布有均匀分布、正态分布、指数分布等。
- 均匀分布是指随机变量取值在一定区间内均匀分布的情况。
例如,从0到1之间随机抽取一个数,其取值可以用均匀分布来描述。
均匀分布的概率密度函数为f(x) = 1 / (b-a),其中a和b分别表示区间的上下界。
假设检验
假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。
具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。
常用的假设检验方法有u—检验法、t—检验法、X2检验法、F—检验法,秩和检验等。
目录简介假设检验亦称“显著性检验(Test of statistical significance)”,是假设检验用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
生物现象的个体差异是客观存在,以致抽样误差不可避免,所以我们不能仅凭个别样本的值来下结论。
当遇到两个或几个样本均数(或率)、样本均数(率)与已知总体均数(率)有大有小时,应当考虑到造成这种差别的原因有两种可能:一是这两个或几个样本均数(或率)来自同一总体,其差别仅仅由于抽样误差即偶然性所造成;二是这两个或几个样本均数(或率)来自不同的总体,即其差别不仅由抽样误差造成,而主要是由实验因素不同所引起的。
假设检验的目的就在于排除抽样误差的影响,区分差别在统计上是否成立,并了解事件发生的概率。
在质量管理工作中经常遇到两者进行比较的情况,如采购原材料的验证,我们抽样所得到的数据在目标值两边波动,有时波动很大,这时你如何进行判定这些原料是否达到了我们规定的要求呢?再例如,你先后做了两批实验,得到两组数据,你想知道在这两试实验中合格率有无显著变化,那怎么做呢?这时你可以使用假设检验这种统计方法,来比较你的数据,它可以告诉你两者是否相等,同时也可以告诉你,在你做出这样的结论时,你所承担的风险。
假设检验的思想是,先假设两者相等,即:µ=µ0,然后用统计的方法来计算验证你的假设是否正确。
8-2正态分布均值的假设检验
)
的情况
利用t检验法检验具有相同方差的两正态总 体均值差的假设.
设 X1, X2 ,, Xn 为来自正态总体N (1, 2 ) 的样本, Y1,Y2 ,,Yn 为来自正态总体N (2 , 2 )的
样本, 且设两样本独立. 注意两总体的方差相等.
又设 X ,Y 分别是总体的样本均值, S12 , S22是样本
因为 2 未知, 不能利用 X 0 来确定拒绝域. / n
因为 S 2 是 2 的无偏估计, 故用 S 来取代 , 即采用t X 0 来作为检验统计量.
S/ n
当观察值
t
x 0
s/ n
过分大时就拒绝H0,
拒绝域的形式为 t x 0 k . s/ n
根据第六章§2定理三知,
定理三
当H0为真时,
79.1, 81.0, 77.3, 79.1, 80.0, 78.1, 79.1, 77.3, 80.2, 82.1; 设这两个样本相互独立, 且分别来自正态总
体 N (1, 2 )和 N (2, 2 ), 1, 2, 2均为未知, 问建议的新操作方法能否提高得率? (取 0.05)
解 需要检验假设 H0 : 1 2 0, H1 : 1 2 0.
即甲、乙两台机床加工的产品直径无显著差异.
三、基于成对数据的检验( t 检验 )
从直观上看, 合理的检验法则是:
若观察值 x 与 0 的差 x 0 过分大, 即 x 0 k ,
则我们拒绝 H0 接受 H1 .
拒绝域的形式 x 0 k , ( k 待定). 由标准正态分布的分布函数 (•) 的单调性可知,
P{拒绝 H0 | H0 为真 } P0 ( x 0 k)
P 0
要检验假设 H0 : 10.5, H1 : 10.5,
正态分布的假设检验方法
正态分布的假设检验方法正态分布是一个重要的统计概念,经常用于解决各种实际问题。
不同于其它常见分布,正态分布具有非常特殊的性质,其中最突出的就是其反映了许多现实生活中的随机变量(例如人的身高、体重等)的分布类似于正态分布的情况。
随着科技与数据收集技术的不断进步,人们能够收集到越来越多的实际数据,并采用各种统计方法来分析这些数据。
在实际应用中,对于一些特定的问题,我们需要检验数据是否符合正态分布,并进而研究相关假设问题。
这需要运用到假设检验的方法,因此本文将对正态分布的假设检验方法进行详细阐述,包括其基础理论、假设设定方法、检验统计量的计算以及显著性检验的实现等。
一、基础理论正态分布是统计学中一个重要的概念,它是一个连续型概率分布,通常由两个参数μ和σ描述,其中μ是正态分布的均值,σ是正态分布的标准差。
对于一个正态分布的随机变量x ~N(μ,σ²),它的概率密度函数可以表示为:$$ f(x)=\frac{1}{\sigma\sqrt{2\pi}}\mathrme^{−(x−\mu)^2/2\sigma^2} $$在实际研究中,许多随机变量的分布都具有类似于正态分布的特性,在大样本情况下,它们的概率密度图常常能够像钟形曲线一样展示出来,因此我们可以通过正态分布模型,来描述某些随机变量的概率分布情况。
随着数据科学的不断进步,我们现在可以通过各种手段来收集数据,并利用统计工具对这些数据进行分析。
假设检验是其中一个最基础的分析方法,它通常用于判断某一假设是否成立。
正态分布的假设检验方法,就是一种基于正态分布模型的检验方法。
二、假设设定方法在进行正态分布的假设检验时,我们通常要设定两个假设,分别为原假设和备择假设。
原假设($H_0$)是我们想要检验的假设,而备择假设($H_1$)则是对原假设的拒绝。
在正态分布的假设检验中,常见的假设包括以下两种:1. 单样本均值检验对于单样本均值检验,我们设定以下的原假设和备择假设:$$ H_0:\mu=\mu_0 \ \ \ \ \ H_1:\mu\neq\mu_0 $$其中,$H_0$表示总体均值等于特定值$\mu_0$,$H_1$表示总体均值不等于$\mu_0$。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
∑ n=100
( fi nPi )2
fi - nPi
nPi
-1.55 0.3668
-2.56 0.6206
4.28 1.0338
4.69 0.9859
-2.89 0.4199
-4.29 1.3848
2.32 0.5560 5.3678
K 7,r 2,α 0.10,
χ
2 α
(
k
r
1)
χ
2 0.10
3 [109.5,119.5) 22 0.1772 17.72
4 [119.5,129.5) 27 0.2231 22.31
5 [129.5,139.5) 17 0.1989 19.89
6 [139.5,149.5) 9 0.1329 13.29
7 [149.5,159.5) 5 0.0661 6.61 8 [159.5, +∞) 7 0.0307 3.07
解:原假设
H0
: Pi
P{ X
xi }
1 6
(i 1,2, ,6)
检验统计量: χ 2 6 ( fi nPi )2
i 1
nPi
拒绝域:
W
{χ2
χ
2 α
(k
r
1)}
K 6,r 0, α 0.05,
χ
2 α
(k
r
1)
χ
2 0.05
(5)
11.071
W { χ 2 11.071}
例1.某个城市在某一时期内共发生交通事故600次,
按不同颜色小汽车分类如下
汽车颜色 红 棕 黄 白 灰 蓝 事故次数 75 125 70 80 135 115
问:交通事故是否与汽车的颜色有关?(α 0.05) 分析:
如果交通事故的发生与汽车的颜色无关,则每种 颜色的小汽车发生交通事故的可能性是一样的.
解:按题意,原假设 H 0 : X ~ π( λ)
由于λ未知,首先须用极大似然估计法,求得 λ的估计值(看七章二节例5):
λˆ
1 n
n i 1
xi
x
4.33
检验统计量: χ 2 ( fi nPi )2
i
nPi
拒绝域:
W
{χ2
χ
2 α
(k
r
1)}
列表计算:
X
fi
Pi
≤1 7 2 12 3 18 4 17 5 20 6 13 76 ≥8 7
因为 χ 2 W
所以拒绝H0,认为交通事故与汽车的颜色有关.
例2.某电话交换台,在100分钟内记录了每分钟被呼 唤的次数X,设f i为出现该 X值的频数,结果如下:
X 0123456789 f i 0 7 12 18 17 20 13 6 3 4
问总体X(电话交换台每分钟呼唤次数)服从泊松 分布吗? (α 0.05)
(4)
7.779
W { χ 2 7.779}
χ 2 5.3678 7.779 因为 χ 2 W 所以接受H0,
即21~59岁男子的血压(收缩压)总体X服从正态分布。
Φ(0.95) Φ(0.39) 0.8289 0.6517 0.1772
P{119.5 X 129.5} Φ(0.18) Φ( 0.39) Φ(0.18) Φ(0.39) 1 0.5714 0.6517 1 0.2231 P{129.5 X 139.5} Φ(0.74) Φ(0.18) 0.7703 0.5714 0.1989 P{139.5 X 149.5} Φ(1.30) Φ(0.74) 0.9032 0.7703 0.1329
3 [109.5,119.5) 22 8 [159.5,169.5) 5
4 [119.5,129.5) 27 9 [169.5,+∞) 2
5 [129.5,139.5) 17
取α=0.10,检验21~59岁男子的血压(收缩压)总 体X是否服从正态分布。
解:按题意,原假设 H 0 : X ~ N(μ,σ 2)
(3) 若在原假设 H0下,总体分布的形式已知,但有r 个参数未知,这时需要用极大似然估计法先估计这 r 个参数. 2. 将 x 轴分成K个互不重迭的小区间:
( ,b1),[b1,b2), ,[bK1, )
3.计算样本的n个观察值落入以上每个区间的个数,
记为fi ( i=1,2, ……,K),称其为实际频数. 所有实
( f i nPi )2 nPi
0.00006 0.0094 0.0018 0.2719 0.6521 0.0749 0.2857 0.0140
1.3099
K 8,r 1, α 0.05,
χ
2 α
(k
r
1)
χ
2 0.05
(6)
12.592
W { χ 2 12.592}
χ 2 1.3099 12.592 因为 χ 2 W 所以接受H0, 认为电话交换台每分钟呼唤次数X 服从泊松分布. 说明: 将n=0和n=1合并,n=8与n≥9合并是为了
P{X 99.5} Φ( 1.51) 1 Φ(1.51) 1 0.9345 0.0655 P{99.5 X 109.5} Φ( 0.95) Φ( 1.51)
Φ(1.51) Φ(0.95) 0.9345 0.8289 0.1056 P{109.5 X 119.5} Φ( 0.39) Φ( 0.95)
际频数之和 f1+ f2+ …+ fk 等于样本容量n.
4.在原假设H0为真时,计算总体落入每个区间的概
率Pi=F(bi)- F(bi-1)( i=1,2, ……,K),于是npi
就是落入第i个区间的样本值的理论频数.
f i nPi反映了实际频数与理论频数的差异.
当原假设H0为真,样本容量又充分大时,两者
i 1
nPi
其中r是分布中被估计的参数的个数.
由此得
5.检验统计量: χ 2 k ( fi nPi )2
i 1
nPi
拒绝域: W { χ 2 χ 2(α K r 1)}
注: χ 2 拟合优度检验法是在n充分大的条件下得到
的,所以在使用时必须注意 n要足够大及 npi不能太小, 根据实际经验,要求 n ≥50,理论频数npi ≥4 ,否则 要适当合并区间以满足这个要求。
由于μ,σ2未知,首先须用极大似然估计法,求得 其估计值(看教科书七章二节例2):
μˆ x 126.37,
σˆ 2 b2
1 100
100
(Xi
i 1
nPi )2
i
nPi
拒绝域:
W
{χ2
χ
2 α
(k
r
1)}
列表计算:
H0为真时, X ~ N(126.37,17.752)
保证理论频数npi ≥4.
例3.为了研究患某种疾病的21~59岁男子的血压(收
缩压,单位:mm-Hg )这一总体X,抽查了100个
男子,得 如下:
x 12,6.37 b2 17,.75样2 本值分组
序 号
分组
fi
序 号
分组
fi
1 (-∞,99.5) 5 6 [139.5,149.5) 9
2 [99.5,109.5) 8 7 [149.5,159.5) 5
的差异应不会太大,皮尔逊由此引进统计量:
χ 2 k ( f i nPi )2
i 1
nPi
并证明了如下定理:
定理(皮尔逊)若 n 充分大,H0为真时,不论 H0
中的分布属于什么类型,统计量
χ 2 k ( f i nPi )2
i 1
nPi
总是近似服从自由度为K-r-1的 χ 2分布,即
χ 2 k ( f i nPi )2 ~ χ(2 K r 1)
列表计算
汽车
颜色
fi
Pi
红
75
1/6
棕
125
1/6
黄
70
1/6
白
80
1/6
灰
135
1/6
蓝
115
1/6
∑ n=600
nP i
100
f i - nP i
-25
( f i nPi )2 nPi
6.25
100
25
6.25
100
30
9
100
-20
4
100
35
12.25
100
15
2.25
40
χ 2 40 11.071
1. 提出原假设 H0 :总体 X 的分布函数为F (x) 备择假设H1 :总体 X 的分布函不是F (x)
说明: (1)备择假设可以不必写出. (2)若X是离散型总体,原假设相当于:
H0 :总体 X 的分布律为:P{X=xi}= pi ,i=1,2, … … 若X是连续型总体,原假设相当于:
H0 :总体 X 的概率密度为f (x).
第四节 分布函数的拟合优度检验
前面几节中讨论了总体分布形式已知时关于 总体参数的假设检验。但在许多实际问题中并不 能预先知道总体分布的形式。这时,就需要根据 样本提供的信息,对总体的分布作出假设,并对 此假设进行检验。本节我们将介绍由英国统计学
家卡尔·皮尔逊提出的 χ 2 拟合优度检验法。
χ 2拟合优度检验法的基本原理和步骤:
P{149.5 X 159.5} Φ(1.87) Φ(1.30) 0.9693 0.9032 0.0661
P{X 159.5} 1 Φ(1.87) 1 0.9693 0.0307
列表计算:
X 分组
fi
Pi
nPi
1 (-∞,99.5) 5 0.0655 6.55
2 [99.5,109.5) 8 0.1056 10.56