假设检验与总体均值检验

合集下载

假设检验的概述及单总体均值的假设检验

概率论与数理统计
一、问题的提出
[例1] 某厂有一批产品，共 200 件，须经检验合格才能出厂，按国家标准，次品率不得超过 1%，今在其中任意抽取 5 件，发现这 5 件中含有次品，问这批产品是否能出厂？
[例2] 至 1984 年底，南京市开办了有奖储蓄以来，13 期对奖号码中诸数码的频数汇总如下：
t /2 (n 1)
右边检验问题 H 0 : 0 , H1 : 0
拒绝域
x 0
s/ n
t
(n 1)
左边检验问题 H 0 : 0 , H1 : 0
拒绝域
x 0
s/ n
t (n 1)
[例5] 某部门对当前市场的价格情况进行调查。以鸡蛋为例，所抽查的全省20个集市上，售价分别为（单位：元/500克） 3.05 3.31 3.34 3.82 3.30 3.16 3.84 3.10 3.90 3.18 3.88 3.22 3.28 3.34 3.62 3.28 3.30 3.22 3.54 3.30 已知往年的平均售价一直稳定在3.25元/500克左右，全省鸡蛋价格服从正态分布 N(, 2 ) ，在显著性水平 0.05下，能否认为全省当前的鸡蛋售价明显高于往年？
本方差，下面讨论未知参数的假设检验问题。
1、已知方差，检验假设
（Z检验）
一个正态总体 N , 2 ， 2 已知，未知。
检验目标是 H0 : 0 。我们可以提出如下三个假设检验问题：
H0 : 0, H1 : 0 H0 : 0, H1 : 0 H0 : 0, H1 : 0
是否成立？
表 8-2
x 8 9 10 11 12 13 14 15 16 17 18 19 20
频数 4 1 7 8 6 12 9 10 17 7 19 14 22

总体均数的假设检验

总体均数的假设检验
$number {01}
目录
• 引言 • 假设检验的基本原理 • 总体均数的假设检验方法 • 实例分析 • 总结与展望
01 引言
目的和背景
确定样本数据是否与假设的总体均数存在显著差异，从而对总体均数进行假设检验。
在科学实验、统计学、医学研究等领域广泛应用，用于评估样本数据是否支持或拒绝关于总体均数的假设。
配对样本均数假设检验实例
总结词
配对样本均数假设检验用于比较同一组研究对象在不同条件下的均数是否存在统计学显著性差异。
详细描述
例如，为了比较同一组患者在接受两种不同治疗措施前后的改善程度，研究者收集了患者的基线数据和接受不同治疗措施后的数据，并计算出各自治疗组的平均改善程度。然后，研究者使用配对样本均数假设检验来比较同一组患者在不同治疗措施下的平均改善
概念简介
假设检验是一种统计推断方法，通过检验样本数据是否符合某个假设，从而对总体参数进行推断。
它基于概率论原理，通过计算样本数据与假设的总体参数之间的差异，评估这种差异是否具有统计学上的显著性。
02
假设检验的基本原理
假设检验的步骤
建立假设
根据研究目的，提出一个关于总体参数的假设，通常包括零假设和备择假设。
收集样本数据
从总体中随机抽取一定数量的样本，并记录样本数据。
确定检验水准
选择合适的检验水准，如α和β，以平衡第一类和第二类错误的概率。
计算统计量
根据样本数据计算适当的统计量，如t值、Z值或χ^2值。
假设检验的类型
1 2
3
单样本均数检验
比较一个样本均数与已知总体均数或正常值范围。
两样本均数比较

总体均数估计与假设检验

无论做出哪一种推断结论，都面临着发生判断错误的风险。这就是假设检验的两类错误。
t 检验
t-test
三、t检验和Z检验（参数检验）
以t分布为基础的检验称为t检验。 t分布的发现使得小样本统计推断成为可能。因而，它被认为是统计学发展历史中的里程碑之一。
在医学统计学中，t检验是重要的假设检验方法之一。常用于两个均数之间差别的比较，并根据资料的分布情况及设计类型，选择不同的t检验方法。
配对样本t检验
Paired design t-test
关系：随着样本含量增加，都减小。
联系：都是表示变异度的指标，当样本量一定时，两者成正比。
标准误用途
衡量样本均数的可靠性：标准误越小，表明样本均数越可靠；
参数估计：估计总体均数的置信区间（区域）；
假设检验：用于总体均数的假设检验（比较）。
二、t分布：
标准正态分布
开创了小样本统计的新纪元，t分布主要用于总体均数的区间估计和t检验！
假设检验（Hypothesis test）
假设检验的推断原理假设检验的基本步骤 t检验和Z检验两样本总体方差齐性检验正态性检验假设检验的两类错误注意事项
一、假设检验的推断原理
上面介绍过的区间估计方法是统计推断的内容之一，假设检验是统计推断的另一重要内容。正是应用统计推断的理论和方法，人们才能顺利地通过有限的样本信息去把握总体特征，实现抽样研究的目的。
s / n 25.74 36
在H0成立的前提下，当前t值出现的概率有多大？？？
如何给出这个量的界限？
小概率事件在一次试验中基本上不会发生！
从附表2中查出在显著性水平 =0.05（双侧），自由度为35所对应的t界值=2.318，即为拒绝域与接受域的界限。如果计算

总体均值检验总结

总体均值检验总结引言总体均值检验是统计学中一种常见的假设检验方法，用于比较不同总体均值之间是否存在显著性差异。

在实际应用中，总体均值检验可以帮助我们判断样本数据是否代表了整个总体的特征，是否能够从样本中得出有关总体均值的可靠性结论。

本文将对总体均值检验进行总结，包括基本原理、常用假设检验方法、应用示例等内容。

基本原理总体均值检验的基本原理是利用样本数据对总体均值进行估计，并在此基础上进行假设检验。

假设检验的基本思想是利用概率统计的方法，通过计算样本均值与总体均值之间的差异，推断出差异是否由随机因素引起。

常用的总体均值检验方法包括单样本 t 检验、独立样本 t 检验和配对样本 t 检验。

单样本 t 检验单样本 t 检验用于比较一个样本的均值与一个已知的总体均值是否存在显著性差异。

它适用于样本数据近似满足正态分布的情况。

单样本 t 检验的原理是计算样本均值与总体均值的差异，并考察差异是否由随机因素引起。

如果差异显著，则拒绝原假设，表示样本均值与总体均值存在显著性差异。

独立样本 t 检验独立样本 t 检验用于比较两个独立样本的均值是否存在显著性差异。

它适用于两组样本数据近似满足正态分布且方差相等的情况。

独立样本 t 检验的原理是计算两组样本均值的差异，并考察差异是否由随机因素引起。

如果差异显著，则拒绝原假设，表示两组样本的均值存在显著性差异。

配对样本 t 检验配对样本t 检验用于比较同一组样本在不同条件下的均值是否存在显著性差异。

它适用于两个相关样本数据近似满足正态分布的情况。

配对样本 t 检验的原理是计算两个相关样本的均值差，并考察差异是否由随机因素引起。

如果差异显著，则拒绝原假设，表示样本均值的差异在统计上是显著的。

应用示例为了更好地理解和应用总体均值检验，下面通过一个简单的实例来展示其具体应用过程。

假设我们想要研究一种新的药物对患者血压的影响。

我们随机选择了50名患有高血压的患者，并记录了他们在服用药物前和服用药物后的血压值。

假设检验

《社会调查与统计分析》
第八章单变量分析
知识点9 假设检验
学习导航
假设检验
假设检验概述假设检验的步骤总体均值的假设检验总体百分数的假设检验
1. 假设检验概述
所谓假设检验，就是先对总体的某一参数做一假设，然后用样本的统计值去验证，以决定该假设是否为总体所接受。
根据对总体特征的初步了解而作出的假设称为虚无假设（H0），与之对立的假设称为研究假设（H1）。假设有三种情况：
设 H0：p0=0.40；H1：p0≠0.40
选择显著性水平ɑ=0.05，查表得Z（0.05/2）=1.96
Z p p0 0.38 0.40 0.02 0.41
p0 (1 p0 )
0.40 (1 0.40 )
0.049
n
100
|Z|=0.41＜Z（0.05/2）=1.96 接受虚无假设。
p 0 (1 p 0 )
0.40 (1 0.40 ) 0.049
n
100
由于|Z|=1.84＞Z0.05=1.65 拒绝虚无假设，接受研究假设。
（1）H0：μ= μ0； H1： μ ≠ μ0 （2）H0：μ=μ0； H1： μ < μ0 （3）H0：μ= μ0； H1：μ > μ0
——两端检验 ——一端检验 ——一端检验
查表：Zɑ/2或Zɑ
（1）H0：μ= μ0； H1： μ ≠ μ0 （2）H0：μ=μ0； H1： μ < μ0 （3）H0：μ= μ0； H1：μ > μ0
Байду номын сангаас
——两端检验 ——一端检验 ——一端检验
1. 假设检验概述
假设检验的小概率原理：
小概率事件在一次观察中不可能出现。

第三章总体均数的估计与假设检验

2
Sd
d
d Sd / n
2

(
d)
n
n 1
S d 0.1087 t 2.7424 0.1087/ 10 7.925
v 10 1 9
3）确定P值，作出推断结论 T0.05,9=2.262, 7.925>2.262,故P<0.05.可以认为两种方法对脂肪含量的测定结果不同。
167.41, 2.74
165.56, 6.57
168.20, 5.36 n j=10
…. 165.69, 5.09
将上述100个样本均数看成新变量值，则这个 100个样本均数构成一新分布，绘制直方图
样本均数的抽样分布具有如下特点：
1) 各样本均数未必等于总体均数
2) 各样本均数间存在差异
3) 样本均数的分布很有规律，围绕着总体均数，中间多，两边少，左右基本对称，也服从正态分布
假设检验的基本步骤：
1、建立检验假设
Ｈ0: 检验假设, 无效假设，零假设 μ=μ0
H1: 备择假设,对立假设
μ≠μ0
2、确定检验水准 α=0.05 单双侧
3、选定检验方法和计算检验统计量
4、确定P值和作出推论结论。
P值是指从H0所规定的总体进行随机抽样，获得大于（或等于及小于）现有样本获得的检验统计量值的概率。
（1012/L)
血红蛋白（g/L)
女
男女
255
360 255
4.18
134.5 117.6
0.29
7.1 10.2
4.33
140.2 124.7
*标准值：使用内科学（1976年）所载均数（转位法定单位）
1）说明女性的红细胞数与血红蛋白的变异程度何者为大？ 2）抽样误差是？ 3）试估计该地健康成年女性红细胞数的均数？ 4) 该地健康成年男女血红蛋白含量是否不同？ 5）该地男性两项血压指标是否均低于上表的标准值（若测定方法相同）？

下列关于假设检验的说法

假设检验是统计学中用于确定一个观察到的或样本统计量所包含的样本平均数与总体平均数之间的差异是否实际上存在的一种假设检验方法。

下面是关于假设检验的一些说法：
1. 假设检验是一种统计推断方法，用于确定样本统计量与总体参数之间是否存在显著差异。

2. 总体参数通常是指总体均值或比例。

在假设检验中，我们通常会提出一个原假设，例如“样本均值等于总体均值”。

3. 我们的检验是基于样本统计量与原假设之间的差异进行的。

如果这个差异超过了我们设定的显著性水平，那么我们就会拒绝原假设，并得出一个不同的结论。

4. 假设检验中的显著性水平是一个重要的概念，它是指在一个合理的假设下，观察到的差异可能是由于偶然原因产生的概率。

5. 我们通常使用α水平来考虑显著性，也就是如果在一次实验中结果与原假设存在显著差异，那么这个结果可以被认为是至少有一部分可能是由于显著性水平下的随机波动造成的。

6. 一种常用的假设检验方法是t检验和z检验。

这些方法可以应用于样本容量不同的情况，对于连续型数据和非连续型数据都有很好的适用性。

7. 假设检验是一种统计工具，但它并不是绝对可靠的。

即使我们进行了严格的假设检验，仍然有可能出现错误或误差。

这可能是因为样本的选择、数据的收集或处理等存在一些问题。

8. 在进行假设检验时，需要仔细考虑样本的选择、数据的收集和处理等细节问题，以确保结果的有效性和可靠性。

总的来说，假设检验是一种非常重要的统计工具，可以帮助我们更准确地了解数据，做出更可靠的决策。

我们应该在实践中认真对待它，同时也要注意其局限性，以更好地利用它来处理数据和分析问题。

总体均值的假设检验

总体均值的假设检验一、正态总体均值的检验设n X X X ，，， 21为总体),(２σμN 的一个容量为n 的样本． 1．方差2σ已知，μ的检验——u 检验法．当202σσ=已知时，假设检验问题：0100μμμμ≠=：；：H H ．选择检验统计量nX U /00σμ-=，当0H 成立时，)1,0(~N U ．给定显著性水平α，由标准正态分布分位点的定义, 有αα=>}|{|2/u U P ，故拒绝域}{}{}|{|2/2/2/αααu U u U u U W >-<=>= ，这种利用服从正态分布的检验统计量的检验方法称为u 检验法．有时我们只关心总体的均值是否增大（或减小）．比如，经过工艺改革后，产品的质量（如材料的强度）比以前是否提高，此时我们要研究的是新工艺下总体的均值μ是小于等于原来的均值0μ，还是大于0μ，即检验假设 0100μμμμ>≤：；：H H ．可以证明，在显著性水平α下，上述假设检验问题和检验假设0100μμμμ>=：；：H H 有相同的拒绝域，因此，遇到形如00μμ≤：H 的检验问题，可归结为后一个假设检验问题讨论．类似地，形如0100μμμμ<≥：；：H H 的检验问题，可归结为检验假设 0100μμμμ<=：；：H H ．这都是单边检验问题．给定显著性水平α，求得的临界值点是上α分位点或上α-1分位点．例1 某厂生产的某种钢索的断裂强度X 服从),(２σμN ，其中40=σ(kg/cm 2)，现从这批钢索中抽取容量为9的样本，测得断裂强度的平均值x 较以往正常生产的μ大20(kg/cm 2)，设总体方差不变，问在1.00=α下，能否认为这批钢索质量有显著提高？解依题意，检验假设0100μμμμ>≤：；：H H ，由于40=σ已知，选择检验统计量nX U /0σμ-=因为0H 中的μ全部都比1H 中的μ要小，从直观上看，当0H 成立时，X 的取值x 不应比μ大很多，若偏差0μ-x 过大，则拒绝0H 而接受1H ．因为 0100μμμμ>=：；：H H 的拒绝域为}{αu U W >=，故在显著性水平1.00=α下原假设的拒绝域为}{}{0nu X u U W σμαα+>=>=．本题中，9=n ，40=σ，200=-μx ，33.201.0=u ，计算U 的值33.25.1/0<=-=nx u σμ因此在显著性水平1.00=α下不能拒绝0H ，即认为这批钢索质量没有显著提高．2．方差2σ未知，μ的检验——t 检验法．检验假设0100μμμμ≠=：；：H H ．因为2σ未知，而样本方差2S 是总体方差2σ的无偏估计量，用S 代替σ．选择检验统计量 nS X T /0μ-=，当0H 成立时，)1(~-n t T ．给定显著性水平α，由t 分布分位点的定义，有αα=->)}1(|{|2/n t T P ，故拒绝域)}1({)}1({)}1(|{|2/2/2/->--<=->=n t T n t T n t T W ααα ，这种利用服从t 分布的检验统计量的检验方法称为t 检验法．例2 某切割机工作正常时，切割每段金属棒的平均长度为10.5cm ．今在某段时间内随机地抽取15段进行测量，其结果如下(cm)：10.4 10.6 10.1 10.4 10.5 10.3 10.3 10.2 10.9 10.6 10.8 10.5 10.7 10.2 10.7问此段时间内该机工作是否正常(5.00=α)？假设金属棒长度服从正态分布．解依题意，检验假设0100.510μμμμ≠==：；：H H ，由于2σ未知，故选择检验统计量nS X T /0μ-=．在0H 下，)1(~-n t T ，15=n ．给定显著性水平5.00=α，查t 分布表，得临界值1448.2)14()1(025.02/==-t n t α，故拒绝域)}1(|{|2/->=n t T W α．由已知条件可得48.102.15715111=⨯==∑=n i i x n x056.0784.0141)(11122=⨯=--=∑=n i ix x n s 故2366.0=s ．计算统计量的值3274.015/2366.05.1048.10/0-=-=-=ns x t μ因为)1(||2/-<n t t α，所以接受0H ，认为切割机工作正常．例3 设木材的小头直径),(~２σμN X ，12≥μcm 为合格，今抽出12根测得小头直径的样本均值为2.11=x cm ，样本方差为44.12=s cm 2，问该批木材是否合格(5.00=α)？解依题意，检验假设010012μμμμ<=≥：；：H H ，选择检验统计量nS X T /0μ-=．在假设0100μμμμ<=：；：H H 下，)1(~-n t T ，12=n ．给定显著性水平5.00=α，查t 分布表，得临界值7959.1)11()1(05.0==-t n t α，故拒绝域)}1({--<=n t T W α，也是假设010012μμμμ<=≥：；：H H 的拒绝域．由于2.11=x ，44.12=s ，计算统计量的值3094.212/44.1122.11/0-=-=-=ns x t μ因为)1(--<n t t α，故拒绝0H ，认为该批木材是不合格的．二、正态总体方差的检验——2χ检验法设n X X X ，，， 21为来自总体),(２σμN 的一个样本，检验假设 20212020σσσσ≠=：；：H H ．1．均值μ已知．因为)1,0(~N X i σμ-，n i ,,2,1 =，则选取检验统计量∑∑==-=⎪⎪⎭⎫ ⎝⎛-=ni ini i XX 12201202)(1μσσμχ．当0H 成立时，)(~22n χχ，给定显著性水平α，由2χ分布表分位点的定义，有αχχχχαα=><-))}(())({(22/222/12n n P ，故得拒绝域)}({)}({22/222/12n n W ααχχχχ><=- ．2．均值μ未知．因为X 是总体均值μ的无偏估计量，用X 代替μ．选择检验统计量202122)1(σσχS n XX ni i -=⎪⎪⎭⎫ ⎝⎛-=∑=．当0H 成立时，)1(~22-n χχ，给定显著性水平α，由2χ分布表分位点的定义，有αχχχχαα=->-<-))}1(())1({(22/222/12n n P故得拒绝域)}1({)}1({22/222/12->-<=-n n W ααχχχχ ．类似地，在μ已知和μ未知时，可以求出检验假设20212020σσσσ>≤：；：H H 和20212020σσσσ<≥：；：H H的拒绝域．例如，在μ未知时，检验假设2020σσ≤：H 的拒绝域为)}1({22->=n W αχχ．上述检验所用的检验统计量均服从2χ分布，称这种检验方法为2χ检验法例4 某无线电厂生产的一种高频管，其中一指标服从正态分布),(２σμN ，今从一批产品中抽取8只管子，测得指标数据：68 43 70 65 55 56 60 72(1) 总体均值60=μ时，检验228=σ(取5.00=α)； (2) 总体均值μ未知时，检验228=σ(取5.00=α)．解本题是在显著性水平5.00=α下，检验假设2021220208σσσσ≠==：；：H H ，这里8=n ．(1) 60=μ已知时临界值35.517)8()(2025.022/==χχαn ，80.12)8()(2975.022/1==-χχαn ，而检验统计量的值359.10663641)(811222=⨯=-=∑=ni i x μχ，由于)()(22/222/1n n ααχχχ<<-，故接受0H ．(2) μ未知时临界值13.016)7()1(2025.022/==-χχαn ，90.61)7()1(2975.022/1==--χχαn ，而125.614898111=⨯==∑=n i i x n x ，875.652)()1(122=-=-∑=ni i x x s n ，检验统计量的值2012.1075.86526412=⨯=χ，由于)1()1(22/222/1-<<--n n ααχχχ，故接受0H ．§8.3 两个正态总体参数的假设检验设121n X X X ，，，为总体),(~11２σμN X 的一个样本，221n Y Y Y ，，，为总体),(~22２σμN Y 的一个样本．∑==1111n i i X n X 和∑==2121n i iYn Y 分别是两个样本的样本均值，∑=--=112121)(11n i i X X n S 和∑=--=212222)(11n i i Y Y n S 是相应的两个样本方差．设这两个样本相互独立．．一、两个正态总体均值的检验考虑检验假设 211210μμμμ≠=：；：H H ． 1．方差21σ与22σ已知——u 检验法．选取 22212121)()(n n Y X U σσμμ+---=．当0H 成立时，检验统计量)1,0(~222121N n n YX U σσ+-=．给定显著性水平α，由标准正态分布表分位点的定义,有αα=>}|{|2/u U P ，故拒绝域}{}{}|{|2/2/2/αααu U u U u U W >-<=>= ．例1 设从甲乙两场所生产的钢丝总体X ，Y 中各取50束作拉力强度试验，得1208=x ，1282=y ，已知801=σ，942=σ，请问两厂钢丝的抗拉强度是否有显著差别(5.00=α)？解本题是在显著性水平5.00=α下，检验假设211210μμμμ≠=：；：H H ，这里5021==n n ．选取检验统计量222121n n YX U σσ+-=．给定显著性水平05.0=α，查标准正态分布表，得临界值96.1025.02/==u u α，故拒绝域}|{|2/αu U W >=．由于1208=x ，1282=y ，801=σ，942=σ，计算检验统计量的值2392.450/)(2221-=+-=σσy x u ．由于2/||αu u >，故拒绝0H ，认为两厂钢丝的抗拉强度有显著差别． 2．方差21σ与22σ未知，但2221σσ=——t 检验法．选取 212111)()(n n S Y X T w+---=μμ．这里2)1()1(21222211-+-+-=n n S n S n S w ．当0H 成立时，检验统计量)2(~112121-++-=n n t n n S Y X T w．给定显著性水平α，由t 分布表分位点的定义，有αα=-+>)}2(|{|212/n n t T P ，故拒绝域)}2({)}2({212/212/-+>-+-<=n n t T n n t T W αα ．例2 某烟厂生产两种香烟，独立地随机抽取样本容量相同的烟叶标本测其尼古丁含量的毫克数，分别测得：甲种香烟：25 28 23 26 29 22 乙种香烟：28 23 30 25 21 27假定尼古丁含量都服从正态分布且具有公共方差，在显著性水平5.00=α下，判断两种香烟的尼古丁含量有无显著差异？解检验假设211210μμμμ≠=：；：H H ，这里621==n n ．.525=x ，67.625=y ，7386.21=s ，3267.32=s ，0469.3=w s ．选取检验统计量2111n n S Y X T w+-=．给定显著性水平5.00=α，查t 分布表，得临界值2281.2)10()2(025.0212/==-+t n n t α，故拒绝域)}2(|{|212/-+>=n n t T W α．计算统计量的值0949.00469.33)667.255.25(1121-=⨯-=+-=n n s y x t w．由于)2(||212/-+<n n t t α，故接受0H ，认为两种香烟的尼古丁含量无显著差异．二、两个正态总体方差的检验——F 检验法考虑检验假设 2221122210σσσσ≠=：；：H H ． 1．均值1μ与2μ已知．因为)(~)(11212121211n Xn i iχμσχ∑=-=，)(~)(12212222222n Yn i iχμσχ∑=-=，选取221222211211222121/)(1/)(1//21σμσμχχ∑∑==--==n i i n i i Y n X n n n F ．当0H 成立时，检验统计量),(~)(1)(1211222121121n n F Y n X n F n i i n i i ∑∑==--=μμ．给定显著性水平α，由F 分布分位点的定义，有ααα=><-))},(()),({(212/212/1n n F F n n F F P ，故得拒绝域)},({)},({212/212/1n n F F n n F F W αα><=- ． 2．均值1μ与2μ未知．因为)1(~)1()(112212111221211--=-=∑=n S n X X n i i χσσχ，)1(~)1()(122222221222222--=-=∑=n S n Y Yn i iχσσχ，选取22222121222121//)1/()1/(σσχχS S n n F =--=．当0H 成立时，检验统计量)1,1(~212221--=n n F S S F ．给定显著性水平α，由F 分布分位点的定义，有ααα=-->--<-))}1,1(())1,1({(212/212/1n n F F n n F F P ，故得拒绝域)}1,1({)}1,1({212/212/1-->--<=-n n F F n n F F W αα ．例3某烟厂生产两种香烟，独立地随机抽取样本容量相同的烟叶标本测其尼古丁含量的毫克数，分别测得：甲种香烟：25 28 23 26 29 22 乙种香烟：28 23 30 25 21 27假定尼古丁含量都服从正态分布且具有公共方差，在显著性水平5.00=α下，判断两种香烟的尼古丁含量的方差是否相等? 解考虑检验假设2221122210σσσσ≠=：；：H H ．由于两个正态总体的均值都未知，选取检验统计量)1,1(~212221--=n n F S S F ．给定显著性水平α，查F 分布表，得两个临界值：15.7)5,5()1,1(025.0212/==--F n n F α1399.015.71)5,5(1)5,5()1,1(025.0975.0212/1====---F F n n F α，故得拒绝域}15.7{}1399.0{><=F F W ．计算统计量的值6777.03267.37386.2222221===s s F ．由于15.71399.0<<F ，故接受0H ，认为两种香烟的尼古丁含量的方差也无显著差异．§8.4 非正态总体参数的大样本检验本节讨论一般总体参数的检验．设总体X 的均值为μ，方差为2σ， n X X X ，，， 21为总体X 的一个样本．由中心极限定理可知，当样本容量n 足够大时，nX U /σμ-=近似地服从标准正态分布．因此，我们可以用正态分布去近似．如果对均值μ进行检验，方差2σ未知时，可以用样本方差2S 代替2σ；如果对方差2σ进行检验，均值μ未知时，可以用样本均值X 代替μ．下面举两个例子．例1 设某段高速公路上汽车限速为104.6km/h ，现检验85辆汽车的样本，测出的平均车速为106.7km/h ，已知总体标准差为.413=σ km/h ，但不知总体是否服从正态分布．在显著性水平50.0=α下，试检验高速公路上的汽车是否比限制速度104.6km/h 显著地快？解依题意，检验假设0100.6104μμμμ>=≤：；：H H ，由于.413=σ已知，n =85足够大，选择检验统计量nX U /0σμ-=近似地服从)10(，N ．其拒绝域}{αu U W >=，其中65.105.0==u u α．计算U 的值449.4185/4.136.1047.106=-=u ，由于αu u <，因此接受0H ，没有理由认为高速公路上的汽车比限制速度104.6km/h 显著地快．例2 为比较甲乙两种小麦植株的高度(单位：cm)，分别抽得甲、乙小麦各100穗，在相同条件下进行高度测定，算得甲乙小麦样本均值和样本方差分别为28=x ，8.3521=s ，26=y ，3.3222=s ，问这两种小麦的株高有无显著差异(50.0=α)？解依题意，检验假设 211210μμμμ≠=：；：H H ，选取 22212121)()(n n Y X U σσμμ+---=，这里两个方差用样本方差代替．当0H 成立时，检验统计量 222121n Sn S Y X U +-=近似地服从)1,0(N ．给定显著性水平05.0=α，查附表3，得临界值96.1025.02/==u u α，得拒绝域}|{|2/αu U W >=．计算U 的值4236.21003.328.352628=+-=u ，由于αu u >，因此拒绝0H ，认为这两种小麦的株高有显著差异．当总体服从(0-1)分布),1(p b 时，由于只有一个参数p ，总体均值p 和方差)1(p p -均只与p 有关，这时对参数p 进行假设检验时，检验统计量可以直接用样本和参数p 表示出来．例3 某厂有一批产品须经检验后方可出厂．按规定二级品率不得超过10%，从中随机抽取100件产品进行检查，发现有二级品14件，问这批产品是否可以出厂(50.0=α)？解这里n =100，14.0=x ．检验假设01001.0p p H p p H >=≤：；：，选取检验统计量 np p p X U )1(000--=，U 近似地服从)1,0(N ．由显著性水平50.0=α，可以得到拒绝域}{αu U W >=，其中65.105.0==u u α，计算U 的值333.31100.90.10.104.10=⨯-=u ，由于αu u <，因此接受0H ，认为这批产品二级品率没有超过10%，可以出厂．§8.5 分布的拟合检验前几节的检验都是参数的检验．实际问题中，有时需要对分布作出假设，进行检验．本节只介绍一种分布的检验方法——皮尔逊2χ检验法，它只适合于大样本的情形，一般要求样本容量50≥n ．设总体X 的分布函数为)(x F ，)(0x F 为一个已知的分布函数，n X X X ，，， 21为总体X 的一个样本，我们来检验关于总体分布的假设)()()()(0100x F x F H x F x F H ≠=：；：．一、基本原理2χ检验法的基本思想是：将随机试验的所有可能结果的全体分成k 个两两互不相容的事件k A A A ，，， 21，在n 次试验中，将i A 发生的次数i f 叫做i A 发生的频数，如果0H 为真，则由大数定律，在n 次试验中(n 足够大)，i A (k i ，，， 21=)出现的实际频率nf i与理论频率)(i i A P p =(可由分布函数)(0x F 算出)不应相差很大．基于这种想法，皮尔逊构造了统计量∑=-=ki i i i np np f 122)(χ或∑=-=ki i i i p n p n f 122ˆ)ˆ(χ，其中i p ˆ是由)(ˆ0x F 计算出来的理论频率，)(ˆ0x F 是)(0x F 中未知参数估计出后的分布函数，并证明了如下定理：定理1 若n 足够大，当0H 成立时，统计量2χ总是近似地服从自由度为1--r k 的2χ分布，其中r 是已知的分布函数)(0x F 中未知参数的个数．直观上看，2χ值表示实际观测结果与理论期望结果的相对差异的总和，当它的取值大于临界值时，应拒绝0H ．二、检验步骤如果)(0x F 为不带有未知参数的已知分布，皮尔逊2χ检验法的具体步骤如下：（1）将总体X 的值域划分成k 个不交的区间i A (k i ，，， 21=)，使得每个区间包含的理论频数满足5≥i np ，否则将区间适当调整；（2）在0H 成立时，计算各理论频率即概率i p 的值：)()()(100--==i i i i y F y F A P p ，k i ，，， 21=．这里1-i y 与i y 为区间i A 的端点，即](1i i i y y A ，-=；（3）数出i A 中含有样本值的个数，即i A 的频数i f ，并计算统计量∑=-=ki ii i np np f 122)(χ 的值2χ；（4）由2χ分布，对于给定的显著性水平α，找出临界值)1(2-k αχ；（5）判断：若)1(22->k αχχ，则拒绝0H ，否则可接受0H ．如果总体X 是离散型的，则假设0H 相当于假设总体X 的概率分布00}{i i p x X P H ==：，，，21=i ．如果总体X 是连续型的，则假设0H 相当于)()(00x f x f H =：，这里)(x f 为总体的概率密度．例1 至1984年底，南京市开办有奖储蓄以来，13期兑奖号码中诸数码的频数汇总如表8.1：表8.1试检验器械或操作方法是否有问题(50.0=α)．解设抽取的数码为X ，它可能的取值为0~9，如果检验器械或操作方法没有问题，则0~9出现是等可能的，即检验假设 1010=i p H ：，9210，，，， =i ，这里}{i X P p i ==．依题意知k =10，令}{i A i =，9210，，，， =i ，n =350，则理论频数35=i np ．57.61935688)(922==-=∑=i i i i np np f χ给定显著性水平5.00=α，查2χ分布表，得临界值9.16)9()1(205.02==-χχαk ．由于19.675>16.9，故拒绝0H ，即认为器械或操作方法有问题．如果)(0x F 为带有未知参数的已知分布，未知参数为r θθθ，，， 21，这时用这r 个未知参数的极大似然估计量r θθθˆˆˆ21，，，来代替)(0x F 中的参数r θθθ，，， 21，得到分布函数)(ˆ0x F ，然后建立统计量∑=-=ki i i i p n p n f 122ˆ)ˆ(χ，这里i p ˆ是由)(ˆ0x F 计算出来的理论频率，再用以上检验步骤进行检验，但此时检验统计量2χ近似服从)1(2--r k χ分布(这里k >r +1)．例2 某高校对100名新生的身高(厘米)做了检查，把测得的100个数据按由大到小的顺序排列，相同的数合并得表8.2：表8.2试问，在显著性水平5.00=α下是否可以认为学生身高X 服从正态分布？解这里n =100，我们来检验假设222)(021)(σμσπ--=x ex f H ：，+∞<<∞-x ，这里)(x f 为正态分布),(2σμN 的概率密度，设其分布函数为)(x F ，μ与0>σ为未知参数．先求μ与2σ的极大似然估计值μˆ，2ˆσ： 33.1661ˆ1==∑=n i i x n μ， 06.28)ˆ(1ˆ212=-=∑=μσn i i x n ．设服从正态分布)ˆ,ˆ(2σμN 的随机变量为Y ，分布函数为)(ˆy F ．按照分组要求，每个小区间的理论频数i pn ˆ不应小于5，因此我们将数据分成了7个组，使得每组的实际频数不小于5，各计算结果如下表8.3所示．表8.3中第3列i pˆ的计算如下： )(ˆ)(ˆ}{ˆ11---=≤<=i i i i i y F y F y Y y P p ，7210，，，， =i ，例如，}06.2833.1665.164ˆˆ06.2833.1665.161{}5.1645.161{ˆ3-≤-<-=≤<=σμY P Y P p1837.0)911.0()345.0(=-Φ--Φ=．给定显著性水平5.00=α，查2χ分布表，得临界值488.9)4()127()1(205.0205.02==--=--χχχαr k ．由于1.8843<9.488，故接受0H ，即认为学生身高服从正态分布．。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

我认为这种新药的疗效比原有的药物更有效!
总体参数包括总体均值、比例、方差等
分析之前必需陈述
第六章假设检验第一节假设检验的基本问题
什么是假设检验?
(hypothesis test)
1. 先对总体的参数(或分布形式)提出某种假设，然后利用样本信息判断假设是否成立的过程
2. 有参数检验和非参数检验 3. 逻辑上运用反证法，统计上依据小概率
解：研究者想收集证据予以支持的假设是
“该城市中家庭拥有汽车的比例超过30%” 。建立的原假设和备择假设为
H0 ： 30% H1 ： 30%
第六章假设检验第一节假设检验的基本问题
提出假设
(结论与建议)
1. 原假设和备择假设是一个完备事件组，而且相互对立
在一项假设检验中，原假设和备择假设必有一个成立，而且只有一个成立
原假设
(null hypothesis)
1. 研究者想收集证据予以反对的假设
2. 又称“0假设”
3. 总是有符号 , 或
4. 表示为 H0
H0 ： = 某一数值
指定为符号 =，或
例如, H0 ： 10cm
为什么叫 0假设?
第六章假设检验第一节假设检验的基本问题
备择假设
2. 先确定备择假设，再确定原假设 3. 等号“=”总是放在原假设上 4. 因研究目的不同，对同一问题可能提出不同
的假设(也可能得出不同的结论)
第六章假设检验第一节假设检验的基本问题
双侧检验单侧检验
第六章假设检验第一节假设检验的基本问题
双侧检验与单侧检验
1. 备择假设没有特定的方向性，并含有符号 “”的假设检验，称为双侧检验或双尾检验(two-tailed test)
2. 备择假设具有特定的方向性，并含有符号 “>”或“<”的假设检验，称为单侧检验或单尾检验(one-tailed test)
备择假设的方向为 “<” 备择假设的方向为 “>”
称为左侧检验
称为右侧检验
第六章假设检验第一节假设检验的基本问题
双侧检验与单侧检验
(假设的形式)
H0:0 H0: 0 H0 : 0 H1 : 0 H1:0 H1:0
原理
第六章假设检验第一节假设检验的基本问题
假设检验的基本思想
这个值不像我们应该得到的样本均值 ...
抽样分布
... 因此我们拒
绝假设 = 50
... 如果这是总体的真实均值
20
第六章假设检验
= 50
样本均值
H0
第一节假设检验的基本问题
原假设备择假设
第六章假设检验第一节假设检验的基本问题
假设检验中的两类错误
(决策结果)
H0: 无罪
假设检验就好像一场审判过程
统计检验过程
第六章假设检验第一节假设检验的基本问题
错误和错误的关系
和的关系就像翘翘板，小就大，大就小
你不能同时减少两类错误!
第六章假设检验第一节假设检验的基本问题
显著性水平
(significant level)
解：研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为
H0 ： 10cm H1 ： 10cm
第六章假设检验第一节假设检验的基本问题
提出假设
(例题分析)
【例】某品牌洗涤剂在它的产品说明书中声称：平均净含量不少于500克。从消费者的利益出发，
有关研究人员要通过抽检其中的一批产品来验
第 6 章假设检验
6.1 假设检验的基本问题 6.2 大样本情形下的总体均值检验 6.3 小样本情形下的总体均值检验 6.3 总体比例的检验
6.1 假设检验的基本问题
原假设与备择假设备拒绝域和检验统计量两类错误和显著性水平单侧检验与双侧检验
什么是假设?
(hypothesis)
对总体参数的具体数值所作的陈述
(alternative hypothesis)
1. 研究者想收集证据予以支持的假设 2. 也称“研究假设” 3. 总是有符号 , 或
4. 表示为 H1
1. H1 ： <某一数值，或某一数值 2. 例如, H1 ： < 10cm，或 10cm
第六章假设检验第一节假设检验的基本问题
提出假设
2. 在一次试验中小概率事件一旦发生，我们就有理由拒绝原假设
3. 小概率由研究者事先确定
什么是小概率？
第六章假设检验第一节假设检验的基本问题
统计量拒绝域
第六章假设检验第一节假设检验的基本问题
第六章假设检验第一节假设检验的基本问题
两类错误显著性水平
第六章假设检验第一节假设检验的基本问题
假设检验中的两类错误
1.第Ⅰ类错误(弃真错误)
Байду номын сангаас
原假设为真时拒绝原假设
第Ⅰ类错误的概率记为
被称为显著性水平
2.第Ⅱ类错误(取伪错误)
原假设为假时未拒绝原假设
第Ⅱ类错误的概率记为B
第六章假设检验第一节假设检验的基本问题
1.是一个概率值 2.原假设为真时，拒绝原假设的概率
被称为抽样分布的拒绝域
3.表示为 (alpha) 常用的值有 0.01 0.05 0.10
4.由研究者事先确定
第六章假设检验第一节假设检验的基本问题
假设检验中的小概率原理
什么是小概率？
1. 在一次试验中，一个几乎不可能发生的事件发生的概率
(例题分析)
【例】一种零件的生产标准是直径应为10cm，为对生产过程进行控制，质量监测人员定期对一台加工机床检查，确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于 10cm ，则表明生产过程不正常，必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设
证该产品制造商的说明是否属实。试陈述用于
检验的原假设与备择假设
解：研究者抽检的意图是倾向于证
实这种洗涤剂的平均净含量并不符
绿叶洗涤剂
合说明书中的陈述。建立的原假设
和备择假设为
H0 ： 500
第六章假设检验
H1 ： < 500
500g
第一节假设检验的基本问题
提出假设
(例题分析)
【例】一家研究机构估计，某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确，该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设