假设检验-例题讲解剖析

假设检验

一、单样本总体均值的假设检验 .................................................... 1 二、独立样本两总体均值差的检验 ................................................ 2 三、两匹配样本均值差的检验 ........................................................ 4 四、单一总体比率的检验 ................................................................ 5 五、两总体比率差的假设检验 .. (7)

一、单样本总体均值的假设检验

例题:

某公司生产化妆品,需要严格控制装瓶重量。标准规格为每瓶250 克,标准差为1 克,企业的质检部门每日对此进行抽样检验。某日从生产线上随机抽取16 瓶测重,以95%的保证程度进行总体均值的假设检验。

x t μ-=

data6_01 样本化妆品重量 SPSS 操作:

(1)打开数据文件,依次选择Analyze (分析)→Compare Means (比较均值)→One Sample T Test (单样本t 检验),将要检验的变量置入Test Variable(s)(检验变量);

(2)在Test Value (检验值)框中输入250;点击Options (选项)按钮,在

Confidence Interval(置信区间百分比)后面的框中,输入置信度(系统默认为95%,对应的显著性水平设定为5%,即0.05,若需要改变显著性水平如改为0.01,则在框中输入99 即可);

(3)点击Continue(继续)→OK(确定),即可得到如图所示的输出结果。

图中的第2~5 列分别为:计算的检验统计量t 、自由度、双尾检验p-值和样本均值与待检验总体均值的差值。使用SPSS 软件做假设检验的判断规则是:p-值小于设定的显著性水平Ɑ时,要拒绝原假设(与教材不同,教材的判断标准是p<Ɑ/2)。从图中可以看到,p-值为0.01,小于0.05,故检验结论是拒绝原假设、接受备择假设,认为当天生产的全部产品平均装瓶重量与250 克有显著差异(拒绝原假设),不符合规定的标准。

图中表格的最后两列,是样本均值与待检验总体均值差值(xi-250)1-Ɑ置信区间的下限与上限,待检验的总体均值Test Value 加上这两个值,就构成了总体均值的1-Ɑ置信区间。通过这个置信区间也可以做假设检验:若这个区间不包含待检验的总体均值,就要在Ɑ水平上拒绝原假设。本例中样本均值与待检验总体均值差值95%置信区间的下限与上限均为负值,因此所构造的总体均值的95%置信区间不可能包含待检验的总体均值250,因此要在0.05 的水平上拒绝原假设、接受备择假设,与依据p-值得出的检验结论一致。

注意:除非给出明确结果,SPSS没有单侧检验,SPSS中的p值均为双侧检验的概率p值,如果要进行要单侧检验,将软件给出的p值与2倍的显著性水平进行比较即可,如要求Ɑ=0.05,单侧比较时,p值与2Ɑ=0.1进行比较.

二、独立样本两总体均值差的检验

例题:

某品牌时装公司在城市中心商业街的专卖店中只销售新款产品且价格不打折,打折的旧款产品则统一在城郊购物中心的折扣店销售。公司销售部门为制订更合理的销售价格及折扣方法,对购买该品牌时装的顾客做了抽样调查。分别从光顾城中心专卖店的顾客中随机抽取了36 人,从光顾折扣店的顾客中随机抽取了25 人。调查发现,光顾专卖店的顾客样本平均月收入水平为1.35 万元,而光顾折扣店的顾客样本平均月收入水平为1.24 万元。现在需要判断:光顾这两种店的顾客的总体收入水平是否也存在明显的差异?

(“data6_03样本顾客月收入水平”)

()()

x x t ---=

SPSS 操作:

(1)打开数据文件,依次选择Analyze (分析)→Compare Means (比较均值)→IndependentSample T Test (独立样本t 检验),将要检验的变量置入Test Variable(s)(检验变量),将分组变量置入Grouping Variable (分组变量),并点击Define Groups (定义组)输入两个组对应的变量值;

(2)点击Options (选项)按钮,在Confidence Interval (置信区间百分比)后面的框中,输入置信度(系统默认为95%,对应的显著性水平为5%即0.05,若需要改变显著性水平如改为0.01,则在框中输入99 即可);

(3)点击Continue (继续)→OK (确定)。得到如图所示的输出结果。

三、两匹配样本均值差的检验

例题:

中学生慢跑试验的例子。表6-3 是30 名学生慢跑锻炼前后脉搏恢复时间及差值数据,试以0.05 的显著性水平检验:学生慢跑锻炼前后脉搏恢复时间是否具有显著差异。

/d d d t s μ-=

data6_04 学生慢跑锻炼前后脉搏恢复时间及差值

SPSS 操作:

(1)打开数据文件,依次选择Analyze (分析)→Compare Means (比较均值)→Paired-Sample T Test (匹配样本t 检验),将要检验的两个变量分别置入

Paired Variables(成对变量)下面的Variable1(变量1)和Variable2(变量2);

(2)点击Options(选项)按钮,在Confidence Interval(置信区间百分比)后面的框中输入置信度(系统默认为95%,对应的显著性水平为5%,即0.05,若需要改变显著性水平如改为0.01,则在框中输入99 即可);

(3)点击Continue(继续)→OK(确定),即得到如图所示的输出内容。

拒绝原假设、接受备择假设

方法二:

对d进行单样本t检验,原假设:检验值为0

四、单一总体比率的检验

例题:

甲企业产品中使用的微型电动机采购自专门制造这种电动机的乙企业。合同规定,若一批电动机的次品率不高于5%,甲企业应当接收;若次品率高于5%,则产品要退回,乙企业同时还要承担相应的运输、检验费用和损失。现有一批电动机到货,抽取100 件进行检验,发现有6 件次品,样本次品率为6%。试以0.05 的显著性水平检验:该批产品的次品率是否明显地高于规定的标准。

/d d d t s μ-=

data6_06 产品合格率检验

SPSS 操作:

比率属于二项分布,使用SPSS 软件做单一总体比率的检验时,可以选择非参数检验(Nonparametric Tests )中的二项分布检验(Binomial Test )或卡方检验(Chi-Square Test )来做。下面给出利用SPSS 实现中单一总体比率的二项分布检验过程。注意:数据文件需要整理为图6-12

所示的形式(见所附数据集“data6_06 产品合格率检验”),检验结果1代表合格品、2代表次品。

五、两总体比率差的假设检验

例题:

某省一项针对女性社会地位的调查结果显示:被调查的1200 名20 至30 岁青年女性中,拥有大专及以上学历者为390 人,占32.5%;被调查的1000 名20 至30 岁青年男性中,拥有大专及以上学历者为306 人,占30.6%。试以0.05 的显著性水平检验:该省30 岁以下青年女性中,拥有大专及以上学历的比率是否显著地高于青年男性的这一比率。

p p Z -=

data6_07 样本的性别及学历情况

SPSS 操作:

检验统计a

学历 Mann-Whitney U 264.000 Wilcoxon W 564.000 Z

-.766 渐近显著性 (双尾) .443

a. 分组变量:性别

不能拒绝原假设

假设检验新知识点

假设检验新知识点(总6页) --本页仅作为文档封面,使用时请直接删除即可-- --内页可以根据需求调整合适字体及大小--

假设检验 一、假设检验的概念 统计推断包括两大方面的内容,其一为参数估计(如总体均数的估计),另一方面,即假设检验(hypothesis test)。假设检验过去亦称显著性检验(significance test)。其基本原理和步骤用以下实例说明。 例为研究某山区成年男子的脉搏均数是否高于一般成年男子的脉搏均数。某医生在一山区随机抽查了 25名健康成年男子,求得其脉搏的均数为 74.2次/分,标准差为6.0次/分。根据大量调查,已知健康成年男子脉搏均数为72次/分;能否据此认为该山区成年男子的脉搏均数高于一般成年男子的脉搏均数 本例可用下图表示。 显然,本例其目的是判断是否μ>μ0。从所给条件看,样本均数X与已知总体均数μ0不等,造成两者不等的原因有二: ①非同一总体,即μ#μ0; ②同一总体即μ=μ0,两个均数不相等的原因在于抽样误差。 假设检验的目的就是要判断造成上面两个均数不等的原因是哪一个。也就是说,是解决样本均数代表性如何的问题。上例是,样本均数比已知总体均数大,有可能是由于抽样误差引起,也有可能是由于所调查的样本人群的生活环境、生活习惯、遗传或其他原因所致,如何判断呢,这就需要利用统计学方法----假设检验方法。假设检验也是统计分析的重要组成部分。 (提问:统计分析包括参数估计和假设检验) 下面我们以例题所提出的问题学习假设检验的基本步骤,同时学习样本均数与总体均数比较的t检验。 假设检验一般都是有“名”的,比如t检验,大家要知道假设检验的命名通常是以所要计算的统计量来命名的,如t 检验、F检验、X2检验等。后面有进一步介绍。 二、假设检验的基本步骤 建立检验假设(一)建立假设 假设有两种:一种是检验假设,常称无效假设,用 H0表示。这种假设的含义是假设两个指标(样本指标与总体指标、或两个样本指标)是相等的,它们的差别是由于抽样误差引起的。另一种是备择假设,常称对立假设,常用H1表示,是与H0相对立的假设,假设两个指标不相等,它们的差别不是由于抽样误差引起的,若无效假设被否决则该假设成立。

高中数学知识点精讲精析 假设检验

3.1 假设检验 1.假设检验是统计推断的一个基本问题,在总体的分布函数完全未知或只知其形式但不知其参数的情况下,为了推断总体的某些性质,先对总体的分布类型或总体分布的参数做某种假设,然后根据样本提供的信息,对所作的假设作出是接受,还是拒绝的决策,这一过程就是假设检验。 2.定义1 对总体分布类型或未知参数值提出的假设称为待检假设或原假设,用表示。对某问题提出待检假设的同时,也就给出了相对立的备择假设,用1H 表示。 3.假设检验的基本原理:首先提出原假设,其次在成立的条件下,考虑已经观测到的样本信息出现的概率。如果这个概率很小,这就表明一个概率很小的事件在一次实验中发生了。而小概率原理认为,概率很小的事件在一次实验中几乎是不发生的,也就是说在成立的条件下导出了一个违背小概率原理的结论,这表明假设是不正确的,因此拒绝,否则接受。 4.假设检验的两类错误 假设检验中作出推断的基础是一个样本,是以部分来推断总体,因此不可避免地会犯错误。第一类错误(弃真错误):0H 为真而拒绝,;第二类错误(取伪错误):0H 不真而接受0H 。 犯第一类错误的概率记为{}00P H H 当为真拒绝,犯第二类错误的概率记为 {}00P H H 当不真接受。 我们当然希望犯两类错误的概率都很小,但是,进一步讨论可知,当样本容量固定时,若减少犯一类错误的概率,则犯另一类错误的概率往往增大。若要使犯两类错误的概率都减小,则须增加样本容量。 在给定样本容量的情况下,一般来说,我们总是控制犯第一类错误的概率,使它不大于α,即令{}00P H H α≤当为真拒绝,通常取0.1,0.05,0.01等。这种只对犯第一类错误的概率加以控制。而不考虑犯第二类错误的概率的检验,成为显著性检验。α是一个事 0H 0H 0H 0H 0H 0H 0H 0H 0H α

假设检验新知识点

假设检验 一、假设检验的概念 统计推断包括两大方面的内容,其一为参数估计(如总体均数的估计),另一方面,即假设检验(hypothesis test)。假设检验过去亦称显著性检验(significance test)。其基本原理和步骤用以下实例说明。 例为研究某山区成年男子的脉搏均数是否高于一般成年男子的脉搏均数。某医生在一山区随机抽查了25名健康成年男子,求得其脉搏的均数为74.2次/分,标准差为6.0次/分。根据大量调查,已知健康成年男子脉搏均数为72次/分;能否据此认为该山区成年男子的脉搏均数高于一般成年男子的脉搏均数? 本例可用下图表示。 显然,本例其目的是判断是否μ>μ0。从所给条件看,样本均数X与已知总体均数μ0不等,造成两者不等的原因有二: ①非同一总体,即μ#μ0; ②同一总体即μ=μ0,两个均数不相等的原因在于抽样误差。 假设检验的目的就是要判断造成上面两个均数不等的原因是哪一个。也就是说,是解决样本均数代表性如何的问题。上例是,样本均数比已知总体均数大,有可能是由于抽样误差引起,也有可能是由于所调查的样本人群的生活环境、生活习惯、遗传或其他原因所致,如何判断呢,这就需要利用统计学方法----假设检验方法。假设检验也是统计分析的重要组成部分。 (提问:统计分析包括参数估计和假设检验) 下面我们以例题所提出的问题学习假设检验的基本步骤,同时学习样本均数与总体均数比较的t检验。 假设检验一般都是有“名”的,比如t检验,大家要知道假设检验的命名通常是以所要计算的统计量来命名的,如t检验、F检验、X2检验等。后面有进一步介绍。 二、假设检验的基本步骤 建立检验假设 (一)建立假设 假设有两种:一种是检验假设,常称无效假设,用H0表示。这种假设的含义是假设两个指标(样本指标与总体指标、或两个样本指标)是相等的,它们的差别是由于抽样误差引起的。另一种是备择假设,常称对立假设,常用H1表示,是与H0相对立的假设,假设两个指标不相等,它们的差别不是由于抽样误差引起的,若无效假设被否决则该假设成立。

假设检验例题.

假设检验 总体均值的检验(σ2 已知 (例题分析 【例】一种罐装饮料采用自动生产线生产,每罐的容量是 255ml ,标准差为 5ml 。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了 40罐进行检验,测得每罐平均容量为 255.8ml 。取显著性水平α=0.05 , 检验该天生产的饮料容量是否符合标准要求? H 0:μ = 255 H 1:μ≠ 255 α = 0.05 n = 40 检验统计量 : 决策 : 不拒绝 H 0 结论 : 样本提供的证据表明:该天生产的饮料符合标准要求 总体均值的检验(σ2 未知 (例题分析 【例】一种机床加工的零件尺寸绝对平均误差允许值为 1.35mm 。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取 50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? (

=0.01 总体均值的检验(σ2 未知 (例题分析 【例】某一小麦品种的平均产量为 5200kg/hm2 。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了 36个地块进行试种, 得到的样本平均产量为 5275kg/hm2,标准差为 120/hm2 。试检验改良后的新品种产量是否有显著提高? (α=0.05 H 0 :μ≤ 5200 H 1 :μ > 5200 α = 0.05 n = 36 临界值 (c : 检验统计量 : 决策 : 拒绝H 0 (P = 0.000088 < α = 0.05 结论 : 改良后的新品种产量有显著提高

假设检验新知识点

v1.0 可编辑可修改假设检验 一、假设检验的概念 统计推断包括两大方面的内容,其一为参数估计(如总体均数的估计),另一方面,即假设检验(hypothesis test)。假设检验过去亦称显著性检验(significance test)。其基本原理和步骤用以下实例说明。 例为研究某山区成年男子的脉搏均数是否高于一般成年男子的脉搏均数。某医生在一山区随机抽查了 25名健康成年男子,求得其脉搏的均数为 74.2次/分,标准差为6.0次/分。根据大量调查,已知健康成年男子脉搏均数为72次/分;能否据此认为该山区成年男子的脉搏均数高于一般成年男子的脉搏均数 本例可用下图表示。 显然,本例其目的是判断是否μ>μ0。从所给条件看,样本均数X与已知总体均数μ0不等,造成两者不等的原因有二: ①非同一总体,即μ#μ0; ②同一总体即μ=μ0,两个均数不相等的原因在于抽样误差。 假设检验的目的就是要判断造成上面两个均数不等的原因是哪一个。也就是说,是解决样本均数代表性如何的问题。上例是,样本均数比已知总体均数大,有可能是由于抽样误差引起,也有可能是由于所调查的样本人群的生活环境、生活习惯、遗传或其他原因所致,如何判断呢,这就需要利用统计学方法----假设检验方法。假设检验也是统计分析的重要组成部分。 (提问:统计分析包括参数估计和假设检验) 下面我们以例题所提出的问题学习假设检验的基本步骤,同时学习样本均数与总体均数比较的t检验。 假设检验一般都是有“名”的,比如t检验,大家要知道假设检验的命名通常是以所要计算的统计量来命名的,如t检验、F检验、X2检验等。后面有进一步介绍。 二、假设检验的基本步骤

假设检验例题讲解

假设检验例题讲解 引言 假设检验是统计学中一种重要的推断方法,用于根据样本 数据对总体参数进行推断。在实际应用中,我们经常需要对某个总体参数是否满足某个假设进行检验,以此来判断某种情况的发生是否是偶然的还是具有统计学意义的。 在本文中,我们将通过一个具体的例子来详细讲解假设检 验的步骤和方法。 例题描述 某公司通过市场调研,推出了一种新的产品,并声称该产 品的平均寿命超过了现有市场上的同类产品。为了验证这一声称,该公司随机选取了30台该产品进行了测试,并记录了它们的寿命(以小时为单位)。假设该产品的寿命服从正态分布,现在我们想要对该声称进行检验。 步骤1:建立假设 在进行假设检验之前,首先需要明确我们的原假设和备择 假设。

原假设(H0):该产品的平均寿命不超过现有市场上同类产品的平均寿命,即μ ≤ μ0(μ0为现有产品的平均寿命)。 备择假设(H1):该产品的平均寿命超过现有市场上同类产品的平均寿命,即μ> μ0。 在本例中,我们要采用单侧检验,因为我们关心的是新产 品平均寿命是否超过现有产品的平均寿命。 步骤2:选择显著性水平 显著性水平(α)是在进行假设检验时事先设定的一个值,它规定了我们对收集到的样本数据作出判断的临界点。常用的显著性水平有0.05和0.01两种。 在本例中,我们选择α = 0.05作为显著性水平。 步骤3:计算样本统计量 根据收集到的样本数据,我们需要计算出一个样本统计量,用来对总体参数进行估计。 在本例中,我们要计算平均寿命的样本均值和样本标准差。假设样本的平均寿命为x̄,样本标准差为s。

步骤4:计算检验统计量 在假设检验中,我们需要计算一个检验统计量来判断样本数据和原假设是否一致。 在本例中,我们要计算t检验统计量,其公式为: t统计量 其中,x̄为样本均值,μ0为原假设的参数值,s为样本标准差,n为样本容量。 步骤5:计算P值 在假设检验中,P值是一个重要的指标,用于评估样本数据在原假设为真时出现的概率。 在本例中,我们要计算P值,即检验统计量大于等于观察到的t检验统计量的概率。根据t分布的性质,我们可以查找表格或使用统计软件来计算P值。 步骤6:做出决策 在假设检验的最后一步,我们使用P值与显著性水平进行比较,从而做出判断。

假设检验例题讲解剖析

假设检验 一、单样本总体均值假设检验 (1) 二、独立样本两总体均值差检验 (2) 三、两匹配样本均值差检验 (3) 四、单一总体比率检验 (4) 五、两总体比率差假设检验 (4) 一、单样本总体均值假设检验 例题: 某公司生产化妆品,需要严格控制装瓶重量。标准规格为每瓶250 克,标准差为1 克,企业质检部门每日对此进行抽样检验。某日从生产线上随机抽取16 瓶测重,以95%保证程度进行总体均值假设检验。 data6_01 样本化妆品重量 SPSS操作: (1)打开数据文件,依次选择Analyze(分析)→Compare Means(比较均值)→One Sample T Test (单样本t 检验),将要检验变量置入Test Variable(s)(检验变量); (2)在Test Value(检验值)框中输入250;点击Options(选项)按钮,在Confidence Interval (置信区间百分比)后面框中,输入置信度(系统默认为95%,对应显著性水平设定为5%,即0.05,若需要改变显著性水平如改为0.01,则在框中输入99 即可); (3)点击Continue(继续)→OK(确定),即可得到如图所示输出结果。 图中第2~5 列分别为:计算检验统计量t 、自由度、双尾检验p-值和样本均值和待检验总体均值差值。使用SPSS 软件做假设检验判断规则是:p-值小于设定显著性水平Ɑ时,要拒绝原假设(和教材不同,教材判断标准是p<Ɑ/2)。从图中可以看到,p-值为0.01,小于0.05,故检验结论是拒绝原假设、接受备择假设,认为当天生产全部产品平均装瓶重量和250 克有显著差异(拒绝原假设),不符合规定标准。 图中表格最后两列,是样本均值和待检验总体均值差值(xi-250)1-Ɑ置信区间下限和上限,待检验总体均值Test Value 加上这两个值,就构成了总体均值1-Ɑ置信区间。通过这个置信区间也可以做假设检验:若这个区间不包含待检验总体均值,就要在Ɑ水平上拒绝原假设。本例中样本均值和待检验总体均值差值95%置信区间下限和上限均为负值,因此所构造总体均值95%置信区间不可能包含待检验总体均值

正态下单个总体的假设检验例题

正态下单个总体的假设检验例题 假设某家服装网站进行了一项调查,调查了100个用户的购物金额,求该样本的购物金额总体是否服从正态分布,这个问题可以通过 假设检验来解决。 首先,需要先对购物金额数据进行统计分析。对该100个用户的 购物金额进行计算,得到最大值为1000,最小值为10,平均值为300,标准差为100。 接下来,我们准备进行正态分布的假设检验,设定零假设H0:总体符合正态分布,备择假设Ha:总体不符合正态分布。 在进行假设检验时,我们需要设定一个显著性水平α。这个α 选取的不同,会影响我们对样本总体的判断。如果α选择小,则在检 验结果上,我们需要更高的标准来认为总体符合正态分布;但若α选 择大,则更容易将总体识别为符合正态分布。 在这里,我们选择α=0.05,即我们认为,样本总体符合正态分 布的判断标准很高,我们要保证样本数据的正态性较为准确。 下面是检验步骤: 步骤一:计算样本观测值的Z值 根据样本的平均值和标准差,利用标准正态分布表计算样本观测 值的Z值。现在,我们可以得到样本的Z值为: Z值 = (Xbar - μ) / (σ / sqrt(n)) = (300-0) / (100/sqrt(100)) = 30 步骤二:查找标准正态分布表 将步骤一中得到的Z值与标准分布表比较,可以得到对应的p值。在标准正态分布表中,Z值为30的p值极其接近1(精度有限,无法给出),可以认为样本符合正态分布。 步骤三:判断结果并作出结论 由于p值很接近1,不能拒绝原假设,即总体是服从正态分布的。

因此,我们可以得出结论,该样本的购物金额总体是服从正态分布的。 总之,假设检验是通过样本推断总体的一种常用方法。在进行假 设检验时,关键在于确定假设的零假设和备择假设,以及确定显著性 水平α的取值。在这个例题中,我们基于样本信息计算了样本的Z值,并通过查找标准正态分布表得出了符合正态分布的p值。通过判断p 值,并根据设定的显著性水平α,我们得出了结论,样本数据总体符 合正态分布。

统计学习题——假设检验

第六章 假设检验 例1从死于汽车碰撞事故的司机中抽取2000名司机的随机样本,根据他们的血液中是否含 有酒精以及他们是否对事故负有责任,将数据整理如下表所示。 在整个总体中,血液中含有酒精和不含酒精的司机之间在对事故负有责任方面有差异 吗?为了回答这一问题: 1) 叙述0H 并计算概值; 2) 计算适当的置信区间(95%)来说明差异有多大; 3) 从这一数据如何说明“酒精增加了事故的发生率”。 解:设1p 为含酒精中有责任的概率,2p 无酒精中有责任的概率。 提出假设0H :血液中含酒精和不含酒精的司机之间对事故富有的责任无差异。即 1p =2p 1H :1p ≠2p 。 依据样本数据:1p =650/(650+150)=13/16 2p =700/(700+500)=7/12 构造统计量:P=1p -2p 又因为1p ~N (1p , 111n )p 1p -(),2p ~N (2p ,222n )p 1p -() 所以1p -2p ~ N (1p -2p ,111n )p 1p -(+222n )p 1p -() 记111n )p 1p -(+2 22n )p 1p -(为2s 1p -2p 的95%的置信区间为(1p -2p -2/z a *s ,1p -2p +2/z a *s )=(0.19,0.27) 。不包括0 ,所以拒绝零假设。可见含酒精的对事故负责任的概率远大于不含酒精的。即酒精增加了事故的而发生率。 (数值计算过程不再列出) 例2、1974年,美国盖洛普公司的一次调查表明,在750名美国男子的样本中,有45%抽烟;在另一个相互独立的750名女子的样本中,36%抽烟, 1) 构造男性总体和女性总体中抽烟比例之差的95%单侧置信区间; 2) 计算没有差异这一原假设的概值; 3) 在错误水平α=0.05下,45%与36%之差在统计上是可以分辨的吗?(或是显著的吗?)即,能拒绝0H 吗?用两种方式回答,并说明两种答案是一致的: 1) 0H 是否没有落入95%的置信区间之内? 2) 对0H 的概值是否小于0.05? 解:设男性抽烟比例为1p ,女性抽烟比例为2p 。 构造统计量:P=1p -2p 又因为1p ~N (1p ,111n )p 1p -(),2p ~N (2p ,2 22n )p 1p -()

假设检验练习试题-答案解析

假设检验练习题 1. 简单回答下列问题: 1)假设检验的基本步骤? 答:第一步建立假设 (通常建立两个假设,原假设H0 不需证明的命题,一般是相等、无差别的结论,备择假设H1,与H0对立的命题,一般是不相等,有差别的结论) 有三类假设 第二步选择检验统计量给出拒绝域的形式。 根据原假设的参数检验统计量: 对于给定的显著水平样本空间可分为两部分:拒绝域W 非拒绝域A 拒绝域的形式由备择假设的形式决定 H1: W为双边 H1: W为单边 H1: W为单边 第三步:给出假设检验的显著水平 第四步给出零界值C,确定拒绝域W 有了显著水平按照统计量的分布可查表得到临界值,确定拒绝域。例如:对于=0.05有 的双边 W为 的右单边 W为 的右单边 W为 第五步根据样本观测值,计算和判断 计算统计量 Z 、 t 、当检验统计量的值落在W内时能拒绝,否则接受 (计算P值 227页 p值由统计软件直接得出时拒绝,否则接受

计算1-a的置信区间置信区间由统计软件直接得出统计量落入置信区间接受,否则接受) 2)假设检验的两类错误及其发生的概率? 答:第一类错误:当为真时拒绝,发生的概率为 第二类错误:当为假时,接受发生的概率为 3)假设检验结果判定的3种方式? 答:1.计算统计量 Z 、 t 、当检验统计量的值落在W内时能拒绝,否则接受 2.计算P值 227页 p值由统计软件直接得出时拒绝,否则接受 3.计算1-a的置信区间置信区间由统计软件直接得出,落入置信区间接受,否则接受 4)在六西格玛A阶段常用的假设检验有那几种?应用的对象是什么? 答:连续型(测量的数据):单样本t检验 -----比较目标均值 双样本t检验 -----比较两个均值 方差分析 -----比较两个以上均值 等方差检验 -----比较多个方差 离散型(区分或数的数据):卡方检验 -----比较离散数 2.设某种产品的指标服从正态分布,它的标准差σ=150,今抽取一个容量为26 的样本,计算得平均值为1 637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ = 1600。 答:典型的Z检验 1. 提出原假设和备择假设 :平均值等于1600 :平均值不等于1600 2. 检验统计量为Z,拒绝域为双边

自-关于假设检验的详细总结与典型例题

关于假设检验的详细总结与典型例题 假设检验是数一考生普遍反映非常头疼的一块内容,因为它入门较难,其思想在初次复习时理解起来较难。虽然这一部分在历年真题中考查次数很少,但为了做到万无一失,我们也应该准备充分,何况相对来说这一部分内容的难度和变化并不大。为了让各位考生对假设检验有一个全面深入的理解和掌握,我们给出如下总结与例题。 对于假设检验,首先要理解其基本原理,即小概率原理,假设检验的方法即是从此原理衍生而来;其次,要掌握其步骤,会根据显著性水平α,即第一类心理学考研错误,来求拒绝域与接收域,其求法要根据不同的条件来套用公式,能根据理解推导公式是上策,如果时间不够,可以选择记忆各种不同条件下的求拒绝域的公式。最后,相比之下两个正态总体参数的假设检验的考查可能性要低于一个正态总体参数的假设检验。 假设检验的基本概念 数理统计的基本任务是根据样本推断总体,对总体的分布律或者分布参数作某种假设,然后根据抽得的样本,运用统计分析的方法来检验这一假设是否正确,从而作出接受假设或者拒绝假设的决定,这就是假设检验. 根据实际问题提出的假设0H 称为原假设,其对立假设1H 称为备择假设. 假设检验中推理的依据是小概率原理:小概率事件在一次试验中实际上不会发生. 假设检验中的小概率α称为显著性水平,通常取0.05α=或者0.01α=. 假设检验中使用的推理方法是:为了检验原假设0H 是否成立,我医学考研论坛们先假定原假设0H 成立. 如果抽样的结果导致小概率事件在一次试验中发生了,根据小概率原理,有理由怀疑0H 的正确性,从而拒绝0H ,否则接受0H . 假设检验的步骤 ⑴根据实际问题提出原假设0H 和备择假设1H ; ⑵确定检验统计量T ; ⑶根据给定的显著水平α,查概率分布表,确定拒绝域W ; ⑷利用样本值计算统计量T 的值t ,若t W ∈,则拒绝0H ,否则接受0H . 假设检验中可能犯的两类错误 由于小概率事件还是可能发生的,根据小概率作出的判断可能是错误的. 事件0H 真而拒绝0H ,称为第一类(弃真)错误,犯第一类错误的概率为{}0P t W H α∈≤,因此显著性水平α是用来控制犯第一类错误的概率的. 0H 假而接受0H ,称为第二类(纳伪)错误,犯第二类错误的概率为{} 1P t W H ∉,记作β. 典型例题

贾俊平统计学第7版

第8章假设检验 例题 8.1 由统计资料得知,1989年某地新生儿的平均体重为3190克,现从1990年的新生儿中国机抽取100个,测得其平均体重为3210克,问1990年的新生儿与1989年相比,体重有无显 ★解:从调查结果看,1990年新生儿的平均体重为3210克,比1989年新生儿的平均体重3190 克增加了20克,但这20克的差异可能源于不同的情况。—种情况是,1990年新生儿的体重与1989年相比没有什么差别,20克的差异是由于抽样的随机性造成的;另一种情况是,抽样的随机性不可能造成20克这样大的差异,1990年新生儿的体重与1989年新生儿的体重相比确实有所增加。 上述问题的关键点是,20克的差异说明了什么?这个差异能不能用抽样的随机性来解释为了回答这个问题,我们可以采取假设的方法。假设1989年和1990年新生儿的体重没有 显著差异,如果用卩o表示1989年新生儿的平均体重,□表示1990年新生儿的平均体重, 我们的假设可以表示为卩=□或□心=0,现要利用1990年新生儿体重的样本信息检验上述假设是否成立。如果成立,说明这两年新生儿的体重没有显著差异;如果不成立,说明1990年 新生儿的体重有了明显增加。在这里,问题是以假设的形式提出的,问题的解决方案是检验 提出的假设是否成立。所以假设检验的实质是检验我们关心的参数一1990年的新生儿总体 平均体重是否等于某个我们感兴趣的数值。 例8.2 某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命平均不能低于 1 000小时, 已知灯泡燃烧寿命服从正态分布,标准差为200小时。在总体中随机抽取了100个灯泡,得 知样本均值为960小时,批发商是否应该购买这批灯泡? ★解:这是一个单侧检验问题。显然,如果灯泡的燃烧寿命超过了 1 000小时,批发商是 欢迎的,因为他用已定的价格(灯泡寿命为1 000小时的价格)购进了更高质量的产品。因此, 如果样本均值超过1000小时,他会购进这批灯泡。问题在于样本均值为960小时他是否应 当购进。因为即便总体均值为1000小时,由于抽样的随机性,样本均值略小于1000小时 的情况也会经常出现。在这种场合下,批发商更为关注可以容忍的下限,即当灯泡寿命低于 什么水平时拒绝。于是检验的形式为: 100(1 例8.3 某种大量生产的袋装食品按规定重量不得少于250克。今从一批该食品中随机抽取50袋,

假设检验spss操作例题

单样本T检验 按规定苗木平均高达1.60m以上可以出圃,今在苗圃中随机抽取10株苗木,测定的苗木高度如下: 1.75 1.58 1.71 1.64 1.55 1.72 1.62 1.83 1.63 1.65 假设苗高服从正态分布,试问苗木平均高是否达到出圃要求?(要求α=0.05) 解:1)根据题意,提出: 虚无假设H0:苗木的平均苗高为H0=1.6m; 备择假设H1:苗木的平均苗高H1>1.6m; 2)定义变量:在spss软件中的“变量视图”中定义苗木苗高, 之后在“数据视图”中输入苗高数据; 3)分析过程 在spss软件上操作分析,输出如下:

表1.1:单个样本统计量 N 均值标准差均值的标准误 苗高10 1.6680 .08430 .02666 表1.2:单个样本检验 检验值 = 1.6 t df Sig.(双侧) 均值差值差分的 95% 置信区间下限上限 苗高 2.551 9 .031 .06800 .0077 .1283 4)输出结果分析 由图1.1和表1.1数据分析可知,变量苗木苗高成正态分布,平均值为1.6680m,标准差为0.0843,说明样本的离散程度较小,标准误为0.0267,说明抽样误差较小。 由表1.3数据分析可知,T检验值为2.55,样本自由度为9,t检

验的

p值为0.031<0.05,说明差异性显著,因此,否定无效假设H0,取备择假设H1。 由以上分析知:在显著水平为0.05的水平上检验,苗木的平均苗高大于1.6m,符合出圃的要求。 独立样本T检验 从两个不同抚育措施育苗的苗圃中各以重复抽样的方式抽得样本如下: 样本1苗高(CM):52 58 71 48 57 62 73 68 65 56 样本2苗高(CM):56 75 69 82 74 63 58 64 78 77 66 73 设苗高服从正态分布且两个总体苗高方差相等(齐性),试以显著水平α=0.05检验两种抚育措施对苗高生长有无显著性影响。 解:1)根据题意提出: 虚无假设H0:两种抚育措施对苗木生长没有显著的影响; 备择假设H1:两种抚育措施对苗高生长影响显著; 2)在spss中的“变量视图”中定义变量“苗高1”,“抚育措施”,之后在“数据视图”中输入题中的苗高数据,及抚育措施,其中措施一定义为“1”措施二定义为“2”; 3)分析过程 在spss软件上操作分析输出分析数据如下;

假设检验讲义

第八章假设检验 内容介绍 本章主要介绍统计假设检验的基本思想和概念以及参数的假设检验,并简单介绍非参数的统计假设检验的一些方法. 内容讲解 §假设检验的基本思想和概念 1.引例 例题1. P167 例8-1 味精厂用一台包装机包装味精,已知袋装味精的重量(单位:公斤)X~N(μ,),机器正常时,其均值μ=公斤. 某日开工后随机抽取9袋袋装味精,其净重分别为, , , , , , , , , 问这台包装机工作是否正常? 【答疑编号】 分析:从上述数据可知,9袋味精没有一袋与包装上标明的公斤相同,这是一种普遍现象.造成这种差异不外乎有两种原因:一是偶然因素造成的差异称为随机误差,属于正常误差;二是由于条件因素造成的误差,称为条件误差,属于不正常的误差。为了检验包装机是否正常,在数理统计中给出了假设检验的方法。 解:已知袋装味精重X~N(μ,),假设现在包装机工作正常,提出如下假设: H0:μ=μ0=,H1:μ≠μ0, 这是两个对立的假设,让我们通过抽样进行检验,从中选取其一,作出决策. 从总体中抽取容量为n的样本,其均值为是μ的一个无偏估计. 易知,当很小时,认定H0为真,反之,很大时,我们有理由怀疑H0为真而拒绝H0,接受H1.

如何求出大、小的临界值下面讨论之. 为了确定临界值,给定一个小数α(0<α<1).由于H0为真时,~, 与区间估计类似,考虑 , 查表可得临界值.显然,事件 是一个小概率事件,在一次试验中几乎不可能发生. 我们只需计算的值,与临界值 比较大小,若,说明上述小概率事件没有发生,我们接受H0,反之说明,小概率事件居然发生了,与“小概率事件在一次试验中几乎不可能发生”相矛盾,于是拒绝H0,接受H1,认为这台包装机工作不正常. 2.统计假设检验中的一些基本概念 (1)参数检验与非参数检验 如果需要检验的量仅仅涉及总体分布的未知参数,则称之为参数检验. 这是本章讲解的主要内容;如果涉及分布函数形式等时,则称之为非参数检验.

参数估计和假设检验习题解答讲解

参数估计和假设检验习题 1.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600? 0.05,α=26,n = 受0 :1600H μ=, 即,以95%的把握认为这批产品的指标 的期望值μ为1600. 2.某纺织厂在正常的运转条件下,平均每台布机每小时经纱断头数为O.973根,各台布机断头数 的标准差为O.162根,该厂进行工艺改进,减少经纱上浆率,在200台布机上进行试验,结果平均每台每小时经纱断头数为O.994根,标准差为0.16根。问,新工艺上浆率能否推广(α=0.05)? 解: 012112:, :,H H μμμμ≥< 3.某电器零件的平均电阻一直保持在2.64Ω,改变加工工艺后,测得100个零件的平均电阻为2.62Ω,如改变工艺前后电阻的标准差保持在O.06Ω,问新工艺对此零件的电阻有无显著影响(α=0.05)? 解: 01: 2.64, : 2.64,H H μμ=≠已知标准差σ=0.16,拒绝域为2 Z z α>,取 0.0252 0.05, 1.96z z αα===, 100,n =由检验统计量 3.33 1.96Z = ==>,接受1: 2.64H μ≠, 即, 以95%的把握认为新工艺对此零件的电阻有显著影响. 4.有一批产品,取50个样品,其中含有4个次品。在这样情况下,判断假设H 0:p ≤0.05是否成立(α=0.05)? 解: 01:0.05, :0.05,H p H p ≤>采用非正态大样本统计检验法,拒绝域为Z z α>,0.950.05, 1.65z α==,

假设检验的习题及详解包括典型考研真题

§假设检验 基本题型Ⅰ 有关检验统计量和两类错误的题型 【例8.1】u 检验、t 检验都是关于 的假设检验.当 已知时,用u 检验;当 未知时,用t 检验. 【分析】 由u 检验、t 检验的概念可知,u 检验、t 检验都是关于均值的假设检验,当方差2 σ为已知时,用u 检验;当方差2 σ为未知时,用t 检验. 【例8.2】设总体2(,)X N u σ,2,u σ未知,12,, ,n x x x 是来自该总体的样本,记 11n i i x x n ==∑,21 ()n i i Q x x ==-∑,则对假设检验0010::H u u H u u =↔≠使用的t 统计量 t = (用,x Q 表示) ;其拒绝域w = . 【分析】2 σ未知,对u 的检验使用t 检验,检验统计量为 (1)x t t n = =- 对双边检验0010::H u u H u u =↔≠,其拒绝域为2 {||(1)}w t t n α=>-. 【例8.3】设总体211(,)X N u σ,总体222(,)Y N u σ,其中22 12,σσ未知,设 112,, ,n x x x 是来自总体X 的样本,212,,,n y y y 是来自总体Y 的样本,两样本独立,则 对于假设检验012112::H u u H u u =↔≠,使用的统计量为 ,它服从的分布为 . 【分析】记1111n i i x x n ==∑,2 1 21n i i y y n ==∑,因两样本独立,故,x y 相互独立,从而在0H 成立下,()0E x y -=,2 2 12 1 2 ()()()D x y D x D y n n σσ+=+= + ,故构造检验统计量 (0,1)x y u N = . 【例8.4】设总体2(,)X N u σ,u 未知,12,, ,n x x x 是来自该总体的样本,样本方 差为2 S ,对2201:16:16H H σσ≥↔<,其检验统计量为 ,拒绝域为 .

相关主题
相关文档
最新文档