对假设检验中若干问题的思考

对假设检验中若干问题的思考
对假设检验中若干问题的思考

假设检验论文

“国十一条”等房市调控政策对沿海和内陆 的影响的研究 摘要: 由于房地产行业的过热,房价飞涨。人们都过上了“蜗居”的日子,但从2010年初开始,千呼万唤始出来的一系列房价调控政策的出台,也得到了积极的响应。人们开始对房市持观望态度。大部分沿海城市房市交易量萎缩,但在一些内陆城市交易量并没放缩,还是同样的热闹。所以我们将对“国十一条”等房市调控政策对沿海和内陆的作用效果是不同的这个问题用假设检验进行研究。 关键字:房市调控政策、沿海和内陆、假设检验、t检验 1.问题的提出 1.1 背景 由于房地产行业的过热,房价飞涨。人们都过上了“蜗居”的日子,但从2010年初开始,千呼万唤始出来的一系列房价调控政策的出台,也得到了积极的响应。人们开始对房市持观望态度。大部分沿海城市房市交易量萎缩,但在一些内陆城市交易量并没放缩,还是同样的热闹。就有记者采访前来的购房者。而这位购房者的观点是:这一系列的政策对不同区域的效果是不同的,在高房价的沿海城市是有一定的效果,但是在相对低房价的内陆城市的效果是不明显的。 1.2 提出问题 现在我们就对这位购房者提出的观点进行统计意义上的验证。 问题:“国十一条”等房市调控政策对沿海和内陆的作用效果是不同的。 我们将从两个方面来研究房市政策对沿海与内陆影响的比较: 一、沿海与内陆房屋销售价格指数x的比较 二、沿海与内陆房屋销售面积增速y(%)的比较 2.假设检验准备 2.1 进行抽样 沿海城市:北京、天津、上海、广州、深圳 内陆城市:重庆、西安、银川、武汉、长沙 在上述抽样的基础上进行问题一的探讨。

沿海地区:北京、天津、上海、江苏、广东 内陆地区:四川、湖南、陕西、湖北、云南 在上述抽样的基础上进行问题二的探讨。 2.2 条件假设 在验证之前我们先进行假设: 1.对沿海和内陆的城市总体的房屋销售价格指数都服从正态分布 2.对沿海和内陆的城市总体的房屋销售面积增速都服从正态分布 3.沿海和内陆总体的房屋销售价格指数的方差相等 4.沿海和内陆地区总体的房屋销售面积增速的方差相等 2.3 参数假设 1. 沿海与内陆房屋销售价格指数分别为1X 、2X 2. 沿海与内陆房房屋销售面积分别为1Y 、2Y 3. 1X ~N(1μ,21σ)、2X ~N(2μ,22σ) 4. 1Y ~N(3μ,2 3σ)、2Y ~N(4μ,24σ) 5. 沿海与内陆样本房屋销售价格指数均值分别为_ 1x 、_ 2x 6. 沿海与内陆样本房屋销售价格指数方差分别为2 1s 、2 2s 7. 沿海和内陆地区样本的房屋销售面积增速的均值分别为_ 3x 、_ 4x 8. 沿海和内陆地区样本的房屋销售面积增速的方差分别为23s 、2 4s 2.4 理论准备 现在给出我们将要用到的假设检验的理论(两个正态总体均值差的检验) 设1X ,2X ,…,1n X 是来自N(1μ,2 1σ)的样本, 1Y ,2Y ,…,2n Y 是来自 N(2μ,2 2σ)得样本,它们相互独立2221,,,s s y x 分别是两个总体的均值与方差,当 2 2 22 1σσσ==未知时( t 检验 )

假设检验中两种类型错误的关系

假设检验中两种类型错误之间的关系 (一) α与β是在两个前提下的概率。α是拒绝H0时犯错误的概率(这时前提是“H0为真”);β是接受H0时犯错误的概率(这时“H0为假”是前提),所以α+β不一定等于1。结合图7—2分析如下: 图7-2 α与β的关系示意图 如果H0:μ1=μ0为真,关于与μ0的差异就要在图7—2中左边的正态分布中讨论。对于某一显著性水平α其临界点为。(将两端各α/2放在同一端)。右边表示H0的拒绝区,面积比率为α;左边表示H0的接受区,面积比率为1-α。在“H0为真”的前提下随机得到的落到拒绝区时我们拒绝H0是犯了错误的。由于落到拒绝区的概率为α,因此拒绝“H0为真”时所犯错误(I型)的概率等于α。而落到H0的接受区时,由于前提仍是“H0为真”,因此接受H0是正确决定,落在接受区的概率为1-α,那么正确接受H0的概率就等于1-α。如α=0.05则1-α=0.95,这0.05和0.95均为“H0为真”这一前提下的两个概率,一个指犯错误的可能性,一个指正确决定的可能性,这二者之和当然为1。但讨论β错误时前提就改变了,要在“H0为假”这一前提下讨论。对于H0是真是假我们事先并不能确定,如果H0为假、等价于H l为真,这时需要在图7—2中右边的正态分布中讨论·(H1:μ1>μ0),它与在“H0为真”的前提下所讨论的相似,落在临界点左边时要拒绝H l (即接受H0),而前提H l为真,因而犯了错误,这就是II型错误,其概率为β。很显然,当α=0.05时,β不一定等于0.95。 (二)在其他条件不变的情况下,α与β不可能同时减小或增大。这一点从图7—2也可以清楚看到。当临界点向右移时,α减小,但此时β一定增大;反之向左移则α增大β减小。一般在差异检验中主要关心的是能否有充分理由拒绝H0,从而证实H l,所以在统计中规定得较严。至于β往往就不予重视了,其实许多情况需要在规定的同时尽量减小β。这种场合最直接的方法是增大样本容量。因为样本平均数分布的标准差为,当n增大时样本平均数分布将变得陡峭,在α和其他条件不变时β会减小(见图7—3)。 (三)在图7—2中H l为真时的分布下讨论β错误已指出落到临界点左边时拒绝H l所犯错误的概率为β。那么落在临界点右边时接受H l则为正确决定,其概率等于1一β。换言之,当H l为真,即μ1与μ0确实有差异时(图7—2中,μ1与μ0的距离即表示μ1与μ0的真实差异),能以(1—β)的概率接受之。

(罗良清)统计学(第二版)思考与练习答案:第七章假设检验习题答案

1 习题答案 计算题: (1)假设考生成绩服从正态分布,在某地一次数学统考中随机抽取了36位考生的成绩,算得平均成绩为66.5分,标准差为15分。问在显著性水平α=0.05下,是否可以认为这次考试全体考生的成绩为70分? 解:建立假设 H 0:0μ=70, H 1:0μ≠70 x =66.5,s=15,n=36 0718/1536x t s n = == 另一方面查表得,t(14)=2.1448>t 故应接受零假设,即不认为0μ≠70 (2)某种导线的质量标准要求其电阻的标准差不得超过σ=0.005Ω,今在一批导线中随机抽取样品9根,测得样本标准差为s=0.007Ω。设总体为正态分布,问在显著性水平α=0.05下能否认为这批导线的标准差显著地增大了? 解:建立假设 H 0:0σ=0.005, H 1: 0σ>0.005 n=9,s=0.007

2 2 22220(1)80.00715.680.005 n s χσ-?=== 另一方面查表得,2 0.05(8)15.5χ=>15.68 故应接受原假设,即不认为0σ>0.005(但已经相当接近于拒绝零假设的边缘了) (3)两台车床生产同一种滚珠,其直径服从正态分布。从中分别抽取8个和9个产品,测得各自的直径为: 甲车床:15.0 14.5 15.2 15.5 14.8 15.1 15.2 14.8; 乙车床:15.2 15.0 14.8 15.2 15.0 15.0 14.8 15.1 14.8。 比较两台车床生产的滚珠直径的方差是否有明显差别(α=0.05)? 解:建立假设 H 0:12μμ=, H 1: 12μμ≠ 经计算后得: x =15.0125,y =14.9889;20.095536x s =,20.026111y s = 1n =8,29n = 合并方差 2 2x y 2 xy (m 1)s (n 1)s 0.058509m n 2s -+-=+-= 20.095536x s = 自由度 m+n-2=15

关于假设检验的两类错误问题的分析--论文

关于假设检验的两类错误问题的分析 摘要:本文对假设检验的两类错误问题进行分析,阐述了两类错误问题的基本概念,讨论了两类错误的产生的原因和它们之间的关系,并给出了减少统计假设检验中两类错误发生的方法。 关键词:假设检验,两类错误,关系,控制 统计学知识具有理论丰富、应用广泛的特征,在生产实践中具有强烈的应用背景[1],由于受到人力、物力、财力、时间等的限制,以及某些实验与检测的破坏性,人们在实践中对总体的某一数量特征进行评估时,常常采取从总体中抽取若干数量的随机样本,然后,依据“小概率原理”和样本信息,用假设检验方法对总体数量特征做出判断。例如,商业银行对企业进行信用评估问题[2],产品生产线工作是否异常的判断问题,炮弹质量检测问题等都要用到统计学中假设检验方面的知识。人们总是希望能够依据样本信息做出关于总体特征的正确判断或决策。然而,由于样本是从总体中随机抽取的,用少量的随机样本信息来对总体的某些特征进行假设检验难免不犯错误,这些错误我们通常称为假设检验的两类错误问题。本文对假设检验的两类错误问题进行分析,阐述了两类错误问题的基本概念,讨论了两类错误的产生的原因和它们之间的关系,并给出了减少统计假设检验中两类错误发生的方法。 1问题引入 由下例引出的问题[3]: 例1:已知罐头番茄汁中维生素C含量服从正态分布,按规定,维生素C的平均含量不得少于21毫克,现在从一批罐头中抽取17罐。算得维生素C含量的平均值X=23,S2=31982,问该批罐头维生素c含量是否合格? (α=0.05)。 解:维生素c含量X~N(μ,α2),检验假设:H0:μ<21,当H0成立时,则有 查表得t0.05=1.746,即P{T>1.746}=0.05,经计算T=2.07>1.746,于是否定H0,认为μ≥21,即该批罐头合格。在本例中,罐头是否合格,在解答之前并不知道,那么,为什么要设为H0<21而不设为H0>21呢?如果说两种地位均等,取哪一个都行,那么将会得出什么结论。请看下例:

8.1.1假设检验的基本思想

第八章假设检验

第一节假设检验的基本思想 统计推断的另一重要问题是假设检验.在总体分布未知或虽知其类型但分布中含有未知参数时,为推断总体的某些未知提出关于总体的一些假设.我们需根据样本提供的信息对所提的假设作出接受或拒绝的决策,假设检验就是作出这一决策的过程. 假设检验???参数假设检验非参数假设检验 0 引言以及运用适当的统计量,特性,

参数假设检验是针对总体分布函数中的未知参数而提出的假设进行检验; 鉴于本章主要讨论单参数假设检验问题,故本节就以此为背景来探讨一般假设检验问题. 非参数假设检验是针对总体分布函数形式或类型的假设进行检验。

下面结合例题来说明假设检验的基本思想. 设一箱中有红白两种颜色的球共100个,甲说这里有99个白球乙从箱中任取一个,发现是红球,说法是否正确?先作假设:0H 箱中确有99个白球. 如果假设0H 正确,则从箱中任取一个球是红球的概率为0.01,是小概率事件.通常认为在一次随机试验中,概率小的事件因此,问甲的取一个,发现是白球,若乙从箱中任则没有理由怀疑假设0H 的正确性.不易发生,今乙从箱中任取一个,发现是红球,即小概率事件竟然在一次试验中发生了,故有理由拒绝假设,0H 即认为甲的说法不正确.

1.假设检验的基本思想 假设检验的基本思想实质上是带有某种概率性质的反证法。为了检验一个假设0H 是否正确,定该0H 正确,然后根据抽取到的样本对假设0H 作出接受或拒绝的决策. 如果样本观察值导致了不合理的现象的发生,就应拒绝假设,0H 假设. 0H 假设检验中所谓“不合理”,并非逻辑中的绝对矛盾,而是首先假否则应接受基于人们在实践中广泛采用的原则,试验中是几乎不发生的,即小概率事件在一次但概率小到什么程度才能看作

假设检验

第七 章 假设检验 一、教材说明 本章主要介绍统计假设检验的基本概念和基本思想、正态总体参数的统计假设的显着性检验方法.。 1、本章的教学目的与要求 (1)使学生了解假设检验的基本概念; (2)使学生了解假设检验的基本思想; (3)使学生掌握假设检验的基本步骤; (4)使学生会计算检验的两类错误,搞清楚两类错误的关系; (5)使学生掌握正态总体参数的假设检验,主要是检验统计量及其分布,检验拒绝域的确定; (6)使学生灵活运用所学知识解决实际问题。 2、本章的重点与难点 本章的重点是正态总体参数的各种假设检验中的检验统计量及其分布,难点是假设检验拒绝域的确定。 二、教学内容 下面主要分3节来讲解本章的主要内容。 § 假设检验的基本概念 对总体分布或分布中的某些参数作出假设,然后利用样本的观测值所提供的信息,运用数理统计的分析方法,检验这种假设是否成立,从而决定接受或拒绝“假设”,这一统计推断过程,称为假设检验。 1.引例 我们先举一个简单的实例来说明假设检验的基本思想及推理方法. 例1:某车间用一台包装机包装葡萄糖, 包得的袋装糖重是一个随机变量, 它服从正态分布.且知标准差为0.015千克.当机器正常时, 其均值为0.5千克,某日开工后为检验包装机是否正常, 随机地抽取它所包装的糖9袋, 称得净重为(千克): , 问机器是否正常 分析:用μ和σ分别表示这一天袋装糖重总体X 的均值和标准差,则)015.0,(~2 μN X ,其中μ未知。 问题: 已知总体2 (,)X N μσ:,且00.015,σσ==根据样本值判断0.5μ=还是 0.5μ≠。 提出两个对立假设00:0.5H μμ==(原假设或零假设)和 10:H μμ≠(备择假设).再利用已知样本作出判断是接受假设0H ( 拒绝假设1H ) , 还是拒绝假设0H (接受假设 1H ). 如果作出的判断是接受0H , 则0μμ=即认为机器工作是正常的, 否则, 认为是不 正常的.

实验7 假设检验(一)

实验7 假设检验(一) 一、实验目的: 1.掌握重要的参数检验方法(单个总体的均值检验,两个总体的均值检验,成对样本的均值的检验,两个 总体方差的检验,二项分布总体的检验); 2.掌握若干重要的非参数检验方法(Pearson拟合优度 2检验,Kolmogorov-Smirnov单样本和双样本检验)。 二、实验内容: 练习: 要求:①完成练习并粘贴运行截图到文档相应位置(截图方法见下),并将所有自己输入文字的字体颜色设为红色(包括后面的思考及小结),②回答思考题,③简要书写实验小结。④修改本文档名为“本人完整学号姓名1”,其中1表示第1次实验,以后更改为2,3,...。如文件名为“09张立1”,表示学号为09的张立同学的第1次实 , 法1Alt ,即完 法2:图标,工具。)1. 2. H0: H1: alternative hypothesis: true mean is not equal to 225 95 percent confidence interval: 172.3827 211.9173 sample estimates: mean of x 192.15 P=0.002516<0.05,拒绝原假设,认为油漆工人的血小板计数与正常成年男子有差异 3.(习题5.2)已知某种灯泡寿命服从正态分布,在某星期所生产的该灯泡中随机抽取10 只,测得其寿 命(单位:小时)为 1067 919 1196 785 1126 936 918 1156 920 948 求这个星期生产出的灯泡能使用1000小时以上的概率。

解: 源代码及运行结果:(复制到此处,不需要截图) > x<-c(1067, 919, 1196, 785, 1126, 936, 918, 1156, 920, 948) > p<-pnorm(1000,mean(x),sd(x)) > 1-p [1] 0.4912059 结论: 这个星期生产出的灯泡能使用1000小时以上的概率为0.4912059 4.(习题 5.3)为研究某铁剂治疗和饮食治疗营养性缺铁性贫血的效果,将16名患者按年龄、体重、病 程和病情相近的原则配成8对,分别使用饮食疗法和补充铁剂治疗的方法,3个月后测得两种患者血红资白如下表所示,问两种方法治疗后的患者血红蛋白有无差异? H0: H1: 5. ,分别测 试验组与对照组空腹腔血糖下降值(mmol/L) (1)检验试验组和对照组的的数据是否来自正态分布,采用正态性W检验方法(见第3章)、Kolmogorov-Smirnov检验方法和Pearson拟合优度 2检验; 解:提出假设:

卫统的假设检验基础 思考与练习

第七章假设检验基础思考与练习(结果只给出SPSS分析结果,手工计算步骤及公式略) 一、该资料为单样本计量资料与一已知总体参数的比较,可选择方法有T检验与秩和检验。如果来自正态总体则选择T检验,偏态则选择秩和检验 上表为正态性检验结果,从表可知W=0.866,P=0.069故该样本服从正态分布,可选择T检验 单样本T检验结果显示T=1.064,P=0.312,不拒绝H0,淌不能认为该法测CaCO3含量与真值有差异。 三、该资料为计量资料,实验设计为完全随机设计,处理组为两组。可选择的方法有两样本T检验,T`检验,秩和检验、U检验、方差分析。根据正态性及方差齐性及样本含量来选择检验方法。

上表为正态性检验结果,结果显示两组的P值均大于0.05,故均服从正态分布。 上表为方差齐性检验结果,结果显示F=0.527,P=0.477。方差齐。 根据前面的的结果正态性、方差齐性均满足,样本含量小,故选择T检验。

上表为两样本T检验结果,第一行为T检验结果,第二行为T’检验结果,因为方差齐,所以看T检验的结果。T=-3.785,P=0.001,拒绝H0,接受H1,可认为两总体均数有差异。 四、该资料为计量资料,实验设计为配对设计,可选择的检验方法有配对t检验及秩和检验。条件看差值是否服从正态分布。 从上表的差值的正态性检验结果可知w值=0.247,p=0.169,故差值服从正分布。选择t检验

从配对t检验结果可知t=0.796,p=0.447故不拒绝H0,尚不能认为两种方法测定结果有差异。 第八章方差分析 一、该资料为计量资料,实验设计为完全随机设计。共三个处理组,可选择的方法有方差分析及秩和检验 正态性检验结果显示,三组样本均服从正态分布

假设检验的类型和两类错误

假设检验的类型和两类错误 关键词:假设检验 导语:作为质量改进的重要工具之一,假设检验是数理统计学中的一种统计推断方法,其根据一定假设条件,由样本推断总体,从而判断样本与样本、样本与总体的差异是由抽样误差引起的,还是本质差别造成的。 作为质量改进的重要工具之一,假设检验是数理统计学中的一种统计推断方法,其根据一定假设条件,由样本推断总体,从而判断样本与样本、样本与总体的差异是由抽样误差引起的,还是本质差别造成的。 假设检验的类型 统计假设一般可分为参数假设与非参数假设。 参数假设是指总体分布类型已知,对未知参数的统计假设。检验参数假设问题成为参数检验。当总体分布类型为正态分布时,则为正态总体参数检验。 非参数假设是指总体分布类型不明确,对参数的各种统计假设。检验非参数假设问题称为非参数检验,也称分布检验。由于非参数检验和非正态分布总体的参数检验都比较复杂,在QC小姐活动中很少应用。 假设检验的两类错误 在假设检验中,常将“小概率事件”的概率表示为α,称为显著性水平,把原先设定的假设称为原假设,记做H0,把与H0相反的假设称为备择假设,它是原假设被拒绝时而应接受的假设,记做H1。 做出接受或拒绝原假H0的判断,都可能犯如下的两类错误: ●Ⅰ类错误——弃真错误,发生的概率为α; ●Ⅱ类错误——取伪错误,发生的概率为β,见下表。 假设健谈决策的两类错误 检验决策H0为真H0非真 拒绝H0犯Ⅰ类错误的概率为α正确 接受H0正确犯Ⅱ类错误的概率为β

样本均值的显著性水平为α时,则得到该样本置信度为1-α的置信区间。 如果,显著性水平为α,均值为μ时,原假设H0是均值μ=μ0.那么,与H0相反的假设,即备择假设H1就是均值μ≠μ0。 因此,我们可以用计算确定出均值μ的1-α置信区间的方法来检验上述假设是否成立。如果计算出来的置信区间包含μ0,就接受H0;如果不包含就拒绝H0。 最后,值得注意的是,假设检验在判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。因此,我们在日常的质量改进工作中,要用辩证的思想来看待假设检验结果。

假设检验作业习题

假设检验与方差分析 一、单选题 1、假设检验的基本思想是() A、中心极限定理 B、小概率原理 C、大数定律 D、置信区间 2、如果一项假设规定的显著水平为0.05,下列表述正确的是() A、接受H0时的可靠性为95% B、接受H1时的可靠性为95% C、H1为假时被接受的概率为5% D、H0为真时被拒绝的概率为5% 3、假设检验的步骤() A、建立假设、选择和计算统计量、确定P值和判断结果 B、建立原假设、备择假设,确定检验水准 C、确定单侧检验或双侧检验、选择t检验或u检验、估计一类错误和二类错误 D、计算统计量、确定P值、做出推断结果 4、在一次假设检验中,当显著水平设为0.05时,结论是拒绝原假设,现将显著水 平设为0.1,那么() A、仍然拒绝原假设 B、不一定拒绝原假设 C、需要重新进行假设检验 D、有可能拒绝原假设 5、进行假设时,在其他条件不变的情形下,增加样本量,检验结论犯两类错误的 概率将() A.都减小 B. 都增加 C.都不变 D.一个增加一个减少 6、在假设检验中,1-α是指() A.拒绝了一个真实的原假设的概率 B.接受了一个真实的原假设概率 C.拒绝了一个错误的原假设的概率 D.接受了一个错误的原假设概率 7、在假设检验中,1-β是指() A.拒绝了一个正确的原假设的概率 B.接受了一个正确的原假设的概率 C.拒绝了一个错误的原假设的概率 D. 接受了一个错误的原假设的概率 8.将由显著性水平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性水平的二分之一,这是()。 A. 单侧检验 B.双侧检验 C.右侧检验 D.左侧检验 9.方差分析要求() A.各个总体方差相等 B.各个样本来自同一总体 C.各个总体均数相等 D.两样本方差相等 二、多项选择题 1.显著性水平与检验拒绝域关系() A. 显著性水平提高(α变小),意味着拒绝域缩小 B. 显著性水平降低,意味着拒绝域扩大 C. 显著性水平提高,意味着拒绝域扩大 D. 显著性水平降低,意味着拒绝域扩大化 E. 显著性水平提高或降低,不影响拒绝域的变化 2. β错误() A. 是在原假设不真实的条件下发生 B. 是在原假设真实的条件下发生 C. 决定于原假设与真实值之间的差距 D. 原假设与真实值之间的差距越大,犯β错误的可能性就越小

第5章 假设检验

第五章、假设检验 思考题 1.1.理解原假设与备择假设的含义,并归纳常见的几种建立原假设与备择假设的原则. 答:原假设通常是研究者想收集证据予以反对的假设;而备择假设通常是研究者想收集证据予以支持的假设。建立两个假设的原则有: (1)原假设和备择假设是一个完备事件组。(2)一般先确定备择假设。再确定原假设。(3)等号“=”总是放在原假设上。(4)假设的确定带有一定的主观色彩。(5)假设检验的目的主要是收集证据来拒绝原假设。 2.第一类错误和第二类错误分别是指什么?它们发生的概率大小之间存在怎样的关系? 答:第I类错误指,当原假设为真时,作出拒绝原假设所犯的错误,其概率为α。第II类错误指当原假设为假时,作出接受原假设所犯的错误,其概率为β。在其他条件不变时,α增大,β减小;β增大,α减小。 3.什么是显著性水平?它对于假设检验决策的意义是什么? 答:假设检验中犯第一类错误的概率被称为显著性水平。显著性水平通常是人们事先给出的一个值,用于检验结果的可靠性度量,但确定了显著性水平等于控制了犯第一错误的概率,但犯第二类错误的概率却是不确定的,因此作出“拒绝原假设”的结论,其可靠性是确定的,但作出“不拒绝原假设”的结论,其可靠性是难以控制的。 4.什么是p值?p值检验和统计量检验有什么不同? 答:p值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。P值常常作为观察到的数据与原假设不一致程度的度量。统计量检验采用事先确定显著性水平α,来控制犯第一类错误的上限,p 值可以有效地补充α提供地关于检验可靠性的有限信息。p值检验的优点在于, 它提供了更多的信息,让人们可以选择一定的水平来评估结果是否具有统计上的显著性。 5.什么是统计上的显著性? 答:一项检验在统计上是显著的(拒绝原假设),是指这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的。显著性的意义在于“非偶然的 练习题 3.解(1)第一类错误是,供应商提供的炸土豆片的平均重量不低于60克,但店方拒收并投诉。 (2)第二类错误是,供应商提供的炸土豆片的平均重量低于60克,但店方没有拒收。

假设检验与方差分析

实验四 假设检验 实验目的:通过此实验熟练掌握如何利用假设检验工具根据不同条件 选择相应检验工具进行检验,有助于学习者理解假设检验的过程及结果 实验要求:能够运用Excel 对总体均值进行假设检验,学会针对实际 背景提出原假设和备择假设来检验实际问题,并根据检验结果作出符合统计学原理和实际情况的判断和结论,加深对统计学方法的广泛应用背景的理解 假设检验与区间估计两者之间存在密切的关系,二者用的是同一个样本、同一个统计量、同一种分布,所以也可以用区间估计进行假设检验,两者结论是一致的。在Excel 中进行假设检验,除可按区间估计过程用公式和逆函数计算外,还备有专用的假设检验工具,包括Z —检验工具、T —检验工具和F —检验工具。使用这些工具,可以直接根据样本数据进行计算,一次给出检验统计量、单尾和双尾临界值以及小于或等于临界值的概率等所需要的数值。实验四主要介绍假设检验工具的使用。 一、假设检验的一般过程 假设检验主要是根据计算出的检验统计量与相应临界值比较,作出拒绝或接受原假设的决定。 根据全国汽车经销商协会报道,旧车的平均销售价格是10192美元。堪萨斯城某旧车经销处的一名经理检查了近期在该经销处销售的100辆旧车。结果样本平均价格是9300美元,样本标准差是4500美元。在0.05的显著性水平下,检验H 0:10192≥μ H 1:10192<μ。问:假设检验的结论是什么?这名经理接下来可能会采取什么行动? 本例由于样本容量比较大,其均值近似服从正态分布,总体方差未知,需要用样本标准差来代替,选择T 统计量进行检验。T 统计量的计算公式如下:

)1(~1 0--= -n t n s x t n μ 单击任一空单元格,输入“=(9300-10192)/(4500/SQRT(100))”,回车确认,得出t 统计量为-1.982。单击另一空单元格,输入“=TINV(0.025,99)”,回车确认,得出t 分布的右临界值为2.276。因为276.2982.1<-,所以不拒绝原假设,认为此旧车经销处旧汽车平均销售价格不小于10192美元。那么接下来这名经理会采取什么相应行动?(请读者思考)。 本例主要介绍了假设检验的一般过程,利用Excel 的公式和函数求出相应的统计量值和临界值,最后作出结论。 二、假设检验工具的使用 接下来介绍如何使用Excel 的假设检验工具。使用这一工具应该注意二点:第一,由于现实世界和生活中大量的数据服从正态分布,Excel 的假设检验工具是按正态总体设计的(以下各例未特殊说明,认为其服从或近似服从正态分布);第二,Excel 的假设检验工具主要用于检验两总体之间有无显著差异。具体来讲,Z —检验工具是对方差或标准差已知的两总体均值进行差异性检验;T —检验工具是对方差和标准差未知的两总体均值进行差异性检验,其中包括等方差假设检验、异方差假设检验和成对双样本检验;F —检验工具是对总体的标准差进行检验。 (一)Z —检验工具的使用 国际航空运输协会对商务旅行者进行调查以确定大西洋两岸过关机场的等级分数。假定:要求50名商务旅行者组成的随机样本给迈阿密机场打分,另50名商务旅行者组成的随机样本给洛杉机机场打分,最高等级为10分。两个样本数据如下: 迈阿密机场得分数据: 6 4 6 8 7 7 6 3 3 8 10 4 8 7 8 7 5 9 5 8 4 3 8 5 5 4 4 4 8 4 5 6 2 5 9 9 8 4 8 9 9 5 9 7 8 3 10 8 9 6 洛杉机机场得分数据: 10 9 6 7 8 7 9 8 10 7 6 5 7 3 5 6 8 7 10 8 4 7 8 6 9 9 5 3 1 8 9 6 8 5 4 6 10 9 8 3 2 7 9 5 3 10 3 5 10 8 假定两总体的等级标准差已知(这里用样本标准差代替总体标准差),

人大版统计学 习题加答案第四章 假设检验

第四章 假设检验 填空(5题/章),选择(5题/章),判断(5题/章),计算(3题/章) 一、 填空 1、在做假设检验时容易犯的两类错误是 和 2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为 ,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为 3、假设检验有两类错误,分别是 也叫第一类错误,它是指原假设H0是 的,却由于样本缘故做出了 H0的错误;和 叫第二类错误,它是指原假设H0是 的, 却由于样本缘故做出 H0的错误。 4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称为 。 5、 假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生的,该原理称为 。 6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm ,标准差为1.6cm ,想知道这批零件的直径是否服从标准直径5cm ,在显著性水平α下,否定域为 7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为 。(用H 0,H 1表示) 8、一般在样本的容量被确定后,犯第一类错误的概率为α,犯第二类错误的概率为β,若减少α,则β 9、某厂家想要调查职工的工作效率,用方差衡量工作效率差异,工厂预计的工作效率为至少制作零件20个/小时,随机抽样30位职工进行调查,得到样本方差为5,试在显著水平为0.05的要求下,问该工厂的职工的工作效率 (有,没有)达到该标准。 KEY: 1、弃真错误,纳伪错误 2、双边检验,单边检验 3、拒真错误,真实的,拒绝,取伪错误,不真实的,接受 4、显著性水平 5、小概率事件 6、1.25>2 1α-z

第7章思考与练习-假设检验

第七章 假设检验 【思考与练习】 一、思考题 1.解释零假设与备择假设的含义。 2.简述假设检验的基本步骤。 3.比较单侧检验与双侧检验的区别。 4.解释I 型错误、II 型错误和检验效能,并说明它们之间的关系。 5.简述假设检验与置信区间估计的联系。 二、案例辨析题 为了比较非洛地平与常规药物治疗高血压的疗效差异,现已知常规药能使高血压患者的血压平均下降20 mmHg ,某医生随机抽取100名原发性高血压患者,分别测量患者接受非洛地平治疗前后的血压差值,计算得其21.5X =mmHg , 8.0S =mmHg 。该医生进行了t 检验,零假设是μμ0=,备择假设是μμ0≠,检验 水准0.05α=。计算得 1.875t =,按100ν=查t 界值表,得0.10P 0.05<<,故接受0H ,认为非洛地平与常规药物治疗高血压的疗效无差别。你认为该结论正确吗?请说明理由。 三、最佳选择题 1.比较两药疗效时,下列哪种情况可作单侧检验 A .已知A 药与B 药均有效 B .已知A 药与B 药均无效 C .已知A 药不会优于B 药 D .已知A 药与B 药差不多好 E .不知A 药好还是B 药好 2.假设检验的步骤是 A .计算检验统计量、确定P 值、作出推断结论 B .建立无效假设、建立备择假设、确定检验水准 C .建立无效假设、计算检验统计量、确定P 值

D.确定单侧检验或双侧检验、选择t检验或Z检验、估计I型错误概率和II型错误概率 E.建立检验假设和确定检验水准、计算检验统计量、确定P值并作出统计推断3.假设检验时,下列关于检验结果的说法正确的是 A.若P值小于0.05,则不拒绝 H,此时可能犯II型错误 B.若P值小于0.05,则拒绝 H,此时可能犯II型错误 C.若P值小于0.05,则不拒绝 H,此时可能犯I型错误 D.若P值大于0.05,则拒绝 H,此时可能犯I型错误 E.若P值大于0.05,则不拒绝 H,此时可能犯II型错误 4.假设检验时,取以下何种检验水准时可能犯II型错误的概率最小 A.0.025 α= B.0.01 α= C.0.05 α= D.0.10 α= E.0.20 α= 5.下列有关检验统计量t的说法中正确的是 A.t越大,说明总体参数差别越大 B.t越大,说明总体参数差别越小 C.t越大,说明样本统计量差别越大 D.t越大,说明样本统计量差别越小 E.t越大,越有理由认为两总体参数不等 6.在样本均数与已知总体均数比较的t检验中,结果 3.24 t=, 0.05/2,2.086 t ν =, 0.01/2,2.845 t ν=,按检验水准0.05 α=,正确的结论是 A.可认为此样本均数与该已知总体均数不同 B.可认为此样本均数与该已知总体均数差异很大 C.可认为此样本均数所对应的总体均数与已知总体均数差异很大D.可认为此样本均数所对应的总体均数与已知总体均数相同E.可认为此样本均数所对应的总体均数与已知总体均数不同7.下列关于单侧检验和双侧检验的说法正确的是

第九章 假设检验

第九章假设检验 一、思考题 1.假设检验的特征是什么?假设检验一般有哪些步骤? 2.举例说明假设检验的两类错误。如何协调弃真概率α和取伪概率β的大小? 3.如何区别双侧检验和单侧检验,左侧检验和右侧检验? 4.区间估计和假设检验有何区别与联系?如何根据置信区间进行假设检验? 5.在假设检验中,什么是显著性水平和检验临界值,试举例说明。 二、练习题 (一)填空题 1.陈述的假设包括和。 2.假设检验的三种形式是指、和。 3.在假设检验中,在原假设为真的前提下,拒绝原假设所犯的错误称为 ___________。 4.的选择和的事先指定共同决定了任何一个特定假设检验问题的拒绝域。 5.进行一个总体均值的假设检验时,大致需要考虑两种情况:一是,检验统计量服从标准分布;二是总体方差未知,检验统计量服从分布。 6.参数估计和________是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断。 (二)判断题 1()原假设与备选假设一定是对立的。 H为假时,被2()α错误又称为显著性水平、第一类错误,即原假设 0我们接受所犯这类错误的概率。 3()假设检验中要使α和β同时减少的唯一方法是减少样本容量。

4( )显著性水平越小,犯β错误的可能性越小。 5( )对总体比例的检验一般采用z 检验法。 6( )在拒绝原假设的前提下,若增大α的水平,有可能变为接受原假设。7( )对一个总体均值进行检验,在α=0.01的显著性水平上拒绝了原假设,这表示原假设为真的概率小于0.01。 8( )右侧检验中,如果P 值<α,则拒绝0H 。 (三)单项选择题 1.在假设检验中,若500:,500:10 μμH H ≥,则此检验是( ) A 、左侧检验 B 、右侧检验 C 、双侧检验 D 、以上都不对 2.下面有关小概率原则说法中正确的是( )。 A 、小概率事件就是不可能事件 B 、它是指当一个事件的概率不大于充分小的界限α(0<α<1)时, 可认为该事件为不可能事件 C 、基于“小概率原理”完全可以对某一事件发生与否作出正确判断 D 、总体推断中可以不予考虑的事件 3.假设检验中的第一类错误也叫( )。 A 、弃真错误 B 、纳伪错误 C 、假设错误 D 、判断错误 4.利用总体方差未知的大样本对总体均值进行检验,应该采用( )。 A 、t 检验 B 、z 检验 C 、2χ检验 D 、以上都不对 5.假设检验和参数估计的联系与区别:(甲)都是对总体某一数量特征的推断,都是运用概率估计来得到自己的结论;(乙)前者则需要事先对总体参数做出某种假设,然后根据已知的抽样分布规律确定可以接受的临界值;(丙)后者无须事先对总体数量特征做出假设,它是根据已知的抽样分布规律找出恰当的区间,给出总体参数包含在这一区间的概率。( ) A.(甲) B.(甲) (丙) C.(乙) (丙) D.(甲) (乙) (丙) 6、一个好的假设检验,理想的情况是:( )。 A . α与β都大 B. α与β都小 C. α小,β大 D.α大,β小

1假设检验的基本思想和概念

7.1 假设检验的基本思想与概念 教学目的:要求学生了解假设检验的基本思想,理解假设检验的基本概念,认识假设检验问题,熟悉假设检验的基本步骤。 教学重点:基本概念,假设检验的基本步骤. 教学难点:基本概念的理解. 7.1.1统计假设的概念 为了引入统计假设的概念,先请看例8-1。 例7-1味精厂用一台包装机自动包装味精,已知袋装味精的重量 ,机器正常时,其均值=0.5(0.5,0.015的单位都是公斤)。某日开工后随机抽取9袋袋装味精,其净重(公斤)为: 0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512 问这台包装机是否正常? 此例随机抽样取得的9袋味精的重量都不正好是0.5公斤,这种实际重量和标准重量不完全一致的现象,在实际中是经常出现的。造成这种差异不外乎有两种原因:一是偶然因素的影响,二是条件因素的影响。 由于偶然因素而发生的(例如电网电压的波动、金属部件的不时伸缩、衡量仪器的误差而引起的)差异称为随机误差;由于条件因素(生产设备的缺陷、机械部件的过度损耗)而产生的差异称为条件误差。若只存在随机误差,我们就没有理由怀疑标准重量不是0.5公斤;如果我们有十足的理由断定标准重量已不是0.5公斤,那么造成这种现象的主要原因是条件误差,即包装机工作不正常,那么,怎样判断包装机工作是否正常呢? 我们通过解例8-1 来找出解假设检验问题的思想方法。 解已知袋装味精重,假设现在包装机工作正常,即提出如下假设: , 这是两个对立的假设,我们的任务就是要依据样本对这样的假设之一作出是否拒绝的判断。 由于样本均值是的一个很好的估计,故当为真时,应很

假设检验的两类错误和假设的提法

2.假设检验的两类错误 当假设0H 正确时,小概率事件也有可能发生,我们会拒绝假设, 0H 因而犯了“弃真”的错误, 称此为第一类错误.犯第一类错误的概率恰好就是“小概 率事件”发生的概率,α即 {P 拒绝00|H H 为真}. α=反之, 若假设 0H 不正确,但一次抽样检验结果未发 生不合理结果,这时我们会接受,0H 因而犯了“取伪” 此时,

的错误,称此为第二类错误,的概率,即记β为犯第二类错误{P 接受00|H H 为不真}. β=

假设检验的犯两类错误的概率的关系: 理论上,自然希望犯这两类错误的概率都很小,当样本容量n 固定时,βα,不能同时都小,小时,β就变大;而 β 变小时,α就变大. 兼顾,在实际应用中,一般原则是: 控制犯第一类错误的概率,即给定,α然后通过增大样本容量 但即α变二者不可 n 来减小. β关于显著性水平的选取: 若注重经济效益, α可小些,如; 01.0=α若注重社会效益, α可大些,如;1.0=α若要兼顾经济效益和社会效益,一般可取. 05.0=αα

3.假设检验问题的提法 在假设检验问题中,把要检验的假设0H 称为原假设(零假设或基本假设),把原假设0H 的对立面称为备择假设或对立假设,记为.1H 例1 某化学日用品有限责任公司用包装机包装洗衣 粉,洗衣粉包装机在正常工作时,)22 (单位:g),每天开工后,需先检验包装机工作是否 正常.某天开工后,在装好的洗衣粉中任取9袋,其重量为: N X ~装包量,500(

本例的假设检验问题可简记为: )350.(:,:00100=≠=μμμμμH H (1) 形如(1)式的备择假设,1H 表示μ 可能大于,0u 能小于,0u 称为双侧(边)备择假设. 也可 形如(1)式的假设检验称为双侧(边)假设检验. 假设总体标准差σ不变,即,2=σ试问这天包装机 工作是否正常? 505499502506498498497510503

最新第5章-假设检验思考与练习参考答案

第5章 假设检验 思考与练习参考答案 一、最佳选择题 1. 样本均数比较作t 检验时,分别取以下检验水准,以( E )所取Ⅱ类错误最小。 A.0.01α= B. 0.05α= C. 0.10α= D. 0.20α= E. 0.30α= 2. 在单组样本均数与一个已知的总体均数比较的假设检验中,结果t = 3.24,t 0.05,v =2.086, t 0.01,v =2.845。正确的结论是( E )。 A. 此样本均数与该已知总体均数不同 B. 此样本均数与该已知总体均数差异很大 C. 此样本均数所对应的总体均数与该已知总体均数差异很大 D. 此样本均数所对应的总体均数与该已知总体均数相同 E. 此样本均数所对应的总体均数与该已知总体均数不同 3. 假设检验的步骤是( A )。 A. 建立假设,选择和计算统计量,确定P 值和判断结果 B. 建立无效假设,建立备择假设,确定检验水准 C. 确定单侧检验或双侧检验,选择t 检验或Z 检验,估计Ⅰ类错误和Ⅱ类错误 D. 计算统计量,确定P 值,作出推断结论 E. 以上都不对 4. 作单组样本均数与一个已知的总体均数比较的t 检验时,正确的理解是( C )。 A. 统计量t 越大,说明两总体均数差别越大 B. 统计量t 越大,说明两总体均数差别越小 C. 统计量t 越大,越有理由认为两总体均数不相等 D. P 值就是α E. P 值不是α,且总是比α小 5. 下列( E )不是检验功效的影响因素的是: A. 总体标准差σ B. 容许误差δ C. 样本含量n D. Ⅰ类错误α E. Ⅱ类错误β 二、思考题 1.试述假设检验中α与P 的联系与区别。 答:α值是决策者事先确定的一个小的概率值。 P 值是在0H 成立的条件下,出现当前检验统计量以及更极端状况的概率。

第5章 假设检验习题

第五章假设检验 思考与练习 一、单项选择题 1.将由显著性水平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性水平的二分之一,这是(b )。 a. 单侧检验 b.双侧检验 c.右侧检验 d.左侧检验 2.检验功效定义为(b )。 a. 原假设为真时将其接受的概率 b. 原假设不真时将其舍弃的概率 c. 原假设为真时将其舍弃的概率 d. 原假设不真时将其接受的概率 3.符号检验中,(+)号的个数与(-)号的个数相差较远时,意味着(c )。 a.存在试验误差(随机误差) b.存在着条件误差 c.不存在什么误差 d.既有抽样误差,也有条件误差 4.得出两总体的样本数据如下: 甲:8,6,10,7,8 乙:5,11,6,9,7,10 秩和检验中,秩和最大可能值是(c )。 126

a. 15 b. 48 c. 45 d. 66 二、多项选择题 1.显著性水平与检验拒绝域关系(a b d ) a. 显著性水平提高(α变小),意味着拒绝域缩小 b. 显著性水平降低,意味着拒绝域扩大 c. 显著性水平提高,意味着拒绝域扩大 d. 显著性水平降低,意味着拒绝域扩大化 e. 显著性水平提高或降低,不影响拒绝域的变化 2. β错误(a c d e ) a. 是在原假设不真实的条件下发生 b. 是在原假设真实的条件下发生 c. 决定于原假设与真实值之间的差距 d. 原假设与真实值之间的差距越大,犯β错误的可能性就越小 e. 原假设与真实值之间的差距越小,犯β错误的可能性就越大 三、计算题 1.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件, 127

128 测得平均重量为820克,标准差为60克,试以显著性水平α=0.01与α=0.05,分别检验这批产品的平均重量是否是800克。 解:假设检验为800:,800:0100≠=μμH H (产品重量应该使用双侧检验)。采用t 分布的检验统计量n x t /0 σμ-= 。查出α=0.05和0.01两个水 平下的临界值(df=n-1=15)为2.131和2.947 。 1.33t = =。因为 t <2.131<2.947,所以在两个水平下都接受原假设。 2.某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10 150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)? 解:假设检验为10000:,10000:0100>=μμH H (使用寿命有无显著增加,应该使用右侧检验)。n=100可近似采用正态分布的检验统计量 n x z /0 σμ-= 。查出α=0.01水平下的反查正态概率表得到临界值2.32到 2.34之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。计算统计量值 3100 /50010000 10150=-= z 。因为z=3>2.34(>2.32),所以拒绝原假设,无故障

相关文档
最新文档