07假设检验基础
梁前德《统计学》(第二版)学习指导与习题训练答案:07第七章 假设检验与方差分析 习题答案

旗开得胜1第七章 假设检验与方差分析 习题答案一、名词解释用规范性的语言解释统计学中的名词。
1. 假设检验:对总体分布或参数做出某种假设,然后再依据抽取的样本信息,对假设是否正确做出统计判断,即是否拒绝这种假设。
2. 原假设:又叫零假设或无效假设,是待检验的假设,表示为 H 0,总是含有等号。
3. 备择假设:是零假设的对立,表示为 H 1,总是含有不等号。
4. 单侧检验:备择假设符号为大于或小于时的假设检验。
5. 显著性水平:原假设为真时,拒绝原假设的概率。
6. 方差分析:是检验多个总体均值是否相等的一种统计分析方法。
二、填空题根据下面提示的内容,将适宜的名词、词组或短语填入相应的空格之中。
1. u ,nx σμ0-,标准正态; ),(),(2/2/+∞--∞nz nz σσααY2. 参数检验,非参数检验3. 弃真,存伪4. 方差旗开得胜25. 卡方, F6. 方差分析7. t ,u8. nsx 0μ-,不拒绝9. 单侧,双侧10.新产品的废品率为5% ,0.01 11.相关,总变异,组间变异,组内变异12.总变差平方和=组间变差平方和+组内变差平方和 13.连续,离散 14.总体均值 15.因子,水平 16.组间,组内 17.r-1,n-r18. 正态,独立,方差齐三、单项选择从各题给出的四个备选答案中,选择一个最佳答案,填入相应的括号中。
1.B 2.B 3. B 4.A 5.C 6.B 7.C 8.A 9.D 10.A 11.D 12.C四、多项选择从各题给出的四个备选答案中,选择一个或多个正确的答案,填入相应的括号中。
1.AC 2.A 3.B 4.BD 5. AD五、判断改错对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。
1. 在任何情况下,假设检验中的两类错误都不可能同时降低。
( ×)样本量一定时2. 对于两样本的均值检验问题,若方差均未知,则方差分析和t检验均可使用,且两者检验结果一致。
07《卫生统计学》第七章_假设检验基础(6版) (1)

sd t
n 1
n
2 7950 8832500
10 1
10
528.336IU / g
d d d 795.0 4.785 sd s d n 528.336 10
确定概率P:按ν =9查t 界值表,得P<0.01 判断结果:在α=0.05的水准上,拒绝H0,接受H1,可以认为 维生素E缺乏组大鼠肝脏维生素A含量低于正常饲料组。
二、 假设检验的基本步骤
• 确定检验水准: 检验水准(size of a test),亦称为 显著性水准(significance level),符号 为α,即拒绝或不拒绝H0所要冒出错的风 险大小。一般取α=0.05或α= 0.01。
二、 假设检验的基本步骤
• 确定单侧检验(one sided test)还是双侧检验(two sided test): 如果根据现有的专业知识无法预先判断该病 病人的脉搏是高于还是低于一般健康成年男,两 种可能性都存在,研究者对这两种可能性同等关 心,那么,就是要推断两总体均数有无差别,应 当采用双侧检验;如果根据专业知识,已知病人 的脉搏不会低于一般人,或是研究者只关心病人 的脉搏是否高于一般,而不关心是否低于一般, 则应当采用单侧检验(one sided test)。
二、 假设检验的基本步骤
本例的资料符合t 检验的应用条件,已知 μ=72次/min , x =75.572次/min ,s=5.0次/min , n=25,代入公式计算t 值,结果:
x x 75.5 72.0 t 3.50 sx s n 5.0 25
3. 确定P值
第二节 t 检验
1. 一组样本资料的 t 检验
第七章假设检验基础

3t检验的应用条件是什么?
1随机样本 2来自正态总体 3均数比较时,要求两总体方差相等(方差齐性)
4假设检验中P之的意义是什么?
如果总体状况与Ho一致,统计量获得现有数值以及更不利于Ho的数值的概率。
5如何确定检验水准?
需根据研究类型,研究目的,变量类型及变异水平,样本大小等诸多因素。
配对设计资料的t检验:配对设计是研究者为了控制可能存在的非处理因素而采用的一种试验设计方法。
检验统计量:t=dbar-0 / Sd/√n,ν=n-1.其中dbar为差值的均数,Sd为差值的样本标准差,n是对子数。
两独立样本资料的t检验:
㈠两样本所属总体方差相等
检验统计量:t=X1bar-X2bar / √Sc^2(1/n1+1/n2)
6如何恰当地应用单侧与双侧检验?
单侧与双侧检验的应用首先应考虑所要解决问题的目的,根据专业知识来确定。若从专业知识判断一种方法的结果不可能低于或高于另一种方法的结果时,可用单侧检验;在尚不能从专业知识判断两种结果谁高谁低时,则用双侧检验。一般认为双侧检验较保守和稳妥。
大样本资料的z检验:即把它当正态分布处理。计算z。
泊松分布资料的z检验:
单样本资料的z检验:与大样本资料处理方法一致,只是相应的把λ=μ,
λ=σ^2代入即可。
两独立样本资料的z检验:1两样本观察单位数相等时,z=X1-X2 / √ X1+X2
2观察单位不等时,z=X1bar-X2bar /√ X1bar/n1+X2bar/n2.
Sc^2=(∑(X1-X1bar)^2 + ∑(X2-X2bar)^2 ) / n1+n2-2,为合并的方差。
第七章 假设检验基础

第七章假设检验基础一、选择题(一)A1型每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。
1、下面有关假设检验的描述,错误的是()A、检验假设又称无效假设,用H0表示B、备择假设用符号H1表示C、H1是从反证法角度提出的D、H0、H1既相互联系有相互对立E、H0、H1都是根据统计推断的目的而提出的对总体特征的假设2、两样本均数比较,经t检验差别有统计学意义时,P值越小,越有理由认为()A、样本均数与总体均数差别大B、两样本均数差别越大C、两总体均数差别越大D、两样本均数不同E、两总体均数不同3、当样本例数相同时,计量资料的成组t检验与配对t检验相比,一般情况下为()A、成组t检验效率高一些B、配对t检验效率高一些C、二者效率相等D、大样本时二者效率一致E、与两组样本均数的大小有关4、在比较两个独立样本资料的总体均数时,进行t检验的前提条件是()A、两总体均数不等B、两总体均数相等C、两总体方差不等D、两总体方差相等E、以上都不对(二)A2型该题以一个小案例出现,其下面都有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。
1、某地成年男子红细胞数普查结果为:均数为480万/mm3,标准差为41.0万/mm3,那么标准差反应的是()A、抽样误差B、总体均数不同C、随机误差D、个体误差E、以上均不正确2、测定某地100名正常男子的血红蛋白量,要估计该地正常男子血红蛋白均数,95%置信区间为()A、µ±1.96XB、X±1.96C、X±2.58SD、X±1.96SE、µ±2.58S3、以往的经验:某高原地区健康成年男子的红细胞数不低于一般健康成年男子的红细胞数。
某医师在高原地区随机抽取调查了100名健康成年男子的红细胞数,与一般健康成年男子的红细胞数进行t检验后,得到P=0.1785,故按照a=0.05的水准,结论是()A、该地区健康成年男子的红细胞数高于一般B、该地区健康成年男子的红细胞数等于一般C、尚不能认为该地区健康成年男子的红细胞数高于一般D、尚不能认为该地区健康成年男子的红细胞数等于一般E、无法下结论,因为可能犯Ⅱ型错误4、某地成年男子红细胞普查结果为:均数480万/mm3,标准差为41.0万/mm3,随机抽取10名男子,测得红细胞均数为400万/mm3,标准误50万/mm3,那么标准误反映的是()A、抽样误差B、总体均数不同C、随机误差D、个体误差E、以上均不正确(四)B1型请从A、B、C、D、E五个备选答案中选择一个与问题关系最密切的答案。
作业题07 假设检验

第七章 假设检验 作业习题答案7.1 设总体2(,)N ξμσ~,其中参数μ,2σ为未知,试指出下面统计假设中哪些是简单假设,哪些是复合假设:(1)0:0,1H μσ==; (2)0:0,1H μσ=>; (3)0:3,1H μσ<=; (4)0:03H μ<<; (5)0:0H μ=.7.2 设1225,,,ξξξ 取自正态总体(,9)N μ,其中参数μ未知,x 是子样均值,如对检验问题001:,:H H μμμμ=≠取检验的拒绝域:12250{(,,,):||}c xx x x c μ=-≥ ,试决定常数c,使检验的显著性水平为0.057.3 设子样1225,,,ξξξ 取自正态总体20(,)N μσ,20σ已知,对假设检验0010:,:H H μμμμ=>,取临界域12n 0{(,,,):|}c x x x c ξ=> ,(1)求此检验犯第一类错误概率为α时,犯第二类错误的概率β,并讨论它们之间的关系;(2)设0μ=0.05,20σ=0.004,α=0.05,n=9,求μ=0.65时不犯第二类错误的概率。
7.4 设一个单一观测的ξ子样取自分布密度函数为()f x 的母体,对()f x 考虑统计假设:0011101201:():()00x x x H f x H f x ≤≤≤≤⎧⎧==⎨⎨⎩⎩其他其他试求一个检验函数使犯第一,二类错误的概率满足2min αβ+=,并求其最小值。
7.5 设某产品指标服从正态分布,它的根方差σ已知为150小时。
今由一批产品中随机抽取了26个,测得指标的平均值为1637小时,问在5%的显著性水平下,能否认为该批产品指标为1600小时?7.6 某电器零件的平均电阻一直保持在2.64Ω,根方差保持在0.06Ω,改变加工工艺后,测得100个零件,其平均电阻为2.62Ω,根方差不变,问新工艺对此零件的电阻有无显著差异?去显著性水平α=0.01。
07 假设检验

2=02
202
2
2=()02 2>02 2=()02 2<02
2 n 1 S
2 0
单个正态总体均值已知的方差检验——2检验
问题:总体 X~N(,2),已知 假设
H0 : ; H1 : ;
2 2 0 2
构造2统计量 2
概率论与数理统计
第七章 假设检验
主要内容
假设检验的基本概念 正态总体参数的假设检验 *多个正态总体均值的比较——单因素方差 分析 *2拟合优度检验
§7.1 假设检验的基本概念
一、统计假设与统计假设检验 统计假设:通过实际观察或理论分析对总体分布形式 或对总体分布形式中的某些参数作出某种假设。 同一问题中的统计假设有两个:原假设和备择假设
基本原则——小概率事件在一次试验中是不可能发生的。 思想:如果原假设成立,那么某个分布已知的统计 量在某个区域内取值的概率应该较小,如果样本的观 测数值落在这个小概率区域内,则原假设不正确,所以, 拒绝原假设;否则,接受原假设。
• 假设检验的推理用到概率性质的反证法:先假设
H0正确,看由此可以推出什么结果。如果样本观 测值导致了一个不合理现象的出现,则有理由否 定原假设H0,而接受备择假设H1;否则,只能将 原假设H0当做真的保留下来。
故T统计量的观测值为
x 99.978 100 T 0.0545 S n 1.212 9
因为0.0545<1.86 ,即观测值落在接受域内 所以接受原假设,即可认为这天的包装机工作正常。
单边检验
H0:=0;H1:0
拒绝域为
X 0 P t (n 1) S n
X
假设检验基础(非老师课件-仅供参考)

自由度 = n1+n2 -2 。
均数之差的标准误
合并方差(方差的加权平均)
sC2
(n1
1)s12 (n2 1)s22 n1 n2 2
均数之差的标准误
s X1 X2
sC2
(
1 n1
1 n2
单侧
t0.05,35=1.691
因t<t0.05,35。所以P>0.05。
4.做推断结论 假设检验的推断结论是对“H0是否
真实”作出判断。
如果P值小于或等于检验水准α,意味着在H0成立的前提
下发生了小概率事件,根据“小概率事件在一次随机试验
H 中不(大)可能发生”的推断原理,怀疑 0的真实性, 从而做出拒绝(reject) H0的决策。因为H0与H1是 对立的,既然拒绝H0 ,就只能接受H1 。
2.计算统计量
t检验的统计量t
t x 0 14.3 14.1 0.236
s / n 5.08 / 36
自由度: n 1 36 1 35
3.确定P值 P值的意义是: 如果总体状况和H0一致,
统计量获得现有数值以及更不利于H0的数值的可
能性(概率)有多大?
自由度为35 ,查附表2,得到:
例7-3 两种方法测定血清Mg2+ (mmol/l)的结果
试样号
甲基百里酚蓝法
葡萄糖激酶法
差值
1
0.94
0.92
-0.02
2
1.02
1.01
-0.01
3
1.14
23
1.22
-0.01
5
1.31
6
1.41
1.32
0.01
1.42
假设检验的基本思想和一般步骤

假设检验的基本思想和一般步骤
检验(hypothesis testing)是统计学中常用的一种方法,用于得出对某一性
质具有一定证据基础的结论。
它以假设检验为基础,将统计学原理用于科学研究,以检验一些假设或猜测是否可以被科学地接受。
检验的基本思想是找出统计数据中与原假设不相符合的内容,即在实践结果中
发现与假设不符的结果,证明我们的假设正确或错误。
然而,有时实践中的结果并不能完全证明或排除假设,这时候就要利用统计学方法来做检验,以定量分析参数的趋势,从而给出统计学上的结论。
一般的检验步骤主要分为以下几步:
1、确定必要的基础信息:需要采集一定样本数据,研究对象,所测参数及其
标准。
2、建立假设:根据大致了解的思路,建立正态分布假设,或者拟合度等参数,观察收敛性。
3、求事实统计量:计算有关参数,以显示差别程度。
4、计算置信水平:利用某个置信度,例如95%,用数值检验假设对比,验证
是否可能出现异常结果。
5、做出结论:根据检验的结果,得出假设的可行性。
从而,通过假设检验来检验假设,可以更加客观地得出结论,增强科学研究的
权威性,提高研究水平。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
26/114
单样本资料的t检验
单样本资料的t检验(样本均数与总体均数比较的t 检验)实际上是推断该样本来自的总体均数µ 与已 知的某一总体均数µ (常为理论值或标准值) 有 0 无差别。 在进行样本均数与总体均数比较中,需要建立一 个统计量,根据样本所属不同总体,该统计量的 分布也不同,由此作出相应的统计推断。
x 0 x 0 74.2 72.0 t 1.833 s 6.0 sx n 25
31/114
样本均数与总体均数比较
3.确定p值,判断是否应该拒绝
查t界值表,临界值t0.05/2,24=2.064,检验统计量
t=1.833<2.064不是小概率事件,对于一14
故0.005>P>0.002。按水准,拒绝H0, 接受H1, 差异有统计学意义。
两独立样本资料的t检验 independent samples t-test
适用于比较按完全随机设计而得到的两组资料,比较的目 的是推断它们各自所代表的总体均数和是否相等。
两总体方差齐性,即总体方差相等。 1 2
假设检验基础
学习要点
为什么要进行假设检验?
假设检验的基本步骤
假设检验中的两类错误
假设检验与置信区间的关系
配对t检验与成组t检验对资料的要求
二项分布近似服从正态分布条件与分析方法
正态近似法分析泊松分布问题
2/114
统计资料处理 统计描述(statistical description)
的脉搏数不同?
4/114
某医生测量了36名男性铅作业工人的血红蛋白含
量,均数为130.8g/L,标准差为25.74g/L, 正常男性血红蛋白含量一般为140g/L, 铅作业工人的血红蛋白含量与正常人有无不同?
5/114
根据以往的资料得知A、B两校男生50米跑成 绩的标准差分别为0.4秒和0.2秒。今从两校中分 别抽测了25名和28名男生,其50米跑平均成绩分 别为8.1秒和7.9秒。问两校男生50米跑水平是否 相同?
统计推断 (statistical inference)
1、参数估计estimation of parameter 2、假设检验 hypothesis testing
3/114
根据大量调查,已知健康成年男子脉搏均数为72次/分钟 某医生在一山区随机测量了25名健康成年男子脉搏数, 求得其均数为74.2次/分钟,标准差为6.5次/分钟, 能否认为该山区成年男子的脉搏数与一般健康成年男子
8.0867 6.812 / 8 Sd 0.572 ( mol / g ) 8 1 0.851 t 4.208 0.572 / 8
查表,t0.005/2,7=4.029, t0.002/2, 7=4.785, 现t0.005/2,7<t< t0.002/2,7 ,
可认为不同饲料的大白鼠肝中维生素A含量有差别,正常饲料的
样本均数与总体均数比较
上述两个均数不等既可能是抽样误差所致,也有可 能真是环境差异的影响,做假设检验。 因为σ未知,可用t检验,检验过程如下:
1. 建立假设 H0:µ 0=72次/分,H1:µ≠µ0, =µ
检验水准α为0.05。
30/114
样本均数与总体均数比较
2. 计算统计量 进行样本均数与总体均数比较的u检验,计算u值
第一步:提出一对检验假设, (1)无效假设null hypothesis, H0,又称零假设、原假设 (2)备择假设 alternative hypothesis, H1 。
H0:假设两总体均数相等。(即样本与总体或样本与样本间 的差异是由抽样误差引起的) H1:假设两总体均数不相等。(即两总体间存在本质差异)
成立。然后H0成立的条件下计算检验统计量,最后获得p
值来判断。
1、若p为小概率,则认为假设不成立; 2、若非小概率,则还不能认为假设不成立。 该结论的正确性是冒着5%的错误风险。 假设检验有自己独特的逻辑和统计学思维方式。
12/114
μ=173.2 173.83
176.5
13/114
假设检验的基本步骤
2、如果差别较大,则有可能不是抽样误差,而是来自的总体不
同。
10/114
假设检验是用来判断样本与样本,样本
与总体的差异是由抽样误差引起还是本
质差别造成的统计推断方法
11/114
假设检验理论基础
假设检验理论基础---利用小概率反证法思想,从问题的
对立面(H0)出发,间接判断要解决的问题(H1)是否
或者 H0:μ=μ0;H1:μ<μ0 (单侧检验)
16/114
对于假设检验,需注意:
检验假设是针对总体而言,而不是针对样本;
H0与H1是相互对立、相互联系的,最后的结论 是根据H0与H1做出的,两者缺一不可;
Ho是无效假设,假设常常是两个或多个总体参数 相等、或之差为0、或….无效、或某资料服从某 一特定分布;
样本均数与总体均数不等,有两种可能: 由抽样误差所致 两者来自不同的总体
9/114
本例目的是判断是否μ≠μ0,但直接判断很困难。但可以利用
反证法思想,从μ=μ0出发,间接的判断是否μ≠μ0. 假设μ=μ0 ,判断由于抽样误差造成 x 与μ0差别可能性有多 大? 1、如果 x 与μ0接近,其差别是抽样造成的可能性就很大;
d 2 d n n 1
2
710 (16 ) 2 12 7.91(k g) 12 1
t
| 1.33 | 7.91 12
0.58
(3)确定 P 值,作出推断结论 , =n-1=12-1=11, 查 附 表 2 , t 界 值 表 , 得 单 侧 t0.05/2 , 11=2.201, 现 t=0.58 <t0.05/2,11=2.201,故P > 0.05。按α=0.05 水准,不拒绝H0, 差异无统计学意义。 结论:故尚不能认为该减肥药有减肥效果。
43/114
23.01
(1)建立检验假设 H0:μ1 =μ2 ,即病人与健康人的尿中17酮类固醇的 排出量相同 H1: μ1 ≠μ2 ,即病人与健康人的尿中17酮类固醇的 排出量不同 α =0.05 (2)计算t值
14/114
某医生测量了36名男性铅作业工人的血红蛋白含
量,均数为130.8g/L,标准差为25.74g/L, 正常男性血红蛋白含量一般为140g/L,铅作业工 人的血红蛋白含量与正常人有无不同?
15/114
假设检验分为单、双侧检验
H0:μ=μ0;H1:μ≠μ0(双侧检验) 或者:
H0:μ=μ0;H1:μ>μ0 ;(单侧检验)
H1的内容直接反映了检验的单、双侧。
17/114
设定检验水准(size of test ) α常为0.05
第二步:选定统计方法,计算出统计量的大小。
根据资料的类型和特点,可分别选用t检验,则计算t值,
z检验则计算z值,或其他检验方法:秩和检验和卡方检验等。
x 0 t sx
18/114
2
2
,用t检验
t
X1 X 2 S X1X 2
S X1X 2
1 1 2 n1 n2 S Sc n n n n 2 1 1 2
2 c
2 (n1 1) S12 (n2 1) S 2 S c2 n1 n2 2
2
36/114
(1)建立检验假设 H0:μd=0, 即该减肥药无效; H1:μd≠0 ,即该减肥药有效。 α=0.05 (2)计算t值
本例n = 12, Σd = -16,Σd2 = 710,
差值的均数=Σd /n = -16/12 = -1.33(kg )
37/114
Sd
19/114
20/114
第三步:根据统计量的大小及其分布确定检验假设成立的
可能性P的大小并判断结果。
拒绝域
拒绝域
( t,z,F,x2 )
21/114
( t,z,F,x2 )
22/114
23/114
t / 2 ,
P值是指在H0成立的条件下,获得等于及大于(或 小于)现有统计量的概率。当求得统计量后,一般 可根据有关统计用表查得P值。例如t检验中, │t│≥ t / 2, ,则P≤α;│t│< t / 2 ,, 则P > α 。
38/114
某单位研究饮食中缺乏维生素E与肝中维生素A含
量的关系,将同种属的大白鼠按性别相同,年龄、
体重相近配成8对,并将每对中的两只大白鼠随
机分到正常饲料组和维生素E缺乏组,然后定期
将大白鼠杀死,测得其肝中维生素A的含量如表。
问不同饲料组的大白鼠肝中维生素A含量有无差
别?
39/114
40/114
42/114
n1 n2 2
例3.9 测得14名慢性支气管炎病人与11名健康人的尿
中17酮类固醇(mol/24h)排出量如下,试比较两组
人的尿中17酮类固醇的排出量有无不同。 原始调查数据如下:
病
人X1:n=14;
10.05 18.75 18.99 15.94 13.96 17.67 20.51 17.22 14.69 15.10 9.42 8.21 7.24 24.60 健康人X2:n=11; 17.95 30.46 10.88 22.38 12.89 13.89 19.40 15.83 26.72 17.29
34/114
t检验的公式为:
| d d | | d 0 | |d | t Sd Sd n Sd n
例题 设有12名志愿受试者服用某减肥药,服药前
和服药后一个疗程各测量一次体重(kg),数据如表 所示。问此减肥药是否有效?