4假设检验

合集下载

4 假设检验和t检验

4 假设检验和t检验

t
2.671
17905113912 /11101971 9462 / 9 ( 1 1)
11 9 2
11 9
=n1+n22=11+9-2=18
(3)确定P值,作出推断结论
以=18,查 t 界值表得 0.01<P<0.02。按=0.05 水
准,拒绝 H0,接受 H1,差异有统计学意义。可以认为 两种饲料对小鼠的体重影响不同。
(2)计算检验统计量
本例n=12,d=53,d2=555,
d d 53 4.42 n 12
sd
d2 (
d)2 / n
555 (53)2 /12 5.40
n 1
12 1
t d 4.42 2.83 sd / n 5.40 / 12
12 1 11
(3)确定P值,作出推断结论
(1)建立检验假设,确定检验水准
H0:1=2 即两组小鼠的体重总体均数相同 H1:1 2 即两组小鼠的体重总体均数不相同 =0.05
(2)计算检验统计量
126.45 105.11
t
2.671
(111)17.762 (9 1)17.802 ( 1 1)
11 9 2
11 9
126.45 105.11
型)选择相应的检验统计量。 如 t 检验、z检验、 F检验和 2 检验等。
本例采用t检验方法 t X X X 0 , n 1
SX S n S n
本例t值为1.54
3. 确定P值,做出推断结论
是指查根表据得所到计检算验的用检的验临统界计值量,确然定后H将0成算立得的可 能性的大统小计,量即与确拒定绝在域检的验临假界设值条作件比下较由,抽确样定误P差引 起差值别。的如概对率双。侧 t 检验 | t | ,则 tα/2(ν) P α ,按检

《六西格玛课程》Unit-4分析 4.4 假设检验

《六西格玛课程》Unit-4分析 4.4 假设检验
分析(Analyze)阶段
六西格玛断根推进团队
假设检验
( Hypothesis Testing )
假设检验 -1-
Haier Six sigma GB Training-V3.0
路径位置
Define
Measure
Step 9- Vital Few X’的选定
Analyze
Step 7- Data 收集 Step 8- Data 分析 多变量研究 中心极限定理 假设检验 置信区间 方差分析,均值检验 卡方检验 相关/回归分析
的术语,在此差异大的不能合理的随机发生。那里很可能在发生什么特殊事
9、检验功效(Power) - 统计检验的能力,探测出某事很重要时,实际上
某事确实很重要。常被用来决定在处置中样本的大小是否足以探测到存在差异。 零假设不真实时推翻错误零假设的概率, 即能够检出假的零假设的概率。(1-β ) 11.检验统计量(Test Statistic) -一个标准化的数值(z、t、F等),代表错误 确认的可能性,分布于一个已知的方式,以便可以决定这个观察到的数值的概率 通常错误确认越可行,检验统计量的绝对值就越小, 而且在其分布内观察到
么目标就会实现。生产者可以通过检验平均生产时间等于6小时这一假设来评估
其是否具备所需要的生产能力。 2、这个制造商还打算修改工艺流程以减少另一种产品所需要的平均时间。
它通过检验在工艺流程改变前后的平均生产时间是否相同这一假设来评估流程
的修改是否有效。 这两种情况都涉及到对总体均值的检验。假设也可以检验标准差或其他参数。
差异 = 1.3%
统计问题:
反应器2的平均值(85.54)和反应器1的平均值(84.24)的差异是否足以被 认为是显著的? 或者说这两个平均值是否足够接近,可被认为是由于偶然因 素或日与日之间的散布呢?

人大版统计学 习题加答案第四章 假设检验

人大版统计学 习题加答案第四章 假设检验

第四章 假设检验填空(5题/章),选择(5题/章),判断(5题/章),计算(3题/章) 一、填空1、在做假设检验时容易犯的两类错误是 和2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为 ,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为3、假设检验有两类错误,分别是 也叫第一类错误,它是指原假设H0是 的,却由于样本缘故做出了 H0的错误;和 叫第二类错误,它是指原假设H0是 的, 却由于样本缘故做出 H0的错误。

4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称为 。

5、 假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生的,该原理称为 。

6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm ,标准差为1.6cm ,想知道这批零件的直径是否服从标准直径5cm ,在显著性水平α下,否定域为7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为 。

(用H 0,H 1表示)8、一般在样本的容量被确定后,犯第一类错误的概率为α,犯第二类错误的概率为β,若减少α,则β9、某厂家想要调查职工的工作效率,用方差衡量工作效率差异,工厂预计的工作效率为至少制作零件20个/小时,随机抽样30位职工进行调查,得到样本方差为5,试在显著水平为0.05的要求下,问该工厂的职工的工作效率 (有,没有)达到该标准。

KEY: 1、弃真错误,纳伪错误 2、双边检验,单边检验3、拒真错误,真实的,拒绝,取伪错误,不真实的,接受4、显著性水平5、小概率事件6、1.25>21α-z7、H 0:t≥1000 H 1:t <1000 8、增大 9、有二、 选择1、假设检验中,犯了原假设H 0实际是不真实的,却由于样本的缘故而做出的接受H 0的错误,此类错误是( )A 、α类错误B 、第一类错误C 、取伪错误D 、弃真错误 2、一种零件的标准长度5cm ,要检验某天生产的零件是否符合标准要求,建立的原假设和备选假设就为( )A 、0:5H μ=,1:5H μ≠B 、0:5H μ≠,1:5H μ>C 、0:5H μ≤,1:5H μ>D 、0:5H μ≥,1:5H μ< 3、一个95%的置信区间是指( ) A 、总体参数有95%的概率落在这一区间内 B 、总体参数有5%的概率未落在这一区间内C 、在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D 、在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数4、假设检验中,如果增大样本容量,则犯两类错误的概率( ) A 、都增大 B 、都减小 C 、都不变 D 、一个增大一个减小5、一家汽车生产企业在广告中宣称“该公司的汽车可以保证在2年或24000公里内无事故”,但该汽车的一个经销商认为保证“2年”这一项是不必要的,因为汽车车主在2年内行驶的平均里程超过24000公里。

4假设检验练习题

4假设检验练习题

第四章 假设检验练习题一、单项选择题1、假设检验主要对()进行检验。

A 、总体参数B 、样本参数C 、统计量D 、样本分布2、参数估计是依据样本信息推断未知的()。

A 、总体参数B 、样本参数C 、统计量D 、样本分布3、小概率事件,是指在一次事件中几乎不可能发生的事件。

一般称之为“显著性水平”,用α表示。

显著性水平一般取值为()。

A 、5%B 、20%C 、30%D 、50%4、假设检验的依据是()。

A 、小概率原理B 、中心极限定理C 、方差分析原理D 、总体分布5、大样本情况下,当总体方差已知时,总体均值检验的统计量为()。

A 、xB 、x C、p -D 、x 6、大样本情况下,当总体方差未知时,总体均值检验的统计量为()。

A、 B、 C、p -D 、 7、小样本情况下,当总体服从正态分布,总体方差已知时,总体均值检验的统计量为()。

A 、xB 、xC 、p - D、x 8、小样本情况下,当总体服从正态分布,总体方差未知时,总体均值检验的统计量为()。

A、x B、xC 、p -D 、x 9、一种机床加工的零件尺寸绝对平均误差允许值为1.35mm 。

生产厂家现采用一种新的机床进行加工以期进一步降低误差。

为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某于生产的零件中随机抽取50个进行检验,得到50个零件尺寸的绝对误差数据,其平均差为1.2152,标准差为0.6365749。

利用这些样本数据,在α=0.05水平下,要检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低,提出的假设应为()。

A 、H 0:μ=1.35 H 1: μ≠1.35B 、H 0:μ≤1.35 H 1: μ>1.35C 、H 0:μ≤1.35 H 1: μ>1.35D 、H 0:μ≠1.35 H 1: μ=1.3510、在大样本时,总体比例检验统计量用z 统计量,其基本形式为()。

A、xB 、x C、p -D 、x 二、多项选择题1、小概率事件,是指在一次事件中几乎不可能发生的事件。

第4章 假设检验(田间试验与统计分析 四川农业大学)

第4章 假设检验(田间试验与统计分析 四川农业大学)



2 2

2
s2 1
s2 2
Hale Waihona Puke s2 es2 e
df1
s2 1
df1

df
2
s
2 2
df2
s2 e

5 2.412 4 3.997 54

3.1164
1.提出假设
H0 :1=2; HA :1≠2 。
2、计算t值
t x1 x2 s x1 x2
s x1 x2
第二节 单个样本平均数的假设检验
在实际研究工作中,常常要检验某样本
所属总体平均数与已知的总体平均数 0 是 否有差异。已知的总体平均数 0 一般为一些
公认的理论数值、经验数值或期望数值。
若σ2已知
u x 0 x
x


n
u检验
s2 若σ2未知
t x 0
sx
sx
s n
x2 1 ( x)2
x x 30.3667(g) s
n
n
2.5328 (g)
n 1
sx
s 0.8443 (g) n
t x 0 30.3667 27.5 3.395
sx
0.8443
df=n-1=9-1=8
t0.05(8) =2.306 t0.01(8) =3.355 | t |=3.395 > t0.01(8)
第四章 假设检验
第一节 假设检验的基本原理 第二节 单个样本平均数的假设检验 第三节 两个样本平均数的假设检验 第四节 百分率资料的假设检验 第五节 参数的区间估计
假设检验(test of hypothesis)又叫显著性 检验 (test of significance),是统计学中的一 个重要内容 。假设检验的方法很多 ,常用的

管理统计学-第4章 假设检验

管理统计学-第4章  假设检验

• 在本例中,
_
x 32 35
3.184
s / n 5.96 / 40
⑤作出统计决策
• 根据样本信息计算出统计量z的具体值,Z 将它与临界值 相比较,就可以作出接受 原假设或拒绝原假设的统计决策。
• 在本例中,由于z=3.184>1.96,落在拒绝 域内,所以拒绝原假设H0。可以得出结论:
在0.05的显著性水平下,抽样结果的平
– p<α,拒绝零假设 – p>α,不应拒绝零假设
举例1
• 某健身俱乐部主管经理估计会员的平均年 龄是35岁,研究人员从2005年入会的新 会员中随机抽取40人,调查得到他们的年 龄数据如下。
33 28 32 26 37 35 27 29 33 30 35 29 39 34 27 37 34 36 31 29 29 26 19 21 36 38 42 39 36 38 27 22 29 34 36 20 39 37 22 39
素有:总体方差已知还是未知,用于进行检验的
样本是大样本还是小样本,等等。
• 在本例中,由于n=40>30是大样本,所以 近似
服从正态分布,以样本标准差代替总体标准差, 所用的统计量是:
_
x
3.184
s/ n
③选取显著性水平,确定接受域和拒绝域
• 显著性水平(Significant Level):事先给定的形 成拒绝域的小概率,用表示。
(3)右单侧检验
两侧,左单侧检验的拒绝域位于统计量分布曲线的左侧,
右单侧检验的拒绝域位于统计量分布曲线的右侧。
④计算检验统计量的值
• 在提出原假设H0和备选假设H1,确定了检验统计 量,给定了显著性水平以后,接下来就要根据

5.4假设检验概述

5.4假设检验概述

当总体中有多个未知参数时, 当总体中有多个未知参数时,即
X ~ F ( x; θ1 ,θ 2 ,...,θ k )
如果只对其中一个参数 提出假设, 进行检验, 如果只对其中一个参数 提出假设, 进行检验, 称为单参数假设检验;如果对其中多个参数 称为单参数假设检验;如果对其中多个参数 一起 单参数假设检验 提出假设,进行检验, 称为多参数假设检验. 多参数假设检验. 提出假设,进行检验, 称为多参数假设检验
α
2
y = f ( x)
接受域越大 “纳伪”的概率越大 纳伪” 纳伪 降低检验的功效. 降低检验的功效.
1 −α
−λ
α
2
λ
拒绝域 接受域 拒绝域
通常事先给定显著性水平α来控制犯第一类错误 通常事先给定显著性水平α来控制犯第一类错误 显著性水平 的概率, 犯第二类错误的概率. 的概率, 再设法尽可能减少犯第二类错误的概率.
在例2中, 对总体期望作假设检验时, 对总体期望作假设检验时, 在例2 H 0 : µ1 = µ2 H 1 : µ1 ≠ µ2 对方差作假设检验时, 对方差作假设检验时, H 0 : σ 12 = σ 22 H 1 : σ 12 ≠ σ 22 在例3 在例3中, H 0 : X ~ P (λ ) 不服从P( P(λ H1 : X不服从P(λ)
拒绝域 接受域 拒绝域
“弃真”的概率越小 弃真” 弃真
α
2
y = f ( x)
α
2
1பைடு நூலகம்α
−λ
λ
纳伪” “弃真” 弃真” 弃真 为第一类错误; “纳伪” 为第二类错误. 为第一类错误; 纳伪 为第二类错误. 第二类错误的概率, 设β为 犯第二类错误的概率,则1-β为 不犯第二类错误的概率, 称为检验的功效. 不犯第二类错误的概率, 称为检验的功效 第二类错误的概率 功效. α越小 1-α越大

第4章假设检验习题解答

第4章假设检验习题解答


25.设总体 X ~ N ( µ , σ ), 其中µ , σ 都未知 . X 1 , X 2 ,L , X n 为来自该总体的一个样 本.记 X =
1 n 1 n Xi, S2 = ( X i − X ) 2 .则检验假设 H 0 : µ ≤ 2 ∑ ∑ n i =1 n − 1 i =1
H 1 : µ > 2 所使
接受H 0

验结论为接受 H 0 ,则在显著性水平为 0.01 下检验结论一定为
24. X ~ N ( µ , 225) ,样本 ( X 1 , X 2 , L X n ) 来自正态总体 X , X 与 S 2 分别是样本均 值与样本方差,要检验 H 0 : µ = µ0 , 采用的统计量是
2 2
X − µ0 15 / n
2. 假设检验中的显著性水平 α 用来控制( A A.犯“弃真”错误的概率. C.不犯“弃真”错误的概率. 3.假设检验中一般情况下( C A. 只犯第一类错误. C. 两类错误都可能犯.
B.犯“纳伪”错误的概率. D.不犯“纳伪”错误的概率. ) .
B. 只犯第二类错误. D. 两类错误都不犯.
4. 假设检验时,当样本容量一定,若缩小犯第一类错误的概率,则犯第二类错误的概 率( B ) . A. 变小. B. 变大. C. 不变. D. 不确定.
检验 P -值: P-value = P ( Z > 1.5 ) = 0.0668 > 0.01 接受 H 0 ,认为这批钢索质量没有显著提高. ,技术革新后,抽出 6 个零件, 35.由经验知某零件质量 X ~ N (15, 0.05 ) (单位:g) 测得质量为: 14.7, 15.1, 14.8, 15.0, 15.2, 14.6. 已知方差不变, 问平均质量是否仍为 15g? 试求问题的 P-值,若取显著性水平 α = 0.05 ,有何结论. 解: H 0 : µ = 15
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

P ( t / 2, t t / 2, ) 1
1- /2
P ( t t / 2, ) /2-t/2, v0
t/2, v
假设检验
Hypothesis Test
主要内容:
□假设检验的目的
□假设检验的原理和步骤 □均数比较的假设检验 □假设检验时应注意的问题 □第一类错误和第二类错误
t
X 0 s n

5.1 4.6 0.88 25
2.841
统计量 t 表示:在标准误的尺度下,样本均 数与总体均数 0 的偏离。这种偏离称为标准t离 差(standard t deviation)。
理论基础:t 分布
X sX
P(2.064 t 2.064) 0.95
问题:该单位食堂炊事员的平均血清总胆固醇的均 数是否与健康成年男子血清总胆固醇的均数 相同 。
解决办法
假设检验的基本思想
提出一个假设(H0); 验证这个假设。 如果假设成立,会得到现在的结果吗? 两种可能的情况: – 1)得到现在的结果可能性很小(小概率) – 拒绝H0 – 2)有可能得到现在的结果(不是小概率) – 没有理由拒绝H0
步骤3:计算检验统计量(statistics for test) 检验统计量衡量样本与总体的差别或偏离程度
点估计量-假设值 标准化检验统计量 点估计量的抽样标准差
样本均数与总体均数0 间的差别常用统计量t表示:
t
X 0 s n
X 本例中已知 n=25, =5.1(mmol/l), s=0.88(mmol/l), 0=4.6(g/l),则检验统计量t:

Why matched?
一般奶粉 强效助长奶粉 基础营养

=
A组
B组
当个体间的差异不均匀时,将差异较小的 个体配对,分别给予不同的处理,以保证两组间 的均衡可比性。 –自身配对:服药前后;手术前后 –异体配对:双胞胎;品系;来自相同的区域
研究者关心的变量常常是对子的效应值而不 是各自的效应值,所以,配对t检验的实质就是 检验样本差值的总体均数是否为0。
医学统计学
—Medical Statistics
Department of Epidemiology & Biostatistics
School of Public Health Nanjing Medical University
Review:
统计推断(statistical inference)
先(根据研究目的)对总体参数提出某 种假设,然后利用样本信息判断假设是否成立的 过程,称为假设检验。
R.A.Fisher
Example 15 :
样本:随机抽查25名成年男炊事员的血清总胆固醇 均数为5.1mmol/L,标准差为0.88mmol/L。 总体:大规模调查表明健康成年男子的平均血清总 胆固醇为4.6mmol/L
成组设计计量资料比较的t检验:
Example 17 (P58例4.7) 某医生研究转铁蛋白对病毒性肝炎诊断的 临床意义,测得12名正常人和13名病毒性肝炎 患者血清转铁蛋白含量(g/dl),结果如下 – 正常组 均数 273.18 标准差 9.77 – 肝炎组 231.86 12.17 问患者和正常人转铁蛋白含量是否有差异?
请思考:若P>0.05,说明什么?
若P>0.05,说明在H0成立的前提下出现 现有差别或更大差别的可能性P(| t | ≥2.841)不 是小概率事件,因此,没有理由拒绝H0。
可见,抉择的标准为:
– 当P≤ 时,拒绝H0,接受H1;
– 当P> 时,不拒绝H0。
假设检验的步骤:
□建立假设(在假设的前提下有规律可循);
平均Hb含量与正常女性不同。
结论的表述:
资料表明,25名女性患者的平均血红蛋 白含量为150±16.5(g/L),其95%可信区间为 (143.1891,156.8109),与正常女性差异有统 计学意义( t = 5.5454, P < 0.0001),女性患者
的平均Hb高于正常女性。
配对设计计量资料的t检验
– 查自由度为24的t界值表
P=P(| t | ≥2.841)<0.05
步骤5:作结论(根据小概率原理): □P>0.05, 不是小概率事件,没有足够的理由拒绝 H0
□P≤0.05, 即手头样本从所设总体随机获得的机会
≤0.05,为小概率事件,拒绝 H0,接受 H1。
(注意统计结论与专业结论相结合) 本例P<0.05,按 =0.05的水准,拒 绝H0,接受H1,差别有统计学意义。认 为该单位炊事员血清总胆固醇平均水平高 于正常人。
如何利用样本值对一个具体的假设进行检验?
通常借助于直观分析和理论分析相结合的
做法,其基本原理就是人们在实际问题中经常采 用的所谓实际推断原理: “小概率原理: 一般认 为,小概率事件(rare event)在一次试验中是不 可能发生的。”
下面结合实例来说明假设检验的基本思想.
2、假设检验的原理:
是本质上的差异还是抽样误差?
成组设计
将受试对象完全随机分入两组,接受两 种不同的处理: – 试验组与对照组,新药组与传统药组
从两个总体中完全随机地抽取一部分个 体进行比较:男性与女性,中国人和日本人
问题:
正常人组
1=?
肝炎组
2=?
均 数: 273.18 标准差: 9.77
均 数: 231.86 标准差: 12.17
s X1 X 2 1 1 s ( ) n1 n2
2 C
(2)
t
273.18 231.86 122.93 1 12 3
(t 因此P ﹤0.01
9.31
2.807)
0.01,23 =
(3) t﹥t
0.01,23 ,
(4) 按=0.05水准,拒绝H0,接受H1 。
差别有统计学意义,可以认为病毒性肝炎患 者的转铁蛋白含量总体均数较正常人低。
(2) 计算检验统计量 t
t
50 4.03 10
3.923
自由度=9。(t 0.005,9 = 3.690、 t 0.002,9 = 4.297)。
分析策略:差值均数与0比较
(3) 确定 P 值。
0.002< P < 0.005。
(4) 作结论: 按检验水准0.05,拒绝H0 ,接受H1 ,差别 有统计学意义,可以认为高血压患者疗前疗 后舒张压有差别。
– 零假设(null hypothesis),记为H0,表示目前的 差异是由于抽样误差引起的; – 备择假设(alternative hypothesis),记为H1,表 示目前的差异主要是由于本质上的差别引起 的
H0: = 0,该单位炊事员与正常人的平均血清 总胆固醇相等; ―随机误差‖ H1:≠ 0 ,该单位炊事员与正常人的平均血清 总胆固醇不等。 ― 本质上的差别‖ H0假设比较单纯、明确,且在该假设的前提 下就有规律可寻。而H1假设包含的情况比较复杂。 因此,检验是针对H0的。
□确定检验水准(确定最大允许误差);
□计算检验统计量(样本与总体有多大的偏离);
□计算概率P (该样本是否支持零假设);
□作结论(根据小概率原理)。
3、均数比较的假设检验:
□样本均数与总体均数的比较 □配对设计样本均数的比较 □两样本均数的比较
□双侧检验 □单侧检验
样本均数与总体均数比较的t检验
Example 16(P55例4.5):
受试者号 (1) 1 2 3 …… 9 疗前 (2) 94 102 110 …… 108 疗后 (3) 88 92 106 …… 102 差值d (4)=(3)-(2) 6 10 4 …… 6
10
合计
104
100
4
50
分析策略:差值均数与0比较
(1) H0 : d=0, 疗前疗后舒张压相同; H1 : d≠0,疗前疗后舒张压不同。 =0.05。
n)

参数估计(parameter estimatio
假设检验(hypothesis test)
统计推断的理论基础:抽样分布
★均数的抽样分布 □中心极限定理表明
从任何总体中抽样,样本均数的抽样分布 近似正态分布。
□ t分布 X t ~ t 分布 sX ★率的抽样分布
可信区间估计的理论基础:均数的抽样分布规律
数为150(g/L),标准差为16.5(g/L)。而该地正常成年
女性的Hb均数为132(g/L)。问该病女性患者的Hb含
量是否与正常女性Hb含量不同?
目的:
推断病人的平均血红蛋白(一未知总体均数 )与正常女性的平均血红蛋白(已知总体均数0) 间有无差别
μ =μ
0

从资料提供的信息来看,样本均数150 与总体均数132不相等,其原因可有以下 两个方面:
1)建立假设,确定检验水准:
H0 : 1= 132; H1 : 1 132 =0.05。
2)计算检验统计量: 3)确定P 值:
t
150 132 16.5 25
5.4545
P < 0.05
4)作结论: 按=0.05水准,拒绝H0 ;接受H1 。
差别有统计学意义。可以认为女性患者的
从资料提供的信息来看,样本均数5.1与总体 均数4.6不相等,其原因可有以下两个方面: 其一:抽样误差 (偶然的、随机的、较小的) 其二:本质上的差别 (必然的、大于随机误差) 两种情况只有一个是正确的,且二者必居其 一,需要我们作出推断。
假设检验的步骤:
步骤1:建立假设 根据统计推断的目的对总体参数提出假设
P(t 2.064) P(t 2.064) 0.05
0.025 0.025
相关文档
最新文档