第45-46讲方差的假设检验知识分享
假设检验与方差分析概述(ppt 33页)

显著水平的运用:t 统计量
• t 统计量的定义
– 假定总体服从正态分布,用样本标准差s作为总体标准 差δ的估计值,则样本平均值服从t分布,可以用t 分布 的值(简称t值)判断样本平均值相对于总体平均值的 误差程度
t x. 其中 x为样本均为 值总 ,体均 n为 值样 ,本
s/ n 个体数s量 为, 样本的标 , s/准n为 差样本均值的标准
– 单边检验(只检验小于或大于检验值中的一种情况)
• 工厂对收到的一批长度为2cm的零件抽检,检验 长度是否合格?
– 检验假设的设定:设u为平均长度,则 H 0:u2 H 1:u2
– 双边检验(检验小于、大于检验值的两种情况)
假设检验的标准:显著水平
显著水平的定义
– 假设检验中的第一类错误(type I error):拒绝正确的原 假设(H0)
假设检验例(续)
• (1)确定假设和备择假设 H 0: 0 7H 1: 0 7
• (2) 计算要检验的统计量:样本均值 x7.75 • (3)确定显著水平为5% • (4) 查表得t分布的临界值 t0.051.796 • (5)要检验的统计量的|t值|>临界值,所以拒
绝原假设( H0 ):
• 结论是:7.75确实大于7,该柜员是高服务质量
• t分布的主要特点
– 在小样本时随个体数变化,但大样本(比如个体数大 于50)时接近标准正态分布
– 适用范围较小:基于正态分布,故只适用于均值类变 量的假设检验,不适用于方差类
显著水平的运用: t 统计量(续)
• 运用过程如下:
– 假定原假设成立,则样本的统计量(比如样本均值) 服从t分布
– 从t分布表可查出某一显著水平(比如5%)的临界值 t0.05
方差分析原假设

方差分析原假设简介造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。
原理定义方差分析(anova)又称“变异数分析”或“f检验”,就是由罗纳德·费雪爵士发明者的,用作两个及两个以上样本均数差别的显著性检验。
原理方差分析的基本原理就是指出相同处置组的均数间的差别基本来源存有两个:(1) 实验条件,即不同的处理造成的差异,称为组间差异。
用变量在各组的均值与总均值之偏差平方和的总和表示,记作ssb,组间自由度dfb。
(2) 随机误差,例如测量误差导致的差异或个体间的差异,称作组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和则表示,记作ssw,组内自由度dfw。
总偏差平方和 sst = ssb + ssw。
组内ssw、组间ssb除以各自的自由度(组内dfw =n-m,组间dfb=m-1,其中n为样本总数,m为组数),获得其均方msw和msb,一种情况就是处置没促进作用,即为各组样本均源自同一总体,msb/msw≈1。
另一种情况就是处置的确存有促进作用,组间均方就是由于误差与相同处置共同引致的结果,即为各样本源自相同总体。
那么,msb\ue\uemsw(远远大于)。
msb/msw比值构成f分布。
用f值与其临界值比较,推断各样本是否来自相同的总体。
基本思想方差分析的基本思想是:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
举例分析:下面我们用一个简单的例子来说明方差分析的基本思想:如某克山病区测出11基准克山病患者和13名健康人的血磷值(mmol/l)如下:患者:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健康人:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87问该地克山病患者与健康人的血磷值是否不同?从以上资料可以窥见,24个患者与健康人的血磷值各不相同,如果用离求逆平方和(ss)叙述其紧紧围绕总均值的变异情况,则总变异存有以下两个来源:组内变异,即由于随机误差的原因使得各组内部的血磷值各不相等;组间变异,即为由于克山病的影响使患者与健康人组的血磷值均值大小不等。
假设检验方法

假设检验-1Hypothesis Testing假设检验方法【例】一种机床加工的零件尺寸绝对平均误差允许值为1.35mm 。
生产厂家现采用一种新的机床进行加工以期进一步降低误差。
为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。
利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(α=0.1),数据见:”Parts .mtw ”左侧检验1.061.220.911.971.982.031.011.241.450.990.590.501.500.741.23 1.131.020.951.121.12 1.161.031.121.100.98 1.122.371.540.961.1950个零件尺寸的误差数据(mm)0.821.601.101.000.970.861.231.171.261.381.70 1.641.081.110.941.061.13 1.811.311.261-Sample Z Test —例题应用Minitab 检验假设检验-31-Sample Z Test—习题1. 请打开“1-Sample Z Test .mtw”C1为某钢丝绳索制造商声称其生产的钢丝绳的平均抗断强度为大于5磅,已经知道总体标准差为1,请判断其声明是否正确?注意:Ⅰ.当小样本时(n<25~30),且总体标准差未知时使用1-Sample T Test.使用1-Sample T Test前,一定要检验正态性.如果非正态时,可以考虑:a.增加样本量,达到n≥25.b.使用非参量设计(绿带教程一般不涉及)Ⅱ. 当大样本时(n≥25~30),使用1-Sample Z Test.不一定要求正态性.如果不知道总体标准差时,可以使用样本标准差代替.Ⅲ.当小样本时(n<25~30),但总体标准差已知时,也是使用1-Sample Z Test.注意:小样本时;一定要保证正态性.第一步设定H0和H a1. H0: 钢丝绳的平均抗断强度≤5H a:钢丝绳的平均抗断强度>5磅2. 取α=0.05假设检验-5第二步比较均值结论One-Sample Z: ValuesTest of mu= 5 vs mu> 5The assumed sigma = 1Variable N Mean StDev SE MeanValues 30 5.435 0.984 0.183Variable 95.0% Lower Bound Z PValues 5.134 2.38 0.009因为P小于0.05,所以对立假设成立。
假设检验与方差分析

三、假设检验的步骤
1、提出原假设(null hypothesis)和备择假设 (alternative hypothesis)
原假设为正待检验的假设:H0; 备择假设为可供选择的假设:H1 一般地,假设有三种形式:
(1)双侧检验:
H0 : 0; H1 :0 (2)左侧检验:
这两个例子中都是要对某种“陈述”做出判
断:
例1要判明工艺改革后零件平均 长度是否仍为4cm;
进行这种判断 的信息来自
例2要判明该批产品的次品率是 所抽取的样本
否低于3%。
所谓假设检验,就是事先对总体参数或总体分 布形式作出一个假设,然后利用样本信息来判断 原假设是否合理,即判断样本信息与原假设是否 有显著差异,从而决定是否接受或否定原假设
对比来构造检验统计量。
可以证明,若H0为真,则
2
(n 1)S 2
2 0
~
2 (n 1)
因此,可构造2 统计量进行总体方差
的假设检验。
当H0成立时,S2/02 接近于1,2的 值在一个适当的范围内,
当H0不成立时,S2/02远离1,2的值 相当大或相当小。
在例2中,由于所抽样本只为10,为小样本,因 此无法构造Z统 计量进行总体比例的假设检验。
如果总体X~N(,2),在方差已知的情况下,对总体均 值进行假设检验。
由于
因此,可通过构造Z统计量来进行假设检验:
注意: 如果总体方差未知,且总体分布未知,但如果是大样
本(n>=30),仍可通过 Z 统计量进行检验,只不过总体 方差需用样本方差 s 替代。
例3:根据以往的资料,某厂生产的产品的使用寿命服从正 态分布N(1020, 1002)。现从最近生产的一批产品中随机抽取16 件,测得样本平均寿命为1080小时。问这批产品的使用寿命 是否有显著提高(显著性水平:5%)?
第二节-正态总体均值和方差的假设检验PPT课件

根据第六章定理三知,
当 H 0 为,真 X S/ n 时 0~t(n1 ),
P { 当 H 0为 ,拒 真 H 0 } 绝 P0 X S/n0 k ,
10
得 kt/2(n 1 ),
拒绝 t域 x s/n 0为 t/2(n1).
上述利用 t 统计量得出的检验法称为t 检验法.
故接H受 0,认为金属棒的 无平 显均 著. 长 变
12
例3 某种电子元件的寿命X(以小时计)服从正态
分布, , 2 均为未知. 现测得16只元件的寿命如
下: 152981002112223471972964 223261262851042964081570 问是否有理由认为元件的平均寿命大于225(小时)?
P 2 0 2 (n 1 2 )S 2 (n 0 1 2 )k . (因2 为 0 2 )
要 P { H 0 为 使 ,拒 H 真 0 } 绝 ,
只需 P 2 0 2 令 (n 1 2 )S 2(n 0 1 2 )k .
因(为 n 12)S2~2(n1),所(以 n01 2)k 2(n1),
拒绝域 x的 0k,(形 k待 式 ).定
由标准正态分布的分布函数(•) 的单调性可知,
P {拒H 绝 0|H 0为} 真 P 0(x 0 k )
4
P 0 x /n 00 /k n
1(0/k)n0(/ 0n k)0
0
(/0nk)/ kn,
因此 P { 拒 要 H 0|绝 H 0 控 为 } 制 真 ,
件都尽可能做到相同.先采用标准方法炼一炉, 然
后用建议的新方法炼一炉, 以后交替进行, 各炼了
10炉, 其得率分别为(1)标准方法: 78.1, 72.4, 76.2,
概率统计、方差、假设检验

分组的频数频率分布表
23
(5)画出频率直方图 以样本值x为横坐标,以频率/组距为纵坐 标,在每个小区间上竖起长条矩形。它们相联 形成一张频率直方图。
24
正态概率纸 正态概率纸是一种特殊的坐标纸。其横坐 标是等间隔的,纵坐标是按标准正态分布的累 积概率F(x)=P(u<x)标示的。在这张纸上,任一 正态分布的累积概率呈直线状,而非正态分布 呈各种形式的曲线状。
2
其中μ为正态均值,它是正态分布的中心。σ2是 正态方差,σ >0是正态标准差。方差σ2与标准 差σ都是描述质量特性x随机的分散程度。
8
标准正态分布 μ=0和σ=1的正态分布称为标准正态分布。 记为N(0,1)。服从标准正态分布的随机变 量记为u,它的概率密度函数记为Φ(u)。它 的图形见图:
9
(1)标准正态分布表 它可用来计算形如“u≤u0”的随机事件(简 称事件)发生的概率。 计算公式: P (u ≤ a ) = P (u < a ) = Φ (a ) (2)P (u > a ) = 1 − Φ (a ) (3)Φ (− a ) = 1 − Φ (a ) (4)P (a ≤ u ≤ b ) = Φ (b ) − Φ (a ) (5)P ( u ≤ a ) = 2Φ (a ) − 1
50
一个正态总体的假设检验
μ 1. 已知 σ 2 ,检验H0: = μ 0 ,H1:μ ≠ μ 6
14
总体与样本 总体与个体 把研究对象的全体称为总体,把构成总体 的每个成员称为个体。 统计学关心的是研究对象(即个体)的某 个数量指标,那么将每个研究对象的数量指标 x称为个体,指标值的全体看作一个总体。
15
样本 从总体中抽取部分个本所组成的集合称为 样本。样本中的个体称为样品,样品的个数称 为样本容量或样本量。 满足下面两个条件的样本称为简单随机样 本,又简称样本。 (1)随机性 (2)独立性,从总体中抽取的每个样品对其 它样本的抽取无任何影响 综上两点,样本x1,x2,…xn可以看作n个 相互独立的,同分布的随机变量,其分布与总 16 体分布相同。
假设检验方法----方差齐性检验、方差分析34页PPT

假设检验方法----方差齐性检验、方差 分析
6、法律的基础有两个,而且只有两个……公平和实用。——伯克 7、有两种和平的暴力,那就是法律和礼节。——歌德
8、法律就是秩序,有好的法律才有好的秩序。——亚里士多德 9、上帝把法律和公平凑合在一起,可是人类却把它拆开。——查·科尔顿 10、一切法律都是无用的,因为好人用不着它们,而坏人又不会因为它们而变得规矩起来。——德谟耶克斯
谢谢你的阅读
❖ 知识就是财富 ❖ 丰富你的人生
71、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下去。——康德 72、家庭成为快乐的种子在外也不致成为障碍物但在旅行之际却是夜间的伴侣。——西塞罗 73、坚持意志伟大的事业需要始终不渝的精神。——伏尔泰 74、路漫漫其修道远,吾将上下而求索。——屈原 75、内外相应,言行相称。——韩非
正态总体方差的假设检验

(4). 拒绝域与临界点
当检验统计量取某个区域C中的值时, 我们拒绝原假
设H0, 则称区域C为拒绝域, 拒绝域的边界点称为临界点.
(5). 两类错误及记号
真实情况
所作
(未知)
接受 H0
H0 为真
正确
H0 不真
犯第II类错误
决策 拒绝 H0
犯第I类错误 正确
F0.975 (9,
9) 0.248, 取统计量F
sx2 sy2
2.67 2.12, 1.21
0.248 F 2.12 4.03,
故接受
H0,
认为
2 x
y2.
再验证 x y , 假设 H0 : x y , H1 : x y .
取统计量
犯第一类错误的概率为 当样本容量 n 一定时, 若减少犯第一类错误的概率,
则犯第二类错误的概率往往增大.
若要使犯两类错误的概率都减小, 除非增加样本容量.
(6). 显著性检验
只对犯第一类错误的概率加以控制, 而不考 虑犯第二类错误的概率的检验, 称为显著性检验.
(7). 双边备择假设与双边假设检验
在 H0 : 0 和 H1 : 0 中, 备 择 假 设H1 表 示 可 能 大 于0 , 也 可 能 小 于0 , 称 为 双 边 备 择 假 设, 形 如 H0 : 0 , H1 : 0 的 假 设 检 验 称 为 双 边 假设 检 验.
(8). 右边检验与左边检验
形如 H0 : 0 , H1 : 0 的假设检验 称为右边检验.
分布, 且总体方差相等. ( 0.05)
解 依题意, 两总体 X 和Y 分别服从正态分布
N (1, 2 )和N (2 , 2 ), 1, 2, 2均为未知,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第45-46讲方差的假
设检验
第45-46讲
正态总体方差的假设检验
χ第1节课:单正态总体下方差的假设检验——2
设总体X ~N (μ,σ2),μ未知,检验假设
H 0:σ2=σ02;H 1:σ2≠σ02.
其中σ02为已知常数.
由于样本方差S 2是σ2的无偏估计,当H 0为真时,比值2
2
S σ一般来说应在1附近摆动,而不应过分大于1或过分小于1,由第六章知当H 0为真时
2
χ=22
(1)n S σ-~2χ(n -1). 所以对于给定的显著性水平α有
P {21/2αχ-(n -1)≤2χ≤2
/2αχ(n -1)}=1-α.
对于给定的α,查2χ分布表可求得2χ分布分位点21/2αχ-(n -1)与2
/2αχ(n -1). 则H 0的接受域是
21/2αχ- (n -1)≤2χ≤2
/2αχ (n -1);
H 0的拒绝域为
2χ<21/2αχ-(n -1)或2χ>2
/2αχ(n -1).
这种用服从2χ分布的统计量对个单正态总体方差进行 假设检验的方法,称为2
χ检验法.
例 某厂生产的某种型号的电池,其寿命长期以来服从方差σ2=5000(小时2)的正态分布,现有一批这种电池,从它的生产情况来看,寿命的波动性有所改变,现随机抽取26只电池,测得其寿命的样本方差s 2=9200(小时2).问根据这一数据能否推断这批电池的寿命的波动性较以往有显著的变化(取α=0.02)?
解 本题要求在α=0.02下检验假设
H 0:σ2=5000;H 1:σ2≠5000.
现在n =26,
2/2αχ(n -1)=20.01(25)χ=44.314,
21/2αχ- (n -1)= 20.99(25)χ=11.524,
σ02=5000.
拒绝域为
于是有
P {2χ>2αχ(n -1)}≤P {*2χ>2αχ(n -1)}=α. 可见,当α很小时,{2χ>2αχ(n -1)}是小概率事件,在一次的抽样中认为不可能发生,所以H 0的拒绝域是:
2
χ=22
(1)n S σ->2αχ(n -1)(右检验). 类似地,可得左检验假设H 0:σ2≥σ02,H 1:σ2<σ02
的拒绝域为
2χ<21αχ-(n -1)(左检验).
例 今进行某项工艺革新,从革新后的产品中抽取25个零件,测量其直径,计算得样本方差为s 2=0.00066,已知革新前零件直径的方差σ2=0.0012,设零件直径服从正态分布,问革新后生产的零件直径的方差是否显著减小?(α=0.05)
解 (1) 提出假设H 0:σ2≥σ02=0.0012;H 1:σ2<σ02.
(2) 选取统计量
2
χ=22
(1)n S σ-. *2
χ=
2
2
(1)n S σ-~2χ(n -1),且当H 0为真时,*2χ≤2χ
(3) 对于显著性水平α=0.05,查2χ分布表得
21αχ-(n -1)=20.95(24)χ=13.848,
当H 0为真时,
P {2χ<2
1αχ- (n -1)}≤P 2212
(1)(1)n S n αχσ-⎧⎫-<-⎨⎬⎩⎭
=α. 故拒绝域为
2χ<21αχ- (n -1)=13.848.
(4) 根据样本观察值计算2χ的观察值
2
χ=
2
2
0(1)240.00066
0.0012
n s σ-⨯=
=13.2.
(5) 作判断:由于2χ=13.2<21αχ- (n -1)=13.848,即2
χ落入拒绝域中,所以拒绝H 0:σ2≥σ02,即认为革新后
生产的零件直径的方差小于革新前生产的零件直径的方差.
钟单个正态总体的假设检验可列表如下
与Y 相互独立,2212,σσ未知,试对21σ与2
2σ有无显著差异作假设检验.
①在总体上作假设22012:H σσ=↔22112:H σσ≠
②检验统计量
00*22*2112*22*22 / ~(1,1)H H X X
Y Y
S S F F n n S S σσ==--
③给定显著水平α,存在1212
(1,1)F n n α---和
122
(1,1)F n n α--,使
1212122
{(1,1)}{(1,1)}2P F F n n P F F n n ααα
-<--=>--= 故取拒绝域
1212121212122
(1,1)
{(,,,;,,,)}
(1,1)n n F F n n W x x x y y y F F n n αα-<--=>--L L ④决策:当抽样结果是
121212(,,,;,,,)n n x x x y y y W ∈L L 时,拒绝0H ,认为21σ与22σ有显著差异;否则接受0H ,认为21σ与22σ无显著差异.
例 有两种冶金方法,所得产品中的杂质含量(%)分别为211~(,)X N μσ,222~(,)Y N μσ,且X 与Y 相互独立,各抽取一个子样,杂质含量(%)如下:
问:两种方法生产的产品中所含杂质的波动性有无显著差异(取0.05α=)?
解:①作假设22012:H σσ=↔22112:H σσ≠
②检验统计量 0
*212*2 ~(1,1)H X
Y
S F F n n S =-- ③拒绝域 121212
1212122
(1,1){(,,,;,,,)}(1,1)
n n F F n n W x x x y y y F F n n αα-<--=>--L L ④给定显著水平0.05α=,1213,9n n ==,则查表
可得
120.0252
(1,1)(12,8) 4.20F n n F α--==,
1120.9752
0.025(1,1)(12,8)
110.28(8,12) 3.51
F n n F F α---====。