第九章方差分析
第九章 复习-方差分析及回归分析

s
n j X . j nቤተ መጻሕፍቲ ባይዱ X ij nX 0
j 1 i 1
因此得知SA的自由度是 s -1.
由(1.3),(1.6)及Xij的独立性得知
X ~ N ( , / n)
2
s j 1
(1.14)
E ( S A ) E[ n j X .2j nX 2 ]
j 1
s
(1.13) 可以计算 E( S E ) (n s) 2. SA的统计特性. 它是s个变量 n j ( X . j X )
2
的平方和,且仅有一个线性约束条件:
j 1 s j 1
s
nj
nj ( X. j X ) nj ( X. j X )
j 1 s nj
i 1
( X ij X . j ) 2 / 2 ~ 2 (n j 1)
i 1
nj
(1.11)中各项独立,根据 分布的可加性,得 s
2
S E / 2 ~ 2 ( ( n j 1))
j 1
即S E / 2 ~ 2 ( n s ),
n n j (1.12)
j
Xij - μj可以看成是随机误差. 记为Xij - μj =εij ,
则Xij 可以写为
Xij = μj +εij
εij ~N(0, ζ2),各ε
ij独立
(1.1)
i=1,2,…,nj , j=1,2,…,s
(1.1)称为单因素方差分析的数学模型.
方差分析的任务
X i1 ~ N (1 , 2 ), X i 2 ~ N (2 , 2 ),..., X is ~ N ( s , 2 ) I. 检验s个总体
第九章单因素方差分析

… … … … … … … …
i yi1 yi2 … yij … yin yi. yi.
… … … … … … … …
a
处理间平均 数的差异是 由处理效应 引起的:
ya1 a ya2 … i 1 yaj … yan ya. ya.
( y
i.
y.. )
2
Yi.=∑yij y ..
处理内的变 异是由随机 误差引起:
相差较大,即处理效应比试验误差
试验误差
大得多,说明试验处理影响是很大
的,不可忽视。
1.3方差分析的用途
1. 用于多个样本平均数的比较
2. 分析多个因素间的交互作用 3. 回归方程的假设检验
4. 方差的同质性检验
二、数学模型
假定有a组观测数据,每组有n个观测值,则共有 a na个观测值。 n n
处理 重复
况下的统计假设检验,或者说是平均数差异显著
性检验的一种引伸。
方差分析的 基本功能
对多组样本平均数差异 的显著性进行检验
例:某鱼场按常规方法所育鲢鱼一月龄的平均体长为7.25cm, 标准差为1.58cm,现采用一新方法进行育苗,一月龄时随机抽 取100尾进行测量,其平均体长为7.65cm,
问新育苗方法与常规方法有无显著差异?
方差是离均差平方和除以自由度的商
σ2 =
∑(y-μ)2
N
s2 =
∑(y- y )2
n-1
方差分析的基本思想:引起观测值出现 变异分解为处理效应的变异和试验误差的变 异。
要把一个试验的总变异依据变异来源分
为相应的变异,首先要将总平方和和总df分
解为各个变异来源的的相应部分。
3.1平方和的分解
第九章(一)方差分析

nj
r
nj
2 ( X ij X j )( X j X )
j 1 i 1
nj
数理统计
续(三个平方和的关系)
由于
2 ( X ij X j )( X j X ) 2 ( X j X ) ( X ij X j )
j 1 i 1 j 1 r i 1 r nj r nj
是否成立。而备选假设则为
H1 : 1 , 2 , 3
和4 不全相等
3.上述假设的检验方法就是方差分析
数理统计
二、方差分析原理 1.两类误差及两类方差
⑴.每个水平为一个总体;
⑵.每个水平的一组观察值为总体的一个随机样本, 同一水平下样本观察值之间的差异称为随机误差,用组内 方差来表示; ⑶.不同水平下样本观察值之间的差异可能是由于不
问饮料的颜色是否对销售量产生影响。
表 9-1 超市 1 2 3 4 5 该饮料在五家超市的销售情况 无色 26.5 28.7 25.1 29.1 27.2 粉色 31.2 28.3 30.8 27.9 29.6 橘黄色 27.9 25.1 28.5 24.2 26.5 单位:箱 绿色 30.8 29.6 32.4 31.7 32.8
同水平引起的,这种误差称为系统误差,但也包含随机误
差。不同水平样本观察值之间差异用组间方差来表示,即
组间方差包括随机误差,也包括系统误差。
数理统计
2.方差的比较
⑴.如果不同水平对试验结果没有不同影响,那么组 间方差中只包括随机误差,这时,组间方差与组内方差应 该相近,组间方差与组内方差之比接近 1; ⑵.如果不同水平对试验结果有不同影响,那么组间 方差除了随机误差之外还包括系统误差,这时,组间方差 就会大于组内方差,组间方差与组内方差之比就会大于 1; ⑶.方差分析就是通过这种方差的比较,作出接受原 假设或拒绝原假设的判断。
第九章方差分析和回归分析

第九章方差分析和回归分析第九章方差分析和回归分析内容提要1、方差分析(1)基本概念方差分析:通过随机抽样及数据处理,检验试验结果是否受试验条件这一类可控制因素显著影响,从而确认对质量指标影响主要来自哪一类因素,即用来鉴别所谓因素效应的有效统计分析方法.因素(因子):人为可以控制的实验条件称为因素或因子.水平:因素或因子的不同等级或因素所处的不同状态称为因素的不同水平. 单因素试验:试验中如果只有一个因素或因子在变化,其它可控条件保持不变,这样的方差试验称为单因素试验.多因素试验:试验中不止一个因素或因子在变化,称为多因素试验.若只有二个因素在变化就叫双因素试验.(2)单因素试验的方差分析设因素A 有j 个不同水平(r j ,,2,1 =),在总的r 个水平下均重复试验i 次(m i ,,2,1 =).每一个水平视为一个独立总体),(~2 j j j N X σμ,每个水平下总的m 次试验结果视为取自j X 的容量为m 的样本),,,,(21mj kj j j X X X X .单因素方差分析的一般方法步骤如下:1)提出待检假设H 0:μμμμ====r 21; 2)列方差计算表9-1,计算2A S 、2E S ; 3)选取建立F 统计量),1(~122r mr r F S S r r mr F EA--?--=,并计算F 统计量的值; 4)对给定的检验水平α,查F 分布表,找到F 统计量的临界值(表值); 5)比较得出结论:① 若计算值F F >临界值),1(r mr r F --α,拒绝H 0,即因素水平影响显著,或有显著影响;② 若计算值F F <临界值),1(r mr r F --α,接受H 0,即因素水平影响不显著或没有显著影响.单因素方差分析见表9-2.表9-1水平试验序号 1A 2A…j A… r A1 x 11 x 12 … x 1j … x 1r 2 x 12 x 22 … x 2j … X 2r … … … … … … … i x i 1 x i 2 … x ij … x ir … … … … … … …∑)(mx m 1x m 2… x mj… x mr∑=??=mi jj x T 11?T 2?T…j T ? …m T ?∑==r j j T x 1 212)(∑=??=m i j jx T21T22T…2jT…2mT∑=?=rj j T T 1 2*∑=?=m i jjxT 12221TT…2jT…2mT∑==rj j T T 1222、回归分析(1)基本概念回归分析:利用样本数据建立起相关变量之间相关关系的数学模型,并应用统计推断的一般法则,对相关关系进行有效的统计分析方法.一元线性回归模型为ε++=bx a Y ,),0(~2σεN 其中,a 、b 称为回归系数.(2)最小二乘法表9-2方差来源离差平方和方差自由度 F 统计量计算值F 临界值(表值)组间2AS12-r S A1-r2)1()(EAS r S r m F --=),1(r mr r F --α组内2E Sr mr S E-2r mr -总变差2TS12-mr S T1-n或1-mr线性回归方程可表示为 x b a y+=,可用最小二乘法求得回归系数的估计值:-=--=∑∑==x b y ax n x y x n y x b ni i ni i i 1221 或-=---=∑∑==x b y ax x y y x x b ni i ni i i ??)())((?121 令-=-=-=--=-=-=-=∑∑∑∑∑∑∑∑========n i n i i i yy n i ni i i i i xy n i n i ni i n i i i i xx y n y y y L y x n y x y y x x L xn x x n x x x L 1122211111221222)())(()(1)(则-==x b y a L L b xx xy ???(3)线性相关显著性检验检验回归方程x b a y+=是否有效,或x 、y 之间线性相关关系是否显著,只要检验回归系数0?=b是否成立.这个问题只存在下面两种可能==≠+=?≠=?=)0?(??)0?(0;??0?ax b y ax b a yb a yb 即,否即是,)2)11)表示y ?与x 无关即y 与x 没有线性相关关系,反过来,若不能否定1),就表示线性相关显著;2)有二种可能,都表示y 与x 之间线性相关关系成立.运用R 检验法进行线性相关显著性检验.R 检验法检验线性相关显著性或回归方程有效性的一般步骤为:1)提出检验假设:0H :0?=b; 2)选用统计量)2(~-=n R L L L R yyxx xy ,并计算R 值;3)在给定α下,查相关系数表得到临界值)2(-n R α; 4)比较得出结论:① 若)2(->n R R α,拒绝0H ,所求回归方程有效或线性相关显著;② 若)2(-<="" ,所求回归方程无效或线性相关不显著.=""> 疑难分析1、怎样区分讨论的问题是方差分析还是回归分析?实际问题所考察的指标y 往往既受因素i x 的影响,又受随机误差的影响.而因素又分为属性的和数量的.属性的因素一般无数量大小可言,只是性质的不同,如:种子的品种、机器的型号、加工的工艺、材料的品质等等.数量的因素,可以在一定范围内取值,如:人的身高、体重,试验的温度,产品的合格率等等.当所考虑的因素是属性时,问题属于方差分析的范围;当所考虑的因素是数量时,问题属于回归分析的范围.例题解析【例1】设某地区酿酒公司下属有1A 、2A 、3A 、4A 共4个酒厂.公司总经理为提高酒的质量,开展质量评优活动,随机地从4个酒厂各抽取3瓶样酒,指定同一名品酒员按事先规定的色、香、味质量标准评分,评分结果的原始数据如表9-3所示.表9-3厂别试验序号 1A 2A 3A 4A1 5 8 7 112 6 9 8 10 36 8 6 12试问:不同酒厂对酒的质量有无显著影响(05.0=α)?解:(1)提出待检假设H 0:μμμμ====r 21;(2)列方差计算表,如表9-4所示. 利用表中最后一列,即(∑)列的数据计算表9-4水平试验序号 1A 2A3A4A1 58 7 11 2 6 9 8 10 368612(∑)∑=??=mi jj x T 117 25 21 33∑==r j j T x 1=96212)(∑=??=mi j jx T 289 625 441 1089∑=?=rj j T T 12*=2444∑=?=mi jjxT 12297 209 149 365∑==rj j T T 122=82033.52444318201*22=?-=-=T m T S E 67.4612 96244431122*2=-?=-?=?mr x T m S A(3)选F 统计量并求F 计算值和临界值)8,3(~38144122222F S S S S F EA E A=?--= 35.2333.5367.468=??=F又查附表5, 07.4)8.3(05.0=F(4)比较得出结论因为)8,3(35.2305.0F F >>=,拒绝H 0,即表示不同酒厂对酒的质量有显著影响.这里αF F >>,可认为因素水平影响特别显著,事实上由原始数据可见,4A 评分特别高,直观上已可判断有显著差异,说明分析的结论是符合实际情况的,也证明了方差分析的科学性.【例2】设有某种创汇商品在国际市场上需求量q (单位:万件),价格p (单位:万美元/件).根据往年市场调查获悉q 与p 之间的一组调查数据如表9-5所示.表9-5价格 p i 2 4 4 4.5 3 4.2 3.5 2.5 3.3 3 需求量 q i6 2 2 1 4 1.5 2.8 5.1 3.4 4.2如果今年该商品预定价为p =4.6(万美元/件),要求根据往年资料建立的q 对p 的回归方程,进行线性相关性是否显著,并预测国际市场上今年的需求量大致为多大?(05.0=α)解:根据样本数据,用最小二乘法求a、b ?的值.04.24.3108.1212.34.31017.97)(1010?222-=?-??-=--=∑∑iiiii p p q p q p b136.104.3)04.2(2.3??=?--=-=p b q a将a、b ?的值代入得到所要求的引例中需求量q 对价格p 的回归方程为 p q04.2136.10?-=. 对所建立的q 对p 的回归方程进行线性相关性显著检验:1)提出待检假设0H :0?=b; 2)选用统计量)2(~-=n R L L L R qqpp qp ,并利用回归计算的结果计算R :因为∑==-=1012268.5)(10i ipp p pL ;63.1110101-=-=∑=i i i pq q p q p L ;∑==?-=-=1012229.23)2.3(103.126)(10i i qq q q L所以 998.09.2368.563.11=?-=R ;3)查附表7得到 632.0)8(05.0=R ; 4)结论∵)2(->n R R α,拒绝0H ,即q 对p 的回归方程有效或线性相关性显著.经检验说明:回归方程p q04.2136.10?-=有效,可以用于预测. 当p =4.6时,国际市场上今年对该商品的需求量大致为:10.136-2.04×4.6=0.752(万件).。
第九章 方差分析修改

498.99
F0.05(2,33)=3.29 F0.01(2,33)=5.34
按 α=0.05水准,拒绝 H0 ,接受 H1 ,差别有统计学意义。
可认为三种饲料喂养大白鼠体重差值总体平均水平不全
相同,即三个总体均数中至少有两个不同。
28
第一节 完全随机设计资料的方差分析
注意:方差分析的结果若拒绝 H0 ,接受 H1 , 不能说明各组总体均数两两间都有差别。如 果要分析哪些两组间有差别,要进行多个均 方差分析的结果与两样本均数比较的t 检验等
方差分析的基本思想就是根据试验设计的类型,
将全部测量值总的离均差平方和及其自由度分解
为两个或多个部分,除随机误差作用外,每个部
分的变异可由某个因素的作用(或某几个因素的交
互作用)加以解释,如组间变异SS组间可由处理因素 的作用加以解释。通过比较不同变异来源的均方, 借助F分布做出统计推断,从而推论各种研究因素 对试验结果有无影响。
察的两因素设计。
31
第二节 随机区组设计资料的方差分析
例9-2 为探索丹参对肢体缺血再灌注损伤的影响,将
30只纯种新西兰实验用大白兔,按窝别相同、体重
相近划分为10个区组。每个区组3只大白兔随机采
用A、B、C三种处理方案,即在松止血带前分别给
予丹参2ml/kg、丹参1ml/kg、生理盐水2ml/kg,在 松止血带前及松后1小时分别测定血中白蛋白含量 (g/L),算出白蛋白减少量如下表9-6所示,问A、B 两方案分别与C方案的处理效果是否不同?
第九章 方差分析
流行病与卫生统计学教研室
1
第九章 方差分析
讲授内容
方差分析的基本思想及应用条件 完全随机设计资料的方差分析 随机区组设计资料的方差分析 析因设计资料的方差分析
第9章方差分析思考与练习带答案讲解

知识是人类进步的阶梯第九章方差分析【思考与练习】一、思考题1. 方差分析de根本思想及其应用条件是什么?2. 在完全随机设计方差分析中SS、、SS且间、SS且内各表示什么含义?3. 什么是交互效应?请举例说明.4. 重复测量资料具有何种特点?5. 为什么总de方差分析de结果为拒绝原假设时,假设想进一步了解两两之间de差别需要进行多重比拟?二、最正确选择题1. 方差分析de根本思想为A. 组问均方大丁组内均方B. 误差均方必然小丁组问均方C. 总变异及其自由度按设计可以分解成几种不同来源D. 组内方差显著大丁组问方差时,该因素对所考察指标de影响显著E. 组问方差显著大丁组内方差时,该因素对所考察指标de影响显著2. 同一两样本均数比拟de资料,方差分析de结果与f检验de结果卜A.理论上不同*完全等价AF PC.完全等价F = F /D不同,,检验de结果更可靠wE.不同,方差分析de结果更可靠3. 完全随机设计de方差分析中,以下式子正确de选项是A.SS皇=$羽十5&时B., A£S t= US.E +A£f a_ +-1c. ss成巧> SS成内+JD,担Sjj闻> MS皿,E一% <54. 总de方差分析结果有P<0.05,那么结论应为A. 各样本均数全相等B. 各总体均数全相等C. 各样本均数不全相等D. 各总体均数全不相等E. 至少有两个总体均数不等5. 对有k个处理组,b个随机区组de资料进行双因素方差分析, 其误差de自由度为A. kb - k - bB. kb - k - b -1C. kb -k - b -2D. kb - k - b 1E. kb -k - b 26. 2 2析因设计资料de方差分析中,总变异可分解为A. MS 总=MS B+MS AB. MS 总=MS B+MS误差C. S&、= SS B SS吴差D. SS = S$ SS SS吴差E. SS、=SS +S& +SS A B +SS吴差7. 观察6只狗服药后不同时间点〔2小时、4小时、8小时和24小时〕血药浓度de 变化,本试验应选用de统计分析方法是A. 析因设计de方差分析B. 随机区组设计de方差分析C. 完全随机设计de方差分析D. 重复测量设计de方差分析E. 两阶段交义设计de方差分析8. 某研究者在4种不同温度下分别独立地重复10次试验,共测得某定量指标de 数据40个,假设采用完全随机设计方差分析进行统计处理,其组问自由度是A. 39B. 36C. 26D. 9E. 39. 采用单因素方差分析比拟五个总体均数得P < 0.05 ,假设需进一步了解其中一个对照组和其它四个试验组总体均数有无差异,可选用de检验方法是A. Z检验B. t检验C. DunnettT 检验D. SNK -q 检验E. Levene 检验三、综合分析题1. 某医生研究不同方案治疗缺铁性贫血de 效果,将36名缺铁性贫血患者随机等分为3组,分别给予一般疗法、一般疗法+药物A低剂量,一般疗法+药物A高剂量三种处理,测量一个月后患者红细胞de升高数〔102/L〕,结果如表9-1所示.问三种治疗方案有无差异?表9-1三种方案治疗一个月后缺铁性贫血患者红细胞de升高数〔102/L〕编亏一般疗法一般疗法+A1 一般疗法+A21 0.81 1.32 2.352 0.75 1.41 2.503 0.74 1.35 2.434 0.86 1.38 2.365 0.82 1.40 2.446 0.87 1.33 2.46 7 0.75 1.43 2.408 0.74 1.38 2.439 0.72 1.40 2.21 10 0.82 1.40 2.45 110.80 1.34 2.38 120.751.462.402. 在药物敏感试验中,欲比拟三种弥散法de 抑菌效果,每种方法均采用三种药 物,观察其抑菌效果,以抑菌环de 直径为观察指标,结果如表 9-2所示,试比拟三种方法de 抑菌效果.表9-2 三种药物在不同弥散法下de 抑菌效果 (mm) 药物 -挖洞27.524.3 20.0 黄艮27.6 24.6 21.0 26.9 25.0 20.627.327.7 20.820.9 24.6 19.1 炒21.2 24.7 19.3 20.5 23.9 18.721.324.818.527.422.0 29.6 青霉素27.6 21.7 30.2 26.9 21.8 29.526.722.330.43. 某试验研究饮食疗法和药物疗法降低高胆固醇血症患者胆固醇de 效果有无差 别,随机选取14名高胆固醇血症患者,随机等分为两组,分别采用饮食疗法和 药物疗法治疗一个疗程,测量试验前后患者血胆固醇含量,结果如表 9-3所示,请问两种疗法降胆固醇效果有无差异.表9-3不同治疗方法下胆固醇变化情况 (mmol/L)4 6.94 6.64 7.31 6.835 9.17 8.42 6.81 6.736 7.61 7.22 8.16 7.657 6.60 6.65 6.98 6.524. 为研究某中学初一年级、初二年级和初三年级学生周日锻炼时间情况,从这三个年级中各随机抽取20名学生,调查得到学生周日锻炼时间如下表9-4所示问这三个年级学生周日锻炼时间是否不同?表9-4初中不同年级学生de锻炼时间〔分〕三年级37.856 59.164 48.77870.793 36.650 51.05786.928 38.511 47.60958.785 48.945 48.42873.923 29.367 42.81461.435 41.988 52.30364.130 69.419 54.32767.169 33.109 35.59149.099 38.872 55.01362.728 53.401 36.08452.534 62.814 21.30745.230 38.454 46.41940.400 32.802 41.83644.399 37.683 37.48133.091 48.944 35.78163.469 48.869 31.35441.704 41.920 45.19062.268 46.859 40.92458.209 65.067 38.87763.319 38.403 27.259经数据分析结果见下表:表9-5 三个年级之间de t检验结果组别t P一年级和二年级2.85 0.0071一年级和三年级4.09 0.0002二年级和三年级1.12 0.2710问:(1)该资料采用de是何种统计分析方法?(2) 所使用de统计分析方法是否正确?为什么?(3) 假设不正确,可以采用何种正确de统计分析方法.请作分析?【习题解析】一、思考题1. 方差分析de根本思想是把全部观察值de总变异按设计和需要分解成两个或多个组成局部,然后将各局部de变异与随机误差进行比拟, 来判断总体均数问de差别是否具有统计学意义.应用条件:各样本是相互独立de随机样本,且服从正态分布,各样本方差齐性.2. S&是各观测值与总均值之差de平方和, 即总离均差平方和,表示总变异de大小;SS且间表示组问变异,指各处理组均值大小de不同,是由处理因素和随机误差造成de;SS且内表示组内变异,指同一处理组内部各观察值之间de变异,是由随机误差造成de.3. 交互效应是指某一因素de效应随另一因素不同水平■de变化而变化,称这两个因素之间存在交互效应.例如:某实验研究A、B两种药物在不同剂量情况下对某病de治疗效果,药物A 在不同剂量时,B药de效应不同,或者药物B在不同剂量时,A药de效应不同,那么A、B两药问存在交互效应.4. 重复测量资料中de处理因素在受试者问是随机分配de,受试者内de因素即时间因素是固定de,不能随机分配;重复测量资料各受试者内de数据彼此不独立, 具有相关性,后一个时间点de数据可能受到前面数据de影响, 而且时间点离得越近de数据相关性越高.5. 方差分析中备择假设是多个总体均数不等或不全相等,拒绝原假设只说明多个总体均数总de 来说差异有统计学意义,并不能说明任意两总体均数之间均有差别.因此,假设希望进一步了解两两问de差异,需进行多重比拟.二、最正确选择题1. C2. C3. A4. E5. D6. E7. D8. E9. C三、综合分析题1.解:此题采用完全随机设计de方差分析表9-6 二种万荣治疗个月后缺铁性贫血患者红细胞de升高数: (102/L)一般疗法一般疗法+A1 一般疗法+A2 合计0.81 1.32 2.350.75 1.41 2.500.74 1.35 2.430.86 1.38 2.360.82 1.40 2.440.87 1.33 2.46X 0.75 1.43 2.400.74 1.38 2.430.72 1.40 2.210.82 1.40 2.450.80 1.34 2.380.75 1.46 2.40n i 12 12 12 36 (n)'X i 9.43 16.60 28.81 54.84( ' X )X i 0.7858 1.3833 2.4008'X i27.4385 22.9828 69.2281 299.6494(、X ) (1) 方差分析1)建立检验假设,确定检验水准H.:即三种方案治疗后缺铁性贫血患者红细胞升高数相同Hi :九、匕、气不全相同,即三种方案治疗后缺铁性贫血患者红细胞升高数不全相同:=0.052)计算检验统计量C =('X)2/N = (54.84)2/36=83.5396-- . —2 _ 2 _SS、= ' (X -X) 八X -C =99.6494-83.5396=16.1098v总=N -1 =36-1=3 5SS且间=' ng -X)2= \' X j)2,n i -C一.2 一一 2 __ __ 2,9.43 16.60 28.81、=(-------- ---------- ----------- )-83.5396 =16.002212 12 12v 组间=k —1 =3—1 = 2S 两内=S&、一S 寄间=16.1098—16.0022= 0.1076v 组内=N —k=33-MS 绢间 SS 祯/v 绢间 F — • = 2452.7216MS 组内SS 且内/v 组内 方差分析结果见表9-7表9-7完全随机资料de 方差分析表3〕确定P 值,作出统计推断查F 界值表〔附表4〕得P<0.01,按a =0.05水准,拒绝H 0 ,接受H 1 ,差异有 统计学意义,可以认为三种不同方案治疗后患者红细胞升高数de 总体均数不全相 同. ⑵ 用Dunnett-t 法进行多重比拟 1〕建立检验假设,确定检验水准H0:任一实验组与对照组de 总体均数相同 H 1 :任一实验组与对照组de 总体均数不同-=0.052〕计算检验统计量MS e =0.0033 n 〔 = n 2 = n 3=12 「「 1 1 1 1S i= \MSe(n T 、「"0033(12 12)=0.02表9-8 多个样本均数de Dunnett-t 检验计算表将表9-8中t D 取绝对值,并以计算 MS e 时de 自由度 *=33和实验组数 a=k-1=2〔不含对照组〕查Dunnett-t 界值表得P 值,列丁表中.按a =0.05水准, 一般疗法+A1与一般疗法相比,疗效差异有统计学意义,可以认为一般疗法+A1与一般疗法治疗缺铁性贫血疗效不同. 同理,可以认为一般疗法+A2与一般疗法治疗缺铁性贫血疗效不同SPSS操作数据录入:翻开SPSS Data Editor® 口,点击Variable View标签,定义要输入de变量, group表示组另U 〔1为一般疗法,2为一般疗法+药物A低剂量,3为一般疗法+ 药物A高剂量〕,x表示患者红细胞de升高数〔102/L〕;再点击Data View标签,录入数据〔见图9-1,图9-2〕.图9-1 Variable View窗口内定义要输入de变量group和x图9-2 Data View窗口内录入数据分析:Analyze Compare Means one-Way ANOV ADependent List 框:xFactor 框:groupPost Hoc—> Equal Variances Assumed:【♦Dunnett: Control Category : firstContinuEOption... r Statistics:I/ Homogeneity of Variances testContinueOK输出结果Test of Homogeneity of Variances(102/L)红细胞升高数(102/L)Multiple Comparisons2 Dependent Variable:红细胞升局数(10 /L)- 一一 _ aa Dunnett t-tests treat one group as a control, and compare all other groups against it.2. 解:此题采用析因设计de方差分析.表9-9 九种不同处理情况下抑菌环de直径(mm)纸片弥散法a〔挖洞弥散a2 钢圈弥散a3稣地青霉素青霉素青霉素合计b1 b2b3 b1 b2b3 b1 b2b327.5 20.9 27.4X 24.3 24.6 22.0 20.0 19.1 29.627.6 21.2 27.6 24.6 24.7 21.7 21.0 19.3 30.226.920.5 26.9 25.0 23.9 21.8 20.6 18.7 29.527.3 21.3 26.7 27.7 24.8 22.3 20.8 18.5 30.4n i 4 44 4 4 4 4 4 4 36 "X i 109.3 83.9 108.6101.698.087.882.4 75.6 119.7866.9n A1212 12n B1212 12、XA301.8 287.4 277.7、XB293.3 257.5316.1(1)建立检验假设,确定检验水准 因素AH o :三种弥散方法抑菌环直径de 总体均数相等H i :三种弥散方法抑菌环直径de 总体均数不全相等 因素B Ho :三种药物抑菌环直径de 总体均数相等 H 1 :三种药物抑菌环直径de 总体均数不全相等 AB 交互作用Ho :不同药物对三种弥散方法de 抑菌效果无影响 H i :不同药物对三种弥散方法de 抑菌效果有影响 :=0.05 (2)计算检验统计量C =(' X)2/N =(866.9)2/36 = 20875.4336 S&、=' X 2 -C =21322.83-20875.4336=447.3964=N —1=36—1 =35283.92 119.72 -+ +川+ )-20875.4336=436.6339 4 4v 处理=k 一1 = 82 -rr -2287土 玄7二)—20875.4336 = 24.50721212% = A de 水平■数-1=22 :109.383.9S —"C=(二2 SS A 八(' XAf.'nA-CT 30!812MS A=竺=24507= 12.2536 '••A22Q3 32257 52316 12SS B (' X B)2n B—C =(. —— ― )- 20875.4336 = 145.4289 12 12 12v B = B de 水平■数-1 =2SS 145.4289MS B = * =72.7145'.•BS&B = S$里- S& - S& = 266.6978AB ='.•处理 一'3 一" =4SS AB 266.6978MS AB =」B = ------- = 66.6745 '•ABSS 吴差=SS 、-S$M 理= 10.7625.误差=N —k =36-9 =27SS 吴差 10.76250.398627MS 误差FBF ABM S AMS 1 2. 253 0. 39860. 74 1 6=些=*^=182.4247MS 误差 0.3986MSAB66.6745167.2717MS 吴差0.3986方差分析结果见表9-10变异来源 SS VMS FP总变异 447.3964 35处理436.6339 8A 24.5072 2 12.2536 30.7416 <0.05B 145.4289 2 72.7145 182.4247 <0.05 AB266.6978 4 66.6745167.2717<0.05误差10.7625270.3986表9-10析因设计资料de 方差分析表根据V,查F界值表〔附表4〕得相应P值.交互作用de F=167.2717, P<0.05, 按a =0.05水准,拒绝H0,接受H1 ,差异有统计学意义,可以认为弥散方法和药物抑菌效果两者之间存在交互作用. 这时,如要分析A因素或B因素de单独效应,应固定在A因素de基线水平■来分析B因素de作用,或者固定在B因素de基线水平■来分析A因素de作用.SPSS操作数据录入:翻开SPSS Data Editor® 口,点击Variable View标签,定义要输入de变量,g1表示三种弥散方法〔1为纸片,2为挖洞,3为钢圈〕,g2表示三种药物〔1为黄共,2为大黄,3为宵霉素〕,x表示抑菌效果〔mm〕;点击Data View标签,录入数据〔见图9-3,图9-4〕.图9-3 Variable View窗口内定义要输入de变量g1、g2和x图9-4 Data View窗口内录入数据分析:Analyze General Linear Model UnivariateDependent List 框:xFixed Factor 框:g1、g2OK输出结果Tests of Betw een-Subjects Effects3. 解:此题可采用t检验分析,但最好采用重复测量资料de方差分析. 因重复测量资料de方差分析计算量较大,故此题不给出笔算结果,仅提供SPSS软件分析结果.(1) 建立检验假设,确定检验水准处理因素KH0 :饮食疗法和药物疗法降低胆固醇值de总体均数相同H I :饮食疗法和药物疗法降低胆固醇值de总体均数不相同时间因素IH0:试验前后患者胆固醇值de总体均数相同H I :试验前后患者胆固醇值de总体均数不相同交互作用KIH0:时间对两种方法降低胆固醇de效果无影响H1 :时间对两种方法降低胆固醇de效果有影响:=0.05(2) 计算检验统计量本例是最简单de重复测量设计,时间因素只有两个水平,可以用重复测量de 方差分析进行计算,由丁时间点只有两个水平, 可以不考虑球形对称问题.列出方差分析表见表9-11:表9-11重复测量资料de方差分析表SS V MS F P总变异14.197 27处理0.168 1 0.168 0.153 0.703个体间误差13.196 12 1.100时间0.445 1 0.445 13.921 0.003处理州间0.004 1 0.004 0.122 0.733个体内误差0.384 12 0.032⑶确定P值,作出统计推断时间因素和治疗方法之间de交互作用,F值为0.122, P值为0.733,按口=0.05 水准,不拒绝H.,差异无统计学意义,尚不能认为时间和疗法之间存在交互作用;对丁时间因素,F值为13.921, P值为0.003, P<0.001,按a =0.05水准, 拒绝H0,接受H1 ,差异有统计学意义,可以认为试验前后患者胆固醇de值不同;两种治疗方法de F值为0.153, P值为0.703, P>0.05,按a =0.05水准,不拒绝H0 , 差异无统计学意义,尚不能认为饮食疗法和药物疗法之间具有差异.SPSS操作数据录入:翻开SPSS Data Editor® 口,点击Variable View标签,定义要输入de变量, no表示编号,g 表示分组〔1为饮食疗法,2为药物疗法〕,t1表示实验前患者胆固醇de值〔mmol/L〕 , t2表示实验后患者胆固醇de值〔mmol/L〕;击Data View标签, 录入数据〔见图9-5,图9-6〕.Filt Edit View Data transform Ainalyifr Graphs Utili ti nd&w Melp诊Q|A|风]J tdJd M|通蓟圜剑匿I栏剑< | ►|\ Data View | ♦SPSS Processor is ready图9-5 Variable View窗口内定义要输入de变量no、g、t1和t2图9-6 Data View窗口内录入数据分析:Analyze General Linear Model Repeated MeasuresWithin-Subject Factor name :改为tNumber of Levels :键入 2 Add |Define :Within-Subjects Variables [t] : t1 〜t2Between- Subjects Factor [s] : g Model : • Customr Within-Subjects Model : tr Between-Subjects Model : g Continue函输出结果Mauchly's Test of Sphericity(b)Tests of W ithin-Subjects EffectsTests of Betw een-Subjects EffectsMeasure: MEASURE_14. (1)该资料采用de是两独立样本t检验作两两比拟.(2) 所使用de统计分析方法错误.欲比拟三组均数是否两两不同,用两独立样本t检验作屡次比拟,会增大犯I型错误de概率.(3) 应领先采用完全随机设计方差分析,假设分析结果拒绝H0,那么进一步采用SNK法作三组问de两两比拟.完全随机设计方差分析1)建立检验假设,确定检验水准H.:三个年级锻炼时间de总体均数相等H I :三个年级锻炼时间de总体均数不全相等,即至少有两个总体均数不等:=0.052)计算检验统计量C =('X)2/N = (2887.142) 2/60=138926.4821 22SS 、= *X _X)2 八 X 2 -C =148914.9985-138926.4821=9988.5164v 总=N 』=60—1=59SS 且间=' MX ] -又)2 =、(' XS.n -C911.241838.432)-138926.4821「2431.72312020¥组间=k -1 =3 -1 = 2SS 且内=SS 、- SS 且间=7556.7933v 组内=N -k=57亡MS 组间SS 且间/v 组间…… F = --------- = ---------------- = 9.1711MS 组内SS 且内/v 组内 方差分析结果见表9-12.表9-12方差分析表SS vMSFP总变异 9988.5164 59组间2431.7231 2 1215.86159.17<0.01组内7556.793357132.5753多个样本均数问比拟见表9-13表9-13 SNK 检验计算表q 界值A 与BX A - XB标准误q包含组数--P& XA Ba0.05 0.01(1) (2) (3) (4)=(2)(3) (5) (6) (7) (8) 1与3 14.9519 2.5746 5.8075 3 3.44 4.37 <0.01 1与2 11.3114 2.5746 4.3935 2 2.86 3.82 <0.01 2与33.64052.57461.414022.863.82>0.053〕确定P 值, 作出统计推断方差分析结果P<0.01,按« =0.05水准,拒绝H 0,接受H 1 ,差异有统计学意义,可以认为三个年级锻炼时间de 总体均数不全相等; 多个均数问de 两两比拟 de SNK 检验结果提示:可以认为一年级和二年级、一年级和三年级de 锻炼时间 不同;尚不能认为二年级和三年级de 锻炼时间不同.1137.469220SPSS操作数据录入:翻开SPSS Data Editor® 口,点击Variable View标签,定义要输入de变量, group表示组另U 〔1为一年级,2为二年级,3为三年级〕,x表示锻炼时间〔分〕;再点击Data View标签,录入数据〔见图9-7,图9-8〕.图9-7 Variable View窗口内定义要输入de变量x、g图9-6 Data View窗口内录入数据分析:Analyze — Compare Means^ ONEWAY-ANOVADependent List 框:锻炼时间(x)Factor 框:gPost Hoc 卜Equal Variances Assumed " S-N-KContinueOption... — Statistics: v Homogeneity of Variances testContinue知识是人类进步的阶梯亟输出结果Test of Homogeneity of Variances 锻炼时间ANOVA锻炼时间文档如有冒犯,请站内留言,谢谢!。
sas第九章t检验和方差分析

第九章 t 检验和方差分析在科研中,我们往往是根据样本之间的差异,去推断其总体之间是否有差异。
样本差异可能是由抽样误差所致,也可能是由本质的不同所致。
应用统计学方法来处理这类问题,称为“差异的显著性检验”。
若已知总体为正态分布,进行差异的显著性检验,称为“参数性检验”,SAS 中M EANS 、TTEST 、ANOVA 、GLM 等均属此类检验;若未知总体分布,进行差异的显著性检验,称为“非参数性检验”,SAS 中采用NPAR 1WAY 过程。
第一节 t 检验9.1.1 简介t 检验是用于两组数据均值间差异的显著性检验。
它常用于以下场合: 1.样本均值与总体(理论)均值差别的显著性检验检验所测得的一组连续资料是否抽样于均值已知的总体 根据大量调查的结果或以往的经验,可得到某事物的平均数(例如生理生化的正常值),以此作总体均值看待。
SAS 中采用MEAN S 过程,计算出观察与总体均值的差值,再对该差值的均值进行t 检验。
2.同一批对象实验前后差异的显著性检验(自身对照比较)或配对资料差异的显著性检验(配对比较检验)比如,在医学研究中,我们常常对同一批病人治疗前后的某些生理生化指标(如血压、体温等)进行测量,以观察疗效;或对同一批人群进行预防接种,以观察预防效果;或把实验对象配成对进行测定,比较其实验结果。
SAS 中采用MEAN S 过程,计算出两样本观察的差值(如治疗前、后实验数据的差值),再对该差值的均值进行t 检验。
3.两样本均值差异的显著性检验作两样本均值差异比较的两组原始资料各自独立,没有成对关系。
两组样本所包含的个数可以相等,也可以不相等。
每组观测值都是来自正态总体的样本。
设与为两样1X 2X 本的均值,1n 与为两样本2n 数,21s ,22s 为两样本方差,分两种情形,其数学模型为:(1)方差齐(相等)时:)/1/1(21221n n s x x t +-=)2/(])1()1[(212222112-+-+-=n n s n s n s(2)方差不齐时: 22212121//n s n s x x t +-=SAS 中采用TTES T 过程,先作方差齐性检验(F 检验),然后根据方差齐(EQUAL )和方差不齐(UNEQU AL)输出t 值和P 值以及基本统计量。
人大《统计学》第九章 方差分析

(4)计算组间均方和组内均方及检验统计量的样本值
SSA MSA r 1 SSE MSE nr MSA F MSE
24
§2.2 分析步骤
4.设定检验的显著性水平 并确定临界值 根据事先设定的显著性水平 ,在F分布表中查找分子自 由度为 df1 r 1 、分母自由度为 df 2 n r 所对应的临界值 F r 1 n r 。 , 5.比较理论值(临界值)与实际值大小,进行决策
i 1 j 1
17
§2.2 分析步骤
下式可以用于验证计算的正确性: 自由度
SST SSA SSE
SST的自由度为n-1; SSA的自由度为r-1; SSE的自由度为n-r。
n=rm为总观测值个数 r 为因素水平数 m为每个水平下的观测值个数
18
§2.2 分析步骤
组间均方MSA计算公式
22分析步骤分析步骤4计算组间均方和组内均方及检验统计量的样本值ssamsar?ssemsenr?msafmse根据事先设定的显著性水平在f分布表中查找分子自由度为005分母自由度为3所对应的临界值在?之间显然因此拒绝原假设即?不成立表明该新药在各个不同年龄段水平下的药效存在显著差异即年龄是影响该新药药效的一个显著因素
29
H0 : 1 2 3 4
§2.2 分析步骤
(2)计算所有因素水平下全部样本的总均值
1 r 1 x xi 49.6 40.5 40 34.6 41.175 r i 1 4
(3)计算误差平方和
SST xij x 1311.775
组间平方和 SSA MSA 自由度 r 1
组内均方MSE计算公式
MSE 组内平方和 SSE 自由度 nr
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、F测验
F =
s s
2 t 2 e
F测验分析的目的是判断各个处理平均数 之间是否存在显著差异,即可测验:
Ho: 1 2 k HA: 1、 2、 k 不相等
三、多重比较
如果F测验的结果为各处理间的差异 不显著,则分析结束,否则将进行多重
比较。多重比较分析的目的是进一步判
df e1 ( r 1)( a 1) df ab ( a 1)( b 1)
(一)单因素资料的方差分析 此资料为两向分组资料(交叉分组资料),其行为 处理,列为区组,为 k 行 r 列的两向表,即可看作是 试验因素具有 k 个水平和区组因素具有 r 个水平的两 因素试验。
注意:这样的模式要求行与列间不存在交互作用,
即处理效应不因区组不同而显著不同,否则,F 测验将
丧失有效性,需采用二因素随机区组试验。一般的随机
Se2的EMS是σe2;
St2的EMS是 e2 n 2 ∴ F =
s s
2 t 2 e
n
2 e
2
2 e
F测验有效性的保证条件之一是分子均方 s12 的EMS仅比分母均方 s
2 的EMS多一个分量(线性 2
组成部分)。
(三)固定模型和随机模型 固定模型是指试验的各处理都抽自其特定的处 理总体,这些总体遵循N(μi, σe2),因而处理效应 τi =(μi - μ)是固定的。我们分析的目的就在于 研究τi ,如果重复做试验,处理不变,而所要测验 的假设则是:H0:τi =0或 H0:μi=μ对HA: 1, 2, k 不等。故我们的推断也仅限于供试处理范围之内。
或 SS T SS m SS b SS ab
SS e1
1. 平 方 和 与 自 由 度 的 分 解
df T rab 1 df a a 1 df b b 1 df e2 a ( r 1)( b 1) df T df r df t df e1
T
注意用计算器进
行各项平方和计
算的简便方法。
2. F测验
进行F测验时,应注意两个因素的模型。如果两个因 素均为固定模型,则测验A因素、B因素以及A、B因素互 作的效应是否显著时,分母均以误差方差为被比量。 3. 多重比较 不同类型平均数的多重比较需要注意标准误计算上 的区别(见表)。若互作效应未达显著,可用相加式法 选取试验优劣组合。但在互作效应显著或极显著时,采 取相加式法推断结果可能有误,需对处理组合平均数进
(2)平均数差值 ≥相应秩次距的 R0.01 ,则两 处理平均数间差异为极显著; (3)相应秩次距的R0.05 > 平均数差值 ,则两处 理平均数间差异为不显著。
表 2
各秩次距下的Rα
K SSR0.05 SSR0.01 R0.05 R0.01
2
3
4
……
多重比较结果的字母表达: (1)以小写英文字母表示α=0.05水平下的比
较结果;以大写英文字母表示α=0.01水平下
的比较结果。 (2)以相同字母表示差异不显著的比较结 果,不同字母表示差异显著。
若各处理的重复次数不相等,其分析过程 与
上述方法仅有以下三点区别,其余步骤完全相同。
1. 矫正数 C = 2. 处理平方和
T2
n
i
SS t
( n
1
k
Ti 2
i
)C
3.以n0代替n进行平均数差数标准误和平均数标 准误的计算: n0 =
一、平方和与自由度的分解
分析目的:获得各项变异来源方差的估计值。
观 察 值 总 变 异 处理间变异 处理内变异 (误差)
SST = SSt+ SSe dfT= dft+ dfe
SS t s t2 k 1 df t 2 ( x x i ) SS e 2 se k ( n 1) df e n ( x i x) 2
区组试验,往往假定处理效应是固定的,而区组效应是 随机的,一般是不存在交互作用的。
观 察 值 总 变 异
处理间变异 区组间变异 误 差
ε
1.平方和与自由度的分解
C kr SS T x 2 C 2 Tr C SS r k Tt 2 C SS t r SS e SS T SS r SS t T2
2. F测验
3. 多重比较
单个拉丁方资料的F测验和多重比较相对简单,基本 同前述单因素随机区组资料的分析,此不再赘述。
五、裂区设计资料的方差分析
区组间变异
观 察 值 总 变 异
主区部分
主处理间(A因素) 主区误差 副处理间(B因素)
副区部分
A×B 副区误差
C
T2
rab SS T x 2 C Tr2 SS r C ab Ta2 SS a C rb 2 Tar SS e1 C SS r SS a b Tb2 SS b C ra 2 Tab SS ab C SS a SS b r SS e2 SS T SS r SS a SS b SS ab
df T kr 1
df r r 1 df t k 1 df e df T df r df t
2.F测验
一般来说,区组只是局部控制的手段,而不是研 究的目的,所以通常仅需将它从误差中分离出来,并 不一定要作 F 测验,更无多重比较的必要。
断两两处理平均数之间的差异显著性。
(一)保护性最小显著差数法(protected least significant difference),即 PLSD法。
步骤:1.
2.
根据 dfe 查出 tα 。
计算平均数差数标准误:
s x1 x 2 =
2 S e2 n
3. 计算显著尺度PLSDα值:
PLSDα = tα ×
s
2 e
n
3.计算各秩次距下的显著尺度LSRα或Rα
值: LSRα或Rα =
SSR S x
4.将处理平均数由大到小排序,并依次
求出各处理平均数之间的差值,将各均数差
值与相应秩次距下的显著尺度进行比较,作
出差异显著性判断。同样有:
(1)相应秩次距的 R0.01 > 平均数差值 ≥ 相应
秩次距的R0.05,则两处理平均数间差异为显著;
第九章
第一节
方差分析
方差分析的意义
当试验的处理数目K≥3时,不能直接应用两两测验方 法进行平均数假设测验的原因有三: 1. 当有K个处理平均数时,将有[k(k-1)]/2 个差数,
要对这诸多差数逐一进行比较测验,程序实为繁琐。
2. 试验误差估计的精确度要受到损失。
。 3. 两两测验的方法会随着K的增加而大大增加犯α错
差异为不显著。
(二)最小显著极差法(least significant ranges) , 即LSR法。 主要介绍SSR法。SSR法即邓肯氏新复极差法。 步骤:1.根据平均数秩次距k和dfe查出SSRα值。
秩次距是指相比较的两个平均数之间(含这两个平
均数)包含的平均数个数。
2.计算平均数标准误:
sx =
行多重比较以确定试验优劣组合。
四、拉丁方设计资料的方差分析 行区组间变异 区组间变异 列区组间变异 处理间变异
观 察 值 总 变 异
误
差
x ijl i j l ijl
1.
平方和与自由度的分解
C 2 k SS T x 2 C 2 Tt SS t C k Tr2 SS r C k 2 Tc SS c C k SS e SS T SS t SS r SS c 2 df T k 1 df t df r df c k 1 df e ( k 1)( k 2 ) df T df t df r df c T2
s x1 x 2
4. 将处理平均数由大到小排序,并依次求出各处
理平均数之间的差值,将各均数差值均与PLSDα
相比较,作出平均数间差异显著性判断:
PLSD 0.01 x 1 x 2 PLSD 0.05
差异为显著; 差异为极显著;
x 1 x 2 PLSD 0.01
x 1 x 2 PLSD 0.05
F=
s s
2 t 2 e
3.多重比较
此资料多重比较方法见前述,此处不赘述。
(二)复因素随机区组资料的方差分析
先了解几个概念:
简单效应:指在单因素试验中不同水平的差异。
主效应: 指复因素试验中不同条件下同一简单效应的平 均效应。 交互作用:指试验因素间相互促进或抑制而产生的效应。 分正交互作用、负交互作用及零交互作用。
第四节
常用试验设计资料的方差分析
一、完全随机设计资料的方差分析(见前述) 二、巢式设计资料的方差分析
观 察 值 总 变 异
处理间变异(组间变异) 亚组间变异 误差
(一)平方和与自由度分解
按照上述变异原因分解进行各项平方和与自由度 的计算。
(二)F测验
巢式设计的资料属于系统分组资料,应注意在进 行处理间(即组间)差异的F测验时,分母应为亚组
1 k 1 ( ni n i2
n
)
i
第三节
方差分析的数学模型
一、线性可加模型
线性可加模型是指每一个观察值可以划分成若
干个线性组成部分。它是分解平方和与自由度的理 论依据,不同类型资料的线性可加模型是各不相同的。 前述资料观察值的数学模型为: