方差分析ANOVA使用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
95% Confidence Interval
Lower Bound Upper Bound
-54.3389
81.5639
14.5303
150.4330
-81.5639
例 在评价某药物耐受性及安全性的I期临床试验 中,对符合纳入标准的30名健康自愿者随机分为 3组每组10名,各组注射剂量分别为0.5U、1U、 2U,观察48小时部分凝血活酶时间(s)试问不 同剂量的部分凝血活酶时间有无不同?
方差分析步骤 :
(1)提出检验假设,确定检验水准
H0:μ1=μ2=μ3 H1:μ1,μ2,μ3不全相同 a=0.05
需要进一步作多重比较
能否用T检验呢 当有k个均数需作两两比较时,比较的次数共 有c= = k!/(2!(k-2)!)=k(k-1)/2
设每次检验所用Ⅰ类错误的概率水准为α,累 积Ⅰ类错误的概率为α’,则在对同一实验资 料进行c次检验时,在样本彼此独立的条件下, 根据概率乘法原理,其累积Ⅰ类错误概率α’ 与c有下列关系: α’=1-(1-α)c
可用离均差平方和反映变异的大小
6
1. 总变异: 所有测量值之间总的变异 程度,SS总
k ni
SST
(XijX)2
i1 j1
总 N 1
2.组间变异:各组均数与总均数的离 均差平方和, SS组间
k
SSTR ni(Xi X)2 i1 组间 a 1
SS组间反映了各组均数 X i 的变异程度
组间变异=①随机误差+②处理因素效应
均数两两比较方法
直接校正检验水准(相对粗糙) 专用的两两比较方法:
计划好的多重比较(Planned Comparisons) 非计划的多重比较(Post-Hoc Comparisons)
Contrasts按钮
Post Hoc按钮
均数两两比较方法
点击单因素方差分析主对话框中的Post Hoc按钮,总共 有14种两两比较的方法,如下:
17
F 界值表
18
二、完全随机设计方差分析(单因素方差分析)
关于因素与水平
因素也称为处理因素(factor) 每一处理因素至少有两个水平(level)(也称“处理组”
)。
完全随机设计:
将实验对象随机分配到不同处理组的单因素 设计方法。针对一个处理因素,通过比较该 因素不同水平组均值,推断该处理因素不同 水平组的均值是否存在统计学差异。
均数两两比较方法
仍以例1为例,LSD法的输出格式:
结果分析
均数两两比较方法
仍以例1为例,SNK法的输出格式:
结果分析
❖ 该方法的目的是寻找同质子集,故各组在表格的纵向上,均 数按大小排序,然后根据多重比较的结果将所有的组分为若干 个子集,子集间有差别,子集内均数无差别。
均数两两比较方法
结果分析
差齐同。
问题: 不符合条件怎么办?
第一招:数据转换 方差齐性转换;正态性转换
第二招:特别分析方法 非参数检验
三、多个样本均数的两两比较
方差分析能说明什么问题?
不拒绝H0,表示拒绝总体均数相等的证据不
足 分析终止
拒绝H0,接受H1, 表示总体均数不全相等
哪两两均数之间相等?哪两 两均数之间不等?
例如,设α=0.05,c=3(即k=3),其累积Ⅰ类错 误的概率为α’=1-(1-0.05)3 =1-(0.95)3 = 0.143
多重比较的方法:
✓ SNK检验(q 检验):探索性研究,进行 两两比较。
✓ LSD-t 检验:证实性检验,可认为LSD法是 最灵敏的
✓ Turkey 检验方法,探索性研究,要求样本 量相同。
✓ Duncan 检验方法,探索性研究
✓ Dunnet 检验方法,证实性检验,常用于多 个试验组与一个对照组间的比较。
单因素方差分析
例1 在肾缺血再灌注过程的研究中,将36只雄性大鼠随机等 分成三组,分别为正常对照组、肾缺血60分组和肾缺血60 分再灌注组,测得各个体的NO数据见数据文件no.sav,试 问各组的NO平均水平是否相同?
预分析(重要):检验其应用条件
选择data 中的split file,出现如下对话框:
单因素方差分析
单因素方差分析
单因素方差分析
❖ 这里仅取其中一组结果,表明该资料符合 分组正态性的条件。
单因素方差分析
注意分组检验正态性后,要先回到data菜单下的split file , 如下操作取消拆分后才能进行后续的方差分析:
(2)计算检验统计量F 值
(3)确定P值,做出推断结论
F0.05(2,26) =2.52,F>F0.05(2,26) ,P<0.05,拒绝 H0。 三种不同剂量48小时部分凝血活酶时间 不全相同。
方差分析适合于任何多组独立均衡可比的数据
例子:某研究者在某单位工作人员中进行了体重指数 (BMI)抽样调查,随机抽取不同年龄组男性受试者 各16名,测量了被调查者的身高和体重值,由此按照 BMI=体重/身高2公式计算了体重指数,请问,不同年 龄组的体重指数有无差异。
223462.975 5.564 33 4216.wenku.baidu.com98
.008
源 Total 186083.6
35
❖ 第1列为变异来源,第2、3、4列分别为离均差平方和、自 由度、均方,检验统计量F值为5.564,P=0.008,组间均数 差别统计学意义,可认为各组的NO不同。
单因素方差分析 (3) 各组样本均数折线图
❖ Levene方法检验统计量为3.216,其P值为0.053,可 认为样本所来自的总体满足方差齐性的要求。
单因素方差分析
结果分析
(2) 方差分析表
ANOVA
no
变
Sum of
异
Squares df Mean Square F
Sig.
来
Betwee4n6G 92ro5u.9p5s0 Within G1ro3u9p1s57.6
3.组内变异:用各组内各测量值Xij与 其所在组的均数差值的平方和来表示,
SS组内
k ni
SSe
(Xij Xi)2
i1 j1
组内 Na
SS组内反映随机误差的影响(个体差异和测量误差)。
均方差,均方(mean square,MS)
变异程度除与离均差平方和的大小有关外, 还与其自由度有关,由于各部分自由度不相等, 因此各部分离均差平方和不能直接比较,须将 各部分离均差平方和除以相应自由度,其比值
18~岁 21.65 20.66
… … 18.82 16 22.07 8.97
30~岁 27.15 28.58
… … 23.93 16 25.94 8.11
45~60岁 20.28 22.88 … … 26.49 16 25.49 7.19
一、方差分析的基本思想
思想来源: 观察值总变异可以分解为组间变异和组内变异
当各组样本含量不同,选择Scheffe法,得结果:
Dependent Variable: no Scheffe
Multiple Comparisons
Mean
Di ffere n ce
(I) group (J) group
(I-J)
Std. Error
Si g.
1
2
13.61250 26.51068
方差分析(ANOVA)
n4
n3 n2 n1
Y4
Y3 Y2
Y1
例子:某研究者在某单位工作人员中进行了体重指 数(BMI)抽样调查,随机抽取不同年龄组男性受试 者各16名,测量了被调查者的身高和体重值,由此按 照BMI=体重/身高2公式计算了体重指数,请问,不 同年龄组的体重指数有无差异。
项目
样本量 平均值 标准差
单因素方差分析
分析:
对于单因素方差分析,其资料在SPSS中的数据结构应当由 两列数据构成,其中一列是观察指标的变量值,另一列是用 以表示分组变量。实际上,几乎所有的统计分析软件,包括 SAS,STATA等,都要求方差分析采用这种数据输入形式, 这一点也暗示了方差分析与线性模型间千丝万缕的联系。
单因素方差分析
称为均方差,简称均方(mean square,MS)。组
间均方和组内均方的计算公式为:
MS组间
SS组间
组间
MS组内
SS组内
组内
n1 n3 n2
Y1 Y3 Y2
VS
n1 n3
n2
Y1 Y3
Y2
n1 n3 n2
Y1 Y3
Y2
VS
n1 n2
Y1
Y3 Y2
组间均方与组内均方比值越小,样本越可能来 源于同一个总体,比值越大,样本越可能不是 来源于一个总体
结果分析
Means plots 选项给出,更直观。 注意:当分组变量体现出顺序的趋势时,绘制这种折线图可以提示 我们选择正确的趋势分析模型。
均数两两比较方法
通过以上分析得到了拒绝H0的结论,但实际上单因素方差分 析并不这样简单。在解决实际问题时,往往仍需要回答多个 均数间到底是哪些存在差异。虽然结论提示不同组别个体的 NO量不同,但研究者并不知道到底是三者之间均有差别,还 是某一组与其他两组有差别。这就应当通过两两比较(多重 比较)进行考察。
P2,45=3.20-3.21<8.87,本次F值处于F界值之 外,说明组间均方组内均方比值属于小概率 事件,因此拒绝H0,接受H1,三个总体均 数不等或不全相等
方差分析的关键条件
第一、各组服从正态分布! 第二、各组符合方差齐性! 第三、独立性
方差齐性检验
➢ Bartlett检验法 ➢ Levene F 检验 ➢ 最大方差与最小方差之比<3,初步认为方
… 二、F 值与F分布
如果各组样本的总体均数相等(H0成立),即各处理组的样
本来自相同总体,无处理因素的作用,则组间变异同,组内变异 一样,只反映随机误差作用的大小。组间均方与组内均方的比
值称为F统计量
F MS组间 M S组内
1 组间 2 组内
F值接近于1,就没有理由拒绝H0;反之,F值越大,拒
.877
3
82.48167* 26.51068
.014
2
1
-13.61250 26.51068
.877
3
68.86917* 26.51068
.046
3
1
-82.48167* 26.51068
.014
2
-68.86917* 26.51068
.046
*. The mean difference is significant at the .05 level.
H0:三个总体均数相等,即三组工作人员 的体重指数总体均数相等
H1:三个总体均数不等或不全相等 a=0.05
(2)计算检验统计量F值
变异来源
SS 自由度(df)
MS
F
组间 组内 总变异
143.406 363.86 507.36
2
71.703
8.87
45
8.09
47
(3)确定p值,作出统计推断
均数两两比较方法
LSD法:最灵敏,会犯假阳性错误; Sidak法:比LSD法保守; Bonferroni法:比Sidak法更为保守一些; Scheffe法:多用于进行比较的两组间样本含量不等时; Dunnet法:常用于多个试验组与一个对照组的比较; S-N-K法:寻找同质亚组的方法; Turkey法:最迟钝,要求各组样本含量相同; Duncan法:与Sidak法类似。
绝
H0的理由越充分。数理统计的理论证明,当H0成立时,F 统计量服从F分布。
1.4 1.2 1.0
f( F)
f
(F)
1
2
2
1/ 2
1
2
2
/
1
2F 2
1
1
2
2
2
(1F
12
2) 2
11,2 5
0.8 0.6
15,2 5
0.4
110,210
0.2
0.0
0
1
2F
3
4
F 分布曲线
回忆t分布和t检验
项目
样本量 平均值 标准差
18~岁 21.65 20.66
… … 18.82 16 22.07 8.97
30~岁 27.15 28.58
… … 23.93 16 25.94 8.11
45~60岁 20.28 22.88 … … 26.49 16 25.49 7.19
基本步骤
(1)建立假设,确定检验水准
单因素方差分析
单因素方差分析
选入因变量
选入分组变量
单因素方差分析
指定进行方差 齐性检验
给出各组间样本 均数的折线图
单因素方差分析 (1) 方差齐性检验
结果分析
Test of Homogeneity of Variances
no
Levene Statisticdf1
3.216
2
df2 Sig. 33 .053
组间变异 组内变异
总变异
5
1. 总变异(Total variation): 全部测量值Xij与总 均数X 间的差异
2. 组间变异(between group variation ): 各组的 均数 X i 与总均数 X 间的差异
3. 组内变异(within group variation ):每组的 每个测量值 X ij与该组均数 X i 的差异