统计学--第八章方差分析

合集下载

医学统计学 -第08章 方差分析

医学统计学  -第08章  方差分析

第一节 方差分析的基本思想
看一个例子
例8-1 为研究钙离子对体重的影响作用,某研究者将36 只肥胖模型大白鼠随机分为三组,每组12只,分别给 予高脂正常剂量钙(0.5%)、高脂高剂量钙(1.0%)和高 脂高剂量钙(1.5%)三种不同的饲料,喂养9周,测其 喂养前后体重的差值。问三组不同喂养方式下大白鼠 体重改变是否不同?
• 三种喂养方式体重改变的平均值各不相同,这种变异 称为组间变异

是组内均值
X
与总均值
i
X
之差的平方和
360
340
组间变异反映了:
320
三种喂养方式的差异(影响), 300
同时也包含了随机误差。
280
260
240
k ni
220
SS组间
(Xi X )2
200
i1 j
180
X甲
X
X乙
X丙



3、组内变异(SS组内,variation within groups)
0.05
2、根据公式计算SS、MS及F值,列于方差分析表内(计 算过程省略)
变异来源 总变异 组间 组内(误差)
完全随机设计的方差分析表
平方和 SS 自由度
均方MS
47758.32
35
31291.67
2
15645.83
16466.65
33
498.99
F值
31.36
3、确定P值,作出判断
分子自由度=k-1=2,分母自由度=n-k=33,查F 界值表(方差分析用)
表 8-1 三种不同喂养方式下大白鼠体重喂养前后差值(g)
正常钙(0.5%) 高剂量钙(1.0%) 高剂量钙(1.5%)

单向方差分析

单向方差分析
1 10, 2 10
F 分布曲线
17
F 界值表
5
附表5 F界值表(方差分析用,单侧界值) 上行:P=0.05 下行:P=0.01
分母自由度 υ2

分子旳自由度,υ1
1
2
3
4
5
6
161 200 216 225 230 234 1
4052 4999 5403 5625 5764 5859
18.51 19.00 19.16 19.25 19.30 19.33 2
t Yi Yh Se
Yi Yh
,
MS组内(
1 n1
1 n2

N a 组内
29
例四个均值旳Bonferroni法比较
设α=α’/c=0.1/6=0.0167,由此t旳临 界值为t(0.0167/2,20)=2.6117
18.5 28.0
t(A: B)
3.48 2.6117, 24 4 20
以F命名,故方差分析 又称 F 检验 (F
test)。用于推断两 个或多种总体均数有 无差别 。
3
方差分析旳优点: 不受比较组数旳限制,可比较多组均数 可同步分析多种原因旳作用 可分析原因间旳交互作用
4
完全随机设计资料(单原因)方差分析 One-way analysis of variance 第一节 方差分析旳基本思想
deviations from mean,SS)反应变异旳大小
10
1. 总变异: 全部测量值之间总
旳变异程度,计算公式
a ni
SS总
Yij Y
2
Y a ni 2 ij
C
i1 j1
i1 j1
N

统计学课后答案(第3版)第8章方差分析习题答案

统计学课后答案(第3版)第8章方差分析习题答案

第八章 方差分析习题答案一、单选1.D ;2.B ;3.A ;4.C ;5.C ;6.C ;7.C ;8.A ;9.B ;10.A二、多选1.ACE ;2.ABD ;3.BE ;4.AD ;5.BCE6.ABCD ;7.ABCDE ;8.ABCE ;9.ACD ;10.ABD三、计算分析题1、运用EXCEL 进行单因素方差分析,有:方差分析:单因素方差分析SUMMARY组 观测数 求和 平均 方差列 1 5 1.21 0.242 2.45E-05列 2 5 1.38 0.276 0.00226列 3 5 1.31 0.262 1.35E-05方差分析差异源 SS df MS F P-value F crit 组间 0.00292 2 0.00146 1.906005 0.191058 3.885294 组内 0.009192 12 0.000766总计 0.012112 14由于P 值=1.906005>05.0=α,不拒绝原假设,没有证据表明3个总体的均值之间有显著差异。

(或用F 值判断,有同样结论)2、运用EXCEL 进行单因素方差分析,有:方差分析:单因素方差分析SUMMARY组 观测数 求和 平均 方差列 1 5 222 44.4 28.3列 2 5 150 30 10列 3 5 213 42.6 15.8方差分析差异源 SS df MS F P-value F crit 组间 615.6 2 307.8 17.06839 0.00031 3.885294 组内 216.4 12 18.03333总计 832 14由于由于P 值=0.00031<05.0=α,拒绝原假设,表明3个总体的均值之间有显著差异。

(或用F 值判断,有同样结论)进一步用LSD 方法见教材P2063、(1)按行依次为:420、2、1.478(第一行);27、142.07(第二行);4256(第三行)。

(2)由于P 值=0.245946>05.0=α,不拒绝原假设,没有证据表明3种方法组装产品数量有显著差异。

第八章:方差分析

第八章:方差分析

SSE xij xi
k ni i 1 j 1
2
计算结果为: SSE = 2708
三个离差平方和的关系
总离差平方和(SST)、组内离差平方和(SSE) 、组间离差平方和 (SSA) 之间的关系:
x
k i 1 j 1
ni
ij
x ni xi x xij x
外包装底色对产品销量是否有显著影响?
市场 北京 上海 深圳 西安 成都 红色 36 35 27 29 38 橙色 28 26 31 30 24 紫色 30 32 28 26 35 蓝色 22 27 20 21 29
什么是方差分析?
【 例 】为了对几个行业的服务质量进行评价,消费者协会 在4个行业分别抽取了不同的企业作为样本。最近一年中消 费者对总共23家企业投诉的次数如下表:

2.
方差分析的基本假定
1. 每个总体都服从正态分布 (每个行业被投诉的次数必须服从正态分布) 2. 各个总体的方差相同 ( 4个行业被投诉次数的方差都相等) 3. 观测值是独立的 (每个行业被投诉的次数与其他行业被投诉的次数独立)
方差分析的基本假设
H 0 : m1 m2 mk H1 : m1 , m2 , , mk 不全相等
2.计算误差
计算全部观测值的均值以及各水平下的组均值 计算总误差 计算组内误差 计算组间误差
计算总误差( SST)
1. 全部观察值 xij 与总平均值 x 的离差平方和 2. 反映全部观察值的离散状况 3. 其计算公式为
SST xij x
k ni i 1 j 1 2
方差分析
差异源
组间 组内
SS
1456.609 2708

石大医学统计学讲义08配伍组设计的方差分析

石大医学统计学讲义08配伍组设计的方差分析

第八讲配伍组设计的方差分析配伍组设计的多个样本均数的比较可用无重复数据的两因素的方差分析(two-way ANOV A)。

两个因素是指主要的研究因素和配伍组因素。

按这两个因素纵横排列时,每个格子中仅有一个数据,故称无重复数据。

配伍组设计在医学科研中较为常见,例如在实验研究中,将动物按窝别配伍,再随机分配到各个处理组;在观察性别研究中,按年龄、性别或地区配伍来抽取和组成研究因素的各个水平组等等。

例题:某厂医务室测定了10名氟作业工人工前、工中及工后4小时的尿氟浓度(μmol/L),结果见下表。

问氟作业工人三个不同时间的的尿氟浓度有无差别?氟作业工人三个不同时间的的尿氟浓度(μmol/L)工人编号工前工中工后(∑X ij) 190.53142.1287.38320.03288.43163.1765.27316.78347.3763.1668.43178.964175.80166.33210.54552.675100.01144.75194.75439.51646.32126.3365.27237.92773.69138.96200.02412.678105.27126.33100.01331.61986.23121.06105.27312.651060.0173.6958.95192.65(∑X ij)873.751265.901155.893295.54(∑∑X) x87.38126.59115.59109.85均数i( ∑X2ij)88876.98170744.12167659.81427280.91 (∑∑X2)计算步骤:(1)建立假设和和确定检验水准H0:工人三个不同时间的的尿氟浓度相等μ1 = μ2 =μ3H1 :三组总体均数不等或不全相等μ1≠μ2 ≠μ3检验水准α=0.05(2) 计算检验统计量F值本例:校正数 C = (3295.54)2 / 30=362019.463SS总= ∑X2 —C = 427280.91 – 362019.463= 65261.447df总= N-1 = 30-1 = 29不同处理间:893.8182463.36201910)89.115(10)90.1265(10)75.873()X ( 222ij =-++=-=∑∑C nSS 处理 df 处理 = k -1 =3-1 =2 不同区组间:39712.984463.362019...3)87.316(3)03.320()X (22ij =-++=-=∑∑Cn SS 区组 df 区组 = n -1 =10-1 =9 SS 误差= SS 总- SS 处理- SS 区组= 65261.447 - 8182.893 - 39712.984 = 17365.570 df 误差= 29-2-9=18 M S 处理 = SS 处理/ df 处理 =8182.893 / 2 =4091.447 M S 区组 = SS 区组 / df 区组 = 39712.984 / 9 =4412.554M S 误差 =SS 误差/ df 误差 = 17365.570 /18 = 964.754 F 处理 = MS 处理/ M S 误差 F 区组= MS 区组/ M S 误差方差分析结果表变异来源 SS dfMSFP总变异 65261.447 29 处理间 8182.893 2 4091.447 4.241 <0.05 区组间 39712.984 9 4412.554 4.574 <0.05 误差17365.57018964.754(3) 确定P 值和作出推断结论 查表得P<0.01, 按α=0.05水准拒绝H 0 ,接受H 1.(4) 结论:故可以认为工人尿氟浓度三个不同时间中至少两组是不同的,同时10个工人尿氟浓度有差别。

卫生统计学第八章正交试验方差分析

卫生统计学第八章正交试验方差分析
REPORTING
WENKU DESIGN
正交试验设计定义与原理
正交试验设计定义
正交试验设计是研究多因素多水平的一种设计方法,它是根 据正交性从全面试验中挑选出部分有代表性的点进行试验, 这些有代表性的点具备了“均匀分散,齐整可比”的特点。
正交试验设计原理
正交试验设计是利用正交表来安排与分析多因素试验的一种 设计方法。它是由试验因素的全部水平组合中,挑选部分有 代表性的水平组合进行试验的,通过对这部分试验结果的分 析,了解全面试验的情况。
THANKS
感谢观看
REPORTINGΒιβλιοθήκη https://VS
正交表特点
每列中不同数字出现的次数相等;任意两 列中数字的排列方式齐全而且均衡。
正交试验设计步骤
挑因素,选水平
根据试验的目的和专业知识,挑选出与考察指标有关的因素。对选出的因素要分清主次,合理安排。 选取的水平数应根据实际情况而定,过少会导致结果不准确,过多则可能数据分布的规律性较差,代 表性差;
通过建立线性模型来描述各因素 与结果之间的关系,从而进行方 差分析和参数估计。
PART 03
正交试验方差分析步骤
REPORTING
WENKU DESIGN
数据整理与描述性统计
整理试验数据
按照试验因素和水平整理数据,列出试验指标的观察值。
计算总均值和总变异
计算所有观察值的总和、均值、离差平方和等描述性统计量。
选正交表,进行表头设计
根据确定的列数(C)与水平数(t)选择相应的正交表。选择的原则是首先满足列数,其次是水平数。若 有2个或2个以上正交表满足条件时则应选取行数最少的一个;
正交试验设计步骤
明确试验方案,进行试验;

医学统计学-8-方差分析

医学统计学-8-方差分析

第二节 单因素方差分析
单因素方差分析
单因素方差分析:研究的是一个处理因素的 不同水平间效应的差别。
处 理 因 素
水平1 水平2 水平1 水平2 水平c
单因素方差分析
例1、某地用A、B和C三种方案治疗血红蛋 白含量不满10g的婴幼儿贫血患者,A方案 为每公斤体重每天口服2.5%硫酸亚铁1ml, B方案为每公斤体重每天口服2.5%硫酸亚 铁0.5ml,C方案为每公斤体重每天口服3g 鸡肝粉,治疗一月后,记录下每名受试者血 红蛋白的上升克数,资料见下表,问三种治 疗方案对婴幼儿贫血的疗效是否相同?
A、B、C三种方案治疗婴幼儿贫血的疗效观察表
治疗方案 A n=20
血红蛋白增加量(g) 1.8 1.4 0.5 1.2 2.3 2.3 3.7 0.7 2.4 0.5 2.0 1.4 1.5 1.7 2.7 3.0 1.1 3.2 0.9 2.5
B
n=19
0.2
0.0 2.1 -0.7
0.5
1.6 1.9 1.3
q XA XB


MSe 1 1 2 nA nB
ν=νe
一、q检验
例、在前面对某地用A、B和C三种方案治疗 血红蛋白含量不满10g的婴幼儿贫血患者的 例题(完全随机设计方差分析例1)进行了 方差分析,我们得出三组总体不等的结论。 究竟哪些总体均数之间存在着差别,我们需 要在前方差分析基础之上,再对该资料作两 两比较的q检验。
随机因素是无法避免的,而实质性差异是我们 需要得到的。 如何排除随机因素的干扰,利用样本信息对总 体均数间是否存在差异作出推断?
方差分析的基本思想
按照设计类型将总变异分解为处理因素引 起的变异和随机因素造成的变异; 以处理因素变异与随机因素变异之比来构 造检验统计量F。

统计学原理——假设检验与方差分析

统计学原理——假设检验与方差分析
双侧检验是指检验统计量的取值位于其抽样分 布的任何一侧范围内时拒绝原假设,也就是说 抽样分布的左右两侧共同构成了拒绝域。
二、假设检验中的两类错误**
第Ⅰ类错误/弃真错误 (type Ⅰ error)
当原假设为真时拒绝原假设。犯第Ⅰ类错误的概率
通常记为 。
第Ⅱ类错误/取伪错误(type Ⅱ error)
n1 P 40010.2 320 f 5
所以为大样本分布,检验统计量 Z 近似服从 正态分布。样本数据显示:
p 100 0.25 400
Z p P0 0.25 0.20 0.05 2.5
P 1 P 0.21 0.2 0.02
n
400
在显著性水平 0.05 情况下,查表可知,
比RMB 245.95小或者比RMB 274.05大。所以,在双侧 检验(见下图8-1)中有两个拒绝域。
拒绝域
接受域
拒绝域
245.95
260.00
274.05
图8-1 双边检验的拒绝域与接受域
[例8-2] 在例8-1的假设检验中,如果样本的均值
为 X 240.00 ,当显著性水平为0.05时,原假设是否被 拒绝。
重点是三种不同情况下的假设检验方法,总体方差已 知时正态总体均值和总体比例的假设检验。
难点是总体方差未知时正态总体均值的假设检验和方 差分析。
第一节 假设检验
一、假设检验的概念
一、假设检验的概念
假设(hypothesis),又称统计假设,是对总体参数 的具体数值所作的陈述。
假设检验(hypothesis test) 是先对总体参数提出 某种假设,然后利用样本信息判断假设是否成立的过程。
(3) H0:μ = μ0 H1:μ<μ
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

处理因素:不同的药物
水平:0.5ml65%乙醇,
0.2g生药/0.5ml65%乙醇
问题的提出
一种新的降血脂药, 120 人分为安慰剂组,用 药 组 1(2.4g) , 用 药 组 2(4.8g) , 用 药 组 3(7.2g)。实验结束后观察血脂水平。
安慰剂组
X =3.43mmol/l
用药组1
排序号(组次):
四、多个样本均数间的多重比较
1)建立假设,确定检验水准 H0: μA=μB H1: μA≠μB α=0.05 2)计算统计量q值。 由于各组的例数都一样,均为8例,而且在进行方差 分析时,已知MS组内=0.175,任意两个比较组的 标准误均为:
s x A x B MS 组内 1 1 ( ) 0.1479 2 n A nB
第八章 方差分析
Analysis of Variance
重点掌握
方差分析的基本思想
完全随机设计、随机区组设计方差分 析和多重比较结果的合理解释
总体
同质、个体变异
随机 抽样
样本 代表性、抽样误差
总体参数 未知
样本统计量已知
统计 推断
风 险
假设检验的原理和步骤
“小概率反证法”思想 如果对总体的H0是真实的,那么不利于或不能支 持这一假设的事件A(小概率事件)在一次试验 中几乎不可能发生的;要是在一次试验中A竟然 发生了,就有理由怀疑该假设的真实性,拒绝H0
二、完全随机设计方差分析步骤
1、 建立检验假设和确定检验水准 H0: 1 2 3 ( 四组血清IL-2水平总体均
4
数相等)
H1:四组血清IL-2水平总体均数不等或不全相等 α=0.05 2、计算F值
直接计算(软件) 或间接估计(查表)
3、确定P值和作出推断结论
二、完全随机设计方差分析步骤
s x A x B 1 1 2 MS组内 ( ) 0.172 0.2092 nA nB 8
四、多个样本均数间的多重比较
3)确定P值,做出推断结论 v=N-K=32-4=28,查t界值表,得:
比较组
| XA XB |
t值
P < 0.001
甲与乙 0.7287 3.4849 0.001< P <0.002 甲与丙 1.8575 8.8833
3、使用近似F检验
t检验也类似!!!
方差分析的基本思想
例 在大肠湿热征模型研究中,将32只大鼠 随机分成4组,每组8值,分别为正常对照 组(甲组)、大肠杆菌模型组(乙组)、轮 状病毒模型组(丙组)和大肠杆菌加轮状病 毒混合模型组(丁组)。测得大鼠血清白细 胞介素IL-2水平见下表。试比较不同大鼠 模型的血清IL-2水平是否有差别。
处 理 因 素
水平1 水平2
水平k
方差分析的应用条件
应用条件 1、各个样本是相互独立的随机样本; 2、各个样本来自正态总体; 3、各个处理组的总体方差相等,即方差齐。
t检验的应用条件??
方差分析的应用条件
不满足应用条件时处理方法
1、进行变量变换,以达到方差齐或 正态的要求 2、采用非参数法(秩和检验)
甲与丁 1.9737 9.4390
乙与丙 1.1288 5.3984 乙与丁 1.2450 5.9541 丙与丁 0.1162 0.5557
方差
SS/(n-1)
消除n 的 影响
总变异
所有观察值几乎不同,各观察值与 总体均数间的差异为总变异
SS总 ( xij x)
i j
第i个处理 水平 每个水平 组的第j例
2
v总 =n 1
总均数
任一 观测值
组内变异 同一水平处理组,各观测值不完全相等
组内变异
同组内的血清IL-2水平不一致 原因是不同个体的随机误差
第i个处理 水平 每个水平 组的例数 第i组的 均数
2
总均数
方差分析的基本思想
SS总=SS组内+SS组间
随机误差
组内变异
SS组内
SS总
总变异
随机误差+处理的作用(可能 存在)
组间变异
SS组间
方差分析表
变异来源 组间 组内 总 SS SS组间 SS组内 SS总 v k-1 N-k N-1
组间方差,又 称组间均方 (MS组间)
四、多个样本均数间的多重比较

在方差分析的基础上,对不同大鼠模型的 IL-2水平进行SNK法的多重比较。 先将样本均数从小到大排序,对比组次从1-4
均数排序(从小到大) 处理组(原组号) 均 例 数: 数: 甲 0.2913 8 1 乙 1.0200 8 2 3 丙 2.1488 8 丁 2.2650 8 4
SNK q检验
LSD -t检验
四、多个样本均数间的多重比较
(一)SNK-q检验
可对所有对照组及处理组的样本均数进行
两两比较
适用于探索性研究,在研究设计阶段未预
先考虑或未预料到,经数据结果的提示后
才决定的多个均数间每两个的事后比较
四、多个样本均数间的多重比较
计算公式
| XA XB | q S -0.05)k=0.4013
问题的提出
t检验的局限性
比较两组样本均数
(单因素两水平)
方差分析
方差分析(Analysis of Variance,简写为
ANOVA )
由英国统计学家R.A.Fisher在1918年提出
F检验
方差分析的原理
单因素方差分析/完全随机设计方差分析 (one-way ANOVA):研究一个处理因素 (有k个水平),将n个观察单位随机分配到k 个水平,观察水平间效应的差别
变异来源 组间 组内 总
SS 21.429 v 3 MS 7.143 F P
40.766 4.906 26.335 28 31 0.175
<0.01
二、完全随机设计方差分析步骤
结论:
按α=0.05的水准,拒绝H0,接受H1,四
组均数之间的差异有统计学意义,可认
为四个模型组IL-2平均水平总体有差别。
| XA XB | t SX AXB
SX AXB
组内=N-k
1 1 MS组内 ( ) n A nB

自由度=υ
四、多个样本均数间的多重比较
LSD法实际上是一种t检验法,主要区别在
于计算标准误中的合并方差及自由度的不

仍按算得的t值查附表2,t界值表,作出 推断结论
四、多个样本均数间的多重比较
二、完全随机设计方差分析步骤
注意!
1. 如果方差分析有差别,只能说明总体间 有差别,各组中哪两组间是否有差别, 还要进一步做多重比较 2.如果方差分析无差别,分析结束
四、多个样本均数间的多重比较
多重比较(Multiple Comparison),又称两两 比较 假如每次t检验犯第一类错误的概率是0.05,那 么要完全地进行比较,犯第一类错误的概率是 1-(1-a)k。
四、多个样本均数间的多重比较
3)确定p值做出推断结论
比较组
1与4 1与3 1与2 2与4 2与3 3与4
XA XB
a
4 3 2 3 2 2
q值
13.345 12.559 4.927 8.418 7.632 0.786
q0.05(a,28)
3.87 3.51 2.90 3.51 2.90 2.90
(1)建立假设和确定显著性水平
(2)计算检验统计量 (3)确定P值和做出推断
可能发生的两类错误
检验结果 真实情况
拒绝H0
不拒绝H0
H0 成立
H1成立
I型错误(a )
推断正确(1-a )
II 型错误 ( b ) 推断正确(1-b)
问题的提出
t检验实例
外用中药搽剂骨肌康对小鼠琼脂肉芽的抑制作用。 给予对照组0.5ml65%乙醇,试验组施用大剂量骨肌 康,给予0.2g生药/0.5ml65%乙醇,观察两组的肉芽 肿重。
SS 组内 (xij x i )
i j
2
第i个处理 水平
每个水平 组的第j例
任一 观测值
第i个处 理组的均 数
组间变异 各水平处理组的均值不同
组间变异
不同组间的血清IL-2水平不同
原因:处理因素的效应(如果存在的话);随机误
差组间变异
SS组间 ni ( xi x)
的比较,多个组与一个特定组间的比较或者特
定组间的比较(Planned Multiple
Comparison) 方差分析得到有差别的结论后多个组之间的 相互比较的探索性研究(Post Hoc)
四、多个样本均数间的多重比较
两两比较方法
多个样本均数间每 两个均数的比较 多个实验组分别与对照组 均数间的两两比较
一、方差分析的基本思想
SS总=SS组间+SS组内
组内变异(SS组内):随机误差 组间变异(SS组间) :处理因素+随机误差 当H0 为真时,由于处理因素不起作用,组间 变异只受随机误差的影响。此时,组间变异 与组内变异相差不能太大,有 MS组间 SS组间 k 1 1 MS组内 SS组内 n k
i列, i =1,2..k,在此 k=4,处理组数
总例数
j 行, j =1,2…,ni,
在此j=8
总例数
第 i个 处理 组的 样本 均数
总 均 数
总变异 所有个体的血清IL-2水平几乎都不同
回顾:正态分布资料的离散趋势指标
SS (X X )
离均差 平方和
2
变异度
总例数n(自由度n-1)
1 0.95 0.2649
相关文档
最新文档