协方差分析课件
合集下载
第七章 协方差分析

有无差别的方法,其目的是把与结果变量(因变量)Y
呈直线关系的自变量X(协变量)化成相等后,检验两
个或多个修正均数间有无差别。
§7 协方差分析
协方差分析的意义
[例7-1 ]为研究镉作业工人暴露于烟尘的年数与肺活量 的关系,按暴露年数将工人分为两组,甲组暴露大于 或等于10年,乙组暴露小于10年,两组年龄未经控制, 问该两组暴露于镉作业的工人肺活量是否相同?
分析:试验用4种肥料分别施10株果树,各组的单株产量 y 既包含了不同肥料所引起的“自身变异”,也包含 了不同的起始干周x所引起的 “协同变异”,因此应 采用协方差分析法将“协同变异”从 y 的总变异中剔 除,获得y的“自身变异”,然后才能正确地检验4种 肥料平均单株产量是否有显著差异。
§7 协方差分析
§7 协方差分析
协方差分析的主要步骤
对x和y作方差分析
这里对y进行的F检验是在没有考虑x的影响下进行的, 若x 与y之间没有显著的回归关系,即x对y没有显著影响,对y进
行的F检验结果可以接受; 若x与y之间有显著的回 归关系,即x对y有显著影响, 则需对y矫正后再进行的F检验, 才能获得正确结论。
yij e (xij x ) y i ij
§7 协方差分析
协方差分析的主要步骤
确定协变量(即未加以控制或难以控制的因素) 建立因变量Y随协变量X变化的线性回归关系 利用回归关系把协变量X化为相等后再进行各组Y 的修正均数间比较的假设检验
§7 协方差分析
协方差分析的主要步骤
确定协变量(即未加以控制或难以控制的因素) 计算变量x和y的自由度、平方和与乘积和
§7 协方差分析
协方差分析的意义
协方差是用来度量两个变量之间 “协同变异”大小的 总体参数,即二个变量相互影响大小的参数,协方差 的绝对值越大,二个变量相互影响越大。
协方差和相关系数的计算ppt(共24张PPT)

E(X 2) 2
D( X ) D(Y ) 2
E(Y 2 ) 2
cov(U ,V ) (a2 b2 ) 2
而 D(U ) a2D( X ) b2D(Y ) (a2 b2 ) 2
D(V ) a2D( X ) b2D(Y ) (a2 b2 ) 2
故
UV
a2 a2
b2 b2
XY 1 0 P pq
E(X ) p, E(Y ) p, D(X ) pq, D(Y ) pq, E(XY ) p, D(XY ) pq,
cov( X ,Y ) pq, XY 1
例2 设 ( X ,Y ) ~ N ( 1,12,2,22,), 求
XY .
解
cov( X ,Y )
当D(X ) > 0, D(Y ) > 0 时,当且仅当
P(Y E(Y ) t0 ( X E( X ))) 1
时,等式成立 —Cauchy-Schwarz不等式.
证明 令
g(t) E[(Y E(Y )) t( X E( X ))]2 D(Y ) 2t cov( X ,Y ) t2D( X )
在寒冷的年代里,母爱是温暖。
协方差和相关系数的计算
cov(U ,V ) 解 在文明的年代里,母爱是道德。
继续讨论:a,b 取何值时,U,V 不相关?
E(UV
)
E(U
)E(V
)
为X,Y 的相关系数,记为
a E( X ) b E(Y ) 例2 设 ( X ,Y ) ~ N ( 1, 12, 2, 22,2 ), 求 2XY . 2
E( XY ) p, D( XY ) pq,
cov( X ,Y ) pq, XY 1
X X p ,Y Y p , P(X Y ) 1
协方差分析(Analysis_of_Covariance)PPT资料35页

Analysis of Convariance (2020年1月13日)
Mslab @ TianjinUniv
FEyy(ad)jS1 k1 S1 N2k
Eyy(ad)jEyybw2Exx
k
S1 Eyy
b E 2 wi xxi
i1
k
[(Eyybw2Exx)(Eyy bwi2Exxi )]/(k1)
对于芬兰白酒专卖的问题,交通事故显然不是仅仅与销售方式有关,而把其 他变量都归为随机误差又太过粗糙.这样。我们就想到了引入其他变量.在
协方差分析的模型中,我们称之为协变量.
下面我们再看协方差分析数据结构:
Analysis of Convariance (2020年1月13日)
Mslab @ TianjinUniv
Analysis of Convariance (2020年1月13日)
从离差分解的角度我们来解释协方差分析
对于方差分析:
总离差=分组变量离差+随机误差(组内离差)
对于协方差分析:
总离差=分组变量离差+协变量离差+随机误差
Mslab @ TianjinUniv
在方差分析中,协变量离差包含在了随机误差中. 在协方差分析中,单独将其分离出来.
Mslab TianjinUniv
协方差分析
Analysis of Covariance
ALBERT R.WLDT OLLI AHT
报告人:白寅
Mslab @ TianjinUniv
我们先来看一个问题:
芬兰由几十个小的自治区组成。在芬兰,白酒的批发和零售是国家垄 断的。几个世纪以来,法律规定白酒只能在城市自治区中销售。
k
n
协方差分析讲课课件

导入所需的库,如 NumPy和SciPy。
02
03
04
读取数据并将其转换为 NumPy数组。
使用SciPy的`cov`函数 计算协方差矩阵。
将计算结果存储在变量 中或直接打印输出。
06 案例分析
案例一:不同教育程度对收入的影响
总结词
教育程度对收入具有显著影响,但性别和工 作经验等因素可能对结果产生干扰。
在进行协方差分析之前,需要对数据进行预处理,包括数据 转换和标准化。数据转换可以将连续变量转换为分类变量, 或者将分类变量转换为连续变量。标准化则可以将数据调整 到同一量纲,使其具有可比性。
计算协方差和相关系数
总结词
协方差和相关系数是衡量两个变量之间线性关系的统计量。
详细描述
在协方差分析中,需要计算协方差和相关系数,以衡量两个变量之间的线性关 系。协方差表示两个变量共同变动的程度,相关系数则表示两个变量之间的线 性关系的强度和方向。
通过协方差分析,可以评估分类 变量对连续变量的独立影响,以 及控制其他变量的影响后,分类 变量对连续变量的影响。
协方差分析的适用场景
当需要研究分类变量对连续变量的独立影响时,可以考虑使用协方差分析。
当存在多个控制变量,且需要控制这些变量对连续变量的影响时,协方差分析是一 个有效的工具。
当分类变量和连续变量的关系受到其他变量的影响时,协方差分析可以帮助排除这 些变量的干扰,更准确地评估分类变量对连续变量的影响。
总结词
显著性差异是协方差分析的主要目的, 需要通过F值和概率p值进行判断。
详细描述
在协方差分析中,需要根据F值和概率p值来判 断变量之间的显著性差异。如果F值的概率p值 小于预设的显著性水平(如0.05),则认为组 间存在显著性差异。同时,还需要对每个效应 量进行解释,以更深入地了解数据之间的差异。
02
03
04
读取数据并将其转换为 NumPy数组。
使用SciPy的`cov`函数 计算协方差矩阵。
将计算结果存储在变量 中或直接打印输出。
06 案例分析
案例一:不同教育程度对收入的影响
总结词
教育程度对收入具有显著影响,但性别和工 作经验等因素可能对结果产生干扰。
在进行协方差分析之前,需要对数据进行预处理,包括数据 转换和标准化。数据转换可以将连续变量转换为分类变量, 或者将分类变量转换为连续变量。标准化则可以将数据调整 到同一量纲,使其具有可比性。
计算协方差和相关系数
总结词
协方差和相关系数是衡量两个变量之间线性关系的统计量。
详细描述
在协方差分析中,需要计算协方差和相关系数,以衡量两个变量之间的线性关 系。协方差表示两个变量共同变动的程度,相关系数则表示两个变量之间的线 性关系的强度和方向。
通过协方差分析,可以评估分类 变量对连续变量的独立影响,以 及控制其他变量的影响后,分类 变量对连续变量的影响。
协方差分析的适用场景
当需要研究分类变量对连续变量的独立影响时,可以考虑使用协方差分析。
当存在多个控制变量,且需要控制这些变量对连续变量的影响时,协方差分析是一 个有效的工具。
当分类变量和连续变量的关系受到其他变量的影响时,协方差分析可以帮助排除这 些变量的干扰,更准确地评估分类变量对连续变量的影响。
总结词
显著性差异是协方差分析的主要目的, 需要通过F值和概率p值进行判断。
详细描述
在协方差分析中,需要根据F值和概率p值来判 断变量之间的显著性差异。如果F值的概率p值 小于预设的显著性水平(如0.05),则认为组 间存在显著性差异。同时,还需要对每个效应 量进行解释,以更深入地了解数据之间的差异。
协方差分析(Analysis_of_Covariance)PPT资料35页

总离差平方和修正值的定义和计算式如下:
kn
Tyy(adj)
(Yij(adj) Y )2
• 协方差分析可以解决这类问题。
Analysis of Convariance (2020年1月13日)
Mslab @ TianjinUniv
协方差分析是如何解决这个问题的呢? 首先,我们看看方差分析数据结构:
Yijuti eij
第i组第j个观 测值
一般均值
第i组的组效 应
随机误差
方差分析的前提是除随机误差外,水平变量是影响观测值的唯一变量
实验前后,同一地区的交通事故量应该有某种联系!--回归关系 销售白酒后交通事故多的地区有可能是因为其原来交通事故就比其他地区多!
直接收集统计资料的有两种方式:实验式和非实验式。
如果条件可以完全控制的话(只一个因素变化,其他因素统一)实验式收集数 据进行方差分析理论上是可以保证精度的。
但是实验条件不能完全控制的时候就要采取统计控制,即用统计的方法排除数 据中的干扰因素从而提高精度。——我们知道,就算12个地区白酒的销售方式 是随机指定的,由于每组仅仅有四个地区,很难保证三组地区的交通事故只与 白酒的销售有关而其他因素统一水平。
Analysis of Convariance (2020年1月13日)
总思路
Mslab @ TianjinUniv
在观测值中去除协变量的影响之后,应用方差分析
于是,我们用协变量对观测值进行修正,去掉“遗传”因素
Y i(ja)d Y jij(X ij X ) u ti e ij
协变量修正后的 观测值
Mslab TianjinUniv
协方差分析
Analysis of Covariance
生物统计课件第9章 协方差分析

P195 习题3
三种日投饵量,测定初始体长(x,cm)与试验结束 时体长(Y,cm),作协方差分析。
请同学们思考,如何输入数据:
(1)输入数据与选择数据: (2)菜单: (3)结果分析:
• 初始体重x与最终体重y之间的回归显著性分析 • 不同日投饵量的差异显著性分析 • 平均值校正 • 平均值多重比较
回归协方差分析
(1)三个回归系数b差异显著性检验:p=0.5870,没有显著差 异,可以用共同的回归系数0.0127 (2)三个回归截距差异显著性检验:p=0.0000,差异非常显 著,需要用三个不同的截距:
y1=0.3446+0.0127x y2=1.4413+0.0127x y3=1.1707+0.0127x
平均值校正后,消除初始体长x的影响,三种投 饵水平下,投饵量1的最终体长为6.9371,投饵量2 为7.9377,投饵量3为7.3451。投饵量2最好。
多重比较结果为:三种投饵水平导致最终体长的 差异都是非常显著的(p<0.01).
回归协方差分析
(1)三个投饵水平下,建立三条直线回归方程,对三个回归 系数b差异显著性进行检验:p=0.1885>0.05,没有显著差异, 可以用共同一个回归系数(b=0.9227) (2)三个回归截距a的也有非常显著的差异:p=0.000<0.01, 需要用三个不同的a。
协变量x:1个,草鱼初始重
DPS法 (1)输入数据与选择数据:
DPS法 (2)菜单:
DPS法 (3)对话框:
配方有3个:因此处理A个数为3; 协变量x为初始重,1个。
DPS法
(4)结果:
• 初始重X与草鱼日增重Y的 存在回归关系,可以用方程 y=0.2222+0.0199x表示, R=0.55886,效果不好,这 是因为把所有数据当作一个 样本来处理,由于忽略了三 种饲料的差异。
第九章_协方差分析

协方差举例
3、纠正后的处理间方差分析
变异来源 处理 误差 总变异 自由度 平方和 均方 F值 2 707.218 353.609 31.07** 227.615 11.381 20 22 934.833
ˉ 4、用回归纠正每处理的平均增重 yi= μi+b(xi-x)
注意的问题
1、统计资料应服从正态分布,否则要做适当 的统计代换。 2、做一般方差分析时处理间差异显著,而做 协方差分析时,处理间差异反而不显著,说明 所谓的差异是由于初始的试验条件造成的,并 非处理间真正的差异。
x 17 16 18 18 21 22 19 18 y 97 90 100 95 103 106 99 94
A1
A2Leabharlann A3x 22 24 20 23 25 27 30 32 y 89 91 83 95 100 102 105 110
协方差举例
1、平方和
2、回归关系的显著性检验
变异来源 回归 误差 自由度 平方和 均方 F值 1 1010.76 1010.76 88.8** 227.615 11.38 20
定义
协方差分析(Analysis of Covariance) 是将回归分析与方差分析结合起来使用的一种 分析方法。它先将定量的影响因素看作自变量 ,或称为协变量,建立因变量随自变量变化的 回归方程,这样就可以利用回归方程把因变量 的变化中受定量因素的影响扣除掉,从而,能 够较合理地比较因变量的总体均数之间是否有 显著性的差别,增加了分析的准确性。 协方差分析的功用就是用处理前的基数矫 正处理后的结果,提高其精确度。
第九章 协方差分析
一、协方差分析的概念
二、协方差分析模型
三、协方差分析举例
《生物统计》教学课件:010 协方差分析

试分析第二年分别施用三种肥料的产量 Y是否
有显著的差异?
方差分析表(y)
方差来源 平方和
组间 组内 总和
60.750 830.875 891.625
自由度
2 21 23
均方和 F值 显著性
30.375 0.77 N
39.565
方差分析表(x)
方差来源 平方和
组间 组内 总和
356.083 589.75 945.833
13.75 0.82 18.63 0.98 25.38 0.97
饲料
xi j
j
x i
x
2 i
j
yi j y i
j
j
y
2 i
j
xij yij
j
j
A 110 13. 75 1544 6. 54 0. 8175 5. 3952 91. 03 B 149 18. 63 2803 7. 84 0. 98 7. 7016 146. 67 C 203 25. 375 5267 7. 75 0. 9688 7. 5645 199. 11 和 462 19. 25 9614 22. 13 0. 9221 20.6613 436. 81
自由度
2 21 23
均方和 F值 显著性
178.042 6.34 **
28.083
y 差异不显著, x 差异极显著,不能说明三种肥料的 增产效果没有差异,差异与基础生产力(x)有关。
方差分析表(y校矫正前)
方差来源 平方和
组间 组内 总和
60.750 830.875 891.625
自由度
2 21 23
j
yi
j
1 rs
(
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
,并且 相互独立。
上述两个问题的模型可以推广到一般情况。
下面只讨论一个影响因素,一个协变量的 协方差分析模型。 设因素A有s个水平,每个水平试验t次。 数学模型:
yij bx ij i ij
i 1 ,2 , , s
2
j 1 ,2 , , t
s i 1
其中 εij ~N( 0 , σ ) ,并且 相互独立, α i 0
表5.4.2
因素v 试验结果 因素m
v1
v2
m1
m2
X:15,4,7, 9,14,5 Y:98,60,77, 80,95,65 X:10,12,14, 13,2,3 Y:71,80,86, 82,46,35
X;4,5,8,7, 13,11 Y:55,60,75, 65,87,78 X:11,10,2,3, 7, 9 Y:76,68,43, 47,62,70
求解模型如下:
令 bi i ,求 bi , b , 使
SS
i 1 s t j 1
y
ij
bi b x ij
2
最小。 记 n st
1 t y i y ij t j 1 1 s x i x ij s i 1
1 s t y y ij st i 1 j 1
第五章
方差分析
§5.4
协方差分析
在方差分析中,因素是可以控制的,每个 水平都可以人为地达到。但是在一些实际问题 中,有些因素是不可能控制的或是难以控制的。 考虑这些因素的影响,并作方差分析的方法称 为协方差分析。
例题5.4.1 研究三种肥料对苹果的增重 效果(肥料因子A有3个水平),又要考虑苹果 树原来产量的影响。选24株同龄苹果树,以它 们第一年的产量x(kg)为协变量,每8株施一 种肥料,以第二年产量y(kg)为因变量,得到 数据如表5.4.1。问三种肥料对苹果树增重有无 显著差异?哪些肥料效果好?第一年产量与苹 果增重有无明显关系?
并且 ij 相互独立。 综合上述假设,得到数学模型: 令 i b0
yij bx ij i ij
i 1 ,2 ,3
2
j 1 ,2 , ,8
3 i 1
其中 εij ~N( 0 , σ ) ,并且 相互独立, α i 0
例题5.4.2 某园艺家研究花的品种v和温 度m对鲜花产量y的影响. 由于试验的地块大小 不一样,他决定引用面积x为协变量,m与v各 取两个水平1和2,对4种组合各试验6次,数据 如表5.4.2。他打算分析x与y的关系,并分析因 素m与v对鲜花产量y的影响。
j 1 s i 1
s
t
( x ij - x i )
j 1
t
2
b yi b xi
再来处理平方和分解公式。 有上估计,可算出协方差模型中的回归平 方和及误差平方和
( y ij - y i )( x ij - x i ) i 1 j 1 SR s t 2 ( x ij - x i )
y
ˆ x ij ˆ ij
2
它的自由度是n-2。
最后处理关于因素A的方差分析问题。 因为 ST 中含有因素A的效应,所以
S A ST S E
这就是因素A的效应, 其自由度为s-1。 关于因素A的方差分析可用方差分析表来 完成分析工作。
综上,我们得到单因素协变量方差分析表
2
最小。 上式对 , 求偏导数,并令其为零,可求 得 , 的估计为
ˆ
i 1
( y ij - y i )( x ij - x i )
j 1 s i 1
s
t
( x ij - x i )
j 1
t
2
ˆ1 s t j 1
方差来源
回归
平方和
自由度
均方和
F值
Fα
显著性
1
SR
因素A
SR
S R n s 1 SE
s-1
SA
误差
SA s 1 SE n s 1
S A n s 1 S E s 1
SE
总和
n-s-1
S
n-1
Ⅱ x y Ⅲ x y
此问题中,A1,A2,A3三个水平是可以控制 的,它们作为分类变量A的值,而苹果第一年产 量x是不可控制的,要分析x与苹果增加重量的 关系,我们把它作为普通变量,即协变量来处 理。 画出x与y的散点图,观察这两个量的关系 可看出,x与y之间有明显的线性关系。于是我 们假设:
(1)第一年重量x和增加重量y之间有线 性关系 y b0 bx 再考虑肥料因素对增重的影响,我们设: (2)施用肥料Ai ,苹果增重为μi (3)影响苹果增重的随机误差为 ij εij ~N( 0 , σ 2 )
s t i 1 t j 1 2
SE
i 1
s
j 1
y
ij
b b x ij
i
2
其中 S R 的自由度为1, S E 的自由度为n-s-1. 接下来处理回归问题。 将样本数据作回归,即求 , 使
i 1
s
t
j 1
y
ij
x ij
表5.4.1
样本
x ,y
肥料因素A(水平)
Ⅰ x
y
47 54 52 54 44 52
58 66 53 53 48 58
53 63 64 67 46 54
46 51 58 62 50 61
49 56 59 62 59 70
56 66 61 63 57 64
54 61 63 64 58 69
44 50 66 69 53 66
考虑面积对鲜花产量有线性影响,我们以x为 协变量建立数学模型:
yijk bx ijk i j ij ijk
i 1 ,2 j 1 ,2 k 1 ,2 , ,6
2
其中 i 是因素v的效应, i 是因素m的效应,
ij 是交互效应,x为协变量, εijk ~N( 0 , σ )
再令
SS 0 b
SS 0 bi
解得
b
i 1
( y ij - y i )( x ij - x i )
j 1 s i 1
s
t
( x ij - x i )
j 1
t
2
bi y i b x i
所以 bi , b 的估计为
b
i
i 1
( y ij - y i )( x ij - x i )
上述两个问题的模型可以推广到一般情况。
下面只讨论一个影响因素,一个协变量的 协方差分析模型。 设因素A有s个水平,每个水平试验t次。 数学模型:
yij bx ij i ij
i 1 ,2 , , s
2
j 1 ,2 , , t
s i 1
其中 εij ~N( 0 , σ ) ,并且 相互独立, α i 0
表5.4.2
因素v 试验结果 因素m
v1
v2
m1
m2
X:15,4,7, 9,14,5 Y:98,60,77, 80,95,65 X:10,12,14, 13,2,3 Y:71,80,86, 82,46,35
X;4,5,8,7, 13,11 Y:55,60,75, 65,87,78 X:11,10,2,3, 7, 9 Y:76,68,43, 47,62,70
求解模型如下:
令 bi i ,求 bi , b , 使
SS
i 1 s t j 1
y
ij
bi b x ij
2
最小。 记 n st
1 t y i y ij t j 1 1 s x i x ij s i 1
1 s t y y ij st i 1 j 1
第五章
方差分析
§5.4
协方差分析
在方差分析中,因素是可以控制的,每个 水平都可以人为地达到。但是在一些实际问题 中,有些因素是不可能控制的或是难以控制的。 考虑这些因素的影响,并作方差分析的方法称 为协方差分析。
例题5.4.1 研究三种肥料对苹果的增重 效果(肥料因子A有3个水平),又要考虑苹果 树原来产量的影响。选24株同龄苹果树,以它 们第一年的产量x(kg)为协变量,每8株施一 种肥料,以第二年产量y(kg)为因变量,得到 数据如表5.4.1。问三种肥料对苹果树增重有无 显著差异?哪些肥料效果好?第一年产量与苹 果增重有无明显关系?
并且 ij 相互独立。 综合上述假设,得到数学模型: 令 i b0
yij bx ij i ij
i 1 ,2 ,3
2
j 1 ,2 , ,8
3 i 1
其中 εij ~N( 0 , σ ) ,并且 相互独立, α i 0
例题5.4.2 某园艺家研究花的品种v和温 度m对鲜花产量y的影响. 由于试验的地块大小 不一样,他决定引用面积x为协变量,m与v各 取两个水平1和2,对4种组合各试验6次,数据 如表5.4.2。他打算分析x与y的关系,并分析因 素m与v对鲜花产量y的影响。
j 1 s i 1
s
t
( x ij - x i )
j 1
t
2
b yi b xi
再来处理平方和分解公式。 有上估计,可算出协方差模型中的回归平 方和及误差平方和
( y ij - y i )( x ij - x i ) i 1 j 1 SR s t 2 ( x ij - x i )
y
ˆ x ij ˆ ij
2
它的自由度是n-2。
最后处理关于因素A的方差分析问题。 因为 ST 中含有因素A的效应,所以
S A ST S E
这就是因素A的效应, 其自由度为s-1。 关于因素A的方差分析可用方差分析表来 完成分析工作。
综上,我们得到单因素协变量方差分析表
2
最小。 上式对 , 求偏导数,并令其为零,可求 得 , 的估计为
ˆ
i 1
( y ij - y i )( x ij - x i )
j 1 s i 1
s
t
( x ij - x i )
j 1
t
2
ˆ1 s t j 1
方差来源
回归
平方和
自由度
均方和
F值
Fα
显著性
1
SR
因素A
SR
S R n s 1 SE
s-1
SA
误差
SA s 1 SE n s 1
S A n s 1 S E s 1
SE
总和
n-s-1
S
n-1
Ⅱ x y Ⅲ x y
此问题中,A1,A2,A3三个水平是可以控制 的,它们作为分类变量A的值,而苹果第一年产 量x是不可控制的,要分析x与苹果增加重量的 关系,我们把它作为普通变量,即协变量来处 理。 画出x与y的散点图,观察这两个量的关系 可看出,x与y之间有明显的线性关系。于是我 们假设:
(1)第一年重量x和增加重量y之间有线 性关系 y b0 bx 再考虑肥料因素对增重的影响,我们设: (2)施用肥料Ai ,苹果增重为μi (3)影响苹果增重的随机误差为 ij εij ~N( 0 , σ 2 )
s t i 1 t j 1 2
SE
i 1
s
j 1
y
ij
b b x ij
i
2
其中 S R 的自由度为1, S E 的自由度为n-s-1. 接下来处理回归问题。 将样本数据作回归,即求 , 使
i 1
s
t
j 1
y
ij
x ij
表5.4.1
样本
x ,y
肥料因素A(水平)
Ⅰ x
y
47 54 52 54 44 52
58 66 53 53 48 58
53 63 64 67 46 54
46 51 58 62 50 61
49 56 59 62 59 70
56 66 61 63 57 64
54 61 63 64 58 69
44 50 66 69 53 66
考虑面积对鲜花产量有线性影响,我们以x为 协变量建立数学模型:
yijk bx ijk i j ij ijk
i 1 ,2 j 1 ,2 k 1 ,2 , ,6
2
其中 i 是因素v的效应, i 是因素m的效应,
ij 是交互效应,x为协变量, εijk ~N( 0 , σ )
再令
SS 0 b
SS 0 bi
解得
b
i 1
( y ij - y i )( x ij - x i )
j 1 s i 1
s
t
( x ij - x i )
j 1
t
2
bi y i b x i
所以 bi , b 的估计为
b
i
i 1
( y ij - y i )( x ij - x i )