7直线回归与相关分析-精品文档
直线回归与相关

应用直线回归的注意事项
进行回归分析时,应先绘制散点图。若提示有直 线趋势存在时,可作直线回归分析;若提示无明 显线性趋势,则应根据散点分布类型,选择合适 的曲线模型,或经数据变换后,化为线性回归来 解决。 绘制散点图后,若出现一些特大特小的离群值 (异常点),则应及时复核检查,对由于测定、 记录或计算机录入的错误数据,应予以修正和剔 除。否则,异常点的存在会对回归方程中的系数 a、b的估计产生较大影响。
a>0表示回归直线与y轴的交点在X轴的上方; a<0表示回归直线与y轴的交点在x轴的下方; a=0表示回归直线通过原点。
b :回归系数 (coefficient of regression)
回归系数即直线的斜率。
b>0,表示随x增加,y亦增加; b<0,表示随x增加,y值减少; b=0,表示回归直线与x轴平行,意为y与x无关。
直线回归分析的一般步骤
1、将 n 个观察单位的变量对(x,y)在直角坐标系中 绘制散点图,若呈直线趋势,则可拟合直线回归 方程。 2 2、求回归方程的回归系数和截矩 3、写出回归方程 Yˆ = a + bX ,画出回归直线 4、对回归方程进行假设检验
a :截距(intercept)
截距是指x=0时,回归直线与y轴交点到原点的 距离。
lxx = ∑ ( x − x) = ∑ x −
2 2
(∑ x ) 2 n
(∑ x )(∑ y ) n
lyy = ∑ ( y − y ) = ∑ y −
2 2
(∑ y ) 2 n
lxy = ∑ ( x − x)( y − y ) = ∑ xy −
求回归系数b和截距a
∑ ( x − x )( y − y ) = l b= l ∑ ( x − x)
相关

2. 应用的情况不同 相关分析用于说明两 变量间的相互关系,描述两变量 X,Y 相互 之间呈线性关系的密切程度和方向;回归分 析用于说明两变量间的依存关系,可以用一 个变量的数值推算另一个变量的数值。
(二)联系 1. 正负符号相同: 在同一资料中,计算 r与 正负符号相同: b值的符号应该相同。 2. 假设检验等价: 在同一资料中,r与 b值 假设检验等价: 的假设检验的统计量 t值相等,即 t r=t b。 3. 对于不同组资料来说,相关系数 r 与 回归 系数 b 二者的数值大小之间无直接联系,且 二者含义不同。 4. r与 b换算关系: 换算关系: 与 换算关系
(三)个体Y值的容许区间 个体 值的容许区间 给定X=X0时,个体Y值的(1-α)容许区间为:
ˆ Y ± tα / 2,v SY −Yˆ
SY −Yˆ = SY ⋅ X 1 (X0 − X ) 1+ + 2 n ∑( X − X )
2
例7-6:X0=1.5时,个体Y值的95%容许区间为: (3.69,5.29)
第七章
回归与相关
回归与相关是用来研究两个变量(或多个变量) 之间数量变化关系的的一种统计分析方法。 本章主要介绍直线回归与直线相关。
第一节
直线回归
一、直线回归的概念
我们以例7-1母婴TSH之间的关系予以说明:
由散点图可以看出,Y 随着 X 的增大而增 大且呈直线变化趋势,但各点并非完全在一条 直线上,这与严格的直线函数关系不同,将X和 Y之间的这类数量变化关系称直线回归。
3. 在回归分析时应正确选定自变量和应 变量。 变量。 若两变量间有明显的依存关系,该问
题很易解决;若两变量间无明显的依存关系, 一般以较易测定者或变异较小者作为自变量 X, 否则可能加大误差。而在相关分析时,不存在 自变量与应变量的关系,它所分析的两个变量 之地位是完全等价的,一般称为第一变量和第 二变量。
23第七章直线回归与相关分析

研究“一因一果”,即一个自变量与一 个依变量的回归分析称为一元回归分析; 研究“多因一果”,即多个自变量与一 个依变量的回归分析称为多元回归分析。 一元回归分析又分为直线回归分析与曲 线回归分析两种; 多元回归分析又分为多元线性回归分析 与多元非线性回归分析两种。
回归分析:揭示出呈因果关系的相关变 量间的联系形式,建立它们之间的回归方程, 利用所建立的回归方程,由自变量(原因)来预 测、控制依变量(结果)。
SS x ( 159.0444) 2
144.6356
249.5556 74.6670
所以
S yx
2 ˆ ( y y )
n2
74.6670 = 3.2660 (天) 92
【题一】下表为每1000 g土壤中所含NaCl 的不同克数(x),对植物单位叶面积干物质 (Y)的影响,试建立其回归方程。 土壤NaCl含量 x/g· kg-1 干重 y/mg· y bx
(7-3)式中的分子是自变量 x 的离均差与
依变量 y 的离均差的乘积和 ( x x )( y y ) ,
简称乘积和,记作 SP ,分母是自变量 x 的离 xy
均差平方和 ( x x )2,记作 SS x。
a 叫做样本回归截距,是总体回归截距α的 最小二乘估计值也是无偏估计值,是回归直线
资料如下表,建立 y 与 x 的直线回归方程。
表7-1 平均温度累积值(x)与一代三化螟盛发期(y)资料
年份 1956 1957 1958 1959 1960 1961 1962 1963 1964 累积温 x 35.5 34.1 31.7 40.3 36.8 40.2 31.7 39.2 44.2 盛发期 y 12 16 9 2 7 3 13 9 –1
第十三章 直线回归与相关分析

第十三章直线回归与相关分析A1型题1 . 已知r=1,则一定有( )A . b=1B . S y = 0C . S Y,X=0D . a=0E . S Y,X= S Y2 .用最小二乘法确定直线回归方程的原则是()A .各观测点距直线的纵向距离相等B .各观测点距直线的纵向距离平方和最小C .各观测点距直线的垂直距离相等D .各观测点距直线的垂直距离平方和最小E .各观测点距直线的纵向距离最小3 . r > r0.05,12 时,可认为两变量X , Y 间()A .有一定关系B .有正相关关系C .有递增关系D .肯定有直线关系E .有线性相关关系存在4 .如果直线相关系数r =1 ,则一定有()A . SS总=SS残B . SS残=SS回C . SS总=SS回D . SS总>SS回E . MS回=MS 残5 .双正态总体随机变量的回归与相关分析中,若直线相关系数r=1 ,则一定有( )A .直线回归的截距等于1B .直线回归的截距等于OC .直线回归的SS残等于0D .直线回归的SS总等于0E .直线回归的SS残等于SS回6 .如果两样本相关系数r1=r2,且n1> n2,那么()A . b l =b2B . t rl=t r2C . b l > b2D . t bl = t r1E . t b1 = t b27 .直线相关系数的假设检验,r > r0.001,34,可认为()A .回归系数β=0。
B .相关系数ρ=0C .决定系数等于零D . X 、Y 间线性关系存在E . X 、Y 差别有统计学意义8 .直线回归分析中,以直线方程Y=0.004+0.0588X代入两点描出回归线。
下面选项中哪项正确()A .所有实测点都应在回归线上B .所绘回归直线必过点(X ,Y )C .原点是回归直线与Y 轴的交点D .回归直线X 的取值范围为〔一1 , 1 〕E .实测值与估计值差的平方和必小于零9 .直线回归与相关分析中,下列哪项正确()A . ρ=0时,r=0B . r > O , b > OC . r > O 时,b < 0D . r < O 时,b < OE . r =1 时,b =110 .直线回归方程()A .一定是过原点的一条直线B .描述了一条斜率为零的直线C .不会受到单位变化的影响D .描述两变量间线性依存的变化规律E .不受自变量大小的影响11 .积差相关系数r ( )A .值一定在-1 到+l 之间B .两变量无关时其值为0.5C .是有单位的值D .可反映某个变量随另一个变量变化的程度E .是自变量改变一个单位时,应变量的平均变化量12 .调查了10 名8 岁男童的身高(cm )与体重(kg ),计算得0<r < l ,则回归系数( )A . b < OB . b > OC . R = OD . b ≤1E .β=O13 .经女大学生肺活量与体重间直线相关系数的假设检验,P<0.01,可认为()A .体重与肺活量间线性关系不存在B .体重随肺活量增加而增加C .两变量间相关程度较高D .肺活量与体重间线性关系存在F .尚不能认为两变量间相关关系存在14 .直线回归方程y=b0 + b x中,b 表示()A .应变量对自变量的比值B .两变量呈同向或反向变化C . X 、Y 两变量间关系的密切程度D . X 增加一个单位时,Y 的平均变化量E .一个变量随另一个变量变化的原因15 .直线回归系数b < O ,则一定有()A . O < r < 1B .一1 < r < OC . r 一OD . a < OE . a > O16 .直线相关是讨论一组观察单位两变量间()A .均数的差别B .线性依存关系数量变化的规律C .某事物现象变化的根本原因D .确定线性关系的重要性E .线性相关关系的方向和程度17 .在总体相关系数ρ=O 的总体中,抽样得到的样本相关系数r( )A .必大于零B .必小于零C .必等于零D .绝对值小于1E .绝对值大于118 .来自双正态总体随机变量的资料,进行相关系数假设检验,P<0.001 ,则回归系数检验必然有()A . t r<t bB . t r>t bC . t r =t bD .无法判断E .以上都不是19 .有关决定系数,下列说法哪项是正确的()A .当r < o0时,决定系数小于零B .当-1 < r < 1 ,决定系数大于1C .当0< r < 1 ,决定系数等于1D .当 r =1 时,回归平方和等于总平方和E .相关系数r 的大小对决定系数大小没有影响A2型题20 .由10 名一年级女大学生体重X(kg)与肺活量Y(L)直线相关分析知,r =0.7459 ,若r> r0.05,8,可认为()A .体重与肺活量间有一定关系B .体重与肺活量相差非常明显C .体重与肺活量间相关关系存在D .体重与肺活量间相关关系不存在E .体重与肺活量间差别有统计学意义21 .某食品科调查克山病区6 份主食大米中硒含量与居民血硒含量,计算得r=0.8053,0.10 >P>0.05,下结论时应慎重。
直线回归与相关分析

f (X)
1
( X )2
e 2 2
2
从正态分布的情况,严格
地说,要求它们服从双变
量正态分布(bi-variable
normal distribution)
8
直线相关(linear correlation)
一、直线相关的概念
如果两个随机变量中,当其中一个变量由小到大的变化时,另一个变 量也相应地由小到大(或由大到小)的变化,并且其相应变化的散点 图在直角坐标系中呈现直线趋势,则称这两个随机变量存在直线相关 (linear correlation)。 应用条件: 适用于两个变量X和Y都服 从正态分布的情况,严格 地说,要求它们服从双变 量正态分布(bi-variable normal distribution)
14
II
I
II
I
III
IV
III
IV
(x x)(y y) 0 (x x)(y y) 0
正相关
负相关
15
II
I
零相关
III
IV
(x x)(y y) 0
16
(x x)(y y)
思路: A:正态标准化 B:归一化处理(除以N)
18
总体
1
N
[
x x x
y
y
y
]
7.8
7.8
6.8
6.8
5.8
5.8
4.8
4.8
3.8
3.8
2.8
2.8
1.8
1.8
r 1 1 2 3 4 5 6 7
直线回归与相关

• 回归分析时的假定:
• (1) Y 变数是随机变数,而X 变数则是没有误差的固定变数,至 少和Y 变数比较起来X 的误差小到可以忽略。
• (2) 在任一X 上都存在着一个Y 总体(可称为条件总体),它是作
正态分布的,其平均数 Y / X 是X 的线性函数:
Y / X X
• Y / X的样本估计值,与X 的关系就是线性回归
相关分析研究X与Y两个随机变量之间的 共同变化规律,例如当X增大时Y如何变化, 以及这种共变关系的强弱。
原则上Y含有试验误差,而X不含试验 误差时着重回归分析;Y和x均含有试验 误差时着重相关分析。
但讨论X为非随机变量的情况,所得到 的参数估计式也可用于X为随机144.6356
SSy=∑y2-(∑y)2/n=794-(70)2/9=249.5556 SPxy=∑xy-∑x∑y/n=2436.4-(333.7×70)/9=-159.0444 X =∑x/n=333.7/9=37.0778
Y =∑y/n=70/9=7.7778 因而有:b=SPxy/SSx=-159.0444/144.6356
对x、y进行考察的简便方法是将n对观察值 (x1,y1)、(x2,,y2)、…、(xn,yn) 于同一直 角坐标平面上制作散点图:
① X和Y的相关的性质(正或负)和密切程度; ② X和Y的关系是直线型的还是非直线型的; ③ 是否有一些特殊的点表示其他因素的干扰等。
图9.1B 每平方米土地上 的总颖花数(X) 和结实率(Y)
a
bxi
)
0
n
n
n
( xi ) ( yi ) n
b
xi yi
i 1 n
i 1 n
i 1
n
第8章 直线回归与相关
散点图可直观地,定性地表示了两个变量之间 散点图可直观地, 的关系.为了探讨它们之间的规律性, 的关系.为了探讨它们之间的规律性,还必须 根据观测值将其内在关系定量地表达出来. 根据观测值将其内在关系定量地表达出来.
上一张 下一张 主 页 退 出
若呈因果关系的两个相关变量y 依变量) 若呈因果关系的两个相关变量y(依变量)与 x(自变量)间的关系是直线关系,,那么,根 自变量)间的关系是直线关系,,那么, ,,那么 据n对观测值所描出的散点图,如图6-1(b)和 对观测值所描出的散点图,如图6 所示. 图6-1(e)所示. 由于依变量y 由于依变量y的实际观测值总是带有随机误 差,因而依变量y的实际观测值yi可用自变量x的 因而依变量y的实际观测值y 可用自变量x 实际观测值x 表示为: 实际观测值xi表示为:
统计学上采用相关分析 统计学上采用相关分析 ( correlation analysis)来研究呈平行关系相关变量之间 analysis)来研究呈平行关系相关变量之间 的关系. 的关系. 对两个变量间的直线关系进行相关分析 称为简单相关分析 也叫直线相关分析 简单相关分析( 直线相关分析); 称为简单相关分析(也叫直线相关分析); 对多个变量进行相关分析时,研究一个 对多个变量进行相关分析时, 变量与多个变量间的线性相关称为复相关 变量与多个变量间的线性相关称为复相关 分析; 分析;研究其余变量保持不变的情况下两 个变量间的线性相关称为偏相关分析 偏相关分析. 个变量间的线性相关称为偏相关分析.
二, 直线回归
1 直线回归方程的建立 2.1.1数学模型 2.1.1数学模型
对于两个相关变量,一个变量用x表示,另 对于两个相关变量,一个变量用x表示, 一个变量用y表示, 一个变量用y表示,如果通过试验或调查获得两 个变量的n对观测值:( 个变量的n对观测值:(x1,y1),(x2, :(x ),(x y2),……,(xn,yn) ),……,( ,(x 为了直观地看出x 为了直观地看出x和y间的变化趋势,可将 间的变化趋势, 每一对观测值在平面直角坐标系中描点, 每一对观测值在平面直角坐标系中描点,作出散 见图6 点图 (见图6-1).
生物统计学课件 7、回归与相关分析
第一节 直线回归
㈡数据整理
由原始数据算出一级数据6个: ΣX=1182 ΣY=32650 ΣXY=3252610 320
ΣX 2=118112 ΣY 2=896696700 n=12
Байду номын сангаас
再由一级数据算出二级数据5个:
SSX= ΣX 2 - (ΣX) 2 /n=1685.00 SSY= ΣY 2 - (ΣY ) 2 /n =831491.67 SP= ΣXY - ΣX ΣY /n =36585.00
280
80
X=ΣX/n =98.5 Ӯ =ΣY/n =2720.8333
㈢计算三级数据
b = SP/ SSX =21.7122 =36585÷1685
a= Ӯ -bX=582.1816 =2720.8333- 21.7122×98.5 得所求直线回归方程为:
y = 582.1816 + 21.7122 x
第一节 直线回归
二、建立直线回归方程
340
例7.1 在四川白鹅的生产性能研究中, 得到如下一组n = 12(只)关于雏鹅重(g) 与70日龄重(10g)的关系的数据,其结 300 果如下表,试予分析。
解 ㈠描散点图
本例已知雏鹅70日龄重随雏鹅重的变 260 化而变化,且不可逆;又据散点图反映的 趋势来看,在80—120g的重量范围, 70日 龄重随雏鹅重呈上升的线性变化关系。
程 y = 582.1816 + 21.7122 x可用于预测。
而是多元回归。
第二节 直线相关
一、相关的含义
二、相关系数
如果两个变量X和Y,总是X和Y 相互 前已述及,具有线性回归关系的
制约、平行变化,则称X和Y为相关关系。 双变量中,Y变量的总变异量分解为:
生物统计附试验设计第八章直线回归与相关分析ppt课件
Q ei2 (y yˆ)2 y (a bx)2
利用最小二乘法,即使偏差平方和最小 的方法求a与b的值。
Q a
2 ( y
a
bx)
0
Q b
2 ( y
a
bx)x
0
na ( x)b y
根据微积分 学中求极值 的原理,将Q 对a与b求偏 导数并令其 等于0:
( x)a ( x)2 b xy
平行关系/相关关系(两个以上变量之间共
同受到另外因素的影响,无自变量与依变
量之分)
X身高
Y体重
X体重
Y身高
在大量测量各种身高人群的体重时会发现,在同样 身高下,体重并不完全一样。在同样体重下,身高 并不完全一样。但在每一身高/体重下,有一确定 的体重/身高。
身高与体重之间存在相关关系。
平行关系/相关关系(两个以上变量之间共 同受到另外因素的影响,无自变量与依变 量之分)
Sr
检验的计算公式为:
Sr (1 r2 ) /(n 2)
Sr—相关系数标准误
F
(1
r2 r2) (n
2)
df1 1, df2 n 2
此外,还可以直接采用查表法对相关系 数r进行显著性检验。先根据自由度n-2查临
界r值(附表8),得r0.05、 r0.01。
若|r|<r0.05 ,P>0.05,则相关系数r不 显著;
椰子树的产果树与树高之间无直线相关关系。
当样本太小时,即使r值达到0.7996,样本也可
能来自总体相关系数ρ=0的总体。
不能直观地由r值判断两变数间的相关密切程度。 试验或抽样时,所取的样本容量n大一些,由此计
算出来的r值才能参考价值。
四、相关与回归的关系
生物统计学第7章 回归与相关
检验统计量为
t
b1 b2 sb1 b2
~ t(n1 n2
4)
s b1b2
s2 y/x
s2 y/x
SSx1 SSx2
s2 y/x
(n1
Q1 Q2 2) (n2
2)
t t 当
α(n1n2 4 ) 时,接受HA,即两样本所属总体的回归系数不相等
样本相关系数:从随机样本的数据计算得来的相关系数,用符号r代表
对某一定的总体来说, ρ是一个常量。
从同一总体中随机抽取的各样本的r值是随机变动的,不是一个常量,且可 以通过实验或测量的样本数据来计算它。
将SP除以n-1,消除了样本容量 的影响,得样本的协方差
(xi x)( yi y)
MP i n 1
i
U
SS y
Q
SP2 SSx
bSP b2SSx
F
MSU MSQ
~
F(dfU,dfQ )
例7.5 用F测验对例7.2所求回归方程作回归显著性测验。
F
MSU MSQ
b2SSx Q (n 2)
b2
s2 y/x
SSx
( b )2 sb
t2
7.2.3.2 两个回归系数相比较的显著性检验
由两个样本的回归系数b1,b2,测验其所属总体的回归系数β1、β2是否相等
7.1.2 回归的概念
两个相关变量之间,有时表现为一个变量依赖于另一个变量的从属关系。 对于这种情况的两个变量可以区分为自变量(记为X)和依变量(记为Y)。
回归关系:一般自变量X是固定的(试验时预先确定的),并且没有试验 误差或试验误差很小,依变量Y则是随自变量X的变化而变化,且受试验误 差的影响较大。这种关系称为回归关系,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
X体重
Y身高
在大量测量各种体重人群的身高时会发现,虽然在同 样体重下,身高并不完全一样。但在每一体重下,都 有一个确定的身高分布与之相对应;
身高与体重之间存在相关关系。
第二节:直线回归 Linear Regression
一、直线回归方程的建立
例:土壤内NaCl含量对植物的生长有很大影响,NaCl含 量过高,将增加组织内无机盐的累积,抑制植物生长。下 表中的数据是每1000g土壤中所含NaCl的不同克数(X), 对植物单位叶面积干物重的影响。
不同NaCl含量对单位叶面积干物重的影响
NaCl含量X(g/kg) 0 0.8 1.6 2.4 3.2 4.0 4.8
干重Y(mg/dm2) 80 90 95 115 130 115 135
散点图如下
140
130
120
110
100
80
70
0
0.8
1.6
2.4
3.2
4
4.8
我们描绘散点的目的:(1)两变量之间的关系是否密切,能否用X来 估计Y;(2)两变量之间的关系是呈线性或某种曲线;(3)是否 存在某个点偏离过大;(4)是否存在其他规律。
d f S S M S
F S i g n i f i c a n c eF
而回归直线是指所有直线中最接近散点图中全部散点
的直线。设样本直线回归方程为: yˆ abx
回归直线在平面坐标系中的位置取决于a,b的取值。
yˆ abx y
最小二乘法
n
(method of least square)
( y yˆ )2
1
最小
天数(天)
40 yˆ5.7 03 92.3 53x17
如果对于变量X的每一个可能的值xi,都有随机变量Y的一个yi 与之对应,则称随机变量Y对变量X存在回归关系。
为了确定相关变量之间的关系,首先应该收集一些数据,这 些数据应该是成对的,然后在直角坐标系上描述这些点,这 一组点集称为散点图。
为了研究父亲与成年儿子身高 之间的关系,卡尔.皮尔逊测量 了1078对父子的身高。把 1078对数字表示在坐标上, 如图。用水平轴X上的数代表 父亲身高,垂直轴Y上的数代 表儿子的身高,1078个点所 形成的图形是一个散点图。它 的形状象一块橄榄状的云,中 间的点密集,边沿的点稀少, 其主要部分是一个椭圆。
温度与幼虫孵化 人类的年龄与血压 身高与胸围、体重 溶液的浓度与OD值
相关关系:当一个或几个相互联系的变量取一定的数值时 ,与之相对应的另一变量的值虽然不确定,但它仍按某种规 律在一定的范围内变化。变量间的这种相互关系,称为具有 不确定性的相关关系
生物学中,研究两变量间的关系,主要是为了探求两变量的 内在联系,或者是从一个变量X去推测另一个随机变量Y.例 如,我们希望通过施肥量X去推测Y
第一节:回归与相关的概念
因果关系
相
一个变量的变化受另一个 变量或几个变量的制约
关
回归分析(regression analysis)
变 量 互依关系
两个以上变量之间共同受 到另外因素的影响
相关分析(correlation analysis)
因果关系 一个变量的变化受另一个变量或几个变
量的制约
x
y
施肥量 (可以严格地人为控制)
温度 (℃)
黏虫孵化历期平均温度与历期天数关系图
若我们增加每一NaCl浓度下的观测次数,其散点图如下:
(可见其平均值更趋近于一条直线)
平均数有一个特性,即在各种离差平方和中,以距平均数 的离差平方和最小。我们把观测值与回归估计值之间的离 差平方和最小时的回归线作为最好的回归线。其方法为最 小二乘法
散点图(scatter diagram)
两个变量间关系的性质(正向协同变化或 负向协同变化)和程度(关系是否密切) 两个变量间关系的类型(直线型或曲线型) 是否有异常观测值的干扰
4 3 2 1
123456 4 3 2 1
123456 4 3 2 1
123456
正向直线关系 负向直线关系
曲线关系
定性研究
30
20
11.8-----20.4
10
0 10 12 14 16 18 20 22
温度 (℃)
用x估计y,存在随机误差,必须根据回归的数学模型 对随机误差进行估计,并对回归方程进行检验。
直线回归方程(linear regression equation)
自变量
Y^ =a+bx
斜率(slope) 回归系数(regerssion coefficient)
截距(intercept) 回归截距
与x值相对应的依变量y的点估计值
yˆ abx
y
b=0
a>0,b>0 a=0
a>0,b<0
a<0,b>0
0
x
直线回归的假设检验
是否真正存在线性关系 回归关系是否显著 因此,求出回归方程后须作统计检验,称回归显著性检验。
不同NaCl含量对单位叶面积干物重的影响 方差分析表
产量
自变量(independent variable) 因变量(dependent variable)
如果对x的每一个可能的值,都有随机变量y 的一个分布相对应,则称随机变量y对变量x 存在回归(regression)关系。
相关关系
X身高
Y体重
在大量测量各种身高人群的体重时会发现,虽然在同 样身高下,体重并不完全一样。但在每一身高下,都 有一个确定的体重分布与之相对应;
例:黏虫孵化历期平均温度与历期天数
变温量度 1
变天量数 2
X
Y
平均温度(℃) 历期天数(d)
11.8
30.1
14.7
17.3
15.6
16.7
16.8
13.6
17.1
11.9
18.8
10.7
19.5
8.3
20.4
6.7
收集数据
散点图
天数(天)
40
yˆ abx
30
20
10
0 10 12 14 16 18 20 22
直线相关与 回归分析
两变量或多变量之间的关系,总起来可分为两类,一类是函数关系,确 定关系的例子,在生物界中是极少见的。 生物中,大量存在的情况是:一种变量受另一种变量的影响,两者之间既有 关系,但又不存在完全确定的函数关系。知道其中一种变量,并不能精 确求出另一变量。下面请同学们举几个例子。 单位面积的施肥量、播种量和产量三者之间的关系。 树木胸径与树木高度的关系。 人类血压与年龄的关系。 玉米的穗长与穗重的关系。 人的身高与体重的关系。