生物统计学教案(10)

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

生物统计学教案

第十章一元回归及简单相关分析

教学时间:5学时

教学方法:课堂板书讲授

教学目的:重点掌握一元线性回归方程,掌握一元线性回归方程的检验和相关,了解一元非线性回归和多元回归与相关。

讲授难点:一元线性回归方程的检验和相关

10.1 回归与相关的基本概念

函数关系:F=ma

相关关系:单位面积的施肥量、播种量和产量;血压和年龄;胸径和高度;玉米的穗长和穗重;身高和体重。

相关:设有两个随机变量X和Y,对于任一随机变量的每一个可能的值,另一个随机变量都有一个分布与之相对应,称X和Y存在相关。

回归:对于变量X的每一个可能的值x i,都有随机变量Y的一个分布相对应,则称随机变量Y对变量X存在回归。X称为自变量,Y称为因变量。

条件平均数:当X=x i时Y的平均数μY.X=xi,称为条件平均数。

10.2 一元线性回归方程

10.2.1 散点图

例不同NaCl含量对单位叶面积干物质的影响

NaCl

含量X(g/kg土壤) 0 0.8 1.6 2.4 3.2 4.0 4.8

干重Y(mg/dm2) 80 90 95 115 130 115 135

从上图虽可以看出Y对X的线性关系,但点子并不在一条直线上。

例每一

NaCl含量下干物质10次重复值

干重(mg/dm2)重

复值

NaCl含量(g/kg土壤)

0 0.8 1.6 2.4 3.2 4.0 4.8

1 80 90 95 115 130 115 135

2 100 85 89 94 106 125 137

3 75 107 115 103 103 128 128

4 89 93 92 110 110 143 127

5 91 103 115 113 128 132 155

6 79 92 120 108 131 121 132

7 101 78 95 121 117 129 148

8 85 105 95 110 121 112 117

9 83 93 105 108 114 120 134

10 79 85 98 111 116 130 132

平均值 86.2 93.1 101.9 109.3 117.6 125.5 134.5

如果增加每一NaCl浓度下的重复次数,用其平均值画成散点图,则点子直线化的程度要好得多。上表给出10次重复的平均值,从下图中可见,点子更接近在一条直线上。当以Y的条件平均数所做的散点图,则完全在一条上。

10.2.2 一元正态线性回归模型

x

i

和各x i上Y的条件平均数μy.x可构成一条直线:

μ

Y

=α+βX

对于变量X的每一个值,都有一个Y的分布,其平均数是上式所示的线性函数。对于随机变量Y:

Y=α+βX+ε

ε:NID(0,σ2) Y:NID(α+βX,σ2)

上式称为一元正态线性回归模型。

10.2.3 参数α和β的估计

在实际工作中,我们是无法得到α和β的,只能得到它们的估计值a和b,从而得到一条估计的回归线:

bX

a

Y+

=

ˆ

上式称为Y对X的回归方程,所画出的直线称为回归线。a是直线的截距,称为常数项;b是直线的斜率,称为回归系数。

对于因变量Y的每一个观测值y i:

y

i

= a + bx i + e i

y i 的回归估计值i yˆ是对i x Y⋅

μ的估计,因此

i

yˆ也是平均数。

在各种离差平方和中,以距平均数的离差平方和为最小。因此我们就把e i =

y

i

-i yˆ平方和为最小的直线作为最好的回归线。

()

=

-

=

n

i

i

i

y

y

L

1

2

ˆ,求出使L达到最小时的a和b,这种方法称为最小二乘法。

为使()()[]

∑∑==+-=-=

n

i n

i i

i

i i

bx a y y

y

L 1

1

2

2

ˆ达到最小,令:

可以得到以下一组联立方程:

解该方程组,得到β的最小二乘估计:

及a 的最小二乘估计:

公式的分子部分称为X 和Y 的校正交叉乘积和,以S XY 表示。分母部分称为X 的校正平方和,以S XX 表示。因变量Y 的 平方和称为总平方和,以S YY 表示。因此,b 又可以表示为:

10.2.4 回归方程的计算

⎪⎪⎩⎪⎪⎨

⎧=∂∂=∂∂00b

L a l

()()[]()()[]⎪⎪⎩⎪⎪⎨⎧=+--=+--∑∑==n i i i i n

i i i bx a y x bx a y 1

10202XX

XY

S S b =

()()

()

∑∑∑∑

∑∑∑=======---=

⎪⎪⎭

⎝⎛--

=

n

i i

n

i i i

n i i

n

i i n

i n

i i

n i i

i i

x x

y y x x

n

x x n y

x y x

b 1

2

1

2

1

1

21

1

1

x

b y a -=

相关文档
最新文档