§1 回归分析(2)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

即在 x=x0处的估计值为 y=a+bx0. 【问题提出】
在某些情况下, 从散点图中不易判断变量之间的线性关系. 另外, 当数据量较大时, 画散点图很麻烦, 有无更好的方法?
§1 回归分析(2)
1.变量间线性相关系数 r(协方差系数):
假设两个随机变量的数据分别为(x1, y1), (x2, y2), …,(xn, yn), 则变量间线性相关系数的计算公式如下:
从散点图容易看出, 表格中的数据都在同一个半圆上, 此时建立线性回归
方程是没有任何意义的, 这与线性相关系数 r的计算结果是一致的.
线性相关系数 r越大, 变量之间的线性关系就越强!
3.课堂练习:
(1)对于回归分析, 下列说法错误的是
(D )
A.在回归分析中, 变量间的关系若是非确定性关系, 则因变量不能由自 变量唯一确定
r 的值越接近于0 误差Q越大 变量之间的线性相关程度越低
对于线性回归方程 y=a+bx (b lxy ) r lxy
l xx
lxx l yy
r 0 lxy 0b 0两个变量的值总体上呈现出同时增减的趋势
两个变量正相关
r 0 lxy 0b 0一个变量增加, 另一个变量有减少的趋势 两个变量负相关
5 解:根据上表的数据, 列表如下所示:
n
n
0 由此可得: xi2 100, yi2 75,
n
i 1
i 1
i 1
xi
yi
0,
x
0,
n
y
2.71.
进而可求得:
xi yi nxy
r
i 1
0.
n
n
xi2 nx2
yi2 ny 2
i 1
6 y i1
5
4
3
2 1
-6 -4 -2 o 2 4 6 x
复习回顾
1.回答线性回归方程的形式: y=a+bx
2.回答线性回归方程中的系数公式:
n
b
l xy l xx
xi yi nxy
i 1 n
,
xi2 nx 2
a y bx.
i 1
n
n
lxy xi yi nxy. lxx xi2 nx2 ,
i 1
i 1
3.回答回归方程的意义:
利用回归方程, 我们可以进行预测, 并对总体进行估计.
则 y与 x的相关系数 r的值为__0_._3______.
(3)P9/练习.
4.课堂小结: (1)系数 r计算公式: r
n
xi yi nxy
i 1
n
n
xi2 nx2
yi2 ny 2
i 1
i 1
r [1,1]
(2)回归方程误差:
Qmin lyy (1 r2 )
r 的值越大 误差Q越小 变量之间的线性相关程度越高 r 的值越接近于0 误差Q越大
r 0lxy 0b 0 两个变量线性不相关
【思考交流】
(1)如何求出下表中变量的线性相关系数? 答案:
编号
1 2 345
股骨长度x/cm 38 56 59 64 74
肱骨长度y/cm 41 63 70 72 84
r
n
xi yi nxy
i 1
n
n
xi2 nx2
yi2 ny 2
i 1
B.线性相关系数可以是正的也可以是负的
C.回归分析中, 如果 r2=1, 说明 x与 y之间完全线性相关
D.相关系数 r∈R
(2)一唱片公司欲知点歌费用 x(十万元)与唱片销售 y(千张) 之间的关系, 从其所发行的唱片中随机抽选了10张, 得到知下的
资料: xi 28, xi2 303.4, yi 75, yi2 598.5, xi yi 237,
(2)请算出下表中变量的线性相关系数 r, 通过计算发现了什么?
x -5 -4 -3 0 3 4 y 0 3 4 543
i xi yi xi2 yi2 xi yi 1 -5 0 25 0 0 2 -4 3 16 9 -12 3 -3 4 9 16 -12 4 0 5 0 25 0 5 3 4 9 16 12 6 4 3 16 9 12 7 5 0 25 0 0 Σ 0 19 100 75 0
n
n
r 来自百度文库xy
( xi x)( yi y)
i 1
xi yi nxy
i 1
lxx l yy
n
n
( xi x)2
( yi y)2
n
n
xi2 nx2
yi2 ny 2
i 1
i 1
i 1
i 1
2.回归方程误差:
n
Q(a,b) [ yi
i 1
其最小值为
(a
Q
bxi )]2 l yy
l yy
l2 xy
l xx
n[ y (a bx)]2 lxx (b
l yy (1
l2 xy
l yy lxx
)
l yy
l xy
)2
l
2 xy
l xx
l xx
(1 r2 )
.
误差的最小值:Q lyy (1 r2 )
【分析理解】
Q lyy(1 r2) Q 0 1 r2 0 r [1,1] l yy 0 r 的值越大 误差Q越小 变量之间的线性相关程度越高
变量之间的线性相关程度越低
对于线性回归方程 y=a+bx (b lxy ) r lxy
l xx
lxx l yy
i 1
n
n
xi2 17633, yi2 22790,
i 1
i 1
n
xi yi 20040, x 58.2, y 66
i 1
20040 5 58.2 66
17633 5 58.22 22790 5 662
0.9941.
由此可以得出, 肱骨长度 y和股骨长度 x有较强的线性相 关程度.
相关文档
最新文档