《回归分析》教案2
《回归分析》教案2
一、学习目标
1、了解回归分析的基本思想、方法及初步应用
2、了解两个具有相关关系的变量进行统计分析的步骤
3、了解判断刻画模型拟合效果的方法-—相关指数和残差分析
二、知识回顾
1.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤: 收集数据→作散点图→求回归直线方程→利用方程进行预报.
2.求回归直线方程的步骤:
第一步:列数据表,
第二步:计算;最小二乘法的公式:1
1
22
2
1
1
()()
()
n n
i
i
i
i
i i n
n
i
i
i i x y nx y x x y y b x
n x x x ====?-?--=
=
-?-∑∑∑∑,
a y bx =-
第三步:写出回归方程
(()11
1,,n
n
i i i i x x y y x y n ====∑∑;
为样本中心) 三、例题解析
例1、某种产品的广告费用支出x 万元与销售额y 万元之间有如下的对应数据:
(1)画出散点图;(2)求回归直线方程;(3)据此估计广告费用为12万元时,销售收入y 的值.
解:(1)作
散点图
(2)求回归直线方程
=x =
y
∑=
i i y x
∑=
2
i x
例题小结:
1.最小二乘法求回归方程和进行预报的步骤:第一步:作______;第二步:求_______;第三步:代值预报
2.思考:线性回归模型与一次函数相同吗?
事实上,销售额和广告费用支出之间的关系并不能用一次函数来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画支出和销售额的关系).这就说明销售额不仅受广告费用支出的影响还受其他因素的影响,我们把这种影响的结果e (即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e =++,其中残差变量e 中包含销售额不能由广告支出的线性函数解释的所有部分.
其中:解释变量为:x 预报变量为:?y
随机误差为:e 特别地:当残差变量恒等于0时,线性回归模型就变成一次函数模型. 四、知识构建
1.残差:??i i i e
=y -y ;残差点比较均匀地落在水平带状区域中,说明选用的模型比较合适,带状区域的宽度越窄说明拟合的精度越_____,回归方程的预报精度越_____.
i x i y i i y x 2i x
合计
2.总体偏差平方和:()
2
y -∑n
i 1
y ; 残差平方和:()2
?i y
-∑n
i 1
y 3.回归效果的相关指数:()()
2
1
2
1
?1n
i
i
n
i y y
y y -=-
-∑∑2
R
R 2
越大,意味()2
?i y
-∑n
i 1
残差平方和
y 越______,即拟合效果越______;
R 2越小,残差平方和越______,即拟合的效果越________.
练习:如果散点图的所有的样本点都落在一条斜率非0实数的直线上,则解释变量和预报变量是________关系,R 2=___________
五、知识应用
例、关于x 与y 有如下数据:
为了对、y 两个变量进行统计分析,现有以下两种线性模型: 6.517.5y x =+,
$717y x =+,试比较哪一个模型拟合的效果更好.