《回归分析》教案1

《回归分析》教案1
《回归分析》教案1

《回归分析》教案1

【教学目标】

1. 了解相关系数r ;

2. 了解随机误差;

3. 会简单应用残差分析

【教学重难点】

教学重点:相关系数和随机误差 教学难点:残差分析应用.

【教学过程】

一、设置情境,引入课题

上节例题中,身高172cm 女大学生,体重一定是60kg 吗?如果不是,其原因是什么? 二、引导探究,发现问题,解决问题

1 $0.84985.712y x =-对于0.849b

=$是斜率的估计值,说明身高x 每增加1个单位,体重就 ,表明体重与身高具有 的线性相关关系.

2 如何描述线性相关关系的强弱?

()()

n

i

i

x x y y r --=

(1)r >0表明两个变量正相关;(2)r <0表明两个变量负相关;

(3)r 的绝对值越接近1,表明相关性越强,r 的绝对值越接近0,表明相关性越弱. (4)当r 的绝对值大于0.75认为两个变量具有很强的相关性关系.

3 身高172cm 的女大学生显然不一定体重是60.316kg ,但一般可以认为她的体重接近于60.316kg .

①样本点与回归直线的关系

②所有的样本点不共线,而是散布在某一条直线的附近,该直线表示身高与体重的关系的线性回归模型表示y bx a ε=++

e 是y 与$y bx a =+的误差,e 为随机变量,e 称为随机误差. ③E (e )=0,D (e )= 2σ>0.④D (e )越小,预报真实值y 的精度越高. ⑤随机误差是引起预报值$y 与真实值y 之间的误差之一.

⑥$,a b $为截距和斜率的估计值,与a ,b 的真实值之间存在误差,这种误差也引起$y 与真

实值y 之间的误差之一.

4 思考

产生随机误差项e 的原因是什么?

5 探究在线性回归模型中,e 是用$y 预报真实值y 的误差,它是一个不可观测的量,那么应该怎样研究随机误差?如何衡量预报的精度?

①2

()D e σ=来衡量随机误差的大小.②μi i i e y y =- ③μμ$i i i i i

e y y y bx a =-=--$ ④μ$22111(,)(2)22

n i e Q a b n n n σ

===>--∑$$ ⑤$(,)Q a b $称为残差平方和,μ2

σ

越小,预报精度越高. 6 思考

当样本容量为1或2时,残差平方和是多少?用这样的样本建立的线性回归方程的预报误差为0吗?

7 残差分析

①判断原始数据中是否存在可疑数据;②残差图 ③相关指数μ

2

2

1

2

1

()1()

n

i

i

i n

i

i y y R y y ==-=-

-∑∑

④R 2越大,残差平方和越小,拟合效果越好;R 2越接近1,表明回归的效果越好. 8 建立回归模型的基本步骤:

①确定研究对象,明确哪个变量时解释变量,哪个变量时预报变量. ②画出确定好的解释变量和预报变量得散点图,观察它们之间的关系; ③由经验确定回归方程的类型; ④按一定规则估计回归方程中的参数; ⑤得出结果后分析残差图是否异常. 三、典型例题

例1 下表是某年美国旧轿车价格的调查资料,今以x 表示轿车的使用年数,y 表示响应的年均价格,求y 关于x 的回归方程

减,但不在一条直线附近,但据此认为y 与x 之间具有线性回归关系是不科学的,要根据图的形状进行合理转化,转化成线性关系的变量间的关系.

解:作出散点图如下图

可以发现,各点并不是基本处于一条直线附近,因此,y 与x 之间应是非线性相关关系.

与已学函数图像比较,用$μ

μ

bx a y e +=来刻画题中模型更为合理,令$ln z y =$,则$z

bx a =+$$, 题中数据变成如下表所示: 拟合,由表中数据可得0.996,0.75r r ≈->,认为x 与z 之间具有线性相关关系,由表中数

据的$0.298,8.165,b a ≈-≈$所以0.2988.165z x =-+$,最后回代$ln z y =$,

即$0.2988.165x y e -+= 四、当堂练习:

1 两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合效果最好的模型是( )

A 模型1的20.98R =

B 模型2的20.80R =

C 模型3的20.50R =

D 模型4的20.25R = 答案 A 五、课堂小结

1 相关系数r 和相关指数R

2 2 残差分析

y

500

相关主题
相关文档
最新文档