选修1-2回归分析的基本思想及其初步应用课件
合集下载
高中数学选修1-2精品课件:1.1 回归分析的基本思想及其初步应用

2.线性回归方程 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),回归 直线y=bx+a的斜率和截距的最小二乘估计公式分别为
n
n
xi- x yi- y xiyi-n x y
i=1
i=1
b^=
=
,a^= y -b^ x ,其中( x , y )称为样本点的
n
xi- x 2
价格x 需求量y
1.4
1.6
1.8
2
2.2
12
10
7
5
3
(1)画出散点图; 解 散点图如图所示.
解析答案
(2)求出y对x的线性回归方程;
解析答案
(3)如果价格定为1.9万元,预测需求量大约是多少. 解 当 x=1.9 时,^y=28.1-11.5×1.9=6.25(t), 所以价格定为1.9万元时,需求量大约是6.25 t.
6
繁殖个数y 6 12 25 49 95 190
求y对x的回归方程.
解析答案
易错点 忽视线性相关性的分析致误 例4 在一次抽样调查中测得变量x与y的一组样本数据如下表:
yi-^yi 0.05 0.005 -0.08 -0.045 0.04 0.025
yi-y -2.24 -1.37 -0.54 0.41 1.41 2.31
6
6
所以 (yi-^yi)2≈0.013 18, (yi- y )2=14.678 4.
i=1
i=1
所以,R2=1-01.40.16738148≈0.999 1,
反思与感悟
解析答案
跟踪训练1 某研究机构对高三学生的记忆力x和判断力y进行统计分析, 得下表数据:
x
《命题回归分析的基本思想及其初步应用》人教版高中数学选修1-2PPT课件(第1.1课时)

24
66
115
325
1.制作散点图
350
300
250
个
解
温度x/℃
200
150
100
50
0
20
22
24
26
28
℃
30
32
34
36
新知探究
2.观察模拟
样本点不能直接利用线性回归,根据我们的函数知识,它应该是一个指数模型:y=c1ec2x其中c1c2为
参数或二次函数模型,根据对数回归知识我们知道:令z=lny将其变换到样本点的分布直线z=a+bx
用回归模型拟合,如果没有错误,则需要找其他原因。
新知探究
残差图:
编号
1
2
3
4
5
6
7
8
身高/
cm
165
165
157
170
175
165
155
170
体重/
kg
48
57
50
54
64
61
43
59
残差
-6.373
2.627
2.419
-4.618
1.137
6.627
-2.883
0.382
8
6
4
2
0
-2 0
-4
-6
人教版高中数学选修1-2
第1章 统计案例
1.1命题回归分析的基本思想及其初步应用
PEOPLE'S EDUCATION PRESS HIGH SCHOOL MATHEMATICS ELECTIVE 1-2
讲解人: 时间:2020.6.1
2019人教版高中数学选修1-2课件:1.1 回归分析的基本思想及其初步应用(共40张PPT)

序号 1 2 3 4 5
总计
ui 15.0 25.8 30.0 36.6 44.4 151.8
yi
uiyi
39.4 225 591
42.9 665.64 1106.82
41.0 900 1230
43.1 1339.56 1577.46
49.2 1971.36 2184.48
215.6 5101.56 6689.76
考点类析
x 0.066 70.038 80.033 30.027 30.022 5 y 39.4 42.9 41.0 43.1 49.2
备课素材 求回归直线方程的方法技巧 [例] 某地最近十年粮食需求量逐年上升,下表是部分统计数据:
年份 2002 2004 2006 2008 2010
需求量/万吨 236 246 257 276 286 (1)利用所给数据求年需求量与年份之间的回归直线方程y^=b^x+a^; (2)利用(1)中所求出的直线方程预测该地 2012 年的粮食需求量.
考点类析
考点一 线性回归方程 例1 某设备的使用年限x和所支出的维修费 y(万元)有如下的统计资料:
x23456 y 2.2 3.8 5.5 6.5 7.0 若由资料可知,y与x之间具有线性相关关系. (1)求线性回归方程. (2)估计使用年限为10年时,维修费用为多少 万元?
解:(1)列表如下:
解:(1)该运动员训练次数(x)与成绩 (y)之间的散点图如图所示.
考点类析
例2 某运动员训练次数与运动成绩之间的 数据关系如下:
编号 1 2 3 4 5 6 7 8 次数(x) 30 33 35 37 39 44 46 50 成绩(y) 30 34 37 39 42 46 48 51 (1)作出散点图; (2)求出线性回归方程; (3)作出残差图,并说明模型的拟合效果; (4)计算R2,并说明其含义.
新课标人教A版高中数学选修1-2 《1.1 回归分析的基本思想及其初步应用》(共45张PPT)

在本例中,根据上面的公式,可以得到 ˆ = 0.849,a ˆ = -85.712. b ˆ = 0.849 x - 85.712. 于是得到线性回归方程y
n
n
ˆ = 0.849是回归直线的斜率的估计值,说明身高x b 每增加1个单位,体重y就增加0.849个单位,这表明体重 与身高具有正的线性相关关系.
图1.1 1
ˆ 和a ˆ, 未知参数 b 和 a 的最小二乘估计分别为 b 其计算公式如下:
ˆ b
x
i 1 n
n
i
x yi y
i
x
i 1
x
,
2
ˆ x, ˆ = y-b a
1 1 其中 x = xi ,y = yi . x,y 称为样本点 的 中心 . n i=1 n i=1
思考:如何发现数据中的错误?如何衡量模型的拟 合效果? 可以通过残差发现原始数据中的可疑数据,判 断所建立模型的拟合效果.下表列出了女大学生身 高和体重的原始数据以及相应的残差数据.
编号 1 2 3 4 170 5 6 7 155 8 170
身 高 / cm 165
165 157
175 165
体 重 / kg 48 57Fra bibliotek50 54 64 61 43 59 ˆ 6 .373 2 .627 2 .419 4 .618 1 .137 6 .627 2 .883 0 .382 残 差e
我们可以利用图形来分析残差特性.作图时纵 坐标为残差, 横坐标可以选为样本编号, 或身高数据, 或 体重估计值等, 这样作出的图形为残差图.下图 是以 样本编号为横坐标的残差图.
所以 ,对身高为 172 cm的女大学生 , 由回归方程可以 预报其体重为 ˆ = 0.849 172 - 85.712 = 60.316 ( kg) . y
n
n
ˆ = 0.849是回归直线的斜率的估计值,说明身高x b 每增加1个单位,体重y就增加0.849个单位,这表明体重 与身高具有正的线性相关关系.
图1.1 1
ˆ 和a ˆ, 未知参数 b 和 a 的最小二乘估计分别为 b 其计算公式如下:
ˆ b
x
i 1 n
n
i
x yi y
i
x
i 1
x
,
2
ˆ x, ˆ = y-b a
1 1 其中 x = xi ,y = yi . x,y 称为样本点 的 中心 . n i=1 n i=1
思考:如何发现数据中的错误?如何衡量模型的拟 合效果? 可以通过残差发现原始数据中的可疑数据,判 断所建立模型的拟合效果.下表列出了女大学生身 高和体重的原始数据以及相应的残差数据.
编号 1 2 3 4 170 5 6 7 155 8 170
身 高 / cm 165
165 157
175 165
体 重 / kg 48 57Fra bibliotek50 54 64 61 43 59 ˆ 6 .373 2 .627 2 .419 4 .618 1 .137 6 .627 2 .883 0 .382 残 差e
我们可以利用图形来分析残差特性.作图时纵 坐标为残差, 横坐标可以选为样本编号, 或身高数据, 或 体重估计值等, 这样作出的图形为残差图.下图 是以 样本编号为横坐标的残差图.
所以 ,对身高为 172 cm的女大学生 , 由回归方程可以 预报其体重为 ˆ = 0.849 172 - 85.712 = 60.316 ( kg) . y
人教版高中数学选修1-2(A版)课件:第一章 1.1回归分析的基本思想及其初步应用 (共93张PPT)

择决定命运唯一的今天。
昨日的明天是今天。明天的昨日是今天。为什么要计较于过去呢(先别急着纠正我的错误,你确实可以在评判过去中学到许多)。但是我发现有的人过分地瞻前顾后了。为 何不想想“现在”呢?为何不及时行乐呢?如果你的回答是“不”,那么是时候该重新考虑一下了。成功的最大障碍是惧怕失败。这些句子都教育我们:不要惧怕失败。如 果你失败了他不会坐下来说:“靠,我真失败,我放弃。”并且不是一个婴儿会如此做,他们都会反反复复,一次一次地尝试。如果一条路走不通,那就走走其他途径,不 断尝试。惧怕失败仅仅是社会导致的一种品质,没有人生来害怕失败,记住这一点。宁愿做事而犯错,也不要为了不犯错而什么都不做。不一定要等到时机完全成熟才动手。 开头也许艰难,但是随着时间的流逝,你会渐渐熟悉你的事业。世上往往没有完美的时机,所以当你觉得做某事还不是时候,先做起来再说吧。喜欢追梦的人,切记不要被 梦想主宰;善于谋划的人,切记空想达不到目标;拥有实干精神的人,切记选对方向比努力做事重要。太阳不会因为你的失意,明天不再升起;月亮不会因为你的抱怨,今 晚不再降落。蒙住自己的眼睛,不等于世界就漆黑一团;蒙住别人的眼睛,不等于光明就属于自己!鱼搅不浑大海,雾压不倒高山,雷声叫不倒山岗,扇子驱不散大雾。鹿 的脖子再长,总高不过它的脑袋。人的脚指头再长,也长不过他的脚板。人的行动再快也快不过思想!以前认为水不可能倒流,那是还没有找到发明抽水机的方法;现在认 为太阳不可能从西边出来,这是还没住到太阳从西边出来的星球上。这个世界只有想不到的,没有做不到的!不是井里没有水,而是挖的不够深;不是成功来的慢,而是放 弃速度快。得到一件东西需要智慧,放弃一样东西则需要勇气!终而复始,日月是也。死而复生,四时是也。奇正相生,循环无端,涨跌相生,循环无端,涨跌相生,循环 无穷。机遇孕育着挑战,挑战中孕育着机遇,这是千古验证了的定律!种子放在水泥地板上会被晒死,种子放在水里会被淹死,种子放到肥沃的土壤里就生根发芽结果。选
昨日的明天是今天。明天的昨日是今天。为什么要计较于过去呢(先别急着纠正我的错误,你确实可以在评判过去中学到许多)。但是我发现有的人过分地瞻前顾后了。为 何不想想“现在”呢?为何不及时行乐呢?如果你的回答是“不”,那么是时候该重新考虑一下了。成功的最大障碍是惧怕失败。这些句子都教育我们:不要惧怕失败。如 果你失败了他不会坐下来说:“靠,我真失败,我放弃。”并且不是一个婴儿会如此做,他们都会反反复复,一次一次地尝试。如果一条路走不通,那就走走其他途径,不 断尝试。惧怕失败仅仅是社会导致的一种品质,没有人生来害怕失败,记住这一点。宁愿做事而犯错,也不要为了不犯错而什么都不做。不一定要等到时机完全成熟才动手。 开头也许艰难,但是随着时间的流逝,你会渐渐熟悉你的事业。世上往往没有完美的时机,所以当你觉得做某事还不是时候,先做起来再说吧。喜欢追梦的人,切记不要被 梦想主宰;善于谋划的人,切记空想达不到目标;拥有实干精神的人,切记选对方向比努力做事重要。太阳不会因为你的失意,明天不再升起;月亮不会因为你的抱怨,今 晚不再降落。蒙住自己的眼睛,不等于世界就漆黑一团;蒙住别人的眼睛,不等于光明就属于自己!鱼搅不浑大海,雾压不倒高山,雷声叫不倒山岗,扇子驱不散大雾。鹿 的脖子再长,总高不过它的脑袋。人的脚指头再长,也长不过他的脚板。人的行动再快也快不过思想!以前认为水不可能倒流,那是还没有找到发明抽水机的方法;现在认 为太阳不可能从西边出来,这是还没住到太阳从西边出来的星球上。这个世界只有想不到的,没有做不到的!不是井里没有水,而是挖的不够深;不是成功来的慢,而是放 弃速度快。得到一件东西需要智慧,放弃一样东西则需要勇气!终而复始,日月是也。死而复生,四时是也。奇正相生,循环无端,涨跌相生,循环无端,涨跌相生,循环 无穷。机遇孕育着挑战,挑战中孕育着机遇,这是千古验证了的定律!种子放在水泥地板上会被晒死,种子放在水里会被淹死,种子放到肥沃的土壤里就生根发芽结果。选
高中数学人教A版选修1-2第一章回归分析的基本思想及其初步应用课件

高中数学人教A版选修1-2第一章回归 分析的 基本思 想及其 初步应 用课件 【精品 】
高中数学人教A版选修1-2第一章回归 分析的 基本思 想及其 初步应 用课件 【精品 】
残差图的制作及作用
1、坐标纵轴为残差变量,横轴可以有不同的选择; 2、若模型选择的正确,残差图中的点应该分布在以横
轴为心的带形区域; 3、对于远离横轴的点,要特别注意。
34 157 170
50 54
2.419 -4.618
5 175
64
1.137
678 165 155 170
61 43 59
6.627 -2.883 0.382
(一)我们可以利用图形来分析残差特性,作图时纵坐标为 残差,横坐标可以选为样本编号,或身高数据,或体重估计值 等,这样作出的图形称为残差图。
探索2:在这些点附近可画直线不止一条,哪条直 线最能代表x与y之间的关系呢?
探究
对于一组具有线性相关关系的数据 (x1, y1), (x2 , y2 ),..., (xn , yn ),
我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:
^
^
a y b x,......(1)
n
n
y ^
编号 1
2
身高 165 165 /cm
体重/kg 48 57
残差 -6.373 2.627
34 157 170
50 54
2.419 -4.618
5 175
64
1.137
678 165 155 170
61 43 59
6.627 -2.883 0.382
(一)我们可以利用图形来分析残差特性,作图时纵坐标为 残差,横坐标可以选为样本编号,或身高数据,或体重估计值 等,这样作出的图形称为残差图。
2019年人教版选修1-2高中数学1.1回归分析的基本思想及其初步应用优质课课件

回顾复 习
必修3(第二章 统计)知识结构
整理、分析数据 估计、推断 用样本估计总体 变量间的相关关系
收集数据
(随机抽样)
简 单 随 机 抽 样
分 层 抽 样
系 统 抽 样
用样本 的频率 分布估 计总体 分布
用样本 数字特 征估计 总体数 字特征
线 性 回 归 分 析
回顾复 习 问题1:现实生活中两个变量间的关系有哪些呢?
法一:我们可以通过残差分析发现原始数据中的可疑数据, 判断建立模型的拟合效果。
(1)计算 ei yi b xi a (i=1,2,...n) 残差分析( 2)画残差图 ①查找异常样本数据 3)分析残差图 ( ②残差点分布在以x轴为中心的水平带状区域,并沿 水平方向散点的分布规律相同。
3.
7.
y=bx+a
4.
用回归直线方程 解决应用问题
8. 9.
自学指 导
阅读课本1页—6页思考回答下列问题
(注意:时间12分钟)
1:结合例1得出线性回归模型及随机误差,并且区分 函数模型和回归模型。
2:在线性回归模型中,e是用bx+a预报真实值y的随 机误差,它是一个不可观测的量,那么应如何研究随机 误差呢? 3:如何发现数据中的错误?如何衡量随机模型的拟合效 果? 4:结合例1思考:用回归方程预报体重时应注意什 么? 5:归纳建立回归模型的基本步骤。
残差图的制作和作用: 制作:坐标纵轴为残差变量, 横轴可以有不同的选择.可以为编号;可以为解释变 量 作用:判断模型的适用性若模型选择的正确,残差图中 的点应该分布在以横轴为中心的水平带状区域.
下面表格列出了女大学生身高和体重的原始数据以及相应的残差数
必修3(第二章 统计)知识结构
整理、分析数据 估计、推断 用样本估计总体 变量间的相关关系
收集数据
(随机抽样)
简 单 随 机 抽 样
分 层 抽 样
系 统 抽 样
用样本 的频率 分布估 计总体 分布
用样本 数字特 征估计 总体数 字特征
线 性 回 归 分 析
回顾复 习 问题1:现实生活中两个变量间的关系有哪些呢?
法一:我们可以通过残差分析发现原始数据中的可疑数据, 判断建立模型的拟合效果。
(1)计算 ei yi b xi a (i=1,2,...n) 残差分析( 2)画残差图 ①查找异常样本数据 3)分析残差图 ( ②残差点分布在以x轴为中心的水平带状区域,并沿 水平方向散点的分布规律相同。
3.
7.
y=bx+a
4.
用回归直线方程 解决应用问题
8. 9.
自学指 导
阅读课本1页—6页思考回答下列问题
(注意:时间12分钟)
1:结合例1得出线性回归模型及随机误差,并且区分 函数模型和回归模型。
2:在线性回归模型中,e是用bx+a预报真实值y的随 机误差,它是一个不可观测的量,那么应如何研究随机 误差呢? 3:如何发现数据中的错误?如何衡量随机模型的拟合效 果? 4:结合例1思考:用回归方程预报体重时应注意什 么? 5:归纳建立回归模型的基本步骤。
残差图的制作和作用: 制作:坐标纵轴为残差变量, 横轴可以有不同的选择.可以为编号;可以为解释变 量 作用:判断模型的适用性若模型选择的正确,残差图中 的点应该分布在以横轴为中心的水平带状区域.
下面表格列出了女大学生身高和体重的原始数据以及相应的残差数
高中数学选修1-2-回归分析第一节.ppt

=
,a^ = y -b^ x ,
n
xi- x 2
n
x2i -n x 2
i=1
i=1
其中 x =1ni=n1xi, y =1ni=n1yi,( x , y )称为样本点的中心.
课前探究学习
课堂讲练互动
(3)解释变量和预报变量 线性回归模型与一次函数模型的不同之处是增加了随机误差项e, 因变量y由 自变量x 和 随机误差e 共同确定,即自变量x只解 释部分y的变化,在统计中,我们也把自变量x称为解释变量,因变 量y称为预报变量.
课前探究学习
课堂讲练互动
【变式1】 以下是某地搜集到的新房屋的销售价格y和房屋的面积x 的数据:
房屋面积/m2 115 110 80 135 105 销售价格/万元 24.8 21.6 18.4 29.2 22
(1)画出数据对应的散点图; (2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150 m2时的销售价格.
1.1 回归分析的基本思想及其初步应用
课前探究学习
课堂讲练互动
【课标要求】 1.了解随机误差、残差、残差分析的概念; 2.会用残差分析判断线性回归模型的拟合效果; 3.掌握建立回归模型的步骤; 4.通过对典型案例的探究,了解回归分析的基本思想方法
和初步应用.
课前探究学习
课堂讲练互动
【核心扫描】 1.利用散点图分析两个变量是否存在相关关系,求线性回归方
6
所以
(yi-y^ i)2≈0.013
6
18,
(yi- y )2=14.678 4.
i=1
i=1
所以,R2=1-01.40.16378184≈0.999 1, 回归模型的拟合效果较好.
,a^ = y -b^ x ,
n
xi- x 2
n
x2i -n x 2
i=1
i=1
其中 x =1ni=n1xi, y =1ni=n1yi,( x , y )称为样本点的中心.
课前探究学习
课堂讲练互动
(3)解释变量和预报变量 线性回归模型与一次函数模型的不同之处是增加了随机误差项e, 因变量y由 自变量x 和 随机误差e 共同确定,即自变量x只解 释部分y的变化,在统计中,我们也把自变量x称为解释变量,因变 量y称为预报变量.
课前探究学习
课堂讲练互动
【变式1】 以下是某地搜集到的新房屋的销售价格y和房屋的面积x 的数据:
房屋面积/m2 115 110 80 135 105 销售价格/万元 24.8 21.6 18.4 29.2 22
(1)画出数据对应的散点图; (2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150 m2时的销售价格.
1.1 回归分析的基本思想及其初步应用
课前探究学习
课堂讲练互动
【课标要求】 1.了解随机误差、残差、残差分析的概念; 2.会用残差分析判断线性回归模型的拟合效果; 3.掌握建立回归模型的步骤; 4.通过对典型案例的探究,了解回归分析的基本思想方法
和初步应用.
课前探究学习
课堂讲练互动
【核心扫描】 1.利用散点图分析两个变量是否存在相关关系,求线性回归方
6
所以
(yi-y^ i)2≈0.013
6
18,
(yi- y )2=14.678 4.
i=1
i=1
所以,R2=1-01.40.16378184≈0.999 1, 回归模型的拟合效果较好.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
残差公式 eˆi(1) = yi - yˆ(1) = yi - e0.272x-3.843 ,(i = 1,2...7)
eˆi(2) = yi - yˆ(2) = yi - 0.367x2 + 202.54,
残
差
表
编号 1
2
x 21 23
y 7 11
e(1) 0.52 -0.167
e(2) 47.7 19.397
抽样
样本分析
y%= f(x)
回归模型
y$= f(x)
60
体重
40
线性 (体重) 线性 (体重)
20
线性 (体重)
0
150 160 170 180
它的均值E(e)= 0,方差D(e)=σ2 > 0
(1)由图形观察可以看出,样本点呈条状分 布,身高和体重有比较好的线性相关关系,因 此可以用线性回归方程刻画它们之间的关系。
80 60 40 20
0 150
y
350 300 250 200 150 100
50 0 0
y 200 400 600 800 1000 1200 1400
散点并不集中在一条直线的附近,因此用线 性回归模型拟合他们的效果不是最好的。
非线性回归方程 yˆ(1) = e0.272x-3.843 ,
二次回归方程 yˆ(2) = 0.367x2 - 202.54
现在有三个不同的回归模型可供选择来拟合 红铃虫的产卵数与温度数据,他们分别是:
y ax b e, y c1ec2xe ,
y x2 e.
z c2x b e
yt e
可以利用直观(散点图和残差图)、相关指
数来确定哪一个模型的拟合效果更好。
小
结
实际问题 y = f(x)
1、所求直线方程 yˆ = bˆ x + aˆ 叫做回归直
---线方程;其中
n
n
y bˆ =
(xi - x)(yi - y)
i=1 n
=
(xi - x)2
xi
- nxy
i
i=1
n xi2 - nx2
,
i=1
i=1
aˆ = y - bˆx
2.相应的直线叫做回归直线。
3、对两个变量进行的线性分析叫做线性 回归分析。
在一条指数曲线或二次曲线的附近。
解:1)用y = c1ec2x模型; 令 z = lny
思
则z=bx+a,(a=lnc1,b=c2),列出变换后数据表并 、
画
出x与z 的散点图
议
x 21 23 25 27 29 32 35
、
z 1.946 2.398 3.045 3.178 4.19 4.745 5.784 检
图表标题 y = 0.8485x - 85.712
yˆ
yˆ
160 170 180
体重 线性 (体重) 线性 (体重) 线性 (体重)
线性回归模型
y=bx+a+e E(e)= 0, D(e)=σ2
y=bx+a+e其中a和b为模型的未知参数,
e是y与 yˆ 之间的误差,通常e称为随机误差。
为了衡量预报的精度,需要估计的5
4
3
z
2
1
0
0
10
20
30
40
x和z之间的关系可以用线性回归模型来拟合
z = ax+ b+e
2) 用 y=c3x2+c4 模型,令 t = x2 ,则y=c3t+c4 ,列出 变换后数据表并画出t与y 的散点图
t 441 529 625 729 841 1024 1225 y 7 11 21 24 66 115 325
1 n2
n i 1
eˆi2
1 Q(aˆ, bˆ)(n n2
2)
Q(aˆ, bˆ)称为残差平方和
(1)根据散点图来粗略判断它们是否线性相关。
(2)是否可以用线性回归模型来拟合数据
(3)通过残差 eˆ1,eˆ2,eˆ3,.....eˆn, 来判断模型拟合的效
果这种分析工作称为残差分析
残差
6000
i=1 n
=
(xi - x)2
xi
- nxy
i
i=1
n xi2 - nx2
,
i=1
i=1
aˆ = y - bˆx
预报精度
思、议、展
在含有一个解释
1.相关指数R2
变量的线性 模型
n
n
(yi - y$i)2
(y$i - y)2
中R2=r2(相关关系)
R2 = 1 - i=1 n
= i=1 n
500
· · 450
(xi ,yi )
· · 400 |yi - y$i |
··· 350
(xi ,y$i )
300
10 20 30 40 50
思、议、展
施化肥量 x
n
Q(a,b)= (yi - bxi - a)2 取最小值时,a,b的值. i=1
推导过程请阅读P92
最小二乘法:yˆ = bˆ x + aˆ
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
思、议
自学思考:
1.相关关系的概念?你能举例说明吗? 2.如何分析两个变量之间的相关关系?
1、定义:
思、议、展
自变量取值一定时,因变量的取值带有一定随
机性的两个变量之间的关系叫做相关关系。
n
Q( , ) ( yi xi )2 i 1
随机误差ei yi bxi a(i 1, 2,....n) 其估计值为: eˆi yi yˆi yi bˆxi aˆ eˆi称为相应点(xi,yi )的残差
类比样本方差估计总体方差的思想
ˆ 2
3 25 21 1.76 -5.835
4 27 24 -9.149 -41.003
5 29 66 8.889 -40.107
6 32 115 -14.153 -58.268
7 35 325 32.928 77.965
在此处可以引导学生体会应用统计方法解决实际 问题需要注意的问题:对于同样的数据,有不 同的统计方法进行分析,我们要用最有效的方 法分析数据。
水稻产量y 330 345 365 405 445 450 455
y
500 水稻产量
450
· ··
400
·
350 · · ·
300
散点图 施化肥量
10 20 30 40 50
x
探索2:在这些点附近可画直线不止一条,
哪条直线最能代表x与y之间的关系呢?
发现:图中各点,大致分布在某条直线附近。
y 水稻产量
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
y
500 水稻产量
450
· ··
400
·
350 · · ·
300
施化肥量
解: 1.画出散点1图0 20 30
40 50
x
2.求出b = 4.75, a = 256.79
3.写出回归方程 yˆ = 4.75x + 256.79
负相关
正相关
相关系数
思、议、展
n
r>r0= 正i相n=1i(关=x1i(;-xxir)-2<x×)i0(=ny1i负(-y相yi)-关y)2.通常,
r∈[-1,-0.75]--负相关很强;
r∈[0.75,1]—正相关很强; r∈[-0.75,-0.3]--负相关一般; r∈[0.3, 0.75]—正相关一般; r∈[-0.25, 0.25]--相关性较弱;
(2)从散点图还可以看到,样本点散布在某一条
直线的附近,而不是一条直线上,所以不能用一次
函数y=bx+a来描述它们之间的关系。这时我
们用下面的线性回归模型来描述身高和体重的关系:
y=bx+a+e其中a和b为模型的未知参数,e
是y与 之间的yˆ 误差,通常e称为随机误差。
图表标题
y = 0.8485x - 85.712 80
4000
2000 0
残差
-2000 0
2
4
6
8
10
12
-4000
使学生了解残差图的制作及作用。P98 • 坐标纵轴为残差变量,横轴可以有不同的选择; • 若模型选择的正确,残差图中的点应该分布在以 横轴为心的带形区域; • 对于远离横轴的点,要特别注意。
身
高
异
与
常
体 重
点
残 差 图
• 错误数据 • 模型问题
4.计算相关系数 r = 0.9718
思、议、
例题1 从某大学中随机选出8名女大学生,其身 高和体重数据如下表:
编号 1 2 3 4 5 6 7 8 身高 165 165 157 170 175 165 155 170 体重 48 57 50 54 64 61 43 59
求根据一名女大学生的身高预报她的体重的 回归方程,并预报一名身高为172cm的女 大学生的体重。
温度x 21 23 25 27 29 32 35 产卵数y 7 11 21 24 66 115 325
解:1)作散点图; 350 300
250
200
产卵数
150
100
50
0
20
22
24
26