1-2第一节《1.1回归分析的基本思想及其初步应用》1ppt课件9

合集下载

新课标人教A版高中数学选修1-2 《1.1 回归分析的基本思想及其初步应用》(共45张PPT)

新课标人教A版高中数学选修1-2 《1.1 回归分析的基本思想及其初步应用》(共45张PPT)
在本例中,根据上面的公式,可以得到 ˆ = 0.849,a ˆ = -85.712. b ˆ = 0.849 x - 85.712. 于是得到线性回归方程y
n
n
ˆ = 0.849是回归直线的斜率的估计值,说明身高x b 每增加1个单位,体重y就增加0.849个单位,这表明体重 与身高具有正的线性相关关系.
图1.1 1
ˆ 和a ˆ, 未知参数 b 和 a 的最小二乘估计分别为 b 其计算公式如下:
ˆ b
x
i 1 n
n
i
x yi y
i
x
i 1
x
,
2
ˆ x, ˆ = y-b a
1 1 其中 x = xi ,y = yi . x,y 称为样本点 的 中心 . n i=1 n i=1
思考:如何发现数据中的错误?如何衡量模型的拟 合效果? 可以通过残差发现原始数据中的可疑数据,判 断所建立模型的拟合效果.下表列出了女大学生身 高和体重的原始数据以及相应的残差数据.
编号 1 2 3 4 170 5 6 7 155 8 170
身 高 / cm 165
165 157
175 165
体 重 / kg 48 57Fra bibliotek50 54 64 61 43 59 ˆ 6 .373 2 .627 2 .419 4 .618 1 .137 6 .627 2 .883 0 .382 残 差e
我们可以利用图形来分析残差特性.作图时纵 坐标为残差, 横坐标可以选为样本编号, 或身高数据, 或 体重估计值等, 这样作出的图形为残差图.下图 是以 样本编号为横坐标的残差图.
所以 ,对身高为 172 cm的女大学生 , 由回归方程可以 预报其体重为 ˆ = 0.849 172 - 85.712 = 60.316 ( kg) . y

《1.1 回归分析的基本思想及其初步应用》PPT课件(河北省县级优课)

《1.1 回归分析的基本思想及其初步应用》PPT课件(河北省县级优课)
人教A版高中数学选修1-2
非线性相关问题
建立回归方程的一般步骤:
1.确定变量 2.制作散点图,观察是否相关 3.确定回归方程的类型(线性回归、指数回归、对数回归等) 4.利用公式确定回归参数 5.利用残差分析回归是否合理或模型是否合适
例1 一只红蛉虫的产卵数y与温度x有关,现收集了7组数据,请建立y 与x的回归方程
为什么这样说?
4.残差分析:
X
21
23
25
27
29
32
35 合计(残差 R2
Y
7
平方和)
11
21
24
66
115
329
e(1) 0.518 -0.167 1.760 -9.149 8.889
- 32.928 1450.673
14.153
e(2) 47.693 19.397 -5.835
-
-
- 77.965 15448.43
y=c e 函数模型:
1 c2x其中c1、c2为参数或二次函数y=c3x2+c4模型,
根据对数知识我们知道:令z=lny将其变换到直线z=a+bx
x 21 23 25 27 29 32 35
产卵数的对数
z
7 6 5 4 3 2 1 0
20 22
1.9 2.39 3.0 46 8 45
24 26 28 30 32 34 36 温度
年宣传费x=49时,年销售量及年利润的预报值是多少? 年宣传费x为何值时,年利率的预报值最大? 附:对于一组数据(u1 v1),(u2 v2)…….. (un vn),其回归 直线v=u的斜率和截距的最小二乘估计分别为:
感受真题
回归 分基本思想Fra bibliotek回归分析

《回归分析的基本思想及其初步应用》PPT精品课件人教版1

《回归分析的基本思想及其初步应用》PPT精品课件人教版1
所以,对于身高为172cm的女大学生,由回归方程可以预报其体重为
y 0 .8 4 9 7 2 8 5 .7 1 2 6 0 .3 1 6 (k g )
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
在统计中,我们也把自变量x称为解析变量,因变量y称为预报变量。
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
案例1:女大学生的身高与体重
n
( yi y ) 2 表示总的效应,称为总偏差平方和。
i1
在例1中,总偏差平方和为354。
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。 解:1、选取身高为自变量x,体重为因变量y,作散点图:
2、由散点图知道身高和体重有比较好的
线性相关关系,因此思可考以用P线4性回归方程
刻 3直、画 线从它 的散们 附点之 近图间 ,还的 而产看的关 不生到原系是,随因。在样机一是本条误什点直差散么线项布?上在e,某所一以条
高 中 数 学 人 教版选 修1-2: 1.1 《 回 归分 析的基 本思想 及其初 步应用 》共3 1张PP

高中数学选修1-2-回归分析第一节.ppt

高中数学选修1-2-回归分析第一节.ppt

,a^ = y -b^ x ,
n
xi- x 2
n
x2i -n x 2
i=1
i=1
其中 x =1ni=n1xi, y =1ni=n1yi,( x , y )称为样本点的中心.
课前探究学习
课堂讲练互动
(3)解释变量和预报变量 线性回归模型与一次函数模型的不同之处是增加了随机误差项e, 因变量y由 自变量x 和 随机误差e 共同确定,即自变量x只解 释部分y的变化,在统计中,我们也把自变量x称为解释变量,因变 量y称为预报变量.
课前探究学习
课堂讲练互动
【变式1】 以下是某地搜集到的新房屋的销售价格y和房屋的面积x 的数据:
房屋面积/m2 115 110 80 135 105 销售价格/万元 24.8 21.6 18.4 29.2 22
(1)画出数据对应的散点图; (2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150 m2时的销售价格.
1.1 回归分析的基本思想及其初步应用
课前探究学习
课堂讲练互动
【课标要求】 1.了解随机误差、残差、残差分析的概念; 2.会用残差分析判断线性回归模型的拟合效果; 3.掌握建立回归模型的步骤; 4.通过对典型案例的探究,了解回归分析的基本思想方法
和初步应用.
课前探究学习
课堂讲练互动
【核心扫描】 1.利用散点图分析两个变量是否存在相关关系,求线性回归方
6
所以
(yi-y^ i)2≈0.013
6
18,
(yi- y )2=14.678 4.
i=1
i=1
所以,R2=1-01.40.16378184≈0.999 1, 回归模型的拟合效果较好.

人教A版选修1-2----1.1-回归分析的基本思想及其初步应用----课件(49张)

人教A版选修1-2----1.1-回归分析的基本思想及其初步应用----课件(49张)

方法技巧 求线性回归方程的基本步骤 (1)列出散点图,从直观上分析数据间是否存在线性相关关系;
n
n
n
(2)计算: x , y ,x2i ,y2i ,xiyi;
i=1
i=1
i=1
(3)代入公式求出^y =^b x+^a 中参数^b ,^a 的值; (4)写出线性回归方程并对实际问题作出估计.
提醒:只有在散点图大致呈线性时,求出的回归方程才有实际意义,否则求出的回归 方程毫无意义.
相应的散点图如图 2.
z 1.79 2.48 3.22 3.89 4.55 5.25
从图 2 可以看出,变换后的样本点分布在一条直线附近,因此可以用线性回归方程来
拟合.
6
xi- x zi- z
i=1
由^b=
≈0.69,
6
xi- x 2
i=1
^a= z -^b x =1.115,得^z =0.69x+1.115; 则有^y =e0.69x+1.115.
其中 x =
n1i=n1xi , y n1i=n1yi ,( x , y )称为样本点的 中心 .
知识点二 线性回归分析 预习教材P3-8,思考并完成以下问题 (1)利用什么方法判断所建立的线性模型的拟合效果? 提示:利用残差.
(2)由散点图知,残差有正、负,如何更好地判断拟合效果?
n
提示:利用残差平方和,即 (yi-^yi)2 越小,R2 越大,拟合效果越好.
5
xiyi=1 380.
i=1
5
xiyi-5 x y
i=1
于是可得^b=
5
xi2-5 x 2
i=1
=1 318405--55××55×2 50=6.5,
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 2 2 2 2 = 88 + 76 + 73 + 66 + 63 =27 174. x2 i 5
5
i=1
所以b=
^
i=1
xiyi-5 x y
2 2 x - 5 x i 5
5
25 054-5×73.2×67.8 = 27 174-5×73.22
i=1
≈0.625.
a= y -b x ≈67.8-0.625×73.2=22.05. 所以 y 对 x 的回归直线方程是 y=0.625x+22.05. (3)x=96,则y=0.625×96+22.05≈82, 即可以预测他的物理成绩是 82.
n ^ 2 (yi-yi) 称为残差平方和 ^ ^ ^ ^
i=1
利用图形来分析残差特性,作图时纵坐标为 残差 ,横 残差图 坐标可以选为 样本编号 ,或 身高数据 ,或体重估计值 等,这样作出的图形称为残差图
残差 图法
残差点比较均匀地落在水平的带状区域内,说明选 用的模型比较适合,这样的带状区域的宽度越窄, 说明模型拟合精度越高
注 1):相关关系是一种不确定性关系; 2):对具有相关关系的两个变量进行
统计分析的方法叫回归分析。
课前探究学习
课堂讲练互动
活页规范训练
2、现实生活中存在着大量的相关关系。
如:人的身高与年龄; 产品的成本与生产数量;
商品的销售额与广告费;
家庭的支出与收入。等等
课前探究学习
课堂讲练互动
活页规范训练
2、回归直线方程: ˆ +a 1、所求直线方程 y ˆ 叫做回归直 ˆ = bx ---线方程;其中
[思路探索] 先利用散点图分析物理成绩与数学成绩是否线性相关,
若相关再利用线性回归模型求解.

(1)散点图如图.
1 (2) x =5×(88+76+73+66+63)=73.2, 1 y = ×(78+65+71+64+61)=67.8. 5
i=1
xiyi=88×78+76×65+73×71+66×64+63×61=25 054.
必修3(第二章 统计)知识结构
收集数据
(随机抽样)
整理、分析数据 估计、推断 用样本估计总体 变量间的相关关系
简 单 随 机 抽 样
分 层 抽 样
系 统 抽 样
用样本 的频率 分布估 计总体 分布
用样本 数字特 征估计 总体数 字特征
线 性 回 归 分 析
相关系数
1.计算公式
r=
(x
i=1 n i=1

6
275, xiyi=1 076.2
i=1
^ ^
6
计算得,b≈0.183,a≈6.285, 所求回归直线方程为y=0.183x+6.285.
^
(2)列表如下:
yi-yi
^
0.05
①y=axn(其中a,x,y均为正值)(幂函数型函数)
lg y=lg a+n lg x,令u=lg y,v=lg x,b=lg a, 则u=nv+b,图象为一直线. ②y=cax(a>0,c>0)(指数型函数) lg y=x lg a+lg c,令u=lg y,b=lg c,d=lg a,
则u=dx+b,图象为一直线.
e为
(2)对参数 a 和 b 的估计,由《数学必修 3》可知:最小二乘法估 计a和b就是未知参数 a、b 的最好估计,其计算公式为
^ ^
b=
^
i=1
xi- x yi- y xiyi-n x y
i=1
n
n

i=1
xi- x
n
2
i=1
2 - n x x2 i
n
,a= y -b x ,
3.建立回归模型的基本步骤 (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报 变量. (2)画出确定好的解释变量和预报变量的散点图,观察它们之间 的关系(如是否存在线性关系等).
(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,
则选用线性回归方程). (4)按一定规则(如最小二乘法)估计回归方程中的参数. (5)得出结果后分析残差图是否有异常(如个别数据对应残差过大 或残差呈现不随机的规律性等).若存在异常,则检查数据是否
1.1 回归分析的基本思想及其初步应用
【课标要求】
1.了解随机误差、残差、残差分析的概念; 2.会用残差分析判断线性回归模型的拟合效果; 3.掌握建立回归模型的步骤; 4.通过对典型案例的探究,了解回归分析的基本思想方法
和初步应用.
重点:利用散点图分析两个变量是否存在相关关系,求线性回 归方程. 难点、易错点:回归模型的选择,特别是非线性回归模型.
残差平 残差平方和为 (yi-y) ,残差平方和 越小 ,模型
i=1
n
^ 2
方和 拟合效果越好
i=1

n
n
^ 2 yi-yi
相关指 R2=1- 数R
2
Байду номын сангаас
, R2 表示 解释 变量对 预报 变量变
i=1
2 y - y i
化的贡献率,R2 越接近于 1,表示回归的效果越好
想一想:回归分析中,利用线性回归方程求出的函数值一定是真实 值吗?为什么? 提示 不一定是真实值,利用线性回归方程求的值,在很多时候是
【变式1】 以下是某地搜集到的新房屋的销售价格y和房屋的面积x
的数据:
房屋面积/m2
115 110
80
135 105
销售价格/万元 24.8 21.6 18.4 29.2 22 (1)画出数据对应的散点图;
(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150 m2时的销售价格.
解 (1)数据对应的散点图如下图所示:
5 15 (2) x = xi=109, (xi- x )2=1 570, 5i=1 i=1
y =23.2, (xi- x )(yi- y )=308.
i=1
5
设所求回归直线方程为y=bx+a,
^
^
^
则b=
^
i=1
xi- x yi- y xi- x 2
个预报值,例如,人的体重与身高存在一定的线性关系,但体重除
了受身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动 等.
4.非线性回归分析
(1)非线性相关关系:样本点分布在某一条曲线的周围,而不是 一条直线附近.我们就称这两个变量之间不具有线性相关关系 而是非线性相关关系. (2)非线性回归方程线性化

ˆ= b
(x
i=1
n
i
- x)(yi - y) = - x)
2 i
x y - nxy
i i=1 n i
n
(x
i=1
n
x
i=1
2 i
- nx
2
,
ˆ ˆ = y - bx a
2.相应的直线叫做回归直线。 3、对两个变量进行的线性分析叫做线性 回归分析。
课前探究学习 课堂讲练互动 活页规范训练
^ ^
题型二 线性回归分析 【例2】 为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,
对不同重量的6个物体进行测量,数据如下表所示:
x 5 10 15 20 25 30
y 7.25 8.12 8.95 9.90 10.9 11.8
(1)作出散点图并求线性回归方程;
(2)求出R2; (3)进行残差分析.
名师点睛 1.线性回归方程 (1)在分析两个变量的相关关系时, 可根据样本数据散点图确定 两个变量之间是否存在相关关系, 然后利用最小二乘法求出回 归直线方程. ^ x+ a ^的关键是求未知参数a ^ 和b ^ ,其中b ^ (2)求线性回归方程^ y =b ^ = y -b ^ x ,即 y =b ^ x +a ^,所以点 可借助于计算器求出,因为a ( x , y )一定满足线性回归方程,即回归直线一定过点( x , y ).
自学导引 1.回归分析
回归分析是对具有 相关关系 的两个变量进行统计分析的一种常
用方法. 2.线性回归模型 (1)由散点图易发现,样本点散布在某一条直线附近,而不是一 条直线上,不能用一次函数y=bx+a描述它们之间的关系,因 随机误差 .
此用线性回归模型 y =bx +a +e 来表示,其中 a、 b 为未知参数,
试一试:下表是x和y之间的一组数据,则y关于x的线性回归方程必
过(
).
x 1 2 3 4
y 1 3 5 7
A.点(2,3)
C.点(2.5,4)
提示
B.点(1.5,4)
D.点(2.5,5)
选 C.线性回归方程必过样本点的中心( x , y ),即(2.5,4).
3.刻画回归效果的方式
数据点和它在回归直线上相应位置的差异(yi-yi)是随机 残差 误差.称ei=yi-yi 为残差,ei 称为相应于点(xi,yi)的残 差.
n
i
- x)(yi - y)
n
2 2 (x x) (y y) i i
2.相关系数的性质 (1)|r|≤1.
i=1
(2)|r|越接近于1,相关程度越大;|r|越接近于0,相关程度
越小.
问题:达到怎样程度,x、y线性相关呢?它们的相关程度怎
样呢?
课前探究学习 课堂讲练互动 活页规范训练
n (xi -x)(yi -y) i=1 r= n n 2× (y -y)2 (x -x) i i i=1 i=1 r>0正相关;r<0负相关.通常,
有误,或模型是否合适等.
题型一 求线性回归方程
【例1】 某班5名学生的数学和物理成绩如下表:
相关文档
最新文档