2019_2018学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用课件新人教A版选修
2018_2019学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用课件新人教A版

当 r<0 时,表明两个变量负相关.
②|r|越接近于 1,表明两个变量的线性相关性越强;
|r|越接近于 0,表明两个变量之间几乎不存在线性相关关系.
通常,当|r|大于 0.75 时,我们认为两个变量存在着很强的线性相关关系.
������
③r= ������∑=1(������������-������)(������������-������)
③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和 越小的模型,拟合效果越好.
其中正确命题的个数是( )
A.0
B.1
C.2
D.3
答案:D
首页
J 基础知识 ICHU ZHISHI
Z S 重点难点 HONGDIAN NANDIAN
随堂练习
UITANG LIANXI
3.非线性回归方程 当回归方程不是形如 y=bx+a(a,b∈R)时,称之为非线性回归方程. 非线性回归方程也可以线性化. (1)将幂函数型函数 y=axn(a 为常数,a,x,y 均取正值)化为线性函数: 将 y=axn 两边取常用对数,则有 lg y=nlg x+lg a,令 μ=lg y,v=lg x,b=lg a 代入上式得 μ=nv+b(其中 n,b 是常数),其图象是一条直线. (2)将指数型函数 y=cax(a>0,c>0,a,c 为常数)化为线性函数: 将 y=cax 两边取常用对数,则有 lg y=xlg a+lg c,令 μ=lg y,b=lg c,d=lg a, 代入上式得 μ=dx+b(d,b 是常数),它的图象是一条直线.
(6)R2
������
越大,意味着残差平方和∑
^
高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用(第3课时)教案 新人教A版选修23

3.1 回归分析的基本思想及其初步应用第三课时教学目标知识与技能能根据散点分布特点,建立不同的回归模型;知道有些非线性模型通过变换可以转化为线性回归模型;通过散点图及相关指数比较不同模型的拟合效果.过程与方法通过将非线性模型转化为线性回归模型,使学生体会“转化”的思想;让学生经历数据处理的过程,培养他们对数据的直观感觉,体会统计方法的特点,认识统计方法的应用;通过使用转化后的数据,利用计算器求相关指数,使学生体会使用计算器处理数据的方法.情感、态度与价值观通过案例的解决,开阔学生的思路,培养学生的探索精神和转化能力,并通过合作学习,培养学生的团队合作意识.重点难点教学重点:通过探究使学生体会有些非线性模型运用等量变换、对数变换可以转化为线性回归模型;教学难点:如何启发学生“对变量作适当的变换(等量变换、对数变换)”,变非线性为线性,建立线性回归模型.教学过程引入背景材料我国是世界产棉大国,种植棉花是我国很多地区农民的主要经济来源,在棉花的种植过程中,病虫害的防治是棉农的一项重要任务,如果处置不当就会造成棉花的减产.其中红铃虫就是危害棉花生长的一种常见害虫,在1953年,我国18省曾发生红铃虫大灾害,受灾面积300万公顷,损失皮棉约二十万吨.如图就是红铃虫的有关图片:红铃虫喜高温高湿,适宜各虫态发育的温度为25~32 ℃,相对湿度为80%~100%,低于20 ℃和高于35 ℃卵不能孵化,相对湿度60%以下成虫不产卵.冬季月平均气温低于-4.8 ℃时,红铃虫就不能越冬而被冻死.为采取有效防治方法,有必要研究红铃虫的产卵数和温度之间的关系.现收集了红铃虫的产卵数y和温度x之间的7组观测数据列于下表:(1)试建立y与x之间的回归方程;并预测温度为28 ℃时产卵的数目.(2)你所建立的模型中温度在多大程度上解释了产卵数的变化?学生活动:类比前面所学过的建立线性回归模型的步骤,动手实施.活动结果:(1)画散点图:通过计算器求得线性回归方程:y ^=19.87x -463.73.当x =28 ℃时,y ^=19.87×28-463.73≈93,即温度为28 ℃时,产卵数大约为93. (2)进行回归分析计算得: R 2≈0.746 4,即这个线性回归模型中温度解释了74.64%产卵数的变化.设计目的:通过背景材料,加深学生对问题的理解,并明白“为什么要学”.体会问题产生于生活,并通过问题的解决复习建立回归模型的基本步骤.探究新知提出问题:结合数据可以发现,随着自变量的增加,因变量也随之增加,气温为28 ℃时,估计产卵数应该低于66个,但是从推算的结果来看93个比66个却多了27个,是什么原因造成的呢?学生活动:分组合作讨论交流.学情预测:由于我们所建立的线性回归模型的相关指数约等于0.746 4,即解释变量仅能解释预报变量大约74.64%的变化,所占比例偏小.这样根据我们建立的模型进行预报,会存在较大的误差.我们还可以从残差图上分析一下我们所建立的回归模型的拟合效果:画出残差图根据残差图可以发现,残差点分布的带状区域较宽,并不集中,这表明我们所建立的回归模型拟合效果并不理想.之所以造成预报值偏差太大的原因是所选模型并不理想.实际上根据散点图也可以发现,样本点并没有很好地集中在一条直线附近,故变量之间不会存在很强的线性相关性.设计目的:引导学生对结果进行分析,从而发现存在的问题,激发好奇心、求知欲.同时培养学生对问题的洞悉能力,增强对结果的敏感自检能力.理解新知提出问题:如何选择合适的回归模型进行预测呢?学生活动:学生讨论,教师合理引导学生观察图象特征,联想学过的基本函数.学情预测:方案一:建立二次函数模型y =bx 2+a. 方案二:建立指数函数模型y =c 1ac 2x.提出问题:如何求出所建立的回归模型的系数呢?我们不妨尝试解决方案一中的系数.学生活动:分组合作,教师引导学生观察y =bx 2+a 与y =bx +a 的关系.学情预测:通过比较,发现可利用t =x 2,将y =bx 2+a(二次函数)转化成y =bt +a(一次函数).求出x利用计算器计算出y 和t 的线性回归方程:y ^=0.367t -202.54,转换回y 和x 的模型:y ^=0.367x 2-202.54.当x =28 ℃时,y ^=0.367×282-202.54≈85,即温度为28 ℃时,产卵数大约为85. 计算相关指数R 2≈0.802,这个回归模型中温度解释了80.2%产卵数的变化.提出问题:提出问题“如果选用指数模型,是否也能转换成线性模型,如何转化?” 学生活动:独立思考也可相互讨论.教师可启发学生思考“幂指数中的自变量如何转化为自变量的一次幂?”可引导学生回忆对数的运算性质以及指对数关系.学情预测:可利用取对数的方法,即在y =c 1ac 2x 两边取对数,得log a y =c 2x +log a c 1. 提出问题:在上面的运算中,由于底数a 不确定,对于x 的值无法求出相应的log a y ,这时可取a =10时的情况,以便利用计算器进行计算,试求出回归模型.学生活动:合作协作,讨论解决.根据数据,可求得变量z 关于x 的回归方程:z ^=0.118x -1.665.转换回y 和x 的模型:y ^=100.118x -1.665.当x =28 ℃时,y ^≈44,即温度为28 ℃时,产卵数大约为44.计算相关指数R 2≈0.985,这个回归模型中温度解释了98.5%产卵数的变化. 提出问题:试选择合适的方法,比较方案一和方案二在数据拟合程度上的效果有什么不同?学生活动:独立思考也可相互讨论,教师加以适当的引导提示. 活动结果:无论从图形上直观观察,还是从数据上分析,指数函数模型都是更好的模型. 设计目的:引导学生进行不同模型的比较,体会“虽然任意两个变量的观测数据都可以用线性回归模型来拟合,但不能保证这种模型对数据的拟合效果最好,为更好地刻画两个变量之间的关系,要根据观测数据的特点来选择回归模型”.提出问题:由上面的分析可以看出,回归模型不一定是线性回归模型,对于非线性回归模型,我们的处理方法是什么?学生活动:独立思考,回顾上面的解决过程.学情预测:选用非线性回归模型时,一般思路是转化成线性回归模型,往往要用“等量变换、对数变换”等方法.设计目的:让学生整理建立非线性回归模型的思路. 运用新知例1试建立y 与x 之间的回归方程.思路分析:先画出散点图,根据散点图确定回归模型的类型,然后求y 与x 之间的回归方程.解:根据上表中的数据,作出散点图由图可以看出,样本点分布在某指数函数曲线y =c 1ec 2x 的周围,于是令z =lny ,则上表变换后如下:作出散点图从图中可以看出,变换后的样本点分布在某条直线附近,因此可用线性回归模型来拟合.由表中数据可得,z 与x 之间的线性回归方程为z ^=0.69x +1.112,则y 与x 之间的回归方程为y ^=e0.69x +1.112.【变练演编】例2混凝土的抗压强度X 较易测定,其抗弯强度Y 不易测定,已知X 与Y 由关系式Y =AX b试求Y 对X 的回归方程.思路分析:题目中已经给出回归模型为Y =AX b类型,故只要通过适当的变量置换把非线性回归方程转化为线性回归方程,然后再套用线性回归分析的解题步骤即可.解:对Y =AX b两边取自然对数得:lnY =blnX +lnA ,做变换y =lnY ,x =lnX ,a =lnA ,根据公式可求得y ^=0.64x +0.017 2,则Y ^=e0.64lnx +0.017 2=1.02X0.64.变式1:若X 与Y 的关系由关系式Y ^=β^X b+α^表示,试根据给出的数据求Y 对X 的回归方程.活动设计:学生分组讨论,尝试解决.活动成果:Y ^=0.086X +13.005.变式2:试选择合适的方法比较上述两种回归模型,相对于给出的数据哪一个的拟合效果更好?活动成果:计算残差平方和与相关指数,对于模型Y =AX b ,残差平方和Q ^(1)=9.819,相关指数R 21=0.930 4;对于模型Y ^=β^X b+α^,残差平方和Q ^(2)=12.306,相关指数R 22=0.908,故模型Y =AX b的拟合效果较好.设计意图:熟悉判断回归模型拟合效果的方法. 【达标检测】1.变量x ,y 的散点图如图所示,那么x ,y 之间的样本相关系数r 最接近的值为( )A .1B .-0.5C .0D .0.52.变量x 与y 之间的回归方程表示( ) A .x 与y 之间的函数关系 B .x 与y 之间的不确定性关系 C .x 与y 之间的真实关系形式D .x 与y 之间的真实关系达到最大限度的吻合 3.非线性回归分析的解题思路是__________.答案:1.C 2.D 3.通过变量置换转化为线性回归分析 课堂小结1.数学知识:建立回归模型及残差图分析的基本步骤;非线性模型向线性模型的转换方法;不同模型拟合效果的比较方法:相关指数和残差的分析.2.数学思想:数形结合的思想,化归思想及整体思想. 3.数学方法:数形结合法,转化法,换元法. 补充练习 【基础练习】1.相关指数R 2,残差平方和与模型拟合效果之间的关系是( )A .R 2的值越大,残差的平方和越大,拟合效果越好B .R 2的值越小,残差的平方和越大,拟合效果越好C .R 2的值越大,残差的平方和越小,拟合效果越好 D .以上说法都不正确2.如果散点图的所有点都在一条直线上,则残差均为____________________,残差平方和为__________,相关指数为______________.答案:1.C 2.0 0 1 【拓展练习】3.某种书每册的成本费Y 元与印刷册数x(千册)有关,经统计得到数据如下:检验每册书的成本费Y 元与印刷册数的倒数1x 之间是否有线性相关关系,如有,求出Y对1x的回归方程. 解:把1x 置换为z ,则z =1x ,从而z 与Y 的数据为:根据数据可得r≈0.999 8>0.75,故z 与Y 具有很强的线性相关关系. 所以b ^≈8.976,a ^≈1.120,从而y ^=8.976z +1.120.又z =1x ,所以y ^ =8.976x+1.120.设计说明本课时内容教材中只安排了一道关于“红铃虫”的例题,但是它却代表了一种“回归分析”的类型.如何利用这道例题使学生掌握这类问题的解决方法呢?为此,本课时设计了“引导发现、合作探究”的教学方法.首先展示“红铃虫”的背景资料来激发学生的学习兴趣;鼓励学生用已有知识解决问题,引导学生检查结果从而发现新问题;通过分组合作来对不同方案进行探索;使学生在合作探索的过程中体会“选择模型——将非线性转化成线性”的方法,体会“化未知为已知、用已知探索未知”思想,同时认识不同模型的效果.培养学生观察、类比联想以及分析问题的能力.在教学过程中让学生自主探索、动手实践,养成独立思考、积极探索的习惯.在“选模型”这个环节中,注意引导学生将散点分布和已学函数图象进行比较,从而发现二次函数和指数函数模型.在“转化”这个环节中,通过引导学生观察所选模型,联系已学知识选择“等量变换或对数变换”,从而找到转化的途径.在运算过程中,如求“相关指数”引导学生使用转化后的数据,利用计算器求其相关系数即为相关指数,使学生体会使用计算器处理数据的方法和技能.备课资料1.回归分析与相关分析的区别(1)相关分析中,变量x、变量y处于平等的地位;回归分析中,变量y称为预报变量,处在被解释的地位,x称为解释变量,用于预测因变量的变化.(2)相关分析中所涉及的变量x和y都是随机变量;回归分析中,预报变量y是随机变量,解释变量x可以是随机变量,也可以是非随机的确定变量.(3)相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制.2。
2018_2019学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用课件新人教A版选修2_3

3.残差图 残差 为纵坐标,____________( 样本编号 或身高数据,或体重的估计值等)为横 以________ 坐标作出的图形,称为残差图.
贡献率 R2 越 4.在线性回归模型中,R2 表示解释变量对预报变量变化的__________.
接近于 1,表示解释变量和预报变量的线性相关性越强;反之,R2 越小,说明随 机误差对预报变量的效应越大. ^ y i- y i 2
新课标导学
数 学
选修2-3 ·人教A版
第三章
统计案例
你坐过火车、 乘过飞机吗?晕车、 晕 机与性别有无关系?肺癌是人类的一大 杀手,吸烟与患肺癌的关联性究竟有多 大?你了解过你们班同学的身高与体重 吗, 身高与体重是否线性相关?你统计过 你们班同学的考试成绩吗, 物理成绩的高 低与数学成绩关联度有多大?……这些 都是统计学研究的内容. 本章我们将要学习独立性检验和回归分析的基本思想、方法.学习本章要注 意学习收集、整理、分析数据的方法,体会统计分析的基本思想、建模思想和现 代计算技术在统计中的应用,体会统计思维和确定性思维的差异.
• [解析] 对两个变量进行回归分析时,
• 首先收集数据(xi,yi),i=1,2,…,n;根据所搜集的数据 绘制散点图. • 观察散点图的形状,判断线性相关关系的强弱, • 求相关系数,写出线性回归方程, • 最后依据所求出的回归直线方程作出解释; • 故正确顺序是②⑤④③① • 故选D.
2.(2018· 南充模拟)已知变量 x 与变量 y 之间具有相关关系,并测得如下一组 数据: x y
. x2 i -n i=1
x i- x y i- y
2 i=1 i=1
n
n
2
2 i=1
高中数学第三章统计案例3.1回归分析的基本思想及其初步应用第1课时线性回归模型高效演练新人教A版选

2018-2019学年高中数学第三章统计案例3.1 回归分析的基本思想及其初步应用第1课时线性回归模型高效演练新人教A版选修2-3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018-2019学年高中数学第三章统计案例3.1 回归分析的基本思想及其初步应用第1课时线性回归模型高效演练新人教A版选修2-3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018-2019学年高中数学第三章统计案例3.1 回归分析的基本思想及其初步应用第1课时线性回归模型高效演练新人教A版选修2-3的全部内容。
第1课时线性回归模型A级基础巩固一、选择题1.有下列说法:①线性回归分析就是由样本点去寻找一条直线,贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归方程错误!=错误!x+错误!及其回归系数b,可以估计和观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确说法的个数是( )A.1 B.2 C.3 D.4解析:①反映的是最小二乘法思想,故正确.②反映的是画散点图的作用,也正确.③反映的是回归模型y=bx+a+e,其中e为随机误差,故也正确.④不正确,在求回归方程之前必须进行相关性检验,以体现两变量的关系.答案:C2.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有( )A.b与r的符号相同 B.a与r的符号相同C.b与r的符号相反 D.a与r的符号相反解析:因为b>0时,两变量正相关,此时r>0;b<0时,两变量负相关,此时r<0。
2018_2019版高中数学第三章统计案例3.1回归分析的基本思想及其初步应用学案新人教A版

§3.1 回归分析的基本思想及其初步应用学习目标 1.了解随机误差、残差、残差图的概念.2.会通过分析残差判断线性回归模型的拟合效果.3.掌握建立线性回归模型的步骤.知识点一 线性回归模型思考 某电脑公司有5名产品推销员,其工作年限与年推销金额数据如下表:请问如何表示推销金额y 与工作年限x 之间的相关关系?y 关于x 的线性回归方程是什么? 答案 画出散点图,由图可知,样本点散布在一条直线附近,因此可用回归直线表示变量之间的相关关系.设所求的线性回归方程为y ^=b ^x +a ^,则b ^=∑i =15(x i -x )(y i -y)∑i =15(x i -x)2=1020=0.5, a ^=y -b ^x =0.4.所以年推销金额y 关于工作年限x 的线性回归方程为y ^=0.5x +0.4. 梳理 (1)函数关系是一种确定性关系,而相关关系是一种非确定性关系. (2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(3)对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),回归直线y =bx +a的斜率和截距的最小二乘估计公式分别为b ^=∑i =1n (x i -x )(y i -y)∑i =1n(x i -x)2=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a ^=y-b ^x ,其中(x ,y )称为样本点的中心.(4)线性回归模型y =bx +a +e ,其中a 和b 是模型的未知参数,e 称为随机误差,自变量x 称为解释变量,因变量y 称为预报变量. 知识点二 线性回归分析具有相关关系的两个变量的线性回归方程为y ^=b ^x +a ^.思考1 预报变量y ^与真实值y 一样吗? 答案 不一定.思考2 预报值y ^与真实值y 之间误差大了好还是小了好? 答案 越小越好. 梳理 (1)残差平方和法①e ^i =y i -y ^i =y i -b ^x i -a ^(i =1,2,…,n )称为相应于点(x i ,y i )的残差.②残差平方和∑i =1n(y i -y ^i )2越小,模型的拟合效果越好.(2)残差图法残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高. (3)利用相关指数R 2刻画回归效果其计算公式为:R 2=1-∑i =1n(y i -y ^i )2∑i =1n(y i -y)2,其几何意义:R 2越接近于1,表示回归的效果越好.知识点三 建立回归模型的基本步骤1.确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.2.画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等). 3.由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程). 4.按一定规则(如最小二乘法)估计回归方程中的参数.5.得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等.1.求线性回归方程前可以不进行相关性检验.( × )2.在残差图中,纵坐标为残差,横坐标可以选为样本编号.( √ ) 3.利用线性回归方程求出的值是准确值.( ×)类型一 求线性回归方程例1 某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^; (3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.⎝⎛⎭⎪⎪⎫相关公式:b ^=∑i =1nx i y i-n x ·y ∑i =1nx 2i-n x 2,a ^=y -b ^x 考点 线性回归方程 题点 求线性回归方程 解 (1)如图:(2)∑i =14x i y i =6×2+8×3+10×5+12×6=158,x =6+8+10+124=9,y =2+3+5+64=4, ∑i =14x 2i =62+82+102+122=344, b ^=158-4×9×4344-4×92=1420=0.7, a ^=y -b ^x =4-0.7×9=-2.3,故线性回归方程为y ^=0.7x -2.3.(3)由(2)中线性回归方程可知,当x =9时,y ^=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.反思与感悟 (1)求线性回归方程的基本步骤①列出散点图,从直观上分析数据间是否存在线性相关关系.②计算:x ,y ,∑i =1nx 2i ,∑i =1ny 2i ,∑i =1nx i y i .③代入公式求出y ^=b ^x +a ^中参数b ^,a ^的值. ④写出线性回归方程并对实际问题作出估计.(2)需特别注意的是,只有在散点图大致呈线性时,求出的回归方程才有实际意义,否则求出的回归方程毫无意义.跟踪训练1 假设关于某设备的使用年限x (年)和所支出的维修费用y (万元)有如下的统计数据:由此资料可知y 对x 呈线性相关关系. (1)求线性回归方程;(2)求使用年限为10年时,该设备的维修费用为多少? 考点 线性回归方程 题点 求线性回归方程 解 (1)由上表中的数据可得x =4,y =5,∑i =15x 2i =90,∑i =15x i y i =112.3,∴b ^=∑i =15x i y i -5x·y∑i =15x 2i -5x 2=112.3-5×4×590-5×42=1.23, ∴a ^=y -b ^x =5-1.23×4=0.08.∴线性回归方程为y ^=1.23x +0.08.(2)当x =10时,y ^=1.23×10+0.08=12.38.即使用年限为10年时,该设备的维修费用约为12.38万元. 类型二 回归分析命题角度1 线性回归分析例2 在一段时间内,某种商品的价格x 元和需求量y 件之间的一组数据为:求出y 对x 的线性回归方程,并说明拟合效果的程度. 考点 残差分析与相关指数 题点 残差及相关指数的应用解 x =15(14+16+18+20+22)=18,y =15(12+10+7+5+3)=7.4.∑i =15x 2i =142+162+182+202+222=1 660, ∑i =15x i y i =14×12+16×10+18×7+20×5+22×3=620,可得回归系数b ^=∑i =15x i y i -5x y∑i =15x 2i -5x 2=620-5×18×7.41 660-5×182=-1.15,所以a ^=7.4+1.15×18=28.1,所以线性回归方程为y ^=-1.15x +28.1. 列出残差表:则∑i =15(y i -y ^i )2=0.3,∑i =15(y i -y )2=53.2.R 2=1-∑i =15 (y i -y ^i )2∑i =15(y i -y)2≈0.994.所以回归模型的拟合效果很好.反思与感悟 (1)该类题属于线性回归问题,解答此类题应先通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R 2来分析函数模型的拟合效果,在此基础上,借助线性回归方程对实际问题进行分析. (2)刻画回归效果的三种方法①残差图法,残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适.②残差平方和法:残差平方和∑i =1n(y i -y ^i )2越小,模型的拟合效果越好.③相关指数法:R 2=1-∑i =1n(y i -y ^i )2∑i =1n(y i -y)2越接近1,表明回归的效果越好.跟踪训练2 关于x 与y 有如下数据:有如下的两个线性模型:(1)y ^=6.5x +17.5;(2)y ^=7x +17.试比较哪一个拟合效果更好.考点 残差分析与相关指数 题点 残差及相关指数的应用解 由(1)可得y i -y ^i 与y i -y 的关系如下表:∴∑i =15(y i -y ^i )2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155,∑i =15(y i -y )2=(-20)2+(-10)2+102+02+202=1 000.∴R 21=1-∑i =15(y i -y ^i )2∑i =15(y i -y)2=1-1551 000=0.845.由(2)可得y i -y ^i 与y i -y 的关系如下表:∴∑i =15(y i -y ^i )2=(-1)2+(-5)2+82+(-9)2+(-3)2=180,∑i =15(y i -y )2=(-20)2+(-10)2+102+02+202=1 000.∴R 22=1-∑i =15(y i -y ^i )2∑i =15(y i -y)2=1-1801 000=0.82.由于R 21=0.845,R 22=0.82,0.845>0.82, ∴R 21>R 22.∴(1)的拟合效果好于(2)的拟合效果.命题角度2 非线性回归分析例3 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =18∑i =18w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑i =1n(u i -u )(v i -v)∑i =1n(u i -u)2,α^=v -β^u .考点 非线性回归分析 题点 非线性回归分析解 (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑i =18(w i -w )(y i -y)∑i =18(w i -w)2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x )-x =-x +13.6x +20.12.所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大. 反思与感悟 求非线性回归方程的步骤 (1)确定变量,作出散点图.(2)根据散点图,选择恰当的拟合函数.(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程. (4)分析拟合效果:通过计算相关指数或画残差图来判断拟合效果. (5)根据相应的变换,写出非线性回归方程.跟踪训练3 在一次抽样调查中测得样本的5个样本点,数值如下表:试建立y 与x 之间的回归方程. 考点 非线性回归分析 题点 非线性回归分析 解 由数值表可作散点图如图,根据散点图可知y 与x 近似地呈反比例函数关系,设y ^=k x ,令t =1x ,则y ^=kt ,原数据变为:由置换后的数值表作散点图如下:由散点图可以看出y 与t 呈近似的线性相关关系,列表如下:所以t =1.55,y =7.2.所以b ^=∑i =15t i y i -5t y∑i =15t 2i -5t 2≈4.134 4,a ^=y -b ^t ≈0.8.所以y ^=4.134 4t +0.8.所以y 与x 之间的回归方程是y ^=4.134 4x+0.8.1.下列两个变量之间的关系不是函数关系的是( ) A .角度和它的余弦值 B .正方形的边长和面积 C .正n 边形的边数和内角度数和 D .人的年龄和身高 考点 回归分析题点 回归分析的概念和意义 答案 D解析 函数关系就是变量之间的一种确定性关系.A ,B ,C 三项中的两个变量之间都是函数关系,可以写出相应的函数表达式,分别为f (θ)=cos θ,g (a )=a 2,h (n )=(n -2)π.D 选项中的两个变量之间不是函数关系,对于年龄确定的人群,仍可以有不同的身高,故选D.2.设有一个线性回归方程y ^=2-1.5x ,当变量x 增加1个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位 考点 线性回归分析 题点 线性回归方程的应用 答案 C解析 由回归方程中两个变量之间的关系可以得到.3.如图四个散点图中,适合用线性回归模型拟合其中两个变量的是( )A .①② B.①③ C.②③ D.③④ 考点 回归分析题点 回归分析的概念和意义 答案 B解析 由图易知①③两个图中样本点在一条直线附近,因此适合用线性回归模型.4.某产品在某零售摊位的零售价x (单位:元)与每天的销售量y (单位:个)的统计资料如下表所示:由上表可得回归直线方程y ^=b ^x +a ^中的b ^=-5,据此模型预测当零售价为14.5元时,每天的销售量为( ) A .51个 B .50个 C .54个D .48个考点 线性回归分析 题点 线性回归方程的应用 答案 C解析 由题意知x =17.5,y =39,代入回归直线方程得a ^=126.5,126.5-14.5×5=54,故选C.5.已知x ,y 之间的一组数据如下表:(1)分别计算:x ,y ,x 1y 1+x 2y 2+x 3y 3+x 4y 4,x 21+x 22+x 23+x 24; (2)已知变量x 与y 线性相关,求出线性回归方程. 考点 线性回归方程题点 求线性回归方程解 (1)x =0+1+2+34=1.5,y =1+3+5+74=4,x 1y 1+x 2y 2+x 3y 3+x 4y 4=0×1+1×3+2×5+3×7=34,x 21+x 22+x 23+x 24=02+12+22+32=14.(2)b ^=34-4×1.5×414-4×1.52=2,a ^=y -b ^x =4-2×1.5=1,故线性回归方程为y ^=2x +1.回归分析的步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);(3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程y ^=b ^x +a ^); (4)按一定规则估算回归方程中的参数;(5)得出结果后分析残差图是否有异常(个别数据对应的残差过大,或残差呈现不随机的规律性等),若存在异常,则检查数据是否有误或模型是否合适等.一、选择题1.对于线性回归方程y ^=b ^x +a ^(b ^>0),下列说法错误的是( )A .当x 增加一个单位时,y ^的值平均增加b ^个单位B .点(x ,y )一定在y ^=b ^x +a ^所表示的直线上C .当x =t 时,一定有y =b ^t +a ^D .当x =t 时,y 的值近似为b ^t +a ^考点 线性回归分析 题点 线性回归方程的应用 答案 C解析 线性回归方程是一个模拟函数,它表示的是一系列离散的点大致所在直线的位置及其大致变化规律,所以有些散点不一定在回归直线上.2.给定x 与y 的一组样本数据,求得相关系数r =-0.690,则( ) A .y 与x 的线性相关性很强 B .y 与x 的相关性很强 C .y 与x 正相关 D .y 与x 负相关 考点 线性相关系数 题点 线性相关系数的应用 答案 D解析 因为r <0,所以y 与x 负相关,又|r |∈[0.75,1]才表示y 与x 具有很强的线性相关性,所以选D.3.某校小卖部为了了解奶茶销售量y (杯)与气温x (℃)之间的关系,随机统计了某4天卖出的奶茶杯数与当天的气温,得到下表中的数据,并根据该样本数据用最小二乘法建立了线性回归方程y ^=-2x +60,则样本数据中污损的数据y 0应为( )A .58B .64C .62D .60 考点 线性回归分析 题点 线性回归方程的应用 答案 B解析 由表中数据易知x =10,代入y ^=-2x +60中,得y ^=40.由y 0+34+38+244=40,得y 0=64.4.已知变量x 与y 负相关,且由观测数据求得样本平均数x =3,y =3.5,则由该观测数据求得的线性回归方程可能是( )A.y ^=-2x +9.5B.y ^=2x -2.4C.y ^=-0.3x -4.4 D.y ^=0.4x +2.3考点 线性回归方程 题点 求线性回归方程 答案 A解析 因为变量x 与y 负相关,所以排除B ,D ,将样本平均数x =3,y =3.5代入选项验证可知,选项A 符合题意.5.对变量x ,y 进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是( )考点 残差分析与相关指数 题点 残差及相关指数的应用 答案 A解析 用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 6.根据如下样本数据得到的回归方程为y ^=b ^x +a ^,则( )A.a ^>0,b ^>0B.a ^>0,b ^<0C.a ^<0,b ^>0 D.a ^<0,b ^<0考点 线性回归分析 题点 线性回归方程的应用 答案 B解析 作出散点图如下:观察图象可知,回归直线y ^=b ^x +a ^的斜率b ^<0,当x =0时,y ^=a ^>0.故a ^>0,b ^<0.7.已知某地的财政收入x 与支出y 满足线性回归方程y =bx +a +e (单位:亿元),其中b =0.8,a =2,|e |≤0.5,如果今年该地区的财政收入为10亿元,那么年支出预计不会超过( ) A .9亿元 B .10亿元 C .9.5亿元D .10.5亿元考点 残差分析与相关指数 题点 残差及相关指数的应用 答案 D解析 y =0.8×10+2+e =10+e ≤10.5. 8.下列数据符合的函数模型为( )A.y =2+13xB .y =2e xC .y =21e xD .y =2+ln x考点 非线性回归分析 题点 非线性回归分析 答案 D解析 分别将x 值代入解析式判断知满足y =2+ln x .9.为了考查两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用最小二乘法求得的回归直线分别为l 1和l 2.已知两个人在试验中发现对变量x 的观测数据的平均值都是s ,对变量y 的观测数据的平均值都是t ,那么下列说法中正确的是( )A .l 1与l 2有交点(s ,t )B .l 1与l 2相交,但交点不一定是(s ,t )C .l 1与l 2必定平行D .l 1与l 2必定重合 考点 线性回归方程 题点 样本点中心的应用 答案 A解析 回归直线l 1,l 2都过样本点的中心(s ,t ),但它们的斜率不确定,故选项A 正确. 二、填空题10.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________. 考点 线性相关系数 题点 线性相关系数的应用 答案 1解析 根据样本相关系数的定义可知,当所有样本点都在一条直线上时,相关系数为1. 11.若一个样本的总偏差平方和为80,残差平方和为60,则相关指数R 2为________. 考点 线性相关系数 题点 线性相关系数的应用 答案 0.25解析 R 2=1-6080=0.25.12.已知一个线性回归方程为y ^=1.5x +45,x ∈{1,5,7,13,19},则y =________. 考点 线性回归方程 题点 样本点中心的应用 答案 58.5解析 ∵x =1+5+7+13+195=9,且y ^=1.5x +45,∴y =1.5×9+45=58.5.13.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =ebx +a的周围.令z ^=ln y ,求得线性回归方程为z ^=0.25x -2.58,则该模型的回归方程为________. 考点 非线性回归分析 题点 非线性回归分析 答案 y =e0.25x -2.58解析 因为z ^=0.25x -2.58,z ^=ln y , 所以y =e0.25x -2.58.三、解答题14.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:(1)在给定的坐标系中画出表中数据的散点图;(2)求出y 关于x 的线性回归方程y ^=b ^x +a ^,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少时间?(注:b ^=∑i =1nx i y i -n x y)∑i =1nx 2i -n x 2,a ^=y -b ^x )考点 线性回归方程 题点 求线性回归方程 解 (1)散点图如图.(2)由表中数据得∑i =14x i y i =52.5,x =3.5,y =3.5,∑i =14x 2i =54,所以b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2=52.5-4×3.5×3.554-4×3.52=0.7, 所以a ^=y -b ^x =3.5-0.7×3.5=1.05.所以y ^=0.7x +1.05. 回归直线如图中所示.(3)将x =10代入回归直线方程,得y ^=0.7×10+1.05=8.05, 所以预测加工10个零件需要8.05小时. 四、探究与拓展15.甲、乙、丙、丁4位同学各自对A ,B 两变量进行回归分析,分别得到散点图与残差平方和∑i =1n(y i -y ^i )2如下表:以上的试验结果体现拟合A ,B 两变量关系的模型拟合精度高的是( ) A .甲 B .乙 C .丙 D .丁 考点 残差分析与相关指数 题点 残差及相关指数的应用 答案 D解析 根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R 2的表达式中∑i =1n(y i -y )2为确定的数,则残差平方和越小,R2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些. 16.为了研究某种细菌随时间x 变化繁殖个数y 的变化情况,收集数据如下:(1)用时间作解释变量,繁殖个数作预报变量作出这些数据的散点图; (2)求y 与x 之间的回归方程;(3)计算相关指数R 2,并描述解释变量与预报变量之间的关系. 考点 非线性回归分析 题点 非线性回归分析 解 (1)散点图如图所示:(2)由散点图看出样本点分布在一条指数曲线y =c 1e c 2x 的周围,于是令z =ln y ,则所以z ^=0.69x +1.115,则有y ^=e 0.69x +1.115.(3)∑i =16e ^2i =∑i =16(y i -y ^)2=4.816 1,∑i =16(y i -y )2≈∑i =16y 2i -6y 2≈24 642.83, R 2=1-∑i =16 (y i -y ^i )2∑i =16(y i -y)2≈1-4.816 124 642.83≈0.999 8,即时间解释了99.98%的细菌繁殖个数的变化.。
2018_2019学年高中数学第三章统计案例3.1回归分析的基本思想及其初步应用课件

510 1 214 = ,y= (6+10+10+…+46)= , 11 11 11
214 510 ^ ^ a =y- b x≈ -0.304× =5.36. 11 11 故腐蚀深度对腐蚀时间的线性回归方程为 y=0.304x+5.36. ^ (3)根据(2)求得的线性回归方程,当腐蚀时间为 100 s 时, y = 5.36+0.304×100=35.76(μm), 即腐蚀时间为 100 s 时腐蚀深度 大约为 35.76 μm.
变量 x 与 y 之间的回归方程表示( A.x 与 y 之间的函数关系 B.x 与 y 之间的不确定性关系 C.x 与 y 之间的真实关系形式
)
D.x 与 y 之间的真实关系达到最大限度的吻合
答案:D
在两个变量 y 与 x 的回归模型中, 分别选择了 4 个不同的模 型, 它们的相关指数 R2 如下, 其中拟合效果最好的模型是( A.模型 1 的相关指数 R2 为 0.98 B.模型 2 的相关指数 R2 为 0.80 C.模型 3 的相关指数 R2 为 0.50 D.模型 4 的相关指数 R2 为 0.25
解析:①正确;②正确;③线性回归模型中,随机误差的估计 值应为^ e i= y i- ^ y i,故错误;④若变量 x 增加 1 个单位,则 y 平 均减少 5 个单位,故错误.
答案:①②
3.某商场经营一批进价是 30 元/台的小商品,在市场试销中发 现, 此商品的销售单价 x(x 取整数)(元)与日销售量 y(台)之间有 如下关系:
画出两个变量的散点图
, 求回归直线方程
,并用
回归直线方程进行预报.
2.线性回归模型 (1) 在 线 性 回 归 直 线 方 程 ^ y = ^ a + ^ b x 中 , ^ b = ∑ ( x i- - x )(yi-- y)
2018-2019年高中数学 第三章 统计案例 3-1 回归分析的基本思想及其初步应用随堂达标验收 新人教A版选修2-3

3-1 回归分析的基本思想及其初步应用1.设某大学的女生体重y (单位:kg)与身高x (单位:cm)有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x -,y -)C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg[解析] 由y ^=0.85x -85.71可知该大学某女生身高为170 cm ,则可断定其体重约为58.79 kg ,故选D.[答案] D2.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423;②y 与x 负相关且y ^=-3.476x +5.648;③y 与x 正相关且y ^=5.437x +8.493;④y 与x 正相关且y ^=-4.326x -4.578.其中一定不正确的结论的序号是( )A .①②B .②③C .③④D .①④[解析] ①③为正相关,②④为负相关.故选D.[答案] D3.已知回归直线方程y ^=b ^x +a ^中的a ^的估计值为0.2,样本点的中心为(4,5),则回归直线方程为( )A.y ^=1.2x -0.2B.y ^=1.2x +0.2C.y ^=0.2x +1.2D.y ^=0.2x -0.2[解析] 将a ^=0.2代入y ^=b ^x +a ^=b ^x +0.2,又∵回归直线方程必过样本点的中心(4,5),∴5=b ^×4+0.2,∴b ^=1.2.∴回归直线方程为y ^=1.2x +0.2,故选B.[答案] B4.已知x 与y 之间的一组数据如下表:已求得y 关于x 的线性回归方程为y =2.1x +0.85,则m 的值为( )A .1B .0.85C .0.7D .0.5[解析] ∵x -=0+1+2+34=32,y -=m +3+5.5+74=m +15.54, ∴这组数据的样本中心点是⎝ ⎛⎭⎪⎫32,m +15.54. ∵y 关于x 的线性回归方程为y ^=2.1x +0.85,∴m +15.54=2.1×32+0.85,解得m =0.5. ∴m 的值为0.5.[答案] D。
3.1回归分析的基本思想及其初步应用(二)

n
★其中:(1)|r|≤1; (2)|r|越接近于1,相关程度越强, |r|越接近于0,相关程度越弱; (3) b 与 r 同号。
3
温故知新
3、线性回归模型:
y bx a e 2 E (e ) 0, D(e )
其中:e是随机误差,均值E(e)=0,方差D(e)=σ2>0 当随机误差e恒等于0时,线性回归模型就变成一 次函数模型。即:一次函数模型是线性回归模型的特
例2、一只红铃虫的产卵数y和温度x有关,现收集了7 组观测数据列于下表,试建立y与x之间的回归方程. 温度x/0C 产卵数y/个 21 7 23 11 25 21 27 24 29 66 32 35
115 325
解:收集数据作散点图:
350 300 250
产卵数
200 150 100 50 0 0 10 20 温度 30 40
(x X i
i 1
i 1
nn
2
i
)x X n
2 2
2
温故知新
2、我们通常用相关系数r来描述两个变量之间 线性相关关系的强弱。
r
x y n xy
i i i1 n 2 2 n 2 2 xi n x yi n y i1 i1
由条件R2分别为0.98和0.80
故指数函数模型的拟合效果比二次函数的模拟效果好.
15
习题3.1
A组 1、3
16
殊形式。
4、相关系数r与随机误差e一般有什么关系?
量
ˆ y y ˆ e
样本点: ( x1 , y1 ),( x2 , y2 ), ... ,( xn , yn )