高中数学 第2章 统计 2.4 线性回归方程教材梳理导学案 苏教版必修3

合集下载

高中数学 2.4线性回归方程导学案(2) 苏教版必修3

高中数学 2.4线性回归方程导学案(2) 苏教版必修3

2.4《线性回归方程》导学案(2)学习目标:(1)了解非确定性关系中两个变量的统计方法; (2)掌握散点图的画法及在统计中的作用; (3)掌握回归直线方程的实际应用。

学习重点: 线性回归方程的求解。

学习难点: 回归直线方程在现实生活与生产中的应用。

学习过程: 一、复习练习1.下例说法不正确的是( )A.在线性回归分析中,x 和y 都是变量;B.变量之间的关系若是非确定关系,那么x 不能由y 唯一确定;C.由两个变量所对应的散点图,可判断变量之间有无相关关系;D.相关关系是一种非确定性关系.2.已知回归方程81.05.0ˆ-=x y ,则x =25时, y 的估计值为_________.3.三点)24,11(),20,7(),10,3(的线性回归方程是 ( ) A x y75.175.1ˆ-= B x y 75.575.1ˆ+= C x y75.575.1ˆ-= D x y 75.175.1ˆ+= 4.我们考虑两个表示变量x 与y 之间的关系的模型,δ为误差项,模型如下:模型1:x y 46+=:;模型2:e x y ++=46. (1)如果1,3==e x ,分别求两个模型中y 的值; (2)分别说明以上两个模型是确定性模型还是随机模型。

二、典例分析例1、一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,测得数据如下:程。

例2、已知10只狗的血球体积及红血球数的测量值如下:(1)画出上表的散点图;(2)求出回归直线方程并画出图形。

例3、以下是收集到的新房屋销售价格y 与房屋的大小x 的数据:上回归直线;(3)计算此时(,)Q a b 和(2,0.2)Q 的值,并作比较。

三、课堂练习1.为了考察两个变量x 和y 之间的线性相关性,甲乙两位同学各自独立做了10次和15次实验,并且利用线性回归直线分别为1l ,2l ,已知两人获得的实验数据中,变量x 和y 的数据平均值都相等,且分别为s,t 那么下例说话正确的是( )A .直线1l 和2l 一定有公共点(s,t)B .直线1l 和2l 相交,但交点不一定是(s,t)C .必有1l // 2lD .1l 和2l 与必定重合2.已知关于某设备的使用年限x 与所支出的维修费用y (万元),有如下统计资料:(1)线性回归方程ˆy bx a =+的回归系数a,b ; (2)估计使用年限为10年时,维修费用多少?四、回顾小结:五、课外作业: 课本第82页第9题.。

2019-2020年高中数学 2.4《线性回归方程》学案 苏教版必修3

2019-2020年高中数学 2.4《线性回归方程》学案 苏教版必修3

2019-2020年高中数学 2.4《线性回归方程》学案 苏教版必修3【目标引领】1.学习目标:了解非确定性关系中两个变量的统计方法;掌握散点图的画法及在统计中的作用,掌握 回归直线方程的求解方法。

2.学法指导:①求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实标意义.否则,求出的回归直线方程毫无意义.因此,对一组数据作线性回归分析时,应先看其散点图是否成线性.②求回归直线方程,关键在于正确地求出系数a 、b ,由于求a 、b 的计算量较大,计算时仔细谨慎、分层进行,避免因计算产生失误.③回归直线方程在现实生活与生产中有广泛的应用.应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序”变为“有序”,并对情况进行估测、补充.因此,学过回归直线方程以后,应增强学生应用回归直线方程解决相关实际问题的意识.【教师在线】1.解析视屏:1.相关关系的概念在实际问题中,变量之间的常见关系有两类:一类是确定性函数关系,变量之间的关系可以用函数表示。

例如正方形的面积S 与其边长之间的函数关系(确定关系);一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达。

例如一块农田的水稻产量与施肥量的关系(非确定关系)相关关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。

相关关系与函数关系的异同点:相同点:均是指两个变量的关系。

不同点:函数关系是一种确定关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系。

2.求回归直线方程的思想方法观察散点图的特征,发现各点大致分布在一条直线的附近,思考:类似图中的直线可画几条?引导学生分析,最能代表变量x 与y 之间关系的直线的特征:即n 个偏差的平方和最小,其过程简要分析如下:设所求的直线方程为,其中a 、b 是待定系数。

高中数学第2章统计2.4线性回归方程知识导引学案苏教版必修3

高中数学第2章统计2.4线性回归方程知识导引学案苏教版必修3

2.4 线性回归方程案例探究在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?分析:凭我们的学习经验可知,物理成绩确实与数学成绩有一定的关系,但除此以外,还存在其他影响物理成绩的因素.例如,是否喜欢物理,用在物理学习上的时间等等.在实际问题中,变量之间的常见关系有如下两类:一类是确定性函数关系,变量之间的关系可以用函数表示.例如,圆的面积S与半径r 之间就是确定性函数关系,可以用函数S=πr2表示.一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达.例如,人的体重与身高有关.一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系.自学导引1.在实际问题中,变量之间的常见关系有两类:一类是确定性关系,另一类是相关关系.2.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.3.请你说出确定性关系与相关关系的相同点和不同点.答案:相同点:均是指两个变量的关系.不同点:相关关系是一种非确定的关系.确定性关系是自变量与函数值之间的关系,可以用一个函数表示.这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.这种关系不能用一个确定的函数来表示.4.你是否还能举出一些现实生活中存在的相关关系的问题?答案:例如,商品销售收入与广告支出经费之间的关系;粮食产量与施肥量之间的关系;人体的脂肪含量与年龄之间的关系,等等.5.将n个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图.6.(1)当两个变量成正相关时,散点图有什么特点?(2)当两个变量成负相关时,散点图又有什么特点?答案:(1)散点图中的点散布在从左下角到右上角的区域.(2)散点图中的点散布在从左上角到右下角的区域.7.对于散点图可以作出如下判断:(1)当所有的样本点都落在某一函数曲线上,变量之间具有函数关系;(2)当所有的样本点都落在某一函数曲线附近,变量之间具有相关关系;(3)当所有的样本点都落在某一直线附近,变量之间具有线性相关关系.8.回归直线是怎样定义的?答案:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.疑难剖析【例1】下表是某地年降雨量与年平均气温的统计数据,判断两变量有相关关系吗?求回归直线方程有意义吗?年平均气温(℃) 12.51 12.84 12.84 13.69 13.33 12.7413.05 年降雨量(mm )748542507813574701432思路分析:用回归直线进行拟合两变量关系的一般步骤为: (1)作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,以公式求出a, b ,并写出线性回归方程.解:以x 轴为年平均气温,y 轴为年降雨量可得相应的散点图:因为图中各点并不在一条直线的附近,所以两者不具有线性相关关系,没有必要用回归直线进行拟合,用公式求得的回归方程也是没有意义的.思维启示:要判断两个变量是否具有线性相关关系,可先作出散点图,再观察散点是否在一条直线附近,如果是,则二者具有线性相关关系;否则,二者不具有线性相关关系. 思维陷阱:解此题的第(2)小问时不要盲目地去求回归方程.观察两相关变量得如下数据:x -1 -2 -3 -4 -5 5 3 4 2 1 y -9 -7 -5 -3 -1 1 5 3 7 9求两变量间的回归方程.错解:求线性回归直线方程的步骤: 第一步:列表x i ,y i ,x i y i ; 第二步:计算x ,y ,∑=ni ix12,∑=ni iy12,∑=ni ii yx 1;第三步:代入公式计算b, a 的值; 第四步:写出回归直线方程.列表:i 1 2 3 4 5 6 7 8 9 10 x i-1-2-3-4-553421计算得:x =0, y =0∑=1012i ix=110,∑=1012i iy=310,∑=101i ii yx =110∴b=1010110010110)(101021012101=*-*-=--∑∑==x x yx yx i i i iia=y -b x =0-1*0=0故所求回归直线方程为yˆ=x. 正解:作两个变量的散点图(图略),从散点图中看出,点不在某条直线附近,分散得很开.因此,变量x 和y 不具有线性相关关系,也就不存在线性回归方程.【例2】 某班学生每周用于数学学习的时间x (单位:h )与数学成绩y (单位:分)之间有如下数据:某同学每周用于数学学习的时间为18小时,试预测该生数学成绩. 思路分析:首先应该利用表中数据通过计算去判断数学学习的时间x 与数学成绩y 是否具有线性相关关系.若有,则可求出回归方程;然后在方程中令x=18,可求出该生数学成绩.解:因为学习时间与学习成绩之间具有线性相关关系.利用科学计算器计算到如下表所示的数据:于是可得b=53.34.1544.545)(101021012101≈=--∑∑==x xyx yx i ii iia=y -b x =74.9-3.53×17.4≈13.5 故所求回归直线方程为y=3.53x+13.5当x=18时,yˆ=3.53×18+13.5=77.04≈77 故该同学预计可得77分左右.思维启示:两个有线性相关关系的变量间的关系可以用线性回归方程来表示,而对总体的预测可依据回归直线方程进行.【例3】 一般说,一个人的身高越高,他的手就越大.为了调查这一问题,对10名高三男生的身高与右手一揸长测量得如下数据:(单位:cm )身高 168170171172174176178178180181一揸长19.0 20.0 21.0 21.5 21.0 22.0 24.0 23.0 22.5 23.0(1)依据上述数据制作散点图,发现两者有何相关关系吗? (2)如果近似成线性关系,求线性回归方程.(3)如果一个学生身高185 cm ,估计他的右手一揸长.思路分析:首先作出散点图;利用散点图去判断两变量是否具有线性关系;若具有线性关系,再利用公式求出方程;最后利用方程去解答第三小问.解:(1)散点图如下:可见,身高与右手一揸长之间的总体趋势成一条直线,即他们线性相关.(2)设线性回归方程为yˆ=bx+a 由上述数据计算可得x =174.8, y =21.7∑=1012i ix=305 730,∑=101i ii yx =37 986∴b=21012101)(1010x xyx yx i ii ii--∑∑===303.08.174107303057.218.17410986372≈⨯-⨯⨯- a=y -b x =-31.264∴方程为yˆ=0.303x-31.264. (3)当x=185时, yˆ=24.79. 思维启示:先作出散点图,若两变量具有线性关系,再利用公式求出方程.拓展迁移【拓展点1】 如果你想作一个反对抽烟的电视公益广告的播放次数与看电视的中学生戒烟率的数据散点图,作为x 轴的变量为__________. 答案:播放次数【拓展点2】 有时候,一些东西吃起来口味越好,对我们的身体越有害,下表给出了不同类型的某种食品的数据.第一列表示此种食品所含热量的百分比,第二列数据表示由一些美食家以百分制给出的对此种食品口味的评价.(1)求出回归直线方程;(2)关于两个变量之间的关系,得出的结论是什么?答案:(1) yˆ=1.565x+37.827 (2)由回归方程知道,食品所含热量越大,口味记录越好,反之亦然.【拓展点3】 某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:(1)作出散点图;(2)如果y与x之间具有线性相关关系,求回归方程;(3)估计尿汞含量为9毫克/升时消光系数.答案:(1)散点图略.(2)由散点图可知y与x线性相关.设回归方程为yˆ=bx+A.计算可得回归方程为yˆ=36.95x-11.3.(3)当x=9时,yˆ=36.95×9-11.3=321.25≈321。

2.4《线性回归方程》教案(苏教版必修3)

2.4《线性回归方程》教案(苏教版必修3)

2.4线性回归方程(1)教学目标(1)通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;(2)在两个变量具有线性相关关系时,会在散点较长中作出线性直线,会用线性回归方程进行预测;(3)知道最小二乘法的含义,知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程,了解(线性)相关系数的定义.教学重点散点图的画法,回归直线方程的求解方法.教学难点回归直线方程的求解方法.教学过程一、问题情境1.情境:客观事物是相互联系的过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系学是“因”,物理是“果”,或者反过来说事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度所以说,函数关系存在着一种确定性关系但还存在着另一种非确定性关系——相关关系2.问题:某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的气温/0C 26 18 13 10 4 1-杯数20 24 34 38 50 64-C,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?如果某天的气温是5二、学生活动为了了解热茶销量与气温的大致关系,我们以横坐标x表示气温,纵坐标y表示热茶销量,建立直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内标出,得到下图,今后我们称这样的图为散点图(scatterplot).从右图可以看出.这些点散布在一条直线的附近,故可用一个线性函数近似地表示热茶销量与气温之间的关系.选择怎样的直线近似地表示热茶销量与气温之间的关系?我们有多种思考方案:(1)选择能反映直线变化的两个点,例如取(4,50),(18,24)这两点的直线;(2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同;(3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距;………………怎样的直线最好呢?三、建构数学1.最小平方法:=+的直线拟合散点图中的点,应使得该直线与散点图中的点最接近。

高中数学第2章统计2.4线性回归方程(1)教案苏教版必修3

高中数学第2章统计2.4线性回归方程(1)教案苏教版必修3

2.4 线性回归方程 1整体设计教材分析在实际问题中,变量之间关系有两类:一类是确定性关系,变量之间关系可以用函数表示.例如,正方形面积S与边长a之间就是确定性关系,可以用函数s=a2表示.还有一类是非确定性关系,例如“学生数学成绩与物理成绩之间关系〞“粮食产量与施肥量之间关系〞“商品销售额与广告费支出之间关系〞“人体脂肪百分比与年龄之间关系〞等贴近学生实际问题,它不能由一个变量数值准确地确定另一个变量数值.像这种自变量取一定值时,因变量取值带有一定随机性,这样两个变量之间关系,我们称之为相关关系.“线性回归方程〞这一节是为了帮助我们了解变量之间相关关系,使学生学会区别变量之间函数关系与变量相关关系,从而到达正确判断实际生活中两个变量之间相关关系并会作出变量相关关系散点图;通过散点图直观性,看各点是否在某条直线附近摆动来为判断两个变量之间相关关系打下坚实根底.通过对人体脂肪百分比与年龄之间关系散点图分析,引入描述两个变量之间关系线性回归方程〔模型〕,使学生通过探索用多种方法确定线性回归直线,学会类比寻求新突破方法,体会最小二乘法思想,掌握计算回归方程斜率与截距方法,求出回归直线方程.通过典型求解,强化回归思想建立,理解回归直线与观测数据关系. 通过引导学生感受生活中实际问题转化为数学问题,学会类比寻求新突破方法,体会最小二乘法思想,培养学生创新精神,不断收取信息,学会用统计知识对实际问题进展数学分析.通过课堂目标检测到达强化所学知识点,提高学生对现代化教学工具应用能力.三维目标1.通过实例,使学生感受到现实世界中变量之间除了函数关系外,还存在着虽无确定函数关系,但却有一定关联性相关关系,相关关系是一种非确定性关系.2.通过收集实际问题中两个有关联变量数据作出散点图,直观认识变量间相关关系.3.经历用不同估算方法描述两个变量线性相关过程,运用最小二乘法思想,发现可用线性回归方程近似地表示两个具有相关关系变量之间关系,并能根据给出线性回归方程系数公式建立线性回归方程.重点难点教学重点:1.会区别变量之间函数关系与变量相关关系;会举例说明现实生活中变量之间相关关系.2.会作散点图,并由此对变量间关系作出直观判断,会求回归直线.教学难点:1.对变量之间相关关系理解;变量之间函数关系与变量相关关系区别.2.了解最小二乘法思想,能根据给出线性回归方程系数公式建立回归方程.课时安排2课时教学过程第1课时导入新课〔多媒体播放四个问题,组织学生分析、思考〕问题1:将汽油以均匀速度注入桶里,注入时间t与注入油量y 如下表:从表里数据得出油量y与时间t之间函数关系式为________________.问题2:圆面积S与半径r之间函数关系式为________________.问题3:小麦产量y千克每亩与施肥量x千克每亩之间关系如下表:从表里数据能得出小麦产量y与施肥量x之间函数关系式吗?问题4:人体重y与身高x之间有什么关系呢?分析问题1:因为是以均匀速度注入桶里,所以注入油量y与注入时间t成正比例关系,由表格数据知,注入油量y与注入时间t之间函数关系式为y=2x(x≥0).因为是实际问题,所以要特别注意自变量取值范围要有实际意义.分析问题2:这是大家熟悉面积公式,所以圆面积S与半径r之间函数关系式为S=πr2(r>0).第1、2两个问题中变量间函数关系是确定,在我们现实生活,两个变量之间存在确定性关系是极少,而两个变量之间存在不确定性关系是很普遍,那么问题3中两个变量之间是确定性函数关系,还是不确定性关系呢?学生甲分析问题3:此问中两个变量之间是确定性函数关系,设为y=kx+b,当x=10时,函数值y为420;当x=20时,函数值y 为440,代入可得函数关系式为y=2x+400(x≥0).学生乙:学生甲答复是错误,假设函数关系式为y=20x+400(x≥0),当x=30时,函数值为460,而不是470.但是可以感觉到施肥量越大,小麦产量就越高.教师分析:从表格里容易发现施肥量越大,小麦产量就越高.但是,施肥量并不是影响小麦产量唯一因素,小麦产量还与土壤质量、降雨量、田间管理等诸多因素影响有关,更何况当施肥量超出一定范围时,还会造成小麦倒塌,以致颗粒无收.这时两个变量之间就不是确定性函数关系,那么这两个变量之间终究是什么关系呢?这就是我们本节课所要研究问题——变量之间相关关系.(引入新课,书写课题)推进新课新知探究由学生举出现实生活中相关关系例子,教师归纳概念!1.变量之间有一定联系,但不能完全用函数来表达,即当自变量一定时,因变量取值带有一定随机性两个变量之间关系称为相关关系.相关关系是非随机变量与随机变量之间关系,函数关系是两个非随机变量之间关系,是一种因果关系,而相关关系不一定是因果关系,所以相关关系与函数关系不同,其变量具有随机性,因此相关关系是一种非确定性关系〔有因果关系,也有伴随关系〕.通过上述三个问题请学生思考相关关系与函数关系有什么区别与联系?相关关系与函数关系异同点如下:一样点:均是指两个变量关系.不同点:函数关系是一种确定关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间关系,这种关系是两个非随机变量关系;而相关关系是非随机变量与随机变量关系.注意:问题3中小麦产量是在土壤质量、降雨量、田间管理等诸多变量共同作用下结果,本节课只研究其中两个主要变量之间相关关系.我们只能得出经历性结论:施肥量越大,小麦产量就越高.但是经历再丰富,也容易犯经历性错误.施肥量过大,反而容易造成粮食减产.由学生解决问题4, 人体重y与身高x之间是一种非确定关系相关关系,因为,一般说来,身高越高,体重就越重,而无法写出具体函数关系.应用例如例1 某班学生在一次数学测验与物理测验中,学号1到20学生成绩如下表:从表里数据你能得出什么样经历性结论呢?分析:即是考虑两门学科成绩之间是否具有一定相关关系.解:数学成绩好同学那么物理成绩就好,反之,数学成绩差同学那么物理成绩就差.点评:注意,只是问“得出什么样经历性结论〞,并不完全绝对.例2 下面提供四个问题,让各组同学共同探究:第一小组探究问题是:调查一下本组所有成员视力与各自学习成绩关系.第二小组探究问题是:商品销售额与广告费支出之间关系.第三小组探究问题是:调查一下本组所有成员身高与各自体重之间关系.第四小组探究问题是:气温上下与空调销售量间关系.分析:根据变量相关关系讨论.解:第一小组:通过对本组所有成员调查我们得到结论是:学习成绩好同学视力都不太好,都佩带了近视眼镜,但是,我们发现这个结论对我们全班来说就不成立,例如,我们班第一名同学视力却是很棒,所以我们只能说学习成绩好同学视力一般都不太好,人视力还与用眼卫生习惯、遗传因素等有密切关系.第二小组:通过本组所有成员共同探讨,我们得到结论是:商品销售额与广告费支出之间有密切关系,但商品销售额不仅与广告费支出多少有关,还与商品质量、居民收入以及售后效劳质量等诸多因素有关.第三小组:通过对本组所有成员调查我们得到结论是:身材高同学体重一般来说大多都比拟大,但是,人体重还与饮食习惯、遗传因素等有密切关系.第四小组:通过本组所有成员共同探讨,我们得到结论是:气温上下与空调销售量之间有密切关系,但空调销售量不仅与气温上下有关,还与空调质量、居民收入以及售后效劳质量等诸多因素有关.点评:通过此例使学生养成考虑问题要多方面思考习惯.例3 以下两个变量之间关系哪个不是函数关系〔〕解析:利用变量函数关系与相关关系解决问题.角度与它余弦值是一个确定函数关系y=cosx;正方形边长与面积:s=a2;正n边形边数与它内角与:s=(n-2)×180°,而人年龄与身高具有相关关系.答案:D点评:函数关系是一种确定关系,而相关关系是一种非确定关系;函数关系是自变量与因变量之间关系,这种关系是两个非随机变量关系,而相关关系是非随机变量与随机变量关系.例4 “强将手下无弱兵〞可以理解为将军本领越高,他手下士兵本领也越高.那么,将军本领与士兵本领成什么相关关系?你能举出更多描述生活中两个变量相关关系成语吗?分析:这是与生活、生产、工作、学习息息相关相关关系,语言功底好同学更显优势.解:此题与“名师出高徒〞相对应.另外举例有:水涨船高.点评:此题加强了与其他学科联系,学生会对数学很有亲切感.知能训练1.在一次对人体脂肪含量与年龄关系研究中,研究人员获得了一组样本数据:根据上述数据,人体脂肪含量与年龄之间有怎样关系?2.某小卖部为了了解热茶销售量与气温之间关系,随机统计并制作了某6天卖出热茶杯数与当天气温比照表:根据上述数据,气温与热茶销售量之间有怎样关系?解答:1.观察表中数据,大体上来看,随着年龄增加,人体中脂肪百分比也在增加.2.观察表中数据,大体上来看,气温越高,卖出去热饮杯数越少.点评:使学生学会全面考察现实生活中变量之间相关关系,并为下一节课作铺垫.课堂小结(让学生进展小结,帮助他们回忆反思、归纳概括.)1.变量之间相关关系;2.变量之间函数关系与变量相关关系区别;3.学会全面考察现实生活中变量之间相关关系.作业阅读、预习课本中本节下一局部内容.举出生活中具有相关关系例子.设计感想通过生活中存在相关关系一些典型事例,如“学生数学成绩与物理成绩之间关系〞“粮食产量与施肥量之间关系〞“商品销售额与广告费支出之间关系〞等贴近学生实际问题,介绍与函数关系不同两个变量之间相关关系,在教学设计时,通过复习变量之间函数关系引出变量相关关系,由熟悉到生疏过程便于学生理解,同时分成四个小组同学共同探究以下四个问题:〔1〕调查一下本组所有成员视力与各自学习成绩关系;〔2〕商品销售额与广告费支出之间关系;〔3〕调查一下本组所有成员身高与各自体重之间关系;〔4〕气温上下与空调销售量间关系.通过讨论来强化学生对所学内容理解.。

高中数学 第2章 统计 2.4 线性回归方程讲义 苏教版必修3-苏教版高一必修3数学教案

高中数学 第2章 统计 2.4 线性回归方程讲义 苏教版必修3-苏教版高一必修3数学教案

2.4 线性回归方程学 习 目 标核 心 素 养1.了解两个变量之间的相关关系并与函数关系比较. 2.会作散点图,并利用散点图判断两个变量之间是否具有线性相关关系.3.能根据给出的线性回归方程系数公式建立线性回归方程,并能由回归方程对总体进行预测、估计.(重点、难点)通过对已有数量的分析、运算培养学生数据分析、数学运算的核心素养.1.变量之间的两类常见关系在实际问题中,变量之间的常见关系有如下两类:一类是确定性函数关系,变量之间的关系可以用函数表示.另一类是相关关系,变量之间有一定的联系,但不能完全用函数表示.2.相关关系的分类相关关系分线性相关和非线性相关两种. 3.线性回归方程系数公式能用直线方程y ^=bx +a 近似表示的相关关系叫做线性相关关系,该方程叫线性回归方程.给出一组数据(x 1,y 1),(x 2,y 2),…, (x n ,y n ),线性回归方程中的系数a ,b 满足⎩⎪⎨⎪⎧b =n ∑i =1n x i y i -⎝ ⎛⎭⎪⎪⎫∑i =1n x i ⎝ ⎛⎭⎪⎪⎫∑i =1n y i n ∑i =1nx 2i -⎝ ⎛⎭⎪⎪⎫∑i =1n x i2,a =y -b x .上式还可以表示为⎩⎪⎨⎪⎧b =∑i =1nx i y i-n x -y -∑i =1n x 2i -n x 2=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2,a =y -b x .1.有下列关系:①人的年龄与其拥有的财富之间的关系; ②曲线上点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一树木,其横截面直径与高度之间的关系; ⑤学生与其学号之间的关系. 其中具有相关关系的是________. ①③④ [②⑤为确定关系不是相关关系.]2.下面四个散点图中点的分布状态,直观上判断两个变量之间具有线性相关关系的是________.③ [散点图①中的点无规律的分布,范围很广,表明两个变量之间的相关程度很小;②中所有的点都在同一条直线上,是函数关系;③中点的分布在一条带状区域上,即点分布在一条直线的附近,是线性相关关系;④中的点也分布在一条带状区域内,但不是线性的,而是一条曲线附近,所以不是线性相关关系,故填③.]3.工人工资y (元)依劳动生产率x (千元)变化的线性回归方程为y ^=50+80x ,下列判断正确的是________.①劳动生产率为1 000元时,工资为130元; ②劳动生产率提高1 000元时,工资提高80元; ③劳动生产率提高1 000元时,工资提高130元; ④当月工资为250元时,劳动生产率为2 000元.② [回归直线斜率为80,所以x 每增加1,y ^增加80,即劳动生产率提高1 000元时,工资提高80元.]4.下表是广告费用与销售额之间的一组数据:广告费用(千元) 1 4 6 10 14 销售额(千元)1944405253销售额y (千元)与广告费用x (千元)之间有线性相关关系,回归方程为y ^=2.3x +a (a 为常数),现要使销售额达到6万元,估计广告费用约为________千元.15 [x =7,y =41.6,则a =y -2.3x =41.6-2.3×7=25.5. 当y =6万元=60千元时,60=2.3x +25.5,解得x =15(千元).]变量间相关关系的判断【例1】 在下列两个变量的关系中,具有相关关系的是________. ①正方形边长与面积之间的关系;②作文水平与课外阅读量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故发生率之间的关系.②④[两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系.]1.函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.准确理解变量间的相关关系是解答本题的关键.要准确区分两个变量间的相关关系和函数关系,事实上,现实生活中相关关系是处处存在的,从某种意义上讲,函数关系可以看作一种理想的关系模型,而相关关系是一种普遍的关系.两者区别的关键点是“确定性”还是“不确定性”.1.下列两个变量中具有相关关系的是________(填写相应的序号).①正方体的棱长和体积;②单产为常数时,土地面积和总产量;③日照时间与水稻的亩产量.③[正方体的棱长x和体积V存在着函数关系V=x3;单产为常数a公斤/亩,土地面积x(亩)和总产量y(公斤)之间也存在着函数关系y=ax.日照时间长,则水稻的亩产量高,这只是相关关系,应选③.]2.下列命题:①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.其中正确的命题为________.③④⑤[两个变量不一定是相关关系,也可能是确定性关系,故①错误;圆的周长与该圆的半径具有函数关系,故②错误;③④⑤都正确.]散点图的画法及应用学生A B C D E学科数学8075706560物理7066686462利用散点图判断它们是否具有线性相关关系?如果有线性相关关系,是正相关还是负相关?思路点拨:本题涉及两个变量(数学成绩与物理成绩),以x轴表示数学成绩、y轴表示物理成绩,可得相应的散点图,再观察散点图得出结论.[解] 把数学成绩作为横坐标,把相应的物理成绩作为纵坐标,在平面直角坐标系中描点(x i,y i)(i=1,2,…,5).从图中可以直观地看出数学成绩和物理成绩具有线性相关关系,且当数学成绩减小时,物理成绩也由大变小,即它们正相关.1.判断两个变量x和y之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果图上发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.如果变量的对应点分布没有规律,我们就可以认为这两个变量不具有相关关系.2.正相关、负相关线性相关关系又分为正相关和负相关.正相关是指两个变量具有相同的变化趋势,即从整体上来看,一个变量会随另一个变量变大而变大.从散点图上看,因变量随自变量的增大而增大,图中的点分布在左下角到右上角的区域.负相关是指两个变量具有相反的变化趋势,即从整体上来看,一个变量会随另一个变量变大而变小.从散点图上看,因变量随自变量的增大而减小,图中的点分布在左上角到右下角的区域.提醒:画散点图时应注意合理选择单位长度,避免图形过大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.3.如图是两个变量统计数据的散点图,判断两个变量之间是否具有相关关系?思路点拨:观察图中点的分布情况作出判断.从散点图上看,点的分布散乱无规律,故不具有相关关系.[解] 不具有相关关系,因为散点散乱地分布在坐标平面内,不呈线形.4.有个男孩的年龄与身高的统计数据如下:思路点拨:描点(1,78),(2,87),(3,98),(4,108),(5,115),(6,120).观察点的分布,作出判断.[解] 作出散点图如图:由图可见,具有线性相关关系,且是正相关.线性回归方程的求法及应用【例3】 某产品的广告支出x (单位:万元)与销售收入y (单位:万元)之间有下表所对应的数据.广告支出x /万元 1 2 3 4 销售收入y /万元12284256(1)画出表中数据的散点图;(2)求出y 对x 的回归直线方程y ^=bx +a ,并解释b 的意义; (3)若广告费为9万元,则销售收入约为多少万元? 思路点拨:画散点图→列表处理数据→计算x ,y ,n ∑i =14x 2i ,∑i =14x i y i →计算b →计算a →线性回归方程→销售收入[解] (1)散点图如图.(2)观察散点图可知各点大致分布在一条直线附近,列出下列表格,以便计算回归系数a ,B .序号 xyx 2y 2xy1 1 12 1 144 12 2 2 28 4 784 563 3 42 9 1 764 126 4 4 56 16 3 136 224 ∑10138305 828418于是x =52,y =692,∑i =14x 2i =30,∑i =14y 2i =5 828,∑i =14x i y i =418,代入公式得,b =∑i =14x i y i -4xy∑i =14x 2i -4x 2=418-4×52×69230-4×⎝ ⎛⎭⎪⎫522=735,a =y -b x =692-735×52=-2.故y 对x 的回归直线方程为y ^=735x -2,其中回归系数b =735,它的意义是:广告支出每增加1万元,销售收入y 平均增加735万元.(3)当x =9万元时,y ^=735×9-2=129.4(万元),即若广告费为9万元,则销售收入约为129.4万元. 1.求样本数据的线性回归方程,可按下列步骤进行: 第一步,计算平均数x ,y ;第二步,求和∑i =1nx i y i ,∑i =1nx 2i ;第三步,计算b =∑i =1n (x i -x )(y i -y)∑i =1n(x i -x)2=∑i =1nx i y i -n xy∑i =1nx 2i -n x 2,a =y -b x ;第四步,写出线性回归方程y ^=bx +A .2.对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程.提醒:(1)对一组数据进行线性回归分析时,应先画出其散点图,判断变量之间是否线性相关,再由系数a ,b 的计算公式,计算出a ,b ,由于计算量较大,在计算时应借助计算器,仔细计算,以防出现错误.(2)为了方便,常制表对应算出x i y i ,x 2i ,以便于求和.(3)研究变量间的相关关系,求得回归直线方程能帮助我们发现事物发展的一些规律,估计、预测某些数据,为我们的判断和决策提供依据.5.如图是我国2012年至2018年生活垃圾无害化处理量(单位:亿吨)的折线图. 注:年份代码1-7分别对应年份2012-2018.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2018年我国生活垃圾无害化处理量.参考数据:∑ 7i =1y i =9.32,∑7i =1t i y i =40.17,∑ 7i =1(y i -y )2=0.55,7≈2.646.参考公式:相关系数r =∑ni =1 (t i -t )(y i -y )∑ ni =1(t i -t )2∑ ni =1(y i -y )2,回归方程y ^=a +bt 中斜率和截距的最小二乘估计公式分别为b =∑ ni =1 (t i -t )(y i -y )∑ ni =1(t i -t )2,a =y --b t . 思路点拨:(1)利用相关系数的大小――→确定y 与t 的线性相关程度 (2)求出回归方程→利用方程进行估计[解] (1)由折线图中的数据和附注中的参考数据得 t =4,∑ 7i =1(t i -t )2=28,∑ 7i =1(y i -y )2=0.55,∑ 7i =1(t i -t )(y i -y )=∑ 7i =1t i y i -t ∑7i =1y i =40.17-4×9.32=2.89,∴r ≈ 2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当大,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b =∑ 7i =1(t i -t )(y i -y )∑ 7i =1 (t i -t )2=2.8928≈0.103. a =y -b t ≈1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t .将2016年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82. 所以预测2020年我国生活垃圾无害化处理量约为1.82亿吨.1.本节课的重点是会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系,能根据给出的线性回归方程系数公式建立线性回归方程.难点是了解相关关系、线性相关、回归直线的概念.2.本节课要掌握以下几类问题 (1)准确区分相关关系与函数关系.(2)会利用散点图判断两个变量间的相关关系. (3)掌握用线性回归方程估计总体的一般步骤.1.在如图所示的四个散点图中,两个变量具有相关性的是( ) A .①②B .①④C .②③D .②④D [由图可知①中变量间是一次函数关系,不是相关关系;②中的所有点在一条直线附近波动,是线性相关的;③中的点杂乱无章,没有什么关系;④中的所有点在某条曲线附近波动,是非线性相关的.故两个变量具有相关性的是②④.]2.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得线性回归方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号有( ) A .①③ B .①④ C .②③D .②④B [由正、负相关性的定义知①④一定不正确.]3.某工厂生产某种产品的产量x (吨)与相应的生产能耗y (吨标准煤)有如下几组样本数据:的斜率为0.7,则这组样本数据的线性回归方程是________.y ^=0.7x +0.35 [∵x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5,∴a =y -b x =3.5-0.7×4.5=0.35. ∴线性回归方程为y ^=0.7x +0.35.]4.2019年元旦前夕,某市统计局统计了该市2018年10户家庭的年收入和年饮食支出的统计资料如下表:(2)若某家庭年收入为9万元,预测其年饮食支出.(参考数据:∑i =110x i y i =117.7,∑i =110x 2i =406)思路点拨:按照求线性回归方程的一般步骤,求出线性回归方程,再根据回归方程作出预测.[解] (1)依题意可计算得:x =6,y =1.83,x 2=36,x y =10.98,又∵∑i =110x i y i =117.7,∑i =110x 2i =406,∴b =∑i =110x i y i -10xy∑i =110x 2i -10x 2≈0.17,a =y -b x =0.81,∴y ^=0.17x +0.81.∴所求的线性回归方程为y ^=0.17x +0.81. (2)当x =9时,y ^=0.17×9+0.81=2.34(万元),可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元.。

高中数学第二章统计2.4线性回归方程学案苏教版必修3

高中数学第二章统计2.4线性回归方程学案苏教版必修31.理解线性回归的基本思想和方法,体会变量之间的相关关系.(难点)2.会画出数据的散点图,并会通过散点图判断这组数据是否具有线性关系.(重点) 3.会求数据的线性回归方程,并根据线性回归方程做出合理的判断.(重点、难点)[基础·初探]教材整理1 变量间的关系阅读教材P 74的内容,并完成下面的问题. 1.变量间的关系(1)函数关系:变量之间的关系可以用函数表示,是一种确定性函数关系. (2)相关关系:变量之间有一定的联系,但不能完全用函数来表达. 2.散点图从一个统计数表中,为了更清楚地看出x 与y 是否有相关关系,常将x 的取值作为横坐标,将y 的相应取值作为纵坐标,在直角坐标系中描点(x i ,y i )(i =1,2,3,…),这样的图形叫做散点图.判断正误:(1)相关关系是一种不确定关系,而函数关系是一种确定关系.( ) (2)商品的销售收入与广告支出经费是函数关系.( ) (3)散点图越集中,则相关关系越强.( )【解析】 (1)√.由函数关系及相关关系的定义知正确. (2)×.是相关关系,而不是确定关系,故错误.(3)×.只有当散点图呈规律性分布时才具有相关关系.故错误. 【答案】 (1)√ (2)× (3)× 教材整理2 线性回归方程阅读教材P 75~P 76“例1”上边的内容,并完成下列问题. 1.线性相关关系如果散点图中点的分布从整体上看大致在一条直线的附近,我们用直线y ^=bx +a 拟合散点图中的这些点,像这样能用直线y ^=bx +a 近似表示的相关关系叫做线性相关关系.2.线性回归方程 设有n 对观察数据如下:x x 1 x 2 x 3 … x n yy 1y 2y 3…y n当a ,b 使Q =(y 1-bx 1-a )2+(y 2-bx 2-a )2+…+(y n -bx n -a )2取得最小值时,就称y ^=bx +a 为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线.3.用回归直线进行数据拟合的一般步骤 (1)作出散点图,判断散点是否在一条直线附近; (2)如果散点在一条直线附近,用公式⎩⎪⎨⎪⎧b =∑i =1nx i y i-∑i =1nx i∑i =1ny 1n ∑i =1nx 2i -∑i =1nx i2a =y --b x-或求出a ,b ,并写出线性回归方程.填空:(1)有一个线性回归方程为y ^=2-1.5x ,则变量x 增加一个单位时,y 平均________1.5个单位.(填“增加”或“减少”)【解析】 ∵b =-1.5,∴x 每增加一个单位时y 减少1.5个单位. 【答案】 减少(2)过(3,10),(7,20),(11,24)三点的回归直线方程是________. 【解析】 代入系数公式得b =1.75,a =5.75. 代入直线方程. 求得y ^=5.75+1.75x . 【答案】 y ^=5.75+1.75x[小组合作型]相关关系的判断(1)在下列两个变量的关系中,具有相关关系的是________.(填序号)①正方形边长与面积之间的关系;②作文水平与课外阅读量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.(2)如图2­4­1所示,表示两个变量不具有相关关系的有________.(填序号)图2­4­1【精彩点拨】(1)根据相关关系的定义判断.(2)观察散点是否分布在一条曲线(直线)附近,否则不具有相关关系.【自主解答】(1)①正方形的边长与面积之间的关系是函数关系.②作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系.故填②④.(2)①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x,y不具有相关关系.故填①④.【答案】(1)②④(2)①④1.函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系.2.判断两个变量x和y间是否具有线性相关关系,常用的方法是绘制散点图,如果散点的分布从整体上看大致在一条直线附近,那么这两个变量就具有线性相关关系,判断时注意不要受个别点的位置的影响.[再练一题]1.如图2­4­2所示的五组数据(x ,y )中,去掉点________后,剩下的四组数据相关性增强.(填坐标)图2­4­2【解析】 去掉点(4,10)后,其余四个点大致在一条直线附近,相关性增强. 【答案】 (4,10)线性回归方程的求法及应用2017年元旦前夕,某市统计局统计了该市2016年10户家庭的年收入和年饮食支出的统计资料如下表:年收入x (万元) 2446 6 67 78 10年饮食支出y (万元) 0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3(1)画出散点图;(2)从散点图判断年饮食支出(y )与年收入(x )是否具有线性相关关系?若有线性相关关系,求出线性回归方程;(3)若某家庭年收入为9万元,预测其年饮食支出.⎝ ⎛⎭⎪⎪⎫参考数据:∑i =110x i y i =117.7,∑i =110x 2i =406 【精彩点拨】 画散点图→判断具有线性相关关系→求b ,a ,得方程→ 进行预测【自主解答】 (1)画出散点图如下图所示.(2)由散点图知年饮食支出与家庭年收入具有线性相关关系.依题意可计算得x -=6,y -=1.83,x -2=36,x - y-=10.98,又∵∑i =110x i y i =117.7,∑i =110x 2i =406,∴b =∑i =110x i y i -10x - y-∑i =110x 2i -10x -2≈0.17,a =y --b x -=0.81, ∴y ^=0.17x +0.81.∴所求的线性回归方程为y ^=0.17x +0.81. (3)当x =9时,y ^=0.17×9+0.81=2.34(万元),可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元.1.求样本数据的线性回归方程,可按下列步骤进行: (1)计算平均数x -,y -;(2)求和∑i =1nx i y i ,∑i =1nx 2i ;(3)计算b =∑i =1nx i -x-y i -y-∑i =1nx i -x-2=∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2,a =y --b x -;(4)写出线性回归方程y ^=bx +a .2.利用线性回归方程可对变量进行预测,但要注意预测的结果只是一个估计值,而不是精确值.[再练一题]2.假设关于某设备的使用年限x 和所支出的维修费用y (万元)有如下的统计资料:【导学号:11032052】使用年限x 2 3 4 5 6 维修费用y2.23.85.56.57.0(1)线性回归方程y ^=bx +a 的回归系数a 、b ; (2)估计使用年限为10年时,维修费用是多少? 【解】 (1)由条件知x -=15(2+3+4+5+6)=4,y -=15(2.2+3.8+5.5+6.5+7.0)=5,∑i =15x 2i =22+32+42+52+62=90,∑i =15x i y i =2×2.2+3×3.8+4×5.5+5×6.5+6×7.0=112.3.由公式可得b =∑i =15x i y i -5x -y-∑i =15x 2i -5x -2=112.3-5×4×590-5×42=12.310=1.23. a =y --b x -=5-1.23×4=0.08.(2)由(1)知回归直线方程为y ^=1.23x +0.08,当x =10时,y ^=1.23×10+0.08=12.3+0.08=12.38,即估计使用10年时,维修费用是12.38万元.[探究共研型]对线性回归方程的认识探究1 对于任意一组样本数据,利用“最小平方法”是否都可以求得“回归方程”?此时的“回归方程”是否都具有实际意义?【提示】 对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程.探究2 对于同一总体而言,由不同的样本数据得到的线性回归方程是否一样? 【提示】 回归方程被样本数据唯一确定,各样本点大致分布在回归直线附近.对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性.探究3 在线性回归方程y ^=bx +a 中,b 的意义是什么?【提示】 回归方程中的系数b 反映了变量y 随x 的变化趋势及变化幅度,即当x 变化一个单位时,y 随着变化|b |个单位.当b >0时,y 随x 的增大而增大,此时y 与x 具有正相关关系;当b <0时,y 随x 的增大而减小,此时y 与x 具有负相关关系.(1)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中正确的是________.(填序号)①y 与x 具有正的线性相关关系; ②回归直线过样本点的中心(x -,y -);③若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ; ④若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg.(2)调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【精彩点拨】 (1)根据回归直线中系数b 的含义逐一判断; (2)根据方程中系数0.254的含义解答.【自主解答】 (1)①中,由于0.85>0,故y 与x 有正相关关系,故正确;②中,由公式a =y --b x -知y -=b x -+a ,因此回归直线y ^=bx +a 一定过点(x -,y -),所以正确;③中,由0.85>0知正确;④中,回归方程的预测值只是一个估计值,故不正确.(2)由回归方程y ^=bx +a 中系数b 的意义知,年收入每增加1万元,年饮食支出平均增加0.254万元,故填0.254.【答案】 (1)①②③ (2)0.254由样本数据得到的回归方程y ^=bx +a 不一定经过散点,但回归直线一定经过样本中心,即点(x -,y ^).[再练一题]3.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程为y ^=bx +a ,那么下列说法不正确的序号是________.(填序号)①直线y ^=bx +a 必经过点(x -,y -);②直线y ^=bx +a 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点;③直线y ^=bx +a 的斜率为∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2;④直线y ^=bx +a 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差∑i =1n[y i -(bx i +a )]2是该坐标平面上所有直线与这些点偏差中最小的.【解析】 回归直线不一定经过散点,故②的说法不对;对一组观测值(x i ,y i )而言,只有当散点集中分布在一条直线附近时,所反映的变量y 和x 才是线性相关关系,此时的回归直线才能真实反映y 和x 的线性相关关系;否则,当散点图不是集中分布在某一条直线附近时,则表示的不是线性相关关系,此时的回归方程是毫无意义的.①③④都正确.【答案】 ②1.下列具有相关性的是________.(填序号) ①某地区的降水量与地下水位; ②人的年龄与血压;③某天的天气情况与股市的涨跌情况; ④学生的学习时间与学习成绩.【解析】 某天的天气情况与股市的涨跌无任何关系,不具有相关性. 【答案】 ①②④2.工人工资(元)依劳动生产率(千元)变化的回归方程为y ^=80x +50,下列判断正确的是________.(填序号)①劳动生产率为1 000元时,工资为130元; ②劳动生产率提高1 000元时,工资平均提高80元; ③劳动生产率提高1 000元时,工资提高130元; ④当月工资为210元时,劳动生产率为2 000元.【解析】 回归直线斜率为80,所以x 每增加1,y 增加80,即劳动生产率提高1 000元时,工资平均提高80元.【答案】 ②3.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.236x -4.578. 其中一定不正确的结论的序号是________.【解析】 ①中y 与x 负相关而斜率为正,不正确;④中y 与x 正相关而斜率为负,不正确.【答案】 ①④4.已知回归直线方程为y ^=4.4x +838.19,则可估计x 与y 增长速度之比约为________. 【导学号:11032053】【解析】 由题意知x 与y 增长速度之比为14.4=522.【答案】5225.要分析学生初中升学的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽选10名学生,分析他们入学的数学成绩(x )和高一年级期末数学考试成绩(y ).编号1 2 3 4 5 6 7 8 9 10 x 63 67 45 88 81 71 52 99 58 76 y65785282928973985675(1)画出散点图;(2)分析x 和y 是否有相关关系;(3)若近似成线性关系,请画出一条直线来近似地表示这种线性关系. 【解】 (1)散点图如图所示:(2)由散点图知x 和y 有线性相关关系.入学成绩高的同学期末成绩一般也较高. (3)所画直线如散点图中直线所示.。

高中数学 2.4 线性回归方程学案 苏教版必修3

2.4 线性回归方程1.变量间的两种关系在实际问题中,变量之间的常见关系有如下两类:一类是确定性函数关系,变量之间的关系可以用函数表示;一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达.预习交流1相关关系与函数关系有何区别与联系?提示:相同点:两者均是指两个变量的关系;不同点:①函数关系是一种确定的关系;相关关系是一种非确定的关系;②函数关系是一种因果关系,而相关关系不一定是因果关系.2.散点图为了刻画两个变量之间的相关关系,常用横坐标x 表示一个变量,纵坐标y 表示另一个变量,建立平面直角坐标系,将两个变量所表示的点在坐标系内标出,这样的图称为散点图.预习交流2散点图有什么作用?提示:可以用来判断两个变量是否相关. 3.线性回归方程(1)最小平方法:离差的平方和Q (a ,b )是直线y ^=bx +a 与各散点在垂直方向(纵轴方向)上的距离的平方和,可以用来衡量直线y ^=bx +a 与图中各个点的接近程度.所以,设法取a ,b 的值,使Q (a ,b )达到最小值.这种方法叫做最小平方法,又称“最小二乘法”.其中y ^读作“y 估计”.(2)线性相关关系的概念:能用直线方程y ^=bx +a 近似表示的相关关系叫做线性相关关系.(3)当a ,b 使Q =(y 1-bx 122n n a )2取得最小值时,就称方程y ^=bx +a 为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线.(4)线性回归系数公式:线性回归方程y ^=bx +a 中的系数a ,b 可用下面的公式计算.⎩⎪⎨⎪⎧b =∑i =1nx i y i-n x y ∑i =1nx 2i -n x 2=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2,a =y -b x .预习交流3线性回归方程y ^=bx +a 是否一定经过一个定点?提示:由a =y -b x 代入线性回归方程,得y ^=bx +y -b x ,整理得(y ^-y )=b (x -x ).因此,线性回归方程一定经过定点(x ,y ).预习交流4(1)以下两变量之间具有相关关系的是__________. ①正方形的面积与边长 ②人的身高与年龄③匀速行驶车辆的行驶路程与时间 ④人的身高与视力(2)散点图的作用是__________. ①查找个体个数②比较个体数据大小关系 ③探究个体分类④粗略判断变量是否具有相关关系(3)若施化肥量x (千克/亩)与水稻产量y (千克/亩)的回归方程为y ^=5x +250,当施化肥量为80千克/亩时,预计水稻产量为__________.提示:(1)② (2)④ (3)650千克/亩一、线性相关关系的判断某公司利润(1)(2)判断y 与x 是否具有线性相关关系.思路分析:本题中涉及两个变量:利润与销售总额,以销售总额为自变量,考察利润的变化趋势,从而作出判断.解:(1)散点图如下,(2)由图知,所有数据点接近直线排列,因此,认为y 与x 有线性相关关系.1.在下列各变量之间的关系中:①凸n 边形(n ≥3)的边数与内角度数之和;②烧香拜佛的次数与考试成绩;③某校高一学生的身高与体重;④一块农田的玉米产量与施肥量.其中具有相关关系的是__________. 答案:③④解析:①是函数关系,②没有相关关系,③④均具有相关关系,故填③④. 2.下列各图中所示两个变量之间具有线性相关关系的是__________.答案:②解析:由散点图易知②中变量具有线性相关关系.解:(1)画出散点图如图.(2)由图知,两变量间存在相关关系.(1)两个变量x 和y 相关关系的确定方法:①散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断; ②表格、关系式法:结合表格或关系式进行判断; ③经验法:借助积累的经验进行分析判断.(2)判断两个变量x 和y 之间是否具有线性相关关系,常用的简便方法就是绘制散点图.如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.二、求线性回归方程求出y 关于x 的回归方程.思路分析:先画出散点图,判断它们是否具有相关关系,再根据题目中提供的数据先计算出x ,y ,∑i =1nx 2i ,∑i =1nx i y i ,代入公式求a ,b 的值即可.解:散点图如图所示.设所求回归方程为:y =bx +a ,则由上表可得b =∑i =15x i y i -5x y∑i =15x 2i -5x 2=112.3-5×4×590-5×42=12.310=1.23, a =y -b x =5-1.23×4=0.08.∴回归方程为y ^=1.23x +0.08.1答案:y ^=0.56x +997.4解析:利用公式b =∑i =15x i y i -5x y∑i =15x 2i -5x 2=0.56,a =y -b x =997.4,故回归直线的方程为y ^=0.56x +997.4.2解:x =706=353,y =2306=1153, x 21+x 22+…+x 26=1+16+100+169+324+676=1 286,x 1y 1+x 2y 2+…+x 6y 6=-20+96+340+13×38+18×50+26×64=3 474.b =x 1y 1+x 2y 2+…+x 6y 6-6x y x 21+x 22+…+x 26-6x2=3 474-6×353×11531 286-6×⎝ ⎛⎭⎪⎫3532≈1.68,a =y -b x ≈18.73.即所求得的线性回归方程为y ^=1.68x +18.73. (1)用公式求回归方程的一般步骤是:①列表x i ,y i ,x i y i ;②计算x ,y ,∑i =1nx 2i ,∑i =1nx i y i ;③代入公式计算b ,a 的值; ④写出回归方程.(2)求回归方程时应注意的问题: ①知道x 与y 呈线性相关关系,无需进行相关性检验;否则,应首先进行相关性检验.如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的;②用公式计算a ,b 的值时,要先算出b ,然后才能算出a ;③使用计算器能大大简化手工的计算,迅速得出正确的结果,但输入数据时要细心,不能出任何差错;不同计算器的按键方式可能不同,可参考计算器的使用说明书进行相关计算.三、线性回归方程的应用(1)(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?解:(1)散点图如下:(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大.图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.1.经调查知,某品牌汽车的销售量y (辆)与广告费用x (万元)之间的线性回归方程为y ^=250+4x .当广告费用为30万元时,预测汽车销售量为__________辆.答案:370解析:当x =30时,y ^=250+4×30=370.2根据上表可得回归方程y =bx +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为__________.答案:65.5万元解析:∵a =y -b x =49+26+39+544-9.4×4+2+3+54=9.1,∴回归方程为y ^=9.4x +9.1.令x =6,得y ^=9.4×6+9.1=65.5(万元).3.(2012福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟(1)求回归直线方程y =bx +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(Ⅰ)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)由于x =16(x 1+x 2+x 3+x 4+x 5+x 6)=8.5,y =16(y 1+y 2+y 3+y 4+y 5+y 6)=80,所以a =y -b x =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得 L =x (-20x +250)-4(-20x +250)=-20x 2+330x -1 000=-20⎝⎛⎭⎪⎫x -3342+361.25,当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.(1)回归分析是数理统计中最常见的统计方法之一,它研究的是一个变量与另一个变量的相关关系.应用线性回归方程解实际问题时,一般是先借助于散点图,直观地看出两个变量之间是否具有相关关系,再利用最小平方法思想建立线性回归方程,从而定量地描述两个变量的关系.回归系数a ,b 刻画了两个变量之间的变化趋势.利用回归直线方程,可以对实际问题进行预测.由一个变量的变化推测另一个变量的变化,从而为决策者提供依据.(2)关于回归分析的几个问题:①回归分析是寻找相关关系中非确定性关系的某种确定性; ②对于相关关系细节的分析,我们可以通过作统计图表来使我们对两个变量之间的关系有一个直观的印象和判断.当然还可以通过另一种图——散点图来分析两个变量间的关系.1.给出x ,y则根据数据可以判断x 和有关系”)答案:确定关系解析:由表中数据可以得到x ,y 之间是一种函数关系:y =2x +1.所以x 和y 是一种确定的关系,也即函数关系.2.下列关系中是相关关系的是__________. ①学生的学习态度和学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. 答案:①②解析:根据相关性的定义可知①②为相关关系,③④不具有相关关系. 3.下列分别是3对变量的散点图,则具有相关关系的是__________.答案:①③解析:由散点图知①③中的点大致分布在一条直线附近.4.(2012湖南高考改编)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系.根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的个数是__________.①y 与x 具有正的线性相关关系;②回归直线过样本点的中心(x ,y );③若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ; ④若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg. 答案:①解析:④中,若该大学某女生身高为170 cm ,则可断定其体重约为:0.85×170-85.71=58.79 kg.故④不正确.5.以下是在某地搜集到的不同楼盘新房屋的销售价格y (单位:万元)和房屋面积x (单位:m 2)(1)(2)判断新房屋的销售价格和房屋面积之间是否具有相关关系.如果有相关关系,是正相关还是负相关?解:(1)数据对应的散点图如图所示.(2)通过以上数据对应的散点图可以判断,新房屋的销售价格和房屋的面积之间具有线性相关关系,且是正相关.。

「精品」高中数学第二章统计2.4线性回归方程学案苏教版必修3

2.4 线性回归方程学习目标 1. 了解相关关系、线性相关的概念;2.会根据散点图判断数据是否具有相关关系;3.会求线性回归方程,并能根据线性回归方程做出合理判断.知识点一 相关关系思考 数学成绩y 与学习数学所用时间t 之间的关系,能否用函数关系刻画?梳理 相关关系:与函数关系不同,相关关系是一种变量之间__________的联系,但不是__________的关系. 知识点二 散点图1.散点图:将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形. 2.利用散点图可以大致确定两个变量是不是有相关关系,以及相关性强弱. 知识点三 最小平方法及线性回归方程思考1 若散点大致分布在一条直线附近,如何确定这条直线比较合理?思考2 任何一组数据都可以由最小二乘法得出线性回归方程吗?梳理 线性回归方程:能用直线方程________________近似表示的相关关系叫做____________关系,该方程叫________________.最小平方法是一种求回归直线的方法,用这种方法求得的回归直线能使样本数据的点到回归直线的距离的平方和最小.给出一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),用最小平方法求得线性回归方程的系数a ,b 满足⎩⎪⎨⎪⎧b = ,a = .上式还可以表示为⎩⎨⎧b = = ,a = .类型一变量之间相关关系的判断例1 在下列两个变量的关系中,哪些是相关关系?(1)正方形边长与面积之间的关系;(2)作文水平与课外阅读量之间的关系;(3)人的身高与年龄之间的关系;(4)降雪量与交通事故发生率之间的关系.反思与感悟如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么.跟踪训练1 有下列关系:①老师的执教水平与学生的学习成绩之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其横截面直径与高度之间的关系;⑤学生与其学号之间的关系.其中有相关关系的是________.(填序号)类型二散点图及应用例2 在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:画出散点图,分析年龄与人体脂肪含量的关系.反思与感悟画散点图时应注意合理选择单位长度,避免图形过大或过小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.相关关系的散点图不一定分布在一条直线附近,也可能是曲线.跟踪训练2 下表为我国在公元1000年到2000年间的人口数量.(1)试画出散点图;(2)年份与人口是相关关系吗?如果是,是正相关还是负相关?你觉得用什么函数模型模拟效果比较好?反思与感悟函数关系与相关关系之间有密切联系,可以用函数关系来模拟相关关系,也可借助散点图来发现两变量之间的函数关系,在一定条件下,两种关系还可相互转化.类型三线性回归方程的求法及应用例3 下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数之间是否具有线性相关关系.如果具有线性相关关系,求出线性回归方程;如果不具有线性相关关系,说明理由.反思与感悟对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,若呈直线形,再依系数a,b的计算公式,算出a,b.求a,b时,先计算平均数x,y;接着计算x i与y i的积,然后求∑x i y i及∑x2i;最后将结果代入公式求b;用a=y-b x求a.跟踪训练3 下表数据是退水温度x(℃)对黄酮延长性y(%)效应的试验结果,y是以延长度计算的,且对于给定的x,y为正态变量,其方差与x无关.(1)画出散点图;(2)指出x,y是否线性相关;(3)若线性相关,求y关于x的线性回归方程;(4)估计退水温度是1 000℃时,黄酮延长性的情况.1.下列两个变量之间的关系,哪个不是函数关系________.①正方体的棱长和体积;②圆半径和圆的面积;③正n边形的边数和内角度数之和;④人的年龄和身高.2.如图所示的五组数据(x ,y )中,去掉__________后,剩下的4组数据相关性增强.3.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i=1,2,…,n ),用最小平方法建立的线性回归方程为y ^=0.85x -85.71,则下列结论中不正确的是________. ①体重y 与身高x 具有函数间的关系; ②回归直线过(x ,y )点;③若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ; ④若该大学某女生身高为170 cm ,则可判定其体重必为58.79 kg. 4.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得线性回归方程y^=bx +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为________万元.1.求样本数据的回归方程,可按下列步骤进行: 第一步 计算平均数x ,y .第二步 求和∑i =1nx i y i ,∑i =1nx 2i .第三步 计算b =∑i =1nx i -xy i -y∑i =1nx i -x2=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a =y -b x .第四步 写出回归方程y ^=bx +a .2.回归方程被样本数据唯一确定,各样本点大致分布在回归直线附近.对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性.3.对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程.答案精析问题导学 知识点一思考 一般来说,学数学的时间越长,成绩越好.但用时10小时,数学成绩却不是一个确定的数字.故不能用函数关系刻画. 梳理 有一定 确定性 知识点三思考1 应该使散点整体上最接近这条直线.思考 2 用最小二乘法求线性回归方程的前提是先判断所给数据是否具有线性相关关系(可利用散点图来判断),否则求出的线性回归方程是无意义的.梳理 y ^=bx +a 线性相关 线性回归方程n ∑ni =1x i y i -∑n i =1x i ∑n i =1y in ∑ni =1x 2i -∑ni =1x i2y -b x ∑ni =1x i y i -n x y ∑n i =1x 2i -n x2∑ni =1x i -xy i -y∑n i =1x i -x2y -b x题型探究例1 解 两变量之间的关系有:函数关系与带有随机性的相关关系.(1)正方形的边长与面积之间的关系是函数关系.(2)作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.(3)人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具备相关关系.(4)降雪量与交通事故发生率之间具有相关关系. 跟踪训练1 ①③④ 例2 解 散点图如下:在散点图中,点分布在从左下角到右上角的区域,故人的年龄与人体脂肪含量是相关关系. 跟踪训练2 解 (1)散点图如下:(2)由图可知,我国在1000年到2000年间的人口数量与年份是相关关系,且为正相关.因为增长速度越来越快, 用指数模型模拟效果比较合适.例3 解 在直角坐标系中画出数据的散点图如图:直观判断散点在一条直线附近,故具有线性相关关系. 从而计算相应的数据之和:∑i =18x i =1 031,∑i =18y i =71.6,∑i =18x 2i =137 835,∑i =18x i y i =9 611.7.将它们代入公式计算得b ≈0.077 4,a ≈-1.024 1,所以,所求线性回归方程为y ^=0.077 4x -1.024 1. 跟踪训练3 解 (1)散点图如图:(2)由散点图可以看出样本点分布在一条直线的附近,可见y 与x 线性相关. (3)列出下表并用科学计算器进行有关计算.于是可得b =∑6i =1x i y i -6x y∑6i =1x 2i -6x2=198 400-6×550×571 990 000-6×5502≈0.058 86,a =y -b x =57-0.058 86×550=24.627.因此所求的线性回归方程为y ^=0.058 86x +24.627.(4)将x =1 000代入线性回归方程得y ^=0.058 86×1 000+24.627=83.487,即退水温度是1 000℃时,黄酮延长性大约是83.487%. 当堂训练 1.④解析 ①②③都是函数关系,人的年龄和身高是一种不确定的关系,故④不是函数关系. 2.(4,10)解析 去除(4,10)后,其余四点大致分布在一条直线附近,相关性增强. 3.①④解析 体重与身高的关系不确定,不是函数关系.当x =170时,y ^=0.85×170-85.71=58.79,体重的估计值为58.79 kg. 4.65.5解析 由题意可知x =3.5,y =42,则42=9.4×3.5+a ,a =9.1,y ^=9.4×6+9.1=65.5.。

高中数学第2章统计2.4线性回归方程名师导航学案苏教版必修3

2.4 线性回归方程名师导航三点剖析一、变量之间关系在实际问题中,变量之间关系有两类:一类是确定性关系,变量之间关系可以用函数表示.例如,正方形面积S与边长a之间就是确定性关系,可以用函数S=a2表示.在实际问题中,变量之间关系除了确定性函数关系之外,还有一种非确定性关系.例如:商品销售收入与广告支出经费之间关系.我们不可否认商品销售收入与广告支出经费之间有着密切联系,但商品销售收入不仅与广告支出多少有关,还与商品质量、居民经济状况等因素有关.再如:粮食产量与施肥量之间关系.在一定范围内,施肥量越大,粮食产量就越高.但是,施肥量并不是决定粮食产量唯一因素,因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素影响.又如人身高与体重之间关系、人年龄与血压之间关系等,这些变量之间存在着密切关系,但它不能由一个变量数值准确地确定另一个变量数值.像这种自变量取一定值时,因变量取值带有一定随机性,这样两个变量之间关系,我们称之为相关关系.从某种意义上讲,函数关系可以看作是一种理想关系模型,而相关关系那么是一种非常普遍关系.研究与学习相关关系不仅可以使我们能够处理更为广泛数学问题,还可以使我们对函数关系认识上升到一个新高度.在现实生活中,存在大量相关关系,所以,寻找变量之间相关关系很有必要.在此,统计在其中发挥着非常重要作用.在相关关系中,变量关系不是完全确定,而是带有不确定性.这就需要通过收集大量数据(有时通过调查,有时通过试验),在对数据进展统计分析,发现其中规律,才能对它们之间关系作出判断.二、散点图在考虑相关关系中两个量关系时,为了对变量之间关系有一个大致了解,我们通常将变量所对应点描出来,这些点就组成了具有相关关系变量之间一组数据图形,通常称这种图为变量之间散点图.通过具有相关关系两个量散点图我们可以对这两个变量间关系有一个大致了解.例如:在7块并排、形状大小一样试验田上进展施化肥量对水稻产量影响试验,得到如下表所示一组数据(单位:kg).将表中各对数据在平面直角坐标系中描点,即可得到该组数据散点图,如图6-12所示:图6-12由图可发现,图中各点大致分布在一条直线附近.三、最小二乘法、线性回归方程1.最小二乘法由施化肥量对水稻产量影响试验所得到散点图可发现,图中各点,大致分布在一条直线y=a+bx 附近.故可用一个线性函数近似表示施化肥量与水稻产量之间关系.这种线性关系可以用多种方法来进展刻画,那么用什么样线性关系刻画会更好一些呢?有一个非常直观想法,一个好线性关系要保证这条直线与所有点都近.如果有n 个点:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),可以用下面表达式来刻画这些点与直线y=a+bx 接近程度:[y 1-(a+bx 1)]2+[y 2-(a+bx 2)]2+…+[y n -(a+bx n )]2.使得上式到达最小值直线y=a+bx 就是我们所要求直线,这种方法称为最小二乘法. 2.线性回归方程通过收集现实生活中两个有关联变量数据作出散点图,如果所有散点分布成或近似成一条直线,我们说这两个变量有线性关系(否那么就说两个变量不具有线性关系),然后运用最小二乘法思想,用一条直线来拟合两个变量之间关系:y=a+bx.要求所有点相对于该直线偏差平方与尽可能到达最小.我们把y=a+bx 称作线性回归方程,其中求线性回归方程一般步骤:(1)根据两组数据计算;,,,,,x ∑∑∑∑====n1i i i n1i 2i n1i i n1i i y x x y x y (2)代入(*)计算求a 、b 值; (3)代入y=a+bx.一般情况下,求线性回归方程可借助计算器与计算机来完成.问题探究问题1:在一次对人体脂肪含量与年龄关系研究中,研究人员获得了一组样本数据:人体脂肪含量与年龄之间关系根据上述数据,人体脂肪含量与年龄之间有怎样关系?探究:观察表中数据,大体上来看,随着年龄增加,人体中脂肪百分比也在增加.为了确定这一关系细节,我们需要进展数据分析.我们假设人年龄影响体内脂肪含量,于是,按照习惯,以x轴表示年龄,以y轴表示脂肪含量,得到相应散点图(如图6-13所示).图6-13从散点图我们可以看出,年龄越大,体内脂肪含量越高,图中点趋势说明两个变量之间确实存在一定关系,这个图支持了我们从数据表中得出结论.经计算可得到回归直线回归方程为yˆ=0.577x-0.448. 问题2:一般地,(x,y)n 组观察数据:x x 1 x 2 x 3 … x n yy 1y 2y 3…y n回归直线方程为y=a+bx ,那么直线y=a+bx 恒过定点是什么? 探究:由线性回归方程推导,可知方程系数a 、b 满足条件:x b ,x x n y x y x n b ni i n i i ni i ni i ni i i ---=∑∑∑∑∑=====y -a )())((2112111.由此不难发现,点(x ,y )坐标满足直线y=a+bx 方程.所以,由点与直线位置关系可得点(x ,y )在直线y=a+bx 上,即直线y=a+bx 恒过点(x ,y ).这里x =n1∑=ni i x 1,y =n1. 精题精讲例1.有一个同学家开了一个小卖部,他为了研究气温对热饮销售影响,经过统计,得到一个卖出热饮杯数与当天气温比照表: 摄氏温度/℃-547 12 15 19 23 27 31 36热饮杯数 1561513212813011610489 93 76 54(1)画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系一般规律; (3)求回归方程;(4)如果某天气温是2℃,预测这天卖出热饮杯数.思路解析根据所给数据,作出散点图,判断散点是否在一条直线附近;如果散点在一条直线附近,用公式(*)求出a、b,写出线性回归方程.答案:(1)散点图如图6-14所示:图6-14(2)从图中看到,各点散布在从左上角到右下角区域里,因此,气温与热饮销售杯数之间成负相关,即气温越高,卖出去热饮杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线附近,因此,可用公式(*)求出回归方程系数.利用计算器容易求得回归方程yˆ=-2.352x+147.767.(4)当x=2时,yˆ=143.063.因此,某天气温为2℃时,这天大约可以卖出143杯热饮.例2.为研究某市家庭年平均收入与年平均生活支出关系,该市统计调查队随机调查了10个家庭,得数据如下:求回归直线方程.思路解析答案:列表.故可求得.y ,,,,x ni n n 17.27x 7.22y 88.32x 42.1102.14y 72.1102.171i i 1i 2i 1i 2i =======∑∑∑===∴b=0.833,a=-0.013.∴回归直线方程为y=0.833x -0.013.例3.随机调查了某地区10个商店建筑面积x(km 2)与年销售额y(百万元)样本如下: (1)求y 关于x 线性回归方程;(2)假设线性关系存在,那么对于一个拥有10 000m 2商店来说,它年销售额为多少? 思路解析答案:(1)列表.∴x=10×169.6=16.96,y=10×99.3=9.93.∴=3 174.9,=5 968.4,=1 822.79.∴ ∴y=0.48x+1.75.(2)当x=10时,y=6.55.∴年销售额约为655万元.绿色通道此题反映了生活中普遍存在商店面积与年销售额之间联系,并根据已有数据得出线性回归方程.这是一类日常生活中经常出现问题.商店面积与年销售额之间存在着线性相关关系,根据相关数据我们求出它们之间线性回归方程.利用该方程得出年销售额也只是一种估计.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.4 线性回归方程庖丁巧解牛知识·巧学一、相关关系变量之间的常见关系:一类是确定性函数关系,变量之间的关系可以用函数表示.如正方形的边长l与面积S 之间就是确定性函数关系,可以用函数S=l2表示;一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达.如人的体重y与身高x有关.一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系.在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常重要的作用.变量之间的相关关系带有不确定性,这需要通过收集大量的数据,对数据进行统计分析,发现规律,才能作出科学的判断.辨析比较函数关系与相关关系的区别与联系相同点:两者均是指两个变量间的关系;不同点:①函数关系是一种确定性关系,自变量的任一取值,因变量都有唯一确定的值与之对应;相关关系是非确定性关系,因变量的取值具有一定的随机性;②函数关系是因果关系,而相关关系不一定是因果关系,也可能是伴随关系;③相关关系的分析方向及方法,由于相关关系的不确定性,在寻找变量间相关性的过程中,统计发挥着重要的作用,而函数关系则可以通过函数的性质来进行研究.二、线性回归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析. 通俗地讲,回归分析就是寻找相关关系中非确定性关系的某种确定性.1.散点图我们把表示具有相关关系的两个变量x、y的一组数据(x n,y n)(n=1,2,3,…)对应的一些点(即样本点)画在坐标系内,得到的图形叫做散点图.如:某地农业技术指导站的技术员,经过在7块并排大小相同的试验田上进行施化肥量对水观察表中数据,大体上随着施化肥量的增加,水稻的产量也在增加.只是表中两者之间的关系表现得不是很确切,需要对数据进行分析.为此我们可以作统计图表,以便对两者有一个直观的印象和判断.除上述的统计图表外,我们还可以用另一种统计图——散点图来分析. 以x轴表示施肥量,y轴表示水稻产量,可得散点图如图2-4-1:图2-4-1从散点图可以看出两变量的确存在一定关系,大体上随着施化肥量的增加,水稻的产量也在增加.可见散点图能直观形象地反映各对数据的密切程度. 注意:如果关于两个变量统计数据的散点图呈现如图2-4-2的形状,则这两个变量之间不具有相关关系.如学生的身高与学生的数学成绩就没有相关关系.图2-4-2可见利用散点图可以判断变量之间有无相关关系.所以在研究两个变量之间是否存在某种关系时,必须从散点图入手.学法一得 画出散点图,可以作出如下判断: ①如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即说明变量之间具有函数关系.②如果所有的样本点都落在某一函数曲线附近,则说明变量之间具有相关关系. ③如果所有的样本点都落在某一直线附近,则变量之间具有线性相关关系. 2.最小二乘法设有一直线方程yˆ=bx+a , Q(a,b)是直线yˆ=bx+a 与各散点在垂直方向(纵轴方向)上的距离的平方和,设法取a,b 的值,使Q(a,b)达到最小值.这种方法叫做最小平方法(又称最小二乘法).其中点Q=(y 1-bx 1-a)2+(y 2-bx 2-a)2+…+(y n -bx n -a)2取得最小值时,就称yˆ=bx+a 为这n 对数据的线性回归方程,该方程所表示的直线称为回归直线.上述式子展开后,是一个关于a 或b 的二次函数,应用配方法,可求出使Q 为最小值时的a 、b 的值,即⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑∑∑∑=====.,)())((2112111x b y a x x n y x y x n b ni i n i i ni i n i i n i i i (*) 其中x =∑=n i i x n 11,∑==ni i y n y 11.求线性回归方程的步骤:计算平均数x ,y ;计算x i 与y i 的积,求∑x i y i ;计算∑x i 2;将结果代入公式求a ;用b=y -a x 求b ;写出回归方程.深化升华 求相关变量的回归直线的意义:回归直线方程在现实生活与生产中有广泛的应用.应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序”变为“有序”,并对情况进行估测、补充.因此,学过回归直线方程以后,应能积极应用回归直线方程解决一些相关的实际问题,去进一步体会回归直线的应用价值. 三、相关系数与相关性检验进行回归分析,通常先进行相关性检验.若能确定两个变量具有线性相关性,则再去求其线性回归方程,否则所求方程毫无意义.给定(x i ,y i )(i=1,2,3,…,n ),只要x 1,x 2,x 3,…,x n 不全相等,就能求出一条回归直线,可它有无意义就是一个大问题.由于根据散点图看数据点是否大致在一直线附近主观性太强,为此可以利用样本相关系数量化的检验法. 样本相关系数:r=∑∑∑===----ni ni i ini i iy y x xy y x x11221)()())((叫做变量y 与x 之间的样本相关系数(简称相关系数),用它来衡量它们之间的线性相关程度.|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小.统计学认为,相关变量的相关系数r∈[-1,-0.75]时,两变量负相关很强; r∈[0.75,1]时,两变量正相关很强;r∈(-0.75,-0.3]或[0.3,0.75)时,两变量相关性一般; r∈[-0.25,0.25]时,两变量相关很弱.学法一得 在实际操作中常常利用计算器计算出相关系数和线性回归方程. 典题·热题知识点一 线性相关关系例1 下列两个变量之间的关系哪个不是函数关系( )A.角度和它的余弦值B.正方形边长和面积C.正n 边形的边数和它的内角和D.人的年龄和身高思路分析:函数关系是一种确定的关系,而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系. 答案:D方法归纳 判断相关关系与函数关系要看两个相关变量是否有确定的关系式. 知识点二 求出回归直线例2 一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,请判断y 与x 是否具有线性相关关系,如果y 与x 具有线性相关关系,求线性回归方程. 思路分析:根据求线性回归的方法与步骤.解:在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:x =55,y =91.7,∑=1012i i x =38 500,∑=1012i i y =87 777,∑=101i i i y x =55 950,∴b=2210121015510385007.915510559501010⨯-⨯⨯-=--∑∑==xx yx yx i i i ii≈0.668. a=y -b x =91.7-0.668×55≈54.96,因此,所求线性回归方程为yˆ=bx+a=0.668x+54.96. 巧解提示 先根据散点图判断两个变量是否具有相关关系,然后计算出各项的值代入公式.(1)用统计方法判断尿汞含量x 与消光系数y 是否相关. (2)求出回归直线方程.(3)能预测尿汞含量为5 mg/L 时的消光系数吗?思路分析:据题意需作回归分析,先画出其散点图,看其是否呈直线形.再借助现代技术手段,求出回归直线方程.根据题意,对实际问题进行预测.解:(1)画出其散点图(如图2-4-3),观察散点图,可以发现5个样本点都落在一条直线附近,所以变量x 、y 属于线性相关.图2-4-3(2)由于尿汞含量x 与消光系数y 线性相关,所以可以利用公式求出回归方程的系数.再利用计算器可求得回归方程yˆ=36.95x-11.3. (3)当x=5时,yˆ=36.95×5-11.3≈173.可知尿汞含量为5 mg/L 时的消光系数约为173. 方法归纳 求线性回归方程的步骤: (1)计算平均数x 、y ;(2)计算x i 与y i 的积,求∑x i y i ;(3)计算∑x i 2,∑y i 2;(4)将上述有关结果代入公式,求b 、a ,写出回归直线方程. 问题·探究 思想方法探究问题 用最小二乘法估计得到的直线与用两点式求出的直线方程一致吗?探究过程:事实上设两点(x 1,y 1),(x 2,y 2),设所求回归直线方程是y=bx+a.Q=[y 1-(a+bx 1)]2+[y 2-(a+bx 2)]2,由使Q 取得最小值的a 、b 的求值公式⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====xb y a x n x y x n y x x x y y x x b ni ini i i n i n i i i ,)())((2121121, 得b=22122211212212211211)2()2()2)(2()2)(2(x x x x x x y y y x x x y y y x x x +-++-+-+-++-+-1212212221121221214)(4)(2222x x y y x x x x y y x x y y x x --=-+--∙-+-∙-=a=1221211212212122x x y x x y x x y y x x y y --=--∙+-+ 即回归直线方程为y=1221211212x x y x x y x x y y --+--.而由(x 1,y 1),(x 2,y 2)两点确定的直线方程为121121x x x x y y y y --=--,变形为y=1221211212x x y x x y x x x y y --+--. 探究结论:用最小二乘法估计得到的直线与用两点式求出的直线方程是一致的.。

相关文档
最新文档