2.3变量间的相关关系
2.3.1(2.3.2)变量之间的相关关系和线性关系

2.3 变量间的相关关系2.3.1 变量之间的相关关系2.3.2 两个变量的线性相关整体设计教学分析变量之间的关系是人们感兴趣的问题.教科书通过思考栏目“物理成绩与数学成绩之间的关系”,引导学生考察变量之间的关系.在教师的引导下,可使学生认识到在现实世界中存在不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性.随后,通过探究人体脂肪百分比和年龄之间的关系,引入描述两个变量之间关系的线性回归方程(模型).教科书在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想.通过气温与饮料销售量的例子及随后的思考,使学生了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能犯的错误.进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性.三维目标1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系.2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.3.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.重点难点教学重点:通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;利用散点图直观认识两个变量之间的线性关系;根据给出的线性回归方程的系数公式建立线性回归方程.教学难点:变量之间相关关系的理解;作散点图和理解两个变量的正相关和负相关;理解最小二乘法的思想.课时安排2课时教学过程第1课时导入新课思路1在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?的,物理也好;数学差的,物理也差,但又不全对.)物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法.数学成绩的高低对物理成绩的高低是有一定影响的.但决非唯一因素,还有其他因素,如是否喜欢物理,用在物理学习上的时间等等.(总结:不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少.但这两个变量是有一定关系的,它们之间是一种不确定性的关系.如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义.)为很好地说明上述问题,我们开始学习变量之间的相关关系和两个变量的线性相关.(教师板书课题)思路2某地区的环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低,于是,他就得出一个结论:天鹅能够带来孩子.你认为这样得到的结论可靠吗?如何证明这个结论的可靠性?推进新课新知探究提出问题(1)粮食产量与施肥量有关系吗?“名师出高徒”可以解释为教师的水平越高,学生的水平也越高.教师的水平与学生的水平有什么关系?你能举出更多的描述生活中两个变量的相关关系的成语吗?(2)两个变量间的相关关系是什么?有几种?(3)两个变量间的相关关系的判断.讨论结果:(1)粮食产量与施肥量有关系,一般是在标准范围内,施肥越多,粮食产量越高;教师的水平与学生的水平是相关的,如水滴石穿,三人行必有我师等.我们还可以举出现实生活中存在的许多相关关系的问题.例如:商品销售收入与广告支出经费之间的关系.商品销售收入与广告支出经费有着密切的联系,但商品销售收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关.粮食产量与施肥量之间的关系.在一定范围内,施肥量越大,粮食产量就越高.但是,施肥量并不是决定粮食产量的唯一因素.因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响.人体内的脂肪含量与年龄之间的关系.在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关.应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、学习经验作出相应的判断,因为“经验当中有规律”.但是,不管你的经验多么丰富,如果只凭经验办事,还是很容易出错的.因此,在分析两个变量之间的相关关系时,我们需要一些有说服力的方法.在寻找变量之间相关关系的过程中,统计同样发挥着非常重要的作用.因为上面提到的这种关系,并不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.这就需要通过收集大量的数据(有时通过调查,有时通过实验),在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出判断.(2)相关关系的概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.两个变量之间的关系分两类:①确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;②带有随机性的变量间的相关关系,例如“身高者,体重也重”,我们就说身高与体重这两个变量具有相关关系.相关关系是一种非确定性关系.如商品销售收入与广告支出经费之间的关系.(还与商品质量、居民收入、生活环境等有关)(3)两个变量间的相关关系的判断:①散点图.②根据散点图中变量的对应点的离散程度,可以准确地判断两个变量是否具有相关关系.③正相关、负相关的概念.①教学散点图出示例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:图来进一步分析.②散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,如下图.从散点图我们可以看出,年龄越大,体内脂肪含量越高.图中点的趋势表明两个变量之间确实存在一定的关系,这个图支持了我们从数据表中得出的结论.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)③正相关与负相关的概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)应用示例思路1例1 下列关系中,带有随机性相关关系的是_____________.①正方形的边长与面积之间的关系②水稻产量与施肥量之间的关系③人的身高与年龄之间的关系④降雪量与交通事故的发生率之间的关系解析:两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系,因此填②④.答案:②④例2 有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语.吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?分析:学生思考,然后讨论交流,教师及时评价.解:从已经掌握的知识来看,吸烟会损害身体的健康,但是除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果.我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题.但吸烟引起健康问题的可能性大.因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.点评:在探究研究的过程中,如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么.本题的意义在于引导学生重视对统计结果的解释,从中发现进一步研究的问题.思路2例1 有时候,一些东西吃起来口味越好,对我们的身体越有害.下表给出了不同类型的某种食品的数据.第二列表示此种食品所含热量的百分比,第三列数据表示由一些美食家以百分制给出的对此种食品口味的评价:(2)关于两个变量之间的关系,你能得出什么结论?解:(1)散点图如下:(2)基本成正相关关系,即食品所含热量越高,口味越好.例2 案例分析:一般说来,一个人的身高越高,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系.为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学生的身高与右手一拃长的数据如下表.(1)根据上表中的数据,制成散点图.你能从散点图中发现身高与右手一拃长之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系.(3)如果一个学生的身高是188 cm,你能估计他的一拃大概有多长吗?解:根据上表中的数据,制成的散点图如下.从散点图上可以发现,身高与右手一拃长之间的总体趋势是成一直线,也就是说,它们之间是线性相关的.那么,怎样确定这条直线呢?同学1:选择能反映直线变化的两个点,例如(153,16),(191,23)两点确定一条直线.同学2:在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.同学3:多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.同学4:从左端点开始,取两条直线,如下图.再取这两条直线的“中间位置”作一条直线.同学5:先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧的点数尽可能一样多.同学6:先将所有的点分成两部分,一部分是身高在170 cm以下的,一部分是身高在170 cm 以上的;然后,每部分的点求一个“平均点”——身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即(164,19),(177,21);最后,将这两点连接成一条直线.同学7:先将所有的点按从小到大的顺序进行排列,尽可能地平均分成三等份;每部分的点按照同学3的方法求一个“平均点”,最小的点为(161.3,18.2),中间的点为(170.5,20.1),最大的点为(179.2,21.3).求出这三个点的“平均点”为(170.3,19.9).我再用直尺连接最大点与最小点,然后平行地推,画出过点(170.3,19.9)的直线.同学8:取一条直线,使得在它附近的点比较多.在这里需要强调的是,身高和右手一拃长之间没有函数关系.我们得到的直线方程,只是对其变化趋势的一个近似描述.对一个给定身高的人,人们可以用这个方程来估计这个人的右手一拃长,这是十分有意义的.知能训练一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:关于加工零件的个数与加工时间,你能得出什么结论?答案:(1)散点图如下:(2)加工零件的个数与所花费的时间呈正线性相关关系.拓展提升以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:(2)指出是正相关还是负相关;(3)关于销售价格y和房屋的面积x,你能得出什么结论?解:(1)数据对应的散点图如下图所示:(2)散点图中的点散分布在从左下角到右上角的区域内,所以是正相关.(3)关于销售价格y和房屋的面积x,房屋的面积越大,价格越高,它们呈正线性相关的关系. 课堂小结通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.作业习题2.3A组3、4(1).设计感想本节课学习了变量之间的相关关系和两个变量的线性相关的部分内容,通过身边的具体实例说明了两个变量的相关关系,并学会了利用散点图及其分布来说明两个变量的相关关系的种类,为下一节课作了铺垫,思路1和思路2的例题对知识进行了巩固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育和增强学生的自信心,养成良好的学习态度和学习方法,树立时间观,培养勤奋、刻苦耐劳的精神.备课资料数学家关肇直关肇直(1919.2.13—1982.11.12),中国科学院院士,是中国数学家,生于北京.原籍广东省南海县.父亲关葆麟早年留学德国,回国后任铁道工程师多年,于1932年故世;母亲陆绍馨,是北平女子师范大学的毕业生,曾从教于北京师范大学.关葆麟去世后,母亲以微薄的收入艰难地抚育关肇直及其弟妹多人.全国解放后,关肇直尽心亲侍慈母,直至1967年去世.关肇直于1959年1月与刘翠娥结婚,他们有两个女儿.刘翠娥系中国科学院工程物理研究所研究人员.关肇直于1927年进入北京培华中学附属小学学习.1931年入英国人办的崇德中学学习.学校对英文要求十分严格,加上关肇直自小就由父母习以英文、德文,为日后掌握英文、德文、法文、西班牙文和俄文奠定了良好基础.1936年高中毕业后考入清华大学土木工程系,后于1938年转入燕京大学数学系学习.毕业后在燕京大学(后迁成都)任教.参加成都教授联谊会,担任学生进步组织的导师,积极支持抗日救国学生运动.1946年春从成都返回北平(北京),不久从燕京大学转到北京大学数学系任教.1947年通过考试成为国民政府派遣的中法交换生赴法国留学.名义上去瑞士学哲学,实际上去了巴黎大学庞加莱研究所研究数学,导师是著名数学家、一般拓朴与泛函分析的创始人弗雷歇(M.R.F rechetl),1948年参加革命团体“中国科学工作者协会”,是该会旅法分会的创办人之一.1949年10月,新中国诞生,他毅然决定放弃获得博士学位的机会.于12月回到祖国,满腔热情地参加了新中国的建设.他立即参加了组建中国科学院的工作.他和其他同志一起,协助郭沫若院长筹划建院事宜,确定科学院的方向、任务、体制等,组建科学院图书馆,担任图书管理处处长,编译局处长.1952年参加筹建中国科学院数学研究所的工作,并在数学研究所从事数学研究,历任副研究员、研究员、研究室主任、副所长、学术委员会副主任.他还是中国科学院声学研究所学术委员会委员及原子能研究所学术委员会委员.从1952年起,兼任北京师范大学、北京大学、中国人民大学和中国科技大学等校教授以及华南工学院名誉教授;并兼任过中国科学院成都分院学术顾问、该院数理科学研究室主任、中国科学院武汉数学物理研究所顾问、研究员.他还是国家科委数学学科组副组长、自动化学科组成员;曾担任北京数学会理事长,中国数学会秘书长,国际自动控制联合会理论委员会成员及《中国科学》《科学通报》《数学学报》和《系统科学与数学》等杂志的编委或主编等职.1980年,他与其他科学家一起创建中国科学院系统科学研究所,担任研究所所长.他还担任中国自动化学会副理事长、中国系统工程学会理事长.1980年当选为中国科学院数理学部委员.关肇直长期从事泛函分析、数学物理、现代控制理论等领域的研究,成绩卓著,为我国的社会主义现代化建设作出了重大贡献,1978年获全国科学大会奖,1980年获国防科委、国工办科研奖十几项,1982年获国家自然科学二等奖;关肇直参与主持的项目《尖兵一号返回型卫星和东方红一号》获1985年国家科技进步特等奖,他本人获“科技进步”奖章.关肇直从事泛函分析、数学物理和现代控制理论研究方面,取得水平很高的成果.主要成果有以下几个方面.(一)最速下降法与单调算子思想关肇直于《数学学报》第6卷第4期(1956)发表了学术论文“解非线性函数方程的最速下降法”,第一次把梯度法(又称最速下降法)由有限维空间推广到无限维空间,而且和线性问题相仿,其收敛速度是依照等比级数的.这种方法可以用来解某些非线性积分方程以及某些非线性微分方程边值问题.并在文中首先提出了单调算子的思想,比外国学者早四五年.国外关于单调算子的概念,最早见于1960年扎朗顿尼罗和闵梯(E.H.Z afantonello,G.J.M inty)的工作.单调算子是非线性泛函分析中很基本的概念之一,单调算子理论已成为泛函分析中的一个重要分支,在处理力学、物理学中的许多非线性问题中被广泛地应用.(二)激光问题的数学理论在数学物理方面,关肇直也进行了深入的研究.他在《中国科学》第14卷第7期(1956)上用法文发表了学术论文“关于…激光理论‟中积分方程的非零本征值的存在性”在论文中他利用泛函分析工具,在很弱的假设下,用极为简短的方式证明了激光理论中一般形式的具有非对称核的线性积分方程非零本征值的存在.这一结果受到国际上的重视.被国外书刊广泛引用,如M agraw H ill图书公司1972年出版的柯克朗(J.A.C ochran)著的《线性积分方程分析》一书就曾详细地引用过.(三)中子迁移理论关肇直在数学物理方面的另一个创造,就是关于中子迁移理论的研究.1963年他用希尔伯特空间与不定规度空间的算子谱理论解决了平板几何情形的中子迁移的本征函数问题,著有“关于一类本征值问题”(当时未发表).这比国外罕日布鲁克(H angelbrook)1973年的同类工作早10年.卡帕(H.G.K aper)和兹维贝尔(P.F.Z weibel)在1975年举行的国际迁移理论第四次会议上的报告(载于期刊《T ranspost T heory and S tatistical P hysiss》V ol.4,N o.3,第105—123页,1975)中,在“迁移理论中有什么创新”标题下,把罕日布鲁克的方法称为求解方程的新方法;但是,罕氏著作中所解决的问题,在关肇直的文章中是早已解决了的.关肇直于1963年完成的这篇论文直到他去世后于1984年发表在《数学物理学报》上,国外同行当得知他在60年代就作出了如此高水平的工作时都深表惊异.(四)飞行器弹性控制理论关肇直在《中国科学》1974年第4期上发表了“弹性振动的镇定问题”,首先提出了用线性算子紧扰动理论解决飞行器弹性振动的镇定问题.在这之前,美国的著名控制论专家鲁塞尔(D.L.R ussell)曾用别的方法讨论过此类问题,但他自己认为他所得的结果“当然并非完全满意”,“增益系数的增大应能改进系统的稳定性,但这样整体性结果没有得到……”他甚至认为:显然他所用的方法“带来必须小的缺陷,……,但很怀疑这里定理所表述的结果的确切化用任何别的技术来实现.”可是,与鲁塞尔的怀疑相反,关肇直用了算子紧扰动方法技巧,此方法与鲁塞方法有本质的区别,它确实摆脱了放大系数很小的限制,得出了工程意义更合理的结果.这项成果已经应用到我国的国防尖端技术设计上,成为导弹运载火箭所必不可少的一个设计理论.(五)几本主要著作1.《泛函分析讲义》1958年高等教育出版社出版了关肇直的《泛函分析讲义》.该书吸取了当时国际上几部有名的介绍泛函分析概要的书的长处,内容适中,很具特色,便于自学.这是国内第一部包括当时泛函分析各分支的较全面的专著,国内当时这类书很少;国内除此之外,迄今也仍只有一些教科书性质的出版物,还没有别的书代替它.关肇直曾使用这部著作在1956年和1957年分别为中国科学院数学研究所一批青年同志和北京大学第一届泛函分析专门化学生讲授过《泛函分析》课程,培养了一批从事泛函分析等方面的中青年骨干教师和科研人员.此书至今仍有重大参考价值.2.《拓扑空间榻论》科学出版社于1958年出版了关肇直教授的这本书.本书是为了数学分析方面的青年数学工作者的需要而写的.目的是使读者获得关于拓扑空间理论的基础知识.本书在当时是这方面较系统的也是较早的一部专著.作者是按照自己的观点来写的,书中许多定理的证明都是作者给出的,他尽可能地遵循一般实变函数论中的叙述问题的方式,因而有自己的特色.这是为了使读者感到新知识与原有知识有联系,对新的抽象概念不至感到突然,同时又帮助读者直达科学研究的前沿.根据研究概率论方面的读者反映,对他们研究极限定理一类工作颇有帮助.3.《高等数学教程》人民教育出版社于1959年出版.本书是关肇直在中国科技大学开办应用数学专业讲授高等数学课程而编写的教材,特点是:材料比较丰富,注意理论联系实际.4.《线性泛函分析入门》上海科技出版社于1979年出版.关肇直同他的学生张恭庆、冯德兴合著.著书的目的是为了满足多方面科学研究工作者的需要,因为当时线性泛函分析已成为许多从事科学技术研究的人所渴望了解和应用的一门数学学科.此书的特点是:尽可能从一些问题提炼出泛函分析中的基本概念,让读者透过叙述方法了解到研究的过程.5.《现代控制系统理论小丛书》这是由关肇直主编的,包括线性系统理论、非线性系统理论、极值控制理论、系统辨识、最优控制与随机控制理论、分布参数系统理论及其他有关内容,共分十几分册,由科学出版社从1975年开始陆续出版.这套丛书介绍了现代控制系统理论的各个部分,并着重说明这种理论怎样由工程实践的需要而产生,又怎样用来解决工程设计中的实际问题.此丛书主要是为从事控制理论研究的科学工作者和工程技术人员而撰写的.此丛书的出版,对于促进我国的控制理论和控制技术的发展起到了很好的作用.。
高中高中数学第二章统计2.3.1变量之间的相关关系2.3.2两个变量的线性相关课件新人教A版必修3

解:(1)画出散点图.
(2)判断变量x,y是否具有相关关系?如果具有相关关系,那么是正相关还是 负相关?
解:(2)具有相关关系.根据散点图,左下角到右上角的区域,变量x的值由小 变大时,另一个变量y的值也由小变大,所以它们具有正相关关系.
方法技巧 两个随机变量x和y是否具有相关关系的确定方法: (1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断 (如本题); (2)表格、关系式法:结合表格或关系式进行判断; (3)经验法:借助积累的经验进行分析判断.
4
4
解:(2)由表中的数据得: xi yi =52.5, x =3.5, y =3.5, xi2 =54,
i 1
i 1
n
所以 b =
xi yi n x y
i 1
n
xi2
2Hale Waihona Puke nx=52.5 4 3.5 3.5 54 4 3.52
=0.7,
i 1
a = y - b x =3.5-0.7×3.5=1.05,
年份x
储蓄存款 y(千亿元)
2013 5
2014 6
2015 7
2016 8
2017 10
为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2 012,z=y-5 得到表2:
时间代号t
1
2
3
4
5
z
0
1
2
3
5
(1)求z关于t的线性回归方程;
5
5
解:(1) t =3, z =2.2, ti zi=45, ti2 =55,
知识探究
1.相关关系与函数关系不同 函数关系中的两个变量间是一种确定性关系,相关关系是一种不确定性关系. 2.正相关和负相关 (1)正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关 关系,我们就称它为正相关. (2)负相关 在散点图中,点散布在从左上角到右下角的区域,对于两个变量的这种相关 关系,我们就称它为负相关.
高中数学必修3第二章:统计2.3变量间的相关关系

Y 研考点·知规律
探究悟道 点拨技法
题型一 相关关系的判断 【例 1】 河北国欣农研会的科研人员在 7 块并排、形状大小 相同的试验田上对某棉花新品种进行施化肥量 x 对产量 y 影响的 试验,得到如下表所示的一组数据(单位:kg): 施化肥量 x 15 20 25 30 35 40 45 棉花产量 y 330 345 365 405 445 450 455
D 读教材·抓基础
回扣教材 扫除盲点
课本导读
1.两个变量的线性相关 (1)在散点图中,点散布在从 左下角 到 右上角的区域,对于 两个变量的这种相关关系,我们将它称为正相关. (2)在散点图中,点散布在从 左上角 到 右下角的区域,两个 变量的这种相关关系称为负相关. (3)如果散点图中点的分布在整体上看大致在一条直线附近 , 就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
() (A)她儿子10岁时的身高一定是145.83 cm (B)她儿子10岁时的身高在145.83 cm以上 (C)她儿子10岁时的身高在145.83 cm左右 (D)她儿子10岁时的身高在145.83 cm以下
2.经调查知,某品牌汽车的销售量y(辆)与广告费用x(万元)之 间的回归直线方程为 yˆ =250+4x,当广告费用为50万元时,预计 汽车销售量约为 ______辆.
2.回归方程 (1)最小二乘法:使得样本数据的点到回归直线的 距离的平方
和最小的方法叫最小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,
^^ ^
y1)、(x2,y2),…,(xn,yn).其回归方程为y=bx+a,则
n
n
xi- x yi- y xiyi-n x y
2017学年数学必修三:2.3.1-变量之间的相关关系~2.3.2 两个变量的线性相关2

(2)问题2中,从表里数据能得出小麦的产量y与施肥量x之间的 函数关系式吗? 提示:从表格里我们很容易发现施肥量越大 ,小麦的产量就越高. 但是,施肥量并不是影响小麦产量的唯一因素 ,小麦的产量还受 土壤的质量、降雨量、田间管理等诸多因素影响 ,这时两个变
量之间就不是确定性的函数关系,因此不能得到y和x的函数关
1.两个变量的线性相关 左下角 到_______. 右上角 (1)正相关:点散布的方向:从_______ 左上角 到_______. 右下角 (2)负相关:点散布的方向:从_______ (3)回归直线:如果散点图中点的分布从整体上看在一条直线附
线性相关 关系,这条直线叫做 近,就称这两个变量之间具有_________
【解析】(1)作出散点图如图所示,
(2)由散点图可知,各点并不在一条直线附近,所以两个变量是
非线性相关关系.
类型二
求回归方程
1.(2013·锦州高一检测)已知一组观测值具有线性相关关系,
bx a ,求得 b =0.51, x =61.75, y =38.14, 则回归方 若对于 y
【探究总结】
1.散点图的作用
(1)判断两个变量之间有无相关关系,一种常用的简便可行的方
法是绘制散点图.
(2)根据散点图很容易看出两个变量之间是否具有相关关系,是
不是线性相关关系,是正相关还是负相关,相关关系强还是弱.
2.利用散点图判断变量间的关系的方法 (1)如果所有的样本点都落在某一函数的曲线上,就用该函数来 描述变量间的关系,即变量具有函数关系. (2)如果所有的样本点都落在某一函数曲线附近,变量之间就有 相关关系. (3)如果所有的样本点都落在某一条直线附近,变量之间就有线 性相关关系.
2.3两个变量间的相互关系

回归直线方程 yˆ bˆx aˆ
n
n
(xi x)( yi y)
xi yi nx y
大数 bˆ i1 n
aˆ
y
( xi
i 1
bˆx.
x)2
i1 n
xi2
2
nx
.
i 1
小数
回归直线过样本点中心(: x,y)
小结:求线性回归直线方程的步骤:
当x 100时,y 100 0.7 0.35 70.35(吨) 预 测 生 产100吨 甲 产 品 的 生 产 能 耗 比技改前降低90 - 70.35 19.65吨
(3)相关关系的分析方向。 由于变量之间相关关系的广泛性和不确定性, 所以不能单靠经验,而应该在收集大量数据的 基. 础上,利用统计分析,发现规律,对它们的 关系作出正确判断。 探究:如下的一组数据,你能分析人体的脂肪含量
与年龄之间有怎样的关系吗? 年龄 23 27 39 41 45 49 50
脂肪 9.5 17.8 21.2 25.9 27.5 26.3 28.2
回归直线一特点:经过样本点的中心(x,y)。
实际上,求回归直线的关键是如何用数学的方法 来刻画“从整体上看,各点到此直线的距离最小”.
3.回归直线方程 n
通采过用n求个Q偏差的n 平( y方i 和b:xiQa)i2最1 ( y小i 值bx而i 得a)出2 回
归表直 示n线个的点方与i法 1相应叫直做线最在小二整乘体法上. 的接近程度
判断.
35
30
25
20
15
10
5
年龄
O
20 25 30 35 40 45 50 55 60 65
2014年人教A版必修三课件 2.3 变量间的相关关系

两个变量相互间有一定影响, 我们就说这两个变 量之间存在着一定的相关关系. 两个变量之间, 除了像函数这样有确定的关系外, 在现实生活中, 存在着许多不确定的相关关系的问题. 如: (1) 商品销售收入与广告支出经费之间的关系.
(2) 粮食产量与施肥量的关系.
(3) 开发一项产品的投入与产出的关系. (4) 个人的教育投资与收入的关系.
练习: (课本85页) 1. 有关法律规定, 香烟盒上必须印上 “吸烟有 害健康” 的警示语. 吸烟是否一定会引起健康问题? 你认为 “健康问题不一定是由吸烟引起的, 所以可以 吸烟” 的说法对吗? 答: 经医学研究, 吸烟对身体有害. 但吸烟不一定会引起健康问题. 因为人的身体健康有很多不确定因素, 所以有些 人吸烟不一定会引起健康问题. 如注射青霉素药物前 要做皮试, 以防药物过敏, 但不是都会产生过敏. 虽然健康问题不一定是由吸烟引起的, 但吸烟与 健康存在相关关系, 虽然有不确定因素, 但有可能引 起健康问题, 所以 “可以吸烟” 的说法是不对的.
年龄 53 54 56 57 58 60 61 脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
年龄 脂肪
23 9.5
27 39 41 45 49 50 17.8 21.2 25.9 27.5 26.3 28.2
年龄 53 54 56 57 58 60 61 脂肪 29.6 30.2 31.4 30.8 33.5 35.2 34.6
【本章内容】
2.1 随机抽样 2.2 用样本估计总体 2.3 变量间的相关关系
第二章 小结
2.3 变量间的相关关系
2.3.1 变量之间的相关关系 (2.3.2)两个变量的线性相关
2.3.2 两个变量的线性相关
2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关

2.3变量间的相关关系2.3.1变量之间的相关关系2.3.2两个变量的线性相关1.理解两个变量的相关关系的概念.(难点)2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系.(重点) 3.会求回归直线方程.(重点)4.相关关系与函数关系.(易混点)[基础·初探]教材整理1变量之间的相关关系阅读教材P84~P86的内容,完成下列问题.1.相关关系:不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.2.散点图:将样本中几个数据点(x i,y i)(i=1,2,…,n)描在平面直角坐标系中得到的图形.3.正相关与负相关:散点图中的点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,称它为正相关.若散点图中的点分布在从左上角到右下角的区域内,对于两个变量的这种相关关系,称它为负相关.4.相关关系与函数关系的辨析相关关系与函数关系均是指两个变量间的关系,它们的不同点如下: (1)函数关系是一种确定的关系;相关关系是一种非确定的关系,即不能用一个函数关系式来严格地表示变量之间的关系.(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,脚的大小与阅读能力有很强的相关关系,然而学会更多的新词并不能使脚变大,而是涉及第三个因素——年龄,当儿童长大一些以后,他们的阅读能力会提高,而且脚也会变大.如图2-3-1所示的两个变量不具有相关关系的有________.图2-3-1【解析】 ①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x ,y 不具有相关关系.【答案】 ①④教材整理2 回归直线方程阅读教材P 87~P 89的内容,完成下列问题.1.回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程. 3.最小二乘法:求回归直线时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.4.求回归方程:若两个具有线性相关关系的变量的一组数据为:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则所求的回归方程为y ^=b ^x +a ^,其中a ^,b ^为待定的参数,由最小二乘法得:⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2=∑i =1nx i y i-n x -y -∑i =1nx 2i-n x -2,a ^=y -b^x .b ^是回归直线斜率,a ^是回归直线在y 轴上的截距.1.判断(正确的打“√”,错误的打“×”)(1)回归方程中,由x 的值得出的y 值是准确值.( ) (2)回归方程一定过样本点的中心.( ) (3)回归方程一定过样本中的某一个点.( )(4)选取一组数据中的部分点得到的回归方程与由整组数据得到的回归方程是同一个方程.( )【答案】 (1)× (2)√ (3)× (4) ×2.过(3,10),(7,20),(11,24)三点的回归直线方程是( ) A.y ^=1.75+5.75x B.y ^=-1.75+5.75x C.y ^=5.75+1.75xD.y ^=5.75-1.75x【解析】 求过三点的回归直线方程,目的在于训练求解回归系数的方法,这样既可以训练计算,又可以体会解题思路,关键是能套用公式.代入系数公式得b ^=1.75,a ^=5.75.代入直线方程,求得y ^=5.75+1.75x .故选C.【答案】 C3.已知x 与y 之间的一组数据:则y 与x 的线性回归方程y =bx +a 必过点( ) A .(1,2) B .(5,2) C .(2,5)D .(2.5,5)【解析】线性回归方程一定过样本中心(x,y).由x=0+1+2+3+45=2,y=1+3+5+7+95=5.故必过点(2,5).【答案】 C[小组合作型](1))A.正方体的棱长和体积B.圆半径和圆的面积C.正n边形的边数和内角度数之和D.人的年龄和身高(2)对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图②.由这两个散点图可以判断()图2-3-2A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关【精彩点拨】结合相关关系,函数关系的定义及正负相关的定义分别对四个选项作出判断.【尝试解答】(1)A、B、C都是函数关系,对于A,V=a3;对于B,S=πr2;对于C,g(n)=(n-2)π.而对于D,年龄确定的不同的人可以有不同的身高,∴选D.(2)由图象知,变量x与y呈负相关关系;u与v呈正相关关系.【答案】(1)D(2)C判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.[再练一题]1.某公司2011~2016年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如下表所示:A.B.利润中位数是18,x与y有负线性相关关系C.利润中位数是17,x与y有正线性相关关系D.利润中位数是17,x与y有负线性相关关系【解析】由表知,利润中位数是12(16+18)=17,且y随x的增大而增大,故选C.【答案】 C一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:(2)如果y 与x 具有线性相关关系,求y 关于x 的回归直线方程. 【精彩点拨】 画散点图→确定相关关系→求回归直线系数 →写回归直线方程【尝试解答】 (1)画散点图如下:由上图可知y 与x 具有线性相关关系. (2)列表、计算:b ^=∑i =110x i y i -10x y ∑i =110x 2i -10x 2=55 950-10×55×91.738 500-10×552≈0.668,a ^=y -b ^x =91.7-0.668×55=54.96. 即所求的回归直线方程为:y ^=0.668x +54.96.用公式求回归方程的一般步骤:(1)列表x i ,y i ,x i y i ;(2)计算x ,y,∑i =1nx 2i ,∑i =1n x i y i ;(3)代入公式计算a ^,a ^的值;(4)写出回归方程.[再练一题]2.已知变量x ,y 有如下对应数据:(1)(2)用最小二乘法求关于x ,y 的回归直线方程. 【解】 (1)散点图如图所示:(2)x =1+2+3+44=52,y =1+3+4+54=134, ∑i =14x i y i =1+6+12+20=39,∑i =14x 2i =1+4+9+16=30,b ^=39-4×52×13430-4×⎝ ⎛⎭⎪⎫522=1310,a ^=134-1310×52=0,所以y ^=1310x 为所求回归直线方程.x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:(2)请根据上表提供的数据,用最小二乘法求出回归方程y ^=b ^x +a ^; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?【精彩点拨】 (1)以产量为横坐标,以生产能耗对应的测量值为纵坐标,在平面直角坐标系内画散点图;(2)应用计算公式求得线性相关系数b ^,a ^的值;(3)实际上就是求当x =100时,对应的v 的值.【尝试解答】 (1)散点图,如图所示:(2)由题意,得∑i =14x i y i =3×2.5+4×3+5×4+6×4.5=66.5,x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5,∑i =14x 2i =32+42+52+62=86,∴b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35, 故线性回归方程为y ^=0.7x +0.35.(3)根据回归方程的预测,现在生产100吨产品消耗的标准煤为0.7×100+0.35=70.35(吨),故耗能减少了90-70.35=19.65(吨)标准煤.回归分析的三个步骤:(1)判断两个变量是否线性相关:可以利用经验,也可以画散点图;(2)求线性回归方程,注意运算的正确性;(3)根据回归直线进行预测估计:估计值不是实际值,两者会有一定的误差.[再练一题]3.某种产品的广告费支出y (百万元)与销售额x (百万元)之间的关系如下表所示.(1)假定y (2)若广告费支出不少于60百万元,则实际销售额应不少于多少?【解】 (1)设回归直线方程为y ^=b ^x +a ^,则b ^=(8×5+12×8+14×9+16×11)-4×8+12+14+164×5+8+9+114(82+122+142+162)-4×⎝⎛⎭⎪⎫8+12+14+1642=438-412.5660-625=25.535=5170,a ^=y -b ^x =5+8+9+114-5170×8+12+14+164=334-5170×252=-67,则所求回归直线方程为y ^=5170x -67.(2)由y ^=5170x -67≥60,得x ≥4 26051≈84,所以实际销售额不少于84百万元.[探究共研型]探究1 变量之间的关系?【提示】 任意两个统计数据均可以作出散点图,对于作出的散点图,如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.特别地,若所有的样本点都落在某一直线附近,变量之间就具有线性相关关系;如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系;如果散点图中的点的分布几乎没有什么规则,则这两个变量之间不具有相关关系.探究2 【提示】 (1)建立直角坐标系,两轴的长度单位可以不一致. (2)将n 个数据点描在平面直角坐标系中.(3)画回归直线时,一定要画在多数点经过的区域,可以先观察有哪两个点在直线上.探究3 回归系数b ^的含义是什么?【提示】 (1)b ^代表x 每增加一个单位,y 的平均增加单位数,而不是增加单位数.(2)当b ^>0时,两个变量呈正相关关系,含义为:x 每增加一个单位,y 平均增加b ^个单位数;当b ^<0时,两个变量呈负相关关系,含义为:x 每增加一个单位,y 平均减少b ^个单位数.探究4 回归直线方程与直线方程的区别是什么?【提示】 线性回归直线方程中y 的上方加记号“^ ”是与实际值y 相区别,因为线性回归方程中的“y ^”的值是通过统计大量数据所得到的一个预测值,它具有随机性,因而对于每一个具体的实际值而言,y ^的值只是比较接近,但存在一定的误差,即y =y ^+e (其中e 为随机变量),预测值y ^与实际值y 的接近程度由随机变量e 的标准差决定.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y =b x +a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′【精彩点拨】 先由已知条件分别求出b ′,a ′的值,再由b ^,a ^的计算公式分别求解b ^,a ^的值,即可作出比较.【尝试解答】 根据所给数据求出直线方程y =b ′x +a ′和回归直线方程的系数,并比较大小.由(1,0),(2,2)求b ′,a ′. b ′=2-02-1=2, a ′=0-2×1=-2. 求b ^,a ^时,i =16x i y i =0+4+3+12+15+24=58,x =3.5,y =136,i =16x 2i =1+4+9+16+25+36=91,∴b ^=58-6×3.5×13691-6×3.52=57,a ^=136-57×3.5=136-52=-13, ∴b ^<b ′,a ^>a ′. 【答案】 C [再练一题]4.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系.根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 【解析】 b ^为正数,所以两变量具有正的线性相关关系,故A 正确;B ,C 显然正确;若该大学某女生身高为170 cm ,则可估计其体重为58.79 kg.【答案】D1.设一个回归方程y ^=3+1.2x ,则变量x 增加一个单位时( ) A .y 平均增加1.2个单位 B .y 平均增加3个单位 C .y 平均减少1.2个单位 D .y 平均减少3个单位【解析】 由b =1.2>0,故选A. 【答案】 A2.下列有关线性回归的说法,不正确的是( )A .变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C .回归方程最能代表观测值x 、y 之间的线性关系D .任何一组观测值都能得到具有代表意义的回归直线【解析】 只有数据点整体上分布在一条直线附近时,才能得到具有代表意义的回归直线.【答案】 D3.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5D.y ^=-0.3x +4.4【解析】 因为变量x 和y 正相关,则回归直线的斜率为正,故可以排除选项C 和D.因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A 和B 中的直线方程进行检验,可以排除B ,故选A.【答案】 A4.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.【解析】 由题意可知x =2+4+5+6+85=5,y =30+40+60+50+705=50.即样本中心为(5,50),设回归直线方程为y ^=6.5x +b ^, ∵回归直线过样本中心(5,50), ∴50=6.5×5+b ^,即b ^=17.5,∴回归直线方程为y ^=6.5x +17.5. 【答案】 y ^=6.5x +17.5学业分层测评(十四) 变量间的相关关系(建议用时:45分钟)[学业达标]一、选择题 1.有几组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程; ②平均日学习时间和平均学习成绩; ③立方体的棱长和体积. 其中两个变量成正相关的是( ) A .①③ B .②③ C .②D .③【解析】 ①是负相关;②是正相关;③是函数关系,不是相关关系. 【答案】 C2.对于给定的两个变量的统计数据,下列说法正确的是( ) A .都可以分析出两个变量的关系B .都可以用一条直线近似地表示两者的关系C .都可以作出散点图D .都可以用确定的表达式表示两者的关系【解析】 由两个变量的数据统计,不能分析出两个变量的关系,A 错;不具有线性相关的两个变量不能用一条直线近似地表示他们的关系,更不能用确定的表达式表示他们的关系,B ,D 错.【答案】 C3.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b^( ) A .不能小于0 B .不能大于0 C .不能等于0D .只能小于0【解析】当b^=0时,r=0,这时不具有线性相关关系,但b^能大于0,也能小于0.【答案】 C4.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且y^=2.347x-6.423;②y与x负相关且y^=-3.476x+5.648;③y与x正相关且y^=5.437x+8.493;④y与x正相关且y^=-4.326x-4.578.其中一定不正确...的结论的序号是()A.①②B.②③C.③④D.①④【解析】由正负相关性的定义知①④一定不正确.【答案】 D5.某产品的广告费用x与销售额y的统计数据如下表:根据上表可得回归方程y=b x+a中的b为9.4,据此模型预报广告费用为6万元时,销售额为()A.63.6万元B.65.5万元C.67.7万元D.72.0万元【解析】x=14(4+2+3+5)=3.5,y=14(49+26+39+54)=42,所以a^=y-b^x=42-9.4×3.5=9.1,所以回归方程为y^=9.4x+9.1,令x=6,得y^=9.4×6+9.1=65.5(万元).故选B.【答案】 B二、填空题6.若施化肥量x(千克/亩)与水稻产量y(千克/亩)的回归方程为y^=5x+250,当施化肥量为80千克/亩时,预计水稻产量为亩产________千克左右.【解析】当x=80时,y^=400+250=650.【答案】6507.已知一个回归直线方程为y^=1.5x+45,x∈{1,7,5,13,19},则y=________.【解析】因为x=15(1+7+5+13+19)=9,且回归直线过样本中心点(x,y),所以y=1.5×9+45=58.5.【答案】58.58.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y 对x的回归直线方程:y^=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】由于y^=0.254x+0.321知,当x增加1万元时,年饮食支出y增加0.254万元.【答案】0.254三、解答题9.某工厂对某产品的产量与成本的资料分析后有如下数据:(1)(2)求成本y与产量x之间的线性回归方程.(结果保留两位小数)【解】(1)散点图如图所示.(2)设y与产量x的线性回归方程为y^=b^x+a^,x =2+3+5+64=4,y =7+8+9+124=9, b^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2=(x 1y 1+x 2y 2+x 3y 3+x 4y 4)-4x yx 21+x 22+x 23+x 24-4x2=1110=1.10,a ^=y -b ^x -=9-1.10×4=4.60. ∴回归方程为:y ^=1.10x +4.60.[能力提升]1.根据如下样本数据:得到的回归方程为y =bx +a ,则( ) A .a >0,b >0 B .a >0,b <0 C .a <0,b >0D .a <0,b <0【解析】 作出散点图如下:观察图象可知,回归直线y ^=bx +a 的斜率b <0,当x =0时,y ^=a >0.故a >0,b <0.【答案】 B2.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y 对总成绩x 的回归直线方程为y ^=6+0.4x .由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差________分.【解析】 令两人的总成绩分别为x 1,x 2. 则对应的数学成绩估计为 y ^1=6+0.4x 1,y ^2=6+0.4x 2,所以|y ^1-y ^2|=|0.4(x 1-x 2)|=0.4×50=20. 【答案】 203.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =1100x2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y =bx +a ; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y =bx +a 中,b =∑i =1nx i y i -n x y ∑i =1nx 2i -n x 2,a =y -b x ,其中x ,y 为样本平均值,线性回归方程也可写为y ^=b^x +a ^.【解】 (1)由题意知n =10,x =1n ∑i =1n x i =8010=8,y =1n ∑i =1n y i =2010=2,又l xx =∑i =1nx 2i -n x 2=720-10×82=80,l xy =∑i =1nx i y i -n x y =184-10×8×2=24,由此得b=l xyl xx=2480=0.3,a=y-b x=2-0.3×8=-0.4.故所求线性回归方程为y=0.3x-0.4.(2)由于变量y的值随x值的增加而增加(b=0.3>0),故x与y之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.3×7-0.4=1.7(千元).。
2.3变量之间的相关关系

前面我们学习了怎样对收集来的数据进行分析: 前面我们学习了怎样对收集来的数据进行分析 集中趋势 频率分布图 离散程度 下面我们来介绍一中更为常见的分析方法: 下面我们来介绍一中更为常见的分析方法
小明,你数学成绩不太好 小明 你数学成绩不太好, 你数学成绩不太好 学不好数学,物理 学不好数学 物理 物理怎么样? 物理怎么样 也是学不好的
注:相关关系和函数关系的异同点 相同点: 相同点:两者均是指两个变量间的关系 不同点:函数关系是一种确定关系, 不同点:函数关系是一种确定关系, 相关关系是一种非确定的关系。 相关关系是一种非确定的关系。
练习: 练习: 1:下列两变量中具有相关关系的是( D ) :下列两变量中具有相关关系的是( A角度和它的余弦值 角度和它的余弦值 C成人的身高和视力 成人的身高和视力 B正方形的边长和面积 正方形的边长和面积 D 身高和体重
四、如何具体的求出这个回归方程呢? 如何具体的求出这个回归方程呢? 方案一:采用测量的方法:先画一条直线, 方案一:采用测量的方法:先画一条直线,测 量出各点到它的距离,然后移动直线, 量出各点到它的距离,然后移动直线,到达一 个使距离之和最小的位置, 个使距离之和最小的位置,测量出此时直线的 斜率和截距,就得到回归方程。 斜率和截距,就得到回归方程。
脂肪含量
40 35 30 25 20 15 10 5 0 20 25 30 35 40 45 50 55 60 65 年龄
思考3 上图叫做散点图, 思考3:上图叫做散点图,你能描述一下散 散点图 点图的含义吗? 点图的含义吗? 在平面直角坐标系中, 在平面直角坐标系中,表示具有相关关系 的两个变量的一组数据图形,称为散点图. 的两个变量的一组数据图形,称为散点图.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
-4ac也就唯一确定了,因此,这两者之间是确定性的函数 关系;一般来说,光照时间越长,果树亩产量越高;降雪量 越大,交通事故发生率越高;施肥量越多,粮食亩产量越 高.所以B、C、D是相关关系.故选A.
跟踪练习 1 如下图所示, 表示两个变量不具有相关关系 的有________.
[答案] ①④
[解析]
A.y 平均增加 1.2 个单位 B.y 平均增加 3 个单位 C.y 平均减少 1.2 个单位 D.y 平均减少 3 个单位
[答案] A
4.线性回归方程^ y=bx+a,过定点________.
[答案] (- x ,- y)
5.下表提供了某厂节能降耗技术改造生产甲产品过程中 记录的产量 x(吨) 与相应的生产能耗 y( 吨标准煤) 的几组对照 数据 x y 3 2.5 4 3 5 4 6 4.5
来计算回
归系数.有时为了方便常列表,对应列出xiyi、x 2 i ,以利于求 和.(2)获得线性回归方程后,取x=10,即得所求.
[解析] i
(1)列表: 1 2 2.2 4.4 4 2 3 3.8 11.4 9 3 4 5.5 22.0 16 4 5 6.5 32.5 25 5 6 7.0 42.0 36
2 2.2
3 3.8
4 5.5
5 6.5
6 7.0
若由资料,知y对x呈线性相关关系.试求: ^x+a ^的回归系数a ^、b ^; (1)线性回归方程^ y=b (2)估计使用年限为10年时,车的使用总费用是多少?
[分析]
第一步,列表xi,yi,xiyi;
n n 2 2 第二步,计算- x ,- y , xi , yi , xiyi; i=1 i=1 i=1
马蹄铁上一个钉子是否丢失与一个帝国存与亡关系有多 大呢?显然,这种关系不能用我们熟悉的函数关系来描述, 那么这究竟是一种什么样的关系?本节,我们共同研究.
请同学们认真阅读学习目标及重点难点,时间30秒
一、学习目标
请同学们认真阅读学习目标及重点难点,时间30秒
1.知道两个变量的相关关系的概念;
A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关
[答案] C
[解析]
图(1)中的数据y随着x的增大而减小,因此变量x
与变量y负相关;图(2)中的数据随着u的增大,v也增大,因 此u与v正相关.
请同学们认真独立完成例 3 及变式,然后讨论派代表回答, 时间 12 分钟
例3
随着人们经济收入的不断增长,个人购买家庭轿
车已不再是一种时尚.车的使用费用,尤其是随着使用年限 的增多,所支出的费用到底会增长多少,一直是购车一族非 常关心的问题.某汽车销售公司作了一次抽样调查,并统计 得出某款车的使用年限 x 与所支出的总费用 y(万元)有如下的 数据资料:
使用年限x 总费用y
规律总结:求回归直线方程应给出线性回归系数公 式,在求解时为了使计算更准确可以先制表,这样使计算过 程更具条理性.
跟踪练习 3 某公司的广告费支出 x 与销售额 y(单位:万元) 之间有下列对应数据:由资料显示 y 对 x 呈线性相关关系. x y 2 30 4 40 5 60 6 50 8 70
高一· 数学
人教A版 ·必修3
路漫漫其修远兮 吾将上下而求索
第二章
统 计
第二章
2.3 变量间的相关关系
第二章
2.3.1 2.3.2 变量之间的相关关系 两个变量的线性相关
课前自主预习
随堂应用练习
思路方法技巧
课后强化作业 方法警示探究
课前自主预习
新课引入
西方流传的一首民谣: 丢失一个钉子,坏了一只蹄铁; 坏了一只蹄铁,折了一匹战马; 折了一匹战马,伤了一位骑士; 伤了一位骑士,输了一场战斗; 输了一场战斗,亡了一个帝国.
78 87 98 108 115 120
画出散点图,并判断它们是否有相关关系.
[解析]
(1)不具有相关关系,因为散点图散乱地分布在
坐标平面内,不呈线形. (2)散点图是分析变量相关关系的重要工具.作出散点图 如图:
由图可见,具有线性相关关系.
跟踪练习 2 对变量 x,y 有观测数据(xi,yi)(i=1,2,„,10), 得散点图(1);对变量 u, v 有观测数据(ui,vi)(i=1,2,„,10), 得散点图(2).由这两个散点图可以判断( )
例 1 下列变量之间的关系不是相关关系的是(
)
A.二次函数 y=ax2+bx+c 中,a,c 是已知常数,取 b 为自变量,因变量是判别式 Δ=b2-4ac B.光照时间和果树亩产量 C.降雪量和交通事故发生率 D.每亩田施肥量和粮食亩产量
[答案] A
[解析]
在A中,若b确定,则a,b,c都是常数, Δ=b2
2.会作散点图,并利用散点图判断两个变量是否具有相关关
系; 3.会求回归直线方程。 二、重点与难点
重点:根据给出的线性回归方程的系数公式建立回归方程。 难点:建立回归思想,知道回归直线与观测数据的关系。
三、自主预习 请同学们认真阅读教材,填写要点,时间 8 分钟 1.相关关系 (1)定义:如果两个变量中一个变量的取值一定时,另一 个变量的取值带有一定的 随机性,那么这两个变量之间的关 系,叫做相关关系.
规律总结:函数关系是一种确定性关系,相关关系是 一种非确定性关系,判断两个变量间的关系是否为相关关系 的关键是看这个关系是否具有不确定性.
2.线性相关 (1)定义:如果两个变量散点图中点的分布从整体上看大 致在一条 直线 附近,我们就称这两个变量之间具有线性相 关关系,这条直线叫做 回归直线. ^ x+ a ^ 时,使得 (2)最小二乘法:求线性回归直线方程 ^ y=b 样本数据的点到它的 距离的平方和 最小的方法叫做最小二 乘法,其中a,b的值由以下公式给出:
①是确定的函数关系;②中的点大都分布在一
条曲线周围;③中的点大都分布在一条直线周围;④中点的 分布没有任何规律可言,x,y不具有相关关系.
请同学们认真独立完成例 2 及变式,然后讨论派代表回答, 时间 8 分钟
[例 2] (1)如图是两个变量统计数据的散点图,判断两 个变量之间是否具有相关关系?
(2)有个男孩的年龄与身高的统计数据如下. 年龄(岁) 身高(cm) 1 2 3 4 5 6
(1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出 y 关于 x ^; 的回归方程^ y=^ bx+a
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准 煤.试根据(2)求出的回归方程,预测生产100吨甲产品的生 产能耗比技改前降低多少吨标准煤?
[解析]
(1)散点图如下:
(2)两类特殊的相关关系:如果散点图中点的分布是从
左下 角到 右上 角的区域,那么这两个变量的相关关系称
为正相关,如果散点图中点的分布是从 左上 角到 右下 角 的区域,那么这两个变量的相关关系称为负相关.
[归纳总结] 两个变量间的关系分为三类:一类是确定 性的函数关系,如正方形的边长与面积的关系;另一类是变 量间确实存在关系,但又不具备函数关系所要求的确定性, 它们的关系是带有随机性的,这种关系就是相关关系,例 如,某位同学的“物理成绩”与“数学成绩”之间的关系, 我们称它们为相关关系;再一类是不相关,即两个变量间没 有任何关系.
^ x+ a ^ 中的 b ^= 根据上表提供的数据得到回归方程 ^ y=b 6.5,预测销售额为115万元时约需________万元广告费.
[答案] 15
2+4+5+6+8 - [解析] x = =5, 5 30+40+60+50+70 - y= =50. 5 ^得a ^= ∵回归方程过样本中心(5,50),代入 ^ y =6.5x+ a 17.5, ∴^ y=6.5x+17.5,当^ y=115时,x=15.
(2)y=0.7x+0.35,过程略 (3)19.65吨标准煤
请同学们认真完成课堂小结,其他同学补充,时间 2分钟. 六、课堂小结:
作业:阳光课堂基础自主演练
xi yi xiyi xi2
5 2 - x =4,- y =5, xi =90, xiyi=112.3 i=1 i=1
Байду номын сангаас
5
112.3-5×4×5 12.3 ^ 于是b= = =1.23; 10 90-5×42 ^=- a y -b- x =5-1.23×4=0.08. (2)线性回归直线方程是 ^ y =1.23x+0.08,当x=10(年) 时, ^ y =1.23×10+0.08=12.38(万元),即估计使用10年时, 支出总费用是12.38万元.
随堂应用练习
五、当堂检测(10 分钟) 1.下列关系中为相关关系的有( )
①学生的学习态度和学习成绩之间的关系; ②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. A.①② B.①③ C.②③ D.②④
[答案] A
2.下列图形中两个变量具有相关关系的是(
)
[答案] C
[解析]
A是一种函数关系,因为任给一个x都有惟一确
定的y和它对应;B也是一种函数关系;C中从散点图可看出 所有点看上去都在某条直线附近波动,具有相关关系,而且 是一种线性相关;D中所有的点在散点图中没有显示任何关 系,因此变量间是不相关的.
3.设一个回归方程为^ y=3 +1.2x,则变量 x 增加一个单 位时( )
^是回归方程的 斜率 ,a ^是回归方程在y轴上的 其中,b
截距.
[破疑点]
线性回归分析涉及大量的计算,形成操作上
的一个难点,可以利用计算机非常方便地作散点图、回归直 线,并能求出回归直线方程.因此在学习过程中,要重视信 息技术的应用.