高中数学第二章统计2.3.1变量之间的相关关系2.3.2两个变量的线性相关课后提升作业含解析

合集下载

2.3.1(2.3.2)变量之间的相关关系和线性关系

2.3.1(2.3.2)变量之间的相关关系和线性关系

2.3 变量间的相关关系2.3.1 变量之间的相关关系2.3.2 两个变量的线性相关整体设计教学分析变量之间的关系是人们感兴趣的问题.教科书通过思考栏目“物理成绩与数学成绩之间的关系”,引导学生考察变量之间的关系.在教师的引导下,可使学生认识到在现实世界中存在不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性.随后,通过探究人体脂肪百分比和年龄之间的关系,引入描述两个变量之间关系的线性回归方程(模型).教科书在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想.通过气温与饮料销售量的例子及随后的思考,使学生了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能犯的错误.进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性.三维目标1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系.2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.3.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.重点难点教学重点:通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;利用散点图直观认识两个变量之间的线性关系;根据给出的线性回归方程的系数公式建立线性回归方程.教学难点:变量之间相关关系的理解;作散点图和理解两个变量的正相关和负相关;理解最小二乘法的思想.课时安排2课时教学过程第1课时导入新课思路1在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?的,物理也好;数学差的,物理也差,但又不全对.)物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法.数学成绩的高低对物理成绩的高低是有一定影响的.但决非唯一因素,还有其他因素,如是否喜欢物理,用在物理学习上的时间等等.(总结:不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少.但这两个变量是有一定关系的,它们之间是一种不确定性的关系.如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义.)为很好地说明上述问题,我们开始学习变量之间的相关关系和两个变量的线性相关.(教师板书课题)思路2某地区的环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低,于是,他就得出一个结论:天鹅能够带来孩子.你认为这样得到的结论可靠吗?如何证明这个结论的可靠性?推进新课新知探究提出问题(1)粮食产量与施肥量有关系吗?“名师出高徒”可以解释为教师的水平越高,学生的水平也越高.教师的水平与学生的水平有什么关系?你能举出更多的描述生活中两个变量的相关关系的成语吗?(2)两个变量间的相关关系是什么?有几种?(3)两个变量间的相关关系的判断.讨论结果:(1)粮食产量与施肥量有关系,一般是在标准范围内,施肥越多,粮食产量越高;教师的水平与学生的水平是相关的,如水滴石穿,三人行必有我师等.我们还可以举出现实生活中存在的许多相关关系的问题.例如:商品销售收入与广告支出经费之间的关系.商品销售收入与广告支出经费有着密切的联系,但商品销售收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关.粮食产量与施肥量之间的关系.在一定范围内,施肥量越大,粮食产量就越高.但是,施肥量并不是决定粮食产量的唯一因素.因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响.人体内的脂肪含量与年龄之间的关系.在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关.应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、学习经验作出相应的判断,因为“经验当中有规律”.但是,不管你的经验多么丰富,如果只凭经验办事,还是很容易出错的.因此,在分析两个变量之间的相关关系时,我们需要一些有说服力的方法.在寻找变量之间相关关系的过程中,统计同样发挥着非常重要的作用.因为上面提到的这种关系,并不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.这就需要通过收集大量的数据(有时通过调查,有时通过实验),在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出判断.(2)相关关系的概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.两个变量之间的关系分两类:①确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;②带有随机性的变量间的相关关系,例如“身高者,体重也重”,我们就说身高与体重这两个变量具有相关关系.相关关系是一种非确定性关系.如商品销售收入与广告支出经费之间的关系.(还与商品质量、居民收入、生活环境等有关)(3)两个变量间的相关关系的判断:①散点图.②根据散点图中变量的对应点的离散程度,可以准确地判断两个变量是否具有相关关系.③正相关、负相关的概念.①教学散点图出示例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:图来进一步分析.②散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,如下图.从散点图我们可以看出,年龄越大,体内脂肪含量越高.图中点的趋势表明两个变量之间确实存在一定的关系,这个图支持了我们从数据表中得出的结论.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)③正相关与负相关的概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)应用示例思路1例1 下列关系中,带有随机性相关关系的是_____________.①正方形的边长与面积之间的关系②水稻产量与施肥量之间的关系③人的身高与年龄之间的关系④降雪量与交通事故的发生率之间的关系解析:两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系,因此填②④.答案:②④例2 有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语.吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?分析:学生思考,然后讨论交流,教师及时评价.解:从已经掌握的知识来看,吸烟会损害身体的健康,但是除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果.我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题.但吸烟引起健康问题的可能性大.因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.点评:在探究研究的过程中,如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么.本题的意义在于引导学生重视对统计结果的解释,从中发现进一步研究的问题.思路2例1 有时候,一些东西吃起来口味越好,对我们的身体越有害.下表给出了不同类型的某种食品的数据.第二列表示此种食品所含热量的百分比,第三列数据表示由一些美食家以百分制给出的对此种食品口味的评价:(2)关于两个变量之间的关系,你能得出什么结论?解:(1)散点图如下:(2)基本成正相关关系,即食品所含热量越高,口味越好.例2 案例分析:一般说来,一个人的身高越高,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系.为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学生的身高与右手一拃长的数据如下表.(1)根据上表中的数据,制成散点图.你能从散点图中发现身高与右手一拃长之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系.(3)如果一个学生的身高是188 cm,你能估计他的一拃大概有多长吗?解:根据上表中的数据,制成的散点图如下.从散点图上可以发现,身高与右手一拃长之间的总体趋势是成一直线,也就是说,它们之间是线性相关的.那么,怎样确定这条直线呢?同学1:选择能反映直线变化的两个点,例如(153,16),(191,23)两点确定一条直线.同学2:在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.同学3:多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.同学4:从左端点开始,取两条直线,如下图.再取这两条直线的“中间位置”作一条直线.同学5:先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧的点数尽可能一样多.同学6:先将所有的点分成两部分,一部分是身高在170 cm以下的,一部分是身高在170 cm 以上的;然后,每部分的点求一个“平均点”——身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即(164,19),(177,21);最后,将这两点连接成一条直线.同学7:先将所有的点按从小到大的顺序进行排列,尽可能地平均分成三等份;每部分的点按照同学3的方法求一个“平均点”,最小的点为(161.3,18.2),中间的点为(170.5,20.1),最大的点为(179.2,21.3).求出这三个点的“平均点”为(170.3,19.9).我再用直尺连接最大点与最小点,然后平行地推,画出过点(170.3,19.9)的直线.同学8:取一条直线,使得在它附近的点比较多.在这里需要强调的是,身高和右手一拃长之间没有函数关系.我们得到的直线方程,只是对其变化趋势的一个近似描述.对一个给定身高的人,人们可以用这个方程来估计这个人的右手一拃长,这是十分有意义的.知能训练一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:关于加工零件的个数与加工时间,你能得出什么结论?答案:(1)散点图如下:(2)加工零件的个数与所花费的时间呈正线性相关关系.拓展提升以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:(2)指出是正相关还是负相关;(3)关于销售价格y和房屋的面积x,你能得出什么结论?解:(1)数据对应的散点图如下图所示:(2)散点图中的点散分布在从左下角到右上角的区域内,所以是正相关.(3)关于销售价格y和房屋的面积x,房屋的面积越大,价格越高,它们呈正线性相关的关系. 课堂小结通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.作业习题2.3A组3、4(1).设计感想本节课学习了变量之间的相关关系和两个变量的线性相关的部分内容,通过身边的具体实例说明了两个变量的相关关系,并学会了利用散点图及其分布来说明两个变量的相关关系的种类,为下一节课作了铺垫,思路1和思路2的例题对知识进行了巩固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育和增强学生的自信心,养成良好的学习态度和学习方法,树立时间观,培养勤奋、刻苦耐劳的精神.备课资料数学家关肇直关肇直(1919.2.13—1982.11.12),中国科学院院士,是中国数学家,生于北京.原籍广东省南海县.父亲关葆麟早年留学德国,回国后任铁道工程师多年,于1932年故世;母亲陆绍馨,是北平女子师范大学的毕业生,曾从教于北京师范大学.关葆麟去世后,母亲以微薄的收入艰难地抚育关肇直及其弟妹多人.全国解放后,关肇直尽心亲侍慈母,直至1967年去世.关肇直于1959年1月与刘翠娥结婚,他们有两个女儿.刘翠娥系中国科学院工程物理研究所研究人员.关肇直于1927年进入北京培华中学附属小学学习.1931年入英国人办的崇德中学学习.学校对英文要求十分严格,加上关肇直自小就由父母习以英文、德文,为日后掌握英文、德文、法文、西班牙文和俄文奠定了良好基础.1936年高中毕业后考入清华大学土木工程系,后于1938年转入燕京大学数学系学习.毕业后在燕京大学(后迁成都)任教.参加成都教授联谊会,担任学生进步组织的导师,积极支持抗日救国学生运动.1946年春从成都返回北平(北京),不久从燕京大学转到北京大学数学系任教.1947年通过考试成为国民政府派遣的中法交换生赴法国留学.名义上去瑞士学哲学,实际上去了巴黎大学庞加莱研究所研究数学,导师是著名数学家、一般拓朴与泛函分析的创始人弗雷歇(M.R.F rechetl),1948年参加革命团体“中国科学工作者协会”,是该会旅法分会的创办人之一.1949年10月,新中国诞生,他毅然决定放弃获得博士学位的机会.于12月回到祖国,满腔热情地参加了新中国的建设.他立即参加了组建中国科学院的工作.他和其他同志一起,协助郭沫若院长筹划建院事宜,确定科学院的方向、任务、体制等,组建科学院图书馆,担任图书管理处处长,编译局处长.1952年参加筹建中国科学院数学研究所的工作,并在数学研究所从事数学研究,历任副研究员、研究员、研究室主任、副所长、学术委员会副主任.他还是中国科学院声学研究所学术委员会委员及原子能研究所学术委员会委员.从1952年起,兼任北京师范大学、北京大学、中国人民大学和中国科技大学等校教授以及华南工学院名誉教授;并兼任过中国科学院成都分院学术顾问、该院数理科学研究室主任、中国科学院武汉数学物理研究所顾问、研究员.他还是国家科委数学学科组副组长、自动化学科组成员;曾担任北京数学会理事长,中国数学会秘书长,国际自动控制联合会理论委员会成员及《中国科学》《科学通报》《数学学报》和《系统科学与数学》等杂志的编委或主编等职.1980年,他与其他科学家一起创建中国科学院系统科学研究所,担任研究所所长.他还担任中国自动化学会副理事长、中国系统工程学会理事长.1980年当选为中国科学院数理学部委员.关肇直长期从事泛函分析、数学物理、现代控制理论等领域的研究,成绩卓著,为我国的社会主义现代化建设作出了重大贡献,1978年获全国科学大会奖,1980年获国防科委、国工办科研奖十几项,1982年获国家自然科学二等奖;关肇直参与主持的项目《尖兵一号返回型卫星和东方红一号》获1985年国家科技进步特等奖,他本人获“科技进步”奖章.关肇直从事泛函分析、数学物理和现代控制理论研究方面,取得水平很高的成果.主要成果有以下几个方面.(一)最速下降法与单调算子思想关肇直于《数学学报》第6卷第4期(1956)发表了学术论文“解非线性函数方程的最速下降法”,第一次把梯度法(又称最速下降法)由有限维空间推广到无限维空间,而且和线性问题相仿,其收敛速度是依照等比级数的.这种方法可以用来解某些非线性积分方程以及某些非线性微分方程边值问题.并在文中首先提出了单调算子的思想,比外国学者早四五年.国外关于单调算子的概念,最早见于1960年扎朗顿尼罗和闵梯(E.H.Z afantonello,G.J.M inty)的工作.单调算子是非线性泛函分析中很基本的概念之一,单调算子理论已成为泛函分析中的一个重要分支,在处理力学、物理学中的许多非线性问题中被广泛地应用.(二)激光问题的数学理论在数学物理方面,关肇直也进行了深入的研究.他在《中国科学》第14卷第7期(1956)上用法文发表了学术论文“关于…激光理论‟中积分方程的非零本征值的存在性”在论文中他利用泛函分析工具,在很弱的假设下,用极为简短的方式证明了激光理论中一般形式的具有非对称核的线性积分方程非零本征值的存在.这一结果受到国际上的重视.被国外书刊广泛引用,如M agraw H ill图书公司1972年出版的柯克朗(J.A.C ochran)著的《线性积分方程分析》一书就曾详细地引用过.(三)中子迁移理论关肇直在数学物理方面的另一个创造,就是关于中子迁移理论的研究.1963年他用希尔伯特空间与不定规度空间的算子谱理论解决了平板几何情形的中子迁移的本征函数问题,著有“关于一类本征值问题”(当时未发表).这比国外罕日布鲁克(H angelbrook)1973年的同类工作早10年.卡帕(H.G.K aper)和兹维贝尔(P.F.Z weibel)在1975年举行的国际迁移理论第四次会议上的报告(载于期刊《T ranspost T heory and S tatistical P hysiss》V ol.4,N o.3,第105—123页,1975)中,在“迁移理论中有什么创新”标题下,把罕日布鲁克的方法称为求解方程的新方法;但是,罕氏著作中所解决的问题,在关肇直的文章中是早已解决了的.关肇直于1963年完成的这篇论文直到他去世后于1984年发表在《数学物理学报》上,国外同行当得知他在60年代就作出了如此高水平的工作时都深表惊异.(四)飞行器弹性控制理论关肇直在《中国科学》1974年第4期上发表了“弹性振动的镇定问题”,首先提出了用线性算子紧扰动理论解决飞行器弹性振动的镇定问题.在这之前,美国的著名控制论专家鲁塞尔(D.L.R ussell)曾用别的方法讨论过此类问题,但他自己认为他所得的结果“当然并非完全满意”,“增益系数的增大应能改进系统的稳定性,但这样整体性结果没有得到……”他甚至认为:显然他所用的方法“带来必须小的缺陷,……,但很怀疑这里定理所表述的结果的确切化用任何别的技术来实现.”可是,与鲁塞尔的怀疑相反,关肇直用了算子紧扰动方法技巧,此方法与鲁塞方法有本质的区别,它确实摆脱了放大系数很小的限制,得出了工程意义更合理的结果.这项成果已经应用到我国的国防尖端技术设计上,成为导弹运载火箭所必不可少的一个设计理论.(五)几本主要著作1.《泛函分析讲义》1958年高等教育出版社出版了关肇直的《泛函分析讲义》.该书吸取了当时国际上几部有名的介绍泛函分析概要的书的长处,内容适中,很具特色,便于自学.这是国内第一部包括当时泛函分析各分支的较全面的专著,国内当时这类书很少;国内除此之外,迄今也仍只有一些教科书性质的出版物,还没有别的书代替它.关肇直曾使用这部著作在1956年和1957年分别为中国科学院数学研究所一批青年同志和北京大学第一届泛函分析专门化学生讲授过《泛函分析》课程,培养了一批从事泛函分析等方面的中青年骨干教师和科研人员.此书至今仍有重大参考价值.2.《拓扑空间榻论》科学出版社于1958年出版了关肇直教授的这本书.本书是为了数学分析方面的青年数学工作者的需要而写的.目的是使读者获得关于拓扑空间理论的基础知识.本书在当时是这方面较系统的也是较早的一部专著.作者是按照自己的观点来写的,书中许多定理的证明都是作者给出的,他尽可能地遵循一般实变函数论中的叙述问题的方式,因而有自己的特色.这是为了使读者感到新知识与原有知识有联系,对新的抽象概念不至感到突然,同时又帮助读者直达科学研究的前沿.根据研究概率论方面的读者反映,对他们研究极限定理一类工作颇有帮助.3.《高等数学教程》人民教育出版社于1959年出版.本书是关肇直在中国科技大学开办应用数学专业讲授高等数学课程而编写的教材,特点是:材料比较丰富,注意理论联系实际.4.《线性泛函分析入门》上海科技出版社于1979年出版.关肇直同他的学生张恭庆、冯德兴合著.著书的目的是为了满足多方面科学研究工作者的需要,因为当时线性泛函分析已成为许多从事科学技术研究的人所渴望了解和应用的一门数学学科.此书的特点是:尽可能从一些问题提炼出泛函分析中的基本概念,让读者透过叙述方法了解到研究的过程.5.《现代控制系统理论小丛书》这是由关肇直主编的,包括线性系统理论、非线性系统理论、极值控制理论、系统辨识、最优控制与随机控制理论、分布参数系统理论及其他有关内容,共分十几分册,由科学出版社从1975年开始陆续出版.这套丛书介绍了现代控制系统理论的各个部分,并着重说明这种理论怎样由工程实践的需要而产生,又怎样用来解决工程设计中的实际问题.此丛书主要是为从事控制理论研究的科学工作者和工程技术人员而撰写的.此丛书的出版,对于促进我国的控制理论和控制技术的发展起到了很好的作用.。

高中数学第二章统计2.3变量的相关性2.3.1-2.3.2变量间的相关关系两个变量的线性相关教学案新人教B版必修3

高中数学第二章统计2.3变量的相关性2.3.1-2.3.2变量间的相关关系两个变量的线性相关教学案新人教B版必修3

2.3.1 & 2.3.2 变量间的相关关系 两个变量的线性相关习课本P73~78,思考并完成以下问题预(1)相关关系是函数关系吗?(2)什么是正相关、负相关?与散点图有什么关系?(3)回归直线方程是什么?如何求回归系数?(4)如何判断两个变量之间是否具备相关关系?[新知初探]1.两个变量的关系分类函数关系相关关系 特征两变量关系确定两变量关系带有随机性2.散点图将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形. 3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.4.最小二乘法设x ,Y 的一组观察值为(x i ,y i ),i =1,2,…,n ,且回归直线方程为y ^=a +bx ,当x 取值x i (i =1,2,…,n )时,Y 的观察值为y i ,差y i -y ^i (i =1,2,…,n )刻画了实际观察值y i 与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即Q =i =1n(y i -a-bx i)2作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q取最小值的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.5.回归直线方程的系数计算公式回归直线方程回归系数系数a^的计算公式方程或公式y^=a^+b^x b^=∑i=1nxiyi-n x-y-∑i=1nx2i-n x2a^=y-b^x-上方加记号“^ ”的意义区分y的估计值y^与实际值ya,b上方加“^ ”表示由观察值按最小二乘法求得的估计值[小试身手]1.下列命题正确的是( )①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.A.①③④B.②③④C.③④⑤D.②④⑤解析:选C ①显然不对,②是函数关系,③④⑤正确.v,u;对变量1,得散点图图10),…,1,2=i)(iy,ix(有观测数据y,x.对变量2)(由这两个散点图可以判断2.,得散点图图10),…,1,2=i)(iv,iu(有观测数据A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:选C 由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关.80,当施肥量为250+x 5=y ^归方程为的线性回(kg)y 与水稻产量(kg)x .若施肥量3kg 时,预计水稻产量约为________kg..650(kg)=250+5×80=y ^代入回归方程可得其预测值80=x 解析:把 答案:6504.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.x 2 4 5 6 8y 30 40 60 50 70若已求得它们的回直线的方程为______________________.,5=2+4+5+6+85=x 解析:由题意可知 y50.=30+40+60+50+705=即样本中心为(5,50).,a ^+x 6.5=y ^设回归直线方程为 ,)y ,x (回归直线过样本中心∵ ,7.51=a ^,即a ^+6.5×5=50∴ 17.5+x 6.5=y ^回归直线方程为∴ 17.5+x 6.5=y ^答案:相关关系的判断[典例] (1) ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系. (2)某个男孩的年龄与身高的统计数据如下表所示.年龄x (岁)123456身高y (cm)78 87 98 108 115 120①画出散点图;②判断y 与x 是否具有线性相关关系.[解析] (1)在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.答案:②④(2)解:①散点图如图所示.②由图知,所有数据点接近一条直线排列,因此,认为y 与x 具有线性相关关系.两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.[活学活用]如图所示的两个变量不具有相关关系的是________(填序号).解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x ,y 不具有相关关系.答案:①④求回归方程[典例] (1)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3B.y ^=2x -2.4C.y ^=-2x +9.5 D.y ^=-0.3x +4.4(2)一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的运转的速度的变化而变化,下表为抽样试验的结果:转速x (转/秒)16 14 12 8 每小时生产有缺点的零件数y (件)11985①画出散点图;②如果y 对x 有线性相关关系,请画出一条直线近似地表示这种线性关系; ③在实际生产中,若它们的近似方程为y =5170x -67,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内?[解析] (1)依题意知,相应的回归直线的斜率应为正,排除C 、D.且直线必过点(3,3.5),代入A 、B 得A 正确.答案:A(2)解:①散点图如图所示:②近似直线如图所示:秒/转14,所以机器的运转速度应控制在≤14.9x ,解得≤1067-x 5170得≤10y 由③内.求回归直线方程的步骤.)数据一般由题目给出)(n ,…,1,2=i )(i y ,i x (收集样本数据,设为(1) (2)作出散点图,确定x ,y 具有线性相关关系..i y i x ,2i x ,i y ,i x 把数据制成表格(3).iy i ∑i =1nx ,2i ∑i =1n x ,y ,x 计算(4) ⎩⎪⎨⎪⎧b ^=∑i =1nxiyi -n x y ∑i =1n x2i -n x 2,a ^=y -b ^ x .,公式为a ^,b ^代入公式计算(5).a ^+x b ^=y ^写出回归直线方程(6) [活学活用]已知变量x ,y 有如下对应数据:x 1 2 3 4 y1345(1)作出散点图;(2)用最小二乘法求关于x ,y 的回归直线方程. 解:(1)散点图如图所示.,52=1+2+3+44=x (2) y ,134=1+3+4+54=∑i=14x 39.=20+12+6+1=i y i ∑i =14x 2i ,30=16+9+4+1= b^,1310=39-4×52×13430-4×⎝ ⎛⎭⎪⎫522=a^,0=52×1310-134= .为所求的回归直线方程x 1310=y ^所以 利用线性回归方程对总体进行估计[典例x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:x 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y 关于x 的回归直线方程y ^=b ^x +a ^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?[解] (1)散点图如图:,3.5=2.5+3+4+4.54=y ,4.5=3+4+5+64=x (2) ∑i=14x ,66.5=6×4.5+5×4+4×3+3×2.5=i y i ∑i=14x 2i ,86=26+25+24+23= ∑i =14xiyi -4xy∑i =14x2i -4x 2=b ^所以 ,0.7=66.5-4×4.5×3.586-4×4.52=a ^0.35.=0.7×4.5-3.5=x b ^-y = 0.35.+x 0.7=y ^所以所求的线性回归方程为 ,)吨标准煤70.35(=0.35+0.7×100=y ^时,100=x 当(3) 90-70.35=19.65(吨标准煤).即生产100吨甲产品的生产能耗比技改前降低了19.65吨标准煤.只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.[活学活用](重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(1)求y 关于t 的回归方程y ^=b ^t +a ^;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款. 解:(1)列表计算如下:it iy it 2it i y i1 1 5 1 52 2 6 4 123 3 7 9 214 4 8 16 325 5 10 25 50 ∑153655120这里n =5,t -=1n ∑i =1n t i =155=3,y -=1n ∑i =1n y i =365=7.2.又∑i =1nt2i -n t -2=55-5×32=10,i =1n t i y i -n t-y -=120-5×3×7.2=12,从而b ^=1210=1.2,a ^=y --b ^t -=7.2-1.2×3=3.6,故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).[层级一 学业水平达标]1.下列变量具有相关关系的是( )A .人的体重与视力B .圆心角的大小与所对的圆弧长C .收入水平与购买能力D .人的年龄与体重解析:选C B 为确定性关系;A ,D 不具有相关关系,故选C.2.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为2+x 1.5=y ^A. 2+x 1.5=-y ^B. 2-x 1.5=y ^C. 2-x 1.5=-y ^D. 之间负相关,回归直线y ,x ,由散点图可知变量a ^+x b ^=y ^设回归方程为 B 解析:选 2.+x 1.5=-y ^,因此方程可能为>0a ^,<0b ^轴上的截距为正数,所以y 在 个样本点,n 的y 和x 是变量)n y ,n x (,…,)2y ,2x (,)1y ,1x (设3.直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是( ))y ,x (过点l .直线A B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同解析:选A A 是正确的;回归直线可以不经过散点图中的任何点,故B 错误;回归直线的斜率不确定,故C 错误;分布在l 两侧的样本点的个数不一定相同,故D 错误. 4.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的,x 0.006 2+9.5=y ^的回归方程为x 关于吨位y 人,船员人数32~5人数 (1)若两艘船的吨位相差1 000,求船员平均相差的人数;(2)估计吨位最大的船和最小的船的船员人数.,则2x ,1x 设两艘船的吨位分别为(1)解: y^)2x 6 20.00+(9.5-1x 0.006 2+9.5=2y ^-1 =0.006 2×1 000≈6, 即船员平均相差6人.,0.006 2×192≈11+9.5=y ^时,192=x 当(2) 0.006 2×3 246≈30.+9.5=y ^时,3 246=x 当 即估计吨位最大和最小的船的船员数分别为30人和11人.[层级二 应试能力达标]1.一个口袋中有大小不等的红、黄、蓝三种颜色的小球若干个(大于5个),从中取5次,那么取出红球的次数和口袋中红球的数量是( ) A .确定性关系 B .相关关系 C .函数关系D .无任何关系 解析:选 B 每次从袋中取球取出的球是不是红球,除了和红球的个数有关外,还与球的大小等有关系,所以取出红球的次数和口袋中红球的数量是一种相关关系.,下x 80+50=y ^变化的回归直线方程为)千元(x 依劳动生产率)元(y .农民工月工资2列判断正确的是( )A .劳动生产率为1 000元时,工资为130元B .劳动生产率提高1 000元时,工资水平提高80元C .劳动生产率提高1 000元时,工资水平提高130元D .当月工资为210元时,劳动生产率为2 000元的单x ,但要注意80增加y ,1每增加x 知,x 80+50=y ^由回归直线方程 B 解析:选位是千元,y 的单位是元.3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下:则y 对x 的线性回归方程为( )A .y =x -1B .y =x +1x 12+88=y .C176=y .D =y ,176=174+176+176+176+1785=x 计算得, C 解析:选符合.C 检验知,)y ,x (,根据回归直线经过样本中心176=175+175+176+177+17754.已知x 与y 之间的几组数据如下表:,若某同学根据上表中的前两组a ^+x b ^=y ^假设根据上表数据所得线性回归直线方程为数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )′a <a ^,′b >y ^′ B.a >a ^,′b >b ^A. ′a <a ^,′b <y ^′ D.a >a ^,′b <b ^C. 解析:选C 由(1,0),(2,2)求b ′,a ′.2.=-2×1-0=′a ,2=2-02-1=′b ,58=24+15+12+3+4+0=i y i ∑i =16x 时,a ^,b ^求 x ,136=y ,3.5= ∑i=16x 2i ,91=36+25+16+9+4+1= ,57=58-6×3.5×13691-6×3.52=b ^∴ a^,13=-52-136=×3.557-136= ′.a >a ^,′b <b ^∴ =y ^的回归方程为(cm)x 对身高(kg)y 岁的人,体重38岁到18.正常情况下,年龄在50.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右. =y ^时,178=x 的人的体重进行预测,当178 cm 解析:用回归方程对身高为0.72×178-58.2=69.96(kg).答案:69.966.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:________.=a ,则a +x 4=-y 由表中数据,求得线性回归方程为 ,132=4+5+6+7+8+96=x 解析: y,80=92+82+80+80+78+686=)y ,x (由回归方程过样本中心点 .a ^+1324×=-80得 106.=1324×+80=a ^即 答案:1067.对某台机器购置后的运行年限x (x =1,2,3,…)与当年利润y 的统计分析知x ,y ,估计该台机器最为划算的使用年限为x 1.3-10.47=y ^具备线性相关关系,回归方程为________年.解析:当年利润小于或等于零时应该报废该机器,当y =0时,令10.47-1.3x =0,解得x ≈8,故估计该台机器最为划算的使用年限为8年.答案:88.某个体服装店经营某种服装在某周内所获纯利y (元)与该周每天销售这种服装的件数x (件)之间有一组数据如下表:;y ,x 求(1) (2)若纯利y 与每天销售这种服装的件数x 之间是线性相关的,求回归直线方程; (3)若该店每周至少要获纯利200元,请你预测该店每天至少要销售这种服装多少件?3 487)=i y i ∑i =17x ,45 309=2i ∑i =17y ,280=2i ∑i =17x 提示:( ,6=3+4+5+6+7+8+97=x (1)解: y≈79.86.66+69+73+81+89+90+917= ,≈4.753 487-7×6×79.86280-7×62=b ^∵(2) a^,51.36=4.75×6-79.86= .x 4.75+51.36=y ^之间的回归直线方程为x 纯利与每天销售件数∴ ≈31.29.x ,所以651.3+x 4.75=200时,200=y ^当(3) 因此若该店每周至少要获纯利200元,则该店每天至少要销售这种服装32件.9.2016年元旦前夕,某市统计局统计了该市2015年10户家庭的年收入和年饮食支出的统计资料如下表:年收入x (万元)2 4 4 6 6 6 7 7 8 10年饮食 支出y(万元)0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3(2)若某家庭年收入为9万元,预测其年饮食支出.406)=2i ∑i =110x ,117.7=i y i ∑i =110x 参考数据:( 解:依题意可计算得:x,10.98=y x ,36=2x ,1.83=y ,6= ,406=2i ∑i =110x ,117.7=i y i ∑i =110x ∵又,≈0.17∑i=110xiyi -10x y ∑i =110x2i -10x 2=b ^∴ a^0.81.+x 0.17=y ^∴,0.81=x b ^-y = 1.0.8+x 0.17=y ^所求的回归方程为∴ .)万元2.34(=0.81+0.17×9=y ^时,9=x 当(2) 可估计年收入为9万元的家庭每年饮食支出约为2.34万元.(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列三个抽样:①一个城市有210家某商品的代理商,其中大型代理商有20家,中型代理商有40家,小型代理商有150家,为了掌握该商品的销售情况,要从中抽取一个容量为21的样本;②在某公司的50名工人中,依次抽取工号为5,10,15,20,25,30,35,40,45,50的10名工人进行健康检查;③某市质量检查人员从一食品生产企业生产的两箱(每箱12盒)牛奶中抽取4盒进行质量检查.则应采用的抽样方法依次为( )A .简单随机抽样;分层抽样;系统抽样B .分层抽样;简单随机抽样;系统抽样C .分层抽样;系统抽样;简单随机抽样D .系统抽样;分层抽样;简单随机抽样解析:选 C ①中商店的规模不同,所以应利用分层抽样;②中抽取的学号具有等距性,所以应是系统抽样;③中总体没有差异性,容量较小,样本容量也较小,所以应采用简单随机抽样.故选C.2.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是( )A .09,14,19,24B .16,28,40,52C .10,16,22,28D .08,12,16,20 解析:选B 分成5组,每组12名学生,按等间距12抽取.选项B 正确.3.某学校有教师200人,男学生1 200人,女学生1 000人.现用分层抽样的方法从全体师生中抽取一个容量为n 的样本,若女学生一共抽取了80人,则n 的值为( )A .193B .192C .191D .190 192.=n ,求得80=n200+1 200+1 0001 000× B 解析:选 4.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )200+x 10=y ^200 B.+x 10=-y ^A. 200-x 10=y ^200 D.-x 10=-y ^C. 解析:选A 由于销售量y 与销售价格x 成负相关,故排除B ,D.又因为销售价格x >0,则C 中销售量全小于0,不符合题意,故选A.,则y 和x ,它们的平均数分别是n y ,…,2y ,1y 与n x ,…,2x ,1x .设有两组数据5)(的平均数是1+n y 3-n x 2,…,1+2y 3-2x 1,2+1y 3-1x 2新的一组数据 y 3-x 2.A 1+y 3-x 2.By 9-x 4.C1+y 9-x 4.D ,)n ,…,1,2=i 1(+i y 3-i x 2=i z 设 B 解析:选 =⎝ ⎛⎭⎪⎫1+1+…+1n +)n y +…+2y +1y (3n -)n x +…+2x +1x (2n =)n z +…+2z +1z (1n =z 则 1.+y 3-x 2 6.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12[35.5,39.5) 7 [39.5,43.5) 3则总体中大于或等于31.5的数据所占比例约为( )211A.13B. 12C.23D. 解析:选B 由题意知,样本的容量为66,而落在[31.5,43.5)内的样本个数为12+7.13=2266的数据约占31.5,故总体中大于或等于22=3+ 7.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各有1人,则该小组数学成绩的平均数、众数、中位数分别是( )A .85,85,85B .87,85,86C .87,85,85D .87,85,90 解析:选C ∵得85分的人数最多为4人,∴众数为85,中位数为85,87.=75)+80+85×4+90×2+95+(100110平均数为 8.某出租汽车公司为了了解本公司司机的交通违章情况,随机调查了50名司机,得到了他们某月交通违章次数的数据,结果制成了如图所示的统计图,根据此统计图可得这50名出租车司机该月平均违章的次数为( )A .1B .1.8C .2.4D .3 1.8.=5×0+20×1+10×2+10×3+5×450B 解析:选 9.下表是某厂1~4月份用水量情况(单位:百吨)的一组数据月份x 1 2 3 4用水量y 4.5 4 3 2.5的a ,则a +x 0.7=-y 之间具有线性相关关系,其线性回归方程为x 与月份y 用水量值为( )A .5.25B .5C .2.5D .3.5 解析:选A 线性回归方程经过样本的中心点,根据数据可得样本中心点为(2.5,3.5),所以a =5.25.10.如图是在元旦晚会举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,1.2D .85,4 +5+6+3+(515+80,平均数为77,去掉一个最低分95去掉一个最高分 C 解析:选,因此1.2=]286)-(85+285)-(85+286)-(85+283)-(85+285)-[(8515,方差为85=6)选C.,…,2+2x 2,3+1x 3,则2s ,方差是x 的平均数是n x ,…,3x ,2x ,1x .如果数据11)(的平均数和方差分别是2+n x 32s 和x A.2s 9和x 3.B2s 9和2+x 3.C4+2s 12和2+x 3.D nx …,2x ,1x ,由于数据2+x 3的平均数是2+n x 3,…,2+2x 2,3+1x 3 C 解析:选.2s 9的方差为2+n x 3,…,2+2x 2,3+1x 3,所以2s 的方差为 12.如图是某赛季甲、乙两名篮球运动员5场比赛得分的茎叶图,已知甲的成绩的极差为31,乙的成绩的平均值为24,则下列结论错误的是( ) A .x =9 B .y =8C .乙的成绩的中位数为26D .乙的成绩的方差小于甲的成绩的方差解析:选B 因为甲的成绩的极差为31,所以其最高成绩为39,所以x =9;因为乙的成绩的平均值为24,所以y =24×5-(12+25+26+31)-20=6;由茎叶图知乙的成绩的中位数为26;对比甲、乙的成绩分布发现,乙的成绩比较集中,故其方差较小. 二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上) 13.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为________.∴,2;又方差为20=y +x ,则10=159)×+11+10+y +x (,得10解析:由平均数为=xy 208,2=2y +2x ,得2=15]×210)-(9+210)-(11+210)-(10+210)-y (+210)-x [( 4.=x2+y2-2xy =x -y 2=|y -x |∴,192 答案:414.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.12.=×482148+36解析:抽取的男运动员的人数为 答案:1215.要考察某种品牌的500颗种子的发芽率,抽取60粒进行实验,利用随机数表抽取种子时,先将500颗种子按001,002,…,500进行编号,如果从随机数表第7行第8列的数3开始向右读,请你依次写出最先检测的5颗种子的编号:________,________,________,________,________.(下面摘取了随机数表第7行至第9行)59408 66368 36016 26247 25965 49487 26968 86021 77681 83458 21540 62651 69424 78197 20643 67297 76413 66306 51671 54964 87683 30372 39469 97434解析:以3开始向右读,每次读取三位,重复和不在范围内的不读,依次为368,360,162,494,021.答案:368,360,162,494,02116.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如下图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]的学生中选取的人数应为________.解析:∵0.005×10+0.035×10+a ×10+0.020×10+0.010×10=1,∴a =0.030.设身高在[120,130),[130,140),[140,150]三组的学生分别有x ,y ,z 人,10.=z ,20=y 同理,30.=x ,解得0.030×10=x100则3.=×181030+20+10的学生中选取的人数为[140,150]故从 答案:0.030 3三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤) ,应如何110名学生中抽取50为调查某班学生的平均身高,从)分10本小题满分(.17抽样?若知道男生、女生的身高显著不同(男生30人,女生20人),应如何抽样? 抽签法或随机数(人,采用简单随机抽样法5,即抽取110名学生中抽取50解:从法).若知道男生、女生的身高显著不同,则采用分层抽样法,按照男生与女生的人数比为30∶20=3∶2进行抽样,则男生抽取3人,女生抽取2人.18.(本小题满分12分)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示. (1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?22.=1326=17+19+20+21+25+306样本均值为1)(解: 4=1312×名工人中有12,故推断该车间13=26知样本中优秀工人所占比例为(1)由(2)名优秀工人.19.(本小题满分12分)2016年春节前,有超过20万名广西、四川等省籍的外出务工人员选择驾乘摩托车沿321国道长途跋涉返乡过年,为防止摩托车驾驶人员因长途疲劳驾驶,手脚僵硬影响驾驶操作而引发交通事故,肇庆市公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让返乡过年的摩托车驾乘人员有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是什么抽样方法?(2)用分层抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的有5人,则四川籍的应抽取几人?解:(1)交警小李对进站休息的驾驶人员的省籍询问采用的是系统抽样法.(2)从题图可知,被询问了省籍的驾驶人员广西籍的有5+20+25+20+30=100(人);四川籍的有15+10+5+5+5=40(人).2,即四川籍的应抽取2=x ,解得x40=5100人,依题意得x 设四川籍的驾驶人员应抽取人.20.(本小题满分12分)某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量(单位:kg),分别记录抽查数据如下:甲:102,101,99,98,103,98,99; 乙:110,115,90,85,75,115,110.(1)这种抽样方法是哪一种方法?(2)试计算甲、乙车间产品重量的平均数与方差,并说明哪个车间产品较稳定?解:(1)甲、乙两组数据间隔相同,所以采用的方法是系统抽样.,100=99)+98+103+98+99+101+(10217=甲x (2) x,100=110)+115+75+85+90+115+(11017=乙 ,1)≈3.43+4+9+4+1+1+(417=2甲s ,228.57=100)+225+625+225+100+225+(10017=2乙s ,故甲车间产品比较稳定.2乙s <2甲s ∴ 21.(本小题满分12分)对某校高一年级学生参加社区服务次数进行统计,随机抽取M 名学生作为样本,得到这M 名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:分组频数 频率[10,15) 10 0.25[15,20) 25n [20,25) mp[25,30] 20.05 合计M1(1)求出表中M ,p 及图中a 的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)的人数.解:(1)由分组[10,15)的频数是10, 40.=M ,所以0.25=10M知,0.25频率是 因为频数之和为40,所以10+25+m +2=40,解得m =3.0.075.=340=p 故 因为a 是对应分组[15,20)的频率与组距的商,125.0.=2540×5=a 所以 (2)因为该校高一学生有360人,分组[10,15)的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为360×0.25=90.22.(本小题满分12分)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入iy i ∑i =110x ,20=i ∑i =110y ,80=i ∑i =110x 的数据资料,算得)单位:千元(i y 与月储蓄)单位:千元(i x 720.=2i ∑i =110x ,184= ;a ^+xb ^=y ^的线性回归方程x 对月收入y 求家庭的月储蓄(1) (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.,8=8010=i ∑i =1n x 1n =x ,10=n 由题意知(1)解: y ,2=2010=i ∑i =1n y 1n = ,80=210×8-720=2x 10-2i ∑i =110x 又 ∑i=110x ,24=10×8×2-184=y x 10-i y i ,0.3=2480=∑i =110xiyi -10x y∑i =110x2i -10x 2=b ^由此得 a^,0.4=-0.3×8-2=x b ^-y = 0.4.-x 0.3=y ^故所求回归方程为 (2)由于变量y 的值随x 的值增加而增加(b =0.3>0),故x 与y 之间是正相关.(3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7千元.。

高中高中数学第二章统计2.3.1变量之间的相关关系2.3.2两个变量的线性相关课件新人教A版必修3

高中高中数学第二章统计2.3.1变量之间的相关关系2.3.2两个变量的线性相关课件新人教A版必修3

解:(1)画出散点图.
(2)判断变量x,y是否具有相关关系?如果具有相关关系,那么是正相关还是 负相关?
解:(2)具有相关关系.根据散点图,左下角到右上角的区域,变量x的值由小 变大时,另一个变量y的值也由小变大,所以它们具有正相关关系.
方法技巧 两个随机变量x和y是否具有相关关系的确定方法: (1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断 (如本题); (2)表格、关系式法:结合表格或关系式进行判断; (3)经验法:借助积累的经验进行分析判断.
4
4
解:(2)由表中的数据得: xi yi =52.5, x =3.5, y =3.5, xi2 =54,
i 1
i 1
n
所以 b =
xi yi n x y
i 1
n
xi2

2Hale Waihona Puke nx=52.5 4 3.5 3.5 54 4 3.52
=0.7,
i 1
a = y - b x =3.5-0.7×3.5=1.05,
年份x
储蓄存款 y(千亿元)
2013 5
2014 6
2015 7
2016 8
2017 10
为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2 012,z=y-5 得到表2:
时间代号t
1
2
3
4
5
z
0
1
2
3
5
(1)求z关于t的线性回归方程;
5
5
解:(1) t =3, z =2.2, ti zi=45, ti2 =55,
知识探究
1.相关关系与函数关系不同 函数关系中的两个变量间是一种确定性关系,相关关系是一种不确定性关系. 2.正相关和负相关 (1)正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关 关系,我们就称它为正相关. (2)负相关 在散点图中,点散布在从左上角到右下角的区域,对于两个变量的这种相关 关系,我们就称它为负相关.

高中数学第二章统计23变量间的相关关系课件新人教A版必修3(2)

高中数学第二章统计23变量间的相关关系课件新人教A版必修3(2)

总费用y/万元 2.2 3.8 5.5 6.5 7.0
(1)根据表格数据,画出散点图;
(2)求线性回归方程y^=b^x+a^的系数a^,b^; (3)估计使用年限为 10 年时,车的使用总费用是多少?
【解题探究】(1)利用描点法作出散点图; (2)把数据代入公式,可得回归方程的系数; (3)把x=10代入回归方程得y值,即为总费用的估计 值.
【答案】A 【解析】在A中,若b确定,则a,b,c都是常数,Δ= b2-4ac也就唯一确定了,因此,这两者之间是确定性的函数 关系;一般来说,光照时间越长,果树亩产量越高;降雪量越 大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所 以B,C,D是相关关系.故选A.
两个变量x与y相关关系的判断方法 1.散点图法:通过散点图,观察它们的分布是否存在 一定规律,直观地判断.如果发现点的分布从整体上看大致在 一条直线附近,那么这两个变量就是线性相关的,注意不要受 个别点的位置的影响. 2.表格、关系式法:结合表格或关系式进行判断. 3.经验法:借助积累的经验进行分析判断.
变量之间的相关关系的判断
【 例 1】 下 列 变 量 之 间 的 关 系 不 是 相 关 关 系 的 是 ()
A.二次函数y=ax2+bx+c中,a,c是已知常数,取b 为自变量,因变量是判别式Δ=b2-4ac
B.光照时间和果树亩产量 C.降雪量和交通事故发生率 D.每亩田施肥量和粮食亩产量
【解题探究】判断两个变量之间具有相关关系的关键是 什么?
①反映^y与 x 之间的函数关系;
②反映 y 与 x 之间的函数关系;
③表示^y与 x 之间的不确定关系;
④表示最接近 y 与 x 之间真实关系的一条直线.
A.①②

【创新设计14-2015学年高中数学 2.3.1 变量之间的相关关系;2.3.2 两个变量的线性相关课件 新人教A版必修3

【创新设计14-2015学年高中数学 2.3.1 变量之间的相关关系;2.3.2 两个变量的线性相关课件 新人教A版必修3
- -
^
(
)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg D.若该大学某女生身高为170 cm,则可断定其体重必为 58.79 kg
答案 D ^ 解析 当 x=170 时,y =0.85×170-85.71=58.79,
体重的估计值为 58.79 kg.
5.正常情况下,年龄在 18 岁到 38 岁的人,体重 y(kg)对身高 x(cm)的回归方程为y=0.72x-58.2,张红同学(20 岁)身高 178 cm,她的体重应该在________kg 左右.
跟踪演练1
下列两个变量之间的关系,哪个不是函数关系 ( )
A.正方体的棱长和体积 B.圆半径和圆的面积 C.正n边形的边数和内角度数之和 D.人的年龄和身高 答案 D
解析
A、B、C都是函数关系,对于A,V=a3;对于B,S=
πr2;对于C,g(n)=(n-2)π.而对于年龄确定的不同的人可以 有不同的身高,∴选D.
(2)正相关与负相关:
右上角 的 左下角 到_______ ①正相关:散点图中的点散布在从_______ 区域.
左上角 到_______ 右下角 的 ②负相关:散点图中的点散布在从_______
区域.
2.回归直线的方程 (1)回归直线:如果散点图中点的分布从整体上看大致在 一条直线 附近,就称这两个变量之间具有_________ 线性相关 关 _________
^
A.y平均增加1.5个单位
B.y平均增加2个单位
C.y平均减少1.5个单位
答案 解析 C
D.y平均减少2个单位
∵两个变量线性负相关,∴变量x增加一个单位,y
平均减少1.5个单位.
4.(2013· 滨州高一检测)设某大学的女生体重 y(单位:kg)与身高 x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i = 1,2,…,n),用最小二乘法建立的回归方程为y = 0.85x - 85.71,则下列结论中不正确的是 A. y 与 x 具有正的线性相关关系 B.回归直线过样本点的中心(x, y)

2017学年数学必修三:2.3.1-变量之间的相关关系~2.3.2 两个变量的线性相关2

2017学年数学必修三:2.3.1-变量之间的相关关系~2.3.2 两个变量的线性相关2
取值范围应该有意义).
(2)问题2中,从表里数据能得出小麦的产量y与施肥量x之间的 函数关系式吗? 提示:从表格里我们很容易发现施肥量越大 ,小麦的产量就越高. 但是,施肥量并不是影响小麦产量的唯一因素 ,小麦的产量还受 土壤的质量、降雨量、田间管理等诸多因素影响 ,这时两个变
量之间就不是确定性的函数关系,因此不能得到y和x的函数关
1.两个变量的线性相关 左下角 到_______. 右上角 (1)正相关:点散布的方向:从_______ 左上角 到_______. 右下角 (2)负相关:点散布的方向:从_______ (3)回归直线:如果散点图中点的分布从整体上看在一条直线附
线性相关 关系,这条直线叫做 近,就称这两个变量之间具有_________
【解析】(1)作出散点图如图所示,
(2)由散点图可知,各点并不在一条直线附近,所以两个变量是
非线性相关关系.
类型二
求回归方程
1.(2013·锦州高一检测)已知一组观测值具有线性相关关系,
bx a ,求得 b =0.51, x =61.75, y =38.14, 则回归方 若对于 y
【探究总结】
1.散点图的作用
(1)判断两个变量之间有无相关关系,一种常用的简便可行的方
法是绘制散点图.
(2)根据散点图很容易看出两个变量之间是否具有相关关系,是
不是线性相关关系,是正相关还是负相关,相关关系强还是弱.
2.利用散点图判断变量间的关系的方法 (1)如果所有的样本点都落在某一函数的曲线上,就用该函数来 描述变量间的关系,即变量具有函数关系. (2)如果所有的样本点都落在某一函数曲线附近,变量之间就有 相关关系. (3)如果所有的样本点都落在某一条直线附近,变量之间就有线 性相关关系.

高中数学 2.3.1变量之间的相关关系教案 新人教B版必修3

高中数学 2.3.1变量之间的相关关系教案 新人教B版必修3

2.3.1变量之间的相关关系教学目标:通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。

教学重点:通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。

教学过程:案例分析:一般说来,一个人的身高越高,他的人就越大,相应地,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系。

为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学生的身高与右手一拃长的数据如下表。

性别身高/cm 右手一拃长/cm 女152 18.5女153 16.0女156 16.0女157 20.0女158 17.3女159 20.0女160 15.0女160 16.0女160 17.5女160 17.5女160 19.0女160 19.0女160 19.0女160 19.5女161 16.1女161 18.0女162 18.2女162 18.5女163 20.0女163 21.5女164 17.0女164 18.5女164 19.0女164 20.0女165 15.0女165 16.0女165 17.5女165 19.5女166 19.0女167 19.0女167 19.0女168 16.0女168 19.0女168 19.5女170 21.0女170 21.0女170 21.0女171 19.0女171 20.0女171 21.5女172 18.5女173 18.0 性别身高/cm 右手一拃长/cm 女173 22.0男162 19.0男164 19.0男165 21.0男168 18.0男168 19.0男169 17.0男169 20.0男170 20.0男170 21.0男170 21.5男170 22.0男171 21.5男171 21.5男171 22.3男172 21.5男172 23.0男173 20.0男173 20.0男173 20.0男173 20.0男173 21.0男174 22.0男174 22.0男175 16.0男175 20.0男175 21.0男175 21.2男175 22.0男176 16.0男176 19.0男176 20.0男176 22.0男176 22.0男177 21.0男178 21.0男178 21.0男178 22.5男178 24.0男179 21.5男179 21.5男179 23.0(1)根据上表中的数据,制成散点图。

2020版人教A数学必修3 课件:2.3.1 变量之间的相关关系2.3.2 两个变量的线性相关

2020版人教A数学必修3 课件:2.3.1 变量之间的相关关系2.3.2 两个变量的线性相关
[例3] 炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时 间的长短,故必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔 化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间) 的一列数据如表所示.
x (0.01%)
104
180 190 177
147
134
150
191
204
121
学霸经验分享区 (1)回归分析是对具有相关关系的两个变量进行统计分析的方法,两 个变量具有相关关系是回归分析的前提. (2)散点图是定义在具有相关关系的两个变量基础上的,对于关系不 明确的两组数据,可先作散点图,在图上看它们有无相关关系,然后再 进行相关回归分析. (3)通过对散点图的观察,一般地,若图中数据大致分布在一条直线附 近,那么这两个变量近似成线性相关关系. (4)求线性回归方程,应注意到,只有大部分点分布在某条直线附近, 求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无 意义.
名师点津 对回归直线方程的几点说明 (1)a,b的上方加“^ ”,表示是由观察值按最小二乘法求得的估计值.
(2)(xi,yi)(i=1,2,…,n)的( x , y )在回归直线上.
(3)由回归直线方程知 x 处的估计值为 yˆ = aˆ + bˆ x.
(4)回归直线使得样本数据中的点到它的距离的平方和最小. (5)求回归直线方程,计算量大,一般应学会使用计算器求解. (6)利用回归直线方程可以对总体进行估计.
解:散点图分别如图(1)(2)所示.
从图中可以看出两图中的点各自分布在一条直线附近,因此两对变量 都具有相关关系. 图(1)中A的值由小变大时,B的值却是由大变小,即A和B成负相关; 图(2)中C的值由小变大时,D的值也是由小变大,即C和D成正相关.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

变量之间的相关关系两个变量的线性相关
(45分钟70分)
一、选择题(每小题5分,共40分)
1.(2016·长春高一检测)有五组变量:
①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;
②平均日学习时间和平均学习成绩;
③某人每日吸烟量和其身体健康情况;
④立方体的棱长和体积;
⑤汽车的重量和行驶100千米的耗油量.
其中两个变量成正相关的是( )
A.①③
B.②④
C.②⑤
D.④⑤
【解析】选C.①是负相关;②是正相关;③是负相关;④是函数关系,不是相关关系;⑤是正相关.
【补偿训练】判断下列图形中具有相关关系的两个变量是( )
【解析】选C.A,B为函数关系,D无相关关系.
2.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
【解析】选C.图(1)中的数据y大多随着x的增大而减小,因此变量x与变量y负相关;图(2)中的数据随着u的增大,v大多也增大,因此u与v正相关.
3.(2016·长沙高一检测)已知x与y之间的一组数据:
则y与x的线性回归方程=x+必过点( )
A.(1,2)
B.(5,2)
C.(2,5)
D.(2.5,5)
【解析】选C.线性回归方程一定过样本点的中心(,).
由==2,==5.
故必过点(2,5).
4.(2016·大连高一检测)某商品销售量y(件)与销售价格x(元/件)呈负相关,其回归方程可能是( )
A.=-10x+200
B.=10x+200
C.=-10x-200
D.=10x-200
【解析】选A.由于y与x呈负相关,所以x的系数为负,
又y不能为负值,所以常数必须是正值.
5.(2015·福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为( )
A.11.4万元
B.11.8万元
C.12.0万元
D.12.2万元
【解析】选B.由题意得
==10,
==8,所以=8-0.76×10=0.4,所以=0.76x+0.4,
把x=15代入得到=11.8.
6.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是( )
A.直线l1和l2有交点(s,t)
B.直线l1和l2相交,但是交点未必是点(s,t)
C.直线l1和l2由于斜率相等,所以必定平行
D.直线l1和l2必定重合
【解析】选A.设线性回归直线方程为=x+,而=-.所以点(s,t)在回归直线上.所以直线l1和l2有公共点(s,t).
7.下列有关回归方程=x+的叙述正确的是( )
①反映与x之间的函数关系
②反映y与x之间的函数关系
③表示与x之间的不确定关系
④表示最接近y与x之间真实关系的一条直线
A.①②
B.②③
C.③④
D.①④
【解析】选D.=x+表示与x之间的函数关系,而不是y与x之间的函数关系.但它所反映
的关系最接近y与x之间的真实关系.
8.已知x与y之间的几组数据如下表:
假设根据上表数据所得线性回归直线方程为=x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是
( ) A.>b′,>a′ B.>b′,<a′
C.<b′,>a′
D.<b′,<a′
【解题指南】先由已知条件分别求出b′,a′的值,再由,的计算公式分别求解,的值,即
可作出比较.
【解析】选C.由两组数据(1,0)和(2,2)可求得直线方程为y=2x-2,从而b′=2,
a′=-2.而利用线性回归方程的公式与已知表格中的数据,可求得=
==,
=-=-×=-,
所以<b′,>a′.
二、填空题(每小题5分,共10分)
9.下列关系:
(1)炼钢时钢水的含碳量与冶炼时间的关系.
(2)曲线上的点与该点的坐标之间的关系.
(3)柑橘的产量与气温之间的关系.
(4)森林中的同一种树木,其横断面直径与高度之间的关系.
其中具有相关关系的是________.
【解析】(1)炼钢的过程就是一个降低含碳量进行氧化还原的过程,除了与冶炼时间有关外,还要受冶炼温度等其他因素的影响,故具有相关关系.
(2)曲线上的点与该点的坐标之间的关系是一种确定性关系.
(3)柑橘的产量除了受气温影响以外,还与施肥量以及水分等因素的影响,故具有相关关系.
(4)森林中的同一种树木,其横断面直径随高度的增加而增加,但是还受树木的疏松及光照等因素的影响,故具有相关关系.
答案:(1)(3)(4)
10.(2016·广州高一检测)某公司的广告费支出x与销售额y(单位:万元)之间有下列对应数据(由资料显示y与x呈线性相关关系):
根据上表提供的数据得到回归方程=x+中的=6.5,预测销售额为115万元时约需________万元广告费.
【解析】=(2+4+5+6+8)=5,
=(30+40+60+50+70)=50,
由=6.5知,=-·=50-6.5×5=17.5,
所以=17.5+6.5x,当=115时,
解得x=15.
答案:15
【补偿训练】调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
【解析】由于=0.254x+0.321知,当x增加1万元时,年饮食支出y增加0.254万元.
答案:0.254
三、解答题(每小题10分,共20分)
11.(2015·重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
(1)求y关于t的回归方程=t+.
(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.
附:回归方程=t+中,=,=-.
【解题指南】(1)直接利用回归系数公式求解即可.
(2)利用回归方程代入直接进行计算即可.
【解析】(1)列表计算如下:
这里n=5,=t i==3,=y i==7.2.
又-n=55-5×32=10,t i y i-n=120-5×3×7.2=12,
从而==1.2,=-=7.2-1.2×3=3.6,
故所求回归方程为=1.2t+3.6.
(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为=1.2×6+3.6=10.8(千亿元).
12.(2016·全国卷Ⅲ)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1-7分别对应年份2008-2014.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明.
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:
参考数据:y i=9.32,t i y i=40.17,=0.55,≈2.646.
参考公式:相关系数r=
回归方程=+t中斜率和截距的最小二乘估计公式分别为:
=,=-.
【解析】(1)由折线图中的数据和附注中参考数据得
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.
(2)由==1.331及(1)得==≈0.103,
=-≈1.331-0.103×4≈0.92.
所以,y关于t的回归方程为=0.92+0.10t.
将2016年对应的t=9代入回归方程得:=0.92+0.10×9=1.82.
所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.
【能力挑战题】给出施化肥量对水稻产量影响的试验数据如下表:
(1)画出散点图,并判断这两者之间是否具有线性相关关系.
(2)如果具有线性相关关系,请求出回归直线并且画出图形.
【解析】(1)散点图如图所示.
=30,≈399.3,=7 000,x i y i=87 175 设回归直线方程为=x+,则
=≈4.75,
=399.3-4.75×30=256.8.
所以回归直线方程是=4.75x+256.8,回归直线如图.。

相关文档
最新文档