高中数学线性回归方程讲解练习题
高中数学北师大版 1 一元线性回归 课后练习、课时练习

一、单选题1. 已知变量关于的线性回归方程为,且,,则时,预测的值为()A.B.C.D.2. 已知变量x和y的统计数据如下表:x 3 n 5 6 7y 2.5 3 4 m 6根据上表可得回归直线方程为,则m的值为()A.4.5 B.4.85 C.6.55 D.6.453. 某单位为了了解用电量(度)与气温(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下的对照表:由表中数据,得回归直线方程,若,则()18 13 10 -1气温(℃)用电量24 34 38 64A.60 B.58 C.62 D.644. 以下说法正确的是()①两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于;②回归直线方程必过点;③已知一个回归直线方程为,则变量每增加一个单位时,平均增加个单位A.③B.①③C.①②D.②③5. 已知x、y的取值如下表,从散点图可以看出y与x线性相关,且回归方程为,则a=()x 2 3 4 5y 2.5 3 4 4.5A.1.25 B.1.05 C.1.35 D.1.456. 某部门统计了某地区今年前7个月在线外卖的规模如下表:月份代号x 1 2 3 4 5 6 7在线外卖规模y(百万元)11 13 18 ★28 ★35其中4、6两个月的在线外卖规模数据模糊,但这7个月的平均值为23.若利用回归直线方程来拟合预测,且7月相应于点的残差为,则()A.1.0 B.2.0 C.3.0 D.4.0二、多选题7. 新能源汽车的核心部件是动力电池,碳酸锂是动力电池的主要成分.从2021年底开始,碳酸锂的价格一直升高,下表是2022年我国某企业前5个月购买碳酸锂价格与月份的统计数据.月份代码x 1 2 3 4 5碳酸锂价格y0.5 0.8 1 1.2 1.5若y关于x的经验回归方程为,则下列说法中正确的有()A.y与x的样本相关系数B.C.经验回归方程经过点D.由经验回归方程可预测6月份的碳酸锂价格约为1.848. 某工厂的某产品的产量(千件)与单位成本(元)满足线性回归方程,则( )A.产量每增加1千件,单位成本约下降1.82元B.产量每减少1千件,单位成本约下降1.82元C.当产量为1千件时,单位成本为75.54元D.当产量为2千件时,单位成本约为73.72元三、填空题9. 假如女儿的身高y(单位:cm)关于父亲身高x(单位:cm)的线性回归方程是,已知父亲身高为175cm,则估计女儿的身高为______cm.(结果精确到整数)10. 已知与之间的一组数据:0 1 33 7根据数据可求得关于的线性回归方程为,则的值为_______.11. 已知、的取值如下表所示,从散点图分析可知与线性相关,如果线性回归方程为,那么表格中的数据的值为_________.12. 某单位为了制定节能减排的目标,先调查了用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温(℃)18 13 10 -1用电量(度)24 34 38 64由表中数据,得线性回归方程,当气温为-5℃时,预测用电量的度数约为______.四、解答题13. 某研究机构对高三学生的记忆力X和判断力Y进行统计分析,得下表数据:X 6 8 10 12Y 2 3 5 6(1)根据上表中的数据画出散点图;(2)如果近似量存在线性关系,请画出一条直线来近似地表示这种线性关系;(3)根据直线拟合预测记忆力为9的同学的判断力.14. 碳中和是指国家、企业、产品、活动或个人在一定时间内直接或间接产生的二氧化碳或温室气体排放总量,通过植树造林、节能减排等形式,以抵消自身产生的二氧化碳或温室气体排放量,实现正负抵消,达到相对"零排放."2020年9月22日,中国政府在第七十五届联合国大会上提出:"中国将提高国家自主贡献力度,采取更加有力的政策和措施,二氧化碳排放力争于2030年前达到峰值,努力争取2060年前实现碳中和.某工厂响应国家号召,随着对工业废气进行处理新技术不断升级,最近半年二氧化碳排放量逐月递减,具体数据如下表:月份序号 1 2 3 4 5 6碳排放量(吨)100 70 50 35 25 20并计算得.(1)这6个月中,任取2个月,求已知其中1个月的碳排放量低于6个月碳排放量的平均值的条件下,另1个月碳排放量高于6个月碳排放量的平均值的概率;(2)若用函数模型对两个变量月份与排放量进行拟合,根据表中数据,求出关于的回归方程.附:对于同一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为:15. 某地有一企业2007年建厂并开始投资生产,年份代号为7,2008年年份代号为8,依次类推.经连续统计9年的收入情况如下表(经数据分析可用线性回归模型拟合与的关系):年份代号()7 8 9 10 11 12 13 14 15当年收入(千万元)13 14 18 20 21 22 24 28 29(1)求关于的线性回归方程;(2)试预测2020年该企业的收入.(参考公式:,)16. 为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前次考试的数学成绩、物理成绩进行分析.下面是该生次考试的成绩.数学88 83 117 92 108 100 112物理94 91 108 96 104 101 106(1)他的数学成绩与物理成绩哪个更稳定?请给出你的理由;(2)已知该生的物理成绩与数学成绩是线性相关的,若该生的物理成绩达到分,请你估计他的数学成绩大约是多少?(参考公式:,)。
(完整版)数学必修三回归分析经典题型(带答案)

数学必修三回归分析经典题型1.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为93.7319.7ˆ+=x y用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ) A.身高一定是145.83cm B.身高在145.83cm 以上 C.身高在145.83cm 以下 D.身高在145.83cm 左右 【答案】D【解析】解:把x=10代入可以得到预测值为145.83,由于回归模型是针对3-9岁的孩子的,因此这个仅仅是估计值,只能说左右,不能说在上或者下,没有标准。
选D2.对有线性相关关系的两个变量建立的线性回归方程$y =$a+b $x ,关于回归系数b $,下面叙述正确的是________.①可以小于0;②大于0;③能等于0;④只能小于0. 【答案】①【解析】由b$和r 的公式可知,当r =0时,这两变量不具有线性相关关系,但b 能大于0也能小于0.3.对具有线性相关关系的变量x 、y 有观测数据(x i ,y i )(i =1,2,…,10),它们之间的线性回归方程是$y =3x +20,若101i i x =∑=18,则101i i y =∑=________.【答案】254【解析】由101i i x =∑=18 1.8.因为点在直线$y =3x +2025.4. 所以101i i y =∑=25.4×10=254.4.下表是某厂1~4由散点图可知,用水量其线性回归直线方程是y =-0.7x +a ,则a 等于________. 【答案】5.252.53.5,∵回归直线方程过定点, ∴3.5=-0.7×2.5+a. ∴a =5.25.5.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到线性回归方程$y =b$x +$a ,那么下列说法正确的是________.①直线$y =b$x +$a 必经过点(x ,y ); ②直线$y =b$x +$a 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点; ③直线$y =b$x +$a 的斜率为1221ni ii nii x ynx y xnx==--∑∑;④直线$y =b $x +$a 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差$21()ni i i b a y x =⎡⎤⎣⎦∑$-+是该坐标平面上的直线与这些点的最小偏差.【答案】①③④【解析】回归直线的斜率为b ,故③正确,回归直线不一定经过样本点,但一定经过样本中心,故①正确,②不正确.6.某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm. 【答案】185【解析】设父亲身高为173176,b$= $a=-b $ 176-1×173=3, ∴$y =x +3,当x =182时,$y =185.7.下表是关于宿州市服装机械厂某设备的使用年限(年)和所需要的维修费用y (万元)的几组统计数据:)请根据上表提供的数据,用最小二乘法求出y 关于的线性回归方程;(2)估计使用年限为10年时,维修费用为多少?【答案】解:(1)0.08 1.23yx =+线性回归方程为 (2)估计使用年限为10年时,维修费用为12.38万元. 【解析】(1)先求然后利用公可求出回归直线y ax b =+方程.(2)把x=10代入回归直线方程可得y 的值,就可得所求的值.解:(1906543222222512=++++=∑=i ixΘ又x y 23.108.0+=∴线性回归方程为 (2)把10=x 代入回归方程得到:38.121023.108.0=⨯+=y∴估计使用年限为10年时,维修费用为12.38万元.。
高二线性回归方程试题及答案

回归直线方程1、某公司为了解广告投入对销售收益的影响,在若干地区各投入万元广告费用,并将各地的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从开始计数的. [附:回归直线的斜率和截距的最小二乘估计公式分别为.] (1)根据频率分布直方图计算图中各小长方形的宽度;(2)试估计该公司投入万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值);(3)该公司按照类似的研究方法,测得另外一些数据,并整理得到下表:广告投入(单位:万元) 1 2 3 4 5 销售收益(单位:万元)2 3 27由表中的数据显示,与之间存在着线性相关关系,请将(2)的结果填入空白栏,并求出关于的回归直线方程.401221ˆˆˆ,ni ii nii x y nx ybay bx xnx ==-==--∑∑4x y x y y x2、某校在规划课程设置方案的调研中,随机抽取160名理科学生,想调查男生、女生对“坐标系与参数方程”与“不等式选讲”这两道题的选择倾向性,调研中发现选择“坐标系与参数方程”的男生人数与选择“不等式选讲”的总人数相等,且选择“坐标系与参数方程”的女生人数比选择“不等式选讲”的女生人数多25人,根据调()完成列联表,并判断在犯错误的概率不超过的前提下,能否认为选题与性 别有关.(Ⅰ)按照分层抽样的方法,从选择“坐标系与参数方程”与选择“不等式选讲”的学生中共抽取8人进行问卷.若从这8人中任选3人,记选择“坐标系与参数方程”与选择“不等式选讲”的人数的差为,求的分布列及数学期望. 附: ,其中.ξξE ξ()()()()()22n ad bc K a b c d a c b d -=++++n a b c d =+++3、面向全市招聘事业编工作人员,由人事、劳动、纪检等部门联合组织招聘考试,招聘考试分为两个阶段:笔试和面试.现将所有参赛选手参加笔试的成绩(得分均为整数,满分为100分)进行统计,制成如下频率分布表.(Ⅰ)求出上表中的x,y,z,s,p的值;(Ⅱ)按规定,笔试成绩不低于90分的应聘人员可以参加面试,且面试的方式采用单循环,以参加面试人员胜出的场数决定是否录用(即参加面试的所有人员中每两人必需进行一个场次的PK比赛).已知松山区有两名应聘人员取得面试资格,在所有的比赛中,求有松山区选手参加比赛的概率.答案1、某公司为了解广告投入对销售收益的影响,在若干地区各投入万元广告费用,并将各地的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从开始计数的. [附:回归直线的斜率和截距的最小二乘估计公式分别为.] (1)根据频率分布直方图计算图中各小长方形的宽度;(2)试估计该公司投入万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值);(3)该公司按照类似的研究方法,测得另外一些数据,并整理得到下表:广告投入(单位:万元) 1 2 3 4 5 销售收益(单位:万元)2 3 27由表中的数据显示,与之间存在着线性相关关系,请将(2)的结果填入空白栏,并求出关于的回归直线方程.解:(1)设各小长方形的宽度为,由频率分布直方图中各小长方形的面积总和为1,可知,故,即图中各小长方形的宽度为2. …3分(2)由(1)知各小组依次是, 其中点分别为,对应的频率分别为,故可估计平均值为.7分 (3)由(2)可知空白栏中填5.由题意可知, ,401221ˆˆˆ,ni ii nii x y nx ybay bx xnx ==-==--∑∑4x y x y y x m (0.080.10.140.120.040.02)0.51m m +++++⋅==2m =[0,2),[2,4),[4,6),[6,8),[8,10),[10,12]1,3,5,7,9,110.16,0.20,0.28,0.24,0.08,0.0410.1630.250.2870.2490.08110.045⨯+⨯+⨯+⨯+⨯+⨯=12345232573, 3.855x y ++++++++====,,根据公式,可求得 ………………10分, ………………11分 所以所求的回归直线方程为. ………………12分2、某校在规划课程设置方案的调研中,随机抽取160名理科学生,想调查男生、女生对“坐标系与参数方程”与“不等式选讲”这两道题的选择倾向性,调研中发现选择“坐标系与参数方程”的男生人数与选择“不等式选讲”的总人数相等,且选择“坐标系与参数方程”的女生人数比选择“不等式选讲”的女生人数多25人,根据调()完成列联表,并判断在犯错误的概率不超过的前提下,能否认为选题与性别有关.(Ⅰ)按照分层抽样的方法,从选择“坐标系与参数方程”与选择“不等式选讲”的学生中共抽取8人进行问卷.若从这8人中任选3人,记选择“坐标系与参数方程”与选择“不等式选讲”的人数的差为,求的分布列及数学期望. 附: ,其中.【解析】(Ⅰ)51122332455769i ii x y=⨯+⨯+⨯+⨯+⨯==∑522222211234555ii x==++++=∑26953 3.8121.2,555ˆ310b-⨯⨯===-⨯3.8 1.230ˆ.2a=-⨯= 1.20.2y x =+ξξE ξ()()()()()22n ad bc K a b c d a c b d -=++++n a b c d =+++,故不能认为选题与性别有关.…………………5分(Ⅱ)选择“坐标系与参数方程”与选择“不等式选讲”的人数比例为100:60=5:3, 所以抽取的8人中倾向“坐标系与参数方程”的人数为5,倾向“不等式选讲”的人 数为3.依题意,得,,,, . …………………9分 故的分布列如下:所以. …………………12分 3、面向全市招聘事业编工作人员 ,由人事、劳动、纪检等部门联合组织招聘考试,招聘考试分为两个阶段:笔试和面试.现将所有参赛选手参加笔试的成绩(得分均为整数,满分为100分)进行统计,制成如下频率分布表.(Ⅰ)求出上表中的x ,y ,z ,s ,p 的值;(Ⅱ)按规定,笔试成绩不低于90分的应聘人员可以参加面试,且面试的方式采用单循环,以参加面试人员胜出的场数决定是否录用(即参加面试的所有人员中每两人必需进行一个场次的 PK 比赛).已知松山区有两名应聘人员取得面试资格,在所有的比赛中,求有松山区选手参加比赛的概率. 解:(1)由题意知,参加招聘考试的人员共有p == 50人, ∴x == 0.18, 22160(9001800) 3.74 5.0241055510060K -=≈<⨯⨯⨯3,1,1,3=--ξ33381(3)56C P C =-==ξ12533815(1)56C C P C =-==ξ21533830(1)56C C P C ===ξ30533810(3)56C C P C ===ξξ115301033(1)135********E =-⨯+-⨯+⨯+⨯=ξ160.32950y = 50×0.38 = 19, Z = 50﹣9﹣19﹣16 = 6, S = = 0.12 ----------------------------------------------------------6分(Ⅱ)由(Ⅱ)知,参加面试的应聘人员共6人.若参加面试的6人分别记为:S 1 , S 2 , a , b , c , d .( 其中S 1 , S 2 表示松山区的参赛选手,a , b , c , d 表示其他旗、县的选手)则所有的比赛为: (S 1 , S 2 ) (S 1 , a ) (S 1 ,b ) (S 1 ,c ) (S 1 , d ) (S 2 , a ) (S 2 , b ) (S 2 , c ) (S 2 ,d ) (a , b ) ( a , c ) ( a , d ) ( b , c ) (b , d ) (c , d ) 共十五个场次的比赛,有松山区选手出现的比赛有9场. 若有松山区选手参加比赛的事件为:A 则P (A ) =-------------------------------12分65035。
最新苏教版高中数学必修三《线性回归方程》课时同步练习及解析.docx

(新课标)2018-2019学年苏教版高中数学必修三2.4 线性回归方程课时目标 1.理解两个变量的相关关系的概念.2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系.3.会求线性回归方程.1.与函数关系不同,相关关系是一种有关系,但不是确定性的关系.2.能用直线方程________近似表示的相关关系叫做线性相关关系,该方程叫______,给出一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),线性回归方程中的系数a ,b 满足⎩⎪⎨⎪⎧b = a =.上式还可以表示为⎩⎪⎨⎪⎧b = ,a = .一、填空题1.下列两个变量之间的关系,不是函数关系的为______.(填序号) ①匀速行驶车辆的行驶距离与时间; ②圆半径与圆的面积;③正n 边形的边数与内角度数之和; ④人的年龄与身高.2.下列有关线性回归的说法,不正确的是________.①变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;②在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图;③线性回归方程最能代表观测值x 、y 之间的关系; ④任何一组观测值都能得到具有代表意义的线性回归方程.3.工人月工资(元)依劳动生产率(千元)变化的线性回归方程为 =60+90x ,下列判断正确的是________.①劳动生产率为1千元时,工资为50元; ②劳动生产率提高1千元时,工资提高150元;③劳动生产率提高1千元时,工资约提高90元;④劳动生产率为1千元时,工资90元.4.某商品销售量y(件)与销售价格x(元/件)在实际生活中的回归方程可能是________.①=-10x+200;②=10x+200;③=-10x-200;④=10x-200.5.给出两组数据x、y的对应值如下表,若已知x、y是线性相关的,且线性回归方程:y=a+bx,经计算知:b=-1.4,则a=________.x 45678y 121098 66.线性回归方程表示的直线=a+bx必经过点____________.7.若对某个地区人均工资x与该地区人均消费y进行调查统计得y与x具有相关关系,且线性回归方程=0.7x+2.1(单位:千元),若该地区人均消费水平为10.5,则估计该地区人均消费额占人均工资收入的百分比约为________.8.设有一个回归方程=3-2.5x,当变量x增加一个单位时,变量y________个单位.9.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y对总成绩x的线性回归方程为=6+0.4x.由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差______分.二、解答题10.下表是某旅游区游客数量与平均气温的对比表:平均气温(℃)-1410131826数量(百个)202434385064若已知游客数量与平均气温是线性相关的,求回归方程.11.5个学生的数学和物理成绩(单位:分)如下表:学生A B C D E学科数学8075706560物理7066686462画出散点图,判断它们是否具有相关关系,若相关,求出回归方程.能力提升12.在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下:温度x(℃)010205070溶解度y 66.776.085.0112.3128.0则由此得到回归直线的斜率约为________.13.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据,如下表所示:x(0.01% )104181917714713415191204121y(min)10202118515513517205235125若由数据知y对x呈线性相关关系.(1)求线性回归方程.(2)预测当钢水含碳量为160时,应冶炼多少分钟?1.线性回归方程=bx+a中的系数a,b的计算公式为:⎩⎪⎨⎪⎧b =∑ni =1(x i -x )(y i -y )∑n i =1 (x i -x )2=∑ni =1x i y i -n x y ∑ni =1x 2i -n x 2a =y -b x其中:b 是回归方程的斜率,a 是截距. 2.回归方程的求解过程 计算x ,y ,∑ni =1x 2i ,∑ni =1x i y i ⇓计算b =∑ni =1x i y i -n x y ∑n i =1x 2i -n x 2,a =y -b x⇓3.在回归方程 =bx +a 中,当回归系数b >0时,说明两个变量呈正相关关系,它的意义是:当x 每增加一个单位时y 就增加b 个单位;当b <0时,说明两个变量呈负相关关系,它的意义是:当x 每增加一个单位时,y 就减少b 个单位.2.4 线性回归方程知识梳理2. =bx +a 线性回归方程 n ∑ni =1x i y i -(∑ni =1x i )(∑ni =1y i )n ∑ni =1x 2i -(∑ni =1x i )2y -b x∑ni =1x i y i -n x y ∑ni =1x 2i -n x2=∑ni =1(x i -x )(y i -y )∑ni =1(x i -x )2y -b x作业设计 1.④解析 人的年龄与身高具有相关关系. 2.④解析 只有所有的数据点都分布在一条直线附近时,才能得到回归直线. 3.③解析 因工人月工资与劳动生产率变化的线性回归方程为 =60+90x ,当x 由a 提高到a +1时, 2- 1=60+90(a +1)-60-90a =90. 4.①解析 ∵在实际生活中,当销售价格提高时,商品销售量一般要降低,∴排除②、④,又∵③中x>0时 <0不合题意,∴③错. 5.17.4 解析x =15(4+5+6+7+8)=6,y =15(12+10+9+8+6)=9.a =y -b x =9+1.4×6=9+8.4=17.4. 6.(x ,y )解析 由a =y -b x 得y =b x +a , 即点(x ,y )适合方程 =a +bx. 7.87.5%解析 设该地区人均工资收入为y , 则y =0.7x +2.1,当y =10.5时,x =10.5-2.10.7=12.10.512×100%=87.5%. 8.减少2.5解析′=3-2.5(x+1)=3-2.5x-2.5=-2.5,因此,y的值平均减少2.5个单位.9.20解析令两人的总成绩分别为x1,x2.则对应的数学成绩估计为=6+0.4x1,2=6+0.4x2,所以| 1-2|=|0.4(x1-x2)|=0.4×50=20.10.解x=706=353,y=2306=1153,∑6i=1x2i=1+16+100+169+324+676=1 286,∑6i=1x i y i=-20+96+340+13×38+18×50+26×64=3 474.b=∑6i=1x i y i-6x y∑6 i=1x2i-6x2=3 474-6×353×11531 286-6×(353)2≈1.68,a=y-b x≈18.73,即所求的回归方程为=1.68x+18.73.11.解以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为线性相关.列表,计算i 1 2 3 4 5x i80 75 70 65 60y i70 66 68 64 62x i y i 56004950476041603720x2i 64005625490042253600x=70,y=66,∑5i=1x2i=24 750,∑5i=1x i y i=23 190设所求回归方程为=bx+a,则由上表可得b=∑5i=1x i y i-5x y∑5 i=1x2i-5x2=90250=0.36,a =y -b x =40.8.∴所求回归方程为 =0.36x +40.8. 12.0.880 9 解析x =30,y =93.6,∑5i =1x 2i =7 900,∑5i =1x i y i =17 035,所以回归直线的斜率b =∑5i =1x i y i -5x y ∑5i =1x 2i -5x 2=17 035-5×30×93.67 900-4 500≈0.880 9.13.解 (1)列出下表,并用科学计算器进行计算: i 1 2 3 4 5 6 7 8 9 10 x i 104 180 190 177 147 134 150 191 204 121 y i 100 200 210 185 155 135 170 205 235 125 x i y i10400360003990032745227851809025500391554794015 125x =159.8,y =172,∑10i =1x 2i =265 448,∑10i =1y 2i =312 350,∑10i =1x i y i =287 640 设所求线性回归方程为 =bx +a ,b =∑10i =1x i y i -10x y∑10i =1x 2i -10x2≈1.27,a =y -b x ≈-30.95.即所求的线性回归方程为 =1.27x -30.95.(2)当x =160时, =1.27×160-30.95≈172(min ),即大约冶炼172 min .。
专题18 线性回归方程的应用(课时训练)解析版

专题18 线性回归方程的应用A 组 基础巩固1.(2021·全国高二专题练习(理))下列说法正确的是( ) A .两个变量的相关关系一定是线性相关B .两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于0C .在回归直线方程y =0.2x +0.8中,当解释变量x 每增加1个单位时,预报变量ˆy平均增加1个单位 D .对分类变量X 与Y ,随机变量K 2的观测值k 越大,则判断“X 与Y 有关系”的把握程度越大 【答案】D 【分析】根据独立性检验的概念以及基本思想即可得出选项. 【详解】A ,两个变量的相关关系有线性相关或非线性相关,故A 错误;B ,两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1,故B 错误;C ,在回归直线方程y =0.2x +0.8中,当解释变量x 每增加1个单位时,预报变量ˆy平均增加0.2个单位,故C 错误; D ,由独立性检验知“判断‘X 与Y 有关系’的把握程度越大”正确, 故选:D .2.(2021·山东临沂市·高三二模)在天文学上恒星的亮度一般用星等来表示,直接测量到的天体亮度被称为视星等m ,而把天体置于10秒差距的距离处所得到的视星等称为绝对星等M ,它能反映天体的发光本领.如果我们观测到了恒星的光谱,可以知道一些类型恒星的绝对星等,就可以利用光谱视差法来获得这些恒星的距离.下表是某校天文爱好者社团在网上收集到一些恒星的相关数据,那么最适合作为星等差y 关于距离x (光年)的回归方程类型的是( )A .2y a bx =+B .lg =+y a b xC .y a =+D .y a bx =+【答案】B 【分析】由表格数据在直角坐标系中标注点坐标,勾画出大概图象,对比2,lg x x x 的图象,即可知其回归方程类型. 【详解】根据表格数据,在直角坐标系中从左至右依次标注表格数据代表的点,拟合曲线如下图示,图象左侧无限靠近y 轴,不与y 轴相交,故其拟合曲线比较接近lg y x =的图象, 故选:B.3.(2021·四川宜宾市·高三三模(文))我校实验二部数学学习兴趣小组为研究某作物种子的发芽率y 和温度x (单位:C ︒)的关系,由实验数据得到右面的散点图. 由此散点图,最适宜作为发芽率y 和温度x 的回归方程类型的是 ( )A .y a bx =+B .ln y a b x =+C .e x y a b =+D .2y a bx =+【答案】B 【分析】先利用散点图判断增长状态,再逐个分析选项是否合适即可. 【详解】由散点图可见,数据分布成递增趋势,但是呈现上凸效果,即增加缓慢. A 中,y a bx =+是直线型,均匀增长,不符合要求; B 中,ln y a b x =+是对数型,增长缓慢,符合要求;C 中,e x y a b =+是指数型,爆炸式增长,增长快,不符合要求;D 中,2y a bx =+是二次函数型,图象呈现下凸,增长也较快,不符合要求. 故对数型最适宜该回归模型. 故选:B.4.(2021·全国高三专题练习(文))某公司由于改进了经营模式,经济效益与日俱增.统计了2018年10月到2019年4月的纯收益y (单位:万元)的数据,如下表:得到y 关于t 的线性回归方程为 4.7551.36y t =+.请预测该公司2019年6月的纯收益为( ) A .万元 B .98.86万元 C .103.61万元 D .108.36万元【答案】C 【分析】根据表格可得6月对应的代码为11t =,代入线性回归方程即可得到答案.【详解】将2019年6月代号11t =带入题中的线性回归方程,得 4.751151.36103.61y =⨯+=.故选:C . 【点睛】本题主要考查线性回归方程的应用,属于基础题.5.(2020·全国高二课时练习)“关注夕阳、爱老敬老”—某马拉松协会从2013年开始每年向敬老院捐赠物资和现金.下表记录了第x 年(2013年是第一年)与捐赠的现金y (万元)的对应数据,由此表中的数据得到了y 关于x 的线性回归方程,则预测2019年捐赠的现金大约是A .5万元B .5.2万元C .5.25万元D .5.5万元【答案】C 【分析】由已知求出,x y ,代入回归直线的方程,求得m ,然后取7x =,求得y 的值,即可得到答案. 【详解】由已知得,,所以样本点的中心点的坐标为,代入, 得3.5 4.50.35m =+,即0.7m =,所以,取7x =,得ˆ0.770.35 5.25y=⨯+=, 预测2019年捐赠的现金大约是5.25万元. 【点睛】本题主要考查了线性回归方程以及应用,其中解答中熟记回归直线的方程经过样本中心点是解答的关键,着重考查了推理与计算能力,属于基础题.6.(2020·全国高三专题练习)为研究某种细菌在特定环境下,随时间变化的繁殖情况,得到如下实验数据:由最小二乘法得y 与x 的线性回归方程为,则当7x =时,繁殖个数y 的预测值为 A .4.9 B .5.25 C .5.95 D .6.15【答案】B 【分析】根据表格中的数据,求得样本中心为,代入回归直线方程,求得ˆ0.35a =,得到回归直线的方程为,即可作出预测,得到答案. 【详解】由题意,根据表格中的数据,可得, 即样本中心为,代入回归直线方程,即79ˆ0.722a=⨯+, 解得ˆ0.35a =,即回归直线的方程为,当7x =时,ˆ0.770.35 5.25y=⨯+=,故选B . 【点睛】本题主要考查了回归直线方程的应用,其中解答中熟记回归直线方程的特征,求得回归直线的方程是解答的关键,着重考查了运算与求解能力,属于基础题.7.(2018·全国高一课时练习)登山族为了了解某山高y (km)与气温x (℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表: 气温x (℃) 18 13 10 -1山高y (km)24343864由表中数据,得到线性回归方程ˆy=-2x+ˆa (ˆa ∈R),由此估计出山高为72(km)处的气温为_____℃. 【答案】-6 【解析】由题意可得x =10,y =40,所以ˆay =+2x =40+2×10=60,所以ˆy =-2x+60,当ˆy =72时,-2x+60=72,解得x=-6.8.(2018·全国高一课时练习)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验收集到的数据如下表: 零件数x 10 20 30 40 50 加工时间y/min 62758189由最小二乘法求得回归方程为ˆy=0.67x+54.9,现发现表中有一个数据模糊不清,请你推断出该数据的值为_____. 【答案】68 【解析】由于回归直线方程过样本中心点,,代入回归直线方程得3070.673054.95a+=⨯+,解得68a =,故填68. 9.(2017·商丘市第一高级中学高二月考(文))某城市2007年到2011年人口总数与年份的关系如表所示.据此估计2017年该城市人口总数_____.(参考数据和公式: ˆˆˆ3.2,b a y bx==-)【答案】35.6 【解析】2x =,10y =,5222222i 00123430ix==++++=∑,故y 关于x 的线性回归方程为 当10x =时,10.(2017·河南洛阳市·高二期末(文))某企业想通过做广告来提高销售额,经预测可知本企业产品的广告费x (单位:百万元)与销售额y (单位:百万元)之间有如下对应数据:由表中的数据得线性回归方程为,其中ˆ 6.5b=,由此预测当广告费为7百万元时,销售额为__________万元. 【答案】63 【解析】根据已知数据可知:2456830406050705,5055x y ++++++++====.50 6.5517.5ˆˆay bx =-=-⨯=. .当7x =时,ˆ63y=. 11.(2021·全国高三其他模拟)2020年全面建成小康社会取得伟大历史成就,决战脱贫攻坚取得决定性胜利.某市积极探索区域特色经济,引导商家利用多媒体的优势,对本地特产进行广告宣传,取得了社会效益和经济效益的双丰收,某商家统计了7个月的月广告投入x (单位:万元)与月销量y (单位:万件)的数据如表所示:(1)已知可用线性回归模型拟合y 与x 的关系,请用相关系数加以说明,并求y 关于x 的线性回归方程; (2)根据(1)的结论,预计月广告投入大于多少万元时,月销量能突破70万件. 参考数据:()()71150i i i x xy y =--=∑,()721820i i y y=-=∑,.参考公式:相关系数;回归直线的斜率和截距的最小二乘估计分别为()()()121nii i nii xx y yb xx==--=-∑∑,.【答案】(1)相关系数0.99r ≈,线性回归模型能够很好地拟合y 与x 的关系;;(2)9.04万元. 【分析】(1)现根据题中数据求得相关系数0.99r ≈,从而说明线性回归模型能够很好地拟合y 与x 的关系,再根据题中数据求得b 和a ,进而求得回归方程; (2)解不等式70y >即可求出结果. 【详解】(1)由题意,知, ∴()()()()()()()7222222211424344455464i i x x=-=-+-+-+-+-+-∑()27428+-=.结合()()71150iii x x y y =--=∑,()721820ii y y =-=∑可得,相关系数()()737.50.9937.88iix x y y r --===≈≈∑,显然y 与x 的线性相关程度相当高,从而线性回归模型能够很好地拟合y 与x 的关系. 易知,28323545 495260437y ++++++==,∴75151434147a y bx =-=-⨯=. ∴y 关于x 的线性回归方程为. (2)若月销量突破70万件,则, 解得2269.0425x >=. 故当月广告投入大于9.04万元时,月销量能突破70万件. 【点睛】易错点睛:解决有关线性回归方程问题时需要特别注意:回归直线的斜率b 是线性回归方程中x 的系数,在应用公式及将数据代入线性回归方程时,不要把回归直线的斜率b 与截距a 搞混.12.(2021·福建厦门市·厦门外国语学校高三其他模拟)根据国际疫情形势以及传染病防控的经验,加快新冠病毒疫苗接种是当前有力的防控手段,我国正在安全、有序加快推进疫苗接种工作,某乡村采取通知公告、微信推送、广播播放、条幅宣传等形式,积极开展疫苗接种社会宣传工作,消除群众疑虑,提高新冠疫苗接种率,让群众充分地认识到了疫苗接种的重要作用,自宣传开始后村干部统计了本村200名居民(未接种)5天内每天新接种疫苗的情况,得如下统计表:(1)建立y 关于x 的线性回归方程;(2)预测该村80%居民接种新冠疫苗需要几天?参考公式:回归方程中斜率和截距的最小二乘估计公式分别为: ,. 【答案】(1);(2). 【分析】(1)本题首先可以求出x 、,然后求出b 、a ,即可求出y 关于x 的线性回归方程; (2)本题可设,数列的前n 项和为n S ,然后根据等差数列求和公式得出21185nS n n ,最后求出6S 、7S ,即可得出结果.【详解】 (1),,则,222919355a=-⨯=,故y关于x的线性回归方程.(2)20080160%=,设,数列的前n项和为n S,易知数列是等差数列,则,因为6127.2S,7163.8S,所以预测该村80%居民接种新冠疫苗需要天.【点睛】关键点点睛:本题考查线性回归方程的求法以及实际应用,能否根据表中数据求出b、a是解决本题的关键,考查等差数列求和公式的应用,考查计算能力,是中档题.B 组 能力提升14.(多选题)(2021·全国高三专题练习)2020年初以来,5G 技术在我国已经进入高速发展的阶段,5G 手机的销量也逐渐上升,某手机商城统计了近5个月来5G 手机的实际销量,如下表所示:若y 与x 线性相关,且求得线性回归方程为455y x =+,则下列说法正确的是( ) A .147a = B .y 与x 正相关C .y 与x 的相关系数为负数D .8月份该手机商城的5G 手机销量约为36.5万部 【答案】AB 【分析】计算出销量的平均数,利用总销量可得a 值;由回归方程中的x 的系数为正可知,y 与x 正相关;将7x =代入,可得8月份该手机商城的5G 手机销量.【详解】由表中数据,计算得()11234535x =⨯++++=,所以4535140y =⨯+=, 于是得,解得147a =,故A 正确;由回归方程中的x 的系数为正可知,y 与x 正相关,且其相关系数0r >,故B 正确,C 错误; 8月份时,7x =,32y =(万部),故D 错误. 故选:AB . 【点睛】本题考查两个变量的线性相关关系,考查了线性回归方程的应用,考查学生逻辑推理能力,属于中档题. 15.(多选题)(2020·济南市章丘区第四中学)给出下列命题,其中正确的命题有( )A .设具有相关关系的两个变量x ,y 的相关系数为r ,则越接近于0,x ,y 之间的线性相关程度越高B .随机变量2(3)~,2X N ,若23X η=+,则()1D η=C .公共汽车上有10位乘客,沿途5个车站,乘客下车的可能方式有510种D .回归方程为中,变量y 与x 具有正的线性相关关系,变量x 增加1个单位时,y 平均增加0.85个单位 【答案】BD 【分析】A.根据相关系数的应用,即可做出判断;B.由正态分布可知,()3E X =,()4D X =,且,计算()D η的值;C.根据分步计数原理直接计算结果;D.根据回归方程的形式,即可做出判断. 【详解】A.设具有相关关系的两个变量,x y 的相关系数为r ,则越接近于0,,x y 之间的线性相关程度越弱,故A 不正确;B. 随机变量2(3)~,2X N ,则()3E X =,()4D X =,若23X η=+,则,得()1D η=,故B 正确;C.由分步计数原理可知,每位乘客下车方法有5种,所以乘客下车的可能方式有105种,故C 不正确;D.由回归方程的形式可知,,变量y 与x 具有正的线性相关关系,变量x 增加1个单位时,y 平均增加0.85个单位,故D 正确. 故选:BD 【点睛】本题考查回归方程,分步计数原理,正态分布方差的性质,以及相关系数的辨析,属于基础题型. 16.(2021·重庆高三三模)近几年,快递业的迅速发展导致行业内竞争日趋激烈.某快递网点需了解一天中收发一件快递的平均成本y (单位:元)与当天揽收的快递件数x (单位:千件)之间的关系,对该网点近5天的每日揽件量i x (单位:千件)与当日收发一件快递的平均成本i y (单位;元)(i =1,2,3,4,5)数据进行了初步处理,得到下面的散点图及一些统计量的值.表中1i i w x =,5115i i w w ==∑.(1)根据散点图判断,y a bx =+与dy c x=+哪一个适宜作为y 关于x 的回归方程类型?并根据判断结果及表中数据求出y 关于x 的回归方程;(2)各快递业为提高快递揽收量并实现总利润的增长,除了提升服务质量、提高时效保障外,价格优惠也是重要策略之一.已知该网点每天揽收快递的件数x (单位:千件)与单件快递的平均价格t (单位;元)之间的关系是,收发一件快递的利润等于单件的平均价格减去平均成本,根据(1)中建立的回归方程解决以下问题:①预测该网点某天揽收2000件快递可获得的总利润;②单件快递的平均价格t 为何值时,该网点一天内收发快递所获利润的预报值最大?附:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线的斜率和截距的最小二乘估计分别为,v u αβ=-.【答案】(1)dy c x =+适宜作为y 关于x 的回归方程类型,回归方程为4 3.5y x=+;(2)①总利润约为12000元;②平均价格t 为8元. 【分析】(1)点不在一条直线的近旁,但与双曲线类似,可得回归曲线类型.令1w x=,根据已知数据求得回归方程y c dw =+,即可得结论.(2)①利用(1)的结论求出利润函数,令2x =可得估计利润值;②由二次函数性质可得. 【详解】解:(1)dy c x=+适宜作为y 关于x 的回归方程类型. 令1w x=,则y dw c =+, 2.02840.507d ==,5.1640.415 3.5c y d w =-⋅=-⨯=,∴4 3.5y w =+,即所求回归方程为43.5y x=+; (2)设收发x 千件快递获利z 千元,则,[]1,15x ∈,①当2x =时,12z =,故该网点某天揽收2000件快递可获得的总利润约为12000元; ②()2173922z x =--+,∴当9x =即8t =时,z 取最大值,故单件快递的平均价格t 为8元时,该网点一天内收发快递所获利润的预报值最大.17.(2021·安徽蚌埠市·蚌埠二中高三其他模拟(文))自从新型冠状病毒爆发以来,美国疫情持续升级,以下是美国2020年4月9日-12月14日每隔25天统计1次共计11次累计确诊人数(万).(1)将4月9日作为第1次统计,若将统计时间序号作为变量x ,每次累计确诊人数作为变量x ,得到函数关系,对上表的数据作初步处理,得到部分数据已作近似处理的一些统计量的值6x =,603.09y =,1111ln 5.9811i i y ==∑,()()11115835.70i ii x y xy =--=∑,()1121110ii x x =-=∑,()1121ln ln 11.90i i y y=-=∑,, 4.0657.97e ≈, 4.0758.56e ≈, 4.0859.15e ≈,根据相关数据,确定该函数关系式(参数a ,b 的取值精确到0.01);(2)为了了解患新冠肺炎与年龄的关系,已知某地曾患新冠肺炎的老年、中年、青年的人数分别为45人,30人,15人,按分层抽样的方法随机抽取6人进行问卷调查,再从6人中随机抽取2人进行调查结果对比,求这2人中至少有一人是老年人的概率. 参考公式:线性回归方程中,,; 【答案】(1)0.3258.56x y e =;(2)45. 【分析】(1)由已知函数,两边到自然对数可得,再计算b ,ln a ,可得函数方程.(2)先由分层抽样的方法求得老年、中年、青年分别抽取的人数,运用列举法和古典概率公式可求得答案. 【详解】(1)因为,所以, 由已知得,, 4.0758.56a e =≈,∴所求函数方程为0.3258.56x y e =.(2)从90人中按照分层抽样的方法随机抽取6人, 老年、中年、青年分别抽取的人数为3人,2人,1人,记3个老年人为1A ,2A ,3A ,2个中年人为1B ,2B ,1个青年人为1C , 抽取的全部结果为,,,,,,,,,,,,,,共15种. 至少1人是老年人的有,,,,,,,,,,,,共12种. 所以至少1人是老年人的概率为124155p ==. 【点睛】关键点睛:本题考查线性回归方程的应用,分层抽样,古典概率的求解,关键在于正确地理解线性回归方程的意义,准确地运用古典概率公式.。
数学必修3自主练习 :2.4线性回归方程 含解析 精品

自主广场我夯基 我达标1.相关关系与函数关系的区别是_________.思路解析:考查函数关系和相关关系的含义.答案:函数关系是两个变量之间有完全确定的关系,而相关关系是两个变量之间并没有严格的确定关系,当一个变量变化时,另一变量的取值有一定的随机性 2.线性回归方程y=bx+a 过定点__________.思路解析:考查线性回归方程的意义,及点与直线的位置关系的判断.由线性回归直线方程的推导过程不难发现直线恒过定点(x ,y ).答案:(x ,y )3.工人工资(元)依劳动生产率(千元)变化的回归方程为y ˆ=50+80x ,下列判断正确的是( ) A .劳动生产率为1 000元时,工资为130元B .劳动生产率提高1 000元时,工资大约提高80元C .劳动生产率提高1 000元时,工资提高大约130元D .当月工资250元时,劳动生产率为2 000元思路解析:考查了直线斜率的实际意义,即k=.x x y y xy1212∆∆==--横坐标的增量纵坐标的增量答案: B4.设有一个直线回归方程为yˆ=2-1.5x ,则变量x 增加一个单位( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位C .y 平均减少1.5个单位D .y 平均减少2个单位思路解析:考查了直线斜率的实际意义,即k=.x x y y xy1212∆∆==--横坐标的增量纵坐标的增量答案: C5.下列两个变量之间的关系不是函数关系的是( )A .角度和它的余弦值B .正方形边长和面积C .正n 边形的边数和它的内角和D .人的年龄和身高思路解析:本题主要考查相关关系的概念.由函数的定义可知A 、B 、C 三项中的两个变量间的关系均为函数关系,故答案为D.答案: D 6.已知样本容量为11,计算得∑=111i ix=510,∑=111i iy=214,∑=1112i ix=36 750,∑=1112i iy=5422,∑=111i ii yx =13 910,则y 对x 的回归方程为__________.思路解析:考查线性回归方程的求法.在回归方程中b=. x b ,x x n y x y x n ni i n i i ni i n i i n i i i -=--∑∑∑∑∑=====y a )())((2112111答案:y=5.34+0.3x7.部分国家13岁学生数学测验平均分数见下表.试作出该数据的散点图,并由图判断是否存在回归直线.若有,试求出直线方程.思路解析:考查了用回归直线方程进行拟合的一般步骤.用回归直线方程进行拟合的一般步骤为:作出散点图;判断散点是不是在一条直线的附近;若散点在一条直线的附近,利用公式求出回归直线方程.答案:(图略)存在回归直线方程,回归直线方程是y=0.313 3x+0.900 1.我综合 我发展8.一个工厂在某年每月产品的总成本y(万元)与该月产量x(万件)之间的一组数据如下:试作出该数据的散点图,并求总成本y 与月产量x 之间的回归直线方程. 思路解析:考查了回归直线方程的求法. 答案:(图略)回归直线方程是y ˆ=1.215x +0.974.9.对于线性相关系数r ,叙述正确的是( )A .|r|∈(0,+∞),|r|越大,相关程度越大;反之,相关程度越小B .r ∈(-∞,+∞),r 越大,相关程度越大;反之,相关程度越小C .|r|≤1,且|r|越接近于1,相关程度越大,|r|越接近于0,相关程度越小D .以上说法都不对思路解析:考查了线性相关程度的判断方法.|r|≤1,且|r|越接近于1,相关程度越大,|r|越接近于0,相关程度越小.答案: C我创新 我超越10.改革开放以来,我国高等教育事业有了迅速发展.这里我们得到了某省从1990~2000年18~24岁的青年人每年考入大学的百分比,我们把农村、乡镇和城市分开统计.为了便于计算,把1990年编号为0,1991年编号为1,…,2000年编号为10.如果把每年考入大学的百分比作为因变量,把年份从0到10作为自变量进行回归分析,可得到下面三条回归直线:城市yˆ=9.50+2.84x,乡镇yˆ=6.76+2.32x,农村yˆ=1.80+0.42x.(1)在同一坐标系内作出三条回归直线.(2)对于农村青年来讲,系数等于0.42意味着什么?(3)在这一阶段,三个组哪一个的大学入学率年增长最快?(4)请查阅我国人口分布的有关资料,选择一个在高等教育发展上有代表性的省,以这个省的大学入学率作为样本,说明我国在1991~2000年10年间大学入学率的总体发展情况.思路解析:考查了直线方程的画法,直线斜率的实际意义及解决问题和分析问题的能力.答案:(1)图略.(2)对于农村青年来讲,系数等于0.42意味着考入大学的百分比增长较慢.(3)城市组.(4)略.。
高中数学回归分析精选题

回归分析精选题20道一.选择题(共12小题)1.设某大学的女生体重y (单位:)k g 与身高x (单位:)cm 具有线性相关关系,根据一组样本数据(i x ,)(1i y i=,2,⋯,)n ,用最小二乘法建立的回归方程为ˆ0.8585.71y x =-,则下列结论中不正确的是()A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,)yC .若该大学某女生身高增加1c m ,则其体重约增加0.85k gD .若该大学某女生身高为170c m ,则可断定其体重必为58.79k g2.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是()A .ˆ10200yx =-+ B .ˆ10200yx =+ C .ˆ10200yx =-- D .ˆ10200yx =-3.有一散点图如图所示,在5个(,)x y 数据中去掉(3,10)D 后,下列说法正确的是( )A .残差平方和变小B .相关系数r 变小C .相关指数2R 变小D .解释变量x 与预报变量y 的相关性变弱4.在线性回归模型中,分别选择了4个不同的模型,它们的相关指数2R 依次为0.36、0.95、0.74、0.81,其中回归效果最好的模型的相关指数2R 为( )A .0.95B .0.81C .0.74D .0.365.已知四个命题:①在回归分析中,2R 可以用来刻画回归效果,2R 的值越大,模型的拟合效果越好; ②在独立性检验中,随机变量2K 的值越大,说明两个分类变量有关系的可能性越大;③在回归方程ˆ0.212yx =+中,当解释变量x 每增加1个单位时,预报变量ˆy平均增加1个单位;④两个随机变量相关性越弱,则相关系数的绝对值越接近于1; 其中真命题是( )A .①④B .②④C .①②D .②③6.某地区植被被破坏,土地沙化越来越严重,最近三年测得沙漠面积增加值分别为0.2万公顷、0.39万公顷和0.78万公顷,则沙漠面积增加数y (万公顷)关于年数x (年)的函数关系较为接近的是( )A .0.2yx= B .20.10.1y x x=+ C .40.2lo g yx=+ D .210xy=7.对于给定的样本点所建立的模型A 和模型B ,它们的残差平方和分别是212,,a a R 的值分别为1b ,2b ,下列说法正确的是( )A .若12a a <,则12b b <,A 的拟合效果更好 B .若12a a <,则12b b <,B 的拟合效果更好 C .若12a a <,则12b b >,A 的拟合效果更好 D .若12a a <,则12b b >,B 的拟合效果更好8.下列结论正确的是( )①函数关系是一种确定性关系; ②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法; ④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. A .①②B .①②③C .①②④D .①②③④9.某车间加工零件的数量x 与加工时间y 的统计数据如表:现已求得上表数据的回归方程ˆˆˆy bx a =+中的ˆb 值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为( )A .84分钟B .94分钟C .102分钟D .112分钟10.两个变量y与x的回归模型中,分别选择了4个不同模型,它们对应的22121()1()ni i i ni i y y Ry y ==-=--∑∑的值如下,其中拟合效果最好的模型是()A .模型1对应的20.48R =B .模型3对应的20.15R =C .模型2对应的20.96R =D .模型4对应的20.30R =11.对于回归分析,下列说法错误的是( )A .在残差图中,纵坐标表示残差B .若散点图中的一组点全部位于直线ˆ32yx =-+的图象上,则相关系数1r =C .若残差平方和越小,则相关指数2R 越大D .在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定 12.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( )A .总偏差平方和B .残差平方和C .回归平方和D .相关指数二.多选题(共1小题)13.下列有关回归分析的结论中,正确的有()A .运用最小二乘法求得的回归直线一定经过样本点的中心(x ,)yB .若相关系数r 的绝对值越接近于1,则相关性越强C .若相关指数2R 的值越接近于0,表示回归模型的拟合效果越好D .在残差图中,残差点分布的带状区域的宽度越窄,说明模型拟合的精度越高 三.填空题(共4小题)14.某商店统计了最近6个月某商品的进价x 与售价y (单位:元)的对应数据如表:假设得到的关于x 和y 之间的回归直线方程是ˆˆˆy bx a =+,那么该直线必过的定点是 .15.对具有线性相关关系的变量x ,y ,测得一组数据如表:根据上表,利用最小二乘法得它们的回归直线方程为ˆˆ10.5y x a=+,据此模型预测,当10x=时,y 的估计值是16.已知x 与y 之间的一组数据:已求得关于y 与x 的线性回归方程ˆ 2.10.85y x =+,则m 的值为 .17.对某城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查后知,y 与x 具有线性相关关系,满足回归方程0.6 1.5yx =+,若该城市居民人均消费水平为7.5(千元),则可以估计该城市人均消费额占人均工资收入的百分比约为 . 四.解答题(共3小题)18.某同学在生物研究性学习中想对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从这5天中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 均不小于25的概率.(2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另三天的数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?(参考公式:1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-19.随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x 与所支出的总费用y(万元)有如下的数据资料:(1)在给出的坐标系中做出散点图;(2)求线性回归方程ˆˆˆybx a =+中的ˆa、ˆb ; (3)估计使用年限为10年时,车的使用总费用是多少?(最小二乘法求线性回归方程系数公式1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-.20.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:(1)画散点图;(2)如果y对x有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为89个,那么机器的运转速度应控制在什么范围内?(参考数值:511380 i iix y==∑,521145)iix==∑回归分析精选题20道参考答案与试题解析一.选择题(共12小题)1.设某大学的女生体重y (单位:)k g 与身高x (单位:)cm 具有线性相关关系,根据一组样本数据(i x ,)(1i y i=,2,⋯,)n ,用最小二乘法建立的回归方程为ˆ0.8585.71y x =-,则下列结论中不正确的是()A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,)yC .若该大学某女生身高增加1c m ,则其体重约增加0.85k gD .若该大学某女生身高为170c m ,则可断定其体重必为58.79k g【分析】根据回归方程为ˆ0.8585.71yx =-,0.85>,可知A ,B ,C 均正确,对于D 回归方程只能进行预测,但不可断定. 【解答】解:对于A ,0.85>,所以y 与x 具有正的线性相关关系,故正确;对于B ,回归直线过样本点的中心(x ,)y ,故正确;对于C ,回归方程为ˆ0.8585.71yx =-,∴该大学某女生身高增加1c m ,则其体重约增加0.85k g,故正确;对于D ,170xc m=时,ˆ0.8517085.7158.79y =⨯-=,但这是预测值,不可断定其体重为58.79k g,故不正确故选:D .【点评】本题考查线性回归方程,考查学生对线性回归方程的理解,属于中档题. 2.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是()A .ˆ10200yx =-+ B .ˆ10200yx =+ C .ˆ10200yx =-- D .ˆ10200yx =-【分析】本题考查的知识点是回归分析的基本概念,根据某商品销售量y (件)与销售价格x(元/件)负相关,故回归系数应为负,再结合实际进行分析,即可得到答案.【解答】解:由x 与y 负相关, 可排除B 、D 两项,而C 项中的ˆ102000yx =--<不符合题意.故选:A .【点评】两个相关变量之间的关系为正相关关系,则他们的回归直线方程中回归系数为正;两个相关变量之间的关系为负相关关系,则他们的回归直线方程中回归系数为负.3.有一散点图如图所示,在5个(,)D后,下列说法正确的是()x y数据中去掉(3,10)A.残差平方和变小B.相关系数r变小C.相关指数2R变小D.解释变量x与预报变量y的相关性变弱【分析】利用散点图分析数据,判断相关系数,相关指数,残差的平方和,的变化情况.【解答】解:从散点图可分析得出:只有D点偏离直线远,去掉D点,变量x与变量y的线性相关性变强,相关系数变大,相关指数变大,残差的平方和变小,故选:A.【点评】本题考查了利用散点图分析数据,判断变量的相关性问题,属于运用图形解决问题的能力,属于容易出错的题目.4.在线性回归模型中,分别选择了4个不同的模型,它们的相关指数2R依次为0.36、0.95、0.74、0.81,其中回归效果最好的模型的相关指数2R为()A.0.95B.0.81C.0.74D.0.36【分析】根据两个变量y与x的回归模型中,它们的相关指数2R越接近于1,这个模型的拟合效果就越好,由此选出选项中的答案.【解答】解:两个变量y与x的回归模型中,它们的相关指数2R越接近于1,这个模型的拟合效果就越好,在所给的四个选项中0.95是相关指数最大的值,∴其拟合效果也最好.故选:A.【点评】本题考查了相关指数,这里不用求相关指数,而是根据所给的相关指数判断模型的拟合效果,解题的关键是理解相关指数越大拟合效果越好.5.已知四个命题:①在回归分析中,2R可以用来刻画回归效果,2R的值越大,模型的拟合效果越好;②在独立性检验中,随机变量2K的值越大,说明两个分类变量有关系的可能性越大;③在回归方程ˆ0.212y x=+中,当解释变量x每增加1个单位时,预报变量ˆy平均增加1个单位;④两个随机变量相关性越弱,则相关系数的绝对值越接近于1;其中真命题是()A.①④B.②④C.①②D.②③【分析】对4个选项分别进行判断,即可得出结论.【解答】解:①相关指数2R是用来刻画回归效果的,2R表示解释变量对预报变量的贡献率,2R越接近于1,表示解释变量和预报变量的线性相关关系越强,越趋近0,关系越弱,故2R的值越大,说明回归模型的拟合效果越好,故①正确.②由2K的计算公式可知,对分类变量X与Y的随机变量2K的观测值k来说,k越小,判断“X与Y有关系”的把握越小,随机变量2K的值越大,说明两个分类变量有关系的可能性越大,故②正确;③在回归直线方程ˆ0.212=+中,当解释变量x每增加一个单位时,预报变量ˆy平均增加y x0.2个单位,故③错误.④两个随机变量相关性越强,则相关系数的绝对值越接近于1;两个随机变量相关性越弱,则相关系数的绝对值越接近于0,故④不正确.故选:C.【点评】本题以命题的真假判断为载体,考查了抽样方法,相关系数,回归分析,独立性检验等知识点,难度不大,属于基础题.6.某地区植被被破坏,土地沙化越来越严重,最近三年测得沙漠面积增加值分别为0.2万公顷、0.39万公顷和0.78万公顷,则沙漠面积增加数y (万公顷)关于年数x (年)的函数关系较为接近的是( )A .0.2yx= B .20.10.1y x x=+ C .40.2lo g yx=+D .210xy=【分析】将(1,0.2),(2,0.39),(3,0.78)分别代入0.2y x=,20.10.1yx x=+,40.2lo g yx=+和210xy=中,验证即可.【解答】解:将(1,0.2),(2,0.39),(3,0.78)代入0.2y x=,当3x=时,0.6y=,和0.78相差较大;将(1,0.2),(2,0.39),(3,0.78)代入20.10.1y x x=+,当2x=时,0.6y=,和0.39相差较大;将(1,0.2),(2,0.39),(3,0.78)代入40.2lo g y x=+,当2x=时,0.7y=,和0.39相差较大;将(1,0.2),(2,0.39),(3,0.78)代入210xy =,当1x =时,0.2y =,当2x =时,0.4y =,与0.39相差0.01, 当3x=时,0.8y=,和0.78相差0.02;综合以上分析,选用函数关系210xy =较为近似.故选:D .【点评】本题考查了函数模型的应用问题,也考查了运算求解能力,是基础题.7.对于给定的样本点所建立的模型A 和模型B ,它们的残差平方和分别是212,,a a R 的值分别为1b ,2b ,下列说法正确的是( )A .若12a a <,则12b b <,A 的拟合效果更好 B .若12a a <,则12b b <,B 的拟合效果更好 C .若12a a <,则12b b >,A 的拟合效果更好D .若12a a <,则12b b >,B 的拟合效果更好【分析】比较两个模型的拟合效果时,如果模型残差平方和越小,则相应的相关指数2R 越大,该模型拟合的效果越好,即可得出结论.【解答】解:比较两个模型的拟合效果时,如果模型残差平方和越小, 则相应的相关指数2R 越大,该模型拟合的效果越好. 故选:C .【点评】本题是基础题.考查残差平方和、相关指数. 8.下列结论正确的是()①函数关系是一种确定性关系; ②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法; ④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. A .①②B .①②③C .①②④D .①②③④【分析】本题是一个对概念进行考查的内容,根据相关关系的定义与回归分析的统计意义进行判断.【解答】解:①函数关系是一种确定性关系,这是一个正确的结论. ②相关关系是一种非确定性关系,是一个正确的结论.③回归分析是对具有相关关系的两个变量进行统计分析的一种方法,所以③不对. 与③对比,依据定义知④是正确的, 故选:C .【点评】本题的考点是相关关系,对本题的正确判断需要对相关概念的熟练掌握. 9.某车间加工零件的数量x 与加工时间y 的统计数据如表:现已求得上表数据的回归方程ˆˆˆy bx a =+中的ˆb 值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为( )A .84分钟B .94分钟C .102分钟D .112分钟【分析】根据表中所给的数据,做出横标和纵标的平均数,得到样本中心点,代入样本中心点求出a 的值,写出线性回归方程.将100x=代入回归直线方程,得y ,可以预测加工100个零件需要102分钟,这是一个预报值,不是生产100个零件的准确的时间数. 【解答】解:由表中数据得:20x =,30y=,又ˆb 值为0.9,故300.92012a=-⨯=,0.912y x ∴=+.将100x=代入回归直线方程,得0.910012102y =⨯+=(分钟).∴预测加工100个零件需要102分钟.故选:C .【点评】本题考查线性回归方程的求法和应用,解题的关键是正确应用最小二乘法求出线性回归方程的系数的运算,再一点就是代入样本中心点可以求出字母a 的值,是一个中档题目. 10.两个变量y与x的回归模型中,分别选择了4个不同模型,它们对应的22121()1()ni i i ni i y y Ry y ==-=--∑∑的值如下,其中拟合效果最好的模型是()A .模型1对应的20.48R =B .模型3对应的20.15R =C .模型2对应的20.96R =D .模型4对应的20.30R =【分析】根据回归分析中相关指数2R 越接近于1,拟合效果越好,即可得出答案. 【解答】解:回归分析中,相关指数2R 越接近于1,拟合效果越好; 越接近0,拟合效果越差,由模型2对应的2R 最大,其拟合效果最好. 故选:C .【点评】本题考查了利用相关指数判断模型拟合效果的应用问题,是基础题. 11.对于回归分析,下列说法错误的是( )A .在残差图中,纵坐标表示残差B .若散点图中的一组点全部位于直线ˆ32y x =-+的图象上,则相关系数1r =C .若残差平方和越小,则相关指数2R 越大D .在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定 【分析】根据题意,对选项种的命题分析判断正误即可.【解答】解:对于A ,在残差图中,纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,所以A 正确;对于B,散点图中的一组点全部位于直线ˆ32=-+的图象上,则x,y成负相关,且相关y x关系最强,此时相关系数1r=-,所以B错误;对于C,若残差平方和越小,则残差点分布的带状区域的宽度越窄,其相关性越强,相关指数2R越大,所以C正确;对于D,回归分析中,变量间的关系若是非确定关系,即变量间的关系不是函数关系,因变量不能由自变量唯一确定,所以D正确.故选:B.【点评】本题考查了统计知识的概念与应用问题,掌握相关概念的含义是解题的关键,是基础题.12.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是() A.总偏差平方和B.残差平方和C.回归平方和D.相关指数【分析】本题考查的回归分析的基本概念,根据拟合效果好坏的判断方法我们可得,数据点和它在回归直线上相应位置的差异是通过残差的平方和来体现的.【解答】解:拟合效果好坏的是由残差的平方和来体现的,而拟合效果即数据点和它在回归直线上相应位置的差异故据点和它在回归直线上相应位置的差异是通过残差的平方和来体现的.故选:B.【点评】拟合效果好坏的是由残差的平方和来体现的,也可以理解为拟合效果即数据点和它在回归直线上相应位置的差异,故据点和它在回归直线上相应位置的差异是通过残差的平方和来体现的.二.多选题(共1小题)13.下列有关回归分析的结论中,正确的有()A.运用最小二乘法求得的回归直线一定经过样本点的中心(x,)yB.若相关系数r的绝对值越接近于1,则相关性越强C.若相关指数2R的值越接近于0,表示回归模型的拟合效果越好D.在残差图中,残差点分布的带状区域的宽度越窄,说明模型拟合的精度越高【分析】利用回归分析中的相关知识对四个选项逐一分析判断即可.【解答】解:对于A,回归方程必定经过样本中心(x,)y,故选项A正确;对于B,由相关系数的意义可知,相关系数r的绝对值越接近于1,则相关性越强,故选项B正确;对于C ,若相关指数2R 的值越接近于1,表示回归模型的拟合效果越好,故选项C 错误; 对于D ,在残差图中,残差点分布的带状区域的宽度越窄,说明模型拟合的精度越高,故选项D 正确. 故选:A B D .【点评】本题考查了回归分析的理解,主要考查了回归方程的性质,相关系数的意义等,属于基础题.三.填空题(共4小题)14.某商店统计了最近6个月某商品的进价x 与售价y (单位:元)的对应数据如表:假设得到的关于x 和y 之间的回归直线方程是ˆˆˆy bx a =+,那么该直线必过的定点是13(2,8).【分析】根据回归方程必过点(,)x y ,计算出,x y 即可求得答案. 【解答】解:35289121362x+++++==,4639121486y+++++==,回归方程必过点(,)x y ,∴该直线必过的定点是13(2,8).故答案为:13(2,8).【点评】本题考查了回归方程,线性回归方程必过样本中心点(,)x y ,这是线性回归中最常考的知识点,希望大家熟练掌握.属于基础题.15.对具有线性相关关系的变量x ,y ,测得一组数据如表:根据上表,利用最小二乘法得它们的回归直线方程为ˆˆ10.5y x a=+,据此模型预测,当10x=时,y 的估计值是 106.5【分析】根据表中数据计算x 、y ,代入回归直线方程求得ˆa的值, 写出回归直线方程,利用方程求出10x =时ˆy的值即可. 【解答】解:根据表中数据,计算1(24568)55x=⨯++++=,1(2040607080)545y =⨯++++=,代入回归直线方程ˆˆ10.5y x a=+中,求得ˆ5410.55 1.5a =-⨯=,∴回归直线方程为ˆ10.5 1.5yx =+,据此模型预测,10x=时,ˆ10.510 1.5106.5y=⨯+=,即y 的估计值是106.5. 故答案为:106.5.【点评】本题考查了线性回归方程的应用问题,是基础题. 16.已知x 与y 之间的一组数据:已求得关于y 与x 的线性回归方程ˆ 2.10.85y x =+,则m 的值为 0.5 .【分析】首先求出这组数据的横标和纵标的平均数,写出这组数据的样本中心点,把样本中心点代入线性回归方程求出m 的值. 【解答】解:0123342x +++==,3 5.5715.544m m y++++==,∴这组数据的样本中心点是3(2,15.5)4m +, 关于y 与x 的线性回归方程ˆ 2.10.85y x =+,∴15.532.10.8542m +=⨯+,解得0.5m =,m∴的值为0.5.故答案为:0.5.【点评】本题考查回归分析,考查样本中心点满足回归直线的方程,考查求一组数据的平均数,是一个运算量比较小的题目,并且题目所用的原理不复杂,是一个好题.17.对某城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查后知,y 与x 具有线性相关关系,满足回归方程0.6 1.5yx =+,若该城市居民人均消费水平为7.5(千元),则可以估计该城市人均消费额占人均工资收入的百分比约为 75%.【分析】根据y 与x 具有线性相关关系,且满足回归方程,和该城市居民人均消费水平为,把消费水平的值代入线性回归方程,可以估计该市的职工均工资水平,做出人均消费额占人均工资收入的百分比. 【解答】解:y与x 具有线性相关关系,满足回归方程0.6 1.5yx =+,该城市居民人均消费水平为7.5y=,∴可以估计该市的职工均工资水平7.50.6 1.5x =+,10x ∴=,∴可以估计该城市人均消费额占人均工资收入的百分比约为7.5100%75%10⨯=,故答案为:75%【点评】本题考查线性回归方程的应用,考查用线性回归方程估计方程中的一个变量,利用线性回归的知识点解决实际问题. 四.解答题(共3小题)18.某同学在生物研究性学习中想对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从这5天中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 均不小于25的概率.(2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另三天的数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?(参考公式:1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-【分析】(1)用数组(,)m n 表示选出2天的发芽情况,用列举法可得m ,n 的所有取值情况,分析可得m ,n 均不小于25的情况数目,由古典概型公式,计算可得答案;(2)根据所给的数据,先做出x ,y 的平均数,即做出本组数据的样本中心点,根据最小二乘法求出线性回归方程的系数,写出线性回归方程.(3)根据估计数据与所选出的检验数据的误差均不超过2颗,就认为得到的线性回归方程是可靠的,根据求得的结果和所给的数据进行比较,得到所求的方程是可靠的.【解答】解:(1)用数组(,)m n 表示选出2天的发芽情况,m,n 的所有取值情况有(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(30,26),共有10个设“m ,n 均不小于25”为事件A ,则包含的基本事件有(25,30),(25,26),(30,26) 所以3()10P A =,故事件A 的概率为310(2)由数据得12,27xy ==,3972x y=,31977i i i x y ==∑,321434i i x ==∑,23432x =由公式,得9779725ˆ4344322b -==-,5ˆ271232a=-⨯=-所以y 关于x 的线性回归方程为5ˆ32yx =-(3)当10x =时,ˆ22y=,|2223|2-<,当8x=时,ˆ17y=,|1716|2-<所以得到的线性回归方程是可靠的.【点评】本题考查回归直线方程的计算与应用,涉及古典概型的计算,是基础题,在计算线性回归方程时计算量较大,注意正确计算.19.随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x 与所支出的总费用y(万元)有如下的数据资料:(1)在给出的坐标系中做出散点图;(2)求线性回归方程ˆˆˆybx a =+中的ˆa、ˆb ; (3)估计使用年限为10年时,车的使用总费用是多少?(最小二乘法求线性回归方程系数公式1221ˆni i i ni i x y n x yb x n x==-=-∑∑,ˆˆ)ay bx =-.【分析】(1)利用描点法作出散点图;(2)把数据代入公式,利用最小二乘法求回归方程的系数,可得回归直线方程; (3)把10x=代入回归方程得y 值,即为预报变量.【解答】解:(1)散点图如图,由图知y 与x 间有线性相关关系.(2)4x=,5y=,52190i i x ==∑,51112.3i i i x y ==∑,∴112.354512.3ˆ 1.239054210a-⨯⨯===-⨯;ˆˆ5 1.2340.08a y b x =-=-⨯=.(3)线性回归直线方程是ˆ 1.230.08y x =+,当10x=(年)时,ˆ 1.23100.0812.38y=⨯+=(万元),即估计使用10年时,支出总费用是12.38万元.【点评】本题考查了线性回归直线方程的求法及利用回归方程估计预报变量,解答此类问题的关键是利用公式求回归方程的系数,计算要细心.20.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:(1)画散点图;(2)如果y 对x 有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为89个,那么机器的运转速度应控制在什么范围内?(参考数值:511380i i i x y ==∑,521145)i i x ==∑【分析】(1)根据表格数据,可得散点图;(2)先求出横标和纵标的平均数,代入求系数b 的公式,利用最小二乘法得到系数,再根据公式求出a 的值,写出线性回归方程,得到结果.(3)允许每小时的产品中有缺点的零件最多为89个,即线性回归方程的预报值不大于89,写出不等式,解关于x 的一次不等式,得到要求的机器允许的转数. 【解答】解:(1)散点图如图;(2)5x =,50y=,511380i i i x y ==∑,521145i i x ==∑∴13805550ˆ 6.5145555b-⨯⨯==-⨯⨯,ˆˆ17.5ay b x =-=∴回归直线方程为:ˆ 6.517.5yx =+;(3)由89y …得6.517.589x+…,解得11x …∴机器的运转速度应控制11转/秒内【点评】本题考查线性回归分析,考查线性回归方程,考查线性回归方程的应用,考查不等式的解法,是一个综合题目.。
高中数学选择性必修三 精讲精炼 8 一元线性回归模型及其应用(精练)(含答案)

8.2 一元线性回归模型及其应用(精练)【题组一 样本中心求参数】1.(2021·全国·高二单元测试)某公司生产某种婴幼儿纸尿裤的产量x 与相应的生产能耗y 有如下样本数据:已知这组样本数据具有线性相关关系,由表中数据,求得回归直线的斜率为0.72,则这组样本数据的回归直线方程是( )A .ˆ0.72 2.05yx =+ B .ˆ0.720.35yx =+ C .ˆ0.720.26yx =+ D .ˆ0.350.72yx =+ 【答案】C【解析】设回归直线方程为ˆˆ0.72yx a =+,由样本数据,可得 4.5x =, 3.5y =, 因为回归直线经过点(),x y ,所以ˆ3.50.72 4.5a=⨯+,解得ˆ0.26a =, 所以回归直线方程为ˆ0.720.26yx =+. 故选:C .2.(2021·江西·吉安一中高二开学考试 )已知x 与y 之间的一组数据:()()()()13253749,,,,,,,,则y 与x 的线性回归方程为y bx a =+必过( )A .()26,B .()38,C .()2.56,D .()3.58,【答案】C【解析】由题意可知:1234 2.54x +++==,357964y +++==, ∴y 与x 的线性回归方程必过点()2.5,6.故选:C.3(2021·河南·孟津县第一高级中学 )为了庆祝建党100周年,某网站从7月1日开始推出党史类书籍免费下载活动,已知活动推出时间x (单位:天)与累计下载量y (单位:万次)的统计数据如表所示:根据上表,利用最小二乘法得到回归直线方程 1.4ˆˆyx a =+,据此模型预测,活动推出11天的累计下载量约A .13.8万次B .14.6万次C .16万次D .18万次【答案】C【解析】由表格数据知4567868910126,955x y ++++++++====,由回归直线方程的性质,得ˆ1.469a⨯+=,所以ˆ0.6a =,故ˆ 1.40.6y x =+, 所以当11x =时, 1.4110.616y =⨯+=(万次), 故选:C.4.(2021·河北·藁城新冀明中学高二月考)(多选)随着养生观念的深入,国民对餐饮卫生条件和健康营养的要求逐渐提高.据了解,烧烤食品含有强致癌物,因此吃烧烤的人数日益减少,烧烤店也随之减少.某市对2014年至2018年这五年间全市烧烤店盈利店铺的个数进行了统计,具体统计数据如下表所示:根据所给数据,得出y 关于t 的回归直线方程为273y bt =+,则下列说法正确的是( ) A .该市2014年至2018年全市烧烤店盈利店铺个数的平均数219y = B .y 关于t 的回归直线方程为18273y t =-+ C .估计该市2020年烧烤店盈利店铺的个数为147D .预测从2025年起,该市烧烤店盈利店铺的个数将不超过100 【答案】ABC【解析】由已知数据得3t =,219y =,故A 正确;因为y 关于t 的回归直线过点()3,219,所以2193273b =+,所以18b =-, 所以y 关于t 的回归直线方程为18273y t =-+.故B 正确;2020年的年份代码为7,故2020年该市烧烤店盈利店铺的个数约为187273147y =-⨯+=.故C 正确; 令18273100t -+≤,由*t N ∈,得10t ≥,故从2023年起,该市烧烤店盈利店铺的个数将不超过100.故D 不正确,故选:ABC.5.(2021·广东惠州 )(多选)某种产品的价格x (单位:元/kg )与需求量y (单位:kg )之间的对应数据如根据表中的数据可得回归直线方程为14.4y bx =+,则以下结论正确的是( ) A .y 与x 正相关 B .y 与x 负相关C .样本中心为()20,8D .该产品价格为35元/kg 时,日需求量大约为3.4kg【答案】BC【解析】由表格数据,随着价格x 的增加,需求量y 随之减少,所以y 与x 负相关. 因为1015202530205x ++++==,111086585y ++++==,故样本中心为()20,8由回归直线14.4y bx =+必过样本点的中心()20,8, 所以有82014.4b =⨯+,解得0.32b =-,所以当35x =时,0.323514.4 3.2y =-⨯+=,日需求量不为最大 故选:BC6.(2021·重庆市秀山高级中学校 )(多选)已知变量x ,y 之间的线性回归方程为0.710.3y x =-+,且变量x ,y 之间的一组相关数据如表所示,则下列说法正确的是( )A .变量x ,y 之间呈负相关关系B .可以预测,当20x 时, 3.7y =-C .4m =D .该回归直线必过点()9,4 【答案】ABD【解析】对于A :由线性回归方程为0.710.3y x =-+可知:0.70-<,所以变量x ,y 之间呈负相关关系,故对于B :当20x 时,0.72010.3 3.7y =-⨯+=-,故选项B 正确;对于C :68101294x +++==,6321144m m y ++++==,因为回归直线过样本中心点,所以110.7910.34m+=-⨯+,解得:5m =,故选项C 不正确; 对于D :由C 可知5m =,所以11544y +==,所以该回归直线必过样本中心点()9,4,故选项D 正确; 故选:ABD.7.(2021·贵州·贵阳一中 )某产品的广告费用x 与销售额y 的统计数据如下表:根据上表已得回归方程为8.6.8ˆ5yx =-,表中一数据模糊不清,请推算该数据的值为___________. 【答案】12【解析】由题中数据可得3,8.63 5.820x y ==⨯-=,故空白数据为12. 故答案为:128.(2021·全国·高二课时练习)已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且回归直线方程为ˆ0.95 2.6yx =+,那么表格中的数据m 的值为______.【答案】6.7 【解析】013424x +++==, 2.2 4.3 4.811.344m m y ++++==, 把(),x y 的坐标代入回归直线方程得11.30.952 2.64m+=⨯+, 解得 6.7m =. 故答案为:6.79.(2021·全国·高二课时练习)蟋蟀鸣叫的频率P (每分钟鸣叫的次数)与气温T (单位:℃)有着很大的关系.某观测人员根据下表中的观测数据计算出P 关于T 的线性回归方程ˆ 5.2168PT =-,则下表中k 的值为______.【答案】51【解析】计算()138414239404T =⨯+++=,()110929443644k P k +=⨯+++=, 将点10940,4k +⎛⎫ ⎪⎝⎭的坐标代入P 与T 的线性回归方程ˆ 5.2168P T =-中,得109 5.2401684k +=⨯-, 解得51k =. 故答案为:51.10.(2021·福建宁德·高三期中)某电子产品的成本价格由两部分组成,一是固定成本,二是可变成本,为确定该产品的成本,进行5次试验,收集到的数据如表:由最小二乘法得到回归方程ˆ0.6754.9yx =+,则a =___________. 【答案】75 【解析】1020304050305x ++++==,62688189600.25a y a ++++==+,因为线性回归方程过样本中心点,所以600.20.673054.975a a +=⨯+⇒=,故答案为:75 【题组二 线性回归方程】1.(2021·河北·藁城新冀明中学高二月考)假定产品产量x (千件)与单位成本y (元/件)之间存在相关关系.数据如下:(1)以x 为解释变量,y 为预报变量,作出散点图;(2)求y 与x 之间的回归直线方程,对于单位成本70元/件时,预报产量为多少; (3)计算各组残差,并计算残差平方和;【答案】(1)散点图见解析;(2)ˆ 1.8277.37yx =-+,4.050千件;(3)各组残差见解析,残差平方和为3.8182. 【解析】(1)解:散点图如下:(2)解:因为2343453.56x +++++==,737271736968716y +++++==,61279ii x==∑,611481i ii x y==∑,所以6162221614816 3.571ˆ 1.82796 3.56i i i i ix yx ybx x==-⋅-⨯⨯==≈--⨯-∑∑,ˆˆ71 1.82 3.577.37ay bx =-=+⨯=, 所以回归直线方程为ˆ 1.8277.37yx =-+,令70y =,则70 1.8277.37x =-+,解得 4.050x ≈, 所以单位成本70元/件时,预报产量约为4.050千件. (3)解:各组残差分别为:()11173 1.822ˆ77.370.73ˆey y =--⨯+=-=-, ()22272 1.82377.370.0ˆˆ9ey y =--⨯+==-, ()33371 1.82477.370.9ˆˆ1ey y =--⨯+==-, ()44473 1.82377.37 1.0ˆˆ9ey y =--⨯+==-, ()55569 1.824ˆ77.37 1.09ˆey y =--⨯+=-=-, ()66668 1.825ˆ77.370.27ˆey y =--⨯+=-=-, 残差的平方和为()()()2222621220.730.090.91 1.09 1.090.27 3.2ˆ818i i i y y=--+++--==++∑. 2.(2021·甘肃张掖)某家庭2015~2019年的年收入和年支出情况统计如表:(1)已知y 与x 具有线性相关关系,求y 关于x 的线性回归方程(系数精确到0.01);(2)假设受新冠肺炎疫情影响,该家庭2021年的年收入为9.5万元,请根据(1)中的线性回归方程预测该家庭2021年的年支出金额.附:回归方程ˆˆˆybx a =+中的斜率的最小二乘估计公式为()()()1122211ˆnni iiii i nniii i x ynx y xxy y b xnxxx====---==--∑∑∑∑.【答案】(1)ˆ0.780.24yx =+;(2)7.65万元. 【解析】(1)依题意,1(99.61010.411)105x =++++=,1(7.37.588.58.7)85y =++++=,则()5212.32i i x x=-=∑,()()511.8i ii x xy y =--=∑,则有()()()125151.8ˆ0.782.32iii ii x x y y bx x ==--==≈-∑∑,则ˆˆ0.24a y bx =-≈, 所以y 关于x 的线性回归方程为ˆ0.780.24yx =+; (2)当2021年的年收入为9.5万元时,即9.5x =,ˆ0.789.50.247.65y=⨯+=, 所以预测该家庭2021年的年支出金额为7.65万元.3.(2021·云南师大附中)大气污染物PM 2.5的浓度超过一定的限度会影响人的健康.为了研究PM 2.5的浓度是否受到汽车流量的影响,研究人员选择了24个社会经济发展水平相近的城市,在每个城市选择一个交通点统计24小时内过往的汽车流量x (单位:千辆),同时在低空相同的高度测定该时间段空气中的PM 2.5的平均浓度y(单位:μg/m 3),制作了如图所示的散点图:(1)由散点图看出,可用线性回归模型拟合y 与x 的关系,请用相关系数加以说明(精确到0.01); (2)建立y 关于x 的回归方程;(3)我国规定空气中的PM 2.5浓度的安全标准为24小时平均依度75μg/m 3,某城市为使24小时的PM 2.5浓度的平均值在60~130μg/m 3,根据上述回归方程预测汽车的24小时流量应该控制在什么范围内?附:参考数据: 1.4x =,95y =,2421() 2.1i i x x =-=∑,2421()60343i i y y =-=∑,241()()294i i i x x y y =--=∑,357.参考公式:相关系数()()nii xx y y r --∑,回归方程ˆˆˆya bx =+中斜率和截距的最小二乘估计公式分别为:121()()ˆ()niii nii x x yy b x x ==--=-∑∑,ˆˆay bx =-. 【答案】(1)答案见解析;(2)140101y x =-;(3)24小时的车流量应该控制在1150~1650辆. 【解析】1)由题得2940.82357r =≈, 因为y 与x 的相关系数近似为0.82,说明y 与x 具有很强的相关性, 从而可以用线性回归模型拟合y 与x 的关系.(2)由95y =得2412421()()ˆ()iii ii x x y y bx x ==--=-∑∑2941402.1==,95140 1.4101a y bx =-=-⨯=-, 所以y 关于x 的回归方程为140101y x =-. (3)当60y =时,由14010160x -=得 1.15x =; 当130y =时,由140101130x -=得 1.65x =. 所以24小时的车流量应该控制在1150~1650辆.4.(2021·全国·高三专题练习)实施新规后,某商场2020年1月份至10月份的收入情况如表.并计算得101890i i i x y ==∑,1021385i i x ==∑,101150i i y ==∑75.99.(1)是否可用线性回归模型拟合y 与x 的关系?请用相关系数r 加以说明;(当0.751r ≤≤时,那么变量x ,y 有较强的线性相关关系)(2)建立y 关于x 的回归方程ˆˆˆybx a =+(结果保留1位小数),并预测该商场12月份的收入情况.(结果保留整数)附:()()()1122211ˆn niii ii i nniii i x x y y x y nx ybx x xnx====---==--∑∑∑∑,ˆˆay bx =-. 【答案】(1)y 与x 有较强的线性相关关系,可用线性回归模型拟合,说明答案见解析;(2)ˆ0.810.7yx =+,预测该商场12月份的收入为20万元.【解析】(1)由题中数据得1011155 5.51010i i x x ===⨯=∑,10111150151010i i y y ===⨯=∑,1010 5.515825x y =⨯⨯=,于是得1010111()()1089082565i i i i i x x y y x y y x ==--=-=-=∑∑,75.99,从而10()()650.8675.99iix x y y r --==≈∑,0.75||1r ≤≤, 所以y 与x 有较强的线性相关关系,可用线性回归模型拟合;(2)由(1)知1011065i i i x y x y =-=∑,而1021385i i x ==∑,221010 5.5302.5x =⨯=,从而得10122110106565ˆ0.8385302.582.510i ii i i x y ybx xx ==-===≈--∑∑,65ˆˆ15 5.510.782.5ay bx =-=-⨯=, 所以y 关于x 的线性回归方程为ˆ0.810.7yx =+,当12x =时,ˆ0.81210.720y =⨯+≈, 从而预测该商场12月份的收入为20万元.5(2021·河南许昌 )某新型外贸出口公司对2021年过去9个月的出口销售数据进行整理,得到了今年第x 个月份与截止该月底的销售额y (单位:万元)之间的关系,如下表:(1)若y 与x 满足线性关系,求出y 关于x 的回归方程;(ˆa,ˆb 精确到整数位) (2)预测该公司10月份的销售额附:参考数据:913087i i y ==∑;9117524i i i x y ==∑;921285i i x ==∑;参考公式:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【答案】(1)ˆ35169yx =+;(2)答案见解析. 【解析】(1)5x =,343y =,919175249534317524154352089i i i x y xy =∴-=-⨯⨯=-=∑92221952859560ii x=-⨯=-⨯=∑,2089ˆ3560b ∴=≈, 2089ˆ343516960a=-⨯≈, ˆ35169yx ∴=+ (2)当10x =时,ˆ3510169519y=⨯+=, 所以预测该公司10月份销售额为519万元.6.(2021·福建·莆田第二十五中学高三月考)2021年东京奥运会,中国举重选手8人参赛,7金1银,在全世界面前展现了真正的中国力量;举重比赛根据体重进行分级,某次举重比赛中,男子举重按运动员体重分为下列十级:每个级别的比赛分为抓举与挺举两个部分,最后综合两部分的成绩得出总成绩,所举重量最大者获胜,在该次举重比赛中,获得金牌的运动员的体重以及举重成绩如下表 (1)根据表中的数据,求出运动员举重成绩y 与运动员的体重x 的回归直线方程(保留1位小数); (2)某金牌运动员抓举成绩为170公斤,挺举成绩为204公斤,则该运动员最有可能是参加的哪个级别的举重?参考数据:()()()992112620,7076i i i i i x x x x y y ==-=--=∑∑;参考公式:()()()121ˆˆˆ,niii nii x x yy bay bx xx ==--==--∑∑. 【答案】(1) 2.7155.4y x =+;(2)83公斤级举重. 【解析】(1)依题意,5459647076839199106789x ++++++++==,2913043373533633894064214303669y ++++++++==,()()()1217076ˆ 2.702620nii i nii xx y y bxx ==--===-∑∑, 则366 2.778155.4a y bx =-=-⨯=, 故回归方程为: 2.7155.4y x =+.(2)该运动员的抓举和挺举的总成绩为374公斤,根据回归方程可知:374 2.7155.4x =+, 解得81x ≈,即该运动员的体重应该在81公斤左右,即参加的应该是83公斤级举重.7.(2021·西藏·拉萨中学高二月考)珠海国际赛车场(简称ZIC)位于珠海经济特区金鼎镇.创建于1996年,是中国国内第一座符合国际汽车联盟一级方程式标准的国际级赛车场.目前该赛事已打造成集赛车竞技运动、汽车文化极致体验、主题休闲度假为一体的超级汽车文化赛事娱乐综合体.为了减少对环境的污染,某环保部门租用了特制环保车清洁现场垃圾.通过查阅近5年参会人数(万人)与所需环保车辆数量(辆),得到如下统计表:(1)根据统计表所给5组数据,求出关于,x y 的线性回归方程ˆˆy bxa =+. (2)已知租用的环保车平均每辆的使用成本费用C (元)与数量(辆)的关系为3000200035,N 2900t t 35,N t t t C t +<<∈⎧=⎨≥∈⎩,主办方根据实际参会人数投入所需环保车,租车每辆支付费用6000元,超出实际需要的车辆,主办方不支付任何费用.预计本次赛车会大约有14万人参加,根据(1)中求出的线性回归方程,预测环保部门在确保清洁任务完成的前提下,应租用多少辆环保车?获得的利润是多少? (注:利润L =主办方支付费用-使用成本费用C ).参考公式:()()()1122211ˆ,ˆˆn niii ii i nniii i x x y y x y nxybay bx x x xnx ====---===---∑∑∑∑ 【答案】(1) 2.32y x =+;(2)为确保完成任务,需要租用35辆环保车,获得的利润108500元. 【解析】(1)11981012105x ++++==2823202529255y ++++== ()()()()()()()()()22222131******** 2.310111091081010101210ˆb ⨯+-⨯-+-⨯-++⨯===-+-+-+-+- ˆˆ2ay bx =-= 关于,x y 的线性回归方程 2.32y x =+ (2)将14x =代入 2.32y x =+得34.2y =为确保完成任务,需要租用35辆环保车, 所以290035101500C =⨯=获得的利润600035101500108500L =⨯-=元8.(2021·江西·新余市第一中学高二月考)某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,他们分别记录了3月1日至3月5日的每天昼夜温差与实验室每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从3月1日至3月5日中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 中至少有一个数小于25”的概率;(2)请根据3月2日至3月4日的数据,求出y 关于x 的线性回归方程y bx a =+.(参考公式:回归直线方程为y bx a =+,其中()1221ni ii nii x y nxyb xn x==-=-∑∑,a y bx =-)【答案】(1)710(2)532y x =-【解析】(1)从3月1日至3月5日中任选2天,m ,n 构成的基本事件(m ,n )有:(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(26,16),共有10个.记“m ,n 至少有一个数小于25”为事件A ,包括:(23,25),(23,30),(23,26),(23,16),(25,16),30,16),(26,16),共有7个基本事件 由古典概型概率公式:7()10P A = (2)11131225302612,27,33x y ++++==== 22221125133012263122751113123122b ⨯+⨯+⨯-⨯⨯==++-⨯. 于是,5271232a =-⨯=-故所求线性回归方程为532y x =- 9.(2021·全国·高二单元测试)某地区2013年至2019年居民纯收入y (单位:千元)的部分数据如表所示:2018和2019年的居民纯收入y (单位:千元)数据采用随机抽样的方式获得,用样本的均值来代替当年的居民人均纯收入,其数据如下:2018年抽取的居民纯收入(单位:千元)数据:5.2 4.8 6.5 5.6 6.0 7.1 6.1 7.3 5.9 7.5 2019年抽取的居民纯收入(单位:千元)数据:6.2 7.8 6.6 5.8 7.1 6.8 7.2 7.9 5.9 7.7 (1)求y 关于t 的线性回归方程;(2)当地政府为了提高居民收入水平,现从2018和2019年居民纯收入(单位:千元)高于7.0千元的样本中随机选择3人进行座谈,了解其工作行业及主要收入来源.设X 为选出的3人中2018年纯收入高于7.0千元的人数,求随机变量X 的分布列和数学期望.附:回归直线的斜率和截距的最小二乘法估计公式分别为:121()()()niii nii t t y y b tt ==--=-∑∑,a y bt =-.【答案】(1)ˆ0.5 3.3yt =+;(2)分布列见解析;期望为98. 【解析】(1)根据2018年的抽样数据可得2018年的人均纯收入为1(5.2 4.8 6.5 5.6 6.07.1 6.17.3 5.97.5) 6.210+++++++++= 千元,根据2019年的抽样数据可得2019年的人均纯收入为1(6.27.8 6.6 5.87.1 6.87.27.9 5.97.75) 6.910+++++++++=千元,由所给的数据得1(1234567)47t =++++++=,1(3.9 4.3 4.6 5.4 5.8 6.2 6.9) 5.37y =++++++=, ∴721()941014928i i t t =-=++++++=∑,71()()(3)( 1.4)(2)(1)(1)(0.7)00.110.520.93 1.614ii i tt y y =--=-⨯-+-⨯-+-⨯-+⨯+⨯+⨯+⨯=∑,∴71721()()14ˆ0.528()ii i ii tt y y btt ==--===-∑∑, 则ˆˆ 5.30.54 3.3ay bt =-=-⨯=, 则所求y 关于t 的线性回归方程为ˆ0.5 3.3yt =+; (2)由2018年和2019年的抽样数据可知,2018年居民纯收入高于7.0千元的有3人,2019年居民纯收入高于7.0千元的有5人,由题意可得,随机变量X 的可能取值为0,1,2,3,则35385(0)28C P X C ===,12353815(1)28C C P X C ===,21353815(2)56C C P X C ===,33381(1)56C P X C ===,∴随机变量X 的分布列为则X 的分布列为:则5151519()0123282856568E X =⨯+⨯+⨯+⨯= 【题组三 非线性回归方程】1.(2021·福建·泉州科技中学 )数独是源自18世纪瑞士的一种数学游戏,玩家需要根据99⨯盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(33⨯)内的数字均含1﹣9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.(1)赛前小明在某数独APP 上进行一段时间的训练,每天的解题平均速度y (秒)与训练天数x (天)有关,经统计得到如表的数据:现用by a x=+作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过100天训练后,每天解题的平均速度y约为多少秒?(2)小明和小红在数独APP 上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为34,已知在前3局中小明胜2局,小红胜1局.若不存在平局,请你估计小明最终赢得比赛的概率.参考数据(其中1i t x =)参考公式:对于一组数据()11,u v ,()22,u v ,…,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计公式分别为:1221ni i i nii u v nu vunuβ==-⋅=-∑∑,v u αβ=-⋅.【答案】(1)1000130y x=+,经过100天训练后,每天解题的平均速度y 约为140秒;(2)243256.【解析】(1)由题意,1(990990450320300240210)5007y =++++++=,令1t x=,设y 关于t 的线性回归方程为y bt a =+,则 717221184570.3750010000.5577i ii i i t y t yb t t==-⨯-⨯-===⋅∑∑,则50010000.37130a =-⨯=. ∴1000130y t =+,又1t x=,∴y 关于x 的回归方程为1000130y x=+, 故100x =时,140y =.∴经过100天训练后,每天解题的平均速度y 约为140秒.(2)设比赛再继续进行X 局小明最终赢得比赛,则最后一局一定是小明获胜, 由题意知,最多再进行4局就有胜负.当2X =时,小明4:1胜,∴339(2)4416P X ==⨯=;当3X =时,小明4:2胜,∴123339(3)144432P X C ⎛⎫==⨯⨯-⨯= ⎪⎝⎭;当4X =时,小明4:3胜,∴21333327(4)1444256P X C ⎛⎫==⨯⨯-⨯= ⎪⎝⎭.∴小明最终赢得比赛的概率为99272431632256256++=. 2.(2021·云南大理 )2021年6月17日9时22分,我国酒泉卫星发射中心用长征2F 遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A 型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A 型材料更好地投入商用,拟对A 型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x (亿元)与产品的直接收益y (亿元)的数据统计如下:当017x <≤时,建立了y 与x 的两个回归模型:模型①: 4.1109ˆ.y x =+,模型②:ˆ14.4y =;当17x >时,确定y 与x 满足的线性回归方程为ˆˆ0.7yx a =-+. (1)根据下列表格中的数据,比较当017x <≤时模型①,②的相关指数2R 的大小,并选择拟合精度更高、更可靠的模型,预测对A 型材料进行应用改造的投入为17亿元时的直接收益;(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.附:刻画回归效果的相关指数()()22121ˆ1ni i i nii y yR y y ==-=--∑∑,且当2R 越大时,4.1≈.用最小二乘法求线性回归方程ˆˆˆybx a =+的截距:ˆˆa y bx =-. 【答案】(1)模型②拟合精度更高、更可靠,72.93亿;(2)投入17亿元比投入20亿元时收益小. 【解析】(1)对于模型①, 对应的15222740485460=387y ++++++=,故对应的()12222111271750i i i i y y y y ==-=-=∑∑,故对应的相关指数2179.1310.9551750R =-≈, 对于模型②,同理对应的相关指数2220.210.9881750R =-≈, 故模型②拟合精度更高、更可靠.故对A 型材料进行应用改造的投入为17亿元时的直接收益为ˆ14.472.93=≈y. (2)当17x >时, 后五组的2122232425235x ++++==,68.56867.5+66+65675y ++==,由最小二乘法可得()ˆ670.72383.1a=--⨯=, 故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:0.72083.1+574.172.93-⨯+=>,故投入17亿元比投入20亿元时收益小.3.(2021·全国·高二单元测试)某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成,每件产品的非原料成本y (元)与生产的产品数量x (千件)有关,经统计得到如下数据:根据以上数据,绘制了如下散点图.参考数据:(其中1iu x =) (1)观察散点图判断,by a x=+与y c dx =+哪一个适宜作为非原料成本y 与生产的产品数量x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程; (3)试预测生产该产品10千件时,每件产品的非原料成本为多少元? 【答案】(1)b y a x =+;(2)100ˆ11y x=+;(3)21元.【解析】(1)由题意,根据题设中的散点图,可得这些点分布在b y a x =+的两侧,所以选择函数by a x=+作为非原料成本y 与生产的产品数量x 的回归方程类型. (2)令1u x =,则by a x=+可转化为y a bu =+,则y 与u 的关系可看成线性相关关系. 因为360458y ==,所以8182218183.480.344561ˆ1001.5380.1150.618i ii ii u yu y b uu==-⋅-⨯⨯====-⨯-∑∑,则ˆˆ451000.3411a y bu =-=-⨯=,所以ˆ11100y u =+,代入1u x =,得100ˆ11y x=+.(3)当10x =时,100ˆ112110y=+=,所以预测生产该产品10千件时,每件产品的非原料成本为21元. 4.(2021·全国·高三课时练习)某芯片公司为制订下一年的研发投入计划,需了解年研发资金投入量x (单位:亿元)对年销售额y (单位:亿元)的影响,该公司对历史数据进行对比分析,建立了两个函数模型:①2y x αβ=+,②e x t y λ+=,其中α,β,λ,t 均为常数,e 为自然对数的底数.现该公司对收集的近12年的年研发资金投入量i x 和年销售额i y (1,2,,12i =⋅⋅⋅)的数据作了初步处理,令2u x =,ln v y =,经计算得到如下数据:(1)设u 和y 的样本相关系数为1r ,x 和v 的样本相关系数为2r ,请从样本相关系数(精确到0.01)的角度判断,哪个模型拟合效果更好;(2)(i)根据(1)的选择及表中数据,建立y 关于x 的非线性经验回归方程;(ii)若下一年销售额y 需达到90亿元,预测下一年的研发资金投入量x 约为多少亿元? 参考数据为308477=⨯9.4868, 4.4998e 90≈.【答案】(1)模型e x t y λ+=的拟合效果更好;(2)(i)0.018 3.84ˆe x y+=;(ii)36.66亿元. 【解析】(1)()()121215000.8625000iiu u y y r --====∑,()()12214100.91770.211iix x v v r --====≈⨯∑,因为12r r <,所以从样本相关系数的角度判断,模型e x t y λ+=的拟合效果更好. (2)(i)先建立v 关于x 的经验回归方程. 由e x t y λ+=,得ln y x t λ=+,即v λx t =+.()()()121122114ˆ0.018770iii ii x x v v x x λ==--==≈-∑∑, ˆˆ 4.20.01820 3.84tv x λ=-=-⨯=, 所以v 关于x 的经验回归方程为0.01838ˆ.4vx +=, 所以0.0134ˆln 8.8x y=+,即0.018 3.84ˆe x y +=.(ii)若下一年销售额y 需达到90亿元,则由0.018 3.84ˆe x y+=,得0.018 3.8490e x +=, 又 4.4998e 90≈,所以4.49980.018 3.84x ≈+, 所以 4.4998 3.8436.660.018x -≈≈,所以预测下一年的研发资金投入量约为36.66亿元.5.(2021·全国·高二课时练习)噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了解声音强度D (单位:dB )与声音能量I (单位:2W cm -⋅)之间的关系,将测量得到的声音强度D 和声音能量I 的数据作了初步处理,得到如图所示的散点图:参考数据:111.0410I -⨯=,45.7D =,11.5W =-,()1022111.5610i i I I-=-=⨯∑,()10210.51i i W W=-=∑,()()101116.8810iii IID D -=--=⨯∑,()()1015.1i i i W W D D =-⋅-=∑,其中lg i i W I =,101110i i W W ==∑.(1)根据散点图判断,11D a b I =+与22lg D a b I =+哪一个适宜作为声音强度D 关于声音能量I 的回归模型?(给出判断即可,不必说明理由)(2)求声音强度D 关于声音能量I 的非线性经验回归方程.(3)假定当声音强度大于60dB 时,会产生噪声污染.城市中某点P 处共受到两个声源的影响,这两个声源的声音能量分别是a I 和b I ,且101410a bI I +=.已知点P 处的声音能量等于a I 与b I 之和.请根据(2)中的非线性经验回归方程,判断点P 处是否受到噪声污染,并说明理由.【答案】(1)22lg D a b I =+更适合;(2)ˆ10lg 160.7DI =+;(3)P 会受到噪声污染,理由见解析. 【解析】(1)22lg D a b I =+更适合. (2)设ˆˆD bW a =+,则 ∵()()()10110215.1ˆ100.51iii i i W W D D bW W==--===-∑∑, ∴ˆˆ160.7a D bW=-=, ∴D 关于W 的经验回归方程是ˆ10160.7DW =+,则D 关于I 的非线性经验回归方程是ˆ10lg 160.7DI =+. (3)设点P 处的声音能量为1I ,则1a b I I I =+. ∵101410a bI I +=, ∴()101010141410105910b a a b a b a b a b I I I I I I I I I I I ---=+=++=++≥⎛⎫⎛⎫ ⎪⎝⨯ ⎪⎝⎭⎭(当且仅当10310a I =,93510bI =⨯时等号成立) 根据(2)中非线性经验回归方程,知点P 处的声音强度D 的预报值的最小值,()10min 10lg 910160.710lg960.760D -=⨯+=+>,∴点P 会受到噪声污染.6.(2021·福建·福州三中高二期中)某地从2月20日开始的连续7天的某传染病累计确诊人数如下表:由上述表格得到如下散点图.(1)根据散点图判断lg =+y a b x 与x y c d =⋅(,c d 均为大于0的常数)哪一个更适合作为累计确诊人数y 与天数x 的回归方程类型(给出判断即可,不必说明理由),并求出y 关于x 的回归方程;(2)3月20日,该地的疾控中心接受了1000份血液样本,假设每份样本的检验结果是阳性还是阴性是相互独立的,且每份样本是阳性的概率是0.6,试剂把阳性样本检测出阳性结果的概率是0.99(试剂存在阳性样本检测不出来的情况,但不会把阴性样本检测呈阳性样本),求这1000份样本中检测出呈阳性的份数的期望.参考数据:其中11lg ,7i i i i v y v v ===∑参考公式:对于一组数据()()()1122,,,,,,n n u v u v u v ⋯,其回归直线ˆvu αβ=+的斜率和截距的最小二乘估计公式分别为1221,ni i i ni i u v nuvv u unuβαβ==-==--∑∑,v u αβ=-.【答案】(1)0.253.4710x x y c d y =⋅=⨯; (2)594【解析】(1)由散点图可知,x y c d =⋅更适合作为累计确诊人数y 与天数x 的回归方程类型. 把x y c d =⋅两边取对数,得lg lg lg y c x d =+, 令lg v y =,则lg lg v c x d =+,1(1234567)47x =++++++=,7211.54140i i v x ===∑,, 7172221750.1274 1.54lg 0.25140747i i i i i x v xvd x x==--⨯⨯===-⨯-∑∑,所以lg 1.540.2540.54c =-⨯=,则0.540.25v x =+, 所以y 关于x 的回归方程为0.253.4710x y =⨯; (2)设这1000份样本中检测出呈阳性的份数为X , 每份样本检测出阳性的概率为0.60.990.594P =⨯=, 由题意可知,(10000.594)XB ,,所以()10000.594594E X =⨯=份.故这1000份样本中检测出呈阳性的份数的期望为594.7.(2021·山西太原·高二期中(文))为了更好的指导青少年健康饮食,某机构调查了本地区不同身高的未成年男性,得到他们的体重的平均值,并对数据作了初步处理,得到下面的散点图及一些统计量的值.表中ln i i w y =(1)根据散点图判断,可采用x y a b =⋅作为这个地区未成年男性体重y 千克与身高x 厘米的回归方程.利用表中数据建立y 关于x 的回归方程;(2)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么该地区一名身高为175厘米,体重为78千克的在校男生的体重是否正常? 参考数据:0.020.71751.02,2,1.0231.99e e ===. 参考公式:对于一组数据()()()1122,,,,,,n n u v u v u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121ˆˆˆ,nii i nii uu v v v u uu βαβ==--==--∑∑.【答案】(1)2 1.02x y =⨯;(2)体重偏胖. 【解析】(1)由x y a b =⋅,得ln ln ln y a x b =+⋅, 设ˆˆˆw cx d=+,由表格中数据,得801ˆ0.02400050c ===, ˆ 3.40.021350.7d=-⨯=, 则0.70.02ln 0.7,ln 0.02,2, 1.02a b a e b e ======, 则y 关于x 的回归方程为2 1.02x y =⨯.(2)当175x =时,1752 1.02231.9963.98y =⨯=⨯=,因为63.98 1.276.77678⨯=<,所以该名在校男生的体重偏胖.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
教学步骤及教学内容
线性回归方程
(参考公式:b=
∑
i=1
n
x i y i-n x y
∑
i=1
n
x2i-n x2
,a=y-b x)
1.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为()
A.y
^
=x+1 B.y
^
=x+2 C.y
^
=2x+1 D.y
^
=x-1
2.在比较两个模型的拟合效果时,甲、乙两个模型的相关指数R2的值分别约为0.96和0.85,则拟合效果好的模型是()
A.甲B.乙C.甲、乙相同D.不确定
3.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算,得∑
8
i=1
x i=52,∑
8
i=1
y i=228,∑
8
i=1
x2i=478,∑
8
i=1
x i y i=1849,则其线性回归方程为()
A.y
^
=11.47+2.62x B.y
^
=-11.47+2.62x
C.y
^
=2.62+11.47x D.y
^
=11.47-2.62x
4.下表是某厂1~4月份用水量(单位:百吨)的一组数据:
月份x 123 4
用水量y 4.543 2.5
由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是y
^
=-0.7x+a,则a等于______.
5.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:
零件的个数x (个)
2 3 4 5
加工的时间y (小时)
2.5
3
4
4.5
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出y 关于x 的线性回归方程y ^
=bx +a ,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少小时?
作业布置
家长意见
家长签名:
2013 年_月_日(第_次)
审阅人:。