高中数学选修3统计案例之线性回归方程习题课
高中数学线性回归方程讲解练习题

教学步骤及教学内容线性回归方程(参考公式:b=∑i=1nx i y i-n x y∑i=1nx2i-n x2,a=y-b x)1.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为()A.y^=x+1 B.y^=x+2 C.y^=2x+1 D.y^=x-12.在比较两个模型的拟合效果时,甲、乙两个模型的相关指数R2的值分别约为0.96和0.85,则拟合效果好的模型是()A.甲B.乙C.甲、乙相同D.不确定3.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算,得∑8i=1x i=52,∑8i=1y i=228,∑8i=1x2i=478,∑8i=1x i y i=1849,则其线性回归方程为()A.y^=11.47+2.62x B.y^=-11.47+2.62xC.y^=2.62+11.47x D.y^=11.47-2.62x4.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x 123 4用水量y 4.543 2.5由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是y^=-0.7x+a,则a等于______.5.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数x(个)234 5加工的时间y(小时) 2.534 4.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程y^=bx+a,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少小时?作业布置家长意见家长签名:2013 年_月_日(第_次)审阅人:1。
高中数学选修2-3统计案例之线性回归方程习题课

1.相关关系的分类从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关.2.线性相关从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线.3.回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则b^,a^其中,b 是回归方程的斜率,a是在y轴上的截距.4.样本相关系数r=∑i=1nx i-x y i-y∑i=1nx i-x2∑i=1ny i-y2,用它来衡量两个变量间的线性相关关系.(1)当r>0时,表明两个变量正相关;(2)当r<0时,表明两个变量负相关;(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.5.线性回归模型(1)y=bx+a+e中,a、b称为模型的未知参数;e称为随机误差.(2)相关指数用相关指数R2来刻画回归的效果,其计算公式是:R2=,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好.规律(1)函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.注意(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.(2)线性回归方程中的截距和斜率都是通过样本数据估计而来的,存在误差,这种误差会导致预报结果的偏差;而且回归方程只适用于我们所研究的样本总体.考向一相关关系的判断例1.下列选项中,两个变量具有相关关系的是( )A.正方形的面积与周长B.匀速行驶车辆的行驶路程与时间C.人的身高与体重D.人的身高与视力答案:C例2.对变量x、y有观测数据(x i,y i)(i =1,2,…,10),得散点图1;对变量u,v 有观测数据(u i,v i)(i=1,2,…,10),得散点图2.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析:选C.由题图1可知,各点整体呈递减趋势,x与y负相关,由题图2可知,各点整体呈递增趋势,u与v正相关.例3.下面哪些变量是相关关系( ).A.出租车车费与行驶的里程B.房屋面积与房屋价格C.身高与体重D.铁块的大小与质量解析A,B,D都是函数关系,其中A一般是分段函数,只有C是相关关系.答案C例4.如图所示,有5组(x,y)数据,去掉________组数据后,剩下的4组数据的线性相关性最大.解析:因为A、B、C、E四点分布在一条直线附近且贴近某一直线,D点离得远.答案:D例5.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(u i、v i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( ).A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析由题图(1)可知,各点整体呈递减趋势,x与y负相关;由题图(2)可知,各点整体呈递增趋势,u与v正相关.答案C例6.下列关系属于线性负相关的是( )A.父母的身高与子女身高的关系B.球的体积与半径之间的关系C.汽车的重量与汽车每消耗1 L汽油所行驶的平均路程D.一个家庭的收入与支出解析:选C.A、D中的两个变量属于线性正相关,B中两个变量是函数关系.例7.山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):棉花产量y3334536540544545455(1)(2)判断是否具有相关关系.[审题视点] (1)用x轴表示化肥施用量,y轴表示棉花产量,逐一画点.(2)根据散点图,分析两个变量是否存在相关关系.解(1)散点图如图所示(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.利用散点图判断两个变量是否有相关关系是比较简便的方法.在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系.即变量之间具有函数关系.如果所有的样本点落在某一函数的曲线附近,变量之间就有相关关系;如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.例8. 根据两个变量x,y之间的观测数据画成散点图如图所示,这两个变量是否具有线性相关关系________(填“是”与“否”).解析从散点图看,散点图的分布成团状,无任何规律,所以两个变量不具有线性相关关系.答案否考向二线性回归方程例9.对有线性相关关系的两个变量建立的回归直线方程y^=a+bx中,回归系数b( )A.不能小于0 B.不能大于0C.不能等于0 D.只能小于0解析:选C.∵b=0时,r=0,这时不具有线性相关关系,但b能大于0也能小于0.例10.已知回归方程y^=4.4x+838.19,则可估计x与y的增长速度之比约为________.解析:x与y的增长速度之比即为回归方程的斜率的倒数14.4=1044=522.答案:5 22例11.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( ).A.y^=-10x+200 B.y^=10x+200 C.y^=-10x-200 D.y^=10x-200解析因为销量与价格负相关,由函数关系考虑为减函数,又因为x,y不能为负数,再排除C,故选A.答案A例12.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^;(3)已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程.预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)[审题视点] (2)问利用公式求a^、b^,即可求出线性回归方程.(3)问将x=100代入回归直线方程即可.解(1)由题设所给数据,可得散点图如图所示.(2)由对照数据,计算得:∑i =14x 2i =86, x =3+4+5+64= 4.5(吨),y =2.5+3+4+4.54=3.5(吨). 已知∑i =14x i y i =66.5,所以,由最小二乘法确定的回归方程的系数为:b^=∑i=14x i y i-4x·y∑i=14x2i-4x2=66.5-4×4.5×3.586-4×4.52=0.7,a^=y-b^x=3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y^=0.7x+0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:90-(0.7×100+0.35)=19.65(吨标准煤).在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具有线性相关关系,若它们之间有线性相关关系,再求回归直线方程.例13.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y对x的线性回归方程为( ).A.y=x-1 B.y=x+1C.y=88+12x D.y=176解析由题意得x=174+176+176+176+1785=176(cm),y=175+175+176+177+1775=176(cm),由于(x,y)一定满足线性回归方程,经验证知选C.答案C例14.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)回归直线方程y^=bx+a;(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.解(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:x=0,y=3.2,b=26040=6.5,a=y-b x=3.2.由上述计算结果,知所求回归直线方程为y -257=b(x-2 006)+a=6.5(x-2 006)+3.2,即y^=6.5(x-2 006)+260.2.①(2)利用直线方程①,可预测2012年的粮食需求量为6.5(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨).例15.下列有关回归直线方程y^=bx+a 的叙述正确的是( )①反映y^与x之间的函数关系;②反映y与x之间的函数关系;③表示y^与x之间的不确定关系;④表示最接近y与x之间真实关系的一条直线.A.①② B.②③C.③④ D.①④解析:选D.y^=bx+a表示y^与x之间的函数关系,而不是y与x之间的函数关系;但它反映的关系最接近y与x之间的真实关系,故选D.例16.设有一个回归方程y^=3-5x,变量x增加一个单位时( )A.y平均增加3个单位B.y平均减少5个单位C.y平均增加5个单位D.y平均减少3个单位解析:选B.∵-5是斜率的估计值,说明x每增加一个单位,y平均减少5个单位.例17.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(x n,y n),则下列说法中不.正确的是( ) A.由样本数据得到的回归方程y^=b^x+a^必过样本中心(x,y)B.残差平方和越小的模型,拟合的效果越好C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好D.若变量y和x之间的相关系数为r=-0.9362,则变量y 和x 之间具有线性相关关系解析:选C.C 中应为R 2越大拟合效果越好.例18.已知回归方程y ^=2x +1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是( )A .0.01B .0.02C .0.03D .0.04解析:选C.当x =2时,y ^=5,当x =3时,y ^=7,当x =4时,y ^=9.∴e ^1=4.9-5=-0.1,e ^2=7.1-7=0.1, e ^3=9.1-9=0.1.∴ i =13e ^i 2=(-0.1)2+(0.1)2+(0.1)2=0.03. 例19.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②回归方程y^=bx+a必过点(x,y);③曲线上的点与该点的坐标之间具有相关关系;④在一个2×2列联表中,由计算得K2=13.079,则其两个变量间有关系的可能性是90%.其中错误的是________.解析:①正确.由回归方程的定义及最小二乘法思想,知②正确.③④不正确.答案:③④例20.在2009年十一国庆8天黄金周期间,某市物价部门,对本市五个商场销售的某商品的一天销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示:价格x 99.5110.511销售量y 1110865yx具有线性相关关系,则销售量y对商品的价格x的回归直线方程为________.解析:由数据表可得x=10,y=8,离差x-x:-1,-0.5,0,0.5,1;离差y-y:3,2,0,-2,-3.∴b^=-1×3-0.5×2-0.5×2-1×3 1+0.25+0+0.25+1=-3.2,a^=y-b^x=40,∴回归直线方程为y^=-3.2x+40.答案:y^=-3.2x+40例21.在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如表:身高(cm)14315615917216517117716116416体重(kg)41496179686974696854的身高和体重之间是否有相关关系.解:以x轴表示身高,y轴表示体重,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为正相关.12.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:日期12月1日12月2日12月3日12月4日12月5日温差x(℃)101113128发芽数y(颗)2325302616组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程y^=b^x +a^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?解:(1)设抽到不相邻2组数据为事件A,因为从5组数据中选取2组数据共有10种情况,每种情况都是等可能出现的,其中抽到相邻2组数据的情况有4种,所以P(A)=1-410=35.(2)由数据求得,x=12,y=27,由公式求得.b^=52,a^=y-b^x=-3.所以y关于x的线性回归方程为y^=52x-3.(3)当x=10时,y^=52×10-3=22,|22-23|<2;当x=8时,y^=52×8-3=17,|17-16|<2.所以该研究所得到的线性回归方程是可靠的.。
2018-2019学年高中数学 第三章 统计案例课后训练 新人教A版选修2-3

第三章 统计案例[A 基础达标]1.对两个变量y 和x 进行回归分析,得到一组样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则下列说法中不正确的是( )A .由样本数据得到的回归方程y ^=b ^x +a ^必过样本点的中心(x -,y -) B .残差平方和越小的模型,拟合的效果越好C .用相关指数R 2来刻画回归效果,R 2的值越小,说明模型的拟合效果越好D .若变量y 和x 之间的相关系数r =-0.936 2,则变量y 与x 之间具有线性相关关系 解析:选C.R 2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C. 2.下列说法中正确的有:( ) ①若r >0,则x 增大时,y 也相应增大; ②若r <0,则x 增大时,y 也相应增大;③若r =1或r =-1,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上. A .①② B .②③ C .①③D .①②③解析:选C.若r >0,表示两个相关变量正相关,x 增大时,y 也相应增大,故①正确,r <0,表示两个变量负相关,x 增大时,y 相应减小,故②错误.|r |越接近1,表示两个变量相关性越高,|r |=1表示两个变量有确定的关系(即函数关系),故③正确.3.若两个变量的残差平方和是325, i =1n(y i -y ―)2=923,则随机误差对预报变量的贡献率约为( ) A .64.8% B .60% C .35.2%D .40%解析:选C.由题意可知随机误差对预报变量的贡献率约为325923≈0.352.4.有下列数据x 1 2 3 y35.9912.01A .y =3×2x -1B .y =log 2xC .y =3xD .y =x 2解析:选A .分别把x =1,2,3,代入求值,求最接近y 的值,即为模拟效果最好,故选A . 5.通过随机询问100名性别不同的小学生是否爱吃零食,得到如下的列联表:由K 2=n (ad (a +b )(c +d )(a +c )(b +d ),计算得K 2=250×50×30×70≈4.762.参照附表,得到的正确结论为( )A .在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”B .在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别无关”C .有97.5%以上的把握认为“是否爱吃零食与性别有关”D .有97.5%以上的把握认为“是否爱吃零食与性别无关”解析:选A .因为K 2≈4.762>3.841,P (K 2>3.841)=0.05.所以在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”,故选A .6.某种活性细胞的存活率y (%)与存放温度x (℃)之间有如下几组样本数据:6 ℃时,该种细胞的存活率的预报值为________%.解析:设回归直线方程为y ^=-3.2x +a ^,因为x ―=1,y ―=50,则a ^=y ―+3.2x ―=53.2.当x =6时,y ^=-3.2×6+53.2=34. 答案:347.已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y =3e 2x +1的图象附近,则可通过转换得到的线性回归方程为________. 解析:由y =3e2x +1,得ln y =ln (3e2x +1),即ln y =ln 3+2x +1,令u =ln y ,v =x ,则线性回归方程为u =1+ln 3+2v . 答案:u =1+ln 3+2x (其中u =ln y )8.为了调查患慢性气管炎是否与吸烟有关,调查了100名50岁以下的人,调查结果如下表:________的前提下认为患慢性气管炎与吸烟有关. 附:K 2=n (ad -(a +b )(c +d )(a +c )(b +d ).解析:K 2的观测值k =100×(20×55-20×5)240×60×25×75≈22.2>10.828.所以在犯错误的概率不超过0.001的前提下认为患慢性气管炎与吸烟有关. 答案:22.2 0.0019.某学校高三年级有学生1 000名,经调查,其中750名同学经常参加体育锻炼(称为A 类同学),另外250名同学不经常参加体育锻炼(称为B 类同学),现用分层抽样方法(按A 类、B 类分两层)从该年级的学生中共抽查100名同学,如果以身高达165 c m 作为达标的标准,对抽取的100名学生,得到以下列联表:(1)(2)能否在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系(K 2的观测值精确到0.001)? 解:(1)填写列联表如下:身高达标 身高不达标总计 经常参加体育锻炼 40 35 75 不经常参加体育锻炼10 15 25 总计5050100(2)由列联表中的数据,得K 2的观测值为 k =100×(40×15-35×10)275×25×50×50≈1.333<3.841.所以不能在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系. 10.某城市理论预测2011年到2015年人口总数与年份的关系如表所示:年份2011+x (年) 0 1 2 3 4 人口数y (十万)5781119(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^; (3)据此估计2018年该城市人口总数. 解:(1)散点图如图:(2)因为x ―=0+1+2+3+45=2,y ―=5+7+8+11+195=10,a ^=y ―-b ^x ―=3.6;所以线性回归方程为y ^=3.2x +3.6. (3)令x =7,则y ^=3.2×7+3.6=26.即估计2018年该城市人口总数为26十万.[B 能力提升]11.(2018·河南洛阳3月模拟)某省电视台为了解该省卫视一档成语类节目的收视情况,抽查东、西部各5个城市,得到观看该节目的人数的统计数据(单位:千人),并画出如下茎叶图,其中一个数字被污损.东部 西部 9 8 83 3 72 1 09 · 9(1)求东部各城市观看该节目的观众的平均人数超过西部各城市观看该节目的观众的平均人数的概率;(2)该节目的播出极大地激发了观众对成语知识学习积累的热情,现从观看节目的观众中随机统计了4位观众学习成语知识的周均时间(单位:小时)与年龄(单位:岁),并整理了如下对照表:年龄x20 30 40 50 周均学习成语知识时间y2.5344.5根据表中数据,试求线性回归方程y ^=b ^x +a ^,并预测年龄为60岁的观众周均学习成语知识的时间.解:(1)设被污损的数字为a ,则a 有10种情况.由88+89+90+91+92>83+83+87+90+a +99,得a <8,所以有8种情况使得东部各城市观看该节目的观众的平均人数超过西部各城市观看该节目的观众的平均人数, 所求概率为810=45.a ^=y -b ^x =3.5-7100×35=2120.所以y ^=7100x +2120.当x =60时,y ^=5.25.即预测年龄为60岁的观众周均学习成语知识的时间为5.25小时.12.(选做题)为了调查某地区成年人血液的一项指标,现随机抽取了成年男性、女性各20人组成一个样本,对他们的这项血液指标进行了检测,得到了如下茎叶图.根据医学知识,我们认为此项指标大于40为偏高,反之即为正常.(1)依据上述样本数据研究此项血液指标与性别的关系,列出2×2列联表,并判断能否在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系?(2)以样本估计总体,视样本频率为概率,现从本地区随机抽取成年男性、女性各2人,求此项血液指标为正常的人数X 的分布列及数学期望.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d ,P (K 2≥k 0)0.025 0.010 0.005 k 05.0246.6357.879解:(1)由茎叶图可得正常 偏高 合计 男性 16 4 20 女性 12 8 20 合计281240K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=40×(16×8-4×12)220×20×28×12≈1.905<6.635,所以不能在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系. (2)由样本数据可知,男性正常的概率为45,女性正常的概率为35.此项血液指标为正常的人数X 的可能取值为0,1,2,3,4,P (X =0)=(1-45)2(1-35)2=4625, P (X =1)=C 1245(1-45)(1-35)2+(1-45)2C 1235(1-35)=44625, P (X =2)=⎝ ⎛⎭⎪⎫452⎝ ⎛⎭⎪⎫1-352+C 1245⎝ ⎛⎭⎪⎫1-45C 1235·⎝ ⎛⎭⎪⎫1-35+⎝ ⎛⎭⎪⎫1-452⎝ ⎛⎭⎪⎫352=169625, P (X =3)=C 1245⎝ ⎛⎭⎪⎫1-45⎝ ⎛⎭⎪⎫352+⎝ ⎛⎭⎪⎫452C 1235·⎝ ⎛⎭⎪⎫1-35=264625,P (X =4)=⎝ ⎛⎭⎪⎫452⎝ ⎛⎭⎪⎫352 =144625, 所以X 的分布列为所以E (X )=0×625+1×625+2×625+3×625+4×625=2.8, 即此项血液指标为正常的人数X 的数学期望为2.8.。
高中数学第三章统计案例3.1第2课时线性回归分析达标练习含解析2_3

第三章统计案例3.1 回归分析的基本思想及其初步应用第2课时线性回归分析A级基础巩固一、选择题1.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做实验,并用回归分析方法分别求得相关系数r与残差平方和m如下表所示:分类甲乙丙丁r 0.820。
780.690。
85m 106115124103则哪位同学的试验结果体现A、B两变量有更强的线性相关性()A.甲B.乙C.丙D.丁解析:r越接近1,相关性越强,残差平方和m越小,相关性越强,所以选D正确.答案:D2.已知回归方程错误!=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9。
1),则残差平方和是()A.0。
01 B.0。
02 C.0.03 D.0.04解析:因为残差错误!i=y i-错误!i,所以残差的平方和为(4。
9-5)2+(7。
1-7)2+(9.1-9)2=0。
03。
答案:C3.若某地财政收入x与支出y满足线性回归模型y=bx+a +e(单位:亿元),其中b=0.8,a=2,|e|〈0.5,如果今年该地区财政收入10亿元,年支出预计不会超过()A.10亿元B.9亿元C.10。
5亿元D.9。
5亿元解析:x=10时,错误!=0。
8×10+2=10.因为|e|〈0.5,所以年支出预计不会超过10.5亿元.答案:C4.下列说法中正确的是()①相关系数r用来衡量两个变量之间线性关系的强弱,|r|越接近于1,相关性越弱;②回归直线错误!=错误!x+错误!一定经过样本点的中心(x,y);③随机误差e满足E(e)=0,其方差D(e)的大小用来衡量预报的精确度;④相关指数R2用来刻画回归的效果,R2越小,说明模型的拟合效果越好.A.①②B.③④C.①④D.②③解析:①线性相关关系r是衡量两个变量之间线性关系强弱的量,|r|越接近于1,这两个变量线性相关关系越强,|r|越接近于0,线性相关关系越弱,①错误;②回归直线错误!=错误!x +错误!一定通过样本点的中心(x,y),②正确;③随机误差e是衡量预报精确度的一个量,它满足E(e)=0,③正确;④用相关指数R2用来刻画回归的效果,R2越大,说明模型的拟合效果越好,④错误.答案:D5.如图所示,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是()A.相关系数r变大B.残差平方和变大C.相关指数R2变大D.解释变量x与预报变量y的相关性变强解析:由散点图知,去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.答案:B二、填空题6.若一组观测值(x1,y1),(x2,y2),…,(x n,y n)之间满足y i=bx i+a+e i(i=1,2,…,n),且e i恒为0,则R2为________.解析:由e i恒为0,知y i=错误!i,即y i-错误!i=0,答案:17.根据如下样本数据得到的回归方程为错误!=错误!x+错误!,若错误!=5。
高中数学第三章统计案例3_2回归分析课后导练苏教版选修23

高中数学 第三章 统计案例 回归分析课后导练 苏教版选修2-3基础达标某运动员训练次数与运动成绩之间的数据关系如下: 次数(x ) 32 33 35 37 39 44 46 成绩(y )25343739424851试求y 与x 之间的回归直线方程. 解析:∵x =38,y =,∴∑=71i i i y x =10 756,∑=712i i x =10 280,∑=712i i y =11 340.∴b ^=∑∑==--71227177i ii iixxy x yx =,a ^=y -b ^x =.∴回归直线方程为y^=考察硫酸铜在水中的溶解度y 与温度x 的关系时,做了9组试验,其数据如下: 温度x /℃ 0 10 20 30 40 50 60 70 80 溶解度y /g求:(1)回归直线方程;(2)相关系数r . 解析:(1)利用计算器分别求出x ,y ,∑=712i i x ,∑=912i iy,∑=91i ii yx ,利用回归直线公式可求出b ^= 2,a ^=可知,回归直线方程为y^= 2x +.(2)将上述数据代入相关系数公式,可得r= 4.水深x /m 流速y /(m·s -1)(2)预测水深为 m 时水的流速是多少?序号 xy x 2x y1 2 3 4 5 6 7 8 ∑于是,x =81×=,y =81×= 5. b ^=694.0151175.1892.249775.175.18993.272≈=⨯-⨯⨯- =1511≈. a ^= 5-1511×≈.y 对x 的回归直线方程为y^=a ^+b ^x =+.回归系数b ^=的意思是,在此灌溉渠道中,水深每增加 m ,水的流速平均增加 m /s(本例数据是以 m 为水深间隔测得的),a ^=可以解释为水的流速中不受水深影响的部分. (2)由(1)中求出的回归直线方程,把x =代入,易得y^=+×≈(m /s). 计算结果表明,当水深为 m 时可以预测水的流速约为 m /s.4.从某地成年男子中随机抽取n 人,测得平均身高x =172 c m,标准差s x = c m,平均体重y =72k g,标准差s y = k g,相关系数r =yyxx xy l l l =.求由身高估计平均体重的回归方程y ^=β^0+β^1x ,以及由体重估计平均身高的回归方程x ^=a ^+b ^y .解析:∵s x =n l xx,s y =nl yy ,∴nl n l nl yy xxxy •==××=. ∴β^1=26.776.57=nl n l xxxy=1. 于是可得b =212122121)125.18(12808.298475.2125.1812243.541212⨯-⨯⨯-=--∑∑==i ii iixxy x yx ≈. β^0=y -x β^1=72-172×1=-100,∴由身高估计平均体重的回归方程为y^=x -100.由x 、y 位置的对称性,得b^=22.1576.57=nlnlyyxy=.∴a^= x-y b^=172-72×=154.∴由体重估计平均身高的回归方程为x^=+154.5.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组数据: xy(1)画出散点图;(2)求月总成本y与月产量x之间的回归直线方程.解析:(1)画出的散点图如图所示.(2)通过计算器可得b^≈,a^=y-b^x= ×125.18≈.因此所求的回归直线方程是y^=+.6.已知10只狗的血球体积及红血球数的测量值如下表:血球体积x(mm)45 42 46 48 42 35 58 40 39 50红血球数y(百万)思路分析:求回归直线方程,就是由公式计算b^与a^的值.解析:由题意,得x=,y=,设回归直线方程为同y^=b^x+a^则b^=∑∑==--niiniiix nxy x nyx1221≈,a^=.故所求的回归直线方程为y^=调查者通过询问男、女大学生在购买食品时是否看营养说明得到的数据如下表所示:看营养说明不看营养说明总计男大学生23 32 55女大学生9 25 34总计32 57 89利用列联表的独立性检验估计看营养说明是否与性别有关系?思路分析:根据列联表中的数据代入公式求得χ2的值,进行比较判断得出相应结论.解:由公式得χ2=57323455)9322523(89))()()(()(22⨯⨯⨯⨯-⨯⨯=++++-d b c a d c b a bc ad n ≈<,所以我们没有理由认为看营养说明与男女性别有关,尽管在这次调查中男性看营养说明的比例5523比女性看营养说明的比例349高,但我们不能认为这些男、女大学生中男性比女性看营养说明的多.8.某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从这个工业部门内随机抽选了10个企业作样本,有如下资料: 产量(千件) x 生产费用(千元)y 40 150 42 140 48 160 55 170 65 150产量(千件)x 生产费用(千元)y 79 162 88 185 100 165 120 190 140185(2)对这两个变量之间是否线性相关进行相关性检验;(3)设回归直线方程为y ^=b ^x +a ^,求系数a ^,b ^. i x iy i x i 2y i 2x i y i1 40 150 1600 22500 60002 42 140 1764 19600 58803 48 160 2304 25600 7680 4 55 170 3 025 28 900 9 350 5 65 150 4 225 22 500 9 7506 79 162 6 241 26 244 12 7987 88 185 7 744 34 225 16 280 8 100 165 10 000 27 225 16 5009 120 190 14 400 36 100 22 800 10 140 185 19 600 34 225 25 900 合计7771 65770 903277 119132 929x =,y=,∑=1012i i x =70 903,∑=1012i i y =277 119,∑=101i ii yx =132 929r=)7.16510277119)(7.771070903(7.1657.771013292922⨯-⨯-⨯⨯-,即x 与y 的相关系数r≈.(2)查表显著性水平,自由度10-2=8.相应的相关系数临界值r = 9;因为r>,所以可以认为x 与y 之间具有线性相关关系. (3)b ^=27.7710709037.1657.7710132929⨯-⨯⨯-≈; a ^=综合运用9.已知10只狗的血球体积及红血球数的测量值如下表:x :血球体积(mm)y :红血球数(百万)45 42 46 48 42 39 50 35 58 40(1)画出上表的散点图;(2)求出回归直线并画出图形. 解析:(1)见下图:(2)x =101(45+42+46+48+42+35+58+40+39+50)=, y =101+++++++++=. 设回归直线的方程为y ^=b ^x +a ^,则b ^=∑∑==--ni ini iixn xy x n yx 1221 =,a ^=y -b x =.所以所求的回归直线为y ^=炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x 与冶炼时间y (从炉料熔化完毕到出钢的时间)的一列数据,如下表所示:x %) 104 180 190 177 147 134 150 191 204 121 y (mi n ) 100 200 210 185 155 135 170205235125(1)y 与x 是否具有线性相关关系?(2)如果y 与x 具有线性相关关系,求回归直线方程.(3)预测当钢水含碳量为160个%时,应冶炼多少分钟? 思路分析:(1)判定两个变量是否具有线性相关关系,可通过计算相关系数与临界值关系;(2)设回归直线方程,依公式代入相关量计算可得;(3)把x =160代入回归直线方程求解可得. 解:(1)根据题意列表并计算如下: i1 2 3 4 5 6 7 8 9 10 x i104 180 190 177 147 134 150 191 204 121 y i100200210185155135170205235125x i y i 10400 36000 39900 32745 22785 18090 25500 39155 47940 15125x =,y =172,∑=1012i ix=265 448,∑=1012i iy=312 350,∑=101i ii yx i=287 640于是r=∑∑∑===---1011012222101)10(1010i i i ii iiy y x xyx yx ≈ 6,查表得显著性水平与n -2的相关系数临界值=, ∴r>.∴y 与x 具有线性相关关系. (2)设所求的回归直线方程为y^=b ^x +a ^,b ^=∑∑==--101221011010i ii iixxy x yx ≈,a ^≈,即所求的回归直线方程为y ^=当x =160时,y ^=×≈172(m i n ),即大约冶炼172 m i n . 11.研究某特殊药物A 有无副作用(比如服用后恶心),给50个患者服用此药,给另外50个患者服用安慰剂,记录每类样本中出现恶心的数目如下表: 有恶心 无恶心 合计 给药A 153550给安慰剂 4 46 50 合计1981100试问此药物有无恶心的副作用?思路分析:根据列联表中的数据代入公式求得χ2的值,与临界值进行比较判断得出相应结论.解:由题意,问题可以归纳为独立检验假设H 1:服该药物(A )与恶心(B )独立.为了检验假设,计算统计量χ2=81195050)3544615(1002⨯⨯⨯⨯-⨯⨯≈>.故拒绝H 1,即不能认为药物无恶心副作用,也可以说,我们有99%的把握说,该药物与副作用(恶心)有关.12.为了了解某地母亲身高x 与女儿身高y 的相关关系,随机测得10对母女的身高,如下表所示:母亲身高x /c m 159 160 160 163 159 154 159 158 159 157 女儿身高y /c m158 159 160161161155162157162156试对x 与y 进行一元线性回归分析,并预测当母亲身高为161 c m 时女儿的身高为多少? 解析:先对x 与y 作相关性检验.(1)作统计假设:x 与y 不具有线性相关关系. (2)由小概率与n -2=8在附表中查得=. (3)x =101(159+160+…+157)=, y =101(158+159+…+156)=, ∑=-1012210i i x x =(1592+1602+…+1572)-10×=,∑=101i ii yx -10x y =(159×158+160×159+…+157×156)-10××=,∑=1012i iy-10y 2=(1582+1592+…+1562)-10×=,所以r=9.566.472.37⨯≈.(4)|r|=>,即|r|>.从而有95%的把握认为x 与y 之间具有线性相关关系,去求回归直线方程是有意义的. 回归系数b ^=6.472.37≈≈, a ^=所以y 对x 的回归直线方程是y ^=+.回归系数反映出当母亲身高每增加1 c m时女儿身高平均增加 c m,a^=可以解释为女儿身高不受母亲身高变化影响的部分.当x=161时,y^=+×161=.这就是说当母亲身高为161 c m时女儿的身高大致也接近161 c m.。
最新苏教版高中数学必修三《线性回归方程》课时同步练习及解析.docx

(新课标)2018-2019学年苏教版高中数学必修三2.4 线性回归方程课时目标 1.理解两个变量的相关关系的概念.2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系.3.会求线性回归方程.1.与函数关系不同,相关关系是一种有关系,但不是确定性的关系.2.能用直线方程________近似表示的相关关系叫做线性相关关系,该方程叫______,给出一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),线性回归方程中的系数a ,b 满足⎩⎪⎨⎪⎧b = a =.上式还可以表示为⎩⎪⎨⎪⎧b = ,a = .一、填空题1.下列两个变量之间的关系,不是函数关系的为______.(填序号) ①匀速行驶车辆的行驶距离与时间; ②圆半径与圆的面积;③正n 边形的边数与内角度数之和; ④人的年龄与身高.2.下列有关线性回归的说法,不正确的是________.①变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;②在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图;③线性回归方程最能代表观测值x 、y 之间的关系; ④任何一组观测值都能得到具有代表意义的线性回归方程.3.工人月工资(元)依劳动生产率(千元)变化的线性回归方程为 =60+90x ,下列判断正确的是________.①劳动生产率为1千元时,工资为50元; ②劳动生产率提高1千元时,工资提高150元;③劳动生产率提高1千元时,工资约提高90元;④劳动生产率为1千元时,工资90元.4.某商品销售量y(件)与销售价格x(元/件)在实际生活中的回归方程可能是________.①=-10x+200;②=10x+200;③=-10x-200;④=10x-200.5.给出两组数据x、y的对应值如下表,若已知x、y是线性相关的,且线性回归方程:y=a+bx,经计算知:b=-1.4,则a=________.x 45678y 121098 66.线性回归方程表示的直线=a+bx必经过点____________.7.若对某个地区人均工资x与该地区人均消费y进行调查统计得y与x具有相关关系,且线性回归方程=0.7x+2.1(单位:千元),若该地区人均消费水平为10.5,则估计该地区人均消费额占人均工资收入的百分比约为________.8.设有一个回归方程=3-2.5x,当变量x增加一个单位时,变量y________个单位.9.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y对总成绩x的线性回归方程为=6+0.4x.由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差______分.二、解答题10.下表是某旅游区游客数量与平均气温的对比表:平均气温(℃)-1410131826数量(百个)202434385064若已知游客数量与平均气温是线性相关的,求回归方程.11.5个学生的数学和物理成绩(单位:分)如下表:学生A B C D E学科数学8075706560物理7066686462画出散点图,判断它们是否具有相关关系,若相关,求出回归方程.能力提升12.在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下:温度x(℃)010205070溶解度y 66.776.085.0112.3128.0则由此得到回归直线的斜率约为________.13.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据,如下表所示:x(0.01% )104181917714713415191204121y(min)10202118515513517205235125若由数据知y对x呈线性相关关系.(1)求线性回归方程.(2)预测当钢水含碳量为160时,应冶炼多少分钟?1.线性回归方程=bx+a中的系数a,b的计算公式为:⎩⎪⎨⎪⎧b =∑ni =1(x i -x )(y i -y )∑n i =1 (x i -x )2=∑ni =1x i y i -n x y ∑ni =1x 2i -n x 2a =y -b x其中:b 是回归方程的斜率,a 是截距. 2.回归方程的求解过程 计算x ,y ,∑ni =1x 2i ,∑ni =1x i y i ⇓计算b =∑ni =1x i y i -n x y ∑n i =1x 2i -n x 2,a =y -b x⇓3.在回归方程 =bx +a 中,当回归系数b >0时,说明两个变量呈正相关关系,它的意义是:当x 每增加一个单位时y 就增加b 个单位;当b <0时,说明两个变量呈负相关关系,它的意义是:当x 每增加一个单位时,y 就减少b 个单位.2.4 线性回归方程知识梳理2. =bx +a 线性回归方程 n ∑ni =1x i y i -(∑ni =1x i )(∑ni =1y i )n ∑ni =1x 2i -(∑ni =1x i )2y -b x∑ni =1x i y i -n x y ∑ni =1x 2i -n x2=∑ni =1(x i -x )(y i -y )∑ni =1(x i -x )2y -b x作业设计 1.④解析 人的年龄与身高具有相关关系. 2.④解析 只有所有的数据点都分布在一条直线附近时,才能得到回归直线. 3.③解析 因工人月工资与劳动生产率变化的线性回归方程为 =60+90x ,当x 由a 提高到a +1时, 2- 1=60+90(a +1)-60-90a =90. 4.①解析 ∵在实际生活中,当销售价格提高时,商品销售量一般要降低,∴排除②、④,又∵③中x>0时 <0不合题意,∴③错. 5.17.4 解析x =15(4+5+6+7+8)=6,y =15(12+10+9+8+6)=9.a =y -b x =9+1.4×6=9+8.4=17.4. 6.(x ,y )解析 由a =y -b x 得y =b x +a , 即点(x ,y )适合方程 =a +bx. 7.87.5%解析 设该地区人均工资收入为y , 则y =0.7x +2.1,当y =10.5时,x =10.5-2.10.7=12.10.512×100%=87.5%. 8.减少2.5解析′=3-2.5(x+1)=3-2.5x-2.5=-2.5,因此,y的值平均减少2.5个单位.9.20解析令两人的总成绩分别为x1,x2.则对应的数学成绩估计为=6+0.4x1,2=6+0.4x2,所以| 1-2|=|0.4(x1-x2)|=0.4×50=20.10.解x=706=353,y=2306=1153,∑6i=1x2i=1+16+100+169+324+676=1 286,∑6i=1x i y i=-20+96+340+13×38+18×50+26×64=3 474.b=∑6i=1x i y i-6x y∑6 i=1x2i-6x2=3 474-6×353×11531 286-6×(353)2≈1.68,a=y-b x≈18.73,即所求的回归方程为=1.68x+18.73.11.解以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为线性相关.列表,计算i 1 2 3 4 5x i80 75 70 65 60y i70 66 68 64 62x i y i 56004950476041603720x2i 64005625490042253600x=70,y=66,∑5i=1x2i=24 750,∑5i=1x i y i=23 190设所求回归方程为=bx+a,则由上表可得b=∑5i=1x i y i-5x y∑5 i=1x2i-5x2=90250=0.36,a =y -b x =40.8.∴所求回归方程为 =0.36x +40.8. 12.0.880 9 解析x =30,y =93.6,∑5i =1x 2i =7 900,∑5i =1x i y i =17 035,所以回归直线的斜率b =∑5i =1x i y i -5x y ∑5i =1x 2i -5x 2=17 035-5×30×93.67 900-4 500≈0.880 9.13.解 (1)列出下表,并用科学计算器进行计算: i 1 2 3 4 5 6 7 8 9 10 x i 104 180 190 177 147 134 150 191 204 121 y i 100 200 210 185 155 135 170 205 235 125 x i y i10400360003990032745227851809025500391554794015 125x =159.8,y =172,∑10i =1x 2i =265 448,∑10i =1y 2i =312 350,∑10i =1x i y i =287 640 设所求线性回归方程为 =bx +a ,b =∑10i =1x i y i -10x y∑10i =1x 2i -10x2≈1.27,a =y -b x ≈-30.95.即所求的线性回归方程为 =1.27x -30.95.(2)当x =160时, =1.27×160-30.95≈172(min ),即大约冶炼172 min .。
一元线性回归分析案例

求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。
解:1、选取身高为自变量x,体重为因变量y,作散点图:
2、由散点图知道身高和体重有比较好的线性相 关关系,因此可以用线性回归方程刻画它们之间 的关系。
第17页/共39页
课题:选修2-3 8.5 回归分析案例
分析:由于问题中要求根 据身高预报体重,因此选 取身高为自变量,体重为 因变量.
再冷的石头,坐上三年也会暖 !
1. 散点图;
2.回归方程: yˆ 0.849x 85.172 身高172cm女大学生体重 yˆ = 0.849×172 - 85.712 = 60.316(kg)
本例中, r=0.798>0.75.这表明体重与身高有很强的线性相关关系,从而也表明我们 建立的回归模型是有意义的。
xi2
2
nx
,......(2)
i 1
i 1
其中x
1 n
n i 1
xi ,
y
1 n
n i 1
yi .
(x, y) 称为样本点的中心。
第8页/共39页
课题:选修2-3 8.5 回归分析案例
再冷的石头,坐上三年也会暖 !
1、回归直线方程
1、所求直线方程叫做回归直线方程;
相应的直线叫做回归直线。
2、对两个变量进行的线性分析叫做线性回归分析。
然后,我们可以通过残差 e1, e2 , , en 来判断模型拟合的效果,
判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析。
表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据。
编号 1
2
3
4
5
人教版高中数学第三章3.1第2课时线性回归分析

+
8.95
+
9.90
+
10.9
+
11.8)≈9.487,
所以 R2=1-01.40.16378184≈0.999 1, 所以回归模型的拟合效果较好.
(3)由表中数据可以看出残差点比较均匀地落在不超 过 0.15 的狭窄的水平带状区域中,说明选用的线性回归 模型的精度较高,由以上分析可知,弹簧长度与拉力成线 性关系.由残差表中的数值可以看出第 3 个样本点的残差 比较大,需要确认在采集这个数据的时候是否有人为的错 误,如果有的话,需要纠正数据,重新建立回归模型.
由公式得:^z =0.69x+1.115,则有^y=e0.69x+1.115. (2)由计数器得如下数表:
^y 6.08 12.12 24.17 48.18 96.06 191.52 y 6 12 25 49 95 190
R2=1-244.8614621.8≈0.999 8, 即解释变量天数对预报变量繁殖细菌个数解释了 99.98%.
x 21 23 25 27 29 32 35 z 1.946 2.398 3.045 3.178 4.190 4.745 5.784
利用公式求得回归直线方程为^z =0.272x-3.849, 所以^y =e0.272x-3.849
残差:
yi 7
11
21
24
66 115
yi 6.443 11.101
解析:因为^z =0.25x-2.58,^z =ln y,所以 y=e0.25x
-2.58.
答案:y=e0.25x-2.58
类型 1 线性回归分析(自主研析)
[典例 1] 为研究重量 x(单位:克)对弹簧长度 y(单位: 厘米)的影响,对不同重量的 6 个物体进行测量,数据如 下表所示:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.相关关系的分类从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关.2.线性相关从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线.3.回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则b^,a^其中,b是回归方程的斜率,a是在y轴上的截距.4.样本相关系数r=∑i=1n(x i-x)(y i-y)∑i=1n(x i-x)2∑i=1n(y i-y)2,用它来衡量两个变量间的线性相关关系.(1)当r>0时,表明两个变量正相关;(2)当r<0时,表明两个变量负相关;(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.5.线性回归模型(1)y=bx+a+e中,a、b称为模型的未知参数;e称为随机误差.(2)相关指数用相关指数R2来刻画回归的效果,其计算公式是:R2=,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好.规律(1)函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.注意(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.(2)线性回归方程中的截距和斜率都是通过样本数据估计而来的,存在误差,这种误差会导致预报结果的偏差;而且回归方程只适用于我们所研究的样本总体.考向一相关关系的判断例1.下列选项中,两个变量具有相关关系的是( )A.正方形的面积与周长B.匀速行驶车辆的行驶路程与时间C.人的身高与体重D.人的身高与视力答案:C例2.对变量x、y有观测数据(x i,y i)(i =1,2,…,10),得散点图1;对变量u,v 有观测数据(u i,v i)(i=1,2,…,10),得散点图2.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析:选C.由题图1可知,各点整体呈递减趋势,x与y负相关,由题图2可知,各点整体呈递增趋势,u与v正相关.例3.下面哪些变量是相关关系().A.出租车车费与行驶的里程B.房屋面积与房屋价格C.身高与体重D.铁块的大小与质量解析A,B,D都是函数关系,其中A一般是分段函数,只有C是相关关系.答案 C例4.如图所示,有5组(x,y)数据,去掉________组数据后,剩下的4组数据的线性相关性最大.解析:因为A、B、C、E四点分布在一条直线附近且贴近某一直线,D点离得远.答案:D例5.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v 有观测数据(u i、v i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断().A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析由题图(1)可知,各点整体呈递减趋势,x与y负相关;由题图(2)可知,各点整体呈递增趋势,u与v正相关.答案 C例6.下列关系属于线性负相关的是( )A.父母的身高与子女身高的关系B.球的体积与半径之间的关系C.汽车的重量与汽车每消耗1 L汽油所行驶的平均路程D.一个家庭的收入与支出解析:选C.A、D中的两个变量属于线性正相关,B中两个变量是函数关系.例7.山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):(1)画出散点图;(2)判断是否具有相关关系.[审题视点] (1)用x轴表示化肥施用量,y轴表示棉花产量,逐一画点.(2)根据散点图,分析两个变量是否存在相关关系.解(1)散点图如图所示(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.利用散点图判断两个变量是否有相关关系是比较简便的方法.在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系.即变量之间具有函数关系.如果所有的样本点落在某一函数的曲线附近,变量之间就有相关关系;如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.例8. 根据两个变量x,y之间的观测数据画成散点图如图所示,这两个变量是否具有线性相关关系________(填“是”与“否”).解析从散点图看,散点图的分布成团状,无任何规律,所以两个变量不具有线性相关关系.答案否考向二线性回归方程例9.对有线性相关关系的两个变量建立的回归直线方程y^=a+bx中,回归系数b( )A.不能小于0 B.不能大于0C.不能等于0 D.只能小于0解析:选C.∵b=0时,r=0,这时不具有线性相关关系,但b能大于0也能小于0.例10.已知回归方程y^=4.4x+838.19,则可估计x与y的增长速度之比约为________.解析:x与y的增长速度之比即为回归方程的斜率的倒数14.4=1044=522.答案:5 22例11.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是().A.y^=-10x+200 B.y^=10x+200 C.y^=-10x-200 D.y^=10x-200 解析因为销量与价格负相关,由函数关系考虑为减函数,又因为x,y不能为负数,再排除C,故选A.答案 A例12.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^;(3)已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程.预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)[审题视点] (2)问利用公式求a ^、b ^,即可求出线性回归方程.(3)问将x =100代入回归直线方程即可. 解 (1)由题设所给数据,可得散点图如图所示.(2)由对照数据,计算得: i =14x 2i =86, x =3+4+5+64= 4.5(吨),y =2.5+3+4+4.54=3.5(吨).已知∑i =14x i y i =66.5,所以,由最小二乘法确定的回归方程的系数为:b ^=∑i =14x i y i -4x ·y ∑i =14x 2i-4x 2=66.5-4×4.5×3.586-4×4.52=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y ^=0.7x +0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为: 90-(0.7×100+0.35)=19.65(吨标准煤).在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具有线性相关关系,若它们之间有线性相关关系,再求回归直线方程.例13.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高x/cm 174176176176178儿子身高y/cm 175175176177177则y对x的线性回归方程为().A.y=x-1 B.y=x+1C.y=88+12x D.y=176解析由题意得x=174+176+176+176+1785=176(cm),y=175+175+176+177+1775=176(cm),由于(x,y)一定满足线性回归方程,经验证知选C.答案 C例14.某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程y^=bx+a;(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.解(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:对预处理后的数据,容易算得,x=0,y=3.2,b=26040=6.5,a=y-b x=3.2.由上述计算结果,知所求回归直线方程为y -257=b(x-2 006)+a=6.5(x-2 006)+3.2,即y^=6.5(x-2 006)+260.2.①(2)利用直线方程①,可预测2012年的粮食需求量为6.5(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨).例15.下列有关回归直线方程y^=bx+a 的叙述正确的是( )①反映y^与x之间的函数关系;②反映y与x之间的函数关系;③表示y^与x之间的不确定关系;④表示最接近y与x之间真实关系的一条直线.A.①② B.②③C.③④ D.①④解析:选D.y^=bx+a表示y^与x之间的函数关系,而不是y与x之间的函数关系;但它反映的关系最接近y与x之间的真实关系,故选D.例16.设有一个回归方程y^=3-5x,变量x增加一个单位时( )A.y平均增加3个单位B.y平均减少5个单位C.y平均增加5个单位D.y平均减少3个单位解析:选B.∵-5是斜率的估计值,说明x每增加一个单位,y平均减少5个单位.例17.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(x n,y n),则下列说法中不.正确的是( ) A.由样本数据得到的回归方程y^=b^x+a^必过样本中心(x,y)B.残差平方和越小的模型,拟合的效果越好C.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好D.若变量y和x之间的相关系数为r =-0.9362,则变量y和x之间具有线性相关关系解析:选C.C中应为R2越大拟合效果越好.例18.已知回归方程y^=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是( )A .0.01B .0.02C .0.03D .0.04解析:选C.当x =2时,y ^=5, 当x =3时,y ^=7,当x =4时,y ^=9.∴e ^1=4.9-5=-0.1,e ^2=7.1-7=0.1, e ^3=9.1-9=0.1.∴ i =13e ^i 2=(-0.1)2+(0.1)2+(0.1)2=0.03.例19.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②回归方程y ^=bx +a 必过点(x ,y ); ③曲线上的点与该点的坐标之间具有相关关系;④在一个2×2列联表中,由计算得K2=13.079,则其两个变量间有关系的可能性是 90%.其中错误的是________.解析:①正确.由回归方程的定义及最小二乘法思想,知②正确.③④不正确.答案:③④例20.在2009年十一国庆8天黄金周期间,某市物价部门,对本市五个商场销售的某商品的一天销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示:价格x 99.5110.511销售量y 11186 5通过分析,发现销售量对商品的价格x具有线性相关关系,则销售量y对商品的价格x的回归直线方程为________.解析:由数据表可得x=10,y=8,离差x-x:-1,-0.5,0,0.5,1;离差y-y:3,2,0,-2,-3.∴b^=-1×3-0.5×2-0.5×2-1×3 1+0.25+0+0.25+1=-3.2,a^=y-b^x=40,∴回归直线方程为y^=-3.2x+40.答案:y^=-3.2x+40例21.在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如表:身高(cm)14315615917216517117716116416体重(kg)41496179686974696854 根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系.解:以x轴表示身高,y轴表示体重,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为正相关.12.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:该农科所确定的研究方案是:先从这5组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程y^=b^ x+a^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?解:(1)设抽到不相邻2组数据为事件A,因为从5组数据中选取2组数据共有10种情况,每种情况都是等可能出现的,其中抽到相邻2组数据的情况有4种,所以P(A)=1-410=35.(2)由数据求得,x=12,y=27,由公式求得.b^=52,a^=y-b^x=-3.所以y关于x的线性回归方程为y^=5 2 x-3.(3)当x=10时,y^=52×10-3=22,|22-23|<2;当x=8时,y^=52×8-3=17,|17-16|<2.所以该研究所得到的线性回归方程是可靠的.。