2019-2020学年高中数学课时分层作业1回归分析相关系数可线性化的回归分析

合集下载

2019_2020学年高中数学第1章统计案例11.1回归分析1.2相关系数1.3可线性化的回归分析学案北师大版选修1_2

2019_2020学年高中数学第1章统计案例11.1回归分析1.2相关系数1.3可线性化的回归分析学案北师大版选修1_2

1.1 回归分析1.2 相关系数1.3 可线性化的回归分析1.回归分析设变量y 对x 的线性回归方程为y =a +bx ,由最小二乘法知系数的计算公式为:b =l xyl xx=∑i =1n(x i -x )(y i -y)∑i =1n(x i -x)2=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a =y -b x .2.相关系数 (1)相关系数r 的计算假设两个随机变量的数据分别为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则变量间线性相关系数r =l xyl xx l yy=∑i =1n(x i -x )(y i -y)∑i =1nx i y i -n x y(2)相关系数r 与线性相关程度的关系 ①r 的取值范围为[-1,1];②|r|值越大,误差Q越小,变量之间的线性相关程度越高;③|r|值越接近0,误差Q越大,变量之间的线性相关程度越低.3.相关性的分类(1)当r>0时,两个变量正相关;(2)当r<0时,两个变量负相关;(3)当r=0时,两个变量线性不相关.思考:所有的两个相关变量都可以来求回归方程吗?[提示] 不一定.如果两个相关变量的相关性很强,可以求出回归方程,当几乎没有相关性时就不可以求出回归方程.4.可线性化的回归分析(1)非线性回归分析对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型.(2)非线性回归方程1.变量y与x之间的回归方程( )A.表示y与x之间的函数关系B.表示y与x之间的不确定性关系C.反映y与x之间真实关系的形式D.反映y与x之间的最大限度的真实关系的形式[答案] D2.某产品的广告费用x 与销售额y 的统计数据如下表:售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元B [x =4+2+3+54=3.5,y =49+26+39+544=42,∴a =y -b x =42-9.4×3.5=9.1,∴回归方程为y =9.4x +9.1,∴当x =6时,y =9.4×6+9.1=65.5,故选B.] 3.下列数据x ,y 符合哪一种函数模型( )A.y =2+3xB .y =2e xC .y =2e 1xD .y =2+ln xD [分别将x 的值代入解析式判断知满足y =2+ln x .]变量间的相关关系及判定【例1】 (1)对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图①,对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图②.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关(2)两个变量x ,y 与其线性相关系数r 有下列说法:①若r >0,则x 增大时,y 也随之相应增大;②若r <0,则x 增大时,y 也相应增大;③若r =1或r =-1,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上,其中正确的有( )A .①②B .②③C .①③D .①②③(3)有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和其身体健康情况;④正方形的边长和面积;⑤汽车的重量和百公里耗油量.其中两个变量成正相关的是( )A .①③B .②④C .②⑤D .④⑤思路点拨:可借助于线性相关概念及性质作出判断.(1)C (2)C (3)C [(1)由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关,故选C.(2)根据两个变量的相关性与其相关系数r 之间的关系知,①③正确,②错误,故选C. (3)其中①③成负相关关系,②⑤成正相关关系,④成函数关系,故选C.]线性相关系数的理解1.线性相关系数是从数值上来判断变量间的线性相关程度,是定量的方法.与散点图相比较,线性相关系数要精细得多,需要注意的是线性相关系数r 的绝对值小,只是说明线性相关程度低,但不一定不相关,可能是非线性相关.2.利用相关系数r 来检验线性相关显著性水平时,通常与0.75作比较,若r >0.75,则线性相关较为显著,否则为不显著.1.下列两变量中具有相关关系的是( ) A .正方体的体积与边长 B .人的身高与体重C .匀速行驶车辆的行驶距离与时间D .球的半径与体积B [选项A 中正方体的体积为边长的立方,有固定的函数关系;选项C 中匀速行驶车辆的行驶距离与时间成正比,也是函数关系;选项D 中球的体积是43π与半径的立方相乘,有固定函数关系.只有选项B中人的身高与体重具有相关关系.]求线性回归方程【例2】(1)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4)(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )A.r2<r1<0 B.0<r2<r1C.r2<0<r1D.r2=r1(2)某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:②气象部门预测下个月的平均气温约为6 ℃,据此估计该商场下个月毛衣的销售量.思路点拨:(1)可利用公式求解;(2)把月平均气温代入回归方程求解.(1)C[对变量X与Y而言,Y随X的增大而增大,故变量Y与X正相关,即r1>0;对变量U与V而言,V随U的增大而减小,故变量V与U负相关,即r2<0.故r2<0<r1.](2)解:①由散点图易判断y与x具有线性相关关系.x=(17+13+8+2)÷4=10,y=(24+33+40+55)÷4=38,4x i y i=17×24+13×33+8×40+2×55=1 267,∑i=14x2i=526,∑i=1b =∑i =1x i y i -4x y∑4i =1x 2i -4x2=1 267-4×10×38526-4×102≈-2.0,a =y -b x ≈38-(-2.0)×10=58.0,所以线性回归方程为y =-2.0x +58.0.②气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月毛衣的销售量为y =-2.0x +58.0=-2.0×6+58.0=46(件).回归分析的理解1.回归分析是定义在具有相关关系的两个变量基础上的,因此,在做回归分析时,要先判断这两个变量是否相关,利用散点图可直观地判断两个变量是否相关.2.利用回归直线,我们可以进行预测.若回归直线方程y =a +bx ,则x =x 0处的估计值为y 0=a +bx 0.3.线性回归方程中的截距a 和斜率b 都是通过样本估计而得到的,存在着误差,这种误差可能导致预报结果的偏差,所以由线性回归方程给出的是一个预报值而非精确值.4.回归直线必过样本点的中心点.2.某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得到下表数据:(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y =bx +a ; (3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力. [解] (1)如图:(2)∑i =1x i y i =6×2+8×3+10×5+12×6=158,x =6+8+10+124=9,y =2+3+5+64=4, ∑ni =1x 2i =62+82+102+122=344,b =158-4×9×4344-4×92=1420=0.7, a =y -b x =4-0.7×9=-2.3,故线性回归方程为y =0.7x -2.3.(3)由(2)中线性回归方程知当x =9时,y =0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.可线性化的回归分析[探究问题]1.如何解答非线性回归问题?[提示] 非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图像作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:2.已知x 和y 之间的一组数据,则下列四个函数中,模拟效果最好的为哪一个?①y 2③y=4x; ④y=x2.[提示] 观察散点图中样本点的分布规律可判断样本点分布在曲线y=3×2x-1附近.所以模拟效果最好的为①.【例3】某地区不同身高的未成年男性的体重平均值如下表:(2)如果一名在校男生身高为168 cm,预测他的体重约为多少?思路点拨:先由散点图确定相应的拟合模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.[解] (1)根据表中的数据画出散点图,如下:由图看出,这些点分布在某条指数型函数曲线y=c1e c2x的周围,于是令z=ln y,列表如下:由表中数据可求得z与x之间的回归直线方程为z=0.693+0.020x,则有y=e0.693+0.020x.(2)由(1)知,当x=168时,y=e0.693+0.020×168≈57.57,所以在校男生身高为168 cm,预测他的体重约为57.57 kg.两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y =c 1e c 2x,我们可以通过对数变换把指数关系变为线性关系,令z =ln y ,则变换后样本点应该分布在直线z =bx +a (a =ln c 1,b =c 2)的周围.3.在一次抽样调查中测得样本的5个样本点,数据如下表:[解] 作出变量y 与x 之间的散点图如图所示.由图可知变量y 与x 近似地呈反比例函数关系.设y =k x,令t =1x,则y =kt .由y 与x 的数据表可得y 与t 的数据表:由图可知y 与t 呈近似的线性相关关系.又t =1.55,y =7.2,∑i =15t i y i =94.25,∑i =15t 2i =21.312 5,b =∑i =15t i y i -5t y∑i =15t 2i -5t 2=94.25-5×1.55×7.221.312 5-5×1.552≈4.134 4,a =y -b t =7.2-4.134 4×1.55≈0.8,∴y =4.134 4t +0.8.所以y 与x 的回归方程是y =4.134 4x+0.8.1.回归分析的注意事项(1)回归方程只适用于我们所研究的样本的总体.如:不能用女大学生的身高和体重之间的回归方程,描述女运动员的身高和体重之间的关系.同样,不能用生长在南方多雨地区的树木的高与直径之间的回归方程,描述北方干旱地区的树木的高与直径之间的关系.(2)我们所建立的回归方程一般都有时间性.例如,不能用20世纪80年代的身高体重数据所建立的回归方程,描述现在的身高和体重之间的关系.(3)样本取值的范围限制了回归方程的适用范围.例如,我们的回归方程是由女大学生身高和体重的数据建立的,那么用它来描述一个人幼儿时期的身高和体重之间的关系是不恰当的(即在回归方程中,变量x 的样本的取值范围为[155,170](单位:cm),而用这个方程计算x =70 cm 时的y 值,显然不合适).(4)不能期望回归方程得到的值就是变量的精确值.它是变量的可能取值的平均值. 2.求非线性回归方程的步骤 (1)确定变量,作出散点图.(2)根据散点图,选择恰当的拟合函数.(3)关系变换,通过关系变换把非线性回归问题转化为线性回归问题,并求出线性回归方程.(4)分析拟合效果:通过计算相关指数或画残差图来判断拟合效果. (5)根据相应的交换,写出非线性回归方程.1.判断正误(1)两个变量的相关系数r >0,则两个变量正相关.( ) (2)两个变量的相关系数越大,它们的相关程度越强.( ) (3)若两个变量负相关,那么其回归直线的斜率为负.( ) [答案] (1)√ (2)× (3)√2.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y =0.85x -85.71,则下列结论中不正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kgD [回归方程中x 的系数为0.85>0,因此y 与x 具有正的线性相关关系,A 正确; 易知回归直线过样本点的中心(x ,y ),B 正确;依据回归方程中b 的含义可知,x 每变化1个单位,y 相应变化约0.85个单位,C 正确;用回归方程对总体进行估计不能得到肯定结论,故D 不正确.]3.对具有线性相关关系的变量x 和y ,由测得的一组数据求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.y =6.5x -10 [由题意知x =2,y =3,b =6.5,所以a =y -b x =3-6.5×2=-10,即回归直线的方程为y =6.5x -10.]4.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:(2)用所求回归方程预测该地区2019年(t =6)的人民币储蓄存款. 附:回归方程y =bt +a 中,b =∑i =1nt i y i -n t y∑i =1nt 2i -n t 2,a =y -b t .[解] (1)列表计算如下:这里n =5,t =1n ∑i =1n t i =155=3,y =1n ∑i =1n y i =365=7.2.又l tt =∑i =1nt 2i -n t 2=55-5×32=10,l ty =∑i =1nt i y i -n t -y -=120-5×3×7.2=12,从而b =l ty l tt =1210=1.2, a =y -b t =7.2-1.2×3=3.6,故所求回归方程为y =1.2t +3.6.(2)将t =6代入回归方程可预测该地区2019年的人民币储蓄存款为y =1.2×6+3.6=10.8(千亿元).。

2019-2020学年高中数学 课时分层作业2 回归分析(含解析)新人教B版选修1-2

2019-2020学年高中数学 课时分层作业2 回归分析(含解析)新人教B版选修1-2

课时分层作业(二)(建议用时:40分钟)[基础达标练]一、选择题1.在画两个变量的散点图时,下面叙述正确的是( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上[解析] 结合线性回归模型y =bx +a +ε可知,解释变量在x 轴上,预报变量在y 轴上,故选B.[答案] B2.在回归分析中,相关指数r 的绝对值越接近1,说明线性相关程度( ) A .越强 B .越弱 C .可能强也可能弱D .以上均错[解析] ∵r =∑x i y i -n x y(∑x 2i -n x -2)(∑y 2i -n y -2)∴|r |越接近于1时,线性相关程度越强,故选A. [答案] A3.已知x 和y 之间的一组数据则y 与x 的线性回归方程y =bx +a 必过点( )A .(2,2) B.⎝ ⎛⎭⎪⎫32,0 C .(1,2) D.⎝ ⎛⎭⎪⎫32,4 [解析] ∵x =14(0+1+2+3)=32,y =14(1+3+5+7)=4,∴回归方程y ^=bx +a 必过点⎝ ⎛⎭⎪⎫32,4.[答案] D4.已知人的年龄x 与人体脂肪含量的百分数y 的回归方程为y ^=0.577x -0.448,如果某人36岁,那么这个人的脂肪含量( )A .一定是20.3%B .在20.3%附近的可能性比较大C .无任何参考数据D .以上解释都无道理[解析] 将x =36代入回归方程得y ^=0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.[答案] B5.某产品的广告费用x (万元)与销售额y (万元)的统计数据如下表所示,根据表中数据可得回归方程y ^=bx +a 中的b ^=10.6.据此模型预测广告费用为10万元时的销售额为( )A C .111.9万元D .113.9万元[解析] 由题表中数据得x =3.5,y =43.由于回归直线y ^=bx +a 过点(x ,y ),且b ^=10.6,解得a ^=5.9,所以线性回归方程为y ^=10.6x +5.9,于是x =10时,y ^=111.9. [答案] C 二、填空题6.已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且线性回归方程为y ^=0.95x +2.6,那么表格中的数据m 的值为________.[解析] x =4=2,y =4=4,把(x -,y -)代入回归方程得11.3+m4=0.95×2+2.6,解得m =6.7.[答案] 6.77.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.[解析] 根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1. [答案] 18.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.[解析] 以x +1代x ,得y ^=0.254(x +1)+0.321,与y ^=0.254x +0.321相减可得,年饮食支出平均增加0.254万元.[答案] 0.254 三、解答题9.关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:如由资料可知(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?附:a ^=y -b ^x -,b ^=∑x i y i -n x -y -∑x 2i -n x2[解] (1)x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+7.05=5,∑i =15x 2i =90,∑i =15x i y i =112.3,b ^=∑x i y i -5x -y -∑x 2i -5x 2=112.3-5×4×590-5×42=1.23. 于是a ^=y -b ^x =5-1.23×4=0.08.所以线性回归方程为:y ^=bx +a =1.23x +0.08. (2)当x =10时,y ^=1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用是12.38万元.10.在一次抽样调查中测得样本的5个样本点,数值如下表:试建立y 与x 之间的回归方程.[解] 作出变量y 与x 之间的散点图如图所示.由图可知变量y 与x 近似地呈反比例函数关系.设y =k x,令t =1x ,则y =kt .由y 与x 的数据表可得y 与t 的数据表:作出y 与t由图可知y 与t 呈近似的线性相关关系.又t -=1.55,y -=7.2,∑5i =1t i y i =94.25,∑5i =1t 2i =21.312 5, b ^=∑t i y i -5t -y -∑t 2i -5t -2=94.25-5×1.55×7.221.312 5-5×1.552≈4.134 4,a ^=y --b ^t -=7.2-4.134 4×1.55≈0.8,∴y ^=4.134 4t +0.8.即y 与x 之间的回归方程为y ^=4.134 4x+0.8.[能力提升练]1.对于下列表格所示的五个散点,已知求得的线性回归直线方程为y ^=0.8x -155.则实数m 的值为( )A .8B .8.2C .8.4D .8.5[解析] 依题意得x =15×(196+197+200+203+204)=200,y =15×(1+3+6+7+m )=17+m 5,因为回归直线必经过样本点的中心,所以17+m5=0.8×200-155,解得m =8,选A.[答案] A2.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:A .y =x -1B .y =x +1C .y =88+12xD .y =176[解析] 因为x =174+176+176+176+1785=176,y =175+175+176+177+1775=176,而回归方程经过样本中心点,所以排除A ,B ,又身高的整体变化趋势随x 的增大而增大,排除D ,所以选C.[答案] C3.以模型y =c e kx去拟合一组数据时,为了求出回归方程,设z =ln y ,其变换后得到线性回归方程z =0.3x +4,则c =________.[解析] 由题意得:ln(c e kx)=0.3x +4, ∴ln c +kx =0.3x +4, ∴ln c =4,∴c =e 4. [答案] e 44.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w ]=8∑ i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘法估计分别为β^=∑ni =1 (u i -u )(v i -v )∑ni =1 (u i -u )2,α^=v -β^u . [解] (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑i =18(w i -w )(y i -y)∑i =18(w i -w)2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6, 年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12.所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.。

2019_2020学年高中数学课时分层作业15回归分析(含解析)苏教版选修2_3

2019_2020学年高中数学课时分层作业15回归分析(含解析)苏教版选修2_3

课时分层作业(十五) 回归分析(建议用时:60分钟)[基础达标练]一、选择题1.关于回归分析,下列说法错误的是( ) A .回归分析是研究两个具有相关关系的变量的方法 B .线性相关系数可以是正的或负的 C .回归模型中一定存在随机误差 D .散点图明确反映变量间的关系D [用散点图反映两个变量间的关系时,存在误差,故D 错误.]2.在回归分析中,相关系数r 的绝对值越接近1,说明线性相关程度( ) A .越强 B .越弱 C .可能强也可能弱D .以上均错A [∵r =∑i =1n(x i -x )(y i -y)(∑i =1nx 2i -n x 2)(∑i =1ny 2i -n y 2),∴|r |越接近1时,线性相关程度越强,故选A.]3.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到回归直线方程y ^=b ^x +a ^,那么下列说法中不正确的是( )A .直线y ^=b ^x +a ^必经过点(x ,y )B .直线y ^=b ^x +a ^至少经过点(x 1,y 1)(x 2,y 2),…,(x n ,b n )中的一个点C .直线y ^=b ^x +a ^的斜率为∑i =1nx i y i -n x y∑i =1nx 2i -n x 2D .直线y ^=b ^x +a ^的纵截距为y -b ^xB [回归直线可以不经过任何一个点,所以B 错误.选B.]4.已知人的年龄x 与人体脂肪含量的百分数y 的回归方程为y ^=0.577x -0.448,如果某人36岁,那么这个人的脂肪含量( )A .一定是20.3%B .在20.3%附近的可能性比较大C .无任何参考数据D .以上解释都无道理B [将x =36代入回归方程得y ^=0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.]5.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元B [由题意得x =8.2+8.6+10.0+11.3+11.95=10,y =6.2+7.5+8.0+8.5+9.85=8,所以a ^=8-0.76×10=0.4, 所以y ^=0.76x +0.4, 把x =15代入得到y ^=11.8.] 二、填空题6.如图所示,对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图(1);对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图(2).由这两个散点图可以判断________.①变量x 与y 正相关,u 与v 正相关; ②变量x 与y 正相关,u 与v 负相关; ③变量x 与y 负相关,u 与v 正相关; ④变量x 与y 负相关,u 与v 负相关.③ [由图(1)知,x 与y 是负相关,由图(2)知,u 与v 是正相关,故③正确.] 7.一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:由表中数据算出线性回归方程y =b x +a 中的b ≈-2.气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月羽绒服的销售量的件数约为________.46 [∵样本点的中心为(10,38), ∴38=-2×10+a ^. ∴a ^=58,即y ^=-2x +58. ∴当x =6时,y =46.]8.在2019年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:由散点图可知,销售量y 与价格x 之间有较强的线性相关关系,其线性回归方程是y ^=-3.2x +40,且m +n =20,则其中的n =________.10 [x =9+9.5+m +10.5+115=8+m5,y =11+n +8+6+55=6+n 5,回归直线一定经过样本点中心(x ,y ), 即6+n5=-3.2⎝ ⎛⎭⎪⎫8+m 5+40,即3.2m +n =42. 又因为m +n =20,即⎩⎪⎨⎪⎧3.2m +n =42,m +n =20,解得⎩⎪⎨⎪⎧m =10,n =10,故n =10.] 三、解答题 9.对于数据组:(1)(2)求线性回归方程.。

2019 2020高中数学课时分层作业1回归分析相关系数可线性化的回归分析含解析北师大版选修

2019 2020高中数学课时分层作业1回归分析相关系数可线性化的回归分析含解析北师大版选修

课时分层作业(一)(建议用时:60分钟)[基础达标练]一、选择题1.下列结论正确的是( )①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①② B.①②③D.①②③④ C.①②④C [函数关系和相关关系的区别是前者是确定性关系,后者是非确定性关系,故①②正确;回归分析是对具有相关关系的两个变量进行统计分析的一种方法,故③错误,④正确.]xyyx的线性回归方程必过点( 和之间的一组数据,则).下表是2关于47 (1.5,4) BA.(2,3) .(2.5,5)C.(2.5,4)D.xy),线性回归方程必过样本点的中心( ,C [即(2.5,4),故选C.]xyyx-0.4480.577已知人的年龄,与人体脂肪含量的百分数如果某的回归方程为=3.人36岁,那么这个人的脂肪含量( )A.一定是20.3%B.在20.3%附近的可能性比较大C.无任何参考数据D.以上解释都无道理xy=0.577×36-0.448≈36代入回归方程得20.3.由回归分析的意义知,这个B[将=人的脂肪含量在20.3%附近的可能性较大,故选B.]4.某学校开展研究性学习活动,某同学获得一组试验数据如下表:6.1218.01 对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是( )1??x??yyx 2A.=-2 .B =??2.12yxxy-1)=DC..=log( 22xy值与已知数据差的平方和最小的便是拟合程代入检验,当取相应的值时,所得D [度最高的.]xyxyxynxxx不全相等),…,)(,,.在一组样本数据5(的,)(),(,…,,≥2,nnn2121121xyinyx+1都在直线上,则这组样本数据的)(=1,2,…,=散点图中,若所有样本点(),ii2样本相关系数为( )A.-1 B.01D .1C.2D [所有点均在直线上,则样本相关系数最大即为1,故选D.]二、填空题6.回归分析是处理变量之间________关系的一种数量统计方法.相关 [回归分析是处理变量之间相关关系的一种数量统计方法.]yyrxx),<07.已知某个样本点中的变量,则在以,(线性相关,相关系数为坐标原点的坐标系下的散点图中,大多数的点都落在第________象限.rb<0,∵<0时二、四 [∴大多数点落在第二、四象限.]8.某中学期中考试后,对成绩进行分析,从某班中选出5名学生的总成绩和外语成绩如下表:则外语成绩对总成绩的回归直线方程是________.482+383+421+364+362x xy=402.4,14.68+ [∵=0.132=578+65+71+64+61y=67.8,=55?2x819 794. 132 496+131 044=++=232 324146 689+177 241ii=15?xy=37 596+24 895+29 891+23 296+22 082=137 760iii1=5?yyxx-5iii1=137 760-5×402.4×67.8b==≈0.132,5×402.4819 7945?22xx5-ii1=a=67.8-0.132×402.4≈2-14.68,∴yx+0.132∴方程为14.68.] =三、解答题xy(万元)和所支出的维修费用,有如下的统计资料: 9.关于某设备的使用年限6 呈线性相关关系.试求:对若由资料可知(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少??yxxyn-iii=1-baybx.n--附:==,-n?22xxn-ii1=2+3+4+5+6x==4,] (1) [解52.2+3.8+5.5+6.5+7.0y=5,=555??2xxy=112.3,,=90 iiiii=1=15--?yxxy5-iii1=112.3-5×4×5b=1.23. ==290-5×45?22xx 5-ii 1=aybx =5于是-1.23×4==-0.08.yx +1.23所以线性回归方程为0.08.=xy =1.23×10+0.08=12.38(时,10万元), 当(2)=即估计使用10年时维修费用是12.38万元.名学生的数学和物理成绩如下表:5.某班10.(1)求物理成绩的相关系数;关于数学成绩 (2)求物理成绩的回归直线方程.对数学成绩1 x ,63)66+=(1)73.2=×(88+76+73+[解] 51 y 67.8. 64+61)==×(78+65+71+ 55yx 25 054. =88×78+76×65+73×71+66×64+63×61=∑iii 1=5222222x 27 174. 63=73+66∑+=88+76+ii 1=5222222y 23 167. 61=+64∑+=78+65+71ii 1=5 xynxy ∑-ii 5i 1= 22yryn ) =-?∑∴ i 522xnx ?-?∑ ii =1i 1=25 054-5×73.2×67.8904 3. ≈0.=22?-5×67.8??23 167?27 174-5×73.2rxy 具有线性相关关系. 1,故可判断两变量由于与的值接近于(2)由(1)知,求回归直线方程是有意义的. 回归系数:5xynxy ∑ -ii25 054-5×73.2×67.8i 1=b =≈0.625,=2527 174-5×73.2 22xx 5∑-ii 1=aybx =67.8 =-0.625×73.2=-22.05.yxyx +0.625对22.05.的回归直线方程是:=所以[能力提升练]2tyy 的线性回归方程,,若将其转化为关于1α+ .已知函数模型为1=sin α2sin +t )( =则需作变换.221)(sin α α +B .A .sin12.以上都不对DC .(sin α+) 22ytyty =(sin α+是关于1)B [的一次函数.因为是关于,若的线性回归方程,即2tytyt ]=与变量,此时变量是线性相关关系.令(sin =α+1),则可得yx 与2.已知之间的几组数据如下表:.若某同学根据上表中的前两组数假设根据上表数据所得线性回归直线方程为+=′,则以下结论正确的是( ′ +据(1,0)和(2,2)求得的直线方程为)′=bbaabbaa ′<′,>B ′ .A . >>′,bbaabbaa ′<′,D<.′, ><′ C .ab ′.求′, C [由(1,0),(2,2)2-0b =2,′= 2-1a ′=0-2×1=-2.ba时,求,6?xy=0+4+3+12+15+24=58,iii=113yx=,=3.5,66?2x=91,++9+1625+36=1+4ii=11358-6×3.5×65b==∴,291-6×3.571351351a-,×3.5=-=-=37266abba<′,′.]>∴)单位:万盒.某同学在研究性学习中,收集到某制药厂今年前35个月甲胶囊生产产量( 的数据如下表所示:x )(月份 1 2 3 4 5,则估计该制药厂6月份生产甲胶囊产量0.7若,线性相关,线性回归方程为=+)( 为A.8.1万盒 B.8.2万盒D.8.6万盒 C.8.9万盒xaxyy=3.9,3,-0.7=6,则A [由题意知==xy=8.1.]6∴时,=xyyx线性相关,且线性回归方程.已知的取值如下表所示,由散点图分析可知,与4yxm 的值为________.+2.6,那么表格中的数据为=0.954 mm+11.3+4.8++3+42.2+4.30+1--xyxy)(代入回归方,=2,,把=6.7 [==444m+11.3m=6.7.]=0.95×2+2.6,解得程得4yx(万元)资料如下:5.某商店各个时期的商品流通率 (%)和商品零售额x2.82.1 的变动关系为一条递减的曲线.经济理论和实际经验都证明,流通与散点图显示出试根+率=决定于商品的零售额.,体现着经营规模效益,假定它们之间存在关系式:xba的估计值,并估计商品零售额为30据上表数据,求出万元时的商品流通率.与1buuya=,则,得下表数据:=][解设+x2.82.1 nuy=3.21,=10,=0.060 4,进而可得102uu 2≈0.004 557 3,-∑10ii1=10?yuuy≈0.256 35,-10iii=10.256 35b≈56.25,=0.004 557 3ubya=-0.187 5-,=56.25y=-0.187 5所求的回归方程为+.xxy=1.687 5,即商品零售额为30万元时,商品流通率约为时,当=301.687 5%.。

【优质部编】2019-2020高中数学 课时分层作业1 回归分析的基本思想及其初步应用 新人教A版选修1-2

【优质部编】2019-2020高中数学 课时分层作业1 回归分析的基本思想及其初步应用 新人教A版选修1-2

课时分层作业(一) 回归分析的基本思想及其初步应用(建议用时:40分钟)[基础达标练]一、选择题1.在画两个变量的散点图时,下面叙述正确的是( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上B [结合线性回归模型y =bx +a +e 可知,解释变量在x 轴上,预报变量在y 轴上,故选B.] 2.在回归分析中,相关指数R 2的值越大,说明残差平方和( ) A .越大 B .越小 C .可能大也可能小D .以上均错B [∵R 2=1-∑i =1ny i -y ^i2∑i =1ny i -y2,∴当R 2越大时,∑i =1n(y i -y ^i )2越小,即残差平方和越小,故选B.]3.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:若x ,y 线性相关,线性回归方程为y =0.7x +a ,估计该制药厂6月份生产甲胶囊产量为( )【导学号:48662007】A .8.0万盒B .8.1万盒C .8.9万盒D .8.6万盒B [回归直线一定过样本点的中心.由已知数据可得x =3,y =6,代入线性回归方程,可得a ^=y -0.7x =3.9,即线性回归方程为y ^=0.7x +3.9.把x =6代入,可近似得y ^=8.1,故选B.]4.某化工厂为预测某产品的回收率y ,而要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18x i y i =1 849,则y 与x 的线性回归方程是( )A.y ^=11.47+2.62xB.y ^=-11.47+2.62xC.y ^=2.62+11.47xD.y ^=11.47-2.62xA [由题中数据得x =6.5,y =28.5,∴b ^=∑i =18x i y i -8x·y∑i =18x 2i -8x 2=1 849-8×6.5×28.5478-8×6.52=367140≈2.62, a ^=y -b ^x ≈28.5-2.62×6.5=11.47,∴y 与x 的线性回归方程是y ^=2.62x +11.47,故选A.]5.若某地财政收入x 与支出y 满足回归方程y ^=b ^x +a ^+e i (单位:亿元)(i =1,2,…),其中b ^=0.8,a ^=2,|e i |<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过( )【导学号:48662008】A .10亿元B .9亿元C .10.5亿元D .9.5亿元C [y ^=0.8×10+2+e i =10+e i , ∵|e i |<0.5,∴9.5<y ^<10.5.] 二、填空题6.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.1 [根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.]7.对具有线性相关关系的变量x 和y ,由测得的一组数据求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.【导学号:48662009】y ^=-10+6.5x [由题意知x =2,y =3,b ^=6.5,所以a ^=y -b ^x =3-6.5×2=-10,即回归直线的方程为y ^=-10+6.5x .]8.已知方程y ^=0.85x -82.71是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,y ^的单位是kg ,那么针对某个体(160,53)的残差是________.-0.29 [把x =160代入y ^=0.85x -82.71,得y ^=0.85×160-82.71=53.29, 所以残差e ^=y -y ^=53-53.29=-0.29.] 三、解答题9.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:(1)图1­1­1(2)求出y 关于x 的线性回归方程y ^=b ^x +a ^,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少时间?(注:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a ^=y -b ^x )[解] (1)散点图如图.(2)由表中数据得∑i =14x i y i =52.5,x =3.5,y =3.5,∑i =14x 2i =54,所以b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2=0.7,所以a ^=y -b ^x =1.05. 所以y ^=0.7x +1.05. 回归直线如图中所示.(3)将x =10代入线性回归方程,得y ^=0.7×10+1.05=8.05,所以预测加工10个零件需要8.05小时. 10.已知某商品的价格x (元)与需求量y (件)之间的关系有如下一组数据:(1)(2)求出回归直线方程;【导学号:48662010】(3)计算R 2的值,并说明回归模型拟合程度的好坏(参考数据:x =18,y =7.4,∑i =15x 2i =1 660,∑i =15y 2i =327,∑i =15xi y i =620,∑i =15 (y i -y ^i )2=0.3,∑i =15(y i -y )2=53.2).[解] (1)散点图如图所示:(2)因为x =18,y =7.4,∑i =15x 2i =1 660,∑i =15y 2i =327,∑i =15x i y i =620,所以b ^=∑i =15x i y i -5 x y∑i =15x 2i -5x 2=-1.15,a ^=y -b ^x =28.1.即所求回归直线方程为:y ^=-1.15x +28.1.(3)∑i =15 (y i -y ^i )2=0.3,∑i =15(y i -y )2=53.2,R 2=1-∑i =15y i -y ^i2∑i =15y i -y2≈0.994.故回归模型的拟合效果较好.[能力提升练]1.已知x 与y 之间的一组数据如下表:已求得y 关于x 的线性回归方程为y =2.1x +0.85,则m 的值为( )【导学号:48662011】A .1B .0.85C .0.7D .0.5D [∵x =0+1+2+34=32,y =m +3+5.5+74=m +15.54,∴这组数据的样本中心点是⎝ ⎛⎭⎪⎫32,m +15.54.∵y 关于x 的线性回归方程为y ^=2.1x +0.85, ∴m +15.54=2.1×32+0.85,解得m =0.5.∴m 的值为0.5.]2.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归方程为y =b x +a .若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′C [x =1+2+3+4+5+66=72,y =0+2+1+3+3+46=136,b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2=57, a ^=y -b ^x =-13,b ′=2-02-1=2>b ^,a ′=-2<a ^.] 3.在对两个变量进行回归分析时,甲、乙分别给出两个不同的回归方程,并对回归方程进行检验.对这两个回归方程进行检验时,与实际数据(个数)的对比结果如下:甲 [可以根据表中数据分析,两个回归方程对数据预测的正确率进行判断,甲回归方程的数据准确率为3240=45,而乙回归方程的数据准确率为4060=23.显然甲的准确率高些,因此甲回归方程好些.]4.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量x (单位:千箱)与单位成本y (单位:元)的资料进行线性回归分析,结果如下:x=72,y =71,∑i =16x 2i =79,∑i =16x i y i =1 481.则销量每增加1 000箱,单位成本下降________元. 【导学号:48662012】1.818 2 [由题意知b ^=1 481-6×72×7179-6×⎝ ⎛⎭⎪⎫722≈-1.818 2,a ^=71-(-1.818 2)×72≈77.36,y ^=-1.818 2x +77.36,销量每增加1千箱,则单位成本下降1.818 2元.]5.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y ^=b ^x +a ^,其中b ^=-20,a ^=y -b ^x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)[解] (1)由于x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80.所以a ^=y -b ^x =80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得L =x (-20x +250)-4(-20x +250)=-20x 2+330x -1 000=-20⎝⎛⎭⎪⎫x -3342+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.。

2019-2020年北师大版选修1-2高中数学1.1.3《可线性化的回归分析》word习题导学案

2019-2020年北师大版选修1-2高中数学1.1.3《可线性化的回归分析》word习题导学案

2019-2020年北师大版选修1-2高中数学1.1.3《可线性化的回归分析》word习题导学案1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;2. 通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法.3. 了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较.一、基础过关3.对于指数曲线y=a e bx,令u=ln y,c=ln a,经过非线性化回归分析之后,可以转化成的形式为( )A.u=c+bx B.u=b+cxC.y=b+cx D.y=c+bx4.下列说法错误的是( )A.当变量之间的相关关系不是线性相关关系时,也能直接用线性回归方程描述它们之间的相关关系B.把非线性回归化为线性回归为我们解决问题提供一种方法C.当变量之间的相关关系不是线性相关关系时,也能描述变量之间的相关关系D.当变量之间的相关关系不是线性相关关系时,可以通过适当的变换使其转换为线性关系,将问题化为线性回归分析问题来解决5.每一吨铸铁成本y c(元)与铸件废品率x%建立的回归方程y c=56+8x,下列说法正确的是( )A.废品率每增加1%,成本每吨增加64元B.废品率每增加1%,成本每吨增加8%C.废品率每增加1%,成本每吨增加8元D .如果废品率增加1%,则每吨成本为56元二、能力提升7. 研究人员对10个家庭的儿童问题行为程度(X )及其母亲的不耐心程度(Y )进行了评价结果如下,家庭1,2,3,4,5,6,7,8,9,10,儿童得分:72,40,52,87,39,95,12,64,49,46,母亲得分:79,62,53,89,81,90,10,82,78,70. 下列哪个方程可以较恰当的拟合( )A .y =0.771 1x +26.528B .y =36.958ln x -74.604C .y =1.177 8x 1.014 5D .y =20.924e0.019 3x8. 已知x ,y 之间的一组数据如下表:则y 与x 之间的线性回归方程y =bx +a 必过点________.9. 已知线性回归方程为y =0.50x -0.81,则x =25时,y 的估计值为________. 10.在一次抽样调查中测得样本的5个样本点,数值如下表:方程.11.某地区六年来轻工业产品利润总额y 与年次x 的试验数据如下表所示:0b 均为正数,求y 关于x 的回归方程.(保留三位有效数字)。

2019_2020学年高中数学课时分层作业2回归分析含解析新人教b版选修1_2

2019_2020学年高中数学课时分层作业2回归分析含解析新人教b版选修1_2

课时分层作业(二)(建议用时:40分钟)[基础达标练]一、选择题1.在画两个变量的散点图时,下面叙述正确的是( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上[解析] 结合线性回归模型y =bx +a +ε可知,解释变量在x 轴上,预报变量在y 轴上,故选B.[答案] B2.在回归分析中,相关指数r 的绝对值越接近1,说明线性相关程度( ) A .越强 B .越弱 C .可能强也可能弱D .以上均错[解析] ∵r =∑x i y i -n x y(∑x 2i -n x -2)(∑y 2i -n y -2)∴|r |越接近于1时,线性相关程度越强,故选A. [答案] A3.已知x 和y 之间的一组数据则y 与x 的线性回归方程y =bx +a 必过点( )A .(2,2) B.⎝ ⎛⎭⎪⎫32,0 C .(1,2) D.⎝ ⎛⎭⎪⎫32,4 [解析] ∵x =14(0+1+2+3)=32,y =14(1+3+5+7)=4,∴回归方程y ^=bx +a 必过点⎝ ⎛⎭⎪⎫32,4.[答案] D4.已知人的年龄x 与人体脂肪含量的百分数y 的回归方程为y ^=0.577x -0.448,如果某人36岁,那么这个人的脂肪含量( )A .一定是20.3%B .在20.3%附近的可能性比较大C .无任何参考数据D .以上解释都无道理[解析] 将x =36代入回归方程得y ^=0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.[答案] B5.某产品的广告费用x (万元)与销售额y (万元)的统计数据如下表所示,根据表中数据可得回归方程y ^=bx +a 中的b ^=10.6.据此模型预测广告费用为10万元时的销售额为( )A C .111.9万元D .113.9万元[解析] 由题表中数据得x =3.5,y =43.由于回归直线y ^=bx +a 过点(x ,y ),且b ^=10.6,解得a ^=5.9,所以线性回归方程为y ^=10.6x +5.9,于是x =10时,y ^=111.9. [答案] C 二、填空题6.已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且线性回归方程为y ^=0.95x +2.6,那么表格中的数据m 的值为________.[解析] x =4=2,y =4=4,把(x -,y -)代入回归方程得11.3+m4=0.95×2+2.6,解得m =6.7.[答案] 6.77.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.[解析] 根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1. [答案] 18.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.[解析] 以x +1代x ,得y ^=0.254(x +1)+0.321,与y ^=0.254x +0.321相减可得,年饮食支出平均增加0.254万元.[答案] 0.254 三、解答题9.关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:如由资料可知(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?附:a ^=y -b ^x -,b ^=∑x i y i -n x -y -∑x 2i -n x2[解] (1)x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+7.05=5,∑i =15x 2i =90,∑i =15x i y i =112.3,b ^=∑x i y i -5x -y -∑x 2i -5x 2=112.3-5×4×590-5×42=1.23. 于是a ^=y -b ^x =5-1.23×4=0.08.所以线性回归方程为:y ^=bx +a =1.23x +0.08. (2)当x =10时,y ^=1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用是12.38万元.10.在一次抽样调查中测得样本的5个样本点,数值如下表:试建立y 与x 之间的回归方程.[解] 作出变量y 与x 之间的散点图如图所示.由图可知变量y 与x 近似地呈反比例函数关系.设y =k x,令t =1x ,则y =kt .由y 与x 的数据表可得y 与t 的数据表:作出y 与t由图可知y 与t 呈近似的线性相关关系.又t -=1.55,y -=7.2,∑5i =1t i y i =94.25,∑5i =1t 2i =21.312 5, b ^=∑t i y i -5t -y -∑t 2i -5t -2=94.25-5×1.55×7.221.312 5-5×1.552≈4.134 4,a ^=y --b ^t -=7.2-4.134 4×1.55≈0.8,∴y ^=4.134 4t +0.8.即y 与x 之间的回归方程为y ^=4.134 4x+0.8.[能力提升练]1.对于下列表格所示的五个散点,已知求得的线性回归直线方程为y ^=0.8x -155.则实数m 的值为( )A .8B .8.2C .8.4D .8.5[解析] 依题意得x =15×(196+197+200+203+204)=200,y =15×(1+3+6+7+m )=17+m 5,因为回归直线必经过样本点的中心,所以17+m5=0.8×200-155,解得m =8,选A.[答案] A2.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:A .y =x -1B .y =x +1C .y =88+12xD .y =176[解析] 因为x =174+176+176+176+1785=176,y =175+175+176+177+1775=176,而回归方程经过样本中心点,所以排除A ,B ,又身高的整体变化趋势随x 的增大而增大,排除D ,所以选C.[答案] C3.以模型y =c e kx去拟合一组数据时,为了求出回归方程,设z =ln y ,其变换后得到线性回归方程z =0.3x +4,则c =________.[解析] 由题意得:ln(c e kx)=0.3x +4, ∴ln c +kx =0.3x +4, ∴ln c =4,∴c =e 4. [答案] e 44.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w ]=8∑ i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘法估计分别为β^=∑ni =1 (u i -u )(v i -v )∑ni =1 (u i -u )2,α^=v -β^u . [解] (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑i =18(w i -w )(y i -y)∑i =18(w i -w)2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6, 年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12.所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.。

2019-2020学年北师大版选修1-2 1.1.1 回归分析 作业

2019-2020学年北师大版选修1-2   1.1.1 回归分析 作业

1.1 回归分析 1.2 相关系数明目标、知重点 1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.3.掌握建立线性回归模型的步骤.1.线性回归方程在线性回归方程y =a +bx 中,b =∑n i =1(x i -x )(y i -y )∑ni =1(x i -x )2=∑ni =1x i y i -n x y∑n i =1x 2i -n x 2,a =y -b x .其中x =1n ∑n i =1x i ,y =1n ∑ni =1y i.(x ,y )称为样本点的中心,线性回归直线过样本点的中心. 2.相关系数(1)相关系数r 的计算公式r =∑ni =1x i y i -n x y∑ni =1x 2i -n x 2∑ni =1y 2i -n y 2.(2)相关系数r 的取值范围是[-1,1],|r |值越大,变量之间的线性相关程度越高;|r |值越接近0,变量之间的线性相关程度越低. (3)当r >0时,b >0,称两个变量正相关; 当r <0时,b <0,称两个变量负相关; 当r =0时,b =0,称两个变量线性不相关.[情境导学]“名师出高徒”这句谚语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?探究点一线性回归方程思考1两个变量之间的关系分几类?答分两类:①函数关系,②相关关系.函数关系是一种确定性关系,而相关关系是一种非确定性关系.上面所提的“名师”与“高徒”之间的关系就是相关关系.思考2什么叫回归分析?答回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.思考3对具有线性相关关系的两个变量进行回归分析有哪几个步骤?答基本步骤为画散点图,求线性回归方程,用线性回归方程进行预测.例1求根据女大学生的身高预测体重的回归方程,并预测一名身高为172 cm的女大学生的体重.解(1)画散点图选取身高为变量x,体重为变量y,画出散点图,展示两个变量之间的关系,并判断二者是否具有线性关系.由散点图可以发现,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用回归直线y=bx+a来近似刻画它们之间的关系.(2)建立回归方程由计算器可得b=0.849,a=-85.712.于是得到回归方程为y =0.849x -85.712. (3)预测和决策当x =172时,y =0.849×172-85.712=60.316(kg). 即预测一名身高为172 cm 的女大学生的体重约为60.316 kg. 反思与感悟 在使用回归方程进行预测时要注意: (1)回归方程只适用于我们所研究的样本的总体; (2)我们所建立的回归方程一般都有时间性; (3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预测值就是预测变量的精确值. 跟踪训练1 某班 学生 学科A B C D E 数学成绩(x ) 88 76 73 66 63 物理成绩(y )7865716461(1)画出散点图;(2)求物理成绩y 对数学成绩x 的线性回归方程; (3)一名学生的数学成绩是96,试预测他的物理成绩. 解 (1)散点图如图.(2)x =15×(88+76+73+66+63)=73.2.y =15×(78+65+71+64+61)=67.8.∑5i =1x i y i =88×78+76×65+73×71+66×64+63×61 =25 054.∑5i =1x 2i=882+762+732+662+632=27 174. ∴b =∑5i =1x i y i -5x ·y ∑5i =1x 2i -5x2≈0.625.∴a =y -b x =67.8-0.625×73.2=22.05.∴y 对x 的线性回归方程是y =0.625x +22.05. (3)当x =96时,y =0.625×96+22.05≈82. 所以,可以预测他的物理成绩是82. 探究点二 相关系数思考1 给出n 对数据,按照公式求出的线性回归方程,是否一定能反映这n 对数据的变化规律?答 如果数据散点图中的点都大致分布在一条直线附近,这条直线就能反映这n 对数据的变化规律,否则求出的方程没有实际意义.思考2 怎样通过相关系数刻画变量之间的线性相关关系?答 |r |值越接近1,变量之间的线性相关程度越高;|r |值越接近0,变量之间的线性相关程度越低;当r =0时,两个变量线性不相关.例2 下面的数据是从年龄在40岁到60岁的男子中随机抽出的6个样本,分别测定了心脏(1)求心脏功能水平y 与每天花在看电视上的平均时间x 之间的样本相关系数r ;(2)求心脏功能水平y 与每天花在看电视上的平均时间x 的线性回归方程,并讨论方程是否有意义;(3)估计平均每天看电视3小时的男子的心脏功能水平.解 n =6,x =16(4.4+4.6+…+4.6)≈3.716 7,y =16(52+53+…+65)≈64.166 7,∑i =16x 2i -6x 2≈(4.42+4.62+…+4.62)-6×3.716 72≈19.766 8,∑i =16y 2i -6y 2≈(522+532+…+652)-6×64.166 72≈964.807 7,∑i =16x i y i -6x y ≈(4.4×52+4.6×53+…+4.6×65)-6×3.7167×64.166 7≈-124.630 2.(1)心脏功能水平y 与每天花在看电视上的平均时间x 之间的相关系数:r ≈-124.630 219.766 8×964.807 7≈-0.902 5.(2)b ≈-124.630 219.766 8≈-6.305 0,a =y -b x ≈87.600 5,心脏功能水平y 与每天花在看电视上的平均时间x 的线性回归方程为y =87.600 5-6.305 0x . 由(1)知y 与x 之间有较强的线性关系,这个方程是有意义的.(3)将x =3代入线性回归方程y =87.600 5-6.305 0x ,可得y ≈68.7,即平均每天看电视3小时,心脏功能水平约为68.7.反思与感悟 求解两个变量的相关系数及它们的线性回归方程的计算量较大,需要细心、谨慎地计算.如果会使用含统计的科学计算器,能简单得到∑i =1nx i ,∑i =1ny i ,∑i =1nx 2i ,∑i =1n y 2i ,∑i =1nx i y i这些量,也就无需制表这一步,直接算出结果就行了.另外,利用计算机中有关应用程序也可以对这些数据进行处理.跟踪训练2 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y 来衡量,这个指标越高,耐水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度(1)画散点图;(2)求线性回归方程; (3)求相关系数r . 解 (1)(2)列表:x =1687=24,y =202.947,b =∑i =1x i y i -7x y ∑7i =1x 2i-7x 2=4 900.16-7×24×202.9474 144-7×242=0.264 3,a =y -b x =202.947-0.264 3×24≈22.648,∴线性回归方程为y =22.648+0.264 3x .(3)∑7i =1y 2i ≈5 892,r =∑7i =1x i y i -7x y∑7i =1x 2i -7x 2∑7i =1y 2i -7y 2=4 900.16-7×24×202.9474 144-7×242×5 892-7×⎝⎛⎭⎫202.9472=0.96.由此可以看出甲醛浓度与缩醛化度两个变量之间有较强的线性相关关系.1.下列变量之间:①人的身高与年龄;②产品的成本与生产数量;③商品的销售额与广告费;④家庭的支出与收入. 其中不是函数关系的有( )A .1个B .2个C .3个D .4个 答案 D2.已知线性回归方程为y =bx +a ,其中a =3且样本点中心为(1,2),则线性回归方程为( ) A .y =x +3B .y =-2x +3C .y =-x +3D .y =x -3答案 C解析 ∵y =bx +3过(1,2),可计算得b =-1.3.已知一个线性回归方程为y =1.5x +45,x i ∈{1,7,5,13,19},则y =________. 答案 58.54.一唱片公司欲知打歌费用x (十万元)与唱片销售量y (千张)之间的关系,从其所发行的唱片中随机抽取了10张,得如下的资料:∑i =110x i =28,∑i =110x 2i =303.4,∑i =110y i =75,∑i =110y 2i =598.5,∑i =110xi y i =237,则y 与x 的相关系数r 的绝对值为________.答案 0.3解析 由公式r =∑i =1nx i y i -n xy∑i =1nx 2i -nx2∑i =1ny 2i -n y2得|r |=0.3.[呈重点、现规律]1.对具有相关关系的两个变量进行统计分析,可从散点图观察大致呈条状分布,可以求线性回归方程并进行预报.2.通过计算相关系数可以判定两个变量的线性相关程度.一、基础过关1.在下列各量之间,存在相关关系的是( ) ①正方体的体积与棱长之间的关系; ②一块农田的水稻产量与施肥量之间的关系; ③某户家庭用电量与电价之间的关系. A .②③ B .①③ C .① D .② 答案 D2.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的线性回归方程为y =0.85x -85.71,则下列结论中不正确的是( ) A .y 与x 具有正的线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案 D解析 由线性回归方程为y =0.85x -85.71知y 随x 的增大而增大,所以y 与x 具有正的线性相关关系;由最小二乘法建立回归方程的过程知y =bx +a =bx +y -b x (a =y -b x ),所以回归直线过样本点的中心(x ,y );利用回归方程可以估计总体,所以D 不正确. 3.根据上表可得回归方程y =bx +a 中的b 为9.4,据此模型预测广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元 答案 B解析 ∵x =4+2+3+54=72,y =49+26+39+544=42,又y =bx +a 必过(x ,y ),∴42=72×9.4+a ,∴a =9.1.∴线性回归方程为y =9.4x +9.1.∴当x =6(万元)时,y =9.4×6+9.1=65.5(万元).4.已知对一组观察值(x i ,y i )作出散点图后确定具有线性相关关系,若对于y =bx +a ,求得b =0.51,x =61.75,y =38.14,则线性回归方程为( ) A .y =0.51x +6.65 B .y =6.65x +0.51 C .y =0.51x +42.30D .y =42.30x +0.51答案 A5.对于回归分析,下列说法错误的是( )A .在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定B .线性相关系数可以是正的,也可以是负的C .回归分析中,如果r 2=1,说明x 与y 之间完全相关D .样本相关系数r ∈(-1,1) 答案 D解析 相关系数r 的范围是[-1,1].6.对具有线性相关关系的变量x 和y ,由测得的一组数据已求得回归直线的斜率为6.5,且恒过(2,3)点,则这条线性回归方程为________. 答案 y =-10+6.5x解析 由题意知x =2,y =3,b =6.5,所以a =y -b x =3-6.5×2=-10,即线性回归方程为y =-10+6.5x .7.某个服装店经营某种服装,在某周内纯获利y (元)与该周每天销售这种服装件数x 之间的一组数据如下表:x 3 4 5 6 7 8 9 y66697381899091(1)求样本点的中心; (2)画出散点图;(3)求纯获利y 与每天销售件数x 之间的回归方程. 解 (1)x =6,y ≈79.86,样本点的中心为(6,79.86). (2)散点图如下:(3)因为∑i =17x i y i =3 487,∑i =17x 2i =280,所以b =∑i =17x i y i -7x y∑i =17x 2i -7(x )2=3 487-7×6×79.86280-7×62≈4.75.a =y -b x ≈51.36, 所以y =4.75x +51.36. 二、能力提升8.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归方程y =bx +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( ) A .b >b ′,a >a ′ B .b >b ′,a <a ′ C .b <b ′,a >a ′ D .b <b ′,a <a ′ 答案 C解析 b ′=2,a ′=-2,由公式b =∑i =16(x i -x )(y i -y )∑i =16(x i -x )2求得.b =57,a =y -b x =136-57×72=-13, ∴b <b ′,a >a ′.选C.9.下表是x 和y ( )A.点(2,3) B .点(1.5,4) C .点(2.5,4)D .点(2.5,5)答案 C解析 回归方程必过样本点的中心(x ,y ),即(2.5,4).10.若线性回归方程中的回归系数b =0,则相关系数r =________. 答案 0解析 b =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2,r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2·∑i =1n(y i -y )2,若b =0,则r =0.11.某车间为了规定工时定额,需确定加工零件所花费的时间,为此做了4次试验,得到的数据如下:若加工时间y 与零件个数x 之间有较好的相关关系. (1)求加工时间与零件个数的回归方程;(2)试预测加工10个零件需要的时间.解 (1)由表中数据得x =72,y =72,∑4i =1x 2i=54,∑4i =1x i y i =52.5,从而得b =0.7,a =y -b x =1.05, 因此,所求的线性回归方程为y =0.7x +1.05. (2)将x =10代入回归方程,得 y =0.7×10+1.05=8.05(小时),即加工10个零件的预测时间为8.05小时.12.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,(1)求线性回归方程y =bx +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本) 解 (1)x =8+8.2+8.4+8.6+8.8+96=8.5,y =16(90+84+83+80+75+68)=80.∵b =-20,a =y -b x ,∴a =80+20×8.5=250, ∴线性回归方程y =-20x +250. (2)设工厂获得的利润为L 元,则L =x (-20x +250)-4(-20x +250)=-20(x -334)2+361.25,∴该产品的单价应定为334元,工厂获得的利润最大.三、探究与拓展13.某运动员训练次数与运动成绩之间的数据关系如下:(1)作出散点图; (2)求出线性回归方程;(3)计算相关系数并进行相关性检验; (4)试预测该运动员训练47次及55次的成绩.解 (1)作出该运动员训练次数x 与成绩y 之间的散点图,如下图所示,由散点图可知,它们之间具有线性相关关系.(2)列表计算:由上表可求得x =39.25,y =40.875,∑i =1x 2i=12 656, ∑8i =1y 2i =13 731,∑8i =1x i y i=13 180, ∴b =∑8i =1x i y i -8x y ∑8i =1x 2i -8x2≈1.041 5,a =y -b x =-0.003 88,∴线性回归方程为y =1.041 5x -0.003 88.(3)计算相关系数r =0.992 7,因此运动员的成绩和训练次数两个变量有较强的相关关系. (4)由上述分析可知,我们可用线性回归方程y =1.041 5x -0.003 88作为该运动员成绩的预测值.将x =47和x =55分别代入该方程可得y =49和y =57.故预测该运动员训练47次和55次的成绩分别为49和57.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

课时分层作业(一)(建议用时:60分钟)[基础达标练]一、选择题1.下列结论正确的是( )①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A .①②B .①②③C .①②④D .①②③④C [函数关系和相关关系的区别是前者是确定性关系,后者是非确定性关系,故①②正确;回归分析是对具有相关关系的两个变量进行统计分析的一种方法,故③错误,④正确.]2.下表是x 和y 之间的一组数据,则y 关于x 的线性回归方程必过点( )C .(2.5,4)D .(2.5,5)C [线性回归方程必过样本点的中心(x ,y ), 即(2.5,4),故选C.]3.已知人的年龄x 与人体脂肪含量的百分数y 的回归方程为y =0.577x -0.448,如果某人36岁,那么这个人的脂肪含量( )A .一定是20.3%B .在20.3%附近的可能性比较大C .无任何参考数据D .以上解释都无道理B [将x =36代入回归方程得y =0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.]4.某学校开展研究性学习活动,某同学获得一组试验数据如下表:A .y =2x -2B .y =⎝ ⎛⎭⎪⎫12xC .y =log 2xD .y =12(x 2-1)D [代入检验,当x 取相应的值时,所得y 值与已知数据差的平方和最小的便是拟合程度最高的.]5.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12D .1D [所有点均在直线上,则样本相关系数最大即为1,故选D.] 二、填空题6.回归分析是处理变量之间________关系的一种数量统计方法. 相关 [回归分析是处理变量之间相关关系的一种数量统计方法.]7.已知某个样本点中的变量x ,y 线性相关,相关系数r <0,则在以(x ,y )为坐标原点的坐标系下的散点图中,大多数的点都落在第________象限.二、四 [∵r <0时b <0, ∴大多数点落在第二、四象限.]8.某中学期中考试后,对成绩进行分析,从某班中选出5名学生的总成绩和外语成绩如下表:y =0.132x +14.68 [∵x =482+383+421+364+3625=402.4,y =78+65+71+64+615=67.8,∑i =15x 2i =232 324+146 689+177 241+132 496+131 044=819 794. ∑i =15x i y i =37 596+24 895+29 891+23 296+22 082=137 760b =∑i =15x i y i -5xy∑i =15x 2i -5x 2=137 760-5×402.4×67.8819 794-5×402.42≈0.132, ∴a =67.8-0.132×402.4≈14.68, ∴方程为y =0.132x +14.68.] 三、解答题9.关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?附:a =y -b x -,b =∑i =1nx i y i -n x -y-∑i =1nx 2i -n x 2.[解] (1)x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+7.05=5,∑i =15x 2i =90,∑i =15x i y i =112.3,b =∑i =15x i y i -5x -y-∑i =15x 2i -5x 2=112.3-5×4×590-5×42=1.23. 于是a =y -b x =5-1.23×4=0.08. 所以线性回归方程为y =1.23x +0.08.(2)当x =10时,y =1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用是12.38万元. 10.某班5名学生的数学和物理成绩如下表:(2)求物理成绩y 对数学成绩x 的回归直线方程. [解] (1)x =15×(88+76+73+66+63)=73.2,y =15×(78+65+71+64+61)=67.8.∑5i =1x i y i =88×78+76×65+73×71+66×64+63×61=25 054.∑5i =1x 2i =882+762+732+662+632=27 174.∑5i =1y 2i =782+652+712+642+612=23 167.∴r =∑5i =1x i y i -n x y (∑5i =1x 2i -n x 2)(∑5i =1y 2i -n y 2)=25 054-5×73.2×67.8(27 174-5×73.22)(23 167-5×67.82)≈0.904 3. 由于r 的值接近于1,故可判断两变量x 与y 具有线性相关关系. (2)由(1)知,求回归直线方程是有意义的. 回归系数:b =∑5i =1x i y i -n x y∑5i =1x 2i -5x2=25 054-5×73.2×67.827 174-5×73.22≈0.625, a =y -b x =67.8-0.625×73.2=22.05.所以y 对x 的回归直线方程是:y =0.625x +22.05.[能力提升练]1.已知函数模型为y =sin 2α+2sin α+1,若将其转化为y 关于t 的线性回归方程,则需作变换t =( )A .sin 2α B .(sin α+1)2C .(sin α+12)2D .以上都不对B [y 是关于t 的线性回归方程,即y 是关于t 的一次函数.因为y =(sin α+1)2,若令t =(sin α+1)2,则可得y =t ,此时变量y 与变量t 是线性相关关系.]2.已知x 与y 之间的几组数据如下表:据(1,0)和(2,2)求得的直线方程为y ′=b ′x +a ′,则以下结论正确的是( )A .b >b ′,a >a ′B .b >b ′,a <a ′C .b <b ′,a >a ′D .b <b ′,a <a ′C [由(1,0),(2,2)求b ′,a ′.b ′=2-02-1=2, a ′=0-2×1=-2.求b ,a 时,∑i =16x i y i =0+4+3+12+15+24=58,x =3.5,y =136,∑i =16x 2i =1+4+9+16+25+36=91, ∴b =58-6×3.5×13691-6×3.52=57, a =136-57×3.5=136-52=-13,∴b <b ′,a >a ′.]3.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:为( )A .8.1万盒B .8.2万盒C .8.9万盒D .8.6万盒A [由题意知x =3,y =6,则a =y -0.7x =3.9, ∴x =6时,y =8.1.]4.已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且线性回归方程为y =0.95x +2.6,那么表格中的数据m 的值为________.6.7 [x =4=2,y =4=4,把(x -,y -)代入回归方程得11.3+m4=0.95×2+2.6,解得m =6.7.]5.某商店各个时期的商品流通率y (%)和商品零售额x (万元)资料如下:率y 决定于商品的零售额x ,体现着经营规模效益,假定它们之间存在关系式:y =a +b x.试根据上表数据,求出a 与b 的估计值,并估计商品零售额为30万元时的商品流通率.[解] 设u =1x,则y =a +bu ,得下表数据:进而可得n =10,u =0.060 4,y =3.21,∑10i =1u 2i -10u 2≈0.004 557 3,i =110u i y i -10u y ≈0.256 35,b =0.256 350.004 557 3≈56.25,a =y -b u =-0.187 5,所求的回归方程为y =-0.187 5+56.25x.当x =30时,y =1.687 5,即商品零售额为30万元时,商品流通率约为1.687 5%.。

相关文档
最新文档