2018年陕西省高三数学第1章《统计案例》导学案:1.1.3可线性化的回归分析习题

合集下载

2018年高中数学第1章统计案例1.2回归分析学案苏教版选修1_2

2018年高中数学第1章统计案例1.2回归分析学案苏教版选修1_2

回归分析.线性回归模型()线性回归模型=++ε,其中+是确定性函数,ε称为随机误差.()随机误差产生的原因主要有以下几种:①所用的确定性函数不恰当引起误差;②忽略了某种因素的影响;③存在观测误差.()在线性回归方程=+中=错误!=错误!,=-(其中=,=).其中,,分别为,的估计值,称为回归截距,称为回归系数,称为回归值..相关系数()计算两个随机变量间线性相关系数的公式)-(,\(-))))-(,\(-)))=()具有如下性质:①≤;②越接近于,,的线性相关程度越强;③越接近于,,的线性相关程度越弱..对相关系数进行显著性检验的基本步骤()提出统计假设:变量,不具有线性相关关系;()如果以的把握作出判断,那么可以根据-=与-在教材附录中查出一个的临界值(其中-=称为检验水平);()计算样本相关系数;()作出统计推断:若>,则否定,表明有的把握认为与之间具有线性相关关系;若≤,则没有理由拒绝原来的假设,即就目前数据而言,没有充分理由认为与之间有线性相关关系.我们把相关关系(不确定性关系)转化为函数关系(确定性关系),当两个具有相关关系的变量近似地满足一次函数关系时,我们所求出的函数关系式=+就是回归直线方程.求回归直线方程的一般方法是借助于工作软件求出回归直线方程,也可以利用计算器计算出,再由=-求出,写出回归直线方程=+.计算时应注意:()求时,利用公式=-)),\(=)\()-(,\(-))),先求出=(++…+),=(++…+),=++…+,=++…+.再由=-求出的值,并写出回归直线方程.()线性回归方程中的截距和斜率都是通过样本估计而来的,存在着误差,这种误差可能导致估计结果的偏差.()回归直线方程=+中的表示增加个单位时,的变化量为,而表示不随的变化而变化的部分.()可以利用回归直线方程=+求在取某一个值时的估计值.[例] 假设关于某设备的使用年限(年)和所支出的维修费用(万元)有如下的统计资料:若由数据可知,对呈线性相关关系.()求线性回归方程;()估计使用年限为年时,维修费用是多少?[思路点拨] 由于题目条件已经指明对呈线性相关关系,所以可直接利用公式求与,然后求出线性回归方程,最后把代入,估计维修费用.[精解详析] ()列表如下:。

2017_2018学年高中数学第一章统计案例1.1回归分析的基本思想及其初步应用学案含解析新人教A版

2017_2018学年高中数学第一章统计案例1.1回归分析的基本思想及其初步应用学案含解析新人教A版

1.1 回归分析的基本思想及其初步应用线性回归模型[提出问题]问题 1:由《数学必修 3》的知识可知,相关关系中自变量和因变量的关系是确定的吗? 提示:不是.问题 2:利用线性回归方程求出的函数值一定是真实值吗? 提示:不一定. [导入新知] 1.回归分析(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系,即自变量取值一定时, 因变量的取值带有一定的随机性的两个变量之间的关系叫做相关关系.(2)由《数学必修 3》的知识可知,回归分析是对具有线性相关关系的两个变量进行统计 分析的一种常用方法,回归分析的基本步骤是画出两个变量的散点图,求回归直线方程,并用 回归直线方程进行预报.2.线性回归模型(1)线性回归模型 y =bx +a +e ,其中 a 和b 是模型的未知参数,e 称为随机误差.自变量x 称为解释变量,因变量 y 称为预报变量.^ ^ ^(2)在回归方程 y = bx + a 中,^b----nn∑i=1x i - x y i - y∑i =1x i y i -n x y==,--nn∑i=1x i - x2∑i =1x 2i -n x 2^ a - ^-= y - b x .nn- 1 - 1 - -∑∑其中 x =x i , y = y i, (x , y )称为样本点的中心. n ni =1i =1[化解疑难]对线性回归方程的理解^ ^ ^ - - - -(1)回归直线方程 y = bx + a 一定经过点(x , y ).我们把(x , y )称为样本点的中心, 因此,回归直线必过样本点的中心.^ ^ ^ ^ ^(2)线性回归方程 y = bx + a 中的截距 a 和斜率 b 都是通过估计而得来的,存在着误差,这种误差可能导致预测结果的偏差.1^ ^(3)当b>0时,变量y与x具有正的线性相关关系;当b<0时,变量y与x具有负的线性相关关系.线性回归分析[提出问题]问题1:利用什么方法判断所建立的线性模型的拟合效果?提示:利用残差.问题2:由散点图知,残差有正、负,如何更好地判断拟合效果?n^∑提示:利用残差平方和,即(y i-y i)2越小,R2越大,拟合效果越好.i=1[导入新知]1.残差分析(1)残差^ ^ ^ ^ ^ 样本点(x n,y n)的随机误差e i=y i-bx i-a,其估计值为e i=y i-y i=y i-b x i-a,e i称为相应于点(x i,y i)的残差(residual).(以上i=1,2,…,n)(2)残差图作图时,纵坐标为残差,横坐标可以选为样本编号,或x i数据,或y i数据,这样作出的图形称为残差图.(3)残差分析残差分析即通过残差发现原始数据中的可疑数据,判断所建立模型的拟合效果,其步骤为:计算残差——画残差图——在残差图中分析残差特性.残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.2.相关指数我们可以用相关指数R2来刻画回归的效果,其计算公式是:^i2n∑i=1y i-yR2=1-.-n∑i=1y i-y2n n^∑∑R2越大,残差平方和(y i-y i)2越小,即模型的拟合效果越好;R2越小,残差平方和i=1 i=1 ^(y i-y i)2越大,即模型的拟合效果越差.在线性回归模型中,R2的取值范围为[0,1],R2表示解释变量对于预报变量变化的贡献率,1-R2表示随机误差对于预报变量变化的贡献率.R2越接近于1,表示回归的效果越好.2[化解疑难]残差分析的注意点在残差图中,可疑数据的特征表现为:(1)个别样本点的残差过大,即大多数的残差点比较均匀地落在水平的带状区域中,而个别残差点偏离该区域过于明显,需要确认在采集这些样本点的过程中是否有人为的错误.如果采集数据有错误,那么需要纠正,然后重新利用线性回归模型拟合数据;如果数据采集没有错误,那么需要寻找其他原因.(2)残差图有异常,即残差呈现不随机的规律性,此时需要考虑所采用的线性回归模型是否合适.线性回归分析[例1]某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x 6 8 10 12y 2 3 5 6(1)请画出上表数据的散点图(要求:点要描粗);^ ^ ^(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(3)试根据求出的线性回归方程,预测记忆力为14的同学的判断力.[解](1)散点图如图所示:-6+8+10+12 -2+3+5+6(2)x==9,y==4,4 44-∑(x i-)2=9+1+1+9=20,xi=14--∑(x i-x)(y i-y)=(-3)×(-2)+(-1)×(-1)+1×1+3×2=14,i=13^ b--4∑i=1x i-xy i-y14===0.7,-204∑i=1x i-x2^ a-^-=y-b x=4-0.7×9=-2.3,^故线性回归方程为y=0.7x-2.3.(3)由(2)中线性回归方程知,当x=14时,^y =0.7×14-2.3=7.5,预测记忆力为14的同学的判断力约为7.5.[类题通法]求线性回归方程的步骤(1)列表表示x i,y i;n n-----∑∑(2)计算x,,(x i-)(y i-),(x i-)2;y x y xi=1 i=1^ ^(3)代入公式计算a,b的值;(4)写出回归直线方程.[活学活用]某公司利润y(单位:千万元)与销售总额x(单位:千万元)之间有如下对应数据:x 10 15 17 20 25 28 32y 1 1.3 1.8 2 2.6 2.7 3.3(1)画出散点图;(2)求回归直线方程;(3)估计销售总额为24千万元时的利润.解:(1)散点图如图:(2)列下表,并利用科学计算器进行有关计算.i 1 2 3 4 5 6 7x i 10 15 17 20 25 28 32y i 1 1.3 1.8 2 2.6 2.7 3.34x=21,y=2.17 7∑∑x2i=3 447,x i y i=346.3i=1 i=1^ 346.3-7 × 21 × 2.1于是b=≈0.104.3 447-7 × 212^a =2.1-0.104×21=-0.084,^因此回归直线方程为y=0.104x-0.084.(3)当x=24时,y=0.104×24-0.084=2.412(千万元).残差分析[例2]某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:编号 1 2 3 4 5 6 7 8 9 10 零件数x/个10 20 30 40 50 60 70 80 90 100 加工时间y/分62 68 75 81 89 95 102 108 115 122(1)建立零件数为解释变量,加工时间为预报变量的回归模型,并计算残差;(2)你认为这个模型能较好地刻画零件数和加工时间的关系吗?[解](1)根据表中数据画出散点图,如图所示.由图可看出,这些点在一条直线附近,可以用线性回归模型来拟合数据.计算得加工时间^对零件数的线性回归方程为y=0.668x+54.93.残差数据如下表:编号 1 2 3 4 5^残差e 0.39 -0.29 0.03 -0.65 0.67编号 6 7 8 9 105^残差e -0.01 0.31 -0.37 -0.05 0.27(2)以零件数为横坐标,残差为纵坐标画出残差图如图所示.由图可知,残差点分布较均匀,即用上述回归模型拟合数据效果很好.但需注意,由残差图可以看出,第4个样本点和第5个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误.[类题通法]残差分析应注意的问题利用残差分析研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,^ ^是否可以用线性回归模型来拟合数据.然后通过图形来分析残差特性,用残差e1,e2,…,^e n来判断原始数据中是否存在可疑数据,用R2来刻画模型拟合的效果.[活学活用]已知某种商品的价格x(元)与需求量y(件)之间的关系有如下几组数据:x 14 16 18 20 22y 12 10 7 5 3求y关于x的回归直线方程,并说明回归模型拟合效果的好坏.- 1解:x=×(14+16+18+20+22)=18,5- 1y=×(12+10+7+5+3)=7.4,55∑x2i=142+162+182+202+222=1 660,i=15∑x i y i=14×12+16×10+18×7+20×5+22×3=620,i=1--5∑i=1x i y i-5xy^所以b=-5∑i=1x2i-5x26620-5 × 18 × 7.4==-1.15,1 660-5 × 182^a =7.4+1.15×18=28.1,所以所求回归直线方程是^y =-1.15x+28.1.列出残差表:0 0.3 -0.4 -0.1 0.2^y i-y i-4.6 2.6 -0.4 -2.4 -4.4y i-y5^∑所以(y i-i)2=0.3,yi=15-∑(y i-)2=53.2,yi=1^i25∑i=1y i-yR2=1-≈0.994,-5∑i=1y i-y2所以回归模型的拟合效果很好.非线性回归分析[例3]在一次抽样调查中测得样本的5个样本点,数值如下表:x 0.25 0.5 1 2 4y 16 12 5 2 1试建立y与x之间的回归方程.[解]作出变量y与x之间的散点图如图所示.由图可知变量y与x近似地呈反比例函数关系.k 1设y=,令t=,则y=kt.x x7由 y 与 x 的数据表可得 y 与 t 的数据表:t 4 2 1 0.5 0.25 y1612521作出 y 与 t 的散点图如图所示.由图可知 y 与 t 近似地呈线性相关关系.55- -∑∑又 t =1.55, =7.2,i y i =94.25,t 2i =21.312 5, yti =1i =1^b=--5∑i =1t i y i -5t y-5∑i =1t 2i -5t 294.25-5 × 1.55 × 7.2= ≈4.134 4, 21.312 5-5 × 1.552^ a - ^-= y - b t =7.2-4.134 4×1.55≈0.8, ^∴ y =4.134 4t +0.8.^ 4.134 4所以 y 与 x 之间的回归方程是 y = +0.8.x[类题通法]非线性回归分析的步骤非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学 过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好 的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步 骤为:8[活学活用]为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下时间x/天 1 2 3 4 5 6繁殖个数y 6 12 25 49 95 190(1)用时间作解释变量,繁殖个数作预报变量作出这些数据的散点图;(2)求y与x之间的回归方程.解:(1)散点图如图所示:(2)由散点图看出样本点分布在一条指数函数y1=c1e c2x(c1>0)的周围,则ln y=ln c1+c2x,于是令z=ln y,则x 1 2 3 4 5 6z 1.79 2.48 3.22 3.89 4.55 5.25画出相应的散点图(图略),可知变换后的样本点分布在一条直线附近,因此可用线性回归^ ^方程来拟合,由表中数据得到线性回归方程为z=0.69x+1.115,则有y=e0.69x+1.115.1.错误理解残差的概念而致误[典例]某种产品的广告费支出x(单元:万元)与销售额y(单位:万元)之间有下表关系:x 2 4 5 6 8y 30 40 60 50 70^y与x的线性回归方程为y=6.5x+17.5,当广告费支出5万元时,随机误差的效应(残差)为()A.10B.209C.30 D.40^ ^ [解析]因为y与x的线性回归方程为y=6.5x+17.5,当x=5时,y=50,当广告费支出5万元时,由表格得y=60,故随机误差的效应(残差)为60-50=10.[答案] A[易错防范]^ ^ ^ ^ ^1.对残差e i不理解,误认为e i=y i-y i=b x i-a-y i,i=1,2,…,n.2.残差平方和越小,说明模型的拟合效果就越好.[成功破障]^已知方程y=0.85x-82.71是根据女大学生的身高预报她的体重的回归方程,其中x的^单位是cm,y的单位是kg,那么针对某个体(160,53)的残差是________.^ ^解析:把x=160代入y=0.85x-82.71,得y=0.85×160-82.71=53.29,所以残差^ e^=y-y=53-53.29=-0.29.答案:-0.29[随堂即时演练]1.(湖北高考)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:^①y与x负相关且y=2.347x-6.423;^②y与x负相关且y=-3.476x+5.648;^③y与x正相关且y=5.437x+8.493;^④y与x正相关且y=-4.326x-4.578.其中一定不正确的结论的序号是()A.①②B.②③C.③④D.①④解析:选D①中y与x负相关而斜率为正,不正确;④中y与x正相关而斜率为负,不正确.2.关于回归分析,下列说法错误的是()A.在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定10B.线性相关系数可以是正的也可以是负的C.在回归分析中,如果r2=1或r=±1,说明x与y之间完全线性相关D.样本相关系数r∈(-1,1)解析:选D样本的相关系数应满足-1≤r≤1.3.在研究气温和热茶销售杯数的关系时,若求得相关指数R2≈0.85,则表明气温解释了________的热茶销售杯数变化,而随机误差贡献了剩余的________,所以气温对热茶销售杯数的效应比随机误差的效应大得多.解析:由相关指数R2的意义可知,R2≈0.85表明气温解释了85%,而随机误差贡献了剩余的15%.答案:85%15%4.某医院用光电比色计检验尿汞时,得尿汞含量(mg/L)与消光系数计数的结果如下:尿汞含量x 2 4 6 8 10消光系数y 64 138 205 285 360若y与x具有线性相关关系,则回归直线方程是______________________________.5--∑解析:由已知表格中的数据,利用科学计算器进行计算得x=6,y=210.4,x2i=i=1 220,5∑x i y i=7 790,i=1--5∑i=1x i y i-5x y^所以b==36.95,-5∑i=1x2i-5x2^ a-^-=y-b x=-11.3.^所以回归直线方程为y=-11.3+36.95x.^答案:y=-11.3+36.95x5.某工厂为了对新研究的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x/元8 8.2 8.4 8.6 8.8 9销量y/件90 84 83 80 75 68^ ^ ^ ^ ^ -^-(1)求回归直线方程y=bx+a,其中b=-20,a=y-b x;11(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)- 1解:(1)x=×(8+8.2+8.4+8.6+8.8+9)=8.5,6- 1y=×(90+84+83+80+75+68)=80,6^ --从而a=y+20x=80+20×8.5=250,^故y=-20x+250.(2)由题意知,工厂获得利润z=(x-4)y=-20x2+330x-1 00033(x-4)2+361.25,=-2033所以当x==8.25时,4z max=361.25(元).即当该产品的单价定为8.25元时,工厂获得最大利润.[课时达标检测]一、选择题--1.(重庆高考)已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得的线性回归方程可能为()^ ^A.y=0.4x+2.3B.y=2x-2.4^ ^C.y=-2x+9.5D.y=-0.3x+4.4解析:选A依题意知,相应的回归直线的斜率应为正,排除C、D.且直线必过点(3,3.5),代入A、B得A正确.2.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如下表:甲乙丙丁R2 0.98 0.78 0.50 0.85建立的回归模型拟合效果最好的同学是()A.甲B.乙C.丙D.丁解析:选A相关指数R2越大,表示回归模型拟合效果越好.123.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样^本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71.则下列结论中不正确的是()A.y与x具有正的线性相关关系--B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg解析:选D回归方程中x的系数为0.85>0,因此y与x具有正的线性相关关系,A正确;--由回归方程系数的意义可知回归直线过样本点的中心(x,y),B正确;^ ^依据回归方程中b的含义可知,x每变化1个单位,y相应变化约0.85个单位,C正确;用回归方程对总体进行估计不能得到肯定结论,故D不正确.4.甲、乙、丙、丁4位同学各自对A,B两变量做回归分析,分别得到散点图与残差平方n^∑和(y i-i)2,如下表:yi=1甲乙丙丁散点图残差平方和115 106 124 103哪位同学的试验结果体现拟合A,B两变量关系的模型拟合精度高?()A.甲B.乙C.丙D.丁解析:选D从题中的散点图上来看,丁同学的散点图中的点更加近似在一条直线附近;从残差平方和来看,丁同学的最小,说明拟合精度最高.5.(福建高考)已知x与y之间的几组数据如下表:x 1 2 3 4 5 6y 0 2 1 3 3 4^ ^ ^假设根据上表数据所得线性回归直线方程为y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是()^ ^ ^ ^A.b>b′,a>a′B.b>b′,a<a′13^ ^ ^ ^C.b<b′,a>a′D.b<b′,a<a′解析:选C由两组数据(1,0)和(2,2)可求得直线方程为y=2x-2,b′=2,a′=-2. 而利用线性回归方程的公式与已知表格中的数据,-6∑i=1x i y i-6x^可求得b=-6∑i=1x2i-6x2 -y7 1358-6 ××2 6 5==,7 7 91-6 ×(2 )2^ a-^-13 5 7 1 =y-b x=-×=-,6 7 2 3^ ^所以b<b′,a>a′.二、填空题6.在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相等)1 的散点图中,若所有样本点(x i,y i)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据2的样本相关系数为_________.解析:根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.答案:17.某咖啡厅为了了解热饮的销售量y(个)与气温x(℃)之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:气温(℃)18 13 10 -1销售量(个) 24 34 38 64^由表中数据,得线性回归方程y=-2x+a.当气温为-4 ℃时,预测销售量约为________.1 1解析:∵x=(18+13+10-1)=10,y=(24+34+38+64)=40,∴40=-2×10+a,∴a4 4=60,当x=-4时,y=-2×(-4)+60=68.答案:688.关于x与y有如下数据:x 2 4 5 6 8y 30 40 60 50 7014^ ^为了对 x ,y 两个变量进行统计分析,现有以下两种线性模型:甲: y =6.5x +17.5, 乙:y =7x +17,则____________(填“甲”或“乙”)模型拟合的效果更好.解析:设甲模型的相关指数为 R 21,^5∑i=1y i - y i2155则 R 21=1-=1- =0.845;-1 0005∑i=1y i - y 2设乙模型的相关指数为 R 2, 180 则 R 2=1- =0.82. 1 000 因为 0.845>0.82,即 R 21>R 2, 所以甲模型拟合效果更好. 答案:甲 三、解答题9.(新课标全国卷Ⅱ)某地区 2007年至 2013年农村居民家庭人均纯收入 y (单位:千元) 的数据如下表:年份 2007 2008 2009 2010 2011 2012 2013 年份代号 t 1 2 3 4 5 6 7 人均纯收入 y2.93.33.64.44.85.25.9(1)求 y 关于 t 的线性回归方程;(2)利用(1)中的回归方程,分析 2007年至 2013年该地区农村居民家庭人均纯收入的变化 情况,并预测该地区 2015年农村居民家庭人均纯收入.--n∑i=1t i - ty i - y^附:回归直线的斜率和截距的最小二乘估计公式分别为 b =,-n∑i=1t i - t 2^ a - ^- = y - b t .解:(1)由所给数据计算得- 1t = ×(1+2+3+4+5+6+7)=4,7- 1y = ×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,77-∑(t i - t )2=9+4+1+0+1+4+9=28,i =1 7- -∑(t i-t)(y i-y)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+i=1151×0.5+2×0.9+3×1.6=14,^b--7∑i=1t i-ty i-y14===0.5,-287∑i=1t i-t 2^a-^-=y-b t=4.3-0.5×4=2.3,^所求回归方程为y=0.5t+2.3.^(2)由(1)知,b=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.^将2015年的年份代号t=9代入(1)中的回归方程,得y=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.10.(全国丙卷)下图是我国2008 年至2014 年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.7 7 7∑∑∑参考数据:y i=9.32,i y i=40.17, y i-y2=0.55,7≈2.646.ti=1 i=1 i=1n∑i=1t i-t y i-y^ ^ ^ 参考公式:相关系数r=,回归方程y=a+b t中斜率和n n∑i=1t i-t2∑i=1y i-y2n^ ∑i=1t i-t y i-y^ ^截距的最小二乘估计公式分别为b=,a=y-b t.n∑i=1t i-t2解:(1)由折线图中的数据和附注中的参考数据得7 7∑∑t=4,(t i-t)2=28, =0.55,y i-y2i=1 i=1167 7 7∑∑∑(t i -t )(y i -y )=t i y i -ty i =40.17-4×9.32=2.89,i =1i =1i =12.89∴r ≈ ≈0.99. 0.55 × 2 × 2.646因为 y 与 t 的相关系数近似为 0.99,说明 y 与 t 的线性相关程度相当大,从而可以用线 性回归模型拟合 y 与 t 的关系.9.32 (2)由y = ≈1.331及(1)得77^ ∑i=1t i -ty i -y2.89 b == ≈0.103. 728∑i=1t i -t 2^ a ^=y - b t ≈1.331-0.103×4≈0.92. ^所以 y 关于 t 的回归方程为 y =0.92+0.10t .^将 2016年对应的 t =9代入回归方程得 y =0.92+0.10×9=1.82. 所以预测 2016年我国生活垃圾无害化处理量约为 1.82亿吨.17。

2017_18版高中数学第一章统计案例1.2回归分析一学案

2017_18版高中数学第一章统计案例1.2回归分析一学案

1.2 回归分析(一)明目标、知重点 1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.1.回归直线方程在回归直线方程y ^=a ^+b ^x 中,b ^=∑ni =1x i -xy i -y∑n i =1x i -x 2=∑ni =1x i y i -n x y∑n i =1x 2i -n x2,a ^=y-b ^x .其中x =1n ∑ni =1x i ,y =1n∑n i =1y i . (x ,y )称为样本点的中心,回归直线过样本点的中心. 2.相关系数(1)对于变量x 与y 随机抽到的n 对数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),检测统计量是样本相关系数r =∑n i =1 x i -xy i -y∑n i =1x i -x2∑n i =1y i -y2=∑ni =1x i y i -n x y∑n i =1x 2i -n x2∑ni =1y 2i -n y2.(2)相关系数r 的取值范围是[-1,1],|r |值越大,变量之间的线性相关程度越高;|r |值越接近0,变量之间的线性相关程度越低.当|r |>r 0.05时,表明有95%的把握认为两个变量之间有线性相关关系.[情境导学]“名师出高徒”这句谚语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关? 探究点一 回归直线方程思考1 两个变量之间的关系分几类? 答 分两类:①函数关系,②相关关系.函数关系是一种确定性关系,而相关关系是一种非确定性关系. 上面所提的“名师”与“高徒”之间的关系就是相关关系.思考2 什么叫回归分析?答 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. 思考3 对具有线性相关关系的两个变量进行回归分析有哪几个步骤? 答 基本步骤为画散点图,求回归直线方程,用回归直线方程进行预报. 例1 若从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg4857505464614359. 解 (1)画散点图选取身高为自变量x ,体重为因变量y ,画出散点图,展示两个变量之间的关系,并判断二者是否具有线性关系.由散点图可以发现,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用回归直线y =bx +a 来近似刻画它们之间的关系.(2)建立回归方程由计算器可得b ^=0.849,a ^=-85.712.于是得到回归直线方程为y ^=0.849x -85.712. (3)预报和决策当x =172时,y ^=0.849×172-85.712=60.316(kg). 即一名身高为172 cm 的女大学生的体重预报值为60.316 kg. 反思与感悟 在使用回归直线方程进行预报时要注意: (1)回归直线方程只适用于我们所研究的样本的总体; (2)我们所建立的回归直线方程一般都有时间性; (3)样本取值的范围会影响回归直线方程的适用范围;(4)不能期望回归直线方程得到的预报值就是预报变量的精确值.跟踪训练1 某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:x 6 8 10 12 y2356(1)请画出上表数据的散点图((2)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归直线方程y ^=b ^x +a ^; (3)试根据求出的回归直线方程,预测记忆力为9的同学的判断力. 解 (1)如图:(2)∑ni =1x i y i =6×2+8×3+10×5+12×6=158, x =6+8+10+124=9,y =2+3+5+64=4, ∑ni =1x 2i =62+82+102+122=344, b ^=158-4×9×4344-4×92=1420=0.7, a ^=y -b ^x =4-0.7×9=-2.3,故线性回归方程为y ^=0.7x -2.3.(3)由(2)中回归直线方程,当x =9时,y ^=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.探究点二 相关性检验思考1 给出n 对数据,按照公式求出的回归直线方程,是否一定能反映这组成对数据的变化规律?答 如果数据散点图中的点都大致分布在这条直线附近,这条直线就能反映这组成对数据的变化规律,否则求出的方程没有实际意义. 思考2 怎样定量确定两个变量的相关关系?答 可以通过计算相关系数r 来确定,若|r |>r 0.05,可以有95%的把握认为两个变量具有线性相关关系;若|r |≤r 0.05,则没有理由认为两个变量具有线性相关关系,此时寻找回归直线方程毫无意义.例2 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y 来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x (g/L)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据:甲醛浓度(g/L) 18 20 22 24 26 28 30 缩醛化度(克分子%) 26.8628.3528.7528.8729.7530.0030.36(1)画散点图; (2)求回归直线方程;(3)求相关系数r ,并进行相关性检验. 解 (1)散点图如下图:(2)可以看出,两变量之间有近似的线性相关关系,下面用列表的方法计算a ^,b ^.ix iy ix i 2x i y i1 18 26.86 324 483.482 20 28.35 400 5673 22 28.75 484 632.5 4 24 28.87 576 692.88 5 26 29.75 676 773.5 6 28 30.00 784 8407 30 30.36 900 910.80 ∑168202.944 1444 900.16x =1687=24,y =202.947, b ^ =∑7i =1x i y i -7x y ∑7i =1x i 2-7x 2=4 900.16-7×24×202.9474 144-7×242≈0.264 3, a ^=y -b ^x =202.947-0.264 3×24≈22.648, ∴回归直线方程为y ^=22.648+0.264 3x .(3)∑7i =1y i 2≈5 892,r =∑7i =1x i y i -7x y∑7i =1x i 2-7x2∑7i =1y i 2-7y2=4 900.16-7×24×202.9474 144-7×242×[5 892-7×⎝ ⎛⎭⎪⎫202.9472]≈0.96.∵r =0.96>r 0.05=0.754.∴有95%的把握认为“甲醛浓度与缩醛化度有关系”,求得的回归直线方程有意义. 反思与感悟 根据已知数据求得回归直线方程后,可以利用相关系数和临界值r 0.05比较,进行相关性检验.跟踪训练2 为了研究3月下旬的平均气温(x )与4月20日前棉花害虫化蛹高峰日(y )的关系,某地区观察了2007年至2012年的情况,得到了下面的数据:年份2007 2008 2009 2010 2011 2012 x (℃) 24.4 29.6 32.9 28.7 30.3 28.9 y (日)19611018(1)对变量x 、y 进行相关性检验;(2)据气象预测,该地区在2013年3月下旬平均气温为27℃,试估计2013年4月化蛹高峰日为哪天.解 由已知条件可得下表:i 1 2 3 4 5 6 x i 24.4 29.6 32.9 28.7 30.3 28.9 y i19611018x ≈29.13,y =7.5,∑i =16x i 2=5 130.92,∑i =16y i 2=563,∑i =16x i y i =1 222.6(1)r =∑i =16x i y i -6x y∑i =16x i 2-6x2∑i =16y i 2-6y2≈-0.934 1.查表知:r 0.05=0.811.由|r |>r 0.05,可知变量y 和x 存在线性相关关系.(2)b ^=1 222.6-6×29.13×7.55 130.92-6×29.132≈-2.23, a ^=y -b ^x ≈72.46.所以回归直线方程为y ^=-2.23x +72.46.当x =27时,y ^=-2.23×27+72.46≈12.据此,可估计该地区2013年4月12日为化蛹高峰日.1.下列各组变量之间具有线性相关关系的是( ) A.出租车费与行驶的里程 B.学习成绩与学生身高 C.身高与体重 D.铁的体积与质量 答案 C2.对变量y 和x 进行相关性检验,已知n 为数据的对数,r 是相关系数,且已知①n =3,r =0.995 0;②n =7,r =0.953 3;③n =15,r =0.301 2;④n =17,r =0.499 1.则变量y 和x 具有线性相关关系的是( )A.①和②B.①和③C.②和④D.③和④答案 C解析 ①n =3时,r 0.05=0.997,所以|r |<r 0.05,我们没有理由拒绝原来的假设,这时寻找回归直线方程是毫无意义的.②n =7时,r 0.05=0.754,所以|r |>r 0.05,表明有95%的把握认为x 与y 之间具有线性相关关系.③n =15时,r 0.05=0.514,所以|r |<r 0.05,我们没有理由拒绝原来的假设,这时寻找回归直线方程是毫无意义的.④n =17时,r 0.05=0.482,所以|r |>r 0.05,表明有95%的把握认为x 与y 之间具有线性相关关系.所以②和④满足题意.3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归直线方程可能是( )A.y ^=-10x +200B.y ^=10x +200C.y ^=-10x -200D.y ^=10x -200 答案 A解析 由于销售量y 与销售价格x 成负相关,故排除B 、D.又当x =10时,A 中y =100,而C 中y =-300,C 不符合题意,故选A.4.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加 万元. 答案 0.2540.254x+1+0.321-(0.254x+0.321)=0.254.解析由题意知[][呈重点、现规律]1.对具有相关关系的两个变量进行统计分析,可从散点图观察大致呈条状分布,可以求回归直线方程并进行预报.2.通过求相关系数并和临界值r0.05比较可以判断两个变量是否有线性相关关系,求得的回归直线方程是否有意义.。

【数学】高中数学第一章统计案例113可线性化的回归分析同步测控北师大版选修12

【数学】高中数学第一章统计案例113可线性化的回归分析同步测控北师大版选修12

【关键字】数学高中数学第一章统计案例 1.1.3 可线性化的回归分析同步测控北师大版选修1-2我夯基我达标1.设在海拔x m处的大气压强是y Pa,y与x之间的关系为y=cekx,其中c、k为常量,如果某游客从大气压为1.01×105 Pa的海平面地区,到了海拔为2 ,大气压为0.90×105 Pa的一个高原地区,则k与c的取值分别是( )A. B.C. D.解析:将和,分别代入y=cekx,得答案:A2.我国1990~2000年的国内生产总值如下表所示:则反映这一时期国内生产总值发展变化的函数模型可能为( )A.y=aekxB.y=a+bxC.y=axbD.y=解析:画出散点图,观察可用y=a+bx刻画国民生产总值发展变化的趋势.答案:B3.下列数据x、y符合的函数模型为( )解析:取x=1,2,…,10,分别代入各解析式判断.答案:D4.指数曲线y=aebx的图像为( )解析:∵y=aebx,a>0时,y>0,排除A、C,且x∈R,排除D,选B.答案:B5.倒指数曲线y=的图像为( )解析:y=,当a>0,b>0时,图像为A.答案:A6.幂函数曲线y=xb,当b>1时的图像为( )解析:当b>1时,图像为A;当0<b<1时,图像为B;当b<0时,图像为C;当b=1时,图像为D.答案:A7.x、y满足则x 、y 之间符合函数模型为___________. 解析:画出散点图,形如y=xb,其中b=2. 答案:y=x2 8.x 、y 满足则x 、y 之间符合函数模型为___________.解析:画出散点图,形如y=a ·ebx,其中a=2,b=1. 答案:y=exln2我综合 我发展9.若x 、y 满足解析:画出散点图,观察图像形如y=,其中b=2. 答案:y=10.若x 、y 满足 则x 、y 满足函数关系是_______________.解析:画出散点图,当x 无限大时,y 逐渐接近于1,符合函数模型y=,其中a=1,b=-1. 答案:y=若y 与t 之间满足y=aebt 关系,求函数解析式,若按此增长趋势估计大约在哪一年我国人口达到14亿?解析:将函数转化为一次函数求解. 解:设μ=lny,c=lna,则μ=c+bt. =45,=110.167 0,=285,=497.593 6,=4.5,=11.016 7, b===0.022 3,c=-b=11.016 7-0.022 3×4.5=10.916 4,∴μ=10.916 4+0.022 3t,y=e10.916 4+0.022 3t.令y=140 000万,则10.916 4+0.022 3t=ln140 000=11.849 4, ∴t=41.838 5,即大约在1950年后的第42年(即1992年)我国人口达到14亿.由此看来,计划生育是我国的基本国策.12.如下表所示,某地区一段时间内观察到的大于或等于某震级x 的地震个数为N,建立回归解析:根据散点图判断函数类型为y=ae ,作变换求解.解:由散点图,知函数模型为y=ae bx, 设μ=lny,c=lna,则μ=c+bx,∑=111i ix=1x i =91.2,∑=111i iμ=138.05,∑=1912i ix=460.56,∑=191i ii x μ=624.622,x =4.8,μ=7.265 8,b=219121911919xx x x i i i ii--∑∑==μμ=28.41956.4602658.78.419622.624⨯-⨯⨯-=-1.667 5,c=μ-b x =7.265 8+1.667 5×4.8=15.269 8,μ=15.269 8-1.667 5x, ∴y=e 15.269 8-1.667 5x.(1)描点画出1990~2000年国内生产总值的图像;(2)建立一个能基本反映这一时期国内生产总值发展变化的函数模型,并根据这个模型,预测2020年的国内生产总值.解析:画出散点图,观察函数类型. 解:(1)作散点图(略).(2)由散点图,可知函数为y=a+bx,∑=111i i t =1x i =21 945,∑=111i i y =592 425.3,∑=1112i i x =43 780 385,∑=111i ii yx =1 182 725 833,x =1 995,y =53 856.845,b=211121111111xx yx yx i i i ii∑∑==--=219951143780385845.538561995111182725833⨯-⨯⨯-=7 612.359 1,a=y -b x =53 856.845-7 612.359 1×1 995=-15 132 799.56,∴y=-15 132 799.56+7 612.359 1x.当x=2 020时,y=244 165.822亿元, 即预测2020年国民生产总值约为244 165.822亿元.我创新 我超越14.在平炉炼钢中,由于矿石与炉气中的氧气作用,铁水的总含量不断下降,现测得含碳量求回归方程.解析:画出散点图观察样本点分布在一条指数函数曲线y=ae bx的周围,再应用换元转化为线性回归问题求解. 则∑=111i it=66,∑=111i iz=6.816,∑=1112i it=400.4,∑=111i ii tz =32.778 2,t =6,z =0.6196,b=22111116114.4006196.06117782.321111⨯-⨯⨯-=--∑∑==tt z zt tz ti i i i ii =4.41178.8-=-1.845,c=z -b t =11.689. ∴z=-1.845t+11.689.∴y=e -1.845t+11.689.此文档是由网络收集并进行重新排版整理.word 可编辑版本!。

2018-2019学年高中数学 第一章 统计案例 1.2 回归分析学案 苏教版选修1-2

2018-2019学年高中数学 第一章 统计案例 1.2 回归分析学案 苏教版选修1-2

1.2 回归分析学习目标 1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.3.了解非线性回归分析.知识点一 线性回归模型思考 某电脑公司有5名产品推销员,其工作年限与年推销金额数据如下表:推销员编号 1 2 3 4 5 工作年限x /年 3 5 6 7 9 年推销金额y /万元23345请问如何表示年推销金额y 与工作年限x 之间的相关关系?y 关于x 的线性回归方程是什么? 答案 画出散点图,由图可知,样本点散布在一条直线附近,因此可用回归直线表示两变量之间的相关关系.设所求的线性回归方程为y ^=b ^x +a ^,则b ^=i =15(x i -x )(y i -y )i =15(x i -x )2=1020=0.5, a ^=y -b ^x =0.4.所以年推销金额y 关于工作年限x 的线性回归方程为y ^=0.5x +0.4.梳理 线性回归模型 (1)随机误差具有线性相关关系的两个变量的取值x ,y ,y 的值不能由x 完全确定,可将x ,y 之间的关系表示为y =a +bx +ε,其中a +bx 是确定性函数,ε称为随机误差. (2)随机误差产生的主要原因①所用的确定性函数不恰当引起的误差. ②忽略了某些因素的影响. ③存在观测误差.(3)线性回归模型中a ,b 值的求法y =a +bx +ε称为线性回归模型.a ,b 的估计值为a ^,b ^,则⎩⎪⎨⎪⎧b ^=∑i =1nx i y i-n x y ∑i =1nx 2i-n (x )2,a ^=y -b ^x .(4)回归直线和线性回归方程直线y ^=a ^+b ^x 称为回归直线,此直线方程即为线性回归方程,a ^称为回归截距,b ^称为回归系数,y ^称为回归值. 知识点二 样本相关系数r具有相关关系的两个变量的线性回归方程为y ^=b ^x +a ^.思考1 变量y ^与真实值y 一样吗? 答案 不一定.思考2 变量y ^与真实值y 之间误差大了好还是小了好? 答案 越小越好.梳理 样本相关系数r 及其性质(1)r =∑i =1nx i y i -n x y(∑i =1nx 2i -n (x )2)(∑i =1ny 2i -n (y )2).(2)r 具有以下性质: ①|r |≤1.②|r |越接近于1,x ,y 的线性相关程度越强. ③|r |越接近于0,x ,y 的线性相关程度越弱.知识点三 对相关系数r 进行显著性检验的基本步骤 1.提出统计假设H 0:变量x ,y 不具有线性相关关系.2.如果以95%的把握作出判断,那么可以根据1-0.95=0.05与n -2在教材附录1中查出一个r 的临界值r 0.05(其中1-0.95=0.05称为检验水平). 3.计算样本相关系数r .4.作出统计推断:若|r |>r 0.05,则否定H 0,表明有95%的把握认为x 与y 之间具有线性相关关系;若|r |≤r 0.05,则没有理由拒绝原来的假设H 0,即就目前数据而言,没有充分理由认为y 与x 之间有线性相关关系.1.求线性回归方程前可以不进行相关性检验.( × )2.在残差图中,纵坐标为残差,横坐标可以选为样本编号.( √ ) 3.利用线性回归方程求出的值是准确值.( × )类型一 求线性回归方程例1 某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:x 6 8 10 12 y2356(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^; (3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.⎝ ⎛⎭⎪⎪⎫相关公式:b ^=∑i =1nx i y i-n x y ∑i =1nx 2i-n (x )2,a ^=y -b ^x 考点 线性回归方程 题点 求线性回归方程 解 (1)如图:(2)∑i =14x i y i =6×2+8×3+10×5+12×6=158,x =6+8+10+124=9,y =2+3+5+64=4,∑i =14x 2i =62+82+102+122=344, b ^=158-4×9×4344-4×92=1420=0.7, a ^=y -b ^x =4-0.7×9=-2.3,故线性回归方程为y ^=0.7x -2.3.(3)由(2)中线性回归方程可知,当x =9时,y ^=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.反思与感悟 (1)求线性回归方程的基本步骤①列出散点图,从直观上分析数据间是否存在线性相关关系.②计算:x ,y ,∑i =1nx 2i ,∑i =1nx i y i .③代入公式求出y ^=b ^x +a ^中参数b ^,a ^的值. ④写出线性回归方程并对实际问题作出估计.(2)需特别注意的是,只有在散点图大致呈线性时,求出的回归方程才有实际意义. 跟踪训练1 某班5名学生的数学和物理成绩如下表:学生编号 12345学科编号 ABCDE数学成绩(x ) 88 76 73 66 63 物理成绩(y )7865716461(1)画出散点图;(2)求物理成绩y 对数学成绩x 的线性回归方程; (3)一名学生的数学成绩是96,试预测他的物理成绩.考点 线性回归方程 题点 求线性回归方程 解 (1)散点图如图.(2)x =15×(88+76+73+66+63)=73.2,y =15×(78+65+71+64+61)=67.8.∑i =15x i y i =88×78+76×65+73×71+66×64+63×61=25054.∑i =15x 2i =882+762+732+662+632=27174. 所以b ^=∑i =15x i y i -5x y∑i =15x 2i -5(x )2=25054-5×73.2×67.827174-5×73.22≈0.625. a ^=y -b ^x ≈67.8-0.625×73.2=22.05.所以y 对x 的线性回归方程是y ^=0.625x +22.05.(3)当x =96时,y ^=0.625×96+22.05≈82,即可以预测他的物理成绩约是82. 类型二 线性回归分析例2 现随机抽取了某中学高一10名在校学生,他们入学时的数学成绩(x )与入学后第一次考试的数学成绩(y )如下表:学生号1 2 3 4 5 6 7 8 9 10 x 120 108 117 104 103 110 104 105 99 108 y84648468696869465771请问:这10名学生的两次数学成绩是否具有线性关系? 考点 题点解 x =110(120+108+…+99+108)=107.8, y =110(84+64+…+57+71)=68.∑i =110x 2i =1202+1082+…+992+1082=116584. ∑i =110y 2i =842+642+…+572+712=47384. ∑i =110x i y i =120×84+108×64+…+99×57+108×71=73796.所以相关系数为r =73796-10×107.8×68(116584-10×107.82)(47384-10×682)≈0.751. 由检验水平0.05及n -2=8, 在附录1中查得r 0.05=0.632. 因为0.751>0.632,由此可看出这10名学生的两次数学成绩具有较强的线性相关关系. 反思与感悟 相关关系的两种判定方法 (1)利用散点图判定(2)利用相关系数判定计算r ―→结合r 的值与相关性检验临界值表中的值进行比较判断跟踪训练2 一台机器由于使用时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转的速度而变化,下表为抽样试验的结果:转速x (转/秒)16 14 12 8 每小时生产有缺点的零件数y (件)11985对变量y 与x 进行线性相关性检验. 考点 题点解 由题中数据可得x =12.5,y =8.25,∑i =14x i y i =438,4x y =412.5,∑i =14x 2i =660,∑i =14y 2i =291, 所以r =∑i =14x i y i -4x y(∑i =14x 2i -4(x )2)(∑i =14y 2i -4(y )2)=438-412.5(660-625)×(291-272.25)=25.5656.25≈0.995. 由检验水平0.05及n -2=2,在教材附录1中查得r 0.05=0.950,因为r >r 0.05,所以y 与x 具有线性相关关系. 类型三 非线性回归分析 例3 下表为收集到的一组数据:x 21 23 25 27 29 32 35 y711212466115325(1)作出x 与y 的散点图,并猜测x 与y 之间的关系; (2)建立x 与y 的关系;(3)利用所得模型,估计当x =40时y 的值. 考点 非线性回归分析 题点 非线性回归分析解 (1)作出散点图如图,从散点图可以看出x 与y 不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数型函数曲线y =c 1e c 2x 的周围,其中c 1,c 2为待定的参数.(2)对两边取对数把指数关系变为线性关系,令z =ln y ,则有变换后的样本点应分布在直线z =bx +a ,a =ln c 1,b =c 2的周围,这样就可以利用线性回归模型来建立y 与x 之间的非线性回归方程,数据可以转化为x 21 23 25 27 29 32 35z1.9462.3983.045 3.1784.190 4.7455.784x=17(21+23+…+32+35)=27.429,z =17(1.946+2.398+…+4.745+5.784)=3.612,∑i =17x i z i =733.741,∑i =17x 2i =5414. 求得线性回归方程为z ^=0.273x -3.876,∴y ^=e0.273x -3.876.(3)当x =40时,y ^=e 0.273x -3.876≈1146.反思与感悟 非线性回归问题的处理方法 (1)指数型函数y =e bx +a①函数y =ebx +a的图象②处理方法:两边取对数,得ln y =lnebx +a,即ln y =bx +a .令z =ln y ,把原始数据(x ,y )转化为(x ,z ),再根据线性回归模型的方法求出a ,b . (2)对数型函数y =b ln x +a ①函数y =b ln x +a 的图象:②处理方法:设x ′=ln x ,原方程可化为y =bx ′+a , 再根据线性回归模型的方法求出a ,b . (3)y =bx 2+a 型处理方法:设x ′=x 2,原方程可化为y =bx ′+a ,再根据线性回归模型的方法求出a ,b . 跟踪训练3 已知某种食品每千克的生产成本y (元)与生产该食品的重量x (千克)有关,经生产统计得到以下数据:x 1 2 3 5 10通过以上数据,判断该食品的生产成本y (元)与生产的重量x (千克)的倒数1x之间是否具有线性相关关系.若有,求出y 关于1x的回归方程,并估计一下生产该食品500千克时每千克的生产成本约是多少.(精确到0.01) 考点 非线性回归分析 题点 非线性回归分析解 设u =1x,通过已知数据得到y 与u 的相应数据为根据上述数据可求得相关系数r =∑i =110u i ·y i -10u ·y(∑i =110u 2i -10·(u )2)(∑i =110y 2i -10·(y )2)≈0.9998,于是有很大的把握认为y 与1x具有线性相关关系.而b ^=∑i =110u i ·y i -10u ·y∑i =110u 2i -10(u )2≈8.973,a ^=y -b ^·u ≈1.126,于是y 与1x 的回归方程为y ^=8.973x+1.126.当x =500时,y ^=8.973500+1.126≈1.14.所以估计生产该食品500千克时每千克的生产成本约是1.14元.1.设有一个线性回归方程y ^=2-1.5x ,当变量x 增加1个单位时,y 平均________个单位. 考点 线性回归分析 题点 线性回归方程的应用 答案 减少1.5解析 由回归方程中两个变量之间的关系可以得到.2.如图四个散点图中,适合用线性回归模型拟合其中两个变量的是________.(填序号)考点 回归分析题点 建立回归模型的基本步骤 答案 ①③解析 由图易知①③两个图中样本点在一条直线附近,因此适合用线性回归模型. 3.某厂节能降耗技术改造后,在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对应数据如表:x 3 4 5 6 y2.5t44.5根据上表提供的数据,求出y 关于x 的线性回归方程为y ^=0.7x +0.35,则上表中的t =________.考点 线性回归分析 题点 线性回归方程的应用 答案 34.下表是x 和y 之间的一组数据,则y 关于x 的回归直线必过点________.x 1 2 3 4 y1357考点 线性回归方程 题点 样本点中心的应用答案 (2.5,4)解析 回归直线必过样本点中心(x ,y ),即(2.5,4). 5.已知x ,y 之间的一组数据如下表:x 0 1 2 3 y1357(1)分别计算:x ,y ,x 1y 1+x 2y 2+x 3y 3+x 4y 4,x 21+x 22+x 23+x 24; (2)已知变量x 与y 线性相关,求出回归方程. 考点 线性回归方程 题点 求线性回归方程解 (1)x =0+1+2+34=1.5,y =1+3+5+74=4,x 1y 1+x 2y 2+x 3y 3+x 4y 4=0×1+1×3+2×5+3×7=34,x 21+x 22+x 23+x 24=02+12+22+32=14.(2)b ^=34-4×1.5×414-4×1.52=2,a ^=y -b ^x =4-2×1.5=1,故y ^=2x +1.回归分析的步骤(1)确定研究对象,明确哪个变量是自变量,哪个变量是因变量.(2)画出确定好的因变量关于自变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程y ^=b ^x +a ^). (4)按一定规则估计回归方程中的参数.一、填空题1.根据如下样本数据:x 3 4 5 6 7 8 y4.02.5-0.50.5-2.0-3.0得到的回归方程为y ^=b ^x +a ^,则a ^,b ^与0的大小关系是________. 考点 线性回归分析 题点 线性回归方程的应用答案 a ^>0,b ^<0 解析 作出散点图如下:观察图象可知,回归直线y ^=b ^x +a ^的斜率b ^<0,当x =0时,y ^=a ^>0.故a ^>0,b ^<0.2.某同学在研究性学习中,收集到某制药厂今年前5个月甲胶囊生产产量(单位:万盒)的数据如下表所示:x (月份) 1 2 3 4 5 y (万盒)55668若x ,y 线性相关,线性回归方程为y ^=0.7x +a ^,估计该制药厂6月份生产甲胶囊产量约为________万盒. 考点 线性回归方程 题点 样本点中心的应用 答案 8.1解析 回归直线一定过样本点中心.由已知数据,可得x =3,y =6,代入回归方程,可得a ^=y -0.7x =3.9,即回归方程为y ^=0.7x +3.9.把x =6代入,可得y ^=8.1,所以6月份的产量约为8.1万盒.3.某化工厂为预测某产品的回收率y ,而要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18x i y i =1849,则y 与x 的线性回归方程是________________. 考点 线性回归方程题点 求线性回归方程答案 y ^=2.62x +11.47解析 由题中数据得x =6.5,y =28.5,∴b ^=∑i =18x i y i -8x·y∑i =18x 2i -8(x )2=1849-8×6.5×28.5478-8×6.52=367140≈2.62, a ^=y -b ^x ≈28.5-2.62×6.5=11.47,∴y 与x 的线性回归方程是y ^=2.62x +11.47. 4.已知x ,y 的取值如下表:从所得的散点图分析,y 与x 线性相关,且y ^=0.95x +a ^,则a ^=________. 考点 题点 答案 2.6解析 ∵x =2,y =4.5.又回归直线恒过定点(x ,y ),代入得a ^=2.6.5.从某大学随机选取8名女大学生,其身高x (cm)和体重y (kg)的线性回归方程为y ^=0.849x -85.712,则身高172cm 的女大学生,由线性回归方程可以估计其体重为________kg. 考点 题点 答案 60.316解析 y ^=0.849×172-85.712=60.316. 6.有下列关系:①曲线上的点与该点的坐标之间的关系; ②苹果的产量与气候之间的关系;③森林中的同一种树木,其断面直径与高度之间的关系; ④学生与其学号之间的关系.其中有相关关系的是________.(填序号) 考点 题点 答案 ②③解析 由相关关系定义分析.7.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得线性回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型估计广告费用为6万元时的销售额为____________万元. 考点 题点 答案 65.5解析 样本点中心是(3.5,42),则a ^=y -b ^x =42-9.4×3.5=9.1,所以线性回归方程是y ^=9.4x +9.1,把x =6代入,得y ^=65.5.8.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________. 考点 线性相关系数题点 线性相关系数的概念及计算 答案 1解析 根据样本相关系数的定义可知,当所有样本点都在一条直线上且直线斜率大于零时,相关系数为1.9.对于回归分析,有下列叙述:①在回归分析中,变量间的关系若是非确定性关系,则因变量不能由自变量唯一确定; ②线性相关系数可以是正的或是负的;③回归分析中,如果r 2=1或r =±1,说明x 与y 之间完全线性相关; ④样本相关系数r ∈(-∞,+∞). 其说法正确的序号是________.考点 题点 答案 ①②③解析 由回归模型及其性质易知①②③是正确的.相关系数的取值范围应为|r |≤1,所以④是错误的.10.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y =ebx +a的周围.令z =ln y ,求得线性回归方程为z ^=0.25x -2.58,则该模型的回归方程为________. 考点 非线性回归分析 题点 非线性回归分析 答案 y =e0.25x -2.58解析 因为z ^=0.25x -2.58,z =ln y ,所以y ^=e0.25x -2.58.11.在对两个变量进行回归分析时,甲、乙分别给出两个不同的回归方程,并对回归方程进行检验.对这两个回归方程进行检验时,与实际数据(个数)的对比结果如下:则从表中数据分析,________回归方程更好.(即与实际数据更贴近) 考点 两个模型拟合效果的比较 题点 两个模型拟合效果的比较 答案 甲解析 可以根据表中数据分析,两个回归方程对数据预测的正确率进行判断,甲回归方程的数据准确率为3240=45,而乙回归方程的数据准确率为4060=23.显然甲的准确率高些,因此甲回归方程好些. 二、解答题12.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:(1)在给定的坐标系中画出表中数据的散点图;(2)求出y 关于x 的线性回归方程y ^=b ^x +a ^,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少时间?(注:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n (x )2,a ^=y -b ^x ) 考点 线性回归方程 题点 求线性回归方程 解 (1)散点图如图.(2)由表中数据得∑i =14x i y i =52.5,x =3.5,y =3.5,∑i =14x 2i =54,所以b ^=∑i =14x i y i -4x y∑i =14x 2i -4(x )2=0.7,所以a ^=y -b ^x =1.05.所以y ^=0.7x +1.05. 回归直线如第(1)问图所示.(3)将x =10代入线性回归方程,得y ^=0.7×10+1.05=8.05,所以预测加工10个零件需要8.05小时.13.为了研究某种细菌随时间x 的变化繁殖个数y 的变化情况,收集数据如下:时间x (天) 1 2 3 4 5 6 繁殖个数y612254995190(1)(2)求y 与x 之间的回归方程. 考点 非线性回归分析 题点 非线性回归分析 解 (1)散点图如图所示:(2)由散点图看出样本点分布在一条指数曲线y =c 1e c 2x 的周围,于是令z =ln y ,则x 1 2 3 4 5 6 z1.792.483.223.894.555.25所以z ^=0.69x +1.115,则有y ^=e 0.69x +1.115.三、探究与拓展14.已知x ,y 的取值如下表:x 2 3 5 6 y2.74.36.16.9从散点图分析y 与x 具有线性相关关系,且回归方程为y ^=1.02x +a ^,则a ^=________. 考点 题点 答案 0.92解析 由题意得x =4,y =5,又(x ,y )在直线y ^=1.02x +a ^上,所以a ^=5-4×1.02=0.92.15.在一段时间内,分5次测得某种商品的价格x (万元)和需求量y (t)之间的一组数据为1234 5价格x 1.4 1.6 1.82 2.2需求量y 121075 3已知∑i=15x i y i=62,∑i=15x2i=16.6.(1)画出散点图;(2)求出y对x的线性回归方程;(3)如果价格定为1.9万元,预测需求量大约是多少?(精确到0.01t) 考点题点解(1)散点图如图所示:(2)因为x=15×9=1.8,y=15×37=7.4,∑i=15x i y i=62,∑i=15x2i=16.6,所以b^=∑i=15x i y i-5x y∑i=15x2i-5(x)2=62-5×1.8×7.416.6-5×1.82=-11.5,a^=y-b^x=7.4+11.5×1.8=28.1,故y对x的线性回归方程为y^=-11.5x+28.1.(3)y^=28.1-11.5×1.9=6.25(t).故价格定为1.9万元,预测需求量大约为6.25 t.。

2018年陕西省高三数学第1章《统计案例》导学案:1.1.1回归分析的基本思想及其初步应用(1)

2018年陕西省高三数学第1章《统计案例》导学案:1.1.1回归分析的基本思想及其初步应用(1)

1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;2. 了解线性回归模型与函数模型的差异,了解衡量两个变量之间线性相关关系得方法---相关系数.24 问题1:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?复习1:函数关系是一种 关系,而相关关系是一种 关系.复习2:回归分析是对具有 关系的两个变量进行统计分析的一种常用方法,其步骤: → → → .二、新课导学 ※ 学习探究实例问题为172cm 的女大学生的体重.解:由于问题中要求根据身高预报体重,因此 选 自变量x , 为因变量. (1)做散点图:从散点图可以看出 和 有比较好的 相关关系.(2) x = y =81i ii x y==∑821ii x==∑所以81822188i ii ii x yx y b xx==-==-∑∑a y bx=-≈于是得到回归直线的方程为r>0, 相关, r<0 相关;相关系数的绝对值越接近于1,两个变量的线性相关关系,它们的散点图越接近;r>,两个变量有关系.※典型例题例1某班5名学生的数学和物理成绩如下表:(2)求物理成绩y对数学成绩x的回归直线方程;(3)该班某学生数学成绩为96,试预测其物理成绩;变式:该班某学生数学成绩为55,试预测其物理成绩;小结:求线性回归方程的步骤:※动手试试练.(07广东文科卷)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=+;y bx a(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?⨯+⨯+⨯+⨯=)(参考数值3 2.543546 4.566.5三、总结提升※学习小结1. 求线性回归方程的步骤:2. 线性回归模型与一次函数有何不同※知识拓展※自我评价你完成本节导学案的情况为().A. 很好B. 较好C. 一般D. 较差※当堂检测(时量:5分钟满分:10分)计分:1. 下列两个变量具有相关关系的是()A. 正方体的体积与边长B. 人的身高与视力C.人的身高与体重D.匀速直线运动中的位移与时间2. 在画两个变量的散点图时,下面哪个叙述是正确的()A.预报变量在x 轴上,解释变量在y 轴上B. 解释变量在x 轴上,预报变量在y 轴上C. 可以选择两个变量中任意一个变量在x 轴上D. 可选择两个变量中任意一个变量在y 轴上3. 回归直线y bx a=+必过()A. (0,0)B. (,0)x C. (0,)y D. (,)x y4.r越接近于1,两个变量的线性相关关系.5. 已知回归直线方程0.50.81=-,则25y xx=时,y的估计值为.。

2017-2018学年高中数学 第一章 统计案例 1.1 回归分析 1.1.1 回归分析 1.1.2 相关系数课件 北师大版选修1-2

2017-2018学年高中数学 第一章 统计案例 1.1 回归分析 1.1.1 回归分析 1.1.2 相关系数课件 北师大版选修1-2

年龄 x/岁 4
5
6
7
8
9
10
身高 y/cm 100 106 112 116 121 124 130
求y对x的线性回归方程. 思路分析:根据求回归系数的公式求a,b,再写出回归直线方程.
探究一
探究二
探究三
思维辨析
解:制表
i
123456
xi
456789
yi 100 106 112 116 121 124
探究一
探究二
探究三
思维辨析
������ = 1 15515=101,������ = 15115.7≈10.11,
15
15
15
5, ∑ xiyi=16 076.8.
������=1
i=1
������=1
故蔬菜产量与施用氮肥量的相关系数
所以当每单位面积施氮肥 150 kg 时,每单位面积蔬菜年平均产
量为 0.646 3+0.093 7×150≈14.701(t).
探究一
探究二
探究三
思维辨析
反思感悟线性回归分析的简要步骤 1.随机抽取样本,确定样本数据. 2.判断两变量是否具有线性相关关系,可画出散点图用散点图判 断;也可计算相关系数r,用相关系数作出判断. 3.若两变量线性相关,用最小二乘法求出回归直线方程. 4.分析模型的拟合效果,看有无特殊点,不合适时,分析错因,加以 纠正. 5.依据回归方程作出预报.
() (4)因为由任何一组观测值都可以求得一个线性回归方程,所以没有 必要进行相关性检验. ( ) (5)回归分析是具有相关关系的两个变量进行统计分析的一种方法.
()
答案:(1)√ (2)√ (3)√ (4)× (5)√

高中数学 第一章 统计案例 1.1.1 回归分析的基本思想及其初步应用导学案新人教A版选修1-2

高中数学 第一章 统计案例 1.1.1 回归分析的基本思想及其初步应用导学案新人教A版选修1-2

回归分析的基本思想及其初步应用
—相关指数和残差分析.
.当一个变量取值改变时,另一个变量的取值随之改变,
这样的两个变量之间的关系叫做相关关系.
知识点2:线性回归分析
.回归分析是处理两个变量之间__________常用的一种统计方法.若两个变
的绝对值越接近
线性相关关系.通常当
__________
.在研究两
数据中是否存在可疑数据,这方面的分析

x
负相关
的观测数据的平均值都是
,则回归直线方程是
②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系
有如下的统计:。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;
2. 通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法.
3. 了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较.
一、基础过关
3.对于指数曲线y=a e bx,令u=ln y,c=ln a,经过非线性化回归分析之后,可以转化成的形式为() A.u=c+bx B.u=b+cx
C.y=b+cx D.y=c+bx
4.下列说法错误的是() A.当变量之间的相关关系不是线性相关关系时,也能直接用线性回归方程描述它们之间的相关关系
B.把非线性回归化为线性回归为我们解决问题提供一种方法
C.当变量之间的相关关系不是线性相关关系时,也能描述变量之间的相关关系
D.当变量之间的相关关系不是线性相关关系时,可以通过适当的变换使其转换为线性关系,将问题化为线性回归分析问题来解决
5.每一吨铸铁成本y c(元)与铸件废品率x%建立的回归方程y c=56+8x,下列说法正确的是() A.废品率每增加1%,成本每吨增加64元
B.废品率每增加1%,成本每吨增加8%
C.废品率每增加1%,成本每吨增加8元
D.如果废品率增加1%,则每吨成本为56元
二、能力提升
7.研究人员对10个家庭的儿童问题行为程度(X)及其母亲的不耐心程度(Y)进行了评价结果如下,家庭1,2, 3,4,5,6,7,8,9,10,儿童得分:72,40,52,87,39,95,12,64,49,46,母亲得分:79,62,53,89,81,90,10,82,78,70.
下列哪个方程可以较恰当的拟合() A.y=0.771 1x+26.528
B.y=36.958ln x-74.604
C.y=1.177 8x1.014 5
D.y=20.924e0.019 3x
8.已知x,y之间的一组数据如下表:
则y与x之间的线性回归方程y=bx+a必过点________.
9.已知线性回归方程为y=0.50x-0.81,则x=25时,y的估计值为________.
10.在一次抽样调查中测得样本的5个样本点,数值如下表:
如何建立y与x
11.某地区六年来轻工业产品利润总额y与年次x的试验数据如下表所示:
求y关于x的回归方程.(保留三位有效数字)。

相关文档
最新文档