3.2 回归分析-王后雄学案
高中数学 第三章 统计 3.2 回归分析学案 新人教B版选修2-3(2021年最新整理)

高中数学第三章统计3.2 回归分析学案新人教B版选修2-3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第三章统计3.2 回归分析学案新人教B版选修2-3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第三章统计3.2 回归分析学案新人教B版选修2-3的全部内容。
3。
2 回归分析1。
通过对典型案例的探究,了解回归分析的基本思想、方法及其初步应用。
2.会求回归直线方程,并用回归直线方程进行预报。
(重点难点)[基础·初探]教材整理1 回归直线方程阅读教材P83~P84探索与研究以上部分,完成下列问题。
1.回归直线方程其中错误!的计算公式还可以写成错误!=错误!.2.线性回归模型:y=bx+a+εi,其中εi称为随机误差项,a和b是模型的未知参数,自变量x称为解释变量,因变量y称为预报变量.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为错误!=0。
85x-85.71,则下列结论中正确的是________(填序号)。
(1)y与x具有正的线性相关关系;(2)回归直线过样本点的中心(x,错误!);(3)若该大学某女生身高增加1 cm,则其体重约增加0.85 kg;(4)若该大学某女生身高为170 cm,则可断定其体重必为58。
79 kg。
【解析】回归方程中x的系数为0.85>0,因此y与x具有正的线性相关关系,A正确;由回归方程系数的意义可知回归直线过样本点的中心(错误!,错误!),B正确;依据回归方程中错误!的含义可知,x每变化1个单位,错误!相应变化约0。
高中数学 3.2 回归分析教案 理 新人教B版选修2-3

3.2 回归分析【教学目标】1.通过实例了解线性回归模型,感受产生随机误差的原因; 2.能求出简单实际问题的线性回归方程;3.能用相关系数进行相关性检验,并解决简单的回归分析问题;【教学重点】线性回归模型的建立和线性回归系数的最佳估计值的探求方法;【教学难点】相关系数的性质及其相关性检验的基本思想、操作步骤。
一、课前预习1. 若两个变量与之间有近似的线性相关关系,则可以用一个回归直线方程bx a y+=ˆ来反应这种关系,利用最小二乘法可以得到a 和回归系数b 的估计值a ˆ和b ˆ的计算公式:=bˆ___________________=______________________ =aˆ___________________ 由此得到的直线x b a yˆˆˆ+=就称为这n 对数据的回归直线,此直线方程即为线性回归方程.其中aˆ、b ˆ分别为a 、b 的估计值,a ˆ称为回归截距,b ˆ称为回归系数,y ˆ称为回归值。
由公式可以判定:点_________一定在回归直线上,这个点称为样本中心点。
2. 线性回归方程x b a yˆˆˆ+=中a ˆ和b ˆ的意义是:以a ˆ为基数,x 每增加1个单位, y 相应地平均增加________个单位。
3. 对任意给定的样本数据,由计算公式都可以求出相应的线性回归方程,但求得的线性回归方程未必有实际意义,我们可以利用________粗略地估计两个变量间是否有线性相关关系。
若散点明显不在一条直线附近,不能进行线性拟合,求得的线性回归方程是没有实际意义的;若散点基本上在一条直线附近,则可以粗略地判断为线性相关,但它们线性相关的程度又如何呢?如何较为精确地刻画线性相关关系呢? 我们需要对变量x 与y 的线性相关性进行检验,简称_________.4. 相关系数的计算公式对于x 与y 随机取到的n 对数据),(i i y x (i =1,2,3,…,n ),样本相关系数r 的计 算公式为:r=___________________________________________5.相关系数r 的性质(1)____________________;(2)__________________________________________; (3)__________________________________________.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关.6. 相关性检验的步骤:(1)作统计假设:___________________________________________; (2)查表:_________________________________________________; (3)计算:_________________________________________________; (4)作统计推断:___________________________________________;二、课上学习例1.研究某灌溉渠道水的流速Y 与水深x 之间的关系,测得一组数据如下:(1) 求对 的回归直线方程;(保留三位有效数字)(2) 预测水深为1.95m 时水的流速是多少?(保留两位有效数字) 参考数据:,82.15,00.148181==∑∑==i i i iy x,993.27,92.2481812==∑∑==i i i i i y x x三、 课堂小结四、课后练习1、下列结论正确的是①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法A .①②B .①②③C .①②④D .①②③④2.一位母亲记录了她儿子3到9岁的身高,数据如下表:年龄(岁) 3 4 5 6 7 8 9 身高(94.8104.2108.7117.8124.3130.8139.0由此她建立了身高与年龄的回归模型 ,她用这个模型预测儿子10岁时的身高,则下面的叙述正确的是( )A.她儿子10岁时的身高一定是145.83B.她儿子10岁时的身高在145.83 以上C.她儿子10岁时的身高在145.83 左右D.她儿子10岁时的身高在145.83 以下 3.两个变量相关性越强,相关系数r ( )A .越接近于0 B.越接近于1 C.越接近于-1 D.绝对值越接近1 4.若散点图中所有样本点都在一条直线上,两个变量的相关系数为( ) A .0 B.1 C.-1 D.-1或1 5.两个变量有线性相关关系且正相关,则回归直线方程中, 的系数 ( )A.B.C.D.6.三点),10,3(),20,7()24,11(的回归直线方程为________________________.7.某种产品的广告费支出x (单位:百万元)与销售额y (单位:百万元)之间有如下对应数据: x 2 4 5 6 8 y3040605070(1)试对x 和y 的关系进行相关性检验。
高中数学 3.2回归分析 精品导学案 苏教版选修2-3

3.2 回归分析1.线性回归方程y ^=a ^+b ^x 称为数据的回归直线,此直线方程即为线性回归方程,其中a ^称为回归截距,b ^称为回归系数,y ^称为回归值,其中:⎩⎪⎨⎪⎧b ^=∑i =1nx i y i-n x y ∑i =1nx 2i-n x2,a ^=y -b ^x .预习交流1线性回归直线方程y ^=a ^+b ^x 与一次函数y =a +kx 有何区别?提示:一次函数y =a +kx 是y 与x 的确定关系,给x 一个值,y 有唯一确定的值与之对应,而线性回归直线方程是y 与x 的相关关系的近似反映,两个数据x ,y 组成的点(x ,y )可能适合线性回归直线方程,也可能不适合.2.相关系数对于x ,y 随机取到的n 对数据(x i ,y i )(i =1,2,…,n )样本,相关系数r 的计算公式为:r =∑i =1n(x i -x)(y i -y )∑i =1n(x i -x )2∑i =1n (y i -y)2=∑i =1nx i y i -n x y(∑i =1nx 2i -n x 2)(∑i =1ny 2i -n y 2),r 具有如下性质:(1)|r |≤1;(2)|r |越接近于1,x ,y 的线性程度越高;(3)|r |越接近于0,x ,y 的线性相关程度越弱.预习交流2如何利用r 的临界值判断两个变量的线性相关关系?提示:(1)提出统计假设H 0:变量x ,y 不具有线性相关关系;(2)如果以95%的把握作出推断,那么可以根据1-0.95=0.05与n -2在相关性检验的临界值表中查出一个r 的临界值r 0.05(其中1-0.95=0.05称为检验水平);(3)计算样本相关系数r ;(4)作出统计推断:若|r |>r 0.05,则否定H 0,表明有95%的把握认为x 与y 之间具有线性相关关系;若|r |≤r 0.05,则没有理由拒绝原来的假设H 0,即就目前数据而言,没有充分理由认为y 与x 之间有线性相关关系.1.线性回归方程的求法(1)(2)如果y 与x 之间具有线性相关关系,求回归直线方程. 思路分析:求回归直线方程必须先对两个变量进行相关性判断,若两个变量存在较大的相关性,则可利用公式求回归直线方程的系数;若两个变量不具备相关关系,则求回归直线方程将变得毫无意义.解:(1)散点图如图.(2)由散点图可知,y 与x 呈相关关系,设回归直线方程为:y ^=b ^x +a ^. 经计算,得x =6,y =210.4,∑5i =1x 2i =220,∑5i =1x i y i =7 790. ∴b ^=7 790-5×6×210.4220-5×62=36.95, a ^=210.4-36.95×6=-11.3.∴回归直线方程为y ^=36.95x -11.3.某地植被面积x ((1)请用最小二乘法求出y 关于x 的线性回归方程y =b x +a ;(2)根据(1)中所求线性回归方程,如果植被面积为200公顷,则下降的气温大约是多少℃?解:(1)x =20+40+50+60+805=50,y =3+4+4+4+55=4.∑i =15x i y i =20×3+40×4+50×4+60×4+80×5=1 060,∑i =15x 2i =202+402+502+602+802=14 500. 所以b ^=1 060-5×50×414 500-5×502=0.03,a ^=4-0.03×50=2.5.故y 关于x 的线性回归方程y ^=0.03x +2.5.(2)由(1)得:当x =200时,y ^=0.03×200+2.5=8.5. 所以植被面积为200公顷时,下降的气温大约是8.5 ℃.先作出散点图可直观地判断两个变量的相关关系,线性回归直线方程一定过样本中心(x ,y ).2.相关系数及相关性检验现随机抽取了我校10名学生在入学考试中的数学成绩(x )与入学后的第一次考试中的思路分析:先利用相关系数计算公式r =∑i =1nx i y i -n x y(∑i =1nx 2i -n x 2)(∑i =1ny 2i -n y 2)计算出r ,当|r |越接近于1时,两个变量越具有很强的线性关系.解:由题意得:x =110×(120+108+…+99+108)=107.8,y =110×(84+64+…+57+71)=68,∑i =110x 2i =1202+1082+…+992+1082=116 584, ∑i =110y 2i =842+642+…+572+712=47 384,i =1nx i y i =120×84+108×64+…+108×71=73 796,∴r =73 796-10×107.8×68(116 584-10×107.82)·(47 384-10×682)≈0.750 6.∵0.750 6接近于1,∴两次数学考试成绩有显著性线性相关关系.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系,如果已测得炉料熔化完毕时,钢水的含碳量x 与冶炼时间y (从(1)y 与x 是否具有线性相关关系?(2)如果y 与x 具有线性相关关系,求线性回归方程.(3)预测当钢水含碳量为160个0.01%时,应冶炼多少分钟?于是r =∑i =1x i y i -10x y(∑10i =1x 2i -10x 2)(∑10i =1y 2i -10y 2)≈0.990 6.∵0.990 6非常接近于1,∴y 与x 具有显著的线性相关关系.(2)设所求的线性回归方程为y ^=b ^x +a ^,其中a ^,b ^的值使Q =∑10i =1(y i -b ^x i -a ^)2的值最小. b ^=∑10i =1x i y i -10x y∑10i =1x 2i -10x2≈1.267,a ^=y -b ^x ≈-30.47,即所求的线性回归方程为y ^=1.267x -30.47.(3)当x =160时,y ^=1.267×160-30.47≈172,即大约冶炼172 min. 如果两个变量不具备线性相关关系或者线性相关关系不显著,即使求出线性回归方程也无意义,用于估计和测量的结果也是不可信的.1.已知x ,y则y 与x 的回归直线方程y =b x +a 必过定点__________.答案:⎝ ⎛⎭⎪⎫32,4 解析:x =14×(0+1+2+3)=32.y =14×(1+3+5-a +7+a )=4,而y ^=b ^x +a ^过(x ,y ). 2.已知x ,y从散点图分析,y 与x 线性相关,且y =0.95x +a ,则a =__________. 答案:2.6解析:x =14×(0+1+3+4)=2,y =14×(2.2+4.3+4.8+6.7)=4.5.4.5=0.95×2+a ^,∴a ^=2.6.3根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为__________.答案:65.5万元解析:x =3.5,y =4.2,∵4.2=9.4×3.5+a ^,∴a ^=9.1.∴y ^=9.4x +9.1.当x =6时,y ^=65.5(万元).4.如下表中给出五组数据(x ,y ),从中选出四组使其线性相关最大,且保留第一组(-5,-3)答案:三解析:应去掉第三组;画散点图可以发现.5.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了4次试验.收集的数据如下:(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^; (2)现需生产20件此零件,预测需用多长时间?解:(1)x =1+2+3+44=2.5,y =2+3+5+84=4.5,b ^=∑i =14x i y i -4x y∑i =14x 2i -4x 2=(2+6+15+32)-4×2.5×4.5(1+4+9+16)-4×2.5×2.5=2, a ^=y -b ^x =4.5-2×2.5=-0.5,所以y ^=2x -0.5.(2)因为y ^=2×20-0.5=39.5(小时),所以生产20件此零件,预测需用39.5小时.教师个人研修总结在新课改的形式下,如何激发教师的教研热情,提升教师的教研能力和学校整体的教研实效,是摆在每一个学校面前的一项重要的“校本工程”。
人教新课标B版高中数学高二选修2-3教学设计 3.2第1课时 回归分析

回归分析【教学目标】:(1)知识与技能:了解求线形回归方程的两个计算公式的推导过程,、回归平方和;了解随机误差产生的原因;了解判断刻画模型拟合效果的方法——相关指数和残差分析;了解非线性模型通过变换转化为线性回归模型。
(2)过程与方法:本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线方程,从中也找出存在的不足,从而有进行回归分析的必要性,进而学习相关指数,用相关指数来刻画回归的效果。
(3)情感态度与价值观:从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求知欲,培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进取。
【教学重点】:1.了解判断刻画模型拟合效果的方法——相关指数和残差分析;2.通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型。
【教学难点】:1.了解随机误差产生的原因,用残差平方和衡量回归方程的预报精度;2.了解判断刻画模型拟合效果的方法——相关指数和残差分析。
【教学过程设计】:教学环节教学活动设计意图一、创设情境1.由例1知,体重的值受身高或随机误差的影响。
2.问题一:身高172cm的女大学生的体重一定是60.316kg吗?如果不是,其原因是什么?引入回归分析的效果评价的三个统计量二、探究新知解答问题一:结合实例由结果分析残差图是否异常,养成从实际问题40455055606570150155160165170175180显然,身高172cm 的女大学生的体重不一定是60.316kg ,但 一般可以认为她的体重接近于60.316kg.上图3.1-2中的样本点和回归直线的相互位置说明了这一点.由于所有的样本点不共线,而只是散布在某一条直线的附近,所以身高和体重的关系可用下面的线性回归模型来表示: y=bx+a+e (3) 这里a 和b 为模型的未知参数,e 是y 与a bx y +=~之间的误差。
通常e 为随机变量,称为随机误差,它的均值E(e)=0,方差D (e)=02>σ.这样线性回归模型的完整表达式为:⎩⎨⎧==++=2)(,0)(σe D e E ea bx y (4) 在线性回归模型(4)中,随机误差e 的方差2σ越小,通过回归直线a bx y +=~(5)预报真实值y 的精度越高。
3.2 回归分析 学案(人教B版高中数学选修2-3)

3.2 回归分析学案(人教B版高中数学选修2-3)3.2回归分析回归分析学习目标1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度知识点一回归分析及回归直线方程思考1什么叫回归分析答案回归分析是对具有相关关系的两个变量进行统计分析的一种方法思考2回归分析中,利用回归直线方程求出的函数值一定是真实值吗答案不一定是真实值,利用回归直线方程求的值,在很多时候是个预测值梳理1回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法若两个变量之间具有线性相关关系,则称相应的回归分析为线性回归分析2回归直线方程为ybxa,且bi1nxixyiyi1nxix2,aybx,其中x1ni1nxi,y1ni1nyi,x,y称为样本点的中心,回归直线一定过样本点的中心知识点二相关系数1对于变量x与Y随机抽到的n对数据x1,y1,x2,y2,,xn,yn,检验统计量是样本相关系数rni1xixyiyni1xix2ni1yiy2ni1xiyinxyni1x2inx2ni1y2iny2.2相关系数r的取值范围是1,1,|r|越接近1,变量之间的线性相关程度越强;|r|越接近0,变量之间的线性相关程度越弱当|r|r0.05时,表明有95的把握认为两个变量之间具有线性相关关系1求回归直线方程前可以不进行相关性检验2利用回归直线方程求出的值是准确值类型一回归直线方程例1若从某大学中随机选取8名女大学生,其身高和体重数据如下表所示编号_________12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据女大学生的身高预测体重的回归直线方程,并预测一名身高为172cm的女大学生的体重考点线性回归分析题点回归直线的应用解1画散点图选取身高为自变量x,体重为因变量y,画出散点图,展示两个变量之间的关系,并判断二者是否具有线性关系由散点图可以发现,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用回归直线方程ybxa 来近似刻画它们之间的关系2建立回归方程由计算器可得b0.848,a85.632.于是得到回归直线方程为y0.848x85.632.3预测和决策当x172时,y0.84817285.63260.224kg即一名身高为172cm的女大学生的体重预测值为60.224kg.反思与感悟在使用回归直线方程进行预测时要注意1回归直线方程只适用于我们所研究的样本的总体2我们所建立的回归直线方程一般都有时间性3样本取值的范围会影响回归直线方程的适用范围4不能期望回归直线方程得到的预测值就是因变量的精确值跟踪训练1假设关于某设备的使用年限x年和所支出的维修费用y万元有如下的统计数据x23456y2.23.85.56.57.0由此资料可知y对x呈线性相关关系1求回归直线方程;2求使用年限为10年时,该设备的维修费用为多少考点回归直线方程题点求回归直线方程解1由题干表中的数据可得x4,y5,i15x2i90,i15xiyi112.3,bi15xiyi5xyi15x2i5x2112.3545905421.23,aybx51.2340.08.回归直线方程为y1.23x0.08.2当x10时,y1.23100.0812.38.即使用年限为10年时,该设备的维修费用约为12.38万元类型二相关性检验例2维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度xg/L 去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据甲醛浓度g/L18202224262830缩醛化度克分子26.8628.3528.7528.8729.7530.0030.361画散点图;2求回归直线方程;3求相关系数r,并进行相关性检验考点线性相关系数题点线性相关系数的概念及计算解1散点图如图2可以看出,两变量之间有近似的线性相关关系,下面用列表的方法计算a,b.ixiyix2ixiyi11826.86324483.4822028.3540056732228.75484632.542428.87576692.8852629.75676773.562830.0078484073030.36900910.80168202.9441444900.16x168724,y202.947,b7i1xiyi7xy7i1x2i7x24900.16724202.947414472420.2643,aybx202.9470.26432422.648,回归直线方程为y22.6480.2643x.37i1y2i5892,r7i1xiyi7xy7i1x2i7x27i1y2i7y24900.16724202.94741447242589 27202.94720.96.r0.96r0.050.754.有95的把握认为“甲醛浓度与缩醛化度有线性相关关系”,求得的回归直线方程有意义反思与感悟根据已知数据求得回归直线方程后,可以利用相关系数和临界值r0.05比较,进行相关性检验跟踪训练2为了研究3月下旬的平均气温x与4月20日前棉花害虫化蛹高峰日y的关系,某地区观察了xx年至xx年的情况,得到了下面的数据年份xxxxxxxxxxxxx24.429.632.930.328.9y日196110181对变量x,y进行相关性检验;2据气象预测,该地区在xx年3月下旬平均气温为27,试估计xx年4月化蛹高峰日为哪天考点线性相关系数题点线性相关系数的概念及计算解由已知条件可得下表i123456xi24.429.632.928.730.328.9yi19611018x29.13,y7.5,i16x2i5130.92,i16y2i563,i16xiyi1222.61ri16xiyi6xyi16x2i6x2i16y2i6y20.9341.查表知r0.050.811.由|r|r0.05可知,变量y和x存在线性相关关系2b1222.6629.137.55129.1322.23,aybx72.46.所以回归直线方程为y2.23x72.46.当x27时,y2.232772.4612.据此,可估计该地区xx年4月12日为化蛹高峰日.1某商品销售量y件与销售价格x元/件呈负相关,则其回归直线方程可能是A.y10x200B.y10x200C.y10x200D.y10x200考点题点答案A解析由于销售量y与销售价格x成负相关,故排除B,D.又当x10时,A中y100,而C中y300,C不符合题意,故选A.2下表是x和y之间的一组数据,则y关于x的回归直线必过x1234y1357A.点2,3B点1.5,4C点2.5,4D点2.5,5考点回归直线方程题点样本点中心的应用答案C解析回归直线必过样本点中心x,y,即2.5,43对变量y和x进行相关性检验,已知n为数据的对数,r是相关系数,且已知n3,r0.9950;n7,r0.9533;n15,r0.3012;n17,r0.4991.则变量y和x具有线性相关关系的是A和B和C和D和考点线性相关系数题点线性相关系数的应用答案C解析当n3时,r0.050.997,所以|r|r0.05,表明有95的把握认为x与y之间具有线性相关关系;当n15时,r0.050.514,所以|r|r0.05,表明有95的把握认为x与y之间具有线性相关关系,所以和满足题意,故选C.4某产品在某零售摊位的零售价x单位元与每天的销售量y 单位个的统计资料如下表所示x16171819y50344131由上表可得回归直线方程ybxa中的b5,据此模型预测当零售价为14.5元时,每天的销售量为A51个B50个C54个D48个考点线性回归分析题点回归直线方程的应用答案C解析由题意知x17.5,y39,代入回归直线方程得a126.5,126.514.5554,故选C.5已知x,y之间的一组数据如下表x0123y13571分别计算x,y,x1y1x2y2x3y3x4y4,x21x22x23x24;2已知变量x与y线性相关,求出回归直线方程考点回归直线方程题点求回归直线方程解1x012341.5,y135744,x1y1x2y2x3y3x4y40113253734,x21x22x23x240212223214.2b3441.541441.522,aybx421.51,故回归直线方程为y2x1.1对具有线性相关关系的两个变量进行统计分析,可从散点图观察大致呈条状分布,可以求回归直线方程并进行预报2通过求相关系数并和临界值r0.05比较可以判断两个变量是否有线性相关关系,求得的回归直线方程是否有意义.。
2021年高中数学3.回归分析教学案理新人教B版选修3

2021年高中数学3.2回归分析教学案理新人教B版选修2-3【教学目标】1.通过实例了解线性回归模型,感受产生随机误差的原因;2.能求出简单实际问题的线性回归方程;3.能用相关系数进行相关性检验,并解决简单的回归分析问题;【教学重点】线性回归模型的建立和线性回归系数的最佳估计值的探求方法;【教学难点】相关系数的性质及其相关性检验的基本思想、操作步骤。
一、课前预习若两个变量与之间有近似的线性相关关系,则可以用一个回归直线方程来反应这种关系,利用最小二乘法可以得到和回归系数的估计值和的计算公式:___________________=_________________________________________由此得到的直线就称为这对数据的回归直线,此直线方程即为线性回归方程.其中、分别为、的估计值,称为回归截距,称为回归系数,称为回归值。
由公式可以判定:点_________一定在回归直线上,这个点称为样本中心点。
线性回归方程中和的意义是:以为基数,每增加1个单位,相应地平均增加________个单位。
对任意给定的样本数据,由计算公式都可以求出相应的线性回归方程,但求得的线性回归方程未必有实际意义,我们可以利用________粗略地估计两个变量间是否有线性相关关系。
若散点明显不在一条直线附近,不能进行线性拟合,求得的线性回归方程是没有实际意义的;若散点基本上在一条直线附近,则可以粗略地判断为线性相关,但它们线性相关的程度又如何呢?如何较为精确地刻画线性相关关系呢? 我们需要对变量x与y的线性相关性进行检验,简称_________.4. 相关系数的计算公式对于x与y随机取到的n对数据(i=1,2,3,…,n),样本相关系数r的计算公式为:r=___________________________________________5.相关系数r的性质(1)____________________;(2)__________________________________________;(3)__________________________________________.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关.相关性检验的步骤:(1)作统计假设:___________________________________________; (2)查表:_________________________________________________; (3)计算:_________________________________________________; (4)作统计推断:___________________________________________;二、课上学习例1.研究某灌溉渠道水的流速与水深之间的关系,测得一组数据如下:预测水深为1.95 时水的流速是多少?(保留两位有效数字)参考数据:,82.15,00.148181==∑∑==iiiiyx,993.27,92.2481812==∑∑==iiiiiyxx课堂小结四、课后练习1、下列结论正确的是①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法A.①②B.①②③C.①②④D.①②③④由此她建立了身高与年龄的回归模型,她用这个模型预测儿子10岁时的身高,则下面的叙述正确的是()A.她儿子10岁时的身高一定是145.83B.她儿子10岁时的身高在145.83 以上C.她儿子10岁时的身高在145.83 左右D.她儿子10岁时的身高在145.83 以下3.两个变量相关性越强,相关系数()A.越接近于0 B.越接近于1 C.越接近于-1 D.绝对值越接近14.若散点图中所有样本点都在一条直线上,两个变量的相关系数为()A.0 B.1 C.-1 D.-1或15.两个变量有线性相关关系且正相关,则回归直线方程中,的系数()A. B. C. D.6.三点的回归直线方程为________________________.7.某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x 2 4 5 6 8y 30 40 60 50 70(1)试对x和y的关系进行相关性检验。
苏教版高中数学选修2-3§3.2 回归分析(二).docx

§3.2 回归分析(二)课时目标1.进一步理解回归分析的基本思想.2.了解一些非线性回归问题的解法.1.对相关系数r进行显著性检验的基本步骤如下:(1)提出统计假设H0:变量x,y________________________;(2)如果以95%的把握作出推断,可以根据1-0.95=0.05与n-2在附录2中查出一个r 的____________(其中1-0.95=0.05称为____________);(3)计算________________;(4)作出统计推断:若____________,则否定H0,表明有________的把握认为x与y之间具有________________;若____________,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为x与y之间有________________.2.用相关系数可以对两个变量之间的______________进行较为精确的刻画,运用________的方法研究一些非线性相关问题.一、填空题1.下列说法正确的是________.(填序号)①y=2x2+1中的x、y是具有相关关系的两个变量;②正四面体的体积与其棱长具有相关关系;③电脑的销售量与电脑的价格之间是一种确定性的关系;④传染病医院感染甲型H1N1流感的医务人员数与医院收治的甲型流感人数是具有相关关系的两个变量.2.两个变量成负相关关系时,散点图的点散布特征是________________________.3.已知x与y之间的一组数据如下表:则y 关于x 4.某种产品的广告费支出x 与销售额y 之间有下表关系,现在知道其中一个数据弄错了,则最可能错的数据是5.为此进行了10次试验,6.对有关数据的分析可知,每一立方米混凝土的水泥用量x (单位:kg)与28天后混凝土的抗压度y (单位:kg/cm 2)之间具有线性相关关系,其线性回归方程为y ^=0.30x +9.99.根据建设项目的需要,28天后混凝土的抗压度不得低于89.7 kg/cm 2,每立方米混凝土的水泥用量最少应为________kg.(精确到0.1 kg)7.根据统计资料,我国能源生产自1986年以来发展很快.下面是我国能源生产总量(单位:亿吨标准煤)的回归模型是下列四种模型中的哪一种________.(填序号)①y ^=a ^x +b ^(a ≠0);②y =ax 2+bx +c (a ≠0);③y =a x(a >0且a ≠1); ④y =log a x (a >0且a ≠1).8.下列说法中正确的是________(填序号).①回归分析就是研究两个相关事件的独立性;②回归模型都是确定性的函数;③回归模型都是线性的;④回归分析的第一步是画散点图或求相关系数;⑤回归分析就是通过分析、判断,确定相关变量之间的内在的关系的一种统计方法.二、解答题9.假设学生在初一和初二的数学成绩是线性相关的.若10名学生的初一(x )和初二(y )10.在某化学实验中,测得如下表所示的6对数据,其中x (单位:min)表示化学反应进行的时间,y ((1)设y 与0.001); (2)估计化学反应进行到10 min 时未转化物质的质量(精确到0.1).能力提升11(1)(2)如果y与x之间具有线性相关关系,求回归直线方程;(3)如果父亲的身高为73英寸,估计儿子的身高.检验每册书的成本费y与印刷册数的倒数之间是否具有线性相关关系?如有,求出yx对x的线性回归方程.1.利用回归分析可对一些实际问题作出预测.2.非线性回归方程有时并不给出回归模型,这时我们可以画出已知数据的散点图,把它与我们所学过的各种函数(幂函数、指数函数、对数函数、二次函数等)图象进行比较,挑选一种拟和比较好的函数,把问题通过变量转换,转化为线性的回归分析问题,使之得到解决.3.2 回归分析(二)答案知识梳理1.(1)不具有线性相关关系 (2)临界值r 0.05 检验水平 (3)样本相关系数r (4)|r |>r 0.05 95% 线性相关关系 |r |≤r 0.05 线性相关关系 2.线性相关程度 转化 作业设计 1.④解析 感染的医务人员数不仅受医院收治的病人数的影响,还受防护措施等其他因素的影响.2.从左上角到右下角区域内解析 散点图的主要作用是直观判断两个变量之间的相关关系.一般地说,当散点图中的点是呈“由左下角到右上角”的趋势时,则两个变量之间具有正相关关系;而当散点图中的点是呈“由左上角到右下角”的趋势时,则两个变量之间具有负相关关系.3.(1.5,4)解析 在本题中,样本点的中心为(1.5,4),所以回归直线过(1.5,4)点. 4.(6,50) 5.0.999 8解析 x =55,y =91.7,∑10i =1x 2i =38 500, ∑10i =1y 2i =87 777,∑10i =1x i y i =55 950, 所以r =∑10i =1x i y i -10·x ·y(∑10i =1x 2i -n x 2)(∑10i =1y 2i -n y 2)≈0.999 8.6.265.7 7.①8.④⑤解析 回归分析就是研究两个事件的相关性;回归模型是需要通过散点图模拟的;回归模型有线性和非线性之分.9.解 因为x =71,∑i =110x 2i =50 520,y =72.3,∑i =110x i y i =51 467,所以,b ^=51 467-10×71×72.350 520-10×712≈1.218 2. a ^=72.3-1.218 2×71=-14.192 2,线性回归方程是:y ^=1.218 2x -14.192 2.10.解 (1)在y =cd x两边取自然对数,令ln y =z ,ln c =a ,ln d =b ,则z =a +bx .由公式得a ≈3.905 5,b ≈-0.221 9,则线性回归方程为z =3.905 5-0.221 9x .而ln c =3.905 5,ln d =-0.221 9,故c ≈49.681,d ≈0.801,所以c 、d 的估计值分别为49.681,0.801.(2)当x =10时,由(1)所得公式可得y ≈5.4(mg).11.解 (1)x =66.8,y =67.01,∑10 i =1x 2i =44 794,∑10 i =1y 2i =44 941.93.x y =4 476.27,x 2=4 462.24,y 2=4 490.34,∑10i =1x i y i =44 842.4.所以r =∑10 i =1x i y i -10x y⎝⎛⎭⎫∑10 i =1x 2i -10x 2⎝⎛⎭⎫∑10 i =1y 2i -10y 2=44 842.4-10×4 476.27(44 794-44 622.4)(44 941.93-44 903.4)=79.76 611.748≈79.781.31≈0.980 2.由于r 非常接近于1,所以y 与x 之间具有线性相关关系.(2)设线性回归方程为y ^=b ^x +a ^.由b ^ =∑10 i =1x i y i -10x y ∑10 i =1x 2i -10x2=44 842.4-44 726.744 794-44 622.4=79.7171.6≈0.4645,a ^=y -b ^x =67.01-0.464 5×66.8≈35.98.故所求的线性回归方程为y ^=0.464 5x +35.98.(3)当x =73时,y ^=0.464 5×73+35.98≈69.9,所以当父亲身高为73英寸时,估计儿子的身高约为69.9英寸.12.解 把1x 置换为z ,则有z =1x,从而回归方程来拟合.z =110×(1+0.5+0.333+0.2+0.1+0.05+0.033+0.02+0.01+0.005)=0.225 1,y =110×(10.15+5.52+4.08+…+1.15)=3.14,∑10i =1z 2i =12+0.52+0.3332+…+0.012+0.0052=1.415,∑10i =1y 2i =10.152+5.522+…+1.212+1.152=171.803,∑10i =1z i y i =1×10.15+0.5×5.52+…+0.005×1.15=15.221 02, 所以b ^=∑10i =1z i y i -10z y∑10i =1z 2i -10z2≈8.976,a ^=y -b ^z =3.14-8.976×0.225 1≈1.120,所以所求的z 与y 的线性回归方程为y ^=8.976z +1.120.又因为z =1x ,所以y ^=8.976x+1.120.。
三段式学案3 :3.2回归分析(一)

回归分析(一)课前预习学案一、预习目标通过截距a 与斜率b 分别是使21(,)()niii Q y x αββα==--∑取最小值时,求,αβ的值。
二、预习内容:1. 对于一组具有线性相关关系的数据112233(,),(,),(,),,(,).n n x y x y x y x y 其回归直线方程的截距和斜率的最小二乘法估计公式:a = ,b =2.x = , y = 3.样本点的中心 三、提出问题如何使 (,)Q αβ值最小,通过观察分析式子进行试探推到 课内探究学案 一、学习目标1. 了解回归分析的基本思想和方法 , 培养学生观察分析计算的能力 二、学习重难点学习重点:回归方程y bx a =+, 学习难点:a 、b 公式的推到 三、学习过程例1.某班5名学生的数学和物理成绩如表:学生学科 A B C D E 数学成绩(x ) 88 76 73 66 63 物理成绩(y )7865716461(1)画出散点图;(2)求物理成绩y 对数学成绩x 的回归方程;(3)一名学生的数学成绩是96,试预测他的物理成绩. 例2. 某运动员训练次数与运动成绩之间的数据关系如下:次数x3033353739444650成绩y3034373942464851(1)作出散点图;(2)求出回归方程;(3)计算相关系数并进行相关性检验;(4)试预测该运动员训练47次及55次的成绩.四、当堂练习1.下列命题中正确的是于().①任何两个变量都具有相关关系②圆的周长与圆的半径具有相关关系③某商品的需求量与该商品的价格是一种非确定性关系④根据散点图求得的线性回归方程可能是没有意义的⑤两个变量的线性相关关系可以通过线性回归方程,把非确定性问题转化为确定性问题进行研究A.①③④B.②④⑤C.③④⑤D.②③⑤2.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有().A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反3.下表是x和y之间的一组数据,则y关于x的回归方程必过()x1234y1357A.点(2,3) B.点(1.5,4)C.点(2.5,4) D.点(2.5,5)4.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是________.5.某个服装店经营某种服装,在某周内纯获利y(元)与该周每天销售这种服装件数x之间的一组数据如下表:x3456789y66697381899091(1)求样本中心点.(2)画出散点图.(3)求纯获利y与每天销售件数x之间的回归方程.答案例1.【解析】 (1)散点图如图.(2)x =15×(88+76+73+66+63)=73.2.y =15×(78+65+71+64+61)=67.8.∑5i =1x i y i =88×78+76×65+73×71+66×64+63×61=25 054.∑5i =1x 2i =882+762+732+662+632=27 174. ∴b ^=∑5i =1x i y i -5x ·y ∑5i =1x 2i -5x2≈0.625.∴a ^=y -b ^ x =67.8-0.625×73.2=22.05. ∴y 对x 的回归方程是y ^=0.625x +22.05. (3)当x =96时,y ^=0.625×96+22.05≈82. 所以,可以预测他的物理成绩是82.例2. 【解析】 (1)作出该运动员训练次数x 与成绩y 之间的散点图,如下图所示,由散点图可知,它们之间具有线性相关关系.(2)列表计算:次数x i 成绩y i x 2i y 2i x i y i 30 30 900 900 900 33 34 1 089 1 156 1 122 35371 2251 3691 29537 39 1 369 1 521 1 443 39 42 1 521 1 764 1 638 44 46 1 936 2 116 2 024 46 48 2 116 2 304 2 208 50512 5002 6012 550由上表可求得x =39.25,y =40.875,∑8i =1x 2i =12 656, ∑8i =1y 2i =13 731,∑8i =1x i y i =13 180, ∴b =∑8i =1x i y i -8x y ∑8i =1x 2i -8x2≈1.041 5,a =y -b x =-0.003 88,∴线性回归方程为y =1.041 5x -0.003 88.(3)计算相关系数r =0.992 7,因此运动员的成绩和训练次数两个变量有较强的相关关系. (4)由上述分析可知,我们可用线性回归方程y =1.041 5x -0.003 88作为该运动员成绩的预报值.将x =47和x =55分别代入该方程可得y ≈49和y ≈57.故预测该运动员训练47次和55次的成绩分别为49和57. 课堂练习1.【解析】显然①是错误的,而②中圆的周长与圆的半径的关系为:C =2πR ,是 一种确定性的函数关系,故应选C.2.【解析】 因为b >0时,两变量正相关,此时r >0;b <0时,两变量负相关, 此时r <0. 【答案】 A3. 【答案】 C【解析】 回归方程必过样本点的中心(x ,y ),即(2.5,4).4.【解析】 由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得y ^-5=1.23(x -4), 即y ^=1.23x +0.08. 【答案】 y ^=1.23x +0.085.【解析】 (1)x -=6,y -≈79.86,中心点(6,79.86).(2)散点图如下:(3)因为b ^=∑i =17x i -x-y i -y-∑i =17x i -x-2≈4.75,a ^=y --b ^x -≈51.36,所以y ^=4.75x +51.36.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
张喜林制3.2 回归分析教材知识检索考点知识清单1.对于一组具有线性相关关系的数据,),,(),,(2211 y x y x),,(n n y x我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:(1)(2)其中,1,111i ni i n i y n y x n x ∑∑==== 称为样本点的中心,回归直线必然过样本点的中心,,2e a bx y ++=⋅这里a 和b 为模型的未知参数,e 是y 与+=bx yˆ a之间的误差,通常e 为随机变量,称为随机误差,它的均值,0)(=e E方差.0)(2>=σe D这样线性回归模型的完整表达式为:=i eˆ.3 i eˆ 称为相应于点),(i i y x的残差.类比样本方差估计总体方差的思想,可以用 作为2σ的估计量,其中b h aˆ*ˆ 由相应公式给出,)ˆ,ˆ(b aQ 称为残差平方和( residual sum of squares).可以用2ˆσ衡量回归方程的预报精度,通常2ˆ,σ越小,预报精度越高.4.在研究两个变量间的关系时,首先要根据 来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后,可以通过残差 来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析,要点核心解读1.变量间的相关关系及线性回归方程(1)变量间的相关关系:①变量与变量间的两种关系:a .函数关系:这是一种确定性的关系,即一个变量能被另一个变量按照某种对应法则唯一确定.例如圆的面积S 与半径r 之间的关系2r s π=为函数关系.b .相关关系:这是一种非确定性关系.即当自变量取值一定时,因变量的取值有一定的随机性,它还受一些其他因素的影响,例如人的身高不能确定体重,但一般来说“身高者,体重也重”,我们说身高与体重这两个变量具有相关关系.相关关系又包括两种:a .在两个变量中,一个变量是可控制变量,另一个变量是随机变量,如施肥量与水稻产量.b .两个变量均为随机变量,如某学生的语文成绩与化学成绩.本书主要涉及上述相关关系的前一种情况.②散点图:将两个变量的各对数据在直角坐标系中描点而得到的图形叫做散点图,它直观地描述了两个变量之间有没有相关关系.这是我们判断的一种依据,③正相关与负相关:根据变量相关性的不同,线性相关关系可分为正相关与负相关.正相关是指两个变量之间的变化趋势方向一致,即一个变量随另一个变量的增长而呈增长趋势;负相关是指两个变量变化趋势方向相反,如产品单位成本降低,利润随之增加就是负相关.(2)线性回归方程:①线性回归模型:一组数据对应点在一条直线附近,但并不在同一条直线上,也就是说,两者之间不能用线性关系准确地表示出来,为此我们将两者之间的关系表示为,⊕++=εbx a y其中a+ bx 称为确定性函数,£称为随机误差,它产生的原因主要有:a .所用的确定性函数不恰当引起的误差.b .忽略了某些因素的影响;c .观测误差.我们将方程④称为线性回归模型( linearregression model).②回归直线:一般地,设x 与y 是具有相关关系的两个变量,且对应于几组观测值的几个点),,2,1)(,(n i y x i i =大致分布在一条直线附近,我们就称这两个变量之间具有线性相关关系.显然,这样的直线可以画出许多条,其中“最贴近”这些数据点的一条叫做回归直线,③线性回归方程:根据线性回归模型,对于每一个,i x对应的随机误差),(i i i bx a y +-=ε利用最小二乘法可求出线性回归方程( equation of linear regression)为.ˆˆˆxb a y += 其中的aˆ 称为回归截距,bˆ 称为回归系数,yˆ称为回归值.求b aˆˆ- 的具体计算公式为⎪⎪⎪⎩⎪⎪⎪⎨⎧-=-=--=∑∑∑∑∑=====.ˆˆ,)()()(ˆ22112111x b y aS y x xy x x n y x y x n b x n i i n i i n i i n i i n i i i 其中x与x S分别表示数据),,2,1(n i x i =的均值和标准差,γ⋅表示数据=⋅i y i (),,2,1n的均值,xy表示数据),,2,1(n i y x i i =的均值.b aˆˆ 的意义是:以aˆ 为基数,x 每增加一个单位,y 相应地平均变化⋅bˆ卜单位.从单调性 的角度看,回归系数0ˆ0ˆ<>b b h时,回归方程表示的函数分别是增函数、减函数.2.相关性检验x 与y 之间可以用一个直线方程x b a yˆˆˆ+= 来反映其关系,而对x 与y 的具体变化规律应对x 与y 作线性相关性检验,简称相关性检验.对于变量x 与y 随机抽取到的n 对数据,(1x),,(,),,(),221n n y x y x y检验统计量是样本相关系数=r,)()())((21211y y x xy y x xi n i i n i i i n i ----∑∑∑--= 即))((212221y n y x n x y x n y x r n i i nt i i i in i ---=∑∑∑--= 这种方法是用参数r 检验线性相关的程度,这个r 称为y 与x 的样本相关系数,简称相关系统( correlation coefficient).其中.11≤≤-r若r >0,则称x 与y 正相关,即x 增加,y 随之相应地增加;若x 减少,y 随之相应地减少.若r <0,则称x 与y 负相关,即x 增加,y 随之相应地减少;若x 减少,y 随之相应地增加,若r =0,则称x 与y 不相关,即x 与y 无线性相关关系,|x |越接近于1,y 与x 的线性相关程度越高,若r=l 或-1,则x 与y 为完全线性相关.|r |越接近于0,则x 与y 线性相关程度越弱.上面公式计算相关系数r ,通常计算量较大,通过变形可将上面公式化为⋅-=yx s s y x xy r 其中y x s s ,分别表示数据=i y x i i (,),,2,1n的标准差,检验的步骤如下:(1)提出统计假设x 与y 不具有线性相关关系;(2)根据小概率0.05与n-2在附表中查出 r 的一个临界值,05.0r(3)根据样本相关系数计算公式算出r 的值;(4)作出统计推断:如果05||αr r >表明有95%的把握认为x与y 之间具有线性相关关系,如果,||05αr r ≤我们没有理由拒绝原来的假设,这时寻求回归直线方程是毫无意义的.3.回归分析对于回归分析问题,在解题时应首先利用散点图或相关性检验判断x 与y 是否具有线性相关关系,如果线性相关,才能求解后面的问题.否则求线性回归方程没有实际意义,它不能反映变量x 与y 之间的变化规律.只有在x 与y 之间具有相关关系时,求线性回归方程才有实际意义.相关性检验的依据:主要利用检验统计量yx i n i i n i i in i s s y x xy y y x xyx n y x r -=---=∑∑∑--=21211)(.)( (其中化简式容易记也好用)求出检验统计量的样本相关系数,再利用r 的性质确定x 和y 是否具有线性相关关系,r 具有的性质为:1||≤r且|r |越接近于1,线性相关程度越强;|r |越接近于0,线性相关程度越弱.4.非线性回归分析问题(1)对于非线性回归分析问题,如果给出了经验公式可直接利用换元,使新元与y 具有线性相关关系,进一步求出y 对新元的线性回归方程,换回x 即可得y 对x 的回归曲线方程.(2)非线性回归问题有时并不给出经验公式,这时按以下步骤求回归方程:①画出已知数据的散点图,看是否是线性回归分析问题,如果不是,把它与必修数学中学过的函数(幂函数、指数函数、对数函数等)图像作比较,挑选一种跟这些散点拟合得最好的函数,采用适当的变量置换,把非线性回归分析问题化为线性回归分析问题.②作相关性检验,即判断寻找线性回归方程是否有意义,③当寻找线性回归方程有意义时,计算系数,ˆ,ˆb a得到线性回归方程.④代回x 得y 对x 的回归曲线方程.5.求线性回归方程的三种方法在求具有线性相关关系的两个变量之间的回归方程时,由于所给两个变量的数据较多并且量大,致使运算量大且繁杂,常常使我们望而生“畏”,望而生“烦”,下面给出求线性回归方程的几种方法,以供参考.(1)用最小二乘法求线性回归方程:对于两个变量,在确定具有线性相关关系后,可以利用“最小二乘法”来求回归方程.用“最小二乘法”求线性回归方程的关键在于正确地利用回归方程中系数公式=--=∑∑==a xn x y x n y x b i ni i in i ˆ,ˆ2211 .ˆx by - 求出系数,ˆ,ˆb a这样回归方程也就建立起来了.为了使计算更加有条理,我们通过制作表格来先计算出212111i n i thn i ih n i i n i y x y x ∑∑∑∑====、和,1ii ni y x ∑= 再计算出,1,111i ni i n i x n x y n y ∑∑==== 然后利用公式yy n i i xx L x n x L ,212-=∑=-=-=∑∑==ni i i xy n i iy x L y n y 1212, ,y x n计算,ˆˆ,ˆx b y a r x xxL L -== 最后写出线性回归方程..ˆˆˆa x b y+= (2)用函数型计算器求线性回归方程:在求线性回归方程时,所给的数据一般较多,运算量大,我们可以借助函数型计算器来代替人工完成这种复杂的数字计算,以提高运算速度.(3)用Excel 软件作散点图并求线性回归方程.在直角坐标系中描出数据的散点图,直观判断散点图是否在一条直线附近;用线性回归方程拟合二者的关系,这一过程还可以用Excel 软件来帮助我们完成,实现上机操作, 典例分 类剖析考点1 相关关系命题规律当一个变量变化时,另一个变量的取值有一定的相关性,这种关系是相关关系.相关关系可以利用散点图和相关系数进行判定.[例1] 在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y 与腐蚀时间x 的一组数据如下表所示.(1)画出散点图.(2)根据散点图,你能得出什么结论?[解析] 利用散点图,直观地归结出相关关系的两个变量所具备的特点,【解] (1)如图3-2 -1所示散点图.(2)结论:设戈与y 是具有相关关系的两个变量,且相应于n 组观测值的n 个点大致分布在一条直线附近,其中整体上与这n 个点最接近的一条直线最能代表x 与y 之间的关系.[点拨]散点图能帮助我们发现变量之间的线性关系,直观地反映了数据的变化规律.母题迁移 1.如图3 -2-2所示的5组数据中,去掉占剩下的4组数据的线____点, 性相关系数最大.考点2求线性回归方程命题规律利用公式yx S S y x xy r -= 计算相关系数,与对应r 的一个临界值进行比较,确定x 、y 之间是否相关;运用相应公式求出线性回归方程中的函数.ˆ,ˆb a[例2]近几年来,随着我国经济的发展,汽车已进入普通百姓家中.根据某汽车协会资料统计,国产某种型号家庭轿车的使用年限x (年)和所支出的维修费用y (千元),如下表:(1)求出相关系数r ,并根据所求的r 判断两个变量之间的线性相关关系的强弱;(2)试求出回归直线方程,若某家庭购得此型号的汽车,请你为他们估计一下使用年限为10年时,维修费用是多少?、 [解析] 通过求出相关系数r ,从而判断出是否具有相关关系;再求回归方程,从而进行回归预测.[解] (1)根据公式,求得r≈0.9792 >0.878,故两个变量之间有较强的线性相关关系. ?(2)设所求的回归方程为,ˆˆˆa x b y+= 则,08.0ˆˆ,23.155ˆ225151=-==--=∑∑==x b y a xx y x y x b i i i ii 即所求的回归直线方程为.08.023.1ˆ+=x y当x=10时,代入回归直线方程得,38.12ˆ=y所以估计使用年限为10年时,维修费用是1.238万元.[点拨] 求x 与y 的回归直线方程,应首先判断x 与y 是否具有线性相关关系,如果直接求x 与y 的回归直线方程,它就没有任何实际价值,也就不能准确反映变量x 与y 之间的变化规律.母题迁移2.测得某种物质在温度x (单位:℃)下吸附另一种物质的重量y(单位:mg)的对应数据如下:(1)对变量y 与x 进行相关性检验;(2)若x 与y 具有线性相关关系,求y 对x 的回归直线方程[例3] 已知某地每单位面积菜地年平均使用氮肥量x( kg)与每单位面积蔬菜年平均产量y(t)之间的关系有如下数据:(1)求x 与y 之间的相关系数,并检验是否线性相关;(2)若线性相关,求蔬菜产量y 与使用氮肥量x 之间的回归直线方程,并估计每单位面积施肥150 kg 时,每单位面积蔬菜的年平均产量.[解析] (1)使用样本相关系数计算公式来完成.(2)先作统计假设,由小概率0.05与n-2在附表中查得相关系数临界值,05L r若05.0r r则线性相关,否则不线性相关.[解] 列出下表,并用科学计算器进行相关计算:)15)(15(15)1(215121215121151---=--⋅-=∑∑∑y y x x y x y x r i i i ii )11.101555.1628)(10115161125(11.10101158.16076⨯-⨯-⨯⨯-= 45.87915.760~ .864.0~由小概率0.05与n-2 =13在附表中查得,514.0.0=ωrx r r ∴>,||05α与y 线性相关.221511511515ˆ)2(x xyx y x b ii i ii -⋅-=∑∑== 21011516112511.10101158.16076⨯-⨯⨯-= ,37.0~ω.6463.010137.011.10ˆˆ=⨯-=-=ωx b y a.‘.回归直线方程为.6463.00937.0ˆ+=x y...当每单位面积施肥150 kg 时,每单位面积蔬菜的年平均产量为⋅=+⨯)(7.14~~7013.146463.015037.0t ω[点拨] 求解两个变量的相关系数及它们的回归直线方程的计算量较大时,需要细心、谨慎地计算.母题迁移 3:-个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:(l)y 与x 是否具有线性相关关系?(2)如果y 与x 具有线性相关关系,求回归直线方程.(3)根据求出的回归直线方程,预测加工150个零件所用的时间为多少?考点3 线性回归方程的三种解法[例4】测得某地10对父子身高(单位:英寸)如下:父亲身高(x )606264656667687067 68 707274儿子身高(y)63.665.26665.566.967.165. 5 66. 9 67. 167.468: 370.17070如果x 与y 之间具有线性相关关系,求线性回归方程,如果父亲的身高为78英寸,试估计儿子的身高.[解] 解法一:先将两个变量的有关数据在表中计算出来,如下表所示:由表中数据可计算,====101.6,8.6610668r y x=∑=1101,01.67y x i i,44794,4.448422111=∑=x i,101293.44941∑==⋅i y i代入公式=⨯-⨯⨯-28.66104479401.678.66104.44842 ≈6.17172.79 .646.04所以4646.001.67ˆˆ-=-=x b y a.975.358.66≈⨯因而所求得线性回归方程为:.975.354646.0ˆ+=x y当78=x时,=yˆ 975.35784646.0+⨯.2.722138.72≈=所以当父亲的身高为78英寸时,估计儿子的身高约为72.2英寸.解法二:用计算器求这个线性回归方程:(计算参数)a得35.977,(计算参数)ˆb得0.4646.所以所求线性回归方程为:.977.354646.0ˆ+=x y当78=x时,⨯=4646.0ˆy.2.722158.72977.3578≈=+所以当父亲的身高为78英寸时,估计儿子的身高约为72.2英寸,解法三:运用计算机中的Excel 软件:(1)输入数据x ,y:x6062646566672.665.6368707274y9.566.66654.167.67)2.(170.370.68选择数据,生成散点图:在菜单中选定“插入”中的“图表”,选择“xy 散点图”,连续点击“下一步”,可得到如图3 -2 -3所示的散点图.(3)建立回归直线:选中“图表”中的“添加趋势线”,点击“类型”标签,选定“趋势预测/回归分析类型”中的“线性”选项,单击“确定”,得到回归直线.(4)求得回归直线方程:双击回归直线,弹出“趋势线格式”,单击“选项”,选定“显示公式”,最后单击“确定”就得到回归直线方程,如图3 -2 -4所示.所求回归直线方程为:;977.354646.0ˆ+=x y当x=78时,977.35784646.0ˆ+⨯=y,2.722158.72≈=所以当父亲的身高为78英寸时,估计儿子的身高约为72.2英寸.[点拨] (1)“最小二乘法”是求线性回归方程常用的方法,在线性回归方程b a lr a x b yˆ,ˆ,ˆˆˆ+= 是线性回归方程中的系数,其中bˆ 是线性回归的斜率,表示自变量变化1个单位时因变量的平均变化值,在数值计算的过程中可以用计算器来帮助完成复杂的计算.(2)用函数型计算器求线性回归方程,避免了繁琐的计算,节省了时闽,因而大大地提高了解题的速度.(3)在运用计算机中的Excel 软件求线性回归方程时,只要严格按照运算程序一步步进行下去,最终总能求出回归直线方程并且得到如上图的图像,总之,求线性回归方程的方法是较多的,既有最常用的“最小二乘法”,又有简便易行的计算器法,还有用计算机软件来完成的方法,这些方法在以后的学习中同学们要逐步体会,考点4非线性回归的转化命题规律借助指数、幂、对数函数,将变量间的变换转化为回归问题.[例5] 在一化学反应过程中某化学物质的反应速度yg /min 与一种催化剂的量xg 有关,现收集了8组数据列于表中,试建立y 与x 之间的回归方程.[解析] 两个变量不一定是线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法将非线性关系转化为线性回归模型.[解】根据收集的数据作散点图:图3 -2 -5根据样本点分布情况,可选用两种曲线模型来拟合.(1)可认为样本点集中在某二次曲线221c x c y +=的附近,令,2x t =则变换后样本,点 应该分布在直线==+=a c b a bt y ,(1)2c的周围,由题意得变换后的t 与y 的样本数据表如下:作y 与 t 的散点图,由y 与t 的散点图可观察到样本数据点并不分布在一条直线的周围,因此不宜用线性回归方程a tb yˆˆˆ+=来拟合,即不宜用二次曲线221c x c y +=来拟合y 与x 之间的关系.(2)根据x 与 y 的散点图也可以认为样本点集中在某一条指数型函数曲线.1c e c y =的周围,今,ln y z =则,ln 12c x c z +=即变换后样本点应该分布在直线),ln (21c b c a a bx z ==+=的周围,由y 与x 数据表可得z 与x 的数据表作出z 与x 的散点图.由散点图可观察到大致在一条直线上,所以可用线性回归方程来拟合它,由z 与x 的数据表,得到线性回归方程,,8485.01812.0ˆ-=x z所以非线性回归方程为,ˆ8485.01812.0-=x e y因此,该化学物质反应速度关于催化剂的量的非线性回归方程为8485.01812.0ˆ-=x e y[点拨] 非线性回归问题有时并不给出经验公式,这时我们可以画出已知数据的散点图,把它与学过的各种函数图像作比较,挑选一种跟这些散点拟舍得最好的函数,然后像本例这样,采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决,母题迁移4.某种图书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:检测每册书的成本费y与印刷册数的倒数1x之间是否具有线性相关关系?如有,求出y对x的回归方程.优化分层测训学业水平测试1.下列变量之间的关系是函数关系的是( ).A .已知二次函数,2c bx ax y ++=其中a ,c 是已知常数,取b为自变量,因变量是这个函数的判别式ac b 42-=∆B .光照时间和果树亩产量C .降雪量和交通事故发生的数量D .每亩施用肥料量和粮食产量2.对于线性相关系数r ,下列叙述正确的是( ).||),,0(||.r r A +∞∈越大,相关程度越大,反之,相关程度越小r r B ),,(||.+∞-∞∈越大,相关程度越大,反之,相关程度越小,1||.≤r C且lrl 越接近于1,相关程度越大;|r |越接近于0,相关程度越小D .以上说法都不对3.工人月工资y (元)按劳动生产率x (千元)变化的回归方程为,8050ˆx y+= 下列判断正确的是( ).①劳动生产率为1000元时,则月工资为130元;②劳动生产率提高1000元时,则月工资提高80元;③劳动生产率提高1000元时,则月工资提高130元;④当月工资为210元时,劳动生产率为2000元.A .① B.② C.③. D .④4.为了考查两个变量x 和y 之间的线性关系,甲、乙两位同学各自独立做了10次和15次试验,并利用线性回归方法,求得回回归直线分别为,21l l N已知两人获得的试验数据中,变量x 和y的数据的平均值都相等,且分别都是s 、t ,那么下列说法正确的是( ).A .直线21*nl l一定有公共点(s ,t)B .直线21*l l ∏相交,但交点不一定是(s ,t)C .直线21*nl l可能没有交点21.kJl l D必定重合5.在一次实验中,测得(x ,y)的四组值分别是A(l ,2),B(2,3),),5,4(),4,3(D C则y 与x 之间的回归直线方程为( ).1ˆ.+=x yA 2ˆ+=⋅x yB 12ˆ+=⋅x yC 1ˆ.-=x yD 6.弹簧长度),( cm)随所挂物体质量x(g)不同而变化的情况如下:(1)画出散点图;(2)求y 对x 的回归直线方程;(3)预测所挂物体的质量为27 g 时的弹簧长度(精确到0.01 cm).7.随着人们经济收入的不断增长,购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增加,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司为此进行了一次抽样调查,并统计得出某款车的使用年限x 与所支出的总费用y (万元)有如下的数据资料:若由资料知,y 对x 呈线性相关关系,试求:(1)线性回归方程a xb yˆˆˆ+= 的回归系数,ˆˆb a、 (2)估计使用年限为10年时,车的使用总费用是多少?嵩考能力测试(测试时间:90分钟测试满分:120分)一、选择题(本大题共7小题,每小题5分.共35分)1.下面两个变量间的关系不是函数关系的是( ).A .正方形的棱长与体积B .角的度数与它的正弦值C .单产为常数时,土地面积与粮食总产量D .日照 时间与水稻亩产量2.(2011年江西高考题)变量x 与y 相对应的一组数据为,10();5,13(),4,5.12(),3,8.11(),2,3.11(),1变量u 与v 相对应的一组数据为),2,5.12(),3,8.11(),4,3.11(),5,10(1),1,13(r表示变量y 与x 之间的线性相关系数,2r表示变量v 与u 之间的线性相关系数,则().0.12<<r r A120.r r B <<120.r r C <<12.r r D =3.为了表示n 个点与相应直线在整体上的接近程度,我们常用( ).)ˆ(.1i i ni y y A -∑=表示)ˆ(.1i i ni y y B -∑=表示21)ˆ(.i i ni y y C -∑=表示21)(.y y D i ni -∑=表示4.设一个回归方程为,53ˆx y -=变量x 增加一个单位时( ).A .y 平均增加3个单位 B.y 平均减少5个单位C.y 平均增加5个单位 D.y 平均减少3个单位5.线性回归方程a xb yˆˆˆ+= 必过( ).)0,0.(A)0,.(x B),0(y C ⋅),.(y x D6.已知两个变量x 和y 之间具有线性相关关系,5次试验的观测数据如下:经计算得回归方程a bx y+=ˆ 的系数,575.0=b则a=9.14.-A9.13.-B9.12.-C9.14.D7.判断图3 -2 -8中的两个变量,具有相关关系的是( ).二、填空题(本大题共3小题,每小题5分,共15分)8.(2011年广东高考题)某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm ,170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为____ cm.9.-唱片公司欲知出歌费用x (十万元)与唱片销售量y (千张)之间的关系,从其所发行的唱片中随机抽选了10张,得到如下的资料:,4.303,282101101==∑∑≡=i i ti x x γ ,5.598,75211011101==∑∑≈y yx i i ,237101=∑≈i ti y x则y 与x 的相关系数r 的绝对值为10.某五星级大饭店的入住率x(%)与每天每间客房的成本,,(元)如下:则y 关于x 的回归直线方程是____三、解答题(70分)11.(10分)设有资料如下表所示:两位评酒员对10种品牌白酒的主观排序及白酒种类试问两位评酒员的评审顺序是否具有一定的线性相关关系?(按5%的显著水平检验)12.(12分)用镁合金X 光探伤时,要考虑透视电压U 与透视厚度l 的关系,做了5次独立试验结果如下:(1)画出散点图;(2)进行相关性检验;(3)求U 关于l 的线性回归方程,并预测当透视厚度l 为40 mm 时,透视电压U 是多少千伏.13.(12分)下表提供了某厂节能降耗技术改造后生产甲产品过’程中记录的产量x(t)与相应的生产能耗y (吨标准煤)的几组数据:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出Y 关于x 的线性回归方程;ˆˆˆa x b y+= (3)已知该厂技改前100t 甲产品的生产能耗为90t 标准煤.试根据(2)求出的线性回归方程,预测生产100t 甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4 x3 +5 x4+6 x4.5 =66.5)14.(12分)每立方米混凝土的水泥用量x (单位:kg )与28天后混凝土的抗压强度(单位:)/2cm kg之间的关系有如下数据:(1)对变量y 与x 进行相关性检验;(2)如果y 与x 之间具有线性相关关系,求回归直线方程.15.(12分)下表为收集到的一组数据:(1)作出x 与y 的散点图,并猜测x 与y 之间的关系;(2)建立x 与y 的关系,预报回归模型并计算残差;(3)利用所得模型,预报x=40时y 的值.16.(12分)已知10只狗的血球体积及红血球数的测量值如下表:(1)画出上表的散点图;(2)求出回归直线方程.单元知识整合2.本章注意问题在本章的学习中我们必须注意以下几个问题:(1)函数关系是一种确定关系,而相关关系是一种非确定关系,函数关系有具体的函数关系式,而相关关系没有一个确定的关系式,用回归直线来估计相应的量的关系,但这种关系也不是确切的,存在着一定的误差.(2)利用散点图来确定两个变量之间是否具有线性相关关系时,作图要规范,如果样本点呈条形分布,我们就认为具有线性相关关系,如果有个别的样本点出现异常,而绝大多数的样本点在这个条形区域内,我们可以不考虑这个别的点,或认为这几个出现异常的点对我们的结论影响不大.但如果出现异常的点过多就认为不具有线性相关关系.(3)样本相关系数的计算公式为,)()())((21211y y x xy y x x r i n i i n i i i n i ----=∑∑∑=-= 可以用来衡量两个变量之间的线性相关关系,当r >0时,表示两个变量正相关;当r<0时,表示两个变量负相关.在实际判断中用…进行衡量,如果|r |越接近于1,表明两个变量之间的线性相关性越强,|r |越接近于0,表明两个变量之间几乎不存在线性相关关系;通常当|r |大于0.75时,就认为两个变量之间有很强的线性相关关系,就可以求回归直线方程,并且在r >0时,回归系数bˆ 为正,在r<0时,bˆ 为负.(4)回归直线方程a xb yˆˆˆ+= 过样本点中心).,(y x(5)在线性回归模型中,随机误差用y ∧预报真实值_y 的误差.它是一个不可预测的变量,但可以通过这个随机变量的数字特征来刻画它的一些总体特征,均值是反映随机变量取值平均水平的数字特征,方差是反映随机变量集中于均值程度的数字特征,而随机误差的均值为O ,因此可以用方差来衡量随机误差的大小.(6)在研究两个变量之间的关系时,可以先根据散点图来粗略地判断它们是否存在线性相关关系,是否可以用线性回归模型来拟合两个变量的关系,如果可以用线性回归模型来拟合时,再求出面归直线方程,.最后再作残差分析来判断拟合的效果,并判断原始数据中是否存在可疑数据.(7)在判断两个分类变量的可信程度时要特别注意计算的准确度,准确代数,准确计算,准确比较,准确下结论.(8)在实际问题中,经常会面临需要推断的问题,在对问题进行推断时,我们不能仅凭主观意愿作出结论,还需要通过收集数据,并根据独立性检验的基本原理作出合理的推断.(9)统计方法是可能犯错误的,不管是回归分析还是独立性检验,得到的结论都可能犯错误,好的统计方法就是要尽量降低犯错误的概率,比如在推断吸烟与患肺癌是否有关时,通过收集数据、整理分析数据得到“吸烟与患肺癌有关”的结论,而且这个结论出错的概率在0.01以下,实际上这是统计思维与确定性思维差异的反应.结合本章的学习,谈谈你对统计思维和确定性思维差异的理解.3.热点透视(1)独立性检验思想在日常生活中的应用.(2)了解线性回归思想,会求线性回归方程及进行相关性检验,掌握回归分析在生活中的应用.4.思想方法总结类型1 独立性检验思想在生活中的应用 ‘由题意列出事件A 与B 的2×2列联表,据公式计算出,2x若,706.22>x则有90%的把握认为事件A 与B 有关,若>2x,635.6则有99%的把握认为事件A 与B 有关;若,828.102>x则有99.9%的把握认为事件A 与B 有关,若,706.22≤x。