人教A版 选修1-2 1.1 回归分析的基本思想及其初步应用 教案
人教A版 选修1-2 1.1 回归分析的基本思想及其初步应用(一) 教案

[核心必知]1.预习教材,问题导入根据以下提纲,预习教材P2~P8的内容,回答下列问题.(1)在数学《必修3》中,我们利用回归分析的方法对两个具有线性相关关系的变量进行了研究,其步骤是什么?所求出的线性回归方程是什么?提示:步骤为:画出两个变量的散点图,求回归直线方程,并用回归直线方程进行预报.线性回归方程为^y=^b x+^a.(2)所有的两个相关变量都可以求回归方程吗?提示:不一定.2.归纳总结,核心必记(1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(2)回归直线方程方程^y=^b x+^a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(x n,y n)的回归方程,其中^a,^b是待定参数,其最小二乘估计分别为:,x其中-x=n1x n i,-y=n1y n i,(-x,-y)称为样本点的中心.(3)线性回归模型线性回归模型用y=bx+a+e来表示,其中a和b为模型的未知参数,e称为随机误差.(4)刻画回归效果的方式(1)通过教材P2中的例1计算出的回归方程^y=0.849x-85.712可以预报身高为172 cm的女大学生的体重为60.316 kg.请问,身高为172 cm的女大学生的体重一定是60.316 kg吗?为什么?提示:不一定.从散点图可以看出,样本点散布在一条直线的附近,而不是在一条直线上,所以不能用一次函数y=bx+a表示.(2)下列说法正确的有哪些?①在线性回归模型中,e是bx+a预报真实值y的随机误差,它是一个可观测的量;②残差平方和越小的模型,拟合的效果越好;③用R2来刻画回归效果,R2越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.提示:e是一个不可观测的量,故①不正确;R2越小,残差平方和越大,即模型的拟合效果越差,故③不正确;②④是正确的.[课前反思](1)回归分析的定义是什么?如何求回归直线方程?(2)线性回归模型是什么?(3)残差、残差图的定义是什么?如何作残差图?(4)残差平方和和相关指数R2的定义是什么?它们与回归效果有什么关系?[思考] 求线性回归方程的步骤是什么?名师指津:(1)列表表示x i,y i,x i y i,x i2;(2)计算,,x n i2,x n i y i;(3)代入公式计算^a,^b的值;(4)写出线性回归方程.讲一讲1.(链接教材P2-例1)某种产品的广告费用支出x与销售额y(单位:百万元)之间有如下的对应数据:x/百万元24568y/百万元3040605070(1)(2)求线性回归方程;(3)试预测广告费用支出为10百万元时的销售额. [尝试解答] (1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算:所以,=525=5,=5=50,x i =145, x 5i y i =1 380. 于是可得^b=22=145-5×521 380-5×5×50=6.5,^a=-y-^b-x=50-6.5×5=17.5.所以所求的线性回归方程为^y=6.5x +17.5.(3)根据(2)中求得的线性回归方程,当广告费用支出为10百万元时, ^y=6.5×10+17.5=82.5(百万元),即广告费用支出为10百万元时,销售额大约为82.5百万元.(1)求线性回归方程前必须判断两个变量是否线性相关,如果两个变量本身不具备相关关系,或者它们之间的相关关系不显著,那么即使求出回归方程也是毫无意义的.(2)写出回归直线方程^y=^bx +^a,并用回归直线方程进行预测说明:当x 取x 0时,由线性回归方程可得^y0的值,从而可进行相应的判断.练一练1.某班5名学生的数学和物理成绩如下表:学生A B C D E学科成绩数学成绩(x)8876736663物理成绩(y)7865716461(1)(2)求物理成绩y对数学成绩x的回归直线方程;(3)一名学生的数学成绩是96,试预测他的物理成绩.解:(1)如图所示.(2)因为=51×(88+76+73+66+63)=73.2,=51×(78+65+71+64+61)=67.8,x5i y i=88×78+76×65+73×71+66×64+63×61=25 054,x5i2=882+762+732+662+632=27 174.25 054-5×73.2×67.8所以^b=22=27 174-5×73.22≈0.625,^a=-^b-x≈67.8-0.625×73.2=22.05.故y对x的回归直线方程是^y=0.625x+22.05.(3)x=96,则^y=0.625×96+22.05≈82,即可以预测他的物理成绩是82.[思考] 如何用残差图、残差平方和、相关指数R2分析拟合效果?名师指津:残差图的带状区域的宽度越窄,模型拟合精度越高;残差平方和越小,模型拟合效果越好;R2越接近于1,模型拟合效果越好.讲一讲2.假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:x 15.025.830.036.644.4y 39.442.942.943.149.2(1)以x(2)求y与x之间的回归方程,对于基本苗数56.7预报有效穗;(3)计算各组残差,并计算残差平方和;(4)求R2,并说明残差变量对有效穗的影响占百分之几?[尝试解答] (1)散点图如下.(2)由(1)中散点图看出,样本点大致分布在一条直线的附近,有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.设回归方程为^y=^b x+^a.=30.36,=43.5,x5i2=5 101.56,y5i2=9 511.43.-x-y=1 320.66,2=921.729 6,x5i y i=6 746.76.则^b=22≈0.29,^a=-^b≈34.70.故所求的回归直线方程为^y=0.29x+34.70.当x =56.7时,^y=0.29×56.7+34.70=51.143. 估计成熟期有效穗为51.143.(3)由于^yi =^bx i +^a,可以算得^ei =y i -^yi 分别为^e1=0.35,^e2=0.718,^e3=-0.5,^e4=-2.214,^e5=1.624,残差平方和: 5^e i 2≈8.43.(4) 5(y i -)2=50.18, 故R 2=1-50.188.43≈0.832.所以解释变量小麦基本苗数对总效应约贡献了83.2%,残差变量贡献了约1-83.2%=16.8%.(1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差^e1,^e2,…,^en 来判断模型拟合的效果.(2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合度越高,回归方程预报精确度越高.练一练2.某运动员训练次数与运动成绩之间的数据关系如下:次数(x ) 30 33 35 37 39 44 46 50 成绩(y )3034373942464851(1)作出散点图; (2)求出线性回归方程;(3)作出残差图,并说明模型的拟合效果; (4)计算R 2,并说明其含义.解:(1)作出该运动员训练次数x 与成绩y 之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.(2)∵=39.25,=40.875,x8i2=12 656,y8i2=13 731,x8i y i=13 180,∴^b=8=22≈1.041 5,^a=-^b≈-0.003 875,∴线性回归方程为^y=1.041 5x-0.003 875.(3)残差分析计算得^e1≈-1.24,^e2≈-0.366,^e3≈0.551,^e4≈0.468,^e5≈1.385,^e6≈0.178,^e7≈0.095,^e8≈-1.071.作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.(4)计算相关指数R2计算相关指数R2≈0.985 5,说明了该运动员成绩的差异有98.55%是由训练次数引起的.讲一讲3.(链接教材P6-例2)某地区六年来轻工业产品利润总额y与年次x的试验数据如下表所示:a,b均为正数,求y关于x的回归方程.[思路点拨] 解答此题可根据散点图选择恰当的拟合函数,而本题已经给出,只需将其转化为线性函数,利用最小二乘法求得回归直线方程,再将其还原为非线性回归方程即可.[尝试解答] 对y=ab x e0两边取自然对数,得ln y=ln ae0+x ln b,令z=ln y,则z与x的数据如下表:由z=ln 0ln b≈0.047 7,ln ae0=2.378,即^z=2.378+0.047 7x,故^y=10.8×1.05x.非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:练一练3.某电容器充电后,电压达到100 V,然后开始放电,由经验知道,此后电压U 随时间t变化的规律用公式U=A e bt(b<0)表示,现测得时间t(s)时的电压U(V)如下表:t/s012345678910U/V10075554030201510105 5线性回归分析问题).解:对U=A e bt两边取对数得ln U=ln A+bt,令y=ln U,a=ln A,x=t,则y=a+bx,y与x的数据如下表:x 012345678910y 4.6 4.3 4.0 3.7 3.4 3.0 2.7 2.3 2.3 1.6 1.6如图所示,从图中可以看出,y与x具有较好的线性相关关系,由表中数据求得=5,≈3.045,由公式计算得^b≈-0.313,^a=-^b-x=4.61,所以y对x的线性回归方程为^y=-0.313x+4.61.所以ln ^U=-0.313t+4.61,即^U=e-0.313t+4.61=e-0.313t·e4.61,因此电压U对时间t的回归方程为^U=e-0.313t·e4.61.————————————[课堂归纳·感悟提升]————————1.本节课的重点是线性回归方程的求法及线性回归分析,难点是残差分析和非线性回归分析问题.2.本节课要重点掌握的规律方法(1)线性回归分析,见讲1;(2)残差分析,见讲2;(3)非线性回归分析,见讲3.。
2018-2019学年人教A版 选修1-2 回归分析的基本思想及其初步应用(一) 教案

一、复习准备:
1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?
2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据作散点图求回归直线方程利用方程进行预报.
二、讲授新课:
1. 教学例题:
①例1从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:
1 2 3 4 5 6 7 8
编
号
165 165 157 170 175 165 155 170 身高
/cm
体重 48 57 50 54 64 61 43 59
/kg
求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重.
(分析思路教师演示学生整理)
第一步:作散点图
第二步:求回归方程
第三步:代值计算
②提问:身高为172cm的女大学生的体重一定是60.316kg吗?
不一定,但一般可以认为她的体重在60.316kg左右.
③解释线性回归模型与一次函数的不同
一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.
2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.
3、小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.
板
书
教学
反思。
高中数学《回归分析的基本思想及其初步应用》教案2 新人教A版选修1-2

回归分析的基本思想及其初步应用(第三课时)(第四课时)一、目标:1、使学生会根据观测数据的特点来选择回归模型2、使学生通过探究体会到有些非线性模型通过变换可以转化为线性回归模型。
3、初步体会不同模型拟合数据的效果。
二、教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。
三、教学基本流程:回忆建立模型的基本步骤①例2 问题背景分析画散点图。
②观察散点图,分析解释变量与预报变量更可能是什么函数关系。
③学生讨论后建立自己的模型④引导学生探究如果不是线性回归模型如何估计参数。
能否利用回归模型通过探究体会有些不是线性的模型通过变换可以转化为线性模型⑤对数据进行变换后,对数据(新)建立线性模型⑥转化为原来的变量模型,并通过计算相关指数比较几个不同模型的拟合效果⑦总结建模的思想。
鼓励学生大胆创新。
⑧布置课后作业:习题1.1 1、附例2的解答过程:解:依题意,把温度作为解释变量x ,产卵个数y作为预报变量 , 作散点图,由观察知两个变量不呈线性相关关系。
但样本点分布在某一条指数函数 y=c1e c2 x周围.令 z=lny , a=lnc1 , b=c2则 z=bx+a此时可用线性回归来拟合 z=0.272x-3.843因此红铃虫的产卵数对温度的非线性回归方程为Y=e0.272x-3.8431、1回归分析的基本思想及其初步应用(习题课)(第五课时)目标:通过习题巩固所学知识过程:1、复习有关知识2、典型例题:例1:某班5名学生的数学和化学成绩如下表所示,对x与y进行回归分析,并预报某学生数学成绩为75分时,他的化学成绩。
A B C D E数学x 88 76 73 66 63 化学y 78 65 71 64 61解略。
例2:某医院用光电比色计检验尿汞时,得尿汞含量 (mg/l) 与消光系数的结果如下:(1)求回归方程。
17学年高中数学专题1.1回归分析的基本思想及其初步应用(第2课时)教案新人教A版选修1-2

17学年高中数学专题1.1回归分析的基本思想及其初步应用(第2课时)教案新人教A版选修1-2D残差平方和、回归平方和;了解偏差平方和分解的思想;了解判断刻画模型拟合效果的方法——相关指数和残差分析;了解非线性模型通过变换转化为线性回归模型。
(2)过程与方法:本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线方程,从中也找出存在的不足,从而有进行回归分析的必要性,进而学习相关指数,用相关指数来刻画回归的效果。
(3)情感态度与价值观:从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求知欲,培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进取。
【教学重点】:1、了解判断刻画模型拟合效果的方法——相关指数和残差分析;2、通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型。
【教学难点】:1、解释残差变量的含义;2、了解偏差平方和分解的思想。
【课前准备】:课件【教学过程设计】:线上相应的位置的差异()i iyyˆ-是随机误差的效应,称i i iyy eˆˆ-=为残差,()∑=-ni i iyy12ˆ为残差平方和;学生动手计算出例1中的残差(如下表)与残差平方和。
编号 1 2 3 4 5 6 7 8 身高/cm165 165 157 170 175 165 155 170 体重/kg48 57 50 54 64 61 43 59y i 54.373 54.373 47.581 58.618 62.863 54.373 45.883 58.618 e i -6.373 2.627 2.419 -4.618 1.137 6.627 -2.883 0.382 ()361.128ˆ12=-∑=ni iiy y 发,抽象为数学问题中的线性回归问题,从而指导实际问题的解决。
⑶回归平方和:解释变量和随机误差的总效应(总偏差平方和),即总的偏差平方和=回归平方和+残差平方和,所以回归平方和=总的偏差平方和-残差平方和学生动手计算出例1中的回归平方和。
人教版高中数学选修(1-2)-1.1《回归分析基本思想及其初步应用(第2课时)》教学设计

1.1.1 回归分析基本思想及其初步应用第二课时(谷杨华)一、教学目标 1.核心素养:通过学习回归分析的基本思想及其初步应用,初步形成基本的数据分析能力. 2.学习目标(1)1.1.2.1 理解相关系数概念(2)1.1.2.2 判断刻画模型拟合效果的方法—相关指数和残差分析 (3)1.1.2.3 能用回归分析的方法对简单的案例进行分析. 3.学习重点判断刻画模型拟合效果的方法—相关系数、相关指数和残差分析 4.学习难点判断刻画模型拟合效果的方法—相关系数、相关指数和残差分析 二、教学设计 (一)课前设计 1.预习任务 任务1阅读教材P 4-P 6,思考在回归分析中,分析残差能够帮助我们解决那些问题?任务2刻画模型拟合效果的方法有哪些?2.预习自测1.下列说法正确的是 ( )A.在统计学中,回归分析是检验两个分类变量是否有关系的一种统计方法B.线性回归方程对应的直线a x b yˆˆˆ+=至少经过其样本数据点1122(,),(,),,(,)n n x y x y x y L 中的一个点C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D.在回归分析中,相关指数2R 为98.0的模型比相关指数2R 为80.0的模型拟合的效果差 【知识点:回归分析】解:C A.回归分析反映两个变量相关关系的数学方法,由建立回归方程来预报变量的情况.错误;B.线性回归方程对应的直线a x b yˆˆˆ+=,过其样本数据平均数点,错误;D.相关指数2R 越大,则相关性越强,模型的拟合效果越好. 错误;C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高. 正确.2.两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下,其中拟合效果最好的模型是( ) A.模型1的相关指数2R 为0.99 B.模型2的相关指数2R 为0.88 C.模型3的相关指数2R 为0.50 D.模型4的相关指数2R 为0.20 【知识点:回归分析】解:A 由相关指数的意义知,2R 越大说明相关性越强,故选A. (二)课堂设计 1.知识回顾⑴对于一组具有线性相关关系的数据1122(,),(,),,(,)n n x y x y x y L ,1211,n n i i x x x x x n n =+++==∑L 121y y y 1y y ,nn i i n n=+++==∑L 则称点),y x (为样本点的中心. (2)线性回归方程:∧∧∧+=a x b y ,其中.1122211()()()n niii ii i nniii i x x y y x y nx yb x x xnx∧====---==--∑∑∑∑,a ∧=x b ∧-y(3)线性回归模型:y =bx +a +e 其中a 和b 为模型的未知参数,e 称为随机误差. 2.问题探究问题探究一 什么是相关系数?相关系数可以用来解释什么?●活动一 理论研究,概念学习—相关系数我们知道,两个变量x 和y 正(负)相关时,它们就有相同(反)的变化趋势,因此可以用回归直线来描述这种关系.与此相关的一个问题:如何描述x 和y 之间种线性关系的强弱?在统计中用相关系数r 来衡量两个变量之间线性关系的强弱.若相应于变量x 的取值i x ,变量y 的观测值为i y (n i ≤≤1),则两个变量的相关系数r 的计算公式为∑∑∑===----=ni ni iini iiy yx x y yx x r 11221)()())((对于相关系数r ,当为正时,表明变量x 和y 正相关,当r 为负时,表明变量x 和y 负相关. 统计学认为,对于变量x,y ,如果[]75.0,1--∈r ,那么负相关很强;如果[]1,75.0∈r ,那么正。
新人教A版(选修1-2)1.1《回归分析的基本思想及其初步应用》word教案

1.1回归分析的基本思想及其初步应用(一)教学任务分析:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法——相关系数.教学难点:解释随机误差的含义及相关系数大小对两个变量相关关系的影响.教学过程: 一.引入问:身高和体重有什么样的关系?吸烟与患肺癌有关系吗?答:函数关系是一种确定性关系,而相关关系是一种非确定性关系。
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:(1)收集数据;(2)作散点图;(3)求回归直线方程;(4)利用方程进行预报 二.例题与练习求根据女大学生的身高预报体重的回归方程,并预报一名身高为172 cm 的女大 学生的体重.练习:学案p2-P6:的最好估计,计算公式和就是未知参数和b a b a ∧∧∑∑==∧---=ni i ni i ix x y y x xb 121)())((∑∑==--=n i i ni ii xn x yx n yx 1221x b y a ∧∧-=:样本相关系数计算公式∑∑∑===----=n i ni i i ni i iy y x x y y x xr 11221)()())((∑∑∑===---=n i ni i i ni ii y n y x n x yx n yx 112221)()(:回归相关指数计算公式∑∑==∧---=n i ini i iy yy yR 12122)()(1作业:习案1、2.。
人教A版高中数学选修1-2《一章 统计案例 1.1 回归分析的基本思想及其初步应用》优质课教案_11

回归分析的基本思想及其初步应用预习课本P2~8,思考并完成以下问题 1.什么是回归分析?2.什么是线性回归模型?3.求线性回归方程的步骤是什么?[新知初探]1.回归分析 (1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. (2)回归方程的相关计算对于两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ).设其回归直线方程为y ^=b ^x +a ^,其中a ^,b ^是待定参数,由最小二乘法得b ^=∑i =1n (x i -x )(y i -y )∑i =1n(x i -x )2=∑i =1nx i y i -nx y∑i =1nx 2i -n x2,a ^=y -b ^x . (3)线性回归模型线性回归模型⎩⎨⎧y =bx +a +e ,E (e )=0,D (e )=σ2,其中a ,b 为模型的未知参数,通常e为随机变量,称为随机误差.x 称为解释变量,y 称为预报变量.[点睛] 对线性回归模型的三点说明(1)非确定性关系:线性回归模型y =bx +a +e 与确定性函数y =a +bx 相比,它表示y 与x 之间是统计相关关系(非确定性关系),其中的随机误差e 提供了选择模型的准则以及在模型合理的情况下探求最佳估计值a ,b 的工具.(2)线性回归方程y ^=b ^x +a ^中a ^,b ^的意义是:以a ^为基数,x 每增加1个单位,y 相应地平均增加b ^个单位.2.线性回归分析(1)残差:对于样本点(x i ,y i )(i =1,2,…,n )的随机误差的估计值 e ^i =y i -y ^i 称为相应于点(x i ,y i )的残差,∑i =1n(y i -y ^i )2称为残差平方和.(2)残差图:利用图形来分析残差特性,作图时纵坐标为残差, 横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.(3)R 2=1-∑i =1n(y i -y ^i )2∑i =1n (y i -y )2越接近1,表示回归的效果越好.[小试身手]1.判断下列命题是否正确.(正确的打“√”,错误的打“×”) (1)残差平方和越小, 线性回归方程的拟合效果越好.( )(2)在画两个变量的散点图时, 预报变量在x 轴上,解释变量在y 轴上.( ) (3)R 2越小, 线性回归方程的拟合效果越好.( ) 答案:(1)√ (2)× (3)×2.从散点图上看,点散布在从左下角到右上角的区域内, 两个变量的这种相关关系称为________.答案:正相关3.在残差分析中, 残差图的纵坐标为________. 答案:残差4.如果发现散点图中所有的样本点都在一条直线上, 则残差平方和等于________, 解释变量和预报变量之间的相关系数等于________.答案:0 1或-1[典例] 表数据(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程 y ^=b ^x +a ^;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力. [解] (1)散点图如图:(2)∑i =1nx i y i =6×2+8×3+10×5+12×6=158,x =6+8+10+124=9,y =2+3+5+64=4,∑i =1nx 2i =62+82+102+122=344.b ^=158-4×9×4344-4×92=1420=0.7,a ^=y -b ^x =4-0.7×9=-2.3, 故线性回归方程为y ^=0.7x -2.3.(3)由(2)中线性回归方程知,当x =9时,y ^=0.7×9-2.3=4,故预测记忆力为9的同学的判断力约为4.求线性回归方程的三个步骤(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系.(2)求回归系数:若存在线性相关关系,则求回归系数.(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明.[活学活用]某工厂1~8月份某种产品的产量与成本的统计数据见下表:月份12345678产量(吨)5.66.06.16.47.07.58.08.2成本(万元)130136143149157172183188(1)画出散点图;(2)y与x是否具有线性相关关系?若有,求出其回归方程.解:(1)由表画出散点图,如图所示.(2)从上图可看出,这些点基本上散布在一条直线附近,可以认为x和y线性相关关系显著,下面求其回归方程,首先列出下表.x i y i x2i x i y i15.613031.36728.026.013636.00816.036.114337.21872.346.414940.96953.657.015749.00 1 099.067.517256.25 1 290.078.018364.00 1 464.0计算得x =6.85,y =157.25.∴b ^=∑i =18x i y i -8xy∑i =18x 2i -8x2=8 764.5-8×6.85×157.25382.02-8×6.852≈22.17,a ^=y -b ^x =157.25-22.17×6.85≈5.39, 故线性回归方程为y ^=22.17x +5.39.1.在一段时间内,某种商品的价格x 元和需求量y件之间的一组数据为:求出y 对x 解:x =15(14+16+18+20+22)=18,y =15(12+10+7+5+3)=7.4.∑i =15x 2i =142+162+182+202+222=1 660, ∑i =15x i y i =14×12+16×10+18×7+20×5+22×3=620,可得回归系数b ^=∑i =15x i y i -5xy∑i =15x 2i -5x2=620-5×18×7.41 660-5×182=-1.15.所以a ^=7.4+1.15×18=28.1所以回归直线方程:y ^=-1.15x +28.1. 列出残差表:则∑i =15(y i -y ^i )2=0.3,∑i =15(y i -y )2=53.2.。
人教A版高中数学选修回归分析的基本思想及其初步应用教案

凡事豫(预)则立,不豫(预)则废。
1、1回归分析的基本思想及其初步应用。
(第1课时)教学目标:通过典型案例,掌握回归分析的基本步骤。
教学重点:熟练掌握回归分析的步骤。
教学难点:求回归系数 a , b教学方法:讲练。
教学过程:一、复习引入:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
二、新课:1、回归分析的基本步骤:(1) 画出两个变量的散点图。
(2) 求回归直线方程。
(3) 用回归直线方程进行预报。
2、举例:例1、题(略) 用小黑板给出。
解:(1) 作散点图,由于问题是根据身高预报体重,因此要求身高与体重的回归直线方程,取身高为自变量x 。
体重为因变量 y ,作散点图(如图)(2)列表求 ,ˆ0.849ˆ85.712x yba ≈≈-回归直线方程 y=0.849x-85.712对于身高172cm 女大学生,由回归方程可以预报体重为y=0.849*172-85.712=60.316(kg) 预测身高为172cm 的女大学生的体重为约60。
316kg问题:身高为172cm 的女大学生的体重一定是60。
316kg 吗?(留下一节课学习) 例2:(提示后做练习、作业)研究某灌溉渠道水的流速y 与水深x 之间的关系,测得一组数据如下:水深xm1.40 1.50 1.60 1.70 1.80 1.902.00 2.10 流速ym/s1.70 1.79 1.88 1.952.03 2.10 2.16 2.21(1)求y 对x 的回归直线方程;(2)预测水深为1。
95m 时水的流速是多少?解:(略)三、小结四、作业: 例2、 预习。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.1 回归分析的基本思想及其初步应用学习目标:1.了解随机误差、残差、残差图的概念.(重点)2.会通过分析残差判断线性回归模型的拟合效果.(重点)3.了解常见的非线性回归模型转化为线性回归模型的方法.(难点)[自 主 预 习·探 新 知]1.回归分析的相关概念 (1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. (2)回归直线方程方程^y=^bx +^a是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中^a,^b是待定参数,其最小二乘估计分别为:,b其中=n 1x n i ,=n 1y ni ,(,)称为样本点的中心. (3)线性回归模型样本点散布在某一条直线的附近,而不是在一条直线上,所以不能用一次函数y =bx +a 来描述它们之间的关系,而是用线性回归模型y =bx +a +e 来表示,其中a 和b 为模型的未知参数,e 称为随机误差,自变量x 称为解释变量,因变量y 称为预报变量.思考:在线性回归模型y =bx +a +e 中,e 产生的原因主要有哪几种? [提示]随机误差产生的原因主要有以下几种: (1)所用的确定性函数不恰当引起的误差; (2)忽略了某些因素的影响; (3)存在观测误差.2.残差的概念对于样本点(x 1,y 1),(x 2,y 2),…,(x n ,y n )而言,它们的随机误差为e i =y i -bx i -a ,i =1,2,…,n ,其估计值为^e i =y i -^y i =y i -^b x i -^a,i =1,2,…,n ,^ei 称为相应于点(x i ,y i )的残差.3.刻画回归效果的方式1.思考辨析(1)相关指数R 2越小,线性回归方程的拟合效果越好. ( )(2)在线性回归模型中,e 是bx +a 预报真实值y 的随机误差,它是一个可观测的量.( )(3)线性回归方程^y=^bx +^a必过样本点的中心(,). ( ) [答案] (1)× (2)× (3)√2.甲、乙、丙、丁四位同学在建立变量x ,y 的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R 2分别如下表:A .甲B .乙C .丙D .丁A [相关指数R 2越大,表示回归模型的拟合效果越好.]3.甲、乙、丙、丁4位同学各自对A 、B 两变量做回归分析,分别得到散点图与残差平方和 n(y i -^yi )2如表所示:关系的模型拟合精度高.丁 [根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R 2表达式中 n(y i -)2为确定的数,则残差平方和越小,R 2越大),由回归分析建立的线性回归模型的拟合效果就越好,由试验结果知丁要好些.]4.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系.根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为^y=0.85x -85.71,则下列结论中正确的是________(填序号).(1)y 与x 具有正的线性相关关系; (2)回归直线过样本点的中心(,);(3)若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ;(4)若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg. (1)(2)(3) [回归方程中x 的系数为0.85>0,因此y 与x 具有正的线性相关关系,(1)正确;由回归方程系数的意义可知回归直线过样本点的中心(,),(2)正确; 依据回归方程中^b的含义可知,x 每变化1个单位,^y相应变化约0.85个单位,(3)正确;用回归方程对总体进行估计不能得到肯定结论,故(4)不正确.][合 作 探 究·攻 重 难]求线性回归方程数据:x 6 8 10 12 (2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程^y =^b x +^a ;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.[解] (1)如图:(2)x ni y i =6×2+8×3+10×5+12×6=158,=46+8+10+12=9,=42+3+5+6=4,x n i 2=62+82+102+122=344, ^b =344-4×92158-4×9×4=2014=0.7, ^a =-^b=4-0.7×9=-2.3,故线性回归方程为^y=0.7x -2.3.(3)由(2)中线性回归方程当x =9时,^y=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.[规律方法] 求线性回归方程的基本步骤: 1列出散点图,从直观上分析数据间是否存在线性相关关系. 2计算:3代入公式求出^y=^bx +^a中参数^b,^a的值. 4写出线性回归方程并对实际问题作出估计.提醒:只有在散点图大致呈线性时,求出的回归方程才有实际意义,否则求出的回归方程毫无意义.1.某种产品的广告费用支出x 与销售额y (单元:百万元)之间有如下的对应数据:x /百万元 2 4 5 6 8 y /百万元 3040605070(2)求线性回归方程;(3)试预测广告费用支出为10百万元时的销售额. [解] (1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算:所以,=5=5,=5=50,x i =145,x 5i y i =1 380.于是可得^b =22=145-5×521 380-5×5×50=6.5, ^a =-^b=50-6.5×5=17.5.所以所求的线性回归方程为^y=6.5x +17.5.(3)根据(2)中求得的线性回归方程,当广告费用支出为10百万元时,^y=6.5×10+17.5=82.5(百万元),即广告费用支出为10百万元时,销售额大约为82.5百万元.线性回归分析量的6个物体进行测量,数据如下表所示:x 5 10 15 20 25 30(2)求出R 2; (3)进行残差分析. [解] (1)散点图如图.=61(5+10+15+20+25+30)=17.5,=61(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,x 6i 2=2 275,x 6i y i =1 076.2, 计算得,^b≈0.183,^a≈6.285, 所求回归直线方程为^y=0.183x +6.285. (2)列表如下:所以 (y i -^i )2≈0.013 18, (y i -)2=14.678 4.所以,R 2=1-14.678 40.013 18≈0.999 1,回归模型的拟合效果较好.(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系.2.关于x 与y 有如下数据:有如下的两个线性模型:(1)^=6.5x +17.5;(2)^=7x +17.试比较哪一个拟合效果更好.[解] 由(1)可得y i -^yi 与y i -的关系如下表:∴ (y i -^i )2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155,(y i -)2=(-20)2+(-10)2+102+02+202=1 000.∴R 12=1-5=1-1 000155=0.845.由(2)可得y i -^yi 与y i -的关系如下表:∴ (y i -^i )2=(-1)2+(-5)2+82+(-9)2+(-3)2=180, (y i -)2=(-20)2+(-10)2+102+02+202=1 000. ∴R 22=1-5=1-1 000180=0.82,由于R 12=0.845,R 22=0.82,0.845>0.82,∴R 12>R 22. ∴(1)的拟合效果好于(2)的拟合效果.非线性回归分析1.已知x 和y 之间的一组数据,则下列四个函数中,模拟效果最好的为哪一个?2③y =4x;④y =x 2.提示:观察散点图中样本点的分布规律可判断样本点分布在曲线y =3×2x-1附近.所以模拟效果最好的为①. 2.如何将上题函数变换为线性函数?提示:将y =3×2x -1两边取自然对数得ln y =ln 3+(x -1)ln 2.令x ′=x ,y ′=ln y ,则原方程变为y ′=ln 3+x ′ln 2-ln 2=ln 23+x ′ln 2.这样y ′与x ′成线性函数关系.为了研究某种细菌随时间x 变化,繁殖的个数,收集数据如下: 天数x /天 1 2 3 4 5 6(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图,根据散点图判断:y =a +bx 与y =c 1e c 2x 哪一个作为繁殖的个数y 关于时间x 变化的回归方程类型为最佳?(给出判断即可,不必说明理由)其中z i =ln y i ;=6z i .(2)根据(1)的判断最佳结果及表中的数据,建立y 关于x 的回归方程.参考公式:^b =n ,^a =-^b.思路探究:(1)根据收集数据,可得数据的散点图;(2)由散点图看出样本点分布在一条指数型曲线y =c e bx (c >0)的周围,则ln y =bx +ln c .变换后的样本点分布在一条直线附近,因此可以用线性回归方程来拟合,即可求出y 对x 的回归方程.[解] (1)作出散点图,如图1所示.图1 图2由散点图看出样本点分布在一条指数函数y =c 1e c 2x 的周围,于是选择y =c 1e c 2x .(2)令z =ln y ,则z =bx +a .z 1.79 2.48 3.22 3.89 4.55 5.25相应的散点图如图2.从图2可以看出,变换后的样本点分布在一条直线附近,因此可以用线性回归方程来拟合.由^b=6≈0.69,^a =-^b=1.115,得z =0.69x +1.115; 则有^y=e 0.69x +1.115.母题探究:1.(变结论)在本例条件不变的情况下,试估计第7天细菌繁殖个数.[解] ∵^y=e 0.69x +1.115, ∴当x =7时,^y≈382(个)即第7天细菌繁殖个数约为382个. 2.(变结论)计算相关指数. [解] 残差计算如下表: 天数 1 2 3 4 5 6 残差0.080.12-0.83-0.821.061.52即解释变量“天数”对预报变量“繁殖细菌个数”解释了99.98%. [规律方法] 解决非线性回归问题的方法及步骤 1确定变量:确定解释变量为x ,预报变量为y ; 2画散点图:通过观察散点图并与学过的函数幂、指数、对数函数、二次函数作比较,选取拟合效果好的函数模型;5写出非线性回归方程.1.下表是x和y之间的一组数据,则y关于x的线性回归方程必过点( )x 123 4y 1357C.(2.5,4) D.(2.5,5)C [线性回归方程必过样本点的中心(,),即(2.5,4),故选C.]2.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是( )A BC DA[用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.] 3.若一组观测值(x1,y1),(x2,y2),…,(x n,y n)之间满足y i=bx i+a+e i(i =1,2,…,n),且e i恒为0,则R2为________.1 [∵e i恒为0,∴样本点(x1,y1),(x2,y2),…,(x n,y n)均落在直线y=bx +a 上,∴变量x ,y 成函数关系,即R 2=1.]4.已知回归方程^y=2x +1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和等于________.0.03 [(4.9-5)2+(7.1-7)2+(9.1-9)2=0.03.] 5.已知x ,y 之间的一组数据如下表:(1)分别计算:、、x 1y 1+x 2y 2+x 3y 3+x 4y 4、x 1+x 2+x 3+x 4;(2)已知变量x 与y 线性相关,求出回归方程.[解] (1)=40+1+2+3=1.5,=41+3+5+7=4,x 1y 1+x 2y 2+x 3y 3+x 4y 4=0×1+1×3+2×5+3×7=34,x 12+x 22+x 32+x 42=02+12+22+32=14. (2)^b =14-4×1.5234-4×1.5×4=2, ^a =-^b=4-2×1.5=1, 故^y=2x +1.。