人教版A选修1-2第一章1.1回归分析的基本思想及其初步应用课案

合集下载

人教A版 选修1-2 1.1 回归分析的基本思想及其初步应用 教案

人教A版 选修1-2  1.1 回归分析的基本思想及其初步应用  教案

1.1 回归分析的基本思想及其初步应用学习目标:1.了解随机误差、残差、残差图的概念.(重点)2.会通过分析残差判断线性回归模型的拟合效果.(重点)3.了解常见的非线性回归模型转化为线性回归模型的方法.(难点)[自 主 预 习·探 新 知]1.回归分析的相关概念 (1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. (2)回归直线方程方程^y=^bx +^a是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中^a,^b是待定参数,其最小二乘估计分别为:,b其中=n 1x n i ,=n 1y ni ,(,)称为样本点的中心. (3)线性回归模型样本点散布在某一条直线的附近,而不是在一条直线上,所以不能用一次函数y =bx +a 来描述它们之间的关系,而是用线性回归模型y =bx +a +e 来表示,其中a 和b 为模型的未知参数,e 称为随机误差,自变量x 称为解释变量,因变量y 称为预报变量.思考:在线性回归模型y =bx +a +e 中,e 产生的原因主要有哪几种? [提示]随机误差产生的原因主要有以下几种: (1)所用的确定性函数不恰当引起的误差; (2)忽略了某些因素的影响; (3)存在观测误差.2.残差的概念对于样本点(x 1,y 1),(x 2,y 2),…,(x n ,y n )而言,它们的随机误差为e i =y i -bx i -a ,i =1,2,…,n ,其估计值为^e i =y i -^y i =y i -^b x i -^a,i =1,2,…,n ,^ei 称为相应于点(x i ,y i )的残差.3.刻画回归效果的方式1.思考辨析(1)相关指数R 2越小,线性回归方程的拟合效果越好. ( )(2)在线性回归模型中,e 是bx +a 预报真实值y 的随机误差,它是一个可观测的量.( )(3)线性回归方程^y=^bx +^a必过样本点的中心(,). ( ) [答案] (1)× (2)× (3)√2.甲、乙、丙、丁四位同学在建立变量x ,y 的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R 2分别如下表:A .甲B .乙C .丙D .丁A [相关指数R 2越大,表示回归模型的拟合效果越好.]3.甲、乙、丙、丁4位同学各自对A 、B 两变量做回归分析,分别得到散点图与残差平方和 n(y i -^yi )2如表所示:关系的模型拟合精度高.丁 [根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R 2表达式中 n(y i -)2为确定的数,则残差平方和越小,R 2越大),由回归分析建立的线性回归模型的拟合效果就越好,由试验结果知丁要好些.]4.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系.根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为^y=0.85x -85.71,则下列结论中正确的是________(填序号).(1)y 与x 具有正的线性相关关系; (2)回归直线过样本点的中心(,);(3)若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ;(4)若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg. (1)(2)(3) [回归方程中x 的系数为0.85>0,因此y 与x 具有正的线性相关关系,(1)正确;由回归方程系数的意义可知回归直线过样本点的中心(,),(2)正确; 依据回归方程中^b的含义可知,x 每变化1个单位,^y相应变化约0.85个单位,(3)正确;用回归方程对总体进行估计不能得到肯定结论,故(4)不正确.][合 作 探 究·攻 重 难]求线性回归方程数据:x 6 8 10 12 (2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程^y =^b x +^a ;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.[解] (1)如图:(2)x ni y i =6×2+8×3+10×5+12×6=158,=46+8+10+12=9,=42+3+5+6=4,x n i 2=62+82+102+122=344, ^b =344-4×92158-4×9×4=2014=0.7, ^a =-^b=4-0.7×9=-2.3,故线性回归方程为^y=0.7x -2.3.(3)由(2)中线性回归方程当x =9时,^y=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.[规律方法] 求线性回归方程的基本步骤: 1列出散点图,从直观上分析数据间是否存在线性相关关系. 2计算:3代入公式求出^y=^bx +^a中参数^b,^a的值. 4写出线性回归方程并对实际问题作出估计.提醒:只有在散点图大致呈线性时,求出的回归方程才有实际意义,否则求出的回归方程毫无意义.1.某种产品的广告费用支出x 与销售额y (单元:百万元)之间有如下的对应数据:x /百万元 2 4 5 6 8 y /百万元 3040605070(2)求线性回归方程;(3)试预测广告费用支出为10百万元时的销售额. [解] (1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算:所以,=5=5,=5=50,x i =145,x 5i y i =1 380.于是可得^b =22=145-5×521 380-5×5×50=6.5, ^a =-^b=50-6.5×5=17.5.所以所求的线性回归方程为^y=6.5x +17.5.(3)根据(2)中求得的线性回归方程,当广告费用支出为10百万元时,^y=6.5×10+17.5=82.5(百万元),即广告费用支出为10百万元时,销售额大约为82.5百万元.线性回归分析量的6个物体进行测量,数据如下表所示:x 5 10 15 20 25 30(2)求出R 2; (3)进行残差分析. [解] (1)散点图如图.=61(5+10+15+20+25+30)=17.5,=61(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,x 6i 2=2 275,x 6i y i =1 076.2, 计算得,^b≈0.183,^a≈6.285, 所求回归直线方程为^y=0.183x +6.285. (2)列表如下:所以 (y i -^i )2≈0.013 18, (y i -)2=14.678 4.所以,R 2=1-14.678 40.013 18≈0.999 1,回归模型的拟合效果较好.(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系.2.关于x 与y 有如下数据:有如下的两个线性模型:(1)^=6.5x +17.5;(2)^=7x +17.试比较哪一个拟合效果更好.[解] 由(1)可得y i -^yi 与y i -的关系如下表:∴ (y i -^i )2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155,(y i -)2=(-20)2+(-10)2+102+02+202=1 000.∴R 12=1-5=1-1 000155=0.845.由(2)可得y i -^yi 与y i -的关系如下表:∴ (y i -^i )2=(-1)2+(-5)2+82+(-9)2+(-3)2=180, (y i -)2=(-20)2+(-10)2+102+02+202=1 000. ∴R 22=1-5=1-1 000180=0.82,由于R 12=0.845,R 22=0.82,0.845>0.82,∴R 12>R 22. ∴(1)的拟合效果好于(2)的拟合效果.非线性回归分析1.已知x 和y 之间的一组数据,则下列四个函数中,模拟效果最好的为哪一个?2③y =4x;④y =x 2.提示:观察散点图中样本点的分布规律可判断样本点分布在曲线y =3×2x-1附近.所以模拟效果最好的为①. 2.如何将上题函数变换为线性函数?提示:将y =3×2x -1两边取自然对数得ln y =ln 3+(x -1)ln 2.令x ′=x ,y ′=ln y ,则原方程变为y ′=ln 3+x ′ln 2-ln 2=ln 23+x ′ln 2.这样y ′与x ′成线性函数关系.为了研究某种细菌随时间x 变化,繁殖的个数,收集数据如下: 天数x /天 1 2 3 4 5 6(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图,根据散点图判断:y =a +bx 与y =c 1e c 2x 哪一个作为繁殖的个数y 关于时间x 变化的回归方程类型为最佳?(给出判断即可,不必说明理由)其中z i =ln y i ;=6z i .(2)根据(1)的判断最佳结果及表中的数据,建立y 关于x 的回归方程.参考公式:^b =n ,^a =-^b.思路探究:(1)根据收集数据,可得数据的散点图;(2)由散点图看出样本点分布在一条指数型曲线y =c e bx (c >0)的周围,则ln y =bx +ln c .变换后的样本点分布在一条直线附近,因此可以用线性回归方程来拟合,即可求出y 对x 的回归方程.[解] (1)作出散点图,如图1所示.图1 图2由散点图看出样本点分布在一条指数函数y =c 1e c 2x 的周围,于是选择y =c 1e c 2x .(2)令z =ln y ,则z =bx +a .z 1.79 2.48 3.22 3.89 4.55 5.25相应的散点图如图2.从图2可以看出,变换后的样本点分布在一条直线附近,因此可以用线性回归方程来拟合.由^b=6≈0.69,^a =-^b=1.115,得z =0.69x +1.115; 则有^y=e 0.69x +1.115.母题探究:1.(变结论)在本例条件不变的情况下,试估计第7天细菌繁殖个数.[解] ∵^y=e 0.69x +1.115, ∴当x =7时,^y≈382(个)即第7天细菌繁殖个数约为382个. 2.(变结论)计算相关指数. [解] 残差计算如下表: 天数 1 2 3 4 5 6 残差0.080.12-0.83-0.821.061.52即解释变量“天数”对预报变量“繁殖细菌个数”解释了99.98%. [规律方法] 解决非线性回归问题的方法及步骤 1确定变量:确定解释变量为x ,预报变量为y ; 2画散点图:通过观察散点图并与学过的函数幂、指数、对数函数、二次函数作比较,选取拟合效果好的函数模型;5写出非线性回归方程.1.下表是x和y之间的一组数据,则y关于x的线性回归方程必过点( )x 123 4y 1357C.(2.5,4) D.(2.5,5)C [线性回归方程必过样本点的中心(,),即(2.5,4),故选C.]2.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是( )A BC DA[用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.] 3.若一组观测值(x1,y1),(x2,y2),…,(x n,y n)之间满足y i=bx i+a+e i(i =1,2,…,n),且e i恒为0,则R2为________.1 [∵e i恒为0,∴样本点(x1,y1),(x2,y2),…,(x n,y n)均落在直线y=bx +a 上,∴变量x ,y 成函数关系,即R 2=1.]4.已知回归方程^y=2x +1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和等于________.0.03 [(4.9-5)2+(7.1-7)2+(9.1-9)2=0.03.] 5.已知x ,y 之间的一组数据如下表:(1)分别计算:、、x 1y 1+x 2y 2+x 3y 3+x 4y 4、x 1+x 2+x 3+x 4;(2)已知变量x 与y 线性相关,求出回归方程.[解] (1)=40+1+2+3=1.5,=41+3+5+7=4,x 1y 1+x 2y 2+x 3y 3+x 4y 4=0×1+1×3+2×5+3×7=34,x 12+x 22+x 32+x 42=02+12+22+32=14. (2)^b =14-4×1.5234-4×1.5×4=2, ^a =-^b=4-2×1.5=1, 故^y=2x +1.。

人教A版 选修1-2 1.1 回归分析的基本思想及其初步应用(一) 教案

人教A版 选修1-2  1.1 回归分析的基本思想及其初步应用(一) 教案

[核心必知]1.预习教材,问题导入根据以下提纲,预习教材P2~P8的内容,回答下列问题.(1)在数学《必修3》中,我们利用回归分析的方法对两个具有线性相关关系的变量进行了研究,其步骤是什么?所求出的线性回归方程是什么?提示:步骤为:画出两个变量的散点图,求回归直线方程,并用回归直线方程进行预报.线性回归方程为^y=^b x+^a.(2)所有的两个相关变量都可以求回归方程吗?提示:不一定.2.归纳总结,核心必记(1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(2)回归直线方程方程^y=^b x+^a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(x n,y n)的回归方程,其中^a,^b是待定参数,其最小二乘估计分别为:,x其中-x=n1x n i,-y=n1y n i,(-x,-y)称为样本点的中心.(3)线性回归模型线性回归模型用y=bx+a+e来表示,其中a和b为模型的未知参数,e称为随机误差.(4)刻画回归效果的方式(1)通过教材P2中的例1计算出的回归方程^y=0.849x-85.712可以预报身高为172 cm的女大学生的体重为60.316 kg.请问,身高为172 cm的女大学生的体重一定是60.316 kg吗?为什么?提示:不一定.从散点图可以看出,样本点散布在一条直线的附近,而不是在一条直线上,所以不能用一次函数y=bx+a表示.(2)下列说法正确的有哪些?①在线性回归模型中,e是bx+a预报真实值y的随机误差,它是一个可观测的量;②残差平方和越小的模型,拟合的效果越好;③用R2来刻画回归效果,R2越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.提示:e是一个不可观测的量,故①不正确;R2越小,残差平方和越大,即模型的拟合效果越差,故③不正确;②④是正确的.[课前反思](1)回归分析的定义是什么?如何求回归直线方程?(2)线性回归模型是什么?(3)残差、残差图的定义是什么?如何作残差图?(4)残差平方和和相关指数R2的定义是什么?它们与回归效果有什么关系?[思考] 求线性回归方程的步骤是什么?名师指津:(1)列表表示x i,y i,x i y i,x i2;(2)计算,,x n i2,x n i y i;(3)代入公式计算^a,^b的值;(4)写出线性回归方程.讲一讲1.(链接教材P2-例1)某种产品的广告费用支出x与销售额y(单位:百万元)之间有如下的对应数据:x/百万元24568y/百万元3040605070(1)(2)求线性回归方程;(3)试预测广告费用支出为10百万元时的销售额. [尝试解答] (1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算:所以,=525=5,=5=50,x i =145, x 5i y i =1 380. 于是可得^b=22=145-5×521 380-5×5×50=6.5,^a=-y-^b-x=50-6.5×5=17.5.所以所求的线性回归方程为^y=6.5x +17.5.(3)根据(2)中求得的线性回归方程,当广告费用支出为10百万元时, ^y=6.5×10+17.5=82.5(百万元),即广告费用支出为10百万元时,销售额大约为82.5百万元.(1)求线性回归方程前必须判断两个变量是否线性相关,如果两个变量本身不具备相关关系,或者它们之间的相关关系不显著,那么即使求出回归方程也是毫无意义的.(2)写出回归直线方程^y=^bx +^a,并用回归直线方程进行预测说明:当x 取x 0时,由线性回归方程可得^y0的值,从而可进行相应的判断.练一练1.某班5名学生的数学和物理成绩如下表:学生A B C D E学科成绩数学成绩(x)8876736663物理成绩(y)7865716461(1)(2)求物理成绩y对数学成绩x的回归直线方程;(3)一名学生的数学成绩是96,试预测他的物理成绩.解:(1)如图所示.(2)因为=51×(88+76+73+66+63)=73.2,=51×(78+65+71+64+61)=67.8,x5i y i=88×78+76×65+73×71+66×64+63×61=25 054,x5i2=882+762+732+662+632=27 174.25 054-5×73.2×67.8所以^b=22=27 174-5×73.22≈0.625,^a=-^b-x≈67.8-0.625×73.2=22.05.故y对x的回归直线方程是^y=0.625x+22.05.(3)x=96,则^y=0.625×96+22.05≈82,即可以预测他的物理成绩是82.[思考] 如何用残差图、残差平方和、相关指数R2分析拟合效果?名师指津:残差图的带状区域的宽度越窄,模型拟合精度越高;残差平方和越小,模型拟合效果越好;R2越接近于1,模型拟合效果越好.讲一讲2.假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:x 15.025.830.036.644.4y 39.442.942.943.149.2(1)以x(2)求y与x之间的回归方程,对于基本苗数56.7预报有效穗;(3)计算各组残差,并计算残差平方和;(4)求R2,并说明残差变量对有效穗的影响占百分之几?[尝试解答] (1)散点图如下.(2)由(1)中散点图看出,样本点大致分布在一条直线的附近,有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.设回归方程为^y=^b x+^a.=30.36,=43.5,x5i2=5 101.56,y5i2=9 511.43.-x-y=1 320.66,2=921.729 6,x5i y i=6 746.76.则^b=22≈0.29,^a=-^b≈34.70.故所求的回归直线方程为^y=0.29x+34.70.当x =56.7时,^y=0.29×56.7+34.70=51.143. 估计成熟期有效穗为51.143.(3)由于^yi =^bx i +^a,可以算得^ei =y i -^yi 分别为^e1=0.35,^e2=0.718,^e3=-0.5,^e4=-2.214,^e5=1.624,残差平方和: 5^e i 2≈8.43.(4) 5(y i -)2=50.18, 故R 2=1-50.188.43≈0.832.所以解释变量小麦基本苗数对总效应约贡献了83.2%,残差变量贡献了约1-83.2%=16.8%.(1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差^e1,^e2,…,^en 来判断模型拟合的效果.(2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合度越高,回归方程预报精确度越高.练一练2.某运动员训练次数与运动成绩之间的数据关系如下:次数(x ) 30 33 35 37 39 44 46 50 成绩(y )3034373942464851(1)作出散点图; (2)求出线性回归方程;(3)作出残差图,并说明模型的拟合效果; (4)计算R 2,并说明其含义.解:(1)作出该运动员训练次数x 与成绩y 之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.(2)∵=39.25,=40.875,x8i2=12 656,y8i2=13 731,x8i y i=13 180,∴^b=8=22≈1.041 5,^a=-^b≈-0.003 875,∴线性回归方程为^y=1.041 5x-0.003 875.(3)残差分析计算得^e1≈-1.24,^e2≈-0.366,^e3≈0.551,^e4≈0.468,^e5≈1.385,^e6≈0.178,^e7≈0.095,^e8≈-1.071.作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.(4)计算相关指数R2计算相关指数R2≈0.985 5,说明了该运动员成绩的差异有98.55%是由训练次数引起的.讲一讲3.(链接教材P6-例2)某地区六年来轻工业产品利润总额y与年次x的试验数据如下表所示:a,b均为正数,求y关于x的回归方程.[思路点拨] 解答此题可根据散点图选择恰当的拟合函数,而本题已经给出,只需将其转化为线性函数,利用最小二乘法求得回归直线方程,再将其还原为非线性回归方程即可.[尝试解答] 对y=ab x e0两边取自然对数,得ln y=ln ae0+x ln b,令z=ln y,则z与x的数据如下表:由z=ln 0ln b≈0.047 7,ln ae0=2.378,即^z=2.378+0.047 7x,故^y=10.8×1.05x.非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:练一练3.某电容器充电后,电压达到100 V,然后开始放电,由经验知道,此后电压U 随时间t变化的规律用公式U=A e bt(b<0)表示,现测得时间t(s)时的电压U(V)如下表:t/s012345678910U/V10075554030201510105 5线性回归分析问题).解:对U=A e bt两边取对数得ln U=ln A+bt,令y=ln U,a=ln A,x=t,则y=a+bx,y与x的数据如下表:x 012345678910y 4.6 4.3 4.0 3.7 3.4 3.0 2.7 2.3 2.3 1.6 1.6如图所示,从图中可以看出,y与x具有较好的线性相关关系,由表中数据求得=5,≈3.045,由公式计算得^b≈-0.313,^a=-^b-x=4.61,所以y对x的线性回归方程为^y=-0.313x+4.61.所以ln ^U=-0.313t+4.61,即^U=e-0.313t+4.61=e-0.313t·e4.61,因此电压U对时间t的回归方程为^U=e-0.313t·e4.61.————————————[课堂归纳·感悟提升]————————1.本节课的重点是线性回归方程的求法及线性回归分析,难点是残差分析和非线性回归分析问题.2.本节课要重点掌握的规律方法(1)线性回归分析,见讲1;(2)残差分析,见讲2;(3)非线性回归分析,见讲3.。

人教a版高中数学选修1-2课件:第一章1.1回归分析的基本思想及其初步应用

人教a版高中数学选修1-2课件:第一章1.1回归分析的基本思想及其初步应用
x 5 10 15 20 25 30 y 7.25 8.12 8.95 9.90 10.9 11.8
(1)作出散点图,并求线性回归方程; (2)求出 R2; (3)进行残差分析.
解:(1)散点图如图所示.
-x =16×(5+10+15+20+25+30)=17.5,
-y

1 6
×
(7.25

8.12
D.若变量 y 和 x 之间的相关系数 r=-0.936 2,则 变量 y 与 x 之间具有线性相关关系
解析:R2 的值越大,说明残差平方和越小,也就是 模型的拟合效果越好,因此 C 是不正确的.
答案:C
类型 2 线性回归分析(互动探究) [典例 2] 为研究重量 x(单位:克)对弹簧长度 y(单位: 厘米)的影响,对不同重量的 6 个物体进行测量,数据如 下表所示:
3.刻画回归效果的方式
[思考尝试·夯基]
1.思考判断(正确的打“√”,错误的打“×”) (1)求线性回归方程前可以不进行相关性检验.( ) (2)在残差图中,纵坐标为残差,横坐标可以选为样 本编号.( ) (3)利用线性回归方程求出的值是准确值.( ) 答案:(1)× (2)√ (3)×
2.如图四个散点图中,适合用线性回归模型拟合其 中两个变量的是( )
第一章 统计案例
1.1 回归分析的基本思想 及其初步应用
[学习目标] 1.了解随机误差、残差、残差分析的概 念(重点). 2.会求线性回归方程. 3.会用残差分析判 断线性回归模型的拟合效果. 4.通过对典型案例的探 究,了解回归分析的基本思想方法和初步应用(重点、难 点).
[知识提炼·梳理]
答案:①②③
类型 1 概念的理解和判断(自主研析)

人教版高中数学选修(1-2)-1.1《回归分析基本思想及其初步应用(第2课时)》教学设计

人教版高中数学选修(1-2)-1.1《回归分析基本思想及其初步应用(第2课时)》教学设计

1.1.1 回归分析基本思想及其初步应用第二课时(谷杨华)一、教学目标 1.核心素养:通过学习回归分析的基本思想及其初步应用,初步形成基本的数据分析能力. 2.学习目标(1)1.1.2.1 理解相关系数概念(2)1.1.2.2 判断刻画模型拟合效果的方法—相关指数和残差分析 (3)1.1.2.3 能用回归分析的方法对简单的案例进行分析. 3.学习重点判断刻画模型拟合效果的方法—相关系数、相关指数和残差分析 4.学习难点判断刻画模型拟合效果的方法—相关系数、相关指数和残差分析 二、教学设计 (一)课前设计 1.预习任务 任务1阅读教材P 4-P 6,思考在回归分析中,分析残差能够帮助我们解决那些问题?任务2刻画模型拟合效果的方法有哪些?2.预习自测1.下列说法正确的是 ( )A.在统计学中,回归分析是检验两个分类变量是否有关系的一种统计方法B.线性回归方程对应的直线a x b yˆˆˆ+=至少经过其样本数据点1122(,),(,),,(,)n n x y x y x y L 中的一个点C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D.在回归分析中,相关指数2R 为98.0的模型比相关指数2R 为80.0的模型拟合的效果差 【知识点:回归分析】解:C A.回归分析反映两个变量相关关系的数学方法,由建立回归方程来预报变量的情况.错误;B.线性回归方程对应的直线a x b yˆˆˆ+=,过其样本数据平均数点,错误;D.相关指数2R 越大,则相关性越强,模型的拟合效果越好. 错误;C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高. 正确.2.两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下,其中拟合效果最好的模型是( ) A.模型1的相关指数2R 为0.99 B.模型2的相关指数2R 为0.88 C.模型3的相关指数2R 为0.50 D.模型4的相关指数2R 为0.20 【知识点:回归分析】解:A 由相关指数的意义知,2R 越大说明相关性越强,故选A. (二)课堂设计 1.知识回顾⑴对于一组具有线性相关关系的数据1122(,),(,),,(,)n n x y x y x y L ,1211,n n i i x x x x x n n =+++==∑L 121y y y 1y y ,nn i i n n=+++==∑L 则称点),y x (为样本点的中心. (2)线性回归方程:∧∧∧+=a x b y ,其中.1122211()()()n niii ii i nniii i x x y y x y nx yb x x xnx∧====---==--∑∑∑∑,a ∧=x b ∧-y(3)线性回归模型:y =bx +a +e 其中a 和b 为模型的未知参数,e 称为随机误差. 2.问题探究问题探究一 什么是相关系数?相关系数可以用来解释什么?●活动一 理论研究,概念学习—相关系数我们知道,两个变量x 和y 正(负)相关时,它们就有相同(反)的变化趋势,因此可以用回归直线来描述这种关系.与此相关的一个问题:如何描述x 和y 之间种线性关系的强弱?在统计中用相关系数r 来衡量两个变量之间线性关系的强弱.若相应于变量x 的取值i x ,变量y 的观测值为i y (n i ≤≤1),则两个变量的相关系数r 的计算公式为∑∑∑===----=ni ni iini iiy yx x y yx x r 11221)()())((对于相关系数r ,当为正时,表明变量x 和y 正相关,当r 为负时,表明变量x 和y 负相关. 统计学认为,对于变量x,y ,如果[]75.0,1--∈r ,那么负相关很强;如果[]1,75.0∈r ,那么正。

高中数学《1.1回归分析的基本思想及其初步应用》教案2 新人教A版选修1-2

高中数学《1.1回归分析的基本思想及其初步应用》教案2 新人教A版选修1-2

11.1回归分析的基本思想及其初步应用(二)教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学难点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学过程:一、复习准备:1.由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响.2.为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 二、讲授新课:1. 教学总偏差平方和、残差平方和、回归平方和:(1)总偏差平方和:所有单个样本值与样本均值差的平方和,即21()ni i SST y y ==-∑.残差平方和:回归值与样本值差的平方和,即21()ni i i SSE y y ==-∑. 回归平方和:相应回归值与样本均值差的平方和,即21()ni i SSR y y ==-∑. (2)学习要领:①注意i y 、 i y 、y 的区别;②预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和,即222111()()()n n ni i i i i i i y y y y y y ===-=-+-∑∑∑;③当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;④对于多个不同的模型,我们还可以引入相关指数 22121()1()nii i n ii yy R yy ==-=--∑∑来刻画回归的效果,它表示解释变量对预报变量变化的贡献率. 2R 的值越大,说明残差平方和越小,也就是说模型拟合的效果越好. 2. 教学例题:为了对x 、Y 两个变量进行统计分析,现有以下两种线性模型: 6.517.5y x =+,717y x =+,试比较哪一个模型拟合的效果更好.分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论. (答案:52211521()155110.8451000()i i i ii y y R y y ==-=-=-=-∑∑,221R =-521521()18010.821000()iii ii y y y y ==-=-=-∑∑,84.5%>82%,所以甲选用的模型拟合效果较好.)3. 小结:分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果的好坏.第三课时。

高中数学人教A版选修1-2教学案第一章 1.1 回归分析的基本思想及其初步应用 Word版含答案

高中数学人教A版选修1-2教学案第一章 1.1 回归分析的基本思想及其初步应用 Word版含答案

预习课本~,思考并完成以下问题.什么是回归分析?.什么是线性回归模型?.求线性回归方程的步骤是什么?.回归分析()回归分析相关关系回归分析是对具有的两个变量进行统计分析的一种常用方法.()回归方程的相关计算对于两个具有线性相关关系的变量的一组数据(,),(,),…,(,).设其回归直线方程为=+,其中,是待定参数,由最小二乘法得==,=-.()线性回归模型线性回归模型(\\(=++,((=,((=σ)),其中,为模型的未知参数,通常为随机变随机误差.量称为,称为变量,称为变量.预报解释[点睛]对线性回归模型的三点说明()非确定性关系:线性回归模型=++与确定性函数=+相比,它表示与之间是统计相关关系(非确定性关系),其中的随机误差提供了选择模型的准则以及在模型合理的情况下探求最佳估计值,的工具.()线性回归方程=+中,的意义是:以为基数,每增加个单位,相应地平均增加个单位..线性回归分析()残差:对于样本点(,)(=,…,)的随机误差的估计值=-称为相应于点(,)的残差,(-)称为残差平方和.()残差图:利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.()=-越接近,表示回归的效果越好..判断下列命题是否正确.(正确的打“√”,错误的打“×”)()残差平方和越小,线性回归方程的拟合效果越好.( ) ()在画两个变量的散点图时,预报变量在轴上,解释变量在轴上.( )()越小,线性回归方程的拟合效果越好.( )答案:()√()×()×.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为.答案:正相关.在残差分析中,残差图的纵坐标为.答案:残差.如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于,解释变量和预报变量之间的相关系数等于.答案:或-[典例] 某研究机构对高三学生的记忆力和判断力进行统计分析,得下表数据()()请根据上表提供的数据,用最小二乘法求出关于的线性回归方程=+;()试根据求出的线性回归方程,预测记忆力为的同学的判断力.[解]()散点图如图:()=×+×+×+×=,==,==,。

新人教A版(选修1-2)1.1《回归分析的基本思想及其初步应用》word教案

新人教A版(选修1-2)1.1《回归分析的基本思想及其初步应用》word教案

1.1回归分析的基本思想及其初步应用(一)教学任务分析:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法——相关系数.教学难点:解释随机误差的含义及相关系数大小对两个变量相关关系的影响.教学过程: 一.引入问:身高和体重有什么样的关系?吸烟与患肺癌有关系吗?答:函数关系是一种确定性关系,而相关关系是一种非确定性关系。

回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:(1)收集数据;(2)作散点图;(3)求回归直线方程;(4)利用方程进行预报 二.例题与练习求根据女大学生的身高预报体重的回归方程,并预报一名身高为172 cm 的女大 学生的体重.练习:学案p2-P6:的最好估计,计算公式和就是未知参数和b a b a ∧∧∑∑==∧---=ni i ni i ix x y y x xb 121)())((∑∑==--=n i i ni ii xn x yx n yx 1221x b y a ∧∧-=:样本相关系数计算公式∑∑∑===----=n i ni i i ni i iy y x x y y x xr 11221)()())((∑∑∑===---=n i ni i i ni ii y n y x n x yx n yx 112221)()(:回归相关指数计算公式∑∑==∧---=n i ini i iy yy yR 12122)()(1作业:习案1、2.。

人教版高中数学选修(1-2)-1.1《回归分析的基本思想及其初步应用》教学教案

人教版高中数学选修(1-2)-1.1《回归分析的基本思想及其初步应用》教学教案

1.1回归分析的基本思想及其初步应用学习目标:(1)通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤;了解线性回归模型与函数模型的区别;(2)尝试做散点图,求回归直线方程;(3)能用所学的知识对实际问题进行回归分析,体会回归分析的实际价值与基本思想;了解判断刻画回归模型拟合好坏的方法――相关指数和残差分析。

学习重难点:(1)求回归直线方程,会用所学的知识对实际问题进行回归分析.(2)掌握回归分析的实际价值与基本思想.(3)能运用自己所学的知识对具体案例进行检验与说明.(4)残差变量的解释;(5)偏差平方和分解的思想;学习内容:一、基础知识梳理1.回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。

求回归直线方程的一般步骤:作出散点图(由样本点是否呈条状分布来判断两个量是否具有线性相关关系),若存在线性相关关系→②求回归系数→③写出回归直线方程,并利用回归直线方程进行预测说明.2.回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法。

建立回归模型的基本步骤是:①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;②画好确定好的解释变量和预报变量的散点图,观察它们之间的关系(线性关系)③由经验确定回归方程的类型.④按一定规则估计回归方程中的参数(最小二乘法);⑤得出结论后在分析残差图是否异常,若存在异常,则检验数据是否有误,后模型是否合适等.3.利用统计方法解决实际问题的基本步骤:(1)提出问题;(2)收集数据;(3)分析整理数据;(4)进行预测或决策。

4.残差变量e的主要来源:(1)用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型到底是什么)所引起的误差。

可能存在非线性的函数能够更好地描述y与x之间的关系,但是现在却用线性函数来表述这种关系,结果就会产生误差。

这种由于模型近似所引起的误差包含在e中。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档