北师大版选修1-2:1.1.1回归分析--教学设计一、二、三

合集下载

数学北师大版高中选修1-2选修1-2第一章 统计案例 §1.1.1回归分析导学案

数学北师大版高中选修1-2选修1-2第一章  统计案例   §1.1.1回归分析导学案

word 格式整理参考资料 学习帮手 第一章 统计案例§1.1.1回归分析预习案【学习目标】1. 理解并掌握用回归分析处理两个变量之间的不确定关系的统计方法。

2. 了解回归分析的意义。

3. 以极度的热情,自动自发、如痴如醉,投入到学习中,充分享受学习的快乐。

【使用说明与学法指导】1. 课前(前一天晚自习)自学课本并完成导学案,要求限时完成,书写规范;2. 带“★”的C 层可以选做,带“★★”的B,C 层可以选做.3. 自主探究先行一步,遇到难以理解的地方先做好标记,然后再通过小组讨论解决,如果小组不能解决的问题第二天在课堂上讨论解决。

一、预习自学: 基础知识梳理 问题导引知识点一:两个变量的关系与回归分析函数关系是一种 关系,而相关关系是一种 关系。

回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。

知识点二:线性回归方程1.求线性回归直线方程的步骤:(1) 作出散点图,将问题所给的数据在平面直角坐标系中描点,这样表示出的具有相关关系的两个变量的一组数据的图形就是散点图,从散点图中我们可以看出样本点是否呈条状分布,来判断两个量是否具有线性相关关系;(2) 求回归系数a ,b ,其中∑∑∑∑====--=---=n i i n i i i n i i n i i i xn x y x n y x x xy y x x b 121121)())((,x b y a -= (3) 写出回归直线方程a bx y +=,并用回归直线方程进行预测。

2. 回归直线a bx y +=过点),(y x ,这个点称为样本的中心.【预习自测】(大约10分钟,包括预习自学)1. 设有一个回归方程为22.5y x ∧=-,当变量x 增加一个单位时,( ) A 、y 平均增加2.5个单位 B 、y 平均增加2个单位C 、y 平均减少2.5个单位D 、y 平均减少2个单位2. 在一次试验中,测得),(y x 的四组数据值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的线性回归方程为 ( ) A.1+=x y B.2+=x y C.12+=x y D.1-=x y3.为研究变量x 和y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l 和2l ,两人计算知x 相同,y 也相同,下列正确的是( )A. 1l 与2l 一定平行B. 1l 与2l 相交于点),(y xC.1l 与2l 重合D. 无法判断1l 和2l 是否相交【我的疑惑】(将在预习中不能理解的问题写下来,供课堂上处理)1.2.3.。

高中数学北师大版选修1-2学案1.1 回归分析 Word版含解析

高中数学北师大版选修1-2学案1.1 回归分析 Word版含解析

§回归分析.回归分析.相关系数.可线性化的回归分析.了解回归分析的思想和方法.(重点).掌握相关系数的计算和判断线性相关的方法.(重点).了解常见的非线性回归模型转化为线性回归模型的方法.(难点)[基础·初探]教材整理回归分析阅读教材~“练习”以上部分,完成下列问题.设变量对的线性回归方程为=+,由最小二乘法知系数的计算公式为:===\(\()),\(=)\()-\()),=-.某产品的广告费用与销售额的统计数据如下表:售额为( ) 【导学号:】.万元.万元.万元.万元【解析】==,==,∴=-=-×=,∴回归方程为=+,∴当=时,=×+=,故选.【答案】教材整理相关系数阅读教材“练习”以下至“练习”以上部分,完成下列问题..相关系数的计算假设两个随机变量的数据分别为(,),(,),…,(,),则变量间线性相关系数===..相关系数与线性相关程度的关系()的取值范围为;[-]()值越大,误差越小,变量之间的线性相关程度越高;()值越接近,误差越大,变量之间的线性相关程度越.低.相关性的分类()当时,两个变量正相关;>()当<时,两个变量负相关;()当时,两个变量线性不相关.=判断(正确的打“√”,错误的打“×”)()两个变量的相关系数>,则两个变量正相关.( )()两个变量的相关系数越大,它们的相关程度越强.( )()若两个变量负相关,那么其回归直线的斜率为负.( )【答案】()√()×()√教材整理可线性化的回归分析阅读教材~“练习”以上部分,完成下列问题..非线性回归分析对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型..非线性回归方程。

高中数学(北师大版)选修1-2教案:第1章 例谈回归分析的应用

高中数学(北师大版)选修1-2教案:第1章 例谈回归分析的应用

例谈回归分析的应用在解许多实际应用问题时,运用回归分析的基本思想,通过构建回归模型去刻画解释变量与预报变量的关系,并利用模型,对解释变量的某个值去预测相应预报变量的某个值,从而使问题得到解决.建立回归模型解实际问题的步骤是:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系;(3)由经验确定回归方程的类型,即拟合直线或拟合曲线;(4)按一定规则估计回归方程中的参数,从而求出拟合直线或拟合曲线的函数关系式;(5)利用函数关系式,根据条件对所给问题进行预测和控制,以便为决策提供依据.下面举例说明.例1某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x元与日销售量y台之间有如下关系:(1)y与x是否具有线性相关关系?如果具有线性相关关系,求出回归直线方程;(2)设经营此商品的日销售利润为P元,根据(1)写出P关于x的函数关系式并预测当销售单价x为多少元时,才能获得最大日销售利润.解析:(1)散点图如右图所示,并从图中可以看出,这些点大致分布在一条直线附近,因此两个变量线性相关.设回归直线为ˆy bx a=+,则由公式求得3a=.b-≈,161.5∴ˆ3161.5=-+;y x(2)依题意有2=-+-=-+-,(3161.5)(30)3251.54845P x x x x∴当251.5426x =≈时,P 有最大值约为426. 即预测销售单价为42元时,才能获得最大日销售利润.点评:本题主要考查构建线性回归模型在解决实际问题中的应用. 例2 某国从1790年至1950年人口数据资料:试利用上述资料预测该国1980年的人口数(假设该国政治、社会、经济环境稳定,且人口数相对于时间是连续的).分析:以x 轴代表年度,y 轴代表人口数,建立直角坐标系,画出散点图(略),并观察散点图可以发现,从1890年以后散点近似分布在一条直线上;而从散点图的整体趋势来看,也可以认为散点近似分布在一条抛物线上,故可采用线性回归模型拟合,或采用二次函数模型拟合.解法一:由散点图可以看出,1890年以后散点大致分布在一条直线上,设线性回归直线方程为ˆybx a =+,由公式求得 1.4852747.025b a -≈,≈, 即ˆ 1.48582747.025yx =-. ∴当1980x =时,6194.85910y =⨯,即1980年该国人口预测为194.859百万人.解法二:从散点的整体趋势看,散点近似分布在一条以直线1790x =为对称轴,以点(1790,3.929)为顶点的抛物线上,再任意选一点(1890,62.948)确定抛物线方程为20.0059(1790) 3.929y x =-+.∴当1980x =时,6216.91910y =⨯,即该国人口预测为216.919百万人. 点评:本题主要考查重视对信息、图表的分析,提取,加工和处理能力.两种解法,由于考虑问题和观察角度不同,所得到结论和答案也不相同,线性回归模型是在依据部分已知数据的基础上作出的,因此精确度比较差;而二次函数模型是根据全部已知数据的分布趋势拟合的,因而有较高的精确度.当然,同学们可以进一步利用回归分析的方法,通过利用相关指数2R来比较两个模型的拟合效果.。

数学北师大版高中选修1-2北师大版数学选修1-2 第一章 统计案例 §1回归分析

数学北师大版高中选修1-2北师大版数学选修1-2     第一章  统计案例 §1回归分析

庐山区一中高效课堂导学案北师大版数学选修1-2 第一章 统计案例 §1回归分析§1.1.1 回归分析(总第1课时)主编:查道强 审核:柯愈勇 审批:【预习案】学习目标:1、知识与技能:通过对统计案例的探究,会对两个随机变量进行线性回归分析。

2、过程与方法:学生通过实例分析学习最小二乘法,及其求解回归方程。

3、情感态度与价值观:(1)进一步树立数形结合的思想。

(2)进一步体会构建模型的作用。

教学重点:散点图的画法,回归直线方程的求解方法。

教学难点:回归直线方程的求解方法。

使用说明&学法指导:1、用15分钟左右时间,阅读探究课本P1-P6的内容,熟记基础知识,自主高效学习,提升自己的阅读理解能力。

2、完成教材助读设置的问题,然后结合课本的基础知识例题,完成预习自测题。

3、将预习中不能解决的问题标记出来,并写到后面“我的疑问”处。

(一)相关知识——知识储备,学以致用请同学们回顾前面所学知识对下面的问题做出回答:问题1:现实生活中两个变量间的关系有哪些呢?问题2:相关关系与函数关系有怎样的不同?问题3:对于线性相关的两个变量用什么方法来刻划之间的关系呢?问题4:你知道最小二乘法吗?(二)教材助读——精心阅读,仔细思考1、必修课程中,我们已经会用最小二乘法求变量之间的线性回归方程。

假设样本点为112233(,),(,),(,),(,)n n x y x y x y x y …,,设线性回归方程为 ,我们的想法就是要求a,b ,使这n 个点与直线 的“距离”平方之和 。

2、在统计中,我们使用 表示一组数据123,,,,n x x x x …的平均值,即 。

为了简化表示,我们引进求和符号,记作 。

3、1()n ii x x =-=∑ 。

1()ni i y y =-=∑ 。

4、____________________________________xx xy yy l l l ===5、线性回归方程y a bx =+,其中b=a=(三)预习自测——自我检测,自我完善自测题体现一定的基础性,又有一定的思维含量,只有“细心才对,思考才会”。

1.1回归分析-北师大版选修2-3教案

1.1回归分析-北师大版选修2-3教案

1.1 回归分析-北师大版选修2-3教案一、教学目标1.理解回归分析的基本概念。

2.掌握最小二乘法求解一元线性回归方程的方法。

3.能够利用回归分析解决实际问题。

4.培养学生运用数学知识分析问题和解决问题的能力。

二、教学重点1.回归分析的定义和基本原理。

2.最小二乘法求解一元线性回归方程的步骤。

3.运用回归分析解决实际问题。

三、教学难点1.最小二乘法求解一元线性回归方程的方法。

2.运用回归分析解决实际问题的能力。

四、教学方法1.讲授法2.示例法3.练习法五、教学资源1.北师大版选修2-3教材2.教学投影仪3.计算器六、教学过程6.1 导入1.引入回归分析的概念,让学生了解回归分析的应用场景。

2.引入最小二乘法的基本概念。

3.引入一元线性回归方程的概念。

6.2 讲授1.讲解回归分析的定义和基本原理。

2.讲解最小二乘法求解一元线性回归方程的步骤。

6.3 示例演练1.通过一个实际问题,示范如何利用回归分析解决问题。

2.带领学生一步一步跟随示例演练。

6.4 训练1.提供多个实际问题,让学生自己运用回归分析解决问题。

2.提供必要的支持和指导。

6.5 总结1.回顾回归分析的基本概念和最小二乘法求解方法。

2.总结回归分析的应用场景和作用。

七、课后作业1.完成教材相关思考题和练习题。

2.自选一道实际问题,利用回归分析解决。

3.总结回归分析的基本原理、方法和应用场景。

八、教学评估1.教师检查学生完成的练习和作业情况。

2.教师记录课堂表现优秀的学生,有针对性地给予表扬或加分。

九、教学反思经过这次教学,我发现学生对于最小二乘法和一元线性回归方程的理解还比较浅,需要在教学时细化概念,加强示范和练习,以便他们更好地吸收掌握。

此外,针对应用场景的演示需更丰富,让学生在现实问题上获得更多的直观感受。

高中数学:1.1回归分析 学案 (北师大选修1-2)

高中数学:1.1回归分析 学案 (北师大选修1-2)

1.1回归分析自学目标(1)通过实例引入线性回归模型,感受产生随机误差的原因;(2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法;(3)能求出简单实际问题的线性回归方程.重点,难点线性回归模型的建立和线性回归系数的最佳估计值的探求方法.学习过程一.问题情境1.情境:对一作直线运动的质点的运动过程观测了8次,得到如下表所示的数据,试估计当x=9时的位置y的值.时刻x/s1*******位置观测值5.547.5210.0211.7315.6916.1216.9821.06y/cm根据《数学3(必修)》中的有关内容,解决这个问题的方法是:先作散点图,如下图所示:从散点图中可以看出,样本点呈直线趋势,时间x与位置观测值y之间有着较好的线性关系.因此可以用线性回归方程来刻画它们之间的关系.根据线性回归的系数公式,1221()ni i i ni i x y nx y b x n x a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑ 可以得到线性回归方为 3.5361 2.1214y x =+,所以当9x =时,由线性回归方程可以估计其位置值为22.6287y =2.问题:在时刻9x =时,质点的运动位置一定是22.6287cm 吗? 二.学生活动思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映x 与y 之间的关系,y 的值不能由x 完全确定,它们之间是统计相关关系,y 的实际值与估计值之间存在着误差. 三.建构数学1.线性回归模型的定义:我们将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型.说明:(1)产生随机误差的主要原因有:①所用的确定性函数不恰当引起的误差; ②忽略了某些因素的影响; ③存在观测误差.(2)对于线性回归模型,我们应该考虑下面两个问题: ①模型是否合理(这个问题在下一节课解决); ②在模型合理的情况下,如何估计a ,b ? 2.探求线性回归系数的最佳估计值:对于问题②,设有n 对观测数据(,)iix y (1,2,3,,)i n =,根据线性回归模型,对于每一个ix ,对应的随机误差项()ii i y a bx ε=-+,我们希望总误差越小越好,即要使21ni i ε=∑越小越好.所以,只要求出使21(,)()ni i i Q y x αββα==--∑取得最小值时的α,β值作为a ,b 的估计值,记为a ,b .注:这里的iε就是拟合直线上的点(),iix a bx +到点(),iiiP x y 的距离.用什么方法求a ,b ?回忆《数学3(必修)》“2.4线性回归方程”P71“热茶问题"中求a ,b 的方法:最小二乘法.利用最小二乘法可以得到a ,b 的计算公式为1122211()()()()nni i iii i nni ii i x x y y x ynx yb x x xn x a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑,[来源:Z #xx #k 。

数学北师大版高中选修1-2第一章 统计案例 §1.1.1回归分析探究案

数学北师大版高中选修1-2第一章  统计案例   §1.1.1回归分析探究案

word 整理版学习参考资料探究案学始于疑----我思考,我收获二、合作探究(大约15分钟,包括小组讨论与展示)探究一:回归分析概念辨析例1:在下列说法中正确命题的个数是 ( )①回归分析就是有样本点去寻找一条直线方程,刻画这些样本点之间的关系的数学方法; ②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示; ③通过线性回归方程a bx y += 及其回归系数分析b ,可以估计和预测变量的取值和变化趋势④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验。

A.1 B.2 C.3 D.4探究二:线性回归分析例2:对于x 与y 有如下观测数据:x 18 25 30 39 41 42 49 32 y356788910(1)画出散点图(2)求出y 对x 的回归直线方程;(3)根据回归直线方程,预测y=20时x 的值。

【探究小结】1.会用散点图判断两个变量的关系是否可以用线性关系。

知道只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程是毫无意义的;2.会利用线性回归方程预测当x 取某一个值时y 的估计值。

【当堂检测】(大约10分钟)1. 下表是x 与y 之间的一组数据,则y 关于x 的线性回归直线必过点 ( )x 0 1 2 3 y1357A.(2,2)B.(1.5,2)C.(1,2)D.(1.5,4)★★2.某产品的广告费用x 与销售额y 的统计数据如表:广告费用x (万元)4 2 35 销售额y (万元)49263954根据上表可得回归方程a bx y += 中的b 为9.4,据此模型预报广告费用为6万元时销售额为 万元。

【我的收获】(反思静悟,体验成功)【课堂小结】1.知识方面:①掌握用回归分析处理两个变量之间的不确定关系的统计方法 ②了解回归分析的意义2.数学思想方法:回归的基本思想 【温馨提示】请同学们完成《全程学习导与练》的训练案。

高中数学北师大版选修1-2教案:第1章 一道回归分析题

高中数学北师大版选修1-2教案:第1章 一道回归分析题

一道回归分析题的思维拓展与延伸一、回归分析的大体步骤:(1) 画出两个变量的散点图.(2) 求回归直线方程.(3) 用回归直线方程进行预报.下面咱们通过案例,进一步学习、拓展与延伸回归分析的大体思想及其应用.二、举例:例1. 从某大学中随机选取 8 名女大学生,其身高和体重数据如表编号 1 2 3 4 5 6 7 8身高/cm 165 165 157 170 175 165 155 170体重/kg 48 57 50 54 64 61 43 59求按照女大学生的身高预报体重的回归方程,并预报一名身高为 172 cm 的女大学生的体重.解:由于问题中要求按照身高预报体重,因此选取身高为自变量 x ,体重为因变量 y .作散点图,如下图从图中能够看出,样本点呈条状散布,身高和体重有比较好的线性相关关系,因此能够用线性回归方程来近似刻画它们之间的关系.按照公式:=-(1)a y bx121()()()n i i i n ii x x y y b x x ==--=-∑∑ (2) 其中1111,n ni i i i x x y y n n ====∑∑,(,x y )成为样本点的中心. 能够取得ˆˆ0.849,85.712ba ==-. 于是取得回归方程084985.712y x =-.因此,对于身高172 cm 的女大学生,由回归方程能够预报其体重为 084917285.71260.316y =⨯-= ( kg ) .ˆ0.849b=是斜率的估量值,说明身高 x 每增加1个单位时,体重y 就增加 位,这表明体重与身高具有正的线性相关关系.三.思维拓展与延伸1.如何描述它们之间线性相关关系的强弱?在必修 3 中,咱们介绍了用相关系数;来衡量两个变量之间线性相关关系的方式.本相关系数的具体计算公式为()()ni ix x y y r --=∑. 当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r 的绝对值越接近1,表明两个变量的线性相关性越强;r 的绝对值接近于0时,表明两个变量之间几乎不存在线性相关关系.通常,当r 的绝对值大于0. 75 时以为两个变量有很强的线性相关关系.在本例中,能够计算出r =0. 798.这表明体重与身高有很强的线性相关关系,从而也表明咱们成立的回归模型是成心义的.2.如何理解y 与y ~间的误差 显然,身高172cm 的女大学生的体重不必然是60. 316 kg ,但一般能够以为她的体重接近于60 . 316 kg .如下图中的样本点和回归直线的彼此位置说明了这一点.由于所有的样本点不共线,而只是散布在某一条直线的周围,所以身高和体重的关系可用下面的线性回归模型来表示:y bx a e =++这里a 和b 为模型的未知参数,e 是y 与y bx a =+之间的误差.通常e 为随机变量,称为随机误差,它的均值 E(e )=0,方差D (e )=2()D e σ=>0 .如此线性回归模型的完整表达式为:2,()0,().y bx a e E e D e σ=++⎧⎨==⎩ (3) 在线性回归模型(3)中,随机误差e 的方差护越小,通过回归直线y bx a =+ 预报真实值y 的精度越高.随机误差是引发预报值y 与真实值 y 之间的误差的原因之一,大小取决于随机误差的方差.另一方面,由于公式(1)和(2)中a 和b 为截距和斜率的估量值,它们与真实值a 和b 之间也存在误差,这种误差是引发预报值y 与真实值y 之间误差的另一个原因.3. 产生随机误差项e 的原因是什么?一个人的体重值除受身高的影响外,还受许多其他因素的影响.例如饮食适应、是不是喜欢运动、气宇误差等.事实上,咱们无法明白身高和体重之间的确切关系是什么,这里只是利用线性回归方程来近似这种关系.这种近似和上面提到的影响因素都是产生随机误差 e 的原因.因为随机误差是随机变量,所以能够通过那个随机变量的数字特征来刻画它的一些整体特征.均值是反映随机变量取值平均水平的数字特征,方差是反映随机变量集中于均值程度的数字特征,而随机误差的均值为0,因此能够用方差2σ来衡量随机误差的大小.4.用身高预报体重时,需要注意哪些问题?需要注意下列问题:(1).回归方程只适用于咱们所研究的样本的整体.例如,不能用女大学生的身高和体重之间的回归方程,描述女运动员的身高和体重之间的关系.一样,不能用生长在南方多雨地域的树木的高与直径之间的回归方程,描述北方干旱地域的树木的高与直径之间的关系.(2).咱们所成立的回归方程一般都有时刻性.例如,不能用 20 世纪80 年代的身高体重数据所成立的回归方程,描述此刻的身高和体重之间的关系.(3).样本取值的范围会影响回归方程的适用范围.例如,咱们的回归方程是由女大学生身高和体重数据成立的,那么用它来描述一个人幼儿时期的身高和体重之间的关系就不适当(即在回归方程中,解释变量 x 的样本的取值范围为[155cm,170cm〕,而用那个方程计算 x-70cm 时的y值,显然不适合.)(4).不能期望回归方程取得的预报值就是预报变量的精准值.事实上,它是预报变量的可能取值的平均值.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.1.1回归分析教学目标(1)通过实例引入线性回归模型,感受产生随机误差的原因;(2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法; (3)能求出简单实际问题的线性回归方程. 教学重点,难点线性回归模型的建立和线性回归系数的最佳估计值的探求方法. 教学过程 一.问题情境1. 情境:对一作直线运动的质点的运动过程观测了8次,得到如下表所示的数据,试估计当x=9时的位置y 的值.根据《数学3(必修)》中的有关内容,解决这个问题的方法是: 先作散点图,如下图所示:从散点图中可以看出,样本点呈直线趋势,时间x 与位置观测值y 之间有着较好的线性关系.因此可以用线性回归方程来刻画它们之间的关系.根据线性回归的系数公式,1221()n i i i nii x y nx y b x n x a y bx==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑可以得到线性回归方为 3.5361 2.1214y x =+,所以当9x =时,由线性回归方程可以估计其位置值为 22.6287y =2.问题:在时刻9x =时,质点的运动位置一定是22.6287cm 吗? 二.学生活动思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映x 与y 之间的关系,y 的值不能由x 完全确定,它们之间是统计相关关系,y 的实际值与估计值之间存在着误差. 三.建构数学1.线性回归模型的定义:我们将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型. 说明:(1)产生随机误差的主要原因有:①所用的确定性函数不恰当引起的误差; ②忽略了某些因素的影响; ③存在观测误差.(2)对于线性回归模型,我们应该考虑下面两个问题: ①模型是否合理;②在模型合理的情况下,如何估计a ,b ? 2.探求线性回归系数的最佳估计值:对于问题②,设有n 对观测数据(,)i i x y (1,2,3,,)i n = ,根据线性回归模型,对于每一个i x ,对应的随机误差项()i i i y a bx ε=-+,我们希望总误差越小越好,即要使21nii ε=∑越小越好.所以,只要求出使21(,)()niii Q y x αββα==--∑取得最小值时的α,β值作为a ,b 的估计值,记为 a,b . 注:这里的i ε就是拟合直线上的点(),i i x a bx +到点(),i i i P x y 的距离.用什么方法求 a,b ?回忆利用最小二乘法可以得到 a,b 的计算公式为 1122211()()()()n ni i i i i i n n i i i i x x y y x y nx y b x x x n x a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑ , 其中11n i i x x n ==∑,11ni i y y n ==∑由此得到的直线 y a bx =+ 就称为这n 对数据的回归直线,此直线方程即为线性回归方程.其中 a ,b 分别为a ,b 的估计值, a 称为回归截距,b 称为回归系数, y 称为回归值.在前面质点运动的线性回归方程 3.5361 2.1214y x =+中,3.5361a =, 2.1214b = . 3. 线性回归方程 y abx =+ 中 a ,b 的意义是:以 a 为基数,x 每增加1个单位,y 相应地平均增加b个单位; 4. 化归思想(转化思想)在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式. (1)b y a x =+,令'y y =,1'x x=,则有''y a bx =+. (2)by ax =,令'ln y y =,'ln x x =,'ln a a =,则有'''y a bx =+.(3)bxy ae =,令'ln y y =,'x x =,'ln a a =,则有'''y a bx =+.(4)b xy ae =,令'ln y y =,1'x x=,'ln a a =,则有'''y a bx =+. (5)ln y a b x =+,令'y y =,'ln x x =,则有''y a bx =+. 四.数学运用 典例分析例1.下表给出了我国从1949年至1999年人口数据资料,试根据表中数据估计我国2004年的人口数.【解析】为了简化数据,先将年份减去1949,并将所得值用x 表示,对应人口数用y 表示,得到下面的数据表:作出11个点(),x y 构成的散点图,由图可知,这些点在一条直线附近,可以用线性回归模型y a bx ε=++来表示它们之间的关系. 根据公式(1)可得14.453,527.591.b a ⎧≈⎪⎨≈⎪⎩ 这里的 ,ab 分别为,a b 的估 计值,因此线性回归方程 为 527.59114.453y x =+由于2004年对应的55x =,代入线性回归方程 527.59114.453y x =+可得 1322.506y =(百万),即2004年的人口总数估计为13.23亿. 例2. 某地区对本地的企业进行了一次抽样调查,下表是这次抽查中所得到的各企业的人均资本x (万元)与人均产出y (万元)的数据:(1)设y 与x 之间具有近似关系by ax ≈(,a b 为常数),试根据表中数据估计a 和b 的值;(2)估计企业人均资本为16万元时的人均产出(精确到0.01).分析:根据x ,y 所具有的关系可知,此问题不是线性回归问题,不能直接用线性回归方程处理.但由对数运算的性质可知,只要对by ax ≈的两边取对数,就能将其转化为线性关系. 解(1)在by a x≈的两边取常用对数,可得lg lg lg y a b x ≈+,设lg y z =,lg a A =,lg x X =,则z A bX ≈+.相关数据计算如图327--所示.仿照问题情境可得A ,b 的估计值 A ,b分别为 0.2155,1.5677,A b ⎧=-⎪⎨=⎪⎩ 由 lg 0.2155a =-可得 0.6088a≈,即a ,b 的估计值分别为0.6088和1.5677. (2)由(1)知 1.5670.6088y x =.样本数据及回归曲线的图形如图328--(见书本102P页)当16x =时, 1.56770.60881647.01y =⨯≈(万元),故当企业人均资本为16万元时,人均产值约为47.01万元. 五.回顾小结:1. 线性回归模型y a bx ε=++与确定性函数y a bx =+相比,它表示y 与x 之间是统计相关关系(非确定性关系)其中的随机误差ε提供了选择模型的准则以及在模型合理的情况下探求最佳估计值 a,b 的工具; 2. 线性回归方程 y abx =+ 中 a ,b 的意义是:以 a 为基数,x 每增加1个单位,y 相应地平均增加b个单位; 3.求线性回归方程的基本步骤.教学设计二【教学目标】 1、知识与技能目标认识随机误差; 2、过程与方法目标(1)会使用函数计算器求回归方程; (2)能正确理解回归方程的预报结果.3、情感、态度、价值观通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,理解处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识,解决实际问题的能力.教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性.【教学重点】随机误差e的认识【教学难点】随机误差的来源和对预报变量的影响 【教学方法】 启发式教学法 【教学手段】多媒体辅助教学【教学过程设计】教学设计三【学情分析】:教学对象是高二理科学生,学生已经初步学会用最小二乘法建立线性回归模型的知识,并能用所学知识解决一些简单的实际问题。

回归分析是数理统计中的重要内容,在教学中,要结合实例进行相关性检验,理解只有两个变量相关性显著时,回归方程才具有实际意义。

在起点低的班级中注重让学生参与实践,结合画图表的方法整理数据,鼓励学生通过收集数据,经历数据处理的过程,从而认识统计方法的特点,达到学习的目的。

【教学目标】:(1)知识与技能:回忆线性回归模型与函数模型的差异,理解用最小二乘法求回归模型的步骤,了解判断两变量间的线性相关关系的强度——相关系数。

(2)过程与方法:本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线方程。

(3)情感态度与价值观:从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求知欲,培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进取。

【教学重点】:1.了解线性回归模型与函数模型的差异;2.了解两变量间的线性相关关系的强度——相关系数。

【教学难点】:1.了解两变量间的线性相关关系的强度——相关系数;2.了解线性回归模型与一次函数模型的差异。

【教学过程设计】:②列表求出相关的量,并求出线性回归方程代入公式有848.025.16582187745.5425.165872315ˆ22121≈⨯-⨯⨯-=--=∑∑==x n xyx n yx bni ini ii712.8525.165849.05.54ˆ-=⨯-=-=x b y a所以回归方程为712.85849.0ˆˆˆ-=+=x x b a y③利用回归方程预报身高172cm 的女大学生的体重约为多少?当172=x 时,()kg y316.60712.85172849.0ˆ=-⨯= 引导学生复习总结求线性回归方程的步骤:第一步:作散点图—→第二步:求回归方程—→第三步:代值计算1. 设有一个回归方程为x y5.22ˆ-=,则变量x 增加一个单位时,则( C ) A .y 平均增加5.2个单位 B .y 平均增加2个单位 C .y 平均减少5.2个单位 D .y 平均减少2个单位 2. 在画两个变量的散点图时,下面哪个叙述是正确的( B )A .预报变量在x 轴上,解释变量在y 轴上B .解释变量在x 轴上,预报变量在y 轴上C .可以选择两个变量中任意一个变量在x 轴上D .可以选择两个变量中任意一个变量在y 轴上 3. 已知x 与y 之间的一组数据:与x 的线性回归方程为a x b yˆˆˆ+=必过( D ) 则yA .(2,2)点B .(1.5,0)点C .(1,2)点D .(1.5,4)点4. 已知两个相关变量x 与y 具有线性相关关系,当x 取值1,2,3,4时,通过观测得到y的值分别为1.2,4.9,8.1,12.8,这组样本点的中心是( D ) A .(2,4.9) B .(3,8.1) C .(2.5,7) D .(2.5,6.75)5. 一位母亲记录了儿子3—9岁的身高,数据(略),由此建立的身高与年龄的回归模型为y=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( C ) A .身高一定是145.83cm B .身高在145.83cm 以上 C .身高在145.83cm 左右D .身高在145.83cm 以下6. 在一次实验中,测得(x ,y )的四组值分别是A (1,2)、B (2,3)、C (3,4)D (4,5),则y 与x 之间的回归直线方程为( A )A .1ˆ+=x yB .2ˆ+=x yC .12ˆ+=x yD . 1ˆ-=x y 7. 有下列关系:⑴人的年龄与其拥有的财富之间的关系;⑵曲线上的点与该点的坐标之间的关系;⑶苹果的产量与气候之间的关系;⑷森林中的同一树木,其横截面直径与高度之间的关系;⑸学生与其学号之间的关系。

相关文档
最新文档