高中数学 3.1回归分析的基本思想及其初步应用第1课时教案 新人教版选修2-3
3.1回归分析的基本思想及其初步应用

35
40
45Leabharlann 水稻产量y330 345
365
405 445
450 455
施化肥量x
水稻产量y
15
20
25
365
30
35
40
45
330 345
405 445
450 455
y
500 450
水稻产量
400
350
·
· ·
·
·· ·
施化肥量
40 50
30010
20
30
x
2013-6-4
1、定义:
5
1
3
5
4
3
2
7
1
9
求两变量间的回归方程. 解:列表:
i xi 1 -1 2 -2 3 -3 4 -4 5 -5 6 5 7 3 8 4 9 2 10 1
yi
xiyi
-9
9
-7
14
-5
15
-3
12
-1
5
1
5
5
15
3
12
7
14
9
9
x 0, y 0,
2013-6-4
x
i 1
10
2 i
110,
高二数学 选修2-3
3.1回归分析的基 本思想及其初步 应用(一)
2013-6-4
数学3——统计内容 1. 画散点图
2. 了解最小二乘法的思想
3. 求回归直线方程 y=bx+a 4. 用回归直线方程解决应用问题
2013-6-4
复习 变量之间的两种关系
问题1:正方形的面积y与正方形的边长x之间 的函数关系是 y = x2 确定性关系 问题2:某水田水稻产量y与施肥量x之间是否 有一个确定性的关系? 例如:在 7 块并排、形状大小相同的试验田上 进行施肥量对水稻产量影响的试验,得 到如下所示的一组数据: 施化肥量x 15 20 25 30
高中数学选修2-3精品教案7:§3.1 回归分析的基本思想及其初步应用教学设计

§3.1 回归分析的基本思想及其初步应用教学目标知识与技能从相关指数和残差分析角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤.过程与方法在发现直接求回归直线方程存在缺陷的基础上,引导学生去发现解决问题的新思路——进行回归分析,进而介绍残差分析的方法和利用R2来表示解释变量对于预报变量变化的贡献率.情感、态度与价值观通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,掌握处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识解决实际问题的能力.教学中适当地利用学生的合作与交流,使学生在学习的同时,体会与他人合作的重要性.重点难点教学重点:从残差分析、相关指数角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤;教学难点:了解评价回归效果的两个统计量:相关指数、残差和残差平方和.教学过程引入新课(幻灯片)编号 1 2 3 4 5 6 7 8身高/cm 165 165 157 170 175 165 155 170体重/kg 48 57 50 54 64 61 43 59 上表是上一节课我们从某大学选取8名女大学生其身高和体重数据组成的数据表,在上一节课中我们通过数据建立了回归直线方程,并根据方程预测了身高为172 cm的女大学生的体重.当时,我们提到根据回归直线方程求得的体重数据,仅是一个估计值,其与真实值之间存在着误差,为了综合分析身高和体重的关系,我们引入了线性回归模型y=bx+a+e 来表示两变量之间的关系,其中e为随机变量,又称随机误差.线性回归模型y=bx+a+e 增加了随机误差项e,因变量y的值由自变量x和随机误差e共同确定.假设随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图中所有的点将完全落在回归直线上.但是,在图中,数据点并没有完全落在回归直线上.这些点散布在回归直线附近,所以一定是随机误差把这些点从回归直线上“推”开了,即自变量x 只能解释部分y 的变化. 同学们考虑一下,随机变量e 的均值是多少?方差又是多少? 活动设计:学生思考回答问题.学情预测:学生回答E (e )=0,D (e )=σ2>0.教师提问:能否通过D (e )来刻画线性回归模型的拟合程度?学情预测:随机误差e 的方差越小,通过回归直线预报真实值y 的精度越高.随机误差是引起预报值与真实值y 之间的误差的原因之一,其大小取决于随机误差的方差.设计意图:说明研究随机误差e 的必要性,通过研究随机误差e 可以分析预报值的可信度. 提出问题:既然可以用随机变量e 的方差来衡量随机误差的大小,即通过方差σ2来刻画预报变量(体重)的变化在多大程度上与随机误差有关,那么如何获得方差σ2呢? 学生活动:学生独立思考,小组合作交流讨论.活动结果:可以采用抽样统计的思想,通过随机变量e 的样本来估计σ2的大小. 设计目的:复习抽样统计思想,以便通过随机变量e 的样本来估计总体.探究新知提出问题:既然e 表示了除解释变量以外其他各种影响预报值的因素带来的误差,那么如何获得e 的样本来计算σ2呢? 学生活动:分组合作讨论交流.学情预测:由函数模型y ^=b ^x +a ^和回归模型y =bx +a +e 可知e =y -y ^,这样根据图表中女大学生的身高求出预报值,再与真实值作差,即可求得e 的一个估计值.教师:由于在计算回归直线方程时,利用公式求得的b ^和a ^为斜率和截距的估计值,它们与真实值a 和b 之间存在误差,因此y ^是估计值,所以e ^=y -y ^也是一个估计值. 由上可知,对于样本点(x 1,y 1),(x 2,y 2),…,(x n ,y n )而言,它们的随机误差为e i =y i -bx i -a ,i =1,2,…n ,称其估计值e ^i =y i -y ^i 为相应于点(x i ,y i )的残差.将所有残差的平方加起来,即 i =1ne ^2i ,这个和称作残差平方和.类比样本方差估计总体方差的思想,可以用σ^2=1n -2∑i =1n e ^2i =1n -2∑i =1n(y i -y ^i )2(n >2)作为σ2的估计量,通常,σ^2越小,预报精度越高.这样,当我们求得回归直线方程后,可以通过残差来判断模型拟合程度的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析. 设计目的:通过问题诱思,引入残差概念.理解新知提出问题:对照女大学生的身高和体重的原始数据,结合求出的回归直线方程,求出相应的残差数据.学生活动:独立完成. 活动结果: 编号 1 2 3 4 5 6 7 8 身高( cm) 165 165 157 170 175 165 155 170 体重( kg) 48 57 50 54 64 61 43 59 残差e ^-6.3732.6272.419-4.6181.1376.627-2.8830.382提出问题:根据表格中的数据,以样本编号为横坐标,残差值为纵坐标,做出散点图(这样的散点图称作残差图).学生活动:分组合作,共同完成. 活动结果:残差图提出问题:观察上面的残差图,你认为哪几个样本点在采集时可能存在人为的错误?为什么?学生活动:分组讨论.活动结果:第一个和第六个样本点在采集过程中可能存在错误,因为其他的样本点基本都集中在一个区域内,只有这两个样本点的残差比较大,相对其他样本点来说,分布得较为分散. 提出问题:如何从残差图来判断模型的拟合程度? 学生活动:独立思考也可相互讨论. 活动结果:因为σ^2越小,预报精度越高,即模型的拟合程度越高,而σ^2越小,e ^的取值越集中,故若残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适,且带状区域的宽度越窄,说明拟合精度越高,回归直线的预报精度越高.教师:在统计学上,人们经常用相关指数R 2来刻画回归的效果,其计算公式是:R 2=1-∑i =1n(y i -y ^i )2∑i =1n(y i -y )2提出问题:分析上面计算相关指数R 2的公式,如何根据R 2来判断模型的拟合效果? 学生活动:独立思考也可相互讨论,教师加以适当的引导提示.活动结果:因为对于确定的样本数据而言,∑i =1n(y i -y )2是一个定值,故R 2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.提出问题:在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率,R2越接近1,表示回归的效果越好,即解释变量和预报变量的线性相关性越强,试计算关于女大学生身高与体重问题中的相关指数R2.学生活动:学生独立计算获得数据.活动结果:R2≈0.64.根据R2≈0.64就可得出“女大学生的身高解释了64%的体重变化”,或者说“女大学生的体重差异有64%是由身高引起的”.由此就不难理解为什么预报体重和真实值之间有差距了.设计目的:结合图象,让学生直观感受残差图在刻画回归模型拟合效果方面的应用,体会残差分析和相关指数的意义.提出问题:根据前面得到的回归方程,能否预测一名美国女大学生的体重?建立回归模型后能否一劳永逸,在若干年后还可以使用,或者适用于多年以前的女大学生体重预测?学生活动:讨论交流总结发言.活动结果:在使用回归方程进行预报时要注意:(1)回归方程只适用于我们所研究的样本的总体;(2)我们建立的回归方程一般都有时间性;(3)样本取值的范围会影响回归方程的适用范围;(4)不能期望回归方程得到的预报值就是预报变量的精确值.提出问题:结合我们刚学习的概念,现在能否将建立回归模型的步骤补充完整?学生活动:讨论交流,合作完成.活动结果:一般地,建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程).(4)按一定规则(如最小二乘法)估计回归方程中的参数.(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,或残差呈现不随机的规律性,等等).若存在异常,则检查数据是否有误,或模型是否合适等.设计意图:设计问题,让学生讨论分析,得出使用回归方程进行预报需注意的问题,并让学生完善建立回归模型的步骤.在这个过程中,教师不宜做太多引导,要放手给学生,让学生讨论,充分参与进来.运用新知例1一个车间为了规定工时定额,需确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:编号 1 2 3 4 5 6 7 8 9 10 零件数x /个 10 20 30 40 50 60 70 80 90 100 加工时间y /分626875818995102108115122(1)建立零件数为解释变量,加工时间为预报变量的回归模型,并计算残差; (2)你认为这个模型能较好地刻画零件数和加工时间的关系吗? 解:(1)根据表中数据作出散点图如下:散点图由散点图可知变量之间具有线性相关关系,可以通过求线性回归方程来拟合数据. 根据公式可求得加工时间对零件数的线性回归方程为y ^=0.668x +54.96. 残差数据如下表: 编号 1 2 3 4 5 6 7 8 9 10 残差e ^0.39-0.290.03-0.650.67-0.010.31-0.37 -0.050.27(2)画出残差图残差图由图可知,残差点分布较均匀,即用上述回归模型拟合数据效果很好,但需注意,由残差图也可以看出,第4个样本点和第5个样本点残差较大,需要确认在采集这两个样本点的过程中是否有人为的错误.点评:由散点图判断两个变量的线性相关关系,误差较大,利用残差图可以较好地评价模型的拟合程度,并能发现样本点中的可疑数据.变练演编例2在一段时间内,某种商品的价格x(元)和需求量y(件)之间的一组数据为:价格x/元14 16 18 20 22需求量y/件56 50 43 41 37求出y对x的回归方程,并说明拟合效果的好坏.解:作出散点图:从作出的散点图可以看出,这些点在一条直线附近,可用线性回归模型来拟合数据.由数据可得x =18,y =45.4,由计算公式得b ^=-2.35,a ^=y -b ^x =87.7. 故y 对x 的回归方程为y ^=-2.35x +87.7,列表:y i -y ^i 1.2 -0.1 -2.4 0.3 1 y i -y10.64.6-2.4-4.4-8.4所以∑i =15 (y i -y ^i )2=8.3,∑i =15(y i -y )2=229.2.相关指数R 2=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2≈0.946.因为0.964很接近1,所以该模型的拟合效果很好.变式1:若要分析是否在上述样本的采集过程中存在可疑数据,应如何分析? 活动设计:学生分组讨论,回顾课本解答问题. 活动成果:可以画出残差图来进行分析.变式2:既然利用残差图和相关指数都能够评价回归模型的拟合效果,能否总结一下两种方法各自的特点?活动成果:利用残差图可以直观展示拟合的效果,而且还可以发现样本数据中的可疑数据;而相关指数是把对拟合效果的评价转换为数值大小的判断,易于量化处理,并能在数量上表现解释变量对于预报变量变化的贡献率.设计意图:进一步熟悉判断拟合效果的方法以及各自的特点. 达标检测1.分析下列残差图,所选用的回归模型效果最好的是( )A BC D2.下列说法正确的是()①回归直线方程适用于一切样本和总体;②回归直线方程一般都有时间性;③样本的取值范围会影响回归直线方程的适用范围;④根据回归直线方程得到的预测值是预测变量的精确值.A.①③④B.②③C.①②D.③④3.在研究气温和热茶销售杯数的关系时,若求得相关指数R2≈__________,表明“气温解释了85%的热茶销售杯数变化”或者说“热茶销售杯数差异有85%是由气温引起的”.【答案】1.D 2.B 3.0.85.课堂小结学生回顾本节课学习的内容,尝试总结,然后不充分的地方由学生相互补充,最后在老师的引导下,用精炼的语言进行概括:1.判断变量是否线性相关的方法以及各自的特点;2.在运用回归模型时需注意的事项;3.建立回归模型的基本步骤.设计意图:让学生自己小结,这是一个多维整合的过程,是一个高层次的自我认识过程.补充练习基础练习1.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适.②用相关指数R2来刻画回归的效果,R2值越接近于1,说明模型的拟合效果越好.③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.正确的是( )A .①②B .②③C .①③D .①②③2.甲、乙、丙、丁四位同学各自对A ,B 两变量做回归分析,分别得到散点图与残差平方和∑i =1n(y i -y ^i )2如下表甲 乙 丙 丁散点图残差平方和115106124103哪位同学的实验结果体现拟合A ,B 两变量关系的模型拟合精度高?( ) A .甲 B .乙 C .丙 D .丁 3.关于x 与y 有如下数据:x 2 4 5 6 8 y3040605070为了对x ,y 两个变量进行统计分析,现有以下两种线性模型:甲:y ^=6.6x +17.5,乙:y ^=7x +17.试比较哪一个模型拟合效果更好. 【答案】1.D 2.D3.解析:设甲模型的相关指数为R 21,则R 21=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2=1-1551 000=0.845;设乙模型的相关指数为R 22,则可求得R 22=0.82,因为R 21>R 22,所以甲模型的拟合效果更好.【拓展练习】4.假设某种农作物基本苗数x 与有效穗数y 之间存在相关关系,今测得5组数据如下:x 15.0 25.8 30.0 36.6 44.4 y39.442.942.943.149.2(1)以x 为解释变量,y 为预报变量,作出散点图;(2)求y 与x 之间的回归方程,对于基本苗数56.7预报有效穗数. (3)计算各组残差;(4)求R 2,并说明随机误差对有效穗数的影响占百分之几? 解:(1)散点图如图:(2)由图可以看出,样本点呈条状分布,有比较好的线性相关关系,因此可用线性回归方程来建立两个变量之间的关系.设线性回归方程为y ^=b ^x +a ^,由数据可以求得:b ^≈0.291, a ^=y -b ^x =34.67.故所求的线性回归方程为y ^=0.291x +34.67. 当x =56.7时,y ^=0.291×56.7+34.67=51.169 7. 估计有效穗数为51.169 7.(3)各组数据的残差分别是e ^1≈0.37,e ^2≈0.72,e ^3≈-0.5,e ^4≈-2.22,e ^5≈1.61.(4)残差平方和:∑i =15(y i -y ^i )2=8.425 8,又∑i =15(y i -y )2=50.18,∴R 2=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2=1-8.425 850.18≈0.832.即解释变量(农作物基本苗数)对有效穗数的影响约占了83.2%,所以随机误差对有效穗数的影响约占1-83.2%=16.8%.设计说明本课时从上一节课的案例出发,通过分析随机误差产生的原因,引入随机变量、残差、残差平方和、相关指数的有关概念,从相关指数和残差分析等角度探讨回归模型拟合的效果,并通过案例说明利用所建立的回归模型进行预报时需要注意的问题,然后总结建立回归模型的基本步骤.在教学过程中以问题为引导思考的动机,注重对学生合作意识的培养,通过对案例的分析,培养学生对数据的处理能力,让学生初步了解回归分析思想在实际生活中的运用.。
高中数学回归分析的基本思想及其初步应用教案1 新人教A版选修1-2

1、1回归分析的基本思想及其初步应用。
教学目标:通过典型案例,掌握回归分析的基本步骤。
教学重点:熟练掌握回归分析的步骤。
教学难点:求回归系数 a , b教学方法:讲练。
教学过程:一、复习引入:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
二、新课:1、回归分析的基本步骤:(1) 画出两个变量的散点图。
(2) 求回归直线方程。
(3) 用回归直线方程进行预报。
2、举例:例1、题(略) 用小黑板给出。
解:(1) 作散点图,由于问题是根据身高预报体重,因此要求身高与体重的回归直线方程,取身高为自变量x 。
体重为因变量 y ,作散点图(如图)(2)列表求 ,ˆ0.849ˆ85.712x yba ≈≈-回归直线方程 y=0.849x-85.712对于身高172cm 女大学生,由回归方程可以预报体重为y=0.849*172-85.712=60.316(kg) 预测身高为172cm 的女大学生的体重为约60。
316kg问题:身高为172cm 的女大学生的体重一定是60。
316kg 吗?(留下一节课学习) 例2:(提示后做练习、作业)研究某灌溉渠道水的流速y 与水深x 之间的关系,测得一组数据如下:水深xm 1.40 1.50 1.60 1.70 1.80 1.90 2.00 2.10 流速ym/s1.70 1.79 1.88 1.952.03 2.10 2.16 2.21(1)求y 对x 的回归直线方程;(2)预测水深为1。
95m 时水的流速是多少?解:(略)三、小结四、作业: 例2、 预习。
高中新课程数学(新课标人教A版)选修2-3《3.1回归分析的基本思想及其初步应用》教案

3.1回归分析的基本思想及其初步应用(共计4课时) 授课类型:新授课一、教学内容与教学对象分析学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。
二、学习目标1、知识与技能通过本节的学习,了解回归分析的基本思想,会对两个变量进行回归分析,明确建立回归模型的基本步骤,并对具体问题进行回归分析,解决实际应用问题。
2、过程与方法 本节的学习,应该让学生通过实际问题去理解回归分析的必要性,明确回归分析的基本思想,从散点图中点的分布上我们发现直接求回归直线方程存在明显的不足,从中引导学生去发现解决问题的新思路—进行回归分析,进而介绍残差分析的方法和利用R 的平方来表示解释变量对于预报变量变化的贡献率,从中选择较为合理的回归方程,最后是建立回归模型基本步骤。
3、情感、态度与价值观 通过本节课的学习,首先让显示了解回归分析的必要性和回归分析的基本思想,明确回归分析的基本方法和基本步骤,培养我们利用整体的观点和互相联系的观点,来分析问题,进一步加强数学的应用意识,培养学生学好数学、用好数学的信心。
加强与现实生活的联系,以科学的态度评价两个变量的相关系。
教学中适当地增加学生合作与交流的机会,多从实际生活中找出例子,使学生在学习的同时。
体会与他人合作的重要性,理解处理问题的方法与结论的联系,形成实事求是的严谨的治学态度和锲而不舍的求学精神。
培养学生运用所学知识,解决实际问题的能力。
三、教学重点、难点教学重点:熟练掌握回归分析的步骤;各相关指数、建立回归模型的步骤;通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:求回归系数 a , b ;相关指数的计算、残差分析;了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。
人教版高中数学选修(1-2)-1.1《回归分析的基本思想及其初步应用》教学教案

1.1回归分析的基本思想及其初步应用学习目标:(1)通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤;了解线性回归模型与函数模型的区别;(2)尝试做散点图,求回归直线方程;(3)能用所学的知识对实际问题进行回归分析,体会回归分析的实际价值与基本思想;了解判断刻画回归模型拟合好坏的方法――相关指数和残差分析。
学习重难点:(1)求回归直线方程,会用所学的知识对实际问题进行回归分析.(2)掌握回归分析的实际价值与基本思想.(3)能运用自己所学的知识对具体案例进行检验与说明.(4)残差变量的解释;(5)偏差平方和分解的思想;学习内容:一、基础知识梳理1.回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。
求回归直线方程的一般步骤:作出散点图(由样本点是否呈条状分布来判断两个量是否具有线性相关关系),若存在线性相关关系→②求回归系数→③写出回归直线方程,并利用回归直线方程进行预测说明.2.回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法。
建立回归模型的基本步骤是:①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;②画好确定好的解释变量和预报变量的散点图,观察它们之间的关系(线性关系)③由经验确定回归方程的类型.④按一定规则估计回归方程中的参数(最小二乘法);⑤得出结论后在分析残差图是否异常,若存在异常,则检验数据是否有误,后模型是否合适等.3.利用统计方法解决实际问题的基本步骤:(1)提出问题;(2)收集数据;(3)分析整理数据;(4)进行预测或决策。
4.残差变量e的主要来源:(1)用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型到底是什么)所引起的误差。
可能存在非线性的函数能够更好地描述y与x之间的关系,但是现在却用线性函数来表述这种关系,结果就会产生误差。
这种由于模型近似所引起的误差包含在e中。
高中数学3.1《回归分析基本思想及其初步应用(二)》教案新人教版A选修23

3.1 回归剖析的基本思想及其初步应用(二)一、基本说明1所属模块:高中数学选修 2-32年级:高二年级3 教材第一版单位:人民教育第一版社A4所属的章节:第三章第一节5 学时数:40分钟多媒体教室二、教课方案教课目标:经过典型事例的研究,进一步认识回归剖析的基本思想、方法及初步应用.教课要点:经过研究使学生领会有些非线性模型经过变换能够转变为线性回归模型,认识在解决实质问题的过程中找寻更好的模型的方法 .教课难点:认识常用函数的图象特色,选择不一样的模型建模,并经过比较有关指数对不一样的模型进行比较.教课过程:一、复预引入问题 1:成立回归模型的一般基本步骤是哪五步?问题 2:残差及有关指数R2如何对回归方程拟合程度进行剖析?问题 3:依据例 2 所给的样本数据作散点图,并察看散点图,判断样本数据组( x i , y i ) 拥有线性关系吗?二、讲解新课:例 2、一只红铃虫的产孵数y 和温度 x 有关,现采集了7 组数据列于表3-3 中,温度 x/℃21232527293235产卵数 y/个711212466115325(1)试成立产卵数y 与温度 x 之间的回归方程;并展望温度为28o C 时产卵数量。
(2)你所成立的模型中温度在多大程度上解说了产卵数的变化?设计企图:由散点图,联合线性回归模型的回归剖析的基本步新知识生长点。
(学生描绘步骤,教师演示剖析数据,议论拟合函数模型。
)骤,诱出350300250数200卵产 15010050010203040温度研究 1:剖析散点图,预计样本数据组(x i , y i ) 的回归方程的拟合模型。
1、议论:察看右图中的散点图,发现样本点并无散布在某个带状地区内,即两个变量不呈线性有关关系,所以不可以直接用线性回归模型y=ax+b 来成立两个变量之间的关系 .2、研究非线性回归方程确实定:① 假如散点图中的点散布在一个直线状带形地区,能够选线性回归模型来建模;假如散点图中的点散布在一个曲线状带形地区,就需选择非线性回归模型来建模.y=bx 2+a, 也象某一条指数函数曲线y=C1e C2x ② 依据已有的函数知识,能够发现样本点散布象某一条抛物线(此中 c1 ,c2是待定的参数),故可考虑用以上两个模型来拟合两个变量.③抛物型:将 y=bx 2+a 进行平方变换:令 t=x 2,产卵数 y 和温度 x 之间二次函数模型y=bx2+a 就转变为产卵数 y 和温度的平方 t 之间线性回归模型 y=bt+a温度21232527293235温度的平方 t44152962572984110241225产卵数 y / 个711212466115325产卵数 y/ 个350300250200150100t 500150300450600750900 1050 1200 1350察看互换数据后的散点图能够发现抛物线模型的拟合成效不是很好,由于散点图不可一条直线。
人教版高中数学选修2-3 3.1 回归分析的基本思想及其初步应用教案
小结与练习:
1、回归分析的基本思想是什么?
2、如何进行回归分析。
第一个问题由教师讲解,第二个问题由学生齐答。
1、整理本节课所学习到的知识.
2、体会随机数学的特点.
1、由小结再次明确了回归分析的步骤 以及每一步需要注意的地方。
2、注重数学教学中的思想性,它们是贯穿数学教学过程的“灵魂”.
3、后续问题的提出,给 学生留下思维发展的时空和探索余地,激发学生对知识的进一步渴望.
一、将前面1、2问题改为:
1、两个变量之间有哪几种关系?
2、进行线 性回归分析的一般步骤是什么。
二、学生回答完问题后,教师用计算机演示一遍操作。
1、在学生小组讨论的时候,教师适时参与讨论。
2、教师演示用计算机进行回归分析的方法。
学生小组讨论1、2两个问题。通过小组讨论,使得学困生也能对以前的知识有必要的了解。
例2教学:
提供期中考试400多名考生的成绩数据来进行回归分析,再次让学生体会回归分析的魅力。
提供期中考试4பைடு நூலகம்0多名考生的成绩,简单的部分让学生来操作。并让学生来分析回答。后面的部分教师操作。
认真思考,并感受当数据量很大的时候,残差图的特点。更加直观的理解,当残差点均匀分布在一条水平带状区域上时,模型选 取较合适。
必修三和选修1-2这两本书在教学时间上间隔很远,通过有效的复习让学生为后面新知识的讲授打下良好的基础。
问题呈现:
例1 、统计10名高三女生的身高体重数据,汇总后求出根据身高预报体重的回归方程,并随机调查一名高三女生的身高,然后预报体重。
1、要求学生小组讨论统计方案。并对学生提出的方案做出评价
2、找学生代表上台操作。
人教课标版高中数学选修2-3《回归分析基本思想及其初步应用(第1课时)》教学设计
第3章 统计案例3.1 回归分析基本思想及其初步应用第一课时一、教学目标 1.核心素养:通过学习回归分析的基本思想及其初步应用,初步形成基本的数据分析能力. 2.学习目标(1)1.1.1.1 温习散点图,复习相关关系与函数关系.(2)1.1.1.2 理解回归分析的基本思想,会求线性回归方程.(3)1.1.1.3 理解回归模型与函数模型的差别,了解随机误差产生的原因. 3.学习重点线性回归分析的一般步骤,,回归分析的应用. 4.学习难点理解随机误差产生的原因以及函数模型与回归模型的差别. 二、教学设计 (一)课前设计 1.预习任务 任务1阅读教材P 2-P 4,思考求解线性回归方程一般步骤是什么?回归模型和函数模型有何区别?随机误差产生的原因? 任务2什么是解样本中心点,什么是回归分析?2.预习自测 1.两个变量有线性相关关系且正相关,则回归直线方程中,a bx y +=的系数b ( )A.0>bB.0<bC.0=bD.1=b解:A2.在画两个变量的散点图时,下面哪个叙述是正确的( ) A.预报变量在x 轴上,解释变量在y 轴上 B.解释变量在x 轴上,预报变量在y 轴上 C.可以选择两个变量中任意一个变量在x 轴上D.可以选择两个变量中任意一个变量在y 轴上 解:B3.回归直线y bx a =+必过( )A. (0,0)B. (,0)xC. (0,)yD. (,)x y 解:D (二)课堂设计 1.知识回顾(1)线性回归方程:∧∧∧+=a x b y ,其中.1122211()()()n niii ii i nniii i x x y y x y nx yb x x xnx∧====---==--∑∑∑∑, ˆy ab x ∧=- (2)线性相关:如果所有点看上去都在一条直线附近波动,则两个变量间是线性相关,可用一条直线来近似表示(3)非线性相关:若所有点看上去都在某条曲线附近波动,则两个变量间是非线性相关,可用一条曲线来拟合.(4)回归分析:是对具有相关关系的两个变量进行的统计分析的一种常用方法. 2.问题探究问题探究一 相关关系与函数关系是什么,如何画散点图? ●活动一 回顾旧知,回忆相关关系与函数关系在《必修3》中,我们已经学习过函数关系与相关关系,那么什么是函数关系,什么是相关关系?想一想:在以往数学学习和日常生活中,我们接触了哪些函数关系与相关关系? 举例:请大家试着列举生活与学习中的相关例子.例如圆的周长2C r π=,周长C 与半径r 之间就是一种确定性的关系,对于自变量半径的每一个确定的值,都有唯一确定的周长的值与之相对应.又如人的体重y 与身高x ,一般来说,身高越高,体重越重,但不能用一个函数来严格表示它们之间的关系.即变量之间有一定的联系,但取值也具有一定的随机性.即: 1. 函数关系与相关关系 (1) 函数关系是一种确定关系. (2) 相关关系是一种不确定关系.注意:判断两个变量是否具有相关关系,应该先看它们是否有关,再看这种关系是否是确定的函数关系.●活动二 旧知推进,回忆散点图的画法 2. 散点图在分析两个变量的关系时,为了对变量之间的关系有一个大概的了解,我们通常将一个变量的数据作为横坐标,另一个变量的数据作为纵坐标,将这些点描在平面直角坐标系中,形成的图形就是散点图(1)散点图直观反映了实例的成对观测值之间是否存在相关关系和存在什么样的相关关系. (2)若散点图中点的分布由左下方到右上方,则两个变量正相关;点的分析由左上方到右下方,则两个变量负相关问题探究二 线性回归分析步骤是什么?●活动一 通过实例,亲身体验在《必修3》中,我们利用回归分析的方法对两个具有线性相关关系的变量进行了研究,你能利用回归分析对下列实例进行分析吗?例1 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm 的女大学生的体重.【知识点:线性回归方程,回归分析;】详解:(1) 作散点图,由于问题是根据身高预报体重,因此要求身高与体重的回归直线方程,取身高为自变量x ,体重为因变量y ,作散点图:40455055606570150155160165170175180从散点图可以看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用回归直线y =bx +a 来近似刻画它们之间的关系,从而可利用我们学过的最小二乘估计思想及计算公式求得线性回归直线方程.其计算公式如下:1122211()()()n niii ii i nniii i x x y y x y nx yb x x xnx∧====---==--∑∑∑∑,y a b x ∧∧=-其中1211,n n i i x x x x x n n =+++==∑…121y y y 1y y ,nn i i n n=+++==∑…根据上面公式,可以得到712.85,849.0-==∧∧a b 于是得到线性回归方程712.85849.0-=∧x y对于身高172cm 女大学生,由回归方程可以预报体重为)(316.60712.85172849.0kg y =-⨯=∧,预测身高为172cm 的女大学生的体重为约60.316kg.点拨:回归分析的基本过程: (1)画出两个变量的散点图; (2)判断是否线性相关;(3)求回归直线方程(利用最小二乘法); (4)并用回归直线方程进行预报 ●活动二 整理旧知,得出新概念 1.样本中心点对于一组具有线性相关关系的数据1122(,),(,),,(,)n n x y x y x y ,1211,nni i x x x x x n n=+++==∑121y y y 1y y ,nni i n n=+++==∑则称点),y x (为样本点的中心.●活动三 总结反思,得出新结论 由上计算过程可以得出:(1)样本点的中心坐标分别是两个变量的观测数据的算术平均数. (2)点),y x (在回归直线上,即回归直线一定过样本点的中心.问题探究三 线性回归模型与函数模型有何差异,随机误差是怎么产生的??●活动一结合实际,反思结果想一想:身高为172cm 的女大学生的体重一定是60.316kg吗?如果不是,你能解释一下原因吗?答:不一定,但一般可以认为她的体重在60.316kg左右.由样本点和回归直线的相互位置可以说明这一点.从散点图可观察出,女大学生的体重y和身高x之间的关系并不能用一次函数y=bx+a来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61kg,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,这时我们把身高和体重的关系可用下面的线性回归模型y=bx+a+e来表示,其中a和b为模型的未知参数,e称为随机误差.●活动二层层推进,答疑解惑那么,产生随机误差项e的原因是什么呢?实际上,一个人的体重除了受身高影响外,还受其他许多因素的影响,例如饮食习惯、是否喜欢运动、度量误差等.另一方面,没有人知道身高和体重之间的真正关系是什么,现在只是利用线性回归方程来近似这种关系.而这种近似和上面提到的影响因素都会导致随机误差e的产生.即随机误差产生的原因:(1)线性回归方程中的∧b和∧a为估计值,与真实值b和a之间存在误差.(2)影响变量y的因素不止变量x一个,可能还包括许多因素(例如农作物的生长不仅要收日照时间的影响,还会受土壤的肥沃程度,施肥量等影响)(3)观测误差,由于测量工具及测量值一般也存在一定的误差,这样的误差也包含在e中所以随机误差e中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.●活动三新知学习在统计中,我们把自变量x称为解释变量,因变量y称为预报变量.线性回归模型与我们熟知的一次函数模型的不同之处就在于增加了随机误差e,预报变量y的值由解释变量x和随机误差e共同决定,即解释变量x只能解释部分预报变量y的变化3.课堂总结【知识梳理】(1)线性回归方程:∧∧∧+=a x b y ,其中.1122211()()()n niii ii i nniii i x x y y x y nx yb x x xnx∧====---==--∑∑∑∑,a ∧=x b ∧-y(2)回归分析的基本过程:①画出两个变量的散点图;②判断是否线性相关,③求回归直线方程(利用最小二乘法),④并用回归直线方程进行预报(3)对于一组具有线性相关关系的数据1122(,),(,),,(,)n n x y x y x y ,1211,nni i x x x x x n n=+++==∑121y y y 1y y ,nni i n n=+++==∑则称点),y x (为样本点的中心.(4)线性回归模型:y =bx +a +e ,其中a 和b 为模型的未知参数,e 称为随机误差.【重难点突破】(1)利用回归分析的方法对两个具有线性相关关系的变量进行研究的步骤: ①作出散点图 ②求回归直线方程 ③利用所求方程进行预测.(2) 随机误差产生的原因:①线性回归方程中的∧b 和∧a 为估计值,与真实值b 和a 之间存在误差.②影响变量y 的因素不止变量x 一个,可能还包括许多因素(例如农作物的生长不仅要收日照时间的影响,还会受土壤的肥沃程度,施肥量等影响)③观测误差,由于测量工具及测量值一般也存在一定的误差,这样的误差也包含在e 中. 4.随堂检测1.下面两个变量间的关系不是函数关系的是() A.正方体的棱长与体积 B.角的度数与它的正弦值C.单位产量为常数时,土地面积与粮食总产量 D.日照时间与水稻亩产量【知识点:函数关系,相关关系】解:D2. 设有一个回归方程为25.2+-=∧x y ,则变量x 增加一个单位时,y 的值得变化情况是( ) A.平均增加2.5个单位 B.平均增加2个单位 C.平均减少2.5个单位 D.平均减少2个单位【知识点:回归方程,函数】 答案:C3. 为了研究两个变量x 与y 之间的线性相关性,甲、乙两个同学并且利用线性回归方法,求得回归直线分别为1l 和2l ,已知在两个人的试验中发现y x 和分别相等,那么下列说法正确的是( )A.1l 与2l 一定平行B. 1l 与2l 重合C.1l 与2l 相交于点),y x (D.无法判断1l 与2l 是否相交【知识点:回归方程,样本点中心】 答案:C4.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程∧∧∧+=a x b y ,其中 x b y a b ^^,76.0-==∧,据此估计,该社区一户收入为15万元家庭年支出为( ) A. 11.4万元 B. 11.8万元 C.12.0万元 D.12.2万元【知识点:回归方程,回归分析】 答案:B5.已知x 与y 有如下数据:则y 关于x 的回归直线方程∧∧∧+=a x b y 必过点 . 【知识点:回归方程,样本点的中心】 解:(1.5,5) (三)课后作业 基础型 自主突破1.对具有相关关系的两个变量统计分析的一种常用的方法是( ) A.回归分析 B.相关系数分析 C.残差分析 D.相关指数分析 【知识点:回归分析】 解:A2.对于具有线性相关关系的变量x 和y ,由测得的数据已求得回归直线的斜率为 6.5,且恒过点(2,3),则回归直线的方程为 . 【知识点:回归方程,样本点的中心】 解:105.6-=∧x y3.一位母亲记录了儿子3—9岁的身高,数据(略),由此建立的身高与年龄的回归模型为y =7.19x +73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ) A.身高一定是145.83cm B.身高在145.83cm 以上 C.身高在145.83cm 左右 D.身高在145.83cm 以下【知识点:回归方程,回归分析】 答案:C4.为了了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了他某月1号到5号每天打篮球的时间x (单位:小时)与当天投篮命中率y 之间的关系:小李这5天平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为_______.【知识点:回归方程,样本点的中心】 解:0.5,0.53 能力型 师生共研1.在一次实验中,测得(x ,y )的四组值分别是A (1,2)、B (2,3)、C (3,4)、D (4,5),则y 与x 之间的回归直线方程为( )A.1ˆ+=x yB.2ˆ+=x yC.12ˆ+=x yD.1ˆ-=x y【知识点:回归直线方程】 解:A2.如果某地的财政收入x 与支出y 满足线性回归方程e a bx y ++=∧(单位:亿元),其中5.0||,2,8.0≤==e a b ,如果今年该地区财政收入10亿元,则年支出预计不会超过( )A.10亿元B.9亿元C.10.5亿元D.9.5亿元【知识点:回归模型,】解:C 点拨:带入数据,得,10e y +=∧又,5.0||≤e 得5.105.9≤≤∧y . 3.已知y x ,的值如下表所示,若y 与x 具有相关关系且其回归直线方程为,2741x y +=∧则a =( )A.4B.5C. 6D. 7【知识点:回归直线方程】解: A 点拨:又表格求得y x ,的值,带入回归直线方程,建立关于a 的方程求解. 4. 有下列关系:①人的年龄与他(她)拥有的财富之间的关系; ②曲线上的点与该点的坐标之间的关系; ③苹果的产量与气候之间的关系;④森林中的同一种树木,其横断面直径与高度之间的关系, ⑤学生他(她)的学号之间的关系.(填序号) 【知识点:函数关系,相关关系】 答案:①③④ 探究型 多维突破1.下表提供了某厂节能降耗技术改造后,生产甲产品过程中记录的产量x (单位:吨)与相应的能耗y (单位:吨标准煤)的几组对照数据(1)请画出上表数据的散点图.(2)y 与x 是否具有线性相关关系?若是,则求出y 关于x 的线性回归方程.(3)已知该厂技术改造前100吨甲产品的生产能耗为90吨标准煤,试根据(2)中求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤(参考值:5.665.4645345.23=⨯+⨯+⨯+⨯) 【知识点:散点图,相关关系,回归分析】 解:(1)略(2)由散点图可知,各数据点大致分布在一条直线的附近,故具有线性相关关系.计算得86412=∑=i ix,5.6641=∑=i i i y x ,,5.3,5.4==y x 又最小二乘法确定的线性回归方程的参数为.35.0,7.0==∧∧a b 故所求的线性回归方程为35.07.0+=∧x y .(3)由(2)中的线性回归方程及技术改造前100吨甲产品的生产能耗,得降低的生产能耗为65.1935.01007.090=+⨯-)((吨标准煤). (四)自助餐1.下面列两个变量之间呈相关关系的是( ) A.圆的面积与半径 B.球的体积与半径 C.角的度数与它的正切值D.一个考生的数学成绩与物理成绩 【知识点:相关关系】 解:D2.下列关于回归分析说法错误的是( ) A.回归分析是研究两个具有相关关系的变量的方法 B.在散点图中,解释变量在x 轴,预报变量在y 轴 C.回归模型中一定存在随机误差 D.散点图能明确反映变量间的关系 【知识点:回归分析】 解:D3.已知变量x 与y 正相关,且由观测数据算得样本平均数5.3,3==y x ,由此该观测数据算得的线性回归方程可能是( ) A.3.24.0+=∧x y B.4.2-2x y =∧ C.5.92-+=∧x y D.4.43.0-+=∧x y【知识点:回归方程,样本点中心】 解:A4.为了了解儿子身高与父亲身高的关系,随机抽取5对父子的身高数据如下则y 对于x 的线性回归方程为( )A.1+=∧x y B.1+=∧x y C.885.0+=∧x y D.12+=∧x y【知识点:回归方程】 解:C5.小李同学根据下表记录的产量x (吨)和能耗y (吨标准煤)对应的四组数据,用最小二乘法求出了y 对于x 的线性回归方程是070.35y x ∧=+.,之后不慎将一滴墨水滴于表内,表中第二行第四列的数据已经无法看清,据你判断这个数据应该是( )A.3.5B.3.75C. 4D. 4.25【知识点:回归方程,样本点中心】 解:C6.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且623.0-347.2x y =∧;②y 与x 负相关且648.5476.3-+=∧x y ;③y 与x 正相关且493.8437.5+=∧x y ;④y 与x 正相关且578.4-326.4-x y =∧. 其中一定不正确的结论序号是( ) A.①② B.②③ C.③④ D.①④【知识点:回归方程,正相关、负相关】 解:D7.若施化肥量x 与小麦产量y 之间的回归直线方程为x y 4250ˆ+=,当施化肥量为50kg 时,预计小麦产量为__________.解析:当50=x 时,450450250ˆ=⨯+=y . 答案:kg 450.8.年或者更少教育的百分比(x )和收入低于官方规定的贫困线人数占本地区的人数的百分比(y )的数据,建立的回归直线方程6.48.0+=∧x y ,斜率的估计值为0.8,说明__________;成年人受过9年或者更少教育的百分比(x )与收入低于官方规定的贫困线的人数占本地区人数的百分比(y )之间的相关系数__________(填“大于0”或“小于0”). 【知识点:回归方程,回归分析】解:一个地区受过9年或者更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本地区人数的百分比将增加0.8%左右 大于0.9.对具有线性相关关系的变量x ,y 有一组观测数据),8,,2,1)(, =i y x i i (其回归直线方程是a x y +=∧31,且,6)(2821821=+++=+++y y y x x x 则实数a 的值是__________. 【知识点:回归方程,回归分析】解:8110.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y bx a ∧=+,其中20-=b ,a y bx =-;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本) 【知识点:回归方程,相关关系,回归分析】解:(1)由于x =16(x 1+x 2+x 3+x 4+x 5+x 6)=8.5,y =16(y 1+y 2+y 3+y 4+y 5+y 6)=80,所以a =y -b x =80+20×8.5=250,从而回归直线方程为y =-20x +250. (2)设工厂获得的利润为L 元,依题意得L =x (-20x +250)-4(-20x +250)=-20x 2+330x -1 000=-20(x-334)2+361.25, 当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可获得最大利润.11. 下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 参考数据:719.32i i y ==∑,7140.17i i i t y ==∑,()7210.55i i y y=-=∑,7≈2.646.参考公式:相关系数1221t)(y y)(t t)(y y)niii niii r ==--=--∑∑回归方程 中斜率和截距的最小二乘估计公式分别为: 121(t t)(y y)(t t)niii ni i b ∧==--=-∑∑,a y b t =-【知识点:回归方程,相关关系,回归分析】 解:(1)由折线图这数据和附注中参考数据得4=t ,28)(712=-∑=i i t t ,55.0)(712=-∑=i iy y,89.232.9417.40))((717171=⨯-=-=--∑∑∑===i i i iii i iy t yt y y t t,99.0646.2255.089.2≈⨯⨯≈r .因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由9.321.3317y =≈及(1)得7121()()2.890.10328()iii ni i t t y y b t t ∧==--==≈-∑∑, 92.04103.0331.1ˆˆ≈⨯-≈-=t b y a .所以,y 关于t 的回归方程为:t y10.092.0ˆ+=. 将2016年对应的9=t 代入回归方程得:82.1910.092.0ˆ=⨯+=y. 所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.。
人教A版选修23教案:3.1回归分析的基本思想及其初步应用第1课时含反思
§3.1 回归分析的基本思想及其初步(1)【学情分析】:教学对象是高二理科学生,学生已经初步学会用最小二乘法建立线性回归模型的知识,并能用所学知识解决一些简单的实际问题。
回归分析是数理统计中的重要内容,在教学中,要结合实例进行相关性检验,理解只有两个变量相关性显著时,回归方程才具有实际意义。
在起点低的班级中注重让学生参与实践,结合画图表的方法整理数据,鼓励学生通过收集数据,经历数据处理的过程,从而认识统计方法的特点,达到学习的目的。
【教学目标】:(1)知识与技能:回忆线性回归模型与函数模型的差异,理解用最小二乘法求回归模型的步骤,了解判断两变量间的线性相关关系的强度——相关系数。
(2)过程与方法:本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线方程。
(3)情感态度与价值观:从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求知欲,培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进取。
【教学重点】:1.了解线性回归模型与函数模型的差异;2.了解两变量间的线性相关关系的强度——相关系数。
【教学难点】:1.了解两变量间的线性相关关系的强度——相关系数;2.了解线性回归模型与一次函数模型的差异。
∑n练习与测试1. 设有一个回归方程为x y5.22ˆ-=,则变量x 增加一个单位时,则( C ) A.y 平均增加5.2个单位 B .y 平均增加2个单位 C .y 平均减少5.2个单位 D .y 平均减少2个单位 2. 在画两个变量的散点图时,下面哪个叙述是正确的( B )A .预报变量在x 轴上,解释变量在y 轴上B .解释变量在x 轴上,预报变量在y 轴上C .可以选择两个变量中任意一个变量在x 轴上D .可以选择两个变量中任意一个变量在y 轴上 3. 已知x 与y则y 与x 的线性回归方程为a x b yˆˆ+=必过( D ) A .(2,2)点 B .(1.5,0)点 C .(1,2)点 D .(1.5,4)点4. 已知两个相关变量x 与y 具有线性相关关系,当x 取值1,2,3,4时,通过观测得到y 的值分别为1.2,4.9,8.1,12.8,这组样本点的中心是( D )A .(2,4.9)B .(3,8.1)C .(2.5,7)D .(2.5,6.75)5. 一位母亲记录了儿子3—9岁的身高,数据(略),由此建立的身高与年龄的回归模型为y=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( C )A .身高一定是145.83cmB .身高在145.83cm 以上C .身高在145.83cm 左右D .身高在145.83cm 以下6. 在一次实验中,测得(x ,y )的四组值分别是A (1,2)、B (2,3)、C (3,4)D (4,5),则y 与x之间的回归直线方程为( A )A .1ˆ+=x yB .2ˆ+=x yC .12ˆ+=x yD . 1ˆ-=x y 7. 有下列关系:⑴人的年龄与其拥有的财富之间的关系;⑵曲线上的点与该点的坐标之间的关系;⑶苹果的产量与气候之间的关系;⑷森林中的同一树木,其横截面直径与高度之间的关系;⑸学生与其学号之间的关系。
人教新课标版数学高二人教A选修2-3教案 回归分析的基本思想及其初步应用(1)(讲)
3.1.1回归分析的基本思想及其初步应用【教学目标】1.了解回归分析的基本思想方法及其简单应用.2.会解释解释变量和预报变量的关系.【教学重难点】教学重点:回归分析的应用. 教学难点:a 、b 公式的推到. 【教学过程】 一、设置情境,引入课题引入:对于一组具有线性相关关系的数据112233(,),(,),(,),,(,).n n x y x y x y x y 其回归直线方程的截距和斜率的最小二乘法估计公式分别为:a y bx =-121()()()niii nii x x y y b x x ==--=-∑∑11n i i x x n ==∑11ni i y y n ==∑(,)x y 称为样本点的中心。
如何推到着两个计算公式?二、引导探究,推出公式从已经学过的知识,截距a 和斜率b 分别是使21(,)()niii Q y x αββα==--∑取最小值时,αβ的值,由于212212211(,)[((]{[(2[([(][(]}[(2[([(](ni i i ni i i i i nni i i i i i Q y x y x y x y x y x y x y x y x y x y x y x y x y x y x n y x αββββαβββββαβαβββββαβα=====-----=---+-----+--=---+-----+--∑∑∑∑)+))])])))])]))因为1111[((([(([(]([(]0,nniiiii i n ni i i i y x y x y x y x y x y x y x y x n y x y x ny n x n y x βββαβαβββαβββαββ====-----=-----=-----=-----=∑∑∑∑)])))]))))所以2212222111222221122111[([(]()2()()()(()()[()()](()[]()()()ni i i nn nii i i i i i nniii i ni i i i nni i iii i Q y x y x n y x x x x x y y y y n y x x x y y x x y y n y x x x y y x x x x αββββαβββαβαβ==========---+--=----+-+------=--+---+---∑∑∑∑∑∑∑∑∑(,))])))1n=∑ 上式中,后两项和,αβ无关,而前两项为非负数,因此要使Q 取得最小值,当且仅当前两项的值均为0.,即有121()()()niii nii x x y y x x β==--=-∑∑y x αβ=-通过上式推导,可以训练学生的计算能力,观察分析能力,能够很好训练学生数学能力,必须在老师引导下让学生自己推出。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(x 2 ,y 2 )……,(x n ,y n ),我们知道其回归方程的截距和斜率的最小二乘
^ ^
估计公式分别为: a = y + b x ,
复习统计方法 解决问题的基本过 程。
n
^
(xi x)( yi y)
b = i1
n
(xi x)2
③由方程求出当 x = 172 时,y 的值。 生:思考、讨论、叙述自己的理解,归纳出题目中的信息。 根据以前所学的知识,让学生自己动手求出回归方程 求解过程如下: ①画出散点图,判断身高 x 与体重 y 之间存在什么关系(线性关系)
?
70
65
60
55
50
45
40
150
155
160
165
170
175
实践,结合画图表的方法整理数据,鼓励学生通过收集数据,经历数据处理的过程,从而认识统计方法
的特点,达到学习的目的。
【教学目标】:
( 1)知识与技能: 回忆线性回归模型与函数模型的差异,理解用最小二乘法求回归模型的步骤,
了解判断两变量间的线性相关关系的强度——相关系数。
( 2)过程与方法: 本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归
直线方程。
( 3)情感态度与价值观: 从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求
知欲,培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生
积极进取。
【教学重点】:
1. 了解线性回归模型与函数模型的差异;
2. 了解两变量间的线性相关关系的强度——相关系数。
【教学难点】:
1. 了解两变量间的线性相关关系的强度——相关系数;
n
Q(α,β)= ( yi xi )2 取最小值时 α,β 的值。 i 1
由于
n
Q(α,β)= [y i xi ( y x) ( y x) [2
i 1
学生经历数据 处理的过程,并借 助 EXCEL 的统计功 能鼓励学生使用计 算器或计算机等现 代工具来处理数据。
=
n[y i xi ( y x)[2 2[y i xi ( y x)[
相关关系)
生:思考、讨论。
问题二:统计方法解决问题的基本过程是什么?
复习回归分析
师:提出问题,引导学生回忆用最小二乘法求回归直线方程的方法。 的解题步骤
二、例题 选讲
生:回忆、叙述 回归分析的基本过程:⑴画出两个变量的散点图;
⑵判断是否线性相关 ⑶求回归直线方程(利用最小二乘法) ⑷并用回归直线方程进行预报
i 1
i 1
i 1
+n ( y x )2
n
n
(xi x)( yi y)
=n( y x )2 + (xi x)[2 i1 n
[2
i 1
(xi x)2
i 1
n
[ (xi x)( yi y)[2
- i1
n
(xi x)2
i 1
n
+ ( yi y)2
i 1
在上式中,后两项和 α,β 无关,而前两项为非负数,因此要 Q 取得 最小值,当且仅当前两项的值均为 0,即有
i1 ( y x) [ [ ( y x) [2[
n
n
= [y i xi ( y x)[2 +2 [y i xi ( y x)[( y x ) +
i 1
i 1
n( y -β x -α) 2 ,
注意到
n
[y i xi ( y x)[( y y i xi ( y x)[
2. 了解线性回归模型与一次函数模型的差异。
【教学过程设计】:
教学环节
教学活动
设计意图
一、创设 问题一:一般情况下,体重与身高有一定的关系,通常个子较高的人体
复习回归分析
情境
重比较大,但这是否一定正确?(是否存在普遍性)
用于解决什么样的
师:提出问题,引导学生判断体重与身高之间的关系(函数关系、 问题。
编号 身高/cm 体重/kg
1
2
3
4
5
6
7
8
165 165 157 170 175 165 155 170
48 57 50 54 64 61 43 59
题目中表达了哪些信息? 师:读例 1 的要求,引导学生理解例题含义。 (例题含义:①数据体重与身高之间是一种不确定性的关系
②求出以身高为自变量 x,体重为因变量 y 的回归方 程。
n
(xi x)( yi y)
β= i1
,
n
(xi x)2
i 1
α= y x .
这正是我们所要推导的公式。 下面我们通过案例,进一步学习学习回归分析的基本思想及其应用。
问题三:思考例 1:从某大学中随机选取 8 名女大学生,其身高和体重 数据如表所示。求根据一名女大学生的身高预报她的体重的回归方程, 并预报一名身高为 172cm 的女大学生的体重。
§3.1 回归分析的基本思想及其初步(1)
【学情分析】:
教学对象是高二理科学生,学生已经初步学会用最小二乘法建立线性回归模型的知识,并能用所学
知识解决一些简单的实际问题。回归分析是数理统计中的重要内容,在教学中,要结合实例进行相关性
检验,理解只有两个变量相关性显著时,回归方程才具有实际意义。在起点低的班级中注重让学生参与
i 1
1 n
1n
其中 x = n
i1 xi , y = n
yi .( x , y )称为样本点的中心。你能推导出
i 1
学生动手画散 点图,老师用 EXCEL 的作图工作 演示,并引导学生 找出两个变量之间 的关系。
这两个计算公式吗?
^
^
从已经学过的知识我们知道,截距 a 和斜率 b 分别是使
180
②列表求出相关的量,并求出线性回归方程
n
代入公式有 bˆ
xi yi nxy
i1
n
xi2 nx 2
72315 8 165.25 54.5 218774 8 165.252
0.848
i1
aˆ y bx 54.5 0.849 165.25 85.712
所以回归方程为 yˆ aˆ bˆx 0.849x 85.712
i 1
n
n
=( y x )[ yi xi n( y x) ]
i 1
i 1
=( y x ) [n y n x n( y x) ]=0,
所以
n
Q(α,β)= [y i xi ( y x)[2 + n( y x ) 2
i 1
n
n
n
=β 2 (xi x)2 - 2β (xi x)( yi y) + ( yi y)2