高中新课程数学(新课标人教A版)选修1-2《1.1回归分析的基本思想及其初步应用》教案2
新课标人教a版选修1-2教案

1.1回归分析的基本思想及其初步应用(一)教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析.教学难点:解释残差变量的含义,了解偏差平方和分解的思想.教学过程:一、复习准备:1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→求回归直线方程→利用方程进行预报.二、讲授新课:1. 教学例题:体重.(分析思路→教师演示→学生整理)第一步:作散点图第二步:求回归方程 第三步:代值计算 ② 提问:身高为172cm 的女大学生的体重一定是60.316kg 吗?不一定,但一般可以认为她的体重在60.316kg 左右.③ 解释线性回归模型与一次函数的不同事实上,观察上述散点图,我们可以发现女大学生的体重y 和身高x 之间的关系并不能用一次函数y bx a =+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm 的3名女大学生的体重分别为48kg 、57kg 和61kg ,如果能用一次函数来描述体重与身高的关系,那么身高为165cm 的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e (即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e =++,其中残差变量e 中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.3. 小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.1.1回归分析的基本思想及其初步应用(二)教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学难点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学过程:一、复习准备:1.由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响.2.为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.二、讲授新课:1. 教学总偏差平方和、残差平方和、回归平方和:(1)总偏差平方和:所有单个样本值与样本均值差的平方和,即21()ni i SST y y ==-∑.残差平方和:回归值与样本值差的平方和,即21()ni i i SSE y y ==-∑. 回归平方和:相应回归值与样本均值差的平方和,即21()ni i SSR y y ==-∑. (2)学习要领:①注意i y 、 i y 、y 的区别;②预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和,即 222111()()()n n ni i i i i i i y y y y y y ===-=-+-∑∑∑;③当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;④对于多个不同的模型,我们还可以引入相关指数 22121()1()n i i i ni i y y R yy ==-=--∑∑来刻画回归的效果,它表示解释变量对预报变量变化的贡献率. 2R 的值越大,说明残差平方和越小,也就是说模型拟合的效果越好.2. 教学例题:为了对x 、Y 两个变量进行统计分析,现有以下两种线性模型: 6.517.5y x =+,717y x =+,试比较哪一个模型拟合的效果更好.分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论.(答案: 52211521()155110.8451000()i i i ii y y R y y ==-=-=-=-∑∑,221R =- 521521()18010.821000()i i i i i y y y y ==-=-=-∑∑,84.5%>82%,所以甲选用的模型拟合效果较好.)3. 小结:分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果的好坏.1.1回归分析的基本思想及其初步应用(三)教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法.教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较.教学过程:一、复习准备:1. 给出例3:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间的回归方程.2. 讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系. 二、讲授新课: 1. 探究非线性回归方程的确定: ① 如果散点图中的点分布在一个直线状带形区域,可以选线性回归模型来建模;如果散点图中的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模.② 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y =2C 1e x C 的周围(其中12,c c 是待定的参数),故可用指数函数模型来拟合这两个变量.③ 在上式两边取对数,得21ln ln y c x c =+,再令ln z y =,则21ln z c x c =+,而z 与x 间的关系线的附近,因此可以用线性回归方程来拟合. ④ 利用计算器算得 3.843,0.272a b =-=,z 与x 间的线性回归方程为0.272 3.843z x =- ,因此红铃虫的产卵数对温度的非线性回归方程为 0.272 3.843x y e -=.⑤ 利用回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行.其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题.2. 小结:用回归方程探究非线性回归问题的方法、步骤.三、巩固练习:(1(2)试求出预报变量对解释变量的回归方程.(答案:所求非线性回归方程为0.69 1.112ˆy=e x +.)1.1回归分析的基本思想及其初步应用(四)教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法,了解可用残差分析的方法,比较两种模型的拟合效果.教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较.教学过程:一、复习准备:1. 提问:在例3中,观察散点图,我们选择用指数函数模型来拟合红铃虫的产卵数y 和温度x 间的关系,还可用其它函数模型来拟合吗?2. 讨论:能用二次函数模型234y c x c =+来拟合上述两个变量间的关系吗?(令2t x =,则34y c t c =+,此时y 与t 间的关系如下:直线的周围,因此不宜用线性回归方程来拟合它,即不宜用二次曲线234y c x c =+来拟合y 与x 之间的关系. )小结:也就是说,我们可以通过观察变换后的散点图来判断能否用此种模型来拟合. 事实上,除了观察散点图以外,我们也可先求出函数模型,然后利用残差分析的方法来比较模型的好坏.二、讲授新课:1. 教学残差分析:① 残差:样本值与回归值的差叫残差,即 i ii e y y=-. ② 残差分析:通过残差来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析.③ 残差图:以残差为横坐标,以样本编号,或身高数据,或体重估计值等为横坐标,作出的图形称为残差图. 观察残差图,如果残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,模型拟合精度越高,回归方程的预报精度越高.2. 例3中的残差分析:计算两种模型下的残差一般情况下,比较两个模型的残差比较困难(某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反),故通过比较两个模型的残差的平方和的大小来判断模型的拟合效果. 残差平方和越小的模型,拟合的效果越好.由于两种模型下的残差平方和分别为1450.673和15448.432,故选用指数函数模型的拟合效果远远优于选用二次函数模型. (当然,还可用相关指数刻画回归效果)3. 小结:残差分析的步骤、作用三、巩固练习:练习:教材P13第1题1.2独立性检验的基本思想及其初步应用(一)教学要求:通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的实施步骤与必要性.教学重点:理解独立性检验的基本思想及实施步骤.K的含义.教学难点:了解独立性检验的基本思想、了解随机变量2教学过程:一、复习准备:回归分析的方法、步骤,刻画模型拟合效果的方法(相关指数、残差分析)、步骤.二、讲授新课:1. 教学与列联表相关的概念:①分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量. 分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级,等等. 分类变量的取值有时可用数字来表示,但这时的数字除了分类以外没有其他的含义. 如用“0”表示“男”,用“1”表示“女”.②列联表:分类变量的汇总统计表(频数表). 一般. 如吸烟与患肺癌的列联表:称为222. 教学三维柱形图和二维条形图的概念:由列联表可以粗略估计出吸烟者和不吸烟者患肺癌的可能性存在差异.(教师在课堂上用EXCEL软件演示三维柱形图和二维条形图,引导学生观察这两类图形的特征,并分析由图形得出的结论)3. 独立性检验的基本思想:①独立性检验的必要性(为什么中能只凭列联表的数据和图形下结论?):列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用列联表检验的方法确认所得结论在多大程度上适用于总体.第一步:提出假设检验问题H0:吸烟与患肺癌没有关系↔H1:吸烟与患肺癌有关系第二步:选择检验的指标22()K()()()()n ad bca b c d a c b d-=++++(它越小,原假设“H:吸烟与患肺癌没有关系”成立的可能性越大;它越大,备择假设“H1:吸烟与患肺癌有关系”成立的可能性越大.1.2独立性检验的基本思想及其初步应用(二)教学要求:通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的实施步骤与必要性.教学重点:理解独立性检验的基本思想及实施步骤.教学难点:了解独立性检验的基本思想、了解随机变量2K的含义.教学过程:教学过程:一、复习准备:独立性检验的基本步骤、思想二、讲授新课:1. 教学例1:例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?①第一步:教师引导学生作出列联表,并分析列联表,引导学生得出“秃顶与患心脏病有关”的结论;第二步:教师演示三维柱形图和二维条形图,进一步向学生解释所得到的统计结果;第三步:由学生计算出2K的值;第四步:解释结果的含义.②通过第2个问题,向学生强调“样本只能代表相应总体”,这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其它的证据表明可以进行这种推广.2. 教学例2:例2 为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:由表中数据计算得到的观察值. 在多大程度上可以认为高中生的性别与是否数学课程之间有关系?为什么?(学生自练,教师总结)强调:①使得2( 3.841)0.05P K ≥≈成立的前提是假设“性别与是否喜欢数学课程之间没有关系”.如果这个前提不成立,上面的概率估计式就不一定正确;②结论有95%的把握认为“性别与喜欢数学课程之间有关系”的含义;③在熟练掌握了两个分类变量的独立性检验方法之后,可直接计算2K 的值解决实际问题,而没有必要画相应的图形,但是图形的直观性也不可忽视.3. 小结:独立性检验的方法、原理、步骤 三、巩固练习: 某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:请问有多大把握认为“高中生学习状况与生理健康有关”?2.1.1 合情推理(一)教学要求:结合已学过的数学实例,了解归纳推理的含义,能利用归纳进行简单的推理,体会并认识归纳推理在数学发现中的作用.教学重点:能利用归纳进行简单的推理.教学难点:用归纳进行推理,作出猜想.教学过程:一、新课引入:1. 哥德巴赫猜想:观察4=2+2, 6=3+3, 8=5+3, 10=5+5, 12=5+7, 12=7+7, 16=13+3, 18=11+7, 20=13+7, ……, 50=13+37, ……, 100=3+97,猜测:任一偶数(除去2,它本身是一素数)可以表示成两个素数之和. 1742年写信提出,欧拉及以后的数学家无人能解,成为数学史上举世闻名的猜想. 1973年,我国数学家陈景润,证明了充分大的偶数可表示为一个素数与至多两个素数乘积之和,数学上把它称为“1+2”.2. 费马猜想:法国业余数学家之王—费马(1601-1665)在1640年通过对020213F =+=,121215F =+=,2222117F =+=,32321257F =+=,4242165537F =+=的观察,发现其结果都是素数,于是提出猜想:对所有的自然数n ,任何形如221n n F =+的数都是素数. 后来瑞士数学家欧拉,发现5252142949672976416700417F =+==⨯不是素数,推翻费马猜想.3. 四色猜想:1852年,毕业于英国伦敦大学的弗南西斯.格思里来到一家科研单位搞地图着色工作时,发现了一种有趣的现象:“每幅地图都可以用四种颜色着色,使得有共同边界的国家着上不同的颜色.”,四色猜想成了世界数学界关注的问题.1976年,美国数学家阿佩尔与哈肯在美国伊利诺斯大学的两台不同的电子计算机上,用1200个小时,作了100亿逻辑判断,完成证明.二、讲授新课:1. 教学概念:① 概念:由某类事物的部分对象具有某些特征,推出该类事物的全部对象都具有这些特征的推理,或者由个别事实概括出一般结论的推理,称为归纳推理. 简言之,归纳推理是由部分到整体、由个别到一般的推理.② 归纳练习:(i )由铜、铁、铝、金、银能导电,能归纳出什么结论?(ii )由直角三角形、等腰三角形、等边三角形内角和180度,能归纳出什么结论?(iii )观察等式:2221342,13593,13579164+==++==++++==,能得出怎样的结论? ③ 讨论:(i )统计学中,从总体中抽取样本,然后用样本估计总体,是否属归纳推理? (ii )归纳推理有何作用? (发现新事实,获得新结论,是做出科学发现的重要手段)(iii )归纳推理的结果是否正确?(不一定)2. 教学例题:① 出示例题:已知数列{}n a 的第1项12a =,且1(1,2,)1n n na a n a +==+ ,试归纳出通项公式. (分析思路:试值n =1,2,3,4 → 猜想n a →如何证明:将递推公式变形,再构造新数列)② 思考:证得某命题在n =n 0时成立;又假设在n =k 时命题成立,再证明n =k +1时命题也成立. 由这两步,可以归纳出什么结论? (目的:渗透数学归纳法原理,即基础、递推关系) ③ 练习:已知(1)0,()(1)1,f af n bf n ==-= 2,0,0n a b ≥>>,推测()f n 的表达式.3. 小结:①归纳推理的药店:由部分到整体、由个别到一般;②典型例子:哥德巴赫猜想的提出;数列通项公式的归纳.三、巩固练习:1. 练习:教材P 38 1、2题.2. 作业:教材P 44 习题A 组 1、2、3题.2.1.1合情推理(二)教学要求:结合已学过的数学实例,了解合情推理的含义,能利用归纳和类比等进行简单的推理,体会并认识合情推理在数学发现中的作用.教学重点:了解合情推理的含义,能利用归纳和类比等进行简单的推理.教学难点:用归纳和类比进行推理,作出猜想.教学过程:一、复习准备:1. 练习:已知 0(1,2,,)i a i n >= ,考察下列式子:111()1i a a ⋅≥;121211()()()4ii a a a a ++≥;123123111()()()9iii a a a a a a ++++≥. 我们可以归纳出,对12,,,n a a a 也成立的类似不等式为 . 2. 猜想数列1111,,,,13355779--⨯⨯⨯⨯ 的通项公式是 . 3. 导入:鲁班由带齿的草发明锯;人类仿照鱼类外形及沉浮原理,发明潜水艇;地球上有生命,火星与地球有许多相似点,如都是绕太阳运行、扰轴自转的行星,有大气层,也有季节变更,温度也适合生物生存,科学家猜测:火星上有生命存在. 以上都是类比思维,即类比推理.二、讲授新课:1. 教学概念:① 概念:由两类对象具有某些类似特征和其中一类对象的某些已知特征,推出另一类对象也具有这些特征的推理. 简言之,类比推理是由特殊到特殊的推理.② 类比练习:(i )圆有切线,切线与圆只交于一点,切点到圆心的距离等于半径. 由此结论如何类比到球体? (ii )平面内不共线的三点确定一个圆,由此结论如何类比得到空间的结论?(iii )由圆的一些特征,类比得到球体的相应特征. (教材P81 探究 填表)小结:平面→空间,圆→球,线→面.③ 讨论:以平面向量为基础学习空间向量,试举例其中的一些类比思维.2. 教学例题:思维:直角三角形中,090C ∠=,3条边的长度,,a b c ,2条直角边,a b 和1条斜边c ; →3个面两两垂直的四面体中,090PDF PDE EDF ∠=∠=∠=,4个面的面积123,,S S S 和S 3个“直角面”123,,S S S 和1个“斜面”S . → 拓展:三角形到四面体的类比. 3. 小结:归纳推理和类比推理都是根据已有的事实,经过观察、分析、比较、联想,再进行归纳、类比,然后提出猜想的推理,统称为合情推理.三、巩固练习:1. 练习:教材P 38 3题. 2. 探究:教材P 35 例5 3.作业:P 44 5、6题.2.1.2 演绎推理教学要求:结合已学过的数学实例和生活中的实例,体会演绎推理的重要性,掌握演绎推理的基本方法,并能运用它们进行一些简单的推理。
新课标人教A版高中数学选修1-2 《1.1 回归分析的基本思想及其初步应用》(共45张PPT)

n
n
ˆ = 0.849是回归直线的斜率的估计值,说明身高x b 每增加1个单位,体重y就增加0.849个单位,这表明体重 与身高具有正的线性相关关系.
图1.1 1
ˆ 和a ˆ, 未知参数 b 和 a 的最小二乘估计分别为 b 其计算公式如下:
ˆ b
x
i 1 n
n
i
x yi y
i
x
i 1
x
,
2
ˆ x, ˆ = y-b a
1 1 其中 x = xi ,y = yi . x,y 称为样本点 的 中心 . n i=1 n i=1
思考:如何发现数据中的错误?如何衡量模型的拟 合效果? 可以通过残差发现原始数据中的可疑数据,判 断所建立模型的拟合效果.下表列出了女大学生身 高和体重的原始数据以及相应的残差数据.
编号 1 2 3 4 170 5 6 7 155 8 170
身 高 / cm 165
165 157
175 165
体 重 / kg 48 57Fra bibliotek50 54 64 61 43 59 ˆ 6 .373 2 .627 2 .419 4 .618 1 .137 6 .627 2 .883 0 .382 残 差e
我们可以利用图形来分析残差特性.作图时纵 坐标为残差, 横坐标可以选为样本编号, 或身高数据, 或 体重估计值等, 这样作出的图形为残差图.下图 是以 样本编号为横坐标的残差图.
所以 ,对身高为 172 cm的女大学生 , 由回归方程可以 预报其体重为 ˆ = 0.849 172 - 85.712 = 60.316 ( kg) . y
人教版高中数学选修1-2(A版)课件:第一章 1.1回归分析的基本思想及其初步应用 (共93张PPT)

昨日的明天是今天。明天的昨日是今天。为什么要计较于过去呢(先别急着纠正我的错误,你确实可以在评判过去中学到许多)。但是我发现有的人过分地瞻前顾后了。为 何不想想“现在”呢?为何不及时行乐呢?如果你的回答是“不”,那么是时候该重新考虑一下了。成功的最大障碍是惧怕失败。这些句子都教育我们:不要惧怕失败。如 果你失败了他不会坐下来说:“靠,我真失败,我放弃。”并且不是一个婴儿会如此做,他们都会反反复复,一次一次地尝试。如果一条路走不通,那就走走其他途径,不 断尝试。惧怕失败仅仅是社会导致的一种品质,没有人生来害怕失败,记住这一点。宁愿做事而犯错,也不要为了不犯错而什么都不做。不一定要等到时机完全成熟才动手。 开头也许艰难,但是随着时间的流逝,你会渐渐熟悉你的事业。世上往往没有完美的时机,所以当你觉得做某事还不是时候,先做起来再说吧。喜欢追梦的人,切记不要被 梦想主宰;善于谋划的人,切记空想达不到目标;拥有实干精神的人,切记选对方向比努力做事重要。太阳不会因为你的失意,明天不再升起;月亮不会因为你的抱怨,今 晚不再降落。蒙住自己的眼睛,不等于世界就漆黑一团;蒙住别人的眼睛,不等于光明就属于自己!鱼搅不浑大海,雾压不倒高山,雷声叫不倒山岗,扇子驱不散大雾。鹿 的脖子再长,总高不过它的脑袋。人的脚指头再长,也长不过他的脚板。人的行动再快也快不过思想!以前认为水不可能倒流,那是还没有找到发明抽水机的方法;现在认 为太阳不可能从西边出来,这是还没住到太阳从西边出来的星球上。这个世界只有想不到的,没有做不到的!不是井里没有水,而是挖的不够深;不是成功来的慢,而是放 弃速度快。得到一件东西需要智慧,放弃一样东西则需要勇气!终而复始,日月是也。死而复生,四时是也。奇正相生,循环无端,涨跌相生,循环无端,涨跌相生,循环 无穷。机遇孕育着挑战,挑战中孕育着机遇,这是千古验证了的定律!种子放在水泥地板上会被晒死,种子放在水里会被淹死,种子放到肥沃的土壤里就生根发芽结果。选
高中数学人教a版选修1-2课件:第一章 1.1 回归分析的基本思想及其初步应用

(3)线性回归模型 线性回归模型用 y=bx+a+e 来表示,其中 a 和 b 为模型 的 未知参数,e 称为随机误差. (4)刻画回归效果的方式 残差 把随机误差的估计值^ e i 称为相应 于点(xi,yi)的残差 作图时纵坐标为 残差 ,横坐标 残差图 可以选为样本编号,或身高数 据,或体重估计值等,这样作出 的图形称为残差图
(2)所有的两个相关变量都可以求回归 方程吗?
Hale Waihona Puke 提示:不一定.2.归纳总结,核心必记 (1)回归分析 回归分析是对具有 相关关系 的两个变量进行统计分 析的一种常用方法. (2)回归直线方程 方程^ y =^ b x+^ a 是两个具有线性相关关系的变量的一 组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中^ a, ^ b 是待定参数,其最小二乘估计分别为:
xiyi 60 160 300 300 560 1 380
5 25 250 所以, x = =5, y = =50, x2 i =145, 5 5 i= 1
xiyi=1 380.
i= 1
5
x- y xiyi-5- 于是可得^ b=
i= 1 5 2 x2 i -5 x i= 1
5
1 380-5×5×50 = =6.5, 2 145-5×5 ^ a =- y -^ b- x =50-6.5×5=17.5. 所以所求的线性回归方程为^ y =6.5x+17.5.
n 2 (2)计算 x , y , xi , xiyi; i= 1 i= 1
n
(3)代入公式计算^ a ,^ b 的值; (4)写出线性回归方程.
讲一讲 1.(链接教材 P2-例 1)某种产品的广告费用支出 x 与 销售额 y(单位:百万元)之间有如下的对应数据: x/百万元 2 4 5 6 8
人教版高中数学选修(1-2)-1.1《回归分析的基本思想及其初步应用》教学教案

1.1回归分析的基本思想及其初步应用学习目标:(1)通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤;了解线性回归模型与函数模型的区别;(2)尝试做散点图,求回归直线方程;(3)能用所学的知识对实际问题进行回归分析,体会回归分析的实际价值与基本思想;了解判断刻画回归模型拟合好坏的方法――相关指数和残差分析。
学习重难点:(1)求回归直线方程,会用所学的知识对实际问题进行回归分析.(2)掌握回归分析的实际价值与基本思想.(3)能运用自己所学的知识对具体案例进行检验与说明.(4)残差变量的解释;(5)偏差平方和分解的思想;学习内容:一、基础知识梳理1.回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。
求回归直线方程的一般步骤:作出散点图(由样本点是否呈条状分布来判断两个量是否具有线性相关关系),若存在线性相关关系→②求回归系数→③写出回归直线方程,并利用回归直线方程进行预测说明.2.回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法。
建立回归模型的基本步骤是:①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;②画好确定好的解释变量和预报变量的散点图,观察它们之间的关系(线性关系)③由经验确定回归方程的类型.④按一定规则估计回归方程中的参数(最小二乘法);⑤得出结论后在分析残差图是否异常,若存在异常,则检验数据是否有误,后模型是否合适等.3.利用统计方法解决实际问题的基本步骤:(1)提出问题;(2)收集数据;(3)分析整理数据;(4)进行预测或决策。
4.残差变量e的主要来源:(1)用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型到底是什么)所引起的误差。
可能存在非线性的函数能够更好地描述y与x之间的关系,但是现在却用线性函数来表述这种关系,结果就会产生误差。
这种由于模型近似所引起的误差包含在e中。
新人教A版(选修1-2)1.1《回归分析的基本思想及其初步应用》ppt课件2

2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若由资料知,y对x呈线性相关关系。试求:
(1)线性回归方程 yˆ bˆx aˆ 的回归系数 aˆ、bˆ ;
(2)求残差平方和;
R (3)求相关系数 2;
(4)估计使用年限为10年时,维修费用是多少?
一般地,建立回归模型的基本步骤为:
(1)确定研究对象,明确哪个变量是解析变量,哪个变量 是预报变量。
线性关系
方案2
产卵数
400
300
200
100
气
温
0
-40 -30 -20 -10 0 -100
10 20 30 40
-200
方案2解答
平方变换:令t=x2,产卵数y和温度x之间二次函数模型y=bx2+a 就转化为产卵数y和温度的平方t之间线性回归模型y=bt+a
温度
21
23
25
27
29
32
35
温度的平方t 441
在统计中,我们也把自变量x称为解析变量,因变 量y为预报变量。
残差
数据点和它在回归直线上相应位置的差异 称为相应于点(xi,yi ) 的残差。
ei =yi
yi
例:编号为6的女大学生,计算随机误差的效应(残差)
61 (0.849165 85.712) 6.627
残差平方和
把每一个n 残差所得的值平方后加起来,用数学符号表
身
高
异
与
常
体 重
点
残
差
• 错误数据
图
• 模型问题
我们可以用相关指数R2来刻画回归的效果,其计算公式是
高中新课标数学人教A版选修1-2课件:1.1 回归分析的基本思想及初步应用 .1

∑ i=1 xi- x yi- y ^ ^ ^ ^ ^ (1)回归直线方程:y=bx+a,其中:b ,a= y
i =1
n
xi- x 2
n
1n 1n ^ -b x , x =ni∑ ∑ =1xi, y =ni =1yi. (2)变量样本点中心:( x , y ),回归直线过样本点的中心. (3)线性回归模型:y=bx+a+e,其中 e 称为随机误差,a 和 b 是 模型的未知参数,自变量 x 称为解释变量,因变量 y 称为预报变量.
目标导航 1.能知道用回归分析处理两个变量之间的不确定关系的统计方法. 2ห้องสมุดไป่ตู้会利用散点图分析两个变量是否存在相关关系;会用残差及 R2 来刻 画线性回归模型的拟合效果. 3.能记住建立回归模型的方法和步骤;能知道如何利用线性回归模型 求非线性回归模型.
1 新知识· 预习探究 知识点一 线性回归模型 阅读教材 P2~P4 探究,完成下列问题.
误差是有的,但并不意味着预报值没有使用价值,它是预报变量 的可能取值的平均值,每一个真实值都在预报值的左右. 可以利用残差(特别是残差平方和)来描述回归模型的回归效果, 如果残差很小,说明样本点几乎全部分布在回归方程上,这时的回归 方程能很好地刻画两变量间的关系. 3.残差平方和的效果 n 残差平方和∑ ^ e2 i 越小,回归模型刻画两变量之间的关系越好;残
2.残差^ e的意义 残差^ e是随机误差 e 的估计量,^ ei 是相应于点(xi,yi)的 ei 的估计 值.可以通过残差发现原始数据中的可疑数据,判断所建立模型的拟 合效果,残差的绝对值越小,拟合效果越好. n n n 2 2 ^ ^ ^xi-a ^)2 称为残差平方 残差平方和:∑ ei =∑ (yi-yi) =∑ (yi-b
高中数学人教A版选修1-21 回归分析的基本思想及其初步应用

学业分层测评(建议用时:45分钟)[学业达标]一、选择题1.在画两个变量的散点图时,下面叙述正确的是( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上【解析】 结合线性回归模型y =bx +a +e 可知,解释变量在x 轴上,预报变量在y 轴上,故选B.【答案】 B2.(2016·泰安高二检测)在回归分析中,相关指数R 2的值越大,说明残差平方和( )A .越大B .越小C .可能大也可能小D .以上均错【解析】 ∵R 2=1-∑i =1n(y i -y ^i )2∑i =1n(y i -y )2,∴当R 2越大时,∑i =1n(y i -y ^i )2越小,即残差平方和越小,故选B. 【答案】 B3.(2016·西安高二检测)已知x 和y 之间的一组数据则y 与x 的线性回归方程y ^=b x +a ^必过点( ) A .(2,2)B.⎝ ⎛⎭⎪⎫32,0C .(1,2)D.⎝ ⎛⎭⎪⎫32,4 【解析】 ∵x =14(0+1+2+3)=32,y =14(1+3+5+7)=4, ∴回归方程y ^=b ^x +a ^必过点⎝ ⎛⎭⎪⎫32,4.【答案】 D4.已知人的年龄x 与人体脂肪含量的百分数y 的回归方程为y ^=0.577x -0.448,如果某人36岁,那么这个人的脂肪含量( )【导学号:19220003】A .一定是20.3%B .在20.3%附近的可能性比较大C .无任何参考数据D .以上解释都无道理【解析】 将x =36代入回归方程得y ^=0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.【答案】 B5.某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程y ^=b x +a ^中的b 为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元【解析】 样本点的中心是(3.5,42),则a ^=y -b ^x =42-9.4×3.5=9.1,所以回归直线方程是y ^=9.4x +9.1,把x =6代入得y ^=65.5.【答案】 B 二、填空题6.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n不全相等)的散点图中,若所有样本点(x i,y i)(i=1,2,…,n)都在直线y=12x+1上,则这组样本数据的样本相关系数为________.【解析】根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.【答案】 17.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是________.【解析】由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得y^-5=1.23(x-4),即y^=1.23x+0.08.【答案】y^=1.23x+0.087.某学生课外活动兴趣小组对两个相关变量收集到5组数据如下表:由最小二乘法求得回归方程为y=0.67x+54.9,现发现表中有一个数据模糊不清,请推断该点数据的值为________.【解析】由题意可得x=15(10+20+30+40+50)=30,设要求的数据为t,则有y=15(62+t+75+81+89)=307+t5,因为回归直线y^=0.67x+54.9过样本点的中心(x,y),所以307+t5=0.67×30+54.9,解得t=68.【答案】688.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y 对x的回归直线方程:y^=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】以x+1代x,得y^=0.254(x+1)+0.321,与y^=0.254x+0.321相减可得,年饮食支出平均增加0.254万元.【答案】 0.254 三、解答题9.(2016·包头高二检测)关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:(1)线性回归方程:⎝ ⎛⎭⎪⎪⎫a ^=y -b ^x -,b ^=∑i =1nx i y i -n x -y -∑i =1nx 2i-n (x )2(2)估计使用年限为10年时,维修费用是多少? 【解】 (1)x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+7.05=5,∑i =15x 2i =90,∑i =15x i y i =112.3, b ^=∑i =15x i y i -5x -y -∑i =15x 2i -5x 2=112.3-5×4×590-5×42=1.23.于是a ^=y -b ^x =5-1.23×4=0.08. 所以线性回归方程为y ^=1.23x +0.08.(2)当x=10时,y ^=1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用是12.38万元. 10.关于x 与y 有如下数据:为了对x ,y 两个变量进行统计分析,现有以下两种线性模型:甲模型y =6.5x +17.5,乙模型y ^=7x +17,试比较哪一个模型拟合的效果更好.【解】 R 2甲=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2=1-1551 000=0.845,R 2乙=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2=1-1801 000=0.82,因为84.5%>82%,所以甲模型拟合效果更好.[能力提升]1.某学生四次模拟考试时,其英语作文的减分情况如下表:归方程为( )A .y =0.7x +5.25B .y =-0.6x +5.25C .y =-0.7x +6.25D .y =-0.7x +5.25【解析】 由题意可知,所减分数y 与模拟考试次数x 之间为负相关,所以排除A.考试次数的平均数为x =14×(1+2+3+4)=2.5,所减分数的平均数为y =14×(4.5+4+3+2.5)=3.5.即直线应该过点(2.5,3.5),代入验证可知直线y =-0.7x +5.25成立,选D.【答案】 D2.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y ^=b x +a ^.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′【解析】 根据所给数据求出直线方程y =b ′x +a ′和回归直线方程的系数,并比较大小.由(1,0),(2,2)求b ′,a ′. b ′=2-02-1=2,a ′=0-2×1=-2. 求b ^,a ^时,∑i =16x i y i =0+4+3+12+15+24=58,x =3.5,y =136,∑i =16x 2i =1+4+9+16+25+36=91,∴b ^=58-6×3.5×13691-6×3.52=57, a^=136-57×3.5=136-52=-13, ∴b ^<b ′,a ^>a ′. 【答案】 C3.(2016·江西吉安高二检测)已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且线性回归方程为y =0.95x +2.6,那么表格中的数据m 的值为________.【解析】 x =0+1+3+44=2,y =2.2+4.3+4.8+m 4=11.3+m 4,把(x -,y -)代入回归方程得11.3+m 4=0.95×2+2.6,解得m =6.7.【答案】 6.74.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100棵种子中的发芽数,得到如下资料:程,剩下的2组数据用于回归方程检验.(1)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(3)请预测温差为14 ℃的发芽数.【解】 (1)由数据求得,x =12,y =27,∑i =13x 2i =434,∑i =13x i y i =977. 由公式求得,b ^=52,a ^=y -b ^x =-3.所以y 关于x 的线性回归方程为y ^=52x -3. (2)当x =10时,y ^=52×10-3=22,|22-23|<2; 当x =8时,y ^=52×8-3=17,|17-16|<2. 所以该研究所得到的线性回归方程是可靠的. (3)当x =14时,有y ^=52×14-3=35-3=32, 所以当温差为14 ℃时的发芽数约为32颗.小课堂:如何培养中学生的自主学习能力?自主学习是与传统的接受学习相对应的一种现代化学习方式。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.1回归分析的基本思想及其初步应用(二)
教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学难点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学过程:
一、复习准备:
1.由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响.
2.为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 二、讲授新课:
1. 教学总偏差平方和、残差平方和、回归平方和:
(1)总偏差平方和:所有单个样本值与样本均值差的平方和,即21()n
i i SST y y ==-∑.
残差平方和:回归值与样本值差的平方和,即
21
()n
i i i SSE y y ==-∑. 回归平方和:相应回归值与样本均值差的平方和,即
21
()n
i i SSR y y ==-∑. (2)学习要领:①注意i y 、 i y 、y 的区别;②预报变量的变化程度可以分解为由解释变量
引起的变化程度与残差变量的变化程度之和,即
2
221
1
1
()()()n n n
i i i i i i i y y y y y y ===-=-+-∑∑∑;③当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;④对于多个不同的模型,我们还可以引入相关指数 2
21
2
1
()1()
n
i
i i n i
i y
y R y
y ==-=-
-∑∑来刻画回归
的效果,它表示解释变量对预报变量变化的贡献率. 2R 的值越大,说明残差平方和越小,
也就是说模型拟合的效果越好. 2. 教学例题:
为了对x 、Y 两个变量进行统计分析,现有以下两种线性模型: 6.517.5y x =+,
717y x =+,试比较哪一个模型拟合的效果更好.
分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论. (答案:
5221
15
2
1
()155110.8451000
()
i i i i
i y y R y y ==-=-
=-=-∑∑,221R =-
5
2
1
5
2
1
()180
10.821000
()
i
i
i i
i y y y y ==-=-
=-∑∑,84.5%>82%,所以甲选用的模型拟合效果较好.)
3. 小结:分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果的好坏.
第三课时。