《1.2回归分析》教学案3
1.1.2回归分析的基本思想及其初步应用 教案

第 1 页 1.1.2 回归分析的根本思想及其初步应用教学要求:通过典型案例的探究 ,进一步了解回归分析的根本思想、方法及初步应用. 教学重点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学难点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学过程:一、复习准备:1.由例1知 ,预报变量〔体重〕的值受解释变量〔身高〕或随机误差的影响.2.为了刻画预报变量〔体重〕的变化在多大程度上与解释变量〔身高〕有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 二、讲授新课:1. 教学总偏差平方和、残差平方和、回归平方和:〔1〕总偏差平方和:所有单个样本值与样本均值差的平方和 ,即21()n i i SST y y ==-∑.残差平方和:回归值与样本值差的平方和 ,即21()ni i i SSE y y ==-∑.回归平方和:相应回归值与样本均值差的平方和 ,即21()ni i SSR y y ==-∑.〔2〕学习要领:①注意i y 、i y 、y 的区别;②预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和 ,即222111()()()n n ni i i i i i i y y y y y y ===-=-+-∑∑∑;③当总偏差平方和相对固定时 ,残差平方和越小 ,那么回归平方和越大 ,此时模型的拟合效果越好;④对于多个不同的模型 ,我们还可以引入相关指数22121()1()n i i i ni i y y R y y ==-=--∑∑来刻画回归的效果 ,它表示解释变量对预报变量变化的奉献率. 2R 的值越大 ,说明残差平方和越小 ,也就是说模型拟合的效果越好.2. 教学例题:例2 关于x 与Y 有如下数据:x 2 4 5 6 8 y 30 40 60 5070为了对x 、Y 两个变量进行统计分析 ,现有以下两种线性模型:6.517.5y x =+ ,717y x =+ ,试比拟哪一个模型拟合的效果更好.分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和 ,也可分别求出两种模型下的相关指数 ,然后再进行比拟 ,从而得出结论.。
高中数学(1.2回归分析的基本思想及其初步应用)学案 新人教B版选修1 2 学案

1.2 回归分析的基本思想及其初步应用知★识★梳★理 1.线性回归模型(1)函数关系是一种关系,而相关关系是一种关系.(2)回归分析是对具有关系的两个变量进行统计分析的一种常用方法.(3)对于一组具有线性相关关系的数据),(11y x ,),(22y x ,…,),(n n y x ,回归直线的斜率和截距的最小二乘估计公式分别为=bˆ,=a ˆ,称为样本点的中心. (4)线性回归模型e a bx y ++=,其中a 和b 为模型的未知参数,e 称为,在统计中,自变量x 称为,因变量y 称为. 2.残差的概念对于样本点),(,),,(),,(2211n n y x y x y x ⋅⋅⋅而言,它们的随机误差为i e =,i =1,2,…,n ,其估计值为=i eˆ=,i =1,2,…,,n i e ˆ称为相应于点),(i i y x 的残差.★★★基础达标★★★1.下列两个变量之间的关系是相关关系的是( ).A .速度一定时,位移与时间B .单位面积的产量为常数时,土地面积与总产量C .身高与体重D .电压一定时,电流与电阻2.[2014·某某卷] 已知变量x 与y 正相关,且由观测数据算得样本平均数5.3,3==y x ,则由该观测数据算得的线性回归方程可能是( )A .3.24.0ˆ+=x yB .4.22ˆ-=x yC .5.92ˆ+-=x yD .4.43.0ˆ+-=x y),(,),,(),,(2211n n y x y x y x ⋅⋅⋅是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是 ( ).A .直线l 过点),(y xB .x 和y 的相关系数为直线l 的斜率C .x 和y 的相关系数在0到1之间D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同4.在一组样本数据),(,),,(),,(2211n n y x y x y x ⋅⋅⋅ (21,,2x x n ≥,…,n x 不全相等)的散点图中,若所有样本点),,2,1)(,(n i y x i i ⋅⋅⋅=都在直线121+=x y 上,则这组样本数据的样本相关系数为 ( ).A .-1B .0C .21D .1 5.[2014·某某一模] 设某大学的女生体重)(kg y 与身高)(cm x 具有线性相关关系,根据一组样本数据),,2,1)(,(n i y x i i ⋅⋅⋅=,用最小二乘法建立的线性回归方程为71.8585.0ˆ-=x y,给出下列结论:①y 与x 具有正的线性相关关系;②回归直线过样本点的中心),(y x ;③若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ; ④若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg. 其中,正确结论的序号是______________.6.(2014·某某重点中学联考)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程9.5467.0ˆ+=x y. 零件数x (个) 10 203040 50 加工时间y (min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为________.7.(2014·某某模拟)为了均衡教育资源,加大对偏远地区的教育投入,调查了某地若干户家庭的年收入x (单位:万元)和年教育支出y (单位:万元),调查显示年收入x 与年教育支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:2.015.0ˆ+=x y.由回归直线方程可知,家庭年收入每增加1万元,年教育支出平均增加________万元.8.四名同学根据各自的样本数据研究变量,x y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且 2.347 6.423y x =-; ②y 与x 负相关且 3.476 5.648y x =-+; ③y 与x 正相关且 5.4378.493y x =+; ④y 与x 正相关且 4.326 4.578y x =--. 其中一定不正确...的结论的序号是.9.(2012·某某)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价(1)求回归直线方程a bx y+=ˆ,其中x b y a b -=-=,20; (2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)10.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入i x (单位:千元)与月储蓄i y (单位:千元)的数据资料,算得10180ii x==∑,10120i i y ==∑,101184i i i x y ==∑,1021720i i x ==∑.(Ⅰ)求家庭的月储蓄y 对月收入x 的线性回归方程a x b yˆˆˆ+=; (Ⅱ)判断变量x 与y 之间是正相关还是负相关;(Ⅲ)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程a x b yˆˆˆ+=中,∑∑==--=n i i ni ii xn x yx n yx b 1221ˆ,x b y aˆˆ-=,★★★能力提升★★★11.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为93.7319.7+=∧x y ,用这个模型预测这孩子10岁时的身高,则正确的叙述是( )A 、身高一定是B 、身高在以上C 、身高在以下D 、身高在左右12.若施肥量x (kg )之间的回归直线方程为x y4250ˆ+=,当施肥量为50kg 时,预计小麦产量为.13.若一组观测值),(,),,(),,(2211n n y x y x y x ⋅⋅⋅之间满足i i i e a bx y ++=),,2,1(n i ⋅⋅⋅=,且i e 恒为0,则2R 为.14.关于x 与y 有以下数据:已知x 与y 线性相关,由最小二乘法得5.6=b, (1)求y 关于x 的线性回归方程.(2)现有第二个线性模型:177ˆ+=x y,且相关指数82.02=R ,若与(1)的线性模型比较,哪一个线性模型拟合效果比较好?请说明理由.1.1 回归分析的基本思想及其初步应用答案 知★识★梳★理1.(1)确定性;非确定性(2)相关(3)∑∑==---ni ini iix x y yx x 121)())((x by ˆ-),(y x (4)随机误差 解释变量 预报变量2.a bx y i i --i i y y ˆ-a x b y ii ˆˆ-- 3.∑∑==---ni in i i i y yy y 1212)()ˆ(1 1★★★基础达标★★★1.C 解析:A 、B 、D 中两个变量间的关系都是确定的,所以是函数关系;C 中的两个变量间是相关关系,对于身高一样的人,体重仍可以不同,故选C.2.A 解析:因为变量x 与y 正相关,则在线性回归方程中,x 的系数应大于零,排除B ,D ;将5.3,3==y x 分别代入A ,B 中的方程只有A 满足,故选A.3.A 解析:由样本的中心(y x ,)落在回归直线上可知A 正确;x 和y 的相关系数表示为x 与y 之间的线性相关程度,不表示直线l 的斜率,故B 错;x 和y 的相关系数应在-1到1之间,故C 错;分布在回归直线两侧的样本点的个数并不绝对平均,即无论样本点个数是奇数还是偶数,故D 错.4.D 解析:所有点均在直线上,则样本相关系数最大即为1,故选D. 5.①②③6.68 解析:由已知可计算求出30=x ,而回归直线方程必过点),(y x ,则759.543067.0=+⨯=y ,设模糊数字为a ,则75589817562=++++a ,计算得68=a . 7.0.15 解析:回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增加0.15万元.8.①④ 解析:y 与x 正相关,回归直线,直线斜率大于0,y 与x 负相关,回归直线系数小于0. 9.解析:(1)由于5.8)(61654321=+++++=x x x x x x x ,80)(61654321=+++++=y y y y y y y ,所以2505.82080=⨯+=-=x b y a ,从而回归直线方程为25020ˆ+-=x y. (2)设工厂获得的利润为L 元,依题意得)25020(4)25020(+--+-=x x x L25.361)433(2010003302022+--=-+-=x x x . 当且仅当25.8=x 时,L 取得最大值. 故当单价定为8.25元时,工厂可获得最大利润.10.解析:(I )由题意知10=n ,8108011===∑=n i i x n x ,∑====n i i y n y 1210201, 808107202212=⨯-=-∑=x n xni i, 2428101841=⨯⨯-=-∑=y x n y x ni i .由此作3.08024==b ,4.083.02-=⨯-=-=x b y a , 故所求回归方程为4.03.0-=x y .(II )由于变量y 的值随x 的值增加而增加03.0>=b ,故x 与y 之间是正相关. (III )将7=x 代入回归方程可以预测该家庭的月储蓄为7.14.073.0=-⨯=y . ★★★能力提升★★★11.D 解析:10=x 时,83.145=y ,它是一个估测值,故选D.12.450kg 解析:250ˆ=y+4×50=450.13.1 解析:i i yy ˆ=故101)()ˆ(112122=-=---=∑∑==n i ini i iy yyyR . 14.解析:(1)依题意设y 关于x 的线性回归方程为a x yˆ5.6ˆ+=, 5)86542(51=++++=x , 50)7050604030(51=++++=y ,∵a x yˆ5.6ˆ+=经过样本点的中心),(y x ,∴a ˆ55.650+⨯=,∴5.17ˆ=a , ∴y 与x 的线性回归方程为5.175.6ˆ+=x y. (2)由(1)的线性模型得y y ˆ-与y y -的关系如下表: 所以∑==+-++-+-=-12222221555.0)5.6(10)5.3()5.0()ˆ(i i iyy. ∑==+++-+-=-51222222100020010)10()20()(i iy y.所以.845.010001551)()ˆ(151251221=-=---=∑∑==i ii i iy yyyR 由于845.021=R ,82.02=R 知221R R >,所以(1)的线性模型拟合效果比较好.。
苏教版选修(1-2)1.2《回归分析》word学案

1.2回归分析BCA案主备人:史玉亮审核人:吴秉政使用时间:2012.2.6 学习目标:1.通过对典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用。
2.结合具体的实际问题,了解非线性回归问题的解决思路。
3.通过回归分析的学习,提高对现代计算技术与统计方法的应用意识。
B案一、基础整合1.召与回归系数b?的计算方法b?= _______________________ ,a?= ________________________ 。
2.样本相关系数(1)对于变量x与y随机抽取到的n对数据(x1,y1),(x2,y2),……,(x n,y n),检验统计量是样本相关系数r= ______________________________________________(2)_____________________________________________________________ r具有以下性质:r w 1,并且r越接近1,线性相关程度___________________________________ ;r越接近0,线性相关程度_______________________ 。
(3)检验的步骤如下:①作统计假设:x与y不具有_____________________ 关系。
②根据 __________ 与______________ 在附表中查出r的一个临界值r0.05。
③根据 ____________________ 计算公式算出r的值。
④作统计推断。
如果r| > “a,表明有____________ 的把握认为x与y之间具有线性相关关系;如果|r w r o.05,我们没有理由拒绝__________ 。
这时寻找回归直线方程是毫无意义的。
二、预习检测1.下列两变量具有相关关系的是( )A.正方体的体积与棱长B.匀速行驶的车辆的行驶距离与时间C.人的身高与体重D.人的身高与视力2.下列两变量是线性相关的是( )A.如果变量X与Y之间存在着线性相关关系,则我们根据试验数据得到的点(X i, yj(i =1,2,3,...,n)将散布在某一条直线附近B.如果两个变量X与Y之间不存在线性关系,那么根据试验数据不能写出一个线性方程C.设x、y是具有线性相关关系的两个变量,且回归直线方程是(•召,则b?叫回归系数D.为使求出的回归直线方程有意义,可用统计假设检验的方法判断变量X与Y之间是否存在线性相关关系4.在一次试验中,测得(x, y)的四组值分别是A(1,2), B(2,3),C(3,4), D(4,5),则y 与x之间的回归直线方程为()A. y?=x1B. ?=x 2C. ? = 2x1D. y? = x-1C案合作探究1.回归直线方程的适用范围是什么?2.建立回归直线方程的一般步骤是什么?3.由回归直线方程得到的变量的值是真实值吗?例某工厂月份某种产品的产量与成本的统计数据见下表。
《回归分析》教学大纲

回归分析RegressionAna1ysis一、课程基本信息课程编号:111093适用专业:统计学专业课程性质:专业必修开课单位:数学与数据科学学院学时:48(理论学时40;实验学时8)学分:3考核方式:考试(平时成绩占30%+考试成绩70%)中文简介:回归分析是应用统计学中一个重要的分支,在自然科学、管理科学和社会经济等领域应用十分广泛。
《回归分析》课程是统计学专业的学科专业必修课是学生掌握统计学的基本思想、理论和方法的主要课程,是培养学生熟练应用计算机软件处理统计数据的能力的基础课程。
通过本课程的学习,使学生掌握应用统计的一些基本理论与方法,初步掌握利用回归分析解决实际问题的能力。
二、教学目的与要求本课程的主要目的是学生在学习后,能够系统掌握回归分析的理论与方法,并在此基础上,掌握回归分析应用的艺术技巧,并利用其分析认识实际问题。
本课程注重回归分析的基本理论与方法,同时通过案例教学与实际应用来剖析回归分析的理论与方法所蕴含的统计思想及其应用艺术。
教学中在回归分析理论与方法的基础上结合社会、经济、自然学科学领域的研究实例,把回归分析方法与实际应用结合起来,注重定性分析与定量分析的紧密结合,强调每种方法的优缺点和实际运用中应注意的问题,研究与实践中应用回归分析的经验和体会融入其中,使学生充分体会到回归分析的应用艺术,并提高解决问题的能力。
通过本课程的学习,在理论教学过程中,可以结合国内外回归分析相关学者的研究经历和成果,传播科学研究所需要的实事求是、脚踏实地的精神,培养学生的科学素养。
在实践教学中,利用案例分析、软件仿真等方式培养学生的实践能力和创新思维,激发学生主动研究新问题和设计新方法的兴趣,让学生在实践中深刻体会科学研究的乐趣,也可以鼓励有突出能力的学生通过创新创业或成果转化为社会发展贡献年轻的力量。
三、教学方法与手段1.教学方法:课堂讲授中要重点对基本概念、基本方法和解题思路的讲解;采用启发式教学,培养学生思考问题、分析问题和解决问题的能力;引导和鼓励学生通过实践和自学获取知识,培养学生的自学能力和创新能力。
《回归分析课程教案》课件

《回归分析课程教案》课件第一章:引言1.1 课程目标让学生了解回归分析的基本概念和应用领域。
让学生掌握回归分析的基本原理和方法。
培养学生应用回归分析解决实际问题的能力。
1.2 教学内容回归分析的定义和分类回归分析的应用领域回归分析的基本原理和方法1.3 教学方法讲授法:讲解回归分析的基本概念和原理。
案例分析法:分析实际案例,让学生了解回归分析的应用。
1.4 教学资源课件:介绍回归分析的基本概念和原理。
案例:提供实际案例,让学生进行分析。
1.5 教学评估课堂讨论:学生参与课堂讨论,回答问题。
第二章:一元线性回归分析2.1 教学目标让学生了解一元线性回归分析的基本概念和原理。
让学生掌握一元线性回归模型的建立和估计方法。
培养学生应用一元线性回归分析解决实际问题的能力。
2.2 教学内容一元线性回归分析的定义和特点一元线性回归模型的建立和估计方法一元线性回归模型的检验和预测2.3 教学方法讲授法:讲解一元线性回归分析的基本概念和原理。
数据分析法:分析实际数据,让学生了解一元线性回归模型的建立和估计方法。
2.4 教学资源课件:介绍一元线性回归分析的基本概念和原理。
数据分析软件:用于一元线性回归模型的建立和估计。
2.5 教学评估课堂练习:学生进行课堂练习,应用一元线性回归分析解决实际问题。
第三章:多元线性回归分析3.1 教学目标让学生了解多元线性回归分析的基本概念和原理。
让学生掌握多元线性回归模型的建立和估计方法。
培养学生应用多元线性回归分析解决实际问题的能力。
3.2 教学内容多元线性回归分析的定义和特点多元线性回归模型的建立和估计方法多元线性回归模型的检验和预测3.3 教学方法讲授法:讲解多元线性回归分析的基本概念和原理。
数据分析法:分析实际数据,让学生了解多元线性回归模型的建立和估计方法。
3.4 教学资源课件:介绍多元线性回归分析的基本概念和原理。
数据分析软件:用于多元线性回归模型的建立和估计。
3.5 教学评估课堂练习:学生进行课堂练习,应用多元线性回归分析解决实际问题。
《1.2回归分析》导学案2.doc

《1.2回归分析》导学案学习目标1.了解回归分析的基本思想和方法2.培养学生观察分析计算的能力学习重难点学习重点:回归方程y = bx +a学习难点:£、方公式的推到学习过程一、预习内容:1.对于一组具有线性相关关系的数据31, 乂 ),(工2, W,(羽,% ),…,3",义)•其回归直线方程的截距和斜率的最小二乘法估计公式:a='方=2- x= ,V =3.样本点的中心4.§ = 0.849x-85.712对于b = 0.849是斜率的估计值,说明身高x每增加1个单位,体重就,表明体重与身高具有的线性相关关系.5.如何描述线性相关关系的强弱?'守支("舟V 1=1 1=1(1)r〉0表明两个变量正相关;(2)广〈0表明两个变量负相关;(3)r的绝对值越接近1,表明相关性越强,7■的绝对值越接近0,表明相关性越弱;(4)当7■的绝对值大于0. 75认为两个变量具有很强的相关性关系.二、思考1、如何使Q(a,8)值最小,通过观察分析式子进行试探推导^(x,.-x)(v;.-V)_ _结论”=------ =——a=y-/3xi=l2、如何描述线性相关关系的强弱?i=l、但光-寸支(力-yfV i=l i=l三、典型例题分析:(l)y与x的回归直线方程为§ = 0.733"0.6948(2)当水深为1.95m时,可以预测水的流速约为2. 12mA四、当堂练习1 •对两个变量y和x进行回归分析,得到一组样本数据:31,>1),32,力),(>3,,3),,“,3",乂)・则下列说法不正确的是( )A.由样本数据得到的回归方程y^bx + a必过样本中心(x,y)&残差平方和越小的模型,拟合的效果越好C.用相关指数来刻画回归效果,R2越小,说明模型的拟合效果越好D.若变量y与x之间的相关系数r = -0.9362 ,则变量y与x之间具有线性相关关系2.已知某地每单位面积菜地年平均使用氮肥量X信与每单位面积蔬菜年平均产量W之间161125 —15x10-__1515每单位面积蔬菜的年平均产量.(已知X = 1O1,/1O.11,〉>: =161,=16076.8)i=li=l解:设所求的回归直线方程为§ = Zw + 0,则15 ____16°76・8「15X 101X 10.11 =。
人教新课标版数学高一-学案 1.2 回归分析

1.2 回归分析1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.1.什么叫回归分析?答 回归分析是对具有相关关系的两个变量进行统计分析的一种方法. 2.回归分析中,利用回归直线方程求出的函数值一定是真实值吗?答 不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食、是否喜欢运动等.1.回归直线方程在回归直线方程y ^=a ^+b ^x 中,b ^=i =1n (x i -x )(y i -y )i =1n (x i -x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .其中x =1n ∑i =1n x i ,y =1n ∑i =1ny i ,(x ,y )称为样本点的中心,回归直线过样本点的中心. 2.相关系数对于变量x 与y 随机抽到的n 对数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),检测统计量是样本相关系数r =i =1n (x i -x )(y i -y )i =1n (x i -x )2i =1n (y i -y )2=∑i =1nx i y i -n x y(∑i =1nx 2i -n x 2)(∑i =1ny2i -n y 2)相关系数r 的取值范围是[-1,1],|r |越接近1,变量之间的线性相关程度越高,|r |越接近0,线性相关程度越弱,当|r |>r 0.05时,有95%的把握认为两个变量之间有线性相关关系. 3.非线性回归分析回归曲线方程也可以线性化(1)将幂函数型函数y =ax n (a 为常数,a ,x ,y 均取正值)化为线性函数:将y =ax n 两边取常用对数,则有lg y =n lg x +lg a ,令μ=lg y ,v =lg x ,b =lg a ,代入上式得μ=n v +b (其中n 、b 是常数),其图象是一条直线.(2)将指数型函数y =ca x (a >0,c >0,a ,c 为常数)化为线性函数;将y =ca x 两边取常用对数,则有lg y =x lg a +lg c ,令μ=lg y ,b =lg c ,d =lg a ,代入上式得μ=dx +b (d ,b 是常数),它的图象是一条直线.要点一 求回归直线方程例1 某班5名学生的数学和物理成绩如下表:(1)画出散点图;(2)求物理成绩y 对数学成绩x 的回归直线方程; (3)一名学生的数学成绩是96,试预测他的物理成绩. 解 (1)散点图如图.(2)x =15×(88+76+73+66+63)=73.2,y =15×(78+65+71+64+61)=67.8.∑i =15x i y i =88×78+76×65+73×71+66×64+63×61=25054.∑i =15x 2i =882+762+732+662+632=27174.所以b ^=∑i =15x i y i -5x y∑i =15x 2i -5x2=25054-5×73.2×67.827174-5×73.22≈0.625.a ^=y -b ^x ≈67.8-0.625×73.2=22.05. 所以y 对x 的回归直线方程是y ^=0.625x +22.05. (3)x =96,则y ^=0.625×96+22.05≈82, 即可以预测他的物理成绩是82.规律方法 (1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析. (2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.跟踪演练1 某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:(1)请画出上表数据的散点图((2)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归直线方程y ^=b ^x +a ^; (3)试根据求出的回归直线方程,预测记忆力为9的同学的判断力.解 (1)如图:(2)∑ni =1x i y i =6×2+8×3+10×5+12×6=158, x =6+8+10+124=9,y =2+3+5+64=4,∑ni =1x 2i =62+82+102+122=344, b ^=158-4×9×4344-4×92=1420=0.7,a ^=y -b ^x =4-0.7×9=-2.3, 故回归直线方程为y ^=0.7x -2.3.(3)由②中回归直线方程当x =9时,y ^=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.要点二 相关性检验例2 下面的数据是从年龄在40到60岁的男子中随机抽出的6个样本,分别测定了心脏的功能水平y (满分100)以及每天花在看电视上的平均时间x (小时).(1)(2)求心脏的功能水平y 与每天花在看电视上的平均时间x 的回归直线方程,并讨论方程是否有意义;(3)估计平均每天看电视3小时的男子的心脏的功能水平. 解 n =6,x =16(4.4+4.6+…+4.6)≈3.7167,y =16(52+53+…+65)≈64.1667,∑i =16x 2i -6(x )2=(4.42+4.62+…+4.62)-6×3.71672≈19.7668,∑i =16y 2i -6(y )2=(522+532+…+652)-6×64.16672≈964.8077,∑i =16x i y i -6x y =(4.4×52+4.6×53+…+4.6×65)-6×3.7167×64.1667≈-124.6302.(1)心脏的功能水平y 与每天花在看电视上的平均时间x 之间的相关系数r =∑i =16x i y i -6x y(∑i =16x 2i -6(x )2)(∑i =16y 2i -6(y )2)≈-124.630219.7668×964.8077≈-0.9025.(2)b ^=∑i =16x i y i -6x y∑i =16x 2i -6(x )2≈-124.630219.7668≈-6.3050,a ^=y -b ^x ≈64.1667+6.3050×3.7167≈87.6005,所以心脏的功能水平y 与每天花在看电视上的平均时间x 的回归直线方程为y ^=-6.3050x +87.6005.查表n -2=4,r 0.05=0.811,因为|r |≈0.9025>0.811,所以有95%以上的把握认为y 与x 之间有线性关系,这个方程是有意义的.(3)将x =3代入回归直线方程y ^=-6.3050x +87.6005可得y ^≈69(分).因此估计平均每天看电视3小时的男子的心脏的功能水平为69分.规律方法 解决这一类问题时,首先应对问题进行必要的相关性检验,如果不作相关性检验,我们仍然可以求出x 与y 的回归直线方程,但不知道这时的回归直线方程是否有意义,也就不知道能否反映变量x 与y 之间的变化规律,只有在x 与y 之间具有相关关系时,求得的回归直线方程才有意义.跟踪演练2 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y 来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度x (g/L)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.(2)求回归直线方程;(3)求相关系数r ,并进行相关性检验. 解 (1)(2)列表:x =1687=24,y =202.947,b ^=∑i =17x i y i -7x y∑i =17x 2i -7(x )2=4900.16-7×24×202.9474144-7×242=0.2643,a ^=y -b ^x =202.947-0.2643×24≈22.648,∴回归直线方程为y ^=22.648+0.2643x . (3)∑i =17y 2i =5892,r =∑i =17x i y i -7x y(∑i =17x 2i -7(x )2)(∑i =17y 2i -7(y )2)=4900.16-7×24×202.947(4144-7×242)×(5892-7×(202.947)2)=0.96.计算得r =0.96>r 0.05=0.754.说明甲醛浓度与缩醛化度两个变量之间有较强的线性相关关系. 要点三 非线性回归模型例3 某地区不同身高的未成年男性的体重平均值如下表:解 根据上表中数据画出散点图如图所示.由图看出,样本点分布在某条指数型函数曲线y =c 12e c x的周围,于是令z =ln y .由计算器计算可得下表,由表中数据可得z 与x 之间的回归直线方程: z ^=0.693+0.020x ,则有y ^=e 0.693+0.020x .规律方法 根据已有的函数知识,可以发现样本分布在某一条指数型函数曲线y =c 12e c x的周围,其中c 1和c 2是待定参数;可以通过对x 进行对数变换,转化为线性相关关系. 跟踪演练3 某种书每册的成本费Y (元)与印刷册数x (千册)有关,经统计得到数据如下:检验每册书的成本费Y 与印刷册数的倒数1x之间是否具有线性相关关系?若有,求出Y 对x的回归方程;若无,说明理由.解 设μ=1x ,则Y 与μ的数据关系如下表所示:0.05=0.632.从而有95%的把握认为这两个变量具有线性相关关系,从而求Y 与μ的回归直线方程有意义.又b ^=Σ10i =1μi y i -10μy Σ10i =1μ2i -10μ2=15.20878-10×0.2248×3.141.413014-10×0.22482≈8.98, a ^=y -b ^μ=3.14-8.98×0.2248=1.12,所以y 关于μ的回归直线方程为y ^=1.12+8.98μ,Y 与x 的回归方程为y ^=1.12+8.98x.1.下列各组变量之间具有线性相关关系的是( ) A.出租车费与行驶的里程 B.学习成绩与学生身高 C.身高与体重 D.铁的体积与质量 答案 C2.若劳动生产率x (千元)与月工资y (元)之间的回归直线方程为y ^=50+80x ,则下列判断正确的是( )A.劳动生产率为1000元时,月工资为130元B.劳动生产率提高1000元时,月工资平均提高80元C.劳动生产率提高1000元时,月工资平均提高130元D.月工资为210元时,劳动生产率为2000元 答案 B3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归直线方程可能是( ) A.y ^=-10x +200 B.y ^=10x +200 C.y ^=-10x -200D.y ^=10x -200答案 A解析 由于销售量y 与销售价格x 成负相关,故排除B.D.又当x =10时,A 中y =100,而C 中y =-300,C 不符合实际情况,故选A.4.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:(1)求年推销金额y (2)若第6名推销员的工作年限为11年,试估计他的年推销金额. 解 (1)设所求的回归直线方程为y ^=b ^x +a ^,则b ^=i =15(x i -x )(y i -y )i =15(x i -x )2=1020=0.5, a ^=y -b ^x =0.4.所以年推销金额y 关于工作年限x 的回归直线方程为y ^=0.5x +0.4. (2)当x =11时,y ^=0.5x +0.4=0.5×11+0.4=5.9(万元). 所以可以估计第6名推销员的年推销金额为5.9万元.回归分析的基本思路:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);(3)由经验确定回归方程的类型(如果呈线性关系,则选用回归直线方程y ^=b ^x +a ^); (4)按一定规则估计回归方程中的参数.。
数学1.2《回归分析》教案(新人教B版选修1-2)

1.2回归分析教学目标:通过对典型案例的探究,了解回归的基本思想、方法及其初步应用。
教学重点:通过对典型案例的探究,了解回归的基本思想、方法及其初步应用。
教学过程一、变量的相关关系中最为简单的是线性相关关系,设随机变量与变量之间存在线性相关关系,则由试验数据得到的点(,)将散布在某一直线周围,因此,可以认为关于的回归函数的类型为线性函数,即,下面用最小二乘法估计参数、b,设服从正态分布,分别求对、b的偏导数,并令它们等于零,得方程组解得其中,且为观测值的样本方差.线性方程称为关于的线性回归方程,称为回归系数,对应的直线称为回归直线.顺便指出,将来还需用到,其中为观测值的样本方差.二、现在讨论线性相关的显著性检验中最简便、最常用的一种方法,即相关系数的显著性检验法.我们早在前面的学习中知道,变量与的相关系数是表示与之间线性相关关系的一个数字特征,因此,要检验随机变量与变量之间的线性相关关系是否显著,自然想到考察相关系数的大小,若相关系数的绝对值很小,则表明与之间的线性相关关系不显著,或者它们之间根本不存在线性相关关系;当且仅当相关系数的绝对值接近1时,才表明与之间的线性相关关系显著,这时求关于的线性回归方程才有意义.在相关系数未知的情况下,可用样本相关系数r作为相关系数的估计值,参照相关系数的定义,并用样本均值与样本方差分别作为数学期望与方差的估计值,定义与的样本相关系数如下:因此,根据试验数据(,),得到的值后可进一步算出样本相关系数r的值. 若使用的是具有线性回归计算功能的电子计算器时,把所有试验数据(,)逐对存入计算器中,则可直接算出r的值.由于样本相关系数r是相关系数的估计值,所以,r的绝对值越接近1,与之间的线性相关关系越显著. 当r>0时,称与正相关;当r<0时,称与负相关. 而当r的绝对值接近0时,则可认为与之间不存在线性相关关系.三、例1.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得数据如下(单位:kg)1x2)检验相关系数r 的显著性水平:r=∑∑∑===---7171222271)7)(7(7i i i i i ii y y x x yx yx =)3.39971132725)(3077000(3.3993078717522⨯-⨯-⨯⨯-≈0.9733,在“相关系数检验的临界值表”查出与显著性水平0.05及自由度7-2=5相应的相关数临界值r 0 05=0.754<0.9733,这说明水稻产量与施化肥量之间存在线性相关关系.3)设回归直线方程a bx y +=ˆ,利用⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑==xb y a x x y x y x b i i i i i 71227177计算a ,b , 得b=75.430770005.399307871752≈⨯-⨯⨯- a=399.3-4.75×30≈257,则回归直线方程25775.4ˆ+=x yx例2.一个工厂在某年里每月产品的总成本y (万元)与该月产量x (万件)之间由如下一组数据:归直线方程.x2)r=∑∑∑===---1211212222121)12)(12(12i i i i i ii y y x x yx yx=18.534.1754.243120.997891-⨯⨯=在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关数临界值r 0 05=0.576<0.997891, 这说明每月产品的总成本y (万元)与该月产量x (万件)之间存在线性相关关系.3)设回归直线方程a bx y+=ˆ, 利用⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑==xb y a x x y x y x b i i i i i 121221211212,计算a ,b ,得b ≈1.215, a=x b y -≈0.974,∴回归直线方程为:974.0215.1ˆ+=x y课堂小节:本节课学习了回归的基本思想、方法及其初步应用 课堂练习:略课后作业:第7页习题A:1,2,3,4,5。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《1.2回归分析》教学案
教学要求:
通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.
教学重点:
了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和
残差分析.
教学难点:
解释残差变量的含义,了解偏差平方和分解的思想.
教学过程:
一、复习准备:
1.提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学
生吗?这两者之间是否有关?
2.复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系.回归分析是对
具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据→作散点图→
求回归直线方程→利用方程进行预报.
二、讲授新课:
1.教学例题:
①例1从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:
学生的体重.(分析思路→教师演示→学生整理)
第一步:作散点图
第二步:求回归方程
第三步:代值计算
②提问:身高为172cm的女大学生的体重一定是60.316kg吗?
不一定,但一般可以认为她的体重在60.316kg左右.
③解释线性回归模型与一次函数的不同
事实上,观察上述散点图,我们可以发现女大学生的体重y和身高x之间的关系并不能=+来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画用一次函数y bx a
身高和体重的关系).在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61k
g,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3名女在学生的体重应相同.这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e(即残差变
=++,其中残差变量e中量或随机变量)引入到线性函数模型中,得到线性回归模型y bx a e
包含体重不能由身高的线性函数解释的所有部分.当残差变量恒等于0时,线性回归模型就变成一次函数模型.因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.
2.相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.
3.小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.。