2.3.2 高中数学人教必修3两个变量的线性关系
高中数学 2.3.2变量间的相关关系课件 新人教A版必修3

热饮杯数
当x=2时,y=143.063.
小结作业 1.求样本数据的线性回归方程,可按 下列步骤进行: 第一步,计算平均数 x , y
第二步,求和
第三步,计算 b i1
x y , x ( x x )( y y ) x y nx y
2
n
n
i 1 n
i
i
i 1
i
n
i
i
2 ( x x ) i i 1
n
x y
i 1 n i i 1
n
i
nx y , a y bx
2 2 x nx i
ˆi )2 为最小,这样 时,总体偏差 Q (yi y
i 1
就得到了回归方程,这种求回归方程的 Ù 方法叫做最小二乘法.回归方程ห้องสมุดไป่ตู้y = bx + a 中,a,b的几何意义分别是什么?
2.观察人体的脂肪含量百分比和年龄的样本 数据的散点图,这两个相关变量成正相关. 我们需要进一步考虑的问题是,当人的年龄 增加时,体内脂肪含量到底是以什么方式增 加呢?对此,我们从理论上作些研究.
脂肪含量
40 35 30 25 20 15 10 5 0 20 25 30 35 40 45 50 55 60 65 年龄
2.3 2.3.1 2.3.2
变量间的相关关系 变量之间的相关关系 两个变量的线性相关
第二课时
问题提出
1 5730 p 2
t
1. 两个变量之间的相关关系的含义如 何?成正相关和负相关的两个相关变量 的散点图分别有什么特点? 自变量取值一定时,因变量的取值带有 一定随机性的两个变量之间的关系. 正相关的散点图中的点散布在从左下角 到右上角的区域,负相关的散点图中的 点散布在从左上角到右下角的区域
人教版高中必修3(B版)2.3.2两个变量的线性相关教学设计

人教版高中必修3(B版)2.3.2 两个变量的线性相关教学设计1. 教学目标1.了解什么是两个变量的线性相关。
2.掌握用散点图和回归分析判断两个变量间是否存在线性相关。
3.能够利用Excel进行数据的处理和线性回归模型的建立。
4.能够分析不同变量间的线性相关性并进行实际应用。
2. 教学重点1.掌握用散点图和回归分析判断两个变量间是否存在线性相关。
2.理解和掌握线性回归模型的建立方法。
3.实际应用场景中的变量分析。
3. 教学工具1.教师用PPT进行幻灯片的展示。
2.学生使用Excel进行数据处理。
3.学生使用PPT或者报告进行结果汇报。
4. 教学步骤4.1 引入1.利用课件引入什么是线性相关性,同时列出场景案例。
2.让学生思考实际用途,如何帮助决策。
4.2 教学内容1.通过教学案例和数据,帮助学生发现两个变量之间存在的线性关系,将数据进行散点图的展示。
2.利用线性回归方法求出变量间的关系,并进行解释分析,同时重点帮助学生理解回归线和残差。
3.在Excel中模拟数据,并进行线性回归模型的建立,帮助学生掌握模型参数的估计与推断,同时展示数据处理过程。
4.通过网络或者其他途径获得实际数据,并进行数据处理和线性回归分析,展示关键参数和线性回归模型的评估。
4.3 练习和应用1.让学生利用Excel进行数据录入和线性回归模型的建立,同时进行结果展示。
2.让学生分组,进行数据收集处理和建模,完成案例分析和报告撰写,同时进行展示和交流。
4.4 总结1.整理本次课程的重点知识点,巩固学生的掌握程度。
2.引导学生思考如何将所学知识应用到更广泛的场景中。
5. 教学资源1.教材:人教版高中必修3(B版)2.网络课件和视频资源:参考相关资源如慕课网、Coursera等。
6. 教学评估1.观察学生课前预习和课堂参与状况。
2.课堂能力训练:教师提供练习题目并进行课堂答题,加深学生对所学知识点的理解,同时检验学会程度。
3.课堂小组作业和课外大作业的评估:教师通过查看学生PPT报告和答辩情况进行交流和评估。
人教B版高中数学必修三2.3.2 两个变量的线性相关.doc

图2.3.2-1高中数学学习材料鼎尚图文*整理制作2.3.2 两个变量的线性相关 【目标要求】1.了解线性回归的意义. 2.会求回归直线方程. 【巩固教材——稳扎马步】1.变量y 与x 之间的回归方程表示 ( ) A.表示y 与x 之间的函数关系 B.表示y 和x 之间的不确定关系C.反映y 和x 之间真实关系的形式 D.反映y 与x 之间的真实关系达到最大限度的吻合2.在回归分析中,自变量同因变量地位不同,在变量x 与y 中,y 依x 回归同x 依y 回归是 ( ) A.同一个问题 B.有联系但意义不同的问题 C.一般情况下是相同的问题 D.是否相同,视两相关变量的具体内容而定 3.一个直线回归方程为 ,则变量x 增加一个单位时 ( ) A.y 平均增加1.5个单位 B. y 平均增加2个单位 C. y 平均减少1.5个单位 D. y 平均减少2个单位4.线性回归方程=bx+a 必过点 ( ) A.(0,0) B.(0,x ) C.(y ,0) D.(y x ,)5.在线性回归中,点(y x ,)是散点图中n 个点的 ( ) A.内心 B.外心 C.重心 D.垂心【重难突破——重拳出击】6.工人月工资(元)依劳动生产率(千元)变化的回归方程为 ,下列判断正确的是 ( ) A .劳动生产率为1000元时,工资为150元 B .劳动生产率提高1000元时,工资提高150元 C .劳动生产率提高1000元时,工资提高90元 D .劳动生产率为1000元时,工资为90元7.某校经济管理类的学生学习《统计学》的时间(x)与考试成绩(y)之间建立线性回归方程y=a+bx .经计算,方程为y =20-0.8x ,则该方程参数的计算 ( ) A .a 值是明显不对的 B .b 值是明显不对的 C .a 值和b 值都是不对的 D .a 值和b 值都是正确的8.2003年春季,我国部分地区SARS 流行,党和政府采取果断措施,防治结合,很快使病情得到控制.下表是某同学记载的5月1日至5月12日每天北京市SARS 病患者治愈者数据,及根据这些数据绘制出的散点图(图2.3.2-1) .^^2 1.5y x =-y x y 9060^+=下列说法:①根据此散点图,可以判断日期与人数具有线性相关关系;②日期与人数具有的相关关系为正相关;③根据此散点图,可以判断日期与人数具有一次函数关系.其中正确的个数为 ( ) A .0个 B .1个 C .2个 D .3个9.实验测得四组(x,y )值为(1,2),(2,3.5),(4,6.5),(6,9.5),则y 与x 之间的线性回归方程为 ;当x 为5时,估算y 的值为 __; 【巩固提高——登峰揽月】10. 根据某地区历年人均收入(元)与商品销售额(万元)资料计算的有关数据如下: (x 代表人均收,y 代表销售额) ∑∑∑∑=========ni i i n i i n i i n i i y x x y x n 1121116918,3436,260,546,9(1) 建立以商品销售额为因变量的直线回归方程,并解释回归系数含义; (2) 若1996年人均收为400元,试推算该年商品销售额. (要求写出公式和计算过程,结果保留两位小数.)11.已知某地每单位面积菜地年平均使用氮肥量xkg 与每单位面积蔬菜年平均产量yt 之间的关系有如下数据:年份1985 1986 1987 1988 1989 1990 1991 1992 x(kg) 70 74 80 78 85 92 90 95 y(t) 5.1 6.0 6.8 7.8 9.0 10.2 10.0 12.0年份1993 1994 1995 1996 1997 1998 1999 x(kg) 92 108 115 123 130 138 145 y(t) 11.5 11.0 11.8 12.2 12.5 12.8 13.0若x 与y 线性相关,求蔬菜产量y 与使用氮肥量之间的回归直线方程,并估计每单位面积施肥150kg 时,每单位面积蔬菜的年平均产量.日期5.15.25.35.45.55.6人数 100 109 115 118 121 134 日期 5.75.8 5.9 5.10 5.11 5.12 人数 141 152 168 175 186 20312.假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:x 2 3 4 5 6 y 2.2 3.8 5.5 6.5 7.0若由资料可知y 对x 呈线性相关关系.试求: (1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?【课外拓展——超越自我】13. 回归直线参数a , b 是用什么方法计算的,回归直线方程中待定参数a.b 的涵义是什么?试给出回归直线参数a , b 的推导过程.2.3.2 两个变量的线性相关1.D ;2.B ;3.C ;4.D ;5.C ;6.C ;7.B ;8.C ;10.(1) 直线回归方程为: y c =-26.92+0.92x ;回归系数b 表示当人均收入每增加一元时, 商品销售额平均增加0.92万元.(2) 当x=400时:y c =-26.92+0.92x =341.08 (万元) 11.列出下表,并用科学计算器进行有关计算:i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 i x 70 74 80 78 85 92 90 95 92 108 115 123 130 138 145i y 5.1 6.0 6.8 7.8 9.0 10.2 10.0 12.0 11.5 11.0 11.8 12.2 12.5 12.8 13.0 i i y x357 444 544 608.4765 938.4900 1140 1058 1188 1357 1500.61625 1766.41885101151515==x ,11.10157.151==y ,1611251512=∑=i ix,55.16281512=∑=i iy,8.16076151=∑=i ii yx .设所求的回归直线方程为a bx y +=^,则0937.01011516112511.10101158.160761515221512151≈⨯-⨯⨯-=--=∑∑==xxy x yx b i ii ii , 6463.01010937.011.10≈⨯-=-=x b y a ,∴回归直线方程为)(701.146463.00937.0^t x y =+=.说明:求解两个变量的相关系数及它们的回归直线方程的计算量较大,需要细心、谨慎地计算.如果会使用含统计的科学计算器,能简单得到∑=n i ix 1,∑=n i iy 1,∑=ni iy12,∑=ni iy12,∑=ni ii yx 1这些量,也就无需有制表这一步,直接算出结果就行了.另外,利用计算机中有关应用程序也可以对这些数据进行处理. 12.(1)列表如下:i 1 2 3 4 5i x2 3 4 5 6 i y 2.2 3.8 5.5 6.5 7.0 i i y x 4.4 11.4 22.0 32.5 42.0 2i x491625364=x ,5=y ,90512=∑=i ix ,3.11251=∑=i i i y x .23.145905453.112552251251=⨯-⨯⨯-=--=∑∑==xx yx yx b i i i ii , 08.0423.15=⨯-=-=bx y a .∴线性回归方程为:08.023.1^+=+=x a bx y .(2)当x=10时,38.1208.01023.1^=+⨯=y (万元) 即估计使用10年时维修费用是12.38万元.13. 最小平方法, 回归直线方程中待定参数a 代表直线的起点值,在数学上称为直线的纵轴截距;b 代表自变量增加一个单位时因变量的平均增加值,数学上称为斜率,也称回归系数.。
人教B版高中数学必修三课件2.3.2两个变量的线性相关

7.下表是某地的年降雨量与年平均气温, 判断两者是相关关系吗?求回归直线方程 有意义吗?
年平均气温 12.51 12.84 12.84 13.69 13.33 12.74 13.05 (°C)
年降雨量 748 542 507 813 574 701 432 (mm)
由散点图看出, 求回归直线方 程无实际意义。
(1)求回归方程; (2)若市政府下一步再扩大5千煤气用户, 试预测该市煤气消耗量将达到多少.
解:(1)画散点图并求回归方程
^y=6.0573x+0.0811 (2)当x=5时, y=30.3676≈30.37。
(1)画出散点图: 杯 数
温度
(2)从图中可以看出温度与杯数具有相 关关系,当温度由小到大变化时,杯数 的值由大到小. 所以温度与杯数成负相关.
图中的数据大致分布在一条直线附近, 因此温度与杯数成线性相关关系。 (3)根据不同的标准,可以画出不同的 直线来近似地表示这种线性关系。
如可以连接最左侧和最右侧的点,或者 让画出的直线上方的点和下方的点的数目 数的历史资料如下:
年份
x用户(万 户)
y (百万立 方米)
1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 1 1.2 1.6 1.8 2 2.5 3.2 4 4.2 4.5 6 7 9.8 12 12.1 14.5 20 24 25.4 27.5
y
1 n
n i 1
yi
同样a,b的上方加“^”,表示是由观察 值按最小二乘法求得的估计值。
由于 y bx a,故巧合的是:(xi,yi) (i=1,
2,…,n)的中心点
在(x回, y归) 直线上,x
必修三2.3.2两个变量的线性相关关系

2.3.2 回归直线及其方程教材分析本节内容数学必修3(人教A版)第二章的第三节的第三课,本节课是在学生已经具备了对样本数据进行初步分析的能力,能够根据两个相关变量的数据作出散点图的基础上进行的.本节课介绍线性回归直线的找法、回归方程的求法以及利用线性回归思想对实际问题进行分析与预测,基于本节课的内容特点和学生的年龄特征,首先采用探究式教学方法创设情境,然后教师作为引导者和帮助者,采用启发式教学方法与学生共同经历回归方程的寻找过程来完成教学,为以后研究选修2-3第三章回归分析思想的应用奠定基础.本节课的教学重点是了解最小二乘法和回归分析的思想,根据给出的线性回归方程的系数公式建立回归方程;难点是建立回归思想,理解回归直线与观测数据的关系.通过本节课的自主探究让学生体会数形结合的方法及最小二乘法的数学思想,培养学生观察、分析、比较和归纳能力.课时分配本节内容用3课时的时间完成,这是第二课时,主要是知道最小二乘法和回归分析的思想,能根据线性回归方程系数公式建立回归方程.教学目标重点: 了解最小二乘法和回归分析的思想,根据给出的线性回归方程的系数公式建立回归方程.难点:如何通过数学方法刻画“从整体上看,各点与此直线的距离最小”,并在此过程中了解最小二乘法思想.知识点:根据给出的线性回归方程的系数公式建立回归方程.能力点:探究体会数形结合的方法及最小二乘法的数学思想.教育点:学生通过合作学习、自主学习和探究式学习的方式完成一个完整的数学学习过程.自主探究点:自学例2.考试点:根据给出的线性回归方程的系数公式建立回归方程.易错易混点:如何化简复杂的代数表达式,学生缺乏处理的经验,在计算能力的要求上也较高.拓展点:事件、样本数据、回归直线方程三者关系.教具准备投影仪和三角板课堂模式学案导学一、复习引入【设计意图】为本节课学生能够更好的建构新的知识做好充分的准备,对旧的知识进行简要的提问复习,为能够顺利的完成本节课的内容提供必要的基础.【设计说明】学生动手操作得出散点图回答.【设计意图】通过讨论比较,调动学生的学习积极性和兴趣,活跃课堂气氛.【设计说明】设计该问题,引导学生自己发现问题,鼓励学生大胆表达自己的看法,充分暴露思维过程.发现:图1很乱,两个变量没有相关关系;图2呈上升趋势,图中点的分布呈条状,所有点都落在某一直线的附近,这样由图2自然地引出线性相关、回归直线的概念,同时引入课题. 引入:为此我们引入今天的课题-回归直线及其方程. 【设计意图】循序渐进,符合学生的认知规律.二、探究新知(一)探索回归直线的概念1.回归直线的定义:如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 【设计意图】培养自学能力和数学阅读能力.【设计说明】让学生阅读教材,通过阅读教材学习线性相关,回归直线,回归方程的概念,并分析概念中应注意的问题.注意:概念的前提是点的分布在一条直线附近. (二)探索回归直线的找法结合引例—年龄与体内脂肪含量相关性的散点图观察,思考以下问题.问题1.对一组具有线性相关关系的样本数据,你认为其回归直线是一条还是几条?【设计意图】让学生通过观察、分析,自己发现回归直线的条数只有一条,从而培养学生观察、分析问题的能力.问题2.回归直线与散点图中各点的位置应具有怎样的关系?【设计意图】让学生分析两者的关系,教师引导学生发现两者整体上最接近,以进一步培养学生观察、分析问题的能力.问题3.那么在样本数据的散点图中,能否用直尺准确画出回归直线?【设计意图】让学生动手操作画回归直线,建立回归思想,以分解难点、突破难点,培养学生的动手操作能力.问题4.如果能够求出回归方程,那么我们就可以比较清楚的了解年龄与体内脂肪含量的相关性.那么我们应当如何具体求出这个回归方程呢?对于求回归直线方程,你有哪些想法?【设计意图】充分暴露学生的思维过程, 通过讨论比较,调动学生的学习积极性和兴趣,活跃课堂气氛,培养学生动脑思考问题的能力.【设计说明】结合教材,学生会出现以下方案.方案一:采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置,测出此时的斜率和截距,就是回归方程了.如图脂肪含量脂肪含量方案二:在图中选两点作直线,使直线两侧的点的个数基本相同.如图脂肪含量方案三:如果多取几对点,确定多条直线,再求出这些直线的斜率和截距的平均值作为回归直线的斜率和截距,得回归方程.如图问题5.以上这些方法是不是真的可行?为什么?【设计意图】结合以上三个方案让学生画图,然后教师引导学生讨论、交流方案的可行性,体会回归直线的特征.【设计说明】教师先展示学生画图情况,学生说明理由;然后教师总结回归直线的特征:整体上看散点图中的点到此直线的距离最小.问题6.如何用数学的方法来刻画“从整体上看,各点到此直线的距离小”?【设计意图】这样设疑符合学生的认知规律,增强了学生的求知欲. 【设计说明】教师引导学生进行下面的分析:引导学生以等效性和简化计算为目标,将点到直线的距离转化为自变量x 取值一定时,纵坐标的偏差.这样自然引出下面求回归方程的方法. 问题7.结合以上分析,我们认为以“偏差”最小的直线作为回归直线比较恰当,那你能用代数式来刻画“从整体上看,各点与此直线的偏差最小”吗?【设计意图】几何问题代数化,为下一步探究作好准备,经历“几何直观”转化为“代数表达”过程,为引出“最小二乘法”作准备.【设计说明】假设我们已经得到两个具有线性相关关系的变量的一组数据:11(,)x y ,22(,)x y , ,(,)n n x y .当自变量x 取i x ),,2,1(n i =时,可以得到ˆi y bx a =+),,2,1(n i =,它与实际收集到的i y 之间的偏差(如图)是ˆ()i i i i y yy bx a -=-+),,2,1(n i =.问题8.教师启发学生比较下列三个模型,哪个模型比较可行? 模型一:1ˆ()nii i yy=-∑最小 模型二:1ˆ||nii i yy=-∑最小 模型三:21ˆ()n ii i yy=-∑最小【设计意图】先向学生说明1ni =∑的意义,体会如何选取恰当的计算方法建立回归方程的过程,提高学生分析问题的能力;培养学生的动手操作能力.【设计说明】教师指出:模型一中ˆ()i i y y-可能有正有负,互相抵消怎么办?学生一般会想到加绝对值. 模型二中ˆ||i i y y -去绝对值非常困难(可以提问,让学生思考),是否有其它的方法,同时可以类比方差的处理方法,引导学生思考.师生一起分析后,得出用模型三来制定标准评价一条直线是否为“最好”的直线较为方便. (三) 利用最小二乘法推导回归系数公式问题9.通过对上述问题的分析,我们知道可以用Q =2211ˆ()()nnii i i i i yyy bx a ==-=--∑∑最小来表示偏差最小,那么在这个式子中,当样本点的坐标(,)i i x y 确定时,a ,b 等于多少,Q 能取到最小值呢?【设计意图】体会最小二乘法思想,不经历公式化简无法真正理解其意义,而直接从n 个点的公式化简,教学要求、教学时间、学生能力都没达到这个高度.因而由具体到抽象,由特殊到一般,将是学生顺利完成这一认知过程的一般性原则.通过这个问题,让学生了解这个式子的结构,为后续的学习打下基础,同时渗透最小值的思想.【设计说明】我们采用n 个偏差的平方和Q =2221122()()()n n y bx a y bx a y bx a --+--++-- 表示n 个点与相应直线在整体上的接近程度:记Q =21()nii i ybx a =--∑.通过化简,得到的其实是关于a 、b 的二元二次函数求最值的问题,一定存在这样的a 、b ,使Q 取到最小值. 教师指出:(1)在此基础上,视Q 为b 的二次函数时,根据有关数学原理分析,可求出使Q 为最小值时的b 的值的线性回归方程系数公式:1122211()(),().nnii i ii i nniii i xx y y x ynx y b xx xnxay bx ====⎛--- ==-- =-⎝∑∑∑∑这样,回归方程的斜率为b,截距为 a ,即回归方程为 y b x a =+ .(2)),(y x 称为样本点的中心,可以证明回归直线一定过样本点的中心,所以可得 ay bx =- . 最小二乘法:这种通过上式的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.三、理解新知理解回归系数公式思考1.线性回归方程 y bx a =+ 为何不记为y bx a =+?你能说明对于确定的x ,根据 y bxa =+ 计算出的 y 的意义吗?【设计意图】使学生理解线性回归方程的真正意义与作用,明确 y 只是y 的一个估计值.【设计说明】学生思考,教师帮助学生理解线性回归方程的意义与作用.思考2.这个公式不要求记忆,但要会运用这个公式进行运算,那么,要求 ,ba 的值,你会按怎样的顺序求呢?【设计意图】公式不要求推导,又不要求记忆,学生对这个公式缺少感性的认识,通过这个问题,使学生从感性的层次上对公式有所了解.【设计说明】由于这个公式比较复杂,因此在运用这个公式求 ,ba 时,必须要有条理,先求什么,再求什么.比如,我们可以按照i i x y 、n 、x 、y 、1n i ii x y =∑、21nii x=∑顺序来求,再代入公式.四、运用新知例1.进一步探究引例—年龄与体内脂肪含量【设计意图】公式形式化程度高、表达复杂,通过分解计算,可加深对公式结构的理解.同时,通过例题,反映数据处理的繁杂性,体现计算器处理的优越性.【设计说明】可让学生观察公式,充分讨论,通过计算:i i x y 、n 、x 、y 、1n i ii x y =∑、21nii x=∑六个数据带入回归方程公式得到线性回归方程,体会求线性回归方程的原理与方法.而后教师可偕同学生,对计算器操作方式提供示范,师生共同完成,得出回归直线方程为: 0.6541 4.5659y x =-.(2)利用计算器,根据表二,请同学们独立解决求出表中两变量的回归方程.【设计意图】让学生独立体验运用计算器求回归直线方程,在重复求解回归直线的过程中,使学生掌握利用计算器求回归直线的操作方法.得出回归直线方程为: 0.57650.4478y x =-.【设计说明】学生独立运用计算器求回归直线方程,对于不会操作的学生,教师给予必要的指导.继续思考下列问题:问题1.请同学们从表格中选取年龄x 的一个值代入上述回归直线的方程,看看得出的数据与真实数值之间的关系.如:x =50时,得出估计值为28.3772,而实际值为28.2,有偏差为什么?【设计意图】使学生理解线性回归方程的真正意义与作用,明确 y 只是y 的一个估计值,将x 值带入后肯定有误差.问题2.试预测某人37岁时,他体内的脂肪含量,并说明结果的含义. 【设计意图】进一步理解线性回归方程的真正意义与作用.【设计说明】学生代入计算得20.883.教师进一步提问:我们能不能说他的体内脂肪含量的百分比一定是20.883%?学生思考回答:不能,只能说他体内的脂肪含量在20.90%附近的可能性比较大.问题3.同样问题背景,为什么回归直线不止一条?回归方程求出后,变量间的相关关系是否就转变成确定关系?【设计意图】明确样本的选择影响回归直线方程,体现统计的随机思想.同时,明确其揭示的是相关关系而非函数的确定关系,而且最小二乘法只是某一标准下的一种数据处理方法,使学生更全面的理解回归直线这一核心概念.【设计说明】教师说明回归直线方程由数据唯一决定,提供的数据不同,回归直线方程当然不同,同时回归直线方程又能反映数据的本质.例2.下表是某小卖部6天卖出热茶的杯数与当天气温的对比表(不用计算器直接求回归直线方程):(1)画散点图;(2)从散点图中发现温度与热饮销售杯数之间关系的一般规律; (3)求回归方程;(4)按照回归方程,计算温度为10度时销售杯数.为什么与表中不同?如果某天的气温是-5℃时,预测这天小卖部卖出热茶的杯数.【设计意图】通过此题,让学生完整经历求回归直线过程.其中第4问,让学生体会到即使是相比下“最优”的所获得的回归直线,也存在着一定的误差,从中体会无论方法的优劣,统计学中随机性无法避免.而在预测值的计算中,体现了回归直线的应用价值,加深学生对回归方程的理解,体验数学在实际生活中的应用.【设计说明】①本题不能用计算器运算,以考查学生的运算能力;②本题让学生自学,爬黑板板书过程,教师进一步规范学生的解题步骤; ③结合这两个例题让学生总结求回归直线方程的步骤. 拓展:通过对以上两个案例的分析,思考:事件、样本数据、回归直线方程三者关系.1.数据采样本身就具有随机性,同样23岁的人,脂肪含量可能9.5%,也有可能30%,这种误差我们称之为随机误差,随机误差是不可避免的.2.回归分析是寻找相关关系中非确定关系中的某种确定性,虽然一个数据具有随机误差,但总体还是具有某种确定的关系.3.在数据采样都符合统计要求的情况下,取三个回归直线方程中的任意一个都是合理的,不存在哪条最合适的问题,但一般情况下,选择数据多一些的比较合理. 因此,事件、样本数据、回归直线方程三者具有如下的关系:五、课堂小结教师提问:本节课我们学习了哪些知识,涉及到哪些数学思想方法?学生作答: 1.知识:(1)求回归直线方程的方法.(2)求回归直线方程的步骤: ①先判断变量是否线性相关;②若线性相关,可按下面的步骤求回归直线方程;第一步,计算平均数x 、y ; 第二步,求和1ni i i x y =∑、21ni i x =∑; 第三步,计算1122211()()()nnii i ii i nniii i xx y y x ynx ybxx xnx====---==--∑∑∑∑ ;第四步,写出回归直线方程为 y bxa =+ . ③利用回归方程对生活实际问题进行分析与预测. (3)回归直线方程的作用及意义.2.思想:数形结合、归纳、类比、最小二乘法和回归分析的思想. 教师总结:提醒学生:在学习新知时,也要经常复习前面学过的内容,“温故而知新”.在应用中增强对知识的理解,及时查缺补漏,从而更好地运用知识,解题要有目的性,加强对数学知识、思想方法的认识与自觉运用.【设计意图】培养学生自主梳理知识能力,加强对学生学习方法的指导.六、布置作业1.书面作业预测抽样 统计意义上的反映 决定选取代表 事件样本数据 回归直线方程1.有5(1) (2)关于两个变量之间的关系,你能得出什么结论?2.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准(1)(2)根据上表提供的数据,用最小二乘法求出回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?【设计意图】通过作业的解决,让学生巩固熟悉回归方程求解的过程,并体会运用回归方程进行预测. 2.课外思考利用最小二乘法求出回归直线的方程后,可以对上面两个变量的关系进行分析与预测. 思考:是不是所有的相关关系都可以求出回归直线的方程?请大家观察这两幅图:【变量之间的关系.显然求回归直线的方程是没有意义的.有些变量线性相关,有些非线性相关,怎样衡量变量的线性相关程度呢?带着这个问题让学生课后阅读第92页的内容.【设计意图】设计书面作业必做题,是引导学生先复习,再作业,培养学生良好的学习习惯.书面作业的布置,是为了让学生进一步掌握求回归直线方程的步骤;课外思考的安排,是让学生在应用知识的同时开阔了学生视野,将课堂内涵延伸到课外.七、教后反思1.本教案的亮点是整个教学设计过程采用研究性学习方法,由学生自己去探究,去解决问题.不是生硬的抛出,而是水到渠成.例题也是变讲为练,都是学生在独立或小组讨论中解决的,很好的调动学生的积极性与主动性,提高了学生的解题能力.2.由于各校的情况不同,建议教师在使用本教案时灵活掌握,但必须在求回归直线方程的步骤上下足功夫.3.本节课的弱项是课容量大,时间所限,在课堂上没有充分暴露学生的思维过程,感觉一节课下来比较紧,学生理解不透彻,尤其是学生对回归直线的找法还存在一定的困难.。
数学知识点人教A版高中数学必修三 2.3.2 《两个变量的线性相关》 第2课时示范教案-总结

高中数学(2.3.2 两个变量的线性相关第2课时)示范教案新人教A版必修3导入新课思路1客观事物是相互联系的,过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系.比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说.事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度.所以说,函数关系存在着一种确定性关系,但还存在着另一种非确定性关系——相关关系.为表示这种相关关系,我们接着学习两个变量的线性相关——回归直线及其方程.思路2某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与题我们接着学习两个变量的线性相关——回归直线及其方程.推进新课新知探究提出问题(1)作散点图的步骤和方法?(2)正、负相关的概念?(3)什么是线性相关?(4)看人体的脂肪百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢?(5)什么叫做回归直线?(6)如何求回归直线的方程?什么是最小二乘法?它有什么样的思想?(7)利用计算机如何求回归直线的方程?(8)利用计算器如何求回归直线的方程?活动:学生回顾,再思考或讨论,教师及时提示指导.讨论结果:(1)建立相应的平面直角坐标系,将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)(2)如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关的关系.(4)大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加,呈正相关的趋势,我们可以从散点图上来进一步分析.(5)如下图:从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附近.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线(regression line).如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性.就像平均数可以作为一个变量的数据的代表一样,这条直线可以作为两个变量具有线性相关关系的代表.(6)从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线.那么,我们应当如何具体求出这个回归方程呢?有的同学可能会想,我可以采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置,测量出此时的斜率和截距,就可得到回归方程了.但是,这样做可靠吗?有的同学可能还会想,在图中选择这样的两点画直线,使得直线两侧的点的个数基本相同.同样地,这样做能保证各点与此直线在整体上是最接近的吗?还有的同学会想,在散点图中多取几组点,确定出几条直线的方程,再分别求出各条直线的斜率、截距的平均数,将这两个平均数当成回归方程的斜率和截距.同学们不妨去实践一下,看看这些方法是不是真的可行?(学生讨论:1.选择能反映直线变化的两个点.2.在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.3.多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.)教师:分别分析各方法的可靠性.如下图:上面这些方法虽然有一定的道理,但总让人感到可靠性不强.实际上,求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与此直线的距离最小”.人们经过长期的实践与研究,已经得出了计算回归方程的斜率与截距的一般公式⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====.)1(,)())((2121121x b y a x n x yx n yx x x y y x x b n i i ni ii n i i ni i i其中,b 是回归方程的斜率,a 是截距.推导公式①的计算比较复杂,这里不作推导.但是,我们可以解释一下得出它的原理.假设我们已经得到两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ), 且所求回归方程是^y =bx+a,其中a 、b 是待定参数.当变量x 取x i (i=1,2,…,n)时可以得到^y =bx i +a(i=1,2,…,n), 它与实际收集到的y i 之间的偏差是y i -^y =y i -(bx i +a)(i=1,2,…,n).这样,用这n 个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的.由于(y i -^y )可正可负,为了避免相互抵消,可以考虑用∑=-ni i iy y1^||来代替,但由于它含有绝对值,运算不太方便,所以改用Q=(y 1-bx 1-a)2+(y 2-bx 2-a)2+…+(y n -bx n -a)2② 来刻画n 个点与回归直线在整体上的偏差.这样,问题就归结为:当a,b 取什么值时Q 最小,即总体偏差最小.经过数学上求最小值的运算,a,b 的值由公式①给出.通过求②式的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法(method of least square ). (7)利用计算机求回归直线的方程.根据最小二乘法的思想和公式①,利用计算器或计算机,可以方便地求出回归方程.以Excel 软件为例,用散点图来建立表示人体的脂肪含量与年龄的相关关系的线性回归方程,具体步骤如下:①在Excel 中选定表示人体的脂肪含量与年龄的相关关系的散点图(如下图),在菜单中选定“图表”中的“添加趋势线”选项,弹出“添加趋势线”对话框.②单击“类型”标签,选定“趋势预测/回归分析类型”中的“线性”选项,单击“确定”按钮,得到回归直线.③双击回归直线,弹出“趋势线格式”对话框.单击“选项”标签,选定“显示公式”,最后单击“确定”按钮,得到回归直线的回归方程^y =0.577x-0.448.(8)利用计算器求回归直线的方程.用计算器求这个回归方程的过程如下:所以回归方程为^y =0.577x-0.448.正像本节开头所说的,我们从人体脂肪含量与年龄这两个变量的一组随机样本数据中,找到了它们之间关系的一个规律,这个规律是由回归直线来反映的. 直线回归方程的应用:①描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系. ②利用回归方程进行预测;把预报因子(即自变量x )代入回归方程对预报量(即因变量Y )进行估计,即可得到个体Y 值的容许区间.③利用回归方程进行统计控制规定Y 值的变化,通过控制x 的范围来实现统计控制的目标.如已经得到了空气中NO 2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO 2的浓度. 应用示例思路1例1 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律; (3)求回归方程;(4)如果某天的气温是2 ℃,预测这天卖出的热饮杯数. 解:(1)散点图如下图所示:(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式①求出回归方程的系数.利用计算器容易求得回归方程^y =-2.352x+147.767.(4)当x=2时,^y =143.063.因此,某天的气温为2 ℃时,这天大约可以卖出143杯热饮. 思考气温为2 ℃时,小卖部一定能够卖出143杯左右热饮吗?为什么? 这里的答案是小卖部不一定能够卖出143杯左右热饮,原因如下:1.线性回归方程中的截距和斜率都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果的偏差.2.即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x 的预报值,能够与实际值y 很接近.我们不能保证点(x,y )落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近,事实上,y=bx+a+e=^y +e.这里e 是随机变量,预报值^y 与实际值y 的接近程度由随机变量e 的标准差所决定. 一些学生可能会提出问题:既然不一定能够卖出143杯左右热饮,那么为什么我们还以“这天大约可以卖出143杯热饮”作为结论呢?这是因为这个结论出现的可能性最大.具体地说,假如我们规定可以选择连续的3个非负整数作为可能的预测结果,则我们选择142,143和144能够保证预测成功(即实际卖出的杯数是这3个数之一)的概率最大.由;(2)如果具有线性相关关系,求出线性回归方程.解:(1)在直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系. (2)计算相应的数据之和:∑=81i ix =1 031,∑=81i iy=71.6,∑=812i ix=137 835,∑=81i ii yx =9 611.7.将它们代入公式计算得b≈0.077 4,a=-1.024 1, 所以,所求线性回归方程为=0.077 4x-1.024 1.思路2(2)求出回归直线的方程. 解:(1)散点图如下图.b=230770003.39930787175⨯-⨯⨯-≈4.75,a=399.3-4.75×30≈257.从而得回归直线方程是^y =4.75x+257.例2 一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,测得解:在直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:∑===1012,7.91,55i ix y x =38 500,∑=1012i iy =87 777,∑=101i i i y x =55 950.b=22101210155********.915510559501010⨯-⨯⨯-=--∑∑==x xyx yx i ii ii≈0.668.a=x b y -=91.7-0.668×55≈54.96.因此,所求线性回归方程为^y =bx+a=0.668x+54.96.(2)求出回归直线的方程. 解:(1)散点图如下.(2)101=x (45+42+46+48+42+35+58+40+39+50)=44.50, 101=y (6.53+6.30+9.52+7.50+6.99+5.90+9.49+6.20+6.55+8.72)=7.37. 设回归直线方程为^y =bx+a,则b=210121011010x xyx yx i ii ii --∑∑===0.175,a=x b y -=-0.418,所以所求回归直线的方程为^y =0.175x-0.148.点评:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a,b 的计算公式,算出a,b .由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误,求线性回归方程的步骤:计算平均数y x ,;计算x i 与y i 的积,求∑x i y i ;计算∑x i 2;将结果代入公式求b ;用a=x b y -求a ;写出回归直线方程.知能训练1.下列两个变量之间的关系哪个不是函数关系( )A.角度和它的余弦值B.正方形边长和面积C.正n边形的边数和它的内角和D.人的年龄和身高 答案:D2.三点(3,10),(7,20),(11,24)的线性回归方程是( ) A.^y =5.75-1.75x B.^y =1.75+5.75x C.^y =1.75-5.75x D.^y =5.75+1.75x答案:D(1)线性回归方程^y =bx+a 的回归系数a,b ;(2)估计使用年限为10年时,维修费用是多少? 答案:(1)b=1.23,a=0.08;(2)12.38.4.我们考虑两个表示变量x 与y 之间的关系的模型,δ为误差项,模型如下: 模型1:y=6+4x ;模型2:y=6+4x+e .(1)如果x=3,e=1,分别求两个模型中y 的值;(2)分别说明以上两个模型是确定性模型还是随机模型. 解:(1)模型1:y=6+4x=6+4×3=18; 模型2:y=6+4x+e=6+4×3+1=19.(2)模型1中相同的x 值一定得到相同的y 值,所以是确定性模型;模型2中相同的x 值,因δ的不同,所得y 值不一定相同,且δ为误差项是随机的,所以模型2是随机性模型.(2)用最小二乘法估计求线性回归方程. 解:(1)散点图如下图.(2)n=5,∑=51i ix=545,x =109,∑=51i iy=116,y =23.2,∑=512i ix=60 952,∑=51i ii yx =12 952,b=2545609525116545129525-⨯⨯-⨯≈0.199,a=23.2-0.199×109≈1.509, 所以,线性回归方程为y=0.199x+1.509. 拓展提升某调查者从调查中获知某公司近年来科研费用支出(X i )与公司所获得利润(Y i )的统计资料如下表:i i 解:设线性回归模型直线方程为:i i X Y 1^0^^ββ+=,因为:630==∑nXxi=5,6180==∑nYY i=30,01方法一:3006009001200540060003020061803010006)(2221^=--=-⨯⨯-⨯=--=∑∑∑∑i i ii i X X n Y Y X n β=2, x Y 1^0^ββ-==30-2×5=20.方法二:501005620030561000)(2221^=⨯-⨯⨯-=--=∑∑x n X Y x n Y X ii i β=2, x Y 1^0^ββ-==30-2×5=20.方法三:50100)())((21^=---=∑∑x X Y Y x X ii iβ=2,x Y 1^0^ββ-==30-2×5=20.所以利润(Y i )对科研费用支出(X i )的线性回归模型直线方程为:i Y ^=20+2X i . 课堂小结1.求线性回归方程的步骤: (1)计算平均数y x ,; (2)计算x i 与y i 的积,求∑x i y i ;(3)计算∑x i 2,∑y i 2,(4)将上述有关结果代入公式⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=---=∑∑∑∑====xb y a x n x yx n yx x x y y x x b n i i ni ii ni i ni i i ,)())((1221121求b,a,写出回归直线方程.2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 作业习题2.3A 组3、4,B 组1、2.设计感想本节课在上节课的基础上,利用实例分析了散点图的分布规律,推导出了线性回归直线的方程的求法,并利用回归直线的方程估计可能的结果,本节课讲得较为详细,实例较多,便于同学们分析比较.思路1和思路2的例题对知识进行了巩固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育和增强学生的自信心,养成良好的学习态度,树立时间观,培养勤奋、刻苦的精神.。
人教版数学必修三第二章2.3.2 两个变量之间的线性相关 教学课件(共22张PPT)

我们还可以举出现实生活中存在的许多相关 关系的问题。例如:
1〉商品销售收入与广告支出经费之间的关系。
商品销售收入与广告支出经费之间有着密切的联系, 但商品收入不仅与广告支出多少有关,还与商品质
量、居民收入等因素有关。
2〉粮食产量与施肥量之间的关系。
在一定范围内,施肥量越大,粮食产量就越高。 但是,施肥量并不是决定粮食产量的唯一因素, 因为粮食产量还要受到土壤质量、降雨量、田 间管理水平等因素的影响。
如高原含氧量与海拔高度 的相关关系,海平面以上, 海拔高度越高,含氧量越少。
作出散点图发现,它们散 布在从左上角到右下角的区 域内。又如汽车的载重和汽 车每消耗1升汽油所行使的 平均路程,称它们成负相关.
O
思考:课本P86的思考题.
正、负相关、线性相关 概念探究
• 请同学们观察这4幅图,看有什么特点?
变量间相关关系的概念: 自变量取值一定时,因变量的取 值带有一定随机性的两个变量之间的关系,叫做相关关系.
请同学们回忆一下,我们以前是否学过变量间的关系呢?
两个变量间的函数关系.
相关关系与函数关系的异同点: 相同点:两者均是指两个变量间的关系. 不同点:①函数关系是一种确定的关系;相关关系是一种 非确定的关系.事实上,函数关系是两个非随机变量的关
脂肪含量 40
35
30
25
20
15
10
5
0
图1
0 5 10 15 20 25 30 35 40 45 50 55 60 65
年龄
1000 800 600 400 200 0 0
图1
10
09
80
70
60
50
40
30
人教版高中数学必修三第二章第3节 2.3.2两个变量的线性相关 课件

案例:年龄与人体脂肪含量的关系
计算回归直线方程斜率和截距的公式:
n
n
(xi x)(yi y)
xi yi nx y
bˆ i1
n
(xi x)2
i1 n
,
xi2 nx2
回aˆ 归 y直线bix1方. 程其中yˆ,b是bˆx斜i率1 a,ˆ a是截距。
2.3.2两个变量的线性相关
10年后的你,会是怎样 呢?20、30年后呢?
Back to school
10年后的我,会是 怎样呢?有多帅? 20、30年后呢?
Back to school
2.3.2两个变量的线性相关(第1课时)
型体变胖?体内脂肪含量增 加?年龄与人体内的脂肪百 分比有关?如果有关,根据 已学知识这是一种什么样的 关系呢?
统计的思维方法,就像 读与写的能力一样,将 来有一天会成为效率公 民的必备能力。 ——英国学者威尔斯
1.成为世界上经济增长速度最快的国 家,创 造了世 界经济 增长史 上的新 奇迹。 1.否定商 品经济 的存在 ,否定 市场及 价值规 律对经 济的调 节作用 。 35、生命是以时间为单位的,浪费别 人的时 间等于 谋财害 命;浪费 自己的 时间, 等于慢 性自杀 。—— 鲁迅 36、社会上崇敬名人,于是以为名人的 话就是 名言, 却忘记 了他之 所以得 名是那 一种学 问或事 业--鲁迅 38、推销员接近顾客的方式,往往决 定自己 在他们 心目中 的地位 是“接 单者” 还是“ 建议者 ”。 39、事先写出自己所要提出的每点意 见,以 合乎逻 辑的顺 序表达 出来: 言简意 骇,抓 住重点 。 2、人生的成功,不在于拿到一幅好 牌,而 是怎样 将坏牌 打好。 3、人生的路每一个人都要走一趟, 同样是 一条路 每一个 人走起 来却有 着不同 的感受 ,是好 是坏那 就要靠 几分的 机缘与 自己的 抉择。 38、推销员接近顾客的方式,往往决 定自己 在他们 心目中 的地位 是“接 单者” 还是“ 建议者 ”。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
导入新课
1. 变量之间的相互关系
两个变量之间的关系,可能是确定关系或非确定关系。
当自变量却只一定,因变量的取值带有一定随机性时,两个变量之间的关系成为相关关系。
相关关系是一种不确定性关系。
2. 前面我们学习了现实生活中存在许多相关关系:商品销售与广告、粮食生产与施肥量、人体的脂肪量与年龄等等的相关关系。
3. 通过收集大量的数据,进行统计,对数据分析,
找出其中的规律,对其相关关系作出一定判断.
4. 由于变量之间相关关系的广泛性和不确定性,所以
样本数据应较大和有代表性,才能对它们之间的关系作出正确的判断。
教学目标
知识与技能
1.最小二乘法;
2.建立线性回归方程;
3.理解变量之间的相关关系。
过程与方法
在解决统计问题的过程中,逐步体会用变量间相关关系,理解数形结合的数学思想和逻辑推理的数学方法。
情感态度与价值观
会用变量之间的相关关系解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系。
C
教学重难点
重点
1.了解最小二乘法的思想;
2.根据给出的线性回归方程的系数公式建立线性回归方程,变量之间相关关系的理解。
难点
回归思想的建立;
对回归直线与观测数据的关系的理解。
在一次对人体脂肪含量和年龄的关系研究
:
中,研究人员获得了一份样本数据
什么样的关系?
分析:从总体上看随着年龄的增长,脂肪含量也在增加,为了确定这一关系的细节,我们需要对数据进行分析,我们可以通过前面的做统计图表的方法分析,我们可以对两个变量间的关系有一个直观上的影响和判断.我们也可以通过下面的图(散点图(scatter plot))来分析:
20253035404550556065年龄脂肪含量
05
10
15
20
25
30
35
40
通过分析、观察可以看到:随着年龄的增长,人体脂肪含量越高,这表明两个变量之间的确存在一定的关系。
递增我们叫它们正相关递减我们叫它们负相关20253035404550556065年龄脂肪含量
05
10
15
20
25
30
35
40
知识要
点
回归直线
从散点图可以看出:所有的点大致在一条直线附近波动,我们称这两个变量间存在线性相关关系,这条直线叫做回归直线(regression line)。
如果可以求出这条直线的方程(回归方程),那么我们就可以比较清楚的了解年龄与体内脂肪含量的相关性.这条直线就可以作为两个变量具有线性相关关系的代表
怎样求线性回归方程呢?
想一想
方法
1. 测量法:移动直线l 使所有点到它的距离之和最小
2.两点确定法:选取两点作直线,使其两边点个数
一样
3.分组法:将点进行分组点,分别求其斜率和截距,
求平均值
如何用你熟悉的数学知识来刻画“从整体上看各点与此直线距离最短”呢?
人们经过长期的实践与研究,已经找到了计算回归方程的斜率与截距的一般公式:
最小二乘法。
知识要
点
最小二乘法
即各点到该直线的距离的平方和最小,这一方法叫最小二乘法。
{11211()()),
22()n n
i i i i i i n n i i x y nx y b i i a y bx
y y x x x n x x x ====---===-∑∑∑∑--最小二乘法的计算公式:
下表是某小卖部6天卖出热茶的杯数(y)与当天气温(x)的对比表:
(1)试用最小二乘法求出线性回归方程;
(2)如果某天的气温是-3℃,请预测这天可能会卖出热茶多少杯?
解:
(1)作散点图如图所示
由散点图知两个变量是线性相关的,计算各
种数据如下表:
分步计算
减少出错
于是:则:于是,线性回归方程为y=57.557-1.648x 35115,33351151910633 1.64857.55735351286633b a y x -
-==-⨯⨯=≈-≈-⨯⨯(2)由回归方程知,当某天的气温是-3℃时,卖出的热茶杯数为
57.557-1.648×(-3)≈63(杯)
课堂小结
1. 回归直线
从散点图可以看出:所有的点大致在一条直线附近波动,我们称这两个变量间存在线性相关关系,这条直线叫做回归直线(regression line)。
2. 最小二乘法法
即各点到该直线的距离的平方和最小,这一方法叫最小二乘法。
3. 最小二乘法法的步骤
1.首先要作出数据的散点图,利用散点图观察数据是否具有线性关系;
2.散点图呈现线性关系时,利用最小二乘公式求出回归方程;
3.求出相应的解。
1(2009宁夏、海南)对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(u i,v i)(i=1,2,….,10),得散点图②。
由这两个散点图可以判断()
高考链接C
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
解析:
本题主要考查两个变量的线性相关性,由图①可看出离散点分布在一条斜率为负的直线周围,所以变量x,y成负相关;而图②的离散点分布在一条斜率为正的直线周围,所以变量u,v成正相关。
1. 球的体积和球的半径具有()
A. 函数关系
B. 相关关系
C. 不确定关系
D. 无任何关系
2. 下列两个变量之间的关系不是函数关系的是(
)
A.角的度数和正弦值
B. 速度一定时,距离和时间的关系
C. 正方体的棱长和体积
D. 日照时间和水稻的亩产量A D 随堂练习
D 3.三点(3,10),(7,20),(11,24)的线性回归方程是( )
ˆ
=-
A. 5.75 1.75
y x
ˆ
B. 1.75 5.75
y x
=+
ˆ
C. 1.75 5.75
=-
y x
ˆ
=+
y x
D. 5.75 1.75
1.当x=0时,,这个值与实际卖出的热饮杯数150不符,原因是:线性回归方程中的截距和斜率都是通过样本估计的,存在随机误差,这种误差可以导致预测结果的偏差;即使截距和斜率的估计没有误差,也不可能百分之百的保证对应于x ,预报值能够等于实际值y 。
事实上,,这里的e 是随机值,预报值与实际值y 的平均接近程度有随机值e 的标准差所决定。
ˆy =147.767y
ˆˆy =bx +a +e =y +e ˆy 习题答案
2.数据的热点散图为:
从这个热点图中可以看出,鸟的种类数与海拔高度应该为正相关(事实上相关系数为0.793)。
但是从热点分布特点来看,它们之间线性相关性不强。