两个变量的线性相关

两个变量的线性相关
两个变量的线性相关

《2.3.2两个变量的线性相关》

一、内容和内容解析

本节课是人教A版高中数学必修三2.3.2两个变量的线性相关的第二课时。上节课通过大量的生活实例,学生已经初步认识两个变量间的相关关系,并可以借助散点图呈现收集的数据。通过对单变量样本数据中“平均数的几何意义”(切合学生的认知需要)的介绍,为本节课的内容做了铺垫。本节课的主要内容是用最小二乘法求线性回归方程,基础知识是回归直线的概念,也是本节课的核心概念;基本思想是“最小二乘法”思想;根据线性回归方程的系数公式求回归直线是本节课的基本技能.

就统计学科而言,对不同的数据处理方法进行“优劣评价”是“假设检验”的萌芽,而后者是统计学学科研究的另一重要领域.了解“最小二乘法”思想,比较各种“估算方法”,体会它的科学性,既是统计学教学发展的需要,又在体会此思想的过程中促进学生对核心概念的进一步理解.“样本估计总体”是本节课的上位思想也是整个第二章的核心思想,而“最小二乘法思想”作为本节课的核心思想,由此得以体现.回归思想和贯穿统计学科中的随机思想,也在本节课中有所渗透.

本节课通过引导学生经历“收集数据——整理数据(作散点图)——探究并确定回归直线的数学意义——求回归直线方程——应用”完整的回归分析的过程,鼓励学生独立思考、自主探究、合作交流和计算机操作等方式展开学习,从而发挥本节课的育人价值。整个学习过程渗透了数据分析和数学建模的核心素养。通过引导学生对散点图中的点大致分布在一条直线附近的观察,渗透直观想象的核心素养;通过尝试提出找回归直线的想法、用自己的语言描述对这条直线的初步认识到探究从数学的角度定义回归直线的过程,渗透数学抽象和逻辑推理的核心素养;最后,根据回归直线方程的系数公式,引导学生先求出公式中的基本统计量,再代入公式的过程和指导学生利用Excel电子表格求回归方程的过程,提升数学运算的核心素养。

基于上述内容分析,本节课的教学重点为:了解最小二乘法思想,并能根据给出的线性回归方程的系数公式,建立线性回归方程

二、目标和目标设置

基于对本节课教学内容的解析,结合《普通高中数学课程标准(2017年版)》的要求,制定本节课的教学目标如下:

1.了解一元线性回归模型的含义:

(1)能根据散点图解释两个相关变量的线性相关关系;

(2)能用自己的语言解释回归直线的统计意义;

2.了解最小二乘原理:

(1)经历用不同方法确定回归直线的过程,能认识到回归直线是“从整体上看,各点与此直线上的点的距离最小”的直线;

(2)能用数学符号刻画“从整体上看,各点与此直线上的点的距离最小”的表达方式;

(3)通过对表达方式的转化(距离最小到偏差平方和最小),体会最小二乘法原理,并能用自己的语言表述;

3. 针对实际应用问题,能根据给出的线性回归方程系数公式建立线性回归方程;

4. 在经历完整的线性回归分析的过程中,重点提升数据分析和数学建模核心素养;

5. 针对实际应用问题,会用一元线性回归模型进行预测.

三、学生学情分析

在经历用不同估算方法描述两个变量线性相关的过程后,在学生现有知识能力范围内,如何选择一个最优方法,成为知识发展的逻辑必然.而上节课的“从平均数的几何意义说起”符合学生的认知需要和支撑点,同时引起了学生的兴趣,为这节课的最小二乘法思想的产生做了重要的铺垫.

“最小二乘法”作为经典的回归方程估算方法,通过用数学方法刻画“从整体上看,各点与此直线的距离最小”这一直观的几何描述,采取合适的数学处理方法,最终获得回归直线,对学生认可统计估算的科学性有很大帮助.其中对于数形结合发现距离与偏差的等价性,二元二次函数的特征辨识等都是这节课学生所要具备的认知基础.

基于此,如何把“从整体上看,各点与此直线的距离最小”用合适的代数符号刻画并化简,化几何问题为代数问题,是学生顺利了解解“最小二乘法”思想的前提;而如何化简复杂的代数表达式,学生缺乏处理的经验,在计算能力的要求上也较高,这里就造成了已有认知与现需认知的差异,而且是学生不能独立突破的.要了解“最小二乘法思想”,接受“由系数公式得到的线性方程”为回归方程,理解此方程可作为“两个具有线性相关关系的变量的代表”这一回归直线概念的本质,并体现相对于其他估算方法法的优越性,又必须要求对给出的系数公式来源进行一定的说理,这里的认知差异也是学生无法自己消除的,需要老师的引导和帮忙.

知识发展的要求与学生能力和经验的欠缺成为本节课将会遇到的最大矛盾.教学中,要防止两种倾向:一是直接套用回归系数公式求解回归方程而回避说理过程;二是过多纠缠于数学刻画过程,甚至在课堂上花大量时间对回归系数公式进行证明说理.这两种倾向,都脱离了实际情况,前者忽略了“最小二乘法思想”,迷失了本节课的教学目标;后者人为拔高教材要求,脱离了本节课教学要求.

所以,本节课的教学难点是:如何通过数学方法刻画“从整体上看,各点与此直线的距离最小”,并在此过程中了解最小二乘法思想.对于该教学难点,教师通过精准问题串层层分解学生认知的难点,不断寻找学生的认知原点,关键处动画展示,直观形象,突破教学难点.本节课涉及大量数据计算,形成操作上的一个难点,通过小组合作,教师培训模式突破难点.

四、教学策略分析

本节课在课前让学生收集身高与体重的数据,一方面对前面学过的知识有一个巩固,同时让本节课进行线性回归分析的过程更加完整;二是从学生身边的真实数据出发,更容易促进学习动机,而且给学生带来的体验也更为真实。对回归直线概念的学习,采用概念形成和概念同化相结合的策略。从自然语言描述上,回归直线是“从整体上看,各点与此直线的距离最小”的一条直线,“总偏差平方和最小”是回归直线的数学符号表示。这里通过精心设计“问题串”引导学生经历充分的思维活动过程,是本节课落实数学基本活动经验的最佳机会。具体来说,考虑让学生带着“同学们想做什么?或者说利用学过的统计知识你能做些什么?”这样的问题,在得出散点图后,直观感知“点”的分布特点,实际上也是在培养学生“发现问题”、“提出问题”的能力;通过让学生“尝试画出你认为合适的回归直线”的活动,给予学生独立思考的时间和空间,再通过让学生展示自己画的回归直线,引导学生对回归直线的标准有一个模糊的初步的想法。在此基础上提出如何给回归直线一个定量的数学的标准的问题。通过借助几何画板动态演示,帮助学生理解从“距离的和的最小”到“总偏差平方和最小”的转化过程,完成对回归直线概念的形成过程。除此之外,上节课利用“平均数的几何意义”的案例做了铺垫,本节课再类比标准差公式的学习过程,实际上是采用了先行组织者策略帮助学生同化回归直线的概念。新课标相对于老课标(修订版)在教学目标上增加了“会使用相关统计软件”的要求,采用小组合作学习的方式,更能在探究和上机操作的过程中帮助基础薄弱的学生学习。另外,手机拍照投屏技术可以及时将学生讨论的结果展示给所有学生,帮助老师及时获得反馈,也有助于学生在心理上形成与他人的比较,帮助学生逐

渐形成自我评价的意识。最后考虑结合国策作为作业的背景材料,也是体现教学中要有立德树人的意识。

五、教学过程设计

(一)知识回顾,导入新课

1.两个变量之间有几种关系?

2.从“平均数”的几何意义说起

师生活动:两个变量之间有两种关系,即函数关系和相关关系.通过平均数是数轴上一组数据最靠近的一个“代表值”,但是这是一个单变量样本数据的问题,日常生活中涉及的大多数是多变量的问题,比如课前收集的身高与体重就是一个双变量样本数据的问题

(二)初步探索,直观感知

面对收集来的样本数据,同学们想做什么?或者说利用学过的统计知识你能做些什么?

利用电子表格作出散点图,直观感知两个变量之间的线性相关关系及回归直线(板书)

数学实验1:寻找回归直线——请同学们在学案上尝试画出你认为合适的回归直线

问题1:如何评价这些“直线”的优劣?是否有个评价标准?

【设计意图】能够进行数学抽象,达到新课标的水平一,即在熟悉的情境中直接抽象出数学概念和规则,能够在特例的基础上归纳并形成简单的数学命题,能够模仿学过的数学方法解决简单问题.在上节课平均数的几何意义的基础上,学生通过散点图对寻求回归直线的优劣展开思考,对于所有的点要突出“整体”二字,于是提出“从整体上看,各点与此直线的距离和最小”这一评价标准,对比几何描述的直观性和代数表达的便捷性,揭示两者是同一标准下不同表述.

师生活动:通过面对样本数据,感受核心思想“利用样本估计总体”.通过作出散点图发现两个变量线性相关关系及回归直线.寻求的可能方案:(1)回归直线是过散点最多的直线;(2)回归直线是使上下点基本平均分布的直线;(3)回归直线是过两个端点的直线;(4)回归直线是经过样本中心的直线;(5)回归直线是各点与之距离最小的直线;(6)多画几条直线,取它们的斜率、截距的平均数作为回归直线的斜率.由此自然出现一个问题:各种处理方法是否合理?哪条“最合适”?类比平均数的几何意义,感受样本数据点与相应直线在整体上是最接近的,“接近”,数学上是如何量化的.于是引出了评价优劣的标准为“从整体上看,各点与此直线的距离和最小”. 由于具有几何直观性,学生易于接受此标准,达成“几何”与“代数”的转化.

(三)循序渐进,延伸拓展

问题2:你能用代数式刻画“从整体上看,各点与此直线的距离和最小”吗?

问题3:距离可以用别的形式代替吗?

问题4:作为判断优劣的标准,距离和偏差可以等价吗?

问题5:偏差有正有负,因此它们的和并不能反映“从总体上来看,各点与直线的偏差最小”,怎样解决这个问题呢?

【设计意图】能够在熟悉的情境中,发现问题并转化为数学问题,建立数学模型,进行数据分析.通过问题,引导学生进人深层次的思考,为下一步探究作好准备.经历“几何直观”转化为“代数表达”过程,体会“最小二乘法” 思想.

师生活动: 利用几何画板介绍偏差处理法的优越性和等价性,达成“距离”与“偏差”的转化.假设样本数据为:11(,)x y 22(,)x y ……(,)n n x y .当自变量x 取i x (i =1,2,……,n )时,

可以得到?i y bx a =+(i =1,2,……,n ),它与实际收集到的i y 之间的偏差是

?()i i i i y y y bx a -=-+(i =1,2,……,n ),故偏差和为1112???()()()n n Q y y

y y y y =-+-++-,偏差有正有负,易抵消,所以学生生可能会存在如下回答:(1)每项加绝对值,这样全部变成正数;(2)每项加平方.类比前面方差的学习,大家不难达成共识选(2),这样就形成二乘法思

想,即 2222112233()()()()n n Q y bx a y bx a y bx a y bx a =--+--+--+???+--

问题6:显然a ,b 是未知量,i x ,i y 是已知量 ,那么下面的表达式具有什么样的函数特征?

【设计意图】不经历公式化简,无法真正理解最小二乘法思想.而直接从n 个点的公式化简,教学要求、教学时间、学生能力都没达到这个高度.而由具体到抽象,由特殊到一般,是学生顺利完成认知过程的一般性原则.通过此问,让学生了解这个式子的结构,为后续学习打下基础.

师生活动:通过令式子等于Q 观察其函数特征,可以发现其实是关于a ,b 的二元二次函数求最值的问题,即我们要求的是当a ,b 取什么值时,使Q 取到最小值,即所有点到直线的整体距离最小.

上述这种通过求Q 的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法,叫做最小二乘法.其中“二乘”指的是平方,最小即使得Q 最小. 在此基础上,给出使Q 为最小值时的a ,b 的值的线性回归方程系数公式

222()()11()11

i i i i i i n n x x y y x y nxy i i b n n x x x nx i i ---∑∑====--∑∑==,a y bx =- 对于公式的推导及证明,我们将在后面的学习中深入展开.

问题7:运用这个公式进行运算,你按怎样的顺序求解呢?

【设计意图】能够针对运算问题,合理选择运算方法,设计运算程序,解决问题,体现了数学的核心素养.但公式不要求推导(推导过程参见《选修2-3》第三章3.1节),又不要求记忆,学生对这个公式缺少感性的认识.通过这个问题,使学生从感性的层次上对公式有所了解.

师生活动: 这个公式不要求记忆,由于这个公式比较复杂,因此在运用这个公式求a ,b 时,必须要有条理,先求什么,再求什么,比如,我们可以按照的顺序来求,再代入公式.

(四)实际应用,知识深化

问题1:观察公式,根据我们收集的数据,需要计算哪些新数据,才能求出线性回归方程系数?计算量大不大?我们用计算机代替,请大家自主进行操作

【设计意图】公式形式化程度高、表达复杂.通过分解,加深对公式结构的理解.同时,通过数据处理的繁杂过程,体现计算器处理的优越性.

师生活动:师生共同得出211,,,,n n i i

i i i n x y x y x ==∑∑这五个新数据.学生自主完成计算机操作(操作

流程拷贝在学生电脑上),最后教师进行操作示范,点评,师生共同完成.

问题2:利用计算机,请同学们独立完成电脑上的例题(即课本上91页例题).

师生活动:教师巡视,适时指导辅助,最后操作演示,并对估计的结果的随机性作出说明.

(五)归纳总结,内化知识

【设计意图】思维导图式的对课堂知识和思想的两层总结、提炼

师生活动: 师生共同小结

(六)作业布置,创新应用

我国是一个人口大国,由于二胎政策的放开,估计人口数量及发展趋势是我们制定经济发展计划等一系列相关政策的基础,人口数量预测是一个复杂的问题,不仅是人口与时间两个变量之间的关系,还与国家经济状况,科技发展,自然灾害和战争等其他因素有关.上网收集我国近15年人口数量,并利用统计知识对收集到的数据进行分析,并预测2020年我国人口数.

【设计意图】学习材料的选择是学生自身的身高和体重的数据,渗透了数学源于生活,材料的选择更能引起学生兴趣,而作业的背景材料选择结合国策,促进知识的保持与迁移,同时也是对立德树人的体现

(七)板书设计

六、课堂教学目标检测

1.完成课本85页“探究”:人体的脂肪百分比和年龄的回归直线方程;

2.从以上探究:人体的脂肪百分比和年龄的表格中随机抽样出7组数据,继续求其回归直线方程,并体会跟1中回归直线方程有什么不同?为什么?

【设计意图】对同样的问题背景,我们进行多次数据采样,求得的回归直线方程却不同,体会数据采样本身具有随机性,因此回归方程也是“随机的”.所以某个回归方程能否较好地反映总体,还需要进行误差分析,为后续学习铺垫.

2020-2021学年人教A版高中数学必修3:2.3.1变量间的相关关系2.3.2两个变量的线性相关

课时分层作业(十四)变量间的相关关 系 (建议用时:60分钟 ) 一、选择题 1.有几组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③立方体的棱长和体积.其中两个变量成正相关的是() A.①③B.②③ C.②D.③ C[①是负相关;②是正相关;③不是相关关系.] 2.由一组样本数据(x1,y1),(x2,y2),…,(x n,y n)得到的回归直线方程为y^=b^x+a^,那么下面说法不正确的是() A.直线y^=b^x+a^必经过点(x,y) B.直线y^=b^x+a^至少经过点(x1,y1),(x2,y2),…,(x n,y n)中的一个点 C.直线y^=b^x+a^的斜率为∑ i=1 n x i y i-n x y ∑ i=1 n x2i-n x2 D.直线y^=b^x+a^是最接近y与x之间真实关系的一条直线 B[回归直线一定经过样本点的中心,故A正确;直线y^=b^x+a^可以不经过样本点中的任何一点,故B错误.由回归方程的系数可知C正确;在直角坐标系中,直线y ^=b^x+a^与所有样本点的偏差的平方和最小,故D正确;] 3.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论: ①y与x负相关且y ^=2.347x-6.423;②y与x负相关且y^=-3.476x+5.648;

③y与x正相关且y ^=5.437x+8.493;④y与x正相关且y^=-4.326x-4.578. 其中一定不正确的结论的序号是() A.①②B.②③ C.③④D.①④ D[由正负相关的定义知①④一定不正确.] 4.为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下: 则y对x A.y=x-1 B.y=x+1 C.y=88+1 2x D.y=176 C[x=174+176+176+176+178 5=176,y= 175+175+176+177+177 5= 176.根据回归直线过样本中心点(x、y)验证知C符合.] 5.某产品的广告费用x与销售额y的统计数据如下表: 根据上表可得回归方程y=b x+a中的b为9.4,据此模型预报广告费用为6万元时,销售额为() A.63.6万元B.65.5万元 C.67.7万元D.72.0万元 B[x=1 4(4+2+3+5)=3.5,y= 1 4(49+26+39+54)=42,所以a ^=y-b^ x=42-9.4×3.5=9.1.所以回归方程为y^=9.4x+9.1.令x=6,得y^=65.5(万元).] 二、填空题 6.若回归直线y^=b^x+a^的斜率估值为1.23,样本中心点为(4,5),当x=2时,估计y的值为________. 2.54[因为回归直线y^=b^x+a^的斜率估值为1.23,所以b^=1.23,y^=1.23x+a^.

线性回归方程中的相关系数r

线性回归方程中的相关系数r r=∑(Xi-X的平均数)(Yi-Y平均数)/根号下[∑(Xi-X平均数)^2*∑(Yi-Y平均数)^2]

R2就是相关系数的平方, R在一元线性方程就直接是因变量自变量的相关系数,多元则是复相关系数 判定系数R^2 也叫拟合优度、可决系数。表达式是: R^2=ESS/TSS=1-RSS/TSS 该统计量越接近于1,模型的拟合优度越高。 问题:在应用过程中发现,如果在模型中增加一个解释变量,R2往往增大 这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。 ——但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。 这就有了调整的拟合优度: R1^2=1-(RSS/(n-k-1))/(TSS/(n-1)) 在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响: 其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。 总是来说,调整的判定系数比起判定系数,除去了因为变量个数增加对判定结果的影响。R = R接近于1表明Y与X1,X2 ,…,Xk之间的线性关系程度密切; R接近于0表明Y与X1,X2 ,…,Xk之间的线性关系程度不密切 相关系数就是线性相关度的大小,1为(100%)绝对正相关,0为0%,-1为(100%)绝对负相关 相关系数绝对值越靠近1,线性相关性质越好,根据数据描点画出来的函数-自变量图线越趋近于一条平直线,拟合的直线与描点所得图线也更相近。 如果其绝对值越靠近0,那么就说明线性相关性越差,根据数据点描出的图线和拟合曲线相差越远(当相关系数太小时,本来拟合就已经没有意义,如果强行拟合一条直线,再把数据点在同一坐标纸上画出来,可以发现大部分的点偏离这条直线很远,所以用这个直线来拟合是会出现很大误差的或者说是根本错误的)。 分为一元线性回归和多元线性回归 线性回归方程中,回归系数的含义 一元: Y^=bX+a b表示X每变动(增加或减少)1个单位,Y平均变动(增加或减少)b各单位多元: Y^=b1X1+b2X2+b3X3+a 在其他变量不变的情况下,某变量变动1单位,引起y平均变动量 以b2为例:b2表示在X1、X3(在其他变量不变的情况下)不变得情况下,X2每变动1单位,y平均变动b2单位 就一个reg来说y=a+bx+e a+bx的误差称为explained sum of square e的误差是不能解释的是residual sum of square

6.示范教案(2.3.2--两个变量的线性相关)

变量间的相关关系 2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关 整体设计 教学分析 变量之间的关系是人们感兴趣的问题.教科书通过思考栏目“物理成绩与数学成绩之间的关系”,引导学生考察变量之间的关系.在教师的引导下,可使学生认识到在现实世界中存在不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性.随后,通过探究人体脂肪百分比和年龄之间的关系,引入描述两个变量之间关系的线性回归方程(模型).教科书在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想.通过气温与饮料销售量的例子及随后的思考,使学生了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能犯的错误.进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性. 三维目标 1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系. ) 2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系. 3.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程. 重点难点 教学重点:通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;利用散点图直观认识两个变量之间的线性关系;根据给出的线性回归方程的系数公式建立线性回归方程. 教学难点:变量之间相关关系的理解;作散点图和理解两个变量的正相关和负相关;理解最小二乘法的思想. 课时安排 2课时 教学过程 、 第1课时 导入新课 思路1 在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢 学生讨论:我们可以发现自己的数学成绩和物理成绩存在某种关系.(似乎就是数学好

两个变量的线性相关

2.3.2 两个变量的线性相关 一、教学目标 重点: 了解最小二乘法和回归分析的思想,根据给出的线性回归方程的系数公式建立回归方程. 难点:如何通过数学方法刻画“从整体上看,各点与此直线的距离最小”,并在此过程中了解最小二乘法思想. 知识点:根据给出的线性回归方程的系数公式建立回归方程. 能力点:探究体会数形结合的方法及最小二乘法的数学思想. 教育点:学生通过合作学习、自主学习和探究式学习的方式完成一个完整的数学学习过程. 自主探究点:自学例2. 考试点:根据给出的线性回归方程的系数公式建立回归方程. 易错易混点:如何化简复杂的代数表达式,学生缺乏处理的经验,在计算能力的要求上也较高. 拓展点:事件、样本数据、回归直线方程三者关系. 二、复习引入 【设计意图】为本节课学生能够更好的建构新的知识做好充分的准备,对旧的知识进行简要的提问复习,为能够顺利的完成本节课的容提供必要的基础. 【设计说明】学生动手操作得出散点图回答. 【设计意图】通过讨论比较,调动学生的学习积极性和兴趣,活跃课堂气氛. 【设计说明】设计该问题,引导学生自己发现问题,鼓励学生大胆表达自己的看法,充分暴露思维过程.发现:图1很乱,两个变量没有相关关系;图2呈上升趋势,图中点的分布呈条状,所有点都落在某一直线的附近,这样由图2自然地引出线性相关、回归直线的概念,同时引入课题. 引入:为此我们引入今天的课题-回归直线及其方程. 【设计意图】循序渐进,符合学生的认知规律. 三、探究新知 (一)探索回归直线的概念 1.回归直线的定义:如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 【设计意图】培养自学能力和数学阅读能力. 【设计说明】让学生阅读教材,通过阅读教材学习线性相关,回归直线,回归方程的概念,并分析概念中应注意的问题. 注意:概念的前提是点的分布在一条直线附近. (二)探索回归直线的找法 结合引例—年龄与体脂肪含量相关性的散点图观察,思考以下问题.

2020_2021学年高中数学第2章统计2.3.1变量间的相关关系2.3.2两个变量的线性相关课时作

课时分层作业(十四) 变量间的相关关系 (建议用时:60分钟 ) 一、选择题 1.有几组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③立方体的棱长和体积.其中两个变量成正相关的是( ) A .①③ B .②③ C .② D .③ C [①是负相关;②是正相关;③不是相关关系.] 2.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程为y ^=b ^x +a ^ ,那么下面说法不正确的是( ) A .直线y ^=b ^x +a ^ 必经过点(x ,y ) B .直线y ^=b ^x +a ^ 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点 C .直线y ^=b ^ x +a ^ 的斜率为 ∑i =1 n x i y i -n x y ∑i =1 n x 2 i -n x 2 D .直线y ^=b ^x +a ^ 是最接近y 与x 之间真实关系的一条直线 B [回归直线一定经过样本点的中心,故A 正确;直线y ^=b ^x +a ^ 可以不经过样本点中的任何一点,故B 错误.由回归方程的系数可知C 正确;在直角坐标系中,直线y ^=b ^x +a ^ 与所有样本点的偏差的平方和最小,故D 正确;] 3.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:

①y 与x 负相关且y ^=2.347x -6.423;②y 与x 负相关且y ^ =-3.476x +5.648;③y 与 x 正相关且y ^=5.437x +8.493;④y 与x 正相关且y ^ =-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④ D .①④ D [由正负相关的定义知①④一定不正确.] 4.为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下: 则y 对x A .y =x -1 B .y =x +1 C .y =88+1 2 x D .y =176 C [x =174+176+176+176+1785=176,y =175+175+176+177+177 5=176. 根据回归直线过样本中心点(x 、y )验证知C 符合.] 5.某产品的广告费用x 与销售额y 的统计数据如下表: 根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时,销售额为( ) A .63.6万元 B .65.5万元 C .67.7万元 D .72.0万元 B [x =14(4+2+3+5)=3.5,y =14 (49+26+39+54)=42,所以a ^=y -b ^ x =

人教版高中数学-两个变量的线性相关

《2.3.2两个变量的线性相关》 一、内容和内容解析 本节课是人教A版高中数学必修三2.3.2两个变量的线性相关的第二课时。上节课通过大量的生活实例,学生已经初步认识两个变量间的相关关系,并可以借助散点图呈现收集的数据。通过对单变量样本数据中“平均数的几何意义”(切合学生的认知需要)的介绍,为本节课的内容做了铺垫。本节课的主要内容是用最小二乘法求线性回归方程,基础知识是回归直线的概念,也是本节课的核心概念;基本思想是“最小二乘法”思想;根据线性回归方程的系数公式求回归直线是本节课的基本技能. 就统计学科而言,对不同的数据处理方法进行“优劣评价”是“假设检验”的萌芽,而后者是统计学学科研究的另一重要领域.了解“最小二乘法”思想,比较各种“估算方法”,体会它的科学性,既是统计学教学发展的需要,又在体会此思想的过程中促进学生对核心概念的进一步理解.“样本估计总体”是本节课的上位思想也是整个第二章的核心思想,而“最小二乘法思想”作为本节课的核心思想,由此得以体现.回归思想和贯穿统计学科中的随机思想,也在本节课中有所渗透. 本节课通过引导学生经历“收集数据——整理数据(作散点图)——探究并确定回归直线的数学意义——求回归直线方程——应用”完整的回归分析的过程,鼓励学生独立思考、自主探究、合作交流和计算机操作等方式展开学习,从而发挥本节课的育人价值。整个学习过程渗透了数据分析和数学建模的核心素养。通过引导学生对散点图中的点大致分布在一条直线附近的观察,渗透直观想象的核心素养;通过尝试提出找回归直线的想法、用自己的语言描述对这条直线的初步认识到探究从数学的角度定义回归直线的过程,渗透数学抽象和逻辑推理的核心素养;最后,根据回归直线方程的系数公式,引导学生先求出公式中的基本统计量,再代入公式的过程和指导学生利用Excel电子表格求回归方程的过程,提升数学运算的核心素养。 基于上述内容分析,本节课的教学重点为:了解最小二乘法思想,并能根据给出的线性回归方程的系数公式,建立线性回归方程 二、目标和目标设置 基于对本节课教学内容的解析,结合《普通高中数学课程标准(2017年版)》的要求,制定本节课的教学目标如下: 1.了解一元线性回归模型的含义: (1)能根据散点图解释两个相关变量的线性相关关系; (2)能用自己的语言解释回归直线的统计意义; 2.了解最小二乘原理: (1)经历用不同方法确定回归直线的过程,能认识到回归直线是“从整体上看,各点与此直线上的点的距离最小”的直线; (2)能用数学符号刻画“从整体上看,各点与此直线上的点的距离最小”的表达方式; (3)通过对表达方式的转化(距离最小到偏差平方和最小),体会最小二乘法原理,并能用自己的语言表述; 3. 针对实际应用问题,能根据给出的线性回归方程系数公式建立线性回归方程; 4. 在经历完整的线性回归分析的过程中,重点提升数据分析和数学建模核心素养; 5. 针对实际应用问题,会用一元线性回归模型进行预测.

《两个变量的线性相关》教案

《两个变量的线性相关》教案 教学目标 经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 教学重点 经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 教学过程 1.回顾上节课的案例分析给出如下概念: (1)回归直线方程 (2)回归系数 2.最小二乘法 3.直线回归方程的应用 (1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系 (2)利用回归方程进行预测;把预报因子(即自变量X )代入回归方程对预报量(即因变量Y )进行估计,即可得到个体Y 值的容许区间. (3)利用回归方程进行统计控制规定Y 值的变化,通过控制X 的范围来实现统计控制的目标.如已经得到了空气中NO 2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO 2的浓度. 4.应用直线回归的注意事项 (1)做回归分析要有实际意义; (2)回归分析前,最好先作出散点图; (3)回归直线不要外延. 5.实例分析: 某调查者从调查中获知某公司近年来科研费用支出(i X )与公司所获得利润(i Y )的统计资料如下表: 科研费用支出(i X )与利润(i Y )统计表 单位:万元 年份 科研费用支出 利润 1998 1999 2000 5 11 4 31 40 30

2001 2002 2003 5 3 2 34 25 20 合计 30 180 要求估计利润(i Y )对科研费用支出(i X )的线性回归模型. 解:设线性回归模型直线方程为:i i X Y 10???ββ+= 56 30 ===∑n X X i 306 180 == =∑n Y Y i 因为: 根据资料列表计算如下表: 年份 i X i Y i Y X 2 i X X X i -Y Y i -2 )(X X i -) )((Y Y X X i i --1998 1999 2000 2001 2002 2003 5 11 4 5 3 2 31 40 30 34 25 20 1 55 4 40 1 20 1 70 7 5 4 2 5 121 1 6 2 5 9 4 0 6 -1 0 -2 -3 1 10 0 4 -5 -1 0 36 1 0 4 9 0 60 0 0 10 30 合计 30 180 1 000 2 00 50 100 现利用公式(Ⅰ)、(Ⅱ)、(Ⅲ)求解参数10ββ、的估计值: 2 300600900120054006000302006180 3010006)(?22 2 1== --= -??-?= --=∑∑∑∑∑i i i i i i X X n Y X Y X n β 20 5 230??1 0=?-=-=X Y ββ

高中数学 2.3.1、2变量之间的相关关系和两个变量的线性相关同步测试 新人教A版必修3

2-3-1变量之间的相关关系 2-3-2 两个变量的线性相关 一、选择题 1.对于给定的两个变量的统计数据,下列说法正确的是( ) A .都可以分析出两个变量的关系 B .都可以用一条直线近似地表示两者的关系 C .都可以作出散点图 D .都可以用确定的表达式表示两者的关系 [答案] C [解析] 给出一组样本数据,总可以作出相应的散点图,但不一定分析出两个变量的关系,更不一定符合线性相关或有函数关系. 2.下列两个变量之间的关系,哪个不是函数关系( ) A .正方体的棱长和体积 B .圆半径和圆的面积 C .正n 边形的边数和内角度数之和 D .人的年龄和身高 [答案] D [解析] A 、B 、C 都是函数关系,对于A ,V =a 3 ;对于B ,S =πr 2 ;对于C ,g (n )=(n -2)π.而对于年龄确定的不同的人可以有不同的身高,∴选D. 3.下列变量之间的关系是函数关系的是( ) A .一次函数y =ax +b ,其中a ,b 是已知常数,取b 为自变量,因变量是b 2 -4a B .施肥量和小麦亩产量 C .降雨量和交通事故发生率 D .学习时间和学习成绩 [答案] A [解析] 一般地说,在一定范围内,在其它条件相同的情况下,施肥量加大,小麦亩产量会增加,它们正相关,但不具有函数关系;同理C 、D 也没函数关系,而A 中,∵a ,b 为已知常数,当b 确定时,b 2 -4a 也随之确定且有唯一值与之对应,∴A 为函数关系. 4.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程y ^ =bx +a ,那么下面说法不正确的是( ) A .直线y ^=bx +a 必经过点(x -,y - )

两个变量的相关关系

两个变量间的相关关系 变量间的相互关系有两种:一类是确定性的函数关系,如正方形的边长和面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的.例如,学生的总成绩和他的单科成绩,一般说来“总成绩高者,单科成绩也高”,我们说总成绩和单科成绩具有相关关系.相关关系又分为两种:(1)正相关:两个变量具有相同的变化趋势.(2)负相关:两个变量具有相反的变化趋势. 对相关关系的理解可以从下面三个角度把握: 相关关系的概念:自变量取值一定时,因变量的取值带有一定的随机性,则两个变量之间的关系叫做相关关系. 对相关关系的理解应当注意以下几点: 其一是相关关系与函数关系不同.因为函数关系是一种非常确定的关系,而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.而函数关系可以看成是两个非随机变量之间的关系.因此,不能把相关关系等同于函数关系. 相关关系与函数关系的异同点为: 相同点:均是指两个变量的关系. 不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系.函数关系是自变量与函数值之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系. 其二是函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系.然而,学会新词并不能使脚变大,而是涉及到第三个因素——年龄.当儿童长大一些,他们的阅读能力会提高而且由于长大脚也变大. 其三是在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常重要的作用.变量之间的相关关系带有不确定性,这需要通过收集大量的数据,对数据进行统计分析,发现规律,才能作出科学的判断. 我们再来认识生活中的确定两个变量间的相关关系的两个例子: 【例1】“名师出高徒”可以解释为教师的水平越高,学生的水平也越高.那么,教师的水平与学生的水平成什么相关关系?你能举出更多的描述生活中的两个变量的相关关系的成语吗? 解析:“名师出高徒”的意思是说有名的教师一定能教出高明的徒弟,通常情况下,高水平的教师有很大的趋势教出高水平的学生.所以,教师的水平与学生的水平成正相关关系.生活中这样的成语很多,如“龙生龙,凤生凤,老鼠的孩子会打洞”. 【例2】历史上,有人认为人们的着装与经济好坏有关系,着装越鲜艳,经济越景气.你认为着装与经济真的有这种相关关系吗? 解析:人们的着装只能反映个人的爱好以及个人心情状况,与经济的好坏没有任何关系,并不能反映经济的景气与否.所以,着装与经济并没有“着装越鲜艳,经济越景气”这种相关关系.

示范教案( 两个变量的线性相关)

2.3 变量间的相关关系 2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关 整体设计 教学分析 变量之间的关系是人们感兴趣的问题.教科书通过思考栏目“物理成绩与数学成绩之间的关系”,引导学生考察变量之间的关系.在教师的引导下,可使学生认识到在现实世界中存在不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性.随后,通过探究人体脂肪百分比和年龄之间的关系,引入描述两个变量之间关系的线性回归方程(模型).教科书在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想.通过气温与饮料销售量的例子及随后的思考,使学生了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能犯的错误.进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性. 三维目标 1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系. 2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系. 3.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程. 重点难点 教学重点:通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;利用散点图直观认识两个变量之间的线性关系;根据给出的线性回归方程的系数公式建立线性回归方程. 教学难点:变量之间相关关系的理解;作散点图和理解两个变量的正相关和负相关;理解最小二乘法的思想. 课时安排 2课时 教学过程 第1课时 导入新课 思路1 在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢? 的,物理也好;数学差的,物理也差,但又不全对.)物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法.数学成绩的高低对物理成绩的高低是有一定影响的.但决非唯一因素,还有其他因素,如是否喜欢物理,用在物理学习上的时间等等.(总结:不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少.但这两

2014人教A版高中数学必修三 2-3-1、2 《变量之间的相关关系》 《两个变量的线性相关》能力强化提升

【成才之路】2014高中数学 2-3-1、2 变量之间的相关关系 两 个变量的线性相关能力强化提升 新人教A 版必修3 一、选择题 1.对于给定的两个变量的统计数据,下列说法正确的是( ) A .都可以分析出两个变量的关系 B .都可以用一条直线近似地表示两者的关系 C .都可以作出散点图 D .都可以用确定的表达式表示两者的关系 [答案] C [解析] 给出一组样本数据,总可以作出相应的散点图,但不一定分析出两个变量的关系,更不一定符合线性相关或有函数关系. 2.在画两个变量的散点图时,下面叙述正确的是( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上 [答案] B 3.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程y ^ =bx +a ,那么下面说法不正确的是( ) A .直线y ^=bx +a 必经过点(x -,y - ) B .直线y ^ =bx +a 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点 C .直线y ^ =bx +a 的斜率为 ∑i =1 n x i y i -n x - y - ∑i =1 n x 2 i -n x - 2 D .直线y ^=bx +a 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差∑i =1 n [y i -(bx i +a )]2 是 该坐标平面上所有直线与这些点的偏差中最小的直线. [答案] B [解析] 由a =y -b x 知y ^ =y -b x +bx ,∴必定过(x ,y )点. 回归直线方程对应的直线是与样本数据距离最小的,但不一定过原始数据点,只须和这

两个变量的线性相关教案

两个变量的线性相关 一、学习目标: 1.通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系. 2.了解最小二乘法的含义,知道最小二乘法的思想 ,能根据给出的线性回归方程系数公式建立线性回归方程. 3.在两个变量具有线性相关关系时,会在散点图中作出线性回归直线,会用线性回归方程进行预测. 二、学习重点与难点: 学习重点:回归直线方程的求解方法. 学习难点:回归直线方程的求解方法. 三、课堂过程: 1.创设情境,揭示课题 的点在坐标系内标出,得到散点图. 从散点图可以看出.这些点大致分布在通过散点图中心的一条直线的附近. 如果散点图中点的分布从整体看大致分布在一条直线的附近,我们称这两个变量之间具有线性相关关系,这条直线叫回归直线. 如果能够求出这条回归直线的方程,我们就可以比较清楚的了解热茶销量与气温之间的关系. 2.最小二乘法 选择怎样的直线近似地表示热茶销量与气温之间的关系? 我们有多种思考方案: (1)选择能反映直线变化的两个点,例如取(4,50),(18,24)这两点的直线; (2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同; (3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距; 怎样的直线最好呢? ------从整体上看,各点与此直线的距离最小. 即:用方程为?y bx a =+的直线拟合散点图中的点,应使得该直线与散点图中的点最接近.那么,怎样衡量直线?y bx a =+与图中六个点的接近程度呢? 我们将表中给出的自变量x 的六个值带入直线方程,得到相应的六个?y 的值: 26,18,13,10,4,b a b a b a b a b a b a +++++-+.这六个值与表中相应的实际值应该越接近越好.所以,我们 用类似于估计平均数时的思想,考虑离差的平方和: 222222 22(,)(2620)(1824)(1334)(1038)(450)(64)12866140382046010172 Q a b b a b a b a b a b a b a b a ab b a =+-++-++-++-+ +-+-+-=++--+ (,)Q a b 是直线?y bx a =+与各散点在垂直方向(纵轴方向)上的距离的平方和,可以用来衡量直线?y bx a =+与图中六个点的接近程度,所以,设法取,a b 的值,使(,)Q a b 达到最小值.这种方法叫做最小平方法(又称最小二乘 法) .

相关文档
最新文档