变量之间的相关关系

变量之间的相关关系
变量之间的相关关系

“变量间的相关关系”中的核心概念和思想方法解读及教学建议

河北师范大学数学与信息科学学院程海奎

《变量间的相关关系》的主要内容为采用定性和定量相结合的方法研究变量之间的相关关系,主要研究线性相关关系.主要概念有“相关关系”、“散点图”、“回归直线和回归直线方程”、“相关系数”等.研究方法为先绘制散点图,直观表示观测数据,定性描述变量间相关关系的类型、方向、相关程度.然后应用最小二乘法确定变量间相关关系的具体表达形式,描述变量间的数量规律,并由一个变量的取值去推测另一个变量的取值.

这部分内容涉及到一些重要的统计思想和方法,对学生的学习和教师的教学都有一定的难度.本文就研究对象、核心概念、研究方法、统计思想及相关应用进行简单的解读,提出一些教学建议,希望对教学能提供一些帮助.

一、相关概念及统计思想方法

1.相关关系——变量间的不确定关系

两个变量之间的数量关系有两种不同的类型:一种是函数关系,一种是相关关系.当一个变量取一定的值时,另一个变量有确定的值与之对应,我们称这种关系为确定的函数关系.一般把作为影响因素的变量称为自变量,把与之对应变化的变量称为因变量.

当一个变量取一定的数值时,与之对应的另一个变量的值虽然不确定,但它按某种规律在一定的范围内变化,变量间的这种关系称为不确定性的相关关系.或者说两个变量之间确实存在某种关系,但不具备函数关系所要求的确定性.

函数关系和相关关系都是指两个变量之间的数量关系.函数关系是两个非随机变量之间的一种确定关系,是一种因果关系.而相关关系是两个变量之间的一种不确定的关系,这两个变量中至少有一个是随机变量.两个相关变量之间可能有内在联系(真实相关),也可能完全不存在内在联系(虚假相关).之所以X和Y之间是相关关系,原因是变量X是影响变量Y的主要因素,但不是唯一因素,还有其他种种因素,而这些因素我们又不能完全把握.

研究函数关系,可以用数学分析的方法.例如,已知y和x之间具有线性关系,即,此时只要知道变量的两组取值就可以确定函数表达式.

研究相关关系则必须对变量进行多次观测,借助统计的相关思想和方法.例如,有人认为人的体重y 和身高x之间具有近似的二次函数关系,由三个人的身高和体重数据,确定出y和x之间的表达式.这样得到的结果很不可靠,难以使人信服.

2.散点图—描述相关关系的直观工具

由于相关关系的不确定性,寻找变量X和Y之间的相关关系时,首先要对变量进行观测.设n次观测值为.在直角坐标系中,横轴代表变量X,纵轴代表变量Y,将观测数据用坐标点的形式描绘出来,得到的图形称为散点图.散点图是研究相关关系的直观工具,可以定性的判断相关的方向和程度.

如果散点大致分布在一条直线附近,又不完全在一条直线上,说明变量间具有线性相关关系;如果这些点大致分布在一条曲线附近,说明变量间具有非线性相关关系;如果这些点的分布几乎没有什么规则,说明两个变量间没有相关关系.对于线性相关,如果散点从左下角到右上角沿直线分布,那么两个变量正相关,如果散点从左上角到右下角沿直线分布,两个变量负相关.如果散点在整体上和某一直线越接近,表明变量间相关关系越强.

3.数据分析方法—相关分析与回归分析

对变量间相关关系,在定性分析的基础上,需要进行定量分析.定量分析有相关分析和回归分析两种方法.相关分析是用一个指标(称为相关系数)来反映变量间相关关系的密切程度(见人教A版必修3P85,阅读与思考).回归分析就是根据相关关系的具体形态,选择一个合适的数学模型,来近似表达变量间的平均变化关系.相关分析和回归分析具有共同的研究对象,在具体应用时,需要互相补充.作相关分析需要依靠回归分析表明变量相关的具体形式,而进行回归分析需要通过相关分析表明变量间的相关程度,只有变量间存在高度相关时,由回归分析得到的变量间的具体形式才有意义.

相关分析研究变量间的相关的方向和相关程度,它不提供相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况.相关分析不必确定哪个变量是自变量,哪个是因变量,所涉及的两个变量可以都是随机变量.回归分析根据观测数据,确定一个数学方程式(回归方程),根据这个方程式可

以由已知量推测未知量,为估算和预测提供一个重要方法.回归分析必须事先确定具有相关关系的变量中哪个为自变量,哪个为因变量.一般地说,自变量是普通变量(人为可以控制其取值),因变量是随机变量.

4.最小二乘思想—统计学基础的重要部分

当两个变量之间存在相关关系时,由于不确定性,如果只有很少几组变量观测值,很难估计误差的大小.法国法数学家勒让德(Le Gendre,1752—1833)在根据测量数据预测彗星轨道的问题时,发现了如何有效利用全部测量数据的方法.即通过计算得出一组数值,在使数据组的偏差达到最小的意义下,这些数值是最优的.由勒让德的方法得出的数值充分利用了所有数据信息,这个方法现在叫做最小二乘法.人们立即认识到勒让德发现的价值,运用最小二乘法的数学并不难,所以绝大多数从事测量的科学家,都能从这一方法中受益,他们可以充分利用数据.当时最小二乘思想在科学界迅速流传.1809年,德国数学家高斯(Gauss,1777—1855年)在一篇论文中,分析了如何充分利用一系列测量数据来预测天体轨道的问题,在文章中也叙述了最小二乘法,并声称自己发明了这一方法.事实上,勒让德第一个发表了最小二乘法思想,并影响了统计学;高斯也使用了最小二乘法,并且考虑了最小二乘法的误差分析问题,他还发现了最小二乘法理论中的重要结果,它从统计学的角度回答了最小二乘法在缩小误差上的优势,使得在勒让德那里只是处理测量数据的代数方法逐渐渗透到统计数据分析的领域,最小二乘法对统计学就象微积分对于数学中的影响一样深远,高斯的巨大声望使一些历史学家把最小二乘法归功于他.

下面通过一个简单问题,阐述最小二乘思想.

一段公路,实际长度为a千米,a是未知的,对公路进行n次实际测量,假设测量值为.可是每次测量都有一定的误差,这些误差或正或负,或大或小.应该如何估计a的值呢?直观的想法是a 的

值应该最接近这些测量数据,数学描述就是: a的值应该使所有的误差平方和达到最小.

当时,达到最小.即用测量数据的平均值作为a的估计值.这里估计参数a所采用的就是最小二乘法的思想.用数理统计知识可以证明这样的估计也是最佳的.

最小二乘法的优点是:有效利用了全部测量数据,使误差平方和达到最小,防止了某一极端误差对决定参数估计值取得支配性地位.在计算上只需对参数求偏导数求解线性方程组即可.

5.回归直线与回归方程

当两个变量之间具有线性相关关系时,散点图中的点大致分布在一条直线附近,这条直线叫做回归直线,这条直线的方程叫做回归方程.

数学模型:假设因变量y主要受自变量x的影响,它们之间的数量关系为,其中x 是非随机变量,是未知的常数.是随机误差项,它反映了未列入方程的其它各种因素对y的影响.从而y是随机变量,它可以用由x的值完全确定的部分和随机误差部分来解释.当由观测数据

估计出和b时,得到直线回归方程为.

将观测数据代入中,得

,或,

其中为n次观测的误差.求的估计值,使“从整体上看各点与直线的距离最小”.应用最小二乘思想,就是求使误差平方和达到最小的的值.可以用配方法或求偏导数的方针求出的估计值.

6.相关系数—变量间线性关系密切程度的度量

相关系数是用来衡量两个变量之间线性关系密切程度(强与弱)的一个数量指标.只有了解构造相关系数的统计思想,才能对相关系数有较深刻的理解.下面对相关统计量的意义及构造相关系数的统计思想做一简述.

设回归方程为,与对应的回归值为.称为偏差,称

为偏差方和.的值越小,反映各偏差普遍较小,数据点整体上比较接近回归直线,说明变量间线性关系比较密切.但是一个绝对量,需要进行调整.

为方便引入以下记号:

,,,.

衡量数据的波动大小,衡量数据的波动大小.

,反映主要由的变化引起的间的波动,

反映除线性关系之外的各种随机因素引起的间的波动.

可以证明:.令,显然,而且越接近1,

就越接近0,说明x和y之间的线性关系越密切.

当时,x和y正相关,当时,x和y负相关.但由于只与有关,所以不能反映相关的方向.因此定义相关系数如下:

,一般越接近1,x和y之间的线性关系越密切.

需要注意的两点是:(1)相关系数只衡量变量间线性关系的密切程度,即使变量间具有确定的非线性函数关系,也可能非常接近0.(2)当n 很小时,即使非常接近1,也不表明变量间的线性关系强.例如,无论x和y之间是何种关系,当n=2时,总有.

二、教学建议

1.“相关关系”的有关概念及定性描述

相关关系的概念是描述性的,不必追求形式化上的严格.建议采用案例教学法.对比函数关系,重点突出相关关系的两个本质特征:关联性和不确定性.关联性是指当一个变量变化时,伴随另一个变量有一定的变化趋势;不确定性是指当一个变量取定值时,与之相关的变量的取值仍具有随机性.因为有关联性,才有研究的必要性.因为其不确定性,从少量的变量观测值,很难估计误差的大小,因此必须对变量作大量的观测.但每个观测值都有一定误差,为了消除误差的影响,揭示变量间的本质联系,就必须要用统计分析方法.

判断两个变量间是否具有相关关系,一是凭经验及学科专业知识,二是借助散点图.下面是一些可供选择的例子,教学时可先逐一分析其关联性和不确定性,然后结合散点图,进一步判断相关关系的类型和方向.

例5(非线性相关和不相关的例子)对0到18岁之间的未成年人来说,年龄和身高之间具有非线性的相关关系.对成年人来说,年龄和身高之间没有相关关系(散点图略).

例6吸烟和患肺部疾病之间不具有因果关系,但具有相关关系.我们引入两值变量X和Y:

如果调查了700人,其中400个不吸烟者中有40人患肺部疾病(10%),300个吸烟者中有60个人患肺部疾病(20%),说明吸烟对患肺部疾病有一定的影响.但不吸烟者也可能患肺部疾病,吸烟者也可能不患肺部疾病,因此X和Y之间具有相关关系.

例7 有人曾经观察过某一国家历年的国内生产总值与精神病患者的人数的关系,发现两者之间存在较强的正相关.实际上国内生产总值与精神病患者的人数之间没有内在联系,是一种典型的虚假相关.这是因为它们都和人口总量有内在的相关关系.

说明:(1)适当例举非线性相关和不相关的例子,有助于对相关关系的全面了解,但我们研究的重点是线性相关关系,而且正相关或负相关只对线性相关有意义.

(2)讨论“相关关系”时,对中学生来说,不要求说明哪个变量是随机变量,哪个变量是普通变量.(3)根据学生实际情况,可以从散点图判断线性关系的强弱,进行适当拓展.

2.相关关系的定量描述——求回归直线方程

本小节的重点是用最小二乘法求回归直线方程.采用探究式教学方式.

在给出回归直线和回归直线方程的定义后,提出如下问题:

如何求回归直线方程,要求这条直线在整体上与数据点最接近?

许多统计思想和方法都比较直观,学生可能提出各种不同的方法,包括教材上列举的方法.为了防止漫无目的,对求回归直线的方法应提出一些基本要求:尽可能利用全部数据,体现整体偏差最小,便于

数学计算,结果确定等.离这些要求越来越远的方法,不必多加考虑.通过对有些方法逐步修正,最后引导到使用最小二乘法求回归直线方程.

方法1:逐渐移动直线,测量各点到直线的距离,使距离和最小.该方法体现了整体偏差最小的思想,缺点是难以实现,而且测量的方法很难得到确定的结果.

方法2:选择两点画直线,使直线两侧的点的个数基本相同.这种方法没有利用全部数据信息,其结果会因人而异.

方法3:用多条直线的斜率和截距的平均值作为回归直线的斜率和截距.这种方法既没有利用全部数据信息,也没有体现整体误差最小的思想,结果也不确定.

设回归方程为,,是第i个观测值的偏差,是第i个观测点到回归直线的距离.设是回归直线的倾斜角,则.

方法4:距离和最小.求a,b使达到最小.这是方法1的数学严格化.

方法5:总的偏差和最小.求a,b使达到最小.方法4和方法5是等价的.方法5利用了全部数据,体现整体偏差最小的思想,结果是唯一确定的.唯一的缺点是不便数学计算.

方法6偏差平方和最小.求a,b使达到最小.该方法克服了方法5的缺点.这种方法称为最小二乘法.

说明:(1)我们的目的是通过探究找到一个求回归方程的“较优”的方法,这里所说的“较优”也是基于直观的思想,在学生现有的知识水平下,无法严格证明.如果对用上面的方法得到直线的“优劣”进行评判,我认为是理解上的偏差,况且也做不到.

(2)应用最小二乘法求回归方程是一个纯数学的问题,用配方法显得繁琐,用求偏导数的方法超出了学生的能力要求.对此不做要求,直接给出a,b的公式,不影响对统计方法的理解.

(3)也可以按下面的过程展开教学.①提供实际问题情境,从测量数据出发,采用偏差平方和最小的思想(最小二乘思想)求参数的估计值.②通过类比用最小二乘法求回归直线方程.3.回归方程的计算

回归方程中a,b的计算公式比较复杂,要求利用计算器或计算机进行计算.为了熟悉公式的构成及相关量的计算过程,建议使用Excel软件中的公式进行计算.

以年龄和脂肪含量的关系为例.如下表所示:在相应的单元格内输入数据,第15行为合计.先计算,,在单元格C1,D1,E1中输入相应的公式.通过公式复制然后求和得到:

(C15)

(D15)

(E15),相关系数

,,回归方程为.

作为拓展还可以计算与对应的回归值,与实际观测值进行比较,了解偏差的大小.由相关系数的大小判断线性关系的强弱.

4.回归方程的意义及应用

回归直线方程作为变量x和y之间线性关系的代表,它近似描述了x和y之间的数量关系.利用回归方程,当已知x的值时,可以推断y的取值.

回归方程中b的意义为:当自变量x改变一个单位时,因变量y的平均改变量.

为当时y的估计值,也可以理解为当时y的可能取值的平均值.

在教学中下面的实例可供选择.例1主要解释系数b和回归值的意义;例2说明回归方程用于预测时的作用;例3介绍“回归”一词的由来的背景知识,同时也说明了回归方程在揭示了变量间的依存规律时的作用.

例1 年龄和脂肪含量之间的回归方程为.

(1)解释b(0.5765)的意义;

(2)当x=37时,计算相应的值并解释其意义.

解(1)回归直线方程中b是直线的斜率,b>0表示随年龄的增长,人体脂肪含量呈现增长的趋势,b=0.5765说明年龄每增加1岁,身体脂肪含量平均增加0.5765%.

(2)当x=37时,%,20.9%是37岁的人脂肪含量的一个估计值,可以理解为众多37岁人脂肪含量的平均值.

说明:年龄的取值范围为23—61岁,一般在这个年龄范围内估计脂肪含量时误差相对较小,如果估计80岁人的脂肪含量,误差会很大,结果不可靠.

例2 某博物馆发现文物被盗,公安刑侦人员经过分析,推测案犯的身高在175㎝左右.刑侦人员是如何推断的呢?原来在现场发现了案犯的脚印,测量脚印的长度为25.5㎝,已知成年人的脚印长x和身高y 之间存在线性相关关系,回归方程为.因此可以从脚印的长度,推断其大致身高,为破案提供重要线索.

例3 英国遗传学家高尔顿(Francis Galton,1822-1911年)在子女与父母相像程度遗传学研究方面,取得了重要进展.高尔顿的学生卡尔·皮尔逊(Karl Pearson,1857-1936年)在继续这一遗传学研究的过程中,测量了1078个父亲及其成年儿子的身高.用x表示父亲的身高,y表示儿子的身高(单位为英寸).求得回归方程为(如图所示),发现了一个重要的规律.主要计算结果及描述见下表:

时,

时,

高尔顿和皮尔逊把这种现象称为“回归效应”,现在人们把由一个变量的变化去推断另一个变量变化的方法统称为回归分析.

参考文献

[1] 袁卫,庞皓,曾五一.统计学.高等教育出版社,2000年.

[2] 魏宗舒等.概率论与数理统计教程.高等教育出版社,1983年.

[3] (美)John Tabak 著,杨静译.不明确的科学.商务印书官,2008年

高中数学必修三检测:变量间的相关关系习题(附解析)

2.3.1 变量之间的相关关系 40分钟课时作业 一、选择题 1.某商品销售量y (件)与销售价格x (元/件)负相关,则其线性回归方程可能是( ) A.y ^ =-10x +200 B.y ^ =10x +200 C.y ^ =-10x -200 D.y ^ =10x -200 答案 A 解析 x 的系数为负数,表示负相关,排除B 、D ,由实际意义可知x >0,y >0,C 中,散点图在第四象限无意义,故选A. 2.根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( ) A .逐年比较,2008年减少二氧化硫排放量的效果最显著 B .2007年我国治理二氧化硫排放显现成效 C .2006年以来我国二氧化硫年排放量呈减少趋势 D .2006年以来我国二氧化硫年排放量与年份正相关 答案 D 解析 由柱形图可知:A 、B 、C 均正确,2006年以来我国二氧化硫年排放量在逐渐减少,所以排放量与年份负相关,所以D 不正确. 3.对变量x ,y 有观测数据(x i ,y i )(i =1,2,3,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,3,…,10),得散点图2,由这两个散点图可以判断( )

A .y 与x 正相关,v 与u 正相关 B .y 与x 正相关,v 与u 负相关 C .y 与x 负相关,v 与u 正相关 D .y 与x 负相关,v 与u 负相关 答案 C 解析 根据散点图直接进行判断. 4.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( ) A.y ^ =0.4x +2.3 B.y ^ =2x -2.4 C.y ^ =-2x +9.5 D.y ^ =-0.3x +4.4 答案 A 解析 由变量x 与y 正相关知C 、D 均错,又回归直线经过样本点的中心(3,3.5),代入验证得A 正确,B 错误.故选A. 5.已知x 与y 之间的一组数据: 若y 与x 线性相关,则y 与x 的回归直线y ^ =b ^ x +a ^ 必过( ) A .点(2,2) B .点(1.5,0) C .点(1,2) D .点(1.5,4) 答案 D 解析 ∵x = 0+1+2+34=1.5,y =1+3+5+7 4 =4, ∴回归直线必过点(1.5,4).故选D. 6.已知x ,y 的取值如表所示:

变量之间的关系练习(1)附答案

变量之间的关系练习(1)附答案 一、选择题(每题3分,共24分) 1.老师骑车外出办事,离校不久便接到学校到他返校的紧急,老师急忙赶回学校.下面四个图象中,描述老师与学校距离的图象是() 2.秋天到了,葡萄熟了,一阵微风吹过,一颗葡萄从架上落下来,葡萄下落过程中速度与时间的大致图像是( ) 3.某同学从学校走回家,在路上遇到两个同学,一块儿去文化宫玩了会儿,然后回家,下列象能刻画这位同学所剩路程与时间的变化关系的是() 4.某人骑车外出,所走的路程s(千米)与时间t(小时)的关系如图1所示,现有下列四种说法:①第3小时中的速度比第1小时中的速度快;②第3小时中的速度比第1小时中的速度慢;③第3小时后已停止前进;④第3小时后保持匀速前进.其中说确的是A.B.C.D. A.B.C.D. A.B.C.D.

( ) A .②③ B .①③ C .①④ D .②④ 5.某校办工厂今年前5个月生产某 种产品总量(件)与时间(月) 的关系如图2所示,则对于该厂 生产这种产品的说确的是( ) A .1月至3月生产总量逐月增加,4,5两月生产总量逐月减少 B .1月至3月生产总量逐月增加,4,5两月生产总量与3月持平 C .1月至3月生产总量逐月增加,4,5两月均停止生产 D .1月至3月生产总量不变,4,5两月均停止生产 6.如图3是反映两个变量关系的图,下列的四个情境比较合适该图的是( ) A .一杯热水放在桌子上,它的水温与时间的关系 B .一辆汽车从起动到匀速行驶,速度与时间的关系 C .一架飞机从起飞到降落的速度与时晨的关系 D .踢出的足球的速度与时间的关系 7.如图4,射线l 甲,l 乙分别表示甲、乙两名运动员在自行车比赛 中所走路程与时间的关系,则图中显示的他们行进的速度关系 是( ) A .甲比乙快 B .乙比甲快 C .甲、乙同速 D .不一定 8.2004年6月3日中央新闻报道.为鼓励居民节约用水,市将出台新的居民用水收费标准:①若每月每户居民用水不超过4立方米,则按每立方米2元计算;②若每月每户居 图2 图3 图4

变量间的相互关系(一)、(二)

2.3变量间的相互关系(一)、(二) 问题提出 1. 函数是研究两个变量之间的依存关系的一种数量形式.对于两个变量,如果当一个变量的取值一定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个函数关系. 2. 在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗? 3. 这两个变量是有一定关系的,它们之间是一种不确定性的关系.类似于这样的两个变量之间的关系,有必要从理论上作些探讨,如果能通过数学成绩对物理成绩进行合理估计,将有着非常重要的现实意义. 知识探究(一):变量之间的相关关系 思考1:考察下列问题中两个变量之间的关系,想一想这些问题中两个变量之间的关系是函数关系吗? (1)商品销售收入与广告支出经费; (2)粮食产量与施肥量; (3)人体内的脂肪含量与年龄. 思考2:“名师出高徒”可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的教学水平之间的关系是函数关系吗? 你能举出类似的描述生活中两个变量之间的这种关系的成语吗? 思考3:上述两个变量之间的关系是一种非确定性关系,称之为相关关系,那么相关关系的含义如何? 自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.思考4:函数关系与相关关系之间的区别与联系. 函数关系中的两个变量间是一种确定性关系;相关关系是一种非确定性关系. 函数关系是一种因果关系而相关关系不一定是因果关系,也可能是伴随关系. 3. 函数关系与相关关系之间有着密切联系,在一定条件下可以互相转化. 例1 在下列两个变量的关系中,哪些是相关关系? ①正方形边长与面积之间的关系; ②作文水平与课外阅读量之间的关系; ③人的身高与年龄之间的关系; ④降雪量与交通事故的发生率之间的关系. 练习 1.已知下列变量,它们之间的关系是函数关系的有①,是相关关系的有②③. ①已知二次函数y=ax2+bx+c,其中a、c是已知常数,取b为自变量,因变量是这个函数的判别式△=b2-4ac; ②光照时间和果树亩产量; ③每亩施用肥料量和粮食产量.

讲义+第16课时变量之间的相关关系两个变量的线性相关最新

课时提升作业15变量之间的相关关系两个变量的线性相关 1.对变量x,y有观测数据(x i ,y i)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据 2.已知回归直线的斜率的估计值是 1.23,样本点中心(即(,))为(4,5),则回归直线的方程是( ) A.网=1.23x+4 B.壯1.23X+5 C. =1.23x+0.08 D』;:I=0.08x+1.23 3.在下列各图中,两个变量具有较强正相关关系的散点图是( ) A.(1) B.(2) C.(3) D.(4) 4.对有线性相关关系的两个变量建立的回归直线 方程」=:,+ ' x中,回归系数'( ) 5.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( ) 6.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归方程,分别得到以下四个 结论:①y与x负相关且 =2.347x-6.423; ②y与x负相关且「=-3.476x+5.648; ③y 与 x 正相关且?’ =5.437x+8.493;④y 与 x 正相关且?’ =-4.326x-4.578. 其中一定不正确的结论的序号是( ) A.①② B.②③ C.③④ D.①④ 7.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据 (X i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是 A.y与x具有正的线性相关关系 B.回归直线过样本点的中心(,) (U i,V i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断 A.变量x与y正相关,u与v正相关 B. 变量x与y正相关,u 与v负 相关 C.变量x与y负相关,u与v正相关 D. 变量x与y负相关,u 与v负 相关 A.不能小于0 B.不能大于0 C.不能等于0 D.只能小于0 A. =-10x+200 B. =10x+200 C. =-10x-200 D. =10x-200 0 1 25 4 5 67 J

【基础练习】《变量之间的相关关系》(数学人教A必修三)

《变量之间的相关关系》基础练习 1下列两个变量之间的关系哪个不是函数关系?() A、角度和它的余弦值 B、正方形边长和面积 C、正n边形的边数和顶点角度之和 D、人的年龄和身高 2、下列变量之间的关系是函数关系的是() 已知二次函数其中a,c是已知常数,取b为自变量,自变量和这个函数的判别式光照时间和果树亩产量降雪量和交通事故发生率 每亩施用肥料量和粮食亩产量 近十年来,某市社会商品零售总额与职工工资总额数据如下(单位:亿元) A、y=2.7991x —23.5494 B、y=2.7992x —23.5493 C、y=2.6962x —23.7493 D、y=2.8992x —23.7494 4、对于回归分析,下列说法错误的是() A、在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定 B、线性相关系数可以是正的或负的 C、回归分析中,如果=1或=1,说明x与y之间完全线性相关 D、样本相关系数r(-1,+1) 5、有一组观测值有22组,则与显著性水平0、05相应的相关系数临界值为() A、0、404 B、0、515 C、0、423 D、0、537 6、下列说法中正确的是() A .任何两个变量都具有相关关系 B. 人的知识与其年龄具有相关关系 C. 散点图中的各点是分散的没有规律

D ?根据散点图求得的回归直线方程都是有意义的 7、变量y与x之间的回归方程() A .表示y与x之间的函数关系 B .表示y和x之间的不确定关系 C.反映y和x之间真实关系的形式 D .反映y与x之间的真实关系达到最大限度的吻合 8、若用水量x与某种产品的产量y的回归直线方程是=2x + 1250,若用水量为50kg时, 预计的某种产品的产量是() A . 1350 kg B .大于1350 kg C.小于1350kg D .以上都不对 9、回归”一词是在研究子女身高与父母的身高之间的遗传关系时,由高尔顿提出的,他的研究结果是子代的平均身高向中心回归.根据他的结论,在儿子的身高y与父亲的身高x 的回归大程=a+ bx中,b (C) (A )在(一1, 0)内(B)等于0 (0在(0, 1 )内(D)在[1 , + *>]内 10、下列两变量具有相关关系的是() A正方体的体积与边长B人的身高与体重 C匀速行驶车辆的行驶距离与时间D球的半径与体积 11、自变量取值一定时,因变量的取值 _____________ 两个变量之间的关系叫做相关关系。与 函数关系___________________ ,相关关系是一种 ___________________ 。 12、对具有 __________ 的两个变量进行统计分析的方法叫回归分析。 13、表示具有相关关系的两个变量的一组数据的图形叫做_______________________________ 。 14、现有一个有身高预测体重的回归方程:体重预测值=4(磅/英村)扇高—130磅.其中体 重与身高分别以磅和英寸为单位.如果换算为公制(1英寸~25cm, 1磅~045kg),回归方 程应该为 15、对于回归方程,当x=28时,y的估计值是 ________________ 。 答案与解析 I、D; 2、A; 3、A; 4、D; 5、C; 6、B; 7、D; 8、A; 9、C; 10、B II、带有一定随机性的不同非确定性关系

【文档】《变量之间的相关关系》练习题数学人教A必修三.doc

第二章 2.3 2.3.1 一、选择题 1.以下关于相关关系的说法正确的个数是( ) ①相关关系是函数关系 ②函数关系是相关关系 ③线性相关关系是一次函数关系 ④相关关系有两种,分别是线性相关关系和非线性相关关系 A.0 B.1 C.2 D.3 [答案] B [解析] 根据相关关系的概念可知,只有④正确,故选 B. 2.下列关系属于线性负相关的是( ) A.父母的身高与子女身高的关系 B.农作物产量与施肥量的关系 C.吸烟与健康的关系 D.数学成绩与物理成绩的关系 [答案] C [解析] 若以吸烟量为横轴,健康为纵轴画出散点图,则由生活常识知,这些点散布在从左上角到右下角的区域内. 因此,吸烟与健康的关系属于线性负相关. 3.对于给定的两个变量的统计数据,下列说法正确的是( ) A.都可以分析出两个变量的关系 B.都可以用一条直线近似地表示两者的关系 C.都可以作出散点图 D.都可以用确定的表达式表示两者的关系 [答案] C [解析] 给出一组样本数据,总可以作出相应散点图,但不一定分析出两个变量的关系,更不一定符合线性相关或有函数关系. 4.下列两个变量之间的关系具有相关关系的是( ) A.家庭的支出与收入 B.某家庭用电量与水价间的关系

C.单位圆中角的度数与其所对孤长 D.正方形的周长与其边长 [答案] A [解析] C、D 均为函数关系, B 用电量与水价间不具有函数关系,也不具有相关关系故选 A 5.观察下列四个散点图,两变量具有线性相关关系的是( ) [答案] A [解析] 选项A 中的点大致分布在一条直线附近,故选 A. 6.有五组变量: ①汽车的重量和汽车每消耗 1 L 汽油所行驶的平均路程; ②平均日学习时间和平均学习成绩; ③某人每日吸咽量和其身体健康情况; ④立方体的边长和体积; ⑤汽车的重量和行驶100 km 的耗油量. 其中两个变量成正相关的是( ) A.①③B.②④ C.②⑤D.④⑤ [答案] C [解析] ②⑤中的两个变量成正相关. 二、填空题 7.有下列关系: ①人的年龄与其拥有的财富之间的关系; ②曲线上的点与该点的坐标之间的关系; ③苹果的产量与气候之间的关系; ④森林中的同一树木,其横截面直径与高度之间的关系; ⑤学生与其学号之间的关系. 其中具有相关关系的是________. [答案] ①③④ [解析] ②⑤为确定性关系. 8.据两个变量x、y 之间的观测数据画成散点图如图,这两个变量是否具有线性相关关系(答是与否)__________. [答案] 否

变量间的相关关系同步练习题

变量间的相关关系同步练习题 1. 下列两个变量具有相关关系的是( ) A. 正方体的体积与边长 B. 人的身高与体重 C. 匀速行驶车辆的行驶距离与时间 D. 球的半径与体积 2. 两个变量成负相关关系时,散点图的特征是( ) A. 点散布在从左下角到右上角的区域内 B. 点散布在某带形区域内 C. 点散布在某圆形区域内 D. 点散布在从左上角到右下角的区域内 3. 由一组样本数据(1x ,1y ),(2x ,2y ),…,(n x ,n y ),得到回归方程a bx y +=∧ ,那么下面说法不正确的是( ) A. 直线a bx y +=∧ 必经过点(x ,y ) B. 直线a bx y +=∧至少经过点(1x ,1y ),(2x ,2y ),…,(n x ,n y )中的一个点 C. 直线a bx y +=∧的斜率为 ∑∑==--n 1 i 2 2i n 1 i i i x n x y x n y x D. 直线a bx y +=∧ 和各点(1x ,1y ),(2x ,2y ),…,(n x ,n y )的偏差 ()[]∑=+-n 1 i 2 i i a bx y 是该坐标平面上所有直线与这些点的偏差中最小的直线 4. 若施化肥量x (单位:kg )与水稻产量y (单位:kg )的回归方程为250x 5y +=∧ ,则当施化肥量为80kg 时,预计水稻产量为___________。 5. 相关关系与函数关系的区别是___________。 (1)作出这些数据的散点图; (2)通过观察这两个变量的散点图,你能得出什么结论? 7. 某化工厂为预测某产品的回收率y ,需要研究回收率y 和原料有效成分含量x 之间的相关关系,现取了8对观察值,计算得: ∑==8 1 i i 52x , ∑==8 1 i i 228y , ∑=8 1 i 2 i x 478=, ∑==8 1 i i i 1849y x ,则y 与x 的回归方程是( ) A. x 62.247.11y +=∧ B. x 62.247.11y +-=∧ C. x 47.2262.2y +=∧ D. x 62.247.11y -=∧

高中数学:变量间的相关关系与统计案例练习

高中数学:变量间的相关关系与统计案例练习 1.(辽宁丹东教学质量监测)某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验,经计算K 2=6.705,则所得到的统计学结论是:有 的把握认为“学生性别与支持该活动没有关系”.( C ) 附: P (K 2≥k ) 0.100 0.050 0.025 0.010 0.001 k 2.706 3.841 5.024 6.635 10.828 C .1% D .0.1% 解析:因为6.635<6.705<10.828,因此有1%的把握认为“学生性别与支持该活动没有关系”,故选C. 2.已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( C ) A .x 与y 正相关,x 与z 负相关 B .x 与y 正相关,x 与z 正相关 C .x 与y 负相关,x 与z 负相关 D .x 与y 负相关,x 与z 正相关 解析:由y =-0.1x +1,知x 与y 负相关,即y 随x 的增大而减小,又y 与z 正相关,所以z 随y 的增大而增大,减小而减小,所以z 随x 的增大而减小,x 与z 负相关,故选C. 3.对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其线性回归方程是y ^=1 3x +a ^,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a ^ 的值是( B ) A.116 B .18 C.14 D .12 解析:依题意可知样本点的中心为? ?? ?? 34,38,则38=13×34+a ^,解得a ^ =18.

变量之间的相关关系

课题:§2.3.1变量之间的相关关系 一.教学任务分析: (1)通过具体示例引导学生考察变量之间的关系,在讨论的过程中认识现实世界中存在着不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性. (2) 通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.会作散点图,并对变量间的正相关或负相关关系作出直观判断. (3) 在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解统计的作用. 二.教学重点与难点: 教学重点:利用散点图直观认识变量间的相关关系. 教学难点:理解变量间的相关关系. ↓ ↓ ↓ 1.创设情景,揭示课题 客观事物是相互联系的,过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系.比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说,事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度,所以说,函数关系存在着一种确定性关系,但还存在着另一种非确定性关系——相关关系. 生活中存在着许多相关关系的问题: 问题1:商品销售收入与广告支出之间的关系. 问题2:粮食产量和施肥量之间的关系. 问题3:人体内的脂肪含量与年龄之间的关系. 由上述问题我们知道,两个变量之间的关系,可能是确定关系或非确定关系.当自变量取

值一定时,因变量的取值带有一定的随机性时,两个变量之间的关系称为相关关系.相关关系是一种非确定性关系,函数关系是一种确定性的关系. 2.两个变量的线性相关 问题4: 在一次对人体的脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据: 问题5:某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表: 根据上述数据,气温与热茶销售量之间的有怎样的关系? 学生活动:为了了解热茶销量与气温的大致关系,我们以横坐标x表示气温,纵坐标y表示热茶销量,建立直角坐标系,将表中数据构成的6个数对所表示的点在坐标系内标出,得到下

变量间的相关关系练习

精品文档 变量间的相关关系练习 、在一组样本数据1的上,则这组样本若所有样本点都在直线散点图中,_______. 数据的样本相关系数为 两变量的线性相关试验,并用回归B2、甲,乙,丙,丁四位同学各自对A,如 表:分析方法分别求得相关系数r丁甲乙丙 0.82 0.78 r 0.69 0.85 则这四位同学的试验结果能体现出A,B两变量有更强的线性相关性的是() A.甲 B.乙 C.丙 D.丁 3、某位同学进行寒假社会实践活动,为了对白天平均气温与某奶茶店的某111115日的白月月日至种饮料销量之间的关系进行分析研究,他分别记录了C°(天 2126233025销量(杯) 222天数据若先从这五组数据中抽出组数据恰好是相邻组,求抽出的(Ⅰ)的概率; yx的线性回归方程;关于(Ⅱ)请根据所给五组数据,求出 116日的白天平均月(Ⅲ)根据(Ⅱ)中所得的线性回归方程,若天气预报C7°(),请预测该奶茶店这种饮料的销量.气温精品文档. 精品文档 .)(参考公式: u11,2…10)xy(xy)(i,4、对变量,,,得散点图有观测数据,,;对变量=ii)((u2.1,2v)(i… 10)v=,,得散点图,,由这两个散点图可以判断有观测数据ii

vyuByuvxAx负相正相关,与正相关与.变量.变量与与正相关,关vyuvDxxCyu 负相正相关负相关,.变量与.变量负相关,与与与关 )(14 5、下表是某厂单位:百吨~的一组数据:月份用水量 x4312月份 xy由散点图可知,用水量之间有较好的线性相关关系,其回归方程是与月份)(0.7xaa+,则等于=- 5.25D B5.15 C5.2 10.5 A ....将其整理后得到如、某研究小组在一项实验中获得一组关于之间的数据,7、) ty图所示的散点图,下列函数中,最能近似刻画与之间关系的是( 精品文档. 精品文档 8、以下四个命题中:分钟从中抽取一件产品质检员每10 ①从匀速传递的产品生产流水线上, 进行某项指标检测,这样的抽样是分层抽样; 1;②若两个随机变量的线性相关性越强,则相关系数的绝对值越接近于 ③根据散点图求得的回归直线方程可能是没有意义的; ,.9=04P),且(④若某项测量结果服从正态分布N(1≤,) 1-2≤)=0.P 则.( 其中真命题的个数为

变式练习(变量间的相关关系)

?变式练习 1.有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语.吸烟和健康之间有因果关系吗?每一个吸烟者的健康问题都是因为吸烟引起的吗?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟“的说法对吗? 解析:吸烟和健康之间并没有严格的因果关系,吸烟者的健康问题并不都是因为吸烟引起的.有的人吸烟,但是健康状况很好;有的人不吸烟,健康状况却很差.但是吸烟却能影响健康状况,其他条件相同的情况下,吸烟者的健康状况要比不吸烟者的健康状况差.所以,吸烟对健康又有一定的影响,应该禁止吸烟. 2.地区的环境条件适合天鹅栖息繁衍.有人经统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率也高;天鹅少的地方婴儿出生率低.于是,他就得出一个结论:天鹅能够带来孩子.你认为这个结论对吗?为什么?你能由此解释一下,社会上流行“乌鸦叫,没好兆”这样的迷信说法的原因吗? 解析:某个地区天鹅栖息的多少,与这个地区的环境条件有很大的关系.适合天鹅栖息的地区天鹅栖息的就多;不适合天鹅栖息的地区天鹅栖息的就少.婴儿出生率与生理遗传有关,当然也受地区环境的影响,但是两者并不存在必然的相关关系,“天鹅能够带来孩子”这个结论是错误的.社会上流行“乌鸦叫,没好兆”这样的说法,是封建迷信的说法,是人们夸大了两者之间的联系,毫无科学道理. 3.在你描述建设有中国特色社会主义事业的发展前景时,请你用一句话来描述下列两个变量之间的理想关系. (1)受教育的年限与文盲人数; (2)收入水平与纳税水平; (3)收入水平与城乡差别; (4)经济发展与环境质量. 提示:只要能够描述出两者之间的关系,符合实际即可. 4.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次实验,收集数据如下: (1)画出散点图; (2)求回归方程; (3)关于加工零件的个数与加工时间,你能得出什么结论? 解:(1)散点图略.

变量间的相关关系与统计案例教案(绝对经典)

第3节变量间的相关关系与统计案例 【最新考纲】 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;4.了解回归分析的基本思想、方法及其简单应用. 【高考会这样考】考查回归分析、独立性检验的基本思想和简单应用. 要点梳理 1.相关关系与回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数. (1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系. 2.线性回归方程 (1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n), 其回归方程为y^=b^x+a^__,则b^=∑ n i=1 (x i-x-)(y i-y-) ∑ n i=1 (x i-x-)2 = ∑ n i=1 x i y i-nx-y- ∑ n i=1 x2i-nx-2 ,a^=y--b^x-.其中, b^是回归方程的斜率,a^是在y轴上的截距. 回归直线一定过样本点的中心(x-,y-). 3.回归分析 (1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.

变量间的相关关系优秀教案

变量间的相关关系 一、教材分析 学生情况分析:学生已经具备了对样本数据进行初步分析的能力,且掌握了一定的计算基础。 教材地位和作用:变量间的相关关系是高中新教材人教A版必修3第二章2.3节的内容, 本节课主要探讨如何利用线性回归思想对实际问题进行分析与预测。为以后更好地研究选修2-3第三章 3.2节回归分析思想的应用奠定基础。 二、教学目标 1、知识与技能:利用散点图判断线性相关关系,了解最小二乘法的思想及线性回归方程系数公式的推导过程,求出回归直线的方程并对实际问题进行分析和预测,通过实例加强对回归直线方程含义的理解。 2 、过程与方法: ①通过自主探究体会数形结合、类比、及最小二乘法的数学思想方法。②通过动手操作培养学生观察、分析、比较和归纳能力。 3、情感、态度与价值观:类比函数的表示方法,使学生理解变量间的相关关系,增强应用回归直线方程对实际问题进行分析和预测的意识。 三、教学重点、难点 重点:利用散点图直观认识两个变量之间的线性相关关系,了解最小二乘法的思想并利用此思想求出回归方程。 难点:对最小二乘法的数学思想和回归方程的理解,教学实施过程中的难点是根据给出的线性回归方程的系数公式建立线性回归方程。 四、教学设计) (一)、创设情境导入新课 1、相关关系的理解 我们曾经研究过两个变量之间的函数关系:一个自变量对应着唯一的一个函数值,这两者之间是一种确定关系。生活中的任何两个变量之间是不是只有确定关系呢?如:学生成绩与教师水平之间存在着某种联系,但又不是必然联系,对于学生成绩与教师水平之间的这种不确定关系,我们称之为相关关系。这就是我们这节课要共同探讨的内容————变量间的相关关系。生活中还有很多描述相关关系的成语,如:“虎父无犬子”,“瑞雪兆丰年”。通过学生熟悉的函数关系,引导学生关注生活中两个变量之间还存在的相关关系。让学生体会研究变量之间相关关系的重要性。感受数学来源于生活。 (二)、初步探索,直观感知 1、根据样本数据作出散点图,直观感知变量之间的相关关系。在研究相关关系前,先回忆一下函数的表示方法有哪些——列表,画图象,求解析式。下面我们就用这些方法来研究相关关系。看这样一组数据:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,根据样本数据,人体的脂肪含量与年龄之间有怎样的关系? 一个点。

【非常考案】高考数学(通用版)一轮复习练习:9.3变量间的相关关系、统计案例(含答案解析)

分层限时跟踪练(五十二) (限时40分钟) [基础练] 扣教材练双基 一、选择题 1.(2015·全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是() 图9-3-3 A.逐年比较,2008年减少二氧化硫排放量的效果最显著 B.2007年我国治理二氧化硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关 【解析】对于A选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A 正确.对于B选项,由图知,由2006年到2007年矩形高度明显下降,因此B正确.对于C选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C 正确.由图知2006年以来我国二氧化硫年排放量与年份负相关,故选D. 【答案】 D 2.(2014·湖北高考)根据如下样本数据 得到的回归方程为y=bx+a,则() A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<0 【解析】作出散点图如下:

观察图象可知,回归直线y ^=bx +a 的斜率b <0,当x =0时,y ^ =a >0.故a >0,b <0. 【答案】 B 3.2016年元旦期间,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表: A .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关” B .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关” C .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关” D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关” 【解析】 由2×2列联表得到a =45,b =10,c =30,d =15,则a +b =55,c +d =45,a +c =75,b +d =25,ad =675,bc =300,n =100,计算得K 2 的观测值k = - 2 55×45×75×25 ≈3.030.因为2.706<3.030<3.841,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,故选A. 【答案】 A 4.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n)都在直线y =1 2x +1上,则这组样本数据的 样本相关系数为( ) A .-1 B .0 C.1 2 D .1 【解析】 样本点都在直线上时,其数据的估计值与真实值是相等的,正相关最强,其相关系数为1. 【答案】 D 5.(2015·福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:

人教版高数必修三第8讲:变量间的相关关系(教师版)

变量间的相关关系 __________________________________________________________________________________ __________________________________________________________________________________ 1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系. 2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系. 3.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程. 1.相关关系 (1)定义:如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的________性,那么这两个变量之间的关系,叫做相关关系. (2)两类特殊的相关关系:如果散点图中点的分布是从________角到________角的区域,那么这两个变量的相关关系称为正相关,如果散点图中点的分布是从________角到________角的区域,那么这两个变量的相关关系称为负相关. 随机 左下 右上 左上 右下 两个变量间的关系分为三类:一类是确定性的函数关系,如正方形的边长与面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,这种关系就是相关关系,例如,某位同学的“物理成绩”与“数学成绩”之间的关系,我们称它们为相关关系;再一类是不相关,即两个变量间没有任何关系. 2.线性相关 (1)定义:如果两个变量散点图中点的分布从整体上看大致在一条________附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做_________. (2)最小二乘法:求线性回归直线方程y ^=b ^x +a ^ 时,使得样本数据的点到它的________________最小的方法叫做最小二乘法,其中a ,b 的值由以下公式给出: 直线 回归直线 距离的平方和

变量间的相关关系-高考文科数学专题练习

一、填空题 1.下列关系中,是相关关系的为________.(填序号) ①学生的学习态度与学习成绩之间的关系; ②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. 解析:由相关关系的概念知①②是相关关系. 答案:①② 2.下面是一个2×2列联表 则表中a 、b 解析:∵a +21=73,∴a =52. 又∵a +2=b ,∴b =54. 答案:52、54 3.一位母亲记录了儿子3~9岁的身高,数据(略),由此建立的身高与年龄的回归模型为y ^ =7.19x +73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是________. ①身高一定是145.83 cm ②身高在145.83 cm 以上 ③身高在145.83 cm 左右 ④身高在145.83 cm 以下 解析:用回归模型y ^ =7.19x +73.93,只能作预测,其结果不一定是个确定值. 答案:③ 4.三点(3,10),(7,20),(11,24)的回归方程为________. 解析:设回归方程为y ^=b ^x +a ^ ,则

b ^=x 1y 1+x 2y 2+x 3y 3-3x 2 x 21+x 22+x 23 -3x 2 =3×10+7×20+11×24-3×7×189+49+121-3×49 =1.75, a ^=y - b ^ x =18-1.75×7=5.75. 故y ^ =1.75x +5.75. 答案:y ^ =1.75x +5.75 5.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表: 由表中数据得线性回归方程y =b x +a 中b =-2,预测当气温为-4 ℃时,用电量的度数约为________度. 解析:x =10,y =40,把(10,40)代入方程y ^=-2x +a ^,得a ^ =60,当x =-4时,y ^ =-2×(-4)+60=68. 答案:68 6.关于某设备的使用年限x 与所支出的维修费用y (万元)有如下统计资料.若由资料知y 对x 呈线性相关关系,则线性回归方程为y ^=6 5x +________. 解析:线性回归直线方程y =65x +a 通过样本中心点(x ,y ),即(4,5),所以5=6 5×4+a ^,解得a ^=15. 答案:15

《变量间的相关关系》教案

变量间的相关关系的教学设计 本节教学设计主要是使用TI92图形计算器,对普通高中课程标准实验教科书数学③第二章《统计》中的“两个变量的线性相关”进行有益的教与学探究。学生通过对 TI图形计算器的操作,具体形象地利用散点图等直观图形认识变量之间的相关关系,同时,经历描述两个变量的相关关系的过程。学生亲自体验了发现数学、领悟数学的全过程。与此同时,教师在落实新课程标准的相关理念上作了一些有益的探讨。 教学设计与实践: [教学目标]: 1、明确事物间的相互联系。认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系。 2、通过TI技术探究用不同的估算方法描述两个变量的线性相关关系的过程,学会用数学的有关变量来描述现实关系。 3、知道最小二乘法思想,了解其公式的推导。会用TI图形计算器来求回归方程,相关系数。 [教学用具]: 学生每人一台TI图形计算器、多媒体展示台、幻灯 [教学实践情况]: 一、问题引出:请同学们如实填写下表(在空格中打“√” ) 然后回答如下问题:①“你的数学成绩对你的物理成绩有无影响?”②“ 如果你的数学成绩好,那么你的物理成绩也不会太差,如果你的数学成绩差,那么你的物理成绩也不会太好。”对你来说,是这样吗?同意这种说法的同学请举手。 根据同学们回答的结果,让学生讨论:我们可以发现自己的数学成绩和物理成绩存在某种关系。(似乎就是数学好的,物理也好;数学差的,物理也差,但又不全对。)教师总结如下:

物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法。数学成绩的高低对物理成绩的高低是有一定影响的。但决非唯一因素,还有其它因素,如图所示(幻灯片给出): (影响你的物理成绩的关系图) 因此,不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少。但这两个变量是有一定关系的,它们之间是一种不确定性的关系。如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义。 二、引出相关关系的概念 教师提问:“像刚才这种情况在现实生活中是否还有?” 学生甲:粮食产量与施肥用量的关系; 学生乙:人的体重与食肉数量的关系。 …… 从而得出:两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系。当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系。相关关系是一种非确定性关系。 三、探究线性相关关系和其他相关关系 问题:在一次对人体脂肪和年龄关系的研究中,研究人员获得了一组样本数据: 人体的脂肪百分比和年龄

_变量间的相关关系练习题

变量间的相关关系练习题 一、选择题 1、下列两个变量具有相关关系的是( B )。 A. 正方体的体积与边长 B. 人的身高与体重 C. 匀速行驶车辆的行驶距离与时间 D. 球的半径与体积 2、 (2010凌海高一检测)有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩; ③某人每日吸烟量和其身体健康情况;④正方形的边长和面积;⑤汽车的重量和百公里耗油量;其中两个变量成正相关的是( )。 A .①③ B.②④ C .②⑤ D.④⑤ 【解析】选C 。 3、两个变量成负相关关系时,散点图的特征是( D )。 A. 点散布在从左下角到右上角的区域内 B. 点散布在某带形区域内 C. 点散布在某圆形区域内 D. 点散布在从左上角到右下角的区域内 4、(2010天津高一检测)对变量x, y 有观测数据(1x ,1y ) (i=1,2,…,10),得散点图 1;对变量u ,v 有观测数据(1u ,1v ) (i=1,2,…,10),得散点图2. 由这两个散点图 可以判断( )。 A 、变量x 与y 正相关,u 与v 正相关 B 、变量x 与y 正相关,u 与v 负相关 C 、变量x 与y 负相关,u 与v 正相关 D 、变量x 与y 负相关,u 与v 负相关 【解析】选C 。图1中x 变大时,y 随之变小故x 与y 负相关;图2中u 变大时,v 也随之变大,故u 与v 正相关。 5、(2010白城高一检测)在下列各图中,每个图的两个变量具有相关关系的图是( )。

(1)(2)(3)(4) A.(1)(2) B.(1)(3) C.(2)(4) D.(2)(3) 【解析】选D。选项A为函数关系,选项D不具有相关关系。 6、(2010个旧高一检测)某设备使用年限x和所支出维修费用y(万元)之间呈线性相关,现取五对观察值,计算得:∑∑ ∑∑ == == = = = = 5 1 5 1 2 5 1 5 1 120 , 90 , 25 , 20 i i i i i i i i i y x x y x,则x y与的 回归方程是()。 A.3 2 ?- =x y B.3 2 ?- - =x y C、2 3 ?- =x y D.2 3 ?- - =x y 【解析】选A。 7、(2010鹤壁高一检测)在一次实验中,测得(,x y)的四组值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为() A.?1 y x =+ B.?2 y x =+ C.?21 y x =+ D.?1 y x =- 【解析】选A。 8、(2010锦州)线性回归方程a bx y+ = ?表示的直线必经过的一个定点是( )。 A) (0,0) (B) )0, (x(C) ) ,0(y(D) ) , (y x 【解析】选D。回归直线方程必过点(,) x y。 9、(2010佛山高一检测)根据表中数据,求y关于x的线性回归方程()。 A.3.1 5. 11- =x y B.3.1 5. 11+ =x y C. 5. 11 3.1 ?- =x y D.5. 11 3.1+ =x y

相关文档
最新文档