利用散点图判断两个变量之间的线性相关关系
高中数学必修3第二章:统计2.3变量间的相关关系

Y 研考点·知规律
探究悟道 点拨技法
题型一 相关关系的判断 【例 1】 河北国欣农研会的科研人员在 7 块并排、形状大小 相同的试验田上对某棉花新品种进行施化肥量 x 对产量 y 影响的 试验,得到如下表所示的一组数据(单位:kg): 施化肥量 x 15 20 25 30 35 40 45 棉花产量 y 330 345 365 405 445 450 455
D 读教材·抓基础
回扣教材 扫除盲点
课本导读
1.两个变量的线性相关 (1)在散点图中,点散布在从 左下角 到 右上角的区域,对于 两个变量的这种相关关系,我们将它称为正相关. (2)在散点图中,点散布在从 左上角 到 右下角的区域,两个 变量的这种相关关系称为负相关. (3)如果散点图中点的分布在整体上看大致在一条直线附近 , 就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
() (A)她儿子10岁时的身高一定是145.83 cm (B)她儿子10岁时的身高在145.83 cm以上 (C)她儿子10岁时的身高在145.83 cm左右 (D)她儿子10岁时的身高在145.83 cm以下
2.经调查知,某品牌汽车的销售量y(辆)与广告费用x(万元)之 间的回归直线方程为 yˆ =250+4x,当广告费用为50万元时,预计 汽车销售量约为 ______辆.
2.回归方程 (1)最小二乘法:使得样本数据的点到回归直线的 距离的平方
和最小的方法叫最小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,
^^ ^
y1)、(x2,y2),…,(xn,yn).其回归方程为y=bx+a,则
n
n
xi- x yi- y xiyi-n x y
【创新设计14-2015学年高中数学 2.3.1 变量之间的相关关系;2.3.2 两个变量的线性相关课件 新人教A版必修3

^
(
)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg D.若该大学某女生身高为170 cm,则可断定其体重必为 58.79 kg
答案 D ^ 解析 当 x=170 时,y =0.85×170-85.71=58.79,
体重的估计值为 58.79 kg.
5.正常情况下,年龄在 18 岁到 38 岁的人,体重 y(kg)对身高 x(cm)的回归方程为y=0.72x-58.2,张红同学(20 岁)身高 178 cm,她的体重应该在________kg 左右.
跟踪演练1
下列两个变量之间的关系,哪个不是函数关系 ( )
A.正方体的棱长和体积 B.圆半径和圆的面积 C.正n边形的边数和内角度数之和 D.人的年龄和身高 答案 D
解析
A、B、C都是函数关系,对于A,V=a3;对于B,S=
πr2;对于C,g(n)=(n-2)π.而对于年龄确定的不同的人可以 有不同的身高,∴选D.
(2)正相关与负相关:
右上角 的 左下角 到_______ ①正相关:散点图中的点散布在从_______ 区域.
左上角 到_______ 右下角 的 ②负相关:散点图中的点散布在从_______
区域.
2.回归直线的方程 (1)回归直线:如果散点图中点的分布从整体上看大致在 一条直线 附近,就称这两个变量之间具有_________ 线性相关 关 _________
^
A.y平均增加1.5个单位
B.y平均增加2个单位
C.y平均减少1.5个单位
答案 解析 C
D.y平均减少2个单位
∵两个变量线性负相关,∴变量x增加一个单位,y
平均减少1.5个单位.
4.(2013· 滨州高一检测)设某大学的女生体重 y(单位:kg)与身高 x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i = 1,2,…,n),用最小二乘法建立的回归方程为y = 0.85x - 85.71,则下列结论中不正确的是 A. y 与 x 具有正的线性相关关系 B.回归直线过样本点的中心(x, y)
2017学年数学必修三:2.3.1-变量之间的相关关系~2.3.2 两个变量的线性相关2

(2)问题2中,从表里数据能得出小麦的产量y与施肥量x之间的 函数关系式吗? 提示:从表格里我们很容易发现施肥量越大 ,小麦的产量就越高. 但是,施肥量并不是影响小麦产量的唯一因素 ,小麦的产量还受 土壤的质量、降雨量、田间管理等诸多因素影响 ,这时两个变
量之间就不是确定性的函数关系,因此不能得到y和x的函数关
1.两个变量的线性相关 左下角 到_______. 右上角 (1)正相关:点散布的方向:从_______ 左上角 到_______. 右下角 (2)负相关:点散布的方向:从_______ (3)回归直线:如果散点图中点的分布从整体上看在一条直线附
线性相关 关系,这条直线叫做 近,就称这两个变量之间具有_________
【解析】(1)作出散点图如图所示,
(2)由散点图可知,各点并不在一条直线附近,所以两个变量是
非线性相关关系.
类型二
求回归方程
1.(2013·锦州高一检测)已知一组观测值具有线性相关关系,
bx a ,求得 b =0.51, x =61.75, y =38.14, 则回归方 若对于 y
【探究总结】
1.散点图的作用
(1)判断两个变量之间有无相关关系,一种常用的简便可行的方
法是绘制散点图.
(2)根据散点图很容易看出两个变量之间是否具有相关关系,是
不是线性相关关系,是正相关还是负相关,相关关系强还是弱.
2.利用散点图判断变量间的关系的方法 (1)如果所有的样本点都落在某一函数的曲线上,就用该函数来 描述变量间的关系,即变量具有函数关系. (2)如果所有的样本点都落在某一函数曲线附近,变量之间就有 相关关系. (3)如果所有的样本点都落在某一条直线附近,变量之间就有线 性相关关系.
利用散点图判断两个变量的相关关系

.
年龄 23 27
39
41
45
49 50
53
54
56
57
58
脂肪
9.5 17.8 21.2 25.9 27.5 26.3 28.2 29.6
30.2
31.4 30.8 33.5
年龄 60
61
脂肪 35.2 34.6
如上的一组数据,你能分析人体的脂肪含量与年龄 之间有怎样的关系吗?
从上表发现,对某个人不一定有此规律,但对很多个体放在一起,就体现出“人体脂肪随年龄增长而增加” 这一规律.而表中各年龄对应的脂肪数是这个年龄
人群的样本平均数.我们也可以对它们作统计图、 表,对这两个变量有一个直观上的印象和判断.
下面我们以年龄为横轴, 脂肪含量为纵轴建立直 角坐标系,作出各个点, 称该图为散点图。
脂肪含量 40 35
如图:
30 25 20 15 10 5
O
20
25
30 35 40
年龄
45 50 55
60 65
从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的位置散布在从左下角到右上角的区域。称它们成正相关。 但有的两个变量的相关,如下图所示:
如高原含氧量与海拔高度 的相关关系,海平面以上, 海拔高度越高,含氧量越 少。 作出散点图发现,它们散 布在从左上角到右下角的区 域内。又如汽车的载重和汽 车每消耗1升汽油所行使的 平均路程,称它们成负相关.
O
1、散点图的特点形象地体现了各数据的密切程度,因此我们可以根据散点图来判断两个 变量有没有线性关系.
2、从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋 势.
一块农田的水稻产量与施肥量之间的关系 。 水稻产量并不是由施肥量唯一确定,在取值上带有随机性
两个变量的线性相关 (11)

2.3变量间的相关关系2.3.1变量之间的相关关系2.3.2两个变量的线性相关1.变量间的相关关系 (1)相关关系的定义变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,那么这两个变量之间的关系叫做相关关系,两个变量之间的关系分为函数关系和相关关系.(2)散点图将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形叫做散点图.(3)正相关与负相关①正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.②负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.2.回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)线性回归方程:回归直线对应的方程叫做回归直线的方程,简称回归方程. (3)最小二乘法:求线性回归方程y ^=b ^x +a ^时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.其中,b ^是线性回归方程的斜率,a ^是线性回归方程在y 轴上的截距.1.下列两个变量具有相关关系的是( ) A .角度和它的余弦值 B .圆的半径和该圆的面积 C .正n 边形的边数和它的内角和 D .居民的收入与存款D [A 、B 、C 中两变量是确定的函数关系.]2.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为( )A .y ^=1.5x +2 B .y ^=-1.5x +2 C .y ^=1.5x -2 D .y ^=-1.5x -2B [由散点图知,变量x ,y 之间负相关,回归直线在y 轴上的截距为正数,故只有B 选项符合.]3.5位学生的数学成绩和物理成绩如下表:A .是函数关系B .是相关关系,但相关性很弱C .具有较好的相关关系,且是正相关D .具有较好的相关关系,且是负相关C [数学成绩x 和物理成绩y 的散点图如图所示.从图上可以看出数学成绩和物理成绩具有较好的相关关系,且成正相关.] 4.设有一个回归方程为y ^=2-1.5x ,则变量x 每增加1个单位时,y 平均减少________个单位.1.5 [因为y ^=2-1.5x ,所以变量x 每增加1个单位时,y 1-y 2=[2-1.5(x +1)]-(2-1.5x )=-1.5,所以y 平均减少1.5个单位.](2)判断y与x是否具有线性相关关系.[解](1)散点图如图所示.(2)由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.相关关系的判断方法(1)两个变量x和y具有相关关系的判断方法①散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;②表格、关系式法:结合表格或关系式进行判断;③经验法:借助积累的经验进行分析判断.(2)判断两个变量x和y之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.1.下列关系中,属于相关关系的是________(填序号).①正方形的边长与面积之间的关系;②农作物的产量与施肥量之间的关系;③出租车费与行驶的里程;④降雪量与交通事故的发生率之间的关系.②④[在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③为确定的函数关系;在④中,降雪量与交通事故的发生率之间具有相关关系.]1.任意两个统计数据是否均可以作出散点图? [提示] 任意两个统计数据均可以作出散点图. 2.任何一组数据都可以由最小二乘法得出回归方程吗?[提示] 用最小二乘法求回归方程的前提是先判断所给数据具有线性相关关系,否则求回归方程是无意义的.3.回归系数b ^的含义是什么?[提示] (1)b ^代表x 每增加一个单位,y 的平均增加单位数,而不是增加单位数.(2)当b ^>0时,两个变量呈正相关关系,含义为:x 每增加一个单位,y 平均增加b ^个单位数;当b ^<0时,两个变量呈负相关关系,含义为:x 每增加一个单位,y 平均减少b ^个单位数.【例2】 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下: 零件数x (个) 10 20 30 40 50 60 70 80 90 100 加工时间y (分)626875818995102108115122(2)如果y 与x 具有线性相关关系,求y 关于x 的回归直线方程.思路点拨:画散点图→确定相关关系→求回归直线系数→写回归直线方程. [解] (1)画散点图如下:由上图可知y与x具有线性相关关系.(2)列表、计算:i 1 2 3 4 5 6 7 8 9 10 x i10 20 30 40 50 60 70 80 90 100 y i62 68 75 81 89 95 102 108 115 122x i y i620 1 360 2 250 3 240 4 450 5 700 7 140 8 6401035012200 a^=y-b^x=91.7-0.668×55=54.96.即所求的回归直线方程为:y^=0.668x+54.96.求回归直线方程的步骤(1)收集样本数据,设为(x i ,y i )(i =1,2,…,n )(数据一般由题目给出). (2)作出散点图,确定x ,y 具有线性相关关系. (3)把数据制成表格x i ,y i ,x 2i ,x i y i . (4)(5)代入公式计算b ^,a ^,公式为(6)写出回归直线方程y ^=b ^x +a ^.2.某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x 2 4 5 6 8y30 40 60 50 70(1)画出散点图;(2)求回归方程.[解](1)散点图如图所示.(2)列出下表,并用科学计算器进行有关计算.i 1 2 3 4 5x i 2 4 5 6 8y i30 40 60 50 70x i y i 60 160 300 300 560 x 2i416253664x =5,y =50,∑5i =1 x 2i =145,∑5i =1i i y i =1 380于是可得,b ^===6.5,a ^=y -b ^x =50-6.5×5=17.5. 于是所求的回归方程是y ^=6.5x +17.5.回归方程的应用学生 A B C D E 总成绩x 428 383 421 364 362 数学成绩y 7865716461(2)求y 对x 的线性回归方程(结果保留到小数点后3位数字); (3)如果一个学生的总成绩为450分,试预测这个学生的数学成绩. [解] (1)散点图如图所示:(2)由题中数据计算可得 x =391.6,y=67.8,∑5i =1x 2i =770654,∑5i =1x i y i =133 548.代入公式得b ^=133 548-5×391.6×67.8770 654-5×391.62≈0.204,a ^=67.8-0.204×391.6≈-12.086,所以y 对x 的线性回归方程为y ^=-12.086+0.204x .(3)由(2)得当总成绩为450分时,y ^=-12.086+0.204×450≈80,即这个学生的数学成绩大约为80分.利用线性回归方程解题的常见思路及注意点(1)利用回归直线过样本点的中心,可以求参数问题,参数可涉及回归方程或样本点数据.(2)利用回归方程中系数b ^的意义,分析实际问题.(3)利用回归直线进行预测,此时需关注两点;①所得的值只是一个估计值,不是精确值;②变量x 与y 成线性相关关系时,线性回归方程才有意义,否则即使求出线性回归方程也是毫无意义的,用其估计和预测的量也是不可信的.3.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑10i =1x i =80,∑10i =1y i =20,∑10i =1x i y i =184,∑10i =1x 2i =720.(1)求月储蓄y (千元)关于月收入x (千元)的线性回归方程; (2)若该居民区某家庭的月收入为7千元,预测该家庭的月储蓄. [解] (1)由题意知n =10,x =1n ∑10i =1x i =110×80=8,y =1n ∑n i =1y i =110×20=2,又∑ni =1x 2i -n x 2=720-10×82=80,∑10i =1x i y i -n x y =184-10×8×2=24,由此得b ^=2480=0.3,a ^=y -b ^y =2-0.3×8=-0.4, 故所求线性回归方程为y ^=0.3x -0.4.(2)将x =7代入线性回归方程,可以得到该家庭的月储蓄约为y ^=0.3×7-0.4=1.7(千元).1.判断变量之间有无相关关系,简便可行的方法就是绘制散点图.根据散点图,可看出两个变量是否具有相关关系,是否线性相关,是正相关还是负相关.2.求回归直线的方程时应注意的问题(1)知道x 与y 呈线性相关关系,无需进行相关性检验,否则应首先进行相关性检验.如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.(2)用公式计算a ^,b ^的值时,要先算出b ^,然后才能算出a ^.3.利用回归方程,我们可以进行估计和预测.若回归方程为y ^=b ^x +a ^,则x=x 0处的估计值为y ^0=b ^x 0+a ^.1.判断下列结论的正误(正确的打“√”,错误的打“×”) (1)相关关系是两个变量之间的一种确定的关系. ( ) (2)回归直线方程一定过样本中心点.( )(3)选取一组数据的部分点得到的回归方程与由整组数据得到的回归方程一定相同.( )[★答案★] (1)× (2)√ (3)×2.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^( )A .不能小于0B .不能大于0C .不能等于0D .只能小于0C [当b ^=0时,不具有相关关系,b ^可以大于0,也可以小于0.]3.若施化肥量x (千克/亩)与水稻产量y (千克/亩)的回归方程为y ^=5x +250,当施化肥量为80千克/亩时,预计水稻产量为亩产________千克左右.650 [当x =80时,y ^=400+250=650.]4.2019年元旦前夕,某市统计局统计了该市2018年10户家庭的年收入和年饮食支出的统计资料如下表:年饮食支出y (万元) 0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3如果已知y 与x 是线性相关的,求回归方程.(参考数据:∑10i =1x i y i =117.7,∑10i =1x 2i =406)[解] 依题意可计算得:x =6,y =1.83,x 2=36,x y =10.98, 又∵∑10i =1x i y i =117.7,∑10i =1x 2i =406,∴b ^=≈0.17,a ^=y -b ^ x =0.81,∴y ^=0.17x +0.81. ∴所求的回归方程为y ^=0.17x +0.81.。
利用散点图判断两个变量的相关关系资料讲解

负相关:如果散点图的点散布的位置是从在左上角到右下角的区域,即一个变量的值由小变大时,另 一个变量的值也近似的由大变小,对于两个变量的这种相关关系,我们称为负相关.
在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们将变量所对应的 点描出来,这些点就组成了变量之间的一个散点图.
探究:
(2)函数关系与相关关系之间有着密切联系: 在一定的条件下可以相互转化.而对于具有线性相关关系的两个变量来说,当求得其回归直线方程后, 又可以用一种确定性的关系对这两个变量间的取值进行估计:
3、判断相关关系的基本程序
两个变量 →一个变量值一定→另一个变量带有不确定性→相关关系
4、相关关系的类型 相关关系可分为线性相关,非线性相关两类.
如高原含氧量与海拔高度 的相关关系,海平面以上, 海拔高度越高,含氧量越 少。 作出散点图发现,它们散 布在从左上角到右下角的区 域内。又如汽车的载重和汽 车每消耗1升汽油所行使的 平均路程,称它们成负相关.
O
1、散点图的特点形象地体现了各数据的密切程度,因此我们可以根据散点图来判断两个 变量有没有线性关系.
利用散点图判断两个变量的相关关系
讲授新课
一:变量之间的相关关系
1.两变量之间的关系
(1)函数关系: 当自变量取值一定时,因变量取值由它唯一确定
正方形面积S与其边长x之间的函数关系S=x2 , 对自变量边长的每一个确定值,都有唯一确定值一定时,因变量的取值带有一定的随机性
一块农田的水稻产量与施肥量之间的关系 。 水稻产量并不是由施肥量唯一确定,在取值上带有随机性
不确定关系
2、相关关系的概念 自变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫相关关系.
专题68 变量间的相关关系与统计案例-高考数学复习资料(解析版)

D.58 件
【答案】A
【解析】由题中数据,得 x =10, y =38,回归直线y^=b^x+a^过点( x , y ),且b^=-2,代入得a^=58, 则回归方程y^=-2x+58,所以当 x=6 时,y=46,故选 A.
附: K 2
n(ad bc)2
.
(a b)(c d)(a c)(b d)
P(K2≥k) 0.050 0.010 0.001
k
3.841 6.635 10.828
【解析】 (1)由调查数据,男顾客中对该商场服务满意的比率为 40 0.8 ,因此男顾客对该商场服务满 50
意的概率的估计值为0.8.
支出费用为 3.00 万元的家庭购买水果和牛奶的年支出费用约为( )
A.1.795 万元
B.2.555 万元
C.1.915 万元
D.1.945 万元
【答案】A
【解析】
x
1 = ×(2.09+2.15+2.50+2.84+2.92)=2.50(万元),
y
1 = ×(1.25+1.30+1.50+1.70
^
y=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(ⅰ)从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线 y=-30.4+13.5t 上下,
这说明利用 2000 年至 2016 年的数据建立的线性模型①不能很好地描述环境基础设施投资额的趋势.2010 年
(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.
--
(2)样本点的中心:对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中(x,y)称为
第九章 变量间的相关关系统计案例

返回
(2)∵ xiyi=3 245, x =25, y =15.43, x2=5 075,7( x )2=4 375,7x y=2 695 i
i= 1 i= 1
7
7
--
y xiyi-7 x ·
i= 1
7
^ ∴b =
≈0.79,
xi2-7 x 2
i= 1
7
^= y -b x =-4.32,∴回归直线方程是y =0.79x-4.32. ^ a (3)进店人数80人时,商品销售的件数y=0.79×80-4.32≈59件.
^ B.y =2x+100 ^ D.y =2x-100
^ 解析:B、D为正相关,C中y 值恒为负,不符合题意.
答案: A
返回
2.两个变量y与x的回归模型中,分别选择了4个不同模
型,它们的相关指数R2如下,其中拟合效果最好的 模型是 A.模型1的相关指数R2为0.98 B.模型2的相关指数R2为0.80 C.模型3的相关指数R2为0.50 D.模型4的相关指数R2为0.25 解析:相关指数R2越大拟合效果越好. ( )
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该 项运动与性别有关” D.在犯错误的概率不超过0.1%的前提下,认为“爱好该 项运动与性别无关”
返回
[自主解答]
根据独立性检验的定义,由K2≈7.8>6.635
可知我们有99%以上的把握认为“爱好该项运动与性别
^= a
^ y -b x .
n
^ ^ Q= yi-b xi-a 2 的最小值而得到回归直线的方 3.通过求
i= 1
法,即求回归直线,使得样本数据的点到它的距离的平 方和最小,这一方法叫做最小二乘法.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
自测自评 1.两个变量之间关系如下, x y 2 3 4 4 6 8
回归直线一定经过点(
C )
B.(4,4)
D.(5,5)
A.(3,3)
C.(4,5)
2.一位母亲记录了儿子3~9岁的身高,数据(略), 由此建立的身高与年龄的回归模型为 ∧ y =7.19x+73.93, 用这个模型预测这个孩子10岁时的身高,则正确的叙述 是( C ) A.身高一定是145.83 cm B.身高在145.83 cm以上
解析:设线性回归方程为 ^ y=bx+a,而 a= y -b x , 即 a=t-bs,t=bs+a. ∴(s,t)在回归直线上. ∴直线 l1 和 l2 一定有公共点(s,t). 答案:A
例如:人的身高和体重的关系是相关关系还是函数 关系? 相关关系
4.最小二乘法:在求回归直线时,公式中选取 的 a,b 使得误差 yi-y i 的平方和 Q= (yi-bxi-a)2
i=1
∧
n
最小,也就是使得样本数据的点到它的距离的平方和最 小,这一方法称为最小二乘法.值得指出的是,讨论变 量是否线性相关,应先进行相关性检验,在确认线性相 关后,再求回归直线.相关性检验的有关概念、方法和 步骤,大纲不作考试要求. 5.回归直线:设 x 与 y 是具有相关关系的两个变量, 且相应于 n 组观测值的 n 个点(xi,yi)(i=1,2,…,n) 大致分布在一条直线附近,则由
^ b=
i=1
n
- - xi- x yi- y =
i=1
i=1
-- x y - n ii x y -2 2 xi -n x i=1
n
n
-2 xi- x
n
^ - ^- - 1 n - 1n a= y -b x , x = xi, y = yi ni=1 ni=1 ^ ^ ^ 所得到的直线方程y =bx+a叫做回归直线方程,b是 ^ 回归方程的斜率,a是截距,相应的直线叫做回归直线.由 回归直线方程算出的结果仅为预测,非必然结果.
变量之间的相关关系及两个变量的线性相关
全州三中高数组 文新红
1.会作两个有关联变量数据的散点图,会利用散
点图认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回 归方程系数公式建立线性回归方程.
基础梳理 1.相关系数:相关系数是描述两个变量关系程度和 方向的统计量,用r表示.相关系数的范围在-1到1之间, 即-1≤r≤1,当r=1为完全正相关即两者之间具有函数关系, r=-1,为完全负相关即两者之间具有函数关系,r=0为 不相关,r的范围在0.3~0.5是低度正相关;r的范围在 0.5~0.8是中度正相关;r的范围在0.8以上是高度正相关; 只有显著相关以上才需要考察相关方程.r的计算不作要 求. 2.散点图:表示具有相关关系的两个变量的一组数 据的图形叫做散点图.
2.如何利用散点图判断两个变量之间是否具备相 关关系? 解析:可根据散点图中对应点的离散程度来判断 两个变量是否具有相关关系.如果散点图中变量的对应 点分布在某条直线周围,我们就可以得出这两个变量具 有相关关系,如果点的分布大致在左下角到右上角的区 域,则为正相关,如果因变量随自变量的增大而减小, 则是负相关.如果变量的对应点分布没有规律,我们就 说这两个变量不具有相关关系.
年降雨 量(mn)
748
542
507
813
574
701
432
解析:以x轴为年平均气温,y轴为年降雨量,可得 相应的散点图如下图所示.
因为图中各点并不在一条直线的附近,所以两者不 具有相关关系,没必要用回归直线进行拟合,如果用公 式求得回归直线也是没有意义的.
跟踪训练 1.下列图形中,两个变量具有线性相关关系的 )
是(
解析:要求大致在一条直线上,但不是函数关系. 答案:B
了解回归直线方程的意义 为了考查两个变量x和y之间的线性关系,甲、 乙两位同学各自独立做了10次和15次试验,并且利用线性 回归的方法,求得回归直线分别为l1,l2,已知两人得到的 试验数据中,变量x和y的数据的平均值都相等,且分别是s, t,那么下列说法正确的是( ) A.直线l1和l2一定有公共点(s,t) B.直线l1和l2相交,但交点不一定是(s,t) C.必有直线l1∥l2 D.l1和l2必定重合
C.身高在145.83 cm左右
D.身高在145.83 cm以下
相关关系 的两个变量进行统计分析的方 3.对具有__________ 法叫回归分析.
4.表示具有相关关系的两个变量的一组数据的图形点图判断两个变量之间的线性相关关系 下表是某地的年降雨量与年平均气温,判断两 者是相关关系吗?求回归直线方程有意义吗? 年平均 12.51 12.84 12.84 13.69 13.33 12.74 13.05 气温(℃)
∧
思考应用 1.变量之间的相关关系与函数关系有何区别? 解析:变量间的相互关系有两种,一种是函数关系, 变量之间的对应是确定的;另一种是变量间确实存在着 关系,但又不具备函数关系所要求的确定性,它们的关 系带有随机性.相关关系分为两种:(1)正相关:两个变 量具有相同的变化趋势.(2)负相关:两个变量具有相反 的变化趋势.
3.如何认识线性回归模型?
解析:两个变量之间的相关性可以用一条直线或曲 线来进行拟合.如果两个变量之间的依赖关系是近似一 条直线,那么这两个变量就是线性相关的;如果两个变 量之间的依赖关系是近似一条曲线,那么这两个变量就 是非线性相关的;如果两个变量之间不存在明显的依赖 关系,那么这两个变量就是不相关的.
例如:某产品产量与生产费用关系如表,画出相应 的散点图. 序号 1 2 2 3 3.1 4 3.8 5 5 6 6.1 7 7.2 8 8 产品产量 1.2 (千吨)x 生产费用 (万元)y
62
86
80
110
115
132
135
160
解析:相应的散点图如下
3.线性相关:当一个变量变动时,另一个变量也 相应发生大致均等的变动,两者之间叫做线性相关.相 关关系与函数关系的相同点均是指两个变量的关系;不 同点是:函数关系是一种确定的关系,而相关关系是一 种非确定关系.