[K12学习]2019高考数学 考点突破——统计与统计案例:变量间的相关关系与统计案例学案
高考数学总复习专题讲座7_变量间的相关关系和统计案例

高考数学总复习专题讲座7_
变量间的相关关系和统计案例
今天为大家一起分享的是:变量间的相关关系、统计案例这方面的内容,其中也为大家分析了关于变量间的相关关系、统计案例在高考中高频率出现的考点分析,还有相关的练习题帮助理解巩固。
首先是基础知识总结:
1.变量间的相关关系
常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.
2.两个变量的线性相关
(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.
(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.
变量间的相关关系、统计案例高考重点归纳:
1.辨明四个易误点
(1)易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
(2)回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(,)点,可能所有的样本数据点都不在直线上.
(3)利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值).
(4)虽然任何一组不完全相同的数据都可以求出回归直线方程,但只有具有线性相关关系的一组数据才能得到有意义的回归直线方程,求出的方程才具有实际价值.
2.求回归方程的方法。
2019高三数学人教A版理一轮课件:第9章 第4节 变量间

4.调查了某地若干户家庭的年收入 x(单位:万元)和年饮食支出 y(单位:万 元),调查显示年收入 x 与年饮食支出 y 具有线性相关关系,并由调查数据得到 ^ 回归直线方程:y=0.254x+0.321,由回归直线方程可知,家庭年收入每增加 1 万元,年饮食支出平均约增加________万元.
0.254 [由题意知回归直线的斜率为 0.254, 故家庭年收入每增加 1 万元,年饮食支出平均约增加 0.254 万元.]
总计 a+c b+d a+b+c+d
nad-bc2 构造一个随机变量 K2=a+ba+cb+dc+d ,其中 n= a+b+c+d为样
本容量.
(3)独立性检验
2 K 利用随机变量 来判断“两个分类变量 有关系 ”的方法称为独立性检验.
^ [知识拓展] 1.b的几何意义:体现平均增加或平均减少. 2.由回归直线求出的数据是估算值,不是精确值.
[基本能力自测] 1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”) (1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关 系.( ) )
^ ^ ^ (2)通过回归直线方程y=bx+a可以估计预报变量的取值和变化趋势. (
(3)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进 行相关性检验.( ) )
4.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的 不同类别 称为分类变量. (2)列联表:列出两个分类变量的 频数表 ,称为列联表.假设有两个分类 变量 X 和 Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称 为 2×2 列联表)为 ,像这类变量
2×2 列联表 y1 x1 x2 a c y2 b d 总计 a+b c+d
2019届高考数学(文科新课标B)一轮复习课件:11.4 变量间的相关关系与统计案例+(共42张)

(2)(i)由于 x =9.97,s≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在( x -3s, x +3s)以外,因
此需对当天的生产过程进行检查. (ii)剔除离群值,即第13个数据,剩下数据的平均数为 ×(16×9.97-9.22)=10.02,
1 15
这条生产线当天生产的零件尺寸的均值的估计值为10.02.
^
b =
i 1 n i 1
n
( t i t )( y i y ) (ti t )
2
^
y - a = b t. ,
解析 (1)由折线图中数据和附注中参考数据得
t =4,
7
i 1
7
t )2=28, (ti-
7
i 1
7
( yi y )
7
2
y = ≈1.331及(1)得 (2)由 b=
7 9 .3 2
^
i 1 7 i 1
7
( t i t )( y i y ) (ti t )
2
= ≈0.10,
28
2 .8 9
y - a = b t =1.331-0.10×4≈0.93.
^ ^
所以y关于t的回归方程为 y =0.93+0.10t. (10分) 将2016年对应的t=9代入回归方程得: =0.93+0.10×9=1.83.
y
^
^
所以预测2016年我国生活垃圾无害化处理量将约为1.83亿吨.(12分) 思路分析 先根据折线图及参考数据求解相关系数r,再对相关系数r的意义进行阐述,然后根据
i 1 n i 1
n
( xi x )( y i y )
2019版高考数学(文)高分计划一轮高分讲义:第9章统计与统计案例 9.3 变量间的相关关系与统计案例 Word

9.3变量间的相关关系与统计案例[知识梳理]1.相关关系与回归方程(1)相关关系的分类①正相关:从散点图上看,点散布在从左下角到右上角的区域内,如图1;②负相关:从散点图上看,点散布在从左上角到右下角的区域内,如图2.(2)线性相关关系:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(3)回归方程①最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.②回归方程:两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为y ^=b ^x +a ^,则b ^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a ^=y -b ^x .其中,b ^是回归方程的斜率,a ^是在y轴上的截距,x -=1n ∑n i =1x i ,y -=1n ∑n i =1y i ,(x -,y -)称为样本点的中心.说明:回归直线y ^=b ^x +a ^必过样本点的中心(x -,y -),这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.(4)样本相关系数r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑i =1n(y i -y )2,用它来衡量两个变量间的线性相关关系.①当r >0时,表明两个变量正相关; ②当r <0时,表明两个变量负相关;③r 的绝对值越接近1,表明两个变量的线性相关性越强;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r |>0.75时,认为两个变量有很强的线性相关关系.2.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为2×2列联表构造一个随机变量K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b+c +d 为样本容量.(3)独立性检验利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验.[诊断自测] 1.概念思辨(1)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示.( )(2)通过回归方程y ^=b ^x +a ^可以估计和观测变量的取值和变化趋势.( )(3)事件X ,Y 关系越密切,则由观测数据计算得到的K 2的观测值越大.( )(4)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.( )答案 (1)√ (2)√ (3)√ (4)× 2.教材衍化(1)(必修A3P 94A 组T 3)某种产品的广告费用支出x (单位:万元)与销售额y (单位:万元)之间有如下的对应数据:由最小二乘法得到线性回归直线方程y =b x +a ,则此直线一定经过点( )A .(5,60)B .(5,50)C .(6,50)D .(8,70) 答案 B解析 回归直线样本点的中心为(x -,y -),而x -=15×(2+4+5+6+8)=5,y -=15×(30+40+60+50+70)=50,所以回归直线一定经过点(5,50).故选B.(2)(选修A1-2P 96T 2)通过随机询问72名不同性别的大学生在购买食物时是否看生产日期,得到如下列联表:答案 99.5%解析 由表中数据得k =72×(16×8-20×28)236×36×44×28≈8.416>7.879,所以可知有99.5%的把握认为性别与是否读生产日期有关.3.小题热身(1)设回归方程为y ^=3-5x ,则变量x 增加一个单位时 ( ) A .y 平均增加3个单位 B .y 平均减少5个单位 C .y 平均增加5个单位 D .y 平均减少3个单位 答案 B解析 因为-5是斜率的估计值,说明x 每增加一个单位,y 平均减少5个单位.故选B.(2)(2018·西安模拟)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y ^=0.67x +54.9. 6________.答案 68解析 由x -=30,得y -=0.67×30+54.9=75. 设表中的“模糊数字”为a ,则62+a +75+81+89=75×5,∴a =68.题型1 相关关系的判断典例1对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图①;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图②,由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关散点分布向右上升为正相关,反之为负相关.答案 C解析题图①的散点分布在斜率小于0的直线附近,y随x的增大而减小,故变量x与y负相关;题图②的散点分布在斜率大于0的直线附近,u随v的增大而增大,故变量u与v正相关,故选C.典例2甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:()A.甲B.乙C.丙D.丁考查r 的取值与1的关系.答案 D解析 在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A ,B 两个变量有更强的线性相关性,故选D.方法技巧判定两个变量正、负相关性的方法1.画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.见典例1.2.相关系数:r >0时,正相关;r <0时,负相关.3.线性回归直线方程中:b ^>0时,正相关;b ^<0时,负相关. 冲关针对训练下面是水稻产量与施化肥量的一组观测数据(单位:千克/亩):(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?解 (1)散点图如下:(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.题型2线性回归分析角度1线性回归方程及应用典例(2014·全国卷Ⅱ)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:(1)求y 关于t 的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^=∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2,a ^=y -b ^t .收集相关数据,代入公式.解 (1)由所给数据计算得t =17×(1+2+3+4+5+6+7)=4,y =17×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑i =17(t i -t )2=9+4+1+0+1+4+9=28,∑i =17(t i -t )(y i -y )=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b ^=∑i =17(t i -t )(y i -y )∑i =17(t i -t )2=1428=0.5,a ^=y -b ^t =4.3-0.5×4=2.3, 所求回归方程为y ^=0.5t +2.3.(2)由(1)知,b ^=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t =9代入(1)中的回归方程, 得y ^=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元. 角度2 非线性回归模型的应用典例(2015·全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =18∑8i =1w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程; (3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑ni =1 (u i -u )(v i -v )∑ni =1(u i -u )2,α^=v -β^ u . (1)散点图趋势是曲线,推断y =c +d x 适宜;(2)将非线性回归方程y =c +d x 用换元法w =x 转化为线性回归方程y =c +d w ,进而求解.解 (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑8i =1(w i -w )(y i -y )∑8i =1(w i -w )2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12. 所以当x =13.62=6.8,即x =46.24时,z ^取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大. 方法技巧1.利用线性回归方程时的关注点(1)正确理解计算b ^,a ^的公式和准确的计算是求线性回归方程的关键.(2)回归直线方程y ^=b ^x +a ^必过样本点中心(x -,y -).(3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.见角度1典例.2.非线性回归方程的求法(1)根据原始数据(x ,y )作出散点图. (2)根据散点图选择恰当的拟合函数.(3)作恰当的变换,将其转化成线性函数,求线性回归方程. (4)在(3)的基础上通过相应变换,即可得非线性回归方程.见角度2典例.冲关针对训练(2016·全国卷Ⅲ)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;(2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:∑7i =1y i =9.32,∑7i =1t i y i =40.17,∑7i =1(y i -y )2=0.55,7≈2.646.参考公式:相关系数r =∑ni =1 (t i -t )(y i -y )∑ni =1(t i -t )2∑ni =1(y i -y )2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:b ^=∑ni =1(t i -t )(y i -y )∑ni =1(t i -t )2,a ^=y -b ^ t . 解 (1)由折线图中数据和附注中参考数据得t =4,∑7i =1 (t i -t )2=28,∑7i =1 (y i -y )2=0.55,∑7i =1(t i -t )(y i -y )=∑7i =1t i y i -t ∑7i =1y i =40.17-4×9.32=2.89,r ≈ 2.890.55×2×2.646≈0.99. 因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b ^=∑7i =1 (t i -t )(y i -y )∑7i =1(t i -t )2=2.8928≈0.103,a ^=y -b ^t ≈1.331-0.103×4≈0.92.所以,y 关于t 的回归方程为y ^=0.92+0.10t .将2016年对应的t =9代入回归方程得 y ^=0.92+0.10×9=1.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨. 题型3 独立性检验典例(2018·广州测试)某企业生产的某种产品被检测出其中一项质量指标存在问题.该企业为了检查生产该产品的甲、乙两条流水线的生产情况,随机从这两条流水线上生产的大量产品中各抽取50件产品作为样本,测出它们的这一项质量指标值.若该项质量指标值落在(195,210]内,则为合格品,否则为不合格品.下表是甲流水线样本的频数分布表,下图是乙流水线样本的频率分布直方图.(1)根据上图,估计乙流水线产品的该项质量指标值的中位数; (2)若将频率视为概率,某个月内甲、乙两条流水线均生产了5000件产品,则甲、乙两条流水线分别生产出不合格品约多少件?(3)根据已知条件完成下面的2×2列联表,并回答能否有85%的把握认为“该企业生产的这种产品的该项质量指标值与甲、乙两条流水线的选择有关”?附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d ).解 (1)设乙流水线产品的该项质量指标值的中位数为x ,因为0.48=(0.012+0.032+0.052)×5<0.5<(0.012+0.032+0.052+0.076)×5=0.86,所以(0.012+0.032+0.052)×5+0.076×(x -205)=0.5, 解得x =390019.(2)由甲、乙两条流水线各抽取50件产品可得,甲流水线生产的不合格品有15件,则甲流水线生产的产品为不合格品的概率为1550=310,乙流水线生产的产品为不合格品的概率为(0.012+0.028)×5=15. 所以某个月内甲、乙两条流水线均生产了5000件产品,则甲、乙两条流水线生产的不合格品件数分别为5000×310=1500,5000×15=1000. (3)2×2列联表:则K 2=100×(350-600)250×50×75×25=43≈1.3,因为1.3<2.072,所以没有85%的把握认为“该企业生产的这种产品的该项质量指标值与甲、乙两条流水线的选择有关”.方法技巧独立性检验的一般步骤(1)根据样本数据列出2×2列联表;(2)计算随机变量K 2的观测值k ,查表确定临界值k 0;(3)如果k ≥k 0,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过P (K 2≥k 0);否则,就认为在犯错误的概率不超过P (K 2≥k 0)的前提下不能推断“X 与Y 有关系”.见典例.冲关针对训练(2017·洛阳模拟)某学生对其亲属30人的饮食习惯进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.)(1)根据以上数据完成下列2×2列联表.习惯与年龄有关?并写出简要分析.(3)能否说有99%的亲属的饮食习惯与年龄有关? 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .解 (1)2×2列联表如下:(2)因为K 2的观测值k =30×(8-128)212×18×20×10=10>6.635,所以能在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关.(3)这种说法不正确.能在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关,是这个论断成立的可能性大小的结论,与是否有“99%的亲属的饮食习惯与年龄有关”无关.1.(2017·山东高考)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系.设其回归直线方程为y ^=b ^x +a ^.已知∑i =110x i=225,∑i =110yi =1600,b ^=4.该班某学生的脚长为24,据此估计其身高为( )A .160B .163C .166D .170 答案 C解析 ∵∑i =110xi =225,∴x =110∑i =110x i=22.5.∵∑i =110y i =1600,∴y =110∑i =110y i=160.又b ^=4,∴a ^=y -b ^x =160-4×22.5=70. ∴回归直线方程为y ^=4x +70.将x =24代入上式得y ^=4×24+70=166. 故选C.2.(2015·福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元 答案 B解析 由统计数据表可得x -=8.2+8.6+10.0+11.3+11.95=10.0, y -=6.2+7.5+8.0+8.5+9.85=8.0,则a ^=8.0-0.76×10.0=0.4,所以回归直线方程为y ^=0.76x +0.4,当x =15时,y ^=0.76×15+0.4=11.8,故估计年收入为15万元家庭的年支出为11.8万元.故选B.3.(2018·江西南城一中、高安中学联考)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.由K 2=(a +b )(c +d )(a +c )(b +d ),得K 2=100×(45×22-20×13)265×35×58×42≈9.616.参照下表,A .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C .有99%以上的把握认为“生育意愿与城市级别有关”D .有99%以上的把握认为“生育意愿与城市级别无关” 答案 C解析 K 2≈9.616>6.635,∴有99%以上的把握认为“生育意愿与城市级别有关”,故选C.4.(2018·广东广州检测)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()A.成绩B.视力C.智商D.阅读量答案 D解析 K 2=52×(6×22-10×14)216×36×20×32,令5216×36×20×32=m , 则K 21=82m ,同理,K 22=m ×(4×20-12×16)2=1122m , K 23=m ×(8×24-8×12)2=962m ,K 24=m ×(14×30-6×2)2=4082m ,∴K 24>K 22>K 23>K 21,则与性别有关联的可能性最大的变量是阅读量,故选D.[重点保分 两级优选练]A 级一、选择题1.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^=-3.476x +5.648; ③y 与x 正相关且y ^=5.437x +8.493; ④y 与x 正相关且y ^=-4.326x -4.578. 其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④ D .①④ 答案 D解析 由回归直线方程y ^=b ^x +a ^,知当b ^>0时,y 与x 正相关;当b ^<0时,y 与x 负相关.∴①④一定错误.故选D.2.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )A .r 2<r 4<0<r 3<r 1B .r 4<r 2<0<r 1<r 3C .r 4<r 2<0<r 3<r 1D .r 2<r 4<0<r 1<r 3 答案 A解析 易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,则r 2<r 4<0<r 3<r 1.故选A.3.(2018·辽宁沈阳二中一模)某考察团对全国10大城市居民人均工资水平x (千元)与居民人均消费水平y (千元)进行统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为( )A .83%B .72%C .67%D .66% 答案 A解析 由7.675=0.66x +1.562,得x ≈9.262,所以7.6759.262×100%≈83%.故选A.4.下表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对应数据:根据上表提供的数据,求出y 关于x 的线性回归方程为y ^=0.7x +0.35,那么表中t 的精确值为 ( )A .3B .3.15C .3.5D .4.5 答案 A解析 ∵x -=3+4+5+64=4.5,代入y ^=0.7x +0.35,得y ^=3.5,∴t =3.5×4-(2.5+4+4.5)=3.故选A.5.(2018·长春检测)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3B.y ^=2x -2.4 C.y ^=-2x +9.5 D.y ^=-0.3x +4.4 答案 A解析 由变量x 与y 正相关知C 、D 均错误,又回归直线经过样本点的中心(3,3.5),代入验证得A 正确,B 错误.故选A.6.(2018·湖南邵阳调研)假设有两个分类变量X 和Y 的2×2列联表如下:组为( )A .a =45,c =15B .a =40,c =20C .a =35,c =25D .a =30,c =30 答案 A解析 根据2×2列联表与独立性检验可知, 当aa +10与c c +30相差越大时,X 与Y 有关系的可能性越大, 即a 、c 相差越大,aa +10与cc +30相差越大,故选A.7.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中数据,求得线性回归方程为y =-4x +a .若在这些样本点中任取一点,则它在回归直线左下方的概率为( )A.16B.13C.12D.23 答案 B解析 由题意可知x -=4+5+6+7+8+96=132, y -=90+84+83+80+75+686=80. 又点⎝ ⎛⎭⎪⎫132,80在直线y ^=-4x +a 上,故a =106.所以回归方程为y =-4x +106.由线性规划知识可知,点(5,84),(9,68)在直线y =-4x +106的左下方.故所求事件的概率P =26=13.故选B.8.(2018·安徽皖南一模)下列说法错误的是( ) A .回归直线过样本点的中心(x -,y -)B .两个随机变量的线性相关性越强,则相关系数的绝对值就越接近1C .在回归直线方程y ^=0.2x +0.8中,当解释变量x 每增加1个单位时,预报变量y ^平均增加0.2个单位D .对分类变量X 与Y ,随机变量K 2的观测值k 越大,则判断“X 与Y 有关系”的把握程度越小答案 D解析 回归直线过样本点的中心(x -,y -),A 正确;两个随机变量相关性越强,则相关系数的绝对值越接近1,B 正确;在线性回归方程y ^=0.2x +0.8中,当解释变量x 每增加1个单位时,预报量平均增加0.2个单位,C 正确;对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越大,“X 与Y 有关系”的把握程度越大,因此D 不正确.故选D.9.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为y ^=b ^x +a ^.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′ D.b ^<b ′,a ^<a ′ 答案 C解析 x =216=72,y =136,代入公式求得b ^=58-6×72×13691-6×⎝ ⎛⎭⎪⎫722=57,a ^=y -b ^x =136-57×72=-13,而b ′=2,a ′=-2,∴b ^<b ′,a ^>a ′,故选C.二、填空题10.x 和y 的散点图如图所示,则下列说法中所有正确命题的序号为________.①x ,y 是负相关关系;②在该相关关系中,若用y =c 1ec 2x 拟合时的相关指数为R 21,用y ^=b ^x +a ^拟合时的相关指数为R 22,则R 21>R 22;③x ,y 之间不能建立线性回归方程. 答案 ①②解析 在散点图中,点散布在从左上角到右下角的区域,因此x ,y 是负相关关系,故①正确;由散点图知用y =c 1ec 2x 拟合比用y ^=b ^x +a ^拟合效果要好,则R 21>R 22,故②正确;x ,y 之间可以建立线性回归方程,但拟合效果不好,故③错误.11.(2017·赣州模拟)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x 6,y 6)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,6)都在曲线y =bx 2-13附近波动.经计算∑6i =1x i =11,∑6i =1y i =13,∑6i =1x 2i =21,则实数b 的值为________.答案 57解析 令t =x 2,则曲线的回归方程变为线性的回归方程,即y=bt -13,此时t =∑6i =1x 2i6=72,y =∑6i =1y i6=136,代入y =bt -13,得136=b ×72-13,解得b =57.12.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K 2≈3.918,经查对临界值表知P (K 2≥3.841)≈0.05.对此,四名同学作出了以下的判断:p :有95%的把握认为“这种血清能起到预防感冒的作用”; q :若某人未使用该血清,则他在一年中有95%的可能性得感冒; r :这种血清预防感冒的有效率为95%;s:这种血清预防感冒的有效率为5%.则下列结论中,正确结论的序号是________.(把你认为正确的命题的序号都填上)①p∧(綈q);②(綈p)∧q;③(綈p∧綈q)∧(r∨s);④(p∨綈r)∧(綈q∨s).答案①④解析由题意,得K2≈3.918,P(K2≥3.841)≈0.05,所以,只有第一位同学的判断正确,即有95%的把握认为“这种血清能起到预防感冒的作用”.所以p真,q假,r假,s假.由真值表知①④为真命题.B级三、解答题13.(2018·湖南百所重点中学诊断)已知某企业近3年的前7个月的月利润(单位:百万元)如下面的折线图所示:(1)试问这3年的前7个月中哪个月的月平均利润较高?(2)通过计算判断这3年的前7个月的总利润的发展趋势;(3)试以第3年的前4个月的数据(如下表),用线性回归的拟合模式估计第3年8月份的利润.相关公式:b=a ^=y --b ^x -.解 (1)由折线图可知5月和6月的平均利润最高.(2)第1年前7个月的总利润为1+2+3+5+6+7+4=28(百万元),第2年前7个月的总利润为2+5+5+4+5+5+5=31(百万元), 第3年前7个月的总利润为4+4+6+6+7+6+8=41(百万元), 所以这3年的前7个月的总利润呈上升趋势.∴b ^=54-4×2.5×530-4×2.52=0.8,∴a ^=5-2.5×0.8=3, ∴y ^=0.8x +3,当x =8时,y ^=0.8×8+3=9.4.∴估计第3年8月份的利润为9.4百万元.14.(2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:旧养殖法新养殖法(1)记A 表示事件“旧养殖法的箱产量低于50 kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)旧养殖法的箱产量低于50 kg 的频率为 (0.012+0.014+0.024+0.034+0.040)×5=0.62. 因此,事件A 的概率估计值为0.62. (2)根据箱产量的频率分布直方图得列联表K 2的观测值k =200×(62×66-34×38)2100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关. (3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.。
2019高考数学一轮复习10.4变量间的相关关系、统计案例课件理新人教B

������
∑
(������������-������)2
������=1
=
������∑=1������������������������-������������ ������ ������∑=������1���������2��� -������������2
,
^^
������ = ������-������ ������.
) (4)事件X,Y关系越密切,则由观测数据计算得到的X2的值越大.(
)
(5)通过回归方程^������ = ^bx+^������可以估计和观测变量的取值和变化趋关闭
势(1).×( (2))√ (3)√ (4)√ (5)√
答案
-8-
知识梳理 考点自测
12345
2.已知变量 x 和 y 满足关系^������=-0.1x+1,变量^������与 z 正相关.下列结
线叫做 回归直线
.
-4-
知识梳理 考点自测
(2)回归方程^������ = ^bx+^������是两个具有线性相关关系的变量的一组
数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中^������ ,
^
������ 是待定系数.
������
������
^
������
=
������∑=1(������������-������)(������������-45
1.判断下列结论是否正确,正确的画“√”,错误的画“×”.
(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关 系.( )
(2)利用散点图可以直观判断两个变量的关系是否可以用线性关 系表示.( )
变量间的相关关系、统计案例易错点 2019高考绝密资料

变量间的相关关系、统计案例易错点主标题:变量间的相关关系、统计案例易错点副标题:从考点分析变量间的相关关系、统计案例易错点,为学生备考提供简洁有效的备考策略。
关键词:相关关系,线性回归方程,独立性检验,易错点难度:2重要程度:4内容:【易错点】1.对变量间的相关关系的认识(1)①A项:正方体的棱长与体积是相关关系.(×)②B项:日照时间与水稻的亩产量是相关关系.(√)(2)(教材思考问题改编)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.(×)(3)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表示.(√)2.对回归直线方程的理解(4)通过回归方程y^=b^x+a^可以估计和观测变量的取值和变化趋势.(√)(5)任何一组数据都对应着一个回归直线方程.(×)(6)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为y^=0.85x -85.71,判断下列命题的正误:①y与x具有正的线性相关关系.(√)②回归直线过样本点的中心(x,y).(√)③若该大学某女生身高增加1 cm,则其体重约增加0.85 kg.(√)④若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg. (×)3.对独立性检验的认识(7)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.(√)(8)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.(×)[剖析]1.“相关关系与函数关系”的区别函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.如(2).2.三点提醒一是回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.如(5).二是根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.如(6)中的④.三是独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.如(8).导数在研究函数中的应用主标题:导数在研究函数中的应用备考策略副标题:通过考点分析高考命题方向,把握高考规律,为学生备考复习打通快速通道。
高考数学复习考点知识讲解课件70 变量间的相关关系、统计案例
(其中n=a+b+c+d为样本
二、必明3个常用结论
1.求解回归方程的关键是确定回归系数 ,
ො ,应充分利用回归直
线过样本中心点(,
ҧ ).
ത
2.根据K2的值可以判断两个分类变量有关的可信程度,若K2 越大,
则两分类变量有关的把握越大.
3.根据回归方程计算的 值,仅是一个预报值,不是真实发生的
3.独立性检验
(1)2×2列联表:假设有两个分类变量X和Y,它们的取值分别为{x1,
x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
a+c
b+d
a+b+c+d
总计
(2)K2统计量
K2=
容量).
(−)2
(a+b)(c+d)(a+c)(b+d)
- 2n
- 2
(xi- x ) (yi- y )
n
i=1
i=1
反思感悟) 回归方程的拟合效果,可以利用相关系数判断,当|r|越
趋近于1时,两变量的线性相关性越强.
D.月收入的中位数是16,x与y有负线性相关关系
答案:C
15+17
解析:月收入的中位数是
=16,收入增加,支出增加,故x与y有正线性相
2
关关系.
3.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并
求得回归直线方程,分别得到以下四个结论:
①y与x负相关且=2.347x-6.423;
ො
②y与x负相关且=-3.476x+5.648;
心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫
2019届高考数学一轮复习第10单元算法初步、统计、统计案例第66讲变量间的相关关系、统计案例课件理
������ =1
∑ (������ ������ -t) ∑ (������ ������ -y)2
������ =1
为:b=������ =1 ������
∑ (������ ������ -t)(������ ������ -y)
������ =1
∑ (������ ������ -t)2
,a=y-bt.
教学参考
解:(1)记 B 表示事件“旧养殖法的箱产量低于 50 kg”,C 表示事件“新养殖法的箱产量不低于 50 kg”. 由题意知 P(A)=P(BC)=P(B)P(C). 旧养殖法的箱产量低于 50 kg 的频率为 (0.012+0.014+0.024+0.034+0.040)×5=0.62, 故 P(B)的估计值为 0.62. 新养殖法的箱产量不低于 50 kg 的频率为 (0.068+0.046+0.010+0.008)×5=0.66, 故 P(C)的估计值为 0.66. 因此,事件 A 的概率估计值为 0.62×0.66=0.409 2.
教学参考
(2)根据箱产量的频率分布直方图得列联表:
箱产量<50 kg 旧养殖法 新养殖法
2 200 × (62 × 66-34 × 38) 2 K= ≈15.705. 100× 100× 96× 104
箱产量≥50 kg 38 66
62 34
由于 15.705>6.635,故有 99%的把握认为箱产量与养殖方法有关. (3)因为新养殖法的箱产量频率分布直方图中,箱产量低于 50 kg 的直方图面积为 (0.004+0.020+0.044)×5=0.34<0.5, 箱产量低于 55 kg 的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5, 故新养殖法箱产量的中位数的估计值为
(全国通用版)2019版高考数学大一轮复习-第十章 统计与统计案例 第3节 变量的相关性课件 理 新
3.独立性检验 (1)2×2列联表
B B 合计
A n11 n12 n1+
A n21 n22 n2+
合计 n+1 n+2
n
其中n1+=n11+n12,n2+=n21+n22n,11n++n121 =____n_1_2_+__n_22,n+2=n11_+__n_21_+__n_1_2+__n_2,2 n=
规律方法 1.散点图中如果所有的样本点都落在某一函数的曲线附近,变量之间就 有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系. 若点散布在从左下角到右上角的区域,则正相关. 2.利用相关系数判定,当|r|越趋近于 1 相关性越强.当残差平方和越小,相关指数 R2 越大,相关性越强.若 r>0,则正相关;r<0 时,则负相关. 3.线性回归直线方程中:b^>0 时,正相关;b^<0 时,负相关.
[常用结论与微点提醒] 1.求解回归方程的关键是确定回归系数a^,b^,应充分利用回归直线过样本中心点( x ,
y ). 2.根据 χ2 的值可以判断两个分类变量有关的可信程度,若 χ2 越大,则两分类变量有
关的把握越大. 3.根据回归方程计算的^y值,仅是一个预报值,不是真实发生的值.
诊断自 1.思考辨析(在括号内打“√”或测“×”)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
K12学习教育资源 K12学习教育资源 变量间的相关关系与统计案例 【考点梳理】 1.回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是散点图;统计量有相关系数与相关指数. (1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系. 2.线性回归方程 (1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,
yn),其回归方程为y^=b^x+a^,则b^=∑n i=1 xi-xyi-y∑n i=1 xi-x2=∑n i=1xiyi-nx y∑n i=1x2i-nx2,a^=y
-b^x.其中,b^是回归方程的斜率,a^是在y轴上的截距. 3.残差分析 (1)残差:对于样本点(x1,y1),(x2,y2),…,(xn,yn),它们的随机误差为ei=yi-bxi-
a,i=1,2,…,n,其估计值为e^i=yi-y^i=yi-b^xi-a^,i=1,2,…,n,e^i称为相应于点(xi,
yi)的残差.
(2)相关指数:R2=1-∑n i=1 yi-y^i2∑n i=1 yi-y2. 4.独立性检验 (1)利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验. (2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)为 K12学习教育资源 K12学习教育资源 y1 y2 总计
x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d
则随机变量K2=nad-bc2a+ba+cb+dc+d(其中n=a+b+c+d为样本容量). 【考点突破】 考点一、相关关系的判断 【例1】(1)两个变量的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右分别反映的变量间的相关关系是( )
A.①②③ B.②③① C.②①③ D.①③② (2)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( ) A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关 (3)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )
A.r2K12学习教育资源
K12学习教育资源 C.r4
[答案] (1) D (2) C (3) A [解析] (1)第一个散点图中,散点图中的点是从左下角区域分布到右上角区域,则是正相关;第三个散点图中,散点图中的点是从左上角区域分布到右下角区域,则是负相关;第二个散点图中,散点图中的点的分布没有什么规律,则是不相关,所以应该是①③②.
(2)因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=b^y+a^,b^>0,则z=b^y+a^=-0.1b^x+b^+a^,故x与z负相关. (3)由相关系数的定义以及散点图所表达的含义可知r2【类题通法】 1.利用散点图判断两个变量是否有相关关系是比较直观简便的方法.如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关,若点散布在左上角到右下角的区域,则负相关. 2.利用相关系数判定,当|r|越趋近于1,相关性越强. 当残差平方和越小,相关指数R2越大,相关性越强. 【对点训练】 1.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.根据该图,下列结论中正确的是( )
A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20% B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20% C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20% D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20% [答案] B [解析] 因为散点图呈现上升趋势,故人体脂肪含量与年龄正相关;因为中间两个数据大K12学习教育资源 K12学习教育资源 约介于15%到20%之间,故脂肪含量的中位数小于20%.
2.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且y^=2.347x-6.423; ②y与x负相关且y^=-3.476x+5.648; ③y与x正相关且y^=5.437x+8.493; ④y与x正相关且y^=-4.326x-4.578. 其中一定不正确的结论的序号是( ) A.①② B.②③ C.③④ D.①④
[答案] D [解析] 正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故不正确的为①④. 3.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散
点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=12x+1上,则这组样本数据的样本相关系数为( ) A.-1 B.0 C.12 D.1 [答案] D [解析] 因为所有样本点都在直线y=12x+1上,所以这组样本数据完全正相关,故其相关系数为1. 考点二、线性回归方程及应用 【例2】某地随着经济的发展,居民收入逐年增长,下表是该地某银行连续五年的储蓄存款(年底余额),如下表1: 年份x 2013 2014 2015 2016 2017 储蓄存款y(千亿元) 5 6 7 8 10 表1 K12学习教育资源 K12学习教育资源 为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2 012,z=y-5得到下
表2: 时间代号t 1 2 3 4 5 z 0 1 2 3 5
表2 (1)求z关于t的线性回归方程; (2)通过(1)中的方程,求出y关于x的回归方程; (3)用所求回归方程预测到2020年年底,该地储蓄存款额可达多少?
(附:对于线性回归方程y^=b^x+a^,其中b^=i=1nxiyi-nx yi=1nx2i-nx2,a^=y-b^x)
[解析] (1)由已知,得t=3,z=2.2,i=15tizi=45,i=15t2i=55, b^=45-5×3×2.255-5×9=1.2,a^=z-b^t=2.2-1.2×3=-1.4,∴z^=1.2t-1.4.
(2)将t=x-2 012,z=y-5,代入z^=1.2t-1.4, 得y-5=1.2(x-2 012)-1.4,即y^=1.2x-2 410.8. (3)∵y^=1.2×2 020-2 410.8=13.2, ∴预测到2020年年底,该地储蓄存款额可达13.2千亿元. 【类题通法】 回归直线方程中系数的2种求法
(1)公式法:利用公式,求出回归系数b^,a^. (2)待定系数法:利用回归直线过样本点中心(x,y)求系数. 【对点训练】 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值. K12学习教育资源 K12学习教育资源 x y w i=18 (xi-x)2 i=18 (wi-w)2 i=1
8 (xi-x)(yi-
y) i=1
8 (wi-w)(yi-y)
46.6 563 6.8 289.8 1.6 1 469 108.8 表中wi=xi,w=18i=18wi. (1)根据散点图判断,y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程. (3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题: ①年宣传费x=49时,年销售量及年利润的预报值是多少? ②年宣传费x为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截
距的最小二乘估计分别为β^=i=1n ui-uvi-vi=1n ui-u2,α^=v-β^ u. [解析] (1)由散点图可以判断,y=c+dx适宜作为年销售量y关于年宣传费x的回归方程类型. (2)令w=x,先建立y关于w的线性回归方程.