高三数学每日一题试题及答案127.变量间的相关关系
高中数学:必修第二册第九章-统计教学教案:变量间的相关关系(习题含答案)

高中数学:第二册第九章:变量间的相关关系一、基础知识梳理1.变量之间的相关关系当自变量取值一定时,因变量的取值带有一定的_________,则这两个变量之间的关系叫相关关系.由于相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断. 注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系. 2.散点图将样本中的n 个数据点(,)(1,2,,)i i x y i n =⋅⋅⋅描在平面直角坐标系中,所得图形叫做散点图.根据散点图中点的分布可以直观地判断两个变量之间的关系.(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为_________,如图(1)所示;(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它称为_________,如图(2)所示.3.两个变量的线性相关(1)如果散点图中点的分布从整体上看大致在_________附近,我们就称这两个变量之间具有_________,这条直线叫做回归直线.回归直线对应的方程叫做回归直线方程(简称回归方程).(2)设已经得到两个具有线性相关关系的变量的一组数据1122(,),(,),,(,)n n x y x y x y ⋅⋅⋅,直线方程y bx a =+,其中,a b 是待定参数.经数学上的推导,,a b 的值由下列公式给出:1122211()()()nni i i ii i nni i i i x x y y x y nx yb x x x nxa y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑.其中,回归直线的斜率为b ,截距为a ,即回归方程为y bx a =+.上述求回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做_________. (3)利用回归方程,我们可以进行预测并对总体进行估计. 4.相关关系的强与弱若相应于变量x 的取值i x ,变量y 的观测值为(1)i y i n ≤≤,则变量x与y 的相关系数()()niix x y y r --=∑,即ni ix y nx yr -=∑,通常用r 来衡量x 与y 之间的线性关系的强弱.r 的范围为11r -≤≤,r 为正时,x 与y 正相关;r 为负时,x 与y 负相关.||r 越接近于1,x 与y 的相关程度越大;||r 越接近于0,二者的相关程度越小.当||1r =时,所以数据点都在一条直线上.习题参考答案: 1.随机性2.(1)正相关 (2)负相关3.(1)一条直线 线性相关关系 (2)最小二乘法二、重点知识梳理b 的公式或混淆b 的位置1.回归方程的求解(1)求回归方程的步骤:列表→计算相关量的值→代入公式计算a ,b 的值→写出回归方程. (2)回归直线一定经过样本点的中心.【例1】假设关于某设备的使用年限x (年)和所支出的年平均维修费用y (万元)(即维修费用之和除以使用年限),有如下的统计资料:使用年限x 2 3 4 5 6 维修费用y2.23.85.56.57.0(1)画出散点图;(2)从散点图中发现使用年限与所支出的年平均维修费用之间关系的一般规律; (3)求回归方程;(4)估计使用年限为10年时所支出的年平均维修费用是多少? 【答案】答案详见解析.【解析】(1)画出散点图如图所示:(2)由上图可知,各点散布在从左下角到右上角的区域里,因此,使用年限与所支出的年平均维修费用之间成正相关,即使用年限越长,所支出的年平均维修费用越多.(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,两变量呈线性相关关系. 由题表数据可得552114,5,112.3,90i ii i i x y x yx ======∑∑,由公式可得2112.3545 1.23,5 1.ˆ2340.089054ˆba y bx -⨯⨯===-=-⨯=-⨯, 即回归方程是 1.230.08y x =+.(4)由(3)知,当10x =时, 1.23100.0812.38y =⨯+=. 故估计使用年限为10年时所支出的年平均维修费用是12.38万元.2.回归直线的理解及其应用在回归方程y bx a =+中,b 是回归直线的斜率,它代表x 每增加一个单位,y 的平均增加单位数,而不是增加单位数.对于具有线性相关关系的两个变量,在求出回归方程后,就可以对总体的数据进行估计或者由已知数据的趋势去预测未知数据的值.【例2】根据如下样本数据得到的回归方程为y bx a =+,若 5.4a =,则x 每增加1个单位,y 就A .增加0.9个单位B .减少0.9个单位C .增加1个单位D .减少1个单位【答案】B【解析】(5,0.9)在回归直线上,∴0.95 5.4b =+,解得0.9b =-,故回归方程为0.9 5.4y x =-+,则x 每增加1个单位,y 就减少0.9个单位,故选B .【例3】中国柳州从2011年起每年国庆期间都举办一届国际水上狂欢节,到2016年已举办了六届,旅游部门统计在每届水上狂欢节期间,吸引了不少外地游客到柳州,这将极大地推进柳州的旅游业的发展,现将前五届水上狂欢节期间外地游客到柳州的人数统计如下表:(1)求y 关于x 的线性回归方程y bx a =+;(2)旅游部门统计在每届水上狂欢节期间,每位外地游客可为本市增加100元左右的旅游收入,利用(1)中的线性回归方程,预测2017年第7届柳州国际水上狂欢节期间外地游客可为本市增加的旅游收入达多少?参考公式:121()()()niii nii x x y y b x x ==--=-∑∑,a y bx =-.3.弄错回归方程中a ,b 的位置【例4】某班5名学生的数学和物理成绩如下表:(1)画出散点图.(2)求物理成绩y 对数学成绩x 的线性回归方程. 【答案】答案详见解析. 【错解】(1)散点图如图所示:(2)计算得1(8876736663)73.25x =⨯++++=,1(7865716461)67.85y =⨯++++=, 518878766573716664636125054i ii x y=⨯+⨯+⨯+⨯+⨯==∑,52222221887673666327174ii x==++++=∑,所以5152221525054573.267.80.6ˆ2527174573.25i ii i i x y x ybx x==--⨯⨯==≈-⨯-∑∑,67.80.625ˆˆ73.222.05a y bx =-=-⨯=. 所以y 对x 的线性回归方程是22.0502ˆ.65yx =+. 【错因分析】错解中回归方程记忆错误,应为y bx a =+. 【正解】(1)散点图如图所示:(2)计算得1(8876736663)73.25x =⨯++++=, 1(7865716461)67.85y =⨯++++=,518878766573716664636125054i ii x y=⨯+⨯+⨯+⨯+⨯==∑,52222221887673666327174i i x ==++++=∑, 所以5152221525054573.267.80.6ˆ2527174573.25i ii i i x yxybx x==--⨯⨯==≈-⨯-∑∑,67.80.625ˆˆ73.222.05a y bx =-=-⨯=. 所以y 对x 的线性回归方程是0.62520ˆ 2.5yx =+.三、习题强化训练1.下列两个变量之间的关系不具有线性关系的是 A .小麦产量与施肥值 B .球的体积与表面积 C .蛋鸭产蛋个数与饲养天数D .甘蔗的含糖量与生长期的日照天数 2.下列命题正确的是①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究. A .①③④ B .②③④C .③④⑤D .②④⑤3.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图图2.由这两个散点图可以判断A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关4.下列变量是线性相关的是 A .人的体重与视力 B .圆心角的大小与所对的圆弧长 C .收入水平与购买能力D .人的年龄与体重5.已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为A .y ^=1.5x +2 B .y ^=-1.5x +2 C .y ^=1.5x -2D .y ^=-1.5x -26.下列关系中,属于相关关系的是________ ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系; ③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.7.若施肥量x (kg )与水稻产量y (kg )的线性回归方程为y ^=5x +250,当施肥量为80 kg 时,预计水稻产量约为________kg.8.正常情况下,年龄在18岁到38岁的人,体重y (kg )对身高x (cm )的回归方程为y ^=0.72x -58.2,张红同学(20岁)身高为178 cm ,她的体重应该在________ kg 左右.9.下表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对应数据:x 3 4 5 6 y2.5t44.5根据上表提供的数据,求出y 关于x 的线性回归方程y ^=0.7x +0.35,那么表中t 的值为________. 10.下列两个变量之间的关系是相关关系的是____________.①正方体的棱长和体积;②单位圆中圆心角的度数和所对弧长; ③单产为常数时,土地面积和总产量;④日照时间与水稻的亩产量.11.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是A .直线l 过点(x ,y )B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同12.设某大学的女生体重y (单位:kg )与身高x (单位:cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是 A .y 与x 具有正的线性相关关系 B .回归直线过样本的中心点(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 13.对有线性相关关系的两个变量建立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^A .不能小于0B .不能大于0C .不能等于0D .只能小于014.某考察团对全国10大城市职工人均工资x 与居民人均消费y 进行统计调查,y 与x 具有线性相关关系,线性回归方程ˆy=0.66x +1.562(单位:千元),若某城市居民消费水平为7.675,估计该城市消费额占人均工资收入的百分比约为____________.15.一项关于16艘轮船的研究中,船的吨位区间为[192,3 246](单位:吨),船员的人数5~32人,船员人数y 关于吨位x 的回归方程为y ^=9.5+0.006 2x , (1)若两艘船的吨位相差1 000,求船员平均相差的人数. (2)估计吨位最大的船和最小的船的船员人数.16.某工厂对某种产品的产量与成本的资料分析后有如下数据:(1)画出散点图;(2)求成本y 与产量x 之间的线性回归方程; (3)预计产量为8千件时的成本.17.某城市理论预测2014年到2018年人口总数y (单位:十万)与年份(用2014+x 表示)的关系如表所示:年份中的x 0 1 2 3 4 人口总数y5781119(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归方程y ∧=bx +a ; (3)据此估计2019年该城市人口总数.(参考数据:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30)参考公式:线性回归方程为y bx a =+,其中()()()1122211n ni i i i i i n n i i i i x x y y x y nxy b x x x nx====---==--∑∑∑∑.习题参考答案:6.【答案】②④ 7.【答案】650 8.【答案】69.96 9.【答案】310.【答案】④14.【答案】83%15.【答案】(1)船员平均相差6人;(2)吨位最大和最小的船的船员数分别为29人和10人. 16.【答案】(1)详见解析;(2)y ^=1.1x +4.6;(3)产量为8千件时,成本约为13.4万元. 17.【答案】(1)详见解析;(2)y =3.2x +3.6;(3)估计2019年该城市人口总数约为196万.。
高中数学变量之间的相关关系两个变量的线性相关统计总结练习有答案解析A

变量之间的相关关系、两个变量的线性相关一、变量间的相关关系1.相关关系的定义变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有①的,那么这两个变量之间的关系叫做相关关系.两个变量之间的关系分为②和③.2.散点图将样本中n个数据点(xi ,yi)(i=1,2,…,n)描在平面直角坐标系中得到的图形叫做散点图.3.正相关与负相关(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为④.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为⑤.二、两个变量的线性相关1.最小二乘法设x、Y的一组观察值为(xi ,yi),i=1,2,…,n,且回归直线方程为y^=a+bx.当x取值xi(i=1,2,…,n)时,Y的观察值为yi ,差yi-y^i(i=1,2,…,n)刻画了实际观察值yi与回归直线上相应点纵坐标之间的偏离程度,通常用离差的平方和,即Q=⑥作为总离差,并使之达到⑦.这样,回归直线就是所有直线中Q取最小值的那一条.由于平方又叫二乘方,所以这种使“⑧”的方法,叫做最小二乘法.2.回归直线方程回归直线方程回归系数a^方程或公式y^=⑨b^=⑩a^=上方加记号y^表示a、b上方加“^”表示是由“^”的意义判断下面结论是否正确(请在括号中打“√”或“×”)1.相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( )2.“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( )3.某同学研究卖出的热饮杯数y(杯)与气温x(℃)之间的关系,得到回归方程y^=-2.352x+147.767,则气温为2 ℃时,一定可卖出143杯热饮.( )一、判断两个变量的相关性1.(2015课标Ⅱ,3,5分,★☆☆)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关2.(2015黑龙江哈六中期末,★★☆)对变量x,y有观测数据(xi ,yi)(i=1,2,3,…,10),得散点图(1);对变量u,v有观测数据(ui ,vi)(i=1,2,3,…,10),得散点图(2),由这两个散点图可以判断( )A.y 与x 正相关,v 与u 正相关B.y 与x 正相关,v 与u 负相关C.y 与x 负相关,v 与u 正相关D.y 与x 负相关,v 与u 负相关思路点拨 直接根据散点图中“点”的分布情况进行判断.二、散点图的画法与应用3.(2015河北唐山一模,14,★☆☆)为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的数据,计算得回归直线方程为y ^=0.85x-0.25.由以上信息,可得表中c 的值为 .天数x34 5 6 7 繁殖数量y(千个) 2.5344.5c4.(2014吉林十中调研,★☆☆)如图所示的五组数据(x,y)中,去掉 后,剩下的四组数据相关性增强.三、利用线性回归方程的特点解题5.(2014重庆,3,5分,★☆☆)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( ) A.y ^=0.4x+2.3 B.y ^=2x-2.4 C.y ^=-2x+9.5 D.y ^=-0.3x+4.46.(2014山东潍坊月考,★★☆)为了均衡教育资源,加大对偏远地区的教育投入,调查了某地区若干户家庭的年收入x(单位:万元)和年教育支出y(单位:万元),调查显示年收入x 与年教育支出y 具有相关关系,并由调查数据得到y 对x 的回归直线方程为y ^=0.15x+0.2.由回归直线方程可知,家庭年收入每增加1万元,年教育支出平均增加 万元. 四、利用线性回归方程对总体进行估计7.(2015黑龙江哈六中期末,★★☆)已知某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i=1,2,…,n),用最小二乘法建立的回归方程为y ^=0.85x-85.71,则下列结论中不正确的是( ) A.y 与x 具有正的线性相关关系 B.回归直线过样本点的中心(x ,y )C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg8.(2015福建,4,5分,★★☆)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元) 8.2 8.6 10.0 11.3 11.9 支出y(万元) 6.2 7.5 8.0 8.5 9.8根据上表可得回归直线方程y ^=b ^x+a ^,其中b ^=0.76,a ^=y -b ^x . 据此估计,该社区一户年收入为15万元家庭的年支出为( ) A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元题组一 两个变量相关关系及回归直线方程问题1.设有一个回归方程为y ^=2-1.5x,则变量x 增加1个单位时,y 平均( ) A.增加1.5个单位 B.增加2个单位 C.减少1.5个单位 D.减少2个单位2.由三点(3,10),(7,20),(11,24)确定的线性回归方程为( ) A.y ^=1.75x-5.75B.y ^=1.75x+5.75C.y^=-1.75x+5.75D.y^=-1.75x-5.753.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )A.y^=-10x+200B.y^=10x+200C.y^=-10x-200D.y^=10x-2004.已知x与y之间的一组数据:x 0 1 2 3y 1 3 5 7若y与x线性相关,则y与x的回归直线y^=bx+a必过( )A.点(2,2)B.点(1.5,0)C.点(1,2)D.点(1.5,4)题组二回归分析及其应用5.某地区近10年居民的年收入x与年支出y之间的关系大致符合y^=0.8x+0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是亿元.6.某市居民2008~2012年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如下表所示:年份2008 2009 2010 2011 2012收入x 11.5 12.1 13 13.3 15支出y 6.8 8.8 9.8 10 12根据统计资料,居民家庭年平均收入的中位数是万元,家庭年平均收入与年平均支出有线性相关关系.7.某5名学生的总成绩和数学成绩如下表(单位:分):学生 A B C D E总成绩x 428 383 421 364 362数学成绩y 78 65 71 64 61(1)画出散点图;(2)求y对x的回归直线方程(结果保留到小数点后3位数字);(3)如果一个学生的总成绩为450分,试预测这个学生的数学成绩.8.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.x 3 4 5 6 y2.53 44.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y=b ^x+a ^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤.(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)模拟(时间:40分钟;分值:60分)一、选择题(每小题5分,共20分)1.(2016山东师大附中期末,★☆☆)已知某种产品的支出广告额x 与利润额y 之间有如下对应数据(单位:万元):x34567y 20 30 30 40 60若y 与x 线性相关,则y 与x 的回归直线必过( ) A.(5,36) B.(5,35) C.(5,30) D.(4,30)2.(2016辽宁大连模拟,★☆☆)已知x,y 的取值如下表所示:x2 3 4y 6 4 5如果y与x线性相关,且线性回归方程为y^=bx+132,则b=( )A.-12B.12C.-110D.1103.(2015黑龙江绥化三校联考,★★☆)下列图中的两个变量是相关关系的是( )A.①②B.①③C.②④D.②③4.(2015河北衡水调研,★★☆)两个相关变量满足下表:x 10 15 20 25 30y10031005101010111014则两变量的回归直线方程为( )A.y^=0.56x+997.4B.y^=0.63x-231.2C.y^=50.2x+501.4D.y^=60.4x+400.7二、填空题(每小题5分,共10分)5.(2016辽宁沈阳模拟,★☆☆)在一次试验中测得(x,y)的四组数据如下:x 16 17 18 19y 50 34 41 31根据上表可得回归方程为y^=-5x+a^,据此模型预报当x=20时,y的值为.6. (2015黑龙江双鸭山一中期末,★★☆)某工厂对某产品的产量与成本的资料分析后有如下数据:产量x(千件) 2 3 5 6成本y(万元) 789 12由表中数据得到的线性回归方程y ^=b ^x+a ^中b ^=1.1,预测当产量为9千件时,成本约为 万元.三、解答题(每小题15分,共30分)7.(2015重庆一中期末,★★☆)某地最近十年粮食需求量逐年上升,下表是部分统计数据:第x 年 1 2 3 4 5 需求量y(万吨)36 578(1)利用所给数据求两变量之间的回归直线方程y ^=b ^x+a ^;(2)利用(1)中所求出的回归直线方程预测该地第6年的粮食需求量.8.(2015黑龙江绥化三校联考,★★☆)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i=110x i =80,∑i=110y i =20,∑i=110x i y i =184,∑i=110x i 2=720.(1)求月储蓄y(千元)关于月收入x(千元)的线性回归方程; (2)若该居民区某家庭的月收入为7千元,预测该家庭的月储蓄. 附:回归直线的斜率和截距的最小二乘估计分别为: b ^=∑i=1nx i y i -nxy ∑i=1nx i 2-nx 2,a ^=y -b ^x .知识清单①随机性 ②函数关系 ③相关关系 ④正相关 ⑤负相关 ⑥∑i=1n(y i -a -bx i )2⑦最小 ⑧离差平方和为最小⑨a +bx ⑩∑i=1nx i y i -nxy∑i=1nx i 2-nx 2 ⑪y -b ^x ⑫回归直线上点的纵坐标观察值按最小二乘法求得的估计值1.✕2.√3.✕链接高考1.D 由柱形图可知:A 、B 、C 均正确,2006年以来我国二氧化硫年排放量在逐渐减少,所以排放量与年份负相关,∴D 不正确.2.C 根据散点图直接进行判断.3.答案 6 解析 x =3+4+5+6+75=5,y =2.5+3+4+4.5+c 5=14+c5,代入回归直线方程中得14+c 5=0.85×5-0.25,解得c=6.4.答案 (4,10)解析 去掉点(4,10)后,其余四点大致在一条直线附近,相关性增强.5.A 由变量x 与y 正相关知C 、D 均错,又回归直线经过样本点的中心(3,3.5),代入验证得A 正确,B 错误.故选A.6.答案 0.15解析 回归直线的斜率为0.15,所以家庭年收入每增加1万元,年教育支出平均增加0.15万元. 7.D8.B 由统计数据表可得x =8.2+8.6+10.0+11.3+11.95=10.0,y =6.2+7.5+8.0+8.5+9.85=8.0,则a ^=8.0-0.76×10.0=0.4,所以回归直线方程为y ^=0.76x+0.4,当x=15时,y ^=0.76×15+0.4=11.8,故估计年收入为15万元家庭的年支出为11.8万元.故选B.基础过关1.C 根据y ^=a ^+b ^x 中b ^的意义可知选C.2.B 设回归直线方程为y ^=b ^x+a ^,则 b ^=x 1y 1+x 2y 2+x 3y 3-3x yx 12+x 22+x 32-3x 2=3×10+7×20+11×24-3×7×189+49+121-3×49=1.75,a ^=y -b ^x =18-1.75×7=5.75. 故y ^=1.75x+5.75,故选B.3.A x 的系数为负数,表示负相关,排除B 、D,由实际意义可知x>0,y>0,C 中,散点图在第四象限无意义,故选A.4.D x =0+1+2+34=1.5,y =1+3+5+74=4.∴回归直线必过点(1.5,4).故选D. 5.答案 12.1解析 将x=15代入y ^=0.8x+0.1,得y ^=12.1. 6.答案 13;正解析 考查中位数的定义,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时需取中间两数的平均数.由统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.7.解析 (1)散点图如图所示:(2)由题中数据计算可得 x =391.6,y =67.8,∑i=15x i 2=770 654,∑i=15x i y i =133 548.代入公式得^b=133 548-5×391.6×67.8770 654-5×391.62≈0.204,^a=67.8-0.204×391.6≈-12.086,所以y 对x 的回归直线方程为^y=-12.086+0.204x.(3)由(2)得当总成绩为450分时,^y=-12.086+0.204×450≈80,即这个学生的数学成绩大约为80分. 8.解析 (1)由题设所给数据,可得散点图如图.(2)由对照数据,计算得∑i=14x i 2=86,x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5,已知∑i=14x i y i =66.5,所以,由最小二乘法确定的回归方程的系数为b ^=∑i=14x i y i -4x ·y ∑i=14x i2-4x 2=66.5-4×4.5×3.586-4×4.52=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y=0.7x+0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为90-(0.7×100+0.35)=19.65吨标准煤.模拟一、选择题1.A 因为x =15×(3+4+5+6+7)=5,y =15×(20+30+30+40+60)=36,故回归直线必过点(5,36),故选A.2.A ∵x =2+3+43=3,y =6+4+53=5,∴回归直线过点(3,5),∴5=3b+132,∴b=-12,故选A.3.D4.A 根据题意,得x =20,y =1 008.6,b ^=∑i=15(x i -x )(yi -y )∑i=15(x i -x )2=0.56,a ^=y -b ^x =997.4,∴回归直线方程为y ^=0.56x +997.4.故选A .二、填空题5.答案 26.5解析 x =16+17+18+194=17.5,y =50+34+41+314=39,∴回归直线过点(17.5,39),∴39=-5×17.5+a ^,∴a ^=126.5,∴x=20时,y=-5×20+126.5=26.5.6.答案 14.5解析 由表中数据得x =4,y =9,代入回归直线方程得a ^=4.6,∴当x=9时,y ^=1.1×9+4.6=14.5.三、解答题7.解析 (1)由所给数据得 x =3,y =5.8,b ^=∑i=15(x i -x )(y i -y )∑i=15(x i -x )2=1.1,a ^=y -b ^x =2.5,∴y ^=1.1x+2.5故所求的回归直线方程为y ^=1.1x+2.5.(2)第6年的粮食需求量约为y ^=1.1×6+2.5=9.1(万吨).8.解析 (1)由题意知n=10,x =1n ∑i=110x i =110×80=8, y =1n ∑i=110y i =110×20=2,又∑i=110x i 2-nx 2=720-10×82=80,∑i=110x i y i -nxy =184-10×8×2=24,由此得b ^=2480=0.3,a ^=y -b ^x =2-0.3×8=-0.4,故所求线性回归方程为y ^=0.3x-0.4.(2)将x=7代入回归方程,可以得到该家庭的月储蓄约为y ^=0.3×7-0.4=1.7(千元).。
高中数学 变量间的相关关系 练习题(含答案)

型号二手车时车辆的使用年数不得超过多少年?
参考公式:回归方程
中斜率和截距的最小二乘估计公式分别为:
,
,
. 【答案】(1) 万元;(2)11. 【解析】
(1)由题意,计算
,
, 12.某地级市共有 200000 中小学生,其中有 7%学生在 2017 年享受了“国家精准扶贫”政策,在享受“国家精 准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为 5:3:2,为进一
,后因某未知原因使第 5 组数据的 值模糊不清,此位置数据记为 (如下表所示),则利用回 归方程可求得实数 的值为( )
196
197
200
203
204
1
3
6
7
A. 8.3 B. 8.2 【答案】D 【解析】 由题意可得:
C. 8.1
D. 8
,
,
回归方程过样本中心点,则:
,解得: . 本题选择 D 选项. 学.科.网
(Ⅱ)(1)
(2)
(2)由(1)得:
令
当
时 取最大
时,收益 预报值最大.
16.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,
每小时生产有缺点零件的多少,随机器运转速度而变化,下表为抽样试验的结果:
转速 x(转/秒)
16
14
12
8
每小时生产有缺点的零件数 y(件)
严重污染(六级),指数大于 300 .某气象站观测点记录了某市五月 1 号—4 号连续 4 天里,AQI 指数 M 与
当天的空气水平可见度 (单位 cm)的情况如下表 1:
M
900
700
高中-数学-变量间关系及概率-知识点及练习

变量间的相关关系一、变量间的相关关系1.常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.2.从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.二、两个变量的线性相关1.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.2.回归方程为=x +,其中=∑i =1nx i y i -n x y ∑i =1nx 2i -n x 2,=y -x .3.通过求Q =∑i =1n(y i -bx i -a )2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.4.相关系数=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑i =1n(y i -y )2,当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.三、独立性检验1.2×2列联表:假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:K2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d)(其中n=a+b+c+d为样本容量).2.用K2的大小可以决定是否拒绝原来的统计假设H0,若K2值较大,就拒绝H0,即拒绝事件A与B无关.3.当K2>3.841时,则有95%的把握说事件A与B有关;当K2>6.635时,则有99%的把握说事件A与B有关;当K2>2.706时,则有90%的把握说事件A与B有关.注:使用K2统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5,在选取样本容量时一定要注意.实战训练1、已知变量x,y之间具有线性相关关系,其散点图如图所示,则其回归方程可能为()A.=1.5x+2B.=-1.5x+2C.=1.5x-2D.=-1.5x-2解析:设回归方程为=bx+a.由散点图可知变量x、y之间负相关,回归直线在y 轴上的截距为正数,所以b<0,a>0,因此其回归直线方程可能为=-1.5x+2. 故选B2、已知变量x ,y 之间具有线性相关关系,其回归方程为=-3+bx ,若∑i =110x i =17,∑i =110y i =4,则b 的值为( )A .2B .1C .-2D .-1解析:选A 依题意知,x =1710=1.7,y =410=0.4,而直线=-3+bx 一定经过点(x ,y ),所以-3+b ×1.7=0.4,解得b =2.3根据表中数据,得到如下结论中正确的一项是( )A .在此次调查中有95%的把握认为是否说谎与性别有关B .在此次调查中有99%的把握认为是否说谎与性别有关C .在此次调查中有99.5%的把握认为是否说谎与性别有关D .在此次调查中没有充分的证据显示说谎与性别有关解析:由于K 2=30×(6×9-7×8)213×17×14×16≈0.0024,由于K 2很小,因此,在此次调查中没有充分的证据显示说谎与性别有关.故选D.5.已知x ,y解析:x =3,y =2.5,∴样本点中心为(3,2.5),回归直线过样本点中心. 答案:(3,2.5)[例1]在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12D .1[思晨解答] 因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1. D2.(2012·长春模拟)已知x、y取值如下表:从所得的散点图分析可知:y与x线性相关,且=0.95x+a,则a=() A.1.30B.1.45C.1.65 D.1.80解析:依题意得,x=16×(0+1+4+5+6+8)=4,y=16×(1.3+1.8+5.6+6.1+7.4+9.3)=5.25;又直线=0.95x+a必过中心点(x,y),即点(4,5.25),于是有5.25=0.95×4+a,由此解得a=1.45. 故选B[例3]衡阳市第一次联考后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如下的2×2列联表,且已知在甲、乙两个文科班全部110人中随机抽取1人为优秀的概率为311.(1)请完成上面的列联表;(2)根据列表中的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”.参考公式与临界值表:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)[思晨解答](1)列联表如下:(2)根据列联表中的数据,得到K 2=110×(10×30-20×50)260×50×30×80≈7.486<10.828.因此按99.9%的可靠性要求,不能认为“成绩与班级有关系”.概率知识点一、随机事件的概率1、必然事件:一定会发生的事件叫做相对于条件S 的必然事件。
高中数学必修3概率统计常考题型:变量间的相关关系.doc

变量间的相关关系【知识梳理】1.相关关系如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的随机性,那么这两个变量之间的关系叫做相关关系.2.散点图将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,利用散点图,可以判断两个变量是否相关,相关时是正相关还是负相关.3.正相关和负相关(1)正相关:散点图中的点散布在从左下角到右上角的区域. (2)负相关:散点图中的点散布在从左上角到右下角的区域. 4.回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程:回归直线的方程,简称回归方程. (3)回归方程的推导过程:①假设已经得到两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ). ②设所求回归方程为y ^=b ^x +a ^,其中a ^,b ^是待定参数. ③由最小二乘法得⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2=∑i =1nx i y i-nx -y -∑i =1nx 2i-n x2a ^=y -b^x其中:b ^是回归方程的斜率,a ^是截距.【常考题型】题型一、相关关系的判断【例1】 (1)下列关系中,属于相关关系的是________ ①正方形的边长与面积之间的关系; ②农作物的产量与施肥量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.(2)某个男孩的年龄与身高的统计数据如下表所示.②判断y与x是否具有线性相关关系.[解析](1)在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在④中,降雪量与交通事故的发生率之间具有相关关系.[答案](1)②④(2)①散点图如图所示.②由图知,所有数据点接近一条直线排列,因此,认为y与x有线性相关关系.【类题通法】两个变量是否相关的两种判断方法(1)根据实际经验:借助积累的经验进行分析判断.(2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.【对点训练】如图所示的两个变量不具有相关关系的有________.解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x,y不具有相关关系.答案:①④题型二、求回归方程【例2】 某连锁经营公司所属5个零售店某月的销售额和利润额资料如下表:(1)(2)若销售额和利润额具有相关关系,计算利润额y 对销售额x 的回归直线方程. [解] (1)散点图如下:(2)数据如下表:可以求得b ^=0.5,a ^=0.4, 线性回归方程为y ^=0.5x +0.4. 【类题通法】求线性回归方程的步骤(1)计算平均数x ,y . (2)计算x i 与y i 的积,求1ni ii x y =∑.(3)计算21nii x=∑.(4)将结果代入公式b ^=1221ni ii nii x y n x yxnx ==-⋅⋅-∑∑,求b ^.(5)用a ^=y -b ^x ,求a ^. (6)写出回归方程. [变式训练]已知变量x ,y 有如下对应数据:(1)作出散点图;(2)用最小二乘法求关于x ,y 的回归直线方程. 解:(1)散点图如图所示.(2)x =1+2+3+44=52,y =1+3+4+54=134,41ii x=∑y i =1+6+12+20=39.41ii x=∑=1+4+9+16=30,b ^=39-4×52×13430-4×(52)2=1310,a ^=134-1310×52=0,所以y ^=1310x 为所求回归直线方程.题型三、利用线性回归方程对总体进行估计【例3】 一台机器由于使用时间较长,但还可以使用,它按不同的转速生产出来的某机器零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表是抽样试验结果:(1)如果(2)若实际生产中,允许每小时的产品中有缺点的零件数最多为10个,那么机器的转速应该控制在什么范围内?[解] (1)由题意,可得x =12.5,y =8.25,41ii x=∑y i =438,∑i =1nx 2i =660,则b ^=438-4×12.5×8.25660-4×12.52≈0.728 6,a ^=y -b ^x =-0.857 5. 所以回归直线的方程为y ^=0.728 6x -0.857 5. (2)要使y ≤10,则0.728 6x -0.857 5≤10,解得x ≤14.90.所以机器的转速应该控制在15转/秒以下. 【类题通法】回归分析的三个步骤(1)进行相关性检验,若两变量无线性相关关系,则所求的线性回归方程毫无意义. (2)求回归直线方程,其关键是正确地求得a ^,b ^. (3)根据直线方程进行预测. 【对点训练】假设关于某设备的使用年限x (年)和所支出的维修费用y (万元),有如下的统计资料:由资料可知y (1)求回归方程y ^=b ^x +a ^的回归系数a ^,b ^; (2)估计使用年限为10年时维修费用是多少. 解:(1)先把数据列成表.由表可知x yb ^=112.3-5×4×590-5×42=12.310=1.23,a ^=y -b ^x =5-1.23×4=0.08. (2)由(1)可知回归方程是y ^=1.23x +0.08,∴当x =10时,y ^=1.23×10+0.08=12.3+0.08=12.38(万元). 故估计使用年限为10年时,维修费用是12.38万元.【练习反馈】1.下列命题正确的是( ) ①任何两个变量都具有相关关系; ②圆的周长与该圆的半径具有相关关系;③某商品的需求量与该商品的价格是一种非确定性关系; ④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究.A .①③④B .②③④C .③④⑤D .②④⑤解析:选C ①显然不对,②是函数关系,③④⑤正确.2.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图图2.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关解析:选C 由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关.3.若施肥量x (kg)与水稻产量y (kg)的线性回归方程为y ^=5x +250,当施肥量为80 kg 时,预计水稻产量约为________kg.解析:把x =80 kg 代入回归方程可得其预测值y ^=5×80+250=650(kg). 答案:6504.对具有线性相关关系的变量x 和y ,测得一组数据如下表所示.________. 解析:由题意可知x =2+4+5+6+85=5,y =30+40+60+50+705=50.即样本中心为(5,50)设回归直线方程为y ^=6.5x +b ^, ∵回归直线过样本中心(x ,y ), ∴50=6.5×5+b ^,即b ^=17.5, ∴回归直线方程为y ^=6.5x +17.5 答案:y ^=6.5x +17.55.2013年元旦前夕,某市统计局统计了该市2012年10户家庭的年收入和年饮食支出的统计资料如下表:(2)若某家庭年收入为9万元,预测其年饮食支出. (参考数据:101i i i x y =∑=117.7,1021i i x =∑=406)解:依题意可计算得:x =6,y =1.83,x 2=36,x y =10.98, 又∵101i i i x y =∑=117.7,1021i i x =∑=406,∴b^=101102211010i i x yii xix yx--=-=--∑∑≈0.17,a^=y-b^x=0.81,∴y^=0.17x+0.81.∴所求的回归方程为y^=0.17x+0.81.(2)当x=9时,y^=0.17×9+0.81=2.34(万元).可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元.。
高三数学课时作业1.10.3变量间的相关关系含答案

一、选择题1.①正相关,②负相关,③不相关,则下列散点图分别反映的变量是( )A.①②③B.②③①C.②①③D.①③②解析:第一个散点图中,散点图中的点是从左下角区域分布到右上角区域,则是正相关;第三个散点图中,散点图中的点是从左上角分布到右下角区域,则是负相关;第二个散点图中,散点图中的点的分布没有什么规律,则是不相关,所以应该是①③②,故选D。
答案:D2.下列有关回归直线方程错误!=错误!x+错误!的叙述正确的是( )①反映错误!与x之间的函数关系;②反映y与x之间的函数关系;③表示错误!与x之间的不确定关系;④表示最接近y与x之间真实关系的一条直线.A.①②B.②③C.③④D.①④解析:y,^=错误!x+错误!表示错误!与x之间的函数关系,而不是y 与x之间的函数关系,但它反映的关系最接近y与x之间的真实关系.答案:D3.观测两相关变量得如下数据:x -9-6.99-5。
01-2.98-554.9994(2)观察散点图知,散点图中的点分布在一条直线附近,则水稻产量与施化肥量之间具有线性相关关系.11.某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份2002200420062008201需求量(万吨)236246257276286(1)利用所给数据求年需求量与年份之间的回归直线方程错误!=错误!x+错误!;(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.解析:(1)由所给数据看出,年需求量与年份之间的关系近似直线上升,下面来配回归直线方程.为此对数据预处理如下:年份-2006-4-2024需求量-257-21-1101929对预处理后的数据,容易算得x=0,错误!=3.2,错误!=错误!=错误!=6.5,a,^=错误!-错误!错误!=3。
2。
由上述计算结果,知所求回归直线方程为错误!-257=错误!(x-2006)+错误!=6。
5(x-2006)+3。
2,即错误!=6。
2021年3月新高考数学复习资料§11.5变量间的相关关系统计案例试题及参考答案
§11.5 变量间的相关关系、统计案例基础知识专题固本夯基【基础训练】考点一 变量间的相关关系1.已知x 与y 之间的一组数据如下表:x 1 2 3 4 y0.5 3.2 4.8 7.5若y 关于x 的线性回归方程为y ^=b ^x+a ^,,则a ^的值为( ) A.1.25 B.-1.25 C.1.65 D.-1.65 【参考答案】D2.已知某产品的销售额y(万元)与广告费用x(万元)之间的关系如下表:x(单位:万元) 0 1 2 3 4 y(单位:万元)1015203035若求得其线性回归方程为y ^=6.5x+a ^,则预计当广告费用为6万元时的销售额为( ) A.42万元 B.45万元 C.48万元 D.51万元 【参考答案】C3.下列说法错误的是( ) A.回归直线过样本点的中心(x ,y )B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近1C.在回归直线方程y ^=0.2x+0.8中,当解释变量x 每增加1个单位时,预报变量y ^平均增加0.2个单位 D.对于分类变量X 与Y,随机变量K 2的观测值k 越大,则判断“X 与Y 有关系”的把握程度越小【参考答案】D4.已知下表所示数据的回归直线方程为y ^=4x+242,则实数a = .x 2 3 4 5 6 y 251 254 257 a 266【参考答案】2625.某学校为倡导全体学生为特困学生捐款,举行“一元钱,一片心,诚信用水”活动,学生在购水处每领取一瓶矿泉水,便自觉向捐款箱中至少投入一元钱.现统计了连续5天的售出和收益情况,如下表:售出水量x(单位:箱) 7 6 6 5 6 收益y(单位:元)165142148125150(1)若x 与y 线性相关,则某天售出8箱水时,预计收益为多少元;(2)期中考试以后,学校决定将诚信用水的收益以奖学金的形式奖励给品学兼优的特困生,规定:特困生考入年级前200名,获一等奖学金500元;考入年级201~500名,获二等奖学金300元;考入年级501名以后的特困生将不获得奖学金.甲、乙两名学生获一等奖学金的概率均为25,获二等奖学金的概率均为13,不获得奖学金的概率均为415. ①在学生甲获得奖学金的条件下,求他获得一等奖学金的概率;②已知甲、乙两名学生获得哪个等级的奖学金是相互独立的,求甲、乙两名学生所获得奖学金总金额X(元)的分布列及数学期望. 附:b ^=∑i =1n(x i -x)(y i -y)∑i =1n (x i -x)2,a ^=y -b ^x .【试题解析】(1)∵x =7+6+6+5+65=6,y =165+142+148+125+1505=146, ∴b ^=∑i =1n(x i -x)(y i -y)∑i =1n(x i -x)2=19+0+0+21+01+0+0+1+0=20,则a ^=y -b ^x =146-20×6=26,∴y ^=20x+26,当x =8时,y ^=20×8+26=186, 故某天售出8箱水时,预计收益是186元.(2)①设事件A 为“学生甲获得奖学金”,事件B 为“学生甲获得一等奖学金”, 则P(B|A)=P(AB)P(A)=251115=611, 即在学生甲获得奖学金的条件下,他获得一等奖学金的概率为611. ②X 的可能取值(单位:元)为0,300,500,600,800,1 000, P(X =0)=415×415=16225,P(X =300)=C 21×13×415=845, P(X =500)=C 21×25×415=1675,P(X =600)=(13)2=19, P(X =800)=C 21×13×25=415,P(X =1 000)=(25)2=425. X 的分布列为X 0 3005006008001 000P16225845167519415425E(X)=0×16225+300×845+500×1675+600×19+800×415+1 000×425=600(元). 考点二 独立性检验6.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.非一线城市 一线城市总计 愿生 45 20 65 不愿生 13 22 35 总计58 42 100 附表:P(K 2≥k) 0.0500.010 0.001 k3.8416.63510.828由K 2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d)算得,K 2=100×(45×22-20×13)258×42×35×65≈9.616,参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C.有99%以上的把握认为“生育意愿与城市级别有关”D.有99%以上的把握认为“生育意愿与城市级别无关” 【参考答案】C7.假设有两个分类变量X 和Y 的2×2列联表:y 1 y 2 总计 x 1 a 10 a+10 x 2c 30 c+30 总计6040100对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为( )A.a=45,c=15B.a=40,c=20C.a=35,c=25D.a=30,c=30【参考答案】A8.为调查了解某省属师范大学师范类毕业生参加工作后从事的工作与教育是否有关的情况,随机调查了该校80位性别不都相同的2019年师范类毕业大学生,得到具体数据如下表:与教育有关与教育无关合计男301040女35540合计651580(1)能否在犯错误的概率不超过5%的前提下,认为“师范类毕业生从事与教育有关的工作与性别有关”?(2)求这80位师范类毕业生从事与教育有关工作的频率;(3)以(2)中的频率作为概率,从该校近几年毕业的2 000名师范类大学生中随机选取4名,记这4名毕业生从事与教育有关工作的人数为X,求X的数学期望E(X).参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(n=a+b+c+d).附表:P(K2≥k0)0.500.400.250.150.100.050.0250.010k00.4550.7081.3232.0722.7063.8415.024 6.635【试题解析】(1)根据题意得K2=80×(30×5-35×10)240×40×65×15≈2.051 3,因为K2<3.841,所以在犯错误的概率不超过5%的前提下,不能认为“师范类毕业生从事与教育有关的工作与性别有关”.(2)由题表知这80位师范类毕业生从事与教育有关工作的频率为6580=1316.(3)由题意知X~B(4,1316),得E(X)=4×1316=134.综合篇知能转换【综合集训】考法一线性回归分析的应用1.(2018广东七校期末联考,5)某单位为了了解用电量y(千瓦时)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下对照表:气温(℃)181310-1用电量(千瓦时)24343864由表中数据得回归直线方程y^=b^x+a^中的b^=-2,预测当气温为-4 ℃时,用电量为()A.68千瓦时B.67千瓦时C.65千瓦时D.64千瓦时【参考答案】A2.(2018湖南张家界三模,4)已知变量x,y之间的线性回归方程为y^=-0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法错误..的是()x681012y6m32A.变量x,y之间呈负相关关系B.可以预测,当x =20时,y ^=-3.7 C.m =4D.该回归直线必过点(9,4) 【参考答案】C3.(2019河南濮阳一模)根据下表中的数据,得到的回归方程为y ^=b ^x+9,则b ^=( )x 4 5 6 7 8 y54321A.2B.1C.0D.-1 【参考答案】D4.(2018广东化州二模,19)在“一带一路”的建设中,中石化集团获得了某地深海油田区块的开采权,集团在该地区随机初步勘探了几口井,取得了地质资料.进入全面勘探时期后,集团按网络点来布置井位进行全面勘探.由于勘探一口井的费用很高,如果新设计的井位与原有井位重合或接近,便利用旧井的地质资料,不必打这口新井,以节约勘探费用,勘探初期数据资料见下表:井号i 1 2 3 4 5 6 坐标(x,y)(km) (2,30) (4,40) (5,60) (6,50) (8,70)(1,y) 钻探深度(km) 2 4 5 6 8 10 出油量(L)407011090160205(1)在散点图中,1~6号旧井的位置大致分布在一条直线附近,借助前5组数据求得回归直线方程为y =6.5x+a,求a,并估计y 的预报值;(2)现准备勘探新井7(1,25),若通过1、3、5、7号井计算出的b ^,a ^的值(b ^,a ^精确到0.01)与(1)中b,a的值的差(即b ^-b b ,a ^-aa)不超过10%,则使用位置最接近的已有旧井6(1,y),否则在新位置打井,请判断可否使用旧井;参考公式和计算结果:b ^=∑i =1nx i y i -nx ·y∑i =1nx i 2-nx2,a^=y -b ^x ,∑i =14x 2i -12=94,∑i =14x 2i-1·y 2i-1=945(3)设出油量与钻探深度的比值k 不低于20的勘探井称为优质井,那么在原有6口井中任意勘探4口井,求勘探优质井数X 的分布列与数学期望.【试题解析】(1)利用前5组数据得到x =15×(2+4+5+6+8)=5,y =15×(30+40+60+50+70)=50,∵y =6.5x+a,∴a =50-6.5×5=17.5,∴回归直线方程为y =6.5x+17.5.当x =1时,y =6.5+17.5=24,∴y 的预报值为24. (2)利用1、3、5、7号井的数据得x =2+5+8+14=4,y =30+60+70+254=46.25, 又∑i =14x 2i -12=94,∑i =14x 2i-1y 2i-1=945,∴b ^=∑i =14x 2i -1y 2i -1-4x ·y∑i =14x 2i -12-4x 2=945-4×4×46.2594-4×42≈6.83,又∵a ^=y -b ^x ,∴a ^=46.25-6.83×4=18.93,又b=6.5,a =17.5,∴b ^-b b ≈5%,a ^-aa≈8%,均不超过10%,∴可使用位置最接近的已有旧井6(1,24).(3)由题意知,1、3、5、6这4口井是优质井,2,4这两口井是非优质井,∴勘探优质井数X 的可能取值为2,3,4, 由P(X =k)=C 4k C 24-kC 64(k =2,3,4),可得P(X =2)=25,P(X =3)=815,P(X =4)=115.∴X 的分布列为X 234P25815115E(X)=2×25+3×815+4×115=83. 考法二 独立性检验的应用5.(2018安徽黄山一模,3)在吸烟与患肺癌这两个分类变量的独立性检验的计算中,下列说法正确的是( )A.若K 2的观测值k =6.635,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患有肺癌B.由独立性检验可知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有99%的可能患有肺癌C.若从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误D.以上三种说法都不正确 【参考答案】C6.(2018山东实验中学上学期第二次诊断,11)某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不都相同的高中生是否爱好游泳运动得到如下2×2列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计60 50110由K 2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d)并参照附表,得到的正确结论是( )附表:P(K 2≥k)0.050 0.010 0.001 k3.841 6.635 10.828A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关” 【参考答案】A7.(2020届西南名校联盟高考适应性月考(一),19)为了实现文化脱贫,某高校鼓励即将毕业的大学生到西部偏远山区去支教,校学生就业部针对即将毕业的男女生是否愿意到西部支教进行问卷调查,得到的情况如下表所示:愿意去支教不愿意去支教 总计女生 20男生 40总计70100(1)完成上述列联表;(2)根据表中的数据,试通过计算,判断是否有95%的把握说明是否愿意去西部支教与性别有关;(3)若在接受调查的所有男生中按照“是否愿意去支教”进行分层抽样,随机抽取10人,再从10人中抽取3人进行面谈,记面谈的男生中,不愿意去支教的人数为ξ,求ξ的分布列及数学期望. 参考数据及公式如下:P(K 2≥k 0) 0.050 0.010 0.001 k 03.841 6.635 10.828K 2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),其中n =a+b+c+d.【试题解析】(1)所求列联表如下:愿意去支教不愿意去支教 总计女生 30 20 50 男生 40 10 50 总计7030100(2)因为K 2的观测值k 0=100×(30×10-40×20)250×50×30×70=10021≈4.762>3.841. 所以有95%的把握说明是否愿意去西部支教与性别有关.(3)由题意,抽取的10人中有8人愿意去西部支教,2人不愿意去西部支教,于是ξ=0,1,2. P(ξ=0)=C 20C 83C 103=715,P(ξ=1)=C 21C 82C 103=715,P(ξ=2)=C 22C 81C 103=115,∴ξ的分布列为ξ 012P715715115∴Eξ=0×715+1×715+2×115=35. 8.(2020届四川邻水实验学校第一次月考,20)通过随机询问某地100名高中学生在选择座位时是否挑同桌,得到如下2×2列联表:男生 女生 总计 挑同桌 30 40 70 不挑同桌 20 10 30 总计5050100(1)从这50名男生中按是否挑同桌采取分层抽样的方法抽取一个容量为5的样本,现从这5人中随机选取3人做深度采访,求这3名学生中至少有2名要挑同桌的概率;(2)根据以上2×2列联表,判断是否有95%以上的把握认为“性别与在选择座位时是否挑同桌”有关. 下面的临界值表供参考:P(K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001k 0 2.706 3.841 5.024 6.635 7.879 10.828(参考公式:K 2=n(ad-bc)2(a +b)(c +d)(a +c)(b +d),其中n =a +b +c +d)【试题解析】(1)根据分层抽样方法可知抽取容量为5的样本中,挑同桌的有3人,记为A 、B 、C,不挑同桌的有2人,记为d 、e;从这5人中随机选取3人,基本事件为ABC,ABd,ABe,ACd,ACe,Ade,BCd,BCe,Bde,Cde,共10种, 这3名学生中至少有2名要挑同桌的基本事件为ABC,ABd,ABe,ACd,ACe,BCd,BCe,共7种, 故所求的概率P =710. (2)根据2×2列联表,计算K 2=100×(30×10-20×40)270×30×50×50≈4.761 9>3.841,对照临界值表知,有95%以上的把握认为“性别与在选择座位时是否挑同桌”有关.思路分析 (1)根据分层抽样原理求出样本中挑同桌的有3人,不挑同桌的有2人,利用列举法求出基本事件数,从而求概率; (2)根据2×2列联表计算K 2,对照临界值表得出结论.【5年高考】考点一 变量间的相关关系1.(2017山东,5,5分)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为y ^=b ^x+a ^.已知∑i =110x i =225,∑i =110y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为( ) A.160 B.163 C.166 D.170 【参考答案】C2.(2015福建,4,5分)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元) 8.2 8.6 10.0 11.3 11.9 支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程y ^=b ^x+a ^,其中b ^=0.76,a ^=y -b ^x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A.11.4万元B.11.8万元C.12.0万元D.12.2万元 【参考答案】B3.(2018课标Ⅱ,18,12分)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^=-30.4+13.5t;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.【试题解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y ^=-30.4+13.5×19=226.1(亿元). 利用模型②,该地区2018年的环境基础设施投资额的预测值为y ^=99+17.5×9=256.5(亿元). (2)利用模型②得到的预测值更可靠. 理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y =-30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y ^=99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠. 以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.方法总结 利用直线方程进行预测是对总体的估计,此估计值不是准确值;利用回归方程进行预测(把自变量代入回归直线方程)是对因变量的估计,此时,需要注意自变量的取值范围.4.(2015课标Ⅰ,19,12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.x y w ∑i =18(x i-x )2∑i =18(w i-w )2∑i =18(x i-x )(y i-y )∑i =18(w i-w )(y i-y )46.6 563 6.8 289.8 1.6 1 469 108.8表中w i =√x ,w 18∑i =18w i.(1)根据散点图判断,y =a+bx 与y =c+d √x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x,y 的关系为z =0.2y-x.根据(2)的结果回答下列问题: (i)年宣传费x =49时,年销售量及年利润的预报值是多少? (ii)年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为 β^=∑i =1n(u i -u)(v i -v)∑i =1n (u i -u)2,α^=v -β^u .【试题解析】(1)由散点图可以判断,y =c+d √x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2分) (2)令w =√x ,先建立y 关于w 的线性回归方程.由于 d ^=∑i =18(w i -w)(y i -y)∑i =18(w i -w)2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w,因此y 关于x 的回归方程为y ^=100.6+68√x .(6分) (3)(i)由(2)知,当x =49时,年销售量y 的预报值 y ^=100.6+68√49=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32.(9分) (ii)根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68√x )-x =-x+13.6√x +20.12. 所以当√x =13.62=6.8, 即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.(12分)思路分析 (1)根据散点图中点的分布趋势进行判断.(2)先设中间量w =√x ,建立y 关于w 的线性回归方程,进而得y 关于x 的回归方程.(3)(i)将x =49代入回归方程求出y 的预报值,进而得z 的预报值,(ii)求出z 关于x 的回归方程,进而利用函数方法求最大值.考点二 独立性检验5.(2018课标Ⅲ,18,12分)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高,并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:超过m不超过m第一种生产方式 第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K 2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),P(K 2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828.【试题解析】(1)第二种生产方式的效率更高. 理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分. (2)由茎叶图知m =79+812=80. 列联表如下:超过m 不超过m 第一种生产方式 15 5 第二种生产方式515(3)由于 K 2=40×(15×15-5×5)220×20×20×20=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.思路分析 (1)根据茎叶图中的数据大致集中在哪个茎,作出判断; (2)通过茎叶图确定数据的中位数,按要求完成2×2列联表;(3)根据(2)中的列联表,将有关数据代入公式计算得K 2的值,查表作出统计推断.解后反思 独立性检验问题的常见类型及解题策略(1)已知分类变量的数据,判断两个分类变量的相关性,可依据数据及公式计算K 2,然后作出判断;(2)独立性检验与概率统计的综合问题,关键是根据独立性检验的一般步骤,作出判断,再根据概率统计的相关知识求解. 6.(2017课标Ⅱ,18,12分)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A 表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50 kg箱产量≥50 kg旧养殖法 新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附:P(K 2≥k)0.050 0.010 0.001 k3.841 6.635 10.828, K 2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d).【试题解析】(1)记B 表示事件“旧养殖法的箱产量低于50 kg ”,C 表示事件“新养殖法的箱产量不低于50 kg ”. 由题意知P(A)=P(BC)=P(B)P(C).旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62, 故P(B)的估计值为0.62.新养殖法的箱产量不低于50 kg 的频率为(0.068+0.046+0.010+0.008)×5=0.66,故P(C)的估计值为0.66. 因此,事件A 的概率估计值为0.62×0.66=0.409 2. (2)根据箱产量的频率分布直方图得列联表箱产量<50 kg箱产量≥50 kg旧养殖法 62 38 新养殖法3466K2=200×(62×66-34×38)2100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg 的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,箱产量低于55 kg 的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5,故新养殖法箱产量的中位数的估计值为50+0.5-0.340.068≈52.35(kg). 解后反思 解独立性检验问题的关注点:(1)两个明确:①明确两类主体;②明确研究的两个问题. (2)两个关键:①准确画出2×2列联表;②准确理解K 2.教师专用题组1.(2014湖北,4,5分)根据如下样本数据x 3 4 5 6 7 8 y4.02.5-0.50.5-2.0-3.0得到的回归方程为y ^=bx+a,则( ) A.a>0,b>0 B.a>0,b<0C.a<0,b>0D.a<0,b<0 【参考答案】B2.(2014重庆,3,5分)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x+2.3 B.y ^=2x-2.4 C.y ^=-2x+9.5 D.y ^=-0.3x+4.4 【参考答案】A3.(2014课标Ⅱ,19,12分,0.311)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年 份 2007 2008 2009 2010 2011 2012 2013 年份代号t12 3 4 5 6 7 人均纯收入y 2.93.33.64.44.85.25.9(1)求y 关于t 的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为: b ^=∑i =1n(t i -t)(y i -y)∑i =1n (t i -t)2,a ^=y -b ^t .【试题解析】(1)由所给数据计算得t =17×(1+2+3+4+5+6+7)=4,y =17×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑i =17(t i -t )2=9+4+1+0+1+4+9=28,∑i =17(t i -t )(y i -y )=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14, b ^=∑i =17(t i -t)(y i -y)∑i =17(t i -t)2=1428=0.5,a ^=y -b ^t =4.3-0.5×4=2.3,所求回归方程为y ^=0.5t+2.3. (2)由(1)知,b ^=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元. 将2015年的年份代号t =9代入(1)中的回归方程,得y ^=0.5×9+2.3=6.8, 故预测该地区2015年农村居民家庭人均纯收入为6.8千元. 易错警示 解题时容易出现计算错误,计算时一定要仔细.【三年模拟】一、单项选择题(每题5分,共15分)1.(2019湖南长沙雅礼中学月考(一),5)已知回归直线方程的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是( )A.y ^=1.23x+4 B.y ^=1.23x+0.8 C.y ^=1.23x+0.08 D.y ^=1.23x-0.08 【参考答案】C2.(2018辽宁丹东期末教学质量监测,7)某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联关表进行独立性检验,经计算K2=6.705,则所得到的统计学结论是:有的把握认为“学生性别与支持该活动没有..系”.()附:P(K2≥k)0.1000.0500.0250.0100.001k 2.706 3.841 5.024 6.63510.828A.99.9%B.99%C.1%D.0.1%【参考答案】C3.(2020届辽宁阜新高级中学10月月考,3)某饮料店某5天的日销售收入y(单位:百元)与当天平均气温x(单位:℃)之间的数据如下表:x-2-1012y54221若x与y之间是线性相关关系,且y关于x的线性回归方程是y^=-x+m,则实数m的值是()A.3B.2.8C.2.6D.2.4【参考答案】B二、多项选择题(每题5分,共10分)4.(改编题)下列说法中正确的是()A.在频率分布直方图中,中位数左边和右边的直方图的面积相等B.若A,B为互斥事件,则A的对立事件与B的对立事件一定互斥C.某个班级内有40名学生,抽10名学生去参加某项活动,则每4人中必有1人被抽中^=b^x+a^的斜率b^>0,则变量x与y正相关D.若回归直线y【参考答案】AD5.(改编题)如图是国家统计局发布的2018年3月到2019年3月全国居民消费价格的涨跌幅情况折线图(注:2019年3月与2018年3月相比较称为同比,2019年2月与2019年1月相比较称为环比),根据该折线图,下列结论正确的是()A.2018年3月至2019年3月全国居民消费价格同比均上涨B.2018年3月至2019年3月全国居民消费价格环比有涨有跌C.2019年3月全国居民消费价格同比涨幅最大D.2019年3月全国居民消费价格环比变化最大【参考答案】ABD三、填空题(共5分)6.(2018湖南师大附中月考(三),14)在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:感染未感染总计服用 10 40 50 未服用 20 30 50 总计3070100参照附表,在犯错误的概率不超过 (填百分比)的前提下,可认为“该种疫苗有预防埃博拉病毒感染的效果”. 参考公式:K 2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),其中n =a+b+c+d.附表:P(K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 0 2.706 3.841 5.024 6.635 7.879 10.828【参考答案】5%四、解答题(共70分)7.(2020届山东夏季高考模拟,20)下面给出了根据我国2012年—2018年水果人均占有量y(单位:kg)和年份代码x 绘制的散点图和线性回归方程的残差图(2012年—2018年的年份代码x 分别为1—7).(1)根据散点图分析y 与x 之间的相关关系;(2)根据散点图相应数据计算得∑i =17y i =1 074,∑i =17x i y i =4 517,求y 关于x 的线性回归方程;(精确到0.01)(3)根据线性回归方程的残差图,分析线性回归方程的拟合效果. 附:回归方程y ^=a ^+b ^x 中斜率和截距的最小二乘估计公式分别为:b ^=∑i =1n(x i -x)(y i -y)∑i =1n(x i -x)2,a ^=y -b ^x .【试题解析】(1)根据散点图可知y 与x 正线性相关. (2)由所给数据计算得 x =17×(1+2+…+7)=4, ∑i =17(x i -x )2=28,∑i =17(x i -x )(y i -y )=∑i =17x i y i -x ∑i =17y i =4 517-4×1 074=221,b ^=∑i =17(x i -x)(y i -y)∑i =17(x i -x)2=22128≈7.89.a ^=y -b ^x =1 0747-7.89×4≈121.87. 所以所求线性回归方程为y ^=7.89x+121.87.(3)由题中给出的残差图知历年数据的残差均在-2到2之间,说明线性回归方程的拟合效果较好.8.(2019湖南娄底二模,19)随着食品安全问题逐渐引起人们的重视,有机、健康的高端绿色蔬菜越来越受到消费者的欢迎,同时生产—运输—销售一体化的直销供应模式,不仅减少了成本,而且减去了蔬菜的二次污染等问题.(1)在有机蔬菜的种植过程中,有机肥料使用是必不可少的.根据统计,某种有机蔬菜的产量与有机肥料的用量有关系,每个有机蔬菜大棚产量的增加量y(百千克)与使用堆沤肥料x(千克)之间对应数据如表:使用堆沤肥料x(千克) 2 4 5 6 8 产量增加量y(百千克)34445依据表中的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x+a ^,并根据所求线性回归方程估计如果每个有机蔬菜大棚使用堆沤肥料10千克,则每个有机蔬菜大棚产量增加量y 是多少百千克;(2)某大棚蔬菜种植基地将采摘的有机蔬菜以每份三千克称重并保鲜分装,以每份10元的价格销售到生鲜超市.“乐购”生鲜超市以每份15元的价格卖给顾客,如果当天前8小时卖不完,则超市通过促销以每份5元的价格卖给顾客(根据经验,当天能够把剩余的有机蔬菜都低价处理完毕,且处理完毕后,当天不再进货).该生鲜超市统计了100天有机蔬菜在每天的前8小时内的销售量(单位:份),制成如下表格(注:x,y ∈N *,且x+y =30):每日前8个小时 销售量(单位:份)15 16 17 18 19 20 21 频数10x16 16 15 13y若以100天记录的频率作为每日前8小时销售量发生的概率,以该生鲜超市当天销售有机蔬菜利润的期望为决策依据,当购进17份比购进18份的利润的期望大时,求x 的取值范围. 附:回归方程系数公式b ^=∑i =1nx i y i -nxy∑i =1n x i 2-nx2,a ^=y ^-b ^x .【试题解析】(1)x =2+4+5+6+85=5,y =3+4+4+4+55=4, 计算得b ^=0.3,a ^=2.5,所以y 关于x 的线性回归方程为y ^=0.3x+2.5, 当x =10时,y ^=0.3×10+2.5=5.5,所以如果每个有机蔬菜大棚使用堆沤肥料10千克,估计每个有机蔬菜大棚产量的增加量是5.5百千克. (2)若该超市一天购进17份这种有机蔬菜,设Y 1表示当天的利润(单位:元),那么Y 1的分布列为Y 1 65 75 85P10100 x 100 90-x 100Y 1的数学期望E(Y 1)=65×10100+75×x 100+85×90-x 100=8 300-10x 100; 若该超市一天购进18份这种有机蔬菜,设Y 2表示当天的利润(单位:元),那么Y 2的分布列为Y 2 60 70 80 90P10100 x 100 16100 74-x100Y 2的数学期望E(Y 2)=60×10100+70×x 100+80×16100+90×74-x 100=8 540-20x 100, 又购进17份比购进18份的利润的期望大,故8 300-10x 100>8 540-20x100,解得x>24,故x 的取值范围是(24,30)且x ∈N *.。
(人教b版)数学必修三练习:2.3.1变量间的相关关系(含答案)
第二章 2.3 2.3.1一、选择题1.以下关于相关关系的说法正确的个数是()①相关关系是函数关系②函数关系是相关关系③线性相关关系是一次函数关系④相关关系有两种,分别是线性相关关系和非线性相关关系A.0B.1C.2D.3[答案] B[解析]根据相关关系的概念可知,只有④正确,故选B.2.下列关系属于线性负相关的是()A.父母的身高与子女身高的关系B.农作物产量与施肥量的关系C.吸烟与健康的关系D.数学成绩与物理成绩的关系[答案] C[解析]若以吸烟量为横轴,健康为纵轴画出散点图,则由生活常识知,这些点散布在从左上角到右下角的区域内. 因此,吸烟与健康的关系属于线性负相关.3.对于给定的两个变量的统计数据,下列说法正确的是()A.都可以分析出两个变量的关系B.都可以用一条直线近似地表示两者的关系C.都可以作出散点图D.都可以用确定的表达式表示两者的关系[答案] C[解析]给出一组样本数据,总可以作出相应散点图,但不一定分析出两个变量的关系,更不一定符合线性相关或有函数关系.4.下列两个变量之间的关系具有相关关系的是()A.家庭的支出与收入B.某家庭用电量与水价间的关系C.单位圆中角的度数与其所对孤长D.正方形的周长与其边长[答案] A[解析]C、D均为函数关系,B用电量与水价间不具有函数关系,也不具有相关关系故选A5.观察下列四个散点图,两变量具有线性相关关系的是()[答案] A[解析]选项A中的点大致分布在一条直线附近,故选A.6.有五组变量:①汽车的重量和汽车每消耗1 L汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸咽量和其身体健康情况;④立方体的边长和体积;⑤汽车的重量和行驶100 km的耗油量.其中两个变量成正相关的是()A.①③B.②④C.②⑤D.④⑤[答案] C[解析]②⑤中的两个变量成正相关.二、填空题7.有下列关系:①人的年龄与其拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一树木,其横截面直径与高度之间的关系;⑤学生与其学号之间的关系.其中具有相关关系的是________.[答案]①③④[解析]②⑤为确定性关系.8.据两个变量x、y之间的观测数据画成散点图如图,这两个变量是否具有线性相关关系(答是与否)__________.[答案]否[解析]如图中的点分布杂乱,两个变量不具有线性相关关系.三、解答题9.5名学生的数学和化学成绩见下表:[解析]散点图如图所示:由图可知,它们之间具有相关关系一、选择题1.如右图所示,有5组(x,y)数据,去掉哪一组数据之后,剩下的4组数据成线性相关关系()A.E B.DC.B D.A[答案] B[解析]去掉D组数据之后,剩下的4组数据成线性相关关系.2.图中的两个变量是相关关系的是()A.①②B.①③C.②④D.②③[答案] D[解析]相关关系所对应的图形是散点图,②③能反映两个变量的变化规律,它们是相关关系,故选D.二、解答题3.某老师为了了解学生的计算能力,对曲胜仁同学进行了10次测试,收集数据如下:相关?[解析]散点图分如图所示由散点图可见,该同学的做题时间与题数之间具有相关关系且是正相关.4.对某种珍稀动物胚胎的生长进行研究,测得9~20日龄动物的胚胎的质量如下:(1)(2)关于这两个变量的关系,你能得出什么结论?[解析](1)以动物胚胎的日龄为x轴,以胚重为y轴,作出散点图如图所示:(2)从图象观察,许多点在同一曲线附近,且可以看出随着时间的增加,胚重增长得越来越快,所以两变量具有相关关系.5.以下是某地搜集到的新房屋的销售价格和房屋的面积的数据:画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是负相关.[解析]散点图如下:由散点图知销售价格与房屋面积这两个变量是正相关的关系.。
2021高中数学 2.3变量间相关关系练习 新人教A版必修3 Word版含答案
2.3变量间相关关系(练)一、选择题1.对于给定的两个变量的统计数据,下列说法正确的是( ) A .都可以分析出两个变量的关系B .都可以用一条直线近似地表示两者的关系C .都可以作出散点图D .都可以用确定的表达式表示两者的关系 [答案] C[解析] 给出一组样本数据,总可以作出相应的散点图,但不愿定分析出两个变量的关系,更不愿定符合线性相关或有函数关系.2.在画两个变量的散点图时,下面叙述正确的是( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上 [答案] B3.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程y ^=bx +a ,那么下面说法不正确的是( )A .直线y ^=bx +a 必经过点(x -,y -)B .直线y ^=bx +a 至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点C .直线y ^=bx +a 的斜率为∑i =1nx i y i -n x - y-∑i =1nx 2i -n x -2D .直线y ^=bx +a 和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差∑i =1n[y i -(bx i +a )]2是该坐标平面上全部直线与这些点的偏差中最小的直线.[答案] B[解析] 由a =y -b x 知y ^=y -b x +bx ,∴必定过(x ,y )点.回归直线方程对应的直线是与样本数据距离最小的,但不愿定过原始数据点,只须和这些点很接近即可. 4.下列说法正确的是( )A .对于相关系数r 来说,|r |≤1,|r |越接近0,相关程度越大;|r |越接近1,相关程度越小B .对于相关系数r 来说,|r |≥1,|r |越接近1,相关程度越大;|r |越大,相关程度越小C .对于相关系数r 来说,|r |≤1,|r |越接近1,相关程度越大;|r |越接近0,相关程度越小D .对于相关系数r 来说,|r |≥1,|r |越接近1,相关程度越小;|r |越大,相关程度越大 [答案] C5.如图是具有相关关系的两个变量的一组数据的散点图和回归直线,去掉哪个点后,剩下的5个点数据的相关系数最大?( )A .DB .EC .FD .A [答案] C[解析] 第F 组数据距回归直线最远,所以去掉第F 组后剩下的相关系数最大. 6.以下关于线性回归的推断,正确的有________个.( )①若散点图中全部点都在一条直线四周,则这条直线为回归直线②散点图中的绝大多数点都线性相关,个别特殊点不影响线性回归,如图中的A ,B ,C 点. ③已知回归直线方程为y ^=0.50x -0.81,则x =25时,y 的估量值为11.69 ④回归直线方程的意义是它反映了样本整体的变化趋势 A .0个 B .1个 C .2个 D .3个[答案] D。
变量间的相关关系试题(含答案)4
一、选择题1、对于线性相关系数r,下列说法正确的是()A、)r,||r越大,相关程度越大;反之,相关程度越∈|+∞|,0(小B、)-∞r,r越大,相关程度越大;反之,相关程度越小∈,(+∞C、||r≤1,且||r越接近于1,相关程度越大;||r越接近于0,相关程度越小D、以上说法都不正确2、下列两变量具有相关关系的是()A 正方体的体积与边长B人的身高与体重C匀速行驶车辆的行驶距离与时间D球的半径与体积3、下列说法中不正确的是()A回归分析中,变量x和y都是普通变量B变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定C回归系数可能是正的也可能是负的D如果回归系数是负的,y的值随x的增大而减小4、线性回归方程ˆy =bx +a 必过( )A 、(0,0)点B 、(x ,0)点C 、(0,y )点D 、(x ,y)点5、若变量y 与x 之间的相关系数r=-0.9362,查表得到相关系数临界值r 0.05=0.8013,则变量y 与x 之间( )A 、不具有线性相关关系B 、具有线性相关关系C 、它们的线性关系还要进一步确定D 、不确定二、填空题6、有下列关系:① 人的年龄与他(她)拥有的财富之间的关系;② 曲线上的点与该点的坐标之间的关系;③ 苹果的产量与气候之间的关系;④ 森林中的同一种树木,其断面直径与高度之间的关系;⑤ 学生与他(她)的学号之间的关系、其中有相关关系的是 。
7、回归直线方式:a bx y+=ˆ∑==ni ix nx 11相应的直线叫回归直线,对两个变量所进行的上述统计分析叫线性回归分析。
8、 叫做变量y 与x 之间的相关系数。
9、相应于显著性水平0、05,观测值为10组的相关系数临界值为 。
10、对于回归方程25775.4ˆ+=x y,当x=28时,y 的估计值是 。
三、解答题11、某种合金的抗拉强度y(kg/m 2m )与其中的含碳量x(%)有关,今测得12对数据如下表所示:利用上述资料:作出抗拉强度y 关于含碳量x 的散点图; 建立y 关于x 的一元线性回归方程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
128变量间的相关关系
【典例】(2018高考新课标II 理)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1217,
,…,)建立模型①:ˆ30.413.5y t =-+;根据2010年至2016年的数据(时间变量t 的值依次为127,,
…,)建立模型②:ˆ9917.5y t =+. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由. 【练习】
1.已知下表所示数据的回归直线方程为y
,则实数a 的值为
x 2 3 4 5 6 y
3
7
11 a
21
A .16
B .18
C .20
D .22
2.为了研究某班学生的脚长(单位厘米)和身高(单位厘米)的关系,从该班随机抽取名学生,根据
测量数据的散点图可以看出与之间有线性相关关系,设其回归直线方程为
.已知
10
1
225i
i x
==∑,10
1
1600i i y ==∑,ˆ4b
=.该班某学生的脚长为,据此估计其身高为 A . B . C .
D .
【参考答案】(1)详见试题解析;(2)详见试题解析.
(2)利用模型②得到的预测值更可靠.
理由如下:
(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠.【解题必备】判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;(2)将相关数据代入相关系数r的公式求出r,然后根据r的大小进行判断.求线性回归方程时要严格按照公式求解,并一定要注意计算的准确性.学科&网
1.【答案】B
2.【答案】C
【解析】由已知,选C.
【名师点睛】(1)判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;
(2)将相关数据代入相关系数公式求出,然后根据的大小进行判断.求线性回归方程时在严格按照公式求解时,一定要注意计算的准确性.。