2019版高考数学一轮复习第十章算法初步第66讲变量间的相关关系与统计案例课件201805072214
2019年高考数学一轮复习第十章算法初步统计统计案例课时达标67变量间的相关关系与统计案例理

2019年高考数学一轮复习第十章算法初步统计统计案例课时达标67变量间的相关关系与统计案例理[解密考纲]本节内容在高考中,三种题型均有考查,文字量比较大,但题目较容易. 一、选择题1.登山族为了了解某山高y (km)与气温x (℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:由表中数据,得到线性回归方程y =-2x +a (a ∈R ),由此请估计出山高72(km)处气温的度数为( D )A .-10B .-8C .-4D .-6解析:由题意可得:x =10,y =40, 所以a ^=y +2x =40+2×10=60.所以y ^=-2x +60,当y ^=72时,有-2x +60=72,解得x =-6,故选D .2.对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8)其回归直线方程是y ^=13x +a ^,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a ^的值是( B )A .116B .18C .14D .12 解析:依题意可知样本中心点为⎝ ⎛⎭⎪⎫34,38,则38=13×34+a ^,解得a ^=18,故选B . 3.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( D )A .-1B .0C .12D .1解析:由题设可知这组样本中的数据完全正相关,又都在y =12x +1上,故相关系数为1,故选D .4.(2017·辽宁大连双基测试)对于下列表格所示五个散点,已知求得的线性回归方程为y ^=0.8x -155,则实数m 的值为( A )A .8 C .8.4D .8.5解析:x =196+197+200+203+2045=200,y =1+3+6+7+m 5=17+m5,样本中心点为⎝ ⎛⎭⎪⎫200,17+m 5,将样本中心点⎝ ⎛⎭⎪⎫200,17+m 5代入y ^=0.8x -155, 可得m =8,故选A .5.如表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对应数据,根据表提供的数据,求出y 关于x 的线性回归方程为y ^=0.7x +0.35,则下列结论错误的是( B )A B .t 的取值必定是3.15 C .回归直线一定过(4.5,3.5)D .A 产品每多生产1吨,则相应的生产能耗约增加0.7吨 解析:由题意,x =3+4+5+64=4.5,因为y ^=0.7x +0.35,所以y =0.7×4.5+0.35=3.5,所以t =4×3.5-2.5-4-4.5=3,故选B .6.(2017·福建泉州模拟)已知某产品连续4个月的广告费x 1(千元)与销售额y 1(万元),经过对这些数据的处理,得到如下数据信息:①∑i =44x i =18,∑i =44y i =14;②广告费用x 和销售额y 之间具有较强的线性相关关系; ③回归直线方程为y ^=b ^x +a ^中的b ^=0.8(用最小二乘法求得). 那么广告费用为6千元时,可预测销售额约为( B ) A .3.5万元 B .4.7万元 C .4.9万元D .6.5万元解析:因为∑i =14x i =18,∑i =14y i =14,所以x =92,y =72,因为回归直线方程为y ^=b ^x +a ^中的b ^=0.8, 所以72=0.8×92+a ^,所以a ^=-110,所以y ^=0.8x -110.故x =6时,可预测销售额约为4.7万元,故选B . 二、填空题7.已知x ,y 的取值如下表:从散点图分析,y 与x 线性相关,且回归方程为y =1.46x +a ,则实数a ^的值为-0.61. 解析:x =2+3+4+54=3.5,y =2.2+3.8+5.5+6.54=4.5,回归方程必过样本的中心点(x ,y ).把(3.5,4.5)代入回归方程,计算得a ^=-0.61.8.高三某班学生每周用于物理学习的时间x (单位:小时)与物理成绩y (单位:分)之间有如下关系:13.5 (精确到0.1).解析:由已知可得x =24+15+23+19+16+11+20+16+17+1310=17.4,y =92+79+97+89+64+47+83+68+71+5910=74.9.设回归直线方程为y ^=3.53x +a ^, 则74.9=3.53×17.4+a ^解得a ^≈13.5. 9.以下四个命题:①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在回归直线方程y ^=0.2x +12中,当解释变量x 每增加一个单位时,预报变量y ^平均增加0.2单位;④对分类变量X 与Y ,它们的随机变量K 2的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越大.其中所有正确的是②③.(填序号)解析:①是系统抽样;对于④,随机变量K 2的观测值k 越小,说明两个变量有关系的把握程度越小.三、解答题10.下表是高三某位文科生连续5次月考的历史、政治的成绩,结果统计如下:月份 9 10 11 12 1 历史/x 分 79 81 83 85 87 政治/y 分7779798283(1)求该生5次月考历史成绩的平均分和政治成绩的方差;(2)一般来说,学生的历史成绩与政治成绩有较强的线性相关关系,根据上表提供的数据,求两个变量x ,y 的线性回归方程y ^=b ^x +a ^.⎝⎛⎭⎪⎪⎫附:b ^=∑i =1n x i -xy i -y∑i =1nx i -x2=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a ^=y -b ^x解析:(1)x =15×(79+81+83+85+87)=83,∵y =15(77+79+79+82+83)=80,∴s 2y =15[(77-80)2+(79-80)2+(79-80)2+(82-80)2+(83-80)2]=4.8.(2)∵∑i =15(x i -x )(y i -y )=30,∑i =15(x i -x )2=40,∴b ^=0.75,a ^=y -b ^x =17.75. 则所求的线性回归方程为y ^=0.75x +17.75.11.(2017·河北石家庄调研)某学校高中毕业班有男生900人,女生600人,学校为了对高三学生数学学习情况进行分析,从高三年级按照性别进行分层抽样,抽取200名学生成绩,统计数据如下表所示: 分数段/分 [50,70) [70,90) [90,110) [110,130)[130,150)总计 频数2040705020200学生人数;(2)如果样本数据中,有60名女生数学成绩及格,请完成如下数学成绩与性别的列联表,并判断是否有90%的把握认为“该校学生的数学成绩与性别有关”.女生 男生 总计 及格人数 60 不及格人数 总计参考公式:K 2=a +bc +d a +cb +d. P (K 2≥k 0)0.10 0.050 0.010 k2.7063.8416.635解析:(1)高三学生数学平均成绩为200(60×20+80×40+100×70+120×50+140×20)=101,估计高三学生数学平均成绩为101分,及格学生人数为70+50+20200×(900+600)=1050.(2)女生 男生 总计 及格人数 60 80 140 不及格人数 20 40 60 总计80120200K2的观测值k=200×60×40-20×80280×120×60×140=10063≈1.587<2.706,所以没有90%的把握认为“该校学生的数学成绩与性别有关”.12.一家商场为了确定营销策略,进行了四次投入促销费用x和商场实际销售额的试验,得到如下数据:投入促销费用x/万元235 6商场实际营销额y/万元100200300400(1)在下面的直角坐标中,画出上述数据的散点图,并据此判断两个变量是否具有较好的线性相关性;(2)求出x,y之间的回归直线方程y^=b^x+a^;(3)若该商场计划营销额不低于600万元,则至少要投入多少万元的促销费用?解析:(1)散点图,如图所示,从图上可以看出两个变量具有较好的线性相关性.(2)x=2+3+5+64=4,y-=100+200+300+4004=250,∑i=14(x i-x)2=(2-4)2+(3-4)2+(5-4)2+(6-4)2=4+1+1+4=10,∑i=14(x1-x)(y i-y-)=(-2)×(-150)+(-1)×(-50)+1×50+2×150=700.b^=∑i=14x i-x y i-y-∑i=14x i-x2=70010=70,a^=y--b^x=250-70×4=-30.故所求的回归直线方程为y ^=70x -30. (3)令70x -30≥600,即x ≥600+3070=9(万元). 即该商场计划营销额不低于600万元,则至少要投入9万元的促销费用.。
2019高考数学一轮复习10.4变量间的相关关系统计案例课件理新人教B版

(3)用X2的大小可以决定是否拒绝原来的统计假设H0,若X2值较大, 就拒绝H0,即拒绝事件A与B无关.
-7知识梳理 考点自测
1
2
3
4
5
1.判断下列结论是否正确,正确的画“√”,错误的画“×”. (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关 系.( ) (2)利用散点图可以直观判断两个变量的关系是否可以用线性关 系表示.( ) (3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( ) (4)事件X,Y关系越密切,则由观测数据计算得到的X2的值越大.( )
������
,
������ = ������- ������ ������ .
������ ������ =1
^
(3)通过求 Q= ∑ (yi-a-bxi)2 的最小值而得到回归直线的方法,即 使得样本数据的点到回归直线的距离的平方和最小的方法叫做最 小二乘法.
-5知识梳理 考点自测
(4)相关系数 r=
关闭 (5)通过回归方程������ = b x+������ 可以估计和观测变量的取值和变化趋 势 ( (2)√ ) (3)√ (4)√ (5)√ (1).×
^ ^ ^
答案
-8知识梳理 考点自测
1
2
3
4
5
2.已知变量 x 和 y 满足关系������ =-0.1x+1,变量������ 与 z 正相关.下列结 论中正确的是( ) A.x 与������ 负相关,x 与 z 负相关 B.x 与������ 正相关,x 与 z 正相关 C. 与 ������ x 负相关 与 z 负相关 由������=0x .1 x+ 1正相关 知y与 ,x ,又������与 z 正相关,故 z 与 x 负相关. D.x 与������ 负相关,x 与 z 正相关
高考数学一轮总复习第十章算法初步、统计与统计案例10.4变量间的相关关系统计案例课时训练理(202

2019年高考数学一轮总复习第十章算法初步、统计与统计案例10.4 变量间的相关关系统计案例课时跟踪检测理编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2019年高考数学一轮总复习第十章算法初步、统计与统计案例10.4 变量间的相关关系统计案例课时跟踪检测理)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2019年高考数学一轮总复习第十章算法初步、统计与统计案例10.4 变量间的相关关系统计案例课时跟踪检测理的全部内容。
10。
4 变量间的相关关系统计案例[课时跟踪检测][基础达标]1.(2017届南昌市第一次模拟)为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据(x1,y1),(x2,y2),(x3,y),(x4,y4),(x5,y5).根据收集到的数据可知x1+x2+x3+x4+x5=150,由3最小二乘法求得回归直线方程为错误!=0.67x+54.9,则y1+y2+y3+y4+y5的值为()A.75 B.115.4C.375 D.466.2解析:由x1+x2+x3+x4+x5=150,得x=30,代入回归直线方程错误!=0。
67x+54.9,得y=75,则y1+y2+y3+y4+y5=375.答案:C2.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且错误!=2.347x-6.423;②y与x负相关且错误!=-3.476x+5。
648;③y与x正相关且错误!=5。
437x+8.493;④y与x正相关且错误!=-4。
326x-4。
2019高考数学一轮复习第10章概率统计和统计案例第5讲变量间的相关关系与统计案例名师课件文科

概率、统计与统计案例
第5讲
变量间的相关关系与统计案例
1.变量间的相关关系 (1)常见的两变量之间的关系有两类:一类是函数关系,另一
相关关系 ;与函数关系不同,相关关系是一种非确定 类是__________
性关系. (2)从散点图上看,点分布在从左下角到右上角的区域内,两
正相关 ,点分布在左上角到右 个变量的这种相关关系称为________ 负相关 . 下角的区域内,两个变量的相关关系为________
正相关 ; 当 r>0 时,表明两个变量________ 负相关 . 当 r<0 时,表明两个变量________ 越强 . r 的绝对值越接近于 1, 表明两个变量的线性相关性______ r
的绝对值越接近于 0,表明两个变量之间几乎不存在线性相
0.75 时,认为两个变量有很强的 关关系,通常|r|大于__________
解析:选 A.四条回归直线,斜率最大的是省城,故选 A.
登山族为了了解某山高 y(百米)与气温 x(℃)之间的关系, 随机统计了 4 次山高与相应的气温,并制作了对照表. 气温(℃) 山高(百米) 18 24 13 34 10 38 -1 64
由表中数据, 得到线性回归方程^ y =-2x+^ a (^ a ∈R). 由此估计 山高为 72(百米)处气温的度数为( A.-10 C.-6 ) B.-8 D.-4
n(ad-bc)2 (a+b)(a+c)(b+d)(c+d)(其中 n=a+b+c+ K2=________________________________
d 为样本容量).
(必修 3 P101A 组 T8 改编)改革开放以来,我国教育事业发 展迅速,某省把近 10 年来农村、县城、地级市和省城每年考 入大学的百分比作为因变量,把年份 x 作为自变量得到四条 回归直线. 省城^ y =2. 84x+9. 50, 地级市^ y =2. 52x+8. 35, 县城^ y =2.31x+6.76,农村^ y =0.42x+1.80,则四个区 域中,大学入学率年增长率最快的区域是( A.省城 C.县城 B.地级市 D.农村 )
2019版高考数学一轮复习第十章算法初步第66讲变量间的相关关系与统计案例学案

2019版高考数学一轮复习第十章算法初步第66讲变量间的相关关系与统计案例学案考纲要求考情分析命题趋势1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解常见的统计方法,并能应用这些方法解决一些实际问题.4.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.5.了解回归分析的基本思想、方法及其简单应用.xx·全国卷Ⅰ,19xx·全国卷Ⅲ,18xx·全国卷Ⅱ,3xx·福建卷,41.散点图与相关关系、线性回归方程与独立性检验在实际生活中的应用.2.有关统计内容及方法主要以选择题、填空题的形式呈现,属容易题;抽样方法和各种统计图表与概率的有关内容相结合或与统计案例相结合也会出现在解答题中,属中档题.分值:5~12分1.相关关系与回归方程(1)相关关系的分类①正相关:从散点图上看,点散布在从__左下角__到__右上角__的区域内.②负相关:从散点图上看,点散布在从__左上角__到__右下角__的区域内.(2)线性相关关系从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫__回归直线__.(3)回归方程①最小二乘法:使得样本数据的点到回归直线的__距离的平方和__最小的方法叫最小二乘法.②回归方程:两个具有线性相关关系的变量的一组数据为(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y ^=b ^x +a ^,其中⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n (x i -x )2=∑i =1nx i y i-n x y ∑i =1nx 2i-n x2,a ^=y -b ^x ,其中(x ,y )称为样本点的中心.(4)样本相关系数r =∑i =1n(x i -x )(y i -y)∑i =1n(x i -x )2∑i =1n(y i -y)2,用它来衡量两个变量间的线性相关关系的强弱.①当r >0时,表明两个变量__正相关__; ②当r <0时,表明两个变量__负相关__;③r 的绝对值越接近1,表明两个变量的线性相关性__越强__;r 的绝对值越接近0,表明两个变量的线性相关性__越弱__,通常当||r >0.75时,认为两个变量有很强的线性相关关系.2.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量. (2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{}x 1,x 2和{}y 1,y 2,其样本频数列联表(称为2×2列联表)如下.K 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d )(其中n =__a +b +c +d __为样本容量),则利用独立性检验判断表来判断“X 与Y 的关系”.1.思维辨析(在括号内打“√”或打“×”).(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( × )(2)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表示.( √ )(3)通过回归方程y ^=b ^x +a ^可以估计和观测变量的取值和变化趋势.( √ ) (4)任何一组数据都对应着一个回归直线方程.( × )(5)事件X ,Y 关系越密切,则由观测数据计算得到的K 2的观测值越大.( √ ) 2.观察下列各图:其中两个变量x ,y 具有相关关系的图是( C ) A .①② B .①④ C .③④D .②③解析 由散点图知③④具有相关关系.3.已知x ,y 的取值如下表,从散点图可以看出y 与x 线性相关,且回归方程为y ^=0.95x +a ^,则a ^=( B )x 0 1 3 4 y2.24.34.86.7A .3.25 C .2.2D .0解析 由已知得x =2,y =4.5,因为回归方程经过点(x ,y ),所以a =4.5-0.95×2=2.6. 4.若回归直线方程为y ^=2-1.5x ^,则变量x 增加一个单位,y ( C ) A .平均增加1.5个单位 B .平均增加2个单位 C .平均减少1.5个单位D .平均减少2个单位解析 因为回归直线方程为 y ^=2-1.5x ,所以b ^=-1.5,则变量x 增加一个单位,y 平均减少1.5个单位.5.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是 ( C )A .若K 2的观测值为k =6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B .从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么他有99%的可能患有肺病C .若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D .以上三种说法都不正确解析 根据独立性检验的思想知C 项正确.一 相关关系的判断判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r >0时,正相关;r <0时,负相关.(3)线性回归方程中:b ^>0时,正相关;b ^<0时,负相关.(4)相关关系的直观判断方法就是作出散点图,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性,若呈图形区域且分布较乱则不具备相关性.【例1】 (1)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x 轴、y 轴的单位长度相同),用回归直线方程y ^=b ^x +a ^近似地刻画其相关关系,根据图形,以下结论最有可能成立的是( B )A .线性相关关系较强,b ^的值为1.25B .线性相关关系较强,b ^的值为0.83C .线性相关关系较强,b ^的值为-0.87 D .线性相关关系较弱,无研究价值(2)已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关,下列结论中正确的是( C ) A .x 与y 正相关,x 与z 负相关 B .x 与y 正相关,x 与z 正相关 C .x 与y 负相关,x 与z 负相关 D .x 与y 负相关,x 与z 正相关解析 (1)由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正数,且从散点图观察,回归直线方程的斜率应该比y =x 的斜率要小一些,故选B .(2)因为y =-0.1x +1,x 的系数为负,故x 与y 负相关;而y 与z 正相关,故x 与z 负相关. 二 线性回归分析(1)正确理解计算b ^,a ^的公式并能准确的计算出结果是求线性回归方程的关键.(2)回归直线方程y ^=b ^x +a ^必过样本点中心(x ,y ).(3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.【例2】 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.xyω∑i =18(x i -x )2∑i =18(ωi-ω)2∑i =18(x i -x )(y i -y )∑i =18(ωi -ω)(y i -y ) 46.65636.8289.8 1.6 1.469108.8其中ωi =x i ,ω=18∑i =18ωi .(1)根据散点图判断y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑i =1n(u i -u )(v i -v)∑i =1n(u i -u)2,α^=v -β^u .解析 (1)由散点图可以判断y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型. (2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑i =18(w i -w )(y i -y)∑i =18(w i -w)2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,年销售量y 的预报值. y ^=100.6+6849=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12.所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大. 三 独立性检验(1)独立性检验的关键是正确列出2×2列联表,并计算出K 2的值.(2)弄清判断两变量有关的把握性与犯错误概率的关系,根据题目要求作出正确的回答. 【例3】 为了调查某高中学生每天的睡眠时间,现随机对20名男生和20名女生进行问卷调查,结果如下:女生:(2)完成下面2×2列联表,并回答是否有90%的把握认为“睡眠时间与性别有关”?⎝ ⎛⎭⎪⎫K 2=(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d 解析 (1)设所求事件概率为P ,则P =C 112C 28C 320=2895.(2)计K 2=40×(12×6-14×8)220×26×14×20=4091≈0.440<2.706.所以没有90%的把握认为“睡眠时间与性别有关”.1.下列四个散点图中,变量x 与y 之间具有负的线性相关关系的是( D )解析 观察散点图可知,只有D 项的散点图表示的是变量x 与y 之间具有负的线性相关关系. 2.为研究变量x 和y 的线性相关性,甲、乙二人分别做了研究,利用回归分析的方法得到回归直线l 1和l 2,两人计算得x 相同,y 也相同,则下列结论正确的是( C )A .l 1与l 2重合B .l 1与l 2一定平行C .l 1与l 2相交于点(x ,y )D .无法判断l 1和l 2是否相交解析 因为回归直线经过样本点的中心(x ,y ),故两直线都经过点(x ,y ),而x ,y 相同不能得到a ^,b ^一定相同,故选C .3.某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下.零件的个数x /个 2 345加工的时间y /小时2.534 4.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y 关于x 的线性回归方程y ^=b ^x +a ^; (3)试预测加工10个零件需要多少小时?⎝ ⎛⎭⎪⎪⎫注:b ^=∑i =1nx i y i-n x y ∑i =1nx 2i-n x 2,a ^=y -b ^x 解析 (1)散点图如图.(2)由表中数据得∑i =14x i y i =52.5,x -=3.5,y -=3.5,∑i =14x 2i =54,∴b ^=0.7,∴a ^=1.05,∴y ^=0.7x +1.05.(3)将x =10代入线性回归方程,得y ^=0.7×10+1.05=8.05,故预测加工10个零件约需要8.05小时.4.某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均分(采用百分制),剔除平均分在40分以下的学生后,共有男生300名,女生200名.现采用分层抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生成绩分为6组,得到如下所示频数分布表.成绩与性别是否有关;(2)规定80分以上为优分(含80分),请你根据已知条件作出2×2列联表,并判断是否有90%以上的把握认为“数学成绩与性别有关”.100解析 (1)x 男=45×0.05+55×0.15+65×0.3+75×0.25+85×0.1+95×0.15=71.5,x 女=45×0.15+55×0.1+65×0.125+75×0.25+85×0.325+95×0.05=71.5,从男、女生各自的平均分来看,并不能判断数学成绩与性别有关.(2)由频数分布表可知:由抽取的100名学生中,“男生组”中的优分有15人,“女生组”中的优分有15人,据此可得2×2列联表如下.优分 非优分 总计 男生 15 4560 女生 15 2540 总计3070100可得K 2=100×(15×25-15×45)260×40×30×70≈1.79,因为1.79<2.706,所以没有90%以上的把握认为“数学成绩与性别有关”.易错点 数据较大,难求真值,忽略样本中心点的特点错因分析:①数据位数较大,计算容易出错;②y ^=b ^x +a ^与y =ax +b 容易混淆.为了避免这些容易发生的错误可将一些数据进行处理.【例1】 某地最近十年粮食需求量逐年上升,下表是部分统计数据.年份 x x x x x x x x x x 需求量/万吨236246257276286(1)利用所给数据求年需求量与年份之间的线性回归方程y =b x +a ; (2)利用(1)中所求出的线性回归方程预测该地xx 年的粮食需求量.解析 (1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求线性回归方程,先将数据处理如下.对处理的数据,容易算得x =0,y =3.2,b ^=(-4)×(-21)+(-2)×(-11)+2×19+4×29-5×0×3.2(-4)2+(-2)2+22+42-5×02= 26040=6.5,a ^=y -b ^x =3.2. 由上述计算结果,知所求线性回归方程为y ^-257=6.5(x -2 010)+3.2,即y ^=6.5(x -2 010)+260.2.(2)利用所求得的线性回归方程,可预测xx 年的粮食需求量大约为6.5×(2 016- 2 010)+260.2 =6.5×6+260.2=299.2(万吨).【跟踪训练1】 某种书每册的成本费y (元)与印刷册数x (千册)有关,经统计得到数据如下.(1)经观测每册书的成本费y 与印刷册数的倒数x之间具有明显的线性相关关系,求出y 对x 的回归方程;(2)试比较(1)中的回归方程与回归模型y =7x哪一个拟合效果更好.参考数据:12≈0.707,15≈0.447. 解析 (1)设t =1x,则t =14(0.05+0.1+0.2+0.5)=0.212 5,y =4(1.5+2.0+2.7+5.4)=2.9,由最小二乘法得b ^=∑i =14t i y i -4t y∑i =14t 2i -4t 2=3.515-2.4650.302 5-0.180 625≈8.615,a ^=y -b t ≈2.9-8.615×0.212 5≈1.069,∴y ^=8.615t +1.069,即线性回归方程为y ^=8.615x+1.069.(2)由回归方程y ^=8.615x+1.069和回归方程y =7x,得以下表格.∴对于回归方程y ^=8.615x+1.069,∑i =14y i -y ^2=02+0.0692+0.0922+0.0232≈0.014;对于回归方程y =7x,∑i =14y i -y ^2=0.0652+0.2122+0.4292+0.4512≈0.437,∵0.014<0.437,∴回归方程y ^=8.615x+1.069比回归模型y =7x的拟合效果更好.课时达标 第66讲[解密考纲]本节内容在高考中,三种题型均有考查,文字量比较大,但题目较容易. 一、选择题1.为了了解某保温产品的用电量y (kW·h)与气温(℃)之间的关系,随机统计了4次用电量与相应的气温,并制作了对照表.由表中数据,得到线性回归方程y =-2x +a (a ∈R ),由此请估计出用电量72 kW·h 时气温的度数为( D )A .-10B .-8C .-4D .-6解析 由题意可得x =10,y =40,所以a ^=y +2x =40+2×10=60.所以y ^=-2x +60,当y ^=72时,有-2x +60=72,解得x =-6,故选D .2.对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8)其回归直线方程是y ^=13x +a ^,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a ^的值是( B )A .116 B .18 C .14D .12解析 依题意可知样本中心点为⎝ ⎛⎭⎪⎫34,38,则38=13×34+a ^,解得a ^=18,故选B . 3.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( D )A .-1B .0C .12D .1解析 由题设可知这组样本中的数据完全正相关,又都在y =12x +1上,故相关系数为1,故选D .4.(xx·辽宁大连双基测试)对于下列表格所示五个散点,已知求得的线性回归方程为y ^=0.8x -155,则实数m 的值为( A )A .8C .8.4D .8.5解析 x =196+197+200+203+2045=200,y =1+3+6+7+m 5=17+m5,将样本中心点⎝⎛⎭⎪⎫200,17+m 5代入y ^=0.8x -155,可得m =8,故选A . 5.如表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对应数据,根据表提供的数据,求出y 关于x 的线性回归方程为y ^=0.7x +0.35,则下列结论错误的是( B )A B .t 的取值必定是3.15 C .回归直线一定过(4.5,3.5)D .A 产品每多生产1吨,则相应的生产能耗约增加0.7吨解析 由题意,x =3+4+5+64=4.5,因为y ^=0.7x +0.35,所以 y =0.7×4.5+0.35=3.5,所以t =4×3.5-2.5-4-4.5=3,故选B .6.(xx·福建泉州模拟)已知某产品连续4个月的广告费x i (千元)与销售额y i (万元),经过对这些数据的处理,得到如下数据信息:①∑i =44x i =18,∑i =44y i =14;②广告费用x 和销售额y 之间具有较强的线性相关关系; ③回归直线方程为y ^=b ^x +a ^中的b ^=0.8(用最小二乘法求得). 那么广告费用为6千元时,可预测销售额约为( B ) A .3.5万元 B .4.7万元 C .4.9万元D .6.5万元解析 因为∑i =14x i =18,∑i =14y i =14,所以x =92,y =72,因为回归直线方程为y ^=b ^x +a ^中的b ^=0.8,所以72=0.8×92+a ^,所以a ^=-110,所以y ^=0.8x -110.故x =6时,可预测销售额约为4.7万元,故选B .二、填空题7.已知x ,y 的取值如下表.从散点图分析,y 与x 线性相关,且回归方程为y =1.46x +a ,则实数a ^的值为__-0.61__. 解析 x =2+3+4+54=3.5,y =2.2+3.8+5.5+6.54=4.5,回归方程必过样本的中心点(x ,y ).把(3.5,4.5)代入回归方程,计算得a ^=-0.61.8.高三某班学生每周用于物理学习的时间x (单位:小时)与物理成绩y (单位:分)之间有如下关系.__13.5__(0.1). 解析 由已知可得x =24+15+23+19+16+11+20+16+17+1310=17.4,y =92+79+97+89+64+47+83+68+71+5910=74.9,设回归直线方程为y ^=3.53x +a ^,则74.9=3.53×17.4+a ^,解得a ^≈13.5. 9.以下四个命题:①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在回归直线方程y ^=0.2x +12中,当解释变量x 每增加一个单位时,预报变量y ^平均增加0.2个单位;④对分类变量X 与Y ,它们的随机变量K 2的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越大.其中所有正确的是__②③__(填序号).解析 ①是系统抽样;对于④,随机变量K 2的观测值k 越小,说明两个变量有关系的把握程度越小.三、解答题10.下表是高三某位文科生连续5次月考的历史、政治的成绩,结果统计如下.(1)求该生5(2)一般来说,学生的历史成绩与政治成绩有较强的线性相关关系,根据上表提供的数据,求两个变量x ,y 的线性回归方程y ^=b ^x +a ^.附:b ^=∑i =1n(x i -x )(y i -y)∑i =1n(x i -x)2=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a ^=y -b ^x .解析 (1)x =15×(79+81+83+85+87)=83,∵y =15×(77+79+79+82+83)=80,∴s 2y =15×[(77-80)2+(79-80)2+(79-80)2+(82-80)2+(83-80)2]=4.8.(2)∵∑i =15(x i -x )(yi -y )=30,∑i =15(x i -x )2=40,∴b ^=0.75,a ^=y -b ^x =17.75, 则所求的线性回归方程为y ^=0.75x +17.75.11.(xx·河北石家庄调研)某学校高中毕业班有男生900人,女生600人,学校为了对高三学生数学学习情况进行分析,从高三年级按照性别进行分层抽样,抽取200名学生成绩,统计数据如下表所示.数;(2)如果样本数据中,有60名女生数学成绩及格,请完成如下数学成绩与性别的列联表,并判断是否有90%的把握认为“该校学生的数学成绩与性别有关”.参考公式:K 2=(a +b )(c +d )(a +c )(b +d )解析 (1)高三学生数学平均成绩为200×(60×20+80×40+100×70+120×50+140×20)=101,估计高三学生数学平均成绩为101分,及格学生人数为70+50+20200×(900+600)=1 050.(2)K 2的观测值k =200×(60×40-20×80)280×120×60×140=10063≈1.587<2.706,所以没有90%的把握认为“该校学生的数学成绩与性别有关”.12.一家商场为了确定营销策略,进行了四次投入促销费用x 和商场实际销售额的试验,得到如下数据.投入促销费用x /万元 2 3 5 6 商场实际营销额y /万元100200300400(1)在下面的直角坐标中,画出上述数据的散点图,并据此判断两个变量是否具有较好的线性相关性;(2)求出x ,y 之间的回归直线方程y ^=b ^x +a ^;(3)若该商场计划营销额不低于600万元,则至少要投入多少万元的促销费用? 解析 (1)散点图如图所示,从图上可以看出两个变量具有较好的线性相关性.(2)x =2+3+5+64=4,y =100+200+300+4004=250,∑i =14(x i -x )2=(2-4)2+(3-4)2+(5-4)2+(6-4)2=4+1+1+4=10,∑i =14(x 1-x )(y i -y )=(-2)×(-150)+(-1)×(-50)+1×50+2×150=700,b ^=∑i =14(x i -x )(y i -y)∑i =14(x i -x)2=70010=70,a ^=y -b ^x =250-70×4=-30.故所求的回归直线方程为y ^=70x -30. (3)令70x -30≥600,即x ≥600+3070=9(万元). 故该商场计划营销额不低于600万元,则至少要投入9万元的促销费用.。
2019年高考数学一轮总复习第十章算法初步统计与统计案例10.4变量间的相关关系统计案例课件理

)
解析:根据回归直线可知变量 x,y 负相关,且由 l 的斜率知回归系数在(-1,0) 之间.故选 C.
答案:C
2.某饮料店的日销售收入 y(百元)与当天的平均气温 x(℃)之间有下列 5 组样本 数据: x -2 -1 0 1 2 y ^ A.y=x+2.6 ^ C.y=x+2.8 5 4 2 2 1 )
零件数 x(个)
加工时间 y(min) 62 A.68.2 C.69
B.68 D.67
62+a+75+81+89 解析: x =30,由于 y =0.68 x +54.6=75,所以 75= ,解得 5 a=68 故选 B.
答案:B
4.某产品的广告费用 x 与销售额 y 的统计数据如表: 广告费用 x(万元) 销售额 y(万元) 3 4 5 6
必修部分
第十章 算法初步、统计与统计案例
第四节 变量间的相关关系统计案例
栏 目 导 航
考情分析
1 3
考点疑难突破
基础自主梳理
2 4 课时跟踪检测
1
考 情 分 析
考点分
布
考纲要求 1.认识变量间的相关关系 了解最小二乘法的思想,能 根据给出的线性回归方程 系数公式建立线性回归方 程.
考点频
率
命题趋势
这组样本数据具有线性相关关系,则其回归方程可能是( ^ B.y=-x+2.6 ^ D.y=-x+2.8
解析:负相关,且过样本点的中心(0,2.8),可知为选项 D 中方程.故选 D. 答案:D
3.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 5 ^ 次试验,根据收集到的数据(如表),由最小二乘法求得回归直线方程y=0.68x+54.6, 利用表中数据推断 a 的值为( ) 10 20 30 40 50 a 75 81 89
高考新课标数学(理)大一轮复习课时作业66变量间的相关关系、统计案例 Word版含解析

课时作业变量间的相关关系、统计案例
一、选择题
.在一组样本数据(,),(,),…,(,)(≥,,,…,不全相等)的散点图中,若所有样本点(,)(=,,…,)都在直线=
+上,则这组样本数据的样本相关系数为( )
.-.
.
解析:样本点都在一条直线上时,其样本数据的相关系数为.
答案:
.根据如下样本数据
得到的回归方程为=+,则().>,> .>,<
.<,> .<,<
解析:由表中数据画出散点图,如图,
由散点图可知<,>,选.
答案:
.(·辽宁大连双基)已知,的取值如表所示:
如果与线性相关,且线性回归方程为=+,则的值为()
.-
.-
解析:将=,=代入到=+中,得=-.故选.
答案:
.(·湖北武汉调考)根据如下样本数据
得到的回归直线方程为=+.若=,则每增加个单位,就()
.增加个单位
.减少个单位
.减少个单位
.增加个单位
解析:=(++++)=,=(+-+-)=,所以样本中心为(,),代入
回归直线方程可得=×+⇒
=-,所以每增加个单位,就减少个单位,故选.
答案:.(·兰州、张掖联考)对具有线性相关关系的变量,有一组观测数据(,)(=,,…,),其回归直线方程是=+,且+++…+=(+++…+)=,则实数的值是()
解析:依题意可知样本中心点为,则=×+,解得=.
答案:.(·东营一模)某商品的销售量(件)与销售价格(元件)存在线性相关关。
高考数学一轮总复习 第10章 算法初步、统计、统计案例 第4节 变量间的相关关系 统计案例课件 理

, ^a=
n x2i -n-x 2
i=1
_-y__-__^b_-_x_.
n
(3)通过求Q= yi-bxi-a2的最小值而得到回归直线的 i=1
方法,即使得样本数据的点到回归直线的距离的平方和 最小,这一方法叫做最小二乘法. (4)相关系数: 当 r>0 时,表明两个变量_正__相__关__; 当 r<0 时,表明两个变量_负__相__关__. r 的绝对值越接近于 1,表明两个变量的线性相关性 _越__强__.r 的绝对值越接近于 0 时,表明两个变量之间 _几__乎__不__存__在__线__性__相__关___关__系__.通常|r|大于_0_._7_5_时,认为 两个变量有很强的线性相关性.
[谨记通法]
相关关系的判断的 2 种方法
(1)散点图法:如果所有的样本点都落在某一函数的曲 线附近,变量之间就有相关关系.如果所有的样本点都落 在某一直线附近,变量之间就有线性相关关系.若点散布 在从左下角到右上角的区域,则正相关.如“题组练透” 第 1 题.
2.两个变量的线性相关 (1)从散点图上看,如果这些点从整体上看大致分布在通过
散点图中心的一条直线附近,称两个变量之间具有
_线__性__相__关__关__系___,这条直线叫做_回__归__直__线__.
n xiyi-n-x -y
i=1
(2)回归方程为_^y_=___^b_x_+__^a_,其中^b=
C.x 与 y 负相关,x 与 z 负相关
D.x 与 y 负相关,x 与 z 正相关
解析:因为 y=-0.1x+1 的斜率小于 0, 故 x 与 y 负相关.因为 y 与 z 正相关,可设 z=b^y+a^,b^ >0,则 z=b^y+a^=-0.1b^x+b^+a^, 故 x 与 z 负相关. 答案:C
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第 十 章 算法初步、统计、统计案例
第66讲 变量间的相关关系与统计案例
考纲要求 考情分析 1.会作两个有关联变量的数据的散点 2017·全国卷Ⅰ,19 图,并利用散点图认识变量间的相关 2016·全国卷Ⅲ,18 2015·全国卷Ⅱ,3 关系. 2015·福建卷,4 2.了解最小二乘法的思想,能根据 给出的线性回归方程系数公式建立线 性回归方程. 3.了解常见的统计方法,并能应用 这些方法解决一些实际问题. 分值:5~12分 4.了解独立性检验(只要求2×2列联 表)的基本思想、方法及其简单应用. 5.了解回归分析的基本思想、方法 及其简单应用.
②回归方程:两个具有线性相关关系的变量的一组数据为(x1,y1),(x2,y2),…, n n xi- x yi- y xiyi-n x y i=1 ^ i =1 ^ ^ ^ = , b= n n (xn,yn),其回归方程为y=bx+a,其中 2 2 2 x - n x x - x i i i=1 i=1 ^ ^ a= y -b x , 其中( x , y )称为样本点的中心.
越强 ③r 的绝对值越接近 1,表明两个变量的线性相关性____________;r 的绝对值
越弱 r>0.75 时,认为两个 越接近 0,表明两个变量的线性相关性____________ ,通常当
变量有很强的线性相关关系.
2.独立性检验 (1)分类变量: 变量的不同“值”表示个体所属的不同类别, 像这类变量称为分类 变量. (2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量 X 和 Y,它们的可能取值分别为 x1,x2 和 y1,y2 ,其样本频数列联表(称为 2×2 列联表) 如下.
^ ^ 解析 因为回归直线方程为 y=2-1.5x,所以b=-1.5,则变量 x 增加一个单位, y 平均减少 1.5 个单位.
5.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是 ( C ) A.若K2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那 么在100个吸烟的人中必有99人患有肺病 B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,我们说某人
(2)线性相关关系 从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个 回归直线 变量之间具有线性相关关系,这条直线叫____________ . (3)回归方程 距离的平方和 最小的方 ①最小二乘法:使得样本数据的点到回归直线的 _________________ 法叫最小二乘法.
)
(5)事件 X,Y 关系越密切,则由观测数据计算得到的 K2 的观测值越大.( √
)
2.观察下列各图:
其中两个变量 x,y 具有相关关系的图是( C ) A.①② B.①④ C.③④ D.②③
解析 由散点图知③④具有相关关系.
3.已知 x,y 的取值如下表,从散点图可以看出 y 与 x 线性相关,且回归方程为 y=0.95x+a,则a=( B ) x y A.3.25 0 2.2 B.2.6 1 4.3 C.2.2 3 4.8 4 6.7 D.0
命题趋势
1.散点图与相关关系、线 性回归方程与独立性检验 在实际生活中的应用. 2.有关统计内容及方法主 要以选择题、填空题的形 式呈现,属容易题;抽样 方法和各种统计图表与概 率的有关内容相结合或与 统计案例相结合也会出现 在解答题中,属中档题.
栏目导航
板 块 一
板 块 二
板 块 三
1.相关关系与回归方程 (1)相关关系的分类 左下角 到__________ 右上角 的区域内. ①正相关:从散点图上看,点散布在从__________ 右下角 的区域内. 左上角 到__________ ②负相关:从散点图上看,点散布在从_________
xi- x yi- y
i =1
n
(4)样本相关系数 r=
n 2 n i=1 i=1
,用它来衡量两个变量间的线性
x i- x y i- y 2
相关关系的强弱.
正相关 ①当 r>0 时,表明两个变量____________ ; 负相关 ②当 r<0 时,表明两个变量____________ ;
^ ^ ^
解析 由已知得 x =2, y =4.5,因为回归方程经过点( x , y ), 所以 a=4.5-0.95×2=2.6.
^ ^ 4.若回归直线方程为y=2-1.5x,则变量 x 增加一个单位,y( C ) A.平均增加 1.5 个单位 C.平均减少 1.5 个单位 B.平均增加 2 个单位 D.平均减少 2 个单位
y1
y2
总计
x1 d
b+d
a+b c+d
a+b+c+d
2 n ad - bc a+b+c+d K2= (其中 n=_______________ 为样本容量),则利用独 a+ba+cb+dc+d
立性检验判断表来判断“X 与 Y 的关系”.
1.思维辨析(在括号内打“√”或打“×”). (1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( × ) (2)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表 示.( √ )
^ ^ ^
(3)通过回归方程y=bx+a可以估计和观测变量的取值和变化趋势.( √ (4)任何一组数据都对应着一个回归直线方程.( × )
吸烟,那么他有99%的可能患有肺病
C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可 能性使得推断出现错误 D.以上三种说法都不正确 解析 根据独立性检验的思想知C项正确.
一
相关关系的判断
判定两个变量正、负相关性的方法
(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上