高考 2018年数学总复习课时规范练50变量间的相关关系统计案例文新人教A版201803154105

合集下载

高考数学一轮复习 第十章 统计与统计案例 10.3 变量间的相关关系、统计案例真题演练集训 理 新人

高考数学一轮复习 第十章 统计与统计案例 10.3 变量间的相关关系、统计案例真题演练集训 理 新人

系、统计案例真题演练集训理新人教A版编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018版高考数学一轮复习第十章统计与统计案例10.3 变量间的相关关系、统计案例真题演练集训理新人教A版)的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018版高考数学一轮复习第十章统计与统计案例10.3 变量间的相关关系、统计案例真题演练集训理新人教A版的全部内容。

关系、统计案例真题演练集训理新人教A版1.[2015·福建卷]为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8。

28.610.011。

311.9支出y(万元) 6.27。

58。

08.59.8根据上表可得回归直线方程y,=错误!x+错误!,其中错误!=0.76,错误!=错误!-错误!错误!。

据此估计,该社区一户年收入为15万元家庭的年支出为( )A.11。

4万元 B.11.8万元C.12。

0万元 D.12。

2万元答案:B解析:由题意知,x=错误!=10,错误!=错误!=8,∴错误!=8-0。

76×10=0。

4,∴当x=15时,错误!=0。

76×15+0.4=11。

8(万元).2.[2016·新课标全国卷Ⅲ]下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1-7分别对应年份2008-2014.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:错误!i=9.32,错误!i y i=40。

2018年高考数学人教A版 文科真题演练集训:10-3变量间

2018年高考数学人教A版 文科真题演练集训:10-3变量间

真题演练集训1.[2015·新课标全国卷Ⅱ]根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案:D解析:依据给出的柱形图,逐项验证.对于A选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A正确.对于B选项,由图知,由2006年到2007年矩形高度明显下降,因此B正确.对于C选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C正确.由图知2006年以来我国二氧化硫年排放量与年份负相关,故选D.2.[2015·福建卷]为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a ^=y --b ^x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元 答案:B解析:先求a ^,再利用回归直线方程预测. 由题意知,x =8.2+8.6+10.0+11.3+11.95=10, y =6.2+7.5+8.0+8.5+9.85=8, ∴ a ^=8-0.76×10=0.4,∴ 当x =15时,y ^=0.76×15+0.4=11.8(万元).3.[2016·新课标全国卷Ⅲ]下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1-7分别对应年份2008-2014.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;(2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,i =17(y i -y )2=0.55,7≈2.646.参考公式:相关系数r =∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2∑i =1n(y i -y )2,回归方程y^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为b ^=∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2,a ^=y -b ^t .解:(1)由折线图中数据和附注中参考数据得 t =4,∑i =17(t i -t )2=28,∑i =17(y i -y )2=0.55,∑i =17 (t i -t )(y i -y )=∑i =17t i y i -t ∑i =17y i =40.17-4×9.32=2.89,r ≈ 2.890.55×2×2.646≈0.99. 因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b ^=∑i =17(t i -t )(y i -y )∑i =17(t i -t )2=2.8928≈0.103,a ^=y -b ^t ≈1.331-0.103×4≈0.92. 所以,y 关于t 的回归方程为y ^=0.92+0.10t .将2016年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82. 所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨. 4.[2015·新课标全国卷Ⅰ]某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =18∑i =18w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程. (3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑i =1n(u i -u )(v i -v )∑i =1n(u i -u )2,α^=v -β^u .解:(1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑i =18(w i -w )(y i -y )∑i =18(w i -w )2=108.81.6=68,c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12. 所以当x =13.62=6.8,即x =46.24时,z ^取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大.5.[2014·新课标全国卷Ⅱ]某地区2007年至2013年农村居民家庭人均纯收入y (单位:千元)的数据如下表:(1)求y 关于t 的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^=∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2,a ^=y -b ^t .解:(1)由所给数据计算得t =17×(1+2+3+4+5+6+7)=4,y =17×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑i =17(t i -t )2=9+4+1+0+1+4+9=28,∑i =17(t i -t )(y i -y )=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b ^=∑i =17(t i -t )(y i -y )∑i =17(t i -t )2=1428=0.5,a ^=y -b ^t =4.3-0.5×4=2.3.所求回归方程为y ^=0.5t +2.3.(2)由(1)知,b ^=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t =9代入(1)中的回归方程,得y ^=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.。

(福建专用)2018年高考数学总复习 课时规范练50 变量间的相关关系、统计案例 文 新人教A版

(福建专用)2018年高考数学总复习 课时规范练50 变量间的相关关系、统计案例 文 新人教A版

课时规范练50 变量间的相关关系、统计案例基础巩固组1.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心()C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg2.根据如下样本数据:得到的回归方程为x+,则()A.>0,>0B.>0,<0C.<0,>0D.<0,<03.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若K2的观测值为6.635,则在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系,因此在100个吸烟的人中必有99个患有肺病B.由独立性检验知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系时,我们说某人吸烟,则他有99%的可能患肺病C.若在统计量中求出在犯错误的概率不超过0.05的前提下认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D.以上三种说法都不正确4.两个随机变量x,y的取值如下表:若x,y具有线性相关关系,且x+2.6,则下列结论错误的是()A.x与y是正相关B.当x=6时,y的估计值为8.3C.x每增加一个单位,y大约增加0.95个单位D.样本点(3,4.8)的残差为0.565.2016年春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:则下面的结论正确的是()A.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别有关”D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关”6.(2017山东潍坊二模,文12)某公司未来对一种新产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中数据,求得线性回归方程为=-4x+,当产品销量为76件时,产品定价大致为元.7.从某居民区随机抽取10个家庭,获得第i个家庭的月收入x i(单位:千元)与月储蓄y i(单位:千元)的数据资料,算得x i=80,y i=20,x i y i=184,=720.(1)求家庭的月储蓄对月收入x的线性回归方程x+;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.〚导学号24190950〛综合提升组8.通过随机询问110名性别不同的学生是否爱好某项运动,得到如下的列联表:附表:参照附表,得到的正确结论是()A.在犯错误的概率不超过0.01的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.01的前提下,认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别无关”9.已知x与y之间的几组数据如下表:假设根据上表数据所得线性回归直线方程x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',则以下结论正确的是()A.>b',>a'B.>b',<a'C.<b',>a'D.<b',<a'10.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为 cm. 11.(2017宁夏石嘴山第三中学模拟,文18)为推行“新课堂”教学法,某化学老师分别用传统教学和“新课堂”两种不同的教学方式,在甲、乙两个平行班进行教学实验,为了解教学效果,期中考试后,分别从两个班级中各随机抽取20名学生的成绩进行统计,作出的茎叶图如下图,记成绩不低于70分者为“成绩优良”.(1)分别计算甲、乙两班20个样本中,化学成绩前十的平均分,并据此判断哪种教学方式的教学效果更佳;(2)由以上统计数据填写下面2×2列联表,并判断能否在犯错误的概率不超过0.05的前提下认为“成绩优良与教学方式有关”?附:K2=(n=a+b+c+d).独立性检验临界值表:12.某贫困地区2011年至2017年农村居民家庭人均纯收入y(单位:千元)的数据如下表:(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2011年至2017年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2019年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:.〚导学号24190951〛创新应用组13.某同学进行寒假社会实践活动,为了对白天平均气温与某奶茶店的某种饮料销量之间的关系进行分析研究,他分别记录了1月11日至1月15日的白天平均气温x(单位:℃)与该奶茶店的这种饮料销量y(单位:杯),得到如下数据:(1)若先从这5组数据中抽出2组,求抽出的2组数据恰好是相邻两天数据的概率;(2)请根据所给5组数据,求出y关于x的线性回归方程x+;并根据线性回归方程预测当气象台预报1月16日的白天平均气温为7 ℃时该奶茶店这种饮料的销量.附:线性回归方程x+中,其中为样本平均值.14.(2017福建南平一模,文18)某单位N名员工参加“我爱阅读”活动,他们的年龄在25岁至50岁之间,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.下面是年龄的分布表(1)求正整数a,b,N的值;(2)现要从年龄低于40岁的员工中用分层抽样的方法抽取42人,则年龄在第1,2,3组的员工分别抽多少?(3)为了了解该单位员工的阅读习惯,对第1,2,3组中抽出的42人是否喜欢阅读国学类书籍进行了调查,调查结果如下表所示:(单位:人)根据表中数据,能否在犯错误的概率不超过0.5%的前提下认为该单位员工“是否喜欢阅读国学类书籍和性别有关系”?附:K2=.答案:1.D由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确;又线性回归方程必过样本点中心(),因此B正确;由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故C正确;当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此D不正确.2.B由题表中数据画出散点图,如图,由散点图可知<0,>0,故选B.3.C独立性检验只表明两个分类变量的相关程度,而不是事件是否发生的概率估计.4.D由表格中的数据可知选项A正确;∵(0+1+3+4)=2,(2.2+4.3+4.8+6.7)=4.5,∴4.5=2+2.6,解得=0.95,∴=0.95x+2.6.当x=6时,=0.95×6+2.6=8.3,故选项B正确;由=0.95+2.6可知选项C正确;当x=3时,=0.95×3+2.6=5.45,残差是5.45-4.8=0.65,故选项D错误.5.A由2×2列联表得到a=45,b=10,c=30,d=15,则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,计算得K2的观测值k=≈3.030.因为3.030>2.706,所以在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”,故选A.6.7.5∵=6.5,=80,∴=80-(-4)×6.5,解得=106,∴回归方程为=-4x+106.当y=76时,76=-4x+106,∴x=7.5,故答案为7.5.7.解 (1)由题意知n=10,x i==8,y i==2,又-10=720-10×82=80,x i y i-10=184-10×8×2=24,由此得=0.3,=2-0.3×8=-0.4,故所求线性回归方程为=0.3x-0.4.(2)由于变量y的值随x值的增加而增加(=0.3>0),因此x与y之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为=0.3×7-0.4=1.7(千元).8.A依题意,由K2=,得K2=≈7.8>6.635,所以在犯错误的概率不超过0.01的前提下,认为“爱好该项运动与性别有关”,故选A. 9.C由题意可知,b'=2,a'=-2,.=-,故<b',>a',故选C.10.185由题意,得父亲身高x cm与儿子身高y cm对应关系如下表:则=173,=176,(x i-)(y i-)=(173-173)×(170-176)+(170-173)×(176-176)+(176-173)×(182-176)=18,(x i-)2=(173-173)2+(170-173)2+(176-173)2=18.∴=1.∴=176-173=3.∴线性回归直线方程x+=x+3.∴可估计孙子身高为182+3=185(cm).11.解 (1)甲班化学成绩前十的平均分(72+74+74+79+79+80+81+85+89+96)=80.9;乙班化学成绩前十的平均分(78+80+81+85+86+93+96+97+99+99)=89.4.∵,∴大致可以判断新课堂教学的教学效果更佳.(2)根据2×2列联表中的数据,得K2的观测值为k=≈3.956>3.841,∴能在犯错误的概率不超过0.05的前提下认为“成绩优良与教学方式有关”.12.解 (1)由所给数据计算得(1+2+3+4+5+6+7)=4,(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,(t i-)2=9+4+1+0+1+4+9=28,(t i-)(y i-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,=0.5,=4.3-0.5×4=2.3,所求回归方程为=0.5t+2.3.(2)由(1)知,=0.5>0,故2011年至2017年该地区农村居民家庭人均纯收入逐年增加,平均每年约增加0.5千元.将2019年的年份代号t=9代入(1)中的回归方程,得=0.5×9+2.3=6.8,故预测该地区2019年农村居民家庭人均纯收入为6.8千元.13.解 (1)设“选取的2组数据恰好是相邻两天数据”为事件A,∵所有基本事件(m,n)(其中m,n为1月11日至1月15日的日期数)有10个,事件A包括的基本事件有(11,12),(12,13),(13,14),(14,15),共4个,∴抽出的2组数据恰好是相邻两天数据的概率P(A)=.(2)∵=10,=25.∴由公式,求得=2.1,=4,∴y关于x的线性回归方程为=2.1x+4.当x=7时,=2.1×7+4=18.7,故该奶茶店这种饮料的销量大约为19杯(或18杯).14.解 (1)总人数N==280,a=280×0.02×5=28.第3组的频率是1-5×(0.02+0.02+0.06+0.02)=0.4,所以b=280×0.4=112.(2)因为年龄低于40岁的员工在第1,2,3组,共有28+28+112=168(人),利用分层抽样在168人中抽取42人,每组抽取的人数分别为:第1组抽取的人数为28×=7(人),第2组抽取的人数为28×=7(人),第3组抽取的人数为112×=28(人),所以第1,2,3组分别抽7人、7人、28人.(3)假设H0:“是否喜欢阅读国学类书籍和性别无关系”,根据表中数据,求得K2的观测值k=≈8.145>7.879.从而能在犯错误的概率不超过0.5%的前提下,认为该单位的员工“是否喜欢阅读国学类书籍和性别有关系”.百度文库是百度发布的供网友在线分享文档的平台。

人教版高三文科数学课后习题(含答案)课时规范练50变量间的相关关系、统计案例

人教版高三文科数学课后习题(含答案)课时规范练50变量间的相关关系、统计案例

课时规范练50 变量间的相关关系、统计案例基础巩固组1.(2019湖南长郡中学一模,6)相关变量的样本数据如下表经回归分析可得y 与x 线性相关,并由最小二乘法求得回归直线方程为y ^=0.5x+2.3,下列说法正确的是( ) A.x 增加1时,y 一定增加2.3 B.变量x 与y 负相关 C.当y 为6.3时,x 一定是8 D.a=5.22.(2019山东临沂三模,6)某产品近期销售情况如下表:根据上表可得回归方程为y ^=b ^x+13.8,据此估计,该公司8月份该产品的销售额为( ) A.19.05 B.19.25C.19.5D.19.83.某同学用收集到的6组数据对(x i ,y i )(i=1,2,3,4,5,6)制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线l 的方程为y ^=b ^x+a ^,相关系数为r.现给出以下3个结论:①r>0;②直线l 恰好过点D ;③b ^>1.其中正确结论是( )A.①②B.①③C.②③D.①②③4.(2019湖南师大附中七模,6)下列说法错误的是( ) A.在回归模子中,预报变量y 的值不能由解释变量x 唯一确定 B.若变量x ,y 满足关系y=-0.1x+1,且变量y 与z 正相关,则x 与z 也正相关C.在残差图中,残差点分布的带状地区的宽度越局促,其模型拟合的精度越高D.以模型y=cekx 去拟合一组数据时,为了求出回归方程,设z=ln y,将其变换后得到线性方程z=0.3x+4,则c=e4,k=0.3 5.(2019四川绵阳质检,6)利用独立性检验的方法调查高中性别与爱好某项活动是否有关,通过随机调查200名高中生是否兴趣某项活动,利用2×2列联表,由计算可得K2≈7.245,参照下表:得到的正确结论是( )A.有99%以上的把握认为“爱好该项运动与性别无关”B.有99%以上的把握认为“爱好该项运动与性别有关”C.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别无关”6.某工厂为了对新研发的一种产物举行公道订价,将该产品按事先制定的代价举行试销,得到如下数据.由表中数据求得线性回归方程y ^=-4x+a ,则x=10元时预测销量为 件.7.(2019海南海口调研,18)某城市的公交公司为了方便市民出行,科学计划车辆投放,在一个人员密集流动地段增设一个起点站,为了研究车辆发车间隔时间x 与乘客等候人数y 之间的干系,经过调查得到如下数据:调查小组先从这6组数据中选取4组数据求线性回归方程,再用剩下的2组数据举行查验.检验方法如下:先用求得的线性回归方程计算间隔时间对应的期待人数,再求与实际等候人数y 的差,若差值的绝对值不超过1,则称所求方程是“恰当回归方程”. (1)若选取的是后面4组数据,求y 关于x 的线性回归方程y ^=b ^x+a ^;(2)判断(1)中的方程是否是“恰当回归方程”;(3)为了使等候的乘客不超过35人,试用(1)中方程估计间隔时间最多可以设置为多少(精确到整数)分钟?附:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x+a ^的斜率和截距的最小二乘估计分别为:b ^=∑i=1nx i y i -nx y∑i=1nx i 2-nx 2=∑i=1n(x i -x )(y i -y )∑i=1n(x i-x )2,a ^=y −b ^x .综合提升组8.已知具有线性相关的变量x ,y ,设其样本点为A i (x i ,y i )(i=1,2,…,8),回归直线方程为y ^=12x+a ,若OA 1⃗⃗⃗⃗⃗⃗⃗ +OA 2⃗⃗⃗⃗⃗⃗⃗⃗ +…+OA 8⃗⃗⃗⃗⃗⃗⃗⃗ =(6,2)(O 为原点),则a=( ) A.18B.-18C.14D.-149.为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关干系,设其回归直线方程为x+.已知xi=225,yi=1 600,=4.该班某学生的脚长为24厘米,据此估计其身高为 厘米.10.(2019山东德州高三一模,19)改革开放以来,我国经济连续高速增长.如图给出了我国2003年至2012年第二产业增加值与第一产业增加值的差值(以下简称为:产业差值)的折线图,记产业差值为y(单位:万亿元).注:年份代码1—10分别对应年份2003—2012 (1)求出y 关于年份代码t 的线性回归方程;(2)利用(1)中的回归方程,分析2003年至2012年我国财产差值的变革环境,并预测我国产业差值在哪一年约为34万亿元; (3)联合折线图,试求出除去2007年产业差值后剩余的9年产业差值的平均值及方差(结果精确到0.1).附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^=∑i=1n(t i -t )(y i -y )∑i=1n(t i-t )2,a ^=y −b ^t .样本方差公式:s 2=1n∑i=1n(y i -y )2.参考数据:y =110∑i=110y i =10.8,∑i=110(t i -t )(y i -y )=132,∑i=110(y i -y )2=211.6.11.(2019湖北武汉调研,19)2019年,在庆祝中华人民共和国成立70周年之际,又迎来了以“创武士光彩,筑世界和平”为宗旨的第七届天下武士运动会.据悉,这次军运会将于2019年10月18日至27日在优美的江城武汉举行,届时将有来自全世界100多个国家和地区的近万名武士运动员参赛.相对于奥运会、亚运会等大型综合赛事,军运会或许对许多人来说还很生疏.为此,武汉某高校为了在学生中更广泛的推介普及军运会相干知识内容,特在网络上组织了一次“我所知晓的武汉军运会”知识问答角逐,为便于对答卷举行比拟研究,组委会抽取了1 000名男生和1 000名女生的答卷,他们的考试成绩频率分布直方图如下:(注:问卷满分为100分,成绩≥80的试卷为“优秀”等级)(1)从现有1 000名男生和1 000名女生答卷中各取一份,分别求答卷成绩为“优秀”等级的概率;(2)求列联表中a,b,c,d的值,并根据列联表回答:能否在犯错误的概率不超过0.025的前提下认为“答卷成绩为优秀等级与性别有关”?(3)根据男、女生结果频率漫衍直方图,对他们的结果的优劣举行比力.附:参考公式:K2=n(ad-bc)2,其中n=a+b+c+d.(a+b)(c+d)(a+c)(b+d)创新应用组12.(2019河北衡水质检(四),7)某研究机构在对具有线性相关的两个变量x和y举行统计分析时,得到如下数据:由表中数据求得y关于x的回归方程为=0.8x+,则在这些样本点中任取一点,该点落在回归直线上方的概率为( )A.14B.12C.34D.4513.已知鸡的产蛋量与鸡舍的温度有关,为了确定下一个时段鸡舍的控制温度,某企业需要了解鸡舍的温度x(单位:℃)对某种鸡的时段产蛋量y(单位:t)和时段投入成本z(单位:万元)的影响,为此,该企业收集了7个鸡舍的时段控制温度xi和产蛋量yi(i=1,2,…,7)的数据,对数据初步处理后得到了如图所示的散点图和表中的统计量的值.7其中k i=ln y i,k=17∑i=17k i.(1)凭据散点图果断,y=bx+a与y=c1哪一个更适宜作为该种鸡的时段产蛋量y关于鸡舍时段控制温度x的回归方程类型?(给果断即可,不必说明理由)(2)若用y=c1作为回归方程模子,凭据表中数据,建立y关于x的回归方程;(3)已知时段投入成本z与x,y的关系为z=e-2.5y-0.1x+10,当时段控制温度为28 ℃时,鸡的时段产蛋量及时段投入成本的预报值分别是多少?附:①对于一组具有线性相关关系的数据(ui,υi)(i=1,2,3,…,n),其回归直线u+的斜率和截距的最小二乘预计分别为.②参考答案课时规范练50 变量间的相关关系、统计案例1.D 由题设x 增加1时,y 可能增加0.5,当y 为6.3时,x 可能为8,变量x 与y 正相关,x =1+2+3+4+5+6+77=4,y=2.9+3.3+3.6+4.4+4.8+a+5.97=24.9+a 7,4×0.5+2.3=24.9+a7⇒a=5.2,故选D . 2.D ∵x =2+3+4+5+65=4,y =15.1+16.3+17.0+17.2+18.45=16.8,∴16.8=4b ^+13.8,解得b ^=0.75,∴y ^=0.75x+13.8,取x=8,得y ^=0.75×8+13.8=19.8,故选D .3.A 由题图可知这些点分布在一条斜率大于零的直线相近,以是为正相干,即相关系数r>0.因为x =0+1+2+3+5+7=3,y=1.5+2+2.3+3+5+4.2=3,所以回归直线l 的方程必过点(x,y )=(3,3),即直线l 恰好过点D.因为直线l 的斜率接近于直线AD 的斜率,而k AD =3-1.5=1<1,所以③错误,综上正确结论是①②,故选A .4.B 对于A,y 除了受自变量x 的影响之外还受其他因素的影响,故A 正确;对于B,变量x ,y 满足关系y=-0.1x+1,则变量x 与y 负相关,又变量y 与z 正相关,则x 与z 负相关,故B 错误;对于C,由残差图的意义可知正确;对于D,∵y=cekx,∴双方取对数,可得ln y=ln(cekx)=ln c+ln ekx=ln c+kx,令z=ln y,可得z=ln c+kx.∵z=0.3x+4,∴ln c=4,k=0.3, ∴c=e 4.即D 正确.故选B .5.B 由K 2≈7.245>6.635,可得有99%以上的把握认为“爱好该项运动与性别有关”.故选B .6.66 由已知得x =16×(4+5+6+7+8+9)=132,y =16×(90+84+83+80+75+68)=80,∴a ^=80+4×132=106,∴x=10时,y ^=106-40=66,故答案为66. 7.解 (1)由题意得后面4组数据是:所以x =12+13+14+154=13.5,y=26+29+28+314=28.5,∑i=14x i y i =12×26+13×29+14×28+15×31=1546,∑i=14x i 2=122+132+142+152=734,所以b ^=∑i=1nx i y i -nx y ∑i=1nx i 2-nx 2=1 546-4×272×572734-4×(272)2=1.4,故a ^=y −b ^x =28.5-1.4×13.5=9.6,所以所求的回归方程为y ^=1.4x+9.6.(2)当x=10时,y ^=1.4×10+9.6=23.6,故23.6-23=0.6<1;当x=11时,y ^=1.4×11+9.6=25,故25-25=0<1. 所以求出的线性回归方程是“恰当回归方程”.(3)由1.4x+9.6≤35,得x ≤1817,故间隔时间最多可设置为18分钟.8.B 因为OA 1⃗⃗⃗⃗⃗⃗⃗⃗ +OA 2⃗⃗⃗⃗⃗⃗⃗⃗ +…+OA ⃗⃗⃗⃗⃗ 8=(x 1+x 2+…+x 8,y 1+y 2+…+y 8)=(8x ,8y )=(6,2), 所以8x =6,8y =2⇒x =34,y =14,因此14=12×34+a ,即a=-18,故选B . 9.166 由∑i=110x i =225,∑i=110y i =1 600,利用平均值公式求得x =22.5,y =160,∵b ^=4,∴a ^=160-4×22.5=70,∴当x=24时,y=4×24+70=166,故答案为166. 10.解 (1)t =110(1+2+3+…+9+10)=5.5,∑i=1n (t i -t )2=(t 1-t )2+…+(t 10-t )2=2×(4.52+3.52+2.52+1.52+0.52)=82.5.b ^=13282.5=1.6,a ^=y −b ^t =10.8-1.6×5.5=2,故回归方程是y ^=1.6t+2.(2)由(1)知,=1.6>0,故2003年至2012年我国财产差值逐年增长,平均每年增加1.6万亿元.令1.6t+2=34,解得t=20,故预测在2022年我国产业差值为34万亿元.(3)联合折线图,2007年产业差值为10.8万亿元,除去2007年(t=5时)产业差值外的9年的产业差值平均值为×(10×10.8-10.8)=10.8.又因为∑i=110(y i -y )2=211.6,故除去2007年(t=5时)产业差值外的9年的产业差值的方差为19×[211.6-(10.8-10.8)2]≈23.5. 11.解 (1)男生答卷成绩优秀概率P=(0.058+0.034+0.014+0.010)×5=0.58, 女生答卷成绩优秀概率P=(0.046+0.034+0.016+0.010)×5=0.53. (2)由题意可得列联表如下:∴a=580,b=530,c=420,d=470, 由K2=n (ad -bc )2得K2=2 000×(580×470-530×420)2=5.061>5.024,∴能在犯错误的概率不超过0.025的前提下认为“问卷成绩为优秀等级与性别有关”.(3)频率分布直方图表明:男生成绩的平均分(或中位数)在80到85之间,女生成绩的平均分(中位数)在75到80分之间,且男生的成绩分布集中程度较女生结果会合水平高,因此,可以认为男生的结果较好且稳固.12.B ∵x =1+2+3+44=52,y =12+32+2+34=74,∴74=0.8×52+a ^,∴a ^=-14,因此点(4,3),(2,32)在回归直线y ^=0.8x-0.25上方,概率为24=12,故选B .13.解 (1)y=c 1e c 2x 适宜.(2)由y=c 1e c 2x 得ln y=c 2x+ln c 1,令ln y=k ,c 2=β,ln c 1=α,由题中图表中的数据可知β^=35140=14,α^=-34,∴k ^=14x-34,∴y 关于x 的回归方程为y=e x 4-34=0.47e x 4.(3)当x=28时,由回归方程得y ^=0.47×1 096.63≈515.4,z ^=0.08×515.4-2.8+10=48.432, 即鸡舍的温度为28 ℃时,鸡的时段产量的预报值为515.4 t,投入成本的预报值为48.432万元.。

高考数学课时过关检测(七十一) 变量间的相关关系、统计案例

高考数学课时过关检测(七十一)  变量间的相关关系、统计案例

课时过关检测(七十一) 变量间的相关关系、统计案例A 级——夯基保分练1.根据如下样本数据:得到的线性回归方程为y =b x +a ,则( ) A.a ^>0,b ^>0 B.a ^>0,b ^<0 C.a ^<0,b ^>0D .a ^<0,b ^<0解析:选B 根据给出的数据可发现:整体上y 与x 呈现负相关,所以b ^<0,由样本点(3,4.0)及(4,2.5)可知a ^>0,故选B.2.某考察团对10个城市的职工人均工资x (千元)与居民人均消费y (千元)进行调查统计,得出y 与x 具有线性相关关系,且线性回归方程为y ^=0.6x +1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为( )A .66%B .67%C .79%D .84%解析:选D ∵y 与x 具有线性相关关系,且满足回归方程y ^=0.6x +1.2,该城市居民人均工资为x =5,∴可以估计该城市的职工人均消费y =0.6×5+1.2=4.2,∴可以估计该城市人均消费额占人均工资收入的百分比为4.25=84%.3.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.由K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),得K 2=100×(45×22-20×13)265×35×58×42≈9.616.参照下表,正确的结论是( A .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关” B .在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关” C .有99%以上的把握认为“生育意愿与城市级别有关” D .有99%以上的把握认为“生育意愿与城市级别无关”解析:选C ∵K 2≈9.616>6.635,∴有99%以上的把握认为“生育意愿与城市级别有关”,故选C.4.(2020·长沙模拟)为了解某社区居民购买水果和牛奶的年支出费用与购买食品的年支出费用的关系,随机调查了该社区5户家庭,得到如下统计表:根据上表可得回归方程y =b x +a ,其中b =0.59,a =y -b x ,据此估计,该社区一户购买食品的年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约为( )A .1.795万元B .2.555万元C .1.915万元D .1.945万元解析:选Ax =15×(2.09+2.15+2.50+2.84+2.92)=2.50(万元),y =15×(1.25+1.30+1.50+1.70+1.75)=1.50(万元),其中b ^=0.59,则a ^=y -b ^ x =0.025,y ^=0.59x +0.025,故年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约为y ^=0.59×3.00+0.025=1.795(万元).5.某炼钢厂废品率x (%)与成本y (元/吨)的线性回归直线方程为y ^=105.492+42.569x .当成本控制在176.5元/吨时,可以预计生产的1 000吨钢中,约有________吨钢是废品(结果保留两位小数).解析:因为176.5=105.492+42.569x ,解得x ≈1.668,即当成本控制在176.5元/吨时,废品率约为1.668%,所以生产的1 000吨钢中,约有1 000×1.668%=16.68吨是废品.答案:16.686.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.解析:K2≈3.918≥3.841,而P(K2≥3.814)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.答案:①B级——提能综合练7.(2019·贵州省适应性考试)2018年12月1日,贵阳市地铁1号线全线开通,在一定程度上缓解了市内交通的拥堵状况.为了了解市民对地铁1号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构,并制作出如下等高条形图:根据图中(35岁以上含35岁)的信息,下列结论中不一定正确的是()A.样本中男性比女性更关注地铁1号线全线开通B.样本中多数女性是35岁以上C.样本中35岁以下的男性人数比35岁以上的女性人数多D.样本中35岁以上的人对地铁1号线的开通关注度更高解析:选C设等高条形图对应2×2列联表如下:35岁以上35岁以下总计男性 a c a+c女性 b d b+d总计a+b c+d a+b+c+d根据第1个等高条形图可知,35岁以上男性比35岁以上女性多,即a>b;35岁以下男性比35岁以下女性多,即c>d.根据第2个等高条形图可知,男性中35岁以上的比35岁以下的多,即a>c;女性中35岁以下的比35岁以下的多,即b>d.对于A,男性人数为a+c,女性人数为b+d,因为a>b,c>d,所以a+c>b+d,所以A正确;对于B,35岁以上女性人数为b,35岁以下女性人数为d,因为b>d,所以B正确;对于C,35岁以下男性人数为c,35岁以上女性人数为b,无法从图中直接判断b与c的大小关系,所以C不一定正确;对于D,35岁以上的人数为a+b,35岁以下的人数为c+d,因为a>c,b>d,所以a+b>c +d,所以D正确.故选C.8.(2019·承德期末)某城市收集并整理了该市2018年1月份至10月份各月最低气温与最高气温(单位:℃)的数据,绘制了下面的折线图.已知该城市各月的最低气温与最高气温具有较好的线性关系,则根据折线图,下列结论错误的是()A.最低气温与最高气温为正相关B.10月的最高气温不低于5月的最高气温C.月温差(最高气温减最低气温)的最大值出现在1月D.最低气温低于0 ℃的月份有4个解析:选D在A中,最低气温与最高气温为正相关,故A正确;在B中,10月的最高气温不低于5月的最高气温,故B 正确;在C 中,月温差(最高气温减最低气温)的最大值出现在1月,故C 正确;在D 中,最低气温低于0 ℃的月份有3个,故D 错误.故选D.9.(2019·福州市第一学期抽测)随着我国中医学的发展,药用昆虫的使用相应愈来愈多.每年春暖以后至寒冬前,昆虫大量活动与繁殖,易于采集各种药用昆虫.已知一只药用昆虫的产卵数y (单位:个)与一定范围内的温度x (单位:℃)有关,于是科研人员在3月份的31天中随机挑选了5天进行研究,现收集了该种药用昆虫的5组观测数据如下表:(1)从这5m ,n 均不小于25”的概率;(2)科研人员确定的研究方案是:先从这5组数据中任选2组,用剩下的3组数据建立y 关于x 的线性回归方程,再对被选取的2组数据进行检验.①若选取的是3月2日与30日这2组的数据,请根据3月7日、15日和22日这3组的数据,求出y 关于x 的线性回归方程;②若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2个,则认为得到的线性回归方程是可靠的,试问①中所得的线性回归方程是否可靠?附:回归直线的斜率和截距的最小二乘估计公式分别为b ^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2,a ^=y-b ^x .解:(1)依题意得,m ,n 的所有情况有{23,25},{23,30},{23,26},{23,16},{25,30},{25,26},{25,16},{30,26},{30,16},{26,16},共10个.设“m ,n 均不小于25”为事件A ,则事件A 包含的所有情况有 {25,30},{25,26},{30,26},共3个,所以P (A )=310,故事件“m ,n 均不小于25”的概率为310.(2)①由已知数据得x =12,y =27,∑i =13 (x i -x )(y i -y )=5,∑i =13(x i -x )2=2,所以b ^=∑i =13(x i -x )(y i -y )∑i =13(x i -x )2=52, a ^=y -52x =27-52×12=-3.所以y 关于x 的线性回归方程为y ^=52x -3.②由①知,y 关于x 的线性回归方程为y ^=52x -3.当x =10时,y ^=52×10-3=22,|22-23|<2,当x =8时,y ^=52×8-3=17,|17-16|<2.所以①中所得的线性回归方程y ^=52x -3是可靠的.C 级——拔高创新练10.(2019·南昌市第一次模拟测试)为推进“千村百镇计划”,2018年4月某新能源公司开展“绿色出行”活动,首批投放200台P 型新能源车到某市多个村镇,供当地村民免费试用三个月.试用到期后,为了解男女试用者对P 型新能源车性能的评价情况,该公司要求每位试用者填写一份性能综合评分表(满分为100分).最后该公司共收回600份评分表,现从中随机抽取40份(其中男、女的评分表各20份)作为样本,经统计得到如下茎叶图:(1)求40个样本数据的中位数m .(2)已知40个样本数据的平均数a =80,记m 与a 的最大值为M .该公司规定样本中试用者的“认定类型”:评分不小于M 的为“满意型”,评分小于M 的为“需改进型”.①请根据40个样本数据,完成下面2×2列联表:认定类型性别满意型需改进型总计根据2×2列联表判断能否有99%的把握认为“认定类型”与性别有关?②为做好车辆改进工作,公司先从样本“需改进型”的试用者中按性别用分层抽样的方法,从中抽取8人进行回访.根据回访意见改进车辆后,再从这8人中随机抽取3人进行二次试用,记这3人中男性人数为X ,求X 的分布列及数学期望.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )解:(1)由茎叶图知m =80+822=81.(2)因为m =81,a =80,所以M =81.①由茎叶图知,女性试用者评分不小于81的有15个,男性试用者评分不小于81的有5个,根据题意得如下2×2列联表:则K 2=40×(15×15-5×5)220×20×20×20=10>6.635,查表得P (K 2≥6.635)≈0.010,所以有99%的把握认为“认定类型”与性别有关.②由①知,从样本“需改进型”的试用者中按性别用分层抽样的方法抽出女性2名,男性6名.X 的所有可能取值为1,2,3,则P (X =1)=C 22C 16C 38=656=328,P (X =2)=C 12C 26C 38=3056=1528,P (X =3)=C 02C 36C 38=2056=514,所以X 的分布列为所以X 的数学期望E (X )=1×328+2×1528+3×514=94.。

2022高考数学一轮复习课时规范练51变量间的相关关系统计案例文含解析新人教A版

2022高考数学一轮复习课时规范练51变量间的相关关系统计案例文含解析新人教A版

课时规范练51 变量间的相关关系、统计案例基础巩固组1.相关变量的样本数据如下表,经回归分析可得y与x线性相关,并由最小二乘法求得回归直线方程为y^=0.5x+2.3,下列说法正确的是()A.x增加1时,y一定增加2.3B.变量x与y负相关C.当y为6.3时,x一定是8D.a=5.22.(2020宁夏银川一中高三检测)为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表,附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)参照附表,得到的正确结论是()A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”3.某产品近期销售情况如下表,根据上表可得回归方程为y ^=b ^x+13.8,据此估计,该公司8月份该产品的销售额为( )A.19.05B.19.25C.19.5D.19.8 4.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据.由表中数据求得线性回归方程y ^=-4x+a ^,则当x=10元时,预测销量为 件.5.(2020全国3,文18)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),.综合提升组6.已知具有线性相关的变量x ,y ,设其样本点为A i (x i ,y i )(i=1,2,…,8),回归直线方程为y ^=12x+a ^,若OA 1⃗⃗⃗⃗⃗⃗⃗⃗ +OA 2⃗⃗⃗⃗⃗⃗⃗⃗ +…+OA 8⃗⃗⃗⃗⃗⃗⃗⃗ =(6,2)(O 为原点),则a ^=( )A.18B.-18C.14D.-14 7.(2020全国2,文18)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i=1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑i=120x i =60,∑i=120y i =1 200,∑i=120(x i -。

(福建专用)高考数学一轮复习 课时规范练54 变量间的相关关系、统计案例 理 新人教A版-新人教A版

(福建专用)高考数学一轮复习 课时规范练54 变量间的相关关系、统计案例 理 新人教A版-新人教A版

课时规X练54 变量间的相关关系、统计案例一、基础巩固组1.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心()C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg2.根据如下样本数据:x 3 4 5 6 7 8y4.0 2.5 -0.5 0.5 -2.0 -3.0得到的回归方程为x+,则()A.>0,>0B.>0,<0C.<0,>0D.<0,<03.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若K2的观测值为6.635,则在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系,因此在100个吸烟的人中必有99个患有肺病B.由独立性检验知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系时,我们说某人吸烟,则他有99%的可能患肺病C.若在统计量中求出在犯错误的概率不超过0.05的前提下认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D.以上三种说法都不正确〚导学号21500769〛4.两个随机变量x,y的取值如下表:x0 1 3 4y2.2 4.3 4.8 6.7若x,y具有线性相关关系,且x+2.6,则下列结论错误的是()A.x与y是正相关B.当x=6时,y的估计值为8.3C.x每增加一个单位,y大约增加0.95个单位D.样本点(3,4.8)的残差为0.565.2017年春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居做不到“光盘”能做到“光盘”男45 10女30 15则下面的结论正确的是()A.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别有关”D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关”6.(2017某某潍坊二模,理12)某公司未来对一种新产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x/元 4 5 6 7 8 9销量y/件90 84 83 80 75 68由表中数据,求得线性回归方程为=-4x+,当产品销量为76件时,产品定价大致为元.7.从某居民区随机抽取10个家庭,获得第i个家庭的月收入x i(单位:千元)与月储蓄y i(单位:千元)的数据资料,算得x i=80,y i=20,x i y i=184,=720.(1)求家庭的月储蓄对月收入x的线性回归方程x+;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.〚导学号21500770〛二、综合提升组8.通过随机询问110名性别不同的学生是否爱好某项运动,得到如下的列联表:男女总计爱好40 20 60不爱好20 30 50总计60 50 110附表:P(K2≥k0) 0.050 0.010 0.001k03.841 6.635 10.828参照附表,得到的正确结论是()A.在犯错误的概率不超过0.01的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.01的前提下,认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.001的前提下,认为“爱好该项运动与性别无关”9.已知x与y之间的几组数据如下表:x 1 2 3 4 5 6y0 2 1 3 3 4假设根据上表数据所得线性回归直线方程x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',则以下结论正确的是()A.>b',>a'B.>b',<a'C.<b',>a'D.<b',<a'10.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为 cm.11.(2017某某某某第三中学模拟)为推行“新课堂”教学法,某化学老师分别用传统教学和“新课堂”两种不同的教学方式,在甲、乙两个平行班进行教学实验,为了解教学效果,期中考试后,分别从两个班级中各随机抽取20名学生的成绩进行统计,作出的茎叶图如下图,记成绩不低于70分者为“成绩优良”.(1)分别计算甲、乙两班20个样本中,化学成绩前十的平均分,并据此判断哪种教学方式的教学效果更佳;(2)由以上统计数据填写下面2×2列联表,并判断能否在犯错误的概率不超过0.05的前提下认为“成绩优良与教学方式有关”?甲班乙班总计成绩优良成绩不优良总计附:K2=(n=a+b+c+d).独立性检验临界值表:P(K2≥k 0) 0.10.050.0250.010k02.7063.8415.0246.635〚导学号21500771〛12.年份2011 2012 2013 2014 2015 2016 2017年份代号t 1 2 3 4 5 6 7人均纯收入y2.9 3.3 3.6 4.4 4.8 5.2 5.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2011年至2017年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2019年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:.三、创新应用组13.某地10户家庭的年收入和年饮食支出的统计资料如表所示:年收入x/万元 2 4 4 6 6 6 7 7 8 10年饮食支出y/万元0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3(1)根据表中数据,确定家庭的年收入和年饮食支出的相关关系;(2)如果某家庭年收入为9万元,预测其年饮食支出.14.(2017某某某某一模)某单位N名员工参加“我爱阅读”活动,他们的年龄在25岁至50岁之间,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.区间[25,30) [30,35) [35,40) [40,45) [45,50]人数28 a b(1)求正整数a,b,N的值;(2)现要从年龄低于40岁的员工中用分层抽样的方法抽取42人,则年龄在第1,2,3组的员工分别抽多少?(3)为了了解该单位员工的阅读习惯,对第1,2,3组中抽出的42人是否喜欢阅读国学类书籍进行了调查,喜欢阅读国学类不喜欢阅读国学类合计男16 4 20女8 14 22合计24 18 42根据表中数据,能否在犯错误的概率不超过0.5%的前提下认为该单位员工“是否喜欢阅读国学类书籍和性别有关系”?附:K2=P(K2≥k0) 0.05 0.025 0.010 0.005 0.001k03.841 5.024 6.635 7.879 10.828〚导学号21500772〛课时规X练54变量间的相关关系、统计案例1.D由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确;又线性回归方程必过样本点中心(),因此B正确;由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故C正确;当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此D不正确.2.B由题表中数据画出散点图,如图,由散点图可知<0,>0,故选B.3.C独立性检验只表明两个分类变量的相关程度,而不是事件是否发生的概率估计.4.D由表格中的数据可知选项A正确;(0+1+3+4)=2,(2.2+4.3+4.8+6.7)=4.5,∴4.5=2+2.6,解得=0.95,=0.95x+2.6.当x=6时,=0.95×6+2.6=8.3,故选项B正确;由=0.95+2.6可知选项C正确;当x=3时,=0.95×3+2.6=5.45,残差是5.45-4.8=0.65,故选项D错误.5.A由2×2列联表得到a=45,b=10,c=30,d=15,则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,计算得K2的观测值k=3.030.因为3.030>2.706,所以在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”,故选A.6.7.5=6.5,=80,=80-(-4)×6.5,解得=106,∴回归方程为=-4x+106.当y=76时,76=-4x+106,∴x=7.5,故答案为7.5.7.解 (1)由题意知n=10,x i==8,y i==2,又=720-10×82=80,x i y i-10=184-10×8×2=24,由此得=0.3,=2-0.3×8=-0.4,故所求线性回归方程为=0.3x-0.4.(2)由于变量y的值随x值的增加而增加(=0.3>0),因此x与y之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为=0.3×7-0.4=1.7(千元).8.A依题意,由K2=,得K2=7.8>6.635.所以在犯错误的概率不超过0.01的前提下,认为“爱好该项运动与性别有关”,故选A.9.C由题意可知,b'=2,a'=-2,=-,故<b',>a',故选C.10.185由题意,得父亲身高x cm与儿子身高y cm对应关系如下表:x173 170 176y170 176 182则=173,=176,(x i-)(y i-)=(173-173)×(170-176)+(170-173)×(176-176)+(176-173)×(182-176)=18, (x i-)2=(173-173)2+(170-173)2+(176-173)2=18.=1=176-173=3.∴线性回归直线方程x+=x+3.∴可估计孙子身高为182+3=185(cm).11.解 (1)甲班化学成绩前十的平均分(72+74+74+79+79+80+81+85+89+96)=80.9;乙班化学成绩前十的平均分(78+80+81+85+86+93+96+97+99+99)=89.4.,∴大致可以判断新课堂教学的教学效果更佳.(2)甲班乙班总计成绩优良10 16 26成绩不优良10 4 14总计20 20 40根据2×2列联表中的数据,得K2的观测值为k=3.956>3.841,∴能在犯错误的概率不超过0.05的前提下认为“成绩优良与教学方式有关”.12.解 (1)由所给数据计算得(1+2+3+4+5+6+7)=4,(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,(t i-)2=9+4+1+0+1+4+9=28,(t i-)(y i-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,=0.5,=4.3-0.5×4=2.3,所求回归方程为=0.5t+2.3.(2)由(1)知,=0.5>0,故2011年至2017年该地区农村居民家庭人均纯收入逐年增加,平均每年约增加0.5千元.将2019年的年份代号t=9代入(1)中的回归方程,得=0.5×9+2.3=6.8,故预测该地区2019年农村居民家庭人均纯收入为6.8千元.13.解 (1)由题意,得年收入x为解释变量,年饮食支出y为预报变量,作散点图如图.从图中可以看出,样本点呈条状分布,年收入和年饮食支出有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.因为=6,=1.83,=406,x i y i=117.7,所以0.172,x≈1.83-0.172×6=0.798.从而得到线性回归方程为=0.172x+0.798.(2)=0.172×9+0.798=2.346(万元).所以某家庭年收入为9万元时,可以预测其年饮食支出为2.346万元.14.解 (1)总人数N==280,a=280×0.02×5=28.第3组的频率是1-5×(0.02+0.02+0.06+0.02)=0.4,所以b=280×0.4=112.(2)因为年龄低于40岁的员工在第1,2,3组,共有28+28+112=168(人),利用分层抽样在168人中抽取42人,每组抽取的人数分别为:第1组抽取的人数为28=7(人),第2组抽取的人数为28=7(人),第3组抽取的人数为112=28(人),所以第1,2,3组分别抽7人、7人、28人.(3)假设H0:“是否喜欢阅读国学类书籍和性别无关系”,根据表中数据,求得K2的观测值k=8.145>7.879.从而能在犯错误的概率不超过0.5%的前提下,认为该单位的员工“是否喜欢阅读国学类书籍和性别有关系”.。

高考数学 103变量间的相关关系、统计案例领航规范训练 文 新人教A版

高考数学 103变量间的相关关系、统计案例领航规范训练 文 新人教A版

高考数学 103变量间的相关关系、统计案例领航规范训练文新人教A版【A级】基础训练1.(2011·高考江西卷)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )A.r2<r1<0 B.0<r2<r1C.r2<0<r1D.r2=r1解析:画散点图,由散点图可知X与Y是正相关,则相关系数r1>0,U与V是负相关,相关系数r2<0,故选C.答案:C2.(2011·高考陕西卷)设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )A.x和y的相关系数为直线l的斜率B.x和y的相关系数在0到1之间C.当n为偶数时,分布在l两侧的样本点的个数一定相同D.直线l过点(x,y)解析:x和y的相关系数表示x与y之间的线性相关程度,不表示直线l的斜率,A错;x和y的相关系数在-1到1之间,B错;当n为偶数时,分布在l两侧的样本点的个数不一定相同,C错;直线l过样本点中心(x,y),D正确,故选D.答案:D3.(2012·高考课标全国卷)在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( ) A .-1 B .0 C.12D .1解析:所有点均在直线上,则样本相关系数最大即为1,故选D. 答案:D4.(2013·河南模拟)已知回归方程y ^=4.4x +838.19,则可估计x 与y 的增长速度之比约为________.解析:x 每增长1个单位,y 增长4.4个单位,故增长的速度之比约为1∶4.4=5∶22,事实上所求的比值为回归直线方程斜率的倒数. 答案:5∶225.(2011·高考辽宁卷)调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元. 解析:解法一:特殊值法. 令x 1=1得y ^1=0.254+0.321.令x 2=1+1=2得y ^2=2×0.254+0.321. y ^2-y ^1=0.254.解法二:由y ^1=0.254x 1+0.321, y ^2=0.254(x 1+1)+0.321,则y ^2-y ^1=0.254.答案:0.2546.(2013·赤壁模拟)已知x ,y 的取值如表所示:x 0 1 3 4 y2.24.34.86.7从散点图分析y 与x 线性相关,且y =0.95x +a ,则a =________. 解析:x =2,y =92,∴92=0.95×2+a ,则a =2.6.答案:2.67.(2013·山东聊城模拟)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:日期 12月1日 12月2日 12月3日 12月4日 12月5日温度X (℃)101113128发芽数 (y 颗)23 25 30 26 16该农科所确定的研究方案是:先从这5组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y =bx +a ;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠? 解:(1)设事件A 表示“选取的2组数据恰好是不相邻2天的数据”,则A 表示“选取的2组数据恰好是相邻2天的数据”.从5组数据中选取2组的基本事件总数为10,事件A 包含的基本事件数为4. ∴P (A )=410=25,∴P (A )=1-P (A )=35.(2)x =12,y =27,∑3i =1x i y i =977,∑3i =1x 2i =434,∴b =∑3i =1x i y i -3x y ∑3i =1x 2i -3x2=977-3×12×27434-3×122=2.5, a =y -b x =27-2.5×12=-3,∴y =2.5x -3.(3)由(2)知:当x =10时,y =22,误差不超过2颗; 当x =8时,y =17,误差不超过2颗. 故所求得的线性回归方程是可靠的.8.(2013·湖南衡阳第二次联考)衡阳市第一次联考后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀, 120分以下为非优秀.统计成绩后,得到如下的2×2列联表,且已知在甲、乙两个文科班全部110人中随机抽取1人为优秀的概率为311.优秀 非优秀 合计 甲班 10乙班 30合计110(1)请完成上面的列联表;(2)根据列表中的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”; (3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到9号或10号的概率. 参考公式与临界值表:K 2=n ad -bc 2a +bc +d a +cb +dP (K 2≥k 0)0.100 0.050 0.025 0.010 0.001 k 02.7063.8415.0246.63510.828解:(1)优秀 非优秀 合计 甲班 10 50 60 乙班 20 30 50 合计3080110(2)根据列联表中的数据,得到 K 2=110×10×30-20×50260×50×30×80≈7.486<10.828.因此按99.9%的可靠性要求,不能认为“成绩与班级有关系.”(3)设“抽到9号或10号”为事件A ,先后两次抛掷一枚均匀的骰子,出现的点数为(x ,y ).所有的基本事件有:(1,1)、(1,2)、(1,3)、…、(6,6),共36个.事件A 包含的基本事件有:(3,6)、(4,5)、(5,4)、(6,3)、(5,5)、(4,6)、(6,4),共7个.所以P (A )=736,即抽到9号或10号的概率为736.【B 级】 能力提升1.(2013·湖南衡阳第二次联考)已知x 与y 之间的一组数据:x 0 1 2 3 y1357则关于y 与x 的线性回归方程y =bx +a 必过定点( ) A .(2,2) B .(1.5,0) C .(1,2)D .(1.5,4)解析:回归方程必过样本中心点(x ,y ),故选D. 答案:D2.(2013·山东潍坊二模)为了普及环保知识,增强环保意识,某大学从理工类专业的A 班和文史类专业的B 班各抽取20名同学参加环保知识测试.统计得到成绩与专业的列联表:优秀 非优秀 总计 A 班 14 6 20 B 班7 13 20 总计211940附:参考公式及数据: (1)卡方统计量:K 2=n n 11n 22-n 12n 212n 11+n 12n 21+n 22n 11+n 21n 12+n 22(其中n =n 11+n 12+n 21+n 22);(2)独立性检验的临界值表:P (K 2≥k 0)0.050 0.010 k 03.8416.635则下列说法正确的是( )A .有99%的把握认为环保知识测试成绩与专业有关B .有99%的把握认为环保知识测试成绩与专业无关C .有95%的把握认为环保知识测试成绩与专业有关D .有95%的把握认为环保知识测试成绩与专业无关 解析:K 2=40×14×13-7×6220×20×21×19=28057≈4.912, 3.841<K 2<6.635,所以有95%的把握认为环保知识测试成绩与专业有关. 答案:C3.鲁北化工厂为预测某产品的回收率y ,需要研究它和原料的有效成分含量x 之间的相关关系.现取了8对观测值,经计算得:∑8i =1x i =52,∑8i =1y i =228,∑8i =1x 2i =478,∑8i =1x i y i=1849,则y 与x 的回归方程为( ) A.y ^=2.62x +11.47 B.y ^=2.62x -11.47 C.y ^=11.47x +2.62D.y ^=-2.62x +11.47解析:将所给数据代入公式可计算出a ^,b ^的值分别约为11.47和2.62,再代入y ^=b ^x +a ^可得.故选A.答案:A4.(2012·宁夏吴忠模拟)某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温(℃) 18 13 10 -1 用电量(度)24343864由表中数据得线性回归方程y ^=bx +a 中b =-2,预测当气温为-4 ℃时,用电量的度数约为________.解析:x =10,y =40 ,回归方程过点(x ,y ), ∴40=-2×10+a . ∴a =60,∴y ^=-2x +60.令x =-4,∴y ^=(-2)×(-4)+60=68. 答案:685.(2013·山东聊城模拟)第二十届世界石油大会将于2011年12月4日—8日在卡塔尔首都举行,能源问题已经成为全球关注的焦点.某工厂经过技术改造后,降低了能源消耗,经统计该厂某种产品的产量x (单位:吨)与相应的生产能耗y (单位:吨)有如下几组样本数据:x 3 4 5 6 y2.5344.5根据相关性检验,这组样本数据具有线性相关关系,通过线性回归分析,求得回归直线的斜率为0.7.已知该产品的年产量为10吨,则该工厂每年大约消耗的汽油为______吨.解析:由题知,x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5,故样本数据的中心点为A (4.5,3.5).设回归直线方程为y =0.7x +b ,将中心点坐标代入得:3.5=0.7×4.5+b ,解得b =0.35,故回归直线方程为y =0.7x +0.35,所以当x =10时,y =0.7×10+0.35=7.35,即该工厂每年大约消耗的汽油为7.35吨. 答案:7.356.(2013·郑州联考)对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过 心脏病 未发作过 心脏病 合计 心脏搭桥手术 39 157 196 血管清障手术29 167 196 合计68324392试根据上述数据计算K 2=________.比较这两种手术对病人又发作心脏病的影响有没有差别,________________________________________________________________________ ________________________________________________________________________. 解析:提出假设H 0:两种手术对病人又发作心脏病的影响没有差别.根据列联表中的数据,可以求得K 2=392×39×167-29×157268×324×196×196≈1.78.当H 0成立时K 2≈1.78,而K 2<2.072的概率为0.85.所以,不能否定假设H 0.也就是不能作出这两种手术对病人又发作心脏病的影响有差别的结论.答案:1.78 不能作出这两种手术对病人又发作心脏病的影响有差别的结论7.(2013·广东惠州模拟)甲、乙两所学校高三年级分别有1 200人,1 000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下: 甲校:分组 [70,80) [80,90) [90,100)[100,110)频数 34815分组 [110,120) [120,130) [130,140) [140,150]频数15x 3 2乙校:分组[70,80)[80,90)[90,100)[100,110)频数 1 2 8 9分组 [110,120) [120,130) [130,140) [140,150]频数1010y 3(1)计算x ,y 的值;(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率; (3)由以上统计数据填写下面2×2列联表,并判断是否有90%的把握认为两所学校的数学成绩有差异.甲校 乙校 总计优秀 非优秀 总计参考数据与公式: 由列联表中数据计算K 2=n ad -bc 2a +bc +d a +cb +d;临界值表P (K 2≥k 0)0.10 0.05 0.010 k 02.7063.8416.635解:(1)甲校抽取110×1 2002 200=60(人),乙校抽取110×1 0002 200=50(人),故x =10,y =7.(2)估计甲校优秀率为1560=25%,乙校优秀率为2050=40%.(3)表格填空:甲校 乙校 总计 优秀 15 20 35 非优秀 45 30 75 总计6050110K 2=110×15×30-20×45260×50×35×75≈2. 83>2.706,又因为1-0.10=0.9,故有90%的把握认为两个学校的数学成绩有差异.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

课时规范练50 变量间的相关关系、统计案例基础巩固组1、设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0、85x-85、71,则下列结论不正确的是()A、y与x具有正的线性相关关系B、回归直线过样本点的中心()C、若该大学某女生身高增加1 cm,则其体重约增加0、85 kgD、若该大学某女生身高为170 cm,则可断定其体重必为58、79 kg2、根据如下样本数据:得到的回归方程为x+,则()A、>0,>0B、>0,<0C、<0,>0D、<0,<03、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A、若K2的观测值为6、635,则在犯错误的概率不超过0、01的前提下认为吸烟与患肺病有关系,因此在100个吸烟的人中必有99个患有肺病B、由独立性检验知,在犯错误的概率不超过0、01的前提下认为吸烟与患肺病有关系时,我们说某人吸烟,则他有99%的可能患肺病C、若在统计量中求出在犯错误的概率不超过0、05的前提下认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D、以上三种说法都不正确4、两个随机变量x,y的取值如下表:若x,y具有线性相关关系,且x+2、6,则下列结论错误的是()A、x与y是正相关B、当x=6时,y的估计值为8、3C、x每增加一个单位,y大约增加0、95个单位D、样本点(3,4、8)的残差为0、565、2016年春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:则下面的结论正确的是()A、在犯错误的概率不超过0、1的前提下,认为“该市居民能否做到‘光盘’与性别有关”B、在犯错误的概率不超过0、01的前提下,认为“该市居民能否做到‘光盘’与性别无关”C、在犯错误的概率不超过0、01的前提下,认为“该市居民能否做到‘光盘’与性别有关”D、在犯错误的概率不超过0、1的前提下,认为“该市居民能否做到‘光盘’与性别无关”6、(2017山东潍坊二模,文12)某公司未来对一种新产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价4 5 6 7 8 9x/元销量y/件9848387568由表中数据,求得线性回归方程为=-4x+,当产品销量为76件时,产品定价大致为元、7、从某居民区随机抽取10个家庭,获得第i个家庭的月收入x i(单位:千元)与月储蓄y i(单位:千元)的数据资料,算得x i=80,y i=20,x i y i=184,=720、(1)求家庭的月储蓄对月收入x的线性回归方程x+;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄、〚导学号24190950〛综合提升组8、通过随机询问110名性别不同的学生是否爱好某项运动,得到如下的列联表:附表:参照附表,得到的正确结论是()A、在犯错误的概率不超过0、01的前提下,认为“爱好该项运动与性别有关”B、在犯错误的概率不超过0、01的前提下,认为“爱好该项运动与性别无关”C、在犯错误的概率不超过0、001的前提下,认为“爱好该项运动与性别有关”D、在犯错误的概率不超过0、001的前提下,认为“爱好该项运动与性别无关”9、已知x与y之间的几组数据如下表:假设根据上表数据所得线性回归直线方程x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',则以下结论正确的是()A、>b',>a'B、>b',<a'C、<b',>a'D、<b',<a'10、某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm、因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为 cm、11、(2017宁夏石嘴山第三中学模拟,文18)为推行“新课堂”教学法,某化学老师分别用传统教学和“新课堂”两种不同的教学方式,在甲、乙两个平行班进行教学实验,为了解教学效果,期中考试后,分别从两个班级中各随机抽取20名学生的成绩进行统计,作出的茎叶图如下图,记成绩不低于70分者为“成绩优良”、(1)分别计算甲、乙两班20个样本中,化学成绩前十的平均分,并据此判断哪种教学方式的教学效果更佳;(2)由以上统计数据填写下面2×2列联表,并判断能否在犯错误的概率不超过0、05的前提下认为“成绩优良与教学方式有关”?附:K 2=(n=a+b+c+d )、独立性检验临界值表:P (K2≥k 0)0、10 0、05 0、020、0112、某贫困地区2011年至2017年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年20202020202020(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2011年至2017年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2019年农村居民家庭人均纯收入、附:回归直线的斜率和截距的最小二乘估计公式分别为:、〚导学号24190951〛创新应用组13、某同学进行寒假社会实践活动,为了对白天平均气温与某奶茶店的某种饮料销量之间的关系进行分析研究,他分别记录了1月11日至1月15日的白天平均气温x(单位:℃)与该奶茶店的这种饮料销量y(单位:杯),得到如下数据:(1)若先从这5组数据中抽出2组,求抽出的2组数据恰好是相邻两天数据的概率;(2)请根据所给5组数据,求出y关于x的线性回归方程x+;并根据线性回归方程预测当气象台预报1月16日的白天平均气温为7 ℃时该奶茶店这种饮料的销量、附:线性回归方程x+中,其中为样本平均值、14、(2017福建南平一模,文18)某单位N 名员工参加“我爱阅读”活动,他们的年龄在25岁至50岁之间,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示、 下面是年龄的分布表(1)求正整数a ,b ,N的值;(2)现要从年龄低于40岁的员工中用分层抽样的方法抽取42人,则年龄在第1,2,3组的员工分别抽多少?(3)为了了解该单位员工的阅读习惯,对第1,2,3组中抽出的42人是否喜欢阅读国学类书籍进行了调查,调查结果如下表所示:(单位:人)根据表中数据,能否在犯错误的概率不超过0、5%的前提下认为该单位员工“是否喜欢阅读国学类书籍和性别有关系”?附:K2=、答案:1、D由于线性回归方程中x的系数为0、85,因此y与x具有正的线性相关关系,故A正确;又线性回归方程必过样本点中心(),因此B正确;由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0、85 kg,故C正确;当某女生的身高为170 cm时,其体重估计值是58、79 kg,而不是具体值,因此D不正确、2、B由题表中数据画出散点图,如图,由散点图可知<0,>0,故选B、3、C独立性检验只表明两个分类变量的相关程度,而不是事件是否发生的概率估计、4、D由表格中的数据可知选项A正确;∵(0+1+3+4)=2,(2、2+4、3+4、8+6、7)=4、5,∴4、5=2+2、6,解得=0、95,∴=0、95x+2、6、当x=6时,=0、95×6+2、6=8、3,故选项B正确;由=0、95+2、6可知选项C正确;当x=3时,=0、95×3+2、6=5、45,残差是5、45-4、8=0、65,故选项D错误、5、A由2×2列联表得到a=45,b=10,c=30,d=15,则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,计算得K2的观测值k=≈3、030、因为3、030>2、706,所以在犯错误的概率不超过0、1的前提下,认为“该市居民能否做到‘光盘’与性别有关”,故选A、6、7、5∵=6、5,=80,∴=80-(-4)×6、5,解得=106,∴回归方程为=-4x+106、当y=76时,76=-4x+106,∴x=7、5,故答案为7、5、7、解 (1)由题意知n=10,x i==8,y i==2,又-10=720-10×82=80,x i y i-10=184-10×8×2=24,由此得=0、3,=2-0、3×8=-0、4,故所求线性回归方程为=0、3x-0、4、(2)由于变量y的值随x值的增加而增加(=0、3>0),因此x与y 之间是正相关、(3)将x=7代入回归方程可以预测该家庭的月储蓄为=0、3×7-0、4=1、7(千元)、8、A依题意,由K2=,得K2=≈7、8>6、635,所以在犯错误的概率不超过0、01的前提下,认为“爱好该项运动与性别有关”,故选A、9、C由题意可知,b'=2,a'=-2,、=-,故<b',>a',故选C、10、185由题意,得父亲身高x cm与儿子身高y cm对应关系如下表:则=173,=176,(x i-)(y i-)=(173-173)×(170-176)+(170-173)×(176-176)+(176-173)×(182-176)=18,(x i-)2=(173-173)2+(170-173)2+(176-173)2=18、∴=1、∴=176-173=3、∴线性回归直线方程x+=x+3、∴可估计孙子身高为182+3=185(cm)、11、解 (1)甲班化学成绩前十的平均分(72+74+74+79+79+80+81+85+89+96)=80、9;乙班化学成绩前十的平均分(78+80+81+85+86+93+96+97+99+99)=89、4、∵,∴大致可以判断新课堂教学的教学效果更佳、(2)根据2×2列联表中的数据,得K2的观测值为k=≈3、956>3、841,∴能在犯错误的概率不超过0、05的前提下认为“成绩优良与教学方式有关”、12、解 (1)由所给数据计算得(1+2+3+4+5+6+7)=4,(2、9+3、3+3、6+4、4+4、8+5、2+5、9)=4、3,(t i-)2=9+4+1+0+1+4+9=28,(t i-)(y i-)=(-3)×(-1、4)+(-2)×(-1)+(-1)×(-0、7)+0×0、1+1×0、5+2×0、9+3×1、6=14,=0、5,=4、3-0、5×4=2、3,所求回归方程为=0、5t+2、3、(2)由(1)知,=0、5>0,故2011年至2017年该地区农村居民家庭人均纯收入逐年增加,平均每年约增加0、5千元、将2019年的年份代号t=9代入(1)中的回归方程,得=0、5×9+2、3=6、8,故预测该地区2019年农村居民家庭人均纯收入为6、8千元、13、解 (1)设“选取的2组数据恰好是相邻两天数据”为事件A,∵所有基本事件(m,n)(其中m,n为1月11日至1月15日的日期数)有10个,事件A包括的基本事件有(11,12),(12,13),(13,14),(14,15),共4个,∴抽出的2组数据恰好是相邻两天数据的概率P(A)=、(2)∵=10,=25、∴由公式,求得=2、1,=4,∴y关于x的线性回归方程为=2、1x+4、当x=7时,=2、1×7+4=18、7,故该奶茶店这种饮料的销量大约为19杯(或18杯)、14、解 (1)总人数N==280,a=280×0、02×5=28、第3组的频率是1-5×(0、02+0、02+0、06+0、02)=0、4,所以b=280×0、4=112、(2)因为年龄低于40岁的员工在第1,2,3组,共有28+28+112=168(人),利用分层抽样在168人中抽取42人,每组抽取的人数分别为:第1组抽取的人数为28×=7(人),第2组抽取的人数为28×=7(人),第3组抽取的人数为112×=28(人),所以第1,2,3组分别抽7人、7人、28人、(3)假设H0:“是否喜欢阅读国学类书籍和性别无关系”,根据表中数据,求得K2的观测值k=≈8、145>7、879、从而能在犯错误的概率不超过0、5%的前提下,认为该单位的员工“是否喜欢阅读国学类书籍和性别有关系”、。

相关文档
最新文档