2017-2018学年人教b版选修2-3统计案例单元测试 (2)

合集下载

高中数学(人教,选修2-3)第三章《统计案例》测试题B卷.docx

高中数学(人教,选修2-3)第三章《统计案例》测试题B卷.docx

高中数学学习材料马鸣风萧萧*整理制作高中数学选修2-3第三章《统计案例》测试题B 卷考试时间:100分钟,满分:150分一、选择题:在每小题给出的四个选项中,只有一项是符合题目要求的,请把正确答案的代号填在题后的括号内(每小题5分,共50分)1.已知一个线性回归方程为ˆy=1.5x +45(x i ∈{1,7,5,13,19}),则y =( ) A .58.5 B .58.6 C .58 D .57.52.对有线性相关关系的两个变量建立的回归直线方程 ˆˆˆya bx =+中,回归系数ˆb ( ) A .能等于0 B .小于0 C .可以小于0D .只能等于03.能表示n 个点与相应直线在整体上的接近程度的是( )A.1()ni i y i =-∑ B 1()ni i i y =-∑ C.21()nii y i =-∑ D.21()nii yy =-∑4.通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110由K 2=2()()()()()n ad bc a b c d a c b d -++++算得K 2=2110(40302030)7.860506050⨯⨯-⨯≈⨯⨯⨯附表:2()P K k ≥0.050 0.010 0.001 k3.8416.63510.828参照附表,得到的正确结论是( )A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”5..已知变量x ,y 之间具有线性相关关系,其回归方程为y ^=-3+bx ,若∑i =110x i =17,∑i =110y i =4,则b 的值为( )A .2B .1C .-2D .-16.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:冷漠 不冷漠 总计 多看电视 68 42 110 少看电视 20 38 58 总计8880168则认为多看电视与人冷漠有关系的把握大约为 ( ) A .90%B .97.5%C .95%D .99.9%7.在一次试验中,测得(x ,y )的四组值分别是A (1,2),B (2,3),C (3,4),D (4,5),则y 与x 间的线性回归方程为( )A. y ^=x +1B. y ^=x +2 C. y ^=2x +1 D . y ^=x-18.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:优秀 非优秀 总计 甲班 10 b 乙班 c 30 总计105已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 9.有下列数据x123y 3 5.99 12.01下列四个函数中,模拟效果最好的为( ) A .y =3×12x - B .y =log 2x C .y =3xD .y =x 210.已知数组(x 1,y 1),(x 2,y 2),…,(x 10,y 10)满足线性回归方程y ^=bx +a ,则“(x 0,y 0)满足线性回归方程y ^=bx +a ”是“x 0=x 1+x 2+…+x 1010,y 0=y 1+y 2+…+y 1010”的( ).A .充分不必要条件B .必要不充分条件C .充要条件D .既不充分也不必要条件二、填空题(每小题6分, 共24分) 11.关于x 与y ,有如下数据 x 2 4 5 6 8 y3040605070有如下的两个模型:5.175.6ˆ)1(+=x y,ˆ(2)717y x =+。

高中数学 第三章 统计章末综合测评 新人教B版选修2-3(2021年最新整理)

高中数学 第三章 统计章末综合测评 新人教B版选修2-3(2021年最新整理)

2017-2018学年高中数学第三章统计章末综合测评新人教B版选修2-3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2017-2018学年高中数学第三章统计章末综合测评新人教B版选修2-3)的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2017-2018学年高中数学第三章统计章末综合测评新人教B版选修2-3的全部内容。

(三)统计案例(时间:120分钟,满分:150分)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1。

下列说法中错误的是()A。

如果变量x与Y之间存在着线性相关关系,则我们根据试验数据得到的点(x i,y i)(i=1,2,…,n)将散布在某一条直线的附近B.如果两个变量x与Y之间不存在着线性关系,那么根据它们的一组数据(x i,y i)(i=1,2,…,n)不能写出一个线性方程C。

设x,Y是具有相关关系的两个变量,且Y关于x的线性回归方程为错误!=bx+a,b叫做回归系数D。

为使求出的线性回归方程有意义,可用统计检验的方法来判断变量Y与x之间是否存在线性相关关系【解析】任何一组(x i,y i)(i=1,2,…,n)都能写出一个线性方程,只是有的无意义。

【答案】B2.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x1234用水量y 4.5432。

5,其线性回归方程是错误!=-0。

7x+错误!,则错误!等于( )A.10.5 B。

5。

15C.5.2D.5.25【解析】样本点的中心为(2.5,3.5),将其代入线性回归方程可解得错误!=5.25.【答案】D3.对变量x,Y由观测数据(x i,y i)(i=1,2,…,10)得散点图1①。

人教版高中数学选修2-3统计案例2

人教版高中数学选修2-3统计案例2

选修2-3统计案例2一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.(2010·宁夏银川模拟)下表是某厂1~4月份用水量(单位:百吨)的一组数据:由散点图可知,其线性回归直线方程是y ^=-0.7x +a ,则a 等于( )A .10.5B .5.15C .5.2D .5.252.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归直线的斜率是b ,纵轴上的截距是a ,那么必有( )A .b 与r 的符号相同B .a 与r 的符号相同C .b 与r 的符号相反D .a 与r 的符号相反 3.有下列说法:①随机误差是引起预报值与真实值之间的误差的原因之一; ②残差平方和越小,预报精度越高;③在独立性检验中,通过二维条形图和三维柱形图可以粗略判断两个分类变量是否有关系.其中真命题的个数是( ) A .0 B .1 C .2D .34.有甲、乙两种钢材,从中各取等量样品检验它们的抗拉强度指标如下: 甲乙现要比较两种钢材哪一种抗拉强度较好,应考察哪项指标( ) A .期望与方差 B .正态分布 C .卡方K 2D .概率5.为调查中学生近视情况,测得某校男生150名中有80名近视,女生140名中有70名近视.在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )A .期望与方差B .排列与组合C .独立性检验D .概率6.(2009·海南宁夏理,3)对变量x ,y 观测数据(x 1,y 1)(i =1,2,…,10),得散点图1;对变量u ,v 有观测数据(u 1,v 1)(i =1,2,…,10),得散点图2.由这两个散点图可以判断.( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关7.某地2010年第一季度应聘和招聘人数排行榜前5个行业的情况列表如下:行业名称 计算机 机械 营销 物流 贸易 应聘人数2158302002501546767457065280行业名称 计算机 营销 机械 建筑 化工 招聘人数124620102935891157651670436则根据表中数据,就业形势一定是( )A .计算机行业好于化工行业B .建筑行业好于物流行业C .机械行业最紧张D .营销行业比贸易行业紧张8.工人月工资y (单位:元)关于劳动生产率x (单位:千元)的回归方程为y ^=650+80x ,下列说法中正确的个数是( )①劳动生产率为1000元时,工资约为730元;②劳动生产率提高1000元时,则工资约提高80元; ③劳动生产率提高1000元时,则工资约提高730元; ④当月工资为810元时,劳动生产率约为2000元. A .1 B .2 C .3D .49.对两个变量y 和x 进行回归分析,得到一组样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则下列说法中不正确的是( )A .由样本数据得到的回归方程为y ^=b ^x +a ^必过样本点的中心(x -,y -) B .残差平方和越小的模型,拟合的效果越好C .用相关指数R 2来刻画回归效果,R 2的值越小,说明模型的拟合效果越好D .若变量y 和x 之间的相关系数r =-0.9362,则变量y 和x 之间具有线性相关关系 10.判断两个分类变量是彼此相关还是相互独立的常用方法中,最为精确的是( ) A .三维柱形图 B .二维条形图 C .等高条形图 D .独立性检验11.在建立两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数R 2如下,其中拟合得最好的模型为( )A .模型1的相关指数R 2为0.75B .模型2的相关指数R 2为0.90C .模型3的相关指数R 2为0.25D .模型4的相关指数R 2为0.55 12.下面是某市场农产品的调查表. 市场供应量表:) A .(2.3,2.6) B .(2.4,2.6) C .(2.6,2.8)D .(2.8,2.9)二、填空题(本大题共4个小题,每小题4分,共16分,将正确答案填在题中横线上) 13.当且仅当r 满足________时,数据点(x i ,y i )(i =1,2,…,n )在一条直线上.14.已知一个回归直线方程为y ^=1.5x +45,x ∈{1,7,5,13,19},则y =__________.15.对具有线性相关关系的变量x 和y ,测得一组数据如下表.若已求得它们的回归直线方程的斜率为6.5,则这条回归直线的方程为________.16.(2010·广东文,12)某市居民2005~2009年家庭年平均收入x (单位:万元)与年平均支出Y (单位:万元)的统计资料如下表所示:出有__________线性相关关系.三、解答题(本大题共6个小题,共70分,解答应写出文字说明、证明过程或演算步骤) 17.(本题满分10分)为了调查胃病是否与生活规律有关,调查某地540名40岁以上的人得结果如下:18.(本题满分12分)一台机器可以按各种不同的速度运转,其生产的物件有一些会有问题,每小时生产有问题物件的多寡,随机器运转的速度而变化,下面表格中的数据是几次试验的结果.(1)(2)若实际生产中所允许的每小时最大问题物件数为10,那么机器的速度不得超过多少转/秒?19.(本题满分12分)在从烟台—大连的某次航运中,海上出现恶劣气候.随机调查男、女乘客在船上晕船的情况如下表所示:20.(本题满分12分)有两个分类变量X与Y,其一组观测的2×2列联表如下表.其中a,15-a均为大于5的整数,则a取何值时有90%以上的把握认为“X与Y之间有关系”?21.(本题满分12分)某超市为了了解热茶销售与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表如下表:22.(本题满分14分)在一个文娱网络中,点击观看某个节目的累积人次和播放天数如下表:(1)画出散点图;(2)判断两变量之间是否具有线性相关关系,求回归直线方程是否有意义?选修2-3统计案例2 答案一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.[答案] D[解析]x=2.5,y=3.5,∵回归直线方程过定点(x,y),∴3.5=-0.7×2.5+a,∴a=5.25.故选D.2.[答案] A[解析]因为b>0时,两变量正相关,此时,r>0;b<0时,两变量负相关,此时r<0.3.[答案] D4.[答案] A5.[答案] C6.[答案] C[解析]本题主要考查了变量的相关知识,考查学生分析问题和解决问题的能力.用散点图可以判断变量x与y负相关,u与v正相关.7.[答案] B[解析]建筑行业的比值小于6528076516,物流行业的比值大于7457070436,故建筑好于物流.8.[答案] C[解析]代入方程计算可判断①②④正确.9.[答案] C[解析]R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C. 10.[答案] D[解析] 前三种方法只能直观地看出两个分类变量x 与y 是否相关,但看不出相关的程度.独立性检验通过计算得出相关的可能性,较为准确.11. [答案] B[解析] 相关指数R 2的值越大,意味着残差平方和越小,也就是说模型的拟合效果越好,故选B.12. [答案] C[解析] 以横轴为单价,纵轴为市场供、需量,在同一坐标系中描点,用近似曲线观察可知选C.二、填空题(本大题共4个小题,每小题4分,共16分,将正确答案填在题中横线上) 13. [答案] |r |=1[解析] 当数据点(x i ,y i )在一条直线上时,y 只受x 的影响,即数据点完全线性相关,此时|r |=1.14. [答案] 58.5[解析] 因为x =15(1+7+5+13+19)=9,且y =1.5x +45,所以y =1.5×9+45=58.5.本题易错之处是根据x 的值及y ^=1.5x +45求出y 的值再求y ,由y ^=1.5x +45求得的y 值不是原始数据,故错误.15. [答案] y ^=17.5+6.5x[解析] 由数据表得x =5,y =50,所以a ^=y -6.5x =17.5,即回归直线方程为y ^=17.5+6.5x .16.[答案] 13 正[解析] 中位数的定义的考查,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时须取中间两数的平均数.由统计资料可以看出,当平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.三、解答题(本大题共6个小题,共70分,解答应写出文字说明、证明过程或演算步骤) 17.[解析] k =540×(60×200-260×20)2320×220×80×460=2496960259072≈9.638∵9.638>6.635∴40岁以上的人患胃病与生活是否有规律有关,有99%的把握认为生活不规律的人易患胃病.18. [解析] (1)用x 表示机器速度,y 表示每小时生产有问题物件数,那么4个样本数据为:(8,5)、(12,8)、(14,9)、(16,11),则x -=12.5,y -=8.25.于是回归直线的斜率为b ^=∑x i y i -4x -y -∑x 2i -4x -2=25.535≈0.7286,a ^=y --b ^x -=-0.8575,所以所求的回归直线方程为y =0.7286x -0.8575.(2)根据公式y ^=0.7286x -0.8575,要使y ≤10,则就需要0.7286x -0.8575≤10,x ≤14.9019,即机器的旋转速度不能超过14.9019转/秒.19. [解析] 男人晕船所占比例为3283×100%=0.386,女人晕船所占比例为832×100%=0.25,虽然0.386远大于0.25,但我们不能用此判断在恶劣气候中航行,男人比女人更容易晕船,而应根据独立性检验进行分析.由公式得:K 2=115×(32×24-51×8)283×32×40×75≈1.870.因为1.870<2.706,所以我们没有充分的证据说晕船跟男女性别有关.20. [解析] 查表可知,要使有90%以上的把握认为X 与Y 之间有关系,则K 2>2.706, 而其观测值k =65[a (30+a )-(20-a )(15-a )]220×45×15×50=13(65a -300)260×45×50=13(13a -60)260×90,解k >2.706得a >7.19或a <2.04.又因为a >5且15-a >5,a ∈Z ,所以a =8,9,故当a 取8或9时有90%以上的把握认为“X 与Y 之间有关系”.21.[解析] 由表中数据画出散点图如图所示.由表中数据得x =16(26+18+13+10+4-1)≈11.67,y=16(20+24+34+38+50+64)≈38.33,∑i =16x i y i =26×20+18×24+13×34+10×38+4×50-1×64=1910,∑i =16x 2i =262+182+132+102+42+(-1)2=1286,∑i =16y 2i =202+242+342+382+502+642=10172,所以r ≈-0.97,因为|r |≈0.97>0.75,所以热茶销售量与气温之间具有很强的线性相关关系.22.[解析] (1)散点图如图所示.(2)由散点图知两变量线性相关,故求回归直线方程有意义.或借助科学计算器,完成下表中的有关计算. i 1 2 3 4 5 6 7 8 9 10 x i 1 2 3 4 5 6 7 8 9 10 y i 51 134 213 235 262 294 330 378 457 533 x i y i51268639940131017642310302441135330x =5.5,y =288.7,∑i =110x 2i =385,∑i =110y 2i =1020953,∑i =110x i y i =19749 r =19749-10×5.5×288.7(385-10×5.52)×(1020953-10×288.72)≈0.984>0.75.这说明累积人次与播放天数之间存在着线性相关关系,自然求回归直线方程有意义.。

2017-2018学年高中数学选修2-3教材用书:第三章 统计

2017-2018学年高中数学选修2-3教材用书:第三章 统计

(时间120分钟,满分150分)一、选择题(共12小题,每小题5分,共60分)1.对于自变量x和因变量y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫做( )A.函数关系B.线性关系C.相关关系 D.回归关系解析:选C 由相关关系的概念可知,C正确.2.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有( )A.b与r的符号相同 B.a与r的符号相同C.b与r的符号相反 D.a与r的符号相反解析:选A 因为b>0时,两变量正相关,此时r>0;b<0时,两变量负相关,此时r<0.3.身高与体重有关系可以用________来分析.( )A.残差 B.回归分析C.等高条形图 D.独立检验解析:选B 因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决.4.利用独立性检验来考虑两个分类变量X与Y是否有关系时,通过查阅下表来确定“X 和Y有关系”的可信度.如果k>5.024,那么就有把握认为“X和Y有关系”的百分比为( )C.5% D.97.5%解析:选D ∵k>5.024,而在观测值表中对应于5.024的是0.025,∴有1-0.025=97.5%的把握认为“X和Y有关系”,故选D.5.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是( )A.线性函数模型 B.二次函数模型C.指数函数模型 D.对数函数模型解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.6.已知变量x ,y 之间具有线性相关关系,其回归方程为y ^=-3+b ^x ,若∑i =110x i =17,∑i =110yi=4,则b ^的值为( )A .2B .1C .-2D .-1解析:选A 依题意知,x =1710=1.7,y =410=0.4, 而直线y ^=-3+b ^x 一定经过点(x ,y ), 所以-3+b ^×1.7=0.4,解得b ^=2.7.对于P (K 2≥k ),当k >2.706时,就推断“x 与y 有关系”,这种推断犯错误的概率不超过( )A .0.01B .0.05C .0.10D .以上都不对解析:选C 已知P (K 2≥2.706)≈0.10,若k >2.706,则在犯错误的概率不超过0.10的前提下认为“x 与y 有关系”.8.根据一位母亲记录儿子3~9岁的身高数据,建立儿子身高(单位:cm)对年龄(单位:岁)的线性回归方程为y ^=7.19x +73.93,若用此方程预测儿子10岁时的身高,有关叙述正确的是( )A .身高一定为145.83 cmB .身高大于145.83 cmC .身高小于145.83 cmD .身高在145.83 cm 左右解析:选D 用线性回归方程预测的不是精确值,而是估计值.当x =10时,y =145.83,只能说身高在145.83 cm 左右.9.在2×2列联表中,下列哪两个比值相差越大,两个分类变量有关系的可能性就越大( )A.a a +b 与c c +d B.a c +d 与c a +b C.aa +d 与cb +cD.ab +d 与ca +c解析:选A 当ad与bc相差越大,两个分类变量有关系的可能性越大,此时aa+b 与c c+d相差越大.10.如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是()A.相关系数r变大B.残差平方和变大C.相关指数R2变大D.解释变量x与预报变量y的相关性变强解析:选B 由散点图知,去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.11.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是( ) A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关解析:选D 根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.12.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于97.5%,则c等于( )A .3B .4C .5D .6解析:选A 列2×2列联表如下:故K 2的观测值k =+c-c≥5.024.把选项A ,B ,C ,D 代入验证可知选A. 二、填空题(共4小题,每小题5分,共20分) 13.给出下列关系:①人的年龄与他(她)身高的关系; ②曲线上的点与该点的坐标之间的关系; ③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系; ⑤学生与他(她)的学号之间的关系. 其中有相关关系的是____________.解析:利用相关关系的概念判断.②曲线上的点与该点坐标是一种对应关系,即每一个点对应一个坐标,是确定关系;⑤学生与其学号也是确定的对应关系.答案:①③④14.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线方程是________.解析:设回归直线的方程为y ^=b ^x +a ^.回归直线的斜率的估计值是1.23,即b ^=1.23,又回归直线过样本点的中心(4,5),所以5=1.23×4+a ^,解得a ^=0.08,故回归直线的方程为y ^=1.23x +0.08.答案:y ^=1.23x +0.0815.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程y ^=b ^x +a ^,其中b ^=-2.现预测当气温为-4℃时,用电量的度数约为________.解析:由题意可知,x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,b ^=-2.又回归直线y ^=-2x +a ^过点(10,40),故a ^=60, 所以当x =-4时,y ^=-2×(-4)+60=68. 答案:6816.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:在犯错误的概率不超过________的前提下性别与休闲方式有关系. 解析:由列联表中的数据,得K 2的观测值为k =-255×34×32×57≈3.689>2.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系. 答案:0.10三、解答题(共6小题,共70分,解答时应写出文字说明、证明过程或演算步骤) 17.(本小题满分10分)x 与y 有如下五组数据:试分析x 与y 理由.解:作出散点图,如下图所示:由散点图可以看出,x 与y 不具有线性相关关系.18.(本小题满分12分)为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人的调查结果如下:根据以上数据判断40岁以上的人患胃病与生活规律有关吗?解:由公式得K2=-2 320×220×80×460≈9.638.∵9.638>6.635,∴有99%的把握说40岁以上的人患胃病与生活是否有规律有关,即生活不规律的人易患胃病.19.(本小题满分12分)有两个分类变量x与y,其一组观测值如下面的2×2列联表所示:其中a,15-a均为大于5的整数,则a取何值时,在犯错误的概率不超过0.1的前提下认为x与y之间有关系?解:查表可知,要使在犯错误的概率不超过0.1的前提下认为x与y之间有关系,则k≥2.706,而k=65×[a+a--a-a220×45×15×50=a-220×45×15×50=a-260×90.由k≥2.706得a≥7.19或a≤2.04.又a>5且15-a>5,a∈Z,解得a=8或9.故a为8或9时,在犯错误的概率不超过0.1的前提下认为x与y之间有关系.20.(本小题满分12分)某品牌手机厂商推出新款的旗舰机型,并在某地区跟踪调查得到这款手机上市时间(x个月)和市场占有率(y%)的几组相关对应数据:(1)(2)根据上述回归方程,分析该款旗舰机型市场占有率的变化趋势,并预测自上市起经过多少个月,该款旗舰机型市场占有率能超过0.5%(精确到月).附:b ^=∑i =1nx i y i -n x -·y-∑i =1nx 2i -n x -2,a ^=y --b ^x -.解:(1)由题意知x -=3,y -=0.1,∑i =15x i y i =1.92,∑i =15x 2i =55, 所以b ^=∑i =15x i y i -5x -y-∑i =15x 2i -5x -2=1.92-5×3×0.155-5×32=0.042, a ^=y --b ^x -=0.1-0.042×3=-0.026,所以线性回归方程为y ^=0.042x -0.026.(2)由(1)中的回归方程可知,上市时间与市场占有率正相关, 即上市时间每增加1个月,市场占有率约增加0.042个百分点. 由y ^=0.042x -0.026>0.5,解得x ≥13,故预计上市13个月时,该款旗舰机型市场占有率能超过0.5%.21.(本小题满分12分)某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺寸均在(单位:cm)之间,把零件尺寸在的记为三等品,现从甲、乙工艺生产的零件中各随机抽取100件产品,所得零件尺寸的频率分布直方图如图所示.附:K2=n ad-bc2a+b c+d a+c b+d(1)根据上述数据完成下列2×2列联表,根据此数据,你认为选择不同的工艺与生产出一等品是否有关?(2)件利润分别为30元、20元、15元,你认为以后该工厂应该选择哪种工艺生产该种零件?请说明理由.解:(1)2×2列联表如下:K2=-2110×90×100×100≈2.02<2.706,所以没有理由认为选择不同的工艺与生产出一等品有关.(2)由题知运用甲工艺生产单件产品的利润X的分布列为X的均值为E(X)=30×0.5+20×0.3+15×0.2=24,X的方差为D(X)=(30-24)2×0.5+(20-24)2×0.3+(15-24)2×0.2=39.乙工艺生产单件产品的利润Y的分布列为Y的均值为E(Y),Y的方差为D(Y)=(30-24.5)2×0.6+(20-24.5)2×0.1+(15-24.5)2×0.3=47.25.由上述结果可以看出D (X )<D (Y ),即甲工艺波动小,虽然E (X )<E (Y ),但相差不大,所以以后选择甲工艺.22.(本小题满分12分)假定小麦基本苗数x 与成熟期有效穗y 之间存在相关关系,今测得5组数据如下:(1)以x (2)求y 与x 之间的线性回归方程,对于基本苗数56.7预报其有效穗; (3)计算各组残差,并计算残差平方和;(4)求R 2,并说明残差变量对有效穗的影响占百分之几. 解:(1)如下图所示:(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.设回归方程为y ^=b ^x +a ^,x =30.316,y =43.5,∑i =15x 2i =5 090.256 4,x y =1 318.746,y 2=1 892.25,x 2=919.059 9,∑i =15x i y i =6 737.322.则b ^=∑i =15x i y i -5xy∑i =15x 2i -5x2≈0.29.a ^=y -b ^x ≈34.708.故所求的线性回归方程为y ^=0.29x +34.708.当x =56.7时,y ^=0.29×56.7+34.708=51.151,估计成熟期有效穗51.151. (3)由于y =bx +a +e ,可以算得e ^i =y i -y ^i 分别为e ^1=0.342,e ^2=0.773 8,e ^3=-0.508,e ^4=-2.222,e ^5=1.616.残差平方和:∑i =15e 2i =8.521 30.(4)总偏差平方和:∑i =15(y i -y )2=50.18,回归平方和:50.18-8.521 30=41.658 7,R 2=41.658 750.18≈0.830.∴解释变量小麦基本苗数对总效应贡献了约83%. 残差变量贡献了约1-83%=17%.。

人教b版选修2-3高中数学第三章《统计》同步练习高三数学试题试卷.doc

人教b版选修2-3高中数学第三章《统计》同步练习高三数学试题试卷.doc

高中新课标选修(2-3)第三章统计案例综合测试题一、选择题1. 下列变量之间:①人的身高与年龄、产甜的成本与生产数量;②商品的销售额与广告费;③家庭的支出与收入.其中不是函数关系的有()A . 0个B . 1个 C. 2个 D. 3个答案:D2. 当>3.841时,认为事件4与事件3 ()A. 有95%的把握有关B. 有99%的把握有关C. 没有理由说它们有关D. 不确定答案:A3. 已知回归直线方程y = bx + a,其中f/ = 3且样本点中心为(1,2),则回归直线方程为()A. y = x + 3 B . y = -2x + 3 C. y = -jr + 3 D . y = x-3答案:C4. 为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校中学生中随机抽取了300名学生,得到如下列联表:喜欢数学不喜欢数学计E378512235143178计72228■00D. 0.95答案:B你认为性别与是否喜欢数学课程之间有关系的把握冇()A. 0B. 95%C. 99%D. 100%则广告费与销售额间的相关系数为()A.. 0.819B. 0.919C. 0. 9236.在回归直线方程y = a + bx中,回归系数b表示()A. 当兀=0时,y的平均值B. /变动一个单位时,y的实际变动量C. y变动一个单位时,/的平均变动量D. /变动一个单位时,y的平均变动量答案:D7.对于回归分析,下列说法错课的是()A. 在回归分析中,变量间的关系若是非确定关系,那么因变量不能由口变量唯一确定B. 线性相关系数可以是正的,也可以是负的C. 回归分析中,如果r2=l,说明『与y之间•完全相关D. 样本相关系数re (-1,1)答案:D8.部分国家13岁学生数学测验平均分数为:对于授课天数与分数是否存在冋归直线,下列说法止确的是()A. —定存在B. 可能存在也可能不存在C . 一定不存在D.以上都不止确答案:A9.下列关于残差图的描述错误的是()A. 残差图的横坐标可以是编号B. 残差图的横坐标可以是解释变量和预报变量C. 残差点分布的带状区域的宽度越窄相关指数越小D. 残差点分布的带状区域的宽度越窄残差平方和越小答案:C10.某化工厂为预测某产品的回收率y,需要研究它和原料有效成份含量之间的相关关系,现取了88对观测值,计算得:£兀=8= 52, £川88= 228, Yx; =478, yx/y/ = 1849 ,则y 与兀的冋归直i=l<=1r=l Z=1线方程是()A. y = 11.47 + 2.62兀 B . y =:—11.47 + 2.62尢C. y = 2.62x4-11.47x D . y =:11.47-2.62兀答案:A 二、填空题11. 直线回归方程y = a + bx恒过定点___________ .答案:(xy)12.下表给出了某些地区的鸟的种类与这些地区的海拔高度5):种类数6qQ7123718295海拔高度1250115810675701311067014936249分析这些数据,可得鸟的种类与海拔高度间的相关系数为 ________ 答案:0. 78213•设对变量x,卩有如下观察数据:答案:y = 0.4463% - 27.292014.某高校大一12名学生的体重/与肺活量F的数据如下:4 2424646465c00cJ22— cJ8582 .552.202.75rz.402.802.81rV.41n■・102・85Q o.50 3.00预测体重是55kg的同学的肺活约量为_________答案:3. 24三、解答题15. 某市统计1994〜2004一年在校屮学生每年高考考入人学的百分比,把农村、县镇、城币分开统计,为了便于计算,把1994年编号为0, 1995年编号为1,…,2004年编号为10,如果把每年考入大学的百分比作为统计变量,把年份从0到10作为自变量进行回归分析,可得到下面三条回归直线:城市:9 = 9.50 + 2.54%;县镇:9 = 6.76 + 2.32x;农村:$ = 1.80 + 0.42x.(1)在同一坐标系中作出.三条回归直线;(2)对于农村学生来讲,系数等于0.42意味着什么?(3)在这一阶段,哪里的大学入学率增长最快?解:(1)散点图略;(2)对于农村学生来讲,系数等于0.42总味着1994^2004年在校中学生每年高考考入大学的百分比逐年增加0. 42;(3)在这一阶段,城市的大学入学率增长最快.16. 调查在2~3级风的海上航行中男女乘客的晕船情况,结果如下表所示:4 船不晕船计L 人12257* 人124nJ4计224971根据此资料,你是否认为在2飞级风的海上航行屮男人比女人更容易晕船?解:心響需泸皿因为0.08 < 2.706 ,所以我们没冇理由说晕船与男女性别冇关.17. 对某校小学牛•进行心理障碍测试得如下列联表:(其屮焦虑、说谎、懒惰都是心理障碍)4 虑1谎* 惰计—生115■牛‘21KV(计2526511.0试说明在这三种心理障碍屮哪一种与性别关系最大?解:对于上述三种心理障碍分别构造三个随机变量K;, K;, 由表中数据可得110x(5x60 - 25x20)230x80x25x85110x(10x70-20x10)230x80x20x90110x(15x30 - 15x50)230x80x65x45因为K;的值最大,所以说谎与性別关系最大.=1.410・18. 一机器可以按各种不同的速度运转,其生产物件有一些会有缺点,每小时生产有缺点物件的多 少随机器运转速度而变化,用/表示转速(单位:转/秒),用y 表示每小时生产的有缺点物件个 数,现观测得到(兀,刃的4组观测值为(8, 5) , (12, 8) , (14, 9) , (16, 11).(1) 假定y 与xZ 间有线性相关关系,求y 对x 的冋归直线方程;(2) 若实际生产中所容许的每小时最人冇缺点物件数为10,则机器的速度不得超过多少转/ 秒.(精确到1转/秒)4 4工#=660,工兀’=438・/=!<=1八 51 6•••所求的冋归直线方程为y = —x--; 70 7 (2)由 y =—兀一°W10,得70751即机器速度不得超过15转/秒.解:(1)设冋归直线方程为y = bx-^a7 = 12.5, y = 8.25 438-4x12.5x8.25 660-4X12.52- 25.53551 70« = ^-^ = 8.25-—xl2.5 = —•70 451 25 6------ x —=— 70 2 7。

(必考题)高中数学高中数学选修2-3第三章《统计案例》检测(含答案解析)

(必考题)高中数学高中数学选修2-3第三章《统计案例》检测(含答案解析)

一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k≥0.0500.0250.0100.0050.001k 3.841 5.024 6.6357.87910.828由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是() A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关5.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”6.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%7.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;②在刻画回归模型的拟合效果时,R2的值越大,说明拟合的效果越好;③设随机变量ξ服从正态分布N(4,22),则P(ξ>4)=12;④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则判断“X与Y有关系”的犯错误的概率越小.其中正确的说法是()A.①④B.②③C.①③D.②④10.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差 B.回归分析C.独立性检验 D.概率11.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bcka b c d a c b d-=++++并参照附表,得到的正确结论是A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”12.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K=,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是()2()P K k≥…0.250.150.100.0250.0100.005…k… 1.323 2.072 2.706 5.024 6.6357.879…A.90%B.95%C.97.5%D.99.5%二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R的值判断模型的拟合效果,2R越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A:“甲、乙中至少一人击中目标”与事件B:“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”.参考附表:(参考公式:K2=()()()()()2n ad bca b c d a c b d-++++,其中n=a+b+c+d)15.某市电信宽带私人用户月收费标准如下表:假定每月初可以和电信部门约定上网方案.若某用户每月上网时间为66小时,应选择__________方案最合算.16.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y与月份x 之间有较好的线性相关关系,其线性回归方程是=﹣0.7x+,则= . 月 份x 1 2 3 4 用水量y4.5432.517.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”.18.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到≈4.844,则认为选修文理科与性别有关系出错的可能性约为________. 19.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异? 人数 男生 女生身高h ≥ 身高h <参照公式:()()()()()22n ad bc k a b c d a c b d -=++++()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.828175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.22.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,23.某科研小组为了验证一种治疗新冠肺炎的新药的效果,选60名患者服药一段时间后,记录了这些患者的生理指标x 和y 的数据,并统计得到如下的22⨯列联表(不完整):在生理指标 1.8x >的人中,设A 组为生理指标65y ≤的人,B 组为生理指标65y >的人,将他们服用这种药物后的康复时间(单位:天)记录如下: A 组:10,11,12,13,14,15,16,17,19. B 组:12,13,14,15,16,17,20,21,25.(1)填写上表,并判断是否有95%95%的把握认为患者的两项生理指标x 和y 有关系; (2)从A ,B 两组人中随机各选1人,A 组选出的人记为甲,B 组选出的人记为乙,求乙的康复时间比甲的康复时间长的概率.附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)20k0.2524.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.25.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.26.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下:(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e=.故选:B.【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.3.D解析:D【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.D解析:D【解析】【分析】由题意结合独立性检验的结论和临界值表给出结论即可.【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.本题选择D选项.【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.B解析:B【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人,又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530)4.762 3.8412109075225K⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.6.A解析:A【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)9.B解析:B 【解析】①中各小长方形的面积等于相应各组的频率;②正确,相关指数R 2越大,拟合效果越好,R 2越小,拟合效果越差;③随机变量ξ服从正态分布N (4,22),正态曲线对称轴为x =4,所以P (ξ>4)=;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则说明“X 与Y 有关系”的犯错误的概率越大.故选B.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”12.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。

最新北师大版高中数学高中数学选修2-3第三章《统计案例》测试题(包含答案解析)

最新北师大版高中数学高中数学选修2-3第三章《统计案例》测试题(包含答案解析)

一、选择题1.已知x 与y 之间的几组数据如下表:参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()niix x y y r --=∑上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >2.下列说法错误..的是( ) A .10xy ≠是5x ≠或2y ≠的充分不必要条件B .若命题p :x R ∀∈,210x x ++≠,则p ⌝:x R ∃∈,210x x ++=C .已知随机变量()2~2,X N σ,且()40.84P X ≤=,则()00.16P X ≤=D .相关系数r 越接近1,表示线性相关程度越弱. 3.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值4.对于独立性检验,下列说法正确的是( ) A .2 3.841K >时,有95%的把握说事件A 与B 无关 B .2 6.635K >时,有99%的把握说事件A 与B 有关 C .2 3.841K ≤时,有95%的把握说事件A 与B 有关 D .2 6.635K >时,有99%的把握说事件A 与B 无关 5.下列命题中正确命题的个数是(1)对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越大;(2)若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变; (3)在残差图,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高; (4)设随机变量ξ服从正态分布()0,1N ; 若()1P p ξ>=,则()1102P p ξ-<<=-( ) A .4B .3C .2D .16.对四对变量Y 和x 进行线性相关性检验,已知n 是观测值组数,r 是相关系数,且已知: ①n=7,r=0.953 3;②n=15,r=0.301 2;③n=17,r=0.499 1;④n=3,r=0.995 0,则变量Y 和x 具有线性相关关系的是( ) A .①和② B .①和③ C .②和④D .③和④7.给出下列说法:①用()()221211ˆni i i n i i i y y R y y ==-=--∑∑刻画回归效果,当2R 越大时,模型的拟合效果越差,反之则越好;②归纳推理是由特殊到一般的推理,而演绎推移则是由一般到特殊的推理;③综合法证明数学问题是“由因索果”,分析法证明数学问题是“执果索因”;④设有一个回归方程ˆ35yx =+,变量x 增加1个单位时,y 平均增加5个单位;⑤线性回归方程ˆˆˆy bx a =+必过点(),x y .其中错误的个数有( )A .0个B .1个C .2个D .3个8.为了普及环保知识,增强环保意识,某大学从理工类专业的A 班和文史类专业的B 班各抽取20名同学参加环保知识测试,统计得到成绩与专业的列联表:( )附:参考公式及数据:(1)统计量:()()()()()22n ad bcKa b c d a c b d-=++++,(n a b c d=+++).(2)独立性检验的临界值表:则下列说法正确的是A.有95%的把握认为环保知识测试成绩与专业有关B.有95%的把握认为环保知识测试成绩与专业无关C.有99%的把握认为环保知识测试成绩与专业有关D.有99%的把握认为环保知识测试成绩与专业无关9.通过随机询问250名不同性别的高中生在购买食物时是否看营养说明书,得到如下列联表:从调查的结果分析,认为性别和读营养说明书的关系为()附:()()()()()22n ad bc K a b c d a c b d -=++++ . A .95%以上认为无关 B .90%~95%认为有关 C .95%~99.9%认为有关D .99.9%以上认为有关10.某种产品的广告费支出x 与销售额y (单位:万元)之间有下表关系: x 2 4 5 6 8 y3040605070y 与x 的线性回归方程为 6.5175ˆ.y x =+,当广告支出5万元时,随机误差的效应(残差)为( ) A .40 B .20 C .30D .1011.下列说法中,不正确的是A .两个变量的任何一组观测值都能得到线性回归方程B .在平面直角坐标系中,用描点的方法得到表示两个变量的关系的图象叫做散点图C .线性回归方程反映了两个变量所具备的线性相关关系D .线性相关关系可分为正相关和负相关 12.有下列数据: x123y35.9912.01下列四个函数中,模拟效果最好的为( ) A .B .C .D .二、填空题13.对相关系数r ,①r 越大,线性相关程度越大; ②r 越小,线性相关程度越大;③|r|越大,线性相关程度越小,|r|越接近0,线性相关程度越大; ④|r|≤1且|r|越接近1,线性相关程度越大,|r|越接近0,线性相关程度越小 以上说法中,正确说法的序号是__________.14. 2.5PM 是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,下图是据某地某日早7点至晚8点甲、乙两个 2.5PM 监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是_________.15.某单位为了了解用电量y (度)与气温x (度)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下的对照表由表中数据,得回归直线方程ˆˆˆy bx a =+,若ˆ2b=-,则ˆa =________. 16.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考查某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:附表:参照附表,在犯错误的概率不超过______(填百分比)的前提下,认为“小动物是否被感染与有没有服用疫苗有关”.17.已知方程ˆ0.8582.71yx =-是根据女大学生的身高预报她的体重的回归方程,其中x 的单位是cm ,ˆy的单位是kg ,那么针对某个体(160,53)的残差是______________. 18.给出下列结论:(1)在回归分析中,可用相关指数R 2的值判断模型的拟合效果,R 2越大,模型的拟合效果越好;(2)某工产加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量; (3)随机变量的方差和标准差都反映了随机变量的取值偏离于均值的平均程度,它们越小,则随机变量偏离于均值的平均程度越小;(4)若关于x 的不等式2x x a a -+-≥在R 上恒成立,则a 的最大值是1;(5)甲、乙两人向同一目标同时射击一次,事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是相互独立事件.其中结论正确的是 .(把所有正确结论的序号填上)19.给出下列四个结论:(1)相关系数r的取值范围是1r<;(2)用相关系数r来刻画回归效果,r的值越大,说明模型的拟合效果越差;(3)一个袋子里装有大小相同的5个白球和5个黑球,从中任取4个,则其中所含白球个数的期望是2;(4) 一个篮球运动员投篮一次得3分的概率为a,得2分的概率为b,不得分的概率为c,且(),,0,1a b c∈,已知他投篮一次得分的数学期望为2,则213a b+的最小值为163.其中正确结论的序号为______________.20.为了了解司机开车时礼让斑马线行人的情况,交警部门调查了100名机动车司机,得到以下统计数据:礼让斑马线行人不礼让斑马线行人男性司机人数4015女性司机人数2025若以2χ为统计量进行独立性检验,则2χ的值是__________.(结果保留2位小数)参考公式()11221221 21212n n n n nn n n nχ++++-=三、解答题21.我国新型冠状病毒肺炎疫情期间,以网络购物和网上服务所代表的新兴消费展现出了强大的生命力,新兴消费将成为我国消费增长的新动能.某市为了了解本地居民在2020年2月至3月两个月网络购物消费情况,在网上随机对1000人做了问卷调查,得如表频数分布表:(1)作出这些数据的频率分布直方图,并估计本市居民此期间网络购物的消费平均值;(2)在调查问卷中有一项是填写本人年龄,为研究网购金额和网购人年龄的关系,以网购金额是否超过4000元为标准进行分层抽样,从上述1000人中抽取200人,得到如表列联表,请将表补充完整并根据列联表判断,在此期间是否有95%的把握认为网购金额与网购人年龄有关.参考公式和数据:()()()()()22n ad bcKa b c d a c b d-=++++.(其中n a b c d=+++为样本容量)22.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:(1)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量<50kg箱产量≥50kg合计旧养殖法新养殖法合计(2)在新养殖法养殖的网箱中,按照分层抽样的方法从箱产量少于50kg和不少于50kg的网箱中随机抽取5箱,再从中抽取3箱进行研究,这3箱中产量不少于50kg的网箱数为X,求X的分布列和数学期望.()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++ ()2P K k ≥ 0.1000.050 0.010 0.005 0.001 k 2.706 3.8416.6357.87910.82823.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比,从全国随机抽取了100个地区作为研究样本,计算了各个地区样本的使用人数,其频率分布直方图如下,(1)记A 表示事件“微信支付人数低于50千人”,估计A 的概率;(2)填写下面2╳2列联表,并根据2╳2列联表判断是否有99%的把握认为支付人数与支付方式有关;()()()()()2n ad bc K a b c d a c b d -=++++.24.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关? (2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X ,若用样本的频率作为概率,求随机变量X 的分布列和期望.附:K 2=2()()()()()n ad bc a b c d a c b d -++++,其中n =a +b +c +d .25.电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下列联表,并判断能否在犯错误率不超过0.05的前提下认为“体育迷”与性别有关?非体育迷体育迷合计男女合计(2)将日均收看该体育项目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.()2P K k≥0.050.01k 3.841 6.63526.为迎接2022年北京冬季奥运会,普及冬奥知识,某校开展了“冰雪答题王”冬奥知识竞赛活动.现从参加冬奥知识竞赛活动的学生中随机抽取了100名学生,将他们的比赛成绩(满分为100分)分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]得到如图所示的频率分布直方图.(Ⅰ)求a 的值;(Ⅱ)记A 表示事件“从参加冬奥知识竞赛活动的学生中随机抽取一名学生,该学生的比赛成绩不低于80分”,估计A 的概率;(Ⅲ)在抽取的100名学生中,规定:比赛成绩不低于80分为“优秀”,比赛成绩低于80分为“非优秀”.请在答题卡上将22⨯列联表补充完整,并判断是否有99.9%的把握认为“比赛成绩是否优秀与性别有关”?参考公式及数据:22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++.()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k 2.7063.8415.0246.6357.87910.828【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()4222221 1.50.50.5 1.55i i x x =-=-+-++=∑ , ()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215ii x x =-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.2.D解析:D 【分析】A 选项,由“若10xy ≠,则5x ≠或2y ≠”的逆否命题判断充分性,由其否命题判断必要性;由全称命题的否定的概念判断选项B ;由正态分布的性质判断选项C ;由相关系数的概念判断选项D. 【详解】对于选项A,命题“若10xy ≠,则5x ≠或2y ≠”的逆否命题为“若5x =且2x =,则10xy =”,为真命题,而命题“若10xy =,则5x =且2x =”为假命题,所以10xy ≠是5x ≠或2y ≠的充分不必要条件,故A 正确;对于选项B,由全称命题的否定可得p ⌝:x R ∃∈,210x x ++=,故B 正确;对于选项C,由随机变量()2~2,X N σ,且()40.84P X ≤=,则()()()041410.840.16P X P X P X ≤=≥=-≤=-=,故C 正确;对于选项D,相关系数r 越接近1,表示线性相关程度越强,故D 错误, 故选:D 【点睛】本题考查充分不必要条件的判断,考查全称命题的否定,考查正态分布的概率,考查相关系数的概念,熟练掌握各知识点是解题关键.3.B解析:B 【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案. 【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验, 回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析, 综上可知①是独立性检验,②是回归分析,故选B . 【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.4.B解析:B 【分析】根据独立性检验中卡方的概念知,选B. 【详解】根据独立性检验中卡方的概念知,2 6.635K >时,有99%的把握说事件A 与B 有关选B. 【点睛】本题主要考查了独立性检验中卡方的概念,属于中档题.5.B解析:B 【解析】 【分析】根据独立性检验的定义可判断(1);根据方差的性质可判断(2);根据残差的性质可判断(3);根据正态分布的对称性可判断(4). 【详解】(1)对分类变量X 与Y 的随机变量2K 的观测值K 来说,K 越大,判断“X 与Y 有关系”的把握越大,故(1)错误;(2)若将一组样本数据中的每个数据都加上同一个常数后,数据的离散程度不变,则样本的方差不变,故(2)正确;(3)根据残差的定义可知,在残差图,残差点分布的带状区域的宽度越狭窄,预测值与实际值越接近,其模型拟合的精度越高,(3)正确;(4)设随机变量ξ服从正态分布()0,1N ,若()1P p ζ>=,则()1P p ζ<-=,则()1112P p ζ-<<=-,则()1102P p ζ-<<=-,故(4)正确, 故正确的命题的个数为3个,故选B. 【点睛】本题主要通过对多个命题真假的判断,主要综合考查独立性检验的定义、方差的性质、残差的性质以及正态分布的对称性,属于中档题. 这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.6.B解析:B 【解析】分析:先查相关系数检验的临界值表,再判断变量Y 和x 具有线性相关关系的选项. 详解: 查相关系数检验的临界值表 ①r 0.05=0.754,r >r 0.05; ②r 0.05=0.514,r <r 0.05; ③r 0.05=0.482,r >r 0.05; ④r 0.05=0.997,r 0.05>r.∴y 和x 具有线性相关关系的是①③.故答案为B.点睛:本题主要考查相关系数,意在考查学生对这些知识的掌握水平.7.B解析:B 【解析】分析:①可由相关指数的概念判断;②③由推理,综合法和反证法的概念判断;④和⑤由线性回归分析判断即可.详解:①相关指数2R 越大,则相关性越强,模型的拟合效果越好.错误;② 归纳推理是由特殊到一般的推理,而演绎推理是由一般到特殊的推理,由归纳推理与演绎推理的概念可知正确.③综合法证明数学问题是“由因索果”,分析法证明数学问题是“执果索因”,由概念可知正确. ④由回归方程的系数意义知,当变量x 增加1个单位时,y 平均增加5个单位,正确;⑤线性回归方程ˆˆˆy bx a =+必过样本中心点(),x y ,正确.故选B.点睛:本题是一道综合性考题,即考查了推理与证明的原理,又考查了利用2R 判断模型拟合程度,同时还考查了线性回归分析的相关概念,属于中档题.8.A【解析】分析:首先计算观测值k 0的值,然后给出结论即可. 详解:由列联表计算观测值:()2401413672804.912 3.8412119202057k ⨯⨯-⨯==≈>⨯⨯⨯, 则有95%的把握认为环保知识测试成绩与专业有关. 本题选择A 选项.点睛:本题主要考查独立性检验及其应用等知识,意在考查学生的转化能力和计算求解能力.9.D解析:D 【解析】分析:由列联表中的数据,利用公式()()()()()22n ad bc K a b c d a c b d -=++++求得2K ,与邻界值比较,即可得到结论. 详解:()222509070603021.6310.828120130150100K ⨯⨯-⨯=≈>⨯⨯⨯,∴有0099.9的把握认为性别和读营养说明书的有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)10.D解析:D 【解析】∵y 与x 的线性回归方程为 6.5175ˆ.y x =+ 当5x =时,ˆ50y=. 当广告支出5万元时,由表格得:60y = 故随机误差的效应(残差)为605010.-= 故选D .11.A解析:A 【解析】要得到线性回归方程应至少有两个变量的两组观测值,因此A 不正确.根据散点图、线性回归方程、线性相关关系的概念可得B ,C ,D 都正确.故选A .12.A【解析】当x=1,2,3时,分别代入求y值,离y最近的值模拟效果最好,可知A模拟效果最好.故选A.考点:非线性回归方程的选择.二、填空题13.④【解析】两个变量之间的相关系数r的绝对值越接近于1表示两个变量的线性相关性越强r的绝对值非常接近于0时表示两个变量之间几乎不存在线性相关故答案为④解析:④【解析】两个变量之间的相关系数,r的绝对值越接近于1,表示两个变量的线性相关性越强,r的绝对值非常接近于0时,表示两个变量之间几乎不存在线性相关.故答案为④.14.甲【解析】根据茎叶图中的数据可知甲地的数据都集中在006和007之间数据分布比较稳定而乙地的数据分布比较分散不如甲地数据集中故甲地的方差小故答案为甲解析:甲【解析】根据茎叶图中的数据可知,甲地的数据都集中在0.06和0.07之间,数据分布比较稳定,而乙地的数据分布比较分散,不如甲地数据集中,故甲地的方差小,故答案为甲. 15.【解析】试题分析:由题意得即样本中心点代入回归直线方程得考点:回归直线方程的应用解析:60【解析】试题分析:由题意得18131011542x++-==,24343864404y+++==,即样本中心点15(,40)2,代入回归直线方程,得15402602ˆˆa a=-⨯+⇒=.考点:回归直线方程的应用.16.%【解析】试题分析:所以在犯错误不超过%的前提下认为小动物是否被感染与有没有服用疫苗有关考点:1卡方统计量2统计;【易错点晴】本题主要考查的是统计中的卡方统计量属于容易题解题时一定要注意计算问题很多解析:%【解析】试题分析:,所以在犯错误不超过%的前提下,认为“小动物是否被感染与有没有服用疫苗有关” . 考点:1.卡方统计量,2.统计;【易错点晴】本题主要考查的是统计中的卡方统计量,属于容易题.解题时一定要注意计算问题,很多同学列式正确计算错误,从而不能正确得到结果.另外,学生容易把答案写为%,所以一定要注意本题中的问题是什么,否则很容易出现错误.17.【解析】将代入得所以残差 解析:0.29-【解析】将160x =代入0.85 2.1ˆ87yx =-,得0.8516082.71ˆ53.29y =⨯-=,所以残差5353.ˆ290ˆ.29ey y =-=-=-. 18.(1)(3)(4)【分析】根据相关指数离散型随机变量随机变量的方差和标准差绝对值不等式和相互独立事件相关的知识对五个结论逐一分析由此得出正确结论的序号【详解】对于(1)R2越大模型的拟合效果越好结论解析:(1),(3),(4) 【分析】根据相关指数、离散型随机变量、随机变量的方差和标准差、绝对值不等式和相互独立事件相关的知识,对五个结论逐一分析,由此得出正确结论的序号. 【详解】对于(1),R 2越大,模型的拟合效果越好,结论正确.对于(2),内径与规定的内径尺寸之差是连续型随机变量,结论错误.对于(3),根据随机变量的方差和标准差的知识可判断出结论正确.对于(4),根据绝对值不等式有22x x a a a -+-≥-≥,所以2a a -≤-或2a a -≥,前者解得1a ≤,后者无解,故a 的最大值为1,结论正确.对于(5),事件A :“甲、乙中至少一人击中目标”与事件B :“甲,乙都没有击中目标”是对立事件,不是相互独立事件,结论错误.综上所述,正确结论为(1),(3),(4). 【点睛】本小题主要考查关指数、离散型随机变量、随机变量的方差和标准差、绝对值不等式和相互独立事件相关的知识,考查分析与解决问题的能力,属于基础题.19.(3)(4)【解析】分析:(1)相关系数的范围;(2)由相关指数r 的含有知|r|的值越大说明模型的拟合效果越好;(3)离散型随机变量的期望;(4)根据期望公式得到3a+2b=2进而利用均值不等式求最解析:(3)(4) 【解析】分析:(1)相关系数的范围;(2)由相关指数r 的含有知,|r|的值越大,说明模型的拟合效果越好;(3)离散型随机变量的期望;(4)根据期望公式得到3a+2b=2,进而利用均值不等式求最值.详解:(1)相关系数r 的取值范围是1r ≤,故(1)错误;(2)用相关指数r 来刻画回归效果,|r|的值越大,说明模型的拟合效果越好,故(2)错误;(3)含零个白球的概率为5210,含一个白球的概率为50210,含二个白球的概率为100210,含三个白球的概率为50210,含四个白球的概率为5210, 白球个数的期望为:550100505012342210210210210210⨯+⨯+⨯+⨯+⨯=,故(3)正确; (4)∵3a+2b+0•c=2,a ,b ,c ∈(0,1), ∴213a b +=(213a b +)•12(3a+2b )=12(6+4b a +a b +23)≥12(203+24b aa b ⋅) =12(203+4)=163(当且仅当a=2b ,即a=12,b=14时取“=”),故(4)正确. 其中正确结论的序号为:(3)(4). 故答案为(3)(4).点睛:本题考查相关系数的有关概念,考查离散型随机变量的期望及概率统计与基本不等式的综合应用,属于中档题.20.【解析】分析:根据题意填写2×2列联表计算观测值对照临界值得出结论详解:填写2×2列联表如下:根据数表计算=≈825>7879所以有995的把握认为开车时使用手机与司机的性别有关;点睛:独立性检验的 解析:8.25【解析】分析:根据题意填写2×2列联表,计算观测值,对照临界值得出结论. 详解:填写2×2列联表,如下:根据数表,计算()()()()()22n ad bc a b c d a c b d -X =++++=()21004025201555456040⨯⨯-⨯⨯⨯⨯≈8.25>7.879,所以有99.5%的把握认为开车时使用手机与司机的性别有关;点睛:独立性检验的一般步骤:(I )根据样本数据制成22⨯列联表;(II )根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(III ) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)三、解答题21.(1)直方图见解析,3360元;(2)列联表见解析,没有95%的把握认为网购金额与网购人年龄有关. 【分析】(1)由频数分布表计算出各组数据的纵坐标(频率除以组距),再做出频率分布直方图, 由频率分布直方图估计平均值的定义可得本市居民此期间网络购物的消费平均值; (2) 根据频数分布表中的数据可知网购金额不超过4000元的有700人,超过4000元的有300人,根据分层抽样可得网购金额不超过4000元需要抽取140人,超过4000元的需要抽取60人,再根据列联表的性质即可完成表格,再根据列联表的数据计算出2K 并与给定的参考表对照得到结论. 【详解】(1)由题可知随机对1000人做问卷调查,消费数据的组距为2000, 可求得频率分布直方图纵轴上每组的数据(频率除以组距), 即3000.0001510002000=⨯,4000.000210002000=⨯,1800.0000910002000=⨯,600.0000310002000=⨯,则[]0,2000,(]2000,4000,(]4000,6000,(]6000,8000,(]8000,10000, 对应的的数据(频率除以组距)分别是0.00015,0.0002,0.00009,0.00003,0.00003, 从而得出频率分布直方图,由频率分布直方图估计平均值的定义,可得10000.330000.450000.1870000.0690000.0630012009004205403360x =⨯+⨯+⨯+⨯+⨯=++++=(元),故本市居民此期间网络购物的消费平均值为3360元; (2)由数据可知以网购金额不超过4000元的有2007001401000⨯=(人), 超过4000元的有200300601000⨯=(人),可得列联表.由()()()()220075356525502.3813.8411406010010021n ad bc K a b c d a c b d -⨯⨯-⨯===≈<++++⨯⨯⨯. 故在此期间没有95%的把握认为网购金额与网购人年龄有关. 【点睛】本题第一问考查了平均数的计算、画出频率分布直方图,其中主要是计算出纵坐标的值(频率除以组距)属于常见题型,第二问主要考查完善列联表,2K 的计算,属于中档题目,解题中对计算能力要求较高.22.(1)列联表见解析,有把握;(2)分布列见解析,1.8. 【分析】(1)完成列联表求出2K ,从而有99%的把握认为箱产量与养殖方法有关.(2)推导出X 的可能取值为1,2,3,分别求出相应的概率,由此能求出X 的分布列和数学期望. 【详解】解:(1)依题意,得下表:2200(62603840)9.68 6.63510298100100K ⨯-⨯∴=≈>⨯⨯⨯,即2( 6.635)0.010P K ∴>=所以,有99%的把握认为箱产量与养殖方法有关;(2)按照分层抽样的方法从箱产量少于50kg 和不少于50kg 的网箱中随机抽取5箱,分别为2箱和3箱,从中再抽3箱,则1,2,3X =则2123353(1)10C C P X C ===,1223356(2)10C C P X C ===,0323351(3)10C C P X C ===,X 的分布列为所以,1123 1.8101010EX=⨯+⨯+⨯=【点睛】本题考查独立检验的应用,考查离散型随机变量的分布列、数学期望的求法,考查运算求解能力,属于中档题.23.(1)0.62;(2)列联表见解析,有99%的把握认为支付人数与支付方式有关.【分析】(1)由频率分布直方图可得微信支付人数低于50千人的频率;(2)根据频率分布直方图得出<50千人和≥50千人的人数,得列联表,计算出2K,比较后可得结论.【详解】(1)根据题意,由微信支付人数的频率分布直方图可得:()()0.0120.0140.0240.0340.04050.62P A=++++⨯=(2)根据题意,补全列联表可得:则有()22006266383415.705 6.63510010096104K⋅⨯-⨯=≈>⨯⨯⨯,故有99%的把握认为支付人数与支付方式有关.【点睛】本题考查频率分布直方图,考查列联表,独立性检验,计算出2K即得,本题属于基础题.24.(1)见解析;(2)分布列见解析,期望是10 3.【分析】(1)先根据题中数据完成列联表,再进行计算,判断;(2)根据题意得X服从二项分布,进而求解.【详解】(1)由题意得,。

(常考题)北师大版高中数学高中数学选修2-3第三章《统计案例》检测题(有答案解析)

(常考题)北师大版高中数学高中数学选修2-3第三章《统计案例》检测题(有答案解析)

一、选择题1.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是()A.①回归分析,②取平均值B.①独立性检验,②回归分析C.①回归分析,②独立性检验D.①独立性检验,②取平均值2.某中学采取分层抽样的方法从高二学生中按照性别抽出20名学生,其选报文科、理科的情况如下表所示,参考公式和数据:22()()()()()n ad bcKa cb d a bc d-=++++,其中n a b c d=+++.则以下判断正确的是A.至少有97.5%的把握认为学生选报文理科与性别有关B.至多有97.5%的把握认为学生选报文理科与性别有关C.至少有95%的把握认为学生选报文理科与性别有关D.至多有95%的把握认为学生选报文理科与性别有关3.某班主任对全班50名学生进行了作业量的调查,数据如表:若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的概率不超过()附:()()()()()22n ad bcKa b c d a c b d-=++++A.0.01 B.0.025 C.0.10 D.0.054.为了考查两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是( )A.l1和l2有交点(s,t)B.l1与l2相交,但交点不一定是(s,t)C.l1与l2必定平行D.l1与l2必定重合5.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是()P(K2≥k)…0.250.150.100.0250.0100.005…k…1.3232.0722.7065.0246.6357.879…A.90% B.95% C.97.5% D.99.5%6.以下四个命题中:①在回归分析中,可用相关指数R2的值判断拟合的效果,R2越大,模型的拟合效果越好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近1; ③若数据x 1,x 2,x 3,…,x n 的方差为1,则2x 1,2x 2,2x 3,…,2x n 的方差为2;④对分类变量x 与y 的随机变量K 2的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为( ) A .1 B .2 C .3 D .47.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关8.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A .平均数与方差 B .回归分析 C .独立性检验 D .概率 9.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归方程^^^y b x a =+必过(),x y ;④在一个22⨯列联表中,由计算得213.079K =,则有99%以上的把握认为这两个变量间有关系.其中错误..的个数是( ) A .0 B .1 C .2D .310.若在区间[-5,5]内任取一个实数a ,则使直线x +y +a =0与圆(x -1)2+(y +2)2=2有公共点的概率为( ) A .25B .25C .35D .321011.由某个22⨯列联表数据计算得随机变量2K 的观测值k 6.879=,则下列说法正确的是 ( )0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.7081.3232.0722.7063.8415.0246.6357.87910.828A .两个分类变量之间有很强的相关关系B .有99%的把握认为两个分类变量没有关系C .在犯错误的概率不超过1.0%的前提下认为这两个变量间有关系D .在犯错误的概率不超过0.5%的前提下认为这两个变量间有关系 12.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: )C(件)由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .58二、填空题13.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的13,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.若有95%的把握认为是否喜欢韩剧和性别有关,求男生至少有______人.14.以下结论正确..的序号有_________ (1)根据22⨯列联表中的数据计算得出2K ≥6.635, 而P (2K ≥6.635)≈0.01,则有99% 的把握认为两个分类变量有关系.(2)在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关.(3)在线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大;r 越小,相关程度越小.(4)在回归直线0.585y x =-中,变量200x =时,变量y 的值一定是15.15.某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如下表: 专业 性别非统计专业统计专业男生1310女生720为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K 2的观测值为.因为k >3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为________.16.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.由表中数据得线性方程=+x 中=﹣2,据此预测当气温为5℃时,用电量的度数约为_____.17.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;③某项测量结果ξ服从正态分布()21,σN ,()50.81ξP ≤=,则()30.19ξP ≤-=;④对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越大.以上命题中其中真命题的个数为___________.18.从某高校在校大学生中随机选取5名女大学生,由她们身高和体重的数据得到的回归直线方程为ˆ0.7973.56yx =-,数据列表是:则其中的数据a =__________.19.以下4个命题中,正确命题的序号为_________.①“两个分类变量的独立性检验”是指利用随机变量2K 来确定是否能以给定的把握认为“两个分类变量有关系”的统计方法;②将参数方程cos sin x y θθ=⎧⎨=⎩(θ是参数,[]0,θπ∈)化为普通方程,即为221x y +=;③极坐标系中,22,3A π⎛⎫⎪⎝⎭与()3,0B 的距离是19; ④推理:“因为所有边长相等的凸多边形都是正多边形,而菱形是所有边长都相等的凸多边形,所以菱形是正多边形”,推理错误在于“大前提”错误. 20.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.网购是当前人们购物的新方式,某公司为了改进营销方式,随机调查了100名市民,统计了不同年龄的人群网购的人数如下表: 年龄段(岁) ()0,20[)20,40[)40,60[)60100,网购人数 2632348 男性人数1510 105(1)若把年龄在[2060,的人称为“网购迷”,否则称为“非网购迷”,请完成下面的22⨯列联表,并判断能否在犯错误的概率不超过1%的前提下,认为网购与性别有关?网购迷 非网购迷 总计男性 女性 总计附:()()()()()22n ad bc K a b c d a c b d -=++++. ()20P K k ≥0.10 0.05 0.01 0.001两人年龄都小于20岁的概率.22.为了解使用手机是否对学生的学习有影响,某校随机抽取50名学生,对学习成绩和使用手机情况进行了调查,统计数据如表所示(不完整):与使用手机有关;(2)现从上表不使用手机的学生中按学习成绩是否优秀分层抽样选出9人,再从这9人中随机抽取3人,记这3人中“学习成绩优秀”的人数为X,试求X的分布列与数学期望.参考公式:()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.参考数据:23.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x和对应的销售额y(万元)进行了调查得到以下数据:关系数r的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii xx =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii n ii x y nx y bxnx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑24.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,25.为了响应国家号召,某校组织部分学生参与了“垃圾分类,从我做起”的知识问卷作答,并将学生的作答结果分为“合格”与“不合格”两类与“问卷的结果”有关?(1)是否有90%以上的把握认为“性别”与“问卷的结果”有关?(2)在成绩合格的学生中,利用性别进行分层抽样,共选取9人进行座谈,再从这9人中随机抽取5人发送奖品,记拿到奖品的男生人数为X,求X的分布列及数学期望()E X.附:22()()()()()n ad bcKa b c d a c b d-=++++26.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.050 0.010 0.001k 3.841 6.63510.828【参考答案】***试卷处理标记,请不要删除一、选择题1.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.2.C解析:C【解析】由题易得22⨯列联表如下:则2K的观测值为()220235104.432 3.841128713k⨯⨯-⨯=≈>⨯⨯⨯,所以至少有95%的把握认为学生选报文理科与性别有关,故选:C.【解题必备】(1)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握认为两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.(2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结论在多大程度上适用于总体.即独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释. (3)独立性检验的具体做法:①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α, 然后查下表确定临界值0k ; ②利用公式()()()()()22n ad bc K a c b d a b c d -=++++,计算随机变量2K 的观测值k ;③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.说明:通常认为 2.706k ≤时,样本数据就没有充分的证据显示“X 与Y 有关系”.3.B解析:B 【解析】分析:根据表格中所给数据,代入公式()()()()()22n ad bc K a b c d a c b d -=++++,求出观测值,把所求的观测值同临界值进行比较,从而可得结果. 详解:根据表中数据得到()2250181589 5.059 5.024********K ⨯⨯-⨯=≈>⨯⨯⨯,所以,若推断“学生的性别与认为作业量大有关”, 则这种推断犯错误的概率不超过0.025,故选B.点睛:本题主要考查独立性检验的应用,解题的关键是正确求出这组数据的观测值,计算过程一定要细心,避免出现计算错误,属于基础题.4.A解析:A 【解析】回归直线方程过样本中心点,过A 选项正确.5.C解析:C 【详解】∵2 6.023 5.024K=>∴可断言市民收入增减与旅游欲望有关的把握为97.5%.故选C.点睛:本题主要考查独立性检验的实际应用.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22()()()()()n ad bcKa b c d a c b d-=++++,计算出2K的值;(3)查表比较2K与临界值的大小关系,作统计判断.6.B解析:B【解析】由题意得,若数据x1,x2,x3,…,x n的方差为1,则2x1,2x2,2x3,…,2x n的方差为4,所以③不正确;对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“x与y 有关系”的把握程度越小,所以④不正确.其中①、②是正确的,故选B.7.C解析:C【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.8.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.考点:独立性检验的意义.9.B解析:B【解析】一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x的系数具备直线斜率的功能,对于回归方程y35x=-,当x增加一个单位时,y平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y= b x+a必过点(),x y,③正确;因为213.079 6.635K=>,故有0099以上的把握认为这两个变量间有关系,④正确,即错误的个数为1,故选B. 10.B解析:B【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.11.C解析:C 【解析】由22⨯列联表数据计算得随机变量2K 的观测值是 6.879 6.635k =>,通过对照表中数据得,在犯错误的概率不超过1.0%的前提下,认为这两个变量间有关系,故选C.12.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.二、填空题13.【分析】设男生人数为依题意填写列联表计算观测值列出不等式求出的取值范围再根据题意求出男生的人数【详解】设男生人数为由题意可得列联表如下: 喜欢韩剧 不喜欢韩剧 总计 男生 女生 总 解析:18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列出不等式求出x 的取值范围,再根据题意求出男生的人数. 【详解】设男生人数为x ,由题意可得列联表如下:则 3.841k>,即2452()3636969 3.84171711931818x x x x xxkx x xx⋅-⋅==>⋅⋅⋅,解得12.697x>.因为各部分人数均为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有18人.故答案为:18.【点睛】本题考查独立性检验的应用,解题关键是列出列联表,然后进行计算,属于常考题. 14.(1)(3)【解析】分析:根据独立性检验残差图相关系数回归分析的定义及性质逐一分析四个答案的真假即可详解:对于(1)根据2×2列联表中的数据计算得出≥6635而P(≥6635)≈001则有99的把握解析:(1)(3).【解析】分析:根据独立性检验、残差图、相关系数、回归分析的定义及性质,逐一分析四个答案的真假即可.详解:对于(1),根据2×2列联表中的数据计算得出2K≥6.635, 而P(2K≥6.635)≈0.01,则有99%的把握认为两个分类变量有关系,故(1)正确.对于(2),根据残差图的意义可得,当带状区域的宽度较小时,说明选用的模型比价合适,而当带状区域的宽度较大时,说明选用的模型不合适,故(2)不正确.对于(3),在线性回归分析中,相关系数为r,|r|越接近于1,则相关程度越大;|r|越接近于0,则相关程度越小.故(3)正确.对于(4),在回归直线y=0.5x−85中,当x=200时,y=15,但实际观测值可能不是15,故(4)不正确.综上可得(1)(3)正确.点睛:本题考查回归分析和独立性检验的基本知识,属于基础类题目,解题的关键是熟记相关的的概念和性质.15.5【解析】因为随机变量K2的观测值k>3841所以在犯错误的概率不超过005的前提下认为主修统计专业与性别有关系故这种判断出现错误的可能性为5考点:独立性检验思想解析:5% 【解析】因为随机变量K 2的观测值k >3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为5%. 考点:独立性检验思想.16.40【解析】试题分析:根据所给的表格做出本组数据的样本中心点根据样本中心点在线性回归直线上利用待定系数法做出a 的值现在方程是一个确定的方程根据所给的x 的值代入线性回归方程预报要销售的件数解:由表格得解析:40 【解析】试题分析:根据所给的表格做出本组数据的样本中心点,根据样本中心点在线性回归直线上,利用待定系数法做出a 的值,现在方程是一个确定的方程,根据所给的x 的值,代入线性回归方程,预报要销售的件数.解:由表格得=(14+12+8+6)÷4=10,=(22+26+34+38)÷4=30 即样本中心点的坐标为:(10,40), 又∵样本中心点(10,40)在回归方程 上且b=﹣2∴30=10×(﹣2)+a , 解得:a=50, ∴当x=5时,y=﹣2×(5)+50=40. 故答案为40.考点:回归分析的初步应用.17.【解析】试题分析:对于①从匀速传递的新产品生产流水线上质检员每20分钟抽取一件新产品进行某项指标检测这样的抽样是系统抽样而不是分层抽样故①错;对于②两个随机变量的相关性知识可知②正确;对于③变量所以 解析:2【解析】试题分析:对于①,从匀速传递的新产品生产流水线上,质检员每20分钟抽取一件新产品进行某项指标检测,这样的抽样是系统抽样,而不是分层抽样,故①错;对于②,两个随机变量的相关性知识可知②正确;对于③变量2(1,)N ξσ~,所以()()30.191510.810.19ξξP ≤-==-P ≤=-=,故③正确;对于④,随机变量2K 观测值k 来说,k 越大,“X 与Y 有关系”的把握程度越大,故④错,所以真命题有2个. 考点:1. 回归分析的基本思想及其应用初步;2.统计与概率.18.163【解析】由根据回归直线经过样本中心即得由得故答案为解析:163 【解析】由4953565864565y ++++==,根据回归直线经过样本中心(),x y ,即560.7973.56x =⨯-,得164x =,由1551611671741645a x ++++==,得163a =,故答案为163.19.①③④【解析】①是独立性检验的应用①对②中由于所以显然是半个圆②错③中由极坐标中两点距离公式=③对④中所有边长相等的凸多边形都是正多边形为大前提是错误的因为只需要正多边形挤压变形使之仍为凸多边形即可解析:①③④ 【解析】①是独立性检验的应用,①对.②中由于[]0,θπ∈,所以01y ≤≤,显然是半个圆,②错.③中,由极坐标中两点距离公式2221212212cos()AB ρρρρθθ=+--=14912()19,2+-⨯-=AB ③对.④中“所有边长相等的凸多边形都是正多边形”为大前提,是错误的,因为只需要正多边形挤压变形,使之仍为凸多边形即可.④对.所以填①③④.20.①④【解析】分析:根据性回归方程独立性检验相关关系以及命题的否定等知识选出正确的得到结果详解:线性回归方程必过样本中心点故①正确命题的否定是故②错误③相关系数r 绝对值越小表明两个变量相关性越弱故不正解析:①④ 【解析】分析:根据性回归方程,独立性检验,相关关系,以及命题的否定等知识,选出正确的,得到结果.详解:线性回归方程ˆˆˆy bx a =+必过样本中心点(),x y ,故①正确.命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃≥+<” 故②错误 ③相关系数r 绝对值越小,表明两个变量相关性越弱,故不正确;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系,正确. 故答案为①④.点睛:本题以命题真假的判断为载体,着重考查了相关系数、命题的否定、独立性检验、回归直线方程等知识点,属于中档题.三、解答题21.(1)列联表答案见解析,能在犯错误的概率不超过1%的前提下,认为网购与性别有关;(2)310.【分析】(1)根据表格中的数据可题中信息可完善22⨯列联表,计算出2K 的观测值,结合临界值表可得出结论;(2)计算得出年龄段()0,20应抽取3人,分别记为1、2、3;年龄段[)20,40应抽取2人,分别记为a 、b ,列举出所有的基本事件,并确定事件“所抽的两人年龄都小于20岁”所包含的基本事件,利用古典概型的概率公式可求得所求事件的概率. 【详解】(1)由题中信息可完善22⨯列联表如下表所示:计算得()2100201446207.605 6.63566344060K ⨯⨯-⨯=≈>⨯⨯⨯,故能在犯错误的概率不超过1%的前提下,认为网购与性别有关;(2)年龄在()0,20、[)20,40网购男性分别有15人、10人.按分层抽样的方法随机抽取5人,年龄段()0,20应抽取3人,分别记为1、2、3;年龄段[)20,40应抽取2人,分别记为a 、b .从中随机抽取2人的一切可能结果所组成的基本事件共10个:()1,2、()1,3、()1,a 、()1,b 、()2,3、()2,a 、()2,b 、()3,a 、()3,b 、(),a b .用A 表示“两人年龄都小于20岁”这一事件,则事件A 由3个基本事件组成:()1,2、()1,3、()2,3.故事件A 的概率为()310P A =. 【点睛】方法点睛:求解古典概型的概率方法如下: (1)列举法; (2)列表法; (3)树状图法; (4)排列、组合数的应用.22.(1)没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)分布列见解析,()2E X =.【分析】(1)根据表格中数据和题中信息可完善22⨯列联表,计算出2χ的观测值,结合临界值表可得出结论;(2)由题意可知,随机变量X 的可能取值有0、1、2、3,计算出随机变量X 在不同取值下的概率,可得出随机变量X 的分布列,进而可求得随机变量X 的数学期望值. 【详解】(1)22⨯列联表如下表所示:()22505102015258.33310.828203025253χ⨯⨯-⨯==≈<⨯⨯⨯,所以,没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)9人中学习成绩优秀的人有209630⨯=人,学习成绩一般的有109330⨯=人, X 可能的取值有0、1、2、3,()3911084P X C ===,()1263393114C C P X C ===,()21633915228C C P X C ===,()363953?21C P X C ===.所以,随机变量X 的分布列为()1232142821E X =⨯+⨯+⨯=. 【点睛】思路点睛:求解随机变量分布列的基本步骤如下:(1)明确随机变量的可能取值,并确定随机变量服从何种概率分布; (2)求出每一个随机变量取值的概率;(3)列成表格,对于抽样问题,要特别注意放回与不放回的区别,一般地,不放回抽样由排列、组合数公式求随机变量在不同取值下的概率,放回抽样由分步乘法计数原理求随机变量在不同取值下的概率.23.(1)0.94r ≈,线性相关性较弱;(2) +77.3ˆyx =。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2017-2018学年人教B版选修2-3统计案例单元测试一.选择题(共9小题)1.某研究员为研究某两个变量的相关性,随机抽取这两个变量样本数据如下表:若依据表中数据画出散点图,则样本点(x i,y i)(i=1,2,3,4,5)都在曲线y=+1附近波动,但由于某种原因表中一个x值被污损,将方程y=+1作为回归方程,则根据回归方程y=+1和表中数据可求得被污损数据为()A.﹣4.32 B.1.69 C.1.96 D.4.322.考查某班学生数学、外语成绩得到2×2列联表如表:那么,随机变量K2的观测值k等于()A.10.3 B.8 C.4.25 D.9.33.有一散点图如图所示,在5个(x,y)数据中去掉D(3,10)后,下列说法正确的是()A.残差平方和变小B.相关系数r变小C.相关指数R2变小D.解释变量x与预报变量y的相关性变弱4.表提供了某厂节能降低技术改造后产生甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.根据表提供的数据,用最小二乘法求出y关于x的线性回归方程=0.7x+a,则实数a的值为()A.0.35 B.0.3 C.0.4 D.0.55.变量x、y具有线性相关关系,当x的取值为8,12,14,16时,通过观测知y的值分别为5,8,9,11,若在实际问题中,y的预报值最大是10,则x的最大取值不能超过()A.16 B.15 C.17 D.126.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y=3﹣5x,变量x增加一个单位时,y平均增加5个单位;③线性回归方程y=bx+a必过;④在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病;其中错误的个数是()A.0 B.1 C.2 D.37.已知变量x,y的值如表所示;如果y与x线性相关且回归直线方程为,则实数=()A.B.﹣C.D.﹣8.根据如下样本数据得到的回归方程为.若a=7.9,则x每增加1个单位,y就()A.增加1.4个单位B.减少1.4个单位C.增加1.2个单位D.减少1.2个单位9.工人工资(元)依劳动生产率(千元)变化的回归直线方程为,下列判断中正确的是()A.劳动生产率为1000元时,工资为130元B.劳动生产率平均提高1000元时,工资平均提高80元C.劳动生产率平均提高1000元时,工资平均提高130元D.当工资为250元时,劳动生产率为2000元二.填空题(共5小题)10.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是(填序号)11.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如表所示:试根据上述数据计算K2=,比较这两种手术对病人又发作心脏病的影响有没有差别.12.已知平面区域D由以A(2,4)、B(5,2)、C(3,1)为顶点的三角形内部和边界组成,若在区域D上有无穷多个点(x,y)可使目标函数z=x+my取得最小值,则m=.13.下面给出四种说法:①用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好;②命题P:“∃x0∈R,x02﹣x0﹣1>0”的否定是¬P:“∀x∈R,x2﹣x﹣1≤0”;③设随机变量X服从正态分布N(0,1),若P(x>1)=p,则P(﹣1<X<0)=﹣p④回归直线一定过样本点的中心(,).其中正确的说法有(请将你认为正确的说法的序号全部填写在横线上)14.在信息时代的今天,随着手机的发展,“微信”越来越成为人们交流的一种方式,某机构对“使用微信交流”的态度进行调查,随机抽取了100人,他们年龄的频数分布及对“使用微信交流”赞成的人数如下表:(注:年龄单位:岁)(1)若以“年龄45岁为分界点”,由以上统计数据完成下面的2×2列联表,并通过计算判断是否在犯错误的概率不超过0.001的前提下认为“使用微信交流的态度与人的年龄有关”?(2)若从年龄在[55,65),[65,75)的别调查的人中各随机选取两人进行追踪调查,记选中的4人中赞成“使用微信交流”的人数为X,求随机变量X的分布列及数学期望.参考数据:参考公式:K 2=,其中n=a +b +c +d .三.解答题(共3小题)15.某市为迎接“国家义务教育均衡发展”综合评估,市教育行政部门在全市范围内随机抽取了n 所学校,并组织专家对两个必检指标进行考核评分.其中x 、y 分别表示“学校的基础设施建设”和“学校的师资力量”两项指标,根据评分将每项指标划分为A (优秀)、B (良好)、C (及格)三个等级,调查结果如表所示.例如:表中“学校的基础设施建设”指标为B 等级的共有20+21+2=43所学校.已知两项指标均为B 等级的概率为0.21.(1)在该样本中,若“学校的基础设施建设”优秀率是0.4,请填写下面2×2列联表,并根据列联表判断是否有90%的把握认为“学校的基础设施建设”和“学校的师资力量”有关;(2)在该样本的“学校的师资力量”为C 等级的学校中,若a ≥18,11≤b ≤15,记随机变量ξ=|a﹣b |,求ξ的分布列和数学期望. 附表: .16.某兴趣小组进行“野岛生存”实践活动,他们设置了200个取水敞口箱.其中100个采用A种取水法,100个采用B种取水法.如图甲为A种方法一个夜晚操作一次100个水箱积取淡水量频率分布直方图,图乙为B种方法一个夜晚操作一次100个水箱积取淡水量频率分布直方图.(1)设两种取水方法互不影响,设M表示事件“A法取水箱水量不低于1.0kg,B 法取水箱水量不低于1.1kg”,以样本估计总体,以频率分布直方图中的频率为概率,估计M的概率;(2)填写下面2×2列联表,并判断是否有99%的把握认为箱积水量与取水方法有关.附:K2=17.某企业为了对新研发的一批产品进行合理定价,将产品按事先拟定的价格进行试销,得到一组销售数据(x i,y i)(i=1,2,…6),如表所示:已知(1)求q的值(2)已知变量x,y具有线性相关性,求产品销量y关于试销单价x的线性回归方程可供选择的数据(3)用表示(2)中所求的线性回归方程得到的与x i对应的产品销量的估计值.当销售数据(x i,y i)(i=1,2,…,6)对应的残差的绝对值时,则将销售数据(x i,y i)称为一个“好数据”.试求这6组销售数据中的“好数据”.参考数据:线性回归方程中的最小二乘估计分别是.2017-2018学年人教B版选修2-3统计案例单元测试参考答案与试题解析一.选择题(共9小题)1.某研究员为研究某两个变量的相关性,随机抽取这两个变量样本数据如下表:若依据表中数据画出散点图,则样本点(x i,y i)(i=1,2,3,4,5)都在曲线y=+1附近波动,但由于某种原因表中一个x值被污损,将方程y=+1作为回归方程,则根据回归方程y=+1和表中数据可求得被污损数据为()A.﹣4.32 B.1.69 C.1.96 D.4.32【分析】设被污损的数据为a,令z=,对数据进行二次拟合,则数据(z i,y i)在直线y=z+1附近波动,列出z与y的对应值,计算、,把(,)代入直线y=z+1中求出a的值.【解答】解:设被污损的数据为a,令z=,则y与z线性相关,回归直线方程为y=z+1,列出z与y的对应值如下:计算=×(0.2+1++2.2+3.2)=,=×(1.1+2.1+2.3+3.3+4.3)=2.62;把(,)代入直线y=z+1中,得2.62=+1,解得a=1.69,所以表中被污损的数据为1.69.故选:B.【点评】本题考查了可化为线性相关的回归方程的应用问题,属于中档题.2.考查某班学生数学、外语成绩得到2×2列联表如表:那么,随机变量K2的观测值k等于()A.10.3 B.8 C.4.25 D.9.3【分析】利用观测值公式计算即可.【解答】解:由2×2列联表中数据,计算K2=≈4.25.故选:C.【点评】本题考查了利用列联表求独立性检验观测值的应用问题,是基础题目.3.有一散点图如图所示,在5个(x,y)数据中去掉D(3,10)后,下列说法正确的是()A.残差平方和变小B.相关系数r变小C.相关指数R2变小D.解释变量x与预报变量y的相关性变弱【分析】利用散点图分析数据,判断相关系数,相关指数,残差的平方和,的变化情况.【解答】解:∵从散点图可分析得出:只有D点偏离直线远,去掉D点,变量x与变量y的线性相关性变强,∴相关系数变大,相关指数变大,残差的平方和变小,故选:A.【点评】本题考察了利用散点图分析数据,判断变量的相关性问题,属于运用图形解决问题的能力,属于容易出错的题目.4.表提供了某厂节能降低技术改造后产生甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.根据表提供的数据,用最小二乘法求出y关于x的线性回归方程=0.7x+a,则实数a的值为()A.0.35 B.0.3 C.0.4 D.0.5【分析】首先,设x,y的样本平均值分别为:,,求解得到==4.5,==3.5.得到样本中心点为(4.5,3.5),然后,将此代人方程,求解即可.【解答】解:设x,y的样本平均值分别为:,,则==4.5,==3.5.∴样本中心点为(4.5,3.5),代人线性回归直线方程,得3.5=0.7×4.5+a,∴a=0.35,故选:A.【点评】本题重点考查了平均值的计算、线性回归直线方程及其求解等知识,属于中档题.5.变量x、y具有线性相关关系,当x的取值为8,12,14,16时,通过观测知y的值分别为5,8,9,11,若在实际问题中,y的预报值最大是10,则x的最大取值不能超过()A.16 B.15 C.17 D.12【分析】由题意求出回归直线方程,利用回归方程≤10求得x的最大值.【解答】解:由题意得:=×(8+12+14+16)=12.5,=×(5+8+9+11)=8.25,x i y i=8×5+12×8+14×9+16×11=438,=82+122+142+162=660;则==≈0.7289,=﹣=8.25﹣0.7289×12.5=﹣0.8575,∴回归直线方程为=0.7689x﹣0.8575,由≤10,解得x≤14.90,∴x的最大值是15.故选:B.【点评】本题考查了线性回归方程的求法与应用问题,是运算量较大的题目.6.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y=3﹣5x,变量x增加一个单位时,y平均增加5个单位;③线性回归方程y=bx+a必过;④在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病;其中错误的个数是()A.0 B.1 C.2 D.3【分析】根据概率与统计的知识,对题目中的问题进行分析、判断即可.【解答】解:对于①,方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变,正确;对于②,设有一个回归方程y=3﹣5x,变量x增加一个单位时,y应平均减少5个单位,②错误;对于③,线性回归方程y=bx+a必过样本中心点,正确;对于④,在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病,错误;综上,其中错误的个数是2.故选:C.【点评】本题考查了线性回归方程和独立性检验以及方差的变化特点、相关关系的应用问题,是基础题目.7.已知变量x,y的值如表所示;如果y与x线性相关且回归直线方程为,则实数=()A.B.﹣C.D.﹣【分析】首先,根据所给数据得到样本中心点为(3,5),然后,将该点代入直线方程,即可得到结果.【解答】解:根据表格可以得到,,∴样本中心点为(3,5)代入方程得5=3b+,∴b=.故选:C.【点评】本题重点考查了线性回归直线方程的求解,属于中档题.8.根据如下样本数据得到的回归方程为.若a=7.9,则x每增加1个单位,y就()A.增加1.4个单位B.减少1.4个单位C.增加1.2个单位D.减少1.2个单位【分析】首先,根据所给数据,计算样本中心点(5,0.9),然后,将改点代人回归方程,得到b=﹣1.4,从而得到答案.【解答】解:设变量x,y的平均值为:,,∴==5,=0.9,∴样本中心点(5,0.9),∴0.9=5×b+7.9∴b=﹣1.4,∴x每增加1个单位,y就减少1.4.故选:B.【点评】本题重点考查了回归直线方程的特征、回归直线方程中回归系数的意义等知识,属于中档题.9.工人工资(元)依劳动生产率(千元)变化的回归直线方程为,下列判断中正确的是()A.劳动生产率为1000元时,工资为130元B.劳动生产率平均提高1000元时,工资平均提高80元C.劳动生产率平均提高1000元时,工资平均提高130元D.当工资为250元时,劳动生产率为2000元【分析】根据所给的工人工资与劳动生产率变化的回归方程为y=50+80x,写出当自变量由x变化为x+1时,y的变化是50+80(x+1)﹣50﹣80x,用文字叙述出来.【解答】解:∵工人工资与劳动生产率变化的回归方程为y=50+80x,∴当自变量由x变化为x+1时,y的变化是50+80(x+1)﹣50﹣80x=80,即当劳动生产率平均提高1千元时,工资平均提高80元,只有B选项是说清楚是平均增长,A和C的增加的工资数不对,D选项颠倒了因果关系.故选:B.【点评】本题考查线性回归方程的应用,本题解题的关键是求出y的变化值,叙述时要指明得到的结果是一个预报值或平均值.二.填空题(共5小题)10.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是③(填序号)【分析】根据独立性检验的基本思想,对题目中的命题进行分析、判断即可.【解答】解:对于①,若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,从独立性检验知,这一句话的意思是有99%的把握认为这个推理是正确的,有1%的可能性认为推理出现错误,并不是说在100个吸烟的人中必有99人患有肺病,①错误;对于②,从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,从独立性检验知,这一句话的意思是有99%的把握认为这个推理是正确的,有1%的可能性认为推理出现错误,并不是说某人吸烟,那么他有99%的可能患有肺病,②错误;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,从独立性检验知,这句话的意思是有95%的把握认为这个推理是正确的,有5%的可能性使得推断错误,③正确.综上,以上说法正确的是③.故答案为:③.【点评】本题考查了独立性检验的基本思想与应用问题,是基础题目.11.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如表所示:试根据上述数据计算K2= 1.78,比较这两种手术对病人又发作心脏病的影响有没有差别当H0成立时,K2≈1.78,而K2<2.072的概率为0.85.所以,不能否定假设H0.也就是不能作出这两种手术对病人又发作心脏病的影响有差别的结论.【分析】先提出假设H0:两种手术对病人又发作心脏病的影响没有差别,根据2×2列联表中的数据代入公式与临界值比较以判断关联性的大小进而做出判断.【解答】解:提出假设H0:两种手术对病人又发作心脏病的影响没有差别.根据2×2列联表中的数据,可以求得K2=≈1.78.当H0成立时,K2≈1.78,而K2<2.072的概率为0.85.所以,不能否定假设H0.也就是不能作出这两种手术对病人又发作心脏病的影响有差别的结论.故答案为:1.78;不能作出这两种手术对病人又发作心脏病的影响有差别的结论【点评】本题主要考查独立性检验的应用,其基本步骤是先由题中数据完成2×2列联表,代入公式的值后与临界值比较,以做出对实际问题的判断12.已知平面区域D由以A(2,4)、B(5,2)、C(3,1)为顶点的三角形内部和边界组成,若在区域D上有无穷多个点(x,y)可使目标函数z=x+my取得最小值,则m=.【分析】方法一:利用数形结合法,画出△ABC表示的平面区域,结合图形知当直线x+my=0与直线AC平行时,线段AC上的任意一点都可使目标函数z=x+my 取得最小值,从而求出m的值.方法二:根据题意,区域的三个顶点中一定有两个顶点的坐标是最优解,故此两点处函数值相等,且小于第三个顶点处的目标函数值,由此列出方程和不等式求出m的值.【解答】解:(方法一)依题意,满足已知条件的三角形如图所示:令z=0,可得直线x+my=0的斜率为﹣,结合可行域可知当直线x+my=0与直线AC平行时,线段AC上的任意一点都可使目标函数z=x+my取得最小值,而直线AC的斜率为=﹣3,所以﹣=﹣3,解得m=.(方法二)依题意,2+4m=5+2m<3+m①,或2+4m=3+m<5+2m②,或3+m=5+2m<2+4m③,解得m∈∅,或m=,或m∈∅,所以m=.故答案为:.【点评】本题考查了线性规划的应用问题,当目标函数的最优解有无数多个时,处理方法一般是:①将目标函数的解析式进行变形,化成斜截式;②分析z与截距的关系,是符号相同,还是相反;③根据分析结果,结合图形做出结论;④根据斜率相等求出参数.13.下面给出四种说法:①用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好;②命题P:“∃x0∈R,x02﹣x0﹣1>0”的否定是¬P:“∀x∈R,x2﹣x﹣1≤0”;③设随机变量X服从正态分布N(0,1),若P(x>1)=p,则P(﹣1<X<0)=﹣p④回归直线一定过样本点的中心(,).其中正确的说法有②③④(请将你认为正确的说法的序号全部填写在横线上)【分析】①用相关指数R2来刻画回归效果时,R2越大,模型的拟合效果越好;②根据特称命题的否定的全称命题,写出P的否定¬P即可;③根据正态分布N(0,1)的性质,由P(X>1)=p求出P(﹣1<X<0)的值;④回归直线一定过样本点的中心(,).【解答】解:对于①,用相关指数R2来刻画回归效果时,R2越大,说明模型的拟合效果越好,∴①错误;对于②,命题P:“∃x0∈R,x02﹣x0﹣1>0”的否定是¬P:“∀x∈R,x2﹣x﹣1≤0”,②正确;对于③,根据正态分布N(0,1)的性质可得,若P(X>1)=p,则P(X<﹣1)=p,∴P(﹣1<X<1)=1﹣2p,∴P(﹣1<X<0)=﹣p,③正确;对于④,回归直线一定过样本点的中心(,),正确;综上,正确的说法是②③④.故答案为:②③④.【点评】本题考查了概率与统计的应用问题,也考查了特称命题的否定问题,是综合题.14.在信息时代的今天,随着手机的发展,“微信”越来越成为人们交流的一种方式,某机构对“使用微信交流”的态度进行调查,随机抽取了100人,他们年龄的频数分布及对“使用微信交流”赞成的人数如下表:(注:年龄单位:岁)(1)若以“年龄45岁为分界点”,由以上统计数据完成下面的2×2列联表,并通过计算判断是否在犯错误的概率不超过0.001的前提下认为“使用微信交流的态度与人的年龄有关”?(2)若从年龄在[55,65),[65,75)的别调查的人中各随机选取两人进行追踪调查,记选中的4人中赞成“使用微信交流”的人数为X,求随机变量X的分布列及数学期望.参考数据:参考公式:K2=,其中n=a+b+c+d.【分析】(1)根据频数分布,填写2×2列联表,计算观测值K2,对照临界值得出结论;(2)根据题意知X所有可能取值,计算对应的概率值,写出X的分布列,计算期望值.【解答】解:(1)根据频数分布,填写2×2列联表如下;计算观测值K2==≈14.512>10.828,对照临界值表知,在犯错误的概率不超过0.001的前提下认为“使用微信交流的态度与人的年龄有关”;(2)根据题意,X所有可能取值有0,1,2,3,P(X=0)=•=,P(X=1)=•+•=,P(X=2)=•+•=,P(X=3)=•=,所以X的分布列是所以X 的期望值是EX=0×+1×+2×+3×=.【点评】本题考查了独立性检验与离散型随机变量的分布列和期望的问题,是综合题.三.解答题(共3小题)15.某市为迎接“国家义务教育均衡发展”综合评估,市教育行政部门在全市范围内随机抽取了n 所学校,并组织专家对两个必检指标进行考核评分.其中x 、y 分别表示“学校的基础设施建设”和“学校的师资力量”两项指标,根据评分将每项指标划分为A (优秀)、B (良好)、C (及格)三个等级,调查结果如表所示.例如:表中“学校的基础设施建设”指标为B 等级的共有20+21+2=43所学校.已知两项指标均为B 等级的概率为0.21.(1)在该样本中,若“学校的基础设施建设”优秀率是0.4,请填写下面2×2列联表,并根据列联表判断是否有90%的把握认为“学校的基础设施建设”和“学校的师资力量”有关;(2)在该样本的“学校的师资力量”为C 等级的学校中,若a ≥18,11≤b ≤15,记随机变量ξ=|a ﹣b |,求ξ的分布列和数学期望. 附表:.【分析】(1)依题意求得n、a和b的值,填写列联表,计算K2,对照临界值得出结论;(2)由题意得到满足条件的(a,b),再计算ξ的分布列和数学期望值.【解答】解:(1)依题意得,解得n=100,由,解得a=8;由20+20+1+12+21+1+a+2+b=100,解得b=15;填写列联表如下;计算,因为2.027<2.232<2.706,所以没有90%的把握认为“学校的基础设施建设”和“学校的师资力量”有关;(2)由a≥8,11≤b≤15,得到满足条件的(a,b);有:(8,15),(9,14),(10,13),(11,12),(12,11);故ξ的分布列为故.【点评】本题考查了独立性检验和离散型随机变量的分布列与数学期望问题,是中档题.16.某兴趣小组进行“野岛生存”实践活动,他们设置了200个取水敞口箱.其中100个采用A种取水法,100个采用B种取水法.如图甲为A种方法一个夜晚操作一次100个水箱积取淡水量频率分布直方图,图乙为B种方法一个夜晚操作一次100个水箱积取淡水量频率分布直方图.(1)设两种取水方法互不影响,设M表示事件“A法取水箱水量不低于1.0kg,B 法取水箱水量不低于1.1kg”,以样本估计总体,以频率分布直方图中的频率为概率,估计M的概率;(2)填写下面2×2列联表,并判断是否有99%的把握认为箱积水量与取水方法有关.附:K2=【分析】(1)设“A法取水箱水量不低于1.0kg”为事件E,“B法取水箱水量不低于1.1k g”为事件F,求出P(E)、P(F),再计算P(M)的值;(2)填写2×2列联表,计算K2,对照临界值得出结论.【解答】解:(1)设“A法取水箱水量不低于1.0kg”为事件E,“B法取水箱水量不低于1.1kg”为事件F,则P(E)=(2+1+0.3)×0.1=0.33,P(F)=(5+3+0.2+0.1)×0.1=0.83,P(M)=P(EF)=P(E)×P(F)=0.33×0.83=0.2739,故M发生的概率为0.2739;(2)填写2×2列联表如下:计算K2==≈98.157>6.635,∴P(K2=98.157>6.635)<0.01,∴有99%的把握认为箱积水量与取水方法有关.【点评】本题考查了概率计算问题和列联表、独立性检验的应用问题,是综合题.17.某企业为了对新研发的一批产品进行合理定价,将产品按事先拟定的价格进行试销,得到一组销售数据(x i,y i)(i=1,2,…6),如表所示:已知(1)求q的值(2)已知变量x,y具有线性相关性,求产品销量y关于试销单价x的线性回归方程可供选择的数据(3)用表示(2)中所求的线性回归方程得到的与x i对应的产品销量的估计值.当销售数据(x i,y i)(i=1,2,…,6)对应的残差的绝对值时,则将销售数据(x i,y i)称为一个“好数据”.试求这6组销售数据中的“好数据”.参考数据:线性回归方程中的最小二乘估计分别是.【分析】(1)根据题意计算,列方程求出q的值;(2)计算平均数和回归系数,写出y关于x的回归方程;(3)根据回归方程计算预测值,与实际值比较,判断是否为好数据.【解答】解:(1)根据题意,计算=×(q+84+83+80+75+68)=80,解得q=90;…(3分)(2)计算=×(4+5+6+7+8+9)=6.5,…(4分)∴==﹣4,…(6分)=80﹣(﹣4)×6.5=106,…(7分)∴y关于x的回归方程是=﹣4x+106;…(8分)(3)∵回归方程为=﹣4x+106∴=﹣4x1+106=90|﹣y1|=|90﹣90|=0<1,∴(x1,y1)=(4,90)是好数据;=﹣4x2+106=86|﹣y2|=|86﹣84|=2>1,∴(x2,y2)=(5,84)不是好数据;=﹣4x3+106=82|﹣y3|=|82﹣83|=1=1,∴(x3,y3)=(6,83)是好数据;=﹣4x4+106=78|﹣y4|=|78﹣80|=2>1,∴(x4,y4)=(7,80)不是好数据;=﹣4x5+106=74|﹣y5|=|74﹣75|=1=1,∴(x5,y5)=(8,75)是好数据;=﹣4x6+106=70|﹣y6|=|70﹣68|=2>1,∴(x6,y6)=(9,68)不是好数据;∴好数据为(4,90),(6,68),(8,75).…(12分)【点评】本题考查了线性回归方程的求法与应用问题,是基础题.。

相关文档
最新文档