2018届高考数学二轮复习 寒假作业(十七)统计、统计案例(注意命题点的区分度)文
2018高考数学备考艺体生百日突围专题17统计与统计案例附解析

2018高考数学备考艺体生百日突围专题17统计与统计案例附解析专题十七 统计与统计案例抽样方法【背一背基础知识】1.简单随机抽样:一般地,从元素个数为N 的总体中逐个不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.最常用的简单随机抽样的方法:抽签法和随机数法.简单随机抽样适用范围是:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小。
2.系统抽样:假设要从容量为N 的总体中抽取容量为n 的样本,第一步,先将总体的N 个个体编号;第二步,确定分隔间距k ,对编号进行分段,当N n (n 是样本容量)是整数时,取k =N n ;当Nn (n 是样本容量)不是整数时,先用简单随机抽样剔除N n -[N n ]个个体,取k =[Nn ];第三步,在第1段用简单随机抽样确定第一个个体编号l (l ≤k );第四步,按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号l k +,再加k 得到第3个个体编号2l k +,依次进行下去,直到获取整个样本.系统抽样的适用范围是:元素个数很多且均衡的总体;各个个体被抽到的机会均等。
3.分层抽样:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个互不交叉的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.分层抽样的应用范围是:总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.【讲一讲提高技能】1.必备技能:在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分成几个组,则分段间隔即为N n(N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值. 2.典型例题:例1【2018届江西省金溪一中、余江一中等五市八校高三上第一次联考】从编号为错误!未找到引用源。
2018年高考数学文科二轮复习 名师导学案:专题六 第1

第1讲统计与统计案例高考定位 1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要以选择题、填空题形式命题,难度较小;2.注重知识的交汇渗透,统计与概率,回归分析与概率是近年命题的热点,2015年,2016年和2017年在解答题中均有考查.真题感悟1.(2017·全国Ⅰ卷)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数解析刻画评估这种农作物亩产量稳定程度的指标是标准差.答案 B2.(2016·全国Ⅲ卷)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个解析 根据雷达图可知全年最低气温都在0 ℃以上,故A 正确;一月平均最高气温是6 ℃左右,平均最低气温2 ℃左右,七月平均最高气温22 ℃左右,平均最低气温13 ℃左右,所以七月的平均温差比一月的平均温差大,B 正确;三月和十一月的平均最高气温都是10 ℃,三月和十一月的平均最高气温基本相同,C 正确;平均最高气温高于20 ℃的有七月和八月,D 项不正确. 答案 D3.(2017·山东卷)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为y ^=b ^x +a ^.已知∑10i =1x i =225,∑10i =1y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为( ) A.160 B.163 C.166D.170解析 由已知得x -=22.5,y -=160,∵回归直线方程过样本点中心(x -,y -),且b ^=4,∴160=4×22.5+a ^,解得a ^=70.∴回归直线方程为y ^=4x +70,当x =24时,y ^=166. 答案 C4.(2017·全国Ⅱ卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50 kg”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较. 附:K 2=n (ad (a +b )(c +d )(a +c )(b +d )解 (1)由频率分布直方图知,旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,则事件A 的概率估计值为0.62. (2)列联表如下:∴K 2=100×100×104×96≈15.705>6.635,∴有99%的把握认为箱产量与养殖方法有关.(3)由箱产量的频率分布直方图可知,旧养殖法的箱产量平均值(或中位数)约在45~50 kg 之间,新养殖法的箱产量平均值(或中位数)约在50~55 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法分布集中程度高,可知新养殖法的箱产量高且稳定,从而新养殖法优于旧养殖法.考 点 整 合1.抽样方法抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围. 2.统计中的四个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即x -=1n(x 1+x 2+…+x n ).(4)方差与标准差.s 2=1n[(x 1-x - )2+(x 2-x - )2+…+(x n -x -)2],s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].3.直方图的两个结论(1)小长方形的面积=组距×频率组距=频率. (2)各小长方形的面积之和等于1. 4.回归分析与独立性检验(1)回归直线y ^ =b ^ x +a ^ 经过样本点的中心点(x - ,y -),若x 取某一个值代入回归直线方程y ^ =b ^ x +a ^ 中,可求出y 的估计值. (2)独立性检验对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:则K 2=n (ad -(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d 为样本容量).热点一 抽样方法【例1】 (1)(2015·北京卷)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )A.90 C.180D.300(2)(2017·长沙雅礼中学质检)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析 (1)设该样本中的老年教师人数为x ,由题意及分层抽样的特点得x 900=3201 600,故x =180.(2)依题意,可将编号为1~35号的35个数据分成7组,每组有5个数据.在区间[139,151]上共有20个数据,分在4个小组内,每组抽取1人,共抽取4人. 答案 (1)C (2)4探究提高 1.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量与总体容量的比值. 2.在系统抽样的过程中,要注意分段间隔,需要抽取n 个个体,样本就需要分成n 个组,则分段间隔即为N n(N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.【训练1】 (1)(2017·郑州模拟)为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( ) A.13 B.19 C.20D.51(2)(2017·江苏卷)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.解析 (1)由系统抽样的原理知,抽样的间隔为52÷4=13,故抽取的样本的编号分别为7,7+13, 7+13×2,7+13×3,即7号,20号,33号,46号. ∴样本中还有一位同学的编号为20号.(2)因为样本容量n =60,样本总体N =200+400+300+100=1 000,所以抽取比例为n N =601000=350. 因此应从丙种型号的产品中抽取300×350=18(件).答案 (1)C (2)18 热点二 用样本估计总体命题角度1 数字特征与茎叶图的应用【例2-1】 (2017·北京东城质检)某班男女生各10名同学最近一周平均每天的锻炼时间(单位:分钟)用茎叶图记录如下:假设每名同学最近一周平均每天的锻炼时间是互相独立的. ①男生每天锻炼的时间差别小,女生每天锻炼的时间差别大; ②从平均值分析,男生每天锻炼的时间比女生多;③男生平均每天锻炼时间的标准差大于女生平均每天锻炼时间的标准差;④从10个男生中任选一人,平均每天的锻炼时间超过65分钟的概率比同样条件下女生锻炼时间超过65分钟的概率大.其中符合茎叶图所给数据的结论是( ) A.①②③ B.②③④ C.①②④D.①③④解析 由茎叶图知,男生每天锻炼时间差别小,女生差别大,①正确.男生平均每天锻炼时间超过65分钟的概率P 1=510=12,女生平均每天锻炼时间超过65分钟的概率P 2=410=25,P 1>P 2,因此④正确.设男生、女生两组数据的平均数分别为x -甲,x -乙,标准差分别为s 甲,s 乙. 易求x - 甲=65.2,x - 乙=61.8,知x - 甲>x -乙,②正确.又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散, ∴s 甲<s 乙,③错误,因此符合茎叶图所给数据的结论是①②④. 答案 C命题角度2 用样本的频率分布估计总体分布【例2-2】 (2016·四川卷)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.解(1)由频率分布直方图可知,月均用水量在[0,0.5)内的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12. 由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.又前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.探究提高 1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小.2.在本例2-2中,抓住频率分布直方图各小长方形的面积之和为1,这是求解的关键;本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.【训练2】(2017·北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为 (0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0. 9-5=5. 所以总体中分数在区间[40,50)内的人数估计为400×5100=20. (3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2. 热点三 回归分析与独立性检验【例3】 (1)某新闻媒体为了了解观众对央视《开门大吉》节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:参考附表:(参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d )(2)(2016·全国Ⅲ卷)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1~7分别对应年份2008~2014.①由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; ②建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注:回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为:(1)解析 分析列联表中数据,可得K 2的一个观测值k =110×(40×30-20×20)260×50×60×50≈7.822>6.635,所以有99%的把握认为“喜爱《开门大吉》节目与否和性别有关”. 答案 99%(2)解 ①由折线图中的数据和附注中参考数据得t -=4,因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.a ^=y - -b ^t -≈1.331-0.103×4≈0.92.所以,y 关于t 的回归方程为y ^=0.92+0.10t .将2016年对应的t =9代入回归方程得:y ^=0.92+0.10×9=1.82. 所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨. 探究提高 1.求回归直线方程的关键及实际应用 (1)关键:正确理解计算b ^,a ^的公式和准确地计算.(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.2.独立性检验的关键(1)根据2×2列联表准确计算K 2,若2×2列联表没有列出来,要先列出此表.(2)K 2的观测值k 越大,对应假设事件H 0成立(两类变量相互独立)的概率越小,H 0不成立的概率越大.【训练3】 (1)(2017·贵阳调研)某医疗研究所为了检验某种血清能起到预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,利用2×2列联表计算得K 2的观测值k ≈3.918. 附表:A.95%B.5%C.97.5%D.2.5%(2)(2017·唐山一模)某市春节期间7家超市的广告费支出x i (万元)和销售额y i (万元)数据如下:②用对数回归模型拟合y 与x 的关系,可得回归方程y ^=12ln x +22,经计算得出线性回归模型和对数模型的R 2分别约为0.75和0.97,请用R 2说明选择哪个回归模型更合适,并用此模型预测A 超市广告费支出为8万元时的销售额.(1)解析 ∵k ≈3.918>3.841,且P (K 2≥k 0=3.841)=0.05,根据独立性检验思想“这种血清能起到预防感冒的作用”出错的可能性不超过5%. 答案 B因此a ^=y - -b ^x -=42-1.7×8=28.4.所以,y 关于x 的线性回归方程是y ^=1.7x +28.4. ②∵0.75<0.97,∴对数回归模型更合适.当x =8时,y ^=12ln 8+22=36ln 2+22=36×0.7+22=47.2万元. ∴广告费支出8万元时,预测A 超市销售额为47.2万元.1.用样本估计总体是统计的基本思想.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.2.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大.3.茎叶图、频率分布表和频率分布直方图都可直观描述样本数据的分布规律.在频率分布直方图中,可分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小反映方差(标准差)的大小. 注意:频率分布直方图的纵轴刻度是频率组距,而不是频率,每个小直方图的面积才是相应区间的频率.4.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.一、选择题1.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( ) A.7 B.9 C.10D.15解析 抽取号码的间隔为96032=30,从而区间[451,750]包含的段数为75030-45030=10,则编号落入区间[451,750]的人数为10人,即做问卷B 的人数为10. 答案 C2.(2017·全国Ⅲ卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( ) A.月接待游客量逐月增加 B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 解析 由题图可知,2014年8月到9月的月接待游客量在减少,则A 选项错误. 答案 A3.(2017·山东卷)如图所示的茎叶图记录了甲乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A.3,5B.5,5C.3,7D.5,7解析 由茎叶图知甲组数据中位数为65,所以y =5,此时乙组平均值为66.56+65+62+74+70+x 5=66,解得x =3.答案 A4.(2017·汉中模拟)已知两个随机变量x ,y 之间的相关关系如表所示:根据上述数据得到的回归方程为y =b x +a ,则大致可以判断( ) A.a ^>0,b ^>0 B.a ^>0,b ^<0 C.a ^<0,b ^>0D.a ^<0,b ^<0解析 作出散点图,画出回归直线直观判定b ^>0,a ^<0. 答案 C5.(2017·济南调研)2016年济南地铁正式开工建设,地铁时代的到来能否缓解济南的交通拥堵状况呢?某社团进行社会调查,得到的数据如下表:附:K 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d )A.有95%的把握认为“对能否缓解交通拥堵的认识与性别有关”B.有95%的把握认为“对能否缓解交通拥堵的认识与性别无关”C.有99%的把握认为“对能否缓解交通拥堵的认识与性别有关”D.有99%的把握认为“对能否缓解交通拥堵的认识与性别无关” 解析 由2×2列联表,可求K 2的观测值,k =(48+30+12+20)(20×48-12×30)2(48+30)(48+12)(12+20)(30+20)≈5.288>3.841. 由统计表P (K 2≥3.841)=0.05,∴有95%的把握认为“能否缓解交通拥堵的认识与性别有关”. 答案 A 二、填空题6.(2017·石家庄质检)为比较甲、乙两地14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论: ①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号正确的是________.解析 x - 甲=26+28+29+31+315=29,x - 乙=28+29+30+31+325=30,则x - 甲<x - 乙,①正确. 由茎叶图知,乙地的气温相对比较集中,甲地的气温相对比较离散. 所以甲地该月的标准差大于乙地该月的标准差,④正确. 答案 ①④7.(2017·泉州模拟)某厂在生产甲产品的过程中,产量x (吨)与生产能耗y (吨)的对应数据如表:根据最小二乘法求得回归方程为y =0.65x +a ,当产量为80吨时,预计需要生产能耗为________吨.解析 由题意,x -=45,y -=36.25,代入y ^=0.65x +a ^,得a ^=7,∴当产量为80吨时,预计需要生产能耗为0.65×80+7=59. 答案 598.(2016·山东卷改编)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是________.解析 设所求的人数为n ,由频率分布直方图,自习时间不少于22.5小时的频率为(0.04+0.08+0.16)×2.5=0.7,∴n =0.7×200=140. 答案 140 三、解答题9.(2017·全国Ⅲ卷)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:(1)估计六月份这种酸奶一天的需求量不超过300瓶的概率;(2)设六月份一天销售这种酸奶的利润为Y (单位:元),当六月份这种酸奶一天的进货量为450瓶时,写出Y 的所有可能值,并估计Y 大于零的概率.解 (1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25,由表中数据可知,最高气温低于25的频率为2+16+3690=0.6.所以这种酸奶一天的需求量不超过300瓶的概率的估计值为0.6. (2)当这种酸奶一天的进货量为450瓶时,若最高气温低于20,则Y=200×6+(450-200)×2-450×4=-100;若最高气温位于区间[20,25),则Y=300×6+(450-300)×2-450×4=300;若最高气温不低于25,则Y=450×(6-4)=900,所以,利润Y的所有可能值为-100,300,900.Y大于零当且仅当最高气温不低于20,由表格数据知,最高气温不低于20的频率为36+25+7+490=0.8.因此Y大于零的概率的估计值为0.8.10.(2017·赤峰二模)微信是腾讯公司推出的一种手机通讯软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人(被称为微商).为了调查每天微信用户使用微信的时间,某经销化妆品的微商在一广场随机采访男性、女性用户各50名,将男性、女性使用微信的时间分成5组:(0,2],(2,4],(4,6],(6,8],(8,10]分别加以统计,得到如图所示的频率分布直方图.(1)根据女性频率分布直方图估计女性使用微信的平均时间;(2)若每天玩微信超过4小时的用户列为“微信控”,否则称其为“非微信控”,请你根据已知条件完成2×2的列联表,并判断是否有90%的把握认为“微信控”与“性别有关”?解(1)女性平均使用微信的时间为:0.16×1+0.24×3+0.28×5+0.2×7+0.12×9=4.76(小时).(2)由已知得:2(0.04+a+0.14+2×0.12)=1,解得a=0.08.由题设条件得列联表∴K2=n(ad(a+b)(c+d)(a+c)(b+d)=100(38×20-30×12)250×50×68×32≈2.941>2.706.所以有90%的把握认为“微信控”与“性别”有关.11.(2017·全国Ⅰ卷)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尽寸:(1)求(x i ,i )(i =1,2,…,16)的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r |<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(x --3s ,x -+3s )之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. ①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(x - -3s ,x -+3s )之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)解 (1)由样本数据得(x i ,i )(i =1,2,…,16)的相关系数由于|r |<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于x - =9.97,s ≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(x --3s ,x -+3s )以外. 因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为 115(16×9.97-9.22)=10.02, 这条生产线当天生产的零件尺寸的均值的估计值为10.02.i =116x 2i ≈16×0.2122+16×9.972≈1 591.134, 剔除第13个数据,剩下数据的样本方差为 115(1 591.134-9.222-15×10.022)≈0.008, 这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09.。
最新-2018高考数学二轮复习 专题限时集训(十七)统计与

专题限时集训(十七)[第17讲 统计与概率的实际应用](时间:45分钟)1.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( ) A.y ^=-10x +200 B.y ^=10x +200 C.y ^=-10x -200 D.y ^=10x -2002.一位母亲记录了儿子3岁至9岁的身高,数据如下表,由此建立的身高与年龄的回归模型为y ^=7.19x +73.93.用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )B .身高在145.83 cm 以上C .身高在145.83 cm 左右D .身高在145.83 cm 以下3.为了研究色盲与性别的关系,调查了1 000人,得到了如下数据:则( )A .有99.9%的把握认为色盲与性别有关B .有99%的把握认为色盲与性别有关C .有95%的把握认为色盲与性别有关D .有90%的把握认为色盲与性别有关4.工人月工资y (元)依劳动生产率x (千元)变化的回归直线方程为y ^=60+90x ,下列判断正确的是( )A .劳动生产率为1000元时,工资为50元B .劳动生产率提高1000元时,工资提高150元C .劳动生产率提高1000元时,工资提高90元D .劳动生产率为1000元时,工资为90元5.最小二乘法的原理是( ) A .使得错误!y i -(a +bx i )]2最小6.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图17-1(1);对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图17-1(2).由这两个散点图可以判断( )图17-1A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关7.用最小二乘法所建立起来的线性回归模型y ^=a +bx ,下列说法正确的是( ) A .使样本点到直线y =a +bx 的距离之和最小 B .使残差平方和最小 C .使相关指数最大 D .使总偏差平方和最大8.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产耗能y (吨标准煤)的几对数据根据上述数据,得到线性回归方程为y =0.7x +0.35,则a =( ) A .3 B .4 C .5 D .69.在性别与吃零食这两个分类变量的计算中,下列说法正确的是________.①若K 2的观测值为k =6.635,我们有99%的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;②从独立性检验可知有99%的把握认为吃零食与性别有关系时,我们说某人吃零食,那么此人是女性的可能性为99%;③若从统计量中求出有99%的把握认为吃零食与性别有关系,是指有1%的可能性使得出的判断出现错误.10.给出下列四个命题:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②样本方差反映了样本数据与样本平均值的偏离程度;③在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;④在回归直线方程y ^=0.1x +10中,当解释变量x 每增加一个单位时,预报变量y ^增加0.1个单位.其中正确命题的个数是________.11.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了气温表如图所示.由表中数据得到线性回归方程y =-2x +a ,预测当气温为-4℃时,用电量的度数约为________度.12.某工科院校对A ,B 两个专业的男女生人数进行调查,得到如下的列联表:(1)从B 少?(2)能否在犯错误的概率不超过0.18的前提下,认为工科院校中“性别”与“专业”有关系呢?注:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )13.为研究棋类运动对数学成绩的影响,某小学对甲、乙两个同类班级进行如下试验,其中甲班为试验班(进行棋类训练),乙班为对比班(常规教学,无棋类训练),在试验前的测试中,甲、乙两班学生在数学计算题上的得分率基本一致,试验结束后,统计几次数学计算题测试的平均成绩(均取整数)如下表所示:(1)试分别估计两个班级的优秀率;(2)由以上统计数据填写下面2×2列联表,并问是否有75%的把握认为“进行棋类训练对提高数学计算题优秀率有帮助”?.参考公式及数据:K2=(a+b)(c+d)(a+c)(b+d)专题限时集训(十七)【基础演练】1.A [解析] 根据负相关,直线的斜率为负值,只能是选项A 、C ,但选项C 中,当x 在正值(不可能是零或者负值)变化时,y 的估计值是负值,这与问题的实际意义不符合,故只可能是选项A 中的方程.2.C [解析] 由回归直线方程得到的数值只是估计值,故只有选项C 正确. 3.A [解析] K 2=1 000×(442×6-38×514)2956×44×480×520≈27.139>10.828.4.C [解析] 回归系数的意义为:解释变量每增加一个单位,预报变量平均增加b 个单位.【提升训练】5.D [解析] 最小二乘法的基本原理是使真实值和估计值差的平方和最小. 6.C [解析] 由这两个散点图可以判断,变量x 与y 负相关,u 与v 正相关,选C. 7.B [解析] 回归方程建立后,相关指数就是一个确定的值,这个值是衡量回归方程拟合效果的,它是由残差平方和确定的,而用最小二乘法建立起来的回归方程其实质是使残差平方和最小.8.A [解析] 由数据可知:x =4.5,y =a +114代入y ^=0.7x +0.35,解得a =3.9.③ [解析] 由独立性检验的基本思想可得,只有③正确. 10.3 [解析] ①是系统抽样;②③④全对,故共有3个正确命题.11.68 [解析] 因为x =18+13+10+(-1)4=10,y =24+34+38+644=40,所以线性回归方程y ^=-2x +a ^必过点(10,40),即40=-2×10+a ^,求得a ^=60,所以y ^=-2x +60.于是当x =-4时,y ^=68,即当气温为-4℃时,预测用电量的度数约为68度.12.解:(1)设B 专业的4名女生为甲、乙、丙、丁,随机选取两个共有(甲,乙),(甲,丙),(甲,丁),(乙,丙),(乙,丁),(丙,丁)6种可能,其中选到甲的共有3种可能,则女生甲被选到的概率是P =36=12.(2)根据列联表中的数据得K 2=100×(12×46-4×38)216×84×50×50≈4.762,由于4.762>3.841,因此能在犯错误的概率不超过0.18的前提下,认为工科院校中“性别”与“专业”有关系.13.解:(1)由题意,甲、乙两班均有学生50人,甲班优秀人数为30人,优秀率为3050=60%.乙班优秀人数为25人,优秀率为2550=50%.(2)注意到K 2=10050×50×55×45=99≈1.010.所以由参考数据知,没有75%的把握认为“进行棋类训练对提高数学计算题优秀率有帮助”.。
2018年高考数学总复习统计与统计案例(2021年整理)

2018年高考数学总复习统计与统计案例(word版可编辑修改)编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018年高考数学总复习统计与统计案例(word版可编辑修改))的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018年高考数学总复习统计与统计案例(word版可编辑修改)的全部内容。
第三节统计与统计案例考纲解读1. 理解随机抽样的必要性和重要性。
2. 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.3. 了解分布的意义和作用,会列频率分布表,会画出频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.4. 理解样本数据标准差的意义和作用,会计算数据标准差.5. 能从样本的频率分布估计总体分布,会用样本的基本数字牲估计总体的基本数字特征,理解用样本估计总体的思想。
6. 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题。
7. 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.8. 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
9. 了解常见的统计方法,并能应用这些方法解决一些实际问题。
(1)独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.(2)回归分析了解回归分析的基本思想、方法及其简单应用.命题趋势探究1。
本节内容是高考必考内容,以选择题、填空题为主.2. 命题内容为:(1)三种抽样(以分层抽样为主);(2)频率分布表和频率分布直方图的制作、识图及运用。
(1)(2)有结合趋势,考题难度中下.3。
统计案例为新课标教材新增内容,考查考生解决实际问题的能力。
2018届高考数学理二轮专题复习课时作业:专题七 概率与统计 十七 含答案 精品

课时作业(十七) 计数原理、二项式定理1.(2017·东北三省四市联考)哈市某公司有五个不同部门,现有4名在校大学生来该公司实习.要求安排到该公司的两个部门,且每部门安排两名,则不同的安排方案种数为( )A.40 B.60C.120 D.240解析:本题考查组合的应用.从五个不同部门选取两个部门有C25种选法,将4名大学生分别安排在这两个部门有C24C22种方法,所以不同的安排方案有C25C24C22=60种,故选B.答案:B2.(2017·陕西宝鸡市高三质量检测(一))我市正在建设最具幸福感城市,原计划沿渭河修建7个河滩主题公园.为提升城市品味、升级公园功能,打算减少2个河滩主题公园,两端河滩主题公园不在调整计划之列,相邻的两个河滩主题公园不能同时被调整,则调整方案的种数为( )A.12 B.8C.6 D.4解析:除两端的2个河滩主题公园之外,从中间5个河滩主题公园中调整2个,保留3个,可以从这3个河滩主题公园的4个空中任选2个来调整,共有C24=6种方法.答案:63.(2017·全国卷Ⅲ)(x+y)(2x-y)5的展开式中x3y3的系数为( )A.-80 B.-40C.40 D.80解析:因为x3y3=x·(x2y3),其系数为-C35·22=-40,x3y3=y·(x3y2),其系数为C25·23=80.所以x3y3的系数为80-40=40.故选C.答案:C4.如图是由四个全等的直角三角形的一个小正方形拼成的一个大正方形,现在用四种颜色给这四个直角三角形区域涂色,规定每个区域只涂一种颜色,相邻区域颜色不相同,则有多少种不同的涂色方法( ),C,D,按答案:2。
2018届高考数学高考复习指导大二轮专题复习课后强化训练:专题7 第1讲统计与统计案例 含解析 精品

第一部分 专题七 第一讲A 组1.(2017·山东卷,5)为了研究某班学生的脚长x (单位:cm)和身高y (单位:cm)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系.设其回归直线方程为y ^=b ^x +a ^.已知∑i =110x i =225,∑i =110y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为导学号 52134822( C )A .160B .163C .166D .170[解析] ∵∑i =110x i =225,∴x =110∑i =110x i =22.5.∵∑i =110y i =1 600,∴y =110∑i =110y i =160.又b ^=4,∴a ^=y -b ^x =160-4×22.5=70. ∴回归直线方程为y ^=4x +70.将x =24代入上式得y ^=4×24+70=166. 故选C .2.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为导学号 52134823( C )A .93B .123C .137D .167[解析] 由图可知该校女教师的人数为110×70%+150×(1-60%)=77+60=137,故选C .3.(文)(2017·豫东、豫北十所名校联考)某厂生产A 、B 、C 三种型号的产品,产品数量之比为3∶2∶4,现用分层抽样的方法抽取一个样本容量为180的样本,则样本中B 型号的产品的数量为导学号 52134824( B )A .20B .40C .60D .80[解析] 由分层抽样的定义知,B 型号产品应抽取180×23+2+4=40件.(理)(2017·济南模拟)某全日制大学共有学生5600人,其中专科生有1300人,本科生有3000人,研究生1300人,现采用分层抽样的方法调查学生利用因特网查找学习资料的情况,抽取的样本为280人,则应在专科生,本科生与研究生这三类学生中分别抽取导学号 52134825( A )A .65人,150人,65人B .30人,150人,100人C .93人,94人,93人D .80人,120人,80人[解析]2805600=120,1300×120=65,3000×120=150,故选A . 4.(文)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{a n }.已知a 2=2a 1,且样本容量为300,则小长方形面积最大的一组的频数为导学号 52134826( A )A .100B .120C .150D . 200[解析] 设公差为d ,则a 1+d =2a 1,∴a 1=d ,∴d +2d +3d +4d +5d =1,∴d =115,∴面积最大的一组的频率等于115×5=13.∴小长方形面积最大的一组的频数为300×13=100.(理)某电视传媒公司为了了解某类体育节目的收视情况,随机抽取了100名观众进行调查,如图是根据调查结果绘制的观众日均收看该类体育节目时间的频率分布直方图,其中收看时间分组区间是:[0,10),[10,20),[20,30),[30,40),[40,50),[50,60].将日均收看该类体育节目时间不低于40分钟的观众称为“体育迷”,则图中x 的值为导学号 52134827( A )A .0.01B .0.02C .0.03D .0.04[解析] 由题设可知(0.005+x +0.012+0.02+0.025+0.028)×10=1,解得x =0.01,选A .5.等差数列x 1,x 2,x 3,…,x 9的公差为1,若以上述数据x 1,x 2,x 3,…,x 9为样本,则此样本的方差为导学号 52134828( A )A .203B .103C .60D .30[解析] 令等差数列为1,2,3…9,则样本的平均值x =5,∴s 2=19[(1-5)2+(2-5)2+…+(9-5)2]=609=203.6.(文)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中数据,求得线性回归方程为y ^=-4x +a .若在这些样本点中任取一点,则它在回归直线左下方的概率为导学号 52134829( B )A .16B .13C .12D .23[解析] x =4+5+6+7+8+96=132,y =90+84+83+80+75+686=80,∵回归直线过点(132,80),∴a =106,∴y ^=-4x +106,∴点(5,84),(9,68)在回归直线左下方,故所求概率P =26=13.(理)关于统计数据的分析,有以下几个结论,其中正确的个数为导学号 52134830( A )①利用残差进行回归分析时,若残差点比较均匀地落在宽度较窄的水平带状区域内,则说明线性回归模型的拟合精度较高;②将一组数据中的每个数据都减去同一个数后,期望与方差均没有变化;③调查剧院中观众观后感时,从50排(每排人数相同)中任意抽取一排的人进行调查是分层抽样法;④已知随机变量X 服从正态分布N (3,1),且P (2≤X ≤4)=0.682 6,则P (X >4)等于0.158 7⑤某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人.为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本.若样本中的青年职工为7人,则样本容量为15人.A .2B .3C .4D .5[解析] ①④正确,②③⑤错误,⑤设样本容量为n ,则3501500=7n ,∴n =30,故⑤错.7.(2017·石家庄质检二)将高三(1)班参加体检的36名学生,编号为:1,2,3,…,36,若采用系统抽样的方法抽取一个容量为4的样本,已知样本中含有编号为6、24、33的学生,则样本中剩余一名学生的编号是__15__.导学号 52134831[解析] 根据系统抽样的特点可知抽取的4名学生的编号依次成等差数列,故剩余一名学生的编号是15.8.(2017·豫北十校联考)2015年的NBA 全明星赛于北京时间2015年2月14日举行,如图是参加此次比赛的甲、乙两名篮球运动员以往几场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是__64__.导学号 52134832[解析] 应用茎叶图的知识得,甲、乙两人这几场比赛得分的中位数分别为28,36,因此甲、乙两人这几场比赛得分的中位数之和是64.9.(2017·吉林通化月考)某产品的广告费用x (万元)与销售额y (万元)的统计数据如下表:根据上表可得回归方程y ^=b ^x +a ^中的b ^为7.据此模型预测广告费用为10万元时销售额为__73.5__万元.导学号 52134833[解析] 由题表可知,x =4.5,y =35,代入回归方程y ^=7x +a ^,得a ^=3.5,所以回归方程为y ^=7x +3.5.所以当x =10时,y ^=7×10+3.5=73.5.10.班主任为了对本班学生的考试成绩进行分析,决定从全班25位女同学,24位男同学中随机抽取一个容量为8的样本进行分析.若这8位同学的数学、物理分数对应如下表:导学号 52134834上表数据表示变量y 与x 的相关关系.(1)画出样本的散点图,并说明物理分数y 与数学分数x 之间是正相关还是负相关; (2)求y 与x 的线性回归直线方程(系数精确到0.01),并指出某学生数学83分,物理约为多少分(精确到1分)?参考公式:回归直线的方程是:y ^=b ^x +a ^,其中b ^=∑i =1n(x i -x -)(y i -y -)∑i =1n(x i -x -)2,a ^=y --b ^x -.参考数据:x -=77.5,y -≈85,∑i =18 (x i -x -)2=1050,∑i =18(x i -x -)(y i -y -)≈688.[解析] (1)画样本散点图如下:由图可知:物理分数y 与数学分数x 之间是正相关关系.(2)从散点图中可以看出,这些点分布在一条直线附近,因此以用公式计算得,b ^=∑i =18(x i -x -)(y i -y -)∑i =18(x i -x -)2=6881050≈0.66, 由x -=77.5,y -≈85,得a ^=y --b ^x -=85-0.66×77.5≈33.85. 所以回归直线方程为y ^=0.66x +33.85.当x =83时,y ^=0.66×83+33.85=88.63≈89. 因此某学生数学83分时,物理约为89分.B 组1.(文)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为导学号 52134835( C )A .90B .100C .180D .300[解析] 由题意,总体中青年教师与老年教师比例为1 600900=169.设样本中老年教师的人数为x ,由分层抽样的性质可得总体与样本中青年教师与老年教师的比例相等,即320x =169,解得x =180.故选C .(理)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了8次试验,收集数据如下:设回归方程为y =bx +a ,则点(a ,b )在直线x +45y -10=0的导学号 52134836( C ) A .左上方 B .左下方 C .右上方D .右下方[解析] ∵x -=45,y -=85,∴a +45b =85,∴a +45b -10>0,故点(a ,b )在直线x +45y -10=0的右上方,故选C .2.在某次测量中得到的A 样本数据如下:42,43,46,52,42,50,若B 样本数据恰好是A 样本数据每个都减5后所得数据,则A 、B 两样本的下列数字特征对应相同的是导学号 52134837( B )A .平均数B .标准差C .众数D .中位数[解析] 因为A 组数据为:42,43,46,52,42,50 B 组数据为:37,38,41,47,37,45.可知平均数、众数、中位数都发生了变化,比原来A 组数据对应量都减小了5,但标准差不发生变化,故选B .3.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y ^=b ^x +a ^,其中b ^=0.76,a ^=y -b ^x .据此估计,该社区一户年收入为15万元家庭的年支出为导学号 52134838( B )A .11.4万元B .11.8万元C .12.0万元D .12.2万元[解析] 由已知得x =8.2+8.6+10.0+11.3+11.95=10(万元),y =6.2+7.5+8.0+8.5+9.85=8(万元),故a ^=8-0.76×10=0.4.所以回归直线方程为y ^=0.76x +0.4,社区一户年收入为15万元家庭的年支出为y ^=0.76×15+0.4=11.8(万元),故选B .4.(文)某养兔场引进了一批新品种,严格按照科学配方进行喂养,四个月后管理员称其体重(单位:kg),将有关数据进行整理后分为五组,并绘制频率分布直方图(如图所示).根据标准,体重超过6kg 属于超重,低于5kg 的不够分量.已知图中从左到右第一、第三、第四、第五小组的频率分别为0.25、0.20、0.10、0.05,第二小组的频数为400,则该批兔子的总数和体重正常的频率分别为导学号 52134839( D )A .1000,0.50B .800,0.50C .800,0.60D .1000,0.60[解析] 第二组的频率为1-0.25-0.20-0.10-0.05=0.40,所以兔子总数为4000.40=1000只,体重正常的频率为0.40+0.20=0.60.故选D .(理)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为导学号 52134840( C )A .6B .8C .12D .18[解析] 第一、二两组的频率为0.24+0.16=0.4 ∴志愿者的总人数为200.4=50(人). 第三组的人数为:50×0.36=18(人) 有疗效的人数为18-6=12(人)5.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:试根据样本估计总体的思想,估计约有__99%__的把握认为“喜爱该节目与否和性别有关”.导学号 52134841参考附表:(参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d )[解析] 分析列联表中数据,可得k 2=110×(40×30-20×20)260×50×60×50≈7.822>6.635,所以有99%的把握认为“喜爱该节目与否和性别有关”.6.某种产品的广告费支出x 与销售额y 之间有如下对应数据(单位:百万元).根据上表提供的数据,求出y 关于x 的线性回归方程为y ^=6.5x +17.5,则表中t 的值为__50__.导学号 52134842[解析] 由题意,x -=5,y -=40+t 5,且点(x -,y -)一定在回归直线y ^=6.5x +17.5上,代入得40+t5=6.5×5+17.5,解得t =50.7.为加强中学生实践、创新能力和团队精神的培养,促进教育教学改革,郑州市教育局举办了全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了解成绩情况,从中选取50名学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表,解答下列问题:导学号 52134843(1)若用系统抽样的方法抽取50个样本,现将所有学生随机地编号为000,001,002,…,199,试写出第二组第一位学生的编号;(2)求出a 、b 、c 、d 、e 的值(直接写出结果),并作出频率分布直方图;(3)若成绩在85.5~95.5分的学生为二等奖,问参赛学生中获得二等奖的学生约为多少人.[解析] (1)004(2)a ,b ,c ,d ,e 的值分别为13,4,0.30,0.08,1. 频率分布直方图如下:(3)由样本中成绩在80.5~90.5的频数为18,成绩在90.5~100.5的频数为4,可估计成绩在85.5~95.5的人数为11人,故获得二等奖的学生约为20050×11=44人.8.(2017·全国卷Ⅱ,19)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:导学号 52134844(1)设A 表示事件“旧养殖法的箱产量低于50 kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有90%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较. 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ). [解析] (1)旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,因此,事件A 的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表K 2=200×(62×66-34×38)100×100×96×104≈15.705. 由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.。
2018年高三最新 高考数学第二轮专题复习----概论统计专题 精品
《计数原理与概率》高考复习指导一、考试说明:1.考试内容(1)分类计数原理与分步计数原理,排列与组合.(2)等可能性事件的概率,互斥事件有一个发生的概率,相互独立事件同时发生的概率.2.考试要求(1)掌握分类计数原理与分步计数原理,并能用它们分析和解决一些简单的应用问题.(2)理解排列与组合的意义,掌握排列数与组合数的计算公式,掌握组合数的两个性质,并能用它们解决一些简单的应用问题.(3)了解等可能性事件的概率的意义,会用排列组合公式计算一些等可能性事件的概率.(4)了解互斥事件的意义,会用互斥事件的概率加法公式计算一些事件的概率.(5)了解相互独立事件的意义,会用相互独立事件的概率乘法公式计算一些事件的概率,会计算事件在n次独立重复试验中恰好发生k次的概率.二、高考试题分析排列与组合、概率与统计是高中数学的重要内容.一方面,这部分内容占用教学时数多达36课时,另一方面,这部分内容是进一步学习高等数学的基础知识,因此,它是高考数学命题的重要内容.从近三年全国高考数学(新材)试题来看,主要是考查排列与组合、概率与统计的基本概念、公式及基本技能、方法,以及分析问题和解决问题的能力.试题特点是基础和全面.题目类型有选择题、填空题、解答题,一般是两小(9分~10分)一大(12分),解答题通常是概率问题.试题难度多为低中档.为了支持高中数学课程的改革,高考数学命题对这部分将进一步重视,但题目数量、难度、题型将会保持稳定.例1.(1999年全国)在一块并排10垄的田地中,选择2垄分别种植A、B两种作物,每种作物种植一垄,为有利于作物生长,要求A、B两种作物间的间隔不小于6垄,则不同的选垄方法共有_______种(用数字作答).[解析]A种植在左边第一垄时,B有3种不同的种植方法;A种植在左边第二垄时,B有两种不同的种植方法;A种植在左边第三垄时,B只有一种种植方法.B在左边种植的情形与上述情形相同.故共有2(3+2+1)=12种不同的选垄方法.∴应填12.例2.(2018年新教材)将3种作物种植在如图所示的5块试验田里,每一块种植一种作物且相邻的试验田不能种植同一作物,不同的种植方法共有______种(以数字作答).[解析]将5块试验田从左到右依次看作甲、乙、丙、丁、戊,3种作物依次看作A、B、C,则3种作物都可以种植在甲试验田里,由于相邻的试验田不能种植同一种作物,从而可知在乙试验田里只能有两种作物.同理,在丙、丁、戊试验田里也只能有两种作物可以种植.由分步计数原理,不同的种植方法共有3×2×2×2=48种.∴应填:48例3.(2018年全国高考题)某城市中心广场建造一个花圃,花圃分为6个部分(如图),现要栽种4种不同颜色的花,每部分栽种1种且相邻部分不能栽种同样颜色的花,不同的栽法有_______种.[解析]由于第1、2、3块两两相邻,我们先安排这三块,给第1、2、3块种花时分别有4、3、2种种法,所以共有4×3×2=24种不同种法.下面给第4块种花,若第4块与第6块同色,只有一种种植方法,则第5块只有2种种法,若第4块与第2块同色时,共有2×1=2种种法.若第4块与第6块不同色,但第4块与第2块同色,则第6块有2种种植的方案,而第5块只有1种种法,共有2种不同的种植方法.若第4块与第6块不同色,但第4块与第2块不同色,则第6块有1种种法,则第5块也有一种不同种法,所以第4块与第6块不同色时,有1种种法.综上共有24×(2+2+1)=120种不同的种植方法.例4.(2018年春季考试题)某班新年联欢会原定的5个节目已排成节目单,开演前又增加了两个新节目,如果将这两个节目插入原节目单中,那么不同的插法的种数为A 、42B 、30C 、20D 、12[解析]将两个新节目插入5个固定顺序节目单有两种情况:(1)两个新节目相邻的插法种数为226A ;(2)两个节目不相邻的插法种数为26A ;由分类计数原理共有2226642A A +=种方法,选A.例5.(2018重庆)(本小题满分12分)设甲、已、丙三人每次射击命中目标的概率分别为0.7、0.6和0.5。
2018届高考理科数学二轮专题复习讲义。统计与统计案例
2018届高考理科数学二轮专题复习讲义。
统计与统计案例本文介绍了统计与统计案例中的一些考点和热点分类,以及一些跟踪演练题目的解析。
在考试中,会以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等。
同时,在概率与统计的交汇处命题,难度适中。
抽样方法有三种:简单随机抽样、系统抽样和分层抽样。
简单随机抽样适用于总体中个体数较少的情况,而系统抽样适用于个体数较多的情况。
分层抽样适用于总体由差异明显的几部分组成的情况。
对于一些具体的题目,我们可以根据题意和抽样比例计算出样本中产品的最小编号或者应该抽取的学生人数。
在随机抽样的各种方法中,每个个体被抽到的概率都是相等的。
系统抽样又称为“等距”抽样,被抽到的各个号码间隔相同。
分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例。
最后,我们来看一道跟踪演练题目。
题目要求从福利彩票“双色球”中选取红色球的6个号码,选取方法是从第1行、第9列和第10列的数字开始从左到右依次选取两个数字。
根据题意和随机数表,我们可以计算出第四个被选中的红色球号码为06.解析:1) 样本编号题目,根据系统抽样的方法,计算出样本组距为9,然后根据已知编号推算出样本中还有一个学生的编号为14,故选B。
2) 该部分内容排版混乱,需要重新排版。
频率分布直方图中,横坐标表示组距,纵坐标表示频率,频率等于组距乘以组距。
各小长方形的面积之和为1.在频率分布直方图中,最高的小长方形底边中点的横坐标即为众数。
中位数左边和右边的小长方形的面积和相等。
平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和。
3) 根据题目可以列出方程,设未知数为x,平均数为a,中位数为b,众数为c,则有:(10+2+5+2+4+2+x)/7=a,中位数为2或5,众数为2,根据众数的定义可得c=2,因此有:b-a=c-b,代入已知数据可得b=3a-4,根据平均数的定义可得:(10+2+5+2+4+2+x)/7=a,解出a=5,代入b=3a-4可得b=11,因此中位数为11,根据中位数的定义可得:(10+2+5+2+4+2+x)/7=11,解出x=3,所以所有可能值之和为25+3=28,因此答案为B。
2018届高考数学(理)二轮复习命题热点课件 专题 7.3 随机变量及其分布
C2 5
=
4 10
,P(AB)= = .
4 1
C2 2 C2 5
=
1 10
.由条件概率计算公式,得
关闭
P(B|A)= = ������ (������) B
������ (������������ )
1 10 4 10
解析
答案
高频考点 命题热点一 命题热点二 命题热点三 命题热点四
-10-
(2)甲、乙两个实习生每人加工一个零件,加工的零件为一等品的 2 3 概率分别为 3 和 4 ,加工的两个零件是否为一等品相互独立,则这两 个零件中恰有一个一等品的概率为 .
选 择 题 填 空 题 解 答 题
高频考点 命题热点一 命题热点二 命题热点三 命题热点四
-3-
条件概率与相互独立事件的概率 【思考】 如何求事件的条件概率?判断相互独立事件的常用方 法有哪些? 例1某公司为了解用户对其产品的满意度,从A,B两地区分别随 机调查了20个用户,得到用户对产品的满意度评分如下: A地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89 B地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79
������(������������) P(B|A)= . ������(������)
2.判断相互独立事件的三种常用方法: (1)利用定义,事件A,B相互独立⇔P(AB)=P(A)· P (B ). (2)利用性质,A 与 B 相互独立,则 A 与������, ������与 B,������与������也都相互独立. (3)具体背景下,①有放回地摸球,每次摸球的结果是相互独立的. ②当产品数量很大时,不放回抽样也可近似看作独立重复试验.
2020版高考数学大二轮复习课时作业17统计与统计案例文
课时作业 17 统计与统计案例1.[2019·湖南五市十校联考]在某次赛车中,50名参赛选手的成绩(单位:min)全部介于13到18之间(包括13和18),将比赛成绩分为五组:第一组[13,14),第二组[14,15),…,第五组[17,18].其频率分布直方图如图所示,若成绩在[13,15)内的选手可获奖,则这50名选手中获奖的人数为( )A.39 B.35C.15 D.11解析:由频率分布直方图知成绩在[15,18]内的频率为(0.38+0.32+0.08)×1=0.78,所以成绩在[13,15)内的频率为1-0.78=0.22,则成绩在[13,15)内的选手有50×0.22=11(人),即这50名选手中获奖的人数为11,故选D.答案:D2.[2019·湖北黄冈期末]为了调查学生对某项新政策的了解情况,准备从某校高一A,B,C三个班级中抽取10名学生进行调查.已知A,B,C三个班级的学生人数分别为40,30,30.考虑使用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按A,B,C三个班级依次统一编号为1,2,…,100;使用系统抽样时,将学生按A,B,C三个班级依次统一编号为1,2,…,100,并将所有编号依次平均分为10组.如果抽得的号码有下列四种情况:①7,17,27,37,47,57,67,77,87,97;②3,9,15,33,43,53,65,75,85,95;③9,19,29,39,49,59,69,79,89,99;④2,12,22,32,42,52,62,73,83,96.关于上述样本的下列结论中,正确的是( )A.①③都可能为分层抽样B.②④都不能为分层抽样C.①④都可能为系统抽样D.②③都不能为系统抽样解析:对于①,既满足系统抽样的数据特征,又满足分层抽样的数据特征,所以可能是分层抽样或系统抽样;对于②,只满足分层抽样的数据特征,所以可能是分层抽样;对于③,既满足系统抽样的数据特征,又满足分层抽样的数据特征,所以可能是分层抽样或系统抽样;对于④,只满足分层抽样的数据特征,所以可能是分层抽样.故选A .答案:A3.[2019·广东惠州一调]已知数据x 1,x 2,…,x 10,2的平均值为2,方差为1,则数据x 1,x 2,…,x 10相对于原数据( )A .一样稳定B .变得稳定C .变得不稳定D .稳定性不可以判断解析:数据x 1,x 2,…,x 10,2的平均值为2,方差为1,故111[(x 1-2)2+(x 2-2)2+…+(x 10-2)2+(2-2)2]=1,数据x 1,x 2,…x 10的方差s 2=110[(x 1-2)2+(x 2-2)2+…+(x 10-2)2]>1,故相对于原数据变得不稳定,故选C .答案:C4.[2019·陕西商洛质检]在一次53.5千米的自行车个人赛中,25名参赛选手成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为1~25号,再用系统抽样的方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为( )A .95B .96C .97D .98解析:由系统抽样法及已知条件可知被选中的其他4人的成绩分别是88,94,99,107,故平均数为88+94+99+1074=97,故选C .答案:C5.[2019·湖北重点高中协作体联考]某镇有A ,B ,C 三个村,它们的人口数量之比为::7,现在用分层抽样的方法抽出容量为n 的样本,样本中A 村有15人,则样本容量为( )A .50B .60C .70D .80解析:设A ,B ,C 三个村的人口数量分别为3x,4x,7x ,则由题意可得3x 15=3x +4x +7x n,解得n =70,故选C .答案:C6.[2019·云南昆明诊断]某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:A .利润率与人均销售额成正相关关系B .利润率与人均销售额成负相关关系C .利润率与人均销售额成正比例函数关系D .利润率与人均销售额成反比例函数关系解析:画出利润率与人均销售额的散点图,如图.由图可知利润率与人均销售额成正相关关系.故选A .答案:A7.[2019·河南濮阳摸底]根据如表数据,得到的回归方程为y ^=b ^x +9,则b ^=( )A .2B .1C .0D .-1解析:由题意可得x -=15×(4+5+6+7+8)=6,y -=15×(5+4+3+2+1)=3,因为回归方程为y ^=b ^x +9且回归直线过点(6,3),所以3=6b ^+9,解得b ^=-1,故选D .答案:D8.[2019·宁夏银川一中月考]利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问110名不同的大学生是否爱好该项运动,得到2×2列联表,并计算可得K 2≈8.806.A .有99.5%以上的把握认为“是否爱好该项运动与性别无关”B .有99.5%以上的把握认为“是否爱好该项运动与性别有关”C .在犯错误的概率不超过0.05%的前提下,认为“是否爱好该项运动与性别有关”D .在犯错误的概率不超过0.05%的前提下,认为“是否爱好该项运动与性别无关”解析:由于8.806>7.879,所以根据独立性检验的知识可知有99.5%以上的把握认为“是否爱好该项运动与性别有关”,故选B .答案:B9.[2019·安徽六安毛坦厂中学月考]某位教师2017年的家庭总收入为80 000元,各种用途占比统计如下面的折线图.2018年收入的各种用途占比统计如下面的条形图,已知2018年的就医费用比2017年增加了4 750元,则该教师2018年的家庭总收入为( )A .100 000元B .95 000元C .90 000元D .85 000元解析:由已知得,2017年的就医费用为80 000×10%=8 000(元),故2018年的就医费用为8 000+4 750=12 750(元),所以该教师2018年的家庭总收入为12 75015%=85 000(元).故选D .答案:D10.[2019·华中师范大学第一附属中学期末]给出下列结论:①某学校从编号依次为001,002,…,900的900个学生中用系统抽样的方法抽取一个样本,已知样本中有两个相邻的编号分别为053,098,则样本中最大的编号为862;②甲组数据的方差为5,乙组数据为5,6,9,10,5,那么这两组数据中甲组数据比较稳定; ③两个变量的线性相关性越强,则相关系数r 的值越接近于1; ④对A ,B ,C 三种个体按 ::2的比例进行分层抽样调查,若抽取的A 种个体有15个,则样本容量为30.则正确的个数是( )A .3B .2C .1D .0解析:①中,样本中相邻的两个编号为053,098,则样本组距为98-53=45,所以样本容量为90045=20,则样本中最大的编号为53+45×(20-2)=863,故①错误;②中,乙组数据的平均数为5+6+9+10+55=7,所以乙组数据的方差为15×[(5-7)2+(6-7)2+(9-7)2+(10-7)2+(5-7)2]=4.4<5,那么这两组数据中乙组数据比较稳定,故②错误;③中,两个变量的线性相关性越强,则相关系数r 的绝对值越接近于1,故③错误;④中,易知样本容量为15÷33+1+2=30,故④正确.综上,选C .答案:C11.[2019·福建三明质检]某校为了解学生的身体素质情况,采用按年级分层抽样的方法,从高一、高二、高三年级的学生中抽取一个300人的样本进行调查,已知高一、高二、高三年级的学生人数之比为::4,抽取的样本中高一年级的学生有120人,则实数k的值为________.解析:由题意可得,120300=kk +5+4,解得k =6.答案:612.[2019·河北六校联考]在一次53.5千米的自行车个人赛中,25名参赛选手的成绩(单位:分)的茎叶图如图所示,若用简单随机抽样的方法从中选取2人,则这2人成绩的平均数恰为100的概率为________.解析:根据题意知,从25人中选取2人,基本事件的总数为C 225=300,其中这2人成绩的平均数恰为100的基本事件为(100,100),(95,105),(95,105),(95,105),(94,106),(93,107),共6个,所以所求的概率P =6300=150.答案:15013.某炼钢厂废品率x(%)与成本y(元/t )的线性回归方程为y ^=105.492+42.569x.当成本控制在176.5元/t 时,可以预计生产的1 000 t 钢中,约有________t 钢是废品.解析:因为176.5=105.492+42.569x ,所以x≈1.668,即成本控制在176.5元/t 时,废品率为1.668%.所以生产的1 000 t 钢中,约有1 000×1.668%=16.68 t 钢是废品.答案:16.6814.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.解析:K2≈3.918≥3.841,而P(K2≥3.841)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.答案:①15.[2019·湖南四校摸底调研]某家电公司销售部门共有200名销售员,每年部门对每名销售员都有 1 400万元的年度销售任务.已知这200名销售员去年的销售额都在区间[2,22](单位:百万元)内,现将其分成5组,第1组、第2组、第3组、第4组、第5组对应的区间分别为[2,6),[6,10),[10,14),[14,18),[18,22],并绘制出如下的频率分布直方图.(1)求a的值,并计算完成年度任务的人数;(2)用分层抽样的方法从这200名销售员中抽取容量为25的样本,求这5组分别应抽取的人数;(3)现从(2)中完成年度任务的销售员中随机选取2名,奖励海南三亚三日游,求获得此奖励的2名销售员在同一组的概率.解析:(1)∵(0.02+0.08+0.09+2a)×4=1,∴a=0.03,∴完成年度任务的人数为2×0.03×4×200=48.(2)第1组应抽取的人数为0.02×4×25=2,第2组应抽取的人数为0.08×4×25=8,第3组应抽取的人数为0.09×4×25=9,第4组应抽取的人数为0.03×4×25=3,第5组应抽取的人数为0.03×4×25=3,(3)在(2)中完成年度任务的销售员中,第4组有3人,记这3人分别为A 1,A 2,A 3;第5组有3人,记这3人分别为B 1,B 2,B 3.从这6人中随机选取2名,所有的基本事件为A 1A 2,A 1A 3,A 1B 1,A 1B 2,A 1B 3,A 2A 3,A 2B 1,A 2B 2,A 2B 3,A 3B 1,A 3B 2,A 3B 3,B 1B 2,B 1B 3,B 2B 3,共有15个基本事件,获得此奖励的2名销售员在同一组所包含的基本事件有6个, 故所求概率P =615=25.16.[2019·四川德阳一诊]某市工业部门计划对所辖中、小型企业推行节能降耗技术改造,下面是对所辖企业是否支持技术改造进行的问卷调查的结果(不完整):已知从这560家企业中随机抽取1家,抽到支持技术改造的企业的概率为47.(1)能否在犯错误的概率不超过0.025的前提下认为“是否支持节能降耗技术改造与企业规模大小”有关?(2)从支持技术改造的中、小型企业中按分层抽样的方法抽出8家企业,再从这8家企业中选出2家进行奖励:中型企业奖励20万元,小型企业奖励10万元.求奖励总金额为20万元的概率.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d.解析:(1)由从这560家企业中随机抽取1家,抽到支持技术改造的企业的概率为47可知,支持技术改造的企业共有320家,故列联表为所以K 2=n ((a +b )(c +d )(a +c )(b +d )=560×(80×200-40×240)2120×440×320×240≈5.657>5.024.故能在犯错误的概率不超过0.025的前提下认为“是否支持节能降耗技术改造与企业规模大小”有关.(2)由(1)可知,从支持技术改造的中、小型企业中,按分层抽样的方法抽出8家企业,其中有2家中型企业,分别用x ,y 表示,6家小型企业,分别用1,2,3,4,5,6表示.则从中选取2家企业的所有可能情况为xy ,x1,x2,x3,x4,x5,x6,y1,y2,y3,y4,y5,y6,12,13,14,15,16,23,24,25,26,34,35,36,45,46,56,共28种,其中奖励总金额为20万元的有12,13,14,15,16,23,24,25,26,34,35,36,45,46,56,共15种.所以奖励总金额为20万元的概率为1528.17.[2019·河南南阳期末联考]某网购平台为了解某市居民在该平台的消费情况,从该市使用该平台且平均每周消费金额超过100元的人员中随机抽取了100名,并绘制如图所示的频率分布直方图,已知中间三组的人数可构成等差数列.(1)求m ,n 的值.(2)分析人员对这100名调查对象的性别进行统计,发现平均每周消费金额不低于300元的男性有20人,低于300元的男性有25人,请根据统计数据完成下列2×2列联表,并判断是否有99%的把握认为平均每周消费金额与性别有关?(3)线性相关,得到的回归方程为y ^=-5x +a ^.已知这100名调查对象的平均年龄为38岁,试估算一名年龄为25岁的年轻人平均每周的消费金额.(同一组数据用该区间的中点值作代表)2×2列联表:附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d.解析:(1)=0.006, 由题意可知m +0.001 5=2n , 解得m =0.003 5,n =0.002 5.(2)平均每周消费金额不低于300元的频率为(0.003 5+0.001 5+0.001)×100=0.6,因此这100名调查对象中,平均每周消费金额不低于300元的人数为100×0.6=60(人).所以2×2列联表为K 2=100×(45×55×60×40≈8.249>6.635,所以有99%的把握认为平均每周消费金额与性别有关.(3)调查对象的平均每周消费金额为0.15×150+0.25×250+0.35×350+0.15×450+0.10×550=330(元),由题意得330=-5×38+a ^,解得a ^=520. y ^=-5×25+520=395(元).故一名年龄为25岁的年轻人平均每周的消费金额约为395元.18.[2019·福建三明月考]统计学中经常用环比、同比来进行数据比较.环比是指本期统计数据与上期比较,如2017年7月与2017年6月相比.环比增长率=本期数-上期数上期数×100%,同比增长率=本期数-同期数同期数×100%.下表是某地区近17个月来的消费者信心指数的统计数据:②除2017年1月外,该地区消费者信心指数月环比增长率为负数的有几个月? (2)由以上数据可判断,序号x 与该地区消费者信心指数y 具有线性相关关系,求出y 关于x 的线性回归方程y ^=b ^x +a ^(a ^,b ^保留2位小数),并依此预测该地区2018年6月的消费者信心指数(结果保留1位小数).参考数据与公式:∑i =117x i y i =18 068.5,∑i =117x 2i =1 785,x -=9,y -≈115,b ^=,a ^=y --b ^x -.解析:(1)①该地区2018年5月消费者信心指数的同比增长率为124-112.6112.6×100%≈10%.②若月环比增长率为负数,则本期数<上期数,从表中可以看出,2017年3月、2017年6月、2017年8月、2018年2月、2018年4月共5个月的月环比增长率为负数.(2)由已知,得≈1.16,a ^=y --b ^x -=104.56,∴线性回归方程为y ^=1.16x +104.56. 当x =18时,y ^=125.4,故该地区2018年6月的消费者信心指数约为125.4.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
寒假作业(十七) 统计、统计案例(注意命题点的区分度)一、选择题1.(2017·福州质检)在检测一批相同规格共500 kg 航空用耐热垫片的品质时,随机抽取了280片,检测到有5片非优质品,则这批航空用耐热垫片中非优质品约为( )A .2.8 kgB .8.9 kgC .10 kgD .28 kg解析:选B 由题意可知,抽到非优质品的概率为5280,所以这批航空用耐热垫片中非优质品约为500×5280=12514≈8.9 kg.2.(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 解析:选A 根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确.3.一次数学考试后,某老师从自己所带的两个班级中各抽取5人,记录他们的考试成绩,得到如图所示的茎叶图.已知甲班5名同学成绩的平均数为81,乙班5名同学成绩的中位数为73,则x -y 的值为( )A .2B .-2C .3D .-3解析:选D 由题意得,72+77+80+x +86+905=81,解得x =0,易知y =3,∴x -y=-3.4.采用系统抽样方法从 1 000人中抽取50人做问卷调查,为此将他们随机编号为1,2,…,1 000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.抽到的50人中,编号落入区间[1,400]的人做问卷A ,编号落入区间[401,750]的人做问卷B ,其余的人做问卷C ,则抽到的人中,做问卷C 的人数为( )A .12B .13C .14D .15解析:选A 由题意组距为1 00050=20,故抽到的号码构成以8为首项,以20为公差的等差数列,且此等差数列的通项公式为a n =8+(n -1)×20=20n -12.由751≤20n -12≤1 000,解得38.15≤n ≤50.6.再由n ∈N *,可得39≤n ≤50,故做问卷C 的人数为50-39+1=12.5.已知x ,y 的取值如下表所示:若y 与x 呈线性相关,且线性回归方程为y ^=b ^xA.12 B .-12 C .2 D .-2解析:选B 由表中数据得x =3(x ,y ),所以5=3b ^+132,解得b ^=-12.6.(2017·广州模拟)为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是( )A .35B .48C .60D .75解析:选C 设被抽查的美术生的人数为n ,因为后2个小组的频率之和为(0.037 5+0.012 5)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n =5+15+250.75=60.7.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,计算得K 2的观测值k =8.01,若推断“喜欢乡村音乐与性别有关系”,则这种推断犯错误的概率不超过( )A .0.01B .0.025C .0.005D .0.001解析:选C 由K 2的观测值k =8.01,观测值同临界值进行比较可知,这种推断犯错误的概率不超过0.005.8.在某次测量中得到的A 样本数据如下:42,43,46,52,42,50,若B 样本数据恰好是A 样本数据每个都减5后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .平均数B .标准差C .众数D .中位数解析:选B A 样本数据的平均数x =2756,B 样本数据的平均数x ′=x -5.A 样本数据的方差s 2=16[(42-x )2+(43-x )2+…+(50-x )2],B 样本数据的方差s ′2=16[(42-x )2+(43-x )2+…+(50-x )2],所以A ,B 两样本的标准差相同.9.某同学将全班某次数学考试成绩整理成频率分布直方图后,并将每个小矩形上方线段的中点连接起来得到频率分布折线图(如图所示).据此估计此次考试成绩的众数是( )A .100B .110C .115D .120解析:选C 众数是一组数据中出现次数最多的数,结合题中频率分布折线图可以看出,数据“115”对应的纵坐标最大,所以相应的频率最大,频数最大,据此估计此次考试成绩的众数是115.10.以模型y =c e kx去拟合一组数据时,为了求出回归方程,设z =ln y ,其变换后得到线性回归方程z =0.3x +4,则c =( )A .0.3B .e 0.3C .4D .e 4解析:选D 因为z =ln y =ln(c e kx)=ln c +kx ,又z =0.3x +4,所以ln c =4,c =e 4.11.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大依次构成等比数列{a n },已知a 2=2a 1,且样本容量为300,则对应小长方形面积最小的一组的频数为( )A .20B .40C .30D .无法确定解析:选A 在等比数列{an }中,a 2=2a 1,则q =2,由题意S 441=1,a 1=115,即小长方形面积最小的一组的面积为115,所以频数为12.为了考察某校各班参加课外书法小组的人数,级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为( )A .9B .10C .11D .12解析:选B 不妨设样本数据为x 1,x 2,x 3,x 4,x 5,且x 1<x 2<x 3<x 4<x 5,则由样本方差为4,知(x 1-7)2+(x 2-7)2+(x 3-7)2+(x 4-7)2+(x 5-7)2=20.若5个整数的平方和为20,则这5个整数的平方只能在0,1,4,9,16中选取(每个数最多出现2次),当这5个整数的平方9时,2=6,x 3=7,x 4=8,x 5=10;,因此不存在满足条件的另y 与x 的线性回归解析:由已知得x =4×(0+1+2+3)=2,y =4×(-1+1+m +8)=m4+2,又点(x ,y )在线性回归直线上,所以m 4+2=3×32-32,解得m =4.答案:414.(2017·江苏高考)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.解析:应从丙种型号的产品中抽取 60×300200+400+300+100=18(件).答案:1815.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,计算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.已知家庭的月储蓄y 关于月收入x 的线性回归方程为y ^=b ^x +a ^,则变量x 与y ________(填“正相关”或“负相关”);若该居民区某家庭月收入为7千元,预测该家庭的月储蓄是________千元.解析:由题意知n =10,x =110∑i =110x i =8,y =110∑i =110y i =2,∴b ^=184-10×8×2720-10×82=0.3,a ^=2-0.3×8=-0.4,∴y ^=0.3x -0.4,∵0.3>0,∴变量x 与y 正相关. 当x =7时,y ^=0.3×7-0.4=1.7(千元). 答案:正相关 1.716.(2017·石家庄质检)设样本数据x 1,x 2,…,x 2 017的方差是4,若y i =2x i -1(i =1,2,…,2 017),则y 1,y 2,…,y 2 017的方差为________.解析:设样本数据的平均数为x , 则y i =2x i -1的平均数为2x -1, 则y 1,y 2,…,y 2 017的方差为12 017[(2x 1-1-2x +1)2+(2x 2-1-2x +1)2+…+(2x 2017-1-2x +1)2]=4×12 017[(x 1-x )2+(x 2-x )2+…+(x 2 017-x )2]=4×4=16.答案:16 三、解答题17.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如下表.(1)画出茎叶图,由茎叶图判断哪位选手的成绩较稳定;(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、中位数、标准差,并判断选谁参加比赛更合适.解:(1)茎叶图如图所示:由茎叶图可知,乙的成绩较稳定.(2)因为v甲=16(27+38+30+37+35+31)=33,v 乙=16(33+29+38+34+28+36)=33.甲的中位数:33,乙的中位数:33.5.]+-2=47-+-2+141,s 乙=附:K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .解:(1)该校高一年级的男、女生之比为600∶480=5∶4,所以按照分层抽样,男生应抽取50名.(2)2×2列联表如下:由K 2=n ad -bc 2a +bc +d a +cb +d,代入数据得K 2=-250×40×55×35=45077≈5.844>5.024. 所以在犯错误的概率不超过0.025的前提下可以认为“该校高一学生是否愿意选修英语口语课程与性别有关”.19.(2017·北京高考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4. (2)根据题意,样本中分数不小于50的频率为 (0.01+0.02+0.04+0.02)×10=0.9, 故样本中分数小于50的频率为0.1,故分数在区间[40,50)内的人数为100×0.1-5=5. 所以总体中分数在区间[40,50)内的人数估计为 400×5100=20.(3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30.所以样本中的男生人数为30×2=60, 女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.x i -y i -∑i =1ni -x=i i =1i b ^x )解:(1)x =15×(79+81+83+85+87)=83,∵y =15×(77+79+79+82+83)=80,∴s 2y =15× [(77-80)2+(79-80)2+(79-80)2+(82-80)2+(83-80)2]=4.8.(2)由(1)知x =83,y =80,则∑i =15(x i -x )(y i -y )=(-4)×(-3)+(-2)×(-1)+0×(-1)+2×2+4×3=30,∑i =15(x i -x )2=(-4)2+(-2)2+02+22+42=40,∴b ^=3040=0.75,a ^=80-0.75×83=17.75.故所求的线性回归方程为y ^=0.75x +17.75.。