2017-2019高考文数真题分项解析-专题15概率与统计

合集下载

2017年高考数学试题分项版—统计概率(解析版)

2017年高考数学试题分项版—统计概率(解析版)

2017年高考数学试题分项版—统计概率(解析版)一、选择题1.(2017·全国Ⅰ文,2)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( ) A .x 1,x 2,…,x n 的平均数 B .x 1,x 2,…,x n 的标准差 C .x 1,x 2,…,x n 的最大值 D .x 1,x 2,…,x n 的中位数 1.【答案】B【解析】因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差. 故选B.2.(2017·全国Ⅰ文,4)如图,正方形ABCD 内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是( )A .14B .π8C .12D .π42.【答案】B【解析】不妨设正方形ABCD 的边长为2,则正方形内切圆的半径为1,可得S 正方形=4. 由圆中的黑色部分和白色部分关于正方形的中心成中心对称,得S 黑=S 白=12S 圆=π2,所以由几何概型知,所求概率P =S 黑S 正方形=π24=π8.故选B.3.(2017·全国Ⅱ文,9)甲、乙、丙、丁四位同学一起去向老师询问成语竞赛的成绩,老师说:你们四人中有2位优秀,2位良好,我现在给甲看乙、丙的成绩,给乙看丙的成绩,给丁看甲的成绩.看后甲对大家说:我还是不知道我的成绩,根据以上信息,则( ) A .乙可以知道四人的成绩 B .丁可以知道四人的成绩C .乙、丁可以知道对方的成绩D .乙、丁可以知道自己的成绩 3.【答案】D【解析】由甲说:“我还是不知道我的成绩”可推知甲看到乙、丙的成绩为“1个优秀、1个良好”.乙看丙的成绩,结合甲的说法,丙为“优秀”时,乙为“良好”;丙为“良好”时,乙为“优秀”,可得乙可以知道自己的成绩.丁看甲的成绩,结合甲的说法,甲为“优秀”时,丁为“良好”;甲为“良好”时,丁为“优秀”,可得丁可以知道自己的成绩. 故选D.4.(2017·全国Ⅱ文,11)从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为( ) A .110B .15C .310D .254.【答案】D【解析】从5张卡片中随机抽取1张,放回后再随机抽取1张的情况如图:基本事件总数为25,第一张卡片上的数大于第二张卡片上的数的事件数为10, ∴所求概率P =1025=25.故选D.5.(2017·全国Ⅲ文,3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 5.【答案】A【解析】对于选项A ,由图易知月接待游客量每年7,8月份明显高于12月份,故A 错; 对于选项B ,观察折线图的变化趋势可知年接待游客量逐年增加,故B 正确; 对于选项C ,D ,由图可知显然正确. 故选A.6.(2017·天津文,3)有5支彩笔(除颜色外无差别),颜色分别为红、黄、蓝、绿、紫.从这5支彩笔中任取2支不同颜色的彩笔,则取出的2支彩笔中含有红色彩笔的概率为( ) A .45B .35C .25D .156.【答案】C【解析】从5支彩笔中任取2支不同颜色彩笔的取法有红黄、红蓝、红绿、红紫、黄蓝、黄绿、黄紫、蓝绿、蓝紫、绿紫,共10种,其中取出的2支彩笔中含有红色彩笔的取法有红黄、红蓝、红绿、红紫,共4种,所以所求概率P =410=25. 故选C.7.(2017·山东文,8)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A .3,5B .5,5C .3,7D .5,7 7.【答案】A【解析】甲组数据的中位数为65,由甲、乙两组数据的中位数相等得y =5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x )=15×(59+61+67+65+78),∴x =3.故选A. 8.(2017·浙江,8)已知随机变量ξi 满足P (ξi =1)=p i ,P (ξi =0)=1-p i ,i =1,2.若0<p 1<p 2<12,则( ) A .E (ξ1)<E (ξ2),D (ξ1)<D (ξ2) B .E (ξ1)<E (ξ2),D (ξ1)>D (ξ2) C .E (ξ1)>E (ξ2),D (ξ1)<D (ξ2) D .E (ξ1)>E (ξ2),D (ξ1)>D (ξ2) 8.【答案】A【解析】由题意可知ξi (i =1,2)服从两点分布,∴E (ξ1)=p 1,E (ξ2)=p 2,D (ξ1)=p 1(1-p 1),D (ξ2)=p 2(1-p 2), 又∵0<p 1<p 2<12,∴E (ξ1)<E (ξ2),把方差看作函数y =x (1-x ),根据0<ξ1<ξ2<12知,D (ξ1)<D (ξ2).故选A.9.(2017·全国Ⅰ理,2)如图,正方形ABCD 内的图形来自中国古代的太极图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是( )A.14 B .π8 C .12 D .π4 9.【答案】B【解析】不妨设正方形ABCD 的边长为2,则正方形内切圆的半径为1,可得S 正方形=4. 由圆中的黑色部分和白色部分关于正方形的中心成中心对称,得S 黑=S 白=12S 圆=π2,所以由几何概型知,所求概率P =S 黑S 正方形=π24=π8.10.(2017·全国Ⅰ理,6)⎝⎛⎭⎫1+1x 2(1+x )6的展开式中x 2的系数为( ) A .15 B .20 C .30 D .35 10.【答案】C【解析】因为(1+x )6的通项为C r 6x r ,所以⎝⎛⎭⎫1+1x 2(1+x )6的展开式中含x 2的项为1·C 26x 2和1x 2·C 46x 4.因为C 26+C 46=2C 26=2×6×52×1=30, 所以⎝⎛⎭⎫1+1x 2(1+x )6的展开式中x 2的系数为30. 故选C.11.(2017·全国Ⅱ理,6)安排3名志愿者完成4项工作,每人至少完成1项,每项工作由1人完成,则不同的安排方式共有()A .12种B .18种C .24种D .36种11.【答案】D【解析】由题意可得,其中1人必须完成2项工作,其他2人各完成1项工作,可得安排方式为C 13·C 24·A 22=36(种),或列式为C 13·C 24·C 12=3×4×32×2=36(种).故选D. 12.(2017·全国Ⅱ理,7)甲、乙、丙、丁四位同学一起去向老师询问成语竞赛的成绩.老师说:你们四人中有2位优秀,2位良好,我现在给甲看乙、丙的成绩,给乙看丙的成绩,给丁看甲的成绩.看后甲对大家说:我还是不知道我的成绩.根据以上信息,则( ) A .乙可以知道四人的成绩 B .丁可以知道四人的成绩 C .乙、丁可以知道对方的成绩 D .乙、丁可以知道自己的成绩 12.【答案】D【解析】由甲说:“我还是不知道我的成绩”可推知甲看到乙、丙的成绩为“1个优秀,1个良好”.乙看丙的成绩,结合甲的说法,丙为“优秀”时,乙为“良好”;丙为“良好”时,乙为“优秀”,可得乙可以知道自己的成绩.丁看甲的成绩,结合甲的说法,甲为“优秀”时,丁为“良好”;甲为“良好”时,丁为“优秀”,可得丁可以知道自己的成绩.13.(2017·全国Ⅲ理,3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 13.【答案】A【解析】对于选项A ,由图易知月接待游客量每年7,8月份明显高于12月份,故A 错误;对于选项B ,观察折线图的变化趋势可知,年接待游客量逐年增加,故B 正确; 对于选项C ,D ,由图可知显然正确. 故选A.14.(2017·全国Ⅲ理,4)(x +y )(2x -y )5的展开式中x 3y 3的系数为( ) A .-80 B .-40 C .40 D .8014.【答案】C【解析】因为x 3y 3=x ·(x 2y 3),其系数为-C 35·22=-40, x 3y 3=y ·(x 3y 2),其系数为C 25·23=80. 所以x 3y 3的系数为80-40=40. 故选C.15.(2017·山东理,5)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为y ^=b ^x +a ^.已知∑10i =1x i =225,∑10i =1y i =1 600,b ^=4.该班某学生的脚长为24,据此估计其身高为( ) A .160 B .163 C .166 D .17015.【答案】C【解析】∵∑10i =1x i =225,∴x =110∑10i =1x i =22.5.∵∑10i =1y i =1 600,∴y =110∑10i =1y i =160.又b ^=4,∴a ^=y -b ^x =160-4×22.5=70.∴回归直线方程为y ^=4x +70.将x =24代入上式,得y ^=4×24+70=166.故选C.16.(2017·山东理,8)从分别标有1,2,…,9的9张卡片中不放回地随机抽取2次,每次抽取1张,则抽到的2张卡片上的数奇偶性不同的概率是( ) A .518B .49C .59D .7916.【答案】C【解析】方法一 ∵9张卡片中有5张奇数卡片,4张偶数卡片,且为不放回地随机抽取, ∴P (第一次抽到奇数,第二次抽到偶数)=59×48=518,P (第一次抽到偶数,第二次抽到奇数)=49×58=518,∴P (抽到的2张卡片上的数奇偶性不同)=518+518=59.故选C.方法二 依题意,得P (抽到的2张卡片上的数奇偶性不同)=5×4C 29=59.故选C. 二、填空题1.(2017·北京文,14)某学习小组由学生和教师组成,人员构成同时满足以下三个条件: (1)男学生人数多于女学生人数; (2)女学生人数多于教师人数; (3)教师人数的两倍多于男学生人数.①若教师人数为4,则女学生人数的最大值为________. ②该小组人数的最小值为________. 1.【答案】6 12【解析】(1)若教师人数为4,则男学生人数小于8,最大值为7,女学生人数最大时应比男学生人数少1人,所以女学生人数的最大值为7-1=6.(2)设男学生人数为x (x ∈N +),要求该小组人数的最小值,则女学生人数为x -1,教师人数为x -2.又2(x -2)>x ,解得x >4,即x =5,该小组人数的最小值为5+4+3=12.2.(2017·浙江,13)已知多项式(x +1)3(x +2)2=x 5+a 1x 4+a 2x 3+a 3x 2+a 4x +a 5,则a 4=________,a 5=________. 2.【答案】16 4【解析】a 4是x 项的系数,由二项式的展开式得a 4=C 33·C 12·2+C 23·C 22·22=16. a 5是常数项,由二项式的展开式得a 5=C 33·C 22·22=4. 3.(2017·浙江,16)从6男2女共8名学生中选出队长1人,副队长1人,普通队员2人组成4人服务队,要求服务队中至少有1名女生,共有________种不同的选法(用数字作答). 3.【答案】660【解析】方法一 只有1名女生时,先选1名女生,有C 12种方法;再选3名男生,有C 36种方法;然后排队长、副队长位置,有A 24种方法.由分步乘法计数原理,知共有C 12C 36A 24=480(种)选法.有2名女生时,再选2名男生,有C 26种方法;然后排队长、副队长位置,有A 24种方法.由分步乘法计数原理,知共有C 26A 24=180(种)选法.所以依据分类加法计数原理知共有480+180=660(种)不同的选法.方法二 不考虑限制条件,共有A 28C 26种不同的选法, 而没有女生的选法有A 26C 24种,故至少有1名女生的选法有A 28C 26-A 26C 24=840-180=660(种).4.(2017·江苏,3)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件. 4.【答案】18【解析】∵样本容量总体个数=60200+400+300+100=350.∴应从丙种型号的产品中抽取350×300=18(件).5.(2017·江苏,7)记函数f (x )=6+x -x 2的定义域为D .在区间[-4,5]上随机取一个数x ,则x ∈D 的概率是________. 5.【答案】59【解析】设事件“在区间[-4,5]上随机取一个数x ,则x ∈D ”为事件A , 由6+x -x 2≥0,解得-2≤x ≤3,∴D =[-2,3]. 如图,区间[-4,5]的长度为9,定义域D 的长度为5,∴P (A )=59.6.(2017·全国Ⅱ理,13)一批产品的二等品率为0.02,从这批产品中每次随机取一件,有放回地抽取100次,X 表示抽到的二等品件数,则DX =________. 6.【答案】1.96【解析】由题意得X ~B (100,0.02), ∴DX =100×0.02×(1-0.02)=1.96.7.(2017·北京理,13)能够说明“设a ,b ,c 是任意实数.若a >b >c ,则a +b >c ”是假命题的一组整数a ,b ,c 的值依次为________. 7.【答案】-2,-4,-5(答案不唯一) 【解析】只要取一组满足条件的整数即可,如-1,-2,-3;-3,-4,-6;-4,-7,-10等.8.(2017·天津理,14)用数字1,2,3,4,5,6,7,8,9组成没有重复数字,且至多有一个数字是偶数的四位数,这样的四位数一共有________个.(用数字作答) 8.【答案】1 080【解析】①当组成四位数的数字中有一个偶数时,四位数的个数为C 35·C 14·A 44=960.②当组成四位数的数字中不含偶数时,四位数的个数为A 45=120. 故符合题意的四位数一共有960+120=1 080(个).9.(2017·山东理,11)已知(1+3x )n 的展开式中含有x 2项的系数是54,则n =________. 9.【答案】4【解析】(1+3x )n 的展开式的通项为T r +1=C r n (3x )r .令r =2,得T 3=9C 2n x 2.由题意得9C 2n =54,解得n =4. 三、解答题1.(2017·全国Ⅰ文,19)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尽寸:18.439≈,161()(8.5) 2.78ii x x i =--=-∑,其中x i 为抽取的第i 个零件的尺寸,i =1,2, (16)(1)求(x i ,i )(i =1,2,…,16)的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r |<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(-3s ,+3s )之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. ①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(-3s ,+3s )之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(x i ,y i )(i =1,2,…,n )的相关系数r =,0.008≈0.09.1.解 (1)由样本数据得(x i ,i )(i =1,2,…,16)的相关系数r =≈-2.784×0.212×18.439≈-0.18,由于|r |<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)(ⅰ)由于=9.97,s ≈0.212,因此由样本数据可以看出抽取的第13个零件的尺寸在(-3s ,+3s )以外,因此需对当天的生产过程进行检查. (ⅱ)剔除离群值,即第13个数据,剩下数据的平均数为 115(16×9.97-9.22)=10.02, 因此这条生产线当天生产的零件尺寸的均值的估计值为10.02.i =116x 2i ≈16×0.2122+16×9.972≈1 591.134, 剔除第13个数据,剩下数据的样本方差为 115(1 591.134-9.222-15×10.022)≈0.008, 因此这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09.2.(2017·全国Ⅱ文,19)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A 表示时间“旧养殖法的箱产量低于50 kg”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3)附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).2.解 (1)旧养殖法的箱产量低于50 kg 的频率为 (0.012+0.014+0.024+0.034+0.040)×5=0.62. 因此,事件A 的概率估计值为0.62. (2)根据箱产量的频率分布直方图得列联表K 2的观测值k =200×(62×66-34×38)100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.3.(2017·全国Ⅲ文,18)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:(1)估计六月份这种酸奶一天的需求量不超过300瓶的概率;(2)设六月份一天销售这种酸奶的利润为Y (单位:元),当六月份这种酸奶一天的进货量为450瓶时,写出Y 的所有可能值,并估计Y 大于零的概率.3.解 (1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25,由表格数据知,最高气温低于25的频率为2+16+3690=0.6,所以这种酸奶一天的需求量不超过300瓶的概率的估计值为0.6.(2)当这种酸奶一天的进货量为450瓶时,若最高气温不低于25,则Y =6×450-4×450=900;若最高气温位于区间[20,25),则Y =6×300+2(450-300)-4×450=300; 若最高气温低于20,则Y =6×200+2(450-200)-4×450=-100, 所以,Y 的所有可能值为900,300,-100.Y 大于零当且仅当最高气温不低于20,由表格数据知,最高气温不低于20的频率为36+25+7+490=0.8.因此Y 大于零的概率的估计值为0.8.4.(2017·北京文,17)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.4.解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4,所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5, 所以总体中分数在区间[40,50)内的人数估计为400×5100=20.(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60, 所以样本中分数不小于70的男生人数为60×12=30,所以样本中的男生人数为30×2=60, 女生人数为100-60=40,所以样本中男生和女生人数的比例为60∶40=3∶2,所以根据分层抽样原理,估计总体中男生和女生人数的比例为3∶2.5.(2017·山东文,16)某旅游爱好者计划从3个亚洲国家A 1,A 2,A 3和3个欧洲国家B 1,B 2,B 3中选择2个国家去旅游.(1)若从这6个国家中任选2个,求这2个国家都是亚洲国家的概率;(2)若从亚洲国家和欧洲国家中各任选1个,求这2个国家包括A 1但不包括B 1的概率. 5.解 (1)由题意知,从6个国家中任选两个国家,其一切可能的结果组成的基本事件有:{A 1,A 2},{A 1,A 3},{A 1,B 1},{A 1,B 2},{A 1,B 3},{A 2,A 3},{A 2,B 1},{A 2,B 2},{A 2,B 3},{A 3,B 1},{A 3,B 2},{A 3,B 3},{B 1,B 2},{B 1,B 3},{B 2,B 3},共15个. 所选两个国家都是亚洲国家的事件所包含的基本事件有:{A 1,A 2},{A 1,A 3},{A 2,A 3},共3个,则所求事件的概率为P =315=15.(2)从亚洲国家和欧洲国家中各任选一个,其一切可能的结果组成的基本事件有:{A 1,B 1},{A 1,B 2},{A 1,B 3},{A 2,B 1},{A 2,B 2},{A 2,B 3},{A 3,B 1},{A 3,B 2},{A 3,B 3},共9个.包括A 1但不包括B 1的事件所包含的基本事件有: {A 1,B 2},{A 1,B 3},共2个, 则所求事件的概率为P =29.6.(2017·江苏,23)已知一个口袋有m 个白球,n 个黑球(m ,n ∈N *,n ≥2),这些球除颜色外完全相同.现将口袋中的球随机的逐个取出,并放入如图所示的编号为1,2,3,…,m +n 的抽屉内,其中第k 次取球放入编号为k 的抽屉(k =1,2,3,…,m +n ).(1)试求编号为2的抽屉内放的是黑球的概率p ;(2)随机变量X 表示最后一个取出的黑球所在抽屉编号的倒数,E (X )是X 的数学期望,证明:E (X )<n(m +n )(n -1).6.解 (1)编号为2的抽屉内放的是黑球的概率为p =C n -1m +n -1C n m +n =n m +n.(2)随机变量X 的概率分布为随机变量X 的期望为随机变量X 的的期望为:11111(1)!()(1)!()!n m nm n k n nk n k nm nm n C k E X k C C k n k n -++-==++-==--∑∑所以1(2)!1(2)!()(1)!()!(1)(2)!()!m nm nn n k n k n m nm nk k E X C n k n n C n k n ++==++--<=-----∑∑ 222121(1...)(1)n n n n n m n nm nC C C n C ----+-+=++++- 12221121(...)(1)n n n n n n n m n nm nC C C C n C ------+-+=++++- 122221(...)(1)n n n n n n n m n nm nC C C C n C ----+-+=++++- 12221...()(1)n n m n m n nm nC C n C --+-+-+==+- 11(1)()(1)n m n nm n C n n C m n n -+-+==-+-, 即()()(1)nE X m n n <+-7.(2017·全国Ⅰ理,19)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N (μ,σ2).(1)假设生产状态正常,记X 表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P (X ≥1)及X 的数学期望;(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)试说明上述监控生产过程方法的合理性; (ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:经计算得,,其中x i 为抽取的第i 个零件的尺寸,i =1,2, (16)用样本平均数作为μ的估计值,用样本标准差s 作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除( -3 ,+3 )之外的数据,用剩下的数据估计μ和σ(精确到0.01).16119.9716i i x x ===∑0.212s =≈附:若随机变量Z 服从正态分布N (μ,σ2),则P (μ-3σ<Z <μ+3σ)=0.997 4,0.997 416≈0.959 2,0.008≈0.09.7.解 (1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.997 4,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.002 6,故X ~B (16,0.002 6). 因此P (X ≥1)=1-P (X =0)=1-0.997 416≈0.040 8. X 的数学期望E (X )=16×0.002 6=0.041 6.(2)(ⅰ)如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小,因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的. (ⅱ)由x =9.97,s ≈0.212,得μ的估计值为=9.97,σ的估计值为=0.212,由样本数据可以看出有一个零件的尺寸在( -3 ,+3 )之外,因此需对当天的生产过程进行检查. 剔除( -3 ,+3 )之外的数据9.22,剩下数据的平均数为115×(16×9.97-9.22)=10.02.因此μ的估计值为10.02.i =116x 2i =16×0.2122+16×9.972≈1 591.134. 剔除( -3 ,+3 )之外的数据9.22,剩下数据的样本方差为115×(1 591.134-9.222-15×10.022)≈0.008,因此σ的估计值为0.008≈0.09.8.(2017·全国Ⅱ理,18)淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件:旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)8.解(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”.由题意知,P(A)=P(BC)=P(B)P(C).旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50 kg的频率为(0.068+0.046+0.010+0.008)×5=0.66,故P(C)的估计值为0.66.因此,事件A 的概率估计值为0.62×0.66=0.409 2. (2)根据箱产量的频率分布直方图得列联表K 2=200×(62×66-34×38)100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg 的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5, 箱产量低于55 kg 的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5, 故新养殖法箱产量的中位数的估计值为 50+0.5-0.340.068≈52.35 (kg).9.(2017·全国Ⅲ理,18)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:(1)求六月份这种酸奶一天的需求量X (单位:瓶)的分布列;(2)设六月份一天销售这种酸奶的利润为Y (单位:元),当六月份这种酸奶一天的进货量n (单位:瓶)为多少时,Y 的数学期望达到最大值?9.解 (1)由题意知,X 所有的可能取值为200,300,500, 由表格数据知,P (X =200)=2+1630×3=0.2,P (X =300)=3630×3=0.4,P (X =500)=25+7+430×3=0.4.则X 的分布列为(2),因此只需考虑200≤n ≤500. 当300≤n ≤500时,若最高气温不低于25,则Y =6n -4n =2n ;若最高气温位于区间[20,25),则Y =6×300+2(n -300)-4n =1 200-2n ; 若最高气温低于20,则Y =6×200+2(n -200)-4n =800-2n , 因此EY =2n ×0.4+(1 200-2n )×0.4+(800-2n )×0.2=640-0.4n . 当200≤n <300时,若最高气温不低于20,则Y =6n -4n =2n ;若最高气温低于20,则Y =6×200+2(n -200)-4n =800-2n , 因此EY =2n ×(0.4+0.4)+(800-2n )×0.2=160+1.2n .所以当n =300时,Y 的数学期望达到最大值,最大值为520元.10.(2017·北京理,17)为了研究一种新药的疗效,选100名患者随机分成两组,每组各50名,一组服药,另一组不服药.一段时间后,记录了两组患者的生理指标x 和y 的数据,并制成下图,其中“*”表示服药者,“+”表示未服药者.(1)从服药的50名患者中随机选出一人,求此人指标y 的值小于60的概率;(2)从图中A ,B ,C ,D 四人中随机选出两人,记ξ为选出的两人中指标x 的值大于1.7的人数,求ξ的分布列和数学期望E (ξ);(3)试判断这100名患者中服药者指标y 数据的方差与未服药者指标y 数据的方差的大小.(只需写出结论)10.解:(1)由题图可知,在服药的50名患者中,指标y 的值小于60的有15人,所以从服药的50名患者中随机选出一人,此人指标y 的值小于60的概率为1550=0.3.(2)由题图可知,A ,B ,C ,D 四人中,指标x 的值大于1.7的有2人:A 和C . 所以ξ的所有可能取值为0,1,2.P (ξ=0)=C 22C 24=16,P (ξ=1)=C 12C 12C 24=23,P (ξ=2)=C 22C 24=16,所以ξ的分布列为故ξ的期望E (ξ)=0×16+1×23+2×16=1.(3)在这100名患者中,服药者指标y 数据的方差大于未服药者指标y 数据的方差. 11.(2017·天津理,16)从甲地到乙地要经过3个十字路口,设各路口信号灯工作相互独立,且在各路口遇到红灯的概率分别为12,13,14.(1)设X 表示一辆车从甲地到乙地遇到红灯的个数,求随机变量X 的分布列和数学期望; (2)若有2辆车独立地从甲地到乙地,求这2辆车共遇到1个红灯的概率. 11.解 (1)随机变量X 的所有可能取值为0,1,2,3, P (X =0)=⎝⎛⎭⎫1-12×⎝⎛⎭⎫1-13×⎝⎛⎭⎫1-14=14,P (X =1)=12×⎝⎛⎭⎫1-13×⎝⎛⎭⎫1-14+⎝⎛⎭⎫1-12×13×⎝⎛⎭⎫1-14+⎝⎛⎭⎫1-12×⎝⎛⎭⎫1-13×14=1124, P (X =2)=⎝⎛⎭⎫1-12×13×14+12×⎝⎛⎭⎫1-13×14+12×13×⎝⎛⎭⎫1-14=14, P (X =3)=12×13×14=124.所以,随机变量X 的分布列为随机变量X 的数学期望E (X )=0×14+1×1124+2×14+3×124=1312.(2)设Y 表示第一辆车遇到红灯的个数,Z 表示第二辆车遇到红灯的个数,则所求事件的概率为P (Y +Z =1)=P (Y =0,Z =1)+P (Y =1,Z =0) =P (Y =0)P (Z =1)+P (Y =1)P (Z =0) =14×1124+1124×14=1148.所以,这2辆车共遇到1个红灯的概率为1148.12.(2017·山东理,18)在心理学研究中,常采用对比试验的方法评价不同心理暗示对人的影响,具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示,另一组接受乙种心理暗示,通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗示的作用.现有6名男志愿者A 1,A 2,A 3,A 4,A 5,A 6和4名女志愿者B 1,B 2,B 3,B 4,从中随机抽取5人接受甲种心理暗示,另5人接受乙种心理暗示. (1)求接受甲种心理暗示的志愿者中包含A 1但不包含B 1的概率;(2)用X 表示接受乙种心理暗示的女志愿者人数,求X 的分布列与数学期望EX . 12.解 (1)记接受甲种心理暗示的志愿者中包含A 1但不包含B 1的事件为M , 则P (M )=C 48C 510=518.(2)由题意知X 可取的值为0,1,2,3,4,则 P (X =0)=C 56C 510=142,P (X =1)=C 46C 14C 510=521,P (X =2)=C 36C 24C 510=1021,P (X =3)=C 26C 34C 510=521,P (X =4)=C 16C 44C 510=142.因此X 的分布列为所以X 的数学期望EX =0×P (X =0)+1×P (X =1)+2×P (X =2)+3×P (X =3)+4×P (X =4) =0+1×521+2×1021+3×521+4×142=2.。

专题14 概率与统计(选择题、填空题)-三年(2017-2019)高考真题数学(文)分项汇编(解析版)

专题14 概率与统计(选择题、填空题)-三年(2017-2019)高考真题数学(文)分项汇编(解析版)

专题14 概率与统计(选择题、填空题)1.【2019年高考全国Ⅲ卷文数】《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为 A .0.5 B .0.6 C .0.7D .0.8【答案】C【解析】由题意得,阅读过《西游记》的学生人数为90-80+60=70, 则其与该校学生人数之比为70÷100=0.7.故选C . 【名师点睛】本题考查抽样数据的统计,渗透了数据处理和数学运算素养.采取去重法,利用转化与化归思想解题.2.【2019年高考全国Ⅰ卷文数】某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生 B .200号学生 C .616号学生D .815号学生【答案】C【解析】由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,解得15n =,不合题意;若200610n =+,解得19.4n =,不合题意;若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C .3.【2019年高考全国Ⅱ卷文数】生物实验室有5只兔子,其中只有3只测量过某项指标,若从这5只兔子中随机取出3只,则恰有2只测量过该指标的概率为A .23 B .35 C .25D .15【答案】B【分析】首先用列举法写出所有基本事件,从中确定符合条件的基本事件数,应用古典概率的计算公式即可求解.【解析】设其中做过测试的3只兔子为,,a b c ,剩余的2只为,A B ,则从这5只中任取3只的所有取法有{,,},{,,},{,,},{,,},{,,},{,,},{,,}a b c a b A a b B a c A a c B a A B b c A ,{,,},{,,},{,,}b c B b A B c A B ,共10种.其中恰有2只做过测试的取法有{,,},{,,},{,,},{,,},a b A a b B a c A a c B {,,},{,,}b c A b c B ,共6种, 所以恰有2只做过测试的概率为63105,故选B . 【名师点睛】本题主要考查古典概率的求解,题目较易,注重了基础知识、基本计算能力的考查.应用列举法写出所有基本事件过程中易于出现遗漏或重复,将兔子标注字母,利用“树图法”,可最大限度的避免出错.4.【2018年高考全国Ⅰ卷文数】某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:建设前经济收入构成比例 建设后经济收入构成比例则下面结论中不正确的是 A .新农村建设后,种植收入减少B .新农村建设后,其他收入增加了一倍以上C .新农村建设后,养殖收入增加了一倍D .新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 【答案】A【解析】设新农村建设前的收入为M ,而新农村建设后的收入为2M ,则新农村建设前种植收入为0.6M ,而新农村建设后的种植收入为0.74M ,所以种植收入增加了,所以A 项不正确;新农村建设前其他收入为0.04M ,新农村建设后其他收入为0.1M ,故增加了一倍以上,所以B 项正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,所以增加了一倍,所以C项正确;新农村建设后,养殖收入与第三产业收入的综合占经济收入的,所以超过了经济收入的一半,所以D正确;故选A.5.【2018年高考全国Ⅱ卷文数】从2名男同学和3名女同学中任选2人参加社区服务,则选中的2人都是女同学的概率为A.0.6B.0.5C.0.4D.0.3【答案】D【解析】设2名男同学为,3名女同学为,从以上5名同学中任选2人总共有,共10种可能,选中的2人都是女同学的情况共有,共3种可能,则选中的2人都是女同学的概率为,故选D.【名师点睛】应用古典概型求概率的步骤:第一步,判断本试验的结果是否为等可能事件,设出事件;第二步,分别求出基本事件的总数与所求事件中所包含的基本事件个数;第三步,利用公式求出事件的概率.6.【2017年高考全国Ⅰ卷文数】如图,正方形ABCD内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A.14B.π8C.12D.π4【答案】B【解析】不妨设正方形边长为a,由图形的对称性可知,太极图中黑、白部分面积相等,即各占圆面积的一半.由几何概型概率的计算公式得,所求概率为221π()π228a a ⨯⨯=,选B .【名师点睛】对于一个具体问题能否用几何概型的概率公式计算事件的概率,关键在于能否将问题几何化,也可根据实际问题的具体情况,选取合适的参数建立适当的坐标系,在此基础上,将实验的每一结果一一对应于该坐标系中的一点,使得全体结果构成一个可度量的区域;另外,从几何概型的定义可知,在几何概型中,“等可能”一词理解为对应于每个实验结果的点落入某区域内的可能性大小,仅与该区域的度量成正比,而与该区域的位置、形状无关.7.【2017年高考全国Ⅰ卷文数】为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg )分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 A .x 1,x 2,…,x n 的平均数 B .x 1,x 2,…,x n 的标准差 C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数【答案】B【解析】评估这种农作物亩产量稳定程度的指标是标准差或方差,故选B .【名师点睛】众数:一组数据出现次数最多的数叫众数,众数反映一组数据的多数水平; 中位数:一组数据中间的数(起到分水岭的作用),中位数反映一组数据的中间水平; 平均数:反映一组数据的平均水平;方差:反映一组数据偏离平均数的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小).在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定. 标准差是方差的算术平方根,意义在于反映一组数据的离散程度.8.【2017年高考山东卷文数】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为A .3,5B .5,5C .3,7D .5,7【答案】A【解析】由题意,甲组数据为56,62,65,70x +,74,乙组数据为59,61,67,60y +,78.要使两组数据的中位数相等,则6560y =+,所以5y =, 又平均数相同,则566265(70)74596167657855x +++++++++=,解得3x =.故选A .【名师点睛】由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示.缺点是当样本容量较大时,作图较烦琐.利用茎叶图对样本进行估计时,要注意区分茎与叶,茎是指中间的一列数,叶是从茎的旁边生长出来的数.9.【2017年高考全国Ⅲ卷文数】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是 A .月接待游客量逐月增加 B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 【答案】A【解析】由折线图,可知每年7月到8月折线图呈下降趋势,月接待游客量减少,A 错误; 折线图整体呈现出增长的趋势,年接待游客量逐年增加,B 正确;每年的接待游客量7,8月份达到最高点,即各年的月接待游客量高峰期大致在7,8月,C 正确; 每年1月至6月的月折线图平稳,月接待游客量波动性更小,7月至12月折线图不平稳,月接待游客量波动性大,D 正确. 所以选A .【名师点睛】用样本估计总体时统计图表主要有:(1)频率分布直方图,特点:频率分布直方图中各小长方形的面积等于对应区间的频率,所有小长方形的面积之和为1;(2)频率分布折线图,连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图;(3)茎叶图,对于统计图表类题目,最重要的是认真观察图表,从中提炼出有用的信息和数据.10.【2017年高考天津卷文数】有5支彩笔(除颜色外无差别),颜色分别为红、黄、蓝、绿、紫.从这5支彩笔中任取2支不同颜色的彩笔,则取出的2支彩笔中含有红色彩笔的概率为A.45B.35C.25D.15【答案】C【解析】选取两支彩笔的方法有:红黄、红蓝、红绿、红紫、黄蓝、黄绿、黄紫、蓝绿、蓝紫、绿紫,共10种,含有红色彩笔的选法有:红黄、红蓝、红绿、红紫,共4种,由古典概型的概率计算公式,可得所求概率42105P==.故选C.【名师点睛】本题主要考查古典概型及其概率计算,属于基础题.解题时要准确理解题意,先要判断该概率模型是不是古典概型,然后找出随机事件A包含的基本事件的个数和试验中基本事件的总数,代入公式()()n APnΩ=即可得解.11.【2017年高考全国Ⅱ卷文数】从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为A.110B.15C.310D.25【答案】D【解析】如下表所示,表中的点的横坐标表示第一次取到的数,纵坐标表示第二次取到的数:总计有25种情况,满足条件的有10种.所以所求概率为102255=. 【名师点睛】古典概型中基本事件数的探求方法: (1)列举法;(2)树状图法:适合于较为复杂的问题中的基本事件的探求.对于基本事件有“有序”与“无序”区别的题目,常采用树状图法;(3)列表法:适用于多元素基本事件的求解问题,通过列表把复杂的题目简单化、抽象的题目具体化. 12.【2019年高考全国Ⅱ卷文数】我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为______________. 【答案】0.98【分析】本题考查通过统计数据进行概率的估计,采取估算法,利用概率思想解题.【解析】由题意得,经停该高铁站的列车正点数约为100.97200.98100.9939.2⨯+⨯+⨯=, 其中高铁个数为10201040++=,所以该站所有高铁平均正点率约为39.20.9840=. 【名师点睛】本题考查了概率统计,渗透了数据处理和数学运算素养,侧重统计数据的概率估算,难度不大.易忽视概率的估算值不是精确值而失误,根据分类抽样的统计数据,估算出正点列车数量与列车总数的比值.13.【2018年高考全国Ⅲ卷文数】公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是______________. 【答案】分层抽样【解析】由于从不同年龄段客户中抽取,故采用分层抽样,故答案为:分层抽样.14.【2019年高考江苏卷】已知一组数据6,7,8,8,9,10,则该组数据的方差是______________.【答案】53【解析】由题意,该组数据的平均数为678891086+++++=,所以该组数据的方差是22222215[(68)(78)(88)(88)(98)(108)]63-+-+-+-+-+-=. 15.【2018年高考江苏卷】已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为______________. 【答案】90【解析】由茎叶图可知,5位裁判打出的分数分别为 , , , , , 故平均数为8989909191905++++=.16.【2018年高考江苏卷】某兴趣小组有2名男生和3名女生,现从中任选2名学生去参加活动,则恰好选中2名女生的概率为______________. 【答案】310【解析】从5名学生中抽取2名学生,共有10种方法,其中恰好选中2名女生的方法有3种, 因此所求概率为310.17.【2017年高考江苏卷】记函数()f x =D .在区间[4,5]-上随机取一个数x ,则x D ∈的概率是______________.【答案】59【解析】由260x x +-≥,即260x x --≤,得23x -≤≤,根据几何概型的概率计算公式得x D ∈的概率是3(2)55(4)9--=--.【名师点睛】(1)当试验的结果构成的区域为长度、面积或体积等时,应考虑使用几何概型求解;(2)利用几何概型求概率时,关键是试验的全部结果构成的区域和事件发生的区域的寻找,有时需要设出变量,在坐标系中表示所需要的区域;(3)几何概型有两个特点:①无限性,②等可能性.基本事件可以抽象为点,尽管这些点是无限的,但它们所占据的区域都是有限的,因此可用“比例解法”求解. 18.【2017年高考江苏卷】某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取______________件. 【答案】18【解析】应从丙种型号的产品中抽取30060181000⨯=件,故答案为18. 【名师点睛】在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即n i ∶N i =n ∶N .。

近五年(2017-2021)高考数学真题分类汇编10 概率与统计

近五年(2017-2021)高考数学真题分类汇编10 概率与统计

近五年(2017-2021)高考数学真题分类汇编十、概率与统计一、单选题1.(2021·全国(文))为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间2.(2021·全国(理))将4个1和2个0随机排成一行,则2个0不相邻的概率为()A.13B.25C.23D.453.(2021·全国(文))将3个1和2个0随机排成一行,则2个0不相邻的概率为()A.0.3 B.0.5 C.0.6 D.0.84.(2021·全国(理))在区间(0,1)与(1,2)中各随机取1个数,则两数之和大于74的概率为()A.79B.2332C.932D.295.(2021·全国(文))在区间10,2⎛⎤⎥⎝⎦随机取1个数,则取到的数小于13的概率为()A.34B.23C.13D.166.(2021·全国)有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回的随机取两次,每次取1个球,甲表示事件“第一次取出的球的数字是1”,乙表示事件“第二次取出的球的数字是2”,丙表示事件“两次取出的球的数字之和是8”,丁表示事件“两次取出的球的数字之和是7”,则()A.甲与丙相互独立B.甲与丁相互独立C.乙与丙相互独立D.丙与丁相互独立7.(2020·天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[)[)[)[]5.31,5.33,5.33,5.35,,5.45,5.47,5.47,5.49,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为()A.10 B.18 C.20 D.36 8.(2020·全国(文))设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为()A.0.01 B.0.1 C.1 D.10 9.(2020·全国(文))如图,将钢琴上的12个键依次记为a1,a2,…,a12.设1≤i<j<k≤12.若k–j=3且j–i=4,则称a i,a j,a k为原位大三和弦;若k–j=4且j–i=3,则称a i,a j,a k为原位小三和弦.用这12个键可以构成的原位大三和弦与原位小三和弦的个数之和为()A.5 B.8 C.10 D.1510.(2020·全国(理))在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是( )A .14230.1,0.4p p p p ====B .14230.4,0.1p p p p ====C .14230.2,0.3p p p p ====D .14230.3,0.2p p p p ====11.(2020·全国(文))设O 为正方形ABCD 的中心,在O ,A ,B ,C ,D 中任取3点,则取到的3点共线的概率为( ) A .15B .25 C .12D .4512.(2020·全国(理))某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+13.(2019·浙江)设01a <<,则随机变量X 的分布列是:则当a 在()0,1内增大时 A .()D X 增大 B .()D X 减小C .()D X 先增大后减小D .()D X 先减小后增大14.(2019·全国(文))某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生B .200号学生C .616号学生D .815号学生15.(2019·全国(理))演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差16.(2019·全国(理))我国古代典籍《周易》用“卦”描述万物的变化.每一“重卦”由从下到上排列的6个爻组成,爻分为阳爻“——”和阴爻“— —”,如图就是一重卦.在所有重卦中随机取一重卦,则该重卦恰有3个阳爻的概率是A .516B .1132C .2132D .111617.(2018·浙江)设01p <<,随机变量ξ的分布列如图,则当p 在()0,1内增大时,A .()D ξ减小B .()D ξ增大C .()D ξ先减小后增大D .()D ξ先增大后减小18.(2018·全国(理))某群体中的每位成员使用移动支付的概率都为p ,各成员的支付方式相互独立,设X 为该群体的10位成员中使用移动支付的人数, 2.4DX =,()()46P X P X =<=,则p =A .0.7B .0.6C .0.4D .0.319.(2018·全国(理))如图来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边AB ,AC .△ABC 的三边所围成的区域记为I ,黑色部分记为II ,其余部分记为III .在整个图形中随机取一点,此点取自I,II,III的概率分别记为p1,p2,p3,则A.p1=p2B.p1=p3C.p2=p3D.p1=p2+p320.(2018·全国(文))某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半21.(2017·全国(理))某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳22.(2017·山东(文))下图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为A .5,5B .3,5C .3,7D .5,723.(2017·全国(文))如图,正方形ABCD 内的图形来自中国古代的太极图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称,在正方形内随机取一点,则此点取自黑色部分的概率是A .14B .8π C .12D .4π 24.(2017·山东(理))为了研究某班学生的脚长x (单位厘米)和身高y (单位厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为ˆˆˆy bx a =+.已知101225i i x ==∑,1011600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计其身高为 A .160B .163C .166D .17025.(2017·全国(理))如图,正方形ABCD 内的图形来自中国古代的太极图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称,在正方形内随机取一点,则此点取自黑色部分的概率是A .14B .8π C .12D .4π 26.(2017·天津(文))有5支彩笔(除颜色外无差别),颜色分别为红、黄、蓝、绿、紫.从这5支彩笔中任取2支不同颜色的彩笔,则取出的2支彩笔中含有红色彩笔的概率为 A .45B .35C .25D .1527.(2017·浙江)已知随机变量i ξ满足P (i ξ=1)=p i ,P (i ξ=0)=1—p i ,i =1,2.若0<p 1<p 2<12,则 A .1E()ξ<2E()ξ,1D()ξ<2D()ξ B .1E()ξ<2E()ξ,1D()ξ>2D()ξ C .1E()ξ>2E()ξ,1D()ξ<2D()ξD .1E()ξ>2E()ξ,1D()ξ>2D()ξ28.(2011·湖北(理))如图,用K 、A 1、A 2三类不同的元件连接成一个系统.当K 正常工作且A 1、A 2至少有一个正常工作时,系统正常工作,已知K 、A 1、A 2正常工作的概率依次是0.9、0.8、0.8,则系统正常工作的概率为A .0.960B .0.864C .0.720D .0.576二、多选题29.(2021·全国)有一组样本数据1x ,2x ,…,n x ,由这组数据得到新样本数据1y ,2y ,…,n y ,其中i i y x c =+(1,2,,),i n c =⋅⋅⋅为非零常数,则( )A .两组样本数据的样本平均数相同B .两组样本数据的样本中位数相同C .两组样本数据的样本标准差相同D .两组样数据的样本极差相同30.(2020·海南)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是A .这11天复工指数和复产指数均逐日增加;B .这11天期间,复产指数增量大于复工指数的增量;C .第3天至第11天复工复产指数均超过80%;D .第9天至第11天复产指数增量大于复工指数的增量;31.(2020·海南)信息熵是信息论中的一个重要概念.设随机变量X 所有可能的取值为1,2,,n ,且1()0(1,2,,),1ni i i P X i p i n p ===>==∑,定义X 的信息熵21()log ni i i H X p p ==-∑.( )A .若n =1,则H (X )=0B .若n =2,则H (X )随着1p 的增大而增大C .若1(1,2,,)i p i n n==,则H (X )随着n 的增大而增大D .若n =2m ,随机变量Y 所有可能的取值为1,2,,m ,且21()(1,2,,)j m j P Y j p p j m +-==+=,则H (X )≤H (Y )三、解答题32.(2021·全国)某学校组织“一带一路”知识竞赛,有A ,B 两类问题,每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A 类问题中的每个问题回答正确得20分,否则得0分;B 类问题中的每个问题回答正确得80分,否则得0分,己知小明能正确回答A 类问题的概率为0.8,能正确回答B 类问题的概率为0.6,且能正确回答问题的概率与回答次序无关. (1)若小明先回答A 类问题,记X 为小明的累计得分,求X 的分布列; (2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.33.(2021·全国(文))甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++34.(2021·全国(理))某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备和新设备生产产品的该项指标的样本平均数分别记为x 和y ,样本方差分别记为21S 和22S .(1)求x ,y ,21S ,22S ;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y x -≥否则不认为有显著提高).35.(2020·海南)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM 2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO浓度不超过150”的概率;(2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO浓度有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,36.(2020·北京)某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:假设所有学生对活动方案是否支持相互独立.(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(Ⅲ)将该校学生支持方案二的概率估计值记为0p ,假设该校一年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为1p ,试比较0p 与1p 的大小.(结论不要求证明)37.(2020·海南)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM 2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM 2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM 2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,38.(2020·江苏)甲口袋中装有2个黑球和1个白球,乙口袋中装有3个白球.现从甲、乙两口袋中各任取一个球交换放入另一口袋,重复n次这样的操作,记甲口袋中黑球个数为X n,恰有2个黑球的概率为p n,恰有1个黑球的概率为q n.(1)求p1·q1和p2·q2;(2)求2p n+q n与2p n-1+q n-1的递推关系式和X n的数学期望E(X n)(用n表示) .39.(2020·全国(文))某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,40.(2020·全国(文))某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表乙分厂产品等级的频数分布表(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?41.(2020·全国(理))甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12,(1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率;(3)求丙最终获胜的概率.42.(2020·全国(理))某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160i ix==∑,2011200i i y ==∑,2021)80i i x x =-=∑(,2021)9000i i y y =-=∑(,201))800ii ix y x y =--=∑((. (1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r =12211))))ni iiiin ni i x y x x y y y x ===----∑∑∑((((,≈1.414.43.(2019·江苏)在平面直角坐标系xOy 中,设点集{(0,0),(1,0),(2,0),,(,0)}n A n =⋯,{(0,1),(,1)},{(0,2),(1,2),(2,2),,(,2)},.n n B n C n n N *==∈令n nn n M A B C =.从集合M n 中任取两个不同的点,用随机变量X 表示它们之间的距离. (1)当n =1时,求X 的概率分布;(2)对给定的正整数n (n ≥3),求概率P (X ≤n )(用n 表示).44.(2019·北京(文))改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校所有的1000名学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:(Ⅰ)估计该校学生中上个月A ,B 两种支付方式都使用的人数;(Ⅱ)从样本仅使用B 的学生中随机抽取1人,求该学生上个月支付金额大于2000元的概率;(Ⅲ)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用B的学生中随机抽查1人,发现他本月的支付金额大于2000元.结合(Ⅱ)的结果,能否认为样本仅使用B的学生中本月支付金额大于2000元的人数有变化?说明理由.45.(2019·北京(理))改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:(Ⅰ)从全校学生中随机抽取1人,估计该学生上个月A,B两种支付方式都使用的概率;(Ⅱ)从样本仅使用A和仅使用B的学生中各随机抽取1人,以X表示这2人中上个月支付金额大于1000元的人数,求X的分布列和数学期望;(Ⅲ)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A的学生中,随机抽查3人,发现他们本月的支付金额都大于2000元.根据抽查结果,能否认为样本仅使用A的学生中本月支付金额大于2000元的人数有变化?说明理由.46.(2019·全国(理))为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成,A B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:P C的估计记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到()值为0.70.(1)求乙离子残留百分比直方图中,a b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).47.(2019·天津(文))2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况.(Ⅰ)应从老、中、青员工中分别抽取多少人?(Ⅱ)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为A B C D E F .享受情况如下表,其中“”表示享受,“×”表示不享受.现从这6人中,,,,,随机抽取2人接受采访.(i)试用所给字母列举出所有可能的抽取结果;(ii)设M为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件M发生的概率.48.(2019·天津(理))设甲、乙两位同学上学期间,每天7:30之前到校的概率均为2 3 .假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.(Ⅰ)用X表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量X的分布列和数学期望;(Ⅱ)设M为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件M发生的概率.49.(2019·全国(文))某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.()分别估计这类企业中产值增长率不低于的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)8.602≈.50.(2019·全国(文))某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.51.(2019·全国(理))11分制乒乓球比赛,每赢一球得1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10:10平后,甲先发球,两人又打了X 个球该局比赛结束. (1)求P (X =2);(2)求事件“X =4且甲获胜”的概率.52.(2019·全国(理))为了治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得1-分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得1-分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X .(1)求X 的分布列;(2)若甲药、乙药在试验开始时都赋予4分,(0,1,,8)i p i =表示“甲药的累计得分为i 时,最终认为甲药比乙药更有效”的概率,则00p =,81p =,11i i i i p ap bp cp -+=++(1,2,,7)i =,其中(1)a P X ==-,(0)b P X ==,(1)c P X ==.假设0.5α=,0.8β=.(i)证明:1{}i i p p +-(0,1,2,,7)i =为等比数列;(ii)求4p ,并根据4p 的值解释这种试验方案的合理性.53.(2018·北京(理))电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.假设所有电影是否获得好评相互独立.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(Ⅲ)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“1k ξ=”表示第k 类电影得到人们喜欢,“0k ξ=”表示第k 类电影没有得到人们喜欢(k =1,2,3,4,5,6).写出方差1D ξ,2D ξ,3D ξ,4D ξ,5D ξ,6D ξ的大小关系. 54.(2018·北京(文))电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)随机选取1部电影,估计这部电影没有获得好评的概率;(Ⅲ)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)55.(2018·全国(理))某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min )绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:()()()()()22n ad bcKa b c d a c b d-=++++,56.(2018·全国(文))某家庭记录了未使用节水龙头50天的日用水量数据(单位:3m)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于30.35m 的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)57.(2018·全国(文))下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,,17)建立模型①:ˆ30.413.5y t =-+;根据2010年至2016年的数据(时间变量t 的值依次为1,2,,7)建立模型②:ˆ9917.5yt =+. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.58.(2018·天津(理))已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.(I )应从甲、乙、丙三个部门的员工中分别抽取多少人?(II )若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.(i )用X 表示抽取的3人中睡眠不足..的员工人数,求随机变量X 的分布列与数学期望; (ii )设A 为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A 发生的概率.59.(2018·全国(理))某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产。

【高考冲刺】高考数学(文)真题专项汇编卷(2017—2019) 知识点10:概率与统计

【高考冲刺】高考数学(文)真题专项汇编卷(2017—2019) 知识点10:概率与统计

知识点10:概率与统计1、某学校为了解1000名新生的身体素质,将这些学生编号为1,2, (1000)从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是( )A.8号学生B.200号学生C.616号学生D.815号学生2、从2名男同学和3名女同学中任选2人参加社区服务,则选中的2人都是女同学的概率为( )A.0.6B.0.5C.0.4D.0.33、某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区系农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半4、若某群体中的成员只用只用现金支付的概率为0.45,既用现金支付也用非现金支付的概率为0.15,则不用现金支付的概率为( )A.0.3B.0.4C.0.6D.0.75、如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据单位:件,若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )A. 3,5B. 5,5C. 3,7D. 5,76、有5支彩笔(除颜色外无差别),颜色分别为红、黄、蓝、绿、紫.从这5支彩笔中任取2支不同颜色的彩笔,则取出的2支彩笔中含有红色彩笔的概率为( )A.45B.35C.25D.157、某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( )A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳8、如图,正方形ABCD内的图形来自中国古代的太极图正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称在正方形内随机取一点,则此点取自黑色部分的概率是()A.14B.π8C.12D.π49、从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为( )A.110B.15C.310D.2510、改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月,A B两种移动支付方式的使用情况,从全校所有的1000名学生中随机抽取了100人,发现样本中,A B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:不大于2000元大于2000元仅使用A 27人3人仅使用B 24人1人(1)估计该校学生中上个月,A B两种支付方式都使用的人数;(2)从样本仅使用B的学生中随机抽取1人,求该学生上个月支付金额大于2000元的概率;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用B的学生中随机抽查1人,发现他本月的支付金额大于2000元.结合(2)的结果,能否认为样本仅使用B的学生中本月支付金额大于2000元的人数有变化?说明理由. 11、2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况.(1)应从老、中、青员工中分别抽取多少人?(2)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为,,,,,A B C D E F.享受情况如右表,其中“”表示享受,“ ”表示不享受.现从这6人中随机抽取2人接受采访.②.设M为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件M 发生的概率.12、为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A B、两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每组小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到()P C 的估计值为0.70.(1).求乙离子残留百分比直方图中,a b的值;(2).分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).13、已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(1)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(2)设抽出的7名同学分别用,,,,,,A B C D E F G表示,现从中随机抽取2名同学承担敬老院的卫生工作.①试用所给字母列举出所有可能的抽取结果;②设M 为事件“抽取的2名同学来自同一年级”,求事件M 发生的概率.14、某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25℃,需求量为500瓶;如果最高气温位于区间[)20,25,需求量为300瓶;如果最高气温低于20℃,需求量为200瓶,为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表. 最高气温[)10,15 [)15,20 [)20,25 [)25,30 [)30,35 [)35,40 天数 2 16 36 25 7 4(1)估计六月份这种酸奶一天的需求量不超过300瓶的概率;(2)设六月份一天销售这种酸奶的利润为Y (单位:元),当六月份这种酸奶一天的进货量为450瓶时,写出Y 的所以可能值,并估计Y 大于零的概率.15、海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位: kg ),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较.附:()()()()2()n ad bc K a b c d a c b d -=++++.答案以及解析1答案及解析:答案:C解析:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则60n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C .2答案及解析:答案:D解析:从5名同学中任选2人参加社区服务,有10种不同选法,其中选中的2人都是女同学的情况有3种,故3()0.310P A ==.3答案及解析:答案:A解析:设建设前总经济收入为100则建设后总经济收入为200对于A ,建设前种植收入为10060%60⨯=,建设后种植收入为20037%74,6074⨯=<故A 借误:对于B ,建设前其他收入为1004%4⨯=,建设后其他收入为2005%10,1024⨯=>⨯,故B 正确对于C ,建设前养殖收入为10030%30⨯=,建设后养殖收入为20030%60,60230⨯==⨯,故C 正确:对于D ,建设后,养殖收入占30%,第三产业收入占28%,30%28%58%50%+=>故D 正确:4答案及解析:答案:B解析:设事件A 为只用现金支付,事件B 为只用非现金支付,则()()()()P A B P A P B P AB ⋃=+=因为()0.45,()0.15P A P AB ==,()0.45()0.151P A B P B ⋃=++=,所以()0.4P B =5答案及解析:答案:A解析:由题意,甲组数据为56,62,65,70,74x +,乙组数据为59,61,67,60,78y +.要使两组数据中位数相等,有6560y =+,所以5y =,又平均数相同,则()56626570745x +++++59616765785++++=,解得3x =.故选A .6答案及解析:答案:C解析:从5支彩笔中任取2支共有10中取法,其中含有红色彩笔的取法有(红,黄),(红,篮),(红,绿),(红,紫),共4种.故所求的概率为42105=.故选C.7答案及解析:答案:A解析:A项,由折线图可看出2014年9月接待的游客量小于8月接待的游客量,因此月接待游客量并不是逐月增加的,故A项结论错误符合题意.B项,由折线图可看出2014年每个月接待的游客量小于2015年对应月份接待的游客量,2015年每个月接待的游客量小于2016年对应月份接待的游客量,所以年接待游客量逐年增加,故B项不符合题意.C项,由折线图可看出每一年的7,8月接待的游客量远高于当年其他月份,因此各年的月接待游客量高峰期大致在7,8月,故C项不符合题意.D项,由折线图可看出各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳,故D项不符合题意.故选A.8答案及解析:答案:B解析:设正方形的边长为2,则正方形的面积为4,正方形内切圆的面积为,根据对称性可知,黑色部分的面积是正方形内切圆的面积的一半,所以黑色部分的面积为π2根据几何概型的概率公式,得所求概率ππ248P==.故选B.9答案及解析:答案:D解析:先后有放回地抽取2张卡片的情况有(1,1),(1,2),(1,3),(1,4),(1,5),(2,1),(2,2),(2,3),(2,4),(2,5),(3,1),(3,2),(3,3),(3,4),(3,5),(4,1),(4,2),(4,3),(4,4),(4,5),(5,1),(5,2),(5,3),(5,4),(5,5),共25种.其中满足条件的有(2,1),(3,1),(3,2),(4,1),(4,2),(4,3),(5,1),(5,2),(5,3),(5,4),共10种情况.因此所求的概率为102P==.故选D.25510答案及解析:答案:(1)由图表可知仅使用A的人数有30人,仅使用B的人数有25人,由题意知A,B两种支付方式都不使用的有5人,所以样本中两种支付方式都使用的有1003025540---=(人),所以全校学生中两种支付方式都使用的有401000400⨯=(人).100(2)因为样本中仅使用B的学生共有25人,只有1人支付金额大于2000元,所.以该学生上个月支付金额大于2000元的概率为125.因为从仅使用B的学生中随机抽取(3)由(2)知支付金额大于2000元的概率为1251人,发现他本月的支付金额大于2000元,依据小概率事件在一次试验中是几乎不可能发生的,所以可以认为仅使用B的学生中本月支付金额大于2000元的人数有变化,且比上个月多.11答案及解析:答案:(1)由已知,老、中、青员工人数之比为6:9:10,由于采用分层抽样的方法从中抽取25位员工,因此应从老、中、青员中分别抽取6人,9人,10人.(2)①.从已知的6人中随机抽取2人的所有可能结果为{}{}{}{}{}{}{}{}{},,,,,,,,,,,,,,,,,,A B A C A D A E A F B C B D B E B F{}{}{}{}{}{}C D C E C F D E D F E F,,,,,,,,,,,共15种.②.由表格知,符合题意的所有可能结果为{}{}{}{}{}{}{}{}{}{}{}A B A D A E A F B D B E B F C E C F D F E F,共11种.,,,,,,,,,,,,,,,,,,,,,所以,事件M发生的概率11P M=()1512答案及解析:答案:(1) 0.35b=;(2) 4.05,6.a=,0.10解析:(1)由题得0.200.150.70a=,a++=,解得0.35由0.050.151()10.70++=-=-,解得0.10b P Cb=.(2)由甲离子的直方图可得,甲离子残留百分比的平均值为⨯+⨯+⨯+⨯+⨯+⨯=,0.1520.2030.3040.2050.1060.057 4.05乙离子残留百分比的平均值为⨯+⨯+⨯+⨯+⨯+⨯=.0.0530.1040.1550.3560.2070.158613答案及解析:答案:(1)解:由已知,甲、乙、丙三个年级的学生志愿者人数之比为3:2:2由于采用分层抽样的方法从中抽取7名同学,因此应从甲、乙、丙三个年级的学生志愿者中分别抽取3人, 2人, 2人.(2)①解:从抽出的7名同学中随机抽取2名同学的所有可能结果为{}{}{}{}{}{}{},,,,,,,,,,,,,A B A C A D A E A F A G B C {}{}{}{}{}{}{},,,,,,,,,,,,,B D B E B F B G C D C E C F{}{}{}{}{}{}{},,,,,,,,,,,,,C G D E D F D G E F E G F G 共21种.②解:由(1),不妨设抽出的7名同学中,来自甲年级的是,,,A B C来自乙年级的是,,D E 来自丙年级的是,,F G则从抽出的7名同学中随机抽取的2名同学来自同一年级的所有可能结果为 {}{}{}{}{},,,,,,,,,,A B A C B C D E F G 共5种.所以,事件M 发生的概率为()5.21P M =14答案及解析:答案:(1)最高气温低于25时这种酸奶的需求量不超过300瓶,则216363905P ++==. (2)当最高气温不低于25时,需求量为500瓶,进货450瓶均可售出, 所以利润450(64)900Y =⨯-= (元).当最高气温位于区间[)20,25时,需求量为300瓶,进货450瓶只能售出300瓶,所以利润()()300642450300300Y =⨯--⨯-= (元).当最高气温低于20,需求量为200瓶,进货450瓶只能售出200瓶, 所以利润()()200642450200100Y =⨯--⨯-=- (元).当利润0Y >时,最高气温不低于20,所以3625744905P +++== (或21641905P +=-=). 15答案及解析:答案:(1)旧养殖法的箱产量低于50kg 的频率为:()(0.0120.0140.024P A =+++0.0340.040)50.62+⨯=.因此,事件A 的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表()222006266343815.70510010096104K ⨯⨯-⨯=≈⨯⨯⨯. 由于15.705 6.635>,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50kg 到55kg 之间,旧养殖法的箱产量平均值(或中位数)在45kg 到50kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高, 因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.。

(晨鸟)三年高考(2017-2019)文数真题分项版解析——专题15概率与统计(解答题)(解析版)

(晨鸟)三年高考(2017-2019)文数真题分项版解析——专题15概率与统计(解答题)(解析版)

专题15 概率与统计(解答题)1.【2019年高考全国Ⅰ卷文数】某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客40 10女顾客30 20(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d.P(K2≥k)0.050 0.010 0.001k 3.841 6.635 10.828【答案】(1)男、女顾客对该商场服务满意的概率的估计值分别为0.8,0.6;(2)有95%的把握认为男、女顾客对该商场服务的评价有差异.【解析】(1)由调查数据,男顾客中对该商场服务满意的比率为400.8 50,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为300.6 50,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)由题可得22100(40203010)4.76250507030K.由于4.762 3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.2.【2019年高考全国Ⅱ卷文数】某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数 2 24 53 14 7 (1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:748.602.【答案】(1)产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%;(2)这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.【解析】(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为1470.21100.产值负增长的企业频率为20.02100.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)1(0.1020.10240.30530.50140.707)0.30100y,52211100i ii sn y y222221(0.40)2(0.20)240530.20140.407100=0.0296,0.02960.02740.17s,所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.3.【2019年高考全国Ⅲ卷文数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C 为事件:“乙离子残留在体内的百分比不低于 5.5”,根据直方图得到P (C )的估计值为0.70.(1)求乙离子残留百分比直方图中a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【答案】(1)0.35a,0.10b ;(2)甲、乙离子残留百分比的平均值的估计值分别为 4.05,6.00.【解析】(1)由已知得0.700.200.15a ,故0.35a .10.050.150.700.10b .(2)甲离子残留百分比的平均值的估计值为20.1530.2040.3050.2060.1070.05 4.05.乙离子残留百分比的平均值的估计值为30.0540.1050.1560.3570.2080.15 6.00.4.【2019年高考天津卷文数】2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况.(1)应从老、中、青员工中分别抽取多少人?(2)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为,,,,,A B C D E F .享受情况如下表,其中“○”表示享受,“×”表示不享受.现从这6人中随机抽取2人接受采访.员工项目 ABCDEF子女教育○○×○×○继续教育××○×○○大病医疗×××○××住房贷款利息○○××○○住房租金××○×××赡养老人○○×××○(i )试用所给字母列举出所有可能的抽取结果;(ii )设M 为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件M 发生的概率.【答案】(1)应从老、中、青员工中分别抽取6人,9人,10人;(2)(i )见解析,(ii )1115.【分析】本题主要考查随机抽样、用列举法计算随机事件所含的基本事件数、古典概型及其概率计算公式等基本知识,考查运用概率知识解决简单实际问题的能力.【解析】(1)由已知,老、中、青员工人数之比为 6 : 9 : 10,由于采用分层抽样的方法从中抽取25位员工,因此应从老、中、青员工中分别抽取6人,9人,10人.(2)(i)从已知的6人中随机抽取2人的所有可能结果为{, },{, },{, },{, },{, },{, },A B A C A D A E A F B C{, },{, },{, },{, {,}},,B D B E B FCD C E{,},C F {,},{,},{,}D E D F E F,共15种.(ii)由表格知,符合题意的所有可能结果为{, },{, },{, },{, },{, },{, },{, {,},{,},{,},{,},}A B A D A E A F B D B CE BF E C F D F E F,共11种.所以,事件M发生的概率11 ()15P M.5.【2019年高考北京卷文数】改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校所有的1000名学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:支付金额支付方式不大于 2 000元大于2 000元仅使用 A 27人3人仅使用 B 24人1人(1)估计该校学生中上个月A,B两种支付方式都使用的人数;(2)从样本仅使用B的学生中随机抽取1人,求该学生上个月支付金额大于 2 000元的概率;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用B的学生中随机抽查1人,发现他本月的支付金额大于 2 000元.结合(2)的结果,能否认为样本仅使用B的学生中本月支付金额大于2 000元的人数有变化?说明理由.【答案】(1)该校学生中上个月A,B两种支付方式都使用的人数约为400;(2)0.04;(3)见解析.【解析】(1)由题知,样本中仅使用A的学生有27+3=30人,仅使用B的学生有24+1=25人,A,B两种支付方式都不使用的学生有5人.故样本中A,B两种支付方式都使用的学生有100–30–25–5=40人.估计该校学生中上个月A,B两种支付方式都使用的人数为401000400 100.(2)记事件C 为“从样本仅使用B 的学生中随机抽取1人,该学生上个月的支付金额大于 2 000元”,则1()0.0425P C .(3)记事件E 为“从样本仅使用B 的学生中随机抽查1人,该学生本月的支付金额大于2 000元”.假设样本仅使用B 的学生中,本月支付金额大于 2 000元的人数没有变化,则由(2)知,4(0)0.P E .答案示例1:可以认为有变化.理由如下:()P E 比较小,概率比较小的事件一般不容易发生,一旦发生,就有理由认为本月支付金额大于 2 000元的人数发生了变化,所以可以认为有变化.答案示例2:无法确定有没有变化.理由如下:事件E 是随机事件,()P E 比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.6.【2018年高考全国Ⅱ卷文数】下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,,17)建立模型①:?30.413.5yt ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,,7)建立模型②:?9917.5yt .(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【答案】(1)模型①:226.1亿元,模型②:256.5亿元;(2)模型②得到的预测值更可靠,理由见解析.【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y $=–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为y $=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i )从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y $=99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii )从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.7.【2018年高考全国Ⅰ卷文数】某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量00.1,0.10.2,0.20.3,0.30.4,0.40.5,0.50.6,0.60.7,频数13249265使用了节水龙头50天的日用水量频数分布表日用水量00.1,0.10.2,0.20.3,0.30.4,0.40.5,0.50.6,频数151310165(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【答案】(1)见解析;(2)0.48;(3)347.45m.【解析】(1)频率分布直方图如下:(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为11(0.0510.1530.2520.3540.4590.55260.655)0.48 50x.该家庭使用了节水龙头后50天日用水量的平均数为21(0.0510.1550.25130.35100.45160.555)0.35 50x.估计使用节水龙头后,一年可节省水3(0.480.35)36547.45(m).8.【2018年高考全国Ⅲ卷文数】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:22()()()()()n ad bcKa b c d a c b d,2()0.0500.0100.0013.8416.63510.828P K kk.【答案】(1)第二种生产方式的效率更高,理由见解析;(2)列联表见解析;(3)有99%的把握认为两种生产方式的效率有差异.【解析】(1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.(2)由茎叶图知7981802m.列联表如下:超过m不超过m第一种生产方式15 5第二种生产方式 5 15(3)由于2240(151555)10 6.63520202020K,所以有99%的把握认为两种生产方式的效率有差异.9.【2018年高考北京卷文数】电影公司随机收集了电影的有关数据,经分类整理得到下表:电影类型第一类第二类第三类第四类第五类第六类电影部数140 50 300 200 800 510好评率0.4 0.2 0.15 0.25 0.2 0.1好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(2)随机选取1部电影,估计这部电影没有获得好评的概率;(3)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)【答案】(1)0.025;(2)0.814;(3)增加第五类电影的好评率,减少第二类电影的好评率.【解析】(1)由题意知,样本中电影的总部数是140+50+300+200+800+510=2000.第四类电影中获得好评的电影部数是200×0.25=50,故所求概率为500.025 2000.(2)方法1:由题意知,样本中获得好评的电影部数是140×0.4+50×0.2+300×0.15+200×0.25+800×0.2+510×0.1 =56+10+45+50+160+51=372.故所求概率估计为37210.8142000.方法2:设“随机选取1部电影,这部电影没有获得好评”为事件B.没有获得好评的电影共有140×0.6+50×0.8+300×0.85+200×0.75+800×0.8+510×0.9=1628部.由古典概型概率公式得16280.8142)00(P B.(3)增加第五类电影的好评率,减少第二类电影的好评率.10.【2018年高考天津卷文数】已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(1)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(2)设抽出的7名同学分别用A,B,C,D,E,F,G表示,现从中随机抽取2名同学承担敬老院的卫生工作.(i)试用所给字母列举出所有可能的抽取结果;(ii)设M为事件“抽取的2名同学来自同一年级”,求事件M发生的概率.【答案】(1)分别抽取3人,2人,2人;(2)(i)见解析,(ii)521.【分析】本小题主要考查随机抽样、用列举法计算随机事件所含的基本事件数、古典概型及其概率计算公式等基本知识,考查运用概率知识解决简单实际问题的能力.【解析】(1)由已知,甲、乙、丙三个年级的学生志愿者人数之比为3∶2∶2,由于采用分层抽样的方法从中抽取7名同学,因此应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人.(2)(i)从抽出的7名同学中随机抽取2名同学的所有可能结果为{A,B},{A,C},{A,D},{A,E},{A,F},{A,G},{B,C},{B,D},{B,E},{B,F},{B,G},{C,D},{C,E},{C,F},{C,G},{D,E},{D,F},{D,G},{E,F},{E,G},{F,G},共21种.(ii )由(1),不妨设抽出的7名同学中,来自甲年级的是A ,B ,C ,来自乙年级的是D ,E ,来自丙年级的是F ,G ,则从抽出的7名同学中随机抽取的2名同学来自同一年级的所有可能结果为{A ,B},{A ,C},{B ,C},{D ,E},{F ,G},共5种.所以,事件M 发生的概率为P (M )=521.11.【2017年高考全国Ⅱ卷文数】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg ),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50 kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50 kg箱产量≥50kg 旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:P ()0.050 0.010 0.001 k3.8416.63510.82822()()()()()n adbc Kab cd a c b d .【答案】(1)0.62;(2)列联表见解析,有99%的把握认为箱产量与养殖方法有关;(3)新养殖法优于旧养殖法.【分析】(1)根据频率分布直方图中小长方形面积等于对应概率,计算A 的概率;(2)将数据填入对应表格,代入卡方公式,计算215.705K ≈,对照参考数据可作出判断;(3)先从均值(或中位数)比较大小,越大越好,再从数据分布情况看稳定性,越集中越好,综上可得新养殖法优于旧养殖法.【解析】(1)旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.因此,事件A 的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表箱产量<50 kg箱产量≥50 kg旧养殖法62 38 新养殖法3466K 2=22006266343815.70510010096104()≈.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.【名师点睛】(1)频率分布直方图中小长方形面积等于对应概率,所有小长方形面积之和为1.(2)频率分布直方图中均值等于组中值与对应概率乘积的和.(3)均值大小代表水平高低,方差大小代表稳定性.12.【2017年高考全国Ⅰ卷文数】为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm ).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序 1 2 3 4 5 6 7 8 零件尺寸9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 抽取次序9 10 11 12 13 14 15 16 零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得16119.9716ii xx ,16162221111()(16)0.2121616iiii sx x xx ,1621(8.5)18.439i i ,161()(8.5)2.78ii x x i ,其中i x 为抽取的第i 个零件的尺寸,1,2,,16i .(1)求(,)i x i (1,2,,16)i的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若||0.25r ,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(3,3)x s x s 之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在(3,3)x s x s 之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(,)i i x y (1,2,,)in 的相关系数12211()()()()niii nn iii i x x y y rx x y y ,0.0080.09.【答案】(1)18.0r ,可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小;(2)(ⅰ)需对当天的生产过程进行检查;(ⅱ)均值与标准差的估计值分别为10.02,0.09.【分析】(1)依公式求r ;(2)(i )由9.7,0.212x s ,得抽取的第13个零件的尺寸在(3,3)x s x s 以外,因此需对当天的生产过程进行检查;(ii )剔除第13个数据,则均值的估计值为10.02,方差为0.09.【解析】(1)由样本数据得(,)(1,2,,16)i x i i的相关系数为16116162211()(8.5) 2.780.180.2121618.439()(8.5)ii ii i x x irx x i.由于||0.25r ,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)(i )由于9.97,0.212xs ,由样本数据可以看出抽取的第13个零件的尺寸在(3,3)x s xs 以外,因此需对当天的生产过程进行检查.(ii )剔除离群值,即第13个数据,剩下数据的平均数为1(169.979.22)10.0215,这条生产线当天生产的零件尺寸的均值的估计值为10.02.162221160.212169.971591.134ii x,剔除第13个数据,剩下数据的样本方差为221(1591.1349.221510.02)0.00815,这条生产线当天生产的零件尺寸的标准差的估计值为0.0080.09.【名师点睛】解答新颖的数学题时,一是通过转化,化“新”为“旧”;二是通过深入分析,多方联想,以“旧”攻“新”;三是创造性地运用数学思想方法,以“新”制“新”,应特别关注创新题型的切入点和生长点.13.【2017年高考全国Ⅲ卷文数】某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温[10,15)[15,20)[20,25)[25,30)[30,35)[35,40)天数216362574以最高气温位于各区间的频率估计最高气温位于该区间的概率.(1)估计六月份这种酸奶一天的需求量不超过300瓶的概率;(2)设六月份一天销售这种酸奶的利润为Y (单位:元).当六月份这种酸奶一天的进货量为450瓶时,写出Y 的所有可能值,并估计Y 大于零的概率.【答案】(1)0.6;(2)Y 的所有可能值为900,300,-100,Y 大于零的概率为0.8.【分析】(1)先确定需求量不超过300瓶的天数为2163654,再根据古典概型的概率计算公式求概率;(2)先分别求出最高气温不低于25(36天),最高气温位于区间[20,25)(36天),以及最高气温低于20(18天)对应的利润分别为900,300,100,所以Y 大于零的概率估计为3625740.890.【解析】(1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25,由表格数据知,最高气温低于25的频率为,所以这种酸奶一天的需求量不超过300瓶的概率的估计值为0.6.(2)当这种酸奶一天的进货量为450瓶时,若最高气温不低于25,则Y=6450-4450=900;若最高气温位于区间[20,25),则Y=6300+2(450-300)-4450=300;若最高气温低于20,则Y=6200+2(450-200)-4450=-100.所以,Y的所有可能值为900,300,-100.Y大于零当且仅当最高气温不低于20,由表格数据知,最高气温不低于20的频率为,因此Y大于零的概率的估计值为0.8.【名师点睛】古典概型中基本事件数的探求方法:(1)列举法;(2)树状图法:适合于较为复杂的问题中的基本事件的探求.对于基本事件有“有序”与“无序”区别的题目,常采用树状图法;(3)列表法:适用于多元素基本事件的求解问题,通过列表把复杂的题目简单化、抽象的题目具体化.14.【2017年高考北京卷文数】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30],[30,40],,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【答案】(1)0.4;(2)20;(3):32.【分析】(1)根据频率分布直方图,表示分数大于等于70的概率,就求最后两个矩形的面积;(2)根据公式:频数=总数频率进行求解;(3)首先计算分数大于等于70的总人数,根据样本中分数不小于70的男女生人数相等再计算所有的男生人数,100-男生人数就是女生人数.【解析】(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.020.04)100.6,所以样本中分数小于70的频率为10.60.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.010.020.040.02)100.9,分数在区间[40,50)内的人数为1001000.955.所以总体中分数在区间[40,50)内的人数估计为540020100.(3)由题意可知,样本中分数不小于70的学生人数为(0.020.04)1010060,所以样本中分数不小于70的男生人数为160302.所以样本中的男生人数为30260,女生人数为1006040,男生和女生人数的比例为::604032.所以根据分层抽样原理,总体中男生和女生人数的比例估计为:32.【名师点睛】(1)用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,而直方图比较直观.(2)频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.。

2019年高考数学试题分项版—统计概率(原卷版)

2019年高考数学试题分项版—统计概率(原卷版)

2019年高考数学试题分项版——统计概率(原卷版)一、选择题1.(2019·全国Ⅰ文,6)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()A.8号学生B.200号学生C.616号学生D.815号学生2.(2019·全国Ⅱ文,4)生物实验室有5只兔子,其中只有3只测量过某项指标.若从这5只兔子中随机取出3只,则恰有2只测量过该指标的概率为()A. B. C. D.3.(2019·全国Ⅱ文,5)在“一带一路”知识测验后,甲、乙、丙三人对成绩进行预测.甲:我的成绩比乙高.乙:丙的成绩比我和甲的都高.丙:我的成绩比乙高.成绩公布后,三人成绩互不相同且只有一个人预测正确,那么三人按成绩由高到低的次序为()A.甲、乙、丙B.乙、甲、丙C.丙、乙、甲D.甲、丙、乙4.(2019·全国Ⅲ文,3)两位男同学和两位女同学随机排成一列,则两位女同学相邻的概率是()A. B. C. D.5.(2019·全国Ⅲ文,4)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5 B.0.6 C.0.7 D.0.86.(2019·浙江,7)设0<a<1.随机变量X的分布列是()则当a在(0,1)内增大时,()A.D(X)增大B.D(X)减小C.D(X)先增大后减小D.D(X)先减小后增大7.(2019·全国Ⅰ理,6)我国古代典籍《周易》用“卦”描述万物的变化,每一“重卦”由从下到上排列的6个爻组成,爻分为阳爻“”和阴爻“——”,如图就是一重卦,在所有重卦中随机取一重卦,则该重卦恰有3个阳爻的概率是()A. B. C. D.8.(2019·全国Ⅱ理,5)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差9.(2019·全国Ⅲ理,3)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5 B.0.6 C.0.7 D.0.810.(2019·全国Ⅲ理,4)(1+2x2)(1+x)4的展开式中x3的系数为()A.12 B.16 C.20 D.24二、填空题1.(2019·全国Ⅱ文,14)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.2.(2019·浙江,13)在二项式(+x)9的展开式中,常数项是________,系数为有理数的项的个数是________.3.(2019·江苏,5)已知一组数据6,7,8,8,9,10,则该组数据的方差是_____________.4.(2019·江苏,6)从3名男同学和2名女同学中任选2名同学参加志愿者服务,则选出的2名同学中至少有1名女同学的概率是________.5.(2019·全国Ⅰ理,15)甲、乙两队进行篮球决赛,采取七场四胜制(当一队赢得四场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队以4∶1获胜的概率是________.6.(2019·全国Ⅱ理,13)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.7.(2019·天津理,10)8的展开式中的常数项为________.三、解答题1.(2019·全国Ⅰ文,17)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:K2=.2.(2019·全国Ⅱ文,19)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:≈8.602.3.(2019·全国Ⅲ文,17)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).4.(2019·北京文,17)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生中上个月A,B两种移动支付方式的使用情况,从全校所有的1 000名学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生支付金额分布情况如下:(1)估计该校学生中上个月A,B两种支付方式都使用的人数;(2)从样本仅使用B的学生中随机抽取1人,求该学生上个月支付金额大于2 000元的概率;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用B的学生中随机抽查1人,发现他本月的支付金额大于2 000元.结合(2)的结果,能否认为样本仅使用B的学生中本月支付金额大于2 000元的人数有变化?说明理由.5.(2019·天津文,15)2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况.(1)应从老、中、青员工中分别抽取多少人?(2)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为A,B,C,D,E,F.享受情况如下表,其中“○”表示享受,“×”表示不享受.现从这6人随机抽取2人接受采访.①试用所给字母列举出所有可能的抽取结果;②设M为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件M发生的概率.6.(2019·江苏,22)(10分)设(1+x)n=a0+a1x+a2x2+…+a n x n,n≥4,n∈N*.已知=2a2a4.(1)求n的值;(2)设(1+)n=a+b,其中a,b∈N*,求a2-3b2的值.7.(2019·江苏,23)在平面直角坐标系xOy中,设点集A n={(0,0),(1,0),(2,0),…,(n,0)},B n={(0,1),(n,1)},C n={(0,2),(1,2),(2,2),…,(n,2)},n∈N*.令M n=A n∪B n∪C n.从集合M n中任取两个不同的点,用随机变量X表示它们之间的距离.(1)当n=1时,求X的概率分布;(2)对给定的正整数n(n≥3),求概率P(X≤n)(用n表示).8.(2019·全国Ⅰ理,21)为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得-1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得-1分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.(1)求X的分布列;(2)若甲药、乙药在试验开始时都赋予4分,p i(i=0,1,…,8)表示“甲药的累计得分为i时,最终认为甲药比乙药更有效”的概率,则p0=0,p8=1,p i=ap i-1+bp i+cp i+1(i=1,2,…,7),其中a=P(X=-1),b=P(X=0),c=P(X=1).假设α=0.5,β=0.8.(ⅰ)证明:{p i+1-p i}(i=0,1,2,…,7)为等比数列;(ⅱ)求p4,并根据p4的值解释这种试验方案的合理性.9.(2019·全国Ⅱ理,18)11分制乒乓球比赛,每赢一球得1分,当某局打成10∶10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10∶10平后,甲先发球,两人又打了X个球该局比赛结束.(1)求P(X=2);(2)求事件“X=4且甲获胜”的概率.10.(2019·全国Ⅲ理,17)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).11.(2019·北京理,17)(13分)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:(Ⅱ)从样本仅使用A和仅使用B的学生中各随机抽取1人,以X表示这2人中上个月支付金额大于1000元的人数,求X的分布列和数学期望;(Ⅲ)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A的学生中,随机抽查3人,发现他们本月的支付金额都大于2000元.根据抽查结果,能否认为样本仅使用A的学生中本月支付金额大于2000元的人数有变化?说明理由.12.(2019·天津理,16)设甲、乙两位同学上学期间,每天7:30之前到校的概率均为,假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.(1)用X表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量X的分布列和数学期望;(2)设M为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件M发生的概率.。

2017-2019年高考真题数学(文)分项汇编_专题15 概率与统计(解答题)

2017-2019年高考真题数学(文)分项汇编_专题15 概率与统计(解答题)

专题15概率与统计(解答题)1.【2019年高考全国Ⅰ卷文数】某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.【答案】(1)男、女顾客对该商场服务满意的概率的估计值分别为0.8,0.6;(2)有95%的把握认为男、女顾客对该商场服务的评价有差异.【解析】(1)由调查数据,男顾客中对该商场服务满意的比率为400.8 50=,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为300.6 50=,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)由题可得22100(40203010)4.76250507030K⨯⨯-⨯=≈⨯⨯⨯.由于4.762 3.841>,故有95%的把握认为男、女顾客对该商场服务的评价有差异.2.【2019年高考全国Ⅱ卷文数】某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)8.602≈.【答案】(1)产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%;(2)这类企业产值增长率的平均数与标准差的估计值分别为30%,17%. 【解析】(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为1470.21100+=. 产值负增长的企业频率为20.02100=. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%. (2)1(0.1020.10240.30530.50140.707)0.30100y =-⨯+⨯+⨯+⨯+⨯=, ()52211100i ii s n y y ==-∑ 222221(0.40)2(0.20)240530.20140.407100⎡⎤=-⨯+-⨯+⨯+⨯+⨯⎣⎦ =0.0296,0.020.17s ==≈,所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.3.【2019年高考全国Ⅲ卷文数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P (C )的估计值为0.70.(1)求乙离子残留百分比直方图中a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表). 【答案】(1)0.35a =,0.10b =;(2)甲、乙离子残留百分比的平均值的估计值分别为4.05,6.00. 【解析】(1)由已知得0.700.200.15a =++,故0.35a =.10.050.150.700.10b =---=.(2)甲离子残留百分比的平均值的估计值为20.1530.2040.3050.2060.1070.05 4.05⨯+⨯+⨯+⨯+⨯+⨯=.乙离子残留百分比的平均值的估计值为30.0540.1050.1560.3570.2080.15 6.00⨯+⨯+⨯+⨯+⨯+⨯=.4.【2019年高考天津卷文数】2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况.(1)应从老、中、青员工中分别抽取多少人?(2)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为, , , , , A B C D E F .享受情况如下表,其中“○”表示享受,“×”表示不享受.现从这6人中随机抽取2人接受采访.(i )试用所给字母列举出所有可能的抽取结果;(ii )设M 为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件M 发生的概率. 【答案】(1)应从老、中、青员工中分别抽取6人,9人,10人;(2)(i )见解析,(ii )1115. 【分析】本题主要考查随机抽样、用列举法计算随机事件所含的基本事件数、古典概型及其概率计算公式等基本知识,考查运用概率知识解决简单实际问题的能力.【解析】(1)由已知,老、中、青员工人数之比为6 : 9 : 10,由于采用分层抽样的方法从中抽取25位员工,因此应从老、中、青员工中分别抽取6人,9人,10人.(2)(i)从已知的6人中随机抽取2人的所有可能结果为{, },{, },{, },{, },{, },{, },A B A C A D A E A F B C{, },{, },{, },{, {,}},,B D B E B FCD C E{,},C F {,},{,},{,}D E D F E F,共15种.(ii)由表格知,符合题意的所有可能结果为{, },{, },{, },{, },{, },{, },{, {,},{,},{,},{,},}A B A D A E A F B D B CE BF E C F D F E F,共11种.所以,事件M发生的概率11 ()15P M=.5.【2019年高考北京卷文数】改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校所有的1000名学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:(1)估计该校学生中上个月A,B两种支付方式都使用的人数;(2)从样本仅使用B的学生中随机抽取1人,求该学生上个月支付金额大于2000元的概率;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用B的学生中随机抽查1人,发现他本月的支付金额大于2000元.结合(2)的结果,能否认为样本仅使用B的学生中本月支付金额大于2000元的人数有变化?说明理由.【答案】(1)该校学生中上个月A,B两种支付方式都使用的人数约为400;(2)0.04;(3)见解析.【解析】(1)由题知,样本中仅使用A的学生有27+3=30人,仅使用B的学生有24+1=25人,A,B两种支付方式都不使用的学生有5人.故样本中A,B两种支付方式都使用的学生有100–30–25–5=40人.估计该校学生中上个月A,B两种支付方式都使用的人数为401000400 100⨯=.(2)记事件C 为“从样本仅使用B 的学生中随机抽取1人,该学生上个月的支付金额大于2000元”, 则1()0.0425P C ==. (3)记事件E 为“从样本仅使用B 的学生中随机抽查1人,该学生本月的支付金额大于2000元”. 假设样本仅使用B 的学生中,本月支付金额大于2000元的人数没有变化, 则由(2)知,4(0)0.P E =.答案示例1:可以认为有变化.理由如下:()P E 比较小,概率比较小的事件一般不容易发生,一旦发生,就有理由认为本月支付金额大于2000元的人数发生了变化, 所以可以认为有变化.答案示例2:无法确定有没有变化.理由如下:事件E 是随机事件,()P E 比较小,一般不容易发生,但还是有可能发生的, 所以无法确定有没有变化.6.【2018年高考全国Ⅱ卷文数】下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,,17)建立模型①:ˆ30.413.5yt =-+;根据2010年至2016年的数据(时间变量t 的值依次为1,2,,7)建立模型②:ˆ9917.5yt =+. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.【答案】(1)模型①:226.1亿元,模型②:256.5亿元;(2)模型②得到的预测值更可靠,理由见解析.【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y$=–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为y$=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y$=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.7.【2018年高考全国Ⅰ卷文数】某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)47.45m.【答案】(1)见解析;(2)0.48;(3)3【解析】(1)频率分布直方图如下:(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m 3的概率的估计值为0.48. (3)该家庭未使用节水龙头50天日用水量的平均数为11(0.0510.1530.2520.3540.4590.55260.655)0.4850x =⨯+⨯+⨯+⨯+⨯+⨯+⨯=. 该家庭使用了节水龙头后50天日用水量的平均数为21(0.0510.1550.25130.35100.45160.555)0.3550x =⨯+⨯+⨯+⨯+⨯+⨯=. 估计使用节水龙头后,一年可节省水3(0.480.35)36547.45(m )-⨯=.8.【2018年高考全国Ⅲ卷文数】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min )绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++,2()0.0500.0100.0013.8416.63510.828P K k k ≥.【答案】(1)第二种生产方式的效率更高,理由见解析;(2)列联表见解析;(3)有99%的把握认为两种生产方式的效率有差异.【解析】(1)第二种生产方式的效率更高. 理由如下:(i )由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.(2)由茎叶图知7981802m+==.列联表如下:(3)由于2240(151555)10 6.63520202020K⨯-⨯==>⨯⨯⨯,所以有99%的把握认为两种生产方式的效率有差异.9.【2018年高考北京卷文数】电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(2)随机选取1部电影,估计这部电影没有获得好评的概率;(3)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)【答案】(1)0.025;(2)0.814;(3)增加第五类电影的好评率,减少第二类电影的好评率.【解析】(1)由题意知,样本中电影的总部数是140+50+300+200+800+510=2000.第四类电影中获得好评的电影部数是200×0.25=50,故所求概率为500.025 2000=.(2)方法1:由题意知,样本中获得好评的电影部数是140×0.4+50×0.2+300×0.15+200×0.25+800×0.2+510×0.1 =56+10+45+50+160+51=372.故所求概率估计为37210.8142000-=.方法2:设“随机选取1部电影,这部电影没有获得好评”为事件B.没有获得好评的电影共有140×0.6+50×0.8+300×0.85+200×0.75+800×0.8+510×0.9=1628部.由古典概型概率公式得16280.8142)00(P B==.(3)增加第五类电影的好评率,减少第二类电影的好评率.10.【2018年高考天津卷文数】已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(1)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(2)设抽出的7名同学分别用A,B,C,D,E,F,G表示,现从中随机抽取2名同学承担敬老院的卫生工作.(i)试用所给字母列举出所有可能的抽取结果;(ii)设M为事件“抽取的2名同学来自同一年级”,求事件M发生的概率.【答案】(1)分别抽取3人,2人,2人;(2)(i)见解析,(ii)521.【分析】本小题主要考查随机抽样、用列举法计算随机事件所含的基本事件数、古典概型及其概率计算公式等基本知识,考查运用概率知识解决简单实际问题的能力.【解析】(1)由已知,甲、乙、丙三个年级的学生志愿者人数之比为3∶2∶2,由于采用分层抽样的方法从中抽取7名同学,因此应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人.(2)(i)从抽出的7名同学中随机抽取2名同学的所有可能结果为{A,B},{A,C},{A,D},{A,E},{A,F},{A,G},{B,C},{B,D},{B,E},{B,F},{B,G},{C,D},{C,E},{C,F},{C,G},{D,E},{D,F},{D,G},{E,F},{E,G},{F,G},共21种.(ii )由(1),不妨设抽出的7名同学中,来自甲年级的是A ,B ,C ,来自乙年级的是D ,E ,来自丙年级的是F ,G ,则从抽出的7名同学中随机抽取的2名同学来自同一年级的所有可能结果为 {A ,B },{A ,C },{B ,C },{D ,E },{F ,G },共5种. 所以,事件M 发生的概率为P (M )=521. 11.【2017年高考全国Ⅱ卷文数】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg ),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50kg”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较. 附: (22()()()()()n ad bc K a b c d a c b d -=++++.【答案】(1)0.62;(2)列联表见解析,有99%的把握认为箱产量与养殖方法有关;(3)新养殖法优于旧养殖法.【分析】(1)根据频率分布直方图中小长方形面积等于对应概率,计算A 的概率;(2)将数据填入对应表格,代入卡方公式,计算215.705K ≈,对照参考数据可作出判断;(3)先从均值(或中位数)比较大小,越大越好,再从数据分布情况看稳定性,越集中越好,综上可得新养殖法优于旧养殖法. 【解析】(1)旧养殖法的箱产量低于50kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62. 因此,事件A 的概率估计值为0.62. (2)根据箱产量的频率分布直方图得列联表K 2=22006266343815.70510010096104⨯⨯-⨯⨯⨯⨯()≈.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45kg 到50kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.【名师点睛】(1)频率分布直方图中小长方形面积等于对应概率,所有小长方形面积之和为1. (2)频率分布直方图中均值等于组中值与对应概率乘积的和. (3)均值大小代表水平高低,方差大小代表稳定性.12.【2017年高考全国Ⅰ卷文数】为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm ).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得16119.9716i i x x ===∑,0.212s ==≈,18.439≈,161()(8.5) 2.78i i x x i =--=-∑,其中i x 为抽取的第i 个零件的尺寸,1,2,,16i =⋅⋅⋅.(1)求(,)i x i (1,2,,16)i =⋅⋅⋅的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若||0.25r <,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(3,3)x s x s -+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在(3,3)x s x s -+之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(,)i i x y (1,2,,)i n =⋅⋅⋅的相关系数()()niix x y y r --=∑0.09≈.【答案】(1)18.0-≈r ,可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小;(2)(ⅰ)需对当天的生产过程进行检查;(ⅱ)均值与标准差的估计值分别为10.02,0.09.【分析】(1)依公式求r ;(2)(i )由9.7,0.212x s =≈,得抽取的第13个零件的尺寸在(3,3)x s x s -+以外,因此需对当天的生产过程进行检查;(ii )剔除第13个数据,则均值的估计值为10.02,方差为0.09.【解析】(1)由样本数据得(,)(1,2,,16)i x i i =的相关系数为16()(8.5)0.18ix x i r --==≈-∑.由于||0.25r <,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小. (2)(i )由于9.97,0.212x s =≈,由样本数据可以看出抽取的第13个零件的尺寸在(3,3)x s x s -+以外,因此需对当天的生产过程进行检查.(ii )剔除离群值,即第13个数据,剩下数据的平均数为1(169.979.22)10.0215⨯-=, 这条生产线当天生产的零件尺寸的均值的估计值为10.02.162221160.212169.971591.134ii x==⨯+⨯≈∑,剔除第13个数据,剩下数据的样本方差为221(1591.1349.221510.02)0.00815--⨯≈,0.09≈.【名师点睛】解答新颖的数学题时,一是通过转化,化“新”为“旧”;二是通过深入分析,多方联想,以“旧”攻“新”;三是创造性地运用数学思想方法,以“新”制“新”,应特别关注创新题型的切入点和生长点.13.【2017年高考全国Ⅲ卷文数】某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:以最高气温位于各区间的频率估计最高气温位于该区间的概率. (1)估计六月份这种酸奶一天的需求量不超过300瓶的概率;(2)设六月份一天销售这种酸奶的利润为Y (单位:元).当六月份这种酸奶一天的进货量为450瓶时,写出Y 的所有可能值,并估计Y 大于零的概率.【答案】(1)0.6;(2)Y 的所有可能值为900,300,-100,Y 大于零的概率为0.8.【分析】(1)先确定需求量不超过300瓶的天数为2163654++=,再根据古典概型的概率计算公式求概率;(2)先分别求出最高气温不低于25(36天),最高气温位于区间[20,25)(36天),以及最高气温低于20(18天)对应的利润分别为900,300,100-,所以Y 大于零的概率估计为3625740.890+++=.【解析】(1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25,由表格数据知,最高气温低于25的频率为,所以这种酸奶一天的需求量不超过300瓶的概率的估计值为0.6.(2)当这种酸奶一天的进货量为450瓶时,若最高气温不低于25,则Y=6450-4450=900;若最高气温位于区间[20,25),则Y=6300+2(450-300)-4450=300;若最高气温低于20,则Y=6200+2(450-200)-4450=-100.所以,Y的所有可能值为900,300,-100.Y大于零当且仅当最高气温不低于20,由表格数据知,最高气温不低于20的频率为,因此Y大于零的概率的估计值为0.8.【名师点睛】古典概型中基本事件数的探求方法:(1)列举法;(2)树状图法:适合于较为复杂的问题中的基本事件的探求.对于基本事件有“有序”与“无序”区别的题目,常采用树状图法;(3)列表法:适用于多元素基本事件的求解问题,通过列表把复杂的题目简单化、抽象的题目具体化.14.【2017年高考北京卷文数】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30],[30,40],,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【答案】(1)0.4;(2)20;(3):32.【分析】(1)根据频率分布直方图,表示分数大于等于70的概率,就求最后两个矩形的面积;(2)根据公式:频数=总数⨯频率进行求解;(3)首先计算分数大于等于70的总人数,根据样本中分数不小于70的男女生人数相等再计算所有的男生人数,100−男生人数就是女生人数.【解析】(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.020.04)100.6+⨯=, 所以样本中分数小于70的频率为10.60.4-=.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.010.020.040.02)100.9+++⨯=, 分数在区间[40,50)内的人数为1001000.955-⨯-=. 所以总体中分数在区间[40,50)内的人数估计为540020100⨯=. (3)由题意可知,样本中分数不小于70的学生人数为(0.020.04)1010060+⨯⨯=, 所以样本中分数不小于70的男生人数为160302⨯=. 所以样本中的男生人数为30260⨯=,女生人数为1006040-=, 男生和女生人数的比例为::604032=.所以根据分层抽样原理,总体中男生和女生人数的比例估计为:32.【名师点睛】(1)用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,而直方图比较直观.(2)频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.。

三年(2017-2019)高考真题数学(文)分项汇编:专题15 概率与统计(解答题)(含解析)

三年(2017-2019)高考真题数学(文)分项汇编:专题15 概率与统计(解答题)(含解析)

专题15 概率与统计(解答题)1.【2019年高考全国Ⅰ卷文数】某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客40 10女顾客30 20(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.P(K2≥k)0.050 0.010 0.001k 3.841 6.635 10.828【答案】(1)男、女顾客对该商场服务满意的概率的估计值分别为0.8,0.6;(2)有95%的把握认为男、女顾客对该商场服务的评价有差异.【解析】(1)由调查数据,男顾客中对该商场服务满意的比率为400.8 50=,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为300.6 50=,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)由题可得22100(40203010)4.76250507030K⨯⨯-⨯=≈⨯⨯⨯.由于4.762 3.841>,故有95%的把握认为男、女顾客对该商场服务的评价有差异.2.【2019年高考全国Ⅱ卷文数】某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)8.602≈.【答案】(1)产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%;(2)这类企业产值增长率的平均数与标准差的估计值分别为30%,17%. 【解析】(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为1470.21100+=. 产值负增长的企业频率为20.02100=. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%. (2)1(0.1020.10240.30530.50140.707)0.30100y =-⨯+⨯+⨯+⨯+⨯=, ()52211100i ii s n y y ==-∑ 222221(0.40)2(0.20)240530.20140.407100⎡⎤=-⨯+-⨯+⨯+⨯+⨯⎣⎦ =0.0296,0.02740.17s ==≈,所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.3.【2019年高考全国Ⅲ卷文数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P (C )的估计值为0.70. (1)求乙离子残留百分比直方图中a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表). 【答案】(1)0.35a =,0.10b =;(2)甲、乙离子残留百分比的平均值的估计值分别为4.05,6.00. 【解析】(1)由已知得0.700.200.15a =++,故0.35a =.10.050.150.700.10b =---=.(2)甲离子残留百分比的平均值的估计值为20.1530.2040.3050.2060.1070.05 4.05⨯+⨯+⨯+⨯+⨯+⨯=.乙离子残留百分比的平均值的估计值为30.0540.1050.1560.3570.2080.15 6.00⨯+⨯+⨯+⨯+⨯+⨯=.4.【2019年高考天津卷文数】2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况. (1)应从老、中、青员工中分别抽取多少人?(2)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为, , , , , A B C D E F .享受情况如下表,其中“○”表示享受,“×”表示不享受.现从这6人中随机抽取2人接受采访.员工项目 ABCDEF子女教育 ○ ○ × ○ × ○ 继续教育 × × ○ × ○ ○ 大病医疗 × × × ○ × × 住房贷款利息 ○ ○ × × ○ ○ 住房租金 × × ○ × × × 赡养老人○○×××○(i )试用所给字母列举出所有可能的抽取结果;(ii )设M 为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件M 发生的概率. 【答案】(1)应从老、中、青员工中分别抽取6人,9人,10人;(2)(i )见解析,(ii )1115. 【分析】本题主要考查随机抽样、用列举法计算随机事件所含的基本事件数、古典概型及其概率计算公式等基本知识,考查运用概率知识解决简单实际问题的能力.【解析】(1)由已知,老、中、青员工人数之比为6 : 9 : 10, 由于采用分层抽样的方法从中抽取25位员工,因此应从老、中、青员工中分别抽取6人,9人,10人.(2)(i )从已知的6人中随机抽取2人的所有可能结果为{, },{, },{, },{, },{, },{, },A B A C A D A E A F B C {, },{, },{, },{, {,}},,B D B E B F C D C E {,},C F {,},{,},{,}D E D F E F ,共15种.(ii )由表格知,符合题意的所有可能结果为{, },{, },{, },{, },{, },{, },{, {,},{,},{,},{,},}A B A D A E A F B D B C E B F E C F D F E F ,共11种.所以,事件M 发生的概率11()15P M =. 5.【2019年高考北京卷文数】改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校所有的1000名学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:支付金额支付方式不大于2 000元大于2 000元仅使用A 27人 3人 仅使用B24人 1人(1)估计该校学生中上个月A ,B 两种支付方式都使用的人数;(2)从样本仅使用B 的学生中随机抽取1人,求该学生上个月支付金额大于2 000元的概率;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用B 的学生中随机抽查1人,发现他本月的支付金额大于2 000元.结合(2)的结果,能否认为样本仅使用B 的学生中本月支付金额大于2 000元的人数有变化?说明理由.【答案】(1)该校学生中上个月A ,B 两种支付方式都使用的人数约为400;(2)0.04;(3)见解析. 【解析】(1)由题知,样本中仅使用A 的学生有27+3=30人, 仅使用B 的学生有24+1=25人,A ,B 两种支付方式都不使用的学生有5人.故样本中A ,B 两种支付方式都使用的学生有100–30–25–5=40人. 估计该校学生中上个月A ,B 两种支付方式都使用的人数为401000400100⨯=. (2)记事件C 为“从样本仅使用B 的学生中随机抽取1人,该学生上个月的支付金额大于2 000元”, 则1()0.0425P C ==. (3)记事件E 为“从样本仅使用B 的学生中随机抽查1人,该学生本月的支付金额大于2 000元”.假设样本仅使用B 的学生中,本月支付金额大于2 000元的人数没有变化, 则由(2)知,4(0)0.P E =.答案示例1:可以认为有变化.理由如下:()P E 比较小,概率比较小的事件一般不容易发生,一旦发生,就有理由认为本月支付金额大于2 000元的人数发生了变化, 所以可以认为有变化.答案示例2:无法确定有没有变化.理由如下:事件E 是随机事件,()P E 比较小,一般不容易发生,但还是有可能发生的, 所以无法确定有没有变化.6.【2018年高考全国Ⅱ卷文数】下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,,17)建立模型①:ˆ30.413.5yt =-+;根据2010年至2016年的数据(时间变量t 的值依次为1,2,,7)建立模型②:ˆ9917.5yt =+. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.【答案】(1)模型①:226.1亿元,模型②:256.5亿元;(2)模型②得到的预测值更可靠,理由见解析. 【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为 y $=–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为 y $=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y$=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.7.【2018年高考全国Ⅰ卷文数】某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)47.45m.【答案】(1)见解析;(2)0.48;(3)3【解析】(1)频率分布直方图如下:(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m 3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为11(0.0510.1530.2520.3540.4590.55260.655)0.4850x =⨯+⨯+⨯+⨯+⨯+⨯+⨯=. 该家庭使用了节水龙头后50天日用水量的平均数为21(0.0510.1550.25130.35100.45160.555)0.3550x =⨯+⨯+⨯+⨯+⨯+⨯=. 估计使用节水龙头后,一年可节省水3(0.480.35)36547.45(m )-⨯=.8.【2018年高考全国Ⅲ卷文数】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min )绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:超过m不超过m第一种生产方式 第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++,2()0.0500.0100.0013.8416.63510.828P K k k ≥.【答案】(1)第二种生产方式的效率更高,理由见解析;(2)列联表见解析;(3)有99%的把握认为两种生产方式的效率有差异.【解析】(1)第二种生产方式的效率更高. 理由如下:(i )由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高. (ii )由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.(2)由茎叶图知7981802m+==.列联表如下:超过m不超过m第一种生产方式15 5第二种生产方式 5 15(3)由于2240(151555)10 6.63520202020K⨯-⨯==>⨯⨯⨯,所以有99%的把握认为两种生产方式的效率有差异.9.【2018年高考北京卷文数】电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(2)随机选取1部电影,估计这部电影没有获得好评的概率;(3)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)【答案】(1)0.025;(2)0.814;(3)增加第五类电影的好评率,减少第二类电影的好评率.【解析】(1)由题意知,样本中电影的总部数是140+50+300+200+800+510=2000.第四类电影中获得好评的电影部数是200×0.25=50,故所求概率为500.025 2000=.(2)方法1:由题意知,样本中获得好评的电影部数是140×0.4+50×0.2+300×0.15+200×0.25+800×0.2+510×0.1=56+10+45+50+160+51 =372.故所求概率估计为37210.8142000-=.方法2:设“随机选取1部电影,这部电影没有获得好评”为事件B.没有获得好评的电影共有140×0.6+50×0.8+300×0.85+200×0.75+800×0.8+510×0.9=1628部.由古典概型概率公式得16280.8142)00(P B==.(3)增加第五类电影的好评率,减少第二类电影的好评率.10.【2018年高考天津卷文数】已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(1)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(2)设抽出的7名同学分别用A,B,C,D,E,F,G表示,现从中随机抽取2名同学承担敬老院的卫生工作.(i)试用所给字母列举出所有可能的抽取结果;(ii)设M为事件“抽取的2名同学来自同一年级”,求事件M发生的概率.【答案】(1)分别抽取3人,2人,2人;(2)(i)见解析,(ii)521.【分析】本小题主要考查随机抽样、用列举法计算随机事件所含的基本事件数、古典概型及其概率计算公式等基本知识,考查运用概率知识解决简单实际问题的能力.【解析】(1)由已知,甲、乙、丙三个年级的学生志愿者人数之比为3∶2∶2,由于采用分层抽样的方法从中抽取7名同学,因此应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人.(2)(i)从抽出的7名同学中随机抽取2名同学的所有可能结果为{A,B},{A,C},{A,D},{A,E},{A,F},{A,G},{B,C},{B,D},{B,E},{B,F},{B,G},{C,D},{C,E},{C,F},{C,G},{D,E},{D,F},{D,G},{E,F},{E,G},{F,G},共21种.(ii)由(1),不妨设抽出的7名同学中,来自甲年级的是A,B,C,来自乙年级的是D,E,来自丙年级的是F,G,则从抽出的7名同学中随机抽取的2名同学来自同一年级的所有可能结果为{A,B},{A,C},{B,C},{D,E},{F,G},共5种.所以,事件M发生的概率为P(M)=521.11.【2017年高考全国Ⅱ卷文数】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50 kg”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50 kg箱产量≥50 kg旧养殖法 新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较. 附:22()()()()()n ad bc K a b c d a c b d -=++++.【答案】(1)0.62;(2)列联表见解析,有99%的把握认为箱产量与养殖方法有关;(3)新养殖法优于旧养殖法. 【分析】(1)根据频率分布直方图中小长方形面积等于对应概率,计算A 的概率;(2)将数据填入对应表格,代入卡方公式,计算215.705K ≈,对照参考数据可作出判断;(3)先从均值(或中位数)比较大小,越大越好,再从数据分布情况看稳定性,越集中越好,综上可得新养殖法优于旧养殖法.【解析】(1)旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62. 因此,事件A 的概率估计值为0.62. (2)根据箱产量的频率分布直方图得列联表箱产量<50 kg箱产量≥50 kg旧养殖法 62 38 新养殖法3466K 2=22006266343815.70510010096104⨯⨯-⨯⨯⨯⨯()≈.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法. 【名师点睛】(1)频率分布直方图中小长方形面积等于对应概率,所有小长方形面积之和为1. (2)频率分布直方图中均值等于组中值与对应概率乘积的和. (3)均值大小代表水平高低,方差大小代表稳定性.12.【2017年高考全国Ⅰ卷文数】为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm ).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得16119.9716i i x x ===∑,16162221111()(16)0.2121616i ii i s x x x x ===-=-≈∑∑18.439≈,161()(8.5) 2.78ii x x i =--=-∑,其中ix 为抽取的第i 个零件的尺寸,1,2,,16i =⋅⋅⋅.(1)求(,)i x i (1,2,,16)i =⋅⋅⋅的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若||0.25r <,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小). (2)一天内抽检零件中,如果出现了尺寸在(3,3)x s x s -+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在(3,3)x s x s -+之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(,)i i x y (1,2,,)i n =⋅⋅⋅的相关系数()()niix x y y r --=∑0.0080.09≈.【答案】(1)18.0-≈r ,可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小;(2)(ⅰ)需对当天的生产过程进行检查;(ⅱ)均值与标准差的估计值分别为10.02,0.09.【分析】(1)依公式求r ;(2)(i )由9.97,0.212x s =≈,得抽取的第13个零件的尺寸在(3,3)x s x s -+以外,因此需对当天的生产过程进行检查;(ii )剔除第13个数据,则均值的估计值为10.02,方差为0.09. 【解析】(1)由样本数据得(,)(1,2,,16)i x i i =的相关系数为16()(8.5)0.180.2121618.439ix x i r --==≈-⨯⨯∑.由于||0.25r <,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小. (2)(i )由于9.97,0.212x s =≈,由样本数据可以看出抽取的第13个零件的尺寸在(3,3)x s x s -+以外, 因此需对当天的生产过程进行检查.(ii )剔除离群值,即第13个数据,剩下数据的平均数为1(169.979.22)10.0215⨯-=, 这条生产线当天生产的零件尺寸的均值的估计值为10.02.162221160.212169.971591.134ii x==⨯+⨯≈∑,剔除第13个数据,剩下数据的样本方差为221(1591.1349.221510.02)0.00815--⨯≈, 0.0080.09≈.【名师点睛】解答新颖的数学题时,一是通过转化,化“新”为“旧”;二是通过深入分析,多方联想,以“旧”攻“新”;三是创造性地运用数学思想方法,以“新”制“新”,应特别关注创新题型的切入点和生长点. 13.【2017年高考全国Ⅲ卷文数】某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:以最高气温位于各区间的频率估计最高气温位于该区间的概率.(1)估计六月份这种酸奶一天的需求量不超过300瓶的概率;(2)设六月份一天销售这种酸奶的利润为Y (单位:元).当六月份这种酸奶一天的进货量为450瓶时,写出Y 的所有可能值,并估计Y 大于零的概率.【答案】(1)0.6;(2)Y 的所有可能值为900,300,-100,Y 大于零的概率为0.8.【分析】(1)先确定需求量不超过300瓶的天数为2163654++=,再根据古典概型的概率计算公式求概率;(2)先分别求出最高气温不低于25(36天),最高气温位于区间[20,25)(36天),以及最高气温低于20(18天)对应的利润分别为900,300,100-,所以Y 大于零的概率估计为3625740.890+++=.【解析】(1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25, 由表格数据知,最高气温低于25的频率为,所以这种酸奶一天的需求量不超过300瓶的概率的估计值为0.6. (2)当这种酸奶一天的进货量为450瓶时, 若最高气温不低于25,则Y =6 450-4 450=900;若最高气温位于区间[20,25),则Y =6 300+2(450-300)-4 450=300; 若最高气温低于20,则Y =6 200+2(450-200)-4 450=-100. 所以,Y 的所有可能值为900,300,-100. Y 大于零当且仅当最高气温不低于20, 由表格数据知,最高气温不低于20的频率为,因此Y 大于零的概率的估计值为0.8.【名师点睛】古典概型中基本事件数的探求方法: (1)列举法;(2)树状图法:适合于较为复杂的问题中的基本事件的探求.对于基本事件有“有序”与“无序”区别的题目,常采用树状图法;(3)列表法:适用于多元素基本事件的求解问题,通过列表把复杂的题目简单化、抽象的题目具体化. 14.【2017年高考北京卷文数】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30],[30,40],,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【答案】(1)0.4;(2)20;(3):32.【分析】(1)根据频率分布直方图,表示分数大于等于70的概率,就求最后两个矩形的面积;(2)根据公式:频数=总数⨯频率进行求解;(3)首先计算分数大于等于70的总人数,根据样本中分数不小于70的男女生人数相等再计算所有的男生人数,100−男生人数就是女生人数.【解析】(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.020.04)100.6+⨯=, 所以样本中分数小于70的频率为10.60.4-=.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.010.020.040.02)100.9+++⨯=, 分数在区间[40,50)内的人数为1001000.955-⨯-=. 所以总体中分数在区间[40,50)内的人数估计为540020100⨯=. (3)由题意可知,样本中分数不小于70的学生人数为(0.020.04)1010060+⨯⨯=, 所以样本中分数不小于70的男生人数为160302⨯=. 所以样本中的男生人数为30260⨯=,女生人数为1006040-=, 男生和女生人数的比例为::604032=.所以根据分层抽样原理,总体中男生和女生人数的比例估计为:32.【名师点睛】(1)用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,而直方图比较直观.(2)频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

专题15 概率与统计1.【2019年高考全国Ⅰ卷文数】某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.2.【2019年高考全国Ⅱ卷文数】某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)8.602≈.3.【2019年高考全国Ⅲ卷文数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).4.【2019年高考天津卷文数】2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况.(1)应从老、中、青员工中分别抽取多少人?A B C D E F.享受(2)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为,,,,,情况如下表,其中“○”表示享受,“×”表示不享受.现从这6人中随机抽取2人接受采访.员工A B C D E F项目子女教育○○×○×○继续教育××○×○○大病医疗×××○××住房贷款利息○○××○○住房租金××○×××赡养老人○○×××○(i)试用所给字母列举出所有可能的抽取结果;(ii)设M为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件M发生的概率.5.【2019年高考北京卷文数】改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校所有的1000名学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:支付金额支付方式不大于2 000元大于2 000元仅使用A 27人3人仅使用B 24人1人(1)估计该校学生中上个月A,B两种支付方式都使用的人数;(2)从样本仅使用B的学生中随机抽取1人,求该学生上个月支付金额大于2 000元的概率;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用B的学生中随机抽查1人,发现他本月的支付金额大于2 000元.结合(2)的结果,能否认为样本仅使用B的学生中本月支付金额大于2 000元的人数有变化?说明理由.6.【2018年高考全国Ⅱ卷文数】下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,,17L)建立模型①:ˆ30.413.5y t=-+;根据2010年至2016年的数据(时间变量t的值依次为1,2,,7L)建立模型②:ˆ9917.5y t=+.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.7.【2018年高考全国Ⅰ卷文数】某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[)00.1,[)0.10.2,[)0.20.3,[)0.30.4,[)0.40.5,[)0.50.6,[)0.60.7,频数 1 3 2 4 9 26 5使用了节水龙头50天的日用水量频数分布表日用水量 [)00.1,[)0.10.2,[)0.20.3,[)0.30.4,[)0.40.5,[)0.50.6,频数151310165(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m 3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)8.【2018年高考全国Ⅲ卷文数】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min )绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++,2()0.0500.0100.0013.8416.63510.828P K kk≥.9.【2018年高考北京卷文数】电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(2)随机选取1部电影,估计这部电影没有获得好评的概率;(3)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)10.【2018年高考天津卷文数】已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(1)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(2)设抽出的7名同学分别用A,B,C,D,E,F,G表示,现从中随机抽取2名同学承担敬老院的卫生工作.(i)试用所给字母列举出所有可能的抽取结果;(ii)设M为事件“抽取的2名同学来自同一年级”,求事件M发生的概率.11.【2017年高考全国Ⅱ卷文数】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50 kg”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50 kg箱产量≥50 kg旧养殖法 新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较. 附: P () 0.050 0.010 0.001k3.841 6.635 10.82822()()()()()n ad bc K a b c d a c b d -=++++.12.【2017年高考全国Ⅰ卷文数】为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm ).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序 1 2 3 4 5 6 7 8 零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 抽取次序 9 10 11 12 13 14 15 16 零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得16119.9716i i x x ===∑,16162221111()(16)0.2121616i i i i s x x x x ===-=-≈∑∑,18.439≈,161()(8.5) 2.78i i x x i =--=-∑,其中i x 为抽取的第i 个零件的尺寸,1,2,,16i =⋅⋅⋅.(1)求(,)i x i (1,2,,16)i =⋅⋅⋅的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若||0.25r <,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(3,3)x s x s -+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在(3,3)x s x s -+之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(,)i i x y (1,2,,)i n =⋅⋅⋅的相关系数()()niix x y y r --=∑0.09≈.13.【2017年高考全国Ⅲ卷文数】某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:以最高气温位于各区间的频率估计最高气温位于该区间的概率. (1)估计六月份这种酸奶一天的需求量不超过300瓶的概率;(2)设六月份一天销售这种酸奶的利润为Y (单位:元).当六月份这种酸奶一天的进货量为450瓶时,写出Y 的所有可能值,并估计Y 大于零的概率.14.【2017年高考北京卷文数】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30],[30,40],L ,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.1.【答案】(1)男、女顾客对该商场服务满意的概率的估计值分别为0.8,0.6;(2)有95%的把握认为男、女顾客对该商场服务的评价有差异.【解析】(1)由调查数据,男顾客中对该商场服务满意的比率为400.850=, 因此男顾客对该商场服务满意的概率的估计值为0.8. 女顾客中对该商场服务满意的比率为300.650=, 因此女顾客对该商场服务满意的概率的估计值为0.6.(2)由题可得22100(40203010) 4.76250507030K ⨯⨯-⨯=≈⨯⨯⨯.由于4.762 3.841>,故有95%的把握认为男、女顾客对该商场服务的评价有差异.2.【答案】(1)产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%;(2)这类企业产值增长率的平均数与标准差的估计值分别为30%,17%. 【解析】(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为1470.21100+=. 产值负增长的企业频率为20.02100=. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%. (2)1(0.1020.10240.30530.50140.707)0.30100y =-⨯+⨯+⨯+⨯+⨯=, ()52211100i ii s n y y ==-∑ 222221(0.40)2(0.20)240530.20140.407100⎡⎤=-⨯+-⨯+⨯+⨯+⨯⎣⎦ =0.0296,0.020.17s ==≈,所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.3.【答案】(1)0.35a =,0.10b =;(2)甲、乙离子残留百分比的平均值的估计值分别为4.05,6.00. 【解析】(1)由已知得0.700.200.15a =++,故0.35a =.10.050.150.700.10b =---=.(2)甲离子残留百分比的平均值的估计值为20.1530.2040.3050.2060.1070.05 4.05⨯+⨯+⨯+⨯+⨯+⨯=.乙离子残留百分比的平均值的估计值为30.0540.1050.1560.3570.2080.15 6.00⨯+⨯+⨯+⨯+⨯+⨯=.4.【答案】(1)应从老、中、青员工中分别抽取6人,9人,10人;(2)(i )见解析,(ii )1115. 【分析】本题主要考查随机抽样、用列举法计算随机事件所含的基本事件数、古典概型及其概率计算公式等基本知识,考查运用概率知识解决简单实际问题的能力. 【解析】(1)由已知,老、中、青员工人数之比为6 : 9 : 10, 由于采用分层抽样的方法从中抽取25位员工,因此应从老、中、青员工中分别抽取6人,9人,10人. (2)(i )从已知的6人中随机抽取2人的所有可能结果为{, },{, },{, },{, },{, },{, },A B A C A D A E A F B C {, },{, },{, },{, {,}},,B D B E B F C D C E {,},C F {,},{,},{,}DE DF E F ,共15种.(ii )由表格知,符合题意的所有可能结果为{, },{, },{, },{, },{, },{, },{, {,},{,},{,},{,},}A B A D A E A F B D B C E B F E C F D F E F ,共11种.所以,事件M 发生的概率11()15P M =. 5.【答案】(1)该校学生中上个月A ,B 两种支付方式都使用的人数约为400;(2)0.04;(3)见解析. 【解析】(1)由题知,样本中仅使用A 的学生有27+3=30人, 仅使用B 的学生有24+1=25人,A ,B 两种支付方式都不使用的学生有5人.故样本中A ,B 两种支付方式都使用的学生有100–30–25–5=40人. 估计该校学生中上个月A ,B 两种支付方式都使用的人数为401000400100⨯=. (2)记事件C 为“从样本仅使用B 的学生中随机抽取1人,该学生上个月的支付金额大于2 000元”, 则1()0.0425P C ==. (3)记事件E 为“从样本仅使用B 的学生中随机抽查1人,该学生本月的支付金额大于2 000元”. 假设样本仅使用B 的学生中,本月支付金额大于2 000元的人数没有变化, 则由(2)知,4(0)0.P E =.答案示例1:可以认为有变化.理由如下:P E比较小,概率比较小的事件一般不容易发生,()一旦发生,就有理由认为本月支付金额大于2 000元的人数发生了变化,所以可以认为有变化.答案示例2:无法确定有没有变化.理由如下:P E比较小,一般不容易发生,但还是有可能发生的,事件E是随机事件,()所以无法确定有没有变化.6.【答案】(1)模型①:226.1亿元,模型②:256.5亿元;(2)模型②得到的预测值更可靠,理由见解析.【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y$=–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为y$=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y$=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.7.【答案】(1)见解析;(2)0.48;(3)347.45m.【解析】(1)频率分布直方图如下:(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m 3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m 3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为11(0.0510.1530.2520.3540.4590.55260.655)0.4850x =⨯+⨯+⨯+⨯+⨯+⨯+⨯=. 该家庭使用了节水龙头后50天日用水量的平均数为 21(0.0510.1550.25130.35100.45160.555)0.3550x =⨯+⨯+⨯+⨯+⨯+⨯=. 估计使用节水龙头后,一年可节省水3(0.480.35)36547.45(m )-⨯=.8.【答案】(1)第二种生产方式的效率更高,理由见解析;(2)列联表见解析;(3)有99%的把握认为两种生产方式的效率有差异.【解析】(1)第二种生产方式的效率更高.理由如下:(i )由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii )由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.(2)由茎叶图知7981802m+==.列联表如下:(3)由于2240(151555)10 6.63520202020K⨯-⨯==>⨯⨯⨯,所以有99%的把握认为两种生产方式的效率有差异.9.【答案】(1)0.025;(2)0.814;(3)增加第五类电影的好评率,减少第二类电影的好评率.【解析】(1)由题意知,样本中电影的总部数是140+50+300+200+800+510=2000.第四类电影中获得好评的电影部数是200×0.25=50,故所求概率为500.025 2000=.(2)方法1:由题意知,样本中获得好评的电影部数是140×0.4+50×0.2+300×0.15+200×0.25+800×0.2+510×0.1 =56+10+45+50+160+51=372.故所求概率估计为37210.8142000-=.方法2:设“随机选取1部电影,这部电影没有获得好评”为事件B.没有获得好评的电影共有140×0.6+50×0.8+300×0.85+200×0.75+800×0.8+510×0.9=1628部.由古典概型概率公式得16280.8142)00(P B==.(3)增加第五类电影的好评率,减少第二类电影的好评率.10.【答案】(1)分别抽取3人,2人,2人;(2)(i)见解析,(ii)521.【分析】本小题主要考查随机抽样、用列举法计算随机事件所含的基本事件数、古典概型及其概率计算公式等基本知识,考查运用概率知识解决简单实际问题的能力.【解析】(1)由已知,甲、乙、丙三个年级的学生志愿者人数之比为3∶2∶2,由于采用分层抽样的方法从中抽取7名同学,因此应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人.(2)(i)从抽出的7名同学中随机抽取2名同学的所有可能结果为{A,B},{A,C},{A,D},{A,E},{A,F},{A,G},{B,C},{B,D},{B,E},{B,F},{B,G},{C,D},{C,E},{C,F},{C,G},{D,E},{D,F},{D,G},{E,F},{E,G},{F,G},共21种.(ii)由(1),不妨设抽出的7名同学中,来自甲年级的是A,B,C,来自乙年级的是D,E,来自丙年级的是F,G,则从抽出的7名同学中随机抽取的2名同学来自同一年级的所有可能结果为{A,B},{A,C},{B,C},{D,E},{F,G},共5种.所以,事件M发生的概率为P(M)=521.11.【答案】(1)0.62;(2)列联表见解析,有99%的把握认为箱产量与养殖方法有关;(3)新养殖法优于旧养殖法.【分析】(1)根据频率分布直方图中小长方形面积等于对应概率,计算A的概率;(2)将数据填入对应表格,代入卡方公式,计算215.705K≈,对照参考数据可作出判断;(3)先从均值(或中位数)比较大小,越大越好,再从数据分布情况看稳定性,越集中越好,综上可得新养殖法优于旧养殖法.【解析】(1)旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.因此,事件A的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表K2=2 2006266343815.705 10010096104⨯⨯-⨯⨯⨯⨯()≈.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.【名师点睛】(1)频率分布直方图中小长方形面积等于对应概率,所有小长方形面积之和为1. (2)频率分布直方图中均值等于组中值与对应概率乘积的和.(3)均值大小代表水平高低,方差大小代表稳定性.12.【答案】(1)18.0-≈r ,可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小;(2)(ⅰ)需对当天的生产过程进行检查;(ⅱ)均值与标准差的估计值分别为10.02,0.09.【分析】(1)依公式求r ;(2)(i )由9.97,0.212x s =≈,得抽取的第13个零件的尺寸在(3,3)x s x s -+以外,因此需对当天的生产过程进行检查;(ii )剔除第13个数据,则均值的估计值为10.02,方差为0.09.【解析】(1)由样本数据得(,)(1,2,,16)i x i i =L 的相关系数为16()(8.5)0.18ix x i r --==≈-∑. 由于||0.25r <,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小. (2)(i )由于9.97,0.212x s =≈,由样本数据可以看出抽取的第13个零件的尺寸在(3,3)x s x s -+以外,因此需对当天的生产过程进行检查.(ii )剔除离群值,即第13个数据,剩下数据的平均数为1(169.979.22)10.0215⨯-=, 这条生产线当天生产的零件尺寸的均值的估计值为10.02.162221160.212169.971591.134i i x==⨯+⨯≈∑,剔除第13个数据,剩下数据的样本方差为221(1591.1349.221510.02)0.00815--⨯≈,0.09≈.【名师点睛】解答新颖的数学题时,一是通过转化,化“新”为“旧”;二是通过深入分析,多方联想,以“旧”攻“新”;三是创造性地运用数学思想方法,以“新”制“新”,应特别关注创新题型的切入点和生长点.13.【答案】(1)0.6;(2)Y 的所有可能值为900,300,-100,Y 大于零的概率为0.8.【分析】(1)先确定需求量不超过300瓶的天数为2163654++=,再根据古典概型的概率计算公式求概率;(2)先分别求出最高气温不低于25(36天),最高气温位于区间[20,25)(36天),以及最高气温低于20(18天)对应的利润分别为900,300,100-,所以Y 大于零的概率估计为3625740.890+++=. 【解析】(1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25, 由表格数据知,最高气温低于25的频率为,所以这种酸奶一天的需求量不超过300瓶的概率的估计值为0.6.(2)当这种酸奶一天的进货量为450瓶时,若最高气温不低于25,则Y =6450-4450=900;若最高气温位于区间[20,25),则Y =6300+2(450-300)-4450=300;若最高气温低于20,则Y =6200+2(450-200)-4450=-100.所以,Y 的所有可能值为900,300,-100.Y 大于零当且仅当最高气温不低于20,由表格数据知,最高气温不低于20的频率为,因此Y 大于零的概率的估计值为0.8.【名师点睛】古典概型中基本事件数的探求方法:(1)列举法;(2)树状图法:适合于较为复杂的问题中的基本事件的探求.对于基本事件有“有序”与“无序”区别的题目,常采用树状图法;(3)列表法:适用于多元素基本事件的求解问题,通过列表把复杂的题目简单化、抽象的题目具体化.14.【答案】(1)0.4;(2)20;(3):32.【分析】(1)根据频率分布直方图,表示分数大于等于70的概率,就求最后两个矩形的面积;(2)根据公式:频数=总数⨯频率进行求解;(3)首先计算分数大于等于70的总人数,根据样本中分数不小于70的男女生人数相等再计算所有的男生人数,100−男生人数就是女生人数.【解析】(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.020.04)100.6+⨯=, 所以样本中分数小于70的频率为10.60.4-=.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.010.020.040.02)100.9+++⨯=,分数在区间[40,50)内的人数为1001000.955-⨯-=.所以总体中分数在区间[40,50)内的人数估计为540020100⨯=. (3)由题意可知,样本中分数不小于70的学生人数为(0.020.04)1010060+⨯⨯=,所以样本中分数不小于70的男生人数为160302⨯=. 所以样本中的男生人数为30260⨯=,女生人数为1006040-=,男生和女生人数的比例为::604032=.所以根据分层抽样原理,总体中男生和女生人数的比例估计为:32.【名师点睛】(1)用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,而直方图比较直观.(2)频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.。

相关文档
最新文档