-2019三年高考数学(文科)分类汇编专题15概率与统计(解答题)


2017-2019三年高考数学(文科)分类汇编
专题15概率与统计
(解答题)
-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN
专题15 概率与统计(解答题)
1.【2019年高考全国Ⅰ卷文数】某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?
附:
2
2
()
()()()()
n ad bc
K
a b c d a c b d
-
=
++++
.
【答案】(1)男、女顾客对该商场服务满意的概率的估计值分别为0.8,0.6;(2)有95%的把握认为男、女顾客对该商场服务的评价有差异.
【解析】(1)由调查数据,男顾客中对该商场服务满意的比率为40
0.8 50
=,
因此男顾客对该商场服务满意的概率的估计值为0.8.
女顾客中对该商场服务满意的比率为30
0.6 50
=,
因此女顾客对该商场服务满意的概率的估计值为0.6.
(2)由题可得
2
2
100(40203010)
4.762
50507030
K
??-?
=≈
???
.
由于4.762 3.841
>,
故有95%的把握认为男、女顾客对该商场服务的评价有差异.
2.【2019年高考全国Ⅱ卷文数】某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例; (2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01) 8.602≈.
【答案】(1)产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%;(2)这类企业产值增长率的平均数与标准差的估计值分别为30%,17%. 【解析】(1)根据产值增长率频数分布表得,
所调查的100个企业中产值增长率不低于40%的企业频率为147
0.21100
+=. 产值负增长的企业频率为
2
0.02100
=. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%. (2)1
(0.1020.10240.30530.50140.70
7)0.30100
y =
-
?+?+?+?+?=, ()52
2
1
1100i i
i s n y y ==-∑ 22222
1(0.40)2(0.20)240530.20140.407100??=
-?+-?+?+?+??
? =0.0296,
0.020.17s ==≈,
所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.
3.【2019年高考全国Ⅲ卷文数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间
后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
【答案】(1)0.35
a=,0.10
b=;(2)甲、乙离子残留百分比的平均值的估计值分别为
4.05,6.00.
【解析】(1)由已知得0.700.200.15
a
a=.
=++,故0.35
b=---=.
10.050.150.700.10
(2)甲离子残留百分比的平均值的估计值为
?+?+?+?+?+?=.
20.1530.2040.3050.2060.1070.05 4.05
乙离子残留百分比的平均值的估计值为
?+?+?+?+?+?=.
30.0540.1050.1560.3570.2080.15 6.00
4.【2019年高考天津卷文数】2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣
除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况.
(1)应从老、中、青员工中分别抽取多少人?
(2)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为
,,,,,
A B C D E F.享受情况如下表,其中“○”表示享受,“×”表示不享受.现从这6人中随机抽取2人接受采访.
(i)试用所给字母列举出所有可能的抽取结果;
(ii)设M为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件M发生的概率.
【答案】(1)应从老、中、青员工中分别抽取6人,9人,10人;(2)(i)见解析,
(ii)11 15
.
【分析】本题主要考查随机抽样、用列举法计算随机事件所含的基本事件数、古典概型及其概率计算公式等基本知识,考查运用概率知识解决简单实际问题的能力.
【解析】(1)由已知,老、中、青员工人数之比为6 : 9 : 10,
由于采用分层抽样的方法从中抽取25位员工,
因此应从老、中、青员工中分别抽取6人,9人,10人.
(2)(i )从已知的6人中随机抽取2人的所有可能结果为
{, },{, },{, },{, },{, },{, },A B A C A D A E A F B C {, },{, },{, },{, {,}},,B D B E B F C D C E {,},C F {,},{,},{,}D E D F E F ,共15种.
(ii )由表格知,符合题意的所有可能结果为
{, },{, },{, },{, },{, },{, },{, {,},{,},{,},{,},}A B A D A E A F B D B C E B F E C F D F E F ,共11种.
所以,事件M 发生的概率11()15
P M
. 5.【2019年高考北京卷文数】改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校所有的1000名学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:
(1)估计该校学生中上个月A ,B 两种支付方式都使用的人数;
(2)从样本仅使用B 的学生中随机抽取1人,求该学生上个月支付金额大于2 000元的概率;
(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用B 的学生中随机抽查1人,发现他本月的支付金额大于2 000元.结合(2)的结果,能否认为样本仅使用B 的学生中本月支付金额大于2 000元的人数有变化?说明理由.
【答案】(1)该校学生中上个月A ,B 两种支付方式都使用的人数约为400;(2)
0.04;(3)见解析.
【解析】(1)由题知,样本中仅使用A 的学生有27+3=30人,
仅使用B 的学生有24+1=25人,
A ,
B 两种支付方式都不使用的学生有5人.
故样本中A ,B 两种支付方式都使用的学生有100–30–25–5=40人. 估计该校学生中上个月A ,B 两种支付方式都使用的人数为
40
1000400100
?=. (2)记事件C 为“从样本仅使用B 的学生中随机抽取1人,该学生上个月的支付金额大于2 000元”, 则1
()0.0425
P C =
=. (3)记事件E 为“从样本仅使用B 的学生中随机抽查1人,该学生本月的支付金额大于2 000元”.
假设样本仅使用B 的学生中,本月支付金额大于2 000元的人数没有变化, 则由(2)知,4(0)0.P E =.
答案示例1:可以认为有变化.理由如下:
()P E 比较小,概率比较小的事件一般不容易发生,
一旦发生,就有理由认为本月支付金额大于2 000元的人数发生了变化, 所以可以认为有变化.
答案示例2:无法确定有没有变化.理由如下:
事件E 是随机事件,()P E 比较小,一般不容易发生,但还是有可能发生的, 所以无法确定有没有变化.
6.【2018年高考全国Ⅱ卷文数】下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,,17)建立模型①:
?30.413.5y
t =-+;根据2010年至2016年的数据(时间变量t 的值依次为1,2,,7)建立模型
②:?9917.5y
t =+. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.
【答案】(1)模型①:226.1亿元,模型②:256.5亿元;(2)模型②得到的预测值更可靠,理由见解析.
【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为
y =–30.4+13.5×19=226.1(亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为
y =99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠. 理由如下:
(i )从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y =–30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述
环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.
7.【2018年高考全国Ⅰ卷文数】某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
使用了节水龙头50天的日用水量频数分布表
(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水(
一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【答案】(1)见解析;(2)0.48;(3)3
47.45m.
【解析】(1)频率分布直方图如下:
(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m 3的频率为 0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,
因此该家庭使用节水龙头后日用水量小于0.35m 3的概率的估计值为0.48. (3)该家庭未使用节水龙头50天日用水量的平均数为
11
(0.0510.1530.2520.3540.4590.55260.655)0.4850
x =
?+?+?+?+?+?+?=. 该家庭使用了节水龙头后50天日用水量的平均数为
21
(0.0510.1550.25130.35100.45160.555)0.3550
x =
?+?+?+?+?+?=. 估计使用节水龙头后,一年可节省水3(0.480.35)36547.45(m )-?=.
8.【2018年高考全国Ⅲ卷文数】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min )绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m 和不超过m的工人数填入下面的列联表:
超过m不超过m
第一种生产方式
第二种生产方式
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附:
2
2
()
()()()()
n ad bc
K
a b c d a c b d
-
=
++++
,
2
()0.0500.0100.001
3.8416.63510.828
P K k
k
≥
.
【答案】(1)第二种生产方式的效率更高,理由见解析;(2)列联表见解析;(3)有99%的把握认为两种生产方式的效率有差异.
【解析】(1)第二种生产方式的效率更高.
理由如下:
(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.
(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.
(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.
(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.
以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.
(2)由茎叶图知
7981
80
2
m
+
==.
列联表如下:
(3)由于
2
2
40(151555)
10 6.635
20202020
K
?-?
==>
???
,所以有99%的把握认为两种生产方式的效
率有差异.
9.【2018年高考北京卷文数】电影公司随机收集了电影的有关数据,经分类整理得到下表:
好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;
(2)随机选取1部电影,估计这部电影没有获得好评的概率;
(3)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大(
只需写出结论)
【答案】(1)0.025;(2)0.814;(3)增加第五类电影的好评率,减少第二类电影的好评率.
【解析】(1)由题意知,样本中电影的总部数是140+50+300+200+800+510=2000.
第四类电影中获得好评的电影部数是200×0.25=50,
故所求概率为
50
0.025 2000
=.
(2)方法1:由题意知,样本中获得好评的电影部数是140×0.4+50×0.2+300×0.15+200×0.25+800×0.2+510×0.1 =56+10+45+50+160+51
=372.
故所求概率估计为
372
10.814
2000
-=.
方法2:设“随机选取1部电影,这部电影没有获得好评”为事件B.
没有获得好评的电影共有140×0.6+50×0.8+300×0.85+200×0.75+800×0.8+510×0.9=1628部.
由古典概型概率公式得
1628
0.814
2
)
00
(
P B==.
(3)增加第五类电影的好评率,减少第二类电影的好评率.
10.【2018年高考天津卷文数】已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.
(1)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?
(2)设抽出的7名同学分别用A,B,C,D,E,F,G表示,现从中随机抽取2名同学承担敬老院的卫生工作.
(i)试用所给字母列举出所有可能的抽取结果;
(ii)设M为事件“抽取的2名同学来自同一年级”,求事件M发生的概率.
【答案】(1)分别抽取3人,2人,2人;(2)(i)见解析,(ii)5
21.
【分析】本小题主要考查随机抽样、用列举法计算随机事件所含的基本事件数、古典概型及其概率计算公式等基本知识,考查运用概率知识解决简单实际问题的能力.
【解析】(1)由已知,甲、乙、丙三个年级的学生志愿者人数之比为3∶2∶2,
由于采用分层抽样的方法从中抽取7名同学,
因此应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人.
(2)(i)从抽出的7名同学中随机抽取2名同学的所有可能结果为
{A,B},{A,C},{A,D},{A,E},{A,F},{A,G},{B,C},{B,D},{B,E},{B,F},{B,G},{C,D},{C,E},{C,F},{C,G},{D,E},{D,F},{D,G},{E,F},{E,G},{F,G},共21种.
(ii)由(1),不妨设抽出的7名同学中,来自甲年级的是A,B,C,来自乙年级的是D,E,来自丙年级的是F,G,
则从抽出的7名同学中随机抽取的2名同学来自同一年级的所有可能结果为
{A,B},{A,C},{B,C},{D,E},{F,G},共5种.
所以,事件M发生的概率为P(M)=5
21.
11.【2017年高考全国Ⅱ卷文数】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对
比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg ),其频率分布直方图如下:
(1)记A 表示事件“旧养殖法的箱产量低于50 kg”,估计A 的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50 kg
箱产量≥50 kg
旧养殖法 新养殖法
(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较. 附:
P (
) 0.050 0.010 0.001
k
3.841 6.635 10.828
2
2
()()()()()
n ad bc K a b c d a c b d -=++++.
【答案】(1)0.62;(2)列联表见解析,有99%的把握认为箱产量与养殖方法有关;(3)新养殖法优于旧养殖法.
【分析】(1)根据频率分布直方图中小长方形面积等于对应概率,计算A 的概率;(2)将数据填入对应表格,代入卡方公式,计算215.705K ≈,对照参考数据可作出判
断;(3)先从均值(或中位数)比较大小,越大越好,再从数据分布情况看稳定性,越集中越好,综上可得新养殖法优于旧养殖法.
【解析】(1)旧养殖法的箱产量低于50 kg的频率为
(0.012+0.014+0.024+0.034+0.040)×5=0.62.
因此,事件A的概率估计值为0.62.
(2)根据箱产量的频率分布直方图得列联表
K2=
2 20062663438
15.705 10010096104
??-?
???
()
≈.
由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到
55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱
产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.
【名师点睛】(1)频率分布直方图中小长方形面积等于对应概率,所有小长方形面积之和为1.
(2)频率分布直方图中均值等于组中值与对应概率乘积的和.
(3)均值大小代表水平高低,方差大小代表稳定性.
12.【2017年高考全国Ⅰ卷文数】为了监控某种零件的一条生产线的生产过程,检验员每隔
30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在
一天内依次抽取的16个零件的尺寸:
经计算得16119.9716i i x x ===∑,
0.212s ==≈,18.439≈,16
1
(
)(8.5) 2.78i i x x i =--=-∑,其中i x 为抽取的第i 个零件的尺寸,
1,2,,16i =???.
(1)求(,)i x i (1,2,,16)i =???的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若||0.25r <,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在(3,3)x s x s -+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(ⅱ)在(3,3)x s x s -+之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)
附:样本(,)i i x y (1,2,,)i n =???的相关系数()()
n
i
i
x x y y r --=
∑0.09≈.
【答案】(1)18.0-≈r ,可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小;(2)(ⅰ)需对当天的生产过程进行检查;(ⅱ)均值与标准差的估计值分别为10.02,0.09.
【分析】(1)依公式求r ;(2)(i )由9.97,0.212x s =≈,得抽取的第13个零件的尺寸在(3,3)x s x s -+以外,因此需对当天的生产过程进行检查;(ii )剔除第13个数据,则均值的估计值为10.02,方差为0.09. 【解析】(1)由样本数据得(,)(1,2,
,16)i x i i =的相关系数为
16
()(8.5)
0.18i
x x i r --=
=
≈-∑.
由于||0.25r <,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.
(2)(i )由于9.97,0.212x s =≈,
由样本数据可以看出抽取的第13个零件的尺寸在(3,3)x s x s -+以外, 因此需对当天的生产过程进行检查.
(ii )剔除离群值,即第13个数据,剩下数据的平均数为
1
(169.979.22)10.0215
?-=, 这条生产线当天生产的零件尺寸的均值的估计值为10.02.
16
2221
160.212169.971591.134i i x
==?+?≈∑,
剔除第13个数据,剩下数据的样本方差为
221
(1591.1349.221510.02)0.00815
--?≈,
0.09≈.
【名师点睛】解答新颖的数学题时,一是通过转化,化“新”为“旧”;二是通过深入分析,多方联想,以“旧”攻“新”;三是创造性地运用数学思想方法,以“新”制“新”,应特别关注创新题型的切入点和生长点.
13.【2017年高考全国Ⅲ卷文数】某超市计划按月订购一种酸奶,每天进货量相同,进货成
本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理
完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
最高气温[10,15)[15,20)[20,25)[25,30)[30,35)[35,40)
天数216362574
以最高气温位于各区间的频率估计最高气温位于该区间的概率.
(1)估计六月份这种酸奶一天的需求量不超过300瓶的概率;
(2)设六月份一天销售这种酸奶的利润为Y(单位:元).当六月份这种酸奶一天的进货量为450瓶时,写出Y的所有可能值,并估计Y大于零的概率.
【答案】(1)0.6;(2)Y的所有可能值为900,300,-100,Y大于零的概率为0.8.【分析】(1)先确定需求量不超过300瓶的天数为2163654
++=,再根据古典概型的概率计算公式求概率;(2)先分别求出最高气温不低于25(36天),最高气温位于区间[20,25)(36天),以及最高气温低于20(18天)对应的利润分别为
900,300,100
-,所以Y大于零的概率估计为362574
0.8
90
+++
=.
【解析】(1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25,由表格数据知,最高气温低于25的频率为,
所以这种酸奶一天的需求量不超过300瓶的概率的估计值为0.6.
(2)当这种酸奶一天的进货量为450瓶时,
若最高气温不低于25,则Y=6450-4450=900;
若最高气温位于区间[20,25),则Y=6300+2(450-300)-4450=300;
若最高气温低于20,则Y=6200+2(450-200)-4450=-100.
所以,Y的所有可能值为900,300,-100.