2020年高考数学(理)热点题型:概率与统计(含答案)
2020年高考数学(理)名师提分专题: 概率与统计(全国版含解析)

【答案】C 【解析】必然事件的概率为 1,不可能事件的概率为 0,不确定事件的概率在 [0,1] .故 A,B 错误;概 率为 0 的事件可能是随机事件,如在任意实数中任取一个数,恰好为 2,概率为 0,可能发生,是随机 事件;又如在圆上任取一点,恰好为圆心,概率是 0,可能发生,是随机事件,故 D 错误.故选 C.
6.某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、90 后从事互 联网行业者岗位分布条形图,则下列结论中不一定正确的是
1
(3)树状图法:树状图是进行列举的一种常用方法,适用于有顺序的问题及较复杂问题中基本事件数 的探求. (4)运用排列组合知识计算.
2.将一根长为 6m 的绳子剪为二段,则其中一段大于另一段 2 倍的概率为( )
A.1
3
B.2
3
C.2
5
D.3
5
【答案】B
【解答】:绳子的长度为 6m,折成两段后,设其中一段长度为 x,则另一段长度 6﹣x,
提分专题:概率与统计
1.从分别写有 1,2,3 的 3 张卡片中随机抽取 1 张.放回后再随机抽取 1 张.则抽得的第一张卡片上的数
不小于第二张卡片上的数的概率为( )
A.2
3
【答案】B
B.1
3
C.5
9
D.4
9
【解答】:从分别写有 1,2,3 的 3 张卡片中随机抽取 1 张.放回后再随机抽取 1 张.
P(X=0)=(1)2(1)2= 1 ,
2
3
2020年高考数学试题分类汇编专题概率理精品

2020年高考试题数学(理科)概率、选择题1.(2020年高考浙江卷理科9)有5本不同的书,其中语文书2本,数学书2本,物理书1本.若将其随机的并排摆放到书架的同一层上,则同一科目的书都不相邻的概率(A) 1(B) 2(C) 3(D )45 5 5 5【答案】B一2A2 AnA^ A^A^A: 2【解析】由古典概型的概率公式得P 1 A3A2 A22.A55 52.(2020年高考辽宁卷理科5)从1, 2, 3, 4, 5中任取2各不同的数,事件A= "取到的2 个数之和为偶数”,事件B= "取到的2个数均为偶数”,则P (Bl A)=(A) 1 (B) 1 (C) 2(D) 18 4 5 2Ci 2 cl 1 u , 1解析:由题意nP(A)= —―5―, P(AB) = —= 一P(B I At=--------- =—.耳5 弓10 , PA 4小组,每位同学参加各个小组的可能性相则这两位同学参加同一个兴趣小组的概率为同,(A) 1(B) 1(C) - (D)-3 2 3 4解析:因为甲乙两位同学参加同一个小组有3种方法,两位同学个参加一个小组共有3 13 3 9种方法;所以,甲乙两位同学参加同一个小组的概率为- -9 3点评:本题考查排列组合、概率的概念及其运算和分析问题、解决问题的能力。
4.(2011年高考广东卷理科6)甲、乙两队断排球决赛.现在的憧&是甲队只要再忘一局就获冠军,乙队初再高两局才能得国军.若两队胜每扃的概率相同.则甲队获谆冠军的概率为()金太阳新课标资源网【解析】D.由题得甲队获得冠军有两种情况,第一局胜或第一局输第二局胜,所以甲队获 (1113)3 (2020年高考全国新课标卷理科4)有3个兴趣小组,甲、乙两位同学各自参加其中一个得冠军的概率p ————.所以选D.2 2 2 45.(2020年高考湖北卷理科7)如图,用K、A、A2三类不同的元件连成一个系统 .当K正常工作且A i 、A 2至少有一个正常工作时,系统正常工作 .已知K 、A 、A 2正常工作的概率依次为0.9、0.8、0.8 ,则系统正常工作的概率为B.0.864C.0.720D.0.576[-S]~~-in ———---- j L -----答案:B解析:系统正常工作概率为 C 2 0.9 0.8 (1 0.8) 0.9 0.8 0.8 0.864 ,所以选B.6. (2020年高考陕西卷理科 10)甲乙两人一起去“ 2020西安世园会”,他们约定,各自独立 地从1到6号景点中任选4个进行游览,每个景点参观1小时,则最后一小时他们同在一个景点的概率是(A) — (B) 1 (Q 9(D) 1369 36 6【答案】D1到6号景点中任选4个进行游览有C 6c 6c 5c 5c 4c 4c 1c 3种,且等可能,最后一小时他们同在一个景点有 C 6c 5c 5c 4c 4c 30种,则最后一小时他们同在一个7. (2020年高考四川卷理科 12)在集合1,2,3,4,5中任取一个偶数a 和一个奇数b 构成以原点为起点的向量 a= (a,b ).从所有得到的以原点为起点的向量中任取两个向量为邻边作 平行四边形.记所有作成的平行四边形的个数为 n ,其中面积不超过.4的平行四边形的个数为m ,则m () n(A) —(B) 1(C) 2(D)-15 3 5 3答案:B2解析:基本事件:从(2,1),(2,3),(2,5),(4,1),(4,5),(4,3)选取 2个,n C 6 3 5 15 .其中面积为2的平行四边形的个数(2,3)(4,5);(2,1)(4,3);(2,1)(4,1);其中面积为4的平行四 边形的为(2,3)(2,5);(2,1)(2,3) ; m=3+2=5 故 m — 1.n 15 3A.0.960【解析】:各自独立地从 景点的概率是p1111111C111111101C6 C6c5c5 C4c4c3c38. (2020年高考福建卷理科 4)如图,矩形 ABCN,点E 为边CD 的中点,若在矩形 ABCD内部随机取一个点 Q,则点Q 取自△ ABE 内部的概率等于8.12D.—3二、填空题:1 .(2020年高考浙江卷理科15)某毕业生参加人才招聘会,分别向甲、乙、丙三个公司投递2 .....................................、,了个人简历,假定该毕业生得到甲公司面试的概率为 上,得到乙、丙两公司面试的概率为3〜 C 、 1 J 、口…… P ( 0) 一,则随机变量的数学期望12 5【答案】53 2 . (2020年高考江西卷理科 12)小波通过做游戏的方式来确定周末活动,他随机地往单位圆内投掷一点,若此点到圆心白^距离大于。
2020高考数学(理)专项复习《概率统计》含答案解析

概率统计统计是研究如何合理收集、整理、分析数据的学科,为人们制定决策提供依据.概率是研究随机现象规律的学科,为人们认识客观世界提供重要的思维模式和解决问题的方法. 统计一章介绍随机抽样、样本估计总体、线性回归的基本方法,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用.概率一章介绍随机现象与概率的意义、古典概型及几何概型,学习某些离散型随机变量分布列及其期望、方差等内容,初步学会利用离散型随机变量思想描述和分析某些随机现象的方法,并能用所学知识解决一些简单的实际问题,进一步体会概率模型的作用及运用概率思考问题的特点,初步形成用随机观念观察、分析问题的意识.§11-1 概率(一)【知识要点】1.事件与基本事件空间:随机事件:当我们在同样的条件下重复进行试验时,有的结果始终不会发生,它称为不可能事件;有的结果在每次试验中一定会发生,它称为必然事件;在试验中可能发生也可能不发生的结果称为随机事件,随机事件简称为事件.基本事件与基本事件空间:在一次试验中我们常常要关心的是所有可能发生的基本结果,它们是试验中不能再分的最简单的随机事件,其他事件可以用它们来描述,这样的事件称为基本事件.所有基本事件构成的集合叫做基本事件空间,常用 表示.2.频率与概率频率:在相同的条件S 下,重复n 次试验,观察某个事件A 是否出现,称n 次试验中事件A 的出现次数m 为事件A 出现的频数,称事件A 出现的比例nm 为事件A 出现的频率. 概率:一般的,在n 次重复进行的试验中,事件A 发生的频率nm ,当n 很大时总是在某个常数附近摆动,随着n 的增加,摆动幅度越来越小,这时就把这个常数叫做事件A 的概率,记做P (A ).显然有0≤P (A )≤1.不可能事件的概率为0,必然事件的概率为1,随机事件的概率在(0,1)之间.3.互斥事件的概率加法公式事件的并:由事件A 或B 至少有一个发生构成的事件C 称为事件A 与B 的并,记做C =A ∪B .互斥事件:不可能同时发生的两个事件称为互斥事件.互斥事件加法公式:如果事件A 、B 互斥,则事件A ∪B 发生的概率等于这两个事件分别发生的概率和,即P (A ∪B )=P (A )+P (B ).如果A 1,A 2,…,A n 两两互斥,那么事件A 1∪A 2∪…∪A n 发生的概率,等于这n 个事件分别发生的概率和,即P (A 1∪A 2∪…∪A n )=P (A 1)+P (A 2)+…+P (A n ).对立事件:不能同时发生且必有一个发生的两个事件叫做互为对立事件.事件A 的对立事件记作A ,满足P (A )=1-P (A ).概率的一般加法公式(选学):事件A 和B 同时发生构成的事件D ,称为事件A 与B 的交(积),记作D =A ∩B .在古典概型中,P (A ∪B )=P (A )+P (B )-P (A ∩B ).4.古典概型古典概型:一次试验有下面两个特征:(1)有限性,在一次试验中可能出现的结果只有有限个,即只有有限个不同的基本事件;(2)等可能性,每个基本事件发生的可能性是均等的,则称这个试验为古典概型.古典概型的性质:对于古典概型,如果试验的n 个基本事件为A 1,A 2,…,A n ,则有P (A 1∪A 2∪…∪A n )=1且⋅=nA P i 1)( 概率的古典定义:在古典概型中,如果试验的基本事件总数为n (Ω ),随机事件A 包含的基本事件数为n (A),则p (A)=试验的基本事件总数包含的基本事件数事件A ,即⋅=)()()(Ωn A n A P 5.几何概型几何概型:一次试验具有这样的特征:事件A 理解为区域Ω的一个子区域A ,A 的概率只与子区域A 的几何度量(长度、面积或体积)成正比,而与A 的位置和形状无关,这样的试验称为几何概型.几何概型的特点:(1)无限性:一次试验中可能出现的结果有无穷多个;(2)等可能性,每个基本事件发生的可能性相等.几何概型中事件A 的概率定义:ΩA A P μμ=)(,其中μ Ω 表示区域Ω 的几何度量,μ A 表示子区域A 的几何度量.随机数:就是在一定范围内随机产生的数,并且得到这个范围内的每一个数的机会均等.计算机随机模拟法(蒙特卡罗方法)是利用模型来研究某种现象的性质的一种有效方法,可以节约大量的人力物力.6.条件概率与事件的独立性条件概率:一般的,设A 、B 为两个事件,且P (A )>0,称P (B |A )=)()(A P B A P I 为在事件A 发生的条件下,事件B 发生的概率.一般把P (B |A )读作“A 发生的条件下B 发生的概率”.在古典概型中,用n (A )表示事件A 中基本事件的个数,则有P (B |A )=)()(A n B A n I .事件的独立性:设A 、B 为两个事件,如果P (B |A )=P (B ),则称事件A 与事件B 相互独立,并称事件A 、B 为相互独立事件.若A 、B 为两个相互独立事件,则A 与A 、A 与B 、A 与B 也都相互独立.若事件A 与事件B 相互独立,则P (A ∩B )=P (A )·P (B ).【复习要求】1.了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.2.了解两个互斥事件的概率加法公式.3.理解古典概型及其概率计算公式,会计算一些随机事件所含的基本事件数及事件发生的概率.4.了解随机数的意义,了解几何概型的意义.5.在具体情境中,了解条件概率,了解两个事件相互独立的概念及独立事件的概率乘法公式,并能解决一些简单的实际问题.【例题分析】例1(1)射中9环或10环的概率;(2)至少命中8环的概率;(3)命中不足8环的概率.【分析】射击运动员一次射击只能命中1个环数,命中不同的环数是互斥事件,射中9环或10环的概率等于射中9环与射中10环的概率和.命中不足8环所包含的事件较多,而其对立事件为“至少命中8环”,可先求其对立事件的概率,再通过P (A )=1-P (A )求解.解:设事件“射击一次,命中k 环”为事件A k (k ∈N ,k ≤10),则事件A k 彼此互斥.(1)记“射击一次,射中9环或10环”为事件A ,则P (A )=P (A 10)+P (A 9)=0.60.(2)记“射击一次,至少命中8环”为事件B ,则P (B )=P (A 10)+P (A 9)+P (A 8)=0.78.(3)“射击一次,命中不足8环”为事件B 的对立事件,则P (B )=1-P (B )=0.22.【评析】解决概率问题时,要先分清所求事件由哪些事件组成,分析是否是互斥事件,再决定用哪个公式.当用互斥事件的概率加法公式解题时,要学会不重不漏的将事件拆为几个互斥事件,要善于用对立事件解题.例2 现有8名奥运会志愿者,其中志愿者A 1,A 2,A 3通晓日语,B 1,B 2,B 3通晓俄语,C 1,C 2通晓韩语.从中选出通晓日语、俄语和韩语的志愿者各1名,组成一个小组.(Ⅰ)求A 1被选中的概率;(Ⅱ)求B 1和C 1不全被选中的概率.【分析】本题是一个古典概型的问题,可以直接用概率公式)()()(Ωn A n A P =求解. 解:(Ⅰ)从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果组成的基本事件空间Ω={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2),(A 2,B 1,C 1),(A 2,B 1,C 2),(A 2,B 2,C 1),(A 2,B 2,C 2),(A 2,B 3,C 1),(A 2,B 3,C 2),(A 3,B 1,C 1),(A 3,B 1,C 2),(A 3,B 2,C 1),(A 3,B 2,C 2),(A 3,B 3,C 1),(A 3,B 3,C 2)} 由18个基本事件组成.由于每一个基本事件被抽取的机会均等,因此这些基本事件的发生是等可能的.用M 表示“A 1恰被选中”这一事件,则M ={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2)}事件M 由6个基本事件组成,因而⋅==31186)(M P(Ⅱ)用N 表示“B 1,C 1不全被选中”这一事件,则其对立事件N 表示“B 1,C 1全被选中”这一事件, 由于N ={(A 1,B 1,C 1),(A 2,B 1,C 1),(A 3,B 1,C 1)},事件N 由3个基本事件组成, 所以61183)(==N P ,由对立事件的概率公式得⋅=-=-=65611)(1)(N P N P 【评析】古典概型解决概率问题时,选定基本事件空间并计算其所含基本事件的个数是重要的一步.本题中选定“从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果”为基本事件空间,计算时采用列举法,也可以利用乘法计数原理计算3×3×2=18.本题第一问还可以选定“从通晓日语的3人中选出1人的可能结果”为基本事件空间,共有3个基本事件,选出A 1只有一种可能,故所求概率为⋅31例3 一个口袋中装有大小相同的2个红球,3个黑球和4个白球,从口袋中一次摸出一个球,摸出的球不再放回.(1)连续摸球2次,求第一次摸出黑球,第二次摸出白球的概率;(2)连续摸球2次,在第一次摸到黑球的条件下,求第二次摸到白球的概率;(3)如果摸出红球,则停止摸球,求摸球次数不超过3次的概率.【分析】本题是一个古典概型问题,因为基本事件空间中所含基本事件的个数较多,宜用排列组合公式计算,当然也可利用两个计数原理计数.本题第二问是条件概率问题.做第三问时,要分为三个事件:“第一次摸到红球”,“第一次摸到不是红球,第二次摸到红球”,“前两次摸到不是红球,第三次摸到红球”,显然三个事件是互斥事件.解:(1)从袋中依次摸出2个球共有29A 种结果,第一次摸出黑球、第二次摸出白球有3×4=12种结果,则所求概率6112291==A P (或6184931=⨯=P ). (2)设“第一次摸到黑球”为事件A ,“第二次摸到白球”为事件B ,则“第一次摸到黑球,且第二次摸到白球”为事件A ∩B ,又31)(=A P ,P (A ∩B )61=,所以或⋅==213161)|(A B P (或2184)|(==A B P ). (3)第一次摸出红球的概率为1912A A ,第二次摸出红球的概率为291217A A A ,第三次摸出红球的概率为391227A A A ,则摸球次数不超过3次的概率为⋅=++=12739122729121719122A A A A A A A A P 【评析】利用古典概型求解时,求基本事件的个数和事件发生的总数时求法要一致,若无序则都无序,若有序则都有序,分子和分母的标准要相同.在求事件个数时常用列举法(画树状图、列表、坐标系法),有时也与排列组合联系紧密,计算时灵活多变,但要注意分类讨论,做到不重不漏.要正确识别条件概率问题,理解P (A),P (A ∩B ),P (B |A )的含义.例4 (1)两根相距6米的木杆上系一根绳子,并在绳子上挂一盏灯,则灯与两端距离都大于2米的概率是______.(2)甲乙两人约定在6点到7点之间在某处会面,并约好先到者等候另一人一刻钟,过时即可离去.则两人能会面的概率是______.(3)正方体内有一个内切球,则在正方体内任取一点,这个点在球内的概率为______.【分析】这三个题都可转化为几何概率问题求解.分别转化为线段长度、图形面积、几何体体积问题求解.解:(1)本题可转化为:“在长为6m 的线段上随机取点,恰好落在2m 到4m 间的概率为多少?” 易求得⋅=31P (2)本题可转化为面积问题:即“阴影部分面积占总面积的多少?”, 解得⋅=167)(A P (3)本题可转化为体积问题:即“内切球的体积与正方体体积之比是多少?”.解得⋅=6πP 【评析】几何概型也是一种概率模型,它具有等可能性和无限性两个特点.解题的关键是要建立模型,将实际问题转化为几何概率问题.基本步骤是:把基本事件空间转化为与之对应的区域Ω;把随机事件A 转化为与之对应的区域A ;利用概率公式)()()(ΩA A P μμ=计算.常用的几何度量包括:长度、面积、体积.例5 设有关于x 的一元二次方程x 2+2ax +b 2=0.(Ⅰ)若a 是从0,1,2,3四个数中任取的一个数,b 是从0,1,2三个数中任取的一个数,求上述方程有实根的概率;(Ⅱ)若a 是从区间[0,3]任取的一个数,b 是从区间[0,2]任取的一个数,求上述方程有实根的概率.【分析】本题第一问是古典概型问题,第二问由于a 、b 在实数区间选取,可以转化为几何概型问题求解.解:设事件A 为“方程x 2+2ax +b 2=0有实根”.当a ≥0,b ≥0时,方程x 2+2ax +b 2=0有实根的充要条件为a ≥b .(Ⅰ)基本事件共12个:(0,0),(0,1),(0,2),(1,0),(1,1),(1,2),(2,0),(2,1),(2,2),(3,0),(3,1),(3,2).其中第一个数表示a 的取值,第二个数表示b 的取值.事件A 中包含9个基本事件,事件A 发生的概率为⋅==43129)(A P (Ⅱ)试验的全部结果所构成的区域为{(a ,b )|0≤a ≤3,0≤b ≤2}.构成事件A 的区域为{(a ,b )|0≤a ≤3,0≤b ≤2,a ≥b }.所以所求的概率为⋅=⨯⨯-⨯=3223221232 【评析】几何概型与古典概型的每个基本事件发生的可能性是均等的,只是几何概型的基本事件有无限个,而古典概型的基本事件有有限个.在具体问题中,不能因为古典概型的基本事件的个数多而误认为是几何概型.例6 如图,用A 、B 、C 三类不同的元件连结成两个系统N 1、N 2,当元件A 、B 、C 都正常工作时,系统N 1正常工作;当元件A 正常工作且元件B 、C 至少有一个正常工作时,系统N 2正常工作,已知元件A 、B 、C 正常工作的概率为0.80、0.90、0.90,分别求系统N 1、N 2正常工作的概率.【分析】三个元件能否正常工作相互独立.当元件A 、B 、C 同时正常工作时,系统N 1正常工作;当元件A 正常工作且元件B 、C 至少有一个正常工作时,系统N 2正常工作,而B 、C 至少有一个正常工作的概率可通过其对立事件计算.解:设元件A 、B 、C 正常工作为事件A 、B 、C ,则P (A )=0.8,P (B)=0.9,P (C)=0.9,且事件A 、B 、C 相互独立.(1)系统N 1正常工作的概率为p 1=P (A ·B ·C )=P (A )·P (B )·P (C )=0.80×0.90×0.90=0.648.(2)元件B 、C 至少有一个正常工作的概率为1-P (B ·C )=1-P (B )·P (C )=1-0.1×0.1=0.99,所以系统N 2正常工作的概率为p 2=P (A )·(1-P (B ·C ))=0.80×0.99=0.792.【评析】本题以串、并联为背景,重点在正确理解题意.在计算几个事件同时发生的概率时,要先判断各个事件之间是否相互独立.独立事件、互斥事件、对立事件的概率各有要求,要依据题目特点,巧妙地选用相关方法.例7 每次抛掷一枚质地均匀的骰子(六个面上分别标以数字1,2,3,4,5,6).(1)连续抛掷3次,求向上的点数之和为3的倍数的概率;(2)连续抛掷6次,求向上的点数为奇数且恰好出现4次的概率.【分析】向上点数之和为3的倍数共有6种情况,计数时要不重不漏;向上点数为奇数的概率为21,连续抛掷6次是独立重复试验. 解:(1)向上的点数之和为3的结果有1种情况,为6的结果共10种情况,为9的结果共25种情况,为12的结果共25种情况,为15的结果共10种情况,为18的结果共1种情况.所以⋅=⨯⨯+++++=3166611025251012P(2)因为每次抛掷骰子,向上的点数为奇数的概率为P =21, 根据独立重复试验概率公式有⋅==⋅⋅6415)21()21(24463C P 【评析】独立重复试验是一类重要的概率问题,要善于分析模型的特点,正确合理的解题.例8 某学校进行交通安全教育,设计了如下游戏,如图,一辆车模要直行通过十字路口,此时前方交通灯为红灯,且该车模前面已有4辆车模依次在同一车道上排队等候(该车道只可以直行或左转行驶).已知每辆车模直行的概率是53,左转行驶的概率是52,该路口红绿灯转换间隔时间均为1分钟.假设该车道上一辆直行去东向的车模驶出停车线需要10秒钟,一辆左转去北向的车模驶出停车线需要20秒钟,求:(1)前4辆车模中恰有2辆车左转行驶的概率;(2)该车模在第一次绿灯亮起时的1分钟内通过该路口的概率(汽车驶出停车线就算通过路口).【分析】该车模1分钟内通过路口包含2种情况:4辆车都直行,3辆车直行1辆车左转.解:(1)设前4辆车模中恰有2辆左转行驶为事件A ,则⋅=⨯=625216)52()53()(2224C A P (2)设该车在第一次绿灯亮起时的1分钟内通过该路口为事件B ,其中4辆车模均 直行通过路口为事件B 1,3辆直行1辆左转为事件B 2,则事件B 1、B 2互斥.=+=+=)()()()(2121B B P B B P B P ⋅=⨯+62529752)53()53(334444C C 【评析】善于从复杂的背景中发现线索,体会其实质.善于转化问题的叙述,恰当的分类.练习11-1一、选择题1.下列随机事件的频率和概率的关系中哪个是正确的( )A .频率就是概率B .频率是客观存在的,与试验次数无关C .随着试验次数增加,频率一般会越来越接近概率D .概率是随机的,在试验前不能确定2.从装有2个黑球2个白球的口袋中任取2个球,那么互斥而不对立的两个事件是( )A .至少有一个白球,都是白球B .至少有一个白球,至少有一个红球C .恰有一个白球,恰有两个白球D .至少有一个白球,都是红球3.独立工作的两套报警系统遇危险报警的概率均为0.4,则遇危险时至少有一套报警系统报警的概率是( )A .0.16B .0.36C .0.48D .0.644.考察正方体6个面的中心,甲从这6个点中任意选两个点连成直线,乙也从这6个点中任意选两个点连成直线,则所得的两条直线相互平行但不重合的概率等于( )A .751B .752C .753D .754 二、填空题5.甲、乙二人掷同一枚骰子各一次.如果谁掷的点数大谁就取胜,则甲取胜的概率为______.6.设每门高射炮命中飞机的概率都是0.6.今有一敌机来犯,要有99%的把握击中敌机,至少需要______门高射炮.7.在平面直角坐标系xoy 中,设D 是横坐标与纵坐标的绝对值均不大于2的点构成的区域,E 是到原点的距离不大于1的点构成的区域,向D 中随机投一点,则落入E 中概率为______.8.一个口袋中有4个白球,2个黑球.有放回的取出3个球,如果第一次取出的是白球,则第三次取出的是黑球的概率为______;不放回的取出3个球,在第一次取出的是白球的条件下,第二次取出的是黑球的概率为______.三、解答题9.已知集合A ={-4.-2,0,1,3,5},在平面直角坐标系中点M (x ,y )的坐标满足x ∈A ,y ∈A .计算:(1)点M 恰在第二象限的概率;(2)点M 不在x 轴上的概率;(3)点M 恰好落在区域⎪⎩⎪⎨⎧>>>-+0008y x y x 上的概率.10.某个高中研究性学习小组共有9名学生,其中有3名男生和6名女生.在研究学习过程中,要进行两次汇报活动(即开题汇报和结题汇报),每次汇报都从这9名学生中随机选1人作为代表发言.设每人每次被选中与否均互不影响;(1)求两次汇报活动都是由小组成员甲发言的概率;(2)求男生发言次数不少于女生发言次数的概率.11.3名志愿者在10月1日至10月5日期间参加社区服务工作,若每名志愿者在这5天中任选两天参加社区服务工作,且各名志愿者的选择互不影响.求(1)这3名志愿者中在10月1日都参加社区服务工作的概率;(2)这3名志愿者中在10月1日至多有1人参加社区服务工作的概率.§11-2 概率(二)【知识要点】1.离散型随机变量及其分布列随机变量:如果随机试验的可能结果可以用一个变量X 来表示,并且X 是随着试验的结果的不同而变化的,我们把这样的变量X 叫做一个随机变量.如果随机变量X 的所有可能的取值都能一一列举出来,则称X 为离散型随机变量.离散型随机变量的分布列:设离散型随机变量X 的可能取值为x 1,x 2,…,x n ,X 取到i i ii 12+…+p n =1.离散型随机变量在某个范围取值的概率等于它取这个范围内各个值的概率和.其中0<p <1,q =1-,则称离散型随机变量服从参数为p 的二点分布.二项分布:一般的,在相同条件下重复地做n 次试验,各次试验的结果相互独立,称为n 次独立重复试验.在n 次独立重复试验中,事件A 恰好发生k 次的概率为==)(k X P k n k k n q p C -(其中p 为在一次试验中事件A 发生的概率,q =1-p ,k =0,1,…,n ).若将n次独立重复试验中事件A 发生的次数设为X ,则X 的分布列为超几何分布:一般的,设有总数为N 件的两类物品,其中一类有M 件,从所有物品中任取n 件(n ≤N ),这n 件中所含这类物品件数X 是一个离散型随机变量,它取值为m 时的概率为m C C C m X P n Nm n M N m M ≤==--0()(≤l ,其中l 为n 和M中较小的一个).我们称离散型随机变量X 的这种形式的概率分布为超几何分布,也称X 服从参数为N 、M 、n 的超几何分布.2.随机变量的数字特征及正态分布1122i i n n 了离散型随机变量的平均取值水平.称i i n i p X E xX D ⋅-=∑=21))(()(为随机变量X 的方差,它反映了离散型随机变量X 相对于期望的平均波动大小(或说离散程度),其算数平方根)(X D 为随机变量X 的标准差,记作σ (X ),方差(或标准差)越小表明X 的取值相对于期望越集中,否则越分散.均值与方差的性质:①E (aX +b )=aE (X )+b ②D (aX +b )=a 2D (X )若X 服从两点分布,则E (X )=p ,D (X )=pq ;若X ~B (n ,p ),则E (X )=np ,D (X )=npq . 正态曲线:函数),((21)(222)(+∞∝-∈=--x e x x σμσπϕ,其中μ ∈R ,σ >0)的图象为正态分布密度曲线,简称正态曲线.其特点有:①曲线位于x 轴上方,与x 轴不相交;②曲线是单峰的,关于x =μ 对称;③曲线在x =μ 处达到峰值σ2π1;④曲线与x 轴之间的面积为1;⑤当σ 一定时,曲线随着μ 的变化而沿x 轴平移;⑥当μ 一定时,曲线的形状由σ 决定.σ 越小,曲线越“瘦高”,表示总体的分布越集中;σ 越大,曲线越“矮胖”,表示总体的分布越分散.正态分布:如果对于任意实数a <b ,随机变量X 满足=≤<)(b X a P dx x ba )(ϕ⎰,则称X 的分布为正态分布;随机变量X 服从参数μ 、σ 的正态分布,记作N ~(μ ,σ 2).正态分布的三个常用数据:①P (μ -σ <X <μ +σ )=68.3%;②P (μ -2σ <X <μ +2σ )=95.4%;③P (μ -3σ <X <μ +3σ )=99.7%.【复习要求】①在对具体问题的分析中,理解取有限值的离散型随机变量及其分布列的概念,认识分布列对于刻画随机现象的重要性.②通过实例,理解超几何分布及其导出过程,并能进行简单的应用.③通过实例,理解n 次独立重复试验的模型及二项分布,并能解决一些简单的实际问题. ④通过实例,理解取有限值的离散型随机变量期望、方差的概念,能计算简单离散型随机变量的期望、方差,并能解决一些实际问题.⑤通过实际问题,认识正态分布曲线的特点及曲线所表示的意义.【例题分析】例1 一袋中装有编号为1、2、3、4、5、6的6个大小相同的小球,现从中随机取出3个球,以X 表示取出球的最大号码,(1)求X 的分布列;(2)求X >4的概率;(3)求E (X ).【分析】随机变量X 可能取的值为3、4、5、6,应用古典概型求得X 取每一个值的概率,就可以写出分布列.解:(1)随机变量X 可能取的值为3、4、5、6,且,203)4(,2011)3(362336======C C X P C X P 3624)5(C C X P ==103206==,212010)6(3625====C C X P ,所求X 的分布列为(2)==+==>)6()5()4(X P X P X P ⋅54 (3).25.5216103520342013)(=⨯+⨯+⨯+⨯=X E 【评析】离散型随机变量的分布列反映了一次试验的所有可能结果(X 的所有可能取值),以及取得每个结果(X 的每一个值)的概率.书写分布列首先要根据具体情况正确分析X 可取的所有值,然后利用排列组合及概率的有关知识求得每个x i 所对应的概率p i ,最后列成表格.要注意不同的X 值所对应的事件之间是互斥的,求离散型随机变量在某一范围的概率等于它取这个范围内各个值的概率和.例2 袋中装有大小相同的5个红球、5个白球,现从中任取4个球,其中所含红球的个数为X ,写出X 的分布列,并求X 的期望.【分析】袋中共有10个球,从中任取4个,所含红球的个数为0、1、2、3、4,每个事件的概率可以利用古典概型求解.解:随机变量X 可取的值有0、1、2、3、4,)0(=X P =,42121054104505==⋅C C C )1(=X P =215210504103515==⋅C C C ,)2(=X P 21102101004102525===⋅C C C ,===⋅4101535)3(C C C X P 21050 215=,4212105)4(4100545==⋅==C C C X P , 分布列为2424213212211420)(=⨯+⨯-+⨯+⨯+⨯=X E 【评析】本题的随机变量X 服从参数为N ,M ,n 的超几何分布,其中N =10,M =5,n =4.例3 某人练习射击,每次击中目标的概率为31. (1)用X 表示击中目标的次数.①若射击1次,求X 的分布列和期望;②若射击6次,求X 的分布列和期望;(2)若他连续射击6次,设ξ为他第一次击中目标前没有击中目标的次数,求ξ的分布列;(3)他一共只有6发子弹,若击中目标,则不再射击,否则子弹打完为止,求他射击次数η 的分布列.【分析】射击问题常被看做是独立重复试验.ξ的取值为0到6,η 的取值为1到6. 解:(1)①X 服从二点分布⋅=31)(X E ②X 服从二项分布)6,,1,0()2()1()(),1,6(~66Λ===-k C k X P B k k k ,分布列为.236)(=⨯=X E (2)ξ的取值为0到6,ξ=k (k =0,1,…,5)表示第k +1次击中目标,前k 次都没击中目标,则P (ξ=k )=)5,,1,0(31)32(.Λ=k k ,ξ=6表示射击6次都未击中目标,==)6(ξP6)2(.ξ的分布列为(3)η 的取值为1到6.η =k (k =1,2,…,5)表示第k 次时第一次击中目标,==)(k P η 6;1)2(.1=-ηk 表示前5次都没有击中目标,5)2()6(==ξP .η 的分布列为“X =k ”.在计算满足二点分布和二项分布的随机变量的期望和方差时,可直接应用公式计算.例4 甲乙两名射手在一次射击中的得分为两个相互独立的随机变量X 和Y ,且X 和Y 的分布列为计算X 和Y 【分析】先由分布列所提供的数据用期望和方差公式计算,再根据实际意义作出分析. 解:E (X )=8.85,D (X )=2.2275;E (Y )=5.6,D (Y )=10.24.由于E (X )>E (Y ),说明甲射击的平均水平比乙高;由于D (X )<D (Y ),说明甲射击的环数比较集中,发挥比较稳定,乙射击的环数比较分散,技术波动较大,不稳定,由此可以看出甲比乙的技术好.【评析】正确记忆期望和方差的公式,在分布列中,期望是每个变量乘以它所对应的概率再相加,求方差要先求期望,再作差、平方、乘以相应概率再相加.科学对待计算结果,正确分析数据所表达的实际意义.例5 设b 和c 分别是先后抛掷一枚骰子得到的点数,用随机变量ξ表示方程x 2+bx +c =0实根的个数(重根按一个计).(1)求方程x 2+bx +c =0有实根的概率;(2)求在先后两次出现的点数中有5的条件下,方程x 2+bx +c =0有实根的概率;(3)若η =2ξ+1,求ξ、η 的数学期望和方差;【分析】本题概率问题是古典概型,要分别求出事件中所含元素的个数,第一问事件“二次方程有实根”等价于“∆=b 2-4c ≥0”,b 、c 的值都取自{1,2,3,4,5,6};第二问是条件概率问题;第三问先求ξ的期望和方差,再由公式求η 的期望和方差.解:(1)由题意知:设基本事件空间为Ω,记“方程x 2+bx +c =0没有实根”为事件A ,“方程x 2+bx +c =0有且仅有一个实根”为事件B ,“方程x 2+bx +c =0有两个相异实数”为事件C ,Ω中基本事件总数为36个,A 中的基本事件总数为17个,B 中的基本事件总数为2个,C 中的基本事件总数为17个.又因为B ,C 是互斥事件,故所求概率⋅=+=+=36193617362)()(C B B P P (2)记“先后两次出现的点数中有5”为事件D ,“方程x 2+bx +c =0有实数”为事件E ,由上面分析得D P D P (,3611)(=∩367)=E ,∴⋅==117)()()|(D P E D P D E P I (Ⅱ)由题意ξ的可能取值为0,1,2,则,3617}2{,181}1{,3617}0{======&ξξξP P P 故ξ的分布列为:所以.18173617·)12(181·)11(3617·(0-0-,136172181136170222=-+-+==⨯+⨯+⨯=ξξD E 9342)12(,312)12(2==+==+=+=ξξξξηηD D D E E E 【评析】本题是一道概率的综合题,由07山东卷改编而得.在古典概型中解决条件概率问题时,概率公式是=)|(A B P )()()()(A n B A n A P B A P I I =.具有线性关系的两个随机变量的期望和方差之间的关系是b X aE b aX E +=+)()(,)()(2X D a b aX D =+.例6 (1)设两个正态分布N (μ 1,21σ)(σ 1>0)和N (μ 2,22σ)(σ 2>0)的密度函数图象如图所示.则有( )。
2020年高考数学(理)专题训练附解答: 概率与统计

(2020江西省上饶市一模)在贯彻中共中央、国务院关于精准扶贫政策的过程中,某单位在某市定点帮扶某村100户贫困户.为了做到精准帮扶,工作组对这100户村民的年收入情况、危旧房情况、患病情况等进行调查,并把调查结果转化为各户的贫困指标x .将指标x 按照[)0,0.2,[)0.2,0.4,[)0.4,0.6,[)0.6,0.8,[]0.8,1.0分成五组,得到如图所示的频率分布直方图.规定若00.6x ≤<,则认定该户为“绝对贫困户”,否则认定该户为“相对贫困户”;当00.2x ≤<时,认定该户为“亟待帮住户”.工作组又对这100户家庭的受教育水平进行评测,家庭受教育水平记为“良好”与“不好”两种.(1)完成下面的列联表,并判断是否有95%的把握认为绝对贫困户数与受教育水平不好有关:受教育水平良好受教育水平不好 总计 绝对贫困户 2相对贫困户 52总计100(2)上级部门为了调查这个村的特困户分布情况,在贫困指标处于[)00.4,的贫困户中,随机选取两户,用X 表示所选两户中“亟待帮助户”的户数,求X 的分布列和数学期望()E X .附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥0.15 0.10 0.05 0.025 0k2.072 2.7063.8415.024专题 概率与统计大题肢解一统计案例与数学期望【肢解1】完成下面的列联表,并判断是否有95%的把握认为绝对贫困户数与受教育水平不好有关:受教育水平良好受教育水平不好 总计 绝对贫困户 2相对贫困户 52总计100【肢解2】上级部门为了调查这个村的特困户分布情况,在贫困指标处于[)00.4,的贫困户中,随机选取两户,用X 表示所选两户中“亟待帮助户”的户数,求X 的分布列和数学期望()E X .【解析】(1)由题意可知,绝对贫困户有()0.250.500.75++0.210030⨯⨯=(户),可得出如列联表:受教育水平良好受教育水平不好总计绝对贫困户 2 28 30 相对贫困户 18 5270总计2080 100()22100182825230702080K ⨯⨯-⨯=⨯⨯⨯ 4.762 3.841≈>. 故有95%的把握认为绝对贫困户数与受教育水平不好有关.(2)贫困指标在[)00.4,的贫困户共有()0.250.50.210015+⨯⨯=(户), “亟待帮助户”共有0. 250.21005⨯⨯=(户), 依题意X 的可能值为0,1,2,()210215307C P X C ===,()1110521510121C C P X C ===,()252152221C P X C ===, 则X 的分布列为X0 12P371021221故31022()012721213E X =⨯+⨯+⨯=.1.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表; (2)根据公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算K 2的值;(3)查表比较K 2与临界值的大小关系,作统计判断. 2.求离散型随机变量ξ的均值与方差的方法:(1)理解ξ的意义,写出ξ可能取的全部值; (2)求ξ取每个值的概率; (3)写出ξ的分布列; (4)由均值的定义求E (ξ); (5)由方差的定义求D (ξ).【拓展1】(2020届辽宁省沈阳市东北育才学校高三上学期第三次模拟)手机支付也称为移动支付,是指允许用户使用其移动终端(通常是手机)对所消费的商品或服务进行账务支付的一种服务方式.随着信息技术的发展,手机支付越来越成为人们喜欢的支付方式.某机构对某地区年龄在15到75岁的人群“是否使用手机支付”的情况进行了调查,随机抽取了100人,其年龄频率分布表和使用手机支付的人数如下所示:(年龄单位:岁)年龄段[15,25) [25,35) [35,45) [45,55) [55,65) [65,75]频率 0.1 0.32 0.28 0.22 0.05 0.03 使用人数828241221若以45岁为分界点,根据以上统计数据填写下面的2×2列联表,并判断能否在犯错误的概率不超过0.001的前提下认为“使用手机支付”与年龄有关?年龄低于45岁 年龄不低于45岁 使用手机支付 不使用手机支付参考数据:)(02k K P ≥ 0.0250.010 0.005 0.0010k3.841 6.635 7.879 10.828参考公式:()()()()22()n ad bc K a b c d a c b d -=++++.【解析】(1)由统计表可得,低于45岁人数为70人,不低于45岁人数为30人, 可得列联表如下:年龄低于45岁 年龄不低于45岁 使用手机支付 60 15 不使用手机支付1015于是有K2的观测值2100(60151510)14.28610.82875257030k ⨯⨯-⨯=≈⨯⨯⨯>. 故可以在犯错误的概率不超过0.001的前提下认为“使用手机支付”与年龄有关.【拓展2】(2020届辽宁省沈阳市东北育才学校高三上学期第三次模拟)手机支付也称为移动支付,是指允许用户使用其移动终端(通常是手机)对所消费的商品或服务进行账务支付的一种服务方式.随着信息技术的发展,手机支付越来越成为人们喜欢的支付方式.某机构对某地区年龄在15到75岁的人群“是否使用手机支付”的情况进行了调查,随机抽取了100人,其年龄频率分布表和使用手机支付的人数如下所示:(年龄单位:岁)年龄段 [15,25) [25,35) [35,45) [45,55) [55,65) [65,75] 频率 0.1 0.32 0.28 0.22 0.05 0.03 使用人数828241221(1)若以45岁为分界点,根据以上统计数据填写下面的2×2列联表,并判断能否在犯错误的概率不超过0.001的前提下认为“使用手机支付”与年龄有关?年龄低于45岁 年龄不低于45岁 使用手机支付 不使用手机支付(2)若从年龄在[55,65),[65,75]的样本中各随机选取2人进行座谈,记选中的4人中“使用手机支付”的人数为X ,求随机变量X 的分布列和数学期望.【解析】由题意可知,X 的所有可能取值为0,1,2,3,相应的概率为:()223222531010C C P X C C ===,()112213223222225353215C C C C C P X C C C C ==+=,()11122322222222535313230C C C C C P X C C C C ==+=,()212222531315C C P X C C ===, 于是X 的分布列为:X 0 1 2 3P110 25 1330 115所以1213122()0123105301515E X =⨯+⨯+⨯+⨯=.1.(2019年湖北模拟)通过随机询问100名性别不同的大学生是否爱好某项运动,得到如下2×2列联表:男女总计爱好402060不爱好152540总计5545100(1)能否有99%的把握认为是否爱好该项运动与性别有关?请说明理由.(2)利用分层抽样的方法从以上爱好该项运动的大学生中抽取6人组建“运动达人社”,现从“运动达人社”中选派2人参加某项校际挑战赛,求选出的2人中恰有1名女大学生的概率.附:P(K2≥k0)0.0500.0100.001k0 3.841 6.63510.828K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.【解析】(1)因为K2=100×(40×25-20×15)255×45×60×40≈8.249>6.635,所以有99%的把握认为是否爱好该项运动与性别有关.(2)由题意,抽取的6人中,有男生4名,分别记为a,b,c,d;女生2名,分别记为m,n.则抽取的结果共有15种:(a,b),(a,c),(a,d),(a,m),(a,n),(b,c),(b,d),(b,m),(b,n),(c,d),(c,m),(c,n),(d,m),(d,n),(m,n),设“选出的2人中恰有1名女大学生”为事件A,事件A所包含的基本事件有8种:(a,m),(a,n),(b,m),(b,n),(c,m),(c,n),(d,m),(d,n).则P(A)=815.故选出的2人中恰有1名女大学生的概率为815.2.(2019年湖北省宜昌模拟)某公司招收大学毕业生,经过综合测试录用了14名男生和6名女生,这20名毕业生的测试成绩如茎叶图所示(单位:分).公司规定:成绩在180分以上者到甲部门工作,在180分以下者到乙部门工作,另外只有成绩高于180分的男生才能担任助理工作.变式训练一(1)现用分层抽样的方法从甲、乙两部门中选取8人.若从这8人中再选3人,求至少有一人来自甲部门的概率;(2)若从甲部门中随机选取3人,用X表示所选人员中能担任助理工作的人数,求X的分布列及数学期望.【解析】(1)根据茎叶图可知,甲、乙两部门各有10人,用分层抽样的方法,应从甲、乙两部门中各选取21045⨯=人.记“至少有一人来自甲部门”为事件A,则()3 4 3 813114CP AC=-=.故至少有一人来自甲部门的概率为1314.(2)由题意可知,X的可能取值为0,1,2,3.()()()()03122130646464643333101010101311 0,1,2,3301026C C C C C C C CP X P X P X P XC C C C============,所以X的分布列为X0 1 2 3P1303101216所以()1311901233010265E X=⨯+⨯+⨯+⨯=.(2019河南洛阳市模拟)雾霾天气对人体健康有伤害,应对雾霾污染、改善空气质量的首要任务是控制PM 2.5,要从压减燃煤、严格控车、调整产业、强化管理、联防联控、依法治理等方面采取重大举措,聚焦重点领域,严格考核指标.某省环保部门为加强环境执法监管,派遣四个不同的专家组对A、B、C三个城市进行治霾落实情况抽查.(1)若每个专家组随机选取一个城市,四个专家组选取的城市可以相同,也可以不同,求恰有一个城市没有专家组选取的概率;(2)每一个城市都要由四个专家组分别对抽查情况进行评价,并对所选取的城市进行评价,每个专家组给检查到的城市评价为优的概率为12,若四个专家组均评价为优则检查通过不用复检,否则需进行复检.设需进行复检的城市的个数为X,求X的分布列和期望.大题肢解二二项分布【肢解1】若每个专家组随机选取一个城市,四个专家组选取的城市可以相同,也可以不同,求恰有一个城市没有专家组选取的概率;【肢解2】每一个城市都要由四个专家组分别对抽查情况进行评价,并对所选取的城市进行评价,每个专家组给检查到的城市评价为优的概率为12,若四个专家组均评价为优则检查通过不用复检,否则需进行复检.设需进行复检的城市的个数为X,求X的分布列和期望.【解析】(1)随机选取,共有34=81种不同方法,恰有一个城市没有专家组选取的有C13(C14A22+C24)=42种不同方法,故恰有一个城市没有专家组选取的概率为4281=1427.(2)设事件A:“一个城市需复检”,则P(A)=1-4)21(=1516,X的所有可能取值为0,1,2,3,P(X=0)=C03·3)161(=14 096,P(X=1)=C13·3)161(·1)1615(=454 096,P(X=2)=C23·1)161(·2)1615(=6754 096,P(X=3)=C33·3)1615(=3 3754 096.所以X的分布列为X 0123P14 096454 0966754 0963 3754 096由题意知X~B)1615,3(,所以E(X)=3×1516=4516.二项分布的期望与方差如果ξ~B(n,p),则用公式E(ξ)=np;D(ξ)=np(1-p)求解,可大大减少计算量.1.(2019四川成都诊断)某部门为了解一企业在生产过程中的用水量情况,对其每天的用水量做了记录,得到了大量该企业的日用水量的统计数据,从这些统计数据中随机抽取12天的数据作为样本,得到变式训练二如图所示的茎叶图(单位:吨).若用水量不低于95吨,则称这一天的用水量超标.(1)从这12天的数据中随机抽取3个,求至多有1天的 用水量超标的概率;(2)以这12天的样本数据中用水量超标的频率作为概率,估计该企业未来3天中用水量超标的天数,记随机变量X 为未来这3天中用水量超标的天数,求X 的分布列、数学期望和方差. 【解析】(1)记“从这12天的数据中随机抽取3个,至多有1天的用水量超标”为事件A ,则P (A )=C 14C 28C 312+C 38C 312=168220=4255.(2)以这12天的样本数据中用水量超标的频率作为概率,易知用水量超标的概率为31. X 的所有可能取值为0,1,2,3, 易知X ~B )31,3(,P (X =k )=C k 3kk-⋅⋅3)32()31(,k =0,1,2,3,则P (X =0)=827,P (X =1)=49,P (X =2)=29,P (X =3)=127.所以随机变量X 的分布列为X 0 1 2 3 P8274929127所以数学期望E (X )=3×13=1,D (X )=3×13×)311(-=23.2.(2020湖南师范大学附属中学高三上学期第二次月考)某种产品的质量以其质量指标值衡量,并依据质量指标值划分等级如下表:从某企业生产的这种产品中抽取200件,检测后得到如下的频率分布直方图:(1)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“一、二等品至少要占全部产品92%”的规定?(2)在样本中,按产品等级用分层抽样的方法抽取8件,再从这8件产品中随机抽取4件,求抽取的4件产品中,一、二、三等品都有的概率;(3)该企业为提高产品质量,开展了“质量提升月”活动,活动后再抽样检测,产品质量指标值X近似满足~(218,140)X N,则“质量提升月”活动后的质量指标值的均值比活动前大约提升了多少?【解析】(1)根据抽样调查数据,一、二等品所占比例的估计值为0.2000.3000.2600.0900.0250.875++++=,由于该估计值小于0.92,故不能认为该企业生产的这种产品符合“一、二等品至少要占全部产品92%”的规定.(2)由频率分布直方图知,一、二、三等品的频率分别为0.375、0.5、0.125,故在样本中用分层抽样方法抽取的8件产品中,一等品3件,二等品4件,三等品1件,再从这8件产品中随机抽取4件,一、二、三等品都有的情况有2种:①一等品2件,二等品1件,三等品1件;②一等品1件,二等品2件,三等品1件,故所求的概率211121 3413414837C C C C C CPC+==.(3)“质量提升月”活动前,该企业这种产品的质量指标值的均值约为1700.0251800.11900.22000.32100.262200.092300.025⨯+⨯+⨯+⨯+⨯+⨯+⨯200.4=“质量提升月”活动后,产品质量指标值X近似满足()~218,140X N,则()218E X=. 所以,“质量提升月”活动后的质量指标值的均值比活动前大约提升了17.6.1.(2019云南省高考模拟)一个口袋中装有大小形状完全相同的红色球1个、黄色球2个、蓝色球*()n n N ∈个,现进行从口袋中摸球的游戏:摸到红球得1分、摸到黄球得2分、摸到蓝球得3分.若从这个口袋中随机的摸出2个球,恰有一个是黄色球的概率是158. (1)求n 的值;(2)从口袋中随机摸出2个球,设ξ表示所摸2球的得分之和,求ξ的分布列和数学期望()E ξ.【解析】(1)由题意有158231211=++n n C C C ,即03522=--n n ,解得3=n ; (2)ξ取值为3,4,5,6.则1112262(3)15C C P C ξ===,11213222664(4)15C C C P C C ξ==+=, 1123262(5)5C C P C ξ===,23261(6)5C P C ξ===, ξ的分布列为:ξ 34 5 6P215 415 25 15故242114()34561515553E ξ=⨯+⨯+⨯+⨯=. 2.(2020福建省厦门外国语学校高三上学期12月月考)自由购是通过自助结算方式购物的一种形式.某大型超市为调查顾客使用自由购的情况,随机抽取了100人,统计结果整理如下:20以下 [20,30) [30,40) [40,50) [50,60) [60,70] 70以上 使用人数312 17 6 4 2 0 未使用人数 0314363(1)现随机抽取1名顾客,试估计该顾客年龄在[30,50)且未使用自由购的概率;(2)从被抽取的年龄在BF 使用自由购的顾客中,随机抽取3人进一步了解情况,用X 表示这3人中年龄在[50,60)的人数,求随机变量X 的分布列及数学期望;(3)为鼓励顾客使用自由购,该超市拟对使用自由购的顾客赠送1个环保购物袋.若某日该超市预计有5000人购物,试估计该超市当天至少应准备多少个环保购物袋. 【解析】(1)在随机抽取的100名顾客中, 年龄在[30,50)且未使用自由购的共有3+14=17人,所以,随机抽取1名顾客,估计该顾客年龄在[30,50)且未使用自由购的概率为17100P =. (2)X 所有的可能取值为1,2,3,()124236115C C P X C ===,()214236325C C P X C ===,()304236135C C P X C ===. 所以X 的分布列为X1 2 3P1553 15所以X 的数学期望为131()1232555E X =⨯+⨯+⨯=. (3)在随机抽取的100名顾客中,使用自由购的共有3121764244+++++=人, 所以该超市当天至少应准备环保购物袋的个数估计为4450002200100⨯=.3.(2020广东省惠州市高三第三次调研)为发挥体育核心素养的独特育人价值,越来越多的中学将某些体育项目纳入到学生的必修课程.惠州市某中学计划在高一年级开设游泳课程,为了解学生对游泳的兴趣,某数学研究学习小组随机从该校高一年级学生中抽取了100人进行调查.(1)已知在被抽取的学生中高一(1)班学生有6名,其中3名对游泳感兴趣,现在从这6名学生中随机抽取3人,求至少有2人对游泳感兴趣的概率;(2)该研究性学习小组在调查中发现,对游泳感兴趣的学生中有部分曾在市级或市级以上游泳比赛中获奖,具体获奖人数如下表所示.若从高一(8)班和高一(9)班获奖学生中随机各抽取2人进行跟踪调查,记选中的4人中市级以上游泳比赛获奖的人数为ξ,求随机变量ξ的分布列及数学期望.班级一)1(一)2( 一)3( 一)4( 一)5( 一)6( 一)7( 一(8) 一(9) 一(10)⋯市级2233443342⋯比赛获奖人数 市级以上比赛获奖人数22 1 0 23 3 2 1 2⋯【解析】(1)记事件i A {=从6名学生抽取的3人中恰好有i 人有兴趣,i 0=,1,2,3}; 则2A 与3A 互斥,故所求概率为()()()()2323P 2P A A P A P A =+=+至少人感兴趣 213033333366C C C C C C ⋅⋅=+101202==; (2)由题意知,随机变量ξ的所有可能取值有0,1,2,3;()22342255C C 9P ξ0C C 50⋅===⋅,()11221234342255C C C C C 12P ξ1C C 25⋅⋅+⋅===⋅,()22111243242255C C C C C 3P ξ2C C 10⋅+⋅⋅===⋅ ()21242255C C 1P ξ3C C 25⋅===⋅. 则ξ的分布列为:ξ0 1 2 3p950 1225 310 125数学期望为()9241526E ξ0123505050505=⨯+⨯+⨯+⨯=. 4.(2019·河北高考模拟)某次招聘分为笔试和面试两个环节,且只有笔试过关者方可进入面试环节,笔试与面试都过关才会被录用.笔试需考完全部三科,且至少有两科优秀才算笔试过关,面试需考完全部两科且两科均为优秀才算面试过关.假设某考生笔试三科每科优秀的概率均为23,面试两科每科优秀的概率均为34. (1)求该考生被录用的概率;(2)设该考生在此次招聘活动中考试的科目总数为ξ,求ξ的分布列与数学期望. 【解析】(1)该考生被录用,说明该考生笔试与面试均得以过关.所以=P 3223221335[()+()]=3334412C ⨯⨯⨯. (2)易得ξ的可能取值为3 ,5 ,所以(=3)=1P ξ-3223221207[()+()]=1-=3332727C ⨯, 或(=3)=P ξ31231127()+()=33327C ⨯ ,所以20(=5)=1-(=3)=27P P ξξ,或(=5)=P ξ322322120()+()=33327C ⨯ ,ξ的分布列为:ξ3 5P727 2027所以720121()=3+5=272727E ξ⨯⨯. 5.(2019江西省新八校联考)某种水果按照果径大小可分为四类:标准果、优质果、精品果、礼品果.某采购商从采购的一批水果中随机抽取100个,利用水果的等级分类标准得到的数据如下:等级 标准果 优质果 精品果 礼品果 个数10304020(1)若将频率是为概率,从这100个水果中有放回地随机抽取4个,求恰好有2个水果是礼品果的概率;(结果用分数表示)(2)用样本估计总体,果园老板提出两种购销方案给采购商参考, 方案1:不分类卖出,单价为20元/kg . 方案2:分类卖出,分类后的水果售价如下:等级标准果优质果 精品果 礼品果 售价(元/kg ) 16182224从采购单的角度考虑,应该采用哪种方案?(3)用分层抽样的方法从这100个水果中抽取10个,再从抽取的10个水果中随机抽取3个,X 表示抽取的是精品果的数量,求X 的分布列及数学期望()E X .【解析】(1)设从100个水果中随机抽取一个,抽到礼品果的事件为A ,则201()1005P A ==, 现有放回地随机抽取4个,设抽到礼品果的个数为X ,则1~(4,)5X B ,所以恰好抽到2个礼品果的概率为22244196(2)C ()()55625P X ===, (2)设方案2的单价为ξ,则单价的期望值为134216548848()1618222420.61010101010E ξ+++=⨯+⨯+⨯+⨯==, 因为()20E ξ>,所以从采购商的角度考虑,应该采用第一种方案. (3)用分层抽样的方法从100个水果中抽取10个,则其中精品果4个,非精品果6个, 现从中抽取3个,则精品果的数量X 服从超几何分布,所有可能的取值为0,1,2,3,则36310C 1(0)C 6P X ===;2164310C C 1(1)C 2P X ===; 1264310C C 3(2)C 10P X ===;34310C 1(3)C 30P X ===, 所以X 的分布列如下:X0 1 2 3P1612 310 130所以11316()01236210305E X =⨯+⨯+⨯+⨯=.6.(2020山西省晋城市高三第一次模拟)“绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新能源汽车产业的迅速发展.下表是近几年我国某地区新能源乘用车的年销售量与年份的统计表:年份2014 20152016 2017 2018 销量(万台) 810132524某机构调查了该地区30位购车车主的性别与购车种类情况,得到的部分数据如下表所示:购置传统燃油车购置新能源车总计男性车主 6 24 女性车主 2 总计30(1)求新能源乘用车的销量y 关于年份x 的线性相关系数r ,并判断y 与x 是否线性相关; (2)请将上述22⨯列联表补充完整,并判断是否有90%的把握认为购车车主是否购置新能源乘用车与性别有关;(3)若以这30名购车车主中购置新能源乘用车的车主性别比例作为该地区购置新能源乘用车的车主性别比例,从该地区购置新能源乘用车的车主中随机选取50人,记选到女性车主的人数为X,求X 的数学期望与方差.参考公式:12211()()()()niii n niii i x x y y r x x y y ===--=--∑∑∑,22()()()()()n ad bc k a b c d a c b d -=++++,其中n a b c d =+++.63525≈,若0.9r >,则可判断y 与x 线性相关. 附表:20()P K k ≥0.10 0.05 0.025 0.010 0.001k2.7063.841 5.024 6.635 10.828【解析】(1)依题意,2014201520162017201820165x ++++==,810132524165y ++++==,故51()()(2)(8)(1)(6)192847iii x x y y =--=-⨯-+-⨯-+⨯+⨯=∑,521()411410ii x x =-=+++=∑,521()643698164254i i y y =-=++++=∑,则51552211()()47470.940.9102542635()()iii iii i x x y y r x x y y ===--===≈>⨯--∑∑∑故y 与x 线性相关.(2)依题意,完善表格如下:购置传统燃油车 购置新能源车 总计 男性车主 18 6 24 女性车主 2 4 6 总计2010302230(18426)15 3.75 2.70620102464K ⨯⨯-⨯===>⨯⨯⨯故有90%的把握认为购车车主是否购置新能源乘用车与性别有关. (3)依题意,该地区购置新能源车的车主中女性车主的概率为42105=, 则2(50,)5X B :, 所以2()50205E X =⨯=,22()50(1)1255D X =⨯⨯-=. 7.(2020云南省昆明市第一中学高三一轮检测)某城市为鼓励人们乘坐地铁出行,地铁公司决定按照乘客经过地铁站的数量实施分段优惠政策,不超过30站的地铁票价如下表:乘坐站数x 100≤<x2010≤<x2030x <≤票价(元)369现有甲、乙两位乘客同时从起点乘坐同一辆地铁,已知他们乘坐地铁都不超过30站,甲、乙乘坐不超过10站的概率分别为14,13;甲、乙乘坐超过20站的概率分别为12,13. (1)求甲、乙两人付费相同的概率;(2)设甲、乙两人所付费用之和为随机变量X ,求X 的分布列和数学期望. 【解析】(1)由题意知甲乘坐超过10站且不超过20站的概率为1111424--=,乙乘坐超过10站且不超过20站的概率为1111333--=, 设“甲、乙两人付费相同”为事件A ,则()11114343P A =⨯+⨯ 111233+⨯=,所以甲、乙两人付费相同的概率是13.(2)由题意可知X 的所有可能取值为:6,9,12,15,18.()11164312P X ==⨯=,()11943P X ==⨯ 111436+⨯=,()11112432P X ==⨯+ 11113433⨯+⨯=,()11112432P X ==⨯+ 1134⨯=,()11118236P X ==⨯=.因此X 的分布列如下:X6912 1518P11216131416所以X 的数学期望()1169126E X =⨯+⨯ 11121534+⨯+⨯ 1511864+⨯=. 8.(2020东北三省三校联合模拟)“移动支付、高铁、网购、共享单车”被称为中国的“新四大发明”.为了帮助50岁以上的中老年人更快地适应“移动支付”,某机构通过网络组织50岁以上的中老年人学习移动支付相关知识.学习结束后,每人都进行限时答卷,得分都在[]50,100内.在这些答卷(有大量答卷)中,随机抽出200份,统计得分绘出频率分布直方图如图.(1)求出图中a 的值,并求样本中,答卷成绩在[)80,90上的人数;(2)以样本的频率为概率,从参加这次答卷的人群中,随机抽取4名,记成绩在80分以上(含80分)的人数为X ,求X 的分布列和期望.【解析】(1)依题意,()2 376 2101,a a a a a ⨯++++=故0.005a =, 故成绩在[)80,90上的频率为600.3,a = 答卷成绩在[)80,90上的人数为2000.360; ⨯=(2)由样本的频率分布直方图知成绩在80分以上(含80分)的频率为2805a =, 依题意,24,5X B ⎛⎫- ⎪⎝⎭,故()04042381055625P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭,()31423216155625P X C ⎛⎫⎛⎫=== ⎪⎪⎝⎭⎝⎭, ()()22423442321623962,35562555625P X C P X C ⎛⎫⎛⎫⎛⎫⎛⎫====== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭, ()4442316455625P X C α⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, 所以X 的分布列为X0 1 2 34P816252166252166259662516625所以X 的数学期望为()28455E X =⨯=.。
2020年高考数学试题分类汇编 专题概率 理 精品

2020年高考试题数学(理科)概率一、选择题:1.(2020年高考浙江卷理科9)有5本不同的书,其中语文书2本,数学书2本,物理书1本.若将其随机的并排摆放到书架的同一层上,则同一科目的书都不相邻的概率(A)15(B)25(C)35(D )45【答案】B【解析】由古典概型的概率公式得522155222233232222=+-=AAAAAAAP.2. (2020年高考辽宁卷理科5)从1,2,3,4,5中任取2各不同的数,事件A=“取到的2个数之和为偶数”,事件B=“取到的2个数均为偶数”,则P(B︱A)=(A)18(B)14(C)25(D)123. (2020年高考全国新课标卷理科4)有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为(A)13(B)12(C)23(D)34解析:因为甲乙两位同学参加同一个小组有3种方法,两位同学个参加一个小组共有933=⨯种方法;所以,甲乙两位同学参加同一个小组的概率为3193=点评:本题考查排列组合、概率的概念及其运算和分析问题、解决问题的能力。
【解析】D.由题得甲队获得冠军有两种情况,第一局胜或第一局输第二局胜,所以甲队获得冠军的概率.43212121=⨯+=P所以选D.5.(2020年高考湖北卷理科7)如图,用K、A1、A2三类不同的元件连成一个系统.当K正常工作且A1、A2至少有一个正常工作时,系统正常工作.已知K、A1、A2正常工作的概率依次为0.9、0.8、0.8,则系统正常工作的概率为A.0.960B.0.864C.0.720D.0.576答案:B解析:系统正常工作概率为120.90.8(10.8)0.90.80.80.864C⨯⨯⨯-+⨯⨯=,所以选B. 6.(2020年高考陕西卷理科10)甲乙两人一起去“2020西安世园会”,他们约定,各自独立地从1到6号景点中任选4个进行游览,每个景点参观1小时,则最后一小时他们同在一个景点的概率是(A)136(B)19(C)536(D)16【答案】D【解析】:各自独立地从1到6号景点中任选4个进行游览有1111111166554433C C C C C C C C种,且等可能,最后一小时他们同在一个景点有11111116554433C C C C C C C种,则最后一小时他们同在一个景点的概率是11111116554433111111116655443316C C C C C C CpC C C C C C C C==,故选D7. (2020年高考四川卷理科12)在集合{}1,2,3,4,5中任取一个偶数a和一个奇数b构成以原点为起点的向量a=(a,b).从所有得到的以原点为起点的向量中任取两个向量为邻边作平行四边形.记所有作成的平行四边形的个数为n,其中面积不超过...4的平行四边形的个数为m,则mn=( )(A)415(B)13(C)25(D)23答案:B解析:基本事件:26(2,1),(2,3),(2,5),(4,1),(4,5),(4,3)23515n C==⨯=从选取个,.其中面积为2的平行四边形的个数(2,3)(4,5);(2,1)(4,3);(2,1)(4,1);其中面积为4的平行四边形的为(2,3)(2,5);(2,1)(2,3); m=3+2=5故51153mn==.8.(2020年高考福建卷理科4)如图,矩形ABCD 中,点E 为边CD 的中点,若在矩形ABCD内部随机取一个点Q ,则点Q 取自△ABE 内部的概率等于 A .14 B .13C .12D .23【答案】C 二、填空题:1.(2020年高考浙江卷理科15)某毕业生参加人才招聘会,分别向甲、乙、丙三个公司投递了个人简历,假定该毕业生得到甲公司面试的概率为23,得到乙、丙两公司面试的概率为p ,且三个公司是否让其面试是相互独立的。
2020高考数学解答题核心素养题型《专题11 概率与统计综合问题》+答题指导)(解析版)

专题11 概率与统计综合问题【题型解读】几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题考查,求解的关键在于找准测度(面积,体积或长度);相互独立事件、互斥事件常作为解答题的一问考查,也是进一步求分布列、期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式.【例1】 (2018·天津卷)已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16,现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.(1)应从甲、乙、丙三个部门的员工中分别抽取多少人?(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查. ①用X 表示抽取的3人中睡眠不足的员工人数,求随机变量X 的分布列与数学期望;②设A 为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A 发生的概率. 【答案】见解析【解析】(1)由题意得,甲、乙、丙三个部门的员工人数之比为3∶2∶2.由于采用分层抽样的方法从中抽取7人,因此应从甲、乙、丙三个部门的员工中分别抽取3人、2人、2人. (2)①随机变量X 的所有可能取值为0,1,2,3. P (X =k )=C k 4C 3-k3C 37(k =0,1,2,3).所以随机变量X 的分布列为随机变量X 的数学期望E (X )=0×35+1×35+2×35+3×35=7.②设事件B 为“抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人”;事件C 为“抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人”,则A =B ∪C ,且B 与C 互斥. 由①知,P (B )=P (X =2),P (C )=P (X =1), 故P (A )=P (B ∪C )=P (X =2)+P (X =1)=67.所以事件A 发生的概率为67.【素养解读】本题考查分层抽样、离散型随机变量的分布列与数学期望、互斥事件的概率加法公式,考查分析问题和解决问题的能力,体现了数学运算和数据分析等核心素养.试题难度:中.【突破训练1】 (2017·天津卷)从甲地到乙地要经过3个十字路口,设各路口信号灯工作相互独立,且在各路口遇到红灯的概率分别为12,13,14.(1)记X 表示一辆车从甲地到乙地遇到红灯的个数,求随机变量X 的分布列和数学期望; (2)若有2辆车独立地从甲地到乙地,求这2辆车共遇到1个红灯的概率. 【答案】见解析【解析】(1)随机变量X 的所有可能取值为0,1,2,3.P (X =0)=⎝⎛⎭⎪⎫1-12×⎝⎛⎭⎪⎫1-13×⎝⎛⎭⎪⎫1-14=14,P (X =1)=12×⎝⎛⎭⎪⎫1-13×⎝⎛⎭⎪⎫1-14+⎝ ⎛⎭⎪⎫1-12×13×⎝⎛⎭⎪⎫1-14+⎝⎛⎭⎪⎫1-12×⎝⎛⎭⎪⎫1-13×14=1124,P (X =2)=⎝⎛⎭⎪⎫1-12×13×14+12×⎝ ⎛⎭⎪⎫1-13×14+12×13×⎝ ⎛⎭⎪⎫1-14=14,P (X =3)=12×13×14=124.所以随机变量X 的分布列为所以E (X )=0×4+1×24+2×4+3×24=12.(2)设Y 表示第一辆车遇到红灯的个数,Z 表示第二辆车遇到红灯的个数,则所求事件的概率为P (Y +Z =1)=P (Y =0,Z =1)+P (Y =1,Z =0)=P (Y =0)P (Z =1)+P (Y =1)P (Z =0) =14×1124+1124×14=1148. 所以这2辆车共遇到了1个红灯的概率为1148.▶▶题型二 离散型随机变量的分布列、均值与方差离散型随机变量及其分布列、均值与方差及应用是数学高考的一大热点,常有解答题的考查,属于中档题.复习中应强化应用类习题的理解与掌握,弄清随机变量的所有取值,它是正确求随机变量分布列和求均值与方差的关键,对概率模型的确定与转化是解题的基础,准确计算是解题的核心,在备考中应强化解答题的规范性训练.【例2】 (2018·北京卷)电影公司随机收集了电影的有关数据,经分类整理得到下表:假设所有电影是否获得好评相互独立.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率; (2)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(3)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等.用“ξk =1”表示第k 类电影得到人们喜欢,“ξk =0”表示第k 类电影没有得到人们喜欢(k =1,2,3,4,5,6).写出方差Dξ1,Dξ2,Dξ3,Dξ4,Dξ5,Dξ6的大小关系.【答案】见解析【解析】 (1)设“从电影公司收集的电影中随机选取1部,这部电影是获得好评的第四类电影”为事件A . 因为第四类电影中获得好评的电影有200×0.25=50(部), 所以P (A )=50140+50+300+200+800+510=502 000=0.025.(2)设“从第四类电影和第五类电影中各随机选取1部,恰有1部获得好评”为事件B ,则P (B )=0.25×(1-0.2)+(1-0.25)×0.2=0.35.(3)由题意可知,定义随机变量如下:ξk =⎩⎪⎨⎪⎧0,第k 类电影没有得到人们喜欢,1,第k 类电影得到人们喜欢,则ξk 显然服从两点分布,故Dξ1=0.4×(1-0.4)=0.24,Dξ2=0.2×(1-0.2)=0.16, Dξ3=0.15×(1-0.15)=0.127 5,Dξ4=0.25×(1-0.25)=0.187 5, Dξ5=0.2×(1-0.2)=0.16, Dξ6=0.1×(1-0.1)=0.09.综上所述,Dξ1>Dξ4>Dξ2=Dξ5>Dξ3>Dξ6.【素养解读】本题考查统计中的概率计算、随机变量的方差计算,考查运算求解能力,体现了数据分析、数学运算等核心素养.试题难度:中.【突破训练2】 (2017·全国卷Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:(1)求六月份这种酸奶一天的需求量X (单位:瓶)的分布列.(2)设六月份一天销售这种酸奶的利润为Y (单位:元).当六月份这种酸奶一天的进货量n (单位:瓶)为多少时,Y 的数学期望达到最大值? 【答案】见解析【解析】(1)由题意知,X 所有可能取值为200,300,500, 由表格数据知P (X =200)=2+1690=0.2,P (X =300)=3690=0.4, P (X =500)=25+7+490=0.4, 因此X 的分布列为当300≤n ≤500时,若最高气温不低于25,Y =6n -4n =2n ; 若最高气温位于区间[20,25),则Y=6×300+2(n-300)-4n=1 200-2n;若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n,因此E(Y)=2n×0.4+(1 200-2n)×0.4+(800-2n)×0.2=640-0.4n.当200≤n<300时,若最高气温不低于20,则Y=6n-4n=2n;若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n.因此E(Y)=2n×(0.4+0.4)+(800-2n)×0.2=160+1.2n.所以当n=300时,Y的数学期望达到最大值,最大值为520元.▶▶题型三概率与统计的综合应用概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及数学均值与方差的运算.【例3】(2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下.(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面的列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;附:K 2=(a +b)(c +d)(a +c)(b +d).【答案】见解析【解析】(1)记B 表示事件“旧养殖法的箱产量低于50 kg”,C 表示事件“新养殖法的箱产量不低于50 kg”. 由题意知P (A )=P (BC )=P (B )P (C ). 旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62, 故P (B )的估计值为0.62.新养殖法的箱产量不低于50 kg 的频率为 (0.068+0.046+0.010+0.008)×5=0.66, 故P (C )的估计值为0.66.因此,事件A 的概率估计值为0.62×0.66=0.409 2. (2)根据箱产量的频率分布直方图得如下列联表.K 2=100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg 的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,箱产量低于55 kg 的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5, 故新养殖法箱产量的中位数的估计值为 50+0.5-0.340.068≈52.35(kg).【素养解读】本题考查频率分布直方图、独立性检验、中位数、相互独立事件的概率,考查学生的阅读理解能力、数据处理能力.主要体现了数据分析,数学运算等核心素养.【突破训练3】 (2017·北京卷)为了研究一种新药的疗效,选100名患者随机分成两组,每组各50名,一组服药,另一组不服药.一段时间后,记录了两组患者的生理指标x 和y 的数据,并制成下图,其中“*”表示服药者,“+”表示未服药者.(1)从服药的50名患者中随机选出一人,求此人指标y 的值小于60的概率;(2)从图中A ,B ,C ,D 四人中随机选出两人,记ξ为选出的两人中指标x 的值大于1.7的人数,求ξ的分布列和数学期望E (ξ);(3)试判断这100名患者中服药者指标y 数据的方差与未服药者指标y 数据的方差的大小(只需写出结论). 【答案】见解析【解析】(1)由题图知,在服药的50名患者中,指标y 的值小于60的有15人. 所以从服药的50名患者中随机选出一人,此人指标y 的值小于60的概率为1550=0.3.(2)由题图知,A ,B ,C ,D 四人中,指标x 的值大于1.7的有2人:A 和C . 所以ξ的所有可能取值为0,1,2.P (ξ=0)=C 22C 24=16,P (ξ=1)=C 12C 12C 24=23,P (ξ=2)=C 22C 24=16.所以ξ的分布列为故ξ的期望E (ξ)=0×6+1×3+2×6=1.(3)在这100名患者中,服药者指标y 数据的方差大于未服药者指标y 数据方差. 题型四 统计与统计案例能根据给出的线性回归方程系数公式求线性回归方程,了解独立性检验的基本思想、方法,在选择或填空题中常涉及频率分布直方图、茎叶图及样本的数字特征(如平均数、方差等)的考查,解答题中也有所考查.【例4】 (2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^=-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^=99+17.5t . (1)分析利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?请说明理由. 【答案】见解析【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y ^=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施资源额的预测值为y ^=99+17.5×9=256.5(亿元). (2)利用模型②得到的预测值更可靠.理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y =-30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势,2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y ^=99+17.5t 可以较好地描述2010年的数据建立基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠. (以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.)【素养解读】本题以统计图为背景,考查线性回归方程,考查运算求解能力和数形结合思想,体现了数学运算的核心素养.【突破训练4】 下图是我国2011年至2017年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量. 附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17(y i -y)2=0.55,7≈2.646.参考公式:相关系数r =∑i =1n(t i -t)(y i -y )∑i =1n(t i -t )2∑i =1n(y i -y)2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为b ^=∑i =1n(t i -t)(y i -y )∑i =1n(t i -t )2,a ^=y -b ^t .【答案】见解析【解析】(1)由折线图中数据和附注中参考数据得t =4,∑i =17(t i -t )2=28,∑i =17(y i -y -)2=0.55,∑i =17(t i -t -)(y i -y -)=∑i =17t i y i -t -∑i =17y i =40.17-4×9.32=2.89,r ≈2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y -=9.327≈1.331及(1)得b ^=∑i =17(t i -t -)(y i -y -)∑i =17(t i -t -)2=2.8928≈0.103,a ^=y --b ^t -=1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t .将2019年对应的t =9代入回归方程,得y ^=0.92+0.10×9=1.82.所以预测2019年我国生活垃圾无害化处理量约为1.82亿吨.。
【高考冲刺】2020年高考数学(理数) 概率与统计 大题(含答案解析)

【高考复习】2020年高考数学(理数) 概率与统计大题1.在中国,不仅是购物,而且从共享单车到医院挂号再到公共缴费,日常生活中几乎全部领域都支持手机下单和支付.出门不带现金的人数正在迅速增加.中国人民大学和法国调查公司益普索(Ipsos)合作,调查了腾讯服务的6 000名用户,从中随机抽取了60名,统计他们出门随身携带的现金(单位:元)如茎叶图所示,规定:随身携带的现金在100元以下的为“淡定族”,其他为“非淡定族”.(1)根据上述样本数据,列出2×2列联表,判断是否有75%的把握认为“淡定族”与“性别”有关?(2)用样本估计总体,若从腾讯服务的用户中随机抽取3人,设这3人中“淡定族”的人数为随机变量ξ,求随机变量ξ的概率分布列及数学期望.参考公式:K2=n ad-bc2a+b c+d a+c b+d,其中n=a+b+c+d.参考数据:2.第四届世界互联网大会在浙江乌镇隆重召开,人工智能技术深受全世界人民的关注,不同年龄段的人群关注人工智能技术应用与发展的侧重点有明显的不同,某中等发达城市的市场咨询与投资民调机构在该市对市民关注人工智能技术应用与发展的侧重方向进行调查,随机抽取1 000名市民,将他们的年龄分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),[70,80],并绘制了如图所示的频率分布直方图.(1)求这 1 000名市民年龄的平均数和中位数(同一组中的数据用该组区间的中点值作代表);(2)调查发现年龄在[20,40)的市民侧重关注人工智能技术在学习与工作方面的应用与发展,其中关注智能办公的共有100人,将样本的频率视为总体的频率,从该市年龄在[20,40)的市民中随机抽取300人,请估计这300人中关注智能办公的人数;(3)用样本的频率代替概率,现从该市随机抽取20名市民调查关注人工智能技术在养老服务方面的应用与发展的情况,其中有k名市民的年龄在[60,80]的概率为P(X=k),其中k=0,1,2,…,20,当P(X=k)最大时,求k的值.3.某校高三年级有500名学生,一次考试的英语成绩服从正态分布N(100,17.52),数学成绩的频率分布直方图如下:(1)如果成绩高于135分的为特别优秀,则本次考试英语、数学成绩特别优秀的学生大约各多少人?(2)试问本次考试英语和数学的平均成绩哪个较高,并说明理由;(3)如果英语和数学两科成绩都特别优秀的共有6人,从(1)中的这些学生中随机抽取3人,设3人中两科成绩都特别优秀的有ξ人,求ξ的分布列和数学期望.参考公式及数据:若X~N(μ,σ2),则P(μ-σ<X≤μ+σ)=0.68,P(μ-2σ<X≤μ+2σ)=0.96,P(μ-3σ<X≤μ+3σ)=0.99.4.已知具有相关关系的两个变量x ,y 的几组数据如下表所示:(1)请根据上表数据在网格纸中绘制散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^,并估计当x=20时y 的值;(3)将表格中的数据看作5个点的坐标,则从这5个点中随机抽取3个点,记落在直线2x-y-4=0右下方的点的个数为ξ,求ξ的分布列以及期望.参考公式:b ^=∑i=1nx i y i -n x-y -∑i =1n x 2i -n x -2,a ^=y --b ^x -.5.某知名品牌汽车深受消费者喜爱,但价格昂贵.某汽车经销商推出A,B,C三种分期付款方式销售该品牌汽车,并对近期100位采用上述分期付款方式付款的客户进行统计分析,得到柱状图如图所示.已知从A,B,C三种分期付款销售中,该经销商每销售此品牌汽车1辆所获得的利润分别是1万元、2万元、3万元.现甲、乙两人从该汽车经销商处,采用上述分期付款方式各购买此品牌汽车一辆.以这100位客户所采用的分期付款方式的频率估计1位客户采用相应分期付款方式的概率.(1)求甲、乙两人采用不同分期付款方式的概率;(2)记X(单位:万元)为该汽车经销商从甲、乙两人购车中所获得的利润,求X的分布列与期望.6.某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(万元)和销售量y(万元)的数据如下:(1)若用线性回归模型拟合y 与x 的关系,求出y 关于x 的线性回归方程;(2)若用y=c +d x 模型拟合y 与x 的关系,可得回归方程y ^=1.63+0.99x ,经计算线性回归模型和该模型的R 2分别约为0.75和0.88,请用R 2说明选择哪个回归模型更好;(3)已知利润z 与x ,y 的关系为z=200y-x.根据(2)的结果回答下列问题:①广告费x=20时,销售量及利润的预报值是多少?②广告费x 为何值时,利润的预报值最大?(精确到0.01)参考公式:回归直线y ^=a ^+b ^x 的斜率和截距的最小二乘估计分别为b ^=∑i=1n x i y i -n x-y -∑i =1n x 2i -n x -2,a ^=y --b ^x -.参考数据:5≈2.24.7.通过随机询问100名性别不同的大学生是否爱好某项运动,得到如下2×2列联表:(1)将题中的2×2列联表补充完整;(2)能否有99%的把握认为是否爱好该项运动与性别有关?请说明理由;(3)如果按性别进行分层抽样,从以上爱好该项运动的大学生中抽取6人组建“运动达人社”,现从“运动达人社”中选派3人参加某项校际挑战赛,记选出3人中的女大学生人数为X,求X的分布列和数学期望.附:K2=n ad-bc2a+b c+d a+c b+d.8.甲、乙两家外卖公司,其送餐员的日工资方案如下:甲公司,底薪80元,每单送餐员抽成4元;乙公司,无底薪,40单以内(含40单)的部分送餐员每单抽成6元,超出40单的部分送餐员每单抽成7元.假设同一公司的送餐员一天的送餐单数相同,现从这两家公司各随机选取一名送餐员,并分别记录其50天的送餐单数,得到如下频数表:(1)现从记录甲公司的50天送餐单数中随机抽取3天的送餐单数,求这3天送餐单数都不小于40的概率;(2)若将频率视为概率,回答下列两个问题:①记乙公司送餐员日工资为X(单位:元),求X的分布列和数学期望E(X);②小王打算到甲、乙两家公司中的一家应聘送餐员,如果仅从日工资的角度考虑,请利用所学的统计学知识为小王作出选择,并说明理由.9.近年来“双十一”已成为中国电子商务行业的年度盛事,并且逐渐影响到国际电子商务行业.某商家为了准备2018年“双十一”的广告策略,随机调查了1 000名客户在2017年“双十一”前后10天内网购所花时间T(单位:时),并将调查结果绘制成如图所示的频率分布直方图.由频率分布直方图可以认为,这10天网购所花的时间T近似服从N(μ,σ2),其中μ用样本平均值代替,σ2=0.24.(1)计算μ,并利用该正态分布求P(1.51<T<2.49).(2)利用由样本统计获得的正态分布估计整体,将这10天网购所花时间在(2,2.98)小时内的人定义为目标客户,对目标客户发送广告提醒.现若随机抽取10 000名客户,记X为这10 000人中目标客户的人数.(ⅰ)求EX;(ⅱ)问:10 000人中目标客户的人数X为何值的概率最大?附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-σ<Z<μ+σ)=0.682 6,P(μ-2σ<Z<μ+2σ)=0.954 4,P(μ-3σ<Z<μ+3σ)=0.997 4.0.24≈0.49.10.某学校为了丰富学生的课余生活,以班级为单位组织学生开展古诗词背诵比赛,随机抽取一首,背诵正确加10分,背诵错误减10分,且背诵结果只有“正确”和“错误”两种.其中某班级学生背诵正确的概率p=23,记该班级完成n 首背诵后的总得分为S n . (1)求S 6=20且S i ≥0(i =1,2,3)的概率;(2)记ξ=|S 5|,求ξ的分布列及数学期望.答案解析1.解:(1)依题意可得2×2列联表如下:K 2=60×10×12-30×8218×42×40×20≈1.429>1.323,故有75%的把握认为“淡定族”与“性别”有关.(2)用样本估计总体,用户中为“淡定族”的概率为1860=310,ξ的可能取值为0,1,2,3,由题意,得到ξ~B ⎝ ⎛⎭⎪⎫3,310, P(ξ=k)=C k 3⎝ ⎛⎭⎪⎫310k ⎝ ⎛⎭⎪⎫7103-k,k=0,1,2,3,随机变量ξ的分布列为故随机变量ξ的数学期望E(ξ)=0×3431 000+1×4411 000+2×1891 000+3×271 000=9001 000=910.2.解:(1)由频率分布直方图可知,抽取的1 000名市民年龄的平均数 x -=25×0.05+35×0.1+45×0.2+55×0.3+65×0.25+75×0.1=54(岁). 设1 000名市民年龄的中位数为x ,则0.05+0.1+0.2+0.03×(x -50)=0.5,解得x=55, 所以这1 000名市民年龄的平均数为54,中位数为55.(2)由频率分布直方图可知,这1 000名市民中年龄在[20,40)的市民共有 (0.05+0.10)×1 000=150人,所以关注智能办公的频率为100150=23,则从该市年龄在[20,40)的市民中随机抽取300人,这300人中关注智能办公的人数为300×23=200.故估计这300人中关注智能办公的人数为200.(3)设在抽取的20名市民中,年龄在[60,80]的人数为X ,X 服从二项分布, 由频率分布直方图可知,年龄在[60,80]的频率为(0.025+0.010)×10=0.35,所以X ~B(20,0.35),所以P(X=k)=C k 200.35k (1-0.35)20-k,k=0,1,2, (20)设t=P X =k P X =k -1=C k 200.35k 0.6520-kC k -1200.35k -10.6521-k =721-k 13k ,k=1,2,…,20. 若t>1,则k<7.35,P(X=k-1)<P(X=k); 若t<1,则k>7.35,P(X=k-1)>P(X=k). 所以当k=7时,P(X=k)最大, 即当P(X=k)最大时,k 的值为7.3.解:(1)因为英语成绩服从正态分布N(100,17.52),所以英语成绩特别优秀的概率P 1=P(X≥135)=(1-0.96)×12=0.02,由频率估计概率,得数学成绩特别优秀的概率P 2=0.001 6×20×34=0.024,所以英语成绩特别优秀的学生大约有500×0.02=10(人), 数学成绩特别优秀的学生大约有500×0.024=12(人). (2)本次考试英语的平均成绩为100分,数学的平均成绩为60×0.16+80×0.168+100×0.48+120×0.16+140×0.032=94.72(分),因为94.72<100,所以本次考试英语的平均成绩较高.(3)英语和数学成绩都特别优秀的有6人,则单科成绩特别优秀的有10人, ξ可取的值有0,1,2,3,所以P(ξ=0)=C 310C 316=314,P(ξ=1)=C 210C 16C 316=2756,P(ξ=2)=C 110C 26C 316=1556,P(ξ=3)=C 36C 316=128,故ξ的分布列为E(ξ)=0×314+1×2756+2×1556+3×128=98.4.解:(1)散点图如图所示:(2)依题意,x -=15×(2+4+6+8+10)=6,y -=15×(3+6+7+10+12)=7.6,∑i =15x 2i=4+16+36+64+100=220,∑i =15x i y i =6+24+42+80+120=272,b ^=∑i=15x i y i -5x-y-∑i =15x 2i -5x -2=272-5×6×7.6220-5×62=4440=1.1,∴a ^=7.6-1.1×6=1, ∴线性回归方程为y ^=1.1x +1,故当x=20时,y=23.(3)可以判断,落在直线2x-y-4=0右下方的点满足2x-y-4>0,故符合条件的点的坐标为(6,7),(8,10),(10,12),故ξ的所有可能取值为1,2,3,P(ξ=1)=C22C13C35=310,P(ξ=2)=C12C23C35=610=35,P(ξ=3)=C33C35=110,故ξ的分布列为故E(ξ)=1×310+2×35+3×110=1810=95.5.解:(1)设“采用A种分期付款方式购车”为事件A,“采用B种分期付款方式购车”为事件B,“采用C种分期付款方式购车”为事件C,由柱状图得,P(A)=35100=0.35,P(B)=45100=0.45,P(C)=20100=0.2,∴甲、乙两人采用不同分期付款方式的概率P=1-(P(A)·P(A)+P(B)·P(B)+P(C)·P(C))=0.635.(2)由题意知,X的所有可能取值为2,3,4,5,6,P(X=2)=P(A)P(A)=0.35×0.35=0.122 5,P(X=3)=P(A)P(B)+P(B)P(A)=0.35×0.45+0.45×0.35=0.315,P(X=4)=P(A)P(C)+P(B)P(B)+P(C)P(A)=0.35×0.2+0.45×0.45+0.2×0.35=0.342 5,P(X=5)=P(B)P(C)+P(C)P(B)=0.45×0.2+0.2×0.45=0.18,P(X=6)=P(C)P(C)=0.2×0.2=0.04.∴X的分布列为E(X)=0.122 5×2+0.315×3+0.342 5×4+0.18×5+0.04×6=3.7.6.解:(1)∵x-=8,y-=4.2,∑i=17x i y i=279.4,∑i=17x2i=708,∴b^=∑i=17x i y i-7x-y-∑i=17x2i-7x-2=279.4-7×8×4.2708-7×82=0.17,a^=y--b^x-=4.2-0.17×8=2.84,∴y关于x的线性回归方程为y^=0.17x+2.84.(2)∵0.75<0.88且R2越大,反映残差平方和越小,模型的拟合效果越好,∴选用y^=1.63+0.99x更好.(3)由(2)知,①当x=20时,销售量的预报值y^=1.63+0.9920≈6.07(万台),利润的预报值z=200×6.07-20≈1 194(万元).②z=200(1.63+0.99x)-x=-x+198x+326=-(x)2+198x+326=-(x-99)2+10 127,∴当x=99,即x=9 801时,利润的预报值最大,故广告费为9 801万元时,利润的预报值最大.7.解:(1)题中的2×2列联表补充如下:(2)K 2=100×40×25-20×15255×45×60×40≈8.25>6.635,所以有99%的把握认为是否爱好该项运动与性别有关.(3)由题意,抽取6人中包括男生4名,女生2名,X 的取值为0,1,2,则P(X=0)=C 34C 36=15,P(X=1)=C 24C 12C 36=35,P(X=2)=C 14C 22C 36=15,故X 的分布列为E(X)=0×15+1×35+2×15=1.8.解:(1)记抽取的3天送餐单数都不小于40为事件M ,则P(M)=C 325C 350=23196.(2)①设乙公司送餐员的送餐单数为a , 当a=38时,X=38×6=228, 当a=39时,X=39×6=234, 当a=40时,X=40×6=240,当a=41时,X=40×6+1×7=247, 当a=42时,X=40×6+2×7=254.所以X 的所有可能取值为228,234,240,247,254. 故X 的分布列为所以E(X)=228×110+234×15+240×15+247×25+254×110=241.8.②依题意,甲公司送餐员的日平均送餐单数为38×0.2+39×0.3+40×0.2+41×0.2+42×0.1=39.7,所以甲公司送餐员的日平均工资为80+4×39.7=238.8元. 由①得乙公司送餐员的日平均工资为241.8元. 因为238.8<241.8,所以推荐小王去乙公司应聘. 9.解:(1)μ=0.4×(0.050×0.8+0.225×1.2+0.550×1.6+0.825×2.0+0.600×2.4+0.200×2.8+0.050×3.2)=2,从而T 服从N(2,0.24),又σ=0.24≈0.49,从而P(1.51<T <2.49)=P(μ-σ<T <μ+σ)=0.682 6. (2)(ⅰ)任意抽取1名客户,该客户是目标客户的概率为P(2<T <2.98)=P(μ<T <μ+2σ) =12P(μ-2σ<T <μ+2σ)=12×0.954 4=0.477 2. 由题意知X 服从B(10 000,0.477 2),所以EX=10 000×0.477 2=4 772. (ⅱ)X 服从B(10 000,0.477 2),P(X=k)=C k 10 0000.477 2k (1-0.477 2)10 000-k =C k 10 0000.477 2k ·0.522 810 000-k(k=0,1,2,…,10 000). 设当X=k(k≥1,k ∈N)时概率最大,则有⎩⎪⎨⎪⎧P X =k >P X =k +1,PX =k >P X =k -1,得⎩⎪⎨⎪⎧0.522 8C k 10 000>0.477 2C k +110 000,0.477 2C k 10 000>0.522 8C k -110 000,解得k=4 772.故10 000人中目标客户的人数为4 772的概率最大. 10.解:(1)当S 6=20时,即背诵6首后,正确的有4首,错误的有2首.由S i ≥0(i =1,2,3)可知,若第一首和第二首背诵正确,则其余4首可任意背诵正确2首; 若第一首背诵正确,第二首背诵错误,第三首背诵正确,则其余3首可任意背诵正确2首.则所求的概率P=⎝ ⎛⎭⎪⎫232×C 24⎝ ⎛⎭⎪⎫232×⎝ ⎛⎭⎪⎫132+23×13×23×C 23⎝ ⎛⎭⎪⎫232×13=1681.(2)由题意知ξ=|S 5|的所有可能的取值为10,30,50,又p=23,∴P(ξ=10)=C 35⎝ ⎛⎭⎪⎫233×⎝ ⎛⎭⎪⎫132+C 25⎝ ⎛⎭⎪⎫232×⎝ ⎛⎭⎪⎫133=4081,P(ξ=30)=C 45⎝ ⎛⎭⎪⎫234×⎝ ⎛⎭⎪⎫131+C 15⎝ ⎛⎭⎪⎫231×⎝ ⎛⎭⎪⎫134=3081,P(ξ=50)=C 55⎝ ⎛⎭⎪⎫235×⎝ ⎛⎭⎪⎫130+C 05⎝ ⎛⎭⎪⎫230×⎝ ⎛⎭⎪⎫135=1181,∴ξ的分布列为∴E(ξ)=10×4081+30×3081+50×1181=1 85081.。
高考理数真题训练15 概率与统计(解答题)(解析版)

专题15 概率与统计(解答题)1.【2020年高考全国Ⅰ卷理数】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12,(1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率;(3)求丙最终获胜的概率.【解析】(1)甲连胜四场的概率为116.(2)根据赛制,至少需要进行四场比赛,至多需要进行五场比赛.比赛四场结束,共有三种情况:甲连胜四场的概率为116;乙连胜四场的概率为116;丙上场后连胜三场的概率为18.所以需要进行第五场比赛的概率为11131161684 ---=.(3)丙最终获胜,有两种情况:比赛四场结束且丙最终获胜的概率为18.比赛五场结束且丙最终获胜,则从第二场开始的四场比赛按照丙的胜、负、轮空结果有三种情况:胜胜负胜,胜负空胜,负空胜胜,概率分别为116,18,18.因此丙最终获胜的概率为11117 8168816+++=.2.【2020年高考全国Ⅰ卷理数】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i,y i)(i=1,2,…,20),其中x i和y i分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160iix ==∑,2011200iiy ==∑,2021)8(0ii x x =-=∑,2021)9000(i i y y =-=∑,201)()800(i i i y y x x =--=∑.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i ) (i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数)()(iinx y r x y --=∑1.414≈.【解析】(1)由已知得样本平均数20160120i iy y===∑,从而该地区这种野生动物数量的估计值为60×200=12000. (2)样本(,)i i x y (1,2,,20)i =的相关系数20)()0.943(iix y y x r --===≈∑.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.3.【2020年高考全国III 卷理数】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天): 锻炼人次(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表); (3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:K 2【解析】(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:(2)一天中到该公园锻炼的平均人次的估计值为1(100203003550045)350100⨯+⨯+⨯=. (3)根据所给数据,可得22⨯列联表:根据列联表得22100(3382237) 5.82055457030K ⨯⨯-⨯=≈⨯⨯⨯.由于5.820 3.841>,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 4.【2020年高考山东】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,【解析】(1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且2SO 浓度不超过150的天数为32186864+++=,因此,该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150的概率的估计值为640.64100=. (2)根据抽查数据,可得22⨯列联表:(3)根据(2)的列联表得2100(64101610)7.48480207426K ⨯⨯-⨯=≈⨯⨯⨯.由于7.484 6.635>,故有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关.5.【2020年高考北京】某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:假设所有学生对活动方案是否支持相互独立.(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(Ⅲ)将该校学生支持方案的概率估计值记为0p ,假设该校年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为1p ,试比较0p 与1p 的大小.(结论不要求证明) 【解析】(Ⅰ)该校男生支持方案一的概率为2001200+4003=,该校女生支持方案一的概率为3003300+1004=;(Ⅱ)3人中恰有2人支持方案一分两种情况,(1)仅有两个男生支持方案一,(2)仅有一个男生支持方案一,一个女生支持方案一,所以3人中恰有2人支持方案一概率为:2121311313()(1)()(1)3433436C -+-=; (Ⅲ)01p p <【点睛】本题考查利用频率估计概率、独立事件概率乘法公式,考查基本分析求解能力,属基础题. 6.【2019年高考全国Ⅲ卷理数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【答案】(1)a=0.35,b=0.10;(2)甲、乙离子残留百分比的平均值的估计值分别为4.05,6.00.【解析】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1–0.05–0.15–0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.7.【2019年高考全国Ⅱ卷理数】11分制乒乓球比赛,每赢一球得1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10:10平后,甲先发球,两人又打了X个球该局比赛结束.(1)求P(X=2);(2)求事件“X=4且甲获胜”的概率.【答案】(1)0.5;(2)0.1.【解析】(1)X=2就是10∶10平后,两人又打了2个球该局比赛结束,则这2个球均由甲得分,或者均由乙得分.因此P(X=2)=0.5×0.4+(1–0.5)×(1–0.4)=0.5.(2)X=4且甲获胜,就是10∶10平后,两人又打了4个球该局比赛结束,且这4个球的得分情况为:前两球是甲、乙各得1分,后两球均为甲得分.因此所求概率为[0.5×(1–0.4)+(1–0.5)×0.4]×0.5×0.4=0.1.8.【2019年高考天津卷理数】设甲、乙两位同学上学期间,每天7:30之前到校的概率均为23.假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.(1)用X 表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量X 的分布列和数学期望; (2)设M 为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件M 发生的概率. 【答案】(1)分布列见解析,()2E X =;(2)20243. 【分析】本小题主要考查离散型随机变量的分布列与数学期望,互斥事件和相互独立事件的概率计算公式等基础知识.考查运用概率知识解决简单实际问题的能力.满分13分.【解析】(1)因为甲同学上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率均为23,故2~(3,)3X B ,从而3321()C ()(),0,1,2,333kkkP X k k -===.所以,随机变量X 的分布列为随机变量X 的数学期望()323E X =⨯=.(2)设乙同学上学期间的三天中7:30之前到校的天数为Y , 则2~(3,)3Y B ,且{3,1}{2,0}M X Y X Y =====. 由题意知事件{3,1}X Y ==与{2,0}X Y ==互斥,且事件{3}X =与{1}Y =,事件{2}X =与{0}Y =均相互独立, 从而由(1)知()({3,1}{2,0})P M P X Y X Y =====(3,1)(2,0)P X Y P X Y ===+== (3)(1)(2)(0)P X P Y P X P Y ===+== 824120279927243=⨯+⨯=. 9.【2019年高考北京卷理数】改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:(1)从全校学生中随机抽取1人,估计该学生上个月A ,B 两种支付方式都使用的概率;(2)从样本仅使用A 和仅使用B 的学生中各随机抽取1人,以X 表示这2人中上个月支付金额大于1000元的人数,求X 的分布列和数学期望;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A 的学生中,随机抽查3人,发现他们本月的支付金额都大于2000元.根据抽查结果,能否认为样本仅使用A 的学生中本月支付金额大于2000元的人数有变化?说明理由.【答案】(1)0.4;(2)分布列见解析,E (X )=1;(3)见解析.【解析】(1)由题意知,样本中仅使用A 的学生有18+9+3=30人,仅使用B 的学生有10+14+1=25人,A ,B 两种支付方式都不使用的学生有5人.故样本中A ,B 两种支付方式都使用的学生有100−30−25−5=40人.所以从全校学生中随机抽取1人,该学生上个月A ,B 两种支付方式都使用的概率估计为400.4100=. (2)X 的所有可能值为0,1,2.记事件C 为“从样本仅使用A 的学生中随机抽取1人,该学生上个月的支付金额大于1000元”,事件D 为“从样本仅使用B 的学生中随机抽取1人,该学生上个月的支付金额大于1000元”. 由题设知,事件C ,D 相互独立,且93141()0.4,()0.63025P C P D ++====. 所以(2)()()()0.24P X P CD P C P D ====,(1)()P X P CD CD == ()()()()P C P D P C P D =+0.4(10.6)(10.4)0.6=⨯-+-⨯0.52=,(0)()()()0.24P X P CD P C P D ====.所以X 的分布列为故X 的数学期望()00.2410.5220.241E X =⨯+⨯+⨯=.(3)记事件E 为“从样本仅使用A 的学生中随机抽查3人,他们本月的支付金额都大于2000元”. 假设样本仅使用A 的学生中,本月支付金额大于2000元的人数没有变化, 则由上个月的样本数据得33011()C 4060P E ==. 答案示例1:可以认为有变化. 理由如下:P (E )比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2000元的人数发生了变化,所以可以认为有变化. 答案示例2:无法确定有没有变化.理由如下: 事件E 是随机事件,P (E )比较小,一般不容易发生, 但还是有可能发生的,所以无法确定有没有变化.10.【2019年高考全国Ⅰ卷理数】为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得1-分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得1-分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X . (1)求X 的分布列;(2)若甲药、乙药在试验开始时都赋予4分,(0,1,,8)i p i =表示“甲药的累计得分为i 时,最终认为甲药比乙药更有效”的概率,则00p =,81p =,11i i i i p ap bp cp -+=++(1,2,,7)i =,其中(1)a P X ==-,(0)b P X ==,(1)c P X ==.假设0.5α=,0.8β=.(i)证明:1{}i i p p +-(0,1,2,,7)i =为等比数列;(ii)求4p ,并根据4p 的值解释这种试验方案的合理性.【答案】(1)分布列见解析;(2)(i)证明见解析,(ii)45 127p =,解释见解析. 【解析】X 的所有可能取值为1,0,1-.(1)(1)P X αβ=-=-,(0)(1)(1)P X αβαβ==+--, (1)(1)P X αβ==-,所以X 的分布列为(2)(i )由(1)得0.4,0.5,0.1a b c ===.因此110.40.5 0.1i i i i p p p p -+=++,故110.1()0.4()i i i i p p p p +--=-, 即114()i i i i p p p p +--=-. 又因为1010p p p -=≠, 所以1{}(0,1,2,,7)i i p p i +-=为公比为4,首项为1p 的等比数列.(ii )由(i )可得88776100p p p p p p p p =-+-++-+877610()()()p p p p p p =-+-++-81413p -=.由于8=1p ,故18341p =-, 所以44433221101( 411()327)(5())p p p p p p p p p p -=-+-+-+=-=. 4p 表示最终认为甲药更有效的概率,由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时, 认为甲药更有效的概率为410.0039257p =≈, 此时得出错误结论的概率非常小,说明这种试验方案合理.11.【2018年高考全国Ⅰ卷理数】某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为)10(<<p p ,且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为)(p f ,求)(p f 的最大值点0p . (2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的0p 作为p 的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用. (i )若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X ,求EX ; (ii )以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验? 【答案】(1)0.1;(2)(i )490,(ii )应该对余下的产品作检验.【解析】(1)20件产品中恰有2件不合格品的概率为221820()C (1)f p p p =-. 因此2182172172020()C [2(1)18(1)]2C (1)(110)f p p p p p p p p '=---=--.令()0f p '=,得0.1p =,当(0,0.1)p ∈时,()0f p '>;当(0.1,1)p ∈时,()0f p '<. 所以()f p 的最大值点为00.1p =. (2)由(1)知,0.1p =.(i )令Y 表示余下的180件产品中的不合格品件数, 依题意知(180,0.1)YB ,20225X Y =⨯+,即4025X Y =+.所以(4025)4025490EX E Y EY =+=+=.(ii )如果对余下的产品作检验,则这一箱产品所需要的检验费为400元. 由于400EX >,故应该对余下的产品作检验.12.【2018年高考全国Ⅱ卷理数】下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1217,,…,)建立模型①:ˆ30.413.5y t =-+;根据2010年至2016年的数据(时间变量t 的值依次为127,,…,)建立模型②:ˆ9917.5y t =+. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.【答案】(1)模型①:226.1亿元,模型②:256.5亿元;(2)利用模型②得到的预测值更可靠,理由见解析.【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为ˆ30.413.519226.1y=-+⨯=(亿元). 利用模型②,该地区2018年的环境基础设施投资额的预测值为ˆ9917.59256.5y=+⨯=(亿元). (2)利用模型②得到的预测值更可靠. 理由如下:(Ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线30.413.5y t =-+上下.这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型ˆ9917.5yt =+可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(Ⅰ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.13.【2018年高考全国Ⅲ卷理数】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:()()()()()22n ad bcKa b c d a c b d-=++++,【答案】(1)第二种生产方式的效率更高,理由见解析;(2)列联表见解析;(3)有99%的把握认为两种生产方式的效率有差异.【解析】(1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高. (iii )由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(iv )由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分. (2)由茎叶图知7981802m +==. 列联表如下:(3)由于2240(151555)10 6.63520202020K ⨯-⨯==>⨯⨯⨯,所以有99%的把握认为两种生产方式的效率有差异. 14.【2018年高考北京卷理数】电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.假设所有电影是否获得好评相互独立.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率; (2)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(3)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“1k ξ=”表示第k 类电影得到人们喜欢,“0k ξ=”表示第k 类电影没有得到人们喜欢(k =1,2,3,4,5,6).写出方差1D ξ,2D ξ,3D ξ,4D ξ,5D ξ,6D ξ的大小关系.【答案】(1)0.025;(2)0.35;(3)1D ξ>4D ξ>2D ξ=5D ξ>3D ξ>6D ξ.【解析】(1)由题意知,样本中电影的总部数是140+50+300+200+800+510=2000, 第四类电影中获得好评的电影部数是200×0.25=50. 故所求概率为500.0252000=. (2)设事件A 为“从第四类电影中随机选出的电影获得好评”, 事件B 为“从第五类电影中随机选出的电影获得好评”. 故所求概率为P (AB AB +)=P (AB )+P (AB ) =P (A )(1–P (B ))+(1–P (A ))P (B ). 由题意知:P (A )估计为0.25,P (B )估计为0.2. 故所求概率估计为0.25×0.8+0.75×0.2=0.35. (3)1D ξ>4D ξ>2D ξ=5D ξ>3D ξ>6D ξ.15.【2018年高考天津卷理数】已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查. (1)应从甲、乙、丙三个部门的员工中分别抽取多少人?(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.(i )用X 表示抽取的3人中睡眠不足的员工人数,求随机变量X 的分布列与数学期望;(ii )设A 为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A 发生的概率.【答案】(1)分别抽取3人,2人,2人;(2)(i )分布列见解析,12()7E X =,(ii )67. 【解析】(1)由已知,甲、乙、丙三个部门的员工人数之比为3∶2∶2, 由于采用分层抽样的方法从中抽取7人,因此应从甲、乙、丙三个部门的员工中分别抽取3人,2人,2人. (2)(i )随机变量X 的所有可能取值为0,1,2,3.P (X =k )=34337C C C k k-⋅(k =0,1,2,3).所以,随机变量X 的分布列为随机变量X的数学期望11218412 ()0123353535357E X=⨯+⨯+⨯+⨯=.(ii)设事件B为“抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人”;事件C为“抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人”,则A=B∪C,且B与C互斥,由(i)知,P(B)=P(X=2),P(C)=P(X=1),故P(A)=P(B∪C)=P(X=2)+P(X=1)=67.所以,事件A发生的概率为67.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率与统计热点一 常见概率模型的概率几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题考查,求解的关键在于找准测度(面积,体积或长度);相互独立事件,互斥事件常作为解答题的一问考查,也是进一步求分布列,期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式.【例1】现有4个人去参加某娱乐活动,该活动有甲、乙两个游戏可供参加者选择.为增加趣味性,约定:每个人通过掷一枚质地均匀的骰子决定自己去参加哪个游戏,掷出点数为1或2的人去参加甲游戏,掷出点数大于2的人去参加乙游戏. (1)求这4个人中恰有2人去参加甲游戏的概率;(2)求这4个人中去参加甲游戏的人数大于去参加乙游戏的人数的概率; (3)用X ,Y 分别表示这4个人中去参加甲、乙游戏的人数,记ξ=|X -Y |,求随机变量ξ的分布列.解 依题意,这4个人中,每个人去参加甲游戏的概率为13,去参加乙游戏的概率为23.设“这4个人中恰有i 人去参加甲游戏”为事件A i (i =0,1,2,3,4). 则P (A i )=C i 4⎝⎛⎭⎪⎫13i ⎝ ⎛⎭⎪⎫234-i . (1)这4个人中恰有2人去参加甲游戏的概率 P (A 2)=C 24⎝⎛⎭⎪⎫132⎝ ⎛⎭⎪⎫232=827.(2)设“这4个人中去参加甲游戏的人数大于去参加乙游戏的人数”为事件B ,则B =A 3+A 4,且A 3与A 4互斥,∴P (B )=P (A 3+A 4)=P (A 3)+P (A 4)=C 34⎝ ⎛⎭⎪⎫133×23+C 44⎝ ⎛⎭⎪⎫134=19.(3)依题设,ξ的所有可能取值为0,2,4. 且A 1与A 3互斥,A 0与A 4互斥.则P (ξ=0)=P (A 2)=827,P (ξ=2)=P (A 1+A 3)=P (A 1)+P (A 3) =C 14⎝⎛⎭⎪⎫131·⎝ ⎛⎭⎪⎫233+C 34⎝ ⎛⎭⎪⎫133×23=4081,P (ξ=4)=P (A 0+A 4)=P (A 0)+P (A 4) =C 04⎝⎛⎭⎪⎫234+C 44⎝ ⎛⎭⎪⎫134=1781.所以ξ的分布列是【类题通法】(1)本题4个人中参加甲游戏的人数服从二项分布,由独立重复试验,4人中恰有i 人参加甲游戏的概率P =C i 4⎝⎛⎭⎪⎫13i ⎝ ⎛⎭⎪⎫234-i ,这是本题求解的关键. (2)解题中常见的错误是不能分清事件间的关系,选错概率模型,特别是在第(3)问中,不能把ξ=0,2,4的事件转化为相应的互斥事件A i 的概率和.【对点训练】甲、乙两班进行消防安全知识竞赛,每班出3人组成甲乙两支代表队,首轮比赛每人一道必答题,答对则为本队得1分,答错或不答都得0分,已知甲队3人每人答对的概率分别为34,23,12,乙队每人答对的概率都是23,设每人回答正确与否相互之间没有影响,用ξ表示甲队总得分. (1)求ξ=2的概率;(2)求在甲队和乙队得分之和为4的条件下,甲队比乙队得分高的概率. 解 (1)ξ=2,则甲队有两人答对,一人答错,故P (ξ=2)=34×23×⎝ ⎛⎭⎪⎫1-12+34×⎝ ⎛⎭⎪⎫1-23×12+⎝ ⎛⎭⎪⎫1-34×23×12=1124;(2)设甲队和乙队得分之和为4为事件A ,甲队比乙队得分高为事件B .设乙队得分为η,则η~B ⎝ ⎛⎭⎪⎫3,23.P (ξ=1)=34×⎝ ⎛⎭⎪⎫1-23×⎝ ⎛⎭⎪⎫1-12+⎝ ⎛⎭⎪⎫1-34×23×⎝ ⎛⎭⎪⎫1-12+⎝ ⎛⎭⎪⎫1-34×⎝ ⎛⎭⎪⎫1-23×12=14,P (ξ=3)=34×23×12=14, P (η=1)=C 13·23·⎝⎛⎭⎪⎫132=29,P (η=2)=C 23·⎝ ⎛⎭⎪⎫232·13=49,P (η=3)=C 33⎝⎛⎭⎪⎫233=827,∴P (A )=P (ξ=1)P (η=3)+P (ξ=2)P (η=2)+P (ξ=3)·P (η=1) =14×827+1124×49+14×29=13, P (AB )=P (ξ=3)·P (η=1)=14×29=118, ∴所求概率为P (B|A )=P (AB )P (A )=11813=16.热点二 离散型随机变量的分布列、均值与方差离散型随机变量及其分布列、均值与方差及应用是数学高考的一大热点,每年均有解答题的考查,属于中档题.复习中应强化应用题目的理解与掌握,弄清随机变量的所有取值是正确列随机变量分布列和求均值与方差的关键,对概率模型的确定与转化是解题的基础,准确计算是解题的核心,在备考中强化解答题的规范性训练.【例2】甲乙两人进行围棋比赛,约定先连胜两局者直接赢得比赛,若赛完5局仍未出现连胜,则判定获胜局数多者赢得比赛.假设每局甲获胜的概率为23,乙获胜的概率为13,各局比赛结果相互独立. (1)求甲在4局以内(含4局)赢得比赛的概率;(2)记X 为比赛决出胜负时的总局数,求X 的分布列和均值(数学期望).解 用A 表示“甲在4局以内(含4局)赢得比赛”,A k 表示“第k 局甲获胜”,B k 表示“第k 局乙获胜”,则P (A k )=23,P (B k )=13,k =1,2,3,4,5. (1)P (A )=P (A 1A 2)+P (B 1A 2A 3)+P (A 1B 2A 3A 4) =P (A 1)P (A 2)+P (B 1)P (A 2)P (A 3)+P (A 1)P (B 2)· P (A 3)P (A 4)=⎝ ⎛⎭⎪⎫232+13×⎝ ⎛⎭⎪⎫232+23×13×⎝ ⎛⎭⎪⎫232=5681. (2)X 的可能取值为2,3,4,5.P (X =2)=P (A 1A 2)+P (B 1B 2)=P (A 1)P (A 2)+P (B 1)·P (B 2)=59, P (X =3)=P (B 1A 2A 3)+P (A 1B 2B 3)=P (B 1)P (A 2)P (A 3)+P (A 1)P (B 2)P (B 3)=29, P (X =4)=P (A 1B 2A 3A 4)+P (B 1A 2B 3B 4)=P (A 1)P (B 2)P (A 3)P (A 4)+P (B 1)P (A 2)P (B 3)P (B 4)=1081, P (X =5)=1-P (X =2)-P (X =3)-P (X =4)=881. 故X 的分布列为E (X )=2×59+3×29+4×1081+5×881=22481.【类题通法】求离散型随机变量的均值和方差问题的一般步骤 第一步:确定随机变量的所有可能值; 第二步:求每一个可能值所对应的概率; 第三步:列出离散型随机变量的分布列; 第四步:求均值和方差;第五步:反思回顾.查看关键点、易错点和答题规范.【对点训练】为回馈顾客,某商场拟通过摸球兑奖的方式对1 000位顾客进行奖励,规定:每位顾客从一个装有4个标有面值的球的袋中一次性随机摸出2个球,球上所标的面值之和为该顾客所获的奖励额.(1)若袋中所装的4个球中有1个所标的面值为50元,其余3个均为10元.求:①顾客所获的奖励额为60元的概率;②顾客所获的奖励额的分布列及数学期望;(2)商场对奖励总额的预算是60 000元,并规定袋中的4个球只能由标有面值10元和50元的两种球组成,或标有面值20元和40元的两种球组成.为了使顾客得到的奖励总额尽可能符合商场的预算且每位顾客所获的奖励额相对均衡,请对袋中的4个球的面值给出一个合适的设计,并说明理由.解(1)设顾客所获的奖励额为X.①依题意,得P(X=60)=C11C13C24=12,即顾客所获的奖励额为60元的概率为1 2.②依题意,得X的所有可能取值为20,60.P(X=60)=12,P(X=20)=C23C24=12,即X的分布列为所以顾客所获的奖励额的数学期望为E(X)=20×12+60×12=40(元).(2)根据商场的预算,每个顾客的平均奖励额为60元.所以,先寻找期望为60元的可能方案.对于面值由10元和50元组成的情况,如果选择(10,10,10,50)的方案,因为60元是面值之和的最大值,所以期望不可能为60元;如果选择(50,50,50,10)的方案,因为60元是面值之和的最小值,所以期望也不可能为60元,因此可能的方案是(10,10,50,50),记为方案1.对于面值由20元和40元组成的情况,同理,可排除(20,20,20,40)和(40,40,40,20)的方案,所以可能的方案是(20,20,40,40),记为方案2.以下是对两个方案的分析:对于方案1,即方案(10,10,50,50),设顾客所获的奖励额为X1,则X1的分布列为X1的数学期望为E(X1)=20×16+60×23+100×16=60(元),X1的方差为D(X1)=(20-60)2×16+(60-60)2×23+(100-60)2×16=1 6003.对于方案2,即方案(20,20,40,40),设顾客所获的奖励额为X2,则X2的分布列为X2的数学期望为E(X2)=40×16+60×23+80×16=60(元),X2的方差为D(X2)=(40-60)2×16+(60-60)2×23+(80-60)2×16=4003.由于两种方案的奖励额的数学期望都符合要求,但方案2奖励额的方差比方案1的小,所以应该选择方案2.热点三概率与统计的综合应用概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及数学均值与方差的运算.【例3】2018年6月14日至7月15日,第21届世界杯足球赛将于俄罗斯举行,某大学为世界杯组委会招收志愿者,被招收的志愿者需参加笔试和面试,把参加笔试的40名大学生的成绩分组:第1组[75,80),第2组[80,85),第3组[85,90),第4组[90,95),第5组[95,100],得到的频率分布直方图如图所示:(1)分别求出成绩在第3,4,5组的人数;(2)现决定在笔试成绩较高的第3,4,5组中用分层抽样抽取6人进行面试.①已知甲和乙的成绩均在第3组,求甲或乙进入面试的概率;②若从这6名学生中随机抽取2名学生接受考官D的面试,设第4组中有X名学生被考官D面试,求X的分布列和数学期望.解(1)由频率分布直方图知:第3组的人数为5×0.06×40=12.第4组的人数为5×0.04×40=8.第5组的人数为5×0.02×40=4.(2)利用分层抽样,在第3组,第4组,第5组中分别抽取3人,2人,1人.①设“甲或乙进入第二轮面试”为事件A,则P(A)=1-C310C312=511,所以甲或乙进入第二轮面试的概率为5 11.②X的所有可能取值为0,1,2,P(X=0)=C24C26=25,P(X=1)=C12C14C26=815,P(X=2)=C22C26=115.所以X的分布列为X 012P 25815115E(X)=0×25+1×815+2×115=1015=23.【类题通法】本题将传统的频率分布直方图与分布列、数学期望相结合,立意新颖、构思巧妙.求解离散型随机变量的期望与频率分布直方图交汇题的“两步曲”:一是看图说话,即看懂频率分布直方图中每一个小矩形面积表示这一组的频率;二是活用公式,本题中X服从超几何分布.【对点训练】某公司为了解用户对某产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A 地区用户满意度评分的平均值高于B 地区用户满意度评分的平均值;A 地区用户满意度评分比较集中,B 地区用户满意度评分比较分散. (2)记C A 1表示事件:“A 地区用户的满意度等级为满意或非常满意”; C A 2表示事件:“A 地区用户的满意度等级为非常满意”; C B 1表示事件:“B 地区用户的满意度等级为不满意”; C B 2表示事件:“B 地区用户的满意度等级为满意”, 则C A 1与C B 1独立,C A 2与C B 2独立,C B 1与C B 2互斥, C =C B 1C A 1∪C B 2C A 2. P (C )=P (C B 1C A 1∪C B 2C A 2) =P (C B 1C A 1)+P (C B 2C A 2) =P (C B 1)P (C A 1)+P (C B 2)P (C A 2).由所给数据得C A 1,C A 2,C B 1,C B 2发生的频率分别为1620,420,1020,820,即P (C A 1)=1620,P (C A 2)=420,P (C B 1)=1020,P (C B 2)=820,故P (C )=1020×1620+820×420=0.48. 热点四 统计与统计案例能根据给出的线性回归方程系数公式求线性回归方程,了解独立性检验的基本思想、方法,在选择或填空题中常涉及频率分布直方图、茎叶图及样本的数字特征(如平均数、方差)的考查,解答题中也有所考查.【例4】从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑10i =1x i =80,∑10i =1y i =20,∑10i =1x i y i =184,∑10i =1x 2i=720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b^x +a ^;(2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程y ^=b ^x +a ^中,b ^=,a ^=y -b ^ x ,其中x ,y 为样本平均值.解 (1)由题意知n =10,x =1n ∑n i =1x i =8010=8, y =1n ∑n i =1y i =2010=2,又l xx =∑ni =1x 2i -n x 2=720-10×82=80, l xy =∑ni =1x i y i -n x y =184-10×8×2=24, 由此得b^=l xy l xx=2480=0.3, a^=y -b ^x =2-0.3×8=-0.4,故所求线性回归方程为y ^=0.3x -0.4.(2)由于变量y 的值随x 值的增加而增加(b^=0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄为y ^=0.3×7-0.4=1.7(千元). 【类题通法】(1)分析两个变量的线性相关性,可通过计算相关系数r 来确定,r 的绝对值越接近于1,表明两个变量的线性相关性越强,r 的绝对值越接近于0,表明两变量线性相关性越弱.(2)求线性回归方程的关键是正确运用b^,a ^的公式进行准确的计算. 【对点训练】4月23日是“世界读书日”,某中学在此期间开展了一系列的读书教育活动.为了解本校学生课外阅读情况,学校随机抽取了100名学生对其课外阅读时间进行调查.下面是根据调查结果绘制的学生日均课外阅读时间(单位:分钟)的频率分布直方图.若将日均课外阅读时间不低于60分钟的学生称为“读书迷”,低于60分钟的学生称为“非读书迷”.(1)根据已知条件完成下面2×2列联表,并据此判断是否有99%的把握认为“读书迷”与性别有关?非读书迷 读书迷总计 男 15 女 45 总计(2)1人,共抽取3次,记被抽取的3人中的“读书迷”的人数为X .若每次抽取的结果是相互独立的,求X 的分布列、期望E (X )和方差D (X ). 解 (1)完成2×2列联表如下:非读书迷 读书迷 总计 男 40 15 55 女 20 25 45 总计6040100K 2=100×(40×25-15×20)60×40×55×45≈8.249>6.635,故有99%的把握认为“读书迷”与性别有关.(2)将频率视为概率.则从该校学生中任意抽取1名学生恰为读书迷的概率P =25. 由题意可知X ~B ⎝ ⎛⎭⎪⎫3,25,P (X =i )=C i 3⎝ ⎛⎭⎪⎫25i ⎝ ⎛⎭⎪⎫353-i (i =0,1,2,3). X 的分布列为X123均值E(X)=np=3×25=65,方差D(X)=np(1-p)=3×25×⎝⎛⎭⎪⎫1-25=1825.。