2021届广东省高考数学专题复习专项训练:统计与概率
2021高考数学热点题型专题01概率与统计理

2021高考数学热点题型专题01概率与统计理热点一 常见概率模型的概率几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型要紧以客观题考查,求解的关键在于找准测度(面积,体积或长度);相互独立事件,互斥事件常作为解答题的一问考查,也是进一步求分布列,期望与方差的基础,求解该类问题要正确明白得题意,准确判定概率模型,恰当选择概率公式.【例1】某地乒乓球队备战全运会的热身赛暨选拔赛中,种子选手M 与B 1,B 2,B 3三位非种子选手分别进行一场对抗赛,按以往多次竞赛的统计,M 获胜的概率分别为34,23,12,且各场竞赛互不阻碍.(1)若M 至少获胜两场的概率大于710,则M 入选征战全运会的最终大名单,否则不予入选,问M 是否会入选最终的大名单?(2)求M 获胜场数X 的分布列和数学期望.解:(1)记M 与B 1,B 2,B 3进行对抗赛获胜的事件分别为A ,B ,C ,M 至少获胜两场的事件为D ,则P (A )=34,P (B )=23,P (C )=12,由于事件A ,B ,C 相互独立,因此P (D )=P (ABC )+P (ABC —)+P (AB —C )+P (A —BC )=34×23×12+34×23×⎝ ⎛⎭⎪⎫1-12+34×⎝ ⎛⎭⎪⎫1-23×12+⎝ ⎛⎭⎪⎫1-34×23×12=1724,由于1724>710,因此M 会入选最终的大名单. (2)M 获胜场数X 的可能取值为0,1,2,3,则P (X =0)=P (A —B —C —)=⎝⎛⎭⎪⎫1-34×⎝⎛⎭⎪⎫1-23×⎝⎛⎭⎪⎫1-12=124;P (X =1)=P (AB —C —)+P (A —B —C )+P (A —BC —)=34×⎝⎛⎭⎪⎫1-23×⎝⎛⎭⎪⎫1-12+⎝⎛⎭⎪⎫1-34×⎝⎛⎭⎪⎫1-23×12+⎝⎛⎭⎪⎫1-34×23×⎝⎛⎭⎪⎫1-12=624=14; P (X =2)=P (ABC —)+P (AB —C )+P (A —BC )=34×23×⎝ ⎛⎭⎪⎫1-12+34×⎝ ⎛⎭⎪⎫1-23×12+⎝ ⎛⎭⎪⎫1-34×23×12=1124; P (X =3)=P (ABC )=34×23×12=624=14,因此M 获胜场数X 的分布列为:数学期望为E (X )=0×124+1×4+2×24+3×4=12.【类题通法】(1)求解该类问题在于正确分析所求事件的构成,将其转化为彼此互斥事件的和或相互独立事件的积,然后利用相关公式进行运算.(2)求相互独立事件同时发生的概率的要紧方法:①利用相互独立事件的概率乘法公式直截了当求解;②正面运算较繁(如求用“至少”表达的事件的概率)或难以入手时,可从其对立事件入手运算.【对点训练】甲、乙两人组成“火星队”参加投篮游戏,每轮游戏中甲、乙各投一次,假如两人都投中,则“火星队”得4分;假如只有一人投中,则“火星队”得2分;假如两人都没投中,则“火星队”得0分.已知甲每次投中的概率为45,乙每次投中的概率为34;每轮游戏中甲、乙投中与否互不阻碍,假设“火星队”参加两轮游戏,求:(1)“火星队”至少投中3个球的概率;(2)“火星队”两轮游戏得分之和X 的分布列和数学期望E (X ).(2)X 的所有可能的取值为0,2,4,6,8,P (X =0)=14×15×14×15=1400;P (X =2)=2×⎝ ⎛⎭⎪⎫34×15×14×15+14×45×14×15=14400=7200; P (X =4)=2×⎝ ⎛⎭⎪⎫34×45×14×15+14×45×34×15+34×15×34×15+14×45×14×45=73400;P (X =6)=2×⎝ ⎛⎭⎪⎫34×45×34×15+34×45×14×45=168400=2150;P (X =8)=34×45×34×45=144400=925.因此X 的分布列为X 0 2 4 6 8 P 14007200734002150925E (X )=0×400+2×400+4×400+6×400+8×400=5. 热点二 离散型随机变量的分布列、均值与方差离散型随机变量及其分布列、均值与方差及应用是数学高考的一大热点,每年均有解答题的考查,属于中档题.复习中应强化应用题目的明白得与把握,弄清随机变量的所有取值是正确列随机变量分布列和求均值与方差的关键,对概率模型的确定与转化是解题的基础,准确运确实是解题的核心,在备考中强化解答题的规范性训练.【例2】一家面包房依照以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示.将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.(1)求在以后连续3天里,有连续2天的日销售量都不低于100个且另1天的日销售量低于50个的概率;(2)用X表示在以后3天里日销售量不低于100个的天数,求随机变量X的分布列、数学期望E(X)及方差D(X).(2)X的可能取值为0,1,2,3.P(X=0)=C03×(1-0.6)3=0.064,P(X=1)=C13×0.6×(1-0.6)2=0.288,P(X=2)=C23×0.62×(1-0.6)=0.432,P(X=3)=C33×0.63=0.216.X的分布列为X 012 3P 0.0640.2880.4320.216因为X~B(3,0.6)方差D(X)=3×0.6×(1-0.6)=0.72.【类题通法】求离散型随机变量的均值和方差问题的一样步骤第一步:确定随机变量的所有可能值;第二步:求每一个可能值所对应的概率;第三步:列出离散型随机变量的分布列;第四步:求均值和方差;第五步:反思回忆.查看关键点、易错点和答题规范.【对点训练】打算在某水库建一座至多安装3台发电机的水电站,过去50年的水文资料显示,水库年入流量X(年入流量:一年内上游来水与库区降水之和,单位:亿立方米)都在40以上.其中,不足80的年份有10年,不低于80且不超过120的年份有35年,超过120的年份有5年.将年入流量在以上三段的频率作为相应段的概率,并假设各年的年入流量相互独立.(1)求以后4年中,至多有1年的年入流量超过120的概率;(2)水电站期望安装的发电机尽可能运行,但每年发电机最多可运行台数受年入流量X限制,并有如下关系:年入流量X40<X<80 80≤X≤120X>120发电机最多1 2 3可运行台数电站年总利润的均值达到最大,应安装发电机多少台?(2)记水电站年总利润为Y(单位:万元).(Ⅰ)安装1台发电机的情形.由于水库年入流量总大于40,故一台发电机运行的概率为1,对应的年利润Y=5 000,E(Y)=5 000×1=5 000.(Ⅱ)安装2台发电机的情形.依题意,当40<X<80时,一台发电机运行,现在Y=5 000-800=4 200,因此P(Y=4 200)=P(40<X<80)=p1=0.2;当X≥80时,两台发电机运行,现在Y=5 000×2=10 000,因此P(Y=10 000)=P(X≥80)=p2+p3=0.8.由此得Y的分布列如下:Y 4 200 10 000P0.2 0.8因此,E(Y)(Ⅲ)安装3台发电机的情形.依题意,当40<X<80时,一台发电机运行,现在Y=5 000-1 600=3 400,因此P(Y=3 400)=P(40<X<80)=p1=0.2;当80≤X≤120时,两台发电机运行,现在Y=5 000×2-800=9 200,因此P(Y=9 200)=P(80≤X≤120)=p2=0.7;当X>120时,三台发电机运行,现在Y=5 000×3=15 000,因此P(Y=15 000)=P(X>120)=p3=0.1.由此得Y的分布列如下:Y 3 400 9 200 15 000P0.2 0.7 0.1因此,E(Y)综上,欲使水电站年总利润的均值达到最大,应安装发电机2台.热点三概率与统计的综合应用概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.要紧依靠点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清晰,在此基础上把握好样本特点数的计数方法、各类概率的运算方法及数学均值与方差的运算.【例3】质监部门从某超市销售的甲、乙两种食用油中分别各随机抽取100桶检测某项质量指标,由检测结果得到如下的频率分布直方图:(1)写出频率分布直方图(甲)中a的值;记甲、乙两种食用油100桶样本的质量指标的方差分别为S21,S22,试比较S21,S22的大小(只要求写出答案);(2)估量在甲、乙两种食用油中随机抽取1捅,恰有一桶的质量指标大于20的概率;(3)由频率分布直方图能够认为,乙种食用油的质量指标值Z服从正态分布N(μ,σ2).其中μ近似为样本平均数x,σ2近似为样本方差S22,设X表示从乙种食用油中随机抽取10桶,其质量指标值位于(14.55,38.45)的桶数,求X的数学期望.注:①同一组数据用该区间的中点值作代表,运算得S2=142.75≈11.95;②若Z~N(μ,σ2),则P(μ-σ<Z<μ+σ)=0.682 6,P(μ-2σ<Z<μ+2σ)=0.954 4.解:(1)a=0.015,S21>S22.(2)设事件A:在甲种食用油中随机抽取1桶,其质量指标不大于20,事件B:在乙种食用油中随机抽取1桶,其质量指标不大于20,事件C:在甲、乙两种食用油中随机抽取1桶,恰有一桶的质量指标不大于20,且另一桶大于20,则P(A)=0.20+0.10=0.3,P(B)=0.10+0.20=0.3,因此P(C)=P(A—)P(B)+P(A)P(B—)=0.42,【类题通法】本题将传统的频率分布直方图与分布列、数学期望相结合,立意新颖、构思巧妙.求解离散型随机变量的期望与频率分布直方图交汇题的“两步曲”:一是看图说话,即看明白频率分布直方图中每一个小矩形面积表示这一组的频率;二是活用公式,本题中Z服从正态分布.【对点训练】某市为了考核甲、乙两部门的工作情形,随机访问了50位市民.依照这50位市民对这两部门的评分(评分越高说明市民的评判越高),绘制茎叶图如下:(1)分别估量该市的市民对甲、乙两部门评分的中位数;(2)分别估量该市的市民对甲、乙两部门的评分高于90的概率;(3)依照茎叶图分析该市的市民对甲、乙两部门的评判.解:(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,因此该市的市民对甲部门评分的中位数的估量值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为67,因此该市的市民对乙部门评分的中位数的估量值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16.故该市的市民对甲、乙部门的评分高于90的概率的估量值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图能够大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评判较高、评判较为一致,对乙部门的评判较低、评判差异较大. 热点四 统计与统计案例能依照给出的线性回来方程系数公式求线性回来方程,了解独立性检验的差不多思想、方法,在选择或填空题中常涉及频率分布直方图、茎叶图及样本的数字特点(如平均数、方差)的考查,解答题中也有所考查. 【例4】下图是我国2008年至2020年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1~7分别对应年份2008~2020.(1)由折线图看出,可用线性回来模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回来方程(系数精确到0.01),推测2021年我国生活垃圾无害化处理量. 附注: 参考数据:71ii y=∑=9.32,71i ii t y=∑=40.1771ii y y =∑2(-)=0.55,7≈2.646.参考公式:相关系数r 12211()()()()niii n niii j t t y y t t y y ===----∑∑∑,回来方程y ^=a ^+b ^t 中斜率和截距的最小二乘估量公式分别为:121()()ˆˆˆ.()nii i nii tt y y bay bt tt ==--==--∑∑,因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而能够用线性回来模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b ^=121()()()nii i nii tt y y tt ==---∑∑=2.8928≈0.103, a ^=y -b ^t ≈1.331-0.103×4≈0.92.因此y 关于t 的回来方程为y ^=0.92+0.10t.将2021年对应的t =9代入回来方程得y ^=0.92+0.10×9=1.82, 因此推测2021年我国生活垃圾无害化处理量将约为1.82亿吨.【类题通法】(1)分析两个变量的线性相关性,可通过运算相关系数r 来确定,r 的绝对值越接近于1,说明两个变量的线性相关性越强,r 的绝对值越接近于0,说明两变量线性相关性越弱. (2)求线性回来方程的关键是正确运用b ^,a ^的公式进行准确的运算.【对点训练】近年来,我国电子商务蓬勃进展,治理部门推出了针对某网购平台的商品和服务的评判系统.从该评判系统中选出200次成功交易,并对其评判进行统计,网购者对商品的中意率为0.6,对服务的中意率为0.75,其中对商品和服务都中意的交易为80次.(1)依照已知条件完成下面的2×2列联表,并回答能否有99%的把握认为“网购者对商品中意与对服务中意之间有关系”?对服务中意对服务不中意合计 对商品中意 80 对商品不中意X ,求X 的分布列和数学期望E (X ).附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .K 2=150×50×120×80≈11.111,因为11.111>6.635,因此能有99%的把握认为“网购者对商品中意与对服务中意之间有关系”. (2) 每次购物时,对商品和服务都中意的概率为25,且X 的取值能够是0,1,2,3.P (X =0)=⎝ ⎛⎭⎪⎫353=27125;P (X =1)=C 13⎝ ⎛⎭⎪⎫25×⎝ ⎛⎭⎪⎫352=54125;P (X =2)=C 23⎝ ⎛⎭⎪⎫252×⎝ ⎛⎭⎪⎫351=36125;P (X =3)=C 33⎝ ⎛⎭⎪⎫253×⎝ ⎛⎭⎪⎫350=8125.X 的分布列为:因此E (X )=0×27125+1×125+2×125+3×125=5.或者由于X ~B ⎝ ⎛⎭⎪⎫3,25,得E (X )=3×25=65.。
2021届高三总复习——专题05 概率与统计(新高考地区专用)

专题05 常用逻辑用语姓名:__________________ 班级:______________ 得分:_________________ 注意事项:本试卷满分150分,考试时间120分钟.答卷前,考生务必用0.5毫米黑色签字笔将自己的姓名、班级等信息填写在试卷规定的位置.一、单项选择题(本大题共8小题,每小题5分,共40分)1.(2020·湖北宜昌·月考)在对具有线性相关的两个变量x 和y 进行统计分析时,得到如下数据:由表中数据求得y 关于x 的回归方程为0.65.8ˆ1yx =-,则()4,1,()m,2,()8,3这三个样本点中,距离回归直线最近的点是( ) A .()4,1 B .()m,2C .()8,3D .()4,1或()m,2【答案】B【解析】由表中数据,计算134(481012)55m x m +=⨯++++=,1(12356) 3.45y =⨯++++=,代入回归方程0.65.8ˆ1yx =-中, 得343.40.65 1.85m+=⨯-,解得6m =; 所以4x =时,ˆ0.654 1.80.8,10.80.2y=⨯-=-=; 6x =时,ˆ0.656 1.8 2.1,2.120.1y=⨯-=-=; 8x =时,ˆ0.658 1.8 3.4,3.430.4y=⨯-=-=; 综上,(4,1),(6,2),(8,3)这三个样本点中距离回归直线最近的点是(6,2)即()m,2.故选:B .2.(2020·贵州遵义·其他(理))从2019年12月底开始,新型冠状病毒引发的肺炎疫情不断蔓延,给全国人民带来了重大损失,如图是我国2020年1月20日至2月10日,湖北内外新增确诊人数的折线统计图,由图可知,1月20日至2月10日这几天内,下列选项中正确的是()A.湖北新增确诊人数逐日增加B.全国新增确诊人数呈增加的趋势C.2月4号全国患病人数达到最多D.湖北地区新增确诊人数的方差大于非湖北地区新增确诊人数的方差【答案】D【解析】湖北最新确诊人数有增有减,A错误;全国最新确诊人数呈先增加后减少的趋势,B错误;2月4号全国新增确诊人数达到最多,并非患病人数最多,C错误;非湖北地区1月20日至2月10日这几天内新增确诊人数相较于湖北地区新增确诊人数的波动性较小,变化比较平稳,方差更小,D正确.故选:D3.(2018·广东高二学业考试)从96名数学教师,24名化学教师,16名地理教师中,用分层抽样的方法抽取一个容量为17的样本,则应抽取的数学教师人数是()A.2B.3C.12D.15【答案】C【解析】从96名数学教师,24名化学教师,16名地理教师中,用分层抽样的方法抽取一个容量为17的样本,则应抽取的数学教师人数是961712962416⨯=++,故选:C.4.(2020·广东月考)在一项调查中有两个变量x 和y ,下图是由这两个变量近8年来的取值数据得到的散点图,那么适宜作为y 关于x 的回归方程的函数类型是( )A .y a bx =+B .y c =+C .2y m nx =+D .x y p qc =+(0q >)【答案】B【解析】散点图呈曲线,排除A 选项,且增长速度变慢,排除选项C 、D ,故选B . 5.(2020·重庆高二期末)今年,受新冠肺炎疫情的影响,在全国的许多地方都采取了在家线上学习的方式,而此种方式对学生的自制力、自觉性有极高的要求.然而,在手机面前,有些学生终究无法抵御游戏和短视频的诱惑.从而导致无法专心完成学习任务,成绩下滑;但是对于自制力强,能有效管理自己的学生,手机不仅不会对他们的学习造成负面影响,还能成为他们学习的有力助手.某校某研究学习小组调查研究“学生线上学习智能手机对学习的影响”,从学习成绩优秀与不优秀中分别随机抽查了40名同学,得到了是否使用手机的如下样本数据:附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.根据表中的数据,下列说法中,正确的是( ) A .有99%的把握认为中学生使用手机对学习有影响 B .有99.5%的把握认为中学生使用手机对学习有影响C .可以在犯错误的概率不超过0.025的前提下认为中学生使用手机对学习有影响D .可以在犯错误的概率不超过0.001的前提下认为中学生使用手机对学习有影响 【答案】B【解析】()()()()()()22280282612147.==9.82542384047908n ad bc K a b c d a c b d -⨯⨯-⨯=≥++++⨯⨯⨯有99.5%的把握认为中学生使用手机对学习有影响,故选:B6.(2020·贵州遵义·其他(理))2019年湖南等8省公布了高考改革综合方案将采取“312++”模式即语文、数学、英语必考,考生首先在物理、历史中选择1门,然后在思想政治、地理、化学、生物中选择2门,一名同学随机选择3门功课,则该同学选到历史、地理两门功课的概率为( ) A .14B .13C .12D .23【答案】A【解析】由题意,记物理、历史分别为A 、B ,从中选择1门;记思想政治、地理、化学、生物为a 、b 、c 、d ,从中选择2门;则该同学随机选择3门功课,所包含的基本事件有:(),,A a b ,(),,A a c ,(),,A a d ,(),,A b c ,(),,A b d ,(),,A c d ,(),,B a b ,(),,B a c ,(),,B a d ,(),,B b c ,(),,B b d ,(),,B c d ,共12个基本事件;该同学选到历史、地理两门功课所包含的基本事件有:(),,B a b ,(),,B b c ,(),,B b d 共3个基本事件;∴该同学选到物理、地理两门功课的概率为31124P ==.故选:A . 7.(2020·沙坪坝·重庆八中月考)已知甲盒子有6个不同的小球,编号分别为1,2,3,4,5,6,从甲盒子中取出一个球,记随机变量X 是取出球的编号,数学期望为()E X ,乙盒子有5个不同的小球,编号分别为1,2,3,4,5,从乙盒子中取出一个球,记随机变量Y是取出球的编号,数学期望为()E Y ,则( ) A .(3)(3)P X P Y =>=且()()E X E Y > B .(3)(3)P X P Y =>=且()()E X E Y < C .(3)(3)P X P Y =<=且()()E X E Y > D .(3)(3)P X P Y =<=且()()E X E Y <【答案】C【解析】由题1(3)6P X ==,1(3)5P Y ==, 1111117()1234566666662E X =⨯+⨯+⨯+⨯+⨯+⨯=,11111()12345355555E Y =⨯+⨯+⨯+⨯+⨯=.故选:C8.(2020·山东潍坊·高三月考)算盘是中国传统的计算工具,其形长方,周为木框,内贯直柱,俗称“档”,档中横以梁,梁上两珠,每珠作数五,梁下五珠,每珠作数一.算珠梁上部分叫上珠,梁下部分叫下珠.例如,在十位档拨上一颗上珠和一颗下珠,个位档拨上一颗上珠,则表示数字65,若在个、十、百、千位档中随机选择一档拨上一颗下珠,再随机选择两个档位各拨一颗上珠,则所拨数字小于600的概率为( )A .38B .524C .34D .724【答案】D【解析】在个、十、百、千位档中随机选择一档拨上一颗下珠,再随机选择两个档位各拨一颗上珠,所有的数有124424C C =个,其中小于600的有1213327C C C -=个,∴所求概率为724P =. 二、多项选择题(本大题共4小题,每小题5分,共20分.全部选对的得5分,部分选对的得3分,有选错的得0分)9.(2020·湖南永州·月考)2020年新型冠状病毒肺炎疫情对消费饮食行业造成了很大影响,为了解A ,B 两家大型餐饮店受影响的程度,现统计了2020年2月到7月A ,B 两店每月营业额,得到如图所示的折线图,根据营业额折线图可知,下列说法正确的是( )A .A 店营业额的平均值超过B 店营业额的平均值 B .A 店营业额在6月份达到最大值C .A 店营业额的极差比B 店营业额的极差小D .A 店5月份的营业额比B 店5月份的营业额小 【答案】ABC【解析】A 店的2-7月的营业额1420264564362816355063+++++>+++++故A 正确,根据营业额折线图可知B 正确;A 店营业额的极差641450-=,B 店营业额的极差63261-=故C 正确,A 店5月份的营业额45比B 店5月份的营业额35大,故D 错误,故选:ABC10.(2020·山东济南外国语学校高三月考)下列说法正确的是( )A .将一组数据中的每个数据都乘以同一个非零常数a 后,方差也变为原来的a 倍B .设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位C .线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱D .在某项测量中,测量结果ξ服从正态分布N (1,σ2)(σ>0),则P (ξ>1)=0.5 【答案】BD【解析】对于选项A :将一组数据中的每个数据都乘以同一个非零常数a 后,方差变为原来的a 2倍,故错误.对于选项B :若有一个回归方程35y x =-,变量x 增加1个单位时,()351355y x x =-+=--,故y 平均减少5个单位,正确.对于选项C :线性相关系数|r |越大,两个变量的线性相关性越强;反之,线性相关性越弱,错误.对于选项D :在某项测量中,测量结果ξ服从正态分布N (1,σ2)(σ>0),由于正态曲线关于x =1对称,则P (ξ>1)=0.5,正确.故选:BD11.(2020·汨罗市第二中学高三开学考试)信息熵是信息论中的一个重要概念.设随机变量X 所有可能的取值为1,2,,n ,且1()0(1,2,,),1ni i i P X i p i n p ===>==∑,定义X 的信息熵21()log ni i i H X p p ==-∑.( )A .若n =1,则H (X )=0B .若n =2,则H (X )随着1p 的增大而增大C .若1(1,2,,)i p i n n==,则H (X )随着n 的增大而增大D .若n =2m ,随机变量Y 所有可能的取值为1,2,,m ,且21()(1,2,,)j m j P Y j p p j m +-==+=,则H (X )≤H (Y ) 【答案】AC【解析】对于A 选项,若1n =,则11,1i p ==,所以()()21log 10H X =-⨯=,所以A 选项正确.对于B 选项,若2n =,则1,2i =,211p p =-, 所以()()()121121X log 1log 1H p p p p =-⋅+-⋅-⎡⎤⎣⎦, 当114p =时,()221133log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,当13p 4=时,()223311log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,两者相等,所以B 选项错误. 对于C 选项,若()11,2,,i p i n n==,则()222111log log log H X n n nn n ⎛⎫=-⋅⨯=-= ⎪⎝⎭,则()H X 随着n 的增大而增大,所以C 选项正确.对于D 选项,若2n m =,随机变量Y 的所有可能的取值为1,2,,m ,且()21j m j P Y j p p +-==+(1,2,,j m =).()2222111log log m mi i i i i iH X p p p p ===-⋅=⋅∑∑ 122221222122121111log log log log m m m mp p p p p p p p --=⋅+⋅++⋅+⋅. ()H Y =()()()122221212122211111log log log m m m m m m m m p p p p p p p p p p p p -+-++⋅++⋅+++⋅+++12222122212221221121111log log log log m m m m m mp p p p p p p p p p p p ---=⋅+⋅++⋅+⋅++++由于()01,2,,2i p i m >=,所以2111i i m i p p p +->+,所以222111log log i i m ip p p +->+, 所以222111log log i i i i m ip p p p p +-⋅>⋅+, 所以()()H X H Y >,所以D 选项错误.故选:AC12.(2020·湖北黄石港·黄石二中月考)甲罐中有4个红球,3个白球和3个黑球;乙罐中有5个红球,3个白球和2个黑球.先从甲罐中随机取出一球放入乙罐,分别以1A ,2A 和3A 表示由甲罐取出的球是红球,白球和黑球的事件;再从乙罐中随机取出一球,以M 表示由乙罐取出的球是红球的事件,下列的结论:其中正确结论的为( ) A .()12P M =B .()1611P M A =C .事件M 与事件1A 不相互独立D .1A ,2A ,3A 是两两互斥的事件【答案】BCD 【解析】甲罐中有4个红球,3个白球和3个黑球;乙罐中有5个红球,3个白球和2个黑球.先从甲罐中随机取出一球放入乙罐,分别以1A 、2A 和3A 表示由甲罐取出的球是红球,白球和黑球的事件;再从乙罐中随机取出一球,以M 表示由乙罐取出的球是红球的事件, 对A ,463535541()1011101110111102P M =⨯+⨯+⨯=≠,故A 错误;对B ,11146()61011(|)4()1110P MA P M A P A ⨯===,故B 正确; 对C ,当1A 发生时,6()11P M =,当1A 不发生时,5()11P M =,∴事件M 与事件1A 不相互独立,故C 正确;对D ,1A ,2A ,3A 不可能同时发生,故是两两互斥的事件,故D 正确; 故选:BCD .三、填空题(本大题共4小题,每小题5分,共2013.(2020·海南期中)《周髀算经》记载了勾股定理的公式与证明,相传是由商高发现,故又称勾股定理为商高定理.我们把可以构成一个直角三角形三边的一组正整数称为勾股数.现从6、7、8、9、10这5个正整数中随机抽取3个数,则恰好构成勾股数的概率为______. 【答案】110【解析】从6、7、8、9、10这5个正整数中随机抽取3个数,可能的情况有()6,7,8、()6,7,9、()6,7,10、()6,8,9、()6,8,10、()6,9,10、()7,8,9、()7,8,10、()7,9,10、()8,9,10,共10种,其中恰好构成勾股数的情况有1种,为()6,8,10, 所以所求概率为110. 故答案为:110. 14.(2020·山西运城·高二期末(文))某企业对4个不同的部门的个别员工的年旅游经费调查发现,员工的年旅游经费y (单位:万元)与其年薪(单位:万元)有较好的线性相关关系,通过下表中的数据计算得到y 关于x 的线性回归方程为0.2529 1.4574y x =-.那么,相应于点(10,1.1)的残差为_______. 【答案】0.0284【解析】当10x =时, 1.16ˆ07y=, ∴残差为y- 1.1 1.07160.0284ˆy=-=. 故答案为0.0284.15.(2020·湖南永州·月考)甲、乙两人参加“社会主义价值观”知识竞赛,两人获一等奖的概率分别为13和12,若两人是否获得一等奖相互独立,则这两人中恰有一人获得一等奖的概率为_____. 【答案】12【解析】设甲乙分别获一等奖的概率为1()3P A =和1()2P B =,则这两人中恰有一人获得一等奖的概率1111()()323222P P AB P AB =+=⨯+⨯=,故答案为:1216.(2019·贵州贵阳一中高二月考)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行第5列的数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为______. 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481 【答案】01【解析】从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字开始向右读,第一个数为65,不符合条件,第二个数为72,不符合条件, 第三个数为08,符合条件,以下符合条件依次为:08,02,14,07,01, 故第5个数为01. 故答案为: 01四、解答题(本大题共6小题,共70分)17.(2020·全国月考(文))为了加快恢复疫情过后的经济,各地旅游景点相继推出各种优惠政策,刺激旅游消费.8月份,某景区一纪念品超市随机调查了180名游客到该超市购买纪念品的情况,整理数据,得到下表:(Ⅰ)估计8月份游客到该超市购买纪念品不少于90元的概率;(Ⅱ)估计8月份游客到该超市购买纪念品金额的平均值(结果精确到0.1,同一组中的数据用该组区间的中点值作代表);(Ⅲ)完成下面的22⨯列联表,并判断能否有99.5%的把握认为购买纪念品的金额与年龄有关.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.【答案】(Ⅰ)0.5;(Ⅱ)91.7;(Ⅲ)表格见解析,有.【解析】(Ⅰ)估计8月份游客到该超市购买纪念品不少于90元的概率为3040200.5180++=.(Ⅱ)估计8月份游客到该超市购买纪念品金额的平均值为1520453075401053013540165201650091.7180180⨯+⨯+⨯+⨯+⨯+⨯=≈.(Ⅲ)填写22⨯列联表,如下:则()2218024408036288011.667.8796012010476247K ⨯⨯-⨯==≈>⨯⨯⨯,因此,有99.5%的把握认为购买纪念品的金额与年龄有关.18.(2020·云南昆明一中月考(理))学校食堂统计了最近5天到餐厅就餐的人数x (百人)与食堂向食材公司购买所需食材(原材料)的数量y (袋),得到如下统计表:(1)根据所给的5组数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+; (2)已知购买食材的费用C (元)与数量y (袋)的关系为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩,投入使用的每袋食材相应的销售单价为700元,多余的食材必须无偿退还食材公司,据悉下周一大约有1500人到食堂餐厅就餐,根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材,才能获得最大利润,最大利润是多少?(注:利润L =销售收入-原材料费用)参考公式:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-参考数据:511343i ii x y==∑,521558i i x ==∑,5213237i i y ==∑【答案】(1) 2.51y x =-;(2)食堂购买36袋食,能获得最大利润,最大利润为11520元. 【解析】(1)由所给数据可得:1398101210.45x ++++==,3223182428255y ++++==,515222151343510.4252.5558510.45i ii i i x y x yb x x==-⋅-⨯⨯===-⨯-∑∑,25 2.510.41a y bx =-=-⨯=-,故y 关于x 的线性回归方程为 2.51y x =-.(2)因为 2.51y x =-,所以当15x =时36.5y =,即预计需要购买食材36.5袋,因为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩, 所以当36y <时,利润()7004002030020L y y y =--=+, 此时当35y =时,max 300352010520L =⨯+=, 当36y ≥时,由题意可知,剩余的食材只能无偿退还, 此时当36y时,700363803611520L =⨯-⨯=,当37y =时,利润70036.53803711490L =⨯-⨯=,综上所述,食堂应购买36袋食,才能获得最大利润,最大利润为11520元.19.(2020·北京期末)为了了解我市参加2018年全国高中数学联赛的学生考试结果情况,从中选取60名同学将其成绩(百分制,均为正数)分成[)[)[)[)[)[)40,50,50,60,60,70,70,80,80,90,90,100六组后,得到部分频率分布直方图(如图),观察图形,回答下列问题:(1)求分数在[)70,80内的频率,并补全这个频率分布直方图; (2)根据频率分布直方图,估计本次考试成绩的众数、均值;(3)根据评奖规则,排名靠前10%的同学可以获奖,请你估计获奖的同学至少需要所少分? 【答案】(1)详见解析(2)众数为:75和85,均值为:70.5(3)88分【解析】(1)设分数在[)70,80内的频率为x ,根据频率分布直方图,则有()0.010.0150.020.0250.005101x ++++⨯+=,可得0.25x =,∴分数在[)70,80内的频率为0.25.所以频率分布直方图为:(2)由图知,众数为:75和85均值为:450.10550.15650.2750.25850.25950.0570.5⨯+⨯+⨯+⨯+⨯+⨯=. (3)因为分数在[)80.90内的频率为0.25,[)90,100内的频率为0.05, 而()0.0510%0.250.05<<+所以得分前10%的分界点应在80至90之间. 设所求的分界点为90x -,则0.0250.0051010%x +⨯=,解得2x =.所以得分前10%的分界点为88,即获奖的同学至少需要88分.20.(2020·渝中·重庆巴蜀中学月考)从2021年起,重庆市将进行新高考改革,在选科方式、试卷形式、考查方法等方面都有很大的变化.在数学学科上,有如下变化:新高考不再分文理科数学,而是采用一套试题测评;新高考增加了多选题,给各种层次的学生更大的发挥空间;新高考引入开放性试题,能有效地考查学生建构数学问题、分析问题、解决向题的能力.已知新高考数学共4道多选题,评分标准是每题满分5分,全部选对得5分,部分选对得3分,有错选或不选的得0分.每道多选题共有4个选项,正确答案往往为2项或3项.为了研究多选题的答题规律,某数学兴趣小组研究发现:多选题正确答案是“选两项”的概率为12,正确答案是“选三项”的概率为12.现有学生甲、乙两人,由于数学基础很差,多选题完全没有思路,只能靠猜.(1)在已知某题正确答案是“选两项”的条件下,学生甲乱猜该题,求他不得0分的概率; (2)学生甲的答题策略是“猜一个选项”,学生乙的策略是“猜两个选项”,试比较两个同学的策略,谁的策略能得更高的分数?并说明理由. 【答案】(1)23;(2)学生甲的策略最好,理由见解析. 【解析】(1)分两类:乱猜一个选项得3分,乱猜两个选项得5分. ①猜一个选项得3分的概率为12; ②猜两个选项得5分的概率为222416C C =,故学生甲不得0分的概率112263P =+=. (2)设甲、乙两人的得分分别为X ,Y , 两人的得分期望分别为()E X ,()E Y , 学生甲:()11135322248P X ==⨯+⨯=,()11113022248P X ==⨯+⨯=, 学生甲的得分X 的分布列为故()8E X =. 学生乙:()232411324C P Y C ==⨯=,()2224115212C P Y C ==⨯=,()203P Y ==,学生乙的得分Y 的分布列为故()6E Y =, 因为()()E X E Y >,所以学生甲的策略最好.21.(2020·福建省福州第一中学开学考试)工作人员需进入核电站完成某项具有高辐射危险的任务,每次只派一个人进去,且每个人只派一次,工作时间不超过10分钟,如果有一个人10分钟内不能完成任务则撤出,再派下一个人.现在一共只有甲、乙、丙三个人可派,他们各自能完成任务的概率分别1p ,2p ,3p ,假设1p ,2p ,3p 互不相等,且假定各人能否完成任务的事件相互独立.(Ⅰ)如果按甲最先,乙次之,丙最后的顺序派人,求任务能被完成的概率.若改变三个人被派出的先后顺序,任务能被完成的概率是否发生变化?(Ⅱ)若按某指定顺序派人,这三个人各自能完成任务的概率依次为1q ,2q ,3q (1q ,2q ,3q 是1p ,2p ,3p 的一个排列),求所需派出人员数目X 的分布列和数学期望()E X (结果用1q ,2q ,3q 表示).【答案】(Ⅰ)123122313p p p p p p p p p ++---;不会发生变化;(Ⅱ)分布列见解析;()121232E X q q q q =--+.【解析】(Ⅰ)无论以怎样的顺序派出人员,任务不能被完成的概率都是()()()123111p p p ---,所以任务能被完成的概率与三个人被派出去的先后顺序无关,都等于()()()1231231223131111p p p p p p p p p p p p ----=++---, (Ⅱ)当依次派出去的三个人各自完成任务的概率分别为1q ,2q ,3q 时, 随机变量X 的分布列为:所派出人员数目的数学期望()E X 是()()()()1121212122131132E X q q q q q q q q q =+-+--=--+22.(2020·福建厦门一中月考)科学家为研究对某病毒有效的疫苗,通过小鼠进行毒性和药效预实验.已知5只小鼠中有1只患有这种病毒引起的疾病,需要通过化验血液来确定患病的小鼠.血液化验结果呈阳性的即为患病小鼠,呈阴性即没患病.下面是两种化验方案: 方案甲:逐个化验,直到能确定患病小鼠为止.方案乙:先任取3只,将它们的血液混在一起化验.若结果呈阳性则表明患病动物为这3只中的1只,然后再逐个化验,直到能确定患病小鼠为止;若结果呈阴性则在另外2只中任取1只化验.(1)求方案甲化验次数X 的分布列; (2)判断哪一个方案的效率更高,并说明理由.【答案】(1)详见解析(2)乙方案的效率更高,详见解析 【解析】(1)依题知X 的可能取值为1,2,3,4.44551(1)5A P X A ===,44551(2)5A P X A ===,44551(3)5A P X A ===,4444552(4)5A A P X A +===, 故方案甲化验次数X 的分布列为:设方案乙化验次数为Y ,则Y 可能取值为2,3.Y =2时的情况为先验三只结果为阳性,再从中逐一检验时,恰好一次检验出,或先验三只结果为阴性,再从其他两只中取出一只检验.则()23314342313253521325C A A AP Y A A A A ⨯⨯==⨯+=,()235P Y == 故方案乙化验次数Y 的分布列为:则() 2.855555E X =+++== () 2.45656E Y =+=()()E Y E X <,所以乙方案的效率更高.。
广东省2021高考数学学业水平合格考试总复习学业达标集训统计含解析

统计一、选择题1.贵阳地铁1号线12月28日开通运营,某辆机车某时刻从下麦西站驶往贵阳北站的过程中,10个车站上车的人数统计如下:70、60、60、50、60、40、40、30、30、10,则这组数据的众数、中位数、平均数的和为( )A .170B .165C .160D .150D [将这组数据从小到大排列:10、30、30、40、40、50、60、60、60、70,易知其众数为60,中位数为45,平均数为45,故众数、中位数、平均数的和为150.]2.从编号为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量为5的一个样本,若编号为42的产品在样本中,则该样本中产品的最小编号为( )A .8B .10C .12D .16B [系统抽样的分段间隔为805=16,设样本中产品的最小编号是x,42是第三组编号,因此x +2×16=42,得x =10.]3.由小到大排列的一组数据x 1,x 2,x 3,x 4,x 5,其中每个数据都小于-1,则样本1,x 1,-x 2,x 3,-x 4,x 5的中位数为( )A .1+x 22B .x 2-x 12C .1+x 52D .x 3-x 42C [因为x 1<x 2<x 3<x 4<x 5<-1,题目中数据共有六个, 排序后为x 1<x 3<x 5<1<-x 4<-x 2,故中位数是按从小到大排列后第三,第四两个数的平均数作为中位数, 故这组数据的中位数是12(x 5+1).故选C .]4.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和92A [∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数为12×(91+92)=91.5.平均数为18×(87+89+90+91+92+93+94+96)=91.5.]5.工人月工资(元)依劳动生产率(千元)变化的回归方程为y ^=60+90x ,下列判断正确的是( )A .劳动生产率为1千元时,工资为50元B .劳动生产率提高1千元时,工资提高150元C .劳动生产率提高1千元时,工资约提高90元D .劳动生产率为1千元时,工资为90元C [因工人月工资依劳动生产率变化的回归方程为y ^=60+90x ,当x 由a 提高到a +1时,y ^2-y ^1=60+90(a +1)-60-90a =90.]6.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A .93B .123C .137D .167C [由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137.] 7.从一堆苹果中任取10个,称得它们的质量如下(单位:克):125 120 122 105 130 114 116 95 120 134,则样本数据落在[114.5,124.5)内的频率为( )A .0.2B .0.3C .0.4D .0.5C [∵在125 120 122 105 130 114 116 95 120 134十个数字中,样本数据落在[114.5,124.5)内的有116,120,120,122共有四个,∴样本数据落在[114.5,124.5)内的频率为410=0.4,故选C .]8.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是()A.45 B.50C.55 D.60B[由频率分布直方图,知低于60分的频率为(0.01+0.005)×20=0.3.∴该班学生人数n=50.]=150.39.某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45)岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是()A.31.6岁B.32.6岁C.33.6岁D.36.6岁C[由题图可知,在区间[25,30)上的数据的频率为1-(0.01+0.07+0.06+0.02)×5=0.2.故中位数在第3组,且中位数的估计为30+(35-30)×0.250.35≈33.6(岁).]10.在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A,B两样本的下列数字特征对应相同的是() A.平均数B.标准差C.众数D.中位数B[利用平均数、标准差、众数、中位数等统计特征数的概念求解.由B样本数据恰好是A样本数据每个都减5后所得数据,可得平均数、众数、中位数分别是原来结果减去5,即与A样本不相同,标准差不变.]11.高三某班有学生56人,现将所有同学随机编号,用系统抽样的方法,抽取一个容量为4的样本,已知5号、33号、47号学生在样本中,则样本中还有一个学生的编号为()A .13B .17C .19D .21C [因为47-33=14,所以由系统抽样的定义可知样本中的另一个学生的编号为5+14=19.]12.如图茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩.(单位:分)已知甲组数据的平均数为17,乙组数据的中位数为17,则x ,y 的值分别为( ) A .2,6 B .2,7 C .3,6D .3,7D [依题意得9+10×2+2+x +20×2+7+4=17×5,即x =3,y =7,故选D .] 13.在样本频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形面积和的14,且样本容量为160,则中间一组的频数为( )A .32B .0.2C .40D .0.25A [由频率分布直方图的性质,可设中间一组的频率为x ,则x +4x =1, 所以x =0.2,故中间一组的频数为160×0.2=32,选A .]14.如图所示,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x A 和xB ,样本标准差分别为s A 和s B ,则()A .x A >xB ,s A >s B B .x A <x B ,s A >s BC .x A >x B ,s A <s BD .x A <x B ,s A <s BB [A 中的数据都不大于B 中的数据,所以x A <x B ,但A 中的数据比B 中的数据波动幅度大,所以s A >s B .]15.某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其均值和方差分别为x -和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A .x -,s 2+1002 B .x -+100,s 2+1002 C .x -,s 2D .x -+100,s 2D [x 1+x 2+…+x 1010=x -,y i =x i +100,所以y 1,y 2,…,y 10的均值为x -+100,方差不变,故选D .]二、填空题16.某大学共有本科生5000人,其中一、二、三、四年级的人数比为4∶3∶2∶1,要用分层抽样的方法从所有本科生中抽取一个容量为200的样本,则应抽取三年级的学生人数为 .40 [∵要用分层抽样的方法从该系所有本科生中抽取一个容量为200的样本, 一、二、三、四年级的学生比为4∶3∶2∶1, ∴三年级要抽取的学生人数是24+3+2+1×200=40.]17.已知一组正数x 1,x 2,x 3,x 4的方差为s 2=14 (x 21+x 22+x 23+x 24-16),则数据x 1+2,x 2+2,x 3+2,x 4+2的平均数为 .4 [由方差的计算公式可得:s 21=1n [x 21+x 22+…+x 2n ]-x 21=14(x 21+x 22+x 23+x 24-16),可得平均数x 1=2.对于数据x 1+2,x 2+2,x 3+2,x 4+2有x 2=2+2=4.]18.如图是某学校抽取的n 个学生体重的频率分布直方图,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第3小组的频数为18,则n 的值是 .48 [根据频率分布直方图,得从左到右的前3个小组的频率和为:1-(0.037 5+0.012 5)×5=0.75. 又∵这三组频率之比为1∶2∶3, ∴第3小组的频率为31+2+3×0.75=0.375,且对应的频数为18,∴样本容量n =180.375=48.]19.已知x ,y 的值如下表所示:如果y 与x 呈线性相关且回归直线方程为y ^=b ^x +3.5,那么b ^= .x 2 3 4 y5460.5 [由表可知x =3,y =5,代入y =b x +3.5得b =0.5.] 三、解答题20.随机抽样某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图所示.(1)根据茎叶图判断哪个班的平均身高较高; (2)计算甲班的样本方差.[解] (1)由茎叶图可知:甲班身高集中于160~179之间,而乙班身高集中于170~179之间,因此乙班的平均身高高于甲班.(2)x甲=158+162+163+168+168+170+171+179+179+18210=170,甲班的样本方差 s 2甲=110[(158-170)2+(162-170)2+(163-170)2+(168-170)2+(168-170)2+(170-170)2+(171-170)2+(179-170)2+(179-170)2+(182-170)2]=57.2.21.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得Σ10i =1x i =80,Σ10i =1y i =20,Σ10i =1x i y i =184,Σ10i =1x 2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程y ^=b ^x +a ^中,b ^=Σni =1x i y i -n x y Σn i =1x 2i -n x 2,a ^=y -b ^x ,其中x ,y 为样本平均值.[解] (1)由题意知n =10,x =110Σn i =1x i =8010=8,y =110Σ10i =1y i =2010=2, b ^=Σ10i =1x i y i -10x y Σ10i =1x 2i -10x 2=184-10×8×2720-10×82=2480=0.3,a ^=y -b ^x =2-0.3×8=-0.4, 故所求回归方程为y ^=0.3x -0.4.(2)由于变量y 的值随x 值的增加而增加(b ^=0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7(千元).。
模块二讲重点 概率与统计(3)统计及统计案例小题-2021届高考数学二轮复习课件(新高考版)

提取频率分布直方图中的数据
(1)组距、频率:频率分布直方图中每个矩形的宽表示
组距,高表示
频率 组距
,面积表示该组数据的频率,各个矩形
的面积之和为1;
(2)众数:最高小长方形底边中点的横坐标;
(3)中位数:平分频率分布直方图面积且垂直于横轴的
直线与横轴交点的横坐标;
(4)平均数:频率分布直方图中每个小长方形的面积乘
【分析】 由茎叶图,可得甲的中位数是65,从而可知乙 的中位数也是65,可得到y=5,再利用二者平均数也相等,可 求出x的值,即可得到答案.
【解析】 由茎叶图,可知甲的中位数为65,则乙的中位 数也是65,故y=5,
因为甲、乙的平均数相等, 所以56+62+65+5 74+70+x=59+61+657+65+78, 解得x=3.故选D.
小长方形底边中点的横坐标,再求和;
(5)参数:若纵轴上存在参数,则根据所有小长方形的
面积之和为1,列方程即可求得参数值.
用样本的数字特征估计总体的数字特征 (1)众数:一组数据中出现次数最多的数; (2)方差和标准差反映了数据波动程度的大小. ①方差:s2=1n[(x1--x )2+(x2--x )2+…+(xn--x )2]; ②标准差: s= n1[(x1--x )2+(x2--x )2+…+(xn--x )2]. 性质:标准差(或方差)越小,说明数据波动越小,越稳 定;标准差越大,说明数据越分散,越不稳定.
模 块 二 讲 重 点 第 1 0讲 概 率 与统 计(3) 统计及 统计案 例小题 -2021 届高考 数学二 轮复习 课件( 新高考 版)
模 块 二 讲 重 点 第 1 0讲 概 率 与统 计(3) 统计及 统计案 例小题 -2021 届高考 数学二 轮复习 课件( 新高考 版)
74.概率、随机变量专题1:概率中的加减乘除 课件-广东省惠来县第一中学2021届高三数学一轮复习

(包括长度比,面积比,角度比,
体积比);
5.若事件 A 与事件 B 独立,则 P(AB) P(A) P(B) ;
6.在 n 次独立重复试验中,事件 A 恰好发生 k 次的概率为 P(X k) Cnk pk (1 p)nk (k 0,1,,n ); 7.对于任意两个事件 A 和 B ,在已知事件 A 发生的条件下,事件B 发生的概率叫做条件概 率,用符号 P(B|A) 来表示,其中公式P(B|A)= P( AB) ;
61 , 000
故
1
张奖券的中奖概率约为 1
60100.
③设“1 张奖券不中特等奖且不中一等奖”为事件 N,则事件 N 与“1 张奖券中特等奖或中一等奖”为对立事件,
∴P(N)=1-P(A∪B)=1-
1
1 +1 000 100
= 989 , 1 000
故 1 张奖券不中特等奖且不中一等奖的概率为1908090.
1.概率题中往往出现“将频率视为概率”的字眼,频率是统计出来的, 概率是频率的稳定值,频率是概率的估计值。
2.随机模拟中有涉及古典概型的随机模拟,也有涉及几何概型的随机模拟。 3.可以通过大量试验来获取概率。
概率中的加减乘除
★概率中的加减乘除:
1. P(A B) P(A) P(B) P(A B) , P( A) 1 P( A) ;
题组四 : 事件的独立性
10.(2020 天津高考卷理科)已知甲、乙两球落入盒子的概率分别为1 和1 .假定两球是否落 1 23
入盒子互不影响,则2甲、乙两球都落入盒子的概率为_____6___;甲、乙两球至少有一个落 入盒子的概率为____3____.
题组四 : 事件的独立性
11.(2019全国Ⅰ卷理科第15题)甲、乙两队进行篮球决赛, 采取七场四胜制(当一队赢得四场胜利时,该队获胜, 决赛结束).根据前期比赛成绩,甲队的主客场安排依 次为“主主客客主客主” .设甲队主场取胜的概率为0.6, 客场取胜的概率为0.5,且各场比赛结果相互独立,则甲
2021高考数学押题专练统计概率(解析版)

押题20 统计概率【押题方向】统计概率是高考的重点和热点,从2019年高考情况来看,更是有压轴题的趋势,并且分值和题量都略有增加。
其中解答题考查涉及的主要方向有:(1)与社会生活紧密相连,紧跟时代步伐创设情境。
(2)概率的求解.同时也常渗透考查统计知识,背景新颖,体现了概率与统计的工具性和交汇性,综合考查考生的应用意识、阅读理解能力、数据处理能力和转化与化归思想的应用;(3)统计知识.其核心是样本数据的获得和分析方法,重点是频率分布直方图、茎叶图、样本的数字特征、线性回归方程、独立性检验,常与概率交汇命题,意在考查考生的数据分析能力和综合应用能力.【模拟专练】16.(2021·山东淄博市·高三二模)某市在司法知识宣传周活动中,举办了一场司法知识网上答题考试,要求本市所有机关、企事业单位工作人员均要参加考试,试题满分为100分,考试成绩大于等于90分的为优秀.考试结束后,组织部门从所有参加考试的人员中随机抽取了200人的成绩作为统计样本,得到样本平均数为82、方差为64.假设该市机关、企事业单位工作人员有20万人,考试成绩ξ服从正态分布()82,64N . (1)估计该市此次司法考试成绩优秀者的人数有多少万人?(2)该市组织部门为调动机关、企事业单位工作人员学习司法知识的积极性,制定了如下奖励方案:所有参加考试者,均可参与网上“抽奖赢手机流量”活动,并且成绩优秀者可有两次抽奖机会,其余参加者抽奖一次.抽奖者点击抽奖按钮,即随机产生一个两位数()10,11,,99,若产生的两位数的数字相同,则可获赠手机流量5G ,否则获赠手机流量1G .假设参加考试的所有人均参加了抽奖活动,试估计此次抽奖活动赠予的手机流量总共有多少G ? 参考数据:若()2,N ξμσ,则()0.68P μσξμσ-<<+=【详解】(1)由题意,随机抽取了200人的成绩作为统计样本,得到样本平均数为82、方差为64, 即82,8μσ==,所以考试成绩优秀者得分90ξ≥,即ξμσ≥+. 又由()0.68P μσξμσ-<<+≈,得()()110.680.162P ξμσ≥+≈-=. 所以估计该市此次司法考试成绩优秀者人数可达200.16 3.2⨯=万人. (2)设每位抽奖者获赠的手机流量为X G ,则X 的值为1,2,5,6,10.可得()()9756110.16101000P X ==-⨯=, ()29129620.161010000P X ⎛⎫==⨯=⎪⎝⎭, ()()184510.16101000P X ==-⨯=, ()9128860.162101010000P X ==⨯⨯⨯=,()2116100.161010000P X ⎛⎫==⨯=⎪⎝⎭. 所以随机变量X 的分布列为:所以()125610 1.62410001000010001000010000E X =⨯+⨯+⨯+⨯+⨯=(G ). 因此,估计此次抽奖活动赠予的手机流量总值为20 1.62432.48⨯=(万G ).17.(2021·山东德州市·高三二模)2020年1月15日教育部制定出台了《关于在部分高校开展基础学科招生改革试点工作的意见》(也称“强基计划”),《意见》宣布:2020年起不再组织开展高校自主招生工作,改为实行强基计划,强基计划主要选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生,据悉强基计划的校考由试点高校自主命题,校考过程中通过笔试后才能进入面试环节.(1)为了更好的服务于高三学生,某研究机构对随机抽取的5名高三学生的记忆力x 和判断力y 进行统计分析,得到下表数据请用相关系数说明该组数据中y 与x 之间的关系可用线性回归模型进行拟合,并求y 关于x 的线性回归方程ˆˆˆya bx =+. (2)现有甲、乙两所大学的笔试环节都设有三门考试科目且每门科目是否通过相互独立,若某考生报考甲大学,每门笔试科目通过的概率均为25,该考生报考乙大学,每门笔试科目通过的概率依次为m ,14,23,其中01m <<,根据规定每名考生只能报考强基计划的一所试点高校,若以笔试过程中通过科目数的数学期望为依据作出决策,求该考生更希望通过乙大学笔试时m 的取值范围.参考公式:①线性相关系数ni ix y nxyr -=∑r 的绝对值在0.95以上(含0.95)认为线性相关性较强;否则,线性相关性较弱.②对于一组数据()11,x y ,()22,x y ,…(),n n x y ,其回归直线方程ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆni ii nii x y nxybxnx ==-=-∑∑,ˆˆa y bx=-. 【详解】(1)根据表格中的数据,可得689101295x ++++==,2345645y ++++==,511224365072194i ii x y==++++=∑,521366481100144425i i x ==++++=∑,5214916253690ii y==++++=∑,可得相关系数0.990.95r ==≈>, 故y 与x 之间的关系可用线性回归模型进行拟合,又由1221194594ˆ0.7425581ni ii nii x y nxybxnx ==--⨯⨯===-⨯-∑∑,可得ˆ490.7 2.3a =-⨯=-.综上回归直线方程ˆ 2.30.7yx =-+. (2)通过甲大学的考试科目数235XB ⎛⎫ ⎪⎝⎭,,则()26355E X =⨯=,设通过乙大学的考试科目数为Y ,则Y 可能的取值为0,1,2,3, 则()()()12101111434P Y m m ⎛⎫⎛⎫==---=- ⎪⎪⎝⎭⎝⎭,()()()121212711111111434343123P Y m m m m ⎛⎫⎛⎫⎛⎫⎛⎫==--+-⨯⨯-+-⨯-⨯=- ⎪⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭,()()121212152111434343612P Y m m m m ⎛⎫⎛⎫==⨯-+⨯-⨯+-⨯⨯=+ ⎪ ⎪⎝⎭⎝⎭,()1213436P Y m m ==⨯⨯=,所以()711511123123612612E Y m m m m ⎛⎫=-+++⨯=+ ⎪⎝⎭, 因为该考生更希望通过乙大学的笔试考试,所以()()E Y E X >,即116125m +>, 又由01m <<,解得17160m <<, 即为该考生更希望通过乙大学的笔试时m 的范围为17,160⎛⎫⎪⎝⎭. 18.(2021·山东高三二模)2020年是全面建成小康社会之年,是脱贫攻坚收官之年.上坝村是乡扶贫办的科学养鱼示范村,为了调查上坝村科技扶贫成果,乡扶贫办调查组从该村办鱼塘内随机捕捞两次,上午进行第一次捕捞,捕捞到60条鱼,共105kg ,称重后计算得出这60条鱼质量(单位kg )的平方和为200.41,下午进行第二次捕捞,捕捞到40条鱼,共66kg .称重后计算得出这40条鱼质量(单位kg )的平方和为117. (1)请根据以上信息,求所捕捞100条鱼儿质量的平均数z 和方差2s ;(2)根据以往经验,可以认为该鱼塘鱼儿质量X 服从正态分布()2,N μσ,用z 作为μ的估计值,用2s 作为2σ的估计值.随机从该鱼塘捕捞一条鱼,其质量在[1.21,2.71]的概率是多少?(3)某批发商从该村鱼塘购买了5000条鱼,若从该鱼塘随机捕捞,记ξ为捕捞的鱼儿质量在[1.21,2.71]的条数,利用(2)的结果,求ξ的数学期望.附:(1)数据1t ,2t ,…n t 的方差()22221111n n i i i i s t tt nt n n ==⎛⎫=-=- ⎪⎝⎭∑∑,(2)若随机变量X 服从正态分布()2,N μσ,则()0.6827P X μσμσ-≤≤+=;(22)0.9545P X μσμσ-≤≤+=;(33)0.9973P X μσμσ-≤≤+=.【详解】(1)10566 1.716040z +==+,22200.411171.710.25100s +=-=.(2)该鱼塘鱼儿质量()2~,X N μσ,其中 1.71μ=,20.25σ=,所以(1.21 2.71)(2)P X P X μσμσ≤≤=-≤≤+.()(22)0.68270.95450.818622P X P X μσμσμσμσ-≤≤++-≤≤++===(3)由题意可知~(5000,0.8186)B ξ, 所以ξ的数学期望为()50000.81864093E ξ=⨯=.19.(2021·山东枣庄市·)天问一号火星探测器于2021年2月10日成功被火星捕获,实现了中国在深空探测领域的技术跨越.为提升探测器健康运转的管理水平,西安卫星测控中心组织青年科技人员进行探测器遥控技能知识竞赛,已知某青年科技人员甲是否做对每个题目相互独立,做对A ,B ,C 三道题目的概率以及做对时获得相应的奖金如表所示. 题目 ABC做对的概率 0.8 0.6 0.4 获得的奖金/元100020003000规则如下:按照A ,B ,C 的顺序做题,只有做对当前题目才有资格做下一题. (1)求甲获得的奖金X 的分布列及均值;(2)如果改变做题的顺序,获得奖金的均值是否相同?如果不同,你认为哪个顺序获得奖金的均值最大?(不需要具体计算过程,只需给出判断) 【详解】(1)解:分别用A ,B ,C 表示做对题目A ,B ,C 的事件,则A ,B ,C 相互独立. 由题意,X的可能取值为0,1000,3000,6000.()()00.2P X P A ===;()()10000.80.40.32P X P AB ===⨯=; ()()30000.80.60.60.288P X P ABC ===⨯⨯=;()()60000.80.60.40.192P X P ABC ===⨯⨯=.所以甲获得的奖金X 的分布列为:()00.210000.3230000.28860000.1922336E X =⨯+⨯+⨯+⨯=.(2)改变做题的顺序,获得奖金的均值互不相同.决策的原则是选择期望值()E X 大的做题顺序,这称为期望值原则.做对的概率大表示题目比较容易,做对的概率小表示题目比较难.猜想:按照由易到难的顺序做题,即按照题目A ,B ,C 的顺序做题,得到奖金的期望值最大.20.(2021·山东临沂市·高三其他模拟)下围棋既锻炼思维又愉悦身心,有益培养人的耐心和细心,舒缓大脑并让其得到充分休息.现某学校象棋社团为丰富学生的课余生活,举行象棋大赛,要求每班选派一名象棋爱好者参赛.现某班有12位象棋爱好者,经商议决定采取单循环方式进行比赛,(规则采用“中国数目法”,没有和棋.)即每人进行11轮比赛,最后靠积分选出第一名去参加校级比赛.积分规则如下(每轮比赛采取5局3胜制,比赛结束时,取胜者可能会出现3:0,3:1,3:2.三种赛式).9轮过后,积分榜上的前两名分别为甲和乙,甲累计积分26分,乙累计积分22分.第10轮甲和丙比赛,设每局比赛甲取胜的概率均为23,丙获胜的概率为13,各局比赛结果相互独立. (1)①在第10轮比赛中,甲所得积分为X ,求X 的分布列; ②求第10轮结束后,甲的累计积分Y 的期望;(2)已知第10轮乙得3分,判断甲能否提前一轮获得累计积分第一,结束比赛.(“提前一轮”即比赛进行10轮就结束,最后一轮即第11轮无论乙得分结果如何,甲累计积分最多)?若能,求出相应的概率;若不能,请说明理由. 【详解】(1)①由题意,随机变量X 的可能取值为3,2,1,0,则()322322221631333327P X C ⎛⎫⎛⎫⎛⎫⎛⎫==+-= ⎪ ⎪⎪⎪⎝⎭⎝⎭⎝⎭⎝⎭,()2224222162133381P X C ⎛⎫⎛⎫⎛⎫==⋅-⋅= ⎪⎪ ⎪⎝⎭⎝⎭⎝⎭, ()2324228113381P X C ⎛⎫⎛⎫==⋅-= ⎪ ⎪⎝⎭⎝⎭, ()331322210113339P X C ⎛⎫⎛⎫⎛⎫==-+-= ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭,所以X 的分布列为X 32 1 0P16271681 881 19②随机变量Y 的可能取值为29,28,27,26, 则()161681229029282726278181981E Y =⨯+⨯+⨯+⨯= ()2若3X =,则甲10轮后的总积分为29分,乙即便第10轮和第11轮都得3分,则11轮过后的总积分是28分,2928>,所以甲如果第10轮积3分,则可提前一轮结束比赛,其概率为()16327P X ==. 【押题专练】1.2017年国家发改委、住建部发布了《生活垃圾分类制度实施方案》规定46个城市在2020年底实施生活垃圾强制分类,垃圾回收、用率要达35%以上.某市在实施垃圾分类之前,对该市大型社区(即人口数量在1万左右)一天产生的垃圾量(单位:吨)进行了调查.已知该市这样的大型社区有200个,如图是某天从中随机抽取50个社区所产生的垃圾量绘制的频率分布直方图.现将垃圾量超过14吨/天的社区称为“超标”社区.(1)根据上述资料,估计当天这50个社区垃圾量的平均值x (四舍五入精确到整数);(2)若当天该市这类大型社区的垃圾量()~,9X N μ,其中μ近似为(1)中的样本平均值x ,请根据X 的分布估计这200个社区中“超标”社区的个数(四舍五入精确到整数);(3)市环保部门决定对样本中“超标”社区的垃圾来源进行调查,现从这些社区中随机抽取3个进行重点监控,设Y 为其中当天垃圾量至少为16吨的社区个数,求Y 的分布列与数学期望. 附:()0.6827P X μσμσ-<≤+≈;(22)0.9545P X μσμσ-<≤+≈;(33)0.9974P X μσμσ-<≤+≈.【详解】(1)由频率分布直方图得该样本中垃圾量为[)4,6,[)6,8,[)8,10,[)10,12,[)12,14,[)14,16,[]16,18的频率分别为0.08,0.1,0.2,0.24,0.18,0.12,0.08,50.0870.1090.20110.24130.18150.12170.0811.0411,x =⨯+⨯+⨯+⨯+⨯+⨯+⨯=≈所以当天这50个社区垃圾量的平均值为11吨; (2)由(1)知11μ=,29σ=,3σ∴=,10.6827(14)()0.158652P X P X μσ-∴>=>+==, 所以这200个社区中“超标”社区的个数为2000.1586532⨯≈;(3)由(1)得样本中当天垃圾量为[)14,16的社区有500.126⨯=个,垃圾量为[)16,18的社区有500.084⨯=个,所以Y 的可能取值为0,1,2,3,363101(0)6C P Y C ===,21643101(1)2C C P Y C ===,12643103(2)10C C P Y C ===,343101(3)30C P Y C ===,Y ∴的分布列为()01236210305E Y ∴=⨯+⨯+⨯+⨯=.2.到2020年年底,经过全党全国各族人民共同努力,现行标准下9899万农村贫困人口全部脱贫,832个贫困县全部摘帽,12.8万个贫困村全部出列,区域性整体贫困得到解决,完成了消除绝对贫困的艰巨任务.在接下来的5年过渡期,为巩固脱贫成果,将继续实行“四个不摘”,某市工作小组在2021年继续为已脱贫群众的生产生活进行帮扶,工作小组经过多方考察,引进了一种新的经济农作物,并指导一批农户于2021年初开始种植.已知该经济农作物每年每亩的种植成本为1000元,根据前期各方面调查发现,由于天气、市场经济等因素的影响,近几年该经济农作物的亩产量与每千克售价具有随机性,且互不影响,其具体情况如下表:(1)设2021年当地某农户种植一亩该经济农作物的纯收入为X 元,求X 的分布列;(2)已知当地某农户在2021年初种植了3亩该经济农作物,假设各亩地的产量相互独立,求该农户在2021年通过种植该经济农作物所获得的纯收入超过12000元的概率. (注:纯收入=种植收入-种植成本) 【详解】(1)由题知一亩地的种植收入可能为4000,6000,9000,故X 的所有可能取值为3000,5000,8000(3000)0.40.250.1P X ==⨯=,(5000)0.40.750.60.250.45P X ==⨯+⨯=, (8000)0.60.750.45P X ==⨯= X 的分布列为:(2)纯收入超过12000元,即3亩地种植收入超过15000元, 若价格为10元/kg ,则3亩地的总产量超过1500kg , 因为40026001500⨯+<,所以符合条件的概率为()22330.750.250.750.40.3375C ⨯⨯+⨯=.若价格为15元/kg ,则3亩地的总产量超过1000kg ,34001000⨯>, ∴P (纯收入超过1200元)0.60.33750.9375=+=3.第24届冬季奥林匹克运动会,将于2022年2月4日至2022年2月20日在北京举行实践“绿色奥运、科技奥运、人文奥运”理念,举办一届“有特色、高水平”的奥运会,是中国和北京的庄严承诺,也是全世界的共同期待.为宣传北京冬奥会,激发人们参与冬奥会的热情,某市开展了关于冬奥知识的有奖问答.从参与的人中随机抽取100人,得分情况如下:(1)得分在80分以上称为“优秀成绩”,从抽取的100人中任取2人,记“优秀成绩”的人数为X ,求X 的分布列及数学期望;(2)由直方图可以认为,问卷成绩值Y 服从正态分布()2,N μσ,其中μ近似为样本平均数,2σ近似为样本方差.①求(77.289.4)P Y <<;②用所抽取100人样本的成绩去估计城市总体,从城市总人口中随机抽出2000人,记Z 表示这2000人中分数值位于区间(77.2,89.4)的人数,利用①的结果求()E Z .15012.2≈14612.1≈,()0.6826P Y μσμσ-<<+=,(22)0.9544P Y μσμσ-<<+=,(33)0.9974P Y μσμσ-<<+=.【详解】(1)得分80以上的人数为10010(0.0080.002)10⨯⨯+=,X 可能取值为0,1,22902100C 89(0)C 110P X ===,1110902100C C 2(1)C 11P X ===,2102100C 1(2)C 110P X ===, X 分布列为: X 012P89110 211 1110()012110111105E X =⨯+⨯+⨯=. (2)10(350.002450.009550.022650.033750.024850.008950.002)x =⨯⨯+⨯+⨯+⨯+⨯+⨯+⨯65=22222(3565)100.002(4565)100.009(5565)100.022(7565)100.024s =-⨯⨯+-⨯⨯+-⨯⨯+-⨯⨯ 22(8565)100.008(9565)100.002150+-⨯⨯+-⨯⨯=取65x μ==,12.2σ==①1(77.289.4)[(22)()]0.13592P Y P Y P Y μσμσμσμσ<<=-<<+--<<+= ②~(2000,0.1359)Z B ,()20000.1359271.8E Z =⨯=4.在刚刚过去的寒假,由于新冠疫情的影响,哈尔滨市的A 、B 两所同类学校的高三学年分别采用甲、乙两种方案进行线上教学,为观测其教学效果,分别在两所学校的高三学年各随机抽取60名学生,对每名学生进行综合测试评分,记综合评分为80及以上的学生为优秀学生,经统计得到两所学校抽取的学生中共有72名优秀学生.(1)用样本估计总体,以频率作为概率,若在A 、B 两个学校的高三学年随机抽取3名学生,求所抽取的学生中的优秀学生数的分布列和数学期望;(2)已知A 学校抽出的优秀学生占该校抽取总人数的23,填写下面的列联表,并判断能否在犯错误的概率不超过0.1的前提下认为学生综合测试评分优秀与教学方案有关.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. 【详解】()1由已知,学生为优秀的概率为720.6120=, 记优质学生数为X ,由题意知,X 的所有可能取值为0,1,2,3.则()()30300.40.064P X C ===,()()23110.40.60.288P X C ===,()()22320.40.60.432P X C ===,()()33330.60.216P X C ===.故X 的分布列为所以X 的数学期望为()30.6 1.8E X =⨯=.()2填写列联表如下计算()2212040282032 2.22 2.70660607248k ⨯-⨯=≈<⨯⨯⨯,所以不能在犯错误的概率不超过0.1的前提下认为学生综合测试评分优秀与教学方案有关.5.为了调查A 地区200000名学生寒假期间在家的课外阅读时间,研究人员随机抽取了20000名学生作调查,所得结果统计如下表所示:(1)若阅读的时间Z 近似地服从正态分布(),64N μ,其中μ为这20000名学生阅读时间的平均值,试估计这200000名学生中阅读时间在(]6,38的学生人数(同一组数据用该组区间的中点值为代表); (2)以频率估计概率,若从全体学生中随机抽取5人,记阅读时间在(]30,40中的人数为X ,求X 的分布列和数学期望()E X ;(3)为了调查阅读时间与性别是否具有相关性,研究人员从这20000名学生中再随机抽取500名男生和500名女生作进一步调查,所得数据如下表所示,判断是否有99.9%的把握认为阅读时间与性别具有相关性.附:若()2~,Z N μσ,则()0.6827P Z μσμσ-<≤+=,()220.9545P Z μσμσ-<≤+=,()330.9973P Z μσμσ-<≤+=.()()()()()22n ad bc K a b c d a c b d -=++++.【详解】(1)依题意,5200153700255300358000452300555003020000μ⨯+⨯+⨯+⨯+⨯+⨯==,则()230,8ZN ,故()()0.68270.997363830.842P Z P Z μσμσ+<≤=-<≤+==,故所求人数约为2000000.84168000⨯=人.(2)由题意,可得阅读时间在(]30,40的人数所占的频率为80002200005=,所以2~5,5XB ⎛⎫⎪⎝⎭,X 的可能取值为0,1,2,3,4,5.所以()53243053125P X ⎛⎫=== ⎪⎝⎭,()4152********C 553125625P X ⎛⎫⎛⎫==== ⎪⎪⎝⎭⎝⎭, ()23252310802162C 553125625P X ⎛⎫⎛⎫==== ⎪ ⎪⎝⎭⎝⎭,()3235237201443553125625P X C ⎛⎫⎛⎫==== ⎪ ⎪⎝⎭⎝⎭, ()24523240484C 553125625P X ⎛⎫⎛⎫==== ⎪ ⎪⎝⎭⎝⎭,()5232553125P X ⎛⎫=== ⎪⎝⎭, 故X 的分布列为:故()525E X=⨯=.(3)完善列联表如下:由于()221000300400200100166.6710.828 500500400600K⨯⨯-⨯=≈>⨯⨯⨯,所以有99.9%的把握认为阅读时间与性别具有相关性.。
高考数学压轴专题2020-2021备战高考《计数原理与概率统计》专项训练解析附答案

【最新】数学《计数原理与概率统计》期末复习知识要点一、选择题1.已知()929012913x a a x a x a x -=++++L ,则019a a a +++…等于( ) A .92B .94C .93D .1【答案】B【解析】【分析】求出二项式()913x -展开式的通项为()193r r r T C x +=⋅-,可知当r 为奇数时,0r a <,当r 为偶数时,0r a >,然后代入1x =-即可得出019a a a ++⋯+的值.【详解】二项式()913x -展开式的通项()193rr r T C x +=⋅-,当r 为奇数时,0r a <,当r 为偶数时,0r a >, 因此,()990191314a a a ⎡⎤++⋯+=-⨯-=⎣⎦. 故选:B.【点睛】本题考查利用赋值法求各项系数绝对值之和,要结合二项式定理判断各项系数的符号,考查推理能力与计算能力,属于中等题.2.设某中学的女生体重y (kg )与身高x (cm )具有线性相关关系,根据一组样本数(),i i x y ()1,2,3,,i n =L L ,用最小二乘法建立的线性回归直线方程为ˆ0.8585.71yx =-,给出下列结论,则错误的是( ) A .y 与x 具有正的线性相关关系B .若该中学某女生身高增加1cm ,则其体重约增加0.85kgC .回归直线至少经过样本数据(),i i x y ()1,2,3,,i n =L L 中的一个D .回归直线一定过样本点的中心点(),x y【答案】C【解析】【分析】根据回归直线方程的性质和相关概念,对选项进行逐一分析即可.【详解】因为0.850k =>,所以y 与x 具有正的线性相关关系,故A 正确;该中学某女生身高增加1cm ,则其体重约增加0.85kg ,故B 正确; 回归直线一定过样本点的中心点(),x y ,回归直线有可能不经过样本数据,故D 正确;C 错误.故选:C .【点睛】本题考查线性回归直线方程的定义,相关性质,属基础题.3.我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,在不超过20的素数中,随机选取两个不同的数,其和等于20的概率是( )A .112B .115C .118D .114【答案】D【解析】【分析】先得到随机抽取两个不同的数共有28种,再得出选取两个不同的数,其和等于20的共有2中,结合古典概型的概率计算公式,即可求解.【详解】由题意,在不超过20的素数有:2,3,5,7,11,13,17,19,共有8个数,随机选取两个不同的数,共有2828C =种,其中随机选取的两个不同的数,其和为20的有31720,71320+=+=,共有2种, 所以概率为212814P ==. 故选:D .【点睛】本题主要考查了古典概型及其概率的计算,其中解答中利用组合数的公式求得基本事件的总数是解答的关键,着重考查了推理与运算能力.4.某小学要求下午放学后的17:00-18:00接学生回家,该学生家长从下班后到达学校(随机)的时间为17:30-18:30,则该学生家长从下班后,在学校规定时间内接到孩子的概率为( )A .78B .34C .12D .14【答案】A【解析】【分析】根据题意,设学生出来的时间为x ,家长到达学校的时间为y ,转化成线性规划问题,利用面积型几何概型求概率,即可求得概率.【详解】解:根据题意,设学生出来的时间为x ,家长到达学校的时间为y ,学生出来的时间为17:00-18:00,看作56x ≤≤,家长到学校的时间为17:30-18:30,5.5 6.5y ≤≤,要使得家长从下班后,在学校规定时间内接到孩子,则需要y x ≥,则相当于565.5 6.5x y ≤≤⎧⎨≤≤⎩,即求y x ≥的概率, 如图所示:约束条件对应的可行域面积为:1,则可行域中y x ≥的面积为阴影部分面积:111712228-⨯⨯=, 所以对应的概率为:77818=, 即学生家长从下班后,在学校规定时间内接到孩子的概率为:78. 故选:A.【点睛】本题考查利用面积型几何概型求概率,考查运算求解能力. 5.设*N n ∈,n a 为()()41n nx x +-+的展开式的各项系数之和,7c t =-,R t ∈,1222555n n n na a a b ⎡⎤⎡⎤⎡⎤=+++⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦L ([]x 表示不超过实数x 的最大整数).则()()22n n t b c -++的最小值为( ) A .12 B .22 C .22D .32【答案】A【解析】【分析】令1x =可得,52n n n a =-,求出n b ,则22()()n n t b c -++的几何意义为点(n ,2)(*)2n n n N -∈到点(,7)t t -的距离的平方,最小值即(3,3)到7y t =-的距离d 的平方,然后由点到直线的距离公式求解即可得答案.【详解】令1x =可得,52n nn a =-,2[][]55nn n n na n n =-g , 设25n n n n c =g ,所以1+11(1)22223()()055555n n n n n n n n n c c n +++-=-=-<g g , 所以数列{}n c 单调递减,所以数列2{}5nn n n -g 是单调递增数列,(增函数+增函数=增函数) 当n →+∞时,20,5n n n →g 且20,5nn n >g 所以2[][]155n n n n na n n n =-=-g . 21222[][][]12(1)5552n n n na a a n n b n -=++⋯+=++⋯+-=, 则22()()n n t b c -++的几何意义为点(n ,2)(*)2n n n N -∈到点(,7)t t -的距离的平方, 即求点(n ,2)(*)2n n n N -∈到7y t =-的距离d 的最小值,所以222|7|157|14||()|4424n n n d n n n -+-==+-=+-,当1n =时,957||=4444d =-; 当2n =时,2557||=4444d =- 当3n =时,4957||44d =-; 当4n =时,8157||6=44d =-; 由函数的图象可知当5,6,7,n =L时,d > 所以点(n ,2)(*)2n n n N -∈为(3,3)时,它到7y t =-的距离d 最小,d ==Q ,∴2. ∴()()22n n t b c -++的最小值为12. 故选:A .【点睛】本题考查了二项式定理的应用,考查了点到直线的距离公式,意在考查学生对这些知识的理解掌握水平和分析推理能力.6.如果一个三位数,各位数字之和等于10,但各位上数字允许重复,则称此三位数为“十全九美三位数”(如235,505等),则这种“十全九美三位数”的个数是()A.54 B.50C.60 D.58【答案】A【解析】【分析】利用分类计数原理,分成有重复数字和无重复数字的情况,即可得答案.【详解】利用分类计数原理,分成有重复数字和无重复数字的情况:(1)无重复数字:109,190,901,910,127,172,271,217,721,712,136,163,316,361,613,631,145,154,451,415,514,541,208,280,802,820,235,253,352,325,523,532,307,370,703,730,406,460,604,640,共40个,(2)有重复数字:118,181,811,226,262,622,334,343,433,442,424,244,550,505,共14个.故选:A.【点睛】本题考查分类计数原理的应用,考查逻辑推理能力和运算求解能力,求解时注意不重不漏.7.某校组织由5名学生参加的演讲比赛,采用抽签法决定演讲顺序,在“学生甲和乙都不是第一个出场,甲不是最后一个出场”的前提下,学生丙第一个出场的概率为()A.13B.14C.15D.12【答案】A【解析】【分析】根据条件概率的公式与排列组合的方法求解即可.【详解】由题意得学生甲和乙都不是第一个出场,甲不是最后一个出场的概率113333155C C A9A20P==,其中学生丙第一个出场的概率1333255C A3A20P==,所以所求概率为2113PPP==.故选:A【点睛】本题主要考查了根据排列组合的方法求解条件概率的问题,属于中等题型.8.已知不等式501x x -<+的解集为P ,若0x P ∈,则“01x <”的概率为( ). A .14 B .13 C .12 D .23【答案】B【解析】【分析】【详解】分析:解分式不等式得集合P ,再根据几何概型概率公式(测度为长度)求结果. 详解:(5)(1)050101x x x x x -+<⎧-<⇒⎨+≠+⎩, ∴{}|15P x x =-<<,||111x x <⇒-<<, ∴1(1)15(1)3P --==--. 选B .点睛:(1)当试验的结果构成的区域为长度、面积、体积等时,应考虑使用几何概型求解.(2)利用几何概型求概率时,关键是试验的全部结果构成的区域和事件发生的区域的寻找,有时需要设出变量,在坐标系中表示所需要的区域.9.在区间[1,1]-上随机取一个数k ,使直线(3)y k x =+与圆221x y +=相交的概率为( )A .12B .13C .4D .3【答案】C【解析】【分析】根据直线与圆相交,可求出k 的取值范围,根据几何概型可求出相交的概率.【详解】因为圆心(0,0),半径1r =,直线与圆相交,所以1d =≤,解得44k -≤≤所以相交的概率224P ==,故选C. 【点睛】本题主要考查了直线与圆的位置关系,几何概型,属于中档题.10.3ax ⎛ ⎝⎭的展开式中,第三项的系数为1,则11a dx x =⎰( ) A .2ln 2B .ln 2C .2D .1【答案】A【解析】【分析】 首先根据二项式定理求出a ,把a 的值带入11a dx x⎰即可求出结果. 【详解】 解题分析根据二项式36ax ⎛- ⎝⎭的展开式的通项公式得221213()4a T C ax x +⎛== ⎝⎭. Q 第三项的系数为1,1,44aa ∴=∴=, 则4411111d d ln 2ln 2a x x x x x ===⎰⎰. 故选:A【点睛】本题考查二项式定理及定积分. 需要记住二项式定理展开公式:1C k n k k k n T a b -+=.属于中等题.11.已知某口袋中有3个白球和a 个黑球(*a N ∈),现从中随机取出一球,再换回一个不同颜色的球(即若取出的是白球,则放回一个黑球;若取出的是黑球,则放回一个白球),记换好球后袋中白球的个数是ξ.若3E ξ=,则D ξ= ( )A .12B .1C .32D .2【答案】B【解析】由题意2ξ=或4,则221[(23)(43)]12D ξ=-+-=,故选B .12.若二项式2nx ⎫⎪⎭的展开式中各项的系数和为243,则该展开式中含x 项的系数为( )A .1B .5C .10D .20 【答案】C【解析】【分析】对2n x x ⎛⎫+ ⎪⎝⎭令1x =,结合展开式中各项的系数和为243列方程,由此求得n 的值,再利用二项式展开式的通项公式,求得含x 项的系数. 【详解】 对2n x x ⎛⎫+ ⎪⎝⎭令1x =得()123243n n +==,解得5n =.二项式52x x ⎛⎫+ ⎪⎝⎭展开式的通项公式为()515312225522r r r r r rC x x C x ---⎛⎫⋅⋅=⋅⋅ ⎪⎝⎭,令53122r -=,解得1r =,故展开式中含x 项的系数为115210C ⋅=.故选:C.【点睛】本小题主要考查二项式展开式各项系数之和,考查求二项式展开式指定项的系数,属于基础题.13.赵爽是我国古代数学家、天文学家,大约在公元222年,赵爽为《周髀算经》一书作序时,介绍了“勾股圆方图”,亦称“赵爽弦图”(以弦为边长得到的正方形是由4个全等的直角三角形再加上中间的一个小正方形组成的).类比“赵爽弦图”.可类似地构造如下图所示的图形,它是由3个全等的三角形与中间的一个小等边三角形拼成一个大等边三角形.设22DF AF ==,若在大等边三角形中随机取一点,则此点取自小等边三角形(阴影部分)的概率是( )A .413B 213C .926D 313【答案】A【解析】【分析】根据几何概率计算公式,求出中间小三角形区域的面积与大三角形面积的比值即可.【详解】在ABD ∆中,3AD =,1BD =,120ADB ∠=︒,由余弦定理,得222cos12013AB AD BD AD BD =+-⋅︒所以DF AB =.所以所求概率为24=13DEF ABC S S ∆∆=. 故选A.【点睛】本题考查了几何概型的概率计算问题,是基础题.14.将编号1,2,3,4的小球放入编号为1,2,3盒子中,要求不允许有空盒子,且球与盒子的编号不能相同,则不同的放球方法有A .6种B .9种C .12种D .18种【答案】C【解析】由题意可知,这四个小球有两个小球放在一个盒子中,当四个小球分组为如下情况时,放球方法有:当1与2号球放在同一盒子中时,有2种不同的放法;当1与3号球放在同一盒子中时,有2种不同的放法;当1与4号球放在同一盒子中时,有2种不同的放法;当2与3号球放在同一盒子中时,有2种不同的放法;当2与4号球放在同一盒子中时,有2种不同的放法;当3与4号球放在同一盒子中时,有2种不同的放法;因此,不同的放球方法有12种.故选:C15.在航天员进行的一项太空实验中,先后要实施6个程序,其中程序A 只能出现在第一步或最后一步,程序B 和C 实施时必须相邻,请问实验顺序的编排方法共有A .24种B .48种C .96种D .144种【答案】C【解析】由题意知程序A 只能出现在第一步或最后一步,∴从第一个位置和最后一个位置选一个位置把A 排列,有122A =种结果,Q 程序B 和C 实施时必须相邻,∴把B 和C 看做一个元素,同除A 外的3个元素排列,注意B 和C 之间还有一个排列,共有424248A A =,根据分步计数原理知共有24896⨯=种结果,故选C.16.2019年10月1日,中华人民共和国成立70周年,举国同庆.将2,0,1,9,10这5个数字按照任意次序排成一行,拼成一个6位数,则产生的不同的6位数的个数为( ) A .96 B .84 C .120 D .360【答案】B【解析】【分析】先求得所有不以0开头的排列数,再由以1,0相邻,且1在左边时所对应的排列数有一半是重复的,求出对应的排列数,进而可求出答案.【详解】由题意,2,0,1,9,10按照任意次序排成一行,得所有不以0开头的排列数为444A 96=,其中以1,0相邻,且1在左边时,含有2个10的排列个数为44A 24=,有一半是重复的,故产生的不同的6位数的个数为961284-=.故选:B.【点睛】本题考查排列组合,考查学生的推理能力与计算求解能力,属于中档题.17.若随机变量()23,X N σ:,且()50.2P X ≥=,则()15P X ≤≤等于( ) A .0.6B .0.5C .0.4D .0.3 【答案】A【解析】【分析】由正态密度曲线的对称性得出()()15125P X P X ≤≤=-≥,由此可得出结果.【详解】由于()23,X N σ:,则正态密度曲线关于直线3x =对称,所以()()15125120.20.6P X P X ≤≤=-≥=-⨯=,故选A.【点睛】本题考查正态分布在指定区间上概率的计算,解题时要确定正态密度曲线的对称轴,利用对称性列等式计算,考查计算能力,属于中等题.18.先后投掷骰子(骰子的六个面分别标有1、2、3、4、5、6个点)两次落在水平桌面后,记正面朝上的点数分别为,x y ,设事件A 为“x y +为偶数”,事件B 为“x y 、中有偶数,且x y ≠”,则概率()P B A =( )A .13B .12C .14D .25【答案】A【解析】【分析】根据题意有()))|(=(n AB P n A A B ,所以只须分析事件A 和事件AB 所包含的基本事件,即可根据公式求出结果.解:事件A 中“x y +为偶数”,所以,x y 同奇同偶,共包含22318⨯=种基本事件;事件AB 同时发生,则,x y 都为偶数,且x y ≠,则包含236A =个基本事件;()()61=)13|=(8n AB n A P B A =. 故选:A.【点睛】 本题考查条件概率的应用,考查基本事件的求法,解题的关键是辨析条件概率,属于基础题.19.我国南宋数学家杨辉1261年所著的《详解九章算法》一书里出现了如图所示的表,即杨辉三角,这是数学史上的一个伟大成就,在“杨辉三角”中,第n 行的所有数字之和为12n -,若去除所有为1的项,依次构成数列2,3,3,4,6,4,5,10,10,5,…,则此数列的前15项和为( )A .110B .114C .124D .125【答案】B【解析】【分析】 利用二项式系数对应的杨辉上三角形的第1n +行,令1x =,得到二项展开式的二项式系数的和,再结合等差、等比数列的求和公式,即可求解.【详解】 由题意,n 次二项式系数对应的杨辉三角形的第1n +行,令1x =,可得二项展开式的二项式系数的和2n ,其中第1行为02,第2行为12,第3行为22,L L 以此类推,即每一行的数字之和构成首项为1,公比为2的对边数列,则杨辉三角形中前n 行的数字之和为122112n n n S -==--, 若除去所有为1的项,则剩下的每一行的数字的个数为1,2,3,4,L可以看成构成一个首项为1,公差为2的等差数列,则(1)2n n n T +=, 令(1)152n n +=,解得5n =, 所以前15项的和表示前7行的数列之和,减去所有的1,即()72113114--=, 即前15项的数字之和为114,故选B.本题主要考查了借助杨辉三角形的系数与二项式系数的关系考查等差、等比数列的前n 项和公式的应用,其中解答中认真审题,结合二项式系数,利用等差等比数列的求和公式,准确运算是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.20.若实数2a =1019228101010222a C a C a -+-+L 等于( )A .32B .-32C .1 024D .512【答案】A【解析】由题意可得: ()()1019222101010101022222232.a C a C a a -+-+=-==L本题选择A 选项.。
新高考数学二轮总复习第三部分专题六.3统计与概率小题专项练课件

C 15 C 110
取法,所求概率为 2
C 15
=
50
105
=
10
.
21
4.(2021江西萍乡高三检测,8)算盘是中国传统的计算工具,其形长方,周为
木框,内贯直柱,俗称“档〞,档中横以梁,梁上两珠,每珠作数五,梁下五珠,每
珠作数一.算珠梁上局部叫上珠,梁下局部叫下珠.例如:在十位档拨上一颗
=
4
4
P(B|A2)= ,P(B|A3)= ,而
11
11
1
3
,P(A3)= ;P(B|A1)=
5
10
=
5
,由此知选项
11
B 正确.
P(B)=P(A1B)+P(A2B)+P(A3B)
1
=P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3)=2
此知选项 AC 不正确.
1 5
×
2 11
1
2
×
5
11
1
+5
×
4
11
+
3
10
×
4
11
=
9
.由
22
考向四
相互独立事件及二项分布
10.(2021天津,13)甲、乙两球落入盒子的概率分别为
落入盒子互不影响,那么甲、乙两球都落入盒子的概率为
乙两球至少有一个落入盒子的概率为
答案
1
6
1 1
.假定两球是否
和
2 3
;甲、
.
2
3
解析 两球都落入
1
p1=2
1
2 2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2021届广东省高考数学专题复习专项训练
统计与概率
一、选择、填空题
1、(深圳市 2020年高考模拟)某班组织文艺晚会,准备从A,B等8个节目中选出4个节目演出,要求A,B两个节目至少有一个选中,且A,B同时选中时,它们的演出顺序不能相邻,那么不同演出顺序的种数为()
A.1 860 B.1 320
C.1 140 D.1 020
2、(东莞市 2020年高考模拟)身高从矮到高的甲、乙、丙、丁、戊5人排成高矮相间的一个队形,则甲丁不相邻的不同的排法共有()
A.12 B.14
C.16 D.18
3、(华附、省实、广雅、深中2020届高三上学期期末联考).如图,在正方形区域内任取一点,则此点取自阴影部分的概率是
A.21
-
B.
()
2
421
π
-
C.
()
2
421
π
+
D.
1
6
4、(深圳市宝安区2019届高三9月调研)某景区在开放时间内,每个整点时会有一趟观光车从景区入口发车,某人上午到达景区入口,准备乘坐观光车,则他等待时间不多于10分钟的概率为()
A.
1
10
B.
1
6
C.
1
5
D.
5
6
5、(佛山市2019届高三教学质量检测(二))下图是1990年~2017年我国劳动年龄(15~64岁)人口数量及其占总人口比重情况:
第1 页共33 页。