2019届高考数学二轮复习高考大题专项练四统计概率B理

合集下载

2019届高考数学二轮复习大题专项练四统计概率b文(附答案)

2019届高考数学二轮复习大题专项练四统计概率b文(附答案)

四统计概率(B)1.(2018·合肥一模)一家大型购物商场委托某机构调查该商场的顾客使用移动支付的情况.调查人000人购物,试根据上述数据估计,该商场当天应准备多少个环保购物袋?(2)某机构从被调查的使用移动支付的顾客中,按分层抽样的方式抽取7人做跟踪调查,并给其中2人赠送额外礼品,求获得额外礼品的2人年龄都在[20,30)内的概率.2.(2014·全国Ⅱ卷)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.3.为了了解市民对开设传统文化课的态度,教育机构随机抽取了200位市民进行了解,发现支持开展的占75%,在抽取的男性市民120人中持支持态度的为80人.(1)完成2×2列联表,并判断是否有99.9%的把握认为性别与支持与否有关?样的方法抽取5位市民,并从抽取的5人中再随机选取2人进行座谈,求选取的2人恰好为1男1女的概率.24.(2018·梅州二模)某学校共有1 500名学生,为调查该校学生每周使用手机上网时间的情况,采用分层抽样的方法,收集100名学生每周上网时间的样本数据(单位:小时).根据这100个样本数据,得到学生每周上网时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].(1)估计该校学生每周平均使用手机上网时间(每组数据以组中值为代表);(2)估计该校学生每周使用手机上网时间超过4个小时的概率;(3)将每周使用手机上网时间在(4,12]内的定义为“长时间使用手机上网”,每周使用手机上网时间在(0,4]内的定义为“不长时间使用手机上网”.在样本数据中,有25名学生不近视.请完成每周使用手机上网的时间与近视程度的2×2列联表,并判断是否有95%的把握认为“该校学生的每周使用21.解:(1)由题表可知,该商场使用移动支付的顾客的比例为=,若当天该商场有12 000人购物,则估计该商场要准备环保购物袋 12 000×=7 000个。

专题4第2讲 统计和概率-2019年高考数学二轮复习题型总结与必刷题含答案

专题4第2讲 统计和概率-2019年高考数学二轮复习题型总结与必刷题含答案

考情速递:1(2018•新课标Ⅲ)某群体中的每位成员使用移动支付的概率都为p,各成员的支付方式相互独立.设X为该群体的10位成员中使用移动支付的人数,DX=2.4,P(x=4)<P(X=6),则p=()A.0.7 B.0.6 C.0.4 D.0.3【答案】:B2. (2018•新课标Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=,【解析】:(1)根据茎叶图中的数据知,第一种生产方式的工作时间主要集中在72~92之间,第二种生产方式的工作时间主要集中在65~85之间,所以第二种生产方式的工作时间较少些,效率更高;(2)这40名工人完成生产任务所需时间按从小到大的顺序排列后,排在中间的两个数据是79和81,计算它们的中位数为m==80;由此填写列联表如下;(3)根据(2)中的列联表,计算K2===10>6.635,∴能有99%的把握认为两种生产方式的效率有差异.例1(2018•新课标Ⅰ)如图来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC的斜边BC,直角边AB,AC.△ABC的三边所围成的区域记为I,黑色部分记为Ⅱ,其余部分记为Ⅲ.在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为p1,p2,p3,则()A.p1=p2B.p1=p3C.p2=p3D.p1=p2+p3【分析】如图:设BC=2r1,AB=2r2,AC=2r3,分别求出Ⅰ,Ⅱ,Ⅲ所对应的面积,即可得到答案.【答案】A变式训练题:(2018•新课标Ⅱ)我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30=7+23.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是()A.B.C.D.【答案】:C【解析】:在不超过30的素数中有,2,3,5,7,11,13,17,19,23,29共10个,从中选2个不同的数有=45种,和等于30的有(7,23),(11,19),(13,17),共3种,则对应的概率P==,故选:C.例2(2018•天津)已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.(Ⅰ)应从甲、乙、丙三个部门的员工中分别抽取多少人?(Ⅱ)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.(i)用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期望;(ii)设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率.【分析】(Ⅰ)利用分层抽样,通过抽样比求解应从甲、乙、丙三个部门的员工中分别抽取人数;(Ⅱ)若(i)用X表示抽取的3人中睡眠不足的员工人数,的可能值,求出概率,得到随机变量X的分布列,然后求解数学期望;(ii)利用互斥事件的概率求解即可.所以随机变量的分布列为:随机变量X的数学期望E(X)==;(ii)设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,设事件B为:抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人,事件C为抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人,则:A=B∪C,且P(B)=P(X=2),P(C)=P(X=1),故P(A)=P(B∪C)=P(X=2)+P(X=1)=.所以事件A发生的概率:.变式训练题:(2018•和平区二模)甲、乙、丙均两次参加英语高考,取两次成绩中较高的为最终成绩,三人第一次成绩不低于130分的概率依次为、.甲若第一次成绩不低于130分,则第二次成绩不低于130分的概率为,若第一次成绩在130分以下,则第二次成绩不低于130分的概率为;乙若第一次成绩不低于130分,则第二次成绩不低于130分的概率为,若第一次成绩在130分以下,则第二次成绩不低于130分的概率为;丙第二次成绩不受第一次成绩的影响,不低于130分的概率为.(Ⅰ)设A为事件“甲的英语高考最终成绩不低于130分”,B为事件“乙的英语高考最终成绩不低于130分”,C为事件“丙的英语高考最终成绩不低于130分”,分别求出事件A、事件B、事件C发生的概率;(Ⅱ)设甲、乙、丙中英语高考最终成绩不低于130分的人数为X,求X的分布列与数学期望.丙第二次成绩不受第一次成绩的影响,不低于130分的概率为.设A为事件“甲的英语高考最终成绩不低于130分”,事件A发生的概率P(A)=+(1﹣)×=,B为事件“乙的英语高考最终成绩不低于130分”,事件B发生的概率P(B)==,C为事件“丙的英语高考最终成绩不低于130分”,事件C发生的概率P(C)==.∴X的分布列为:数学期望E(X)==2.例3(2018•新课标Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验.设每件产品为不合格品的概率都为p(0<p<1),且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为f(p),求f (p)的最大值点p0.(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求EX;(ⅱ)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?【分析】(1)求出f(p)=,则=,利用导数性质能求出f (p)的最大值点p0=0.1.(2)(i)由p=0.1,令Y表示余下的180件产品中的不合格品数,依题意知Y~B(180,0.1),再由X=20×2+25Y,即X=40+25Y,能求出E(X).(ii)如果对余下的产品作检验,由这一箱产品所需要的检验费为400元,E(X)=490>400,从而应该对余下的产品进行检验.(2)(i)由(1)知p=0.1,令Y表示余下的180件产品中的不合格品数,依题意知Y~B(180,0.1),X=20×2+25Y,即X=40+25Y,∴E(X)=E(40+25Y)=40+25E(Y)=40+25×180×0.1=490.(ii)如果对余下的产品作检验,由这一箱产品所需要的检验费为400元,∵E(X)=490>400,∴应该对余下的产品进行检验.例4(2018•新课标Ⅱ)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=﹣30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【分析】(1)根据模型①计算t=19时的值,根据模型②计算t=9时的值即可;(2)从总体数据和2000年到2009年间递增幅度以及2010年到2016年间递增的幅度比较,即可得出模型②的预测值更可靠些.(2)模型②得到的预测值更可靠;因为从总体数据看,该地区从2000年到2016年的环境基础设施投资额是逐年上升的,而从2000年到2009年间递增的幅度较小些,从2010年到2016年间递增的幅度较大些,所以,利用模型②的预测值更可靠些.3.新题快递1(2018•保定一模)已知具有线性相关的变量x,y,设其样本点为A i(x i,y i)(i=1,2,……,8),回归直线方程为,若,(O为原点),则a=()A.B.C.D.【答案】:B统计与概率的交汇(2018•丰台区二模)某汽车生产厂家为了解某型号电动汽车的“实际平均续航里程数”,收集了使用该型号电动汽车1年以上的部分客户的相关数据,得到他们的电动汽车的“实际平均续航里程数”.从年龄在40岁以下的客户中抽取10位归为A组,从年龄在40岁(含40岁)以上的客户中抽取10位归为B组,将他们的电动汽车的“实际平均续航里程数”整理成下图,其中“+”表示A组的客户,“⊙”表示B组的客户.注:“实际平均续航里程数”是指电动汽车的行驶总里程与充电次数的比值.(Ⅰ)记A,B两组客户的电动汽车的“实际平均续航里程数”的平均值分别为m,n,根据图中数据,试比较m,n的大小(结论不要求证明);(Ⅱ)从A,B两组客户中随机抽取2位,求其中至少有一位是A组的客户的概率;(III)如果客户的电动汽车的“实际平均续航里程数”不小于350,那么称该客户为“驾驶达人”.从A,B两组客户中,各随机抽取1位,记“驾驶达人”的人数为ξ,求随机变量ξ的分布列及其数学期望Eξ.【分析】(Ⅰ)m<n.(Ⅱ)设“从抽取的20位客户中任意抽取2位,至少有一位是A组的客户”为事件M,利用古典概型及排列组合能求出从抽取的20位客户中任意抽取2位至少有一位是A组的客户的概率.(III)依题意ξ的可能取值为0,1,2.分别求出相应的概率,由此能求出随机变量ξ的分布列和数学期望.(III)依题意ξ的可能取值为0,1,2.则,,.…………………(10分)所以随机变量ξ的分布列为:所以随机变量ξ的数学期望.…………………(12分)即.…………………(13分)必刷题:1. (2018•新乡一模)连掷一枚均匀的骰子两次,所得向上的点数分别为a,b,记m=a+b,则()2(安徽合肥高三2018一模)已知在边长为2的正方形内,有一月牙形图形,向正方形内随机地投射100个点,恰好有15个点落在了月牙形图形内,则该月牙形图形的面积大约是()A.3.4B.0.3C.0.6D.0.15【答案】C3. (河南开封2018高三一模)如图的茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,则乙的平均成绩超过甲的平均成绩的概率为A.110B.15C.710D.45【答案】:A【解析】茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,甲的平均成绩为:x甲= 1 5(88+89+90+91+92)=90,∵乙的平均成绩超过甲的平均成绩,设数字被污损为x,∴83+83+87+(90+x)+99>450,x>8,∴x=9,∴乙的平均成绩超过甲的平均成绩的概率为p=110.故选A.4. (河北唐山2018•高三二模)甲乙等4人参加4×100米接力赛,在甲不跑第一棒的条件下,乙不跑第二棒的概率是A.B.C.D.【答案】:D【解析】甲不跑第一棒共有133318A A=种情况,甲不跑第一棒且乙不跑第二棒共有两类:(1)若乙跑第一棒,则共有A33=6种情况;(2)若乙不跑第一棒,则共有1122228A A A=种情况,∴甲不跑第一棒的条件下,乙不跑第二棒的概率为6+87= 189.故选D.6 (天津南开2018高三模拟)一射手对同一目标独立地进行4次射击,已知至少命中一次的概率为,则此射手的命中率是.【答案】:2 3【解析】设此射手每次射击命中的概率为p,分析可得,至少命中一次的对立事件为射击四次全都没有命中,由题意可知一射手对同一目标独立地射击四次全都没有命中的概率为1﹣801=8181.则(1﹣p)4=181,解可得p=23;故答案为:23.7. (黑龙江哈尔滨香坊区2018•高三三模)某学校高三年级有1000名学生,按分层抽样从高三学生中抽取30名男生,20名女生分析期末某学科的考试成绩,得到如图所示男生成绩的频率分布直方图和女生成绩的茎叶图.(Ⅰ)试计算男生、女生考试成绩的平均分;(Ⅱ)若由直方图可以认为,男生考试成绩服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ为10,利用该正态分布,求:(ⅰ)P(62<Z<82);(ⅱ)若全校所有男生考试成绩在区间(62,82)人数记为X,利用(ⅰ)的结果,求E(X).(Ⅲ)若从50名学生中任意抽取两名考试优秀的(90分以上为优秀包括90分)学生参加该学科的竞赛,若两名男生参加可以获A奖励;若两名女生参加可以获B奖励;若一名男生和一名女生参加可以获C奖励,试判断三种奖励的哪种奖励的可能性大?参考数据:若Z~(μ,σ2),则P(μ﹣σ<Z<μ+σ)=0.6826.【解析】:(Ⅰ)设男生考试成绩的平均分,女生考试成绩的平均分, ∴=72,120y =(44+51+52+60+65+74+74+75+76+81+82+84+84+85+87+89+90+90+91+93)=76.35; (Ⅱ) (ⅰ)由已知,Z 服从正态分布N (72,100), ∴P (62<Z <82)=P (72﹣10<Z <72+10)=0.6826;(ⅱ)根据分层抽样可知,男生与女生人数的比为3:2,可知男生有600人,女生有400人, 依题意知X ~N (600,0.6826),∴E (X )=600×0.6826=409.56;(Ⅲ)由图可知,男生考试优秀人数为30×0.1=3,女生考试优秀人数为4,∴任意抽取两名男生参加即获A 奖励的概率为2312717C P C ==, 任意抽取两名女生参加即获B 奖励的概率为,任意抽取一名男生和一名女生参加即获C 奖励的概率为,∵>>,∴获C 奖励的可能性较大.8 (天津和平区2018•高三二模)甲、乙、丙均两次参加英语高考,取两次成绩中较高的为最终成绩,三人第一次成绩不低于130分的概率依次为、.甲若第一次成绩不低于130分,则第二次成绩不低于130分的概率为,若第一次成绩在130分以下,则第二次成绩不低于130分的概率为;乙若第一次成绩不低于130分,则第二次成绩不低于130分的概率为,若第一次成绩在130分以下,则第二次成绩不低于130分的概率为;丙第二次成绩不受第一次成绩的影响,不低于130分的概率为.(Ⅰ)设A为事件“甲的英语高考最终成绩不低于130分”,B为事件“乙的英语高考最终成绩不低于130分”,C为事件“丙的英语高考最终成绩不低于130分”,分别求出事件A、事件B、事件C发生的概率;(Ⅱ)设甲、乙、丙中英语高考最终成绩不低于130分的人数为X,求X的分布列与数学期望.(Ⅱ)设甲、乙、丙中英语高考最终成绩不低于130分的人数为X,则X的可能取值为0,1,2,3,P(X=0)=P()==,P(X=1)=P(++)==,P(X=2)=P()==,P(X=3)=P(ABC)==,∴X的分布列为:数学期望E(X)==2.9(河南洛阳2018•高三二模)某市共有户籍人口约400万,其中老人(60岁及以上)约66万,为了解老人们的身体健康状况,相关部门从这些老人中随机抽取600人进行健康评估.健康状况共分为不能自理、不健康尚能自理、基本健康、健康四个等级,并以80岁为界限分成两个群体进行统计,由样本数据制得如下条形图t(1)根据条形图完成下表:并估算该市80岁及以上老人占全市户籍人口的百分比;(2)据统计,该市大约有五分之一的户籍老人无固定收入,该市政府计划给这部分老人每月发放生活补贴,标准如下:①80岁及以上老人每人每月发放生活补贴200元,②80岁以下老人每人每月发放生活补贴120元;③不能自理的老人每人每月额外发放生活补贴100元,试估算该市政府为执行此计划每年所需资金的总额(单位:亿元,保留两位小数)【解析】:(1)80岁及以上老人大约为:66×=11万人,∴该市80岁及以上老人占全市户籍人口的百分比为=2.75%.(2)设某户籍老人每月享受的生活补助为X元,则P(X=0)=,P(X=120)=×=,P(X=200)==,P(X=220)==,P(X=300)==.∴X的分布列为:∴E(X)=0×+120×+200×+220×+300×=28.∴该市政府为执行此计划每年所需资金的总额为28×12×66×104=2.2176×108元.∴该市政府为执行此计划每年所需资金的总额约为2.2亿元.10(江西师大附中2018.10月月考)“过大年,吃水饺”是我国不少地方过春节的一大习俗.2018年春节前夕,市某质检部门随机抽取了100包某种品牌的速冻水饺,检测其某项质量指标,检测结果如频率分布直方图所示.(1)求所抽取的100包速冻水饺该项质量指标值的样本平均数(同一组中数据用该组区间的中点值作代表);(2)①由直方图可以认为,速冻水饺的该项质量指标值服从正态分布,利用该正态分布,求落在内的概率;②将频率视为概率,若某人从某超市购买了4包这种品牌的速冻水饺,记这4包速冻水饺中这种质量指标值位于内的包数为,求的分布列和数学期望.附:①计算得所抽查的这100包速冻水饺的质量指标的标准差为;②若,则,.②根据题意得,;;;;.∴的分布列为∴.11(内蒙古赤峰市2018•高三一模)如今我们的互联网生活日益丰富,除了可以很方便地网购,网上叫外卖也开始成为不少人日常生活中不可或缺的一部分.为了解网络外卖在A市的普及情况,A市某调查机构借助网络进行了关于网络外卖的问卷调查,并从参与调查的网民中抽取了300人进行抽样分析,得到表格:(单位:人)(1)根据表中数据,能否在犯错误的概率不超过0.15的前提下认为A市使用网络外卖的情况与性别有关?(2)①现从所抽取的女网民中利用分层抽样的方法再抽取6人,再从这6人中随机选出3人赠送外卖优惠券,求选出的3人中至少有2人偶尔或不用网络外卖的概率;②将频率视为概率,从A市所有参与调查的网民中随机抽取5人赠送礼品,记其中经常使用网络外卖的人数为X,求X的数学期望和方差.参考公式:,其中n=a+b+c+d.参考数据:则这3人中至少有2人偶尔或不用网络外卖的基本事件是Acd、Ace、Acf、Ade、Adf、Aef、Bcd、Bce、Bcf、Bde、Bdf、Bef、cde、cdf、cef、def共16种;故所求的概率为P==;②由列联表知,抽到经常使用网络外卖的网民的频率为=,将频率视为概率,即从A市市民中任意抽取1人,恰好抽到经常使用网络外卖的市民的概率为;由题意得X~B(5,),所以数学期望为E(X)=5×=;方差为D(X)=5××(1﹣)=.。

2019年高考数学(理)二轮专题练习:概率与统计(含答案)

2019年高考数学(理)二轮专题练习:概率与统计(含答案)

高考数学精品复习资料2019.5概率与统计1.随机抽样方法简单随机抽样、系统抽样、分层抽样的共同点是抽样过程中每个个体被抽取的机会相等,且是不放回抽样.[问题1] 某社区现有480个住户,其中中等收入家庭200户、低收入家庭160户,其他为高收入家庭.在建设幸福社区的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次抽取的总户数为________. 答案 24解析 由抽样比例可知6x =480-200-160480,则x =24.2.对于统计图表问题,求解时,最重要的就是认真观察图表,从中提取有用信息和数据.对于频率分布直方图,应注意的是图中的每一个小矩形的面积是数据落在该区间上的频率.茎叶图没有原始数据信息的损失,但数据很大或有多组数据时,茎叶图就不那么直观、清晰了. [问题2] 从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中视力情况进行统计,其结果的频率分布直方图如图所示.若某高校A 专业对视力的要求在0.9以上,则该班学生中能报A 专业的人数为________.答案 203.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数. 众数为频率分布直方图中最高矩形的底边中点的横坐标.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.平均数:样本数据的算术平均数,即x =1n(x 1+x 2+…+x n ).平均数等于频率分布直方图中每个小矩形的面积乘以小距形底边中点的横坐标之和. 标准差的平方就是方差,方差的计算(1)基本公式s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].(2)简化计算公式①s 2=1n [(x 21+x 22+…+x 2n )-n x 2],或写成s 2=1n (x 21+x 22+…+x 2n )-x 2,即方差等于原数据平方和的平均数减去平均数的平方.[问题3] 已知一个样本中的数据为0.12,0.15,0.13,0.15,0.14,0.17,0.15,0.16,0.13,0.14,则该样本的众数、中位数分别是________. 答案 0.15、0.145 4.变量间的相关关系假设我们有如下一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ).回归方程y ^=b ^x +a ^,其中⎩⎪⎨⎪⎧b ^=∑i =1n(x i-x )(y i-y )∑i =1n (x i-x )2=∑i =1nx i y i-n x y∑i =1n x 2i-n x2,a ^=y -b ^x .[问题4] 回归直线方程y ^=b ^x +a ^必经过点________. 答案 (x ,y )5.独立性检验的基本方法一般地,假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表如表:根据观测数据计算由公式k =n (ad -bc )(a +b )(a +c )(b +d )(c +d )所给出的检验随机变量K 2的观测值k ,并且k 的值越大,说明“X 与Y 有关系”成立的可能性越大,可以利用数据来确定“X 与Y 有关系”的可信程度.[问题5] 为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:则至少有________附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )答案 6.互斥事件有一个发生的概率P (A +B )=P (A )+P (B ) (1)公式适合范围:事件A 与B 互斥. (2)P (A )=1-P (A ).[问题6] 抛掷一枚骰子,观察掷出的点数,设事件A 为出现奇数点,事件B 为出现2点,已知P (A )=12,P (B )=16,则出现奇数点或2点的概率之和为________.答案 237.古典概型P (A )=mn (其中,n 为一次试验中可能出现的结果总数,m 为事件A 在试验中包含的基本事件个数)[问题7] 若将一枚质地均匀的骰子先后抛掷2次,则出现向上的点数之和为4的概率为________. 答案1128.几何概型一般地,在几何区域D 内随机地取一点,记事件“该点在其内部一个区域d 内”为事件A ,则事件A 发生的概率为P (A )=d 的度量D 的度量.此处D 的度量不为0,其中“度量”的意义依D 确定,当D 分别是线段、平面图形和立体图形时,相应的度量分别为长度、面积和体积等. 即P (A )=构成事件A 的区域长度(面积和体积)试验的全部结果所构成的区域长度(面积和体积)[问题8] 在棱长为2的正方体ABCD —A 1B 1C 1D 1中,点O 为底面ABCD 的中心,在正方体ABCD —A 1B 1C 1D 1内随机取一点P ,则点P 到点O 的距离大于1的概率为( ) A.π12B .1-π12C.π6 D .1-π6答案 B解析 记“点P 到点O 的距离大于1”为A , P (A )=23-12×43π×1323=1-π12. 9.解排列、组合问题的依据是:分类相加,分步相乘,有序排列,无序组合.解排列、组合问题的规律是:相邻问题捆绑法;不相邻问题插空法;多排问题单排法;定位问题优先法;定序问题倍缩法;多元问题分类法;有序分配分步法;综合问题先选后排法;至多至少问题间接法. (1)排列数公式A m n =n (n -1)(n -2)…[n -(m -1)]=n !(n -m )!,其中m ,n ∈N *,m ≤n .当m =n 时,A n n =n ·(n -1)·……·2·1=n !,规定0!=1. (2)组合数公式C mn =A m n A m m =n (n -1)(n -2)…[n -(m -1)]m !=n !m !(n -m )!.(3)组合数性质C m n =C n-mn,C m n +C m -1n =C m n +1,规定C 0n =1,其中m ,n ∈N *,m ≤n .[问题9] (1)将5封信投入3个邮筒,不同的投法共有________种.(2)从4台甲型和5台乙型电视机中任意取出3台,其中至少要甲型和乙型电视机各一台,则不同的取法共有________种. 答案 (1)35 (2)70 10.二项式定理(1)定理:(a +b )n =C 0n a n +C 1n a n -1b +…+C r n a n -r b r +…+C n -1n ab n -1+C n n b n (n ∈N *).通项(展开式的第r +1项):T r +1=C rna n -r b r ,其中C r n (r =0,1,…,n )叫做二项式系数.(2)二项式系数的性质①在二项式展开式中,与首末两端“等距离”的两项的二项式系数相等,即C 0n =C n n ,C 1n =C n -1n ,C 2n =C n -2n ,…,C r n =C n -r n .②二项式系数的和等于2n (组合数公式),即C 0n +C 1n +C 2n +…+C n n =2n .③二项式展开式中,偶数项的二项式系数和等于奇数项的二项式系数和,即C 1n +C 3n +C 5n +…=C 0n +C 2n +C 4n +…=2n -1.特别提醒:二项式系数最大项与展开式系数最大项是两个不同的概念,在求法上也有很大的差别,往往因为概念不清导致出错. [问题10] 设⎝⎛⎭⎫x -2x 6的展开式中x 3的系数为A ,二项式系数为B ,则A ∶B =________. 答案 4∶1解析 T r +1=C r 6x6-r(-1)r ⎝⎛⎭⎫2x r=C r 6(-1)r 2r362r x-,6-32r =3,r =2,系数A =60,二项式系数B =C 26=15,所以A ∶B =4∶1.4∶1.11.要注意概率P (A |B )与P (AB )的区别:(1)在P (A |B )中,事件A ,B 发生有时间上的差异,B 先A 后;在P (AB )中,事件A ,B 同时发生.(2)样本空间不同,在P (A |B )中,事件B 成为样本空间;在P (AB )中,样本空间仍为Ω,因而有P (A |B )≥P (AB ).[问题11] 设A 、B 为两个事件,若事件A 和B 同时发生的概率为310,在事件A 发生的条件下,事件B 发生的概率为12,则事件A 发生的概率为________.答案 3512.求分布列,要检验概率的和是否为1,如果不是,要重新检查修正.还要注意识别独立重复试验和二项分布,然后用公式.如果事件A 在一次试验中发生的概率是p ,那么它在n 次独立重复试验中恰好发生k 次的概率为P n (k )=C k n p k ·(1-p )n -k . [问题12] 若随机变量ξ的分布列如下表,则E (ξ)的值为________.答案209解析 根据概率之和为1,求出x =118,则E (ξ)=0×2x +1×3x +…+5x =40x =209.13.一般地,如果对于任意实数a <b ,随机变量X 满足P (a <X ≤b )=ʃba φμ,σ(x )d x ,则称X 的分布为正态分布.正态分布完全由参数μ和σ确定,因此正态分布常记作N (μ,σ2).如果随机变量X 服从正态分布,则记为X ~N (μ,σ2).满足正态分布的三个基本概率的值是:①P (μ-σ<X ≤μ+σ)=0.682 6;②P (μ-2σ<X ≤μ+2σ)=0.954 4;③P (μ-3σ<X ≤μ+3σ)=0.9974.[问题13] 已知随机变量ξ服从正态分布N (2,σ2),且P (ξ<4)=0.8,则P (0<ξ<2)等于( ) A .0.6 B .0.4 C .0.3 D .0.2 答案 C解析 ∵P (ξ<4)=0.8,∴P (ξ>4)=0.2,由题意知图象的对称轴为直线x =2, P (ξ<0)=P (ξ>4)=0.2,∴P (0<ξ<4)=1-P (ξ<0)-P (ξ>4)=0.6. ∴P (0<ξ<2)=12P (0<ξ<4)=0.3.易错点1 统计图表识图不准致误例1 如图所示是某公司(共有员工300人)20xx 年员工年薪情况的频率分布直方图,由此可知,员工中年薪在1.4万元~1.6万元之间的大约有________人.错解 由频率分布直方图,员工中年薪在1.4万元~1.6万元之间的频率为1-(0.02+0.08+0.10+0.10+0.08)=0.62.∴估计年薪在1.4万元~1.6万元之间约有300×0.62=186(人).找准失分点 本题主要混淆频率分布直方图与条形图纵轴的意义,频率分布直方图中,纵轴(矩形高)表示“频率组距”,每个小矩形的面积才表示落在该区间上的频率,由于概念不清,识图不准导致计算错误.正解 由所给图形可知,员工中年薪在1.4万元~1.6万元之间的频率为1-(0.02+0.08+0.08+0.10+0.10)×2=0.24.所以员工中年薪在1.4万元~1.6万元之间的共有300×0.24=72(人). 答案 72易错点2 在几何概型中“测度”确定不准致误例2 如图所示,在等腰Rt △ABC 中,过直角顶点C 在∠ACB 内部任意作一条射线CM ,与线段AB 交于点M ,求AM <AC 的概率.错解 记AM <AC 为事件E ,设CA =CB =a ,因为△ABC 是直角三角形, 所以,AB =2a ,在AB 上取一点D ,使AD =AC =a ,那么对线段AD 上的任意一点M 都有AM <AD ,即AM <AC , 因此AM <AC 的概率为P (E )=AD AB =a 2a =22. 找准失分点 据题意,过直角顶点C 在∠ACB 内部作一条射线CM ,射线CM 在∠ACB 内部均匀分布,但是点M 在AB 上的分布不是均匀的.正解 在AB 上取一点D ,使AD =AC ,因为AD =AC =a ,∠A =π4,所以∠ACD =∠ADC =3π8,则P (E )=∠ACD ∠ACB =3π8π2=34.易错点3 分不清是排列还是组合致误例3 如图所示,A ,B ,C ,D 是海上的四个小岛,要建三座桥,将这四个岛连接起来,不同的建桥方案共有多少种?错解 对于有一个中心的结构形式有A 44,对于四个岛依次相连的形式有A 44,∴共有2A 44=48(种).找准失分点 没有分清是排列还是组合. 正解 由题意可能有两种结构,如图:第一种:,第二种:对于第一种结构,连接方式只需考虑中心位置的情况,共有C 14种方法.对于第二种结构,有C 24A 22种方法. ∴总共有C 14+C 24A 22=16(种).易错点4 均匀分组与非均匀分组混淆致误例4 4个不同的小球放入编号为1、2、3、4的4个盒中,则恰有1个空盒的放法共有________种.(用数字作答) 错解 288错误!未找到引用源。

2019年高考数学二轮复习 概率与统计解答题专题训练(含解析)

2019年高考数学二轮复习 概率与统计解答题专题训练(含解析)

2019年高考数学二轮复习 概率与统计解答题专题训练(含解析)1.(xx·保定调研)近年来,我国的高铁技术发展迅速,铁道部门计划在A 、B 两城之间开通高速列车,假设在试运行期间,每天8:00-9:00,9:00-10:00两个时段内各发一趟列车由A 城到B 城(两车发生情况互不影响),A 城发车时间及其概率如下表所示:8:00和周日8:20.(只考虑候车时间,不考虑其他因素)(1)设乙侯车所需时间为随机变量X ,求X 的分布列和数学期望; (2)求甲、乙二人候车时间相等的概率.解 (1)X 的所有可能取值为10、30、50、70、90(分钟),其概率分布列如下X 的数学期望E (X )=10×12+30×13+50×136+70×112+90×118=2459(分钟).(2)甲、乙二人候车时间分别为10分钟、30分钟、50分钟的概率为 P 甲10=16,P 甲30=12,P 甲50=13;P 乙10=12,P 乙30=13,P 乙50=16×16=136.所以所求概率P =16×12+12×13+13×136=28108=727,即甲、乙二人候车时间相等的概率为727.2.(xx·皖南八校联考)从正方体的各个表面上的12条面对角线中任取2条,设ξ为2条面对角线所成的角(用弧度制表示),如当2条面对角线垂直时,ξ=π2.(1)求概率P (ξ=0);(2)求ξ的分布列,并求其数学期望E (ξ).解 (1)当ξ=0时,即所选的2条面对角线平行,则P (ξ=0)=6C 212=111.(2)ξ的可能取值为0,π3,π2.则P (ξ=0)=6C 212=111,P ⎝⎛⎭⎫ξ=π3=48C 212=811,P ⎝⎛⎭⎫ξ=π2=12C 212=211. ξ的分布列如下:ξ 0 π3 π2 P111811211E (ξ)=0×111+π3×811+π2×211=π3.3.(xx·广州调研)空气质量指数PM2.5(单位:μg/m 3)表示每立方米空气中可入肺颗粒物的含量,这个值越高,代表空气污染越严重.PM2.5的浓度与空气质量类别的关系如下表所示:PM2.5日均浓度 0~35 35~75 75~115 115~150 150~250 >250 空气质量类别优良轻度污染中度污染重度污染严重污染从甲城市xx 年9月份的30天中随机抽取15天的PM 2.5日均浓度指数数据茎叶图如图所示.(1)试估计甲城市在xx 年9月份30天的空气质量类别为优或良的天数;(2)在甲城市这15个监测数据中任取2个,设X 为空气质量类别为优或良的天数,求X 的分布列及数学期望.解 (1)由茎叶图可知,甲城市在xx 年9月份随机抽取的15天中的空气质量类别为优或良的天数为5.所以可估计甲城市在xx 年9月份30天的空气质量类别为优或良的天数为10. (2)X 的所有可能取值为0,1,2,因为P (X =0)=C 05C 210C 215=37,P (X =1)=C 15C 110C 215=1021,P (X =2)=C 25C 010C 215=221,所以X 的分布列为:X 0 1 2 P371021221数学期望E (X )=0×37+1×1021+2×221=23.4.(xx·浙江名校联考)甲、乙两支球队进行总决赛,比赛采用七场四胜制,即若有一队先胜四场,则此队为总冠军,比赛结束.因两队实力相当,每场比赛两队获胜的可能性均为12.据以往资料统计,第一场比赛可获得门票收入40万元,以后每场比赛门票收入比上一场增加10万元.(1)求总决赛中获得门票总收入恰好为300万元的概率; (2)设总决赛中获得门票总收入为X ,求X 的均值E (X ).解 (1)依题意,每场比赛获得的门票收入组成首项为40,公差为10的等差数列. 设此数列为{a n },则易知a 1=40,a n =10n +30, 所以S n =n10n +702=300.解得n =-12(舍去)或n =5, 所以总决赛共比赛了5场.则前4场比赛中,一支球队共赢了3场,且第5场比赛中,领先的球队获胜,其概率为C 14⎝⎛⎭⎫124=14. (2)随机变量X 可取的值为S 4,S 5,S 6,S 7,即220,300,390,490.又P (X =220)=2×⎝⎛⎭⎫124=18, P (X =300)=C 14⎝⎛⎭⎫124=14, P (X =390)=C 25⎝⎛⎭⎫125=516, P (X =490)=C 36⎝⎛⎭⎫126=516, 所以X 的分布列为X 220 300 390 490 P1814516516所以X 的均值E (X )=5.自驾游从A 地到B 地有甲、乙两条线路,甲线路是A -C -D -B ,乙线路是A -E -F -G -H -B ,其中CD 段、EF 段、GH 段都是易堵车路段.假设这三条路段堵车与否相互独立.这三条路段的堵车概率及平均堵车时间如表1所示.经调查发现,堵车概率x 在⎝⎛⎭⎫23,1上变化,y 在⎝⎛⎭⎫0,12上变化.在不堵车的情况下,走甲线路需汽油费500元,走乙线路需汽油费545元.而每堵车1小时,需多花汽油费20元.路政局为了估计CD 段平均堵车时间,调查了100名走甲路线的司机,得到表2数据.CD 段 EF 段 GH 段(1)求CD 段平均堵车时间a 的值;(2)若只考虑所花汽油费期望值的大小,为了节约,求选择走甲线路的概率. 解 (1)a =12×8100+32×6100+52×38100+72×24100+92×24100=3.(2)设走甲线路所花汽油费为ξ元,则E (ξ)=500(1-x )+(500+60)x =500+60x . 设走乙线路多花的汽油费为η元, ∵EF 段与GH 段堵车与否相互独立,∴P (η=0)=(1-y )×⎝⎛⎭⎫1-14, P (η=20)=(1-y )×14,P (η=40)=y ×⎝⎛⎭⎫1-14, P (η=60)=14y ,∴E (η)=0×(1-y )×⎝⎛⎭⎫1-14+20×(1-y )×14+40×y ×⎝⎛⎭⎫1-14+60×14y =40y +5. ∴走乙线路所花的汽油费的数学期望为E (545+η)=545+E (η)=550+40y . 依题意,选择走甲线路应满足(550+40y )-(500+60x )≥0, 即6x -4y -5≤0,又23<x <1,0<y <12,∴P (选择走甲线路)=⎝⎛⎭⎫1-23×12-12×⎝⎛⎭⎫1-56×14⎝⎛⎭⎫1-23×12=78.。

专题04概率与统计理-2019年高考数学冲刺大题精做专项训练

专题04概率与统计理-2019年高考数学冲刺大题精做专项训练

04概率与统讣(理)【热点题型】(1 )频率分布直方图与随机变量分布列的综合;(2)频率分布直方图与独立性检验的综合;(3)线性回归方程与非线性回归方程的实际应用;(4)随机变量分布列与函数的综合;(5)独立性检验与随机变量分布列的综合。

【最新联考,模拟考试题】1、某商场营销人员进行某商品M市场营销调查发现,每回馈消费者一定的点数,该商品每天的销量就会发生一定的变化,经过试点统计得到以下表:反馈点数t12345销量(百件)/天0.50.61 1.4 1.7(1)经分析发现,可用线性回归模型拟合当地该商品销量y (千件)与返还点数t之间的相关关系•请用最小二乘法求y关于t的线性回归方程y bt a,并预测若返回6个点时该商品每天销量;(2)若节日期间营销部对商品进行新一轮调整•已知某地拟购买该商品的消费群体十分庞大,经营销调研机构对其中的200名消费者的返点数额的心理预期值进行了一个抽样调查,得到如下一份频数表:返还点数预期值区间[1,3) [3,5) [5,7) [7,9) [9,11) [11,13)频数206060302010(i )求这200位拟购买该商品的消费者对返点点数的心理预期值X的样本平均数及中位数的估计值(同一区间的预期值可用该区间的中点值代替;估计值精确到0.1);(ii)将对返点点数的心理预期值在[1,3)和[11,13]的消费者分别定义为欲望紧缩型”消费者和欲望膨胀型”消费者,现采用分层抽样的方法从位于这两个区间的30名消费者中随机抽取6名,再从这6人中随机抽取3名进行跟踪调查,设抽出的3人中欲望膨胀型”消费者的人数为随机变量X,求X的分布列及数学期望参考公式及数据:①_ _ Zty-lS.8 y bt ;②-【答案】(1)032^+0.05;2;( 2)( i) 5.7;( ii) 2根据样本质量指标平均值估计总体质量指标平均值为30.2.【解析】(1) 易知匚I"2+4"」丄 2m 4厂=]皿 y f ; =f+f+3:+4; + 5:=55?5k5 *亠 y (t, -n^i-jj y r, ji-心 5..5_,—b =--- = --- = 一― * 严=032 . d = v - !?t ■ 1.04- 032 x3 = 0.08二 J"^则丫关于啲线性回归方程为S =032f +0.08,当r =召时打二2.00、即返回矗个点时该商品每天销量约为2 百件.(2)(i )根据题意,这200位拟购买该商品的消费者对返回点数的心里预期值X 的平均值X ,及中位数的估计值分别为.-'.'1 - '. .■ .一 '. : 一一: 1 .'.一 一 一上 一质量指标值[15,20)[20,25)[25,30)[30,35)[35,40)[40,45)频数41640121810=100 x2.54-4xL5 + 16x20 + 40x25-F12x30-F18x 35 +10x403020.中位数的估计值为 5+2x(ii )抽取6名消费者中欲望紧缩型”消费者人数为620 304 ,欲望膨胀型”消费者人数为610 302.样本的质量指标平均值为100100-20-6060P(X=2) =⑵ 样本频率井布估计总体分布,样本中一、二 三尊品的频率分别为茁:,2 J o 故从所有产品中随机抽一件,是一、二、三尊品的槪率分剔为1,L23 6随机变量兀的取値为:240, 300, 360, 420, 4SO.P 〔兀二 240)二2x2 二丄,P(X 二300]二 U •二》丄二乂6 636* 3 69 P(X = ^60)-c! X 丄乂丄+2交2 =丄.p (X =420) = C^-<- =-.'2 63 3 1S* 2 33F(X = 48O>=|xl=i ,所以随机变量 X 的分布列为:5 1 1K W = 24OX- +300x _+360x_ +4204003、有甲、乙两家公司都需要招聘求职者,这两家公司的聘用信息如下:(1)根据以上信息,如果你是该求职者,你会选择哪一家公司?说明理由;(2)某课外实习作业小组调查了1000名职场人士,就选择若分析选择意愿与年龄这两个分类变量,计算得到的K2的观测值为k1 = 5.5513,测得出选择意愿与年龄有关【答案】(1)我希望不同职位的月薪差距小一些,故选择甲公司;或我希望不同职位的月薪差距大一些, 故选择乙公司;(2)与年龄相比,选择意愿与性别关联性更大. 【解析】< 1)设申公司与乙公司的月薪分别为随机变量M 匚JjJjE (AO = MOflxC.4-7flOOxO.3+8OOOxO L 2-9OQOxO.l=700fl ,E (D = 5000x0.4-7000x0.3+flOOOx0.2-11 OT0>0. 1 = 700®,D LD = (6000-70OC) ^0 4- (7000- 700(1) 2«0.3- (8000-^000)纹0V — (5000- 7000) *0」 = 1«XP JD (Y ) = ( 5000 - 7000) 2 >0.4+ ( 7000 - 7000) 2 >0.3+ ( 9000 - 7000) 2X 0.2+ (11000 - 7000) 2 >0.1 =20002,则 E (X )= E (Y ), D (X )V D (Y ),我希望不同职位的月薪差距小一些,故选择甲公司;或我希望不同职位的月薪差距大一些,故选择乙公司; (2)因为k 1= 5.5513>5.024,根据表中对应值, 得出选择意愿与年龄有关系”的结论犯错的概率的上限是0.025,由数据分布可得选择意愿与性别两个分类且 K 2=6.734>6.635,选择甲公司选择乙公司总计 男 250 350 600 女 200 200 400 总计4505501000变量的2X2列联表如下:计算--- 性更大?P K 2 k 0.050 0.025 0.010 0.005 k3.8415.0246.6357.879-be)2{a + &X e + 力)(° + 亡 沁 6.734系”的结论犯错误的概率的上限是多少?并用统计学知识分析,选择意愿与年龄变量和性别变量哪一个关联("随机变量匸的所有可管諏值为X 1, 2C A . C!_iP (A-0 ■(z h ?3 3>.所儿随机SS.v的分布列为工0113P「11218435■»3535357、为吸引顾客,某公司在商场举办电子游戏活动•对于代B两种游戏,每种游戏玩一次均会出现两种结果,而且每次游戏的结果相互独立,具体规则如下:玩一次游戏A,若绿灯闪亮,获得50分,若绿灯不闪亮,1则扣除10分(即获得10分),绿灯闪亮的概率为丄;玩一次游戏B,若出现音乐,获得60分,若没有出22现音乐,则扣除20分(即获得20分),出现音乐的概率为.玩多次游戏后累计积分达到130分可以兑换5奖品.(1 )记X为玩游戏A和B各一次所得的总分,求随机变量X的分布列和数学期望;(2)记某人玩5次游戏B,求该人能兑换奖品的概率.【答案】992(1)32;(2)卫【解析】①玩游戏A,绿灯闪亮,且玩游戏B,出现音乐;②玩游戏A,绿灯不闪亮,且玩游戏B,出现音乐;③玩游戏A,绿灯闪亮,且玩游戏B,没有出现音乐;④玩游戏A,绿灯不闪亮,且玩游戏B,没有出现音乐,即X的分布列为隨机糜量T的魏学期望站)弘存1罟(1 )随机变量X的所有可能取值为110=5030=-30,分别对应以下四种情况:1QE ⑵=0芒7芒十丄』所以②小李该月的工资'薪金等税前收入为 用。

历年(2019-2023)高考数学真题专项(概率与统计解答题)汇编(附答案)

历年(2019-2023)高考数学真题专项(概率与统计解答题)汇编(附答案)

历年(2019-2023)高考数学真题专项(概率与统计解答题)汇编考点01:统计案例及应用1 (2021年全国高考乙卷文科)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:122S .(1)求x ,y ,21S ,22S ;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y x -≥则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).2 (2020年高考数学课标Ⅰ卷文科)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A ,B ,C ,D 四个等级.加工业务约定:对于A 级品、B 级品、C 级品,厂家每件分别收取加工费90元,50元,20元;对于D 级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下: 甲分厂产品等级的频数分布表等级 ABCD频数40202020乙分厂产品等级的频数分布表等级 ABCD频数28173421(1)分别估计甲、乙两分厂加工出来的一件产品为A 级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?3 (2019年高考数学课标Ⅲ卷文科)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下实验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据实验数据分别得到如下直方图:记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P (C )的估计值为0.70. (1)求乙离子残留百分比直方图中的a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用改组区间的中点值为代表).4 (2019年高考数学课标Ⅱ卷文科)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.y 的分组[0.20,0)-[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数 2 24 53 147 (1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)8.602≈.5.(2022新高考全国II 卷·)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表); (2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).考点02相关关系与回归分析1.(2022年高考全国乙卷(文)·)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:2m )和材积量(单位:3m ),得到如下数据:样本号i 12345678910总和根部横截面积i x0.04 0.06 0.04 0.08 0.08 0050050.07 0.07 0.06 0.6材积0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9..量i y并计算得10101022i i i ii=1i=1i=10.038, 1.6158,0.2474x y x y===∑∑∑.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为2186m.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数i i(1.377)()nx x y yr--=≈∑.2.(2020年高考数学课标Ⅱ卷文科·)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i,y i)(i=1,2,…,20),其中x i和y i分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160iix==∑,2011200iiy==∑,202180iixx=-=∑(,2021)9000iiy y=-=∑(,201)800iiix yx y=--=∑((.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i,y i)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r)ni ix yx y--∑((≈1.414.考点03 独立性检验1.(2022年全国高考甲卷(文)·)甲、乙两城之间的长途客车均由A 和B 两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数 未准点班次数 A 240 20 B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有0090的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,()2P K k …0.100 0.050 0.010 k2.7063.8416.6352.(2020年新高考I 卷(山东卷)·)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和2SO 浓度(单位:3μg/m ),得下表: 2SOPM2.5[0,50](50,150] (150,475][0,35]32 18 4 (35,75]6 8 12 (75,115]3710(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表: 2SOPM2.5[0,150](150,475][0,75](75,115](3)根据(2)中列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,2()P K k ≥ 0.050 0.010 0.001 k3.841 6.63510.8283 .(2020新高考II 卷(海南卷)·)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM 2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM 2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM 2.5浓度与2SO 浓度有关?的附:22()()()()()n ad bc K a b c d a c b d -=++++,4.(2021年高考全国甲卷文科·)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品 二级品 合计 甲机床 150 50 200 乙机床 120 80 200 合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++ ()2P K k ≥ 0.050 0.0100.001k 3.841 6.635 10.8285.(2020年高考数学课标Ⅲ卷文科·)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天): 锻炼人次 空气质量等级 [0,200](200,400](400,600]1(优) 2 16 25 2(良)51012的3(轻度污染) 67 84(中度污染) 72 0(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.050 0.010 0.001k 3.841 6.635 10.8286.(2019年高考数学课标Ⅰ卷文科·)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客40 10女顾客30 20(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.2()P K k…0.050 0.010 0.001 k 3.841 6.635 10.828参考答案考点01:统计案例及应用1 (2021年全国高考乙卷文科)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:122S .(1)求x ,y ,21S ,22S ;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y x -≥则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).【答案】(1)221210,10.3,0.036,0.04x yS S ====;(2)新设备生产产品的该项指标的均值较旧设备有显著提高. 【答案解析】:(1)9.810.31010.29.99.81010.110.29.71010x +++++++++==,10.110.410.11010.110.310.610.510.410.510.310y +++++++++==,22222222210.20.300.20.10.200.10.20.30.03610S +++++++++==,222222222220.20.10.20.30.200.30.20.10.20.0410S +++++++++==(2)依题意,0.320.15y x -==⨯==,=y x -≥,所以新设备生产产品的该项指标的均值较旧设备有显著提高.2 (2020年高考数学课标Ⅰ卷文科)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A ,B ,C ,D 四个等级.加工业务约定:对于A 级品、B 级品、C 级品,厂家每件分别收取加工费90元,50元,20元;对于D 级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲.分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表等级 A B C D频数 4020 20 20乙分厂产品等级的频数分布表等级 A B C D频数 2817 34 21(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?【答案】(1)甲分厂加工出来的A级品的概率为0.4,乙分厂加工出来的A级品的概率为0.28;(2)选甲分厂,理由见答案解析.【答案解析】(1)由表可知,甲厂加工出来的一件产品为A级品的概率为400.4100=,乙厂加工出来的一件产品为A级品的概率为280.28 100=;(2)甲分厂加工100件产品总利润为()()()()4090252050252020252050251500⨯-+⨯-+⨯--⨯+=元,所以甲分厂加工100件产品的平均利润为15元每件;乙分厂加工100件产品的总利润为()()()()2890201750203420202150201000⨯-+⨯-+⨯--⨯+=元,所以乙分厂加工100件产品的平均利润为10元每件.故厂家选择甲分厂承接加工任务.3 (2019年高考数学课标Ⅲ卷文科)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下实验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据实验数据分别得到如下直方图:的记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P (C )的估计值为0.70. (1)求乙离子残留百分比直方图中的a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用改组区间的中点值为代表). 【答案】【答案解析】:(1)C 为事件:“乙离子残留在体内的百分比不低于5.5”, 根据直方图得到P (C )的估计值为0.70. 则由频率分布直方图得: 0.200.150.70.050.1510.7a b ++=⎧⎨++=-⎩, 解得乙离子残留百分比直方图中0.35a =,0.10b =. (2)估计甲离子残留百分比的平均值为:20.1530.2040.3050.2060.1070.05 4.05x =⨯+⨯+⨯+⨯+⨯+⨯=甲.乙离子残留百分比的平均值为:30.0540.150.1560.3570.280.156x =⨯+⨯+⨯+⨯+⨯+⨯=乙.4 (2019年高考数学课标Ⅱ卷文科)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.y 的分组[0.20,0)-[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数 2 24 53 147 (1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)8.602≈. 【答案】【答案解析】:(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为1470.21100+=.产值负增长的企业频率为20.02100=. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)1(0.1020.10240.30530.50140.707)0.30100y =-⨯+⨯+⨯+⨯+⨯=,()52211100i i i s n y y ==-∑222221(0.40)2(0.20)240530.20140.407100⎡⎤=-⨯+-⨯+⨯+⨯+⨯⎣⎦ =0.0296,0.020.17s ==≈,所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.5.(2022新高考全国II 卷·)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表); (2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001). 【答案】(1)47.9岁; (2)0.89; (3)0.0014.【答案解析】:(1)平均年龄(50.001150.002250.012350.017450.023x =⨯+⨯+⨯+⨯+⨯ 550.020650.017750.006850.002)1047.9+⨯+⨯+⨯+⨯⨯=(岁). (2)设A ={一人患这种疾病的年龄在区间[20,70)},所以()1()1(0.0010.0020.0060.002)1010.110.89P A P A =-=-+++⨯=-=.(3)设{B =任选一人年龄位于区间}[40,50),{C =任选一人患这种疾病}, 则由条件概率公式可得 ()0.1%0.023100.0010.23(|)0.00143750.0014()16%0.16P BC P C B P B ⨯⨯⨯====≈.考点02相关关系与回归分析1.(2022年高考全国乙卷(文)·)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:2m )和材积量(单位:3m ),得到如下数据: 样本号i 12345678910总和根部横截面积i x0.04 0.06 0.04 0.08 0.08 0050050.07 0.07 0.06 0.6材积量i y0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9并计算得10101022ii i i i=1i=1i=10.038, 1.6158,0.2474xy x y ===∑∑∑.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量; (2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为2186m .已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数ii( 1.377)()nx x y y r --=≈∑.【答案】(1)20.06m ;30.39m (2)0.97..(3)31209m【答案解析】:【小问1详解】样本中10棵这种树木的根部横截面积的平均值0.60.0610x == 样本中10棵这种树木的材积量的平均值 3.90.3910y == 据此可估计该林区这种树木平均一棵的根部横截面积为20.06m , 平均一棵的材积量为30.39m 【小问2详解】()()1010iii i10x x y y x y xyr ---==∑∑0.01340.970.01377==≈≈则0.97r ≈ 【小问3详解】设该林区这种树木的总材积量的估计值为3m Y , 又已知树木的材积量与其根部横截面积近似成正比, 可得0.06186=0.39Y,解之得3=1209m Y . 则该林区这种树木总材积量估计为31209m2.(2020年高考数学课标Ⅱ卷文科·)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160i ix==∑,2011200i i y ==∑,202180i ix x =-=∑(,2021)9000i i y y =-=∑(,201)800i i i x y x y =--=∑((.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.的附:相关系数r)niix y x y --∑((≈1.414.【答案】(1)12000;(2)0.94;(3)详见答案解析【答案解析】(1)样区野生动物平均数为201111200602020ii y ==⨯=∑, 地块数为200,该地区这种野生动物的估计值为2006012000⨯= (2)样本(,)i i x y (i =1,2,…,20)的相关系数为20()()0.943iix x y y r --===≈∑(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性, 由于各地块间植物覆盖面积差异很大,从俄各地块间这种野生动物的数量差异很大, 采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性, 从而可以获得该地区这种野生动物数量更准确的估计.【点晴】本题主要考查平均数的估计值、相关系数的计算以及抽样方法的选取,考查学生数学运算能力,是一道容易题.考点03 独立性检验1.(2022年全国高考甲卷(文)·)甲、乙两城之间的长途客车均由A 和B 两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数 未准点班次数 A 240 20 B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有0090的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,()2P K k …0.100 0.050 0.010 k2.7063.8416.635【答案】(1)A ,B 两家公司长途客车准点的概率分别为1213,78(2)有 【答案解析】根据表中数据,A 共有班次260次,准点班次有240次, 设A 家公司长途客车准点事件为M ,则24012()26013P M ==; B 共有班次240次,准点班次有210次, 设B 家公司长途客车准点事件为N , 则210()28074P N ==. A 家公司长途客车准点的概率为1213; B 家公司长途客车准点的概率为78. (2)列联表准点班次数未准点班次数 合计A 240 20 260B 210 30 240 合计4505050022()()()()()n ad bc K a b c d a c b d -=++++=2500(2403021020) 3.205 2.70626024045050⨯⨯-⨯≈>⨯⨯⨯,根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关. 2.(2020年新高考I 卷(山东卷)·)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和2SO 浓度(单位:3μg/m ),得下表: 2SOPM2.5[0,50](50,150] (150,475][0,35]32 18 4 (35,75]6812(75,115]3 7 10(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表: 2SOPM2.5[0,150](150,475][0,75](75,115](3)根据(2)中列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,2()P K k ≥ 0.050 0.010 0.001 k3.841 6.63510.828【答案】(1)0.64;(2)答案见答案解析;(3)有.【答案解析】:(1)由表格可知,该市100天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的天数有32618864+++=天,所以该市一天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的概率为640.64100=; (2)由所给数据,可得22⨯列联表为:2SO2.5PM[]0,150(]150,475合计[]0,7564 16 80 (]75,11510 10 20 合计 7426100(3)根据22⨯列联表中的数据可得的222()100(64101610)()()()()80207426n ad bc K a b c d a c b d -⨯⨯-⨯==++++⨯⨯⨯36007.4844 6.635481=≈>, 因为根据临界值表可知,有99%的把握认为该市一天空气中 2.5PM 浓度与2SO 浓度有关. 3 .(2020新高考II 卷(海南卷)·)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM 2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM 2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM 2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,【答案】(1)0.64;(2)答案见答案解析;(3)有.【答案解析】:(1)由表格可知,该市100天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的天数有32618864+++=天,所以该市一天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的概率为640.64100=; (2)由所给数据,可得22⨯列联表为:2SO2.5PM[]0,150(]150,475合计[]0,7564 16 80 (]75,11510 10 20 合计 7426100(3)根据22⨯列联表中的数据可得222()100(64101610)()()()()80207426n ad bc K a b c d a c b d -⨯⨯-⨯==++++⨯⨯⨯36007.4844 6.635481=≈>, 因为根据临界值表可知,有99%的把握认为该市一天空气中 2.5PM 浓度与2SO 浓度有关. 【题目栏目】统计\相关关系、回归分析与独立性检验\独立性检验4.(2021年高考全国甲卷文科·)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品 二级品 合计 甲机床 150 50 200 乙机床 120 80 200 合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++ ()2P K k ≥ 0.050 0.0100.001k 3.841 6.635 10.828【答案】(1)75%;60%;的(2)能.答案解析:(1)甲机床生产的产品中的一级品的频率为15075% 200=,乙机床生产的产品中的一级品的频率为12060% 200=.(2)()22400150801205040010 6.63527013020020039K⨯-⨯==>>⨯⨯⨯,故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.5.(2020年高考数学课标Ⅲ卷文科·)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级[0,200](200,400] (400,600]1(优) 216 252(良) 510 123(轻度污染) 67 84(中度污染) 72 0(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.050 0.010 0.001 k 3.841 6.635 10.828【答案】(1)该市一天的空气质量等级分别为1、2、3、4的概率分别为0.43、0.27、0.21、0.09;(2)350;(3)有,理由见答案解析.【答案解析】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为216250.43100++=,等级为2的概率为510120.27100++=,等级为3的概率为6780.21100++=,等级为4的概率为7200.09100++=;(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100203003550045350100⨯+⨯+⨯=(3)22⨯列联表如下:人次400≤人次400>空气质量不好 3337 空气质量好 228()221003383722 5.820 3.84155457030K ⨯⨯-⨯=≈>⨯⨯⨯,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.6.(2019年高考数学课标Ⅰ卷文科·)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意 不满意 男顾客 40 10 女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:22()()()()()n ad bc K a b c d a c b d -=++++.2()P K k …0.050 0.010 0.001 k3.8416.63510.828【答案】【答案解析】(1)由调查数据,男顾客中对该商场服务满意的比率为400.850=,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为300.650=,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)22100(40203010)4.76250507030K⨯⨯-⨯=≈⨯⨯⨯.由于4.762 3.841>,故有95%的把握认为男、女顾客对该商场服务的评价有差异.。

概率与统计(押题专练)-2019年高考理数二轮复习精品资料+Word版含解析

概率与统计(押题专练)-2019年高考理数二轮复习精品资料+Word版含解析

4.在 1, 2, 3,4, 5, 6, 7, 8 这组数据中,随机取出五个不同的数,则数字
5 是取出的五个不同数的中
位数的概率为 ( )
9
9
9
5
A. 56 B. 28 C.14 D. 9
【答案】 B 【解析】要满足题意,则抽取的除
求概率
P=
C24·C23 C58

ቤተ መጻሕፍቲ ባይዱ
9 28.
5 以外的四个数字中,有两个比 5 小,有两个比 5 大,故所
3 种情况, ∴甲、乙两人参加同一兴趣小组的概率
P= 39= 13,故选 A.
2.在区间 [ - 2, 3]上随机选取一个数 X,则 X≤1的概率为 ( ) 4321
A. 5 B. 5 C.5 D.5 【答案】 B 这是一个几何概型问题, 测度是长度, 此问题的总体长度为 5,使得 “X≤1”的长度为 3,故 P(X≤1)
P(2

ξ≤
4=)
P
(ξ=
3)

P(
ξ=
4)=
213+
214=
3 16.
14.已知随机变量 X+ η=8,若 X~ B(10, 0.6),则 E(η)和 D(η)分别是 ( )
A . 6 和 2.4 B . 2 和 2.4
C. 2 和 5.6 D. 6 和 5.6 【答案】 B 【解析】若两个随机变量
m、n,本次期末考试两级部数学平均分分别是
a、b,则这两个级
部的数学平均分为
na m

mnb;
④某中学采用系统抽样方法,从该校高一年级全体
800 名学生中抽 50 名学生做牙齿健康检查,现将 800 名
学生从 1 到 800 进行编号.已知从 497~ 513 这 16 个数中取得的学生编号是 503,则初始在第 1 小组 1~ 16

(新课标)天津市2019年高考数学二轮复习 专题能力训练20 概率、统计与统计案例 理

(新课标)天津市2019年高考数学二轮复习 专题能力训练20 概率、统计与统计案例 理

专题能力训练20 概率、统计与统计案例一、能力突破训练1.某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30 之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是()A。

B.C. D.2.已知x与y之间的一组数据:x0123y m35.57已求得关于y与x的线性回归方程为=2。

1x+0。

85,则m的值为()A.1 B。

0。

85 C。

0.7 D.0。

53。

某市2016年各月的平均气温(℃)数据的茎叶图如下:则这组数据的中位数是()A。

19 B。

20 C。

21.5 D.234.(2018全国Ⅱ,理8)我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30=7+23。

在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是()A. B.C。

D.5.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x/万元8。

28。

610.011.311。

9支出y/万元6。

27.58.08。

59。

8根据上表可得回归直线方程x+,其中=0。

76,.据此估计,该社区一户年收入为15万元家庭的年支出为()A。

11.4万元B.11.8万元C。

12.0万元D。

12。

2万元6。

如图,点A的坐标为(1,0),点C的坐标为(2,4),函数f(x)=x2。

若在矩形ABCD内随机取一点,则此点取自阴影部分的概率等于.7。

有一个底面圆的半径为1,高为2的圆柱,点O为这个圆柱底面圆的圆心,在这个圆柱内随机取一点P,则点P到点O的距离大于1的概率为.8.某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件。

9。

一辆小客车有5个座位,其座位号为1,2,3,4,5,乘客P1,P2,P3,P4,P5的座位号分别为1,2,3,4,5,他们按照座位号从小到大的顺序先后上车,乘客P1因身体原因没有坐1号座位,这时司机要求余下的乘客按以下规则就座:如果自己的座位空着,就只能坐自己的座位;如果自己的座位已有乘客就座,就在这5个座位的剩余空位中任意选择座位。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

四统计概率(B)
1.(2018·张家口质检)2018年2月9~25日,第23届冬奥会在韩国平昌举行,4年后,第24届冬奥会将在中国北京和张家口举行,为了宣传冬奥会,某大学在平昌冬奥会开幕后的第二天,从全校学生中随机抽取了120名学生,对是否收看平昌冬奥会开幕式情况进行了问卷调查,统计数据如下:
(1)根据上表说明,能否有99%的把握认为,收看开幕式与性别有关?
(2)现从参与问卷调查且收看了开幕式的学生中,采用按性别分层抽样的方法选取12人参加2022年北京冬奥会志愿者宣传活动.
①问男、女学生各选取了多少人?
②若从这12人中随机选取3人到校广播站作冬奥会及冰雪项目的宣传介绍,设选取的3人中女生人数为X,写出X的分布列,并求E(X).
2.(2018·宁夏吴忠一模)观察研究某种植物的生长速度与温度的关系,经过统计,得到生长速度(单位:毫米/月)与月平均气温的对比表如下:
(1)求生长速度y关于温度t的线性回归方程(斜率和截距均保留三位有效数字).
(2)利用(1)中的线性回归方程,分析气温从-5 ℃至 20 ℃时生长速度的变化情况,如果某月的平均气温是2 ℃时,预测这月大约能生长多少.
附:回归直线的斜率和截距的最小二乘法估计公式分别为
==,=-.
3.(2018·宿州一模)为了了解市民对开设传统文化课的态度,教育机构随机抽取了200位市民进行了解,发现支持开展的占75%,在抽取的男性市民120人中持支持态度的为80人.
(1)完成2×2列联表,并判断是否有99.9%的把握认为性别与支持与否有关?
(2)为了进一步征求对开展传统文化的意见和建议,从抽取的200位市民中对不支持的按照分层抽样的方法抽取5位市民,并从抽取的5人中再随机选取2人进行座谈,求选取的2人恰.
女的概率1男1好为2. 附:K=
4.(2018·贵阳模拟)从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如图频率分布直方图,
s件产品质量指标值的样本平均数和样本方差((1)求这500); 2同一组中的数据用该组区间的
中点值作代表2近似为样其中μμ,σ),(2)由直方图可以认为,这种产品的质量指标值Z服从正态分布N(22.
近似为样本方差s本平均数,σP(187.8<Z<212.2);
,求①利用该正态分布件产品中质量指标值位于区间100记X表示这②某用户从该企业购买了100件这种产品,E(X).
求.利用①的结果,(187.8,212.2)的产品件数2+2μ-2σ<Z<则σ<Z<μ+σ)=0.682 7,P(μμσ~≈附:12.2.若ZN(μ,),则P(-)=0.954 5. σ
所以有99%的把握认为收看开幕解:(1)因为K=1..
2=7.5>6.635,
式与性别有关(2)①根据分层抽样方法抽得男生×12=9人,女生×12=3人,
所以选取的12人中,男生有9人,女生有3人.
0,1,2,3.
的可能取值有,X②由题意可知.
==,
P(X=0)=,P(X=1)=
==,
P(X=2)=,P(X=3)=所以X的分布列如下
P
所以E(X)=0×+1×+2×+3×=.
2.解:(1)由题可知
==8,
==6,
ty=-10+0+30+48+84+120+200=472, ii=25+0+36+64+144+225+400=894,
则==≈0.305,
=-≈6-0.305×8=3.56,
于是生长速度y关于温度t的线性回归方程为y=0.305t+3.56.
(2)利用(1)的线性回归方程可以发现,月平均气温从-5 ℃至20 ℃时该植物生长速度逐渐增加,
如果某月的平均气温是2 ℃时,预测这月大约能生长3.56+0.305×2=4.17毫米.
3.解:(1)抽取的男性市民为120人,持支持态度的为200×75%=150人,
男性公民中持支持态度的为80人,列出2×2列联表如下:
K==≈11.11>10.828,
2所以
所以在犯错误的概率不超过0.1%的前提下,可以认为性别与支持与否有关.
=4,
×5人中抽到的男性的人数为5抽取的(2).
女性的人数为5×=1.
则从5人中随机选取2人,其中恰好为1男1女的概率为P==.
解:(1)抽取产品的质量指标值的样本平均数和样本方差s分别为=170×
24.
0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230× 0.02=200,
×0.02+(-20)×0.09+(-10)×0.22+0×0.33+10×0.24+20×0.08+30×0.02=150. 2222222s=(-30)
(2)①由(1)知,Z~N(200,150),从而P(187.8<Z<212.2)=P(200-12.2<Z<200+ 12.2)=0.682
7.
②由①知,一件产品的质量指标值位于区间(187.8,212.2)的概率为0.682 7,
依题意知X~B(100,0.682 7),
所以E(X)=100×0.682 7=68.27.。

相关文档
最新文档