22版:高考专题突破六 高考中的概率与统计问题(步步高)

合集下载

【步步高】高考数学 二轮专题复习 专题6第2讲 概率与统计课件

【步步高】高考数学 二轮专题复习 专题6第2讲 概率与统计课件

变式训练 2 已知区域 Ω={(x,y)|x+y≤10,x≥0,y≥0},
A={(x,y)|x-y≥0,x≤5,y≥0},若向区域 Ω 上随机投
1 1 个点,则这个点落入区域 A 的概率 P(A)=___4_____.
解析 作出如图所示的可行域,易得区 域 Ω 的面积为12×10×10=50,区域 A(阴 影 部 分 ) 的 面 积 为 12 ×5×5 = 225 . 故 该 点
题型二 几何概型的概率问f(x)=x3+
ax-b 在区间[-1,1]上有且仅有一个零点的概率是______. 思维启迪 由于 a∈[0,2],根据三次函数的性质可知函数 f(x) 在[-1,1]上单调递增,根据函数的零点定理,实数 a,b 应 满足 f(-1)≤0,f(1)≥0,由此即得实数 a,b 所满足的不等 式组,把问题转化为平面上的区域面积之比. 解析 因为 f′(x)=3x2+a,由于 a≥0,故 f′(x)≥0 恒成立, 故函数 f(x)在[-1,1]上单调递增,故函数 f(x)在区间[-1,1]上有且只有一个零点的充 要条件是ff((- 1)≥1)≤ 0,0, 即aa+ -bb+ +11≥ ≥00, .
解析 用频率分布直方图反映样本的频率分布,每个小矩形 的面积等于样本数据落在相应区间上的频率,则新生婴儿的 体重在[3.2,4.0)(kg)的人数为 100×(0.4×0.625+0.4×0.375) =40(人).
答案 40
(3)设初三年级女生比男生多的事件为 A,初三年级女生、男 生数记为(y,z), 由(2)知 y+z=500,且 y,z∈N*, 基本事件空间包含的基本事件有: (245,255)、(246,254)、(247,253)、…、(255,245)共 11 个, 事件 A 包含的基本事件有:(251,249)、(252,248)、(253,247)、 (254,246)、(255,245)共 5 个. ∴P(A)=151.

高考数学步步高2022理科人教版A 第十一章 高考专题突破六 高考中的概率与统计问题

高考数学步步高2022理科人教版A 第十一章 高考专题突破六 高考中的概率与统计问题

高考专题突破六高考中的概率与统计问题题型一随机事件的概率例1 (12分)(2019·北京)改革开放以来,人们的支付方式发生巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校所有的1 000名学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:支付金额支付方式不大于2 000元大于2 000元仅使用A27人3人仅使用B24人1人(1)估计该校学生中上个月A,B两种支付方式都使用的人数;(2)从样本仅使用B的学生中随机抽取1人,求该学生上个月支付金额大于2 000元的概率;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用B的学生中随机抽查1人,发现他本月的支付金额大于2 000元.结合(2)的结果,能否认为样本仅使用B的学生中本月支付金额大于2 000元的人数有变化?说明理由.规范解答解(1)由题意知,样本中仅使用A的学生有27+3=30(人),仅使用B的学生有24+1=25(人),A,B两种支付方式都不使用的学生有5人,[2分]故样本中A,B两种支付方式都使用的学生有100-30-25-5=40(人).估计该校学生中上个月A,B两种支付方式都使用的人数为40100×1 000=400.[4分](2)记事件C为“从样本仅使用B的学生中随机抽取1人,该学生上个月的支付金额大于2 000元”,则P(C)=125=0.04.[8分](3)记事件E为“从样本仅使用B的学生中随机抽查1人,该学生本月的支付金额大于2 000元”.假设样本仅使用B的学生中,本月支付金额大于2 000元的人数没有变化,则由(2)知,P(E)=0.04.[10分]答案示例1:可以认为有变化.理由如下:P(E)比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2 000元的人数发生了变化,所以可以认为有变化.[12分] 答案示例2:无法确定有没有变化,理由如下:事件E 是随机事件,P (E )比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.[12分]第一步:审清题意,理清条件和结论,找到关键数量关系.第二步:找数量关系,把图表语言转化为数字,将图表中的数字转化为公式中的字母. 第三步:建立解决方案,找准公式,根据图表数据代入公式计算数值. 第四步:作出判断得结论,依据题意,借助数表作出正确判断. 第五步:反思回顾,查看关键点、易错点和答题规范性.跟踪训练 1 疫情爆发以来,相关疫苗企业发挥专业优势与技术优势争分夺秒开展疫苗研发.为测试疫苗的有效性(若疫苗有效的概率小于90%,则认为测试没有通过),选定 2 000个样本分成三组,测试结果如下表:A 组B 组C 组 疫苗有效 673 x y 疫苗无效7790z已知在全体样本中随机抽取1个,抽到B 组疫苗有效的概率是0.33. (1)求x ,y +z 的值;(2)现用分层抽样的方法在全体样本中抽取360个测试结果,求C 组应抽取多少个? (3)已知y ≥465,z ≥30,求疫苗能通过测试的概率.解 (1)∵在全体样本中随机抽取1个,抽到B 组疫苗有效的概率是0.33. ∴x2 000=0.33,∴x =660, y +z =2 000-(673+77+660+90)=500. (2)应在C 组抽取的个数为360×5002 000=90.(3)由题意知疫苗有效需满足77+90+z ≤2 000×10%, 即z ≤33,C 组疫苗有效与无效的可能情况有(465,35),(466,34),(467,33),(468,32),(469,31),(470,30), 共6种结果,有效的可能情况有(467,33),(468,32),(469,31),(470,30), 共4种结果, ∴疫苗能通过测试的概率P =46=23.题型二 用样本估计总体例2 (2020·石家庄模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x 人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.(1)求x ;(2)求抽取的x 人的年龄的中位数(结果保留整数);(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加“一带一路”知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90. ①分别求5个年龄组和5个职业组成绩的平均数和方差;②以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.解 (1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴6x =0.05,∴x =120.(2)设中位数为a ,则0.01×5+0.07×5+(a -30)×0.06=0.5, ∴a =953≈32,则中位数为32.(3)①5个年龄组成绩的平均数为x 1=15×(93+96+97+94+90)=94,方差为s 21=15×[(-1)2+22+32+02+(-4)2]=6.5个职业组成绩的平均数为x 2=15×(93+98+94+95+90)=94,方差为s 22=15×[(-1)2+42+02+12+(-4)2]=6.8.②从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可). 思维升华 (1)注意频率分布直方图中平均数、中位数、众数的求法. (2)处理决策问题时,一般先比较平均数,若平均数相同,再比较方差.跟踪训练2 (2020·佛山模拟)寒假期间,很多同学都喜欢参加“迎春花市摆档口”的社会实践活动,下表是今年某个档口某种精品的销售数据.日期 2月14日2月15日2月16日2月17日2月18日销售量/件 白天35 32 43 39 51 晚上 4642505260已知摊位租金900元/档,售余精品可以进货价退回厂家. (1)求表中10个销售数据的中位数和平均数;(2)明年花市期间甲、乙两位同学想合租一个摊位销售同样的精品,其中甲、乙分别承包白天、晚上的精品销售,承包时间段内销售所获利润归承包者所有.如果其他条件不变,以今年的数据为依据,甲、乙两位同学应如何分担租金才较为合理? 解 (1)中位数为43+462=44.5,平均数为35+46+32+42+43+50+39+52+51+6010=45.(2)由题意知,今年花市期间该摊位所售精品的销售量与时间段有关,明年合租摊位的租金较为合理的分摊方法是根据今年的平均销售量按比例分担. 今年白天的平均销售量为35+32+43+39+515=40(件/天),今年晚上的平均销售量为46+42+50+52+605=50(件/天),所以甲同学应分担的租金为900×4040+50=400(元), 乙同学应分担的租金为900×5040+50=500(元). (注:本小题也可直接按白天、晚上的总销售量比例分摊租金.)题型三 回归分析与独立性检验例3 近年来,国资委、党委高度重视扶贫开发工作,坚决贯彻落实中央扶贫工作重大决策部署,在各个贫困县全力推进定点扶贫各项工作,取得了积极成效,某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面积以及相应的管理时间的关系如下表所示:土地使用面积x (单位:亩) 1 2 3 4 5 管理时间y (单位:月)810132524并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:愿意参与管理不愿意参与管理男性村民15050(1)求y 关于x 的线性回归方程;(计算结果保留两位小数)(2)是否有99.9%的把握认为村民的性别与参与管理的意愿具有相关性?参考公式:b ^=∑ni =1 (x i -x )(y i -y )∑ni =1(x i -x )2,a ^=y -b ^x ,K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d . 临界值表:解 (1)依题意得,x =1+2+3+4+55=3,y =8+10+13+25+245=16,故∑5i =1(x i -x )(y i -y )=(-2)×(-8)+(-1)×(-6)+1×9+2×8=47, ∑5i =1(x i -x )2=4+1+1+4=10,则b ^=∑5i =1 (x i -x )(y i -y )∑5i =1(x i -x )2=4710=4.7, a ^=y -b ^x =16-4.7×3=1.9,所以y 关于x 的线性回归方程为y ^=4.7x +1.9. (2)依题意,女性不愿意参与管理的人数为50, 计算得K 2的观测值为k =300×(150×50-50×50)2200×100×200×100=300×5 000×5 000200×100×200×100=18.75>10.828,故有99.9%的把握认为村民的性别与参与管理的意愿具有相关性.思维升华 统计案例的综合应用常涉及相互独立事件同时发生的概率、独立重复实验、超几何分布、二项分布、独立性检验、线性回归等知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识.跟踪训练3 (2020·济宁模拟)下面给出了根据我国2012年~2018年水果人均占有量y (单位:kg)和年份代码x 绘制的散点图和线性回归方程的残差图(2012年~2018年的年份代码x 分别为1~7).(1)根据散点图分析y 与x 之间的相关关系;(2)根据散点图相应数据计算得∑i =17y i =1 074,∑i =17x i y i =4 517,求y 关于x 的线性回归方程;(3)根据线性回归方程的残差图,分析线性回归方程的拟合效果.(只写出结论) 附:线性回归方程y ^=a ^+b ^x 中斜率和截距的最小二乘估计公式分别为b ^=∑i =1n (x i -x )(y i -y )∑i =1n(x i -x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .解 (1)由散点图可以看出,点大致分布在某一直线的附近,且当x 由小变大时,y 也由小变大,从而y 与x 之间是正相关关系.(2)由题中数据可得x =17(1+2+3+4+5+6+7)=4,y =17×1 074=1 0747,从而b ^=∑i =17x i y i -7x ·y∑i =17x 2i -7x2= 4 517-7×1 0747×412+22+32+42+52+62+72-7×42=22128, a ^=y -b ^x =1 0747-22128×4=8537, 从而所求y 关于x 的线性回归方程为y ^=22128x +8537.(3)由残差图可以看出,残差对应的点均匀地落在水平带状区域内,且宽度较窄,说明拟合效果较好.课时精练1.(2020·南宁适应性测试)某电子商务平台的管理员随机抽取了1 000位上网购物者,并对其年龄(在10岁到69岁之间)进行了调查,统计情况如表所示.年龄 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70) 人数100150a200b50已知[30,40),[40,50),[50,60)三个年龄段的上网购物的人数依次构成递减的等比数列. (1)求a ,b 的值;(2)若将年龄在[30,50)内的上网购物者定义为“消费主力军”,其他年龄段内的上网购物者定义为“消费潜力军”.现采用分层抽样的方式从参与调查的1 000位上网购物者中抽取5人,再从这5人中抽取2人,求这2人中至少有一人是消费潜力军的概率. 解 (1)由题意得⎩⎪⎨⎪⎧a +b =500,ab =40 000,a >b ,解得a =400,b =100.(2)由题意可知,在抽取的5人中,有3人是消费主力军,分别记为a 1,a 2,a 3,有2人是消费潜力军,分别记为b 1,b 2.记“这2人中至少有一人是消费潜力军”为事件A .从这5人中抽取2人所有可能的情况为(a 1,a 2),(a 1,a 3),(a 1,b 1),(a 1,b 2),(a 2,a 3),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2),共10种.符合事件A 的有(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2),共7种. 故所求概率为P (A )=710.2.某中学高一年级从甲、乙两个班级各选出7名学生参加学科测试,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83.(1)求x 和y 的值,并计算甲班7位学生成绩的方差s 2;(2)从成绩在90分以上的学生中随机抽取两名学生,求至少有一名学生是甲班的概率. 解 (1)由题意知85×7=79+78+80+80+x +85+92+96,解得x =5. 又因为乙班学生成绩的中位数是83,所以y =3.s 2=17[(79-85)2+(78-85)2+(80-85)2+(85-85)2+(85-85)2+(92-85)2+(96-85)2]=40.(2)设甲班成绩在90分以上的学生为A ,B , 乙班成绩在90分以上的学生为C ,D ,E . 从成绩在90分以上的学生中随机抽取两名学生,共有AB ,AC ,AD ,AE ,BC ,BD ,BE ,CD ,CE ,DE,10种情况,其中至少有一名学生是甲班的学生共有7种情况,记“至少有一名学生是甲班的学生”为事件M ,则P (M )=710.3.(2019·全国Ⅲ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意 不满意 男顾客 40 10 女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).P (K 2≥k )0.050 0.010 0.001 k3.8416.63510.828解 (1)由调查数据,男顾客中对该商场服务满意的频率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8. 女顾客中对该商场服务满意的频率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6. (2)K 2的观测值k =100×(40×20-30×10)250×50×70×30≈4.762.由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.4.(2020·内江模拟)基于移动网络技术的共享单车被称为“新四大发明”之一,短时间内就风靡全国,给人们带来新的出行体验,某共享单车运营公司的市场研究人员为了了解公司的经营状况,对公司最近6个月的市场占有率y %进行了统计,结果如下表:(1)请用相关系数说明能否用线性回归模型拟合y 与月份代码x 之间的关系.如果能,请计算出y 关于x 的线性回归方程;如果不能,请说明理由;(2)根据调研数据,公司决定再采购一批单车扩大市场,从成本1 000元/辆的A 型车和800元/辆的B 型车中选购一种,两款单车使用寿命频数如下表:经测算,平均每辆单车每年能为公司带来500元收入,不考虑除采购成本以外的其他成本,假设每辆单车的使用寿命都是整数年,用频率估计每辆车使用寿命的概率,以平均每辆单车所产生的利润的估计值为决策依据,如果你是公司负责人,会选择采购哪款车型? 参考数据:∑i =16(x i -x )(y i -y )=35,∑i =16(x i -x )2=17.5,∑i =16(y i -y )2=76, 1 330≈36.5.参考公式:相关系数r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑i =1n(y i -y )2,b ^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2,a ^=y -b ^x .解 (1)由表格中数据可得,x =3.5,y =16.∵r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x)2∑i =1n(y i -y )2=3517.5×76=351 330≈0.96.∴y 与月份代码x 之间具有较强的相关关系,故可用线性回归模型拟合两变量之间的关系.b ^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2=3517.5=2. ∴a ^=y -b ^x =16-2×3.5=9, ∴关于x 的线性回归方程为y ^=2x +9. (2)这100辆A 款单车平均每辆车的利润为1100(-500×10+0×30+500×40+1 000×20)=350(元), 这100辆B 款单车平均每辆车的利润为1100(-300×15+200×40+700×35+1 200×10)=400(元), ∴用频率估计概率,A 款单车与B 款单车平均每辆的利润估计值分别为350元、400元,应采购B 款车型.5.西尼罗河病毒(WNV)是一种脑炎病毒,WNV 通常是由鸟类携带,经蚊子传播给人类.1999年8-10月,美国纽约首次爆发了WNV 流行脑炎.在治疗上目前尚未有什么特效药可用,感染者需要采取输液及呼吸系统支持性疗法,有研究表明,大剂量的利巴韦林含片可抑制WNV 的复制,抑制其对细胞的致病作用.现某药企加大了利巴韦林含片的生产,为了提高生产效率,该药企负责人收集了5组实验数据,得到利巴韦林的投入量x (千克)和利巴韦林含片产量y (百盒)的统计数据如下:投入量x (千克) 1 2 3 4 5 产量y (百盒)1620232526由相关系数r 可以反映两个变量相关性的强弱,|r |∈[0.75,1],认为变量相关性很强;|r |∈[0.3,0.75),认为变量相关性一般;|r |∈[0,0.25],认为变量相关性较弱. (1)计算相关系数r ,并判断变量x ,y 相关性强弱;(2)根据上表中的数据,建立y 关于x 的线性回归方程y ^=b ^x +a ^;为了使某组利巴韦林含片产量达到150百盒,估计该组应投入多少利巴韦林? 参考数据:660≈25.69.参考公式:相关系数r =∑i =1n(x i -x )(y i -y )∑i =1n (x i -x )2∑i =1n (y i -y )2,线性回归方程y ^=b ^x +a ^中,b ^=∑n i =1(x i -x )(y i -y ) ∑n i =1(x i -x )2, a ^=y -b ^x .解 (1)x =15×(1+2+3+4+5)=3,y =15×(16+20+23+25+26)=22, ∑5i =1(x i -x )(y i -y )=(1-3)×(16-22)+(2-3)×(20-22)+(3-3)×(23-22)+(4-3)×(25-22)+(5-3)×(26-22)=25, ∑5i =1(x i -x )2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10,∑5i =1(y i -y )2=(16-22)2+(20-22)2+(23-22)2+(25-22)2+(26-22)2=66,则r =∑5i =1(x i -x )(y i -y )∑5i =1(x i -x )2∑5i =1(y i -y )2=25660≈0.97, 所以x 与y 具有很强的相关性.(2)由(1)得,b ^=∑5i =1 (x i -x )(y i -y )∑5i =1(x i -x )2=2510=2.5, a ^=y -b ^x =22-2.5×3=14.5,所以y 关于x 的线性回归方程为y ^=2.5x +14.5.当y =150时,x =54.2.故要使某组利巴韦林含片产量达到150百盒,估计该组应投入54.2千克利巴韦林.。

2021届步步高数学大一轮复习讲义(理科)第十二章 高考专题突破六 高考中的概率与统计问题

2021届步步高数学大一轮复习讲义(理科)第十二章 高考专题突破六 高考中的概率与统计问题

高考专题突破六高考中的概率与统计问题概率与统计的综合应用例1(2020·四川双流中学检测)甲、乙两品牌计划入驻某商场,该商场批准两个品牌先进场试销5天.两品牌提供的返利方案如下:甲品牌无固定返利,卖出10件以内(含10件)的产品,每件产品返利5元,超出10件的部分每件返利7元;乙品牌每天固定返利20元,且每卖出一件产品再返利3元.经统计,两家品牌在试销期间的销售件数的茎叶图如图:(1)现从乙品牌试销的5天中随机抽取3天,求这3天的销售量中至少有一天低于10的概率;(2)若将频率视作概率,回答以下问题:①记甲品牌的日返利额为X(单位:元),求X的分布列和均值;②商场拟在甲、乙两品牌中选择一个长期销售,如果仅从日返利额的角度考虑,请利用所学的统计学知识为商场作出选择,并说明理由.解 (1)方法一 设A 为从乙品牌试销售的5天中抽取3天,这3天的销量中至少有一天低于10件的事件,则P (A )=C 12C 23+C 22C 13C 35=910. 方法二 设A 为从乙品牌试销售的5天中抽取3天,这3天的销售量中至少有一天低于10件的事件,则A 为从乙品牌试销售的5天中抽取3天,这3天的销售量都不低于10件的事件, 则P (A )=1-P (A )=1-C 33C 35=1-110=910.(2)①设甲品牌的日销售量为随机变量ξ, 则甲品牌的日返利额X (单位:元)与ξ的关系为:X =⎩⎪⎨⎪⎧5ξ,0≤ξ≤10,ξ∈N ,50+7(ξ-10),ξ≥11,ξ∈N .当ξ=6时,X =30; 当ξ=7时,X =35; 当ξ=10时,X =50; 当ξ=12时,X =64. 所以X 的分布列为E (X )=30×25+35×15+50×15+64×15=41.8(元).②方法一 设乙品牌的日销售量为随机变量η,乙品牌的日返利额Y (单位:元)与η的关系为Y =20+3η,且η的分布列为则E(η)=6×15+9×15+12×25+13×15=10.4(件),则E(Y)=E(3η+20)=3E(η)+20=3×10.4+20=51.2(元).因为乙品牌的日平均返利额大于甲品牌的日平均返利额,所以如果仅从日返利额的角度考虑,商场应选择乙品牌长期销售.方法二乙品牌的日返利额Y(单位:元)的取值集合为{38,47,56,59},分布列为则E(Y)=38×15+47×15+56×25+59×15=51.2(元).思维升华概率与统计作为考查学生应用意识的重要载体,已成为近几年高考一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.跟踪训练1(2020·四川成都诊断性检测)某保险公司给年龄在20~70岁的民众提供某种疾病的一年期医疗保险,现从10 000名参保人员中随机抽取100名作为样本进行分析,按年龄段[20,30),[30,40),[40,50),[50,60),[60,70]分成了五组,其频率分布直方图如图所示;参保年龄(单位:岁)与每人每年应交纳的保费(单位:元)如表所示.据统计,该公司每年为这10 000名参保人员支出的各种费用为一百万元.(1)用样本的频率分布估计总体分布,为使公司不亏本,求x精确到整数时的最小值x0;(2)经调查,年龄在[60,70]的老人每50人中有1人患该种疾病(以此频率作为概率).该种疾病的治疗费为12 000元,如果参保,保险公司补贴治疗费10 000元.某老人年龄为66岁,若购买该项保险(x取(1)中的x0),针对此疾病所支付的费用为X元;若没有购买该项保险,针对此疾病所支付的费用为Y元.试比较X和Y的均值大小,并判断该老人购买此项保险是否划算?解(1)由(0.007+0.016+a+0.025+0.020)×10=1,解得a=0.032.该保险公司每年收取的保费为10 000(0.007×10x+0.016×10×2x+0.032×10×3x+0.025×10×4x+0.020×10×5x)=10 000×3.35x.要使公司不亏本,则10 000×3.35x≥1 000 000,即3.35x≥100,解得x≥1003.35≈29.85,∴x0=30.(2)①若该老人购买了此项保险,则X 的取值为150,2 150.P (X =150)=4950,P (X =2 150)=150,∴E (X )=150×4950+2 150×150=147+43=190(元).②若该老人没有购买此项保险,则Y 的取值为0,12 000. P (Y =0)=4950,P (X =12 000)=150,∴E (Y )=0×4950+12 000×150=240(元).∴E (Y )>E (X ),∴该老人购买此项保险比较划算.概率与统计案例的综合应用例2 (2020·蓉城名校联盟联考)成都市现在已是拥有1 400多万人口的城市,机动车保有量已达450多万辆,成年人中约40%拥有机动车驾驶证.为了解本市成年人的交通安全意识情况,某中学的同学利用国庆假期进行了一次全市成年人安全知识抽样调查.先根据是否拥有驾驶证,用分层抽样的方法抽取了200名成年人,然后对这200人进行问卷调查.这200人所得的分数都分布在[30,100]范围内,规定分数在80以上(含80)的为“具有很强安全意识”,所得分数的频率分布直方图如图所示.(1)补全上面的2×2列联表,并判断能否有超过95%的把握认为“‘具有很强安全意识’与拥有驾驶证”有关?(2)将上述调查所得的频率视为概率,现从全市成年人中随机抽取4人,记“具有很强安全意识”的人数为X,求X的分布列及均值.附表及公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.解(1)200人中拥有驾驶证的占40%,有80人,没有驾驶证的有120人;具有很强安全意识的占20%,有40人,不具有很强安全意识的有160人.补全的2×2列联表如表所示:K 2的观测值k =200×(22×102-18×58)240×160×80×120=7516=4.687 5>3.841, 所以有超过95%的把握认为“‘具有很强安全意识’与拥有驾驶证”有关.(2)由频率分布直方图中数据可知,抽到的每个成年人“具有很强安全意识”的概率为15,所以X =0,1,2,3,4,且X ~B ⎝⎛⎭⎫4,15. P (X =k )=C k 4·⎝⎛⎭⎫15k ·⎝⎛⎭⎫454-k(k =0,1,2,3,4), X 的分布列为所以E (X )=4×15=45.思维升华 概率与统计案例的综合应用常涉及相互独立事件同时发生的概率、独立重复实验、超几何分布、二项分布、独立性检验、线性回归等知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识.跟踪训练2 (2020·四川成都检测)为了让税收政策更好地为社会发展服务,国家在修订《中华人民共和国个人所得税法》之后,发布了《个人所得税专项附加扣除暂行办法》,明确“个税专项附加扣除”是指个人所得税法规定的子女教育、继续教育、大病医疗、住房贷款利息、住房租金、赡养老人六项专项附加扣除,并公布了相应的定额扣除标准,决定自2019年1月1日起施行.某企业为了调查内部员工对新个税方案的满意程度与年龄的关系,通过问卷调查,整理数据得如下2×2列联表:(1)根据列联表,能否有99%的把握认为满意程度与年龄有关?(2)为了帮助年龄在40岁及以下的未购房的8名员工解决实际困难,该企业拟按员工贡献积分x (单位:分)给予相应的住房补贴y (单位:元),现有两种补贴方案,方案甲:y =1 000+700x ;方案乙:y =⎩⎪⎨⎪⎧3 000,0<x ≤5,5 600,5<x ≤10,9 000,x >10.已知这8名员工的贡献积分分别为2,3,6,7,7,11,12,12,将采用方案甲比采用方案乙获得更多补贴的员工记为“A 类员工”.为了解员工对补贴方案的认可度,现从这8名员工中随机抽取4名进行面谈,求恰好抽到3名“A 类员工”的概率. 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d . 参考数据:解 (1)根据列联表可得K 2的观测值k =80×(25×30-10×15)235×45×40×40=807≈11.429.∵11.429>6.635,∴有99%的把握认为满意程度与年龄有关.(2)据题意,这8名员工的贡献积分及按甲、乙两种方案所获补贴情况为:由表可知,“A类员工”有5名.设从这8名员工中随机抽取4名进行面谈,恰好抽到3名“A类员工”的概率为P,则P=C35C13C48=37.均值与方差在决策中的应用例3(2018·全国Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品做检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件做检验,再根据检验结果决定是否对余下的所有新产品做检验.设每件产品为不合格品的概率都为p(0<p<1),且各件产品为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为f (p),求f (p)的最大值点p0;(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.①若不对该箱余下的产品做出检验,这一箱产品的检验费用与赔偿费用的和记为X,求E(X);②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品做检验?解(1)20件产品中恰有2件不合格品的概率为f (p)=C220·p2(1-p)18.因此f′(p)=C220[2p(1-p)18-18p2(1-p)17]=2C220p(1-p)17(1-10p).令f′(p)=0,得p=0.1.当p∈(0,0.1)时,f′(p)>0;当p∈(0.1,1)时,f′(p)<0.所以f (p)的最大值点为p0=0.1.(2)由(1)知,p=0.1①令Y表示余下的180件产品中的不合格品件数,依题意知Y~B(180,0.1),X=20×2+25Y,即X=40+25Y.所以E(X)=E(40+25Y)=40+25E(Y)=490.②如果对余下的产品做检验,则这一箱产品所需要的检验费为400元.由于E(X)=490>400,故应该对余下的产品做检验.思维升华随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量偏离均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要依据,一般先比较均值,若均值相同,再由方差来决定.跟踪训练3有两种理财产品A和B,投资这两种理财产品一年后盈亏的情况如下(每种理财产品的不同投资结果之间相互独立):产品A产品B注:p >0,q >0.(1)若甲、乙两人分别选择了产品A ,B 投资,一年后他们中至少有一人获利的概率大于34,求实数p 的取值范围;(2)若丙要将20万元人民币投资其中一种产品,以一年后的投资收益的均值为决策依据,则丙选择哪种产品投资较为理想?解 (1)记事件C 为“甲选择产品A 投资且获利”,记事件D 为“乙选择产品B 投资且获利”,记事件E 为“一年后甲、乙两人中至少有一人投资获利”, 则P (C )=14,P (C )=34,P (D )=p ,p (D )=1-p ,P (E )=1-P (C D )=1-34(1-p )>34,∴p >23.又p +q =34,且q >0,∴p <34,∴23<p <34.即p 的取值范围是⎝⎛⎭⎫23,34. (2)假设丙选择A 产品投资,且记ξ为获利金额(单位:万元),则ξ的分布列为∴E (ξ)=10×14-6×13=12.假设丙选择B 产品投资,且记η为获利金额(单位:万元),则η的分布列为E (η)=8p -4q =8p -4⎝⎛⎭⎫34-p =12p -3⎝⎛⎭⎫0<p <34.∴当p =724时,E (ξ)=E (η),丙可在产品A 和产品B 中任选一种投资;当0<p <724时,E (ξ)>E (η),丙应选产品A 投资;当724<p <34时,E (ξ)<E (η),丙应选产品B 投资.例 (12分)(2019·北京)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:(1)从全校学生中随机抽取1人,估计该学生上个月A ,B 两种支付方式都使用的概率; (2)从样本仅使用A 和仅使用B 的学生中各随机抽取1人,以X 表示这2人中上个月支付金额大于1 000元的人数,求X 的分布列和均值;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A 的学生中,随机抽查3人,发现他们本月的支付金额都大于2 000元.根据抽查结果,能否认为样本仅使用A 的学生中本月支付金额大于2 000元的人数有变化?说明理由. 规范解答解 (1)由题意知,样本中仅使用A 的学生有18+9+3=30(人),仅使用B 的学生有10+14+1=25(人),A ,B 两种支付方式都不使用的学生有5人,故样本中A ,B 两种支付方式都使用的学生有100-30-25-5=40(人).[1分]所以从全校学生中随机抽取1人,该学生上个月A ,B 两种支付方式都使用的概率为40100=0.4.[2分](2)X 的所有可能值为0,1,2.[3分]记事件C 为“从样本仅使用A 的学生中随机抽取1人,该学生上个月的支付金额大于1 000元”,事件D 为“从样本仅使用B 的学生中随机抽取1人, 该学生上个月的支付金额大于1 000元”.由题设知,事件C ,D 相互独立,且P (C )=9+330=0.4,P (D )=14+125=0.6,[4分]所以P (X =2)=P (CD )=P (C )P (D )=0.24.[5分] P (X =1)=P (C D ∪C D ) =P (C )P (D )+P (C )P (D ) =0.4×(1-0.6)+(1-0.4)×0.6 =0.52,[6分]P (X =0)=P (C D )=P (C )P (D )=0.24.[7分] 所以X 的分布列为[8分]故X 的均值E (X )=0×0.24+1×0.52+2×0.24=1.0.[9分](3)记事件E 为“从样本仅使用A 的学生中随机抽查3人,他们本月的支付金额大于2 000元”.假设样本仅使用A的学生中,本月支付金额大于2 000元的人数没有变化,则由上个月的样本数据得P(E)=1C330=14 060.[11分]答案示例1:可以认为有变化.理由如下:P(E)比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2 000元的人数发生了变化,所以可以认为有变化.[12分]答案示例2:无法确定有没有变化,理由如下:事件E是随机事件,P(E)比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.[12分]第一步:审清题意,理清条件和结论,找到关键数量关系.第二步:找数量关系,把图表语言转化为数字,将图表中的数字转化为公式中的字母.第三步:建立解决方案,找准公式,根据图表数据代入公式计算数值.第四步:作出判断得结论,依据题意,借助数表作出正确判断.第五步:反思回顾,查看关键点、易错点和答题规范性.1.(2020·四川成都质检)2018年央视大型文化节目《经典咏流传》热播,在全民中掀起了诵读诗词的热潮.某大学社团调查了该校文学院300名学生每天诵读诗词的时间(所有学生诵读时间都在两小时内),并按时间(单位:min)将学生分成六个组:[0,20),[20,40),[40,60),[60,80),[80,100),[100,120],经统计得到了如图所示的频率分布直方图.(1)求频率分布直方图中a的值,并估计该校文学院的学生每天诵读诗词的平均时间;(2)若2名学生诵读诗词的时间分别为x,y.当x,y满足|x-y|>60时,这2名同学组成一个“Team”.已知从每天诵读时间小于20 min和大于或等于80 min的所有学生中用分层抽样的方法抽取5人,现从这5人中随机选取2人,求选取的2人能组成一个“Team”的概率.解(1)∵各组数据的频率之和为1,即所有小矩形的面积和为1,∴(a+a+6a+8a+3a+a)×20=1,解得a=0.002 5.∴该校文学院的学生每天诵读诗词的平均时间为10×0.05+30×0.05+50×0.3+70×0.4+90×0.15+110×0.05=64(min).(2)由频率分布直方图,知[0,20),[80,100),[100,120]内的学生人数的频率之比为1∶3∶1,故5人中[0,20),[80,100),[100,120]内的学生人数分别为1,3,1.方法一设[0,20)内的1名学生为A,[80,100)内的3名学生分别为B,C,D,[100,120]内的1名学生为E,则抽取2人的所有基本事件有AB,AC,AD,AE,BC,BD,BE,CD,CE,DE,共10种.选取的2人能组成一个“Team”的情况有AB,AC,AD,AE,共4种,故选取的2人能组成一个“Team”的概率P=410=2 5.方法二由题意知,应从[0,20)内的学生抽取1人,从[80,120]内的学生抽取1人,故所求概率为C 11C 14C 25=25.2.(2020·贵州贵阳模拟)某大学毕业生准备到贵州非私营单位求职,为了了解工资待遇情况,他在贵州省统计局的官网上,查询到2008年至2017年非私营单位在岗职工的年平均工资近 似值(单位:万元),如下表:(1)请根据上表的数据,利用线性回归模型进行拟合,求y 关于x 的线性回归方程y ^=b ^x +a ^(a ^,b ^的计算结果根据四舍五入精确到小数点后第二位);(2)如果该大学生对年平均工资的期望值为9万元,请利用(1)的结论,预测2020年非私营单位在岗职工的年平均工资(单位:万元.计算结果根据四舍五入精确到小数点后第二位),并判断2020年平均工资能否达到他的期望.参考数据:∑i =110x i y i =311.5,∑i =110x 2i =385,∑i =110(x i -x )(y i -y )=47.5.附:对于一组具有线性相关的数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计分别为b ^=∑i =1nx i y i -n x ·y∑i =1nx 2i -n x2=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2,a ^=y -b ^x .解 (1)由已知,得x =5.5,y =4.8.b ^=∑i =110(x i -x )(y i -y )∑i =110x 2i -n ·x2=47.5385-10×5.52≈0.58, 所以a ^=y -b ^x =4.8-0.58×5.5=1.61, 故y 关于x 的线性回归方程为y ^=0.58x +1.61. (2)由(1)知y ^=0.58x +1.61,当x =13时,y ^=0.58×13+1.61=9.15>9.所以,预测2020年非私营单位在岗职工的年平均工资为9.15万元,达到了他的期望. 3.(2020·贵州贵阳模拟)运动健康已成为大家越来越关心的话题,某公司开发的一个类似计步数据库的公众号,手机用户可以通过关注该公众号查看自己每天行走的步数,同时也可以和好友进行运动量的PK 和点赞.现从张华的好友中随机选取40人(男、女各20人),记录他们某一天行走的步数,并将数据整理如下表:(1)若某人一天行走的步数超过8 000被评定为“积极型”,否则被评定为“懈怠型”,根据题意完成下列2×2列联表,若有n %(n ∈Z )的把握认为男、女的“评定类型”有差异,参考现有公式与数据,则n 可能的最大值为多少?(2)在张华的这40位好友中,从该天行走的步数超过10 000的人中随机抽取3人,设抽取的女性有X 人,求X 的分布列及均值E (X ). 参考公式与数据:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .解 (1)由题意可得2×2列联表如下:K 2的观测值k =40×(13×12-7×8)220×20×21×19=1 000399≈2.506<2.706,所以85<n <90(n ∈Z ),因此n 可能的最大值为89. (2)该天行走步数超过10 000的有6男2女共8人,则X =0,1,2,P (X =0)=C 36C 38=514,P (X =1)=C 12C 26C 38=1528,P (X =2)=C 22C 16C 38=328,所以X 的分布列为所以E (X )=0×514+1×1528+2×328=34.4.东方商店欲购进某种食品(保质期两天),此商店每两天购进该食品一次(购进时,该食品为刚生产的).根据市场调查,该食品每份进价8元,售价12元,如果两天内无法售出,则食品过期作废,且两天内的销售情况互不影响,为了了解市场的需求情况,现统计该产品在本地区100天的销售量如表:(视样本频率为概率)(1)根据该产品100天的销售量统计表,记两天中一共销售该食品份数为ξ,求ξ的分布列与均值;(2)以两天内该产品所获得的利润均值为决策依据,东方商店一次性购进32或33份,哪一种得到的利润更大?解(1)ξ的可能取值有30,31,32,33,34,35,36,其中P(ξ=30)=0.2×0.2=0.04,P(ξ=31)=2×0.2×0.3=0.12,P(ξ=32)=0.3×0.3+2×0.2×0.4=0.25,P(ξ=33)=2×0.2×0.1+2×0.3×0.4=0.28,P(ξ=34)=0.4×0.4+2×0.3×0.1=0.22,P(ξ=35)=2×0.4×0.1=0.08,P(ξ=36)=0.1×0.1=0.01,∴ξ的分布列为∴E(ξ)=30×0.04+31×0.12+32×0.25+33×0.28+34×0.22+35×0.08+36×0.01=32.8.(2)当一次性购进32份食品时,设每两天的利润为X,则X的可能取值有104,116,128,且P(X=104)=0.04,P(X=116)=0.12,P(X=128)=1-0.04-0.12=0.84,∴E(X)=104×0.04+116×0.12+128×0.84=125.6.当一次性购进33份食品时,设每两天的利润为Y,则Y的可能取值有96,108,120,132.且P(Y=96)=0.04,P(Y=108)=0.12,P(Y=120)=0.25,P(Y=132)=1-0.04-0.12-0.25=0.59,∴E(Y)=96×0.04+108×0.12+120×0.25+132×0.59=124.68.∵E(X)>E(Y),∴东方商店一次性购进32份食品时得到的利润更大.5.为了解2019届高三毕业学生的复习备考情况,某省甲、乙两市组织了一次大联考.为比较两市本届高三毕业学生的数学优秀率,某教研机构从甲、乙两市参加大联考的数学高分段(数学成绩不低于100分)的学生中各随机抽取了100名学生,统计其数学成绩,得到甲市数学高分段学生成绩的频率分布直方图如图所示,乙市数学高分段学生成绩的频数分布表如下表所示(同一组数据用该组数据的区间中点值作代表,将频率视为概率).(1)现计算得甲市数学高分段学生成绩的平均分为123分,乙市数学高分段学生成绩的方差为111,试利用统计知识判断甲、乙两市哪一个市2019届高三毕业学生数学高分段成绩更突出;(2)由频率分布直方图可以认为,甲市这次大联考的数学高分段学生成绩Z(单位:分)近似地服从正态分布N (μ,σ2),其中μ近似为样本平均数,试利用该正态分布模型解决下列问题. ①若甲市恰有2万名学生这次大联考的数学成绩不低于100分,试估计甲市这次大联考的数学成绩Z 高于142.6分的学生人数;②现从甲市这次大联考的数学成绩不低于100分的学生中随机抽取1 000人,若抽到k 人的数学成绩在区间(123,142.6]内的可能性最大,试求整数k 的值. 附:若X ~N (μ,σ2),则P (μ-σ<X ≤μ+σ)≈0.682 7, P (μ-2σ<X ≤μ+2σ)≈0.954 5, P (μ-3σ<X ≤μ+3σ)≈0.997 3.解 (1)由题意得甲市数学高分段学生成绩的方差为s 2甲=(105-123)2×0.05+(115-123)2×0.4+(125-123)2×0.3+(135-123)2×0.2+(145-123)2×0.05=96,乙市数学高分段学生成绩的平均分为 x乙=105×0.15+115×0.25+125×0.4+135×0.15+145×0.05=122(分). 又x 甲=123,s 2乙=111,所以x 甲>x 乙,s 2甲<s 2乙.故甲市数学高分段学生成绩的平均分更高,且方差更小,故甲市数学高分段学生成绩更稳定. 综上可知甲市的2019届高三毕业学生数学高分段成绩更为突出.(2)①P (Z >142.6)=P (Z >μ+2σ)=12[1-P (μ-2σ<Z ≤μ+2σ)]≈12(1-0.954 5)=0.022 75.因为20 000×0.022 75=455,所以可估计甲市这次大联考的数学成绩Z 高于142.6分的学生有455人.②记所抽取的1 000人中数学成绩在区间(123,142.6]内的人数为Y , 因为P (123<Z ≤142.6)=P (μ<Z ≤μ+2σ)=P (μ-2σ<Z ≤μ+2σ)2≈0.477 25,所以Y ~B (1 000,0.477 25),故P (Y =k )=C k 1 000×0.477 25k ×0.522 751 000-k . 设P (Y =k )最大,则⎩⎪⎨⎪⎧ P (Y =k )≥P (Y =k +1),P (Y =k )≥P (Y =k -1)即⎩⎪⎨⎪⎧0.522 751 000-k ≥0.477 25k +1,0.477 25k≥0.522 751 001-k,解得476.727 25≤k ≤477.727 25.因为k ∈N *,所以使P (Y =k )取得最大值的整数k 的值为477.。

步步高中档题目强化练——概率与统计

步步高中档题目强化练——概率与统计
5 6 7 8 9 10
4 . 已 知 x∈[ - 1,1] , y∈[0,2] , 则 点 P(x , y) 落 在 区 域 2x-y+2≥0, x-2y+1≤0 内的概率为 x+y-2≤0 3 3 3 A. B. C. 16 8 4 ( B ) 3 D. 2
解析
不等式组表示的区域如图所示, 1 1 阴影部分的面积为2×3×2-2×3×1= 3 3 ,则所求概率为 . 2 8
2 的数学期望 Eξ=________. 3
解析 两封信投入 A,B,C 三个空邮箱,投法种数是 32=9, 4 A 中没有信的投法种数是 2×2=4,概率为9, 4 1 A 中仅有一封信的投法种数是 C2×2=4,概率为9, 1 A 中有两封信的投法种数是 1,概率为9, 4 4 1 2 故 A 邮箱的信件数 ξ 的数学期望是9×0+9×1+9×2=3.
解析
( D ) D.0.648
B.0.36
C.0.432
由题意知,甲获胜有两种情况,
一是甲以 2∶0 获胜,此时 P1=0.62=0.36; 二是甲以 2∶1 获胜, 此时 P2=C1 2×0.6×0.4×0.6=0.288, 故甲获胜的概率 P=P1+P2=0.648.
A组
1 2 3 4
专项基础训练
-1),(-2,0),(-2,1),(-2,2),(-2,3),(-1,-1), (-1,0),(-1,1),(-1,2),(-1,3),(0,-1),(0,0),(0,1), (0,2),(0,3),
A组
1 2 3 4
专项基础训练
5 6 7 8
<0.
9
10
9.已知集合
x+2 2 A={x|x +3x-4<0},B=x x-4

19版:高考专题突破六 高考中的概率与统计问题(步步高)

19版:高考专题突破六 高考中的概率与统计问题(步步高)

轿车数量(辆)
2
3 45 5 45
每辆利润(万元)
1
2
3 1.8 2.9
将频率视为概率,解答下列问题:
(1)从该厂生产的甲品牌轿车中随机抽取一辆,求其首次出现故障发生
在保修期内的概率;
解答
(2)若该厂生产的轿车均能售出,记生产一辆甲品牌轿车的利润为X1, 生产一辆乙品牌轿车的利润为X2,分别求X1,X2的分布列;
故小正方形的面积为 S1=( 3-1)2=4-2 3, 又大正方形的面积为 S=2×2=4,故飞镖落在小正方形内的概率 P=SS1= 4-2 3 2- 3
4 =2.
解析 答案
题型二 求离散型随机变量的期望与方差
例2 《最强大脑》是江苏卫视推出的国内首档大型科学类真人秀电视节 目.该节目集结了国内外最顶尖的脑力高手,堪称脑力界的奥林匹克.某 校为了增强学生的记忆力和辨识力也组织了一场类似《最强大脑》的 PK赛,A,B两队各由4名选手组成,每局两队各派一名选手PK,除第 三局胜者得2分外,其余各局胜者均得1分,每局的负者得0分.假设每局 比赛两队选手获胜的概率均为0.5,且各局比赛结果相互独立. (1)求比赛结束时A队的得分高于B队的得分的概率;
(3-2)2×15=25.
12345
解析 答案
4.已知高一年级某班有63名学生,现要选1名学生作为标兵,每名学 生被选中的概率是相同的,若“选出的标兵是女生”的概率是“选出 的标兵是男生”的概率的1110,则这个班男生的人数为__3_3__. 解析 根据题意,设该班的男生人数为 x,则女生人数为 63-x,因为每 名学生被选中的概率是相同的, 根据古典概型的概率计算公式知,“选 出的标兵是女生”的概率是636-3 x,“选出的标兵是男生”的概率是6x3, 故636-3 x=1110×6x3,解得 x=33,故这个班男生的人数为 33.

2022届新教材高考数学一轮复习专题突破六概率与统计综合问题课件

2022届新教材高考数学一轮复习专题突破六概率与统计综合问题课件
(1)求第四小组的频率,补全频率分布直 方图,并估计该校学生的数学成绩的中位数;
(2)从被抽取的数学成绩是70分以上(包括 70分)的学生中选两人,求他们在同一分数段 的概率;
(3)假设从全校参加高一年级期末考试的学 生中,任意抽取4个学生,设这四个学生中数 学成绩为80分以上(包括80分)的人数为X(以该 校学生数学成绩的频率估计概率),求X的分布 列和数学期望.
专题突破六 概率与统计综合问题
题型一 概率与频率分布直方图的综合 [例1] 2020年是中国改革开放42周年,为了充分认识新形势下改革开 放的时代性,某地的民调机构随机选取了该地的100名市民进行调查,将他 们的年龄分成6段:[20,30),[30,40),…,[70,80],并绘制了如图所示 的频率分布直方图.
年经验,该校初三年级学生经过一年的训练,正式测试时每人每分钟 跳绳个数都有明显进步,假设2020年正式测试时每人每分钟跳绳个数 比初三上学期开始时个数增加10,利用现所得正态分布模型:
(ⅰ)预估2020年全年级1 000名学生正式测试时每分钟跳193个以上 的人数(结果四舍五入到整数);
(ⅱ)若在该地区2020年所有初三毕业生中任意选取3人,记正式测 试时每分钟跳202个以上的人数为ξ,求随机变量ξ的分布列和期望.
研发费用x(百万元) 2 3 6 10 13 15 18 21
销量y(万盒)
1 1 2 2.5 3.5 3.5 4.5 6
观看《名著导读课》 超过5节
高二年级
90
高三年级
合计
不超过5节 45
合计 200
α 0.100 0.050 0.010 0.001 xα 2.706 3.841 6.635 10.828
5

21版:高考专题突破六 高考中的概率与统计问题(步步高)

21版:高考专题突破六 高考中的概率与统计问题(步步高)

高考专题突破六 高考中的概率与统计问题概率与统计的综合应用例1 (2020·汉中模拟)槟榔原产于马来西亚,在中国主要分布在云南、海南及台湾等热带地区.槟榔是重要的中药材,在南方一些少数民族还将果实作为一种咀嚼嗜好品,但其被世界卫生组织国际癌症研究机构列为致癌物清单Ⅰ类致癌物.云南某民族中学为了解A ,B 两个少数民族班的学生咀嚼槟榔的情况,分别从这两个班中随机抽取5名学生进行调查,将他们平均每周咀嚼槟榔的颗数作为样本,绘制成如图所示的茎叶图(图中的茎表示十位数字,叶表示个位数字).(1)你能否估计哪个班的学生平均每周咀嚼槟榔的颗数较多?(2)在被抽取的10名学生中,从平均每周咀嚼槟榔的颗数不低于20颗的学生中随机抽取3名学生,求抽取B 班学生人数X 的分布列和均值.解 (1)A 班样本数据的平均值为15(9+11+14+20+31)=17,由此估计A 班学生平均每周咀嚼槟榔的颗数为17,B 班样本数据的平均值为15(11+12+21+25+26)=19,由此估计B 班学生平均每周咀嚼槟榔的颗数为19, 故估计B 班学生平均每周咀嚼槟榔的颗数较多. (2)∵平均每周咀嚼槟榔的颗数不低于20颗的学生中, A 班有2人,B 班有3人,共有5人, ∴X 的可能取值为1,2,3,P (X =1)=C 13C 22C 35=310,P (X =2)=C 23C 12C 35=35,P (X =3)=C 33C 02C 35=110,∴X 的分布列为X 1 2 3 P31035110∴E (X )=1×310+2×35+3×110=95.思维升华概率与统计作为考查学生应用意识的重要载体,已成为近几年高考一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.跟踪训练1(2020·西安八校联考)从某企业生产的某种产品中抽取100件,测量这些产品的质量指标值,由测量结果得到如图所示的频率分布直方图,质量指标值落在区间[55,65),[65,75),[75,85]内的频率之比为4∶2∶1.(1)求这些产品的质量指标值落在区间[75,85]内的频率;(2)若将频率视为概率,从该企业生产的这种产品中随机抽取3件,记这3件产品中质量指标值位于[45,75)内的产品件数为X,求X的分布列与均值.解(1)设落在区间[75,85]内的频率为x,则落在区间[55,65),[65,75)内的频率分别为4x和2x,依题意得(0.004+0.012+0.019+0.030)×10+4x+2x+x=1,解得x=0.05.所以落在区间[75,85]内的频率为0.05.(2)从该企业生产的该种产品中随机抽取3件,相当于进行了3次独立重复试验,所以X服从二项分布B(n,p),其中n=3.由(1)得,落在区间[45,75)内的频率为0.3+0.2+0.1=0.6,将频率视为概率得p=0.6.因为X的所有可能取值为0,1,2,3,则P(X=0)=C03×0.60×0.43=0.064,P(X=1)=C13×0.61×0.42=0.288,P(X=2)=C23×0.62×0.41=0.432,P(X=3)=C33×0.63×0.40=0.216,所以X的分布列为X 012 3P 0.0640.2880.4320.216所以X的均值为E(X)=0×0.064+1×0.288+2×0.432+3×0.216=1.8.(或直接根据二项分布的均值公式得到E(X)=np=3×0.6=1.8)概率与统计案例的综合应用例2(2020·华中师大附中模拟)中国大学先修课程,是在高中开设的具有大学水平的课程,旨在让学有余力的高中生早接受大学思维方式、学习方法的训练,为大学学习乃至未来的职业生涯做好准备.某高中开设大学先修课程已有两年,两年共招收学生2 000人,其中有300人参与学习先修课程,两年全校共有优等生200人,学习先修课程的优等生有60人.这两年学习先修课程的学生都参加了考试,并且都参加了某高校的自主招生考试(满分100分),结果如表所示:分数a 95≤a≤10085≤a<9575≤a<8560≤a<75a<60人数20551057050 自招通过率0.90.80.60.50.4(1)填写列联表,并画出列联表的等高条形图,并通过图形判断学习先修课程与优等生是否有关系,根据列联表的独立性检验,能否在犯错误的概率不超过0.01的前提下认为学习先修课程与优等生有关系?优等生非优等生总计学习大学先修课程没有学习大学先修课程总计(2)已知今年有150名学生报名学习大学先修课程,以前两年参加大学先修课程学习成绩的频率作为今年参加大学先修课程学习成绩的概率.①在今年参加大学先修课程的学生中任取一人,求他获得某高校自主招生通过的概率;②设今年全校参加大学先修课程的学生通过某高校自主招生考试人数为ξ,求E(ξ).参考数据:P(K2≥k0)0.150.100.050.0250.0100.005k0 2.072 2.706 3.841 5.024 6.6357.879参考公式:K 2=n (ad -bc )2(a +b )(c +b )(a +c )(b +d ),其中n =a +b +c +d解 (1)列联表如下:优等生 非优等生 总计 学习大学先修课程 60 240 300 没有学习大学先修课程140 1 560 1 700 总计2001 8002 000等高条形图如图:通过图形可判断学习先修课程与优等生有关系, 又K 2=2 000(60×1 560-140×240)2300×1 700×200×1 800≈39.216>6.635,因此在犯错误的概率不超过0.01的前提下认为学习先修课程与优等生有关系. (2)①P =20300×0.9+55300×0.8+105300×0.6+70300×0.5+50300×0.4=0.6.②设通过某高校自主招生考试的人数为ξ, 则ξ~B ⎝⎛⎭⎫150,35, P (x =k )=C k 150⎝⎛⎭⎫35k ⎝⎛⎭⎫25150-k ,k =0,1,2,…,150, 所以E (ξ)=150×35=90.思维升华 概率与统计案例的综合应用常涉及相互独立事件同时发生的概率、独立重复实验、超几何分布、二项分布、独立性检验、线性回归等知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识.跟踪训练2 (2019·洛阳模拟)某商场营销人员进行某商品M 市场营销调查发现,每回馈消费者一定的点数,该商品每天的销量就会发生一定的变化,经过试点统计得到下表:返还点数t 1 2 3 4 5 销量(百件)/天0.50.611.41.7(1)经分析发现,可用线性回归模型拟合当地该商品销量y (百件)与返还点数t 之间的相关关系,请用最小二乘法求y 关于t 的线性回归方程y ^=b ^t +a ^,并预测若返还6个点时该商品每天的销量;(2)若节日期间营销部对商品进行新一轮调整.已知某地拟购买该商品的消费群体十分庞大,经营销调研机构对其中的200名消费者的返点数额的心理预期值进行了一个抽样调查,得到如下一份频数表:①求这200位拟购买该商品的消费者对返还点数的心理预期值X 的样本平均数及中位数的估计值(同一区间的预期值可用该区间的中点值代替;估计值精确到0.1);②将对返还点数的心理预期值在[1,3)和[11,13]的消费者分别定义为“欲望紧缩型”消费者和“欲望膨胀型”消费者,现采用分层抽样的方法从位于这两个区间的30名消费者中随机抽取6名,再从这6人中随机抽取3名进行跟踪调查,设抽出的3人中“欲望膨胀型”消费者的人数为随机变量X ,求X 的分布列及均值.参考公式及数据:b ^=∑i =1nt i y i -n t y∑i =1nt 2i -nt2,a ^=y -b ^t ;∑i =15t i y i =18.8. 解 (1)由题意知t =1+2+3+4+55=3,y =0.5+0.6+1+1.4+1.75=1.04,∑i =15t 2i =12+22+32+42+52=55, b ^=∑i =15t i y i -5t y∑i =15t 2i -5t2=18.8-5×3×1.0455-5×32=0.32,a ^=y -b ^t =1.04-0.32×3=0.08, 则y 关于t 的线性回归方程为y ^=0.32t +0.08,当t =6时,y ^=2.00,即返还6个点时该商品每天销量约为200件.(2)①根据题意,这200位拟购买该商品的消费者对返还点数的心理预期值X 的样本平均数x 为x =2×0.1+4×0.3+6×0.3+8×0.15+10×0.1+12×0.05=6, 中位数的估计值为5+2×100-20-6060=5+23≈5.7.②抽取的6名消费者中“欲望紧缩型”消费者人数为6×2030=4,“欲望膨胀型”消费者人数为6×1030=2.故X 的所有可能取值为0,1,2.P (X =2)=C 14C 22C 36=15,P (X =1)=C 24C 12C 36=35,P (X =0)=C 34C 02C 36=15,故随机变量X 的分布列为X 0 1 2 P153515E (X )=2×15+1×35+0×15=1.均值与方差在决策中的应用例3 (2018·全国Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品做检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件做检验,再根据检验结果决定是否对余下的所有新产品做检验.设每件产品为不合格品的概率都为p (0<p <1),且各件产品为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为f (p ),求f (p )的最大值点p 0;(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p 0作为p 的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.①若不对该箱余下的产品做出检验,这一箱产品的检验费用与赔偿费用的和记为X ,求E (X ); ②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品做检验? 解 (1)20件产品中恰有2件不合格品的概率为 f (p )=C 220·p 2(1-p )18. 因此f ′(p )=C 220[2p (1-p )18-18p 2(1-p )17]=2C 220p (1-p )17(1-10p ).令f ′(p )=0,得p =0.1.当p ∈(0,0.1)时,f ′(p )>0;当p ∈(0.1,1)时,f ′(p )<0. 所以f (p )的最大值点为p 0=0.1. (2)由(1)知,p =0.1①令Y 表示余下的180件产品中的不合格品件数, 依题意知Y ~B (180,0.1), X =20×2+25Y ,即X =40+25Y .所以E (X )=E (40+25Y )=40+25E (Y )=490.②如果对余下的产品做检验,则这一箱产品所需要的检验费为400元. 由于E (X )=490>400,故应该对余下的产品做检验.思维升华 随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量偏离均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要依据,一般先比较均值,若均值相同,再由方差来决定.跟踪训练3 (2020·100所名校最新冲刺卷)某中学是走读中学,为了让学生更有效率的利用下午放学后的时间,学校在本学期第一次月考后设立了多间自习室,以便让学生在自习室自主学习、完成作业,同时每天派老师轮流值班.在本学期第二次月考后,高一某班数学老师统计了两次考试该班数学成绩优良人数和非优良人数,得到如下2×2列联表:(1)能否在犯错的概率不超过0.005的前提下认为设立自习室对提高学生成绩有效? (2)设从该班第一次月考的所有数学成绩中任取两个,取到成绩优良数为X ;从该班第二次月考的所有数学成绩中任取两个,取到成绩优良数为Y ,求X 与Y 的均值并比较大小,请解释所得结论的实际含义. 下面的临界值表供参考:(参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d )解(1)K 2=80(25×30-15×10)240×40×35×45≈11.43>7.879,所以能在犯错的概率不超过0.005的前提下认为设立自习室对提高学生成绩有效. (2)X 的所有可能取值为0,1,2,则P (X =0)=C 225C 240=513,P (X =1)=C 125C 115C 240=2552,P (X =2)=C 215C 240=752,X 0 1 2 P5132552752所以E (X )=0×513+1×2552+2×752=34.Y 的所有可能取值为0,1,2,则P (Y =0)=C 210C 240=352,P (Y =1)=C 110C 130C 240=513,P (Y =2)=C 230C 240=2952,Y 0 1 2 P3525132952所以E (Y )=0×352+1×513+2×2952=32,即E (X )<E (Y ),其实际含义是设立自习室后学生的数学成绩提高,说明设立自习室对提高学生成绩有效.例 (12分)(2019·北京)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:支付金额(元)支付方式(0,1 000] (1 000,2 000]大于2 000 仅使用A 18人 9人 3人 仅使用B10人14人1人(1)从全校学生中随机抽取1人,估计该学生上个月A ,B 两种支付方式都使用的概率;(2)从样本仅使用A 和仅使用B 的学生中各随机抽取1人,以X 表示这2人中上个月支付金额大于1 000元的人数,求X 的分布列和均值;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A 的学生中,随机抽查3人,发现他们本月的支付金额都大于2 000元.根据抽查结果,能否认为样本仅使用A 的学生中本月支付金额大于2 000元的人数有变化?说明理由. 规范解答解 (1)由题意知,样本中仅使用A 的学生有18+9+3=30(人),仅使用B 的学生有10+14+1=25(人),A ,B 两种支付方式都不使用的学生有5人,故样本中A ,B 两种支付方式都使用的学生有100-30-25-5=40(人).[1分]所以从全校学生中随机抽取1人,该学生上个月A ,B 两种支付方式都使用的概率为40100=0.4.[2分](2)X 的所有可能值为0,1,2.[3分]记事件C 为“从样本仅使用A 的学生中随机抽取1人,该学生上个月的支付金额大于1 000元”,事件D 为“从样本仅使用B 的学生中随机抽取1人,该学生上个月的支付金额大于1 000元”.由题设知,事件C ,D 相互独立,且P (C )=9+330=0.4,P (D )=14+125=0.6,[4分]所以P (X =2)=P (CD )=P (C )P (D )=0.24.[5分] P (X =1)=P (C D ∪C D ) =P (C )P (D )+P (C )P (D ) =0.4×(1-0.6)+(1-0.4)×0.6 =0.52,[6分]P (X =0)=P (C D )=P (C )P (D )=0.24.[7分] 所以X 的分布列为[8分]故X 的均值E (X )=0×0.24+1×0.52+2×0.24=1.0.[9分](3)记事件E 为“从样本仅使用A 的学生中随机抽查3人,他们本月的支付金额大于2 000元”.假设样本仅使用A 的学生中,本月支付金额大于2 000元的人数没有变化,则由上个月的样本数据得P(E)=1C330=14 060.[11分]答案示例1:可以认为有变化.理由如下:P(E)比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2 000元的人数发生了变化,所以可以认为有变化.[12分]答案示例2:无法确定有没有变化,理由如下:事件E是随机事件,P(E)比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.[12分]第一步:审清题意,理清条件和结论,找到关键数量关系.第二步:找数量关系,把图表语言转化为数字,将图表中的数字转化为公式中的字母.第三步:建立解决方案,找准公式,根据图表数据代入公式计算数值.第四步:作出判断得结论,依据题意,借助数表作出正确判断.第五步:反思回顾,查看关键点、易错点和答题规范性.。

【步步高】高考数学 考前3个月(上)专题复习 专题六 第一讲 统计、统计案例配套限时规范训练

【步步高】高考数学 考前3个月(上)专题复习 专题六 第一讲 统计、统计案例配套限时规范训练

第三讲 统计、统计案例(推荐时间:50分钟)一、选择题1.在某超市的四类包装食品中,抽取一个容量为20的样本进行检测,已知四类包装食品中果脯类、火腿类、饼干类、蛋糕类分别有40种、10种、30种、20种,若采用分层抽样的方法抽取,则抽取果脯类、饼干类食品的种数之和为( )A .6B .9C .12D .142.(2012·安徽“江南十校”联考)已知一组正数x 1,x 2,x 3,x 4的方差为s 2=14(x 21+x 22+x 23+x 24-16),则数据x 1+2,x 2+2,x 3+2,x 4+2的平均数为( ) A .2B .3C .4D .63.从容量为102的总体中用系统抽样法随机抽取一个容量为9的样本,下列说法正确的是( )A .将总体分成11组,每组间隔为9B .将总体分成9组,每组间隔为11C .从总体中剔除2个个体后分成10组,每组间隔为10D .从总体中剔除3个个体后分成9组,每组间隔为114.某商品销售量y (件)与销售价格x (元/件)负相关,则其线性回归方程可能是( )A.y ^ =-10x +200B.y ^=10x +200C.y ^=-10x -200D.y ^=10x -2005.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A .甲地:总体均值为3,中位数为4B .乙地:总体均值为1,总体方差大于0C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为36.学校为了调查学生在课外读物方面的支出情况 ,抽取了一个容量为n 的样本,其频率分布直方图如图所示,其中支出在[50,60)的同学有30人,若想在这n 个人中抽取50个人,则在[50,60)之间应抽取的人数为( )A.10 B.15 C.25 D.30 7.(2012·陕西)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x甲、x乙,中位数分别为m甲、m乙,则( )A.x甲<x乙,m甲>m乙B.x甲<x乙,m甲<m乙C.x甲>x乙,m甲>m乙D.x甲>x乙,m甲<m乙二、填空题8.(2012·江苏)某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取______名学生.9.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.10.(2012·天津)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.11.一个总体中有100个个体,随机编号0,1,2,…,99.依编号顺序平均分成10个小组,组号依次为1,2,3,…,10,现用系统抽样方法抽取一个容量为10的样本,规定如果在第一组随机抽取的号码为t,则在第k组中抽取的号码个位数字与t+k的个位数字相同,若t=7,则在第8组中抽取的号码应是________.12.2012年,各大品牌汽车继续在中国的汽车市场上相互博弈,汽车的配置与销售价格以及维修费用等成为人们购买汽车时需要考虑的因素,某汽车制造商为了进一步拓宽市场,统计了某种品牌的汽车的使用年限x 和所支出的维修费用y (万元),得到的统计资料如下表所示:若由资料,可知y 对x 呈线性相关关系,且线性回归方程为y ^=a ^+b ^x ,其中已知b ^=1.23,根据国家政策规定,轿车报废的年限最长为15年,若该品牌汽车在使用10.三、解答题13.为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:kg),并将所得数据分组,画出频率分布直方图(如图所示).(1)(2)估计数据落在[)1.15,1.30中的概率为多少;(3)将上面捕捞的100条鱼分别作一记号后再放回水库.几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条.请根据这一情况来估计该水库中鱼的总条数.14.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得到的线性回归方程是否可靠?答案1.D 2.C 3.D 4.A 5.D 6.B 7.B 8.15 9.37 20 10.18 9 11.75 12.12.3813.解 (1)/组距),故可得下表:(2)因为0.30+0.15+0.02=0.47,所以数据落在[1.15,1.30)中的概率约为0.47. (3)120×1006=2 000,所以水库中鱼的总条数约为2 000.14.解 (1)设事件A 表示“选取的2组数据恰好是不相邻2天的数据”,则A 表示“选取的数据恰好是相邻2天的数据”.基本事件总数为10,事件A 包含的基本事件数为4.∴P (A )=410=25,∴P (A )=1-P (A )=35.(2)x =12,y =27,∑i =13x i y i =977,∑i =13x 2i =434,∴b ^=∑i =13x i y i -3x y∑i =13x 2i -3x 2=977-3×12×27434-3×122=2.5, a ^=y -b ^x =27-2.5×12=-3,∴y ^=2.5x -3.(3)由(2)知:当x =10时,y ^=22,误差不超过2颗;当x =8时,y ^=17,误差不超过2颗. 故所求得的线性回归方程是可靠的.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高考专题突破六 高考中的概率与统计问题题型一 随机事件的概率例1 某社区举办“环保我参与”有奖问答比赛活动,某场比赛中,甲、乙、丙三个家庭同时回答一道有关环保知识的问题.已知甲家庭回答正确这道题的概率是34,甲、丙两个家庭都回答错误的概率是112,乙、丙两个家庭都回答正确的概率是14.若各家庭回答是否正确互不影响.(1)求乙、丙两个家庭各自回答正确这道题的概率;(2)求甲、乙、丙三个家庭中不少于2个家庭回答正确这道题的概率.解 (1)记“甲家庭回答正确这道题”“乙家庭回答正确这道题”“丙家庭回答正确这道题”分别为事件A ,B ,C ,则P (A )=34,且有⎩⎨⎧P (A )·P (C )=112,P (B )·P (C )=14,即⎩⎨⎧[1-P (A )]·[1-P (C )]=112,P (B )·P (C )=14,所以P (B )=38,P (C )=23.(2)有0个家庭回答正确的概率为 P 0=P (A B C )=P (A )·P (B )·P (C ) =14×58×13=596, 有1个家庭回答正确的概率为 P 1=P (A B C +A B C +A B C ) =P (A B C )+P (A B C )+P (A B C )=P (A )·P (B )·P (C )+P (A )·P (B )·P (C )+P (A )·P (B )·P (C ) =34×58×13+14×38×13+14×58×23=724,所以不少于2个家庭回答正确这道题的概率为P=1-P0-P1=1-596-724=2132.思维升华随机事件的概率求解策略(1)对复杂的随机事件表示成互斥事件的和,独立事件的积;(2)利用概率的性质进行计算.跟踪训练1(1)(2020·上海市七宝中学模拟)通过手机验证码登录哈啰单车App,验证码由四位数字随机组成,如某人收到的验证码(a1,a2,a3,a4)满足a1<a2<a3<a4,则称该验证码为递增型验证码,某人收到一个验证码,那么是首位为2的递增型验证码的概率为________.答案1 6解析∵a1=2,2<a2<a3<a4,∴a2,a3,a4从3~9中选,只要选出3个数,让其按照从小到大的顺序排列,分别对应a2,a3,a4即可,∴P=C37C410=1 6.(2)(2020·福建省安溪一中、养正中学、惠安一中联考)世卫组织就新型冠状病毒感染的肺炎疫情称,新型病毒可能造成“持续人传人”.通俗点说就是存在A传B,B又传C,C又传D,这就是“持续人传人”.那么A,B,C就会被称为第一代、第二代、第三代传播者.假设一个身体健康的人被第一代、第二代、第三代传播者感染的概率分别为0.9,0.8,0.7,健康的小明参加了一次多人宴会,事后知道,参加宴会的人有5名第一代传播者,3名第二代传播者,2名第三代传播者,试计算,小明参加聚会,仅和感染的10个人其中一个接触,感染的概率为________.答案0.83解析设事件A,B,C为第一代、第二代、第三代传播者接触,事件D为小明被感染,由已知得:P(A)=0.5,P(B)=0.3,P(C)=0.2,P(D|A)=0.9,P(D|B)=0.8,P(D|C)=0.7,P(D)=P(D|A)P(A)+P(D|B)P(B)+P(D|C)P(C)=0.9×0.5+0.8×0.3+0.7×0.2=0.83.所以小明参加聚会,仅和感染的10个人其中一个接触,感染的概率为0.83.题型二 离散型随机变量及其分布列例2 (12分)(2019·北京)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:支付金额(元)支付方式(0,1 000] (1 000,2 000]大于2 000 仅使用A 18人 9人 3人 仅使用B10人14人1人(1)从全校学生中随机抽取1人,估计该学生上个月A ,B 两种支付方式都使用的概率; (2)从样本仅使用A 和仅使用B 的学生中各随机抽取1人,以X 表示这2人中上个月支付金额大于1 000元的人数,求X 的分布列和均值;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A 的学生中,随机抽查3人,发现他们本月的支付金额都大于2 000元.根据抽查结果,能否认为样本仅使用A 的学生中本月支付金额大于2 000元的人数有变化?说明理由. 规范解答解 (1)由题意知,样本中仅使用A 的学生有18+9+3=30(人),仅使用B 的学生有10+14+1=25(人),A ,B 两种支付方式都不使用的学生有5人,故样本中A ,B 两种支付方式都使用的学生有100-30-25-5=40(人).[1分]所以从全校学生中随机抽取1人,该学生上个月A ,B 两种支付方式都使用的概率为40100=0.4.[2分](2)X 的所有可能值为0,1,2.[3分]记事件C 为“从样本仅使用A 的学生中随机抽取1人,该学生上个月的支付金额大于1 000元”,事件D 为“从样本仅使用B 的学生中随机抽取1人,该学生上个月的支付金额大于 1 000元”.由题设知,事件C ,D 相互独立,且P (C )=9+330=0.4,P (D )=14+125=0.6,[4分]所以P (X =2)=P (CD )=P (C )P (D )=0.24.[5分] P (X =1)=P (C D +C D )=P (C )P (D )+P (C )P (D ) =0.4×(1-0.6)+(1-0.4)×0.6 =0.52,[6分]P (X =0)=P (C D )=P (C )P (D )=0.24.[7分] 所以X 的分布列为X 0 1 2 P0.240.520.24[8分]故X 的均值E (X )=0×0.24+1×0.52+2×0.24=1.0.[9分](3)记事件E 为“从样本仅使用A 的学生中随机抽查3人,他们本月的支付金额大于2 000元”.假设样本仅使用A 的学生中,本月支付金额大于2 000元的人数没有变化,则由上个月的样本数据得P (E )=1C 330=14 060.[11分]答案示例1:可以认为有变化.理由如下:P (E )比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2 000元的人数发生了变化,所以可以认为有变化. 答案示例2:无法确定有没有变化,理由如下:事件E 是随机事件,P (E )比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.[12分]第一步:审清题意,理清条件和结论,找到关键数量关系.第二步:找数量关系,把图表语言转化为数字,将图表中的数字转化为公式中的字母. 第三步:建立解决方案,找准公式,根据图表数据代入公式计算数值. 第四步:作出判断得结论,依据题意,借助数表作出正确判断. 第五步:反思回顾,查看关键点、易错点和答题规范性.跟踪训练2 某项大型赛事需要从高校选拔青年志愿者,某大学学生实践中心积极参与,在8名学生会干部(其中男生5名,女生3名)中选3名参加志愿者服务活动.若所选3名学生中的女生人数为X ,求X 的分布列及均值.解 因为8名学生会干部中有5名男生,3名女生,所以X 服从参数N =8,M =3,n =3的超几何分布.X 的所有可能取值为0,1,2,3,其中P (X =i )=C i 3C 3-i5C 38(i =0,1,2,3).由公式可得P (X =0)=C 03C 35C 38=528,P (X =1)=C 13C 25C 38=1528,P (X =2)=C 23C 15C 38=1556,P (X =3)=C 33C 05C 38=156.所以X 的分布列为X 0 1 2 3 P52815281556156所以X 的均值为E (X )=0×528+1×1528+2×1556+3×156=6356=98.题型三 用样本估计总体例3 (2021·石家庄模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x 人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.(1)求x ;(2)求抽取的x 人的年龄的中位数(结果保留整数);(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加“一带一路”知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90. ①分别求5个年龄组和5个职业组成绩的平均数和方差;②以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.解 (1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴6x =0.05,∴x =120.(2)设中位数为a ,则0.01×5+0.07×5+(a -30)×0.06=0.5, ∴a =953≈32,则中位数为32.(3)①5个年龄组成绩的平均数为x 1=15×(93+96+97+94+90)=94,方差为s 21=15×[(-1)2+22+32+02+(-4)2]=6.5个职业组成绩的平均数为x 2=15×(93+98+94+95+90)=94,方差为s 22=15×[(-1)2+42+02+12+(-4)2]=6.8.②从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可). 思维升华 用样本估计总体的类型 (1)总体取值规律、总体百分位数; (2)总体的集中趋势,总体的离散程度.跟踪训练3 (2021·佛山模拟)寒假期间,很多同学都喜欢参加“迎春花市摆档口”的社会实践活动,下表是今年某个档口某种精品的销售数据.已知摊位租金900元/档,售余精品可以进货价退回厂家. (1)求表中10个销售数据的中位数和平均数;(2)明年花市期间甲、乙两位同学想合租一个摊位销售同样的精品,其中甲、乙分别承包白天、晚上的精品销售,承包时间段内销售所获利润归承包者所有.如果其他条件不变,以今年的数据为依据,甲、乙两位同学应如何分担租金才较为合理? 解 (1)中位数为43+462=44.5,平均数为35+46+32+42+43+50+39+52+51+6010=45.(2)由题意知,今年花市期间该摊位所售精品的销售量与时间段有关,明年合租摊位的租金较为合理的分摊方法是根据今年的平均销售量按比例分担. 今年白天的平均销售量为35+32+43+39+515=40(件/天),今年晚上的平均销售量为46+42+50+52+605=50(件/天),所以甲同学应分担的租金为900×4040+50=400(元), 乙同学应分担的租金为900×5040+50=500(元). (注:本小题也可直接按白天、晚上的总销售量比例分摊租金.)题型四 统计模型例4 (1)(2020·蚌埠质检)用模型y =c e kx 拟合一组数据时,为了求出经验回归方程,设z =ln y ,其变换后得到线性经验回归方程为z ^=0.3x +2,则c 等于( ) A .e 2 B .e 4 C .2 D .4 答案 A解析 z =ln y =ln(c e kx )=ln c +ln e kx =kx +ln c =0.3x +2, ∴ln c =2 即c =e 2.(2)(2020·新高考全国Ⅰ,改编)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM 2.5和SO 2浓度(单位:μg/m 3),得下表:SO 2PM 2.5[0,50] (50,150] (150,475][0,35] 32 18 4 (35,75] 6 8 12 (75,115]3710①估计事件“该市一天空气中PM 2.5浓度不超过75,且SO 2浓度不超过150”的概率; ②根据所给数据,完成下面的2×2列联表:SO 2PM 2.5[0,150] (150,475][0,75] (75,115]③根据②中的列联表,判断在犯错误的概率不超过1%的前提下,能否认为该市一天空气中PM 2.5浓度与SO 2浓度有关? 附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),α=P (χ2≥k )0.0500.0100.001k 3.841 6.63510.828解①由表格可知,该市100天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+6+18+8=64,所以该市一天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为64100=0.64.②由所给数据,可得2×2列联表:SO2PM2.5[0,150](150,475][0,75]6416(75,115]1010③根据2×2列联表中的数据可得χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100×(64×10-16×10)2 80×20×74×26≈7.484>6.635,故在犯错误的概率不超过1%的前提下,可以认为该市一天空气中PM2.5浓度与SO2浓度有关.思维升华成对数据的统计分析包括:(1)成对数据的相关性,主要是建立一元线性回归模型;(2)独立性检验:通过计算随机变量χ2的值,推断两个分类变量是否有关系.跟踪训练4(2020·济宁模拟)下面给出了根据我国2012年~2018年水果人均占有量y (单位:kg)和年份代码x绘制的散点图和线性经验回归方程的残差图(2012年~2018年的年份代码x 分别为1~7).(1)根据散点图分析y与x之间的相关关系;(2)根据散点图相应数据计算得∑i =17y i =1 074,∑i =17x i y i =4 517,求y 关于x 的回归直线方程;(3)根据线性回归方程的残差图,分析回归直线方程的拟合效果.(只写出结论) 附:回归直线方程y ^=a ^+b ^x 中斜率和截距的最小二乘估计公式分别为b ^=∑i =1n (x i -x )(y i -y )∑i =1n(x i -x)2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .解 (1)由散点图可以看出,点大致分布在某一直线的附近,且当x 由小变大时,y 也由小变大,从而y 与x 之间是正相关关系.(2)由题中数据可得x =17(1+2+3+4+5+6+7)=4,y =17×1 074=1 0747,从而b ^=∑i =17x i y i -7x ·y∑i =17x 2i -7x2= 4 517-7×17×1 074×412+22+32+42+52+62+72-7×42=22128, a ^=y -b ^x =1 0747-22128×4=8537, 从而所求y 关于x 的回归直线方程为y ^=22128x +8537.(3)由残差图可以看出,残差对应的点均匀地落在水平带状区域内,且宽度较窄,说明拟合效果较好.。

相关文档
最新文档