(完整)2020年高考文科数学《概率与统计》题型归纳与训练,推荐文档
2020年高考文数二轮专题复习:题型2第5讲概率与统计含解析

第5讲概率与统计[考情分析]概率与统计通过统计图、古典概型、几何概型、线性相关与线性回归方程等知识考查数据处理能力•题目设置比较注重数学与生活的结合,属于中档题,难度适中.热点题型分析热点1统计图方法结论V1•一表二图(1) 频率分布表——数据详实;(2) 频率分布直方图--- 分布直观;(3) 频率分布折线图一一便于观察总体分布趋势.2 •茎叶图(1) 茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众数等;(2) 个位数为叶,十位数(或百位与十位)为茎,相同的数据重复写.3•条形图条形图是用条形的长度表示各类别频数(或频率)的多少,其宽度(表示类别)则是固定的.【题型分析】某城市100户居民的月平均用电量(单位:度),以[160,180), [180,200), [200,220), [220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.频率J纽更(1) 求直方图中x的值;⑵求月平均用电量的众数和中位数.解(1)由(0.002+ 0.0095+ 0.011+ 0.0125+ x+ 0.005+ 0.0025)X 20= 1 得x= 0.0075,•••直方图中x的值为0.0075.••• (0.002 + 0.0095+ 0.011)x 20= 0.45<0.5,•••月平均用电量的中位数在[220,240)内,设中位数为a ,则(0.002 + 0.0095+ 0.011)X 20+ 0.0125X (a - 220)= 0.5, 解得a = 224,即中位数为224.【通法指导】1.频率分布直方图中需要注意的几点 率;条形图的纵坐标为频数或频率;⑵各组频率之和为1,即所有小矩形的面积和为1; ⑶直方图中各小矩形的高度比=各组频率比=各组频数比. 2.与频率分布直方图相关问题的解题模板 第一步:根据频率分布直方图计算出相应的频率; 第二步:运用样本频率估计总体的频率; 第三步:得出结论.3•解决与茎叶图相关问题时,一要弄清茎叶图中茎与叶的含义,不要混淆; 二要注意看清所有的样本数据,弄清图中的数字特点,不要漏掉数据.[针对训练】随着新课程改革和高考综合改革的实施,高中教学以发展学生学科核心素养 为导向,学习评价更关注学科核心素养的形成和发展.为此,某市于2018年举行第一届高中数学学科素养竞赛,竞赛结束后,为了评估该市高中学生的数学学科 素养,从所有参赛学生中随机抽取 1000名学生的成绩(单位:分)作为样本进行估 计,将抽取的成绩整理后分成五组,依次记为 [50,60), [60,70), [70,80), [80,90), [90,100],并绘制成如图所示的频率分布直方图.(1) 请补全频率分布直方图,并估计这(2)月平均用电量的众数是 220+2402 =230. (1)直方图与条形图不同,直方图中的纵坐标是 频率组距,每个小矩形的面积为频0.04111000名学生成绩的平均数(同一组数据用该组区间的中点值作代表);(2) 该市决定对本次竞赛成绩排在前180名的学生给予表彰,授予“数学学科素养优秀标兵”称号,一名学生本次竞赛成绩为 79分,请你判断该学生能否被授 予“数学学科素养优秀标兵”称号.解 ⑴成绩在[60,70)的频率为1 — (0.30+ 0.15+ 0.10+ 0.05)= 0.40,补全的频率分布直方图如图:样本的平均数 —=55X 0.30 +65X 0.40+ 75 X 0.15+ 85X 0.10+ 95X 0.05 = 67. 所以由频率分布直方图可以估计获得 “数学学科素养优秀标兵”称号学生的因为79>78,所以该同学能被授予“数学学科素养优秀标”称号.热点2概率统计方法结论V1 •古典概型_事件A 所包含的基本事件数 P (A )= 基本事件总数 2 •几何概型构成事件A 的区域长度(面积或体积) P(A)=试验的全部结果所构成的区域长度 面积或体积*3 •当事件A 与B 互斥时,满足加法公式:P(A U B)= P(A) + P(B).4 •若事件A 与B 为对立事件,则P(A)= 1 — P(B),即PCA) = 1 — P(A).【题型分析】(2019四川省成都模拟)某学校为担任班主任的教师办理手机语音月卡套餐, 为了解通话时长,采用随机抽样的方法,得到该校100位班主任每人的月平均通话时长T(单位:分钟)的数据,其频率分布直方图如图所示,将频率视为概率.(2)因为 1801000=0.18, 最低成绩为80— 0.18— 0.05—0.100.015 oo4n ........ 「0.030 [).020 0.01()0.005(1) 求图中m 的值;(2) 估计该校担任班主任的教师月平均通话时长的中位数;(3) 在[450,500), [500,550]这两组中采用分层抽样的方法抽取 6人,再从这 6 人中随机抽取2人,求抽取的2人恰在同一组的概率.解(1)依题意,根据频率分布直方图的性质,可得:50X (m + 0.0040+ 0.0050+ 0.0066+ 0.0016+ 0.0008)= 1,解得 m = 0.0020. (2)设该校担任班主任的教师月平均通话时长的中位数为t.因为前2组的频率之和为(0.0020+ 0.0040)X 50 = 0.3<0.5, 前 3 组的频率之和为(0.0020+ 0.0040+ 0.0050) X 50= 0.55>0.5, 所以 350<t<400,由 0.3+ 0.0050X (t - 350)= 0.5,得 t = 390. 所以该校担任班主任的教师月平均通话时长的中位数为 390.(3)由题意,可得在[450,500)内抽取 小 0.0016 , t 八口「…斗 , 6X = 4人,分别记为a , b ,0.0016+ 0.0008 为 e , f ,则6人中抽取2人的取法有:{a , b}, {a , {b , c} , {b , d}, {b , e}, {b , f}, {c , d} , {c , f},共15种等可能的取法.其中抽取的2人恰在同一组的有{a , b}, {a , c}, {a , d} , {b , c}, {b , d}, {c , d} , {e , f},共7种取法,所以从这6人中随机抽取的2人恰在同一组的概率 7 P=— P15.【通法指导】求解概率与统计综合题的两点注意:(1) 明确频率与概率的关系,频率可近似替代概率;(2) 此类问题中的概率模型多是古典概型, 在求解时,要明确基本事件的构成, 并c ,d ,在[500,550]内抽取2人,记c , },{a ,d},{a ,e},{a ,f}, e},{c ,f},{d ,e},{d ,f},{e .判断所述试验的所有基本事件是否为等可能的.【针对训练】(2019西南名校联盟联考)某种产品的质量按照其质量指标值M进行等级划分,具体如下表:质量指标值M M<8080 < M<110M > 110等级三等品二等品一等品现从某企业生产的这种产品中随机抽取了100件作为样本,对其质量指标值M进行统计分析,得到如图所示的频率分布直方图.(1) 记A表示事件“一件这种产品为二等品或一等品”,试估计事件A的概率;(2) 已知该企业的这种产品每件一等品、二等品、三等品的利润分别为10元、6元、2元,试估计该企业销售10000件该产品的利润;(3) 根据该产品质量指标值M的频率分布直方图,求质量指标值M的中位数的估计值(精确到0.01).解(1)记B表示事件“一件这种产品为二等品”,C表示事件“一件这种产品为一等品”,则事件B,C互斥,且由频率分布直方图估计P(B) = 0.2+ 0.3+ 0.15= 0.65, P(C) = 0.1 + 0.09= 0.19,又P(A)= P(B+ C)= P(B) + P(C) = 0.84,所以事件A的概率估计为0.84.⑵由(1)知,任取一件产品是一等品、二等品的概率估计值分别为0.19,0.65,故任取一件产品是三等品的概率估计值为0.16,从而10000件产品估计有一等品、二等品、三等品分别为1900,6500,1600件, 故利润估计为1900 X 10+ 6500X 6+ 1600 X 2 = 61200 元.(3) 因为在产品质量指标值M的频率分布直方图中,质量指标值M<90的频率为0.06+ 0.1 + 0.2= 0.36<0.5,质量指标值M<100 的频率为0.06+ 0.1 + 0.2+ 0.3= 0.66>0.5,C A C故质量指标值M 的中位数估计值为90+ . ~03 94.67.热点3线性回归分析与独立性检验方法结论V1.线性回归方程AAA方程y =b x + a 称为线性回归方程,利用最小二乘法估计公式中的斜率和截距n AKx i y i— n xy A _ A ___分别为b 」一n, a = y — b —X ,其中(x , V)是样本点的中心,且回归直S2 — 2X i — n x线恒过该点.2.独立性检验根据2 X 2列联表,计算随机变量 K 2=2詈芝++詈+—+d (K 2也可以表示为気,当厶诃1时,则有95%的把握说两个事件有关;当K 2>6.635时,则有99%的把握说两个事件有关.具体参考 数据如下表:【题型分析】1. 某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五 年的储蓄存款(年底余额),如下表1:表1为了研究计算的方便,工作人员将上表的数据进行了处理, t 二x — 2012, z = y—5得到下表2:(1)求z关于t的线性回归方程;⑵通过⑴中的方程,求出y关于x的回归方程;⑶用所求回归方程预测到2022年年底,该地储蓄存款额可达多少?A A A(附:对于线性回归方程y = b x + a ,n人着x i y i — nxy 人 _ 人_其中 b = -------- — , a =_y — b _X)占x f — n _X 2__55解 (1) t = 3, z = 2.2, ^t i z = 45,若t f = 55,AAa = z —b 7 = 2.2— 3X 1.2=— 1.4,A所以 z = 1.2t — 1.4.A(2) 将 t =x — 2012, z = y — 5,代入z = 1.2t — 1.4,A得 y — 5= 1.2(x — 2012)— 1.4,即y = 1.2x — 2410.8.A(3) 因为 y = 1.2 X 2022 — 2410.8= 15.6,所以预测到2022年年底,该地储蓄存款额可达15.6千亿元. 2. (2019全国卷I )某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1) 分别估计男、女顾客对该商场服务满意的概率;(2) 能否有95%的把握认为男、女顾客对该商场服务的评价有差异?2附:K 2=——nad 二匹5 -----------------(a + b '(c + d [a + c(b + d jP(K !>A O )①050 6 010 0+ 0013・ 841& 63510. 828解(1)由调查数据,男顾客中对该商场服务满意的比率为 50=0.8,因此男顾客对该商场服务满意的概率的估计值为 0.8.女顾客中对该商场服务满意的比率为 |0= 0.6,因此女顾客对该商场服务满意45 — 5X 3X 2.2 55— 5X 9 1.2,的概率的估计值为062⑵K2的观测值k=100X(40X20 —30X 10)〜450X 50X 70 X 30 &4.762.由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差日异・【通法指导】I1・线性回归模型是回归模型中的核心问题,判断两个变量是否线性相关及相关程度通常有两种方法:一是根据散点图直观判断;二是将相关数据代入相关系数公式求出r,然后根据r的大小进行判断.A A2•求线性回归直线的关键:一是根据公式准确计算出b, a的值;二是抓住样本点的中心(—,—)必在回归直线上.3•求解独立性检验问题时要注意:一是2X2列联表中的数据与公式中各个字母的对应,不能混淆;二是注意计算得到K1 2之后的结论,即K2的观测值k越大, 对应假设事件H。
2020届高考文数二轮复习常考题型大通关(全国卷):第19题+统计概率+Word版含答案

常考题型大通关:第19题统计概率1、2018年10月17日是我国第5个扶贫日,也是第26个国际消除贫困日。
射洪某企业员工共500人参加“精准扶贫”活动,按年龄分组:第一组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.(1)下表是年龄的频数分布表,求正整数a,b的值;(2)根据频率分布直方图,估算该企业员工的平均年龄及年龄的中位数;(3)现在要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,从这6人中随机抽取2人参加社区宣传交流活动,求至少有1人年龄在第3组的概率.2、某高校在2014年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下左图所示.(1)请先求出频率分布表中①、②、③、④位置相应的数据,再在答题纸上完成下列频率分布直方图;(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样抽取6名学生进入第二轮面试,求第3、4、5组每组各抽取多少名学生进入第二轮面试?3、随着生活水平的提高,人们对空气质量的要求越来越高,某机构为了解公众对“车辆限行”的态度,随机抽查40人,并将调查情况进行整理后制成下表:年龄(岁) [15,25) [25,35) [35,45) [45,55) [55,60]频数 5 10 10 5 10赞成人数 4 6 8 4 91.完成被调查人员年龄的频率分布直方图,并求被调查人员中持赞成态度人员的平均年龄约为多少岁?15,25,45,55的被调查人员中各随机选取1人进行调查.请写出所有的基2.若从年龄在[)[)本亊件,并求选取2人中恰有1人持不赞成态度的概率.4、某中学为弘扬优良传统,展示80年来的办学成果,特举办“建校80周年教育成果展示月”活动。
现在需要招募活动开幕式的志愿者,在众多候选人中选取100名志愿者,为了在志愿者.组号分组频数频率160,165 5 0.05第1组[)第2组[165,170)0.35第3组[170,175)第4组[175,180)20 0.20第5组[180,185)10合计100 1.001.请补充频率分布表中空白位置相应数据,再完成下列频率分布直方图;2.为选拔出主持人,决定在第3、4、5组中用分层抽样抽取6人上台,求第3、4、5组每组各抽取多少人?3.在2的前提下,主持人会在上台的6人中随机抽取2人表演诗歌朗诵,求第3组至少有一人被抽取的概率?5、某中学组织了一次高三学生数学学业水平模拟测试,学校从测试合格的男、女生中各随机抽取100人的成绩进行统计分析,分别制成了如图所示的男生和女生数学成绩的频率分布直方图.1.若所得分数大于等于80分认定为优秀,求男、女生优秀人数各有多少人?2.在1中的优秀学生中用分层抽样的方法抽取5人,从这5人中任意选取2人,求至少有一名男生的概率.6、某乡镇根据中央文件精神,在2014年通过精准识别确定建档立卡的贫困户共有473户,结合当地实际情况采取多项精准扶贫措施,从2015年至2018年该乡镇每年脱贫户数见下表:年份2015 2016 2017 2018 年份代码x 1 2 3 4脱贫户数y55 69 71 85(1)根据2015-2018年的数据,求出y关于x的线性回归方程$$y bx a=+$;(2)利用(1)中求出的线性回归方程,试判断到2020年底该乡镇的473户贫困户能否全部脱贫.附:$$1221,ni iiniix y nxyb a y bxx nx==-==--∑∑$$7、某农科所对冬季昼夜温差大小与某反季节大豆新品种种子发芽数之间的关系进行分析研究,他们分别记录了12月1日至12月5日每天昼夜温差大小与实验室每天每100颗种子中的发芽数,得到如下数据:该农科所确定的研究方案是:先从这5组数据中随机选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验。
高考数学概率统计知识点总结(文理通用)

概率与统计知识点及专练(一)统计基础知识:1. 随机抽样:(1).简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.(2).系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).(3).分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.2. 普通的众数、平均数、中位数及方差: (1).众数:一组数据中,出现次数最多的数(2).平均数:常规平均数:12nx x x x n ++⋅⋅⋅+=(3).中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数(4).方差:2222121[()()()]n s x x x x x x n =-+-+⋅⋅⋅+-(5).标准差:s3 .频率直方分布图中的频率:(1).频率 =小长方形面积:f S y d ==⨯距;频率=频数/总数; 频数=总数*频率(2).频率之和等于1:121n f f f ++⋅⋅⋅+=;即面积之和为1: 121n S S S ++⋅⋅⋅+=4. 频率直方分布图下的众数、平均数、中位数及方差: (1).众数:最高小矩形底边的中点(2).平均数:112233n n x x f x f x f x f =+++⋅⋅⋅+ 112233n n x x S x S x S x S =+++⋅⋅⋅+(3).中位数:从左到右或者从右到左累加,面积等于0.5时x 的值(4).方差:22221122()()()nn s x x f x x f x x f =-+-+⋅⋅⋅+-5.线性回归直线方程:(1).公式:ˆˆˆy bx a=+其中:1122211()()ˆ()n ni i i ii in ni ii ix x y y x y nxybx x x nx====---∑∑==--∑∑(展开)ˆˆa y bx=-(2).线性回归直线方程必过样本中心(,) x y(3).ˆ0:b>正相关;ˆ0:b<负相关(4).线性回归直线方程:ˆˆˆy bx a=+的斜率ˆb中,两个公式中分子、分母对应也相等;中间可以推导得到6. 回归分析:(1).残差:ˆˆi i ie y y=-(残差=真实值—预报值)分析:ˆie越小越好(2).残差平方和:2 1ˆ() ni iiy y =-∑分析:①意义:越小越好;②计算:222211221ˆˆˆˆ()()()() ni i n niy y y y y y y y =-=-+-+⋅⋅⋅+-∑(3).拟合度(相关指数):2 2121ˆ()1()ni iiniiy y Ry y==-∑=--∑分析:①.(]20,1R∈的常数;②.越大拟合度越高(4).相关系数:()()n ni i i ix x y y x y nx y r---⋅∑∑==分析:①.[1,1]r∈-的常数;②.0:r>正相关;0:r<负相关③.[0,0.25]r∈;相关性很弱;(0.25,0.75)r∈;相关性一般;[0.75,1]r∈;相关性很强7. 独立性检验:(1).2×2列联表(卡方图): (2).独立性检验公式①.22()()()()()n ad bc k a b c d a c b d -=++++②.上界P 对照表:(3).独立性检验步骤:①.计算观察值k :2()()()()()n ad bc k a b c d a c b d -=++++ ②.查找临界值0k :由犯错误概率P ,根据上表查找临界值0k③.下结论:0k k ≥即认为有P 的没把握、有1-P 以上的有把握认为两个量相关;0k k <:即认为没有1-P 以上的把握认为两个量是相关关系。
【精编版】2020年高考数学(文)热点专练10 概率与统计(解析版)

热点10 概率与统计【命题趋势】统计与概率是高考文科中的一个重要的一环高考对概率与统计内容的考查一般以实际应用题出现,这既是这类问题的特点,也符合高考发展的方向.概率应用题侧重于古典概率,近几年的高考有以概率应用题替代传统应用题的趋势,该题出现在解答题第二或第三题的位置,可见概率统计在高考中属于中档题.虽为中档题,但是实际生活背景在加强,阅读量大,所以快速阅读考题并准确理解题意是很重要的.对于这部分,我们还应当重视与传统内容的有机结合. 为了准确地把握2020年高考概率统计命题思想与趋势,在最后的复习中做到有的放矢,提高复习效率,纵观近五年的全国文科I卷,我们看到近几年每年一考,多出现在19题,分值12分;从难度上看:以中档题为主,重基础,考查的重点为统计图表的绘制与分析、数字特征的计算与分析、概率计算、线性回归分析,独立性检验等知识点,一般都会以实际问题为载体,代替传统建模题目.本专题我们把这些热点问题逐一说明,并提出备考指南,希望同学们在复习时抓住重点、事半功倍.【热点预测以及解题技巧】热点一:“统计”背景下的“概率”问题这类问题一般将统计与概率相结合.以频率分布直方图或茎叶图为背景来考查概率知识,有时以表格为背景来考查概率知识,需要从统计图、表格获取信息、处理数据的能力,并根据得出的数据求概率.热点二:样本分析并通过样本分析作决策进行样本分析时从统计图表中获取数据,得出频率、平均数、方差,用样本频率估计概率、样本数字特征估计总体数字特征,有时需以此作出决策.热点三:线性回归分析根据最小二乘法得出回归直线方程,有时需适当换元转化为线性回归方程. 由于计算量很大,题目一般会给出的参考数据,但是注意数据设置的“障眼法”,这时就要认真领会题意,找出适用的参考数据加以计算.热点四:独立性检验寻找数据完成列联表,下面的解题步骤比较固定,按部就班完成即可.热点五:与函数相结合的概率统计题这类题也是近几年出现较多的一类题,其综合性强,理解题意后找准变量,构建函数关系式.【考查题型】选择,填空,解答题【限时检测】(建议用时:45分钟)1.(2018·黑龙江哈尔滨三中高考模拟(文))从甲、乙两种树苗中各抽测了10株树苗的高度,其茎叶图如图所示.根据茎叶图,下列描述正确的是( )A.甲种树苗的高度的中位数大于乙种树苗高度的中位数,且甲种树苗比乙种树苗长得整齐B.甲种树苗的高度的中位数大于乙种树苗高度的中位数,但乙种树苗比甲种树苗长得整齐C.乙种树苗的高度的中位数大于甲种树苗高度的中位数,且乙种树苗比甲种树苗长得整齐D.乙种树苗的高度的中位数大于甲种树苗高度的中位数,但甲种树苗比乙种树苗长得整齐【答案】D【解析】从茎叶图的数据可以看出甲种树苗的平均高度为27,乙种树苗的平均高度为30,因此乙种树苗的平均高度大于甲种树苗的平均高度.又从茎叶图分析知道,甲种树苗的高度集中在20到30之间,因此长势更集中.2.(2019·辽宁高考模拟(文))《九章算术》中有如下问题:“今有勾五步,股一十二步,问勾中容圆,径几何?”其大意:“已知直角三角形两直角边长分别为5步和12步,问其内切圆的直径为多少步?”现若向此三角形内随机投一粒豆子,则豆子落在其内切圆外的 概率是 ( )A .215π B .320π C .2115π-D .3120π-【答案】C 【解析】 【分析】本题首先可以根据直角三角形的三边长求出三角形的内切圆半径,然后分别计算出内切圆和三角形的面积,最后通过几何概型的概率计算公式即可得出答案. 【详解】13=, 设内切圆的半径为r ,则51213r r -+-=,解得2r =. 所以内切圆的面积为24r ππ=,所以豆子落在内切圆外部的概率42P 111155122ππ=-=-⨯⨯,故选C.【名师点睛】本题主要考查“面积型”的几何概型,属于中档题. 解决几何概型问题常见类型有:长度型、角度型、面积型、体积型,求与面积有关的几何概型问题关鍵是计算问题的总面积以及事件的面积;几何概型问题还有以下几点容易造成失分,在备考时要高度关注:(1)不能正确判断事件是古典概型还是几何概型导致错误;(2)基本事件对应的区域测度把握不准导致错误 ;(3)利用几何概型的概率公式时 , 忽视验证事件是否等可能性导致错误. 3.(2019·安徽合肥一中高考模拟(文))甲、乙两名同学在 6 次数学考试中,所得成绩 用茎叶图表示如下,若甲、乙两人这 6 次考试的平均成绩分别用,x x 乙甲 表示,则下列结论正确的是( )A .x x >乙甲 ,且甲成绩比乙成绩稳定B .x x >乙甲 ,且乙成绩比甲成绩稳定C .x x <乙甲 ,且甲成绩比乙成绩稳定D .x x <乙甲,且乙成绩比甲成绩稳定【答案】C 【解析】 【分析】从茎叶图提取两个人的成绩,分别求出两个人的平均分,得到甲的平均数比乙的平均数要低,但甲数据比较集中,所以成绩比较稳定. 【详解】757782838590826x +++++==甲,727681869192836x +++++==乙,所以x x <乙甲,因为甲数据比较集中,所以成绩比较稳定.【名师点睛】茎叶图保留了原始数据,所以可通过计算平均数来比较大小,再通过数据的集中与离散程度判断稳定性.4.(2018·天津南开中学高考模拟(文))在长为12cm 的线段AB 上任取一点C .现作一矩形,邻边长分别等于线段AC ,CB 的长,则该矩形面积大于20cm 2的概率为 A .16B .13C .23D .45【答案】C 【解析】试题分析:设AC=x ,则BC=12-x (0<x <12) 矩形的面积S=x (12-x )>20 ∴x 2-12x+20<0 ∴2<x <10由几何概率的求解公式可得,矩形面积大于20cm 2的概率10221203p -==-考点:几何概型5.(2019·新疆高考模拟(文))《史记》中讲述了田忌与齐王赛马的故事.“田忌的上等马优于齐王的中等马,劣于齐王的上等马;田忌的中等马优于齐王的下等马,劣于齐王的中等马;田忌的下等马劣于齐王的下等马.”双方从各自的马匹中随机选一匹进行一场比赛,则田忌的马获胜的概率为A .31 B .41 C .51 D .61 【答案】A 【解析】分析:由题意结合古典概型计算公式即可求得最终结果.详解:记田忌的上等马、中等马、下等马分别为a ,b ,c ,齐王的上等马、中等马、下等马分别为A ,B ,C ,由题意可知,可能的比赛为:Aa ,Ab ,Ac ,Ba ,Bb ,Bc ,Ca ,Cb ,Cc ,共有9种,其中田忌可以获胜的事件为:Ba ,Ca ,Cb ,共有3种,则田忌马获胜的概率为p =39=13.本题选择A 选项.【名师点睛】:有关古典概型的概率问题,关键是正确求出基本事件总数和所求事件包含的基本事件数.(1)基本事件总数较少时,用列举法把所有基本事件一一列出时,要做到不重复、不遗漏,可借助“树状图”列举.(2)注意区分排列与组合,以及计数原理的正确使用.6.(2017·天津耀华中学高考模拟(文))某工厂甲,乙,丙三个车间生产了同一种产品,数量分别为600件,400件,300件,用分层抽样方法抽取容量为n 的样本,若从丙车间抽取6件,则n 的值为( ) A .18 B .20C .24D .26【答案】D 【解析】由分层抽样的定义可得:6300600400300n =++,解得:26n =. 本题选择D 选项.7.(2017·辽宁高考模拟(文))设样本数据1210,,,x x x L 的均值和方差分别为1和4,若(i i y x a a =+为非零常数,1,2,,10)i =L ,则1210,,,y y y L 的均值和方差分别为( )A .1,4a +B .1,4a a ++C .1,4D .1,4a +【答案】A 【解析】试题分析:因为样本数据1210,,,x x x L 的平均数是1,所以1210,,...y y y 的平均数是121012101210 (1101010)y y y x a x a x a x x x a a ++++++++++++==+=+;根据i i y x a =+(a 为非零常数,1,2,,10i =L ),以及数据1210,,,x x x L 的方差为4可知数据1210,,,y y y L 的方差为2144⨯=,综上故选A. 考点:样本数据的方差和平均数.8.(2017·陕西高考模拟(文))已知函数2()log ,[1,8]f x x x =∈,则不等式1()2f x ≤≤ 成立的概率是( ) A .17B .27C .37D .47【答案】B 【解析】由()12f x ≤≤,可知21log 2x ≤≤,解得24x ≤≤,由几何概型可知27P =,选B 二、填空题9.(2017·河南高考模拟(文))已知()0,0O ,()2,1A ,()1,2B -,31,55C ⎛⎫- ⎪⎝⎭,动点(),P x y满足02OP OA ≤⋅≤u u u r u u u r 且02OP OB u u u r u u u r ≤⋅≤,则点P 到点C 的距离大于14的概率为______.【答案】5164π- 【解析】由题意得,因为()()()310,0,2,1,1,2,,55O A B C ⎛⎫-- ⎪⎝⎭,所以动点(,)P x y 满足02OP OA ≤⋅≤u u u r u u u r 且02OP OB u u u r u u u r≤⋅≤,所以022{022x y x y ≤+≤≤-≤ ,则点P 到点C 的距离为22311()()5516z x y =-++≥ , 作出不等式组对应的平面区域,如图所示, 因为点P 到点C 的距离大于14,所以14PC >,则对应的部分为阴影部分, 由2042,2055x y x y x y -==⎧⇒=+=⎨⎩ ,即点42(,)55E,则5OE ==,所以正方形OEFG 的面积为45, 则阴影部分的面积为41516π- ,所以根据几何概型的概率公式可知所求的概率为41551614645ππ-=-.【名师点睛】:本题主要考查了几何概型及其概率的计算问题,其中解答中涉及到向量的数量积的运算,二元一次不等式组所表示的平面区域,简单的线性规划的应用,几何概型及其概率的计算公式等知识点的综合应用,着重考查了学生分析问题和解答问题的能力,以及推理与运算能力,本题的解答中利用向量的数量积的运算,转化为简单的线性规划求解是解答的关键.9.(2018·河南高考模拟(文))某班共有56名学生,现将所有学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知12号、26号、54号同学在样本中,则样本中还有一名同学的编号是__________.【答案】40【解析】【分析】先求出组距,然后根据已知的第二个样本的编号,求得第三个样本的编号.【详解】从56名学生中抽取4名,组距为56414÷=,由于抽取到第二个编号为26号,故第三个样本的编号为261440+=号.【名师点睛】本小题主要考查系统抽样的知识,先求得系统抽样的组距,然后根据已知来求得未知的样本编号,属于基础题.11.(2019·浠水县实验高级中学高三月考(文))设AB=6,在线段AB上任取两点(端点A,B除外),将线段AB分成了三条线段,若分成的三条线段长度均为正整数,则这三条线段可以构成三角形的概率是____________;若分成的三条线段的长度均为正实数,则这三条线段可以构成三角形的概率是_________.【答案】11014【解析】【分析】若分成的三条线段的长度均为正整数,则三条线段的长度的所有可能为:1,1,4;1,2,3;2,2,2共3种情况,其中只有三条线段为2,2,2时能构成三角形,由古典概型的概念,得到概率.三条线段的长度均为正实数时,则是几何概型,设出变量,写出全部结果所构成的区域,和满足条件的事件对应的区域,注意整理三条线段能组成三角形的条件,求出面积,作比值得到概率.【详解】若分成的三条线段的长度均为正整数,则三条线段的长度的所有可能为:1,1,4;1,2,3;1,3,2;1,4,1;2,1,3;2,2,2;2,3,1;3,1,2;3,2,1;4,1,1共10种情况,其中只有三条线段为2,2,2时能构成三角形则构成三角形的概率p1 10 =.(2)由题意知本题是一个几何概型设其中两条线段长度分别为x,y,则第三条线段长度为6﹣x﹣y,则全部结果所构成的区域为:0<x<6,0<y<6,0<6﹣x﹣y<6,即为0<x<6,0<y<6,0<x+y<6所表示的平面区域为三角形OAB;若三条线段x,y,6﹣x﹣y,能构成三角形,则还要满足666x y x yx x y yy x y x+--⎧⎪+--⎨⎪+--⎩>>>,即为333x yyx+⎧⎪⎨⎪⎩><<,所表示的平面区域为三角形DEF,由几何概型知所求的概率为:P14DEFAOBSS==VV【名师点睛】本题考查古典概型,考查几何概型,对于几何概型的问题,一般要通过把试验发生包含的事件同集合结合起来,根据集合对应的图形做出面积,用面积的比值得到结果. 三、解答题12.(2019·天津高考模拟(文))为预防H 1N 1病毒爆发,某生物技术公司研制出一种新流感疫苗,为测试该疫苗的有效性(若疫苗有效的概率小于90%,则认为测试没有通过),公司选定2000个流感样本分成三组,测试结果如下表:已知在全体样本中随机抽取1个,抽到B 组疫苗有效的概率是0.33. (∴)求x 的值;(∴)现用分层抽样的方法在全体样本中抽取360个测试结果,问应在C 组抽取多少个? (∴)已知y ≥465,z ≥30,求不能通过测试的概率.【答案】(1)660;(2)90;(3)112.【解析】 【分析】(1)由古典概型概率公式列方程求解即可;(2)先求出C 组样本个数,再根据分层抽样方法可得结果;(3)利用列举法可得基本事件空间包含的基本事件有11个,测试不能通过事件包含基本事件2个,利用古典概型概率公式可得结果. 【详解】(1)∵在全体样本中随机抽取1个,抽到B 组疫苗有效的概率约为其频率 即x2000=0.33, ∴ x =660;(2)C 组样本个数为y +z =2000-(673+77+660+90)=500,现用分层抽样的方法在全体样本中抽取360个测试结果,应在C 组抽取个数为3602000×500=90;(3)设测试不能通过事件为A,C 组疫苗有效与无效的可能的情况记为(y,z )由(2)知500=y+z ,且y,z ∈N ,基本事件空间包含的基本事件有:(465,35)、(466,34)、(467,33)、……(475,25)共11个 若测试不能通过,则77+90+z>200,即z>33事件A 包含的基本事件有:(465,35)、(466,34)共2个 ∴ P(A)=211故不能通过测试的概率为211.【名师点睛】本题主要考查分层抽样以及古典概型概率公式的应用,属于难题,利用古典概型概率公式求概率时,找准基本事件个数是解题的关键,基本亊件的探求方法有 (1)枚举法:适合给定的基本事件个数较少且易一一列举出的;(2)树状图法:适合于较为复杂的问题中的基本亊件的探求.在找基本事件个数时,一定要按顺序逐个写出:先(A 1,B 1),(A 1,B 2)….(A1,B n),再(A2,B1),(A2,B2)…..(A2,B n)依次(A3,B1)(A3,B2)….(A3,B n)… 这样才能避免多写、漏写现象的发生.13.(2019·山东高考模拟(文))2019年2月13日《烟台市全民阅读促进条例》全文发布,旨在保障全民阅读权利,培养全民阅读习惯,提高全民阅读能力,推动文明城市和文化强市建设.某高校为了解条例发布以来全校学生的阅读情况,随机调查了200名学生每周阅读时间X(单位:小时)并绘制如图所示的频率分布直方图.(1)求这200名学生每周阅读时间的样本平均数x和中位数a(a的值精确到0.01);(2)为查找影响学生阅读时间的因素,学校团委决定从每周阅读时间为[6.5,7.5),[7.5,8.5)的学生中抽取9名参加座谈会.(i)你认为9个名额应该怎么分配?并说明理由;(ii)座谈中发现9名学生中理工类专业的较多.请根据200名学生的调研数据,填写下面的列联表,并判断是否有95%的把握认为学生阅读时间不足(每周阅读时间不足8.5小时)与“是否理工类专业”有关?附:22()()()()()n ad bc K a b c d a c b d -=++++(n a b c d =+++).临界值表:【答案】(1)平均数9,中位数8.99;(2)(i )按照1:2进行名额分配;理由见详解; (ii )有. 【解析】 【分析】(1)根据平均数,中位数的定义进行求解即可(2)完成列联表,计算2K 的观测值,结合独立性检验的性质进行判断即可. 【详解】(1)该组数据的平均数60.0370.180.290.35100.19x =⨯+⨯+⨯+⨯+⨯110.09120.049+⨯+⨯=,因为0.030.10.20.350.680.5+++=>,所以中位数[8.5,9.5)a ∈,由0.030.10.2(8.5)0.350.5a +++-⨯=,解得0.50.338.58.990.35a -=+≈;(2)(i )每周阅读时间为[6.5,7.5)的学生中抽取3名,每周阅读时间为[7.5,8.5)的学生中抽取6名.理由:每周阅读时间为[6.5,7.5)与每周阅读时间为[7.5,8.5)是差异明显的两层,为保持样本结构与总体结构的一致性,提高样本的代表性,宜采用分层抽样的方法抽取样本;因为两者频率分别为0.1,0.2,所以按照1:2进行名额分配.(ii)由频率分布直方图可知,阅读时间不足8.5小时的学生共有200(0.030.10.2)66⨯++=人,超过8.5小时的共有20066134-=人.于是列联表为:2K的观测值2200(40742660)4.432 3.84166134100100k⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为学生阅读时间不足与“是否理工类专业”有关.【名师点睛】本题主要考查独立性检验的应用,根据数据计算出K2的观测值是解决本题的关键.考查学生的计算能力.14.(2019·江西高考模拟(文))某品牌餐饮公司准备在10个规模相当的地区开设加盟店,为合理安排各地区加盟店的个数,先在其中5个地区试点,得到试点地区加盟店个数分别为1,2,3,4,5时,单店日平均营业额y(万元)的数据如下:(1)求单店日平均营业额y(万元)与所在地区加盟店个数x(个)的线性回归方程;(2)根据试点调研结果,为保证规模和效益,在其他5个地区,该公司要求同一地区所有加盟店的日平均营业额预计值总和不低于35万元,求一个地区开设加盟店个数m 的所有可能取值;(3)小赵与小王都准备加入该公司的加盟店,根据公司规定,他们只能分别从其他五个地区(加盟店都不少于2个)中随机选一个地区加入,求他们选取的地区相同的概率.(参考数据及公式:51125i ii x y==∑,52155i i x ==∑,线性回归方程ˆybx a =+,其中1221ni ii nii x y nxyb xnx ==-=-∑∑,a y bx =-.)【答案】(1) ˆ12yx =-+ (2) 5,6,7 (3) 15P = 【解析】 【分析】(1)利用最小二乘法求线性回归方程;(2)解不等式()1235m m -≥得一个地区开设加盟店个数m 的所有可能取值;(3)利用古典概型的概率求选取的地区相同的概率. 【详解】(1)由题可得,3x =,9y =,设所求线性回归方程为ˆybx a =+, 则5152215125135155455i i i i i x y xy b x x ==--===---∑∑,将3x =,9y =代入,得()9312a =--=,故所求线性回归方程为ˆ12yx =-+. (2)根据题意,()1235m m -≥,解得:57m ≤≤,又m Z +∈,所以m 的所有可能取值为5,6,7.(3)设其他5个地区分别为,,,,A B C D E ,他们选择结果共有25种,具体如下:AA ,AB ,AC ,AD ,AE ,BA ,BB ,BC ,BD ,BE ,CA ,CB ,CC ,CD ,CE ,DA ,DB ,DC ,DD ,DE ,EA ,EB ,EC ,ED ,EE ,其中他们在同一个地区的有5种,所以他们选取的地区相同的概率51255P ==. 【名师点睛】本题主要考查线性回归方程的求法,考查古典概型的概率的计算,意在考查学生对这些知识的理解掌握水平和分析推理能力.15.(2018·天津南开中学高考模拟(文))某校从高一年级学生中随机抽取40名学生,将 他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,后得到如图的频率分布直方图.(1)求图中实数a 的值;(2)若该校高一年级共有学生640人,试估计该校高一年级 期中考试数学成绩不低于60分的人数;(3)若从数学成绩在[)40,50与[]90,100两个分数段内的学生中随机选取两名学生,求这两名学生的数学成绩之差的绝对值不大于10的概率.【答案】(1)0.03a =. (2)544人. (3)()715P M =. 【解析】试题分析:(1)由于图中所有小矩形的面积之和等于1, 所以10(0.0050.010.02⨯++0.0250.01)1a +++=. ……2分解得0.03a =. ……3分(2)根据频率分布直方图,成绩不低于60分的频率 为110(0.0050.01)-⨯+0.85=. ……5分由于该校高一年级共有学生640人,利用样本估计总体的思想,可估计该校高一年级数学成绩不低于60分的人数约为6400.85544⨯=人. ……6分 (3)成绩在[)40,50分数段内的人数为400.052⨯=人,分别记为A ,B . ……7分成绩在[]90,100分数段内的人数为400.14⨯=人,分别记为C ,D ,E ,F . ……8分若从数学成绩在[)40,50与[]90,100两个分数段内的学生中随机选取两名学生, 则所有的基本事件有:(),A B ,(),A C ,(),A D ,(),A E ,(),A F ,(),B C ,(),B D ,(),B E ,(),B F ,(),C D ,(),C E ,(),C F ,(),D E ,(),D F , (),E F 共15种. ……10分如果两名学生的数学成绩都在[)40,50分数段内或都在[]90,100分数段内,那么这两名学生的数学成绩之差的绝对值一定不大于10.如果一个成绩在[)40,50分数段内,另一个成绩在[]90,100分数段内,那么这两名学生的数学成绩之差的绝对值一定大于10. 记“这两名学生的数学成绩之差的绝对值不大于10”为事件M ,则事件M 包含的基本事件有:(),A B ,(),C D ,(),C E ,(),C F ,(),D E ,(),D F ,(),E F 共7种. ……11分所以所求概率为()715P M =. ……12分 考点:本小题主要考查频率分布直方图的应用和古典概型概率的求解,考查学生识图、用图的能力和运算求解能力.【名师点睛】:解决与频率分布直方图有关的题目时,要注意到频率分布直方图中纵轴表示的是频率/组距,不是频率,图中小矩形的面积才表示频率.16.(2019·江西高考模拟(文))某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:万元)对年销售量y (单位:吨)和年利润z (单位:万元)的影响.对近六年的年宣传费i x 和年销售量i y (1,2,3,4,5,6i =)的数据作了初步统计,得到如下数据:经电脑模拟,发现年宣传费x (万元)与年销售量y (吨)之间近似满足关系式b y a x =⋅(,0a b >).对上述数据作了初步处理,得到相关的值如表:(1)根据所给数据,求关于x 的回归方程; (2)已知这种产品的年利润z 与x ,y 的关系为e14zx =-若想在2019年达到年利润最大,请预测2019年的宣传费用是多少万元?附:对于一组数据()1,l u v ,()22,u v ,…,(),n n u v ,其回归直线v u a β=⋅+中的斜率和截距的最小二乘估计分别为()1221()()ni i i nii u v n uv un u β==-=-∑∑,v u αβ=-⋅【答案】(1)y e =2)当2018年的宣传费用为98万元时,年利润有最大值. 【解析】 【分析】(1)转化方程by a x =⋅,结合线性回归方程参数计算公式,计算,即可.(2)将z 函数转化为二次函数,计算最值,即可. 【详解】(1)对by a x =⋅,(0a >,0b >),两边取对数得ln ln ln y a b x =+,令ln i i u x =,ln i i v y =,得ln v a b u =+⋅,由题目中的数据,计算24.6 4.16u ==,18.33.056v ==, 且()()6611ln ln i iiii i u v x y ====∑∑ 75.3,()6622111n 101.4i ii i u x ====∑∑;则()6162216ˆ6i i i i i u v u v b u u ==-⋅=-⋅∑∑ 275.36 4.1 3.05101.46 4.1-⨯⨯=-⨯ 0.2710.542==, 1ln ln 3.05 4.112a v u =-=-⨯=, 得出ˆae =, 所以y 关于x的回归方程是ˆye = (2)由题意知这种产品的年利润z 的预测值为14ˆe z x e =-=1414e e x -=-(14e x -=-27e +,=98x =时,ˆz 取得最大值,即当2019年的年宣传费用是98万元时,年利润有最大值.【名师点睛】考查了线性回归方程求解,考查了二次函数计算最值问题,关键结合题意,得到回归方程,第二问关键转化为二次函数问题,难度中等.。
42、2020版高考文科数学突破二轮复习新课标通用讲义:第三部分 回顾9 概率与统计 Word版含答案

回顾9 概率与统计[必记知识]概率的几个基本性质(1)任何事件A 的概率都在0~1之间,即0≤P (A )≤1. (2)若A ⊆B ,则P (A )≤P (B ).(3)必然事件发生的概率为1,不可能事件发生的概率为0.(4)当事件A 与事件B 互斥时,P (A +B )=P (A )+P (B ).注意没有事件A 与事件B 互斥这一条件时,这个公式不成立.(5)若事件A 与事件B 互为对立事件,则P (A )+P (B )=1.古典概型与几何概型的异同(1)古典概型的概率计算公式P (A )=事件A 包含的基本事件的个数基本事件的总数.(2)几何概型的概率计算公式P (A )=构成事件A 的区域长度(面积或体积)试验的全部结果所构成的区域长度(面积或体积).抽样方法简单随机抽样、系统抽样、分层抽样.(1)从容量为N的总体中抽取容量为n的样本,则每个个体被抽到的概率都为n N.(2)分层抽样实际上就是按比例抽样,即按各层个体数占总体的比确定各层应抽取的样本容量.统计中的四个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即 x =1n (x 1+x 2+…+x n ).(4)方差与标准差方差:s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].标准差: s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. [必会结论]直方图的三个结论(1)小长方形的面积=组距×频率组距=频率. (2)各小长方形的面积之和等于1.(3)小长方形的高=频率组距,所有小长方形高的和为1组距.线性回归方程线性回归方程y ^=b ^x +a ^一定过样本点的中心(x ,y ).独立性检验利用随机变量K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )来判断“两个分类变量有关系”的方法称为独立性检验.如果K 2的观测值k 越大,说明“两个分类变量有关系”的这种判断犯错误的可能性越小.[必练习题]1.(2019·洛阳尖子生第二次联考)已知x 与y 之间的一组数据如表:已求得y 关于x 的线性回归方程y =2.1x +0.85,则m 的值为( ) A .1 B .0.85 C .0.7D .0.5解析:选D.x -=0+1+2+34=1.5,y ^=m +3+5.5+74=m +15.54,因为点(x -,y -)在回归直线上,所以m +15.54=2.1×1.5+0.85,解得m =0.5,故选D.2.(2019·福州市第一学期抽测)随机抽取某中学甲班9名学生、乙班10名学生的期中考试数学成绩,获得茎叶图如图.估计该中学甲、乙两班期中考试数学成绩的中位数分别是( )A .75,84B .76,83C .76,84D .75,83解析:选B.甲班9名学生的期中考试数学成绩分别为52,66,72,74,76,76,78,82,96,中位数为76,乙班10名学生的期中考试数学成绩分别为62,74,76,78,82,84,85,86,88,92,中位数为82+842=83,所以估计该中学甲、乙两班期中考试数学成绩的中位数分别是76,83,故选B.3.(2019·昆明市诊断测试)高铁、扫码支付、共享单车、网购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了n 座城市作试验基地.这n 座城市共享单车的使用量(单位:人次/天)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是( )A .x 1,x 2,…x n 的平均数B .x 1,x 2,…x n 的标准差C .x 1,x 2,…x n 的最大值D .x 1,x 2,…x n 的中位数解析:选B.平均数、中位数可以反映一组数据的集中程度;方差、标准差可以反映一组数据的波动大小,同时也反映这组数据的稳定程度.故选B.4.(2019·济南市学习质量评估)如图,在△ABC 中,∠C =90°,BC =2,AC =3,三角形内的空白部分由三个半径均为1的扇形构成,向△ABC 内随机投掷一点,则该点落在阴影部分的概率为( )A.π6 B .1-π6C.π4D .1-π4解析:选B.三个空白部分的面积之和为一个半径为1的圆的面积的二分之一,即π2,△ABC的面积为3,故所求的概率为1-π23=1-π6.5.某校为了了解学生一天的休息状况,分别从高一年级的510名学生、高二年级的480名学生、高三年级的450名学生中用分层抽样的方法抽取一个容量为n 的样本进行调查,其中从高三年级抽取了15名,则n =________.解析:由题意知抽样比为15450=130,所以n 510+480+450=130,解得n =48.答案:486.(一题多解)(2019·武昌区调研考试)甲盒中有红、黑皮笔记本各2本,乙盒中有黄、黑皮笔记本各1本,从两盒中各取1本,则取出的2本笔记本是不同颜色的概率为________.解析:法一:依题意,从甲盒、乙盒中各取1本笔记本共有4×2=8(种)取法,取出的2本笔记本是不同颜色的方法有2×2+2×1=6(种),所以取出的2本笔记本是不同颜色的概率P =68=34.法二:依题意,从甲盒、乙盒中各取1本笔记本共有4×2=8(种)取法,取出的2本笔记本是相同颜色的方法有2种,所以取出的2本笔记本是相同颜色的概率P ′=28=14,所以取出的2本笔记本是不同颜色的概率P =1-14=34.答案:347.(2019·武昌区调研考试)对参加某次数学竞赛的1 000名选手的初赛成绩(满分:100分)作统计,得到如图所示的频率分布直方图.(1)根据频率分布直方图完成以下表格;(3)如果从参加初赛的选手中选取380人参加复赛,那么如何确定进入复赛选手的成绩? 解:(1)填表如下.(2)平均数为55×0.05+65×0.15+75×0.35+85×0.35+95×0.1=78,方差s 22×0.05+(-13)2×0.15+(-3)2×0.35+72×0.35+172×0.1=101.(3)进入复赛选手的成绩为80+350-(380-100)350×10=82(分),所以初赛成绩为82分及其以上的选手均可进入复赛.(说明:回答82分以上,或82分及其以上均可)8.2019年国际篮联篮球世界杯,于2019年8月31日至9月15日在中国的北京、广州、南京、上海、武汉、深圳、佛山、东莞八座城市举办.为了宣传世界杯,某大学从全校学生中随机抽取了120名学生,对是否会收看篮球世界杯赛进行了问卷调查,统计数据如下:(1)(2)现从参与问卷调查且会收看篮球世界杯赛的学生中,采用按性别分层抽样的方法选取4人参加2019年国际篮联篮球世界杯志愿者宣传活动.(ⅰ)求男、女学生各选取多少人;(ⅱ)若从这4人中随机选取2人到校广播站开展2019年国际篮联篮球世界杯宣传介绍,求恰好选到2名男生的概率.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .解:(1)因为K 2=120×(60×20-20×20)280×40×80×40=7.5>6.635,所以有99%的把握认为收看篮球世界杯赛与性别有关. (2)(ⅰ)根据分层抽样的知识得,选取的男生有6060+20×4=3(人),女生有2060+20×4=1(人),所以选取的4人中,男生有3人,女生有1人.(ⅱ)设选取的3名男生分别为A ,B ,C ,1名女生为甲.从4人中随机选取2人,有(A ,B ),(A ,C ),(A ,甲),(B ,C ),(B ,甲),(C ,甲),共6种情形,其中恰好选到2名男生,有(A ,B ),(A ,C ),(B ,C ),共3种情形,所以,所求概率P =36=12.。
(完整版)高考数学概率和统计知识点,推荐文档

1 件是合格的概率;
(Ⅱ)若厂家发给商家 20 件产品中,其中有 3 件不合格,按合同规定该商家从中任取 2 件.
都进行检验,只有 2 件都合格时才接收这批产品.否则拒收,求出该商家检验出不合格产品数
的分布列及期望 E ,并求出该商家拒收这批产品的概率.
[解答过程](Ⅰ)记“厂家任取 4 件产品检验,其中至少有 1 件是合格品”为事件 A
一般地,设离散型随机变量 可能取的值为 x1 , x2 ,……, xi ,……, 取每一个值 xi (
i 1,2,……)的概率 P( xi )= Pi ,则称下表.
x1 x2 … xi …
P
P1 P2 … Pi …
为随机变量 的概率分布述两个性质:
本,则指定的某个个体被抽到的概率为
.
专业 知识分享
完美 WORD 格式
1.
P 5 1 .
[解答过程] 20 提示: 100 20
例 3.接种某疫苗后,出现发热反应的概率为 0.80.现有 5 人接种该疫苗,至少有 3 人出现
发热反应的概率为__________.(精确到 0.01)
[考查目的] 本题主要考查运用组合、概率的基本知识和分类计数原理解决问题的能力,以
P A 1 P A 1 0.24 0.9984
用对立事件 A 来算,有
(Ⅱ) 可能的取值为 0,1, 2 .
P
0
C127 C220
136 190 ,
P
1
C31C117 C220
51
190 ,
P
2
C32 C220
3 190
0
1
2
136
E
0 136
P
1
2020年高考数学(文数)解答题强化专练——概率与统计解析版

(文数)解答题强化专练——概率与统计一、解答题(本大题共10小题,共120.0分)1.党中央、国务院历来高度重视青少年的健康成长.“少年强则国强”,青少年身心健康、体魄强健、意志坚强、充满活力,是一个民族旺盛生命力的体现,是社会文明进步的标志,是国家综合实力的重要方面.全面实施《国家学生体质健康标准》,把健康素质作为评价学生全面健康发展的重要指标,是新时代的要求.《国家学生体质健康标准》有一项指标是学生体质指数(BMI),其计算公式为:,当BMI>23.5时认为“超重”,应加强锻炼以改善BMI.某高中高一、高二年级学生共2000人,人数分布如表(a).为了解这2000名学生的BMI指数情况,从中随机抽取容量为160的一个样本.性别男生女生合计年级高一年级5506501200高二年级425375800合计97510252000表(a)(1)为了使抽取的160个学生更具代表性,宜采取分层抽样,试给出一个合理的分层抽样方案,并确定每层应抽取出的学生人数;(2)分析这160个学生的BMI值,统计出“超重”的学生人数分布如表(b).性别男生女生年级高一年级46高二年级24表(b)(i)试估计这2000名学生中“超重”的学生数;(ii)对于该校的2000名学生,应用独立性检验的知识,可分析出性别变量比年级变量与“是否超重”关联性更强.应用卡方检验,可依次得到K2的观察值k1,k2,是判断k1和k2的大小关系.(只需写出结论)2.“公平正义”是社会主义和谐社会的重要特征,是社会主义法治理念的价值追求.“考试”作为一种公平公正选拔人才的有效途径,正被广泛采用.每次考试过后,考生最关心的问题是:自己的考试名次是多少?自已能否被录取?能获得什么样的职位?某单位准备通过考试(按照高分优先录取的原则)录用300名,其中275个高薪职位和25个普薪职位.实际报名人数为2000名,考试满分为400分.考试后对部分考生考试成绩进行抽样分析,得到频率分布直方图如下:试结合此频率分布直方图估计:(1)此次考试的中位数是多少分(保留为整数)?(2)若考生甲的成绩为280分,能否被录取?若能被录取,能否获得高薪职位?(分数精确到个位,概率精确到千分位)3.纪念币是一个国家为纪念国际或本国的政治、历史,文化等方面的重大事件、杰出人物、名胜古迹、珍稀动植物、体育赛事等而发行的法定货币.我国在1984年首次发行纪念币,目前已发行了115套纪念币,这些纪念币深受邮币爱好者的喜爱与收藏.2019年发行的第115套纪念币“双遗产之泰山币”是目前为止发行的第一套异形币,因为这套纪念币的多种特质,更加受到爱好者追捧.某机构为调查我国公民对纪念币的喜爱态度,随机选了某城市某小区的50位居民调查,调查结果统计如下:喜爱不喜爱合计年龄不大于40岁24年龄大于40岁20合计2250(Ⅰ)根据已有数据,把表格数据填写完整,判断能否在犯错误的概率不超过1%的前提下认为不同年龄与纪念币的喜爱无关?(Ⅱ)已知在被调查的年龄不大于40岁的喜爱者中有5名男性,其中3位是学生,现从这5名男性中随机抽取2人,求至多有1位学生的概率.附:,n=a+b+c+d.P(K2≥k)0.1000.0500.0250.010k 2.706 3.841 5.024 6.6354.某市一水电站的年发电量y(单位:亿千瓦时)与该市的年降雨量x(单位:毫米)有如下统计数据:2013年2014年2015年2016年2017年降雨量x (毫米) 1 500 1 400 1 900 1 600 2 100发电量y (亿千瓦7.4 7.0 9.2 7.9 10.0时)(1)若从统计的5年中任取2年,求这2年的发电量都高于7.5 亿千瓦时的概率;(2)由表中数据求得线性回归方程为=0.004x+,该水电站计划2019年的发电量不低于8.6 亿千瓦时,现由气象部门获悉2019年的降雨量约为1 800 毫米,请你预测2019年能否完成发电任务?5.2019年2月13日《烟台市全民阅读促进条例》全文发布,旨在保障全民阅读权利,培养全民阅读习惯,提高全民阅读能力,推动文明城市和文化强市建设.某高校为了解条例发布以来全校学生的阅读情况,随机调查了200名学生每周阅读时间X (单位:小时)并绘制如图所示的频率分布直方图.(1)求这200名学生每周阅读时间的样本平均数和中位数a(a的值精确到0.01);(2)为查找影响学生阅读时间的因素,学校团委决定从每周阅读时间为[6.5,7,5),[7.5,8.5)的学生中抽取9名参加座谈会.(i)你认为9个名额应该怎么分配?并说明理由;(ii)座谈中发现9名学生中理工类专业的较多.请根据200名学生的调研数据,填写下面的列联表,并判断是否有95%的把握认为学生阅读时间不足(每周阅读时间不足8.5小时)与“是否理工类专业”有关?阅读时间不足8.5小时阅读时间超过8.5小时理工类专业4060非理工类专业附:.临界值表:P(K2≥k0)0.150.100.050.0250.0100.0050.001k0 2.072 2.706 3.841 5.024 6.6357.87910.8286.2017年3月郑州市被国务院确定为全国46个生活垃圾分类处理试点城市之一,此后由郑州市城市管理局起草公开征求意见,经专家论证,多次组织修改完善,数易其稿,最终形成《郑州市城市生活垃圾分类管理办法》(以下简称《办法》).《办法》已于2019年9月26日被郑州市人民政府第35次常务会议审议通过,并于2019年12月1日开始施行.《办法》中将郑州市生活垃圾分为厨余垃圾、可回收垃圾、有害垃圾和其他垃圾4类为了获悉高中学生对垃圾分类的了解情况,某中学设计了一份调查问卷,500名学生参加测试,从中随机抽取了100名学生问卷,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图频率分布直方图:(Ⅰ)从总体的500名学生中随机抽取一人,估计其分数不低于60的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的学生人数;(Ⅲ)学校环保志愿者协会决定组织同学们利用课余时间分批参加“垃圾分类,我在实践”活动,以增强学生的环保意识.首次活动从样本中问卷成绩低于40分的学生中随机抽取2人参加,已知样本中分数小于40的5名学生中,男生3人,女生2人,求抽取的2人中男女同学各1人的概率是多少?7.某汽车公司生产新能源汽车,2019年3-9月份销售量(单位:万辆)数据如表所示:月份x3456789销售量y(万辆) 3.008 2.401 2.189 2.656 1.665 1.672 1.368(1)某企业响应国家号召,购买了6辆该公司生产的新能源汽车,其中四月份生产的4辆,五月份生产的2辆,6辆汽车随机地分配给A,B两个部门使用,其中A 部门用车4辆,B部门用车2辆.现了解该汽车公司今年四月份生产的所有新能源汽车均存在安全隐患,需要召回.求该企业B部门2辆车中至多有1辆车被召回的概率;(2)经分析可知,上述数据近似分布在一条直线附近.设y关于x的线性回归方程为,根据表中数据可计算出,试求出的值,并估计该厂10月份的销售量.8.某商家在某一天统计前5名顾客扫微信红包所得金额分别为5.9元,5.7元,4.7元,3.3元,2.1元,商家从这5名顾客中随机抽取3人赠送礼品.(Ⅰ)求获得礼品的3人中恰好有2人的红包超过5元的概率;(Ⅱ)商家统计一周内每天使用微信支付的人数x与每天的净利润y(单位:元),得到如表:x12162225262930y60100210240150270330根据表中数据用最小二乘法求y与x的回归方程=(,的计算结果精确到小数点后第二位)并估计使用微信支付的人数增加到36人时,商家当天的净利润为多少(计算结果精确到小数点后第二位)?参考数据及公式:①=22.86,=194.29;=268.86;=3484.29,②回归方程:=(其中=,=-)9.某医学院欲研究昼夜温差大小与患感冒人数多少之间的关系,该院派出研究小组分别到气象局与某医院,抄录了1到6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到数据资料见表:月份123456昼夜温差(℃)1011131286就诊人数(个)232630271713该研究小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻的两个月的概率;(2)已知选取的是1月与6月的两组数据.(i)请根据2到5月份的数据,求就诊人数y关于昼夜温差x的线性回归方程:(ii)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该研究小组所得的线性回归方程是否理想?(参考公式==,=-)10.某学校有40名高中生参加足球特长生初选,第一轮测身高和体重,第二轮足球基础知识问答,测试员把成绩(单位:分)分组如下:第1组[75,80),第2组[80,85),第3组[85,90),第4组[90,95),第5组[95,100),得到频率分布直方图如图所示.(1)根据频率分布直方图估计成绩的平均值(同一组中的数据用该组区间的中点值作代表);(2)用分层抽样的方法从成绩在第3,4,5组的高中生中6名组成一个小组,若6人中随2人担任小组负责人,求这2人来自3,4组各1人的概率.答案和解析1.【答案】解:(1)考虑到BMI应与年龄或性别均有关,最合理的分层应为以下四层:高一男生、高一女生、高二男生、高二女生;则高一男生抽取×160=44(人),高一女生抽取×160=52(人),高二男生抽取×160=34(人),高二女生抽取×160=30(人);(2)(i)160人中,“超重”人数为4+6+2+4=16(人),“超重”发生的频率为0.1,用样本的频率估计总体的频率,估计这2000名学生中“超重”的学生数为2000×0.1=200(人);(ii)应用独立性检验的知识,分析出性别变量与年级变量哪一个与“是否超重”的关联性更强,得出K2的观察值k1,k2,则k1和k2的大小关系为k1>k2.【解析】(1)考虑到BMI与年龄或性别均有关,最合理的分层为高一男生、女生,高二男生、女生;分别求出每层所抽取的人数即可;(2)(i)计算样本中“超重”的人数和频率,用样本的频率估计总体的频率,计算即可;(ii)应用独立性检验的知识分析出性别变量与年级变量哪一个与“是否超重”的关联性更强,得出K2的观察值k1应大于k2.本题考查了分层抽样原理与独立性检验的问题,也考查了用样本估计总体的问题,是基础题.2.【答案】解:(1)设(0.002+0.0029+x)×100=0.5,解得:x=0.0001.∴可得其中位数为:200+×(300-200)≈202.(2)300~400分的人数为:0.001×100×2000=200.280~300分的人数为:0.0041×100×2000×=164.而164+200>300.∴考生甲的成绩为280分,不能被录取.【解析】(1)设(0.002+0.0029+x)×100=0.5,解得:x.可得其中位数.(2)300~400分的人数为:0.001×100×2000=200.280~300分的人数为:0.0041×100×2000×=164.进而判断出结论.本题考查了频率分布直方图的性质及其应用,考查了推理能力与计算能力,属于中档题.3.【答案】解:(1)根据题意,设表中数据为喜爱不喜爱合计年龄不大于40岁a b24年龄大于40岁20c d 合计e2250则有e+22=50,则e=28;24+d=50,则d=26,a+20=e=28,则a=8,a+b=24,则b=16,b+c=22,则c=6;故列联表为:喜爱不喜爱合计年龄不大于40岁81624年龄大于40岁20626合计282250则有≈9.623>6.635.故能在犯错误的概率不超过1%的条件下认为不同年龄与纪念币的喜爱无关.(2)根据题意,记不大于40岁的5位喜爱者中的3位学生记为a,b,c,非学生记为A,B,则从5人中任取2人,共有(a,b),(a,c),(a,A),(a,B),(b,c),(b,A),(b,B),(c,A),(c,B),(A,B)10种结果.其中至多有1位学生的有7种,∴至多有1位学生的概率.【解析】(1)根据题意,由列联表的结构分析可得其他数据,即可完善列联表,进而计算K2的值,据此分析可得答案;(2)根据题意,记不大于40岁的5位喜爱者中的3位学生记为a,b,c,非学生记为A,B;由列举法分析“从这5名男性中随机抽取2人”和“至多有1位学生”的情况数目,由古典概型公式计算可得答案.本题考查独立性检验的应用,涉及古典概型的计算,属于基础题.4.【答案】解:(1)从统计的5年发电量中任取2年,基本事件为:(7.4,7.0},{7.4,9.2},{7.4,7.9},{7.4,10.0},{7.0,9.2},{7.0,7.9},{7.0,10.0},{9.2,7.9},{9.2,10.0},{7.9,10.0},共10个;其中这2年的发电量都高于7.5亿千瓦时的基本事件为:{9.2,7.9},{9.2,10.0},{7.9,10.0},共3个.所以这2年的发电量都高于7.5亿千瓦时的概率为.(2)因为.,又直线过点,所以,解得,所以.当x=1800时,.所以预测该水电站2019年能完成发电任务.【解析】本题考查回归直线方程,概率中的基本事件,属于中档题.(1)确定从统计的5年发电量中任取2年的基本事件、2年发电量都低于8.0(亿千瓦时)的基本事件,即可求出这2年的发电量都低于8.0(亿千瓦时)的概率;(2)先求出线性回归方程,再令x=1800,即可得出结论.5.【答案】解:(1)该组数据的平均数因为0.03+0.1+0.2+0.35=0.68>0.5,所以中位数a∈[8.5,9.5),由0.03+0.1+0.2+(a-8.5)×0.35=0.5,解得;(2)(i)每周阅读时间为[6,5,7.5)的学生中抽取3名,每周阅读时间为[7.5,8.5)的学生中抽取6名.理由:每周阅读时间为[6,5,7.5)与每周阅读时间为[7.5,8.5)是差异明显的两层,为保持样本结构与总体结构的一致性,提高样本的代表性,宜采用分层抽样的方法抽取样本;因为两者频率分别为0.1,0.2,所以按照1:2进行名额分配.(ii)由频率分布直方图可知,阅读时间不足8.5小时的学生共有200×(0.03+0.1+0.2)=66人,超过8.5小时的共有200-66=134人.于是列联表为:阅读时间不足8.5小时阅读时间超过8.5小时理工类专业4060非理工类专业2674K2的观测值,所以有95%的把握认为学生阅读时间不足与“是否理工类专业”有关.【解析】本题主要考查独立性检验的应用,根据数据计算出K2的观测值是解决本题的关键.考查学生的计算能力.(1)根据平均数,中位数的定义进行求解即可,(2)完成列联表,计算K2的观测值,结合独立性检验的性质进行判断即可.6.【答案】解:(Ⅰ)根据频率分布直方图可知,样本中分数高于60的频率为:(0.02+0.04+0.02)×10=0.8,所以样本中分数高于60的概率为0.8.故从总体的500名学生中随机抽取一人,其分数高于60的概率估计为0.8.(Ⅱ)根据题意,样本中分数不小于50的频率为:(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5,所以总体中分数在区间[40,50)内的人数估计为500×=25,(Ⅲ)设3名男生分别为A,B,C,2名女生分别为1,2,则从这5名同学中选取2人的结果为:{A,B},{A,C},{A,1},{A,2},{B,C},{B,1},{B,2},{C,1},{C,2},{1,2}共10种情况.其中2人中男女同学各1人包含结果为:{A,1},{A,2},{B,1},{B,2},{C,1},{C,2},共6种,设事件A={抽取的2人中男女同学各1人},则P(A)=,所以,抽取的2人中男女同学各1人的概率是.【解析】(1)由直方图求出分数高于60的频率,计算出分数高于60的概率,(2)先计算出分数不小于50的频率,再算出分数在区间[40,50)内的人数,再估算出总体中分数在区间[40,50)内的人数.(3)先计算出从这5名同学中选取2人的事件,再算出抽取的2人中男女同学各1人的事件,再求抽取的2人中男女同学各1人的概率.本题考查频率直方图,通过频率估算整体,以及求频率,属于基础题.7.【答案】解:(1)设某企业购买的6辆新能源汽车,4月份生产的4辆车为C1,C2,C3,C4;5月份生产的2辆车为D1,D2,6辆汽车随机地分配给A,B两个部门.B部门2辆车可能为(C1,C2),(C1,C3),(C1,C4),(C1,D1),(C1,D2),(C2,C3),(C2,C4),(C2,D1),(C2,D2),(C3,C4),(C3,D1),(C3,D2),(C4,D1,(C4,D2),(D1,D2)共15种情况;其中,至多有1辆车是四月份生产的情况有:(C1,D1),(C1,D2),(C2,D1),(C2,D2),(C3,D1),(C3,D2),(C4,D1),(C4,D2),(D1,D2)共9种,所以该企业B部门2辆车中至多有1辆车被召回的概率为;(2)由题意得,.因为线性回归方程过样本中心点,所以,解得.当x=10时,,即该厂10月份销售量估计为1.151万辆.【解析】(1)用列举法,求出个数,根据概率公式求出即可;(2)求出线性回归方程过样本中心点,代入求出a,再代入x=10即可.考查古典概型求概率,线性回归方程的性质及其应用,中档题.8.【答案】解:(Ⅰ)记“5名顾客扫微信红包所得金额超过5元的2人”为A1,A2,“不超过5元的3人”为B1,B2,B3,“获得礼品的3人中恰好有2人的红包超过5元”为事件M,则所有的基本事件有:A1A2B1,A1A2B2,A1A2B3,A1B1B2,A1B1B3,A1B2B3,A2B1B2,A2B1B3,A2B2B3,B1B2B3共10种,其中事件M包含的基本事件有共3种,为A1A2B1,A1A2B2,A1A2B3,∴P(M)=;(Ⅱ)∵==,∴=-=194.29-12.9622.86=-101.98.∴y与x的回归方程为=12.96x-101.98,当x=36时,.故估计使用微信支付的人数增加到36人时,商家当天的净利润约为364.58元.【解析】(Ⅰ)利用古典概型的概率公式求获得礼品的3人中恰好有2人的红包超过5元的概率;(Ⅱ)利用最小二乘法求y与x的回归方程为=12.96x-101.98,把x=36代入方程,即可得解.本题考查古典概型的概率的计算,考查线性回归方程的求法,考查利用回归方程进行预测,意在考查学生对这些知识的理解掌握水平和分析推理计算能力,是中档题.9.【答案】解:(1)设选取的2组数据恰好是相邻两个月为事件A,因为从6组数据中选取2组数据共有15种情况,每种情况都是等可能出现的,其中选取的2组数据恰好是相邻两个月的情况有5种,所以P(A)=,(2)=(11+13+12+8)=11,=(26+30+27+17)=25,===,=-=25-=,得到y关于x的回归直线方程为y=(2)当x=10时,y=同样,当x=6时,y=,估计数据与所选出的检验数据的误差均不超过2人,∴该小组所得线性回归方程是理想的.【解析】(1)本题是一个古典概型,试验发生包含的事件是从6组数据中选取2组数据共有15种情况,满足条件的事件是抽到相邻两个月的数据的情况有5种,根据古典概型的概率公式得到结果.(2)根据所给的数据,求出x,y的平均数,根据求线性回归方程系数的方法,求出系数a,b,写出线性回归方程;(3)将x的值代入回归方程检验即可.考查古典概型求概率,求线性回归方程和应用,考查运算能力,中档题.10.【答案】解:(1)因为(0.01+0.07+0.06+x+0.02)×5=1,所以x=0.04,所以成绩的平均值为+0.10×=87.25;(2)第3组学生人数为0.06×5×40=12,第4 组学生人数为0.04×5×40=8,第5组学生人数为0.02×5×40=4,所以抽取的6人中第3,4,5组的人数分别为3,2,1.第3组的3人分别记为A1,A2,A3,第4 组的2人分别记为B1,B2,第5 组的1 人记为C,则从中选出2人的基本事件为共15个,记“从这6人中随机选出2人担任小组负责人,这2人来自第3,4组各1人”为事件M ,则事件M包含的基本事件为(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),共6个,所以P(M)=.【解析】(1)根据频率分布直方图求出x的值,再利用同一组中的数据用该组区间的中点值作代表估计平均数即可;(2)先求出抽取的6人中第3,4,5组的人数,再利用古典概型的概率公式求解即可.本题考查由频数分布直方图,以及古典概型,属于基础题.。
概率统计(文科).pdf

文科数学《统计与概率》核心知识点与参考练习题一、统计(核心思想:用样本估计总体)1.抽样(每个个体被抽到的概率相等)(1)简单随机抽样:抽签法与随机数表法(2)系统抽样(等距抽样)(3)分层抽样2.用样本估计总体:(1)样本数字特征估计总体:众数、中位数、平均数、方差与标准差(2)样本频率分布估计总体:频率分布直方图与茎叶图3.变量间的相关关系:散点图、正相关、负相关、回归直线方程(最小二乘法)4.独立性检验二、概率(随机事件发生的可能性大小)1.基本概念(1)随机事件A的概率1,0AP(2)用随机模拟法求概率(用频率来估计概率)(3)互斥事件(对立事件)2.概率模型(1)古典概型(有限等可能)(2)几何概型(无限等可能)三、参考练习题1.某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_______ .2.某学校高一、高二、高三年级的学生人数之比是3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则该从高二年级抽取_____名学生.3.某校老年、中年和青年教师的人数见右表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为_______ .4.已知一组数据5.5,4.5,1.5,8.4,7.4,则该组数据的方差是_____.5.若1,2,3,4,m这五个数的平均数为3,则这五个数的标准差为____.6.重庆市2013年各月的平均气温(℃)数据的茎叶图如右图:则这组数据的中位数是________.7.某高校调查了200名学生每周的晚自习时间(单位:小时),制成了如图所示的频率分布直方图,其中晚自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.1408.(2016四川文)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查. 通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照 [0,0.5),[0.5,1),…,[4,4.5] 分成9组,制成了如图的频率分布直方图. (Ⅰ)求直方图中a的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(Ⅲ)估计居民月均用水量的中位数.类别人数老年教师900中年教师1800青年教师1600合计43009.(2015全国Ⅱ文)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表.A 地区用户满意度评分的频率分布直方图B 地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数2814106(Ⅰ)作出B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图(Ⅱ)根据用户满意度评分,将用户的满意度分为三个等级:试估计哪个地区用户的满意度等级为不满意的概率大?说明理由.10.(2014安徽文)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(Ⅰ)应收集多少位女生的样本数据?(Ⅱ)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;(Ⅲ)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:db c a d cb a bcd a n K22满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意2k KP 0.10 0.05 0.01 0.005 0k 2.7063.8416.6357.87911.(2014全国Ⅰ文)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125] 频数 6 26 38 22 8(Ⅰ)在下表中作出这些数据的频率分布直方图:(Ⅱ)估计这种产品质量指标值的平均数和方差(同一组中的数据用该组区间的中点值作代表);(Ⅲ)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?12.(2014广东文)某车间20名工人年龄数据如下表:(Ⅰ)求这20名工人年龄的众数与极差;(Ⅱ)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(Ⅲ)求这20名工人年龄的方差.13.(2016江苏)将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是_______ .14.从甲、乙等5名学生中随机选出2人,则甲被选中的概率为_______ .15.(2016全国乙卷文)为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是______ .16.(2016全国丙卷文)小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M、I、N中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是________ .17.(2016天津文)甲、乙两人下棋,两人下成和棋的概率为21,甲获胜的概率是31,则甲不输的概率为_________ . 18.已知5件产品中有2件次品,其余为合格品.现从这5件产品中任选2件,恰有一件次品的概率为_________ .19.某单位N 名员工参加“社区低碳你我他”活动.他们的年龄在25岁至50岁之间.按年龄分组并得到的频率分布直方图如图所示.下表是年龄的频数分布表.区间[25,30)[30,35)[35,40)[40,45)[45,50]人数25ab(Ⅰ)求正整数a ,b ,N 的值;(Ⅱ)现要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,则年龄在第1,2,3组的人数分别是多少?(Ⅲ)在(2)的条件下,从这6人中随机抽取2人参加社区宣传交流活动,求恰有1人在第3组的概率.20.(2016全国Ⅰ文)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是()A.31 B.21 C.32 D.4321.(2016全国Ⅱ文)某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为()A.107 B.85 C.83 D.10322.在区间[-2,3]上随机选取一个数x ,则1x 的概率为_____ .23.若将一个质点随机投入如图所示的长方形ABCD 中,其中AB=2,BC=1,则质点落在以AB 为直径的半圆内的概率是_______ .24.如图,在边长为1的正方形中随机撒1000粒豆子,有180粒落到阴影部分,据此估计阴影部分的面积为_________ .25.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x 的线性回归方程为()A.1?x yB.1?x yC.xy 2188? D.176?y26.某产品的广告费用x 与销售额y 的统计数据如下:根据上表可得回归方程axb y ???中的b ?为9.4,据此模型预报广告费用为6万元时销售额为A.63.6万元B.65.5万元C.67.7万元D.72.0万元27.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份2011 2012 2013 2014 2015 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(Ⅰ)求y 关于t 的回归方程at by ???;(Ⅱ)利用(Ⅰ)中的回归方程,分析2011年至2015年该地区城乡居民储蓄存款的变化情父亲身高x (cm )174 176 176 176 178 儿子身高y (cm )175175176177177广告费用x (万元) 4 2 3 5 销售额y (万元)49263954况,并预测该地区2016年(t =6)的人民币储蓄存款.附:回归方程at b y ???中,t by atn t yt n y t b ni ini ii ??,?1221. 28.甲、乙两所学校高三年级分别有1200人、1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样的方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下:甲校:分组[70,80)[80,90)[90,100)[100,110)频数 3 4 8 15 分组[110,120)[120,130)[130,140)[140,150]频数15x32乙校:分组[70,80)[80,90)[90,100)[100,110)频数 1 2 8 9 分组[110,120)[120,130)[130,140)[140,150]频数1010y3(1)计算y x,的值;(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率;(3)由以上统计数据填写下面2×2列联表,并判断是否有90%的把握认为两所学校的数学成绩有差异.参考数据与公式:由列联表中数据计算db c a d cb abcadn K22;临界值表:29.一次考试中,5名学生的数学、物理成绩如下表所示:学生 A B C D E 数学成绩x (分)89 91 93 95 97 物理成绩y (分)8789899293(1)要从5名学生中选2人参加一项活动,求选中的学生中至少有一人的物理成绩高于90分的概率;甲校乙校总计优秀非优秀总计2k KP 0.10 0.05 0.010 0k 2.7063.8416.635(2)根据上表数据作散点图,求y 与x 的线性回归方程(系数精确到0.01).附:回归直线的方程是:ax b y ???,其中x byaxx y y x x b ni ini i i??,?121;90,93y x ,30,4051251yy x x xx ii i i i.30.为调查市民对汽车品牌的认可度,在秋季车展上,从有意购车的500名市民中,随机抽取100名市民,按年龄情况进行统计得到下面的频率分布表和频率分布直方图.(1)求频率分布表中a 、b 的值,并补全频率分布直方图,再根据频率分布直方图估计有意购车的这500名市民的平均年龄;31.(2016新课标Ⅱ)某险种的基本保费为a (单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:上年度出险次数0 1 2 3 4 5保费0.85aa1.25a1.5a 1.75a 2a设该险种一续保人一年内出险次数与相应概率如下:一年内出险次数0 1 2 3 4 5 概率0.300.150.200.200.100.05(Ⅰ)求一续保人本年度的保费高于基本保费的概率;32.袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,从中一次随机分组(岁)频数频数[20,25) 5 0.050 [25,30) 200.200 [30,35) a0.350 [35,40) 30 b [40,45] 10 0.100 合计1001.000摸出2只球,则这2只球颜色不同的概率为____________ .33.现有6道题,其中4道甲类题,2道乙类题,某同学从中任取2道题解答.试求:(1)所取的2道题都是甲类题的概率;(2)所取的2道题不是同一类题的概率.A,两地区分别随机调查了20个用户,得到用34.某公司为了解用户对其产品的满意度,从B户对产品的满意度评分如下:A地区:62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 91 46 53 73 64 8293 48 65 81 74 56 54 76 65 79(Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020年高考文科数学《概率与统计》题型归纳与训练【题型归纳】 题型一 古典概型例1 从甲、乙等5名学生中随机选出2人,则甲被选中的概率为( ).A.15 B. 25 C. 825D. 925【答案】B【解析】 可设这5名学生分别是甲、乙、丙、丁、戊,从中随机选出2人的方法有:(甲,乙),(甲,丙),(甲,丁),(甲,戊),(乙,丙),(乙,丁),(乙,戊),(丙,丁),(丙,戊),(丁,戊),共有种选法,其中只有前4种是甲被选中,所以所求概率为.故选B. 例2 将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为________. 【答案】23【解析】根据题意显然这是一个古典概型,其基本事件有:数1,数2,语; 数1,语,数2;数2,数1,语; 数2,语,数1;语,数2,数1; 语,数1,数2共有6种,其中2本数学书相邻的有4种,则其概率为:4263p ==. 【易错点】列举不全面或重复,就是不准确 【思维点拨】直接列举,找出符合要求的事件个数.1042105=题型二 几何概型例1 如图所示,正方形ABCD 内的图形来自中国古代的太极图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是( ).A.14 B. π8 C. 12 D. π4【答案】B【解析】不妨设正方形边长为a ,由图形的对称性可知,太极图中黑白部分面积相等,即各占圆面积的一半.由几何概型概率的计算公式得,所求概率为822122ππ=⎪⎭⎫⎝⎛⨯⨯a a .故选B.例2 在区间[0,5]上随机地选择一个数p ,则方程22320x px p ++-=有两个负根的概率为________. 【答案】32【解析】方程22320x px p ++-=有两个负根的充要条件是2121244(32)020320p p x x p x x p ⎧∆=--≥⎪+=-<⎨⎪=->⎩即21,3p <≤或2p ≥,又因为[0,5]p ∈,所以使方程22320x px p ++-=有两个负根的p 的取值范围为2(,1][2,5]3U ,故所求的概率2(1)(52)23503-+-=-,故填:32.【易错点】“有两个负根”这个条件不会转化.【思维点拨】“有两个负根”转化为函数图像与x 轴负半轴有两个交点.从而得到参D数p 的范围.在利用几何概型的计算公式计算即可. 题型三 抽样与样本数据特征例1 某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 ________件.【答案】18【解析】按照分层抽样的概念应从丙种型号的产品中抽取60300181000⨯=(件). 例2 已知样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,则样本数据121x +,221x +,⋅⋅⋅,21n x +的均值为 .【答案】11【解析】 因为样本数据,,⋅⋅⋅,的均值,又样本数据,,,的和为()122n x x x n ++++L ,所以样本数据的均值为=11.例3 某电子商务公司对10000名网络购物者2018年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.30.9],内,其频率分布直方图如图所示. (1)直方图中的a = .(2)在这些购物者中,消费金额在区间[0.50.9],内的购物者的人数为 .【答案】3a = 人数为0.6100006000⨯=1x 2x n x 5x =121x +221x +⋅⋅⋅21n x +21x+/万元a【解析】 由频率分布直方图及频率和等于1,可得0.20.10.80.1 1.50.120.1 2.50.10.11a ⨯+⨯+⨯+⨯+⨯+⨯=,解之得3a =.于是消费金额在区间[]0.50.9,内频率为0.20.10.80.120.130.10.6⨯+⨯+⨯+⨯=, 所以消费金额在区间[]0.50.9,内的购物者的人数为0.6100006000⨯=.例 4 某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图所示.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则从月平均用电量在[)220,240的用户中应抽取多少户? 【答案】见解析【解析】(1)由()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=, 得0.0075x =./度(2)由图可知,月平均用电量的众数是2202402302+=. 因为()0.0020.00950.011200.450.5++⨯=<,又()0.0020.00950.0110.0125200.70.5+++⨯=>, 所以月平均用电量的中位数在[)220,240内.设中位数为a ,由()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=, 得224a =,所以月平均用电量的中位数是224.(3)月平均用电量为[)220,240的用户有0.01252010025⨯⨯=(户); 月平均用电量为[)240,260的用户有0.00752010015⨯⨯=(户); 月平均用电量为[)260,280的用户有0.0052010010⨯⨯=(户); 月平均用电量为[]280,300的用户有0.0025201005⨯⨯=(户). 抽取比例为11125151055=+++,所以从月平均用电量在[)220,240的用户中应抽取12555⨯=(户). 【易错点】没有读懂题意,计算错误.不会用函数思想处理问题【思维点拨】根据题意分情况写出函数解析式;2牵涉到策略问题,一般可以转化为比较两个指标的大小. 题型四 回归与分析例1下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(1)由折线图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明(2)建立关于的回归方程(系数精确到),预测年我国生活垃圾无害化处理量.参考数据:,.参考公式:相关系数回归方程中斜率和截距的最小二乘估计公式分别为: 【答案】见解析【解析】(1)由折线图中数据和附注中参考数据得,,,,.y年生活垃圾无害化处理量年份代码ty t y t 0.012016719.32i i y ==∑7140.17i i i t y ==∑0.55= 2.646≈()()niit t y y r --=∑$$y abt =+$121()()()nii i nii tt y y b tt ==--=-∑∑$,$=.a y bt-$4t =()27128i i t t =-=∑0.55=()()77711140.1749.32 2.89i i i i i i i i t t y y t y t y ===--=-=-⨯=∑∑∑ 2.890.990.552 2.646r ≈≈⨯⨯因为与的相关系数近似为,说明与的线性相关程度相当高,从而可以用线性回归模型拟合与的关系.(1)变量与的相关系数,又,,,所以 ,故可用线性回归模型拟合变量与的关系.(2),,所以, ,所以线性回归方程为. 当时,.因此,我们可以预测2016年我国生活垃圾无害化处理亿吨.【易错点】没有读懂题意,计算错误.【思维点拨】将题目的已知条件分析透彻,利用好题目中给的公式与数据. 题型五 独立性检验例1 甲、乙、丙、丁四位同学各自对A 、B 两变量的线性相关性作试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:y t 0.99y t y t y t 7777()()7iii i i it t y y t y t y r ---⋅==∑∑∑∑7128i i t ==∑719.32i i y ==∑7140.17i i i t y ==∑ 5.292==0.55=740.17289.320.997 5.2920.55r ⨯-⨯=≈⨯⨯y t 4t =y =7117i i y =∑7172211740.17749.327ˆ0.10287i ii ii t y t yb tt ==-⋅-⨯⨯⨯===-∑∑1ˆˆ9.320.1040.937ay bx =-=⨯-⨯≈ˆ0.10.93y t =+9t =ˆ0.190.93 1.83y=⨯+=1.83则哪位同学的试验结果体现A、B两变量更强的线性相关性?() A.甲B.乙C.丙D.丁【答案】D【解析】D因为r>0且丁最接近1,残差平方和最小,所以丁相关性最高【易错点】不理解相关系数和残差平方和与相关性的关系【思维点拨】相关系数r的绝对值越趋向于1,相关性越强.残差平方和m越小相关性越强【巩固训练】题型一古典概型1.将一颗质地均匀的骰子(一种各个面上分别标有个点的正方体玩具)先后抛掷次,则出现向上的点数之和小于的概率是.【答案】【解析】将先后两次点数记为,则基本事件共有(个),其中点数之和大于等于有,共种,则点数之和小于共有种,所以概率为.2.我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30723=+.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是().A.112B.114C.115D.118【答案】C 1,2,3,4,5,621056(),x y6636⨯=10()()()()()()4,6,5,5,5,6,6,4,6,5,6,661030305 366=【解析】不超过30的素数有2、3、5、7、11、13、17、19、23、29,共10个,随机选取两数有45(种)情况,其中两数相加和为30的有7和23,11和19,13和17,共3种情况,根据古典概型得314515P ==.故选C .3.袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,从中一次随机摸出2只球,则这2只球颜色不同的概率为 . 【答案】56P =【解析】1只白球设为a ,1只红球设为b ,2只黄球设为c ,d , 则摸球的所有情况为(),a b ,(),a c ,(),a d ,(),b c ,(),b d ,(),c d ,共6件, 满足题意的事件为(),a b ,(),a c ,(),a d ,(),b c ,(),b d ,共5件,故概率为56P =.题型二 几何概型1.某公司的班车在7:00,8:00,8:30发车,学.小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( ).A .B .C .D . 【答案】B【解析】 如图所示,画出时间轴.小明到达的时间会随机的落在图中线段中,而当他的到达时间落在线段或时,才能保证他等车的时间不超过分钟.根据几何概型,所求概率.故选B . 13122334A 8:208:307:30AB AC DB 1010101402P +==2. 从区间随机抽取2n 个数,,…,,,,…,,构成n 个数对,,…,,其中两数的平方和小于1的数对共有m 个,则用随机模拟的方法得到的圆周率的近似值为( ).A .B .C .D .【答案】C【解析】由题意得:在如图所示方格中,而平方和小于1的点均在如图所示的阴影中,由几何概型概率计算公式知,所以.故选C .3.下图来自古希腊数学家希波克拉底所研究的几何图形,此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边AB ,AC ,ABC △的三边所围成的区域记为Ⅰ,黑色部分记为Ⅰ,其余部分记为Ⅰ,在整个图形中随机取一点,此点取自Ⅰ,Ⅰ,Ⅰ的概率分别记为1p ,2p ,3p ,则 A .12p p = B .13p p = C .23p p = D .123p p p =+【答案】A【解析】概率为几何概型,总区域面积一定,只需比较Ⅰ,Ⅰ,Ⅰ区域面积即可.设直角三角形ABC 的三个角A ,B ,C 所对的边长分别为a ,b ,c ,则区域Ⅰ的面积为112S ab =,[]0,11x 2x n x 1y 2y n y ()11,x y ()22,x y (),n n x y π4n m2n m4m n2m n()()12i i x y i n =⋅⋅⋅,,,,π41m n=4πmn=区域Ⅰ的面积为222211111111πππ22222222S c b ab a ab ⎛⎫⎛⎫⎛⎫=++-= ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭, 区域Ⅰ的面积为22231111111πππ2222282S c b ab a ab ⎛⎫⎛⎫=+-=- ⎪ ⎪⎝⎭⎝⎭. 显然12p p =.故选A .题型三 抽样与样本的数据特征1.已知一组数据4,6,5,8,7,6,那么这组数据的平均数为 . 【答案】10【解析】平均数()146587666x =+++++=.2.某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示. (Ⅰ)直方图中的a =_________;(Ⅰ)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为_________.【答案】3;6000【解析】频率和等于1可得0.20.10.80.1 1.50.120.1 2.50.10.11a ⨯+⨯+⨯+⨯+⨯+⨯=, 解之得3a =.于是消费金额在区间[0.5,0.9]内频率为0.20.10.80.120.130.10.6⨯+⨯+⨯+⨯=,所以消费金额在区间[0.5,0.9]内的购物者的人数为:0.6100006000⨯=,故应填3;6000. 3.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准(吨)、一位居民的月用水量不超过的部分按平价收费,超出的部分按议价收费.为了了解居民用水情x x x况,通过抽样,获得了某年位居民每人的月均用水量(单位:吨),将数据按照, ,, 分成组,制成了如图所示的频率分布直方图. (1)求直方图中的值;(2)设该市有万居民,估计全市居民中月均用水量不低于吨的人数,请说明理由;(3)若该市政府希望使的居民每月的用水量不超过标准(吨),估计的值,并说明理由. 【答案】见解析【解析】(1)由频率分布直方图知,月均用水量在中的频率为,同理,在,,, ,,中的频率分别为,, , , , .由,解得.(2)由(1),位居民每人月均用水量不低于吨的频率为. 由以上样本的频率分布,可以估计全市万居民中月均用水量不低于吨的人数为.(3)因为前组的频率之和为, 而前组的频率之和为,所以 由,解得. 题型四 回归与分析1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:100[)0,0.5[)0.5,1⋅⋅⋅[)4,4.59a 30385%x x [)00.5,0.080.50.04⨯=[)0.5,1[)1.5,2[)22.5,[)33.5,[)3.54,[)44.5,0.080.200.260.060.040.020.04+0.08+0.50.200.260.50.060.040.021a a ⨯+++⨯+++=0.30a =10030.06+0.04+0.02=0.123033000000.1236000⨯=60.040.080.150.200.260.15=0.880.85----->50.04+0.08+0.150.200.26=0.730.85--< 2.5 3.x <…()0.3 2.50.850.73x ⨯-=- 2.9x =根据上表可得回归直线方程ˆˆˆybx a =+ ,其中ˆˆˆ0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元 【答案】B【解析】由已知得8.28.610.011.311.9105x ++++==(万元),6.27.58.08.59.885y ++++==(万元),故ˆ80.76100.4a =-⨯=, 所以回归直线方程为ˆ0.760.4y x =+.当社区一户收入为15万元,家庭年支出为 ˆ0.7615y =⨯+0.411.8=(万元).故选B .2.为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为.已知,,.该班某学生的脚长为24,据此估计其身高为( ).A .B .C .D . 【答案】C 【解析】,,所以,时,.ˆˆˆybx a =+101225i i x ==∑1011600i i y ==∑ˆ4b =16016316617022.5x =160y =$160422.570a =-⨯=24x =42470166y =⨯+=故选C .3.某公司为确定下一年投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量()1,2,,8i y i =⋅⋅⋅数据作了初步处理,得到下面的散点图及一些统计量的值.表中i w =8118i i w w ==∑,(1)根据散点图判断,y a bx =+与y c =+哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型(给出判断即可,不必说明理由)? (2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系式为0.2z y x =-,根据(2)的结果回答下列问题:(Ⅰ)年宣传费49x =时,年销售量及年利润的预报值是多少?年宣传费/千元(Ⅰ)年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据()11,u v ()22,u v ,⋅⋅⋅,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121ˆnii i nii uu v v uu β==--=-∑∑,ˆˆv u αβ=-. 【答案】见解析【解析】(1)由散点图变化情况可知选择y c =+较为适宜.(2)由题意知()()()81821108.8681.6iii ii w w y y d w w ==--===-∑∑.又y c =+一定过点(),y ω,所以c y d ω=-=56368 6.8100.6-⨯=, 所以y 与x的回归方程为100.6y =+(3)(Ⅰ)由(2)知,当49x =时,()100.668576.6t y =+=, 0.2576.649z =⨯-=66.32(千元), 所以当年宣传费为49x =时,年销售量为()576.6t ,利润预估为66.32千元. (Ⅰ)由(2)知,(0.20.2100.6z y x x =-=+-=x +20.12=)226.8 6.820.12-++6.8时,年利润的预估值最大,即26.846.24x ==(千元). 题型五 独立性检验1.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H :“这种血清不能起到预防感冒的作用”,利用2×2列联表计算的K 2≈3.918,则下列表述中正确的是( )A .有95℅的把握认为“这种血清能起到预防感冒的作用”B .若有人未使用该血清,那么他一年中有95℅的可能性得感冒C .这种血清预防感冒的有效率为95℅D .这种血清预防感冒的有效率为5℅ 【答案】A【解析】由题可知,在假设H 成立情况下,)841.3(2≥K P 的概率约为0.05,即在犯错的概率不错过0.05的前提下认为“血清起预防感冒的作用”,即有95℅的把握认为“这种血清能起到预防感冒的作用”.这里的95℅是我们判断H 不成立的概率量度而非预测血清与感冒的几率的量度,故B 错误.C ,D 也犯有B 中的错误.故选A 2.观察下面频率等高条形图,其中两个分类变量x y ,之间关系最强的是( )A .B .C .D . 【答案】D【解析】在频率等高条形图中,a ab +与cc d+相差很大时,我们认为两个分类变量有关系,四个选项中,即等高的条形图中12,x x 所占比例相差越大,则分类变量,x y 关系越强,故选D .3.淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg )的频率分布直方图如图所示.(1)设两种养殖方法的箱产量相互独立,记A 表示事件:旧养殖法的箱产量低于50kg , 新养殖法的箱产量不低于50kg ,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附:22()()()()()n ad bc K a b c d a c b d -=++++ .频率频率组距箱产量/kg新养殖法旧养殖法箱产量/kg【答案】见解析【解析】(1)记:“旧养殖法的箱产量低于50kg ” 为事件B ,“新养殖法的箱产量不低于50kg ”为事件C ,由题图并以频率作为概率得()0.04050.03450.02450.01450.0125P B =⨯+⨯+⨯+⨯+⨯0.62=,()0.06850.04650.01050.0085P C =⨯+⨯+⨯+⨯0.66=,()()()0.4092P A P B P C ==.(2)由计算可得2K 的观测值为()222006266383415.70510010096104k⨯⨯-⨯==⨯⨯⨯,因为15.705 6.635>,所以()2 6.6350.001P K ≈≥,从而有99%以上的把握认为箱产量与养殖方法有关.(3)150.2÷=,()0.10.0040.0200.0440.032-++=,80.0320.06817÷=,85 2.3517⨯≈,50 2.3552.35+=,所以中位数为52.35.。