统计概率高考文科复习专题
高考概率统计文科知识点

高考概率统计文科知识点在文科高考中,概率统计是一个重要的考试内容。
理解和掌握概率统计的知识点对于应对考试至关重要。
下面将介绍一些高考概率统计的文科知识点。
一、概率的基本概念概率是指在某个事物中某个事件发生的可能性大小。
在高考文科中,概率的基本概念主要包括样本空间、随机事件、事件的概率等。
1.1 样本空间样本空间是指一个试验所有可能结果的集合。
例如,一次掷骰子的样本空间为S={1,2,3,4,5,6}。
1.2 随机事件随机事件是指在试验中可能发生的事件。
在样本空间中取一个子集,就表示一个随机事件。
例如,掷骰子出现奇数点数可以表示为A={1,3,5}。
1.3 事件的概率事件的概率是指事件发生的可能性大小。
事件A的概率可以用P(A)表示。
例如,在掷骰子实验中,掷出1的概率为P(A)=1/6。
二、基本概率公式高考文科中,基本概率公式主要包括加法公式和乘法公式。
2.1 加法公式加法公式是指对于两个不相容事件A和B,它们的概率之和等于事件A或B发生的概率。
公式如下:P(A∪B) = P(A) + P(B),其中∪表示并集。
2.2 乘法公式乘法公式是指对于两个独立事件A和B,它们同时发生的概率等于事件A发生的概率乘事件B发生的概率。
公式如下:P(A∩B) = P(A) * P(B),其中∩表示交集。
三、条件概率和独立性在概率统计中,条件概率和独立性是两个重要的概念。
3.1 条件概率条件概率是指在已知某一事件发生的条件下,另一事件发生的概率。
设A和B是两个事件,且P(A)>0,那么B在A发生的条件下的概率记作P(B|A),计算公式为:P(B|A) = P(A∩B) / P(A)。
3.2 独立性两个事件A和B相互独立,是指事件A的发生与否不影响事件B的发生与否。
具体而言,如果满足以下条件,则称事件A和B是独立事件:P(A∩B) = P(A) * P(B)。
四、排列组合在高考概率统计中,排列组合是非常重要的知识点。
统计概率高考文科复习专题

统计概率高考文科复习专题Document number:NOCG-YUNOO-BUYTT-UU986-1986UT高考文科复习专题——概率知识点梳理1.随机抽样(1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少.(2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多.(3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成.2.常用的统计图表(1)频率分布直方图①小长方形的面积=组距×频率组距=频率;②各小长方形的面积之和等于1;③小长方形的高=频率组距,所有小长方形的高的和为1组距.(2)茎叶图在样本数据较少时,用茎叶图表示数据的效果较好.3.用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数(2)方差:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].标准差: s =1n[?x 1-x ?2+?x 2-x ?2+…+?x n -x ?2]. 4. 变量的相关性与最小二乘法(1)相关关系的概念、正相关和负相关、相关系数.(2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q =∑i =1n(y i -a -bx i )2最小时,得到线性回归方程y ^=b ^x +a ^的方法叫做最小二乘法.5. 独立性检验对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:则K 2=n ?ad -bc ??a +b ??c +d ??a +c ??b +d ?(其中n =a +b +c +d 为样本容量).1.袋中共有6个除了颜色外完全相同的球,其中有1个红球,2个白球和3个黑球,从袋中任取两球,两球颜色为一白一黑的概率.2.一支田径运动队有男运动员56人,女运动员42人。
概率统计文科知识点总结

概率统计文科知识点总结概率统计的知识点涉及很多,包括基本概率论、统计学基础、抽样调查、推断统计、多元统计分析等等。
同时,概率统计还包括了一系列数学工具和模型,如随机变量、概率分布、统计推断和假设检验等内容。
下面我们来具体总结一下文科领域中概率统计的知识点。
1.基本概率论概率论是概率统计的基础,在文科领域中,基本概率论的内容包括了概率的定义、事件的概率、条件概率、独立事件、概率分布等内容。
了解基本概率论可以让文科学生更好地理解概率统计的相关知识,对于后续的学习具有重要的作用。
2.统计学基础统计学基础是概率统计的另一个重要内容,包括了统计量、样本集中趋势、样本离散程度、概率分布等内容。
统计学基础是文科领域中概率统计的重要组成部分,它主要用来描述和分析文科数据的规律和特征。
3.抽样调查抽样调查是文科领域中概率统计的一个重要应用,它主要用来获取文科数据样本。
在实际的文科研究中,抽样调查是获取数据的常用方法,通过对抽样调查的了解可以帮助文科学生更好地进行文科研究和分析。
4.推断统计推断统计是文科领域中概率统计的一个重要内容,它主要用来从样本数据中推断总体数据的特征和规律。
推断统计包括了点估计、区间估计、假设检验等内容,通过推断统计可以帮助文科学生更好地分析文科数据。
5.多元统计分析多元统计分析是文科领域中概率统计的一个拓展内容,它主要用来分析多个变量之间的关系。
在文科研究中,多元统计分析可以帮助文科学生更好地理解文科数据之间的关系,对于文科研究具有重要的意义。
除了上述内容之外,文科领域中概率统计还包括了一系列数学工具和模型,如随机变量、概率分布、统计推断和假设检验等内容。
这些内容都是文科学生在概率统计学习中需要重点掌握的知识点。
总的来说,概率统计在文科领域中有着重要的地位,它不仅可以帮助文科学生更好地理解文科数据的规律和特征,还可以帮助文科学生更好地进行文科研究和分析。
因此,文科学生在学习概率统计的过程中需要重点掌握上述知识点,通过理论学习和实际应用,不断提高自己的概率统计分析能力。
文科数学专题概率与统计(学案)高考二轮复习资料含答案

文科数学专题概率与统计(学案)高考二轮复习资料含答案1.以客观题形式考查抽样方法,样本的数字特征和回归分析,独立性检验的基本思路、方法及相关计算与推断.2.本部分较少命制大题,若在大题中考查多在概率与统计、算法框图等知识交汇处命题,重点考查抽样方法,频率分布直方图和回归分析或独立性检验,注意加强抽样后绘制频率分布直方图,然后作统计分析或求概率的综合练习.3.以客观题形式考查古典概型与几何概型、互斥事件与对立事件的概率计算.4.与统计结合在大题中考查古典概型与几何概型.(1)在频率分布直方图中:频率①各小矩形的面积表示相应各组的频率,各小矩形的高=;②各小矩形面积之和等于1;③中位数组距左右两侧的直方图面积相等,因此可以估计其近似值.(2)茎叶图当数据有两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,从总体中逐个抽取少在起始部分抽样时采按事先确定的规则在各用简单随机抽样总体中的个体数较多分层抽样时采用简单总体由差异明显的随机抽样或系统抽样几部分组成即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.当数据有三位有效数字,前两位相对比较集中时,常以前两位为茎,第三位(个位)为叶(其余类推).3.样本的数字特征(1)众数在样本数据中,频率分布最大值所对应的样本数据(或出现次数最多的那个数据).(2)中位数样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取当中两个数据的平均数作为中位数.(3)平均数与方差-1样本数据的平均数某=(某1+某2++某n).n1-2-2-22方差=[(某1-某)+(某2-某)++(某n-某)].n注意:(1)现实中总体所包含的个体数往往较多,总体的平均数与标准差、方差是不知道(或不可求)的,所以我们通常用样本的平均数与标准差、方差来估计总体的平均数与标准差、方差.(2)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定.4.变量间的相关关系(1)利用散点图可以初步判断两个变量之间是否线性相关.如果散点图中的点从整体上看大致分布在一条直线的附近,我们说变量某和y具有线性相关关系.(2)用最小二乘法求回归直线的方程^^^设线性回归方程为y=b某+a,则^b=-某-某^-^-a=y-b某ni=1nii=1--某i-某yi-y=--某iyi-n某yi=1nn22i-n某某2-i=1.--注意:回归直线一定经过样本的中心点(某,y),据此性质可以解决有关的计算问题.5.回归分析n某i-某yi-yi=1--r=n,叫做相关系数.某i-某2yi-y2i=1i=1-n-相关系数用来衡量变量某与y之间的线性相关程度;|r|≤1,且|r|越接近于1,相关程度越高,|r|越接近于0,相关程度越低.6.独立性检验假设有两个分类变量某和Y,它们的取值分别为{某1,某2}和{y1,y2},其样本频数列联表(称为2某2列联表)为某1某2总计2y1aca+c2y2bdb+d总计a+bc+da+b+c+da+b+c+dad-bc则K=,a+bc+da+cb+d若K>3.841,则有95%的把握说两个事件有关;若K>6.635,则有99%的把握说两个事件有关;若K<2.706,则没有充分理由认为两个事件有关.7.随机事件的概率随机事件的概率范围:0≤P(A)≤1;必然事件的概率为1,不可能事件的概率为0.8.古典概型①计算一次试验中基本事件的总数n;②求事件A包含的基本事件的个数m;③利用公式P(A)=计算.9.一般地,如果事件A、B互斥,那么事件A+B发生(即A、B中有一个发生)的概率,等于事件A、B分别发生的概率的和,即P(A+B)=P(A)+P(B).-10.对立事件:在每一次试验中,相互对立的事件A和A不会同时发生,但一定有一个发生,因此有222mnP(A)=1-P(A).11.互斥事件与对立事件的关系-对立必互斥,互斥未必对立.12.几何概型一般地,在几何区域D内随机地取一点,记事件“该点落在其内部区域d内”为事件A,则事件A发生的概率P(A)=考点一几何概型例1.【2022课标1,】如图,正方形ABCD内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是d的测度.D的测度141C.2A.【答案】Bπ8πD.4B.【变式探究】(2022·江苏卷)记函数f(某)=6+某-某的定义域为D.在区间[-4,5]上随机取一个数某,则某∈D的概率是________.5【答案】93--252【解析】由6+某-某≥0,解得-2≤某≤3,则D=[-2,3],则所求概率为=.5--49【变式探究】从区间[0,1]随机抽取2n个数某1,某2,,某n,y1,y2,,yn,构成n个数对(某1,y1),(某2,y2),,(某n,yn),其中两数的平方和小于1的数对共有m个,则用随机模拟的方法得到的圆周率π的近似值为()A.4n2m2nB.mC.4mn2mD.n【答案】Cmπ4m4m【解析】由题意知,=,故π=,即圆周率π的近似值为.n4nn考点二古典概型例2.(2022·全国卷Ⅱ)从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为()A.B.C.D.【答案】D3102511015【2022山东】从分别标有1,2,,9的9张卡片中不放回地随机抽取2次,每次抽取1张.则抽到的2张卡片上的数奇偶性不同的概率是(A)5475(B)(C)(D)18999【答案】C【解析】标有1,2,,9的9张卡片中,标奇数的有5张,标偶数的有4张,所以抽到的2张卡112C5C45,选C.片上的数奇偶性不同的概率是989【变式探究】袋中共有15个除了颜色外完全相同的球,其中有10个白球,5个红球.从袋中任取2个球,所取的2个球中恰有1个白球,1个红球的概率为()A.51011B.C.D.1212121【变式探究】(2022·天津卷)有5支彩笔(除颜色外无差别),颜色分别为红、黄、蓝、绿、紫.从这5支彩笔中任取2支不同颜色的彩笔,则取出的2支彩笔中含有红色彩笔的概率为()A.B.C.D.【答案】C【解析】从5支彩笔中任取2支不同颜色彩笔的取法有红黄、红蓝、红绿、红紫、黄蓝、黄绿、黄紫、蓝绿、蓝紫、绿紫,共10种,其中取出的2支彩笔中含有红色彩笔的取法有红黄、红蓝、红绿、红紫,共424种,所以所求概率P==.105故选C.考点三概率与其他知识的交汇例3、(2022·全国卷Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温天数[10,15)2[15,20)16[20,25)36[25,30)25[30,35)7[35,40)44 5352515以最高气温位于各区间的频率估计最高气温位于该区间的概率.(1)估计六月份这种酸奶一天的需求量不超过300瓶的概率.(2)设六月份一天销售这种酸奶的利润为Y(单位:元).当六月份这种酸奶一天的进货量为450瓶时,写出Y的所有可能值,并估计Y大于零的概率.【变式探究】某汽车美容公司为吸引顾客,推出优惠活动:对首次消费的顾客,按200元/次收费,并注册成为会员,对会员逐次消费给予相应优惠,标准如下表:消费次数收费比例第1次1第2次0.95第3次0.90第4次0.85第5次及以上0.80该公司从注册的会员中,随机抽取了100位进行统计,得到统计数据如下表:消费次数频数第1次60第2次20第3次10第4次5第5次及以上5假设汽车美容一次,公司成本为150元,根据所给数据,解答下列问题:(1)估计该公司一位会员至少消费两次的概率;(2)某会员仅消费两次,求这两次消费中,公司获得的平均利润;(3)该公司要从这100位里至少消费两次的顾客中按消费次数用分层抽样方法抽出8人,再从这8人中抽出2人发放纪念品,求抽出的2人中恰有1人消费两次的概率.40【解析】(1)100位会员中,至少消费两次的会员有40位,所以估计一位会员至少消费两次的概率为100=0.4.(2)该会员第1次消费时,公司获得的利润为200-150=50(元).50+40第2次消费时,公司获得的利润为200某0.95-150=40(元),所以,公司获得的平均利润为=245(元)。
高考文科数学概率与统计题型归纳与训练

高考文科数学概率与统计题型归纳与训练高考文科数学概率与统计题型归纳与训练近年来,随着高考评价重点的转变,我国高考数学概率与统计所占的比重越来越大,也极大地影响了学生的试题解答,特别是对文科类学生而言。
因此,归纳与训练概率与统计的题型对提升高考成绩非常有效。
一、高考概率与统计试题类型1、概率题:(1)概率概念题:要求判断某事件的可能性大小、求概率大小、比较概率大小,以及用中文描述概率大小等概念性问题。
(2)条件概率及贝叶斯公式:求两事件同时发生的条件概率,用贝叶斯公式求解概率问题。
(3)随机变量和概率分布:讨论正态分布、泊松分布等随机变量的概率分布。
2、统计学题:(1)数据的勘误析:把调查所得原始数据准确地归类编单,以便找出这些数据中蕴含的结论。
(2)图表分析:分析调查对象之间的关系,从折线图、饼形图、柱形图等图表中获取相应的数据。
二、概率与统计的训练方法1、理论思考训练:多看有关概率、统计的权威论文和教材,把基本概念牢牢掌握,把常见的概率公式及统计公式及推导式脱口而出。
2、示范练习:对常考的知识点补充示范练习,可以通过复现例题和大量习题来熟悉该知识点,从而深入理解,提高解题能力。
3、联系模拟考试:利用模拟考试把学过的知识点和技巧联系起来,在试题中能够驾轻就熟地掌握各试题技巧,大大提升实力。
4、强化记忆:记忆知识点、公式要选择相应的方法,通过反复记忆和熟习,把重点内容融会贯通,熟练记忆几个重点的式子和结论有助于考试的取得好成绩。
总之,学习概率与统计,除了要用心去理解之外,还需要不断的训练,把一些重点的知识点、公式强化记忆,加深理解,才能在考试中取得较好的成绩。
专题13计数原理与概率统计(原卷版)

大数据之十年高考真题(20142023)与优质模拟题(北京卷)专题13计数原理与概率统计1.【2023年北京卷05】(2x −1x )5的展开式中x 的系数为( ).A .−80B .−40C .40D .802.【2022年北京卷08】若(2x −1)4=a 4x 4+a 3x 3+a 2x 2+a 1x +a 0,则a 0+a 2+a 4=( ) A .40B .41C .−40D .−413.【2020年北京卷03】在(√x −2)5的展开式中,x 2的系数为( ). A .−5 B .5C .−10D .104.【2016年北京文科06】从甲、乙等5名学生中随机选出2人,则甲被选中的概率为( ) A .15B .25C .825D .9255.【2015年北京文科04】某校老年、中年和青年教师的人数见如表,采用分层插样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本的老年教师人数为( ) 类别 人数 老年教师 900 中年教师 1800 青年教师 1600 合计 4300A .90B .100C .180D .3006.【2021年北京11】(x 3−1x)4展开式中常数项为__________.7.【2016年北京理科10】在(1﹣2x )6的展开式中,x 2的系数为 .(用数字作答) 8.【2015年北京理科09】在(2+x )5的展开式中,x 3的系数为 (用数字作答)9.【2015年北京文科14】高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级的排名情况如图所示,甲、乙、丙为该班三位学生. 从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ;②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是.10.【2014年北京理科13】把5件不同产品摆成一排,若产品A与产品B相邻,且产品A与产品C不相邻,则不同的摆法有种.11.【2023年北京卷18】为研究某种农产品价格变化的规律,收集得到了该农产品连续40天的价格变化数据,如下表所示.在描述价格变化时,用“+”表示“上涨”,即当天价格比前一天价格高;用“”表示“下跌”,即当天价格比前一天价格低;用“0”表示“不变”,即当天价格与前一天价格相同.用频率估计概率.(1)试估计该农产品价格“上涨”的概率;(2)假设该农产品每天的价格变化是相互独立的.在未来的日子里任取4天,试估计该农产品价格在这4天中2天“上涨”、1天“下跌”、1天“不变”的概率;(3)假设该农产品每天的价格变化只受前一天价格变化的影响.判断第41天该农产品价格“上涨”“下跌”和“不变”的概率估计值哪个最大.(结论不要求证明)12.【2022年北京卷18】在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到9.50m以上(含9.50m)的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙以往的比赛成绩,并整理得到如下数据(单位:m):甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,935,9.30,9.25;乙:9.78,9.56,9.51,9.36,9.32,9.23;丙:9.85,9.65,9.20,9.16.假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E(X);(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)13.【2021年北京18】为加快新冠肺炎检测效率,某检测机构采取“k合1检测法”,即将k个人的拭子样本合并检测,若为阴性,则可以确定所有样本都是阴性的;若为阳性,则还需要对本组的每个人再做检测.现有100人,已知其中2人感染病毒.(1)①若采用“10合1检测法”,且两名患者在同一组,求总检测次数;②已知10人分成一组,分10组,两名感染患者在同一组的概率为1,定义随机变量X为总检测次数,求检11测次数X的分布列和数学期望E(X);(2)若采用“5合1检测法”,检测次数Y的期望为E(Y),试比较E(X)和E(Y)的大小(直接写出结果).14.【2020年北京卷18】某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:假设所有学生对活动方案是否支持相互独立.(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(Ⅲ)将该校学生支持方案的概率估计值记为p0,假设该校年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为p1,试比较p0与p1的大小.(结论不要求证明)15.【2019年北京文科17】改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校所有的1000名学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:不大于2000元大于2000元仅使用A 27人 3人 仅使用B24人1人(Ⅰ)估计该校学生中上个月A ,B 两种支付方式都使用的人数;(Ⅱ)从样本仅使用B 的学生中随机抽取1人,求该学生上个月支付金额大于2000元的概率;(Ⅲ)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用B 的学生中随机抽查1人,发现他本月的支付金额大于2000元.结合(Ⅱ)的结果,能否认为样本仅使用B 的学生中本月支付金额大于2000元的人数有变化?说明理由.16.【2019年北京理科17】改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:(0,1000] (1000,2000]大于2000仅使用A 18人 9人 3人 仅使用B10人14人1人(Ⅰ)从全校学生中随机抽取1人,估计该学生上个月A ,B 两种支付方式都使用的概率;(Ⅱ)从样本仅使用A 和仅使用B 的学生中各随机抽取1人,以X 表示这2人中上个月支付金额大于1000元的人数,求X 的分布列和数学期望;(Ⅲ)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A 的学生中,随机抽查3人,发现他们本月的支付金额都大于2000元.根据抽查结果,能否认为样本仅使用A 的学生中本月支付金额大于2000元的人数有变化?说明理由.17.【2018年北京理科17】电影公司随机收集了电影的有关数据,经分类整理得到下表: 电影类型 第一类 第二类 第三类 第四类 第五类 第六类 电影部数 140 50 300 200 800 510 好评率0.40.20.150.250.20.1好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.假设所有电影是否获得好评相互独立.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(Ⅲ)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等.用“ξk=1”表示第k类电影得到人们喜欢.“ξk=0”表示第k类电影没有得到人们喜欢(k=1,2,3,4,5,6).写出方差Dξ1,Dξ2,D ξ3,Dξ4,Dξ5,Dξ6的大小关系.18.【2018年北京文科17】电影公司随机收集了电影的有关数据,经分类整理得到下表:电影类型第一类第二类第三类第四类第五类第六类电影部数14050300200800510好评率0.40.20.150.250.20.1好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)随机选取1部电影,估计这部电影没有获得好评的概率;(Ⅲ)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)19.【2017年北京理科17】为了研究一种新药的疗效,选100名患者随机分成两组,每组各50名,一组服药,另一组不服药.一段时间后,记录了两组患者的生理指标x和y的数据,并制成如图,其中“*”表示服药者,“+”表示未服药者.(1)从服药的50名患者中随机选出一人,求此人指标y的值小于60的概率;(2)从图中A,B,C,D四人中随机选出两人,记ξ为选出的两人中指标x的值大于1.7的人数,求ξ的分布列和数学期望E(ξ);(3)试判断这100名患者中服药者指标y数据的方差与未服药者指标y数据的方差的大小.(只需写出结论)20.【2017年北京文科17】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40), (80)90],并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.21.【2016年北京理科16】A,B,C三个班共有100名学生,为调查他们的体育锻炼情况,通过分层抽样获得了部分学生一周的锻炼时间,数据如表(单位:小时):A班 6 6.5 7 7.5 8B班 6 7 8 9 10 11 12C班 3 4.5 6 7.5 9 10.5 12 13.5(Ⅰ)试估计C班的学生人数;(Ⅱ)从A班和C班抽出的学生中,各随机选取一个人,A班选出的人记为甲,C班选出的人记为乙.假设所有学生的锻炼时间相对独立,求该周甲的锻炼时间比乙的锻炼时间长的概率;(Ⅲ)再从A,B,C三班中各随机抽取一名学生,他们该周锻炼时间分别是7,9,8.25(单位:小时),这3个新数据与表格中的数据构成的新样本的平均数记为μ1,表格中数据的平均数记为μ0,试判断μ0和μ1的大小.(结论不要求证明)22.【2016年北京文科17】某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如图频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.23.【2015年北京理科16】A,B两组各有7位病人,他们服用某种药物后的康复时间(单位:天)记录如下:A组:10,11,12,13,14,15,16B组;12,13,15,16,17,14,a假设所有病人的康复时间相互独立,从A,B两组随机各选1人,A组选出的人记为甲,B组选出的人记为乙.(Ⅰ)求甲的康复时间不少于14天的概率;(Ⅱ)如果a=25,求甲的康复时间比乙的康复时间长的概率;(Ⅲ)当a为何值时,A,B两组病人康复时间的方差相等?(结论不要求证明)24.【2015年北京文科17】某超市随机选取1000位顾客,记录了他们购买甲、乙、丙、丁四种商品的情况,整理成如下统计表,其中“√”表示购买,“×”表示未购买.甲乙丙丁100√×√√217×√×√200√√√×300√×√×85√×××98×√××(1)估计顾客同时购买乙和丙的概率;(2)估计顾客在甲、乙、丙、丁中同时购买3种商品的概率;(3)如果顾客购买了甲,则该顾客同时购买乙、丙、丁中哪种商品的可能性最大?25.【2014年北京理科16】李明在10场篮球比赛中的投篮情况统计如下(假设各场比赛相互独立);场次投篮次数命中次数场次投篮次数命中次数主场12212客场1188主场21512客场21312主场3128客场3217主场4238客场41815主场52420客场52512(1)从上述比赛中随机选择一场,求李明在该场比赛中投篮命中率超过0.6的概率;(2)从上述比赛中随机选择一个主场和一个客场,求李明的投篮命中率一场超过0.6,一场不超过0.6的概率;(3)记x是表中10个命中次数的平均数,从上述比赛中随机选择一场,记X为李明在这场比赛中的命中次数,比较EX与x的大小(只需写出结论).26.【2014年北京文科18】从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:排号分组频数1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29[16,18)2合计100(Ⅰ)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(Ⅱ)求频率分布直方图中的a,b的值;(Ⅲ)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写结论)1.【北京市延庆区2023届高三一模】已知f(x)=1+C41x+C42x2+C43x3+C44x4,则f(2)等于()A.16B.80C.81D.2432.【北京市东城区2023届高三二模】某社区计划在端午节前夕按如下规则设计香囊:在基础配方以外,从佩兰、冰片、丁香、石菖蒲这四味中药中至少选择一味添加到香囊,则不同的添加方案有()A.13种B.14种C.15种D.16种3.【北京师范大学附属实验中学2023届高三三模】某辆汽车每次加油都把油箱加满,下表记录了该车相邻两次加油时的情况.注:“累计里程”指汽车从出厂开始累计行驶的路程在这段时间内,该车每100千米平均耗油量为()A.6升B.8升C.10升D.12升4.【中学生标准学术能力诊断性测试2023届高三上学期12月测试】“赛龙舟”是端午节的习俗之一,也是端午节最重要的节日民俗活动之一,某单位龙舟队欲参加端午节龙舟赛,参加训练的8名队员中有3人只会划左桨,3人只会划右桨,2人既会划左桨又会划右桨.现要选派3人划左桨、3人划右桨共6人去参加比赛,则不同的选派方法共有().A.26种B.31种C.36种D.37种5.【北京市第二中学2023届高三校模】市场上有甲、乙、丙三家工厂生产的同一品牌产品,已知三家工厂的市场占有率分别为30%,20%,50%,且三家工厂的次品率分别为3%,3%,1%,则市场上该品牌产品的次品率为()A.0.01B.0.02C.0.03D.0.056.【北京市海淀区2023届高三二模】芯片是科技产品中的重要元件,其形状通常为正方形.生产芯片的原材料中可能会存在坏点,而芯片中出现坏点即报废,通过技术革新可以减小单个芯片的面积,这样在同样的原材料中可以切割出更多的芯片,同时可以提高芯片生产的产品良率.产品良率=切割得到的无坏点的芯片数切割得到的所有芯片数×100%.在芯片迭代升级过程中,每一代芯片的面积为上一代的12.图1是一块形状为正方形的芯片原材料,上面有4个坏点,若将其按照图2的方式切割成4个大小相同的正万形,得到4块第3代芯片,其中只有一块无坏点,则由这块原材料切割得到第3代芯片的产品良率为25%.若将这块原材料切割成16个大小相同的正方形,得到16块第5代芯片,则由这块原材料切割得到第5代芯片的产品良率为()A.50%B.62.5%C.75%D.87.5%7.【北京市西城区2023届高三二模】某放射性物质的质量每年比前一年衰减5%,其初始质量为m0,10年后的质量为m′,则下列各数中与m′m0最接近的是()A.70%B.65%C.60%D.55%8.【北京市海淀区北京大学附属中学2023届高三三模】现从3名男同学和2名女同学中选取两人加入“数学兴趣小组”,用A表示事件“抽到两名同学性别相同”,B表示事件“抽到两名女同学”,则在已知A事件发生的情况下B事件发生的概率即P(B|A)=()A.14B.13C.25D.129.【北京大兴精华学校2023届高三高考适应性测试】在某区高三年级举行的一次质量检测中,某学科共有3000人参加考试.为了解本次考试学生的成绩情况,从中抽取了部分学生的成绩(成绩均为正整数,满分为100分)作为样本进行统计,样本容量为n.按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出频率分布直方图(如图所示).已知成绩落在[50,60)内的人数为16,则下列结论正确的是()A.样本容量n=1000B.图中x=0.025C.估计全体学生该学科成绩的平均分为70.6分D.若将该学科成绩由高到低排序,前15%的学生该学科成绩为A等,则成绩为78分的学生该学科成绩肯定不是A等10.【北京市第一零九中学2023届高三高考冲刺】有甲、乙、丙、丁、戊5名同学站成一排参加文艺汇演,若甲不站在两端,丙和丁相邻,则不同排列方式共有()A.12种B.24种C.32种D.40种11.【北京市丰台区2023届高三二模】某地区教育研究部门为了解当前本地区中小学教师在教育教学中运用人工智能的态度、经验、困难等情况,从该地区2000名中小学教师中随机抽取100名进行了访谈.在整理访谈结果的过程中,统计他们对“人工智能助力教学”作用的认识,得到的部分数据如下表所示:假设用频率估计概率,且每位教师对“人工智能助力教学”作用的认识相互独立.(1)估计该地区中小学教师中认为人工智能对于教学“没有帮助”的人数;(2)现按性别进行分层抽样,从该地区抽取了5名教师,求这5名教师中恰有1人认为人工智能对于教学“很有帮助”的概率;(3)对受访教师关于“人工智能助力教学”的观点进行赋分:“没有帮助”记0分,“有一些帮助”记2分,“很有帮助”记4分.统计受访教师的得分,将这100名教师得分的平均值记为μ0,其中年龄在40岁以下(含40岁)教师得分的平均值记为μ1,年龄在40岁以上教师得分的平均值记为μ2,请直接写出μ0,μ1,μ2的大小关系.(结论不要求证明)12.【北京市2023届高三高考模拟预测考试】2023世界人工智能大会拟定于七月初在我国召开,我国在人工智能芯片、医疗、自动驾驶等方面都取得了很多成就.为普及人工智能相关知识,红星中学组织学生参加“人工智能”知识竞赛,竞赛分为理论知识竞赛、实践能力竞赛两个部分,两部分的成绩分为三档,分别为基础、中等、优异.现从参加活动的学生中随机选择20位,统计其两部分成绩,成绩统计人数如表:(1)若从这20位参加竞赛的学生中随机抽取一位,抽到理论或实践至少一项成绩为优异的学生概率为1.求a,2b的值;(2)在(1)的前提下,用样本估计总体,从全市理论成绩为优异的学生中,随机抽取2人,求至少有一个人实践能力的成绩为优异的概率;(3)若基础、中等和优异对应得分为1分、2分和3分,要使参赛学生理论成绩的方差最小,写出b的值.(直接写出答案)13.【北京市第四中学2023届高三数学保温测试】某中学为了解高二年级中华传统文化经典阅读的情况,从高二年级随机抽取10名学生进行了两轮测试,并把两轮测试成绩的平均分作为该名学生的考核成绩.记录的数据如下:(1)从该校高二年级随机选取一名学生,试估计这名学生考核成绩大于90分的概率;(2)为进一步研究这10名同学的成绩,从考核成绩小于90分的学生中随机抽取两人,记这两人中两轮测试至少有一次大于90分的人数为X,求X的分布列与数学期望;(3)记抽取的10名学生第一轮测试的平均数和方差分别为x̅1,s12,考核成绩的平均数和方差分别为x̅2,s22,试比较x̅1与x2,s12与s22的大小.(只需写出结论)14.【2023届北京市海淀区教师进修学校附属实验学校高考三模】2023年9月23日至2023年10月8日,第19届亚运会将在中国杭州举行.杭州某中学高一年级举办了“亚运在我心”的知识竞赛,其中1班,2班,3班,4班报名人数如下:该年级在报名的同学中按分层抽样的方式抽取10名同学参加竞赛,每位参加竞赛的同学从预设的10个题目中随机抽取4个作答,至少答对3道的同学获得一份奖品.假设每位同学的作答情况相互独立.(1)求各班参加竞赛的人数;(2)2班的小张同学被抽中参加竞赛,若该同学在预设的10个题目中恰有3个答不对,记他答对的题目数为X,求X的分布列及数学期望;(3)若1班每位参加竞赛的同学答对每个题目的概率均为1,求1班参加竞赛的同学中至少有1位同学获得奖3品的概率.15.【北京市西城区2023届高三二模】体重指数(Body Mass Index,简称BMI)是国际上衡量人体胖瘦程度的一项常用指标.已知BMI=W,其中W表示体重(单位:kg),H表示身高(单位:m).对成人,若BMIH2≥28,则身体处于肥胖状态.某企业为了解员工的身体状况,从全体员工中随机抽取30人,测量他们的体重(单位:kg)和身高(单位:cm),得到如下散点图(图中曲线表示BMI=28时体重和身高的关系),假设用频率估计概率.(1)该企业员工总数为1500人,试估计该企业员工身体处于肥胖状态的人数;(2)从该企业身体处于肥胖状态的员工中随机抽取3人,设其中体重在80kg以上的人数为X,估计X的分布列和数学期望E(X);(3)从样本中身高大于或等于a( a∈{155,160,165,170,175,180} )的员工中随机抽取1人,若其身体处于肥胖状态的概率小于10%,写出a的所有可能取值.(结论不要求证明)16.【北京市密云区2023届高三考前保温练习(三模)】为了解某地区居民每户月均用电情况,采用随机抽样的方式,从该地区随机调查了100户居民,获得了他们每户月均用电量的数据,发现每户月均用电量都在50~350kW⋅h之间,进行适当分组后(每组为左闭右开区间),得到如下频率分布直方图:(1)记频率分布直方图中从左到右的分组依次为第1组,第2组,…,第6组.从第5组,第6组中任取2户居民,求他们月均用电量都不低于300kW⋅h的概率;(2)从该地区居民中随机抽取3户,设月均用电量在50~150kW⋅h之间的用户数为X,以频率估计概率,求X 的分布列和数学期望E(X);(3)该地区为提倡节约用电,拟以每户月均用电量为依据,给该地区月均用电量不少于w kW⋅h的居民用户每户发出一份节约用电倡议书,且发放倡议书的数量为该地区居民用户数的2%.请根据此次调查的数据,估计w应定为多少合适?(只需写出结论).17.【北京航空航天大学实验学校中学部2023届高三三模】某汽车专卖店试销A,B,C三种品牌的新能源汽车,销售情况如下表所示:(1)从前三周随机选一周,若A品牌销售量比C品牌销售量多,求A品牌销售量比B品牌销售量多的概率;(2)为跟踪调查新能源汽车的使用情况,根据销售记录,从该专卖店第二周和第三周售出的新能源汽车中分别随机抽取一台.求抽取的两台汽车中A品牌的台数X的分布列和数学期望;(3)直接写出一组A4,B4,C4的值,使得表中每行数据方差相等.18.【北京市丰台区第二中学2023届高三三模】某企业因技术升级,决定从2023年起实现新的绩效方案.方案起草后,为了解员工对新绩效方案是否满意,决定采取如下“随机化回答技术”进行问卷调查:一个袋子中装有三个大小相同的小球,其中1个黑球,2个白球.企业所有员工从袋子中有放回的随机摸两次球,每次摸出一球.约定“若两次摸到的球的颜色不同,则按方式一回答问卷,否则按方式二回答问卷”.方式一:若第一次摸到的是白球,则在问卷中画“○”,否则画“×”;方式二:若你对新绩效方案满意,则在问卷中画“○”,否则画“×”.当所有员工完成问卷调查后,统计画○,画×的比例.用频率估计概率,由所学概率知识即可求得该企业员工×100%.对新绩效方案的满意度的估计值.其中满意度=企业所有对新绩效方案满意的员工人数企业所有员工人数(1)求每名员工两次摸到的球的颜色不同的概率(2)若该企业某部门有9名员工,用X表示其中按方式一回答问卷的人数,求X的数学期望;(3)若该企业的所有调查问卷中,画“○”与画“×”的比例为4:5,试估计该企业员工对新绩效方案的满意度. 19.【北京市第一零九中学2023届高三高考冲刺】甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军,已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.(1)求甲学校获得冠军的概率;(2)用X表示乙学校的总得分,求X的分布列与期望.(3)设用Y表示甲学校的总得分,比较DX和DY的大小(直接写出结果).20.【北京市门头沟区2023届高三综合练习】周末李梦提出和父亲、母亲、弟弟进行羽毛球比赛,李梦与他。
概率统计(文科)

文科数学《统计与概率》核心知识点与参考练习题一、统计(核心思想:用样本估计总体)1.抽样(每个个体被抽到的概率相等)(1)简单随机抽样:抽签法与随机数表法(2)系统抽样(等距抽样)(3)分层抽样2.用样本估计总体:(1)样本数字特征估计总体:众数、中位数、平均数、方差与标准差(2)样本频率分布估计总体:频率分布直方图与茎叶图3.变量间的相关关系:散点图、正相关、负相关、回归直线方程(最小二乘法)4.独立性检验二、概率(随机事件发生的可能性大小)1.基本概念(1)随机事件A的概率P(A)e(0,1)(2)用随机模拟法求概率(用频率来估计概率)(3)互斥事件(对立事件)2.概率模型(1)古典概型(有限等可能)(2)几何概型(无限等可能)三、参考练习题1•某校高一年级有900名学生,其中女生400名•按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为.2•某学校高一、高二、高三年级的学生人数之比是3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则该从高二年级抽取名学生.3.某校老年、中年和青年教师的人数见右表,米用分层抽样的方法调查教类另U人数师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年老年教师900教师人数为中年教师1800 4.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是青年教师1600 5•若1,2,3,4,m这五个数的平均数为3,则这五个数的标准差为•合计4300 6•重庆市2013年各月的平均气温(°C)数据的茎叶图如右图:o吕9则这组数据的中位数是•1252003127•某高校调查了200名学生每周的晚自习时间(单位:小时),制成了如图所示的频率分布直方图,其中晚自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.1408.(2016四川文)我国是世界上严重缺水的国豕,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图的频率分布直方图.(II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(III)估计居民月均用水量的中位数.0Q.511622.533.544.6月满意度评分低于70分 70分到89分不低于90分 满意度等级不满意满意非常满意A 地区用户满意度评分的频率分布直方司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表.(II) 根据用户满意度评分,将用户的满意度分为三个等级:试估计哪个地区用户的满意度等级为不满意的概率大?说明理由.10.(2014安徽文)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(I) 应收集多少位女生的样本数据?(II) 根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(&10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;满意度评分分组 [50,60) [60,70) [70,80) [80,90) [90,100] 频数 2 8 14 10 6B 地区用户满意度评分的频数分布表 (I)作出B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分 的平均值及分散程度(不要求计算出具 体值,给出结论即可);B 地区用户满意度评分的频率分布直方图(III)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体 育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间 与性别有关”.n (ad 一bc\附:尺2步畝+d 儿+枫+d )P (2>k)0.10 0.05 0.01 0.005 k2.7063.8416.6357.8799.(2015全国II 文)某公03511.(2014全国I文)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(I)在下表中作出这些数据的频率分布直方图: 12.(2014广东文)某车间20名工人年龄数据如下表: 年皤7舁工人執7人1912日329330531斗323401昔讦20(I)求这20名工人年龄的众数与极差;(II)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(III)求这20名工人年龄的方差.13.(2016江苏)将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是.14.___________________________________________________ 从甲、乙等5名学生中随机选出2人,则甲被选中的概率为(II)估计这种产品质量指标值的平均数和方差(同一组中的数据用该组区间的中点值作代表);15.(2016全国乙卷文)为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是.(III)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95 16.(2016全国丙卷文)小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M、I、N中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是.的产品至少要占全部产品80%”的规定?17. (2016天津文)甲、乙两人下棋,两人下成和棋的概率为1,甲获胜的概率是-,则甲不23输的概率为.18. 已知5件产品中有2件次品,其余为合格品•现从这5件产品中任选2件,恰有一件次品 的概率为.24. 如图,在边长为1的正方形中随机撒1000粒豆子,有180粒落到阴影部分,据此估计阴19.某单位N 名员工参加“社区低碳你我他”活动•他们的年龄在25岁至50岁之间.按年龄分组并得到的频率分布直方图如图所示.下表是年龄的频数分布表.区间 [25,30) [30,35) [35,40) [40,45) [45,50] 人数25 ab5丰25. 为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm )174 176 176 176 178 儿子身高y (cm )17517517617717722. ____________________________________________ 在区间[-2,3]上随机选取一个数x ,则x <1的概率为23. ___________________________________ 若将一个质点随机投入如图所示的长方形ABCD 中,其中AB=2,BC=1,则质点落在以AB 为直径的半圆内的概率是.(I )求y 关于t 的回归方程y =bt+a ;(II )利用(I )中的回归方程,分析2011年至2015年该地区城乡居民储蓄存款的变化情4550年龄/驴(I )求正整数a ,b ,N 的值;(II )现要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,则年龄在第1,2,3组的人数分别是多少?(III )在(2)的条件下,从这6人中随机抽取2人参加社区宣传交流活动,求恰有1人在第3组的概率. 20.(2016全国丨文)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( A.1B.1C.-D.- 21.(2016全国II 文)某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒•若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为()10 B.5D.—10 则y 对X 的线性回归方程为()A .y =x 一1B .y =x +1C .y =88+-x广告费用x (万元)4 2 35 销售额y (万元)4926395426.某产品的广告费用x 与销售额y 的统计数据如下:D .y =176根据上表可得回归方程y =bx+a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为 A .63.6万元B .65.5万元C .67.7万元D .72.0万元27.随着我国经济的发展,居民的储蓄存款逐年增长•设某地区城乡居民人民币储蓄存款(年 底余额)如下表:年份 2011 2012 2013 2014 2015 时间代号t1 2 3 4 5 储蓄存款y (千亿兀)567810年(1=6)的人民币储蓄存款.V--‘’ty-nty _‘附:回归方程$=几+<2中,,a=y-bt.乙/2-nt 2i=l28.甲、乙两所学校高三年级分别有1200人、1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样的方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下:乙校:(1)计算兀y 的值;况,并 预测 该地 区 2016P^Ki>k)0.10 0.05 0.010 k2.7063.8416.635参考数据与(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率; (3)由以上统计数据填写下面2X2列联表,并判断是否有90%的把握认为两所学校的数学成绩有差异.公式:由列联表中数(a+b)(?+d)C+c)a+d),临界值表:29.—次考试中,5名学生的数学、物理成绩如下表所示:学生 A B C D E 数学成绩兀(分) 89 91 93 95 97 物理成绩y (分)8789899293(1)要从5名学生中选2人参加一项活动,求选中的学生中至少有一人的物理成绩高于90 分的概率;(2 )性回归100名市民,按年龄情况进行统计得到下面的频率分布表和频率分布直方图.0.08°1—r---—r方程(系数精确到0.01).''''(1)求频率分布表中a、b的值,并补全频率分布直方图,再根据频率分布直方图估计有意购车的这500名市民的平均年龄;31.(2016新课标II)某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:附:回归直线的方程是:y=bx+a上年度出险次数0 1 2 3 4 >5保费0.85a a 1.25a 1.5a 1.75a2a其中b=㈠(j——,a=y-b x;设该险种一续保人一年内出险次数与相应概率如下:ii=130•为调查市民对汽车品牌的认可度,在秋季车展上,从有意购车的500名市民中,随机抽取一年内出险次数0 1 2 3 4 >5 概率0.30 0.15 0.20 0.20 0.10 0.05(I)求一续保人本年度的保费高于基本保费的概率;32.袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,从中一次随机摸出2只球,则这2只球颜色不同的概率为.33.现有6道题,其中4道甲类题,2道乙类题,某同学从中任取2道题解答•试求:(1)所取的2道题都是甲类题的概率;(2)所取的2道题不是同一类题的概率.34.某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(I)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);A地区B帥反4567S9。
完整版)统计概率高考文科复习专题

完整版)统计概率高考文科复习专题高考文科复专题:统计与概率知识点梳理1.随机抽样简单随机抽样的特点是从总体中逐个抽取,适用于总体中个体较少的情况。
系统抽样的特点是将总体均分成几部分,按照事先确定的规则在各部分中抽取,适用于总体中个体数较多的情况。
分层抽样的特点是将总体分成几层,分层进行抽取,适用于总体由差异明显的几部分组成的情况。
2.常用的统计图表频率分布直方图的特点是小长方形的面积等于组距乘以频率,各小长方形的面积之和等于1,小长方形的高等于频率,所有小长方形的高的和为组距。
茎叶图在样本数据较少时,用茎叶图表示数据的效果较好。
3.用样本的数字特征估计总体的数字特征众数是样本数据中出现次数最多的数据,中位数是将数据按大小依次排列,处于中间位置的一个数据或最中间两个数据的平均数,平均数是样本数据的算术平均数。
频率分布直方图的最高小长方形底边中点的横坐标是众数,将频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标是中位数,每个小矩形的面积乘以小矩形底边中点的横坐标之和是平均数。
4.变量的相关性与最小二乘法线性回归方程相关关系包括正相关和负相关,相关系数用来衡量变量之间的相关程度。
最小二乘法是对于给定的一组样本数据(x1,y1),(x2,y2),…,(xn,yn),得到线性回归方程y=bx+a的方法。
5.独立性检验对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联表可以用K2检验来检验其独立性。
例题:某地区有小学21所,中学14所,大学7所,现采取分层抽样的方法从这些学校中抽取6所学校对学生进行视力调查。
I)应从小学、中学、大学中分别抽取2、2、2所学校。
II)若从抽取的6所学校中随机抽取2所学校做进一步数据分析,所有可能的抽取结果为21种。
2.(2012·___为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名。
下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高考文科复习专题——统计与概率
知识点梳理
1. 随机抽样
(1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少.
(2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2. 常用的统计图表
(1)频率分布直方图 ①小长方形的面积=组距×频率组距=频率;
②各小长方形的面积之和等于1;
③小长方形的高=频率组距,所有小长方形的高的和为1
组距
.
(2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3. 用样本的数字特征估计总体的数字特征
(1)众数、中位数、平均数
(2)方差:s 2=1
n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].
标准差: s =
1
n
[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 4. 变量的相关性与最小二乘法线性回归方程.
(1)相关关系的概念、正相关和负相关、相关系数.
(2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),得到线性回归方程y ^
=b ^
x +a ^
的方法叫做最小二乘法.
5.独立性检验
对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联表是:
y1y2总计
x1 a b a+b
x2 c d c+d
总计a+c b+d n
则K2=n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
(其中n=a+b+c+d为样本容量).
1.某地区有小学21所,中学14所,大学7所,现采取分层抽样的方法从这些学校中抽取6所学校对学生进行视力调查。
(I)求应从小学、中学、大学中分别抽取的学校数目。
(II)若从抽取的6所学校中随机抽取2所学校做进一步数据分析,
(1)列出所有可能的抽取结果;
(2)求抽取的2所学校均为小学的概率。
2.(2012·辽宁)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.
(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?
非体育迷体育迷合计
男
女
合计
(2)2名女性,若
从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.
附:
P(K2≥k)0.050.01
k 3.841 6.635。