高中数学统计概率
高中数学统计与概率知识点归纳

高中数学统计与概率知识点归纳高中数学中的统计与概率是两个非常重要的知识点,它们在日常生活和工作中也具有广泛的应用价值。
本文将对这些知识点进行归纳和总结,以便读者更好地理解和掌握。
首先,让我们来看看统计。
统计是研究如何从数据中获取有用信息的学科。
在高中数学中,统计的主要内容包括以下三个方面:1、概率分布:这是统计的基础知识,它描述了各种可能结果出现的概率。
例如,投掷一枚硬币,正面朝上的概率为0.5,反面朝上的概率为0.5。
2、参数估计:参数估计是通过样本数据来估计总体参数的方法。
例如,通过样本的平均值来估计总体的平均值。
3、假设检验:假设检验是用来检验一个假设是否成立的统计学方法。
例如,我们想要检验某种新药的疗效是否优于安慰剂,可以通过比较实验组和对照组的数据来进行假设检验。
接下来,让我们来看看概率。
概率是描述事件发生可能性大小的数学工具。
在高中数学中,概率的主要内容包括以下三个方面:1、事件的关系和运算:事件的关系包括互斥、独立、不独立等,事件之间的运算包括并、交、差等。
2、概率的性质和计算:概率的性质包括加法定理、乘法定理、全概率公式等,概率的计算方法包括直接计算、利用公式计算等。
3、概率分布:概率分布描述了随机变量的取值概率,例如伯努利分布、二项分布、正态分布等。
在应用方面,统计与概率的知识点可以应用于很多领域,例如金融、医学、工业、农业等。
例如,在金融领域,可以通过统计方法来分析股票数据的规律和趋势;在医学领域,可以通过概率方法来预测疾病的发病率和死亡率。
总之,统计与概率是高中数学中非常重要的知识点,它们在日常生活和工作中也具有广泛的应用价值。
通过对这些知识点的归纳和总结,我们可以更好地理解和掌握它们,从而更好地应用于实际问题的解决中。
高中数学概率与统计知识点总结高中数学:概率与统计知识点总结一、前言在现实生活中,我们经常需要处理各种与概率和统计相关的问题。
例如,在掷骰子时计算点数、在班级中选取学生、或者在评估天气预报的准确性。
如何解决高中数学中的概率与统计难题

如何解决高中数学中的概率与统计难题高中数学中的概率与统计难题是让许多学生头疼的问题之一。
概率与统计是数学的重要分支,也是日常生活中经常会遇到的概念。
解决高中数学中的概率与统计难题需要一定的策略和技巧,本文将介绍几种解决高中数学中的概率与统计难题的方法。
以下是一些建议。
1. 理解基本概念首先,要解决高中数学中的概率与统计难题,必须对基本概念有清晰的理解。
例如,了解事件、样本空间、随机变量、概率、期望值等基本概念是非常重要的。
只有掌握了这些基本概念,才能更好地理解与解决难题。
2. 掌握计算方法在解决概率与统计难题时,掌握相关的计算方法是很关键的。
例如,计算置信区间、计算概率、计算期望值等。
要做到这一点,就需要掌握一些公式和计算技巧。
此外,要熟悉使用计算器或电脑软件进行计算。
3. 勤练习概率与统计是一门需要大量练习才能掌握的学科。
通过大量的练习,可以巩固基本概念、学会灵活运用各种计算方法,提高解题能力。
可以寻找一些相关的练习题,根据难度逐渐增加,逐步提高自己的解题水平。
4. 学会归类与总结归类和总结是解决概率与统计难题的重要方法。
通过对一类题目进行归纳整理,找出问题的共性和规律,可以更好地解决类似的难题。
在解题过程中,可以总结一些常用的方法和技巧,以备将来效仿。
5. 多角度思考解决概率与统计难题时,多角度思考是非常有帮助的。
有时候,一个问题可以从多个角度进行思考和解决。
尝试从不同的角度入手,换个思路来解决问题,可能会找到一个更简单或更直接的解决办法。
6. 查找资料与请教他人当遇到较难的概率与统计难题时,可以查找相关的学习资料,寻求问题的解答和解释。
可以向老师、同学或其他专业人士请教,听取他们的经验和建议。
他们可能会提供一些有用的思路和方法,帮助解决难题。
总结起来,解决高中数学中的概率与统计难题需要掌握基本概念、计算方法,勤加练习,学会归类与总结,多角度思考,并及时查找资料与请教他人。
通过这些方法和策略,相信能够有效地解决高中数学中的概率与统计难题,提高数学学习的水平。
高中数学中的概率统计计算期望与方差的技巧

高中数学中的概率统计计算期望与方差的技巧概率统计是高中数学中的重要内容,计算期望与方差是其中的关键技巧。
本文将介绍几种常见的计算期望与方差的技巧,以帮助读者更好地理解和应用这些知识。
一、离散型随机变量的期望与方差计算对于离散型随机变量X,其概率分布列为P(X=x),而期望和方差的计算公式如下:1. 期望计算期望E(X)表示随机变量X的平均值,计算公式为:E(X) = Σ[x * P(X=x)]其中,Σ表示对所有可能取值的求和。
通过遍历所有可能取值,将取值与其对应的概率相乘,再求和,即可得到期望值。
2. 方差计算方差Var(X)表示随机变量X的离散程度,计算公式为:Var(X) = Σ[(x - E(X))^2 * P(X=x)]同样,通过遍历所有可能取值,将每个取值减去期望值,再平方,再与其对应的概率相乘,最后再求和,即可得到方差值。
这种计算方法适用于离散型随机变量的期望和方差计算,例如投掷一枚骰子的结果、抽取一副扑克牌的点数等情况。
二、连续型随机变量的期望与方差计算对于连续型随机变量X,其概率密度函数为f(x),而期望和方差的计算公式如下:1. 期望计算期望E(X)的计算公式为:E(X) = ∫(x * f(x))dx其中,∫表示对整个定义域的积分。
通过对概率密度函数乘以x后再积分,即可得到期望值。
2. 方差计算方差Var(X)的计算公式为:Var(X) = ∫[(x - E(X))^2 * f(x)]dx同样,通过对概率密度函数乘以(x - E(X))的平方后再积分,即可得到方差值。
这种计算方法适用于连续型随机变量的期望和方差计算,例如正态分布、指数分布等情况。
三、应用技巧下面将介绍一些计算期望与方差时的常用技巧:1. 期望的线性性质如果X和Y是两个随机变量,a和b为常数,则有:E(aX + bY) = aE(X) + bE(Y)这是期望的线性性质,利用这个性质可以简化复杂随机变量的期望计算。
高中数学必修二统计概率知识点总结

必修第二册第九章 统计知识点总结知识点一:简单随机抽样1. 全面调查和抽样调查2.简单随机抽样的概念放回简单随机抽样不放回简单随机抽样一般地,设一个总体含有N(N 为正整数)个个体,从中逐个抽取n (1≤n<N)个个体作为样本如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本3.抽签法先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌.最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.调查方式全面调查(普查)抽样调查定义对每一个调查对象都进行调查的方法,称为全面调查,又称普查根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为 抽样调查相关概念总体:在一个调查中,我们把调查对象的全体称为总体.个体:组成总体的每一个调查对象称为个体样本:把从总体中抽取的那部分个体 称为样本.样本量:样本中包含的个体数称为 样本量4.随机数法(1)定义:先把总体中的个体编号,用随机数工具产生已编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,直到抽足样本所需要的个体数.(2)产生随机数的方法:(i)用随机试验生成随机数;(ii)用信息技术生成随机数.5.总体均值和样本均值(1)总体均值:一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,Y N,则称Y=Y1+Y2+⋯+Y NN =1N∑i=1NY i为总体均值,又称总体平均数.(2)总体均值加权平均数的形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数f i(i=1,2,…,k),则总体均值还可以写成加权平均数的形式Y=1N ∑i=1kf i Y i.(3)如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,y n,则称y=y1+y2+⋯+y nn =1n∑i=1ny i为样本均值,又称样本平均数.6.分层随机抽样的相关概念(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.(3)进行分层随机抽样的相关计算时,常用到的关系①样本容量n总体容量N =该层抽取的个体数该层的个体数;②总体中某两层的个体数之比等于样本中这两层抽取的个体数之比;③样本的平均数和各层的样本平均数的关系:w=mm+n x+nm+ny=MM+Nx+NM+Ny.1.画频率分布直方图的步骤(1)求极差:极差为一组数据中最大值与最小值的差;(2)决定组距与组数:当样本容量不超过100时,常分成5-12组,为方便起见,一般取等长组距,并且组距应力求“取整”;(3)将数据分组;(4)列频率分布表:一般分四列:分组、频数累计、频数、频率.其中频数合计应是样本容量,频率合计是⑥1;.(5)画频率分布直方图:横轴表示分组,纵轴表示频率组距=频率,各小长方形的面积的总和等于1.小长方形的面积=组距×频率组距2.其他统计图表统计图表主要应用扇形图直观描述各部分数据在全部数据中所占的比例条形图和直方图直观描述不同类别或分组数据的频数和频率反映统计对象在不同时间(或其他合适情形)的发展折线图变化情况1.第p百分位数:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.3.四分位数:第25百分位数,第50百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.知识点四:总体集中趋势的估计1.众数、中位数和平均数的定义(1)众数:一组数据中出现次数最多的数.(2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果这组数据是偶数个,则取中间两个数据的平均数.(3)平均数:一组数据的和除以数据个数所得到的数.2.众数、中位数、平均数与频率分布直方图的关系(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)众数:众数是最高小矩形底边的中点所对应的数据.2.众数、中位数、平均数与频率分布直方图的关系众数众数是最高小长方形底边的中点所对应的数据,表示样本数据的中心值中位数①在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差;②表示样本数据所占频率的等分线平均数①平均数等于每个小长方形的面积乘小长方形底边中点的横坐标之和;②平均数是频率分布直方图的重心,是频率分布直方图的平衡点1.一组数据x1,x2,…,x n的方差和标准差数据x1,x2,…,x n的方差为1n ∑i=1n(x i-x)2=1n∑i=1nx i2-x2,标准差为√1n∑i=1n(x i-x)2.2.总体方差和总体标准差(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,Y N,总体的平均数为Y,则称S2= 1N ∑i=1N(Y i-Y)2为总体方差,S=√S2为总体标准差.(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数为f i(i=1,2,…,k),则总体方差为S2= 1N ∑i=1kf i(Y i-Y)2.3.样本方差和样本标准差如果一个样本中个体的变量值分别为y1,y2,…,y n,样本平均数为y,则称s2= 1n ∑i=1n(y i-y)2为样本方差,s=√s2为样本标准差.4.标准差的意义标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.5.分层随机抽样的方差设样本容量为n,平均数为x,其中两层的个体数量分别为n1,n2,两层的平均数分别为x1,x2,方差分别为s12,s22,则这个样本的方差为s2=n1n [s12+(x1-x)2]+n2n[s22+(x2-x)2].必修第二册第十章概率知识点总结知识点一:有限样本空间与随机事件1.随机试验的概念和特点(1)随机试验:我们把对随机现象的实现和对它的观察称为随机试验,简称试验,常用字母E表示.(2)随机试验的特点:(i)试验可以在相同条件下重复进行;(ii)试验的所有可能结果是明确可知的,并且不止一个;(iii)每次试验总是恰好出现这些可能结果中的一个,但事先不能确定出现哪一个结果.2.样本点和样本空间定义字母表示样本点我们把随机试验E的每个可能的基本结果称为样本点用ω表示样本点样本空间全体样本点的集合称为试验E的样本空间用Ω表示样本空间有限样本空间如果一个随机试验有n个可能结果ω1,ω2,…,ωn,则称样本空间Ω={ω1,ω2,…,ωn}为有限样本空间Ω={ω1,ω2,…,ωn}3.事件的类型我们将样本空间Ω的子集称为随机事件,简称事件,并把只包含一个样本点的事件称为基本事件.随机事件一般用大写字母A,B,C,…表示.在每次试验中,当且仅当A中某个样本点出现时,称为事件A发生.Ω作为自身的子集,包含了所有的样本点,在每次试验中总有一个样本点发生,所以Ω总会发生,我们称Ω为必然事件.而空集⌀不包含任何样本点,在每次试验中都不会发生,我们称⌀为不可能事件.必然事件与不可能事件不具有随机性.为了方便统一处理,将必然事件和不可能事件作为随机事件的两个极端情形.这样,每个事件都是样本空间Ω的一个子集.知识点二:事件的关系和运算1.包含关系定义一般地,若事件A 发生,则事件B 一定发生,我们就称事件B 包含事件A(或事件A 包含于事件B)含义 A 发生导致B 发生 符号表示B ⊇A(或A ⊆B)图形表示特殊情形如果事件B 包含事件A,事件A 也包含事件B,即B ⊇A 且A ⊇B,则称事件A 与事件B 相等,记作A=B2.并事件(和事件)定义一般地,事件A 与事件B 至少有一个发生,这样的一个事件中的样本点或者在事件A 中,或者在事件B 中,我们称这个事件为事件A 与事件B 的并事件(或 和事件)含义 A 与B 至少有一个发生符号表示A ∪B(或A+B)图形表示3.交事件(积事件)定义一般地,事件A 与事件B 同时发生,这样的一个事件中的样本点既在事件A中,也在事件B 中,我们称这样的一个事件为事件A 与事件B 的交事件(或积 事件)含义 A 与B 同时发生 符号表示A ∩B(或AB)图形表示4.互斥(互不相容)一般地,如果事件A与事件B不能同时发生,也就是说A∩B是一个不可能定义事件,即A∩B=⌀,则称事件A与事件B互斥(或互不相容)含义A与B不能同时发生符号表示A∩B=⌀图形表示5.互为对立一般地,如果事件A与事件B在任何一次试验中有且仅有一个发生,即A∪B=定义Ω,且A∩B=⌀,那么称事件A与事件B互为对立.事件A的对立事件记为A 含义A与B有且仅有一个发生符号表示A∩B=⌀,且A∪B=Ω图形表示6.清楚随机事件的运算与集合运算的对应关系有助于解决此类问题.符号事件的运算集合的运算A 随机事件集合A A的对立事件A的补集AB 事件A与B的交事件集合A与B的交集A∪B 事件A与B的并事件集合A与B的并集知识点三:古典概型1.古典概型的定义试验具有如下共同特征:(1)有限性:样本空间的样本点只有有限个;(2)等可能性:每个样本点发生的可能性相等.我们将具有以上两个特征的试验称为古典概型试验,其数学模型称为古典概率模型,简称古典概型.2.古典概型的概率计算公式一般地,设试验E是古典概型,样本空间Ω包含n个样本点,事件A包含其中的k个样本点,则定义事件A的概率P(A)= kn =n(A)n(Ω),其中n(A)和n(Ω)分别表示事件A和样本空间Ω包含的样本点个数.知识点四:概率的基本性质1.概率的基本性质性质1 对任意的事件A,都有P(A)≥0.性质2 必然事件的概率为1,不可能事件的概率为0,即P(Ω)=1,P(⌀)=0.性质3 如果事件A与事件B互斥,那么P(A∪B)=P(A)+P(B).性质4 如果事件A与事件B互为对立事件,那么P(B)=1-P(A),P(A)=1-P(B).性质5 如果A⊆B,那么P(A)≤P(B).性质6 设A,B是一个随机试验中的两个事件,我们有P(A∪B)=P(A)+P(B)-P(A∩B).知识点五:事件的相互独立性1.相互独立事件的定义:对任意两个事件A与B,如果P(AB)=P(A)P(B)成立,则称事件A 与事件B相互独立,简称为独立.2.相互独立事件的性质:当事件A,B相互独立时,则事件A与事件B相互独立,事件A与事件B相互独立,事件A与事件B相互独立.【提示】公式P(AB)=P(A)P(B)可以推广到一般情形:如果事件A1,A2,…,A n相互独立,那么这n个事件同时发生的概率等于每个事件发生的概率的积,即P(A1A2·…·A n)=P(A1)P(A2)·…·P(A n).3. 两个事件是否相互独立的判断方法(1)直接法:由事件本身的性质直接判定两个事件发生是否相互影响.(2)公式法:若P(AB)=P(A)P(B),则事件A,B为相互独立事件.4.求相互独立事件同时发生的概率的步骤:①首先确定各事件之间是相互独立的.②求出每个事件的概率,再求积.5.事件间的独立性关系已知两个事件A,B相互独立,它们的概率分别为P(A),P(B),则有事件表示概率A,B同时发生AB P(A)P(B)A,B都不发生A B P(A)P(B)A,B恰有一个发生(A B)∪(A B) P(A)P(B)+P(A)P(B)A,B中至少有一个发生(A B)∪(A B)∪(AB) P(A)P(B)+P(A)P(B)+P(A)P(B)A,B中至多有一个发生(A B)∪(A B)∪(A B) P(A)P(B)+P(A)P(B)+P(A)P(B)。
高中数学概率统计(含详细答案)

1.某初级中学共有学生2000名,各年级男、女生人数如下表:已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19. (1)求x 的值;(2)现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名? (3)已知y ≥245,z ≥245,求初三年级中女生比男生多的概率. 解:(1)0.192000x= ∴ 380x =(2)初三年级人数为y +z =2000-(373+377+380+370)=500, 现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为:48500122000⨯= 名 (3)设初三年级女生比男生多的事件为A ,初三年级女生男生数记为(y ,z ); 由(2)知 500y z += ,且 ,y z N ∈, 基本事件空间包含的基本事件有:(245,255)、(246,254)、(247,253)、……(255,245)共11个事件A 包含的基本事件有:(251,249)、(252,248)、(253,247)、(254,246)、(255,245) 共5个∴ 5()11P A =2.为了了解《中华人民共和国道路交通安全法》在学生中的普及情况,调查部门对某校6名学生进行问卷调查.6人得分情况如下:5,6,7,8,9,10.把这6名学生的得分看成一个总体. (Ⅰ)求该总体的平均数;(Ⅱ)用简单随机抽样方法从这6名学生中抽取2名,他们的得分组成一个样本.求该样本平均数与总体平均数之差的绝对值不超过0.5的概率. 解:(Ⅰ)总体平均数为1(5678910)7.56+++++=. (Ⅱ)设A 表示事件“样本平均数与总体平均数之差的绝对值不超过0.5”. 从总体中抽取2个个体全部可能的基本结果有:(56),,(57),,(58),,(59),,(510),,(67),,(68),,(69),,(610),,(78),,(79),,(710),,(89),,(810),,(910),.共15个基本结果.事件A 包括的基本结果有:(59),,(510),,(68),,(69),,(610),,(78),,(79),.共有7个基本结果. 所以所求的概率为7()15P A =.3.现有8名奥运会志愿者,其中志愿者123A A A ,,通晓日语,123B B B ,,通晓俄语,12C C ,通晓韩语.从中选出通晓日语、俄语和韩语的志愿者各1名,组成一个小组. (Ⅰ)求1A 被选中的概率;(Ⅱ)求1B 和1C 不全被选中的概率.解:(Ⅰ)从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果组成的基本事件空间Ω={111112121()()()A B C A B C A B C ,,,,,,,,,122131()()A B C A B C ,,,,,,132()A B C ,,,211212221()()()A B C A B C A B C ,,,,,,,,,222()A B C ,,, 231()A B C ,,,232()A B C ,,,311312321()()()A B C A B C A B C ,,,,,,,,, 322331332()()()A B C A B C A B C ,,,,,,,,}由18个基本事件组成.由于每一个基本事件被抽取的机会均等,因此这些基本事件的发生是等可能的.用M 表示“1A 恰被选中”这一事件,则M ={111112121()()()A B C A B C A B C ,,,,,,,,,122131132()()()A B C A B C A B C ,,,,,,,,}事件M 由6个基本事件组成, 因而61()183P M ==. (Ⅱ)用N 表示“11B C ,不全被选中”这一事件,则其对立事件N 表示“11B C ,全被选中”这一事件,由于N ={111211311()()()A B C A B C A B C ,,,,,,,,},事件N 有3个基本事件组成, 所以31()186P N ==,由对立事件的概率公式得15()1()166P N P N =-=-=.4.某校高三(1)班的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题.(I )求全班人数及分数在[)90,80之间的频数;(II )估计该班的平均分数,并计算频率分布直方图中[)90,80间的矩形的高; (III )若要从分数在[80,100]之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在[90,100]之间的概率.解:(I )由茎叶图知,分数在[)60,50之间的频数为2,频率为,08.010008.0=⨯ 全班人数为.2508.02= …………3分所以分数在[)90,80之间的频数为42107225=---- …………5分(II )分数在[)60,50之间的总分为56+58=114;分数在[)70,60之间的总分为60×7+2+3+3+5+6+8+9=456;(III )将[)90,80之间的4个分数编号为1,2,3,4,[90,100]之间的2个分数编号为5,6,在[80,100]之间的试卷中任取两份的基本事件为: (1,2),(1,3),(1,4),(1,5),(1,6) (2,3),(2,4),(2,5),(2,6), (3,4),(3,5),(3,6) (4,5),(4,6) (5,6)共15个, …………12分 其中,至少有一个在[90,100]之间的基本事件有9个, …………14分故至少有一份分数在[90,1000]之间的频率是6.0159= …………15分5.袋子中装有编号为b a ,的2个黑球和编号为e d c ,,的3个红球,从中任意摸出2个球。
高中数学必修一概率与统计概念知识点总结及练习题

高中数学必修一概率与统计概念知识点总结及练习题概率的基本概念- 事件:指某个特定的结果或情况。
- 样本空间:所有可能结果的集合。
- 随机试验:具有确定结果但无法预知的试验。
- 事件发生的概率:一个事件发生的可能性大小。
概率的计算方法频率定义法- 通过大量重复试验来估计某个事件发生的概率。
古典定义法- 对于具有确定结果的试验,通过分析样本空间和事件的个数来计算概率。
几何定义法- 通过几何形状的面积或长度来计算概率。
组合计数法- 通过组合的方法计算某个事件发生的概率。
概率的性质- 概率的取值范围:[0,1]- 必然事件的概率:1- 不可能事件的概率:0- 互斥事件的概率:两个事件不可能同时发生,概率为两个事件概率之和。
统计的基本概念- 总体:研究对象的全体。
- 样本:从总体中选取的一部分。
- 参数:总体的某个数值特征。
- 统计量:样本的某个数值特征。
抽样方法- 随机抽样:每个样本都有相同的机会被选中。
- 系统抽样:按照一定的规则抽取样本。
- 分层抽样:将总体划分成几个层次,然后从每个层次中随机抽取样本。
- 整群抽样:将总体划分成若干个互相独立的群组,然后随机选择某些群组作为样本。
统计的应用- 描述统计:通过图表和指标等方式描述数据特征。
- 推断统计:通过样本的统计量推断总体参数。
练题1. 一个骰子掷一次,计算以下事件的概率:- 出现奇数的概率- 出现大于4的概率2. 甲、乙、丙三个班级参加校运动会,根据每个班级报名人数的统计数据,计算以下事件的概率:- 一个学生随机选中是甲班的概率- 一个学生随机选中是丙班的概率3. 一名学生参加数学竞赛,根据往年的统计数据,该学生获奖的概率为0.4。
如果该学生连续参加了5次数学竞赛,计算以下事件的概率:- 至少获奖一次的概率- 恰好获奖3次的概率4. 某商品以正态分布的价格出售,平均价格为100元,标准差为10元。
计算以下事件的概率:- 价格大于90元的概率- 价格在90元到110元之间的概率5. 一组学生的考试成绩服从正态分布,平均分为80分,标准差为5分。
高中概率统计知识点_高三概率知识点总结范文

《高中概率统计知识点总结》高中概率统计是数学中的重要组成部分,它不仅在高考中占据着重要的地位,而且在实际生活中也有着广泛的应用。
本文将对高中概率统计的知识点进行全面总结,帮助高三学生更好地掌握这部分内容。
一、随机事件与概率1. 随机事件随机事件是在一定条件下可能发生也可能不发生的事件。
必然事件是在一定条件下必然发生的事件,不可能事件是在一定条件下不可能发生的事件。
2. 概率的定义概率是对随机事件发生可能性大小的度量。
对于一个随机事件A,它的概率 P(A)满足0≤P(A)≤1。
当 P(A)=1 时,事件 A 为必然事件;当 P(A)=0 时,事件 A 为不可能事件。
3. 概率的基本性质(1)概率的加法公式:对于任意两个互斥事件 A 和 B,P(A∪B)=P(A)+P(B)。
(2)对立事件的概率:若事件 A 的对立事件为\(\overline{A}\),则 P(A)+P(\(\overline{A}\))=1。
二、古典概型1. 古典概型的特点(1)试验中所有可能出现的基本事件只有有限个。
(2)每个基本事件出现的可能性相等。
2. 古典概型的概率计算公式如果一次试验中共有 n 个基本事件,事件 A 包含其中的 m 个基本事件,则事件 A 的概率 P(A)=\(\frac{m}{n}\)。
三、几何概型1. 几何概型的特点(1)试验中所有可能出现的结果(基本事件)有无限多个。
(2)每个基本事件出现的可能性相等。
2. 几何概型的概率计算公式一般地,在几何区域 D 中随机地取一点,记事件“该点落在其内部一个区域 d 内”为事件 A,则事件 A 发生的概率P(A)=\(\frac{d 的测度}{D 的测度}\)。
这里测度可以是长度、面积、体积等。
四、互斥事件与独立事件1. 互斥事件若事件 A 与事件 B 不能同时发生,则称事件 A 与事件 B 为互斥事件。
互斥事件的概率加法公式为P(A∪B)=P(A)+P(B)(A、B 互斥)。
高中数学经典概率与统计(解析版)

概率与统计统计与概率是高考文科中的一个重要的一环高考对概率与统计内容的考查一般以实际应用题出现,这既是这类问题的特点,也符合高考发展的方向.概率应用题侧重于古典概率,近几年的高考有以概率应用题替代传统应用题的趋势,该题出现在解答题第二或第三题的位置,可见概率统计在高考中属于中档题.虽为中档题,但是实际生活背景在加强,阅读量大,所以快速阅读考题并准确理解题意是很重要的.对于这部分,我们还应当重视与传统内容的有机结合. 为了准确地把握2020年高考概率统计命题思想与趋势,在最后的复习中做到有的放矢,提高复习效率,纵观近五年的全国文科I卷,我们看到近几年每年一考,多出现在19题,分值12分;从难度上看:以中档题为主,重基础,考查的重点为统计图表的绘制与分析、数字特征的计算与分析、概率计算、线性回归分析,独立性检验等知识点,一般都会以实际问题为载体,代替传统建模题目.本专题我们把这些热点问题逐一说明,并提出备考指南,希望同学们在复习时抓住重点、事半功倍.【热点预测以及解题技巧】1 .抽样方法是统计学的基础,在复习时要抓住各种抽样方法的概念以及它们之间的区别与联系.茎叶图也成为高考的热点内容,应重点掌握.明确变量间的相关关系,体会最小二乘法和线性回归方法是解决两个变量线性相关的基本方法,就能适应高考的要求.2.求解概率问题首先确定是何值概型再用相应公式进行计算,特别对于解互斥事件(独立事件)的概率时,要注意两点:(1)仔细审题,明确题中的几个事件是否为互斥事件(独立事件),要结合题意分析清楚这些事件互斥(独立)的原因.(2)要注意所求的事件是包含这些互斥事件(独立事件)中的哪几个事件的和(积),如果不符合以上两点,就不能用互斥事件的和的概率.3.离散型随机变量的均值和方差是概率知识的进一步延伸,是当前高考的热点内容.解决均值和方差问题,都离不开随机变量的分布列,另外在求解分布列时还要注意分布列性质的应用.【考查题型】选择,填空,解答题【限时检测】(建议用时:45分钟)一、单选题1.(2020·上海闵行区·高三二模)某县共有300个村,现采用系统抽样方法,抽取15个村作为样本,调查农民的生活和生产状况,将300个村编上1到300的号码,求得间隔数3002015k==,即每20个村抽取一个村,在1到20中随机抽取一个数,如果抽到的是7,则从41到60这20个数中应取的号码数是( ) A .45B .46C .47D .48 【答案】C【分析】根据系统抽样的定义和性质即可得到结论.【详解】解:根据题意,样本间隔数3002015k ==,在1到20中抽到的是7, 则41到60为第3组,此时对应的数为7+2×20=47.故选:C.【点睛】本题主要考查系统抽样的应用,样本间距是解决本题的关键,比较基础.2.(2020·上海松江区·高三其他模拟)已知6260126(1)x a a x a x a x +=+++⋯+,在0,a 1,a 2,a ,⋅⋅⋅6a 这7个数中,从中任取两数,则所取的两数之和为偶数的概率为( )A .12B .37C .47D .821【答案】B【分析】根据6260126(1)x a a x a x a x +=+++⋯+,将0,a 1,a 2,a ,⋅⋅⋅6a 计算出来,分清几个奇数,几个偶数, 得到从中任取两数的种数;所取的两数之和为偶数的种数,代入古典概型的概率公式求解.【详解】因为6260126(1)x a a x a x a x +=+++⋯+,0,a 1,a 2,a ,⋅⋅⋅6a 这7个数分别为:061,C =166,C =2615,C =3620,C =4615,C =566,C =661,C =. 4个奇数,3个偶数;从中任取两数共有:2721C =种;所取的两数之和为偶数的有:22439C C +=;∴所取的两数之和为偶数的概率为:93217=. 故选:B.【点睛】本题主要考查二项式系数和古典概型的概率,还考查了运算求解的能力,属于基础题.3.(2019·上海杨浦区·高三一模)某象棋俱乐部有队员5人,其中女队员2人,现随机选派2人参加一个象棋比赛,则选出的2人中恰有1人是女队员的概率为( )A .310B .35C .25D .23【答案】B【分析】直接利用概率公式计算得到答案.【详解】11322563105C C P C ⨯=== ,故选:B 【点睛】本题考查了概率的计算,属于简单题.4.(2019·上海黄浦区·高三二模)在某段时间内,甲地不下雨的概率为1P (101P <<),乙地不下雨的概率为2P (201P <<),若在这段时间内两地下雨相互独立,则这段时间内两地都下雨的概率为( ) A .12PPB .121PP -C .12(1)P P -D .12(1)(1)P P -- 【答案】D【分析】根据相互独立事件的概率,可直接写出结果.【详解】因为甲地不下雨的概率为1P ,乙地不下雨的概率为2P ,且在这段时间内两地下雨相互独立, 所以这段时间内两地都下雨的概率为()()1211P P P =--.故选D【点睛】本题主要考查相互独立事件的概率,熟记概念即可,属于基础题型.二、填空题5.(2020·上海奉贤区·高三一模)某工厂生产A 、B 两种型号的不同产品,产品数量之比为2:3.用分层抽样的方法抽出一个样本容量为n 的样本,则其中A 种型号的产品有14件.现从样本中抽出两件产品,此时含有A 型号产品的概率为__________. 【答案】1117【分析】先由分层抽样抽样比求B 种型号抽取件数,以及n ,再根据古典概型公式求概率. 【详解】设B 种型号抽取m 件,所以1423m =,解得:21m =,142135n =+=, 从样本中抽取2件,含有A 型号产品的概率2111414212351117C C C P C +==.故答案为:11176.(2019·上海市建平中学高三月考)一个总体分为A ,B 两层,其个体数之比为4:1,用分层抽样方法从总体中抽取一个容量为10的样本.已知B 层中甲、乙都被抽到的概率为128,则总体中的个体数为 _____ . 【答案】40【解析】设B 层中的个体数为n ,则211828nn C =⇒=,则总体中的个体数为8540.⨯=7.(2020·上海黄浦区·高三二模)某社区利用分层抽样的方法从140户高收入家庭、280户中等收入家庭、80户低收入家庭中选出100户调查社会购买力的某项指标,则中等收入家庭应选________户.【答案】56【分析】由分层抽样的计算方法有,中等收入家庭的户数占总户数的比例再乘以要抽取的户数,即可得到答案.【详解】该社区共有14028080500++=户.利用分层抽样的方法, 中等收入家庭应选28010056500⨯=户,故答案为:56 【点睛】本题考查分层抽样,注意抽取比例是解决问题的关键,属于基础题.8.(2020·上海高三其他模拟)某校三个年级中,高一年级有学生400人,高二年级有学生360人,高三年级有学生340人,现采用分层抽样的方法从高一年级学生中抽出20人,则从高三年级学生中抽取的人数为________.【答案】17【分析】由于分层抽样是按比例抽取,若设高三年级的学生抽取了x 人,则有40034020x=,求出x 的值即可【详解】解:设高三年级的学生抽取了x 人,则由题意得 40034020x=,解得17x =,故答案为:17 【点睛】此题考查分层抽样,属于基础题.9.(2016·上海杨浦区·复旦附中高三月考)如图所示,一家面包销售店根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,若一个月以30天计算,估计这家面包店一个月内日销售量不少于150个的天数为________.【答案】9【分析】根据频率分布直方图计算出日销售量不少于150个的频率,然后乘以30即可.【详解】根据频率分布直方图可知,一个月内日销售量不少于150个的频率为()0.0040.002500.3+⨯=, 因此,这家面包店一个月内日销售量不少于150个的天数为300.39⨯=.故答案为9.【点睛】本题考查频率分布直方图的应用,解题时要明确频数、频率和样本容量三者之间的关系,考查计算能力,属于基础题.10.(2020·上海高三专题练习)中位数为1010的一组数构成等差数列,其末项为 2015,则该数列的首项为__________.【答案】5.【解析】设数列的首项为1a ,则12015210102020a+=⨯=,所以15a =,故该数列的首项为5,所以答案应填:5.【考点定位】等差中项.11.(2020·上海浦东新区·高三一模)在7(2)x +的二项展开式中任取一项,则该项系数为有理数的概率为_________.(用数字作答)【答案】12【分析】根据二项展开式的通项,确定有理项所对应的r 的值,从而确定其概率. 【详解】7(2)x +展开式的通项为()77217722rr rr rr r T C x C x --+==,07,r r N ≤≤∈, 当且仅当r 为偶数时,该项系数为有理数,故有0,2,4,6r =满足题意,故所求概率4182P ==.【点睛】(1)二项式定理的核心是通项公式,求解此类问题可以分两步完成:第一步根据所给出的条件(特定项)和通项公式,建立方程来确定指数(求解时要注意二项式系数中n 和r 的隐含条件,即n ,r 均为非负整数,且n ≥r ,如常数项指数为零、有理项指数为整数等);第二步是根据所求的指数,再求所求解的项.(2)求两个多项式的积的特定项,可先化简或利用分类加法计数原理讨论求解.12.(2020·上海松江区·高三一模)从包含学生甲的1200名学生中随机抽取一个容量为80的样本,则学生甲被抽到的概率___.【答案】115【分析】基本事件总数801200n C =,学生甲被抽到包含的基本事件个数79112001m C C =,由此能求出学生甲被抽到的概率.【详解】解:从包含学生甲的1200名学生中随机抽取一个容量为80的样本,基本事件总数801200n C =, 学生甲被抽到包含的基本事件个数79112001m C C =,∴学生甲被抽到的概率79111991801200115C C m P n C ===. 故答案为:115. 【点睛】方法点睛:求概率常用的方法是:先定性(六种概率:古典概型的概率、几何概型的概率、独立事件的概率、互斥事件的概率、条件概率和独立重复试验的概率),再定量.13.(2019·上海市建平中学高三月考)已知方程221x y a b+=表示的曲线为C ,任取a 、{}1,2,3,4,5b ∈,则曲线C 表示焦距等于2的椭圆的概率等于________. 【答案】825【分析】计算出基本事件的总数,并列举出事件“曲线C 表示焦距等于2的椭圆”所包含的基本事件,利用古典概型的概率公式可求得所求事件的概率.【详解】所有可能的(),a b 的组数为:5525⨯=,又因为焦距22c =,所以1c =,所以1a b -=±, 则满足条件的有:()1,2、()2,3、()3,4、()4,5、()5,4、()4,3、()3,2、()2,1,共8组, 所以概率为:825P =.故答案为:825. 【点睛】方法点睛:计算古典概型概率的方法如下:(1)列举法;(2)数状图法;(3)列表法;(4)排列、组合数的应用.14.(2020·上海徐汇区·高三一模)小王同学有4本不同的数学书,3本不同的物理书和3本不同的化学书,从中任取2本,则这2本书属于不同学科的概率为______________(结果用分数表示). 【答案】1115【分析】利用古典概型公式计算概率.【详解】共43310++=本不同的数,任取2本包含21045C =种方法,若从中任取两本,这2本书属于不同学科的情况有11111143433333C C C C C C ⋅+⋅+⋅=,所以这2本书属于不同学科的概率33114515P ==. 故答案为:111515.(2020·上海高三一模)近年来,人们的支付方式发生了巨大转变,使用移动支付购买商品已成为一部分人的消费习惯.某企业为了解该企业员工A 、B 两种移动支付方式的使用情况,从全体员工中随机抽取了100人,统计了他们在某个月的消费支出情况.发现样本中A ,B 两种支付方式都没有使用过的有5人;使用了A 、B 两种方式支付的员工,支付金额和相应人数分布如下:依据以上数据估算:若从该公司随机抽取1名员工,则该员工在该月A 、B 两种支付方式都使用过的概率为______.【答案】310【分析】根据题意,计算出两种支付方式都使用过的人数,即可得到该员工在该月A 、B 两种支付方式都使用过的概率.【详解】解:依题意,使用过A 种支付方式的人数为:18292370++=,使用过B 种支付方式的人数为:10242155++=,又两种支付方式都没用过的有5人,所以两种支付方式都用过的有()()7055100530+--=,所以该员工在该月A 、B 两种支付方式都使用过的概率30310010p ==. 故答案为:310. 【点睛】本题考查了古典概型的概率,主要考查计算能力,属于基础题.16.(2020·上海大学附属中学高三三模)一名工人维护甲、乙两台独立的机床,在一小时内,甲需要维护和乙需要维护相互独立,它们的概率分别为0.4和0.3,则一小时内没有一台机床需要维护的概率为________【答案】0.42【分析】根据甲需要维护和乙需要维护相互独立,它们的概率分别为0.4和0.3,利用独立事件和对立事件的概率求法求解.【详解】因为甲需要维护和乙需要维护相互独立,它们的概率分别为0.4和0.3,所以一小时内没有一台机床需要维护的概率为()()10.410.30.42-⨯-=,故答案为:0.42【点睛】本题主要考查独立事件和对立事件的概率,属于基础题.17.(2020·上海长宁区·高三三模)2021年某省将实行“312++”的新高考模式,即语文、数学、英语三科必选,物理、历史二选一,化学、生物、政治、地理四选二,若甲同学选科没有偏好,且不受其他因素影响,则甲同学同时选择历史和化学的概率为________ 【答案】14【分析】甲同学从物理、历史二选一,其中选历史的概率为12,从化学、生物、政治、地理四选二,有6种选法,其中选化学的有3种,从而可得四选二,选化学的概率为12,然后由分步原理可得同时选择历史和化学的概率.【详解】解:由甲同学选科没有偏好,且不受其他因素影响,所以甲同学从物理、历史二选一选历史的概率为12,甲同学从化学、生物、政治、地理四选二有:化学与生物,化学与政治,化学与地理,生物与政治,生物与地理,政治与地理共6种不同的选法,其中选化学的有3种,所以四选二中有化学的概率为12, 所以由分步原理可知甲同学同时选择历史和化学的概率为111=224⨯, 故答案为:14 【点睛】此题考查古典概型概率以及独立事件概率乘法公式的求法,考查理解运算能力,属于基础题. 18.(2019·上海市七宝中学高三三模)一名信息员维护甲乙两公司的5G 网络,一天内甲公司需要维护和乙公司需要维护相互独立,它们需要维护的概率分别为0.4和0.3,则至少有一个公司不需要维护的概率为________【答案】0.88【分析】根据相互独立事件概率计算公式和对立事件的概率计算公式直接求解即可.【详解】"至少有一个公司不需要维护"的对立事件是"两公司都需要维护",所以至少有一个公司不需要维护的概率为10.30.40.88p =-⨯=,故答案为0.88.【点睛】本题主要考查概率的求法以及相互独立事件概率计算公式和对立事件的概率计算公式的应用. 19.(2019·上海金山区·高三二模)若生产某种零件需要经过两道工序,在第一、二道工序中生产出废品的概率分别为0.01、0.02,每道工序生产废品相互独立,则经过两道工序后得到的零件不是废品的概率是________(结果用小数表示)【答案】0.9702【分析】利用对立事件概率计算公式和相互独立事件概率乘法公式能求出经过两道工序后得到的零件不是废品的概率.【详解】生产某种零件需要经过两道工序,在第一、二道工序中生产出废品的概率分别0.01、0.02, 每道工序生产废品相互独立,则经过两道工序后得到的零件不是废品的概率:p =(1﹣0.01)(1﹣0.02)=0.9702.故答案为0.9702.【点睛】本题考查概率的求法,考查对立事件概率计算公式和相互独立事件概率乘法公式等基础知识,考查运算求解能力,是基础题.三、解答题20.(2019·上海普陀区·)某城市自2014年至2019年每年年初统计得到的人口数量如表所示.(1)设第n 年的人口数量为n a (2014年为第1年),根据表中的数据,描述该城市人口数量和2014年至2018年每年该城市人口的增长数量的变化趋势;(2)研究统计人员用函数0.6544450()2000 4.48781x P x e -=++拟合该城市的人口数量,其中x 的单位是年.假设2014年初对应0x =,()P x 的单位是万.设()P x 的反函数为()T x ,求(2440)T 的值(精确到0.1),并解释其实际意义.【分析】(1)根据表中的数据可得从2014年到2019年人口增加的数量,逐年增多,从2017年后,增加的人数逐年减少,但人口总数是逐年增加的;(2)根据函数的表达式,以及反函数的定义,代值计算即可.【详解】(1)201520142135208253f f -=-=,201620152203213568f f -=-=,201720162276220373f f -=-=,201820172339227663f f -=-=,201920182385233946f f -=-=,由上述计算可知,该地区2014年至2019年每年人口增长数量呈先增后减的变化趋势,每一年任可总数呈逐渐递增的趋势;(2)因为0.65444.48781x e -+为单调递减函数,则()P x 为单调递增函数,则0(2440)T x =0()2440P x ⇒=, 代入000.6544450()200024404.48781x P x e -=+=+,解得08.1x =,即(2440)8.1T =, 其实际意义为:可根据数学模型预测人口数量增长规律,及提供有效依据,到2022年人口接近2440万.【点睛】该题考查的是有关统计的问题,涉及到的知识点有利用表格判断其变化趋势,利用题中所给的函数解析式,计算相关的量,反函数的定义,属于中档题目.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章 概率统计及统计案例 第一节 随机抽样 一、高考考点梳理 (一)、简单随机抽样
1.定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫作简单随机抽样. 2.最常用的简单随机抽样的方法:抽签法和随机数法. 3.应用范围:总体中的个体数较少.
(二)、系统抽样 1.定义:当总体中的个体数目较多时,可将总体分成均衡的几个部分,然后按照事先定出的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样. 2.系统抽样的操作步骤 第一步编号:先将总体的N个个体编号;
第二步分段:确定分段间隔k,对编号进行分段,当Nn(n是样本容量)是整数时,取k=Nn; 第三步确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(l≤k); 第四步获取样本:按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本. 3.应用范围:总体中的个体数较多. (三)、分层抽样 1.定义:在抽样时,将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本,这种抽样方法叫作分层抽样,有时也称为类型抽样. 2.应用范围:当总体是由差异明显的若干类型组成时,往往选用分层抽样. 二、历年高考真题题型分类突破 题型一 系统抽样
【例1】(2019国Ⅰ卷)某学校为了解1000名新生的身体素质,将这些学生编号1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是( ) A.8号学生 B.200号学生 C.616号学生 D.815号学生 解析:∵从1000名学生从中抽取一个容量为100的样本, ∴系统抽样的分段间隔为=10, ∵46号学生被抽到, 则根据系统抽样的性质可知,第一组随机抽取一个号码为6,以后每个号码都比前一个号码增加10,所有号码数是以6为首项,以10为公差的等差数列, 设其数列为{ɑn},则ɑn=6+10(n﹣1)=10n﹣4, 当n=62时,ɑ62=616,即在第62组抽到616号学生.故选C . 题型二 分层抽样 【例2】(2018国Ⅲ卷)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________. 解析:因为不同年龄段客户对其服务的评价有较大差异,所以最合适的抽样方法是分层抽样. 题型三 抽样数据的统计 【例3】(2019国Ⅲ卷)《西游记》《三国演义》《水浒传》和《红楼梦》是中 国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( ) A.0.5 B.0.6 C.0.7 D.0.8 解析:设阅读过《西游记》或《红楼梦》的分别为事件A和事件B,则A或者B中有90人,B中有80人,A且B中有60人,所以A中有90-80+60=70人,则A的概率是0.7,故选C.
第二节 用样本估计总体 一、高考考点梳理 (一)、用样本的频率分布估计总体分布
1.频率分布表与频率分布直方图 频率分布表与频率分布直方图的绘制步骤如下: ①求极差(即一组数据中最大值与最小值的差); ②定组距与组数;③将数据分组;④列频率分布表; ⑤画频率分布直方图. 2.频率折线图 在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图. 3.茎叶图 ①茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数. ②对于样本数据较少,但较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、 十位数字作茎,个位数字作叶,样本数据为小数时做类似处理. (二)、用样本的数字特征估计总体的数字特征 1.众数 在一组数据中,出现次数最多的数据叫作这组数据的众数.体现了样本数据的最大集中点,不受极端值的影响而且不唯一. 2.中位数 将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.它不受极端值的影响,仅利用了排在中间数据的信息,只有一个,且在频率分布直方图中,中位数左边和右边的直方图的面积相等.
3.平均数:样本数据的算术平均数,即x=1n(x1+x2+…+xn),它与每一个样本数据有关,仅有一个. 4.极差:一组数值中最大值与最小值的差,它反映一组数据的波动情况,但极差只考虑两个极端值,可靠性极差. 5.标准差:①考查样本数据的分散程度的大小,最常用的统计量是标准差,标准差是样本数据到平均数的一种平均距离,一般用s表示:
s= 1n[x1-x2+x2-x2+…+xn-x2]. ②标准差的平方s2叫作方差: s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].
二、历年高考真题题型分类突破 题型一 频率分布直方图的绘制与应用
【例1】(2018国Ⅰ卷)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下: 未使用节水龙头50天的日用水量频数分布表 日用水量 [0,0.1) [0.1,0.2) [0.2,0.3) [0.3,0.4) [0.4,0.5) [0.5,0.6) [0.6,0.7)
频数 1 3 2 4 9 26 5 使用了节水龙头50天的日用水量频数分布表 日用水量 [0,0.1) [0.1,0.2) [0.2,0.3) [0.3,0.4) [0.4,0.5) [0.5,0.6)
频数 1 5 13 10 16 5 (1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率; (3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表) 解析:(1) (2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48, 因此该家庭使用节水龙头后日用水量小于0.35m3的概率的估计值为0.48. (3)该家庭未使用节水龙头50天日用水量的平均数为
x1=150(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48 该家庭使用了节水龙头后50天日用水量的平均数为 x2=150(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35 估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).
题型二 茎叶图的应用 【例2】(2018国Ⅲ卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表: 超过m 不超过m 第一种生产方式 第二种生产方式 (3)根据(2)中的列表,能否有99%的把握认为两种生产方式的效率有差异? 附:K2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d), 临界值表: P(K2≥k0) 0.050 0.010 0.001 k0 3.841 6.635 10.828 解析:(1)第二种生产方式的效率更高. 理由如下: (i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高. (ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高. (iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高. (iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高. 以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.
(2)由茎叶图知m=79+812=80. 列联表如下: 超过80 不超过80 第一种生产方式 15 5 第二种生产方式 5 15