高中数学统计与概率知识点
高中数学统计与概率
高中数学统计与概率1、概率的定义随机事件A的概率是频率的稳定值;频率是概率的近似值。
2、等可能事件的概率如果一次试验中可能出现的结果有n个,且所有结果出现的可能性都相等,那么,每一个基本事件的概率都是1/n,如果某个事件A包含的结果有m个,那么事件A的概率为P(A)=m/n。
3、互斥事件不可能同时发生的两个事件叫互斥事件。
如果事件A、B互斥,那么事件A+B发生(A、B中有一个发生)的概率,等于事件A、B分别发生的概率和,即P(A+B)=P(A)+P(B)。
4.抽签法和随机数表法(1)抽签法①优点:简单易行;②缺点:当总体容量非常大时,操作比较麻烦;若抽取前搅拌不均匀,可能导致抽取的样本不具有代表性.(2)随机数表法随机数表是由水技术(通常为自然数)形成的数表,表中的每一位置出现的数都是随机的.随机数表法的一般步骤:第一步:对总体进行编号;第二步:任意指定一个开始选取的位置,位置的确定可以闭着眼用手指随机确定,也可以用其他方法;第三步:按照一定规则选取编号;第四步:按照得到的编号找出对应的个体.【注释】①规则一经确定,就不能更改;②选取过程中,遇到超过编号范围或已经选取了的数字,应该舍弃.5.分层抽样一般地,如果相对于要考察的问题来说,总体可以分为有明显差别的,互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称分层抽样).【注释】分层抽样得到的样本,一般更具有代表性,可以更准确地反映总体的特征,尤其是在层内个体相对同质而层间差异较大时更是如此.分层抽样在各层中抽样时,还可根据各层的特点灵活选用不同的随机抽样方法.。
高中数学统计与概率知识点
高中数学统计与概率知识点一、统计学基础1. 数据收集- 普查与抽样调查- 数据的类型(定量数据与定性数据)2. 数据整理与展示- 频数分布表- 直方图- 饼图- 条形图3. 中心趋势的度量- 平均数(算术平均数)- 中位数- 众数4. 离散程度的度量- 极差- 四分位距- 方差与标准差5. 相关性分析- 相关系数- 散点图二、概率论基础1. 随机事件- 事件的定义- 必然事件与不可能事件- 互斥事件与独立事件2. 概率的计算- 单次试验的概率- 多次试验的概率- 条件概率- 贝叶斯定理3. 随机变量- 离散随机变量与连续随机变量 - 概率分布- 概率密度函数与概率分布函数4. 期望值与方差- 随机变量的期望值- 随机变量的方差5. 常见概率分布- 二项分布- 泊松分布- 正态分布三、统计与概率的应用1. 假设检验- 零假设与备择假设- 显著性水平- 第一类错误与第二类错误 - t检验与卡方检验2. 回归分析- 线性回归- 相关系数与决定系数3. 抽样与估计- 抽样误差- 置信区间- 最大似然估计四、综合练习题1. 选择题- 统计图表解读- 概率计算- 假设检验2. 填空题- 计算平均数、中位数、众数 - 计算方差、标准差- 概率分布的应用3. 解答题- 解释统计概念- 概率问题的求解- 应用统计方法解决实际问题五、附录1. 公式汇总- 统计学公式- 概率论公式2. 重要概念索引- 术语解释- 概念间的关系3. 参考资料- 推荐阅读书籍- 在线资源链接请根据需要对上述内容进行编辑和调整。
这篇文章是为了提供一个关于高中数学统计与概率的知识点概览,适用于教育目的。
每个部分都包含了关键的子标题和简短的描述,以便于理解和使用。
(最全)高中数学概率统计知识点总结
高中数学-概率与统计一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。
2、平均数:①、常规平均数:12nx x x x n++⋅⋅⋅+=②、加权平均数:112212n n n x x x x ωωωωωω++⋅⋅⋅+=++⋅⋅⋅+3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。
4、方差:2222121[()()()]n s x x x x x x n=-+-+⋅⋅⋅+- 二、频率直方分布图下的频率1、频率 =小长方形面积:f S y d ==⨯距;频率=频数/总数2、频率之和:121n f f f ++⋅⋅⋅+=;同时 121n S S S ++⋅⋅⋅+=;三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。
2、平均数: 112233n nx x f x f x f x f =+++⋅⋅⋅+ 112233n n x x S x S x S x S =+++⋅⋅⋅+ 3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。
4、方差:22221122()()()n n s x x f x x f x x f =-+-+⋅⋅⋅+-四、线性回归直线方程:ˆˆˆybx a =+ 其中:1122211()()ˆ()nni i i i i i nni i i i x x y y x y nxybx x x nx ====---∑∑==--∑∑ , ˆˆay bx =- 1、线性回归直线方程必过样本中心(,)x y ;2、ˆ0:b>正相关;ˆ0:b <负相关。
3、线性回归直线方程:ˆˆˆy bx a =+的斜率ˆb 中,两个公式中分子、分母对应也相等;中间可以推导得到。
五、回归分析1、残差:ˆˆi i i ey y =-(残差=真实值—预报值)。
分析:ˆi e 越小越好; 2、残差平方和:21ˆ()ni i i y y=-∑, 分析:①意义:越小越好; ②计算:222211221ˆˆˆˆ()()()()ni i n n i y yy y y y y y =-=-+-+⋅⋅⋅+-∑ 3、拟合度(相关指数):22121ˆ()1()ni i i ni i y yR y y ==-∑=--∑,分析:①.(]20,1R ∈的常数; ②.越大拟合度越高;4、相关系数:()()nni i i i x x y y x y nx yr ---⋅∑∑==分析:①.[r ∈-的常数; ②.0:r >正相关;0:r <负相关③.[0,0.25]r ∈;相关性很弱; (0.25,0.75)r ∈;相关性一般; [0.75,1]r ∈;相关性很强; 六、独立性检验 1、2×2列联表: 2、独立性检验公式 ①.22()()()()()n ad bc k a b c d a c b d -=++++②.犯错误上界P 对照表3、独立性检验步骤①.计算观察值k :2()()()()()n ad bc k a b c d a c b d -=++++;②.查找临界值0k :由犯错误概率P ,根据上表查找临界值0k ;③.下结论:0k k ≥:即犯错误概率不超过P 的前提下认为: ,有1-P 以上的把握认为: ; 0k k <:即犯错误概率超过P 的前提认为: ,没有1-P 以上的把握认为: ;【经典例题】题型1 与茎叶图的应用例1(2014全国)某市为考核甲、乙两部门的工作情况,学科网随机访问了50位市民。
高中数学概率与统计知识点
高中数学概率与统计知识点1、概率的定义随机事件A的概率是频率的稳定值;频率是概率的近似值。
2、等可能事件的概率如果一次试验中可能出现的结果有n个,且所有结果出现的可能性都相等,那么,每一个基本事件的概率都是1/n,如果某个事件A包含的结果有m个,那么事件A的概率为P(A)=m/n。
3、互斥事件不可能同时发生的两个事件叫互斥事件。
如果事件A、B互斥,那么事件A+B发生(A、B中有一个发生)的概率,等于事件A、B 分别发生的概率和,即P(A+B)=P(A)+P(B)。
4、对立事件对立事件是指两个事件必有一个发生的互斥事件。
例如:从1~52张扑克牌中任取一张抽到“红桃”与抽到“黑桃”互为互斥事件,因为其中一个不可能同时发生,但又不能保证其中一个必然发生,故不是对立事件。
而抽到“红色牌”与抽到“黑色牌”互为对立事件,因为其中一个必发生。
对立事件的性质:1)对立事件的概率和等于1:P(A)+P(Ä)=P(A+A)=1。
2)互为对立的两个事件一定互斥,但互斥不一定是对立事件。
5、相互独立事件事件A(或B)是否发生对事件B(或A)发生的概率没有影响,这样的两个事件叫做相互独立事件。
两个相互独立事件同时发生的概率,等于每个事件发生的概率的积,即P(A·B)=P(A)·P(B)。
相互独立事件的性质:1)如果事件A与B相互独立,那么A与B,A与B,A与B也都相互独立。
2)必然事件与任何事件都是相互独立的。
3)独立事件是对任意多个事件来讲,而互斥事件是对同一实验来讲的多个事件,且这多个事件不能同时发生,故这些事件相互之间必然影响,因此互斥事件一定不是独立事件。
6、独立重复试验若n次重复试验中,每次试验结果的概率都不依赖于其他各次试验的结果,则称这n次试验是独立的。
如果在一次试验中某事件发生的概率为P,那么在n次独立重复试验中这个事件恰好发生k 次的概率:P…(k)=CP*(1-P)"-*7、两个事件之间的关系对任何两个事件都有P(A+B)=P(A)+P(B)-P(A·B)。
(完整版)高中数学统计与概率知识点归纳(全)
高中数学统计与概率知识点(文)的平均数就是中位数。
③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平 均数。
四、 中位数与众数的特点。
⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据;⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若 这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数;⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单 位相同; (6) 众数可能是一个或多个甚至没有;(7) 平均数、众数和中位数都是描述一组数据集中趋势的量。
五、 平均数、中位数与众数的异同:⑴平均数、众数和中位数都是描述一组数据集中趋势的量; ⑵平均数、众数和中位数都有单位; ⑶平均数反映一组数据的平均水平,与这组数据中的每个数都有关系, 所以最为重要,应用最广;⑷中位数不受个别偏大或偏小数据的影响;⑸众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的数据。
六、 对于样本数据 X i , X 2,…,X n ,设想通过各数据到其平均数的平均距离来反映样本数据的分散 程度,那么这个平均距离如何计算?|X i - x| + |X 2- X| + L + |X n - x|思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差, 一般用s 表示•假设样本数据X i , X 2,…,X n 的平均数为X ,则标准差的计算公式是:(X i - X)2 + (X 2 - x)2 + L +(x n - X)2七、简单随即抽样的含义一般地,设一个总体有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本(n W N ),如果每次 抽取时总体内的各个个体被抽到的机会都相等,则这种抽样方法叫做简单随机抽样•八、 根据你的理解,简单随机抽样有哪些主要特点?一、 众数:一组数据中出现次数最多的那个数据。
高中数学统计与概率知识点
高中数学统计与概率知识点高中数学统计与概率知识点第一部分:统计一、众数众数是一组数据中出现次数最多的数据。
它反映了数据的集中趋势,但当数据大小差异很大时,众数的准确值难以判断。
此外,当众数出现次数不具明显优势时,用它来反映数据的典型水平是不可靠的。
二、中位数中位数是一组数据中位于最中间的数据,当数据为偶数个时,为最中间两个数据的平均数。
求中位数时,需要先将数据排序,然后根据数据的个数来确定中位数。
三、众数、中位数及平均数的求法众数由所给数据可直接求出;求中位数时,需要先排序,然后根据数据的个数来确定中位数;求平均数时,需要将各数据的总和除以数据的个数。
四、中位数与众数的特点中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是;众数考察的是一组数据中出现的频数,它的大小只与这组数据的个别数据有关,可能是一个或多个,甚至没有。
五、平均数、中位数与众数的异同平均数、中位数和众数都是描述一组数据集中趋势的量,都有单位。
平均数反映数据的平均水平,与每个数据都有关系,应用最广;中位数不受个别偏大或偏小数据的影响;众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的数据。
六、样本数据的分散程度对于样本数据x1,x2,…,xn,可以通过各数据到其平均数的平均距离来反映样本数据的分散程度。
平均距离的计算公式为12n。
本文介绍了统计学中常用的标准差,以及简单随机抽样的定义和特点。
其中,简单随机抽样的主要特点包括总体个体数有限、逐个抽取、不放回、公平性。
抽签法是一种简单易行的抽样方法,但在总体个数较多时可能会导致样本代表性差。
随机数表法是另一种常用的抽样方法,其步骤包括编号、选定起始位置和依次读取。
最后,对于从100个个体中抽取一个容量为10的样本,可以采用抽签法或随机数表法进行编号。
十三、系统抽样的一般步骤在使用系统抽样从总体中抽取样本时,首先需要将总体中的所有个体进行编号。
举例来说,如果要从605件产品中抽取60件进行质量检查,由于605件产品不能均衡分成60部分,因此需要先从总体中随机剔除5个个体,再均衡分成60部分。
(完整word版)高中数学统计与概率知识点归纳(全)
高中数学统计与概率知识点(文)一、众数: 一组数据中出现次数最多的那个数据。
众数与平均数的区别: 众数表示一组数据中出现次数最多的那个数据;平均数是一组数据中表示平均每份的数量。
二、.中位数: 一组数据按大小顺序排列,位于最中间的一个数据(当有偶数个数据时,为最中间两个数据的平均数)三 .众数、中位数及平均数的求法。
①众数由所给数据可直接求出;②求中位数时,首先要先排序(从小到大或从大到小),然后根据数据的个数,当数据为奇数个时,最中间的一个数就是中位数;当数据为偶数个时,最中间两个数的平均数就是中位数。
③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平均数。
四、中位数与众数的特点。
⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据; ⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数;⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单位相同;(6)众数可能是一个或多个甚至没有;(7)平均数、众数和中位数都是描述一组数据集中趋势的量。
五.平均数、中位数与众数的异同:⑴平均数、众数和中位数都是描述一组数据集中趋势的量; ⑵平均数、众数和中位数都有单位; ⑶平均数反映一组数据的平均水平,与这组数据中的每个数都有关系,所以最为重要,应用最广; ⑷中位数不受个别偏大或偏小数据的影响;⑸众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的数据。
六、对于样本数据x 1,x 2,…,x n ,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用s 表示.假设样本数据x 1,x 2,…,x n 的平均数为x ,则标准差的计算公式是:七、简单随即抽样的含义一般地,设一个总体有N 个个体, 从中逐个不放回地抽取n 个个体作为样本(n≤N), 如果每次12||||||n x x x x x x n-+-++-L 22212()()()n x x x x x x s n -+-++-=L抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽样.八、根据你的理解,简单随机抽样有哪些主要特点?(1)总体的个体数有限;(2)样本的抽取是逐个进行的,每次只抽取一个个体;(3)抽取的样本不放回,样本中无重复个体;(4)每个个体被抽到的机会都相等,抽样具有公平性.九、抽签法的操作步骤?第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.第二步,将号签放在一个容器中,并搅拌均匀第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.十一、抽签法有哪些优点和缺点?优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大.十一、利用随机数表法从含有N个个体的总体中抽取一个容量为n的样本,其抽样步骤如何?第一步,将总体中的所有个体编号.第二步,在随机数表中任选一个数作为起始数.第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.简单随机抽样一般采用两种方法:抽签法和随机数表法。
高中数学统计与概率知识点归纳全
高中数学统计与概率知识点归纳全统计与概率是数学中重要的一部分,出现在中学数学和高中数学的教学中。
它涵盖了很多基本的概念和方法,并且在实际生活中有广泛的应用。
本文将全面归纳高中数学统计与概率的知识点,以帮助读者更好地理解和掌握这一领域的内容。
一、基本概念1. 数据与统计:数据是通过观察、测量或实验获得的信息,统计是对数据进行收集、整理、分析和解释的过程。
2. 总体与样本:总体是指研究对象的全体,样本是从总体中选取的一部分。
3. 参数与统计量:参数是描述总体的数值特征,统计量是根据样本数据计算得到的总体参数的估计值。
4. 随机事件与样本空间:随机事件是指一个结果不确定、以概率形式描述的事件,样本空间是随机事件可能发生的所有结果的集合。
5. 概率:概率是用来描述随机事件发生可能性大小的数值。
它可以通过实验、几何、统计推理等方法进行计算。
二、统计方法1. 数据收集与处理:包括数据的收集、整理和清洗,以及计算数据的频数、频率、中位数、平均数等。
2. 描述统计和推断统计:描述统计通过图表、图像和数值等形式展示数据的分布特征;推断统计则通过样本数据进行参数估计、假设检验等,从而对总体进行推断。
3. 频数分布与频率分布:频数分布是指将数据按照取值范围划分成若干组,并统计每组中数据出现的频数;频率分布则是统计每组数据出现的频率。
三、概率相关知识1. 事件的概率:事件A发生的概率记为P(A),它满足0≤P(A)≤1。
2. 基本事件与复合事件:基本事件是样本空间中的单个事件,复合事件由一个或多个基本事件组成。
3. 互斥事件与相对事件:互斥事件是指两个事件不可能同时发生,相对事件是指两个事件都能够发生,或者都不能发生。
4. 概率的计算:通过等可能原理、频率法、古典概型等方法计算事件的概率。
5. 条件概率与独立事件:条件概率是指在已知事件B发生的条件下,事件A发生的概率,记为P(A|B);独立事件是指事件A和事件B的发生与否互不影响。
高中数学概率与统计知识点总结
概率与统计一、概率及随机变量的分布列、期望与方差(一)概率及其计算1.几个互斥事件和事件概率的加法公式①如果事件A 与事件B 互斥,则()P A B =()()P A P B +.推广:如果事件1A ,2A ,…,n A 两两互斥(彼此互斥),那么事件12n A A A +++发生的概率,等于这n 个事件分别发生的概率的和,即()12n P A A A +++=()()()12n P A P A P A ++.②若事件B 与事件A 互为对立事件,则()P A =()1P B -. 2.古典概型的概率公式P (A )=A 包含的基本事件的个数基本事件的总数.(二)随机变量的分布列、期望与方差1. 常用的离散型随机变量的分布列(1)二项分布如果随机变量X 的可能取值为0,1,2,…,n ,且X 取值的概率()P X k ==C k k n kn p q-(其中0,1,2,,,1k n q p ==-),其随机变量分布列为X 0 1 …k…nP0C nnp q111C n np q-…C k k n knp q-…0C n n n p q则称X 服从二项分布,记为(),X B n p ~.(2)超几何分布在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则事件{}X k =发生的概率为C C C k n kM N Mn N--()0,10,1,2,,2,,k m =,其中{}min ,m M n =,且n N …,M N …,n ,M ,*N ÎN .此时称随机变量X 的分布列为超几何分布列,称随机变量X 服从超几何分布.2.条件概率及相互独立事件同时发生的概率 I.条件概率条件概率一般地,设A ,B 为两个事件,且()0P A >,称()()()P ABP B A P A=为事件A 发生的条件下,事件B 发生的条件概率.在古典概型中,若用()n A 表示事件A 中基本事件的个数,则()()()()()n AB P AB P B A n A P A ==. II .相互独立事件相互独立事件(1)若,A B 相互独立.则()P AB =()()P A P B .(3)若A 与B 相互独立,则A 与B ,A 与B ,A 与B 也都相互独立. III .独立重复试验与二项分布独立重复试验与二项分布在n 次独立重复试验中,事件A 发生k 次的概率为(每次试验中事件A 发生的概率为p)()C 1n kkknp p --,事件A 发生的次数是一个随机变量X ,其分布列为()01)2()C 1(n kk knP X k k n p p -===-¼,,,,,此时称随机变量X 服从二项分布. 学科*网3.离散型随机变量的数学期望(均值)与方差 (1)若离散型随机变量X 的概率分布列为的概率分布列为X x 1 x 2 … x i … x n P p 1 p 2 … p i … p n则称EX =1122i i n n x p x p x p x p ++++¼+¼为随机变量X 的均值或数学期望. (2)若Y aX b =+,则EY =aEX b +,)(D aX b +=2a DX (3)若()X B n p ~,,则EX np =.()(1)D X np p -=. 4.正态分布(1)正态曲线的性质:正态曲线的性质:①曲线位于x 轴上方,与x 轴不相交;②曲线是单峰的,它关于直线x m =对称;③曲线在x m=处达到峰值12πs;④曲线与x 轴之间的面积为1;⑤当s 一定时,曲线的位置由m 确定,曲线随着m 的变化而沿x 轴平移,⑥当m 一定时,曲线的形状由s 确定,s 越小,曲线越“瘦高”,表示总体的分布越集中;s 越大,曲线越“矮胖”,表示总体的分布越分散,如图乙所示.(3)服从正态分布的变量在三个特殊区间内取值的概率服从正态分布的变量在三个特殊区间内取值的概率 ①0().6826P X m s m s -<+=…;②2209().544P X m s m s -<+=…; ③3309().974P X m s m s -<+=…. 二、统计与统计案例 (一)抽样方法 1.简单随机抽样设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本()n N …,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,最常用的简单随机抽样的方法:抽签法和随机数表法.最常用的简单随机抽样的方法:抽签法和随机数表法. 2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本.的样本.(1)先将总体的N 个个体编号.(2)确定分段间隔k ,对编号进行分段,当Nn是整数时,取N k n =.如果遇到Nn不是整数的情况,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除得总体中剩余的个体数能被样本容量整除(3)在第1段用简单随机抽样确定第一个个体编号()l l k ….(4)按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号()l k +,再加k 得到第3个个体编号()2l k +,依次进行下去,直到获取整个样本.直到获取整个样本.3.分层抽样在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.分层抽样的应用范围:当总体是由差异明显的几个部分组成的,往往选用分层抽样.层抽样.注:注:不论哪种抽样方法不论哪种抽样方法,总体中的每一个个体入样的概率是相同的. (二)统计图表的含义 1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距和组数.(3)将数据分组.(4)列频率分布表.列频率分布表. (5)画频率分布直方图.画频率分布直方图. (三)样本的数字特征1.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.出现次数最多的数据叫做这组数据的众数.2.中位数:将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数叫做这组数据的中位数3.平均数:样本数据的算术平均数,即x =()121n x x x n+++.4.方差:()()()2222121n s x x x x x x n éù=-+-++-êúëû(n x 是样本数据,n 是样本容量,x 是样本平均数).5.标准差:()()()222121ns x x x x x x n éù=-+-++-êúëû.(四)线性回归直线方程 1.两个变量的线性相关(1)如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫回归直线.(2)从散点图上看,如果点分布在从左下角到右上角的区域内,那么两个变量的这种相关关系称为正相关;如果点分布在从左上角到右下角的区域内,那么两个变量的这种相关关系称为负相关. (3)相关系数相关系数r =ååå===----ni nj jini i i y y x x y y x x 11221)()())((,当0r >时,表示两个变量正相关;当0r <时,表示两个变量负相关.r 的绝对值越接近1,表示两个变量的线性相关性越强;r 的绝对值越接近0,表示两个变量的线性相关性越弱.通常当r 的绝对值大于0.75时,便认为两个变量具有很强的线性相关关系.当1r =时,两个变量在回归直线上两个变量在回归直线上 2.回归直线方程 (1)通过求21()ni i i Qy x a b ==--å的最小值而得出回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.该式取最小值时的a ,b 的值即分别为aˆ,b ˆ. (2)两个具有线性相关关系的变量的一组数据:11(,)x y ,22(,)x y ,…,()n n x y ,,其回归方程为a x b y ˆˆˆ+=,则1122211()()ˆ()ˆˆnn i i i i i i n ni ii i x x y y x y nx yb x x x nxa y bx ====ì---×ï==ïí--ïï=-ïîåååå.注:样本点的中心(),x y 一定在回归直线上. (3)相关系数22121ˆ()1()n i ii ni i y yR y y ==-å=--å.2R 越大,说明残差平方和越小,即模型的拟合效果越好;2R 越小,残差平方和越大,即模型的拟合效果越差.在线性回归模型中,2R表示解释变量对于预报变量变化的贡献率,2R 越接近于1,表示回归的效果越好. (六)独立性检验(1)变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.像这样的变量称为分类变量.(2)像下表所示列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y ,它们的可能取值分别为12(,)x x 和12(,)y y ,其样本频数列联表(称为22´列联表)为表)为y 1 y 2 总计总计x 1 a b a b + x 2 cdc d +总计a c +b d +a b c d +++构造一个随机变量()()()()()22n ad bc K a b c d a c b d -=++++ ,其中n a b c d =+++为样本容量.确定临界值0k ,如果2K 的观测值0k k …,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量之间没有关系”.。
高中数学概率和统计知识点
高中数学之概率与统计求等可能性事件、互斥事件和相互独立事件的概率解此类题目常应用以下知识:(1)等可能性事件(古典概型)的概率:P(A)=)()(I card A card =n m; 等可能事件概率的计算步骤:计算一次试验的基本事件总数n ;设所求事件A ,并计算事件A 包含的基本事件的个数m ; 依公式()mP A n =求值;答,即给问题一个明确的答复.(2)互斥事件有一个发生的概率:P(A +B)=P(A)+P(B); 特例:对立事件的概率:P(A)+P(A )=P(A +A )=1. (3)相互独立事件同时发生的概率:P(A ·B)=P(A)·P(B); 特例:独立重复试验的概率:Pn(k)=kn k k n p p C --)1(.其中P 为事件A 在一次试验中发生的概率,此式为二项式[(1-P)+P]n 展开的第k+1项.(4)解决概率问题要注意“四个步骤,一个结合”:求概率的步骤是:第一步,确定事件性质⎧⎪⎪⎨⎪⎪⎩等可能事件互斥事件 独立事件 n 次独立重复试验即所给的问题归结为四类事件中的某一种.第二步,判断事件的运算⎧⎨⎩和事件积事件即是至少有一个发生,还是同时发生,分别运用相加或相乘事件.第三步,运用公式()()()()()()()()(1)kk n k n n m P A nP A B P A P B P A B P A P B P k C p p -⎧=⎪⎪⎪+=+⎨⎪⋅=⋅⎪=-⎪⎩等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解第四步,答,即给提出的问题有一个明确的答复.例1.在五个数字12345,,,,中,若随机取出三个数字,则剩下两个数字都是奇数的概率是 (结果用数值表示).[解答过程]0.3提示:1335C 33.54C 102P ===⨯例2.一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为 .[解答过程]1.20提示:51.10020P == 例3.接种某疫苗后,出现发热反应的概率为0.80.现有5人接种该疫苗,至少有3人出现发热反应的概率为__________.(精确到0.01)[考查目的] 本题主要考查运用组合、概率的基本知识和分类计数原理解决问题的能力,以及推理和运算能力.[解答提示]至少有3人出现发热反应的概率为33244555550.800.200.800.200.800.94C C C ⋅⋅+⋅⋅+⋅=.故填0.94.离散型随机变量的分布列 1.随机变量及相关概念①随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用希腊字母ξ、η等表示.②随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量. ③随机变量可以取某区间内的一切值,这样的随机变量叫做连续型随机变量. 2.离散型随机变量的分布列①离散型随机变量的分布列的概念和性质一般地,设离散型随机变量ξ可能取的值为1x ,2x ,……,i x ,……,ξ取每一个值i x (=i 1,2,……)的概率P (i x =ξ)=i P ,则称下表.为随机变量ξ的概率分布,简称ξ的分布列.由概率的性质可知,任一离散型随机变量的分布列都具有下述两个性质: (1)0≥i P ,=i 1,2,…;(2)++21P P …=1. ②常见的离散型随机变量的分布列: (1)二项分布n 次独立重复试验中,事件A 发生的次数ξ是一个随机变量,其所有可能的取值为0,1,2,…n ,并且kn k k n k q p C k P P -===)(ξ,其中n k ≤≤0,p q -=1,随机变量ξ的分布列如下:称这样随机变量ξ服从二项分布,记作),(~p n B ξ,其中n 、p 为参数,并记:),;(p n k b q p C kn k k n =- .(2) 几何分布在独立重复试验中,某事件第一次发生时所作的试验的次数ξ是一个取值为正整数的离散型随机变量,“k ξ=”表示在第k 次独立重复试验时事件第一次发生. 随机变量ξ的概率分布为:例1.厂家在产品出厂前,需对产品做检验,厂家将一批产品发给商家时,商家按合同规定也需随机抽取一定数量的产品做检验,以决定是否接收这批产品.(Ⅰ)若厂家库房中的每件产品合格的概率为0.8,从中任意取出4件进行检验,求至少有1件是合格的概率;(Ⅱ)若厂家发给商家20件产品中,其中有3件不合格,按合同规定该商家从中任取2件.都进行检验,只有2件都合格时才接收这批产品.否则拒收,求出该商家检验出不合格产品数ξ的分布列及期望ξE ,并求出该商家拒收这批产品的概率.[解答过程](Ⅰ)记“厂家任取4件产品检验,其中至少有1件是合格品”为事件A 用对立事件A 来算,有()()4110.20.9984P A P A =-=-=(Ⅱ)ξ可能的取值为0,1,2.()2172201360190C P C ξ===, ()11317220511190C C P C ξ===,()2322032190C P C ξ===136513301219019019010E ξ=⨯+⨯+⨯=.记“商家任取2件产品检验,都合格”为事件B ,则商家拒收这批产品的概率()136271119095P P B =-=-=.所以商家拒收这批产品的概率为2795.例12.某项选拔共有三轮考核,每轮设有一个问题,能正确回答问题者进入下一轮考核,否则即被淘汰. 已知某选手能正确回答第一、二、三轮的问题的概率分别为54、53、52,且各轮问题能否正确回答互不影响.(Ⅰ)求该选手被淘汰的概率;(Ⅱ)该选手在选拔中回答问题的个数记为ξ,求随机变量ξ的分布列与数学期望. (注:本小题结果可用分数表示)[解答过程]解法一:(Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =,,,则14()5P A =,23()5P A =,32()5P A =,∴该选手被淘汰的概率112223112123()()()()()()()P P A A A A A A P A P A P A P A P A P A =++=++142433101555555125=+⨯+⨯⨯=.(Ⅱ)ξ的可能值为123,,,11(1)()5P P A ξ===,1212428(2)()()()5525P P A A P A P A ξ====⨯=, 12124312(3)()()()5525P P A A P A P A ξ====⨯=.ξ∴的分布列为11235252525E ξ∴=⨯+⨯+⨯=.解法二:(Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =,,,则14()5P A =,23()5P A =,32()5P A =.∴该选手被淘汰的概率1231231()1()()()P P A A A P A P A P A =-=-4321011555125=-⨯⨯=. (Ⅱ)同解法一.离散型随机变量的期望与方差随机变量的数学期望和方差 (1)离散型随机变量的数学期望:++=2211p x p x E ξ…;期望反映随机变量取值的平均水平.⑵离散型随机变量的方差:+-+-=222121)()(p E x p E x D ξξξ…+-+n n p E x 2)(ξ…;方差反映随机变量取值的稳定与波动,集中与离散的程度.⑶基本性质:b aE b a E +=+ξξ)(;ξξD a b a D 2)(=+.(4)若ξ~B(n ,p),则 np E =ξ ; D ξ =npq (这里q=1-p ) ;如果随机变量ξ服从几何分布,),()(p k g k P ==ξ,则p E 1=ξ,D ξ =2p q 其中q=1-p.例1.甲、乙两名工人加工同一种零件,两人每天加工的零件数相等,所得次品数分别为ε、η,ε和η的分布列如下:则比较两名工人的技术水平的高低为 .思路:一是要比较两名工人在加工零件数相等的条件下出次品数的平均值,即期望;二是要看出次品数的波动情况,即方差值的大小.解答过程:工人甲生产出次品数ε的期望和方差分别为:7.0103210111060=⨯+⨯+⨯=εE ,891.0103)7.02(101)7.01(106)7.00(222=⨯-+⨯-+⨯-=εD ;工人乙生产出次品数η的期望和方差分别为:7.0102210311050=⨯+⨯+⨯=ηE ,664.0102)7.02(103)7.01(105)7.00(222=⨯-+⨯-+⨯-=ηD由E ε=E η知,两人出次品的平均数相同,技术水平相当,但D ε>D η,可见乙的技术比较稳定.小结:期望反映随机变量取值的平均水平;方差反映随机变量取值的稳定与波动,集中与离散的程度. 例2.某商场经销某商品,根据以往资料统计,顾客采用的付款期数ξ的分布列为商场经销一件该商品,采用1期付款,其利润为200元;分2期或3期付款,其利润为250元;分4期或5期付款,其利润为300元.η表示经销一件该商品的利润.(Ⅰ)求事件A :“购买该商品的3位顾客中,至少有1位采用1期付款”的概率()P A ;(Ⅱ)求η的分布列及期望E η.[解答过程](Ⅰ)由A 表示事件“购买该商品的3位顾客中至少有1位采用1期付款”. 知A 表示事件“购买该商品的3位顾客中无人采用1期付款”2()(10.4)0.216P A =-=, ()1()10.2160.784P A P A =-=-=.(Ⅱ)η的可能取值为200元,250元,300元.(200)(1)0.4P P ηξ====,(250)(2)(3)0.20.20.4P P P ηξξ===+==+=,(300)1(200)(250)10.40.40.2P P P ηηη==-=-==--=.η的分布列为2000.42500.43000.2E η=⨯+⨯+⨯240=(元).抽样方法与总体分布的估计 抽样方法1.简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).3.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样. 总体分布的估计由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体的分布,一般地,样本容量越大,这种估计就越精确.总体分布:总体取值的概率分布规律通常称为总体分布.当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及相应的频率表示,几何表示就是相应的条形图.当总体中的个体取值在某个区间上时用频率分布直方图来表示相应样本的频率分布.总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,即总体密度曲线. 典型例题例1.某工厂生产A 、B 、C 三种不同型号的产品,产品数量之比依次为2:3:5.现用分层抽样方法抽出一个容量为n 的样本,样本中A 种型号产品有16件.那么此样本的容量n= .解答过程:A 种型号的总体是210,则样本容量n=1016802⨯=.例2.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m k +的个位数字相同,若6m =,则在第7组中抽取的号码是 .解答过程:第K 组的号码为(1)10k - ,(1)101k -+,…,(1)109k -+,当m=6时,第k 组抽取的号的个位数字为m+k 的个位数字,所以第7组中抽取的号码的个位数字为3 ,所以抽取号码为63.正态分布与线性回归 1.正态分布的概念及主要性质(1)正态分布的概念如果连续型随机变量ξ 的概率密度函数为 222)(21)(σμπσ--=x ex f ,x R ∈ 其中σ、μ为常数,并且σ>0,则称ξ服从正态分布,记为~N ξ(μ,2σ).(2)期望E ξ =μ,方差2σξ=D .(3)正态分布的性质 正态曲线具有下列性质:①曲线在x 轴上方,并且关于直线x =μ对称.②曲线在x=μ时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低.③曲线的对称轴位置由μ确定;曲线的形状由σ确定,σ越大,曲线越“矮胖”;反之越“高瘦”.三σ原则即为数值分布在(μ—σ,μ+σ)中的概率为0.6526 数值分布在(μ—2σ,μ+2σ)中的概率为0.9544 数值分布在(μ—3σ,μ+3σ)中的概率为0.9974 (4)标准正态分布当μ=0,σ=1时ξ服从标准的正态分布,记作~N ξ(0,1) (5)两个重要的公式①()1()x x φφ-=-,② ()()()P a b b a ξφφ<<=-.(6)2(,)N μσ与(0,1)N 二者联系.若2~(,)N ξμσ,则~(0,1)N ξμησ-=;②若2~(,)N ξμσ,则()()()b a P a b μμξφφσσ--<<=-.2.线性回归简单的说,线性回归就是处理变量与变量之间的线性关系的一种数学方法.变量和变量之间的关系大致可分为两种类型:确定性的函数关系和不确定的函数关系.不确定性的两个变量之间往往仍有规律可循.回归分析就是处理变量之间的相关关系的一种数量统计方法.它可以提供变量之间相关关系的经验公式.具体说来,对n 个样本数据(11,x y ),(22,x y ),…,(,n n x y ),其回归直线方程,或经验公式为:a bx y+=ˆ.其中,,)(1221x b y a x n xyx n yx b ni ini ii⋅-=--=∑∑==,其中y x ,分别为|i x |、|i y |的平均数.例1.如果随机变量ξ~N (μ,σ2),且E ξ=3,D ξ=1,则P (-1<ξ≤1=等于( ) A.2Φ(1)-1 B.Φ(4)-Φ(2) C.Φ(2)-Φ(4) D.Φ(-4)-Φ(-2)解答过程:对正态分布,μ=E ξ=3,σ2=D ξ=1,故P (-1<ξ≤1)=Φ(1-3)-Φ(-1-3)=Φ(-2)-Φ(-4)=Φ(4)-Φ(2). 答案:B例2. 将温度调节器放置在贮存着某种液体的容器内,调节器设定在d ℃,液体的温度ξ(单位:℃)是一个随机变量,且ξ~N (d ,0.52). (1)若d=90°,则ξ<89的概率为 ; (2)若要保持液体的温度至少为80 ℃的概率不低于0.99,则d 至少是 ?(其中若η~N (0,1),则Φ(2)=P (η<2)=0.9772,Φ(-2.327)=P (η<-2.327)=0.01).解答过程:(1)P (ξ<89)=F (89)=Φ(5.09089-)=Φ(-2)=1-Φ(2)=1-0.9772=0.0228.(2)由已知d 满足0.99≤P (ξ≥80),即1-P (ξ<80)≥1-0.01,∴P (ξ<80)≤0.01.∴Φ(5.080d-)≤0.01=Φ(-2.327).∴5.080d -≤-2.327.∴d ≤81.1635.故d 至少为81.1635.小结:(1)若ξ~N (0,1),则η=σμξ-~N (0,1).(2)标准正态分布的密度函数f (x )是偶函数,x<0时,f (x )为增函数,x>0时,f (x )为减函数.。
高中数学知识点第十二章-概率与统计
高中数学知识点第十二章-概率与统计 考试内容:抽样方法.总体分布的估计. 总体期望值和方差的估计. 考试要求:(1)了解随机抽样了解分层抽样的意义,会用它们对简单实际问题进行抽样. (2)会用样本频率分布估计总体分布. (3)会用样本估计总体期望值和方差.§12. 概率与统计 知识要点一、随机变量.1. 随机试验的结构应该是不确定的.试验如果满足下述条件: ①试验可以在相同的情形下重复进行;②试验的所有可能结果是明确可知的,并且不止一个;③每次试验总是恰好出现这些结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果.它就被称为一个随机试验.2. 离散型随机变量:如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.若ξ是一个随机变量,a ,b 是常数.则b a +=ξη也是一个随机变量.一般地,若ξ是随机变量,)(x f 是连续函数或单调函数,则)(ξf 也是随机变量.也就是说,随机变量的某些函数也是随机变量.设离散型随机变量ξ可能取的值为: ,,,,21i x x xξ取每一个值),2,1(1 =i x 的概率i i p x P ==)(ξ,则表称为随机变量ξ的概率分布,简称ξ的121i 注意:若随机变量可以取某一区间内的一切值,这样的变量叫做连续型随机变量.例如:]5,0[∈ξ即ξ可以取0~5之间的一切数,包括整数、小数、无理数.3. ⑴二项分布:如果在一次试验中某事件发生的概率是P ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率是:kn k k n qp C k)P(ξ-==[其中p q n k -==1,,,1,0 ] 于是得到随机变量ξ的概率分布如下:我们称这样的随机变量ξ服从二项分布,记作ξ~B(n ·p ),其中n ,p 为参数,并记p)n b(k;qp C k n k k n ⋅=-. ⑵二项分布的判断与应用.①二项分布,实际是对n 次独立重复试验.关键是看某一事件是否是进行n 次独立重复,且每次试验只有两种结果,如果不满足此两条件,随机变量就不服从二项分布. ②当随机变量的总体很大且抽取的样本容量相对于总体来说又比较小,而每次抽取时又只有两种试验结果,此时可以把它看作独立重复试验,利用二项分布求其分布列. 4. 几何分布:“k =ξ”表示在第k 次独立重复试验时,事件第一次发生,如果把k 次试验时事件A 发生记为k A ,事A 不发生记为q )P(A ,A k k =,那么)A A A A P(k)P(ξk 1k 21-== .根据相互独立事件的概率乘法分式:))P(A A P()A )P(A P(k)P(ξk 1k 21-== ),3,2,1(1 ==-k p q k 于是我们称ξ服从几何分布,并记p q p)g(k,1k -=,其中 3,2,1.1=-=k p q5. ⑴超几何分布:一批产品共有N 件,其中有M (M <N )件次品,今抽取)N n n(1≤≤件,则其中的次品数ξ是一离散型随机变量,分布列为)M N k n M,0k (0CC C k)P(ξnNk n MN k M -≤-≤≤≤⋅⋅==--.〔分子是从M 件次品中取k 件,从N-M 件正品中取n-k 件的取法数,如果规定m <r 时0C rm=,则k 的范围可以写为k=0,1,…,n.〕 ⑵超几何分布的另一种形式:一批产品由 a 件次品、b 件正品组成,今抽取n 件(1≤n ≤a+b ),则次品数ξ的分布列为n.,0,1,k CC C k)P(ξnba kn bk a =⋅==+-.⑶超几何分布与二项分布的关系. 设一批产品由a 件次品、b 件正品组成,不放回抽取n 件时,其中次品数ξ服从超几何分布.若放回式抽取,则其中次品数η的分布列可如下求得:把b a +个产品编号,则抽取n 次共有n b a )(+个可能结果,等可能:k)(η=含kn k k n ba C -个结果,故n 0,1,2,k ,)ba a (1)b a a (C b)(a ba C k)P(ηkn k k n nkn k k n =+-+=+==--,即η~)(b a a n B +⋅.[我们先为k 个次品选定位置,共k n C 种选法;然后每个次品位置有a 种选法,每个正品位置有b 种选法] 可以证明:当产品总数很大而抽取个数不多时,k)P(ηk)P(ξ=≈=,因此二项分布可作为超几何分布的近似,无放回抽样可近似看作放回抽样.二、数学期望与方差.1. 期望的含义:一般地,若离散型随机变量ξ的概率分布为n n 2211.数学期望反映了离散型随机变量取值的平均水平.2. ⑴随机变量b a +=ξη的数学期望:b aE b a E E +=+=ξξη)( ①当0=a 时,b b E =)(,即常数的数学期望就是这个常数本身.②当1=a 时,b E b E +=+ξξ)(,即随机变量ξ与常数之和的期望等于ξ的期望与这个常数的和.③当0=b 时,ξξaE a E =)(,即常数与随机变量乘积的期望等于这个常数与随机变量期望的乘积.⑵单点分布:c c E =⨯=1ξ其分布列为:c P ==)1(ξ.⑶两点分布:p p q E =⨯+⨯=10ξ,其分布列为:(p +q = 1)⑷二项分布:∑=⋅-⋅=-np q pk n k n k E k n k)!(!!ξ 其分布列为ξ~),(p n B .(P 为发生ξ的概率)⑸几何分布:pE 1=ξ 其分布列为ξ~),(p k q .(P 为发生ξ的概率) 3.方差、标准差的定义:当已知随机变量ξ的分布列为),2,1()( ===k p x P k k ξ时,则称+-++-+-=n n p E x p E x p E x D 2222121)()()(ξξξξ为ξ的方差. 显然0≥ξD ,故σξξσξ.D =为ξ的根方差或标准差.随机变量ξ的方差与标准差都反映了随机变量ξ取值的稳定与波动,集中与离散的程度.ξD 越小,稳定性越高,波动越小............... 4.方差的性质.⑴随机变量b a +=ξη的方差ξξηD a b a D D 2)()(=+=.(a 、b 均为常数) ⑵单点分布:0=ξD 其分布列为p P ==)1(ξ ⑶两点分布:pq D =ξ 其分布列为:(p + q = 1)⑷二项分布:npq D =ξ ⑸几何分布:2p q D =ξ5. 期望与方差的关系.⑴如果ξE 和ηE 都存在,则ηξηξE E E ±=±)(⑵设ξ和η是互相独立的两个随机变量,则ηξηξηξξηD D D E E E +=+⋅=)(,)(⑶期望与方差的转化:22)(ξξξE E D -= ⑷)()()(ξξξξE E E E E -=-(因为ξE 为一常数)0=-=ξξE E .三、正态分布.(基本不列入考试范围)1.密度曲线与密度函数:对于连续型随机变量ξ,位于x 轴上方,ξ落在任一区间),[b a 内的概率等于它与x 轴.直线a x =与直线b x =(如图阴影部分)的曲线叫ξ的密度曲线,以其作为图像的函数)(x f 叫做ξ的密度函数,由于“),(+∞-∞∈x 是必然事件,故密度曲线与x 轴所夹部分面积等于1.2. ⑴正态分布与正态曲线:如果随机变量ξ的概率密度为:222)(21)(σμσπ--=x ex f .(σμ,,R x ∈为常数,且0 σ),称ξ服从参数为σμ,的正态分布,用ξ~),(2σμN 表示.)(x f 的表达式可简记为),(2σμN ,它的密度曲线简称为正态曲线.⑵正态分布的期望与方差:若ξ~),(2σμN ,则ξ的期望与方差分别为:2,σξμξ==D E . ⑶正态曲线的性质.①曲线在x 轴上方,与x 轴不相交. ②曲线关于直线μ=x 对称.③当μ=x 时曲线处于最高点,当x 向左、向右远离时,曲线不断地降低,呈现出“中间高、两边低”的钟形曲线.④当x <μ时,曲线上升;当x >μ时,曲线下降,并且当曲线向左、向右两边无限延伸时,以x 轴为渐近线,向x 轴无限的靠近.⑤当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”.表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.3. ⑴标准正态分布:如果随机变量ξ的概率函数为)(21)(22+∞-∞=-x ex x πϕ,则称ξ服从标准正态分布. 即ξ~)1,0(N 有)()(x P x ≤=ξϕ,)(1)(x x --=ϕϕ求出,而P (a <ξ≤b )的计算则是)()()(a b b a P ϕϕξ-=≤ .注意:当标准正态分布的)(x Φ的X 取0时,有5.0)(=Φx 当)(x Φ的X 取大于0的数时,有5.0)( x Φ.比如5.00793.0)5.0(=-Φσμ则σμ-5.0必然小于0,如图.⑵正态分布与标准正态分布间的关系:若ξ~),(2σμN 则ξ的分布函数通 常用)(x F 表示,且有)σμx (F(x)x)P(ξ-==≤ϕ.4.⑴“3σ”原则.假设检验是就正态总体而言的,进行假设检验可归结为如下三步:①提出统计假设,统计假设里的变量服从正态分布),(2σμN .②确定一次试验中的取值a 是否落入范围)3,3(σμσμ+-.③做出判断:如果)3,3(σμσμ+-∈a ,接受统计假设. 如果)3,3(σμσμ+-∉a ,由于这是小概率事件,就拒绝统计假设.⑵“3σ”原则的应用:若随机变量ξ服从正态分布),(2σμN 则 ξ落在)3,3(σμσμ+-内的概率为99.7% 亦即落在)3,3(σμσμ+-之外的概率为0.3%,此为小概率事件,如果此事件发生了,就说明此种产品不合格(即ξ不服从正态分布).S 阴=0.5S a =0.5+S。
高中数学《统计》与《概率》知识点
高中数学《统计》与《概率》知识点高中数学的《统计》和《概率》是数学领域中的两个重要分支,它们是数据分析、预测和决策制定等实际问题中必不可少的工具。
下面将详细介绍这两个知识点。
一、统计学是研究数据收集、整理、分析和解释的学科。
统计学的主要任务是从已有的数据中得出结论,进而得到有关总体的信息。
统计学的主要内容包括:1.描述统计:通过数值特征描述数据的中心位置、离散程度等。
描述统计包括以下几个方面:(1)集中趋势:主要有均值、中位数和众数。
均值是一组数据的平均值,中位数是一组数据中处于中间位置的数值,众数是一组数据中出现频率最高的数值。
(2)离散程度:主要有极差、方差和标准差。
极差是一组数据中最大数与最小数的差值,方差是各个数据与均值的差值的平方的平均值,标准差是方差的平方根。
(3)分布形状:主要有正态分布、偏态分布和峰态分布等类型。
2.探索性数据分析:根据数据特征进行初步探索,主要包括绘制直方图、饼图、箱线图等工具来分析数据分布和异常值。
3.概率论:概率是描述随机事件发生可能性的数值,涉及到概率的计算、随机变量及其分布、大数定律和中心极限定理等概念。
(1)概率的定义与性质:概率的定义有经典概率和条件概率等。
经典概率是指在等可能的情况下,一些事件发生的概率。
条件概率是指在已知一事件发生的条件下,另一事件发生的概率。
(2)随机变量与概率分布:随机变量是具有随机性的数值,可分为离散随机变量和连续随机变量。
离散随机变量取有限或可数个数值,其概率分布函数称为概率分布列;连续随机变量在一些区间上取值,其概率分布函数称为概率密度函数。
(3)大数定律与中心极限定理:大数定律是指随着试验次数的增加,频率逼近概率。
中心极限定理是指多个独立随机变量之和的分布近似于正态分布。
4.统计推断:通过样本数据推断总体特征,主要有参数估计和假设检验。
(1)参数估计:根据样本数据估计总体参数,主要有点估计和区间估计。
点估计是用一个数值来估计总体参数,区间估计是用一个区间来估计总体参数,有置信水平的概念。
高中数学《统计》与《概率》知识点
4)互斥事件与对立事件的区别与联系,互斥事件是指事件
A 与事件 B 在一次试验中不会同时发生,其具体包括三
种不同的情形: ( 1)事件 A 发生且事件 B 不发生;( 2)事件 A 不发生且事件 B 发生;( 3)事件 A 与事件 B 同时不
发生,而对立事件是指事件 A 与事件 B 有且仅有一个发生,其包括两种情形; (1)事件 A 发生 B 不发生;( 2)事件
( 2)若 A ∩B 为不可能事件,即 A ∩ B= ф ,那么称事件 A 与事件 B 互斥;
( 3)若 A ∩ B 为不可能事件,且 A ∪B 为必然事件,那么称事件 A 与事件 B 互为对立事件;注意:对立事件一定是互
斥事件,但互斥事件 不一定是 对立事件!
( 4)当事件 A 与 B 互斥时,满足加法公式: P(A ∪ B)= P(A)+ P(B) ;若事件 A 与 B 为对立事件,则 A ∪ B 为必然事件,
( 2)不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不 同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权
处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。 四、用样本的数字特征估计总体的数字特征
nA 与试验总次数 n 的比值 n A ,它具有一定的 n
稳定性,总在某个常数附近摆动,且随着试验次数的不断增多,这种摆动幅度越来越小。我们把这个常数叫做随
机事件的概率, 概率从数量上反映了随机事件发生的可能性的大小。
频率在大量重复试验的前提下可以近似地作
为这个事件的概率 二、 概率的基本性质 1、基本概念: ( 1)事件的包含、并事件、交事件、相等事件;
高中数学概率统计知识点全归纳
高中数学《概率与统计》知识点总结一、统计1、抽样方法:①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显)注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为Nn 。
2、总体分布的估计: ⑴一表二图:①频率分布表——数据详实 ②频率分布直方图——分布直观③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。
⑵茎叶图:①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。
②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。
3、总体特征数的估计:⑴平均数:nx x x x x n++++= 321;取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。
⑵方差与标准差:一组样本数据n x x x ,,,21 方差:212)(1∑=−=ni ix xns ;标准差:21)(1∑=−=ni ix xns注:方差与标准差越小,说明样本数据越稳定。
平均数反映数据总体水平;方差与标准差反映数据的稳定水平。
⑶线性回归方程①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系③线性回归方程:a bx y +=∧(最小二乘法)1221ni i i nii x y nx y b x nx a y bx==⎧−⎪⎪=⎪⎨−⎪⎪=−⎪⎩∑∑ 注意:线性回归直线经过定点),(y x 。
二、概率1、随机事件及其概率:⑴事件:试验的每一种可能的结果,用大写英文字母表示; ⑵必然事件、不可能事件、随机事件的特点; ⑶随机事件A 的概率:1)(0,)(≤≤=A P nmA P . 2、古典概型:⑴基本事件:一次试验中可能出现的每一个基本结果; ⑵古典概型的特点:①所有的基本事件只有有限个; ②每个基本事件都是等可能发生。
高一必修二数学统计与概率
高一必修二数学统计与概率摘要:一、统计与概率的基本概念1.统计学的定义与作用2.概率论的定义与作用3.统计与概率的关系二、数据的收集与整理1.数据的来源与分类2.数据的收集方法3.数据的整理与展示三、描述性统计分析1.频数与频率分布2.图表法3.统计量度四、概率的基本概念与运算1.随机事件与样本空间2.概率的公理化定义3.概率的运算五、条件概率与独立性1.条件概率2.独立性3.贝叶斯公式六、随机变量及其分布1.随机变量的定义与性质2.离散型随机变量3.连续型随机变量七、数学期望与方差1.数学期望2.方差与标准差3.协方差与相关系数正文:在我国高中数学课程中,必修二数学统计与概率是高一阶段的重要内容。
本章主要介绍统计与概率的基本概念、数据的收集与整理、描述性统计分析、概率的基本概念与运算、条件概率与独立性、随机变量及其分布以及数学期望与方差等方面的知识。
首先,统计学是一门研究如何收集、整理、分析、解释以及展示数据的方法论,它具有广泛的应用,如在科学研究、企业管理、政府决策等方面都发挥着重要作用。
概率论则是一门研究随机现象的理论,通过研究随机现象发生的可能性,可以对未来事件进行预测。
统计与概率之间存在密切的联系,统计学中的许多方法都基于概率论的理论。
数据的收集与整理是统计分析的基础。
数据来源于各种渠道,包括实验数据、观测数据和调查数据等。
数据的整理主要包括数据的分类、排序、汇总等操作,而数据的展示则有图表法、描述性统计量度等方法。
描述性统计分析是统计学的一个重要分支,主要通过频数与频率分布、图表法以及统计量度等方法来概括和描述数据的基本特征。
在概率论部分,我们学习随机事件与样本空间、概率的公理化定义以及概率的运算等基本概念。
条件概率与独立性是概率论中的重要内容,通过学习这部分知识,我们可以更好地处理复杂事件之间的概率关系。
此外,贝叶斯公式是一种在概率论中广泛应用的计算工具,它可以帮助我们根据已知信息来更新对未知事件的概率估计。
高中数学统计与概率知识点归纳(全)
高中数学统计与概率知识点(文)一、众数: 一组数据中出现次数最多的那个数据。
众数与平均数的区别: 众数表示一组数据中出现次数最多的那个数据;平均数是一组数据中表示平均每份的数量。
二、.中位数: 一组数据按大小顺序排列,位于最中间的一个数据(当有偶数个数据时,为最中间两个数据的平均数)三 .众数、中位数及平均数的求法。
①众数由所给数据可直接求出;②求中位数时,首先要先排序(从小到大或从大到小),然后根据数据的个数,当数据为奇数个时,最中间的一个数就是中位数;当数据为偶数个时,最中间两个数的平均数就是中位数。
③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平均数。
四、中位数与众数的特点。
⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据; ⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数;⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单位相同;(6)众数可能是一个或多个甚至没有;(7)平均数、众数和中位数都是描述一组数据集中趋势的量。
五.平均数、中位数与众数的异同:⑴平均数、众数和中位数都是描述一组数据集中趋势的量; ⑵平均数、众数和中位数都有单位; ⑶平均数反映一组数据的平均水平,与这组数据中的每个数都有关系,所以最为重要,应用最广; ⑷中位数不受个别偏大或偏小数据的影响;⑸众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的数据。
六、对于样本数据x 1,x 2,…,x n ,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用s 表示.假设样本数据x 1,x 2,…,x n 的平均数为x ,则标准差的计算公式是:七、简单随即抽样的含义一般地,设一个总体有N 个个体, 从中逐个不放回地抽取n 个个体作为样本(n≤N), 如果每次12||||||n x x xx x x n22212()()()n x x x x x x sn抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽样.八、根据你的理解,简单随机抽样有哪些主要特点?(1)总体的个体数有限;(2)样本的抽取是逐个进行的,每次只抽取一个个体;(3)抽取的样本不放回,样本中无重复个体;(4)每个个体被抽到的机会都相等,抽样具有公平性.九、抽签法的操作步骤?第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.第二步,将号签放在一个容器中,并搅拌均匀第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.十一、抽签法有哪些优点和缺点?优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大.十一、利用随机数表法从含有N个个体的总体中抽取一个容量为n的样本,其抽样步骤如何?第一步,将总体中的所有个体编号.第二步,在随机数表中任选一个数作为起始数.第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.简单随机抽样一般采用两种方法:抽签法和随机数表法。
高中数学选修统计和概率
概率与统计知识点:1、随机变量:如果随机试验可能出现的结果可以用一个变量X 来表示,并且X 是随着试验的结果的不同而变化,那么这样的变量叫做随机变量.随机变量常用大写字母X 、Y 等或希腊字母ξ、η等表示。
2、离散型随机变量:在上面的射击、产品检验等例子中,对于随机变量X 可能取的值,我们可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.3、离散型随机变量的分布列:一般的,设离散型随机变量X 可能取的值为x 1,x 2,.....,x i ,......,x n X 取每一个值x i (i=1,2,......)的概率P(ξ=x i )=P i ,则称表为离散型随机变量X 的概率分布,简称分布列456、n(n ≤N)件,这n 0,1,2,,)m , 其中m =7、概率.8、公式9、10、n 11、如中(k P =ξ12、则称E 是13、14、N15、方差:D(ξ)=(x 1-E ξ)2·P 1+(x 2-E ξ)2·P 2+......+(x n -E ξ)2·P n 叫随机变量ξ的均方差,简称方差。
16、集中分布的期望与方差一览:若概率密度曲线就是或近似地是函数的图像,其中解析式中的实数0)μσσ>、(是参数,分别表示总体的平均数与标准差. 则其分布叫正态分布(,)N μσ记作:,f(x)的图象称为正态曲线。
18.基本性质:③当时x x 轴为④当μ越小,19.3σ考点:123★★★1目B (1)求X (2)★★★2济南市有大明湖、趵突泉、千佛山、园博园4个旅游景点,一位客人浏览这四个景点的概率分别是0.3,0.4,0.5,0.6,且客人是否游览哪个景点互不影响,设ξ表示客人离开该城市时游览的景点数与没有游览的景点数之差的绝对值。
(1)求ξ=0对应的事件的概率;(2)求ξ的分布列及数学期望。
★★★3.袋子中装有8个黑球,2个红球,这些球只有颜色上的区别。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应
用
最
广
;
⑷中位数不受个别偏大或偏小数据的影响;
⑸众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的数
据
。
六、对于样本数据 x1,x2,…,xn,设想通过各数据到其平均数的平均距离来反映样本数 据的分散程度,那么这个平均距离如何计算?
| x1 x | | x2 x |
| xn x |
第一部分:统计
高中数学统计与概率知识点(文)
一、什
么
是
众
数
。
一组数据中出现次数最多的那个数据,叫做这组数据的众数。
众
数
的
特
点
。
①众数在一组数据中出现的次数最多;②众数反映了一组数据的集中趋势,当众数出现
的次数越多,它就越能代表这组数据的整体状况,并且它能比较直观地了解到一组数据的
大致情况。但是,当一组数据大小不同,差异又很大时,就很难判断众数的准确值了。此
第一步,将这 600 件产品编号为 1,2,3,…,600. 第二步,将总体平均分成 60 部分,每一部分含 10 个个体. 第三步,在第 1 部分中用简单随机抽样抽取一个号码(如 8 号). 第四步,从该号码起,每隔 10 个号码取一个号码,就得到一个容量为 60 的样本.(如 8,18,28,…,598)
数
据
的
单
位
相
同
;
(6)众数可能是一个或多个甚至没有;
(7)平均数、众数和中位数都是描述一组数据集中趋势的量。
1 / 10
五.平均数、中位数与众数的异同:
⑴平均数、众数和中位数都是描述一组数据集中趋势的量;
⑵平均数、众数和中位数都有单位;
⑶平均数反映一组数据的平均水平,与这组数据中的每个数都有关系,所以最为重要,
如果每次抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽 样.
八、根据你的理解,简单随机抽样有哪些主要特点? (1)总体的个体数有限; (2)样本的抽取是逐个进行的,每次只抽取一个个体; (3)抽取的样本不放回,样本中无重复个体; (4)每个个体被抽到的机会都相等,抽样具有公平性.
九、抽签法的操作步骤? 第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上. 第二步,将号签放在一个容器中,并搅拌均匀 第三步,每次从中抽取一个号签,连续抽取 n 次,就得到一个容量为 n 的样本.
2 / 10
十一、抽签法有哪些优点和缺点? 优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽
简单随机抽样每个个体入样的可能性都相等,均为 n/N,但是这里一定要将每个 个体入样的可能性、第 n 次每个个体入样的可能性、特定的个体在第 n 次被抽到的可 能性这三种情况区分开来,避免在解题中出现错误.
3 / 10
解题应用 如果从 600 件产品中抽取 60 件进行质量检查,按照上述思路抽样应如何操作?
n 思考 4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用 s 表示.假
设样本数据 x1,x2,…,xn 的平均数为 x ,则标准差的计算公式是:
s (x1 x)2 (x2 x)2 n
(xn x)2
七、简单随即抽样的含义 一般地,设一个总体有 N 个个体, 从中逐个不放回地抽取 n 个个体作为样本(n≤N),
外,当一组数据的那个众数出现的次数不具明显优势时,用它来反映一组数据的典型水平
是
不
大
可
靠
的
。
3.众数与平均数的区别。
众数表示一组数据中出现次数最多的那个数据;平均数是一组数据中表示平均每份的数
量
。
二
、
.
中
位
数
的
概
念
。
一组数据按大小顺序排列,位于最中间的一个数据(当有偶数个数据时,为最中间两
个数据的平均数)叫做这组数据的中位数。
简单随机抽样一般采用两种方法:抽签法和随机数表法。 思考: 如果从 100 个个体中抽取一个容量为 10 的样本,你认为对这 100 个个体进行怎样 编号为宜?
解法 1:(抽签法)将 100 件轴编号为 1,2,…,100,并做好大小、形状相同的号 签,分别写上这 100 个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取 10 个 号签,然后测量这个 10 个号签对应的轴的直径。 解法 2:(随机数表法)将 100 件轴编号为 00,01,…99,在随机数表中选定一个起 始位置,如取第 21 行第 1 个数开始,选取 10 个为 68,34,30,13,70,55,74, 77,40,44,这 10 件即为所要抽取的样本。
小结、 简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体
的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样 方法有抽签法和随机数法.
抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方 便, 如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法 相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种 方法只适合总体容量较少的抽样类型.
三
.众数、中位数及平均数的求法。
①众数由所给数据可直接求出;②求中位数时,首先要先排序(从小到大或从大到小),
然后根据数据的个数,当数据为奇数个时,最中间的一个数就是中位数;当数据为偶数个
时,最中间两个数的平均数就是中位数。③求平均数时,就用各数据的总和除以数据的个
数,得数就是这组数据的平均数。
四、中位数与众数的特点。
⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数
据
;
⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中
位数;若这组数据是偶数个时,则中间的两个数据的平均数是中位数;
⑶中位数的单位与数据的单位相同;
⑷众数考察的是一组数据中出现的频数;
⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与
中,从而能保证样本的代表性. 缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大.
十一、 利用随机数表法从含有 N 个个体的总体中抽取一个容量为 n 的样本,其抽样步 骤如何?
第一步,将总体中的所有个体编号. 第二步,在随机数表中任选一个数作为起始数. 第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取 出,编号范围外的数去掉,直到取满 n 个号码为止,就得到一个容量为 n 的样本.