高中数学统计与概率知识点

合集下载

高中数学统计与概率

高中数学统计与概率1、概率的定义随机事件A的概率是频率的稳定值；频率是概率的近似值。

2、等可能事件的概率如果一次试验中可能出现的结果有n个，且所有结果出现的可能性都相等，那么，每一个基本事件的概率都是1/n，如果某个事件A包含的结果有m个，那么事件A的概率为P(A)=m/n。

3、互斥事件不可能同时发生的两个事件叫互斥事件。

如果事件A、B互斥，那么事件A+B发生（A、B中有一个发生）的概率，等于事件A、B分别发生的概率和，即P(A+B)=P(A)+P(B)。

4．抽签法和随机数表法（1）抽签法①优点：简单易行；②缺点：当总体容量非常大时，操作比较麻烦；若抽取前搅拌不均匀，可能导致抽取的样本不具有代表性.（2）随机数表法随机数表是由水技术（通常为自然数）形成的数表，表中的每一位置出现的数都是随机的.随机数表法的一般步骤：第一步：对总体进行编号；第二步：任意指定一个开始选取的位置，位置的确定可以闭着眼用手指随机确定，也可以用其他方法；第三步：按照一定规则选取编号；第四步：按照得到的编号找出对应的个体.【注释】①规则一经确定，就不能更改；②选取过程中，遇到超过编号范围或已经选取了的数字，应该舍弃.5．分层抽样一般地，如果相对于要考察的问题来说，总体可以分为有明显差别的，互不重叠的几部分时，每一部分可称为层，在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样（简称分层抽样）.【注释】分层抽样得到的样本，一般更具有代表性，可以更准确地反映总体的特征，尤其是在层内个体相对同质而层间差异较大时更是如此.分层抽样在各层中抽样时，还可根据各层的特点灵活选用不同的随机抽样方法.。

高中数学统计与概率知识点

高中数学统计与概率知识点一、统计学基础1. 数据收集- 普查与抽样调查- 数据的类型（定量数据与定性数据）2. 数据整理与展示- 频数分布表- 直方图- 饼图- 条形图3. 中心趋势的度量- 平均数（算术平均数）- 中位数- 众数4. 离散程度的度量- 极差- 四分位距- 方差与标准差5. 相关性分析- 相关系数- 散点图二、概率论基础1. 随机事件- 事件的定义- 必然事件与不可能事件- 互斥事件与独立事件2. 概率的计算- 单次试验的概率- 多次试验的概率- 条件概率- 贝叶斯定理3. 随机变量- 离散随机变量与连续随机变量 - 概率分布- 概率密度函数与概率分布函数4. 期望值与方差- 随机变量的期望值- 随机变量的方差5. 常见概率分布- 二项分布- 泊松分布- 正态分布三、统计与概率的应用1. 假设检验- 零假设与备择假设- 显著性水平- 第一类错误与第二类错误 - t检验与卡方检验2. 回归分析- 线性回归- 相关系数与决定系数3. 抽样与估计- 抽样误差- 置信区间- 最大似然估计四、综合练习题1. 选择题- 统计图表解读- 概率计算- 假设检验2. 填空题- 计算平均数、中位数、众数 - 计算方差、标准差- 概率分布的应用3. 解答题- 解释统计概念- 概率问题的求解- 应用统计方法解决实际问题五、附录1. 公式汇总- 统计学公式- 概率论公式2. 重要概念索引- 术语解释- 概念间的关系3. 参考资料- 推荐阅读书籍- 在线资源链接请根据需要对上述内容进行编辑和调整。

这篇文章是为了提供一个关于高中数学统计与概率的知识点概览，适用于教育目的。

每个部分都包含了关键的子标题和简短的描述，以便于理解和使用。

(最全)高中数学概率统计知识点总结

高中数学-概率与统计一、普通的众数、平均数、中位数及方差 1、众数：一组数据中，出现次数最多的数。

2、平均数：①、常规平均数：12nx x x x n++⋅⋅⋅+=②、加权平均数：112212n n n x x x x ωωωωωω++⋅⋅⋅+=++⋅⋅⋅+3、中位数：从大到小或者从小到大排列，最中间或最中间两个数的平均数。

4、方差：2222121[()()()]n s x x x x x x n=-+-+⋅⋅⋅+- 二、频率直方分布图下的频率1、频率 =小长方形面积：f S y d ==⨯距；频率=频数/总数2、频率之和：121n f f f ++⋅⋅⋅+=；同时 121n S S S ++⋅⋅⋅+=；三、频率直方分布图下的众数、平均数、中位数及方差 1、众数：最高小矩形底边的中点。

2、平均数： 112233n nx x f x f x f x f =+++⋅⋅⋅+ 112233n n x x S x S x S x S =+++⋅⋅⋅+ 3、中位数：从左到右或者从右到左累加，面积等于0.5时x 的值。

4、方差：22221122()()()n n s x x f x x f x x f =-+-+⋅⋅⋅+-四、线性回归直线方程：ˆˆˆybx a =+ 其中：1122211()()ˆ()nni i i i i i nni i i i x x y y x y nxybx x x nx ====---∑∑==--∑∑ , ˆˆay bx =- 1、线性回归直线方程必过样本中心(,)x y ；2、ˆ0:b>正相关；ˆ0:b <负相关。

3、线性回归直线方程：ˆˆˆy bx a =+的斜率ˆb 中，两个公式中分子、分母对应也相等；中间可以推导得到。

五、回归分析1、残差：ˆˆi i i ey y =-（残差=真实值—预报值）。

分析：ˆi e 越小越好； 2、残差平方和：21ˆ()ni i i y y=-∑，分析：①意义：越小越好； ②计算：222211221ˆˆˆˆ()()()()ni i n n i y yy y y y y y =-=-+-+⋅⋅⋅+-∑ 3、拟合度（相关指数）：22121ˆ()1()ni i i ni i y yR y y ==-∑=--∑，分析：①.(]20,1R ∈的常数； ②.越大拟合度越高；4、相关系数：()()nni i i i x x y y x y nx yr ---⋅∑∑==分析：①.[r ∈-的常数； ②.0:r >正相关；0:r <负相关③.[0,0.25]r ∈；相关性很弱； (0.25,0.75)r ∈；相关性一般； [0.75,1]r ∈；相关性很强；六、独立性检验 1、2×2列联表： 2、独立性检验公式 ①．22()()()()()n ad bc k a b c d a c b d -=++++②．犯错误上界P 对照表3、独立性检验步骤①．计算观察值k ：2()()()()()n ad bc k a b c d a c b d -=++++；②．查找临界值0k ：由犯错误概率P ，根据上表查找临界值0k ；③．下结论：0k k ≥：即犯错误概率不超过P 的前提下认为： ,有1-P 以上的把握认为： ; 0k k <：即犯错误概率超过P 的前提认为： ,没有1-P 以上的把握认为： ;【经典例题】题型1 与茎叶图的应用例1（2014全国）某市为考核甲、乙两部门的工作情况，学科网随机访问了50位市民。

高中数学概率与统计知识点

高中数学概率与统计知识点1、概率的定义随机事件A的概率是频率的稳定值；频率是概率的近似值。

3、互斥事件不可能同时发生的两个事件叫互斥事件。

如果事件A、B互斥，那么事件A+B发生（A、B中有一个发生）的概率，等于事件A、B 分别发生的概率和，即P(A+B)=P(A)+P(B)。

4、对立事件对立事件是指两个事件必有一个发生的互斥事件。

例如:从1~52张扑克牌中任取一张抽到“红桃”与抽到“黑桃”互为互斥事件，因为其中一个不可能同时发生，但又不能保证其中一个必然发生，故不是对立事件。

而抽到“红色牌”与抽到“黑色牌”互为对立事件，因为其中一个必发生。

对立事件的性质:1)对立事件的概率和等于1:P(A)+P(Ä)=P(A+A)=1。

2)互为对立的两个事件一定互斥，但互斥不一定是对立事件。

5、相互独立事件事件A(或B)是否发生对事件B(或A)发生的概率没有影响，这样的两个事件叫做相互独立事件。

两个相互独立事件同时发生的概率，等于每个事件发生的概率的积，即P(A·B)=P(A)·P(B)。

相互独立事件的性质:1)如果事件A与B相互独立，那么A与B,A与B，A与B也都相互独立。

2)必然事件与任何事件都是相互独立的。

3)独立事件是对任意多个事件来讲，而互斥事件是对同一实验来讲的多个事件，且这多个事件不能同时发生，故这些事件相互之间必然影响，因此互斥事件一定不是独立事件。

6、独立重复试验若n次重复试验中，每次试验结果的概率都不依赖于其他各次试验的结果，则称这n次试验是独立的。

如果在一次试验中某事件发生的概率为P，那么在n次独立重复试验中这个事件恰好发生k 次的概率:P…(k)=CP*(1-P)"-*7、两个事件之间的关系对任何两个事件都有P(A+B)=P(A)+P(B)-P(A·B)。

(完整版)高中数学统计与概率知识点归纳(全)

高中数学统计与概率知识点（文）的平均数就是中位数。

③求平均数时，就用各数据的总和除以数据的个数，得数就是这组数据的平均数。

四、中位数与众数的特点。

⑴中位数是一组数据中唯一的，可能是这组数据中的数据，也可能不是这组数据中的数据；⑵求中位数时，先将数据有小到大顺序排列，若这组数据是奇数个，则中间的数据是中位数；若这组数据是偶数个时，则中间的两个数据的平均数是中位数； ⑶中位数的单位与数据的单位相同； ⑷众数考察的是一组数据中出现的频数；⑸众数的大小只与这组数的个别数据有关，它一定是一组数据中的某个数据，其单位与数据的单位相同；（6）众数可能是一个或多个甚至没有；（7）平均数、众数和中位数都是描述一组数据集中趋势的量。

五、平均数、中位数与众数的异同：⑴平均数、众数和中位数都是描述一组数据集中趋势的量； ⑵平均数、众数和中位数都有单位； ⑶平均数反映一组数据的平均水平，与这组数据中的每个数都有关系，所以最为重要，应用最广;⑷中位数不受个别偏大或偏小数据的影响；⑸众数与各组数据出现的频数有关，不受个别数据的影响，有时是我们最为关心的数据。

六、对于样本数据 X i , X 2,…，X n ,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度，那么这个平均距离如何计算？|X i - x| + |X 2- X| + L + |X n - x|思考4：反映样本数据的分散程度的大小，最常用的统计量是标准差，一般用s 表示•假设样本数据X i , X 2,…，X n 的平均数为X ，则标准差的计算公式是:(X i - X)2 + (X 2 - x)2 + L +(x n - X)2七、简单随即抽样的含义一般地，设一个总体有 N 个个体，从中逐个不放回地抽取 n 个个体作为样本（n W N ）,如果每次抽取时总体内的各个个体被抽到的机会都相等，则这种抽样方法叫做简单随机抽样•八、根据你的理解，简单随机抽样有哪些主要特点？一、众数：一组数据中出现次数最多的那个数据。

高中数学统计与概率知识点

高中数学统计与概率知识点高中数学统计与概率知识点第一部分：统计一、众数众数是一组数据中出现次数最多的数据。

它反映了数据的集中趋势，但当数据大小差异很大时，众数的准确值难以判断。

此外，当众数出现次数不具明显优势时，用它来反映数据的典型水平是不可靠的。

二、中位数中位数是一组数据中位于最中间的数据，当数据为偶数个时，为最中间两个数据的平均数。

求中位数时，需要先将数据排序，然后根据数据的个数来确定中位数。

三、众数、中位数及平均数的求法众数由所给数据可直接求出；求中位数时，需要先排序，然后根据数据的个数来确定中位数；求平均数时，需要将各数据的总和除以数据的个数。

四、中位数与众数的特点中位数是一组数据中唯一的，可能是这组数据中的数据，也可能不是；众数考察的是一组数据中出现的频数，它的大小只与这组数据的个别数据有关，可能是一个或多个，甚至没有。

五、平均数、中位数与众数的异同平均数、中位数和众数都是描述一组数据集中趋势的量，都有单位。

平均数反映数据的平均水平，与每个数据都有关系，应用最广；中位数不受个别偏大或偏小数据的影响；众数与各组数据出现的频数有关，不受个别数据的影响，有时是我们最为关心的数据。

六、样本数据的分散程度对于样本数据x1，x2，…，xn，可以通过各数据到其平均数的平均距离来反映样本数据的分散程度。

平均距离的计算公式为12n。

本文介绍了统计学中常用的标准差，以及简单随机抽样的定义和特点。

其中，简单随机抽样的主要特点包括总体个体数有限、逐个抽取、不放回、公平性。

抽签法是一种简单易行的抽样方法，但在总体个数较多时可能会导致样本代表性差。

随机数表法是另一种常用的抽样方法，其步骤包括编号、选定起始位置和依次读取。

最后，对于从100个个体中抽取一个容量为10的样本，可以采用抽签法或随机数表法进行编号。

十三、系统抽样的一般步骤在使用系统抽样从总体中抽取样本时，首先需要将总体中的所有个体进行编号。

举例来说，如果要从605件产品中抽取60件进行质量检查，由于605件产品不能均衡分成60部分，因此需要先从总体中随机剔除5个个体，再均衡分成60部分。

(完整word版)高中数学统计与概率知识点归纳(全)

高中数学统计与概率知识点（文）一、众数: 一组数据中出现次数最多的那个数据。

众数与平均数的区别: 众数表示一组数据中出现次数最多的那个数据；平均数是一组数据中表示平均每份的数量。

二、.中位数: 一组数据按大小顺序排列，位于最中间的一个数据(当有偶数个数据时，为最中间两个数据的平均数)三 .众数、中位数及平均数的求法。

①众数由所给数据可直接求出;②求中位数时，首先要先排序(从小到大或从大到小)，然后根据数据的个数，当数据为奇数个时，最中间的一个数就是中位数;当数据为偶数个时，最中间两个数的平均数就是中位数。

③求平均数时，就用各数据的总和除以数据的个数，得数就是这组数据的平均数。

四、中位数与众数的特点。

⑴中位数是一组数据中唯一的，可能是这组数据中的数据，也可能不是这组数据中的数据； ⑵求中位数时，先将数据有小到大顺序排列，若这组数据是奇数个，则中间的数据是中位数；若这组数据是偶数个时，则中间的两个数据的平均数是中位数； ⑶中位数的单位与数据的单位相同； ⑷众数考察的是一组数据中出现的频数；⑸众数的大小只与这组数的个别数据有关，它一定是一组数据中的某个数据，其单位与数据的单位相同；（6）众数可能是一个或多个甚至没有；（7）平均数、众数和中位数都是描述一组数据集中趋势的量。

五.平均数、中位数与众数的异同：⑴平均数、众数和中位数都是描述一组数据集中趋势的量； ⑵平均数、众数和中位数都有单位； ⑶平均数反映一组数据的平均水平，与这组数据中的每个数都有关系，所以最为重要，应用最广； ⑷中位数不受个别偏大或偏小数据的影响；⑸众数与各组数据出现的频数有关，不受个别数据的影响，有时是我们最为关心的数据。

六、对于样本数据x 1，x 2，…，x n ，设想通过各数据到其平均数的平均距离来反映样本数据的分散程度，那么这个平均距离如何计算？思考4：反映样本数据的分散程度的大小，最常用的统计量是标准差，一般用s 表示.假设样本数据x 1，x 2，…，x n 的平均数为x ，则标准差的计算公式是：七、简单随即抽样的含义一般地,设一个总体有N 个个体, 从中逐个不放回地抽取n 个个体作为样本（n≤N）, 如果每次12||||||n x x x x x x n-+-++-L 22212()()()n x x x x x x s n -+-++-=L抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽样.八、根据你的理解，简单随机抽样有哪些主要特点？（1）总体的个体数有限；（2）样本的抽取是逐个进行的，每次只抽取一个个体；（3）抽取的样本不放回，样本中无重复个体；（4）每个个体被抽到的机会都相等，抽样具有公平性.九、抽签法的操作步骤？第一步，将总体中的所有个体编号，并把号码写在形状、大小相同的号签上.第二步，将号签放在一个容器中，并搅拌均匀第三步，每次从中抽取一个号签，连续抽取n次，就得到一个容量为n的样本.十一、抽签法有哪些优点和缺点？优点：简单易行，当总体个数不多的时候搅拌均匀很容易，个体有均等的机会被抽中，从而能保证样本的代表性.缺点：当总体个数较多时很难搅拌均匀，产生的样本代表性差的可能性很大.十一、利用随机数表法从含有N个个体的总体中抽取一个容量为n的样本，其抽样步骤如何？第一步，将总体中的所有个体编号.第二步，在随机数表中任选一个数作为起始数.第三步，从选定的数开始依次向右（向左、向上、向下）读，将编号范围内的数取出，编号范围外的数去掉，直到取满n个号码为止，就得到一个容量为n的样本.简单随机抽样一般采用两种方法：抽签法和随机数表法。

高中数学统计与概率知识点归纳全

高中数学统计与概率知识点归纳全统计与概率是数学中重要的一部分，出现在中学数学和高中数学的教学中。

它涵盖了很多基本的概念和方法，并且在实际生活中有广泛的应用。

本文将全面归纳高中数学统计与概率的知识点，以帮助读者更好地理解和掌握这一领域的内容。

一、基本概念1. 数据与统计：数据是通过观察、测量或实验获得的信息，统计是对数据进行收集、整理、分析和解释的过程。

2. 总体与样本：总体是指研究对象的全体，样本是从总体中选取的一部分。

3. 参数与统计量：参数是描述总体的数值特征，统计量是根据样本数据计算得到的总体参数的估计值。

4. 随机事件与样本空间：随机事件是指一个结果不确定、以概率形式描述的事件，样本空间是随机事件可能发生的所有结果的集合。

5. 概率：概率是用来描述随机事件发生可能性大小的数值。

它可以通过实验、几何、统计推理等方法进行计算。

二、统计方法1. 数据收集与处理：包括数据的收集、整理和清洗，以及计算数据的频数、频率、中位数、平均数等。

2. 描述统计和推断统计：描述统计通过图表、图像和数值等形式展示数据的分布特征；推断统计则通过样本数据进行参数估计、假设检验等，从而对总体进行推断。

3. 频数分布与频率分布：频数分布是指将数据按照取值范围划分成若干组，并统计每组中数据出现的频数；频率分布则是统计每组数据出现的频率。

三、概率相关知识1. 事件的概率：事件A发生的概率记为P(A)，它满足0≤P(A)≤1。

2. 基本事件与复合事件：基本事件是样本空间中的单个事件，复合事件由一个或多个基本事件组成。

3. 互斥事件与相对事件：互斥事件是指两个事件不可能同时发生，相对事件是指两个事件都能够发生，或者都不能发生。

4. 概率的计算：通过等可能原理、频率法、古典概型等方法计算事件的概率。

5. 条件概率与独立事件：条件概率是指在已知事件B发生的条件下，事件A发生的概率，记为P(A|B)；独立事件是指事件A和事件B的发生与否互不影响。

高中数学概率与统计知识点总结

概率与统计一、概率及随机变量的分布列、期望与方差(一)概率及其计算1.几个互斥事件和事件概率的加法公式①如果事件A 与事件B 互斥,则()P A B =()()P A P B +.推广：如果事件1A ,2A ,…,n A 两两互斥(彼此互斥),那么事件12n A A A +++发生的概率,等于这n 个事件分别发生的概率的和,即()12n P A A A +++=()()()12n P A P A P A ++.②若事件B 与事件A 互为对立事件,则()P A =()1P B -. 2.古典概型的概率公式P (A )＝A 包含的基本事件的个数基本事件的总数．(二)随机变量的分布列、期望与方差1. 常用的离散型随机变量的分布列(1)二项分布如果随机变量X 的可能取值为0,1,2,…,n ,且X 取值的概率()P X k ==C k k n kn p q-(其中0,1,2,,,1k n q p ==-),其随机变量分布列为X 0 1 …k…nP0C nnp q111C n np q-…C k k n knp q-…0C n n n p q则称X 服从二项分布,记为(),X B n p ~.(2)超几何分布在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则事件{}X k =发生的概率为C C C k n kM N Mn N--()0,10,1,2,,2,,k m =,其中{}min ,m M n =,且n N …,M N …,n ,M ,*N ÎN .此时称随机变量X 的分布列为超几何分布列,称随机变量X 服从超几何分布.2.条件概率及相互独立事件同时发生的概率 I.条件概率条件概率一般地,设A ,B 为两个事件,且()0P A >,称()()()P ABP B A P A=为事件A 发生的条件下,事件B 发生的条件概率.在古典概型中,若用()n A 表示事件A 中基本事件的个数,则()()()()()n AB P AB P B A n A P A ==. II .相互独立事件相互独立事件(1)若,A B 相互独立.则()P AB =()()P A P B .(3)若A 与B 相互独立,则A 与B ,A 与B ,A 与B 也都相互独立. III .独立重复试验与二项分布独立重复试验与二项分布在n 次独立重复试验中,事件A 发生k 次的概率为(每次试验中事件A 发生的概率为p)()C 1n kkknp p --,事件A 发生的次数是一个随机变量X ,其分布列为()01)2()C 1(n kk knP X k k n p p -===-¼，，，，,此时称随机变量X 服从二项分布. 学科*网3.离散型随机变量的数学期望（均值）与方差 (1)若离散型随机变量X 的概率分布列为的概率分布列为X x 1 x 2 … x i … x n P p 1 p 2 … p i … p n则称EX =1122i i n n x p x p x p x p ++++¼+¼为随机变量X 的均值或数学期望. (2)若Y aX b =+,则EY =aEX b +,)(D aX b +=2a DX (3)若()X B n p ～，,则EX np =.()(1)D X np p -=. 4.正态分布(1)正态曲线的性质：正态曲线的性质：①曲线位于x 轴上方,与x 轴不相交；②曲线是单峰的,它关于直线x m =对称；③曲线在x m=处达到峰值12πs；④曲线与x 轴之间的面积为1；⑤当s 一定时,曲线的位置由m 确定,曲线随着m 的变化而沿x 轴平移,⑥当m 一定时,曲线的形状由s 确定,s 越小,曲线越“瘦高”,表示总体的分布越集中；s 越大,曲线越“矮胖”,表示总体的分布越分散,如图乙所示.(3)服从正态分布的变量在三个特殊区间内取值的概率服从正态分布的变量在三个特殊区间内取值的概率 ①0().6826P X m s m s -<+=…；②2209().544P X m s m s -<+=…； ③3309().974P X m s m s -<+=…. 二、统计与统计案例 (一)抽样方法 1．简单随机抽样设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本()n N …,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,最常用的简单随机抽样的方法：抽签法和随机数表法．最常用的简单随机抽样的方法：抽签法和随机数表法． 2．系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本．的样本．(1)先将总体的N 个个体编号．(2)确定分段间隔k ,对编号进行分段,当Nn是整数时,取N k n =．如果遇到Nn不是整数的情况,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除得总体中剩余的个体数能被样本容量整除(3)在第1段用简单随机抽样确定第一个个体编号()l l k …．(4)按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号()l k +,再加k 得到第3个个体编号()2l k +,依次进行下去,直到获取整个样本．直到获取整个样本．3．分层抽样在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样．分层抽样的应用范围：当总体是由差异明显的几个部分组成的,往往选用分层抽样．层抽样．注：注：不论哪种抽样方法不论哪种抽样方法,总体中的每一个个体入样的概率是相同的．（二）统计图表的含义 1．作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差)．(2)决定组距和组数．(3)将数据分组．(4)列频率分布表．列频率分布表． (5)画频率分布直方图．画频率分布直方图．（三）样本的数字特征1．众数：在一组数据中,出现次数最多的数据叫做这组数据的众数．出现次数最多的数据叫做这组数据的众数．2．中位数：将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数叫做这组数据的中位数3．平均数：样本数据的算术平均数,即x =()121n x x x n+++．4．方差：()()()2222121n s x x x x x x n éù=-+-++-êúëû(n x 是样本数据,n 是样本容量,x 是样本平均数)．5.标准差：()()()222121ns x x x x x x n éù=-+-++-êúëû．（四）线性回归直线方程 1．两个变量的线性相关(1)如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫回归直线．(2)从散点图上看,如果点分布在从左下角到右上角的区域内,那么两个变量的这种相关关系称为正相关；如果点分布在从左上角到右下角的区域内,那么两个变量的这种相关关系称为负相关． (3)相关系数相关系数r ＝ååå===----ni nj jini i i y y x x y y x x 11221)()())((,当0r >时,表示两个变量正相关；当0r <时,表示两个变量负相关．r 的绝对值越接近1,表示两个变量的线性相关性越强；r 的绝对值越接近0,表示两个变量的线性相关性越弱．通常当r 的绝对值大于0.75时,便认为两个变量具有很强的线性相关关系．当1r =时,两个变量在回归直线上两个变量在回归直线上 2．回归直线方程 (1)通过求21()ni i i Qy x a b ==--å的最小值而得出回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法．该式取最小值时的a ,b 的值即分别为aˆ,b ˆ． (2)两个具有线性相关关系的变量的一组数据：11(,)x y ,22(,)x y ,…,()n n x y ,,其回归方程为a x b y ˆˆˆ+=,则1122211()()ˆ()ˆˆnn i i i i i i n ni ii i x x y y x y nx yb x x x nxa y bx ====ì---×ï==ïí--ïï=-ïîåååå．注：样本点的中心(),x y 一定在回归直线上．（3）相关系数22121ˆ()1()n i ii ni i y yR y y ==-å=--å．2R 越大,说明残差平方和越小,即模型的拟合效果越好；2R 越小,残差平方和越大,即模型的拟合效果越差．在线性回归模型中,2R表示解释变量对于预报变量变化的贡献率,2R 越接近于1,表示回归的效果越好．（六）独立性检验（1）变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量．像这样的变量称为分类变量．（2）像下表所示列出两个分类变量的频数表,称为列联表．假设有两个分类变量X和Y ,它们的可能取值分别为12(,)x x 和12(,)y y ,其样本频数列联表（称为22´列联表）为表）为y 1 y 2 总计总计x 1 a b a b + x 2 cdc d +总计a c +b d +a b c d +++构造一个随机变量()()()()()22n ad bc K a b c d a c b d -=++++ ,其中n a b c d =+++为样本容量．确定临界值0k ,如果2K 的观测值0k k …,就认为“两个分类变量之间有关系”；否则就认为“两个分类变量之间没有关系”．。

高中数学概率和统计知识点

高中数学之概率与统计求等可能性事件、互斥事件和相互独立事件的概率解此类题目常应用以下知识:(1)等可能性事件(古典概型)的概率：P(A)＝)()(I card A card ＝n m; 等可能事件概率的计算步骤：计算一次试验的基本事件总数n ;设所求事件A ，并计算事件A 包含的基本事件的个数m ; 依公式()mP A n =求值;答，即给问题一个明确的答复.(2)互斥事件有一个发生的概率：P(A ＋B)＝P(A)＋P(B); 特例：对立事件的概率：P(A)＋P(A )＝P(A ＋A )＝1. (3)相互独立事件同时发生的概率：P(A ·B)＝P(A)·P(B); 特例：独立重复试验的概率：Pn(k)＝kn k k n p p C --)1(.其中P 为事件A 在一次试验中发生的概率，此式为二项式[(1-P)+P]n 展开的第k+1项.(4)解决概率问题要注意“四个步骤，一个结合”：求概率的步骤是：第一步，确定事件性质⎧⎪⎪⎨⎪⎪⎩等可能事件互斥事件独立事件 n 次独立重复试验即所给的问题归结为四类事件中的某一种.第二步，判断事件的运算⎧⎨⎩和事件积事件即是至少有一个发生，还是同时发生，分别运用相加或相乘事件.第三步，运用公式()()()()()()()()(1)kk n k n n m P A nP A B P A P B P A B P A P B P k C p p -⎧=⎪⎪⎪+=+⎨⎪⋅=⋅⎪=-⎪⎩等可能事件: 互斥事件：独立事件： n 次独立重复试验:求解第四步，答，即给提出的问题有一个明确的答复.例1．在五个数字12345，，，，中，若随机取出三个数字，则剩下两个数字都是奇数的概率是（结果用数值表示）．[解答过程]0.3提示:1335C 33.54C 102P ===⨯例2．一个总体含有100个个体，以简单随机抽样方式从该总体中抽取一个容量为5的样本，则指定的某个个体被抽到的概率为．[解答过程]1.20提示:51.10020P == 例3.接种某疫苗后，出现发热反应的概率为0.80.现有5人接种该疫苗，至少有3人出现发热反应的概率为__________.（精确到0.01）[考查目的] 本题主要考查运用组合、概率的基本知识和分类计数原理解决问题的能力，以及推理和运算能力.[解答提示]至少有3人出现发热反应的概率为33244555550.800.200.800.200.800.94C C C ⋅⋅+⋅⋅+⋅=.故填0.94.离散型随机变量的分布列 1.随机变量及相关概念①随机试验的结果可以用一个变量来表示，这样的变量叫做随机变量，常用希腊字母ξ、η等表示.②随机变量可能取的值，可以按一定次序一一列出，这样的随机变量叫做离散型随机变量. ③随机变量可以取某区间内的一切值，这样的随机变量叫做连续型随机变量. 2.离散型随机变量的分布列①离散型随机变量的分布列的概念和性质一般地，设离散型随机变量ξ可能取的值为1x ，2x ，……，i x ，……，ξ取每一个值i x （=i 1，2，……）的概率P （i x =ξ）=i P ，则称下表.为随机变量ξ的概率分布，简称ξ的分布列.由概率的性质可知，任一离散型随机变量的分布列都具有下述两个性质：（1）0≥i P ，=i 1，2，…;（2）++21P P …=1. ②常见的离散型随机变量的分布列：（1）二项分布n 次独立重复试验中，事件A 发生的次数ξ是一个随机变量，其所有可能的取值为0，1，2，…n ，并且kn k k n k q p C k P P -===)(ξ，其中n k ≤≤0，p q -=1，随机变量ξ的分布列如下：称这样随机变量ξ服从二项分布，记作),(~p n B ξ，其中n 、p 为参数，并记：),;(p n k b q p C kn k k n =- .（2）几何分布在独立重复试验中，某事件第一次发生时所作的试验的次数ξ是一个取值为正整数的离散型随机变量，“k ξ=”表示在第k 次独立重复试验时事件第一次发生. 随机变量ξ的概率分布为：例1．厂家在产品出厂前,需对产品做检验,厂家将一批产品发给商家时,商家按合同规定也需随机抽取一定数量的产品做检验,以决定是否接收这批产品.（Ⅰ）若厂家库房中的每件产品合格的概率为0.8,从中任意取出4件进行检验,求至少有1件是合格的概率；（Ⅱ）若厂家发给商家20件产品中,其中有3件不合格,按合同规定该商家从中任取2件.都进行检验,只有2件都合格时才接收这批产品.否则拒收,求出该商家检验出不合格产品数ξ的分布列及期望ξE ,并求出该商家拒收这批产品的概率.[解答过程]（Ⅰ）记“厂家任取4件产品检验，其中至少有1件是合格品”为事件A 用对立事件A 来算，有()()4110.20.9984P A P A =-=-=（Ⅱ）ξ可能的取值为0,1,2．()2172201360190C P C ξ===， ()11317220511190C C P C ξ===，()2322032190C P C ξ===136513301219019019010E ξ=⨯+⨯+⨯=．记“商家任取2件产品检验，都合格”为事件B ，则商家拒收这批产品的概率()136271119095P P B =-=-=．所以商家拒收这批产品的概率为2795．例12．某项选拔共有三轮考核，每轮设有一个问题，能正确回答问题者进入下一轮考核，否则即被淘汰. 已知某选手能正确回答第一、二、三轮的问题的概率分别为54、53、52,且各轮问题能否正确回答互不影响.（Ⅰ）求该选手被淘汰的概率;（Ⅱ）该选手在选拔中回答问题的个数记为ξ，求随机变量ξ的分布列与数学期望. （注：本小题结果可用分数表示）[解答过程]解法一：（Ⅰ）记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =，，，则14()5P A =，23()5P A =，32()5P A =，∴该选手被淘汰的概率112223112123()()()()()()()P P A A A A A A P A P A P A P A P A P A =++=++142433101555555125=+⨯+⨯⨯=．（Ⅱ）ξ的可能值为123，，，11(1)()5P P A ξ===，1212428(2)()()()5525P P A A P A P A ξ====⨯=， 12124312(3)()()()5525P P A A P A P A ξ====⨯=．ξ∴的分布列为11235252525E ξ∴=⨯+⨯+⨯=．解法二：（Ⅰ）记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =，，，则14()5P A =，23()5P A =，32()5P A =．∴该选手被淘汰的概率1231231()1()()()P P A A A P A P A P A =-=-4321011555125=-⨯⨯=．（Ⅱ）同解法一．离散型随机变量的期望与方差随机变量的数学期望和方差 (1)离散型随机变量的数学期望：++=2211p x p x E ξ…；期望反映随机变量取值的平均水平.⑵离散型随机变量的方差：+-+-=222121)()(p E x p E x D ξξξ…+-+n n p E x 2)(ξ…；方差反映随机变量取值的稳定与波动，集中与离散的程度.⑶基本性质：b aE b a E +=+ξξ)(；ξξD a b a D 2)(=+.(4)若ξ～B(n ，p)，则 np E =ξ ; D ξ =npq （这里q=1-p ） ;如果随机变量ξ服从几何分布，),()(p k g k P ==ξ，则p E 1=ξ，D ξ =2p q 其中q=1-p.例1．甲、乙两名工人加工同一种零件，两人每天加工的零件数相等，所得次品数分别为ε、η，ε和η的分布列如下：则比较两名工人的技术水平的高低为 .思路：一是要比较两名工人在加工零件数相等的条件下出次品数的平均值，即期望；二是要看出次品数的波动情况，即方差值的大小.解答过程：工人甲生产出次品数ε的期望和方差分别为：7.0103210111060=⨯+⨯+⨯=εE ，891.0103)7.02(101)7.01(106)7.00(222=⨯-+⨯-+⨯-=εD ；工人乙生产出次品数η的期望和方差分别为：7.0102210311050=⨯+⨯+⨯=ηE ，664.0102)7.02(103)7.01(105)7.00(222=⨯-+⨯-+⨯-=ηD由E ε=E η知，两人出次品的平均数相同，技术水平相当，但D ε>D η，可见乙的技术比较稳定.小结：期望反映随机变量取值的平均水平；方差反映随机变量取值的稳定与波动，集中与离散的程度. 例2.某商场经销某商品，根据以往资料统计，顾客采用的付款期数ξ的分布列为商场经销一件该商品，采用1期付款，其利润为200元；分2期或3期付款，其利润为250元；分4期或5期付款，其利润为300元．η表示经销一件该商品的利润．（Ⅰ）求事件A ：“购买该商品的3位顾客中，至少有1位采用1期付款”的概率()P A ；（Ⅱ）求η的分布列及期望E η．[解答过程]（Ⅰ）由A 表示事件“购买该商品的3位顾客中至少有1位采用1期付款”．知A 表示事件“购买该商品的3位顾客中无人采用1期付款”2()(10.4)0.216P A =-=， ()1()10.2160.784P A P A =-=-=．（Ⅱ）η的可能取值为200元，250元，300元．(200)(1)0.4P P ηξ====，(250)(2)(3)0.20.20.4P P P ηξξ===+==+=，(300)1(200)(250)10.40.40.2P P P ηηη==-=-==--=．η的分布列为2000.42500.43000.2E η=⨯+⨯+⨯240=（元）．抽样方法与总体分布的估计抽样方法1．简单随机抽样：设一个总体的个数为N ，如果通过逐个抽取的方法从中抽取一个样本，且每次抽取时各个个体被抽到的概率相等，就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.2．系统抽样：当总体中的个数较多时，可将总体分成均衡的几个部分，然后按照预先定出的规则，从每一部分抽取1个个体，得到所需要的样本，这种抽样叫做系统抽样（也称为机械抽样）.3．分层抽样：当已知总体由差异明显的几部分组成时，常将总体分成几部分，然后按照各部分所占的比进行抽样，这种抽样叫做分层抽样. 总体分布的估计由于总体分布通常不易知道，我们往往用样本的频率分布去估计总体的分布，一般地，样本容量越大，这种估计就越精确.总体分布：总体取值的概率分布规律通常称为总体分布.当总体中的个体取不同数值很少时，其频率分布表由所取样本的不同数值及相应的频率表示，几何表示就是相应的条形图.当总体中的个体取值在某个区间上时用频率分布直方图来表示相应样本的频率分布.总体密度曲线：当样本容量无限增大，分组的组距无限缩小，那么频率分布直方图就会无限接近于一条光滑曲线，即总体密度曲线. 典型例题例1.某工厂生产A 、B 、C 三种不同型号的产品，产品数量之比依次为2：3：5.现用分层抽样方法抽出一个容量为n 的样本，样本中A 种型号产品有16件.那么此样本的容量n= .解答过程：A 种型号的总体是210，则样本容量n=1016802⨯=.例2．一个总体中有100个个体，随机编号0，1，2，…，99，依编号顺序平均分成10个小组，组号依次为1，2，3，…，10.现用系统抽样方法抽取一个容量为10的样本，规定如果在第1组随机抽取的号码为m ，那么在第k 组中抽取的号码个位数字与m k +的个位数字相同，若6m =，则在第7组中抽取的号码是．解答过程：第K 组的号码为(1)10k - ，(1)101k -+，…，(1)109k -+，当m=6时，第k 组抽取的号的个位数字为m+k 的个位数字，所以第7组中抽取的号码的个位数字为3 ，所以抽取号码为63．正态分布与线性回归 1.正态分布的概念及主要性质（1）正态分布的概念如果连续型随机变量ξ 的概率密度函数为 222)(21)(σμπσ--=x ex f ，x R ∈ 其中σ、μ为常数，并且σ＞0，则称ξ服从正态分布，记为~N ξ（μ，2σ）.（2）期望E ξ =μ，方差2σξ=D .（3）正态分布的性质正态曲线具有下列性质:①曲线在x 轴上方，并且关于直线x ＝μ对称.②曲线在x=μ时处于最高点，由这一点向左右两边延伸时，曲线逐渐降低.③曲线的对称轴位置由μ确定；曲线的形状由σ确定，σ越大，曲线越“矮胖”；反之越“高瘦”.三σ原则即为数值分布在（μ—σ,μ+σ)中的概率为0.6526 数值分布在（μ—2σ,μ+2σ)中的概率为0.9544 数值分布在（μ—3σ,μ+3σ)中的概率为0.9974 （4）标准正态分布当μ=0，σ=1时ξ服从标准的正态分布，记作~N ξ（0，1）（5）两个重要的公式①()1()x x φφ-=-,② ()()()P a b b a ξφφ<<=-.（6）2(,)N μσ与(0,1)N 二者联系.若2~(,)N ξμσ，则~(0,1)N ξμησ-=;②若2~(,)N ξμσ，则()()()b a P a b μμξφφσσ--<<=-.2.线性回归简单的说，线性回归就是处理变量与变量之间的线性关系的一种数学方法.变量和变量之间的关系大致可分为两种类型：确定性的函数关系和不确定的函数关系.不确定性的两个变量之间往往仍有规律可循.回归分析就是处理变量之间的相关关系的一种数量统计方法.它可以提供变量之间相关关系的经验公式.具体说来，对n 个样本数据（11,x y ），（22,x y ），…，（,n n x y ），其回归直线方程，或经验公式为：a bx y+=ˆ.其中,,)(1221x b y a x n xyx n yx b ni ini ii⋅-=--=∑∑==，其中y x ,分别为|i x |、|i y |的平均数.例1.如果随机变量ξ～N （μ，σ2），且E ξ=3，D ξ=1，则P （－1＜ξ≤1＝等于( ) A.2Φ（1）－1 B.Φ（4）－Φ（2） C.Φ（2）－Φ（4） D.Φ（－4）－Φ（－2）解答过程：对正态分布，μ=E ξ=3，σ2=D ξ=1，故P （－1＜ξ≤1）=Φ（1－3）－Φ（－1－3）=Φ（－2）－Φ（－4）=Φ（4）－Φ（2）. 答案：B例2. 将温度调节器放置在贮存着某种液体的容器内，调节器设定在d ℃，液体的温度ξ（单位：℃）是一个随机变量，且ξ～N （d ，0.52）. （1）若d=90°，则ξ<89的概率为；（2）若要保持液体的温度至少为80 ℃的概率不低于0.99，则d 至少是 ?（其中若η～N （0，1），则Φ（2）=P （η<2）=0.9772，Φ（－2.327）=P （η<－2.327）=0.01）.解答过程：（1）P （ξ<89）=F （89）=Φ（5.09089-）=Φ（－2）=1－Φ（2）=1－0.9772=0.0228.（2）由已知d 满足0.99≤P （ξ≥80），即1－P （ξ<80）≥1－0.01，∴P （ξ<80）≤0.01.∴Φ（5.080d-）≤0.01=Φ（－2.327）.∴5.080d -≤－2.327.∴d ≤81.1635.故d 至少为81.1635.小结：（1）若ξ～N （0，1），则η=σμξ-～N （0，1）.（2）标准正态分布的密度函数f （x ）是偶函数，x<0时，f （x ）为增函数，x>0时，f （x ）为减函数.。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

应
用
最
广
；
⑷中位数不受个别偏大或偏小数据的影响；
⑸众数与各组数据出现的频数有关，不受个别数据的影响，有时是我们最为关心的数
据
。
六、对于样本数据 x1，x2，…，xn，设想通过各数据到其平均数的平均距离来反映样本数据的分散程度，那么这个平均距离如何计算？
| x1 x | | x2 x |
| xn x |
第一部分:统计
高中数学统计与概率知识点（文）
一、什
么
是
众
数
。
一组数据中出现次数最多的那个数据，叫做这组数据的众数。
众
数
的
特
点
。
①众数在一组数据中出现的次数最多；②众数反映了一组数据的集中趋势，当众数出现
的次数越多，它就越能代表这组数据的整体状况，并且它能比较直观地了解到一组数据的
大致情况。但是，当一组数据大小不同，差异又很大时，就很难判断众数的准确值了。此
第一步，将这 600 件产品编号为 1，2，3，…，600. 第二步，将总体平均分成 60 部分，每一部分含 10 个个体. 第三步，在第 1 部分中用简单随机抽样抽取一个号码（如 8 号）. 第四步，从该号码起，每隔 10 个号码取一个号码，就得到一个容量为 60 的样本.（如 8，18，28，…，598）
数
据
的
单
位
相
同
；
（6）众数可能是一个或多个甚至没有；
（7）平均数、众数和中位数都是描述一组数据集中趋势的量。
1 / 10
五.平均数、中位数与众数的异同：
⑴平均数、众数和中位数都是描述一组数据集中趋势的量；
⑵平均数、众数和中位数都有单位；
⑶平均数反映一组数据的平均水平，与这组数据中的每个数都有关系，所以最为重要，
如果每次抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽样.
八、根据你的理解，简单随机抽样有哪些主要特点？（1）总体的个体数有限；（2）样本的抽取是逐个进行的，每次只抽取一个个体；（3）抽取的样本不放回，样本中无重复个体；（4）每个个体被抽到的机会都相等，抽样具有公平性.
九、抽签法的操作步骤？第一步，将总体中的所有个体编号，并把号码写在形状、大小相同的号签上. 第二步，将号签放在一个容器中，并搅拌均匀第三步，每次从中抽取一个号签，连续抽取 n 次，就得到一个容量为 n 的样本.
2 / 10
十一、抽签法有哪些优点和缺点？优点：简单易行，当总体个数不多的时候搅拌均匀很容易，个体有均等的机会被抽
简单随机抽样每个个体入样的可能性都相等，均为 n/N，但是这里一定要将每个个体入样的可能性、第 n 次每个个体入样的可能性、特定的个体在第 n 次被抽到的可能性这三种情况区分开来，避免在解题中出现错误.
3 / 10
解题应用如果从 600 件产品中抽取 60 件进行质量检查，按照上述思路抽样应如何操作？
n 思考 4：反映样本数据的分散程度的大小，最常用的统计量是标准差，一般用 s 表示.假
设样本数据 x1，x2，…，xn 的平均数为 x ，则标准差的计算公式是：
s (x1 x)2 (x2 x)2 n
(xn x)2
七、简单随即抽样的含义一般地,设一个总体有 N 个个体, 从中逐个不放回地抽取 n 个个体作为样本（n≤N）,
外，当一组数据的那个众数出现的次数不具明显优势时，用它来反映一组数据的典型水平
是
不
大
可
靠
的
。
3.众数与平均数的区别。
众数表示一组数据中出现次数最多的那个数据；平均数是一组数据中表示平均每份的数
量

。
二
、
.
中
位
数
的
概
念
。
一组数据按大小顺序排列，位于最中间的一个数据(当有偶数个数据时，为最中间两
个数据的平均数)叫做这组数据的中位数。
简单随机抽样一般采用两种方法：抽签法和随机数表法。思考：如果从 100 个个体中抽取一个容量为 10 的样本，你认为对这 100 个个体进行怎样编号为宜？
解法 1：（抽签法）将 100 件轴编号为 1，2，…，100，并做好大小、形状相同的号签，分别写上这 100 个数，将这些号签放在一起，进行均匀搅拌，接着连续抽取 10 个号签，然后测量这个 10 个号签对应的轴的直径。解法 2：（随机数表法）将 100 件轴编号为 00，01，…99，在随机数表中选定一个起始位置，如取第 21 行第 1 个数开始，选取 10 个为 68，34，30，13，70，55，74， 77，40，44，这 10 件即为所要抽取的样本。
小结、简单随机抽样是一种最简单、最基本的抽样方法，简单随机抽样有两种选取个体
的方法：放回和不放回，我们在抽样调查中用的是不放回抽样，常用的简单随机抽样方法有抽签法和随机数法.
抽签法的优点是简单易行，缺点是当总体的容量非常大时，费时、费力，又不方便，如果标号的签搅拌得不均匀，会导致抽样不公平，随机数表法的优点与抽签法相同，缺点上当总体容量较大时，仍然不是很方便，但是比抽签法公平，因此这两种方法只适合总体容量较少的抽样类型.
三
.众数、中位数及平均数的求法。
①众数由所给数据可直接求出;②求中位数时，首先要先排序(从小到大或从大到小)，
然后根据数据的个数，当数据为奇数个时，最中间的一个数就是中位数;当数据为偶数个
时，最中间两个数的平均数就是中位数。③求平均数时，就用各数据的总和除以数据的个
数，得数就是这组数据的平均数。
四、中位数与众数的特点。
⑴中位数是一组数据中唯一的，可能是这组数据中的数据，也可能不是这组数据中的数
据
；
⑵求中位数时，先将数据有小到大顺序排列，若这组数据是奇数个，则中间的数据是中
位数；若这组数据是偶数个时，则中间的两个数据的平均数是中位数；
⑶中位数的单位与数据的单位相同；
⑷众数考察的是一组数据中出现的频数；
⑸众数的大小只与这组数的个别数据有关，它一定是一组数据中的某个数据，其单位与
中，从而能保证样本的代表性. 缺点：当总体个数较多时很难搅拌均匀，产生的样本代表性差的可能性很大.
十一、利用随机数表法从含有 N 个个体的总体中抽取一个容量为 n 的样本，其抽样步骤如何？
第一步，将总体中的所有个体编号. 第二步，在随机数表中任选一个数作为起始数. 第三步，从选定的数开始依次向右（向左、向上、向下）读，将编号范围内的数取出，编号范围外的数去掉，直到取满 n 个号码为止，就得到一个容量为 n 的样本.