概率统计知识点全面总结

合集下载

统计概率所有知识点总结

统计概率所有知识点总结

统计概率所有知识点总结一、基本概率论概率论是统计学中最基础的部分,它研究的是随机事件的可能性。

随机事件是不确定的事件,而概率就是描述这种不确定性的量。

在概率论中,经常用到的概念包括事件、概率、样本空间等。

事件是指可能发生或者不发生的事物,而概率则是衡量事件发生可能性的大小。

样本空间是所有可能结果的集合,它包括了所有可能的事件。

二、条件概率条件概率是指在已知某些信息的情况下,另一个事件发生的概率。

条件概率的计算方法通常使用乘法法则。

条件概率在许多领域中都有着广泛的应用,比如医学诊断、市场营销、风险管理等。

三、独立性在概率论中,独立性是一个非常重要的概念。

两个事件如果是独立的,那么它们的发生不会互相影响。

独立性的概念在统计推断中有着广泛的应用,比如在抽样调查中,我们通常要求样本之间是独立的,以保证统计推断的准确性。

四、随机变量随机变量是统计学中的一个重要概念,它是对随机事件的量化描述。

随机变量可以是离散的,也可以是连续的。

对于离散的随机变量,我们通常关心的是它的概率分布;而对于连续的随机变量,我们通常关心的是它的密度函数。

五、概率分布概率分布是描述随机变量取值可能性的函数。

常见的概率分布包括均匀分布、正态分布、泊松分布、指数分布等。

概率分布在统计学中有着广泛的应用,比如在假设检验、参数估计等问题中。

六、抽样分布抽样分布是指统计量在重复抽样过程中的概率分布。

常见的抽样分布包括t 分布、F分布、卡方分布等。

抽样分布在统计推断中有着重要的作用,它可以帮助我们理解样本统计量的性质,从而进行参数估计和假设检验。

七、统计推断统计推断是统计学中一个重要的领域,它研究的是如何通过样本数据对总体特征进行推断。

统计推断通常包括参数估计和假设检验两个部分。

参数估计是指在已知总体分布的情况下,通过样本数据估计总体参数的值;而假设检验是指在总体参数未知的情况下,通过样本数据来对总体特征进行检验。

统计推断在医学、经济学、社会学等领域中有着广泛的应用。

概率与统计知识点总结

概率与统计知识点总结

概率与统计知识点总结一、概率的基本概念概率,简单来说,就是衡量某个事件发生可能性大小的一个数值。

比如抛硬币,正面朝上的概率是 05,意思是在大量重复抛硬币的实验中,正面朝上的次数大约占总次数的一半。

随机事件,就是在一定条件下,可能出现也可能不出现,而在大量重复试验中具有某种规律性的事件。

比如掷骰子得到的点数就是随机事件。

必然事件,就是在一定条件下必然会发生的事件。

比如太阳从东方升起,这就是必然事件。

不可能事件,就是在一定条件下不可能发生的事件。

比如在地球上,水往高处流就是不可能事件。

概率的取值范围在 0 到 1 之间。

0 表示事件不可能发生,1 表示事件必然发生。

二、古典概型古典概型是一种最简单、最基本的概率模型。

它具有两个特点:试验中所有可能出现的基本事件只有有限个;每个基本事件出现的可能性相等。

计算古典概型中事件 A 的概率公式为:P(A) = A 包含的基本事件个数/基本事件的总数。

例如,一个袋子里有 5 个红球和 3 个白球,从中随机摸出一个球是红球的概率,基本事件总数是 8(5 个红球+ 3 个白球),红球的个数是 5,所以摸到红球的概率就是 5/8。

三、几何概型与古典概型不同,几何概型中的基本事件个数是无限的。

比如在一个时间段内等可能地到达某一地点,或者在一个区域内等可能地取点。

几何概型的概率计算公式是:P(A) =构成事件 A 的区域长度(面积或体积)/试验的全部结果所构成的区域长度(面积或体积)。

举个例子,在区间0, 10中随机取一个数,这个数小于 5 的概率就是 5/10 = 05。

四、条件概率条件概率是在已知某个事件发生的条件下,另一个事件发生的概率。

记事件 A 在事件 B 发生的条件下发生的概率为 P(A|B)。

计算公式为:P(A|B) = P(AB) / P(B) ,其中 P(AB) 表示事件 A 和事件 B 同时发生的概率。

比如说,已知今天下雨,明天也下雨的概率就是一个条件概率。

统计概率知识点归纳总结大全

统计概率知识点归纳总结大全

统计概率知识点归纳总结大全1.了解随机事件的发生存在着规律性和随机事件概率的意义.2.了解等可能性事件的概率的意义,会用排列组合的基本公式计算一些等可能性事件的概率.3.了解互斥事件、相互独立事件的意义,会用互斥事件的概率加法公式与相互独立事件的概率乘法公式计算一些事件的概率.4.会计算事件在n 次独立重复试验中恰好发生k 次的概率.5. 掌握离散型随机变量的分布列. 6.掌握离散型随机变量的期望与方差. 7.掌握抽样方法与总体分布的估计. 8.掌握正态分布与线性回归.考点1. 求等可能性事件、互斥事件和相互独立事件的概率 解此类题目常应用以下知识:(1)等可能性事件(古典概型)的概率:P (A )=)()(I card A card =nm ;等可能事件概率的计算步骤:(1) 计算一次试验的基本事件总数n ;(2) 设所求事件A ,并计算事件A 包含的基本事件的个数m ; (3) 依公式()m P A n=求值;(4) 答,即给问题一个明确的答复.(2)互斥事件有一个发生的概率:P (A +B )=P (A )+P (B ); 特例:对立事件的概率:P (A )+P (A )=P (A +A )=1. (3)相互独立事件同时发生的概率:P (A ·B )=P (A )·P (B );特例:独立重复试验的概率:P n (k )=k n k k n p p C --)1(.其中P 为事件A 在一次试验中发生的概率,此式为二项式[(1-P)+P]n 展开的第k+1项.(4)解决概率问题要注意“四个步骤,一个结合”: ① 求概率的步骤是:第一步,确定事件性质⎧⎪⎪⎨⎪⎪⎩等可能事件互斥事件 独立事件 n 次独立重复试验即所给的问题归结为四类事件中的某一种. 第二步,判断事件的运算⎧⎨⎩和事件积事件即是至少有一个发生,还是同时发生,分别运用相加或相乘事件.第三步,运用公式()()()()()()()()(1)k k n k n n m P A nP A B P A P B P A B P A P B P k C p p -⎧=⎪⎪⎪+=+⎨⎪⋅=⋅⎪=-⎪⎩等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解 第四步,答,即给提出的问题有一个明确的答复. 考点2离散型随机变量的分布列 1.随机变量及相关概念①随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用希腊字母ξ、η等表示.②随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量. ③随机变量可以取某区间内的一切值,这样的随机变量叫做连续型随机变量. 2.离散型随机变量的分布列①离散型随机变量的分布列的概念和性质一般地,设离散型随机变量ξ可能取的值为1x ,2x ,……,i x ,……,ξ取每一个值ix (=i 1,2,……)的概率P (i x =ξ)=i P ,则称下表.为随机变量ξ的概率分布,简称ξ的分布列.由概率的性质可知,任一离散型随机变量的分布列都具有下述两个性质: (1)0≥i P ,=i 1,2,…;(2)++21P P …=1. ②常见的离散型随机变量的分布列: (1)二项分布n 次独立重复试验中,事件A 发生的次数ξ是一个随机变量,其所有可能的取值为0,1,2,…n ,并且k n k k n k q p C k P P -===)(ξ,其中n k ≤≤0,p q -=1,随机变量ξ的分布列如下:ξ1… k… nPn n q p C 00111-n n q p C…k n k kn q p C -q p C n n n称这样随机变量ξ服从二项分布,记作),(~p n B ξ,其中n 、p 为参数,并记:),;(p n k b q p C kn k k n =- .(2) 几何分布在独立重复试验中,某事件第一次发生时所作的试验的次数ξ是一个取值为正整数的离散型随机变量,“k ξ=”表示在第k 次独立重复试验时事件第一次发生.随机变量ξ的概率分布为:ξ1x2x… i x… PP 1P 2…i P…ξ1 2 3… k… Ppqp2q p…1k q p -…考点3 离散型随机变量的期望与方差 随机变量的数学期望和方差(1)离散型随机变量的数学期望:++=2211p x p x E ξ…;期望反映随机变量取值的平均水平. ⑵离散型随机变量的方差:+-+-=222121)()(p E x p E x D ξξξ…+-+n n p E x 2)(ξ…; 方差反映随机变量取值的稳定与波动,集中与离散的程度. ⑶基本性质:b aE b a E +=+ξξ)(;ξξD a b a D 2)(=+.(4)若ξ~B(n ,p),则 np E =ξ ; D ξ =npq (这里q=1-p ) ;如果随机变量ξ服从几何分布,),()(p k g k P ==ξ,则pE 1=ξ,D ξ =2pq 其中q=1-p.考点4 抽样方法与总体分布的估计 抽样方法1.简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).3.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样. 总体分布的估计由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体的分布,一般地,样本容量越大,这种估计就越精确.总体分布:总体取值的概率分布规律通常称为总体分布.当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及相应的频率表示,几何表示就是相应的条形图.当总体中的个体取值在某个区间上时用频率分布直方图来表示相应样本的频率分布. 总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,即总体密度曲线. 考点5 正态分布与线性回归 1.正态分布的概念及主要性质 (1)正态分布的概念如果连续型随机变量ξ 的概率密度函数为 222)(21)(σμπσ--=x ex f ,x R ∈ 其中σ、μ为常数,并且σ>0,则称ξ服从正态分布,记为~N ξ(μ,2σ).(2)期望E ξ =μ,方差2σξ=D . (3)正态分布的性质 正态曲线具有下列性质:①曲线在x 轴上方,并且关于直线x =μ对称.②曲线在x=μ时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低.③曲线的对称轴位置由μ确定;曲线的形状由σ确定,σ越大,曲线越“矮胖”;反之越“高瘦”.(4)标准正态分布当μ=0,σ=1时ξ服从标准的正态分布,记作~N ξ(0,1) (5)两个重要的公式①()1()x x φφ-=-,② ()()()P a b b a ξφφ<<=-.(6)2(,)N μσ与(0,1)N 二者联系.(1)若2~(,)N ξμσ,则~(0,1)N ξμησ-= ;②若2~(,)N ξμσ,则()()()b a P a b μμξφφσσ--<<=-.2.线性回归简单的说,线性回归就是处理变量与变量之间的线性关系的一种数学方法.变量和变量之间的关系大致可分为两种类型:确定性的函数关系和不确定的函数关系.不确定性的两个变量之间往往仍有规律可循.回归分析就是处理变量之间的相关关系的一种数量统计方法.它可以提供变量之间相关关系的经验公式.具体说来,对n 个样本数据(11,x y ),(22,x y ),…,(,n n x y ),其回归直线方程,或经验公式为:a bx y +=ˆ.其中,,)(1221x b y a x n xyx n yx b ni ini ii⋅-=--=∑∑==,其中y x ,分别为|i x |、|i y |的平均数.。

概率统计知识点总结

概率统计知识点总结

概率统计知识点总结概率统计是一门研究随机现象规律性的数学学科,主要研究随机变量的分布、参数估计、假设检验、方差分析等内容。

下面是对概率统计中的一些重要知识点的总结:1. 随机事件与概率:随机事件是指试验中可能发生也可能不发生的结果,概率是描述随机事件发生可能性的数值。

概率由经典概率、几何概率和统计概率三类组成。

2. 随机变量与概率分布:随机变量是一个能随机变化的量,可以分为离散随机变量和连续随机变量。

概率分布指的是随机变量各个取值及其相应的概率。

3. 期望与方差:期望是统计量中的一个重要概念,描述了随机变量在一次试验中平均取值的大小。

方差则是描述随机变量取值分散程度的一个指标。

4. 大数定律与中心极限定理:大数定律指的是当样本容量足够大时,样本平均值会趋近于理论期望。

中心极限定理则是指当样本容量足够大时,样本均值的分布会趋近于正态分布。

5. 参数估计与假设检验:参数估计是通过样本数据来估计总体参数的值,可以分为点估计和区间估计。

假设检验则是通过样本数据来判断总体参数的假设是否成立。

6. 方差分析与回归分析:方差分析是根据不同因素对总体均值的影响进行推断的一种方法。

回归分析则是研究因变量与自变量之间关系的一种方法,可以进行线性回归和非线性回归。

7. 相关分析与统计推断:相关分析是研究两个变量之间关系的一种方法,可以通过计算相关系数来确定两个变量之间的线性关系强度和方向。

统计推断是利用样本数据对总体进行推断的一种方法,可以由样本推断出总体特征。

8. 非参数统计方法:非参数统计方法是在对总体分布形态不做假设的情况下,利用样本统计量进行推断的方法。

它包括了秩和检验、符号检验、分布自由检验等方法。

以上只是概率统计中的一部分重要知识点总结,概率统计的内容非常广泛,应用领域也十分广泛。

希望能够通过学习以上知识点,对概率统计有一个初步的了解。

概率和统计的基本概念知识点总结

概率和统计的基本概念知识点总结

概率和统计的基本概念知识点总结概率和统计是数学中的两个重要分支,被广泛应用于各个领域,包括自然科学、社会科学和工程学等。

本文将对概率和统计的基本概念进行总结和阐述,并提供一些实际应用案例。

1. 概率的基本概念概率是描述事件发生可能性的数值,通常用一个介于0和1之间的数表示。

概率的计算可以根据事件的性质和概率空间来进行。

1.1 事件与样本空间事件是指在一次试验中可能发生的一种或几种结果。

样本空间是指试验的所有可能结果的集合。

事件是样本空间的子集。

1.2 随机试验与概率空间随机试验是指具有以下特点的实验:可以在相同的条件下重复进行,并且每次试验的结果无法提前确定。

概率空间包括样本空间和概率函数。

1.3 概率函数概率函数是一个将样本空间的事件映射到实数区间[0,1]的函数。

它满足以下条件:对于任意样本空间的事件A,概率函数P(A)具有非负性、规范性和可列可加性。

2. 统计学的基本概念统计学是研究收集、整理、分析和解释数据的方法和技术的学科。

统计学分为描述统计和推断统计两个方面。

2.1 描述统计描述统计是用图表、统计量等方法对数据进行总结和描述的过程。

常用的描述统计方法包括平均数、中位数、众数、方差、标准差等。

2.2 推断统计推断统计是通过对样本数据进行分析,得出关于总体的结论或推断的过程。

推断统计方法包括假设检验、置信区间估计等。

3. 概率与统计的应用案例概率和统计的理论在实际生活和科学研究中有着广泛的应用。

以下是几个典型的案例:3.1 风险评估概率与统计能够用于评估风险和制定保险政策。

根据历史统计数据和概率模型,可以估计某种风险发生的可能性,并制定相应的保险费率。

3.2 质量控制概率与统计可以用于质量控制中的过程监控和产品检验。

通过收集数据并进行统计分析,可以判断生产过程是否处于控制状态,以及产品是否符合质量标准。

3.3 经济预测概率与统计可以应用于经济领域的预测和决策。

通过对历史数据进行分析,可以建立经济模型并做出相应的预测,帮助政府和企业做出合理决策。

统计概率知识点归纳总结大全

统计概率知识点归纳总结大全

统计概率知识点归纳总结大全统计概率是数学中的一个重要分支,它是一门研究数据收集、分析、解释和预测的学科。

在我们的日常生活中,统计概率也是不可避免的。

在我们购买彩票、浏览社交媒体的统计数据、选举、医学实验中的分析等方面,统计学都在起着重要的作用。

下面我们就来对统计概率的知识点进行归纳总结。

一、基本概念1. 概率是指某一事件发生的可能性大小,通常表示为P。

2. 样本空间是指所有可能的结果构成的集合,一般用S表示。

3. 事件是指样本空间S的子集,即可能发生的结果的集合。

4. 随机变量是指样本空间S中的元素与实数集之间的一个函数。

5. 概率分布是指随机变量每个可能取值的概率。

二、概率公式1. 概率加法规则:P(A或B) = P(A) + P(B) - P(A且B),其中A 且B是指A和B同时发生的概率。

2. 概率乘法规则:P(A且B) = P(A) × P(B|A),其中P(B|A)是指在A发生的前提下,B发生的概率。

3. 贝叶斯公式:P(A|B) = P(B|A) × P(A) / P(B),其中P(A|B)是指在B发生的前提下,A发生的概率。

4. 全概率公式:P(A) = ∑ P(A|B_k) × P(B_k),其中B_k是划分样本空间的一组事件。

三、概率分布1. 离散型随机变量的概率分布:P(X=x_i) = p_i,其中X为随机变量,x_i为可能取值,p_i为取值为x_i的概率。

2. 离散型随机变量的期望:E(X) = ∑ x_i × p_i,其中x_i为可能取值,p_i为取值为x_i的概率。

3. 连续型随机变量的概率密度函数:f(x),其中f(x)为概率密度函数的值,表示X落在一个x到(x+dx)的范围内的概率为f(x) × dx。

4. 连续型随机变量的期望:E(X) = ∫ x × f(x)dx。

5. 方差: Var(X) = E(X²) - [E(X)]²。

概率 统计知识点总结

概率 统计知识点总结

概率统计知识点总结一、概率统计基本概念1. 随机事件和样本空间在概率统计中,随机事件是指在一次试验中可能发生的结果,例如抛硬币的结果可以是正面或反面。

样本空间是指所有可能的结果的集合,例如抛硬币的样本空间为{正面,反面}。

2. 概率和基本概率公式概率是指某一事件在所有可能事件中发生的频率,通常用P(A)表示。

基本概率公式是P(A)=n(A)/n(S),其中n(A)表示事件A发生的次数,n(S)表示样本空间的大小。

3. 条件概率条件概率是指在事件B已经发生的条件下,事件A发生的概率,通常表示为P(A|B)。

4. 独立事件两个事件A和B称为独立事件,意味着事件A的发生不受事件B的影响,其概率关系为P(A∩B)=P(A)×P(B)。

二、概率统计的数据分析方法1. 描述性统计描述性统计是对数据进行总结和描述的方法,包括平均数、中位数、众数、标准差、极差等指标,用来描述数据的集中趋势、离散程度和分布形状。

2. 探索性数据分析探索性数据分析是一种用图表和统计分析方法探索数据背后的规律和结构的方法,通过绘制图表和计算相关指标,发现数据之间的关系、趋势和异常值。

3. 统计推断统计推断是根据样本数据对总体参数进行推断的方法,包括点估计和区间估计,以及假设检验。

三、概率统计的应用1. 随机过程随机过程是研究随机事件随时间或空间变化的规律性的数学模型,包括马尔可夫过程、布朗运动、泊松过程等,广泛应用于金融、电信、生物等领域。

2. 统计建模统计建模是根据数据建立数学模型,预测未来的趋势和规律,包括线性回归模型、时间序列模型、机器学习模型等。

3. 贝叶斯统计贝叶斯统计是一种基于贝叶斯定理的概率统计方法,它将先验信息和样本数据结合起来,进行参数估计和模型推断,常用于医学、生态学、市场营销等领域。

四、概率统计的挑战和发展1. 大数据与统计随着大数据时代的到来,传统的统计方法和模型已经无法满足大规模、高维度、非结构化数据的分析需求,需要发展新的统计方法和算法。

概率与统计重要知识点归纳

概率与统计重要知识点归纳

概率与统计重要知识点归纳概率与统计是数学中的重要分支,它们研究随机事件和数据的规律性。

在现实生活中,概率与统计广泛应用于各个领域,如金融、工程、医学等。

本文将对概率与统计的重要知识点进行归纳,帮助读者更好地理解和应用这些概念。

一、概率的基本概念及计算方法1. 样本空间与事件:样本空间是指一个随机试验所有可能结果的集合,而事件是样本空间的子集。

通过样本空间和事件的定义,我们可以对随机事件进行描述和计算。

2. 概率的定义与性质:概率是指某一事件发生的可能性大小。

它的计算可以通过古典概型、几何概型和统计概型等方法。

3. 事件的运算:事件之间可以进行并、交、差、对立等运算。

这些运算可以帮助我们计算复杂事件的概率。

二、离散型随机变量1. 随机变量与概率分布:随机变量是指某个试验的结果可以用数表示的变量。

离散型随机变量描述了某个事件发生的次数,其概率分布可以用概率质量函数来表示。

2. 期望与方差:期望是随机变量的平均值,方差是随机变量的离散程度。

通过计算期望和方差,我们可以对随机变量的特征有更深入的认识。

三、连续型随机变量1. 连续型随机变量的概率密度函数:概率密度函数描述了连续型随机变量可能取值的概率分布情况。

通过计算概率密度函数的积分,我们可以得到某个区间上的概率。

2. 正态分布:正态分布是概率论中的重要分布,它以钟形曲线为特点,广泛应用于各个领域。

通过正态分布的性质,我们可以进行样本的统计推断和参数估计。

四、统计学推断1. 参数估计:参数估计是指通过样本数据对总体参数进行估计。

最大似然估计和贝叶斯估计是常用的参数估计方法。

2. 假设检验:假设检验是统计学中重要的推断方法,用于判断总体参数是否符合某个假设。

显著性水平、拒绝域和p值是假设检验中常用的概念。

五、相关与回归分析1. 相关分析:相关分析用于研究两个变量之间的关系强度和方向。

皮尔逊相关系数是度量两个变量线性相关程度的重要指标。

2. 简单线性回归:简单线性回归分析用于研究一个自变量和一个因变量之间的关系。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

知识点总结:统计与概率
I 统计
1.三大抽样 (1)基本定义:
① 总体:在统计中,所有考查对象的全体叫做全体.
② 个体:在所有考查对象中的每一个考查对象都叫做个体. ③ 样本:从总体中抽取的一部分个体叫做总体的样本. ④ 样本容量:样本中个体的数目叫做样本容量. (2)抽样方法:
①简单随机抽样:逐个不放回、等可能性、有限性。

=======★适用于总体较少★
抽签法:整体编号(
1~N )放入不透明的容器中搅拌均匀逐个抽取n 次,即可得样本容量为
n 的样本。

随机数表法:整体编号(等位数,如001、111不能是1、111) 从0~9中随机取一行一列然后初方向随机
(上、下、左、右)重复,超过范围则忽略不计直至取得以n 为样本容量的样本。

②系统抽样:容量大.等距,等可能。

=======★适用于总体多★
用随机方法编号,若N 无法被整除,则剔除后再分组,n
N
k。

再用简单随机抽样法来抽取一个个体,设为l ,则编号为l ,k+l ,2k+l ……(n-1)k ,抽出容量为n 的样本。

(每组编号相同)。

③分层抽样:总体差异明显.按所占比例抽取.等可能.=======★适用于由差异明显的几部分构成的总体★
总体有几个差异明显的部分构成,经总体分成几个部分,然后按照所占比例进行抽样.抽样比为:k =n
N
3.总体分布的估计: (1)一表二图:
①频率分布表——数据详实
②频率分布直方图——分布直观
③频率分布折线图——便于观察总体分布趋势
★注:总体分布的密度曲线与横轴围成的面积为1。

(2)茎叶图:
①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数.众位数等。

②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。

4.样本分析
(1)在频率直方图中计算众数.平均数.中位数
众数 在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。

(最多的那个)--忽视其他数据
中位数 在频率分布直方图中,中位数左边和右边的直方图的面积应该相等。

(最中间的,若偶取平均)--对极端值不敏感
平均数 频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和 。

--可靠性低 在频率分布直方图中,纵轴表示频率组距
,数据落在各小组内的频率用各小矩形的面积表示.各小矩形的面积总和等于1.
,此关系式的变形为频数
频率=样本容量,也可变形为样本容量×频率=频数。

(2)
① 算数平均数
方差
★注:特别地,对于连续型的随机变量在分好组后,其i 21 x , ... , x , x 应该取每一组的组中值近似的表示 ★注:方差与标准差越小,说明样本数据越稳定。

平均数反映数据总体水平;方差与标准差反映数据的稳定水平。

5.线性回归方程
①变量之间的两类关系:函数关系(确定性关系)与相关关系(非确定性关系); ②制作散点图,判断线性相关关系;
③线性回归方程: (最小二乘法)
注:当r >0时,表明两个变量正相关当r <0时,表明两个变量负相关.
r 的绝对值越接近于1r 的绝对值越接近于0通常|r |大于0.75时,认为两个变量有很强的线性相关性.6. 独立性检验
相关系数r =
极差(全距) 样本中最大值与最小值的差值
(1)2×2列联表:假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表为:
K2=n(ad-bc)2
(a+b)(a+c)(b+d)(c+d)
(其中n=a+b+c+d为样本容量).
(2)用K2的大小可以决定是否拒绝原来的统计假设H0,若K2值较大,就拒绝H0,即拒绝事件A与B无关.
(3)当K2≥2.706时,则有90%以上的把握说事件A与B有关;
当K2≥3.841时,则有95%以上的把握说事件A与B有关;
当K2≥6.635时,则有99%以上的把握说事件A与B有关.
II概率
1. 事件
必然事件 :在条件S下一定会发生的事件,叫作相对于条件S的必然事件(P=1)
不可能事件:在条件S下,一定不会发生的事件,叫作相对于条件S的不可能事件(P=0)
确定事件 :必然事件与不可能事件统称为相对于条件S的确定事件,简称确定事件
随机事件 :在条件S下,可能发生也可能不发生的事件,叫作相对于条件S的随机事件[P∈(0,1)] 2.事件的关系
3.概率模型
(1)古典概型(有限、等可能)的概率公式.
(2)几何概型(无限,等可能)的概率公式.
(3)条件概率. 在A 发生的条件下B
(4)相互独立事件同时发生的概率. 若A ,B 相互独立,则P (AB )=P (A )·P (B ). (5)若事件A ,B 互斥,则P (A ∪B )=P (A )+P (B )

4.独立重复试验与二项分布
若事件A 在一次试验发生的概率是p ,则它在n 次独立重复试验中恰好发生k 次的概率为:
P n (k )=C k n p k (1-p )n -
k
,k =0,1,2,…,n .用X 表示事件A 在n 次独立重复试验中发生的次数,
5.超几何分布
在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,,k =0,1,2,…,m ,其中m =min{M ,n },且n ≤N ,M ≤N ,n ,M ,N ∈N *
,此时称随机变量X 服从超几何分布.超几何分布的模型是不放回抽样,超几何分布中的参数是M ,N ,n . 6.离散型随机变量的均值、方差
(1)离散型随机变量ξ(读作:可系)的分布列为:
离散型随机变量ξi 12i p n =1(i =1,2,3,…,n). (2)E (ξ)=x 1p 1+x 2p 2+…+x i p i +…+x n p n 为随机变量ξ的数学期望或均值.
D (ξ)=(x 1-
E (ξ))2·p 1+(x 2-E (
ξ))2·
p 2+…+(
x i -E (ξ))2·p i +…+(x n -E (ξ))2·p n 叫做随机变量ξ的方差. (3)数学期望、方差的性质.
①E (aξ+b )=aE (ξ)+b ,D (aξ+b )=a 2D (ξ).
②X 服从二项分布,即X ~B (n ,p ),则E (X )=np ,D (X )=np (1-p ). ③X 服从两点分布,则E (X )=p ,D (X )=p (1-p ).
7.正态分布
总体密度曲线: 频率分布直方图无限接近于一条光滑曲线(如P1下方)
22
()2,1
(),(,)
2x x e x μσμσϕπσ
--
=
∈-∞+∞ μ是均值,x=μ对称轴,σ(σ>0)是标准差,σ2是方差。

一般地,如果对于任何实数a b <,随机变量X 满足,
()()b
a
P a X B x dx μσϕ<≤=
⎰,
则称 X 的分布为正态分布.正态分布完全由参数μ和σ(读作:习个么儿)确定, 因此正态分布常记作),(2σμN .如果随机变量 X 服从正态分布,则记为X ~),(2σμN
正态分布具有:两头低、中间高、左右对称的特点,在X 轴上方且与X 轴不相交,关于x=μ对称,x=μ为最高点。

σ越大,曲线越“矮胖”,总体分布越分散; σ越小.曲线越“瘦高”,总体分布越集中。

σ3原则:
6826.0)(=+≤<-σμσμX P 9544.0)22(=+≤<-σμσμX P 9974)33(=+≤<-σμσμX P
通常认为服从正态分布),(2σμN 的随机变量X 只取)3,3(σμσμ+-之间的值,并简称之为σ3原则。

相关文档
最新文档