正态分布
三大分布--正态分布

( k=0,1, 2,, m ; m=min{M,n} )
E(X ) nM
N
D(
X
)
nM
(N N
n)(N 2(N 1)
M
)
超几何分布的应用
注1:当n≤2时,虽可套用公式 但不如直接计算简捷 当n≥3时,套用公式 一般的,可减少操作量
注2:三个细节要留心 书写格式要正规 随机变量有范围 (高仿只用莫声张) 二项分布会区分
超几何分布的书写格式
由题意得X服从超几何分布
其中 N=!,M=!,n=!
则
P( X
k)
C C k nk M NM CNn
(k=0,1, 2,, m)
m =min{M,n}
从而X的分布列为
X
0
p
C C 0 n0 M NM
CNn
1
C C 1 n1 M NM CNn
… …
m
C C m nm M NM CNn
其密度函数f(xf ()x=)
1
e
(
x
80 200
)2
,
x,则(不, 正) 确的是
【B】
2 10
A.平均成绩为80分
B.分数在120分以上和分数在60分以下的人数相同
C.分数在110分以上和分数在50分以下的人数相同
D.这次考试的成绩标准差为10
(4)设随机变量ξ~N(2,4),则D(2ξ+3)=_1_6__
一、概念:
1.正态曲线: 称函数 f (x) , (x)
1
e
(x )2 2 2
,
x (, )
的图象
2
(其中μ和δ>0为参量)为正态分布密度曲线,简称正态曲线
正态分布

2. 一般正态分布的概率计算
对于一般正态分布的概率计算,可以应用定积分的
换元法将其转化为标准正态分布的概率计算.
定理 设X~ N(, ) ,则 X ~ N(0,1).
这样,若X~ N(, ),并记其分布函数为 F(x),则
从而
F ( x)
P{X
x}
P
X
x
P
X
1 2
5
1
2
2
0.9772
P{0
X
1.6}
P
0
1 2
X 1 2
1.6 1
2
0.3 0.5
0.3 0.5 1
0.6179 0.6915 1 0.3094
P{
解:由题意知 X ~ N (10.05,0.062 ),于是
P{
X
10.05
0.12}
P
0.12 0.06
X
10.05 0.06
0.12
0.06
2 2
22 1
2 0.9772 1 0.9544
例4 设 X ~ N(, ),求 P{ X }, P{ X 2 },
越小,图形越陡峭.
o
1 x
0.5 1 1.5
x
特别地,当 0, 1时,称 X 服从标准正态分布,
记为 X ~ N(0,1),其概率密度函数为
(x)
1
x2
正态分布概念

图2-4 频数分布与正态分布曲线示意图
一、正态分布的概念和特征
1.正态分布曲线的数学函数表达式:
X服从的概率密度函数f(x)
f (X)
1
1( X )2
e2
2
(-<X< )
X为连续随机变量,μ为X值的总体均数, σ2 为总体方差,记为X~N( μ , σ2)
1.正态分布
正态分布的分布密度函数为:f(x)=σ
解析:从正态曲线的图像可知,该正态曲线关于直线 x=20
对称,最大值为 2
1 ,所以 π
μ=20,
1= 2π·σ 2
1 ,解得 π
σ=
2.于是概率密度函数的解析式为 f(x)=2 1πe-x-4202,x∈(-∞,+∞).
总体随机变量的期望是 μ=20,方差是 σ2=( 2)2=2.
正态分布 (Normal distribution)
正态分布
概述
正态分布是描述连续型变量值分布 的曲线,医学上许多资料近似服从正态 分布。
正态分布在统计推断上有重要的作用。 直方图的频数分布与正态分布
(见图2-4)
频数(f)
25 20 15 10
5 0
2.30~ 2.90~ 3.50~ 4.10~ 4.70~ 5.30~
(5)最值性:当 x=μ时, f, ( x)取得最大值
1
2
σ越大,曲线越“矮胖”,表示总体的分布越
分散;反之σ越小,曲线越“瘦高”,表示总体
的分布越集中.
(6) 几 何 性 : 参 数 μ 和 σ
y
的统计意义:E(x)=μ,曲
线的位置由μ决定
;D(x)=σ2, 曲 线 的 形 状
由σ决定.
正态分布所有的知识点

正态分布是统计学中一种常见的概率分布,也称为高斯分布。
它在许多实际问题的建模和分析中都有重要应用。
本文将从基本概念、性质和应用等方面介绍正态分布。
1. 基本概念正态分布是一种连续型的概率分布,其特点是呈钟形曲线,对称分布于均值周围。
正态分布的定义由两个参数确定,分别是均值μ和标准差σ。
记为N(μ, σ^2),表示随机变量X服从均值为μ,标准差为σ的正态分布。
2. 性质正态分布具有许多重要的性质,包括:2.1 对称性正态分布是关于均值对称的。
也就是说,分布在均值μ左侧的曲线与分布在均值右侧的曲线是相似的。
2.2 峰度和偏度正态分布的峰度是指其曲线的陡峭程度。
正态分布的峰度为3,称为正态分布的峰度系数。
高于3的峰度表示曲线更陡峭,低于3的峰度表示曲线更平缓。
正态分布的偏度是指其曲线的对称性。
正态分布的偏度为0,表示曲线对称。
大于0的偏度表示曲线向左偏斜,小于0的偏度表示曲线向右偏斜。
2.3 中心极限定理中心极限定理是指在一定条件下,独立同分布的随机变量之和近似服从正态分布。
这个定理在统计学中有广泛的应用,使得正态分布成为统计推断的基础。
3. 应用正态分布在实际问题中有广泛的应用,下面介绍几个常见的应用场景:3.1 统计推断正态分布在统计推断中起到至关重要的作用。
通过收集样本数据,我们可以根据正态分布的性质进行参数估计和假设检验等统计分析。
3.2 财务分析正态分布在财务分析中也有重要应用。
例如,股票市场的收益率往往服从正态分布,基于正态分布的模型可以用于分析和预测股票的风险和收益。
3.3 质量控制正态分布在质量控制中用于判断产品质量是否符合要求。
通过收集产品的测量数据,可以利用正态分布的性质进行质量控制和异常检测。
3.4 自然科学研究正态分布在自然科学研究中也有广泛应用。
例如,地震的震级、物种的体重和身高等都可以用正态分布进行建模和分析。
结论正态分布是统计学中最重要的概率分布之一,具有许多重要的性质和应用。
正态分布.

正态分布是应用最广泛的一种连续型分布.正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯分布.德莫佛德莫佛最早发现了二项概率的一个近似公式,这一公式被认为是正态分布的首次露面.正态分布的定义是什么呢?对于连续型随机变量,一般是给出它的概率密度函数.一、正态分布的定义若r.v X 的概率密度为),(~2σμN X 记作f (x )所确定的曲线叫作正态曲线.∞<<∞-=--x e x f x ,)()(22221σμπσ其中和都是常数,任意,>0,则称X 服从参数为和的正态分布.σ2σμμ2σμ正态分布有些什么性质呢?由于连续型随机变量唯一地由它的密度函数所描述,我们来看看正态分布的密度函数有什么特点.正态分布的图形特点),(2σμN正态分布的密度曲线是一条关于对称的钟形曲线.μ特点是“两头小,中间大,左右对称”.决定了图形的中心位置,决定了图形中峰的陡峭程度.μσ正态分布的图形特点),(2σμN能不能根据密度函数的表达式,得出正态分布的图形特点呢?∞<<∞-=--x e x f x ,)()(22221σμπσ容易看到,f (x )≥0即整个概率密度曲线都在x 轴的上方;故f (x )以μ为对称轴,并在x =μ处达到最大值:∞<<∞-=--x e x f x ,)()(22221σμπσ令x =μ+c ,x =μ-c (c >0),分别代入f (x ),可得f (μ+c )=f (μ-c )且f (μ+c ) ≤f (μ), f (μ-c )≤f (μ)σπμ21)(=f这说明曲线f (x )向左右伸展时,越来越贴近x 轴. 即f (x )以x 轴为渐近线.∞<<∞-=--x e x f x ,)()(22221σμπσ当x→ ±∞时,f (x ) →0,用求导的方法可以证明,∞<<∞-=--x ex fx, )()(22221σμπσ为f(x)的两个拐点的横坐标.x = μ±σ这是高等数学的内容,如果忘记了,课下再复习一下.根据对密度函数的分析,也可初步画出正态分布的概率密度曲线图.用上海99年年降雨量的数据画出了频率直方图.从直方图,我们可以初步看出,年降雨量近似服从正态分布.下面是我们用某大学男大学生的身高的数据画出的频率直方图.红线是拟合的正态密度曲线可见,某大学男大学生的身高应服从正态分布.人的身高高低不等,但中等身材的占大多数,特高和特矮的只是少数,而且较高和较矮的人数大致相近,这从一个方面反映了服从正态分布的随机变量的特点.请同学们想一想,实际生活中具有这种特点的随机变量还有那些呢?除了我们在前面遇到过的年降雨量外,在正常条件下各种产品的质量指标,如零件的尺寸;纤维的强度和张力;某地区成年男子的身高、体重;农作物的产量,小麦的穗长、株高;测量误差,射击目标的水平或垂直偏差;信号噪声等等,都服从或近似服从正态分布.∞<<∞-=--x e x f x ,)()(22221σμπσ服从正态分布的随机变量X 的概率密度是),(2σμN X 的分布函数P (X ≤x )是怎样的呢?设X ~,),(2σμN X 的分布函数是∞<<∞-=⎰∞---x dt e x F xt ,)()(22221σμπσ正态分布由它的两个参数μ和σ唯一确定,当μ和σ不同时,是不同的正态分布.下面我们介绍一种最重要的正态分布标准正态分布dt e x x t ⎰∞--=Φ2221)(π二、标准正态分布1,0==σμ的正态分布称为标准正态分布.∞<<∞-=-x e x x ,21)(22πϕ其密度函数和分布函数常用和表示:)(x ϕ)(x Φ)(x Φ它的依据是下面的定理:标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.根据定理1,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题.),(~2σμN X σμ-=X Y ,则~N (0,1)设定理1书末附有标准正态分布函数数值表,有了它,可以解决一般正态分布的概率计算查表.三、正态分布表)(1)(x x Φ-=-Φdt e x x t ⎰∞--=Φ2221)(π表中给的是x >0时, Φ(x )的值.当-x <0时x -x),,(~2σμN X 若σμ-=X Y ~N (0,1)若X ~N (0,1),)(σμσμ-≤≤-=b Y a P )(b X a P <<)()()(a b b X a P Φ-Φ=<<)()(σμσμ-Φ--Φ=a b由标准正态分布的查表计算可以求得,这说明,X 的取值几乎全部集中在[-3,3]区间内,超出这个范围的可能性仅占不到0.3%.当X ~N (0,1)时,P (|X | 1)=2 (1)-1=0.6826≤Φ≤ΦP (|X | 2)=2 (2)-1=0.9544≤ΦP (|X | 3)=2 (3)-1=0.9974四、3准则σ将上述结论推广到一般的正态分布, ),(~2σμN Y 时,6826.0)|(|=≤-σμY P 9544.0)2|(|=≤-σμY P 9974.0)3|(|=≤-σμY P 可以认为,Y 的取值几乎全部集中在]3,3[σμσμ+-区间内.这在统计学上称作“3 准则”(三倍标准差原则).σ上一讲我们已经看到,当n很大,p接近0或1时,二项分布近似泊松分布; 如果n很大,而p不接近于0或1,那么可以证明,二项分布近似于正态分布.下面我们不加证明地介绍有关二项分布近似于正态分布的一个定理,称为棣莫佛-拉普拉斯定理. 它是第五章要介绍的中心极限定理的一个最重要的特殊情况.五、二项分布的正态近似定理(棣莫佛-拉普拉斯定理)})1({lim x p np np Y P n n ≤--∞→设随机变量服从参数n, p (0<p <1)的二项分布,则对任意x ,有n Y dt e x t ⎰∞--=2221π定理表明,当n 很大,0<p <1是一个定值时(或者说,np (1-p )也不太小时),二项变量的分布近似正态分布N (np ,np (1-p )).n Y≥≥实用中,n30,np10时正态近似的效果较好.例1将一枚硬币抛掷10000次,出现正面5800次,认为这枚硬币不均匀是否合理? 试说明理由.解: 设X 为10000次试验中出现正面的次数,采用正态近似, np =5000, np (1-p )=2500,若硬币是均匀的,X ~B (10000,0.5),505000)1(-=--X p np np X 近似正态分布N (0,1).即=1-Φ(16))5050005800(1-Φ-≈≈0此概率接近于0,故认为这枚硬币不均匀是合理的.P (X ≥5800)=1-P (X <5800)505000)1(-=--X p np np X 近似正态分布N (0,1).再看一个应用正态分布的例子:例2公共汽车车门的高度是按男子与车门顶头碰头机会在0.01以下来设计的.设男子身高X~N(170,62),问车门高度应如何确定?解: 设车门高度为h cm,按设计要求P(X≥ h)≤0.01或P(X< h)≥0.99,下面我们来求满足上式的最小的h.因为X ~N (170,62),)1,0(~6170N X -)6170(-Φh ≥故P (X < h )=0.99Φ查表得(2.33)=0.9901>0.996170-h 所以=2.33,即h =170+13.98 184≈设计车门高度为184厘米时,可使男子与车门碰头机会不超过0.01.P(X < h ) 0.99≥求满足的最小的h .。
正态分布完整ppt课件

使用如Shapiro-Wilk检验、Kolmogorov-Smirnov检验等方法,对 误差项进行正态性检验,以验证其是否符合正态分布。
方差分析中F分布应用
01 02
F分布的定义
F分布是一种连续型概率分布,常用于方差分析中的假设检验。在方差 分析中,通过比较不同组间的方差与组内方差,判断各因素对结果的影 响是否显著。
筛选方法
包括单变量分析和多变量分析等,结合临床 意义和统计学显著性进行生物标志物的筛选 。
社会科学调查数据分析
社会科学调查数据特点
大量、复杂、多维度的数据,往往需要进行统计分析和数据挖掘。
正态分布在社会科学调查数据分析中的应用
通过对调查数据进行正态性检验,选择合适的数据处理和分析方法,如参数检验、回归分析等。
有对称性和单峰性。
性质
对称性:正态分布曲线关于均值对称 。
单峰性:正态分布曲线只有一个峰值 ,位于均值处。
均值、中位数和众数相等。
概率密度函数在均值两侧呈指数下降 。
正态曲线特点
01
02
03
04
形状
钟形曲线,中间高,两边低。
对称性
关于均值对称,即左右两侧形 状相同。
峰值
位于均值处,且峰值高度由标 准差决定。
05
正态分布在金融学领域应用
风险评估及资产组合优化
风险评估
正态分布用于描述金融资产的收益和风险分布,通过计算均值和标准差来评估投资组合 的风险水平。
资产组合优化
基于正态分布假设,利用马科维茨投资组合理论等方法,构建最优资产组合以降低风险 并提高收益。
VaR(Value at Risk)计算
正态分布用于计算投资组合在一定置信水平下的最大可能损失(VaR),以衡量潜在风 险。
正态分布公式

正态分布公式正态分布也称为高斯分布或正常分布,它是一种概率分布,用于描述符合几种基本假设的连续随机变量的分布。
正态分布是一个重要的基本分布,被广泛应用于统计学、自然科学、社会科学等领域中。
正态分布有许多不同的形式,但最常见的是标准正态分布。
标准正态分布的分布函数和概率密度函数分别如下:标准正态分布的分布函数:$$\\Phi (x)=\\frac{1}{\\sqrt{2\\pi}}\\int_{-\\infty}^x e^{-\\frac{t^2}{2}} dt$$标准正态分布的概率密度函数:$$\\phi (x)=\\frac{1}{\\sqrt{2\\pi}}e^{-\\frac{x^2}{2}}$$其中,$\\phi(x)$表示在点$x$处获得概率密度的值,$\\Phi(x)$表示在$-\\infty$到$x$的积分所得到的累积概率。
对于非标准正态分布,可以使用变换将其转换为标准正态分布。
转换的方法是,对于一个均值为$\\mu$,标准差为$\\sigma$的正态分布$X$,使用以下公式进行变换:$$Z=\\frac{X-\\mu}{\\sigma}$$其中,$Z$表示标准正态分布的变量。
只要确定了$Z$,就可以使用标准正态分布的表格或统计软件来计算概率。
正态分布的形状是钟形曲线,均值$\\mu$位于曲线中心,标准差$\\sigma$决定曲线的宽度。
它具有很多特性:1. 正态分布的均值、中位数和众数相等。
2. 曲线在均值处对称,即左右两侧面积相等。
3. 由于标准差的不同,曲线的高度、峰度和尖度也不同。
4. 68%的数据落在均值$\\pm$1个标准差范围内,95%的数据落在均值$\\pm$2个标准差范围内。
正态分布在现实生活中具有重要意义,例如身高、体重、智力、化学反应速率、股票收益率等,往往都服从于正态分布。
因此,深入理解正态分布的公式和性质,对于数据分析、统计学、金融学等领域的人士来说是非常重要的。
正态分布解释

正态分布解释正态分布是统计学中最常见的分布之一,也被称为高斯分布。
它在各个领域都有广泛的应用,尤其在自然科学和社会科学中经常被使用。
正态分布的特征是呈钟形曲线,两侧的尾部逐渐衰减。
其分布是由两个参数所决定,即均值(μ)和标准差(σ)。
均值决定了曲线的中心位置,而标准差则决定了曲线的宽度。
当均值为0,标准差为1时,这个分布被称为标准正态分布。
正态分布有许多重要的性质。
首先,它是对称的,即曲线两侧呈镜像关系。
其次,68%的数据落在均值加减一个标准差的范围内,而95%的数据落在均值加减两个标准差的范围内。
这个性质被称为“三个标准差原则”。
正态分布在实际应用中有着广泛的应用。
例如,在自然科学中,正态分布可以用来描述许多自然现象,如身高、体重等。
在社会科学中,正态分布可以用来描述人口统计数据、心理测量等。
此外,在工程学中,正态分布被用来描述可靠性和质量控制等。
正态分布的解释还可以从概率密度函数来进行拓展。
概率密度函数是描述随机变量在某一点附近的概率分布的函数。
对于正态分布来说,其概率密度函数为:f(x) = (1 / (σ * √(2 * π))) * e^(-((x - μ)^2) / (2 * σ^2))其中,e为自然对数的底数。
通过概率密度函数,我们可以计算出特定取值范围内的概率。
例如,我们可以计算出落在某个特定区间的概率,或者求出某个特定值的累积概率。
总之,正态分布是一种常见的概率分布,具有许多重要的性质,可以用来描述各种现象和数据。
在实际应用中,我们可以利用正态分布的特性来进行数据分析和推断。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正态分布维基百科,自由的百科全书跳转到:导航, 搜索此条目或章节需要精通或熟悉本主题的专家参与编辑请协助邀请适合的人士,或参照相关专业文献,自行改善这篇条目。
更多的细节与详情请参见条目讨论页。
汉漢▼正态分布概率密度函数绿线代表标准正态分布累积分布函数颜色与概率密度函数同参数μlocation(real)σ2 > 0 squared scale(real)支撑集概率密度函數累积分布函数期望值μ中位数μ众数μ方差σ2偏度0峰度 3信息熵动差生成函数特性函数正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为:X∼N(μ,σ2),则其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
因其曲线呈钟形,因此人们又经常称之为钟形曲线。
我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布(见右图中绿色曲线)。
目录• 1 概要o 1.1 历史• 2 正态分布的定义o 2.1 概率密度函数o 2.2 累积分布函数o 2.3 生成函数▪ 2.3.1 动差生成函数▪ 2.3.2 特征函数• 3 性质o 3.1 标准化正态随机变量o 3.2 矩(英文:moment)o 3.3 生成正态随机变量o 3.4 中心极限定理o 3.5 无限可分性o 3.6 稳定性o 3.7 标准偏差• 4 正态测试• 5 相关分布• 6 参量估计o 6.1 参数的极大似然估计▪ 6.1.1 概念一般化o 6.2 参数的矩估计•7 常见实例o7.1 光子计数o7.2 计量误差o7.3 生物标本的物理特性o7.4 金融变量o7.5 寿命o7.6 测试和智力分布•8 计算统计应用o8.1 生成正态分布随机变量•9 参见•10 引用条目•11 外部连接[编辑]概要正态分布是自然科学与行为科学中的定量现象的一个方便模型。
各种各样的心理学测试分数和物理现象比如光子计数都被发现近似地服从正态分布。
尽管这些现象的根本原因经常是未知的,理论上可以证明如果把许多小作用加起来看做一个变量,那么这个变量服从正态分布(在R.N.Bracewell的Fourier transform and its application中可以找到一种简单的证明)。
正态分布出现在许多区域统计:例如, 采样分布均值是近似地正态的,既使被采样的样本总体并不服从正态分布。
另外,常态分布信息熵在所有的已知均值及方差的分布中最大,这使得它作为一种均值以及方差已知的分布的自然选择。
正态分布是在统计以及许多统计测试中最广泛应用的一类分布。
在概率论,正态分布是几种连续以及离散分布的极限分布。
[编辑]历史常态分布最早是亚伯拉罕·棣莫弗在1734年发表的一篇关于二项分布文章中提出的。
拉普拉斯在1812年发表的《分析概率论》(Theorie Analytique des Probabilites)中对棣莫佛的结论作了扩展。
现在这一结论通常被称为棣莫佛-拉普拉斯定理。
拉普拉斯在误差分析试验中使用了正态分布。
勒让德于1805年引入最小二乘法这一重要方法;而高斯则宣称他早在1794年就使用了该方法,并通过假设误差服从正态分布给出了严格的证明。
“钟形曲线”这个名字可以追溯到Jouffret他在1872年首次提出这个术语"钟形曲面",用来指代二元正态分布(bivariate normal)。
正态分布这个名字还被Charles S. Peirce、Francis Galton、Wilhelm Lexis在1875分布独立的使用。
这个术语是不幸的,因为它反应和鼓励了一种谬误,即很多概率分布都是正态的。
(请参考下面的“实例”)这个分布被称为“正态”或者“高斯”正好是Stigler名字由来法则的一个例子,这个法则说“没有科学发现是以它最初的发现者命名的”。
[编辑]正态分布的定义有几种不同的方法用来说明一个随机变量。
最直观的方法是概率密度函数,这种方法能够表示随机变量每个取值有多大的可能性。
累积分布函数是一种概率上更加清楚的方法,但是非专业人士看起来不直观(请看下边的例子)。
还有一些其他的等价方法,例如cumulant、特征函数、动差生成函数以及cumulant-生成函数。
这些方法中有一些对于理论工作非常有用,但是不够直观。
请参考关于概率分布的讨论。
四个不同参数集的概率密度函数(绿色线代表标准正态分布)正态分布的概率密度函数均值为μ方差为σ2 (或标准差σ)是高斯函数的一个实例:。
(请看指数函数以及π.)如果一个随机变量X服从这个分布,我们写作X ~ N(μ,σ2). 如果μ = 0并且σ = 1,这个分布被称为标准正态分布,这个分布能够简化为。
右边是给出了不同参数的正态分布的函数图。
正态分布中一些值得注意的量:•密度函数关于平均值对称•平均值是它的众数(statistical mode)以及中位数(median)•函数曲线下68.268949%的面积在平均值左右的一个标准差范围内•95.449974%的面积在平均值左右两个标准差2σ的范围内•99.730020%的面积在平均值左右三个标准差3σ的范围内•99.993666%的面积在平均值左右四个标准差4σ的范围内•反曲点(inflection point)在离平均值的距离为标准差之处上图所示的概率密度函数的累积分布函数累积分布函数是指随机变量X小于或等于x的概率,用密度函数表示为正态分布的累积分布函数能够由一个叫做误差函数的特殊函数表示:标准正态分布的累积分布函数习惯上记为Φ,它仅仅是指μ = 0,σ = 1时的值,将一般正态分布用误差函数表示的公式简化,可得:它的反函数被称为反误差函数,为:该分位数函数有时也被称为probit函数。
probit函数已被证明没有初等原函数。
正态分布的分布函数Φ(x)没有解析表达式,它的值可以通过数值积分、泰勒级数或者渐进序列近似得到。
[编辑]生成函数[编辑]动差生成函数动差生成函数被定义为exp(tX)的期望值。
正态分布的矩生成函数如下:可以通过在指数函数内配平方得到。
[编辑]特征函数特征函数被定义为exp(itX)的期望值,其中i是虚数单位. 对于一个正态分布来讲,特征函数是:把矩生成函数中的t换成it就能得到特征函数。
[编辑]性质正态分布的一些性质:1.如果且a与b是实数,那么aX + b∼N(aμ + b,(aσ)2) (参见期望值和方差).2.如果与是统计独立的正态随机变量,那么:o它们的和也满足正态分布 (proof).o它们的差也满足正态分布.o U与V两者是相互独立的。
3.如果和是独立正态随机变量,那么:o它们的积XY服从概率密度函数为p的分布其中K0是贝塞尔函数(modified Bessel function)o它们的比符合柯西分布,满足X / Y∼Cauchy(0,σX / σY).4.如果为独立标准正态随机变量,那么服从自由度为n的卡方分布。
[编辑]标准化正态随机变量[编辑]矩(英文:moment)一些正态分布的一阶动差如下:阶数原点矩中心矩累积量0 1 01 μ0 μ2 μ2+ σ2σ2σ23 μ3+ 3μσ20 04 μ4+ 6μ2σ2+ 3σ43σ40正态分布的所有二阶以上的累积量为零。
[编辑]生成正态随机变量[编辑]中心极限定理主条目:中心极限定理正态分布的概率密度函数,参数为μ = 12,σ = 3,趋近于n = 48、p = 1/4的二项分布的概率质量函数。
正态分布有一个非常重要的性质:在特定条件下,大量统计独立的随机变量的和的分布趋于正态分布,这就是中心极限定理。
中心极限定理的重要意义在于,根据这一定理的结论,其他概率分布可以用正态分布作为近似。
•参数为n和p的二项分布,在n相当大而且p不接近1或者0时近似于正态分布(有的参考书建议仅在np与n(1 −p)至少为5时才能使用这一近似)。
近似正态分布平均数为μ = np且方差为σ2 = np(1 −p).•一泊松分布带有参数λ当取样样本数很大时将近似正态分布λ.近似正态分布平均数为μ = λ且方差为σ2 = λ.这些近似值是否完全充分正确取决于使用者的使用需求[编辑]无限可分性正态分布是无限可分的概率分布。
[编辑]稳定性正态分布是严格稳定的概率分布。
[编辑]标准偏差深蓝色区域是距平均值小于一个标准差之内的数值范围。
在正态分布中,此范围所占比率为全部数值之68%。
根据正态分布,两个标准差之内(蓝,棕)的比率合起来为95%。
根据正态分布,三个标准差之内(深蓝,橙,黄)的比率合起来为99%。
在实际应用上,常考虑一组数据具有近似于正态分布的概率分布。
若其假设正确,则约68%数值分布在距离平均值有1个标准差之内的范围,约95%数值分布在距离平均值有2个标准差之内的范围,以及约99.7%数值分布在距离平均值有3个标准差之内的范围。
称为"68-95-99.7法则"或"经验法则".[编辑]正态测试[编辑]相关分布•R∼Rayleigh(σ)是瑞利分布,如果,这里X∼N(0,σ2)和Y∼N(0,σ2)是两个独立正态分布。
•是卡方分布具有ν自由度,如果这里X k∼N(0,1)其中是独立的。
•Y∼Cauchy(μ = 0,θ = 1)是柯西分布,如果Y = X1 / X2,其中X1∼N(0,1)并且X2∼N(0,1)是两个独立的正态分布。
•Y∼Log-N(μ,σ2)是对数正态分布如果Y = e X并且X∼N(μ,σ2).•与Lévy skew alpha-stable分布相关:如果因而.•截断正态分布.如果,在A以下和B以上截取X将产生一个平均值这里,φ是一个标准正态随机变量的密度函数•如果X是一个正态分布的随机变量, Y = | X | ,那么Y具有折叠正态分布.[编辑]参量估计[编辑]参数的极大似然估计[编辑]概念一般化多元正态分布的协方差矩阵的估计的推导是比较难于理解的。
它需要了解谱原理(spectral theorem)以及为什么把一个标量看做一个1×1 matrix的trace而不仅仅是一个标量更合理的原因。
请参考协方差矩阵的估计(estimation of covariance matrices).[编辑]参数的矩估计[编辑]常见实例[编辑]光子计数[编辑]计量误差《饮料装填量不足与超量的概率》某饮料公司装瓶流程严谨,每罐饮料装填量符合平均600毫升,标准差3毫升的常态分配法则。