第3章-正态分布时的统计决策

合集下载

正态分布的理论原理及应用

正态分布的理论原理及应用

正态分布的理论原理及应用正态分布(Normal Distribution),又称高斯分布(Gaussian Distribution),是概率统计学中最重要的概率分布之一,也是最常见的连续概率分布之一、正态分布在理论研究和实际应用中都起到了重要的作用。

1.中心极限定理:中心极限定理是正态分布理论的基础,它指出,独立同分布的随机变量的和的极限分布依近似于正态分布。

这意味着,对于大量独立随机变量的和,即使这些变量的分布不同,其总体分布也会接近于正态分布。

2.正态分布的概率密度函数:正态分布的概率密度函数由两个参数决定,即均值(μ)和标准差(σ)。

其概率密度函数可以表示为:f(x)=(1/(σ*√(2π)))*e^(-((x-μ)^2/(2σ^2)))3.正态分布的特性:-均值μ是分布的中心,标准差σ决定了分布的离散程度。

-68%的观测值在均值左右一个标准差范围内,95%的观测值在均值左右两个标准差范围内,99.7%的观测值在均值左右三个标准差范围内。

1.统计分析:正态分布广泛应用于统计分析中。

很多统计模型都需要基于正态分布的假设。

例如,参数估计、假设检验、方差分析等都需要基于正态分布进行推断。

2.质量控制:质量控制中常常使用正态分布。

通过收集样本数据,计算平均值和标准差,可以对产品的质量进行控制和评估。

例如,正态分布常用于确定产品的上下公差。

3.自然科学:正态分布在自然科学中也有应用。

例如,生物学中研究身高、体重等指标时可以使用正态分布。

物理学中粒子运动的速度和位置分布也可以近似为正态分布。

4.金融与经济学:金融市场和经济领域中,许多变量的分布近似为正态分布。

例如,股票收益率、利率、汇率等可以建模为正态分布。

这使得研究人员能够使用正态分布的属性来做出预测和决策。

5.归一化处理:正态分布是进行归一化处理的常用工具之一、通过将数据转化为标准正态分布,可以对不同数据进行比较和分析。

第3章-正态分布时的统计决策

第3章-正态分布时的统计决策

第3章 正态分布时的统计决策在统计决策理论中,涉及到类条件概率密度函数)|(i w x P 。

对许多实际的数据集,正态分布通常是合理的近似。

如果在特征空间中的某一类样本,较多地分布在这一类均值附近,远离均值点的样本比较少,此时用正态分布作为这一类的概率模型是合理的。

另外,正态分布概率模型有许多好的性质,有利于作数学分析。

概括起来就是: (1) 物理上的合理性 (2) 数学上的简单性下面重点讨论正态分布分布及其性质,以及正态分布下的Bayes 决策理论。

3.1 正态分布概率密度函数的定义及性质 1.单变量正态分布 定义:])(21ex p[21)(2σμσπρ--=x x(3.1-1)其中:μ为随机变量x 的期望,也就是平均值;2σ为x 的方差,σ为均方差,又称为标准差。

⎰∞∞-⋅==dx x x x E )()(ρμ (3.1-2)⎰∞∞-⋅-=dx x x )()(22ρμσ(3.1-3)概率密度函数的一般图形如下:)(x ρ具有一下性质:)(,0)(∞<<-∞≥x x ρ1)(=⎰∞∞-dx x ρ (3.1-4)从)(x ρ的图形上可以看出,只要有两个参数2σμ和就可以完全确定其曲线。

为了简单,常记)(x ρ为),(2σμN 。

若从服从正态分布的总体中随机抽取样本x ,约有95%的样本落在)2,2(σμσμ+-中。

样本的分散程度可以用σ来表示,σ越大分散程度越大。

2.多元正态分布 定义:∑---∑=-)]()(21ex p[||)2(1)(1212μμπρx x x T d(3.1-5)其中: T d x x x x ],,,[21 =为d 维随机向量,对于d 维随机向量x ,它的均值向量μ是d 维的。

也就是:T d ],,,[21μμμμ =为d 维均值向量。

∑是d d ⨯维协方差矩阵,1-∑是∑的逆矩阵,||∑为∑的行列式。

协方差矩阵∑是对称的,其中有2/)1(+⨯d d 个独立元素。

概率统计中的正态分布与标准正态分布

概率统计中的正态分布与标准正态分布

概率统计中的正态分布与标准正态分布概率统计是一门研究随机现象的学科,它关注的是事件发生的可能性以及这些可能性的分布规律。

在概率统计中,正态分布是一种非常重要的分布形式,它在自然界和社会科学中广泛应用。

本文将介绍正态分布的基本概念和性质,以及与之相关的标准正态分布。

一、正态分布的基本概念正态分布,又称高斯分布,是一种连续型的概率分布。

它的概率密度函数可以用一个钟形曲线来描述,曲线的中心对称,左右两侧的面积相等。

正态分布的概率密度函数可以表示为:f(x) = (1 / (σ * √(2π))) * exp(-((x - μ)^2 / (2σ^2)))其中,μ是分布的均值,σ是分布的标准差。

均值决定了曲线的中心位置,标准差决定了曲线的宽度。

正态分布的均值和标准差越大,曲线越平坦;均值和标准差越小,曲线越陡峭。

二、正态分布的性质正态分布具有许多重要的性质,其中一些性质对于概率统计的应用非常关键。

1. 对称性:正态分布是以均值为中心对称的,即曲线左右两侧的面积相等。

2. 均值与中位数相等:正态分布的均值等于中位数,即曲线对称轴上的点。

3. 68-95-99.7法则:对于一个服从正态分布的随机变量,约68%的观测值位于均值的一个标准差范围内,约95%的观测值位于均值的两个标准差范围内,约99.7%的观测值位于均值的三个标准差范围内。

4. 累积分布函数:正态分布的累积分布函数可以用高斯误差函数表示,它可以计算出给定值之前的累积概率。

三、标准正态分布标准正态分布是一种特殊的正态分布,其均值为0,标准差为1。

标准正态分布在概率统计中具有重要的作用,它可以通过标准化来简化计算。

标准正态分布的概率密度函数可以表示为:φ(x) = (1 / √(2π)) * exp(-x^2 / 2)标准正态分布的累积分布函数通常用符号Φ(x)表示,它可以表示为:Φ(x) = ∫φ(t)dt标准正态分布的性质与一般正态分布类似,但由于其均值和标准差已经确定,计算和应用更加方便。

概率与统计中的正态分布与标准化

概率与统计中的正态分布与标准化

概率与统计中的正态分布与标准化正态分布(Normal distribution)是概率论与统计学中一种重要的连续概率分布,也被称为高斯分布(Gaussian distribution)。

正态分布在实际生活和科学研究中有着广泛的应用。

本文将介绍正态分布的特点、标准化以及相关应用。

一、正态分布的特点正态分布的概率密度函数是一个钟形曲线,其特点包括:1. 对称性:正态分布的曲线关于均值对称,即均值左右对称。

2. 唯一性:正态分布由两个参数决定,即均值和标准差。

3. 正态性:大部分实际数据可以近似看作是正态分布,例如身高、体重等。

二、标准化标准化是指将正态分布的随机变量转化为标准正态分布的随机变量的过程。

标准正态分布是均值为0,标准差为1的正态分布。

标准化的步骤为:1. 假设有一个服从正态分布的随机变量X,其均值为μ,标准差为σ。

2. 标准化公式为Z = (X - μ) / σ,其中Z为标准化后的变量。

标准化后的变量Z可以用来计算正态分布中某个随机变量落入某个区间的概率,而不需要知道具体的正态分布的均值和标准差。

三、正态分布的应用正态分布在各个领域都有广泛的应用,以下是其中几个常见的应用:1. 统计推断:利用正态分布的特性,可以进行假设检验、置信区间估计等统计推断分析,从而帮助研究人员做出科学的决策。

2. 风险分析:正态分布可以用来分析金融市场的风险,帮助投资者做出风险管理和资产配置的决策。

3. 质量控制:正态分布可以应用于质量控制中,通过控制图等方法,对生产过程中的差异进行监控和控制。

4. 教育评估:正态分布可以用来评估学生的智力、能力等指标,帮助教师进行个体化的教育和辅导。

5. 自然科学研究:正态分布在物理、化学、生物等自然科学研究中有着广泛的应用,从而揭示事物的规律和特性。

综上所述,正态分布是概率与统计学中的重要内容,通过对正态分布的了解和应用,可以为实际问题提供科学的分析和解决方案。

标准化是利用正态分布特性的一种方法,可以简化计算和分析过程。

正态分布的概率计算解读

正态分布的概率计算解读

正态分布的概率计算解读正态分布是概率论和统计学中最为常见且重要的一种连续概率分布。

它的图形呈钟形曲线,也被称为高斯分布。

这个分布是由数学家高斯提出并发展而来的,被广泛应用于自然科学、社会科学、工程技术和金融等领域的数据分析。

在正态分布中,均值和标准差是两个关键参数。

均值决定了曲线的中心位置,而标准差则刻画了曲线的宽度和形状。

具体来说,均值决定了分布的期望值,标准差则表征了分布的离散程度。

正态分布的图像是中间较高、两端逐渐降低,并且在均值两侧关于均值对称的。

这种对称性和中间高、两端低的特点使得正态分布成为许多自然和社会现象的模型。

正态分布的概率计算是指根据给定的正态分布进行统计推断和概率预测。

主要有两种类型的概率计算,即概率密度函数(Probability Density Function, PDF)和累积分布函数(Cumulative Distribution Function, CDF)。

PDF可以帮助我们计算在其中一特定值的概率密度,而CDF可以帮助我们计算在一些特定阈值以下的概率。

在进行正态分布的概率计算前,先要标准化数据。

标准化是将原始数据转化成标准正态分布的过程。

标准正态分布是均值为0,标准差为1的正态分布。

标准化可以通过以下公式完成:Z值=(X-均值)/标准差其中,X为原始数据,均值为正态分布的均值,标准差为正态分布的标准差。

通过标准化,我们可以将不同的数据转化成相同的标准分布,从而方便进行概率计算和比较。

一种常见的概率计算是计算在其中一特定值的概率密度。

由于正态分布是连续分布,每个具体的值的概率都是无限小,因此我们只能计算在一些区间的概率密度。

对于标准正态分布而言,其曲线下一个区间的概率可以通过求解累积分布函数来得到。

另一种常见的概率计算是计算在一些特定阈值以下的概率。

对于标准正态分布而言,计算在一些特定阈值以下的概率可以通过查表或使用计算机软件来进行。

一般地,我们可以使用标准正态分布的累积分布函数来计算该概率。

正态分布 课件

正态分布   课件
在气象中,某地每年七月份的平均气温、平均湿度 以及降雨量等,水文中的水位;
总之,正态分布广泛存在于自然界、生产及科学技术的许多领域中。
正态分布在概率和统计中占有重要地位。
4、正态曲线的性质
(1)曲线在x轴的上方,与x轴不相交.
(μ-σ,μ+σ]
0.6826
(μ-2σ,μ+2σ]
0.9544
(μ-3σ,μ+3σ]
0.9974
(2)曲线是单峰的,它关于直线x=μ对称.
(4)曲线与x轴之间的面积为1.
(3)曲线在x=μ处达到峰值(最高点)
(5)若 固定, 随 值的变化而沿x轴平移, 故 称为位置参数
(6)当μ一定时,曲线的形状由σ确定 .σ越大,曲线越“矮胖”,表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.
5、特殊区间的概率:
m-a
m+a
x=μ
若X~N ,则对于任何实数a>0,概率 为如图中的阴影部分的面积,对于固定的 和 而言,该面积随着 的减少而变大。这说明 越小, 落在区间 的概率越大,即X集中在 周围概率越大。
4
0.04
[0.5,1)
8
0.08
[1,1.5)
15
0.15
[1.5,2)
22
0.22
[2,2.5)
25
0.25
[2.5,3)
14
0.14
[3,3.5)
6
0.06
[3.5,4)
4
0.04
[4,4.5)
2
0.02
11
高尔顿钉板实验的 频率分布直方图
这条曲线具有 “中间高,两头低” 的特征,像这种类型的曲线, 就是(或近似地是)以下函数的图像:

正态分布与标准正态分布

正态分布与标准正态分布

概率密度函数:描述正态分布 的概率密度函数图像
分布函数:描述正态布的分 布函数图像
图像特征
钟形曲线
均值为0,标准差 为1
概率密度函数关 于y轴对称
面积总和为1
03 标准正态分布的概念
定义与特性
定义:标准正态分布是 均值为0,标准差为1 的正态分布
特性:概率密度函数关 于y轴对称,呈钟形曲 线状,且在y轴两侧逐 渐趋于0
分布和规律。
参数估计与假设检验
参数估计:正态分布与标准正态分布是常用的概率分布,在参数估计中具有重 要的应用,如回归分析中的最小二乘法等。
假设检验:正态分布与标准正态分布也是假设检验中常用的概率分布,如t检 验、Z检验等。通过比较实际数据与理论分布的差异,可以检验假设是否成立。
统计决策:正态分布与标准正态分布在统计决策中也有广泛应用,如贝叶 斯决策、风险决策等。这些方法可以帮助我们做出更科学、更合理的决策。
感谢您的观看
汇报人:XX
数据分析:正态分布与标准正态分布在数据分析中也有重要的应用,如主 成分分析、因子分析等。这些方法可以帮助我们更好地理解和分析数据。
方差分析中的应用
描述性统计:正态分 布和标准正态分布是 描述性统计中的重要 分布,用于描述数据 的分布情况。
参数估计:标准正态 分布可用于估计总体 参数,如总体均值和 总体比例。
应用场景:正态分 布在描述数据分布 时更为常见,而标 准正态分布则常用 于概率计算和统计 分析。
差异:标准正态分 布是正态分布在特 定条件下的简化形 式,两者在应用上 存在一定的差异。
05
正态分布与标准正态分 布在统计学中的重要性
中心极限定理
定义:在大量独 立随机变量的平 均数中,无论这 些随机变量是何 种类型,其分布 都趋近于正态分

正态分布原则

正态分布原则

正态分布原则正态分布是统计学中的一个重要概念,也被称为高斯分布。

它在自然界中广泛存在,并且在各个领域的研究中扮演着重要角色。

正态分布有许多相关的原则和性质,下面将介绍几个常见的参考内容。

1. 中心极限定理中心极限定理是正态分布的一个重要原则。

该定理指出,对于一个随机变量序列,无论其原始分布如何,其样本量足够大时,该序列的均值将近似服从正态分布。

这一定理的应用非常广泛,可用于建立统计学方法和推断,解释观测数据的规律和模型等。

2. 标准正态分布标准正态分布是正态分布的一种特殊形式,均值为0,标准差为1。

标准正态分布常用于统计推断和假设检验中,通过将原始数据标准化为标准正态分布,可以对数据进行比较和分析。

标准正态分布在经济学、生物学、金融学等多个领域中都有广泛应用。

3. 正态曲线图和概率密度函数正态曲线是正态分布的图形表示,具有典型的钟形曲线,左右对称,峰值在均值处。

正态曲线图可以直观地展示数据集的分布情况。

正态分布的概率密度函数是描述正态分布的函数,它具有一定的数学形式,描述了各个取值点的概率密度。

通过概率密度函数,我们可以计算出数据在不同区间的概率。

4. 正态分布的性质和特点正态分布具有许多重要的性质和特点。

首先,正态分布的均值、中位数和众数是相等的,并且都位于曲线的中心。

其次,正态分布的方差决定了曲线的宽窄程度,方差越大,曲线越宽。

另外,正态分布的曲线是左右对称的,即左半部分与右半部分完全相同。

5. 应用范围与意义正态分布在许多领域中都有广泛的应用。

在自然科学中,正态分布常被用来描述物种分布、自然现象的测量误差等。

在社会科学中,正态分布可以用来描述人群身高、智力分数、心理测量结果等。

在金融学中,正态分布可以用来描述股票收益、汇率波动等变量。

正态分布的应用使得我们能够更好地理解和解释数据集的特征,从而推断和预测未来的结果。

以上是关于正态分布原则的一些相关参考内容,正态分布的理论和方法在统计学中具有重要的地位和应用价值。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第3章 正态分布时的统计决策在统计决策理论中,涉及到类条件概率密度函数)|(i w x P 。

对许多实际的数据集,正态分布通常是合理的近似。

如果在特征空间中的某一类样本,较多地分布在这一类均值附近,远离均值点的样本比较少,此时用正态分布作为这一类的概率模型是合理的。

另外,正态分布概率模型有许多好的性质,有利于作数学分析。

概括起来就是: (1) 物理上的合理性 (2) 数学上的简单性下面重点讨论正态分布分布及其性质,以及正态分布下的Bayes 决策理论。

3.1 正态分布概率密度函数的定义及性质 1.单变量正态分布 定义:])(21ex p[21)(2σμσπρ--=x x(3.1-1)其中:μ为随机变量x 的期望,也就是平均值;2σ为x 的方差,σ为均方差,又称为标准差。

⎰∞∞-⋅==dx x x x E )()(ρμ (3.1-2)⎰∞∞-⋅-=dx x x )()(22ρμσ(3.1-3)概率密度函数的一般图形如下:)(x ρ具有一下性质:)(,0)(∞<<-∞≥x x ρ1)(=⎰∞∞-dx x ρ (3.1-4)从)(x ρ的图形上可以看出,只要有两个参数2σμ和就可以完全确定其曲线。

为了简单,常记)(x ρ为),(2σμN 。

若从服从正态分布的总体中随机抽取样本x ,约有95%的样本落在)2,2(σμσμ+-中。

样本的分散程度可以用σ来表示,σ越大分散程度越大。

2.多元正态分布 定义:∑---∑=-)]()(21ex p[||)2(1)(1212μμπρx x x T d(3.1-5)其中: T d x x x x ],,,[21 =为d 维随机向量,对于d 维随机向量x ,它的均值向量μ是d 维的。

也就是:T d ],,,[21μμμμ =为d 维均值向量。

∑是d d ⨯维协方差矩阵,1-∑是∑的逆矩阵,||∑为∑的行列式。

协方差矩阵∑是对称的,其中有2/)1(+⨯d d 个独立元素。

由于)(x ρ可由μ和∑完全确定,所以实际上)(x ρ可由2/)1(+⨯+d d d 个独立元素来确定。

T x )(μ-是)(μ-x 的转置,且:}{x E =μ}))({(T x x E μμ--=∑μ、∑分别是向量x 和矩阵T x x ))((μμ--的期望。

具体说:若i x 是x 的第i 个分量,i μ是μ的第i 个分量,2ij σ是∑的第i 、j 个元素。

⎰⎰∞∞-===i i i i i i dx x x dx x x x E )()(][ρρμ(3.1-6)其中)(i x ρ为边缘分布,⎰⎰∞∞-∞∞-=di dx dx dx x x 21)()(ρρ―――――――――――――――――――――――――――“对于二维随机变量X 和Y 作为一个整体,其分布函数F (x ,y ),而X 和Y 都是随机变量,各别也有分布函数F X (x)、F Y (y),分别称为二维随机变量(X ,Y )关于X 和Y 的边缘分布函数。

有:),()(+∞=x F x F X 和),()(y F y F Y +∞=。

对于离散随机变量有:∑∑≤∞==+∞=x x j ijX i p x F x F 1),()(从中得到X 的分布律为:∑∞===1}{j ij i p x X P 同样,Y的分布律为∑∞===1}{i ij j p y Y P 。

对于连续型随机变量(X ,Y ),假定它的概率密度为),(y x f ,由:dx dy y x f x F x F xX ⎰⎰∞-+∞∞-=+∞=]),([),()(知道,X 的概率密度为:⎰+∞∞-=dy y x f x f X ),()(同样也可以求出Y 的概率密度函数。

”―――――――――――――――――――――――――――――而:)])([(j 2j i i ijx x E μμσ--=]),())((j j i j i j i i dx dx x x x x ρμμ⋅--=⎰⎰∞∞-∞∞-(3.1-7)协方差矩阵:⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡=∑222212222221221212211dd d d d d σσσσσσσσσ (3.1-8)是一个对称矩阵,只考虑∑为正定矩阵的情况,也就是||∑所有的子式都大于0。

即0||211≥σ,0222212212211≥σσσσ,…… 同单变量正态分布一样,多元正态分布)(x ρ可以由μ和∑完全确定,常记为),(∑μN 。

3.多元正态分布的性质(1)参数∑和μ对分布的决定性对于d 维随机向量x ,它的均值向量μ也是d 维的,协方差矩阵是对称的,其中有2/)1(+d d 个独立元素。

)(x ρ可由∑和μ完全确定,实际上)(x ρ可由2/)1(++d d d 个独立元素决定。

常记为:)(x ρ~),(∑μN 。

(2)等密度点的轨迹为一超椭球面由)(x ρ的定义公式(3.1-5)可知,当右边指数项为常数时,密度)(x ρ的值不变,所以等密度点满足:常数=-∑--)()(1μμx x T可以证明,上式的解是一个超椭球面,其主轴方向取决于∑的本征向量(特征向量),主轴的长度与相应的本征值成正比。

如下图所示:从上图可以看出,从正态分布总体中抽取的样本大部分落在由μ和∑所确定的一个区域里,这个区域的中心由均值向量μ决定,区域的大小由协方差矩阵决定。

在数理统计中,令: )()(12μμγ-∑-=-x x T式中γ称为x 到μ的马氏距离(Mahalanobis )距离。

所以,等密度点轨迹是x 到μ的马氏距离γ为常数的超椭球面。

该超椭球面构成的球体的大小是样本对于均值向量的“离散度度量”。

体积:dd γνν⋅∑⋅=21||⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧-⋅⋅=-!)!21(2)!2(2)1(2d d d d d d d ππν 如果d 确定了,则d ν不变,v 与21||∑有关。

也就是对于给定的维数d ,样本离散度随21||∑而变。

(3)不相关性等价于独立性概率论中,两个随机变量i x 和j x 之间不相关,并不意味着它们一定独立。

如果i x 和j x 之间不相关,则j i x x 的数学期望有:)()()(j i j i x E x E x x E ⋅=如果i x 和j x 相互独立,则有:)()(),(j i j i x P x P x x P ⋅=独立性是比不相关更强的条件。

不相关反映了i x 和j x 的总体性质。

如果i x 和j x 相互独立,则它们之间一定不相关,反之则不成立。

但是对服从正态分布的两个分量i x 和j x ,若i x 与j x 互不相关,则它们之间一定独立。

证明:根据定义,i x 和j x 的协方差)])([(2j j i i ijx x E μμσ--= 又根据不相关定义)()(),(j i j i x E x E x x E ⋅=有:)()()])([(2j j i i j j i i ij x E x E x x E μμμμσ-⋅-=--=又:)(i i x E =μ,0)()()()[(=-=-=-i i i i i i x E E x E x E μμμ所以:有02=ijσ d 为偶数d 为奇数协方差矩阵⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=∑2211ddσσ 成为对角阵。

可以计算出:⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡=∑-221111001dd σσ∏==∑di ii 12||σ,∏==∑di ii121||σ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡--=-∑⋅--d d dd d d x x x x x T x μμσσμμμμ 1122111111001],,[)()(21)(∑=-=di iiii x σμ因此,∑---∑=-)]()(21ex p[||)2(1)(1212μμπρx x x T d∏∏===⎭⎬⎫⎩⎨⎧--⋅=di i ii i i di iix x 121)()(21ex p 21ρσμσπ根据独立性的定义:正态分布随机向量的各分量间互不相关性与相互独立等价。

(4)边缘分布与条件分布的等价性不难证明正态随机向量的边缘分布与条件分布仍服从正态分布。

从(3)证明得出的结论)(x ρ表达式,如果x 用1x 表示,有:))(21exp(21)(211111σμσπρ--⋅=x x ii也就是说,边缘分布)(1x ρ服从均值为1μ,方差为211σ的正态分布:),(~)(21111σμρN x同理,),(~)(22222σμρN x另外,条件分布,给定1x 的条件下2x 的分布:)(),()|(12112x x x x x ρρρ=[]⎭⎬⎫⎩⎨⎧----+-∑-∑=))(()()(||21exp ||21),(22112122222112112222121μμσμσμσπρx x x x x x 代入上式,)|(12x x ρ服从正态分布,同理)|(21x x ρ也服从正态分布。

(5)线性变换的正态性对于多元随机向量的线性变换,仍为多元正态分布的随机向量。

就是:x 服从正态分布),(~)(∑μρN x ,对x 作线性变换Ax y =,其中A 为线性变换矩阵,且0||≠A ,则y 服从正态分布:),(~)(T A A A N y ∑μρ(6)线性组合的正态性若x 为多元正态随机向量,则线性组合x a y T =是一维的正态随机变量:),(~)(a a a N y T T ∑μρ其中,a 与x 同维。

3.2 正态分布中的Bayes 分类方法在上一章,我们已经把基于Bayes 公式的几种分类判决规则抽象为相应的判决函数和决策面方程。

这几种方法中Bayes 最小错误率判决规则是一种最基本的方法。

如果取0-1损失函数,最小风险判决规则和最大似然比判决规则均与最小错误判决规则等价。

为了方便,我们以最小错误判决规则为例来研究Bayes 分类方法在正态分布中的应用。

由最小错误率判决规则抽象出来的判决函数如下:)()|()(i i i w P w x x g ⋅=ρc i ,,2,1 =如果类概率密度是正态分布的,则)|(i w x ρ~),(i i N ∑μ。

∑---∑=-)]()(21exp[||)2()()(1212i i Ti i d i i x x w P x g μμπ 由于对数函数是一个单调变化的函数,上式右边取对数后作为判决函数使用不会改变类型区域的划分。

因此:)(ln ||ln 212ln 2)()(21)(1i i i i T i i w P d x x x g +∑-----=∑-πμμ其中,π2ln 2d 与类型无关,所有函数皆加上此项后,并不影响区域的划分,可以去掉。

下面对几种特殊情况进行讨论。

1.情况一:I i2σ=∑,c i ,,2,1 =该情况下,每类的协方差矩阵相等,而且类的各特征间相互独立(由上节的性质③得知),具有相等的方差2σ。

相关文档
最新文档