Bayes判别

合集下载

判别分析贝叶斯判别

判别分析贝叶斯判别

ql
fl
(x0
)
max
1ik
qi
fi
(x0 ),
则x0判给 Gl。
若fi
(x)
(2
1 i
)1
2
exp[
1 2
(
x
(i)
)i
1 ( x
(i)
)]
则,
qi
fi
(
x)
qi
(2
1 i
)1
2
exp[
1 2
(
x
(i)
)i 1 ( x
(i)
)]
上式两边取对数 ln(qi fi (x))
ln
qi
1 ln 2
2
1 ln 2
判别分析是多元统计中用于判别样品所属类型 的一种统计分析方法。是一种在一些已知研究对象 用某种方法已经分成若干类的情况下,确定新的样 品的观测数据属于那一类的统计分析方法。
判别准则: 用于衡量新样品与各已知组别接近程度的思路原则。
判别函数: 基于一定的判别准则计算出的用于衡量新样品与各 已知组别接近程度的描述指标。
1 (x μ(i) )Σ1(x μ(i) ) 2
1 [2 ln 2
qi
(x
μ(i)
)Σ 1 (x
μ(i) )]
令 Fi (x) 2ln qi (x μ(i) )Σ1(x μ(i))
2 ln qi x' Σ1x μ(i)' Σ1x x' Σ1μ(i) μ(i)' Σ1μ(i)
令 Pi (x) 2ln qi 2μ(i)Σ1x μ Σ μ (i) 1 (i)
q2C(1/ 2) f2 (x) q1C(2 /1) f1(x) 0

ch2_2.3.2正态分布下的Bayes判据的判别函数和决策面(线性、二次分类器)解读

ch2_2.3.2正态分布下的Bayes判据的判别函数和决策面(线性、二次分类器)解读

T
2
1
x 2 ln
1 2
1 0 x1 x2 0 4 x x1 x2 2 2
2019/2/25
四川大学、电气信息学院、余勤
2
• 二次或线性分类器的引出:
在一定的分布和条件下(如正态、等协方差 矩阵),贝叶斯决策可以导致二次或线性分 类器。
虽然贝叶斯决策(似然比检验)在错误率或 风险上是最优的,但必须知道类条件密度。 (在大多数应用场合,类条件密度函数是从有限的样本中估


• 上式是二次分类器。计算x到各类均值 i 的
1 Mahalanobis距离,然后和阈值 T ln 2 ln 2 (x ) (x )
T i 1 i i
相比较,决定 x 属于第一类或第二类。
2019/2/25
四川大学、电气信息学院、余勤
T 1 1 T

1

1
P (1 )
2
c 1 1 2 2
2019/2/25
1 2 ln 2
四川大学、电气信息学院、余勤
8
• 决策边界 h( x ) T 是二次曲面(超曲面): 超椭球面、超双曲面、超抛物面、超平面等, 或它们组合的形式。
• (为了确定二次曲面的形状,首先要消掉x的各分
2.3.2 正态分布下的Bayes判据的 判别函数和决策面
(二次和线性分类器)
2019/2/25
四川大学、电气信息学院、余勤
1
• 前面讲的提供了设计各种特定形式分类器的 基础。 • 这一小节讲述二次和线性分类器。所以叫作 二次或线性分类器是因为分类(决策)面方 程的数学形式是二次或线性的。 • 这样的分类器又叫参数分类器,因为它们由 一些参数所规定(如分布的均值和方差)。

bayes判别法

bayes判别法

bayes判别法Bayes判别法Bayes判别法是一种基于贝叶斯定理的分类方法,它通过计算样本在各个类别下的后验概率来进行分类。

Bayes判别法在模式识别、机器学习和统计学等领域中得到了广泛应用。

一、贝叶斯定理贝叶斯定理是概率论中的一个重要定理,它描述了在已知某些条件下,某个事件发生的概率。

假设A和B是两个事件,P(A)和P(B)分别表示它们各自发生的概率,则有:P(A|B)=P(B|A)×P(A)/P(B)其中,P(A|B)表示在事件B发生的条件下事件A发生的概率,称为后验概率;P(B|A)表示在事件A发生的条件下事件B发生的概率,称为似然函数;P(A)和P(B)分别表示事件A和事件B独立发生的概率。

二、Bayes判别法原理Bayes判别法是一种基于贝叶斯定理的分类方法。

假设有n个样本,每个样本可以被分为k类。

对于一个新样本x,我们需要将其归入其中一类。

Bayes判别法采用后验概率最大化准则进行分类,即将x归为后验概率最大的那一类。

具体地,对于一个新样本x,我们需要计算其在每个类别下的后验概率P(ci|x),然后将x归为后验概率最大的那一类。

其中,ci表示第i类。

根据贝叶斯定理,我们可以将P(ci|x)表示为:P(ci|x)=P(x|ci)×P(ci)/P(x)其中,P(x|ci)表示在第i类下样本x出现的概率,称为类条件概率;P(ci)表示第i类出现的概率,称为先验概率;P(x)表示样本x出现的概率。

由于对于一个新样本来说,其出现的概率是相同的,因此可以忽略分母部分。

因此,我们只需要比较每个类别下的P(x|ci)×P(ci),并选择最大值所对应的类别作为分类结果。

三、Bayes判别法实现Bayes判别法可以通过训练样本来估计先验概率和类条件概率。

具体地,在训练阶段中,我们需要统计每个类别下每个特征取值出现的次数,并计算相应的先验概率和类条件概率。

具体地:1. 先验概率先验概率指在没有任何信息或者证据的情况下,每个类别出现的概率。

bayes判别分析案例及结果

bayes判别分析案例及结果

例:研究某年全国各地区农民家庭收支的分布规律,根据抽样调查资料进行分类,共抽取28个省、市、自治区的六个指标数据。

先采用聚类分析,将28个省、市、自治区分为三组。

北京、上海、广州3个城市属于待判样本。

(家庭收支.sav)1.选中判别分析,2.选择Fisher 即bayes判别分析方法,易混!!!3.确定组别4. 选择保存结果5. 模型检验(即判别准确率)重要结果分类函数系数类别1 2 3食品.480 .473 .429 衣着 1.612 1.354 .933 燃料 2.421 2.189 .777 住房.555 .335 .052 用品及其它 1.032 .580 .847 文化支出 5.387 5.446 4.317(常量) -117.620 -89.052 -53.616Fisher 的线性判别式函数按照案例顺序的统计量案例数目实际组最高组第二最高组判别式得分预测组P(D>d |G=g)P(G=g| D=d)到质心的平方Mahalanobis距离组P(G=g| D=d)到质心的平方Mahalanobis距离函数1函数2 p df初始 1 1 1 .320 2 1.000 2.282 2 .000 22.754 3.163 -2.7172 1 1 .799 2 1.000 .449 2 .000 17.611 3.559 -1.6593 1 2**.095 2 .688 4.705 1 .312 6.283 2.737 1.2754 1 1 .797 2 .984 .453 2 .016 8.670 2.855 -.5695 1 1 .504 2 1.000 1.372 2 .000 20.770 4.205 -1.4616 1 1 .313 2 .996 2.321 2 .004 13.305 1.847 -2.1317 2 2 .788 2 .986 .476 1 .011 9.482 .566 .5958 2 2 .405 2 .992 1.806 1 .008 11.456 1.756 1.9139 2 2 .532 2 .987 1.263 1 .013 9.942 1.645 1.60710 2 2 .451 2 .999 1.593 1 .001 15.008 1.358 2.26911 2 2 .826 2 .984 .383 1 .015 8.758 .816 .71812 2 2 .769 2 .994 .524 1 .006 10.742 1.252 1.52313 2 2 .378 2 .861 1.945 3 .139 5.594 -.611 .53914 2 2 .219 2 .639 3.034 3 .361 4.179 -1.036 .60515 2 2 .304 2 .941 2.379 3 .059 7.903 -.943 1.59616 2 2 .935 2 .997 .134 1 .003 12.046 .874 1.48517 3 3 .387 2 .994 1.899 2 .006 12.039 -1.570 -1.44818 3 3 .801 2 1.000 .443 2 .000 19.449 -3.157 -1.07619 3 3 .413 2 .991 1.767 2 .009 11.104 -1.531 -1.30320 3 3 .570 2 .984 1.124 2 .016 9.398 -1.635 -.84721 3 3 .880 2 .997 .255 2 .003 11.791 -2.562 -.12822 3 3 .826 2 .993 .383 2 .007 10.155 -2.282 -.14023 3 3 .130 2 1.000 4.077 2 .000 29.305 -4.643 -.18324 3 3 .078 2 .995 5.095 2 .005 15.558 -3.369 1.52625 3 3 .323 2 1.000 2.260 2 .000 25.638 -3.294 -1.98926 未分组的1 .0002 1.000 20.223 2 .000 62.899 7.054 -3.27827 未分组的1 .0002 1.000 82.160 2 .000 150.236 11.796 -3.63028 未分组的1 .0052 1.000 10.431 2 .000 25.808 5.621 .759交叉验证a 1 1 1 .349 6 1.000 6.707 2 .000 27.3012 1 1 .025 6 .999 14.400 2 .001 29.4123 1 2**.087 6 1.000 11.051 1 .000 37.7404 1 1 .233 6 .900 8.064 2 .100 12.4595 1 1 .136 6 1.000 9.738 2 .000 28.7186 1 1 .182 6 .975 8.851 2 .025 16.1797 2 2 .249 6 .945 7.850 1 .043 14.0428 2 2 .734 6 .984 3.575 1 .016 11.8079 2 2 .039 6 .880 13.285 1 .120 17.26810 2 2 .078 6 .996 11.349 1 .004 22.46511 2 2 .701 6 .967 3.819 1 .031 10.68312 2 2 .461 6 .984 5.669 1 .016 13.90313 2 3**.129 6 .703 9.898 2 .297 11.62214 2 3**.444 6 .684 5.820 2 .316 7.36815 2 2 .123 6 .635 10.047 3 .365 11.15116 2 2 .000 6 .878 35.006 1 .121 38.97317 3 3 .114 6 .955 10.252 2 .044 16.40718 3 3 .925 6 1.000 1.939 2 .000 20.37119 3 3 .288 6 .959 7.373 2 .041 13.67820 3 3 .652 6 .963 4.186 2 .037 10.70721 3 3 .526 6 .991 5.139 2 .009 14.63422 3 3 .834 6 .986 2.792 2 .014 11.30223 3 3 .101 6 1.000 10.616 2 .000 39.41124 3 3 .018 6 .917 15.261 2 .083 20.05725 3 3 .268 6 1.000 7.611 2 .000 32.555对初始数据来说,平方Mahalanobis 距离基于典则函数。

ch2_2.3.2正态分布下的Bayes判据的判别函数和决策面(线性、二次分类器)

ch2_2.3.2正态分布下的Bayes判据的判别函数和决策面(线性、二次分类器)
计的。后面我们将讲一些密度函数估计的方法。但密度函数 的估计本身是一件复杂工作(其难度不低于分类)并且需要 大量样本。 )
2013-9-12
四川大学、电气信息学院、余勤
3
• 即使我们得到了密度函数,有时用似然比检 验的方法也很难计算,需要大量的时间和空 间。 • 因此我们有时考虑实际中更简便易行的分类 器设计方法。用二次、线性、分段线性分类 器。即先规定分类器的数学(函数)形式, 然后在适当的准则下,来确定这些函数中的 未知参数。 • 这一节先分析在什么条件下贝叶斯分类器变 成二次和线性分类器,第四章再讨论当这些 条件不满足时,如何设计“性能好”的参数 2013-9-12 4 分类器(LDA判别式分析法)。 四川大学、电气信息学院、余勤
w 其中: 1 2 (2 97) 满足(2-96)的x的轨迹是一个超平面
该超平面过 x0 正交于 1 和 2 的连线。当 P ( 1 ) P ( 2 )时, x0 在 连线的中点,当 P ( 1 ) P ( 2 ) 时,x0 在连线上靠近先验概率小的 2013-9-12 15 一边。 四川大学、电气信息学院、余勤
二. 判别函数和多类分类器
1. 多类的判别函数 • 当模式有 N c 2 类,这时的最小错误率的 决策规则可以表示为:
若 g x max g x i k
k
ωi (3)
式中 g x p(ω x ) ,k 1, , ,N 2 k k c
• g k x 称为判别函数(discriminant function)。它表示决策规则。
h x xT A x bT x c
2013-9-12
四川大学、电气信息学院、余勤
(2)
10

贝叶斯判别分析ppt课件

贝叶斯判别分析ppt课件
假定两总体G1,G2均服从4元正态分布,在误判损失相 等且先验概率按比例分配条件下,对待判样本进行bayes
判别.
19
表4-2 两类企业财务状况数据
G1(破产企业)
G2(非破产企业)
X1
X2
-0.45 -0.41
-0.56 -0.31
0.06 0.02
-0.07 -0.09
-0.10 -0.09
-0.14 -0.07
p20=1-chi2cdf(Q20, p*(p+1)/2) %卡方分布概率p20 p20 P{Q2 Q20}
输出结果:Q10=2.5784,Q20=0.7418均<7.8147=λ,
p10=0.4613,p20=0.8633,均>0.05,
认为两个总体协方差矩阵相等
15
(2)估计两个总体的先验概率 按样本容量比例选取.由于Apf与Af分别为
回代误判率: p pˆ N1 N2
n1 n2
交叉误判率:
p
pˆ *
N1*
N
* 2
mn
11
例4.3.1 6只Apf和9只Af蠓虫触角长度和翅膀长度数据: Apf:(1.14,1.78), (1.18,1.96), (1.20,1.86), (1.26,2.00), (1.28,2.00), (1.30,1.96) ; Af:(1.24,1.72), (1.36,1.74), (1.38,1.64),(1.38,1.82), (1.38,1.90),(1.40,1.70),(1.48,1.82),(1.54,1.82), (1.56,2.08).
0.40 0.38 0.11 3.27
0.26 0.19 0.05 2.25

实验报告Bayes判别

实验报告Bayes判别

实验十一Bayes判别实验目的和要求掌握Bayes判别分析的理论与方法、模型的建立与误差率估计;掌握利用判别分析的SAS过程解决有关实际问题.实验要求:编写程序,结果分析.实验内容:5.4 5.5 选一题data examp5_4。

input group $ x1-x7 @@。

cards。

G1 6.6 39 1.0 6.0 6 0.12 20G1 6.6 39 1.0 6.0 12 0.12 20G1 6.1 47 1.0 6.0 6 0.08 12G1 6.1 47 1.0 6.0 12 0.08 12G1 8.4 32 2.0 7.5 19 0.35 75G1 7.2 6 1.0 7.0 28 0.30 30G1 8.4 113 3.5 6.0 18 0.15 75G1 7.5 52 1.0 6.0 12 0.16 40G1 7.5 52 3.5 7.5 6 0.16 40G1 8.3 113 0.0 7.5 35 0.12 180G1 7.8 172 1.0 3.5 14 0.21 45G1 7.8 172 1.5 3.0 15 0.21 45G2 8.4 32 2.0 9.0 10 0.35 75 G2 8.4 32 2.5 4.0 10 0.35 75 G2 6.3 11 4.5 7.5 3 0.20 15 G2 7.0 8 4.5 4.5 9 0.25 30 G2 7.0 8 6.0 7.5 4 0.25 30 G2 7.0 8 1.5 6.0 1 0.25 30 G2 8.3 161 1.5 4.0 4 0.08 70 G2 8.3 161 0.5 2.5 1 0.08 70 G2 7.2 6 3.5 4.0 12 0.30 30 G2 7.2 6 1.0 3.0 3 0.30 30 G2 7.2 6 1.0 6.0 5 0.30 30 G2 5.5 6 2.5 3.0 7 0.18 18 G2 8.4 113 3.5 4.5 6 0.15 75 G2 8.4 113 3.5 4.5 8 0.15 75 G2 7.5 52 1.0 6.0 6 0.16 40 G2 7.5 52 1.0 7.5 8 0.16 40 G2 8.3 97 0.0 6.0 5 0.15 180 G2 8.3 97 2.5 6.0 5 0.15 180 G2 8.3 89 0.0 6.0 10 0.16 180 G2 8.3 56 1.5 6.0 13 0.25 180 G2 7.8 172 1.0 3.5 6 0.21 45run。

贝叶斯判别法的判别准则

贝叶斯判别法的判别准则

贝叶斯判别法的判别准则
贝叶斯判别法是一种统计学习方法,它利用贝叶斯公式计算后验概率,从而判断模式的分类。

具体而言,根据所给的数据和先验概率,利用
贝叶斯公式计算出各个类别的后验概率,从而根据最大后验概率原则
进行分类。

因为它考虑了类别之间的联合概率,因此通常具有较好的
分类精度。

贝叶斯判别法的基本思想可以表述为以下式子:
P(ωj|x) = P(x|ωj)P(ωj) / P(x)
其中,P(ωj|x) 为后验概率,即在给定观测值 x 的条件下事件ωj 发生
的概率;P(x|ωj) 为类别ωj 的条件概率密度函数;P(ωj) 为先验概率;P(x) 为边际概率密度函数。

根据这个公式可以得到贝叶斯判别法的判别准则:对于给定的观测值 x,将其划归到后验概率最大的类别中。

也就是说,找到使得P(ωj|x) 最大的类别 j,将 x 分类为该类别。

由于贝叶斯判别法需要计算类别的先验概率和条件概率密度函数,因
此它通常需要大量的样本数据进行训练,从而得到可靠的统计模型。

此外,由于实际应用中往往难以得到准确的先验概率和条件概率密度函数,因此常常需要进行模型简化或参数估计等操作,以提高模型的可信度和准确性。

总之,贝叶斯判别法是一种重要的统计学习方法,其分类准确性通常较高,但在实际应用中需要考虑多种因素的影响,并根据具体情况进行定制化和调整,以适应不同的应用场景和需求。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

贾博婷
应用多元统计分析
♠ 两个总体的Bayes判别问题 问题: 设有两个总体G1 和G2 , 各自出现的概率为q1 和
q2 , 概率密度函数为f1 (x)和f2 (x). 对于一个新样品X, 要
判断它来自哪个总体?
贾博婷
应用多元统计分析
♠ 两个总体的Bayes判别问题 问题: 设有两个总体G1 和G2 , 各自出现的概率为q1 和
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦
贾博婷
应用多元统计分析
(1) X(1)
⎡ ⎤ ⎡ ⎤ ⎢ ⎥ ⎢ ⎥ 1 − 1 ⎢ ⎥ ⎢ ⎥ ( 1 ) ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ =⎢ , · · · · · · , X = ⎢ ⎥ ⎢ ⎥ ⎣ ⎦ ⎣ ⎦ (5)
0 0
(2) X(1)
⎡ ⎤ ⎡ ⎢ ⎥ ⎢ 0 −1 ⎢ ⎥ ⎢ ( 2 ) ⎥ ⎢ ⎢ ⎥ ⎢ =⎢ , · · · · · · , X = ⎢ ⎥ ⎢ ⎣ ⎦ ⎣ (4) −1 −2
(2) (X(i )
−X ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦
(2)
(2) )(X(i )
⎡ ⎢ 2/3 ⎢ ⎢ −X ) =⎢ ⎢ ⎣
0
1 ^− Σ 2
1/4
0 ⎥ ⎥ ⎥
1 ^− Σ 1
⎡ ⎢ 1 ⎢ ⎢ =⎢ ⎢ ⎣
0
0 10/3
⎡ ⎤ ⎢ 3/2 0 ⎥ ⎢ ⎥ ⎢ ⎥ ⎥ =⎢ ⎢ ⎥ ⎣ ⎦
0 4
1
1
贾博婷应用多元统计分析Σ1Σ2比较 Yj (X) (j = 1, 2)
1 1 ⇔ 比较 ln qj − p ln(2π) − 2 ln |Σj | − 1 (X − µj )′ Σ− j (X − µj ) 2 2 1 ⇔ 比较 ln qj − ln |Σj | − (X − µj )′ Σ− j (X − µj ) 2 2 ⏟ ⏞ Rj (X)
2
两个总体的先验概率分别为q1 和q2 , 则
Yj (X) = qj fj (X)
= qj (2π)−p /2 |Σj |−1/2 e − 2 (x−µj ) Σj
1
{︁

−1
}︁ (x−µj )
, j = 1, 2
贾博婷
应用多元统计分析
Σ1
Σ2
贾博婷
应用多元统计分析
Σ1
Σ2
比较 Yj (X) (j = 1, 2)
q1 = 5/9, q2 = 4/9
贾博婷
应用多元统计分析
(1) X(1)
⎡ ⎤ ⎡ ⎤ ⎢ ⎥ ⎢ ⎥ 1 − 1 ⎢ ⎥ ⎢ ⎥ ( 1 ) ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ =⎢ , · · · · · · , X = ⎢ ⎥ ⎢ ⎥ ⎣ ⎦ ⎣ ⎦ (5)
0 0
(2) X(1)
⎡ ⎤ ⎡ ⎢ ⎥ ⎢ 0 −1 ⎢ ⎥ ⎢ ( 2 ) ⎥ ⎢ ⎢ ⎥ ⎢ =⎢ , · · · · · · , X = ⎢ ⎥ ⎢ ⎣ ⎦ ⎣ (4) −1 −2
贾博婷
应用多元统计分析
1 ′ −1 比较 Rj (X) = ln qj − 1 2 ln |Σj | − 2 (X − µj ) Σj (X − µj ), j = 1, 2
先验概率的赋值方法有 (1)利用历史资料及经验进行估计. (2)利用样本中各类样品占的比例作为估计值. (3)假定各类出现的概率都相等. 本例中, 利用方法(2)得到先验概率分别为
取事件A = {X已知}, 事件Bj = {X ∈ Gj }, 则后验概率为
P (j |X) = qj fj (X)
2 ∑︀ i =1
, j = 1, 2
qi fi (X)
令Yj (X) = qj fj (X) (j = 1, 2), 则 ⎧ ⎪ ⎪ 判 X ∈ G1 , 如果 Y1 (X) > Y2 (X) ⎪ ⎪ ⎪ ⎪ ⎨ ⇐⇒ ⎪ 判 X ∈ G2 , 如果 Y1 (X) < Y2 (X) ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ 待判, 如果 Y1 (X) = Y2 (X)
2
两个总体的先验概率分别为q1 和q2 , 则
贾博婷
应用多元统计分析
♠ 正态总体的Bayes判别函数 设G1 和G2 为正态总体, 其密度函数分别为 {︃ }︃ 1 −p / 2 −1/2 ′ −1 f1 (X) = (2π) |Σ1 | exp − (X − µ1 ) Σ1 (X − µ1 ) 2 {︃ }︃ 1 −p / 2 −1/2 ′ −1 f2 (X) = (2π) |Σ2 | exp − (X − µ2 ) Σ2 (X − µ2 )

⎤′ ⎡
⎢ 0 ⎥ 0 ⎥ ⎥ ⎢ ⎥ ⎥ ⎢ ⎥ ⎥ ⎢ ⎥ ⎥ ⎢ ⎥ = −1.79 10 ⎦ ⎣ 3 ⎦
3
⎤⎡
^ 1 | = 3/10 |Σ
^ 2 | = 1/6 |Σ
贾博婷
应用多元统计分析
Rj (X) = ln qj −
1 1 1 ln |Σj | − (X − µj )′ Σ− j (X − µj ), j = 1, 2 2 2
⎢ 0 ⎥ 1 5 1 3 1 ⎢ ⎢ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ R1 (X) = ln − × ln − ×⎢ ⎢ ⎢ ⎥ ⎣ ⎣ ⎦ 3 9 2 10 2 −5 0 ⎡ ⎤′ ⎡
2
贾博婷
应用多元统计分析
♠ 正态总体的Bayes判别函数 设G1 和G2 为正态总体, 其密度函数分别为 {︃ }︃ 1 −p / 2 −1/2 ′ −1 f1 (X) = (2π) |Σ1 | exp − (X − µ1 ) Σ1 (X − µ1 ) 2 {︃ }︃ 1 −p / 2 −1/2 ′ −1 f2 (X) = (2π) |Σ2 | exp − (X − µ2 ) Σ2 (X − µ2 )
判 别 分 析
贾博婷 吉林财经大学 统计学院
botingjia@
贾博婷
应用多元统计分析
♠ 在统计学中有两个大的学派: 经典学派(频率学派)和贝 叶斯学派. 利用经典学派进行统计推断时要使用到两种 信息: 总体信息和样本信息; 而贝叶斯学派认为, 除了上 述两种信息以外, 统计推断还应该使用第三种信息: 先 验信息.
贾博婷
应用多元统计分析
1 ′ −1 比较 Rj (X) = ln qj − 1 2 ln |Σj | − 2 (X − µj ) Σj (X − µj ), j = 1, 2
先验概率的赋值方法有 (1)利用历史资料及经验进行估计. (2)利用样本中各类样品占的比例作为估计值. (3)假定各类出现的概率都相等.
贾博婷
应用多元统计分析
Σ1
Σ2
比较 Yj (X) (j = 1, 2)
1 1 ⇔ 比较 ln qj − p ln(2π) − 2 ln |Σj | − 1 (X − µj )′ Σ− j (X − µj ) 2 2
贾博婷
应用多元统计分析
Σ1
Σ2
比较 Yj (X) (j = 1, 2)
1 1 ⇔ 比较 ln qj − p ln(2π) − 2 ln |Σj | − 1 (X − µj )′ Σ− j (X − µj ) 2 2 1 ⇔ 比较 ln qj − ln |Σj | − (X − µj )′ Σ− j (X − µj ) 2 2 ⏟ ⏞ Rj (X)
P (Bj |A ) = P (A |Bj )P (Bj )
n ∑︀ i =1
, j = 1, 2, · · · , n
P (A |Bi )P (Bi )
贾博婷
应用多元统计分析
♠ Bayes判别法的基本思想 将Bayes思想用于判别分析就得到Bayes判别法.
贾博婷
应用多元统计分析
♠ Bayes判别法的基本思想 将Bayes思想用于判别分析就得到Bayes判别法. 基本思想样品属于哪个总体的后验概率大, 就判断它属 于哪个总体.
贾博婷 应用多元统计分析

( )
P (Bj |A ) =
P (A |Bj )P (Bj )
2 ∑︀ i =1
, j = 1, 2
P (A |Bi )P (Bi )
贾博婷
应用多元统计分析
P (Bj |A ) =
P (A |Bj )P (Bj )
2 ∑︀ i =1
, j = 1, 2
P (A |Bi )P (Bi )
取事件A = {X已知}, 事件Bj = {X ∈ Gj }, 则后验概率为
P (j |X) = qj fj (X)
2 ∑︀ i =1
, j = 1, 2
qi fi (X)
贾博婷
应用多元统计分析
P (Bj |A ) =
P (A |Bj )P (Bj )
2 ∑︀ i =1
, j = 1, 2
P (A |Bi )P (Bi )
q2 , 概率密度函数为f1 (x)和f2 (x). 对于一个新样品X, 要
判断它来自哪个总体? 想法: 计算后验概率P (j |X) = P (X ∈ Gj |X已知), j = 1, 2, 并按照如下的判别准则判断. ⎧ ⎪ ⎪ 判 X ∈ G1 , 如果 P (1|X) > P (2|X) ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ 判 X ∈ G2 , 如果 P (1|X) < P (2|X) ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ 待判, 如果 P (1|X) = P (2|X)
1
1
⎧ ⎪ ⎪ 判 X ∈ G1 , 如果 R1 (X) > R2 (X) ⎪ ⎪ ⎪ ⎪ ⎨ 判 X ∈ G2 , 如果 R1 (X) < R2 (X) ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ 待判, 如果 R1 (X) = R2 (X)
贾博婷
应用多元统计分析
♣ 例: 已知9个样品分别来自两个2维正态总体, 观测数据 见下表. 利用Bayes判别法判断样品(0, 0)′ 属于哪一类. 类别 序号
相关文档
最新文档