费希尔判别法理论

合集下载

判别分析(第4节_Fisher判别法)

本章主要内容
第一节第二节第三节第四节第五节
绪论距离判别法贝叶斯判别法 Fisher判别法判别效果检验问题
第三节贝叶斯（BAYES）判别法
■
多元正态总体的贝叶斯判别法
设 Gi ~ N p ( (i ) , i )(i 1,2,, k ) ，并假定错判损失相等，先验概率 q1 , q2 ,, qk ，有时先验概率确定起来不是很明 n qi i 确的，这时可用“样品频率”代替，即可令。 n
第三节贝叶斯（BAYES）判别法
其中 ( h ) , h 意义同前，已知后验概率为
P(Gh | x) qh f h ( x)
q f ( x)
i i i 1
k
由于上式中，分母部分为常数，所以有
P(Gh | x) max qh f h ( x) max
同时
1 1 qh f h ( x) qh (2 ) p / 2 | h |1/ 2 exp ( X ( h ) )h ( X (h) ) 2
* 故问题化简为 Z (Gh | x) max . h
ห้องสมุดไป่ตู้
注意：这里取对数可起到简化算式的作用，同时对数函数是严格单调的，所以取对数不改变原问题的性质。
第三节贝叶斯（BAYES）判别法
◆ 判别准则下面分两种不同的情形考虑。
●
假设协方差阵都相等（ 1 2 k ）
2 2
exp[ y(G x]
i| i 1
k
注意：这意味着 P(Gh | x) max y(Gh | x) max
第三节贝叶斯（BAYES）判别法
证明因为 y(Gh | x) ln[qh f h ] ( x) ，其中 ( x) 是ln[ qh f h ]

费歇尔判别法

费歇尔判别法费歇尔判别法（Fisher's Discriminant Analysis）是一种统计学中的方法，用于寻找两个或多个分类变量中最能有效区分它们的线性组合。

这种方法最初是由英国统计学家罗纳德·费歇尔（Ronald A. Fisher）在1936年所提出。

费歇尔判别法的目标是通过将数据投影到低维空间来确定样本类别之间最明显的分离平面。

这个方法假设所有数据员来自正态分布，这使得它的结果具有很高的概率。

此外，这种方法特别适用于小样本数据，在这种情况下，其它多变量方法往往受到数据不足或对角线矩阵估计的影响。

费歇尔判别法通过将多维数据投影到一维空间上，找到最能表示数据差异的线性变量。

具体步骤如下：1. 定义问题在进行费歇尔判别分析之前，首先需要定义问题。

这个问题可以是不同的变量之间的分类问题，或者是同一变量在不同条件下的分类问题。

例如，可以通过费歇尔判别分析找到两个组的区别，这两个组的特征可以用来预测其他类似两个组。

2. 构造分类变量在对数据进行投影之前，需要将分类变量定义为正态分布。

这种变量通常为两个或更多个。

3. 计算均值和方差计算每个分类变量的均值和方差，以用于后面的投影计算。

4. 计算类内离散度矩阵类内离散度矩阵是指每个类别内所有点与该类别均值之间的距离的累加和。

这个矩阵用来衡量类的内部分散程度，通常使用矩阵的矩阵乘法来进行计算。

5. 计算类间离散度矩阵类间离散度矩阵是指不同类别均值之间的距离的累加和。

这个矩阵用来衡量类别之间的分散程度，也通常使用矩阵的矩阵乘法来进行计算。

6. 计算特征值和特征向量计算类内离散度矩阵和类间离散度矩阵的特征值和特— 1 —征向量。

这些值可以使用线性代数中的方法计算。

一般来说，特征向量是正交（perpendicular）的。

7. 选取最大特征值从计算出的特征值中找到最大特征值，找到最大特征值所对应的特征向量。

这个特征向量就是数据的主要方向，也被称为“判别变量”。

费希尔判别法的基本思想

费希尔判别法的基本思想
费希尔判别法，又称Fisher LDA(Linear Discriminant Analysis）或Fisher 正则化，是一种多变量分类分析技术，是20世纪30年代由英国统计学家菲舍尔第一次提出的。

该技术具有某种正则属性，可实现二分类或多分类分析，并有助于综合对各个分类因素的重要性程度快速排序。

费希尔判别法最重要的特性在于它专注于各个分类变量之间的相关性，可生成一组权重因子，分析出最有价值的分类变量，并可以用权重因子对每个样本进行评分，使系统能够可靠地把新输入的样本归入不同分类范畴。

在高等教育中也可以使用费希尔判别法。

例如，学校可以使用费希尔判别法仔细评估潜在学生的申请材料，从而能够准确地确定学生的入学标准。

它还可以用于确定高考考生的排名，从而根据得分和预测可能的能力来确定学生的合格程度。

它还可以帮助学校确定最具有吸引力的课程，这些课程可能对学生有更多的吸引力，也可能带来更多的利益。

此外，费希尔判别法还可以帮助高校管理者评估校园安全情况，并减少校园内犯罪行为的发生，提升学生的学习环境。

费希尔判别法还可以用来及时识别学生表现出来的异常问题，从而及早发现学生在生活上表现出来的社会问题，从而及早给学生提供危机意识教育。

事实上，费希尔判别法是目前高等教育中被广泛应用的一种数据挖掘技术，可以帮助高校管理者更加精确地识别出进入学校的入学生，根据学生的资历做出正确的判断，确定最适合学生发展的课程，帮助学校管理者评估校园安全情况，并为高校提高学生的学习效率和学习质量做出贡献。

fisher判别的基本步骤

Fisher判别是一种基于线性判别分析的分类方法，用于将样本分为不同的类别。

其基本步骤如下：
1. 确定判别变量：首先需要确定用于判别的变量，即用于分类的特征。

2. 计算判别函数：根据样本数据，计算出判别函数，即用于将样本分为不同类别的函数。

3. 确定判别类别：根据判别函数，将样本分为不同的类别。

4. 计算判别准确率：计算分类准确率，即正确分类的样本数与总样本数之比。

5. 优化判别函数：根据判别准确率，调整判别函数，以提高分类准确率。

6. 重复步骤3~5：重复以上步骤，直到达到所需的分类准确率。

在Fisher判别中，判别函数是基于Fisher线性判别的，即对于每个类别，计算出一个线性函数，使得属于该类别的样本与属于其他类别的样本的距离最大化。

这个过程可以通过矩阵运算和求导来实现。

总之，Fisher判别是一种基于线性判别分析的分类方法，其基本步骤包括确定判别变量、计算判别函数、确定判别类别、计算判别准确率、优化判别函数和重复步骤3~5，直到达到所需的分类准确率。

简述fisher判别的基本思想

简述fisher判别的基本思想一、关于fisher判别在零和博弈的环境下，当各自利益都为零时，会做出什么选择？其中，局中人A是指在与B的交易中获得好处的人，而B则指因此而损失的人。

不管从哪一个角度考虑，局中人A都不会自己吃亏，他一定会想办法将自己的损失补偿给对方。

因此，从A到B的行动是单方面的。

为了对这种行动作出客观评价，我们假定： 1、局中人A 获得正收益； 2、局中人B获得负收益。

在这样的背景下，博弈方应该如何评价局中人A的行为？这就需要引入一个分析工具——fisher判别法。

fisher判别方法要求：每个局中人都会选择和自己利益最大化相等的行动，而不管别人如何。

因此，一个局中人的行动仅仅取决于它对另一个局中人所得利益的期望。

因为B的利益和A的利益总是相等的，即B的收益为-0，因此B的行动对A而言无关紧要。

如果局中人A的行动对B来说有很大影响，那么即使B不采取任何行动，也能够保证A自己的利益最大化，那么它也会采取一些行动。

fisher分析是解决寡头垄断的重要手段。

上世纪70年代以前，荷兰的壳牌公司(荷兰皇家石油公司)是唯一一家占有全国市场的企业。

通过在全国建立广泛的销售网络，荷兰皇家石油公司控制了几乎全部的石油产品市场。

为了反击荷兰皇家石油公司对竞争者的排挤，其他公司纷纷效仿荷兰皇家石油公司，设立全国性销售网络，实现地区范围内的联合销售，并在若干个城市设立销售公司。

这样，一个庞大的跨地区石油销售网络就形成了，而原先各企业各自为战的情况也逐渐改变，甚至消失。

荷兰皇家石油公司从独霸市场到“共存共荣”，完全是由于fisher分析技术的发展。

可见， fisher分析方法的实质是：在一个竞争性环境中，博弈各方最优决策问题可表述为：对于各博弈方而言，如何做出各自最优的个人决策？fisher分析主要适用于零和博弈情形。

如果存在多个纳什均衡点，但这些均衡点没有明显的共同点，而是由局中人的个人偏好、资源约束和实际可能达成的结果共同决定的。

4-3_Fisher判别

整性。
在解决实际问题时，当总体参数未知，需要通过样本来估计，
我们仅对 k2 的情形加以说明。设样本分别为
X(1) 1
,
X(1) 2
,
X(1) n1
和
X(2) 1
,
X(2) 2
,
X(2) n2
，则
X n1X(1) n2X(2) n1 n2
X(1) X n2 (X(1) X(2) ) n1 n2
方法回顾
距离判别法优点：简单，便于使用。不足之处：
第一，判别方法与总体各自出现的概率的大小无关；第二，判别方法与错判之后所造成的损失无关。 Bayes判别法优点：错判率较小。不足之处：需要获取总体的分布及参数值，实现困难。实际问题中有时也没必要知道其分布。
第四节费歇（Fisher）判别法
E(uX) E(uX | Gi ) uE(X | Gi ) uμi i ， i 1,2
D(uX) D(uX | Gi ) uD(X | Gi )u uΣiu

2 i
，
i 1,2
在求线性判别函数时，尽量使得总体之间差异大，也就是要求
uμ1 uμ2 尽可能的大，即 1 2 变大；同时要求每一个总体内
的离差平方和最小，即

2 1

2 2
，则我们可以建立一个目标函数
(u) (1 2 )

2 1

2 2
（4.20）
这样，我们就将问题转化为，寻找 u 使得目标函数 (u) 达到
最大。从而可以构造出所要求的线性判别函数。
2、针对多个总体的情形
假设有 k 个总体 G1, G2 ,, Gk ，其均值和协方差矩阵分别为 μ i

判别分析(2)费希尔判别

两总体的Fisher判别法判别法两总体的
其中，其中，S 即
jl
= ∑ ( x Aij − x Aj )( x Ail − x Al ) + ∑ ( x Bij − x Bj )( x Bil − x Bl )
i =1 i =1
na
nb
F = ∑ ∑ c j c l s jl
j =1 l =1
Fisher判别判别
内容：
1、建立判别准则； 2、建立判别函数 3、回代样本； 4、估计回代的错误率； 5、判别新的样本。
Fisher判别判别
y 是线性函数，由于 ( X ) 是线性函数，一般可将 y( X )表示为
（4.2））对于线性函数 y( X ) ，它的几何表示就是空间中的一条直线或平面，或超平面，的一条直线或平面，或超平面，如果我们把两 B 看成空间的两个点集，总体 A、看成空间的两个点集，该平面所起的 B 分开，作用就是尽可能将空间两个点集 A 、分开，如所示。图4.1所示。所示
Fisher判别判别
Fisher判别判别
Fisher判别判别
费希尔判别的基本思想是投影（或降维）
Fisher方法是要找到一个(或一组)投影轴w使得样本投影到该空间后能在保证方差最小的情况下，将不同类的样本很好的分开。并将度量类别均值之间差别的量称为类间方差 (或类间散布矩阵);而度量这些均值周围方差的量称为类内方差(或类内散布矩阵)。Fisher判决的目标就是: 寻找一个或一组投影轴，能够在最小化类内散布的同时最大化类间布。
两总体的Fisher判别法判别法两总体的
两总体的Fisher判别法判别法两总体的
max I = max ( ya − yb )

fisher判别函数

Fisher判别函数，也称为线性判别函数（Linear Discriminant Function），是一种经典的模式识别方法。

它通过将样本投影到一维或低维空间，将不同类别的样本尽可能地区分开来。

一、算法原理：Fisher判别函数基于以下两个假设：1.假设每个类别的样本都服从高斯分布；2.假设不同类别的样本具有相同的协方差矩阵。

Fisher判别函数的目标是找到一个投影方向，使得同一类别的样本在该方向上的投影尽可能紧密，而不同类别的样本在该方向上的投影尽可能分开。

算法步骤如下：(1)计算类内散度矩阵（Within-class Scatter Matrix）Sw，表示每个类别内样本之间的差异。

Sw = Σi=1 to N (Xi - Mi)(Xi - Mi)ᵀ，其中Xi 表示属于类别i 的样本集合，Mi 表示类别i 的样本均值。

(2)计算类间散度矩阵（Between-class Scatter Matrix）Sb，表示不同类别之间样本之间的差异。

Sb = Σi=1 to C Ni(Mi - M)(Mi - M)ᵀ，其中 C 表示类别总数，Ni 表示类别i 中的样本数量，M 表示所有样本的均值。

(3)计算总散度矩阵（Total Scatter Matrix）St，表示所有样本之间的差异。

St =Σi=1 to N (Xi - M)(Xi - M)ᵀ(4)计算投影方向向量w，使得投影后的样本能够最大程度地分开不同类别。

w= arg max(w) (wᵀSb w) / (wᵀSw w)，其中w 表示投影方向向量。

(5)根据选择的投影方向向量w，对样本进行投影。

y = wᵀx，其中y 表示投影后的样本，x 表示原始样本。

(6)通过设置一个阈值或使用其他分类算法（如感知机、支持向量机等），将投影后的样本进行分类。

二、优点和局限性：Fisher判别函数具有以下优点：•考虑了类别内和类别间的差异，能够在低维空间中有效地区分不同类别的样本。

Fisher判别分析原理详解

Fisher判别分析原理详解说起Fisher判别分析，不得不提到一个大神级人物！Ronald Aylmer Fisher (1890～1962)英国统计学家和遗传学家主要著作有：《根据孟德尔遗传方式的亲属间的相关》、《研究者用的统计方法》、《自然选择的遗传理论》、《试验设计》、《近交的理论》及《统计方法和科学推理》等。

他一生在统计生物学中的功绩是十分突出的。

•生平1890年2月17日生于伦敦，1962年7月29日卒于澳大利亚阿德莱德。

1912年毕业于剑桥大学数学系，后随英国数理统计学家J.琼斯进修了一年统计力学。

他担任过中学数学教师，1918年任罗坦斯泰德农业试验站统计试验室主任。

1933年，因为在生物统计和遗传学研究方面成绩卓著而被聘为伦敦大学优生学教授。

1943年任剑桥大学遗传学教授。

1957年退休。

1959年去澳大利亚，在联邦科学和工业研究组织的数学统计部作研究工作。

大神解决的问题•Fisher 线性判别函数的提出：在用统计方法进行模式识别时，许多问题涉及到维数，在低维空间可行的方法，在高维空间变得不可行。

因此，降低维数就成为解决实际问题的关键。

Fisher 的方法，就是解决维数压缩问题。

对xn的分量做线性组合可得标量yn=wTxn,n=1,2,…,Ni得到N个一维样本yn组成的集合。

从而将多维转换到了一维。

考虑把d维空间中的数据点投影到一条直线上去的问题，需要解决的两个问题：(1)怎样找到最好的投影直线方向；(2)怎样向这个方向实现投影，这个投影变换就是要寻求的解向量w*。

这两个问题就是Fisher方法要解决的基本问题。

•判别分析的一些基本公式Fisher判别分析用于两类或两类以上间的判别，但常用于两类间判别。

Fisher判别函数表达式（多元线性函数式）：判别函数的系数是按照组内差异最小和组间差异最大同时兼顾的原则来确定判别函数的。

Fisher判别准则：判别临界点：Fisher判别分析思想：1. 类间差异大，类内变异小，最大2. 方差分析的思想：以下值最大•Fisher判别的原理分析w1方向之所以比w2方向优越，可以归纳出这样一个准则，即向量w的方向选择应能使两类样本投影的均值之差尽可能大些，而使类内样本的离散程度尽可能小。

Fisher判别法距离判别法Bayes判别法逐步判别法

设有总体
又D1，D2，┅，Dk是R(p)的一个分划，判别法则为：当样品X落入Di时，则判
i 1,2,3,, k X Di 关键的问题是寻找D1，D2，┅，Dk分划，这个分划应该使平均错判率最小。
【定义】（平均错判损失函数）
用P(j/i)表示将来自总体Gi的样品错判到总体Gj的条件概率。 p( j / i) P( X D j / Gi ) fi ( x)dx i j
P好人 P做好事 / 好人 P好人 P (做好事 / 好人) P (坏人) P (做好事 / 坏人)
P (好人 / 做好事）
0.5 0.9 0.82 0.5 0.9 0.5 0.2
P坏人P做好事 / 坏人 P好人P (做好事 / 好人) P (坏人) P (做好事 / 坏人)
办公室新来了一个雇员小王，小王是好人还是坏人大家都在猜测。按人们主观意识，一个人是好人或坏人的概率均为 0.5。坏人总是要做坏事，好人总是做好事，偶尔也会做一件坏事，一般好人做好事的概率为0.9，坏人做好事的概率为0.2，一天，小王做了一件好事，小王是好人的概率有多大，你现在把小王判为何种人。。
目录上页下页返回结束
7
§4.2
距离判别
2018/10/4
目录上页下页返回结束
8
§4.2
距离判别
2018/10/4
目录上页下页返回结束
9
§4.2
距离判别
2018/10/4
目录上页下页返回结束
10
4.2.2 多总体情况
§4.2
距离判别
1. 协差阵相同。
2018/10/4
目录上页下页返回结束

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

费希尔判别费希尔判别（或称典型判别）的基本思想是投影（或降维）：用p维向量x （X i,X2, X p）的少数几个线性组合（称为费希尔判别函数或典型变量）y i a i x, y2 a?x, y x （—般r明显小于p ）来代替原始的p个变量X i,X2, X p，以达到降维的目的，并根据这r个判别函数y i,y2, *对样品的归属做出判别或将各组分离。

成功的降维将使样品的归类或组的分离更为方便和有效，并且可以对前三个判别函数作图，从直观的几何图像上区别各组。

在降维的过程中难免会有部分有用信息的损失，但只要使用的方法得当，我们可以最大限度地减少这种损失，从而保留尽可能多的有用信息，即关于能够反点画于直角坐标系上，一组的样品点用“肿表示，另一组的样品点用“c”表示。

假定我们希望将二维空间的点投影到某个一维空间，即一条直线上，然后再对两组进行判别，则投影到不同的直线上，判别的效果一般是不同的。

从图中可见,如果两组的点都投影到直线 z 上则这两组的投影点在该直线上的分布几乎无任何差异，他们完全混合在一起，我们无法将这两组的点区别开来，这样的降维把反应两组间差异的信息都给损失了，显然是不可取的。

事实上，最好的投影是投影到直线y 上，因为它把两组的投影点很清楚地区分了开来，这种降维把有关两组差异的信息很好地保留了下来，几乎没有任何损失，如此就完全可以在一维的直线上作判别分析。

我们现考虑在R p中将k 组的p 维数据向量投影到某个具有最佳方向的 a 上, 即投影到a 上的点能最大限度地显现出各组之间的差异。

设来自组i 的p 维观测值为X j ，j=1,2, ,n i ，i=l,2, ,k ，将它们共同投影到某一 p 维常数向量a 上，得到的投影点可分别对应线性组合y j =a x 0，j=1,2, ,n i ，i=1,2, ,k 。

这样，所有的p 维观测值就简化为一维观测值。

下面我们用％表示组i 中y j 的均值，y 表示所有组k 组的y 0的总均值，即对于任一用来投影的a ，我们需要给出一个能反映组之间分离程度的度量比较图中的上、下半图，上半图三组均值之间的差异程度与下半图是相同的，而前者组之间的分离程度却明显高于后者，原因就在于前者的组内变差要远小于后者，后者组之间有较多重叠。

因此，可以考虑将组之间的分离程度度量为相对其组内变差的组间变差。

在以下的讨论中，我们需假定各组的协方差矩阵相同，n i j iy ja X i式中nX i1 nixij， n j 1a X i1 k- n i X i o n i 1n in可用来度量y j 的组之间分离程度的一个量是(a)达到最大。

由于对任意非零常数c ，用ca 代替上式中的a ， (a)将保持不变，故考虑对a 加以约束。

我们希望判别函数y ax 具1S p — E 替代，所以a 的约束条件实际应为a S p a 1，即判别函数的联合样本 n k方差为1。

y j 的组间平方和SSTRk ___式中 H n i (X i x)(x ii 1SSEk式中E(n i i 11)SmWy)2k__口 (a X i a x)2aHax)为组间平方和及叉积和矩阵。

y j 的组内平方和n __kn i (y ij y i )2j 1山__(a x ij a X i )2 a Eaj 1ni ____(X ij X i )(X ij X i ) i 1 j 1为组内平方和及叉积和矩阵。

(a)SSTR a Ha SSE a Ea我们应选择这样的a ，使得有单位方差，即V(ax) a a 1，但因未知，于是用其联合无偏估计图三组之间的分离程度设E 1H的全部非零特征值依次为i 2 s 0，这里s ran k（H），且有s min（k 1, p）（ 5.4.2 ）（通常情况下上式等号成立），相应的特征向量依次记为 t1,t2, ,t s （标准化为 t j S p t j 1 , i 1,2, ,s ）。

由（1.8.5）式知，当 a i t i 时（aj 达到最大值i。

所以，选择投影到t i上能使各组的投影点最大限度地分离，称y i=t i x为费希尔第一线性判别函数，简称第一判别函数。

在许多情况下（如组数 k 是大的，或者原始的数据向量维数 p 是大的），仅仅使用第一判别函数也许不够，因为仅在这一个投影方向上组之间的差异可能还不够清晰，各组未能很好地分开。

这时，我们应考虑建立第二线性组合y2=a2 x，为使降维最具效率，应要求y2 （在线性关系的意义上）不重复 y i 中的信息，即Co（v y i,y2）=Co（v t i x,a2 x）=t i a2 0用S p代替未知的，于是我们在约束条件t i S p a20（或 t| Ea20）下寻找a2，使得（a?）达到最大。

按（1.8.6）式，当a? t?时（a?）达到最大值2，称y2=t 2 x为第二判别函数。

如还不够，可再建立第三判别函数 y3，依次类推。

一般地，我们要求第i个线性组合y i=a i x不重复前i 1个判别函数中的信息，即Co（v y j ,y i）=Co（v t j x,a i x）=t j a i 0， j= i,2, ,i i用S p代替，上式变为t j Spq 0（或 -Eq 0），j=1,2, ,i 1我们希望在约束条件（）下寻找a i，使得（a）达到最大。

由（1.8.6）式知，当 a i t i时（a）达到最大值i，称y i=t i x为第i判别函数，i=2,3, ,s。

附：1.85-1.86设A 是p 阶对称矩阵，B 是p 阶正定矩阵，i 2p是B 1A 的p 个特征值，相应的一组特征向量t it , ,t p ，满足t i Bt j =0 , 1 i j p ，则(i)x Ax max — x 0 x Bx(ii)max xAx= i(当x=t i 时达到)，i=2,3, , pxBtk 0 、=1, ,i 1 x 0综上所述，费希尔判别函数具有这样一些特点：（1）各判别函数都具有单位（联合样本）方差；（2）各判别函数彼此之间不相关（确切地说，是彼此之间的联合样本协方差为零）；（3）判别函数方向t 1,t 2, ,t s 并不正交，但作图时仍将它们画成直角坐标系，虽有些变形，但通常并不严重。

依（5.4.2 ）式可知，组数k=2时只有一个判别函数，k=3时最多只有两个判别函数。

这从直观上也不难理解，（不重合的）两个组重心（即组均值点）可在（一维）直线上有最大分离，（不在一直线上的）三个组重心也可在（二维）平面上有最大分开。

一般地，由全部 s 维空间可最大限度地分离k 个组重心。

（t i ） i 表明了第i 判别函数y i 对分离各组的贡献大小，y i 在所有s 个判别函数中的贡献率为s i /i jj=1而前r （ s ）个判别函数y 1,y 2, ,y r 的累计贡献率为（当x=t 1时达到） .x Ax min x 0 x Bx（当x=t p 时达到）si=1它表明了％肆2, ,y 「能代表wz, ,y 进行判别的能力。

在实际应用中，通常我们并不使用所有s 个判别函数，除非s 很小，因为费希尔判别法的基本思想就是要降维。

如果前 r 个判别函数的累计贡献率已达到了一个较高的比例（如 75%~95% ），则就采用这r 个判别函数进行判别。

在确定了需使用的r 个判别函数Y I ，Y 2, ,y r 之后，可制定相应的判别规则。

由于各判别函数都具有单位方差且彼此不相关，故此时的马氏距离等同于欧式距那一组，即判别规则为如果只使用一个判别函数进行判别（即r=1），则（5.4.6 ）式可简化为x l ，若 y Y I = mW y 耳（5.4.7）1 i k式中 y 和 y i （i=1,2, ,k ）分别是（5.4.6）式中的％和 % （i= 1,2, , k ）。

有时我们也使用中心化的费希尔判别函数，即y i =t i （x x ），i=1,2, ,s1 k ni式中x=2X ij 为k 个组的总均值，仍使用（5.4.6）式进行判别。

n i= 1 j=1r i=1 离。

我们米用距离判别法，依据（y i ,y 2.,y r ）值，判别新样品归属离它最近的xl ，若r(y j j=1Y u )2r 吧j1(yj汀(546 )1 ni其中 y ij =t j x ， x=X j n i j=1，y ij 为第判别函数在组i 的样本均值y i =（y i , y i2, ,%）的平方欧式距离, i=1,2, ,k 。

（5.4.6）式也可表达为X l ，若[t j (x X l )]j=1mi n k[t j (x x)]2j 1例5.4.1 （有用结论）组数k=2时的费希尔判别E 1H= 1(x i x 2)(x i x 2) m n 2有唯一的非零特征值此，费希尔判别函数为y=(又 X 2) S p 1x由于x=n 1x 1 n i门2乂 2 n 2故组间矩阵 x-i x= n2 (X |n j n 2X 2) , X 2x= ni (X 2 X) n j n 2H n 1(x 1 X)(£ x) n 2(x 2 x)(x 2 x)niPn 1 n 2 (x-x 2 )(x - %)假设组内矩阵E 是可逆的（必须有n i n 2 2 p ）,则有1.6一中的性质（2）知门小2n n(% 1 -X 2) E (人 X 2)这是一个正数（因为E>0 ）。

令a 为相应的特征向量，它应满足(H E)a 0即于是Ha= Ea门小2n 1门 2(X 1 X 2)(X 1 X 2)a 二 (X 1 1 x 2) E (x 1 x 2)Ea 易见，a=S p 1(x 1X 2）满足上述方程, 这里S p =n 1 n 2尹为联合协方差矩阵按（547 ）式，判别规则为其中 y i =(X i X 2) S p 1X i , V 2=(X iV 2= (X i X 2) S p 1(X i X 2)0 ,y i >y 2。

因此，上述判别规则等价于也可以表达为11 1,右(X X 2)S p 1[X 2(X i卄 __11 _2，右(E X 2)S p [X(X 1 2此正为（5.2.6）式。

上例表明，对于两组的判别，费希尔判别等价于协方差矩阵相等的距离判别, 对两个正态组也等价于协方差相等且先验概率和误判代价也均相同的贝叶斯判别。

当使用的判别函数个数r=2时，可将各样品的两个判别函数得分画成平面直角坐标系上的散点图，用目测法对新样品的归属进行判别或对来自各组样品的分离情况及结构进行观测评估。

当r=3时，可利用SAS 的交互式数据分析菜单系统，让样本中来自不同组的样品点呈现不同颜色（或不同形状）以区分各组，然后作（三维）旋转图从多角度来辨别新样品的归属或观测评估各组之间的分离效果，但其目测效果一般明显不如r=2时清楚。