第2章模式识别的基本理论(3)

合集下载

2022年电网人工智能选拔V2试卷和答案(3)

2022年电网人工智能选拔V2试卷和答案（3）共4种题型，共95题一、单选题(共40题)1.Tensorflow框架自带对网络结构等数据进行可视化的工具是A：VisdomB：FlaskC：VueD：以上选项均不正确【答案】：D2.下面哪一句话是正确的A：人工智能就是机器学习B：机器学习就是深度学习C：人工智能就是深度学习D：深度学习是一种机器学习的方法【答案】：D3.在pandas中以下哪个方法用于向csv文件中实现写入工作？A：to_csv()B：read_csv()C：to_excel()【答案】：A4.Notebook发布的模型类型为：（）A：PymodelB：BMLC：NotebookD：PalePale【答案】：A5.以下哪种神经网络技术可以用于语音识别的处理？A：卷积神经网络B：循环神经网络C：深层神经网络D：浅层神经网络【答案】：B6.下列选择中，哪个不是关键词提取常用的算法？A：TE-IDFB：LDAC：TextRankD：SSA【答案】：D7.以下哪个不是语音识别的范畴A：语音听写B：语音合成C：语音转写D：语音唤醒【答案】：B8.pandas的三个基本数据结构：Series、（）和IndexA：numpyB：listC：numberD：Dataframe【答案】：D9.下列哪个不是人工智能的研究领域（）。

A：机器证明B：模式识别C：人工生命D：编译原理【答案】：D10.对于分类任务,我们不是将神经网络中的随机权重初始化,而是将所有权重设为零。

下列哪项是正确的?()A：没有任何问题,神经网络模型将正常训练B：神经网络模型可以训练,但所有的神经元最终将识别同样的事情C：神经网络模型不会进行训练,因为没有净梯度变化D：这些均不会发生【答案】：B11.下列关于人工智能的叙述不正确的有（）A：人工智能技术它与其他科学技术相结合极大地提高了应用技术的智能化水平。

B：人工智能是科学技术发展的趋势。

大三心理学认知心理学的基本理论与研究方法

大三心理学认知心理学的基本理论与研究方法心理学是一门关于人类及其行为和心理状态的科学研究领域。

而认知心理学是心理学的一个重要分支，它主要关注人类思维、学习、记忆和知觉等认知过程。

在大三学习心理学的过程中，我们不仅需要了解认知心理学的基本理论，还需要掌握一些研究方法。

本文将介绍大三心理学认知心理学的基本理论并讨论相关的研究方法。

一、认知心理学的基本理论1. 认知心理学的起源与发展认知心理学起源于20世纪中叶，它的发展离不开信息处理模型的提出。

信息处理模型认为人类的思维过程类似于计算机信息处理的过程，人类大脑接收输入信息，加工处理后输出反应。

这一理论为认知心理学的研究奠定了基础。

2. 认知心理学的研究对象及范畴认知心理学研究的对象主要是人类思维过程中的各个组成部分及其相互关系，包括知觉、注意、记忆、语言、问题解决、决策等。

它旨在揭示人类认知的本质与机制。

3. 认知心理学的三个重要理论- 信息加工理论：认为人类思维是通过信息加工的过程来实现的，包括接收信息、加工信息和输出反应。

- 模式识别理论：认为人类在认知过程中，会通过将输入信息与存储在记忆中的模式进行比较，以识别和理解信息。

- 心理表征理论：认为人类在进行认知活动时，会使用内部的心理表征进行信息表示和处理，这些表征可以是符号、图像或概念等形式。

二、认知心理学的研究方法1. 实验研究方法实验研究是认知心理学中应用最广泛的研究方法之一。

通过控制实验条件和操作变量，研究者可以观察到认知过程的变化，并从中得出结论。

实验设计、参与者筛选、数据收集和分析都是实验研究中需要注意的关键步骤。

2. 调查问卷法调查问卷法是一种收集大量数据的研究方法，适用于研究人们的认知态度、信念和行为等。

研究者可以设计合适的问题并向大量被试发放问卷，然后通过对问卷数据的统计分析来得出结论。

3. 观察法观察法是一种直接观察和记录被试行为和认知过程的研究方法。

研究者可以通过实地观察或视频录制等方式来获取数据，并根据观察结果进行分析和解释。

第二章知觉案例

【实验】 Tulving等（1964）的字词识别实验
通过改变刺激的呈现时间来研究自下而上的加工，而通过改变上下文字词的数目来研究自上而下的加工。
上下文
Countries in the United Nations form a military alliance.
The political leader was challenged by a dangerous opponent.
二、两种对立的知觉理论
1.假设考验说 2.刺激物说
1.假设考验说
代表人物：Bruner、Gregory
主要内容：知觉是一种包含假设考验的构造过程
。人通过接受信息、形成和考验假设，再接受或搜寻信息，再考验假设，直至验证某个假设，从而对感觉剌激做出正确地解释。论据：Rock（1983）指出，外部刺激与知觉经验
觉信息是现实刺激的信息和记忆信息相互作用的结果。
三、知觉加工
1.自下而上加工和自上而下加工
2.整体加工和局部加工
1.自下而上加工和自上而下加工
自下而上（bottom-up）加工：是指由外部刺激开始的加工，通常是说先对较小的知觉单元进行分析，然后再转向较大的知觉单元，经过一系列连续阶段的加工而达到对感觉刺激的解释。
局限性
给记忆带来沉重的负担，缺少灵活性。
难以解释人何以迅速识别一个新的、不熟悉的
模式这类常见的事实。
模板说没有完全解释人的模式识别过程。
二、原型说（Prototype Theory）
在记忆中储存的不是与外部模式有一对一关系的模
板，而是原型（Prototype）。原型是一个类别或范畴的所有个体的概括表征，反映一类客体具有基本特征。

第二章贝叶斯决策理论—第三次课

第2章贝叶斯决策理论
第2章贝叶斯决策理论
第2章贝叶斯决策理论
本章内容
2.1 分类器的描述方法 2.2 最大后验概率判决准则 2.3 最小风险贝叶斯判决准则 2.4 Neyman-Person判决准则 2.5 最小最大风险判决准则 2.6 本章小结
第2章贝叶斯决策理论
2.2 最大后验概率判决准则 (基于最小错误率的贝叶斯决策准则)
第2章贝叶斯决策理论
2.5
第2章贝叶斯决策理论
最小风险贝叶斯判决受三种因素的影响：类条件概率密度函数p(x|ωi) ；先验概率P(ωi) ；损失（代价）函数λ(αj, ωi) 。在实际应用中遇到的情况： – 各类先验概率不能精确知道； – 在分析过程中发生变动。这种情况使判决结果不能达到最佳，实际分类器的平均损失要变大，甚至变得很大。
第2章贝叶斯决策理论
2.4 Neyman-Person
第2章贝叶斯决策理论
最小风险贝叶斯判决准则使分类的平均风险最小, 该准则需要什么条件？
最大后验概率判决准则使分类的平均错误率最小, 该准则需要什么条件？
N-P准则在实施时既不需要知道风险函数，也不需要知道先验概率。
第2章贝叶斯决策理论
最大后验概率判决准则使分类的平均错误概率最小。最小风险贝叶斯判决准则使分类的平均风险最小。可是, 在实际遇到的模式识别问题中有可能出现这样的问题: 对于两类情形, 不考虑总体的情况, 而只关注某一类的错误概率, 要求在其中一类错误概率小于给定阈值的条件下, 使另一类错误概率尽可能小。
因为两类情况下, 先验概率满足:
P(1) P(2 ) 1
第2章贝叶斯决策理论
R R1 [(1,1)P(1) p(x | 1) (1,2 )P(2 ) p(x | 2 )]dx R2 {(2 ,1)P(1) p(x | 1) (2,2 )P(2 ) p(x | 2 )}dx

第二章第三节定量构效关系案例

通过生物活性强度与特性参数回归分析，得Hansch方程：
此式表示生物活性强度与各参数线性相关。也可能有复杂情况，如出现最适疏水常数，此时生物活性强度与疏水参数呈抛物线关系，方程为：
(三)Hansch方程的推导
生物效应速率与三个因素有关，即药物分子在一定时间内通过“随机运行”到达限速反应部位的概率 A，给药的剂量 C ，引起生物效应的限速反应的速率常数κ x。用式2—23表示：
由式2—34获得如下信息：①活性与π、σm和立体位阻有关，疏水性强、吸电子的基团对提高活性有利，基团的长度 L 对活性不利；② p— 取代对活性不利， om 与 o’m’ 方向对活性有较大影响， om取向比 o’m’ 取向好，即取代基应离开 1， 4—二氢吡啶平面。
(五)应用的限度
Hansch分析不能产生先导化合物，在实际运用中有的能成功，但有的不一定成功。这是由于药物实际作用过程往往比较复杂，生物活性的测定和参数的客观性也受到限制。构效关系的理论告诉我们，若将过程中药物动力相和药效相分别研究，可能获得较好的结果。在药效相可采取体外测试的方法，所得数据更客观，模型与作用机理也更一致。在药物动力相方面，有人正在研究药物的化学结构与药物动力学的定量关系。
式2—29告诉我们，亲水性和推电子基团有利于活性的提高。羟基的 π =-0.67 ， σ p=-0.37 ，合成该化合物，回归分析得 n=8时r=0.919。活性的实验值与计算值相当一致。如果某类化合物的活性、毒性与分配系数有图 2—24所示关系。其中lgPo(A)和lgPo(B)分别是活性和毒性的极值，构效关系告诉我们，设计分配系数为 lgPo(A)的化合物是不可取的，因此时其毒性也相当高。而分配系数为lgPi的化合物是适宜的。

模式识别(三)课后上机作业参考解答

“模式识别(三).PDF”课件课后上机选做作业参考解答(武大计算机学院袁志勇, Email: yuanzywhu@) 上机题目：两类问题，已知四个训练样本ω1={(0,0)T,(0,1)T}；ω2={(1,0)T,(1,1)T}使用感知器固定增量法求判别函数。

设w1=(1,1,1)Tρk=1试编写程序上机运行(使用MATLAB、 C/C++、C#、JA V A、DELPHI等语言中任意一种编写均可)，写出判别函数，并给出程序运行的相关运行图表。

这里采用MATLAB编写感知器固定增量算法程序。

一、感知器固定增量法的MATLAB函数编写感知器固定增量法的具体内容请参考“模式识别(三).PDF”课件中的算法描述，可将该算法编写一个可以调用的自定义MATLAB函数：% perceptronclassify.m%% Caculate the optimal W by Perceptron%% W1-3x1 vector, initial weight vector% Pk-scalar, learning rate% W -3x1 vector, optimal weight vector% iters - scalar, the number of iterations%% Created: May 17, 2010function [W iters] = perceptronclassify(W1,Pk)x1 = [0 0 1]';x2 = [0 1 1]';x3 = [1 0 1]';x4 = [1 1 1]';% the training sampleWk = W1;FLAG = 0;% iteration flagesiters = 0;if Wk'*x1 <= 0Wk =Wk + x1;FLAG = 1;endif Wk'*x2 <= 0Wk =Wk + x2;FLAG = 1;endif Wk'*x3 >= 0Wk=Wk-x3;FLAG = 1; endif Wk'*x4 >= 0Wk =Wk -x4; FLAG = 1; enditers = iters + 1; while (FLAG) FLAG = 0; if Wk'*x1 <= 0Wk = Wk + x1; FLAG = 1; endif Wk'*x2 <= 0Wk = Wk + x2; FLAG = 1; endif Wk'*x3 >= 0 Wk = Wk - x3; FLAG = 1; endif Wk'*x4 >= 0 Wk = Wk - x4; FLAG = 1; enditers = iters + 1; endW = Wk;二、程序运行程序输入：初始权向量1W , 固定增量大小k ρ 程序输出：权向量最优解W , 程序迭代次数iters 在MATLAB 7.X 命令行窗口中的运行情况：１、初始化1[111]T W = 初始化W 1窗口界面截图如下：２、初始化1kρ=初始化Pk 窗口界面截图如下：３、在MATLAB 窗口中调用自定义的perceptronclassify 函数由于perceptronclassify.m 下自定义的函数文件，在调用该函数前需要事先[Set path…]设置该函数文件所在的路径，然后才能在命令行窗口中调用。

机器学习与模式识别-教学大纲

机器学习与模式识别》教学大纲课程编号： 071243B课程类型：□通识教育必修课□通识教育选修课■专业必修课□专业选修课□学科基础课总学时： 48 讲课学时： 32 实验（上机）学时： 16 学分： 3适用对象：计算机科学与技术专业先修课程：程序设计基础与应用、数据结构、高等数学、算法导论一、教学目标《机器学习与算法导论》是计算机科学技术专业的一门专业选修课程。

本课程是面向计算机技术开设的专业选修课。

其教学重点是使学生掌握常见机器学习算法，包括算法的主要思想和基本步骤，并通过编程练习和典型应用实例加深了解；同时对机器学习的一般理论，如假设空间、采样理论、计算学习理论，以及无监督学习和强化学习有所了解。

模式识别部分是研究计算机模式识别的基本理论、方法和应用。

通过本课程的学习，使学生掌握模式识别的基本概念、基本原理、基本分析方法和算法，培养学生利用模式识别方法，运用技能解决本专业和相关领域的实际问题的能力。

学生通过本门课程的学习，能够对机器学习和模式识别的内容有一个较为全面的了解和认识，更深刻地理解机器学习的实质内容，使学生具备前沿的计算机技术必要的专业知识。

从而，为学生今后从事计算机技术应用与计算机技术前沿研究，以及相关领域的科学研究做好理论和技术上的准备。

目标1：通过对机器学习与模式识别基本概念、原理、和基本方法的讲解，让学生理解并掌握机器学习和模式识别的基本技术。

目标2：培养学生利用模式识别方法，运用技能解决本专业和相关领域的实际问题的能力。

目标3：鼓励学生运用知识解决各自学科的实际问题，培养他们的独立科研的能力和理论联系实际的能力。

二、教学内容及其与毕业要求的对应关系（黑体，小四号字）本课程主要介绍决策论与信息论基础、概率分布、回归的线性模型、分类的线性模型、核方法、支持向量机、图模型、混合模型和期望最大化、隐Markov 模型和条件随机场模型、统计决策方法、概率密度函数的估计、线性分类器、非线性分类器、其他分类方法、特征选择、特征提取、非监督模式识别、模式识别系统的评价等。

第2章贝叶斯决策理论PPT课件

令每一个x都取使P( P (e | x) p ( x)dx
P(e
|
x)
P P
(1 ( 2
| |
x) x)
P ( 2 | x) P (1 | x) P (1 | x) P ( 2 | x)
最小的值，则所有x产生
的平均错误率最小。
结论可推广至多类
t
P (e) P ( 2 | x) p ( x)dx t P (1 | x) p ( x)dx
t
p ( x | 2 ) P ( 2 )dx t p ( x | 1 ) P (1 )dx
P ( 2 ) P2 (e) P (1 ) P1 (e)
12
基于最小错误率的贝叶斯决策
使误判概率 P (最e ) 小，等价于使正确分类识别的概率 P ( c ) 最大。
贝叶斯决策理论研究了模式类的概率结构完全知道的理想情况。这种情况实际中极少出现，但提供了一个对比其它分类器的依据，即“最优”分类器。
5
2.1 引言
符号规定
分类类别数：c
类别状态： i,i1,2, ,c
特征空间维数：d
d维特征空间中的特征向量：x[x1,x2, ,xd]T
先验概率：P (表i ) 示类出i 现的先验概率,简称为类的概i 率
P(1| x)
p(x|1)P(1)
2
p(x|j)P(j)
0.20.9 0.818 0.20.90.40.1
j1
P(2 | x)1P(1| x)0.182 P(1|x)0.818P(2| x)0.182 x1
11
基于最小错误率的贝叶斯决策
关于错误率最小的讨论（一维情况）
错误率是指平均错误率P(e)
2.1 引言

模式识别第2章非监督学习方法

三、匹配测度
当特征只有两个状态（0，1）时，常用匹配测度。 0表示无此特征 1表示有此特征。故称之为二值特征。对于给定的x和y中的某两个相应分量xi与yj 若xi=1,yj=1 ，则称 xi与yj是 (1-1)匹配；若xi=1,yj=0 ，则称 xi与yj是 (1-0)匹配；若xi=0,yj=1 ，则称 xi与yj是 (0-1)匹配；若xi=0,yj=0 ，则称 xi与yj是 (0-0)匹配。
青蛙
无肺
有肺
14
特征选取不同对聚类结果的影响
(c) 按生活环境分
羊,狗,猫蜥蜴,毒蛇麻雀,海鸥
金鱼绯鲵鲣
蓝鲨
青蛙
陆地
水里
两栖
15
特征选取不同对聚类结果的影响
(d) 按繁衍后代方式和肺是否存在分
蜥蜴,毒蛇麻雀,海鸥
青蛙
金鱼绯鲵鲣
非哺乳且有肺非哺乳且无肺
羊,狗,猫
哺乳且有肺
蓝鲨
哺乳且无肺
p
q
最近距离法
1/2
1/2
0
-1/2
最远距离法
1/2
1/2
0
1/2
中间距离法重心距离法平均距离法可变平均法可变法离差平方和法
1/2
np n p nq
np n p nq
(1 ) np np nq
1
2
nk n p nk nl
1/2
nq n p nq
nq n p nq (1 ) nq
48
2·3 类的定义与类间距离
49
2·3 类的定义与类间距离
w j 的类内离差阵定义为
S ( j) W
1 nj
nj
(

2016年福建自考《认知心理学》考试大纲

2016年福建自考《认知心理学》考试大纲。

（二）模式识别识记：模板说、原型说、特征说应用：（1）模板说的核心思想认为在人的长时记忆中，贮存着许多各式各样的过去在生活中形成的外部模式的袖珍样本。

基本思想是刺激与模板匹配，而且这两种匹配要求两者有限度的重叠。

模板说的基本观点得到一些实验结果的支持。

（2）原型说认为在记忆贮存的不是与外部模式有一对一关系的模板，而是原型（Prototype）。

对于原型说来讲，关键点在于是否存在这种原型，目前已有一些实验结果提示原型确实存在。

（3）特征说认为，模式可以分解为诸特征。

照特征说来看，特征和特征分析在模式识别中起着关键的作用。

（三）结构优势效应识记：结构优势效应包括字词优势效应、客体优势效应、构型优势效应、字母优势效应。

这些效应都表明上下文，或者严格地说，整体的结构在模式识别中所起的有利的作用，可统称为结构优势效应。

第三章注意一、学习目的与要求通过本章的学习理解过滤器模型和衰减模型、反应选择模型与知觉选择模型。

明确中枢能量理论，认识控制性加工与自动加工。

二、考核知识点与考核目标（一）过滤器模型和衰减模型识记：过滤器模型是英国心理学家Broadbent于1958年提出的一个较早的注意模型。

Cherry应用追随程序所做的双听实验也支持过滤器模型。

识记：Treisman提出了衰减模型，并将阙限概念引入高级分析水平。

理解：（1）衰减模型（2）过滤器模型和衰减模型的共同点和不同点（二）反应选择模型与知觉选择模型识记：（1）反应选择模型以Deutsh为代表（2）反应选择模型与知觉选择模型主要差别在于对注意机制在信息加工系统中所处的位置有不同的看法。

理解：（1）反应选择模型（2）两类注意模型的比较（三）中枢能量理论理解：双作业操作识记：（1）一些心理学家并不设想一个瓶颈结构，即存在于某个位置的过滤器，而是将注意看做人能用于执行任务的数量有限的能量和资源，用这种能量或资源的分配来解释注意。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

对原特征空间优化，就要对优化结果进行评价实际的评价方法：对系统性能进行测试，测试指标主要有正确率、计算速度、存储容量等。本节讨论的评价方法：找出对特征空间进行优化的具体算法。对特征空间进行优化是一种计算过程，它的基本方法仍然是模式识别的典型方法：找到一种准则(或称判据，通常用一种式子表示），以及一种优化计算方法，使这种准则达到一个极值。理想的情况：判据与计算错误率有关，但直接反映错误率的是贝叶斯公式，在实际中运用有困难。采用其他判据：类别可分离性判据
22
U T SW U I
SW (U ) U
T 1
1
或
SW UU
1
T
U T U
UU T U U
因此：即：是
（两边同乘U）
1 Sw U U
S
1 w
的本征值矩阵
|| D J（X） i 由： 5 | I | i 1
可见，取使J5达最大的d个本征
按距离度量的特征提取就是：利用基于距离的判据(J1~J5)找出一种线性变换W，使得判据J达到极值。
13
（1）J2判据下的特征提取算法
设X空间的类内离散度矩阵和类间离散度矩阵分别为 SW ,Sb；则按J2判据得到的特征提取矩阵W是按如下方式构造的：
若矩阵 SW-1Sb 的本征值λi按大小顺序列为
7
1、用于可分性判据的距离
C类：各类之间的平均距离
c 1 c 1 J d ( x ) Pi Pj 2 i 1 j 1 ni n j (i ) ( j) ( x , x k l ) k 1 l 1 ni nj
式中： (i ) ( j) ( xk , xl ) :ωi任一点xk(i)与ωj中任一点xj( j)的距离，可用不同距离度量方法，如欧氏距离等。 Pi, Pj：分别表示第ωi类和第ωj类的先验概率
17
例：
给定先验概率相等的两类，其均值向量分别为：
协方差矩阵是：
求用J2判据的最优特征提取。
18
解：应先求混合均值类间离散度矩阵：
，再求此矩阵的本征矩阵。
类内离散度矩阵
19
求的本征值矩阵。由于这是一个两类别问题，总均值向量μ值是两个均值向量μ1和μ2的线性求和，则中只有一个是独立的，因此的秩是一，换句话说它只有一个非零本征值，W是D×1矩阵，是一个向量，求该向量需解
4
可分性判据应满足的要求
（1）与错误率有单调关系，这使判据取最大值时错误率也较小 d （2）当特征独立时 J (x ,x ,...,xd ) J ij (xk ) 有可加性： ij 1 2 k 1 （Jij是第i类与第j类的可分性准则）（3）度量特性： Jij 0,i j; J ij 0,i j; J ij J ji （4）单调性：加入新的特征时，判据不减小
1. 特征选择
已有D维特征向量空间，Y={y1,y2,…,yD} ，从原有的D维特征空间，删去一些特征描述量，从而得到精简后的特征空间。在这个特征空间中，样本由d维的特征向量描述：X={x1,x2,…,xd} ，d ＜D。X只是Y的一个子集，每个分量xi必然能在原特征集中找到其对应的描述量xi＝yj。
1 J 2 ( X ) tr ( S w Sb )
则选择前最大的d个本征值所对应的本征向量组成的变换矩阵WD*d，可使判据J2(W)在W是D*d维下达到最大值。
1 2 3
D
14
证明：因为： Y=WTX，设：X的类内和类间离散度矩阵分别为SW ,Sb 则：Y的类内和类间离散度矩阵分别为SW’, Sb’为 SW’=W SW’WT , Sb’=W Sb’WT
（见第3章中，Fisher准则一节）
在使用J2判据下，将其Y的可分性判据表示成变换W的函数： J2(Y)=tr[(SW’)-1 Sb’]
则： J2(Y)=tr[(WSWWT)-1 (WSbWT)]= J2(W)
可以证明：在不降维条件下，即，设W是D*D维的，则J2判据不变 J2(Y)= J2(X) 。
i 1 c ~
总的类间离散度矩阵）（总的类间离散度矩阵）
~ ~
1 ni ( i ) (i ) S w Pi ( xk mi )( xk mi )T ni k 1 i 1
则可得判据的矩阵形式： J d ( x) tr ( S b S w )
tr：迹
9
~ ~ 上述公式是有限样本集， mi , m, S w , S b 是均值 i , , 及散度 Sw , Sb 的估计。对于无限样本：
3、特征空间的优化
这个层次的工作发生在已有了特征的描述方法之后，也就是已有了一个初始的特征空间，如何对它进行改造与优化的问题。对初始的特征空间进行优化是为了降维。即初始的特征空间维数较高。能否改成一个维数较低的空间，称为优化，优化后的特征空间应该更有利于后续的分类计算。
2
特征空间的优化的两种方法
i Ei [ x]
c i 1
E[ x],
T
Sw PE i i [( x i )( x i ) ]
Sb Pi ( i )( i )T
i 1
c
J1( x) tr( Sb Sw )
10
3、类内类间欧氏距离的其它判据
判据Jd(X)是计算特征向量的总平均距离，以下一些判据则基于使类间离散度尽量大，类内离散度尽量小的考虑而提出。
0 J 2(W ) tr[U d T SW -1SbU d ] tr 0 0
1
2
0 0
0 0
则：如果矩阵
1 SW Sb 的本征值按大小顺序列为
d 0 0 i 1 i d
1 2 3
D
那么由对应于d个最大的本征值的本征向量所组成的矩阵 W(D×d)，就能使所得到的d维特征满足J2判据最大的要求。此结论对J4判据也适用
1
如何构造一个特征空间，即对要识别的事物用什么方法进行描述、分析的问题？
1、物理量的获取与转换(原始测量）
这是指用什么样的传感器获取电信号，如摄取景物则要用摄像机。可以称之为原始信息(原始测量，得到测量空间)。
2、描述事物方法的选择与设计(特征形成)
在得到了原始信息之后，要对它进一步加工，以获取对分类最有效的信息。设计所要信息的形式是十分关键的。
由于 SW 阵U使得：
Sb和 SW 是对称矩阵，因此，存在矩
0 0 0 0 D
则：
1 U T U 0 0
U T SW U I
| Sw Sb | | | | U T U | | | D J（ T i 5 X） | Sw | | Sw | | U S wU | | I | i 1
值对应的本征向量组成的W，可将X降到d维。
23
J5的另一种形式
SW Sb
1
1 1 SW I SW Sb 1
( I S W Sb )U S W U U
12
2.4.2 特征提取
1、按距离度量的特征提取方法 Fisher准则的延伸，这种判据的优化体现出降维后的特征空间较好地体现类内密集、类间分离的要求。特征优化过程是通过一个线性变换实现的：设在原特征空间一个样本向量表示成X(D维)，在优化特征空间中，样本向量表示成Y(d维)，X与Y之间的关系是： Y=WTX， W：D×d维矩阵（d<D）
所有样本集的总均值： m
则平均距离为：
~ c
Pm
i 1 i
c
i
1 ni ( i ) T (i ) T J d ( x) P [ ( x m ) ( x m ) ( m m ) (mi m)] i k i k i i n i 1 i k 1
c
令： S b Pi ( mi m)(mi m)T
哈尔滨工业大学电信院宿富林
15
证明：J2(W)=tr[(WSWWT)-1 (WSbWT)] =tr[(WT)-1SW-1W-1 WSbWT)] =tr[(WT)-1SW-1SbWT] = tr[SW-1SbWT(WT)-1] = tr[SW-1Sb]=J2(X) 设：SW-1Sb的本征值为λ1 >λ2 >λ3 >……>λD ，对应的本征向量矩阵为U=[u1，u2,….,uD] 则 UT SW-1Sb U =Λ,
1. 特征提取
找到一个映射关系：A:Y→X ，使新样本特征描述维数比原维数降低。其中X的每个分量xi是原特征向量Y各分量的函数，即： xi=fi(y1,y2,…,yD) 这两种降维的基本方法是不同的。在实际应用中可将两者结合起来使用，比如先进特征提取，然后再进一步选择其中一部分，或反过来。
3
2.4.1特征空间优化结果的评价准则：类别可分离性判据
§2.4 特征的选择与提取
如何确定合适的特征空间是设计模式识别系统另一个十分重要，甚至更为关键的问题。
如果所选用的特征空间能使同类物体分布具有紧致性，即各类样本能分布在该特征空间中彼此分割开的区域内，这就为分类器设计成功提供良好的基础。反之，如果不同类别的样本在该特征空间中混杂在一起，再好的设计方法也无法提高分类器的准确性。这一节要讨论的问题就是特征空间如何设计的问题
J ij (x1 ,x2 ,...,xd ) J ij (x1 ,x2 ,...,xd , x d 1 )
5
几种常用的可分性判据
以计算样本在特征空间离散程度为基础的准则，称为基于距离的可分性判据（重点）基于概率密度分布的可分性判据（不讲）。基于熵函数的可分性判据（不讲）