模式识别导论习题集

合集下载

模式识别练习题

模式识别练习题

模式识别练习(1)主题:1.“基于最小错误率的贝叶斯决策”模式识别练习2.“基于最小风险的贝叶斯决策”模式识别练习3.基于“主成分分析”的贝叶斯决策模式识别练习已知训练样本集由“”、“”组成:={(0,0),(0,1),(1,0)};={(4,4),(4,5),(5,4),(5,5)},而测试样本集为C={(2,2),(2.2,2.2),(3,3)}。

(1)利用“基于最小错误率的贝叶斯决策”判别测试集为C中的样本的归类;(2)利用“基于最小风险的贝叶斯决策”判别测试集为C中的样本的归类;(3)在进行“主成分分析”的基础上,采用90%的主成分完成前面的(1)、(2),比较结果的异同。

模式识别练习(2)主题:很多情况下,希望样本维数(特征数)越少越好,降维是解决问题的一个有效的方法。

主成分分析希望得到较少的特征数,而Fisher准则方法则将维数直接降到1维。

一、已知训练样本集由“”、“”组成:={(0,0),(0,1),(1,0)};={(4,4),(4,5),(5,4),(5,5)},而测试样本集为C={(i,i)|i=0:0.005:5}。

分别利用基于最小错误率的贝叶斯决策、基于最小风险的贝叶斯决策、仅使用第一主成分、使用Fisher准则等四种方法(自编函数文件或用书上的函数文件)计算出测试集C中线段(0,0)-(5,5)的临界点;要求:将计算结果自动写入数据文件中二、已知训练样本集为教材上的10类手写数字集。

分别利用基于最小错误率的贝叶斯决策、基于最小风险的贝叶斯决策、仅使用第一主成分、使用Fisher准则等四种方法,统计出各大类的错误率和计算机cpu的计算时间,采用的测试集C依旧是10类手写数字集(虽然分类已知,但用不同的方法实际判别时可能有误判情况!)要求:使用书上的函数文件,并将计算结果自动写入数据文件中模式识别练习(3)一、已知训练样本集由“”、“”组成:={(0,0),(0,1),(1,0)};={(4,4),(4,5),(5,4),(5,5)},而测试样本集为C={(i,i)|i=0:0.01:5}。

模式识别试卷及答案

模式识别试卷及答案

模式识别试卷及答案一、选择题(每题5分,共30分)1. 以下哪一项不是模式识别的主要任务?A. 分类B. 回归C. 聚类D. 预测答案:B2. 以下哪种算法不属于监督学习?A. 支持向量机(SVM)B. 决策树C. K最近邻(K-NN)D. K均值聚类答案:D3. 在模式识别中,以下哪一项是特征选择的目的是?A. 减少特征维度B. 增强模型泛化能力C. 提高模型计算效率D. 所有上述选项答案:D4. 以下哪种模式识别方法适用于非线性问题?A. 线性判别分析(LDA)B. 主成分分析(PCA)C. 支持向量机(SVM)D. 线性回归答案:C5. 在神经网络中,以下哪种激活函数常用于输出层?A. SigmoidB. TanhC. ReLUD. Softmax答案:D6. 以下哪种聚类算法是基于密度的?A. K均值聚类B. 层次聚类C. DBSCAND. 高斯混合模型答案:C二、填空题(每题5分,共30分)1. 模式识别的主要任务包括______、______、______。

答案:分类、回归、聚类2. 在监督学习中,训练集通常分为______和______两部分。

答案:训练集、测试集3. 支持向量机(SVM)的基本思想是找到一个______,使得不同类别的数据点被最大化地______。

答案:最优分割超平面、间隔4. 主成分分析(PCA)是一种______方法,用于降维和特征提取。

答案:线性变换5. 神经网络的反向传播算法用于______。

答案:梯度下降6. 在聚类算法中,DBSCAN算法的核心思想是找到______。

答案:密度相连的点三、简答题(每题10分,共30分)1. 简述模式识别的基本流程。

答案:模式识别的基本流程包括以下几个步骤:(1)数据预处理:对原始数据进行清洗、标准化和特征提取。

(2)模型选择:根据问题类型选择合适的模式识别算法。

(3)模型训练:使用训练集对模型进行训练,学习数据特征和规律。

模式识别习题及答案

模式识别习题及答案

模式识别习题及答案模式识别习题及答案【篇一:模式识别题目及答案】p> t,方差?1?(2,0)-1/2??11/2??1t,第二类均值为,方差,先验概率??(2,2)?122???1??1/21??-1/2p(?1)?p(?2),试求基于最小错误率的贝叶斯决策分界面。

解根据后验概率公式p(?ix)?p(x?i)p(?i)p(x),(2’)及正态密度函数p(x?i)?t(x??)?i(x??i)/2] ,i?1,2。

(2’) i?1基于最小错误率的分界面为p(x?1)p(?1)?p(x?2)p(?2),(2’) 两边去对数,并代入密度函数,得(x??1)t?1(x??1)/2?ln?1??(x??2)t?2(x??2)/2?ln?2(1) (2’)1?14/3-2/3??4/32/3??1由已知条件可得?1??2,?1,?2??2/34/3?,(2’)-2/34/31设x?(x1,x2)t,把已知条件代入式(1),经整理得x1x2?4x2?x1?4?0,(5’)二、(15分)设两类样本的类内离散矩阵分别为s1??11/2?, ?1/21?-1/2??1tt,各类样本均值分别为?1?,?2?,试用fisher准(1,0)(3,2)s2-1/21??(2,2)的类别。

则求其决策面方程,并判断样本x?解:s?s1?s2??t20?(2’) ??02?1/20??-2??-1?*?1w?s()?投影方向为12?01/22?1? (6’) ???阈值为y0?w(?1??2)/2??-1-13 (4’)*t2?1?给定样本的投影为y?w*tx??2-1?24?y0,属于第二类(3’) ??1?三、(15分)给定如下的训练样例实例 x0 x1 x2 t(真实输出) 1 1 1 1 1 2 1 2 0 1 3 1 0 1 -1 4 1 1 2 -1用感知器训练法则求感知器的权值,设初始化权值为w0?w1?w2?0;1 第1次迭代2 第2次迭代(4’)(2’)3 第3和4次迭代四、(15分)i. 推导正态分布下的最大似然估计;ii. 根据上步的结论,假设给出如下正态分布下的样本,估计该部分的均值和方差两个参数。

模式识别习题集

模式识别习题集

2.6 简述最小张树算法的优点。
2.7 证明马氏距离是平移不变的、非奇异线性变换不变的。 2.8 设,类 有
p 、 q 的重心分别为 x p 、 xq ,它们分别有样本 n p 、 n q 个。将和 q 合并为 l ,则 l
个样本。另一类
2 Dkl


nl n p nq
k 的重心为 x k 。试证明 k 与 l 的距离平方是
,JH 越(
),说明模式的

)(i=1,2,…,c)时,JH 取极大值。
1.20 Kn 近邻元法较之于 Parzen 窗法的优势在于 ( 上述两种算法的共同弱点主要是( )。 )。
1.21 已知有限状态自动机 Af=(,Q,,q0,F),={0,1};Q={q0,q1}; :(q0,0)= q1,(q0,1)= q1,(q1,0)=q0,(q1,1)=q0;q0=q0;F={q0}。现有输入字符串:(a) 00011101011,(b) 1100110011,(c) 101100111000,(d)0010011,试问,用 Af 对上述字符串进行分类 的结果为( 1.22 句法模式识别中模式描述方法有: (1)符号串 (2)树 (3)图 (4)特征向量 )。 。
《模式识别》习题集
一、基本概念题 1.1 是: 1.2、模式分布为团状时,选用 1.3 欧式距离具有 。 马式距离具有 模 式 识 、 别 的 三 大 、 聚类算法较好。 。 核 心 问 。 题
(1)平移不变性 (2)旋转不变性 (3)尺度缩放不变性 (4)不受量纲影响的特性 1.4 描述模式相似的测度有: (1)距离测度 (2)模糊测度 (3)相似测度 (4)匹配测度 ;(2) 个技术途径。 ; 。
(1)

模式识别练习题(简答和计算)

模式识别练习题(简答和计算)

这两个特征向量,即为主分量。 (3) K-L 变换的最佳准则为:
对一组数据进行按一组正交基分解,在只取相同数量分量的条件下,以均方误差计算 截尾误差最小。 (4) 在经主分量分解后,协方差矩阵成为对角矩阵,因而各主分量间相关性消除。
4、试说明以下问题求解是基于监督学习或是非监督学习: (1) 求数据集的主分量 (2) 汉字识别 (3) 自组织特征映射 (4) CT 图像的分割 答:(1) 求数据集的主分量是非监督学习方法; (2) 汉字识别:对待识别字符加上相应类别号—有监督学习方法; (3) 自组织特征映射—将高维数组按保留近似度向低维映射—非监督学习; (4) CT 图像分割—按数据自然分布聚类—非监督学习方法; 5、试列举线性分类器中最著名的三种最佳准则以及它们各自的原理。 答:线性分类器三种最优准则: Fisher 准则:根据两类样本一般类内密集,类间分离的特点,寻找线性分类器最佳的法线 向量方向,使两类样本在该方向上的投影满足类内尽可能密集,类间尽可能分开。 这种度量通过类内离散矩阵 Sw 和类间离散矩阵 Sb 实现。 感知准则函数:准则函数以使错分类样本到分界面距离之和最小为原则。 其优点是通过错分类样本提供的信息对分类器函数进行修正,这种准则是人工神经元 网络多层感知器的基础。 支持向量机:基本思想是在两类线性可分条件下,所设计的分类器界面使两类之间的 间隔为最大,它的基本出发点是使期望泛化风险尽可能小。 6、试分析五种常用决策规则思想方法的异同。 答、五种常用决策是: 1. 基于最小错误率的贝叶斯决策,利用概率论中的贝叶斯公式,得出使得错误率最小 的分类规则。 2. 基于最小风险的贝叶斯决策,引入了损失函数,得出使决策风险最小的分类。当在 0-1 损失函数条件下,基于最小风险的贝叶斯决策变成基于最小错误率的贝叶斯决

《模式识别》试题库

《模式识别》试题库

《模式识别》试题库一、基本概念题1.1 模式识别的三大核心问题是: 、。

1.2、模式分布为团状时,选用 聚类算法较好。

1.3 欧式距离具有 。

马式距离具有 。

(1)平移不变性 (2)旋转不变性 (3)尺度缩放不变性 (4)不受量纲影响的特性 1.4 描述模式相似的测度有: 。

(1)距离测度 (2)模糊测度 (3)相似测度 (4)匹配测度1.5 利用两类方法处理多类问题的技术途径有:(1) ;(2) ;(3) 。

其中最常用的是第 个技术途径。

1.6 判别函数的正负和数值大小在分类中的意义是: , 。

1.7 感知器算法 。

(1)只适用于线性可分的情况;(2)线性可分、不可分都适用。

1.8 积累位势函数法的判别界面一般为 。

(1)线性界面;(2)非线性界面。

1.9 基于距离的类别可分性判据有: 。

(1)1[]wB Tr S S - (2)B W S S (3)BW BS S S + 1.10 作为统计判别问题的模式分类,在( )情况下,可使用聂曼-皮尔逊判决准则。

1.11 确定性模式非线形分类的势函数法中,位势函数K(x,x k )与积累位势函数K(x)的关系为( )。

1.12 用作确定性模式非线形分类的势函数法,通常,两个n 维向量x 和x k 的函数K(x,x k )若同时满足下列三个条件,都可作为势函数。

①( ); ②( ); ③ K(x,x k )是光滑函数,且是x 和x k 之间距离的单调下降函数。

1.13 散度J ij 越大,说明ωi 类模式与ωj 类模式的分布( )。

当ωi 类模式与ωj 类模式的分布相同时,J ij =( )。

1.14 若用Parzen 窗法估计模式的类概率密度函数,窗口尺寸h1过小可能产生的问题是( ),h1过大可能产生的问题是( )。

1.15 信息熵可以作为一种可分性判据的原因是: 。

1.16作为统计判别问题的模式分类,在( )条件下,最小损失判决规则与最小错误判决规则是等价的。

模式识别习题集答案解析

模式识别习题集答案解析

PCA是一种无监督的映射方法,LDA是一种有监督的映射方法。

PCA只是将整组数据映射到最方便表示这组数据的坐标轴上,映射时没有利用任何数据部的分类信息。

因此,虽然做了PCA后,整组数据在表示上更加方便(降低了维数并将信息损失降到了最低),但在分类上也许会变得更加困难;LDA在增加了分类信息之后,将输入映射到了另外一个坐标轴上,有了这样一个映射,数据之间就变得更易区分了(在低纬上就可以区分,减少了很大的运算量),它的目标是使得类别的点距离越近越好,类别间的点越远越好。

2、最大似然估计和贝叶斯方法的区别?p(x|X)是概率密度函数,X是给定的训练样本的集合,在哪种情况下,贝叶斯估计接近最大似然估计?最大似然估计把待估的参数看做是确定性的量,只是其取值未知。

利用已知的样本结果,反推最有可能(最大概率)导致这样结果的参数值(模型已知,参数未知)。

贝叶斯估计则是把待估计的参数看成是符合某种先验概率分布的随机变量。

对样本进行观测的过程,把先验概率密度转化为后验概率密度,利用样本的信息修正了对参数的初始估计值。

当训练样本数量趋于无穷的时候,贝叶斯方法将接近最大似然估计。

如果有非常多的训练样本,使得p (x|X)形成一个非常显著的尖峰,而先验概率p(x)又是均匀分布,此时两者的本质是相同的。

3、为什么模拟退火能够逃脱局部极小值?在解空间随机搜索,遇到较优解就接受,遇到较差解就按一定的概率决定是否接受,这个概率随时间的变化而降低。

实际上模拟退火算法也是贪心算法,只不过它在这个基础上增加了随机因素。

这个随机因素就是:以一定的概率来接受一个比单前解要差的解。

通过这个随机因素使得算法有可能跳出这个局部最优解。

4、最小错误率和最小贝叶斯风险之间的关系?基于最小风险的贝叶斯决策就是基于最小错误率的贝叶斯决策,换言之,可以把基于最小错误率决策看做是基于最小风险决策的一个特例,基于最小风险决策本质上就是对基于最小错误率公式的加权处理。

模式识别习题及答案

模式识别习题及答案

模式识别习题及答案模式识别习题及答案模式识别是人类智能的重要组成部分,也是机器学习和人工智能领域的核心内容。

通过模式识别,我们可以从大量的数据中发现规律和趋势,进而做出预测和判断。

本文将介绍一些模式识别的习题,并给出相应的答案,帮助读者更好地理解和应用模式识别。

习题一:给定一组数字序列,如何判断其中的模式?答案:判断数字序列中的模式可以通过观察数字之间的关系和规律来实现。

首先,我们可以计算相邻数字之间的差值或比值,看是否存在一定的规律。

其次,我们可以将数字序列进行分组,观察每组数字之间的关系,看是否存在某种模式。

最后,我们还可以利用统计学方法,如频率分析、自相关分析等,来发现数字序列中的模式。

习题二:如何利用模式识别进行图像分类?答案:图像分类是模式识别的一个重要应用领域。

在图像分类中,我们需要将输入的图像分为不同的类别。

为了实现图像分类,我们可以采用以下步骤:首先,将图像转换为数字表示,如灰度图像或彩色图像的像素矩阵。

然后,利用特征提取算法,提取图像中的关键特征。

接下来,选择合适的分类算法,如支持向量机、神经网络等,训练模型并进行分类。

最后,评估分类结果的准确性和性能。

习题三:如何利用模式识别进行语音识别?答案:语音识别是模式识别在语音信号处理中的应用。

为了实现语音识别,我们可以采用以下步骤:首先,将语音信号进行预处理,包括去除噪声、降低维度等。

然后,利用特征提取算法,提取语音信号中的关键特征,如梅尔频率倒谱系数(MFCC)。

接下来,选择合适的分类算法,如隐马尔可夫模型(HMM)、深度神经网络(DNN)等,训练模型并进行语音识别。

最后,评估识别结果的准确性和性能。

习题四:如何利用模式识别进行时间序列预测?答案:时间序列预测是模式识别在时间序列分析中的应用。

为了实现时间序列预测,我们可以采用以下步骤:首先,对时间序列进行平稳性检验,确保序列的均值和方差不随时间变化。

然后,利用滑动窗口或滚动平均等方法,将时间序列划分为训练集和测试集。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

模式识别导论习题集1、设一幅256×256大小的图像,如表示成向量,其维数是多少?如按行串接成一维,则第3行第4个象素在向量表示中的序号。

解:其维数为2;序号为256×2+4=5162、如标准数字1在5×7的方格中表示成如图所示的黑白图像,黑为1,白为0,现若有一数字1在5×7网格中向左错了一列。

试用分别计算要与标准模板之间的欧氏距离、绝对值偏差、偏差的夹角表示,异己用“异或”计算两者差异。

解:把该图像的特征向量为5×7=35维,其中标准模版的特征向量为: x =[0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0]T 待测样本的特征向量为:y =[0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0]T因此欧氏距离为3521()14i i i x y =-=∑ ,绝对值偏差为351|()|14i i i x y =-=∑,夹角余弦为cos 0||||||||Tx y x y θ==⋅,因此夹角为90度。

3、哈明距离常用来计算二进制之间的相似度,如011与010的哈明距离为1,010与100距离为3。

现用来计算7位LED 编码表示的个数字之间的相似度,试计算3与其它数字中的哪个数字的哈明距离最小。

解:是“9”,距离为14、对一个染色体分别用一下两种方法描述:(1)计算其面积、周长、面积/周长、面积与其外接矩形面积之比可以得到一些特征描述,如何利用这四个值?属于特征向量法,还是结构表示法?(2)按其轮廓线的形状分成几种类型,表示成a 、b 、c 等如图表示,如何利用这些量?属哪种描述方法? (3)设想其他结构描述方法。

解:(1)这是一种特征描述方法,其中面积周长可以体现染色体大小,面积周长比值越小,说明染色体越粗,面积占外接矩形的比例也体现了染色体的粗细。

把这四个值组成一个维数为4的特征向量,该特征向量可以描述染色体的一些重要特征,可以按照特征向量匹配方法计算样本间的相似度。

可以区分染色体和其它圆形、椭圆细胞结构。

(2)a 形曲线表示水平方向的凹陷,b 形表示竖直方向的凹陷,c 形指两个凹陷之间的突起,把这些值从左上角开始,按顺时针方向绕一圈,可以得到一个序列描述染色体的边界。

它可以很好的体现染色体的形状,用于区分X 和Y 染色体很合适。

这是结构表示法。

(3)可以先提取待识别形状的骨架,在图中用蓝色表示,然后,用树形表示骨架图像。

5. 设在一维特征空间中两类样本服从正态分布,1σ=2σ=1,µ1=0,µ2=3,两类先验概率之比e P P =)(/)(21ωω,试求按基于最小错误率贝叶斯决策原则的决策分界面的x 值。

解:按照公式(2-84),分界面上的点应满足:111[(0)1(0)(3)1(3)]ln ln 022111302116x x x x e x x --⋅⋅---⋅⋅--+=⇒-+=⇒=6. 设有两类正态分布的样本集,第一类均值t )0,2(1=μ,⎪⎪⎭⎫⎝⎛=∑12/12/111,t )2,2(2=μ先验概率)()(21ωωP P =,现按基于最小错误率贝叶斯决策设计分类器,试求分类器得分界面。

解:按照公式(2-84),分界面上的点应满足:11112211112212111[()()()()]ln ln10221()()()()2T T T T x x x x x x x x x x μμμμμμμμ------⋅⋅---⋅⋅--+=⇒-⋅⋅-=-⋅⋅-⇒=∑∑∑∑7. 已知某一正态分布二维随机变量的协方差矩阵为⎪⎪⎭⎫⎝⎛12/12/11,均值向量为零向量。

试求其mahalanobis 距离为1的点的轨迹。

(不要求)8. 设有二维随机变量的分布如图a 、b 、c 所示的三种情况,协方差矩阵表示成⎪⎪⎭⎫⎝⎛22211211a a a a ,试问这三种分布分别对应哪种情况(A. a12>0 B. a12<0 C. a12≈0)?解:这3种情况都存在均值向量μ=0,所以协方差矩阵为211121222122{()}x x x x E x x E x x x x ⎛⎫⎛⎫==⎪ ⎪⎝⎭⎝⎭∑ 所以对于图a 而言,明显有12x x 的平均值>0,因此a →A,对于图b 而言,明显有12x x 的平均值=0,因此b →C, 对于图b 而言,明显有12x x 的平均值<0,因此c →B,a bc图19. 什么叫对称矩阵?什么叫正定矩阵?半正定矩阵?试问协方差矩阵是否是对称矩阵?是否是正定矩阵或半正定矩阵?答:对称阵:a ij =a ji 。

正定阵:它的特征值都大于0。

半正定阵:它的特征值都大于等于0。

协方差矩阵是正定阵。

10. 设有N 个d 维向量组成样本集,表示成X1,…,Xn ,Σ是任一个非奇异对称阵,证明使∑=--∑-Nk k T k x x x x 11)()(为最小的向量X 是该样本集的均值向量。

(不要求)证明:显然可以看出这是一个多元二次式。

故极值位置是导数为零的位置,求导,得:∑∑==--=-∑+∑-Nk Nk k Tkx x x x11110)()(,这是一个一次方程组,在Nxx Nk k∑==1处得零。

故极值在这里取得。

11. 设一个二维空间中的两类样本服从正态分布,其参数分别为t)0,1(1=μ,⎪⎪⎭⎫ ⎝⎛=∑10011,t)0,1(2-=μ,⎪⎪⎭⎫ ⎝⎛=∑20022,先验概率)()(21ωωP P =,试证明其基于最小错误率的贝叶斯决策分界面方程为一圆,并求其方程。

证明:先验概率相等条件下,基于最小错误率贝叶斯决策的分界面上两类条件概率密度函数相等。

因此有:1111112222222212121111()()ln ||()()ln ||222211(1)(1)ln 422T T X X X X x x x x μμμμ----∑--∑=--∑--∑⇒-+=+++化简为4ln 28)3(2221+=+-x x ,是一个圆的方程12. 将上题推广到一般情况(不要求)(1) 若I 21σ=∑,12∑=∑k ,试说明先验概率相等条件下,基于最小错误率的贝叶斯决策面是否是超球面;(2) 它能否用mahalanobis 距离平方为常数的轨迹表示(3) 用mahalanobis 距离表示的轨迹,分析其Σ与Σ1,Σ2的关系.13. 对两类问题,若损失函数02211==λλ,012≠λ,021≠λ,试求基于最小风险贝叶斯决策分界面处的两类错误率与12λ,21λ的关系。

(不要求)14. 思考题:如果有两类问题,ω1和ω2,现欲严格限制错将第二类误判成第一类的情况,那么应如何选择)2(2)1(2)2(1)1(1,,,λλλλ(不要求)15. 证明在Σ正定或半正定时,mahalanobis 距离r 符合距离定义的三个条件,即(不要求) (1) r(a,b)=r(b,a)(2) 当且仅当a=b 时,有r(a,b)=0 (3) r(a,c)≤r(a,b)+r(b,c)16、设五维空间的线性方程为010261632685554321=+++++x x x x x , 试求出其权向量与样本向量点积的表达式00=+w X W T 中的W ,X 以及增广权向量与增广样本向量形式 Y a T 中的a 与Y 。

解:W=[55 68 32 16 26]T ,X=[x 1 x 2 x 3 x 4 x 5] a=[55 68 32 16 26 10]T ,Y=[x 1 x 2 x 3 x 4 x 5 1]17、上式是一个五维空间的超平面,试求该平面到坐标原点的法向距离。

解:根据式(4-8),该式的权向量的模为:222222616126855W ++++= 而超平面到坐标原点的距离为3492100-=-=-W W w18、设在三维空间中一个类别分类问题拟采用二次曲面。

如欲采用广义线性方程求解。

试向其广义样本向量与广义权向量的表达式,其维数是多少?解:根据式(5-29)12001111()dd ddTTkk kjkj k j j k j k j j g x x Wx w x w w x wx x w x w -===+==++=+++∑∑∑∑其中111213112222321323333w w w w W w w w w w w w w w ⎡⎤⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦可得:22211122233312121313232311223302220w x w bx w cx w x x w x x w x x w x w x w x w +++++++++=因此可令其广义样本向量为222123121323123(,,,,,,,,,1)T Y x x x x x x x x x x x x =广义权向量为1112131213231230(,,,2,2,2,,,,)T W w w w w w w w w w w *=19、设两类样本的类内离散矩阵分别为⎪⎪⎭⎫⎝⎛=12/12/111S ,⎪⎪⎭⎫ ⎝⎛--=12/12/112S 均值向量t t m m )2,2(,)0,2(21== 试用fisher 准则求其决策面方程。

解:由式(4-18)和(4-32)分别得总类内离散度矩阵和最佳投影方向为⎪⎪⎭⎫ ⎝⎛-=⎪⎪⎭⎫ ⎝⎛-⎪⎪⎭⎫ ⎝⎛=-=⎪⎪⎭⎫⎝⎛=+=-*10205.0005.0)(200221121m m S W S S S w w因此,原二维空间的均值m 1、m 2在一维y 空间中的投影分别为,112202T T m W m m W m **====-,,由于两类样本分布形状是相同的(只是方向不同),根据先验知识由式(4-33)选定分界阈值点y 0应为两类均值的中点:即012()/21y m m =+=-。

20、设在一个二维空间,A 类有三个训练样本,图中用红点表示,B 类四个样本,图中用蓝点表示。

试问:(1) 按近邻法分类,这两类最多有多少个分界面(2) 画出实际用到的分界面 (3) A 1与B 4之间的分界面有没有用到?解: (1)按近邻法,对任意两个由不同类别的训练样本构成的样本对,如果它们有可能成为测试样本的近邻,则它们构成一组最小距离分类器,它们之间的中垂面就是分界面,因此由三个A 类与四个B 类训练样本可能构成的分界面最大数量为3×4=12。

(2)实际分界面如下图所示,由9条线段构成。

(3)没有用到。

因为它可以用A 1与B 1的分界面代替。

相关文档
最新文档