模式识别习题及答案

合集下载

模式识别试卷及答案

模式识别试卷及答案一、选择题（每题5分，共30分）1. 以下哪一项不是模式识别的主要任务？A. 分类B. 回归C. 聚类D. 预测答案：B2. 以下哪种算法不属于监督学习？A. 支持向量机（SVM）B. 决策树C. K最近邻（K-NN）D. K均值聚类答案：D3. 在模式识别中，以下哪一项是特征选择的目的是？A. 减少特征维度B. 增强模型泛化能力C. 提高模型计算效率D. 所有上述选项答案：D4. 以下哪种模式识别方法适用于非线性问题？A. 线性判别分析（LDA）B. 主成分分析（PCA）C. 支持向量机（SVM）D. 线性回归答案：C5. 在神经网络中，以下哪种激活函数常用于输出层？A. SigmoidB. TanhC. ReLUD. Softmax答案：D6. 以下哪种聚类算法是基于密度的？A. K均值聚类B. 层次聚类C. DBSCAND. 高斯混合模型答案：C二、填空题（每题5分，共30分）1. 模式识别的主要任务包括______、______、______。

答案：分类、回归、聚类2. 在监督学习中，训练集通常分为______和______两部分。

答案：训练集、测试集3. 支持向量机（SVM）的基本思想是找到一个______，使得不同类别的数据点被最大化地______。

答案：最优分割超平面、间隔4. 主成分分析（PCA）是一种______方法，用于降维和特征提取。

答案：线性变换5. 神经网络的反向传播算法用于______。

答案：梯度下降6. 在聚类算法中，DBSCAN算法的核心思想是找到______。

答案：密度相连的点三、简答题（每题10分，共30分）1. 简述模式识别的基本流程。

答案：模式识别的基本流程包括以下几个步骤：（1）数据预处理：对原始数据进行清洗、标准化和特征提取。

（2）模型选择：根据问题类型选择合适的模式识别算法。

（3）模型训练：使用训练集对模型进行训练，学习数据特征和规律。

模式识别习题及答案

模式识别习题及答案模式识别习题及答案【篇一：模式识别题目及答案】p> t，方差?1?（2,0）-1/2??11/2??1t，第二类均值为，方差，先验概率??（2,2）?122???1??1/21??-1/2p(?1)?p(?2)，试求基于最小错误率的贝叶斯决策分界面。

解根据后验概率公式p(?ix)?p(x?i)p(?i)p(x)，(2’)及正态密度函数p(x?i)?t(x??)?i(x??i)/2] ,i?1,2。

(2’) i?1基于最小错误率的分界面为p(x?1)p(?1)?p(x?2)p(?2)，(2’) 两边去对数，并代入密度函数，得(x??1)t?1(x??1)/2?ln?1??(x??2)t?2(x??2)/2?ln?2(1) (2’)1?14/3-2/3??4/32/3??1由已知条件可得?1??2，?1，?2??2/34/3?，(2’)-2/34/31设x?(x1,x2)t，把已知条件代入式（1），经整理得x1x2?4x2?x1?4?0，(5’)二、（15分）设两类样本的类内离散矩阵分别为s1??11/2?, ?1/21?-1/2??1tt,各类样本均值分别为?1?，?2?，试用fisher准（1,0）（3,2）s2-1/21??（2,2）的类别。

则求其决策面方程，并判断样本x?解：s?s1?s2??t20?(2’) ??02?1/20??-2??-1?*?1w?s()?投影方向为12?01/22?1? (6’) ???阈值为y0?w(?1??2)/2??-1-13 (4’)*t2?1?给定样本的投影为y?w*tx??2-1?24?y0，属于第二类(3’) ??1?三、（15分）给定如下的训练样例实例 x0 x1 x2 t(真实输出) 1 1 1 1 1 2 1 2 0 1 3 1 0 1 -1 4 1 1 2 -1用感知器训练法则求感知器的权值，设初始化权值为w0?w1?w2?0；1 第1次迭代2 第2次迭代（4’）（2’）3 第3和4次迭代四、（15分）i. 推导正态分布下的最大似然估计；ii. 根据上步的结论，假设给出如下正态分布下的样本，估计该部分的均值和方差两个参数。

大学模式识别考试题及答案详解

大学模式识别考试题及答案详解Document number：PBGCG-0857-BTDO-0089-PTT1998一、填空与选择填空（本题答案写在此试卷上，30分）1、模式识别系统的基本构成单元包括：模式采集、特征提取与选择和模式分类。

2、统计模式识别中描述模式的方法一般使用特真矢量；句法模式识别中模式描述方法一般有串、树、网。

3、聚类分析算法属于（1）；判别域代数界面方程法属于（3）。

（1）无监督分类 (2)有监督分类（3）统计模式识别方法（4）句法模式识别方法4、若描述模式的特征量为0-1二值特征量，则一般采用（4）进行相似性度量。

（1）距离测度（2）模糊测度（3）相似测度（4）匹配测度5、下列函数可以作为聚类分析中的准则函数的有（1）（3）（4）。

（1）（2） (3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在（2）中进行。

（1）二维空间（2）一维空间（3）N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有（1）；线性可分、不可分都适用的有（3）。

（1）感知器算法（2）H-K算法（3）积累位势函数法8、下列四元组中满足文法定义的有（1）（2）（4）。

（1）({A, B}, {0, 1}, {A?01, A? 0A1 , A? 1A0 , B?BA , B? 0}, A)（2）({A}, {0, 1}, {A?0, A? 0A}, A)（3）({S}, {a, b}, {S ? 00S, S ? 11S, S ? 00, S ? 11}, S)（4）({A}, {0, 1}, {A?01, A? 0A1, A? 1A0}, A)二、(15分)简答及证明题（1）影响聚类结果的主要因素有那些？（2）证明马氏距离是平移不变的、非奇异线性变换不变的。

答：（1）分类准则，模式相似性测度，特征量的选择，量纲。

（2）证明：(2分)(2分)(1分)设，有非奇异线性变换：(1分)(4分)三、(8分)说明线性判别函数的正负和数值大小在分类中的意义并证明之。

模式识别作业题(1)

m 2 mn ] 是奇异的。 mn n 2
1
2、参考参考书 P314“模式识别的概要表示”画出第二章的知识结构图。答：略。 3、现有两类分类问题。如下图所示，（1,
1 1 3 ）、（，）、（1， 3 ）、（1，-tan10°）为 3 2 2 3 3 ，- * tan 10° ）、（2，0）为 W2 类。 5 5
W1 类，其中（1，-tan10°）已知为噪声点；（1,0）、（自选距离度量方法和分类器算法，判别（
6 ，0）属于哪一类？ 5
答：度量方法：根据题意假设各模式是以原点为圆心的扇状分布，以两个向量之间夹角（都是以原点为起点）的余弦作为其相似性测度，P22。然后使用 K 近邻法，K 取 3，求已知 7 个点与（
2
答：（1）×，不一定，因为仅仅是对于训练样本分得好而已。（2）×，平均样本法不需要。（3）√，参考书 P30，将 r 的值代入式（2.26）即得。（4）√，参考书 P34，三条线线性相关。（ 5 ） √ ，就是说解区是 “ 凸 ” 的，参考书 P37 ，也可以证明，设 W1T X’=a, W2T X’=b, 则 a≤λW1+(1-λ)W2≤b（设 a≤b）。（6）√，参考书 P38。（7）×，前一句是错的，参考书 P46。（8）×，是在训练过程中发现的，参考书 P51。（9）×，最简单的情况，两个点（0,0）∈w1,（2,0）∈w2，用势函数法求出来的判决界面是 x1=1。（10）√，一个很简单的小证明，设 X1=a+K1*e，X2= a-K1*e，X3=b+K2*e，X4= b-K2*e， Sw=某系数*e*e’，设 e=[m n]，则 e *e’= [
方法三：参照“两维三类问题的线性分类器的第二种情况（有不确定区域） ”的算法，求 G12,G23,G13。 G12*x1>0, G12*x2<0, G12=(-1,-1,-1)’ G23*x2>0, G23*x3<0, G23=(-1,-1,1)’ G13*x1>0, G13*x3<0, G12=(-1,-1,1)’ 有两条线重合了。

大学模式识别考试题及答案详解()

一、填空与选择填空（本题答案写在此试卷上，30分）1、模式识别系统的基本构成单元包括：模式采集、特征提取与选择和模式分类。

2、统计模式识别中描述模式的方法一般使用特真矢量；句法模式识别中模式描述方法一般有串、树、网。

3、聚类分析算法属于（1）；判别域代数界面方程法属于（3）。

（1）距离测度（2）模糊测度（3）相似测度（4）匹配测度5、下列函数可以作为聚类分析中的准则函数的有（1）（3）（4）。

（1）（2） (3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在（2）中进行。

（1）二维空间（2）一维空间（3）N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有（1）；线性可分、不可分都适用的有（3）。

（1）感知器算法（2）H-K算法（3）积累位势函数法8、下列四元组中满足文法定义的有（1）（2）（4）。

（1）({A, B}, {0, 1}, {A?01, A? 0A1 , A? 1A0 , B?BA , B? 0}, A) （2）({A}, {0, 1}, {A?0, A? 0A}, A)（3）({S}, {a, b}, {S ? 00S, S ? 11S, S ? 00, S ? 11}, S)（4）({A}, {0, 1}, {A?01, A? 0A1, A? 1A0}, A)二、(15分)简答及证明题（1）影响聚类结果的主要因素有那些？（2）证明马氏距离是平移不变的、非奇异线性变换不变的。

答：（1）分类准则，模式相似性测度，特征量的选择，量纲。

（2）证明：(2分)(2分)(1分)设，有非奇异线性变换：(1分)(4分)三、(8分)说明线性判别函数的正负和数值大小在分类中的意义并证明之。

答：（1）（4分）的绝对值正比于到超平面的距离平面的方程可以写成式中。

大学模式识别考试题及答案详解

大学模式识别考试题及答案详解Last revision on 21 December 2020一、填空与选择填空（本题答案写在此试卷上，30分）1、模式识别系统的基本构成单元包括：模式采集、特征提取与选择和模式分类。

2、统计模式识别中描述模式的方法一般使用特真矢量；句法模式识别中模式描述方法一般有串、树、网。

3、聚类分析算法属于（1）；判别域代数界面方程法属于（3）。

（1）距离测度（2）模糊测度（3）相似测度（4）匹配测度5、下列函数可以作为聚类分析中的准则函数的有（1）（3）（4）。

（1）（2） (3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在（2）中进行。

（1）二维空间（2）一维空间（3）N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有（1）；线性可分、不可分都适用的有（3）。

（1）感知器算法（2）H-K算法（3）积累位势函数法8、下列四元组中满足文法定义的有（1）（2）（4）。

（1）({A, B}, {0, 1}, {A01, A 0A1 , A 1A0 , B BA , B 0}, A)（2）({A}, {0, 1}, {A0, A 0A}, A)（3）({S}, {a, b}, {S 00S, S 11S, S 00, S 11}, S)（4）({A}, {0, 1}, {A01, A 0A1, A 1A0}, A)二、(15分)简答及证明题（1）影响聚类结果的主要因素有那些（2）证明马氏距离是平移不变的、非奇异线性变换不变的。

答：（1）分类准则，模式相似性测度，特征量的选择，量纲。

（2）证明：(2分)(2分)(1分)设，有非奇异线性变换：(1分)(4分)三、(8分)说明线性判别函数的正负和数值大小在分类中的意义并证明之。

中科院-模式识别考题总结(详细答案)

1.简述模式的概念及其直观特性，模式识别的分类，有哪几种方法。

（6’）答（1）：什么是模式？广义地说，存在于时间和空间中可观察的物体，如果我们可以区别它们是否相同或是否相似，都可以称之为模式。

模式所指的不是事物本身，而是从事物获得的信息，因此，模式往往表现为具有时间和空间分布的信息。

模式的直观特性：可观察性；可区分性；相似性。

答（2）：模式识别的分类：假说的两种获得方法（模式识别进行学习的两种方法）：●监督学习、概念驱动或归纳假说；●非监督学习、数据驱动或演绎假说。

模式分类的主要方法：●数据聚类：用某种相似性度量的方法将原始数据组织成有意义的和有用的各种数据集。

是一种非监督学习的方法，解决方案是数据驱动的。

●统计分类：基于概率统计模型得到各类别的特征向量的分布，以取得分类的方法。

特征向量分布的获得是基于一个类别已知的训练样本集。

是一种监督分类的方法，分类器是概念驱动的。

●结构模式识别：该方法通过考虑识别对象的各部分之间的联系来达到识别分类的目的。

（句法模式识别）●神经网络：由一系列互相联系的、相同的单元（神经元）组成。

相互间的联系可以在不同的神经元之间传递增强或抑制信号。

增强或抑制是通过调整神经元相互间联系的权重系数来（weight）实现。

神经网络可以实现监督和非监督学习条件下的分类。

2.什么是神经网络？有什么主要特点？选择神经网络模式应该考虑什么因素？（8’）答（1）：所谓人工神经网络就是基于模仿生物大脑的结构和功能而构成的一种信息处理系统（计算机）。

由于我们建立的信息处理系统实际上是模仿生理神经网络，因此称它为人工神经网络。

这种网络依靠系统的复杂程度，通过调整内部大量节点之间相互连接的关系，从而达到处理信息的目的。

人工神经网络的两种操作过程：训练学习、正常操作（回忆操作）。

答（2）：人工神经网络的特点：●固有的并行结构和并行处理；●知识的分布存储；●有较强的容错性；●有一定的自适应性；人工神经网络的局限性：●人工神经网络不适于高精度的计算；●人工神经网络不适于做类似顺序计数的工作；●人工神经网络的学习和训练往往是一个艰难的过程；●人工神经网络必须克服时间域顺序处理方面的困难；●硬件限制；●正确的训练数据的收集。

大学模式识别考试题及答案详解完整版

大学模式识别考试题及答案详解HUA system office room 【HUA16H-TTMS2A-HUAS8Q8-HUAH1688】一、填空与选择填空（本题答案写在此试卷上，30分）1、模式识别系统的基本构成单元包括：模式采集、特征提取与选择和模式分类。

2、统计模式识别中描述模式的方法一般使用特真矢量；句法模式识别中模式描述方法一般有串、树、网。

3、聚类分析算法属于（1）；判别域代数界面方程法属于（3）。

（1）距离测度（2）模糊测度（3）相似测度（4）匹配测度5、下列函数可以作为聚类分析中的准则函数的有（1）（3）（4）。

（1）（2） (3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在（2）中进行。

（1）二维空间（2）一维空间（3）N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有（1）；线性可分、不可分都适用的有（3）。

（1）感知器算法（2）H-K算法（3）积累位势函数法8、下列四元组中满足文法定义的有（1）（2）（4）。

（1）({A, B}, {0, 1}, {A01, A 0A1 , A 1A0 , B BA , B 0}, A)（2）({A}, {0, 1}, {A0, A 0A}, A)（3）({S}, {a, b}, {S 00S, S 11S, S 00, S 11}, S)（4）({A}, {0, 1}, {A01, A 0A1, A 1A0}, A)二、(15分)简答及证明题（1）影响聚类结果的主要因素有那些？（2）证明马氏距离是平移不变的、非奇异线性变换不变的。

答：（1）分类准则，模式相似性测度，特征量的选择，量纲。

（2）证明：(2分)(2分)(1分)设，有非奇异线性变换：(1分)(4分)三、(8分)说明线性判别函数的正负和数值大小在分类中的意义并证明之。

模式识别习题及答案

模式识别习题及答案模式识别习题及答案模式识别是人类智能的重要组成部分，也是机器学习和人工智能领域的核心内容。

通过模式识别，我们可以从大量的数据中发现规律和趋势，进而做出预测和判断。

本文将介绍一些模式识别的习题，并给出相应的答案，帮助读者更好地理解和应用模式识别。

习题一：给定一组数字序列，如何判断其中的模式？答案：判断数字序列中的模式可以通过观察数字之间的关系和规律来实现。

首先，我们可以计算相邻数字之间的差值或比值，看是否存在一定的规律。

其次，我们可以将数字序列进行分组，观察每组数字之间的关系，看是否存在某种模式。

最后，我们还可以利用统计学方法，如频率分析、自相关分析等，来发现数字序列中的模式。

习题二：如何利用模式识别进行图像分类？答案：图像分类是模式识别的一个重要应用领域。

在图像分类中，我们需要将输入的图像分为不同的类别。

为了实现图像分类，我们可以采用以下步骤：首先，将图像转换为数字表示，如灰度图像或彩色图像的像素矩阵。

然后，利用特征提取算法，提取图像中的关键特征。

接下来，选择合适的分类算法，如支持向量机、神经网络等，训练模型并进行分类。

最后，评估分类结果的准确性和性能。

习题三：如何利用模式识别进行语音识别？答案：语音识别是模式识别在语音信号处理中的应用。

为了实现语音识别，我们可以采用以下步骤：首先，将语音信号进行预处理，包括去除噪声、降低维度等。

然后，利用特征提取算法，提取语音信号中的关键特征，如梅尔频率倒谱系数（MFCC）。

接下来，选择合适的分类算法，如隐马尔可夫模型（HMM）、深度神经网络（DNN）等，训练模型并进行语音识别。

最后，评估识别结果的准确性和性能。

习题四：如何利用模式识别进行时间序列预测？答案：时间序列预测是模式识别在时间序列分析中的应用。

为了实现时间序列预测，我们可以采用以下步骤：首先，对时间序列进行平稳性检验，确保序列的均值和方差不随时间变化。

然后，利用滑动窗口或滚动平均等方法，将时间序列划分为训练集和测试集。

模式识别习题解答第三章

题1：在一个10类的模式识别问题中，有3类单独满足多类情况1，其余的类别满足多类情况2。

问该模式识别问题所需判别函数的最少数目是多少？答：将10类问题可看作4类满足多类情况1的问题，可将3类单独满足多类情况1的类找出来，剩下的7类全部划到4类中剩下的一个子类中。

再在此子类中，运用多类情况2的判别法则进行分类，此时需要7*（7-1）/2=21个判别函数。

故共需要4+21=25个判别函数。

题2：一个三类问题，其判别函数如下：d1(x)=-x1, d2(x)=x1+x2-1, d3(x)=x1-x2-11.设这些函数是在多类情况1条件下确定的，绘出其判别界面和每一个模式类别的区域。

2.设为多类情况2，并使：d12(x)= d1(x), d13(x)= d2(x), d23(x)= d3(x)。

绘出其判别界面和多类情况2的区域。

3.设d1(x), d2(x)和d3(x)是在多类情况3的条件下确定的，绘出其判别界面和每类的区域。

答：三种情况分别如下图所示：1．2．3．题3：两类模式，每类包括5个3维不同的模式，且良好分布。

如果它们是线性可分的，问权向量至少需要几个系数分量？假如要建立二次的多项式判别函数，又至少需要几个系数分量？（设模式的良好分布不因模式变化而改变。

）答：（1）若是线性可分的，则权向量至少需要14N n =+=个系数分量；（2）若要建立二次的多项式判别函数，则至少需要5!102!3!N ==个系数分量。

题4：用感知器算法求下列模式分类的解向量w : ω1: {(0 0 0)T, (1 0 0)T, (1 0 1)T, (1 1 0)T} ω2: {(0 0 1)T, (0 1 1)T, (0 1 0)T, (1 1 1)T}解：将属于2w 的训练样本乘以(1)-，并写成增广向量的形式x1=[0 0 0 1]',x2=[1 0 0 1]',x3=[1 0 1 1]',x4=[1 1 0 1]';x5=[0 0 -1 -1]',x6=[0 -1 -1 -1]',x7=[0 -1 0 -1]',x8=[-1 -1 -1 -1]';迭代选取1C =，(1)(0,0,0,0)w '=，则迭代过程中权向量w 变化如下：(2)(0 0 0 1)w '=；(3)(0 0 -1 0)w '=；(4)(0 -1 -1 -1)w '=；(5)(0 -1 -1 0)w '=；(6)(1 -1 -1 1)w '=；(7)(1 -1 -2 0)w '=；(8)(1 -1 -2 1)w '=；(9)(2 -1 -1 2)w '=； (10)(2 -1 -2 1)w '=；(11)(2 -2 -2 0)w '=；(12)(2 -2 -2 1)w '=；收敛所以最终得到解向量(2 -2 -2 1)w '=，相应的判别函数为123()2221d x x x x =--+。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第一章绪论1.什么是模式？具体事物所具有的信息。

模式所指的不是事物本身，而是我们从事物中获得的___信息__。

2.模式识别的定义？让计算机来判断事物。

3.模式识别系统主要由哪些部分组成？数据获取—预处理—特征提取与选择—分类器设计/ 分类决策。

第二章贝叶斯决策理论1.最小错误率贝叶斯决策过程？答：已知先验概率，类条件概率。

利用贝叶斯公式得到后验概率。

根据后验概率大小进行决策分析。

2.最小错误率贝叶斯分类器设计过程？答：根据训练数据求出先验概率类条件概率分布利用贝叶斯公式得到后验概率如果输入待测样本X ，计算X 的后验概率根据后验概率大小进行分类决策分析。

3.最小错误率贝叶斯决策规则有哪几种常用的表示形式？答：4.贝叶斯决策为什么称为最小错误率贝叶斯决策？答：最小错误率Bayes 决策使得每个观测值下的条件错误率最小因而保证了（平均）错误率最小。

Bayes 决策是最优决策：即，能使决策错误率最小。

5.贝叶斯决策是由先验概率和（类条件概率）概率，推导（后验概率）概率，然后利用这个概率进行决策。

均值：∑==mi xi m x mean 11)( 方差：2)^(11)var(1∑=--=m i x xi m x 9.计算属性Marital Status 的类条件概率分布给表格计算，婚姻状况几个类别和分类几个就求出多少个类条件概率。

10，朴素贝叶斯分类器的优缺点？答：分类器容易实现。

面对孤立的噪声点，朴素贝叶斯分类器是健壮的。

因为在从数据中估计条件概率时。

这些点被平均。

面对无关属性，该分类器是健壮的。

相关属性可能降低分类器的性能。

因为对这些属性，条件独立的假设已不成立。

11.我们将划分决策域的边界称为(决策面)，在数学上用可以表示成(决策面方程) 12.用于表达决策规则的函数称为(判别函数)13.判别函数与决策面方程是密切相关的，且它们都由相应的决策规则所确定. 14.写出多元正态概率下的最小错误率贝叶斯决策的判别函数，即15.多元正态概率下的最小错误率贝叶斯决策的决策面方程为()()0i j g g -=x x16.多元正态概率下的最小错误率贝叶斯决策，当类条件概率分布的协方差矩阵为I ∧=∑2σi时，每类的协方差矩阵相等，且类内各特征间（相互独立），并具有相等的方差。

17.多元正态概率下的最小错误率贝叶斯决策，如果先验概率相等，并I ∧=∑2σi且i=1,2,...c ，那么分类问题转化为只要计算待测样本x 到各类均值的(欧式距离)，然后把x 归于具有（最小距离平方）的类。

这种分类器称为（最小距离分类器）。

18.19.多元正态概率下的最小错误率贝叶斯决策，类条件()ln((|)())i i i g p P ωω==x x 11212()()ln 2ln ln ()2T i i i i i dP πω-=--∑---∑+x μx μ概率密度各类的协方差矩阵不相等时，决策面是（超二次曲面），判别函数是（二次型）第三章概率密度函数的估计1.类条件概率密度估计的两种主要方法（参数估计）和（非参数估计）。

2.类条件概率密度估计的非参数估计有两种主要的方法（Parzen 窗法）和（KN 近邻法）。

它们的基本原理都是基于样本对分布的（未知）原则。

3.如果有N 个样本，可以计算样本邻域的体积V ，然后获得V 中的样本数k ，那么P(x)=VN K4.假设正常细胞和癌细胞的样本的类条件概率服从多元正态分布，使用最大似然估计方法，对概率密度的参数估计的结果为。

证明：使用最大似然估计方法，对一元正态概率密度的参数估计的结果如下：5.已知5个样本和2个属性构成的数据集中，w1类有3个样本，w2类有两个样本。

如果使用贝叶斯方法设计分类器，需要获得各类样本的条件概率分布，现假设样本服从多元正态分布则只需获得分布的参数均值向量和协方差矩阵即可，那么采用最大似然估计获得的w1类的类条件概率密度均值向量为（()3,2转置）,以及协方差矩阵为（⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡----422220202）。

第四章线性判别函数1.已知两类问题的样本集中，有两个样本。

属于类，属于类，对它们进行增广后，这两个样本的增广样本分别为 [ y1 =(1,1,-3,2)T,y2 =(-1,-1,-2,3)T ]2.广义线性判别函数主要是利用(映射)原理解决（普通函数不能解决的高次判别函数）问题，利用广义线性判别函数设计分类器可能导致（维数灾难）。

3.线性分类器设计步骤？主要步骤：1.收集训练数据集D={x1,x2,…,xN}2.按需要确定一个准则函数J(D,w,w0)或J(D,a)，其值反映分类器的性能，其极值解对应于“最好”决策。

3.用最优化技术求准则函数J 的极值解w*，w*或a*。

4.最终，得到线性判别函数，完成分类器设计5.线性判别函数g(x)的几何表示是：点x 到决策面H 的（距离的一种代数度量）。

6.增广样本向量使特征空间增加了（一）维，但样本在新的空间中保持了样本间的（欧氏距离）不变，对于分类效果也与原决策面相同。

在新的空间中决策面H 通过坐标（原点）7.Fisher 准则的基本原理为：找到一个最合适的投影轴，使_(类间)在该轴上投影之间的距离尽可能远，而（类内）的投影尽可能紧凑，从而使分类效果为最佳。

8.Fisher 准则函数的定义为 9Fisher 方法中，样本类内离散度矩阵Si 与总类内离散度矩阵Sw 分别为111ˆN k k x N μθ∧===∑22211ˆ()N k k x N σθμ∧∧===-∑(|)(,)1,2i i i p N i ω=∑=x μ1(1,3,2)T x =-2(1,2,3)Tx =-0()(*),()(*)T Tg x x w g x a y=+=w 12()b F S J w S S =+T b T w S S =w w w w()(), 1,2i T i i i D i ∈=--=∑x S x m x m 12w =+S S S10.利用Lagrange 乘子法使Fisher 线性判别的准则函数极大化，最终可以得到的判别函数权向量11.叙述Fisher 算法的基本原理。

Fisher 准则的基本原理：找到一个最合适的投影轴，使两类样本在该轴上投影之间的距离尽可能远，而每一类样本的投影尽可能紧凑，从而使分类效果为最佳。

1213.已知两类问题的样本集中，有两个样本。

属于w1类，属于w2类，对它们进行增广规范化后，这两个样本的规范化增广样本分别为y1=(1,1,-3,2)转置和y2=(1,-1,-2,3)转置。

14.叙述感知准则的梯度下降算法的基本过程。

答：1. 初值: 任意给定一向量初始值a(1)2. 迭代: 第k+1次迭代时的权向量a(k+1)等于第k 次的权向量a(k)加上被错分类的所有样本之和与pk 的乘积3. 终止: 对所有样本正确分类*112()w S -=-w m m 1(1,3,2)Tx =-2(1,2,3)Tx =-()()kT P Y J ∈=-∑y a a y15感知准则函数16线性判别函数g(x)的几何表示是：点x 到决策面H 的（距离的代数度量）17.感知机方法主要有两种，批量样本修正法与单样本修正法。

它们之间的区别是什么？答单样本修正法：样本集视为不断重复出现的序列，逐个样本检查，修正权向量批量样本修正法：样本成批或全部检查后，修正权向量 18.感知准则特点是随意确定权向量（初始值），在对样本分类训练过程中（逐步修正）权向量直至最终确定。

19.对于感知准则函数，满足（）的权向量称为解向量，解向量不止一个，而是由无穷多个解向量组成的解，称这样的区域为（解区域）。

20.感知准则函数为极小值时的a 为最优解证明使用梯度下降算法的迭代过程公式证明：21.下列哪种分类方法最不适用于样本集线性不可分情况：BA ．Fisher 线性判别的Lagrange 乘子法B ．感知准则的梯度下降算法C ．最小错分样本数准则的共轭梯度法D ．最小平方误差准则的梯度下降法22.多类问题可以利用求两类问题的方法来求解。

这样做的缺点是会造成(无法确定类别的区域增大)，需要训练的(子分类器及参数增多)。

23.利用最小平方误差准则函数进行分类器设计，主要是求极小化时的权向量。

当时，最小平方误差准则函数的解等价于(Bayes)线性判别的解。

24.叙述分类器错误率估计中的留一法的运算过程。

答：1.N 个样本，取N-1个样本作为训练集，设计分类器。

2.剩下的一个样本作为测试集，输入到分类器中，检验是否错分。

3.然后放回样本，重复上述过程，直到N 次，即每个样本都做了一次测试。

4.统计被错分的次数k, 作为错误率的估计率。

25利用两类问题的线性分类器解决多类问题常用的两种方法的优缺点。

答：优点：设计思想简单，容易实现。

缺点：（1）需要训练的子分类器或参数多，效率低。

（2）无法确定类别的区域多。

【造成该问题的根本原因是将多类问题看成了多个两类问题来解决。

这样必然造成阴影区域的出现。