2014年巴中市零诊断性试题

高三零诊考试数学试题（理科）

本试题卷分第Ⅰ卷（选择题）和第Ⅱ卷（非选择题）。第Ⅰ卷1至2页，第Ⅱ卷3至4页，共4页。考生作答时，须将答案答在答题卡上，在本试题卷、草稿纸上答题无效。满分150分。考试时间120分钟。

第Ⅰ卷（选择题共50分）

注意事项：

必须使用2B 铅笔在答题卡上将所选答案对应的标号涂黑。

一、选择题：本大题共10小题，每小题5分，共50分。在每小题给出的四个选项中，只有一个是符合题目要求的。 1、已知集合M={x |1+x ＞0}，N={x |

-11

＞0}，则M∩N= A.{x |-1≤x ＜1} B.{x |x ＞1} C.{x |-1＜x ＜1} D.{x |x ≥-1} 答案为：C

2、如果a ＜0，b ＞0，那么，下列不等式中正确的是 A.

a 1

1< B.b a <- C. a 2＜b 2 D. |a|＞|b|. 答案为：A

3、某几何体的正视图和侧视图均如图所示，则该几何体的俯视图不可能是（）

答案为：D

4、阅读如图所示的程序框图，运行相应的程序．如果输入某个正整数n 后，输出的S ∈(10,20)，那么n 的值为( )．

A ．3

B ．4

C ．5

D ．6 答案为：B

5、若|a |=1,|b |=2,c =a +b ,且c ⊥a ，则向量a 与b 的夹角为 A. 30° B. 60° C. 120° D. 150° 答案为：C

6、要得到函数y ＝cos(2x +1)的图象，只要将函数y ＝cos2x 的图象（） A ．向左平移1个单位 B ．向右平移1个单位 C ．向左平移

21个单位 D ．向右平移2

个单位

答案为：C

7、设变量x ，y 满足约束条件??

??-≥-≤+≥+144222y x y x y x ,则目标函数z ＝3x －y 的取值范围是

A ．［23-

，6］ B ．［2

-，－1］ C ．［－1,6］ D ．［－6，2

］答案为：A

8、将2名教师，4名学生分成2个小组，分别安排到甲、乙两地参加社会实践活动，每个小组由1名教师和2名学生组成，不同的安排方案共有（） A ．12种 B ．10种 C ．9种 D ．8种答案为：A

9、已知双曲线)0,0(122

22>>=-b a b

y a x 的左顶点与抛物线)0(22>=p px y 的焦点

的距离为4，且双曲线的一条渐近线与抛物线的准线的交点坐标为(－2，－1)，则双曲线的焦距为…( )

A ．32 B.52 C ．34 D.54 答案为：B

10、设S ，T 是R 的两个非空子集，如果存在一个从S 到T 的函数y ＝f (x )满足：（1）T ＝{f (x )|x ∈S }；（2）对任意x 1，x 2∈S ，当x 1＜x 2时，恒有f (x 1)＜f (x 2)，那么称这两个集合“保序同构”．以下集合对不是“保序同构”的是( )． A ．A ＝N *，B ＝N

B ．A ＝{x |－1≤x ≤3}，B ＝{x |x ＝－8或0＜x ≤10}

C ．A ＝{x |0＜x ＜1}，B ＝R

D ．A ＝Z ，B ＝Q 答案为：D

二、填空题：本大题共5小题，每小题5分，共25分。

11、在复平面内，复数i

-12对应的点的坐标为__________．答案为：(－1,1)

12、在6)2

x -的二项展开式中，常数项等于__________．

答案为：－160

13、设△ABC 的内角A ，B ，C 所对的边分别为a ，b ，c .若(a +b －c )(a +b +c )＝ab ，则角C ＝________. 答案为：

2π 14、已知函数???≥<+-=1,log ,

1,4)13()(x x x a x a x f a 满足对任意的实数21x x ≠都有

()(2

121<--x x x f x f 成立，则实数a 的取值范围为

答案为：)3

,71[

15、已知数列{n a }满足n a a a n n 2,3311=-=+，则

a n

的最小值为__________．答案为：

三、解答题：本大题共6小题，共75分。解答应写出文字说明，证明过程或演算步骤。 16、设函数f(x)＝cos(3

2π+x )+x 2sin

(1)求函数f(x)的最大值和最小正周期; (2)设A,B,C 为△ABC 的三个内角,若31cos =B , 4

)2(-=C f ,且C 为锐角, 求sinA.

答案为：解：(1)

所以当,即(k∈Z)时,

f(x)取得最大值,,f(x)的最小正周期,

故函数f(x)的最大值为最小正周期为π.

(2)由,即,

解得.又C 为锐角,所以

由求得.

因此sinA ＝sin ［π-(B+C)］＝sin(B+C)＝sinBcosC+cosBsinC

＝＝.

17、设{n a }是公比为正数的等比数列，.4,2231+==a a a

(1)求{n a }的通项公式；

(2)设{n b }是首项为1，公差为2的等差数列，求数列{n a ＋n b }的前n 项和S n . 答案为：解：(1)设q 为等比数列{a n }的公比，

则由a 1＝2，a 3＝a 2＋4得2q 2＝2q ＋4，即q 2－q －2＝0，解得q ＝2或q ＝－1(舍去)，因此q ＝2. 所以{a n }的通项为a n ＝2·2n －1＝2n (n ∈N *)．

(2)18、根据以往统计资料，某地车主购买甲种保险的概率为0.5，购买乙种保险但不购买甲种保险的概率为0.3.设各车主购买保险相互独立．（1）求该地1位车主至少购买甲、乙两种保险中的1种的概率；（2） X 表示该地的100位车主中，甲、乙两种保险都不购买的车主数，求X 的期望．

答案为：解：记A 表示事件：该地的1位车主购买甲种保险；

B 表示事件：该地的1位车主购买乙种保险但不购买甲种保险；

C 表示事件：该地的1位车主至少购买甲、乙两种保险中的1种；

D 表示事件：该地的1位车主甲、乙两种保险都不购买．（1）P (A )＝0.5，P (B )＝0.3，C ＝A ＋B ，

P (C )＝P (A ＋B )＝P (A )＋P (B )＝0.8.

（2）

，P (D )＝1－P (C )＝1－0.8＝0.2，

X ～B (100，0.2)，即X 服从二项分布，所以期望EX ＝100×0.2＝20.

19、如图，直三棱柱ABC －A 1B 1C 1中，AC ＝BC ＝

AA 1，D 是棱AA 1的中点，DC 1⊥BD ．

（1）证明：DC 1⊥BC ；

（2）求二面角A 1－BD －C 1的大小．

答案为：解：（1）证明：由题设知，三棱柱的侧面为矩形．由于D 为AA 1的中点，故DC ＝DC 1．

又，可得DC 12+DC 2＝CC 12，

所以DC 1⊥DC ．而DC 1⊥BD ，DC ∩BD ＝D ，所以DC 1⊥平面BCD ．

BC平面BCD，故DC

⊥BC．

（2）由（1）知BC⊥DC1，且BC⊥CC1，

则BC⊥平面ACC1，所以CA，CB，CC1两两相互垂直．

以C为坐标原点，的方向为x轴的正方向，为单位长，建立如图所示的空间直角坐标系C－xyz．

由题意知A1(1,0,2)，B(0,1,0)，D(1,0,1)，C1(0,0,2)．

则，，．

设n=(x，y，z)是平面A1B1BD的法向量，

则，即可取n＝(1,1,0)．

同理，设m是平面C1BD的法向量，

可取m＝(1，2，1).

故二面角A1－BD－C1的大小为30°

20、已知椭圆C:)0(12222>>=+b a b

y a x 的一个焦点为(0,5)，离心率为35

（1）求椭圆C 的标准方程；

（2）若动点P(00,y x )为椭圆C 外一点，且点P 到椭圆C 的两条切线相互垂直，求点P 的轨迹方程. 答案为：

94,33

55,512

2222=+∴=-==∴===

=y x C c a b a a a c e c 标准方程为椭圆）解：（（2）①若一切线垂直x 轴，则另一切线垂直于y 轴，则这样的点P 共有4个，它们的坐标分别为)2,3(),2,3(±±-.

②若两切线不垂直于坐标轴，设切线方程为)(00x x k y y -=-

即)(00x x k y y -+=，与椭圆方程14

2=+y x 联立，并整理得， 0]4)[(9)(18)49(2000022=--+-++kx y x kx y k x k ，

依题意，0=?，即0]4)[()49(36)()18(20022002=--?+--kx y k kx y k 即0)49(4)(42200=+--k kx y

.042)9(2

000220=-+--∴y k y x k x 两切线互相垂直，121-=∴k k

即

4202

0-=--x y ，132020=+∴y x ，

显然)2,3(),2,3(±±-这四点也满足方程132

020=+y x

132

020=+∴y x P 的轨迹方程为点 21、).0(ln )(>--=a x a x x f

（1）若1=a ，求)(x f 的单调区间及)(x f 的最小值；（2）若0>a ，求)(x f 的单调区间；

（3）试比较222222ln 33ln 22ln n

n +++ 与)1(2)12)(1(++-n n n 的大小)2(≥∈*n N n 且，并

证明你的结论.

答案为：解：,ln 1)(,1)1(x x x f a --== 当1≥x 时，.01

1)(,ln 1)('≥-

=--=x

x f x x x f )(x f ∴在区间),1[+∞上是递增的.

当10<

1)(,ln 1)('<-

-=--=x

x f x x x f )(x f ∴在区间（0,1）上是递减的

故1=a 时，)(x f 的递增区间为),1[+∞，递减区间为（0,1），.0)1()(m i n ==f x f

（2）①若,1≥a

当a x ≥时，.01

1)(,ln )('≥-

=--=x

x f x a x x f )(x f ∴在区间),[+∞a 上是递增的.

当a x <<0时，.01

1)(,ln )('<-

-=--=x

x f x x a x f )(x f ∴在区间),0(a 上是递减的

②若,10<

当a x ≥时，x

x x x f x a x x f 111)(,ln )('-=-

=--=，当1>x 时，,0)('>x f 当1<

则)(x f 在区间),1[+∞上是递增的，在区间)1,[a 上是递减的；当a x <<0时，.01

1)(,ln )('<-

-=--=x

x f x x a x f )(x f ∴在区间),0(a 上是递减的，而)(x f 在a x =处有意义，

则)(x f 在区间),1[+∞上是递增的，在区间上)1,0(是递减的.

综上，当1≥a 时，)(x f 的递增区间为),[+∞a ，递减区间为),0(a ；当10<

（3）由（1）可知，当1,1>=x a 时，有0ln 1>--x x ，即

x x 1

1ln -<， ∴22

2222ln 33ln 22ln n

n +++ 22211311211n -++-+-< =)13121(1222n n +++--

12)(1()1121(1++-=+---=n n n n n

故222222ln 33ln 22ln n

n +++ <)1(2)

12)(1(++-n n n ,2≥∈*n N n 且

模式识别试题答案

模式识别非学位课考试试题考试科目：模式识别考试时间考生姓名：考生学号任课教师考试成绩一、简答题（每题6分，12题共72分）： 1、监督学习和非监督学习有什么区别？参考答案：当训练样本的类别信息已知时进行的分类器训练称为监督学习，或者由教师示范的学习；否则称为非监督学习或者无教师监督的学习。 2、你如何理解特征空间？表示样本有哪些常见方法？参考答案：由利用某些特征描述的所有样本组成的集合称为特征空间或者样本空间，特征空间的维数是描述样本的特征数量。描述样本的常见方法：矢量、矩阵、列表等。 3、什么是分类器？有哪些常见的分类器？参考答案：将特征空中的样本以某种方式区分开来的算法、结构等。例如：贝叶斯分类器、神经网络等。 4、进行模式识别在选择特征时应该注意哪些问题？参考答案：特征要能反映样本的本质；特征不能太少，也不能太多；要注意量纲。 5、聚类分析中，有哪些常见的表示样本相似性的方法？参考答案：距离测度、相似测度和匹配测度。距离测度例如欧氏距离、绝对值距离、明氏距离、马氏距离等。相似测度有角度相似系数、相关系数、指数相似系数等。 6、你怎么理解聚类准则？参考答案：包括类内聚类准则、类间距离准则、类内类间距离准则、模式与类核的距离的准则函数等。准则函数就是衡量聚类效果的一种准则，当这种准则满足一定要求时，就可以说聚类达到了预期目的。不同的准则函数会有不同的聚类结果。 7、一种类的定义是：集合S 中的元素x i 和x j 间的距离d ij 满足下面公式： ∑∑∈∈≤-S x S x ij i j h d k k )1(1 ，d ij ≤ r ，其中k 是S 中元素的个数，称S 对于阈值h ，r 组成一类。请说明，该定义适合于解决哪一种样本分布的聚类？参考答案：即类内所有个体之间的平均距离小于h ，单个距离最大不超过r ，显然该定义适合团簇集中分布的样本类别。 8、贝叶斯决策理论中，参数估计和非参数估计有什么区别？参考答案：参数估计就是已知样本分布的概型，通过训练样本确定概型中的一些参数；非参数估计就是未知样本分布概型，利用Parzen 窗等方法确定样本的概率密度分布规律。 9、基于风险的统计贝叶斯决策理论中，计算代价[λij ]矩阵的理论依据是什么？假设这个矩阵是 M ?N ，M 和N 取决于哪些因素？

人工智能期末试题及答案完整版

xx学校 2012—2013学年度第二学期期末试卷考试课程：《人工智能》考核类型：考试A卷考试形式：开卷出卷教师：考试专业：考试班级：一单项选择题（每小题2分，共10分） 1.首次提出“人工智能”是在（D ）年 A.1946 B.1960 C.1916 D.1956 2. 人工智能应用研究的两个最重要最广泛领域为：B A.专家系统、自动规划 B. 专家系统、机器学习 C. 机器学习、智能控制 D. 机器学习、自然语言理解 3. 下列不是知识表示法的是 A 。 A：计算机表示法B：“与/或”图表示法 C：状态空间表示法D：产生式规则表示法 4. 下列关于不确定性知识描述错误的是 C 。 A：不确定性知识是不可以精确表示的 B：专家知识通常属于不确定性知识 C：不确定性知识是经过处理过的知识 D：不确定性知识的事实与结论的关系不是简单的“是”或“不是”。 5. 下图是一个迷宫，S0是入口，S g是出口，把入口作为初始节点，出口作为目标节点，通道作为分支，画出从入口S0出发，寻找出口Sg的状态树。根据深度优先搜索方法搜索的路径是 C 。 A：s0-s4-s5-s6-s9-sg B：s0-s4-s1-s2-s3-s6-s9-sg C：s0-s4-s1-s2-s3-s5-s6-s8-s9-sg D：s0-s4-s7-s5-s6-s9-sg 二填空题（每空2分，共20分） 1.目前人工智能的主要学派有三家：符号主义、进化主义和连接主义。 2. 问题的状态空间包含三种说明的集合，初始状态集合S 、操作符集合F以及目标

状态集合G 。 3、启发式搜索中，利用一些线索来帮助足迹选择搜索方向，这些线索称为启发式(Heuristic)信息。 4、计算智能是人工智能研究的新内容，涉及神经计算、模糊计算和进化计算等。 5、不确定性推理主要有两种不确定性，即关于结论的不确定性和关于证据的不确定性。三名称解释（每词4分，共20分）人工智能专家系统遗传算法机器学习数据挖掘答：（1）人工智能人工智能(Artificial Intelligence) ，英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等（2）专家系统专家系统是一个含有大量的某个领域专家水平的知识与经验智能计算机程序系统,能够利用人类专家的知识和解决问题的方法来处理该领域问题.简而言之,专家系统是一种模拟人类专家解决领域问题的计算机程序系统（3）遗传算法遗传算法是一种以“电子束搜索”特点抑制搜索空间的计算量爆炸的搜索方法，它能以解空间的多点充分搜索，运用基因算法，反复交叉，以突变方式的操作，模拟事物内部多样性和对环境变化的高度适应性，其特点是操作性强，并能同时避免陷入局部极小点，使问题快速地全局收敛，是一类能将多个信息全局利用的自律分散系统。运用遗传算法(GA)等进化方法制成的可进化硬件(EHW)，可产生超出现有模型的技术综合及设计者能力的新颖电路，特别是GA独特的全局优化性能，使其自学习、自适应、自组织、自进化能力获得更充分的发挥，为在无人空间场所进行自动综合、扩展大规模并行处理(MPP)以及实时、灵活地配置、调用基于EPGA的函数级EHW，解决多维空间中不确定性的复杂问题开通了航向（4）机器学习机器学习(Machine Learning)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎（5）数据挖掘数据挖掘是指从数据集合中自动抽取隐藏在数据中的那些有用信息的非平凡过程，这些信息的表现形式为：规则、概念、规律及模式等。它可帮助决策者分析历史数据及当前数据，并从中发现隐藏的关系和模式，进而预测未来可能发生的行为。数据挖掘的

模式识别试题

一、试问“模式”与“模式类”的含义。如果一位姓王的先生是位老年人，试问“王先生”和“老头”谁是模式，谁是模式类？二、试说明Mahalanobis距离平方的定义，到某点的Mahalanobis距离平方为常数的轨迹的几何意义，它与欧氏距离的区别与联系。三、试说明用监督学习与非监督学习两种方法对道路图像中道路区域的划分的基本做法，以说明这两种学习方法的定义与它们间的区别。四、试述动态聚类与分级聚类这两种方法的原理与不同。五、如果观察一个时序信号时在离散时刻序列得到的观察量序列表示为，而该时序信号的内在状态序列表示成。如果计算在给定O条件下出现S的概率，试问此概率是何种概率。如果从观察序列来估计状态序列的最大似然估计，这与Bayes 决策中基于最小错误率的决策有什么关系。六、已知一组数据的协方差矩阵为，试问 1．协方差矩阵中各元素的含义。 2．求该数组的两个主分量。 3．主分量分析或称K-L变换，它的最佳准则是什么？ 4．为什么说经主分量分析后，消除了各分量之间的相关性。七、试说明以下问题求解是基于监督学习或是非监督学习： 1. 求数据集的主分量非 2. 汉字识别有 3. 自组织特征映射非 4. CT图像的分割非八、试列举线性分类器中最著名的三种最佳准则以及它们各自的原理。九、在一两维特征空间，两类决策域由两条直线H1和H2分界，其中而包含H1与H2的锐角部分为第一类，其余为第二类。试求： 1．用一双层感知器构造该分类器 2．用凹函数的并构造该分类器十、设有两类正态分布的样本基于最小错误率的贝叶斯决策分界面，分别为X2=0，以及X1=3，其中两类的协方差矩阵，先验概率相等，并且有，。试求：以及。

【模式识别】期末考试复习资料

题型： 1.填空题5题填空题 2.名词解释4题 3.问答题4题 4.计算作图题3题 5.综合计算题1题备注1：没有整理第一章和第六章，老师说不考的备注2：非线性判别函数相关概念P69 概率相关定义、性质、公式P83以后最小错误率贝叶斯决策公式P85 最小风险贝叶斯P86 正态贝叶斯P90 综合计算有可能是第六次作业一、填空题物以类聚人以群分体现的是聚类分析的基本思想。模式识别分类：1.从实现方法来分模式识别分为监督分类和非监督分类；2.从理论上来分，有统计模式识别，统计模式识别，模糊模式识别，神经网络模式识别法聚类分析是按照不同对象之间的差异，根据距离函数的规律做模式分类的。模式的特性：可观察性、可区分性、相似性模式识别的任务：一是研究生物体（包括人）是如何感知对象的，二是如何用计算机实现模式识别的理论和方法。计算机的发展方向：1.神经网络计算机－－模拟人的大脑思维；2.生物计算机－－运用生物工程技术、蛋白分子作芯片； 3.光计算机－－用光作为信息载体，通过对光的处理来完成对信息的处理。训练学习方法：监督学习、无监督学习（无先验知识，甚至类别数也未知）。统计模式识别有：1.聚类分析法（非监督）；2.判决函数法/几何分类法(监督)；3.基于统计决策的概率分类法 - 以模式集在特征空间中分布的类概率密度函数为基础，对总体特征进行研究，以取得分类的方法数据的标准化目的：消除各个分量之间数值范围大小对算法的影响模式识别系统的基本构成：书P7 聚类过程遵循的基本步骤：特征选择；近邻测度；聚类准则；聚类算法；结果验证；结果判定。相似测度基础：以两矢量的方向是否相近作为考虑的基础,矢量长度并不重要。确定聚类准则的两种方式：阈值准则，函数准则基于距离阈值的聚类算法——分解聚类：近邻聚类法；最大最小距离聚类法类间距离计算准则:1）最短距离法2）最长距离法3）中间距离法4）重心法5）类平均距离法6）离差平方和法P24 系统聚类法——合并的思想用于随机模式分类识别的方法，通常称为贝叶斯判决。 BAYES 决策常用的准则：最小错误率；最小风险错误率的计算或估计方法：①按理论公式计算；②计算错误率上界；③实验估计。

中科院-模式识别考题总结(详细答案)

1.简述模式的概念及其直观特性，模式识别的分类，有哪几种方法。（6’）答（1）：什么是模式？广义地说，存在于时间和空间中可观察的物体，如果我们可以区别它们是否相同或是否相似，都可以称之为模式。模式所指的不是事物本身，而是从事物获得的信息，因此，模式往往表现为具有时间和空间分布的信息。模式的直观特性：可观察性；可区分性；相似性。答（2）：模式识别的分类：假说的两种获得方法（模式识别进行学习的两种方法）： ●监督学习、概念驱动或归纳假说； ●非监督学习、数据驱动或演绎假说。模式分类的主要方法： ●数据聚类：用某种相似性度量的方法将原始数据组织成有意义的和有用的各种数据集。是一种非监督学习的方法，解决方案是数据驱动的。 ●统计分类：基于概率统计模型得到各类别的特征向量的分布，以取得分类的方法。特征向量分布的获得是基于一个类别已知的训练样本集。是一种监督分类的方法，分类器是概念驱动的。 ●结构模式识别：该方法通过考虑识别对象的各部分之间的联系来达到识别分类的目的。（句法模式识别） ●神经网络：由一系列互相联系的、相同的单元（神经元）组成。相互间的联系可以在不同的神经元之间传递增强或抑制信号。增强或抑制是通过调整神经元相互间联系的权重系数来（weight）实现。神经网络可以实现监督和非监督学习条件下的分类。 2.什么是神经网络？有什么主要特点？选择神经网络模式应该考虑什么因素？（8’）答（1）：所谓人工神经网络就是基于模仿生物大脑的结构和功能而构成的一种信息处理系统（计算机）。由于我们建立的信息处理系统实际上是模仿生理神经网络，因此称它为人工神经网络。这种网络依靠系统的复杂程度，通过调整内部大量节点之间相互连接的关系，从而达到处理信息的目的。人工神经网络的两种操作过程：训练学习、正常操作（回忆操作）。答（2）：人工神经网络的特点： ●固有的并行结构和并行处理； ●知识的分布存储； ●有较强的容错性； ●有一定的自适应性；人工神经网络的局限性： ●人工神经网络不适于高精度的计算； ●人工神经网络不适于做类似顺序计数的工作； ●人工神经网络的学习和训练往往是一个艰难的过程； ●人工神经网络必须克服时间域顺序处理方面的困难； ●硬件限制； ●正确的训练数据的收集。答（3）：选取人工神经网络模型，要基于应用的要求和人工神经网络模型的能力间的匹配，主要考虑因素包括：

清华大学模式识别往年考题2

模式识别张长水2007.7.1 14:00-16:00 1 （15分）两类分类问题，P(w1)=1/4，P(w2)=3/4。样本有两个特征，分别是x和y。两类?的概率密度函数：w1，在0<=x<=3、0<=y<=3中均匀分布，其余为0；w2，在2<=x<=5、1<=y<=7 中均匀分布，其余为0。请设计做小错误率贝叶斯分类器，并计算误分率。 2 （20分）支持向量机通过二次最优化得到支持向量。现在有一个两类分类问题，共有N 个样本，样本有d维特征空间，样本集合是线性可分的。试使用遗传算法求解支持向量，说明算法步骤和使用的遗传算子。使用遗传算法求解支持向量有什么优缺点？ 3 （20分）两类分类问题，有3个特征x,y,z，共有N个样本。通过经验知道将3个特征进行加权相加得到的特征将具有更好的分类性能，但是不知道如何得到各个特征的权重。试回答? 如何得到各个特征的权重。给出必要的计算和推导过程。 4 （15分）使用多级聚类算法对下面的样本进行聚类，使用最近距离量度。给出计算过程，多级聚类树。问应该分成几类，为什么？举例说明使用最近距离量度聚类和使用最远距离量度聚类各自的优缺点。 (1,0) (2,0) (0,2) (1,3) (0,5) 5 （20分）距离是模式识别中的重要概念，试说明贝叶斯分类器、近邻法、Fisher投影法、C均值算法是否受不同距离量度选择的影响。如果不是，说明原因；如果是，举例说明受什么影响。 6 （10分）一个袋子中装有红、绿、蓝三种颜色的球，采用有放回的取球方法，取出N个球，其中有n1个红色球、n2个绿色球和n3个蓝色球的概率为 p(n1,n2,n3)=(N!/(n1!n2!n3!))*p1^n1*p2^n2*p3^n3 其中n1+n2+n3=N，p1+p2+p3=1 已知概率模型如下：p1=1/4 p2=1/4+p/4 p3=1/2-p/4 如果一个人是红绿色盲，分不清红色球和绿色球，那么他只能知道他取了m1=n1+n2个红/绿球，和m2=n3个蓝色球。试通过这些数据估计概率模型中的p，并估计红色球和绿色球的数? 。 -------------------------------- 不出意外的话应该是在清华最后一门考试了，复习的时候又极其痛苦，500+张ppt，很多公式要理解要背，所以得纪念一下，粗略回忆一下今天考的内容，给后面的同

中科大模式识别试题

中国科学技术大学模式识别试题（2012年春季学期）姓名：学号：成绩：一、填空与选择填空（本题答案写在此试卷上，30分） 1、模式识别系统的基本构成单元包括：、和。 2、统计模式识别中描述模式的方法一般使用；句法模式识别中模式描述方法一般有、、。 3、聚类分析算法属于；判别域代数界面方程法属于。（1）无监督分类 (2)有监督分类（3）统计模式识别方法（4）句法模式识别方法 4、若描述模式的特征量为0-1二值特征量，则一般采用进行相似性度量。（1）距离测度（2）模糊测度（3）相似测度（4）匹配测度 5、下列函数可以作为聚类分析中的准则函数的有。（1） (4) 6、Fisher线性判别函数的求解过程是将N维特征矢量投影在中进行。（1）二维空间（2）一维空间（3）N-1维空间 7、下列判别域界面方程法中只适用于线性可分情况的算法有；线性可分、不可分都适用的有。（1）感知器算法（2）H-K算法（3）积累位势函数法 8、下列四元组中满足文法定义的有。（1）({A, B}, {0, 1}, {A→01, A→ 0A1 , A→ 1A0 , B→BA , B→ 0}, A) （2）({A}, {0, 1}, {A→0, A→ 0A}, A) （3）({S}, {a, b}, {S → 00S, S → 11S, S → 00, S → 11}, S) （4）({A}, {0, 1}, {A→01, A→ 0A1, A→ 1A0}, A) 二、(15分)简答及证明题（1）影响聚类结果的主要因素有那些？（2）证明马氏距离是平移不变的、非奇异线性变换不变的。（3）画出对样本集 ω1：{(0,0,0)T, (1,0,0)T, (1,0,1)T, (1,1,0)T,} PDF 文件使用 "pdfFactory Pro" 试用版本创建https://www.360docs.net/doc/a010336865.html,

模式识别与机器学习期末考查试题及参考答案(20210221222717)

模式识别与机器学习期末考查试卷研究生姓名：入学年份：导师姓名：试题1：简述模式识别与机器学习研究的共同问题和各自的研究侧重点。答：（1）模式识别是研究用计算机来实现人类的模式识别能力的一门学科，是指对表征事物或现象的各种形式的信息进行处理和分析，以对事物或现象进行描述、辨认、分类和解释的过程。主要集中在两方面，一是研究生物体（包括人）是如何感知客观事物的，二是在给定的任务下，如何用计算机实现识别的理论和方法。机器学习则是一门研究怎样用计算机来模拟或实现人类学习活动的学科，是研究如何使机器通过识别和利用现有知识来获取新知识和新技能。主要体现以下三方面：一是人类学习过程的认知模型；二是通用学习算法；三是构造面向任务的专用学习系统的方法。两者关心的很多共同问题，如：分类、聚类、特征选择、信息融合等，这两个领域的界限越来越模糊。机器学习和模式识别的理论和方法可用来解决很多机器感知和信息处理的问题，其中包括图像/ 视频分析（文本、语音、印刷、手写）文档分析、信息检索和网络搜索等。（2）机器学习和模式识别是分别从计算机科学和工程的角度发展起来的，各自的研究侧重点也不同。模式识别的目标就是分类，为了提高分类器的性能，可能会用到机器学习算法。而机器学习的目标是通过学习提高系统性能，分类只是其最简单的要求，其研究更

侧重于理论，包括泛化效果、收敛性等。模式识别技术相对比较成熟了，而机器学习中一些方法还没有理论基础，只是实验效果比较好。许多算法他们都在研究，但是研究的目标却不同。如在模式识别中研究所关心的就是其对人类效果的提高，偏工程。而在机器学习中则更侧重于其性能上的理论证明。试题2：列出在模式识别与机器学习中的常用算法及其优缺点。答：（1）K 近邻法算法作为一种非参数的分类算法，它已经广泛应用于分类、回归和模式识别等。在应用算法解决问题的时候，要注意的两个方面是样本权重和特征权重。优缺点：非常有效，实现简单，分类效果好。样本小时误差难控制，存储所有样本，需要较大存储空间，对于大样本的计算量大。（2）贝叶斯决策法贝叶斯决策法是以期望值为标准的分析法，是决策者在处理风险型问题时常常使用的方法。优缺点：由于在生活当中许多自然现象和生产问题都是难以完全准确预测的，因此决策者在采取相应的决策时总会带有一定的风险。贝叶斯决策法就是将各因素发生某种变动引起结果变动的概率凭统计资料或凭经验主观地假设，然后进一步对期望值进行分析，由于此概率并不能证实其客观性，故往往是主观的和人为的概率，本身带有一定的风险性和不肯定性。虽然用期望的大小进行判断有一些风险，但仍可以认为贝叶斯决策是一种兼科学性和实效性于一身的比较完善的用于解决风险型决策问题的方法，在实际中能够广泛应

2017年北京邮电大学模式识别期末考试试题

北京邮电大学2016——2017学年第二学期《模式识别》期末考试试题（A卷） ①写出后验概率的表达式，描述它和先验概率的区别。 ②写出线性判别函数的表达式，画图指出参数的物理意义，描述它和神经元模型的联系。 ③为什么说SVM是最优线性分类器，它相比感知器算法的优点是? ④Logistic Regression的优化表达式，它的功能与SVM的作用有什么区别?

⑤单层神经网络有什么局限性?如何将其扩展处理复杂的非线性分类问题? ⑥多层神经网络的主流参数学习算法是什么?试用个公式说明参数学习的原理。 ⑦针对图像处理和识别设计的神经网络是什么?为什么它的参数数量远小于全连接网络? ⑧主成分分析获得的特征有什么特点?主成分投影基向量与博里叶变换基函数有什么区别? ⑨当误差数值的符合什么分布时，我们常用的均方误差是理论最优的?为什么? ⑩当需要衡量两个分布的误差时，一般采用什么物理量作为损失函数?试写出该函数形式。

二、技术应用速答题(每题答案不超过10字，1分*10): ①根据用户画像(上网特征)预测用户购买某类商品的概准，用什么方法? ②为了获得两类分类任务中最靠谱的投影特征，用什么方法? ③两类特征的类条件密度函数未知，对测试样本分类并求出后验概率，用什么方法? ④在训练样本数量较少的两类分类任务中，一般认为什么方法是最靠谱的? ⑤在高维数据分析任务中，什么方法是最常用的数据进行降维方法? ⑥系统要对多类样本进行分类，而手上的分类器只能处理两类，如何扩展? ⑦当采用线性SVM分类器的分类效果较差，应该首先试验什么改进分类器? ⑧我们常用的正态分布的均值和方差公式，是用什么算法估计出来的?. ⑨得到一批无标记(类别标签的)数据，用什么算法可以对其进行自动“分类” ⑩深度学习或者深度神经网络中的“深度”是指

模式识别复习题1

模式识别复习题 1. 简单描述模式识别系统的基本构成（典型过程）？ 2. 什么是监督模式识别（学习）？什么是非监督模式识别（学习）？对一副道路图像，希望把道路部分划分出来，可以采用以下两种方法： (1). 在该图像中分别在道路部分与非道路部分画出一个窗口，把在这两个窗口中的象素数据作为训练集，用某种判别准则求得分类器参数，再用该分类器对整幅图进行分类。 (2)．将整幅图的每个象素的属性记录在一张数据表中，然后用某种方法将这些数据按它们的自然分布状况划分成两类。因此每个象素就分别得到相应的类别号，从而实现了道路图像的分割。试问以上两种方法哪一种是监督学习，哪个是非监督学习？ 3. 给出一个模式识别的例子。 4. 应用贝叶斯决策的条件是什么？列出几种常用的贝叶斯决策规则，并简单说明其规则. 5. 分别写出在以下两种情况：（1）12(|)(|)P x P x ωω=；（2）12()() P P ωω=下的最小错误率贝叶斯决策规则。 6. （教材P17 例2.1） 7. （教材P20 例2.2），并说明一下最小风险贝叶斯决策和最小错误率贝叶斯决策的关系。 8. 设在一维特征空间中有两类服从正态分布的样本， 12122,1,3,σσμμ====两类先验概率之比12(),() P e P ωω= 试确定按照最小错误率贝叶斯决策规则的决策分界面的x 值。

9. 设12{,,...,}N x x x =X 为来自点二项分布的样本集，即 1(,),0,1,01,1x x f x P P Q x P Q P -==≤≤=-，试求参数P 的最大似然估计量?P 。 10. 假设损失函数为二次函数2??(,)()P P P P λ=-，P 的先验密度为均匀分布，即()1,01f P P =≤≤。在这样的假设条件下，求上题中的贝叶斯估计量?P 。 11. 设12{,,...,}N x x x =X 为来自(|)p x θ的随机样本，其中0x θ≤≤时， 1 (|)p x θθ=，否则为0。证明θ的最大似然估计是max k k x 。 12. 考虑一维正态分布的参数估计。设样本（一维）12,,...,N x x x 都是由独立的抽样试验采集的，且概率密度函数服从正态分布，其均值μ和方差2σ未知。求均值和方差的最大似然估计。 13. 设一维样本12{,,...,}N x x x =X 是取自正态分布2(,)N μσ的样本集，其中均值μ为未知的参数，方差2σ已知。未知参数μ是随机变量，它的先验分布也是正态分布200(,)N μσ，200,μσ为已知。求μ的贝叶斯估计 ?μ 。 14. 什么是概率密度函数的参数估计和非参数估计？分别列去两种参数估计方法和非参数估计方法。 15. 最大似然估计和Parzen 窗法的基本原理？

模式识别试题及总结

一、填空与选择填空（本题答案写在此试卷上，30分） 1、模式识别系统的基本构成单元包括：模式采集、特征提取与选择和模式分类。 2、统计模式识别中描述模式的方法一般使用特真矢量；句法模式识别中模式描述方法一般有串、树、网。 3、聚类分析算法属于（1）；判别域代数界面方程法属于（3）。（1）无监督分类 (2)有监督分类（3）统计模式识别方法（4）句法模式识别方法 4、若描述模式的特征量为0-1二值特征量，则一般采用（4）进行相似性度量。（1）距离测度（2）模糊测度（3）相似测度（4）匹配测度 5、下列函数可以作为聚类分析中的准则函数的有（1）（3）（4）。（1）（2） (3) (4) 6、Fisher线性判别函数的求解过程是将N维特征矢量投影在（2）中进行。（1）二维空间（2）一维空间（3）N-1维空间 7、下列判别域界面方程法中只适用于线性可分情况的算法有（1）；线性可分、不可分都适用的有（3）。（1）感知器算法（2）H-K算法（3）积累位势函数法 8、下列四元组中满足文法定义的有（1）（2）（4）。（1）({A, B}, {0, 1}, {A→01, A→ 0A1 , A→ 1A0 , B→BA , B→ 0}, A) （2）({A}, {0, 1}, {A→0, A→ 0A}, A) （3）({S}, {a, b}, {S → 00S, S → 11S, S → 00, S → 11}, S) （4）({A}, {0, 1}, {A→01, A→ 0A1, A→ 1A0}, A) 9、影响层次聚类算法结果的主要因素有（计算模式距离的测度、（聚类准则、类间距离门限、预定的类别数目））。 10、欧式距离具有（ 1、2 ）；马式距离具有（1、2、3、4 ）。（1）平移不变性（2）旋转不变性（3）尺度缩放不变性（4）不受量纲影响的特性 11、线性判别函数的正负和数值大小的几何意义是（正（负）表示样本点位于判别界面法向量指向的正（负）半空间中；绝对值正比于样本点到判别界面的距离。）。 12、感知器算法1。（1）只适用于线性可分的情况；（2）线性可分、不可分都适用。

模式识别试题

《模式识别》试题答案（A卷）一、填空与选择填空（本题答案写在此试卷上，30分） 1、影响层次聚类算法结果的主要因素有（计算模式距离的测度、（聚类准则、类间距离门限、预定的类别数目））。 2、欧式距离具有（ 1、2 ）；马式距离具有（1、2、 3、4 ）。（1）平移不变性（2）旋转不变性（3）尺度缩放不变性（4）不受量纲影响的特性 3、线性判别函数的正负和数值大小的几何意义是（正（负）表示样本点位于判别界面法向量指向的正（负）半空间中；绝对值正比于样本点到判别界面的距离。）。 4、感知器算法1。（1）只适用于线性可分的情况；（2）线性可分、不可分都适用。 5、积累势函数法较之于H-K算法的优点是（该方法可用于非线性可分情况（也可用于线性可分情况））；位势函数K(x,x k)与积累位势函数K(x)的关系为（ ∑ ∈ = X x x x K x K ~ k k k ) , ( ) ( α ）。 6、在统计模式分类问题中，聂曼-皮尔逊判决准则主要用于（某一种判决错误较另一种判决错误更为重要）情况；最小最大判决准则主要用于（先验概率未知的）情况。 7、“特征个数越多越有利于分类”这种说法正确吗？（错误）。特征选择的主要目的是（从n个特征中选出最有利于分类的的m个特征（m>n ）的条件下，可以使用分支定界法以减少计算量。 8、散度Jij越大，说明i类模式与j类模式的分布（差别越大）；当i类模式与j类模式的分布相同时，Jij=（0）。 9、已知有限状态自动机Af=(，Q，，q0，F)，={0，1}；Q={q0，q1}；：(q0，0)= q1， (q0，1)= q1，(q1，0)=q0，(q1，1)=q0；q0=q0；F={q0}。现有输入字符串：(a) 00011101011， (b) 1100110011，(c) 101100111000，(d)0010011，试问，用Af对上述字符串进行分类的结果为（ω1:{a,d};ω2:{b,c} ）。二、（15分）在目标识别中，假定类型1为敌方目标，类型2为诱饵（假目标），已知先验概率 P(1)=0.2和P(2)=0.8，类概率密度函数如下： x 0 x < 1 x 1 1 x < 2 p(x1)= 2 x 1 x 2 p(x2)= 3 x 2 x 3 0 其它 0 其它（1）求贝叶斯最小误判概率准则下的判决域，并判断样本x=1.5属于哪一类（2）求总错误概率P(e)；（3）假设正确判断的损失11=22=0，误判损失分别为12和21，若采用最小损失判决准则，12和21满足怎样的关系时，会使上述对x=1.5的判断相反？

模式识别试题2

《模式识别》试题库一、基本概念题 1模式识别的三大核心问题是：（）、（）、（）。 2、模式分布为团状时，选用（）聚类算法较好。 3 欧式距离具有（）。马式距离具有（）。（1）平移不变性（2）旋转不变性（3）尺度缩放不变性（4）不受量纲影响的特性 4 描述模式相似的测度有( )。（1）距离测度（2）模糊测度（3）相似测度（4）匹配测度 5 利用两类方法处理多类问题的技术途径有：（1）（2）（3）。其中最常用的是第( )个技术途径。 6 判别函数的正负和数值大小在分类中的意义是：( )。 7 感知器算法 ( )。（1）只适用于线性可分的情况；（2）线性可分、不可分都适用。 8 积累位势函数法的判别界面一般为( )。（1）线性界面；（2）非线性界面。 9 基于距离的类别可分性判据有：( ).（1）1[]w B Tr S S - （2） B W S S （3） B W B S S S + 10 作为统计判别问题的模式分类，在（）情况下，可使用聂曼-皮尔逊判决准则。 11 确定性模式非线形分类的势函数法中，位势函数K(x,xk)与积累位势函数K(x)的关系为（）。 12 用作确定性模式非线形分类的势函数法，通常，两个n 维向量x 和xk 的函数K(x,xk)若同时满足下列三个条件，都可作为势函数。①（）； ②（）；③ K(x,xk)是光滑函数，且是x 和xk 之间距离的单调下降函数。 13 散度Jij 越大，说明i 类模式与j 类模式的分布（）。当i 类模式与j 类模式的分布相同时，Jij=（）。 14 若用Parzen 窗法估计模式的类概率密度函数，窗口尺寸h1过小可能产生的问题是（），h1过大可能产生的问题是（）。 15 信息熵可以作为一种可分性判据的原因是：( )。 16作为统计判别问题的模式分类，在（）条件下，最小损失判决规则与最小错误判决规则是等价的。 17 随机变量l(x )=p(x 1)/p(x 2)，l(x )又称似然比，则E l( x )2= （）。在最小误判概率准则下，对数似然比Bayes 判决规则为（）。 18 影响类概率密度估计质量的最重要因素（）。 19 基于熵的可分性判据定义为)]|(log )|([1x P x P E J i c i i x H ωω∑=-=，JH 越（），说明模式的可分性越强。当P(i| x ) =（）(i=1,2,…,c)时，JH 取极大值。 20 Kn 近邻元法较之于Parzen 窗法的优势在于（）。上述两种算法的共同弱点主要是（）。 21 已知有限状态自动机Af=(，Q ，，q0，F)，={0，1}；Q={q0，q1}；：(q0， 0)= q1，(q0，1)= q1，(q1，0)=q0，(q1，1)=q0；q0=q0；F={q0}。现有输入字符串：(a) 000，(b) 11，(c) ，(d)0010011，试问，用Af 对上述字符串进行分

【模式识别】期末考试试卷02

《模式识别》期末考试试题（ A ）一、填空题（ 15 个空，每空 2 分，共 30 分） 1 ．基于机器学习的模式识别系统通常由两个过程组成 , 即（）和分类判决。 2 ．统计模式识别把观察对象表达为一个随机向量 (即特征向量 ), 将 ( ) 表达为由有穷或无穷个具有相似数值特性的模式组成的集合。 3 ．特征一般有两种表达方法 : (1)将特征表达为 ( )； (2)将特征表达为基元。 4 ．特征提取是指采用变换或映射实现由模式测量空间向 ( )的转变。 5 ．同一类模式类样本的分布比较集中，没有或临界样本很少，这样的模式类称为 ( )。 6 ．加权空间的所有 ( )都通过坐标原点。 7．线性多类判别：若每两个模式类间可用判别平面分开，在这种情况下， M 类有 ( )个判别函数 ,存在有不确定区域。 8 ．当取 ( )损失函数时 , 最小风险贝叶斯判决准则等价于最大后验概率判决准则。 9．Neyman-Pearson 决策的基本思想是 ( )某一错误率，同时追求另一错误率最小。 10．聚类 /集群：用事先不知样本的类别，而利用样本的先验知识来构造分类器属于 ( )学习。 11．相似性测度、 ( )和聚类算法称为聚类分析的三要素。 12． K/C 均值算法使用的聚类准则函数是 ( )准则，通过反复迭代优化聚类结果，使所有样本到各自所属类别的中心的距离平方和达到最小。 13．根据神经元的不同连接方式，可将神经网络分为分层网络和相互连接型网络两大类。其中分层网络可细分为前向网络、具有反馈的前向网络和 ( )三种互连方式。 14．神经网络的特性及能力主要取决于 ( )及学习方法。 15． BP 神经网络是采用误差反向传播算法的多层前向网络，其中，神经元的传输函数为是一种 ( )映射关系。二、简答题（ 2 题，每小题 10 分，共 20 分） S 型函数，网络的输入和输出 1．简述有监督分类方法和无监督分类方法的主要区别。 1 1/ 2 2．已知一组数据的协方差矩阵为，试问： 1/2 1 (1) 协方差矩阵中各元素的含义是什么？ (2) K-L 变换的最佳准则是什么？ (3) 为什么说经 K-L 变换后消除了各分量之间的相关性？三、计算题(2 题，每小题 13 分，共 26 分 ) 1．设有两类样本，两类样本的类内离散度矩阵分别为 S 1 1/ 2 ， S 1 1/ 2 ，各类样本均值分别为 1 1/ 2 1 2 1/ 2 1 T T μ1 2 0 和 μ2 2 2 ，试用 Fisher 准则求其决策面方程。 2．设有两类正态分布的样本集，第一类均值 μ1 T 1 1/ 2 T 20，方差 1 1/ 2 ，第二类均值 μ2 22，方差 1 1 1/ 2 p( 2 ) 。试按最小错误率 Bayes 决策求两类的分界面。 2 1/ 2 ，先验概率 p( 1 ) 1

模式识别试题

《模式识别》试题库一、基本概念题 1模式识别的三大核心问题是：（）、（）、（）。 2、模式分布为团状时，选用（）聚类算法较好。 3 欧式距离具有（）。马式距离具有（）。（1）平移不变性（2）旋转不变性（3）尺度缩放不变性（4）不受量纲影响的特性 4 描述模式相似的测度有( )。（1）距离测度（2）模糊测度（3）相似测度（4）匹配测度 5 利用两类方法处理多类问题的技术途径有：（1）（2）（3）。其中最常用的是第( )个技术途径。 6 判别函数的正负和数值大小在分类中的意义是：( )。 7 感知器算法 ( )。（1）只适用于线性可分的情况；（2）线性可分、不可分都适用。 8 积累位势函数法的判别界面一般为( )。（1）线性界面；（2）非线性界面。 9 基于距离的类别可分性判据有：( ).（1）1[]w B Tr S S - （2） B W S S （3） B W B S S S + 10 作为统计判别问题的模式分类，在（）情况下，可使用聂曼-皮尔逊判决准则。 11 确定性模式非线形分类的势函数法中，位势函数K(x,xk)与积累位势函数K(x)的关系为（）。 12 用作确定性模式非线形分类的势函数法，通常，两个n 维向量x 和xk 的函数K(x,xk)若同时满足下列三个条件，都可作为势函数。①（）； ②（）；③ K(x,xk)是光滑函数，且是x 和xk 之间距离的单调下降函数。 13 散度Jij 越大，说明i 类模式与j 类模式的分布（）。当i 类模式与j 类模式的分布相同时，Jij=（）。 14 若用Parzen 窗法估计模式的类概率密度函数，窗口尺寸h1过小可能产生的问题是（），h1过大可能产生的问题是（）。 15 信息熵可以作为一种可分性判据的原因是：( )。 16作为统计判别问题的模式分类，在（）条件下，最小损失判决规则与最小错误判决规则是等价的。 17 随机变量l(x ρ)=p(x ρ1)/p(x ρ2)，l(x ρ)又称似然比，则E l( x ρ)2= （）。在最小误判概率准则下，对数似然比Bayes 判决规则为（）。 18 影响类概率密度估计质量的最重要因素（）。 19 基于熵的可分性判据定义为)] |(log )|([1x P x P E J i c i i x H ρρωω∑=-=，JH 越（），说明模式的可分性越强。当P(i| x ρ) =（）(i=1,2,…,c)时，JH 取极大值。 20 Kn 近邻元法较之于Parzen 窗法的优势在于（）。上述两种算法的共同弱点主要是（）。 21 已知有限状态自动机Af=(，Q ，，q0，F)，={0，1}；Q={q0，q1}；：(q0， 0)= q1，(q0，1)= q1，(q1，0)=q0，(q1，1)=q0；q0=q0；F={q0}。现有输入字符串：(a) 000，(b) 11，(c) ，(d)0010011，试问，用Af 对上述字符串进行分

模式识别习题答案

1 ．设有下列语句，请用相应的谓词公式把它们表示出来：（1）有的人喜欢梅花，有的人喜欢菊花，有的人既喜欢梅花又喜欢菊花。答：定义谓词： MAN（X）：X是人， LIKE（X，Y）：X喜欢Y ((?X)(MAN(X)∧LIKE(X, 梅花)) ∧ ((?Y)(MAN(Y)∧LIKE(Y,菊花))∧ ((?Z)(MAN(Z)∧(LIKE(Z,梅花) ∧LIKE(Z,菊花)) （2）他每天下午都去打篮球。答：定义谓词：TIME(X):X是下午 PLAY(X,Y):X去打Y （?X）TIME(X) PLAY(他,篮球) （3）并不是每一个人都喜欢吃臭豆腐。定义谓词：MAN（X）：X是人 LIKE（X，Y）：X喜欢吃Y ┐（（?X）MAN（X） LIKE（X，CHOUDOUFU）） 2 ．请对下列命题分别写出它的语义网络：（1）钱老师从 6 月至 8 月给会计班讲《市场经济学》课程。（2）张三是大发电脑公司的经理，他 35 岁，住在飞天胡同 68 号。

（3）甲队与乙队进行蓝球比赛，最后以 89 ： 102 的比分结束。 3. 框架表示法一般来讲，教师的工作态度是认真的，但行为举止有些随便，自动化系教师一般来讲性格内向，喜欢操作计算机。方园是自动化系教师，他性格内向，但工作不刻苦。试用框架写出上述知识，并求出方圆的兴趣和举止？答：框架名：<教师> 继承：<职业> 态度：认真举止：随便框架名：<自动化系教师> 继承：<教师> 性格：内向兴趣：操作计算机框架名：<方园> 继承：<自动化系教师> 性格：内向态度：不刻苦兴趣：操作计算机举止：随便 4. 剧本表示法作为一个电影观众，请你编写一个去电影院看电影的剧本。

模式识别习题集答案解析

1、PCA和LDA的区别？ PCA是一种无监督的映射方法，LDA是一种有监督的映射方法。PCA只是将整组数据映射到最方便表示这组数据的坐标轴上，映射时没有利用任何数据部的分类信息。因此，虽然做了PCA后，整组数据在表示上更加方便（降低了维数并将信息损失降到了最低），但在分类上也许会变得更加困难；LDA在增加了分类信息之后，将输入映射到了另外一个坐标轴上，有了这样一个映射，数据之间就变得更易区分了（在低纬上就可以区分，减少了很大的运算量），它的目标是使得类别的点距离越近越好，类别间的点越远越好。 2、最大似然估计和贝叶斯方法的区别？p(x|X)是概率密度函数，X是给定的训练样本的集合，在哪种情况下，贝叶斯估计接近最大似然估计？最大似然估计把待估的参数看做是确定性的量，只是其取值未知。利用已知的样本结果，反推最有可能（最大概率）导致这样结果的参数值(模型已知，参数未知）。贝叶斯估计则是把待估计的参数看成是符合某种先验概率分布的随机变量。对样本进行观测的过程，把先验概率密度转化为后验概率密度，利用样本的信息修正了对参数的初始估计值。当训练样本数量趋于无穷的时候，贝叶斯方法将接近最大似然估计。如果有非常多的训练样本，使得p(x|X)形成一个非常显著的尖峰，而先验概率p(x)又是均匀分布，此时两者的本质是相同的。 3、为什么模拟退火能够逃脱局部极小值？在解空间随机搜索，遇到较优解就接受，遇到较差解就按一定的概率决定是否接受，这个概率随时间的变化而降低。实际上模拟退火算法也是贪心算法，只不过它在这个基础上增加了随机因素。这个随机因素就是：以一定的概率来接受一个比单前解要差的解。通过这个随机因素使得算法有可能跳出这个局部最优解。 4、最小错误率和最小贝叶斯风险之间的关系？基于最小风险的贝叶斯决策就是基于最小错误率的贝叶斯决策，换言之，可以把基于最小错误率决策看做是基于最小风险决策的一个特例，基于最小风险决策本质上就是对基于最小错误率公式的加权处理。 5、SOM的主要功能是什么？怎么实现的？是winner-all-take-all 策略吗？ SOM是一种可以用于聚类的神经网络模型。自组织映射（SOM）或自组织特征映射（SOFM）是一种使用非监督式学习来产生训练样本的输入空间的一个低维（通常是二维）离散化的表示的人工神经网络（ANN）。自组织映射与其他人工神经网络的不同之处在于它使用一个邻近函数来保持输入控件的拓扑性质。SOM网络中, 某个输出结点能对某一类模式作出特别的反应以代表该模式类, 输出层上相邻的结点能对实际模式分布中相近的模式类作出特别的反映,当某类数据模式输入时, 对某一输出结点产生最大刺激( 获胜结点) , 同时对获胜结点周围的一些结点产生较大刺激。在训练的过程中, 不断对获胜结点的连接权值作调整, 同时对获胜结点的邻域结点的连接权值作调整; 随着训练的进行, 这个邻域围不断缩小, 直到最后, 只对获胜结点进行细微的连接权值调整。不是winner-all-take-all 策略。获胜结点产生刺激，其周围的结点也会产生一定程度的兴奋。 6、期望算法需要哪两步？请列出可能的公式并做必要的解释。 E-Step和M-Step。E-Step叫做期望化步骤，M-Step为最大化步骤。整体算法的步骤如下所示： 1、初始化分布参数。 2、(E-Step)计算期望E，利用对隐藏变量的现有估计值，计算其最大似然估计值，以此实现期望化的过程。 3、(M-Step)最大化在E-步骤上的最大似然估计值来计算参数的值