模式识别练习题及答案.docx

合集下载

模式识别课后习题答案

模式识别课后习题答案

• 2.16 证明M ahalanobis距离r符合距离定义三定理,即 – (1) r(a, b) = r(b, a) – (2) 当且仅当a = b时,r(a, b) = 0 – (3) r(a, c) ≤ r(a, b) + r(b, c) 证明: (1) r(a, b) = (a − b)T Σ−1 (a − b) = (b − a)T Σ−1 (b − a) = r(b, a) (2) Σ为半正定矩阵所以r(a, b) = (a − b)T Σ−1 (a − b) ≥ 0,只有当a = b时,才有r(a, b) = 0。 (3) Σ−1 可对角化,Σ−1 = P ΛP T • 2.17 若将Σ−1 矩阵写为:Σ−1 h1d h2d ,证明M ahalanobis距离平方为 . . . hdd
• 2.13 把连续情况的最小错误率贝叶斯决策推广到离散情况,并写出其判别函数。 • 2.14 写出离散情况条件风险R(ai |x)的定义,并指出其决策规则。 解: R(ai |x) = = R(ak |x) = min
c ∑ j =1 c ∑ j =1
λij P (wj |x) λij pቤተ መጻሕፍቲ ባይዱx|wj )P (wj )////omit the same part p(x)
j =1,...,c j =1,...,c
考虑两类问题的分类决策面为:P (w1 |x) = P (w2 |x),与p(x|w1 )P (w1 ) = p(x|w2 )P (w2 ) 是相同的。 • 2.9 写出两类和多类情况下最小风险贝叶斯决策判别函数和决策面方程。 • 2.10 随机变量l(x)定义为l(x) = p(x|w1 ) ,l(x)又称为似然比,试证明 p(x|w2 )
1

模式识别习题答案

模式识别习题答案

将 w0 代入由 (∗∗) 得到的第二个等式得到:
1 [ N
Sw
+
N1N2 N2
(m1

m2)(m1

m2)T ]w
=
m1

m2
显然,
N1 N2 N2
(m1

m2
)(m1

m2
)T
w

m1 − m2
方向上,不妨令
N1 N2 N2
(m1

m2)(m1 − m2)T w = (1 − λ)(m1 − m2) 代入上式可得
g(x) = aT y, a = (1, 2, −2)T , y = (x1, x2, 1)T
(3)事实上, X 是 Y 中的一个 y3 = 1 超平面,两者有相同的表达式,因此对 原空间的划分相同。 4.8 证明在正态等协方差条件下,Fisher线性判别准则等价于贝叶斯判别。 证明: 在正态等协方差条件( Σ1 = Σ2 = Σ )下,贝叶斯判别的决策面方程为:
w xp = x ∓ r ∥w∥
根据超平面的定向,将 r 代入可得,
g(x) xp = x − ∥w∥2 w
4.4 对于二维线性判别函数
g(x) = x1 + 2x2 − 2
(1)将判别函数写成 g(x) = wT x + w0 的形式,并画出 g(x) = 0 的几何图形; (2)映射成广义齐次线性判别函数
∥∇J (a)∥2 ρk = ∇JT (a)D∇J(a)
时,梯度下降算法的迭代公式为
证明:
ak+1
=
ak
+
b
− aTk y1 ∥y1∥2
y1

模式识别习题解答第三章

模式识别习题解答第三章

模式识别习题解答第三章案场各岗位服务流程销售大厅服务岗:1、销售大厅服务岗岗位职责:1)为来访客户提供全程的休息区域及饮品;2)保持销售区域台面整洁;3)及时补足销售大厅物资,如糖果或杂志等;4)收集客户意见、建议及现场问题点;2、销售大厅服务岗工作及服务流程阶段工作及服务流程班前阶段1)自检仪容仪表以饱满的精神面貌进入工作区域2)检查使用工具及销售大厅物资情况,异常情况及时登记并报告上级。

班中工作程序服务流程行为规范迎接指引递阅资料上饮品(糕点)添加茶水工作要求1)眼神关注客人,当客人距3米距离时,应主动跨出自己的位置迎宾,然后侯客迎询问客户送客户注意事项15度鞠躬微笑问候:“您好!欢迎光临!”2)在客人前方1-2米距离领位,指引请客人向休息区,在客人入座后问客人对座位是否满意:“您好!请问坐这儿可以吗?”得到同意后为客人拉椅入座“好的,请入座!”3)若客人无置业顾问陪同,可询问:请问您有专属的置业顾问吗?,为客人取阅项目资料,并礼貌的告知请客人稍等,置业顾问会很快过来介绍,同时请置业顾问关注该客人;4)问候的起始语应为“先生-小姐-女士早上好,这里是XX销售中心,这边请”5)问候时间段为8:30-11:30 早上好11:30-14:30 中午好 14:30-18:00下午好6)关注客人物品,如物品较多,则主动询问是否需要帮助(如拾到物品须两名人员在场方能打开,提示客人注意贵重物品);7)在满座位的情况下,须先向客人致歉,在请其到沙盘区进行观摩稍作等待;阶段工作及服务流程班中工作程序工作要求注意事项饮料(糕点服务)1)在所有饮料(糕点)服务中必须使用托盘;2)所有饮料服务均已“对不起,打扰一下,请问您需要什么饮品”为起始;3)服务方向:从客人的右面服务;4)当客人的饮料杯中只剩三分之一时,必须询问客人是否需要再添一杯,在二次服务中特别注意瓶口绝对不可以与客人使用的杯子接触;5)在客人再次需要饮料时必须更换杯子;下班程序1)检查使用的工具及销售案场物资情况,异常情况及时记录并报告上级领导;2)填写物资领用申请表并整理客户意见;3)参加班后总结会;4)积极配合销售人员的接待工作,如果下班时间已经到,必须待客人离开后下班;1.3.3.3吧台服务岗1.3.3.3.1吧台服务岗岗位职责1)为来访的客人提供全程的休息及饮品服务;2)保持吧台区域的整洁;3)饮品使用的器皿必须消毒;4)及时补充吧台物资;5)收集客户意见、建议及问题点;1.3.3.3.2吧台服务岗工作及流程阶段工作及服务流程班前阶段1)自检仪容仪表以饱满的精神面貌进入工作区域2)检查使用工具及销售大厅物资情况,异常情况及时登记并报告上级。

(完整word版)模式识别试题及总结

(完整word版)模式识别试题及总结

一、填空与选择填空(本题答案写在此试卷上,30分)1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择和模式分类。

2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。

3、聚类分析算法属于(1);判别域代数界面方程法属于(3)。

(1)无监督分类 (2)有监督分类(3)统计模式识别方法(4)句法模式识别方法4、若描述模式的特征量为0-1二值特征量,则一般采用(4)进行相似性度量。

(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。

(1)(2) (3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在(2)中进行。

(1)二维空间(2)一维空间(3)N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。

(1)感知器算法(2)H-K算法(3)积累位势函数法8、下列四元组中满足文法定义的有(1)(2)(4)。

(1)({A, B}, {0, 1}, {A→01, A→ 0A1 , A→ 1A0 , B→BA , B→ 0}, A)(2)({A}, {0, 1}, {A→0, A→ 0A}, A)(3)({S}, {a, b}, {S → 00S, S → 11S, S → 00, S → 11}, S)(4)({A}, {0, 1}, {A→01, A→ 0A1, A→ 1A0}, A)9、影响层次聚类算法结果的主要因素有(计算模式距离的测度、(聚类准则、类间距离门限、预定的类别数目))。

10、欧式距离具有( 1、2 );马式距离具有(1、2、3、4 )。

(1)平移不变性(2)旋转不变性(3)尺度缩放不变性(4)不受量纲影响的特性11、线性判别函数的正负和数值大小的几何意义是(正(负)表示样本点位于判别界面法向量指向的正(负)半空间中;绝对值正比于样本点到判别界面的距离。

模式识别练习题

模式识别练习题

第四章 习题解1. 设一维两类模式满足正态分布,它们的均值和方差分别为,μ1=0,σ1=2,μ2=2,σ2=2,p(x) ~N(μ,σ),窗函数P(ω1)= P(ω2),取0-1损失函数,试算出判决边界点,并绘出它们的概率密度函数曲线;试确定样本-3,-2,1,3,5各属哪一类。

解:已知21(|p x ω2由Bayes 最小损失判决准则: 如果1221221212211211(|)()()()(|)()()p x P l x p x P ωωλλθωωλλ-=>=-,则判1x ω∈,否则判2x ω∈。

221212(2)1()exp[]exp()1882x x x l x θ--=-+=->= 1211ln[exp()]ln ln1022x xθ---=>==∴如果1x <,则判1x ω∈,否则判2x ω∈。

∴-3,-2属于ω1;1,3,5属于ω2。

2. 在图像识别中,假定有灌木丛和坦克两种类型,分别用ω1和ω2表示,它们的先验概率分别为0.7和0.3,损失函数如表所示。

现在做了四次试验,获得四个样本的类概率密度如下: )/(1ωx p :0.1,0.15,0.3, 0.6)/(2ωx p :0.8,0.7,0.55, 0.3(1) 试用贝叶斯最小误判概率准则判决四个样本各属于哪个类型;(2)假定只考虑前两种判决,试用贝叶斯最小风险准则判决四个样本各属于哪个类型;(3)将拒绝判决考虑在内,重新考核四次试验的结果。

解:(1)两类问题的Bayes最小误判概率准则为如果12121221(|)()()(|)()p x Pl xp x Pωωθωω=>=,则判1xω∈,否则判2xω∈。

由已知数据,θ12=0.3/0.7=3/7,样本x1:∵l12(x1)=0.1/0.8<θ12=3/7 ∴x1∈ω2样本x2:∵l12(x2)=0.15/0.7<θ12=3/7 ∴x2∈ω2样本x3:∵l12(x3)=0.3/0.55>θ12=3/7 ∴x3∈ω1样本x4:∵l12(x4)=0.6/0.3>θ12=3/7 ∴x4∈ω1(2)不含拒绝判决的两类问题的Bayes最小风险判决准则为如果1221221212211211(|)()()()(|)()()p x Pl xp x Pωωλλθωωλλ-=>=-,则判1xω∈,否则判2xω∈。

模式识别期末考试题及答案

模式识别期末考试题及答案

模式识别期末考试题及答案一、填空题1. 模式识别是研究通过_________从观测数据中自动识别和分类模式的一种学科。

答案:计算机算法2. 在模式识别中,特征选择的主要目的是_________。

答案:降低数据的维度3. 支持向量机(SVM)的基本思想是找到一个最优的超平面,使得两类数据的_________最大化。

答案:间隔4. 主成分分析(PCA)是一种_________方法,用于降低数据的维度。

答案:线性降维5. 隐马尔可夫模型(HMM)是一种用于处理_________数据的统计模型。

答案:时序二、选择题6. 以下哪种方法不属于模式识别的监督学习方法?()A. 线性判别分析B. 支持向量机C. 神经网络D. K-means聚类答案:D7. 在以下哪种情况下,可以使用主成分分析(PCA)进行特征降维?()A. 数据维度较高,且特征之间存在线性关系B. 数据维度较高,且特征之间存在非线性关系C. 数据维度较低,且特征之间存在线性关系D. 数据维度较低,且特征之间存在非线性关系答案:A8. 以下哪个算法不属于聚类算法?()A. K-meansB. 层次聚类C. 判别分析D. 密度聚类答案:C三、判断题9. 模式识别的目的是将输入数据映射到事先定义的类别中。

()答案:正确10. 在模式识别中,特征提取和特征选择是两个不同的概念,其中特征提取是将原始特征转换为新的特征,而特征选择是从原始特征中筛选出有用的特征。

()答案:正确四、简答题11. 简述模式识别的主要任务。

答案:模式识别的主要任务包括:分类、回归、聚类、异常检测等。

其中,分类和回归任务属于监督学习,聚类和异常检测任务属于无监督学习。

12. 简述支持向量机(SVM)的基本原理。

答案:支持向量机的基本原理是找到一个最优的超平面,使得两类数据的间隔最大化。

具体来说,SVM通过求解一个凸二次规划问题来确定最优超平面,使得训练数据中的正类和负类数据点尽可能远离这个超平面。

模式识别课后习题答案

模式识别课后习题答案
• 2.10 随机变量l(x)定义为l(x) = p(x|w1) ,l(x)又称为似然比,试证明 p(x|w2)
– (1) E{ln(x)|w1} = E{ln+1(x)|w2} – (2) E{l(x)|w2} = 1 – (3) E{l(x)|w1} − E2{l(x)|w2} = var{l(x)|w2}(教材中题目有问题) 证∫ 明ln+:1p对(x于|w(12)),dxE={ln∫(x()∫p(|wp(x(1x|}w|w=1)2))∫n)+nl1nd(xx)所p(x以|w∫,1)Ed{xln=(x∫)|w(1p(}p(x(=x|w|Ew1)2{))ln)n+n+11d(xx)又|wE2}{ln+1(x)|w2} = 对于(2),E{l(x)|w2} = l(x)p(x|w2)dx = p(x|w1)dx = 1
对于(3),E{l(x)|w1} − E2{l(x)|w2} = E{l2(x)|w2} − E2{l(x)|w2} = var{l(x)|w2}
• 2.11 xj(j = 1, 2, ..., n)为n个独立随机变量,有E[xj|wi] = ijη,var[xj|wi] = i2j2σ2,计 算在λ11 = λ22 = 0 及λ12 = λ21 = 1的情况下,由贝叶斯决策引起的错误率。(中心极限 定理)
R2
R1
容易得到


p(x|w2)dx = p(x|w1)dx
R1
R2
所以此时最小最大决策面使得P1(e) = P2(e)
• 2.8 对于同一个决策规则判别函数可定义成不同形式,从而有不同的决策面方程,指出 决策区域是不变的。
3
模式识别(第二版)习题解答

模式识别练习题

模式识别练习题

模式识别练习题填空题1、模式识别系统的基本构成单元包括:模式采集、特征选择与提取和模式分类。

2、统计模式识别中描述模式的⽅法⼀般使⽤特征⽮量;句法模式识别中模式描述⽅法⼀般有串、树、⽹。

3、影响层次聚类算法结果的主要因素有计算模式距离的测度、聚类准则、类间距离门限、预定的类别数⽬。

4、线性判别函数的正负和数值⼤⼩的⼏何意义是正(负)表⽰样本点位于判别界⾯法向量指向的正(负)半空间中;绝对值正⽐于样本点到判别界⾯的距离。

5、感知器算法1。

(1)只适⽤于线性可分的情况;(2)线性可分、不可分都适⽤。

6、在统计模式分类问题中,聂曼-⽪尔逊判决准则主要⽤于某⼀种判决错误较另⼀种判决错误更为重要情况;最⼩最⼤判别准则主要⽤于先验概率未知的情况。

7、“特征个数越多越有利于分类”这种说法正确吗?错误。

特征选择的主要⽬的是从n个特征中选出最有利于分类的的m个特征(m⼀般在可分性判据对特征个数具有单调性和(C n m>>n )的条件下,可以使⽤分⽀定界法以减少计算量。

8、散度J ij越⼤,说明ωi类模式与ωj类模式的分布差别越⼤;当ωi类模式与ωj类模式的分布相同时,J ij= 0 。

选择题1、影响聚类算法结果的主要因素有( B C D)。

A. 已知类别的样本质量B. 分类准则C. 特征选取D. 模式相似性测度2、模式识别中,马式距离较之于欧式距离的优点是( C D )。

A. 平移不变性B. 旋转不变性C. 尺度不变性D. 考虑了模式的分布 3、影响基本K-均值算法的主要因素有( D A B )。

A. 样本输⼊顺序B. 模式相似性测度C. 聚类准则D. 初始类中⼼的选取 4、在统计模式分类问题中,当先验概率未知时,可以使⽤( B D )。

A. 最⼩损失准则B. 最⼩最⼤损失准则C. 最⼩误判概率准则D. N-P 判决 5、散度J D 是根据( C )构造的可分性判据。

A. 先验概率B. 后验概率C. 类概率密度D. 信息熵E. ⼏何距离6、如果以特征向量的相关系数作为模式相似性测度,则影响聚类算法结果的主要因素有( B C )。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1=填空题1、模式识别系统的基本构成单元包括:模式采集、特征选择与提取和模式分类。

2、统计模式识别中描述模式的方法一般使用特征矢量;句法模式识别中模式描述方法一般有串、树、网。

3、影响层次聚类算法结果的主要因素有计算模式距离的测度、聚类准则、类间距离门限、预定的类别数目。

4、线性判别函数的正负和数值大小的几何意义是正(负)表示样本点位于判别界面法向量指向的正(负)半空间中;绝对值正比于样本点到判别界面的距离。

5、感知器算法丄。

(1 )只适用于线性可分的情况;(2)线性可分、不可分都适用。

6、在统计模式分类问题中,聂曼-皮尔逊判决准则主要用于某一种判决错误较另一种判决错误更为重愛情况;最小最大判别准则主要用于先验概率未知的情况。

7、“特征个数越多越有利于分类”这种说法正确吗?错误。

特征选择的主要目的是从n个特征中选出最有利于分类的的m个特征(m<n),以降低特征维数。

一般在可分性判据对特征个数具有单调性和(C n m»n )的条件下,可以使用分支定界法以减少计算量。

& 散度Jij越大,说明。

类模式与3j类模式的分布差别越大;当3类模式与(Oj类模式的分布相同时,Jij=_O_.选择题1、影响聚类算法结果的主要因素有(BCD ).A.已知类别的样本质量B.分类准则C.特征选取D.模式相似性测度2、模式识别中,马式距离较之于欧式距离的优点是(CD )。

A.平移不变性B.旋转不变性C.尺度不变性D.考虑了模式的分布3、影响基本K-均值算法的主要因素有(DAB )。

A.样本输入顺序B.模式相似性测度C.聚类准则D.初始类中心的选取4、在统计模式分类问题中,当先验概率未知时,可以使用(BD )。

A.最小损失准则B.最小最大损失准则C.最小误判概率准则D.N-P判决5、散度环是根据(C )构造的可分性判据。

A.先验概率B.后验概率C.类概率密度D.信息燔E.几何距离6、如果以特征向量的相关系数作为模式相似性测度,则影响聚类算法结果的主要因素有(B C )。

A.已知类别样本质量B.分类准则C.特征选取D.量纲7、欧式距离具有(AB );马式距离具有(ABCD )。

A.平移不变性B.旋转不变性C.尺度缩放不变性D.不受量纲影响的特性&聚类分析算法属于(A );判别域代数界面方程法属于(C )。

A.无监督分类B.有监督分类C.统计模式识别方法D.句法模式识别方法9、下列函数可以作为聚类分析中的准则函数的有(ACD )。

C "丿CK.J = Tr[S^S B] B. J = |5X| C.八£刃护-码『D.八£(兀-初何-祈)j=l z=l j=l10、Fisher线性判别函数的求解过程是将N维特征矢量投影在(B )中进行。

A.二维空间B. —维空间C.N-1维空间简答题一、试问“模式”与“模式类”的含义。

如果一位姓王的先生是位老年人,试问“王先生”和“老头”谁是模式,谁是模式类?答:在模式识别学科中,就“模式”与“模式类”而言,模式类是一类事物的代表,概念或典型,而“模式”则是某一事物的具体体现,如“老头”是模式类,而王先生则是“模式”是“老头”的具体化。

二、试说明Mahalanobis距离平方的定义,到某点的Mahalanobis距离平方为常数的轨迹的几何意义,它与欧氏距离的区别与联系。

答:Mahalanobis 距离的平方定义为:r2(x,w) =(X- w)r^ \x-u)其中x, u为两个数据,二是一个正定对称矩阵(一般为协方差矩阵)。

根据定义,距某一点的Mahalanobis距离相等点的轨迹是超椭球,如果是单位矩阵则Mahalanobis 距离就是通常的欧氏距离。

三、试说明用监督学习与非监督学习两种方法对道路图像中道路区域的划分的基本做法,以说明这两种学习方法的定义与它们间的区别。

答:监督学习方法用来对数据实现分类,分类规则通过训练获得。

该训练集由带分类号的数据集组成,因此监督学习方法的训练过程是离线的。

非监督学习方法不需要单独的离线训练过程,也没有带分类号(标号)的训练数据集, 一般用来对数据集进行分析,如聚类,确定其分布的主分量等。

就道路图像的分割而言,监督学习方法则先在训练用图像中获取道路象素与非道路象 素集,进行分类器设计,然后用所设计的分类器对道路图像进行分割。

使用非监督学习方法,则依据道路路面象素与非道路象素之间的聚类分析进行聚类运 算,以实现道路图像的分割。

四、 试述动态聚类与分级聚类这两种方法的原理与不同。

答:动态聚类是指对当前聚类通过迭代运算改善聚类; 分级聚类则是将样本个体,按相似度标准合并,随着相似度要求的降低实现合并。

(1 1/2、五、 已知一组数据的协方差矩阵为,试问匕/2 1丿1. 协方差矩阵中各元素的含义。

2. 求该数组的两个主分量。

3. 主分量分析或称K-L 变换,它的最佳准则是什么?4. 为什么说经主分量分析后,消除了各分量之间的相关性。

答:协方差矩阵为S J 则1. 对角元素是各分量的方差,非对角元素是各分量之间的协方差。

2-12.主分量,通过求协方差矩阵的特征值,用 ]<_2这两个特征向量,即为主分量。

3. K-L 变换的最佳准则为:对一组数据进行按一组正交基分解,在只取相同数量分量的条件下,以均方误差计算截尾误差最小。

4. 在经主分量分解后,协方差矩阵成为对角矩阵,因而各主分量间相关性消除。

六、试列举线性分类器中最著名的三种最佳准则以及它们各自的原理。

答:线性分类器三种最优准则:2=0 得仇— I)? =1/4,则 2-1)[1/22 = <3/2相应的:2 = 3/2,对应特征向量为2=-Fisher准则:根据两类样本一般类内密集,类间分离的特点,寻找线性分类器最佳的法线向量方向,使两类样本在该方向上的投影满足类内尽可能密集,类间尽可能分开。

这种度量通过类内离散矩阵Sw和类间离散矩阵Sb实现。

感知准则函数:准则函数以使错分类样本到分界面距离之和最小为原则。

其优点是通过错分类样本提供的信息对分类器函数进行修正,这种准则是人工神经元网络多层感知器的基础。

支持向量机:基本思想是在两类线性可分条件下,所设计的分类器界面使两类之间的间隔为最大,它的基本出发点是使期望泛化风险尽可能小。

七、对一副道路图像,希望把道路部分划分出来,可以采用以下两种方法:1.在该图像中分别在道路部分与非道路部分画出一个窗口,把在这两个窗口中的象素数据作为训练集,用Fisher准则方法求得分类器参数,再用该分类器对整幅图进行分类。

2.将整幅图的每个象素的属性记录在一张数据表中,然后用某种方法将这些数据按它们的自然分布状况划分成两类。

因此每个象素就分别得到相应的类别号,从而实现了道路图像的分割。

试问以上两种方法哪一种是监督学习,哪个是非监督学习?答:第一种方法中标记了两类样本的标号,需要人手工干预训练过程,属于监督学习方法;第二种方法只是依照数据的自然分布,把它们划分成两类,属于非监督学习方法。

八、试分析五种常用决策规则思想方法的异同。

答、五种常用决策是:1.基于最小错误率的贝叶斯决策,利用概率论中的贝叶斯公式,得出使得错误率最小的分类规则。

2.基于最小风险的贝叶斯决策,引入了损失函数,得出使决策风险最小的分类。

当在0-1损失函数条件下,基于最小风险的贝叶斯决策变成基于最小错误率的贝叶斯决策。

3.在限定一类错误率条件下使另一类错误率最小的两类别决策。

4.最大最小决策:类先验概率未知,考察先验概率变化对错误率的影响,找出使最小贝叶斯奉献最大的先验概率,以这种最坏情况设计分类器。

5. 序贯分类方法,除了考虑分类造成的损失外,还考虑特征获取造成的代价,先用一部分特征分类,然后逐步加入性特征以减少分类损失,同时平衡总的损失,以求得 最有效益。

九、假设在某个地区细胞识别中正常(W1)和异常(W2)两类先验概率分别为P(W ]) = 0.9,P(w 2) = 0.1 ,现有一待识别的细胞,其观察值为x,从类条件概率密度分布曲线上查得 P(x/wJ = 0.2 , P(x/ w 2) = 0.4 ,并且已知 2[]=0,入2 = 6 , 2?1 = 1,= 0试对该细胞x 用一下两种方法进行分类:1.基于最小错误率的贝叶斯决策;2.基于最小风险的贝叶斯决策;请分析两种结果的异同及原因。

答:利用贝叶斯公式,分别计算出叫和w?的后验概率:/>(w 2|x) = 1 _p(wjx) = 0.182根据贝叶斯决策规则:Xwjx) = 0.818 > Xw 2|x) = 0.182 ,所以把x 归为正常状态。

(2)根据条件和上面算出的后验概率,计算出条件风险:2R(a x |x)=工 2 屏(W/卜)=212/?(W 2|X ) = 1.0927=12人©2卜)=工久2/卩的卜)=兄21P (W ]卜)=0.818丿=1由于卜)> 7?(cr 2|x),即决策为W ]的条件风险小于决策为w 2的条件风险,因此采取 决策行动a 2,即判断待识别的细胞x 为%类 ------------- 异常细胞。

p(w |x) = P (x|wi )p(wj 工P (x|wJp(Wji)J=l02x0.9~ 0.2x0.9 + 0.4x0.1 _0'818将1与2相对比,其分类结果正好相反,因为这里影响决策结果的因素多了“损失”;而且两类错误决策所造成的损失相差很悬殊,因此“损失”起了主导作用。

十、既然有线性判别函数,为什么还要引进非线性判别函数?试分析由“线性判别函数”向“非线性判别函数”推广的思想和方法。

答:实际中有很多模式识别问题并不是线性可分的,这时就需要采用非线性分类器,比如当两类样本分不具有多峰性质并互相交错时,简单的线性判别函数往往会带来较大的分类错误。

这时,树分类器作为一种分段线性分类器,常常能有效地应用于这种情况。

十一、1.什么是特征选择?2.什么是Fisher线性判别?答:1.特征选择就是从一组特征中挑选出一些最有效的特征以达到降低特征空间维数的目的。

2. Fisher线性判别:可以考虑扌巴d维空间的样本投影到一条直线上,形成一维空间,即把维数压缩到一维,这在数学上容易办到,然而,即使样本在d维空间里形成若干紧凑的互相分得开的集群,如果把它们投影到一条任意的直线上,也可能使得几类样本混在一起而变得无法识别。

但是在一般情况下,总可以找到某个方向,使得在这个方向的直线上,样本的投影能分开得最好。

问题是如何根据实际情况找到这条最好的、最易于分类的投影线,这就是Fisher算法所要解决的基本问题。

十二、写出两类和多类情况下最小风险贝叶斯决策判别函数和决策面方程。

相关文档
最新文档