基于核函数的学习算法

合集下载

机器学习的分类与主要算法对比

机器学习的分类与主要算法对⽐机器学习的分类与主要算法对⽐⾸先让我们瞻仰⼀下当今机器学习领域的执⽜⽿者：这幅图上的三⼈是当今机器学习界的执⽜⽿者。

中间的是Geoffrey Hinton, 加拿⼤多伦多⼤学的教授，如今被聘为“Google⼤脑”的负责⼈。

右边的是Yann LeCun, 纽约⼤学教授，如今是Facebook⼈⼯智能实验室的主任。

⽽左边的⼤家都很熟悉，Andrew Ng，中⽂名吴恩达，斯坦福⼤学副教授，如今也是“百度⼤脑”的负责⼈与百度⾸席科学家。

这三位都是⽬前业界炙⼿可热的⼤⽜，被互联⽹界⼤鳄求贤若渴的聘请，⾜见他们的重要性。

⽽他们的研究⽅向，则全部都是机器学习的⼦类–深度学习。

从⼴义上来说，机器学习是⼀种能够赋予机器学习的能⼒以此让它完成直接编程⽆法完成的功能的⽅法。

但从实践的意义上来说，机器学习是⼀种通过利⽤数据，训练出模型，然后使⽤模型预测的⼀种⽅法。

机器学习⽆疑是当前数据分析领域的⼀个热点内容。

很多⼈在平时的⼯作中都或多或少会⽤到机器学习的算法。

从范围上来说，机器学习跟模式识别，统计学习，数据挖掘是类似的，同时，机器学习与其他领域的处理技术的结合，形成了计算机视觉、语⾳识别、⾃然语⾔处理等交叉学科。

因此，⼀般说数据挖掘时，可以等同于说机器学习。

同时，我们平常所说的机器学习应⽤，应该是通⽤的，不仅仅局限在结构化数据，还有图像，⾳频等应⽤。

机器学习的算法很多。

很多时候困惑⼈们都是，很多算法是⼀类算法，⽽有些算法⼜是从其他算法中延伸出来的。

这⾥，我们从两个⽅⾯来给⼤家介绍，第⼀个⽅⾯是学习的⽅式，第⼆个⽅⾯是算法的类似性。

⼀、机器学习⽅式根据数据类型的不同，对⼀个问题的建模有不同的⽅式。

在机器学习或者⼈⼯智能领域，⼈们⾸先会考虑算法的学习⽅式。

在机器学习领域，有⼏种主要的学习⽅式。

将算法按照学习⽅式分类是⼀个不错的想法，这样可以让⼈们在建模和算法选择的时候考虑能根据输⼊数据来选择最合适的算法来获得最好的结果。

基于核函数法及马尔可夫链的节点定位算法

Ｍａｋｏｖｃａｎｓｒｈｉｗａｅｅｎｅｄｓｐｒｓｔ，ｗｈｃｍｐｌｓＢａｓａｆｌｅｒｍｅｏｋｎｄｒｄｉｎｇｒｉｎｔｎｔｃｏｌｙ．Ｉｓｓｉｈｅｏｙｙｅｉｎｉｔｒｆａｗｒａａｏｆｅｐｒｉｇｅｈｎｏｇｉｔｕｅ
赵方，罗海勇，林权，马严
（．北京邮电大学软件学院，北京１０７；２中国科学院计算技术研究所普适计算研究中心，北京１０９ｉ０８６．０１０３中航工业综合技术研究所，北京１０２：４北京邮电大学信息网络中一，北京１０７）．００８．ｔ３０８６
第３卷第１期１１
２１００年１月１
通
信
学
报
、，＿Ｎｏ．１０１３１１
ＪＩ＂ａｎＣｍｍｕｉａｉｎｏ１Ｉｌｏ１１ｏｎｃｔｓｏ
Ｎｏｖｅｂｅｍｒ２ＯｌＯ
基于核函数法及马尔可夫链的节点定位算法
ｋｒｅｕｃｉｎｔｏｓｒｃｉｅｉｏｄｆｎｔｎｔａｅｆｌａｖｔｇｆｔｅｓｍｉｒｔｅｗｅｎｏｓｒａｉｎａｄｓｖｒｌｅｎｌｆｎｔｃｎｔｔｋｌｏｕｃｉｏｔｋｕｌｄａａｅｏｉｌｉｂｔｅｂｅｖｔｏｅｅａｏｏｕｌｈｏｎｈａｙｎｔａｎｎａｌｓｗｈｃｖｉｓｔｅｅｒｒｒｕｈｙｅｌｙｎｒｒｄｔｒｎｄｄｓｒｂｔｎｍｏｅ．ｕｔｅｍｏｅｔｅｒｉｉｇｓｍｐｅ，ｉｈａｏｄｈｒｏｏｇｔｂｍｐｏｉｇａｐｏｉｅｅｍｉｅｉｔｕｉｄ１Ｆｒｈｒｒ，ｈｂｉｉｏｐｏｏｅｌｏｔｍｓｓＭａｋｖｃａｎｏｉｒｖｅｌｃｌａｉｎａｃｒｃｄｓｏｅｈｏｉｏｉｇｔｅＩｌｔｒｐｓｄａｇｒｈｕｅｒｏｈｉｓｔｍｐｏｅｔｏａｉｔｃｕａｙａｈｒｎｔｅｐｓｔｎｎｉ．ｔｉｓｉｈｚｏｎｔｉｍｍｉ

基于各向异性核函数的均值漂移跟踪算法

ｎｉｈｏｈｏ，ａｅｎａｐｉｏｏｃｔａｋｎ．ｗｖｒｗｉｈｈｎｉｇｓｒｃｕｅｏｂｅｔｉｉｅｅｂｒｏｄｈｓｂｅｐｌｄｔｎｅｔｒｉｇＨｏｅｅ，ｔｔｅｃａｇｎｔｕｔｒｆｏｊｃｎｖｄｏｇｅｃｈｓｑｅｃｓｒｄｔｎｌｍｅｎｓｉｒｋｒｂｓｔｏｉｋｒｅｏｔｎｌｓｓｔｅｏｊｃ，ｅｐｃａｌｅｂｅｔｅｕｎｅ，ｔａｉｏａｉａｈｆｔａｅｙｉｒｐｃｅｎｌｆｏｅｈｂｅｔｓｅｉｙｗｈｎｏｊｃｔｃｏｅｌｓｒｃｕｅｖｒｓａｔＴｈｓａｅｌｎｓｂｅｔｒｋｎｔｎｓｔｏｉｋｒｅｍｅｎｓｉｉｅｈｐ，ｔｕｔｒａｉ．ｉｐｐｒｍｐｅｅｆｓｉｍｅｔｊｃａｉｇｗｉａｉｒｐｃｅｎｌａｆｉｗｈｃｔａｅｏｔｃｈｏｈｔｎｈｈｓｓａｅａｄｏｉｎａｉｎｏｅｅｎｌａａｔｏｔｅｈｎｉｇｏｊｃｒｃｕｅＴｈｇｒｈｅｓｒｓｒｋｎｂｓｃｌ，ｒｔｔｆｈｒｅｐａｇｎｂｅｔｔｕｔｒ．ｅｏｉｍｕｅａｉｇｒｕｔｎｅｏｔｋｓｄｔｈｃｓｌａｔｎｔｃｏ
２基于各向同性核函数的均值漂移跟踪算法及其
性和鲁棒性。实验结果证明该算法是有效的。关键词：目标跟踪；均值漂移；各向异性核函数；模板匹配
中图分类号：ＴＮ９９８１．
文献标识码：Ａ
文献标识码：１０．８６２０）３０８．４０９５９（０７０ —６６０

基于快速高斯核函数模糊聚类算法的图像分割

本文首先用阈值模糊聚类方法得到模糊规则数
和初始聚类中心；然后通过引入高斯核函数，平滑图像的像素灰度值，从而提高图像分割的抗干扰能力
和鲁棒性；最后用普通模糊聚类算法优化模糊隶属度和聚类中心值。本文方法有效地提高了图像分割的精度和速度，仿真结果验证了本方法的鲁棒性和
目标从背景中分割出来等等。因为图像分割在计算机视觉领域中的基础作用，分割的准确性直接影响后续任务，得它在图像理解、于内容的视频压缩使基
Ｓ，）通过引入变量改进了目标函数，提高了图像分割精度。Ｃｅ等人对ＴｌｓＰｎｓｈｎｏａ和ａａ提出的模糊ｉ
邹立颖郝，冰沙丽娟，
（齐齐哈尔大学ａ通信与电子工程学院电工电子教学与实验中心；．
ｂ计算机与控制工程学院自动化系，龙江齐齐哈尔１１０）．黑６０６
摘要：对模糊聚类算法通过引入高斯核函数，平滑图像像素灰度值，而增强图像分割的抗干扰能力和鲁从棒性，并结合阈值模糊聚类算法，高了图像分割的速度。首先利用阈值模糊聚类法划分初始输入空间，提得到模糊规则数及初始聚类中心；然后用高斯核函数平滑图像的像素灰度值；最后用标准模糊聚类算法求解并优化模糊隶属度和聚类中心。将本算法应用于添加噪声的嫦娥一号采集的月球地面灰度图像和Ｌｎｅａ灰度图像进行图像分割，仿真结果验证了本方法的鲁棒性、有效性和实用性。关键词：高斯核函数；阈值模糊聚类；标准模糊聚类算法；图像分割中图分类号：Ｐ８文献标识码：文章编号：００３３（００１－０１０Ｔ１Ａ１０ —９２２１）１０８－４１引言

《人工神经网络：模型、算法及应用》习题参考答案

习题2.1什么是感知机？感知机的基本结构是什么样的？解答：感知机是Frank Rosenblatt在1957年就职于Cornell航空实验室时发明的一种人工神经网络。

它可以被视为一种最简单形式的前馈人工神经网络，是一种二元线性分类器。

感知机结构：2.2单层感知机与多层感知机之间的差异是什么？请举例说明。

解答：单层感知机与多层感知机的区别：1. 单层感知机只有输入层和输出层，多层感知机在输入与输出层之间还有若干隐藏层；2. 单层感知机只能解决线性可分问题，多层感知机还可以解决非线性可分问题。

2.3证明定理：样本集线性可分的充分必要条件是正实例点集所构成的凸壳与负实例点集构成的凸壳互不相交.解答：首先给出凸壳与线性可分的定义凸壳定义1：设集合S⊂R n，是由R n中的k个点所组成的集合，即S={x1,x2,⋯,x k}。

定义S的凸壳为conv(S)为：conv(S)={x=∑λi x iki=1|∑λi=1,λi≥0,i=1,2,⋯,k ki=1}线性可分定义2：给定一个数据集T={(x1,y1),(x2,y2),⋯,(x n,y n)}其中x i∈X=R n , y i∈Y={+1,−1} , i=1,2,⋯,n ,如果存在在某个超平面S：w∙x+b=0能够将数据集的正实例点和负实例点完全正确地划分到超平面的两侧，即对所有的正例点即y i=+1的实例i，有w∙x+b>0，对所有负实例点即y i=−1的实例i，有w∙x+b<0，则称数据集T为线性可分数据集；否则，称数据集T线性不可分。

必要性：线性可分→凸壳不相交设数据集T中的正例点集为S+，S+的凸壳为conv(S+)，负实例点集为S−，S−的凸壳为conv(S−)，若T是线性可分的，则存在一个超平面：w ∙x +b =0能够将S +和S −完全分离。

假设对于所有的正例点x i ，有：w ∙x i +b =εi易知εi >0，i =1，2，⋯，|S +|。

基于核函数的支持向量机样本选取算法

（．Ｓｈｏｆｏｕｅｃｅｃ，ＳｕｈＣｈｎｒｌｉｅｓｙ１ｃｏｌｍｐｔｒｉｎｅｏｔｉａｏＣＳＮｏｍａＵｎｖｒｉ，Ｇｕｎｚｏ６ｔａｇｈｕ５３，Ｃｈｎ；１１０ｉａ２ｎｏａｉｎＴｃｎｌｇｅｅｒｈＩｓｉｔ，ＪｎｎＵｎｖｒｉ，Ｇｕｎｚｏ１０５ｈｎ）．ＩｆｒｔｅｈｏｏｙＲｓａｃｔｕｅｉａｉｅｓｙｍｏｎｔｔａｇｈｕ５０７，Ｃｉａ
样本时所需空间及时间开销，高支持向量机分类效率与质量，提出了一种基于核函数的样本选取算法。该算法通过选取提
最大可能成为支持向量的样本，以达到减少训练时存储Ｈｅｓｎ矩阵所需空间及时间开销的目的。实验结果表明，ｓａｉ该算法所
摘要：用支持向量机求解大规模数据分类需要较大内存来存储Ｈｅｓｎ矩阵，矩阵的大小则依赖于样本数，因此在一使ｓｉａ而，
定程度上导致支持向量机分类效率及质量难以提高考虑到只有成为支持向量的样本才对决策函数起作用，了减少训练为
ＡｂｔａｔＵｓｇｓｐｏｔｅｔｒｃｉｅｏｖｒｅｓａｅｄｔｌｓｉｃｔｎｎｅｓａｈｒｒｍｏｙｔｔｒｓｉｎｍａｒｏｅｓｒｃ：ｉｐｒｖｃｏｎｕｍａｈｎｓｏｓｌｅａｇ — ｃｌａａａｓｆａｉｅｄｔｅｔｌｃｉｏｒｍｏｅｍｅｒｓｅｏｏＨｅｓｔｉｗｈｓａｘ

数据分析知识：数据挖掘中的监督学习和无监督学习

数据分析知识：数据挖掘中的监督学习和无监督学习在数据分析领域，数据挖掘技术被广泛运用于从数据中挖掘出有意义的信息和规律，以帮助企业和个人做出更明智的决策。

而数据挖掘主要分为监督学习和无监督学习两种方式。

本文将详细介绍这两种学习方式的概念、算法、应用场景和优缺点。

一、监督学习监督学习是指基于已知结果的数据样本，通过建立一个映射函数，将输入数据映射到输出结果，从而实现对未知数据进行预测或分类的过程。

在监督学习中，我们通常将输入数据称为自变量，输出结果称为因变量。

监督学习的核心是建立一个有效的模型，这个模型需要能够对未知数据进行良好的预测或分类。

目前常用的监督学习算法包括决策树、神经网络、支持向量机、朴素贝叶斯分类和随机森林等。

1.决策树算法决策树算法是一种基于树型结构的分类算法，它通过对数据样本的分类特征进行判断和划分，最终生成一棵树形结构，用于对未知数据进行分类或预测。

决策树算法具有易于理解、易于实现和可解释性强等优点，适合于处理中小规模的数据集。

2.神经网络算法神经网络算法是一种基于人工神经网络的分类算法，它通过多层神经元之间的相互连接和权重调整，学习输入数据和输出结果之间的复杂非线性关系，从而实现对未知数据的分类或预测。

神经网络算法具有适应性强、泛化能力好等优点，但也存在学习速度慢、容易陷入局部最优等缺点。

3.支持向量机算法支持向量机算法是一种基于核函数的分类算法，它通过定义一个最优超平面，将不同类别的数据样本分隔开来，从而实现对未知数据的分类或预测。

支持向量机算法具有泛化性能强、对于样本噪声和非线性问题具有较好的处理能力等优点，但也存在计算量大、核函数选择过程较为困难等缺点。

4.朴素贝叶斯分类算法朴素贝叶斯分类算法是一种基于概率统计的分类算法，它通过统计样本数据中各个特征值出现的概率，并根据贝叶斯公式计算出对于给定数据属于每个类别的概率，从而实现对未知数据的分类或预测。

朴素贝叶斯分类算法具有计算速度快、对于高维数据具有处理优势等优点，但也存在对于样本分布不平衡和假设独立性等问题的限制。

常见的核函数

常见的核函数核函数是机器学习中一种常用的方法，它主要用于将高维空间中的数据映射到低维空间中，从而提升算法的性能。

核函数在SVM、PCA、KPCA等机器学习算法中广泛应用。

下面我们将介绍常见的核函数。

1. 线性核函数线性核函数是最简单的核函数之一，它是一种将数据点映射到低维空间的方式，其表达式如下：K(x_i, x_j) = (x_i * x_j)其中x_i, x_j是样本数据集中的两个数据，返回一个标量值。

线性核函数的优点在于需要的计算量较小，适用于大型数据集，但它的缺点是它只能处理线性分离的数据。

2. 多项式核函数其中x_i, x_j是样本数据集中的两个数据，c是一个常数，d是多项式的度数。

多项式核函数适用于非线性分离的数据。

3. 径向基函数(RBF)核函数其中x_i, x_j是样本数据集中的两个数据，gamma是一个正常数，||x_i - x_j||^2表示两个数据点之间的欧几里得距离的平方。

4. Sigmoid核函数其中x_i, x_j是样本数据集中的两个数据，alpha和beta是Sigmoid函数参数。

Sigmoid核函数适用于二分类问题。

上述四种核函数都是常见的核函数，它们各自有不同的优劣势，在不同的机器学习算法中应该选择适当的核函数来处理不同的数据。

除了上述四种常见的核函数，还有其他的一些核函数也具有重要的应用价值。

5. Laplacian核函数Laplacian核函数计算方式类似于径向基函数，但是它将样本数据点间的距离转化成样本数据点间的相似度，其表达式如下：K(x_i, x_j) = exp(-gamma * ||x_i - x_j||)其中gamma和径向基函数中的参数相同。

Laplacian核函数在图像识别和自然语言处理等领域有着广泛的应用。

6. ANOVA核函数ANOVA核函数通常用于数据分析和统计学中，它对混合多种类型数据的模型有较好的表现，其表达式如下：其中h_i和h_j是从样本数据点中提取出来的特征，gamma是一个常数。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

线性Fisher判别分析
对于两类问题,设待分类的样本有n个:x1, x2,…,xn∈Rd 。在进行Fisher判别分析时,目标是找到线性投影方向(投影轴),使得训练样本在这些轴上的投影结果类内散度最小,类间散度最大。设样本类内均值为mi,则
设样本类间离散度矩阵为Sω,则
设样本类间离散度矩阵为Sb,则
核函数
在处理线性分类问题时，数据以点积的形式( xi · xj ) 出现。而在处理非线性分类问题时，需要采用非线性映射把输入空间映射到高维特征空间，记为：
当在特征空间H 中构造最优超平面时，训练算法仅使用空间中的点积，即存在一种核函数K,使得: 核函数将m维高维空间的内积运算转化为n维低维输入空间的核函数计算，从而巧妙地解决了在高维特征空间中计算的“维数灾难”等问题。
对于类型未知的样本x , 可以采用线性判决函数: 来判断其所属类别,综合式(9)，可得分类判决函数:
根据核函数的相关知识，可以使用核函数K( xi · xj )替代线性分类问题中的点积形式，从而实现非线性变换后的线性分类。由此,式(5) 的对偶形式可变为：
约束条件：
相应的分类判决函数转变为:
该线性分类函数的VC维即为3
一般而言,VC维越大, 学习能力就越强,但学习机器也越复杂。
目前还没有通用的关于计算任意函数集的VC 维的理论,只有对一些特殊函数集的VC维可以准确知道。
结构风险最小化准则
Vapnik和Chervonenkis(1974)提出了SRM。传统机器学习方法中普遍采用的经验风险最小化原则在样本数目有限时是不合理的,因此，需要同时最小化经验风险和置信范围。统计学习理论提出了一种新的策略,即把函数集构造为一个函数子集序列,使各个子集按照VC维的大小排列;在每个子集中寻找最小经验风险,在子集间折衷考虑经验风险和置信范围,取得实际风险的最小。这种思想称作结构风险最小化准则(Structural Risk Minimization Principle)。
这时,输入训练样本由原来的x变为Ø ( x) ,然后在这个特征空间F中进行线性FDA 。问题转变为在F中最大化目标函数JF(w)
式中,ω∈F,
是F中相应的矩阵,分别为
由于F空间的维数通常很高甚至是无穷维,因JF (w )式直接求解很困难。借用非线性支持向量机的核方法,引入以下内积核函数来隐含地进行运算，,定义核矩阵K为式中, (Ki ) pj = k ( xp , xij ) , p = 1, 2, ⋯, n, 是n ×ni 矩阵( i = 1, 2) ,是全体样本分别与类1、类2的内积核矩阵。由再生核理论可知, F空间的任何解wØ 都是F空间中的训练样本的线性组合,即:
径向基函数
S形函数
有监督学习 (supervised learning)
监督学习，就是人们常说的分类，通过已有的训练样本（即已知数据以及其对应的输出）去训练得到一个最优模型（这个模型属于某个函数的集合，再利用这个模型将所有的输入映射为相应的输出，对输出进行简单的判断从而实现分类的目的，也就具有了对未知数据进行分类的能力。典型的例子就是SVM（可支持向量机）、 KFD（基于核的Fisher判别分析）。
b可以通过求解具有L1 软边界的一维线性支持向量机( SVM)来确定。
SVM和KFD的比较
核Fisher判别分析与支持向量机分类精度相差不大;但由于SVM 需要求解二次优化问题,因此在训练样本较多的情况下需要的训练时间较长,而KFDA只计算矩阵的特征向量,计算量小，在消耗时间上具有明显的优势。与SVM分类相似, KFDA的分类性能受核函数及参数影响很大, 核函数参数在特定的范围内才能得到良好的分类精度。
无监督学习 (unsupervised learning)
无监督学习是我们事先没有任何训练样本，而需要直接对数据进行建模。典型的例子就是KPCA（核主成分分析）。
Kernel Principal Component Analysis
KPCA方法借鉴SVM的核方法思想,将线性的PCA扩展到非线性情形。
理论基础监督学习:SVM、KFD
无监督学习：KPCA
模型选择
理论基础
机器学习 VC维
结构风险最小化原则
SLT(Statistical Learning Theory)
上世纪90年代中才成熟的统计学习理论，是在基于经验风险的有关研究基础上发展起来的，专门针对小样本的统计理论。统计学习理论为研究有限样本情况下的模式识别、函数拟合和概率密度估计等三种类型的机器学习问题提供了理论框架，同时也为模式识别发展了一种新的分类方法——支持向量机。
是第i类各个样本与总体的内积核的均值。
由上述三式可得
在F空间中,求解Fisher线性判别函数: 该判别函数隐式地对应原空间的一个非线性判别函数,因此, 它是一种非线性方法。求解矩阵N - 1M 的最大特征值对应的特征向量就可求得上式的最优解。测试数据在特征向量wØ 上的投影为：在实际应用中为了防止N 非正定,使解更稳定,通常引入一个正则化参数λ,令Nλ =N +λI, I是单位矩阵。则判别函数可以写为:
已知变量y与输入x之间存在一定的未知依赖关系，即联合概率分布F(x,y) 机器学习就是根据独立同分布的n个观测样本： (x1, y1), (x2, y2), · · ·, (xn, yn) 在一组函数{f(x,w)}中求一个最优函数f(x,w0)，使预测的期望风险R(w)最小化。
R( w) L( y, f ( x, w))dF ( x, y )
Kernel Fisher discriminant analysis（基于核的Fisher判别方法）
是由Mika 等人于1999 年提出的方法。核 Fisher 判别分析是一种很有用的机器学习方法，将一个非线性问题通过非线性变换转化为
另一个空间中的线性问题进行求解. 它不依赖于
模型，也不存在现代智能技术中重要的一个方面，研究从观测样本出发去分析对象，去预测未来。机器学习的基本模型：
输出y与x之间存在一种固定的、但形式未知的联合概率分布函数 F(y,x)。
学习机中有函数集{f(x,w)}，可估计输入与输出之间依赖关系，其中w为广义参数。
风险最小化－机器学习问题表示
其中,非负常数C 为惩罚因子，C 值越大表示对错误分类的惩罚越大。这是一个具有线性约束的二次规划问题，利用拉格朗日乘子法可以将式(4) 转化为其对偶形式:
(5)
约束条件:
(6)
其中ai为原问题中与约束条件式(2) 对应的拉格朗日乘子。这是一个不等式约束下的二次函数寻优问题，存在高效的算法求解。可以证明，在此寻优问题的解中有一部分ai不为0，它们所对应的训练样本完全确定了这个超平面，因此称其为支持向量(support vector)。
核方法分为核函数设计和算法设计两个部分,具体情况如图1 所示。核方法的实施步骤,具体描述为: ①收集和整理样本,并进行标准化; ②选择或构造核函数; ③ 用核函数将样本变换成为核矩阵; ④在特征空间对核矩阵实施各种线性算法;⑤得到输入空间中的非线性模型。
核函数
主要的核函数有三类：多项式核函数
模型选择
核函数方法中模型选择十分重要,模型选择包括核函数的选择、构造以及参数调整;就SVMs 而言,还包括容量控制参数(正则化参数) 、损失函数的确定等。
基于核的Fisher判别分析
KFDA算法的思想是:引入核方法，通过一个非线性映射,将输入数据映射到一个高维的线性可分的特征空间中,然后在这个特征空间中进行线性Fisher判别分析, 从而实现相对于输入空间的非线性判别分析。在进行KFDA时,首先通过非线性映射Ø 将输入数据映射到一个高维特征空间中, 即
支持向量机方法建立在统计学习理论基础之上，专门针对小样本情况下的机器学习问题。对于分类问题，支持向量机方法根据区域中的样本计算该区域的分类曲面，由该曲面决定该区域中的样本类别。已知样本x 为m 维向量, 在某个区域内存在n个样本: (x1,y1)，(x2,y2)，…，(xn,yn) 其中，xi 是训练元组，xi∈Rm，yi是类标号，yi∈{1,1}。若存在超平面( hyperplane):
最佳投影方向是通过最大化目标函数J(w) W为投影方向。
考虑到J(w)的尺度不变性,令分母为非零常数,用Lagrange乘子法求解得到下面的特征值： W*就是J(w)中的极值解,也就是矩阵S - 1ω Sb的最大特征值对应的特征向量。测试样本在这个向量上的投影系数就是所提取的测试样本的特征值。则FDA的判别函数为 b为偏移量,可以通过求解以下方程得到则对于一待测样本xi ,求Fisher判别分析判别函数 f ( xi ) =w*xi + b,通过f ( xi )正负确定其归属。
ω·x + b = 0
(1)
其中· 表示向量的点积，如图1 所示，超平面能将这n 个样本分为两类,那么存在最优超平面不仅能将两类样本准确分开，而且能使两类样本到超平面的距离最大。式(1) 中的ω和b 乘以系数后仍能满足方程，进行归一化处理之后，对于所有样本xi ，式| ω·xi + b| 的最小值为1 , 则样本与此最优超平面的最小距离为|ω·xi + b |/‖ω‖= 1/‖ω‖,那么最优超平面应满足条件: yi（ω·xi + b）≥1，i=1，…，n. (2)
SVM（Support vector machines)
SVM是基于SLT的一种机器学习方法。简单的
说，就是将数据单元表示在多维空间中，然后对这个空间做划分的算法。
SVM是建立在统计学习理论的VC维理论和结
构风险最小原理基础上的，根据有限的样本信息在模型的复杂性之间寻求最佳折衷，以期获得最好的推广（泛化）能力。