基于支持向量机分类方法论文

合集下载

基于支持向量机方法的医学图像分割

ｉｃｎｉｅｅｏｄｃｎｉａｅｂｃｕｅｏｔｇｏｅｅａｉａｉｎｐｒｒｎｅ，ｓｅｉｌｈｎｔｅｎｍｂｒｏｒｉｉｇｓｍｐｅｓｓｏｓｄｒｄａｇｏａｄｄｔｅａｓｆｉｏｄｇｎｒｌｔｅｆｍａｃｅｐｃａｌｗｅｕｅｆｔａｎｎａｌｓｉｓｚｏｏｙｈ
１ｃｏｌｏｒｎｐｒｔｎ，ｕａｉｅｓｙｏｅｈｏｏｙ，ｕａ３０３，ｉａ．ｈｏｆＴａｓｏｔｉＷｈｎＵｎｖｒｉｆＴｃｎｌｇＷｈｎ４０６ＣｈｎＳａｏｔ２ＷｕａｇｔｌＥｇｎｅｎｎｔｕｅＷｕａ３０４，ｈｎ．ｈｎＤｉｉｎｉｅｒｇＩｓｉｔ，ｈｎ４０７Ｃｉａａｉｔ３ＷｕａｏｅＳｉｎｅ＆Ｔｃｎｌｇｏ，Ｔ，ｕａ３２３，ｈｎ．ｈｎＧｕｃｃｅｃｅｈｏｏｙＣ．ＬＤ，Ｗｈｎ４０２Ｃｉａ
ＬＡＯｕ — ｏｇＱｕＨＵＡＧａｇｆ．ｅｉａｍａｅｓｇｎａｏａｅｎＳｐｏＶｃｒＭａｈｎｐｒａｈＩＧｏｈｎ。ＩＪｎ，ＮＧｕｎ — ｎＭｄｃｌｉｇｅｍｅｔｔｎｂｓｄｏｕｐ￣ｅｔｃｉｅａｐｏｃ．ｉｉｏＣｍｐｔｒＥｇｎｅｉｇａｄＡｐｉａｉｓ２０，３２）２７２９ｏｕｅｎｉｅｒｎｐｌｔｎ，０７４（９：１－１．ｎｃｏ

如何使用支持向量机进行多标签分类问题解决

如何使用支持向量机进行多标签分类问题解决支持向量机（Support Vector Machine，SVM）是一种常用的机器学习算法，广泛应用于分类和回归问题。

在分类问题中，SVM能够有效地解决多标签分类问题，本文将介绍如何使用支持向量机进行多标签分类问题的解决。

一、多标签分类问题简介多标签分类问题是指一个样本可能同时属于多个类别的分类问题。

例如，对于一张包含猫、狗和鸟的图片，我们需要将其同时分类为“猫”、“狗”和“鸟”。

传统的分类算法通常只能处理单标签分类问题，无法应对多标签分类问题。

二、支持向量机的基本原理支持向量机是一种二分类模型，其基本原理是通过构建一个超平面，将不同类别的样本分开。

对于多标签分类问题，我们可以采用一对多（One-vs-Rest）的方法，将每个标签作为一个二分类问题进行处理。

三、数据预处理在使用支持向量机进行多标签分类问题解决之前，我们需要对数据进行预处理。

首先，需要将数据集划分为训练集和测试集。

其次，对数据进行特征提取和特征选择，以便提取出最能表征样本的特征。

四、特征编码在多标签分类问题中，标签通常是以二进制形式表示的，每个标签对应一个二进制位。

例如，对于三个标签的问题，可以用000、001、010、011等方式表示不同的标签组合。

因此，我们需要对标签进行编码，将其转化为二进制形式。

五、训练模型在训练模型之前，我们需要选择一个合适的核函数。

核函数在支持向量机中起到了非常重要的作用，能够将低维的特征映射到高维空间，从而使得样本更容易被分开。

常用的核函数包括线性核函数、多项式核函数和高斯核函数等。

六、模型评估在训练完成后，我们需要对模型进行评估。

常用的评估指标包括准确率、精确率、召回率和F1值等。

通过这些评估指标，我们可以了解模型的性能，并对其进行调优。

七、模型调优在使用支持向量机解决多标签分类问题时，我们可以通过调整参数来提高模型的性能。

常见的参数包括正则化参数C、核函数参数gamma等。

基于支持向量机回归的土壤有机质含量预测

-52-科学技术创新2019.07基于支持向量机回归的土壤有机质含量预测黄婷'轩双霞2(1、南京中医药大学翰林学院，江苏泰州2253002、安徽财经大学，安徽蚌埠233030)摘要：土壤有机质(Soil Organic Matter,SOM)是土壤肥力的重要指标，其含量变化对表征土壤养分含量高低和预测作物产量具有重要的作用。

因此，预测有机质含量变化可以为提前进行土壤有机质积累试验提供理论支持「，本文采集长期定位试验点的土壤信息，对比支持向量机预测方法与反向传播(BP)神经网络和径向基函数(RBF)神经网络，结论得出支持向量机模型预测精确度更优。

关键词：支持向量机;土壤有机质；作物产量；回归预测中图分类号:S15&S153.6+21文献标识码：A1非线性支持向量回归理论拟合和预测是非线性问题卩研究的难点，通常的解决途径是将非线性研究转化为线性研究，关键是变换非线性的特征空间,进行由高到低的降维转换。

2土壤有机质含量预测2.1研究资料本研究的土壤样本来自试验点安徽科技学院安徽阜阳临泉农科所的砂姜黑土，从土壤中提取有机质含量进行预测。

该试验点的种植模式为一年两熟的冬小麦和夏玉米,预测数据来源于2011-2014年安徽阜阳试验点所测有机质含量数据。

在不同的模型预测中，把2011-2013年的有机质含量作为训练数据集，构建不同的对比模型来预测2014年6月和2014年10月土壤有机质含量。

2.2利用支持向量机模型预测有机质含量的方法和步骤首先是数据预处理。

在进行训练和预测之前,先进行数据编号，对数据进行标准化处理,建立将要预测的土壤有机质含量和训练数据集之间的函数模型：y=f(x},x2)其中y为预测集的有机质的含量。

其次是核函数的选择。

下面给出常用的核函数，也是软件包中自带的。

d阶多项式核函数：K(齐,x)=(丁匕・x)+r)",丁>0径向基函数核函数：K(x t,x)=exp(-7||x,.-x||2),7>0神经网络Simgoid反曲核函数：K(x”x)=tanh(7(兀・ x〉+r),丁>0接下来确定模型参数选择方法。

基于SVM技术实现手写数字分类识别的研究

基于SVM技术实现手写数字分类识别的研究1. 引言1.1 研究背景手写数字分类识别是图像识别领域的一个重要应用，其在数字识别、验证码识别、自动化审核等方面都具有广泛的应用价值。

随着深度学习的快速发展，各种卷积神经网络在图像识别领域取得了巨大成功，但是在一些特定应用场景下，传统的支持向量机（SVM）技术仍然具有其独特优势。

鉴于SVM技术在图像识别领域的表现，本研究旨在探究如何基于SVM技术实现手写数字分类识别，提高识别准确度和效率，为相关领域的研究和应用提供参考借鉴。

通过对SVM技术及手写数字分类识别方法的深入研究与实验验证，期望能够为该领域的发展做出一定的贡献。

1.2 研究目的研究目的是通过利用SVM技术实现手写数字分类识别，提高数字识别的准确性和效率。

手写数字分类识别是计算机视觉领域的一个重要研究方向，对于识别手写数字图像具有广泛的应用价值，如数字识别、自动化识别等。

本研究旨在探讨如何利用SVM技术对手写数字图像进行分类识别，并通过实验验证其准确性和实用性。

通过研究，希望能够提高手写数字分类识别的准确率，降低误识率，提高识别速度，为数字识别领域的发展提供参考和借鉴。

本研究还旨在比较SVM技术与其他常用的手写数字分类方法的优劣，探讨SVM技术在手写数字识别中的应用前景和潜力。

通过本研究，将为进一步完善和优化手写数字识别系统提供重要的理论和实践基础。

2. 正文2.1 SVM技术介绍支持向量机（Support Vector Machine，SVM）是一种常用的机器学习方法，主要用于分类和回归分析。

SVM的基本思想是通过寻找最优超平面来对数据进行分类，即找到能够最大化间隔的超平面，从而实现对不同类别的有效分类。

SVM的核心是构建一个能够将不同类别的数据分割开的决策边界，该决策边界由支持向量所确定。

支持向量是训练数据集中离决策边界最近的样本点，它们对SVM的模型起着关键作用。

除了线性核函数外，SVM还可以使用非线性核函数来处理非线性可分的数据。

研究生数学建模竞赛优秀论文

全国第七届研究生数学建模竞赛
题目
基于临床与基因图谱的结肠癌基因标签提取
摘
要
由于基因间的调控和相互作用表现为“功能基因组合”形式，基因的功能与作用是集体作用的结果，而非单个基因单独作用的结果，表现在分类特征对样本的分类能力方面就是以特征集合的形式整体体现出来的。根据这个生物学知识，本文考察由多个基因构成的基因簇作为区分正常人和癌症患者的分类因素，利用独立成分分析(ICA)技术对已给出的基因表达采样数据进行分析，最大程度地降低基因之间强烈的相互影响，从而获得对判断是否患有肿瘤或者癌症的最有直接关系但数目较少的潜在因素，即基因簇信息。随后，我们采用了支持向量机(SVM) 依据提取出的潜在因素（基因簇）进行分类，筛选出致病的癌症基因15个。另外，我们还运用基于灵敏度的支持向量机对基因本身进行分类，而不是基于基因簇。利用得到的结果与基于独立成分分析的方法所提取的基因提供比较。发现所筛选的基因簇中有三个基因与灵敏度支持向量机方法筛选的基因相同。对预处理过后的1908个基因，通过独立成分分析提取出61个基因簇，这些基因簇中含有与分类无关的基因簇，即噪声，以及与分类相关的分类因素5个。事实上，为了能够得到最好的分类因素，我们将问题转化为一类信号稀疏表示的优化问题。此外，为了进一步进行基因分类，我们利用含噪声的ICA和带松弛因子的非光滑优化模型研究带有噪声的基因图谱信息。通过含噪声模型与不含噪声模型进行对比，说明含噪模型的优势。最后，借助于条件概率模型，对病人数据进行了筛选，将临床结论与基因图谱相结合，通过已有文献以及生物信息网站所获取资料发现，所筛选的大部分基因标签与当今临床医学所得到的直肠癌研究结论相吻合。
2
强度值均为 1000，而在另外一种实验条件下的强度值分别为 100 和 10000。如果从对照与实验的绝对值来看，一个基因表达的变化远远大于另一基因，即但是，从生物学的角度出发，两个基因变化的是相等的， 10000-1000>>1000-100 。都是 10 倍的变化。用对数转换可以消除这种由两个相对变化间的不成比例所引起的误导。例如，对数据进行以 10 为底的对数变换，则 lg100 2 lg1000 3 lg10000 4 可以看出，基因的变化是相等的，只是方向不同，一个增大，另一个减小。对数变换减弱了数据的平均值和方差，使得表达的变化独立于其产生的强度位置，从而使得低强度值与高强度值发生的倍数变化具有可比性。另外，对数变换使得数据的分布具有对称性和接近正态分布性质，而一些常用的统计方法，如 t 检验、F 检验等方法都要求数据满足正态分布或近似正态分布。由于本问题中所提供的数据已经是对数形式的，所以可以忽略这一步。（二）重复数据的合并重复的测量可以用于估计实验中的噪声，比较不同处理组间和处理组内的变异。然而，在特定的条件下把所有的重复值合并成一个数值可能更为方便，而这一个值就是给定基因（条件）的代表。根据不同的情况，这些重复测量可能是同一芯片上的重复点，或是同一基因在不同芯片上的测量值。通常的合并是指计算这些重复值的集中趋势指标，如均数、中位数或众数。（三）数据归一化系统误差使得采集到的数据可能含有奇异样本数据，所谓奇异样本数据指的是相对于其他输入样本特别大或特别小的样本矢量。奇异样本数据的存在会影响特征基因的提取。所以，在数据预处理部分，需要对原始数据进行归一化。归一化的具体作用就是归纳统一样本的统计分布性。归一化在 0~1 之间是统计的概率分布，归一化在-1~+1 之间是统计的坐标分布。例如规整原数据到 0,1 内，这样可以降低奇异样本数据对整体的误差影响，从而更加有效地提取特征基因。另外，数据归一化对于独立分量分析（ICA）、支持向量机（SVM）数据处理也是有帮助的。首先，根据附件的文件说明，我们需要对 project_data.txt 里的数据进行以下预处理： 1. 在project_data.txt数据文件中，第二列为UMGAP，HSAC07 或者i的数据是和RNA控制相关的，对下面所做的工作没有关系，为冗余数据，所以需要把这些数据去除。 2. 基因芯片探针探测到的序列表明了基因的表达水平，有些数据可能是同一基因探针的重复点，也有可能是同一基因在不同基因探针上的探测值。因而，对于project_data.txt中基因相同的序列，需消除重复表示，采用了类均值算法，对其进行取平均或取中值处理，给出特定基因的唯一表达数据。以上两步的数据预处理可以保证：处理后的数据较真实地反映了不同基因的不同表达水平。通过以上的预处理，原基因数据从2000个基因减少到了1908个。实验表明， 1908个基因数据为可靠性较高的数据。其次，进行数据归一化处理。采用的归一化映射为：

基于支持向量机和模态曲率的桥梁结构损伤识别

第８期
魏
拓：基于支持向量机和模态曲率的桥梁结构损伤识别
・１４・
式中，（一）（）（＋１分别表示桥ｉ１、ｉ、ｉ）梁结构未损伤时在点（一１、、ｉ）ｉ）ｉ（＋１处的第ｒ阶模态振型值；ｈ为从结点（一１到结点ｉ从结点ｉｉ）和
桥梁结构的损伤识别问题是一个反问题，经神
在实际应用中，态曲率通常是通过对振型曲模
线的近似中心差分获得。第ｒ阶振型在第ｉ个结点处的模态曲率计算公式如下：
网络等计算智能方法得到了广泛的应用。Ｎｒ— ｏｈｉａａｈｒｓｍＢｋａｈｙ等采用神经网络方法对混凝土板
１ｎ
图２单元１６损伤２％、０、０时模态曲率差变化图０３％４％
以单元４１、５的双位置损伤识别为例，其一阶模
（）３
态曲率识别结果如图３所示。
一一一・一
为了获得最优参数Ｗ和ｂ需要解答如下的最，
ＣＳＭＤ＝ＩＭＣＳｌＳ一ＭＣ
模态曲率。２２支持向量机理论．
（）１支持向量机分类算法
（）２
。
其中，ＭＣＳ分别为未损伤及损伤结构的ＣＳ、Ｍ
ｌ
商．＾．．．．，．，
一
．
．
．
…
５
１
性及耐久性的功能降低，易引起严重的垮塌事故。容

最小二乘支持向量机算法及应用研究

最小二乘支持向量机算法及应用研究最小二乘支持向量机算法及应用研究引言：在机器学习领域中，支持向量机（Support Vector Machines, SVM）算法是一种广泛应用于分类和回归分析的监督学习方法。

而最小二乘支持向量机算法（Least Square Support Vector Machines, LS-SVM）则是支持向量机算法的一种变种。

本文将首先简要介绍支持向量机算法的原理，然后重点探讨最小二乘支持向量机算法的基本原理及应用研究。

一、支持向量机算法原理支持向量机是一种有效的非线性分类方法，其基本思想是找到一个超平面，使得将不同类别的样本点最大程度地分开。

支持向量是指离分类超平面最近的正负样本样本点，它们对于分类的决策起着至关重要的作用。

支持向量机算法的核心是通过优化求解问题，将原始样本空间映射到更高维的特征空间中，从而实现在非线性可分的数据集上进行线性分类的目的。

在支持向量机算法中，线性可分的数据集可以通过构建线性判别函数来实现分类。

但是，在实际应用中，往往存在非线性可分的情况。

为了克服这一问题，引入了核技巧（Kernel Trick）将样本映射到更高维的特征空间中。

通过在高维空间中进行线性判别，可以有效地解决非线性可分问题。

二、最小二乘支持向量机算法基本原理最小二乘支持向量机算法是一种通过最小化目标函数进行求解的线性分类方法。

与传统的支持向量机算法不同之处在于，最小二乘支持向量机算法将线性判别函数的参数表示为样本点与分类超平面的最小误差之和的线性组合。

具体而言，最小二乘支持向量机算法的目标函数包括一个平滑项和一个约束条件项，通过求解目标函数的最小值，得到最优解。

最小二乘支持向量机算法的求解过程可以分为以下几个步骤：1. 数据预处理：对原始数据进行标准化或归一化处理，以确保算法的稳定性和准确性。

2. 求解核矩阵：通过选取适当的核函数，将样本点映射到特征空间中，并计算核矩阵。

3. 构建目标函数：将目标函数表示为一个凸二次规划问题，包括平滑项和约束条件项。

SVM支持向量机算法-原理篇

SVM⽀持向量机算法-原理篇本篇来介绍SVM 算法，它的英⽂全称是Support Vector Machine，中⽂翻译为⽀持向量机。

之所以叫作⽀持向量机，是因为该算法最终训练出来的模型，由⼀些⽀持向量决定。

所谓的⽀持向量，也就是能够决定最终模型的向量。

SVM 算法最初是⽤来解决⼆分类问题的，⽽在这个基础上进⾏扩展，也能够处理多分类问题以及回归问题。

1，SVM 算法的历史早在1963 年，著名的前苏联统计学家弗拉基⽶尔·⽡普尼克在读博⼠期间，就和他的同事阿列克谢·切尔沃宁基斯共同提出了⽀持向量机的概念。

但由于当时的国际环境影响，他们⽤俄⽂发表的论⽂，并没有受到国际学术界的关注。

直到 20 世纪 90 年代，⽡普尼克随着移民潮来到美国，⽽后⼜发表了 SVM 理论。

此后，SVM 算法才受到应有的重视。

如今，SVM 算法被称为最好的监督学习算法之⼀。

2，线性可分的 SVMSVM 算法最初⽤于解决⼆分类问题，下⾯我们以最简单的⼆维平⾯上的，线性可分的数据点来介绍⽀持向量机。

假设平⾯上有⼀些不同颜⾊的圆圈，这些圆圈是线性可分的，也就是可⽤⼀条直线分开。

如下：现在想在平⾯上画出⼀条直线，将这些圆圈分开。

通过观察，你很容易就能画出⼀条直线，如下：但是这样的直线会有很多，它们都能正确的划分两类圆圈，就像下⾯这幅图中的⼀样：那么哪条直线才是最好的呢？通过⾁眼我们⽆法找到那条最好的直线。

但是就上图中的三条直线⽽⾔，明显你会觉得中间那条红线，会⽐两侧的两条线要更好。

因为，如果有⼀些圆圈往中间靠拢，那么两侧的那两条直线就不能将两种圆圈划分开了。

⽽中间那条直线依然可以划分两种圆圈。

如下：因此，中间那条红线会⽐两侧的两条直线更好，更安全。

虽然通过⾁眼我们能知道哪条直线更好，但是怎样才能找到最好的那条直线呢？⽽ SVM 算法就可以帮我们找到那条最好的直线。

3，找到最好的直线下⾯我们来看下如何找到最好的那条直线。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

基于支持向量机的分类方法
摘要：支持向量机是建立在统计学习理论基础上的一种小样本机器学习方法，用于解决二分类问题。

本文阐述了支持向量机的理论基础并对核函数的参数选择进行了分析研究。

关键词：支持向量机最优超平面二分类核函数
中图分类号：tp751 文献标识码：a 文章编号：1672-3791(2011)10(c)-0000-00
1 支持向量机
支持向量机是统计学习理论中最年轻的部分，是vapnik等根据统计学习理论中的结构风险最小化原则提出的。

其主要内容在1992到1995年间才基本完成，目前仍处在不断发展阶段。

支持向量机充分考虑了算法的推广能力，很多传统的机器学习方法都可以看作是支持向量机方法的一种实现，因而统计学习理论和支持向量机被很多人认为是研究机器学习问题的一个基本框架。

最优分类超平面的构造
支持向量机方法是从线性可分情况下的最优分类超平面提出的。

对于两类的分类问题，设训练数据，，可以被一个超平面分开，即存在，使
(2.1)
分类的目的是寻求来最佳分离两类数据。

此时假设空间为：
(2.2)
在这个公式里，为符号函数，和是非零常数，能任意缩放。

为
减少分类超平面的重复，对进行如下约束：
(2.3)
考虑图2.1所示的二维两类线性可分情况，图中实心点和空心点分别表示两类训练样本，为把两类没有错误地分开的分类线，、分别为过各类样本中离分类
图2.1 最优分类超平面
线最近的点且平行于分类线的直线，和之间的距离叫做两类的分类间隔（margin）。

所谓最优分类线就是要求分类线不但能将两类无错误地分开（训练错误率为0），而且要使两类的分类间隔最大。

推广到高维空间，最优分类线就成为最优分类超平面。

由约束条件式得：
(2.4)
3 支持向量机的算法
3.1 线性可分情况
在结构风险最小化原则下的最优超平面可以通过最小化泛函
得到。

按照最优化理论中二次规划的解法，可把该问题转化为wolfe对偶问题来求解。

构造lagrange函数：
(3.1)
式中为lagrange乘子。

可采用优化算法解得最优超平面为：
(3.2)
3.2 非线性可分情况
对于非线性可分的问题，需要将样本通过非线性函数映射到高维特征空间中，使其线性可分，再在该特征空间中建立优化超平面：。

于是，原样本空间的二元模式分类问题可以表示为：
(3.3)
支持向量机利用核函数简便地解决了这个问题。

只要一个核函数满足mercer条件，它就对应某一变换空间的内积，即。

此时的二次优化最终结果为
(3.4)
4 仿真研究
本文采用iris标准数据集进行仿真实验，其数据是用来测试机器学习的uml标准数据库。

iris数据集包括三类数据：versicolor （类1），virginica（类2）和setosa（类3）。

在这三个类别中，类1与其余的两类之间分类比较复杂，所以，我将类1看作一类，类2和类3看作另一类，研究一个二分类问题。

利用s.r.gunn编写的matlab中的支持向量机工具箱。

本文采用目前较为常见的多项式核函数的模型选择问题进行仿真研究。

(4.1)
首先运行svm_stevegunn工具箱中的uniclass.m函数即得图4.1中的界面。

其中，直径较小的点为类1，主要分布于中间的区域；直径较大的点为类2和类3，分布于左下和右上两侧。

在下拉菜单中选择polynomial，表示选用多项式核函数。

可以选择separable（可分的）和不可分的两种算法进行分类，我分别对其
进行了测试并比较。

4.1 可分的情况
首先选择separable的情况，整个模型仅有多项式的阶次（degree）一个参数需要确定，我将其从1开始逐步增大。

取不同degree值时，支持向量机的相关性能参数如下表所示，主要有五项：执行时间、错分样本数、分类间隔、支持向量个数以及支持向量的百分比。

a) 当degree由1变为2时，错分的样本个数显著减小，由此可见核函数的参数对于正确分类起着很大的作用。

b) 当degree取上述四个值的时候，分类间隔都非常小，意味着支持向量机的泛化能力差。

c) 当degree=4时，支持向量机的各项性能较好。

4.2 不可分的情况
不在separable之前打勾，此时引入惩罚参数c，即程序中的bound。

固定可分时性能最佳的参数degree=4，从小到大改变c的大小：
a) 与表4.1对比，不可分情况下支持向量机的执行时间较可分情况明显减小，分类间隔则明显增大，可见引入c参数确实起到了正面的作用。

b) c参数越大，分类的正确率越高，但分类间隔越小。

因为c 参数是在目标函数里对错分的样本点进行惩罚的，所以选取大的c，意味着更强调最小化训练错误，但也同时削弱了泛化能力。

c) c参数增大的过程中，支持向量个数基本呈减小的趋势，但是当c大到一定程度之后，对支持向量的数目影响不大。

d) 当c=50时，支持向量机的综合性能较好。

所谓最优分类面就是要求分类面不但能将两类无错误地分开，而且要使两类的分类间隔最大、支持向量数目最少。

这是一个折衷的过程，也正是核函数模型选择的难点所在。

进一步地，固定c=50，调节degree参数，寻找不可分情况下的最优支持向量机。

5 结论
本文在阐述支持向量机原理的基础上，通过matlab仿真实验探讨了支持向量机模型选择的问题，得到了以下结论：c参数越大，分类的正确率越高，但分类间隔越小。

因为c参数是在目标函数里对错分的样本点进行惩罚的，所以选取大的c，意味着更强调最小化训练错误，但也同时削弱了泛化能力。

当参数时，线性软间隔分类机算法即退化为线性硬间隔分类机，此时可以认为两个算法相同。

参考文献
[1] 李国正，王猛，曾华军译. 支持向量机导论[m]. 北京：电子工业出版社，2004.
[2] 祁享年. 支持向量机及其应用研究综述[j]. 计算机工程，2004，30(10)：8-9.
[3] 许建华，张学工，李衍达. 支持向量机的新发展[j]. 控制
与决策，2004，19(5)：481.
[4] 谢芳芳. 基于支持向量机的故障诊断方法[d]. 长沙：湖南大学，2006.
[5]刘定平,叶向荣,陈斌源,汤美玉. 基于核主元分析和最小二乘支持向量机的中速磨煤机故障诊断[j]动力工程, 2009,(02).
[6] 吕成岭. 基于支持向量机的故障诊断方法研究[d]. 江南大学, 2009。