支持向量机理论及算法研究综述_汪海燕

合集下载

基于支持向量机和盒维数的滚动轴承状态预测

基于支持向量机和盒维数的滚动轴承状态预测

第42卷第3期2023年6月沈㊀阳㊀理㊀工㊀大㊀学㊀学㊀报JournalofShenyangLigongUniversityVol 42No 3Jun 2023收稿日期:2022-08-28基金项目:国家自然科学基金项目(52004165ꎬ51905357)ꎻ沈阳理工大学博士科研启动基金项目(1010147000818)作者简介:刘天顺(1995 )ꎬ男ꎬ硕士研究生ꎮ通信作者:谷晓娇(1989 )ꎬ女ꎬ副教授ꎬ博士ꎬ研究方向为设备故障诊断㊁运行状态监测㊁安全性预测ꎮ机械工程文章编号:1003-1251(2023)03-0082-06基于支持向量机和盒维数的滚动轴承状态预测刘天顺ꎬ谷晓娇ꎬ李时雨(沈阳理工大学机械工程学院ꎬ沈阳110159)摘㊀要:针对轴承在运行过程中状态难以预测的问题ꎬ提出一种基于最小二乘支持向量机(LSSVM)结合分形盒维数的方法预测滚动轴承状态ꎮ首先ꎬ分析滚动轴承在正常和三种故障状态下的盒维数和峭度值ꎻ然后ꎬ分析盒维数和峭度值对轴承运行状态的描述ꎻ最后ꎬ借助改进LSSVM预测轴承信号的盒维数和峭度值ꎮ实验结果表明ꎬ分形盒维数能对正常状态㊁内外圈及滚动体故障进行区分ꎬ结合峭度值能提高分类识别效果ꎬ改进的LSSVM方法能准确地预测特征参数ꎬ从而实现对轴承状态的预测ꎮ关㊀键㊀词:滚动轴承ꎻ盒维数ꎻ特征参数ꎻ最小二乘支持向量机中图分类号:TH133.33文献标志码:ADOI:10.3969/j.issn.1003-1251.2023.03.013RollingBearingConditionPredictionBasedonSupportVectorMachineandBoxDimensionLIUTianshunꎬGUXiaojiaoꎬLIShiyu(ShenyangLigongUniversityꎬShenyang110159ꎬChina)Abstract:Aimingatthedifficultytopredicttheconditionofarollingbearingduringitsop ̄erationꎬtheimprovedLSSVMwithfractalboxdimensionmethodisproposed.Firstlyꎬtheboxdimensionandkurtosisvaluesofrollingbearingsundernormalandthreefaultcondi ̄tionsareanalyzedrespectively.Thenꎬonthisbasisꎬthedescriptionoftheoperatingstateofthebearingbytheboxdimensionandkurtosisvaluesisanalyzed.FinallyꎬtheboxdimensionandkurtosisvaluesofbearingsignalsarepredictedbyusingtheimprovedLSSVM.Theex ̄perimentalresultsshowthattheimprovedLSSVMmethodcombinedwithfractalboxdi ̄mensioncaneffectivelydistinguishthenormalfromrollingbearingfaultsandtheinnerandouterringfaults.Bycombiningthekurtosisvaluetheclassificationandrecognitioneffectcanbeimproved.Atthesametimeꎬthemethodcanpredictthecharacteristicparametersmoreaccuratelyꎬsoastorealizethepredictionofthebearingstate.Keywords:rollingbearingꎻboxdimensionꎻcharacteristicparameterꎻleastsquaresupportvectormachine㊀㊀轴承作为机械设备的主要核心零件ꎬ广泛应用于工业生产㊁交通运输㊁农业机械㊁国防军用装备等领域ꎮ轴承一旦出现问题会直接影响整个设备的运行ꎬ甚至停工停产ꎬ造成重大事故和损失ꎮ因此ꎬ有效地对轴承进行状态预测及状态评估ꎬ便于实时制定出相应的维修更换策略ꎬ对保障机械设备的正常使用具有重要意义[1-3]ꎮ实现对轴承运行状态的预测及评估ꎬ一方面需要准确预测并确定运行状态相关数据ꎬ另一方面需要提出状态数据分类的有效方法ꎮ关于数据预测的方法ꎬ机械领域常用最小二乘支持向量机(LeastSquareSupportVectorMachineꎬLSSVM)算法ꎬ其求解形式由凸二次规划问题转变为线性方程组[4-6]ꎬ提升了求解速度ꎬ在很大程度上降低了运算的复杂程度ꎮ但LSSVM算法也存在不足之处ꎬ如最优参数难以确定㊁稳定性差等问题ꎮ近年来ꎬ为使LSSVM更好地应用于工程实践ꎬ许多学者基于LSSVM算法对数据预测领域进行了深入的探索ꎮ罗小燕等[7]提出了一种基于粒子群算法的LSSVMꎬ极大提高了LSSVM预测模型的拟合性能ꎮ董程阳[8]提出了一种基于多特征融合与改进鲸鱼算法优化LSSVM的电机轴承故障识别方法ꎬ通过该诊断方法使电机轴承的故障识别率提高到99.5%以上ꎮ孟凡念等[9]以预测值和真值间差值范数最小为目标导向ꎬ优化出LSSVM模型ꎬ实现了对轴承振动信号的预测ꎮ状态数据分类的实现有赖于轴承运行状态参数的选择ꎬ所选择的状态参数需要对轴承运行状态实现准确的表达区分ꎮ大量研究成果表明ꎬ在代表轴承运行状态的参数中ꎬ振动信号的峭度值对不同的运行状态颇具敏感性ꎬ峭度值的变化能体现轴承的运行状态[10-11]ꎮ分形理论是解决非线性行为和复杂性问题的一个新型且活跃的理论[12-15]ꎬ该理论将盒维数与峭度值相结合来研究轴承的非线性运行状态ꎮ本文根据LSSVM和盒维数的特点及优势ꎬ提出一种基于LSSVM和盒维数的轴承运行状态预测方法ꎮ首先计算出不同运行状态下轴承振动信号的盒维数和峭度值ꎬ再通过改进的LSSVM方法进行数据预测ꎬ最后对预测结果进行分类识别ꎬ实现对轴承运行状态的预测ꎮ1㊀改进的LSSVM算法传统LSSVM算法考虑的往往只是单个特征参数随时间的变化趋势ꎬ未考虑不同特征参数之间的相互作用ꎬ而实际情况中ꎬ各个状态特征参数之间存在相关性ꎬ某一状态特征参数的变化会在一定程度上影响其他参数的变化ꎮ针对该问题ꎬ对LSSVM进行改进ꎬ分别采用时间对特征参数影响和参数间相关性两方面来预测ꎮ时间对特征参数影响的LSSVM预测方式为采用参数自身的历史数据来预测该参数在下一时刻的数值ꎬ此时输入数据为V={v1ꎬv2ꎬ ꎬvn}ꎬ即基于某一特征参数vi在时间t之前的测试数据xiꎬtꎬxiꎬt-1ꎬ ꎬxiꎬt-m+1进行数据预测ꎬ其中m是预设的嵌入尺寸ꎮ由LSSVM得到拟合函数f1ꎬ参数vi在时间t+1上的值为xiꎬt+1=f1(xiꎬtꎬxiꎬt-1ꎬ ꎬxiꎬt-m+1)(1)参数间相关性的LSSVM预测方式为采用上一时刻全部参数的历史数据预测某一参数在下一时刻的数值ꎬ采用特征参数集V在时间t上的测试数据ꎮ利用LSSVM得到拟合函数f2ꎬ参数vi在时间t+1上的值为xiꎬt+1=f2(x1ꎬtꎬx2ꎬtꎬ ꎬxnꎬt)(2)以上两种LSSVM预测模型分别考虑了时间对特征参数的影响ꎬ以及各参数之间的交互作用ꎮ为提高预测精度ꎬ需要对两种预测模型进行合理融合ꎮ当使用时间对参数影响的LSSVM预测方式时ꎬ特征参数vi在时间t+1上的预测值表示为x1iꎬt+1ꎻ当使用参数间相关性的LSSVM预测方式时ꎬ特征参数vi在时间t+1上的预测值表示为x2iꎬt+1ꎮ基于两个预测值ꎬ构建组合函数为xiꎬt+1=f(x1iꎬt+1ꎬx2iꎬt+1)(3)组合函数的加权形式为xiꎬt+1=ω1iꎬt+1x1iꎬt+1+ω2iꎬt+1x2iꎬt+1(4)式中:ω1iꎬt+1是考虑时间对参数影响的LSSVM模型的权重ꎻω2iꎬt+1是考虑参数间相关性的LSSVM模型的权重ꎮ采用改进的D ̄S理论[16]获取权重值ꎮ假设有n个特征参数ꎬ以预测第i个特征参数在时间t+2上的数值为例ꎬ改进的LSSVM算法步骤如下:38第3期㊀㊀㊀㊀㊀刘天顺等:基于支持向量机和盒维数的滚动轴承状态预测1)对按时间序列排布的t组数据的n个特征参数值进行计算ꎻ2)采用按时间序列排布的1至t组数据的第i个特征参数值预测第t+1组数据的第i个特征参数值ꎻ3)采用第t组数据的n个值预测第t+1组数据的第i个值ꎻ4)根据t+1时刻的实际计算结果ꎬ结合D ̄S理论获取权重值ꎬ确定步骤(2)和步骤(3)中第i个特征参数在LSSVM算法中所对应的权重ꎻ5)以考虑权重的LSSVM算法作为预测模型ꎬ用来预测t+2时刻的特征参数值ꎮ改进LSSVM流程如图1所示ꎮ图1㊀改进LSSVM流程图2㊀分形盒维数分形是对没有特征长度但具有一定意义的自相似图形和结构的总称ꎬ盒维数能够实现自相似性的定量描述ꎬ从而表达出某一信号的分形特征ꎬ基于此原理ꎬ分形理论能对工程中不同运行状态下的信号特征进行区分ꎮ轴承运行状态特征参数的选择是机械运行状态识别研究的关键问题ꎬ直接关系到信号区分结果的准确性和预测的可靠性ꎬ采用分形盒维数来描述轴承的运行状态ꎬ有利于实现对轴承振动状态的可视化评价ꎮ盒维数具有计算简单㊁物理意义明确的优势ꎬ盒维数能够体现一维曲线对平面的占布能力ꎬ且与振动的频谱分布具有一定的关联性ꎬ但盒维数也有局限性ꎬ其对频谱中单个尖峰不敏感ꎬ在旋转零件的振动分析方面存在不足ꎮ因此ꎬ采用峭度和盒维数共同描述轴承的运行状态ꎮ设离散信号y(i)⊂Rnꎬ其中y(i)可以用尽可能小的边长为ε的格形覆盖ꎬN(ε)表示网格计数ꎬ将ε逐步放大到k倍ꎬ网格边长为kεꎮ令N(kε)为离散空间集合网格数ꎬ计算公式为N(kε)=P(kε)/(kε)+1(5)P(kε)=ðN/ki=1|max{yk(i-1)+1ꎬyk(i-1)+2ꎬ ꎬyk(i-1)+k+1}㊀㊀㊀-min{yk(i-1)+1ꎬyk(i-1)+2ꎬ ꎬyk(i-1)+k+1}|(6)式中k=1ꎬ2ꎬ ꎬMꎬM<NꎬM㊁N为离散空间采样点数ꎮ在对数坐标中ꎬ选定线性较好的一段为无标度区ꎬ假设无标度区的起点为k1ꎬ终点为k2ꎬ则lgN(kε)=alg(kε)+b㊀k1ɤkɤk2(7)采用最小二乘法确定该直线的斜率为^a=-(k2-k1+1)ðlgklgN(kε)-ðlgkðlgN(kε)(k2-k1+1)ðlg2k-(ðlgk)2(8)盒维数DB为DB=^a(9)峭度K为描述波形尖峰度的无量纲参数ꎬ其数学表达式为K=1pðpi=1(si-μ)41pðpi=1(si-μ)2()2(10)式中:i=1ꎬ2ꎬ ꎬpꎻs为信号时域波形离散序列点对应的振动幅值ꎻμ为信号的均值ꎻp为离散序列点数ꎮ3㊀实验验证实验使用旋转机械振动故障实验台(镇江华飞检测技术有限公司)采集轴承振动信号ꎬ如图2所示ꎮ实验设置采样频率fs=2000Hzꎬ采集时间为10sꎬ去掉启动前和结束阶段ꎬ选取中间连续10240个点ꎮ48沈㊀阳㊀理㊀工㊀大㊀学㊀学㊀报㊀㊀第42卷图2㊀旋转机械振动故障实验平台㊀㊀实验采用的轴承(型号为SKF6205 ̄2RS)分别具有正常㊁内外圈及滚动体故障四种状态ꎮ在轴承内㊁外圈采用线切割形成宽1mm㊁深1mm的凹槽用来模拟内㊁外圈故障ꎮ用电火花在轴承滚动体上局部破坏ꎬ用于模拟滚动体故障ꎮ轴承结构参数信息详见表1ꎮ表1㊀轴承结构参数mm内圈直径外圈直径轴承厚度滚珠直径节圆直径25.0052.0015.007.9439.04㊀㊀每种类型的轴承分别采集50组数据ꎬ共200组数据ꎬ按时间顺序排列并编号ꎬ然后对四类状态数据分别进行盒维数的计算ꎮ四种状态的轴承振动分形盒维数计算结果如图3所示ꎮ图3㊀分形盒维数计算结果㊀㊀由图3计算结果可知ꎬ正常状态的盒维数范围是0.06~0.07ꎬ具有内圈故障的轴承盒维数范围是0.12~0.135ꎬ具有外圈故障的轴承盒维数范围是0.12~0.14ꎬ具有滚动体故障的轴承盒维数范围是0.075~0.065ꎮ不同运行状态的盒维数计算结果之间存在重叠现象ꎬ如内圈故障和外圈故障基本重叠ꎬ滚动体故障和正常轴承的盒维数比较接近ꎬ故单一的盒维数不能对全部运行状态做出有效区分ꎮ为对不同运行状态的轴承进行分类ꎬ分别对正常㊁内外圈及滚动体故障四种状态轴承的峭度值进行计算ꎮ计算结果如图4所示ꎮ图4㊀峭度计算结果㊀㊀由图4计算结果可知ꎬ正常状态的峭度范围是2.8~3.2ꎬ具有内圈故障的轴承峭度范围是2.9~3.5ꎬ具有外圈故障的轴承峭度范围是3.4~4.0ꎬ具有滚动体故障的轴承峭度范围是2.6~2.9ꎮ因此ꎬ图3中盒维数计算结果重叠的内圈故障和外圈故障通过峭度能够被有效区分ꎬ同样ꎬ图3中重叠的滚动体故障和正常轴承也被有效区分ꎮ可见ꎬ结合盒维数和峭度值各自的特性能对四种运行状态进行有效区分ꎮ根据盒维数和峭度的计算结果进行分类ꎬ结果如图5所示ꎮ由图5可以看出ꎬ仅内㊁外圈故障两种状态有少许数量重叠ꎬ轴承的四种状态均得到了很好的区分ꎬ避免了盒维数对振动尖峰不敏感的问题ꎮ为实现对轴承运行状态的预测ꎬ分别对正常㊁内外圈及滚动体故障四种状态各50组数据盒维数计算结果进行数据预测ꎮ先根据四种运行状态下1~50组数据的盒维数采用LSSVM预测出第51组的盒维数ꎬ再根据峭度值与盒维数之间的相互影响预测出第51组的盒维数ꎬ最后采用D ̄S理论把两个盒维数的预测结果进行加权计算ꎮ采用此方法预测出51~54组的盒维数ꎬ预测结果如图6所示ꎮ58第3期㊀㊀㊀㊀㊀刘天顺等:基于支持向量机和盒维数的滚动轴承状态预测图5㊀计算结果分类图6㊀盒维数预测结果㊀㊀由图6可以看出ꎬ盒维数的预测值均分布在轴承对应的状态范围内ꎬ故盒维数值对于轴承振动信号的分类识别有很高的参考价值ꎮ分别对正常㊁内外圈及滚动体故障四种运行状态共200组数据峭度的计算结果进行数据预测ꎮ采用和图6同样的方法预测第51组的峭度值ꎬ最后采用D ̄S理论把两个峭度的预测结果进行加权计算ꎮ采用此方法预测出51~54组的峭度值ꎬ预测结果如图7所示ꎮ由图7可知ꎬ计算结果的预测值与实际测试的峭度值近乎相等ꎬ结果比较准确ꎮ以第51组参数为例ꎬ对比LSSVM算法及改进的LSSVM算法预测结果与实际测量值ꎬ结果如表2所示ꎮ由表2可知ꎬ与传统的LSSVM算法相比ꎬ采用改进LSSVM算法ꎬ四种运行状态盒维数的预测误差精度分别提高了33.33%㊁60.00%㊁71.40%㊁60.00%ꎬ平均提高56.18%ꎬ峭度值的预图7㊀峭度预测结果表2㊀预测结果与实际测量值样本类型盒维数LSSVM改进的LSSVM实际值峭度LSSVM改进的LSSVM实际值正常状态0.0620.0640.0683.3483.1973.052外圈故障0.1360.1290.1313.1933.4393.548滚动体故障0.0650.0700.0722.4322.6952.701内圈故障0.1350.1280.1302.8923.1483.213测误差精度分别提高了51.01%㊁69.30%㊁97.77%㊁79.75%ꎬ平均提高了74.46%ꎮ表明改进的LSSVM提高了对轴承状态运行参数预测的准确性ꎮ将预测的51~54组与实测的1~50组盒维数和峭度的计算结果放在同一分类图形中ꎬ预测结果分类如图8所示ꎮ图8㊀预测结果分类㊀㊀由图8可知ꎬ预测的结果值均分布于实测的真实值附近ꎬ轴承四种状态均得到有效区分ꎮ表明该方法能对轴承状态实现较准确的预测ꎬ在轴68沈㊀阳㊀理㊀工㊀大㊀学㊀学㊀报㊀㊀第42卷承运行状态的识别上起到很好的作用ꎮ4 结论本文采用改进的LSSVM方法ꎬ引入分形理论中的盒维数和运行状态参数中的峭度值对轴承在正常㊁内外圈及滚动体故障情况下的运行状态预测及分类识别进行分析比较ꎬ结论如下ꎮ1)改进的LSSVM方法能更准确地预测特征参数ꎬ相较于传统的LSSVM方法ꎬ对盒维数的预测误差精度平均提高了56.18%ꎬ对峭度的预测误差精度平均提高了74.46%ꎮ2)盒维数能对正常状态㊁内外圈及滚动体故障进行分类ꎬ通过峭度值能区分内外圈故障ꎬ也能区分正常状态和滚动体故障ꎬ两种特征参数相结合提高了分类识别效果ꎮ3)改进的LSSVM方法能实现对峭度值及盒维数的预测ꎬ结合轴承运行状态的分类识别ꎬ实现了对轴承运行状态的预测ꎮ参考文献:[1]TOMARNꎬKIMJM.Bearingfaultclassificationofinductionmotorsusingdiscretewavelettransformandensemblemachinelearningalgorithms[J].AppliedSciences ̄Baselꎬ2020ꎬ10(15):5251.[2]ZHUXXꎬLUOXZꎬZHAOJHꎬetal.Researchondeepfeaturelearningandconditionrecognitionmethodforbearingvibration[J].AppliedAcousticsꎬ2020ꎬ168:107435.[3]魏永合ꎬ宫俊宇.基于CNN ̄LSTM ̄Attention的滚动轴承故障诊断[J].沈阳理工大学学报ꎬ2022ꎬ41(4):73-77.[4]万晓静ꎬ孙文磊ꎬ陈坤.小波包能量熵和改进的LSS ̄VM在风力机轴承故障诊断中的应用[J].水电能源科学ꎬ2021ꎬ39(2):142-145.[5]CORTESCꎬVAPNIKV.Support ̄vectornetworks[J].MachLearnꎬ1995ꎬ20(3):273-297. [6]HUANGXLꎬSHILꎬSUYKENSJAK.Asymmetricleastsquaressupportvectormachineclassifiers[J].ComputationalStatisticsandDataAnalysisꎬ2014ꎬ70(2):395-405.[7]罗小燕ꎬ黄耀锋ꎬ李波波ꎬ等.基于PSO ̄LSSVM球磨机负荷参数预测及监测系统开发[J].噪声与振动控制ꎬ2022ꎬ42(4):144-151.[8]董程阳.基于MFF与IWOA ̄LSSVM的电机轴承故障诊断研究[J].机电工程ꎬ2022ꎬ39(6):806-812. [9]孟凡念ꎬ杜文辽ꎬ李浩ꎬ等.基于混沌理论的滚动轴承振动信号融合模型预测[J].航空动力学报ꎬ2020ꎬ35(8):1664-1675.[10]涂文兵ꎬ梁杰ꎬ周建民ꎬ等.滚动轴承振动特性评价指标工况敏感度分析[J].噪声与振动控制ꎬ2022ꎬ42(4):93-99ꎬ131.[11]赵洪山ꎬ李浪ꎬ王颖.一种基于盲源分离和流形学习的风电机组轴承故障特征提取方法[J].太阳能学报ꎬ2016ꎬ37(2):269-275.[12]张美芸ꎬ魏晖ꎬ樊富起.滚动轴承外圈失效的盒维数与信息维数特征[J].机械设计与制造ꎬ2019(9):227-230.[13]李洋ꎬ李春ꎬ杨阳.基于EEMD及分形方法的轴承振动信号分析[J].热能动力工程ꎬ2018ꎬ33(8):38-44.[14]陈龙ꎬ邵梦博ꎬ孟相旭ꎬ等.滚动轴承振动信号的多重分形特性分析[J].轴承ꎬ2020(9):43-49ꎬ56. [15]刘楠.基于变分模态分解的风力发电机组叶轮不平衡检测方法[J].电子测量技术ꎬ2021ꎬ44(24):147-152.[16]徐廷学ꎬ丛林虎ꎬ董琪.基于UGM ̄ULSSVM的导弹制导控制系统状态预测方法[J].上海交通大学学报ꎬ2015ꎬ49(12):1761-1767.(责任编辑:徐淑姣)78第3期㊀㊀㊀㊀㊀刘天顺等:基于支持向量机和盒维数的滚动轴承状态预测。

支持向量机理论及算法研究综述

支持向量机理论及算法研究综述

支持向量机理论及算法研究综述WANG Hai-yan;LI Jian-hui;YANG Feng-lei【期刊名称】《计算机应用研究》【年(卷),期】2014(31)5【摘要】介绍了SVM的理论基础和它的多种主要算法及这些算法的利弊与发展现状,并介绍了SVM在现实生活中的应用原理及应用现状。

最后分析了SVM在发展中的不足之处,指出了其研究方向及前景,并提出在分布式支持向量机这个方向上可以进行更深层次的研究。

%This paper introduced the theoretical basisof support vector machine, in addition, it described some algorithms about SVM and analysed their advantages and disadvantages and development status.Then it introduced the application principle of SVMin the【总页数】6页(P1281-1286)【作者】WANG Hai-yan;LI Jian-hui;YANG Feng-lei【作者单位】Science Data Center,Computer Network Information Center,Chinese Academy of Sciences,Beijing 100190,Chin;Science Data Center,Computer Network Information Center,Chinese Academy of Sciences,Beijing 100190,Chin;Science Data Center,Computer Network Information Center,Chinese Academy of Sciences,Beijing 100190,Chin 【正文语种】中文【中图分类】TP301【相关文献】1.支持向量机理论及其在复杂电机设计中的应用 [J], 王群京;鞠鲁峰;钱喆;姜卫东;吴海岸2.支持向量机理论及其在遥感图像处理中的应用 [J], 丁海勇;卞正富3.支持向量机理论与算法研究综述 [J], 丁世飞;齐丙娟;谭红艳4.支持向量机理论及应用 [J], 马旭霞;5.基于谱风险度量的支持向量机理论及在银行信贷中的应用 [J], 李瑞祺;韩有攀因版权原因,仅展示原文概要,查看原文内容请购买。

支持向量机原理SVMPPT课件

支持向量机原理SVMPPT课件

回归分析
除了分类问题,SVM也可以用于 回归分析,如预测股票价格、预 测天气等。通过训练模型,SVM
能够预测未知数据的输出值。
数据降维
SVM还可以用于数据降维,通过 找到数据的低维表示,降低数据
的复杂性,便于分析和理解。
02 支持向量机的基本原理
线性可分与不可分数据
线性可分数据
在二维空间中,如果存在一条直线, 使得该直线能够将两类样本完全分开 ,则称这些数据为线性可分数据。
支持向量机原理 svmppt课件
目录
CONTENTS
• 引言 • 支持向量机的基本原理 • 支持向量机的数学模型 • 支持向量机的优化问题 • 支持向量机的核函数 • 支持向量机的训练和预测 • 支持向量机的应用案例 • 总结与展望
01 引言
什么是支持向量机
定义
支持向量机(Support Vector Machine,简称SVM)是一种监督学习算法, 用于分类和回归分析。它通过找到一个超平面来分隔数据集,使得分隔后的两 类数据点到该平面的距离最远。
支持向量机的优势和局限性
01
对大规模数据集效 率较低
对于大规模数据集,支持向量机 可能需要较长时间进行训练和预 测。
02
核函数选择和参数 调整
核函数的选择和参数调整对支持 向量机的性能有很大影响,需要 仔细选择和调整。
03
对多分类问题处理 不够灵活
对于多分类问题,支持向量机通 常需要采用一对一或一对多的策 略进行处理,可能不够灵活。
图像识别
• 总结词:支持向量机用于图像识别,通过对图像特征的提取和分类,实现图像 的自动识别和分类。
• 详细描述:支持向量机在图像识别中发挥了重要作用,通过对图像特征的提取 和选择,将图像数据映射到高维空间,然后利用分类器将相似的图像归为同一 类别,不相似图像归为不同类别。

支持向量机理论概述

支持向量机理论概述

支持向量机理论概述中图分类号:o213 文献标识:a 文章编号:1009-4202(2010)11-347-01摘要支持向量机是数据挖掘的新方法,也是一种小样本统计工具,它在解决小样本、非线性及高维的模式识别问题上具有其他机器学习方法难以企及的优势。

本文概述了支持向量机的理论发展过程,并在前人研究的基础上,对支持向量机的算法进行了改进。

关键词支持向量机核函数多分类一、支持向量机概念支持向量机(support vector machine,svm)是由vapnik等人提出的一种新的机器学习方法,是以vc维理论和结构风险最小化原则为基础的。

1981年,vapnik和他的合作者提出了svm的重要基础理论&not;&not;---vc维。

1982年,vapnik提出了具有划时代意义的结构风险最小化原则。

1992年,boser.guyon和vapnik等人提出最优边界分类器算法,这是支持向量机算法的最初模型。

1993年,cortes和vapnik进一步探讨了非线性情况下最优边界分类问题。

二、支持向量机的理论发展(1)核函数的构造,如核主成分分析等。

基于不同的应用领域,构造不同的核函数。

现在核函数广泛应用的类型有:多项式逼近、贝叶斯分类器、径向机函数、多层感知器等。

(2)svm从两类问题向多类问题的推广,以weston在1998年提出的多类算法为代表,在经典svm理论的基础上,直接在目标函数上进行改进,重新构造多值分类模型,建立k分类svm。

(3)与目前其他机器学习方法的融合。

如:最小二乘支持向量机,研究的问题已推广到对于大规模数据集的处理;处理数据的鲁棒性;参数调节和选择问题等。

(4)与数据预处理方法的结合,将数据中脱离领域知识的信息即数据本身的性质融入svm的算法而产生的新算法。

(5)svm训练算法的探索,提高svm的计算速度,处理大规模问题。

vapnik在1995年提出了一种块算法,即如果删除矩中对应拉格朗日乘数为0的行和列,将不会影响最终结果。

支持向量机及其应用研究综述

支持向量机及其应用研究综述

题时具有优越性,而且对于小样本数据集也表现出良好的性能。
支持向量机的工作原理可以概括为以下几个步骤:
1、构建超平面:通过训练数据集,支持向量机试图寻找一个超平面,将不 同类别的样本分隔开。这个超平面是由支持向量所决定的。
2、最大化间隔:支持向量机通过最大化间隔来提高泛化能力,间隔越大, 对训练数据集的泛化性能越好。
SVR具有很好的鲁棒性和泛化能力,这使得它在许多领域中都得到了广泛的 应用。
在应用方面,支持向量回归机已被广泛用于各种时间序列预测、函数逼近、 分类等问题中。例如,在金融领域,SVR被用于股票价格预测(Krauss et al., 2007);在医学领域,SVR被用于基因表达数据的分析(Liu et al., 2009)
三、支持向量机在文本分类中的 应用
文本分类是支持向量机应用的另一个重要领域。在文本分类中,支持向量机 可以用于文本的分类、聚类和情感分析等。
在文本分类中,支持向量机可以通过对文本进行特征提取,将不同的文本分 类到不同的类别中。常见的文本特征提取方法包括词袋模型、TF-IDF权重和词嵌 入等。在分类效果的评价中,准确率、召回率和F1得分是常用的评价指标。
一、支持向量机算法及其优化
支持向量机是一种基于统计学习理论的二分类模型,其基本思想是在高维空 间中找到一个最优超平面,将不同类别的样本分隔开来。这个最优超平面是根据 训练样本所构成的向量空间来确定的,通过求解一个二次规划问题来得到。
在支持向量机中,每个样本点都对应一个支持向量,这些支持向量构成了最 优超平面的法向量。为了获得更好的分类性能,支持向量机采用核函数(Kernel Function)将样本映射到高维空间,并在高维空间中构造最优超平面。常见的核 函数有线性核、多项式核和径向基核(RBF)等。

支持向量机的理论与算法研究概要

支持向量机的理论与算法研究概要

北京邮电大学博士学位论文支持向量机的理论与算法研究姓名:王国胜申请学位级别:博士专业:信号与信息处理指导教师:钟义信20070601北京邮电大学博上论文摘要支持向量机的理论与算法研究摘要机器学习是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,从而不断改善自身性能。

它是人工智能最早关注的问题之一,是使计算机具有智能的根本途径。

一个不具有学习能力的智能系统难以称得上真正的智能系统,但以往的智能系统普遍缺少学习能力。

例如,它们的推理仅限于演绎而缺少归纳,因此至多只能够证明已存在的事实、定理,而不能发现新的定理、定律和规则等。

随着人工智能的深入发展,这些局限性表现得愈加突出。

机器学习历经几十年发展,产生了各种各样的方法。

从学习所依赖的经验(输入)与学习所要获得的结果(输出)之间的关系来看,学习策略可分为归纳、类比和演绎三种。

归纳:输入概念的实例,学习目标是从这些实例概括出关于这个概念的描述,或改进概念的已有描述。

类比:输入新问题的描述,学习目标是寻找系统先前已解决的类似问题,并用解决该问题的经验知识处理新问题。

演绎:输入的新问题能够用学习系统已有的知识解决,但知识库的相关部分不能被有效地利用,学习目标是将这些部分转换为更好的形式。

实际上,类比策略可看作归纳和演绎策略的综合,因而最基本的学习策略只有归纳和演绎。

从学习内容角度看,归纳是从个别到一般、从部分到整体的行为,所学知识超过原有知识库所蕴含的范围,我们称之为知识级学习;而演绎是“保真"变换和特化的过程,尽管所学知识能够提高系统的效率,但仍被原有的知识库所蕴含,我们称之为符号级学习。

从实现技术角度看,归纳学习使用基于统计的方法,演绎学习使用北京邮电大学博上论文摘要基于规则的方法。

基于规则的方法,优点是简单、效率高,而且发现新规则后可以方便地加入。

但规则总会有例外,规则过多以后,需要权衡这些规则,保持其一致性,这是很困难的。

支持向量机

支持向量机
(2) 分类阶段,给计算机一些它从来没见过的文档, 让它分类。
智能信息处理实验室
6
2.1 引子
用向量空间模型简表示文档,比如
w2=(文本,5,统计学习,4,模型,0,……) w3=(文本,9,统计学习,4,模型,10,……) 这个向量表示在 w2 所代表的文本中,“文本”这个词出 现了 5 次(这个信息就叫做词频) ,“统计学习”这个词出 现了 4 次,而“模型”这个词出现了 0 次,依此类推w3。 把所有文档都要用到的词从向量中抽离出来,形成共用的 数据结构(也可以仍是向量的形式) ,这个数据结构就叫做 词典,或者特征项集合。比如
支持向量机方法是建立在统计学习理论的VC维理论和结 构风险最小原理基础上的,根据有限的样本信息在模型 的复杂性(即对特定训练样本的学习精度,Accuracy) 和学习能力(即无错误地识别任意样本的能力)之间寻 求最佳折衷,以期获得最好的推广能力(或称泛化能 力).
智能信息处理实验室
3
小样本
并不是说样本的绝对数量少(实际上,对任何算法来说, 更多的样本几乎总是能带来更好的效果),而是说与问题的复 杂度比起来,SVM 算法要求的样本数是相对比较少的.
Remp(w)是R(w)得估计,传统概率论中的定理只说明 了(在一定条件下)当样本趋于无穷多时Remp(w)将在概
率意义上趋近于R(w)。 经验风险泛化能力很差,原因。。。
智能信息处理实验室
14
2.3.3 结构风险最小化(SRM)
根据统计学习理论中关于函数集的推广性的 界的结论,对于两类分类问题中的指示函数
智能信息处理实验室
35
3.4.2 核函数
智能信息处理实验室
36
3.4.2核函数
智能信息处理实验室

支持向量机的学习方法综述

支持向量机的学习方法综述

支持向量机的学习方法综述
张浩然;汪晓东
【期刊名称】《浙江师范大学学报(自然科学版)》
【年(卷),期】2005(028)003
【摘要】支持向量机是一种基于统计学习理论的新型机器学习方法,由于其出色的学习性能,已经成为当前机器学习界的研究热点.详细总结了支持向量机的学习方法,其学习方法主要分为3大类:分解算法、多变量更新算法和序列算法,比较了它们的优缺点;最后指出了学习算法的研究方向.
【总页数】6页(P283-288)
【作者】张浩然;汪晓东
【作者单位】浙江师范大学,信息科学与工程学院,浙江,金华,321004;浙江师范大学,信息科学与工程学院,浙江,金华,321004
【正文语种】中文
【中图分类】TP181
【相关文献】
1.基于支持向量机集成学习方法的高新技术上市公司绩效预测研究 [J], 吴荣顺;王丹阳;戚啸艳
2.基于支持向量机的主动学习方法及其实现 [J], 王玲;李琴;隋美玲;肖海军
3.基于三支决策的支持向量机增量学习方法 [J], 徐久成;刘洋洋;杜丽娜;孙林
4.Lp范数约束的多核半监督支持向量机学习方法 [J], 胡庆辉;丁立新;何进荣
5.基于主动学习的交互式支持向量机文本分类学习方法 [J], 黄永毅;龚垒;
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[2 ] [3 ] [4 ] 、 文本分类 、 图像分类与识别 等众多领域中。
1
1. 1
支持向量机理论
VC 维理论和结构风险最小原理 支持向量机是基于统计学习理论 ( SLT ) 的新型机器学习
remp( w ) 是经验风险, 其中: R( w) 是实际风险, φ ( n / h ) 是置信 风险。置信风险与两个量相关 : a) 样本数量, 样本数量越大, 机 置信风险也就越小; b ) 分类函数的 器学习结果越有可能正确 , VC 维, VC 维的维数越大, 泛化能力越差, 置信风险就会越大。 统计学习的目标就是从寻求经验风险最小化转变为寻求经验 风险与置信风险的和最小 , 即结构风险最小。 SVM 正是这样 一种使结构风险最小的算法 。 1. 2 SVM 理论 SVM 理论的初衷是寻求一种处理两类数据分类问题的方 。 SVM 法 旨在寻找一个超平面, 使得训练样本集中不同类别
R( w) ≤remp( w) + φ( n / h) ( 1)
h
Cher是建立在ቤተ መጻሕፍቲ ባይዱ计学习理论的 VC( Vapnik-
vonenkis) 维理论和结构风险最小原理基础上的 , 根据有限的样 以期获 本信息在模型的复杂性和学习能力之间寻求最佳折中 , 得最好的推广能力。支持向量机具有较强的理论基础 , 它能保 证找到的极值解是全局最优解而非局部最小值 , 这也就决定了 SVM 方法对未知样本有较好的泛化能力 , 正因为这些优点, SVM 能良好地应用到模式识别 、 概率密度函数估计、 时间序列 预测、 回归估计等领域, 也被广泛应用到模式识别中的手写数 字识别
支持向量机 ( SVM ) 是 Cortes 等人于 1995 年提出的, 它在 解决小样本、 非线性及高维模式识别中表现出许多特有的优 并能推广应用到函数拟合等其他机器学习问题中 。 势, 支持向量机
[1 ]
在这种体系下的统计推理规则不仅考虑了对渐进性能的要求 , 而且追求在现有有限信息条件下能够得到最优结果 。 SVM 是建立在 SLT 的 VC 维理论和结构风险最小原理基 [6 ] 础上的。关于 VC 维理论 的定义是: 对一个指示函数集, 如 果存在 h 个样本能够被一个函数集中的函数按所有可能的 2 种形式分开, 则称这个函数集能够把 h 个样本打散, 函数集的 VC 维就是它能打散的最大样本数目 h。 VC 维本质上可以理 VC 维数越高, 则该函数集的机器学习越 解为问题的复杂程度, SLT 引入了泛化误差界的概 复杂。关于结构风险最小原理 , 该理论指出, 机器学习的实际误差是由经验风险和置信风 念, 险两部分组成。 泛化误差界的公式如下 :
Abstract: This paper introduced the theoretical basis of support vector machine,in addition,it described some algorithms about SVM and analysed their advantages and disadvantages and development status. Then it introduced the application principle of SVM in the real life and its application status. Finally, it analysed the deficiency in the development of SVM and pointed out the research direction and prospects,and it put forward distributed support vector machine which as a direction could be make a deeper research. Key words: support vector machine( SVM) ; statistical learning theory( SLT) ; training algorithm; fuzzy support vector maclass support vector machines; pattern recognition chines; multi-
light
( 4)
subject to
yi [ ( wx i ) + b]≥1 - ξ i ( 5)
[5 ]
, 该理论针对小样本统计问题建立了一套新的理论体系 ,
收稿日期: 2013-08-13 ; 修回日期: 2013-10-18 助项目( 2012BAK17B01-1 )
“十二五” 基金项目: 国家自然科学基金重点资助项目( 91224006 ) ; 国家 科技支撑计划资
作者简介: 汪海燕( 1984-) , 女, 河南许昌人, 助理工程师, 硕士, 主要研究方向为 Web 数据挖掘、 机器学习、 文本分类 ( why@ cnic. cn ) ; 黎建辉 ( 1973-) , 男, 研究员, 博士, 主要研究方向为海量数据管理 、 处理与挖掘分析的理论、 方法及关键技术; 杨风雷 ( 1973-) , 男, 副研究员, 博士, 主要研 究方向为 Web 数据挖掘、 云计算和大数据处理 、 机器学习.
*
要: 介绍了 SVM 的理论基础和它的多种主要算法及这些算法的利弊与发展现状, 并介绍了 SVM 在现实生
活中的应用原理及应用现状。最后分析了 SVM 在发展中的不足之处, 指出了其研究方向及前景, 并提出在分布 式支持向量机这个方向上可以进行更深层次的研究。 关键词: 支持向量机; 统计学习理论; 训练算法; 模糊支持向量机; 多分类支持向量机; 模式识别 中图分类号: TP301 文献标志码: A 文章编号: 1001-3695 ( 2014 ) 05-1281-06 3695. 2014. 05. 001 doi: 10. 3969 / j. issn. 1001-
第 31 卷第 5 期 2014 年 5 月
计 算 机 应 用 研 究 Application Research of Computers
Vol. 31 No. 5 May 2014
支持向量机理论及算法研究综述
汪海燕,黎建辉,杨风雷
( 中国科学院计算机网络信息中心 科学数据中心,北京 100190 ) 摘
Overview of support vector machine analysis and algorithm
WANG Haiyan,LI Jianhui,YANG Fenglei
( Science Data Center,Computer Network Information Center,Chinese Academy of Sciences,Beijing 100190 ,China)
l 1 min ‖ w ‖2 + C ∑ ξ i 2 i =1
提出的, 它的主要思想也
是把大型的 QP 问题分解成一系列小的子问题 , 但是它与选块 算法又是不同的, 它是活动集( active set) 方法的一个变形。 它 的算法过程是: 在每次迭代中, 把 Lagrange 乘子 α i 分为工作集 非工作集在本次迭代中保持不变 ; 工作集为自由 和非工作集, 变量, 在本次迭代中对这些自由变量进行优化 , 这个过程一直 进行下去, 直到满足停止条件为止 。这个算法的关键在于选择 但在实际的过 最优工作集来提高该算法的收敛性和收敛速度 , 程中工作集的选取是随机的 , 所以限制了其收敛速度 。 , 对于上述算法中的不足 Joachims 对 Osuna 的方法进行了 一系列的改进, 提出了选择工作集及其他的一些策略与技术 , light 并实现了这一算法, 最终形成了软件 SVM 。 在选择工作集 方面, 其思想是从全部变量中挑选出 q 个变量, 这些变量应满 足下述条件: 不等于零且与目标函数可行的最速下降方向对 应, 这个可以通过求解一个简单的线性优化问题解决 。 SVM light 算法还引入了 shrinking 技术、 caching 技术、 梯度增 量修正技术等。它对大规模问题, 尤其是支持向量比例较小或 者多数支持向量在边界上的情况效果明显 。 2. 3 序列最小优化算法 SMO 算法 是 分 解 算 法 的 一 种 特 殊 情 况 , 它最早是由 Platt[9] 提出来的, 这个算法的主要特点是其工作集中只有两个 样本, 减少到两个的原因是等式线性约束的存在要求至少有两 个 Lagrange 乘子发生变化。由于只有两个变量, 迭代中这样的 QP 子问题都能用解析方法得到最优解 , 从而避开了复杂的求 解优化过程, 也提高了算法的收敛速度 , 又不需要大的矩阵存 。 SMO 对于工作集的选择采用的是启发式策略 , 具体 储空间 10 ] 。 SMO 算法对线性核的情况最有 的办法可以参考文献[ 效, 而对于非线性问题则达不到满意的结果 , 原因是在线性情 每次最小优化后的重置都是简单运算 , 但是在非线性情 形下, 误差的重置必须对全部支持向量逐个地计算核函数 , 而 形下, 核函数的计算比较复杂 , 也就需要占有较多的时间 。 之后 Platt 又对 SMO 算法进行了一些改进, 如借鉴 SVM
方法。机器学习主要研究的是计算机如何模拟或实现人类的 学习能力, 以获取新的知识和技能 , 重新组织已有的知识结构 , 使之不断改善自身的性能 。 机器学习的实现方法主要有以下 经验非线性方法、 统计学习理论。 三种: 统计预测方法、 SLT 是一种 专 门 研 究 小 样 本 情 况 下 机 器 学 习 规 律 的 理 论
[8 ]
这个两类分类问题被转换成了一个带约束的最小值问题: 最大,
min subject to
yi [ ( wx i ) + b] - 1 ≥0
本文也把式( 2 ) 和( 3 ) 的问题叫做二次规划( quadratic proQP) , gramming, 由于它的可行域是一个凸集 , 也可以叫做凸二 次规划。在线性不可分的情况下 , 需要在条件式 ( 3 ) 中加入一 个松弛变量 ξ i ≥0 、 惩罚因子 C, 则上面所述凸二次规划问题就 变成
相关文档
最新文档