基于降维BP神经网络的高维数据分类研究

2013,49(20)1引言随着科学技术的发展,航天数据、生物数据、图像数据、金融市场交易数据和多源空间数据等均为高维数据[1-2]。面对这些浩如烟海的数据,如何通过数据分析得到更深层

次的规律,一直是困扰学者的重大课题。分类可以用于提取描述重要数据类的模型和预测未来的数据趋势。传统的神经网络针对大规模高维数据分类,将导致神经网络的训练时间过长,容易陷于局部最优甚至产生振荡;BP 算法的本质是梯度下降算法,因而其存

在局部极小值、训练速度慢等缺陷[3-4]。因此迫切需要一种方法,从原始训练样本中选择部分重要的、对数据分类影响最大的数据属性集进行分类。本文通过先降维然后对

传统BP 算法进行改进的方式方实现高维数据的高速准确分类。

2高维数据降维处理

直接对高维数据进行分类,由于训练样本有限、数据维数很高,分类结果往往不佳。根据高维特征空间的特性可知,对高维数据集采取降低维数的处理是有利且有必要的。2.1降维的定义

若{}x n N n =1ìR D 为D 维空间中的一个容量为N 的数据

基于降维BP 神经网络的高维数据分类研究

康辉英1,李明亮2,3

KANG Huiying 1,LI Mingliang 2,3

1.石家庄经济学院华信学院,石家庄050031

2.石家庄经济学院河北省光电信息与地球探测技术重点实验室,石家庄050031

3.石家庄经济学院信息工程学院,石家庄050031

1.College of Huaxin,Shijiazhuang University of Economics,Shijiazhuang 050031,China

2.Hebei Key Laboratory of Optoelectronic Information and Geo-detection Technology,Shijiazhuang University of Economics,Shijiazhuang 050031,China

3.College of Information Technology,Shijiazhuang University of Economics,Shijiazhuang 050031,China

KANG Huiying,LI Mingliang.High-dimensional data classification based on dimension reduction of BP neural https://www.360docs.net/doc/bb1309164.html,puter Engineering and Applications,2013,49(20):183-187.

Abstract :To ensure the classification accuracy of the neural network of high-dimensional data,it proposes to firstly reduce its dimension and then to do classification.And it in fact achieves the dimension reduction of high-dimensional data by Principal Component Analysis (PCA ).By analysis of the traditional BP algorithm,the proposed disturbance BP learning method is divided into two steps to update the network weights.It analyzes the classification accuracy and error convergence rate of the algorithm through MATLAB.The simulation results show that firstly reducing its dimension and then doing classification of high dimen-sional data employing disturbance BP network can greatly improve the classification accuracy and training speed of data.

Key words :high-dimension data;neural network;Back Propagation (BP )algorithm;high-order differential;perturbed Back Propagation (BP )

摘要:为确保高维数据的神经网络分类精度,提出了先降维后分类的方法。采用主成分分析(PCA )法实现高维数据的降维。通过分析传统BP 算法,提出分两步来更新网络权值的扰动BP 学习方法。采用MATLAB 对降维分类算法的分类精度和误差收敛速度进行分析。仿真结果显示:先降维再采用扰动BP 网络进行高维数据分类可大大提高数据的分类精度和训练速度。关键词:高维数据;神经网络;反向传播(BP )算法;高阶微分;扰动反向传播(BP )

文献标志码:A 中图分类号:TP393doi :10.3778/j.issn.1002-8331.1201-0137

基金项目:国家自然科学基金(No.51077125/E070602);中国科技部科技人员服务企业行动项目基金(No.2009GJA0035)。

作者简介:康辉英(1974—),女,讲师,研究方向为计算机应用技术;李明亮(1976—),男,博士研究生,副教授,研究方向为检测技术与自

动化装置。E-mail :kanghuiying1@https://www.360docs.net/doc/bb1309164.html,

收稿日期:2012-01-09修回日期:2012-03-29文章编号:1002-8331(2013)20-0183-05

CNKI 出版日期:2012-06-05https://www.360docs.net/doc/bb1309164.html,/kcms/detail/11.2127.TP.20120605.1543.003.html Computer Engineering and Applications 计算机工程与应用

183

相关主题
相关文档
最新文档