人工神经网络在聚类分析中的运用

摘要：本文采用无导师监督的som网络，对全国31个省市自治区的人民生活质量进行了综合评价，在没有先验信息的条件下，不采用人为主观赋予各指标权重的办法，转而运用自组织神经网络自组织竞争学习的网络方法来进行赋值、计算和评价，消除了主观确定各指标的权重的主观性，得到的结果较为符合各省市自治区的实际结果。

关键词：聚类分析；k-means聚类；系统聚类；自组织神经网络；人民生活质量

一、引言（研究现状）

自改革开放以来，我国生产力极大发展，生活水平总体上得到了提高。但是，地区间的发展不平衡始终存在，而且差距越来越大，不同地区人民的生活水平也存在显著的差异。据此，我们利用自组织人工神经网络方法对全国31个省市自治区的人民生活水平质量进行分析评价。

二、指标选取与预处理

1.指标选取

遵循合理性、全面性、可操作性、可比性的原则，从以下5个层面共11个二级指标构建了人民生活质量综合评价指标体系（如下表所示）。

人民生活质量综合评价指标体系

2.指标预处理

（1）正向指标是指标数据越大，则评价也高，如人均可支配收入，人均公园等。

正向指标的处理规则如下（1）：

kohonen 自组织神经网络

输入层是一个一维序列，该序列有n个元素，对应于样本向量的维度；竞争层又称为输出层，该层是由m′n=h个神经元组成的二维平面阵列其神经元的个数对应于输出样本空间的维数，可以使一维或者二维点阵。

竞争层之间的神经元与输入层之间的神经元是全连接的，在输入层神经元之间没有权连接，在竞争层的神经元之间有局部的权连接，表明竞争层神经元之间的侧反馈作用。训练之后的竞争层神经元代表者不同的分类样本。

自组织特征映射神经网络的目标：从样本的数据中找出数据所具有的特征，达到能够自动对样本进行分类的目的。

2.网络反馈算法

自组织网络的学习过程可分为以下两步：

（1）神经元竞争学习过程

对于每一个样本向量，该向量会与和它相连的竞争层中的神经元的连接权进行竞争比较（相似性的比较），这就是神经元竞争的过程。相似性程度最大的神经元就被称为获胜神经元，将获胜神经元称为该样本在竞争层的像，相同的样本具有相同的像。

（2）侧反馈过程

竞争层中竞争获胜的神经元会对周围的神经元产生侧反馈作用，其侧反馈机制遵循以下原则：以获胜神经元为中心，对临近邻域的神经元表现为兴奋性侧反馈。以获胜神经元为中心，对邻域外的神经元表现为抑制性侧反馈。

对于竞争获胜的那个神经元j，其邻域内的神经元在不同程度程度上得到兴奋的侧反馈，而在nj（t）外的神经元都得到了抑制的侧反馈。nj（t）是时间t的函数，随着时间的增加，nj（t）围城的面积越来越小，最后只剩下一个神经元，而这个神经元，则反映着一个类的特征或者一个类的属性。

3.评价流程

（1）对n个输入层输入神经元到竞争层输出神经元j的连接权值为（6）式：

（2）获胜邻域j*（t），设定为邻域函数（h）t，表示第i个神经元与获胜神经元之间的距离函数。s2会随着学习的进行而减小，从而邻域在学习初期很宽，随着学习的进行会变窄。因此，权值随着学习的进行从较大幅度调整向微小幅度调整变化。邻域函数产生了有效的映射作用。其中邻域函数的表达式如下（8）式所示

分析结果如下：

第一类：北京，天津，辽宁，上海，江苏，浙江，广东

第二类：福建，山东，湖北，重庆，陕西

第三类：河北，山西，内蒙古，吉林，黑龙江，江西，湖南

第四类：安徽，河南，广西，海南，四川，贵州，云南，西藏，甘肃，青海，宁夏，新疆基于分类结果，得知第一类中的各地区的人民生活质量最高，主要分布于东部沿海。这些地区共同点是：工业和经济文化实力雄厚，基础设施建设齐全，医疗卫生事业、教育水平高度发达。

对于第二类，他们的生活质量相对于第一类次之，但比第三、四类的评价则较优。福建是东南部沿海的经济大省，山东、湖北、陕西具有较强的工业实力和较高的教育水平；重庆市内地唯一的直辖市，境内有长江干道，这五省的共同他点在于其工业实力较强，教育水平发达，基础设施齐全。

第三类中的诸多省份均是我国农业和采矿业大省，相比前两类，他们则是缺少雄厚的工业基础，但有良好的气候条件社会环境和丰富的自然资源。

第四类，造成这些地区的人民生活质量较差的原因多且复杂。就安徽、河南而言，自古以来河南是华夏文化的中心，安徽是有名的产量大省，是什么因素限制了它们生活水平的发展还值得考究。广西，海南，贵州，云南，西藏，等的一个共性在于自然条件的劣势。广西，海南自古以来是官员贬庶之地；贵州、则云南困于云贵高原，交通向来闭塞；西藏、青海更是由于自然环境恶劣而在各方面的发展较为欠缺；宁夏、甘肃、新疆则是身居内地，生活用水奇缺，种植业较为薄弱，多以畜牧为主，自古有甘凉不毛之地之说。四川则居于天府之国，但人口基数庞大且发展不平衡，所以人民生活质量也不是很高。

总体而言，此分类结果与实际基本吻合；但受变量体系等因素的干扰，部分地区仍然存在疑问，具体原因还值得进一步探讨。

五、模型评价

网络结构简单、自组织自学习能力强和学习速度快是自组织网络所具有的优点，在样本识别上具有很强的优势。此外，它将输出表现成一维或者二维的概率密度分布，因此运用越来越来广泛。对于实际中复杂和高维度的数据，该网络具有较好的适应性和识别性。它本属于一种无监督的自主竞争学习的神经网络，网络根据样本的特征进行自组织学习竞争、聚类，将高维数据映射到低维度的二维平面，能够较好地在保持数据拓扑结构不变的情况下进行数据压缩和识别。其聚类的客观性，更适用于于处理海量未知数据问题。以此同时，由于模型的可视化，在人们开发和构建新型网络变得更加简洁，易于被人们接受。

自组织神经网络的二维拓扑映射图的可视性很强，通过映射图，可以直接观察到数据的特征。同时，清晰的了解其分类情况。但是，传统自组织特征映射神经网络采用了向量内积、欧氏距离函数等确定输入样本最为相似的连接权向量，这就要求数据必须是连续的，若数据是离散的或者数据为顺序型或者属性型，则就不能胜任聚类这项任务。

基于划分方法的聚类分析

南京信息工程大学滨江学院实验（实习）报告实验（实习）名称基于划分方法的聚类分析实验（实习）日期 2011.6.10 指导教师闫雷鸣专业软工（动画）年级 2008 班次（1）班姓名王圆媛学号 20082358002 得分一、实验目的（1）学习聚类分析的基本概念、各种数据类型、聚类方法的分类。（2）学会典型的划分方法K均值和K中心点算法的基本原理、特点、优缺点。（3）应用Weka软件，学会导入数据文件，并对数据文件进行预处理。（4）学会并应用划分方法中K均值和K中心点算法对数据集进行聚类分析。二、实验准备： Bank-data 三、实验要求：用划分方法中K均值和K中心点算法对数据集进行聚类分析四、实验内容： 4.1 相关知识聚类分析中的“类”（cluster）和前面分类的“类”（class）是不同的，对cluster更加准确的翻译应该是“簇”。聚类的任务是把所有的实例分配到若干的簇，使得同一个簇的实例聚集在一个簇中心的周围，它们之间距离的比较近；而不同簇实例之间的距离比较远。对于由数值型属性刻画的实例来说，这个距离通常指欧氏距离。聚类分析中使用最常见的K均值（K-means）算法。 K均值聚类方法的步骤如下。（1）K均值算法首先随机的指定K个簇中心。（2）将每个实例分配到距它最近的簇中心，得到K个簇；（3）计分别计算各簇中所有实例的均值，把它们作为各簇新的簇中心。重复（2）和（3），直到K个簇中心的位置都固定，簇的分配也固定。上述K均值算法只能处理数值型的属性，遇到分类型的属性时要把它变为若干个取值0和1的属性。WEKA将自动实施这个分类型到数值型的变换，而且Weka会自动对数值型的数据作标准化。 Weka中列出了很多聚类算法。对于EM实现，用户可指定需要产生多少聚类，否则所用的算法可通过交叉验证来决定，在这种情况下，折的数量固定为10（除非训练实例小于10个）。用户可指定循环次数的最大值，并且为正常的密度计算设定可允许的最小标准差。SimpleKMeans使用k均值来聚类数据；聚类的数量通过一个参数设定。Cobweb实现了用于名词属性的Cobweb算法和用于数值性属性的Classit算法。FarthestFirst实现Hochbaum 和Shmoys远端优先遍历算法。MakeDensityBaseCluster是一个元聚类器，它包装一个聚类算法，使其返回一个概率分布和密度。它为每个聚类拟合一个离散分布，或一个对称的正态

数据挖掘中的聚类分析方法

计算机工程应用技术本栏目责任编辑：贾薇薇数据挖掘中的聚类分析方法黄利文（泉州师范学院理工学院，福建泉州３６２０００）摘要：聚类分析是多元统计分析的重要方法之一，该方法在许多领域都有广泛的应用。本文首先对聚类的分类做简要的介绍，然后给出了常用的聚类分析方法的基本思想和优缺点，并对常用的聚类方法作比较分析，以便人们根据实际的问题选择合适的聚类方法。关键词：聚类分析；数据挖掘中图分类号：ＴＰ３１１文献标识码：Ａ文章编号：１００９－３０４４（２００８）１２－２０５６４－０２ＣｌｕｓｔｅｒＡｎｌａｙｓｉｓＭｅｔｈｏｄｓｏｆＤａｔａＭｉｎｉｎｇＨＵＡＮＧＬｉ－ｗｅｎ（ＳｃｈｏｏｌｏｆＳｃｉｅｎｃｅ，ＱｕａｎｚｈｏｕＮｏｒｍａｌＵｎｉｖｅｒｓｉｔｙ，Ｑｕａｎｚｈｏｕ３６２０００，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｃｌｕｓｔｅｒａｎａｌｙｓｉｓｉｓｏｎｅｏｆｔｈｅｉｍｐｏｒｔａｎｔｍｅｔｈｏｄｓｏｆｍｕｌｔｉｖａｒｉａｔｅｓｔａｔｉｓｔｉｃａｌａｎａｌｙｓｉｓ，ａｎｄｔｈｉｓｍｅｔｈｏｄｈａｓａｗｉｄｅｒａｎｇｅｏｆａｐｐｌｉｃａ－ｔｉｏｎｓｉｎｍａｎｙｆｉｅｌｄｓ．Ｉｎｔｈｉｓｐａｐｅｒ，ｔｈｅｃｌａｓｓｉｆｉｃａｔｉｏｎｏｆｔｈｅｃｌｕｓｔｅｒｉｓｉｎｔｒｏｄｕｃｅｄｂｒｉｅｆｌｙ，ａｎｄｔｈｅｎｇｉｖｅｓｓｏｍｅｃｏｍｍｏｎｍｅｔｈｏｄｓｏｆｃｌｕｓｔｅｒａｎａｌｙｓｉｓａｎｄｔｈｅａｄｖａｎｔａｇｅｓａｎｄｄｉｓａｄｖａｎｔａｇｅｓｏｆｔｈｅｓｅｍｅｔｈｏｄｓ，ａｎｄｔｈｅｓｅｃｌｕｓｔｅｒｉｎｇｍｅｔｈｏｄｗｅｒｅｃｏｍｐａｒｅｄａｎｄａｎｓｌｙｚｅｄｓｏｔｈａｔｐｅｏｐｌｅｃａｎｃｈｏｓｅｓｕｉｔａｂｌｅｃｌｕｓｔｅｒｉｎｇｍｅｔｈｏｄｓａｃｃｏｒｄｉｎｇｔｏｔｈｅａｃｔｕａｌｉｓｓｕｅｓ．Ｋｅｙｗｏｒｄｓ：ＣｌｕｓｔｅｒＡｎａｌｙｓｉｓ；ＤａｔａＭｉｎｉｎｇ１引言聚类分析是数据挖掘中的重要方法之一，它把一个没有类别标记的样本集按某种准则划分成若干个子类，使相似的样品尽可能归为一类，而不相似的样品尽量划分到不同的类中。目前，该方法已经被广泛地应用于生物、气候学、经济学和遥感等许多领域，其目的在于区别不同事物并认识事物间的相似性。因此，聚类分析的研究具有重要的意义。本文主要介绍常用的一些聚类方法，并从聚类的可伸缩性、类的形状识别、抗“噪声”能力、处理高维能力和算法效率五个方面对其进行比较分析，以便人们根据实际的问题选择合适的聚类方法。２聚类的分类聚类分析给人们提供了丰富多彩的分类方法，这些方法大致可归纳为以下几种［１，２，３，４］：划分方法、层次方法、基于密度的聚类方法、基于网格的聚类方法和基于模型的聚类方法。２．１划分法（ｐａｒｔｉｔｉｏｎｇｉｎｇｍｅｔｈｏｄｓ）给定一个含有ｎ个对象（或元组）的数据库，采用一个划分方法构建数据的ｋ个划分，每个划分表示一个聚簇，且ｋ≤ｎ。在聚类的过程中，需预先给定划分的数目ｋ，并初始化ｋ个划分，然后采用迭代的方法进行改进划分，使得在同一类中的对象之间尽可能地相似，而不同类的中的对象之间尽可能地相异。这种聚类方法适用于中小数据集，对大规模的数据集进行聚类时需要作进一步的改进。２．２层次法（ｈｉｅｔａｒｃｈｉｃａｌｍｅｔｈｏｄｓ）层次法对给定数据对象集合按层次进行分解，分解的结果形成一颗以数据子集为节点的聚类树，它表明类与类之间的相互关系。根据层次分解是自低向上还是自顶向下，可分为凝聚聚类法和分解聚类法：凝聚聚类法的主要思想是将每个对象作为一个单独的一个类，然后相继地合并相近的对象和类，直到所有的类合并为一个，或者符合预先给定的终止条件；分裂聚类法的主要思想是将所有的对象置于一个簇中，在迭代的每一步中，一个簇被分裂为更小的簇，直到最终每个对象在单独的一个簇中，或者符合预先给定的终止条件。在层次聚类法中，当数据对象集很大，且划分的类别数较少时，其速度较快，但是，该方法常常有这样的缺点：一个步骤（合并或分裂）完成，它就不能被取消，也就是说，开始错分的对象，以后无法再改变，从而使错分的对象不断增加，影响聚类的精度，此外，其抗“噪声”的能力也较弱，但是若把层次聚类和其他的聚类技术集成，形成多阶段聚类，聚类的效果有很大的提高。２．３基于密度的方法（ｄｅｎｓｉｔｙ－ｂａｓｅｄｍｅｔｈｏｄｓ）该方法的主要思想是只要临近区域的密度（对象或数据点的数目）超过某个阈值，就继续聚类。也就是说，对于给定的每个数据点，在一个给定范围的区域中必须至少包含某个数目的点。这样的方法就可以用来滤处＂噪声＂孤立点数据，发现任意形状的簇。２．４基于网格的方法（ｇｒｉｄ－ｂａｓｅｄｍｅｔｈｏｄｓ）这种方法是把对象空间量化为有限数目的单元，形成一个网格结构。所有的聚类操作都在这个网格结构上进行。用这种方法进行聚类处理速度很快，其处理时间独立于数据对象的数目，只与量化空间中每一维的单元数目有关。２．５基于模型的方法（ｍｏｄｅｌ－ｂａｓｅｄｍｅｔｈｏｄ）基于模型的方法为每个簇假定一个模型，寻找数据对给定模型的最佳拟合。该方法经常基于这样的假设：数据是根据潜在的概收稿日期：２００８－０２－１７作者简介：黄利文（１９７９－），男，助教。

人工神经网络及其在医学影像分析中的应用解析

人工神经网络及其在医学影像分析中的应用作者：雷元义1陈海东2 摘要：人工神经网络（ANN）是在结构上模仿生物神经联结型系统，能够设计来进行模式分析，信号处理等工作。为了使医学生和医务工作者能对神经网络，特别是人工神经网络及其在医学图像和信号检测与分析中的应用有个全面了解，本文避免了繁琐的数学分析与推导，以阐明物理概念为主，深入浅出地就有关问题加以阐述，期望有所裨益。关键词：人工神经网络；产生；原理；特点；应用 Application of man- made neural network and medical Image to analyses Abstract: Man- made neural network (ANN)is a binding system on structure to imitate biological neural to link. It can carry on pattern discriminate, Signal processing et. in order to let the me dical students and workers understand the neural network, esp ecially understand the man- made neural network which applies to the medical image to a nalyses, the article avoids complicated figure’s analysis and reasoning. It explains the concerned profound questions, mai nly about the physical concept. In simple terms. I hope it can work ! Key words: Man- made neural network; Produce; Principle; Characteristic; Applic ation 人工神经的出现与发展，从而解决了对于那些利用其它信号处理技术无法解决的问题，已成为信号处理的强有力的工具，人工神经网络的应用开辟了新的领域。二十世纪九十年代初，神经网络的研究在国际上曾经出现一股热潮，近年来有增无减，已广泛应用在民用、军用、医学生物等各个领域。 1 神经网络与人工神经网络 1.1 神经网络神经网络就是由多个非常简单的处理单元彼此按某种方式相互连接而成的计算机系统。该系统是靠其状态对外部输入信息的动态响应来处理信息。 1.2 人工神经网络 1.2.1 神经元模型的产生神经元（神经细胞）是神经系统的基本构造单位，是处理人体内各部分之间相互信息传递的基本单元。每个神经元都由一个简单处理作用的细胞体，一个连接其它神经元的轴突和一些向外伸出的其它较短分支——树突组成。人的大脑正是拥有约个神经元这个庞大的信息处理体系，来完成极其复杂的分析和推导工作。人工神经网络（ARTIFICIALNEURALNETWORK，简称(A.N.N.）就是在对

基于聚类分析法空气质量分析论文

基于聚类分析法的空气质量分析摘要：本文利用聚类分析法研究深圳市各区的空气质量问题，就主要污染物so2、no2、pm10、co和o3等进行分析，得到各污染物含量之间的关系，以及其相关性程度，从中找到污染程度相当的主要地区，结合其地理位置，从而判断其主要污染源，对同一类地区用相同的方法进行集中治理。关键词：聚类分析空气质量集中治理污染源 based on clustering analysis of air quality analysis wang shuai (college of mechanical engineering, south east university, nanjing, 211189) abstract: this paper make use of cluster analysis method to study the district shenzhen city air quality problem, the main pollutant so2, no2 and pm10 readings - which were taken, co and o3 undertake an analysis, get the relationship between the content of each pollutant, and the correlation degree, find the main area is polluted, combined with its geographical position to judge the main pollution sources, to the same kind of area with the same method for centralized management. keywords: clustering analysis; air quality; centralized management; pollution sources; 中图分类号：q938.1+4文献标识码： a 文章编号：

基于人工神经网络的通信信号分类识别

基于人工神经网络的通信信号分类识别冯涛 (中国电子科技集团公司第54研究所,河北石家庄050081) 摘要通信信号的分类识别是一种典型的统计模式识别问题。系统地论述了通信信号特征选择、特征提取和分类识别的原理和方法。设计了人工神经网络分类器,包括神经网络模型的选择、分类器的输入输出表示、神经网络拓扑结构和训练算法,并提出了分层结构的神经网络分类器。关键词模式识别;特征提取;分类器;神经网中图分类号 TP391 文献标识码 A Classification and Identification of Communication Signal Using Artificial Neural Networks FE NG Tao (T he 54th Research Institute of CETC,Shijia zhuan g Hebei 050081,China) Abstract The classification and identificati on of communication signal is a typical statistical pattern identification.The paper discusses the theory and method of feature selection,feature extraction and classi fication &identificaiton of communication signal.A classifier based on artificial neural networks is designed,includin g the selection of neural network model,the input and output expression of the classifier,neural network topology and trainin g algorithm.Finally a hierarchical archi tecture classifier based on artificial neural networks is presented. Key words pattern recognition;features extraction;classifier;neural networks 收稿日期:2005-12-16 0 引言在通信对抗侦察中,侦察接收设备在截获敌方通信信号后,必须经过对信号的特征提取和对信号特征的分析识别,才能变为有价值的通信对抗情报。通过对信号特征的分析识别,可以得到信号种类、通信体制、网路组成等方面的情报,从而为研究通信对抗策略、研制和发展通信对抗装备提供重要参考依据。 1 通信信号分类识别的原理通信信号的分类识别是一种典型的模式识别应用,其作用和目的就是将某一接收到的信号正确地归入某一种类型中。一般过程如图1 所示。图1 通信信号分类识别的一般过程下面简单介绍这几部分的作用。信号获取:接收来自天线的信号x (t),并对信号进行变频、放大和滤波,输出一个中频信号; A/D 变换:将中频模拟信号变换为计算机可以运算的数字信号x (n); 以上2步是信号空间x (t)到观察空间x (n )的变换映射。特征提取:为了有效地实现分类识别,必须对原始数据进行变换,得到最能反映分类差别的特征。这些特征的选择和提取是非常重要的,因为它强烈地影响着分类器的设计和性能。理想情况下,经过特征提取得到的特征向量对不同信号类型应该有明显的差别; 分类器设计和分类决策:分类问题是根据识别对象特征的观察值将其分到某个类别中去。首先,在样本训练集基础上确定合适的规则和分类器结构,然后,学习训练得到分类器参数。最后进行分类决策,把待识别信号从特征空间映射到决策空间。 2 通信信号特征参数的选择与特征提取 2 1 通信信号特征参数的选择选择好的特征参数可以提高低信噪比下的正确识别率,降低分类器设计的难度,是基于统计模式识别方法最为关键的一个环节。试图根据有限的信号信号与信息处理 24 2006Radio Engineering Vo1 36No 6

各种聚类算法及改进算法的研究

论文关键词：数据挖掘；聚类算法；聚类分析论文摘要：该文详细阐述了数据挖掘领域的常用聚类算法及改进算法，并比较分析了其优缺点，提出了数据挖掘对聚类的典型要求，指出各自的特点，以便于人们更快、更容易地选择一种聚类算法解决特定问题和对聚类算法作进一步的研究。并给出了相应的算法评价标准、改进建议和聚类分析研究的热点、难点。上述工作将为聚类分析和数据挖掘等研究提供有益的参考。 1 引言随着经济社会和科学技术的高速发展，各行各业积累的数据量急剧增长，如何从海量的数据中提取有用的信息成为当务之急。聚类是将数据划分成群组的过程，即把数据对象分成多个类或簇，在同一个簇中的对象之间具有较高的相似度，而不同簇中的对象差别较大。它对未知数据的划分和分析起着非常有效的作用。通过聚类，能够识别密集和稀疏的区域，发现全局的分布模式，以及数据属性之间的相互关系等。为了找到效率高、通用性强的聚类方法人们从不同角度提出了许多种聚类算法，一般可分为基于层次的，基于划分的，基于密度的，基于网格的和基于模型的五大类。 2 数据挖掘对聚类算法的要求(1)可兼容性：要求聚类算法能够适应并处理属性不同类型的数据。(2)可伸缩性：要求聚类算法对大型数据集和小数据集都适用。(3)对用户专业知识要求最小化。(4)对数据类别簇的包容性：即聚类算法不仅能在用基本几何形式表达的数据上运行得很好，还要在以其他更高维度形式表现的数据上同样也能实现。(5)能有效识别并处理数据库的大量数据中普遍包含的异常值，空缺值或错误的不符合现实的数据。(6)聚类结果既要满足特定约束条件，又要具有良好聚类特性，且不丢失数据的真实信息。(7)可读性和可视性：能利用各种属性如颜色等以直观形式向用户显示数据挖掘的结果。(8)处理噪声数据的能力。(9)算法能否与输入顺序无关。 3 各种聚类算法介绍随着人们对数据挖掘的深入研究和了解，各种聚类算法的改进算法也相继提出，很多新算法在前人提出的算法中做了某些方面的提高和改进，且很多算法是有针对性地为特定的领域而设计。某些算法可能对某类数据在可行性、效率、精度或简单性上具有一定的优越性，但对其它类型的数据或在其他领域应用中则不一定还有优势。所以，我们必须清楚地了解各种算法的优缺点和应用范围，根据实际问题选择合适的算法。 3.1 基于层次的聚类算法基于层次的聚类算法对给定数据对象进行层次上的分解，可分为凝聚算法和分裂算法。 (1)自底向上的凝聚聚类方法。这种策略是以数据对象作为原子类，然后将这些原子类进行聚合。逐步聚合成越来越大的类，直到满足终止条件。凝聚算法的过程为：在初始时，每一个成员都组成一个单独的簇，在以后的迭代过程中，再把那些相互邻近的簇合并成一个簇，直到所有的成员组成一个簇为止。其时间和空间复杂性均为O(n2)。通过凝聚式的方法将两簇合并后，无法再将其分离到之前的状态。在凝聚聚类时，选择合适的类的个数和画出原始数据的图像很重要。 [!--empirenews.page--] (2)自顶向下分裂聚类方法。与凝聚法相反，该法先将所有对象置于一个簇中，然后逐渐细分为越来越小的簇，直到每个对象自成一簇，或者达到了某个终结条件。其主要思想是将那些成员之间不是非常紧密的簇进行分裂。跟凝聚式方法的方向相反，从一个簇出发，一步一步细化。它的优点在于研究者可以把注意力集中在数据的结构上面。一般情况下不使用分裂型方法，因为在较高的层很难进行正确的拆分。 3.2 基于密度的聚类算法很多算法都使用距离来描述数据之间的相似性，但对于非凸数据集，只用距离来描述是不够的。此时可用密度来取代距离描述相似性，即基于密度的聚类算法。它不是基于各种各样的距离，所以能克服基于距离的算法只能发现“类圆形”的聚类的缺点。其指导思想是：只要一个区域中的点的密度（对象或数据点的数目）大过某个阈值，就把它加到与之相近的聚类中去。该法从数据对象的分布密度出发，把密度足够大的区域连接起来，从而可发现任意形状的簇，并可用来过滤“噪声”数据。常见算法有DBSCAN，DENCLUE 等。[1][2][3]下一页 3.3 基于划分的聚类算法给定一个N个对象的元组或数据库，根据给定要创建的划分的数目k，将数据划分为k个组，每个组表示一个簇类（<=N）时满足如下两点：(1)每个组至少包含一个对象；(2)每个对

数据挖掘考试题目——聚类

数据挖掘考试题目——聚类一、填空题 1、密度的基于中心的方法使得我们可以将点分类为：__________、________ 、_________。 2、DBSCAN算法在最坏的情况下，时间复杂度是__________、空间复杂度是__________。 3、DBSCAN算法的优点是_______、__________________________。 4、DBSCAN算法的缺点是处理_________________、_____________的数据效果不好。 5、DBSCAN算法的参数有：___________、____________。 6、簇的有效性的非监督度量常常可以分为两类：__________、__________，它常采用的指标为__________。 7、簇的有效性的监督度量通常称为___________，它度量簇标号与外部提供的标号的匹配程度主要借助____________。 8、在相似度矩阵评价的聚类中，如果有明显分离的簇，则相似度矩阵应当粗略地是__________。 9、DBSCAN算法的参数确定的基本方法是观察____________________的特性。 10、不引用附加的信息，评估聚类分析结果对数据拟合情况属于__________技术。答案： 1、核心点边界点噪声点 2、O(n2) O(n) 3、耐噪声能够处理任意大小和形状的簇 4、高维数据变密度的 5、EPS MinPts 6、簇的凝聚性簇的分离性均方差(SSE) 7、外部指标监督指标的熵 8、块对角的 9、点到它的第K个最近邻的距离（K-距离） 10、非监督

二、选择题 1、DBSCAN算法的过程是（B）。 ①删除噪声点。 ②每组连通的核心点形成一个簇。 ③将所有点标记为核心点、边界点和噪声点。 ④将每个边界点指派到一个与之关联的核心点的簇中。 ⑤为距离在Eps之内的所有核心点之间赋予一条边。 A：①②④⑤③ B：③①⑤②④ C：③①②④⑤ D：①④⑤②③ 2、如果有m个点，DBSCAN在最坏的情况下的时间复杂度度为（C）。 A O(m) B O(mlogm) C O(m2) D O(logm) 3、在基本DBSCAN的参数选择方法中，点到它的K个最近邻的距离中的K选作为哪一个参数（B）。 A Eps B MinPts C 质心 D 边界 4、当采用K-距离的方法选择DBSCAN的Eps和MinPts参数时，如果设置的K的值太大，则小簇（尺寸小于K的簇）可能会被标记为（A）。 A 噪声 B 核心簇 C 边界簇D以上都不对 5、如果处理以下形状的数据时，适宜采用DBSCAN的是（B） A 球形 B SS形 C 椭球形 D 方形 6、DBSCAN之所以难以有效处理高维数据，其主要原因是（D）

人工神经网络大作业

X X X X大学研究生考查课作业课程名称：智能控制理论与技术研究生姓名：学号：作业成绩：任课教师(签名) 交作业日时间：2010年12月22日

人工神经网络(artificial neural network，简称ANN)是在对大脑的生理研究的基础上，用模拟生物神经元的某些基本功能元件(即人工神经元)，按各种不同的联结方式组成的一个网络。模拟大脑的某些机制，实现某个方面的功能，可以用在模仿视觉、函数逼近、模式识别、分类和数据压缩等领域，是近年来人工智能计算的一个重要学科分支。人工神经网络用相互联结的计算单元网络来描述体系。输人与输出的关系由联结权重和计算单元来反映，每个计算单元综合加权输人，通过激活函数作用产生输出，主要的激活函数是Sigmoid函数。ANN有中间单元的多层前向和反馈网络。从一系列给定数据得到模型化结果是ANN的一个重要特点，而模型化是选择网络权重实现的，因此选用合适的学习训练样本、优化网络结构、采用适当的学习训练方法就能得到包含学习训练样本范围的输人和输出的关系。如果用于学习训练的样本不能充分反映体系的特性，用ANN也不能很好描述与预测体系。显然，选用合适的学习训练样本、优化网络结构、采用适当的学习训练方法是ANN的重要研究内容之一，而寻求应用合适的激活函数也是ANN研究发展的重要内容。由于人工神经网络具有很强的非线性多变量数据的能力，已经在多组分非线性标定与预报中展现出诱人的前景。人工神经网络在工程领域中的应用前景越来越宽广。 1人工神经网络基本理论[1] 1.1神经生物学基础可以简略地认为生物神经系统是以神经元为信号处理单元,通过广泛的突触联系形成的信息处理集团,其物质结构基础和功能单元是脑神经细胞即神经元(neu ron)。(1)神经元具有信号的输入、整合、输出三种主要功能作用行为。突触是整个神经系统各单元间信号传递驿站,它构成各神经元之间广泛的联接。(3)大脑皮质的神经元联接模式是生物体的遗传性与突触联接强度可塑性相互作用的产物,其变化是先天遗传信息确定的总框架下有限的自组织过程。 1.2建模方法神经元的数量早在胎儿时期就已固定,后天的脑生长主要是指树突和轴突从神经细胞体中长出并形成突触联系,这就是一般人工神经网络建模方法的生物学依据。人脑建模一般可有两种方法:①神经生物学模型方法,即根据微观神经生物学知识的积累,把脑神经系统的结构及机理逐步解释清楚,在此基础上建立脑功能模型。②神经计算模型方法,即首先建立粗略近似的数学模型并研究该模型的动力学特性,然后再与真实对象作比较(仿真处理方法)。 1.3概念人工神经网络用物理可实现系统来模仿人脑神经系统的结构和功能,是一门新兴的前沿交叉学科,其概念以T.Kohonen.Pr的论述最具代表性:人工神经网络就是由简单的处理单元(通常为适应性)组成的并行互联网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。 1.4应用领域人工神经网络在复杂类模式识别、运动控制、感知觉模拟方面有着不可替代的作用。概括地说人工神经网络主要应用于解决下述几类问题:模式信息处理和模式识别、最优化问题、信息的智能化处理、复杂控制、信号处理、数学逼近映射、感知觉模拟、概率密度函数估计、化学谱图分析、联想记忆及数据恢复等。 1.5理论局限性 (1)受限于脑科学的已有研究成果由于生理试验的困难性,目前对于人脑思维与记忆机制的认识尚很肤浅,对脑神经网的运行和神经细胞的内部处理机制还没有太多的认识。 (2)尚未建立起完整成熟的理论体系目前已提出的众多人工神经网络模型,归纳起来一般都是一个由节点及其互连构成的有向拓扑网,节点间互连强度构成的矩阵可通过某种学

一个基于聚类分析的发现方法1

一个基于聚类分析的典型过程路径发现方法 Shunuan Liu & Zhenming Zhang & Xitian Tian 摘要：典型过程路径实是编制过程路径的一个样本。它是一类编制知识的过程。为了在编制数据库的过程中从计算机半自动过程编制中（CAPP）发现典型过程路径,在数据库中知识发现被应用.数据选择过程,剔除过程和转换过程都被用于数据优化过程.聚类分析被采用于挖掘典型过程路径的运算法则.描述此过程路径的数学模型通过数据矩阵建立.在过程路径的聚类中有三类相似性:操作间的相似性用基于操作编码的的曼哈顿距离来度量;过程路径间相似性用欧氏距离来计算并表示成一个相异度矩阵;过程路径串间的相似性由基于相异度矩阵的平均距离来估计．那么,过程路径串最后通过会凝聚的分等级的聚类方法被合并.并且过程路径的聚类结果由过程路径的聚类粒度决定.这个方法已经被成功用来发现某一类轴套的典型过程路径. 关键词:计算机半自动编制过程典型过程路径聚类分析数据库里的知识发现 1．引言过程编制是把一个设计规范集转换成一个用来描述如何加工一个零件科技说明书集的任务。因此，它是产品设计与制造间的基本连接。过程路径编制是编制科技说明的逻辑顺序的一个任务，考虑诸如几何形状，技术必备，经济要素，生产力和实际生产环境的约束。从而过程路径编制依赖于过程编制者拥有的知识和经验。过程知识是通过过程编制实践自身理解和经验的积累。它能帮助过程编制者完成编制任务并避免重复智力劳动。并且，随着产品复杂程度的增加，过程复杂程度也增加。过程知识的再使用变得越来越重要以确保过程编制的质量和有效性。制造型企业迫切地需要过程知识以使他们自己适应市场竞争。 1960s,计算机半自动过程编制（CAPP）开始被研究以减少过程编制者的劳动。已有大量在智能化CAPP 上的预先研究。人工智能技术诸如专家体系，基于推论的规则，神经网络，和黑板方法通常被应用。不管什么被应用，知识在智能化的CAPP是不可缺少的。它已经成为CAPP向智能化发展的一个瓶颈。如何获得大量有效的知识是智能化CAPP和企业的关键。过程知识主要来源于指南和书本，相关的数据，专家和科技文件。来自专家和科技文件的只是被深深的植入到个体，产品和公司的关系在[4]中有描述。通常很难发现正确的到处方法。现在，中国所有当前的CAPP系统有通过计算机逼近科技程序的功能。纸制的科技程序在大的制造型企业中被电子表格代替。因为CAPP更深的应用，大量的过程数据被累积在企业的数据库中以至编者者的职能和经验被隐藏了。过程数据库成为过程知识的新来源。此外，过程数据库有普遍数据结构的有利条件。用这个方式来发现和构造过程知识是非常有利的，它可以被用于只能计算工具。数据库中的知识发现是在数据库里挖掘知识的智能工具。它已经被应用于制造业，例如在制造业数据中发现有用的和可理解的模式[5]，在设计和制造业的知识库中发现学问[6]。少数研究者努力把它应用到过程知识的获得上。Gao Wei [7]讨论了帮助导向的过程知识库的组成和应用的KDD知识获得方法。概要地引进几个可用的方法以自动获得过程知识。但并没有详细说明如何运用这些方法来获得具体知识如在过程编制中的决定规则和典型过程编制实例的。数据库中的过程知识发现有很多优势。它使维持，管理和扩展知识变得容易。而且，它能促进过程编制的标准化。这篇文章提出运用KDD在过程数据库中获得典型过程路径的方法。基于聚类分析的典型过程路径发现被着重论述。 2．典型过程路径发现理论典型过程路径发现主要采用聚类分析把过程路径聚集成组。然后，同一组里的各零件的共同特征通过分析这些部分的过程路径而被了解。最后，包含个部分特征的典型过程路径被存储到知识库中。过程路径能够被查询和再使用通过匹配包含在典型过程路径中的特征。 2．1典型过程路径发现的步骤典型过程路径发现被划在图1。最优化的过程路径应该根据过程类型，零件类型和过程路径长度来大致分类。过程类型包括技工加工过程，装配过程和专门的过程等。零件类型包括轴套，轮盘，盒子，包装等。它是根据零件外形的特征来分类的。过程路径长度是过程路径中操作的数目。它是不确定的，用K表示，K∈{正整数}，K可以定义为1≤K≤5，3≤K≤8，5≤K≤12，10≤K≤15等。然后，相

人工神经网络发展前景111

人工神经网络发展前景姓名单位摘要在分析人工神经网络的发展过程、基本功能、应用范围的基础上，着重论述了神经网络与专家系统、模糊技术、遗传算法、灰色系统及小波分析的融合。关键词英文摘要英文关键词 1前言人工神经网络的发展起源于何时，说法不一。一般认为，其起源可追溯到Warren WcCulloch和Walter Pitts提出的MP模型。从此拉开了神经网络的序幕。20世纪50年代后期，Frank Rosenblatt定义了一种以后常用的神经网络结构，称为感知器。这是人工神经网络第一个实际应用；20世纪60年代，Bernard Widrow和Ted Hoff提出了一个新的学习算法用于训练自适应线性神经网络；20世纪70年代，Grossberg 提出了自适应共振理论。他研究了两种记忆机制（短期记忆和长期记忆），提出了一种可视系统的自组织神经网络，这是一种连续时间竞争网络，是构成自适应谐振理论网络基础；20世纪80年代，Hopfield 及一些学者提出了Hopfield网络模型，这是一种全连接的反馈网络。此外，Hinton等提出了Boltzman机。Kumellhart等人提出误差反向

传播神经网络，简称BP网络。目前BP神经网络已成为广泛使用的网络。 2应用现状神经网络以及独特的结构和处理信息的方法，在许多实际应用领域中取得了显著的成效，主要应用如下： 1）信号处理。神经网络广泛应用于自适应信号处理和非线性信号处理中。前者如信号的自适应滤波、时间序列预测、谱估计、噪声消除等；后者如非线性滤波、非线性预测、非线性编码、调制/解调等。2）模式识别。神经网络不仅可以处理静态模式如固定图像、固定能谱等，还可以处理动态模式如视频图像、连续语音等。 3）系统识别。基于神经网络的系统辨识是以神经网络作为被识对象的模型，利用其非线性特性，可建立非线性系统的静态或动态模型。 4)智能检测。在对综合指标的检测（例如对环境舒适度这类综合指标检测）中，以神经网络作为智能检测中的信息处理联想等数据融合处理，从而实现单一传感器不具备的功能。 5）汽车工程。神经网络在汽车刹车自动控制系统中也有成功的应用，该系统能在给定刹车距离、车速和最大减速度的情况下，以人体能感受到的最小冲击实现平稳刹车，而不受路面坡度和车重影响。 6）化学工程。神经网络在光谱分析、判定化学反应的生成物、判定离子浓度及研究生命体中某些化合物的含量与生物活性的对应关系都有广泛应用并取得了一定成果。 7）卫生保健、医疗。比如通过训练自主组合的多层感知器可以区分

聚类分析、数据挖掘、关联规则这几个概念的关系

聚类分析和关联规则属于数据挖掘这个大概念中的两类挖掘问题，聚类分析是无监督的发现数据间的聚簇效应。关联规则是从统计上发现数据间的潜在联系。细分就是聚类分析与关联规则是数据挖掘中的核心技术；从统计学的观点看，聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中，如SPSS、SAS等。从机器学习的角度讲，簇相当于隐藏模式。聚类是搜索簇的无监督学习过程。与分类不同，无监督学习不依赖预先定义的类或带类标记的训练实例，需要由聚类学习算法自动确定标记，而分类学习的实例或数据对象有类别标记。聚类是观察式学习，而不是示例式的学习。聚类分析是一种探索性的分析，在分类的过程中，人们不必事先给出一个分类的标准，聚类分析能够从样本数据出发，自动进行分类。聚类分析所使用方法的不同，常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析，所得到的聚类数未必一致。从实际应用的角度看，聚类分析是数据挖掘的主要任务之一。而且聚类能够作为一个独立的工具获得数据的分布状况，观察每一簇数据的特征，集中对特定的聚簇集合作进一步地分析。聚类分析还可以作为其他算法（如分类和定性归纳算法）的预处理步骤。关联规则挖掘过程主要包含两个阶段：第一阶段必须先从资料集合中找出所有的高频项目组(FrequentItemsets)，第二阶段再由这些高频项目组中产生关联规则(AssociationRules)。关联规则挖掘的第一阶段必须从原始资料集合中，找出所有高频项目组(LargeItemsets)。高频的意思是指某一项目组出现的频率相对于所有记录而言，必须达到某一水平。关联规则挖掘的第二阶段是要产生关联规则(AssociationRules)。从高频项目组产生关联规则，是利用前一步骤的高频k-项目组来产生规则，在最小信赖度(MinimumConfidence)的条件门槛下，若一规则所求得的信赖度满足最小信赖度，称此规则为关联规则。

人工神经网络的发展及应用

人工神经网络的发展与应用神经网络发展启蒙时期启蒙时期开始于1980年美国著名心理学家W．James关于人脑结构与功能的研究，结束于1969年Minsky和Pape~发表的《感知器》(Perceptron)一书。早在1943年，心理学家McCulloch和数学家Pitts合作提出了形式神经元的数学模型(即M—P模型)，该模型把神经细胞的动作描述为：1神经元的活动表现为兴奋或抑制的二值变化；2任何兴奋性突触有输入激励后，使神经元兴奋与神经元先前的动作状态无关；3任何抑制性突触有输入激励后，使神经元抑制；4突触的值不随时间改变；5突触从感知输入到传送出一个输出脉冲的延迟时问是0．5ms。可见，M—P模型是用逻辑的数学工具研究客观世界的事件在形式神经网络中的表述。现在来看M—P 模型尽管过于简单，而且其观点也并非完全正确，但是其理论有一定的贡献。因此，M—P模型被认为开创了神经科学理论研究的新时代。1949年，心理学家D．0．Hebb 提出了神经元之间突触联系强度可变的假设，并据此提出神经元的学习规则——Hebb规则，为神经网络的学习算法奠定了基础。1957年，计算机学家FrankRosenblatt提出了一种具有三层网络特性的神经网络结构，称为“感知器”(Perceptron)，它是由阈值性神经元组成，试图模拟动物和人脑的感知学习能力，Rosenblatt认为信息被包含在相互连接或联合之中，而不是反映在拓扑结构的表示法中；另外，对于如何存储影响认知和行为的信息问题，他认为，存储的信息在神经网络系统内开始形成新的连接或传递链路后，新的刺激将会通过这些新建立的链路自动地激活适当的响应部分，而不是要求任何识别或坚定他们的过程。1962年Widrow提出了自适应线性元件(Ada—line)，它是连续取值的线性网络，主要用于自适应信号处理和自适应控制。低潮期人工智能的创始人之一Minkey和pape~经过数年研究，对以感知器为代表的网络系统的功能及其局限性从数学上做了深入的研究，于1969年出版了很有影响的《Perceptron)一书，该书提出了感知器不可能实现复杂的逻辑函数，这对当时的人工神经网络研究产生了极大的负面影响，从而使神经网络研究处于低潮时期。引起低潮的更重要的原因是：20世纪7O年代以来集成电路和微电子技术的迅猛发展，使传统的冯·诺伊曼型计算机进入发展的全盛时期，因此暂时掩盖了发展新型计算机和寻求新的神经网络的必要性和迫切性。但是在此时期，波士顿大学的S．Grossberg教授和赫尔辛基大学的Koho—nen教授，仍致力于神经网络的研究，分别提出了自适应共振理论(Adaptive Resonance Theory)和自组织特征映射模型(SOM)。以上开创性的研究成果和工作虽然未能引起当时人们的普遍重视，但其科学价值却不可磨灭，它们为神经网络的进一步发展奠定了基础。复兴时期 20世纪80年代以来，由于以逻辑推理为基础的人工智能理论和冯·诺伊曼型计算机在处理诸如视觉、听觉、联想记忆等智能信息处理问题上受到挫折，促使人们

人工神经网络在聚类分析中的运用

摘要：本文采用无导师监督的som网络，对全国31个省市自治区的人民生活质量进行了综合评价，在没有先验信息的条件下，不采用人为主观赋予各指标权重的办法，转而运用自组织神经网络自组织竞争学习的网络方法来进行赋值、计算和评价，消除了主观确定各指标的权重的主观性，得到的结果较为符合各省市自治区的实际结果。关键词：聚类分析；k-means聚类；系统聚类；自组织神经网络；人民生活质量一、引言（研究现状）自改革开放以来，我国生产力极大发展，生活水平总体上得到了提高。但是，地区间的发展不平衡始终存在，而且差距越来越大，不同地区人民的生活水平也存在显著的差异。据此，我们利用自组织人工神经网络方法对全国31个省市自治区的人民生活水平质量进行分析评价。二、指标选取与预处理 1.指标选取遵循合理性、全面性、可操作性、可比性的原则，从以下5个层面共11个二级指标构建了人民生活质量综合评价指标体系（如下表所示）。人民生活质量综合评价指标体系 2.指标预处理（1）正向指标是指标数据越大，则评价也高，如人均可支配收入，人均公园等。正向指标的处理规则如下（1）： kohonen 自组织神经网络输入层是一个一维序列，该序列有n个元素，对应于样本向量的维度；竞争层又称为输出层，该层是由m′n=h个神经元组成的二维平面阵列其神经元的个数对应于输出样本空间的维数，可以使一维或者二维点阵。竞争层之间的神经元与输入层之间的神经元是全连接的，在输入层神经元之间没有权连接，在竞争层的神经元之间有局部的权连接，表明竞争层神经元之间的侧反馈作用。训练之后的竞争层神经元代表者不同的分类样本。自组织特征映射神经网络的目标：从样本的数据中找出数据所具有的特征，达到能够自动对样本进行分类的目的。 2.网络反馈算法自组织网络的学习过程可分为以下两步：（1）神经元竞争学习过程对于每一个样本向量，该向量会与和它相连的竞争层中的神经元的连接权进行竞争比较（相似性的比较），这就是神经元竞争的过程。相似性程度最大的神经元就被称为获胜神经元，将获胜神经元称为该样本在竞争层的像，相同的样本具有相同的像。（2）侧反馈过程竞争层中竞争获胜的神经元会对周围的神经元产生侧反馈作用，其侧反馈机制遵循以下原则：以获胜神经元为中心，对临近邻域的神经元表现为兴奋性侧反馈。以获胜神经元为中心，对邻域外的神经元表现为抑制性侧反馈。对于竞争获胜的那个神经元j，其邻域内的神经元在不同程度程度上得到兴奋的侧反馈，而在nj（t）外的神经元都得到了抑制的侧反馈。nj（t）是时间t的函数，随着时间的增加，nj（t）围城的面积越来越小，最后只剩下一个神经元，而这个神经元，则反映着一个类的特征或者一个类的属性。 3.评价流程（1）对n个输入层输入神经元到竞争层输出神经元j的连接权值为（6）式：

基于人工神经网络的图像识别

本文首先分析了图像识别技术以及bp神经网络算法，然后详细地阐述了人工神经网络图像识别技术。【关键词】人工神经网络 bp神经网络图像识别识别技术通常而言，所谓图像处理与识别，便是对实际图像进行转换与变换，进而达到识别的目的。图像往往具有相当庞大的信息量，在进行处理图像的时候要进行降维、数字化、滤波等程序，以往人们进行图像识别时采用投影法、不变矩法等方法，随着计算机技术的飞速发展，人工神经网络的图像识别技术将逐渐取代传统的图像识别方法，获得愈来愈广泛的应用。 1 人工神经网络图像识别技术概述近年来，人工智能理论方面相关的理论越来越丰富，基于人工神经网络的图像识别技术也获得了非常广泛的应用，将图像识别技术与人工神经网络技术结合起来的优点是非常显著的，比如说：（1）由于神经网络具有自学习功能，可以使得系统能够适应识别图像信息的不确定性以及识别环境的不断变化。（2）在一般情况下，神经网络的信息都是存储在网络的连接结构以及连接权值之上，从而使图像信息表示是统一的形式，如此便使得知识库的建立与管理变得简便起来。（3）由于神经网络所具有的并行处理机制，在处理图像时可以达到比较快的速度，如此便可以使图像识别的实时处理要求得以满足。（4）由于神经网络可增加图像信息处理的容错性，识别系统在图像遭到干扰的时候仍然能正常工作，输出较准确的信息。 2 图像识别技术探析 2.1 简介广义来讲，图像技术是各种与图像有关的技术的总称。根据研究方法以及抽象程度的不同可以将图像技术分为三个层次，分为：图像处理、图像分析以及图像理解，该技术与计算机视觉、模式识别以及计算机图形学等学科互相交叉，与生物学、数学、物理学、电子学计算机科学等学科互相借鉴。此外，随着计算机技术的发展，对图像技术的进一步研究离不开神经网络、人工智能等理论。 2.2 图像处理、图像识别与图像理解的关系图像处理包括图像压缩、图像编码以及图像分割等等，对图像进行处理的目的是判断图像里是否具有所需的信息并滤出噪声，并对这些信息进行确定。常用方法有灰度，二值化，锐化，去噪等；图像识别则是将经过处理的图像予以匹配，并且对类别名称进行确定，图像识别可以在分割的基础之上对所需提取的特征进行筛选，然后再对这些特征进行提取，最终根据测量结果进行识别；所谓图像理解，指的是在图像处理与图像识别的基础上，根据分类作结构句法分析，对图像进行描述与解释。所以，图像理解包括图像处理、图像识别和结构分析。就图像理解部分而言，输入是图像，输出是对图像的描述解释。 3 人工神经网络结构和算法在上个世纪八十年代，mcclelland与rumelhant提出了一种人工神经网络，截止现在，bp神经网络已经发展成为应用最为广泛的神经网络之一，它是一种多层前馈神经网络，包括输入层、输出层和输入层输出层之间隐藏层，如图1所示，便是一种典型的bp神经网络结构。 bp神经网络是通过不断迭代更新权值使实际输入与输出关系达到期望，由输出向输入层反向计算误差，从而通过梯度下降方法不断修正各层权值的网络。 bp神经网络结构算法如下所述：（1）对权值矩阵，学习速率，最大学习次数，阈值等变量和参数进行初始化设置；（2）在黑色节点处对样本进行输入；