数据融合各种算法整理汇总
多源异构数据融合算法研究

多源异构数据融合算法研究随着互联网的普及和数据的爆炸增长,各种数据源在不断涌现的同时,由于其来源、格式等方面的差异,给数据的应用和分析带来了较大的困难。
这就需要将多源异构数据进行融合,从而实现对数据的高效利用。
本文将从多源异构数据融合的概念、挑战、应用以及融合算法等方面进行论述。
一、多源异构数据融合的概念多源异构数据融合,是指将多个不同来源、不同格式、不同语义的数据集,进行有效的整合、转换和合并,来实现对数据的全面的分析和挖掘。
多源异构数据融合起到了很重要的作用,一方面是可以将数据的利用率最大化,另一方面也可以提升数据的应用价值。
二、多源异构数据融合的挑战多源异构数据融合需要面对很多的挑战,其中之一是数据的差异性,会包括数据语义和格式的差异等。
这些差异性导致了数据的融合过程难度较大,需要进行有效处理才能完成数据的融合。
另外,多源异构数据的处理过程还需要考虑到数据的安全性和保密性等方面,从而保障数据的可靠性和可用性。
三、多源异构数据融合的应用随着多源异构数据融合技术的不断发展成熟,其在各个领域的应用越来越广泛,下面介绍几个比较典型的应用。
1.数据分析:对于数据分析来说,融合多源异构数据能够从更广泛的角度为用户提供更具洞见价值的信息。
2.网络安全:利用多源异构数据,可以更全面地分析网络的行为,从而更加快速,地识别出网络中的异常行为,保证网络的安全性。
3.金融领域:在金融领域中,融合多源异构数据可以帮助用户更好地了解市场的趋势和变化,从而作出更加准确的决策,为金融市场的开幕起到了重要的作用。
四、多源异构数据融合算法的研究针对多源异构数据融合的问题,科学家们在不断进行研究,发展出一些融合算法来应对这个问题,以下是常用的几种算法。
1.数据对齐法:通过数据对齐和匹配来处理数据融合中的异构问题。
该算法基于对数据进行特征提取和匹配,来找到数据之间的相似性。
2.模型融合法:将多种不同模型的输出结果融合在一起,从而获得更为准确的结果。
(完整版)信息融合算法

信息融合算法1 概述信息融合又称数据融合,是对多种信息的获取、表示及其内在联系进行综合处理和优化的技术。
经过融合后的传感器信息具有以下特征:信息冗余性、信息互补性、信息实时性、信息获取的低成本性。
1、组合:由多个传感器组合成平行或互补方式来获得多组数据输出的一种处理方法,是一种最基本的方式,涉及的问题有输出方式的协调、综合以及传感器的选择。
在硬件这一级上应用。
2、综合:信息优化处理中的一种获得明确信息的有效方法。
例:在虚拟现实技术中,使用两个分开设置的摄像机同时拍摄到一个物体的不同侧面的两幅图像,综合这两幅图像可以复原出一个准确的有立体感的物体的图像。
3、融合:当将传感器数据组之间进行相关或将传感器数据与系统内部的知识模型进行相关,而产生信息的一个新的表达式。
4、相关:通过处理传感器信息获得某些结果,不仅需要单项信息处理,而且需要通过相关来进行处理,获悉传感器数据组之间的关系,从而得到正确信息,剔除无用和错误的信息。
相关处理的目的:对识别、预测、学习和记忆等过程的信息进行综合和优化。
2 技术发展现状信息融合技术的方法,概括起来分为下面几种:1)组合:由多个传感器组合成平行或互补方式来获得多组数据输出的一种处理方法,是一种最基本的方式,涉及的问题有输出方式的协调、综合以及传感器的选择。
在硬件这一级上应用。
2)综合:信息优化处理中的一种获得明确信息的有效方法。
例:在虚拟现实技术中,使用两个分开设置的摄像机同时拍摄到一个物体的不同侧面的两幅图像,综合这两幅图像可以复原出一个准确的有立体感的物体的图像。
3)融合:当将传感器数据组之间进行相关或将传感器数据与系统内部的知识模型进行相关,而产生信息的一个新的表达式。
4)相关:通过处理传感器信息获得某些结果,不仅需要单项信息处理,而且需要通过相关来进行处理,获悉传感器数据组之间的关系,从而得到正确信息,剔除无用和错误的信息。
相关处理的目的:对识别、预测、学习和记忆等过程的信息进行综合和优化。
多源异构数据的融合算法研究

多源异构数据的融合算法研究随着各种传感器、云计算等技术的发展,数据的来源和类型也变得越来越多样化和异构化。
在这样的背景下,如何对多源异构数据进行融合,成为了数据挖掘与分析领域的一个热门研究方向。
本文将从算法的角度,探讨多源异构数据的融合算法研究。
一、多源异构数据的特点多源异构数据指的是由不同的数据源(如多个传感器、数据库等)采集得到的、类型和格式不同的数据。
由于来源的差异,多源异构数据具有以下的特点:1.数据量大:不同数据源同时采集得到的数据可能非常庞大,需要进行处理和筛选。
2.数据类型多样:不同的数据源可能会采用不同的数据类型(如文本、图像、音频等),使得数据的分析过程变得复杂。
3.数据质量参差不齐:由于不同的数据源采集环境和采集方式的不同,导致数据的质量存在差异(如只是部分数据存在噪声、无效数据等),这就需要进行有效的异常检测和数据清洗。
4.数据格式不同:由于不同的数据源可能存在不同的数据格式(如不同的编码、不同的数据结构等),所以需要进行数据转换或者规范化,以便进行统一的数据处理和分析。
二、多源异构数据的融合算法为了充分利用多源异构数据,同时避免由于数据的维数过高导致的数据过拟合问题,目前常用的做法是使用基于特征选择和特征融合的方法。
特征选择是一种针对原始特征选择出最重要的特征的技术,特征融合是指将不同来源的数据特征,进行整合或匹配,得到更加丰富的数据特征。
根据特征选择和特征融合的方法,目前的多源异构数据融合算法主要有以下几种:1.基于加权平均法的特征融合。
该算法将不同来源的特征进行平均,然后计算每一个特征在整个数据集上的加权得分,将具有高分的特征保留下来,其余则删除。
然后使用得分比较高的特征进行数据分析和建模。
2.基于主成分分析的特征选择和融合。
该算法将不同来源的数据特征进行降维处理,得到最具有代表性的主成分,并利用主成分上的变量来代替原始特征。
在此基础上,使用常规方法进行分类和预测。
3.基于迁移学习的特征融合。
多传感器数据融合常用的算法

多传感器数据融合常用的算法
多传感器数据融合常用的算法有很多,以下是一些常见的算法:
1. 卡尔曼滤波:一种基于最小均方误差准则的线性最优估计方法,适用于动态系统的状态估计。
2. 扩展卡尔曼滤波:对非线性系统进行线性化处理,然后应用卡尔曼滤波算法。
3. 粒子滤波:一种基于蒙特卡罗方法的非线性滤波算法,通过粒子采样和重采样来估计系统状态。
4. 模糊逻辑算法:利用模糊规则和模糊推理来处理不确定性和模糊性的数据。
5. D-S 证据理论:用于处理不确定性和多源信息融合的算法。
6. 支持向量机:一种监督学习算法,可用于分类或回归问题,常用于多传感器数据的特征提取和分类。
7. 人工神经网络:通过模拟神经系统的结构和功能,对多传感器数据进行学习和预测。
8. 贝叶斯网络:基于概率论和图论的方法,用于表示变量之间的概率关系和推理。
9. 小波变换:用于多传感器数据的时频分析和特征提取。
10. 主成分分析:一种数据降维和特征提取的方法,可减少数据维度并突出主要特征。
选择合适的多传感器数据融合算法取决于具体应用的需求、传感器数
据的特点和系统的约束条件等。
在实际应用中,通常需要根据具体情况选择和组合多种算法,以达到最优的融合效果。
同时,数据预处理、特征选择和模型评估等步骤也是多传感器数据融合过程中的重要环节。
多传感器数据融合目标识别算法综述

第35卷,增刊红外与激光工程2006年10月V01.35Suppl em ent hl觎r ed趾d La se r Eng抵ri ng oc t.2006多传感器数据融合目标识别算法综述徐小琴a匕京跟踪与通信技术研究所,北京100094)摘要:多传感器数据融合作为一种特殊的数据处理手段在目标识别领域得到了较大的重视和发展。
在介绍多传感器数据融合目标识别基本原理及其算法理论依据基础上,从概念分类方面,对目前多传感器数据融合目标识别算法进行了全面综述,包括参数分类算法、基于认识模型的算法、物理模型算法及多类算法综合识别法等,说明了各算法特点及对其的进一步改进,列举了目前国内外一些已经发表的重要算法,为下一步多传感器融合目标识别研究提供了一定的理论依据。
关键词:多传感器;数据融合;目标识别;证据理论;推理算法中圈分类号l T P274.2文献标识码l A文章编号:1007.2276(2006)增D.0321一osSur vey of m ul t i-sens or dat a f us i on t ar get r ecogni t i on al gor i t hm sX UⅪao—qi n(B ei ji ng h曲埔e of T r∞ki ng蛐d Tel∞D衄ul Ii cal i o娜.Ibchnol ogy’B嘶ing100094,al ina)A bs tr act:M ul t i—s ens or dat a f us i on obt ai ns def i I l i t e D e c ogI l i t i on aI l d devel op r nent ac t S a s an e spe ci al dat apr o ces s i ng r nea ns i n m e dom如of t a唱et r eco gni t i on.B as i c也eor y of r r l ul t i—s enso r dat a f us i on协略etr ecogIl i t i on andi ts al gonⅡ1mⅡl eo巧el em ent s a r e i n仰duced,and f r om m e as p ect of concept cl as si fi c撕on,aI l al l—a round sun,e y of act Il al m ul t i一§ens or dat a f us i on t a r ge t re c ogI l i t i on al gor i t l l m s i s gi V en w hi c h i n cl udes par锄et er c l as s i fl c at i on al gor i t hm s,al gor i m m s bas ed o n cogI l i t i on m odel,phys i cs m odel al g嘶m m s aI l d s ynm et i cal m ul t i一哆pe r ecogni t i on al gori t l l m s aI l d s o on,pecul i撕t ies of m ese al gor i t l l m s aI l df珊l er锄el i om t i on about t he m ar e expl ai ned,som e publ i s hed i m por t ant al gor i m m s at t ll e pres ent t i l ne a r e em m l er纳ed,w l l i ch pr ovi des def i I l i t e t l l eor e廿ca l bas es f br f ut ur e m ul t i se ns or f us i on t a r ge t r ecogni t i on r es ear ch.K ey w or ds:M ul t i—s ensor;D at a f l ls i on;№et rec删ti∞;E vi den ce nl eor y;R caso血g al go珊吼O引育众所周知,在高科技信息对抗环境下,各种监测设备功能不断增加,检测到的信息复杂多变且日益增多。
数据特征融合经典方法_概述及解释说明

数据特征融合经典方法概述及解释说明1. 引言1.1 概述在当前信息时代,数据的积累量呈指数级增长。
然而,这些海量的数据往往存在着高维度、复杂性和异构性等问题,对数据挖掘和分析带来了挑战。
为了充分利用这些宝贵的数据资源,并从中获取有意义的信息和洞察力,数据特征融合成为一种重要的技术手段。
1.2 文章结构本文将围绕数据特征融合经典方法展开讨论。
首先,在第2节中,我们将介绍几种常用的数据特征融合方法,包括方法A、方法B和方法C。
接下来,在第3节中,我们将对数据特征融合的概念进行解释,并讨论经典方法的优势与限制。
最后,在第4节中,我们将通过应用案例和实际效果评估来验证这些经典方法的实际应用价值。
最后一节则是对整篇文章进行总结,并展望未来数据特征融合研究的发展方向。
1.3 目的本文旨在系统地概述和解释数据特征融合经典方法,并深入探讨其在实际应用中的效果和局限性。
通过对这些方法的介绍和评估,我们希望能够增进对数据特征融合技术的理解,并为相关领域的研究和实践提供有益的指导和启示。
而对未来数据特征融合研究方向的展望,则可以引领更加创新和高效的数据分析方法的发展。
2. 数据特征融合经典方法:2.1 方法A:方法A是一种常用的数据特征融合方法。
它主要基于统计学原理,通过整合不同数据源的特征信息,来达到提高模型性能的目的。
该方法首先对待融合的数据进行探索性分析,了解不同特征之间的关系和重要程度。
然后,根据特征选择算法挑选出最具代表性和相关性的特征,并进行组合。
最后,采用适当的机器学习算法对整合后的特征进行建模与训练。
2.2 方法B:方法B是基于深度学习技术的数据特征融合方法。
它利用深度神经网络模型强大的拟合能力,能够从多个数据源中提取出高层次、抽象化的特征表示形式。
该方法首先构建深度神经网络结构,包括卷积神经网络(CNN)和循环神经网络(RNN)等,并将不同数据源输入到相应网络中进行训练。
然后,通过将各网络输出进行融合或级联操作得到最终预测结果。
空间数据融合

融合结果定量评价
影像 波段
HR
\
R
CCD
G
B
R
主成分 G
变换
B
R
IHS
G
变换
B
小波 R
(主成 G
分)变
换
B
小波
R
(IHS G )
变换
B
均值 标准差
120.194 96.731 142.898 61.906 85.430 116.278 94.827 91.874 134.223 58.333 168.795 171.720
2.信息量 通过信息熵可以看出主成分变换所得融合结果信息量最大, 小波
变换其次, IHS变换最后。
第三十五页,共41页。
融合结果定量评价
3.清晰度 主成分变换法融合影像的的平均梯度高于原始多光
谱影像,同时也高于原始全色影像,说明融合后的结果影像可 以更好地突出细节纹理信息,使影像更加清晰。IHS变换法, 恰恰相反。小波变换的指标接近于或稍高于原始多光谱影 像,提高较少。
第十六页,共41页。
栅格数据融合
栅格数据融合主要是多源遥感数据的融合,是将同一地区的多 源遥感数据加以智能化合成,产生比单一信源更精确、更完全、更 可靠的估计和判断。
意义:提高影像的空间分解力和清晰度
提高平面测图精度、分类的精度与可靠性
增强解译和动态监测能力 减少模糊度
提高遥感影像数据的利用率
第十七页,共41页。
据,舍弃精度低的数据。对于几何精度近似的数据源,应该分 点、线、面来探讨融合的方法。点状物体的合并较为简单, 线状物体的融合可采用特征点融合法和缓冲区算法。面状物 体的融合主要涉及边界线的融合,可参照线状物体的合并进 行。
多传感器数据融合算法汇总

一、背景介绍:多传感器数据融合是一种信号处理、辨识方法,可以与神经网络、小波变换、kalman 滤波技术结合进一步得到研究需要的更纯净的有用信号。
多传感器数据融合涉及到多方面的理论和技术,如信号处理、估计理论、不确定性理论、最优化理论、模式识别、神经网络和人工智能等。
多传感器数据融合比较确切的定义可概括为:充分利用不同时间与空间的多传感器数据资源,采用计算机技术对按时间序列获得的多传感器观测数据,在一定准则下进行分析、综合、支配和使用,获得对被测对象的一致性解释与描述,进而实现相应的决策和估计,使系统获得比它的各组成部分更充分的信息。
多传感器信息融合技术通过对多个传感器获得的信息进行协调、组合、互补来克服单个传感器的不确定和局限性,并提高系统的有效性能,进而得出比单一传感器测量值更为精确的结果。
数据融合就是将来自多个传感器或多源的信息在一定准则下加以自动分析、综合以完成所需的决策和估计任务而进行的信息处理过程。
当系统中单个传感器不能提供足够的准确度和可靠性时就采用多传感器数据融合。
数据融合技术扩展了时空覆盖范围,改善了系统的可靠性,对目标或事件的确认增加了可信度,减少了信息的模糊性,这是任何单个传感器做不到的。
实践证明:与单传感器系统相比,运用多传感器数据融合技术在解决探测、跟踪和目标识别等问题方面,能够增强系统生存能力,提高整个系统的可靠性和鲁棒性,增强数据的可信度,并提高精度,扩展整个系统的时间、空间覆盖率,增加系统的实时性和信息利用率等。
信号级融合方法最简单、最直观方法是加权平均法,该方法将一组传感器提供的冗余信息进行加权平均,结果作为融合值,该方法是一种直接对数据源进行操作的方法。
卡尔曼滤波主要用于融合低层次实时动态多传感器冗余数据。
该方法用测量模型的统计特性递推,决定统计意义下的最优融合和数据估计。
多传感器数据融合虽然未形成完整的理论体系和有效的融合算法,但在不少应用领域根据各自的具体应用背景,已经提出了许多成熟并且有效的融合方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据融合各种算法及数学知识汇总粗糙集理论理论简介面对日益增长的数据库,人们将如何从这些浩瀚的数据中找出有用的知识?我们如何将所学到的知识去粗取精?什么是对事物的粗线条描述什么是细线条描述?粗糙集合论回答了上面的这些问题。
要想了解粗糙集合论的思想,我们先要了解一下什么叫做知识?假设有8个积木构成了一个集合A,我们记:A={x1,x2,x3,x4,x5,x6,x7,x8},每个积木块都有颜色属性,按照颜色的不同,我们能够把这堆积木分成R1={红,黄,蓝}三个大类,那么所有红颜色的积木构成集合X1={x1,x2,x6},黄颜色的积木构成集合X2={x3,x4},蓝颜色的积木是:X3={x5,x7,x8}。
按照颜色这个属性我们就把积木集合A进行了一个划分(所谓A的划分就是指对于A中的任意一个元素必然属于且仅属于一个分类),那么我们就说颜色属性就是一种知识。
在这个例子中我们不难看到,一种对集合A的划分就对应着关于A中元素的一个知识,假如还有其他的属性,比如还有形状R2={三角,方块,圆形},大小R3={大,中,小},这样加上R1属性对A构成的划分分别为:A/R1={X1,X2,X3}={{x1,x2,x6},{x3,x4},{x5,x7,x8}} (颜色分类)A/R2={Y1,Y2,Y3}={{x1,x2},{x5,x8},{x3,x4,x6,x7}} (形状分类)A/R3={Z1,Z2,Z3}={{x1,x2,x5},{x6,x8},{x3,x4,x7}} (大小分类)上面这些所有的分类合在一起就形成了一个基本的知识库。
那么这个基本知识库能表示什么概念呢?除了红的{x1,x2,x6}、大的{x1,x2,x5}、三角形的{x1,x2}这样的概念以外还可以表达例如大的且是三角形的{x1,x2,x5}∩{x1,x2}={x1,x2},大三角{x1,x2,x5}∩{x1,x2}={x1,x2},蓝色的小的圆形({x5,x7,x8}∩{x3,x4,x7}∩{x3,x4,x6,x7}={x7},蓝色的或者中的积木{x5,x7,x8}∪{x6,x8}={x5,x6,x7,x8}。
而类似这样的概念可以通过求交运算得到,比如X1与Y1的交就表示红色的三角。
所有的这些能够用交、并表示的概念以及加上上面的三个基本知识(A/R1,A/R2.A/R3)一起就构成了一个知识系统记为R=R1∩R2∩R3,它所决定的所有知识是A/R={{x1,x2},{x3,x4},{x5},{x6},{x7},{x8}}以及A/R中集合的并。
下面考虑近似这个概念。
假设给定了一个A上的子集合X={x2,x5,x7},那么用我们的知识库中的知识应该怎样描述它呢?红色的三角?****的大圆?都不是,无论是单属性知识还是由几个知识进行交、并运算合成的知识,都不能得到这个新的集合X,于是我们只好用我们已有的知识去近似它。
也就是在所有的现有知识里面找出跟他最像的两个一个作为下近似,一个作为上近似。
于是我们选择了“蓝色的大方块或者蓝色的小圆形”这个概念:{x5,x7}作为X的下近似。
选择“三角形或者蓝色的”{x1,x2,x5,x7,x8}作为它的上近似,值得注意的是,下近似集是在那些所有的包含于X的知识库中的集合中求交得到的,而上近似则是将那些包含X的知识库中的集合求并得到的。
一般的,我们可以用下面的图来表示上、下近似的概念。
这其中曲线围的区域是X的区域,蓝色的内部方框是内部参考消息,是下近似,绿的是边界加上蓝色的部分就是上近似集。
其中各个小方块可以被看成是论域上的知识系统所构成的所有划分。
核心整个粗集理论的核心就是上面说的有关知识、集合的划分、近似集合等等概念。
下面我们讨论一下关于粗糙集在数据库中数据挖掘的应用问题。
考虑一个数据库中的二维表如下:元素颜色形状大小稳定性x1 红三角大稳定x2 红三角大稳定x3 黄圆小不稳定x4 黄圆小不稳定x5 蓝方块大稳定x6 红圆中不稳定x7 蓝圆小不稳定x8 蓝方块中不稳定可以看出,这个表就是上面的那个例子的二维表格体现,而最后一列是我们的决策属性,也就是说评价什么样的积木稳定。
这个表中的每一行表示了类似这样的信息:红色的大三角积木稳定,****的小圆形不稳定等等。
我们可以把所有的记录看成是论域A={x1,x2,x3,x4,x5,x6,x7,x8},任意一个列表示一个属性构成了对论域的元素上的一个划分,在划分的每一个类中都具有相同的属性。
而属性可以分成两大类,一类叫做条件属性:颜色、形状、大小都是,另一类叫做决策属性:最后一列的是否稳定?下面我们考虑,对于决策属性来说是否所有的条件属性都是有用的呢?考虑所有决策属性是“稳定”的集合{x1,x2,x5},它在知识系统A/R中的上下近似都是{x1,x2,x5}本身,“不稳定”的集合{x3,x4,x6,x7,x8},在知识系统A/R中的上下近似也都是{x3,x4,x6,x7,x8}它本身。
说明该知识库能够对这个概念进行很好的描述。
下面考虑是否所有的基本知识:颜色、形状、大小都是必要的?如果我们把这个集合在知识系统中去掉颜色这个基本知识,那么知识系统变成A/(R-R1)={{x1,x2},{x3,x4,x7},,,}以及这些子集的并集。
如果用这个新的知识系统表达“稳定”概念得到上下近似仍旧都是:{x1,x2,x5},“不稳定”概念的上下近似也还是{x3,x4,x6,x7,x8},由此看出去掉颜色属性我们表达稳定性的知识不会有变化,所以说颜色属性是多余的可以删除。
如果再考虑是否能去掉大小属性呢?这个时候知识系统就变为:A/(R-R1-R3)=A/R2={{x1,x2},{x5,x8},{x3,x4,x6,x7}}。
同样考虑“稳定”在知识系统A/R2中的上下近似分别为:{x1,x2,x5,x8}和{x1,x2},已经和原来知识系统中的上下近似不一样了,同样考虑“不稳定”的近似表示也变化了,所以删除属性“大小”是对知识表示有影响的故而不能去掉。
同样的讨论对于“形状”属性,“形状”属性是可以去掉的。
A/(R-R2)={{x1,x2},x6,{x3,x4},x5,x7,x8},通过求并可以得知“稳定”的下近似和上近似都是{x1,x2,x5},“不稳定”的上下近似都是{x3,x4,x6,x7,x8}。
最后我们得到化简后的知识库R2,R3,从而能得到下面的决策规则:大三角->稳定,大方块->稳定,小圆->不稳定,中圆->不稳定,中方块->不稳定,利用粗集的理论还可以对这些规则进一步化简得到:大->稳定,圆->不稳定,中方块->不稳定。
这就是上面这个数据表所包含的真正有用的知识,而这些知识都是从数据库有粗糙集方法自动学习得到的。
因此,粗糙集是数据库中数据挖掘的有效方法。
从上面这个例子中我们不难看出,实际上我们只要把这个数据库输入进粗糙集运算系统,而不用提供任何先验的知识,粗糙集算法就能自动学习出知识来,这正是它能够广泛应用的根源所在。
而在模糊集、可拓集等集合论中我们还要事先给定隶属函数。
进入网络信息时代,随着计算机技术和网络技术的飞速发展,使得各个行业领域的信息急剧增加,如何从大量的、杂乱无章的数据中发现潜在的、有价值的、简洁的知识呢?数据挖掘(Data Mining)和知识发现(KDD)技术应运而生。
编辑本段主要优势粗糙集理论作为一种处理不精确(imprecise)、不一致(inconsistent)、不完整(incomplete)等各种不完备的信息有效的工具,一方面得益于他的数学基础成熟、不需要先验知识;另一方面在于它的易用性。
由于粗糙集理论创建的目的和研究的出发点就是直接对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律,因此是一种天然的数据挖掘或者知识发现方法,它与基于概率论的数据挖掘方法、基于模糊理论的数据挖掘方法和基于证据理论的数据挖掘方法等其他处理不确定性问题理论的方法相比较,最显著的区别是它不需要提供问题所需处理的数据集合之外的任何先验知识,而且与处理其他不确定性问题的理论有很强的互补性(特别是模糊理论)。
编辑本段研究方向理论①利用抽象代数来研究粗糙集代数空间这种特殊的代数结构。
②利用拓扑学描述粗糙空间。
③还有就是研究粗糙集理论和其他软计算方法或者人工智能的方法相接合,例如和模糊理论、神经网络、支持向量机、遗传算法等。
④针对经典粗糙集理论框架的局限性,拓宽粗糙集理论的框架,将建立在等价关系的经典粗糙集理论拓展到相似关系甚至一般关系上的粗糙集理论。
应用领域粗糙集理论在许多领域得到了应用,①临床医疗诊断;②电力系统和其他工业过程故障诊断;③预测与控制;④模式识别与分类;⑤机器学习和数据挖掘;⑥图像处理;⑦其他。
算法一方面研究了粗糙集理论属性约简算法和规则提取启发式算法,例如基于属性重要性、基于信息度量的启发式算法,另一方面研究和其他智能算法的结合,比如:和神经网络的结合,利用粗糙集理论进行数据预处理,以提高神经网络收敛速度;和支持向量机SVM结合;和遗传算法结合;特别是和模糊理论结合,取得许多丰硕的成果,粗糙理论理论和模糊理论虽然两者都是描述集合的不确定性的理论,但是模糊理论侧重的是描述集合内部元素的不确定性,而粗糙集理论侧重描述的是集合之间的不确定性,两者互不矛盾,互补性很强,是当前国内外研究的一个热点之一。
Dempster证据理论证据理论是由Dempster于1967年首先提出,由他的学生shafer于1976年进一步发展起来的一种不精确推理理论,也称为Dempster/Shafer 证据理论(D-S证据理论),属于人工智能范畴,最早应用于专家系统中,具有处理不确定信息的能力。
作为一种不确定推理方法,证据理论的主要特点是:满足比贝叶斯概率论更弱的条件;具有直接表达“不确定”和“不知道”的能力.。
在此之后,很多技术将 DS 理论进行完善和发展,其中之一就是证据合成(Evidential reasoning, ER) 算法。
ER 算法是在置信评价框架和DS 理论的基础上发展起来的。
ER 算法被成功应用于:机动车评价分析、货船设计、海军系统安全分析与综合、软件系统安全性能分析、改造轮渡设计、行政车辆评估集组织评价。
在医学诊断、目标识别、军事指挥等许多应用领域,需要综合考虑来自多源的不确定信息,如多个传感器的信息、多位专家的意见等等,以完成问题的求解,而证据理论的联合规则在这方面的求解发挥了重要作用。
在DS证据理论中,由互不相容的基本命题(假定)组成的完备集合称为识别框架,表示对某一问题的所有可能答案,但其中只有一个答案是正确的。