粗糙集研究综述
粗糙集

粗糙集理论建立在这样一个前提上:即所考虑的 论域中的每一个对象都包含某种信息(数据和知 识)。
条件属性集:
数学定义是:P={P1,P2,…,Pm} 解释:就是对象的各种属性总和(也就是数据库中 的字段) Pm 就是这个对象的一个属性
基本集(基本粒度):
定义:所有不可区分的对象形成的集合 解释:可区分(可分辨):如果Ui ≠Uj 就称这两个 对象在其条件P下是可区分的(对于两个不同的对 象至少有一个属性是不同的)否则即为不可区分
集合O 的下逼近(即正区) 为 I 3 (O ) = PO S (O ) = {刘保,赵 凯} 集合O 的负区为 N EG (O ) = {李得} 集合O 的边界区为 BND (O ) = {王治, 马丽} 集合O 的上逼近为 I 3 (O ) = PO S (O ) + BND (O ) = {刘保,赵凯,王治,马 丽} 根据表1, 可以归纳出下面几条规则, 揭示了教育程度与 是否能找到好工作之间的关 RUL E 1: IF (教育程度= 大学) OR (教育程度= 博士) THEN (可以找到好工作) RUL E 2: IF (教育程度= 小学) THEN (找不到好工作) RUL E 3: IF (教育程度= 高中) THEN (可能找到好工作)
例
对于上表来说,U中有四个对象(概念),而现 在条件集合中只有一个属性,对于U1和U2来说, 它们的p不同所以可以通过p来区分,即u1,u2在p 下可区分;而U2和U3虽然是不同的对象但是在P 下却是相同的,即在p下不可区分,就成为不可ห้องสมุดไป่ตู้区分
粗糙集:
一个集合若恰好等于基本集的任意并集称为一个清晰 (crisp)集(精确集),否则称为粗糙(rough)集(不 精确集)。 解释:都可区分的是清晰集,有不可区分的对象为粗糙 集 主要特点:以不完全信息或知识去处理一些不分明现象的 能力,或依据观察、度量到的某些不精确的结果而进行分 类数据的能力. 粗糙集体现了集合中元素间的不可区分性. 主要优势:它不需要提供问题所需处理的数据集合之外的 任何先验知识,而且与处理其它不确定性问题的理论有很 强的互补性.
基于粗糙集智能集成方法的故障诊断应用综述

的重视。 a l 于 19 年出版了《 Pwa k 91 粗糙集一 关于数 据推理的理论》 专著, 从而使粗糙集理论及其应用 进 入 了一个 新 的研 究 阶段 。19 9 2年关 于粗糙集 理
论 的第一 届 国 际学 术会 议 在 波 兰召 开 .95年 粗 19 糙 集理 论被 列为计 算 机科学 新兴 的研究 课题 【 。
输 出残 差进行 处 理 , 并得 出诊 断结 果 。 通过选 用 确
粗糙集的算法研 究 , 一方面侧重于属性约简 算法 和规 则 提取启 发 式算 法 , 如基 于属性 重要 性 、 信息度量的启发式算法 ;另一方面侧重于和其他 智能算法 ( 如神经 网络 、 支持向量机 、 遗传算法 、 模 糊理论) 的结合 。 由于粗糙集理论描述的是集合之 间的不确定性 .且无需所需处理的数据集合之外 的任何先验知识来处理不精确或不确定问题 , 从 而与概率论 、模糊数学和证据理论等有很强的互
棒 性及 系统对 于早 期故 障 的灵 敏度 参 数估计 方 。
法通过辨识系统模型参数实现故障诊断 ,适用于 线性 系统 和非 线性 系统 。在 实 际应用 中为 了提高 故障检测和分离性能 ,参数估计法通常结合其他 数学模型使用嘲 。 基于信号处理的故 障诊断方法 主要有两种 :
5 一 8
知识是对客观世界的认识和总结 .是把有关 信息相关联形成 的信息结构。知识在粗糙集中也 是一个重要概念 .表示论域 u中以基本概念作为 模 块 的概 念族 。 中 , 域 【表 示研 究对象 组成 的 其 论 ,
糊方法在建立正确的模糊规则和隶属函数上存在
非空有限集合 。 概念是论域的任意子集 。 基本概念
态估计方法 、 参数估计方法和等价空间方法。 状态
粗糙集理论及其应用研究

粗糙集理论及其应用研究一、粗糙集理论概述粗糙集是一种用于解决不确定性问题的数学工具。
粗糙集理论中知识被理解为对事物进行区分的能力,在形式上表现为对论域的划分,因而通过论域上的等价关系表示。
粗糙集通过一对上、下近似算子来刻画事物,它不需要数据以外的任何先验知识,因此具有很高的客观性。
目前,粗糙集被广泛用于决策分析、机器学习、数据挖掘等领域[1~6]。
二、粗糙集中的基本概念[7]定义1 论域、概念。
设U是所需研究的对象组成的非空有限集合,称为一个论域,即论域U。
论域U的任意一个子集XU,称为论域U的一个概念。
论域U中任意一个子集簇称为关于U的知识。
定义2 知识库。
给定一个论域U和U上的一簇等价关系S,称二元组K=(U,S)是关于论域U的知识库或近似空间。
定义3 不可分辨关系。
给定一个论域U和U上的一簇等价关系S,若PS,且P≠?,则∩P仍然是论域U上的一个等价关系,称为P上的不可分辨关系,记做IND(P)。
称划分U/IND(P)为知识库K=(U,S)中关于论域U的P-基本知识。
定义4 上近似、下近似。
设有知识库K=(U,S)。
其中U为论域,S为U 上的一簇等价关系。
对于X∈U和论域U上的一个等价关系R∈IND(K),则X关于R的下近似和上近似分别为:下近似R(X)=∪{Y∈U/R|YX}上近似R(X)=∪{Y∈U/R|Y∩X=?}集合的上近似和下近似是粗糙集中最核心的概念,粗糙集的数字特征以及拓扑特征都是由它们来描述和刻画的。
当R=(X)时,称X是R-精确集;当R(X)≠(X)时,称X是R-粗糙集,即X是粗糙集。
三、粗糙集理论的优势随着人们对粗糙集理论的不断研究,它的应用领域在不断扩大,粗糙集理论的优势在于:1)他不需要专家的经验知识,而仅利用现实实例数据本身提供的信息;2)能搜索数据的最小集合,能从实例数据中获取易于证实的规则知识,最后,它同时允许使用定性和定量的数据。
近年来,粗糙集理论应用到了许多领域。
粗糙集

粗糙集(Rough Set)理论是由波兰数学家Pawlak在1982年提出的一种数据分析理论,常用于处理模糊和不精确的问题。
RS可以从大量的数据中挖掘潜在的、有利用价值的知识,它与概率方法、模糊集方法和证据理论方法等其他处理不确定性问题理论的最显著的区别在于:它无需提供问题所需处理的数据集合之外的任何先验信息(即无需指定隶属度或隶属函数)。
粗糙集是提供了严格的数学理论方法。
它把知识理解为对对象的分类能力。
它包含了知识的一种形式模型,这种模型将知识定义为不可区分关系的一个族集。
在信息检索过程中,由于文档中存在大量的多义和近义现象,导致不确定性出现,这将影响检索的性能。
为此采用基于互信息的粗糙集理论来处理这类不确定性问题。
动态约简技术探讨:利用标准的粗糙集方法来产生约简,即直接在原决策表的基础上计算所有的约简集,然后利用这些约简计算决策规则集合来分类未知对象。
这种方法对于未知对象的分类不总是足够充分的,因为该方法没有考虑到约简集的属性部分可能是混乱、不规则的。
动态约简是来自于在决策表的众多随机采样的子表中具有最大的出现频率的约简,在此意义上来说,利用动态约简来分类位置对象是最为稳定、可靠的。
经典粗糙集理论是建立在对象空间的等价类之上,采用上近似、下近似和边界的概念来分析对象的空间中不能由等价关系定义的子集的性质,是一种利用三值逻辑处理不精确或不完全信息的形式化方法。
有“智慧”,实际上是它们将外部环境和内部状态的传感信号分类,得出可能的情况,并由此支配行动,知识直接与真实或抽象世界有关的不同分类模式联系在一起。
因此,任何一个物种都是由一些知识来描述,对物种可以产生不同的分类。
从而如何在知识库中进行本质特征提取,发现最简决策表及最简分类规则集成为知识描述的关键。
从理论上看,智能信息处理的重要任务就是要从大量观察和实验数据中获取知识、表达知识、推理决策规则,特别是对于不精确、不完整的知识。
RS是处理不精确信息的有力工具。
粗糙集理论及其应用研究

粗糙集理论的核心内容
知识的约简与核
知识的约简: 通过删除不重 要的知识,保 留关键信息
核的概念:核 是知识的最小 表示,包含所 有必要信息
核的性质:核 具有独立性、 完备性和最小 性
核的求取方法: 基于信息熵、 信息增益等方 法进行求取
0
0
0
0
1
2
3
4
决策表的简化
决策表:用于描述决策问题的表格 简化目标:减少决策表的规模,提高决策效率 简化方法:合并条件属性,删除冗余属性 简化效果:提高决策表的可读性和可理解性,降低决策复杂度
粗糙集理论在聚类分析中的应用:利用粗糙集理论处理不确定和不完整的数据,提高聚类 分析的准确性和效率。
聚类分析在数据挖掘中的应用:可以帮助发现数据中的模式和趋势,为决策提供支持。
粗糙集理论在其他领域的应用
决策支持系统
粗糙集理论可以帮助决策者 处理不确定性和模糊性
粗糙集理论在决策支持系统 中的应用
粗糙集理论可以提高决策支 持系统的准确性和效率
粗糙集理论在决策支持系统 中的实际应用案例分析
智能控制
粗糙集理论在模糊控制中的 应用
粗糙集理论在智能控制中的 应用
粗糙集理论在神经网络控制 中的应用
粗糙集理论在自适应控制中 的应用
模式识别
粗糙集理论在模式 识别中的应用
粗糙集理论在图像 识别中的应用
粗糙集理论在语音 识别中的应用
粗糙集理论在生物 信息学中的应用
添加标题
添加标题
ห้องสมุดไป่ตู้添加标题
添加标题
机器学习
粗糙集理论在机器学习中的应用 粗糙集理论在数据挖掘中的应用 粗糙集理论在模式识别中的应用 粗糙集理论在自然语言处理中的应用
粗糙集综述word版

粗糙集论文题目 粗糙集综述1 粗糙集属性约简1.1 经典粗糙集属性约简对于经典粗糙集我们可以用上下近似来描述。
给定知识库()R U K ,=,对于每个子集U X ⊆和一个等价关系()K ind R ∈,定义两个上下近似:{}{}.|/,|/ U U φ≠⋂∈=⊆∈=X Y R U Y X R X Y R U Y X R 另外上下近似还可以用以下的等式表达:[]{}[]{}.|,| U U φ≠⋂∈=⊆∈=X x U x X R X x U x X R R R 当利用区分矩阵来表达知识时有许多优点,特别是他能很容易计算约简和核。
约简是满足能区别由整个属性集区别的所有对象的属性极小子集。
如果A 包含B 是满足B 交区别对象x 和y 的所有属性集合的极小子集不为空,且区别对象x 和y 的所有属性集合的极小子集不为空,则B 是A 的一个约简。
核是区分矩阵中所有单个元素组成的集合。
对于决策表,C 为条件属性集,D 为决策属性集,决策表S 的区分矩阵是一个n n ⨯矩阵,其任一元素为},x ),(),(|{),(a *)(且y a y f a x f C a y x ω≠∈=对于满足),(,,x y x U y ω∈)(y )(x D pos D pos C C ∉∈且,或者)(y )(x D pos D pos C C ∈∉且,或者).(),()(,D ind y x D pos y x C ∉∈且如果φφ≠∀≠⋂⊆),(,),(C C C **''y x a y x a 满足条件的极小子集(关于包含),则'C 是C 的D 约简(相对约简).D 核(相对核)是决策表S 的区分矩阵中所有单个元素组成的集合,即}.,},{),(a |{)(core *U y x a y x C a C D ∈=∈=其中1.2 变精度粗糙集属性约简变精度粗糙集是粗糙集的扩充,它是在基本粗糙集模型的基础上引入)5.00(<≤ββ,即允许一定程度的错误分类率存在。
粗糙集理论的属性重要性评估方法及其实际应用
粗糙集理论的属性重要性评估方法及其实际应用引言:粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它在数据挖掘、模式识别和决策分析等领域中得到了广泛的应用。
在粗糙集理论中,属性重要性评估是一个重要的问题,它能够帮助我们识别出对决策结果具有重要影响的属性,从而提高决策的准确性和可靠性。
本文将介绍一种基于粗糙集理论的属性重要性评估方法,并探讨其在实际应用中的价值。
一、粗糙集理论概述粗糙集理论是由波兰学者Pawlak于1982年提出的,它是一种处理不确定性和模糊性问题的数学工具。
粗糙集理论通过将对象的属性进行划分,将属性值之间的差异进行模糊化处理,从而实现对不完备和不精确数据的分析和决策。
粗糙集理论的核心思想是近似和约简,即通过近似的方法对数据进行简化和压缩,从而提取出最重要的信息。
二、属性重要性评估方法在粗糙集理论中,属性重要性评估是一个关键问题。
属性重要性评估的目标是确定哪些属性对决策结果的影响最大,从而帮助我们进行决策和分析。
常用的属性重要性评估方法有正域、核和约简等方法。
1. 正域方法正域方法是一种基于粗糙集的属性重要性评估方法。
它通过计算属性在正域中的覆盖度来评估属性的重要性。
正域是指在给定条件下能够唯一确定决策结果的属性取值,它反映了属性对决策结果的贡献程度。
正域方法的优点是简单直观,容易理解和计算,但它没有考虑属性之间的依赖关系。
2. 核方法核方法是一种基于粗糙集的属性重要性评估方法。
它通过计算属性在核中的约简度来评估属性的重要性。
核是指在给定条件下能够唯一确定决策结果的最小属性集合,它反映了属性对决策结果的决定性影响。
核方法考虑了属性之间的依赖关系,能够更准确地评估属性的重要性,但计算复杂度较高。
3. 约简方法约简方法是一种基于粗糙集的属性重要性评估方法。
它通过对属性集合进行约简,得到一个最小的属性子集,从而实现对属性的重要性评估。
约简方法的优点是能够同时考虑属性之间的依赖关系和决策结果的覆盖度,能够更全面地评估属性的重要性。
经典粗糙集理论
粗糙集可以用于提取数据中的决策规则,这些规则可以作为神经网络的 训练样本。通过训练,神经网络可以学习到决策规则,并用于分类或预 测。
边界区域
近似集合中的不确定性区 域,即既不属于正域也不 属于负域的元素集合。
粗糙集的度量
精确度
描述了集合中元素被近似集合 包含的程度,即属于近似集合
的元素比例。
覆盖度
描述了近似集合能够覆盖的元 素数量,即近似集合的大小。
粗糙度
描述了集合被近似程度,是精 确度和覆盖度的综合反映。
知识的不确定性
描述了知识表达系统中属性值 的不确定性程度,与粗糙度相
经典粗糙集理论
目录
• 粗糙集理论概述 • 粗糙集的基本概念 • 粗糙集的运算与性质 • 粗糙集的决策分析 • 粗糙集与其他方法的结合 • 经典粗糙集理论案例研究
01 粗糙集理论概述
定义与特点
定义
粗糙集理论是一种处理不确定性和模 糊性的数学工具,通过集合近似的方 式描述知识的不完全性和不确定性。
粗糙集理论中的属性约简可以用于简化神经网络的输入特征,降低输入 维度,提高分类或预测的准确率。
粗糙集与遗传算法
01
遗传算法是一种全局优化算法,能够通过模拟自然界的进化过程来寻找最优解 。将粗糙集与遗传算法结合,可以利用粗糙集对数据的分类能力,结合遗传算 法的全局搜索能力,寻找最优的分类规则或决策规则。
02
粗糙集可以用于生成初始的分类规则或决策规则,然后利用遗传算法对这些规 则进行优化,通过选择、交叉、变异等操作,寻找最优的规则组合。
粗糙集理论简介及应用介绍
粗糙集理论简介及应用介绍引言:在现代信息时代,数据的快速增长和复杂性给决策和问题解决带来了挑战。
为了更好地理解和分析数据,人们提出了许多数据挖掘和分析方法。
其中,粗糙集理论作为一种有效的数据处理方法,被广泛应用于各个领域。
本文将简要介绍粗糙集理论的基本概念以及其在实际应用中的一些案例。
一、粗糙集理论的基本概念粗糙集理论是由波兰学者Pawlak在20世纪80年代初提出的。
它是一种基于近似和不确定性的数学工具,用于处理不完全和不确定的信息。
粗糙集理论的核心思想是通过将数据划分为等价类来对数据进行描述和分析。
在这种划分中,数据被分为确定和不确定的部分,从而实现了对数据的粗糙描述。
1.1 粗糙集的等价关系粗糙集的等价关系是粗糙集理论的基础。
在粗糙集中,等价关系是指具有相同属性值的数据实例之间的关系。
通过等价关系,我们可以将数据实例划分为不同的等价类,从而实现对数据的刻画和分析。
1.2 下近似集和上近似集在粗糙集中,下近似集和上近似集是对数据的进一步描述。
下近似集是指具有最小确定性的数据实例的集合,而上近似集是指具有最大确定性的数据实例的集合。
通过下近似集和上近似集,我们可以更好地理解数据的不确定性和不完整性。
二、粗糙集理论的应用案例粗糙集理论在实际应用中具有广泛的应用价值。
以下将介绍一些典型的应用案例。
2.1 数据挖掘粗糙集理论在数据挖掘中被广泛应用。
通过粗糙集理论,我们可以对大量的数据进行分类和聚类。
例如,在医学领域,研究人员可以利用粗糙集理论对医疗数据进行分类,从而实现对疾病的诊断和治疗。
2.2 特征选择特征选择是数据挖掘和机器学习中的一个重要问题。
通过粗糙集理论,我们可以对数据中的特征进行选择,从而减少数据的维度和复杂性。
例如,在图像识别中,研究人员可以利用粗糙集理论选择最具代表性的图像特征,从而提高图像识别的准确性和效率。
2.3 决策支持系统粗糙集理论在决策支持系统中的应用也非常广泛。
通过粗糙集理论,我们可以对决策问题进行建模和分析。
粗糙集理论研究综述
活跃 期 。经过 十 几 年 的 发 展 以及 研 究 的 深 入 ,在 理 论
关 键 词 :粗 糙 集 理 论 ;智 能 方 法 ;F G P A;硬 件 实 现 中 图 分 类 号 :N 4 91 文 献 标 识 码 :A 文 章 编 号 : 10 0 2—6 6 ( 0 8 0 0 1 2 0 ) 6—0 0 0 1—0 4
A r e n Ro gh Se Su v y o u t The y or
i eiet to s t atnr ue oe t i pe et og e bsdo P A n lgn me d.A s it d csam dlo m lm n ru st ae nF G . tl h l o h
Ke r s o u h s tt e r ;i tl g n t o y wo d :r g e h o y n el e tme d; F G ; h r w r e l a in i h P A ad aerai t z o
Ab t a t T e r u h s tt e r sa r l t e y n w s f c mp t g me h d t e l i f z y a d u c r i n o mai n T i a e e i w sr c : h o g u i t o o d a m u z n n e t n if r t . h sp p rr ve s v n w a o te t e r f o g e .i t d c s te ma n c n e to o g e h o y a d d s u s st ea p i ain o er u h s t e r xn t eo h r h h oy o u h s t n r u e h i o c p fru h s tte r n i s e p l t ft g e o mii gwi t t e r o c h c o h o h t y hh
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3粗糙集理论扩展
针对经典粗糙集,国内外学者已经做了大量的 改进与推广工作。从粗糙集的基本要素来看,主要 有3个方面的工作:基于不可分辨关系的扩展¨6|、 基于被近似集合的扩展、基于包含算子的扩展嵋1。 不可分辨关系可以说是经典粗糙集最基本的概念, 上、下近似算子可以被该关系所刻画,将等价关系
are
alSO introduced.
Key words:rough set;feature selection;rule induction;classification
1
引
言
实际问题中出现测量噪声及测量不完全问题。因而 对于粗糙集的研究与开发不仅仅集中在它的应用领
域,还包括粗糙集理论框架本身。目前针对RST 的扩展方法有很多,这些方法一般从3个方面人
法。比如,为了处理不完备信息系统,很多非等价
集。V=Uo。。uDK是属性的值域,其中,圪是属性 a的值域。.厂:U×(cuD)一y是信息决策函数。 当D≠囝时,该信息表是一个决策信息表。 不可分辨关系(等价关系): 对于任意属性子集B∈CUD, IND(B)={(戈,Y)∈己产If(戈,a)=八Y,a),Va∈B}
(2)
关系如容差关系、相似关系、量化容差关系、限制 容差关系、优势关系及特征关系被引入进来扩展粗 糙集模型¨8|。代数方法又称公理化方法,有时也 称为算子方法,它以近似算子为基础,给定满足某 些特性的近似算子,使用这些算子导出相应的二元 关系,使用这个二元关系又通过构造性方法产生给
定的近似算子。利用代数方法的主要优点是能够深
all
outline of the basic concepts of rough sets and their major extensions,covering
variable precision,tolerance,dominance—based and fuzzy rough sets.The successful applications of fuzzy set theory in feature selection and classification
使用不可分辨关系可以对论域形成一个划分
U/IND(B)(或者U/B)。其中划分的每个小区域均
是一个等价类,记为
[戈]。={Y∈UI(戈,Y)∈IND(B)}
对于任意论域中的任意子集x∈U,其相对于丑 的上近似与下近似可以分别记为 B(x)={茗∈UI[菇]。C_X}
f31
刻了解粗糙集的数学结构¨9|。 目前关于公理化的研究主要集中在公理组的极 小化和独立性两个方面,同时该方法的应用对象也 由经典粗糙集算子扩展到模糊粗糙近似算子、粗糙 模糊近似算子以及直觉模糊近似算子等¨9’2¨。在 Pawlak粗糙集模型中被近似集合是清晰集(crisp
为 %=7P(Q)=lPOS,(Q)I/I POSR(D)=POSc(D)
UI
(7)
对于条件属性的任一子集R∈C,如果:
f8)
tabase)系统已经建立,其中具有代表性的有KDD-
R,RoughDAS&RoughClass[8|,LERS[9|,Rosetta[10]
POSR(D)≠POSR山}(D),a∈R
(或特征)集合’2 J。经典的RST(Pawlak提出的模
型)建立在等价关系上,要求很高,无法有效应对
收修定稿日期:2012・1l-25 收稿日期:2012-04-20; 基金项目:国家自然科学基金(61074176);国家自然科学基金(61104214);国家自然科学基金创新群体(60921003) 作者简介:王学恩(1982一),男,山东邹城人,博士,主要研究方向为不确定信息处理、粗糙集理论等;韩崇昭(1943一),男,教授 博士生导师。
息处理工具有很强的互补性旧j,因而将RST与其
高效的计算方法,从一开始它就被成功的用来解决 知识提取、数据约简、数据重要性评估、决策规则
提取、基于数据的推理解释等问题。从形式上看,
粗糙集使用上近似、下近似这样一对精确的概念 (集合)来描述一个含糊的概念(集合)。其中下近 似集合中包含的对象是可以确定的归入到某一感兴
基于粗糙集理论的KDD(Knowledge
Discovery in Da-
BND日(D)=Ux。U/DB(X)一U x。U/D墨(x)
(6)
式中,正区域表示的是基于B的划分区域中可以确 定的被划分到某一个基于D的划分区域中的所有区 域集合,反映的是属性集B相对于D的分类能力。 对于P,QcCUD,Q对P的依赖度可以定义
set),针对非清晰集合已经有一些扩展模型,其中
B(X)={戈∈uf[戈]。z置≠⑦} 上近似是指在基于B的划分区域中可以确定的
被划分到x类中对象集合。下近似是指基于日的
研究最多的是将被近似集合扩展到模糊集合,给出
模糊粗糙集模型相关理论。还有一些研究将被近似
划分区域中有可能被划分到x类中对象集合。 对于属性集合B∈c,其相对于决策集合D的 正区域、负区域(外部区域)和边界区域定义如下: POSB(D)=ux。wD墨(X)
这一情况文献给出一种变精度粗糙集模型旧3|,该
万方数据
第1期
王学恩等:粗糙集研究综述
・3・
模型用一种多数包含算子取代原来的包含算子,允 许一定程度的错误分类率存在。此外,在Pawlak 的粗糙集模型中,所有的概念定义均基于一个论域
U,文献将粗糙集模型推广到两个不同但相关的论 域上Ⅲj,此种情况其实也可以看成一种对等价关 系的推广,此时的二元关系变成了2个不同论域笛
to
cently.the theory and its extensions have been前dety applied
ognition
many
problems,including decision analysis,data mining,pattern
ree—
and intelligent contr01.This paper presents
27
文献标识码:A
A Survey of Rough
sets
Theory
Qin92
WANG Xue—e凡1。HAN Chong—zha01,HAN De-qian91,FAN
(1.Institute ofIntegrated Automation,Xi’all Jiaotong University,Xi’an 710049,China;
摘
要:粗糙集理论提供了一种有效处理不完整、不确定信息的数学工具。近年来,它被
广泛应用于决策分析、数据挖掘、模式识别、智能控制等领域,介绍了粗糙集的基本理论以及 其扩展模型,其中详细介绍了变精度、容差、优势、模糊等粗糙集模型。在应用研究方面,主 要介绍了粗糙集在特征选择、模式分类两个方面研究进展。 关键词:粗糙集;特征选择;规则提取;分类 中图分类号:TP
2.Southwest China research Institute of Electronic Equipment,Sichuan
610036,China)
Abstract:Rough set theory provides
a
useful mathematical foundation for effectively handling imperfect and uncertain information.Re。
在机器学习、模式识别、数据挖掘、智能控制 等领域,如何有效处理不完整、不确定信息,实现 知识的提取是智能计算领域一个重要的研究课题, 有着十分重要的理论和实践意义。Pawlak在1982
年提出了粗糙集理论¨o(Rough Set Theory,简称 RST),成为该领域重要的理论与方法之一。
RST是一个好的数学工具,可用于设计开发出
扩展到非等价关系显然可以得到不同的粗糙集模
2节对经典粗糙集理论作了介绍,第3节介绍了基 于粗糙集的各种扩展模型。基于粗糙集的应用研究 结果在第4节给出。
2粗糙集基本理论
一个信息表可以描述为¨4’15 J: S=(U,C,D,y∽
(1) 式中,u是论域,c是条件属性集;D是决策属性
型,对此主要有两种研究方式:构造化方法和代数 方法‘17]。构造化方法以二元关系为基础,定义粗 糙集近似算子并构造粗糙集代数系统。因此这种方 法多是根据实际问题直接够造新的二元关系,所建 立的模型有很强的实用价值,也是最为常用的方
万方数据
・Hale Waihona Puke ・控制工程第20卷
邻(nearest neighbor,NN)法,并将它们用于各个领 域如医学图像处理∞一o、字符识别。刊等。 粗糙集理论发展近三十年来,无论在理论研究 还是应用研究均取得了很多成果。从1992年至今, 每年都召开以粗糙集为主题的国际会议,主要的 RSCTC、RsFDG圯和RSKT。在国内,从2001年开 始每年将举办粗糙集与软计算学术会议。此外很多
粗糙集(FRS)模型、粗糙模糊集(RFS)模型拉1’地291,
POS印(D)=U工。wD当(X)
ⅣEG肇(D)=U—Ux。啪&(x)
(13) (14)
BND邛(D)=U-=r;wD%(x)一UJ。wD当(X)(15)
20 1
3年1月
控
制
工
程
Jan.2 0 l 3
V01.20,No.1
第20卷第1期
Control Engineering of China
文章编号:1671-7848(2013)0143001-08
粗糙集研究综述
王学恩1,韩崇昭1,韩德强1,范
卿2
(1西安交通大学综合自动化研究所,陕西西安710049;2中国电子科技集团公司第二十九研究所,四川成都610036)