粗糙集理论及其应用与发展研究
粗糙集理论及其应用研究

粗糙集理论及其应用研究一、粗糙集理论概述粗糙集是一种用于解决不确定性问题的数学工具。
粗糙集理论中知识被理解为对事物进行区分的能力,在形式上表现为对论域的划分,因而通过论域上的等价关系表示。
粗糙集通过一对上、下近似算子来刻画事物,它不需要数据以外的任何先验知识,因此具有很高的客观性。
目前,粗糙集被广泛用于决策分析、机器学习、数据挖掘等领域[1~6]。
二、粗糙集中的基本概念[7]定义1 论域、概念。
设U是所需研究的对象组成的非空有限集合,称为一个论域,即论域U。
论域U的任意一个子集XU,称为论域U的一个概念。
论域U中任意一个子集簇称为关于U的知识。
定义2 知识库。
给定一个论域U和U上的一簇等价关系S,称二元组K=(U,S)是关于论域U的知识库或近似空间。
定义3 不可分辨关系。
给定一个论域U和U上的一簇等价关系S,若PS,且P≠?,则∩P仍然是论域U上的一个等价关系,称为P上的不可分辨关系,记做IND(P)。
称划分U/IND(P)为知识库K=(U,S)中关于论域U的P-基本知识。
定义4 上近似、下近似。
设有知识库K=(U,S)。
其中U为论域,S为U 上的一簇等价关系。
对于X∈U和论域U上的一个等价关系R∈IND(K),则X关于R的下近似和上近似分别为:下近似R(X)=∪{Y∈U/R|YX}上近似R(X)=∪{Y∈U/R|Y∩X=?}集合的上近似和下近似是粗糙集中最核心的概念,粗糙集的数字特征以及拓扑特征都是由它们来描述和刻画的。
当R=(X)时,称X是R-精确集;当R(X)≠(X)时,称X是R-粗糙集,即X是粗糙集。
三、粗糙集理论的优势随着人们对粗糙集理论的不断研究,它的应用领域在不断扩大,粗糙集理论的优势在于:1)他不需要专家的经验知识,而仅利用现实实例数据本身提供的信息;2)能搜索数据的最小集合,能从实例数据中获取易于证实的规则知识,最后,它同时允许使用定性和定量的数据。
近年来,粗糙集理论应用到了许多领域。
粗糙集理论及其应用与发展研究

粗糙集理论及其应用与发展研究作者:韦良来源:《电脑知识与技术·学术交流》2008年第28期摘要:粗糙集理论是一种研究不精确、不确定性、处理不完备知识的数学工具,目前被广泛应用于人工智能、模式识别、机器学习、决策支持和数据挖掘等领域。
该文通过介绍粗糙集理论及特点,叙述了粗糙集理论在各领域的应用发展情况,并且展望了其未来发展趋势。
关键词:粗糙集;属性约简;粗糙集应用;数据挖掘中图分类号:TP18文献标识码:A文章编号:1009-3044(2008)28-0172-03Rough Set Theory and Its Application ResearchWEI Liang(Electronics and Information School, Tongji University, Shanghai 201804, China)Abstract: Rough set theory is a math theory which processes non-accurate, uncertain and incomplete knowledge. Currently, it has already been applied successfully in the area of Artificial Intelligence, Pattern Recognition, Machine Learning, Decision Analyzing and Data Mining etc. This paper introduces the rough set theory and its characteristics, reviews the development of this theory in different fields, and suggests evolutional trend in the coming future.Key words: rough set; attribute reduction; rough set application; data mining1 引言波兰数学家Pawlak于1982年提出的粗糙集理论是一种新的处理模糊和不确定性知识的数学工具[1]。
粗糙集理论及其应用研究

粗糙集理论的核心内容
知识的约简与核
知识的约简: 通过删除不重 要的知识,保 留关键信息
核的概念:核 是知识的最小 表示,包含所 有必要信息
核的性质:核 具有独立性、 完备性和最小 性
核的求取方法: 基于信息熵、 信息增益等方 法进行求取
0
0
0
0
1
2
3
4
决策表的简化
决策表:用于描述决策问题的表格 简化目标:减少决策表的规模,提高决策效率 简化方法:合并条件属性,删除冗余属性 简化效果:提高决策表的可读性和可理解性,降低决策复杂度
粗糙集理论在聚类分析中的应用:利用粗糙集理论处理不确定和不完整的数据,提高聚类 分析的准确性和效率。
聚类分析在数据挖掘中的应用:可以帮助发现数据中的模式和趋势,为决策提供支持。
粗糙集理论在其他领域的应用
决策支持系统
粗糙集理论可以帮助决策者 处理不确定性和模糊性
粗糙集理论在决策支持系统 中的应用
粗糙集理论可以提高决策支 持系统的准确性和效率
粗糙集理论在决策支持系统 中的实际应用案例分析
智能控制
粗糙集理论在模糊控制中的 应用
粗糙集理论在智能控制中的 应用
粗糙集理论在神经网络控制 中的应用
粗糙集理论在自适应控制中 的应用
模式识别
粗糙集理论在模式 识别中的应用
粗糙集理论在图像 识别中的应用
粗糙集理论在语音 识别中的应用
粗糙集理论在生物 信息学中的应用
添加标题
添加标题
ห้องสมุดไป่ตู้添加标题
添加标题
机器学习
粗糙集理论在机器学习中的应用 粗糙集理论在数据挖掘中的应用 粗糙集理论在模式识别中的应用 粗糙集理论在自然语言处理中的应用
粗糙集理论在人工智能领域中的前沿应用研究

粗糙集理论在人工智能领域中的前沿应用研究人工智能(Artificial Intelligence, AI)作为一门交叉学科,涵盖了众多领域,其中粗糙集理论在AI领域中的应用研究备受关注。
粗糙集理论是由波兰学者Zdzislaw Pawlak于1982年提出的,它是一种处理不确定性和不完备性信息的数学工具,能够有效地处理模糊和不精确的数据,为人工智能领域的决策和推理提供了新的思路和方法。
在人工智能领域中,数据的不完备性和不确定性是常见的问题。
而粗糙集理论的核心思想是将数据集划分为不同的等价类,从而实现对数据的分类和推理。
粗糙集理论通过使用近似集和约简技术,能够从大规模的数据中提取出最具代表性的特征,进而实现数据的分类和决策。
例如,在图像识别领域,粗糙集理论可以用于处理图像中的不完整信息。
由于图像数据通常是大规模的、复杂的,传统的图像识别算法往往难以处理其中的不确定性和模糊性。
而粗糙集理论可以通过约简技术,从大规模的图像数据中提取出最有代表性的特征,从而实现对图像的分类和识别。
这种方法不仅提高了图像识别的准确性,还减少了计算复杂度,提高了识别速度。
除了图像识别,粗糙集理论还在自然语言处理、数据挖掘、智能推荐等领域中得到了广泛应用。
在自然语言处理中,粗糙集理论可以用于处理文本中的模糊和不确定性信息。
通过约简技术,可以从大规模的文本数据中提取出最有代表性的特征,实现对文本的分类和情感分析。
在数据挖掘领域,粗糙集理论可以用于处理大规模的数据集,从中挖掘出有用的模式和规律。
在智能推荐领域,粗糙集理论可以用于个性化推荐系统的构建,通过分析用户的行为和兴趣,提供个性化的推荐服务。
然而,粗糙集理论在人工智能领域中的应用研究还存在一些挑战和问题。
首先,粗糙集理论在处理大规模数据时,计算复杂度较高,需要考虑如何提高计算效率。
其次,粗糙集理论在处理模糊和不确定性数据时,对数据的表示和处理方式有一定的局限性,需要进一步研究如何提高其表达能力和推理能力。
粗糙集理论简介及应用介绍

粗糙集理论简介及应用介绍引言:在现代信息时代,数据的快速增长和复杂性给决策和问题解决带来了挑战。
为了更好地理解和分析数据,人们提出了许多数据挖掘和分析方法。
其中,粗糙集理论作为一种有效的数据处理方法,被广泛应用于各个领域。
本文将简要介绍粗糙集理论的基本概念以及其在实际应用中的一些案例。
一、粗糙集理论的基本概念粗糙集理论是由波兰学者Pawlak在20世纪80年代初提出的。
它是一种基于近似和不确定性的数学工具,用于处理不完全和不确定的信息。
粗糙集理论的核心思想是通过将数据划分为等价类来对数据进行描述和分析。
在这种划分中,数据被分为确定和不确定的部分,从而实现了对数据的粗糙描述。
1.1 粗糙集的等价关系粗糙集的等价关系是粗糙集理论的基础。
在粗糙集中,等价关系是指具有相同属性值的数据实例之间的关系。
通过等价关系,我们可以将数据实例划分为不同的等价类,从而实现对数据的刻画和分析。
1.2 下近似集和上近似集在粗糙集中,下近似集和上近似集是对数据的进一步描述。
下近似集是指具有最小确定性的数据实例的集合,而上近似集是指具有最大确定性的数据实例的集合。
通过下近似集和上近似集,我们可以更好地理解数据的不确定性和不完整性。
二、粗糙集理论的应用案例粗糙集理论在实际应用中具有广泛的应用价值。
以下将介绍一些典型的应用案例。
2.1 数据挖掘粗糙集理论在数据挖掘中被广泛应用。
通过粗糙集理论,我们可以对大量的数据进行分类和聚类。
例如,在医学领域,研究人员可以利用粗糙集理论对医疗数据进行分类,从而实现对疾病的诊断和治疗。
2.2 特征选择特征选择是数据挖掘和机器学习中的一个重要问题。
通过粗糙集理论,我们可以对数据中的特征进行选择,从而减少数据的维度和复杂性。
例如,在图像识别中,研究人员可以利用粗糙集理论选择最具代表性的图像特征,从而提高图像识别的准确性和效率。
2.3 决策支持系统粗糙集理论在决策支持系统中的应用也非常广泛。
通过粗糙集理论,我们可以对决策问题进行建模和分析。
粗糙集理论的应用领域及研究现状

粗糙集理论的应用领域及研究现状摘要:粗糙集理论是一种基于不完备信息的数学模型,具有广泛的应用领域。
本文将介绍粗糙集理论的基本概念和原理,并探讨其在数据挖掘、模式识别、决策分析等领域的应用。
同时,还将介绍粗糙集理论在实际研究中的现状和挑战。
1. 引言粗糙集理论是由波兰学者Pawlak于1982年提出的一种基于不完备信息的数学模型。
它通过将数据集划分为等价类,可以有效地处理不确定和模糊的信息。
粗糙集理论在多个学科领域中得到了广泛的应用,如数据挖掘、模式识别、决策分析等。
2. 粗糙集理论的基本概念和原理粗糙集理论的核心概念是“粗糙集”,它是指在不完备信息条件下,将数据集划分为等价类的过程。
在粗糙集理论中,等价类被称为“粗糙集”,而等价类之间的差异被称为“粗糙度”。
粗糙度越小,等价类之间的差异越小,数据集的信息越完备。
粗糙集理论的基本原理是“下近似”和“上近似”。
下近似是指用最少的信息描述数据集的特征,上近似是指用尽可能多的信息描述数据集的特征。
通过下近似和上近似的计算,可以得到数据集的粗糙集,从而实现对不完备信息的处理。
3. 粗糙集理论在数据挖掘中的应用数据挖掘是从大量数据中发现隐藏模式和知识的过程。
粗糙集理论在数据挖掘中可以用于特征选择、属性约简和规则提取等任务。
通过粗糙集理论,可以从复杂的数据集中挖掘出有用的模式和规律,帮助人们更好地理解数据集的结构和特征。
4. 粗糙集理论在模式识别中的应用模式识别是通过对数据进行分类和识别,从而实现对数据的理解和分析。
粗糙集理论在模式识别中可以用于特征选择、模式分类和模式识别等任务。
通过粗糙集理论,可以对数据进行有效的特征选择,提高模式识别的准确性和效率。
5. 粗糙集理论在决策分析中的应用决策分析是通过对决策问题进行建模和分析,从而实现对决策的优化和改进。
粗糙集理论在决策分析中可以用于决策规则的提取和决策的评估。
通过粗糙集理论,可以从决策问题中提取出有用的规则和知识,帮助人们做出更好的决策。
粗糙集理论及其应用与发展研究

C mp tr n we g n e h o g o u o ld eA d T c n l y电脑 知 识 与技术 eK o
Vo . . ., tb r2 08 P . 7 —1 4 1 No 10c o e 0 , P 1 2 7 4
粗糙 集 理论及 其应 用 与发展 研 究
2粗 糙集理 论的基 本概念
设 U是 非 空 有 限论 域 , R是 U上 的二 元 等 价关 系 , R称 为不 可 分 辨关 系 , 序对 A (,) 为 近似 空 间 。V xY∈U U, x ) =U R称 , ) x 若 , ∈R, y 则称 对 象 X v 近 似 空 间 A 中是 不 可 分 辨 的 。 / 与 在 UR是 u上 由 R生 成 的 等 价类 全 体 . 它构 成 了 U的 一个 划 分 。 以证 明 , 可 U上 划 分
W EI Li n ag
( e t nc n nomain Sh o, n j Unv ri , h n h i2 1 0 , ia Elcr is d Ifr t c o lTo gi iesy S a g a 0 4 Chn ) o a o t 8
Ab t a t Ko g e h o y i a ma h o ih p o es sn n a c r t , n e ti n n o lt n wl d e Cu r n y i h sa e d sr c : u h stt e r s t t e r wh c r c s o — c u a e u c ra a d i c mpe ek o e g . re d , t a l a y h家 P wa al k于 】 8 9 2年 提 出 的粗 糙 集 理 论 是一 种 新 的 处 理模 糊 和 不 确 定性 知识 的数 学工 具 l 其 主要 思 想 就是 在 保 持分 l 1 。 类 能 力不 变 的前 提 下 , 过 知识 约简 , 出问 题 的 决 策 或分 类 规 则 。粗 糙 集 理 论 能 有 效 地 分 析 和处 理 不 精 确 、 一 致 和 不 完 整 等各 通 导 不 种 不 完 备 信息 , 从 中发 现 隐 含 的知 识 , 示 潜 在 的 规 律 以粗 糙 集 理 论 为 基 本 框 架 的 知 识 发 现过 程 的研 究 , 来 越 引 起 人 们 的关 行 揭 越 注 , 别是 将 粗 糙 集理 论 与 机 器学 习 、 式 识 别 、 据 库 理 论 等 相 结 合 , 融 合 其 它 有 效 的 数 学 工具 与方 法 的研 究 , 示 出基 于 粗糙 特 模 数 并 显 集理 论 的 多种 软 计 算 方 法相 结 合 算 法在 知 识 发 现 和 优 化过 程 中 的强 大 的优 越 性 . 为知 识 发 现 的理 论 基 础 提供 了一 定 的依 据 。 目前 粗 糙 集 理 论 已成 为 人 工 智 能领 域 中一个 较 新 的学 术热 点 , 引起 了越 来 越 多科 研 人 员 的 关 注 。
粗糙集理论在医学诊断中的实际应用效果分析

粗糙集理论在医学诊断中的实际应用效果分析近年来,随着人工智能和大数据技术的快速发展,粗糙集理论在医学诊断中的应用逐渐受到关注。
粗糙集理论是一种基于不完全信息的数学工具,能够处理不确定性和模糊性问题,对于医学诊断中的疾病分类和辅助决策具有重要意义。
本文将从粗糙集理论的基本原理、应用场景以及实际应用效果等方面进行分析。
首先,我们来了解一下粗糙集理论的基本原理。
粗糙集理论是由波兰学者Pawlak于1982年提出的一种数学模型,它主要用于处理不完全和不确定的信息。
在医学诊断中,患者的病情往往是多因素综合作用的结果,而且医学数据往往存在不确定性和模糊性。
粗糙集理论通过将数据集划分为等价类和近似类,建立了一个数学框架,能够从海量的医学数据中提取出有用的信息,帮助医生做出准确的诊断。
其次,粗糙集理论在医学诊断中有着广泛的应用场景。
首先,粗糙集理论可以用于疾病分类。
通过对大量的医学数据进行分析,可以建立起一个包含不同疾病特征的数据集,然后利用粗糙集理论进行分类,将患者的病情归类到不同的疾病中。
其次,粗糙集理论还可以用于病情风险评估。
通过对患者的病史、体检结果和实验室检查数据等进行分析,可以评估患者的病情风险,帮助医生制定个性化的治疗方案。
此外,粗糙集理论还可以用于辅助医生做出决策,例如在手术前对手术风险进行评估,或者在治疗过程中对疗效进行监测。
最后,我们来分析一下粗糙集理论在医学诊断中的实际应用效果。
研究表明,粗糙集理论在医学诊断中的应用可以提高诊断的准确性和效率。
通过对大规模的医学数据进行分析,可以发现一些潜在的规律和模式,帮助医生发现一些常规检查所不能发现的疾病特征。
此外,粗糙集理论还可以辅助医生进行病情风险评估,提供个性化的治疗建议,从而提高治疗的效果和患者的生存率。
然而,粗糙集理论在医学诊断中仍然存在一些挑战和限制。
首先,医学数据的质量和可用性对粗糙集理论的应用效果有着重要影响。
如果医学数据存在错误或者缺失,那么粗糙集理论的分析结果可能会失真。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Computer Knowledge And Technology电脑知识与技术2008年第4卷第1期(总第28期)粗糙集理论及其应用与发展研究韦良(同济大学电子与信息工程学院,上海201804)摘要:粗糙集理论是一种研究不精确、不确定性、处理不完备知识的数学工具,目前被广泛应用于人工智能、模式识别、机器学习、决策支持和数据挖掘等领域。
该文通过介绍粗糙集理论及特点,叙述了粗糙集理论在各领域的应用发展情况,并且展望了其未来发展趋势。
关键词:粗糙集;属性约简;粗糙集应用;数据挖掘中图分类号:TP18文献标识码:A文章编号:1009-3044(2008)28-0172-03Rough Set Theory and Its Application ResearchWEI Liang(Electronics and Information School,Tongji University,Shanghai201804,China)Abstract:Rough set theory is a math theory which processes non-accurate,uncertain and incomplete knowledge.Currently,it has already been applied successfully in the area of Artificial Intelligence,Pattern Recognition,Machine Learning,Decision Analyzing and Data Mining etc.This paper introduces the rough set theory and its characteristics,reviews the development of this theory in different fields,and suggests evolutional trend in the coming future.Key words:rough set;attribute reduction;rough set application;data mining1引言波兰数学家Pawlak于1982年提出的粗糙集理论是一种新的处理模糊和不确定性知识的数学工具[1]。
其主要思想就是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。
粗糙集理论能有效地分析和处理不精确、不一致和不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。
以粗糙集理论为基本框架的知识发现过程的研究,越来越引起人们的关注,特别是将粗糙集理论与机器学习、模式识别、数据库理论等相结合,并融合其它有效的数学工具与方法的研究,显示出基于粗糙集理论的多种软计算方法相结合算法在知识发现和优化过程中的强大的优越性,为知识发现的理论基础提供了一定的依据。
目前粗糙集理论已成为人工智能领域中一个较新的学术热点,引起了越来越多科研人员的关注。
2粗糙集理论的基本概念设U是非空有限论域,R是U上的二元等价关系,R称为不可分辨关系,序对A=(U,R)称为近似空间。
坌(x,y)∈U×U,若(x,y)∈R,则称对象x与y在近似空间A中是不可分辨的。
U/R是U上由R生成的等价类全体,它构成了U的一个划分。
可以证明,U上划分可以与U上的二元等价关系之间建立一一对应。
U/R中的集合称为基本集或原子集。
若将U中的集合称为概念或表示知识,则A= (U,R)称为知识库,原子集表示基本概念或知识模块。
任意有限的基本集的并和空集均称为可定义集,否则称为不可定义的。
可定义集也称为精确集,它可以在知识库中被精确地定义或描述,可表示已知的知识。
可以验证所有可定义集全体可构成U上的一个拓扑。
令知识库K=(U,R),集合X哿U,R是一个等价关系:分别称RX为X的R下近似(Lower Approximation)和RX为X的R上近似(Upper Approximation)。
称集合BN R(X)=RX-RX为X 的R边界域;POS R(X)RX为X的R正域;NEG R(X)=U-RX为X的R负域。
下近似RX包含了所有使用知识R可确切分类到概念X的元素。
上近似RX则包含了所有那些可能是属于概念X的元素。
概念的边界区域BN R(X)由不能肯定分类到这个概念X或其补集X中的所有元素组成。
关系如图1所示。
刻画粗糙集的方法有以下两种:一种是用表示近似精度的数值表示粗糙集的数字特征;数字特征表示粗糙集边界域的相对大小,但没有说明边界域的结构。
另一种是用粗糙集的拓扑分类表示粗糙集的拓扑特征。
拓扑特征给出边界域的结构信息,但没有给出边界域大小的信息。
由等价关系R定义的集合X的近似精度如下:收稿日期:2008-07-03作者简介:韦良(1982-),男(朝鲜族),黑龙江牡丹江人,在读硕士研究生,研究方向:数据挖掘,人工智能,粗糙集应用。
图1概念的上近似、下近似和区域表示ISSN1009-3044Computer Knowledge And Technology电脑知识与技术Vol.4,No.1,October2008,pp.172-174E-mail:eduf@Tel:+86-551-56909635690964 172本栏目责任编辑:唐一东人工智能及识别技术韦良:粗糙集理论及其应用与发展研究其中X≠Ф,|X|表示集合X的基数,显然,0≤αR(X)≤1。
定义P R(X)=1-αR(X),称P R(X)为X的R粗糙度。
粗糙度反映了利用知识R 近似表示X的不完全程度。
设X是一个R粗糙集,称X是R粗糙可定义的,当且仅当RX≠Ф且RX≠U;称X是R内不可定义的,当且仅当RX=Ф且RX≠U;称X是R外不可定义的,当且仅当RX≠Ф且RX=U;称X是R全不可定义的,当且仅当RX=Ф且RX=U。
如果X是R粗糙可定义的,则意味着我们可以确定U中的某些元素属于X或X;如果X是R内不可定义的,则意味着我们可以确定U中的某些元素是否属于X,但不能确定U中任一元素是否属于X;如果X是R外不可定义的,则意味着我们可以确定U中的某些元素是否属于X,但不能确定U中任一元素是否属于X;如果X是R全不可定义的,则意味着我们不能确定U中的任一元素是否属于X或X。
粗糙集的数字特征(近似精度)和拓扑特征之间有一定的联系:若集合是内不可定义的或全不可定义的,则其近似精度为0;若集合是外不可定义的或全不可定义的,则其补集的近似精度为0。
实际应用时,应综合考虑边界域的两种信息。
3属性约简属性约简是粗糙集理论中的一个核心部分,同时也是粗糙集理论中最重要的概念之一。
自粗糙集理论被提出后,研究学者在属性约简方面提出了许多算法,这些属性约简算法最终可以归结为三类:基于约简定义的Pawlak属性约简算法[2];基于差别矩阵的属性约简算法;基于启发式信息的属性约简算法。
然而,到目前为止,还没有一个公认的、高效的最佳属性约简算法,另一方面,科学家在理论上证明求取处理对象的所有属性约简、所有最小约简是一个NP完全问题。
3.1几种典型的约简算法3.1.1基本算法基本算法首先在已有数据的基础上构造差别矩阵。
然后在差别矩阵的基础上得到差别函数。
对此得到的差别函数进行化简,使之成为析取范式。
最后得到的每个主蕴含式均为约简。
该算法可以求出所有的约简。
然而,由于对大数据集的差别函数的约简是一个非常困难几乎不可能的问题,因此,此算法只适合于非常小的数据集。
3.1.2基于差别矩阵的启发式算法Skowron提出差别矩阵,并且提出差别矩阵可用于属性约简。
在此基础上,利用差别矩阵得到了许多启发式约简算法。
这些算法的共同点都是先得到差别矩阵,由差别矩阵求出属性核,在此基础上根据如信息熵、属性频率等启发式规则往属性核加入属性,直到满足条件为止。
3.1.3遗传算法己经有不少用遗传算法计算约简的算法。
各种算法的不同之处主要在适应度函数的不同。
Bjorvand和Komorowski提出了具有代表性的遗传算法。
每个位串代表差别矩阵的一项,即两个对象的属性集口某位为1时表示该属性存在,否则不存在。
这样每个位:串是一个约简的候选。
定义适应度函数如下Array其中N是属性集合的长度,L v是v中1的个数。
C v是v能区分的对象组合的个数。
m是对象的个数。
该函数由两部分组成,前一部分的目的是希望L v的长度尽可能的小。
后一部分希望区分的对象尽可能多。
在设计初始种群时,可以考虑将核或专家认为必要的属性加入种群中,以加快算法的收敛速度。
3.1.4扩展法则约简算法Starzyk,Nelson and Sturtz提出一种新概念,称为强等价(strong equivalence),进而发展为扩展法则,用于快速简化差别函数。
两个属性称为局部强等价,若它们在差别函数的所有项中同时出现或不出现。
当两个属性是局部强等价时,它们就可以仅用一个属性代替。
实验表明该算法比基本算法快数十到数百倍。
因而这种算法可以较基本算法处理更大的数据集。
3.1.5动态约简算法动态约简在某种意义上是给定决策表中最稳定的约简,它们是从给定决策表中随机抽样形成的子表中最常出现的约简。
动态约简能够有效的增强约简的抗噪音能力。
动态约简的计算过程较为简明,主要是对决策表进行采样,然后对采样后的决策表计算所有约简。
在所有的子表中保持不变或近似保持不变的约简就是动态约简。
3.1.6复合系统的约简算法Kryszkiewicz和Rybinski研究了在复合信息系统中寻求约简的问题。
即怎样利用现有的子系统的约简求复合系统的约简。
其主要思想是将布尔函数的约简问题转化为集合空间的边界搜索问题。
而在己知子系统的约简的情况下,统的搜索空间将得到简化。
设有信息系统S1,S2,它们的属性集合相同f1和f2分别是它们的差别函数。
则整个信息系统S的差别函数f可表示为f=f1∧f2∧f12。
其中f12代表S1、S2中的对象分别作为横纵坐标组成的差别函数。
根据上面的讨论,如果已知S1和S2的约简时,则S的约简只需在空间[MINS(f1∧f2),{c}]上搜索而不必从头开始。
其中MINS(f1∧f2)是两个子系统约简的并的最小值,因而使搜索空间大大减小。
4粗糙集理论的应用与发展趋势4.1粗糙集理论的研究对象粗糙集理论的研究对象是由一个多值属性(特征、症状、特性等)集合描述的一个对象(观察、病历等)集合,对于每个对象及其属性都有一个值作为其描述符号,对象、属性和描述符是表达决策问题的3个基本要素[4]。
这种表达形式也可以看成一个二维表格,表格的行与对象相对应,列对应于对象的属性;各行包含了表示相应对象信息的描述符,还有关于各个对象的类别成员的信息。