《粗糙集理论与方法》读书笔记
粗糙集理论和模糊集理论的异同与结合应用

粗糙集理论和模糊集理论的异同与结合应用粗糙集理论和模糊集理论是两种常用的数学工具,用于处理不确定性和模糊性问题。
虽然它们在某些方面有相似之处,但在其他方面又有明显的差异。
本文将探讨粗糙集理论和模糊集理论的异同,并介绍它们如何结合应用。
首先,我们来看看粗糙集理论和模糊集理论的异同。
粗糙集理论是由波兰学者Pawlak于1982年提出的一种数学方法,用于处理不完备和不一致的信息。
它的核心思想是通过分析决策属性和条件属性之间的关系,来确定对象的分类和特征。
而模糊集理论则是由日本学者石原均于1973年提出的一种数学方法,用于处理模糊和不确定的信息。
它的核心思想是引入隶属函数来描述事物的隶属度,从而实现模糊分类和模糊推理。
粗糙集理论和模糊集理论在处理不确定性问题时有一些相似之处。
首先,它们都能够处理模糊和不完备的信息,帮助我们更好地理解和分析复杂的现实问题。
其次,它们都能够提供一种数学框架,用于描述和推理模糊和不确定的概念。
最后,它们都能够应用于多个领域,如医学诊断、决策支持、图像处理等。
然而,粗糙集理论和模糊集理论在处理不确定性问题时也存在一些明显的差异。
首先,粗糙集理论更关注于数据的粗粒度分析,即将对象划分为不同的等价类,而模糊集理论更关注于数据的细粒度分析,即通过隶属函数来描述对象的隶属度。
其次,粗糙集理论更注重于数据的不确定性和不完备性,而模糊集理论更注重于数据的模糊性和不确定性。
最后,粗糙集理论更适用于处理离散的数据,而模糊集理论更适用于处理连续的数据。
尽管粗糙集理论和模糊集理论在处理不确定性问题时有一些差异,但它们也可以结合应用,以提高问题的解决效果。
例如,在医学诊断中,可以使用粗糙集理论来确定疾病的分类和特征,然后使用模糊集理论来描述病情的模糊程度和不确定性。
这样可以更准确地判断病情和选择治疗方案。
在决策支持中,可以使用粗糙集理论来分析决策属性和条件属性之间的关系,然后使用模糊集理论来描述决策的模糊性和不确定性。
粗糙集理论介绍

粗糙集理论介绍面对日益增长的数据库,人们将如何从这些浩瀚的数据中找出有用的学问?我们如何将所学到的学问去粗取精?什么是对事物的粗线条描述什么是细线条描述?粗糙集合论Pl答了上面的这些问题。
要想了解粗糙集合论的思想,我们先要了解一下什么叫做学问?假设有8个积木构成了一个集合A,我们记:A={xl,x2,x3,x4,x5,x6,x7,x8},每个积木块都有颜色属性,根据颜色的不同,我们能够把这积累木分成Rl={红,黄,兰} 三个大类,那么全部红颜色的积木构成集合Xl = {xl,x2,x6},黄颜色的积木构成集合X2={x3,x4},兰颜色的积木是:X3={x5,x7,x8}o根据颜色这个属性我们就把积木集合A进行了一个划分(所谓A的划分就是指对于A中的任意一个元素必定属于且仅属于一个分类),那么我们就说颜色属性就是一种学问。
在这个例子中我们不难看到,一种对集合A的划分就对应着关于A中元素的一个学问,假如还有其他的属性,比如还有外形R2={三角,方块,圆形},大小R3={大,中,小},这样加上Rl 属性对A 构成的划分分别为:A/R1={X1 ,X2,X3}={(X1 ,x2,x6},{x3,x4)4x5,x7,x8},(颜色分类) A∕R2={Yl,Y2,Y3}={{xl,x2},{x5,x8},{x3,x4,x6,x7}}(外形分类)A∕R3={Z1,Z2,Z3)={{x1,x2,x5},{x6,x8},{x3,x4,x7}}(大小分类) 上面这些全部的分类合在•起就形成了•个基本的学问库。
那么这个基本学问库能表示什么概念呢?除了红的{xl,x2,x6}、大的{xl,x2,x5}、三角形的{xl,x2)这样的概念以外还可以表达例如大的且是三角形的{xl,x2,x5}∩{xl,x2)={xl,x2}, 大三角{xl,x2,x5}∩{xl,x2}={xl,x2},兰色的小的圆形({x5,x7,x8)∩{x3,x4,x7}∩{x3,x4,x6,x7}={x7},兰色的或者中的积木{x5,x7,x8} U {x6,x8)={×5,x6,x7,x8}β而类似这样的概念可以通过求交运算得到,比如Xl与Yl的交就表示红色的三角。
粗糙集_学习笔记

设 P 和 Q 是全域 U 上的等价关系的族集,R P。
若 不可省的﹔
,则称关系 R 在族集 P 中是 Q-可省的;否则称为 Q-
如果在族集 P 中的每个关系 R 都是 Q-不可省的﹐则称 P 关于 Q 是独立的﹐否则就称为是依
赖的。
3、定义 5
S P 称为 P 的 Q-约简(Q-reduct):当且仅当 S 是 P 的 Q-独立的子族集,且
10、新型的隶属关系
其中 R 是不分明关系 可以看到,这里的隶属关系是根据已有的分类知识客观计算出来的,可以被解释为一种条件概率, 能够从全域上的个体加以计算,而不是主观给定的。 11、近似度 Accuracy of Approximation
其中,|X| denotes the cardinality(基数) of X 12、近似性质 Properties of Approximations
K=(U,R) 其中 U 不为空集,是一个被称为全域或论域(universe)的所有要讨论的个体的集合,R 是 U 上等价 关系的一个族集。 7、不可区分关系:
8、概念(concept):给定近似空间 K=(U, R),子集 X 称为 U 上的一个概念(concept),形式上, 空集也视为一个概念; 基本知识(basic knowledge):非空子族集 P R 所产生的不分明关系 IND(P)的所有等价类关系 的集合即 U/IND(P) 相应的等价类称为基本概念 初等知识(elementary knowledge):特别地,若关系 Q R,则关系 Q 就称为初等知识
(二)相对约简 1、定义 3
设 P 和 Q 是全域 U 上的等价关系的族集,所谓族集 Q 的 P-正区域(P-positive region of Q),记作
粗糙集理论在药物发现与设计中的应用

粗糙集理论在药物发现与设计中的应用随着科技的不断发展,药物发现与设计成为了现代医学领域的重要研究方向。
而在这个过程中,粗糙集理论的应用也逐渐受到了关注。
粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它可以帮助科研人员更好地理解和分析药物的特性,从而提供指导药物发现与设计的依据。
首先,粗糙集理论可以帮助科研人员进行药物特性分析。
药物的特性包括化学结构、生物活性、毒性等多个方面。
而这些特性之间往往存在着复杂的相互关系。
粗糙集理论通过建立属性间的关联关系,可以帮助科研人员从海量的数据中提取出有用的信息,进而分析药物的特性。
例如,科研人员可以通过建立药物分子与生物活性之间的关联关系,快速筛选出具有潜在生物活性的化合物,从而缩小药物发现的范围,提高研究效率。
其次,粗糙集理论可以帮助科研人员进行药物筛选与评价。
在药物发现与设计的过程中,科研人员需要从大量的候选化合物中选择出具有潜在药效的化合物。
而这个过程往往需要考虑到多个指标,如生物活性、毒性、药代动力学等。
粗糙集理论可以通过建立属性间的关联关系,帮助科研人员对候选化合物进行筛选与评价。
通过构建属性间的约简关系,科研人员可以快速剔除那些不符合要求的化合物,从而缩小筛选范围,提高筛选效率。
此外,粗糙集理论还可以帮助科研人员进行药物相互作用的预测。
药物相互作用是指药物与生物体内其他分子之间的相互作用关系,它对于药物的疗效和安全性具有重要影响。
粗糙集理论可以通过建立药物分子与其他分子之间的关联关系,预测药物相互作用的可能性。
这对于药物发现与设计来说具有重要意义,可以帮助科研人员更好地理解药物的作用机制,从而指导药物的设计与优化。
总之,粗糙集理论在药物发现与设计中具有广泛的应用前景。
它可以帮助科研人员进行药物特性分析、药物筛选与评价以及药物相互作用的预测。
通过粗糙集理论的应用,科研人员可以更好地理解和分析药物的特性,为药物发现与设计提供有力的支持。
相信随着粗糙集理论的不断发展和完善,它将在药物发现与设计领域发挥越来越重要的作用,为人类的健康事业做出更大的贡献。
如何使用粗糙集理论解决复杂系统的分析问题

如何使用粗糙集理论解决复杂系统的分析问题粗糙集理论是一种用于解决复杂系统分析问题的有效方法。
它源于20世纪80年代初,由波兰学者Pawlak提出,并逐渐发展成为一种重要的数据挖掘和知识发现技术。
粗糙集理论的核心思想是通过模糊和粗糙的概念,对数据进行描述和分析,从而揭示系统内部的规律和关系。
在使用粗糙集理论解决复杂系统分析问题时,首先需要对系统进行建模。
建模是指将复杂的系统抽象成一组属性和关系的集合,以便于进行分析和推理。
建模的关键在于选择合适的属性和关系,以及确定它们之间的相互作用方式。
在这个过程中,我们可以利用领域知识、统计方法和数据挖掘技术等手段,对系统进行全面而准确的描述。
建模完成后,接下来是利用粗糙集理论进行数据分析。
粗糙集理论的核心工具是粗糙集近似算法,它能够在不完备和不确定的情况下,对数据进行有效的近似和推理。
具体而言,粗糙集近似算法通过对数据集进行粗化和约简操作,将数据集中的不相关和冗余信息剔除,从而得到一个更简洁和有效的数据表示。
这样一来,我们就可以更好地理解和分析数据,发现其中的规律和关系。
在进行数据分析时,我们还可以借助粗糙集理论的一些衍生技术,如粗糙集聚类和粗糙集分类等。
粗糙集聚类是一种无监督学习方法,它能够将数据集中的对象划分成若干个不相交的类别,每个类别内部的对象相似度较高,而不同类别之间的相似度较低。
通过粗糙集聚类,我们可以对复杂系统中的对象进行分类和聚类,从而更好地理解和描述系统的结构和行为。
另外,粗糙集分类是一种基于规则的分类方法,它能够根据已有的数据和知识,对新的对象进行分类和预测。
粗糙集分类的核心思想是通过建立决策规则,将对象映射到相应的类别或属性值上。
通过粗糙集分类,我们可以对复杂系统中的对象进行预测和决策,从而指导实际应用和决策制定。
除了数据分析和建模,粗糙集理论还可以应用于多领域的问题解决。
比如,在医学领域,粗糙集理论可以用于疾病诊断和治疗方案选择等问题;在金融领域,粗糙集理论可以用于风险评估和投资决策等问题;在工程领域,粗糙集理论可以用于系统优化和故障诊断等问题。
粗糙集理论及其应用研究

粗糙集理论的核心内容
知识的约简与核
知识的约简: 通过删除不重 要的知识,保 留关键信息
核的概念:核 是知识的最小 表示,包含所 有必要信息
核的性质:核 具有独立性、 完备性和最小 性
核的求取方法: 基于信息熵、 信息增益等方 法进行求取
0
0
0
0
1
2
3
4
决策表的简化
决策表:用于描述决策问题的表格 简化目标:减少决策表的规模,提高决策效率 简化方法:合并条件属性,删除冗余属性 简化效果:提高决策表的可读性和可理解性,降低决策复杂度
粗糙集理论在聚类分析中的应用:利用粗糙集理论处理不确定和不完整的数据,提高聚类 分析的准确性和效率。
聚类分析在数据挖掘中的应用:可以帮助发现数据中的模式和趋势,为决策提供支持。
粗糙集理论在其他领域的应用
决策支持系统
粗糙集理论可以帮助决策者 处理不确定性和模糊性
粗糙集理论在决策支持系统 中的应用
粗糙集理论可以提高决策支 持系统的准确性和效率
粗糙集理论在决策支持系统 中的实际应用案例分析
智能控制
粗糙集理论在模糊控制中的 应用
粗糙集理论在智能控制中的 应用
粗糙集理论在神经网络控制 中的应用
粗糙集理论在自适应控制中 的应用
模式识别
粗糙集理论在模式 识别中的应用
粗糙集理论在图像 识别中的应用
粗糙集理论在语音 识别中的应用
粗糙集理论在生物 信息学中的应用
添加标题
添加标题
ห้องสมุดไป่ตู้添加标题
添加标题
机器学习
粗糙集理论在机器学习中的应用 粗糙集理论在数据挖掘中的应用 粗糙集理论在模式识别中的应用 粗糙集理论在自然语言处理中的应用
粗糙集理论的属性重要性评估方法及其实际应用

粗糙集理论的属性重要性评估方法及其实际应用引言:粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它在数据挖掘、模式识别和决策分析等领域中得到了广泛的应用。
在粗糙集理论中,属性重要性评估是一个重要的问题,它能够帮助我们识别出对决策结果具有重要影响的属性,从而提高决策的准确性和可靠性。
本文将介绍一种基于粗糙集理论的属性重要性评估方法,并探讨其在实际应用中的价值。
一、粗糙集理论概述粗糙集理论是由波兰学者Pawlak于1982年提出的,它是一种处理不确定性和模糊性问题的数学工具。
粗糙集理论通过将对象的属性进行划分,将属性值之间的差异进行模糊化处理,从而实现对不完备和不精确数据的分析和决策。
粗糙集理论的核心思想是近似和约简,即通过近似的方法对数据进行简化和压缩,从而提取出最重要的信息。
二、属性重要性评估方法在粗糙集理论中,属性重要性评估是一个关键问题。
属性重要性评估的目标是确定哪些属性对决策结果的影响最大,从而帮助我们进行决策和分析。
常用的属性重要性评估方法有正域、核和约简等方法。
1. 正域方法正域方法是一种基于粗糙集的属性重要性评估方法。
它通过计算属性在正域中的覆盖度来评估属性的重要性。
正域是指在给定条件下能够唯一确定决策结果的属性取值,它反映了属性对决策结果的贡献程度。
正域方法的优点是简单直观,容易理解和计算,但它没有考虑属性之间的依赖关系。
2. 核方法核方法是一种基于粗糙集的属性重要性评估方法。
它通过计算属性在核中的约简度来评估属性的重要性。
核是指在给定条件下能够唯一确定决策结果的最小属性集合,它反映了属性对决策结果的决定性影响。
核方法考虑了属性之间的依赖关系,能够更准确地评估属性的重要性,但计算复杂度较高。
3. 约简方法约简方法是一种基于粗糙集的属性重要性评估方法。
它通过对属性集合进行约简,得到一个最小的属性子集,从而实现对属性的重要性评估。
约简方法的优点是能够同时考虑属性之间的依赖关系和决策结果的覆盖度,能够更全面地评估属性的重要性。
经典粗糙集理论

粗糙集可以用于提取数据中的决策规则,这些规则可以作为神经网络的 训练样本。通过训练,神经网络可以学习到决策规则,并用于分类或预 测。
边界区域
近似集合中的不确定性区 域,即既不属于正域也不 属于负域的元素集合。
粗糙集的度量
精确度
描述了集合中元素被近似集合 包含的程度,即属于近似集合
的元素比例。
覆盖度
描述了近似集合能够覆盖的元 素数量,即近似集合的大小。
粗糙度
描述了集合被近似程度,是精 确度和覆盖度的综合反映。
知识的不确定性
描述了知识表达系统中属性值 的不确定性程度,与粗糙度相
经典粗糙集理论
目录
• 粗糙集理论概述 • 粗糙集的基本概念 • 粗糙集的运算与性质 • 粗糙集的决策分析 • 粗糙集与其他方法的结合 • 经典粗糙集理论案例研究
01 粗糙集理论概述
定义与特点
定义
粗糙集理论是一种处理不确定性和模 糊性的数学工具,通过集合近似的方 式描述知识的不完全性和不确定性。
粗糙集理论中的属性约简可以用于简化神经网络的输入特征,降低输入 维度,提高分类或预测的准确率。
粗糙集与遗传算法
01
遗传算法是一种全局优化算法,能够通过模拟自然界的进化过程来寻找最优解 。将粗糙集与遗传算法结合,可以利用粗糙集对数据的分类能力,结合遗传算 法的全局搜索能力,寻找最优的分类规则或决策规则。
02
粗糙集可以用于生成初始的分类规则或决策规则,然后利用遗传算法对这些规 则进行优化,通过选择、交叉、变异等操作,寻找最优的规则组合。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《粗糙集理论与方法》读书笔记智能信息处理是当前信息科学理论和应用研究中的一个热点领域。
由于计算机科学与技术的发展,特别是计算机网络的发展,每日每时为人们提供了大量的信息,信息量的不断增长,对信息分析工具的要求也越来越高,人们希望自动地从数据中获取其潜在的知识。
特别是近20年间,知识发现(规则提取、数据挖掘、机器学习)受到人工智能学界的广泛重视,知识发现的各种不同方法应运而生。
1 粗糙集概述粗糙集(Rough Set,有时也称Rough集、粗集)理论是Pawlak 教授于1982年提出的一种能够定量分析处理不精确、不一致、不完整信息与知识的数学工具粗糙集理论最初的原型来源于比较简单的信息模型,它的基本思想是通过关系数据库分类归纳形成概念和规则,通过等价关系的分类以及分类对于目标的近似实现知识发现。
由于粗糙集理论思想新颖、方法独特,粗糙集理论已成为一种重要的智能信息处理技术,该理论已经在机器学习与知识发现、数据挖掘、决策支持与分析等方面得到广泛应用。
目前,有三个有关粗糙集的系列国际会议,即:RSCTC、RSFDGrC和RSKT。
中国学者在这方面也取得了很大的成果,从2001年开始每年召开中国粗糙集与软计算学术会议;RSFDGRC2003、IEEE GrC2005、RSKT2006、IFKT2008、RSKT2008、IEEE GrC2008等一系列国际学术会议在中国召开。
粗糙集理论与应用的核心基础是从近似空间导出的一对近似算子,即上近似算子和下近似算子(又称上、下近似集)。
经典Pawlak模型中的不分明关系是一种等价关系,要求很高,限制了粗糙集模型的应用。
因此,如何推广定义近似算子成为了粗糙集理论研究的一个重点。
目前,常见的关于推广粗糙集理论的研究方法有两种,即:构造化方法和公理化方法。
构造化方法是以论域上的二元关系、划分、覆盖、邻域系统、布尔子代数等作为基本要素,进而定义粗糙近似算子,从而导出粗糙集代数系统。
公理化方法的基本要素是一对满足某些公理的一元集合算子,近似算子的某些公理能保证有一些特殊类型的二元关系的存在;反过来, 由二元关系通过构造性方法导出的近似算子一定满足某些公理。
事实上,有两种形式来描述粗糙集,一个是从集合的观点来进行,一个是从算子的观点来进行。
那么,从不同观点采用不同的研究方法就得到粗糙集的各种扩展模型。
扩展模型的研究以及基于其上的应用研究已经成为新的研究热点。
粗糙集理论与其他处理不确定和不精确问题理论的最显著的区别是它无需提供问题所需处理的数据集合之外的任何先验信息, 所以对问题的不确定性的描述或处理可以说是比较客观的, 由于这个理论未能包含处理不精确或不确定原始数据的机制, 所以这个理论与概率论, 模糊数学和证据理论等其他处理不确定或不精确问题的理论有很强的互补性。
因此,研究粗糙集理论和其他理论的关系也是粗糙集理论研究的重点之一。
如果我们将研究对象看成是现象,那么我们可以将这些现象分类。
现象被分为确定现象与不确定现象。
不确定现象有分为随机现象,模糊现象和信息不全的粗糙现象。
如下所示:相对于前两种现象的处理,粗糙现象是基于不完全的信息或知识去处理不分明的现象,因此需要基于观测或者测量到的部分信息对数据进行分类,这就需要与概率统计和模糊数学不同的处理手段,这就是粗糙集理论。
直观地讲,粗糙集是基于一系列既不知道多了还是少了,也不知道有用还是没用的不确定、不完整乃至于部分信息相互矛盾的数据或者描述来对数据进行分析、推测未知信息。
下面我们对粗糙集的基本特征、以及数学符号进行简述。
2粗糙集的特点粗糙集的特点是利用不精确、不确定、部分真实的信息来得到易于处理、鲁棒性强、成本低廉的决策方案。
因此更适合于解决某些现实系统,比如,中医诊断,统计报表的综合处理等。
粗糙集的另一个重要特点就是它只依赖于数据本身,不需要样本之外的先验知识或者附加信息,因此挑选出来的决策属性可以避免主观性,有英雄不问出身的意味。
用粗糙集来处理的数据类型包括确定性的、非确定性的、不精确的、不完整的、多变量的、数值的、非数值的。
粗糙集使用上、下近似来刻画不确定性,使得边界有了清晰的数学意义并且降低了算法设计的随意性。
粗糙集理论与其他处理不确定和不精确问题理论的最显著的区别是它无需提供问题所需处理的数据集合之外的任何先验信息, 所以对问题的不确定性的描述或处理可以说是比较客观的, 由于这个理论未能包含处理不精确或不确定原始数据的机制, 所以这个理论与概率论, 模糊数学和证据理论等其他处理不确定或不精确问题的理论有很强的互补性。
因此,研究粗糙集理论和其他理论的关系也是粗糙集理论研究的重点之一。
基于粗糙集理论的应用研究主要集中在属性约简、规则获取、基于粗糙集的计算智能算法研究等方面。
由于属性约简是一个NP-Hard问题,许多学者进行了系统的研究。
基于粗糙集的约简理论发展为数据挖掘提供了许多有效的新方法。
比如,针对不同的信息系统(协调的和不协调的、完备的和不完备的),结合信息论、概念格、群体智能算法技术等都有了相应的研究成果。
基于粗糙集理论的应用也涌现在各行各业。
许多学者将粗糙集理论应用到了工业控制、医学卫生及生物科学、交通运输、农业科学、环境科学与环境保护管理、安全科学、社会科学、航空、航天和军事等领域。
2.粗糙集的基本概念从经典的角度来看,每个概念都包含其内涵和外延。
为了给出概念内涵和外延的具体描述,我们考虑一个简单的知识表达系统,即信息表。
信息表就是一组对象的集合,对象通过一组属性来描述。
2.1定义粗糙集要涉及论域U(这与模糊系统相似),还要涉及属性集合=U(这被认为是知识,或者知识库)。
当然,也要有属性值域V,R C D以及从U R⨯到V的信息函数f。
因此,一个信息系统S可以表示为一个四元组{}=。
在不混淆的情况下,简记为(,),,,S U R V f=,也称为S U R知识库。
等价关系(通常用来代替分类)是不可或缺的概念,根据等价关系可以划论域中样本为等价类。
而每个等价类被称为同一个对象。
但是,等价关系又是建立在不可分辨概念之上的,为了便于描述这里的等价关系,我们首先介绍不可分辨性。
设B R ⊆为一个非空子集,如果,i j x x U ∈,均有(,)(,),i j f x r f x r r B =∀∈成立,那么,我们称i j x x 和关于属性子集B 不可分辨。
B 不可分辨关系,简记为()Ind B ,是一种等价关系(易验证它满足等价关系的数学公理),于是()Ind B 可以将论域U 中的元素分成若干等价类,每一个等价类称为知识库的知识颗粒。
全体等价类组成的集合记为/()U Ind B ,称之为基本集合。
若集合X 可以表示成某些基本集的并时,则称X 是B 精确集,否则称为B 粗糙集。
粗糙集中的“粗糙” 主要体现在边界域的存在,而边界又是由下、上近似来刻画的。
对于任意XU ⊂,X 关于现有知识R 的下、上近似分别定义为:_(){,[]}R R X x U x X =∈⊆,(){,[]}R R x x U x X φ-=∈⋂≠。
X 的确定域()()Pos X R X -=,是指论域U 中那些在现有知识R 之下能够确定地归入集合X 的元素的集合。
反之,()()Neg X U R X -=-被称为否定域。
边界域是某种意义上论域的不确定域,即在现有知识R 之下U 中那些既不能肯定在X 中,又不能肯定归入\XU X =中的元素的集合,记为()R Bnd X 。
样本子集X 的不确定性程度可以用粗糙度()R a X 来刻画,粗糙度的定义为:式中Card 表示集合的基数(集合中元素的个数)。
显然,()01R a X ≤≤,如果()1R a X =,则称集合X 关于R 是确定的;如果()1R a X <,则称集合X 关于R 是粗糙的,()R a X 可认为是在等价关系R 下逼近集合X 的精度。
为了使得上述概念具体化,下面我们举一个例子说明如何理解和计算以上相应的概念和对应量。
例. 针对一下医学信息表我们来理解前面所提到的概念。
表1 某医疗信息表依据此表,如果取属性子集{}{}12,,R r r ==头疼肌肉疼,{}123,,X x x x =。
那么我们下面给出X 的上近似集、下近似集、确定域、边界域、粗糙度。
解:①计算论域U 的所有R 基本集:(){}{}{}{}123465/,,,,,U Ind R x x x x x x =令 {}{}{}112324635,,,R x x x R x x R x ===②确定样本子集X 与基本集的关系 ③计算()R X 、()R X -、()()Pos X Bnd X 和:④计算近似精确度:与粗糙度类似,在给出了两个知识集(特征属性)的相对肯定域的概念()P Pos Q 之后,我们也可以一个量来刻画两个知识集的依赖度。
设(,)K U R =为一个知识库,,P Q R ⊆为两个知识集。
令()(())/()P P k r Q Card Pos Q Card U ==,称为知识Q 依赖于知识P 的依赖度。
特别,当1k =时称为完全依赖;01k <<时,部分依赖;0k =时,Q 完全独立于知识P 。
2.2近似空间语言()A L 的所有可定义集正好构造成一个σ代数(/())U E A σ,即: (,())(/()).Def U A U E A σ=L 。
序对(,())apr U E A =称为一个Pawlak 近似空间,简称近似空间。
所以,也可以将语言()A L 的所有可定义集记为(,())()Def U A Def apr =L 。
通过/()U E A ,可以构造一个σ代数,即(/())U E A σ,它包含空集φ和等价关系()E A 构成的等价类及其并,并且在交、并和补运算上是封闭的。
那么,Pawlak 近似空间也唯一确定了一个拓扑空间(,(/()))U U E A σ。
2.3上下近似针对不可定义集,显然不可能构造一个公式来精确描述,只能通过上下界逼近的方式来刻画,这就是粗糙集理论中的上下近似算子。
定义2 设()E A 是信息表M 上的等价关系,X U ⊆,上下近似算子,()()apr apr E A E A (下文我们采用缩写形式,apr apr )定义为: 上近似()apr X 是包含X 的最小可定义集,下近似()apr X 是包含在X 中的最大可定义集。
根据定义2,可定义集显然有相同的上下近似。
刚才我们在可定义的基础上构造了一对近似算子。
也就是说,只有当对象不可定义时,才会用上下近似的方法来描述。
考虑子集X U ⊆,论域空间将被分成三个区域:(1) 集合X 的正域: ()();POS X apr X =(2) 集合X 的负域: ()(~)();NEG X POS X U apr X ==-(3) 集合X 的边界域: ()()().BND X apr X apr X =-。