粗糙集理论方法及其应用
粗糙集的简单应用解析

pos(C ?{ R}) ( D) ? ? ? pos C (D)
第二十一页,编辑于星期三:二点 三十分。
规则提取
提取决策规则可以得到以下确定性规则:
(购买Q)且(不购买 R)—— (不购买 S) (购买 Q)且(购买 R) ——(购买S)
不确定规则为:
(不购买 Q)且(购买 R) —— (购买 S) ? (不买 Q买R,买 S ) ? 0.5
(不购买Q)且(购买 R)——(不购买 S)
论域, U 中的每个 xi (i ? n) 称为一个对象;
(2)A 是属性的非空有限集合,即 A ? {a1 , a2 ,? , an } , A 中
的每个 a j ( j ? m) 称为一个属性;
(3)V
?
?
a?
A
Va,Va
是属性的值域;
( 4) f :U ? A ? V 称为信息函数,它为每个对象关于每个
i Cij 表示分辨矩阵 中第 行,第 j 列的元素,Cij 被定义为:
C ij
?
??{a ? ? ??
A a ( xi ) ? a ( xj )}, D( xi ) ?
? , D (xi ) ? D( x j )
D(xj )
其中 i, j ? 1,2,? , n; n ? U
定义2.10 区分函数 是从分辨矩阵中构造的。约简算法的方法
定理2 core ( A) ? ? red ( A),其中 red ( A) 表示 A 的所有约简。
粗糙集理论的模型参数估计方法及其实际应用

粗糙集理论的模型参数估计方法及其实际应用粗糙集理论是一种用于处理不完备、不精确、不确定信息的数学工具,被广泛应用于数据挖掘、模式识别、决策分析等领域。
在粗糙集理论中,模型参数的估计是一个重要的研究内容,本文将介绍几种常用的粗糙集模型参数估计方法,并探讨其在实际应用中的价值。
一、基于最大似然估计的参数估计方法最大似然估计是一种常用的参数估计方法,其基本思想是通过最大化观测数据出现的概率来估计模型参数。
在粗糙集理论中,最大似然估计可以用于估计决策属性的条件概率分布。
具体而言,对于给定的条件属性集合和决策属性,最大似然估计可以通过统计样本中各个条件属性取值与决策属性取值的频率来估计其条件概率分布。
然后,可以利用估计得到的条件概率分布进行决策推理和决策分析。
二、基于贝叶斯估计的参数估计方法贝叶斯估计是一种基于贝叶斯定理的参数估计方法,其基本思想是通过先验知识和观测数据来估计模型参数的后验概率分布。
在粗糙集理论中,贝叶斯估计可以用于估计条件属性的条件概率分布。
具体而言,可以利用先验知识和观测数据来构建条件属性的先验概率分布和似然函数,然后通过贝叶斯定理计算条件属性的后验概率分布。
最后,可以利用估计得到的后验概率分布进行决策推理和决策分析。
三、基于遗传算法的参数估计方法遗传算法是一种模拟生物进化过程的优化算法,其基本思想是通过模拟自然选择、交叉和变异等操作来搜索最优解。
在粗糙集理论中,遗传算法可以用于估计约简算法中的参数。
具体而言,可以将约简算法中的参数作为遗传算法的个体编码,然后通过选择、交叉和变异等操作来搜索最优的参数组合。
最后,可以利用估计得到的最优参数组合进行数据挖掘和模式识别。
四、粗糙集理论在实际应用中的价值粗糙集理论作为一种处理不完备、不精确、不确定信息的数学工具,具有很强的实际应用价值。
首先,粗糙集理论可以用于特征选择和约简,可以帮助我们从大量的属性中选择出最具有代表性和区分性的属性,从而提高数据挖掘和模式识别的效果。
粗糙集理论及其应用研究

粗糙集理论及其应用研究一、粗糙集理论概述粗糙集是一种用于解决不确定性问题的数学工具。
粗糙集理论中知识被理解为对事物进行区分的能力,在形式上表现为对论域的划分,因而通过论域上的等价关系表示。
粗糙集通过一对上、下近似算子来刻画事物,它不需要数据以外的任何先验知识,因此具有很高的客观性。
目前,粗糙集被广泛用于决策分析、机器学习、数据挖掘等领域[1~6]。
二、粗糙集中的基本概念[7]定义1 论域、概念。
设U是所需研究的对象组成的非空有限集合,称为一个论域,即论域U。
论域U的任意一个子集XU,称为论域U的一个概念。
论域U中任意一个子集簇称为关于U的知识。
定义2 知识库。
给定一个论域U和U上的一簇等价关系S,称二元组K=(U,S)是关于论域U的知识库或近似空间。
定义3 不可分辨关系。
给定一个论域U和U上的一簇等价关系S,若PS,且P≠?,则∩P仍然是论域U上的一个等价关系,称为P上的不可分辨关系,记做IND(P)。
称划分U/IND(P)为知识库K=(U,S)中关于论域U的P-基本知识。
定义4 上近似、下近似。
设有知识库K=(U,S)。
其中U为论域,S为U 上的一簇等价关系。
对于X∈U和论域U上的一个等价关系R∈IND(K),则X关于R的下近似和上近似分别为:下近似R(X)=∪{Y∈U/R|YX}上近似R(X)=∪{Y∈U/R|Y∩X=?}集合的上近似和下近似是粗糙集中最核心的概念,粗糙集的数字特征以及拓扑特征都是由它们来描述和刻画的。
当R=(X)时,称X是R-精确集;当R(X)≠(X)时,称X是R-粗糙集,即X是粗糙集。
三、粗糙集理论的优势随着人们对粗糙集理论的不断研究,它的应用领域在不断扩大,粗糙集理论的优势在于:1)他不需要专家的经验知识,而仅利用现实实例数据本身提供的信息;2)能搜索数据的最小集合,能从实例数据中获取易于证实的规则知识,最后,它同时允许使用定性和定量的数据。
近年来,粗糙集理论应用到了许多领域。
粗糙集理论的使用方法与步骤详解

粗糙集理论的使用方法与步骤详解引言:粗糙集理论是一种用来处理不确定性和模糊性问题的数学工具,它在数据分析和决策支持系统中得到了广泛的应用。
本文将详细介绍粗糙集理论的使用方法与步骤,帮助读者更好地理解和应用这一理论。
一、粗糙集理论概述粗糙集理论是由波兰学者Pawlak于1982年提出的,它是一种基于近似和粗糙程度的数学理论。
粗糙集理论的核心思想是通过对属性间的关系进行分析,识别出数据集中的重要特征和规律。
它主要包括近似集、正域、决策表等概念。
二、粗糙集理论的使用方法1. 数据预处理在使用粗糙集理论之前,首先需要对原始数据进行预处理。
这包括数据清洗、数据变换和数据归一化等步骤,以确保数据的准确性和一致性。
2. 构建决策表决策表是粗糙集理论中的重要概念,它由属性和决策构成。
构建决策表时,需要确定属性集和决策集,并将其表示为一个矩阵。
属性集包括原始数据中的各个属性,而决策集则是属性的决策结果。
3. 确定正域正域是指满足某一条件的样本集合,它是粗糙集理论中的关键概念。
通过对决策表进行分析,可以确定正域,即满足给定条件的样本集合。
正域的确定可以通过计算属性的约简度或者使用启发式算法等方法。
4. 近似集的计算近似集是粗糙集理论中的核心概念,它是指属性集在正域中的近似表示。
通过计算属性集在正域中的近似集,可以确定属性之间的关系和重要程度。
近似集的计算可以使用不同的算法,如基于粒计算、基于覆盖算法等。
5. 属性约简属性约简是粗糙集理论中的一个重要问题,它是指从属性集中选择出最小的子集,保持属性集在正域中的近似表示不变。
属性约简的目标是减少属性集的复杂性,提高数据分析和决策的效率。
属性约简可以通过计算属性的重要度、使用启发式算法或者遗传算法等方法实现。
6. 决策规则的提取决策规则是粗糙集理论中的重要结果,它是从决策表中提取出来的一组条件和决策的组合。
决策规则可以帮助我们理解数据集中的规律和特征,从而做出更好的决策。
粗糙集方法与应用

辽宁省物流航运管理系统工程重点实验室
2.2 不精确范畴、近似与粗糙集
上近似和下近似 X关于R的上近似(Upper Approximation)定义为: R X a U : a R X
R ( x ) 是所有与X相交非空的等价类[a]R的并集,是那些 可能属于X的对象组成的最小集合。
粗糙集(Rough Sets)理论是由波兰数学家Pawlak Z 于1982年提出的。 粗糙集方法是基于一个机构(或一组机构)关于现实的 大量数据信息,以对观察和测量所得数据进行分类的能 力为基础,从中发现、推理知识和分辨系统的某些特点、 过程、对象等的一种方法。 经过二十多年的发展以及研究的深入,粗糙集方法在理 论和实际应用上都取得了长足的发展。在知识发现、数 据挖掘、模式识别、故障检测、医疗诊断等领域得到了 广泛应用。
辽宁省物流航运管理系统工程重点实验室
2.1 知识与不可分辨关系
不可分辨关系是物种由属性集P表达时,论域U中的等价 关系。U|ind(P)表示由等价关系ind(P)划分的所有等价类, 且将其定义为与等价关系P的族相关的知识,称为P基本 知识。同时,也将U|ind(P)记为U|P,ind(P)的等价类称为 关系P的基本概念或基本范畴。
辽宁省物流航运管理系统工程重点实验室
1.2 粗糙集的应用及与其他领域的结合
三、粗糙集与其他相关理论和领域 粗糙集与模糊集、证据理论的关系 粗糙集和神经网络 粗糙集与遗传算法 粗糙集与支持向量 粗糙集与自动控制
辽宁省物流航运管理系统工程重点实验室
二、粗糙集基本理论
2.1 知识与不可分辨关系
2.2不精确范畴、近似与粗糙集
上近似和下近似 当集合X能表示成基本等价类组成的并集时,则称集合X 是R可精确定义的,称作R精确集;否则,集合X是R不可 精确定义的,称作R非精确集或R粗糙集。对于粗糙集可 近似利用两个精确集,即下近似和上近似来描述。 X关于R的下近似(Lower Approximation)定义为: R X a U : a R X R X 是由那些根据已有知识判断肯定属于X的对象所组成 的最大的集合。
粗糙集理论及其应用研究

粗糙集理论的核心内容
知识的约简与核
知识的约简: 通过删除不重 要的知识,保 留关键信息
核的概念:核 是知识的最小 表示,包含所 有必要信息
核的性质:核 具有独立性、 完备性和最小 性
核的求取方法: 基于信息熵、 信息增益等方 法进行求取
0
0
0
0
1
2
3
4
决策表的简化
决策表:用于描述决策问题的表格 简化目标:减少决策表的规模,提高决策效率 简化方法:合并条件属性,删除冗余属性 简化效果:提高决策表的可读性和可理解性,降低决策复杂度
粗糙集理论在聚类分析中的应用:利用粗糙集理论处理不确定和不完整的数据,提高聚类 分析的准确性和效率。
聚类分析在数据挖掘中的应用:可以帮助发现数据中的模式和趋势,为决策提供支持。
粗糙集理论在其他领域的应用
决策支持系统
粗糙集理论可以帮助决策者 处理不确定性和模糊性
粗糙集理论在决策支持系统 中的应用
粗糙集理论可以提高决策支 持系统的准确性和效率
粗糙集理论在决策支持系统 中的实际应用案例分析
智能控制
粗糙集理论在模糊控制中的 应用
粗糙集理论在智能控制中的 应用
粗糙集理论在神经网络控制 中的应用
粗糙集理论在自适应控制中 的应用
模式识别
粗糙集理论在模式 识别中的应用
粗糙集理论在图像 识别中的应用
粗糙集理论在语音 识别中的应用
粗糙集理论在生物 信息学中的应用
添加标题
添加标题
ห้องสมุดไป่ตู้添加标题
添加标题
机器学习
粗糙集理论在机器学习中的应用 粗糙集理论在数据挖掘中的应用 粗糙集理论在模式识别中的应用 粗糙集理论在自然语言处理中的应用
粗糙集理论的属性约简方法及其在实际问题中的应用

粗糙集理论的属性约简方法及其在实际问题中的应用引言粗糙集理论是一种基于不确定性的数据分析方法,它通过对数据集中属性之间的关系进行分析,提供了一种有效的数据降维和特征选择的方法。
在实际问题中,属性约简是粗糙集理论的一个重要应用,它可以帮助我们从大规模的数据中提取出最为关键和有价值的属性,减少数据处理的复杂性,提高数据分析的效率和准确性。
一、粗糙集理论概述粗糙集理论是由波兰学者Pawlak于1982年提出的,它是一种处理不确定性信息的数学工具,主要用于数据分析和知识发现。
粗糙集理论的核心思想是基于近似和不确定性,通过对属性之间的关系进行分析,找出属性的重要性和相关性,从而对数据进行降维和特征选择。
二、属性约简方法属性约简是粗糙集理论的一个重要应用,它可以帮助我们从大规模的数据中提取出最为关键和有价值的属性,减少数据处理的复杂性,提高数据分析的效率和准确性。
常用的属性约简方法主要有以下几种:1. 正域约简:正域约简是一种基于属性重要性的约简方法,它通过计算属性的依赖度和冗余度来评估属性的重要性,从而选择出最为重要的属性。
正域约简方法在处理具有大量属性的数据集时具有较好的效果。
2. 直接约简:直接约简是一种基于属性关系的约简方法,它通过计算属性之间的相似度和相关性来选择出最为相关的属性。
直接约简方法在处理具有复杂关系的数据集时具有较好的效果。
3. 快速约简:快速约简是一种基于属性搜索的约简方法,它通过快速搜索算法来选择出最为关键的属性。
快速约简方法在处理大规模数据集时具有较好的效果。
三、属性约简方法在实际问题中的应用属性约简方法在实际问题中具有广泛的应用价值,可以帮助我们从大规模的数据中提取出最为关键和有价值的属性,减少数据处理的复杂性,提高数据分析的效率和准确性。
以下是属性约简方法在实际问题中的一些应用案例:1. 医学诊断:在医学诊断中,属性约简方法可以帮助医生从大量的医学数据中提取出最为关键和有价值的属性,辅助医生进行疾病诊断和治疗方案选择。
粗糙集理论简介及应用介绍

粗糙集理论简介及应用介绍引言:在现代信息时代,数据的快速增长和复杂性给决策和问题解决带来了挑战。
为了更好地理解和分析数据,人们提出了许多数据挖掘和分析方法。
其中,粗糙集理论作为一种有效的数据处理方法,被广泛应用于各个领域。
本文将简要介绍粗糙集理论的基本概念以及其在实际应用中的一些案例。
一、粗糙集理论的基本概念粗糙集理论是由波兰学者Pawlak在20世纪80年代初提出的。
它是一种基于近似和不确定性的数学工具,用于处理不完全和不确定的信息。
粗糙集理论的核心思想是通过将数据划分为等价类来对数据进行描述和分析。
在这种划分中,数据被分为确定和不确定的部分,从而实现了对数据的粗糙描述。
1.1 粗糙集的等价关系粗糙集的等价关系是粗糙集理论的基础。
在粗糙集中,等价关系是指具有相同属性值的数据实例之间的关系。
通过等价关系,我们可以将数据实例划分为不同的等价类,从而实现对数据的刻画和分析。
1.2 下近似集和上近似集在粗糙集中,下近似集和上近似集是对数据的进一步描述。
下近似集是指具有最小确定性的数据实例的集合,而上近似集是指具有最大确定性的数据实例的集合。
通过下近似集和上近似集,我们可以更好地理解数据的不确定性和不完整性。
二、粗糙集理论的应用案例粗糙集理论在实际应用中具有广泛的应用价值。
以下将介绍一些典型的应用案例。
2.1 数据挖掘粗糙集理论在数据挖掘中被广泛应用。
通过粗糙集理论,我们可以对大量的数据进行分类和聚类。
例如,在医学领域,研究人员可以利用粗糙集理论对医疗数据进行分类,从而实现对疾病的诊断和治疗。
2.2 特征选择特征选择是数据挖掘和机器学习中的一个重要问题。
通过粗糙集理论,我们可以对数据中的特征进行选择,从而减少数据的维度和复杂性。
例如,在图像识别中,研究人员可以利用粗糙集理论选择最具代表性的图像特征,从而提高图像识别的准确性和效率。
2.3 决策支持系统粗糙集理论在决策支持系统中的应用也非常广泛。
通过粗糙集理论,我们可以对决策问题进行建模和分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、原理
• (二)粗糙集与近似集
令XU ,R为U上的一个等价关系。 当X能表达成某些R基本范畴的并时,称X是 R可定义的,也称作R精确集;否则称X为R 不可定义的,也称为R非精确集或R粗糙集。 • 当存在等价关系RIND(K)且X为R精 确集时,集合X U称为K中的精确集;当 对于任何R IND(K),X都为R粗糙集, 则X称为K中的粗糙集。
Rough集理论方法及其应用
学生:朱 兵 导师:贺昌政
Content
• • • • • 一、 二、 三、 四、 五、 简 原 应 评 实 介 理 用 价 例
一、简介
在自然科学、社会科学和工程技术的 很多领域中,都不同程度地涉及到对不确定 因素和对不完备信息的处理。从实际系统中 采集到的数据常常包含着噪声,不精确甚至 不完整。采用纯数学上的假设来消除或回避 这种不确定性,效果往往不理想,反之,如 果正视它,对这些信息进行合适地处理,常 常有助于相关实际系统问题的解决。
二、原理
• 一般地,集合X包含于Y并未反映出集 合X的元素属于集合Y的“多少”。为此, VPRS定义了它的量度: • 当card(x)>0, C(X, Y)=1–card(XY)/card(X) • 当card(x)=0, C(X, Y)=0
二、原理
• C(X, Y)表示把集合X归类于集合Y的误
二、原理
★预备知识:
• 定义: 设R是集合A上的二元关系,如果它 是自反、对称和传递的,则它是A上的等 价关系。 • 定义: 设R是A上的一个等价关系,与A中 的一个元素a相关的所有元素a的集合被称 做的一个等价类。 • 命题: R是集合S的一个等价关系,那么R的 等价类形成S的一个划分。
二、原理
AW {x1, x6},
AW {x1, x3, x 4, x6}, BN A (W ) {x3, x 4}, U AW {x 2, x5, x7}.
• W是一个粗糙集合
二、原理
{{x2}, {x5,x7}}
AW
AW
{{x3,x4}}
yes {{x1},{x6}} yes/no
no
一、简介
刘清. Rough Set及Rough推理. 北京: 科学 出版社, 2001 张文修等. Rough Set理论与方法. 北京: 科 学出版社, 2001 王国胤, Rough Set理论与知识获取. 西安: 西安交通大学出版社, 2001 曾黄麟. 粗集理论及其应用(修订版). 重庆: 重庆大学出版社
性的数学工具,能有效地分析不精确、不
一致、不完整等各种不完备的信息,还可
以对数据进行分析和推理,从中发现隐含
的知识,揭示潜在的规律。
一、简介
粗糙集理论的主要优势之一是它不需要 任何预备的或额外的有关数据信息。自提出 以来,许多计算机科学家和数学家对粗糙集 理论及其应用进行了坚持不懈的研究,使之 在理论上日趋完善,特别是由于20世纪80年 代末和90年代初在知识发现等领域得到了成 功的应用而越来越受到国际上的广泛关注。Fra bibliotek二、原理
U
RX X
RX
setX U/R
R : subset of attributes
二、原理
近似精度
| B( X ) | B (X ) | B( X ) |
X .
αB (X) 表示了一个集合的粗糙程度, 显然 0 αB 1
当 αB (X) = 1 时,集合X相对于R是精确的 当 αB (X) < 1 时,集合X相对于R是粗糙的
二、原理
•例: • 给定一玩具积木的集合 E={x1, x2, x3, x4,x5, x6, x7, x8} •按颜色分类: • x1 ,x3 ,x7—红;x2,x4—蓝;x5, x6 ,x8 —黄 •按形状分类: • x1 ,x5 —圆;x2 ,x6 —方;x3 ,x4 ,x7,x8—三角
二、原理
二、原理
• 另一个是来自于给定论域里粗糙近似的
边界,当边界为空集时知识是完全确定的,边 界越大知识就越粗糙或越模糊。这时处理知 识不确定性就用不分明对象类形成的上近似 和下近似来描述。
二、原理
粗糙集与模糊集
对象间关系的基础 不精确刻画方法 研究方法 对知识的近似描述
对象间关系 模糊集理论 概念边界的不分明性 隶属程度 隶属函数 隶属程度 集合边界的病态定义和 边界的不分明性 粗糙集理论 对象间不可分辨关系 粗糙度 对象的分类 上、下近似集 不可分辨关系
LEMS Walk 50 0 1-25 1-25 26-49 26-49 26-49 yes no no yes no yes no
• IND({Age}) = {{x1,x2,x6}, {x3,x4}, {x5,x7}} • IND({LEMS}) = {{x1}, {x 2}, {x3,x4}, {x5,x6,x7}} • IND({Age,LEMS}) = {{x 1}, {x2}, {x3,x4}, {x5,x7}, {x6}}.
二、原理
• 对于{R1, R2} ,它的基本范畴有 • {x1 ,x3 ,x7}∩{x3, x4 ,x7,x8 }={x3,x7} —红色三角 • {x2,x4 }∩{x2,x6 }= {x2} • —蓝色方形 • {x5, x6 ,x8 }∩{x3, x4 ,x7,x8 }={x8} • —黄色三角形
•
一、简介
• 1991年波兰Pawlak教授的第一本关于粗糙 集的专著《Rough Sets Theoretical Aspects of Reasoning about Data 》; • 1992年R.Slowinski主编的关于粗糙集应用 及其与相关方法比较研究的论文集; • 1992年在波兰Kiekrz召开了第1届国际粗糙 集讨论会。从此每年召开一次与粗糙集理 论为主题的国际研讨会。
二、原理
•(三)粗糙集与不确定性
•粗糙集理论中知识的不确定性有两方面: 一是来自来自于论域上的二元关系及其 产生的知识模块,即近似空间本身由于对象的 可得到的信息不一定足以划分其成员类别,换 句话说,这种不精确性导致了对象的不可分辨 性。论域上的二元关系及其产生的知识模块 越大,知识库中的知识越粗糙, 近似空间的概 念和知识就越不确定,这时处理知识的不确定 性的方法往往用香农信息熵来刻画。
因为描述它们特征同性的信息相同,都是
黑色。
二、原理
• 如果再引入方、圆的属性,又可以将 物体进一步分割为四类:{黑色方物体}、 {黑色圆物体}、{白色方物体}、{白色圆物 体}。这时,如果两个同为黑色方物体,则 它们还是不可分辨的。
二、原理
• 一个知识库定义为一个关系系统 K=(U,R) 其中U是一个被称为全域或论域的所 有要讨论的个体的集合,R是U上等价关系 的一个族集。
先验知识
与普通集合的联系 计算方法
需要
λ截集 连续特征函数产生
不需要
上近似、下近似 知识表达和简约
二、原理
(四)粗糙集模型的扩展
基本粗糙集理论的主要存在的问题是: 1)对原始数据本身的模糊性缺乏相应处理能力; 2)对于粗糙集的边界区域的刻画过于简单; 3)粗糙集理论的方法的分类是确定的,但并未提 供数理统计中所常用的在一个给定错误率的条 件下将尽可能多的对象进行分类的方法,而实 际中常常遇到这类问题。
•
二、原理
X的下近似:
R*(X)={x:(xU) ([x]RX )}
X的上近似:
R*(X)={x:(xU) ([x]RX )}
下近似包含了所有使用知识R可确切分
类到X的元素;上近似则是包含了所有那些可
能是属于X的元素的最小集合。
二、原理
•X的边界区域: BNR(X)=R*(X)–R*(X) •X的R-正区域: POSR(X)=R*(X) •X的R-反区域: NEGR(X)=U–R*(X) 概念的边界区域由不能肯定分类到这个 概念或其补集中的所有元素组成。若BNR(X) ,则集合X就是一个粗糙概念。
二、原理
设PR,且P ,P中所有等价关系的交集 称为P上的一种难区分关系,记作IND(P),即
[x] IND(p) = ∩ [x]R
RP
注意,IND(P)也是等价关系且是唯一的。
二、原理
给定近似空间K=(U, R),子集XU称为U 上的一个概念;非空子族集PR所产生的不分 明关系IND(P)的所有等价类关系的集合即 U/IND(P),称为基本知识,相应的等价类称为 基本概念.特别地,若关系QR,则关系Q就称 为初等知识,相应的等价类就称为初等概念。 根据上述定义可知,概念是对象的集合,分 类就是U上的知识,U上分类的族集可以认为 是U上的一个知识库,或说知识库即是分类方 法的集合。
二、原理
现有一集合(概念)X={x2 , x5 , x6} 它是粗糙集
R1*(X)= ={x2 , x4 , x5 , x6 , x8}
R1*(X) ={x2 , x6}
BNR(X)=R*(X)–R*(X) ={x4 , x5 , x8 }
二、原理
Age x1 x2 x3 x4 x5 x6 x7 16-30 16-30 31-45 31-45 46-60 16-30 46-60
二、原理
U
RβX
RβX
setX
U/R
R : subset of attributes
二、原理
2.相似关系模型 在数据中存在缺失的属性值的时候,不分 明关系或等价关系无法处理这种情形。为扩展 粗糙集的能力,有许多作者提出了用相似关系 来代替不分明关系作为粗糙集的基础。
分类度,即有C(X, Y)100%的元素归类错误。
显然,C(X, Y)=0时有XY。如此,可事先给
定一错误分类率(0<0.5),基于上述定义,
我们有XY,当且仅当C(X, Y)。 • 在此基础上,设U为论域且R为U上的等 价关系,U/R=A={X1, X2, …, Xk }