粗糙集
粗糙集理论优质获奖课件

若rij=1, 且 i≠j, 则rji=0
对M2中1所 在位置,M 中相应位置 都是1
假如两 假如顶
点之
点xi
间有边, 到xj有边,
一定
xj
13
4、等价关系
等价关系旳定义:设R是非空集合A上旳关系,假如满足 ⑴ R是自反旳; ⑵ R是对称旳; ⑶ R是传递旳; 则称R是A上旳等价关系。
21
内容提要
一、概述 二、知识分类 三、知识旳约简 四、决策表旳约简 五、粗糙集旳扩展模型 六、粗糙集旳试验系统 七、粒度计算简介
22
一、 概述
现实生活中有许多模糊现象并不能简朴地 用真、假值来表达﹐怎样表达和处理这些现 象就成为一种研究领域。早在1923年谓词逻 辑旳创始人G.Frege就提出了模糊(Vague)一 词,他把它归结到边界线上,也就是说在全 域上存在某些个体既不能在其某个子集上分 类,也不能在该子集旳补集上分类。
自反性 反自反性 对称性 反对称性 传递性
12
关系性质旳三种等价条件
体 现 式
关系 矩阵
关系图
自反性 IAR
主对角 线元素 全是1
每个顶 点都有 环
反自反性 R∩IA=
主对角线 元素全是 0
每个顶点 都没有环
对称性 R=R1
反对称性 R∩R1 IA
传递性 RRR
矩阵是对称 矩阵
假如 两个 顶
定义 假如一种集合满足下列条件之一: (1)集合非空, 且它旳元素都是有序对 (2)集合是空集 则称该集合为一种二元关系, 简称为关系,记作R. 如<x,y>∈R, 可记作 xRy;假如<x,y>R, 则记作xRy
实例:R={<1,2>,<a,b>}, S={<1,2>,a,b}. R是二元关系, 当a, b不是有序对时,S不是二元关系 根据上面旳记法,能够写1R2, aRb, aSb等.
粗糙集的简单应用解析

pos(C ?{ R}) ( D) ? ? ? pos C (D)
第二十一页,编辑于星期三:二点 三十分。
规则提取
提取决策规则可以得到以下确定性规则:
(购买Q)且(不购买 R)—— (不购买 S) (购买 Q)且(购买 R) ——(购买S)
不确定规则为:
(不购买 Q)且(购买 R) —— (购买 S) ? (不买 Q买R,买 S ) ? 0.5
(不购买Q)且(购买 R)——(不购买 S)
论域, U 中的每个 xi (i ? n) 称为一个对象;
(2)A 是属性的非空有限集合,即 A ? {a1 , a2 ,? , an } , A 中
的每个 a j ( j ? m) 称为一个属性;
(3)V
?
?
a?
A
Va,Va
是属性的值域;
( 4) f :U ? A ? V 称为信息函数,它为每个对象关于每个
i Cij 表示分辨矩阵 中第 行,第 j 列的元素,Cij 被定义为:
C ij
?
??{a ? ? ??
A a ( xi ) ? a ( xj )}, D( xi ) ?
? , D (xi ) ? D( x j )
D(xj )
其中 i, j ? 1,2,? , n; n ? U
定义2.10 区分函数 是从分辨矩阵中构造的。约简算法的方法
定理2 core ( A) ? ? red ( A),其中 red ( A) 表示 A 的所有约简。
粗糙集

例
对于上表来说,U中有四个对象(概念),而现 在条件集合中只有一个属性,对于U1和U2来说, 它们的p不同所以可以通过p来区分,即u1,u2在p 下可区分;而U2和U3虽然是不同的对象但是在P 下却是相同的,即在p下不可区分,就成为不可 区分
粗糙集:
一个集合若恰好等于基本集的任意并集称为一个清晰 (crisp)集(精确集),否则称为粗糙(rough)集(不 精确集)。 解释:都可区分的是清晰集,有不可区分的对象为粗糙 集 主要特点:以不完全信息或知识去处理一些不分明现象的 能力,或依据观察、度量到的某些不精确的结果而进行分 类数据的能力. 粗糙集体现了集合中元素间的不可区分性. 主要优势:它不需要提供问题所需处理的数据集合之外的 任何先验知识,而且与处理其它不确定性问题的理论有很 强的互补性.
粗糙集理论所处理的问题
•不确定或不精确知识的表达; •经验学习并从经验中获取知识; •不一致信息的分析; •根据不确定,不完整的知识进行推理; •在保留信息的前提下进行数据化简; •近似模式分类; •识别并评估数据之间的依赖关系
三、粗糙集的应用
粗糙集理论在许多领域得到了应用: ①临床医疗诊断;
②电力系统和其他工业过程故障诊断;
3. 如果P中的任何一条属性都是不 可简约的,那么就称P是独立的 解释:P是独立的说明P中的任何一个属性都是必 不可少的,它独立的表达一个系统分类的特征。
属性约简的算法分析:
初始状态:所有数据已存入数据库(以下为模拟数据)
u 1 2 3 4 5 6
a 1 1 0 1 1 2
b 0 0 0 1 1 1
集合O 的下逼近(即正区) 为 I 3 (O ) = PO S (O ) = {刘保,赵 凯} 集合O 的负区为 N EG (O ) = {李得} 集合O 的边界区为 BND (O ) = {王治, 马丽} 集合O 的上逼近为 I 3 (O ) = PO S (O ) + BND (O ) = {刘保,赵凯,王治,马 丽} 根据表1, 可以归纳出下面几条规则, 揭示了教育程度与 是否能找到好工作之间的关 RUL E 1: IF (教育程度= 大学) OR (教育程度= 博士) THEN (可以找到好工作) RUL E 2: IF (教育程度= 小学) THEN (找不到好工作) RUL E 3: IF (教育程度= 高中) THEN (可能找到好工作)
粗糙集理论的基本原理与模型构建

粗糙集理论的基本原理与模型构建粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它在信息科学、数据挖掘和人工智能等领域具有广泛的应用。
本文将介绍粗糙集理论的基本原理和模型构建方法。
一、粗糙集理论的基本原理粗糙集理论最早由波兰学者Pawlak于1982年提出,它是基于集合论和近似推理的一种数学模型。
粗糙集理论的核心思想是通过对数据集进行分析,找出数据之间的关联和规律,从而进行决策和推理。
粗糙集理论的基本原理包括下近似和上近似。
下近似是指在给定条件下,能够包含所有满足条件的对象的最小集合;上近似是指在给定条件下,能够包含所有满足条件的对象的最大集合。
通过下近似和上近似的计算,可以得到粗糙集的边界区域,进而进行数据分类、决策和模式识别等任务。
二、粗糙集模型的构建方法粗糙集模型的构建方法主要包括属性约简和决策规则提取两个步骤。
属性约简是指从原始数据集中选择出最具代表性和决策能力的属性子集。
属性约简的目标是减少属性的数量,同时保持原始数据集的决策能力。
常用的属性约简方法包括正域约简、核约简和快速约简等。
这些方法通过计算属性的重要性和相关性,从而选择出最优的属性子集。
决策规则提取是指从属性约简后的数据集中提取出具有决策能力的规则。
决策规则是一种描述数据之间关系的形式化表示,它可以用于数据分类、决策和模式识别等任务。
决策规则提取的方法包括基于规则的决策树、基于规则的神经网络和基于规则的关联规则等。
三、粗糙集理论的应用领域粗糙集理论在信息科学、数据挖掘和人工智能等领域具有广泛的应用。
它可以用于数据预处理、特征选择、数据分类和模式识别等任务。
在数据预处理方面,粗糙集理论可以帮助我们对原始数据进行清洗和转换,从而提高数据的质量和可用性。
通过对数据集进行属性约简和决策规则提取,可以减少数据集的维度和复杂度,提高数据挖掘和决策分析的效率和准确性。
在特征选择方面,粗糙集理论可以帮助我们选择出最具代表性和决策能力的属性子集。
粗糙集理论的基本概念与原理

粗糙集理论的基本概念与原理粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它的提出源于20世纪80年代初期的波兰学者Zdzisław Pawlak。
粗糙集理论的核心思想是通过将数据划分成不同的等价类,来描述和处理不完全和不确知的信息。
本文将介绍粗糙集理论的基本概念与原理。
1. 粗糙集的定义与等价关系粗糙集是指将一个数据集划分成若干个等价类,其中每个等价类称为一个粗糙集。
在粗糙集理论中,等价关系是一个重要的概念。
等价关系是指具有自反性、对称性和传递性的关系。
在粗糙集理论中,等价关系用来描述数据中的相似性和差异性。
2. 上近似集与下近似集上近似集是指在一个粗糙集中,包含了所有与该粗糙集中的元素相似的元素。
下近似集是指在一个粗糙集中,包含了所有与该粗糙集中的元素不相似的元素。
上近似集和下近似集是粗糙集理论中的两个重要概念,它们用来描述数据的粗糙性和不确定性。
3. 约简与精确度约简是粗糙集理论中的一个重要操作,它的目的是通过删除一些不必要的属性或条件,从而减少数据集的复杂性,提高数据的处理效率。
约简可以通过删除一些不重要或不相关的属性来实现。
精确度是用来评估数据集的质量和可靠性的指标,粗糙集理论通过约简来提高数据集的精确度。
4. 粗糙集与模糊集粗糙集理论与模糊集理论有一些相似之处,但也存在一些差异。
模糊集理论是一种用来处理模糊和不确定性问题的数学工具,它通过给每个元素赋予一个隶属度来描述元素的模糊性。
而粗糙集理论是一种用来处理不完全和不确知信息的数学工具,它通过将数据划分成不同的等价类来描述数据的粗糙性。
5. 粗糙集的应用领域粗糙集理论在许多领域中都有广泛的应用。
在数据挖掘领域,粗糙集理论可以用来处理不完全和不确定的数据。
在人工智能领域,粗糙集理论可以用来处理模糊和不确定性问题。
在决策支持系统领域,粗糙集理论可以用来辅助决策过程。
在模式识别领域,粗糙集理论可以用来提取和分类模式。
总结:粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它通过将数据划分成不同的等价类来描述和处理不完全和不确知的信息。
粗糙集 (ppt)

2
一、 概述
现实生活中有许多含糊现象并不能简单 地用真、假值来表示﹐如何表示和处理这些 现象就成为一个研究领域。早在1904年谓词 逻辑的创始人G.Frege就提出了含糊(Vague) 一词,他把它归结到边界线上,也就是说在 全域上存在一些个体既不能在其某个子集上 分类,也不能在该子集的补集上分类。
12
Issues in the Decision Table
• The same or indiscernible objects may be represented several times. • Some of the attributes may be superfluous.
13
不可区分性Indiscernibility
二、 知识分类
为数学处理方便起见,在下面的定义中用等价关系 来代替分类。 一个近似空间(approximate space)(或知识库)定义 为一个关系系统(或二元组)
K=(U,R)
其中U(为空集)是一个被称为全域或论域(universe) 的所有要讨论的个体的集合,R是U上等价关系的一 个族集。
7
二、 知识分类
设PR,且P ,P中所有等价关系的交集称为P上 的一种不可区分关系(indiscernbility relation) 记作IND(P),即
[x]IND(p)= ∩[x]R RP 注意,IND(P)也是等价关系且是唯一的。
8
二、 知识分类
给定近似空间K=(U, R),子集XU称为U上的一个概念 (concept),形式上,空集也视为一个概念;非空子族集 PR所产生的不可区分关系IND(P)的所有等价类关系的集合 即U/IND(P),称为基本知识(basic knowledge),相应的等 价类称为基本概念(basic concept);特别地,若关系QR, 则关系Q就称为初等知识(elementary knowledge),相应的 等价类就称为初等概念(elementary concept)。 根据上述定义可知,概念即对象的集合,概念的族集(分类) 就是U上的知识,U上分类的族集可以认为是U上的一个知识 库,或说知识库即是分类方法的集合。
粗糙集理论简介及基本概念解析

粗糙集理论简介及基本概念解析粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它由波兰学者Pawlak于1982年提出。
粗糙集理论的核心思想是通过对数据进行粗糙化处理,将不完全、不确定的信息转化为可处理的粗糙集,进而进行数据分析和决策。
粗糙集理论的基本概念包括:粗糙集、等价关系、下近似集和上近似集。
首先,粗糙集是指在不完全信息条件下,通过将数据进行粗糙化处理得到的集合。
粗糙集可以看作是原始数据的一个近似描述,它包含了原始数据的一部分信息。
粗糙集的构建是通过等价关系来实现的。
其次,等价关系是粗糙集理论中的一个重要概念。
等价关系是指在给定的数据集中,将数据划分为若干等价类的关系。
等价关系的划分可以通过相似性度量来实现,相似性度量可以是欧氏距离、余弦相似度等。
等价关系的划分可以将原始数据进行分类,从而构建粗糙集。
下面,我们来介绍下近似集和上近似集。
下近似集是指在给定的粗糙集中,对于某个特定的属性或条件,能够确定的元素的集合。
换句话说,下近似集是能够满足某个条件的元素的集合,它是粗糙集的一个子集。
而上近似集是指在给定的粗糙集中,对于某个特定的属性或条件,可能满足的元素的集合。
上近似集是包含下近似集的最小集合,它是粗糙集的一个超集。
粗糙集理论的应用非常广泛,特别是在数据挖掘和模式识别领域。
通过粗糙集理论,可以对大量的数据进行处理和分析,从中发现隐藏的规律和模式。
粗糙集理论可以用于特征选择、属性约简、数据分类等任务,为决策提供有力支持。
总结起来,粗糙集理论是一种处理不确定性和模糊性问题的数学工具。
它通过粗糙化处理将不完全、不确定的信息转化为可处理的粗糙集,进而进行数据分析和决策。
粗糙集理论的基本概念包括粗糙集、等价关系、下近似集和上近似集。
粗糙集理论在数据挖掘和模式识别领域有着广泛的应用,可以用于特征选择、属性约简、数据分类等任务。
通过粗糙集理论,我们可以更好地理解和处理不确定性和模糊性问题,为决策提供有力支持。
粗糙集

粗糙集简述1、什么是粗糙集2、粗糙集与经典集合的关系经典集合论的“成员关系”是“非此即彼”粗糙集合论的“成员关系”是“亦此亦彼”3、模糊集合论VS粗糙集合论(1)模糊集合论着眼于模糊性粗糙集合论着眼于知识的粗糙性3、模糊集合论VS粗糙集合论如:《应用模糊数学》里说过,“高个子的男生”、“漂亮的女孩”假如刘备、关羽、张飞、曹操、诸葛亮五人在一间房子里开会,现在知道关羽和曹操患了感冒,而其他人是否感冒不知。
但是他们或多或少地有一些症状,刘备肌肉痛,张飞肌肉痛&头痛,诸葛亮体温高。
到底是体温高的感冒了,还是头痛的感冒了,不得而知,若非得回答谁感冒了,那么这个问题就是具有粗糙性的问题。
在这里把集合{关羽、曹操}称作精确集,{刘备、关羽、张飞、曹操、诸葛亮}叫作粗糙集。
(2)从知识描述方法上来看,模糊集合论是通过对象关于集合的隶属度来近似描述。
粗糙集合论通过信息库的一对上下近似来描述的。
(3)从对象间的关系来看,模糊集合论强调边界的不分明。
粗糙集合论强调对象间的不可区分性。
(4)从研究对象来看,模糊集合论研究的是同一类的不同对象的隶属关系,重在隶属程度。
粗糙集合论研究的是不同类中的对象组成的集合之间的关系,重在分类。
(1)什么是“知识”【标准定义】设U是我们感兴趣的对象组成的非空有限集合,称为论域。
U的任何一个子集X U,称为论域U的一个概念。
论域U中的任何子集簇称为关于U的抽象知识,简称知识。
【我的理解】曹操、关羽等是对象,{头痛}、{头痛、肌肉痛}、{头痛、肌肉痛、体温高}、∅这些集合就是知识(2)为什么要约简信息系统中的属性并不是同等重要的,甚至其中某些属性是冗余的。
在保证信息系统分类能力不变的条件下,删除其中不必要的、不重要的或不相关的属性。
小例子-银行信贷风险之后结合小例子为大家介绍粗糙集,数据和例子均来自中国期刊杂志一、选择指标体系根据个人消费信贷指标体系的选择方法及数据的可获取性,初选10个指标变量,个人信用评分指标体系共由10个条件属性构成,分别由个人自然特征变量、经济状况变量及信用状况变量三部分组成。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分辨矩阵与分辨函数
由于应用之前粗糙集理论对知识系统进行约简计算量过于巨大,所以 我们引入分辨矩阵与分辨函数来对知识系统进行约简
设S=(U,R,V,f)为一信息系统,R=C∪D是属性集合,自己C={ai|i=1,2,...,m} 和D={d}分别为条件属性集合决策属性集,U={x1,x2,...,xn}为论域,ak(xj) 是样本xj在属性ak上的取值。定义系统的分辨矩阵为M(S)=[mi的扩展模型
用属性相似关系代替等价关系
定义Sa(vi,vj)=1-|vi-vj|/|amax-amin|称为属性相似度,指定a的相似阈值为t(a), 当Sa(vi,vj)≥t(a)时认为vi,vj在属性a上相似。
可变精度粗糙模型
定义
1 Card ( X Y ) / Card ( X ) Card ( X ) 0 C( X , Y ) 0 Card ( X ) 0
属性值的离散化
用粗糙集进行数据处理具有无需先验知识,可从数据中获 取知识生成决策规则的优点,然而由于其对应的数据应该 是分散的,所以应用粗糙集处理连续型数据需要先进行离 散化处理,而数据处理的结果也会对运用粗糙集处理数据 的结果的精度产生影响。下面介绍几种离散化算法。
(1)等距离划分法:在每个属性上,根据用户给定的参数来把属性值 简单的划分为距离相等的断点段,不考虑每个断点段中属性值个数的多 少。假设某个属性的最大数属性值为xmax,最小属性值为xmin,用户给 定的参数为k,则断点间隔为δ=(xmax-xmin)/k,为此得到此属性上的断 点为xmin+iδ,i=0,1,...,k。这些断点间距离相等。
f M ( S ) {mij ,1 i, j n, mij }
U/R a b c d
1 0 0 0 0
2 0 2 1 1
3 0 1 0 0
4 1 2 1 2
5 1 0 0 1
6 1 2 1 2
U/R={{1},{2},{3},{4,6},{5}} U/a={{1,2,3},{4,5,6}} U/b={{1,5},{2,4,6},{3}} U/c={{1,3,5},{2,4,6}} U/a={{1,3},{2,5},{4,6}}
R=C∪D为属性集,其中C为条件属性集,D为决策属性集
Vc Vd V为属性值,V c C d D
f:f(x,r)→v
可分辨关系
在信息系统里面,我们只能通过已知的属性集判断两个物 体是否可分辨,比如若只有颜色一个属性,则我们认为所 有黑色的东西之间是不可分辨的,我们将论域U按属性R进 行划分,使得任何一个集合中的两个元素不可分辨,任何 不同两个集合中的元素可分辨,记这样的划分为Ind(R)
1 1
2
3
4
5
6
2
3 4 5 6
b,c,d
b a,b,c,d a,d a,b,c,d b,c,d a,d a,b,c a,d a,b,c,d a,b,d a,b,c,d b,c,d b,c,d
它的分辨函数fM(S) =(b∨c∨d)∧(b)∧(a∨b∨c∨d)∧(a∨d)∧(a∨b∨c∨d) ∧(b∨c∨d)∧(a∨d)∧(a∨b∨c)∧(a∨d)∧(a∨b∨c∨d) ∧(a∨b∨d)∧(a∨b∨c∨d)∧(b∨c∨d)∧(b∨c∨d) =b∧(a∨d) =ab∨bd b为R的核,{a,b}和{b,d}是R的两个约简。
(2)Naive Scaler算法:对于每一个属性a进行如下过程: 第一步:根据a(x)的值,从小到大排列实例x。 第二步:从上到下扫描,设xi和xj代表相邻实例:如果 a(xi)=a(xj),则继续扫描;如果d(xi)=d(xj),即决策相同,则继续扫描,否 则,得到一个新断点C,C=(a(xi)=a(xj))/2。
C(X,Y)是将X归类于Y的错误分类率。对于给定的错误分类率β X Y ,当且仅当C(X,Y)≤β。通过错误分类率这个概念我们 (0≤β<0.5)定义 重新定义X的上下近似集
R X X i (C( X i , X ) , i 1,2,...,k ) R X X i (C( X i , X ) 1 , i 1,2,...,k )
总结
粗糙集在对数据进行处理的过程相比较其他的方法,能够 自然地对数据的重要性进行评价,并产生一个客观的判断 系统。然而是否能有效运用粗糙集仍很大程度上取决于对 初始数据的处理。同时粗糙集对于海量数据的处理上仍存 在不足,本身的大量运算加上没有成熟的算法使得我们离 运用粗糙集解决实际问题还有很大的距离。在使用的过程 中需要与其他方法结合来更好地处理问题。
则r称为P中Q可省的。若P中无Q可省元素,则称P是相对于Q独 立的。当P-{r}相对于Q独立,则P-{r}为P的Q相对约简。P的 所有Q约简的交集成为P的Q的核。同样有
CoreQ (P) Re dQ (P)
一个用来帮助理解的例子
U={1,2,3,4,5,6,7,8},R={R1,R2,R3} U/R1={{1,2,3,4},{5,6,7,8}} U/R2={{1,2,4,7},{2,6},{5,8}} U/R3={{1,5,8},{2,3,4},{6,7}} U/Q={{1,2,3},{2,5,6},{7,8}} U/R={{1},{2},{3},{4},{5},{6},{7},{8}} U/(R1,R2)={{1,2},{3},{4},{5,8},{6},{7}} U/(R1,R3)={{1},{2,3,4},{5,8},{6,7}} U/(R2,R3)={{1},{2},{3},{4},{5},{6},{7},{8}}
粗糙度
对于样本子集 X ,我们需要弄清楚它究竟是什么样的,即 里面的元素究竟有什么属性。而由于知识R受限,当X的边 界域不为空时,我们并不能完整地通过 Ind(R)描述 X ,此 时就需要通过粗糙度度量R对X描述的精确程度。
R (X )
Card ( R ( X )) Card ( R ( X ))
(2)等频率划分算法:根据用户给定的参数k把m个对象分成段,每段 中有m/k个对象。假设某个属性的最大属性值为xmax,最小属性值为xmin, 用户给定的参数为k,则需要将这个属性在所有实例上的取值从小到大 进行排列,然后平均划分为k段,即得到断点集。每两个相邻断点之间 所包含属性值的个数是相等的。
粗糙集
主讲人:彭俊沛
粗糙集讲的是什么?
对于给定范围的对象(论域U)和已知的知识(条件属性C及属性值V) 来进行分类,并以此进行判断(决策属性)
样本 苹果 香菜
是否是水果 是 否
是否可食用 是 是
信息系统
信息系统S={U,R,V,f}
U={x1,x2,x3...}被称为论域,是我们所研究的全体样本的 集合
U 1
R C
X /
升学与成绩的关系
U / R {{1,6},{2},{3,5},{4}}
U / X {{2,3,5,6},{1,4}} {X1 , X 2 }
2
3 4 5 6
B
A D A C
+
+ / + +
Pos( X 1 ) {2,3,5}
Bnd( X 1 ) {1,6}
Neg( X1 ) Pos( X 2 ) {4}
V {水果,蔬菜 } {红,绿,黄 }
上近似和下近似
R ( X ) {x U , [ x]R X } R ( X ) {x U ,[ x]R X }
正域: Pos( X ) R ( X ) 边界:Bnd( X ) R ( X ) R ( X ) 负域:Neg( X ) U R ( X )
ak C , ak ( xi ) ak ( x j ) D( xi ) D( x j ) mi , j i, j 1,2,3,...,n , D( xi ) D( x j )
对于每一个分辨矩阵M(S)对应唯一的分辨函数fM(S),它实际上是一个布尔 函数其定义为:信息系统S的分辨函数是一个具有M元变量的布尔函数, 它是(∨mij)的和取,而(∨mij)是矩阵项中的各元素的析取,即
相对约简
在研究问题或作出决定的过程中,我们往往只需要考虑与我 们所关系的目标所相关的“知识”,所以我们引入相对约简 的概念。对论域U上的两个等价关系P,Q,定义Q的P正域为:
PosP (Q) P ( X )( X U / Q)
rP 若 设P和Q为论域U上的等价关系,
PosP (Ind(Q)) Pos( P{r}) ( Ind(Q))
易知粗糙度是个介于0跟1之间的量,当粗糙度小于1时, 我们称集合X相对于R是粗糙的,而粗糙度也可以认为是在 等价关系R下逼近集合X的精度。
知识的约简
如果对属性R及 r R 有 Ind( R) Ind( R {r})
则属性r对描述体域U是多余的,此时我们称r在等价关系R中 是可省的。如果R中不存在可省略属性,则称R是独立的。若 Q P ,Q独立,且Ind(Q)=Ind(P)则称Q是P的一个约简.P的 约简记为Red(P).而P中所有不可省关系的集合称为P的核, 由定义我们有 Core( P) Re d ( P)