保正域的决策粗糙集属性约简
基于粗糙集的属性约简算法

} 。
…
3
的上 近似 集 B ) 根据 知识 判定 可 能属 ( , 于 的 中的对象 组成 的集合 B X)= { ∈ Ul ( X B( " X ≠ } X)I 1 。
定义 3 正域
收 稿 日期 :0 l 3 1 2 1 - —l 0 基 金项 目 : 国家 自然 科 学 基 金 资 助 项 目( 07 0 9 6543 )
D c u D =Q, = ) ( Cn D 两个不同的集合。 概念 2 完备信息系统与不完备信息系统 在决 策信息系统 D S=< , uD, , UC VP>中, 中每个对
1 2 基本 定义 .
L )= { ( Y∈ UI( Y ,)∈ L , } L = { ∈ UI ( X L ) } , L = { ∈ UJ ( X )n ≠ } 。
() 2 () 3 () 4
定义 1 不可 分辨 关 系
限制容 差关 系具 有 自反 性 和对 称性 , 是不 具 但 有 传递 性 。
步骤 有的约简属性集都包含的不可省略属性 的集合 , 记 为 C R P)=n R D( O E( E P)。
步骤 7 将 R d e 集里的属性与 c集合里剩余的
属性 分别结 合 。 步骤 8 采 用组合 属性 , 复步骤 2 ~6 重 。 步骤 9 从 R d的尾部 开 始 , 后 往前 对 每 个 e 从
2 2 知 识约 简算法 .
q }I D B 是一个等价关系。 )。 ( ) N 由这种等价关 系导
出 的对 的划 分记 为 U ID( , 中包 含样本 的 /N B)其 等价类 记 为 [ ] 。
粗糙集理论的使用方法与步骤详解

粗糙集理论的使用方法与步骤详解引言:粗糙集理论是一种用来处理不确定性和模糊性问题的数学工具,它在数据分析和决策支持系统中得到了广泛的应用。
本文将详细介绍粗糙集理论的使用方法与步骤,帮助读者更好地理解和应用这一理论。
一、粗糙集理论概述粗糙集理论是由波兰学者Pawlak于1982年提出的,它是一种基于近似和粗糙程度的数学理论。
粗糙集理论的核心思想是通过对属性间的关系进行分析,识别出数据集中的重要特征和规律。
它主要包括近似集、正域、决策表等概念。
二、粗糙集理论的使用方法1. 数据预处理在使用粗糙集理论之前,首先需要对原始数据进行预处理。
这包括数据清洗、数据变换和数据归一化等步骤,以确保数据的准确性和一致性。
2. 构建决策表决策表是粗糙集理论中的重要概念,它由属性和决策构成。
构建决策表时,需要确定属性集和决策集,并将其表示为一个矩阵。
属性集包括原始数据中的各个属性,而决策集则是属性的决策结果。
3. 确定正域正域是指满足某一条件的样本集合,它是粗糙集理论中的关键概念。
通过对决策表进行分析,可以确定正域,即满足给定条件的样本集合。
正域的确定可以通过计算属性的约简度或者使用启发式算法等方法。
4. 近似集的计算近似集是粗糙集理论中的核心概念,它是指属性集在正域中的近似表示。
通过计算属性集在正域中的近似集,可以确定属性之间的关系和重要程度。
近似集的计算可以使用不同的算法,如基于粒计算、基于覆盖算法等。
5. 属性约简属性约简是粗糙集理论中的一个重要问题,它是指从属性集中选择出最小的子集,保持属性集在正域中的近似表示不变。
属性约简的目标是减少属性集的复杂性,提高数据分析和决策的效率。
属性约简可以通过计算属性的重要度、使用启发式算法或者遗传算法等方法实现。
6. 决策规则的提取决策规则是粗糙集理论中的重要结果,它是从决策表中提取出来的一组条件和决策的组合。
决策规则可以帮助我们理解数据集中的规律和特征,从而做出更好的决策。
粗糙集理论的属性约简方法及其在实际问题中的应用

粗糙集理论的属性约简方法及其在实际问题中的应用引言粗糙集理论是一种基于不确定性的数据分析方法,它通过对数据集中属性之间的关系进行分析,提供了一种有效的数据降维和特征选择的方法。
在实际问题中,属性约简是粗糙集理论的一个重要应用,它可以帮助我们从大规模的数据中提取出最为关键和有价值的属性,减少数据处理的复杂性,提高数据分析的效率和准确性。
一、粗糙集理论概述粗糙集理论是由波兰学者Pawlak于1982年提出的,它是一种处理不确定性信息的数学工具,主要用于数据分析和知识发现。
粗糙集理论的核心思想是基于近似和不确定性,通过对属性之间的关系进行分析,找出属性的重要性和相关性,从而对数据进行降维和特征选择。
二、属性约简方法属性约简是粗糙集理论的一个重要应用,它可以帮助我们从大规模的数据中提取出最为关键和有价值的属性,减少数据处理的复杂性,提高数据分析的效率和准确性。
常用的属性约简方法主要有以下几种:1. 正域约简:正域约简是一种基于属性重要性的约简方法,它通过计算属性的依赖度和冗余度来评估属性的重要性,从而选择出最为重要的属性。
正域约简方法在处理具有大量属性的数据集时具有较好的效果。
2. 直接约简:直接约简是一种基于属性关系的约简方法,它通过计算属性之间的相似度和相关性来选择出最为相关的属性。
直接约简方法在处理具有复杂关系的数据集时具有较好的效果。
3. 快速约简:快速约简是一种基于属性搜索的约简方法,它通过快速搜索算法来选择出最为关键的属性。
快速约简方法在处理大规模数据集时具有较好的效果。
三、属性约简方法在实际问题中的应用属性约简方法在实际问题中具有广泛的应用价值,可以帮助我们从大规模的数据中提取出最为关键和有价值的属性,减少数据处理的复杂性,提高数据分析的效率和准确性。
以下是属性约简方法在实际问题中的一些应用案例:1. 医学诊断:在医学诊断中,属性约简方法可以帮助医生从大量的医学数据中提取出最为关键和有价值的属性,辅助医生进行疾病诊断和治疗方案选择。
基于粗糙集理论的评价指标属性约简

基于粗糙集理论的评价指标属性约简摘要:粗糙集理论是一种对数据进行约简的有效工具。
文章运用粗糙集理论对评价指标进行了属性约简,并根据各指标包含信息量的大小确定权重,构建了基于粗糙集理论的指标综合评价模型。
标签:指标评价;粗糙集;属性约简引言粗糙集(Rough set)是由波兰数学家Z.Pawlak于1982年提出的一种处理模糊、不确定信息的方法。
粗糙集理论把知识看做关于论域的划分,以不可分辨关系为基础,在保持分类能力不变的前提下,通过知识属性约简,导出问题的决策分类规则。
属性约简是指对知识库中冗余繁杂的信息进行精简,以较少的数据进行较多信息的表达,从而方便对数据的处理和分析。
根据其客观性和自身特点,其用在评价指标属性约简具有可行性,众多学者和专家们对该方法在各个领域运用的可行性方面进行了研究。
1 粗糙集理论1.1 信息表。
S=(U,R,V,f)表示为信息表,其中U是一个非空集合,称为论域,U={x1,x2,x3……xn},其中xi表示对象;R表示对象的属性集合,R=C∪D,即对象的属性集合是条件属性(C)和决策属性(D)的并集;V是属性值的集合,Va是属性a∈R的值域;f是U×R→V的一个信息函数,它为每个属性a赋予一个属性值,即a∈R,x∈U,fa(x)∈Va。
1.2 等价关系。
对于任意a∈A(A中包含一个或多个属性),A?R,x∈U,它们的属性值相同,即fa(x)=fa(y)成立,称对象x和y是对属性A的等价关系,表示为IND(A)={(x,y)|(x,y)∈U×U,?a∈A,fa(x)=fa(y)}。
1.3 等价类。
在U中,对属性集A中具有相同等价关系的元素集合称为等价关系IND(A)的等价类,表示为[x]A={y|(x,y)∈IND(A)}。
1.4 属性约简。
给定一个信息表IT(U,A),若有属性集B?A,且满足IND(B)=IND(A),称B为A的一个约简,记为red(A),即B=red(A)。
基于Pawlak的决策粗糙集的属性约简研究

0 引 言
决 策理 论 粗糙 集模 型 在 9 0年 代 初 提 出 , 是根 据 贝叶斯 的一组 损 失 函数 计 算 的。损 失 函数 可 以理 解
a n d i t s a n a l y s i s .
Ke y wo r d s :d e c i s i o n — t h e o r e t i c r o u g h s e t ;a t t ib r u t e r e d u c t i o n;l o s s f u n c t i o n
2 0 1 3年第 7期
文章编号 : 1 0 0 6 . 2 4 7 5 ( 2 0 1 3 ) 0 7 - 0 0 5 6 - 0 3
计 算 机 与 现 代 化 J I S U A N J I Y U X I A N D A I H U A
总第 2 1 5期
基于 P a w l a k的决 策 粗糙 集 的属性 约简 研 究
Re s e a r h o n At t r i b u t e Re d uc t i o n o f De c i s i o n— t he o r e t i c Ro u g h S e t Mo d e l Ba s e d o n Pa wl a k
韩丽丽 , 李 龙 澍
( 安徽大学计算机科 学与技术 学院, 安徽 合肥 2 3 0 6 0 1 )
摘要 : 粗 糙 集 用 于规 则 归 纳 时 , 其 正 域 规 则 和 边 界 规 则这 两种 不 同 的 分 类规 则会 导致 不 同 的 决 策 序 列 。 这 两 种 分 类规 则
都 能 够 从 语 法 和 语 义上 进 行 区分 , 并被 P a w l a k模 型 所 延 伸 的粗 糙 集 理 论 所 解 释 。 属 性 约 简是 粗 糙 集 理 论 的 一 个 重要 概 念, 本 文针 对 决 策 粗糙 集 中的 决 策 单 调 性 这 个 分 类 属 性 , 给 出属性 约 简 中基 于 正 域 约 简模 型 及 其 分 析 。 关键词 : 决 策 粗糙 集 ; 属性 约简 ; 损 失 函数 中图 分 类 号 : T P 3 1 2 文献标识码 : A d o i :1 0 . 3 9 6 9 / j . i s s n . 1 0 0 6 - 2 4 7 5 . 2 0 1 3 . 0 7 . 0 1 4
粗糙集理论的属性重要性评估方法及其实际应用

粗糙集理论的属性重要性评估方法及其实际应用引言:粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它在数据挖掘、模式识别和决策分析等领域中得到了广泛的应用。
在粗糙集理论中,属性重要性评估是一个重要的问题,它能够帮助我们识别出对决策结果具有重要影响的属性,从而提高决策的准确性和可靠性。
本文将介绍一种基于粗糙集理论的属性重要性评估方法,并探讨其在实际应用中的价值。
一、粗糙集理论概述粗糙集理论是由波兰学者Pawlak于1982年提出的,它是一种处理不确定性和模糊性问题的数学工具。
粗糙集理论通过将对象的属性进行划分,将属性值之间的差异进行模糊化处理,从而实现对不完备和不精确数据的分析和决策。
粗糙集理论的核心思想是近似和约简,即通过近似的方法对数据进行简化和压缩,从而提取出最重要的信息。
二、属性重要性评估方法在粗糙集理论中,属性重要性评估是一个关键问题。
属性重要性评估的目标是确定哪些属性对决策结果的影响最大,从而帮助我们进行决策和分析。
常用的属性重要性评估方法有正域、核和约简等方法。
1. 正域方法正域方法是一种基于粗糙集的属性重要性评估方法。
它通过计算属性在正域中的覆盖度来评估属性的重要性。
正域是指在给定条件下能够唯一确定决策结果的属性取值,它反映了属性对决策结果的贡献程度。
正域方法的优点是简单直观,容易理解和计算,但它没有考虑属性之间的依赖关系。
2. 核方法核方法是一种基于粗糙集的属性重要性评估方法。
它通过计算属性在核中的约简度来评估属性的重要性。
核是指在给定条件下能够唯一确定决策结果的最小属性集合,它反映了属性对决策结果的决定性影响。
核方法考虑了属性之间的依赖关系,能够更准确地评估属性的重要性,但计算复杂度较高。
3. 约简方法约简方法是一种基于粗糙集的属性重要性评估方法。
它通过对属性集合进行约简,得到一个最小的属性子集,从而实现对属性的重要性评估。
约简方法的优点是能够同时考虑属性之间的依赖关系和决策结果的覆盖度,能够更全面地评估属性的重要性。
属性约简

粗糙集的研究对象是一个数据集,数据集一般被保存为数据表格形式,即数据库或信息系统。
信息系统的形式是由研究对象和属性值关系构成的二维数据表,类似于基础数学中的关系数据库。
信息系统实现了粗糙集模型的知识表示。
定义 2.1.1[46] 设(,,,)S U A V f =为一个数据库,即信息系统,也称为知识表示系统。
其中12{,}U U x x x = 为一个非空的有限对象集,12{,,}A A a a a = 是属性的有限非空集合,a V V =⋃,a A ∈,a V 为属性a 的值域;定义信息函数:U V c a f A ⨯→ .例如表2.1.1是一个信息系统,其中12345{,,,,}U x x x x x =,1234{,,,}A a a a a =,123a a a V V V ==={0,1},4a V ={0,1,2}.表2.1.1 信息系统定义2.1.2[46] 对于a A ∀∈,x U ∀∈,(,)a f x a V ∈,对于P A ∀∅≠⊆,定义:{(,):(,)(,),}I x y U U f x q f y q q P =∈⨯=∀∈,I U 称为上的不可分辨关系。
(1)若(,)x y I ∈,则称:x y 和是不可分辨的。
(2)不可分辨关系是等价关系,具有:自反性:xIx ; 对称性:xIy yIx ⇒;传递性:,xIy yIz xIz ⇒ .(3) I 是U 上的一个等价关系,[]{,}I x y y U xIy =∈,12{[]}{,}I k U I x x U X X X =∈= ,12,k X X X 称为U 关于I 的一个划分。
(4)P I ∅≠⊆,1,2I I I ∈, 112{,}k U I X X X = ,212{,}l U I Y Y Y = ,12{,1,2,1,2}i j U I I X Y i k j l ⋂=⋂== ,()I Pind P I P ∈== ,则称:()ind P U 是上的一个等价关系,称为P 上的不可区分关系。
粗糙集理论的使用方法和步骤

粗糙集理论的使用方法和步骤粗糙集理论是一种用于处理不完全、不确定和模糊信息的数学工具,它在决策分析、数据挖掘和模式识别等领域具有广泛的应用。
本文将介绍粗糙集理论的使用方法和步骤,帮助读者更好地理解和应用这一理论。
一、粗糙集理论的基本概念粗糙集理论是由波兰学者Pawlak于1982年提出的,它的核心思想是通过对数据集进行粗糙化处理,找出数据集中的重要信息,从而进行决策和分析。
在粗糙集理论中,数据集由属性和决策组成,属性是描述对象的特征,决策是对对象进行分类或判断的结果。
二、粗糙集理论的步骤1. 数据预处理:在使用粗糙集理论之前,需要对原始数据进行预处理。
预处理包括数据清洗、数据变换和数据归一化等步骤,旨在提高数据的质量和可用性。
2. 属性约简:属性约简是粗糙集理论的核心步骤之一。
在属性约简过程中,需要根据属性的重要性对属性进行选择和优化。
常用的属性约简方法有基于信息熵的属性约简和基于模糊熵的属性约简等。
3. 决策规则的生成:在属性约简完成后,可以根据属性和决策之间的关系生成决策规则。
决策规则是对数据集中的决策进行描述和判断的规则,可以帮助决策者进行决策和分析。
4. 决策规则的评价:生成的决策规则需要进行评价和优化。
常用的决策规则评价方法有支持度和置信度等指标,通过对决策规则进行评价,可以提高决策的准确性和可靠性。
5. 决策与分析:最后一步是根据生成的决策规则进行决策和分析。
根据决策规则,可以对新的数据进行分类和判断,从而帮助决策者做出正确的决策。
三、粗糙集理论的应用案例粗糙集理论在实际应用中具有广泛的应用价值。
以电商平台为例,可以使用粗糙集理论对用户行为进行分析和预测。
首先,对用户的行为数据进行预处理,包括清洗和归一化等步骤。
然后,通过属性约简找出用户行为中的关键属性,如浏览时间、购买频率等。
接下来,根据属性和决策之间的关系生成决策规则,如用户购买商品的决策规则。
最后,根据生成的决策规则对新的用户行为进行分类和分析,从而提供个性化的推荐和服务。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
保正域的决策粗糙集属性约简黄国顺【摘要】针对决策粗糙集模型,分析了它的正域随条件属性删除时的变化特点,即当条件属性集变小时,决策粗糙集的正域不但会变大,而且可能保持不变或变小。
讨论了现有几种与正域相关的决策粗糙集属性约简定义的优缺点,在此基础上提出一种新的保正域不变的决策粗糙集属性约简。
计算实例发现,现有基于差别矩阵的决策粗糙集属性约简方法不能求到它的所有保正域约简。
上述研究结果说明,决策粗糙集模型与经典粗糙集模型的属性约简问题完全不同,因此不能简单地将经典粗糙集的方法平行推广到决策粗糙集模型上。
该文的结论为将来系统研究决策粗糙集模型中的属性约简问题提供了很好的小结和理论基础。
%For Decision-Theoretic Rough Set(DTRS)models, the positive region change rules are analyzed when remov-ing attributes from conditional attribute set. That is, the positive region not only may be larger, but also can be unchanged or smaller with respect to the decreasing of attributes. The existing attribute reducts related to positive regions in DTRS models are discussed and analyzed. Then a new type of positive region preservation attribute reduct in DTRS models is proposed. An example is given to show that the method based on discernibility matrix can’t get all of positive region pres-ervation reducts as in classical rough set models. It shows that the attribute reduct methods in classical rough set models are completely different from the ones in DTRS models and can’t extend the methods to DTRS parallelly. The results above give a summary and provide atheoretical basis for the attribute reduct research in DTRS models in the future.【期刊名称】《计算机工程与应用》【年(卷),期】2016(000)002【总页数】6页(P165-169,270)【关键词】决策粗糙集;属性约简;正域;差别矩阵【作者】黄国顺【作者单位】佛山科学技术学院理学院,广东佛山 528000【正文语种】中文【中图分类】TP18HUANG Guoshun.Computer Engineering and Applications,2016,52(2):165-169.决策粗糙集模型是经典粗糙集模型的一个概率推广[1-3],它通过引入两个阈值和条件概率,允许决策具有一定程度的误差。
在经典粗糙集模型中[4-5],Pawlak首先提出一种保正域不变的属性约简,并且可以证明保正域不变与保正域基数不变是等价的。
但在决策粗糙集模型中,由于决策区域和属性减少之间没有单调性[6-7],使得在经典粗糙集上适用的定义和方法在决策粗糙集上无效。
Yao和Zhao在详细讨论的基础上提出一种泛化形式的决策粗糙集属性约简定义,即满足某种度量性质的极小条件属性集合。
为了避开决策粗糙集属性约简的非单调性问题,国内外多位学者提出了各种约简办法,如LI等人提出的非单调属性约简[8],Jia等人提出的基于决策风险最小化的属性约简及其优化方法[9-10],Liao和Min等人提出的代价敏感属性约简[11],Ma和Wang等提出的保决策区域分布约简[12]等。
根据文献[6]的观点,决策粗糙集模型中的属性约简应该保持约简前后正规则不变,即约简前的正规则约简后仍然是正规则。
因此有学者提出正域或正域基数最大化的属性约简[7-8],但这样做是否合理呢?本文首先分析了决策粗糙集模型中正域随条件属性删除时的变化情况,然后分析了现有几种与正域相关的属性约简定义的优缺点,在此基础上提出一种保正域不变的决策粗糙集属性约简定义。
与经典粗糙集模型不同,现有基于差别矩阵的决策粗糙集约简方法不能求到它的所有保正域约简,因此不能简单地将经典粗糙集的方法和结论平行推广到决策粗糙集模型上。
由于求属性约简的过程即是删除一些不必要属性的过程,在删除冗余属性时会使得划分变粗,从而影响各个决策规则的可信度大小,最终导致决策区域发生变化。
一般地,在删除属性的过程中,高的可信度会变低,较低可信度会变高,即如下引理1。
引理1假设,那么对∀Dj∈πD,有证明由于,因此合并后所得规则[x]A→Dj的可信度为参与合并等价类[xi]C在 Dj上可信度的加权平均值,马上有结论成立。
根据定义2,(α,β)-正域仅要求存在某个Dj∈πD,使得Pr(Dj|[x]A)≥α。
根据引理1,即使是正域与正域中的等价类合并,合并后的等价类可能被划入负域或边界域或正域中。
具体算例见例1。
例1[9]给定如表1所示的决策表 S1,其中U={x1,x2,…,x9},C={c1,c2},D={d}。
记U/C={C1,C2,C3,C4},其中C1={x1,x4},C2={x2,x6,x8},C3={x3},C4={x5,x7,x9}。
U/D={D1,D2,D3},其中D1={x1,x2},D2={x3,x4,x5},D3={x6,x7,x8,x9}。
令A={c1},那么U/A={A1,A2},其中A1=C1∪C2,A2=C3∪C4。
若令α=0.6,β=0.5,那么POS(α,β)(πD|πC)=C2∪C3∪C4,NEG(α,β)(πD|πA)=U。
正域中的等价类C3,C4合并成A2后被划入负域,此时正域变小。
若令α=0.6,β=0.4,同样是等价类C3,C4合并成A2,但此时A2被划入边界域,此时正域变小。
若令α=0.5,β=0.3,同样是等价类C3,C4合并成A2,但此时A2被划入正域,此时正域不变。
类似地,当正域与边界域(负域)中的等价类合并,新得到的等价类也可能被划入正域、边界域或负域,从而使得在等价类合并过程中正域变大或变小。
因此在决策粗糙集模型中,当删除冗余属性时,正域不仅仅可能变大[8]、还有可能保持不变或变小。
而在经典粗糙集模型中,随着属性的删除,它的正域不可能变大,只会变小或不变,这是两种模型不同的地方。
本章先回顾几种与正域相关的决策粗糙集属性约简定义,然后提出一种新的保正域不变属性约简定义。
4.1 决策粗糙集属性约简泛化定义由于决策粗糙集的决策区域与属性减少之间没有单调性,Yao和Zhao在文献[6]给出一种决策粗糙集属性约简的泛化定义即满足某种性质的C的极小集合。
假设是从条件属性集的幂集到偏序集L的一个映射。
定义3[6]给定决策表DIS,0≤β<α≤1和度量性质集合E={e1,e2,…},称集合R⊆C是C的关于决策属性D的一个约简,当且仅当满足如下两个条件:(1)对。
(2)对任意的R′⊂R和任意的不成立。
其中度量属性集可以是决策单调性、泛化规模和决策风险等指标。
作者特别就上述三个指标展开讨论,强调如下几点:(1)约简前的非负决策规则,约简后应给予保留,特别是高可信度正规则约简后应该仍是正规则。
(2)约简后决策规则的覆盖范围至少不少于约简前决策规则的覆盖范围。
(3)约简后的代价不能超过约简前的代价,同时代价的减少不能改变原始决策,也不能以牺牲决策规则集的覆盖范围为代价。
4.2 基于正域基数的属性约简Li等在文献[8]提出一种基于正域基数的属性约简方法。
定义4[8]给定决策表 DIS,0≤β<α≤1,B⊆C是C的一个属性约简,如果满足以下两个条件:(1)(2)对任意由于定义4以集合基数而非集合本身参与比较,可能会产生如下几个问题:(1)由于只需要比较集合基数大小,而非集合本身,从而不能保证高可信度正规则在属性约简后仍是正规则。
(2)由于正域依赖于阈值α的值,如果α取值较小(此时仍满足0≤β<α≤1),很容易有POS(α,β)(πD|πC)=U,最终也会导致每个单列属性都是约简集。
考察文献[7]的算例。
例2[7]给定表2的决策表S2,U={x1,x2,…,x9},C= {c1,c2,c3,c4,c5,c6},D={d}。
记U/D={D1,D2,D3},其中D1={x1,x2},D2={x3,x4,x5},D3={x6,x7,x8,x9}。
取α=0.75,那么POS(α,β)(πD|πC)= {x1,x3,x4,x7},令R={c5},那么POS(α,β)(πD|πR)={x3,x4,x5, x9},虽然,但POS(α,β)(πD|πC)≠POS(α,β)(πD|πR),对于约简前的确定性正规则[x1]C→D1在属性约简后消失了。
虽然允许误差,也允许属性约简前后正规则可信度可以不相等,但希望约简前的确定性正规则在约简后还是应该保留,定义4显然保证不了这点。
4.3 一种保正域的属性约简在文献[7]中,Zhao提出一种保正域的属性约简。
定义5[7]给定决策表DIS,0≤β<α≤1,R⊆C,如果,那么称集合R是C的关于决策属性D的一个保正域约简。
在某些情况下,该定义可放松为:(1)(2)对任意根据定义5,保正域属性约简R希望得到一个局部最大的正域,这样做在约去一些条件属性后似乎能保留正规则,从而是合理的,但由于扩大了正域,从而必将约简前可信度低的边界域或负域在约简后将其划入正域中,势必增加决策风险。
例3[9]例1续)取α=0.75,β=0.6,此时有。
在删除属性集{c1,c3,c4, c6}后,一方面有但另一方面它将原始决策表的边界域对象{x2,x6,x8}划入正域中,从而增加了决策风险。
4.4 一种新的保正域不变属性约简根据前面的讨论,本节提出一种新的决策粗糙集属性约简定义。
与Zhao的方法不同,不允许正域无限制扩大,即不是正域越大越好,因为这样做可能会在扩大正域的同时增加决策风险。