粗糙集属性约简matlab程序

合集下载

r语言粗糙集算法 -回复

r语言粗糙集算法-回复R语言中的粗糙集算法（Rough Set Algorithm）是一种数据挖掘和知识发现的工具，可用于处理不完整、模糊和不确定的数据。

它源于粗糙集理论，该理论由波兰学者Zdzisław Pawlak在20世纪80年代提出，并被广泛应用于决策支持系统、特征选择、模式识别和数据挖掘等领域。

粗糙集算法主要基于两个重要概念：决策表和约简。

决策表是数据集的一种特殊形式，由决策属性、条件属性和属性值组成。

决策属性表示待分类对象的结果，而条件属性表示影响决策结果的因素。

而约简是为了避免属性冗余和信息冗余，将决策表简化为更简洁的形式。

下面将详细介绍R语言中的粗糙集算法的实现步骤。

第一步是数据预处理。

R语言提供了许多函数和包用于数据预处理，例如读取数据、数据清洗、特征选择和标准化等。

在粗糙集算法中，数据通常以矩阵或数据框的形式出现，其中每一行代表一个样本，每一列代表一个属性。

第二步是属性约简。

属性约简是粗糙集算法中的核心步骤，目的是从原始数据中选择出具有最小决策集的属性子集。

在R语言中，可以使用现有的函数和包来实现这一步骤，例如ROUGH或coreHunter包。

这些包提供了实现不同约简算法的函数，如正域约简和最大极小约简等。

第三步是决策规则的生成。

在粗糙集算法中，决策规则是用于解释数据集中复杂决策过程的规则。

R语言提供了许多函数和包用于决策规则的生成，如ruleInduction包和RWeka包。

这些包提供了实现不同决策规则生成算法的函数，例如朴素贝叶斯算法和决策树算法等。

第四步是模型评估。

在粗糙集算法中，模型评估是对生成的决策规则进行性能评估和优化的过程。

R语言提供了许多函数和包用于模型评估，如ROCR包和caret包。

这些包提供了实现不同评估指标和交叉验证等技术的函数，如准确率、召回率和F1值等。

第五步是模型应用和结果解释。

在粗糙集算法中，模型应用和结果解释是最终的步骤，用于将生成的决策规则应用于新的数据集，并解释其结果。

使用粗糙集理论进行数据分类的步骤详解

使用粗糙集理论进行数据分类的步骤详解数据分类是数据挖掘领域中的一个重要任务，它可以帮助我们从大量的数据中发现隐藏的规律和模式。

粗糙集理论是一种常用的数据分类方法，它基于信息不完全和不确定的原则，能够处理不完备和模糊的数据。

本文将详细介绍使用粗糙集理论进行数据分类的步骤。

第一步：数据预处理在进行数据分类之前，我们需要对原始数据进行预处理。

预处理包括数据清洗、数据集成、数据变换和数据规约等步骤。

数据清洗是指去除数据中的噪声和异常值，以保证数据的质量。

数据集成是将多个数据源的数据进行整合，以便于后续的分析和处理。

数据变换是将原始数据进行转换，以适应分类算法的要求。

数据规约是对数据进行简化，以减少数据的复杂性。

第二步：属性约简属性约简是粗糙集理论的核心内容之一。

它的目的是通过删除冗余和无关的属性，提取出最具有分类能力的属性子集。

属性约简可以帮助我们减少计算复杂度，并提高分类的准确性。

属性约简的方法有很多种，常用的有基于信息增益和基于近似的方法。

基于信息增益的方法是通过计算属性对分类结果的贡献程度，选择出对分类最有用的属性。

基于近似的方法是通过计算属性之间的关系，选择出具有最小冗余的属性子集。

第三步：确定决策规则在属性约简之后，我们需要根据属性子集来确定决策规则。

决策规则是一种描述数据分类的模式，它由条件属性和决策属性组成。

条件属性是用来描述分类对象的特征，决策属性是用来描述分类结果的特征。

决策规则可以帮助我们理解数据分类的过程，并为后续的分类任务提供指导。

确定决策规则的方法有很多种，常用的有基于频率和基于覆盖度的方法。

基于频率的方法是通过计算属性子集在数据集中的出现频率，选择出频繁出现的属性子集作为决策规则。

基于覆盖度的方法是通过计算属性子集对数据集的覆盖程度，选择出覆盖度最高的属性子集作为决策规则。

第四步：分类预测在确定决策规则之后，我们可以使用这些规则对新的数据进行分类预测。

分类预测是根据新的数据的条件属性，通过匹配决策规则，得到新数据的决策属性。

基于变精度粗糙集的属性约简

摘要：性约简是粗糙集理论的核心内容之一。对变精度粗糙集理论的属性约简问题，属性依赖度增量、信属针从互息增量角度对属性重要度进行分析，以这两个属性重要度的度量作为启发式信息。出变精度粗糙集属性约简的并给
其中ｆｆ表示集合的基数。称ＰＸ，）（ｌ为集合于集，关
合ｙ的相对错误分类率。即如果将集合中的无素分到集合ｙ
糙集模型中引入了错误分类率１ｏ３０５的概念，出了变精３ ≤１．（＜）提度粗糙集模型。后来， Ⅳ等人将定义为正确分类率且卢∈ （．，１模型是Ｐｗａ粗糙集模型的扩充。当０，０５１。该ａｌｋ＝时变精度
Ｒｕ｛／ห้องสมุดไป่ตู้ ＝ ∈ＵＲｆＥ１｝
ＢＲ＝．Ｅ∈ＵＲｌ＜ＰＪ１ＢｊＮ‘ ｔＪ｛／卢Ｊ＜－ＮＧ￣＝ｕ｛／ＰＥｘ）－ＥＲｘＥＥＵＲ１ｆ， ≥１￣）
的下近似可理解为将中的对象以不大于的分类误差分于的集合；的区域相应理解为将中的对象以不大于Ｊ负Ｂ的分类误差分于的补集（）的集合。显然，于任意 ∈ ；对ｐｓＸ＝ＥＧｏ－；３界域是由那些以不大于Ｊ的分类误ｏＰＮＲ（Ｘ）的／边Ｂ
差既不能分类于～又不能分类于～的Ｕ对象所构成的集合。中如果Ｂａｄ，ｌｏｒ＿ⅣＥ＝的卢近似是由那些以ＮＲＸ＝ｐ￥ｐｓＸｔＧＪＳＪ；上

基于相似关系粗糙集模型的数值属性约简算法

衡量属性在样本上的差异性和相似性。以这种属性度量指标为启发式设计了相似关系粗糙集框架下的数值属性约
简算法，并推广到经典粗糙集。在车牌字符集和ＵＩ写体数字字符集上和常用约简算法进行了比较，Ｃ手实验结果显示这种方法产生的约简属性可以导出规则数少并且具有较好分类能力的规则集。
念的粒化。下面定义实数空间中的差异性度量。
定义１论域中任意两个样本ｔ，（ ≠ ）在数值属性。ｔｉｊ
上的相对差异性为：ｄ＝㈩
识别的文献使用粗糙集属性约简方法，删除冗余属性，搜索分辨力高的属性集合，然后利用约简的属性集构成分类器Ｊ。
关键词：字符识别；糙集；性约简；征选择；似关系；值属性粗属特相数
中图分类号：Ｐ９Ｔ３１
文献标志码：Ａ
Ａｌｏｉｈｆｎｇｒｔｍｏｕｍｅｉａｔｒｂｅｅｕｃｉｎｂａｅｎｓｍｉａｉｙｒｕｇｅｒｃｌａｔｉｕｔｓｒｄｔｏｓｄｏｉｌｒｔｏｈｓｔ
ｃｎｔｕｔｄｂｓｄｏｉｌｒｔｏｈｓｔｍｏｌａｄｉｗａｘｅｄｄｔａｎｃｏｈｓｔｔｏ．Ｅｘｅｉｎｔｒａｒｅｕｏｓｒｃｅａｅｎｓｍｉａｙｒｕｇｅｄｅ，ｎｔｓｅｔｎｅｏｃｎｏｉａｒｕｇｅｏｉｌｐｒｍｅｓｗｅｅｃｒｉｄｏｔｏｗｏｄａａｓｔ，ｏｓｏｉｅｓａｅｃａａｔｒｎｈｔｅｓｏｎｔｔｅｓｎｅｉｆｌｃｎｅｐｌｔｈｒｃｅｓａｄｔｅｏｈｒｉｆＵＣＩｈｎｄｉｔｎｎｍｂｒｔｅｅｐｒｍｅｔｌｒｓｔｈｗａｗｒｔｅｕｅ，ｈｘｅｉｎａｅｕｌｓｓｏｔａｈｒｐｓｄａｇｒｔｍａｅｅａｅｓｍｐｌｒｂｒｏｒｕｕｌｓｓｔｔａｔｒｒｄｕｔｏｇｒｔｍｓｈｔｔｅｐｏｏｅｌｏｈｃｎｇｎｒｔｉｅｕｔｍｏｅｐｗｅｌｒｅｅｈｎｏｈｅｅｃｉｎａｏｈ．ｉｆｌｉＫｅｙｗｏｒｓｃｒｃｅｓｅｏｉｉｎｒｕｇｓｔａｔｂｔｓｅｕｃｉｎ；ｆａｕｅｅｅｔｎ；ｓｍｉａｉｙｅａｉｎｎｍｅｉａｄ：ｈａａｔｒｒｃｇｔｏ；ｏｈｅ；ｔｕｅｒｄｔｏｎｉｒｅｔｒｓｌｃｉｏｉｌｒｔｒｌｔｏ；ｕｒｃｌａｔｉｔｔｒｂｕｅ

基于粗糙集的属性约简算法

第２２卷
ａ＝表示不包含条件属性ａ，ａ＝１０而表示包含条件属性ａ。如果要识别所有决策不同的记录，ａ（＝１２ …，）则ｉ，，与（＝１２ … ，之中必然至少各有一个条件属性不能，，）被删除，否则新决策表将与原决策表具有不同的不科技开发项目（０１３）２４３５０作者简介：赵青杉（９２，山西五台，州师范学院计算机系讲师，１７一）男，人忻从事数据挖掘、集理论研究。粗糙
维普资讯
忻州师范学院学报
ｘ关于Ｒ的下近似集是Ｕ中根据已有知识判断必定属于Ｘ的对象所组成的最大集合，＝Ｕ｛ ∈ ＵＲ１即』ｙ／ｙ∈Ｘ｝
定义２设ＲＣ称Ｒ为Ｃ的Ｄ一：约简当且仅当Ｒ是Ｃ
属性组合以布尔值表示其中是否包含某个条件属性。比如
收稿日期：０６１５２００ —０
的最小约简是ＮＰ—ｈｒａｄ问题。解决这类问题的方法一般
的值， “ 是 “ Ｄ（）在属性Ｄ上的值，可识别矩阵记为：
ｆａ∈ Ａ：（１ ≠ ａ “ ）Ｄ（ ≠ Ｄ（，ａ “）（，， “） “）
是启发式搜索，进而获得最优解或近似最优解。本文研究了可辨识矩阵的约简，从属性依赖度角度给出
粗糙集理论是波兰数学家ＺＰｗｌ．ａａｋ在２０世纪８ｏ年代初首先提出的一种可以分析模糊和不确定问题的数学理
定义３Ｃ的所有必要属性组成的集合称为Ｃ的核，：记
为 ∞ ＲＣ）它是Ｃ的所有约简的交，ＣＲＥ（＝ｎＥ（，即ＯＣ）ＲＤ（，中ＲＤ（表示的约简。ＥＣ）其ＥＣ）三、基于可识别矩阵的约简方法可辨识矩阵由华沙大学数学家￣ｏｏ出，ｗｒｎ提定义为系统Ｓ＝（Ａ）Ｕ＝｛１ “ ， “ ｝ａ（） “在属性ａ上Ｕ，， “ ，２… ， “ 是

基于粗糙集的属性约简方法在指标筛选中的应用

基于粗糙集的属性约简方法在指标筛选中的应用张朝阳;赵涛;王春红【摘要】建立一套科学、系统的指标体系是进行综合评价的重要前提.从目前来看,指标体系的建立和筛选尚没有统一规范的标准和方法.传统评价方法主观性强,客观性差;统计方法需要大量的样本,而且很多时候大量的样本是不可获得的.文章提出基于粗糙集的指标约简方法,并以企业产品创新能力评价指标约简为例进行验证,得出该方法的应用特点和优势.【期刊名称】《科技管理研究》【年(卷),期】2009(029)001【总页数】3页(P78-79,85)【关键词】粗糙集;属性约简;指标筛选;产品创新【作者】张朝阳;赵涛;王春红【作者单位】天津大学,管理学院,天津,300072;天津大学,管理学院,天津,300072;天津大学,管理学院,天津,300072【正文语种】中文【中图分类】F272.5综合评价是管理学的热点、难点问题之一。

所谓综合评价(comprehensive evaluation)，是指对以多属性体系结构描述的对象作出全局性、整体性的评价。

综合评价的前提是确定评价指标体系，即采用哪些指标进行综合评价。

由于影响评价有效性的因素很多，评价的对象系统也往往是社会、经济、科技、教育、环境和管理等一些复杂系统，但并非评价指标越多越好，关键在于所选评价指标是否恰当。

指标的遗漏会影响评价结果，指标间信息的重迭一般会夸大评价结果，这些都会导致人们对多指标综合评价的必要性、准确性产生怀疑。

问题是如何通过科学的指标筛选来保证综合评价结果的可靠性[1]。

从目前的情况来看，指标体系的建立和筛选尚没有统一规范的标准和方法，大多数学者根据自己的经验，按照一定原则确定指标体系，主观性强，容易出现偏差。

采用德尔菲法、层次分析法、模糊评价法等方法也同样很难避免主观性带来的弊端；应用主成分分析、后向回归分析等统计方法则需要大量的样本，而很多时候大量的样本是不可获得的。

本文提出基于粗糙集的指标约简方法，并以企业产品创新能力评价指标约简为例进行验证。

基于粗糙集的属性约简算法概要

基于粗糙集的属性约简算法夏春艳 1李树平 2刘世勇 3牡丹江师范学院计算机科学与技术系,黑龙江省牡丹江市 157012The Approach for Attributes Reduction Based on Rough Set TheoryAbstract :This paper researches attributes reduction of Rough Set Theory. Put forward a heuristic attribute reduction algorithm based on the table of compatibility information and incompatible information at same time. The experimental results show that the algorithm is verified to be more feasible and effective.Key words: Rough Set Attribute Reduction Attribute dependencies摘要:本文主要研究基于粗糙集理论的属性约简算法。

提出了一种同时适合于相容信息表和不相容信息表的启发式约简算法,并通过算例验证了该算法的可行性和有效性。

关键词:粗糙集属性约简属性依赖度中图分类号:TP311 文献标识码:A0 引言粗糙集理论是由波兰华沙理工大学 Z.Pawlak 教授在 1982年提出的, 是一种研究不精确、不确定性知识的数学工具 [1]。

该理论已经在数据挖掘、机器学习、过程控制、决策分析和模式识别等领域得到了广泛的应用, 并取得了良好的效果。

属性约简就是在保持分类能力不变的前提下, 通过对知识的化简导出问题的决策或分类规则, 是粗糙集理论中的一个重要研究课题 [2]。

它的意义在于可以删除冗余信息,形成精简的规则库以便人们 (或者机器人作出快速、准确的决策。

基于粗糙集理论的评价指标属性约简

基于粗糙集理论的评价指标属性约简摘要：粗糙集理论是一种对数据进行约简的有效工具。

文章运用粗糙集理论对评价指标进行了属性约简，并根据各指标包含信息量的大小确定权重，构建了基于粗糙集理论的指标综合评价模型。

标签：指标评价;粗糙集;属性约简引言粗糙集（Rough set）是由波兰数学家Z.Pawlak于1982年提出的一种处理模糊、不确定信息的方法。

粗糙集理论把知识看做关于论域的划分，以不可分辨关系为基础，在保持分类能力不变的前提下，通过知识属性约简，导出问题的决策分类规则。

属性约简是指对知识库中冗余繁杂的信息进行精简，以较少的数据进行较多信息的表达，从而方便对数据的处理和分析。

根据其客观性和自身特点，其用在评价指标属性约简具有可行性，众多学者和专家们对该方法在各个领域运用的可行性方面进行了研究。

1 粗糙集理论1.1 信息表。

S=（U，R，V，f）表示为信息表，其中U是一个非空集合，称为论域，U={x1，x2，x3……xn}，其中xi表示对象;R表示对象的属性集合，R=C∪D，即对象的属性集合是条件属性（C）和决策属性（D）的并集;V是属性值的集合，Va是属性a∈R的值域;f是U×R→V的一个信息函数，它为每个属性a赋予一个属性值，即a∈R，x∈U，fa（x）∈Va。

1.2 等价关系。

对于任意a∈A（A中包含一个或多个属性），A?R，x∈U，它们的属性值相同，即fa（x）=fa（y）成立，称对象x和y是对属性A的等价关系，表示为IND（A）={（x，y）|（x，y）∈U×U，?a∈A，fa（x）=fa（y）}。

1.3 等价类。

在U中，对属性集A中具有相同等价关系的元素集合称为等价关系IND（A）的等价类，表示为[x]A={y|（x，y）∈IND（A）}。

1.4 属性约简。

给定一个信息表IT（U，A），若有属性集B?A，且满足IND（B）=IND（A），称B为A的一个约简，记为red（A），即B=red（A）。

粗糙集多目标并行属性约简算法

粗糙集多目标并行属性约简算法危前进;魏继鹏;古天龙;常亮;文益民【期刊名称】《软件学报》【年(卷),期】2022(33)7【摘要】粗糙集理论(RST)中,求解最小属性约简MAR(minimal attribute reduction)是一种NP-难(non-deterministic polynomial hard)组合优化问题.蚁群优化算法ACO(ant colony optimization)是进化算法中的一种启发式全局优化算法,粗糙集理论与ACO相结合,是求解属性约简的一种有效、可行的方式.针对蚁群优化算法易于陷入局部最优解、收敛速度慢等问题,首先以一种改进的信息增益率作为启发信息,提出了冗余检测机制,对每个被选属性和每代最优约简集合进行冗余检测,并提出了概率提前计算机制,可避免每只蚂蚁在搜索过程中相同路径上的信息反复计算;针对大数据集的属性约简问题,考虑到蚁群优化算法具有并行能力以及粗糙集中“等价类”计算的可并行性,提出一种将ACO与云计算相结合用于求解大数据集的属性约简算法,在此基础上,进一步提出一种多目标并行求解方案.该方案可以同时计算出其余属性相对于当前属性或约简集合的重要度.实验结果表明,该算法在处理大数据的情况下能够得到最小属性约简,计算属性重要度的时间复杂度由O(n^(2))降至O(|n|).【总页数】19页(P2599-2617)【作者】危前进;魏继鹏;古天龙;常亮;文益民【作者单位】广西可信软件重点实验室(桂林电子科技大学);桂林电子科技大学计算机与信息安全学院【正文语种】中文【中图分类】TP18【相关文献】1.并行遗传算法在粗糙集属性约简中的应用2.一种基于聚类划分的并行粗糙集属性值约简算法3.一种基于粗糙集理论的快速并行属性约简算法4.一种基于并行遗传算法的粗糙集属性约简5.并行PSO结合粗糙集的大数据属性约简算法因版权原因，仅展示原文概要，查看原文内容请购买。

杂合数据的粗糙集属性约简方法

ｓＣｅｓｎｈｏｇｅｅｐｉｓｏｅｕｐｒａｄｌｗｒｓｌｒｄｓｉｕｏｔｘｓｆｕｄｏｏｄｔｎａｔｂｔｓａｄｄｃｓｎａｒｕｅｕＣｓｉ，ｔｒｕｈｄｓｒｔｎｆｔｐｎｅｉａｉｔｂｔｎｍａｅｎｎｃｎｉｏｔｕｅｎｅｉｏｔｉｔ，ｏｉｏｈｅｏｍｉｒｉｉｒｏｉｉｒｉｔｂ
ｏｔｎｒｓｎｂｅｏａｔｏｓａｏｇｏｊｔｈｔｉｔｎｍｏｅｆｒｈｌａｃｕｔｇｉｐｅｅｔ．ｈｎａｅｎｔｐｅｂｉｅｏａｌｓｆｐｒｎｎｅｓｅｏｉｚｉｄｌｏｔｅｏｃｏｎｎｒｎｅＴｅ，ｂｓｄｏｅｕｐｒａａｔｉｉｔｍｂｃ，ｔｐｍａｏｒｈｓｄｉｓｓｄｈａｄｌｅａｐｘａｏｎｅｔｒｕｈｓｔｅｒ．ｈｖｒｇｕｐｒａｄｌｅｍｌａｔｏｓａｏｇｏｊｔａｏｔｎ．ｎｎｗｒｐｒｉｔｎｃｃｐｆｍｒｇｏｔｃｅｎｐｅｎｗｒｉｉｒｒｔｎｍｎｂｃｂｉｅＩｏｏｍｉｏｏｏｅｔｙｅｏｉｈｏｓａｐｉｉｅｓａｄ
ｔｅｔｏａｔｂｔｒｄｃｏｓ１ｆｉｅｅｔｉｏｎｓｃｎｂｔｅｅｔｉｖｌ，ｂｓｄＯｅｎ－ｉｔｂｔｎｍａｘｓｉａｌ，ｔｅｈｔｉｕｅｅｕｔｎｒｕｔｏｄｆｒｎｅｉｔａｅｒｒｖｉｕｔｅｙａｅＮｔｍｘｄｓ／ｕｏｔｅ．Ｆｎｌｗｒｉｓｖｗｐｅｉｄｎｉｈｒｉｉｒｙｈｅｐｒｅｒｕｔｐｏｅｔａｉａｏｔｍｓｅｅｔｅａｄｆａｉｌ．ｘｉｍｓｌｒｖｈｔｈｓｌｒｈｉｆｃｖｓｂｅｅｍｅｓｔｇｉｉｎｅ

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

粗糙集属性约简matlab程序
(总3页)

-CAL-FENGHAI.-(YICAI)-Company One1
-CAL-本页仅作为文档封面，使用请直接删除
粗糙集-属性约简-matlab程序
Data2为条件属性， decision2为决策属性
%%%my_test函数实现
clc;
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%读取信息系统文件
file = textread('data2.txt','%s','delimiter','\n','whitespace',''); %读取文件信息，每一行为
一个胞元
[m,n]=size(file); %胞元的大小
for i=1:m
words=strread(file{i},'%s','delimiter',' ');%读取每个胞元中字符，即分解胞元为新的胞元
words=words';%转置
X{i}=words;
end
X=X';
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
[B,num,AT]=my_reduct(X); %信息系统的约简
ind_AT=ind(X); %信息系统的不可等价关系
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%显示约简信息系统
disp('约简后的条件系统为：');
[m,n]=size(B);
for i=1:m
disp(B{i});
end
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%读取决策系统文件
file = textread('decision2.txt','%s','delimiter','\n','whitespace','');
[m,n]=size(file);
for i=1:m
words=strread(file{i},'%s','delimiter',' ');
words=words';
D{i}=words;
end
D=D';
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%决策系统的正域约简
X_D=X;
[l,k]=size(X_D{1});
pos_d=pos(X_D,D);%正域
for i=1:m %%%%%%%%%%%%%%正域有问题%%%%%%%%%%%%%%%%%%%%%%%%%%%
if(~ismember(num(i),pos_d))
B{i}=''; %若约简后的信息系统B{i}不在正域中则删除该行
end %因为相同的条件得到的决策不一样，
end
%将在正域规则下约简过的信息系统B连接决策系统D
[m,n]=size(B);
for i=1:m
if(~isequal(B{i},''))
B{i}{1,k+1}=D{i}{1};
end
end
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%显示约简决策系统
disp('约简后的决策系统为：');
[m,n]=size(B);
for i=1:m
disp(B{i});
end
--------------------------------------------------------------------------------
%%%%%my_reduct函数实现
function [C,num,reduct_attr]=my_reduct(X)
%%%%%y为约简后的cell数组，reduct_attr为可约去的属性
%X为行向量（元素为胞元）
clc;
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%约简
[m,n]=size(X);
[p,k]=size(X{1});
ind_AT=ind(X);%寻找不可等价关系
reduct_attr=[]; %可约去的的属性
num=zeros(m,1);%约简后的信息对应的个体
for i=1:k
B=delete_AT(X,i);
if(isequal(ind_AT,ind(B))) %若IND(AT-{a}=IND(AT)
reduct_attr=union(reduct_attr,i); %则寻找到可约去的属性
X=B;
end
end
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%剔除重复的行
k=1;
for i=1:m
if(~isequal(ind_AT{i},[]))
C_i=ind_AT{i,1}(1);
num(k)=i;
C{k,1}=X{C_i}; %返回约简后的信息系统
k=k+1;
end
end
--------------------------------------------------------------------------------
%%%%%ind函数实现
function yy=ind(X) %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%寻找不可分辨关系
[m,n]=size(X);
k=1;
ind_AT=cell(m,1);
for i=1:m
for j=(i+1):m %潜在问题，如i=m是终止循环，此时若最后一行不为空的话，将漏扫
if(~isequal(X{i},'')) %若X{i}不为空
ind_AT{k}=union(ind_AT{k},i); %不可等价关系赋初值
if(isequal(X{i},X{j}))
X{j}=''; %若X{i}==X{j},则删除X{j}
ind_AT{k}=union(ind_AT{k},j); %寻找不可等价关系
end
end
end
k=k+1;
end
--------------------------------------------------------------------------------
%%%delete_AT函数的源代码
function y=delete_AT(X,ATi) % 删除X中第i列的属性值
[m,n]=size(X);
[l,k]=size(X{1});
for i=1:m
X{i}{ATi}='';
end
y=X;
--------------------------------------------------------------------------------
%%%%%pos函数实现
function pos_d=pos(X,D)%求决策系统的正域函数
%X为条件属性，D为决策属性
ind_D=ind(D); %求决策属性D的不可等价关系
[m,n]=size(ind_D);
ind_X=ind(X); %求信息系统属性X的不可等价关系
low=[]; %存储正域个体的编号
for i=1:m
for j=1:m
if(~isequal(ind_X{i},[])&&~isequal(ind_D{j},[]))
if(ismember(ind_X{i},ind_D{j}))
low=union(low,ind_X{i});%由性质Pos_AT(d)=low_AT(X1)Ulow_AT(X2)U...
end
end
end
end
pos_d=low;