结合模糊集理论的粗糙集属性约简算法
粗糙集理论的基本原理与模型构建

粗糙集理论的基本原理与模型构建粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它在信息科学、数据挖掘和人工智能等领域具有广泛的应用。
本文将介绍粗糙集理论的基本原理和模型构建方法。
一、粗糙集理论的基本原理粗糙集理论最早由波兰学者Pawlak于1982年提出,它是基于集合论和近似推理的一种数学模型。
粗糙集理论的核心思想是通过对数据集进行分析,找出数据之间的关联和规律,从而进行决策和推理。
粗糙集理论的基本原理包括下近似和上近似。
下近似是指在给定条件下,能够包含所有满足条件的对象的最小集合;上近似是指在给定条件下,能够包含所有满足条件的对象的最大集合。
通过下近似和上近似的计算,可以得到粗糙集的边界区域,进而进行数据分类、决策和模式识别等任务。
二、粗糙集模型的构建方法粗糙集模型的构建方法主要包括属性约简和决策规则提取两个步骤。
属性约简是指从原始数据集中选择出最具代表性和决策能力的属性子集。
属性约简的目标是减少属性的数量,同时保持原始数据集的决策能力。
常用的属性约简方法包括正域约简、核约简和快速约简等。
这些方法通过计算属性的重要性和相关性,从而选择出最优的属性子集。
决策规则提取是指从属性约简后的数据集中提取出具有决策能力的规则。
决策规则是一种描述数据之间关系的形式化表示,它可以用于数据分类、决策和模式识别等任务。
决策规则提取的方法包括基于规则的决策树、基于规则的神经网络和基于规则的关联规则等。
三、粗糙集理论的应用领域粗糙集理论在信息科学、数据挖掘和人工智能等领域具有广泛的应用。
它可以用于数据预处理、特征选择、数据分类和模式识别等任务。
在数据预处理方面,粗糙集理论可以帮助我们对原始数据进行清洗和转换,从而提高数据的质量和可用性。
通过对数据集进行属性约简和决策规则提取,可以减少数据集的维度和复杂度,提高数据挖掘和决策分析的效率和准确性。
在特征选择方面,粗糙集理论可以帮助我们选择出最具代表性和决策能力的属性子集。
粗糙集理论介绍

问题的提出:知识的含糊性
术语的模糊性,如高矮 数据的不确定性,如噪声 知识自身的不确定性,如规则的前后件间的 依赖关系不完全可靠 不完备性,数据缺失
由此,提出了包括
概率与统计、证据理论:理论上还难以令人信服,
不能处理模糊和不完整的数据
模糊集合理论:能处理模糊类数据,但要提供隶属
函数(先验知识)
so
例2: (表2)
R1(颜色) R2(形状) R3(体积) class
X1
红
圆形
小
1
X2
蓝
方形
大
1
X3
红
三角形
小
1
X4
蓝
三角形
小
1
X5
黄
圆形
小
2
X6
黄
方形
小
2
X7
红
三角形
大
2
X8
黄
三角形
大
2
等价类IND(R1)={{x1,x3,x7}, {x2,x4}, {x5,x6,x8}}
X={X1,X2,X3,X4}
Step2. 针对各个属性下的初等集合寻找下近似和上近似。
以“头疼+肌肉痛+体温”为例,设集合X为患流感的 人的集合,I为3个属性构成的一个等效关系: {p1},{p2,p5},{p3},{p4},{p6}, 则
X={P1,P2,P3,P6} I={{p1},{p2,p5},{p3},{p4},{p6}}
粗糙集在数据挖掘中的应用 基于粗糙集的数据约简
返回
1. 粗糙集在数据挖掘中的应用
粗糙集对不精确概念的描述是通过上、下近似这两 个精确概念来表示的。
粗糙集理论的的数学基础:假定所研 究的每一个对象都涉及到一些信息(数据、 知识),如果对象由相同的信息描述,那 么它们就是相似的或不可区分的。
基于粗糙集理论的属性约简算法的实现

Jn o 6 u e2 0
基 于 粗糙 集 理 论 的属 性约 简算 法 的 实现
张冬 玲
( 州边 防指挥 学校 教 育技 术 中心 , 东 广 州 5 0 6 ) 广 广 16 3
(dig 16 tm zl @ 2 .o ) n
摘
要 : 属性 约 简算 法的 实现进 行讨 论研 究 , 用数 学 中的 一 些运 算规 律 , 计 算机 上 实现 布 对 利 在
尔代数 的运算 。 最后 , 结合 实 际的研 究课 题 , 通过 运行程 序 , 某些数据 表 实现 属性 约 简。 对 关键 词 : 糙 集 ; 别矩 阵 ; 粗 差 差别 函数 ; 属性 约 简; 增量算 法
中图分类 号 : P l .3 T 3 1 1 文献标 识 码 : A
n×( n一1 / 。 )2
r
约简通常是不 唯一的 。 一个数 据集的所有约简 可以通过 构造差别矩阵 , 由差别矩 阵导 出差别 函数并对其化简而得到。 2 1 差别矩阵 与属性约筒 . 根据差别矩 阵的概念 , 阵元 素与属性约 简存 在着 下列 矩
关系
(, 2 )
,f 属于相同决策属性类
x 属于不 同决策属性类 j
1 粗糙 集理论 的相关概念
粗糙 集理论是研究不完 整数据 及不精 确知识 的表达 、 学
2 利用差别矩 阵的属 性约简
当前 , 息系统 中信 息膨胀 主 要有 两个方 向 : 向和纵 信 横 向。 向指切是属性字段 的不 断增 加 , 横 纵向指的是记 录数的增 加。 在粗糙集 中对于信息 系统 横向的约 简可 以称之 为属 性约 简 , 向的约简可 以认为是值约简 。 纵 随着数据库 系统 中数据的 不断增加 , 属性 的约简相对于值 的约简变得更加有效。 如果某 个条件属 性被去除后仍 有相 同的等 价关系的话 , 么这个 条 那 件属性便 是 可省 的 。 这样 将 大大 简化 数据库 结 构的复 杂 度, 提高人们对隐含在数 据库 庞大数据 量下的各种信息 的认 识程度 , 因此属性约简也 就成为 了 目前粗糙 集理论 的研究 热
粗糙集理论的使用方法与步骤详解

粗糙集理论的使用方法与步骤详解引言:粗糙集理论是一种用来处理不确定性和模糊性问题的数学工具,它在数据分析和决策支持系统中得到了广泛的应用。
本文将详细介绍粗糙集理论的使用方法与步骤,帮助读者更好地理解和应用这一理论。
一、粗糙集理论概述粗糙集理论是由波兰学者Pawlak于1982年提出的,它是一种基于近似和粗糙程度的数学理论。
粗糙集理论的核心思想是通过对属性间的关系进行分析,识别出数据集中的重要特征和规律。
它主要包括近似集、正域、决策表等概念。
二、粗糙集理论的使用方法1. 数据预处理在使用粗糙集理论之前,首先需要对原始数据进行预处理。
这包括数据清洗、数据变换和数据归一化等步骤,以确保数据的准确性和一致性。
2. 构建决策表决策表是粗糙集理论中的重要概念,它由属性和决策构成。
构建决策表时,需要确定属性集和决策集,并将其表示为一个矩阵。
属性集包括原始数据中的各个属性,而决策集则是属性的决策结果。
3. 确定正域正域是指满足某一条件的样本集合,它是粗糙集理论中的关键概念。
通过对决策表进行分析,可以确定正域,即满足给定条件的样本集合。
正域的确定可以通过计算属性的约简度或者使用启发式算法等方法。
4. 近似集的计算近似集是粗糙集理论中的核心概念,它是指属性集在正域中的近似表示。
通过计算属性集在正域中的近似集,可以确定属性之间的关系和重要程度。
近似集的计算可以使用不同的算法,如基于粒计算、基于覆盖算法等。
5. 属性约简属性约简是粗糙集理论中的一个重要问题,它是指从属性集中选择出最小的子集,保持属性集在正域中的近似表示不变。
属性约简的目标是减少属性集的复杂性,提高数据分析和决策的效率。
属性约简可以通过计算属性的重要度、使用启发式算法或者遗传算法等方法实现。
6. 决策规则的提取决策规则是粗糙集理论中的重要结果,它是从决策表中提取出来的一组条件和决策的组合。
决策规则可以帮助我们理解数据集中的规律和特征,从而做出更好的决策。
基于粗糙集的概念格约简构造算法

O 引 言
概念 格 , 也称 为形式 概念分 析 , 由 WieR于 18 提 出的 , 基本 思 想是基 于 对象 与属 性 之 间的 是 l l 9 2年 其 关系 , 根据 这一关 系来 建立 一种 概念层 次结构 , 中每个概念 都是对 象与属 性 的统 一 体 另外 , 其 概念 格通 过
Hs as e图生 动和 简洁地体现 了这些 概念之 间 的泛 化和 特化 关 系. 概念 格 已经被 广 泛地应 用 于知识 工 程 、 数
பைடு நூலகம்
据 挖掘等领 域. 粗糙集 理论 是 由 P wa a lkZ于 18 9 2年 提 出的 , 它是 一种处 理不确 定 、 不精 确和模 糊知识 的数学 工具 , 由
中图分类 号 : 19 0 5 文献标识 码 : 文章 编号 :0 7—8 5 2 0 )5— 13— 4 A 10 5 X( 0 8 0 0 l 0 Co s r c i n o du e n e tLa tc s d o ug e n t u to f Re c d Co c p ti e Ba e n Ro h S t
Ab t a t s r c :Co c p atc n o g e r ic s e oca iy t i eain h p.A w t o o c n tu tte n e tl t e a d r u h s tae d s u s d t lrf herr l t s i i o ne me h d t o sr c h lt c fe e u t n i u o wa d b o i gt e t o eh r s e ilywi heu e o trb t e ucin o at e atr rd c i sp tf r r y c mb n h wo tg t e ,e p c al t t s fati u e rd to f i o h ru h s t o g e .Th ,r d cn n o sr tn a e a c mp ih d a he s me tme ft e c n e tltie h s bg us e u ig a d c n tuci g c n b c o l e tt a i .I o c p at a i s h c f r lc ne t hi t d c n ma e t e ifr t n mo e o ttn i g a d t e c n e tl t c r o d n e . o ma o tx ,t smeho a k h n o mai r u sa d n n h o c p at e mo e c n e s d o i Ke y wor :at b t e cin;c n e tltie;r u h s tt e r ds tr ue rdu to i o c p a t c o g e h o y;c n tu t n a g rt m o sr ci lo h o i
基于粗糙集的属性约简优化算法研究

a r ) U [ ] p( =
收稿 日期 : 0 7—1 —1 20 1 1
( 上近似集 )
基金项 目:江苏省高校 自然科学基础研究项 目( 5 J 50 0 ) 南通大学 自然科 学基金项 目(5 0 1 0 K B 2 17 ; 0Z6 )
GENRED
—
G O H属性 约简 算法 , 通过 C I 器学 习数据 库 中相关 属性 约简实 验 , 该算法 的有效性 . R WT 并 U机 验证
1 粗 糙 集 基本 理论
1 1 基 本 定 义 .
定 义 1 信息 系统 ) 信息 系统是 有序对 S=( , d} , 中 是 非 空有 限集 合 , 为全 域.A是非 空 ( U AU{ ) 其 称
关 键 宇 :粗 糙 集 ; 性 约 简 ; 性 重 要度 ; 据 挖 掘 属 属 数
中图分类号 : P 0 . T 3 16
文献标识码 : A
文章编号 : 00— 0 3 20 )2— 0 2— 5 10 2 7 (0 8 0 0 5 0
0 引 言
粗糙 集 ( og e ) 论 由波 兰数 学家 Pwa R uhSt 理 s al k于 18 首 先提 出 , 9 2年 由于其 思想 新颖 、 方法 独 特 , 已成 为 近 年来获 得飞速 发展 的数据 挖掘有 力工具 , 它提 供 了一套严 格 处理 知识 发现 中基 本 分类 问题 的数学 方法 . 粗糙 集理 论不需 要先 验知识 , 即可 发现数据 中蕴 涵 的知识模式 , 在保 持分类 能力 的前提 下 , 通过 对属性 和属性 值 约简获 取最小 的规 则集 , 获取 的规则 易于被 专家解 读说 明 j 且 .
粗糙集属性约简算法的分析与改进
【 要 】研 究应 用粗挺 集理 论对信息 系统进行属性 约 简的方法。在分析粗糙 集理 论基本概 念的基础 上 根 据 属 性 的 依 摘 : 赖度和重要度等性质, 出一种 改进的属性 的 简算法, 提 并运用 实例对算法的有效性进行分析和验证 。 【 关键词 】 粗糙集 ; : 属性约 简; 属性 重要度 ; 依赖度
.
0 引 言 .
S F a, DJ= +。r 一 NDJ G ( R, l lDJ 6 r 。 粗糙集 理论 (o曲 S t h oy 由波兰科学家 ZP w8 R u e T er) 是 , lk教 1 a . 2传统的属 性约简算法 授 于 18 9 2年 提 出 的 l 是 一 种 新 型 的 处 理 模 糊 和 不 确 定 知 识 的 l 1 , 传统的粗糙集算法 中的属性约 简算 法的基本思路如下 : 数 学 工 具 。 核 心思 想 是 在 保 持 分 类 能 力 不 变 的 前 提下 通 过 对 其 ① 对 给定 的信息 系统 , 首先求 出条件 属性 的核 . 并将 其作 知 识 的 化 简 , 出问 题 的 决 策 或 分 类 规 则 。 糙 集 理 论 建 构 在 经 为 初始 约简 : 导 粗 典集合论基础之上 , 借助分类手段对数据进行处理 .f - , 以有效 地 ② 对不属于约简属性集 中的属性 。逐个计算 其重要度 . 并 进行信息处理 , 提取有用信息 , 简化决策规则 , 提高分类效率。 相 排 序 : 对于概率统计 、 证据理论 、 模糊集等处 理含糊性 和不确定性 问题 ③ 将重要度最大的属性加入 约简生成新 的约 简 . 断新的 判 的数学工具而言 , 粗糙集理论既与他们有一定的联系 . 又有这 些 约简对于决策属性 的依赖度 , 若依 赖度为 1则当前约 简集 即为 . 理 论 不具 备 的 优越 性 。其 主 要 优 势 之 一 就 在 于 它不 需 要 关 于数 所求。否则转② 。 据的任何预备 的或额外 的信息I Z l 。粗糙集理论 已经在数据挖掘 、 在该算法 中, 需要先计算出属性核 . 然后再根据属 性重要度 模式识别 、 器学 习、 机 医疗 诊 断 、 家 系 统 以及 决 策 分 析 等 领 域 逐 个 加 入 属 性 直 到依 赖 度 为 1计 算 量 较 大 . 适 合 对 大 数 据 集 专 , 不 得到了广泛的应用 , 并取得了 良好 的效果 进 行 处 理 。 以需 要 寻找 一 种 方 法 对 属 性 约 简 过 程 进 行 简 化 所 属性约简是粗糙集理论中的一个 核心 部分 ,可用 于知识 约 2 改进 的 粗 糙 集 属 性 约简 算 法 . 简。由于求所有属性约简是一个 N P完全 问题 , 目前 为止 。 到 还 21改进 算 法 的思 想 . 没有一个 高效 的算法可 以求 出最佳约简和所有约简 , 因此 . 人们 利用每一个 条件属性值对信 息表进 行划分 同时求出该属 已提出了一些 较简单 的信息表属 性约简算 法 . Jlnk等人 提 性 值 的依 赖 度 和 重 要 度 , 根 据 属 性 的 重 要 度 进 行 排 序 。然 后 , 如 eoe 并 出的算法1 3 1 了较好的效果。但 也存在一些不足 . 取得 它必须计算 选 择 重 要 度 最 大 的属 性 进 入 约 简 属 性 集 .直 到 约 简集 和 最 初 信 很多不 同属性 子集 的逼近精 度才能 决定如 何扩展 候选 属性约 息 表 的所 有 属 性 的 依 赖 度 一 致 为 止 。 此 约 简 集 的 基 础 上 . 并 在 合 简 , 算量较大 , 计 特别是 随着 数据集规模 的不断扩大 。 法 的效 相 同 的行 得 到 约 简 表 算 率 急 剧 下 降 ,过 长 的运 行 时 间 使 得 粗 糙 集 理 论 的优 势 无 法 体 现 改进 后 的约 简算 法 基 本 思 路 如 下 : 出 来 。对 于海 量 数 据 挖 掘 丽 言 . 据 约 简 更 具 有 特 殊 的 意 义 . 数 一 ① 初 始化约简集为空 ; 个 高 效 的 约 简算 法 可 以通 过 缩 减 原 始 数 据 库 的数 据 量 。提 高 数 ② 计算所有不在约简集 中的条件属性 的重 要度并排序 : 据 挖 掘 的效 率 ③ 取重要度 最大 的条 件属性 , 其加 入约 简集中 , 判断 将 并 1 粗 糙 箍 理 论 的 基 本 概 念 . 此时约简集的依赖度, 若依赖度为 1则算法结柬, , 否则转②。
基于相似矩阵的连续域决策表属性约简算法
向量并建立了连续属性 间的相似矩 阵, 以此为基础 并
提出了一个新的适用于连续 型属性的决策表的约简算 法。采用该算法 , 用户可以根据实际需求更改阅值 , 从 而得 到较为满意的属性约简集和模糊规则集。 1 相关 定义 为了较好地描述本文算 法 , 先给 出下 面的一些定
第
2 9 期 2 1 4 月 0 年 0
情
报
杂
志
J OURN N L GE C AL OF L TE LI N E
Vl . 9 No 4 d 2 。 Ap . 2 1 r OO
基于相似矩阵的连续域决策表属性约简算法 *
Atr b t du t n Alo t m fCo tnu u m a n De ii n ti u e Re c i g r h o n i o s Do i cso o i Ta l s d o i i r M a rx b eBa e n S m l t a i
定义 1 连续域决策表 S=< U, D, f>, C, V, 其 中 u是非空有限对象集合 U = { 1“ , U }C U , 2…, ,
:
{lc, , 是条件 属性 集合 , c ,2… c } 每个 属性都 是连
续 型属性 D : { , d}是决策属性 。
对 于 Vc∈ c( 12 … , , j= , , 研)都可 以使用隶属 度 函数把它的连续型属性连续域决策表 S=< U, D, 厂 C, V,
>, 对象 “ 和 U 在连续型属性 c 的相似度定义如下 : , ( )= f R'I£ 一 M 一 - | £ t I () 2
分类规则。属性约简就是该理论中一个非常重要 的概
基于粗糙集的属性约简的矩阵方法
些数据的附加信息或先验知识 , 如模糊隶属函数 、 基本概率指派函数和有关统计概率分布等 , 而这些信 息有时并不容易得到。文献[ ] 2 首次提出了粗糙集理论 , 它是一种刻划不完整性和不确定性的数学工 具, 能有效地分析不精确 、 不一致、 不完整等各种不完备 的信息, 还可 以对数据进行分析和推理 , 从中发
现隐含的知识 , 揭示潜在的规律。 粗糙集理论 中,知识” “ 被认为是一种分类能力。在分类过程中 , 将相差不大的个体归于 同一类 , 对
象间的关系就是不可分辨关系, 一种等价关系 J 。粗糙集理论应用在完备 的信息系统上 , 找到知识库
的等价类 , 进行挖掘知识任务。在现实生活中, 信息系统 常常是不完备的 , 这样直接应用粗糙集理论发 现不了等价类 , 不能有效地进行数据挖掘, 所以需要重新考虑分类或决策规则提取的对象关系的定义 , 即降低很强的等价关系的要求 , 提出如相容关系、 相似关系或者更一般的关系 , 来适应知识获取的需要。 受关系的矩阵表示及关系运算的矩阵方法 的启示 , 提出粗糙集理论在分类和决策规则获取中基本
[ 文章编号 ]63— 94 20 )3— 0 6一 5 17 24 (06 0 07 O
基于粗糙集 的属性约简的矩 阵方法
任艳玲 , 朱明放
(1陕西理工学 院 电子信息 系 , 2 陕西理工学 院 计算机科学与技术 系 , 陕西 汉 中 730 ) . . 203
[ 摘
要] 粗糙集理论 中, 属性约简是知识挖掘 的核 心。知识获取是根据对 象间的某种关系
简算法奠定了基础 。但是 , 属性约简算法都是先求出不可区分关系或者相容关系 , 然后逐个检验去掉某
收稿 日期 :0 5— 2一O 20 1 5 基金项 目: 陕西理工学 院科研基金资助项 目( 55 。 0 3 )
经典粗糙集理论
粗糙集可以用于提取数据中的决策规则,这些规则可以作为神经网络的 训练样本。通过训练,神经网络可以学习到决策规则,并用于分类或预 测。
边界区域
近似集合中的不确定性区 域,即既不属于正域也不 属于负域的元素集合。
粗糙集的度量
精确度
描述了集合中元素被近似集合 包含的程度,即属于近似集合
的元素比例。
覆盖度
描述了近似集合能够覆盖的元 素数量,即近似集合的大小。
粗糙度
描述了集合被近似程度,是精 确度和覆盖度的综合反映。
知识的不确定性
描述了知识表达系统中属性值 的不确定性程度,与粗糙度相
经典粗糙集理论
目录
• 粗糙集理论概述 • 粗糙集的基本概念 • 粗糙集的运算与性质 • 粗糙集的决策分析 • 粗糙集与其他方法的结合 • 经典粗糙集理论案例研究
01 粗糙集理论概述
定义与特点
定义
粗糙集理论是一种处理不确定性和模 糊性的数学工具,通过集合近似的方 式描述知识的不完全性和不确定性。
粗糙集理论中的属性约简可以用于简化神经网络的输入特征,降低输入 维度,提高分类或预测的准确率。
粗糙集与遗传算法
01
遗传算法是一种全局优化算法,能够通过模拟自然界的进化过程来寻找最优解 。将粗糙集与遗传算法结合,可以利用粗糙集对数据的分类能力,结合遗传算 法的全局搜索能力,寻找最优的分类规则或决策规则。
02
粗糙集可以用于生成初始的分类规则或决策规则,然后利用遗传算法对这些规 则进行优化,通过选择、交叉、变异等操作,寻找最优的规则组合。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息系统 的数据 以关 系表 的形式来 表示 。关系 表的行 对 应所要研究 的对象 , 列对应对象的属性 。对象的信息是通过指
定对象 的各属性值来表达 。
1 2 不 可 分 辨 关 系 .
研究人员 已经提 出很多属性约简算法 。 。其 ; 性约 简算 法 模 属 中图分类 号 :T 3 1 P 1 文献标 志码 :A 文章 编号 :1 0 — 6 5 2 0 ) 10 9 — 3 0 13 9 ( 0 7 1 -0 30
Atrb t e u to l oih o o g e o i e u z e h oy t ue rd cin ag rtm fr u h s tc mbn d f zy s tt e r i
处理各种不完备信息 , 并从 中发现 隐含知识 , 揭示潜在 的规律 。
粗糙集以不可分辨关系为基础 , 研究不 同类 中对象组成 的集合
之 间的关系 。属性约简是粗糙 集理论 的核心 问题和 重要课题
之一 。
1 粗 糙集 理论
1 1 信息 系统 . 知识表 达在数据 处理 中有 着十分重要的地位 , 知识表达系
维普资讯
第2 4卷 第 1 期 1
20 0 7年 1 1月
计 算 机 应 用 研 究
Ap l ain Re e rho o ues pi t s ac fC mp tr c o
Vo . 4 No 1 12 . 1
NO .2 o V 07
的诸多方法 中, 粗糙集理论 与方法是复杂系统 中一种较 为有效 的方法 。因为它与概率方法 、 模糊集方法和证据理论方法等其
统也被称 为信息 系统 。形式上 四元 组 S=( A, , ) U, V f 是一个 信息 系 统。其 中: U是 对象 的非 空有 限 集合 , 为论 域 U= 称
法 的研究主要集 中在信息系统 属性约 简和用 以规则 提取 的值
约简方面。属性 约简是指在保 持信息 系统 分类 或决策 能力不 变的条件下 , 删除冗余属性 , 以得 出正 确的 、 用 简洁的规则 。求
解最小 属性 约简是 N —ad问题 。不过在实 际应用 中, 出 Ph r 得 相 对属性 约简就 可以了。
{ , , , }A是 属性 的非空有 限集 合 , … ; A={ a ,…, n, a ; } V=u 是属性 的值域集 , 是属 性 a∈ A的值 域 ; f是
他处理不确定性问题 理论最显 著的 区别 是它无 须提供 问题所 需处理的数 据集合之外的任何先验信息 , 以它对数据 的不确 所 定性描述和处理 一般来说是比较客观的。 信息系统约简主要 是使信 息量减少 , 将一些无关或多余 的 信息丢弃 , 而不影 响其原有 的功能 。 目前粗糙集应用 的有效算
QA eg H N H i hn J N i —hn I N F n ,C E a sa , I G Qn sa — A g
( colfSfw r, im nU i r t,Xa e 6 0 5 hn ) Sho o ae Xa e n esy im n3 10 ,C ia o t v i
Ab t a t T i p p rd s u s d te a t b t e u t n i o g e o b n d f zy rl t n t e r s r c : hs a e i se h t i u er d ci r u h s tc m i e u z eai h oy,a d t e r p s d a n w c r o n o n h n p o o e e at b t e u t n a g rtm n a e a l srtv x mp e t u e r d c i lo h a d g v n i u taie e a l . i r o i l Ke r s:r u h s t f z y s t t b t e u t n ag rtm y wo d o g e ; u z e ;a t u e rd ci lo h i r o i
随着数 据挖 掘 ( a iig D 和知 识 发现 ( nweg dt mnn , M) a ko l e d
dsoe a bs , D 的概念在 18 i vr i dt aeK D) c yn a 9 9年被提 出, 随之 出现
了新一代的技术和工具用于 D M和 K D领域 。在 D D M和 K D D
波兰数学家 Z a l 于 18 .P wa k 92年提 出 的粗糙集 理论 是
一
它具有 一定 的领 域知识 , 让本文属性约简算法具有更实际 的决
种新 的处理不精确 、 完全与 不相容 的数学方 法 , 不 能有效地
策需要 和用 户要求 。实验证 明 , 用户可 以根据专家领域知识调 整 阈值 , 得到用户满意 的属性约简结果 。
信息 函数 , U× : A— , 它为每个对象的每个属性赋予一个信 息值 , V口 , 即 ∈A ∈U, , )∈ 。 口 如果 A=C uD,C ND= ( c表示条件属性集 ,D表示决 策属性集 ) 则该类信息系统 又称为决 策系统 。决 策系统 是一 ,
类最为 常见 的信息系统 。
结合 模 糊 集 理 论 的粗糙 集属 性 约简 算 法
钱 锋, 陈海 山, 姜青 山
( 门大学 软件 学 院 , 建 厦 门 3 10 ) 厦 福 605
摘
要:结合模糊 关系的理论 , 对粗糙集理论 的属性约简算法进行研 究, 出了一个新的属性约 简算法, 提 并给 出
了 一 个 应 用 实例 。