基于标识矩阵的粗糙集属性约简改进算法

合集下载

一种改进的模糊粗糙集属性约简启发式算法

一种改进的模糊粗糙集属性约简启发式算法

定理 4
=Sr( )( 】 ) ) i R +【 D ( ,当( a ㈤ 【】 时,则 S P (, ≤1 e Y) D i ) y - m( x ) .
定义 3 模糊 区分 矩 阵 MDU,R ,其任 一元 素 为: ( )
第 1期
陈贞 Leabharlann 一种改进的模糊粗糙集属性约简启发式算法
4 7
( (= z{ )
-x r, (

z ∈U, x ∈U,
∈ (’ 】 o1
是截. ): z z , 然 x (尺 个集(( { Z ∈ 显, x z 毒 = ) ≠ X u xx _ c)
定 理 1 R A= u{ ( ): ( ) A) + , , . 定理 2 如 果 ( ) ) 【】 鼬 ( zD,则 ( ) ㈤ 【 D 尺 】 . 定理 3 设 PcR,P是 R 的相对 约 简 ,当且 仅 当 P是 R 的最 小子 集 , ( ) f) 【 D, | p 】 =Sr( 【】 ) ) ∈U . i R)( D ( , e
明了改进算法的有 效性 .
关键 词:模糊粗糙 集 ;属 性约简 ;属性权 重 中图分类号: T 8 P1 文献标识码: A
1 引言
传统基 于粗 糙集 的约 简算 法 ,只 能有 效地 处理包 含 离散值 的数 据集 ,但 是对 连续 属性 处理 能力 非常有 限.而现 实世 界中大 多数 的数 据集 , 属性 值可 能是符 号或 者是 实型 的数 据 , 些连 续数 据大 多具 有模糊 性 , 这
概念 之间 的界 限并不十 分 明确 .因此 ,利用 粗糙 集理 论进行 约 简处理 之 前 ,必须 对连 续属 性进 行离 散化 ,
这一过 程将造 成某 种程度 的信 息损 失 ,因为离散 化后 的属 性值 没有 保 留属性 值在 实数 值 上存在 的差 异.目 前 ,粗 糙集理 论与其 它具有 处理 不精 确或 不确 定 问题 的理论 ( 概率 论 、模 糊数 学和 证据 理论 等) 行相 互 如 进 补 充 ,是 约简 算法 的一个 重要 研 究和应 用 方 向. 文献 【】 2较早将 模糊 集 与粗糙 集 结合 , 模糊 粗糙 集进 行 了研究 , 对 并提 出 了基 于相似 关 系 的模 糊粗糙 集. 通过 粗糙 隶属 函数将模 糊集 的研 究方法 引入 到粗 糙集 的研 究中 , 把模 糊集 合 中 的隶属 度看 作是 粗糙集 理论 中 的属性值 ,更好地 指导特 征 选取 ,从而 更完 整地保 留原 始数 据 的知识 和信 息 ,提 高在 知 识获 取 、数据 挖 掘 、决策分 析和 决策支 持 、模式 识别 、机 器 学习等 域 中的数据 约 简 的准 确 性具 有 重要 的意义 .

基于粗糙集的实属性值约简算法

基于粗糙集的实属性值约简算法

基于粗糙集的实属性值约简算法
赵连胜;施纪华
【期刊名称】《内蒙古大学学报:自然科学版》
【年(卷),期】2010()1
【摘要】在A.Skowron关于属性值约简研究的基础上,给出截断点集的逻辑抽取方法,并基于复杂度的考虑提出一种改进的启发式算法,使属性的值集规模有实质性的约简.
【总页数】5页(P97-101)
【关键词】粗糙集;属性值约简;截断点集;逻辑抽取
【作者】赵连胜;施纪华
【作者单位】包头师范学院信息科学与技术学院
【正文语种】中文
【中图分类】TP301.6
【相关文献】
1.一种基于粗糙集理论的属性值约简改进算法 [J], 曾孝文;胡虚怀;严权峰
2.一种基于聚类划分的并行粗糙集属性值约简算法 [J], 陈燕云;肖坤楠;邱建林
3.基于属性值集合链的粗糙集快速属性约简算法 [J], 武友新;李文晶;钟子岳
4.基于粗糙集的一种属性值约简算法及其应用 [J], 吴尚智
5.基于关联规则挖掘的粗糙集属性值约简算法研究 [J], 杜跃;王治和;景永霞
因版权原因,仅展示原文概要,查看原文内容请购买。

基于粗糙集的属性约简算法

基于粗糙集的属性约简算法

第2 2卷
a= 表示不包含条件属性 a, a =1 0 而 表示包 含条件 属性 a。如果要识别所有 决策不同的记 录 , a( =12 …, ) 则 i ,, 与 ( =12 … , 之 中必然 至少各有 一个 条件属性 不能 ,, ) 被 删除 , 否则新决策表将与原决策表具 有不同的不科技开发项 目( 013) 2 435 0 作者简介 : 赵青杉(92 , 山西五 台 , 州师 范学院计算机 系讲师 , 17 一)男, 人 忻 从事数据挖掘 、 集理论研 究。 粗糙
维普资讯
忻 州 师 范 学 院 学 报
x 关于 R 的下近似集是 U 中根据 已有知识 判断必 定属于 X 的对象所组成 的最大集合 , =U{ ∈ U R1 即』 y / y∈X}
定义 2 设 R C称 R 为 C的 D一 : 约简当且仅 当 R 是 C
属性组合以布尔值表示其中是否包含某个条件属性。 比如
收稿 日期 :0 6 1 5 20 0 —0
的最小约简是 N P—hr a d问题 。解决 这类 问题 的方法一 般
的值, “ 是 “ D( ) 在属性D上的值, 可识别矩阵记为:
f a∈ A : ( 1 ≠ a “ )D( ≠ D( , a “) ( , , “) “)
是启发式搜索 , 进而获得最优解或近似最优解。 本文研究 了可辨识矩 阵的约简 , 从属性依赖度角度给 出
粗糙集理论是波兰数学家 Z P wl .a a k在 2 0世纪 8 o年代 初首先提 出 的一种 可 以分析 模糊 和不 确定 问 题 的数 学理
定义 3 C的所有 必要属 性组成 的集 合称 为 C 的核 , : 记
为 ∞ R C)它是 C的所 有约简 的交 , C RE( =n E( , 即 O C) R D( , 中 R D( 表示 的约 简。 E C)其 E C) 三、 基于可识别矩阵的约简方法 可辨识矩 阵由华 沙大学数学家  ̄o o 出 , wrn提 定义 为系 统 S=( A) U= { 1 “ , “ }a( ) “在属性 a上 U, , “ ,2… , “ 是

粗糙集属性约简的方法

粗糙集属性约简的方法

WANG P i, AO Y l , VJa fn . w meh do t iuerd c o ae nr u hstCo ue n ier ga dAp e iZH ui L ine g Ne to f t b t ut nb sdo o g e. mp tr gn ei n — j n ar e i E n piain , 0 2 4 ( )131 5 l t s2 1, 8 2 :1 —1 . c o Ab tat Obet c sict ni sit xes e n osn iv nn i . miga eio s m wi n e a c ra l src: jcs l s ai tc e csi l a dt s i o os Ai n t c ins t t u cr i f t .na・ a f o s r i vy o e te e d s ye h tn a o
的决 策系统 , 为 S, } d是 带不确定 因子 (-. ) 记 D= , 0I <t 1 的结论属性 , =1 示该元 素对 结论有 完全肯定 的判断 , 表 即该
识 库 中的知识 ( 属性 ) 并不 是同等重要 的 , 还存在 冗余 , 不利 这 于 做出正确 而简洁的决策 。属性约简要求 在保持知识库 的分 类和 决策 能力 不变 的 条件 下 , 除不 相关 或不 重要 的属 性 。 删 般而言, 较优 的属 性 约简 有如 下指 标 : 简后 属性 个 数较 约 少; 约简后规则数 目较少 ; 最终范化规 则数 目较少等 。已证明
Ke r s o g e; e e d bl ; t iuerd cin i lme tt n ywo d :ru hst d p n a i t at b t e u t ;mpe n ai i y r o o

一种改进的属性约简算法

一种改进的属性约简算法

输入: 一个决策表信息系统S = ( U , R , V , . 厂 ) ,R = C U D, 这里 : 论域;C: 条件属. 集;D: 决
策属性集 。 输出: 的一个 约简 R e d 。 算 法步骤 如下 :
第 l 步 :初 始化 R e d : ,S i g ( a ) =0,c o u n t ( a ) =0;
长l e n ,并 更新相应 屙 陛频率值 S i g( a i ) 和属 陛出现 次数 c o u n t ( a i ) ; 。
第 5步 :按属性重要度 ( a i ) 排序 ,选择属性重要度最大 ( 若属性重要度 ( a) 值 相 同 ,则 选择

齐 齐 哈 尔 大 学 学 报
c o u n t ( 口 , ) 较大 的 )的属 性 a并人 R e d中 ,即 R e d = R e d U{ a i } ;
中图分 类 号 :T P 3 0 I . 6 文 献 标 志 码 :A 文 章 编号 : 1 0 0 7 — 9 8 4 X ( 2 0 1 3 ) 0 3 — 0 0 1 2 - 0 3
属性约 简是粗糙集 理论 及应用 研究 的重要组成 部分 ,它是知识 获取 的关 键步骤 。信息 系统 中知识的重
【 3 1 胡成祥 ,李天瑞 ,邹维丽 ,等.基于限制容差关系的粗糙集模型中近似集增量更新方法研究f J 1 _两南 族大学学报 :自
然科 学 版 ,2 0 0 9 ( 3 1 :4 8 0 — 4 8 4 .
f 4 1苗夺谦 ,李道 国.粗糙集理论 、算法 与应用[ MI .北京 :清华大学出版礼 。2 0 0 8 .
S i g( a j ) = ( / l e n , ) ( 小 于决策表 中属 性个数 )

基于粗糙集的属性约简优化算法研究

基于粗糙集的属性约简优化算法研究
a r ) [ p( = ] ( 下近 似集 )
a r ) U [ ] p( =
收稿 日期 : 0 7—1 —1 20 1 1
( 上近似集 )
基金项 目:江苏省高校 自然科学基础研究项 目( 5 J 50 0 ) 南通大学 自然科 学基金项 目(5 0 1 0 K B 2 17 ; 0Z6 )
GENRED

G O H属性 约简 算法 , 通过 C I 器学 习数据 库 中相关 属性 约简实 验 , 该算法 的有效性 . R WT 并 U机 验证
1 粗 糙 集 基本 理论
1 1 基 本 定 义 .
定 义 1 信息 系统 ) 信息 系统是 有序对 S=( , d} , 中 是 非 空有 限集 合 , 为全 域.A是非 空 ( U AU{ ) 其 称
关 键 宇 :粗 糙 集 ; 性 约 简 ; 性 重 要度 ; 据 挖 掘 属 属 数

中图分类号 : P 0 . T 3 16
文献标识码 : A
文章编号 : 00— 0 3 20 )2— 0 2— 5 10 2 7 (0 8 0 0 5 0
0 引 言
粗糙 集 ( og e ) 论 由波 兰数 学家 Pwa R uhSt 理 s al k于 18 首 先提 出 , 9 2年 由于其 思想 新颖 、 方法 独 特 , 已成 为 近 年来获 得飞速 发展 的数据 挖掘有 力工具 , 它提 供 了一套严 格 处理 知识 发现 中基 本 分类 问题 的数学 方法 . 粗糙 集理 论不需 要先 验知识 , 即可 发现数据 中蕴 涵 的知识模式 , 在保 持分类 能力 的前提 下 , 通过 对属性 和属性 值 约简获 取最小 的规 则集 , 获取 的规则 易于被 专家解 读说 明 j 且 .

粗糙集属性约简算法的分析与改进

粗糙集属性约简算法的分析与改进
3湖 南 图书 馆 . 湖 南- K沙 4 0 1 10 1
【 要 】研 究应 用粗挺 集理 论对信息 系统进行属性 约 简的方法。在分析粗糙 集理 论基本概 念的基础 上 根 据 属 性 的 依 摘 : 赖度和重要度等性质, 出一种 改进的属性 的 简算法, 提 并运用 实例对算法的有效性进行分析和验证 。 【 关键词 】 粗糙集 ; : 属性约 简; 属性 重要度 ; 依赖度

0 引 言 .
S F a, DJ= +。r 一 NDJ G ( R, l lDJ 6 r 。 粗糙集 理论 (o曲 S t h oy 由波兰科学家 ZP w8 R u e T er) 是 , lk教 1 a . 2传统的属 性约简算法 授 于 18 9 2年 提 出 的 l 是 一 种 新 型 的 处 理 模 糊 和 不 确 定 知 识 的 l 1 , 传统的粗糙集算法 中的属性约 简算 法的基本思路如下 : 数 学 工 具 。 核 心思 想 是 在 保 持 分 类 能 力 不 变 的 前 提下 通 过 对 其 ① 对 给定 的信息 系统 , 首先求 出条件 属性 的核 . 并将 其作 知 识 的 化 简 , 出问 题 的 决 策 或 分 类 规 则 。 糙 集 理 论 建 构 在 经 为 初始 约简 : 导 粗 典集合论基础之上 , 借助分类手段对数据进行处理 .f - , 以有效 地 ② 对不属于约简属性集 中的属性 。逐个计算 其重要度 . 并 进行信息处理 , 提取有用信息 , 简化决策规则 , 提高分类效率。 相 排 序 : 对于概率统计 、 证据理论 、 模糊集等处 理含糊性 和不确定性 问题 ③ 将重要度最大的属性加入 约简生成新 的约 简 . 断新的 判 的数学工具而言 , 粗糙集理论既与他们有一定的联系 . 又有这 些 约简对于决策属性 的依赖度 , 若依 赖度为 1则当前约 简集 即为 . 理 论 不具 备 的 优越 性 。其 主 要 优 势 之 一 就 在 于 它不 需 要 关 于数 所求。否则转② 。 据的任何预备 的或额外 的信息I Z l 。粗糙集理论 已经在数据挖掘 、 在该算法 中, 需要先计算出属性核 . 然后再根据属 性重要度 模式识别 、 器学 习、 机 医疗 诊 断 、 家 系 统 以及 决 策 分 析 等 领 域 逐 个 加 入 属 性 直 到依 赖 度 为 1计 算 量 较 大 . 适 合 对 大 数 据 集 专 , 不 得到了广泛的应用 , 并取得了 良好 的效果 进 行 处 理 。 以需 要 寻找 一 种 方 法 对 属 性 约 简 过 程 进 行 简 化 所 属性约简是粗糙集理论中的一个 核心 部分 ,可用 于知识 约 2 改进 的 粗 糙 集 属 性 约简 算 法 . 简。由于求所有属性约简是一个 N P完全 问题 , 目前 为止 。 到 还 21改进 算 法 的思 想 . 没有一个 高效 的算法可 以求 出最佳约简和所有约简 , 因此 . 人们 利用每一个 条件属性值对信 息表进 行划分 同时求出该属 已提出了一些 较简单 的信息表属 性约简算 法 . Jlnk等人 提 性 值 的依 赖 度 和 重 要 度 , 根 据 属 性 的 重 要 度 进 行 排 序 。然 后 , 如 eoe 并 出的算法1 3 1 了较好的效果。但 也存在一些不足 . 取得 它必须计算 选 择 重 要 度 最 大 的属 性 进 入 约 简 属 性 集 .直 到 约 简集 和 最 初 信 很多不 同属性 子集 的逼近精 度才能 决定如 何扩展 候选 属性约 息 表 的所 有 属 性 的 依 赖 度 一 致 为 止 。 此 约 简 集 的 基 础 上 . 并 在 合 简 , 算量较大 , 计 特别是 随着 数据集规模 的不断扩大 。 法 的效 相 同 的行 得 到 约 简 表 算 率 急 剧 下 降 ,过 长 的运 行 时 间 使 得 粗 糙 集 理 论 的优 势 无 法 体 现 改进 后 的约 简算 法 基 本 思 路 如 下 : 出 来 。对 于海 量 数 据 挖 掘 丽 言 . 据 约 简 更 具 有 特 殊 的 意 义 . 数 一 ① 初 始化约简集为空 ; 个 高 效 的 约 简算 法 可 以通 过 缩 减 原 始 数 据 库 的数 据 量 。提 高 数 ② 计算所有不在约简集 中的条件属性 的重 要度并排序 : 据 挖 掘 的效 率 ③ 取重要度 最大 的条 件属性 , 其加 入约 简集中 , 判断 将 并 1 粗 糙 箍 理 论 的 基 本 概 念 . 此时约简集的依赖度, 若依赖度为 1则算法结柬, , 否则转②。

基于粗糙集值约简改进算法的进程异常检测

基于粗糙集值约简改进算法的进程异常检测

o e a n r l y F rt ma ea d cso b eb s g t ek p st n h h r s q e c so y tm al s h o dt n I ft b omai . i . d e i n t l yu i o i o si t e s ot e u n e fs se c l a e c n i o a h t s i a n h i n s t i at b tsa d t e tp f h r c s st e d c s n a t b t . h n a p id te n w S v le r d cin ag r h t e ta ta t u e n h y e o e p o e s a h e ii t ue T e p l h e R au e u t l o t m o xrc i r t o i r e o i r l e . tls ,d n i e h y e o e p o e s b h tt t a g r s o o a s n b t e h r c s ’s q e c so ue s t A a t ie t d te t p ft rc s y te s i i lf u e fc mp r o ewe n t e p o e s e u n e f i f h a sc i i s se c l n e r l e. h x e i n h w h t h smeh d c n i e t y t ep o e s s y e f c e t n o r cl . y tm al a d t es t T e e p r s h u me ts o st a i t t o a d n i h r c s e ’tp s f i nl a d c re t f ei y y
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

法 因重 复 计 算 会 增 加 更 多 的 运 算 时 间并 占 用较 大 的存 储 空 间 ; 对 此 以 引入 标 识 矩 阵构 造 方 法 , 在 标 识 矩 阵 中对 属 性 的表 示
采 用计 算机 更 易 处理 的数 字表 示 方 法 , 仅对原始合取矩阵( 0CM) 中属 性存 在 ( 即 标 识 矩 阵 中为 表 示 为 1 ) 的项 作 合 取 运 算 并
t i o n f o r i t c o u l d b e e a s i e r f o r c o mp u t e r t o h a n d l e , i n w h i c h o r i g i n a l c o n j u n c t i o n ma t r i x , o n l y m a k e s c o n j u n c t i o n o p e r a t e a m o n g e x i s t i n g a t t r i b u t i o n s( m a r k e d n u m b e r 1 i n i d e n t i t y ma t r i x ) .
5 0
基 于 标 识 矩 阵 的粗 糙 集 属 性 约 简 改 进 算 法
基于标识矩阵的粗糙集屙 陛约简改进算法
mpr o v e d Al g o r i t h m o f R o u g h S e t s At t r i b u t i o n R e d u c t i o n Ba s e d o n I d e n t i t y Ma t r i x
删 除标 记 属 性 全部 存 在 ( 即全 为 1 ) 的行 , 显 著 缩 短 了搜 索 空 间 , 节 省 了计 算 时 间 。
关键词 : 粗 糙 集理 论 , 标识矩阵 , 属性约 简, 算 法
Ab s t r a c t : A t t r i b u t e r e d u c t i o n i s o n e o f c o r e s t u d y p o i n t s i n r o u g h s e t t h e o r y . A t r a d i t i o n a l me t h o d u s e d i n d i s j u n c t i o n ma —
ห้องสมุดไป่ตู้
X关 于 R 的上 近似 与 下 近 似 之 差 。 上近似 、 边界域 、 下 近 似 的概 念 刻划 了 一 个 边 界 不 清 晰 的集 合 的逼 近特 性 ,在 粗 糙 集 理 论 中一 个 集 合 之 所 以粗 糙 正 是 因 为 划 分论 域 的 知识 不 够 充 分 , 无 法 用 等 价 类来 准 确 的定 义 。 总结 上 述 定 义 以及 结 合 粗 糙 集 理 论 自身 特 点 可 以知 道 粗糙 集 方 法 能 够 如 此 快 速 的发 展 是 因为 具 有 如 下 的特 点 :
李 保 李翠玲 赵 荣 泳
( 上海海事大学电气自动化系, 上海 2 0 1 3 0 6 ) ( 同济大学电子与信 息工程学院, 上海 2 0 1 8 0 4 )
摘要 : 属 性 约 简 是 粗糙 集 理 论 研 究 中的 核 心 内容 之 一 , 传 统 的 由 区分 矩 阵获 得 析 取 矩 阵 的 方 法 多 为全 局 搜 索 方 法 , 该 方
t r i x o bt ai ni n g i s a do pt gl oba l s ea r c h i n di s ce r n i bi l i t y mat r i x, whi l e gl oba l s ea r c h f or do ubl e co u nt i n g wi l gr l ea t l y i n c r e as e t h e ope r a t i on t i me an d o cc up y l ar ger s t or a ge sp a ce: t h er ef O r e. t hi s pap er i s bas ed o n i d en t i t y ma t r i x , u s e s di gi t a l r epr es e n t a t t r i bu —
过 程 中必 不 可 少 的一 步 ,本 文 以 标 识 矩 阵 的构 造 方 法 为基 础 并 做 了 改进 , 只 对 标 识 矩 阵 中全 部 存 在 的属 性 进 行 合 取 运 算 , 同 时 将 标 识 矩 阵 中 属性 行 全 为 1的 行 略 去 ,认 为其 在 属 性 约 简 过 程 中 是冗 余 的 属性 记 录 ; 这 样 可 以 提 高 合 取 矩 阵 的运 算 速 度 , 为 粗
Ke y wor d s: r ou gh s e t t h e or y, i den t i t y ma t r i x , a tr i bu t e Redu c t i on , al gor i t hm
华 沙技术 大学 的波 兰学者 Z d z i s — l a w P a wl a k在 1 9 8 2年 发 表 的经 典论 文 “ R o u g h S e t s ” , 该 论 文 不 仅 标 志 着 粗 糙 集 理 论 的诞 生 , 同时 也 开 启 了 粗糙 集 理 论 的研 究 热 潮 [ 1 - 2 ] 0属性约简是 粗 糙 集 理 论 研 究 的核 心 问题 之 一 ,析 取 矩 阵 的计 算 是 属 性 约 简
相关文档
最新文档