粗糙集属性约简matlab程序解析

合集下载

基于粗糙集的符号与数值属性的快速约简算法

基于粗糙集的符号与数值属性的快速约简算法

1000
2000
3000
numbers of samples
统已提示 out of memory.且在占用虚拟内存时,
(a) abalone 上的计算时间
计算速度异常变慢,计时方式来对比已不科学. 由于时间太长,abalone 未能计算完成.该方法 在后面大数据实验时不作比较.
在FARNeMF与FARNeM1 的比较中(图 2),发 现由于FARNeMF大量减少了样本比较次数,较大 幅度地提高了计算速度图 2(c,e).例外的是图 2(a),FARNeM1 居然比FARNeMF速度还快些.但两
性质 2: M ⊆ N ⊆ C , X ⊆ U ,则 ∀x ∈U ,若 δ M (x) ⊆ M X 则δ N (x) ⊆ N X . 证明:由下近似定义可知 δ M (x) ⊆ X ,由性质 6 可得 δ N (x) ⊆ δM (x) ⊆ X ,从而由下近似定义得 δ N (x) ⊆ N X 由性质2中 x 任意性,可得
3) Δ(x1, x3 ) ≤ Δ(x1, x2 ) + Δ(x2 , x3 ) .
对于 N 个属性的样本集,距离常用 P 范数表 示为
∑ Δ
P
(
x1
,
x
2
)
=
⎜⎜⎝⎛
N i =1
|
f (x1, ai ) −
f (x2 , ai ) |P ⎟⎟⎠⎞1/ P
其中 f (x, ai ) 为样本 x 在属性 ai 上的取值.
4. 实验分析
为测试优化算法的效果,采用 UCI 数据集作
对比实验. 所用的数据集构成如表 1 所示.
表 1 数据集描述
数据集
样本个数
数值型属性
符号型属性

广义多粒度粗糙集属性约简和matlab计算

广义多粒度粗糙集属性约简和matlab计算

广义多粒度粗糙集属性约简和matlab计算
张先韬
【期刊名称】《计算机工程与应用》
【年(卷),期】2016(052)008
【摘要】定义了基于广义多粒度粗糙集的属性约简,研究了约简的一些基本性质,给出matlab计算的过程,并给出计算实例.定义了信息系统的严格协调、软不协调性、粒度协调、粒度不协调,定义了广义多粒度下约简、粒度约简、(下/上近似)分布协
调约简、(下/上近似)质量协调约简,并给出部分结论.广义多粒度粗糙集的约简适用于乐观多粒度粗糙集和悲观多粒度粗糙集.研究结果可完善多粒度粗糙集理论,为理
论研究和应用奠定基础.
【总页数】6页(P43-48)
【作者】张先韬
【作者单位】中煤科工集团重庆研究院有限公司,重庆 400039;瓦斯灾害监控与应
急技术国家重点实验室,重庆 400039
【正文语种】中文
【中图分类】TP18
【相关文献】
1.多粒度粗糙集模型下的矩阵属性约简算法 [J], 李丹
2.基于决策表的多粒度粗糙集属性约简研究 [J], 赵思雨;钱婷;魏玲
3.基于局部可调节多粒度粗糙集的属性约简 [J], 侯成军; 米据生; 梁美社
4.利用多粒度粗糙集属性约简和TOPSIS的IPv6负载均衡机制 [J], 罗宏等;蓝耿;聂良刚;粟光旺;伍一坤
5.多源覆盖信息系统下的加权广义多粒度粗糙集模型及其应用 [J], 骆公志;陈佳馨因版权原因,仅展示原文概要,查看原文内容请购买。

基于粗糙集理论的属性约简算法的实现

基于粗糙集理论的属性约简算法的实现

Jn o 6 u e2 0
基 于 粗糙 集 理 论 的属 性约 简算 法 的 实现
张冬 玲
( 州边 防指挥 学校 教 育技 术 中心 , 东 广 州 5 0 6 ) 广 广 16 3
(dig 16 tm zl @ 2 .o ) n

要 : 属性 约 简算 法的 实现进 行讨 论研 究 , 用数 学 中的 一 些运 算规 律 , 计 算机 上 实现 布 对 利 在
尔代数 的运算 。 最后 , 结合 实 际的研 究课 题 , 通过 运行程 序 , 某些数据 表 实现 属性 约 简。 对 关键 词 : 糙 集 ; 别矩 阵 ; 粗 差 差别 函数 ; 属性 约 简; 增量算 法
中图分类 号 : P l .3 T 3 1 1 文献标 识 码 : A
n×( n一1 / 。 )2

约简通常是不 唯一的 。 一个数 据集的所有约简 可以通过 构造差别矩阵 , 由差别矩 阵导 出差别 函数并对其化简而得到。 2 1 差别矩阵 与属性约筒 . 根据差别矩 阵的概念 , 阵元 素与属性约 简存 在着 下列 矩
关系
(, 2 )
,f 属于相同决策属性类
x 属于不 同决策属性类 j
1 粗糙 集理论 的相关概念
粗糙 集理论是研究不完 整数据 及不精 确知识 的表达 、 学
2 利用差别矩 阵的属 性约简
当前 , 息系统 中信 息膨胀 主 要有 两个方 向 : 向和纵 信 横 向。 向指切是属性字段 的不 断增 加 , 横 纵向指的是记 录数的增 加。 在粗糙集 中对于信息 系统 横向的约 简可 以称之 为属 性约 简 , 向的约简可 以认为是值约简 。 纵 随着数据库 系统 中数据的 不断增加 , 属性 的约简相对于值 的约简变得更加有效。 如果某 个条件属 性被去除后仍 有相 同的等 价关系的话 , 么这个 条 那 件属性便 是 可省 的 。 这样 将 大大 简化 数据库 结 构的复 杂 度, 提高人们对隐含在数 据库 庞大数据 量下的各种信息 的认 识程度 , 因此属性约简也 就成为 了 目前粗糙 集理论 的研究 热

粗糙集属性约简的方法

粗糙集属性约简的方法

WANG P i, AO Y l , VJa fn . w meh do t iuerd c o ae nr u hstCo ue n ier ga dAp e iZH ui L ine g Ne to f t b t ut nb sdo o g e. mp tr gn ei n — j n ar e i E n piain , 0 2 4 ( )131 5 l t s2 1, 8 2 :1 —1 . c o Ab tat Obet c sict ni sit xes e n osn iv nn i . miga eio s m wi n e a c ra l src: jcs l s ai tc e csi l a dt s i o os Ai n t c ins t t u cr i f t .na・ a f o s r i vy o e te e d s ye h tn a o
的决 策系统 , 为 S, } d是 带不确定 因子 (-. ) 记 D= , 0I <t 1 的结论属性 , =1 示该元 素对 结论有 完全肯定 的判断 , 表 即该
识 库 中的知识 ( 属性 ) 并不 是同等重要 的 , 还存在 冗余 , 不利 这 于 做出正确 而简洁的决策 。属性约简要求 在保持知识库 的分 类和 决策 能力 不变 的 条件 下 , 除不 相关 或不 重要 的属 性 。 删 般而言, 较优 的属 性 约简 有如 下指 标 : 简后 属性 个 数较 约 少; 约简后规则数 目较少 ; 最终范化规 则数 目较少等 。已证明
Ke r s o g e; e e d bl ; t iuerd cin i lme tt n ywo d :ru hst d p n a i t at b t e u t ;mpe n ai i y r o o

基于粗糙集的属性约简算法

基于粗糙集的属性约简算法
中 的对 象组 成 的集合 + X) = { ∈ UI ) ( B(
} 。


的上 近似 集 B ) 根据 知识 判定 可 能属 ( , 于 的 中的对象 组成 的集合 B X)= { ∈ Ul ( X B( " X ≠ } X)I 1 。
定义 3 正域
收 稿 日期 :0 l 3 1 2 1 - —l 0 基 金项 目 : 国家 自然 科 学 基 金 资 助 项 目( 07 0 9 6543 )
D c u D =Q, = ) ( Cn D 两个不同的集合。 概念 2 完备信息系统与不完备信息系统 在决 策信息系统 D S=< , uD, , UC VP>中, 中每个对
1 2 基本 定义 .
L )= { ( Y∈ UI( Y ,)∈ L , } L = { ∈ UI ( X L ) } , L = { ∈ UJ ( X )n ≠ } 。
() 2 () 3 () 4
定义 1 不可 分辨 关 系
限制容 差关 系具 有 自反 性 和对 称性 , 是不 具 但 有 传递 性 。
步骤 有的约简属性集都包含的不可省略属性 的集合 , 记 为 C R P)=n R D( O E( E P)。
步骤 7 将 R d e 集里的属性与 c集合里剩余的
属性 分别结 合 。 步骤 8 采 用组合 属性 , 复步骤 2 ~6 重 。 步骤 9 从 R d的尾部 开 始 , 后 往前 对 每 个 e 从
2 2 知 识约 简算法 .
q }I D B 是一个等价关系。 )。 ( ) N 由这种等价关 系导
出 的对 的划 分记 为 U ID( , 中包 含样本 的 /N B)其 等价类 记 为 [ ] 。

粗糙集属性约简算法综述

粗糙集属性约简算法综述

随着计算机 网络 的高速 发展,人们所要 处理 的数据越来 越多 。在大量 数据 中会伴有 不确定 问题 。 目前处 理不确定性 问题的方法主要包括概率统计、模糊理论、证据 理论等…。但
这 些 方 法 必 须 依 靠 大 量 的 先 验 知 识 。粗 糙 集 理 论 很 好 弥 补 了 以上 方 法 缺 点 , 可 以有 效 处 理 不 确 定 信 息 , 却不 需 要 任 何 先
【 文章编号 】1 0 0 8 — 1 1 5 1 ( 2 0 1 5 ) 1 1 - 0 0 1 7 — 0 3
A s ur ve y o f r o ug h s e t r e d uc t i o n pr o c e s s a l g o r i t hm
I 为:
H ( K I M) = 一 ∑p ( ) ∑P ( Y i I X , ) l o g ( p (  ̄ ) I ) ( 4 )
属 性 集 同属 性 集 的 互 信 息 为 :
对 于信 息 表/ ( u , A 1 ,如 果有 属 性集B A , 且 满 足 i n d ( B ) = i n d ( A ) ,则 称 曰 为 的 一 个 约 简 ,记 为 r e d ( A ) 。i n d ( A ) , i n d ( B ) 代 表 着 和 上 的 不 可 分 辨 关 系 。
验 知 。
核属性就会影 响属性约简 的前后一致性 。
1 粗糙集约筒算法初探
1 . 1 基 于信 息熵 的约 简算 法
定义 1 设 、 K  ̄ UA z 划 分为 Y , 其中: { Y= { Y I , Y z , …, Y m } , 则 属 性 集 合M 的熵

, … } ;

粗糙集属性约简算法的分析与改进

粗糙集属性约简算法的分析与改进
3湖 南 图书 馆 . 湖 南- K沙 4 0 1 10 1
【 要 】研 究应 用粗挺 集理 论对信息 系统进行属性 约 简的方法。在分析粗糙 集理 论基本概 念的基础 上 根 据 属 性 的 依 摘 : 赖度和重要度等性质, 出一种 改进的属性 的 简算法, 提 并运用 实例对算法的有效性进行分析和验证 。 【 关键词 】 粗糙集 ; : 属性约 简; 属性 重要度 ; 依赖度

0 引 言 .
S F a, DJ= +。r 一 NDJ G ( R, l lDJ 6 r 。 粗糙集 理论 (o曲 S t h oy 由波兰科学家 ZP w8 R u e T er) 是 , lk教 1 a . 2传统的属 性约简算法 授 于 18 9 2年 提 出 的 l 是 一 种 新 型 的 处 理 模 糊 和 不 确 定 知 识 的 l 1 , 传统的粗糙集算法 中的属性约 简算 法的基本思路如下 : 数 学 工 具 。 核 心思 想 是 在 保 持 分 类 能 力 不 变 的 前 提下 通 过 对 其 ① 对 给定 的信息 系统 , 首先求 出条件 属性 的核 . 并将 其作 知 识 的 化 简 , 出问 题 的 决 策 或 分 类 规 则 。 糙 集 理 论 建 构 在 经 为 初始 约简 : 导 粗 典集合论基础之上 , 借助分类手段对数据进行处理 .f - , 以有效 地 ② 对不属于约简属性集 中的属性 。逐个计算 其重要度 . 并 进行信息处理 , 提取有用信息 , 简化决策规则 , 提高分类效率。 相 排 序 : 对于概率统计 、 证据理论 、 模糊集等处 理含糊性 和不确定性 问题 ③ 将重要度最大的属性加入 约简生成新 的约 简 . 断新的 判 的数学工具而言 , 粗糙集理论既与他们有一定的联系 . 又有这 些 约简对于决策属性 的依赖度 , 若依 赖度为 1则当前约 简集 即为 . 理 论 不具 备 的 优越 性 。其 主 要 优 势 之 一 就 在 于 它不 需 要 关 于数 所求。否则转② 。 据的任何预备 的或额外 的信息I Z l 。粗糙集理论 已经在数据挖掘 、 在该算法 中, 需要先计算出属性核 . 然后再根据属 性重要度 模式识别 、 器学 习、 机 医疗 诊 断 、 家 系 统 以及 决 策 分 析 等 领 域 逐 个 加 入 属 性 直 到依 赖 度 为 1计 算 量 较 大 . 适 合 对 大 数 据 集 专 , 不 得到了广泛的应用 , 并取得了 良好 的效果 进 行 处 理 。 以需 要 寻找 一 种 方 法 对 属 性 约 简 过 程 进 行 简 化 所 属性约简是粗糙集理论中的一个 核心 部分 ,可用 于知识 约 2 改进 的 粗 糙 集 属 性 约简 算 法 . 简。由于求所有属性约简是一个 N P完全 问题 , 目前 为止 。 到 还 21改进 算 法 的思 想 . 没有一个 高效 的算法可 以求 出最佳约简和所有约简 , 因此 . 人们 利用每一个 条件属性值对信 息表进 行划分 同时求出该属 已提出了一些 较简单 的信息表属 性约简算 法 . Jlnk等人 提 性 值 的依 赖 度 和 重 要 度 , 根 据 属 性 的 重 要 度 进 行 排 序 。然 后 , 如 eoe 并 出的算法1 3 1 了较好的效果。但 也存在一些不足 . 取得 它必须计算 选 择 重 要 度 最 大 的属 性 进 入 约 简 属 性 集 .直 到 约 简集 和 最 初 信 很多不 同属性 子集 的逼近精 度才能 决定如 何扩展 候选 属性约 息 表 的所 有 属 性 的 依 赖 度 一 致 为 止 。 此 约 简 集 的 基 础 上 . 并 在 合 简 , 算量较大 , 计 特别是 随着 数据集规模 的不断扩大 。 法 的效 相 同 的行 得 到 约 简 表 算 率 急 剧 下 降 ,过 长 的运 行 时 间 使 得 粗 糙 集 理 论 的优 势 无 法 体 现 改进 后 的约 简算 法 基 本 思 路 如 下 : 出 来 。对 于海 量 数 据 挖 掘 丽 言 . 据 约 简 更 具 有 特 殊 的 意 义 . 数 一 ① 初 始化约简集为空 ; 个 高 效 的 约 简算 法 可 以通 过 缩 减 原 始 数 据 库 的数 据 量 。提 高 数 ② 计算所有不在约简集 中的条件属性 的重 要度并排序 : 据 挖 掘 的效 率 ③ 取重要度 最大 的条 件属性 , 其加 入约 简集中 , 判断 将 并 1 粗 糙 箍 理 论 的 基 本 概 念 . 此时约简集的依赖度, 若依赖度为 1则算法结柬, , 否则转②。

一种基于粗糙集的属性值约简方法

一种基于粗糙集的属性值约简方法
( 兰州大学信息科学 与工程学 院 甘肃 兰州 7 0 0 ) 3 0 0 甘肃 兰州 7 0 5 ) 3 0 0 ( 兰州工业高等专科学校电子信息工程系


利用矩 阵的可操作性等优点 , 将决策表 中的知识通过 区分矩阵反映 出来 , 对决策表 的值 约简操作转换 为对 矩阵 的运算。
提 出基 于区分矩 阵的一些重要性质及在此基础上 的属性值约简方法 , 最后通过 实验和 实例验证 了该 算法是有 效可行 的。
关 键 词 粗 糙 集 区分 矩 阵 属 性 值 约 简 属 性 重 要 度
ATTRI BUTE VALUE REDUCTI oN ALGoRI THM BAS ED oN RoUGH SET TH Eo RY
Ch n Xio u e ay n La n h a , n Co g u
Ke wo d y rs
Ro g e D s e n b e marx A t b t au e u t n At iu e sg i c n e u h st ic r a l t t i u e v le r d ci i r o t b t inf a c r i
U 如果 Va∈P, , 都有 f , )=f Y a 。说 明仅 仅根据 条件 ( a (,)
0 引 言
粗糙集理论是一种新 型的处理不 确定 的 、 模糊 的和不完 整
属性子集 P提供的信息 , 无法将对 象 , Y区分开来 , 称对象 , Y 在条件属性子集 P上是不可 区分 的 , 记为 : D( I P):{ ,)∈ N ( Y U×UI Va∈ P , ) 厂 Y a }I D( 是 U上的等价关 系。 a :_ , ) , ( N P)
信息 的数学工具。在粗糙集 理论 中, 知识被 看作是关 于论域 的 划分 , 是一种对对象进行分类 的能力 , 理论是建立 在集 合的基 该
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

粗糙集-属性约简-matlab程序
Data2为条件属性,decision2为决策属性
%%%my_test函数实现
clc;
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%读取信息系统文件
file = textread('data2.txt','%s','delimiter','\n','whitespace',''; %读取文件信息,每一行为一个胞元
[m,n]=size(file; %胞元的大小
for i=1:m
words=strread(file{i},'%s','delimiter',' ';%读取每个胞元中字符,即分解胞元为新的胞元
words=words';%转置
X{i}=words;
end
X=X';
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%
[B,num,AT]=my_reduct(X; %信息系统的约简
ind_A T=ind(X; %信息系统的不可等价关系
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%显示约简信息系统
disp('约简后的条件系统为:';
[m,n]=size(B;
for i=1:m
disp(B{i};
end
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %读取决策系统文件
file = textread('decision2.txt','%s','delimiter','\n','whitespace','';
[m,n]=size(file;
for i=1:m
words=strread(file{i},'%s','delimiter',' ';
words=words';
D{i}=words;
end
D=D';
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%决策系统的正域约简
X_D=X;
[l,k]=size(X_D{1};
pos_d=pos(X_D,D;%正域
for i=1:m %%%%%%%%%%%%%%正域有问
题%%%%%%%%%%%%%%%%%%%%%%%%%%%
if(~ismember(num(i,pos_d
B{i}=''; %若约简后的信息系统B{i}不在正域中则删除该行
end %因为相同的条件得到的决策不一样,
end
%将在正域规则下约简过的信息系统B连接决策系统D
[m,n]=size(B;
for i=1:m
if(~isequal(B{i},''
B{i}{1,k+1}=D{i}{1};
end
end
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%显示约简决策系统
disp('约简后的决策系统为:';
[m,n]=size(B;
for i=1:m
disp(B{i};
end
--------------------------------------------------------------------------------
%%%%%my_reduct函数实现
function [C,num,reduct_attr]=my_reduct(X
%%%%%y为约简后的cell数组,reduct_attr为可约去的属性
%X为行向量(元素为胞元
clc;
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%约简
[m,n]=size(X;
[p,k]=size(X{1};
ind_A T=ind(X;%寻找不可等价关系
reduct_attr=[]; %可约去的的属性
num=zeros(m,1;%约简后的信息对应的个体
for i=1:k
B=delete_A T(X,i;
if(isequal(ind_A T,ind(B %若IND(AT-{a}=IND(A T
reduct_attr=union(reduct_attr,i; %则寻找到可约去的属性
X=B;
end
end
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%剔除重复的行
k=1;
for i=1:m
if(~isequal(ind_A T{i},[]
C_i=ind_A T{i,1}(1;
num(k=i;
C{k,1}=X{C_i}; %返回约简后的信息系统
k=k+1;
end
end
--------------------------------------------------------------------------------
%%%%%ind函数实现
function
yy=ind(X %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%寻找不可分辨关系[m,n]=size(X;
k=1;
ind_A T=cell(m,1;
for i=1:m
for j=(i+1:m %潜在问题,如i=m是终止循环,此时若最后一行不为空的话,将漏扫if(~isequal(X{i},'' %若X{i}不为空
ind_A T{k}=union(ind_A T{k},i; %不可等价关系赋初值
if(isequal(X{i},X{j}
X{j}=''; %若X{i}==X{j},则删除X{j}
ind_A T{k}=union(ind_A T{k},j; %寻找不可等价关系
end
end
end
k=k+1;
end
--------------------------------------------------------------------------------
%%%delete_A T函数的源代码
function y=delete_AT(X,ATi % 删除X中第i列的属性值
[m,n]=size(X;
[l,k]=size(X{1};
for i=1:m
X{i}{A Ti}='';
end
y=X;
-------------------------------------------------------------------------------- %%%%%pos函数实现
function pos_d=pos(X,D%求决策系统的正域函数
%X为条件属性,D为决策属性
ind_D=ind(D; %求决策属性D的不可等价关系
[m,n]=size(ind_D;
ind_X=ind(X; %求信息系统属性X的不可等价关系
low=[]; %存储正域个体的编号
for i=1:m
for j=1:m
if(~isequal(ind_X{i},[]&&~isequal(ind_D{j},[]
if(ismember(ind_X{i},ind_D{j}
low=union(low,ind_X{i};%由性质Pos_A T(d=low_AT(X1Ulow_A T(X2U... end
end
end
end
pos_d=low;。

相关文档
最新文档