基于信息最大覆盖率蚁群算法的 Rough 属性优化约简
一种基于蚁群优化的粗糙集属性约简方法

一种基于蚁群优化的粗糙集属性约简方法
孙涛;蒋科艺;王永华;马力
【期刊名称】《海军航空工程学院学报》
【年(卷),期】2011(026)001
【摘要】针对基于智能优化算法的属性约简方法存在的问题,在扩张矩阵概念的基础上,将属性约简问题转化为几何路径寻优问题,通过改进最大-最小蚂蚁系统(MMAS)算法,提出了一种基于蚁群优化的粗糙集属性约简方法,给出了相关参数的定义和详细算法流程,在UCI数据集上测试了该算法,结果表明了算法的有效性.【总页数】5页(P96-100)
【作者】孙涛;蒋科艺;王永华;马力
【作者单位】海军航空工程学院飞行器工程系,山东,烟台,264001;海军航空工程学院飞行器工程系,山东,烟台,264001;海军航空工程学院飞行器工程系,山东,烟
台,264001;海军驻沈阳地区军事代表室,沈阳,110015
【正文语种】中文
【中图分类】TP183
【相关文献】
1.一种基于灰色变精度粗糙集的属性约简方法及其应用 [J], 宋李俊;周怡伶;谷和平
2.基于邻域粗糙集和蚁群优化的属性约简算法 [J], 张冬雯;王鹏;仇计清
3.一种基于灰色变精度粗糙集的属性约简方法及其应用 [J], 宋李俊;周怡伶;谷和平;
4.利用蚁群优化算法的粗糙集属性约简方法 [J], 吴尚智;张文超;余志用;张霞;段超
5.基于决策理论粗糙集的一种新属性约简方法 [J], 姚晟;吴照玉;陈菊;王维
因版权原因,仅展示原文概要,查看原文内容请购买。
一种基于Rough集的属性值约简算法

一种基于Rough集的属性值约简算法
胡斐;张峰筠;刘少辉
【期刊名称】《计算机工程与应用》
【年(卷),期】2003(039)031
【摘要】文章将Rough集理论应用于不同类型的决策表(一致决策表和不一致决策表)的约简,给出了广义决策、决策规则的一致程度、属性值重要性等定义,在此基础上提出了一种基于Rough集的属性值约简算法.该算法不仅能得到更为简洁的决策规则,而且能保持决策规则的一致程度不变.实例分析表明该算法是可行的.
【总页数】4页(P48-51)
【作者】胡斐;张峰筠;刘少辉
【作者单位】上海体育学院体育管理系,上海,200438;上海体育学院体育管理系,上海,200438;中国科学院计算技术研究所智能信息处理重点实验室,北京,100080【正文语种】中文
【中图分类】TP18
【相关文献】
1.一种基于聚类划分的并行粗糙集属性值约简算法 [J], 陈燕云;肖坤楠;邱建林
2.一种新的基于属性重要性的粗糙集值约简算法 [J], 刘甲伟;栾爽
3.基于Rough Set理论的一种属性值约简算法 [J], 马凌;蒋外文;王加阳
4.基于粗糙集的一种属性值约简算法及其应用 [J], 吴尚智
5.基于属性值重要性的Rough集值约简算法 [J], 宋旭东;朱伟红;宁涛
因版权原因,仅展示原文概要,查看原文内容请购买。
基于可拓蚁群算法的粗糙集属性约简方法

的边表示对下一个结点 的选择
22 问题 的 描 述 . 给 定 一 个 决 策 表 . ( R, ,寻 找 粗 糙 集 的 最 s , V = 小 约 简集
_
T e1I ( 【 I _ A f k k 【 + 1 ’
, 表示 t ()
03 .6 1 l 0 2 0 C4 .5 6 l 0 0 9 C5 . 1 2 l 0 1 9 C6 .3 6 l 0 9 0
时刻路径 V 上信息量 的值。 i i 初始时刻 . 蚂蚁不具备任何经验 , 为各弧段 上的 认 信息 素是相 同的, 为一个常数 C, ( )C 即 £= 。 。
() 2 启发信息元 : L J 文中选 择信息熵作 R =R 。 , 为启发信息。
c 3 蚁元 : A=
om 和 V M n z ri . aiz e o提出的一种新 型模拟进化算法 。该
算 法 为求 解 复 杂 的组 合 优 化 问题 提 供 了一 种 有效 的 方
法 。然而 . 它并不完美 , 例如搜索 时间长等 。可拓学『 l 1 是 我 国学者 2 世 纪 8 年代初 提出的一 门原创性 交叉学 0 0
() 1
其 中,t [ [ = ]
o( l ≥0 和 p p ) 别 表 示 ) ( ≥0 分
1 可 拓 蚁群 算 法 的描 述
11 初 始化信 息 的物 元 【 述 . 1 】 描
基于可拓学 的物元理论 .初 始化信 息可以表现为
如 下 形式 :
信息素和启发信息 的重要程度 。 () 2 计算关联 函数值 :
一 : :1 > 0 K < 0 K 0 1 3 0.9 3 ‘ .91 — 0 4 ” <0 K : ”
基于蚁群优化的属性约减方法研究

sga) i( 最大 , 则取属 n 并将 M1 陛 , 约减成 M :
=
2 V oe, Mo ) Ⅱ ∈C r 从 中消去列 口 中取值 为 1 对应 的所有 行及 , 所
该 列 , M 1 得 ;
[ 苫。 草] ; : x 3 ) ,
(43 ) ' ,7 2 5 7 6
o
/ 4
重复步骤 3 , : )得 s a) 留(。:s a) 喀(s= 。 皙(z一5 n) 哲( =s “)
3 对 于一个二元辨识 矩阵 ^ ) 根 据如下公式计算 其各属性 ) 以(≥1 ,
减等等 。 2基 本 概 念 .
根据定义 3 可得如下二元辨识矩 阵 M ,
I l
定 义 称 ( A, ) 一 个 信 息 系 统 , 中 u 为 对 象 集 , u, F 是 其 即
U=。 1T, z ) A为属 性集 , A= ,2 .& } F为 U 与 A 『, 2…, 。 J 即 la… , 。
O O
O
个 较小 的属性 集 B[ A , 使得 可用 A描述 的对象 集合必 然可用 上 描 {
0
0
O
O
述, 从而消除冗余属性 。属性 约减 简化了分类的标准 , 同时也使人们更 加深 入地认识分类的实质 。
定 义2 设 , F) 一个信 息系统 , 于 B A , RBm A, 是 对 若 RA, - 称 B是属性协 调集。若 B是属性协调集 , B 的任何真子集均不是 属 而 性协调集 , 则称 B为属性约减集 。 由于 RA, RB L 总成立 , 从而 RA=RB 等价于 RB RA。 定义 3设 , F) 一个 信息 系统 , 所对 应 的二元 辨识 矩 阵 A, 是 其 mo 定义 为 : 共有 列 , Mo 每一列对应一个属性 , 每一行对应 论域 中的
基于粗糙集和蚁群优化算法的特征选择方法

* **
& 488 &
南京大学学报 ( 自然科学 )
权重参数蚂蚁数量m满足n实验结果与分析为了表述方便分别称蚁群优化算法贪婪法和基于粗糙集蚁群优化方法的特征选择算法为算法1算法2和算法其中算法1和算法3中取蚁群迭代10次所得到结果的平均值作为最终测试结果三种方法在不同数据集上的测试结果tableexperimentresultsdifferentdatasetsthreemethods数据集编号算法1算法85714857141818216867390241699615385173751012436161674535428可以看出本文提出的将粗糙集和蚁群优化方法相结合的特征选择算法与基于粗糙集的特征选择算法或者基于蚁群优化方法的特征选择算法相比不管是在特征子集的长基于粗糙集和蚁群优化算法的特征选择方法度上还是在特征子集的精度上都具有一定的优势
[ 7]
与其他方法相结合的优点. 本文将粗糙集方法 和蚁群优化算法各自的优势相结合应用于特征 选择中, 提出一种基于粗糙集蚁群优化方法的 特征选择算法. 所提出的方法将粗糙集的属性 依赖度和重要度作为启发性信息应用于转移规 则中, 并用粗糙集方法的分类质量和特征子集 的长度来构建信息素更新策略.
1
粗糙集理论的相关概念[ 12, 13]
X ! U/ Q
算法能保证得到相对最优特征子集 , 但是
, C为
随着处理的数据集规模增大, 算法的效率会有 所下降 . 随机搜索策略在计算过程中将特征选 择问题与模拟退火算法、 禁忌搜索算法和遗传 算法
基于蚁群算法的属性约简方法

基于蚁群算法的属性约简方法朱元凯;陈涛;陈亮【摘要】在粗糙集理论中属性约简是个NP—hard问题,已有的方法都有不同的局限性.由蚁群算法的启发,通过粗糙集将条件属性集映射到有向图结构,并采用蚁群协作共同完成求解,提出了属性约简的蚁群算法.%Attribute reduction in rough sets theory is a kind of NP - hard problem. The existing methods for solving this problem have limits. By the construction of the graph expressing the combination of condition sets, a new approach to attribute reduction based【期刊名称】《泰山学院学报》【年(卷),期】2011(000)003【总页数】4页(P35-38)【关键词】蚁群算法;粗糙集;属性约简【作者】朱元凯;陈涛;陈亮【作者单位】泰山职业技术学院信息工程系,山东泰安271000;泰山学院数学与系统科学学院,山东泰安271021;泰山职业技术学院信息工程系,山东泰安271000【正文语种】中文【中图分类】TP311粗糙集理论是分析不完整、不精确甚至是不一致信息系统的有力工具.知识约简是粗糙集理论研究中的核心问题,现在已经证明了粗糙集寻找最小属性集是一个NP 难问题,这是由属性组合爆炸问题造成的.近年来,由意大利学者Dorie M等提出来的蚁群系统(Ant System)与蚁群算法(Ant Colony Algorithm),是一种通用的启发式算法,主要模拟自然界蚂蚁觅食,通过在路径上信息素的传递,最终发现一条最短路径的过程.它的主要特征是采用正反馈机制、具有较强的鲁棒性和适于并行处理.本文结合粗糙集相对核的概念和蚁群算法提出了一种新的属性约简方法,既能充分利用蚁群算法的并行优化处理能力,也能解决初期信息素匮乏造成的速度慢的问题.1 属性两两间的依赖度属性的重要性的定义及形式为:令Ø⊂X⊆U,Ø⊂Y⊆U,U/Y≠δ={U},给定x∈X 在X中的重要性为当X只有一个元素x时,x在X中重要性(相对于Y)为由于|SX(Y)|/|U|就是Y关于X的支持度,记为sptx(Y).可得结论:sptx(Y)越高,X 相对于Y也就越重要,X也就越有可能属于核.2 有向图的构造根据1中的属性间的依赖关系确定有向图中各结点间的连接关系,其中一个结点对应一个属性.构造步骤如下:(1)选取第一个结点j={i|max(sigX(i))且min(sigi(x)),x∈A(所有的属性)};(2)作两条有向边<j,i1>和<j,i2>,i1和i2={i|min(sigX(i)),x∈A(所有的属性)};(3)选取下一个结点j={i|max(sigX(i))∧min(sigi(x)),x∈A'(未被选过的点或属性)};(4)作两条有向边<j,i1>,<j,i2>,i1,i2={i|min(sigX(i))∧x的入度≤b,x∈A(未被选过的点)}.其中,b为预先设定的量大入度数;(5)重复(3)和(4),直到所有的结点都已经选取;(6)做起始结点s,选取入度小于2(或相对其它所有属性依赖度较低的)结点k,作有向边<s,k>,如此作两条边;(7)做终点e,选取出度小于2(或其它所有属性与之相对依赖度较低的)结点作k,作有向边<k,e>,如此作两条边.3 有向图的各结点的信息量初始值在以上构造的有向图中选取任意一个中间结点Ⅰ,其信息量的初值=n1+n2,其中: n1=|{j|sigx(I)>a,a为预先设定的最小依赖度}|,n2=|{j|sigI(x)<b,b为预先设定的最大依赖度}|,其它结点的信息量初值类似计算.4 确定目标函数根据最小约简的要求,约简的性能主要取决于两个方面:所含条件属性的个数和决策属性对其依赖度.对某一属性子集,其含属性个数越少,决策属性对其依赖度越大,则最有可能成为最小约简[2].构造目标函数如下:该函数由两部分组成:第一部分,其中|U|表示论域的长度,card(x)表示个体x中1的个数,即x中所含条件属性的个数,其含义为不包含在个体x中的属性所占的比率,如果x中属性的个数越少,f(x)的值就会越大[3],目的是希望x中所含条件属性的个数尽可能的小;第二部分spt(x)表示x的支持度,即个体x中所含的条件属性对决策属性的支持度[4],目的是希望x中所含条件属性对决策属性的支持度尽可能的大.5 算法描述(1)设定蚂蚁的总数为m,循环次数为t,各结点的信息量(激素)浓度由3中的方法确定,△τij=0,全部蚂蚁放入结点S,pathk={蚂蚁k经过的结点}.(2)取新蚂蚁k,path=Ø.(3)计算蚂蚁k从当前结点i转移到下一结点j,概率如公式计算,如果概率相同时选择一个信息量最大的结点.其中:ηij=1/dij为路径<i,j>的可见度:α和β分别表征信息素的迹和路线可见度的相对重要程度,α,β≥0,经过实验α、β在区间[1,5][5]取值效果较好.(4)把j存入pathk,如果所有属性全部选取或已经达到结点e,转下一步;否则转(3).(5)计算目标函数,如果较前次的好,则记录下来.(6)按以下公式的调整各结点的信息量(激素)值:在蚂蚁k经过的路径上(7)如果所有蚂蚁路径已经相同,则输出路径后结束;否则转(2).6 实例应用在信息系统中属性算法的研究中,选取典型的一组数据组成IS信息系统(如表1),分别应用经典的属性约简算法、基于蚁群算法的属性约简算法,实验过程结果如下: 表1 信息系统ISIS a b c d e 1 0 1 2 0 1 2 1 2 0 0 3 1 0 1 1 2 4 2 1 0 1 5 1 1 0 2 0对表1采用属性约简的定义算法计算方法处理,得到表1的核Core(IS)={b}和一个约简RED= {a,b}.实验2使用基于蚁群算法的属性约简算法计算信息系统的核和约简集.实验3增加属性,再使用基于蚁群算法的属性约简算法计算信息系统的核和约简集.实例分析:(1)实验1与实验2的结果约简核和约简集一致,经过对新增属性的信息系统采用以上两种算法计算(即实验3),约简核和约简集仍一致.(2)实验2所用时间实验有明显提高,实验3所用时间(即增加属性后)比实验2增加不明显.7 实验分析为了测试基于蚁群算法的属性约简算法的性能,选择典型的测试函数对基于蚁群算法的属性约简算法、属性基本定义算法和基于遗传算法属性约简算法的进行测试. 三种算法参数设置相同:属性共200个,表共20个,每表记录数平均为1万条.各测试函数变量维数为50,三种算法中的局部迭代次数为100,全局迭代次数为5000.当精度达到0.0001时,算法将停止迭代。
基于蚁群算法和粗糙集方法的图像聚类分析研究

基于蚁群算法和粗糙集方法的图像聚类分析研究艾凌云【摘要】Aim To solve the classification and performance problems of image recognition, a clustering analysis method is proposed for image clustering by combining the rough set theory and the ant colony algorithm. Methods First of all, the total samples were numbered and corresponding digital features were extracted. Then they were clustered by using the ant colony algorithm. Finally, the performance of the clustering was evaluated by using the principle of the positive domain of rough set theory. Results Compared with the method based on GA, the proposed method can reach better clustering performance. Conclusion The advantages of ant colony algorithm in optimization ability and rough set in dealing with information, are greatly helpful for realizing effective clustering analysis of digital images.%目的为了解决图像识别中类别划分及划分性能问题,提出基于粗糙集和蚁群优化方法相融合的图像聚类分析方法.方法先对所有样本进行编号并提取数字特征后,采用蚁群优化方法进行数字聚类,最后采用基于粗糙集理论的正域关系进行聚类结果评价.结果与遗传算法实验比较,所提出的方法能获得更理想的聚类结果.结论利用蚁群算法的寻优能力和粗糙集的不确定信息评价的优势,对数字图像进行聚类分析是有效的.【期刊名称】《西北大学学报(自然科学版)》【年(卷),期】2011(041)005【总页数】5页(P808-812)【关键词】蚁群算法;粗糙集;特征提取;聚类分析;数字图像识别【作者】艾凌云【作者单位】永州市职业技术学院,湖南永州425006【正文语种】中文【中图分类】TP301随着网络技术和数据存储技术的迅速发展,各个机构组织积累了大量的数据。
蚁群优化算法技术介绍

目录
• 蚁群优化算法概述 • 蚁群优化算法的基本原理 • 蚁群优化算法的实现过程 • 蚁群优化算法的改进与优化 • 蚁群优化算法的案例分析
01 蚁群优化算法概述
定义与原理
定义
蚁群优化算法是一种模拟自然界 中蚂蚁觅食行为的仿生优化算法 。
原理
通过模拟蚂蚁的信息素传递过程 ,利用正反馈机制寻找最优解。
算法特点
分布式计算
蚁群算法中的蚂蚁可以并行地搜索解空间,提高了算法的搜索效 率。
鲁棒性
对初始解和参数选择不敏感,能在多变的搜索空间中寻找到最优 解。
易于实现
算法实现简单,可扩展性强,适用于解决复杂优化问题。
应用领域
路径规划
任务调度
用于解决车辆路径规划、 物流配送等问题。
应用于多核处理器任务 调度、云计算资源分配
蚂蚁的移动规则
随机选择
蚂蚁在移动时,会根据当前位置和目标位置之间的路径上信息素浓度随机选择 下一个移动的节点。
避免重复
为了避免重复访问同一个节点,蚂蚁会根据一定的概率选择新的节点,这个概 率与路径上的信息素浓度成正比。
蚂蚁之间的协作机制
共享信息
蚂蚁通过释放和感知信息素来共享彼此的路径信息和状态,从而在群体中形成一 种协作效应。
网络路由问题求解
总结词
蚁群优化算法在网络路由问题求解中具有较好的应用 效果,能够优化网络路由和提高网络性能。
详细描述
网络路由问题是一个重要的网络通信问题,旨在根据 网络拓扑结构和通信需求,选择最优的路由路径和转 发策略,以实现数据包的可靠传输和网络性能的提升 。蚁群优化算法通过模拟蚂蚁的行为,利用信息素传 递机制来指导搜索过程,能够有效地解决网络路由问 题,优化网络路由和提高网络性能。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
四川理工学院学报( 自然科学版)
J o u r n a l o f S i c h u a nU n i v e r s i t yo f S c i e n c e&E n g i n e e r i n g ( N a t u r a l S c i e n c eE d i t i o n )
}, 定义 5 设有非空集合 A ,S = { A 其 , A , …A 1 2 m
a r d ( UC )表示 U基于条件属性 C不可分辨 这里 c 关系的等价类的数目, c a r d ( U )表示有限论域 U中可分 辨的集合的基数。 定理 1 在一个知识表达系统中, R =C∪ D是属 性集, C和 D分别是条件属性集和决策属性,如果该决
4 ] 定义 2[ 在一个知识表达系统中, 基于条件属性
C的 不 可 分 辨 关 系 的 等 价 族 集 合 表 示 为 P = 这里 X j 是基于条件属性由某些 U C =( X 1 , X 2 , …X j ), 研究对象 x 构成的等价集合; 基于条件属性 C描述决策 属性 D表达的信息一致性定义为
i
中A , 且A i =1 , 2 ,…,m ) , 若A i A i≠ Φ ( 1∪ A 2∪ A , 则称 S是集合 A的一个 3∪ … ∪ A i∪ … ∪ A m =A 覆盖。 定义 6 在一个信息系统集合覆盖问题( s c p ) 中, 给 定一个所有的元素值都为 0或 1的 m ×n矩阵 A , A= [ a ], 矩阵中的每一列 都 给 定 一 个 非 负 的 代 价 b 当 i j j, a 1时, 就认为第 j 列覆盖了第 i 行, s c p的目标就是 i j= 选择一个带有最小权重的覆盖了矩阵中所有行的矩阵 行的子集, 用J 代表矩阵列的一个子集,y j是一个二进 制变量, 如果 j , 那么 y 1, 否则 y 0, s c p 的形式 ∈J j= j= 化定义如下:
文章编号: 1 6 7 3 1 5 4 9 ( 2 0 1 1 ) 0 4 0 4 5 2 0 4
基于信息最大覆盖率蚁群算法的 R o u g h集 属性优化约简
曾黄麟, 黄 艳
( 四川理工学院自动化与电子信息学院,四川 自贡 6 4 3 0 0 0 )
摘 要: 属性约简是一个 N P难问题, 这种算法不仅复杂而且非常耗时。因此本文提出了一种基于 等价划分的信息一致性的属性约简算法, 降低了属性约简计算复杂度, 并将信息最大覆盖率和属性重要 性作为蚁群优化算法的信息素进行添加式属性约简, 既减小了属性约简的空间复杂度, 也提高了计算效 率。最后通过一个具体的例子, 证明了此算法的有效性和可行性。 关键词: 蚁群优化; 粗糙集; 决策表; 属性约简; 信息覆盖率 中图分类号: T P 1 8 文献标识码: A 一个整体, 采用逐次去掉每个属性的方法, 空间复杂度 较大, 用计算机进行计算的时候, 要浪费太多的存取空 间, 也会影响算法的速率。 本文针对一个协调数据系统, 根据系统的信息一致 性定义, 提出一种更简单的属性约简方法, 并利用信息 覆盖率的概念, 选出系统具有最大的信息覆盖率的约简 属性最小子集。将信息最大覆盖率作为属性重要性应 用于蚁群优化算法的信息素, 采用逐 次 添 加 属 性 的 方 法, 通过启发式算法, 选出系统具有最大的信息覆盖率 的最小约简属性集。
i j j j
j = 1
y j =1
( 8 )
基数, 表示数据表中属性 R i不同的属性值数目。 对于一个根据采集的数据构成的决策信息系统, 某 一属性 R 则该数据决策信息系统能提供的最大 i约简后, 协调数据信息覆盖率为: G j ≠i = N j ≠i
其中式( 1 ) 给出的约束强制要求矩阵中的每一行至 少被一列覆盖, 换句话说, 选出来的列集合必须覆盖所 有的行。 2 . 2 蚁群算法求解最小属性约简集 蚁群算法求解的重要构件元素: 节点: 把每个属性的不可分辨关系的等价族集合作 为蚁群算法的节点; 约束: 要求每个节点最多只能被一只蚂蚁访问一 次, 而且问题的解必须覆盖信息系统中的所有样本。 信息素与启发式信息: 信息素与属性相关联, 成分 j 上的信息素 τ 的期望度, 所有 j量度的是解中包含成分 j 属性的信息素都初始化为一定值, 利用信息最大覆盖率 和属性重要性作为蚁群优化算法的信息素的启发式信 息: η j =β i =1- N j ≠i
第2 4卷第 4期 曾黄麟等: 基于信息最大覆盖率蚁群算法的 R o u g h 集属性优化约简 Q C = ( UC ) c a r d c a r d ( U ) ( 1 ) 2 . 1 蚁群算法中的集合覆盖问题
4 5 3
目前, 用蚁群优化算法进行属性约简主要通过差别 矩阵先求出属性核, 然后在属性核的基础上, 并采用逐 次去掉每个属性的办法, 再求出属性约简, 这种算法不 仅复杂而且非常耗时, 而且空间复杂度较大, 用计算机 进行计算的时候, 要浪费太多的存取空间, 也会影响算 法的速率, 因此, 在这里我们提出一种新的属性约简方 法, 这种方法是上述方法的逆向思维, 也就是采用逐次 添加属性的方法来达到属性约简的目的。
τ η i i
∑ τη
k l ∈N
l l
k k 其中 N 表示第 k只蚂蚁下一次可以 如果 i ∈N, k 访问的节点, 对N 来说, 至少存 在 一 个 未 被 覆 盖 的 行
( 样本) , 当所有的行都被覆盖( 即t ) 以后, 蚂蚁就 2 =n 完成了一个解的构建。 2 . 3 基于信息最大覆盖率蚁群算法的属性优化约简算 法 置两个访问数组 v i s i t e d 1 [ ] 和v i s i t e d 2 [ ] , v i s i t e d 1 [ ] 用来记录已访问的节点, v i s i t e d 1 [ j ] =1时, 表示节点 j 已访问, v i s i t e d 2 [ ] 用来记录已覆盖的样本,v i s i t e d 2 [ i ] =1 时, 代表样本 i 已被添加进来( 已被访问) , 并用 t 1和 t 2 记录已访问的节点个数和样本个数。 ( s =n ) , 蚂蚁最大迭代次数 设置蚂蚁的个数为 s 为N C= 1 0 0 , c o u n t = 0 。算法的步骤如下: 1 参数初始化: c o u n t =c o u n t + 1 ( 迭代次数) , 释放 只蚂蚁, k=0 , 且 k=k + 1 , 置访问数组 v i s i t e d [ n ]= 第k 1 0和 v i s i t e d [ m ] =0。 2 2 根据启发式信息公式( 3 ) 和信息素组成的行为 选择规则公式( 4 ) 选择节点 j , 并使 v i s i t e d [ j ] =1 , t 1 1 = 1 , 并依照样本覆盖算法来逐次选择样本 i , 并使 t 1+ v i s i t e d [ i ] =1 , t 1, 若此次不能再添加样本, 转 2 2 =t 2+ 步骤 3 。 3 判断节点是否被全部访问, 即判断 t , 如果 t 1 1≠ n , 转步骤 4 , 如果 t , 转步骤 5 。 1 =n 4 判断样本是否被全部覆盖, 即判断 t , 如果 t 2 2≠ m , 转步骤 2 , 如果 t 。 2 =m转步骤 5 5 根据蚁群优化算法对蚂蚁 k构建的路径进行信 息素更新, 转步骤 2 。 6 判断迭代次数, 如果 c o u n t <N C, 转步骤 1 , 如果 c o u n t C, 则迭代终止。 ≥N 以下给出一个简单的例子来描述信息系统集合覆 盖问题在属性约简中的应用。我们以分析学生就业知 识系统为例, 来证明本文方法的有效性和可行性。一个 学生就业情况的调查数据如表 1所示。 ( i= 在该表中论域 U是考察的学生对象的全体 x i 1 , …, 1 5 )。在条件属性中 R 1表示汉族, 2 1 表示民族( 其他民族) , R 1女, 2男) , R R 2 表示性别( 3 表示身材, 4 表示基础课成绩, R R 5 表示外语水平, 6 表示计算机应用 R R R 水平, 7 表示背景及社会关系, 8 表示专业水平, 9表 示动手能力, R (R 优, 1 0表示社交能力, 1 -R 1 0中表示 1 2良, 3中) ,R 1表 示 是, 2表 示 1 1 表示学 生 干 部 与 否 ( D表示就业情况( 1优, 2良, 3中, 4差) 。 否) , 根据信息一致性定义,利用定理 2进行系统的属性
是通过差别矩阵先求出属性核, 然后在属性核的基础上 再求出属性约简, 这种算法不仅复杂而且非常耗时。而 且他们所使用的属性约简方法, 大多是把所有属性作为
收稿日期: 2 0 1 1 0 6 2 2 基金项目: 四川省技术厅应用基础研究专项课题( 2 0 1 1 J Y 0 0 5 1 ) ; 四川省白酒及生物技术重点实验室重点专项课题( N J 2 0 1 0 0 1 ) 作者简介: 曾黄麟( 1 9 5 5 ) , 男, 四川富顺人, 教授, 博士, 主要从事粗集理论、 人工神经网络及模糊控制等方面的研究。
n j = 1 , j ≠i
∏
n j = 1 , j ≠i
i=1 , 2 …, n V R
i
( 5 )
这里 N 表示某一属性 R 约简后, 数据信息系统能 j i ≠i 提供的协调有用数据数目, ∏ 数据对象数目。 定义 4 性定义为: β i =1- N j ≠i
n j = 1 , j ≠i [ 5 ] n
n
略后的条件属性描述决策属性 D表达的信息一致性。 由公式( 3 ) 可以看到, 利用信息一致性计算系统条 件属性简化, 比利用不可分辨性, 协调性, 条件熵等方法 计算系统条件属性简化 定义 3 定义为: G= U n
[ 8 ] [ 1 3 ]
, 计算复杂度将大大降低。
一个知识表达系统, 当用一张数据表表
7 ] 策系统是一个协调系统, 文献 [ 已证明, 则存在