一种不完备信息系统的约简方法

合集下载

不完备信息系统的属性约简方法研究

不完备信息系统的属性约简方法研究

不完备信息系统的属性约简方法研究
程玉胜;胡学钢;江效尧
【期刊名称】《计算机工程与应用》
【年(卷),期】2004(040)001
【摘要】该文从经典的粗糙集对完备信息系统的属性约简方法入手,为避免不完备系统的完备化处理,修改了传统意义上的差别函数,在不生成分辨矩阵的情况下,提出基于按桶散列的物理存储方法,并利用逻辑运算中的吸收律直接对不完备信息系统进行约简.
【总页数】3页(P68-70)
【作者】程玉胜;胡学钢;江效尧
【作者单位】合肥工业大学计算机学院,安徽,合肥,230009;安庆师范学院数学计算机系,安徽,安庆,246011;合肥工业大学计算机学院,安徽,合肥,230009;南京审计学院计算机科学与技术系,南京,240029
【正文语种】中文
【中图分类】TP31
【相关文献】
1.基于边界域的不完备信息系统属性约简方法 [J], 刘芳;李天瑞
2.应用近似模糊熵的不完备信息系统属性约简 [J], 汪琼枝;郑文曦;王道然
3.基于扩展容差关系的不完备信息系统属性约简 [J], 罗豪;续欣莹;谢珺;张扩;谢新林
4.基于粗糙集的不完备信息系统增量式属性约简 [J], 李成;赵海琳
5.不完备信息系统属性约简算法研究 [J], 刘巧云
因版权原因,仅展示原文概要,查看原文内容请购买。

基于遗传算法的不完备信息表约简方法

基于遗传算法的不完备信息表约简方法

基于遗传算法的不完备信息表约简方法
孙晶晶;刘镔;刘粉林
【期刊名称】《计算机工程与应用》
【年(卷),期】2005(041)022
【摘要】粗糙集理论是一种较新的处理模糊和不确定知识的软计算工具.针对粗糙集理论中不完备信息系统的容差关系的一种改进模型,结合遗传算法的全局优化和隐含并行性的特性,给出了一种不完备信息系统属性约简方法,经仿真实验知该算法是有效的,能得到不同概念层次的所有相对最小约简.
【总页数】3页(P174-176)
【作者】孙晶晶;刘镔;刘粉林
【作者单位】解放军信息工程大学信息工程学院,郑州,450002;解放军信息工程大学信息工程学院,郑州,450002;解放军信息工程大学信息工程学院,郑州,450002【正文语种】中文
【中图分类】TP18
【相关文献】
1.基于动态容差关系的不完备信息表约简研究 [J], 李龙澍;纪霞;汤伟
2.动态内容完备信息表约简的更新算法 [J], 吴正江
3.基于模糊粗集的不完备信息表属性约简新算法 [J], 邱卫根;罗中良
4.基于相容关系分配约简遗传算法的高校人事不完备信息系统的设计 [J], 姜萱;徐红梅
5.基于遗传算法的不完备信息系统属性约简方法 [J], 陶志;刘庆拯;李卫民
因版权原因,仅展示原文概要,查看原文内容请购买。

不完备系统中的一种多粒度粗糙集粒度约简算法

不完备系统中的一种多粒度粗糙集粒度约简算法

不完备系统中的一种多粒度粗糙集粒度约简算法
胡善忠;徐怡;何明慧;王冉
【期刊名称】《微电子学与计算机》
【年(卷),期】2018(35)6
【摘要】本文针对不完备决策信息系统,首先给出粒度上属性值缺失率的定义,结合粒度重要度和粒度上属性值缺失率定义粒度组合重要度,然后以粒度组合重要度为启发函数,设计了新的粒度约简算法,通过调节参数,该算法在保证约简率的同时可以得到属性值缺失率较低的粒度约简结果,最后,实验验证了本文所提算法的有效性.【总页数】6页(P41-46)
【关键词】粗糙集;粒度约简;不完备系统;缺失率;组合重要度
【作者】胡善忠;徐怡;何明慧;王冉
【作者单位】安徽大学计算机科学与技术学院;安徽大学计算机智能与信号处理教育部重点实验室
【正文语种】中文
【中图分类】TP18
【相关文献】
1.一种基于知识粒度的不完备信息系统的属性约简算法 [J], 李秀红;史开泉
2.多粒度粗糙集粒度约简的高效算法 [J], 胡善忠;徐怡;何明慧;王冉
3.一种悲观多粒度粗糙集中的粒度约简算法 [J], 桑妍丽;钱宇华
4.不完备加权程度多粒度粗糙集及粒度约简 [J], 汪小燕;沈家兰;申元霞;杨思春
5.基于压缩决策表的乐观多粒度粗糙集粒度约简算法 [J], 王必晴;梁昌勇;齐平;黄永青
因版权原因,仅展示原文概要,查看原文内容请购买。

不完备不一致决策系统的最大分布约简及计算方法

不完备不一致决策系统的最大分布约简及计算方法

不完备不一致决策系统的最大分布约简及计算方法蒙祖强;许珂;周石泉【摘要】In inconsistent incomplete decision systems (IIDSs),some tolerance classes in tolerance partition overlap more than one decision class,so as to produce complex overlapping subsets between tolerance partition and decision partition. This leads to occurrence of many concepts of reductions in IIDSs and makes the reduction problem more complex. Therefore,the concept of maximum distribution reduct is extended to IIDSs in this paper,then,some of its properties in IIDSs are analyzed. It is found that,unlike other reducts' core attributes,the maximum distribution reduct's core attribute does not have inheritable trait. This shows that the maximum distribution reduct can not be generated by adding attributes to core attribute set. But,by using the testing and deleting operations repeatedly,an algorithm for computing the maximum distribution reduct in IIDSs is successfully constructed in this paper. The algorithm's description and its complexity analysis are also given. Finally,the proposed algorithm is illustrated to be effective and be of practical significance through sample analysis.%不完备不一致决策系统中,条件属性下的相容划分与决策属性下的等价划分形成了复杂的交集,导致出现了多种不同的约简概念,从而使约简问题变得更加复杂.本文将最大分布约简的概念引入不完备不一致决策系统中,然后研究其在不完备不一致决策系统中的性质,发现其核属性不具备传统约简核属性通常所具备的继承特性,因而不能通过增加属性的方法来计算此类约简.但是通过不断的属性测试和删除操作,成功地构造了不完备不一致决策系统中计算最大分布约简的算法,并给出了算法的描述和复杂度分析.通过实例分析,本文算法是有效的且具有实际意义.【期刊名称】《广西师范大学学报(自然科学版)》【年(卷),期】2011(029)003【总页数】5页(P89-93)【关键词】决策系统;不一致性;不完备性;最大分布约简【作者】蒙祖强;许珂;周石泉【作者单位】广西大学计算机与电子信息学院,广西南宁530004;广西大学计算机与电子信息学院,广西南宁530004;广西大学计算机与电子信息学院,广西南宁530004【正文语种】中文【中图分类】TP18随着计算机技术和网络技术的发展,数据的来源更趋广泛,数据呈现形式更加复杂化和多样化。

不完备区间值信息系统的粗糙集约简算法

不完备区间值信息系统的粗糙集约简算法

不完备区间值信息系统的粗糙集约简算法
曾玲;何普彦;付敏
【期刊名称】《南京理工大学学报(自然科学版)》
【年(卷),期】2013(037)004
【摘要】探讨不完备区间值信息系统的属性约简问题.定义了一种相似联系度容差关系,基于此关系建立了拓展粗糙集模型.然后通过定义双参数分配约简和同异反可辨识矩阵,给出了基于同异反可辨识矩阵的双参数分配约简算法.所建模型可根据不同的用户需求和数据集的分布特点对参数进行动态调整,更符合实际.最后给出了数值例子,并分析了不同参数值对约简结果的影响.
【总页数】6页(P524-529)
【作者】曾玲;何普彦;付敏
【作者单位】桂林电子科技大学数学与计算科学学院,广西桂林 541004;桂林电子科技大学数学与计算科学学院,广西桂林 541004;桂林电子科技大学数学与计算科学学院,广西桂林 541004
【正文语种】中文
【中图分类】TP18
【相关文献】
1.基于相似联系度不完备区间值信息系统的属性约简 [J], 何普彦;曾玲;付敏;张立强
2.不完备区间值模糊信息系统的粗糙集理论 [J], 巩增泰;陶蕾
3.不完备信息系统下的变精度粗糙集模型及其知识约简算法 [J], 张宏宇;梁吉业
4.基于不完备区间值信息系统的决策粗糙集 [J], 张鑫;李续武;路艳丽;陈玉金
5.一种针对不完备信息系统的粗糙集约简算法 [J], 邵斌;吴玲丽;蒋云良
因版权原因,仅展示原文概要,查看原文内容请购买。

不完备信息系统属性约简算法研究

不完备信息系统属性约简算法研究

U×A→V 的一个映射,f(x,a)=a(x)∈Va 是 x 在属性 a 上
数据获取、数据保存技术等方面的限制,很多信息系
的取值,则称(U,A,V,f)是一个完备信息系统。
统都会存在属性的缺省值,即遇到的绝大多数信息系
定义 2[9] 形式上,(U,A,V,f)是一个四元组,其中,
统都是不完备的。在文献[7]中作者为了能利用粗糙
U 是对象的非空有限集合,A 是属性的非空有限集合,
集来处理不完备的信息系统,提出以相容关系来分
a∈A,Va 表示属性 a 的值域;V=∪a∈AVa 表示 A 的值域;
类,但遇到数据量比较大时,人为计算相容类耗时耗
f 为 U×A→V 的一个映射,f(x,a)=a(x)∈Va 是 x 在属性
力,求属性约简更是耗时。所以设计计算机算法来处
输入:
不完备信息系统(U,
A,
V,
f),
U={u1,u2,…,u|U|}
其中 U={1,2,3,4},A={a,b,c}。现求所给系统的相
约简集的算法;最后,给出了全文总结。
定义 3[10] (U,A,V,f) 是一个不完备信息系统,
B⊆A,a∈B,容差关系定义如下:
SIM(B)={(x,y)∈U×U|∀a ∈ B,f a ( x) = f a ( y ) ∨ f a ( x)
= * ∨ fa ( y ) = * }
收稿日期:2020-03-31
约简算法。此算法将继续被研究以期降低其时间复杂属性约简;相容类
中图分类号:TP18
文献标识码:A
文章编号:1006-8228(2020)07-83-03
Study on attribute reduction algorithm in incomplete information system

不完备贝叶斯决策信息系统的属性约简

不完备贝叶斯决策信息系统的属性约简韩楠;舒畅;莫智文【摘要】在不完备贝叶斯决策信息系统中,改进全局增益函数,结合二进制分辨矩阵编码方法提出一种新的不完备贝叶斯决策信息系统启发式属性约简算法,并将其应用于系统的故障状况诊断研究中,该方法提高了约简的效率.%In incomplete Bayesian decision information system,this paper improves the global gain function,and combines with the coding method of binary discernibility matrix.A new heuristic attribute reduction algorithm is proposed.The method is applied to the study of the system of the fault condition's diagnosis,and improves the efficiency of reduction.【期刊名称】《四川师范大学学报(自然科学版)》【年(卷),期】2016(039)006【总页数】4页(P825-828)【关键词】不完备贝叶斯决策信息系统;二进制分辨矩阵;全局增益函数;属性约简【作者】韩楠;舒畅;莫智文【作者单位】四川师范大学数学与软件科学学院, 四川成都 610066;四川师范大学数学与软件科学学院, 四川成都 610066;四川师范大学数学与软件科学学院, 四川成都 610066【正文语种】中文【中图分类】TP301.6经典粗糙集是处理不确定和不精确问题的有效工具[1].由于经典粗糙集以等价关系为基础,只适用于完备信息系统.对于不完备信息系统[2-3],则不再适用.目前对不完备信息系统的处理方式有2种:1)将不完备信息系统通过某种方法转化为完备信息系统;2)将经典粗糙集进行拓展.目前常见的扩展模型有变精度、容差、限制容差、优势、模糊等粗糙集模型.经典粗糙集只考虑属性值之间的可区分关系,未考虑到偏好关系,因此并不能很好地在决策过程中表达原有的偏好信息.文献[4-5]研究了优势关系下决策信息系统,文献[6]提出了可变精度粗糙集模型,在经典粗糙集的基础上引进阈值β,允许一定程度上错误分类的存在,但在实际运用中变精度粗糙集也有其局限性.文献[7]结合贝叶斯推理提出贝叶斯粗糙集模型,贝叶斯粗糙集是一种修正的变精度粗糙集模型,将变精度粗糙集中精度参数用先验概率来替代,从而避免了变精度粗糙集中参数对约简过程带来的影响,同时贝叶斯理论与统计决策相结合形成的贝叶斯决策理论,在医疗和管理中起到了重要作用,因此本文对不完备贝叶斯决策信息系统进行属性约简,在限制容差关系分类模型的基础上,利用贝叶斯粗糙集模型,通过引入全局增益函数和二进制分辨矩阵,给出了不完备贝叶斯决策信息系统的启发式属性约简算法.1.1 不完备贝叶斯决策信息系统定义 1.1[8] 称一个四元组(U,A,V,f)为信息系统,其中U为有限非空对象集;A为有限非空属性集;V为属性值值域;f为对象属性值映射,即U={x1,x2,...,xn},A={a1,a2,...,ap},V=∪a∈AVa,Va为属性a的值域,f:U×A→V,且f(x,a)∈Va.如果至少有一个属性b∈A使得Vb含有空值,用“*”表示空值,则称S是不完备信息系统,否则称为完备信息系统.A=C∪D,C∩D=∅,C称为条件属性集,D称为决策属性集.V=∪Va,a∈A,Va是属性a的值域;f表示U×A→V的信息函数,为每个对象的每个属性赋予一个信息值,即∀a∈A,x∈U,f(x,a)∈Va,称这样具有条件属性和决策属性的信息系统为决策信息系统.定义 1.2[9] 在信息系统S=(U,A,V,f)中,U为非空有限论域,A为有限非空属性集,E 为U上的等价关系,对于目标集X⊆U有:贝叶斯正域为|[x]E)>P(X)};贝叶斯负域为|[x]E)<P(X)};贝叶斯边界域为|[x]E)=P(X)},其中,P(X)=|X|/|U|,P(X|[x]E)=|X∩[x]E|/|[x]E|.贝叶斯粗糙集是一种修正过的变精度粗糙集模型[10-11],用事件的先验概率代替变精度粗糙集参数,从而避免了变精度粗糙集中参数带来的影响.贝叶斯正域定义为U/A中所有元素集的集合出现的条件下X发生的概率大于先验概率,即贝叶斯正域中的任何事件都会增加事件X确定发生的程度.贝叶斯负域定义为U/A中所有元素集的集合出现的条件下X发生的概率小于先验概率,即贝叶斯正域中的任何事件都会减少事件X确定发生的程度.贝叶斯边界域定义为U/A中所有元素集的集合出现的条件下X发生的概率等于先验概率,即贝叶斯正域中的任何事件不会影响事件X 确定发生的程度.为了描述分类的特征,文献[9]中贝叶斯决策信息系统引入了置信增益函数.定义 1.3[9] 在信息系统S中,对于E⊆C,U/D=[x]d={X1,X2...,Xp},则称...,p}-1为E相对于决策属性D的全局相对增益函数,全局增益函数可以用来度量贝叶斯决策信息系统的属性重要度.1.2 限制容差关系模型定义 1.4[12] 设S=(U,C∪D,V,f)是一个不完备决策信息系统,对于具有空值的属性子集,记空值为“*”,B⊆U,定义U上的容差关系T(B)记为a(y)∨((a(x)=*∨a(y)=*)→f(x,b)=f(y,b))}.则可记TB(x)={y∈U:(x,y)∈T(B)}为x的限制容差类.定义 1.5[12] 设S=(U,C∪D,V,f)是一个不完备决策信息系统,对于X⊆U,B⊆C,在容差关系T(B)下,X的下上近似集分别定义为⊆X},∅}.由表1可知:U/D=[x]d={X1,X2}={(x1,x2,x5,x6),(x3,x4,x7,x8)}.按定义1.4将U中对象在属性集C下进行分类可得TC(x3)={x3,x7}, TC(x4)={x1,x2,x4,x5},TC(x5)={x1,x4,x5,x7}, TC(x6)={x6},TC(x7)={x3,x5,x7}, TC(x8)={x8}.经典的属性约简算法中分辨矩阵以条件属性集合作为矩阵元素,其空间复杂度高,处理效率低,所以将其优化为二进制的分辨矩阵[13-14].本文通过限制容差关系模型对不完备决策信息系统进行分类,利用二进制分辨矩阵对所有对象进行编码组合,找出论域中各对象组合的行所在的属性值为1的属性集,从而提高了查找约简集合的效率.根据二进制分辨矩阵找出的各行可能的约简属性集,利用新定义的全局增益函数来度量属性重要度,给出不完备贝叶斯决策信息系统的启发式属性约简算法.定义 2.1 在不完备决策信息系统S=(U,C∪D,V,f)中,定义其二进制分辨矩阵为在很多预测模型[15](如股票市场、医疗领域、系统故障等)中,其最终目的都是为了提高决策的确定性程度.而传统的Slezak贝叶斯粗糙集模型中提出的全局增益函数则反映了相对于先验概率确定性增加或者减小的程度,但未能反映通过决策得到所需要的论域中的对象集合,本文改进了传统全局增益函数,改进的全局增益函数可以通过决策属性得到所需对象集合.定义 2.2 设S=(U,C∪D,V,f)是一个不完备决策信息系统,对于∀B⊆C,U/D=[x]d={X1,X2,...,Xn},定义则RC(X)=∪iRC(Xi),称RC(X)为C相对于D 的全局相对增益函数.定义 2.3 设在不完备信息系统S中,对于∀X⊆U,B⊆C,若B是信息系统S的约简集,则必须满足下列条件:1) RC(X)=RB(X);2) 不存在A⊆B,使得RC(X)=RA(X).2.1 算法输入:不完备决策信息系统S=(U,C∪D,V,f),输出:不完备贝叶斯粗糙集的R 约简.1) 根据限制容差关系,计算U中全部对象的容差类中使用到的子域;2) 根据不完备决策表S构造二进制分辨矩阵M;3) 删除二进制分辨矩阵M中全为零的行;4) 将i记为二进制分辨矩阵第i行,令i=i+1,初始化i=0,若第i行属性值为1的条件属性集合B满足RC(X)=RB(X),则得出约简集B,否则继续下一行i=i+1,直到第i 行属性值为1的条件属性集合B满足RC(X)=RB(X),结束算法.2.2 算法实例分析表1为某系统的故障信息,其中U={x1,x2,x3,x4,x5,x6,x7,x8}表示被控制的对象,系统的故障状况由3个传感器进行信息反馈,表示为A={a1,a2,a3},传感器会反馈3种信号,即值域为Vc={1,2,3},控制系统的故障d有2种状态,即{1,2},已知的历史决策表如下所示,但因种种原因有部分信息缺失,缺失信息用*代替.根据决策,确定3个传感器反馈信号的重要程度.步骤 1 根据定义1.2和1.4得到在条件属性集下论域U中全部对象的限制容差类并计算目标事件Xi发生下,出现在限制容差类中对象的条件概率.P([x3]C|X1)=0, P([x4]C|X1)=3/4,P([x5]C|X1)=2/4, P([x6]C|X1)=1/4,P([x7]C|X1)=1/4, P([x8]C|X1)=0,P([x1]C|X2)=1/4, P([x2]C|X2)=1/4,P([x3]C|X2)=2/4, P([x4]C|X2)=1/4,P([x5]C|X2)=2/4, P([x6]C|X2)=0,P([x7]C|X2)=2/4, P([x8]C|X2)=1/4.步骤 2 由不完备决策表1,构造二进制分辨矩阵M,如表2所示,M为12×3阶矩阵.表2中最后一列为各行对象组合中属性值为1的集合.步骤 3 计算属性集C相对于D的全局相对增益函数RC(X),同时依据表2中二进制分辨矩阵得出的属性值为1的集合计算相应属性集合对应的全局相对增益函数. {x1,x2,x4,x5},RC(X2)={[x]c|max P([x]c|X2)}={x1,x3,x4,x5,x7},则RC(X)=∪iRC(Xi)={x1,x2,x3,x4,x5,x7}.由二进制表2可得,论域中对象组合属性值为1的集合为(a1,a3),(a1),(a1,a2),(a3),(a2).分别计算其限制容差类及全局相对增益函数,结果如下:Ta1,a2(x2)={x1,x2,x4,x5},Ta1,a2(x3)={x3,x5,x7},Ta1,a2(x4)={x1,x2,x4,x5},Ta1,a2(x5)={x1,x2,x3,x4,x5,x7},Ta1,a2(x6)={x6},Ta1,a2(x7)={x3,x5,x7},Ta1,a2(x8)={x8};P([x1]a1,a2|X1)=3/4,P([x2]a1,a2|X1)=3/4,P([x3]a1,a2|X1)=1/4,P([x4]a1,a2|X1)=3/4,P([x5]a1,a2|X1)=3/4,P([x6]a1,a2|X1)=1/4,P([x7]a1,a2|X1)=1/4,P([x8]a1,a2|X1)=0,P([x1]a1,a2|X2)=1/4,P([x2]a1,a2|X2)=1/4,P([x3]a1,a2|X2)=2/4,P([x4]a1,a2|X2)=1/4,P([x5]a1,a2|X2)=3/4,P([x6]a1,a2|X2)=0,P([x7]a1,a2|X2)=2/4,P([x8]a1,a2|X2)=1/4;Ra1,a2(X1)={[x]a1,a2|max P([x]a1,a2|X1)}= {x1,x2,x3,x4,x5,x7},Ra1,a2(X2)={[x]a1,a2|max P([x]a1,a2|X2)}= {x1,x2,x3,x4,x5,x7},则{x1,x2,x3,x4,x5,x7}.经计算可得RC(X)=Ra1,a2(X).由定义2.3可知{a1,a2}为属性集C的约简集.所以相对于3个传感器反馈的信号,{a1,a2}应重点考虑.本文在不完备决策信息系统的基础上,利用限制容差关系和贝叶斯粗糙集决策理论相结合,引入二进制区分矩阵和改进的全局增益函数,对不完备贝叶斯决策粗糙集进行属性约简,给出新的思路和方法,从而提高了不完备决策信息系统的约简效率.【相关文献】[1] 张文修,吴伟志,梁吉业. 粗糙集理论与方法[M]. 北京:科学出版社,2001.[2] 杨柳娇,莫智文. 几类不完备信息系统的属性约简[D]. 成都:四川师范大学,2014.[3] 王国胤. Rough集理论在不完备信息系统中的扩充[J]. 计算机研究与发展,2002,39(10):1238-1243.[4] 张辉. 优势关系下区间值决策信息系统一致性度量[J]. 计算机工程与设计,2013,34(12):4336-4339.[5] 王斌,邵明文,王金鹤. 基于改进的优势关系下的不完备区间值信息系统评估模型[J]. 计算机科学,2014,41(2):253-258.[6] 华伟,祁云嵩,王芳. 不完备目标信息系统中的可变精度粗糙集模型[J]. 江苏科技大学学报,2009,23(6):531-534.[7] DOMINIK S, WOJCIECH Z. The investigation of the Bayesian rough set model[J]. Inter J Approximate Reasoning,2005(40):81-91.[8] WANG X. Incomplete decision-theoretic rough set model based on improved complete tolerance relation[C]//Computer Engineering and Networking. NewYork:Springer International Publishing, 2014:273-280.[9] 蔡娜,张雪峰. 基于贝叶斯粗糙集模型的属性约简[J]. 计算机工程,2007,33(24):45-48.[10] 陈可,张小强,徐选华. 基于改进贝叶斯粗糙集和证据理论的决策信息融合方法[J]. 计算机应用研究,2014,31(9):2625-2628.[11] 韩敏,张俊杰,彭飞,等. 一种基于多决策类的贝叶斯粗糙集模型[J]. 控制与决策,2009,24(11):1615-1619.[12] 郭嗣琮,徐丽,郑爱红. 限制容差关系的不完备可变粗糙集[J]. 辽宁工程技术大学学报,2015,33(7):988-991.[13] 赵军,陈宸. 一种基于二进制分辨矩阵的属性约简新算法[J]. 重庆邮电大学学报,2012,24(4):490-494.[14] 陈宸,赵军. 一种新的基于二进制分辨矩阵的属性约简方法[J]. 计算机应用与软件,2013,30(9):123-127.[15] 张本文. 基于贝叶斯粗糙集的大数据频繁项挖掘技术[J]. 科技通报,2015,31(6):210-213. 2010 MSC:03F03。

基于容差关系的不完备信息系统的属性约简

基于容差关系的不完备信息系统的属性约简颜家凯;范敏;刘文奇;叶荣荣【摘要】粗糙集理论是一种处理不确定性知识的有效工具,属性约简是其核心内容之一,然而对于属性值有缺省的不完备信息系统,基于等价关系的经典粗糙集理论已经不再适用。

由于容差关系下的不完备信息系统的属性约简的定义与经典粗糙集的属性约简定义相似,可以用容差关系对粗糙集理论进行扩充。

文中通过定义容差关系下的可辨识矩阵,运用可辨识方法,得到了一种属性约简算法;接着分析了算法的不足之处,并且在此基础上提出了增加约简效率的改进型算法;最后通过一个数值例子,说明了该算法是合理的和有效的。

%Rough set theory is a kind of effective tool for dealing with uncertainty knowledge. Attribute reduction is one of the most im-portant content. Nevertheless,the classical rough set theory based on equivalence relation has not been applied for the incomplete informa-tion system which some attribute is the default value. The definition that attributes reduction of incomplete information system is similar to the classical rough set because of the tolerance relation. Can expand the classical rough set theory with tolerance relation. In this paper,by defining the discernibility matrix under the tolerance relation,obtain an attribute reduction algorithm through discernibility method. Then analyze the deficiency of the algorithm and put forward a kind of modified algorithm that can improve efficiency of the reduction. At last, prove the reasonableness and validity of the algorithm through a numerical example.【期刊名称】《计算机技术与发展》【年(卷),期】2014(000)001【总页数】4页(P102-104,108)【关键词】属性约简;不完备信息系统;容差关系;可辨识矩阵【作者】颜家凯;范敏;刘文奇;叶荣荣【作者单位】昆明理工大学理学院,云南昆明 650500;昆明理工大学理学院,云南昆明 650500;昆明理工大学理学院,云南昆明 650500;昆明理工大学理学院,云南昆明 650500【正文语种】中文【中图分类】TP302.10 引言波兰数学家Z.Pawlak提出的粗糙集理论[1]是一种处理模糊和不精确问题的数学工具[2]。

不完备信息系统的一种属性约简

不完备信息系统的一种属性约简
颜艳;丁健;管雪珍
【期刊名称】《计算机工程与应用》
【年(卷),期】2010(46)36
【摘要】条件属性的重要性存在差异,通过引入差异度,对不完备信息系统中属性的重要性进行了定义,提出了一种基于权重联系度的属性约简算法.通过实例说明该算法能得到不完备决策表的最小相对约简.
【总页数】3页(P165-167)
【作者】颜艳;丁健;管雪珍
【作者单位】无锡商业职业技术学院,电子工程系,江苏,无锡,214153;无锡市科技职业技术学院,电子工程系,江苏,无锡,214058;无锡商业职业技术学院,电子工程系,江苏,无锡,214153
【正文语种】中文
【中图分类】TP273
【相关文献】
1.一种新的不完备信息系统属性约简算法 [J], 鄂旭;邵良杉;周津;杨芳;李岩
2.一种基于知识粒度的不完备信息系统的属性约简算法 [J], 李秀红;史开泉
3.一种不完备信息系统的属性约简算法研究 [J], 赵亚鹏;丁以中
4.一种基于变精度区分矩阵的不完备信息系统属性约简 [J], 蔡正琦;林和;孔令旺;李永礼
5.不完备信息系统下的一种概率属性约简算法 [J], 白俊卿;刘琼荪
因版权原因,仅展示原文概要,查看原文内容请购买。

基于信息熵的不完备模糊信息系统属性约简


合, {
, … } 是信 息 函数集 。 对每个 c∈C都 有
c , c为 C的值 域 , 且至 少有一个 属
厂 芒F使得 f :
性 C ∈C使 得 c有 空值 ,用 六表 示
二元关 系 :
[ D , ] , 其中 ∈
定 义 6 ] 设 不完 备 信 息 系统 J s = ( U, C , V, F) 上 有
模 糊 集 的粗 糙 集 理 论 在 1 9 9 0年 由 D u b o i s 等 人 提 出后得 到 了迅 速发展 。 近几年 来 不完 备和 模糊 信息 系统 的属性 约简成 为研 究 热点 之 一 , 对于 不 完备信 息 系统 , 有 K r y s z k i e w i c  ̄2 ] 提 出 的基 于 容 差 关 系 的粗 糙




( X ) = { ∈ U I ( ) n ≠ } = v / ( ) I ∈ }
与 ( ) =f ∈U J ( ) X l _ { ∈ X』 ( ) x}
由定义 显然 得 出 : ( ) ( ) 。同时 , 由定义可 知, 上 近 似 集表 示 的是 可 能属 于 x的对 象集 合 , 下近
B) = f ∈U I b∈ B, 6 ( ) = 6 ( Y ) Vb ( ) = ★V b ( Y ) = 六l ,
其中 B 口c ,则称 ( 口) 为相 容 关系。 由定 义 可知 , 相容 类 中空值 与其 他任 意属性值 是 相等的, 相 容 关系 产生 相容 类 ( ) , 其分类 U / T ( B) =
要 的意义 。
定义 1 c l 设 S = ( , C, D, , F) 是 不完 备模 糊 目标
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第27卷第1期 辽 宁 工 学 院 学 报 V ol.27,No.12007年 2 月 Journal of Liaoning Institute of Technology Feb.2007收稿日期:2006-09-14作者简介:周玉新(1977-),男,山东聊城人,硕士生。

周 军(1966-),女,吉林郑家屯人,教授,博士生。

一种不完备信息系统的约简方法周玉新,周 军,梅红岩(辽宁工学院 计算机科学与工程学院,辽宁 锦州 121001)摘 要:提出了一种基于覆盖粗糙集理论、利用最大一致块技术进行不完备信息系统约简的方法。

在证明利用最大一致块技术生成的相容类构成论域的最简覆盖基础上,利用覆盖粗糙集理论对已利用最大一致块技术进行属性约简的信息系统进行属性值约简,并提出一种新的约简算法。

关键词:不完备信息系统;约简;覆盖粗糙集;最大一致块;粗集中图分类号:TP391 文献标识码:A 文章编号:1005-1090(2007)01-0014-04Reduct Method of Incomplete Information SystemZHOU Yu-xin, ZHOU Jun, MEI Hong-yan(Computer Science & Engineering College, Liaoning Institute of Technology, Jinzhou 121001, China )Key words: incomplete information system; reduct; covering rough set; maximal consistent block;rough setAbstract: The paperproposed a reduct method of an incomplete information system based on covering rough set theory and maximal consistent block technique. On the base of minimal covering constructed by the tolerance classes from the maximal consistent block technique, the attribute value reduct was carried through by the covering rough set theory on the system that has been reduced in attributes by the maximal consistent block technique. In addition to that effect, a new reduct algorithm was proposed.粗集理论是由波兰数学家Z. Pawlak [1]提出的一种新的用确定性方法处理不确定性和模糊性知识的理论方法,在基于知识的各种信息系统中发挥着独特的优势,现在已广泛应用于知识发现、机器学习、决策支持、模式识别等领域。

它的核心内容之一是约简,包括属性约简和属性值约简。

国内外很多研究者对之进行了研究[2~8],已经证明,求粗集的最小约简是NP 完全问题。

尽管粗集理论的理论研究已取得很大的进展,但大都集中在信息系统的属性约简方面,到目前为止,属性值约简方面的方法相对较少。

Yee Leung 和Deyu Li [2]扩充了经典粗集理论,提出了最大一致块的概念,并用于不完备信息系统的属性约简。

Zakowski 将经典粗集理论和覆盖理论相结合,提出了覆盖粗糙集模型[6],并讨论了相关的性质。

William Zhu 和Fei-Yue Wang [7]在此基础上给出了约简的概念和方法,并证明了一个覆盖通过约简得到的最简覆盖是惟一的,而且最简覆盖相同的两个覆盖产生相同的覆盖上、下近似。

本文将最大一致块技术和覆盖粗集理论相结合,提出了一种新的不完备信息系统约简算法。

首先利用最大一致块技术对原始的不完备信息系统进行属性约简,在此基础上利用覆盖粗糙集理论对已进行属性约简的信息系统进行属性值的约简,以尽可能最大程度地去除信息系统中的冗余信息,仅保留有用的信息,大大简化后继的规则提取工作。

第1期 周玉新等:一种不完备信息系统的约简方法 151 基本理论和概念这里给出本文用到的一些主要概念和结论。

定义1[2] 设S =(U ,AT )是一个不完备信息系统,A ⊆AT ,X ⊆U . 则说X 在A 下是一致的,如果对任意x , y ∈X 有(x , y )∈SIM (A )。

如果不存在子集Y ⊆U 并且Y 在A 下是一致的,那么X 称为A 下的最大一致块。

用M (A )表示由A ⊆AT 所确定的最大一致块的集合,M x (A )表示由A ⊆AT 所确定的包含对象x ∈U 的最大一致块的集合。

在此基础上,定义U /SIM (AT )={M x (AT )| x ∈U },则U /SIM (AT )中的相容类构成U 的覆盖,并且满足U /SIM (AT )=U .上、下近似定义为:定义2[2] }|)({X Y A M Y X A ⊆∈=∪,}|)({φ≠∈=X Y A M Y X A ∩∪定义3[7] 设<U ,C >是一个近似空间,x ∈U ,称集类Md(x )={K ∈C ∧C S ∈∀(∧S x ∈∧)}S K K S =⇒⊆为x 的最小描述。

对于集合X ⊆U ,称集类C *(X )={ K ∈C |K ⊆X }为X 的覆盖下近似类。

称X *=∪C *(X )为X 的覆盖下近似;称X **=X -X *为X 的覆盖边界;称集类Bn(X )={Md(x )|x ∈X **}为X 的覆盖边界近似集类,集类C *(X )=C *(X ) ∪Bn(X )为X 的覆盖上近似集类;称X *=∪C *(X )为X 的覆盖上近似。

如果C *(X )=C *(X ),就说X 是精确的,否则,就说X 是不确定的。

最简覆盖:定义4[7] 设C 是论域U 的一个覆盖,K ∈C ,如果K 是C -{K }中的一些元素的并集,就说K 是C 的一个可约简的元素,否则,就称K 是C 的一个不可约简的元素。

定义5[7] 设C 是论域U 的一个覆盖,如果C 的每个元素都是不可约简的,则称C 是不可约简的;否则,称C 是可约简的。

命题1[7] 设C 是论域U 的一个覆盖,如果K 是C 的一个可约简的元素,则C -{K }也是U 的一个覆盖。

命题2[7] 设C 是论域U 的一个覆盖,K ∈C ,K 是C 的一个可约简的元素,K 1∈C -{K },则K 1是C 的一个可约简的元素当且仅当它是C -{K }的一个可约简元素。

由上面两个命题可知,删除一个覆盖的可约简元素后所得的仍然是一个覆盖,并且删除一个覆盖的可约简元素后不会产生任何新的可约简元素,也不会使原来的可约简元素变成新覆盖下的不可约简元素。

因此,可以通过同时删除一个覆盖的所有可约简元素或者一步删除一个可约简元素的方法来得到一个不可约简元素的覆盖。

删除覆盖的可约简元素的过程,称为覆盖约简。

定义6[7] 设C 是论域U 的一个覆盖,则通过覆盖约简而得到的新的不含可约简元素的覆盖为C 的最简覆盖,记为Reduct (C )。

2 基于覆盖粗糙集的约简在通常的信息系统中,由于论域中的元素对每个属性可能是缺省的、不精确的、多属性值的情况,所以按某个或某些属性对论域进行分类所得的结果一般并不是论域的一个划分,而是论域的一个覆盖。

也就是说,在通常的信息系统中并不存在等价关系。

根据覆盖粗糙集的性质和Yee Leung 、Deyu Li 提出的最大一致块的概念,可以得到:命题3 设S =(U ,AT )是一个不完备信息系统,则由U /SIM (AT )={M x (AT )| x ∈U }所确定的相容类U /SIM (AT )构成U 的一个覆盖,并且是最简覆盖。

证明 已知U /SIM (AT )构成U 的一个覆盖,如果U /SIM (AT )不是U 的最简覆盖,则根据最简覆盖的定义,肯定存在一个元素K ∈U /SIM (AT )是U /SIM (AT )中几个元素的并集。

不妨假设K =K 1∪K 2且K 1≠K 2.则根据最大一致块的定义,存在x ∈K 1\K 2.又因为对任意x , y ∈K ,有(x , y )∈SIM (AT ),所以对任意z ∈K 2,有(x , z )∈SIM (AT ),所以x ∈K 2,矛盾,命题得证。

如此,通过利用最大一致块技术对原始不完备信息系统进行处理便得到了论域的最简覆盖。

文献[8]描述了信息系统约简的一般方法: (1)删除重复的实例; (2)删除多余的属性;(3)对每个实例删除多余的属性值; (4)求出最小约简;如果所面临的最终任务是机器学习或从数据库中发现规则,那么还需以下步骤:(5)根据最小约简,求出逻辑规则。

Yee Leung 和Deyu Li 在提出最大一致块概念的同时,利用区分函数对不完备信息系统进行了属性约简。

在这里,同样借鉴这种方法首先对原始的不完备信息系统进行属性约简,并同时得到了不完备信息系统的最简覆盖。

在此基础上,利用覆盖粗糙集理论对属性约简后的系统进行属性值约简,以尽可能地去掉不完备信息系统中的冗余信息。

16 辽宁工学院学报 第27卷定义7设〈U,C〉是一个覆盖近似空间,AT 是论域U上的非空属性集,a∈AT,V a是a的值域。

如果将某个实例的属性值a(x)去掉后,不会将不属于同一个相容类的两个实例划入同一个相容类,则称a(x)是不必要的,或者可约简的,否则称为必要的,或不可约简的。

信息表的属性值约简,就是利用某种算法,去掉信息表中所有的不必要属性值的过程。

算法的处理过程如图1所示。

图1 信息系统处理流程图具体算法描述如下:算法(不完备信息系统约简方法):利用最大一致块技术和覆盖粗糙集理论对信息系统进行约简。

输入:原始信息系统S1=(U, AT, f),信息系统中的记录数N1,属性数N2.输出:已进行属性约简和属性值约简的信息系统S2=(U’, AT’, f)。

步骤:(1)for(i=1;i<= N1;i++)for(j=i+1;j<= N1;j++){ if 记录j==记录i then delete记录j;N1= N1-1;}(2)for(i=1;i<= N1;i++){S AT(i)={i};for(j=i+1;j<= N1;j++){对AT中的任意属性aif f a(i)==NULL或f a(j)==NULL或f a(i)==f a(j)then S AT(i)=S AT(i){∪j};} }(3)for(i=1;i<= N1;i++)for(j=i+1;j<= N1;j++)if i∈S AT(j) then M i(AT)=S AT(i)∩S AT(j);(4)for(i=1;i<= N1;i++)for(j=i+1;j<= N1;j++){α(i, j)=Φ;对AT中的任一属性aif f a(i)!=NULL且f a(j)!=NULL且f a(i)!=f a(j)then α(i, j)=α(i, j)∪a;}(5)∏×∈=Δ)()(),(),(ATMATMYXATYXα其中∏∑×∈=YXyxATyxYX),(),(),(αα由上(1)~(5),利用最大一致块技术得到对原信息系统进行属性约简后的信息系统。

相关文档
最新文档