基于容差计算的非完备信息系统属性约简算法
基于包含度的不完备序信息系统属性约简的一种算法

基于包含度的不完备序信息系统属性约简的一种算法郭永平【期刊名称】《佳木斯大学学报(自然科学版)》【年(卷),期】2012(030)002【摘要】In this paper,by introducing the concept of inclusion degree to incomplete ordered information system,the significance of attribute was defined.Then,an inclusion degree-based algorithm for attribute reduction under incomplete ordered information system was proposed.The experimental results show that this algorithm can find the reduction of an incomplete ordered information system.%在不完备序信息系统中,通过引入包含度的概念,对属性重要度进行了定义;在此基础上,提出了一种基于包含度的属性约简算法;最后,通过实例分析表明,该算法能得到不完备序信息系统的一个约简.【总页数】4页(P270-272,277)【作者】郭永平【作者单位】中国人民银行嘉峪关市中心支行,甘肃嘉峪关735100【正文语种】中文【中图分类】O159【相关文献】1.一种不完备模糊目标信息系统的精度属性约简算法 [J], 于晓辉;张强2.一种基于知识粒度的不完备信息系统的属性约简算法 [J], 李秀红;史开泉3.基于全序优势关系的不完备模糊信息系统及其属性约简 [J], 曾雪兰;孙兴星;于莹莹4.不完备信息系统下基于分辨度的属性约简算法 [J], 李长清;张燕兰5.一种基于变精度区分矩阵的不完备信息系统属性约简 [J], 蔡正琦;林和;孔令旺;李永礼因版权原因,仅展示原文概要,查看原文内容请购买。
不完备信息系统的属性约简算法-计算机工程

决策属性集;V = ∪ Vr 是属性值集合,Vr 表示属性 R 的值域; r∈R f :U × R → V 是一个映射函数。若 D 为空,则称信息系统为
数据表,否则称之为决策表。对于具有遗漏属性值的属性子
集 B ⊆ C ,记遗漏值为“*”,则含有未知属性值的信息系统
称为不完备信息系统。Kryszkiewicz M.定义了容差关系 T。
定义 1 容差关系 T 为
( ) ∀x,
y∈U
,
⎛ ⎜ ⎜⎝
TB ( x,
∀Cj∈B
y)
C
⇔
j (x
)
=
C
jபைடு நூலகம்
(
y
)
∨
C
j
(
y
)
=
∗
∨
C
j
(
x
)
=∗
⎞ ⎟ ⎟⎠
其中, TB ( x, y) 表示在属性集合 B 上满足关系个体对象 y 和
对象 x 的容差类关系。本文沿用完备信息系统中的一些相关
定义,对不完备信息系统做相同定义。
若 POSB ( D) = POS(B−{r}) ( D) ,则称 r 为 B 中相对于 D 可省略
的属性,否则称 r 为 B 中相对于 D 不可省略的属性。若对 C
中的独立子集 B ⊆ C ,有 POSB ( D) = POSC ( D) ,则称 B 为 C
的相对约简。
2.2 集合近似关系下的属性约简算法 集合近似关系下的属性约简算法描述如下:
扩展后的信息表进行属性约简。
本文考虑扩展粗糙集理论的适应范围,通过实例比较了
3 种属性约简方法的处理效果。
2 基于集合近似关系的不完备决策属性约简
基于粗糙集的属性约简算法

} 。
…
3
的上 近似 集 B ) 根据 知识 判定 可 能属 ( , 于 的 中的对象 组成 的集合 B X)= { ∈ Ul ( X B( " X ≠ } X)I 1 。
定义 3 正域
收 稿 日期 :0 l 3 1 2 1 - —l 0 基 金项 目 : 国家 自然 科 学 基 金 资 助 项 目( 07 0 9 6543 )
D c u D =Q, = ) ( Cn D 两个不同的集合。 概念 2 完备信息系统与不完备信息系统 在决 策信息系统 D S=< , uD, , UC VP>中, 中每个对
1 2 基本 定义 .
L )= { ( Y∈ UI( Y ,)∈ L , } L = { ∈ UI ( X L ) } , L = { ∈ UJ ( X )n ≠ } 。
() 2 () 3 () 4
定义 1 不可 分辨 关 系
限制容 差关 系具 有 自反 性 和对 称性 , 是不 具 但 有 传递 性 。
步骤 有的约简属性集都包含的不可省略属性 的集合 , 记 为 C R P)=n R D( O E( E P)。
步骤 7 将 R d e 集里的属性与 c集合里剩余的
属性 分别结 合 。 步骤 8 采 用组合 属性 , 复步骤 2 ~6 重 。 步骤 9 从 R d的尾部 开 始 , 后 往前 对 每 个 e 从
2 2 知 识约 简算法 .
q }I D B 是一个等价关系。 )。 ( ) N 由这种等价关 系导
出 的对 的划 分记 为 U ID( , 中包 含样本 的 /N B)其 等价类 记 为 [ ] 。
基于容差计算的非完备信息系统属性约简算法

基于容差计算的非完备信息系统属性约简算法梁宝华【摘要】对于有缺损值的非完备信息系统约简,多数算法利用容差关系求信息量,但此类算法需消耗大量时间计算容差,导致属性约简质量、消耗的时间及空间复杂度均不理想.为了有效提高求容差类计算效率,引入一个与相容类信息量等价的计算公式.以此为基础,提出一种属性约简算法,使时间复杂度降为O(|C|2|U|),空间降为O(|C||U|).最后,通过实例和实验分析并验证了算法的有效性和可行性.%For incomplete information system reduction with defective values, most algorithms use the tolerance relation to compute the amount of information, but this kind of algorithm consumes a large amount of time computing tolerance, which leads to the quality of attribute reduction and the time and space complexity are not ideal.In order to improve the computation efficiency of the tolerance class effectively, a formula for calculating the equivalent information of the compatible class is introduced.Based on it, an attribute reduction algorithm is proposed, which reduces the time complexity to O(|C|2|U|) and reduces the space to O(|C||U|).Finally, the examples and experimental analysis show that the proposed algorithm is efficient and feasible.【期刊名称】《计算机应用与软件》【年(卷),期】2017(034)004【总页数】6页(P299-304)【关键词】粗糙集;属性约简;非完备信息系统;相容类【作者】梁宝华【作者单位】巢湖学院信息工程学院安徽合肥 238000【正文语种】中文【中图分类】TP181粗糙集理论[1-2]是由波兰数学家Pawlak教授于1982年提出的,是一种处理不完全、不精确和模糊性数据的数学工具。
不完备信息系统的属性约简算法研究

Ab ta t I hs a e , a tiue eu to b sd n oea c rlt n sr c : n i p r t p tr t rd cin a e o tlrn e ea i wa su id a d n loih fr tr ue e uto b sd n %lrn e b o s tde , n a ag r m 0 a ti t rd c i t b n ae o oea c
备 信息 系统 的研 究却 没 有涉 及 。因此 ,研 究 属性 次
序下 不完 备信息 系统 的属性 约简 算法很 有必 要 。
D ={ l x∈U八 () DI x 。
定义 3 设 U为 一 个 论域 ,P、Q是 定 义 在 U 上
值 的集合 ,V 表 示属 性 r 的值 域 ,f U V是 : A
一
个信 息 函数 ,它指 定 U 中每 一个 对象 x的 属性值 ,
方 法 是 先将 不 完 备 信 息 系统 进 行 补 全 ,然 后 再 用
Ro g u h集 的方法 来进行 处理 。这 样导致 了原 始系统 信 息的变 化 ,得到 的 结果也 不 一定 反映 原 始 系统 的
真 实情 况 。 因此 ,对 属 性次 序 的研 究对 于面 向领 域 的数据 挖掘具 有重 要意义 。
属 性值 “ ”表示 未知 属性值 。 定 义 2 容 差 关 系 。 设 不 完 备 信 息 系 统 S= cuD _ 及 U 上定义 的二 元关 系 T( <U A= 厂>
不完备信息系统属性约简算法研究

不完备信息系统属性约简算法研究作者:***来源:《计算机时代》2020年第07期摘要:基于经典粗糙集,从不完备信息系统和相容类的相关概念出发,给出了不完备信息系统中相容类的算法和属性约简算法。
此算法将继续被研究以期降低其时间复杂度。
关键词:不完备信息系统;粗糙集;属性约简;相容类中图分类号:TP18 文献标识码:A 文章编号:1006-8228(2020)07-83-030引言自学者Pawlak于1982年提出粗糙集以来,粗糙集理论在机器学习、规则提取、决策支持等领域得到了广泛应用。
经典的粗糙集理论以完备的信息系统为研究对象,在处理数据时基于严格的等价关系来进行划分。
然而,在实际生产、生活和科学实践中,由于数据获取、数据保存技术等方面的限制,很多信息系统都会存在属性的缺省值,即遇到的绝大多数信息系统都是不完备的。
在文献(7)中作者为了能利用粗糙集来处理不完备的信息系统,提出以相容关系来分类,但遇到数据量比较大时,人为计算相容类耗时耗力,求属性约简更是耗时。
所以设计计算机算法来处理是十分关键的。
本文的安排如下:第一部分简要阐述不完备信息系统、完备信息系统及其约简集的相关概念;第二部分设计了计算不完备信息系统中相容类的算法;第三部分设计了计算不完备信息系统中属性约简集的算法;最后,给出了全文总结。
4结束语本文在相关定义和相容类的分类方法下,设計了处理不完备信息系统中分类和属性约简的计算机算法,极大地简化了计算量,在一定程度上能够有效地节省计算时间和研究者的精力。
本文只是在相容类情况下进行分类和属性约简算法的一个初步探索。
基于本文的结果,还可以深入研究分类和属性约简的算法,以进一步降低算法的时间复杂度。
基于近似度的不完备信息系统属性约简

[ ywod Iapo i t dge;n o lt ifr t nss m; tiuerd c o Ke r s p rxmae e re ic mpee nomao yt a r t u t n i e tb e i
DOI 1 . 6 0i n10 —4 82 1.307 : 03 9 .s . 03 2 .0 0 .1 9 s 0 1
An u Unv rt, fi 3 0 9 C ia 2 Sae yL b rtr r v l ot r eh oo y Naj gU iesy N nig2 0 9 , hn ) h i ies yHee 2 0 3 , hn ;. tt a oa y f e f eT cn lg , ni nvri , aj 10 3 C ia i Ke o o No S wa n t n
较 高 的约 简 效 率 。
关健词 :近似度 ;不完备信息系统 ;属性约简
I c m p e eI f r a i n S se t i u eRe u t0 n o lt n o m t0 y t m Atrb t d c i n
Ba e n A pp o i a eD e r e sd0 r x m t g e
st f e o
) n o sn t eo g t a dd e o ln b o
) O i b ss a t iu erd c o l oi m a e n a p o i t d ge o c mpeeif r t n . n t s a i, nat b t u t n a r h b d o p r xmae e ref r n o lt n o ma o h r e i g t s i i
[ b ta t hs ae o s estedf rne f eidvd a cnr uinbsdo tiuest l s ct ni etl ac ea o , A src!T i p p r ni r h iee cso iiul o tb t ae n ar t e ca i a o nt e nerl n c d f h t n i o tb P sf i i h or i t
不完备信息系统的一种属性相对约简算法

第3 3卷 第 9期
V .3 o1 3
・
计
算
机
工
程
20 0 7年 5月
Ma o u e g n e i g mp t rEn i e rn
人工 智能及 识别技 术 ・
文章编号:1 32(0) _ 14 2 文献标 0 _ 48 0 0 _ 8一l 0 2 7 0 识码: A
ZHANG e ge, ANG h a。 AO in e T n fiW Xiu iXI Ja m i
( p r n o E e t c l n t ma in S a g a Ma imeUnv ri , h n h i 0 1 5 De at t f lcr a a dAu o t , h n h i rt i es y S a g a 2 0 3 ) me i o i t
规则 ,若存在 f x, ) ( . ) (,c =fx, ,但 fx, ≠fx, ), c (. D) (.D
则称该决策表是不相容的。 由于不 完备信息系统含 有一 定数量的空值 ,相似关系的
信息系统决策表 的求核与属性相对约简一直是粗糙集理
论和应用研究的焦点 问题 ,且决策表核属性的确定往往是属
定义很可能会导致一些规则不相容 。考虑决策表可能存在的
[ yw  ̄s o g e ter;no leifr ainss m; ea v d cin Ge eai ddcs ntbe Ke o ]R u hsthoy Icmpe o t yt R lier u t ; nrl e eio l t n m o e t e o z i a
统是完备的 ,每 个样本对象的所有属性值都是 已知 的。而在 现实生活中不完备 的信息系统随处可见。为了使粗糙集理论 能适应于对 不完备信息系统 的处理 ,目前主要有 2种方法: () 处理方法 ,即通过数据预处理把不 完备信息表转化为 1间接 完备信息表 ;() 2直接处理方法 ,即对 经典粗糙集理论中的相 关概念在不完备信息系统下进行 扩充 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Keywords
〇 引 言
R o u g h set
Attribute reduction
Incomplete information system
Compatible class
象属性值是未知的。这种数据缺失会影响粗糙集理论 向实用化方向推广。 为了解决不完备信息系统对粗糙集理论应用化的 粗糖集理论[14]是 由 波 兰 数 学 家 P a w l a k 教授于
第 3 4 卷第4 期
2017年4 月
计算机应用与软件
C o m p u t e r Applications an d Software
VoL34
No. 4
Apr. 2 0 1 7
基于容差计算的非完备信息系统属性约简算法
梁宝华
( 巢 湖 学 院 信 息 工 程 学 院 安 徽 合 肥 238000)
数据的数学工具。属性约简是粗糖集理论研究的重要 内容之一, 指在不影响原知识表达能力的情况下, 通过 消除冗余属性的方法, 从而获得较简洁的知识表达。 经典的粗糙集理论在完备信息系统中已有大量的研 究, 提出了基于正区域、 基于差别矩阵、 基于信息熵及 启发式属性约简算法[3_5’ 14_19]。然 而 在 现 实 生 活 中 , 由于对数据的理解、 获取方法的限制等不可控因素, 使 得实际处理的数据是一个不完备信息完全、 不精确和模糊性
影响, 研究者们利用相容关系[6]、 相似 关 系 等 , 给出一 系列有效的属性约简算法, 如 文 献 [7 ]给出了差别矩 阵的二进制形式, 文 献 [8 - 1 0 ] 提出相容关系相似矩 阵并给出一种不完备决策表的属性约简算法。不完备 决策表的属性约简算法多数以“ 信息量” [ 1 °]为启发式 信息, 张等在文献[11 ] 中提出 一 些 改 进 方 法 , 经研究 发现, 文 献 [11 ]存 在 大 量 重 复 扫 描 数 据 对 象 的 不 足 。 为了减少扫描数据的次数, 无需大量空间存储相容类 信息, 本文根据相容类元素间的对称性、 自反性特征, 提出一种快速计算相容信息量的方法, 有效提高属性
收稿日期 :2016 - 03 - 3 0 。安徽省省级质量工程项目( 2013tSZy31) ;安徽省高等学校省级自然科学研究项目( KJ2013Z231) 。 梁 宝 华 ,副 教 授 , 主研领域 :粗 糖 集 , 数据 挖掘。
300
计算机应用与软件
2017 年
约简效率。最后通过实例及实验验证算法的有效性和 正确性。
U I ) and
reduces the space to 0 ( I
C II U I)
. Finally, the examples an d experimental analysis
s h o w that the proposed algorithm is efficient a n d feasible.
表 1 不完备决策
U
1 2 3 4 5 6 7 8 r al(l)
a\
1 1 2
a2
1 1
a3
1 1
a4
1 2 1 2 2 1 1 1 =|1,2,4,7|
D
1 1 2 1 1 3 1 2
1
相关概念
设信息系统 S = ( f /, 4, F, /), 其 中 f/为 论 域 =
氺
1 1
氺
2
氺
C l I f/l )
。
最后, 通过实例和实验分析并验证了算法的有效性和可行性。
关键词
中图分类号
粗糙集属性约简非完备信息系统相容类
TP181
文献标识码
A
DOI : 10. 3969/j. issn. 1000-386x. 2017. 0 4 . 0 5 1
ATTRIBUTE REDUCTION ALGORITHM FOR INCOMPLETE INFORMATION SYSTEM BASED ON TOLERANCE COMPUTATION
relation to c o m p u t e the a m o u n t of information, but this kind of algorithm co ns u m e s a large a m o u n t of time computing tolerance, which leads to the quality of attribute reduction a n d the time an d space complexity are not ideal. In order to improve the computation efficiency of the tolerance class effectively, a formula for calculating the equivalent information of the compatible class is introduced. Based on it, an attribute reduction algorithm is propos ed, which reduces the time complexity to 0 ( I C I 2 I
摘要
对于有缺损值的非完备信息系统约简, 多数算法利用容差关系求信息量, 但此类算法需消耗大量时间
计算容差, 导致属性约简质量、 消耗的时间及空间复杂度均不理想。为了有效提高求容差类计算效率, 引入一个 与相容类信息量等价的计算公式。以此为基础, 提出一种属性约简算法, 使时间复杂度降为 〇(l C I 2 I f / l ) , 空间 降 为 0(1
Liang B a o h u a
{Information Engineering Institute ,Chaohu University,Hefei 238000, Anhui, China)
Abstract
For incomplete information system reduction with defective values, most algorithms use the tolerance