概念格合并原理与算法

合集下载

概念格并行构造算法研究

概念格并行构造算法研究
X, J是 G和 M 之 间的 一个 二元 关 系 , 且 G×M 。
G, y
, 且满 足 =y和 Y =
是 属性 的集 合 , 那
定 理 1 设 K一 ( M ,) 一 个背 景 , x X。 G 是对 象 的 集 合 , y , G, J 是 x, , y, y 么下列 式 子成 立 L : 1 ] ① X1 X2 X X , 1 y2 y 2 y 1②X X y 2 1Y ; ,
算法 , 它将概 念集合看作初始闭包 系统 , 迭代生成相互 独立的多个子 闭包系统 , 然后在 每个子闭包系统 中独立 生成概念 , 有效提高 了运算效率 。
关 键 词 : 念 格 ; 造 算 法 ; 行 算 法 ; 分 ; 包 系 统 概 构 并 划 闭
中图分类号 : I TP 8
文献标识码 : A
K K。 G, U , U ) ② 如 果 M I 一( M ; 一M2- , K K2 -M 则 和 的叠 置 为 一 ( G UC2M ,1 2 。 , I U在 同项 形 式背 景 K K。 , M 一 , 和 中 若 n 则称 L( ) L( ) 内涵 独 立 的 ; M1 K 和 Kz是 若 N
文奄 编号 :0 16 0 (0 8 0 — 1 20 1 0 —6 0 2 0 ) 30 2 —3
随着 数 据规 模 的 不 断增 大 ,已有 建 格算 法 在 时 间 、 间复 杂 性 方面 的问 题 越 来越 突 出 ,研 究 采 用新 空 的方法 和 手段 来构 造概 念 格 , 为众 多 学者 一个 新 的研 究方 向 。 成 概念 格 的分 布处 理 思想就 是 根据 不 同 的原 理 , 用分 治 策略 , 采 把构 造概 念 格 的任务 分成 多个 子 任务 , 个 子任 务构 造部 分 概念 格 , 由部分 概 念格 合 每 再

一种基于概念格胶合的模糊本体合并方法

一种基于概念格胶合的模糊本体合并方法
第 2 第 7期 9卷
21 0 2年 7月
计 算 机 应 用 研 究
Ap l ainRe e rh o mp tr pi t sac fCo u es c o
Vo . 9 No 7 12 .
J1 2 2 u . 01

种 基 于概 念 格 胶 合 的模糊 本 体 合 并 方 法

2l 5 8・
计 算 机 应 用 研 究
表 1 一个模糊形式背景
第2 9卷
C r R ,,, 。其 中 : P , P ,A ) R,
a c 是模糊概念集 , ), 概念也可 以叫做类 。 bC f ) P 是模糊概念的属性集合 , 集合 中的每个元素 可以看
做是一个三元组 c ,=(r , ,。这里 c是 模糊本体 中的一 t f c, f r ) r 个概念 , 是属性 的值 , 表示 限定词。 比如“ , z , 空气很 湿润”, 概
根 据渐进式算法构建 出模糊概念格 , 如图 1所示。
为 了解决本 体异构 , 现本 体资源 的共享 和重用 , 实 需要 进
行本体集成 ] 。本体合并是 本体集 成 的一种方 式。本体 合并 是把两个或 多个本体 合并成 一个本 体 的过程 。 目前 已有很 多
精确 的本体合并 或者 集成的方法 , 映射方 法主要有基于语法 的 方法 , 如基于编辑距离 的方法 、 基于概念结构 的方法 、 基于机器
sleti po lm,b tih sdfc l n cdn n e snn . I ma e ab t rwa o cmbn oma o c p n ls ov s rbe h u t a i ut i o iga d rao ig t y b et y t o iefr lc n e ta ayi i y e s

基于属性的概念格渐进式构造原理与算法

基于属性的概念格渐进式构造原理与算法

基于属性的概念格渐进式构造原理与算法智慧来;智东杰【期刊名称】《计算机工程与应用》【年(卷),期】2012(048)026【摘要】In order to improve concept lattice construction efficiency, it proves that concept generation and inserting place only relate to newly generated concept instead of the entire concepts in the lattice. Accordingly, it presents the algorithm and carries out experiments, which show that new concepts are few and don't increase steadily with the growth of the lattice, and running time is reduced.%为了提高概念格生成的效率,证明了概念的生成及其插入位置只与最新生成的概念有关,与先前生成的大量概念无关.设计算法并编写程序,程序运行结果表明,在形式背景插入属性时,概念格中增加的新生概念数量较少,且不随概念格规模的增大而迅速增大,概念格生成时间明显缩短.【总页数】5页(P17-21)【作者】智慧来;智东杰【作者单位】河南理工大学计算机科学与技术学院,河南焦作454150;河南理工大学计算机科学与技术学院,河南焦作454150【正文语种】中文【中图分类】TP18【相关文献】1.基于对象和属性交叉的渐进式概念格生成算法 [J], 刘群;冷平;孙凌宇2.基于属性消减的模糊概念格渐进式构造算法 [J], 王黎明;姜琴;张卓3.基于属性的概念格快速渐进式构造算法 [J], 曲立平;刘大昕;杨静;张万松4.基于属性集合幂集的区间概念格◢L▲β△▼α▽◣的渐进式生成算法 [J], ZHANG Chun-ying;WANG Li-ya5.基于属性的概念格快速渐进式构造算法 [J], 杨凯;马垣;张小平因版权原因,仅展示原文概要,查看原文内容请购买。

双序渐进式概念格合并算法

双序渐进式概念格合并算法
T e c h n o l o g y ,Na n i f n g U n i v e r s i t y, N a n j i n g 2 1 0 0 9 3, C h i n a )
Ab s t r a c t :I n e x i s t i n g l i t e r a t u r e s ,t h e a l g o r i t h ms o f c o n c e p t l a t t i c e u n i o n a r e a l l o n e — w a y v e r t i c a l o r h o r i z o n t a l u n i o n . B a s e d o n c o n c e p t l a t t i c e d u a l i t y p r i n c i p l e , t h i s p a p e r p r o p o s e d a t wo - wa y u n i o n a l g o r i t h m. Co mp a r i n g wi t h v e ti r c a l o r h o r i z o n t a l a l g o — r i t h ms , t h i s a l g o r i t h m d o e s u n i o n b y t h e a s c e n d i n g a n d d e s c e n d i n g o r d e r o f t h e i n t e n s i o n a n d e x t e n s i o n o f c o n c e p t . A l g o r i t h m a — n a l y s i s a n d e x a m p l e s h o w t h a t t h e n e w a l g o r i t h m r e t a i n s t h e s t r u c t u r a l i n f o r ma t i o n a n d i t s e ic f i e n c y i s s i g n i i f c a n t l y i mp r o v e d .

概念格构造算法(综述)

概念格构造算法(综述)

概念格构造算法(综述)
概念格⾃理论提出⾄今发展了近30年,已经成功应⽤于多个研究领域,如数据挖掘、机器学习、知识发现、软件⼯程、知识⼯程以及信息检索等。

概念格的构造算法是基于概念格的应⽤的关键。

现有的构造算法可以分为三类:批处理算法、渐进式算法和分布式算法,其中前两类是单机构造算法。

批处理算法是出现较早的⼀类构造算法,根据构造格的不同⽅式,可分为三类,即⾃顶向下、⾃底向上和枚举。

⾃顶向下类算法⾸先构造格的最上层节点,再逐层向下,较经典的算法有Bordat算法;⾃底向上算法则相反,⾸先构造最底层的节点,再向上扩展,如Chein算法;枚举算法是根据给定数据集,按照⼀定的顺序枚举出所有的节点,然后再⽣成节点间的关系,代表算法有Ganter算法等。

这类算法都需要多遍扫描数据库。

渐进式算法,⼜称增量式算法。

这类算法的基本思想都是将当前要插⼊的记录和格中概念进⾏交运算,根据结果采取不同的处理⽅法,主要区别在连接边的⽅法。

经典的有Godin算法,T. B. Ho算法等。

由于时间性能优越,现有的⼤多数概念格系统都是基于这类算法搭建的。

随着数据规模的迅速增长,概念格的分布式构造成为重要的研究内容。

⽬前我正在做相关研究,过段时间,我会把我的⽅法和现⾏的其他分布式⽅法做个对⽐,⼀起介绍给⼤家。

概念整合理论的基本原理及优化原则

概念整合理论的基本原理及优化原则

概念整合理论的基本原理及优化原则概念整合理论作为一种新兴的认知语言学理论,遵循人类认知的普遍原则,从新的角度研究意义构建的认知机制。

文章分析了概念整合理论的理论基础、基本原理及优化原则。

该理论从篇章在线的角度分析意义构建,克服了隐喻认知机制中的不足,体现了人类思维的多构性及语言的经济、灵活原则。

标签:概念整合心理空间意义构建概念整合理论是在心理空间理论的基础之上发展起来的一种认知语言学理论,是一种研究意义构建的新范式。

目前,在美国的认知学界,大家一致认同,整合作为一种普遍的认知操作原理,适应于所有认知过程。

概念整合理论的核心思想就是将概念整合看作是人类的一种基本的、普遍的认知方式,它涉及人类日常生活的各方面。

一、概念整合理论的基础认知语言学从以往对语言抽象范畴的关注转向对具体篇章的分析,为概念整合理论的提出奠定了基础。

G.Fauconnier、M.Turner、E.Sweetser等人创立概念整合理论,把对篇章的理解及篇章的产生过程看作是心智空间的连续作用过程。

这一理论主要以下列两方面为基础:(一)在意义构建中,结构映射(structure mapping)和隐喻投射(metaphorical projection)起着关键作用。

概念整合理论的提出与隐喻观有着紧密的联系。

Lakoff 认为隐喻可以理解为一种映射。

映射是一整套固定的本体范围的实体与喻体范围的实体之间的本体论对应。

(Lakoff,1993)表示单向映射的方向Fauconnier&Turner的概念整合理论认为结构之间的投射是认知科学的中心思想。

投射将框定与具体情况、相关框定和常规情景连接起来。

(二)心智空间理论:心智空间是人们理解、想象、记忆或领会的一个特定场景中的成分以及各成分之间的关系的表征,它是人们在思考、交谈时为了达到局部理解与行动之目的而构建的概念体系,各成分代表话语实体,框架(frame)代表他们之间的关系。

心智空间可建立起一系列概念如时间、信念、愿望、可能性、虚拟等。

概念格的快速构造算法及其应用探讨

概念格的快速构造算法及其应用探讨

概念格是一种用于数据分析和知识发现的重要工具,它可以帮助人们在数据中快速发现潜在的规律和关联,进而为决策提供依据。

而快速构造算法是一种用于构建概念格的高效算法,它在处理大规模数据时具有较好的性能表现。

本文将探讨概念格的快速构造算法及其在实际应用中的价值和意义。

一、概念格的基本概念及应用场景1.1 概念格的概念概念格是由法国数学家Begrès在20世纪初提出的一种概念表示方法,它可以将数据集中的对象和属性转化为一个交互的概念结构。

概念格由概念和概念之间的关系组成,可以以图形的方式呈现出来,有助于理解和分析数据之间的关系。

1.2 概念格的应用场景概念格在数据挖掘、知识发现、决策支持等领域被广泛应用。

在医疗领域,可以利用概念格分析患者的病历数据,发现疾病之间的关联和规律;在金融领域,可以利用概念格分析客户的交易行为,识别潜在的欺诈风险。

二、概念格的快速构造算法2.1 基于属性增长的算法基于属性增长的算法是一种常见的概念格构造算法,它从数据集中逐步增加属性,构建概念格的过程中只考虑当前对象集合和属性集合的支撑关系,属于一种自底向上的构造方法。

2.2 基于对象约简的算法基于对象约简的算法是另一种常见的概念格构造算法,它从数据集中逐步约简对象,构建概念格的过程中只考虑当前属性集合和对象集合的支撑关系,属于一种自顶向下的构造方法。

2.3 快速构造算法的意义和价值快速构造算法可以大幅提高概念格构造的效率和性能,特别是在处理大规模数据时,传统的构造方法往往效率低下。

快速构造算法在实际应用中具有重要的意义和价值,可以帮助人们更快速地发现数据中的潜在关系和规律,为决策提供更可靠的依据。

三、概念格的快速构造算法在实际应用中的探索与应用3.1 概念格的快速构造算法在医疗领域的应用在医疗领域,概念格的快速构造算法可以帮助医生分析患者的病历数据,发现不同疾病之间的关联和规律,进而为临床诊断和治疗提供依据。

快速构造算法的高效性能可以帮助医生在较短的时间内分析大量的病历数据,为医疗决策提供及时支持。

一种基于直积运算的概念格合并算法

一种基于直积运算的概念格合并算法

n m e f t i ue i oma o tx h n e ,t sn c s a y t e ul e t c a e n sn l t iu eo e f t i u e A e lo u b ro t b t n fr l n e t a g s i i e e s r or b i a n w l t e b s d o i ge at b t ra s t t b t. n w ag . ar c c d ai r o ar
Y) ,2 。若( 1Y ) X ,2 且 ( ,1 ≠( 2Y ) 则记 1 ≤(2Y ) ,1 ≤(2Y) lY ) ,2 ,
r h f ric r o ai gc n e tlt c sb s d o h xse o c p at e sp e e t d T e“ o eh rl t c ’ sb i o b t m o y i m o op rt o c p at e a e n te e itd c n e tlt c si r s n e . h t n n i i tg te at e ’i ul f m o t t tp b i tr o o d r c r d c o e ain o h x se o c p ] t c s a d te n p n eain b t e h i c p o u t at e o o e i e o c p a— i tp o u t p rt n t e e itd c n e t at e n h mp i g rl t ewe n te d r t r d c t c f w xs d c n e t t e o i o e l i t 0 8牟 1 1月
计 算机 应用 与软件
Co ue p iai n n ot r mp trAp lc t sa d S fwa e o
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

概念格合并原理与算法智慧来1,2,智东杰2,刘宗田1(1.上海大学计算机工程与科学学院,上海200072;2.河南理工大学计算机科学与技术学院,河南焦作454150) 摘 要: 子形式背景可以进行纵向或横向合并得到一个新的形式背景,相反地,这个形式背景可以进行纵向或横向的拆分得到子形式背景.相应地,子概念格也可以进行合并,得到一个新的概念格.概念格合并无论是纵向合并还是横向合并,合并都不改变原有概念之间业已存在的父子关系.根据这个事实,结合概念格合并的定义,设计了概念格合并算法.此算法充分利用原有概念格的结构,在原有概念格基础上对部分节点进行调整得到合并结果.实验和分析均表明与将一概念格中的概念插入到另一个概念格的算法相比,此算法效率明显提高,适合概念格的合并运算.关键词: 概念格;子格;纵向合并;横向合并中图分类号: TP18 文献标识码: A 文章编号: 037222112(2010)022*******Theory and Algorithm of Concept Lattice UnionZHI Hui 2lai 1,2,ZHI D ong 2jie 2,LI U Z ong 2tian 1(1.School o f Computer Engineering and Science ,Shanghai Univer sity ,Shanghai 200072,China ;2.School o f Computer Science and Technology ,H enan Polytechnic Univer sity ,Jiaozuo ,H enan 454150,China )Abstract : Vertical union and horizontal union can be carried on sub 2context ,vice versa ;vertical split and horizontal split can be carried on a context.Accordingly ,sub 2lattice of the sub 2context can be united to create a new lattice which is affiliate to the con 2text created by the sub 2contexts.Both vertical union and horizontal union don ’t change the father 2son relationships that already exist in the sub 2lattice.Based on this fact and the definition of lattice union ,a union algorithm of concept lattices is put forward.This al 2gorithm uses the sub 2lattices ’structure ,only a few adjustment need to be made.Experiments and analysis show that compared with inserting one lattice ’s concepts into another lattice one by one ,the efficiency of this algorithm is improved.K ey words : concept lattice ;sub 2lattice ;vertical union ;horizontal union1 引言 随着处理的形式背景的增大,概念格的时空复杂度也会随着急剧增大.研究采用新的方法和手段来构造概念格,是形式概念分析应用于大型复杂数据系统的前提.而概念格的分布处理[1]思想就是通过形式背景的拆分,形成分布存储的多个子背景,然后构造相应的子概念格,再由子概念格的合并得到所需的概念格.这称为概念格分布处理模型或分布式概念格模型.形式背景的拆分有横向和纵向之分.把一个形式背景拆分成多个子背景,也称作局部背景,其对应的概念格就可称为子概念格或部分格.形式背景所对应的概念格可通过各子概念格进行合并来实现.这种概念格的构造方法采用的是一种分治策略,或者说是概念格的分布处理模型或框架.在采用分治策略构造概念格的研究中,P.Valtchev 等分别在文献[2]和文献[3]提出了叠置格和并置格两种概念格的构造方案.在文献[2,3]中,子格的构造采用的是一种递归的G odin 算法[4],并在概念格的构造中引入了下覆盖概念.而在子格或局部格合并为完整格或全局格中,两种方案中都是引入了子格和完整格之间的两个映射函数来通过部分格概念计算全局格概念.以并置格为例,设形式背景的属性被分割为A 1和A 2,对于部分格中的两个概念(X 1,Y 1)和(X 2,Y 2),那么这两个映射函数φ和ψ就可定义为:设函数φ:G L →P L ,是全局格概念到部分格概念的映射,那么:φ(X ,Y )=((f (Y ∩A 1),Y ∩A 1),(f (Y ∩A 2),Y ∩A 2));同理,设函数ψ:P L →G L ,,是部分格概念到全局格概念的映射,那么:ψ((X 1,Y 1),(X 2,Y 2))=(X 1∩X 2,g (X 1∩X 2)).有了上述的两个映射函数,就可以通过枚举两个子格概念之间的组合,计算出其对应的全局格概念.但是,在P.Valtchev 的算法中,由于一个部分格的概念对另一部分格的概念是遍历计算,会产生较大的重复,从而影响了算法效率.收稿日期:2009203211;修回日期:2009209210基金项目:国家自然科学基金(N o.60275022,60575035);上海大学创新基金(N o.A.16201082082002)第2期2010年2月电 子 学 报ACT A E LECTRONICA SINICA V ol.38 N o.2Feb. 2010 与此同时,文献[5]提出了概念的并与交原理,在此基础上文献[6,7]首先从形式背景的纵向、横向合并出发,定义了内涵独立和内涵一致的形式背景和概念格;还定义了内涵一致的形式背景、概念的横向加运算和概念格的横向并运算,并证明了横向合并的子形式背景的概念格和子背景所对应的子概念格的横向并是同构的,最后结合子概念格中概念间固有的泛化2特化关系,提出一种多概念格的横向合并算法来构造概念格.合并概念格的过程是其中一个概念格保持不变,将另一个概念格中的概念依次插入到保持不变的概念格中,插入过程中对概念格进行相应调整.对比文献[2,3]和文献[6,7]可知,所谓叠置格就是通过形式背景的叠置所得到的概念格,它实际上是对应子格的纵向合并;并置格就是通过形式背景的并置所得到的概念格,它实际上是对应子格的横向合并.根据概念格的对偶原理,概念的对象和属性具有同等的地位,只是论述的需要将两者区分开来.因此,有必要将两者统一论述,提出一个统一的概念格合并理论与实现方法;其次,文献[2,3,6,7]在合并概念格时都没有考虑如何利用原有概念格的结构,而是将概念格中的概念一个个地插入到另一个概念格中,损失了大量可以直接利用的信息.2 概念格合并的基本概念与理论 R.W ille[8]提出的形式概念分析是以序理论和完备格理论为基础,依据数据库中提供的基本信息建立起的一种刻画对象与属性之间关系的数学结构,其核心数据结构是概念格.定义1 设K=(G,M,I)是一个形式背景,AΑG,BΑM.如果A、B满足条件f(A)=B,g(B)=A,则称序对(A,B)为形式背景K的一个概念.A称为概念(A,B)的外延,B称为概念(A,B)的内涵.L(G,M,I)或L(K)表示K中所有概念全体构成的集合,即:L(G,M,I)={(A×B)∈G×M,f(A)=B,g(B)=A}[8]定义2 设K=(G,M,I)是一个形式背景,(A1, B1)、(A2,B2)∈L(K),如果A1ΑA2或B1ΒB2,称(A1, B1)是(A2,B2)的子概念,记为(A1,B1)≤(A2,B2).显然L(K)关于“≤”构成一个格,称为概念格[8].对于给定形式背景K=(G,M,I)的两个概念(A1, B1)、(A2,B2),以下结论成立:对于A1,A2ΑG,如果A1ΑA2,那么f(A2)Αf(A1);对于B1,B2ΑM,如果B1ΑB2,那么g(B2)Αg(B1).定理1(概念格基本定理) 概念格B(G,M,I)是一个完全格,其上确界和下确界分别是∧t∈T(A t,B t)=(∩t∈TA t,f(g(∪t∈TB t))),∨t∈T(A t,B t)=(g(f(∪t∈TA t)),∩t∈TB t)[8].定义3 在形式背景K1=(G1,M1,I1)和形式背景K2=(G2,M2,I2)中,对于任意g∈G1∩G2和任意m∈M1∩M2满足gI1mΖgI2m,则称K1和K2是一致的,否则称K1和K2是不一致的[6,7].定义4 如果形式背景K1=(G1,M1,I1)和K2= (G2,M2,I2)是一致的,那么它们的合并是:K1 K2= (G1∪G2,M1∪M2,I1∪I2),称为K1和K2的加运算.如果M1=M2,称K1±K2=(G1∪G2,M,I1∪I2)是两个形式背景的纵向合并[6,7].如果G1=G2,称K1 K2=(G, M1∪M2,I1∪I2)是两个形式背景的横向合并[6,7].定理2 如果K1=(G1,M1,I1)、K2=(G1,M2, I2)、K3=(G2,M1,I3)、K4=(G2,M2,I4)是一致的,那么,(K1 K2)±(K3 K4)=(K1±K3) (K2±K4).由定义4易知定理2成立,证明从略.定义5 如果L(K1)和L(K2)是一致形式背景K1和K2的概念格,则定义它们的加运算L(K1)+L(K2)等于L,L满足:(1)如果L(K1)中有概念c1(A1,B1),L(K2)中概念c2(A2,B2),令c3=(A1∪A2,B1∩B2),如果在L(K1)中的所有大于c1的概念中不存在等于或小于c3的概念,且在L(K2)中的大于c2的所有概念中不存在等于或小于c3的概念,则c3∈L;(2)如果L(K1)中有概念c1(A1,B1),L(K2)中概念c2(A2,B2),令c3=(A1∩A2,B1∪B2),如果在L(K1)中的所有小于c1的概念中不存在等于或大于c3的概念,且在L(K2)中的小于c2的所有概念中不存在等于或大于c3的概念,则c3∈L.(3)上述情况之外的概念不属于L.定理3 如果L(K1)和L(K2)是一致形式背景K1和K2的概念格,那么L(K1)+L(K2)=L(K1+K2).证明 定理的证明分为两个步骤:(1)如果概念c3由定义5(1)生成,C1=(A1, B3∪B x)∈L(K1)和c2=(A2,B3∪B y)∈L(K2)且满足A1∪A2=A3,B x∩B y={}Ζ在K1中有f(A1)=B3∪B x, g(B3)=A1,在K2中有f(A2)=B3∪B y,g(B3)=A2ΖK1+K2中有f(A3)=B3,g(B3)=A3Ζc3∈L(K1+K2).(2)由概念格的对偶性,同理可证,即:如果概念c3由定义5(2)生成,即:c1=(A1∪Ax,B3)∈L(K1)和c2= (A2∪A y,B3)∈L(K2)且满足A1∩A2=A3,A x∩A y={}Ζ在K1中有g(B3)=A1∪Ax,f(A1)=B3,在K2中有g(B3)=A2∪A y,f(A2)=B3ΖK1+K2中有f(A3)=654 电 子 学 报2010年B3,g(B3)=A3Ζc3∈L(K1+K2).综合上述两种情况,定理成立.概念格合并具有以下两个性质:性质1 假如c1(A1,B1)∈L(K1)、c2(A2,B2)∈L (K2),概念格合并如果产生新的概念,只产生型如(A1∪A2,B1∩B2)和(A1∩A2,B1∪B2)的概念.这个性质可以由定理1(概念格基本定理)直接得到.性质2 假如c1(A1,B1)∈L(K1)、c2(A2,B2)∈L (K2),概念格纵向合并如果产生新的概念,只产生型如(A1∪A2,B1∩B2)的概念;概念格横向合并如果产生新的概念,只产生型如(A1∩A2,B1∪B2)的概念.纵向合并不可能产生型如c3(A1∩A2,B1∪B2)的概念,这是因为A1∩A2ΑA1,A1∩A2ΑA2,因此c3既是c1的子概念又是c2的子概念,即既属于L(K1)又属于L(K2),故不是新生成的概念.根据概念格的对偶原理可知,性质的后半部分也成立.定义6 对于概念(A1,B1)和(A2,B2),若A1=A2或者B1<B2,则称(A2,B2)是(A1,B1)的前辈概念, (A2,B2)是(A1,B1)的后辈概念.3 概念格合并算法 概念格的合并可以转化为概念格的纵向合并和横向合并.本文重点讨论概念格的纵向合并,然后根据概念格的对偶原理,直接给出概念格的横向合并算法.3.1 概念格的纵向合并根据概念格合并的定义5、性质1以及性质2,可以得到概念格的纵向合并算法.概念格纵向合并算法:初始化: 对于(A1,B1)∈L(K1)、c2(A2,B2)∈L(K2),按照内涵的势升序比较概念的内涵;步骤1 对于待合并概念,即c1(A1,B1)∈L(K1)、c2(A2,B2)∈L(K2),B1=B2=B,合并为(A1∪A2,B),若A1≠A2,则更新c1(A1,B1)、c2(A2,B2)各自的前辈概念;若概念格中任意两个合并后的概念由父子关系直接相连,并且存在其它的概念使得这两个概念间接相连成为祖孙关系,则删除这两个概念之间的直接相连的父子关系;步骤2 对于产生子概念对,即c1(A1,B1)∈L(K1)、c2(A2,B2)∈L(K2),B1≠B2,生成概念c3(A1∪A2,B1∩B2)(如果内涵为空或者等于某个已经产生的生成概念的内涵,则放弃这个概念),并更新c1(A1, B1)、c2(A2,B2)各自的前辈概念;假如B1∩B2=B1或B1∩B2=B2,转步骤4;否则,执行步骤3;步骤3 若c1、c2有共同的前辈概念,c3调整为c1、c2的共同前辈概念的子概念,c3成为c1、c2的直接父概念;步骤4 删除已经生成的c3;如果B1∩B2=B1,c1调整为c1(A1∪A2,B1),建立父子关系使c1成为c2的父概念,若c2的内涵包含于c1原有子概念的内涵,则删除c1与原有子概念的父子关系;如果B1∩B2=B2, c2调整为c2(A1∪A2,B2),建立父子关系使c2成为c1的父概念,若c1的内涵包含于c2原有子概念的内涵,则并删除c2与原有子概念的父子关系;步骤5 结束并返回结果.更新前辈概念:若一个概念(A,B)的外延增大,增加的对象集为Ax,即(A,B)更新为(A∪Ax,B),则概念(A,B)的前辈概念(A an, B an)的外延都需要增大,(A an,B an)更新为(A an∪A x, B an);对于合并或者生成得到的一个概念,若其前辈概念也是合并或者生成得到的一个概念,那么就不再对这个前辈概念进行更新,也不再对这个前辈概念的前辈概念进行更新.例1 已知一致的形式背景K1、K2,和L(K1)、L(K2),求L(K1+K2).表1 形式背景K1a b c d1323334353336333表2 形式背景K2a b c d(1)33(2)3353336333 算法执行过程:步骤1 从根结点概念开始比较两个概念格的概念,并对内涵相同的概念进行合并.例如:(U1,{})和(U2,{})合并得到(U1∪U2,{}),(156,a)和((1)56,a)合并得到(156(1),a),(256,b)和(56(2),b)合并得到(256(2),b),直到合并得到({},abcd).合并的概念在图754第 2 期智慧来:概念格合并原理与算法3中用3号加以标记;步骤2 没有合并的概念有(35,c )∈L 1、(46,d )∈L 1、((1)6,ad )∈L 2、((2)5,bc )∈L 2,生成新概念(35(2),c )和(46(1),d ),转步骤3;步骤3 建立与调整父子概念的关系;步骤4 结束并返回合并结果.下面根据例1对本文的算法和文献[6,7]中的算法进行对比分析.在合并后的概念格中共有16对父子关系,其中只有(35(2),c )≥((2)5,bc )和(46(1),d )≥(6(1),ad )两对关系是原有概念格中没有的关系,因此本算法概念格结构信息利用率为14/16=87.5%.利用文献[6,7]的算法,如果将L (K 2)中的概念依次插入L (K 1)中,只利用了10对父子关系,利用率为10/16=6215%;如果将L (K 1)中的概念依次插入L (K 2)中,只利用了6对父子关系,利用率为6/16=3715%.可以看到,本文提出的算法在原有概念格结构利用率上明显优于文献[6,7]中的算法.由于概念格中父子关系定量计算十分困难,算法的复杂性可以采用处理概念节点的个数进行推算.假设L (K 1)有m 个概念,L (K 2)有n 个概念.比较算法的差异:如果采用本文的算法,假设L (K 1)和L (K 2)有p 个概念的内涵相同,那么只需要合并结点.因此这个步骤处理概念2p 个.另外L (K 1)中的(m -p )个概念和L (K 2)中的(n -p )个概念需要生成新的概念,共有(m -p )3(n -p )个.插入生成概念时,由于利用了两个概念格的信息,不需要遍历,直接可以找到父结点位置.算法一共处理概念(2p +(m -p )3(n -p ))个.如果采用将L (K 2)中的概念逐次插入到L (K 1)中,每插入一个概念,需要遍历L (K 1)中的每个概念,生成新概念并插入.因此,算法一共处理概念m 3n 个.令d =m 3n -(2p +(m -p )3(n -p )),则d/(m 3n )即为本文算法减少计算量所占比重.令p =a 3(m +n ),则a 代表相同内涵节点数量占节点总数的比例,并且有a <0.5.忽略d 表达式中的一次项,得到d =a 3(1-a )(m +n )2.由d 的表达式可知,d 的值与节点总数的平方成正比,并随着a 的增大而增大.为了验证上述概念格纵向合并算法的有效性,用Java2分别编程实现直接插入的合并算法和本文的算法.在P4117G 的计算机上运行结果如图4.在图4中,横轴代表规模n ,纵轴代表概念格合并用时.形式背景的属性个数定为30,对象属性间存在关系的概率为012.L 1:n 个对象等分为两部分,对每一部分的n/2个对象用G odin 算法生成概念格,然后将后一个概念格中的概念插入到前一个概念格中;L 2:n 个对象等分为两部分,对每一部分的n/2个对象用G odin 算法生成概念格,然后用本文的算法进行合并.随着对象的增加,内涵相同的节点数量所占总数比例逐渐增加,由5%增加到15%左右.图中的曲线表明,本文的算法与直接插入算法相比,运行时间明显减少.当节点总数接近500个时,本文算法的运行时间大约为直接插入算法的3/5,减少大约2/5的时间.由把a =10%,m =n 代入d 的表达式,得到d/(m 3n )=2/5.由于推算过程中忽略了一次项以及判断内涵是否相同时处理的节点,因此实验结果与推算结果是基本吻合的.3.2 概念格的横向合并算法根据概念格以及形式背景的对偶原理,可以得到概念格的横向合并算法:初始化:对于(A 1,B 1)∈L (K 1)、c 2(A 2,B 2)∈854 电 子 学 报2010年L(K2),按照外延的势升序比较概念的外延;步骤1 对于待合并概念,即c1(A1,B1)∈L(K1)、c2(A2,B2)∈L(K2),A1=A2=A,合并为(A,B1∪B2),若B1≠B2,更新c1(A1,B1)、c2(A2,B2)各自的后辈概念;若概念格中任意两个合并后的概念由父子关系直接相连,并且存在其它的概念使得这两个概念间接相连成为祖孙关系,则删除这两个概念这间的直接相连的父子关系;步骤2 对于产生子概念对,即c1(A1,B1)∈L (K1)、c2(A2,B2)∈L(K2),A1≠A2,生成概念c3(A1∩A2,B1∪B2)(如果外延为空或者等于某个已经产生的生成概念的外延,则放弃这个概念),并更新c1(A1, B2)、c2(A2,B2)各自的后辈概念;假如A1∩A2=A1或A1∩A2=A2,转步骤4;否则,执行步骤3;步骤3 若c1、c2有共同的后辈概念,则c3调整为c1、c2共同的后辈概念的父概念,c3成为c1、c2的直接子概念;步骤4 删除已经生成的c3;如果A1∩A2=A1,c1调整为c1(A1,B1∪B2),建立父子关系使c1成为c2的子概念,若c2的外延包含于c1原有父概念的外延,则删除c1与原有父概念的父子关系;如果A1∩A2=A2,c2调整为c2(A2,B1∪B2),建立父子关系使c2成为c1的子概念,若c2的外延包含于c1原有父概念的外延,则删除c2与原有父概念的父子关系;步骤5 结束并返回结果.更新后辈概念:若一个概念(A,B)的内涵增大,增加的属性集为Bx,即(A,B)更新为(A,B∪Bx),则概念(A,B)的后辈概念(A o f,B o f)的内涵都需要增大,即(Ao f,B o f)更新为(A o f,B o f∪B x).对于合并或者生成得到的一个概念,若其后辈概念也是合并或者生成得到的一个概念,那么就不再对这个后辈概念进行更新,也不再对这个后辈概念的后辈概念进行更新.3.3 概念格合并根据定理2,一个形式背景可以拆分成四个子形式背景,对这四个形式背景进行两次横向合并一次纵向合并,或者进行两次纵向合并一次横向合并,都可以得到原来的形式背景.相应地,对子背景的概念格进行两次横向合并一次纵向合并,或者进行两次纵向合并一次横向合并,都可以得到原来背景的概念格.4 总结 对形式背景的拆分与合并、概念格的合并进行了论述,提出了一个简便的概念格纵向合并算法.这个算法的核心思想是利用待合并概念格的结构,以改进计算量.实验与推算基本吻合,表明本文算法是有效的.根据概念格的对偶原理,概念格的横向合并也容易得到,故本文没有进行深入的论述.参考文献:[1]Li Yun,Liu Zong2tian,Shen Xia2jiong et al.Theoretical re2search on the distributed construction of concept lattices[A].Proceedings of the International Conference on Machine Learn2 ing and Cybernetics[C].New York:Institute of Electrical and Electronics Engineers Inc,2003.474-479.[2]Petko Valtchev,Rokia Missaoui.Building concept(Galois)lat2tice from parts:gennralizing the incremental methods[A].Lec2 ture Notes in Computer Science[C].Berlin:Springer,2001.290 -303.[3]P Valtchev,R Missaoui,P Lebrun.A partition2based approachtowards constructing Galois(concept)lattices[J].Discrete Mathematics,2002,256(3):801-829.[4]Godin R,Missaoui R,Alaoui H.Incremental concept formationalgorithms based on Galois(concept)lattices[J].Computation2 al Intelligence,1995,11(2):246-267.[5]刘宗田,分布式概念格数学模型研究[A].中国人工智能第9届年会论文集,人工智能进展[C].北京:邮电工业出版社,2001.39-42.Liu Zong2tian.Distribute concept lattice mathematic model re2 search[A].The9th AI conference in China,AI Development[C].BeiJing:People Post Industry Press,2001.39-42.(inChinese)[6]Liu Zong2tian,Li Liangsheng,Zhang Qing.Research on a unionalgorithm of multiple concept lattices[A].Proceedings of9th International Conference on Rough Sets,Fuzzy Sets,Data Min2 ing and Granular Computing[C].Berlin:Springer2Verlag, 2003.533-540.[7]李云,刘宗田.多概念格的横向合并算法[J].电子学报,2004,32(11):1849-1854.Li Yun,Liu Zong2tian.Horizontal union algorithm of multiple concept lattices[J].Acta Electronica Sinica,2004,32(11): 1849-1854.(in Chinese)[8]Ganter B,Wille R.Formal Concept Analysis:MathematicalFoundation[M].New York:Springer2Verlag,l999.作者简介:智慧来 男,1981出生,河南洛阳偃师人,博士生,主要研究领域为:信息处理、概念格、本体. E2mail:zhihuilai@智东杰 男,1952出生,河南洛阳伊川人,高级实验师,主要研究方向为人工智能、符号计算.刘宗田 男,1946出生,山东临沂人,教授,博士生导师,主要研究领域为:人工智能、软件工程和形式概念分析.954第 2 期智慧来:概念格合并原理与算法。

相关文档
最新文档