基于内容的概念格近似自相似度度量
基于概念格的语义相关度计算

算及 分 布 式 存 储 .
维普资讯
第 2 3期 /
张
柯等 : 于概念格 的语义相关度计算 基
・7 19・
V 12 N . / o. 2 o2 3
20 0 7年 6月
Jn O 7 u .2 o
文章编号 :04—17 ( 07 0 /3— 18— 4 10 4 8 2 0 )2 0 0 7 0
基 于概 念格 的语义 相 关 度 计算
张 柯 , 沈夏 炯 , 董 鑫 , 于俊 洋
维普资讯
第2 2卷
第 2 3期 /
郑 州 轻 工 业 学 院 学 报 (自 然 科 学 版 )
JU N L F H N Z O NV R IY F IH D SR Nt aSi c) O R A O Z E G H UU IE S G TI U T Y( a r c ne TO L N ul e
l a ,a meh d o ma t e e a c o u a in i p o o e .b s d o e fr l o c p a y i te r . t o fs e n i r lv y c mp tt r p s d a e n t ma n e t c n o s h o c n a l ss h o y T r u h t esu y o e e p rme t t eme h a e n c n e t at e i r v d t ef a i l .A d i h o g t d f h x e i n , h t o b s d o o c p t c sp o e b sb e n h t d l i o e n
基于语义词典和本体知识的概念相似度计算

基于语义词典和本体知识的概念相似度计算此文档将阐述基于语义词典和本体知识的概念相似度计算(ConceptualSimilarityCalculationBasedonSemanticDictionarya ndOntologyKnowledge),它是计算机领域中一种重要的实证研究领域,运用计算机技术和语言学知识来处理大规模数据,探索两个或更多的概念在语言上的差异和关联。
从宏观上来看,概念相似度计算可以应用于计算机语言处理领域,如文本摘要,语义分析,机器翻译,自动问答,文档检索和搜索,信息检索等重要研究领域。
语义词典和本体知识是概念相似度计算的关键构建部分,它们是专业语言学知识的集合,包括英语词典,概念空间,形式语言,语义网络,概念图和静态本体等,这些信息包含了该语言中的不同概念的含义,协助实现概念之间的相似度计算。
概念相似度计算的基本思想是基于多种信息计算两个或多个概念之间的相似度。
具体而言,概念相似度计算可以分为两个主要步骤:(1)语义词典建模;(2)本体知识建模。
首先,语义词典建模可以根据概念之间的正式定义,选择和组织一系列概念信息,构建语义词典,将概念信息表示成词语,概念,关联等。
据此,可以根据语义信息建立概念相似度模型,计算不同概念之间的相似度,进而实现概念之间的联系。
其次,本体知识建模是概念相似度计算的重要组成部分,指的是本体知识建模语言(Ontology Knowledge Modeling Language)。
本体知识是以概念、关系和概念之间的关系的形式建模的,它由多种方式表示知识,定义概念和实例之间的关系,以及概念之间的关系。
本体知识建模技术可以将概念模型数据转换为本体模型,并将本体知识应用于知识管理,确定概念之间的关联,考虑概念之间的相似度,从而实现概念之间的相似度计算。
最后,将语义词典和本体知识相结合,实现概念相似度计算。
基于语义词典和本体知识的概念相似度计算模型可以表示概念之间的关系,并以计算概念之间的距离来实现概念之间的相似度计算。
基于信息论方法的分类数据相似性度量

2018年第5期计算机与现代化JISUANJI YU XIANDAIHUA总第273期文章编号:1006-2475 (2018 )05-0030-05基于信息论方法的分类数据相似性度量郑碧如,吴广潮(华南理工大学数学学院,广东广州510641)摘要:两实例的距离或相似性度量在数据挖掘和机器学习中扮演着重要的角色。
常用的距离度量方法主要适用于数值数据,针对分类数据,本文提出一种数据驱动的相似性度量方法。
该方法利用属性值与类标签的信息,将属性值的类条件概率结合信息论来度量分类数据的相似性。
为了与已提出的相似性度量方法作比较,把各度量方法与k最近邻算法结合,对多个分类数据集进行分类,通过十折交叉验证比较结果的错误率。
实验表明该度量结合k最近邻方法使分类具有较低的错误率。
关键词:相似性;分类数据;信息论;条件概率中图分类号:TP391 文献标识码:A d o i:10. 3969/j.issn.1006-2475.2018.05.007Simil^rit^ Measure of Categorical Data Based on Information TheoryZ H E N G B i-r u,W U G u a n g-c h a o(School o f M a th e m a tics,South C hina U n iv e rs ity o f T e chno lo gy,Guangzhou 510641,C h in a)A b s t r a c t:The measure o f distance or s im ila rity bet^veen two instances plays an im po rtan t roleing. The com m on distance measures are m a in ly suitable fo r n u m e rica l d a ta,to the cla ssifica tio n d a ta,d rive n s im ila rity measure. T h is m ethod uses the in fo rm a tio n of a ttrib u te values and class labels to measure the s im ila rity o f catego rical data b y com b in in g the la b e l i s co n d itio n a l p ro b a b ility o f a ttrib u te values w ith in fo rm a tio n theory. In order to com pare w ith the proposed s im ila rity m easures,t h ii paper com bines 8 kin d s o f measure methods w ith k-nea p lu ra lity o f categorical data sets,and the e rro r rates o f the results are com pared through te n-fo ld cross s h o w th a t th is m e tric com bined w ith k-nearest ne ighbor m ethod makes a low er e rro r c la ssifica tio n rate.K e y w o r d s:s im ila r ity;categorical d a ta;in fo rm a tio n th e o ry;co n d itio n a l p ro b a b ility;引言在机器学习算法中,两实例间距离或者相似性度量扮演着重要的角色,广泛地应用于分类、聚类和奇异值检测和特征学习[1-]等算法中。
基于FCA的概念相似度计算方法

基于FCA的概念相似度计算方法
曹泽文;钱杰;张维明;邓苏
【期刊名称】《模糊系统与数学》
【年(卷),期】2008(22)1
【摘要】针对传统基于特征的概念相似度计算方法准确性不高的问题,提出了基于FCA的概念相似度计算方法。
该方法利用辞典形成两个本体特征之间的偏序关系,建立形式背景;以此为基础形成概念格。
引入新的基于概念格的相似度计算模型,以概念格的不可约下确界元素作为相似度计算的依据。
实验结果证明该方法提高了概念匹配的准确率。
【总页数】8页(P155-162)
【关键词】FCA;概念相似度;本体
【作者】曹泽文;钱杰;张维明;邓苏
【作者单位】国防科学技术大学信息系统与管理学院
【正文语种】中文
【中图分类】TP18
【相关文献】
1.基于FCA的领域问句相似度计算方法 [J], 万庆生;黄少滨;刘刚;陆路
2.基于限界传递相似度图的FCA概念相似度计算方法 [J], 黄宏涛;吴忠良;万庆生;黄少滨
3.基于语义信息内容的FCA概念相似度计算方法 [J], 黄宏涛;程清杰;万庆生;黄少
滨
4.一种基于FCA的概念相似度算法 [J], 林智超;朱国进
5.基于属性相似度在概念格的概念相似度计算方法 [J], 裴梧延;张琳
因版权原因,仅展示原文概要,查看原文内容请购买。
《本体映射中概念相似度计算研究》范文

《本体映射中概念相似度计算研究》篇一一、引言随着信息技术的飞速发展,大数据和知识图谱的构建与应用日益受到关注。
本体映射作为知识图谱构建过程中的关键技术之一,其重要性不言而喻。
在映射过程中,概念相似度计算是本体映射的核心问题之一。
本文旨在研究本体映射中概念相似度计算的相关方法,为知识图谱的构建提供理论支持和技术手段。
二、概念相似度计算的重要性概念相似度计算是本体映射的基础,其目的是衡量不同本体中概念之间的语义相似性。
在知识图谱构建过程中,概念相似度计算能够帮助我们准确地找到不同本体之间的关联,实现知识的整合与共享。
此外,概念相似度计算还可以应用于自然语言处理、机器翻译、信息检索等领域,具有重要的理论和实践意义。
三、概念相似度计算的方法目前,概念相似度计算的方法主要包括基于词汇的方法、基于语义的方法和混合方法。
1. 基于词汇的方法:该方法主要依据概念的名称或描述信息进行相似度计算。
常用的方法包括基于字符串的方法、基于共现关系的方法等。
基于词汇的方法简单易行,但往往忽略了概念的语义信息,导致计算结果不够准确。
2. 基于语义的方法:该方法利用语义模型和知识库来计算概念的相似度。
常见的语义模型包括语义网络、语义角色标注等。
基于语义的方法能够更好地捕捉概念的语义信息,提高相似度计算的准确性。
然而,由于知识库的复杂性和多样性,该方法存在一定的误差和不确定性。
3. 混合方法:为了结合基于词汇和基于语义方法的优点,研究者们提出了混合方法。
该方法综合利用词汇信息和语义信息来计算概念的相似度,能够在一定程度上提高计算的准确性。
混合方法通常需要结合具体的应用场景和需求进行设计。
四、本研究的内容与方法本研究旨在提出一种基于多源信息的本体映射中概念相似度计算方法。
该方法综合利用词汇信息、结构信息和语义信息来计算概念的相似度。
具体方法包括:1. 词汇信息提取:从概念名称和描述中提取关键词和短语,形成词汇特征向量。
2. 结构信息分析:利用本体结构信息,如类别关系、层次关系等,形成结构特征向量。
相似度测度总结汇总

1 相似度文献总结相似度有两种基本类别:(1)客观相似度,即对象之间的相似度是对象的多维特征之间的某种函数关系,比如对象之间的欧氏距离;(2)主观相似度,即相似度是人对研究对象的认知关系,换句话说,相似度是主观认知的结果,它取决于人及其所处的环境,主观相似度符合人眼视觉需求,带有一定的模糊性[13]。
1.1 客观相似度客观相似度可分为距离测度、相似测度、匹配测度。
它们都是衡量两对象客观上的相近程度。
客观相似度满足下面的公理,假设对象 A 与B 的相似度判别为(,)A B δ,有:(1) 自相似度是一个常量:所有对象的自相似度是一个常数,通常为 1,即 (,)(,)1A A B B δδ==(2) 极大性:所有对象的自相似度均大于它与其他对象间的相似度,即 (,)(,)(,)(,)A B A A A B B B δδδδ≤≤和。
(3) 对称性:两个对象间的相似度是对称的,即(,)(,)A B B A δδ=。
(4) 唯一性:(,)1A B δ=,当且仅当A B =。
1.1.1 距离测度这类测度以两个矢量矢端的距离为基础,因此距离测度值是两矢量各相应分量之差的函数。
设{}{}''1212,,,,,,,n n x x x x y y y y == 表示两个矢量,计算二者之间距离测度的具体方式有多种,最常用的有: 1.1.1.1 欧氏距离:Euclidean Distance-based Similarity最初用于计算欧几里德空间中两个点的距离,假设 x ,y 是 n 维空间的两个点,它们之间的欧几里德距离是:1/221(,)()n i i i d x y x y x y =⎡⎤=-=-⎢⎥⎣⎦∑(1.1)当x ,y 是两个直方图时,该方法可称为直方图匹配法。
可以看出,当 n=2 时,欧几里德距离就是平面上两个点的距离。
当用欧几里德距离表示相似度,一般采用以下公式进行转换:距离越小,相似度越大。
基于特征隶属度的文本分类相似性度量方法
Vo 1. 44 No. 11 Nov.2017
基于特征隶属度的文本分类相似性度量方法
池云仙 1 , 2 赵书良 2 罗燕2 赵骏鹏 2 高琳2 李超2
(河北师范大学资源与环境科学学院
ห้องสมุดไป่ตู้
石家庄 050024)1
(河北师范大学数学与信息科学学院
摘 要
石家庄 050024)2
基于相似性进行文本分类是当前流行的文本处理方法。基于特征隶属度的文本分类相似性度量方法旨在利
Abstract
It is a fashionable method to do text classification based on similarity. Algorithm similarity measure for text
classification based on feature subjection degree (SMTCFSD) aims at measuring similarity of documents through sub jection relationship between feature words and documents. Algorithm SMTCFSD divides words into total subjection word sets. partial subjection word sets and none subjection word sets based on the subjection relationship. and defines subjection function based on three subjection word sets. Total subjection word sets subject to two documents.and sub jection degree will decrease when the differences between two total subjection words increase. The words that only belong to one of the two documents are subsumed into partial subjection word sets.in which subjection degree is a definite value. Subjection degree of none subjection word sets is zero. because the words subject to neither of two documents. Total subjection relationship is more important than partial subjection relationship for similarity measure. Due to word sets of documents in the same category is similar to each other. while the ones in different categories have great distinc tion. classification accuracy will be promoted obviously based on different values of feature words. which are decided by subjection degree. Algorithm SMTCFSD is superior to the widely used similarity measure methods through experimental results on data sets from Reuters-21578 and 20-Newsgroups. Keywords Data mining. Text classification. Similarity measure. Subjection degree
《2024年度本体映射中概念相似度计算研究》范文
《本体映射中概念相似度计算研究》篇一一、引言随着信息技术的快速发展,海量的数据和信息日益增多,使得人们需要更加高效和准确地处理这些数据和信息。
在这个过程中,本体映射成为了一个重要的研究领域。
本体映射的主要目的是在多个本体之间建立联系,从而实现信息的共享和交换。
而概念相似度计算是本体映射中的关键技术之一。
本文将针对本体映射中概念相似度计算进行研究,介绍相关的理论和方法,并分析其优缺点和适用场景。
二、概念相似度计算的理论基础概念相似度计算是通过对两个或多个概念之间的语义关系进行度量,从而得出它们之间的相似度。
这种计算方法主要基于以下几个理论基础:1. 语义网络理论:语义网络是一种通过节点和边来表示概念及其关系的网络结构。
在概念相似度计算中,可以通过构建语义网络来描述概念之间的关系,从而计算相似度。
2. 特征比较理论:不同的概念具有不同的特征和属性。
通过比较两个概念的特征和属性,可以得出它们之间的相似度。
3. 机器学习理论:机器学习可以通过对大量数据进行学习和分析,提取出有用的信息和规律。
在概念相似度计算中,可以利用机器学习算法对大量文本数据进行训练和分析,从而得出概念之间的相似度。
三、概念相似度计算的方法目前,常用的概念相似度计算方法主要有以下几种:1. 基于路径的方法:该方法通过计算两个概念在语义网络中的路径长度来计算相似度。
路径长度越短,相似度越高。
2. 基于词向量空间模型的方法:该方法将每个概念表示为一个词向量,然后通过计算两个词向量之间的余弦值来计算相似度。
3. 基于语义规则的方法:该方法通过定义一系列的语义规则来描述概念之间的关系,然后根据这些规则计算相似度。
4. 基于深度学习的方法:利用深度学习算法对大量文本数据进行训练和分析,从而提取出有用的特征和规律,再通过计算这些特征和规律之间的相似度来得出概念之间的相似度。
四、各方法的优缺点及适用场景分析1. 基于路径的方法:优点是简单易懂,易于实现;缺点是对于复杂的语义关系难以准确度量。
基于语义信息内容的FCA概念相似度计算方法
优先出版 计 算 机 应 用 研 究 第32卷--------------------------------基金项目:国家科技支撑计划项目(2012BAH08B02);河南省科技攻关项目(082400420250,112300410008);河南省教育厅科学技术研究重点项目(13A520508);河南师范大学博士科研启动基金项目(qd12107)作者简介:黄宏涛(1980-),男,河南漯河人,副教授,博士,主要研究方向为问答系统、模型检测(huanght@);程清杰(1990-),女,河南安阳人,硕士研究生,主要研究方向为数据挖掘;万庆生(1975-),男,黑龙江哈尔滨人,博士研究生,主要研究方向为问答系统、数据挖掘;黄少滨(1965-),男,黑龙江哈尔滨人,博士,教授,博导,主要研究方向为数据挖掘、模型检测.基于语义信息内容的FCA 概念相似度计算方法黄宏涛1,程清杰1,万庆生2,黄少滨2(1.河南师范大学 河南省高校教育信息工程技术研究中心,河南 新乡 453007;2.哈尔滨工程大学 计算机科学与技术学院,哈尔滨 150001)摘 要:基于概率信息内容的FCA 概念相似度计算方法依赖于语料库中概念的频次信息,这种方法仅使用出现概率作为信息内容度量指标计算FCA 概念相似度,其计算结果的准确率不高。
针对上述问题提出一种基于语义信息内容的FCA概念相似度计算方法,该方法利用本体中概念间的上下位语义关系度量信息内容,以进一步提高概念一般/具体程度的度量精度;然后在本体派生的ISA 层次结构上计算语义信息内容相似度,从而避免基于概率信息内容的方法对语料库的依赖;最后把语义信息内容相似度作为度量FCA 概念相似度的依据,并给出了通过构造带权二部图提高相似度计算效率的方法。
实验结果表明使用基于语义信息内容的方法能够在不牺牲时间性能的前提下有效提高FCA 概念相似度计算结果的准确率。
关键词:FCA 概念相似度;信息内容;概率;语义;层次结构中图分类号:TP391.1 文献标志码:AFCA concept similarity computation based on semantic information contentHUANG Hong-tao 1, CHENG Qing-jie 1, WAN Qing-sheng 2, HUANG Shao-bin 2(1. Engineering Research Center of Henan provincial Universities for Education Information, Henan Normal University,Xinxiang Henan 453007, China; 2. College of Computer Science & Technology, Harbin Engineering University, Harbin 150001,China)Abstract: The FCA concept similarity computation method based on probability information content relies on the frequency ofconcepts in corpus, this method takes only the occurrence probability as information content metric to compute FCA conceptsimilarity, which makes the accuracy of computing results is not high. In order to improve the accuracy of probability basedmethod, this paper proposes a semantic information content based FCA concept similarity computation method, it utilizes thesuperordinate and subordinate semantic relationship of concepts to measure information content, which improves the accuracyof the generic and specific degree of concepts. Then it computes the semantic information content similarity on ISA hierarchyderived from ontology, which avoids the dependence of probability information content method on corpus; Finally, this methodtakes semantic information content as a measure to compute the FCA concept similarity, and introduces a weighted bipartitegraph construction method to improve the efficiency of similarity computation. Experimental results show that this semanticinformation content based FCA concept similarity computation method improves the accuracy of probability information contentbased method effectively without sacrificing time performance.Key Words: FCA concept similarity; Information content; Probability; Semantic; Hierarchy0 引言 形式概念分析(Formal Concept Analysis ,FCA )是一种数据分析的有效工具,是人工智能领域研究人员关注的焦点之一,目前在信息检索、数据挖掘、软件工程等领域有着广泛的应用。
基于相似度度量的无监督学习算法研究
基于相似度度量的无监督学习算法研究摘要:无监督学习算法是机器学习领域的重要研究方向之一。
相似度度量作为无监督学习算法的核心概念之一,对于无监督学习的模式发现、聚类、降维等任务具有重要意义。
本文综述了基于相似度度量的无监督学习算法的研究现状以及相关的理论和应用。
首先介绍了相似度度量的基本概念和常用的度量方法,并重点讨论了K近邻算法、谱聚类算法和降维算法等几种典型的无监督学习算法。
然后,总结了相似度度量在图像识别、文本分类和推荐系统等领域的应用。
最后,对未来无监督学习算法中基于相似度度量的研究方向进行了展望。
1. 引言无监督学习算法是指从未标注的数据中自动学习模式、结构或特征,广泛应用于聚类、降维、异常检测等领域。
相似度度量作为无监督学习算法的基础,对于捕捉数据间的内在关系具有重要意义。
本章将对基于相似度度量的无监督学习算法进行研究。
2. 相似度度量的基本概念相似度度量是衡量数据间相似程度的一种方法。
常用的相似度度量方法包括欧氏距离、曼哈顿距离、余弦相似度等。
其中,欧氏距离是最常见的相似度度量方法之一,它通过计算数据点间的欧氏距离来判断它们的相似程度。
曼哈顿距离是另一种常用的相似度度量方法,它在计算过程中考虑了数据点在各个维度上的绝对差值。
余弦相似度度量了两个向量之间的夹角,用于比较文本或稀疏向量的相似性。
3. 基于相似度度量的无监督学习算法3.1 K近邻算法K近邻算法是一种基于相似度度量的无监督学习算法,它通过计算数据点与最近邻数据点之间的相似度来进行分类或聚类。
K近邻算法的核心思想是“近朱者赤”,即将一个数据点分为属于同一类别的数据点的多数投票决定。
K近邻算法在模式发现和聚类任务中得到广泛应用。
3.2 谱聚类算法谱聚类算法是一种基于图论和相似度度量的无监督学习算法,它通过构建数据点之间的相似度矩阵,并对其进行降维和聚类来实现数据集的分割和分类。
谱聚类算法的核心思想是将数据点看作图上的节点,相似度度量作为边的权重,通过图的切割和嵌入来实现聚类。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
种方法就是对该 图形进行划分 , 并以其中的一个子块为基块
来提取 图形 的特征值进 行分析I 实际上 , 。 用户一般只对其 中的 某一类或某几类对象或者属性感兴趣 , 即他们关注的只是具有
结果 ; 最后对两种方法的特 点进行了分析。
1概念格 图形 近似 自相似特 性
概念格图形的 一种 表示方法是线图 表示法n 这种表示形 , 式生动 、 简洁地体现了概 念之 问的泛化和特化关系 。在线图表 示 中, 一个 节点代表着一个概 念 , 条边代表与之 相连 的两个 一 节点之间的偏序关 系。每个概念又是由一类具有相同对 象的属 性集和这些对 象 ( 可以是具有相 同属性 的对象集和这些 属 也
不同的用户可能对关注内容要求的精确程度不一样 ,如果
将概念格图形 的划分细度固定 , 将会给用户带来不便。因此 , 本 方法将概念格 图形的划分细度交给了用户,即用户可 以根据需
部的各个节点组成的组 , 即概念组之问在内容上存在着很大的 相似特性 也就 是说概念格局部 与局部之间在 内容上存在着
的近似 自相似特性 , 出了基于用户 自定义基块和划分细度的 提 近似 自相似度度量方法 , 以及基于确定关键 子块的近似 自相似 度度量方法 。
21 用户 自定 义 基块 和 划 分 细 度 的近 似 自相 似度 度 量 方 法 .
如果要 计算具有一定规模的概念格图形的近似 自相似度 ,
析, 并提 出 了概 念 格 近似 自相 似 度度 量 的应 用方 向 。
关键 词 :概 念格 ;分 形 ;近 似 自相 似 ;基 块 ; 关键 子 块
O 引言
概念格作为一种 支持 数据分析 的有效工 具 ,迅速 发展起 来 。但 是在以后 的一段时『 内 , 日 对概念格的研究只是停留在概 J 化关系的图形特性的探讨没有突破性进展 。近年来 , 虽然也有
2 概 念格 图形近 似 自相似特性 的度量 方 法
从严格意义上来讲 , 概念格图形并不是完全 自相似特性 的
图形结构 , 只是具有近似 自相似特性 , 因此 , 我们不能 用传统 的 分析分 形图的一些参数或 函数 , 例如 自相似维数 , 仿射变换等 对概念格图形进行定量分析 。 文根据概念格 自身的基于内容 本
维普资讯
・
6 ・
Co u e a N o. 0 7 mp t r Er 1 2 0 1
基 于 内容 的概 念格 近似 自相似 度度量★
张瑞青 ,马 骏 ,李 铁柱
(. 南 大学计 算机 与信 息工程 学 院 ,河 南 开封 450 ;2 1河 70 4 .河南 大学数 据与 知识 工程研 究所)
一种是基于用户 自定义基块和 留在对给定概念集 的可视 化布局 以及概 念格图形之 『 的相 似 形 的近似 自相似度的两种方法 : 日 J 比较 上 近来 , 利用一种合适 的数学工具对概念格图形 自 如何
身的特性进行分析 , 逐渐成为一个令人关注的问题 。
与此同时 , M 公一研 究中心物理部研究员暨哈佛大学数 I B J 学系教授曼德勃罗(e otBmadlrt 18 B ni . n e o) 9 2年出版 了著名 b 在 的专著《 自然界的分形几何学》标志着分形理 论初步形成 。 , 】 从 此 , 为非线性科 学 中的一个前沿 课题 , 作 分形数学迅速发展起 来 ,并成为分析数 学界研 究不规叭 几何图形问题的有力工具 ; 4 尤其是 “ 分形” 的定义 , 突出了分形 的 自相似性 , 反映了 自然 界 中广泛 存在的一类物质的基本 属性 : 局部与局部 , 局部与整体 在形态 、 功能 、 时间 、 空问 以及 内容等方面具有统 计意义或近似 的自相似性 】 。 本文 试图通过分析概念格图形的特征 , 出概念格 图形 的 提 近似 自相似特性 , 并给出基于子块的概念格 图形的近似 自相似 度度量方法 ; 在此基础 上 , 介绍 了具体的软件实现 原型和计算
性 ) 成的 一 个 二元 组 ; 组 由此 , 于 每 个 具 体 的线 图 而 言 , 内 对 其
这些对象或者属性 的子概念集 。基于此 , 本文把 内容上的相似
性作为概念格 图形的一个特征值 , 以此作 为划分依据 ; 并 为了 增加图形的整体近似 自相似度 , 允要 :根据 基 于 内容 的概 念 格 图形 的 近似 自相 似 性 ,给 出了 用户 自定 义基 块 和 划 分 细度 的近 似 自相 似 度 度 量 方 法 , 在
此 基 础上 又提 出确 定 关 键 子 块 的 近似 自相 似 度 度 量 方法 ,最 后 分 别 用 这 两 种 方 法 对概 念 格 图形 的 近 似 自相 似 性 进 行 分
一
要 自定义划分细度 。例如, 一个用户只关心与一个对象相关的概 念节点 ,那么该用户就可以要求概念格 图形的划分细度为 1如 ;
定的相似特性 。同理 , 我们 对线图进 行适当的划分 , 经分析发 果 另一个用户关心的对象个数为 n那么该用户就可以要求概念 ,
一
现 , 内容上 , 在 各个 子块之 间也存在着一定的相似性 , 并且各个 子块内部同样存 在着一定 自相似性 , 而概念 节点的个数与 内容 就成了度量线图近似 自相似特性的标准 ; 如果再对线图的每条 之 间在 内容上 的相似 关系 , 那么 , 边也 可以成 为度量两个概 念
并且这个权值能够正确反映两个 概念 念格 的建造算法和一般性的应用 , 对体现概念之问的泛化和特 边 附上一个恰 当的权值 , 我们提 出了分析概念格图 部分学者把注意力转 向了概念格 图形 的研 究 , 不过 , 也仅 停 之 问相似性 的依据 。根据这些特征 , 划分细度 的概念格 图形的近似 自相似度 度量方法 ; 另一种是基 于确定关键 子块 的概念格图形的近似 自相似度度量方法 。