基于MLS方法的本体算法

合集下载

本体构建方法与应用

本体构建方法与应用

本体构建方法与应用马旭明 王海荣(北方民族大学 计算机科学与工程学院,宁夏 银川 750000)摘 要:自从本体的概念被广泛地引入计算机领域之后,领域专家和相关机构提出了众多本体的构建方法,但每种方法都有各自的适用领域,且不同的领域知识概念具有不同特点,使得构建方法的实用性和通用性大大降低。

笔者在七步法的基础之上结合了高校领域的相关概念实现了一个简单的可推理的领域本体。

最后利用Protégé5.0.0自带的推理机结合SWRL规则对所实现本体进行了测试,测试结果显示,七步法适合高校领域本体的构建,且能够根据已有知识获取新知识。

关键词:本体构建方法;七步法;高校领域;推理机;语义Web规则语言中图分类号:TP18 文献标识码:A 文章编号:1003-9767(2018)05-033-04Ontology Construction Method and ApplicationMa Xuming, Wang Hairong(College of Computer Science and Engineering, North Minzu University, Ningxia Yinchuan 750000, China) Abstract: Since the concept of ontology has been widely introduced into computer field, domain experts and related agencieshave proposed many ontology building methods, but each method has its own applicable field. Because different domain knowledge concepts have different characteristics, making the practicability and universality of the construction method greatly reduced. Based on the seven-step method, this paper combines the relevant concepts of the university field to realize a simple and deductive domain ontology. At last, the ontology is tested by using Protégé5.0.0 inference engine combined with SWRL rules. The test results show that the seven-step method is suitable for the construction of ontology in the university field and can obtain new knowledge based on the existing knowledge.Key words: ontology construction method; seven-step method; university field; inference engine; semantic Web rule language1 概述Web发展已进入了Web3.0的阶段,语义Web是Web3.0的一个重要组成部分,在语义Web发展的过程中面临的一个技术难题是如何让机器和人一样进行“思考”和“推断”,这涉及本体、逻辑和规则等若干方面。

基于机器学习的基因表达富集分析算法

基于机器学习的基因表达富集分析算法

基于机器学习的基因表达富集分析算法一、基因表达富集分析算法概述基因表达富集分析是一种生物信息学方法,用于识别基因表达数据中显著变化的基因集,并探索这些基因集在生物学过程中的功能和作用。

随着高通量测序技术的发展,基因表达数据的获取变得更加容易和快速,但同时也带来了数据分析的挑战。

机器学习作为一种强大的数据分析工具,已经被广泛应用于基因表达富集分析中,提高了分析的准确性和效率。

1.1 基因表达富集分析的核心特性基因表达富集分析的核心特性主要体现在以下几个方面:- 高通量:能够处理大规模的基因表达数据,识别出显著变化的基因集。

- 多维度:不仅考虑基因表达的变化,还考虑基因的功能和生物学背景。

- 动态性:能够适应不同实验条件下的基因表达变化,动态调整分析策略。

1.2 基因表达富集分析的应用场景基因表达富集分析的应用场景非常广泛,包括但不限于以下几个方面:- 疾病诊断:通过分析疾病状态下的基因表达变化,识别出与疾病相关的基因集,为疾病诊断提供分子标记。

- 药物靶点发现:通过分析药物处理后的基因表达变化,识别出潜在的药物靶点,为新药研发提供依据。

- 功能基因组学:通过分析不同组织或细胞类型的基因表达变化,揭示基因在不同生物学过程中的功能。

二、机器学习在基因表达富集分析中的应用机器学习是一种通过算法让计算机系统利用数据进行学习和改进的方法。

在基因表达富集分析中,机器学习技术被用来提高分析的准确性和效率。

以下是机器学习在基因表达富集分析中的关键应用。

2.1 机器学习算法的选择在基因表达富集分析中,选择合适的机器学习算法是至关重要的。

常用的机器学习算法包括:- 支持向量机(SVM):用于分类和回归分析,能够处理高维数据。

- 随机森林(RF):一种集成学习方法,能够处理大规模数据,并且具有良好的泛化能力。

- 神经网络:特别是深度学习网络,能够处理复杂的非线性关系,适用于大规模数据集。

2.2 特征选择和降维在基因表达数据中,特征选择和降维是提高机器学习模型性能的关键步骤。

omlsa算法

omlsa算法

omlsa算法摘要:1.OMLSA算法简介2.OMLSA算法原理3.OMLSA算法应用4.OMLSA算法优缺点5.结论与展望正文:一、OMLSA算法简介OMLSA(One-class Multiple Local Scattering Algorithm)算法是一种基于样本的异常检测方法,主要用于挖掘数据集中的局部结构。

与传统的聚类算法不同,OMLSA仅需使用正常样本数据进行训练,从而实现对异常数据的检测。

该算法具有较强的适应性和鲁棒性,已广泛应用于各种领域。

二、OMLSA算法原理OMLSA算法主要基于多局部散射(Multiple Local Scattering)思想。

在训练过程中,算法将正常样本数据划分为多个局部区域,并计算每个局部区域的中心。

接下来,通过计算正常样本与局部区域中心的距离来判断新样本是否属于正常类别。

若距离超出预设阈值,则将该样本标记为异常。

三、OMLSA算法应用1.金融欺诈检测:通过分析用户交易数据,识别出异常交易行为,从而防范欺诈风险。

2.网络入侵检测:分析网络流量数据,检测潜在的恶意攻击行为。

3.医疗诊断:分析病人病历数据,发现异常病例,提高诊断准确性。

4.工业监控:对生产过程中的数据进行实时监测,发现异常情况,确保生产安全。

四、OMLSA算法优缺点优点:1.适应性强:能够应对数据分布的多样性,具有较强的普适性。

2.鲁棒性高:对于噪声数据和异常值具有较强的抗干扰能力。

3.计算效率较高:相较于一些聚类算法,OMLSA具有较快的收敛速度。

缺点:1.参数选择:OMLSA算法需要选取合适的参数,以达到最佳的异常检测效果。

2.阈值设定:确定合适的阈值对于算法性能至关重要,若阈值设置不当,可能导致误报或漏报。

五、结论与展望OMLSA算法作为一种高效、实用的异常检测方法,在许多领域取得了良好的应用效果。

然而,如何选取合适的参数和阈值以提高算法性能仍是一个值得探讨的问题。

未来研究可以针对这一方向进行优化,进一步提高OMLSA算法的检测性能。

应用WEMLS的安全数据集成模型

应用WEMLS的安全数据集成模型

l 概述
本体是定义了一个领 域的公共词 汇集 ,利用这个公共词 汇集 ,可实现信息共享和知识 共享。领 域内存在一 些基本概
念 ,本体一般包含这些基 本概 念及 基本概念 间关系的计算机 可理解 的定义 。就领域本体而言 ,其一致性检查…及集成过 程 中的安全处理 是一 个热点 问题 。
[ src ]T eee i sav r t fh t o e eu aata ne Ob nertdwi i eued man I re ov ei u so e Abtat h r xs ai yo ee g no sd t t edt eitgae t nasc r o i. nodrt slet s e ft t e r h h o h s h
( ML ) WE S的安全数据集成模型 。定义可信权值 的概念 , 建立进程授权 机制和信任 计算机 制。应用结果表 明, 该模型能使可信进程更灵活地
访问客体 。
关健词 :多级 安全策 略;安全数据 ;可信权值 ;本体
S c r t t n e r t n M o e i g W EM LS e u iy Da a I t g a i d l o Usn
M ENG - n , N is e g W ANG iq a g Yu l g YI Gu -h n , o Hu - i n
( l g f o ue c n ea d e h oo y H r i E gn e n ies y Hab n1 0 0 ) Cgl e mp t S i c c n lg , ab n n ie r gUnv r t, ri 5 0 1 e oC r e n T i i
s c r y a d itg t f aamo ef xby i e r c s f ne r i n Mut e e S c r y ML ) sit d c d A t o g S i w d l p l d e u t n e r yo t i n i d r e il t o eso tg a o , lL v l e u i ( S i nr u e . l u hML iey a pi l nh p i t i t o h s e

自然灾害应急预案形式化表示技术

自然灾害应急预案形式化表示技术

本体 是描 述语义 模型 的重 要手段,是 “ 共享概 念
模 型的 明确 的形式化规 范说 明”,其 目标是捕获相 关
的领域 的知识,提 供对 该领域知 识的共 同理解 , 定 确 该领域 内共 同认 可的词汇,并从不 同层次 的形式化模
1 基于本体 的形式化方法O WL
OWL是 W3 C的推荐标准, 具有与 多种其他本体
① 基金 项 目: 家 自然科 学基 金: 大 自然灾 害应 急救 助预 案仿 真 与模拟 技 术研 究(120 8 国 重 9 04 0) 收稿 时 间:020 -3收 到修 改稿 时 间: 1—22 2 1-1 ; 0 2 20 .3 0 Apl ai ae实 用案例 1 3 pi t nC s c o 3
提供大 来表示,可 以是名字( u . 或表达式. W 如 P) i O L
通过属性 “ 包含处置流程 ”与 “ 处置流程 ”相关联,通
过属性 “ 包含 附则”与 “ 附则 ” 相关联。 通过属性 “ 包
含应急预案管理过程 ”与 “ 应急预案管理过程 ”相关
联. “ 总则 ”通过 属性 “ 包含编制依据 ”与 “ 编制依 据 ”相关联,再通过 “ 编制依据 ”与 “ 法律 ” 法规 ” 、“ 以及 “ 国家文件 ”相关联.以此类推,实现 自然灾害应
缺 乏统一 的标准 ,计算机无法直 接理解和 自动处理 这 些 非结构化文 本形式 的应 急领域知 识, 在其 应用于 应 急处置决策时往往会存在对 自动化决策 的支持不够 和
集 中在应 急预案 内部组织结构 的理论建模 研究,并没 有结合实 际的应 急机构综合协调过程 . 本文基于对 自然灾 害应 急预案和应 急机 构综合协 调联动 过程 的分析 , 选择适合 预案知识表示 的本体方

omlsa算法

omlsa算法

omlsa算法OMLSA(One-pass Multi-step Ahead Local Search Algorithm)是一种基于稀疏性技术的搜索算法,用于解决组合优化问题。

通过使用一种逐步向前搜索的策略,OMLSA能够在一次搜索中找到多个最优解,并避免了重复搜索相同的解空间。

本文将介绍OMLSA算法的核心思想、具体步骤以及应用场景。

一、核心思想OMLSA算法的核心思想是将搜索问题分解为多个子问题,并通过稀疏性技术来减少搜索空间的规模。

具体而言,OMLSA算法通过引入一种全局稀疏性的方法,选择一部分子问题进行搜索,并通过快速的局部搜索方法得到近似最优解。

在得到一个近似最优解之后,OMLSA算法通过对这个解的微调来产生更好的解。

这样的迭代过程将持续多次,最终得到多个最优解。

二、具体步骤OMLSA算法的具体步骤如下:1. 初始化:设置搜索问题的初始解,以及相关参数如搜索时间、搜索空间大小等。

2. 全局稀疏性:根据全局稀疏性方法,从搜索空间中选择一部分子问题进行搜索。

全局稀疏性方法可以根据问题的特点来选择,如基于约束图的稀疏性和基于启发式方法的稀疏性。

3. 局部搜索:对选定的子问题进行局部搜索,找到一个近似最优解。

4. 解微调:对近似最优解进行微调,以得到更好的解。

微调的方法可以是局部搜索、模拟退火或遗传算法等。

5. 判断停止条件:根据设定的搜索时间、搜索空间大小或达到一定收敛程度等条件,判断是否停止搜索。

6. 重复步骤2至步骤5:如果未满足停止条件,重复进行全局稀疏性、局部搜索和解微调的步骤。

7. 输出结果:将得到的多个最优解输出,作为问题的解集。

三、应用场景OMLSA算法适用于各种组合优化问题,特别是那些搜索空间较大、搜索时间较长的问题。

以下是几个常见的应用场景:1. 旅行商问题(TSP):在给定一组城市和它们之间的距离矩阵的情况下,找到一条最短路径,使得所有城市都被访问且路径最短。

2. 装箱问题(Bin Packing Problem):将一组物品放入最少的容器中,使得容器的数量最少。

基于OWL属性特征的语义检索研究

第 1 卷 第 2期 8
V0. 8 1 1
No2 .
电子设计 工程
Elcr n cDe in En i e rn e to i sg gn ei g
21 00年 2月
Fb 2 1 e. 00
基于 OWL属 性特征 的语义检 索研 究
张 野
( 海大学 商学院, 宁 锦 州 111) 渤 辽 20 3
i i a e a e p o e a i meh d ef cie y rg l tst e p e iin a d r c l a d c s mie s r Sr t e a . n t sp p rh v r v d t t h s t o f t l e u ae h r cso n e al n u t z su e ’ er v 1 h h t e v o i
Ke r s nooy;We noo yL n a e OW L) e ni rt ea ;c n e ts lrt;p rmeeie y wo d :o tlg b O tlg a g g ( u ;sma t er vl o c p i a y aa trz c i mi i
本 体 在 软 件 工 程 、 工 智 能 、 息 检 索 、 bSri I 人 信 We ev ej c 等
等有 关 属 性 的 特 征 。
系统 的实 现 过 程 中 . 域 本 体 中 概 念 之 间 的相 似度 量 化 计 算 领 是检 索 词扩 展 和 检 索 结果 排 序 的 核 心 问题 。现 关 于 本体 内语 义 相 似 度 算 法 研 究 主要 有 基 于 D MLS描 述 的 匹 配算 法 [ A — 2 l , 基 于 概 念 语义 距 离 的算 法 . 于 属 性 的相 似度 算 法 [ 及 基 基 4 1 以

omlsa算法

omlsa算法 摘要: 一、算法背景 1.omlsa算法简介 2.算法发展历程 二、算法原理 1.核心思想 2.算法流程 三、算法应用 1.应用领域 2.实际案例 四、算法优缺点 1.优点 2.缺点 五、发展趋势 1.发展前景 2.未来研究方向 正文: 一、算法背景 omlsa算法是一种用于处理高维数据的新型算法,全称为One-class Learning based on Manifold Regularization and Support Vector Machines。该算法是在传统的支持向量机(SVM)的基础上,结合了流形正则化(Manifold Regularization)和一类学习(One-class Learning)的思想,从而能够在处理高维数据时具有较高的分类准确率和较强的泛化能力。 自omlsa算法提出以来,已在模式识别、数据挖掘、生物信息学等多个领域得到广泛应用,为高维数据的处理提供了新的解决方案。 二、算法原理 1.核心思想 omlsa算法的核心思想是将高维空间中的数据映射到低维空间,从而降低数据的复杂度。在此基础上,通过在低维空间中构建一个最优超平面,将不同类别的数据分开。同时,为了防止过拟合现象的发生,算法中引入了流形正则化的概念,对低维空间的表示进行约束。 2.算法流程 (1)数据预处理:对于输入的数据,首先进行归一化处理,使得不同特征之间的尺度和范围相近。 (2)特征降维:通过优化目标函数,找到一个低维特征空间,使得在这个空间中,数据能够被较好地分类。 (3)构建超平面:在低维空间中,构建一个最优超平面,使得不同类别的数据在这个超平面的两侧。 (4)流形正则化:为了防止过拟合,对低维空间的表示进行约束,从而提高算法的泛化能力。 三、算法应用 1.应用领域 omlsa算法广泛应用于模式识别、数据挖掘、生物信息学等领域。在这些领域中,数据通常具有高维度的特征,给传统的分类算法带来较大的挑战。而omlsa算法通过降低数据维度,能够有效地提高分类准确率和泛化能力。 2.实际案例 以生物信息学为例,omlsa算法被成功应用于蛋白质序列比对、基因表达数据的分类等问题中。在这些实际案例中,omlsa算法展现出了较好的分类性能,为相关领域的研究提供了有力支持。 四、算法优缺点 1.优点 (1)对于高维数据的处理能力强,能够有效地提高分类准确率和泛化能力。 (2)算法具有较强的鲁棒性,对于数据中的噪声和不稳定因素具有一定的抵抗能力。 2.缺点 (1)计算复杂度较高,尤其是在处理大规模数据集时,算法的运行时间较长。 (2)对于一些特殊类型的数据,如存在较多噪声或缺失值的数据,算法的表现可能不尽如人意。 五、发展趋势 1.发展前景 随着大数据时代的到来,高维数据的处理成为了一个重要的研究方向。omlsa算法作为处理高维数据的有效方法,具有广泛的应用前景。 2.未来研究方向 (1)提高算法的计算效率,降低算法的运行时间。 (2)探索与其他算法相结合的可能性,以实现更好的分类效果。

基于蚁狮算法的元特征选择方法

第45卷 第9期2023年9月系统工程与电子技术SystemsEngineeringandElectronicsVol.45 No.9September2023文章编号:1001 506X(2023)09 2831 12 网址:www.sys ele.com收稿日期:20220506;修回日期:20220809;网络优先出版日期:20221007。

网络优先出版地址:http:∥kns.cnki.net/kcms/detail/11.2422.TN.20221007.1613.006.html基金项目:科技部科技创新2030 重大项目(2020AAA0104802);国家自然科学基金(91948303);国家自然科学青年基金(61802426)资助课题 通讯作者.引用格式:李庚松,刘艺,郑奇斌,等.基于蚁狮算法的元特征选择方法[J].系统工程与电子技术,2023,45(9):2831 2842.犚犲犳犲狉犲狀犮犲犳狅狉犿犪狋:LIGS,LIUY,ZHENGQB,etal.Meta featureselectionmethodbasedonantlionoptimizationalgorithm[J].SystemsEngineeringandElectronics,2023,45(9):2831 2842.基于蚁狮算法的元特征选择方法李庚松1,刘 艺1, ,郑奇斌2,秦 伟1,李红梅2,任小广1,宋明武3(1.国防科技创新研究院,北京100071;2.军事科学院,北京100091;3.天津(滨海)人工智能创新中心,天津300457) 摘 要:为了提升基于元学习算法选择的性能,提出一种基于蚁狮算法的元特征选择方法。

首先,通过鲁棒初始化机制构建初始种群,增强所选元特征子集的鲁棒性。

其次,在个体解的搜索过程中应用动态边界策略,增加方法的种群多样性。

然后,采用混沌映射变异策略,提升方法的寻优性能,给出方法伪代码并分析时间复杂度。

ML-常见算法简介(CommonAlgorithms)

ML-常见算法简介(CommonAlgorithms)机器学习常见算法简介 - 原⽂链接:应该使⽤哪种机器学习算法?很⼤程度上依赖于可⽤数据的性质和数量以及每⼀个特定⽤例中你的训练⽬标。

不要使⽤最复杂的算法,除⾮其结果值得付出昂贵的开销和资源。

这⾥给出了⼀些最常见的算法,按使⽤简单程度排序。

1. 决策树(DT,Decision Trees)在进⾏逐步应答过程中,典型的决策树分析会使⽤分层变量或决策节点,例如,可将⼀个给定⽤户分类成信⽤可靠或不可靠。

优点:擅长对⼈、地点、事物的⼀系列不同特征、品质、特性进⾏评估场景举例:基于规则的信⽤评估、赛马结果预测2. ⽀持向量机(SVM,Support Vector Machine)基于超平⾯(hyperplane),⽀持向量机可以对数据群进⾏分类。

优点:⽀持向量机擅长在变量 X 与其它变量之间进⾏⼆元分类操作,⽆论其关系是否是线性的场景举例:新闻分类、⼿写识别3. 回归(Regression)回归可以勾画出因变量与⼀个或多个因变量之间的状态关系。

在这个例⼦中,将垃圾邮件和⾮垃圾邮件进⾏了区分。

优点:回归可⽤于识别变量之间的连续关系,即便这个关系不是⾮常明显场景举例:路⾯交通流量分析、邮件过滤4. 朴素贝叶斯分类(Naive Bayes Classification)朴素贝叶斯分类器⽤于计算可能条件的分⽀概率。

每个独⽴的特征都是「朴素」或条件独⽴的,因此它们不会影响别的对象。

例如,在⼀个装有共 5 个黄⾊和红⾊⼩球的罐⼦⾥,连续拿到两个黄⾊⼩球的概率是多少?从图中最上⽅分⽀可见,前后抓取两个黄⾊⼩球的概率为 1/10。

朴素贝叶斯分类器可以计算多个特征的联合条件概率。

优点:对于在⼩数据集上有显著特征的相关对象,朴素贝叶斯⽅法可对其进⾏快速分类场景举例:情感分析、消费者分类5. 隐马尔可夫模型(Hidden Markov model)显马尔可夫过程是完全确定性的——⼀个给定的状态经常会伴随另⼀个状态。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

( 1 ) 对任意 t E ,都有中 , f ) ≤1 成立.
( 2 )存在常数 c > 0 ,使得对任意 一 t I l ,都有
( , f ) C q 成立
对 于任 意 v ∈V,所 谓 ML S方 法 ,是指 如 下 最 小 化 经验计 算模 型:
) = a r g mi n
V o 1 . 1 3 N o . 5
0c t . 2 01 5
基 于 ML S方法的本体算法
何 国英 , 高 炜
( 1 . 云南师范大学经济与管理学院, 昆明 6 5 0 5 0 0 ;2 . 云南师范大学信息学院, 昆明 6 5 0 5 0 0 )
摘 要 : ML S 模型作为一种逼近模型被广泛应用于数据光 滑 、数值分 析和统计等诸多领域. 文 章将 M L S模型用 于最优本 体 函数 的计算 ,将本体 图中每个顶点映射成实数后 ,通过顶点对应实数 间的差值来确定它们的相似度. 将新本体算法应用于 G O本
. 一
1 ML S方 法 介绍 首先 ,将本体 图中每个顶点的对应信息分 别用 个n 维向量来表示. 为了方便标记 ,本文 中使用

来表 示顶 点 以及 它 对应 的 向量 . 这样 ,本体 顶 点 集合 可 以假 设 成 的 紧子 集 . 设标记集合 y m . 选 取 样 本 集S = y , ), , …, m , y , . 学 习的过 程 是 通过 样本 集 . s的学 习得到本 体 得分 函数 厂 : . 函数 : X ” - - - > :称 为 权 重 函 数 如 果 满 足如 下两 个条件 :
A 1 :对本体图进行预处理. 将本体 图中每个顶点的信 息 用一个 向量 表示 . A 2 :选取样 本集 ,计 算标 记从 而得 到 S . A 3 :通过模型 ( 1 ) 得到最优本体 函数. , = A 4 :通过计算两顶点对应实数 的差值来计算本体顶
收 稿 日期 :2 0 1 4 — 0 9 — 1 5


i =1
( ( 八 ) 一 ) ) ・ ( 1 ) ( 7 " , )
这 里 ,H是 假设 空 间 ,一 般取 再 生 核希 尔 伯 特空 间. > 0 称 为 比例参 数 .
2 本体 算法描述
由以上 分 析 ,我 们得 到基 于 ML S方 法 的本 体 算 法 ,其整 体 描述如 下 : 算法 A :基于 M L S 方法的本体相似度计算算法
基金项 目:国家 自然科学青年基金 资助项 目 ( 1 1 4 0 1 5 1 9 ); 教育部科学技术研 究重点项 目 ( 2 1 0 2 1 0 ). 第一作者 :何国英 ( 1 9 8 6 一 ) ,女 ,云南 大理人 ,助教 ,硕士 ,研究方 向:思想政治和课 程教 学及 教育技术研究 。
体 和物理教育本体 ,通过实验结果表明新 算法对特定应 用领域 的相似度计算和建立本体映射是有效的. 关键词 :本体; 相似度计算; 本体映射 ; ML S方法 中图分类号 :T P 3 9 3 . 0 9 2 文献标识码 :A 文章编号 :1 0 0 8 — 9 1 2 8( 2 0 1 5 )0 5 — 0 0 1 4 — 0 3
DOI : I O . 1 3 9 6 3 / j . c n k i . h h u x b . 2 0 1 5 . 0 5 . 0 0 4
第 1 3卷 第 5期 2 0 1 5 年 1 0 月
红河学院学报
J o u na r l o f Ho
顺着大数据时代 的到来 , 日常的信息处理数据 量 日趋 庞 大 ,各 种 学 习算 法 被 广泛 应 用 于 本体 相 似 度计算 和本体映射. 设本体用其 图结 构 G =r , 表 示. 其 中一类本体学习算法是通过样本的学习得到一 个 得分函数 厂 : . 该得分 函数将本体 图中每个 顶 点 映射 成 实数 ,而概 念 对 应 顶 点之 间 的相 似度 则 通 过计 算顶 点 对应 实 数 间 的差值 的大小 来判 定 . 此 类 技 术 的优 点在 于 :直 观性 强 ,适合 大 数 据 本 体相 似 度计算和大数据本体之间的本体映射 的创建. [ 1 ]通过 排序 学 习方法 得 到本 体顶 点集 上 的得 分 函数 厂 ,并将 此方 法应 用 于在不 同本 体 之 间建立 本 体 映射 ; [ 2 ]从 本 体 图边 权 重 的计 算人 手 ,通 过 图 学 习方法得到实值得分函数 ,进而得到对应 的本体算 法; [ 3 ]和 [ 4 】则 是 利用 正 则 化模 型 得 到最 优 本 体 函数 f ,并分 别得 到对 应 的本 体相 似度 计算 和本 体 映 射算法 ; [ 5 ] 提出 一 部排序半监督学习算法 ,将 部排序和半监督算法相融合 ,并应用于本体相似 度 计算 . 文献 [ 6 — 7 】对这 些本 体 算法 的收敛 性 进行 了 理 论上 的分 析. 本 文尝 试 将 其 他 的学 习算 法 应用 于本 体 相 似 度 计 算 和本体 映射 . 将 ML S ( Mo v i n g l e a s t — s q u a r e 1方 法 应用于得分 函数 厂 的计算 ,并 由此得到新 的本体算 法. 组 织结 构如下 :首先介 绍 ML S方 法 的基本 思想 和 对 应计 算 模 型 ;其次 对 基 于 ML S方 法 的新 本 体相 似 度计算和本体映射算法进行描述 ;最后将此算法应 用于生物学 “ G O ”本体和物理教育学本体 ,通过实 验 数据 的对 比分 析来 说 明 ML S方法 对 于特 定 领域 本 体 相似 度计算 和本 体 映射 的构 建 是有效 的.
相关文档
最新文档