图匹配问题的应用和研究 - 首页-中国计算机学会信息网

合集下载

大规模图像匹配算法研究及其应用

大规模图像匹配算法研究及其应用

大规模图像匹配算法研究及其应用随着人工智能领域的发展和深度学习技术的不断完善,大规模图像匹配算法成为了近年来备受研究者关注的焦点之一。

本文将从算法原理、应用场景和未来发展趋势等方面探讨大规模图像匹配算法的研究现状和应用前景。

一、算法原理大规模图像匹配算法是一种通过计算机视觉技术对大规模图像集进行匹配的算法。

其基本原理是在高维空间中建立各个图像的特征描述子,并在其间寻找相似度较高的图像。

常用的特征描述子包括SIFT、SURF、ORB等。

其中SIFT是一种早期发展的特征描述算法,能够有效地保持尺度不变性,对旋转、平移、缩放等有很好的鲁棒性。

SURF则是在SIFT的基础上进一步发展的算法,相对而言更快一些。

而ORB则是一种结合了SIFT和FAST等算法优点的特征描述算法,同时具备了高速度和鲁棒性。

针对大规模图像匹配问题,近年来出现了许多优秀的算法。

例如,近似最近邻搜索算法(ANNS)、基于树结构的K-Means算法、基于深度学习的学习型哈希算法等。

其中,ANNS算法是一种高效的近似搜索算法,能够有效地加快匹配速度,而K-Means算法则是将图像集合中的特征向量集合进行聚类,以便更好地组织和利用这些特征向量。

而基于深度学习的学习型哈希算法更是充分利用了深度学习技术的优势,通过将高维向量映射到低维向量空间中,以加快匹配速度。

二、应用场景大规模图像匹配算法的应用场景非常广泛,例如:1. 无人机及行星探测领域:无人机、卫星等搭载着高分辨率相机,能够在不同高度、角度、时间拍摄到大量影像数据,利用大规模图像匹配技术,可以生成高质量的地形图和三维重建,以便用于地理探索、军事情报等领域。

2. 图像搜索引擎:运用大规模图像匹配算法可以实现更快速、准确、丰富的图像搜索,用户可以通过上传自己的图片查找相关的图片信息。

3. 物体识别与跟踪:在现实生活中,有许多需要在不同角度,遮挡情况,背景噪声下进行物体识别和跟踪,如自动驾驶汽车、智能家居等等。

图像匹配算法的研究进展

图像匹配算法的研究进展

图像匹配算法的研究进展一、本文概述随着信息技术的飞速发展,图像匹配算法在诸多领域,如人脸识别、物体追踪、自动驾驶、医学影像分析以及遥感图像处理等,都发挥着越来越重要的作用。

图像匹配算法的核心在于通过一定的算法和策略,从大量图像中快速准确地找到目标图像,或者从同一场景的不同图像中找出相似或相同的部分。

本文旨在探讨图像匹配算法的研究进展,包括经典的算法、新兴的算法以及它们在不同领域的应用。

我们将回顾传统的图像匹配算法,如基于特征的方法、基于灰度的方法等,分析它们的优缺点以及适用场景。

然后,我们将重点介绍近年来兴起的深度学习在图像匹配领域的应用,包括卷积神经网络(CNN)、孪生网络(Siamese Network)等,以及它们在提高匹配精度和效率方面的突出表现。

我们还将讨论图像匹配算法在实际应用中面临的挑战,如光照变化、视角变化、遮挡等问题,以及针对这些问题的解决方案。

我们将展望图像匹配算法的未来发展趋势,包括算法性能的进一步提升、多模态图像匹配的研究、以及在大规模图像数据库中的应用等。

通过本文的综述,我们希望能够为读者提供一个全面而深入的图像匹配算法研究进展的概览,同时也为相关领域的研究人员提供有益的参考和启示。

二、图像匹配算法的基本原理图像匹配算法是计算机视觉领域的一个核心问题,它旨在从大量图像中找出具有相似性或相关性的图像。

这些算法的基本原理主要基于特征提取和相似性度量两个方面。

特征提取是图像匹配算法的首要步骤。

在这一过程中,算法会从图像中提取出关键信息,这些信息通常是对图像内容的抽象描述,如边缘、角点、纹理、颜色分布等。

这些特征的选择对后续的匹配效果至关重要,因为它们需要既能代表图像的主要内容,又具有一定的鲁棒性,能够在不同的光照、视角、尺度等条件下保持一致。

相似性度量是图像匹配算法的另一关键步骤。

在提取了特征之后,算法需要一种方法来量化两个图像之间的相似性。

常见的相似性度量方法包括欧氏距离、余弦相似度、汉明距离等。

基于特征点的图像匹配技术研究及应用

基于特征点的图像匹配技术研究及应用

基于特征点的图像匹配技术研究及应用文献综述1.图像匹配的概念图像匹配[1]是指通过一定的匹配算法在两幅或多幅图像之间识别同名点,如二维图像匹配中通过比较目标区和搜索区中相同大小的窗口的相关系数,取搜索区中相关系数最大所对应的窗口中心点作为同名点。

其实质是在基元相似性的条件下,运用匹配准则的最佳搜索问题。

图像匹配中事先获得的图像称为基准图像(base image),在匹配过程中在线或者实时获得的图像称为实时图像(real time image)。

基准图像可以比实时图像大也可以比实时图像小。

当基准图像比实时图像大时,匹配过程就是在基准图像中搜寻实时图像位置的过程;当实时图像比基准图像大时,匹配过程就是在实时图像中寻找作为目标的基准图像的过程。

在地图导航系统[2]中,基准图像比实时图像大。

如图1.1所示。

M2图1.1 地图导航系统中的图像匹配示意图基准图像和实时图像是对同一对象有差别的近似描述,设和分别为基准图像和实时图像的灰度分布,在不考虑关照变换等影响下,两者存在如下关系:鍏紡其中是高斯白噪声,可以通过一定的滤波方法滤除。

是上的点在X和Y方向上的位置偏差,称为定位噪声。

位置偏差往往是因为图像的几何形变造成的。

实际上利用计算机进行处理的并不是连续图像,图像的位置和灰度都被划分为离散的值,常用像素矩阵来表示一副图像。

在地图匹配导航中,通常基准图像比实时图像大。

直接进行相关匹配的两幅图像应该是大小一样的,为了确定实时图像在基准图像中的位置,就必须在基准图像中提出与实时图像大小相等的基准子图,并逐个与实时图像进行比较,以便找出与实时图像匹配的那个基本子图,从而确定实时图像在基准图像中的位置。

所以一般图像匹配的过程就是不断从基准图像中提取基准子图与实时图像进行相关运算的过程,这个过程可以是线性遍历式的,也可以是非线性随机的搜索过程。

在本课题中,我们选取左上角为原点作为坐标基准。

如图1.1所示,大方框为基准图像,小方框代表实时图像,虚线方框内事待选的实验匹配位置区域,也就是进行匹配的搜索区域。

计算机视觉中的图匹配方法研究

计算机视觉中的图匹配方法研究

计算机视觉中的图匹配方法研究计算机视觉是一门研究如何使计算机“看懂”图像、视频等视觉信息,并进行分析、识别和理解的学科。

在计算机视觉中,图像匹配是一个重要的研究领域,它涉及到识别两幅或多幅图像之间的相似性和关联性,是图像处理和模式识别的核心技术之一。

而图像匹配的方法则是实现图像匹配的关键。

本文将就计算机视觉中的图像匹配方法进行深入研究。

一、基于特征点的图像匹配方法基于特征点的图像匹配方法是目前应用最为广泛的图像匹配方法之一,它通过检测图像中的特征点,并对这些特征点进行描述和匹配,来实现图像的匹配识别。

特征点是图像中具有显著性和区分性的点,比如角点、边缘点等。

常用的特征点检测算法有Harris角点检测、SIFT(尺度不变特征变换)、SURF(加速稳健特征)等。

1.1 SIFT算法SIFT算法是一种基于局部特征的图像匹配算法,它首先通过高斯差分金字塔寻找极值点,然后利用尺度空间极值点提取局部不变特征描述符,再通过特征描述符进行特征点的匹配。

SIFT算法在实际应用中具有很好的鲁棒性和区分性能,因此被广泛应用于目标识别、图像拼接等领域。

SURF算法是一种加速稳健特征的图像匹配算法,它基于积分图像和快速Hessian矩阵的计算来加速特征点的检测和匹配过程。

SURF算法在处理大规模图像数据库时具有较高的匹配速度和精度,因此被广泛应用于图像检索、视频跟踪等领域。

除了基于局部特征点的图像匹配方法外,基于全局描述子的图像匹配方法也是一种重要的图像匹配技术。

全局描述子是对整个图像进行描述和表示的特征,它主要包括颜色直方图、纹理特征、形状特征等。

常用的全局描述子包括Bag of Visual Words(BoVW)、图像的直方图特征等。

2.1 Bag of Visual Words(BoVW)BoVW是一种基于词袋模型的图像匹配方法,它首先通过聚类算法将图像特征点聚类成视觉词典,然后根据视觉词典对图像进行编码描述,最后通过词袋模型进行图像的匹配识别。

多尺度图像匹配算法的研究与应用

多尺度图像匹配算法的研究与应用

多尺度图像匹配算法的研究与应用随着数字化时代的到来,图像技术的应用越来越广泛,比如:安防、医疗、车载导航、虚拟现实等等。

而图像匹配作为图像技术中最重要的核心内容之一,也成为许多应用的关键技术。

因此,多尺度图像匹配算法是目前图像技术研究的热点之一,也是当前图像技术应用中不可或缺的基础技术之一。

在传统的图像匹配算法中,主要采用基于全局特征描述符的方法,但是对于多尺度的图像数据,这种方法难以满足实际需求。

因为过多的全局信息会导致算法计算复杂度大增,降低算法实施效率。

而且,全局特征的描述对于图像的细节信息捕获较少,无法适应多尺度变化造成的图像配准误差。

因此,针对多尺度图像匹配,需要采用基于局部特征描述符的算法。

具体地,需要在图像局部区域内提取特征,根据这些局部特征构建图像特征向量,然后再将不同尺度的特征向量进行匹配。

因此,多尺度图像匹配算法主要包含三个步骤:局部特征提取、特征匹配和变换估计。

在局部特征提取方面,现在的局部特征描述算法已经非常成熟,比如:SIFT (Scale-Invariant Feature Transform)、SURF(Speeded Up Robust Features)和ORB(Oriented FAST and Rotated BRIEF)等。

其中,SIFT算法是最早提出的一种基于局部特征的算法,具有尺度不变性和旋转不变性等特点。

而SURF算法则主要针对SIFT算法中计算量过大和效率低下的问题进行的优化,并且实现方式上比SIFT更加简单。

而ORB算法则是近几年发展的一种基于FAST角点检测和BRIEF特征描述的新型算法,具有高速度和高效率的特点,对于实时性要求较高的应用场景非常适用。

在特征匹配方面,主要考虑特征向量间的相似性度量,以及匹配算法的效率。

对于相似性度量,一般采用欧式距离、汉明距离等方式进行计算。

其中,欧式距离是比较常见的特征匹配方式,但是对于某些应用场景,误匹配率较高,效果不太理想;汉明距离则不具备欧式距离的连续性质,但是其可以得到更多的匹配特征。

图匹配算法在计算机视觉中的应用

图匹配算法在计算机视觉中的应用

图匹配算法在计算机视觉中的应用计算机视觉是现代科技的重要领域,它涉及到图像处理、计算机图形学等多个方面。

其中,图像处理是计算机视觉的基础,而图匹配算法是图像处理中最关键的环节之一。

本文将重点介绍图匹配算法在计算机视觉中的应用及其研究进展。

一、图匹配算法的定义及分类图匹配算法是指在两个或多个图像中找出相互对应的关键点,以实现图像的对齐、配准、匹配等操作的过程。

它是计算机视觉中最常用的算法之一,主要包括基于特征点的图像匹配算法、基于边界的图像匹配算法、基于区域的图像匹配算法等几种。

基于特征点的图像匹配算法主要是通过提取图像中的特定特征点,并在图像中寻找相应的特征点实现图像配准。

其中最常用的特征点方法有SIFT、SURF、ORB等等。

基于边界的图像匹配算法是通过比对图像中的边界信息来实现图像对齐、配准、匹配等操作。

这种算法的流程包括边缘检测、特征提取、特征匹配等步骤。

基于区域的图像匹配算法主要利用图像的颜色、纹理、形状等信息来对图像进行匹配,常见的区域匹配算法有基于颜色直方图的匹配算法、基于纹理相似性度量的匹配算法、基于形状特征的匹配算法等。

二、图匹配算法在计算机视觉中的应用2.1 图像配准图像配准的作用是通过调整图像的位置、大小、旋转等变换实现图像的对齐。

这种技术在医学成像、动漫制作、地图拼接、地震勘探等领域都有广泛的应用。

其中基于特征点的图像配准算法是最常用的方法之一,其可以实现对不同角度、比例、光照条件下的图像进行对齐,具有很高的鲁棒性。

2.2 三维重建三维重建是通过将多个二维图像进行对齐、匹配等操作,获得三维空间中的物体形状、位置等信息的过程。

这种技术在生物学、地质学、城市规划等领域都有非常广泛的应用。

其中三维重建的基本流程包括图像采集、相机标定、立体匹配、三维重建等步骤。

2.3 目标跟踪目标跟踪是指在连续的图像序列中,对某一目标的位置、大小等进行跟踪的过程。

这种技术在视频监控、自动驾驶等领域都有广泛的应用。

基于深度学习的图像匹配算法研究及应用

基于深度学习的图像匹配算法研究及应用

基于深度学习的图像匹配算法研究及应用深度学习是近年来人工智能领域中非常热门的技术,它的应用范围极广,其中就包括图像匹配。

图像匹配是指在两张或多张图像中寻找相似的部分,通常有两种场景,一种是在同一张图像中找出不同角度或不同光照下的同一物体,另一种是在多张图像中找出相同的物体,这就需要使用基于深度学习的图像匹配算法。

一、深度学习在图像匹配中的优势深度学习的一个显著优势是它能够自动学习特征。

传统的图像匹配算法通常需要手动提取特征,而且对于不同样本需要使用不同的特征提取方法,这不仅耗时,而且很难保证准确性。

但是基于深度学习的图像匹配算法能够通过卷积神经网络(CNN)等自动学习适合当前任务的特征,因此不需要手动提取特征,而且能够适应不同场景,达到更高的准确率。

二、基于深度学习的图像匹配算法基于深度学习的图像匹配算法可以分为两类,一类是两阶段匹配算法,一类是端到端匹配算法。

1. 两阶段匹配算法两阶段匹配算法主要包括特征提取和特征匹配两个步骤。

特征提取使用卷积神经网络(CNN)来学习图像的特征表示,通常使用基于分类模型的预训练模型,如VGG、AlexNet等,也可以使用自己构建的网络模型。

特征匹配则使用传统的特征匹配算法,如基于SIFT、SURF算法的特征点匹配,或者基于RANSAC算法的基础矩阵估计。

2. 端到端匹配算法端到端匹配算法能够直接从图像中学习匹配关系,相比于两阶段匹配算法,它能够减少中间环节的干扰,提高匹配的精度。

目前比较流行的端到端匹配算法有大规模深度回归(DeepMatching)、卷积神经网络匹配(MatchNet)、图像检索极化子网络(PN-Net)等。

三、基于深度学习的图像匹配算法在实际应用中的应用基于深度学习的图像匹配算法可以应用于很多领域,例如机器人视觉、自动驾驶、智能安防等。

下面以机器人视觉为例,说明基于深度学习的图像匹配算法的应用。

1. 机器人视觉中的图像匹配机器人在进行任务时需要感知周围环境,并定位自身位置,但由于环境中物体的不断变化,传统的基于特征点的图像匹配算法容易出错。

基于深度学习的图像匹配技术研究及应用

基于深度学习的图像匹配技术研究及应用

基于深度学习的图像匹配技术研究及应用随着科技的发展和人们对于图像信息的需求日益增长,图像匹配技术显得尤为重要。

在传统的图像匹配技术中,基于特征点的方法在实时性和精度上有一定的瓶颈。

而深度学习技术的发展为图像匹配技术的提高和应用带来了新的机遇。

一、深度学习技术与图像匹配技术深度学习技术以其卓越的特征表达能力和优秀的图像分类能力成为近年来科学领域的密切关注点。

在图像匹配领域,深度学习技术的优势也是明显的。

它可以通过大量的训练数据学习出一些具有代表性的特征,进而实现图像的匹配。

相较于传统的方法,深度学习不需要手工计算特征点,可以对图像进行端到端的训练,从而优化整个特征提取和匹配阶段。

这种方式更加自然,并可以避免出现“失配”问题,提高了匹配的稳定性和准确率。

二、基于深度学习的图像匹配技术的研究现状在当前研究中,基于深度学习的图像匹配技术主要分为两个方向:基于传统特征提取方法和基于端到端匹配方法。

在前者中,研究人员将特征提取阶段和深度网络的训练阶段分离开来,通过控制网络的特征提取过程来提高特征的可靠性和鲁棒性。

而在后者中,则是将整个特征提取过程和匹配过程融合在一起,直接从输入图像到输出结果进行训练,从而提高整个匹配过程的效率和准确性。

三、基于深度学习的图像匹配技术的应用基于深度学习的图像匹配技术具有广泛的应用前景。

首先,它可以应用于无人驾驶领域中,实现车辆和交通场景的感知和识别。

其次,它可以应用于视觉导航,在机器人导航、无人机导航、AR技术等领域有着广泛的应用。

此外,它还可以应用于智能安防,通过对周围环境的监控和识别,实现对于异常事件的及时处理。

四、深度学习技术在当前图像匹配领域还存在的问题和未来发展方向尽管深度学习已经在图像匹配领域中取得了很大的进步,但是仍存在着一些问题。

例如,数据集的选择、网络结构的优化和特征提取的可解释性等问题,需要我们进一步深入研究。

未来的发展方向也非常值得期待,例如利用更小的网络结构实现更高的性能、实现跨模态图像匹配等。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

祝园园 秦 璐 于 旭香港中文大学图匹配问题的应用和研究图结构被广泛应用于多种领域,以描述事物之间的复杂关系,如万维网、社交网络、蛋白质交互网络、化学分子结构、电力网、公路网、图像处理中的属性图和生态系统中的食物链等。

随着这些领域的发展和数据的增加,图的大小和数量也在不断增长。

例如,典型蛋白质交互网络已有上万个节点,随着研究对象从低等生物(如细菌)向高等生物(如人类)的转移,节点将会急剧增长,预计可达到30万个。

在PubChem 数据库中,已有超过3000万个化学分子结构,并且仍在不断增加。

如何在大量积累的图上进行高效的图匹配(graph matching )操作,已成为学术界和工业界关注的新的研究内容。

图匹配的总体目标是确定两个图的顶点对应关系,使其满足某些限制条件或者目标函数,尽可能地保留两个图的共同部分。

应用领域在许多应用领域,图匹配都是一个必要的基本操作手段,起着至关重要的作用。

相关领域包括:生物学 在大多数生物进程中,蛋白质交互(protein-protein interaction ,PPI )网络起着非常重要的作用。

其中,图的每个顶点对应一个蛋白质,每条边表示两个蛋白质间的相互作用关系。

如果对来自不同物种的蛋白质交互网络关键词:近似图匹配 子图同构 最大公共子图进行比较分析,我们可识别出它们的共存功能成分(conserved functional component ),并能够在体系层次上深刻阐述物种间的相似及差别。

图匹配可以被有效地应用于蛋白质交互网络的分析比较,以最大限度地识别出不同物种间的同源蛋白质对(pairs of homologous proteins ),且保留蛋白质间的相互作用关系[1~3]。

生物化学 一个物种的基因组(genome )可以表示为图结构。

基因之间的序列关系由基因上的核苷酸(nucleotide )在一条链上的起始位置和互补链上的终止位置决定。

基因序列中的每个基因均可以表示为顶点,染色体(chromosome )上相邻的两个基因相连成一条边。

因此一个双链环状(double-stranded circular )DNA 基因组可以表示为一个带环图。

类似地,代谢途径(metabolic pathway )也可以用图结构表示。

图的顶点表示酶(enzymes),图1 蛋白质交互网络若两个酶能催化逐次反应步骤(successive reaction steps),就在二者之间建立一条边。

每条边表示一个特定的化学物质(specific chemical compound),它既是上一个反应步骤的产物(product),也是下一个反应步骤的底物(substrate)。

对这两种具有不同结构和含义的图进行匹配,将有助于我们识别功能相关的酶簇(functionally related enzyme clus-ters,FRECs)[4]。

医学 在医学领域,脑电图(electroencepha-logram,EEG)信号记录了神经元(neuron)的活动过程,用来描述快速的大脑活动(brain activ-ity),也可以转化为图结构。

我们从脑电波的时频图(time-frequency map)中提取能量脉冲(energy burst),将其表示为图的顶点。

若某个脉冲与前一个或下一个脉冲的时间间隔在一定范围内,就用边将它们连接起来。

对这样的两个图进行匹配,可以比较脑电图信号在延迟性(latency)、频率(fre-quency)、能量(energy)以及活跃区域(activated areas)等方面的差异,进而比较两个大脑皮层的活动(cortical activity)[5]。

图像和视频 在图像和视频处理领域,每个图像或者视频中的每个帧(frame)都可以用图结构表示。

在图像中,用户感兴趣的对象可以用边界框(bounding box)表示。

对象之间有多种空间关系(spatial relation),如重叠(overlap)、包含(contain)和相接(meet)等。

在二维空间上,这种空间关系高达169种。

对于每个图像,我们可以构建一个区域邻接图(region adjacency graph,RAG),图中每个点表示一个对象,边表示对象间的空间关系。

对两个区域邻接图进行匹配,可以帮助我们提取多个图片或一系列视频镜头集合中的相似对象[6,7]。

模式匹配 在数据集成(data integration)和服务互操作性(service interoperability)研究中,模式匹配(schema matching)起着非常重要的作用。

它主要用来识别元数据(metadata)或模型的对应关系。

例如,国内外很多大型的比较购物网站(comparison shopping website),如雅虎、Shop-ping、BizRate、一淘网和比购网等,可以从多个独立的在线商店(online store)中整合商品信息,为用户提供价格比较和评价分析功能。

每一个独立在线商店的商品目录以及层次关系都可以用图结构表示,图匹配算法可以用来解决对不同在线商店进行信息整合时出现的模式匹配问题[8]。

研究进展在图匹配问题中,我们希望能找到两个图的顶点的对应关系,且尽可能保留顶点之间边的对应关系。

换言之,如果一个图中的两个顶点之间存在一条边,那么在与之匹配的另外一个图上的对应顶点之间也应存在一条边。

根据约束条件的不同,接下来介绍几种问题定义及相关研究工作。

(子)图同构算法图匹配问题中最严格的定义是图同构(graph isomorphism),即两个图的顶点存在一个双射关系,使得图中的两个顶点相连的充分必要条件是它们在另一个图上的映射顶点相连。

另一约束条件较弱的定义是子图同构(subgraph isomorphism),即两个图的顶点存在一个单射关系,若子图中两个顶点相连,它们在另一个图上的映射顶点也一定相连。

子图同构问题被证明是NP完全问题[9]。

经典的子图同构算法通常采用带有回溯的树搜索技术,如Ullmann算法[10]。

VF算法[11]及后来的VF2算法[12]都采用了树搜索技术,并采用了一个能够快速计算的启发式规则进行剪枝,在性能上比Ullmann算法有了显著提升。

此外,还有未采用树搜索技术的算法,比如用以解决图同构问题的Nauty算法[13],现被大多数学者认为是迄今最快的图同构判定算法。

最大公共子图算法对于既不满足图同构也不满足子图同构的两个图,研究者致力于寻找他们的最大公共子图(maximum common subgraph,MCS)。

现有的大部分研究工作致力于求解基于点的最大公共诱导子图(maximum common node induced subgraph)。

早期,麦格雷戈盖尔(Mcgregor)提出的树搜索算法[14]采用了与子图同构算法[10]类似的回溯技术。

之后,文献[15]给出了一个改进的带有回溯的树搜索算法,它采用了更好更高效的搜索策略。

最近,文献[16]采用带有回溯的树搜索和顶点覆盖(vertex cover)相结合的技术,能够更快地求解基于点的最大公共诱导子图问题。

还有研究者通过求解最大团问题来计算基于点的最大公共诱导子图[17~19]。

他们首先构造两个图的关联图(association graph),然后找到最大团,此问题等价于求解两个图的最大公共子图问题。

这类算法的时间复杂度并不比带有回溯的树搜索算法低。

近似算法对于给定的两个图,无论是判断它们是否(子)图同构还是求解它们的最大公共子图,其时间复杂度均随顶点数的增加而呈指数级增长。

例如,在一台普通计算机上,求解顶点数约为30的两个图的最大公共子图,需要花费超过100000秒的时间。

因此,这类算法通常只能处理规模很小的图。

而在实际应用领域中,图的规模可能会非常大。

例如,现在的蛋白质网络已经包含几千甚至上万个顶点,在有限时间内难以求解其最大公共子图。

即使对于规模较小的图,也很难在实际应用中满足用户的查询需求。

例如在很多应用中,最大公共子图常用来描述两个图的相似程度。

如果用户需要在Pub-chem数据库中搜寻与某个化学分子结构(查询图)相似的化学物质,就需要计算查询图与数据库中每个图(超过3千万)的最大公共子图来衡量其相似度,并返回与查询图最相似的化学物质。

为此,很多研究者致力于设计近似图匹配算法。

它不要求匹配为基于点的公共诱导子图,而是允许边的缺失,即近似求解基于边的最大公共子图(maximum edge induced subgraph)。

根据技术种类的不同,近似图匹配算法分为如下三类:传播算法(p r o p a g a t i o n) 其直观思想是:如果两个图中两点的邻居节点十分相似,那么这两个点也可能会非常相似。

早期的经典算法有相似度泛洪(similarity flooding,SF)算法[8]。

首先,相似度泛洪算法构建了两个图的相似度传播图(propagation graph)。

传播图的每个顶点表示一个点对(u,v),u和v点分别来自图A和图B。

如果(u,l,v)∈A,且(u′,l,v′)∈B,那么((u,u′),l,(v,v′))也存在于传播图中。

在传播图中,每个顶点传播出去的相似度将由其邻居节点平分。

对于传播图中的所有点对,相似度泛洪算法通过比较字符串信息来计算初始相似度;然后,在传播图上进行迭代的定点计算(fix-point computation),不断地把点对的相似度传递到其邻居节点;最后,从计算结果中筛选出满足用户要求的点对。

基于HITS算法中的hub(中枢性1)和authority(权威性)思想[20],布隆德尔(Blondel)等人[21]提出了一个计算两个图中所有点对的相似度算法。

它同样采用迭代的方法,不断利用两个图的邻接矩阵来更新相似度矩阵。

根据相似度矩阵初始值设置的不同,在奇数或偶数次迭代中收敛到不同的极限值。

IsoRank2方法[1]也采用了类似的相似度传播思想来计算两个图中顶点对的相似度。

它利用顶点度表示传播过程中的权重,并将其他的相似度信息加入迭代过程。

谱算法(spectra) 该算法侧重于研究图的邻接矩阵的特征值和特征向量,以表示和区分图的结构特征。

它主要基于图的如下特性:如果两个图是同构的,那么它们的邻接矩阵有相同的特征值和特征向量。

换言之,对于同构的两个图,存在一个置换矩阵P,使得PAP T=B(A和B分别表示两个图的邻接矩阵)。

由于特征值的计算可以在多项式时间内完成,它被很多研究者应用到图匹配算法中[22~28]。

这类算法最早由梅山申二(S.Umeyama)1指网页与权威网页链接的数量。

2一种蛋白质交互网络全局排列算法,由麻省理工学院和东芝研究院(芝加哥)的研究人员开发。

相关文档
最新文档