图近似查询算法研究

合集下载

快速近似最近邻算法

快速近似最近邻算法

快速近似最近邻算法快速近似最近邻算法(Approximate Nearest Neighbor, ANN)是一种用于解决最近邻搜索问题的算法。

最近邻搜索是指在给定数据集中查找与查询点最接近的数据点的问题。

在现实生活中,最近邻搜索问题经常出现。

例如,在推荐系统中,我们希望根据用户的历史行为找到与其兴趣最相似的其他用户或物品;在图像识别中,我们希望根据图像的特征找到与之最相似的其他图像。

解决这些问题的关键是能够高效地找到最近邻。

传统的最近邻搜索算法,如线性搜索和KD树,虽然能够得到精确的最近邻,但在大规模数据集上的效率较低。

因此,快速近似最近邻算法应运而生。

快速近似最近邻算法的核心思想是通过牺牲一定的准确性来换取更快的搜索速度。

它通过在数据集中构建一种数据结构,如哈希表或树状结构,来加速最近邻搜索过程。

这种数据结构可以将相似的数据点聚集在一起,从而减少搜索的范围。

常用的快速近似最近邻算法包括局部敏感哈希(Locality Sensitive Hashing, LSH)、球树(Ball Tree)和随机投影树(Random Projection Tree)等。

局部敏感哈希是一种通过哈希函数将相似的数据点映射到相同的桶中的方法。

通过调整哈希函数的参数,可以控制桶的大小和相似度的阈值,从而平衡搜索的准确性和效率。

球树是一种基于树状结构的快速近似最近邻算法。

它通过将数据点逐层划分为球形区域,并构建一棵树来表示这些区域。

在搜索过程中,球树可以根据查询点的位置快速确定搜索路径,从而减少搜索的范围。

随机投影树是一种基于随机投影的快速近似最近邻算法。

它通过随机选择一组投影向量,将数据点映射到低维空间中,并构建一棵树来表示这些映射后的数据点。

在搜索过程中,随机投影树可以根据查询点的投影值快速确定搜索路径,从而加速搜索过程。

快速近似最近邻算法在实际应用中具有广泛的应用价值。

它不仅可以提高最近邻搜索的效率,还可以通过调整参数来灵活地控制搜索的准确性和效率。

图数据库的特点与图算法的应用探讨

图数据库的特点与图算法的应用探讨

图数据库的特点与图算法的应用探讨图数据库是一种基于图结构的数据库,与传统的关系型数据库不同,它主要用于存储和处理图形数据。

图数据库具有许多独特而强大的特点,使其在许多领域都有广泛的应用。

本文将探讨图数据库的特点以及图算法在实际应用中的价值。

一、图数据库的特点1. 图结构:图数据库采用图结构来表示数据,由节点(Vertices)和边(Edges)组成。

节点表示实体或对象,边表示节点之间的关系。

这种数据模型更接近于现实世界中的关系和连接,能够更准确地描述实际的数据关系。

2. 大规模数据处理:图数据库适用于处理大规模的数据和复杂的关系。

其基于分布式计算架构,可以快速地处理图形数据并支持并行处理。

相比传统的关系型数据库,图数据库在处理大规模数据上具有明显的优势。

3. 强大的查询能力:图数据库提供了灵活而强大的查询能力。

通过使用图查询语言(如Cypher、Gremlin等),可以方便地执行各种复杂的查询操作,包括查找节点、遍历路径、计算节点之间的关联等。

这些查询能力使得图数据库在挖掘和分析数据中起到重要的作用。

4. 实时更新:图数据库可以实时地更新和处理数据。

在传统的关系型数据库中,由于存在复杂的表和约束,数据的更新和处理需要进行大量的转换和计算。

而在图数据库中,数据的更新和处理可以以图的形式直接进行,减少了数据转换的开销,提高了处理的效率。

5. 深入挖掘关系:图数据库具有非常强大的分析和挖掘关系的能力。

通过图算法,可以深入挖掘节点和边之间的关系,并发现隐藏在数据背后的有价值的信息。

这使得图数据库在社交网络分析、推荐系统、风险评估等领域具有重要的应用价值。

二、图算法的应用探讨1. 社交网络分析:社交网络是图结构的典型应用场景,图算法在社交网络分析中具有广泛的应用。

通过分析社交网络中的节点和边,可以揭示社交网络中的社群、影响力传播、节点关联等信息。

例如,利用PageRank算法可以从社交网络中识别出重要的节点和关键路径,实现精准的网络影响力定位。

ann检索原理

ann检索原理

ann检索原理ANN检索原理什么是ANN检索ANN(Approximate Nearest Neighbor)是指近似最近邻检索,它是一种用于在大规模数据集中快速查找最相似数据点的算法。

ANN检索在计算机视觉、自然语言处理、推荐系统等领域有着广泛的应用。

ANN检索的背景在大规模数据集中搜索最相似的数据点是一个常见的问题。

例如,在图像检索中,用于搜索与输入图像最相似的图像;在推荐系统中,用于搜索与用户喜好最相似的商品。

传统的最近邻搜索算法(如线性搜索、KD树)在大规模数据集中效率低下,因为它们需要计算所有数据点之间的距离。

而ANN检索算法通过近似计算距离,以牺牲一定的准确性为代价,提供了更高的搜索速度。

ANN检索的工作原理ANN检索的工作原理可以简要概括为以下几个步骤:1.数据预处理:将数据集中的数据点转化为ANN算法所需的特定格式,如特征向量或哈希码。

2.建立索引:将数据集中的数据点组织成索引结构,以便快速检索。

常用的索引结构包括KD树、球树、哈希表等。

3.查询处理:对于输入的查询点,通过索引结构进行相似度计算和候选集筛选。

根据相似度计算的近似性质,ANN算法会根据一定的条件提前终止计算过程。

4.结果返回:根据相似度计算结果,返回与查询点最相似的数据点。

ANN检索算法的优缺点ANN检索算法有以下的优点和缺点:优点: - 搜索速度快:相较于传统的最近邻搜索算法,ANN检索算法能够在大规模数据集中提供更高的搜索速度。

- 可扩展性好:ANN算法可以轻松处理包含数百万或上亿个数据点的大规模数据集。

缺点: - 近似性:为了提高搜索速度,ANN算法所返回的结果是近似的最近邻,而不是精确的最近邻。

- 必须预处理:ANN算法需要将数据点进行特定格式的预处理,这会增加一定的计算和存储开销。

ANN检索应用案例ANN检索算法在许多领域都有广泛的应用。

以下是一些典型的应用案例:•图像检索:通过ANN算法可以快速搜索与输入图像最相似的图像,实现精确或近似的图像检索。

图近似查询算法研究

图近似查询算法研究
2 0 1 3 年 5 月
计 算 机 工程 与设 计
COM PUTER ENGI NEERI NG AND DES I GN
Ma y .2 01 3
第3 4 卷
第 5 期
Vo L 3 4 NO . 5
图近 似 查 询 算 法 研 究
谭 伟, 杨 书新
( 江 西理 工大 学 信 息 工程 学院 ,江 西 赣 州 3 4 1 0 0 0 )
Th e a l g o r i t h m b a s e d o n t h e i r s t y l e s i s c l a s s i f i e d a n d s o me c l a s s i c a l g o r i t h ms f r o m i n d e x u n i t a n d s c h e me i n t h i s a r e a a r e p r e s e n — t e d .S o me t y p i c a l a l g o r i t h ms a r e i n v e s t i g a t e d .Ea c h a l g o r i t h m’ S c h a r a c t e r i s t i c a n d s e a r c h e f f i e e n e y a r e c o mp a r e d a n d r e f i n e d t o c l a r i f y t h e i r a d v a n t a g e s a n d d i s a d v a n t a g e s . Th e c o mp a r i s o n i s g i v e n b a s e d o n t h e p r o p e r t i e s o f t h e a l g o r i t h ms a n d a p p l i c a t i o n s . Th e n t h e d i s a d v a n t a g e s a n d f u t u r e r e s e a r c h d i r e c t i o n s a r e d i s c u s s e d . Ke y wo r d s :s i mi l a r i t y s e a r c h;s u b g r a p h s i mi l a r i t y s e a r c h; s u p e r g r a p h s i mi l a r i t y s e a r c h; g r a p h i s o mo r p h i s m;g r a p h s i mi l a r i t y

一种有效的图索引查询算法

一种有效的图索引查询算法

一种有效的图索引查询算法随着图数据库的发展和广泛应用,图索引查询算法成为了研究的热点之一。

目前,常见的图索引查询算法有两种:基于高效的结点标签或属性的算法,以及基于图结构的算法。

在这些算法中,基于高效的结点标签或属性的算法在实际应用中表现良好,本文重点介绍这种类型的算法中一种有效的图索引查询算法。

该算法被称为“LSH Forest”,它是基于局部敏感哈希(Locality Sensitive Hashing,LSH)和随机森林(Random Forest)的一种高效的图索引查询算法。

LSH是一种相似性搜索技术,其核心思想是将高维数据映射到低维空间,同时保证相似的数据在低维空间中仍保持相似关系。

随机森林则是一种基于决策树的学习算法,可以有效地处理高维数据和噪声数据。

将LSH 和随机森林相结合,能够有效地解决图索引查询中的高维度和复杂性问题,同时保持查询速度快和准确率高的特点。

具体来说,LSH Forest算法首先根据结点的标签或属性进行局部敏感哈希,将相似的结点分配到同一个哈希桶中。

接着,通过构建随机森林,将各个哈希桶中的结点分配到森林中的不同决策树中。

最后,在查询时,根据查询结点的标签或属性,将其映射到哈希桶中,再根据哈希桶中对应的决策树,找到最相似的结点。

相对于传统的图索引查询算法而言,LSH Forest算法具有一些优势。

首先,它能够有效地处理高维度的结点数据,而且计算效率高,能够在大规模图数据库中迅速查询到结果。

其次,LSH Forest算法能够自适应地处理噪声数据和不完整数据,能够保持准确的查询结果。

此外,算法实现简单易懂,易于使用和维护。

当然,LSH Forest算法也存在一些潜在的问题。

例如,在某些情况下,哈希桶中的结点数量可能会很少,会导致查询结果不准确。

此外,决策树的构造和训练过程对计算资源要求较高,需要在设计算法时做好平衡。

综上所述,LSH Forest算法是一种非常有效的图索引查询算法,具有高效、准确、自适应等特点,在实际的图数据库应用中表现良好。

多模态图像分析与检索技术研究

多模态图像分析与检索技术研究

多模态图像分析与检索技术研究摘要:随着数字图像和多媒体技术的快速发展,图像分析与检索技术逐渐受到关注。

多模态图像分析与检索技术是指通过融合不同模态的图像数据,利用计算机视觉和模式识别方法,实现对图像的分析和检索。

本文对多模态图像分析与检索技术的研究进行探讨,包括多模态数据的融合方法、特征提取与表示方法以及基于学习的检索算法等,以期为多模态图像分析与检索技术的研究和应用提供参考。

一、引言多模态图像分析与检索技术是计算机科学与技术领域的重要研究方向之一,其目标是利用多模态数据进行图像分析和检索。

多模态数据可以包括图像、文本、声音等多种数据类型,通过融合这些数据,可以更准确地描述和表达图像的含义,提供更精确和全面的图像分析和检索效果。

二、多模态数据的融合方法多模态数据的融合是实现多模态图像分析与检索的基础步骤。

常用的融合方法包括特征级融合、决策级融合和模型级融合等。

特征级融合指将不同模态的数据进行特征提取和融合,得到具有更丰富信息的特征表示;决策级融合是基于多模态特征的决策结果对不同模态的权重进行调整,提升系统的可靠性;模型级融合则是在不同模态的数据上分别建立模型,再将模型的输出结果进行融合。

这些方法相互配合,可以有效提升多模态图像分析与检索的效果。

三、特征提取与表示方法多模态图像分析与检索中的特征提取与表示方法是关键技术之一。

常用的方法包括基于内容的图像特征提取、深度学习特征提取和语义表示方法等。

基于内容的图像特征提取方法主要利用图像的颜色、纹理、形状等特征来描述图像的内容;深度学习特征提取方法则是通过深度神经网络自动学习图像的特征表示,具有更高的表达能力和鲁棒性;语义表示方法则是通过将图像与文本或语义知识关联起来,实现对图像语义信息的描述和表示。

这些方法的应用可以提高多模态图像分析与检索的准确性和效率。

四、基于学习的检索算法基于学习的检索算法是多模态图像分析与检索技术中的研究热点之一。

该算法主要利用机器学习和模式识别方法,通过对大量的图像数据进行训练,自动学习图像的特征和语义表示,并利用学习模型进行图像的检索。

时间序列相似性查询的研究与应用

时间序列相似性查询的研究与应用

时间序列相似性查询的研究与应用随着大数据时代的到来,时间序列数据的重要性逐渐凸显。

时间序列数据是指按照时间顺序排列的一组数据,例如股票价格、气温变化、心电图等。

时间序列相似性查询作为一种重要的数据分析技术,旨在寻找与查询样本相似的时间序列数据,从而揭示隐藏在数据背后的规律和趋势。

在各个领域的实际应用中,时间序列相似性查询已经发挥了重要的作用。

时间序列相似性查询的研究主要包括两个方面:相似性度量和相似性查询算法。

相似性度量是衡量两个时间序列数据之间相似程度的方法,常用的度量方法包括欧氏距离、曼哈顿距离、动态时间规整等。

相似性查询算法是根据相似性度量方法,对大规模时间序列数据进行高效查询的方法,常用的算法包括基于索引的查询、基于哈希的查询、基于树结构的查询等。

这些研究成果为时间序列数据的分析和挖掘提供了基础。

时间序列相似性查询在实际应用中具有广泛的应用前景。

首先,在金融领域,通过对历史股票价格的相似性查询,可以预测未来股票价格的走势,为投资者提供决策依据。

其次,在气象领域,通过对历史气温变化的相似性查询,可以预测未来天气的变化,为气象预报提供支持。

再次,在医疗领域,通过对心电图的相似性查询,可以诊断心脏疾病,为医生提供治疗方案。

另外,在工业生产领域,通过对传感器数据的相似性查询,可以提前预测设备故障,进行维护和修复,提高生产效率。

然而,时间序列相似性查询也面临一些挑战。

首先,大规模时间序列数据的查询效率是一个问题,传统的查询算法无法满足实时查询的需求。

其次,相似性度量方法的选择也是一个难题,不同领域的数据可能需要采用不同的度量方法。

此外,在多维时间序列数据的查询中,如何考虑多个维度之间的相似性也是一个研究方向。

总之,时间序列相似性查询作为一种重要的数据分析技术,在各个领域的实际应用中发挥了重要作用。

未来,我们需要进一步研究相似性度量方法和查询算法,提高查询效率和准确性,以更好地应对大数据时代的挑战。

kgraph原理

kgraph原理

kgraph原理KGraph原理及应用KGraph是一种基于图结构的高效近似最近邻搜索算法,它在大规模数据集中能够快速找到与给定查询对象最相似的数据点。

KGraph 的原理基于图的构建和图搜索,通过将数据点表示为图中的节点,并使用边来表示节点之间的相似关系,从而实现高效的近似最近邻搜索。

KGraph的原理核心是构建一个稀疏图,以数据点为节点,通过边来连接相似的节点。

构建图的过程分为两步:首先,根据数据集中的距离信息,计算每个节点与其邻居节点之间的相似度,选择相似度大于一定阈值的节点连接;然后,根据相似度将节点按照一定规则进行排序,以减少图的规模。

通过构建稀疏图,可以在保持较高的搜索效率的同时,降低图的存储和计算开销。

在构建好的图上,KGraph利用基于图的搜索算法来实现近似最近邻搜索。

给定一个查询对象,KGraph首先根据查询对象与已知节点的相似度,选择一些候选节点作为搜索起点。

然后,通过迭代搜索的方式,逐步扩展搜索半径,找到与查询对象相似度最高的数据点。

在搜索的过程中,KGraph通过动态调整搜索半径和更新候选节点,以提高搜索效率。

最终,KGraph能够以较高的准确度找到与查询对象最相似的数据点,满足实际应用的需求。

KGraph的应用非常广泛。

在图像检索中,KGraph可以快速找到与给定图像最相似的图像,实现图像的快速搜索和匹配。

在推荐系统中,KGraph可以根据用户的历史行为和兴趣,快速找到与用户兴趣相似的商品或内容,提供个性化的推荐服务。

在社交网络分析中,KGraph可以根据用户之间的关系和相似度,发现社交网络中的群组和社区结构,实现社交网络的分析和挖掘。

此外,KGraph还可以应用于文本检索、数据压缩、生物信息学等领域。

尽管KGraph在很多领域中取得了良好的效果,但也存在一些挑战和限制。

首先,构建和维护KGraph所需的计算和存储开销较大,特别是在大规模数据集上,需要充分考虑算法的效率和可扩展性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
:F , A b s t r a c t r o m t h e a r o x i m a t e u e r i e s o f d a t a m a n a e m e n t s o m e r e r e s e n t a t i v e a l o r i t h m s i n s i m i l a r i t s e a r c h a r e r e v i e w e d . p p q g p g y a l o r i t h m b a s e d o n t h e i r s t l e s i s c l a s s i f i e d a n d s o m e c l a s s i c a l o r i t h m s f r o m i n d e x u n i t a n d s c h e m e i n t h i s a r e a a r e r e s e n T h e - g y g p t e d . S o m e t i c a l a l o r i t h m s a r e i n v e s t i a t e d . E a c h a l o r i t h m’ s c h a r a c t e r i s t i c a n d s e a r c h e f f i c e n c a r e c o m a r e d a n d r e f i n e d t o y p g g g y p i v e n r o e r t i e s c l a r i f t h e i r a d v a n t a e s a n d d i s a d v a n t a e s . T h e c o m a r i s o n i s b a s e d o n t h e o f t h e a l o r i t h m s a n d a l i c a t i o n s . g p p y g g p g p p T h e n t h e d i s a d v a n t a e s a n d f u t u r e r e s e a r c h d i r e c t i o n s a r e d i s c u s s e d . g : ; ;s ;g K e w o r d s s i m i l a r i t s e a r c h s u b r a h s i m i l a r i t s e a r c h u e r r a h s i m i l a r i t s e a r c h i s o m o r h i s m;g s i m i l a r i t r a h r a h y g p y p g p y p y p p y
2 . 1 子图近似查询算法
1 基本概念
本节主要介 绍 图 的 一 些 基 本 专 业 术 语 , 以 及 图 查 询 中 涉及的定义和概念 。 本文中的图 G 可 以 采 用 一 个 五 元 组
[ ] 1 2 1 3 -
来 进 行 表 示,
G =( V, E, L), V 代 表 图 中 结 点 的 集 合, E= ∑V , ∑E, V× V 代表图中边的集合 。 ∑V 代表图中所有结点标号的集
1 1] 算法从 图 的 近 似 定 义 [ 上 可 分 为: ① 基 于 物 理 特 性 的 近
据库 K E G G
[ 3]
等 。 人们利用图数据 库 对 复 杂 数 据 进 行 查 询
和定位操作 , 进而有快速做出进一步的数据分析 。 尽管在图数 据 查 询 领 域 已 经 有 不 少 研 究 , 但 是 大 部 分 的研究工作都集 中 在 图 的 精 确 匹 配 查 询 , 其 算 法 有 子 图 查 询 和 超 图 查 询 两 大 类。 子 图 查 询 中 G i u n o和 S h a s h a在 g 2 0 0 2年 首 先 提 出 了 基 于 路 径 查 询 的 G r a h G r e p p
A l o r i t h m s f o r s i m i l a r i t s e a r c h r a h g y g p
, TAN W e i YANG S h u x i n -
( , , ) S c h o o l o f I n f o r m a t i o n E n i n e e r i n J i a n x i U n i v e r s i t o f S c i e n c e a n d T e c h n o l o G a n z h o u 3 4 1 0 0 0, C h i n a g g g y 数据结构 , 既 能 表 示 复 杂 的 数 据 形 式 , 也能表示一 般 的 数 据 类 型 。 因 此 , 现 实 生 活 中 的 许 多 数 据 都可以利用图来进行建模 , 其中结 点 代 表 现 实 世 界 的 实 体 , 结点与结点之间 则 用 边 连 线 表 示 各 个 实 体 之 间 的 关 系 。 在 计算机 、 生物 、 化 学 、 社 会 网 络 社 区 等 各 领 域 中 均 有 广 泛 的应用 。 如在 基 因 调 控 网 络 中 , 节 点 代 表 基 因 , 边 代 表 基 因之间的交互 。 已 有 一 些 图 数 据 库 开 始 广 泛 应 用 于 化 学 和 生物等领域 , 如化学 数 据 C h e m I D l u s 和P D B ,生物数 p
模式 。2 0 0 9年 Z h a n g 等人 则 从 另 一 个 角 度 出 发 , 根 据 特 征
[0] 算 法, 降 低 了 查 询 的 时 子图的最 优 排 序 提 出 了 G P T r e e1
间复杂度 。 精确 匹 配 查 询 虽 然 能 够 准 确 的 找 出 目 标 图 , 但 是由于真实数据库的数据结构复 杂 , 图 数 据 并 非 理 想 状 态 , 使得精确 匹 配 方 法 查 询 存 在 一 定 的 干 扰 , 查 询 效 率 不 高 , 往往无法得 到 我 们 实 际 想 要 的 结 果 。 因 此 , 近 年 来 近 似 查 询开始越来越多 的 受 到 研 究 者 们 的 关 注 。 已 有 的 近 似 查 询
) ; 江西省自然基金项目 ( ) ; 江西省教育厅科技基金 项 目 ( ;江西省 基金项目 : 国家自然科学基金项目 ( 7 1 0 6 1 0 0 8 2 0 0 9 G Z S 0 0 4 3 G J J 1 2 3 4 9) ) 研究生创新基金项目 ( Y C 2 0 1 1 S 0 9 3 - , 男 , 江西宜黄人 , 硕士研究生 , 研究 方 向 为 信 息 管 理 、 图 数 据 查 询 ; 杨 书 新 ( , 男, 江 西 九 江 人, 副 教 作者简介 : 谭伟 ( 1 9 8 5 1 9 7 8 -) -) : 授 , 硕士生导师 ,C C F 会员 , 研究方向为数据管理 、 工作流 。E-m a i l t a n d a v e 2 0 0 7@1 2 6 . c o m y
图近似查询算法研究
谭 伟 ,杨 书 新
( ) 江 西 理 工大学 信息工程学院 , 江 西 赣 州 3 4 1 0 0 0
摘 要 : 从 数据 管 理 中 的 近 似 查 询 方 向 , 对 图 数据 的 近 似 查 询 算 法 进 行 了 研 究 。 依 据 近 似 查 询 的 类 别 , 分 别 介 绍 了 近 似 查 询 中 的 经 典 算 法 , 并 对 这 些 算 法 进 行 了 详细 的 分析 和 讨 论 , 从 索 引单元 以 及 索 引 机 制 比 较 了 各 种 算 法 适 用 的 范 围 以 及 应 用 领 域 。 重 点 阐 述 和比较 了 各 算 法 的 特 点 及 查 询 性能 , 分析 了 各 个 算 法 存 在 的 优 势 和 不 足 。 对 近 似 查 询 中 现 有 算 法 的 不 足 及 未 来 的 研究 方 向进 行 了 讨 论 。 关键词 : 近 似 查 询 ; 子图 近 似 查 询 ; 超 图 近 似 查 询 ; 图 的 同 构 ; 图 近 似 度 )0 中图法分类号 :T P 3 0 1 文献标识号 :A 文章编号 : 1 0 0 0 7 0 2 4( 2 0 1 3 5 1 7 0 0 0 6 - - -
2 0 1 3年5月 第3 4卷 第5期
计算机工程与设计
C OMP UT E R E NG I N E E R I NG AN D D E S I GN
M a . 2 0 1 3 y V o l . 3 4 N o . 5

; 修订日期 :2 收稿日期 :2 0 1 2 0 8 1 7 0 1 2 1 0 2 0 - - - -
[ 4]
似 , ② 基于特 征 模 式 的 近 似 , ③ 基 于 结 构 的 近 似 。 本 文 主 要针对近似查询 的 3 种 定 义 形 式 , 对 近 似 查 询 的 算 法 进 行
算 法,
合,
L 是标号与结点或标 ∑E 代表图中所有边标号的集合 。 E → ∑E 。 ∑V ,
2 . 1 . 1 G r a f i l算法 Y a n 等人在 2 0 0 5 年提出了一种 基 于 特 征 的 结 构 化 过 滤
[ 1] [ 2]
2 0 0 4 年在基于路径查询的基础 上 Y a n等 人 提 出 了 利 用 频 繁
[] 子图挖掘建 立 索 引 的 思 想 ,G I n d e x5 算 法 使 得 子 图 查 询 领
域得到了快速的发展 , 然后 Z o u 等人 在 2 0 0 8年提出了基于
[ 6] 树结构 建 立 索 引 的 G C o d i n D I n - g 算 法,其 他 算 法 还 有 G [] [ 8] d e x7 、G S t r i n h e n 等人在 2 0 0 7 年提出 g 等 。 超图查询中 C [] c I n d e x9 算法 , 利用 c o n t r a s t i n d e x得 到 不 被q 包 含 的 索 引
相关文档
最新文档