Rtop-k基于结构松弛的XML关键字近似查询方法

合集下载

IRST(k,l)-Index:一种支持分支路径查询的高效XML结构索引

IRST(k,l)-Index:一种支持分支路径查询的高效XML结构索引

IRST(k,l)-Index:一种支持分支路径查询的高效XML结构
索引
范颖捷;张成洪;王述云;胡运发
【期刊名称】《小型微型计算机系统》
【年(卷),期】2009(030)008
【摘要】为快速准确地查询图结构XML文档,本文在互关联后继树(IRST)的基础上,引入结构索引的相似性归并思想,提出一种基于互关联后继树且支持分支路径查询的高效XML结构索引-IRST(k,l)-index,并给出该索引的快速创建和查询算法.经实验验证,与国际上同类索引相比,该索引的创建速度更快、查询效率更高、空间开销更小.
【总页数】9页(P1546-1554)
【作者】范颖捷;张成洪;王述云;胡运发
【作者单位】复旦大学,计算机与信息技术系,上海,200433;解放军南京政治学院,上海分院,训练部,上海,200433;复旦大学,信息管理与信息系统系,上海,200433;复旦大学,计算机与信息技术系,上海,200433;复旦大学,计算机与信息技术系,上海,200433【正文语种】中文
【中图分类】TP311
【相关文献】
1.一种XML多分支路径索引查询算法 [J], 吉根林;肖袁
2.一种高效的XML路径查询索引 [J], 韩恺;蔡荣峰;岳丽华;龚育昌
3.一种高效的XML多分支路径查询算法 [J], 肖袁
4.一种支持高效XML路径查询的自适应结构索引 [J], 张博;耿志华;周傲英
5.一种支持动态XML文档上关键字查询的索引结构 [J], 缪丰羽;林宏康
因版权原因,仅展示原文概要,查看原文内容请购买。

一种改进的XML关键字查询算法

一种改进的XML关键字查询算法

一种改进的XML关键字查询算法
吴海涛
【期刊名称】《南京工程学院学报(自然科学版)》
【年(卷),期】2011(009)002
【摘要】为了使XML关键字查询中的查询结果更有意义,首先研究针对XML的各种经典关键字查询算法,然后根据XML文档的结构特征,定义几种结构类型,在此基础上,提出了一种改进的SLCA算法.该算法不仅解决了在XKSearch中存在的查询结果返回无意义信息的问题,而且与XSEEK中的返回有意义信息的算法相比,有效提高了查询效率.试验结果表明,该算法在查询质量和查询效率上都有较大提高.
【总页数】5页(P33-37)
【作者】吴海涛
【作者单位】南京工程学院通信工程学院,江苏南京211167
【正文语种】中文
【中图分类】TP391
【相关文献】
1.POTwigStack:一种改进的XML小枝模式匹配算法 [J], 石隽锋;张剑妹
2.FastMatch:一种高效的XML关键字查询算法 [J], 崔健;周军锋;郭景峰
3.一种基于区间预留编码的XML关键字查询算法 [J], 魏东平; 罗丹
4.一种基于节点语义相关性的XML关键字查询算法 [J], 曾晓宁; 蔺旭东; 李密生; 裴彩燕; 薄静仪
5.PrList:一种高效的不确定XML关键字查询算法 [J], 张晓琳;苏龙超;韩雨童;刘立新
因版权原因,仅展示原文概要,查看原文内容请购买。

【计算机科学】_索引查询_期刊发文热词逐年推荐_20140726

【计算机科学】_索引查询_期刊发文热词逐年推荐_20140726

科研热词 推荐指数 语义 1 索引 1 移动通信 1 相似度 1 标签集约束路径的集合查询 1 标签集约束路径查询 1 时空数据 1 扩展 1 并发 1 局部敏感哈希 1 基于内容图像检索 1 图 1 区域查询 1 分布式索引 1 共享 1 倒排索引 1 产品设计 1
科研热词 索引 数据流 k近邻查询 高维索引 预测聚集 顺序查找 道路网 通配符 连续范围查询 输入/输出 路径查询语言 超图集合查询 语言模型 聚集查询 结构化检索 索引结构 类可扩散列 空间道路网络 空间索引 移动对象 特征 流索引 模式结构 椭圆体聚类 树自动机 查询优化 最短路径矩阵 时空索引 时空查询 时空数据库 无线传感器网络 数据管理 数据模式 数据挖掘 数据存储 嵌入式内存数据库 字符串匹配 可扩展标记语言 可扩展标示语言 反向近似近邻 区域估计 区-段式 分域查询 关键字检索 关系模拟 倒排表 xml t树 spne算法 rr-tree技术 r_tree技术 q-gram索引
科研热词 推荐指数 索引 2 查询处理 2 高维索引 1 马尔可夫链蒙特卡洛(mcmc) 1 隐私保护 1 连续数据保护 1 过滤-精炼 1 超立方体 1 语义检索 1 语义分析 1 语义web服务 1 联合聚类 1 结构扩展 1 索引结构 1 索引日志 1 索引技术 1 空间查询 1 空间数据索引 1 移动对象索引 1 移动对象 1 相似连接 1 相似性查询 1 相似度融合 1 相似度 1 点击率 1 树模型 1 查询算法 1 服务发现 1 最近邻查询 1 时态距离 1 文件视图 1 数据恢复 1 广义可达性查询 1 嵌入式索引 1 对象轨迹查询 1 室内空间 1 实体 1 多连接 1 基础 1 可达性查询 1 可扩展标记语言(xml) 1 半马尔可夫模型 1 列存储 1 分解路径表达式 1 分组 1 关键字查询 1 倒排索引 1 传递闭包压缩 1 云计算 1 x-hop 1 trie树 1 rb 索引 1

FastMatch:一种高效的XML关键字查询算法

FastMatch:一种高效的XML关键字查询算法
第2 9卷 第 6期
21 0 2年 6月
计 算 机 应 用 研 究
Ap l a in R s a c fCo u e s p i t e e r h o mp t r c o
Vo . 9 No 6 12 .
Jn 0 2 u .2 1
Hale Waihona Puke F sMac : a t th 一种 高效 的 X 键 字查 询 算 法 术 ML关
m oe t a nc r h n o e,S ti n f c e n r cie. T ov h sp o l m ,t i a e r po e t d u ed fs r up t e c O i si e inti p a tc i o s l et i r b e h sp p rp o s d a meho s a tg o or du e t e tme fs a n h n et d lss.te r p s d aag rt m a d Fa t th b s d o h eh d. i lo ih f u h i s o c nig t e i v re it h n p o o e lo ih n me sMa c a e n t e m t o Th sag rt m o nd als te es lsm e tng s me c ran c nd to y s a n n l n de n t e i v re it nl nc Th x e i n a e l ub r e r ut e i o et i o iinsb c n i g al o s i h n e d lss o y o e. t e e p rme tlr — s lsv rf he h g e fr a e o hi t d. ut e iy t ih p ro m nc ft s meho Ke r y wo ds: XM L; k y r e r h; e ce t fs o p;Fa t ac e wo d s a c i f in ; a tg u r sM th

基于x-tuple的概率阈值top-k查询算法

基于x-tuple的概率阈值top-k查询算法

基于x-tuple的概率阈值top-k查询算法黄冬梅;舒博;王建;熊中敏【期刊名称】《计算机工程》【年(卷),期】2013(39)4【摘要】不确定数据库中的概率阈值top-k查询是计算元组排在前k位的概率和,返回概率和不小于p的元组,但现有的查询语义没有将x-tuple内的元组进行整体处理.针对该情况,定义一种新的查询语义——概率阈值x-top-k查询,并给出查询处理算法.在该查询语义下采用动态规划方法求取x-tuple内每个元组排在前k位的概率和,对其进行聚集后做概率阈值top-k查询,并利用观察法、最大上限值等剪枝方法进行优化.实验结果表明,该算法平均扫描全体数据集中60%的数据即可返回正确结果集,证明其查询处理效率较高.%Probabilistic threshold top-k query calculation stu of the probability of the tuple ranked top-k and return the tuples whose sum of the probability are at least p.But top-k query does not take x-tuple as a whole,thus a new top-k query semantic probabilistic threshold x-top-k query is defined and an algorithm is given to process it,which uses dynamic method to acquire sum of the probability of the tuple,then process aggregate probabilities with top-k query.It uses several pruning methods like the upper bound method and so on to optimize the algorithm.Experimental result shows that the algorithm return the answer set for scanning about 60% of data set,and it demonstrates that the algorithm is efficient.【总页数】4页(P44-47)【作者】黄冬梅;舒博;王建;熊中敏【作者单位】上海海洋大学信息学院,上海201306;上海海洋大学信息学院,上海201306;上海海洋大学信息学院,上海201306;上海海洋大学信息学院,上海201306【正文语种】中文【中图分类】TP393【相关文献】1.基于滑动窗口的Top-K概率频繁项查询算法研究 [J], 王爽;王国仁2.基于概率信息抽取模型的Top-k查询 [J], 何明;李薇3.不确定数据库中基于x-tuple的高效Top-k查询处理算法 [J], 刘德喜;万常选;刘喜平4.不确定数据库中概率top-k和排序查询算法 [J], 周帆;李树全;肖春静;吴跃5.基于阈值的快速启动Top-k查询处理算法 [J], 江宇;宋省身;杨岳湘;姜琨因版权原因,仅展示原文概要,查看原文内容请购买。

【计算机科学】_查询计算_期刊发文热词逐年推荐_20140727

【计算机科学】_查询计算_期刊发文热词逐年推荐_20140727

科研热词 调度 语义网 语义关联树 能量模型 联机分析处理 网格计算 空间超立方格子树 空间索引 移动计算环境 查询扩展 权重矩阵 本体 易变数据 无线传感器网络 广播 并行计算 封闭立方体 对象线性化 子树 向量空间模型 前缀编码 分层结构 信息集成 信息检索 传输半径 主题选取 xml web文本分类 mapreduce技术
科研热词 数据仓库 面向查询 隐私保护 选择性估计 适应性层次聚集树 连续范围查询 轮廓查询 路径 贝叶斯查询点移动 覆盖网 聚集计算 聚类 结构连接 组范围查询算法 组合分类器 索引结构 索引 算法 空间道路网络 移动数据 矢量图形检索 相关反馈 相似性查询 物化视图处理方法 物化视图 滑动窗口 流式数据 模糊查询 概念树 框架 树模式 查询扩展 查询图 查询优化 最短路径矩阵 星型模型 时间窗口 时空索引 时空查询 时空数据库 无线传感器网络 数据管理 数据流 数据模式 数据挖掘 数据存储 数据划分 数据分布 支配集 扩张树 成员查询 布隆过滤器
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
2011年 科研热词 云计算 skyline计算 mapreduce 数据划分 道路网络 超节点网络 超节点 语义异构 编辑距离 索引阵列 模糊检索 模糊查询 概率skyline 枢轴表 数据表定位 数据缓存 数据管理 数据立方 数据密集计算 数据分区 数据中心 支配概率 拓扑结构 对等计算 容错性 容错 子串查询 多租户数据库系统 可能世界 可扩展性 加密 剪枝技术 分布并行计算 关键字检索 元组聚类 偏序 不确定移动对象 不确定数据库 不确定 top-k查询 top-k skyline查询 r-tree k-匿名数据 gram索引 dwarf 推荐指数 4 3 3 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

简述空间索引的类型

简述空间索引的类型

简述空间索引的类型空间索引是一种用于加快空间数据查询的技术。

它能够将空间数据按照特定的规则进行组织和排序,以便快速检索和访问。

在地理信息系统、数据库和数据挖掘等领域中广泛应用。

一、R树索引R树是一种常用的空间索引方法,它是一种多叉树结构,每个节点代表一个矩形范围。

树的叶子节点保存了实际的空间对象,而非叶子节点保存了其子节点所代表的矩形范围。

通过不断调整节点的位置和大小,R树能够保持树的平衡性和紧凑性,提高查询效率。

二、Quadtree索引Quadtree是一种将二维空间划分为多个象限的树状结构。

每个节点代表一个象限,而非叶子节点代表的象限又被划分为更小的象限,最终形成一棵树。

Quadtree适用于对空间数据进行递归划分和查询,能够有效地处理空间数据的分布不均匀情况。

三、Grid索引Grid索引将空间数据划分为规则的网格单元,每个单元代表一个空间范围。

每个单元可以存储多个空间对象,通过网格索引可以快速定位到包含目标对象的单元,进而加快查询速度。

Grid索引适用于对空间数据进行分区和统计分析。

四、kd树索引kd树是一种二叉树结构,用于对k维空间数据进行划分和查询。

树的每个节点代表一个k维空间范围,非叶子节点按照某个维度的值进行划分,形成左右子树。

kd树索引能够高效地处理高维空间数据的查询问题。

五、R*-tree索引R*-tree是对R树的改进和优化,通过引入一系列策略和算法,提高了R树的查询性能和存储效率。

R*-tree索引在处理大规模和高维空间数据时表现出色,被广泛应用于地理信息系统和数据库领域。

六、Hilbert R树索引Hilbert R树是一种基于Hilbert曲线的空间索引方法,通过将空间数据映射到一条曲线上,实现对空间数据的排序和查询。

Hilbert R 树索引能够有效地处理多维空间数据的查询问题,具有较好的查询性能和存储效率。

空间索引是空间数据处理和查询的重要工具,能够提高数据查询的效率和准确性。

RRTA:一种基于顺序读取的有效Top-K查询算法

RRTA:一种基于顺序读取的有效Top-K查询算法

RRTA:一种基于顺序读取的有效Top-K查询算法周腾腾;陈林祥;胡奥【期刊名称】《计算机工程与应用》【年(卷),期】2013(000)017【摘要】To p-K查询是一种被广泛应用的操作,它根据给定的评分函数在潜在的海量数据中返回k个分值最高的元组。

传统的TA算法要求能够支持随机读,NRA 算法虽然放宽了对随机读的限制,但是增长阶段需要在内存中维护大量的元组,运行时将占用大量的内存资源。

提出的RRTA算法相比NRA算法对数据的存储进行了重新的规划,创建一个新的表将内存上的开销转换到较廉价的外存开销,只需顺序读取就可以进行有效的To p-K查询,同时将表进行了划分,在并行处理的情况下更能提高程序的效率,能够很好地运行在内存有限的环境中。

%Top-K query is a widely used operation, which can return the highest score of the tuple in specialized massive data-bases, according to the given monotone aggregation function. Traditional TA algorithm requires the ability to support random access, NRA algorithm although relaxes the restrictions on the random access, it is found that in massive data context, NRA needs to maintain large quantity of candidate tuples in memory in the increasing phase, it will also use up a lot of memory resources in runtime. Compared with the NRA algorithm, the RRTA(Round-Robin ThresholdAlgorithm)which proposed in this paper replants the data storage mode, which creats a new table to switch the memory overhead to the cheaper external memory over-head, so just sorted access is also able to doefficient top-k query. Meanwhile, the table has been divided, which makes the algo-rithm more efficient and smoother even with limited memory, in the case of parallel processing.【总页数】5页(P116-120)【作者】周腾腾;陈林祥;胡奥【作者单位】中国矿业大学计算机科学与技术学院计算机科学与技术系,江苏徐州 221000;中国矿业大学理学院数学系,江苏徐州 221000;中国矿业大学计算机科学与技术学院计算机科学与技术系,江苏徐州 221000【正文语种】中文【中图分类】TP311【相关文献】1.一种有效的不确定数据流Top-K查询算法 [J], 梁银双;苏玉;卢印举2.一种有效的海量数据Top-k Dominating查询算法 [J], 韩希先;李建中;高宏EP:海量数据上一种有效的Top-K查询处理算法 [J], 韩希先;杨东华;李建中4.基于顺序读取的分布式top-k查询算法 [J], 毕方明;陈伟;杨魁;车奔5.一种基于Jetson-TK1的Top-k查询算法 [J], 李靓琦;黄玉龙;谢绍国因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 2 ( ) ) 辽宁工业大学电子与信息工程学院 锦州 1 辽宁工业大学计算中心 锦州 1 2 1 0 0 1 2 1 0 0 1 ( 3 ( ) 辽宁工程技术大学电子与信息工程学院 葫芦岛 1 2 5 1 0 5
摘 要 目前 , 现有的大多数关键字查 询 方 法 都 是 计 算 XML 包 含 关 键 字 元 素 的 最 紧 致 片 段 , 这类方法大都忽略了 而 XML 结构化查询 能 够 准 确 捕 捉 用 户 查 询 的 信 息 , 具 有 较 高 的 准 确 率。将 结 构 化 查 XML 文档中嵌入的结构关系 , 询方法与关键字信息检索相结合 , 通过分析关键字与 XML 文档的结构关系判断 用 户 查 询 的 需 求 , 将面向对象的思想 ) 。实验结果表明, 和松弛查询的方法引入到关键字查询方法中 , 提出一个新的 XML 关 键 字 近 似 查 询 框 架 ( 所 R t o k - p 具有较高的查全率和查准率 。 提近似查询方法能够较为准确地捕捉用户的查询意图 , 关键词 XML, 关键字 , 松弛查询 , 对象 中图法分类号 Байду номын сангаасT P 3 1 1. 1 3 文献标识码 A
, A b s t r a c t e c e n t l m o s t o f e x i s t i n a l o r i t h m s f o r k e w o r d s s e a r c h a l w a s c o m u t e t h e m o s t c o m a c t f r a m e n t s R y g g y y p p g , c o n t a i n k e w o r d s . H o w e v e r m a n o f t h e s e m e t h o d s d o n o t t a k e t h e s t r u c t u r e r e l a t i o n s h i e m b e d d e d i n t h e XML w h i c h - y y p , i n t o c o n s i d e r a t i o n . F o r t h e s t r u c t u r a l o f XML d o c u m e n t s i t a l w a s h a s a h i h e r a c c u r a c a s i t c a n c a d o c u m e n t u e r - y g y p q y , t u r e t h e i n f o r m a t i o n s e a r c h e d b u s e r s a c c u r a t e l . I n t h i s w e c o m b i n e t h e m e t h o d s o f s t r u c t u r a l t o e t h e r a e r u e r y y g p p q y , ’ w i t h t h e k e w o r d i n f o r m a t i o n r e t r i e v a l a n d i n f e r t h e n e e d s o f u s e r s t h r o u h a n a l z i n t h e r e l a t i o n s h i b e t w e e n u e r y g y g p q y u e r k e w o r d s a n d t h e s t r u c t u r e o f t h e XML d o c u m e n t . W e i n t r o d u c e t h e t h i n k i n o f o b e c t o r i e n t e d a n d t h e o f r e l a x a - - q y y g j , u e r r o o s e r o x i m i t u e r t i o n i n t o k e w o r d m e t h o d s a n d a n e w a r c h i t e c t u r e o f k e w o r d R t o k) . E x e r i m e n t a l - q y p p p y q y( y y p p s h o w t h a t o u r m e t h o d c a n c a t u r e t h e s e a r c h i n t e n t i o n o f u s e r s a c c u r a t e l w i t h h i h r e c a l l a n d r e c i s i o n . r e s u l t s - p y g p , , u e r K e w o r d R e l a x a t i o n O b e c t K e w o r d s XML, q y y j y 匹配结果在结构化查询中比较容易实现 。
第3 9卷 第1 1 A期 2 0 1 2年1 1月
计 算 机 科 学 C o m u t e r c i e n c e S p
V o l . 3 9N o . 1 1 A N o v 2 0 1 2
: 基于结构松弛的 XML 关键字近似查询方法 R t o k - p
李 婷1 李 昕2 孟祥福3
: R t o k A K e w o r d P r o x i m i t S e a r c h M e t h o d B a s e d o n S t r u c t u r e R e l a x a t i o n - p y y
1 2 3 L I T i n I X i n NG X i a n f u ME - g L g 1 ( , , ) C o l l e e E l e c t r o n i c s &I n f o r m a t i c s E n i n e e r i n L i a o n i n U n i v e r s i t o f T e c h n o l o J i n z h o u 1 2 1 0 0 1, C h i n a g g g g y g y 2 ( , , ) C o m u t i n C e n t e r L i a o n i n U n i v e r s i t o f T e c h n o l o J i n z h o u 1 2 1 0 0 1, C h i n a p g g y g y 3 ( , , ) C o l l e e o f E l e c t r o n i c s a n d I n f o r m a t i o n E n i n e e r i n L i a o n i n T e c h n i c a l U n i v e r s i t H u l u d a o 1 2 5 1 0 5, C h i n a g g g g y
相关文档
最新文档