空间Skyline查询

合集下载

障碍环境中空间Skyline查询方法

障碍环境中空间Skyline查询方法

障碍环境中空间Skyline查询方法李松;窦雅男;张丽平;郝晓红【期刊名称】《计算机科学与探索》【年(卷),期】2018(012)012【摘要】为了弥补现有的研究成果对处理障碍环境下空间Skyline查询问题的不足,提出了在障碍环境下基于Voronoi图的空间Skyline查询方法.该方法在实际应用中可以用来解决多目标决策问题.依据查询点集合是否发生变化提出了两种情况下的障碍环境中空间Skyline查询(spatial Skyline queries in obstacle space,OSSQ)方法:一种是静态查询点的障碍环境中空间Skyline查询(static query points of Skyline query in obstacle space,STA_OSSQ)方法,该查询方法主要包括约剪数据集和支配检查两个过程,最后得到Skyline集合;另一种是动态查询点状态下的障碍环境中Skyline查询(dynamic query points of Skyline query in obstacle space,DYN_OSSQ)方法,该方法主要处理了查询点动态增加和减少情况下障碍环境中空间Skyline查询问题.理论研究和实验表明所提出的方法具有较高的效率.【总页数】9页(P1882-1890)【作者】李松;窦雅男;张丽平;郝晓红【作者单位】哈尔滨理工大学计算机科学与技术学院,哈尔滨 150080;哈尔滨理工大学计算机科学与技术学院,哈尔滨 150080;哈尔滨理工大学计算机科学与技术学院,哈尔滨 150080;哈尔滨理工大学计算机科学与技术学院,哈尔滨 150080【正文语种】中文【中图分类】TP311.13【相关文献】1.障碍空间中基于R+树的空间Skyline查询方法 [J], 李松;李爽;张丽平;郝晓红2.一种障碍空间数据库中的连续反k近邻查询方法 [J], 谷峪;于晓楠;于戈3.障碍物环境中的路网最近邻查询方法 [J], 李林;张丽平;李松4.道路网环境下K-支配空间Skyline查询方法 [J], 李松; 窦雅男; 郝晓红; 张丽平; 郝忠孝5.会展空间室内环境中无障碍设计的研究 [J], 郭无霜;胡平因版权原因,仅展示原文概要,查看原文内容请购买。

多因素时间序列Skyline的快速查询算法

多因素时间序列Skyline的快速查询算法
mu t f c o n e c m ep i t c mp t se p c a t F S i a h mi i u tmei tr a e a g rt m o u e h F n t ed sg ae me l — a t r a h t o n , o u e x e t n T n e c n m m i n e v lTh l o i i i i M h c mp t st eM TS i h e i n t d t i
第 3 7卷 第 9期
V_ _7 O 3 1






2 1 年 5月 01
M a 0l v 2 1
N O. 9
Co p t rEn n e i g m u e gie rn
软件 技术 与数 据库 ・
文章 编号: 0 _ 48 o1 9_ 8 - 10 I 2( 1) —0 4 0 3 2 o 0— 3
均 为 内存 算 法 。 数据 库 领 域 对 S yie 询 的研 究 主要 在 数 据 kl 查 n
快速查询算法 ,并计算其算法复杂 度。通过一个简单案例验
证 MF S快速查询方法 的正确性,并对实验结果进行分析 , T 检查 MF S快速查询算法针对不同的多 因素时间序列组 的查 T
J N Xi l ”
(c o l f o t r , h n s a o il r l g , h n s a4 0 0 , ia S h o o f S wae C a g h c kCol e C a g h 10 4 Chn ) S a Wo e
[ s at hs a e rp ss l a tr i dS yi ( T )k l efs q eyagwtm wi T h loi m e n trsh Ab t c]T ip pr o oe MutF co me k l eMF S syi at ur l(i t MF S T eag rh gta ds e e r p a i T n n h h t s o t

一种基于压缩策略的高维空间子空间skyline查询算法

一种基于压缩策略的高维空间子空间skyline查询算法

一种基于压缩策略的高维空间子空间skyline查询算法孟熠;刘玉葆;李启睿【期刊名称】《计算机研究与发展》【年(卷),期】2013(050)0z1【摘要】skyline操作就是找出数据集中不被其他数据点支配的点的集合,但是随着数据属性维度的不断增多,通常人们只对数据集的某几个属性感兴趣,高维空间子空间skyline计算就是发现数据集中在某几个特定维度上不被其他点支配的点的集合,skyline计算在数据量大时其时间花销是非常大的,快速的返回结果才是人们能接受的.基于此提出了一个RSky算法,在原有CSky算法的基础上,指出并改进了其存在的3处明显不足,并根据InvertS索引的特性提出了一个压缩扫描策略,通过设置每个维度的下限来控制要处理的桶,除去不必要处理的桶和不可能是skyline的点,从而减少了点与点之间的比较次数.实验结果表明了RSky算法的有效性.【总页数】8页(P101-108)【作者】孟熠;刘玉葆;李启睿【作者单位】中山大学信息科学与技术学院广州 510006;中山大学信息科学与技术学院广州 510006;中山大学信息科学与技术学院广州 510006【正文语种】中文【中图分类】TP301【相关文献】1.障碍空间中基于R+树的空间Skyline查询方法 [J], 李松;李爽;张丽平;郝晓红2.基于高维空间的在线高效子空间Skyline算法——CSky [J], 周红福;宫学庆;郑凯;周傲英3.一种基于排序子空间的高维聚类算法及其可视化研究 [J], 刘勘;周晓峥;周洞汝4.一种采用Z曲线高维空间范围查询算法 [J], 徐红波;郝忠孝5.基于网格和队列触发的多维空间Skyline查询算法 [J], 张斌;孟凡荣;闫秋艳因版权原因,仅展示原文概要,查看原文内容请购买。

基于时间的空间文本关键词skyline查询

基于时间的空间文本关键词skyline查询

第13卷㊀第6期Vol.13No.6㊀㊀智㊀能㊀计㊀算㊀机㊀与㊀应㊀用IntelligentComputerandApplications㊀㊀2023年6月㊀Jun.2023㊀㊀㊀㊀㊀㊀文章编号:2095-2163(2023)06-0030-09中图分类号:TP311文献标志码:A基于时间的空间文本关键词skyline查询李晨阳1,董雷刚2,孙国豪3,于㊀泉4(1吉林化工学院信息与控制工程学院,吉林吉林132022;2白城师范学院计算机科学学院,吉林白城137000;3东华大学计算机科学与技术学院,上海201620;4蚂蚁科技集团股份有限公司,杭州310012)摘㊀要:在移动互联网环境下,空间文本skyline查询可以有效支持用户在空间和关键词方面的查询㊂随着需求的多样性,基于用户经常会同时考虑空间距离㊁数值型信息㊁关键词和时间等因素对查询结果的影响,提出了基于时间的空间文本关键词skyline查询(TimebasedSpatialTextKeywordSkylineQuery,TSTKSQ),用来查找在空间㊁数值㊁关键词和时间都满足条件的优秀对象,设计了基于时间的空间文本关键词skyline查询的索引结构STTR-Tree,提出了关键词㊁时间和时空关键词相关性的评价函数,在裁剪策略的基础上提出了skyline查询算法㊂通过实验结果分析,验证了算法的准确性和有效性㊂关键词:空间文本skyline查询;关键词相关性;时间相关性;时空关键词相关性;STTR-Tree索引TimebasedspatialtextkeywordskylinequeryLIChenyang1,DONGLeigang2,SUNGuohao3,YUQuan4(1SchoolofInformationandControlEngineering,JilinInstituteofChemicalTechnology,Jilin132022,China;2SchoolofComputerScience,BaichengNormalUniversity,BaichengJilin137000,China;3SchoolofComputerScienceandTechnology,DonghuaUniversity,Shanghai201620,China;4AntTechnologyGroupCo.,Ltd,Hangzhou310012,China)ʌAbstractɔInthemobileInternetenvironment,spatialtextskylinequeriescaneffectivelysupportusersᶄqueriesintermsofspaceandkeywords.Withthediversityofneeds,basedonthefactthatusersoftenconsidertheinfluenceofspatialdistance,numericalinformation,keywordsandtimeonqueryresultsatthesametime,aTimebasedSpatialTextKeywordSkylineQuery(TSTKSQ)isproposedtofindthespatial,numerical,keywordandtimearesatisfiedwiththeconditionsoftheexcellentobject.TheindexstructureSTTR-Treefortimebasedspatialtextkeywordskylinequeryisdesigned,theevaluationfunctionsofkeyword,timeandspatio-temporalkeywordrelevanceisproposed,andtheskylinequeryalgorithmisproposedonthebasisofthetailoringstrategy.Theaccuracyandeffectivenessofthealgorithmareverifiedthroughtheanalysisofexperimentalresults.ʌKeywordsɔspatialtextskylinequery;keywordsrelevance;timecorrelation;temporalspatialkeywordrelevance;STTR-Treeindex基金项目:吉林省自然科学基金项目(YDZJ202201ZYTS666);吉林省教育厅科学研究项目(JJKH20210005KJ)㊂作者简介:李晨阳(1999-),男,硕士研究生,主要研究方向:数据查询与优化;董雷刚(1982-),男,博士,副教授,硕士生导师,主要研究方向:数据查询与优化;孙国豪(1990-),男,博士,副教授,主要研究方向:大数据;于㊀泉(1991-),男,学士,高级工程师,主要研究方向:数据挖掘㊂通讯作者:董雷刚㊀㊀Email:Lgdong010@163.com收稿日期:2023-02-210㊀引㊀言科技的发展产生了海量的数据信息,在移动通信和互联网技术快速发展的背景下,用户对互联网中的数据信息提出了具有特定的查询需求㊂2001年,Börzsönyi等人在文献[1]中首次将skyline查询应用于数据库领域,作为一种高效的数据检索方式,被广泛应用于多目标决策㊁市场分析和数据挖掘等多个领域中㊂Skyline查询的结果为一组skyline对象,这些skyline对象均不能被同一数据集中其它任何对象支配㊂在实际应用中,用户对查询的要求越来越多,现有的空间文本skyline查询算法在计算时考虑的因素较少,无法满足用户需求㊂例如,用户计划在某天晚上与朋友聚餐,需要预定一个20:00-22:00时间段可以营业㊁距离火车站近㊁价格低㊁服务质量好,且最好拥有停车场的饭店㊂在表1中列出了4个饭店的信息,包含了饭店到查询点的空间距离㊁饭店的人均消费价格㊁用户评分㊁关键词信息以及营业时间㊂表1㊀饭店信息Tab.1㊀Hotelinformation饭店名称空间距离/Km人均价格/元用户评分关键词营业时间a3.6908停车场㊁空调5:30-9:00b4607wifi㊁空调10:00-22:00c2.2908停车场22:00-3:00d4.5807wifi㊁停车场11:00-14:00㊁17:30-24:00㊀㊀由于此类查询同时包括空间位置㊁数值型信息㊁关键词以及时间4个属性,以往的空间文本skyline查询不能直接解决此类问题㊂如,文献[2]中提出了空间多关键词skyline查询算法SKS,将空间距离和文本相似度相结合,建立了加权距离的空间文本支配模型㊂SKS算法主要考虑了加权距离和数值型属性,并没有考虑时间属性对查询结果的影响㊂文献[3]中提出了已知时间的空间文本skyline查询TSTSQ,TSTSQ中考虑了查询点和对象间的空间距离㊁查询关键词与对象包含的关键词间的文本相关性以及查询时间段和对象包含时间段的时间相关性3个属性㊂在查询时通过计算空间文本相关性函数kd(q,o)和时间文本相关性函数kt(q,o)来判断对象间的支配关系㊂然而,此查询并没有考虑数值型信息对查询结果的影响,查询结果集具有一定的缺陷㊂当前文献考虑的都是时间㊁空间距离㊁数值型信息和关键词中的若干个因素,并没有将这4个因素同时考虑进去进行研究,而同时考虑这4个因素后将会为用户返回更适合用户偏好的结果集㊂基于此,本文将时间㊁空间距离㊁数值型信息和关键词几个因素相结合,提出一种基于时间的空间文本关键词skyline查询,构建基于时间的空间文本关键词skyline查询的索引结构以及查询算法,满足用户更多和更具体的查询需求㊂1㊀相关工作最开始对skyline查询的研究是以数值型属性为支配判断条件找到最优候选集,文献[4]中介绍了最近邻NN算法和分支界限BBS算法,其中,最近邻搜索策略是基于R∗-Tree索引对象,BBS算法是在NN算法的基础上进行改进,BBS算法只对可能包含skyline点的R树节点进行访问,不会重复检索,其内存开销明显小于NN算法㊂然而,上述查询没有考虑空间属性对查询结果的影响㊂随着进一步的研究,文献[5]考虑了空间属性,提出了欧式空间和路网空间中的skyline查询问题;文献[6]中将K-支配应用到道路网skyline查询中,提出了道路网环境下K-支配空间skyline查询方法,来处理多属性数据对象㊂在实际应用中只考虑空间属性并不能满足用户的偏好性需求,用户的偏好性需求一般通过关键词等文本信息来描述,文献[7]提出将空间位置和查询关键词作为查询条件,使用Voronoi进行空间数据管理,建立路网中每个点的主导区域来求解最优查询结果㊂考虑在实际应用中欧式距离的局限性,文献[8]提出了基于曼哈顿距离的空间skyline查询;文献[9]提出使用R∗树索引空间和文本数据,文本数据采用倒排文件索引结构,并添加到R∗树上,该索引结构插入数据的速度比R树快,并且比传统的空间索引花费时间少;文献[10]提出了加权空间skyline查询,每个兴趣点都有不同的重要性,给每个兴趣点分配不同的权重,并使用加权欧几里得距离来获取skyline点集㊂以上文献虽然在一定程度上解决了skyline查询和空间文本skyline查询等问题,但随着用户的偏好性需求不断增加,以往的skyline查询已经不能满足用户的需求,需要考虑其他因素对查询结果的影响㊂在移动互联网环境下,文献[11]将方向这一属性应用到空间skyline查询中,提出了基于方向的空间skyline,该查询从不同方向检索最优候选对象,查询结果为不同方向上的skyline对象,并提出了伪skyline的概念,如果某一方向上没有skyline对象,则用伪skyline对象替代㊂考虑到用户社交对查询的影响,文献[12]提出了基于社交的空间文本skyline查询,设计了新的评价函数来计算用户的社交相关性㊂为了提高查询结果的质量,引入了受限skyline,当skyline查询返回的结果少于设定的阈值时,需要进行受限skyline查找,最后返回的是skyline对象和受限skyline对象㊂文献[13]将空间关键字查询与社交数据相结合,提出了路网地理社交top-k和skyline关键词查询,通过对象的空间信13第6期李晨阳,等:基于时间的空间文本关键词skyline查询息㊁文本信息和社交网络信息来进行查询㊂考虑到时间在查询中的重要作用㊂文献[14]将时间信息与空间关键词查询结合,同时考虑对象与查询点之间的位置相关性㊁文本相关性和时间相关性,并且定义了两个评价函数来满足用户的不同需求㊂文献[15]提出了在路网中有效处理具有时变属性的对象的skyline查询问题㊂文献[16]将时间属性应用到Top-k查询中,根据用户的空间位置和时间,为用户返回k条旅行时间最短的路线㊂综上所述,现有算法并不能解决带有时间的空间文本关键词skyline查询问题,因此本文提出一种基于时间的空间文本关键词skyline查询,获得那些在时间㊁空间㊁文本㊁数值4个方面具有最优表现的对象集合,以满足用户更具体的偏好需求㊂2㊀问题定义为了清晰地判断对象间的支配关系,本节将着重介绍查询点q与对象o之间的空间距离㊁关键词相关性㊁时间相关性以及时空关键词相关性的评价函数㊂2.1㊀空间距离SD(q,o)=d(q,o)(1)㊀㊀其中,d(q,o)表示查询点和对象点间的欧式距离,则查询点与对象点间的空间距离就是两点间的欧式距离㊂2.2㊀关键词相关性假设查询关键词有n个,对象包含的关键词有m个,则有㊀㊀㊀㊀㊀㊀㊀㊀KR(q,o)=ðni=1Vi(2)Vi=ωiqkiɘokjʂ00qkiɘokj=0{iɪ1,n[],jɪ1,m[]()(3)其中,|qkiɘokj|ʂ0表示查询关键词与对象包含的关键词相交;|qkiɘokj|=0表示查询关键词与对象包含的关键词不相交;ωi表示查询关键词的权重㊂每个查询关键词的权重有两种设定情况,一是由用户根据偏好对每个查询关键词进行设定,其二是默认所有查询关键词的权重相等㊂Vi表示每个查询关键词与对象包含的关键词的相关性,则关键词相关性就是每个查询关键词与对象包含的关键词的相关性之和㊂以表1中包含的对象为例,其中包含了饭店到查询点的空间距离㊁饭店的人均消费价格㊁用户评分㊁关键词信息以及营业时间等信息㊂假设用户查询的关键词为 wifi 和 空调 ,关键词的权重根据用户的偏好设定,设用户对 wifi 的偏好权重为0.6,对 空调 的偏好权重为0.4,则对象a㊁b㊁c㊁d的关键词相关性分别为0.4㊁1㊁0㊁0.6,如果用户没有设置关键词的权重,则默认所有查询关键词的权重相等,此时对象a㊁b㊁c㊁d的关键词相关性分别为0.5㊁1㊁0㊁0.5㊂2.3㊀时间相关性TC(q,o)=qtqɘotqqtq(4)㊀㊀其中,|qtqɘotq|表示查询时间段与对象包含的时间段之间相交的数值,|qtq|表示查询时间段的数值,则时间相关性就是查询时间段和对象包含的时间段间相交的数值与查询时间段的数值的比值㊂以表1中包含的对象为例,假设用户查询的时间段是20:00-22:00,则对象a㊁b㊁c㊁d的时间相关性分别为0㊁1㊁0㊁1㊂为了对某个对象的空间距离㊁关键词相关性及时间相关性有一个综合评价,本文提出了时空关键词相关性函数来衡量一个对象同时在空间㊁时间㊁文本上的优劣程度㊂其中,α是一个平衡系数,用来平衡关键词相关性与时间相关性间的权重,在没有用户设定的情况下,默认二者权重相等㊂本文设定时空关键词相关性的数值越小对象越优㊂2.4㊀时空关键词相关性㊀TSKR(q,o)=SD(q,o)αKR(q,o)+(1-α)TC(q,o)(5)㊀㊀以表1中包含的对象为例,假设用户查询的关键词为 wifi 和 空调 ,用户查询的时间段是20:00-22:00,默认所有查询关键词的权重相等㊂根据计算,对象c的关键词相关性为0,对象a和对象c的时间相关性都为0㊂因此,对象a㊁c不必进行计算可以根据算法提前裁剪,而对象b㊁d的时空关键词相关性分别为4㊁6,说明对象b优于d㊂定义1(数值型信息支配)㊀给定数据集中具有n维数值型属性的任意两个对象oi㊁oj,如果oi在其m维数值型属性中至少有一维属性优于oj,则称在m维数值型属性上oi支配oj,记为oi≺NIoj㊂本文设定数值型属性的数值越小对象表现越优,但在表1中用户评分属性一般是数值越大越好㊂如果遇到某一数值型属性值越大对象越优的情况,则先将对象o进行预处理:oiᶄ=maxi-oi,其中maxi表示第i维数值型属性的最大值,oi表示对象o在第i维数值型属性的取值㊂23智㊀能㊀计㊀算㊀机㊀与㊀应㊀用㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第13卷㊀定义2(基于时间的空间文本关键词支配)㊀给定查询点q和空间数据集D中的任意两个对象oi㊁oj,如果oi㊁oj同时满足oi≺NIoj且TSKR(q,oi)ɤTSKR(q,oj),则称oi基于时间的空间文本关键词支配oj,记为oi≺TSTKoj㊂以表1中包含的对象为例,假设用户需要预定晚上20:00-22:00与其当前位置距离近㊁价格低㊁服务质量好,最好拥有 wifi 和 空调 的饭店㊂根据计算对象b㊁d的时空关键词相关性分别为4㊁6,并且根据对象b和d的数值型信息可知b≺NId,所以由定义2可知,b≺TSTKd㊂定义3(基于时间的空间文本关键词skyline)㊀给定一个数据集D,基于时间的空间文本关键词skyline就是从该数据集中返回那些不能被其它任何对象支配对象的集合㊂即,当且仅当∀oᶄɪD㊁oᶄɲTSTKo时oɪTSTKS㊂由定义2中的例子可得,基于时间的空间文本关键词skyline为{b}㊂3㊀STTR-Tree索引为了高效地获取skyline对象,需要建立相关索引结构㊂虽然R-Tree[17]是一种经典的空间索引数据结构,但其只包含对象的空间信息,随后学者们又提出了IR-Tree[18]㊁IR2-Tree[19]等空间索引,也不能同时存储对象的空间㊁数值型信息㊁关键词及时间等信息㊂因此,本文提出一种可以同时存储对象的空间㊁数值型信息㊁关键词及时间等信息的STTR-Tree索引㊂STTR-Tree索引结构如图1所示㊂11010101110111111001111111010100010101010001010110011011I n v e r t e d F i l e -N 1I n v e r t e d F i l e -N 2I n v e r t e d F i l e -N 3I n v e r t e d F i l e -N 4N 5N 6S Fm b r c n pT i m eN u mT e x t P -N 4N u mT e x t P -N 3N u mT e x t P -N 2N u mT e x t P -N 1s fl o c a t i o n i d t i m eN 1N 2N 3N 4O 1O 2O 5O 4O 6O 3O 8O 7O 9O 10图1㊀STTR-Tree索引Fig.1㊀STTR-Treeindex㊀㊀STTR-Tree索引中叶子结点主要包含以下信息:对象的空间位置信息(location)㊁对象在数据集中的标识符(id)㊁对象包含的时间段信息(time)㊁指向该结点的文件倒排表的指针(InvertedFile)㊂文件倒排表中的关键词是由该结点包含的所有对象关键词的并集组成㊂对象o1㊁o2㊁o4㊁o5㊁o6包含的时间段信息见表2,叶子结点的文件倒排表见表3㊂表2㊀对象的时间段信息Tab.2㊀Timeperiodinformationofobjects对象时间段O16:00-8:00O29:00-12:00O410:00-17:00O58:00-20:00O618:00-24:00表3㊀叶子结点文件倒排表Tab.3㊀InvertedlistofleafnodefilesInvertedFile-N1InvertedFile-N2InvertedFile-N3InvertedFile-N4k1:o1㊁o2k1:k1:k1:o9㊁o10k2:o5k2:o6k2:k2:k3:k3:k3:k3:k4:o2㊁o5k4:o4k4:o3㊁o8k4:o7k5:k5:k5:k5:o9㊁o10k6:o1㊁o5k6:o4k6:o8k6:k7:k7:k7:k7:o7㊁o9k8:k8:o4㊁o6k8:o3k8:o9㊀㊀图1中,sf表示该结点对应的签名文件,结点的签名文件是由该结点中所有对象的签名文件进行or操作产生㊂在STTR-Tree中,假设签名文件为一串33第6期李晨阳,等:基于时间的空间文本关键词skyline查询8位的二进制码,通过设定的hash函数将关键词映射到每一位二进制码中㊂如果二进制码中的位为1,则表示该位包含对应的关键词,若二进制码中的位为0,则表示该位不包含对应的关键词㊂例如,在STTR-Tree中,假设o1㊁o2㊁o5的签名文件分别为10010000㊁01000100㊁00010100,将o1㊁o2㊁o5的签名文件进行or操作,生成结点N1的签名文件11010100㊂同理,其它结点以同样的方式生成相应的签名文件㊂算法在执行查询过程时,首先查询关键词与结点包含的关键词进行匹配,将查询关键词的签名文件与结点包含的签名文件执行and操作,若两个二进制签名文件执行and操作的结果与查询关键词生成的二进制签名文件相同,则表示该结点包含查询关键词,反之则不包含㊂例如,查询关键词生成的签名文件为00000101,对于STTR-Tree根节点,将查询签名文件与根结点的签名文件进行and操作,00000101and11011111=00000101,此结果表示根结点包含查询关键词㊂NumTextP表示指向该结点的数值型信息的指针,结点的数值型信息同时包含了该结点的所有对象的数值型信息㊂叶子结点的数值型信息见表4㊂表4㊀数值型信息Tab.4㊀NumericalinformationNumTextP-N1对象名称人均价格用户评分NumTextP-N2对象名称人均价格用户评分NumTextP-N3对象名称人均价格用户评分NumTextP-N4对象名称人均价格用户评分O1778.5O4558.5O3959.2O7667.5O2658.8O6717.6O81109.5O9527.1O5819O10738.2㊀㊀非叶子结点主要包含以下信息:该结点所有子结点的最小边界矩形(mbr)㊁指向该结点的子结点指针(cnp)㊁该结点包含的所有子结点时间段的并集(Time)㊁该结点对应的签名文件(SF),结点的签名文件是由所有子结点的签名文件进行or操作产生的㊂结点N1㊁N2㊁N5包含的时间段信息见表5㊂表5㊀结点的时间段信息Tab.5㊀Timeperiodinformationofnodes结点时间段N16:00-20:00N210:00-17:00㊁18:00-24:00N56:00-24:004㊀算法描述本节根据STTR-Tree索引提出了TSTKSQ的裁剪策略和算法㊂TSTKSQ算法在遍历STTR-Tree索引时,先判断结点是否在查询范围之内,然后将结点包含的关键词和时间段信息与查询关键词和时间段信息进行相交判定;算法从空间㊁关键词和时间3个属性对空间数据集上的对象进行过滤;当算法遍历至叶子结点时,将筛选出关键词相关和时间相关的对象进行数值型信息支配和基于时间的空间文本关键词支配关系判断,最终获取查询结果集㊂4.1㊀裁剪策略TSTKSQ算法在遍历STTR-Tree索引时,对结点采用如下裁剪策略:(1)若查询关键词与结点包含的关键词不相交,则不必进行时间段相交的判断,直接将结点进行剪枝㊂(2)若查询时间段与结点包含的时间段不相交,则不必进行关键词相交的判断,直接将结点进行剪枝㊂(3)若同时满足查询关键词与结点包含的关键词相交,以及查询时间段与结点包含的时间段相交,则对其子结点进行重复判断,直到筛选出满足条件的候选对象,否则将结点进行剪枝㊂在基于STTR-Tree的查询算法和裁剪算法中,本文使用优先队列对候选集C和结果集R进行维护,优先队列中的对象按照TSKR的非递减顺序出队列㊂定理1[3]㊀在按照TSKR的非递减顺序出队列的优先队列中,首个出队列的对象o必为skyline对象㊂定理2㊀给定数据集中的任意两个对象oi㊁oj,如果oi与oj之间不存在数值型信息支配,则oi与oj之间也不存在基于时间的空间文本关键词支配㊂证明㊀由于oi与oj之间不存在数值型信息支配关系,根据定义2可知,oi与oj之间不能同时满足oi≺NIoj且TSKR(q,oi)ɤTSKR(q,oj),所以oi与oj之间也不存在基于时间的空间文本关键词支配㊂43智㊀能㊀计㊀算㊀机㊀与㊀应㊀用㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第13卷㊀例如,表1中的对象a和b,由于a在用户评分这一属性上支配b,而b在人均价格这一属性上支配a,所以二者不存在数值型信息支配关系,因此二者也不存在基于时间的空间文本关键词支配关系㊂定理3[3]㊀在按照TSKR的非递减顺序出队列的优先队列中,若已出队列的对象为o,在o之后出队列的任意对象为oᶄ,必有oᶄɲTSTKo㊂定理4㊀在按照TSKR的非递减顺序出队列的优先队列中,设先出队列的对象为o,后出队列的对象为oᶄ,若oi≺NIoᶄ,则o≺TSTKoᶄ㊂证明㊀根据优先队列的性质可知,TSKR(q,o)ɤTSKR(q,oᶄ),根据定义2可知,o≺TSTKoᶄ㊂例如定义2中的例子,对象b和d的TSKR分别为4㊁6,因此先出队列的对象为b,后出队列的对象为d,又因为b≺NId,所以b≺TSTKd㊂在基于STTR-Tree的TSTKSQ算法中,本文对候选对象采用如下裁剪策略:按照TSKR的非递减顺序出队列的优先队列中,设当前出候选集队列的对象为o,当前结果集中的任一对象为sp,若sp≺NIo,则裁剪o,否则将对象o放入结果集中㊂证明㊀根据优先队列的性质可知,TSKR(q,sp)ɤTSKR(q,o),若sp≺NIo,根据定义2可知sp基于时间的空间文本关键词支配o,此时对象o可以被裁剪,反之,若sp与o之间不存在数值型信息支配关系,根据定理2,sp与o之间也不存在基于时间的空间文本关键词支配,所以o为skyline对象,放入结果集中㊂4.2㊀算法算法1㊀TSTKSQ算法输入㊀查询点q㊁查询关键词qk㊁查询时间段qtq㊁查询范围r㊁STTR-Tree索引㊁空间对象点集O输出㊀查询结果集R1㊀R=∅;C=∅;㊀//R存放查询结果集,C存放候选集2㊀WhilenotStack.isEmpty()do㊀//以深度优先遍历索引3㊀㊀N=Stack.pop();4㊀㊀Ifd(q,N)<r㊀//若结点在查询范围之内5㊀㊀IfqkɘNkʂ∅//若查询关键词与结点包含的关键词相交6㊀㊀IfqtqɘNtqʂ∅//若查询时间段与结点包含的时间段相交7㊀㊀IfN.isLeaf()then8㊀㊀㊀ForeachoinNdo9㊀㊀㊀Ifqkɘokʂ∅10㊀㊀㊀Ifqtqɘotqʂ∅11㊀㊀㊀CѳNewPriorityQueue;//按照TSKR的非递减顺序初始化优先队列12㊀㊀㊀C.Enqueue(o);㊀//将对象o放入候选集优先队列中13㊀㊀㊀Else14㊀㊀㊀Stack.push(N.ChildNode);㊀//将孩子结点进栈15㊀endWhile16㊀RѳNewPriorityQueue;㊀//按照TSKR的非递减顺序初始化优先队列17㊀R=dominateCompting(q,C);㊀//对候选集中的对象进行支配计算18㊀returnR;算法1是基于时间的空间文本关键词skyline查询的具体过程㊂第2-3行以栈的方式维护索引,第4-7行对查询范围内的结点进行判断,筛选出查询关键词与结点包含关键词相交以及查询时间段与结点包含时间段相交的结点,直到遍历至叶子结点㊂第8-12行遍历叶子结点,筛选出查询关键词与对象包含关键词相交以及查询时间段与对象包含时间段相交的对象,将对象放入TSKR的非递减候选集优先队列中㊂第16-18行将候选集中的对象进行支配计算,把不被支配的对象放入结果集队列中㊂由于第17行中dominateCompting()算法需要判断所有候选对象间的支配关系,导致算法整体查询效率下降,因此需要加入高效的裁剪策略来提升查询效率㊂算法2㊀dominateComputing()算法输入㊀候选集C㊁查询点q㊁查询关键词qk㊁查询时间段qtq输出㊀查询结果集R1㊀RѳgetCFirst();㊀//将C中首个出队列对象放入结果集中2㊀WhilenotC.isEmpty()do3㊀㊀o=C.Dequeue();4㊀㊀IfspNumericTypeDominateo㊀//判断结果集中的对象sp是否数值型信息支配对象o5㊀㊀㊀contine;6㊀㊀Else7㊀㊀㊀insertointoR8㊀endWhile53第6期李晨阳,等:基于时间的空间文本关键词skyline查询9㊀returnR算法2是判断候选集对象间支配关系的裁剪算法㊂第1行是将候选集中首个出队列对象放入结果集中㊂第2-3行若候选集队列非空时,依次取出候选集中的对象进行判断,第4-7行若候选对象被结果集中的对象基于时间的空间文本关键词支配则删除候选对象,否则将对象放入结果集中㊂以图1㊁表2 表5中包含的数据为例,假设查询关键词为k1㊁k2㊁k4,生成对应二进制签名文件为11010000,查询时间段为10:00-12:00,默认各结点在查询范围之内,并且数值型属性的要求为人均价格低㊁用户评分高㊂具体查询过程如下:首先,筛选出查询关键词和查询时间与对象的关键词和时间相交的候选对象㊂从根节点开始,将查询二进制签名文件与结点包含的签名文件进行and操作,11010000and11011111=11010000表示根节点包含查询关键词,并且根节点的时间段包含查询时间段,然后对其孩子结点进行重复判定,11010000and11010101=11010000表示结点N5包含查询关键词,并且结点N5的时间段包含查询时间段,11010000and10011111=10010000表示结点N6不包含查询关键词,则对N6及其孩子结点进行裁剪,不必进行后续判定提高了查询效率,继续对结点N5的孩子结点N1㊁N2进行判断,11010000and11010100=11010000表示结点N1包含查询关键词,并且结点N1的时间段包含查询时间段,11010000and01010101=01010000表示结点N2不包含查询关键词,直接进行剪枝,此时得到叶子结点N1中的对象o1㊁o2㊁o5,由于o1的时间段与查询时间段不相交,删除o1,而o2㊁o5满足查询关键词与查询时间都相交,此时得到候选集对象o2㊁o5㊂之后,判断候选对象间的支配关系㊂假设查询点与对象o2㊁o5的空间距离分别为1㊁2,根据计算o2㊁o5的TSKR分别为1.2㊁2.4,将o2㊁o5按照TSKR的非递减顺序放入候选集队列中,将第一个出队列的对象o2直接加入结果集中,然后o5出队列,由于o2与o5间不能构成数值型信息支配,因此将o5加入结果集中,此时遍历完所有候选对象,得到最终结果集{o2㊁o5}㊂5㊀实验结果与分析实验采用的硬件设备为64位Windows10操作系统,Intel(R)Core(TM)i5-7200UCPU@2.50GHz处理器,8G内存;采用Java语言实现算法,集成开发环境为IntelliJIDEACommunityEdition2021.1.3,JDK版本为11.0.11㊂实验数据来源于yelp网站的开源数据集,该数据集中包括克利夫兰㊁多伦多等11个城市150346个商户的信息㊂实验将数据集中的经纬度作为对象的空间位置信息,价格㊁星级等作为对象的数值型信息,商户的分类作为对象的关键词信息,营业时间作为对象的时间信息㊂通过是否使用裁剪策略TSTKSQ与NTSTKSQ测试算法的有效性,每次测试均取相同环境下10次测试的平均值为最终结果㊂5.1㊀查询关键词数量的影响为了测试查询关键词的数量对算法的影响,设置数值型属性为2维,查询点的空间位置和查询时间段固定不变,查询关键词1 5个㊂查询关键词数量变化对算法的影响如图2所示㊂18001500120090060030012345关键词的数量时间/msT S T K S Q N T S T K S Q图2㊀查询关键词数量的影响Fig.2㊀Impactofthenumberofquerykeywords㊀㊀从图2中可知,随着查询关键词数量的增加,算法整体的运行时间也不断增加㊂对于不使用裁剪策略NTSTKSQ进行查询时,算法需要遍历所有数据集中的对象,将查询关键词与每个对象包含的关键词一一比较,直到筛选出所有包含查询关键词的对象,而随着查询关键词数量的增加,包含查询关键词的对象也越来越多,因此整体查询时间呈上升趋势,而使用裁剪策略TSTKSQ进行查询时,算法的查询时间明显少于使用裁剪策略NTSTKSQ的查询时间㊂由于使用裁剪策略TSTKSQ时,算法根据STTR-Tree结点的签名文件进行操作时,提前裁剪了不包含查询关键词的结点,不必进行后续的判断,因而极大地提升了算法的执行效率㊂5.2㊀数值型属性维度的影响为了测试数值型属性维度对算法的影响,设置了2个查询关键词,查询点的空间位置和查询时间段固定不变,数值型属性维度从1维变化到5维㊂数值型属性维度的变化对算法的影响如图3所示㊂63智㊀能㊀计㊀算㊀机㊀与㊀应㊀用㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第13卷㊀。

skyline服务查询

skyline服务查询

Skyline服务查询实验实验内容:应用BNL算法和SFS算法对QWS数据集进行skyline服务查询算法介绍及实现:➢BNL算法该算法首先在内存中开辟有一块窗口,用于存放从文件中读入的疑似是SP的数据。

还有临时文件T,当内存中的窗口满时,原本需要插入到窗口中的点将被保存在临时文件中。

算法的流程如下:从存放需要查询的数据的文件F中,读取一个数据点p,与窗口中的所有点比较(如果窗口为空,则直接插入),根据比较结果不同执行下面三种操作。

●窗口中存在一点q,q点支配p点,则p点不可能是SP成员,将p点丢弃。

●p点支配窗口中的一个或多个点,则被p点支配的所有点不可能是SP成员,将它们删去。

●p点与窗口内所有的点都不相互支配,若窗口的容量仍够存放p点则插入p点,否则将p点插入临时文件T中。

当所有点都读取完并执行完上述操作时,窗口中在临时文件中加入第一个点之前就已经加入的点作为SP输出。

将临时文件T作为数据来源,即作为存放需要查询的数据的文件F,新建一个空白的临时文件T',从1开始循环执行该过程。

知道所有的点或者被丢弃,或者被作为SP输出。

具体实现(python):def BNL(len1,len2,data_array):reslist = []for i in range(len1):if len(reslist) == 0:reslist.append(i)else:deletelist=[]remain = Truefor k in reslist:kqicnt = 0iqkcnt = 0for t in range(len2):if data_array[i][t] >= data_array[k][t]:iqkcnt = iqkcnt + 1if data_array[i][t] <= data_array[k][t]:kqicnt = kqicnt + 1if kqicnt == 9:remain = Falsebreakif iqkcnt == 9:deletelist.append(k)if len(deletelist) > 0:reslist = [reslist[p] for p in range(0, len(reslist), 1 ) if p not in deletelist]if remain:reslist.append(i)return reslist➢SFS算法在BNL的基础上先对数据进行预处理(排序),使得加入的点一定是SP,减少删除的开销具体实现(python):def SFS(data,len1,len2):reslist = []reslist.append(0)for i in range(1,len1):remain = Truefor k in reslist:kqicnt = 0for t in range(len2):if data[i][t] <= data[k][t]:kqicnt = kqicnt + 1if kqicnt == 9:remain = Falsebreakif remain:reslist.append(i)return reslistQoS服务数据randdataset产生的Qos服务数据集放在了QoSdata文件中,通过传入该数据集检验上面的算法实验结果分析:BNL运行结果(数据较多,截图不全):SFS运行结果(数据较多,截图不全):运行速率分析BNL算法:SFS算法:。

《外包空间数据库中范围和移动k近邻skyline的查询验证》

《外包空间数据库中范围和移动k近邻skyline的查询验证》

《外包空间数据库中范围和移动k近邻skyline的查询验证》篇一一、引言随着空间数据库的广泛应用,对外包空间数据库中范围和移动k近邻查询的需求日益增长。

Skyline查询作为一种重要的空间查询技术,能够有效地找出给定空间范围内的多个目标对象,以构建多维度的轮廓(Skyline)进行信息可视化与挖掘。

本篇论文主要讨论如何对外包空间数据库中范围和移动k近邻的Skyline查询进行验证,以保障查询的准确性和高效性。

二、外包空间数据库与Skyline查询概述外包空间数据库(Outsourced Spatial Database)是一种将空间数据存储在云端或外部服务器上的数据库系统。

其优点在于可以充分利用云计算资源,提高数据处理和存储的效率。

Skyline查询则是一种基于空间对象的多维轮廓查询技术,它能够找出给定空间范围内的多个目标对象,并将它们根据一定规则组合成轮廓图谱。

这种查询技术常用于空间数据分析、地图生成等场景。

三、范围和移动k近邻Skyline查询范围和移动k近邻Skyline查询是外包空间数据库中常见的两种查询需求。

其中,范围k近邻查询是指在给定空间范围内,查找距离指定目标点最近的k个点;而移动k近邻查询则是指在一段时间内,找出离移动点最近的k个点。

这两种查询都需要利用Skyline技术来构建多维度的轮廓图谱,以支持后续的信息挖掘和可视化工作。

四、查询验证方法为了保障外包空间数据库中范围和移动k近邻Skyline查询的准确性和高效性,我们需要采用一系列的验证方法。

首先,我们可以通过设计合理的测试用例来验证查询的正确性。

这些测试用例应该涵盖不同的空间范围、目标点、距离等参数条件,以确保在各种情况下都能得到正确的结果。

其次,我们可以利用已有的数据集进行验证,通过将我们的查询结果与已知的正确结果进行比较,来评估我们的算法性能和准确性。

此外,我们还可以采用一些性能评估指标来衡量我们的算法在处理大规模数据时的效率。

《2024年外包空间数据库中范围和移动k近邻skyline的查询验证》范文

《2024年外包空间数据库中范围和移动k近邻skyline的查询验证》范文

《外包空间数据库中范围和移动k近邻skyline的查询验证》篇一一、引言随着大数据时代的来临,空间数据库的应用越来越广泛。

在处理空间数据时,范围查询和移动k近邻查询是两种常见的操作。

同时,Skyline查询作为一种多维度数据查询的重要手段,在空间数据库中也有着广泛的应用。

本文将探讨外包空间数据库中范围和移动k近邻Skyline的查询验证问题,旨在为相关领域的研究和应用提供参考。

二、范围查询的验证范围查询是空间数据库中常见的一种查询方式,其目的是在给定的空间范围内查找满足条件的数据。

为了验证范围查询的准确性,我们需要从以下几个方面进行考虑:1. 查询准确性的评估:通过对比实际查询结果与预期结果,评估范围查询的准确性。

这需要借助一定的评估指标,如准确率、召回率等。

2. 空间索引的优化:空间索引是提高范围查询效率的关键。

我们需要根据数据的特点和查询需求,选择合适的空间索引策略,如R树、四叉树等,并对其性能进行优化。

3. 查询性能的评估:通过对比不同查询策略的执行时间、内存消耗等指标,评估范围查询的性能。

这有助于我们选择最优的查询策略,提高查询效率。

三、移动k近邻查询的验证移动k近邻查询是一种动态的查询方式,用于在移动对象周围查找k个最近的邻居。

为了验证移动k近邻查询的准确性,我们需要关注以下几个方面:1. 移动对象的数据处理:在移动k近邻查询中,移动对象的数据处理至关重要。

我们需要设计合适的数据结构,如轨迹点列表、空间索引等,以支持动态的查询需求。

2. 查询算法的优化:针对移动k近邻查询,我们需要设计高效的查询算法。

这包括计算移动对象与其它对象的距离、选择合适的邻居等操作。

通过优化算法,可以提高查询的准确性和效率。

3. 实时性的保证:移动k近邻查询要求系统能够实时地返回结果。

因此,我们需要关注系统的实时性,确保在短时间内完成查询并返回结果。

四、Skyline查询的验证Skyline查询是一种多维度数据查询的重要手段,用于查找在多个维度上均优于其他数据的数据集。

《2024年外包空间数据库中范围和移动k近邻skyline的查询验证》范文

《2024年外包空间数据库中范围和移动k近邻skyline的查询验证》范文

《外包空间数据库中范围和移动k近邻skyline的查询验证》篇一一、引言随着空间数据库技术的不断发展,外包空间数据库已成为现代信息处理领域的重要研究课题。

在空间数据库中,范围查询和移动k近邻查询是两种常见的查询需求。

Skyline查询则是一种能够获取多维空间中对象之间关系的重要技术。

本文旨在探讨外包空间数据库中范围和移动k近邻的Skyline查询验证方法,以及相应的技术和应用场景。

二、背景介绍随着空间数据规模的扩大和数据处理技术的快速发展,外包空间数据库得到了广泛的应用。

范围查询、移动k近邻查询以及Skyline查询作为空间数据库的三大关键查询需求,具有非常重要的实际意义。

然而,对于如何在这些复杂的多维空间数据中进行有效的查询验证仍然是一个亟待解决的问题。

三、外包空间数据库的范式和基础概念3.1 外包空间数据库概述外包空间数据库是指将部分或全部的空间数据存储在外部服务器上,通过分布式计算和存储技术实现对空间数据的处理和查询。

这种技术能够有效地解决大规模空间数据处理和存储的问题。

3.2 范围查询和移动k近邻查询范围查询是指在给定的一组数据中,找出满足某种空间范围的点。

而移动k近邻查询则是对于某一特定点的移动路径上,查找与其最近的k个邻居。

这两种查询是空间数据库中的常见需求,广泛应用于许多领域如路径规划、目标跟踪等。

3.3 Skyline查询概念Skyline查询是一种在多维空间中获取对象之间关系的重要技术。

它能够找出在给定方向上具有最高可见度的点集,即Skyline 点集。

Skyline查询在许多领域如城市规划、交通规划等都有广泛的应用。

四、范围和移动k近邻Skyline的查询验证方法4.1 范围查询的验证方法针对范围查询的验证方法主要包括以下几步:首先,确定要查询的空间范围;其次,执行范围查询操作,获取结果;最后,将结果与预期结果进行对比验证。

这需要依赖有效的数据集和准确的算法来实现。

4.2 移动k近邻的查询验证方法对于移动k近邻的查询验证,除了与范围查询相似的步骤外,还需要关注点移动后的近邻变化情况。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
空间Skyline查询
汇报人:刘晴晴 日 期:2016年10月6日
主要内容
1. 研究背景 2
2. 提出问题及相应的准备工作
3. 解决问题的方法 4. 总结
1. 研究背景
很多研究不同问题的老师想利用他们吃饭的时间一起 开发一个项目,但他们在不同的地方工作,这个开会地点 的选择需要顾及每一位成员,考虑到时间问题,希望餐厅 距离每一位成员的距离能小于r,在选择的时候发现很难有 这样一家餐厅。如果这几位成员的位置是移动的寻找这样 的一个餐厅就更具挑战了。 假设把所有餐厅的信息装入一个数据库,老师们都在 学校工作(地点固定),这个查找过程就是静态Skyline项 目,仅取决于数据库本身,但是在用户移动的情况下,餐 厅位置的选择就不仅取决于数据库本身还取决于用户的位 置,这就是一个空间查询,需要使用空间Skyline查询。
主要内容
1. 研究背景 2
2. 提出问题及相应的准备工作
3. 解决问题的方法 4. 总结
2.1提出问题定义
那什么样的查询是空间Skyline查询呢?
给一些数据点P 和一些查询点Q, 如上述问题中的成员 和餐厅,每个数据点到每个查询点都有一段距离。 SSQ 检 索这些点P,找到没有被别的点控制(取代)的点,即得到 查询区域内的数据点。这与普通Skyline最主要的区别是空 间Skyline查询依赖查询点的位置Q。用户的位置在变化相应 的查询点也在变化。
2.2 .2 理论
2.2 .2 理论
2.2 .2 理论
主要内容
1. 研究背景 2
2. 提出问题及相应的准备工作
3. 解决问题的方法 4. 总结
3.解决问题的方法
2 解决方法
Branch-and-Bound Spatial Skyline Algorithm(B2S2) 分值界定空间轮廓算法
2.1.2 空间Skyline查询
总的来说,空间轮廓查询 (SSQ)是查找给定集合P关 于查询集Q的空间轮廓点
2.2 准备工作
图:Voronoi图 Delaunay图 凸包
准备工作
理论前提: 两个引理 三个定理
2.2.1 图
Voronoi图
The region corresponding to the point p ∈P contains all the points x ∈ Rd for which we have
2.1提出问题定义
普通Skyline查询Fra bibliotekdefine
空间Skyline查询
2.1.1普通Skyline查询
Given the two points p=(p1, . . . , pd) and p=(p1, . . . , pd) in Rd, p dominates p iff we have pi ≤ p,i for 1 ≤ i ≤ d and pj < p,j for some 1 ≤ j ≤ d. To illustrate, in Figure 1b the point f=(3, 75) dominates the point d=(4, 125). Now,given a set of points P, the skyline of P is the set of those points of P which are not dominated by any other point inP. The skyline of the points shown in Figure is the set S = {a, c, e}.
Voronoi-based Spatial Skyline Algorithm(VS2) 基于Voronoi图的空间 Skyline算法
3.1 B2S2
对于每一个点p我们定义 mindist(p,A)为p点到A区域中所 有点的最小距离之和。右图中, 先用两个最小面积的矩形框包 住所有数据点p,然后递归的缩 小范围,得到离A最近的几个区 域,最后通过计算mindist(e,A), mindist(p,A),得到在查询区域内 的三个数据点。即 S(Q)={p1,p2,p3}
谢 谢!
p代表数据点,q代表查询点,N代表区域,e代表最小包围盒,S(Q)表示 关于查询q的空间轮廓点,整个过程用R-树表示如上图
3.1 B2S2
B2S2 算法的伪代码如下
3.2 VS2
画一个矩形边框圈 住所有点,根据voronoi 图划分总区域,然后根 据定理1得出p1为关于查 询q的空间轮廓点,(这 个点距离q点的距离和最 小)然后由delaunay找 出p1相邻的点 p3,p4,p5,p6,p8,并计算 出mindist(p,A)进行比较, 以此类推,得出S(Q)
2.1.1普通Skyline查询
The Skyline Query is to find the skyline set of the given database P considering attributes of the objects in P as dimensions of the space. Notice that every point of the skyline does not need to dominate a point of P. For instance in Figure, while the points c and e each dominate two other points, the point a dominates no point.
3.2 VS2
具体步骤如下:
3.2 VS2
VS2 算法的伪代码如下
主要内容
1. 研究背景 2
2. 提出问题及相应的准备工作
3. 解决问题的方法 4. 总结
总结
通过举例,我们了解了Skyline查询和空间 Skyline查询,学习了Voronoi图,Delaunay图 和凸包还有很多关于Skyline查询的定理。并简 单介绍了如何用B2S2和VS2进行Skyline查询。 SSQ在很多领域都有应用如应急响应和在 线地图。我们对空间问题进行SSQ方法的新颖 性在于利用几何性质避免穷举检验在P和Q中的 所有点对
2.1.2 空间Skyline查询
相对于查询Q来说,P在空间上能取代P’即P占主导地位。 即有∀p∈ P, ∃qi ∈ Q s.t. D(p, qi) ≤ D(p, qi)
也就是说如果每一个q的与P的距离都小于或等于q到P’的距离,P 就可以在空间上主导P’ Figure 2 shows a set of nine 2-d points and two query points q1 and q2 The point p spatially dominates the point p’ as both q1 and q2 are closer to p than to p’
即图中p的面积是最小的。
在每两个点中间画一条二等分线,找到交点,删掉多余的线段进行 调整,就能得到voronoi图
2.2.1 图
Delaunay图
2
在voronoi图中把相邻区域中的两个点连接起来就得到delaunay图
2.2.1 图
凸包
It is clear that the shape of the convex hull of a set P only depends on the convex points in P. Consequently, the location of any non-convex point p ∈ P does not affect the shape of CH(P). 可以理解为凸包是把所有顶点连在一起形成的面积最大的区域
相关文档
最新文档