一种改进的连续k近邻查询处理方法

合集下载

基于预计算的连续k近邻查询处理的性能优化

ＬｉＹａｎｈｏｎｇ
（ＣｏｌｌｅｇｅｏｆＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅ，Ｓｏｕｔｈ — ＣｅｎｔｒａｌＵｎｉｖｅｒｓｉｔｙｆｏｒＮａｔｉｏｎａｌｉｔｉｅｓ，Ｗｕｈａｎ，４３００７４，Ｃｈｉｎａ）
量的信息交换会大大地降低查询算法的性能。为了克服这个问题，本文提出了一种有效的优化技术，以减少查询处理时的内外存交换次数、提高查询处理的效率。实验证明所提出的优化方法的有效性，而且优化技术的采
Ａｂｓｔｒａｃｔ：Ｔｈｅｅｘｉｓｔｉｎｇｃｏｎｔｉｎｕｏｕｓｋ— ｎｅａｒｅｓｔｎｅｉｇｈｂｏｒ（ＣｋＮＮ）ｑｕｅｒｙｐｒｏｃｅｓｓｉｎｇｍｅｔｈｏｄｓｉｎｒｏａｄｎｅｔ —
ｗｈｅｒｅｔｈｅｋＮＮｓｏｆｔｈｅｑｕｅｒｙｃｏｕｌｄｅｘｉｓｔ：（２）Ｔｈｅｍｅｔｈｏｄｓｂａｓｅｄｏｎｐｒｅ — ｃａｌｃｕｌａｔｉｏｎ．Ｐｅｏｐｌｅａｌｗａｙｓｃｏｎ— ｓｉｄｅｒｔｈａｔＣｋＮＮｑｕｅｒｙｍｅｔｈｏｄｓｂａｓｅｄｏｎｐｒｅ — ｃｏｍｐｕｔａｔｉｏｎｃａｎｎｏｔｅａｓｉｌｙｂｅｅｘｔｅｎｄｅｄｔｏｈａｎｄｌｅＣｋＮＮｑｕｅｒｉｅｓｉｎｌａｒｇｅｒｏａｄｎｅｔｗｏｒｋｓ．Ｔｈｉｓｉｓｂｅｃａｕｓｅｔｈａｔｐｒｅ — ｃｏｍｐｕｔｅｄｉｎｆｏｒｍａｔｉｏｎｏｆａｌａｒｇｅｒｏａｄｎｅｔｗｏｒｋａｌｗａｙｓｈａｓａｔｏｏｌａｒｇｅｓｉｚｅｔｏｂｅｓｔｏｒｅｄｉｎｍｅｍｏｒｙ，ｔｈｕｓｌｏｔｓｏｆｄａｔａｓｗａｐｐｉｎｇｂｅｔｗｅｅｎｔｈｅｍａｉｎｍｅｍｏｒｙａｎｄｔｈｅａｕｘｉｌｉａｒｙｓｔｏｒａｇｅｗｉｌｌｇｒｅａｔｌｙｄｅｇｒａｄｅｔｈｅｐｅｒｆｏｒｍａｎｃｅｏｆｑｕｅｒｙｍｅｔｈｏｄｓ．Ｉｎｏｒｄｅｒｔｏｏｖｅｒｃｏｍｅｔｈｉｓｓｈｏｒｔｃｏｍｉｎｇ，ａｎｅｆｆｉｃｉｅｎｔｏｐｔｉｍｉｚａｔｉｏｎｔｅｃｈｎｉｑｕｅｉｓｐｒｏｐｏｓｅｄｔｏｇｒｅａｔｌｙｒｅｄｕｃｅｄａｔａｓｗａｐｐｉｎｇｂｅ — ｔｗｅｅｎｔｈｅｍａｉｎｍｅｍｏｒｙａｎｄｔｈｅａｕｘｉｌｉａｒｙｓｔｏｒａｇｅｉｎｑｕｅｒｙｐｒｏｃｅｓｓｉｎｇａｎｄｉｍｐｒｏｖｅｔｈｅｅｆｆｉｃｉｅｎｃｙｏｆｑｕｅｒｙｐｒｏｃｅｓｓｉｎｇ．Ｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｈｏｗｓｔｈｅｅｆｆｉｃｉｅｎｃｙｏｆｔｈｅｔｅｃｈｎｉｑｕｅ．Ｍｏｒｅｏｖｅｒ，ｔｈｅｕｓｅｏｆｏｐｔｉｍｉｚａ — ｔｉｏｎｔｅｃｈｎｉｑｕｅｃｏｕｌｄｉｍｐｒｏｖｅｔｈｅｓｃａｌａｂｉｌｉｔｙｏｆｔｈｅｑｕｅｒｙｐｒｏｃｅｓｓｉｎｇｍｅｔｈｏｄｓ．Ｋｅｙｗｏｒｄｓ：ｃｏｎｔｉｎｕｏｕｓｋ — ｎｅａｒｅｓｔｎｅｉｇｈｂｏｒｑｕｅｒｙ；ｒｏａｄｎｅｔｗｏｒｋ；ｐｒｅ — ｃａｌｃｕｌａｔｉｏｎ；ｐｅｒｆｏｒｍａｎｃｅｏｐｔｉｍｉｚａ～

基于道路网的连续k近邻查询算法

其中的有效部分，从而避免了对道路网的盲目扩展；且在节点的网络扩展中，通过应用具有相同扩展方向的其他查询
的扩展结果，不仅减少了对道路网的重复扩展，还节省了计算代价。实验结果表明，所提算法同传统算法相比较，缩短了查询响应时间，提高了运行效率，并且适用于不同类型的ｋ近邻查询。关键词：增量式监测算法；移动对象；连续ｋ近邻查询；网络扩展；扩展树；道路网
刘德高 ’ ，李晓宇
（郑州大学信息工程学院，郑州４５０００１）（通信作者电子邮箱ｌｄｇ＿８０＠１６３．ｃｏｎｒ）
摘
要：针对增量式监测算法（ＩＭＡ）的冗余搜索问题，提出一种基于ＩＭＡ改进的移动对象连续ｋ近邻（Ｃｏｎｉｔｎｕｏｕｓ
Ａｂｓｔｒａｃｔ：ＣｏｎｃｅｍｉｎｇｔｈｅｐｒｏｂｌｅｍｏｆｒｅｄｕｎｄａｎｔｓｅｒｃａｈｏｆＩｎｃｒｅｍｅｎｔｌａＭｏｎｉｔｏｉｒｎｇＡｌｇｏｉｒｈｍ（ｔＩＭＡ），ｔｈｉｓｐａｐｅｒｐｒｏｐｏｓｅｄ
ａｎｅｗｌａｇｏｒｉｔｈｍｏｆｉｍｐｒｏｖｉｎｇＣｏｎｔｉｎｕｏｕｓｋＮｅａｒｅｓｔＮｅｉｇｈｂｏｒ（ＣｋＮＮ）ｑｕｅｉｒｅｓｆｏｒｍｏｖｉｎｇｏｂｊｅｃｔｓｂａｓｅｄｏｎＩＭＡ．Ｔｈｅ

基于扩展时空距离度量的连续k近邻查询方法

基于扩展时空距离度量的连续ｋ近邻查询方法
廖巍，吴秋云，陈宏盛，景宁，钟志农
４０７）１０３
（国防科技大学电子科学与工程学院，湖南长沙
摘
要：针对基于 ⅡｌＲ树索引的连续ｋ近邻查询，引入了一种新的时空距离度量最小最大距离函数作为
ｒＲ树索引搜索时节点剪枝上界。提出了一种采用最优优先策略的基于扩展时空距离度量的连续近邻查Ｐ询ＳＭＣＮ算法，Ｔ —Ｎ利用最小距离函数进行ＴＲ树索引节点搜索时访问排序，Ｐ并使用最小最大距离函数对ＴＲＰ
树索引进行剪枝界定。
关键词：连续ｋ近邻查询；ＰＴＲ树；最小最大距离函数；ＭＣＮ算法Ｓ —ＮＴ
中图分类号：Ｐ９Ｔ３２文献标识码：Ａ
Ｃｎｉｕｕ —ｅｒｓＮｉｈｏｅｉａｅｎＥｔｎｅｏｔｏｓｋｎａｅｔｅｂｒＱｕｒｅＢｓｄｏｘｅｄｄｎｇｓ
（）ｗｒｅｔｒｉｐｅｂｕｄｌＫＮｑｅｅａｏｔ＇ —Ｎｈｈｃｎｓｒｎｂｓｆｓｉ／ｅｗｔａｐｅｎｄａａｐｕｎｕｐｒｏｎ．ＡｓａＣＮｕｒｓｌｒｈＳＭＣＮｗｉａｅｃｉｅｔｒｆｎｒａｓｓｅｓｎｇｏｉｇｉｍＦｃａｈ — ｔｎｌｓｉｌｄｖｌｅｅｌｏｍｎｓ（）ａｄｍｎａｄｓ（）ｍｔｃ，ｉｗｃＴ — ＮｌｒｈｉｔＴＲｔｅｎｄｓａｃｒｉｅｅｐｄｙｍａｏｂ￣ｆｉｄｔｔｎｉｘｔｔｅｓｎｈｈＳＭＣＮａｏｉｍｖｉＰ－ｅｏｅｃｏｄｇｉｍｉｉｒｉｇｔｓｓｒｎｔｍｎｓｔｒｅ，ａｄｐｎｎｅｎｄｓｉｉｍｘｓｔ．ｏｉｔ）ｏｄｒｎｒｉｔｏｅｔｍｎａｄｔ）ｄ（ｉｕｇｈｗｈｉ（

移动对象的K个连续最近邻查询算法

维普资讯
第ｌ２卷
第６期
哈尔滨理工大学学报
ＪＯＵＲＮＡＬＨＡＲＢＮＵＮＩＩＶ．Ｓ．＆ＴＣＨ．ＣＩＥ
Ｖｏ２Ｎｏ６Ｌ１．
Ｄｅ．０７ｃ，２０
２００７年ｌ２月
移动对象的个连续最近邻查询算法
ｏｓａｆｃｅｔａｇｒｈｍａａｅｏｈｎｅｆｒＲｔｅａｄｕｅｏｐｕｉｅｈｉｅｔｅｏｖｅｐｏｌｍ．ｎｐｅｉｉｎｌｏｔｅｔｔｓｎｔｅｉｄｘｏＰ — ｅｎｓ【ｒｎｇｔｃｎｑｒｓｌｅｔｒｂｅＡｎｉｈｂｒｕｏｈ
黄敬良，郝忠孝
（哈尔滨理工大学计算机科学与技术学院，黑龙江哈尔滨１０８）５００
摘
要：给定一个移动查询点和一个移动对象集合，由于查询和数据对象的位置都是连续变
化的。因此不能依赖于给出的固定参考位置来解决查询问题．为了解决移动对象的个连续最近邻查询。ＴＲ树的基础上，出了分界时间的概念，剪枝技术给出了查询算法．在Ｐ提利用利用模拟
点只被访问一次．
树索引．４局限于回答一个最近邻查询．［］文［］文５提出一种基于ＴＲ树索引的查询算法，Ｐ］这种方法要多次对ＴＲ树进行搜索，Ｐ因此时间复杂度高．文
２基础知识
２１ＴＲ树．Ｐ
［］１虽对文［］５进行了改进，但是这种技术只适应于静态数据集合．［］文６等人提出的算法不能查询多

k-最近邻算法

k-最近邻算法
1.k-最近邻算法是一种基于实例（Instance-based）的学习方法，也称为惰性学习（Lazy learning）方法或者近似实例学习方法。

它是一种分类方法，它不学习实例及其
之间的关系，而是直接存储数据，当需要进行分类预测时，寻找距离最近的K个点，然后
根据这些点的类别进行预测。

2.k-最近邻算法原理：通过比较未知实例与训练数据库中的实例，测量它们之间的距离，来预测该未知实例的类别。

与距离它最近的K个实例的类别最多的作为该未知实例的
类别。

3.k-近邻算法的优缺点：
优点：
1.简单易行：最近邻算法是计算机最简单的分类算法，直观有效，操作简单易行。

2.可预测性良好：最近邻分类算法可以获得较好的解决方法，并达到较高的预测性能。

3.大规模数据集可以很快地进行分类：kNN算法仅依赖训练数据中出现的模型，而不
用于存储数据，因此它可以在庞大的数据集上进行分类并实现极快的计算性能。

1.计算复杂度高：KNN算法比较复杂，需要调参数，计算复杂度较高且及时性较差。

2.存在样本不平衡问题：由于KNN算法没有考虑数据的内在分布特征，对于样本不平
衡的问题容易出现误分的情况。

3.维数灾难：KNN算法容易陷入维数灾难，即随着维数增加，距离也会不断增加，准
确率越来越低。

BCC相Fe-Ni合金晶格常数的计算

卅
＝
州
囡Ｆｅ
（）９
Ｆ．合金的模型如图ｌ示：ｅＮｉ所
＝
这里局是原子ｆ对总能量的能量贡献值，这里，）Ｆ（是的嵌入函数，是所有其他原子在ｉ处产生的电子密度，ｒｆ（．Ｏ）
是一个原子的电子密度，第－近邻到ｉ子的距离，（ｊ是，个原Ｆｐ）
是嵌入一个原子ｉ至电子密度为的晶体中的能量，）ｉ是和＿，两原子间的两体中心势。（是修正项，）其中的参数为基体电子密度中原子的电子密度非球对称部分的贡献。修正项的物理意义主要是描述原子电子密度非球对称分布所引起的系统总能量的变化。这里嵌入函数Ｆ）两体势）修正（，，项Ｍ（ｔ和电子密度ｆｒ）Ｐ），（的具体函数形式，ｏ即：３计算结果
达的两体势。根据这种认识和思想，建立了ＭＡＥＭ理论框Ａ
参数单位为Ａ和局，，单位为ｅｌｏ单位为ＧａｖＣ。Ｐ
口０
２８６．４６３５３．６２４８．２４４．４
且，
１９．７Ｉ５．４
ｃｌｌ
在ＭＡＥＡＭ中，系统地总能量表述为：
＝
∑ ＝Ｉ），＃，（＋（Ｉｆ ∑ ＋ ∑ ｌ，Ｌ毒））二）（
∑，（）
∑ｆ（）
本文中，采用Ｊｈｓｎ的合金势，ｏｎｏ即：
（）１
＝
（）２（）３
口＝０９８ｎ如图２．１９ｍ，２。

基于聚集块的多用户连续K最近邻多线程查询

聚集块是一组在当前和将来一段时间都彼此靠近的移动查询点的集合。表示为ＪＪ（，Ｓ，ｔｔＵＯ，ｆｓｒ，ａｅｄＮ），０是对象的集合，ｓｒ，ｅｄ是聚集块的起点和终点位置，是聚集块中对象的个数。聚集块ｎ，ｔｔｎａ Ⅳ
的长度为Ｉａｔｅ４，聚集块与数据点间的网络距离为聚集块的中心位置到数据点的网络距离。ｓｒ—ｎｔ将要查询的查询点分组成不同的聚集块，将每一个聚集块看成一个查询点，共享查询结果，可以减少
／，Ｎ为ｚ所在的边，Ｎ１初始结点，将Ｎ－人Ｈ，Ｎ２ｌ示Ｊ向此方向移动／Ｎｌ２为放＝表ＵＪ
ｚ为聚集块ＪＪ的中心点Ｕ
ＤＣ０／＝＝／Ｄ为ｚ到所有Ｋ个最近临结点的最远距离／Ｚ到下一个扩展点的最短距离／Ｃ为
ＷｈｌｄＮ，）ｄｓｋｉ（（Ｚ＜ｉ）ｅ＿
执行及查询结果分发来提高多用户连续查询的并行ｌ并且利用扩展树增量返回ＫＮ查询结果。生。Ｎ最后通过
实验对提出的方法和现有方向进行比较。
１查询处理
１１道路网络图．
采用有向图Ｇ（，Ｅ，Ｗ）示交通图，作者以Ｖ表示Ｇ中所有顶点的集合，Ｅ是边的集合，为边Ｖ表
第６期
基于聚集块的多用户连续Ｋ最近邻多线程查询
・７・ｌ
阈值内。
１３查询初始化及查询处理．
在算法的初始阶段，利用Ｄｊａ算法，找到每个聚类的初始扩展树和查询结果。即从聚集块开始，ｉｔｋｒ

k近邻算法的缺点与改进_概述及解释说明

k近邻算法的缺点与改进概述及解释说明1. 引言1.1 概述在机器学习和模式识别领域中，k近邻算法被广泛应用于分类、回归和聚类等任务。

该算法利用已知数据集中的样本特征与待分类样本进行相似度度量，并通过最近邻居的投票来确定待分类样本所属的类别。

尽管k近邻算法具有简单直观、易于实现以及适用于多种数据类型的优点，但也存在一些明显的缺点。

1.2 文章结构为了全面分析和探讨k近邻算法的缺点及其改进方法，本文将按照以下结构进行论述：- 引言：对k近邻算法进行概述，提出文章的目的。

- k近邻算法的缺点：列举并详细分析计算复杂度高、数据不平衡问题和高维数据处理困难等方面存在的问题。

- k近邻算法改进方法：介绍加权k近邻算法、特征选择与降维技术以及基于密度的聚类方法等改进策略。

- 实验结果分析与比较：对不同改进方法在准确性和计算效率上的表现进行实验比较，并探讨不同参数配置对结果的影响。

- 结论与展望：总结研究结果，提出进一步研究的方向。

1.3 目的本文旨在全面了解k近邻算法的缺点，并探讨多种改进方法以解决这些问题。

通过实验比较不同改进方法在准确性和计算效率上的表现，可以为相关领域的研究者提供参考。

此外，本文还将指出目前研究中存在的未解决问题，并提出值得深入研究的方向，为未来的研究工作提供有益启示。

2. k近邻算法的缺点2.1 计算复杂度高:在k近邻算法中，当训练数据集规模很大时，计算新实例与所有训练实例之间的距离会变得非常耗时。

由于需要对每个测试实例进行计算，该算法的时间复杂度较高。

特别是在大规模数据集上执行时，可能需要较长的时间才能得出结果。

2.2 数据不平衡问题:k近邻算法中的类别比例不平衡可能导致错误的预测结果。

当某个类别的样本数量明显多于其他类别时，它们将占据更大的部分，并且对最终分类结果产生更大影响。

这种偏向性可能导致少数类别被错误地分类为多数类别，从而降低了算法在处理不平衡数据集上的准确性。

2.3 高维数据处理困难:在高维空间中，由于所谓"维度灾难"问题，在相同数量的训练数据情况下，样本分布变得稀疏，使得k近邻算法面临着挑战。

公路网上移动对象连续k近邻查询的一种方法

欧氏空间的近邻查询方法（Ｅ）（Ｉ），ＩＲ和１ＥＪ由于ｌＥＶＩＶ比ＩＲ的算法效率高，我们就只介绍一下ＩＥ方法．Ｅ这里Ｎ该
方法的主要思想是以发出查询的点为中心逐步进行扩张搜索，在扩张过程中比较所有遇到的移动对象到查询中心的距离，这种方法是对Ｄｉｔ￣ｓａ算法的一种多次使用，ｋｒ当扩张半径超过到第个对象的距离时，查询就结束了．ＮＩＥ算法
（（ｎ）、ｅｎ，）对象离它所在边的起点距离（ｉＤｓｔ
３９
）、）平均
Ｋｌｈｏｚｎ等人提出了Ｖ３方法Ｊ它是基于ｏｄｕａａＮ，
值之和）针对路网下的近邻查询，．一些学者首先提出了对
网络上的静态对象查询处理的算法－２
，而后又针对移动
的效率取决于要查询对象的密度，整个路网范围比较如果大，而要查询的对象又比较少且很分散，么该方法的效率那
就很低，因为要搜索大部分的路网．
然而在大多数现实场景中，查询者和移动对象被限制在一
个传输网络中．型的，典道路网络就是这样一类的传输网
络，由各路段组成，它们路段的权值对应于它们的长度或移动对象穿越它们所需要的行驶时间．在这种环境中，两个对
象之间的距离被定义为连接它们的最短路径的长度（即权
对象的ＣＮＫＮ查询给出了再计算的快照方法，以解决移
动对象的位置随时间变化而进行更新处理，而这种处理然

k- 最近邻算法

k- 最近邻算法k-最近邻算法是一种常用的机器学习算法，它在分类和回归问题中广泛应用。

该算法的核心思想是通过计算样本之间的距离，将测试样本与训练样本中最相似的k个样本进行比较，从而进行预测或分类。

在k-最近邻算法中，k代表了选择最相似的k个样本。

一般而言，k 的选择会影响到算法的性能和结果。

如果选择较小的k值，算法会更加敏感，可能会受到噪声的影响，导致过拟合。

而选择较大的k 值，则可能会忽略一些重要的特征，导致欠拟合。

因此，在使用k-最近邻算法时，我们需要根据具体问题和数据集的特点来选择合适的k值。

在应用k-最近邻算法时，我们首先需要计算测试样本与训练样本之间的距离。

常用的距离度量方法有欧式距离、曼哈顿距离和闵可夫斯基距离等。

通过计算距离，我们可以找到与测试样本最相似的k 个训练样本。

一旦找到了最相似的k个训练样本，根据分类问题或回归问题的不同，我们可以采用不同的方法进行预测或分类。

对于分类问题，一种常用的方法是采用多数表决的方式，即选择k个样本中出现最多的类别作为预测结果。

而对于回归问题，通常采用平均值的方式，即将k个样本的输出值进行平均，作为预测结果。

k-最近邻算法的优点之一是其简单性和易于理解。

它不需要进行模型训练，只需要进行距离计算和预测，因此在处理小型数据集或实时数据时非常有效。

此外，k-最近邻算法还具有较强的鲁棒性，对异常值和噪声具有一定的容忍度。

然而，k-最近邻算法也存在一些局限性。

首先，由于需要计算所有样本之间的距离，当数据集较大时，算法的计算复杂度较高，导致运行时间较长。

其次，k-最近邻算法对于数据集的特征尺度和数据分布较为敏感，需要对数据进行归一化和标准化处理，以确保距离计算的准确性。

此外，当数据集存在类别不平衡或噪声较多时，算法的性能可能会下降。

为了提高k-最近邻算法的性能，我们可以采用一些改进的方法。

例如，可以通过加权平均的方式考虑不同样本对预测结果的贡献程度，使得距离较近的样本具有更大的权重。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

问整个ＴＲ树，响了查询的效率。本文基于动态增大的搜Ｐ影
本文算法需要设定动态增量值为ａ。ｕｒＱｅｙ算法处理新加
ＡｌｏｔＱｅｙｇｒｈｉｍｕｒ
Ｉｐｔ，ｓｏ，ｎｕｑ，ｂＴｑＯｕｐｔｒｐａｅｓｔｕ，ｄｔｄｑｑｕ
Ｍａｅ．：２７ｔｒ５１２．
【１ｒ．ｏｌｄ。ｄｒ２０）ｔｒＳｉＥｇＡｌ】ｅＲＭＰｋｕａＪＡｎｅａＰ（０４Ｍａｅｃ．ｎ
３８３９：２３７— ８９．
【】ｒｔＭ，ｂＭ，ｉｋＶ（０３ＰｉＭａ３３２．１ＦｉｋｏＶｔ２０）ｈｌｇ８：５９２ｆｅ
数ｎｋ的时候，＜利用动态增大的搜索区域裁剪ＴＲ树，免搜索整个ＴＲ树，而减少了ＴＲ树的访问代价。Ｐ避ＰＴ３ｌ
ＴＲ树Ｐ
Ｓ．ＮＮ查询方法ＲＣ
文献标识码：Ａ文章编号：１０．９３２１０ —０ —２０７３７（００）６１１０
针对大量移动对象ＣＮＮ查询问题，ｅｅｓＢｎｔ等人首先提出ｉ了Ｆｎ — Ｎ算法，ｉｄＮ利用最小距离函数对ＴＲ树裁剪，Ｐ进行深度
１算法
在处理大量并发连续ｋ近邻查询时，查询的更新变化非
优先遍历搜索，以获得最近邻对象。ａＴｏ等人对Ｆｎ — Ｎ算法常频繁，ｉｄＮ如果每次搜索都直接扫描整个ＴＲ树，Ｐ造成额外节点
进行了扩展，支持ＣＮ查询。ｅｎ人提出的Ｃ — Ｎ的访问，影响查询效率。本文提出的Ｓ — ＮＮ算法则利用预以ＫＮＧｌ等ｎＷＫＮＲＣ
算法利用搜索区域对ＴＲ树索引节点进行搜索预裁剪。Ｔｏ处理技术，Ｐａ在不扫描整个ＴＲ树的前提下，Ｐ直接利用动态增大
图２ＢＣ相Ｆ — 合金的晶格常数随能量的变化ＣｅＮｉ参考文献：［】１孟庆平，刘奇正，戎咏华，徐祖耀；ｅＮｉ金中相能量的修正Ｆ— 合嵌入原子法计算［；Ｊ上海交通大学学报；００期１８页．］２２年ｌ１０
［】ＭｉｔｎＦＣａｔｓｉｎＳ（９８Ｐｙ．ｅ．８６０．５ｌｅ，ｈｎａｉｗａ１９）ｈｓＲｖＢ５：６ｓｉｒ０
［】ＭａＦＸｕＫ（０６Ｓｌｔｔｍｍｕ．４：８．６，Ｗ２０）ｏｉＳａｅＣｏｄｎ１０４７
近似结果集中对象个数小于查询近邻数目ｋ时，或在更新时入查询，如下：
索区域提出一种改进方法，减少ＴＲ树节点访问次数，Ｐ提高查
询效率。
（）ｉｑｓｕｌ１ｆｓｉｎｌ
（０１ＰｙｉａＢ３７１８２０）ｈｓｃ０：３．
结果增量地更新查询，有良好的伸缩性。文献【】出了相于ｑ的相似度为Ｓ－ｑ，ｑ，２ｌｑｑｑ．ｑ．，具５提：ｑ，Ｓ，＝／１／其中，ｑｑｑｄｋｋｄ－２，
似查询的概念，并利用相似查询引入了动态扩充的查询处理表示ｑ．ｏｔｑ．ｏｔ间的距离。－ｃ和ｃ之ＬＬ算法，具有良好的查询效率。但文献【】５在处理新查询时如果如果搜索区域内对象个数小于查询近邻数目ｋ时，都需要访
【】ＧｍｊｉＭ，ａｇＰ（９５ＭａｒｃＥｇＡ１９１３７ｉｃＤｎ１９）ｔｉｎ９：７．ｃｅＳ
【】ＭｉｉＹ，ｈＭＰｐｃｎｔｔｐｕｏ（０５Ａｔ８ｓｎＭｅｌＪａａｏｓｎｏｏｌｓＡ２０）ｃａｈ．ａＤ
一
种改进的连续ｋ近邻查询处理方法
口武亮亮刘文远陈子军
（燕山大学河北・秦皇岛０６０）６０４
摘要：针对大量并发连续ｋ近邻查询处理，出了一种基于搜索区域的连续ｋ近邻查询处理方法（ｏｔｕｕ提ｃｎｉｏｓｎｋｎａｅｔｅｈｏｂｓｄｎｅｒｈｒｇｏ，－ｅｒｓｎｉｂｒａｅｏａｃｉｎ简称Ｓ．ＮＮｏＳ —ＮＮ查询处理方法在更新时刻搜索区域内近邻个ｇｓｅＲＣＲＣ
Ｍａｅ．３：２９．ｔｒ５４０
【］ＳｉＪＬｅＷｉｈＢＤ（ｏ６Ｊｕ１Ｍａｅ．５：６９ｈｍＨ，ｅＨＪ，ｎ２０）Ｎｃ．ｔｒ３１５．［０ｌｔｂｃＣｒａ，．Ｍｏｒｒ２０）ｃａ１】ＣａｅｕｋＤＭ，ｈｚｎＣＪｔｒＤＷ．ｒｓ（０３ＡｔｉＪ
等人提出的Ｔ — Ｎ算法能够有效地处理时问参数化ｋ近邻搜索区域裁剪ＴＲ树，计算新查询的近似结果集。Ｓ — ＮＰＫＮＰＲＣＮ
查询，但必须重复提交并多次计算查询，增加了计算负担，其由Ｑｅｕｒ法、ｐａｅ法组成。ｙ算Ｕｄｔ算效率低下。廖巍等人提出了Ｓ．ＮＮ算法，ＩＣ能够基于上次查询定义１查询相似度）定两个ＣＮＮ查询ｑ、ｑ相对（．给Ｋ－ｑ，－