翻译

合集下载

翻译的英语单词

翻译的英语单词

翻译的英语单词翻译是在准确、通顺的基础上,把一种语言信息转变成另一种语言信息的行为。

翻译是将一种相对陌生的表达方式,转换成相对熟悉的表达方式的过程。

那么你知道翻译的英语单词是什么吗?下面来学习一下吧。

翻译英语单词1:translate翻译英语单词2:interpreter翻译的英语例句:女孩们等待埃施先生作翻译。

The girls waited for Mr Esch to translate.人们很难翻译幽默或笑话。

You really can 't translate humor or jokes.逐字翻译不一定最接近原义。

A literal translation is not always the closest to the original meaning.我认为她对这篇文章的翻译要比他强的多。

I think her translation of the article is much better than his.你能把这句话翻译成英语吗?Can you translate the sentence into English?我不太满意他对这个句子的翻译。

I'm not satisfied with his interpretation of this sentence.我正在逐字的翻译。

I am making a verbal translation.我给你当翻译。

I'll act as interpreter for you.要不要我来帮你翻译?Would you like me to interpret for you?被翻译成英语的爱尔兰童话故事Irish fairytales that had been translated into English在你们的合同中已订定有可能要翻译这本书。

The possibility of the book being translated is provided for in your contract.受控语言加机器翻译就是受控翻译。

翻译技巧一词法翻译法

翻译技巧一词法翻译法

翻译技巧一词法翻译法词法中文翻译法是一种将英文涉及的词法结构准确转换成中文的翻译方法。

以下是一些词法翻译的技巧:1.词性转换:根据英文词的词性,在中文中选择相应的词性来进行翻译。

例如,将英文动词翻译为中文动词,将英文名词翻译为中文名词等。

2.词序调整:英语中的语序往往与中文不一致,因此在翻译过程中需要调整词语的顺序。

例如,在英文中形容词通常在名词之前,而在中文中通常在名词之后。

3. 词义转换:有些词在不同的语言中具有不同的意义,因此需要根据上下文选择合适的词义进行翻译。

例如,英文单词“present”既可以指“礼物”,也可以指“现在”。

在翻译时需要根据具体语境选择合适的中文词义。

4. 拆分合并:有些英文词在中文中需要拆分成多个词进行翻译,反之亦然。

例如,英文单词“breakfast”可以拆分成“早餐”进行翻译,中文词组“飞机场”可以合并成英文单词“airport”。

5.排序问题:中文和英文在表达时间、地点等信息时,顺序不同。

在翻译过程中需要注意将这些信息按照正确的顺序表达出来。

6. 同音词替换:有些英文词在发音上与中文词相似,可以使用同音词进行翻译。

例如,英文单词“flower”可以使用中文词“花”进行翻译。

7. 翻译成习惯用语:有些英文词没有直接对应的中文词,可以根据上下文和中文语境,将其翻译成习惯用语。

例如,英文表达“keep your chin up”可以翻译成中文的“保持乐观”。

总之,词法中文翻译法需要考虑词性转换、词序调整、词义转换、拆分合并、排序问题、同音词替换和翻译成习惯用语等方面的技巧,以确保翻译准确、地道。

翻译技巧

翻译技巧

顺译法(Linear Translation )
顺译法,又称“顺序法”或“原序译 法”。有些英语长句所叙述的一连串动作 基本按照动作发生的时间先后安排,也有 些英语长句的内容是按逻辑关系安排,这 与汉语的表达习惯颇为一致,基本可以按 照原文语序依次译出,而无需做太大的调 整变通。
例1.She had spent a sleepless night, and rising early, had stood, wrapped up, at her window, with the cooler air blowing on her face, to watch the dawn. 她一夜无眠,早早起身,披上毯子,迎着 拂面的凉风,凭窗眺望黎明。 多个连贯的动作并列时,英语和汉语的语 序一致,采用顺译法。
增译法(Amplification)是指根据英汉两种语言 不同的思维方式、语言习惯和表达方式,在翻译 时增添一些词、短句或句子,以便更准确地表达 出原文所包含的意义。这种方式多半用在汉译英 里。 汉语无主句较多,而英语句子一般都要有主 语,所以在翻译汉语无主句的时候,除了少数可 用英语无主句、被动语态或“There be…”结构来 翻译以外,一般都要根据语境补出主语,使句子 完整。 英汉两种语言在名词、代词、连词、介词和 冠词的使用方法上也存在很大差别。英语中代词 使用频率较高,凡说到人的器官和归某人所有的 或与某人有关的事物时,必须在前面加上物主代 词。因此,在汉译英时需要增补物主代词,而在 英译汉时又需要根据情况适当地删减。
例4. In four weeks I was my old self again.
四个星期后我就彻底康复了。
英语中的介词短语置于句首时,和汉语的 语序一致,可采用顺译法。

相关翻译理论和翻译技巧

相关翻译理论和翻译技巧

第三章:相关翻译理论和翻译技巧3.1 相关翻译理论3.1.1翻译转换理论翻译转换(translation shift)是翻译中的普遍现象,指的是原文译为目的语时发生的语言变化。

“翻译转换”作为术语最早出现在英国学者卡特福德(Catford)的《翻译的语言学理论》中,他认为翻译转换是“偏离形式对等的等值翻译”,并将将翻译定义为:“一种语言(SL) 中的语篇材料被另一种语言( TL) 中等值的语篇材料所取代。

”卡特福德的翻译转换理论是建立在弗斯和韩礼德的语言学模式之上,并借用了韩礼德的系统语法及其对语言“层次”的分类来说明翻译转换现象。

卡特福德的转换理论主要使用了语法和词汇两个层次,单位、结构、类别和系统四个语法范畴。

卡特福德认为,语言是交际性的,在上下文中发挥功能,而且这些功能的发挥通过不同的语言层次( 如语音、词形、语法及词汇) 和级阶( 句子、分句、片语、词及词素等)。

在对“形式对应”( formal correspondence) 和“文本等值”( textual equivalence) 做了区分后,卡特福德认为,既然这两个概念有很大差异,进行翻译转换就是必然的了,翻译转换因而在从源语到目标语的过程中背离了形式对应。

卡特福德进而提出两种转换: 层次转( level shifts) 和范畴转换( category shifts)。

卡特福德翻译转换理论对汉英翻译有很强的指导意义。

1.层次转换所谓层次转换是指处于一种语言层次上的原语单位,具有处于不同语言层次上的译语翻译等值成分。

卡特福德的层次转换包括语音、词形、语法和词汇四个层面,但他认为翻译中惟一可能发生的层次转换就是语法和词汇之间的转移。

也就是说,一种语言的语法项在翻译时可以转换成另一种语言的词汇项,反之亦然。

例如,汉语中的“着”、“了”、“过”等词汇都可以用来英语中的“现在完成时( has/ have done)”和“过去完成时( had done)”这两种时态表达。

翻译学的名词解释

翻译学的名词解释

翻译学的名词解释翻译学是一门关注语言、文化和跨文化交流的学科,旨在研究跨语言和跨文化之间的翻译过程和现象。

它涉及翻译的理论、实践和方法,并探讨翻译在文化交流中的作用与意义。

翻译学的研究对象包括文本翻译、口译、笔译、文化翻译等多个方面。

一. 翻译的概念和历史渊源对于翻译这个词,我们可以从字面上理解为将一种语言转化为另一种语言的过程。

然而,翻译远不止于此。

它是一种复杂的跨文化交流工具,承载着不同文化间的信息传递和理解。

翻译的历史可以追溯到古代,例如古希腊时期的翻译家亚历山大·大希普利和埃及托勒密朝时期的翻译家克莱门提(Clement),他们对翻译理论和实践的贡献对后世影响深远。

二. 翻译学的理论体系翻译学的理论体系是翻译研究的重要组成部分。

其中最重要的理论之一是功能对等理论,它认为翻译的目标是在不同文化背景下实现相同的功能效果。

这可以通过不同的翻译策略和方法来实现。

另一个重要的理论是目的论,它强调翻译的目的是为了满足读者对原文理解的需求,这在广告翻译和政府文件翻译等领域中具有实际应用价值。

三. 翻译的技巧与实践在翻译过程中,翻译者需要应用一系列的技巧和方法来保证翻译质量和准确性。

其中一个重要的技巧是知识储备与背景阅历。

翻译者需要具备广泛的知识储备,例如历史、文化、科学等各个领域的知识,以便更好地理解原文的内容和背景。

此外,翻译者还需具备良好的语言表达能力和逻辑思维能力,以确保翻译文本的准确性和流畅性。

四. 文本翻译与口译的区别与联系文本翻译和口译是翻译学的两个主要分支。

文本翻译是指将书面文本从一种语言转化为另一种语言,而口译是通过口头表达将一种语言的内容转译为另一种语言。

尽管两者在形式上有所不同,但它们都需要翻译者具备一定的语言和文化背景知识,同时需要高度的专注和沟通能力。

五. 翻译的文化意义翻译在现代社会中扮演着重要的角色。

它不仅仅是实现不同文化间信息传递的媒介,更是促进文化交流、增进人类之间理解的桥梁。

翻译的原理

翻译的原理

翻译的原理
翻译作为一种语言交流工具,在不同国家和地区扮演着重要的角色。

它不仅可
以帮助人们沟通交流,还可以促进不同文化之间的交流和理解。

那么,翻译的原理是什么呢?
首先,翻译的原理在于语言的转换和传达。

翻译的目的是将一种语言的信息准
确地转换成另一种语言,使另一种语言的读者能够理解原始语言的含义。

因此,翻译的原理就是要准确地传达原始语言的意思,而不是简单地进行语言的替换。

其次,翻译的原理还在于文化的传递和交流。

语言是文化的载体,每种语言都
承载着特定文化的信息和价值观念。

因此,在翻译过程中,除了要准确地传达语言的意思,还需要传递原始语言所蕴含的文化信息,以便读者能够更好地理解原始语言的背景和内涵。

另外,翻译的原理还涉及到语言和语言之间的差异。

不同的语言有不同的语法
结构、词汇用法和表达习惯,因此在翻译过程中需要考虑到这些差异,以便更好地进行语言的转换和传达。

同时,还需要考虑到不同语言之间的语音、语调、语气等方面的差异,以确保翻译的准确性和流畅性。

此外,翻译的原理还包括了对原始文本的理解和分析。

在进行翻译时,翻译者
需要对原始文本进行深入的理解和分析,把握原始语言的含义和逻辑,以便更好地进行语言的转换和传达。

只有深入理解原始文本,才能准确地传达原始语言的意思,避免出现歧义和误解。

总的来说,翻译的原理包括语言的转换和传达、文化的传递和交流、语言和语
言之间的差异、对原始文本的理解和分析等方面。

只有充分理解和把握这些原理,才能进行准确、流畅的翻译工作,促进不同语言和文化之间的交流和理解。

常用十大英汉互译翻译技巧

常用十大英汉互译翻译技巧

常用十大翻译技巧英汉两种语言在句法、词汇、修辞等方面均存在着很大的差异,因此在进行英汉互译时必然会遇到很多困难,需要有一定的翻译技巧作指导。

常用的翻译技巧有增译法、省译法、转换法、拆句法、合并法、正译法、反译法、倒置法、包孕法、插入法、重组法和综合法等。

1、增译法:指根据英汉两种语言不同的思维方式、语言习惯和表达方式,在翻译时增添一些词、短句或句子,以便更准确地表达出原文所包含的意义。

这种方式多半用在汉译英里。

汉语无主句较多,而英语句子一般都要有主语,所以在翻译汉语无主句的时候,除了少数可用英语无主句、被动语态或"There be?结构来翻译以外,一般都要根据语境补出主语,使句子完整。

英汉两种语言在名词、代词、连词、介词和冠词的使用方法上也存在很大差别。

英语中代词使用频率较高,凡说到人的器官和归某人所有的或与某人有关的事物时,必须在前面加上物主代词。

因此,在汉译英时需要增补物主代词,而在英译汉时又需要根据情况适当地删减。

英语词与词、词组与词组以及句子与句子的逻辑关系一般用连词来表示,而汉语则往往通过上下文和语序来表示这种关系。

因此,在汉译英时常常需要增补连词。

英语句子离不开介词和冠词。

另外,在汉译英时还要注意增补一些原文中暗含而没有明言的词语和一些概括性、注释性的词语,以确保译文意思的完整。

总之,通过增译,一是保证译文语法结构的完整,二是保证译文意思的明确。

如:(1)What about calling him right away? 马上给他打个电话,你觉得如何?(增译主语和谓语)(2)If only I could see the realization of the four modernizations.要是我能看到四个现代化实现该有多好啊!(增译主句)(3)Indeed, the reverse is true 实际情况恰好相反。

(增译名词)(4)就是法西斯国家本国的人民也被剥夺了人权。

四种翻译方法,十种翻译技巧

四种翻译方法,十种翻译技巧

四种翻译方法1.直译和意译所谓直译,就是在译文语言条件许可时,在译文中既保持原文的内容,又保持原文的形式——特别指保持原文的比喻、形象和民族、地方色彩等。

每一个民族语言都有它自己的词汇、句法结构和表达方法。

当原文的思想内容与译文的表达形式有矛盾不宜采用直译法处理时,就应采用意译法。

意译要求译文能正确表达原文的内容,但可以不拘泥与原文的形式。

(张培基)应当指出,在再能确切的表达原作思想内容和不违背译文语言规范的条件下,直译有其可取之处,一方面有助于保存原著的格调,另一方面可以进新鲜的表达方法。

Literal translation refers to an adequate representation of the original. When the original coincides or almost tallies with the Chinese language in the sequence of vocabulary, in grammatical structure and rhetorical device, literal translation must be used.Free translation is also called liberal translation, which does not adhere strictly to the form or word order of the original.(郭著章)直译法是指在不违背英语文化的前提下,在英译文中完全保留汉语词语的指称意义,求得内容和形式相符的方法。

意译是指译者在受到译语社会文化差异的局限时,不得不舍弃原文的字面意义,以求疑问与原文的内容相符和主要语言功能的相似。

(陈宏薇)简单地说,直译指在译文中采用原作的的表达方法,句子结构与原句相似,但也不排除在短语层次进行某些调整。

意译指在译文中舍弃原作的表达方法,另觅同意等效的表达方法,或指对原作的句子结构进行较大的变化或调整。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

快速异常检测非常大的日志数据 摘要 基于密度的异常检测确定一个外围观察参考密度的周围的空间。尽管基于密度的异常检测的检测有几个优点,但其复杂度的计算及其应用仍然是一个主要障碍。本研究的目的是减少计算时间的低频(局部异常因子),密度—基于孤立点检测算法。该方法采用kd树索引和一个近似最近邻搜索算法(安)。理论分析近似近邻并进行搜索。用一组实验进行审查该算法的性能。结果表明,该方法能有效地证明检测局部异常减少了计算时间。 一. 介绍 数据挖掘旨在提取有意义的模式从数据,离群点检测,试图找到一个明显偏离其他意见的外围观察;它往往会引起怀疑,因为它是由不同的机制引发的。(巴内特和路易斯,1994;霍金斯,1980).离群点检测方法已在众多应用中使用(本加尔,2005),如信用卡欺诈检测(岳,吴,李,王,与楚,2007),收回电讯帐户检测(艾兹沃和诺顿,1996),击键动力学为基础的用户认证(黄,秋,与帕克,2009),网络入侵检测(张与zulkernine,2006),和video-stream-based监视(medioni,科恩,hongeng,布雷蒙德,与nevatia,2001)。孤立点检测也是众所周知的新颖性检测,异常检测,和入侵检测,而事实上这些方法有许多共同点,他们试图发现独特外围观察而不是代表模式。 从数据挖掘、机器学习的角度来看,一个异常可以被视为噪声,是不能构成重大数据模式的。统计数据通常被看作为一个从其他数据集中观察具有相对较少的频率或是删除值。由于互联网的出现和计算能力的增加,大量的数据可以提供的。可惜的是,现有的异常检测方法有几个局限性。 统计参数的方法都是假设一个已知的基本分布(Barnett & Lewis, 1994; Ramaswamy, Rastogi, &Shim, 2000)或者,至少是基于统计估计未知分布参数(本加尔,2005)。使用分布估计和/或统计参数这种方法是困难的。此外,应用统计方法更难是的多属性数据集。聚类方法基于监督学习(拉瓦尔,gehrke,与gunopulos,1998;克里格尔,与徐,1996;Guha,Rastogi,&Shim,1998;MacQueen,1967; Ramakrishnan,&livny,1996)也可用于异常检测。他们确定离群且意见不分簇的典型数据。聚类方法基于监督学习,然而有下列限制:(1)一个大的训练数据集是必要的,(2)培训前,正常和异常类需要分为手动,(3)分类器的性能在很大程度上依赖对质量的训练数据集,和(4)正常组经常会过度训练而缺乏概要图。 最近,在洛夫(局部离群因子)算法已成功地应用于异常检测(pokrajac,拉扎雷维奇,及latecki,2007)。该算法是基于密度的算法概述检测局部离群数据分配到一个outlierness程度,称为局部异常因子(基金),每个对象(breunig,克里格尔,吴,与Sander,2000;马鲁夫,2005)。在很多算法中,比周围的点具有较低的密度的数据点被确定为异常值。 (Pokrajac 等人, 2007)。 就是Pokrajac指出的一样,洛夫算法比其他异常检测技术的优势在于:“这检测野值对邻近的数据记录密度不是全球模式。这是能够检测离群无论分布是否正常,因为它没有任何假设分布数据记录。”此外Lazarevic, Ertoz, Kumar, Ozgur, and Srivastava(2003)的实验表明洛夫算法在网络入侵识别上比许多现有的离群点检测算法具有更好的性能。 该算法的计算复杂度很大,然而,还有一个令人担忧的问题,因为这根据不同的尺寸分成的一个集。对medium-high-dimensional用电量数据点表示,很多算法通常有一个平均复杂度O(nlogn),但对于高维数据,复杂性往往成为O(n2)(breunig等人。,2000)。作为真正的数据往往有一个大量非常高维数据点,计算复杂性的问题需要解决。这个问题是在特别重要的应用上需要实时反应。 本研究的目的是制定一个能减少很多算法的计算时间的方法。为了减少洛夫算法的计算时间,kd树索引和一个近似最近邻算法进行了调整。先通过适用性和误差的一个近似最近邻算法的理论分析。再研究该方法的有效性,一些实验将各种参数进行了研究。该方法用预见的和可以接受的逼近误差算出了减少的计算时间。 二. 背景 洛夫算法的主要作用是outlierness数据记录中度的计算。这个度在数据记录上是一个孤立点称它为洛夫。数据点局部密度高LOFs小于周围的点,并因此被确诊为野值,而数据点通常具有较低的洛夫价值。本算法计算的大量数据记录如下。要更详细的信息,请参阅breunig等人。(2000)和pokrajac等人。(2007) 1.对于每一个数据记录与计算离近似最近邻的距离。 2.为每个数据记录计算可达距离关于数据记录如下: Reach-distk(q.p)=max{d(q,p),k-distance(P)} (1) d(q,p)代表从q到p的欧几里德的距离。请注意,K是一个已命名的参数minpts(breunig等人。,2000)确定的边界的邻居。 3.计算局部可达密度(亲属)数据记录q:

Nk(q)代表k近邻数据记录q 4. 许多数据记录与计算

许多洛夫价值邻近1的记录数据其密度类似于其周围的邻居。换句话说,该数据记录的位置在一个集群。然而,如果一个数据记录位于远离其邻近数据或数据集群,它有一个大于1的洛夫价值。 这有一个洛夫算法的例子,如图1,可以看出,184个数据点在二维空间分成三组20,60,100的集合和四个候选离群点。可以看出,集群内的数据点很多洛夫价值接近1,而很多离群点的洛夫价值大于1. 虽然洛夫算法比起其他的异常检测方法有很多优势,但是计算复杂度是这种算法的一种限制。很多的复杂性往往恶化,此外修改数据集时,它需要重新计算的整个数据集的洛夫值。为了克服这个问题,pokrajac等人(2007)提出了一个渐进的很多算法。阿吉曼和ezeife(2004)早些时候制定了一项修改很多算法,命名为lsc-mine,减少了许多计算复杂度。他们意识到,计算数据点q和所有临近点的的可达距离和其复杂性成倍增长的参数K相反。lsc-mine算法利用实际数据点之间的距离采用局部稀疏比。此外,该lsc-mine算法采用局部稀疏系数代表outlierness每个数据点。这个算法提出了一个先修剪以排除最不可能的异常数据计算局部稀疏系数的方法。 复杂的问题可以进一步研究,如以下观点。首先,尺寸数据集应被视为减少计算复杂度。通常称为“诅咒的维度,这计算时间呈指数增长。为减少维度的诅咒,采用奇异值分解(svd)(Press, Flannery, Teukolsky, & Vetterling, 1988; Strang, 1980), Karhunen-Loève (Fukunaga, 1990) or FastMap (Faloutsos & Lin, 1995)。阿加瓦尔和裕(2001)提出了一个遗传算法可以找到最佳的投影三维以减少检测高维数据的离群点。 第二个因素是指制定的近似最近邻。找到最近邻数据这个问题可以表述如下:假设一个数据集,组成的数据点在d维空间。对于一个给定的查询对象,找到的对象数量的欧几里得距离最近的查询对象。 蛮力距离算法将整个数据集分查询对象和排序的距离数据,造成巨大的计算复杂度,尤其是对一个很大距离和面积的数据集。此外,参数k增加的大小和规模的数据集,那些因素还增加了复杂性。 在本文中,为减少计算所需的最近值k我们利用kd树索引(宾利,弗里德曼1990宾利,与芬克尔,1977)。此外,我们适应近似k近邻的kd树数据结构(Arya,Mount,内塔尼亚胡,西尔弗曼,与吴,1998)。这些方法中有详细以下部分。

三. 方法 3.1kd-tree索引 至于计算K -近邻,蛮力方法在前面提到的不需要额外的索引但不需要过多的计算。弗里德曼等人。(1977)提出了一个搜索算法利用kd树索引。该算法的基础上,圣等人。(1998)提出一个近似k近邻算法,提高检测性能高尺寸增加接受不确定性,寻找最近邻居。 在kd树数据结构空间。分区组织点在k维空间。kd树索引开始从超空间包括一个数据集,并将超空间迭代小超空间。方向的一个超平面划分2超空间是由一个预定义的分裂规则。迭代空间划分持续到物体的数量在一个分区的多维空间小于预定义的bucket-size。 影响因素的最近邻搜索时间包括分裂规则,搜索算法,和bucket-size。本分裂规则定义空间划分标准。可怜的spacepartitioning将导致一个倾斜的树,而有效的空间划分将产生一个更平衡的树,搜索性能,可能是比这更好一个倾斜的树。此外,长宽比分区超空间算法性能的影响。外表率的定义是之间的比例最长尺寸长度和最短尺寸长度。让我们假设之间的距离查询数据和样本数据计算的欧氏距离。当一个长宽比接近1,查询数据和他们最近的邻居往往是在同一个空间。当长宽比大于1,他们很可能有不同的多维空间,它需要更多的计算树的遍历。 一般来说,三种类型的划分规则的使用:standardsplit,midpt-split,和fair-split(圣等人。,1998;弗里德曼等人,1977)。确定一个适当的分裂规则分布有关的数据。一个standard-split分区超空间的正交方向的尺寸用中位数的价值。当一个标准分离应用对数据点,深度和大小的kd树是dlog2ne和(例),分别为0。该standard-split有优势的树搜索,但可能会遭受更大的长宽比。一个midptsplit将多维空间使用的中点。虽然外表一个midpt-split比率接近1,这可能会导致琐碎的分裂,这样,没有数据存在于分区。由于琐碎的分裂,大小的kd树可以不必要大于其他方法。一个fair-split分超平面的中点正交的长边,保持长宽比在3。结合双方的优势和standard-split midpt-split,平衡树的深度和大小,与可接受的高宽比,产生。图2显示了spacepartitioning之间的差异三分裂规则。本数据集用于无花果。1和2是一样的。 至于搜索算法,有两家搜索算法可用于kd树索引:标准搜索和优先权搜索。标准搜索包括2个步骤。先一步找到叶节点,包括一个查询点,并通过遍历在kd树从根节点。然后,最近邻居通过计算之间的距离的一个查询点对象的叶节点。搜索停止如果距离从查询点的k最近发现在叶节点小于距离查询点到超平面定义节点边界。否则,之间的距离查询点与点包含在节点共享相交平面也必须计算。在这样一个方法,而不是计算查询点之间的距离和整个数据对象集,搜索计算标准之间的距离只有一点和对象的查询叶节点,或其邻居节点,从而大幅减少计算时间。 一个优先搜索算法生成一个优先队列中树的遍历。优先级队列排序多维空间,或节点,在升序排列,根据查询点之间的距离和边界的超空间。然后,k -最近邻是根据确定的优先级顺序队列。如果一个距离之间的查询和对象人迹罕至的节点距离当前kthnearest邻居,优先搜索停止。 最后一个因素影响性能kd树索引bucket-size。一个较大的桶的大小可以节省tree-traversing时间,但总体计算时间减少是有限的,而一个较小的桶的大小会导致过度树遍历。因此,存在一个最佳的bucket-size。这些因素的影响在4部分讨论。 3.2近似最近邻算法 虽然kd树索引的减少计算时间的许多算法,进一步减少是必要的一些应用处理高维,非常大的数据。例如,在基于内容的图像检索视频监控等,计算时间,更重要的是比精确计算时间价值。

相关文档
最新文档