机器翻译概述
机器翻译及其翻译步骤

机器翻译及其翻译步骤机器翻译(MachineTranslation,MT),指的是由电脑程序实现的自动文字翻译技术,它可以在不进行人工介入的情况下,将源文自动翻译成目标语言。
机器翻译技术已经成为翻译领域最受关注的一个话题,它具有准确、快速等优点,可以有效解决因文字的不通而造成的误解和误传的现象。
机器翻译的步骤包括:分词、语法分析、句子改写、翻译完成。
首先是分词,它指的是将一句话中的汉字分解成单独的词,以便电脑程序能够识别该句的意思。
在机器翻译中,分词是翻译的关键步骤,因此分词精准度的高低直接影响翻译结果的准确性与可信度。
接着是语法分析,它指的是利用若干文字学知识,运用语法规则对汉字分解出来的词语及短语进行解析,以确定句子中词语的排列关系及句法结构,这也是机器翻译的一个关键步骤。
紧接着是句子改写,它是基于语法分析的基础上,利用源语言的语法结构与目标语言的语法结构差别,将句子改写成适用于目标语言的形式,这一步将影响最终翻译结果的准确性。
最后是翻译完成,它是机器翻译中最关键的步骤,也是传统机器翻译中最不可缺少的步骤。
翻译完成是根据句子改写的基础上,按照源语言的意思转译成目标语言,将最终的翻译结果输出来。
机器翻译技术的发展,使得准确快速的机器翻译变得可能。
由于它比传统的人工翻译更加快捷,容易被广泛的应用,如在海外文字交流中,可以有效处理中文和英文等。
此外,机器翻译也可以被应用于机器翻译系统中,自动生成多种语言之间的相互翻译,便于用户阅读多种不同语言文章,从而更好的了解多元化的文化和思想。
综上所述,机器翻译是一种很重要的技术,不仅可以提高翻译的准确度,而且还可以提高翻译的速度。
它的应用广泛,可以解决许多问题,是人类获取和传播资讯的重要途径。
然而,机器翻译仍有一定的局限性,尤其是文字表达比较模糊时,它的准确性就不高,需要使用到人工翻译。
所以,未来,结合机器翻译和人工翻译,可以更好的帮助人们进行跨语言的文字交流。
机器翻译方法

机器翻译方法机器翻译(Machine Translation,MT)是指利用计算机技术实现自然语言之间的翻译。
随着人工智能技术的快速发展,机器翻译已经成为解决语言交流障碍的有效工具。
本文将介绍几种常见的机器翻译方法,并分析它们的优缺点。
一、基于规则的基于规则的机器翻译方法是早期机器翻译技术的主要方法之一。
它通过事先构建一系列的翻译规则,然后根据这些规则将源语言文本转换成目标语言文本。
这种方法需要大量的人工工作,主要包括:1. 构建词汇库:将源语言词汇与目标语言词汇一一对应。
2. 编写规则:根据语法规则和词汇库,编写一系列的翻译规则。
3. 设计规则匹配算法:将源语言文本与规则进行匹配,并生成目标语言文本。
优点:基于规则的机器翻译方法可以实现精确的翻译,尤其在语法规则复杂的语言对之间效果较好。
缺点:构建规则和词汇库需要耗费大量时间和人力,且对语言灵活性要求较高,无法处理多义词和歧义的情况。
二、基于统计的基于统计的机器翻译方法通过分析大规模的双语语料库,学习源语言与目标语言之间的统计规律,从而实现自动翻译。
主要步骤包括:1. 建立双语语料库:收集大规模的源语言和目标语言平行语料,如新闻报道、书籍等。
2. 分词与对齐:将源语言和目标语言文本进行分词,并进行句子级别的对齐。
3. 训练模型:利用统计算法,根据对齐的双语语料库,学习源语言和目标语言之间的翻译模型。
4. 解码翻译:根据学习到的翻译模型,将源语言文本翻译成目标语言文本。
优点:基于统计的机器翻译方法可以自动学习源语言和目标语言之间的翻译规律,无需人工构建规则和词汇库。
缺点:对于生僻词和长句等复杂情况,效果不如基于规则的机器翻译方法。
三、基于神经网络的近年来,随着深度学习的广泛应用,基于神经网络的机器翻译方法逐渐兴起。
该方法通过构建深层神经网络模型,直接将源语言文本映射到目标语言文本,实现端到端的翻译。
主要步骤包括:1. 构建编码器-解码器模型:编码器将源语言文本映射到一个语义空间,解码器将语义空间中的信息转换为目标语言文本。
机器翻译的发展历程

机器翻译的发展历程机器翻译(Machine Translation,简称MT)是指利用计算机和相关的技术,将一种语言的文本自动转化为另一种语言的文本的过程。
它的发展历程可以概括为以下几个阶段:1. 早期阶段机器翻译的起源可以追溯到20世纪50年代。
当时,计算机还处于早期阶段,科学家们开始尝试利用计算机来进行翻译。
早期的机器翻译系统基于规则和字典,通过对源语言和目标语言之间的语法和词汇知识进行编码,来实现自动翻译。
尽管这些系统存在很多限制,但为机器翻译的发展奠定了基础。
2. 统计机器翻译阶段20世纪90年代,随着计算能力的提升和大规模语料库的建立,统计机器翻译(Statistical Machine Translation,简称SMT)成为主流。
SMT基于大量的双语平行语料,通过统计模型研究源语言和目标语言之间的概率分布,从而实现翻译。
SMT取得了很大的突破,并在实际应用中取得了一定的成功。
3. 神经机器翻译阶段在近年来,随着深度研究的兴起,神经机器翻译(Neural Machine Translation,简称NMT)成为机器翻译的新热点。
NMT使用神经网络模型,通过端到端的研究方法进行翻译。
与传统的SMT相比,NMT能够更好地处理句子的结构和语义,翻译质量有了显著提升。
4. 强化研究和迁移研究近年来,强化研究和迁移研究等技术被应用于机器翻译中,进一步提升了翻译质量和效果。
强化研究可以通过与环境的交互研究,提高翻译系统的自主决策能力。
迁移研究则可以将已经研究到的知识和模型迁移到新的任务中,从而提高机器翻译的效率和准确性。
5. 基于预训练模型的机器翻译最近,基于预训练模型的机器翻译方法逐渐受到重视。
这些方法利用大规模的无标注语料进行预训练,然后通过微调的方式进一步优化翻译质量。
这种方法在一些任务和语言对上已经取得了很好的效果。
总的来说,机器翻译经历了从规则和字典到统计模型,再到神经网络模型的发展过程。
机器翻译技术白皮书

机器翻译技术白皮书摘要:机器翻译技术是一种利用计算机自动将一种语言的文字转换为另一种语言的技术。
随着全球化的加速发展,机器翻译技术在跨语言交流、商务合作、文化交流等方面发挥着重要作用。
本白皮书将介绍机器翻译技术的原理、应用领域、挑战与机遇,并展望其未来发展方向。
1. 简介机器翻译技术是指通过计算机自动将一种语言的文字转换为另一种语言的技术。
其目的是实现不同语言之间的自动翻译,提供便捷的跨语言交流工具。
机器翻译技术的发展离不开自然语言处理、机器学习、神经网络等领域的支持。
2. 机器翻译技术原理机器翻译技术的原理主要包括基于规则的机器翻译、统计机器翻译和神经机器翻译。
基于规则的机器翻译是通过定义一系列的语言规则和词典来进行翻译,但其受限于规则的准确性和覆盖范围。
统计机器翻译则是基于大规模双语语料库进行训练,利用统计模型来进行翻译,但其对语言的理解能力有限。
神经机器翻译则是近年来兴起的一种方法,通过神经网络模型来进行翻译,具有更好的表达能力和泛化能力。
3. 机器翻译技术应用领域机器翻译技术在多个领域都有广泛应用。
在商务合作方面,机器翻译可以帮助企业进行跨国合作、商务谈判等,提高沟通效率。
在旅游领域,机器翻译可以帮助游客解决语言障碍,提供更好的旅行体验。
在科技研究领域,机器翻译可以帮助研究人员更好地获取和理解其他语言的研究成果。
4. 机器翻译技术挑战与机遇机器翻译技术仍然面临着一些挑战。
首先,语言的多样性和复杂性使得翻译任务变得困难。
其次,文化差异和语言习惯也会影响翻译的准确性和流畅性。
此外,机器翻译技术还需要解决低资源语言的翻译问题,以及专业领域的术语和语境理解等挑战。
然而,机器翻译技术也面临着巨大的机遇。
随着互联网的普及和全球化的加速发展,跨语言交流的需求不断增长。
同时,深度学习和神经网络的发展为机器翻译技术提供了更好的模型和算法支持。
未来,机器翻译技术有望在各个领域实现更高的准确性和流畅度。
5. 未来发展方向未来机器翻译技术的发展方向主要包括以下几个方面。
软件开发知识:如何实现高效的机器翻译和自然语言生成

软件开发知识:如何实现高效的机器翻译和自然语言生成随着全球化和信息时代的到来,自然语言处理技术成为了日益重要的领域。
机器翻译和自然语言生成是其中的两个主要方向。
它们的目标都是让计算机更好地理解和使用自然语言。
本文将会探讨如何实现高效的机器翻译和自然语言生成,并介绍当前行业内应用最广泛的技术和方法。
一、机器翻译技术概述作为一项基于计算机辅助语言翻译的技术,机器翻译首要面对的问题是语言间的差异性。
翻译过程中需要将一种语言中的语义和结构转化为另一种语言的语义和结构。
不同的语言之间,在语言结构和文化背景上存在较大的差异,使得计算机无法直接进行语言转换。
机器翻译因此成为了一项困难而又重要的研究课题。
1.机器翻译基本原理机器翻译技术的核心是基于统计模型。
该方法通过对大量的双语语料库进行学习,建立一个转移模型,实现自动翻译。
因此,机器翻译系统主要包含以下几个部分:(1)语言分析:将输入的句子依赖结构进行分析,包括分词、句法分析和语义分析。
(2)翻译模型:将分析得到的源语言句子转换为目标语言句子,其中主要包括翻译和调序。
(3)语言生成:将翻译得到的句子依据语言结构和文化背景进行自然语言生成。
2.机器翻译技术发展概述历史上,机器翻译技术曾经经历过从规则型转向统计型的演进。
不过,随着神经网络技术的发展,基于深度学习的神经机器翻译技术已经成为了市场主流。
经典的统计机器翻译技术以短语为基本单位,针对一个句子,需要将其分解为多个短语,然后对每个短语进行翻译。
这种方法的主要问题在于,在翻译词序、调序等方面存在问题,以及训练样本需要高质量的双语语料库。
而基于神经网络的机器翻译技术能够直接将整个语言句子作为输入,并进行端到端的训练。
其中最经典的代表就是谷歌于2016年发布的神经网络机器翻译系统——GNMT。
该系统将句子向量化,并通过编码-解码结构将源语言句子翻译为目标语言句子。
3.机器翻译技术面临的挑战虽然机器翻译已经取得了长足的进步,但现阶段仍需解决诸如语言结构、语义、语用和文化差异等难点问题。
机器翻译方法概述

2
10.3.1 机器翻译方法概述
▪ 3. 中介语式翻译系统(inter-lingual MT systems) 先生成一种中介的表达方式,而非特定语言的结构; 再由中介的表达式,转换成译文。
基于规则的翻译
3
中介语式的翻译
10.3.1 机器翻译方法概述
▪ 4. 知识库式翻译系统(knowledge-based MT systems) 翻译经常需要除了词汇之外的各种知识,使用知识获取工 具(knowledge acquisition),以充实知识库的内容。
4
10.3.1 机器翻译方法概述
▪ 5. 统计式翻译系统(Statistics-based MT systems )
目前,Google翻译的大部分语言采用的都是统计机器翻 译的方法,在美国国家标准局组织的机器翻译评测中遥遥 领先。 此外,基为语言的产生构造某种合理的 统计模型,并在此统计模型基础上,定义要估计的模型参 数,并设计参数估计算法。早期的基于词的统计机器翻译 采用的是噪声信道模型,采用最大似然准则进行无监督训 练,而近年来常用的基于短语的统计机器翻译则采用区分 性训练方法,一般来说需要参考语料进行有监督训练。
发展历程:
直接型
间接型
中间语言型
转换型
1
10.3.1 机器翻译方法概述
机器翻译的基本原理和方法

机器翻译的基本原理和方法摘要:机器翻译是一种通过计算机自动将一种语言的表达转换为另一种语言的方法。
本文将介绍,包括传统方法和最新的深度学习方法。
第一部分:引言机器翻译是人工智能领域的一个重要研究方向,旨在通过计算机自动将一种语言的表达转换为另一种语言,以实现不同语言之间的交流和理解。
机器翻译的研究和应用对于促进全球信息交流和跨文化交流具有重要意义。
本文将介绍,包括传统方法和最新的深度学习方法。
第二部分:传统机器翻译方法传统机器翻译方法主要基于规则的方法和统计的方法。
规则的方法是通过定义一个包含语法、语义等方面知识的规则库,在翻译过程中根据这些规则来实现翻译。
规则的方法需要人工编写规则,因此需要大量的人力和时间,并且对于语言的规则和特点的覆盖较为有限,因此在实际应用中并不常见。
统计的方法是通过大规模语料库的统计分析来实现翻译。
统计的方法通常包括两个主要步骤:训练和解码。
在训练过程中,计算机通过学习大规模的双语语料库,建立一个统计模型,用于表示两种语言之间的对应关系。
在解码过程中,计算机根据给定的输入语句,通过搜索找到最有可能的输出语句。
统计的方法在实际应用中取得了很好的效果,但是由于其依赖大规模的语料库,对于语言的覆盖和处理能力有一定的限制。
第三部分:最新的深度学习方法最新的深度学习方法在机器翻译领域取得了重大突破。
深度学习是一种基于神经网络的机器学习方法,通过多层次的特征表示和学习来实现对复杂模式的建模。
深度学习方法主要包括递归神经网络(RNN)和卷积神经网络(CNN)两种。
递归神经网络是一种能够处理序列数据的神经网络模型,在机器翻译中被广泛应用。
递归神经网络通过对输入语句的逐个词进行处理,并通过词与词之间的关系来预测输出语句。
递归神经网络能够捕捉到语言的上下文信息,因此在翻译长句子和复杂句子时具有一定的优势。
卷积神经网络是一种能够提取局部特征和整体特征的神经网络模型,在机器翻译中也有一定的应用。
什么是机器翻译

机器翻译的利与弊
通过对机器翻译和人工翻译的比较,发现
机器翻译有其速度快、效率高、词汇量 大的优点,但也发现机器翻译存在的不足, 比如翻译死板、灵活性低、句子歧义和 存在文化因素的问题 。
智能型
基于语料库的机译系统是以语 料的应用为核心,由经过划分 并具有标注的语料库构成知识 库。基于语料库的方法可以分 为基于统计(Statisticsbased)的方法和基于实例 (Example-based)的方法。
基于统计的机器翻译
基于统计的机器翻译方法把机器翻译看成是一 个信息传输的过程,用一种信道模型对机器翻 译进行解释。这种思想认为,源语言句子到目 标语言句子的翻译是一个概率问题,任何一个 目标语言句子都有可能是任何一个源语言句子 的译文,只是概率不同,机器翻译的任务就是 找到概率最大的句子。具体方法是将翻译看做 对原文通过模型转换为译文的解码过程。Biblioteka 中 国 的 机 器 翻 译
系 统 划 分
机译系统可划分为基于规则( RuleBased )和基于语料库(Corpus-Based) 两大类。前者由词典和规则库构成知识 源;后者由经过划分并具有标注的语料 库构成知识源,既不需要词典也不需要 规则,以统计规律为主。机译系统是随 着语料库语言学的兴起而发展起来的, 世界上绝大多数机译系统都采用以规则 为基础的策略,一般分为语法型、语义 型、知识型和智能型。不同类型的机译 系统由不同的成分构成。抽象地说,所 有机译系统的处理过程都包括以下步骤: 对源语言的分析或理解,在语言的某一 平面进行转换,按目标语言结构规则生 成目标语言。技术差别主要体现在转换 平面上。
在线机译
目前网络上比较知名的几译 。
机器翻译的现状
我们需要的是计算机帮助人类完成某些翻译 工作,而不是完全替代人,人与机器翻译系 统之间应该是互补的关系,而不是相互竞争。 机器翻译还不成熟,需要的是人与系统的配 合,而不是有意为难,辅助机器翻译可以大 大减轻人的负担。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
模型训练(EM算法—词对齐)
基于统计的机器翻译
英文: The proposal will not now be implemented 法文: Les(1) propositions(2) ne(4) seront(3) pas(4) mises(7)
en(7) application(7) maintenant(5)
响,而提出。 强调对源语言进行更为彻底的分析和理解。 不仅进行深层语言学分析,还需要进行世界知识
(world knowledge)的显式处理。 需要建立对语言理解有益的本体知识库(ontology)。
机器翻译的基本方法
研制代价昂贵,没有特别成功的案例。
基于规则的翻译方法图示
机器翻译的基本方法
机器翻译概述
常宝宝 北京大学计算语言学研究所 chbb@
什么是机器翻译
研究目标:研制出能把一种自然语言(源语言)的文 本翻译为另外一种自然语言(目标语言)的文本的计 算机软件系统。 制造一种机器,让使用不同语言的人无障碍地自由交 流,一直是人类的一个梦想。
随着国际互联网络的日益普及,网上出现了以各种语 言为载体的大量信息,语言障碍问题在新的时代又一 次凸显出来,人们比以往任何时候都更迫切需要语言 的自动翻译系统。 但机器翻译是一个极为困难的研究课题,无论目前对 它的需求多么迫切,全自动高质量的机器翻译系统 (FAHQMT)仍将是人类一个遥远的梦。
(三)源语言到目标语言的对译知识。在基于转换的 系统中,系统需要根据各种级别的对应关系来完成 源语言到目标语言的转换。最基本的是词之间的对 译知识。
规则系统中的知识表示
(四)领域知识和世界知识。利用源语言知识、目标 语言知识,在领域知识和世界知识的协助下,可以 更好地完成对源语言的理解和目标语言的生成。
Ҽ Ñ CVODI fÑ
基于实例的机器翻译
Example Based Machine Translation(EBMT) 1984年由日本著名机器翻译专家长尾真提出 背景 建立在转换基础上的机器翻译系统,在差异较大语
言对间进行互译时,效果不好 人在翻译时不做深层次语言学分析 人在学外语的时候,首先要作大量的对照记忆,在
机器翻译的基本方法
不同系统采用不同层次内部表示,例如浅层句法表 示或深层句法语义表示。
商业上最为成功的方法,目前绝大部分商品化机器 翻译系统采用转换式机器翻译方法。
基于知识的机器翻译方法(knowledge-based machine translation) 20世纪70年代,受人工智能、知识工程发展的影
在词序、词汇、结构等方面的差异。 翻译效果差,属于早期过时认识,现已无人采用 How are you ? 怎么 是 你 ? How old are you ? 怎么 老 是 你 ?
机器翻译的基本方法
中间语言法(interlingua approach) 中间语言(interlingua)是一种中间表达,通常是一种句
机器翻译的使用
对于信息传播型用户而言 译文质量十分关键,跨国公司的所有技术资料都应
准确翻译,不存在妥协的可能。 目前机器翻译似乎难以发挥作用 但跨国公司产品数量有限、领域狭窄,可采用子语
言技术以及后编辑(post-edit)技术 机器辅助翻译技术和翻译记忆(translation memory)技术广
中间语言法在理论上非常经济,可有效减少翻译模 块的数量。可把n(n-1)个直接翻译模块减少为2n个 翻译模块。
机器翻译的基本方法
把任何一种自然语言翻译成为一种独立的中间语 言,需要深层次的语言分析和生成技术,目前没有 特别成功的基于中间语言的机器翻译系统。
转换法(transfer approach) 分析源语言文本,得到源语言的内部表达 将源语言内部表达转换成目标语内部表达 根据目标语内部表达生成目标语文本 翻译过程分成三个阶段
基于统计的机器翻译
翻译问题可用噪声信道来描述
T → 噪音信道 → S
基本模型
Tˆ = argmaxPr(T ) Pr(S | T )
T
Tˆ = argmax Pr( T | S )
T
Pr( T | S ) = Pr( T ) Pr( S | T ) Pr( S )
Pr(S|T)称为语ԊSՑTٙᔕ译ᅼۨ
20世纪80年代中后期,基于语料库的机器翻译技术得 到越来越多的关注。 试图避开知识库建设的困难 试图回避对源语言进行深层语言分析 翻译知识主要来自双语平行语料库 基于实例的翻译通过模仿实例库中已有的翻译基于
类比的策略进行翻译。 基于统计的机翻译通过建立统计翻译模型、训练统
计模型进而基于统计模型进行翻译。 考虑到这些方法背后的哲学背景,也常把基于规则的 方法称为理性主义(rationalism )方法,而把基于语料库的 方法称为经验主义(empiricism)方法。
基于实例的机器翻译
EBMT的关键问题
大规模的双语语料库 双语对齐问题
语篇、句子、短语和词汇等各种级别
建立合理的相似度准则 高效的实例检索机制 译文生成
翻译记忆技术和基于模板的翻译技术
基于统计的机器翻译
Statistic-Based Machine Translation(SBMT) 翻译问题是解密问题 50年代初曾有提及,遭到以Chomsky为代表的 语言学家的反对 90年代初,统计翻译技术复苏 统计技术在语音识别领域获得成功 目前计算机性能已能胜任密集型计算 目前也有大量联机双语电子文本
(五)有关社会、文化和习俗的知识。在人工翻译 中,这些知识也起着重要作用。但鉴于目前的处理 水平,几乎没有机器翻译系统把该类知识纳入处理 范围。人们目前还缺乏有效方法把这些知识以机器 可以操作的方式描述出来。
规则系统中的知识表示
词典 机器翻译系统中,有关词的知识记录在词典中,源 语言的形态知识、句法知识和语义知识记录在源语 言词典中。目标语言的形态知识、句法知识等记录 在目标语言词典中。词语间的对译关系则记录在对 译词典中。
遇到新的句子时,会和记忆中的句子类比 建立基于类比思想的机器翻译
基于实例的机器翻译
基本思想
主要知识库是双语对 照的实例库
当需要翻译一个新句 子时,通过检索的办 法在实例库中寻找和 该句类似的翻译实 例。
新句子的翻译可通过 模拟最类似的实例的 译文的方式获得。
基于实例的机器翻译
EBMT的优点
机器翻译的基本方法
机器翻译的基本方法 基于规则的机器翻译方法
直接翻译法 转换法 中间语言法 基于语料库的机器翻译方法 基于统计的方法 基于实例的方法 混合式机器翻译方法
目前没有任何
一种方法能实现机 器翻译的完美理 想,但在方法论方 面的探索已经使得 人们对机器翻译问 题的认识更加深 刻,而且也确实带 动了不少虽不完美 但尚可使用的产品 问世。
泛使用 机器翻译也可较好保证术语翻译的一致性
机器翻译的使用
对于信息吸收型用户而言 往往面临太多的文献需要浏览,但并非对所有文献
都有兴趣 机器可以提供一个初步的翻译,虽不准确,但可传
达文献的总体思想,有利于用户定位文献 对于选出的文献,可以聘请专人进行译后编辑或聘
请专家进行翻译 同聘请翻译人员相比,机器翻译具有廉价和高速的
词Պ 规则库
结ᦻ转换
ͦ标语Ԋ˖͉ Җ态͛ϓ 译词选择 句ɿ͛ϓ
规则翻译方法例示
䜲ɝjμҪɓҼ׳ڀίࣲɪf
切ʱձ标ءjμSҪQɓNҼRڀO׳WίQࣲOɪGfX
规则翻译方法例示
䜲ɝjμҪɓҼ׳ڀίࣲɪf
句جʱؓj
机器翻译的基本方法
20世纪90年代以前,机器翻译方法的主流一直是基于 规则的方法,因此基于规则的方法也被称为传统的机 器翻译方法。 直接翻译法 逐词进行翻译,又称逐词翻译法(word for word translation) 无需对源语言文本进行分析 对翻译过程的认识过渡简化,忽视了不同语言之间
法-语义表达(syntactic-semantic expression),中间语言独立 于任何具体的自然语言。 源文本经过深层分析得到其对应的中间语言表示。 再由该中间表示生成目标语文本。 翻译过程为两个阶段。
机器翻译的基本方法
不同系统采用不同的中间语言,有的是一种逻辑形 式的语言,有的甚至采用类似自然语言的人工语 言,如:荷兰政府支持的DLT计划采用世界语 Esperanto做中间语言。
优势
机器翻译的使用
目前机器翻译的价值不在于它可以取代翻译专家,而在 于它可在一个完整翻译过程的部分环节中有所贡献。
机器翻译的价值也体现在它可以带来翻译生产率的提高 和翻译成本的降低这两个方面。
互联网时代对机器翻译的新需求 (1) 网页的翻译 (2)网络聊天室、技术论坛中用户交谈的实时翻译 (3)跨语言信息检索(Cross Language Information Retrieval) (4)跨语言的信息提取
系统维护容易
系统中知识以翻译实例和义类词典等形式存在,可以很容 易的利用增加实例和词汇的方式扩充系统。
容易产生高质量的译文
尤其是利用了较大的翻译实例或和实例精确匹配时更是如 此。
可避免进行深层次的语言学分析
类义词典的作用
The rabbit eats vegetables Sulfuric acid eats metal He eats apple?
规则 为了源语言句子分析和目标语言句子生成的需要, 还需要有关句子结构的知识。句子或短语的组成规 律用规则描述。源语言和目标语言结构间的对应关 系一般用转换规则来表达。
规则系统的基本流程
词法分析 句法分析 语义分析 结构转换 句子生成 译词选择 形态生成