机器翻译技术的探讨
机器翻译技术的发展及未来趋势分析

机器翻译技术的发展及未来趋势分析一、引言随着全球化的深入发展,各国之间的交流与合作日益密切,语言翻译的需求也越来越大。
机器翻译技术,正是在这种大环境下应运而生。
机器翻译技术利用计算机来处理源语言和目标语言之间的转换,能够实现实时、高效、准确的翻译,大大提高了人们的翻译效率和质量。
本文将针对机器翻译技术的发展及未来趋势进行分析。
二、机器翻译技术的发展历程1.传统机器翻译技术传统机器翻译技术主要依靠语言规则和词典,通过对语言规则和词典进行分析和处理,将源语言转化为目标语言。
这种方法虽然能够处理一些简单的语言互译,但是对于大量的自然语言表达和潜在意义的捕捉,准确性还存在一定的局限。
2.神经机器翻译技术神经机器翻译技术是利用人工神经网络来模拟人脑的记忆和思考过程,通过大量的语料训练,能够自动学习语言之间的映射关系,并将源语言转化为目标语言。
相比于传统机器翻译技术,神经机器翻译技术更具有准确性和泛化性,已经成为现代机器翻译领域的主流技术。
三、机器翻译技术的发展趋势1.加强神经机器翻译技术的深度学习能力随着人工智能技术的发展,神经机器翻译技术也会进一步发展,增强其深度学习能力,提高其自主学习和理解语言意义的能力。
2.实现多语种、多模态的机器翻译传统的机器翻译技术主要针对单一语种进行翻译,未来的机器翻译技术将会实现多语种、多模态的翻译,将会应用于语音识别、声音处理、图像处理等领域。
3.通过深度融合来提高翻译质量深度学习和神经机器翻译技术的发展,将会带来多种信息的融合,例如声音、图像、文本等,这将会帮助机器翻译技术更全面地捕捉实际情境中的意义,并提高翻译质量。
四、机器翻译技术的应用1.机器翻译在商务领域的应用随着全球化的发展,商务活动的跨境交流越来越普遍。
机器翻译技术能够帮助商务人士进行跨文化交流,提高商务活动的效率和精度。
2.机器翻译在旅游领域的应用旅游是人们在生活工作之余,寻求放松和娱乐的方式。
随着社会经济和科技的发展,人们的旅游活动也越来越多样化和国际化。
机器翻译技术论文

机器翻译技术论文机器翻译是使用计算机实现一种自然语言文本到另一种自然语言文本的翻译。
下面是店铺整理的机器翻译技术论文,希望你能从中得到感悟!机器翻译技术论文篇一机器翻译在翻译实践中的应用摘要: 本文研究机器翻译在翻译实践中的应用,其由两部分组成:第一部分概述机器翻译,第二部分通过一个具体的翻译任务演示谷歌翻译工具的用法。
关键词: 机器翻译谷歌翻译译后编辑一、机器翻译概述机器翻译是指将翻译过程的部分或全部使用机器实现自动化(Austermühl,2006)。
一般认为机器翻译的思想起源于1949年写作的韦弗备忘录,而后机器翻译的发展经历了重大的起伏。
时至今日,机器翻译的研究和产品如雨后春笋般不断涌现出来,机器翻译已然成为一个具有重大社会意义、政治意义、商业价值、科学价值和哲学意义的重要课题。
机器翻译系统可以依据不同的标准分为不同的种类。
根据机器翻译系统的使用环境可以分为三类:低端机器翻译系统、用户定制的高端机器翻译系统和基于因特网的机器翻译系统。
低端机器翻译系统的目标客户是个人,用户定制的高端机器翻译系统的目标客户是公司,基于因特网的机器翻译系统则是一种通过因特网使用的。
根据机器翻译系统使用的技术可以分为下图所示的五类:基于规则的机器翻译系统、基于语料库的机器翻译系统、多引擎机器翻译系统、在线机器翻译系统和口语机器翻译系统(Feng,2004)。
一般而言,由于自然语言中诸如歧义、复杂句法、成语和照应关系之类问题,机器翻译的输出结果并不能令用户满意。
于是一些人认为机器翻译系统对于译员而言毫无用处。
我认为这是一种误解。
翻译的过程一般可以分为两个阶段:第一阶段是翻译出译稿,第二阶段是修改译稿以求译文可以达到要求。
在多数情况下使用机器翻译的目的仅仅是将第一阶段自动化,即翻译出译稿。
然后由译员修改译稿,最终产出达到要求的译文。
由此可见,机器翻译在将文本翻译成译稿的过程中大有用处。
在使用机器翻译将文本翻译成译稿的过程中,我们还可以使用多种方法提高机器翻译输出结果的质量。
机器翻译的技术和优缺点

机器翻译的技术和优缺点机器翻译是一种基于计算机技术的翻译方式,其实现原理是通过软件程序将一种语言自动转换成另一种语言。
随着人工智能、大数据等技术的不断发展,机器翻译在翻译行业中扮演着越来越重要的角色。
本文将从机器翻译的技术原理、优点和局限性三个方面来进行探讨。
一、技术原理机器翻译的技术原理主要分为三种类型:基于规则的机器翻译、统计机器翻译以及深度学习机器翻译。
基于规则的机器翻译,是一种利用专家制定的语言规则和语法规则实现翻译的技术,需要人工编写的规则非常严谨。
这种方法的翻译准确率相对较高,但需要大量的人工干预和专业知识,而且只适用于有限的语言对。
统计机器翻译,是一种通过大量双语语料库来训练计算机学习翻译模板的方法。
具体来说,就是通过分析一种语言和另一种语言的对应翻译样本,以此建立由输入语言到输出语言之间的映射模型。
这种方法的翻译速度较快,适用范围也比较广,但是需要大量的语料库支持,翻译结果质量的优劣取决于训练的质量和句子之间的相似度。
深度学习机器翻译则是近年来出现的一种高级翻译技术。
在这种方式中,计算机需要学习如何进行翻译。
通过深度学习技术建立神经网络,让计算机从资料库中学习翻译,从而能够进行人类水平的翻译。
这种方式的翻译效果比前两种都要好,可以适用于多语言和多领域的翻译,但是需要大量的训练数据,建立好的神经网络也会消耗大量的计算资源。
二、优点机器翻译具有明显的优点,其最大的优势在于高效性和低成本。
首先,机器翻译可以进行大量翻译工作,不需要休息和休假。
与人工翻译相比,机器翻译可以快速地翻译大量的文件、文章和网站。
这不仅节约了时间,还可以为翻译公司提供更快、更准确、更高质量的翻译服务。
其次,机器翻译是可以降低翻译成本的。
相比人工翻译,机器翻译不需要支付工资、保险和福利等社会成本。
当然,机器翻译并不是所有情况下都能降低成本,因为有时由于翻译质量不好、翻译错误或存在文化差异等原因需要重新修订翻译结果,这需要道德、专业和人工等资源来完成。
机器翻译技术的现状和未来发展趋势

机器翻译技术的现状和未来发展趋势随着全球化进程的加速,人类的交流需求越来越高,而语言壁垒却给交流带来了无法逾越的障碍。
机器翻译技术的出现解决了这一难题,让人类交流变得更加无缝便利。
本文将探讨机器翻译技术的现状和未来发展趋势。
一、机器翻译技术的现状机器翻译技术是一种将一种语言的文本转换成另一种语言的过程。
不同于人工翻译,机器翻译由计算机系统完成。
机器翻译技术的优点在于,它可以快速高效地翻译大量的文本,而且可以根据需要进行实时翻译,具有很高的灵活性。
然而,机器翻译技术的发展历程也充满了曲折与挫折。
早期的机器翻译技术受限于计算机处理能力和语言处理技术的不足,翻译效果很差。
但随着计算机技术和人工智能技术的发展,机器翻译技术变得越来越成熟和优秀。
例如谷歌翻译等机器翻译工具已经可以实现基本的翻译需求。
然而,机器翻译技术目前仍面临一些挑战。
一些语言之间的语言差异比较大,翻译起来较为困难。
一些语言中存在大量的歧义和多义词,这使得翻译词汇选择变得更加困难。
此外,许多语言中有大量的文化隐喻和表达方式,这也极大地增加了机器翻译的难度。
二、机器翻译技术的未来发展趋势机器翻译技术的发展趋势一直很明显:它将越来越接近人工翻译的效果。
在未来,机器翻译技术将面临着三个主要挑战。
1. 机器翻译技术需要表现得更加人性化机器翻译技术的翻译效果仍然比人工翻译差。
如果机器翻译技术想要在市场中取得更好的表现,它必须表现得更加人性化,这包括提高翻译质量和增加定制化服务。
机器翻译技术将提供更高质量的翻译,以及更多的翻译选择。
2. 语言差异问题依然存在虽然机器翻译技术在语言差异问题上得到了很大的改善,但这个问题还远远没有解决。
在未来,机器翻译技术需要更加深入地了解不同语言之间的差异,以便更准确地进行翻译。
3. 文化隐喻和表达方式的翻译问题仍然存在文化隐喻和表达方式是机器翻译技术面临的另一个难题。
这些隐喻和表达方式在语言中非常常见,但对于非本国人来说却很难理解。
机器翻译技术的优缺点分析

机器翻译技术的优缺点分析随着全球化的快速发展,跨国交流越来越频繁,语言隔阂也成为一大瓶颈。
而机器翻译技术的不断进步,为解决语言隔阂带来了新的可能性。
但是,机器翻译技术在实际应用中也存在一些优缺点,本文将从多个角度分析这些优缺点。
一、机器翻译技术的优点1.大幅提升翻译效率传统的人工翻译需要专业的翻译人员,消耗大量的时间和精力。
然而,机器翻译技术采用了自动化、智能化的处理方式,可以快速高效地完成翻译工作,减少了人工翻译所需的时间和成本。
尤其是对于大量、繁琐的文件翻译,机器翻译技术具有明显的优势。
2.简化跨语言交流机器翻译技术使得我们能够在不同的语言环境下进行更加便捷的沟通。
无论是商务洽谈、旅游、学术交流还是其他海外事务,只要有机器翻译的支持,就能够大幅简化跨语言交流的成本和困难,使得有效沟通变得更加容易。
3.提升翻译准确度随着机器学习、深度学习等技术的不断发展,机器翻译技术的翻译准确度也越来越高。
尤其是对于语义复杂的长句、技术术语等特殊情况,机器翻译技术能够做出较为准确的翻译,大大提升了翻译的质量。
二、机器翻译技术的缺点1.存在难以避免的翻译误译机器翻译技术在遇到类似语义歧义、语言习惯等特殊情况时,难免会出现翻译误译的现象。
这种误译有时候可能是极其严重的,尤其是对于商务、法律等领域的翻译。
与此同时,这些翻译误差也给人带来了解读的难度,特别是对于不熟悉原语种的读者来说,仍然需要额外的努力去理解。
2.对于语言习惯的识别有限每个语言都有自己的独特语言习惯和语言文化,要想将这些习惯和文化在不同的语言中准确地表达出来是非常困难的。
机器翻译技术的翻译结果受限于其语言模型和训练数据的多样性,往往无法准确地识别各种类型的语言习惯。
这使机器翻译在人文领域的应用受限,例如文学、哲学等领域。
3.翻译质量需要人工干预尽管机器翻译技术在自动化、智能化处理方面有了重大的进步,但在翻译精确性上仍需要人类专业人员进行后期校对和修正。
机器翻译技术研究与应用分析

机器翻译技术研究与应用分析一、介绍随着人工智能技术的快速发展,机器翻译技术也越来越受到人们的关注。
机器翻译是指使用计算机或其他机器设备将一种语言的文字或口语翻译成另一种语言的过程。
随着全球化趋势的加速发展,跨语言交流已经成为一项越来越重要的任务,因此机器翻译在多种应用场景中得到了广泛应用,如商务沟通、科技交流、学术研究等。
本文将以机器翻译技术的研究和应用为切入点,进行分析和探讨。
二、机器翻译技术的类别机器翻译技术可以分为基于规则的机器翻译和基于统计的机器翻译。
1.基于规则的机器翻译基于规则的机器翻译(Rule-based Machine Translation,RMT)是指根据语法和词汇规则,通过人类所设定的规则,来对源语言进行分析,并翻译成目标语言。
规则可以包括语法、词典、语言知识库等。
这种方法需要人为的指导和规则的输入,需要花费大量的时间和精力。
2.基于统计的机器翻译基于统计的机器翻译(Statistical Machine Translation,SMT)是一种利用大量双语语料库来建立翻译模型的方法。
在这种方法中,翻译模型从大量的双语素材中学习,然后进行预测。
这种方法不需要人为指导或规则的输入,模型可以自主学习,减少了开发成本和时间。
三、机器翻译技术的应用机器翻译技术的应用范围非常广泛,下面将分别介绍几个应用领域。
1.商务沟通在全球化的情况下,企业、政府机关等需要频繁进行跨语言交流。
机器翻译技术的应用可以有效地解决跨语言沟通问题,如翻译商务文件、合同等。
2.科技交流在全球化时代,国际学术交流的必要性不断提高,机器翻译技术可以帮助破解跨语言交流的障碍。
利用机器翻译技术可以方便地获取外国的学科资料和研究成果,促进国际学术交流。
3.旅游服务在国外旅游时,许多人语言不通,机器翻译可以为游客提供便利,如翻译菜单、路标等。
机器翻译技术的应用可以提高旅游服务的质量和效率,促进旅游业的发展。
4.文化交流文化交流也是一种重要的跨语言交流形式,机器翻译技术可以为不同国家和地区的人们提供更多的交流机会,在拉近不同文化之间的距离方面发挥积极作用。
机器翻译技术的研究与发展趋势

机器翻译技术的研究与发展趋势随着全球化进程的加速,语言交流依旧是制约国际交往的重要因素之一。
传统的翻译方式需要大量的人力物力,同时还存在着质量、成本的问题。
由于机器翻译技术具有速度快、成本低等优点,近年来得到了广泛的关注和研究。
本文将对机器翻译技术的现状与发展趋势进行分析和探讨。
一、机器翻译技术的现状机器翻译技术经历了数十年的发展,从最早的基于规则的翻译方法,到统计机器翻译、深度学习机器翻译的出现,机器翻译技术越来越成熟和完善。
基于规则的翻译方法,是通过人工处理语言规则和知识,对原文进行翻译的方法。
该方法的缺点是无法处理语言的复杂性和变化性,也无法应对不同地区的语言差异。
相比之下,统计机器翻译能够更好地解决这些问题。
该方法利用大量的语料库,通过统计和分析,得出翻译的最优解,进而进行翻译。
该方法的缺点是需要大量的语料库和计算资源,同时受到数据偏差的干扰,翻译效果往往难以满足用户的需求。
近年来,深度学习机器翻译技术的出现,为机器翻译技术的发展带来了新的突破。
该技术利用神经网络模型,通过大量语料库的学习,从而自主学会语言的翻译规则和特征,进而实现智能化翻译。
深度学习机器翻译技术在处理复杂语言时效果尤佳,已经在多个领域得到成功应用。
二、机器翻译技术的发展趋势随着人工智能技术的不断发展,机器翻译技术也将得到持续发展。
以下是未来机器翻译技术的发展趋势:1、深度学习机器翻译技术的提升深度学习技术发展迅猛,未来深度学习机器翻译技术将有更多的发展空间。
未来深度学习机器翻译技术有望在处理口译、文学作品等方面取得更好的效果。
2、多模态机器翻译随着人们对语言交流的要求越来越高,语音、图像等多模态交互也成为了机器翻译技术的发展趋势。
在多模态机器翻译中,机器不仅要能够听懂、读懂,还要能够理解图片、视频等语音以外的信息。
3、自适应机器翻译未来机器翻译技术有望实现自适应机器翻译。
这就是说,机器翻译系统将根据用户的需求和习惯,自动适应翻译结果,从而提供更加个性化的翻译服务。
人工智能翻译技术的利与弊

人工智能翻译技术的利与弊随着科技的不断进步,人工智能翻译技术在跨语言交流中扮演着越来越重要的角色。
人工智能翻译技术的出现,既带来了诸多的便利,也带来了一些问题和挑战。
本文将从利与弊两个方面对人工智能翻译技术进行探讨。
一、利:提高翻译效率和准确性人工智能翻译技术在短时间内能够实现大量的翻译工作,极大地提高了工作效率。
传统的人工翻译通常需要花费大量的时间和精力,而人工智能翻译技术能够在几秒钟内完成翻译任务。
此外,人工智能翻译技术凭借其强大的处理能力,可以在较短的时间内完成大量文本的翻译工作,从而缩短了处理时间,提高了翻译的效率。
同时,人工智能翻译技术在准确性方面也表现出色。
由于其使用了先进的算法和庞大的语料库,可以更加准确地理解源文本的含义,并将其翻译成目标语言。
相比之下,人工翻译由于个人水平和经验的不同,可能存在一定的误差和主观性。
而人工智能翻译技术在准确性方面能够克服这些问题,提供更为准确的翻译结果。
二、弊:语义理解和文化差异限制尽管人工智能翻译技术在提高翻译效率和准确性方面具有巨大优势,但仍存在一些弊端。
其中一个主要问题是语义理解的限制。
虽然人工智能翻译技术能够通过算法来理解源文本的含义,但由于语言之间的语义差异和复杂性,仍然存在一定的困难。
比如,在一些含有多义词或暗示的句子中,机器往往无法准确捕捉到原文的意思,导致翻译出现错误。
此外,文化差异也是人工智能翻译技术面临的挑战之一。
不同的国家和地区有不同的文化背景和习惯,这些差异在翻译过程中需要充分考虑。
然而,人工智能翻译技术通常难以充分理解和运用这些文化差异,导致在翻译中可能出现文化融入不恰当或缺失的情况。
三、应对与解决难题的探索尽管人工智能翻译技术存在一些问题和挑战,但科学家和专家们一直在努力寻找解决方案。
为了提高语义理解能力,研究人员通过深度学习等方法,不断改进机器的理解能力,使其能够更好地理解源文本的含义。
同时,他们还在加大对大规模语料库的积累和利用,以丰富翻译系统的数据库,提高准确性和涵盖范围。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
机器翻译技术的探讨六院五队-徐允鹏-12060143摘要随着国际交流的日益增多,在计算机、互联网等相关技术日新月异的基础上,机器翻译的技术与应用得到了蓬勃发展。
本文详细探讨了基于规则的机器翻译方法、基于语料库的机器翻译方法和混合式机器翻译方法,并讲述了机器翻译的评估方法,最后介绍了机器翻译技术的最新进展。
关键词:机器翻译;基于规则;语料库;评估方法1.机器翻译概述随着国际化交流的普遍性,信息通信的日益膨胀,高效的处理不同领域各种语言之间的互译已成为当代人们的普遍需求。
翻译是解决自然语言之间通信障碍最直接最有效的方法。
传统的翻译工作都是通过专业翻译人员完成,利用语言学知识进行自然语言之间的互译,帮助人们实现信息通信。
伴随着计算机技术的成熟与自然语言处理技术的不断进步,利用机器翻译系统帮助人们快速获取外文信息代替人工翻译已成为一种必然的趋势。
机器翻译(machine translation),又称为自动翻译,是利用计算机把一种自然源语言转变为另一种自然目标语言的过程,一般指自然语言之间句子和全文的翻译。
它是自然语言处理(Natural LanguageProcessing)的一个分支,与计算语言学(Computational Linguistics )、自然语言理解(Natural Language Understanding)之间存在着密不可分的关系[1]。
机器翻译是21世纪要解决的科技难题之一,主要困难是自然语言在各个层次上的歧义性。
研究机器翻译具有重要的实践意义和理论意义。
国际间的合作与交流,语言的差异是一个非常重要的障碍,各行各业的人们面对大量他们不熟悉的语言的文档资料,如果单纯的依靠人工翻译,这些日益的待翻译材料将是一种非常沉重的负担,而机器翻译可大幅度减轻这种负担。
同时,机器翻译对于了解人类语言和思维的基本机制,探讨人工智能技术有着重要的意义。
2.机器翻译方法人们一直在寻求更好的解决机器翻译问题的方法,目前机器翻译方法主要有基于规则的机器翻译,基于语料库的机器翻译和混合式机器翻译方法。
2.1基于规则的机器翻译方法2.1.1基于分析和转换的机器翻译方法人作翻译时,把一个源语言句子译成目标语言句子,设计到四个基本操作:目标语言单词的检索、调序、删词、增词;机器翻译系统的过程包括检索、分析、转换和生成主要四个阶段,这被称为基于分析和转换的机器翻译系统,也被认为是模拟人类翻译活动最恰当的机制[2]。
该方法有三个阶段,为分析—转换—生成。
一般情况下,分析以句法为主、语义为辅,正确的句法结构转换加正确的词汇译文可以从源语言向目标语言传递完整的正确信息。
以句法结构转换附加一定的语义信息, 能够构成转换的基本层次[3]。
标准机器翻译系统中句子和短语层次的结构转换是核心,产生式方式的转换规则形式为:S:S1+S2+···Si <C1 C2···Ck> T1+T2+···Tj :TS是源语言的某个待翻译单位(句子、短语等等),S1~Si是S 中的下一级组成单位对于S,如果满足条件<C1 C2···Ck>, 则目标语言中有T1~Tj译文构成了相应的等价物T。
上述方法称为基于句法的转换方法, 因为S1+S2+···Si一般来说就是源语言的的句法结构表示:也可以称为直接转换方法, 因为对于每个源语言的翻译组块, 都马上给出一个目标语言组块与之对应应该说, 这种转换方法符合人的直觉认识, 也能够实现[3]。
2.1.2基于中间语言的机器翻译方法基于中间语言的翻译方法是对源语言进行分析以后产生一种称为中间语言的表示形式,然后直接由这种中间语言的表示形式生成目标语言。
所谓中间语言就是自然语言的计算机表示形式的系统化, 它试图创造出一种独立于各种自然语言,同时又能表示各种自然语言的人工语言。
基于中间语言的机器翻译方法的优势是无需一种语言到另一种语言的一一转换,对于多语种的翻译系统可以节约大量的转换知识的手工获取工作量,假如有N种语对需要相互翻译, 只要有2N个分析和生成模块就够了。
其中一半是源语言分析模块,输入为原文,输出以1L表示:另一半是目标语言生成模块,输入为1L表示,输出为目标语言译文。
然而,中间语言的机器翻译方法也常遭到怀疑。
因为是否能够构造出表示各种不同的自然语言语法、语义的中间语言至少目前还是未知数。
此外,中间语言能不能把各种语言的所有特征保留下来,又能很好生成对应的各种语言也是问题。
所以,构造中间语言是一个巨大、复杂的工程,还包含许多理论研究,迄今为止的探索还没有好的答案[3]。
基于转换的方法采取了一系列转换生成层次,各种分析多(如词法、句法、语义和语境等),而且在分析的过程中,会出现许多歧义结构,显然,如果没有好的算法,效率就会低;此外,对于那些不符合语法规则的句子,这种方法难于给出正确的翻译结果。
2.2基于语料库的机器翻译方法2.2.1基于统计的机器翻译方法基于统计的机器翻译方法,一般不要任何语言学知识,它的基本原理是实现源语言词汇到目标语言词汇的映射。
其思路受到语音识别研究的启发,因而应用了类似的方法来实现。
研究者用大规模的双语语料库作为基础,对源语言和目标语言词汇的对应关系进行统计,根据统计规律输出译文。
这种方法没有使用语言知识,主要特征是概率统计与随机过程的方法成为了分析和生成过程的唯一方法。
它的主要内容是双语句对的对齐,通过词汇同现的可能性来计算一种语言的一个词映射到另一种语言的一个词(或两个、零个词)的概率。
应该说,基于统计的机器翻译方法的出现改变了机器翻译研究的面貌, 从而开始了机器翻译研究的新阶段。
统计方法最先在语音识别领域取得了成功,机器翻译的噪声通道模型可以视作最早的机器翻译思想, 其思路可以这样理解:目标语言句子源语言句子噪声信道假设说话者已经用目标语想好了一句话T,但是说出的却是源语言句子S。
这样一个过程可以看成为编码过程。
而统计的机器翻译就是要从S回推T, 可以看成解码过程。
这样,统计的机器翻译任务分为两个部分:一是建模,即建立翻译的计算方法以及从双语语料库中估计模型的参数;二是解码,即寻求一种高效搜索算法取有关概率计算的最大值。
基于统计的方法以大规模的双语语料库为基础,需要训练,一般翻译速度比较慢;而且它还有被怀疑之处——这种方法会不会由于本身的固有属性,不可能有很高的译文正确率。
但基于统计的机器翻译方法还是具有很多优势,如开发速度快、周期短、无需人工干预等,在特定领域训练数据充分的情况下翻译性能基本可以达到实用水平。
2.2.2基于实例的机器翻译方法基于实例的机器翻译方法通过结构化的翻译例子直接把源语言的短语和句子与目标语言的短语和句子对应起来,方法的不同使得处理步骤或多或少,但都必须实现源语言到目标语言的转换,其映射关系或者是词到词,或者是短语或句子到与之相应的等价物,或者是一棵句法树到另一棵句法树[4]。
基于实例的机器翻译(EBMT)的实现过程简单概述如下:给定源语言输入句子S,在双语语料库C中匹配查找一个最相近的句子S’,则S’的译文就被接受为S的译文。
翻译的过程一般就是查找和复现相似的例子,发现和记起特定的源语言表达或相似的表达在以前是如何翻译的,把以前的翻译实例作为主要知识源[5]。
2.3混合式机器翻译方法基于混合式的机器翻译方法能够很好的利用两种方法的优点,目前非常盛行。
混合式机器翻译方法是将基于规则的翻译方法和基于统计的翻译方法结合。
在基于规则的技术中引入语料库方法,其中有基于实例的方法、统计方法,通过对语料库的预处理使其转化为自然语言知识库的方法。
Rules post-processed by statistics统计方法做后处理,翻译使用规则方法。
Statistics guided by rules使用规则方法做前后处理,翻译使用统计方法。
混合式机器翻译方法是效果最好的,但目前混合方法中各种模型的耦合方式还比较松散,进行多翻译模型的深度融合可能是未来研究的一个热点。
3.机器翻译评测在机器翻译系统中,系统质量评测问题已经成为整个领域研究的重要内容之一,它直接推动着机器翻译技术的研究。
机器翻译评测起源于1964年美国国家科学院成立的语言自动处理咨询委员会(ALPAC),当时的评测是通过人工的方式对译文的忠实度和流畅性进行的评测。
1992年至1994年,美国国防部高级研究计划署(DARPA)专门组织了一批专家从译文的充分性(adequacy)、流畅性(fluency)和信息量(comprehension)三个角度进行了大量评测。
国内较早的评测系统为北京大学计算语言学研究所的俞士汶教授与二十世纪九十年代初研发的MTE系统,该系统使用分类评估法。
常用的评测标准有:一种是主观评测(subjective evaluation)标准,即由人工通过主观评测对系统的输出译文进行打分;另一处是客观的自动评测(automatic evaluation)标准,即依据建立一定的数据模型对系统的输出译文进行机器自动计算打分。
对于主观评测方法,评测的准确率较高,但是评测人员将候选译文的含义与原文含义对比得出评分,评分人员要全面考虑候选译文的含义与原文含义的异同程度,其需要耗费大量的人力成本和时间代价,性能较低。
与人工评测相比,客观的自动评测方法成本低,速度快,可重用性高,但是准确性比较低。
因此目前对于机器翻译的自动评测研究主要是如何提高翻译的准确率[6]。
4.机器翻译新进展尽管机器翻译已经为人们的学习和工作提供了很多便利,但目前的机器翻译技术并不成熟,还存在着很多缺陷,如基于规则的翻译协调依赖于专家制定的规则,规则的维护与更新非常困难,而基于统计的翻译方法则需要大规模的双语平行语料库,并且领域适应能力较差等等。
总体来说,无论是翻译系统的译文质量、运行速度,还是系统的可操作性、人机交互能力、自学习能力,以及对各种非规范语言现象的处理能力等,都有待于进一步提高。
目前机器翻译的研究者们正努力从两个方向改进机器翻译的性能。
其中一个方向专注于进一步提高现有机器翻译模型的性能,尽量获得令人满意的自动翻译结果;另一个方向则聚焦在已有机器翻译技术的基础上实现机器辅助翻译。
前一个方向中,一部分研究者则在寻求利用更为深入的语言学知识(如语义)对翻译过程进行统计建模,另一部分研究者则在探索统计方法与其他方法的有机结合。
5.结束语机器翻译走过了几十年的发展历程,尽管目前的译文质量仍不尽人意,若干理论问题一直没有从根本上解决,许多方法和技术有待于进一步研究和探索,但我们也欣喜地看到,机器翻译已经在某些特定的领域为人们提供了快捷、方便的翻译服务。