从机器翻译到计算机辅助翻译的发展现状研究

从机器翻译到计算机辅助翻译的发展现状研究
从机器翻译到计算机辅助翻译的发展现状研究

从机器翻译到计算机辅助翻译的发展现状研究

何兴建成都体育学院

摘要:机器翻译,又称自动翻译,是利用计算机把一种自然源语言转变为另一种自然目标语言的过程,一般指自然语言之间句子和全文的翻译。它是自然语言处理的一个分支,与计算语言学、自然语言理解之间存在着密不可分的关系。我们所熟知并广泛使用的互联网翻译,包括谷歌翻译、有道翻译、百度翻译等,都是机器翻译服务。本文从机器翻译的发展历程入手,分析它的优势和不足,并引入计算机辅助翻译进行对比研究。最后,本文通过引入语料库和大数据的概念,探讨了机器翻译技术后续的发展方向,以便更好地为译者服务。

关键词机器翻译;计算机辅助翻译;语料库;大数据

Abstract Machine translation, also known as automatic translation, is a process from a natural source language to another natural target language via computer. As a branch of natural language processing, machine translation has an inseparable relationship with computational linguistics and natural language understanding. Internet translation has widely been used by us. Such as Google Translation, Youdao Translation, Baidu Translation, etc., are all machine translation services. Starting from the development process of machine translation, this paper analyzes its advantages and disadvantages, and then introduces computer aided translation (CAT). Finally, through introducing the concept of corpus and big data, this paper discusses the follow-up development direction of CAT technology, in order that it can give better service for translators.

Key words machine translation (MT); computer aided translation (CAD); corpus; big data

1. 研究背景:机器翻译简介和发展历程

随着国际贸易的发展和经济全球化的崛起,使得市场对专业翻译人才的需求不断增大。机器翻译技术在翻译行业中起着十分关键的辅助作用,可以大大减少翻译的工作量。所谓机器翻译,就是通过电子计算机程序,自动地把一种语言(源语言,source language)翻译成另一种语言(目标语言,target language)。从语言学的角度来讲,机器翻译就是自然语言处理技术的开发。机器翻译从总体模式上可分为三种类型:直接翻译法(Direct Translation)、中间语言法(Interlingual approach)以及转换法(Transfer approach)。

机器翻译的历史最早可追溯到20世纪三四十年代。20世纪30年代初,法国科学家G.B.阿尔楚尼提出了用机器来进行翻译的想法。1933年,苏联发明家П.П.特罗扬斯基设计了把一种语言翻译成另一种语言的机器,并在同年9月5日登记了他的发明。早在1956年,我国就把这项研究列入了全国科学工作发展规划,课题名称是“机器翻译、自然语言翻译规则的建设和自然语言的数学理论”。机器翻译经历了一条曲折而漫长的发展道路,学术界一般将其划分为如下四个阶段:开创期(1947‐1964)、受挫期(1964‐1975)、恢复期(1975‐1989)和新时期(1990‐至今)[1]。

中国机器翻译研究起步于1957年,是世界上第4个开始研究机器翻译的国家,60年代中期以后一度中断,70年代中期以来有了进一步的发展。现在,中国社会科学院语言研究所、中国科学技术情报研究所、中国科学院计算技术研究所、黑龙江大学、哈尔滨工业大学等单位都在进行机器翻译的研究。

在文献冯志伟著的《机器翻译研究》中,法国著名机器翻译专家沃古瓦(B.Vauquois)教授把基于语言规则的机器翻译方法总结为如下的图形(图1),我们可以把这个图形就做“机器翻译金字塔”(MT Pyramid):

图1机器翻译金字塔

Fig.1 machine translation pyramid

从机器翻译金字塔可以看出,一个完整的机器翻译过程是这样的:首先,输入源语言的

句子,经过形态分析,得出句子中每个单词的形态信息和其他信息,再进行句法分析[2]。

机器翻译,尤其是以统计机器翻译方法具有很多优势,如开发速度快、周期短、无需人

工干预等,在特定领域训练数据充分的情况下翻译性能基本可以达到实用水平。因此,统计

方法成为众多机器翻译系统开发者的首选。例如,Google、Microsoft以及国内的有道、百

度等互联网公司开发的在线多语言机器翻译系统;Asia Online、SDL Weaver等著名公司向企业和政府提供的翻译服务;及时通信工具Google Talk、MSN中的及时翻译服务,社交网络

Facebook中的翻译服务;以及IBM、Google推出的实时语音翻译系统等等。可以看到,在通用领域,机器翻译已经开始进入人们的日常生活。

2. 机器翻译的现状及其存在的问题

从机器翻译的定义和发展可以看出,同人工翻译一样,机器翻译也离不开对自然语言的理解。但是与人对语言的理解不同,机器只能识别形式化的东西,因此要实现自然语言的理解任务,机器必须用形式化的语言去描述自然语言。下面将描述现存的机器翻译的现状以及存在的问题[3][4]。

(1)翻译死板

使用机器翻译只是句法结构和词汇的机械对应,对源语言的分析只是求解句法关系,完全不是意义上的理解。当碰到段落一句一句处理时,上下文又缺乏联系,翻译结果无法让读者看懂,和语言本身的灵活性存在差异。而人工翻译就能先理解整篇文章的意思,再根据需要适当地调整翻译顺序,这样读者就一目了然。

(2)词义选择和句子歧义问题

多义词是英文中普遍存在的,现在的机器翻译还不能从多个意思中选择适当地一个,这是阻碍其发展的一个难题。在没有语境的情况下,英语句子常常存在着歧义。例如对于这句话:He hit the boy with a stick. 人工翻译有两种译法:“他用木棍打了那个男孩”或者“他打了拿着木棍的男孩”,而机器翻译的结果就只有第一种。

(3)文化因素的问题

对带文化色彩的语句,机器翻译和人工翻译真实有着天壤之别。人工翻译可以通过音译加注,以对遗漏的文化信息进行补充,而机器翻译几乎是不可能的。如果都使用机器翻译,那么大量的文化信息就会在翻译过程中遗失,以至于在译文中得不到原文所表达的意思。众所周知,用词丰富是语言使用的基本原则,英语尤其如此,最忌讳重复使用一个词来表达相近的意思,而机器翻译似乎没有这种能力。机器翻译的常见问题如错误的代词、介词,断章取义的句法,不正确的选词,单复数混淆,错误的时态等。

中国数学家、语言学家周海中曾在论文《机器翻译五十年》中指出:要提高机译的质量,

首先要解决语言本身问题而不是程序设计问题;单靠若干程序来做机译系统,肯定是无法提高机译质量的。同时,他还指出:在人类尚未明了“人脑是如何进行语言的模糊识别和逻辑判断”的情况下,机译要想达到“信、达、雅”的程度是不可能的。这也是制约机译质量提高的一大瓶颈[5]。

3. 计算机辅助翻译及其概况

通过上面的描述,单纯的机器翻译得到的译文仍有不足之处。在这种情况下,计算机辅助翻译应运而生。计算机辅助翻译(Computer Assisted Translation,CAT)的思想可以追溯到20世纪70年代,当时有人提出了“翻译记忆”的概念,即把以前的翻译结果存储在计算机中,以后在翻译相同或类似的文本时可以重复利用。从广义上来说,计算机辅助翻译仍然属于机器翻译,因为它利用的还是计算机强大的储存和快速检索能力,知识计算机本身不会翻译任何文本。计算机辅助翻译不同于机器翻译,机器翻译旨在用机器完全代替人的劳动来完成文本的翻译。而计算机辅助翻译则是通过利用一系列工具来辅助译者完成文本的翻译工作[6][7]。可以用一句通俗的话来区分二者,就是看“翻译的工作由谁来完成”。由此,二者无论在设计理念上还是支持技术上都有很大的不同。计算机辅助翻译(CAT)的主要支持技术是翻译记忆(Translation Memory)和术语库(Terminology Database)。译者的人工翻译结果将为软件所记忆(翻译记忆),这样译者下次碰到类似的翻译文本时,软件将会从以前的翻译案例中自动匹配符合的译文,供译者选择。此外,译者还可以建立术语库来规范翻译项目中的术语,从而保证同一个项目中译文术语的一致性。目前主流的CAT软件有SDL Trados、Déjà Vu、Wordfast、SDLX、MemoQ、Transmit、Across、OmegaT、Okapi、Alchemy Catalyst、SDL Passolo、雅信CAT、雪人CAT以及朗瑞CAT等[8]。

计算机辅助翻译的工作原理是:系统根据自己的判断,将原文划分为单独的句子单元,如词或词组,并根据系统自带的词库、用户建立的词库或者系统记忆的词库,给出句子单元的翻译建议;同时,系统自动搜索翻译记忆库中相同或相似的翻译资源,给出参考译文[9][10]。译者可以首先调整系统对句子单元的划分,然后根据系统给出的句子单元翻译建议,重组句子单元,完成信息重组;也可以根据系统显示的参考译文,重组句子单元,修改或直接采用参考译文。计算机辅助翻译把翻译过程中的机械、重复、琐碎的工作交给计算机来完成,译者重点把精力放在译文的组织上,这样充分发挥了计算机和译者的优势,提高了翻译的效率和质量。计算机辅助翻译的优势在于信息的存储和检索,它可以导入大量的专业词汇,减少翻译过程中译者查词检索的步骤。同时由于它具有自动记忆和搜索功能,如果当前句子曾经翻译过,系统会给出之前的翻译结果,以供译者参考。图2为计算机辅助翻译系统的工作流程图[11]:

图2 计算机辅助翻译工作流程

Fig.2 workflow of CAT

计算机辅助翻译除了可以提高翻译效率,还可以多人合作翻译,且能保证翻译风格和用词上的一致性。但是由于语言的复杂性,计算机辅助翻译仍存在着一些不足之处。首先,计算机辅助翻译软件都是按句子把原文分割,译者在翻译过程中,只能根据原文顺序一对一地进行翻译,这限制了译员的创作性,会使译文略显僵硬[12]。计算机辅助翻译技术更适合于重复率较高且句型变化较少的文档,如法律条款、技术说明书等。而对于文学文本的翻译,由于其修辞手法多,句型变换复杂,且上下文联系紧密,很难用到翻译记忆库进行预翻译。

4. 未来机器翻译发展趋势探讨

4.1 构建更加丰富的语料库资源

翻译记忆需要更多的文本资源,而语料库语言学正好可以为其提供强大的支撑[13][14][15]。语料库包含的内容多种多样,可以是书面语或者口语,也可以来自多种语言的古代或者现代

文本。根据文本的使用领域和范文,语料库可以分为通用语料库和专用语料库。同时,语料

库可以由不同语言文本组成,其中包含“平行语料库”和“对比语料库”。我们在构建语料库的工作中,往往需要经过进行文件预处理、文件入库、对齐和切割等工作,这和CAT的操作原理具有类似之处。在专业领域的翻译上,多构建相应的语料库,如体育英语语料库、法律英语语料库等,特别是双语平行语料库,会大大减少译者对专业词汇的检索时间。因此,构建丰富的语料库资源可以增加翻译记忆的容量,提高翻译效率。

4.2 充分利用大数据

大数据对翻译行业的重要性不可低估。大数据将推动自动翻译向前发展。大数据将能够应对包括机器翻译在内的自然语言处理的不同领域的挑战。计算机将能够自动运行语义聚类和类型识别处理,这就意味着计算机可以识别行业领域(如医学和放射学)和内容类型(如说明书或专利申请)。

大数据对机器翻译技术的持续改进和定制化至关重要。由于现代机器翻译系统需要越来越多的平行数据,而这样大量的数据最终要达到使用传统数据管理技术无法处理的极限,因此大数据技术已经成为决定因素。如果计算机获得更多数据,也能够更好地进行术语挖掘。

大数据可以识别同义词、相关术语、新词、行业用语,并运用平行处理工具自动生成句法分类。简单的统计翻译模型发展成为包含(基于句法或对齐的)层次树结构的混合模型,使得机器翻译引擎能够进行远距离调序,产生更流畅、准确的译文,这对于结构差异大的语言对更是如此。

4.3 云翻译技术

随着翻译信息化程度日益深入,云计算技术迅速得到应用,对翻译行业产生了重要的影响( Muzii 2014) 。云计算技术应用于现代语言服务行业,催生了云翻译技术。以云计算为依托,可快速搭建定制化的机器翻译系统,并且实现跨系统、跨设备、无安装的互联网服务访问。目前国内外很多机器翻译项目已经利用了云计算,如Google Translate Toolkit、Microsoft Bing、Microsoft Translator Hub、EU LetsMT!、Xcelerator KantanMT、Lionbridge GeoFluent、SDL BeGlobal 等等。基于云计算的语联网技术,集成了基于云计算的计算机辅助翻译和机器翻译引擎的翻译管理平台,将“私有云”、云计算接口( API) 、云共享资源平台和云语言服务产业链整合,能大幅度提升翻译生产效率,降低成本( 韦忠和2013) 。云计算同智能机器翻译技术相结合,融合基于大数据建构的语义信息和深层语言学知识,将会大幅度地提升机器翻译的质量,是未来翻译技术发展强劲的驱动力。

5. 结语

本文介绍了机器翻译和计算机辅助翻译的发展现状和工作原理,同时探讨了机器翻译未来的发展趋势。由于语言之间的差别设计到社会背景和文化上的差异,不能把完全意义的全自动翻译作为终极目标,我们需要利用机器辅助为翻译服务。从机器翻译到计算机辅助翻译的发展,互联网、云计算等信息技术起到了很大的推动作用。全面了解计算机辅助翻译技术的发展趋势,更有利于人们利用计算机有效地开展翻译工作。

参 考 文 献

[1] 巩茗珠. 浅议机器翻译的发展历史及前景展望[J]. 吉林省教育学院学报, 2009, 25(223): 135‐136

[2] 冯志伟. 机器翻译研究[M]. 北京: 中国对外翻译出版公司, 2004:74‐76

[3] 罗蓉. 浅谈机器翻译的现状[J]. 剑南文学, 2012, (12): 236‐237

[4] 杜金华, 张萌, 宗成庆等. 中国机器翻译研究的基于与挑战—第八届全国机器翻译研讨会总结与展望[J]. 中文信息学报, 2013, 27(4): 2‐8

[5] 张敬源, 彭漪. 语篇 语境 机译质量[J]. 山东外语教学, 2009, (6): 73‐77

[6] 梁三云. 机器翻译与计算机辅助翻译比较分析[J]. 外语电话教学, 2004, (100): 42‐45

[7] 钱多秀. “计算机辅助翻译” 课程教学思考[J]. 中国翻译, 2009, (4): 49‐53

[8] 周兴华. 计算机辅助翻译教学: 方法与资源[J]. 中国翻译, 2013, (4), 91‐94

[9] 许云峰. 基于信息技术的计算机辅助翻译理论与实践[J]. 航空科学技术, 2014, 25(06): 54‐57

[10] 朵宏威. 信息化时代背景下基于计算机辅助翻译技术的译者主体性研究[J]. 云南社会主义学院学报, 2013, (5): 316‐317

[11] 王华树, 杨润丽. 计算机辅助翻译(CAT) 技术在现代翻译中的应用探析[J]. 语言教育, 2015, 3(1): 82‐85

[12] 刘思. 论计算机辅助翻译技术的优势与不足[J]. 重庆电子工程职业学院学报, 2014, 23(6): 89‐91

[13] 王立非, 王金铨. 计算机辅助翻译研究方法及其应用[J]. 外语与外语教学, 2008, (5): 41‐44

[14] 刘稳良. 电子语料库在翻译教学中的应用[J]. 上海翻译, 2013, (4): 57‐59

[15] 冯志伟. 基于语料库的及其翻译系统[J]. 术语标准化与信息技术, 2010, (1): 28‐35

机器翻译技术的现状及发展

机器翻译技术的现状及发展 篇一:翻译技术领域的现状与展望 翻译技术领域的现状与展望 作者/王华伟闫栗丽 翻译技术在中国的发展起步相对较晚,但近年来随着中国在全球化进程中扮演着越来越重要的角色,催生了对翻译技术发展的强烈需求。中国翻译行业在借鉴国外同行经验的基础上,于2007~2008年间在翻译技术领域取得了一系列成就,也还存在一些亟需改进的方面,而这也势必对我国的翻译行业产生深远的影响。 1. 国家政策的扶持和行业协会的推动 翻译技术的发展直接关乎整个翻译行业的翻译质量及效率,具备巨大的行业经济效益。对此,科技部、财政部都给与了足够的重视并拨出专项资金进行扶持。在 2008年的科技型中小企业技术创新基金扶持计划中,中文及多语种处理软件及基于先进语言学理论的中文翻译软件等赫然在列。而中国译协也在 2008年的第 18届世界翻译大会上专门辟出了翻译工具、术语管理和翻译标准等分论坛,着力推动翻译技术的探讨与发展。 2. 词典型翻译软件百花齐放 词典是使用范围最广的工具,它以使用便利的优势,几乎占据了每个计算机的桌面,无论语言学习者还是专业翻译人员,几乎都是必备工具。词典的发展从最早的单机版本发展至今,已经有很多种产品

类型,我们可以见到的有:电子词典、在线词典、手机词典等。“金山词霸”的网络版本“爱词霸”在这两年获得了长足的发展,如爱词霸网络释义、谷歌金山词霸等一系列特色功能的相继推出,将词典型翻译软件的应用领域从传统的桌面计算机拓展到网络、手机等,并取得了显著的成功。另外,类似Google这样的搜索引擎,因为信息量大,检索便利而成为很多专业翻译人员查词的重要辅助工具。 值得一提的是,最新推出的基于用户发布词汇的词典编撰系统之前的词典都是以各大出版社公开发行的词典中的词条作为主要数据库来源,为用户提供查询上的便利。但是传统出版词典的方式存在发布周期长、词汇更新慢的缺陷。互联网的出现,加快了信息传播的速度,也提高了用户对新词更新的速度要求,为了方便新词汇的发布,词典编纂系统也就应运而生了。这是一种基于用户的词典发布系统,用户可自由发起词典编纂项目,自发组织人员参与项目,发起人可以按照需要给小组成员分配不同的权限,将词汇添加等基本工作和审核人员明确区分,既确保了词典的专业性,也实现了专业语料的适时更新和发布。 3. 机器翻译应用软件融入普通网民生活 谷歌语言工具的推出打破了互联网语言的藩篱,用户可以方便简捷地将目标语言的网页转化成自己的母语进行浏览。事实上,这也是机器翻译软件的一个应用领域,而国内的相关软件如金山快译等,专注于为普通网民提供更为友好的英中日网站浏览体验,并在亚洲语言的机器翻译应用方面积累了大量的经验。其他如华建等长期从事机器

计算机辅助翻译的研究进展

龙源期刊网 https://www.360docs.net/doc/d17145518.html, 计算机辅助翻译的研究进展 作者:关赢 来源:《中国教育技术装备》2015年第12期 摘要对近些年来计算机辅助翻译的研究情况进行总结与整理,并将其进行对比分析,指出研究中的不足及未来研究的主要方向,以期为未来翻译产业的发展奠定基础。 关键词计算机;翻译;翻译软件 中图分类号:H085 文献标识码:B 文章编号:1671-489X(2015)12-0042-02 1 计算机辅助翻译研究内容 根据CNKI学术知识总库相关记载,本文重点搜索2000年1月—2015年5月之间关于计算机辅助翻译类相关研究内容,对统计结果进行有效统计。为保障检索结果的全面性与准确性,笔者分别检索了计算机辅助翻译、机器辅助翻译、电脑辅助翻译、机助翻译、机辅翻译五个关键词,共得到540篇检索结果,具体的检索结果如表1所示。 根据表1关于计算机辅助翻译相关研究的检索结果,将其分为理论、教学、技术三个方向进行研究。经过比较发现,在三个研究方向中,技术类研究所占比重最大,达到了46.9%;其次是理论类和教学类,分别占23.8%和19.3%。这在一定程度上显示出近十几年来我国关于计算机辅助翻译的研究现状。接下来,笔者具体就理论、教学、技术三个方向的研究情况进行具体阐述。 计算机辅助翻译理论研究计算机辅助翻译源自西方,所以,研究计算机辅助翻译应从计 算机辅助翻译在国外的兴起与发展说起,比如《国外计算机翻译的发展和近况》(袁亦宁,2002)一文就比较全面、系统地介绍了国外计算机辅助翻译综合发展情况,对其研究现状与未来发展情况进行了较为详细的阐述。因为这方面的研究主要集中于对计算机辅助翻译的理论层次上,以概述为主,为国内研究者更好地认识计算机翻译发展理论与应用实践奠定基础。 国内理论研究主要涉及三个方面:一是关于计算机辅助翻译的专业术语研究与分析,如《从计算机辅助翻译到协同翻译》(叶娜、张桂平、韩亚冬、蔡东风,2012)、《语料库翻译学:内涵与意义》(胡开宝,2012)等;二是比较机器翻译和人工翻译之间的优势与不足,如《机器翻译教学:问题与对策》(刘扬,2009)具体指出我国机器翻译教学中存在的主要问题与解决策略,还有就是讲机器翻译与计算机辅助翻译进行比较,如《机器翻译与计算机辅助翻译的比较研究》(赖怡霏,2014)、《机器翻译及计算机辅助翻译面面观》(韩阳,2006),这类论文一般侧重于比较研究的角度,在比较中阐述计算机辅助翻译存在与发展的必要性,并指明其未来发展的主要方向;三是尝试通过与之相关的一些理论来指导计算机辅助翻译研究,

计算机辅助翻译技术的发展

我国计算机辅助翻译技术的发展历程 和计算机辅助翻译技术的发展前景 摘要:我国计算机辅助翻译技术发展已有60年之余的历史,各种翻译软件运营而生,但却未被广泛应用,计算机辅助翻译技术是未来翻译事业发展的重头戏,应当得到恰当的长足的修改和完善,为翻译事业发展做出有力的支持。 关键词:计算机辅助翻译技术背景发展历程软件政策语料库前景 一.计算机辅助翻译技术发展的背景 翻译事业的历史源远流长,自人类开始进行文化交流的时期开始,翻译和议员就运应而生了,众所周知的是,翻译工作是一项浩大且繁重的工作,翻译工作不仅是原文与译文的转换,更是文化与文化的重新构建,必然会耗费大量的人力和时间,我国著名作家、翻译家傅雷曾耗时二十余年翻译亨利·德·巴尔扎克的《高老头》,所以翻译工作也一直被认为是“耗费大、效率低”的。 随着我国对外开放的深入,我国与其他国家在经济贸易、文化、政治方面的政府间及民间交流与合作活动日益增多,对翻译的需求量也空前绝后地增大,在这种背景下,繁冗复杂的人工翻译往往供不应求。 上世纪70年代到上世纪90年代计算机技术得到迅猛的发展,科技的进步推动着计算机辅助翻译技术的长足发展 在这种背景下,计算机翻译技术随之被广泛应用起来。 二.计算机辅助翻译技术在我国的发展 早在1956年,中国就开始将计算机翻译技术纳入了全国科学工作发展规划,课题名称为“机器翻译、自然语言翻译规则的建设和自然语言的数学理论”。1957年,中国科学院语言研究所与计算机技术研究所合作开展俄汉机器翻译实验,翻译了9种不同类型的较为复杂的句子。在这一时期,欧洲国家对机器翻译给予了相当大的重视,在这种动力的驱使下,我国机器翻译也进入了乐观的繁荣期。 在文革期间,机器翻译步入萧条期。 进入70年代后,随着计算机技术的发展尤其是计算机硬件的飞速成长以及语言学和计算机的学科联系建设,计算机辅助翻译技术逐步走向繁荣。随着我国文革的结束,各项科学事业建设被重新提上日程,计算机辅助翻译技术迎来了充满希望的春天。 到了90年代,全球范围内科技呈现爆炸式发展,计算机已经成为人们生活中工作中不可或缺的一部分,计算机的普及和Internet 的普遍应用,让计算机辅助翻译机器翻译迎来了一个新的发展机遇。在同一时代,中国取得了前所未有的成就,相继推出了一系列机器翻译软件,例如“译星”、“通译”、等。计算机辅助翻译技术拉开了新的帷幕。计算机辅助翻译软件也走向了专业化和市场化。随着市场需求的扩大,互联网翻译成为一种新型产业,例如“百度翻译”,“有道在线翻译”等等。

计算机辅助翻译课后答案第一第二章

第一章 1、计算机辅助翻译同机器翻译的主要区别是什么? 机器翻译(machine translation),也叫做计算机翻译或电脑翻译(computer translation),是利用计算机把一种自然语言翻译成另一种自然语言的技术。这既是一门新学科,也是一门结合了语言学和计算机科学等学科交叉学科,其复杂性不难想象。 不同于机器翻译,计算机辅助翻译是指利用计算机工具来辅助译员进行翻译而不是取代译员。计算机辅助翻译可以细分为计算机辅助的人工翻译(CAHT)和人工辅助的计算机翻译(HACT)。在翻译的过程中始终有人工因素。而机器翻译则是没有人工参与的全自动翻译过程。 2、计算机辅助翻译的主要方法有几种?分别是什么原理? 机器翻译可分为多种类型。 基于规则的机器翻译,是指机器翻译系统建立在语言规则的基础上,包括直接法、转换法和中间语言法。 基于统计的机器翻译,是指把机器翻译问题看成一个噪声信道的问题。 基于实例的机器翻译,原理是在机器中存储一些原文和对应译文的实例,让系统参照这些实例进行类比翻译。 多引擎的机器翻译,上述三种机器翻译方法各有长短。因此将各种方法按照一定的方式集成起来,便构成了多引擎的机器翻译系统。在这个系统中,集成了基于规则的机器翻译、基于实例的机器翻译以及词汇转换引擎。 3、计算机辅助翻译的现状如何? 随着翻译需求突增, 现代翻译行业日趋产业化, 形成了从翻译软件公司、翻译公司到印刷出版公司的产业链. 与传统译员拿到原文直接翻译不同, 现代翻译需要对稿件进行译前、译后处理. 相对于传统翻译。 现代翻译呈现出4大新特点. 1)翻译内容多媒体化. 传统意义上的翻译, 就是文字到文字的转换, 翻译内容都是纸质材料. 随着计算机的普及, 现代翻译中, 除了宣传册、书籍等纸质材料外, 出现了翻译多媒体材料的需求, 包括视频、图片、音频, 乃至网站、软件的本地化. 2)项目时间紧. 市场环境下, 不允许译员十年磨一剑. 翻译工作一般是产品开发、文档撰写的最后一道环节, 其进度直接影响产品投放市场的时间. 比如在软件开发中, 用户界面、帮助文档等内容的翻译, 是在软件开发最后阶段完成的, 由于许多软件都要求产品全球同步发行, 所以对翻译时效性要求甚高. 3)多人合作. 由于翻译量大, 翻译时间紧迫, 现代翻译多采用多位译员合作完成的模式. 由于译员不同,风格各异, 选用术语也不同, 因此就会产生翻译项目风格和用词前后不一致的问题, 也给审校工作带来了前所未有的困难. 4)翻译行业分工明确化. 随着现代翻译的产业化发展,翻译内容批量增长, 行业分工随之细化, 翻译模式也发生了转变. 由于翻译任务日益复杂, 翻译项目已不可能单纯由译员完成. 现代翻译中, 是由项目经理、译员、审校、DTP工程师等共同协作, 分工完成项目中的不同任务。 4、计算机辅助翻译广义工具盒狭义工具的主要区别在哪里? 广义的翻译工具是指能在翻译过程中提供便利的所有软硬件设施,如文字处理软件、文本格式装换软件、电子词典、在线词典和包括计算机、扫描仪、传真机等在内的硬件设备等;

机器翻译质量的研究与探讨

机器翻译质量的研究与探讨 何站涛韩兆强闫栗丽 交大铭泰软件有限公司北京100081 E—mail:hezt@sunv.com <摘要:本文简介了机器翻译的发展历史和常用方法,重点阐述了提高机器翻译质量的新思路,最后进行了展望. 关键词:机器翻译N元文法语义网语料库计算机辅助翻译 一、引言 计算机对自然语言的研究和处理,一般应经过如下三个方面的过程: I.把问题在语言学上加以形式化.使之能用数学形式严密而规整地表示出来 2.把这种数学形式表示为算法,使之在计算上形式化; 3.根据算法编写计算机程序,使之在计算机上加以实现。 因此.自然语言处理就成了语言学、数学和计算机科学之间的边缘学科。 二、机器翻译概述 面向计算机的语言的机器翻译研究是二十世纪五十年代才开始的: 从五十年代初期到六十年代中期,机器翻译一直是自然语言处理系统研究的中心课题,当时采用的主要是“词对词”翻译方式,这种不是建立在对自然语言理解的基础上的简单技术,没有得到预期的翻译效果,如,威沃(Weaver)设计实现的机器翻译原型系统,该系统采取查找双语词典,句子译文只是单词译文的简单罗列。 六十年代初,自然语言处理使用了简单的语料库统计方法,不仅依据词的意义.而且依据词与其他词的共现情况对词进行分类。但经验主义遭到了理性主义的批评,如乔姆斯基(Chomsky)对N元语法(N.Gram)的批评、闵斯基(Minsky)等对神经网络的批评。 六十年代中期,人们开始转入对自然语言的语法、语义和语用等基本问题的研究,并尝试着让计算机来理解自然语言。乔姆斯基的转换语法和形式化理论为下一代的自然语言处理提供了一种新的解决方案。 七十年代初,美国哈佛大学人工智能专家伍兹(Woods)提出了扩充转移网络(AugmentedTransitionNetWork,ATN),通过使用成份寄存器和功能约束对有限状态机进行了扩充,ATN考察了更多的上下文信息,保持了有限状态计算的简单性。 从八十年代初期开始,国际计算语言学界出现了一批新的语法理论。比较著名的有广义短语结构语法(GeneralizedPhraseStructureGrammar,GPSG)、中心语驱动的短语结构语法(Head-drivenPhraseStructureGrammar,HPSG)、词汇功能语法(LexicalFunctionalGrammar,LFG)、功能合一语法(FunctionUnificationGrammar,FUG)等确定子句语法。 ?218?

trados计算机辅助翻译实践报告

研究生课程考核试卷 (适用于课程论文、提交报告) 科目:计算机辅助翻译教师:王春渝姓名:学号: 专业:翻译类别:专业硕士上课时间: 考生成绩: 卷面成绩平时成绩课程综合成绩 阅卷评语: 阅卷教师(签名) 大学研究生院制

目录 摘要 (2) 1 翻译任务描述 (2) 1.1翻译任务背景介绍 (2) 1.2任务性质 (2) 2翻译过程描述 (3) 2.1译前准备 (3) 2.2 Trados辅助翻译流程 (4) 3 翻译案例分析 (6) 3.1文本翻译难点、问题及解决策略 (6) 3.2 Trados技术问题及解决方案 (7) 4 翻译实践总结 (9) 4.1 Trados软件应用评价 (10) 4.2对今后学习工作的启发及展望 (10) 5 参考文献 (11) 6、附录 (12)

TRADOS翻译软件在《大别山》翻译中的应用 摘要:本次翻译项目利用trados软件对《大别山》进行汉英翻译,旨在通过具体翻译实践,简单介绍计算机辅助翻译软件的使用方法和流程,总结计算机辅助翻译的优势与弊端,总结翻译经验,实现规化翻译。本翻译报告包括翻译任务描述、翻译过程、翻译案例分析、翻译实践总结四个部分。 1 翻译任务描述 1.1翻译任务背景介绍 与传统翻译教育重翻译的学术性和理论性研究不同,MTI强调学生的实践性、应用性和专业化特点,根本目标是要培养国家社会、经济、文化建设需要的高层次、应用型、专业性翻译人才。所以,对于MTI专业的学生来说,最核心的任务就是通过各种翻译实践来提高自己的业务水平和素质。本次翻译项目旨在利用trados软件来进行汉英翻译,通过翻译项目的实践,在其过程中总结翻译策略及技巧,总结计算机辅助翻译的优势与弊端,实现规化翻译。这对任何一位MTI 学生来说,都是一个磨练、提升和成长的宝贵机会和重要环节。 1.2任务性质 本次翻译对象为《大别山》,全篇共计3578汉字,全文对大别山风景区加以

计算机辅助翻译技术Review

计算机辅助翻译技术概论 押题: 1、隐马尔科夫模型 2、机器翻译的方法 3、文本电子化OCR 4、双语对齐处理 5、汉语切分的方法和关键问题 5-20考试——计算机辅助翻译技术 考试题型:填空、判断、问答7-8个 考查内容:基本概念梳理,理解分析能力,考题思路,课件! 1、概论 1.1概况 为什么要研究翻译技术? 何谓翻译技术(translation technology)?能够用来进行语言翻译或辅助进行语言 翻译的信息技术。 解决或缓解语言障碍(language barrier)问题,提高翻译从业人员的生产率。 翻译技术的研究始于机器翻译 关于机器翻译 机器翻译(Machine Translation)定义:利用计算机及其软件把一种语言(自动)翻译成为另外一种语言的技术。 机器翻译研究的目标是研制具有翻译能力的计算机软件系统。 机器翻译的研究始于20世纪40年代末期。 机器翻译结论很困难。 翻译技术的分流 机器翻译(MT):机器翻译的主体是机器。目前比较困难。(目标是寻找彻底的解决方案) 计算机辅助翻译(CAT):计算机辅助翻译的主体是人。相对比较容易,但却很实用。 计算机辅助翻译立足为翻译人员提供(软件)工具。协助翻译人员提高效率(生产率)。 名词辨析 CAT - Computer-aided Translation MAT - Machine-aided(-assisted) Translation MAHT - Machine-assisted Human Translation HAMT - Human-assisted Machine Translation MT - Machine Translation FAHQMT - Fully Automatic High Quality MT

计算机辅助翻译

计算机辅助翻译:翻译者的新技术 随着信息时代的到来,计算机逐渐走出工程技术人员的实验室进入了家庭,原本属于技术的研究工具,却为新时代的翻译人员开创了全新的天地。计算机辅助翻译(Computer Aided Translation,简称CAT),就是利用利用计算机的巨大存储能力与快速检索能力,建立供翻译人员使用的机器词典、术语库、资料库等,以节省翻译人员的检索时间,显著提高工作效率。计算机翻译在分析、转换及生成中,允许人的介入。在某种情况下,如语言结构歧义时,人的介入会使问题轻而易举地得以解决。 计算机辅助翻译技术教学进入翻译课程体系设置的必要性,可以从以下几方面来理解:首先是翻译市场的需求。随着中国越来越融人国际经济体系,翻译市场的总量迅猛增长,市场中的大部分翻译项目,是有关工程技术的文档翻译和商业本地化( lo-calization),一般这样的项目都具有时间紧任务重的特点。要想在既定时间内,组织起足够数量的人力资源,保质保量完成任务,必须依赖计算机技术,对翻译的整个流程进行科学管理,合理分配;再者,当前的翻译机构必须倚重翻译技术,越来越多的大中型翻译机构要求加盟的专职和兼职译员掌握诸如Trados、Wordfast等主流的TM软件,唯其如此,译员才能顺利融入翻译公司的工作流程,和其他译员共享术语数据,保证项目的质量;还有,国内大学翻译专业尚无开设CAT技术课程。为了尽快使中国的翻译教学与世界接轨,很有必要对CAT技术进行研究。

1 计算机辅助翻译基本过程 1.1 已有翻译成果的重复利用 词汇复用:系统提供大容量的专业词库,为用户节省查词典的时间,可自动进行词频记忆并按词频排序,用户只要点击鼠标或按快捷键即可完成句子翻译。 句子复用:采用先进的翻译记忆( TM)技术,把用户翻译的原文句子和译文自动记忆到数据库中。翻译过程中,通过搜索引擎,自动查找记忆库,对需要翻译的内容进行快速分析、对比,保证相同的句子永远不要翻译第二遍。 模糊匹配复用:一旦发现与记忆库中例句相同或相似的句子,将根据与原文的匹配情况,系统自动给出翻译建议,用户可选择自动匹配替换,直接得到翻译结果,避免重复性劳动,提高工作效率。 片段复用:如果当前翻译的句子与记忆库中例句有相同的片段时,系统会给出提示,作为翻译时的参考。 这样的重复利用,不但可以提高翻译效率,而且达到了翻译结果的准确和统一,还可降低成本,节省时间。1.2翻译项目管理 项目管理是多语翻译和多语软件本地化项目的关键因素( Esselink,2000)。多语翻译和软件本地化涉及到居住在世界各地的许多人的合作,完美的项目管理是产品和服务全球化的关键。项目管理经理在项目中是最重要的资源,他们在项目中起了关键的作用,是所有在多语翻译和软件本地化项目中工作人员信息交流的中心。为了有效地管理

机器翻译研究现状与展望1 Machine TranslationPast,Present,future

机器翻译研究现状与展望1 戴新宇,尹存燕,陈家骏,郑国梁 (南京大学计算机软件新技术国家重点实验室,南京 210093) (南京大学计算机科学与技术系,南京 210093) 摘要:本文回顾机器翻译研究的历史,介绍典型的机器翻译方法,包括:基于规则、基于统计以及基于实例的机器翻译方法;针对机器翻译的研究现状,详细介绍和分析了基于混合策略的机器翻译方法,对统计以及机器学习方法在机器翻译中的应用进行了描述;论文还介绍了当前机器翻译评测技术;最后对机器翻译进行总结和展望。 关键字:机器翻译,基于规则,基于统计,基于实例,混合策略,机器学习 Machine Translation:Past,Present,future Dai Xinyu, Yin Cunyan, Chen Jiajun and Zheng Guoliang (State Key Laboratory for Novel Software Technology, Department of Computer Science & Technology Nanjing University, Nanjing 210093) Abstract:This paper firstly presents the history of machine translation, and introduces some classical paradigms of machine translation: RBMT, SBMT and EBMT. Secondly, we introduce the recent research on machine translation, and describe the hybrid strategies on machine translation in detail, and discuss the applications of machine learning for machine translation. We also analyze the current techniques about evaluation on machine translation. Finally, we draw a conclusion and prospect on the research of machine translation. Keywords:Machine Translation, RBMT, SBMT,EBMT, HSBMT, Machine Learning. 1本论文工作得到863课题资助(编号:2001AA114102, 2002AA117010-04) 戴新宇博士生,主要研究自然语言处理;尹存燕助教,主要研究自然语言处理;陈家骏教授,博士生导师,主要研究自然语言处理、软件工程;郑国梁教授,博士生导师,主要研究软件工程。

理工科院校翻译专业硕士教学中计算机辅助翻译课程的设计研究

理工科院校翻译专业硕士教学中计算机辅助翻译课程的设计研究论文关键词:计算机辅助翻译理工科院校MTI培养 论文摘要:本文以燕山大学翻译专业硕士课程设计中的计算机辅助翻译课程为例,着重探讨如何充分利用现有教学和科研资源的可行性,提出以技术资源为保障的实训平台建设、以工程技术为特色的翻译专业语料库和术语库的建立、以项目为依托的翻译实践平台建设和以就业为导向的对口翻译实践培养模式,以适应理工类院校翻译专业硕士培养和发展的需要。 一、引言 计算机辅助翻译(CA T)是指利用计算机程序设计将一种自然语言翻译成另一种自然语言的过程。与将文中的词语用软件作简单过程处理的机器翻译不同,计算机辅助翻译能够利用数据库功能和翻译记忆程序,为翻译人员提供建议和解决方案,这样便能够有效节约翻译时间及成本,同时确保翻译品质和风格的一致性。CA T技术的核心是翻译记忆技术,也就是当译者在前台进行翻译工作时,CA T的后台同时自动进行语言数据库的建立和更新。 CA T在国内作为一门硕士研究生课程最初是按照学术型硕士培养方案要求,设立在翻译方向课程体系下的一门选修课程。无论是在教学大纲的设计,还是授课方式上,该课程均以课堂理论讲授和掌握翻译软件原理为主,真正与实践结合的翻译活动不多,考核方式也均以给定的翻译语篇为主,学生毕业后仍然无法真正领会和展现应有的翻译技能和方法,甚至造成了对计算机辅助翻译的一些误解和偏见。自从2007年3月国务院学位委员会发布翻译硕士专业学位设置方案以来,翻译专业硕士在多所高校蓬勃发展。作为培养专业翻译人才的一种全新模式,CAT也成为MTI培养体系中的一个重要环节。俞敬松、王华树(2010)以北京大学为例,探讨了计算机辅助翻译硕士专业教学中课程设计定位和教学计划的设定,教学过程中所面临的各种问题和解决思路。王立非、王进铨(2008)着重介绍了panaconc软件在翻译语料库研究中的应用以及计算机辅助方法对翻译研究的意义。张霄军(2010)以英国四所大学所开设的计算机辅助翻译,翻译工具和资源课程为例,讨论了我国MTI教学中相关课程的问题。在我国现有批准开设MTI培养工作的高校中,大多数理工类院校专业英语开设时间相对较晚,与校内强势学科相比普遍较为薄弱,但理工类院校专业的大背景恰好为MTI的发展提供了一个良好的契机和条件。如何能充分挖掘理工科院校教学和科研的优势,使得计算机辅助翻译课程真正能够发挥其优势,这是本研究所探讨的问题。 二、理工科院校的传统优势与CAT课程设计 燕山大学于2011年正式招收翻译专业硕士,在此之前,学校已开设学术型翻译方向硕士课程多年,并在科技翻译与文学语料库建设等方面积累了大量的经验。由于翻译专业硕士的培养目标及课程设置的特殊性,如何既能发挥学校已有的翻译理论与实践的科研积累,同时又能借鉴学校在工科领域的强势研究特色是我们首先要解决的问题。在课程设置之初,我们已充分意识到依托校内强势学科在工程技术领域研究的雄厚基础的重要性,努力挖掘二者之间合作的接面,而CAT是相比其他MTI课程更具有可操作性的一门课程。因为,一方面它具有能够借助英语专业语言翻译优势和翻译辅助软件快速处理大批量翻译文本的强大功能,为理工类项目提供专业而准确的翻译服务;另一方面又能够在专业技术人员的指导下,通过课堂项目模拟训练逐步使学生真正参与项目的工作,确保学生能够在实践过程中了解和熟悉项目整个流程及岗位职责,为将来找到适合自己的就业岗位打下基础。 基于以上考虑,本文尝试设计适用于理工类院校MTI教学大纲中CA T课程大纲的总体思路和培养目标。课程首先应使学生了解并熟练掌握CAT软件供应商所提供的软件所涉及

常用CAT计算机辅助翻译软件

常用CAT计算机辅助翻译软件 1、SDL TRADOS SDL Trados为他们克服了在不同国家地区的文化、语言障碍,从而为他们的全球化铺平了发展道路。因为SDL Trados用户通常能够将完成工作的速度提高50%左右(具体数值依不同文档,项目会有变化),更准确地评估时间和成本,显著减少翻译错误,编写更为一致的翻译(对技术、法律和医学翻译来说,这一点尤其重要)。这正因为其功能强大,在操作性方面就有所不足,在国内来说普及度不高。 2、iCAT iCAT辅助翻译工具免费软件,内嵌到Word工具中,支持最新的Word2013,支持64、32的系统,支持中文、繁体中文、英、日、韩、德、法、俄、西班牙等。它提供独立的术语和翻译记忆库(TM),可以同时挂多个术语库,同时通过火云术语配合使用,实现术语分享和收藏功能,达到云端保存的效果。自带机器翻译,术语批准等功能,同时译员通过使用该工具能及时了解自己最新的翻译字数。对于译后稿,提供3种保存格式,解决了译员对译后稿件的排版麻烦。该公司有兼全职译员3W多名,同时在各高校MTI教学和外语类实验室广泛使用,故在国内知名度很高。 3、passolo Passolo 是一款功能强大的软件本地化工具,它支持以Visual C++ 、Borland C++ 及Delphi 语言编写的软件(.exe、.dll、.ocx)的本地化。以往针对这两种不同语言编写的软件,我们大多是需要分别使用Visual Localize 和Language Localizator 来进行软件的中文化。而现在,Passolo 把二者的功能结合在了一起,并且性能稳定、易于使用,用户即不需要进行专门的训练,也不需要丰富的编程经验,在本地化的过程中可能发生的许多错误也都能由Passolo 识别或自动纠正。所以,passolo是软件本地化不二的选择。 4、Transmate Transmate 提供了独立的翻译操作界面,不依赖、也无需与其他应用程序交互(如MS WORD),在单一的程序界面中集成了翻译记忆库(TM)、术语库和翻译单元列表,界面简洁,操作方便。不像使用老版Trados 那样,需要启动多个不同的应用程序来分别操作记忆库、术语库和相关的文件。因其Transmate其实验室产品在高校广泛应用,故儿成为国内大多数译员比较熟悉的工具,在翻译公司的应用率也相对较高。 5、WordFast Wordfast 是结合Microsoft Word 使用的翻译记忆引擎。它可以在PC 或Mac 操作系统下运行。(请参阅技术规格或支持的操作系统)Wordfast 数据具有易用性和开放性,同时又与Trados 和大多数计算机辅助翻译(CAT) 工具兼容。它不仅可被用来翻译Word, Excel, Powerpoint, Access 文件,还可被用来翻译各种标记文件。此外,Wordfast 还可以与诸如PowerTranslator?,Systran?,Reverso? 等机器翻译(MT) 软件连接使用。另外,它还具有强大的词汇识别功能。所以,个人译员使用的比例相对较高. 6、Logoport Lionbridge 的免费产品,嵌入Word工具中,至于它的RTF文件是怎么做出来的,不得而知。它使用在线的TM服务器,可以很多译员同时翻译一个文件,TM时时共享,这和免费使用可以说是Logoport最大的优势,但是因为使用在线的TM,可能是他们服务器在国外的原因,每打开一个翻译单元格,都要花费一两秒钟的时间,译员怨声不断。初次看到分析出来的Log文件,可能会受到误导,认为那些100%匹配不用翻译,其实Logoport是用本文件将要翻译出来的TM结果分析未曾翻译的文件,乍一看好似很多匹配,实际上都是需要翻译的"新词",不过,匹配部分算钱的办法还算合理,比Trados匹配部分要高很多。所以,CAT爱好者可以玩一玩.

机器翻译技术的探讨

机器翻译技术的探讨 六院五队-徐允鹏-12060143 摘要随着国际交流的日益增多,在计算机、互联网等相关技术日新月异的基础上,机器翻译的技术与应用得到了蓬勃发展。本文详细探讨了基于规则的机器翻译方法、基于语料库的机器翻译方法和混合式机器翻译方法,并讲述了机器翻译的评估方法,最后介绍了机器翻译技术的最新进展。 关键词:机器翻译;基于规则;语料库;评估方法 1.机器翻译概述 随着国际化交流的普遍性,信息通信的日益膨胀,高效的处理不同领域各种语言之间的互译已成为当代人们的普遍需求。翻译是解决自然语言之间通信障碍最直接最有效的方法。传统的翻译工作都是通过专业翻译人员完成,利用语言学知识进行自然语言之间的互译,帮助人们实现信息通信。伴随着计算机技术的成熟与自然语言处理技术的不断进步,利用机器翻译系统帮助人们快速获取外文信息代替人工翻译已成为一种必然的趋势。 机器翻译(machine translation),又称为自动翻译,是利用计算机把一种自然源语言转变为另一种自然目标语言的过程,一般指自然语言之间句子和全文的翻译。它是自然语言处理(Natural Language

Processing)的一个分支,与计算语言学(Computational Linguistics )、自然语言理解(Natural Language Understanding)之间存在着密不可分的关系[1]。 机器翻译是21世纪要解决的科技难题之一,主要困难是自然语言在各个层次上的歧义性。研究机器翻译具有重要的实践意义和理论意义。国际间的合作与交流,语言的差异是一个非常重要的障碍,各行各业的人们面对大量他们不熟悉的语言的文档资料,如果单纯的依靠人工翻译,这些日益的待翻译材料将是一种非常沉重的负担,而机器翻译可大幅度减轻这种负担。同时,机器翻译对于了解人类语言和思维的基本机制,探讨人工智能技术有着重要的意义。 2.机器翻译方法 人们一直在寻求更好的解决机器翻译问题的方法,目前机器翻译方法主要有基于规则的机器翻译,基于语料库的机器翻译和混合式机器翻译方法。 2.1基于规则的机器翻译方法 2.1.1基于分析和转换的机器翻译方法 人作翻译时,把一个源语言句子译成目标语言句子,设计到四个基本操作:目标语言单词的检索、调序、删词、增词;机器翻译系统的过程包括检索、分析、转换和生成主要四个阶段,这被称为基于分析和转换的机器翻译系统,也被认为是模拟人类翻译活动最恰当的机

机器翻译技术的现状及发展

机器翻译技术的现状及发展 摘要:本文在分析机器翻译内涵的基础上,阐述了机器翻译的历史和现状,探讨了机器翻译所面临的问题及机器翻译的发展趋势。 关键词:机器翻译;自然语言;发展趋势 1.引言 《圣经.创世纪》中第十一章巴别塔:“耶和华说:看哪,他们成为一样的人民,都是一样的言语,如今既作起这事来,以后他们所要作的事就没有不成就的了。我们下去,在那里变乱他们的口音,使他们的言语彼此不通。于是耶和华使他们从那里分散在全地上;他们就停工,不造那城了。因为耶和华在那里变乱天下人的言语,使众人分散在全地上,所以那城名叫巴别(就是变乱的意思)[1]。”这只是圣经故事,但告诉我们语言的不同确实是人们交流的极大障碍,因此人们一直在寻找打破语言障碍的途径和办法。翻译则能克服语言障碍,使得不同语言人们之间能相互交流。谭载喜在他的《西方翻译简史》一书中提到我国的翻译史时说:孔子周游列国,在各地言语发音不尽相同,彼此交流甚少的当时,也不得不通过象寄之才(即翻译人员)以“达其意,通其欲”。随着互联网的日益发展,网络信息的激增,国际社会交流愈加频繁,机器翻译已成为克服交流时所产生的语言障碍的重要手段之一。

2.机器翻译的定义 计算机翻译通常叫机器翻译(Machine Translation或MT),即全自动高质量机器翻译(Fully Automatic High Quality Machine Translation,简称FAHQMT或MT),就是人类利用计算机进行自然语言间的相互翻译,利用软件实现从一种自然语言文本到另一种自然语言文本的翻译[2]。 3.机器翻译的历史与现状 在古希腊时代就有人提出利用机械装置来进行语言翻译的想法,其中之一是如何用机械手段来分析自然语言。17世纪,人们首次提出使用机械字典克服语言障碍的设想。1903年,古图拉特(Couturat)和洛(Leau)在《通用语言的历史》一书中指出,德国学者里格(W.Rieger)首次使用了“机器翻译”(Machine Translation)这个术语。1952年在美国麻省理工学院(MIT)召开了第一届国际机器翻译会议,标志着机器翻译正式迈出了第一步。1978年在中科院计算机所的一台64K容量的计算机上成功地进行了20个标题的机器翻译测试。1987年在日本箱根举行了第一届机器翻译峰会(MT Summit),并决定以后每两年轮流在亚、欧、美定期举行。20世纪90年代后,随着微机的普及,相继出现了多种翻译软件,例如金山公司的词霸系列,实达铭泰的东方快车系列,Trados 翻译软件等。到目前为止,由于计算机科学、语言学研究的发展,特别是计算机硬件技术的大幅度提高以及人工智能在自然语言处理上的应用,机器翻译已经取得了相当大的进步,不过,机器翻译的水平距理想的“全自动高质量(FAHQ)”的目标还有很远的距离[3]。4.机器翻译面临的问题 4.1影响机器翻译质量的核心是歧义的处理。在词汇的层面上,词汇的歧义主要是一词多义,如英语单词“note”可以指“笔记”、“短信”、“注释”、“纸币”等。以下是词汇歧义的例子: 原文:Thank-you notes are heart-warming. 机器译文:感谢笔记温暖人心。人工译文:感谢信温暖人心。 在结构层面上,常见的结构歧义有and(和)结构,如nice girls and boys, 它既可表示“好女孩和男孩”,也可表示“好女孩和好男孩”,这种歧义只有人工翻译才能消除,计算机无法识别此歧义,可见歧义的处理是影响机器翻译质量的关键。 4.2人类翻译目标集中于目标语言,如果有必要的话,译者会采用灵活的方式以使翻译传情达意,有的时候会使用意译的方法,这是机器翻译所无法达到的。 以文学翻译为例,文学翻译是“传达作者的全部意图,即作者对在读者思想感情上产生艺术作用的全部意图……”。即使对于专业翻译工作者来说,文学翻译也不是件容易的事,更何况是对于没有任何认知能力的机器。笔者曾让机器翻译了下面几句:以下是美国19世纪著名作家爱默森长篇散文Beauty中的原句。 原文:"But this beauty of Nature which is seen and felt as beauty, is the least part." —Beauty Ralph Waldo Emerson 机器译文:但是这哪个看见并且作为美丽感到的自然的美丽,是最小部分。 夏济安译文:可是凡是耳目所能辨认出来的美,只是自然之美的最低部分。 以下是美国著名作家马克.吐温早期创作的一则优秀短篇小说《竞选州长》中的原句。原文:"I hauled down my colors and surrendered." —Running For Governor Mark Twain 机器译文:我沿着我的颜色拖并且投降。 张有松译文:我偃旗息鼓,甘拜下风。 以上机器译文荒唐可笑。由于机器没有思维、推理、判断能力,缺乏人工译者的综合知识和长期积淀下来的文化知识等,无法对原文产生全面的了解,做的只是机械转码,无法突破思维障碍。要获得地道完整的译文,必须对机器译文进行人工

机器翻译研究综述

机器翻译综述 1.引言 1.1机器翻译的历史 现代机器翻译的研究应该是从20世纪50年代开始,但是早在这以前很多人已经提出了相应的想法,甚至是远在古希腊时期就有人提出要用机器来进行语言翻译的想法。 在1946年,美国宾夕法尼亚大学的两位科学家设计并制造了世界上第一台电子计算机。与此同时,英国工程师同美国洛克菲勒基金会副总裁韦弗在讨论计算机的应用范围时,就提出了利用计算机实现语言的自动翻译的想法。在1949年,韦弗发表了一份名为《翻译》的备忘录,正式提出了机器翻译问题。他提出了两个主要观点: 第一,他认为翻译类似于解读密码的过程。 第二,他认为原文与译文“说的是同样的事情”,因此,当把语言A翻译为语言B时,就意味着从语言A出发,经过某一“通用语言”或“中 间语言”,可以假定是全人类共同的。 在这一段时间由于学者的热心倡导,实业界的大力支持,美国的机器翻译研究一时兴盛起来。 1964年,美国科学院成立语言自动处理咨询委员会,调查机器翻译的研究情况,给出了“在目前给机器翻译以大力支持还没有多少理由”的结论,随后机器翻译的研究就陷入了低潮期。直到70年代以后机器翻译的研究才重新进入了一个复苏期,随后机器翻译的发展又迎来了繁荣期 1.2机器翻译的主要内容 经过50多年的发展,在机器翻译领域中出现了很多的研究方法,总结如下:●直接翻译方法 ●句法转换方法 ●中间语言方法 ●基于规则的方法 ●基于语料库的方法 基于实例的方法(含模板、翻译记忆方法) 基于统计的方法 在当前的研究中,更多的是基于统计的方法进行的,因为基于统计的方法可以充分的利用计算机的计算能力,并且并不需要过多的语言学知识作为支撑,可以让更多的计算机科学家投入到实用系统的研究中,极大的促进了统计机器翻译的发展。 下面对各个方法逐一的进行介绍。

机器翻译技术的研究和应用综述

机器翻译技术的研究和应用综述 ACM Matrix_68 摘要:随着互联网的日益发展,网络信息的激增,国际社会交流愈加频繁,机器翻译已成为克服交流时所产生的语言障碍的重要手段之一。本文回顾机器翻译研究的历史,介绍典型的机器翻译方法,在分析机器翻译内涵的基础上,阐述了机器翻译的现状,探讨了机器翻译所面临的问题及机器翻译的发展趋势,对统计以及机器学习方法在机器翻译中的应用进行了描述;论文还介绍了当前机器翻译评测技术;最后对机器翻译进行总结和展望。 关键字:机器翻译;自然语言;基于规则;基于统计;基于实例;混合策略;机器学习 1引言 近年来,自然语言处理的研究已经成为热点,而机器翻译作为自然语言研究领域的一个重要分支,同时也是人工智能领域的一个课题,同样为大家所关注。当电子计算机1946年问世的时候,人们就提出了机器翻译的想法,并且在1954年进行了第一次机器翻译试验。然而与后来的各种语言信息处理研究和应用(语言信息检索、文本自动分类、自动文摘、信息提取等等)相比,机器翻译却是进展最慢的。 从上个世纪40年代英国工程师Booth 和美国工程师Weaver提出利用计算机进行翻译的想法,到50年代欧美国家投入大量的人力、物力致力于机器翻译的研究,再到60年代ALPAC置疑报告的提出,机器翻译走向沉寂。 学者们倾其大半生精力、商家投入为数可观的资金,经历五十多年不懈的研究和开发,得到的成果或者产品却常常不能令人满意。最近的二十年,随着语言学理论的发展、计算机技术的进步以及统计学和机器学习 方法在自然语言处理领域中的广泛应用,人们对机器翻译本身的应用背景、目标等也有了更加准确的认识,机器翻译在此背景下取得了长足的发展,基于统计、基于实例等新的机器翻译方法也都是在这一时期出现,一些机器翻译系统也从实验室走向了市场。 本文第二节介绍了机器翻译的历史现状;第三节介绍了机器翻译面临的问题;第四节介绍几种经典的机器翻译方法;第五节给出近期机器翻译的发展趋势,介绍基于混合策略的机器翻译方法,对统计机器学习在机器翻译中的应用进行总结;第六节讨论当前机器翻译的评测系统;最后,对机器翻译研究进行总结和展望。 2机器翻译的历史现状 机器翻译的研究历史可以追溯到20世纪三四十年代。20世纪30年代初,法国科学家G.B.阿尔楚尼提出了用机器来进行翻译的想法。1933年,苏联发明家П.П.特罗扬斯基设计了把一种语言翻译成另一种语 言的机器,并在同年9月5日登记了他的发明;但是,由于30年代技术水平还很低,他的翻译机没有制成。1946年,第一台现代电子计算机ENIAC诞生,随后不久,信息论的先驱、美国科学家W.Weaver和英国工程师A.D.Booth在讨论电子计算机的应用范围时,于1947年提出了利用计算机进行语言自动翻译的想法。1949年,W.Weaver发表《翻译备忘录》,正式提出机器翻译的思想。走过六十年的风风雨雨,机器翻译经历了一条曲折而漫长的发展道路,学术界一般将其划分为如下四个阶段: 2.1机器翻译的开创期(1947-1964) 1954年,美国乔治敦大学(GeorgetownUniversity)在IBM公司协同下,用IBM-701计算机首次完成了英俄机器

相关文档
最新文档