对齐已翻译文档导入翻译记忆库-Winalign讲课稿

合集下载

机器翻译中的语言对齐和文本对齐方法

机器翻译中的语言对齐和文本对齐方法

机器翻译中的语言对齐和文本对齐方法机器翻译(Machine Translation,MT)是一种通过计算机将一种自然语言的文本翻译成另一种语言的技术。

在实际应用中,语言对齐和文本对齐是机器翻译中至关重要的步骤。

语言对齐指的是将源语言文本与目标语言文本进行对应,以确保翻译的准确性和连贯性。

而文本对齐则是指在大规模文本中对齐相同或相似的内容,以提高翻译的效率和质量。

本文将深入探讨,分析其原理、应用和未来发展趋势。

首先,语言对齐是机器翻译中的基础环节之一,其目的是建立源语言文本和目标语言文本之间的对应关系。

在传统的基于规则的机器翻译系统中,语言对齐通常是通过对齐词语或短语进行实现的。

然而,随着神经网络机器翻译的发展,基于统计和神经网络的方法也逐渐被广泛应用于语言对齐任务中。

这些方法通过学习大量的平行语料,自动学习源语言和目标语言之间的对应关系,从而实现更加精准和高效的语言对齐。

其次,文本对齐是提高机器翻译效率的关键技术之一。

在大规模文本翻译任务中,通常会存在大量相同或相似的内容,这些内容可以被重复利用以提高翻译的速度和质量。

文本对齐的主要任务是识别文本中的相似段落或句子,并建立它们之间的关联。

传统的文本对齐方法主要基于词袋模型和相似度匹配算法,但这些方法在处理复杂文本结构和语义信息时存在较大的局限性。

近年来,基于深度学习的文本对齐方法逐渐兴起,通过将文本表示为向量空间并利用神经网络模型进行匹配,取得了较好的效果。

另外,随着机器翻译技术的不断发展和应用,语言对齐和文本对齐方法也在不断演化和完善。

传统的基于规则和统计的方法在处理复杂语言现象和文本结构时存在一定的局限性,而基于神经网络的深度学习方法具有更好的泛化能力和表征学习能力,能够更好地适应各种复杂的翻译任务。

未来,随着自然语言处理和机器学习领域的不断发展,我们可以预见语言对齐和文本对齐方法将会更加智能化和自动化,为机器翻译技术的进一步发展提供更加强大的支撑。

浅谈如何创建翻译记忆库及提高其使用效率

浅谈如何创建翻译记忆库及提高其使用效率

浅谈如何创建翻译记忆库及提高其使用效率作者:王潇来源:《青年生活》2019年第25期摘要:全球化的发展使得语言服务行业成为全球产业链重要组成部分,推动了计算机辅助翻译的广泛运用。

翻译记忆库作为计算机辅助翻译的众多核心技术之一,不仅能提高翻译的质量和效率,减少译者工作,也是企业语言资产的重要组成部分。

因此,建立翻译记忆库就尤为重要。

本文以运用trados翻译苹果系统用户手册为例,探索企业运用已有翻译来建立记忆库的阶段中存在哪些因素可能影响其使用效果,并由此提出相关建议。

关键词:计算机辅助翻译;翻译记忆库;SDL Trados Studio1. 研究背景1.1 机器翻译和计算机辅助翻译1966年,美国科学院成立的语言自动处理咨询委员会(ALPAC 委员会)宣布机器翻译无法实现完自动高质量翻译。

为了使翻译达到可出版的质量,译员的角色是必要的,计算机可用于辅助译员进行翻译。

在现代社会,几乎所有翻译都由计算机进行辅助。

计算机辅助技术,如翻译记忆库,术语库等,可以让译员免去重复繁杂的工作,保持术语的一致性。

尤其是翻译记忆库技术(Translation Memory)使传统翻译进入了工业时代(Garcia,2003)。

翻译记忆库采用翻译记忆技术。

译员在翻译时,系统在后台建立翻译记忆库。

如原文出现相同或相近句段时,系统会提供已有翻译供译员选择和参考。

SDL TradosWinAlign是一款双语对齐工具,利用已有的翻译文本建立翻译记忆库。

2. 研究过程2.1翻译记忆库的大小本文使用iPhone IOS5 的用户手册作建立小翻译记忆库,同时使用iPhone IOS5 和iPhone IOS6 的用户手册建立较大翻译记忆库。

二者在完全匹配中的区别不大,但在匹配率为95%-99%这一区间内,大翻译记忆库提供了18.29%的模糊匹配,远远高出小翻译记忆库。

翻译记忆库的大小,即其内容的充实程度对预翻译结果产生了影响。

但是小翻译记忆库除了提供几乎一样的完全匹配外,如将匹配率在50%-95% 的模糊匹配相加,大小翻译记忆库匹配数据分别为20.87%和19.93%,差異甚微。

双语平行语料库的制作流程

双语平行语料库的制作流程
Step 5.利用ParaConc软件对双语语料库进行检索统计。步骤如下:
1.运行ParaConc269软件,如下图:
2.点击“File”,在下拉列表中选择“Load Corpus Files”,如下图:
3.在Align format处,选择“Start/stop tags”,如下图:
4.点击“add”,分别添加Step 4中得到的中文txt文本和英文txt文本。如下图:
3.点击“导出”,如下图:
点击“确定”,关闭该软件。
4.找到导出文本所在文件夹,可以看到txt格式的中文文本和英文文本,打开中文文本,如下图:
点击“文件”,选择“另存为”,如下图:
在“编码”处可看到当前编码为“UTF-8”,点击,在下拉列表中选择“ANSI”,如下图:
选择“是”,关闭记事本。
注意:与英文txt文本不同,中文txt文本必须经过这一步改成ANSI格式。若文件数量大,也可使用编码批量转换软件。
点击“OK”,双语语料库制作完成。
Step 6.在该语料库中执行“搜索”功能。例如,查询“shall”在该语料库中对应的中文翻译。
1.点击“Search”,在下拉列表中选择“search”。在跳出的选框中输入“shall”,如下图:
点击”OK”,即可得到搜索结果,如下图:
2.可将搜索结果保存下来:保持该搜索界面不变,点击“Search”,选择“Save as File”,如下图:
点击“文件”→“另存为”txt文本,如下图:
点击“保存”,关闭Heartsome TMX Editor。
Step 4.利用TMX-ParaConV软件,从上一步得到的txt中英文本中分别导出中文txt文本和英文txt文本。步骤如下:
1.运行TMX-ParaConV,如下图:

SDL Trados Studio 2014-2015 对齐功能详解

SDL Trados Studio 2014-2015 对齐功能详解

SDL Trados Studio 2014/2015 --“对齐文档”详解BY 周兴华山东·烟台·鲁东大学·MTI教育中心新浪微博:@鲁大CAT教学SDL Trados Studio 2007 的对齐模块称为WinAlign,之后的SDL Trados Studio 2009、SDL Trados Studio 2011 的对齐一直借用WinAlign来实现,直到2013年9月SDL Trados Studio 2014 发布,官方才正式推出意在取代WinAlign的“对齐文档(Align Documents)”功能。

不过,悲催的是该新功能一经试用便引来无数批评,部分原因可能是大家对于WinAlign 感情深厚,历经“三年之痛,七年之痒”而不悔,但主要原因则是自动对齐效果令人瞠目,差的令人瞠目!而想伸出援手之际却发现没有“编辑”功能。

怎么能这样?自动对齐结果乱到不忍直视,手工操作又无处下手,这是要闹哪样?!差评!没商量!好事不出门,坏事传千里。

SDL Trados Studio 2014对齐文档的恶名一开始就种下了,可谓根深蒂固,也难怪常听人说Trados 2014的对齐不好用,直接称其为“渣”的教学视频更是让其陷入绝境。

事已至此,还有什么好说的呢?!如果您严重同意以上观点,以下内容可能会引起您的反感,务请留步!如果您是为吐槽、批判本文寻找证据,务请耐心读完!*******************************************************************************SDL Trados Studio 2014 有3个版本:2014 版(2013年9月发布)、2014 SP1版(2014年4月发布)和2014 SP2版(2014年11月发布)。

除去其它新功能不谈,2014版推出旨在取代WinAlign的“对齐文档”功能;2014 SP1版增加“对齐编辑”功能;2014 SP2版主打“别了JAVA”,对齐功能与SP1一样。

trados个人反思及评价

trados个人反思及评价

trados个人反思及评价使用Trados时间不长,简要谈谈个人经验,仅供后来者参考!1.Trados不是一种机器翻译软件,而是一种翻译记忆软件提起翻译软件,不少人就会联想到金山快译、东方快车等翻译软件。

尽管这些软件有一定的市场,也有人把它们吹得神乎其神,但我对它们并不看好。

这些翻译软件的特点是将英语或者汉语输进它的输入界面,马上就能得到它的译文。

可是,这只能蒙外行。

懂一点外语知识的人都能看出它的译文是驴头不对马嘴。

有一次我用金山快译翻译一段计算机方面的资料,它将Library译为图书馆,还有许多莫名其妙的错误。

我就再也不用这种软件了。

即使偶尔用用,也只是作为一种翻译的参考。

Trados是一种计算机辅助翻译(CAT:Computer Aided Translation)软件,它也称为翻译记忆(TM:Translation Memory)软件。

什么是翻译记忆?简言之,就是将译员做过的工作,用Trados 提供的工具存储起来,放到两个主要的数据库(记忆库)中,一个是句料库(用WinAlign工具制作),另一个是术语库(即Multiterm)。

在进行翻译工作的时候,只要是句料库和术语库中有的,Trados就会提醒你,帮助你,完全相同的句子,在Trados中称为100%完全匹配,自动插入译文,不再要你译第二次。

类似的句子,它用一种称为模糊匹配的方法,给出参考译文,让译员去选择、修改。

对数字、缩写、日期、时间和度量单位等等,Trados能够自动替换,比如已有的句料库中有2004年4月20日,到译文中出现日期(May 3,2005)时就会自动替换为2005年5月3日。

2.用Trados工作,必须要有句料库和术语库有的人光知道用Trados,以为有了Trados,就能够提高工作效率和译文的准确程度。

他不知道,如果没有句料库和术语库,用它是既不可能提高工作效率,也不可能做到译文准确的。

这是因为翻译记忆软件在国内还没有广泛为人们所了解,以为有了它,就一通百通了。

从译者角度探讨CAT软件的应用及发展——以Tradoa为例

从译者角度探讨CAT软件的应用及发展——以Tradoa为例

从译者角度探讨CAT软件的应用及发展——以Tradoa为例[摘要]计算机辅助翻译(CAT)软件使翻译人员免于翻译重复信息,从而提高工作效率,保证译文质量。

但现在国内市场上有许多计算机辅助翻译(CAT)软件在实际操作过程中都存在或多或少的缺陷有待解决。

因此,本文以作者亲身使用Trados过程中产生的问题为研究对象,分析问题产生的原因,并提出解决方案。

本文首先介绍使用CAT软件进行翻译工作的情境,并概述CAT翻译软件和Trados的常用功能。

其次,作者将对Trados软件特色功能的二次开发提出设想,利用Trados WinAlign工具对中英文平行文本进行对齐存库的实验,希望得出文档对齐的准确率,分析出错原因并提出改进意见。

最后,作者从译者角度出发,探讨CAT软件的未来发展趋势。

[关键词]Trados;二次开发;WinAlign文档对齐;对齐准确率科学研究表明, 企业和机构在处理专业文档时,翻译中重复的工作量高达30%,有些企业和机构的这个数字可能更高。

如欧盟的许多资料翻译重复率接近100%,微软的许多项目重复率也高达60%。

[1]50计算机辅助翻译软件(CAT)的出现能避免翻译重复句段,保证术语统一,并在很大程度上提高工作效率和翻译质量,有助于形成统一的翻译风格。

在各种CAT工具中,国内外最为知名、最具有代表性并广泛使用的是德国的Trados。

2008年侯晓琛和颜玉祚进行的一项针对CAT工具使用现状的在线调查发现,约66%的译员使用CAT工具,其中78%在使用Trados,38%在使用雅信CAT,22%在使用Déjà Vu X。

[2]223-224由此可以看出,SDL Trados无疑是当今计算机辅助翻译领域的主流软件之一,其客户范围广泛,拥有全球四万多企业级用户,占有该领域70%以上的市场份额。

[3]42作为一款拥有众多客户的软件,Trados在2008年的调查中却被认为是最难以掌握的。

将翻译过的文件导入trados全攻略-WinAlign操作手册

将翻译过的文件导入trados全攻略-WinAlign操作手册

将翻译过的文件导入trados全攻略-WinAlign操作手册将翻译过的文件导入trados全攻略 WinAlign 操作手册WinAlign 操作手册1. 用WinAlign1.1 设置项目请从“开始à程序àTRADOS 5 Applications”菜单中运行WinAlign,然后选择File菜单下的New Project。

1.1.1 设置一般选项(General标签)1. 在Project Name中键入项目名,比如“My First Alignment Project”。

注意:这只是你的项目名称,而不是文件名。

2. 在File Type下拉菜单中确定本项目所用文档类型,我们选用缺省文档类型(Word 文档)。

3. 在New WinAlign Project窗口内,单击Source Language和Target Language按钮,选择源语言和目标语言。

4. 对于中文、韩文、日文等双字节目标语言,单击T arget Segmentation按钮。

5. 对中文,选择Colon。

6. 将Trailing Whitespace的值改为0。

7. 选择Marks8. 将Trailing Whitespace的值改为0。

9. 对于韩文,选择Full Stop。

10. 将Trailing Whitespace的值改为1。

只有双字节目标语言才须要做以上特别设置。

如果目标语言是单字节语言,你只须保留原有设置即可。

1.1.2 在项目中加载文件(Files标签)1. 选择File项2. 单击Add Source Files,选择原语言文件3. 单击Add Target Files,选择目标语言文件4. 单击Align File Name按钮,现在两个文件被虚线连接起来了。

(如果,使用Align File Names无法实现文件名连接,可以手动连接文件名)注意:你可以同时加载多个文件。

1.1.3 设置Alignment选项即使没有人工干预,WinAlign也可通过调整一系列选项优化匹配结果。

Wordfast Aligner 的对齐使用

Wordfast Aligner 的对齐使用

【狗尾续貂】语料回收与双语对齐(九)-- Wordfast Aligner的使用2015年8月4日周兴华翻译技术沙龙BY 周兴华山东·烟台·鲁东大学·MTI教育中心新浪微博:@鲁大CAT教学“语料回收与双语对齐”是翻译技术沙龙近期重磅推出的一个翻译技术科普专题,共有8篇文章,其中第1篇对齐概要,后续6篇工具实战,最后1篇大盘点。

在读第1篇时作者就发现推荐的对齐工具中有Trados-WinAlign,但没有提SDL Trados Studio 2014的对齐,也没有Wordfast Aligner。

为什么呢?带着这个疑问,作者拜读了后续的7篇文章,篇篇都是图文并茂、要言不烦,真是玩对齐与股掌之间。

但是…我的疑问?常听说SDL Trados Studio 2014 的对齐不好用,更有人称其为“渣”,果真如此不堪吗?Wordfast Aligner 呢?抛弃她又是何故?作者觉得“语料回收与双语对齐”专题意在一网打尽天下对齐无对手,故斗胆在大盘点之后狗尾续貂补充以上两种对齐。

本篇先来介绍Wordfast Aligner的使用,SDL Trados Studio 2014 的对齐就留作“十全十美”带盐人吧!******************************************************************************* 首先,请准备2篇需要对齐的文档,一篇英文文档,一篇中文文档。

步骤一:打开Wordfast Aligner安装Wordfast Pro之后,依次点击:开始> 所有程序> Wordfast > Wordfast Aligner (提示:Wordfast Pro 软件中没有对齐,需要单独打开Wordfast Aligner。

)步骤二:新建对齐项目点击菜单栏上的File(文件)> New Project(新建项目)或工具栏中的图标或使用快捷键Ctrl + N,在弹出的New Project(新建项目)对话框中输入Project Name(项目名称)、Project Location(项目存放路径),Source Path(源语文档路径)、Source Language(源语言)以及Target Path(目标语文档路径)和Target Language(目标语言),如下图所示。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对齐已翻译文档导入翻译记忆库-
W i n a l i g n
Trados2011对齐已翻译文档
对于从未使用过Trados的译员来说,积累翻译记忆库是一个漫长而艰巨的过程,因此在刚开始使用时,没有可以参照的库直接拿来使用。

因此Trados具有对齐已翻译文档的功能,帮助译员将之前未使用Trados时翻译的原文和译文创建成相关的翻译记忆库。

这个功能称为Winalign。

在本节中,我们准备了一篇英文和对应的中文Word文档用来对齐译文。

请注意,原文和译文的文档类型必须一致,否则无法进行Winalign操作。

新建对齐已翻译文档项目
打开SDL Trados 2011,并在主页的工具栏中,点击按键“对齐已翻译文档”,便会跳出Winalign界面。

图6.46 Winalign界面
点击“File”菜单并新建一个项目“New Project”,会跳出一个名为“New Winalign Project”的对话框,我们需要在这个对话框调整语言、文件等一系列设置。

图6.47新建对齐项目
点击“General”常规选项卡,在“Project Name”中填写项目名称,并设置原语言和目标语言,分别为英文和中文。

对于文件类型而言,由于准备的是word文档,则选择“Microsoft Word Document (*.doc)”文件。

图6.48设置常规选项
需要注意的是,Winalign是根据设置的断句规则来进行断句并自动对齐的。

对于中文而言,需要对断句规则略作调整。

点击“Chinese (PRC)”下方的“Target Segmentation”设置中文的断句规则。

由于中文的冒号、问号和感叹号之后都没有空格,因此点击“Colon”,将“Trailing WhiteSpaces”前的数字改成0。

同样需要修改的还有“Marks”。

图6.49修改中文断句规则
General 常规选项设置完成,第二步便是加载需要对齐的原文及译文。

点击第二个选项卡“Files”。

在英文栏和中文栏中分别添加原文及译文,并点击按钮“Align File Name”,将两个文件之间相连。

图6.50添加原文及译文文档
在该选项卡中,可以添加多组原文及译文,并将它们之间相互连接。

在示例项目中,我们只添加一对文件。

图6.51选择导出格式
添加文件完成后,需设置导出文件的类型。

Winalign默认导出的文件为txt,但对于SDL Trados 2011而言,只有导成翻译记忆库交互文件tmx,才能直接导入至2011的翻译记忆库中。

因此此例中我们单击“Export”选项卡,并选择“Translation Memory Exchange Format (TMX)”,并点击“OK”确认该设置。

完成后点击“File”菜单-> Save Project,保存该项目。

匹配文件对
选择需要匹配的文件对,点击菜单栏中的“Alignment”,并选择“Align File Pair”对齐该文件对。

文件匹配后,经过winalign处理的结果显示在编辑窗口中:
图6.52文件匹配结果
Winalign后自动匹配的句段以虚线连接。

接下来是进行检查的工作,译员或审校员需查看左右两边的句段是否互为译文。

如果发现有错误,可以将虚线断开。

右击某一侧句段的绿色节点,并选择“Disconnect”,将其拉至正确的句段节点上。

手动连接的线皆为实线,这表示被连接的两个句段已经是确认的状态(Committed)。

图6.53检查并手动连接确认句段
如果需要原文或者译文句段的,可以直接双击该句段,并将光标移至需要修改处,可进行相应的修改工作。

图6.54修改句段
通篇检查完毕后,可右键点击界面当中空白处,并选择“Commit All Units”(确认所有单元),将所有虚线变为已确认的实线。

如果文章很长句段较多,可以在检查过程中时时保存项目,以便下次打开该项目时会直接跳转至上一次正在检查的位置。

图6.55确认所有句段
导出匹配结果
检查完并确认所有句段后,我们需将结果导出。

点击“File”->“Export File Pair”(导出文件对),选择导出文件存放的位置,并将目标tmx文件导出。

“File”菜单中还有一个按键为“Export Project”(导出项目),如果点击该按键,则导出该项目中所有的文件对。

图6.56导出TMX文件
至此,我们完成了将两片文档(原文及译文),通过Winalgin工具进行对齐,并做句段检查,最后导出成tmx的过程。

该tmx文件可直接导入至SDL Trados 2011翻译记忆库中,为译员翻译工作带来方便。

导入SDL Trados 2011翻译记忆库
打开SDL Trados Studio 2011,切换至“翻译记忆库”视图
右击左侧列表中的某一翻译记忆库,并选择导入:
在弹出的对话框中点击“添加文件”,并选择之前使用Winalign生成的*.tmx文件
点击“下一步”,直至最后进度条完成。

这样,我们就完成了对翻译记忆库的更新,之前翻译过的文件被做成了翻译单元并导入了2011的翻译记忆库中。

使用Winalign时会产生的问题
问题一:在对齐完成后,导出文件对时,Winalign发生错误,软件自动关闭
解决办法:
1. 在对齐过程中请时时保存项,下次查看时可以打开项目,并右击文件对,点击“Review File Pairs”来查看对齐结果
2. 如果发生上述错误,可点击“设置”->“项目”,选择其中的“export”选项卡,将导出文件类型设置成“Translator’s workbench import Format”
3. 重新导出文件对(此时导出的文件是txt文件,而非之前设置的tmx文件),软件将不会报错。

问题二:在Winalign中加载文件后,双击文件对时软件突然报错并自动关闭
解决办法:
1. 将两个文件另存,例如原来doc的文件,另存成docx
2.重新加载另存后的文件,双击后软件应不会报错。

相关文档
最新文档