旅游汉英双语平行语料库的建设与应用

合集下载

语料库的分类\创建和检索简述

语料库的分类\创建和检索简述

语料库的分类\创建和检索简述随着计算机技术的发展,语料库开创了新的研究方向,引起了越来越多的注意。

本文将简单介绍语料库的概念、分类、创建和检索及其在应用中的优越性和局限性,使相关爱好者初步了解语料库这一新的范畴。

标签:语料库;平行语料库;类比语料库;创建;检索1.引言自20世纪中期, 美国布朗大学创建了世界上第一个语料库,即标准美国英语布朗语料库,开创了语料库研究的先河,到20世纪80年代,这一星星之火开始渐渐有燎原之势,上海交通大学杨惠中教授便在这一崭新的浪潮之下,于80年代中期率先建成中国第一个真正意义上的语料库,即上海交大英语科技语料库、接着像中国学习者英语语料库、大学英语学习者口语英语语料库、北外的汉英汉日平行语料库等陆续建成,并且还吸引了一些教授、博士生、硕士生的目光,开始把研究方向转向语料库研究,为中国语料库研究的发展注入了新的力量,同时也推动了基于语料库的语言学研究和翻译研究的发展.2.语料库的定义及分类语料库是以计算机储存大量的真实语料,对语料做各种带有研究目的的加工标注,利用研制的检索工具对标注语料进行快捷的搜寻和分类,以发现并分析以往因条件限制而未能注意的语言现象(王克非,2004)。

研究的性质和需要决定着语料库的性质,根据语料库中收集语料的种类多少可以分为,单语语料库、双语语料库和多语语料库(王克非,2004)。

单语语料库指只收集一种语言的语料库,早期开发的语料库大多都是单语的,如布朗语料库。

双语语料库指收集两种语言文本的语料库。

多语语料库指收集两种以上语言文本的语料库。

而双语和多语语料库又可以分为平行语料库、类比语料库和翻译语料库三类。

平行语料库又可称为对应语料库,是由原文和它对应的译文文本构成的,可以有词语、句子和段落三种级别的对应关系;类比语料库是由同一语言不同变体的文本或不同语言的文本构成;翻译语料库是由具有翻译关系的不同语言的文本构成,它和平行语料库的区别在于,它仅仅只是篇章上的对应关系,不一定有其它级别的对应关系如词语、句子和段落等。

基于英汉双语平行语料库的翻译教学模式研究_熊兵

基于英汉双语平行语料库的翻译教学模式研究_熊兵

基于英汉双语平行语料库的翻译教学模式研究*熊兵提要:本研究探讨了基于英汉双语平行语料库的翻译教学模式。

研究首先讨论了适用翻译教学的英汉双语平行语料库构建,重点分析了建库中的语料标注问题,主要涉及词性标注、语言特征信息标注、翻译方法与技巧标注。

研究进而论述了基于英汉双语平行语料库的翻译教学模式构建及其运作,着重解析了翻译教学模式的教学内容编排、实施原则及操作方式等相关方面。

关键词:英汉平行语料库;翻译教学模式;语料库构建;语料标注;操作方式Abstract :The present study makes an exploration of a translation teaching model based on an English-Chinese paral-lel corpus.The study firstly discusses the construction of the English-Chinese parallel corpus pertaining to translation teaching ,and focuses on the annotation of the corpus ,mainly including the POS tagging ,language-feature annotation and translation-method /technique annotation.Then it probes into the development of the translation teaching model based on the corpus and its operation ,and explains the arrangement of teaching content ,implementing principles and the operational procedures.Key words :English-Chinese parallel corpus ;translation teaching model ;corpus construction ;data annotation ;op-erational procedure中图分类号:H319文献标识码:B 文章编号:1004-5112(2015)04-0002-091.研究背景作为新兴教学研究领域,基于语料库的翻译教学研究正日益受到学界的关注。

汉意意汉文学平行语料库的研制

汉意意汉文学平行语料库的研制

语料库语言学 2020年 第7卷 第2期汉意意汉文学平行语料库的研制*北京外国语大学 余丹妮提要:北京外国语大学汉意意汉文学平行语料库是首个以意大利语经典文学作品及其汉语译本、汉语经典文学作品及其意大利语译本为语料创建的双语双向平行语料库。

语料库研制的主要环节包括语料文本的搜集与选择、语料电子化、语料对齐与语料检索功能的实现。

本语料库基于互联网进行部署,向相关领域的学习者、译员及研究人员开放,有助于促进汉语—意大利语文学翻译的教学与研究,以期进一步推动中国文学的对外翻译。

关键词:汉意意汉文学平行语料库、意大利语、文学翻译1. 引言双语平行语料库的建设与研究已有近30年的历史。

20世纪90年代初,世界上第一个双语库在加拿大建成(王克非、黄立波 2012:3)。

平行语料库的开发与研制是语料库翻译学取得新突破的数据和方法基础,其潜力有待激发(王克非、黄立波 2012:8)。

目前,平行语料库涉及的语言主要为英语,比如德英文学文本平行语料库(GEPCOLT)、隆德大学开发的英语—瑞典语双向平行语料库(ESPC)、博洛尼亚大学开发的英语—意大利语双向平行语料库(CEXI)等(王克非、黄立波 2012)。

目前仍未发现汉语与意大利语作为句对的双语平行语料库以及相关研究。

自2019年3月,我国与意大利签署《“一带一路”倡议谅解备忘录》以来,中意两国在各领域的合作日益加深,意汉文学翻译领域及翻译教学的需求不断增长。

1980—2017年,37年间,在意大利仅以书籍形式出版的中国文学译作就有260部(吴菡、吴志杰 2018)。

在这一背景下,汉意意汉文学平行语料库CIICLPC的创建具有紧迫性和必要性,将为两国的文学翻译研究、文学交流与语言教学等提供突破性的数据共享平台,为现有翻译研究提供可靠的数据支撑,更系统地推进意汉翻译研究。

* 本文系教育部人文社科青年项目“意汉双向平行语料库的构建与研究”(19YJC740044)、北京外国语大学一流学科建设自主选题重点项目“意大利语语言学研究概论”(YY19ZZA022)和北京外国语大学一流学科建设自主选题重点项目“汉语—欧洲非通用语双语平行语料库”(YY19ZZA021)的阶段性成果。

理想与现实之间的一种选择——关于平行语料库建设及其使用的几点思考

理想与现实之间的一种选择——关于平行语料库建设及其使用的几点思考

成果 , 一切 自行重起炉灶 , 从头做起的想法 , 既不科学 , 也不现实。 但是 , 由于双语词典编纂活动的一个 主要 目 标就是改进词典的编
纂方法 , 针对众多汉英词典中一些词 目 义互相借用 、 译 大同小异的
普遍现象 , 词典编者必须要有 目的地阅读 、 爬梳名家的翻译材料来 搜寻那些“ 更好” 的对应词 , 或者是搜寻那些 “ 的却被其他词典 好”
译材料的质量都处于“ 与“ 之间 , 好” 坏” 百分之百地完全忠实于原
文的译文是不存在的。殊不知 , 作为一项学术活动的翻译也有 自 己的一套操作准则。 汉英词典编纂最重要的工作 , 是为汉语词 目提供英语对应词。 因此 , 编者在广泛收集翻译材料的基础上 , 找出汉语词语的准确英
b a g ru(f evi l oso) no i
学而不厌, 诲人不倦 l mwh ta ta a i i  ̄ud e io t y n tc w} b | a tusi de h t e 删te1 i g e
天生我材必有用 8T s m出 yt e ae fh m ti o n e 0l ue i e b m d ts a rl mi m 1e o i ea b
以一种语言或多种语言形式 出现的文本及其译文在段落层次左右 对齐 , 在句子乃至短语层面尽量相对应 的电子语料库。 j 而, _然 2 客
观地讲 , 词典编者要将大量 的原文文本与译语文本输入计算机 , 需 要投入大量人力 、 物力。由于具体的翻译过程是翻译 者主观裁决
的过程, 而非一个直接的文字转换过程, 词典编者即使花费大量的 人力、 物力将汉英文本输入计算机 , 也未必能收到相应的回报。因 此, 如何改进平行语料库 的设计方案, 更好地使用名家 的翻译材

中国科学院汉英平行语料库

中国科学院汉英平行语料库

中国科学院汉英平行语料库
中国科学院汉英平行语料库(Parallel Corpus of Chinese Academy of Sciences)是一个结构整齐、体积庞大、全方位覆盖的、
面向科技文献翻译的大规模语料库,是中国科技研究文献汉英翻译的
极佳资源。

本平行语料库收录的文献共计达到700多万句,包括来自中国科
学全文数据库、中国科学文摘数据库、维普资讯网、万方科技云等多
种来源的语料,覆盖了国内各种学科的文献翻译,丰富了汉英翻译资源,有助于科学研究。

中国科学院汉英平行语料库由中国科技文献翻译研究重点实验室,以及中国工程院等机构联手制作而成,从平行语料收集、平行语料处理、数据标注、语料质量检验等多个方面考虑,采取多种技术手段,
结合中文语料注记标准和英文规范,实现了翻译文献自动化标注,实
现了文本在线查询、翻译查询和语料挖掘等功能。

中国科学院汉英平行语料库对于文献翻译、机器翻译、口译辅助、自然语言处理和语言学研究等领域都有重要应用价值。

经多方测试,
本库满足了机器翻译系统训练所需的高质量、大规模的汉英平行语料
的要求,针对机器翻译的分析预测开发,研究的执行效果有明显的提升。

此外,中国科学院汉英平行语料库还对外提供汉英、汉法、汉德
等多语种的神经网络翻译系统,支持跨语言机器翻译,支持词法短语
翻译等覆盖面更加透彻的翻译服务,搭建起一整套健全的翻译系统,
广大研究人员和学者可以在线上获得高效、准确的翻译结果,满足学
术研究和实际应用的需要。

中国科学院汉英平行语料库在自然语言处理领域发挥了重要作用,极大提升了中国自然语言处理市场的竞争力,为自然语言处理的发展
推进了大中国语言环境的翻译。

汉英公共标示语的语用功能及其翻译策略——兼论河南省旅游城市双语标示语建设

汉英公共标示语的语用功能及其翻译策略——兼论河南省旅游城市双语标示语建设
提 出 了双 语 标 示 语 建 设 的 一 些 思路 。
[ 中图分 类号 ] 3 5 9 H 1 .
[ 文献标 识码] A
[ 文章编号 ]0 8 6 8 2 1 )4—03 0 10 —2 3 (0 0 0 15— 3
发表 文章 , 目为 《 题 标记 语 的英 译 原则 及实 例 分析 》 。吕和 发( 0 5 、 2 0 ) 贺学 耘( 0 6 、 2 0 ) 龙江华 (0 7 等都 从不 同角度 对 20 ) 双语标 示语进行 了分析 、 阐述 。但早期 的双语标示语研究 多
公 共 标 示 语 作 为 社 会 用 语 的重 要 组 成 部分 , 于 社 会 管 属
理用语范畴 , 其社会功 能是 显而易见的 。进入 2 1世纪 , 国 我 的对外交流更加频 繁 , 各大城 市或旅游景区 的标示语双语 化 达到 了前所未有 的程度 。这些 双语标示 语大 大方 便 了国 际 人士在华工作和生 活 , 同时也 存在着各种错误和不规 范现 但 象 。标示语作为城 市的形象窗 口, 是其语言和人文环境建 设 的重要载体 。标示语 的恰 当翻译 和得体 运用 不仅有 利 于提 升城市及旅游景 区的国际形 象 , 也体 现了当地较高的教育 水 平和公 民文化素质 。本 文拟 在 阐述我 国公共标 示语 及其 翻 译研究现状的基础 上 , 探讨公共标示语 的语用特征和功能 意 义 , 归纳、 并 分析我 国双语标 示语 中存在 的问题 , 最后 以河 南 省主要旅游城 市为 例 , 出双 语 标示 语建 设 的一 些基 本 思 提 路, 以期 净化语 言人文环境 , 优化 国际交往空问 , 提升旅游 城 市的国际形象 , 更好地 服务于 对外宣 传 和经 济文 化交 流 , 助
格式文本 ) 和呼唤功能型文本 ( 能够 感染 读者并 使其 获得信 息的所有文本 ) 。呼唤型文本 功 能 的核心是 读者 层 , 是唤起 他们去行动 、 去思考 、 去感受 , 照文本预想 的方 式作 出反应 按 ( e m r,9 8 。标示语 文本最 主要 的 目的是 唤起读 者注 N w ak 18 )

“中国法律法规汉英平行语料库(PCCLD)”创建的思路、过程与功能

“中国法律法规汉英平行语料库(PCCLD)”创建的思路、过程与功能

收 稿 日期 :0 0—0 — 5 21 1 0
作 者 简介 : 鸿 仁 (9 1 , , 苏 宿迁 人 , 授 , 事语 法 理 论 、 孙 15 一) 男 江 教 从 语料 库 语 言学 、 S E P翻译 等 研 究 。
杨 坚 定 (9 1 , , 江绍 兴 人 , 授 , 事 系统 功 能 语 法 、 料 库 语 言学 、 语 教 学 沦 等研 究 。 16 一) 女 浙 教 从 语 外
1 P C D研 发 背 景 .C L
语料库 建设 随着信息 技术 的发展 而发展 。2 纪 6 0世 0—7 0年代 问建立 的 Bon Cru 和 L B C ru , r o s w p O o s p
分 别汇集 了 10万词次 的美 国和英 国书面英语 ;0年代建 立 的 Ln o 0 8 odn—L n o u oe nlh L C u dC r s f pknE g s( L ) p oS i
第 2胡
孙 鸿 仁 杨 坚 定 : 中 国法 律 法 规 汉 英 平 行 语 料 库 ( C L )创 建 的思 路 、 程 与 功 能 “ PCD” 过
4 9
平 行语 料库 。
在 国 内 , 京大 学计 算语 言学 研究 所 、 北 哈尔滨 工业 大学 、 外语 教学 与研 究 出版社 、 国家 语言文 字工 作委
千万词 次 。T eIt ntn l o u f nlh IE 语 料库汇 集全 球 2 h e aoa C r s gs (C ) nr i p oE i 0个 国家 和地 区 的英 语语 料 , 可用 来 进
行跨 国界 、 跨地域 、 跨文 化 、 跨语 域 的英语 对 比分析 。这 一切 都 为语 言 学 的研 究 提 了无 穷无 尽 的 资料 来 源 ( 王建新 ,9 9 。 19 ) 在 我 国, 英语 语料库 语 言学的 研究是从 7 O年代末 8 0年代初 兴起 的 , 基本 与世界 同步。 目前影 响 较 大 的 J E T是 由上 海交 大的黄 人杰 、 DS 杨惠 中主持完 成 的专 门用 途英语 语料 库 ( 惠 中,03 。 目前 J E T扩 杨 20 ) DS

军事双语平行语料库建设意义分析

军事双语平行语料库建设意义分析
参考文献 : 『1]王岚 ,严灿 勋.军事英汉 汉英平行语料 库建设存在 的 问题 及
对策[J].解放 军外 国语 学院学报 ,2o15,38(5):33—34. [2]梁晓波 ,刘伍 颖 ,孟凡 礼.信 息化条件 下的 军事 语料 库应 用
也掌握 了真 实语 境下 的交 际用语 ,积 累了军事英语术语 ,为军 事英语交流奠定 了良好 的基础 。
三 、军事双语平行语料库应用于军事英语研究 利用语料库对军 事英语本身特 点的研究是今后 研究 的一 个 重要方面 ,对 军事英语教学 的研 究将随着军 队院校 的转 型 成为今后军 事英 语研究 的重要 方向。 已有 的对 军事英语词 汇 和文体 的研究 主要采用 自上而 下的研究方法 ,今后 的研究 可 以结合 自下 而上 的方法 ,利 用语 料库 的研 究方 法 ,通 过真实 的 语 料展 现军事英语的文体特点 。随着 信息技术的飞速发展 ,多 种 操作简单 、易 获取 的计算机技术 和软件为语料库 的建设 和 分 享提供 了帮 助。而现代教育技术 的飞速发展和教 学理念 的 不断更新 ,除了推动真实语料在 军事英语课堂 的普 及使用 之 外 ,还使相关研究具备真 实数 据的支撑。基于语料库 以及语料 库驱动的研究方法使军事英语研究 向更深层 次发展 。 另外 ,军事双语语料库具有 可扩展性 和开放性两大 特点 , 即不断有新鲜语料充 实到库 内,同时教师和科研人 员能 随时 查 询和使用库 中的语料 。这样 可以推动军事翻译平台 的建立 , 为情报搜集 、军事演练 和实 战提供强有力 的保 障 ,具 有广 阔的 应 用 开 发 前 景 。 四 、结 语 军事英语语料库 为军事英语课 堂教 学提供 了真 实可靠 的 语 料支撑 ,为 军事 翻译 和培 训 、军事词 典编撰 、军事英语 文体 学 研究 、语 言对 比研究 、军事英语教 学等提供 了真实 自然 的语 料 ,促进 了军事英语在各方 面的应用 ,对新形势下军 队改革转 型 、军 队院校英语教学 、培养符合 军队需要 的精英 人才具有重 要 作用 和意义。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第33卷第10期湖南科技学院学报 V ol.33 No.10 2012年10月 Journal of Hunan University of Science and Engineering Oct.2012旅游汉英双语平行语料库的建设与应用肖庚生 陈欣(南华大学 外国语学院,湖南 衡阳 421001)摘 要:文章在综述现有旅游语料库的基础上,介绍了自建的衡阳旅游汉英平行语料库的建库步骤,即语料的取样、英译、标注与对齐,并阐述了该库在旅游文本语言特征、旅游翻译、旅游英语及旅游翻译教学研究中的应用价值。

该库的建设与应用既能充分满足研究需要,亦能促进导游、翻译等英语人才的培养,进而推动当地旅游产业的发展及跨文化传播。

关键词:旅游语料库;双语平行语料库;旅游英语中图分类号:H030文献标识码:A 文章编号:1673-2219(2012)10-0163-03近30年来,语料库及语料库语言学从无到有、蓬勃发展。

基于语料库的语言学及应用语言学研究应运而生,语料库这一研究工具与方法业已广泛应用于词汇、句法、语义、语言对比、词典编撰、二语习得、翻译等领域的研究之中, 并取得了累累硕果。

[1]为了研究或应用的需要,国内外先后创建了跨学科、多语言、内容迥异、库容不一的众多语料库。

近年来,双语平行语料库由于其独特的优势备受关注,其建设与应用正如火如荼地进行。

不过,迄今为止,国内外高校与研究机构所研制的平行语料库主要是通用型的双语平行语料库以及文学翻译类型的平行语料库,以某一专门用途为导向的平行语料库仍较为鲜见。

此外,基于平行语料库的相关研究主要侧重于对个别语言或翻译现象的探讨。

鉴于这一研究现状,我们拟以课题研究为契机,建设衡阳旅游汉英双语平行语料库,在此基础上,力图摸索其在汉语与英语的旅游文本语言特征、旅游汉英翻译、旅游英语与旅游翻译教学研究中的应用。

一双语语料库与旅游语料库综述双语语料库最早创建于上世纪90年代中后期,迄今为收稿日期:2012-08-26基金项目:衡阳市社科基金项目“顺应论视阈下衡阳旅游汉英双语平行语料库的建设与应用研究”(项目编号2011C011);全国教育科学规划课题“基于语料库的大学英语教学平台建设与研究”(项目编号GPA105029)阶段性成果。

作者简介:肖庚生(1980-),男,湖南衡阳人,讲师,应用语言学博士生,主要研究方向为语料库语言学。

陈欣(1983-),女,湖南郴州人,讲师,语言学硕士,主要研究方向为翻译理论与实践。

止国内外业已建立多种类型的双语平行语料库。

早在1995年,曼彻斯特大学研制了世界上首个翻译语料库,主要收集从各国语言翻译成为英文的文本,如今库容已达千万词。

但是它并非严格意义上的双语平行语料库,因为它并没有实现双语对齐,只能称其为对比语料库。

目前国际上比较知名的平行语料库有挪威的“英语-挪威语平行语料库”、英国的“德语-英语文学文本平行语料库”等等。

而由北京外国语大学中国外语教育研究中心于2004年启动创建的“新型双语对应语料库”(含汉英、汉日两个双语平行语料库),库容为3000万词次。

其中,汉英双语平行语料库的文本类型主要涵盖人文类、社科类和科技类。

该语料库的建设得到了国家社科基金重大规划课题的资助,目前正为1亿词次的超大库容做进一步的扩容努力。

此外,国内比较知名的双语平行语料库还包括:李德俊以汉英词典研编为主要目的,主持建设2000万词次的英汉平行语料库;卫乃兴以研究探讨英汉对等表达为目的,主持建设900万词次的英汉平行语料库;哈尔滨工业大学所创建的库容为40万对的英汉双语平行语料库;绍兴文理学院创建的中国古典文学英译双语平行语料库等等。

上述双语平行语料库多数以文学文本为主,抑或以收集百科文本(含文学与非文学作品)为特色,而针对某一特定文类或某一地域特色而专门建构的专门用途双语平行语料库仍较为鲜见。

近年来,随着交通与通讯技术的日新月异,世界各地人们之间的科技、文化、商务交流、合作与往来日益频繁。

更为重要的是,各国人们纷纷走出国门,畅游世界,体验世界各地的异域风情,许多国家的旅游产业获得了飞速发展。

为更好地发展旅游产业、传播旅游资讯、吸引外国游客,同时亦为了满足语言学及应用语言学研究需要,旅游专门语料库应运而生。

163到目前为止,国内外最知名的旅游语料库有如下四库:一是芬兰萨翁林纳翻译研究学院语言教师Michael Wilkinson所创建的库容为67万词的英语旅游文本语料库,旨在为芬兰学生在将芬兰旅游文本英译时提供参考标准;二是英国埃塞克斯大学研究生Carlota Alcantar于2007年创建的库容为37,795词的英语旅游文本语料库,其内容包括旅游行政机构的介绍、酒店及旅行社信息等,旨在为旅游英语教学总结旅游写作常用的词汇与短语;三是日本大学Kiyomi等人于2006年所构建的“京都旅游语料库”。

该库为英语单语语料库,收集的材料均为用英文撰写的有关京都旅游介绍的文本,共885篇,建库目的在于总结适合于日本旅游市场(尤其是京都地区)常用旅游英语词汇,为旅游英语课程提供教学参考;四是香港理工大学中文及双语学系所创建的新型双语平行旅游语料库,是中国第一个较大库容的英汉/汉英旅游语料库,它由一个双语旅游翻译对应语料库与一个双语旅游翻译类比语料库组成,库容为各100万字/词。

旨在促进香港旅游翻译研究以及旅游英语教学。

尽管世界各地的旅游语料库建设工作取得了丰硕的成果,但鉴于各地有着各自独特的自然与人文景观,各地旅游资源迥异,因此旅游语料库的本土化至关重要。

为了对衡阳旅游资源进行跨文化传播,并满足语言学与应用语言学研究需要,促进在衡高校旅游英语及旅游英汉互译教学,我们自建了衡阳旅游汉英双语平行语料库(Hengyang Tourism Chinese & English Bilingual Parallel Corpus,HTCEBPC)。

二 HTCEBPC的创建HTCEBPC是一个开放式的语料库,也就是说,其库容将会随着旅游宣传或研究需要不断得到扩充。

HTCEBPC的内容主要涵盖以下几个方面:衡阳自然景观、人文景观的介绍;介绍衡阳旅游资源的观光小册子;衡阳本土酒店、旅馆、餐饮业及娱乐场所与设施的介绍;与衡阳旅游业相关的其它行业的文本,如交通运输、导游服务、旅行社业务、货币兑换、投诉处理、景区公示语及旅游管理部门的宣传等相关的文本。

HTCEBPC的建库工程主要包括以下三个步骤:首先是对汉语语料的取样。

语料的选择主要借鉴Maia[2]的标准,依据社会语域(如分为景点介绍、观光介绍、景点公示语、旅游配套设施介绍等若干类),将分层抽样、均衡抽样和比例抽样有机结合使用,以确保入库语料的代表性。

语料来源既包括正式出版物(图书、论文、音像制品等),非出版物(网页、各类旅游宣传材料如酒店介绍、旅行社介绍、景点旅游宣传册等)。

我们在建库过程中充分利用衡阳市旅游局与衡阳市旅游协会的官方网站-衡阳旅游网(www.. )以及南岳衡山官方网站(/)等权威网站的网页内容。

此外,我们亦深入5A级景点南岳衡山以及回雁峰、石鼓书院、王船山故居、蔡侯祠等著名景点进行实地考察,获取关于景点介绍、景区标识语等信息的第一手语料,并进行录入。

同样,我们亦通过利用网络资源与实地调研相结合的方式获取有关衡阳林隐假日酒店、神龙大酒店等旅游配套设施的相关语料。

实现衡阳旅游汉语文本的数字化,建成衡阳旅游汉语语料库(Hengyang Tourism Chinese Corpus, HTCC)。

接着我们在完成汉语语料的取样基础上对衡阳旅游汉语文本进行英译。

笔者曾于2009年参加了南岳衡山申遗活动中的口、笔译工作,发现当前南岳景区建设中明显滞后的一个环节就是其英译工作,景区中许多景点介绍、标识牌等缺乏中英对照文本,即使有,也是错误百出。

其他景区的旅游英译则更是一块未曾开垦的处女地。

我们以Verschueren[3]所提出的顺应论为翻译实践的理论指导,将旅游文本英译的全过程视为一个不断顺应和选择的过程。

我们在理解原文的阶段,运用顺应理论,可以通过认知语境进行推理和探究,找出原语中的心理因素和文化特质,从而加深对旅游文本交际意图的理解。

与此同时,在用译语进行重新编码时,运用动态顺应的原理,在众多的语言选择中,找出最能让译语读者接受的语项,从而顺利地完成满足译语读者需求的翻译任务。

尽管对旅游文本的汉译英是一项艰巨浩大的工程,但庆幸的是,笔者所在的课题组其组员普遍英语技能较高、翻译能力较强、理论功底扎实,他们发扬精诚合作的精神,顺利完成相关语料的汉译英工作,建成衡阳旅游英语语料库(Hengyang Tourism English Corpus,HTEC)。

最后则实现语料的标注、对齐。

语料标注分为词性标注与修辞标注两类。

HTCC的词性标注将通过运用SVMTool得以实现,SVMTool在中文词性标注中具有较高的准确率。

而HTEC的标注则以CLAWS7来得以实现,它的标注准确率已达到96%以上。

而修辞标注则无现成的电脑软件进行辅助,完全需要人工进行。

HTCEBPC中、英文语料都首先启用Paraconc 软件以句为单位进行粗略对齐,辅之以人工校对,以备concordancer 检索所用。

而中文语料还通过利用中科院计算所研制的“汉语词汇分析系统”(ICTCLAS)进行切分。

不过需指出的是,我们在顺应论的指导下,对旅游文本的翻译并非完全按照句对句的原则,我们灵活采纳摘译、扩译或省译等翻译策略。

故软件在某些地方难以实现一对一的对应。

我们便在运用concordancer检索相关的句子时,设定同时出现相对应的句子的相邻的几个句子,通过提供详尽的语境,能较为准确地了解是哪一不奋斗原文被改动。

在语料实现对齐后,文本转换为XML格式,这样就能让语料库以多种语言格式编码,以便传播与检索。

三 HTCEBPC的应用目前,本旅游语料库只是初步建成,今后将会逐步增加语料扩充库容,并考虑将语料库上网或制作为可供检索的光盘。

同时,我们还将不断完善对语料库的标注,依据教学与研究需要,进行语义与句法方面的标注,最大限度地挖掘语164料库的应用潜能。

我们业已或将要在以下几个方面开展基于HTCEBPC的研究,以实现其应用价值。

首先,旅游文本语言特征研究。

旅游双语平行语料库的构建为我们提供了鲜活、真实、海量的有关景点介绍、景区公示语、酒店文宣等内容的语料。

对这些旅游文本的分析有助于揭示汉英两种语言旅游文本在词汇、句法、语篇以及文体上的语言特征的共性和差异。

借助于语料库定量数据分析,我们可以得到旅游文本标准化类符/型符比,平均词长、平均句长、词类的出现频次与频率、词块的出现频次与频率等定量数据信息。

我们已初步发现,英语旅游文本通常具有用词平易、丰富、通俗易懂,注重语篇衔接,强调呼唤功能等特点,而汉语旅游文本则表现为数量表达使用过于频繁,惯于堆彻华丽辞藻,常用隐性语篇衔接手段。

相关文档
最新文档