语料库在改善中国旅游资料翻译可接受性差方面的创新性作用

合集下载

平行语料库在翻译教学中的应用初探

平行语料库在翻译教学中的应用初探

平行语料库在翻译教学中的应用初探【摘要】本文旨在探讨平行语料库在翻译教学中的应用。

首先介绍了平行语料库的定义和特点,然后分析了平行语料库在翻译教学中的优势,包括提高学生的翻译水平和培养跨文化意识。

接着列举了一些平行语料库在翻译教学中的应用案例,比如在翻译实践课程中的应用等。

还讨论了平行语料库在翻译教学中可能面临的挑战,并提出了如何更好地利用平行语料库进行翻译教学的建议。

展望了平行语料库在翻译教学中的发展前景,并对其在未来的展望做出了一些预测。

通过本文的研究,可以更深入地了解平行语料库在翻译教学中的作用和潜力,为提高翻译教学质量提供一定的参考和启示。

【关键词】平行语料库、翻译教学、定义、特点、优势、应用案例、挑战、利用、发展前景、展望、结语。

1. 引言1.1 平行语料库在翻译教学中的应用初探通过对平行语料库的研究与探讨,可以帮助翻译教学者更好地理解学生在翻译过程中所面临的困难与挑战,进而针对性地进行教学指导与辅导。

平行语料库的丰富资源也为翻译教学提供了更多的素材和案例,帮助学生更好地了解不同语言之间的对应关系,提高翻译水平。

本文旨在探讨平行语料库在翻译教学中的应用现状与发展趋势,为翻译教学领域的研究和实践提供新的思路和方法。

在未来的翻译教学中,平行语料库将扮演越来越重要的角色,为培养优秀的翻译人才提供强大的支持和帮助。

2. 正文2.1 平行语料库的定义与特点平行语料库是指包含源语言和目标语言之间对应的句子对的数据库。

它是翻译学习和研究中的重要工具,能够帮助学生更好地理解和掌握语言之间的翻译规律。

平行语料库的特点主要包括:1. 双语对照:平行语料库中的文本是按照源语言和目标语言之间的对应关系进行排列的,方便进行对照和比较。

2. 多样性:平行语料库中包含大量的不同主题和领域的文本,涵盖了多种语言风格和表达方式,有助于学生了解不同领域的翻译技巧。

3. 实时更新:平行语料库会定期更新,保持内容的新鲜和多样性,确保学生可以接触到最新的翻译材料。

浅谈语料库应用于高校翻译教学的优势

浅谈语料库应用于高校翻译教学的优势

浅谈语料库应用于高校翻译教学的优势
语料库是指一定数量的语言材料集合,这些材料可以是书面材料、口语材料、电子文
献等,语料库可以为翻译学生的学习和研究提供可靠的语言数据。

1. 语料库可以提高翻译质量
语言是变化的,过去的翻译作品可能已经不能适应今天的语言要求。

通过语料库,学
生可以获得大量的实际语料,了解当今语言的发展趋势和变化,可以更好地掌握专业术语,提高翻译质量。

通过语料库,翻译学生可以快速找到相应的语料,不需要耗费大量时间在文献检索上,提高了翻译速度。

3. 语料库可以培养学生自主学习的能力
语料库需要学生自己去探索和发现,这可以锻炼学生的自主学习能力,促进学生的知
识建构和能力提升。

4. 语料库可以加强文化交流和跨文化理解
语料库不仅包含了语言材料,还包含了文化材料,通过学习语料库中的文化材料,学
生可以更好地理解不同文化之间的差异和共同点,加强文化交流和跨文化理解。

总之,语料库对于高校翻译教学的优势是显而易见的,语料库在翻译教学中的应用也
将会越来越广泛。

浅谈语料库应用于高校翻译教学的优势

浅谈语料库应用于高校翻译教学的优势

浅谈语料库应用于高校翻译教学的优势随着信息时代的到来,语料库的作用在翻译教学中越来越重要。

语料库是大规模语言现实样本的电子化储存库,包括各种类型的语料,如文本、音频、视频等,是翻译教学中不可缺少的资源。

本文将从三个方面浅谈语料库应用于高校翻译教学的优势:贴近真实语言使用、提高学生实践能力、提高翻译质量。

首先,语料库应用于高校翻译教学的优势之一在于它可以贴近真实语言使用。

学习翻译不是单纯地学习语法知识和单词词汇,更重要的是学习语言的实际应用。

语料库中的数据来源于真实的语言使用环境,可以很好地贴近实际场景,从而让学生更好地掌握语言的使用方式和特点。

在实际的翻译中,学生还可以通过语料库去寻找典型的句型和语言表达方式,快速准确地翻译。

因此,语料库能够帮助学生更好地掌握语言,更准确、更生动地进行翻译。

其次,应用语料库能够提高学生的实践能力。

在翻译教学中,学生单纯地学习语法知识和单词很难直接应用到翻译实践中。

但是,语料库可以提供大量的例句和标准翻译,让学生可以在实践中进行学习和运用。

学生可以通过对原文和译文的反复对照,找到最优的翻译方式,同时也能够通过对标准翻译的学习,提高学生的翻译水平和实践能力。

语料库中的实例可以让学生更好地理解翻译的技巧和方法,同时也增强们的自信心,提高他们的翻译实践能力。

最后,语料库应用于高校翻译教学的优势之一在于它可以提高翻译质量。

翻译作为语言交际的一种形式,需要高水平的语言能力和专业的知识水平。

语料库中的实例和样本,具有很高的可靠性和准确性,可以帮助学生掌握标准的翻译方法和技巧。

同时,语料库中的资料能够丰富翻译的语言内容,有助于让翻译更加准确、简洁、生动。

因此,应用语料库能够提高翻译质量,让学生可以创造优质的翻译作品。

综上所述,语料库在高校翻译教学中有着广泛的应用优势,可以帮助学生贴近真实语言使用,提高实践能力和翻译质量。

因此,采用语料库教学,不仅能够切实提高学生的翻译能力,而且更能够让学生更快、更准确地掌握语言应用能力,使翻译教学变得更加有效和高效。

智慧旅游双语平行语料库创建SWOT分析

智慧旅游双语平行语料库创建SWOT分析

智慧旅游双语平行语料库创建SWOT分析智慧旅游是指利用智能技术、互联网和大数据等手段提供更便捷、个性化、智能化的旅游服务,并帮助游客更好地规划行程、体验旅游,提升旅游业的整体效益。

创建智慧旅游双语平行语料库是为了满足智慧旅游发展对语言资源的需求,提供对各类旅游文本的自动化处理和翻译。

SWOT分析是一种常用的战略管理工具,用于评估一个项目或企业的优势、劣势、机会和威胁。

下面是针对智慧旅游双语平行语料库创建的SWOT分析。

优势:1. 丰富的语言资源:创建智慧旅游双语平行语料库需要大量的双语文本,而旅游行业因为信息的多元性和复杂性,在多个语言环境中都具有丰富的语言资源。

2. 高度相关的语料数据:智慧旅游相关的文本内容非常丰富,包括旅游景点介绍、旅游攻略、交通信息等,这些内容对于智能化的旅游服务来说非常重要。

3. 便于收集和整理:在互联网普及的背景下,收集和整理语料数据变得相对容易,可以通过网络爬虫等方式快速获取大量的相关文本。

4. 提高旅游服务的质量:智慧旅游双语平行语料库的创建可以为旅游翻译系统提供支持,提高旅游服务的质量,减少语言交流的障碍。

劣势:1. 文化差异:不同国家和地区的旅游文本具有明显的文化差异,如词汇、表达方式等,这就要求在创建双语平行语料库时需要针对不同的文化特点进行处理。

2. 数据质量参差不齐:由于智慧旅游相关文本的来源广泛,数据质量往往参差不齐,需要额外的清洗和筛选工作才能得到高质量的语料数据。

机会:1. 促进旅游业的发展:智慧旅游的兴起为旅游业带来了巨大的机遇,通过创建智慧旅游双语平行语料库,在智慧旅游翻译服务等方面提供支持,有助于推动旅游业的发展。

2. 为智能化服务提供基础:智慧旅游双语平行语料库的创建为智能化旅游服务提供了重要的基础资源,有助于提高智能翻译和语音识别等技术在旅游领域的应用水平。

3. 推动跨文化交流:智慧旅游双语平行语料库的创建可以促进不同地区间的跨文化交流,为旅游者提供更加便捷、舒适的旅游体验。

地方性旅游景区翻译语料库的创建及其应用

地方性旅游景区翻译语料库的创建及其应用

2015年12月下半月刊旅游管理研究地方性旅游景区翻译语料库的创建及其应用陈昕媛随着经济全球化和地方旅游业的持续发展,能否为游客提供更加优质的服务将成为地方性旅游景区是否能够持续发展的关键性因素。

在这里,建立一个好的地方性旅游景区的翻译语料库就显得尤为重要。

为此,本文就地方性旅游景区翻译语料库的创建和应用展开了讨论,通过分析语料库创建的意义价值和语料库建设过程中需要注意的一系列问题,提出有益的意见和建议,旨在为地方性旅游景区翻译语料库的良性建设发展提供学术支持,并为地区旅游经济的发展提供支持和保障。

随着改革开放的深入进行和旅游业的持续发展,新时期,对于外国人来说,越来越开放的中国,让他们有了近距离接触中国的机会。

中国城乡基础设施的持续建设和完善,也让更多的域外游客有了在中国深度游的想法和愿望。

以此为契机,地方性的旅游景区也将面临更多的发展机会,更多的中外游客,选择地方性的旅游景区作为放松度假的场所。

在此过程中,作为地方性的旅游景区,一方面要加强基础设施建设,另一方面,也要加强景区的翻译语料库的建设,为国外游客提供更便捷、更高效的语言服务,为实现地方旅游经济的发展助力添能。

一、地方性旅游景区和翻译语料库的概念辨析(一)地方性旅游景区所谓地方性旅游景区,是指服务于地方的、新型的景区。

这里强调地方性景区,事实上强调的是其区别于诸如故宫、卢浮宫这类世界性景区的旅游地点。

世界性的旅游景区早已或正在实现国际化,多语种的交互切换在这类景区并不是问题。

但是对于新近发展起来的地方性景区而言,发展建设的实践相对不长,周边的基础设施和景区内的软件建设也还不完全。

在这种层次的旅游景区游览,对于国内游客来说不便利的感触可能不大。

但是对于国外游客来说,它们则会面临语言不通和翻译障碍的双重问题,会严重影响游客的游览体验。

(二)翻译语料库所谓语料库,就是构成语言的各个语料的一定集合。

语料库有三点基本认识需要掌握,首先,语料库中存有的语料都应该是在语言的实际运用中真实出现过的,并且能够真实地反映当地的民风物貌;第二,语料库的整理和运行需要以计算机为媒介,进行语言知识基础资源的整合;第三,真实的语料需经过加工,才能称为语料库,才能保证实际的运行工作无疏漏,真正发挥语料库的真实意义,造福于地方景区。

语料库技术在中医术语翻译中的应用

语料库技术在中医术语翻译中的应用

语料库技术在中医术语翻译中的应用随着全球化进程的不断加速,不同国家、不同文化之间的交流与合作变得愈发频繁。

在这种背景下,语言翻译成为了一项日益重要的工作。

而在医学领域,尤其是中医领域,术语翻译更是至关重要。

中医术语翻译的准确性直接关系到医学文献的质量和对患者的准确诊断和治疗。

如何利用先进的技术手段来提高中医术语翻译的准确性和效率,成为了一个迫切需要解决的问题。

在这方面,语料库技术的应用为中医术语翻译带来了新的希望。

语料库技术是指通过收集大量的语言实例并进行整理、分析和利用,从而帮助人们更好地理解和使用语言的技术手段。

在中医术语翻译中,语料库技术可以发挥以下几方面的作用。

语料库技术可以帮助翻译人员收集大量的中医术语实例,从而更好地理解这些术语的使用场景和语境。

在传统的术语翻译中,翻译人员往往只能利用自己的知识和经验来进行翻译,容易出现主观理解偏差。

而通过语料库技术,翻译人员可以轻松地找到大量的中医术语实例,并对这些实例进行分析和比对,从而更准确地把握这些术语的含义和用法。

语料库技术可以帮助翻译人员发现中医术语的搭配规律和惯用表达。

语言是具有一定规律和约束的,而这些规律和约束往往体现在词语之间的搭配和固定表达上。

通过语料库技术,翻译人员可以更好地发现中医术语的搭配规律和惯用表达,从而在翻译过程中更好地把握这些术语的语言特点和风格特征。

语料库技术还可以帮助翻译人员进行术语的对比和翻译选择。

在中医术语翻译中,往往存在着多种不同的表达方式和翻译选项。

通过语料库技术,翻译人员可以轻松地找到这些不同的表达方式和翻译选项,并进行比对和分析,从而选取最合适的翻译方案。

这种对比和选择能力,对于提高中医术语翻译的准确性和质量具有非常重要的意义。

语料库技术还可以帮助翻译人员进行自动化翻译和术语翻译工具的开发。

随着人工智能和大数据技术的不断发展,自动化翻译技术已经逐渐成为了一种重要的翻译手段。

通过语料库技术,翻译人员可以构建中医术语的语料库数据库,并利用这些数据库来训练和改进翻译模型,从而实现自动化翻译的目标。

语料库技术在中医术语翻译中的应用

语料库技术在中医术语翻译中的应用

语料库技术在中医术语翻译中的应用随着全球化的发展和经济全球化的趋势,语言障碍越来越成为一个重要的问题。

在医学领域中,传统医学语言的翻译是非常具有挑战性的,特别是在中医术语的翻译方面。

术语翻译的错误会产生严重的后果,这对于患者的生命和健康是至关重要的。

因此,采用有效的方法来翻译医学术语是非常重要的。

近年来,语料库技术成为了翻译领域的热点技术。

语料库是指收集和组织的大量语言数据的数据库,其中包含了丰富的语言信息,它可以用来帮助我们了解语言规律、词汇用法和表达方式。

在中医术语翻译中,语料库技术的应用可以帮助翻译人员快速地找到专业术语的正确翻译,并且提高译文的质量。

语料库技术可以通过以下几个方面来帮助中医术语翻译:1. 收集和建立中医术语语料库。

中医术语非常复杂,包括了大量的内涵和外涵。

建立一个中医术语语料库是非常有必要的。

这个语料库可以包括中医书籍、病例、专业文章等,收集到的内容可以从不同的角度分析中医术语的含义和使用方式,更好地理解中医文化及其传统医学知识。

同时,这个语料库还可以成为一个寻找正确翻译的参考资料库。

2. 利用语料库分析工具分析中医术语。

语料库分析工具可以帮助翻译人员快速地定位术语的上下文、用法、搭配和语义等信息,更好地理解词汇的含义和使用方式。

例如,利用语料库分析工具可以从中医术语语料库中找到“五脏”一词的用法及其搭配方式,进而得到正确的翻译。

3. 提供精准的翻译建议。

在翻译过程中,语料库技术可以提供一些精准的翻译建议。

例如,可以根据语料库中的常用词汇和短语,提供给译者一些建议的术语翻译。

同时,翻译人员也可以通过对语料库中的译文进行比较,找到正确的表达方式。

4. 验证译文的准确性。

语料库技术可以作为翻译质量评估的一种工具,帮助翻译人员验证译文的准确性和语言表达的恰当性。

通过比较翻译人员的译文和语料库中的合理翻译,可以及时发现错误和不合理表达,提高翻译人员的翻译质量。

总之,语料库技术在中医术语翻译中具有广泛的应用价值。

语料库在口译中的作用

语料库在口译中的作用

语料库在口译中的作用一、引言随着科技的进步,人工智能和大数据技术已经深入到各个领域。

其中,语料库作为一种重要的数据来源,为语言学习和应用提供了强大的支持。

尤其在口译领域,语料库的应用更是发挥着举足轻重的作用。

本文将探讨语料库在口译过程中的作用及其对提高口译质量的影响。

二、语料库的构建与收集语料库的建设是利用大量的真实场景下的对话或文本进行采集和分析的过程。

这些数据通常来自各种媒体,如新闻报道、会议记录、演讲等。

通过这种方式,我们可以获取丰富的语言样本,包括各种口音、方言、俚语以及专业术语等,从而建立一个庞大的数据库。

三、语料库在口译准备阶段中的作用1. 词汇积累:语料库可以提供大量实用的词汇和短语,帮助译者扩充自己的词汇量,熟悉各种语境下的表达方式。

2. 提高预判能力:通过对语料的深度分析,译者可以提高对目标语言的敏感度,更好地理解源语言的含义,从而提高翻译的准确性。

3. 专业术语更新:语料库可以帮助译者了解zui新的行业术语和表达方式,确保译文的专业性和准确性。

四、语料库在实际口译过程中的应用1. 即时参考:在进行口译时,遇到不确定的词汇或表达方式,可以通过快速查阅语料库来找到合适的译法。

2. 纠正错误:通过对比语料库中的正确译文和自己的初次翻译结果,可以发现并纠正自己在理解和表达上的问题。

3. 提供背景信息:语料库可以提供与特定话题相关的背景知识和文化信息,有助于译员更准确地传达原意。

五、结论总的来说,语料库在口译过程中起着至关重要的作用。

它不仅能为译者提供丰富的词汇资源和学习材料,还能帮助他们提高预判能力和专业知识水平。

此外,语料库还为译者提供了即时参考和纠错的机会,使其能够更准确、更流畅地完成口译任务。

然而,我们也要意识到,尽管语料库为我们提供了许多有价值的资源和工具,但它并不能完全替代人工口译。

在某些情况下,如需要高度精确或复杂的翻译,人工口译仍然具有不可替代的优势。

因此,我们应该合理利用语料库,将其作为辅助工具,以提高整体口译质量和效率。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

论语料库在改善中国旅游资料翻译可接受性差方面的创新性作用摘要:20世纪80年代以来,随着计算机科学的不断发展,语料库语言学取得了丰硕的成果。

语料库在语言学研究以及自然语言处理中显现出的优势也日益吸引更多的各国的语言学家及信息科学家对其进行更深入的探索。

结合现有的语料库成果以及中国旅游资料翻译的现状,笔者论证了建立文史英汉双语对齐语料库的可行性以其在改善中国旅游资料翻译可接受性方面的创新性作用。

关键词:语料库双语对齐分布模型创新性1、语料库发展简介“语料库(corpus)是语料的仓库或者语料的集合”(何,2003)gmeme kennedy在他的an introduction to corpus linguistics中将语料库的发展分为两个阶段:20世纪80年代以前的第一代语料库,以brown语料库为代表,规模一般不超过100万字;以及20世纪80年代以来的第二代语料库,以cobuild语料库为代表,规模庞大,设计更加科学。

在此发展期间,虽然单一语种语料库得到了长足的发展,但双语对齐平衡语料库也得到很大的发展,并逐渐成为语料库语言学的新焦点。

如:英国birmingham大学英语系语料库语言学中正在建设的chinese english translation base就是通过建设英汉双语对齐的语料库来提取翻译单元的;英法双语语料库——hansard corpus则是以加拿大大会辩论英法双语稿为基础而建立的。

此外,国内的双语对齐语料库也如雨后春笋,相继问世,如:由外国语大学建立的规模约2000万字的大型句对齐英汉平行语料库,又如由中科院计算所软件研究室开发的双语句对齐数据库(mtgroup.ict.ac./corpus)。

2、中国旅游资料翻译中的可接受性问题及其现有解决方案和理论自我国实行对外开放政策以来,我国源远流长的文化以及丰富的旅游资源吸引了全世界各地的游客前来旅游。

随之而来的即是大量的旅游景点及其宣传资料的翻译工作。

翻译资料往往是外国游客了解旅游景点的第一步。

旅游资料提供了旅游景点的历史背景和景点特色,使得外国游客不至于走马观花地游览景色。

然后现有的旅游资料的译文,尤其是那些新兴的,知名度上不及故宫之类的旅游景点的资料译文往往达不到介绍历史背景以及景点特色的效果,使得外国游客读不知其所云,甚至产生误解或失去兴趣。

这些译文中最突出的问题即译文的可接受性问题。

2.1 旅游资料译文可接受性问题可接受性一直是对翻译作品进行评价的重要标准。

著名学者X仲英(1994)就指出:“译文的可接受性(accept ability)是指译文读者(接受者)对译文能否完全理解,译文是否明白易懂。

可接受性的高低。

即读者对译文的理解程度,将会直接影响翻译的效果。

”旅游资料的翻译作为旅游景点文化传播的重要途径,人们对其译文的可接受性有更高的要求。

然后旅游资料的翻译者往往忽略了其译作的可接受性。

例如,墓塔林是我国很多旅游胜地中常有的一个景点,曾有人译为forest of tomb-pagodas或memorial grave。

但由于这些译文看上去正确,实际上却没有触及景点的本质,使得外国游客无法理解,或者联想到先贤祠之类的地方,那就加重了翻译造成的误解。

在英语中收录了一个词为stupa,而现在的很多书籍类翻译中多用此词。

又如:东昌湖风景区的“沙滩浴场”译成了bathing beach,然而国外的沙滩浴场则多说做swimming beach。

又如,XX是越瓷的产地。

早些时候,不少译文都会翻译成shaoxing is the home of yue porcelain. 然而外国游客却对越国没有一点了解,又怎么会了解这句翻译呢。

再如,XX的留园在XX的宣传小册子中就被一笔带过的译为了liuyuan garden。

这种译文丝毫不能吸引游客的兴趣。

诸如上述类的翻译还有很多,旅游资料译文可接受性差已经是普遍现象。

有的是因为地方投入有限、翻译者水平有限造成的;有的是因为翻译者懒惰或者过于刻板造成的;有的是因为缺少翻译对照的规X造成的。

2.2现有的对可接受性的解决办法及翻译理论增添法,即对旅游资料中的存在容易产生可接受性问题的地方做出一些补充性的解释,提供一些人文历史、风土人情等方面背景知识,以帮助外国读者理解进而唤起他们的兴趣。

改写法,即对那些不容易被接受的内容进行改写,比如说诗句或者古文中的双关类的表达等。

其他的解决办法,比如删节法和类比法等。

这些从翻译理论出发而提出的解决办法。

都为保证译文的可接受性指明了方向。

但是使用这些方法,有一个共通的要求,即翻译者必须具备深厚的历史文化功底或者愿意花大量的时间去查阅典籍寻求更优的译法,但往往只有部分的翻译者才会注意在翻译旅游资料的时候有意识地使用这些技巧,而其他的翻译者在翻译的时候则不会去翻阅典籍,查证历史。

因此,构建一个更加方便、更加简洁、更加具有可得性的平台来帮助旅游资料的翻译则更不失为一个有效的解决方案。

3、应用语料库改善中国旅游资料翻译可接受性的可行性经过一个多世纪的发展,语言学家以及计算机科学家已经建立了一套科学的数据库建设方法以及程序。

每个语料库的建立都有其自身的用途,如字典编纂、语言统计、语言监控、语言教学,以及方言研究等方面。

本文中笔者建议构建的语料库则将用作中国旅游资料翻译查询。

3.1 中英文旅游资料语料库语料易得性“语料库工程的生命周期可以划分为7个阶段:语料库规划阶段、需求分析阶段、语料库设计阶段、语料采集阶段、语料库实现阶段、语料库标注阶段、语料库使用和维护阶段。

”(何,2003)其中语料的采集是最重要的一项工作。

一方面,中英文双语对齐旅游资料语料库的语料则较容易取得。

作为旅游资料的翻译对照语料库,其语料资源应该主要来自于中英文对照的文史类刊物或者中国文史题材的英文作品。

目前,此类作品正朝着系统性的、全面性的方面发展。

如,由中华大百科全书出版的《中华文明史话》系列丛书,涵盖了饮食、古塔、体育、杂技、瓷器、服饰、小说、诗歌、绘画、武术、园林、饮酒、中医、丝绸、敦煌、XX宫殿、文明起源、节日、民居、孔庙、陶器、长江、黄河、长城、书法、科技以及七大古都共27个方面的中华文明及其历史,并以中英文双语作为编写语言;又如,由XX理工大学出版的《每天读点中国文化》系列丛书,涵盖了建筑艺术、城镇魅力、自然景观、民俗风情以及饮食五个大方面的中华文明,同时也是以中英文双语作为编写语言;与此同时还有诸如《图语中国文化》、《中国历史地理全貌》等大量的以中英文双语作为编写语言、以介绍中国文化为主题的刊物。

另一方面,除了有中国学者编纂的中英文双语书籍,还有大量的有外国人以英文为语言编纂的中国文明历史类书籍同样也是中英文双语旅游资料语料库中的重要语料来源。

如:由中国社会科学出版的《剑桥中国史》包含了自秦汉至新中国的各个朝代的历史,涉及政府活动、法律、经济、XX、教育、哲学以及历史人物等各个方面;又如,由英国人X瑞德(denis twitchett)编写的诸如《史家、读者与时间历程》等书籍对唐宋社会进行了比较广泛的研究,其内容涉及到盐运使、寺院地产、货币制度、商业税收、印刷术、农业灌溉等,以及《剑桥中国百科全书》中对中国历史和文明各方面的介绍。

首先,这些刊物的作者多半是比较资深的学者,他们治学严谨,文化底蕴深厚,因此他们的作品具有比较高的科学性及可靠性。

其次,由于这些作品含有大量的双语作品,它们是建设双语对齐语料库的最优语料,也是最易得的语料;再次,这些中英文双语作品覆盖题材以及内容广泛,基本上可以涉及到中国文明历史的各个方面,能够构建一套完整的中英文旅游资料语料库。

最后,由于这些语料都具有其自身的,所以可以采用联合开发等方式获取其,保证语料库的合法性。

3.2语料库的运行方式3.2.1 语料的平行对齐在对语料进行诸如格式统一,杂质清楚以及中英文语料分存之类的预处理之后,语料库的建设者可以使用如:paraconc和wordsmith 以及中国科学院计算机技术研究所开发的ictclas等软件对中英文语料进行处理,然后对句子和词语以及关键词等进行标注,然后再利用自动对齐并协助以人工对齐。

由于目前在双语对齐语料库的建设方面已经有了较成熟的技术,这里并不过多的对细节进行阐述。

类似的语料库的建设可以参考《莎士比亚戏剧英汉平行语料库的创建与应用》(胡,2002)、《小型英汉平行语料库的建立与运用》(谢,2004)、《汉英/英汉平行翻译语料库的设计及其在翻译中的应用》(钱,2005)等。

3.2.2分布模型(distributional model)在建立中英文对照语料的对齐的基础上,同时建立中英文对照的典籍中的英文资料与纯英文典籍中的英文资料的对接。

运用现在计算机语言学中常用的一个理论,即分布模型理论,可以实现此类对接。

firth曾提出一个词通常和一串与它联系密切的词一起出现。

分布模型假设指出相同意义的词语通常在相同的语境中出现。

peirsman 和他的同事已经通过他们在《the automatic identication of lexical variation between language varieties》中的实验证明了使用分布模型寻找意义相近的词的可行性。

以这一理论为基础,笔者认为可以使两种处处的英文文本以关键词的形式对接起来,使得语料库的使用者在搜索该关键词的时候可以同时入诸如《剑桥中国百科全书》这样的典籍中,从而为英汉对齐提供更多的英语资源。

由于这种自动识别的概率在目前的计算机技术中还不能做到100%识别(peirsman, 2010),所以有必要将每次搜索结果设定为关键词所在的句子或者段落,进而能够更好的为使用该语料库的翻译者提供更多的参考。

3.2.3监控语料库模式笔者认为该语料库还应该是一个监控语料库,随着潜在语料的不断增加,语料库可以将这些新的语料以语料流的形式吸收进来,不断的完善语料库,直至形成个类似于中国旅游双语百科全书查询的语料库。

3.3中英文旅游资料语料库的作用基于目前中国旅游资料译文可接受性差的现实,以及改革开放以来中国旅游市场日益膨胀的强烈文化传播需求,建立一套作为旅游资料翻译的语言依据的语料库具有现实意义和长期意义。

短期来看:一方面,该资料库对全国个地方旅游机关开放,可以克服由于地方投入有限和资料翻译者水平低,而造成的胡翻乱翻的问题;另一方面,该资料库可以节约旅游资料翻译者的时间,并提供较为统一的翻译方法,能够帮助中国旅游资料翻译实现逐步的全国X围内的统一。

长期来看,由于语料库是一个动态的模式,可以不断的实现自身的完善,终将形成一个较为完善的,在旅游资料方面覆盖极其广泛的语料库,它将不仅仅服务于旅游资料的翻译,还能够能为编纂中英文中国文史书籍的重要参考语料库。

相关文档
最新文档