一带一路视角下中英语料库建设项目报告

一带一路视角下中英语料库建设项目报告
一带一路视角下中英语料库建设项目报告

一带一路视角下的中英语料库建设项目报告

随着“一带一路”战略的提出,中外文化交流日益频繁,这种现象对翻译行业提出了更高的要求。因此,采取有效措施培养优秀翻译人才、提高译员翻译质量刻不容缓。基于此,本项目决定建设一带一路视角下中英语料库以提高翻译质量。本文将着重报告本项目中英语料库建设的背景目的、过程及其作用。

一、一带一路视角下的中英语料库建设背景及目的

“一带一路”战略的提出为本项目的开展提供了时代背景。“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称。从古至今,“一带一路”一直是连接东西方文化的重要纽带,尤其是在新的历史时期,“一带一路”战略促进了区域间的人际交往和文化交流。全国政协委员、中国翻译协会常务副会长黄友义在接受专访时曾表示,经济和文化的走出去导致了中译外工作量的增加,但目前中译外人才十分紧缺。而作为覆盖范围及应用领域日益广泛的语料库在提高翻译教学质量、培养优秀译员及促进计算机辅助翻译中发挥着日益重要的作用。目前国内外都已有大量已建成的语料库,如BNC英国国家语料库、美国当代英语语料库、中国学习者英语语料库及中国英语学习者口语语料库等,但针对于“一带一路”战略的语料库较为稀少。本项目的开展旨在抓住“一带一路”战略所带来的发展契机,建设“一带一路视角下的中英语料库”,为“一带一路”战略中相关政策的英译提供便利,从而加强中外交流。

青岛农业大学翻译中心的成立及其已承接的翻译活动为本项目的开展提供了专业背景。近年来,翻译中心承接了大量专利翻译、影视字幕翻译等翻译活动,在此过程中,翻译人员遇到了一些问题:如对专利特有名词和英美俗语不够熟悉等。本项目的旨在将翻译学理论、语言学理论及现代计算机技术相结合,通过对大量真实语言数据的研究,将众多科技名词、英语俗语和习语及与英美文化相关的词语收录进语料库当中,将中英双语语料库作为教学手段,方便译者查询、理解及使用相关名词,切实提高其翻译质量。另外,该项目的开展由具有多年翻译经验和教学经验的纪卫宁老师亲自指导,这为本项目的顺利开展提供了重要保障。

二、一带一路视角下中英语料库建设过程

(1)语料库建设前期准备

首先,语料库的建设将使用AntConc语料库分析统计软件,该软件具有索引、词表生成、主题词计算、搭配和词族提取等多种功能,这位本项目的开展提供了强大的技术支持。其次,本项目语料库的建设将以大量阅读专业文献资料为基础,并借鉴权威语料库建设经验,如1982年上海大学黄人杰、杨惠中教授主持建立的一百万词专门用途英语语料库以及中国英语专业语料库等都为本项目的开展提供了大量有益经验。再次,本次语料库的建设团队由翻译爱好者及计算机技术爱好者组成,这为项目的开展提供了必要前提。

(2)语料库设计及加工

一带一路视角下的中英语料库将通过多种方式进行文本采集,如大量分析真实语言数据、利用网络现有语料资源等。语料库建成后将成为“一带一路”战略实行期语言的一个典型代表。本语料库将涉及到多种题材,如与“一带一路”战略相关的政治、经济及文化术语和科技专利翻译以及影视字幕翻译相关名词等。本语料库的建设涉及到语料库题材、规模、样本的大小、切分标注标准等,此外还充分考虑到了语料代表性、平衡性、一致性、标签集、描述元语言等许多问题。

(3)收集语料

首先,在语料库的大体结构设计完成后,查询并收集关于一带一路方面的各种语料,并对语料进行分类整理。经过对目前一带一路相关语料的研究,可以归纳的高频主题名词有: 合作、一带、一路、国家、丝绸之路、愿景、开放、贸易、发展、互联、互利共赢、投资、亚洲、文化、机制、地区、二十一世纪、合作、基础设施,等等。同时,一带一路战略中主题高频形容词及副词有“互相的、经济的、共同地、互相的、地区的、国际的、跨边界的、海上的、文化的、多边的”,这些词语在情态上具有很强的评价功能,它们在强调相互合作重要性的基础上进一步强调了构建命运、经济和责任共同体的重要性以及建设海上丝绸之路和多边文化交流的必要性。

其次,本语料库还将时刻关注青岛农业大学翻译中心的翻译活动,不断收集有关于科技专利翻译以及影视字幕翻译有关的词、固定搭配以及句子等。以影视节目中的俗语为例:电影《傲慢与偏见》有这样一句话:What’s your 20?如果直译的话,可将其“你的20是什么?”这样的译文难免让人感觉一头雾水。而实际上,这句话是美国20世纪七八十年代很流行的一句话,那时民用波段无线电通信开始流行,而这句话的意思就是问与自己通话的人的确切位置,其与“Where are you?”意义相同。故而,为了提高译员翻译质量,本语料库在收录大量词、句的同时还将深入挖掘其文化内涵并将这些词、句进行有机整合。(6)语料库后期维护。

语料库建成后,将不断进行日常的维护和升级以适应新的软硬件和用户需求的改变。一带一路视角下的中英语料库会随着一带一路战略的深入及翻译中心翻译活动的开展而不断更新,以确保其代表性、时效性。

三、一带一路视角下中英语料库的作用

笼统来讲,一带一路视角下的中英语料库将对大量语料资源进行快速、高校的有机整合,进行语料库的“深加工”,实现语料库的个性化服务,改变传统英文及翻译教学模式。并且,建设过程中将会充分考虑到语料多样性及语言的变化性,添加一些有关于英文歌曲、英文演讲与辩论及娱乐等方面的词汇并实时更新语料库,以激发学习者的学习热情,增强学习者的自主性和积极性;并鼓励其通

过自主检索手段解决学习及翻译过程中所遇到的问题,增强其对相关语言知识的理解,帮助学习者进行语料的归纳总结,增强学生的翻译能力。另外,本语料库的建设过程中将大量参照翻译学理论及语言学理论,并在语料库中加入大量词条及翻译实例,加强译员对于英汉语言异同的理解,使其在更大范围内方便译员查阅相关资料及进行译文校对。并且,一带一路视角下的中英语料库还能被广泛应用于外语学习、双语词典及教材编纂、译员英汉互译及机器翻译等各个方面,切实提高译员翻译效率及翻译质量。

具体来说,一方面,该语料库建成之后,能够提高翻译教学质量、翻译人才培养质量及译员翻译质量,从而有利于充分挖掘、整合“一带一路”沿路各国丰富多元的文化资源,提高各国人民参与“一带一路”战略的积极性和主动性,真正实现不同文化之间的交流与为融合,使不同文明彰显出各自的文化魅力;并且推动中华优秀传统文化走向世界,应对当前新常态,从而促进“一带一路”战略的贯彻实施,为实现“中国美”奠定良好基础。而另一方面,作为一种新型的网络学习资源,该语料库的建设能够为青岛农业大学广大翻译爱好者提供一个了解“一带一路”相关术语、专利术语及影视字幕相关名词的有关渠道,是其更加了解英汉语言及背景文化差异,提高其自身翻译水平,使翻译中心实现长足发展。

托福口语话题语料库:学校

托福口语话题语料库:学校 为了帮助大家积累更多的优秀素材,为大家带来托福口语话题语料库:学校,希望能够帮助大家更好的备考托福口语,一起来看看吧! 托福口语话题语料库 学校的硬件设施: gym : 活动类型: 哑铃do some dumbbell, 室内跑道run on the indoor track, 在场地上打球play some sport on the court, 水上运动do some aquatic activities, 邮箱运动如瑜伽、游泳、在跑步机上跑步aerobics like yoga, swimming, running on a treadmill 体育馆是个休闲娱乐的地方,是打发时间的首选;在这里可以做各种各样的运动(举以上的例子)。

A gym is the place where students can have fun and relax themselves, for many students it can be the first choices when it comes to how to spend their spare time. There are lots of fun activities you can do in the gym like, play some sports on the court, do some aerobics like yoga, swimming, and running on a treadmill,and stuff like that. 作用:保持体型Keep fit, 有趣have fun,放松relax,引导学生健康、活跃的生活方式lead a healthy and active lifestyle 总之,很有必要建设一个体育馆。 In a nutshell, it is really important for a university to own a nice recreation center(gym 的同义词),for it helps to promote a healthy, active lifestyle. 实验室laboratory : 做实验conduct research, 把理论应用于实际apply theory in practice, 直观的理解概念understand concepts intuitively(直观的),培养学生的创造力develop students' creativity; 实验室是好学校的重要组成部分,然后展开实验室的作用(即以上内容)。

语料库术语中英对照

Aboutness 所言之事 Absolute frequency 绝对频数 Alignment (of parallel texts) (平行或对应)语料的对齐 Alphanumeric 字母数字类的 Annotate 标注(动词) Annotation 标注(名词) Annotation scheme 标注方案 ANSI/American National Standards Institute 美国国家标准学会 ASCII/American Standard Code for Information Exchange 美国信息交换标准码Associate (of keywords) (主题词的)联想词 AWL/Academic word list 学术词表 Balanced corpus 平衡语料库 Base list 底表、基础词表 Bigram 二元组、二元序列、二元结构 Bi-hapax 两次词 Bilingual corpus 双语语料库 CA/Contrastive Analysis 对比分析 Case-sensitive 大小写敏感、区分大小写 Chi-square (χ2) test 卡方检验 Chunk 词块 CIA/Contrastive Interlanguage Analysis 中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-tagging System CLAWS词性赋码系统Clean text policy 干净文本原则 Cluster 词簇、词丛 Colligation 类联接、类连接、类联结 Collocate n./v. 搭配词;搭配 Collocability 搭配强度、搭配力 Collocation 搭配、词语搭配 Collocational strength 搭配强度 Collocational framework/frame 搭配框架 Comparable corpora 类比语料库、可比语料库 ConcGram 同现词列、框合结构 Concordance (line) 索引(行) Concordance plot (索引)词图 Concordancer 索引工具 Concordancing 索引生成、索引分析 Context 语境、上下文 Context word 语境词 Contingency table 连列表、联列表、列连表、列联表 Co-occurrence/Co-occurring 共现 Corpora 语料库(复数) Corpus Linguistics 语料库语言学 Corpus 语料库 Corpus-based 基于语料库的

哪里有可以免费使用的大型英语语料库资源-外语教学与研究出版社

语料库相关资源 David Lee语料库研究书签 Bookmarks for Corpus-based Linguists (David Lee) https://www.360docs.net/doc/3515750981.html,.au/~dlee/CBLLinks.htm (https://www.360docs.net/doc/3515750981.html,/corpora) 常用语料库资源链接汇集(语料天涯) https://www.360docs.net/doc/3515750981.html,/corpus/ 互动平台 https://www.360docs.net/doc/3515750981.html,/forum/ 入门读物 专著 梁茂成、李文中、许家金,2010,《语料库应用教程》。北京:外语教学与研究出版社。Hunston, Susan. 2002. Corpora in Applied Linguistics. Cambridge: Cambridge. University Press. (世界图书出版社引进) Kennedy, Graeme. 1998. An Introduction to Corpus Linguistics. London: Longman. (外研社引进) 期刊论文 中国期刊网 EBSCO英文期刊数据库 书店可以买到的语料库相关书籍 Aijmer, K. & B. Altenberg (Eds.). 2004. Advances in Corpus Linguistics. Papers from the 23rd International Conference on English Language Research on Computerized Corpora (ICAME 23). Amsterdam: Rodopi. (世界图书出版社引进) Austermühl, F. 2001. Electronic Tools for Translators《译者的电子工具》. Manchester: St. Jerome Publishing. (外研社引进) Biber, Douglas, Stig Johansson, Geoffrey Leech, Susan Conrad & Edward Finegan. 1999. Longman Grammar of Spoken and Written English. Longman Publications Group. (外研社引进) Biber, Douglas, Susan Conrad & Randi Reppen. 1998. Corpus Linguistics. Cambridge: Cambridge University Press. (外研社引进) Connor, U & T. Upton (Eds.). 2004. Applied Corpus Linguistics: A Multidimensional Perspective. Amsterdam: Rodopi. (世界图书出版社引进)

托福独立口语高频题语料素材汇总分享:internetoracademicbooks

托福独立口语高频题语料素材汇总分享:internetoracademicbooks 今天给大家带来了托福独立口语高频题语料素材汇总分享:internet or academic books,希望能够帮助到大家在托福口语中拿高分,下面就和大家分享,来欣赏一下吧。 托福独立口语高频题语料素材汇总分享:internet or academic books 托福独立口语高频话题解读:internet or academic books Which one do you think is better to help do research, internet or academic books? Explain why. 高频话题语料补充 有害健康 pose a threat to your health, hurt your eyesight, get dizzy, backache, neck problems, obesity 出版商审查并且批准一些信息 publisher checks and approves the information 作者都是权威

authors are authorities in a certain field 因特网的信息不准确 source might be unreliable 托福独立口语高频话题范文分享 Well, personally I would like to use paper books to do research. Sitting in front of the computer poses a threat to your health, like staring at the screening for a long time hurt your eyesight, you get dizzy, and there are other problems like backache, neck problems, and even obesity. Also, the information in books is reliable, the publisher checks and approves the information and the authors are authorities in a certain field. However, the information on the internet is not reliable since everyone can post information. 托福口语备考的七大技巧 扩充词汇 托福口语考试,讲究的不是词汇的多少,掌握2500个左右常用词就足够了。托福口语考试的关键,是要熟练掌握和运用一些转折连词、动词,以及美国口语的惯用方法。这样可以让你在口语考试中,表现的更加精彩。 题海战术

双语平行语料库对齐技术述评

双语平行语料库对齐技术述评 对齐的双语语料库在机器翻译、词义消歧和双语词典编撰等领域都非常有用。语料对齐的单位由大到小,有篇章、段落、句子、短语、词等不同的层次。粒度越小,提供的语言信息就越多,应用的价值也就越大。然而平行语料库的自动对齐并非是一件容易的事情。由于语料大都来自人工翻译,句子之间并不都是一对一的翻译模式,还有一对多、多对多的翻译模式。这种复杂性加大了对齐的难度,特别是对更细粒度级别的对齐。由于语言之间存在着差异,找到固定的对应翻译很难,再加上文本预处理工具难以保证处理效果,以及一些电子文本的噪声纷繁复杂,这都增加了对齐的难度。而对于英汉两种差别很大的语言来说,目前的语料库对齐算法并不一定完全适用于汉英语料库的对齐。本文首先回顾了当前国外平行语料库的对齐技术,然后分析了国内在对齐中所使用的技术,旨在为本研究所今后构建小型汉英平行语料库提供一个技术支持。 1 目前平行语料库对齐技术的现状 1.1 句子级对齐技术 在各级对齐研究中,其中最为重要且较为成熟的自动对齐技术是句子一级的对齐。句子级对齐的方法主要有三种:①基于长度的方法(length-based)(Brown et al,1991; Gale & Church, 1991a);②基于词汇的方法(lexical-based)(Kay & Roscheisen, 1993);③混合法(combination)(Tan & Nagao, 1995; Wu,1994)。 基于长度的方法最早是由Brown和Gale提出,虽然他们的算法都是由源文本中句子长度和译文本中的句子长度有很大的正相关这一观察得出,但其侧重点却不同。Brown的算法以词为单位计算句子的长度,而Gale和Church则是以字符为单位计算句子的长度。他们分别用各自的算法对加拿大议会会议所录英法双语语料库进行了对齐实验,准确率达96~97%。然而该方法在处理复杂句子的对齐(如2∶1或2∶2的句子对齐,或非直译和省略的句子)以及不同语系的句子对齐时,准确率却并不高,而且此算法一旦出错,便不可能自动纠正。 基于词汇的方法是由Kay和Rosheisen提出的。他们认为最佳的句子对是那些使系统词汇对齐数量最大化的句子。基于词汇的算法虽然可以提高对齐的准确性,但却费时;而且目前还没有充分证明这一方法适合于大型语料库。Chen(1993)对Kay 和 Rosheisen的算法进行了改进,这一算法运用词汇信息构建了一对一词汇统计翻译模型,用这样的翻译模型找到语料库生成的最大可能性。他用此算法对旧的Hansard语料库进行双语对齐。与Brown和Gale的对齐算法相比,这一算法不仅正确率高,而且在处理大量省略的对齐中能轻易确定省略的位置,且鲁棒性(robust)较好。基于词汇方法的另一种做法是利用同源词(cognate)(Church,1993)。此方法在处理英法和英德语言中的诸如名字、日期、数字、术语等可辨认单位出现比率高的情况下效果更好。 如前所述,基于词汇的方法相对可靠精确,但计算起来相当复杂且速度较慢;而基于长度的算法模型虽然简单,独立于语言知识和外部资源,但鲁棒性不好,极易造成错误蔓延。由于每种方法都有自己的优缺点,人们试图将各种方法混合起来找到问题的解决途径(Tan & Nagao, 1995; Wu,1994; ;Collier,1998; Vronis,1999;Melamed,2000)。试验结果表明,混合的方法优于单纯使用其中的任何一种方法。

托福常用口语900句语料中英文对照汇总:1-250句

托福常用口语900句语料中英文对照 汇总:1-250句 今天给大家带来托福常用口语900句语料中英文对照汇总:1-250句,希望可以帮助到大家在托福口中拿高分,下面就和大家分享,来欣赏一下吧。 托福常用口语900句语料中英文对照汇总:第1部分1-50句 托福常用口语900句语料对照汇总:1-50句 1. I see. 我明白了。 2. I quit! 我不干了! 3. Let go! 放手! 4. Me too. 我也是。 5. My god! 天哪! 6. No way! 不行! 7. Come on. 来吧(赶快) 8. Hold on. 等一等。

9. I agree。我同意。 10. Not bad. 还不错。 11. Not yet. 还没。 12. See you. 再见。 13. Shut up! 闭嘴! 14. So long. 再见。 15. Why not? 好呀! (为什么不呢?) 16. Allow me. 让我来。 17. Be quiet! 安静点! 18. Cheer up! 振作起来! 19. Good job! 做得好! 20. Have fun! 玩得开心! 21. How much? 多少钱? 22. Im full. 我饱了。 23. Im home. 我回来了。 24. Im lost. 我迷路了。

25. My treat. 我请客。 26. So do I. 我也一样。 27. This way。这边请。 28. After you. 您先。 29. Bless you! 祝福你! 30. Follow me. 跟我来。 31. Forget it! 休想! (算了!) 32. Good luck! 祝好运! 33. I decline! 我拒绝! 34. I promise. 我保证。 35. Of course! 当然了! 36. Slow down! 慢点! 37. Take care! 保重! 38. They hurt. (伤口)疼。 39. Try again. 再试试。 40. Watch out! 当心。

旅游汉英双语平行语料库的建设与应用

第33卷第10期湖南科技学院学报 V ol.33 No.10 2012年10月 Journal of Hunan University of Science and Engineering Oct.2012 旅游汉英双语平行语料库的建设与应用 肖庚生 陈欣 (南华大学 外国语学院,湖南 衡阳 421001) 摘 要:文章在综述现有旅游语料库的基础上,介绍了自建的衡阳旅游汉英平行语料库的建库步骤,即语料的取样、英译、标注与对齐,并阐述了该库在旅游文本语言特征、旅游翻译、旅游英语及旅游翻译教学研究中的应用价值。该库的建设与应用既能充分满足研究需要,亦能促进导游、翻译等英语人才的培养,进而推动当地旅游产业的发展及跨文化传播。 关键词:旅游语料库;双语平行语料库;旅游英语 中图分类号:H030文献标识码:A 文章编号:1673-2219(2012)10-0163-03 近30年来,语料库及语料库语言学从无到有、蓬勃发展。基于语料库的语言学及应用语言学研究应运而生,语料库这一研究工具与方法业已广泛应用于词汇、句法、语义、语言对比、词典编撰、二语习得、翻译等领域的研究之中, 并取得了累累硕果。[1]为了研究或应用的需要,国内外先后创建了跨学科、多语言、内容迥异、库容不一的众多语料库。近年来,双语平行语料库由于其独特的优势备受关注,其建设与应用正如火如荼地进行。不过,迄今为止,国内外高校与研究机构所研制的平行语料库主要是通用型的双语平行语料库以及文学翻译类型的平行语料库,以某一专门用途为导向的平行语料库仍较为鲜见。此外,基于平行语料库的相关研究主要侧重于对个别语言或翻译现象的探讨。鉴于这一研究现状,我们拟以课题研究为契机,建设衡阳旅游汉英双语平行语料库,在此基础上,力图摸索其在汉语与英语的旅游文本语言特征、旅游汉英翻译、旅游英语与旅游翻译教学研究中的应用。 一双语语料库与旅游语料库综述 双语语料库最早创建于上世纪90年代中后期,迄今为 收稿日期:2012-08-26 基金项目:衡阳市社科基金项目“顺应论视阈下衡阳旅游汉英双语平行语料库的建设与应用研究”(项目编号2011C011);全国教育科学规划课题“基于语料库的大学英语教学平台建设与研究”(项目编号GPA105029)阶段性成果。 作者简介:肖庚生(1980-),男,湖南衡阳人,讲师,应用语言学博士生,主要研究方向为语料库语言学。陈欣(1983-),女,湖南郴州人,讲师,语言学硕士,主要研究方向为翻译理论与实践。止国内外业已建立多种类型的双语平行语料库。早在1995年,曼彻斯特大学研制了世界上首个翻译语料库,主要收集从各国语言翻译成为英文的文本,如今库容已达千万词。但是它并非严格意义上的双语平行语料库,因为它并没有实现双语对齐,只能称其为对比语料库。目前国际上比较知名的平行语料库有挪威的“英语-挪威语平行语料库”、英国的“德语-英语文学文本平行语料库”等等。而由北京外国语大学中国外语教育研究中心于2004年启动创建的“新型双语对应语料库”(含汉英、汉日两个双语平行语料库),库容为3000万词次。其中,汉英双语平行语料库的文本类型主要涵盖人文类、社科类和科技类。该语料库的建设得到了国家社科基金重大规划课题的资助,目前正为1亿词次的超大库容做进一步的扩容努力。此外,国内比较知名的双语平行语料库还包括:李德俊以汉英词典研编为主要目的,主持建设2000万词次的英汉平行语料库;卫乃兴以研究探讨英汉对等表达为目的,主持建设900万词次的英汉平行语料库;哈尔滨工业大学所创建的库容为40万对的英汉双语平行语料库;绍兴文理学院创建的中国古典文学英译双语平行语料库等等。上述双语平行语料库多数以文学文本为主,抑或以收集百科文本(含文学与非文学作品)为特色,而针对某一特定文类或某一地域特色而专门建构的专门用途双语平行语料库仍较为鲜见。 近年来,随着交通与通讯技术的日新月异,世界各地人们之间的科技、文化、商务交流、合作与往来日益频繁。更为重要的是,各国人们纷纷走出国门,畅游世界,体验世界各地的异域风情,许多国家的旅游产业获得了飞速发展。为更好地发展旅游产业、传播旅游资讯、吸引外国游客,同时亦为了满足语言学及应用语言学研究需要,旅游专门语料库应运而生。 163

《英语语言学》术语(英汉对照)表

语言学术语(英-汉对照)表 Glossary and Index (备注:因教材改版,部分章节标注等内容有出入。) A abbreviation 缩写词,略语3.3.1 Abercrombie 10.3.2 ablative 夺格,离格4.1.1 abstractness 抽象性1.3.2 accent 重音(符)2.4.4;2.4.5 accuracy 正确性11.6.4 accusative 宾格4.1.1 achievement test 成绩测试11.6.3 acoustic phonetics 声学语音学1.7.1;2.1 acquisition 习得6.1.2 acronym 缩略语3.3.1 action process 动作过程12.2.3 actor 动作者4.4.2;12.2.3 addition 添加3.3.2 address form 称呼形式7.2.3 addressee 受话人1.4;9.4.1 addresser 发话人1.4;9.4.1 adjective 形容词3.1.2;4.1.1;5.5.2 adjunct 修饰成分;附加语12.2.3 adverb 副词3.1.2 affix 词缀3.2.1 affix hopping 词缀跳跃4.3.1 affixation词缀附加法7.1.4 affricate 塞擦音2.4.3;2.4.5;2.9.1 agreement 一致关系4.1.3 airstream 气流2 alliteration 头韵9.3.2;9.3.6 allomorph 词/语素变体3.2.4;4.3.1 allophone 音位变体2.8 allophonic variation 音位变体2.8.3

最常用的英语动词(根据美国语料库整理 word 可打印)

be turn walk wear lie have start win support occur do might offer end accept say show remember hit identify go hear love base determine can play consider produce prepare get run appear eat argue would move buy teach recognize make like wait face indicate know live serve cover wonder will believe die describe lay think hold send catch fail take bring expect draw arrive see happen build choose name come must stay cause present could write fall point answer want provide cut listen compare look sit reach realize miss use stand kill place act find lose remain close state give pay suggest involve discuss tell meet raise increase force work include pass seek check may continue sell deal laugh should set require fight guess call learn report throw study try change decide fill prove ask lead pull represent hang need understand return focus design feel watch explain drop forget become follow hope plan claim leave stop develop push remove put create carry reduce sound mean speak drive note enjoy keep read break enter form let allow thank share establish begin add receive rise visit seem spend join shoot care help grow agree save avoid talk open pick protect imagine

《双语平行语料库在翻译教学上的用途》评述

攻读博士、硕士学位研究生试卷(作业)封面(2016 至2017 学年度第一学期) 学号 姓名 题目《双语平行语料库在翻译教学上的用途》评述 课程名称语料库语言学 专业英语语言文学 入学年月2016年9月 培养方式 全日制□非全日制

题目:双语平行语料库在翻译教学上的用途。 作者:王克非,曾任北京外国语大学外国语言研究所副所长、中国外语教育研究中心常务副主任,现任《外语教学与研究》杂志主编,博士生导师,研究方向为语言学和翻译研究。 研究问题:本文以北京外国语大学建成的通用汉英平行语料库为例,探讨如何在翻译教学中运用双语平行语料库、如何处理翻译教学与双语平行语料库的关系、双语平行语料库对译者有何帮助、以及译者如何在翻译教学中运用双语对译检索(词语的对译检索、结构的对译检索和语句语篇的对译检索)时找到合适的对译,提高他们的英语语感,掌握正确的翻译方法。 研究方法: 本文根据北京外国语大学中国外语教育研究中心建成的通用汉英平行语料库(3000万字词)为例,探讨它在翻译教学上的用途。首先,本文作者采用了随机抽取的方法对克服(overcome)和找(find)进行了检索,找到了他们不同的翻译方法和用法;然后作者通过举例说明汉语中把字句结构的三种形式如何在英语中翻译;最后作者从台湾大学高建明所建的英汉平行语料库中,以“他心情很低落”为例,从语料库中找到相近的中英文短句、句子,找到了表示“心情低落”的各种不同词汇和方法。 结论:在翻译的教学和实践中,双语平行语料库和检索工具的运用不仅给译者提供了方便,而且使他们掌握了一种科学、多样的翻译方法。同时也能激发学生的兴趣,让学生在不同版本的对译中互相学习。这表明双语平行语料库是翻译教学中的一种重要的学习资源,应当引起

托福口语语料库整理Fancy(优选.)

Task 1\2 独立题戏精上身语音语调 Task1 多选一、三选一、建议类、优缺点 Task2 A or B, agree or disagree, good or not I’m a university student who has endless tasks to deal with. For example, i need to take classes, write papers, prepare for the TOEFL test and so on. Usually, i feel so tired and busy, so i need to find a way to let off my steam. Like last weekend, i ...,and i felt so relaxed. I could totally get away from the daily grind. What’s more, while doing sth, i can meet a bunch of people who share the common interests and hob bies. I mean, it’s easier for us to get along with each other. It can help me to expend my social network. 大城市、出国 Living in a big city can provide people with a lot of benefits. I’m a university student who studies in shanghai, i enjoy my life here in this big and modern city, because i can receive better education, experience new things, get more job opportunities and so on. All these can lead to a better life, right?Besides, the basic infrastructure in big city is perfect, because there are some museums, hospitals, schools,libraries and so on. 榜样力量 Yi Fan is a famous actor in my country, and i admire him a lot because he sets a good example to me. Once, i watched an interview about him on TV. In the interview, he told us that at the beginning of his career, he was little-known. However, he kept trying harder and harder and never give up. Now, he is a household star and everyone knows his name. His story motivates and inspires me all the time. 大学教育、商业 I’m studying in a top university, which provides me a pla tform to gain and enrich knowledge for my major. My major is business administration. In university, i have learned some related academic subjects, such as economics, management, e-commerce and so on. At the same time, i can do some internships in some business companies. All these can lay a solid foundation for my future career. What’s more, in university, i can make friends with some talented people who can give me a lot of inspiration. 三选一结尾套话 To tell you the truth, when talking about the other two things, i have absolutely no interest in them.

中国英汉平行语料库的设计与研制

中国英汉平行语料库的设计与研制 王克非北京外国语大学中国外语教育研究中心提要:本文论述超大型双语平行语料库的设计与研制问题。在综合述介国内外双语语料库建设情况之后,作者着重论述了中国英汉平行语料库这一超大型双语平行语料库的设计特点(主要有分类架构、历时处理、语料平衡以及通用的和各种专门语料的采集)和研制方法(主要讲述语料的加工标注、检索平台以及各个专门语料库、历时语料库和口译语料库的构建)。其设计与研制对于其他大型语料库的建设具有借鉴意义。 关键词:中国英汉平行语料库;设计;研制 Abstract:The paper deals with the design and construction of asuper-large-scale bilingual parallel corpus.After an overview of parallelcorpora constructions and applications both in China and abroad, the designfeatures(including classification and composition,diachronical arrangement,balance of textual materials,and collection of texts for general or specificpurposes)and the construction methods (including tagging,concordanceplatform,and the construction of specialized corpora,diachronical corpora andinterpreting corpora)of the super-large-scale China English-Chinese ParallelCorpus(CECPC)are focused on.The design and construction discussed areapplicable to the compiling of other large-scale corpora. Keywords:China English-Chinese Parallel Corpus (CECPC);design;construction 1、中国英汉平行语料库的研制意义 在全球化、信息化的当今世界,翻译已成为了解全球信息、扩大对外宣传、获取国际资源的重要手段。同计算机技术结合而兴起的双语平行语料库建设,则为语言研究、翻译研究、外语教学、词典编纂和跨语言信息检索等提供了最好的平台,同时还可用来考察和验证基于单语语料库或者基于直觉提出的假设,具有广阔的应用前景。

语料库简单dye 第二讲

2008/7/31 语料库简单DIY 第二讲语料库软件初探-- 语料库软件初探--MonoConcPro 2.2 本软件是Athelstan开发小组https://www.360docs.net/doc/3515750981.html,/ ,于1996年开发的语料库比较检索工具。目前,我的服务器上提供学术性下载,下载地址: http://vu.flare.hiroshima-u.ac.jp/whistle/corpus/MoconcPro2. 2.rar (本软件为学术交流使用,所有权归本软件开发小组所有,一切商务性盈利目的的违法使用,所带来的连带责任关系与本人及本论坛无关。请慎重下载,小心使用!!!) 功能介绍: 软件主界 面 基本功能: MonoConc Pro 2.2 的软件界面比较简单。适合语料库初学者和初级研究人员使用。 本软件据作者的研究,其内部主核使用UTF-8编码,基本支持欧洲几种主要语言。当然,其主要的应用领域还是针对英语。本软件主要处理的文本素材是以TXT结尾的记事本文件,当然,本软件还可以导入RTF文档和其他格式的操作系统默认文档格式。不过,从DIY的角度来说,我们自己收集到的语料,为了免除格式,字体,行距等等文本要求,最好全部使用TXT文档,方便,省

事!用了都说好!(谁用谁知道) 我们按照自己的研究目的,研究方向,收集我们所需要的语料素材,具体的收集方法因人而异。可以从报纸杂志的电子文文档上直接下载,也可以从网站上直接下载整理好的TXT版本的小说,资料素材等,还可以直接从各大语料库中检索需要的语用素材,然后拷贝粘贴到TXT文本中。由于MonoConc Pro 强大的跨文档处理系统,一次可以同时导入多个TXT文档进行比较处理,所以我们可以把文章或者资料按照自己喜好的分类标准进行分类,然后存成不同的TXT文件名。检索的时候,只需要同时导入这些文件就可以了。(异常强大~)下载好软件,解压缩,然后打开MP22.EXE文件,你就可以看到上图那个简单的主界面了。 之后,选择File→Lord Corpus File(s),找到你需要导入处理的TXT文档,一个或者多个都可以,然后选择[打开]。指定的TXT文件就被全部导入进MonoConc Pro中了。 如果导入了过多的TXT文档,比如您导入了莎士比亚全集+马克思选+恩格斯选+列宁选+毛泽东选+邓小平选.....(不能否认,真的有这样的朋友存在)。那么,为了方便您查询检索结果所出现的文章,你可以选择File→View Corpus File/URL,这样就能看到查询结果所在的文章,还可以删除不需要的文章,或者添加新的文章,非常简单。 *这里的URL,指的是在HTTP或者FTP上,可以直接打开的文字页面的链接。一般朋友们DIY的语料库都是存在本地硬盘上的,所以基本上可以无视这个选项。不过,将来我们的个人语料库要实现点对点,点对多的平台连接。连接后,我们就可以相互查询对方个人语料库中的资料,此时在导入对方语料库中的文档的时候,就要用这个了。(这个目前还很遥远,大家还是踏踏实实做自己的DIY语料库吧!) 当我们要删除所有的文章的时候,这个时候仅仅关闭文章的窗口,是不能实

一对四_英汉双语对应语料库的建设及应用_任小华

2013年9月第3期外语艺术教育研究 Educational Research on Foreign Languages &Arts Sep.2013No.3 收稿日期:2013-04-10 基金项目:2012年洛阳市社会科学规划项目“英汉双语对应语料库的建设及应用”(2012B233)。 作者简介:任小华(1978-),男,陕西汉中人,洛阳师范学院公共外语教研部讲师、硕士,主要研究方向为应用语言学、语料库语言学、对比语言学。 “一对四”英汉双语对应语料库的建设及应用 任小华 (洛阳师范学院 公共外语教研部,河南 洛阳471022) 摘要:双语对应语料库对对比语言学和翻译研究的重要性不言而喻,国内外大多双语对应语语料库不 对外公开或提供的检索数据很有限,而已建成或在建的“一对多”双语对应语料库并不多见。以美国总统就职演说词及四个汉语译文为语料开发的“一对四”型的英汉双语对应语料库,库容为76万词/字。其对整理后的语料进行分词、词性标注,也对未分词标注的语料进行了句子对齐,并实现了“一对四”双语语料的检索。 关键词:双语语料库;美国总统就职演说词;分词;标注;对齐;检索 中图分类号:H 319 文献标识码:A 文章编号:粤内登字O -10339(2013)03-0020-07 一、引言 由于现代计算机和网络技术的有力支持,语料库语言学得到了飞速的发展,现已成为语言学的一个重要分支。随着语料库语言学的发展,语料库的研制类型也呈现多样化,双语甚至多语的平行对应语料库成为语料库语言学的一个亮点。平行语料库开发具有较高的理论及应用价值。Ai-jmer 和Altenberg 指出,平行语料库对翻译和语言对比研究特别有用,并扩展了研究问题的范围。 [10]12 它有助于通过对比深入了解所对比的语 言,而这往往在研究单语种语料库时被忽略,通过比较,它能揭示语言的共性以及某语种所特有的、语言类型与文化上的差异,还可以揭示原文与译文、母语与非母语之间的差异等。 双语对应语料库最初侧重于英语与其亲属语言之间,上世纪90年代中期才逐渐扩展到英语与欧洲之外的一些语言之间,现在已几乎覆盖世界上所有主要的语言之间。在国外,挪威、荷兰、英国、美国、加拿大等国家都建立了涉及不同语种、不同规模的平行语料库。 [1]18-19 比较著名 的平行语料库有:Hansard 对应语料库 [11]169-176 ,英语-挪威语双语对应语料库(ENPC ) [12]87-112 ,ITU 英语-法语-西班牙语三语对应语料库 [13]219-226 ,英语-法语-丹麦语-芬兰语-希 腊语-拉丁语-瑞典语-西班牙语-越南语等九种语言的Bible 对应语料库 [14]129-153 。 近年来港台学者和海外华人学者也建立了一些双语对应语料库,主要是和汉语对应的平行语料库,如吴德凯等人在香港科技大学建立的HKUST 中英对应语料库[15]80-87,台湾的中英对应 语料库(Sinica Corpus ) [1]18 ,Bermingham 中英对应语料库[1]18 ,英国兰卡斯特大学的中英对应语 料库 [1]19 ,以及巴比伦英汉平行语料库[1]19,等 等。大陆学者也建了一些英汉平行语料库,包括:北京大学计算语言学研究所的新闻机助类平行语料库Babel ,北京外国语大学中国外语教育研究中心的通用汉英平行语料库(PCCE ),南京国际关系学院的英汉平行语料库(PECC ),上海交通大学外国语学院的英汉平行语料库、莎士比亚戏剧英汉平行语料库和汉英会议口译平行语料库,绍兴文理学院的毛泽东选集汉英平行语料库、鲁迅小说汉英平行语料库、邓小平文选汉英平行语料库和中国法律法规汉英平行语料库,燕

英汉双语平行语料库人工对齐方法说明

英汉双语平行语料库人工对齐方法说明 1.概述 半自动英汉双语平行语料库的对齐分为两个过程: 第一个过程是先将两种语言的文本分成句子,每个句子占一行。句子定义为:以句号、问号、感叹号、分号结尾的一串字符,或以句号+引号、问号+引号、感叹号+引号等结尾的一串字符。“行”的概念是一串以回车换行符结尾的字符。这个过程可以采用任何一种具有“查找”和“替换”功能的文字处理软件来完成,也可以编程由计算机自动完成。 第二个过程是在第一个过程产生的结果的基础上以手工方式将两种语言的文本在句子水平上对齐。这一过程要采用UltraEdit软件来辅助完成。 在句子水平上对齐两种语言的文本,除了要注意以上对“句子”和“行”的定义以外,还应遵循一个重要的原则,即:如果两种语言的文本在句子的切分上有差异,应尽量保持原文句子不动,调整译文以适应原文。 为了能从双语平行语料库中获取更多的信息,还需要在对齐过程中插入少量的标记,例如:分译标记、合译标记、混译标记和移动标记等。此外,为了便于以后的检索,对于过长的句子还要在适当的地方将长句截短成两个或更多的小句。 2.人工对齐的方法 2.1打开文件 先用UltraEdit软件将两个已经分为句子的文本文件打开,在该软件的工具栏的“窗口”下拉菜单中点“水平平铺”选项,使两个打开的文本同时显示在屏幕上。为了操作方便,一般把原文放在上半屏,把译文放在下半屏。(见图1) 2.2 上下移动文本 为了能够对齐两种语言的文本,在操作过程中需要不断地上下移动文本。移动文本可以用鼠标移动窗口右边的滑块来完成。也可以将光标放在某一行,然后用鼠标的中间滚轮来上下移动。 2.3 同步移动上下两个窗口中的文本 在“窗口”下拉菜单中选“同步”选项,就可以同步移动上下两个窗口中文本,极大地方便人工对齐的操作。

相关文档
最新文档