桂诗春等-2010-语料库语言学与中国外语教学

桂诗春等-2010-语料库语言学与中国外语教学
桂诗春等-2010-语料库语言学与中国外语教学

2010年11月November 2010

第33卷第4期Vol.33No.4

现代外语(季刊)

Modern Foreign Languages (Quarterly )语料库语言学与中国外语教学

桂诗春

冯志伟杨惠中何安平卫乃兴李文中梁茂成

[编者按]

为推动我国应用语言学研究的新发展,教育部人文社科重点研究基地———广东

外语外贸大学外国语言学及应用语言学研究中心于2010年9月24-25日成功举办了“首届广外应用语言学论坛”,庆贺我国著名语言学家、应用语言学学科的开拓者桂诗春教授八十华诞。期间,举行了题为“语料库语言学与外语教学”的高层论坛,就语料库语言学的现状、发展前景及语料库的建设、共享、应用等展开了互动讨论。以下是根据专家发言,整理后的主要内容。

[中图分类号]H319

[文献标识码]A

[文章编号]1003-6105(2010)04-0419-08

语料库语言学的发展前景与资源共享

广东外语外贸大学

桂诗春

1.语料库语言学的发展前景

语料库语言学在外国和国内都发展很快,有的人选择了它作为发展方向,因为它的入门比较容易,上手较快;有的人把语料库语言学作为收集数据的重要手段。但是总的来说,我们的语料库研究还处在比较初级阶段,需要提高。究其原因是很多人把它看成是一种工具或手段,可以运用现有的一些现成的程序和公开的语料库,如Brown ,LOB ,Frown.

Flob ,

BNC ,CLEC ,只要选题得当,就能获得很多量化的数据,从而写出洋洋洒洒的文章来。在计算机和扫描仪的支持下,自行收集一些语言素材,建立一个特定的语料库,也不是什么难事。

我觉得,语料库语言学既是一种工具,但更是一门学科;它是对语言行为进行概率性归纳和概括的一门学科,它本身是跨学科性的,要做语料库语言学研究必须许多方面要有比较雄厚的基础。首先是数学和统计学。Herdan (1960)的一本早期著作,叫做《词次/词型数学》(Type /token Mathematics ),其副标题就是《数理语言学教科书》(A Textbook of

Mathematical Linguistics ),当时还是前计算机

时代,但Herdan 觉得有两件语言事实值得我们注意:一是大量语言资料(language in

mass ),二是语言排列(language in line ),它们是任何语言运作都不能离开的两个方面。某些语言学研究分支如果考虑到这两个方面,将会从中获益。当时还没有真正的机读语料库,

Brown 的语料库在1967年才面世,美国心理

学家John Carroll 根据该语料库以及他后来参与制作500万词的AHI 语料库,所提出的词汇频数对数正态模型(lognormal model )均源于Herdan 所奠定的基础。一直到最近美国Barber 利用计算机对英语语体的各种研究,更是利用了因子分析的统计方法。其次是计算机科学。语料库的发展离不开现代科学技术,其主要表现是个人电脑、扫描仪和大容量硬盘的普及,当初Brown 语料库要动用到大型电脑,而到如今,只需一万元左右就能在家里拥有这些设备,制作出甚至比Brown 还要大的语料库。但是我们往往只注意到硬件部分,而不认识到软件的建设。从事语料库语言学研究的人而不掌握一到两种编成语言,也不可能拓展他们的研究领域,因为他不能根据个人的研究需

语料库语言学与中国外语教学

1.双语料库的建设

我很赞同桂诗春教授的意见,积极推进语言资源的共享,语料库只有共享才能变成财富,如果把语料库的研究成果“藏诸名山,束之高阁”,只是一堆数据垃圾,必将自毁前程。桂诗春教授刚才提到宾西法尼亚大学的

Linguistic Data Consortium (我建议最好翻译为“语言数据联盟”,简称LDC ),是一个很好的供语料库语言学研究者进行交流互动的平台。在语言数据联盟和其他相关机构的帮助下,研究者们可以获得口语和书面语的大规模的语料。重要的是,在这些语料中还包括一些标注

过的语料,如宾州树库(Penn Treebank ),布拉格依存树库(Prague Dependency Tree Bank ),命题库(PropBank ),宾州话语树库(Penn

Discourse Treebank ),修辞结构库(RSTBank )和TimeBank (我不知道TimeBank 这个名称如何翻译为中文)。这些语料库是带有句法、语义和语用等不同层次的标记的标准文本语言资源。这些语言资源的存在大大地推动了人们使用“有监督的机器学习方法”(supervised

machine learning )来处理那些在传统上非常复杂的自动句法剖析(automatic syntactic parsing )和自动语义分析(automatic semantic

双语语料库的建设与用途

国家教育部语言文字应用研究所

冯志伟

要,通过计算机自行编程来检验假设。此外,要做语料库语言学研究,文本分类(又叫文本分析或内容分析)也必须具备雄厚的基础。它的研究范围也很广,从信息的提取、组织、储存,文本(包括语体)的分析,社会舆论调查,著作归属到文本格式。这也牵涉到许多统计学知识和计算机知识。数理语言学和计算机语言学的研究对象是文本和语篇。有志于研究这门科学的必需具有这些基础训练,否则不会走得很远的。我觉得,当务之急是让我国语料库语言学的先行者们聚在一起,研究语料库语言学作为一门科学应该在什么层次上开设?它有什么基本内容?由哪些核心课程组成?只有规范语料库语言学专业的课程,按照这些课程设置来培养我国语料库语言学的学生,他们才能高瞻远瞩,取得真正的进展。

2.资源共享问题

语料库语言学对资源有很大的依赖性,为了促进语料库语言学在我国的发展,应该提倡资源共享。回顾语料库语言学在国外的迅猛发展,和资源共享有密切的关系。共享的方法有

多种:一是免费提供,最典型的例子是George

Miller 领衔制作的英语大型词汇数据库Wordnet 受到各方面资助,前后参与制作的不下一千人,而且还在不断完善。他们认为这不是一个商品,应该为公众所有。二是提供网上服务,整个语料库不提供,但是在网上可以自由检索获得数据,像美国Brigham Young 大学的Mark Davies 在他的网页上检索美国现代英语语料库、美国历史英语语料库、英国国家语料库、《时代》杂志语料库、西班牙语语料库、葡萄牙语语料库以供检索。三是成立语料库分配中心,收少量成本费提供语料库,像挪威的

ICAME (International Computer Archive of Modern and Medieval English ),美国的LDC (The Linguistic Data Consortium ),等等。一些语料库工具,如TACT 、LEXA ,Wordcruncher ,Wordsmith 、Antconc 也都很容易在网上获取。资源共享的理念是,只要有更多的人使用,我们所开发的资源、工具才能完善,学科才能发展。只有互通有无,才能共同协作,才能减少重复劳动,制作出更成熟的成品。

420

1.语料库语言学的应用研究

这次专题讨论的题目“语料库语言学与

外语教学”我觉得很好,很及时。语料库语言学本来就是实践性、应用性很强的一门学科,

语料库语言学的应用研究与贡献

上海交通大学

杨惠中

analysis )等问题。这些语言资源也推动了有竞争性的评测机制的建立,评测的范围涉及到自动剖析(parsing )、信息抽取(information

extraction )、词义排歧(word sense disambiguation )、问答系统(question-answer system )、自动文摘(automatic summarization )等领域。

几年前由中国中文信息学会发起,在北京创建了“中文语言数据联盟”(Chinese

Linguistic Data Consortium ,缩写为CLDC ),是一个自愿组成的学术性社会团体,其宗旨是团结中文语言资源建设领域的广大科技工作者,建成代表中文信息处理国际水平的、通用的中文语言和语音的资源库。欢迎语言学界的同仁积极参与CLDC 的工作,促进语料库资源的共享。

目前单语语料库很多,已取得煌煌的成绩,但双语并行语料库(parallel corpus )不容易获得,它的构建和加工是很困难的工作。我国还没有高质量的、大规模真实文本的英汉双语语料库,更没有成熟的、可共享的加工工具,最近公布的2010年国家社会科学基金重大项目中有一项就是“大规模英汉平行语料库的构建与加工研究”,资助强度大约是50万元左右,可见国家对于双语语料库建设的重视。这个项目是我和王克非教授在今年的社科基金评审会议上建议提出的,已开始招标,希望大家积极投标,积极推进我国的双语语料库建设。

2.如何将语料库语言学运用到外语教

学,如何从语料库中挖掘知识?

我认为英汉双语语料库的最大用途就是

推进英语教学,我们可以从双语语料库中抽取教材的原材料,帮助语言学习者提高对于真实语言材料的语感,从而编写出高质量的外语教材。有的外语老师冥思苦想地根据自己的语感来编写教材,费时费力,其实,如果依靠英汉双语平行语料库,就可以减轻搜集素材之困难,大大提高编写教材的工作效率。

另外,语料库中蕴藏着无比丰富的知识等待我们去挖掘,如果我们使用“文本数据挖掘”(text data mining )的技术,从语料库中挖掘知识,既可以挖掘语言学的知识,也可以挖掘非语言学的知识,就像从矿石中挖掘出黄金一样,这些知识可以弥补传统语言学的不足,克服研究者的主观性和片面性。我们在

text data mining 这个术语中使用mining (挖掘)这个单词,而没有使用extraction (抽取)这个单词,正是为了强调在从语料库中获取知识的时候,要开动脑筋,要经过一番“去粗取精,去伪存真,由此及彼,由表及里”的深思熟虑的功夫来加工数据,而不要被海量的数据所迷惑。数据就像矿石,我们的任务是从海量的数据中挖掘出隐藏在其中的有规律性的东西,把海量的、离散的“数据”(data )变为精炼的、系统化的“知识”(knowledge ),从而把经验主义方法和理性主义方法紧密地结合起来。这种知识获取方法上的巨大变化,有可能引起整个语言学研究的“战略转移”(strategy

transit );我们中国的语言学家应当敏锐地关注“战略转移”问题,做出我们的应有的贡献,千万不要错过这个在语言学历史上千载难逢的良机。

桂诗春冯志伟杨惠中何安平卫乃兴李文中梁茂成

421

语料库语言学与中国外语教学

脱离了应用,坐而论道,也就失去了发展的基础和动力,将变成无本之木、无源之水。外语教学正是语料库语言学的重要应用领域,语料库语言学以实际使用中的语言事实作为研究对象是一种着眼于语言运用的研究方法(performance-based approach),因此跟语言教学有着直接的关系,对真实语言交际的各个方面,包括词汇的、句法的、语义的、语用的、语篇的,进行深入的探讨和全面的描写,其研究成果可以应用在教学大纲设计中,为确定教学内容、制定教学目标提供坚实可靠的决策依据。

语料库语言学在外语教学中的应用研究在三个方面应当加强。首先,充分利用在国内已经建成的中国学习者英语赋码语料库,包括书面语语料库和口语语料库,进一步深入研究中国学生学习英语的典型困难所在、研究中国学生运用英语的特点、调查不同类型和不同背景的学生的语言特征、探讨学生的学习策略、研究有关学习者语言发展的全面信息,以便建立有中国特色的英语教学体系。其次,把语料库语言学的研究成果,包括对预构成语块、词语搭配与用法、关键词、错误分析等方面的研究成果,建成语言数据库,提供在线帮助,把研究成果直接应用于教材开发和课堂教学,提高语言教学的有效性。再次,可以为高端学生提供“数据驱动学习”,由教师开发有针对性的小型专用语料库,学生利用词语索引软件,通过与母语语料的对比分析,自己探索英语词语的用法,让学生直接接触复杂的语言现象,在老师指导下,通过实际观察语境,通过分析、对比、综合、归纳,自己发现规则,做出假设,通过“探索”进行学习,掌握地道的英语、发展英语语感。当然,不能让学生迷失在海量的语言“事实”中,应当进一步开发便于使用的、界面友好的检索工具、分析工具等辅助语言学习软件,并且对语料进行预分析,帮助学生迅速找到语言的正确用法。

语料库语言学另外一个重要应用领域是自然语言处理,今天在计算机自然语言处理领域里,基于规则的方法已经让位于基于概率的方法,也就是语料库语言学方法,并且已经取得显著成果,充分说明语言概率模型的生命力。

2.语料库语言学促进语言学研究

语料库语言学作为一种研究方法,今天没有人怀疑,事实上众多研究领域已经离不开基于语料库的研究方法,比如社会语言学、语用学、会话分析、语体分析、儿童语言发展研究等等,而在有些领域,像词典编纂,基于语料库的方法则已经是当今词典编纂的范式,很难想象任何原创性的词典编纂项目可以没有自己的语料库的支持。

语料库语言学作为一门学科,则尚有争论。我们认为语言学的任务就是对语言进行科学的研究。由于人类语言涉及人类生活的方方面面,对语言的研究可以从不同的侧面着手,社会的、心理的、历史的、地理的、人种的、比较的、甚至神经生理的、病理诊断的等等,由于人类语言的复杂性,每一方面的研究都会使我们对语言的本质获得进一步的认识,人类的认识是没有止境的。

语料库语言学以真实语言数据为研究对象,凭借计算机技术,采用数据驱动的实证主义研究方法,从宏观的角度对大数量的语言事实、对语言交际和语言学习的行为规律进行多层面的研究,尤其是提供有关语言使用的概率信息,这就为语言学研究提供了新的途径、带来了新的理念、新的方法,这方面的研究必然使人们加深对语言本质的理解,这些研究当然属于语言学研究范畴。至于语料库语言学学科的研究对象、范围、方法等怎样进行界定,这将是新一代语料库语言学家面临的任务。

422

1.语料库语言学的学科地位与争议

关于语料库语言学的学科定位,一直众说纷纭。语料库研究创始之初,先贤们以解决语言教学中的实际问题为己任,无疑挑战理论语言学。然而,及至1990年代,大量新的研究发现问世,触动了语言学的方方面面,也引起了

1.语料库语言学从工具和方法正走向理论构建

语料库语言学经过近半个世纪与计算机科学的协同发展,已经从早期的建设大规模语料库、开展语言调查和研发检索工具进入到语言学理论构建及更加广泛深入应用的阶段。语料库使人类掌控的语言资源空前巨大、检索和提取语言信息的手段空前快捷和灵活,它先从改变人们观察语言的方式进而发展到改变人们对语言本质的认识。其中对语言意义的构建单位和表达范式的研究就已经涌现出一批创新性的理论成果,包括“词汇语法理论”、“口语语法”和“短语理念”等等。上述的理论发展自然对语言教育,尤其是外语教学产生触媒作用,并且已经引发了一系列外语教学理念改革。例如,词汇教学是教单词还是教短语搭配?教搭配是仅教词汇和语法形式搭配还是要扩展至教语义或语用搭配?词汇和语法是分开教还是……?所以,国外有学者称“语料库是一场革命”。

2.语料库的“教学加工”理念

语料库的“教学加工”(pedagogic processing)是目前国内外不少学者对语料库语言学应用于语言教育教学的深刻反思。它包括如何让语料库走进语言教学大纲的设置、教材的编写、课堂教学活动设计、实施和效果评估等等。目前在国外,语料库应用于教学的研究已经从宣传和介绍其可能性和潜在意义发展到深入探究如何与其他学科的理论和方法相结合以及如何解决在教学实施过程中遇到的理论困惑、工具改良、教材设计和教学方法等实际问题。在国内,业内人士虽然越来越认同语料库作为一种新资源和新技术对外语教育教学有巨大的潜在价值,但是语料库辅助的教学还未能切实进入外语教学的主流(即课堂教学)。2010年在捷克召开的第9届“教学与语料库(TaCL)国际研讨会更提出一种观念转变:即,不是由专家学者向一线教师宣讲可能利用语料库来做什么,而是由一线老师提出需要用语料库来做什么,然后再共同研究如何解决这些教学上的实际问题。语言教师要从“语料库产品(如教材)”的“消费者”转变为“合作研发者”、“实践反思者”和“教师自我发展的行动者”。

3.语料库应用于外语教学的发展趋势

语料库语言学在该领域的发展至少有以下几个趋势。一是着力建设外语学习者语料库、口语语料库和专门学科或行业语料库(如英语ESP);二是创建多模态语料库,即语料库与音频和视频相链接的、甚至是同步共现的综合性教学资源库;三是将语料库语言学纳入师范教育和继续教育的必修课程,使之成为外语教师必备的教学资源和信息技术。我们华南师范大学的语料库语言学教学团队将一如既往,朝着这些趋势努力探索实践。

语料库的教学加工理念与应用

华南师范大学何安平

语料库语言学的学科地位及外语教学服务

北京航空航天大学卫乃兴

桂诗春冯志伟杨惠中何安平卫乃兴李文中梁茂成423

1.语料库语言学的发展问题

我不敢去做什么预测,只是把我们自己正在做的和希望做到的,以及在此过程中碰到的一些困扰,向在座的各位汇报,并请大家指导。(1)语料库开发问题。我们感觉到,语料

库开发正在向两头快速发展和延伸:一是通用型的、基于网络的超大型语料库开发,其主要特征是应用新技术新方法,如网络服务和云计算,提供可定制的动态开放语料库,以满足使用者日趋多元的需求和应用取向;二是

诸多反弹。在理论语言学阵营,Chomsky 说“Corpus linguistics does not exist ”(Tognini

Bonelli 2001:50)。在应用语言学阵营,Widdowson (2000)认为,语料库语言学的研究成果不能应用于语言教学,如果那样做,就是在搞Linguistics applied 。显然,Widdowson 认为语料库语言学不属于应用语言学。然而,Halliday (1993:1)却认为,将语料库语言学家与理论语言学家区分开来是非常奇怪的做法,因为语料库语言学是一种理论性极高的探索。时至今日,大家仍在讨论,并无共识。我个人十分赞赏黄国文教授刚才主旨报告中讲的观点,即语料库语言学和功能语言学一样,属于Halliday 所阐述的“适用语言学”(Appliable linguistics )。事实上,几年前我在洛阳举行的一次会议上也提出过类似的观点。也就是说,语料库语言学是介于理论语言学与应用语言学之间的一种语言学,它的研究活动及其成果既适用于语言理论构建,也适用于语言教学的实践。“适用语言学”是个十分有用的概念,因为有些语言学在可预见的将来是无法应用的。它可以较好地解决语料库语言学的学科定位问题。

关于中国国内过去数年进行的语料库研究,我认为基本上属于应用语料库语言学(Applied Corpus Linguistics ),因为大家主要是针对二语习得和教学问题进行探讨。

2.语料库技术在外语教学中的运用杨惠中教授关于语料库应用于外语教学

的观点一语中的。中国的语料库研究应当也必须为外语教学服务。遗憾的是,过去数年间,语料库帮助一大批学子获得了硕士、博士学位,却未能有效帮助外语教师和学生提升教学效果。我认为,应当首先从教师培训做起。帮助教师从语料库证据归纳最频繁使用的类联接型式、最频繁使用的词语搭配、最频繁表达的意义和功能;帮助他们学会发现新的语言事实,新的意义和用法模式。这对发展他们的语言意识大有裨益。教师的语言意识提高了,使用语料库的技能娴熟了,观念发生了变化,会逐步改进教学,并最终使学生受益。

3.语料库语言学的现状和未来

全球范围内的语料库语言学现状可谓喜忧参半。一方面,越来越多的不同学术路线和背景的研究者加入到了语料库研究队伍,包括心智语言研究者,阵容空前庞大,异彩纷呈。另一方面,各种学术理念和方法交织碰撞,有些做法已经明显不同于第一代语料库学者创设的基本经典方法。问题不在于能做什么;平行语料库、多模态语料库、动态语料库等等,都可以做。问题在于如何做:任何学科都有其认识论和方法论;背离了基本立场和方法,就不再属于该学科了。总之,这个学科的未来有很多不确定性。不过,我们什么时候都应相信严肃科学的力量。

语料库开发与语料库研究

河南师范大学

李文中

语料库语言学与中国外语教学

424

1.外语教学中如何合理使用大型语料库

这里我想谈两个问题。第一个是语料库在外语教学中的应用问题。正如许多学者所言,语料库的最大优势在于其语言的真实性,有别于教师凭直觉杜撰出来的例句。或许是受这种思想的启发,前一阵子,有一位老师很得意地向我演示他如何利用数据库技术,将总容量达到一亿词的英国国家语料库(British National Corpus)存放到自己的服务器上,并提供网络入口,任由学生进行“探索性学习”。对这位老师的高超技术和热情投入我十分佩服,但不难想象,大型通用语料库往往口笔语兼收、语料庞杂,口语方面包含日常会话、公共演讲、电视访谈等;笔语方面既涉及书信往来、娱乐小报和时尚杂志,又不乏小

个性化、专门化、行业化的小型语料库开发。前者需要大规模的投入和专业化的开发队伍,愈来愈注重数据挖掘、信息智能处理、以及知识挖掘,强调语料库数据的组织结构和呈现方式;而后者仅需要小规模、小投入,开发者即是研究者,又是研究成果的田野使用者,更强调语料库的整体平衡性和代表性。当然,二者虽离心发展,但之间的界限却非泾渭分明,而是相互借鉴,互为发明,互相促进。(2)语料库研究的发展问题。语料库研究需要更大的发展纵深,要解决如何从描述到解释,以及如何从发现到理论建构等难题。描述须完备,解释须充分;研究发现强调可靠性,理论建构则注重可验证性。(3)语料库研究方法和视野问题。无论是基于语料库的研究,还是语料库驱动研究,我们都可能需要解决如何从词语分析、短语学分析到文本分析、话语分析以及文本群落分析的视角和方法问题,把具体的、散点的词语层研究统一到多维纵深的文本整体研究上,这使得语料库研究方法和视野呈收敛趋势:不是用其它各个学科的理论和观点来观照和审视语料库语言学,而是拿语料库语言学来观照和审视相关的研究发现和成果。(4)语料库研究应用问题。语料库研究应用越来越多元化和日常化。方法、工具和应用是语料库语言学学科从一开始就不可或缺的要素。它既不是纯理论的推演,也不是机械的泛工具。纯粹把语料库当作工具的学科需要谨慎,他们可能要么为语料库大量产生的“废料”感到头疼,要么为无限增长的反证而感到束手束脚。语料库语言学方兴未艾,目前对其发展作任何预测可能都是徒劳的。借用一部电影的对白,对语料库语言学的发展,我们只能知道开头,却永远猜不中结尾。

2.语料库与外语教学

再汇报一下我们对语料库应用的工作和学习体会。我们河师大团队目前正在解决以下几个问题:(1)如何使语料库服务语言教学的目标、内容、过程以及评价,使语料库应用纳入到教育教学这个整体框架下。语料库研究成果不仅需要融合应用语言学理论,还需要教师行动研究来具象,使之语境化、具体化,更富于针对性。(2)基于语料库的学习平台应与网络无缝联接。(3)多媒体语料库集成语料库检索技术、网络音视频流媒体技术及人机交互界面,在学科教学理论指导下,为语言教学提供底层数据支持,真正实现虚拟语料驱动学习。

大型语料库的合理使用与共建共享

北京外国语大学梁茂成

桂诗春冯志伟杨惠中何安平卫乃兴李文中梁茂成425

说戏剧、学术著作和政府文书,不一而足。在教学实践中,若将如此混杂的语料不分青红皂白地和盘托出,交给初涉外语的学生,无异于把刚学游泳的孩子扔到茫茫大海之中,其结果可想而知。

几乎在语料库问世之时,人们就意识到语料库在外语教学中的广阔应用前景。的确有一些学者在大纲制定、教材编写、语言测试中尝试使用语料库,然而,迄今为止,普通外语教师和外语学习者,充分利用语料库的人少之又少。造成这种局面的原因是多方面的,值得我们思考。在我看来,语料库应用于外语教学应以遵循教育教学规律为首要原则。譬如按照因材施教的个性化学习原则,我们可以为不同学生(或不同课程)定制不同难度的分级语料库。或者还可按照不同教学目标,从大型语料库中精选少量语料以适应课堂教学的要求(我称之为“微型文本”)(梁茂成2009)。围绕教材和课程内容构建的微型文本库将会给外语教学提供丰富且可操作的真实语言素材;其次,若想使语料库在我国的外语教学和研究中获得更广泛的应用,我们有必要组织一些针对教学实际的专题研讨,走出“象牙塔”,以网络论坛或研修班的形式,同一线教师探讨语料库应用方面的实际知识。

2.也谈语料库资源的共建与共享

第二个问题是语料库资源共享。资源问题是约束语料库语言学普及和发展的一个突出问题。这其中包括软件资源和语料库资源两方面。我十分敬仰桂诗春教授,他不仅传授给我们做人之道,为我们提供学术指导,更重要的是在与桂老师交往中,他常常与我们共享资源。

我认为,在语料库资源方面,我们应该加强共建和共享。加强共建指的是在语料库建设和软件开发方面各单位应加强合作,整合智力和人力。对于共建的资源,大家则可以共享使用权。这样研发出来的产品便不会只存储在个别单位实验室的电脑里。目前,我们北京外国语大学语料库语言学团队正在联合全国近百所高校的外语教师,共同建设一个共享语料库。希望这成为国内共建语料库的一个成功试点。同时,加强共享也十分重要。我们开发了一些有价值的资源,若拒绝交流,这不利于发现问题,也不利于技术创新。近几年,北京外国语大学中国外语教育研究中心语料库语言学团队不断进取,特别注重与国内外同仁的交流。不仅如此,我们开发了多个专门用途语料库软件,如PatCount(梁茂成、熊文新2008),Colligator(许家金、熊文新2009)等,全部免费在专业的语料库论坛(www.corpus4u.org)上与人分享。这些软件极大地方便了广大语料库爱好者。我们衷心地希望桂诗春老师所提倡的共建与共享的精神可以将我国语料库语言学的发展推向新的高度。

参考文献

Halliday,M.A.K.1993.Quantitative studies and probabilities in grammar.In Michael Hoey(ed).Data,Description,Discourse[C].London:HarperCollins Publisher,1-25.

Herden,G.1960.Type-Token Mathematics[M].The Hague:Mouton.

Tognini-Bonelli,E.2001.Corpus Linguistics at Work [M].Amsterdam:John Benjamins.Widdowson,H.G.2000.On the limitation of linguistics applied[J].Applied Linguistics21,1:3-25.

梁茂成,2009,微型文本及其在外语教学中的应用[J]。外语电化教学(3):8-12。

梁茂成、熊文新,2008,文本分析工具PatCount在外语教学与研究中的应用[J]。外语电化教学(5):71-76。

许家金、熊文新,2009,基于学习者语料库的类联接研究:概念、方法与例析[J]。外语电化教学(3):18-23。

收稿日期:2010-10-15;

本刊订正,2010-10-22

语料库语言学与中国外语教学426

语料库翻译学_问题与展望_龙绍赟

江西社会科学2012.12 244 语料库翻译学:问题与展望 ■龙绍眖语料库翻译学在汲取语料库语言学、描写性译学及其他相关学科营养的同时,不断丰富和发展自己的研 究内容和研究方法,颠覆了传统译学的研究方法,形成了自己独特的研究对象,拓展和深化了翻译学研究的外延和内涵。然而,语料库翻译学研究也存在内容上的缺陷。因此,未来的语料库翻译学研究应紧密结合翻译学的跨学科属性,构建并完善语料库翻译学的理论体系,发挥其方法优势,突破自身的缺陷,实现其发展预期。 [关键词]语料库翻译学;跨学科属性;代表性;应用文体;深度与广度 [中图分类号]H0[文献标识码]A[文章编号]1004-518X(2012)12-0244-05 龙绍眖(1969—),男,江西师范大学外国语学院副教授,硕士生导师,主要研究方向为语料库语言学。(江西南昌330022) 20世纪以来,描写性译学悄然兴起,语料库语言学蓬勃发展。20世纪90年代,以英国曼彻斯特大学翻译与跨文化研究中心Mona Baker为代表的一批学者相继将语料库应用于翻译学研究,开启了全新的译学研究范式—— —语料库翻译学。语料库翻译学注重实证研究,强调数据统计与理论分析的有机结合,主张从大量翻译事实或现象出发,在对获取数据进行统计分析的基础上来阐明翻译本质、翻译过程、翻译策略及翻译活动的制衡因素,有效地弥补了定性研究的缺陷与不足。短短十几年的发展,语料库翻译学已逐渐形成自己独特的研究领域,并发展为翻译研究领域不可或缺的学科。但语料库翻译学研究在技术层面、研究方法、研究广度和深度等层面还有很多不足,本文就此提出一些建议与策略。 一、语料库翻译学的发展概况 语料库翻译学,指以语料库为基础,以真实的双语语料或翻译语料为研究对象,以数据统计和理论分析为研究方法,依据语言学、文学和文化理论及翻译学理论,系统分析翻译本质、翻译过程和翻译现象等内容的研究。[1]语料库翻译学最早由Mona Baker于1996年正式提出[2],Tymoczko将该领域的研究命名为“Corpus Trans-lation Studies”(语料库翻译学研究)。[3]语料库翻译学是语料库语言学和描写性译学相互影响、相互结合的产物。Sara Laviosa认为:语料库语言学和翻译研究的结合形成了“一种连贯的、全面而丰富的研究范式。该范式涉及翻译理论、描写和实践等方面的问题,业已成为当代描写性译学研究的新范式”。[4]相应的,语料库翻译学具有这两个研究领域的特征,即语料库方法的运用与注重描写与实证。[1] 语料库翻译学已成为语料库翻译学区别于传统译学研究不可或缺的研究领域。译学研究语料库的建设应属语料库翻译学的研究内容之一。不同于以学者直觉和

基于COCA语料库和CCL语料库的翻译教学探索

基于COCA语料库和CCL语料库的翻译教学探索 南京大学 常熟理工学院 朱晓敏 提 要:从上世纪80年代起,作为一种研究语言现象和语言本质的新模式,语料库语言学取得了令人鼓舞的成就。语料库已经渗透到语言研究的各个领域。翻译研究领域里使用的语料库多为双语平行语料库和翻译语料库。单语语料库与翻译研究相结合,尤其是与翻译教学相结合,是一个鲜有人探索的未知领域。在课堂上使用可以免费获取的美国杨百翰大学的英语单语语料库(CO CA语料库)和北京大学汉语语言学研究中心的汉语单语语料库(CCL语料库)能改变传统翻译教学模式,为翻译教学的改革提供借鉴。 关键词:语料库,COCA,CCL,翻译教学 一、引言 作为一个新的研究领域,一种全新的探究语言现象和语言本质的方法,语料库语言学在上世纪80年代得到了蓬勃的发展。韩礼德(1993:24)曾指出: 语料库语言学将数据收集与理论论述有机地结合在一起,使我们对语言的理解发生了质的变化(转引自王克非,2004:4)。 根据收集语料的语言种类,语料库可分为单语语料库(monolingual corpus)和双语/多语语料库(bilingual/multilingual corpora)。前者仅采用一种语言的语料,通过大量收集本族语者的语言实例而建成;而后者是由两种或两种以上的语言文本构成的语料库,它可以有对应/平行的、类比的和翻译的三种形式。 单语语料库的研发历史要追溯到上世纪50年代末,由夸克等人在伦敦大学率先建立起现代意义上的语料库,即 英语用法调查(Survey of English Usage)。到目前为止,比较大型的英语单语语料库有BNC英国国家语料库,CBECobuild 英语库,Brow n布朗语料库,美国杨百翰大学M ark Davis教授主持的美国当代英语语料库(Corpus of Contemporary American English,简称COCA语料库),汉语的有北京大学汉语语言学研究中心的CCL汉语语料库等。国际上双语/多语语料库在近十几年得到了长足的发展,比较早的双语语料库有20世纪90年代早期建立的英语-挪威语双语平行语料库和英语-意大利语双语平行语料库,以及后来建立的英语和德语,英语和法语等双语语料库。国内目前规模最大的汉英双语语料库是北京外国语大学中国外语教育研究中心近年建成的达3000万字词的通用汉英语料库。国际上多语语料库有T he ECI M ultilingual Corpus多语种语料库(The ECI M ultilingual Corpus,简称IECI/M CI),近1亿字,包含了欧洲主要的语言及土耳其语、日语,俄语、汉语和马来语。而国内目前多语语料库的研究开发还是空白。 二、传统翻译教学面临的挑战与改革的出路 我国传统的翻译教学模式,即 理论讲解!举例验证!结论巩固,曾经为我国培养了一批优秀的翻译人才,他们中的很多人仍然是现在翻译行业的主力军。他们拥有扎实的中、英文功底和孜孜不倦的翻译探索精神。进入21世纪以来,信息技术迅猛发展,知识更新速度加快,传统的翻译教学难以适应新的挑战。从学生对课堂教学的反馈和专业八级考试中翻译部分的得分来看,传统翻译教学存在以下三个方面的问题:首先,翻译教学观念比较陈旧,课堂教学以教师讲述为主,学生听记为辅。学生只记得了抽象的翻译技巧,其实际的翻译能力并没有得到发展。其次,讲授的内容受教材限制,例句少且多为人造语境,学生感觉枯燥,难以提高学生的翻译能力。最后,课堂信息输入量小。 粉笔+黑板+教材+课后翻译练习的单一的教学方法导致课堂容量小,节奏缓慢。要改变以上现状,就要 实现翻译课程结构的科学化,扩大课堂教学的信息输入量,让学生在教师提 本文是南京大学2009年博士研究生科研创新基金课题 基于网络的英汉/汉英平行语料对自动获取(项目编号2010CW02)的前期研究成果。感谢匿名评审人员的宝贵意见。文责自负。

语料库语言学综述

语料库语言学综述 作者:刘美良 作者单位:柳州铁道职业技术学院,广西,柳州,545001 刊名: 科技信息 英文刊名:SCIENCE & TECHNOLOGY INFORMATION 年,卷(期):2010,""(21) 被引用次数:0次 参考文献(19条) 1.Chomsky,N Syntactic Structure 1957 2.Sinclair.John Corpus.Concordance Collocation 3.Susan Hunstom Corpora in Applied Linguistics 2006 4.Aijmer,K.Altenberg,B English Corpus Linguistics:Studies in Honour of Jan Svartvik 1991 5.杨惠中语料库语言学导论 2002 6.何安平语料库在外语教育中的应用--理论与实践 2004 7.何安平谈语料岸研究 1997(5) 8.丁信善语料库语言学的发展及研究现状 1998(1) 9.李文中2003上海语科库语言学国际会议述评 2004(1) 10.粱旭红语料库语言学研究综述 2001(1) 11.粱燕近十年我国语料库实证研究综述 2004(6) 12.刘满堂近40年英语语料库及语料库语言学研究的回顾与出展望 2004(1) 13.潘永本梁语料库语言学的目的和方法 2001(3) 14.王建新语料库语言学发展史上的几个重要阶段 1998(4) 15.许家金语料库语言学的理论解析 2003(6) 16.卫乃兴专业性搭配初探--语料库语言学方法 2001(4) 17.卫乃兴语料库语言学的弗斯学说基础 2008(3) 18.甄风超.张霞语料库语言学发展趋势瞻望--2003语料库语言学国际会议综述 2004(4) 19.吴菲国内外英语语料库的建设和发展述评 2007(6) 相似文献(4条) 1.期刊论文王虹.岳俊发.Wang Hong.Yue Jun Fa书面言语鉴定技术的发展历程-中国公共安全(学术版)2005,""(3) 书面言语鉴定技术产生于20世纪80年代中期.随着电子打印技术的普及,涉案的不留笔迹的打印文件显著增加,书面言语鉴定技术倍受关注.近年来,运用统计语言学、语料库语言学和计算机词频检索与统计等新技术获得了新的研究成果并应用于鉴定实践.书面言语鉴定技术已经发展成为文件检验学的一个新的分支,必将在司法鉴定领域发挥更大的功效. 2.期刊论文孙丰果话语分析整合研究-聊城大学学报(社会科学版)2010,""(2) 近60年来.话语分析经历了从无到有,从小到大的发展历程.话语分析要取得长足发展,需要有一个明确的概念,需要人们对其以前的发展情况进行总结和评述.对话语分析研究的评述不妨从系统功能语言学、认知语言学、语料库语言学等多角度进行.今后,话语分析研究可以从话语分析的哲学转向、心理学转向及整合批评话语分析和积极话语分析等方面展开. 3.期刊论文杨连瑞.Yang Lianrui第二语言习得研究的学科定位和进展-外语与外语教学2005,""(5) 第二语言习得是一种复杂的人文现象.作为一门新兴的交叉学科,第二语言习得研究在发展中应重视其学科性质的科学定位和学科体系的科学建构.本文在对第二语言习得研究的学科定位、学科性质和研究对象进行讨论后,回顾和评述了国外第二语言习得研究从对比分析、错误分析、中介语理论、普遍语法研究、语言类型学研究到语料库语言学研究的发展历程和研究问题,分析了目前我国开展这一学科研究的现状,并结合我国外语教学实际对目前开展这一学科的研究提出建设性意见. 4.学位论文魏琳中国英译旅游宣传材料的语料库分析2006 旅游业在全球范围内的迅猛发展使不同文化背景的人们进行文化交流变成了一种需要。在我国,旅游英语特别是网上的旅游英译材料是外国游客接触和了解我国的媒介。因此,旅游材料的翻译质量举足轻重。而目前旅游文本的翻译研究在中国还是一个比较新的话题,近年来主要是结合最新语言学

语料库话语分析综述

近十年国内基于语料库的话语研究综述 A Review of Ten - year Research on Corpus-Based Discourse Analysis in China 摘要:文章从基于语料库的话语研究领域出发,通过对2002年至2011年发表在国内八种核心期刊上的论文进行统计与分析,发现这些研究在研究领域取得了很大的进步,涉及到话语各个方向,对于实践有重大指导作用,但同时也出现一些问题值得我们关注。 Abstract: From corpus-based discourse analysis, this thesis finds this field has made great progress, relates to many directions of discourse and has a significant guiding role for the practice, but also brings many problems worthy our attention. All of these are derived from the research and analysis of thesises published in 8 kinds of core journals from 2002 to 2011 in China. 关键词: 语料库话语基于语料库的话语研究 0. 引言 现代语料库语言学是20世纪中后期兴起的一门语言研究科学。语料库是指按一定的语言学原则,运用随即抽样的方法,收集自然出现的连续的语言运用文本或话语片段而建成的具有一定容量的大型电子文库。在20 世纪后半叶的西方语言学界, Chomsky的观点大行其道,秉承该学说的语言研究者唯直觉语料独尊。他们躲在书斋,满足于依靠自己的直觉语料从事语言研究。随着社会语言学、话语分析、语用学、语料库语言学的兴起,越来越多的语言学家认识到光靠直觉语料来研究语言是远远不够的,人们还必须借助语料库语料以及其他各种语料,只有这样我们才能更好地揭示语言的本质,克服直觉语料的局限与不足。这样基于语料库的话语研究越发引起大家的重视,并取得了丰硕的成果。国内基于语料库的话语研究虽然起步较晚,但是成果仍然颇丰。 1. 研究样本 由于近几年运用语料库来做话语研究已经成为语言研究的热点,笔者通过检索主题与关键词,将文献定在2002年至2011年这十年期间,研究样本来源为发表在八种外语类核心期刊的22篇文章。这是因为这8种外语类期刊有一定的权

Corpus Linguistics and Translation Studies Mona Baker 1993 语料库翻译学文献

Corpus Linguistics and Translation Studies Implications and Applications Mona Baker Cobuild, Birmingham Abstract The rise of corpus linguistics has serious implications for any discipline in which language plays a major role. This paper explores the impact that the availability of corpora is likely to have on the study of translation as an empirical phenomenon. It argues that the techniques and methodology developed in the field of corpus linguistics will have a direct impact on the emerging discipline of translation studies, particularly with respect to its theoretical and descriptive branches. The nature of this impact is discussed in some detail and brief reference is made to some of the applications of corpus techniques in the applied branch of the discipline. 0.Introduction A great deal of our experience of and knowledge about other cultures is mediated through various forms of translation, including written translations, sub-titling, dubbing, and various types of interpreting activities. The most obvious case in point is perhaps literature. Most of us know writers such as Ibsen, Dostoyevsky and Borges only through translated versions of their works. But our reliance on translation does not stop here. Our understanding of political issues, of art, and of various other areas which are central to our lives is no less dependent on translation than our understanding of world literature. Given that translated texts play such an important role in shaping our experience of life and our view of the world, it is difficult to understand why translation has traditionally been viewed as a second-rate activity, not worthy of serious academic enquiry, and why translated texts have been regarded as no more than second-hand and distorted versions of …real? text s. If they are to be studied at all, these second-hand texts are traditionally analysed with the (233) sole purpose of proving that they inevitably fall short of reproducing all the glory of the original. A striking proof of the low status accorded to translated texts comes from the young but by now well-established field of corpus linguistics. A recent survey commissioned by the Network of European Reference Corpora, an EEC-funded project, shows that many corpus builders in Europe specifically exclude translated text from their corpora.1 This

语料库翻译学研究内容

研讨五语料库翻译学 1. 什么是语料库翻译学? 2. 语料库翻译学的理论基础? 3. 语料库翻译学的研究内容? 4. 什么是翻译共性? 根据研究课题的来源,语料库翻译学的研究领域分为三类。 第一类源自传统译学研究,包括基于语料库的文学翻译、翻译史、翻译教学、翻译实践、机器翻译和口译等领域的研究。 基于语料库的文学翻译研究以文学翻译作品的文本分析为基础,研究文学翻译理论与实践的相关课题。这些课题具体为: 1) 意象和人物形象的再现与变形,2) 文学风格的再现与重构,3) 文学翻译的创造性,4) 译者风格,5) 文学作品空白和未定性的翻译,6) 文化负载词的翻译,7) 误译和漏译研究。 基于语料库的翻译史研究利用历时性平行语料库对名家译作进行文本分析,揭示翻译家在翻译策略应用、翻译风格和翻译语言等方面所表现出的个性特征及其所遵循的翻译规范。目前,翻译史研究大多将翻译家的观点或言论视为客观现实,满足于翻译事实的罗列,对于翻译规范和历史语境关注不够。事实上,翻译家的所做与所言往往不一致,翻译家所言并不能反映其翻译作品的特征。此外,翻译是一种特殊的社会文化行为,受特定规范的制约。这些规范因时代或文化的差异而不同。利用语料库分析翻译文本的具体特征,归纳不同历史时期的翻译规范,可以阐明翻译家的所作所为,还原历史的真实面貌。另外,该领域的研究还通过提取语料库的篇头信息,对于具体某一历史时期的翻译活动进行客观描述。这些信息包括出版商、出版时间、作品主题、译者姓名和性别等内容。应当指出,语料库翻译学与翻译史均强调对研究对象进行客观描写,重视还原语境方法( contextualization) 的应用。这些共性为语料库在翻译史研究中的应用提供了作为空间。 以上研究均属语料库翻译学理论层面的研究,而基于语料库的翻译教学、翻译实践和机器翻译研究都是应用层面的研究。前者侧重于探讨语料库在翻译评估、翻译教材编写和翻译教学模式中的应用,后者主要关注双语词汇和句式之间的对应关系、翻译策略和方法的应用等问题。基于语料库的机器翻译研究是指利用语料库的核心技术,建设具有海量信息的知识库,以满足机助翻译或自动翻译的需求。 基于语料库的口译研究侧重于分析口译语料词汇、句法和语篇等层面的特征,研究口译语言特征、口译规范、口译策略和方法等。该领域的研究是综合性研究,既有理论层面的探讨,也有实践层面的分析。 第二类研究领域源自描写性译学研究,涵盖翻译共性、翻译规范和批评译学等领域的研究。 翻译共性是指由于翻译过程而形成的翻译文本所具有的区别于原创文本的特征,与源语和目的语之间差异无关,具体表现为显化、隐化、简化和范化等。翻译规范是“译者在具体时间或社会文化环境中所做出的规律性或习惯性选择”。“翻译规范是关于翻译作品和翻译过程正确性的规范,体现了具体某一社会或历史时期关于翻译的价值观和行为原则”。翻译规

基于双语平行语料库的翻译教学

基于双语平行语料库的翻译教学 翻译是英语专业高年级学生一门非常重要的课程。传统的翻译教学以教师讲解为中心,以翻译教材为学习载体,学生在上完课之后很难具备一定水平的翻译能力。针对于此,我们把双语平行语料库及相应的检索功能引入到翻译教学当中,以提高翻译教学质量,提升学生的翻译能力。 标签:双语平行语料库;翻译;教学 双语平行语料库是指使用两种语言撰写相互间具有翻译关系的文本的集合平台,与普通的词典相比,这种翻译方法更加准确、便利、快捷,更新速度快,可以提供大量真实的双语对译语料以供学习者查询。 何安平指出,将语料库引入翻译教学,会改变传统的翻译教学模式,使学生可以开展各种学习活动,比如互动式学习、开放式学习和分析归类型学习,这一系列学习可以激发学生的好奇心、求知欲,帮助学生塑造的批判精神和反思精神,为培养学生的创新思维提供了条件。 本文例句所使用的双语平行语料库是指北京外国语大学通用双语平行语料库。 1.基于双语平行语料库的词汇翻译 曾有人提出,平行语料库最典型的应用范围之一是双语词汇教学。无论是英译汉还是汉译英,在很多时候英汉两种语言不存在一一对应的词汇,一词多义的现象很普遍,这就意味着这个词有多种译文;而且,在某些特定的语境中,有的词被赋予固定的意思,这又是新的译文。北京外国语大学王克非教授以汉语“克服”一词为例,在北京外国语大学通用汉语双语平行语料库中检索,发现24处“克服”一词中,有15处翻译为overcome。在学生学习完这24个例子后,他们就会明白,在以后的翻译中,不是所有的“克服”都用overcome翻译,在其他情况下使用cope with,fight down,get rid of 等会更加贴切。 学习者可以借助双语平行语料库的真实语境平台,找到单词在不同语境下的地道翻译,既丰富了词汇量,快速准确地译出对应语,同时可增强语感,提升双语翻译能力。 2.基于双语平行语料库的句式翻译 有时候,学生会感觉无论是英语还是汉语,其中一些句式很难理解,至于翻译更是无从下手。在这种情况下,双语平行语料库为学生们提供了大量的特殊句式翻译例句。我们以英文中“it is said that”为例。这是英语中常用的句式,很多学生张口就翻译为“据说”,好像也没有人怀疑过;包括我本人在接触双语平行语料库之前,见到it is said that也随口就翻译为“据说”。但是,笔者通过双语平行语

语料库语言学的发展

语料库语言学的发展 语料库顾名思义就是放语言材料的仓库。现在人们谈起语料库,不言而喻是指存放在计算机里的原始文本或经过加工后带有语言学信息标注的语料文本。现在世界上已经有了不少规模较大的语料库,有些是国家级的,有些由大学和词典出版商联合建设。另外,由于个人微机的迅猛发展和存贮数据的硬盘造价持续下降,研究者个人也开始建立适合于自己研究的小型语料库。 语料库语言学(英文corpus linguistics)这个术语有两层主要含义。一是利用语料库对语言的某个方面进行研究,即“语料库语言学”不是一个新学科的名称,而仅仅反映了一个新的研究手段。二是依据语料库所反映出来的语言事实对现行语言学理论进行批判,提出新的观点或理论。只有在这个意义上“语料库语言学”才是一个新学科的名称。从现有文献来看,属于后一类的研究还是极个别的。所以,严格地说,现在不能把语料库语言学跟语言学的分支, 如社会语言学、心理语言学、语用学等相提并论。 近年来,随着我国经济的发展,科研经费的增加,汉语语料库的建设得到了开展。1999 年我院把建立汉语语料库列为院重大课题。目前语言所正在构建三个大规模的语料库: 现场即席话语语料库,主要方言口语库和现代汉语文本语料库。在世界范围内,我国的语料库建设在规模上还赶不上欧洲的一些发达国家,特别是英国。然而,在语料库语言学的研究上,以及语料库的实际运用上,我国已经进入世界前沿的行列。 20 世纪语言研究的总特点可以用四个字概括──高度抽象。最近几十年来,语言研究的高度抽象倾向已经失去主导地位。这主要缘于两个方面的因素: 一是计算机技术,特别是基于计算机处理的多媒体技术的飞速发展;二是社会语言学、语用学、会话分析、人类语言学、计算语言学、人机对话研究、语音识别与合成等研究取得令人瞩目的成就。先前难以抓住并进行有效处理的五花八门的实际语料,现在可以对其进行大规模地的、自动的或人机配合的处理。比如个人发音特征,先前认为这跟语言学毫无关系,现在成了侦破语音学的重要内容。侦破语音学家首先建立个人发音特征语料库,这个语料库可以用来鉴别嫌疑犯。概言之,当今的语言研究由先前的高度抽象逐步走向最具体的语言的实际活动,其中

双语对应语料库翻译教学平台的应用初探_王克非

语言技术与外语教学研究 *版权所有 文责自负* 双语对应语料库翻译教学平台的应用初探 王克非1 ,秦洪武2 ,王海霞 2 (1.北京外国语大学中国外语教育研究中心,北京 100089;2.曲阜师范大学外语学院,山东曲阜 273165) 摘 要:本文通过语料呈现实验探讨双语对应语料库翻译教学平台的应用效果。实验显示,学生在观察语料后能够归纳和总结出有意义的翻译技巧,并能据此评估或反思自己的翻译行为。实验表明,在翻译课堂教学中使用语料资源有助于自主学习和发现式翻译教学环境的创建,也有助于学习者形成 稳定的翻译技巧。 关键词:对应语料库;翻译教学;发现式学习;语料呈现中图分类号:H 319.3 文献标识码:A 文章编号:1001-5795(2007)12-0003-0006 近20年来,语料库的创建和应用取得了长足发展。对应语料库大都在上世纪九十年代开始创建,起步较晚,但已展现出广阔的应用前景。在欧美,这类语料库有十多个,涉及近20个语种,如H ansard(法-英对应语料库)和ENPC (英语-挪威语对应语料库)(V ron is 2000:14-15);在中国,有中科院计算所的大规模汉英对应语料库、北京大学的/B ABLE 汉英平行语料库0,以及北京外国语大学的/通用汉英对应语料库0(该库现有可检索语料2千万字/词以上,见王克非2004a),后者是本项研究使用的主要工具。对应语料库的创建有两个主要目的:一是用于语言与翻译研究,二是用于外语教学。用于前者的研究成果丰富,涉及语言对比、双语词典编纂和翻译研究(Lav i o sa 1997;Baker 1999;Serpellet 2000;H unston 2002)。用于后者尤其是用于翻译教学的研究也已取得不少成果,如Zanetti n 1998、Pearson (2003:15-24)和Bernardini (2004b :97-111),但大都研究平行语料为翻译训练提供的可能的资源和手段,还没有研究探讨大型对应语料库在课堂教学中的实际应用问题。 1 研究内容 有关运用语料库提高翻译效率和质量的研究还没有全面展开,而将对应语料库应用于翻译教学的研究则是刚刚开始(Bo w ker 2003;Ber nardi n i 2004b)。从理 论上看,语料库用于教学有利于自主学习环境的创建(Bernardini 2004a :22;秦洪武、王克非2007)。自主性学习主要表现在两个方面:研究性学习和发现式学习(learning as discovery)。前者假定学习者和教师研究兴趣相投、研究能力相当;后者则鼓励学习者自行调节兴趣点,并给他们提供机会来提高自己观察和处理问题的能力,使他们对两种语言的特征和差异有敏锐的觉识。本文认为,研究和发现虽不矛盾,但在以技能培养为核心的翻译教学中,不宜过分强调学生的研究能力,发现式学习这一提法更合适一些。 近年来,国内也有研究关注语料库在翻译教学中的应用问题。有些研究探讨了语料库在翻译教学中的用途(郭红2004;于连江2004;王克非2004b),但还没有研究系统地探讨对应语料在课堂教学中的应用方式和应用效果,也没有研究关注学生对于语料使用的态度。鉴于此,我们以/通用汉英对应语料库0为翻译教学平台,探讨在现有技术条件下翻译语料用于翻译教 作者简介:王克非:男,教授,博士生导师。研究方向:语言学、翻译学。 秦洪武:男,教授,博士。研究方向:语言学、翻译学。王海霞:女,讲师,硕士。研究方向:翻译学。 收稿日期:2007-03-18 基金项目:本文是国家社科基金课题/基于大型英汉对应语料库的翻译研究与翻译教学平台0的阶段性成果(编号05BYY 013),并获得曲阜师范大学科研启动基金资助(编号Bsqd2007022)。 # 3#第118期2007年12月 外语电化教学 C AFLE N o .118D ec . 2007

桂诗春等-2010-语料库语言学与中国外语教学

2010年11月November 2010 第33卷第4期Vol.33No.4 现代外语(季刊) Modern Foreign Languages (Quarterly )语料库语言学与中国外语教学 桂诗春 冯志伟杨惠中何安平卫乃兴李文中梁茂成 [编者按] 为推动我国应用语言学研究的新发展,教育部人文社科重点研究基地———广东 外语外贸大学外国语言学及应用语言学研究中心于2010年9月24-25日成功举办了“首届广外应用语言学论坛”,庆贺我国著名语言学家、应用语言学学科的开拓者桂诗春教授八十华诞。期间,举行了题为“语料库语言学与外语教学”的高层论坛,就语料库语言学的现状、发展前景及语料库的建设、共享、应用等展开了互动讨论。以下是根据专家发言,整理后的主要内容。 [中图分类号]H319 [文献标识码]A [文章编号]1003-6105(2010)04-0419-08 语料库语言学的发展前景与资源共享 广东外语外贸大学 桂诗春 1.语料库语言学的发展前景 语料库语言学在外国和国内都发展很快,有的人选择了它作为发展方向,因为它的入门比较容易,上手较快;有的人把语料库语言学作为收集数据的重要手段。但是总的来说,我们的语料库研究还处在比较初级阶段,需要提高。究其原因是很多人把它看成是一种工具或手段,可以运用现有的一些现成的程序和公开的语料库,如Brown ,LOB ,Frown. Flob , BNC ,CLEC ,只要选题得当,就能获得很多量化的数据,从而写出洋洋洒洒的文章来。在计算机和扫描仪的支持下,自行收集一些语言素材,建立一个特定的语料库,也不是什么难事。 我觉得,语料库语言学既是一种工具,但更是一门学科;它是对语言行为进行概率性归纳和概括的一门学科,它本身是跨学科性的,要做语料库语言学研究必须许多方面要有比较雄厚的基础。首先是数学和统计学。Herdan (1960)的一本早期著作,叫做《词次/词型数学》(Type /token Mathematics ),其副标题就是《数理语言学教科书》(A Textbook of Mathematical Linguistics ),当时还是前计算机 时代,但Herdan 觉得有两件语言事实值得我们注意:一是大量语言资料(language in mass ),二是语言排列(language in line ),它们是任何语言运作都不能离开的两个方面。某些语言学研究分支如果考虑到这两个方面,将会从中获益。当时还没有真正的机读语料库, Brown 的语料库在1967年才面世,美国心理 学家John Carroll 根据该语料库以及他后来参与制作500万词的AHI 语料库,所提出的词汇频数对数正态模型(lognormal model )均源于Herdan 所奠定的基础。一直到最近美国Barber 利用计算机对英语语体的各种研究,更是利用了因子分析的统计方法。其次是计算机科学。语料库的发展离不开现代科学技术,其主要表现是个人电脑、扫描仪和大容量硬盘的普及,当初Brown 语料库要动用到大型电脑,而到如今,只需一万元左右就能在家里拥有这些设备,制作出甚至比Brown 还要大的语料库。但是我们往往只注意到硬件部分,而不认识到软件的建设。从事语料库语言学研究的人而不掌握一到两种编成语言,也不可能拓展他们的研究领域,因为他不能根据个人的研究需

《双语平行语料库在翻译教学上的用途》评述

攻读博士、硕士学位研究生试卷(作业)封面(2016 至2017 学年度第一学期) 学号 姓名 题目《双语平行语料库在翻译教学上的用途》评述 课程名称语料库语言学 专业英语语言文学 入学年月2016年9月 培养方式 全日制□非全日制

题目:双语平行语料库在翻译教学上的用途。 作者:王克非,曾任北京外国语大学外国语言研究所副所长、中国外语教育研究中心常务副主任,现任《外语教学与研究》杂志主编,博士生导师,研究方向为语言学和翻译研究。 研究问题:本文以北京外国语大学建成的通用汉英平行语料库为例,探讨如何在翻译教学中运用双语平行语料库、如何处理翻译教学与双语平行语料库的关系、双语平行语料库对译者有何帮助、以及译者如何在翻译教学中运用双语对译检索(词语的对译检索、结构的对译检索和语句语篇的对译检索)时找到合适的对译,提高他们的英语语感,掌握正确的翻译方法。 研究方法: 本文根据北京外国语大学中国外语教育研究中心建成的通用汉英平行语料库(3000万字词)为例,探讨它在翻译教学上的用途。首先,本文作者采用了随机抽取的方法对克服(overcome)和找(find)进行了检索,找到了他们不同的翻译方法和用法;然后作者通过举例说明汉语中把字句结构的三种形式如何在英语中翻译;最后作者从台湾大学高建明所建的英汉平行语料库中,以“他心情很低落”为例,从语料库中找到相近的中英文短句、句子,找到了表示“心情低落”的各种不同词汇和方法。 结论:在翻译的教学和实践中,双语平行语料库和检索工具的运用不仅给译者提供了方便,而且使他们掌握了一种科学、多样的翻译方法。同时也能激发学生的兴趣,让学生在不同版本的对译中互相学习。这表明双语平行语料库是翻译教学中的一种重要的学习资源,应当引起

语料库语言学术语汇编Aglossaryofcorpuslinguistics.docx

语料库语言学术语汇编 ( V2.0 ) Last updated 2012-10-08 by许家金 Aboutness所言之事 Absolute frequency绝对频数 Alignment (of parallel texts)(平行或对应)语料的对齐Alphanumeric字母数字构成的 Annotate标注(动词) Annotated text/corpus标注文本 /语料库、赋码文本/语料库Annotation标注(名词) Annotation scheme标注方案 ANSI/American National Standards Institute美国国家标准学会 ASCII/American Standard Code for Information美国信息交换标准码 Exchange Associates (of keywords)(主题词的)联想词 AWL/academic word list学术词表 Balanced corpus平衡语料库 Base list/baselist底表、基础词表 Bigram二元组、二元序列、二元结构 Bi-text/bitext双语合并文本、双语分行对齐文本 (一句源语一句目标语对齐后的文 本) Bi-hapax两次词 Bilingual corpus双语语料库 Bootcamp debate/discourse/discussion(新手)训练营大辩论 /话语 /大探讨CA/Contrastive Analysis对比分析 Case-sensitive/case sensitivity大小写敏感、区分大小写 Category-based approach基于类(范畴)的方法 Chi-square test/ 2χ卡方检验 Chunk词块 CIA/Contrastive Interlanguage Analysis中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-CLAWS 词性赋码系统 tagging System Clean text policy干净文本原则 Cluster词簇、词丛 Colligation类联接、类连接、类联结 Collocate n./v.搭配词;搭配 Collocability搭配强度、搭配力 Collocation搭配、词语搭配 Collocational strength搭配强度 Collocational framework/frame搭配框架 Collocational profile搭配概貌

基于COCA语料库的汉英翻译教学探索

龙源期刊网 https://www.360docs.net/doc/8f3330264.html, 基于COCA语料库的汉英翻译教学探索 作者:张静华 来源:《读与写·上旬刊》2017年第11期 摘要:本文通过翻译教材中真实的案例,探索了COCA语料库在语料库中的运用,可以帮助审核地道的译文表达,培养学生的批判性思维。在线开放COCA语料库为汉英翻译教学提供了丰富的教学资源和便捷的教学手段。 关键词:COCA;语料库;翻译教学;批判性思维 中图分类号:G648 文献标识码:B 文章编号:1672-1578(2017)11-0240-01 自20世纪90年代以来,语料库翻译学逐渐形成了自己独特的研究领域和研究方法,研究内容在不斷地拓展和深化(胡开宝,2011)。在计算机技术和网络技术迅速发展的时代,语料库在翻译教学中的运用可以弥补传统翻译教学的不足。本文探索COCA语料库在汉英翻译教学中的应用,COCA语料库为翻译教学提供了丰富的教学资源和便捷的教学手段。 1.COCA语料库与译文的真实性 语料库可以真实地展现社会中运用的语料,语域全,文本量大,可以有效地避免个人在语言运用中的主观判断和偏见。美国当代英语语料库COCA(Corpus of Contemporary American English)是Mark Davies教授负责开发的最新当代英语语料库,涵盖当代口语、小说、流行杂志、报纸和学术期刊五大类型,基本均匀平衡分布,每年更新,规模大而且免费在线使用。利用COCA主要搜索功能,共现动态语境,可以帮助学生提高翻译的准确性和连贯性。例如,陈宏薇、李亚丹编著《新编汉英翻译教程》(第2版)("十二五"普通高等教育本科国家级规划教材),第三章词语的英译中翻译练习有一例: 例(1)湖色越远越深,由近到远,是银白、淡蓝、深青、墨绿,非常分明。 Father still, the lake water seems darker, changing from silver white near at hand through light blue, deep blue, finally to dark green, all being very distinct. 其中"银白"英译为"silver white",在COCA语料库中搜索silver white,使用频率并不高"11",而在COCA语料库中搜索silvery white,使用频率达到"27",而且近年来一直在使用,大于"silver white"使用频率"11"。由此,可以进一步改进参考译文中"银白"的表达,修订为"silvery white"。 2.COCA语料库与学生批判性思维

王克非 语料库翻译学的几个术语

2007年11月第23卷 第6期 四川外语学院学报 Journal of Sichuan I nternati onal Studies University Nov.,2007 Vol.23 No.6语料库翻译学的几个术语 王克非1 黄立波2 (11北京外国语大学中国外语教育研究中心,北京 100089; 21西安外国语大学英文学院,陕西西安 710061) 提 要:语料库翻译学,即基于语料库的翻译研究,关注翻译共性问题。主要阐述语料库翻译学关于翻译共性研究的几个术语,并评介相关论点。 关键词:语料库翻译学;共性;简化;显化;隐化;范化;整齐化 中图分类号:H31519 文献标识码:A 文章编号:1003-3831(2007)06-0101-05 Ter m s i n Corpus2Ba sed Tran sl a ti on Stud i es WANG Ke2fei HUANG L i2bo Abstract:Issues of translati on universals have recently been discussed in cor pus2based translati on studies.The paper ex2 pounds s o me ter m s in this disci p line including translati on universals,si m p lificati on,ex p licitati on,i m p licitati on,nor maliza2 ti on and leveling out,and makes brief co mments on the vie wpoints inv olved. Key words:cor pus2based translati on studies;translati on universals;si m p lificati on;ex p licitati on;i m p licitati on;nor malizati on; levelling out 语料库翻译学,又称基于语料库的翻译研究,是近十多年随语料库语言学发展起来的新学科分支,包括方法论或工具层面上的应用研究、描写性研究和关于翻译特征的抽象性理论研究。它在研究方法上以语言学和翻译理论为指导,以概率和统计为手段,以双语真实语料为对象,对翻译进行历时或共时的研究,代表了一种新的研究范式,产出了一批研究成果,加深了人们对翻译现象的认识,值得我们关注。本文讲解这一学科有关翻译共性研究的几个基本术语,希望有助于读者的了解。 一、语料库翻译学 语料库翻译学是指根据特定的研究目标,建立以真实翻译语料为主的语料库(包括单语类比语料库(monolingual co mparable cor pus)和双语/多语平行语料库(bilingual/multilingual parallel cor pus)、翻译语料库(translati onal cor pus)等几种类型)。这类语料库在标注上比一般语料库复杂。如翻译语料库需要对翻译文本、译者信息等要素加以详细标注,对应语料库需要对两种语料作句子或某种层级上的对齐处理,类比语料库需要对文体、主题、作者、译者等要素加以标注。语料库翻译学以电子文本为基础,以计算机统计为手段,对各类翻译现象进行大范围的或特定范围的描写,在充分描写的基础上,探究两种语言及其转换的过程、特征和规律,分析和解释翻译现象或验证关于翻译的种种假说。从本质上讲,语料库翻译学是描写性翻译研究(Descri p tive Translati on Studies)与语料库语言学(Cor pus L inguistics)相结合的跨学科产物。 语料库用于翻译研究最早可以追溯到20世纪80年代(Lavi osa,2002:1,21),但通常认为,Baker (1993:233-250)的“Cor pus L inguistics and Transla2 ti on Studies:I m p licati ons and App licati ons”一文是语料库翻译研究范式(Cor pus2based Translati on Studies Paradig m)开始建立的标志。1998年,加拿大蒙特利尔大学主办的翻译研究季刊MET A出版了Sara Lavi osa主编的基于语料库的翻译研究专号MET A43 (4),从理论阐释和实证研究两方面宣告基于语料库的翻译研究已经成为一个新的翻译研究范式。以Baker(1993)为标志,语料库翻译学可划分为前语料库和基于语料库的两个时期(Lavi osa,2002;O l ohan, 2004),前者是指大规模机读翻译文本用于翻译研究之前,通过人工采集原文和译文文本,并对与翻译有关的语言现象进行对比、分析和统计的时期。基于语料库的翻译研究范式产生以来,其研究范围覆盖了从翻译过程到翻译产品的各种翻译现象,特别是翻译共性(Translati on Universals)、翻译过程(translati on p r ocess)、翻译转换与规范(translati on shift and trans2 lati on nor m s)、译者文体(translat or’s style)、翻译教学等诸多方面。新的研究方法促进范式的形成和发展, 101

相关文档
最新文档