中国英语学习者语料库CLEC(桂诗春杨惠中)

合集下载

语料库相关源

语料库相关源

语料库相关资源David Lee语料库研究书签Bookmarks for Corpus-based Linguists (David Lee).au/~dlee/CBLLinks.htm (/corpora)常用语料库资源链接汇集(语料天涯)/corpus/互动平台/forum/入门读物专著梁茂成、李文中、许家金,2010,《语料库应用教程》。

北京:外语教学与研究出版社。

Hunston, Susan. 2002. Corpora in Applied Linguistics. Cambridge: Cambridge. University Press. (世界图书出版社引进)Kennedy, Graeme. 1998. An Introduction to Corpus Linguistics. London: Longman. (外研社引进)期刊论文中国期刊网EBSCO英文期刊数据库书店可以买到的语料库相关书籍Aijmer, K. & B. Altenberg (Eds.). 2004. Advances in Corpus Linguistics. Papers from the 23rd International Conference on English Language Research on Computerized Corpora (ICAME 23). Amsterdam: Rodopi. (世界图书出版社引进)Austermühl, F. 2001. Electronic Tools for Translators《译者的电子工具》. Manchester: St.Jerome Publishing. (外研社引进)Biber, Douglas, Stig Johansson, Geoffrey Leech, Susan Conrad & Edward Finegan. 1999.Longman Grammar of Spoken and Written English. Longman Publications Group.(外研社引进)Biber, Douglas, Susan Conrad & Randi Reppen. 1998. Corpus Linguistics. Cambridge: Cambridge University Press. (外研社引进)Connor, U & T. Upton (Eds.). 2004. Applied Corpus Linguistics: A Multidimensional Perspective. Amsterdam: Rodopi. (世界图书出版社引进)Granger, S. & S. Petch-Tyson (Eds.). 2003. Extending the Scope of Corpus-based Research: New Applications, New Challenges. Amsterdam: Rodopi. (世界图书出版社引进)Granger, S. et al. (Eds.). 2003. Corpus-based Approaches to Contrastive Linguistics and Translation Studies《基于语料库的语言对比和翻译研究》. Amsterdam: Rodopi. (外研社引进)Gries, Stefan Thomas. 2004. Multifactorial Analysis in Corpus Linguistics: A Study of Particle Placement. Beijing: Peking University Press. (北大出版社引进)Hunston, Susan. 2002. Corpora in Applied Linguistics. Cambridge: Cambridge. University Press. (世界图书出版社引进)Kennedy, Graeme. 1998. An Introduction to Corpus Linguistics. London: Longman. (外研社引进)Kettemann, B. & G. Marko. 2002. Teaching and Learning by Doing Corpus Analysis.Amsterdam: Rodopi. (世界图书出版社引进)Meyer, Charles. 2002. English Corpus Linguistics: An Introduction. Cambridge: Cambridge University Press. (外教社引进)Mukherjee, J. 2001. Form and Function of Parasyntactic Presentation Structures. A Corpus-based Study of Talk Units in Spoken English. Amsterdam: Rodopi. (世界图书出版社引进)Nattinger, James R. & Jeanette S. DeCarrico. 1992. Lexical Phrases and Language Teaching. Oxford: Oxford University Press. (外教社引进)Sinclair, John. 1991. Corpus, Concordance, Collocation. Oxford: Oxford University Press.(外教社引进)Thomas, Jenny & Mick Short. 1996. Using Corpora for Language Education. London: Pearson Education. (外研社引进)Zanettin, F., et al. (eds.). 2003. Corpora in Translator Education《语料库与译者培养》.Manchester: St. Jerome Publishing. (外研社引进)蔡金亭,2003,《语言因素对英语过渡中使用——一般过去时的影响》。

语料库与语料库建设

语料库与语料库建设

语料库和语料库建设一、什么叫语料库1、定义语料库,通俗意义上指的是语言材料库。

严格意义上的语料库(corpus)是指按照一定的语言学原则,运用随机抽样方法,收集自然出现的连续的语言运用文本或话语片断而建成的具有一定容量的大型电子文本库。

目前,语言学家对于语料库的定义不尽相同,如辛克莱(Sinclair)认为语料库是“按照明确的语言学标准选择并排序的语言运用材料汇集,旨在用作语言的样本”。

阿特金斯等(Atkins & Clear)认为语料库是“按照明确的设计标准,为某一具体目的而集成的大型文本库”。

赫努(Renouf)认为语料库是“由大量收集的书面语或口头语构成,并通过计算机储存和处理,用于语言学研究的文本库”。

我们看到,以上关于语料库的几种定义相同之处在于都谈到语料库是语言材料的汇集;不同之处在于前两个定义指出语料库的设计是有明确的设计标准的,赫努的定义明确指出语料库“通过计算机储存和处理”这一特点。

语料库不同于电子文档,语料库的建设有特定的研究目的和具体用途,因此在语料抽样范围和文类覆盖方面都力求取得平衡,在收集语料时需要考虑到每一文类、体裁、语域、主题类型等的抽样比例。

而大型文档目标在于搜集任何可获得的语言材料或所限定的数种文类语料,其语言材料之间的关系较为松散。

语料库具有以下特征:1、语料库的设计与建设有系统的语言学理论指导,语料库的开发具有明确而又具体的目的;如,布朗语料库用于对20世纪60年代的美国英语的研究,LOB是与布朗语料库对齐的同时期的英国英语语料库,可用以对英国英语进行研究,也可与布朗语料库加以对比进行美国英语和英国英语的对比研究。

2、语料库的语料是按照明确的语言学原则采用随机抽样的方法得到的语言运用的自然语料,不是随意的语言材料的堆积,更不是由某个个人杜撰出来的。

语料库的容量和语料采用随机抽样方式都保证了语料具有代表性,由此保证基于语料库的语言研究的科学性、客观性。

语料库在大学英语写作教研中的应用评析

语料库在大学英语写作教研中的应用评析
2 0 1 4年 2月 第3 3卷第 2期
黑龙江教育学院学报
J o u na r l o f H e i l o n g j i a n g C o l l e g e o f E d u c a t i o n
F e b . 2 0 1 4 V0 1 . 3 3 No . 2
随着英语语 言学 习在我 国的发展 , 英语学习者语料库在 英语语言学习 和研 究 方面 的重要 作用 开 始逐 步得 到认 可。 2 O 世纪 7 O年代末 、 8 O 年代初 , 我国 的学 者开始建 设 了一些
学 习者语料库 , 如 国 内最 早的英 语语 料库 , J D E S T交 大科技


语料库的建设与应用现 状
创建 了 中 国学 习 者 英 语 语 料 库 C L E C( 桂诗春、 杨 惠 中,
2 0 0 3 ) …, 中国学生英 语 口笔 语语料库 S WE C C L ( 文秋芳 、 王 立非 、 梁茂成 , 2 0 0 5 ) j , 中国大学生 口语语 料库 C O L S E C ( 杨
内相 关 研 究 提 供 了 较 为 科 学 的 理 论 依 据 。梁 茂 成 ( 2 0 0 3 ) J 、 谢家成 ( 2 0 0 3 ) 对个 人教学 语料库 的建 设在 方 法上进行了较为详尽 的论述 , 并对工具的使 用作了说明。国 内学者在语 料库建设 方面 的宝贵经验 为其他研 究者提供 了 可靠的依据 , 并使得 自建学习者书面语料库在英语教学 中的
象进行 系统的分析 , 语料库语言学 的研究方法 因其真 实系统 性逐渐得到人们的认 同, 经过语 料库 量化地加 工整 理 , 人们
者 的英语语言使用特 点奠 定了宝贵 的数据基础。

近十年国内外学习者语料库建设情况及研究述评

近十年国内外学习者语料库建设情况及研究述评

摘 要:本文通过对学习者语料库相关文献的搜索和整理,对近十年国内外学习者语料库建设情况进行了重点介绍,同时对基于学习者语料库的二语习得相关研究进行了探讨,旨在对我国学习者语料库的建设和相关研究提供借鉴。

关键词:学习者语料库;二语习得;英语学习[中图分类号]H319.3[文献标识码]A[文章编号]1006-2831(2015)02-0052-6 doi:10.3969/j.issn.1006-2831.2015.01.014苏晓俐(四川外国语大学,四川 重庆 400031)收稿日期:2014-11-29;修改稿:2014-12-101. 概述语料库语言学的研究开始于20世纪50年代,之后该领域的研究者逐渐增多,语料库的研究开始与大多数语言研究相关领域相结合,这一结合的主要贡献之一为变体研究,包括语言媒介变体研究(口语变体与笔语变体),语场变体研究(一般文体与专门化语体)以及地理地位变体研究(世界英语)。

然而,对外语/二语学习者语言变体的语料库研究直到20世纪90年代初才逐渐兴起(Granger, 2003: 538)。

学习者语料库主要是指经过计算机处理的外语学习者的语言产出的数据库(Leech, 1998: 3),本文将对近十年国内外学习者语料库的发展现状和基于学习者语料库的二语习得相关研究作一个评述。

2. 学习者语料库的建设情况经过三十多年的发展,学习者语料库的建设在全世界范围内掀起一股热浪。

在学习者语料库研究颇有建树的研究团队代表是由比利时Louvain-La-Neuve 大学的Sylviane Granger 教授所创建的英语语料库语言学中心(Center for English Corpus Linguistics ),简称CECL 。

根据C E C L 的不完全统计,截止到2014年11月14日,全世界学习者语料库已经达到136个,涉及的语言包括英语、汉语、捷克语、阿拉伯语、荷兰语、法语、德语、匈牙利语、朝鲜语、挪威语、西班牙语、意大利语等十几种,媒介方式由之前的以笔语为主逐渐向多媒介方式转变,包括口语(spoken )、笔语(written )、多媒体(m u l t i m e d i a )以及计算机中介交流(computer-mediated communication ,简称C M C ),收录的语料丰富多样,例如学生习作、访谈、演讲、测试等,涵盖了从语言初学者到熟练使用者不同层次的语言学习者(http://www.uclouvain.be/en-cecl-lcworld.html )。

中国学生英语作文中情态动词的使用情况_一项基于语料库的研究_程晓堂

中国学生英语作文中情态动词的使用情况_一项基于语料库的研究_程晓堂
L O C N E S S 95218 语料库
表 1 本研究所使用语料库情况
总词数 学生教育水平 作文类型 大学一 、二 S t 3 209043 年级非英语 专业学生 大学三 、四 S t 4 212855 年级非英语 专业学生 E x a m ( C E T -4) 常见作文题目 G e t t i n gt o k n o wt h ew o r l do u t s i d e ; H e a l t h g a i n s i nd e v e l o p i n g c o u n t r i e s ; g l o b a l s h o r t a g e o f w a t e r ;e t c . H a s t em a k e s w a s t e ; E x a m M yv i e wo nj o b h o p p i n g ; c a m p u s ;e t c . E u r o p e a ni n t e g r a t i o n ; F r e e E u t h a n a s i a ; P r a y e r i n p u b l i cs c h o o l s ; e t c . ( C E T -6) G e t t i n gt ok n o wt h ew o r l do u t s i d et h e
所选取的 40个 E D 来自于 M c E n e r y 和 K i f l e ( 2002: 194 -195) 所总结的词表 , 包括 11个形容 词 ( 如 p o s s i b l e ) 、 8个 名词 ( 如 c e r t a i n t y ) 、 11 个副词 ( 如 p r o b a b l y ) 及 10个动词 ( 如 a s c e r t a i n ) 。

英语专业学生写作中的词汇错误分析——一项基于语料库的研究

英语专业学生写作中的词汇错误分析——一项基于语料库的研究
理 论 。Ne e 17 ) 和 T rn 1 8) 认 为, 大 多 数 语言 名词词组、代词 、形容词词组、副词、介词词组、连词、词汇、 msr(9 1 a o e(9 3
学 习者总是处于中介语 连续体 的某个 阶段 ,因此学 习者在二语 搭配和句法共 1 类错误,其 中词形失误包括拼写、构词及大小 l
犯错误 是其验证 所学第二语言假设 的方法。 ”错误分析把语言 包 括不存在 的外语词和存在 的外语词 错误,存在的外语词错误
学 习者作为研 究 中心 ,将犯错误 看作是外语学 习的必 然过程, 又分为概念错误、 语体错误和搭配错 误。5 【桂诗春、 杨惠中(0 3 20) 揭示了第二语言或外语学习的一般规律,丰富了第二浯言习得 在 《 中国学习者英语语料库》中把语言错误分为词形、 动词词组、
CE E中国电力教育 P
而 丽
D OI编 码 :1 .9 9jis .0 7 0 92 1 .11 1 03 6 /.sn 10 —0 7 .0 03 .0
英语专业学生写作 中的词汇错误分析

项基于语料库的研究
罗利 丽
摘要 : 作为语料分析的重要方法,错误 分析不仅有助于了 解学习者第二语言的掌握程度及学习策略,而且对促进二语教学具有重要 意义。本文采用定量分析方法,对中国学习者英语语料库中英语专业学生作文的词汇错误进行分析,结果表明 : 词汇错误频率最高的是 拼 写错误,占错误总数的 4 .5%,其次是替代错误 ; 500 不同水平学生所犯词汇错误的数量差异非常显著。 关键词 : 错误 分析 ; 词汇错误 ; 英语专业学生 ; 英语写作 作者简 介 : 罗利丽 (9 5 ) 18 - ,女,江西上饶人,宁波 大学外国语学院硕士研究生,主要研究方向 : 英语教育。( 浙江 宁波 551) 121

英语语料库建设及应用研究:现状与趋势

英语语料库建设及应用研究:现状与趋势

英语语料库建设及应用研究:现状与趋势叶章勇【摘要】田野语言学(field linguistics)已取代沙发里的语言学(armchair linguistics)成为现代语言学研究的主流,语料库成为语言学研究及语言工程不可或缺的基础资源,国外在英语语料库研究方面起步较早,已形成完善的语料库研究规范,我国在借鉴国外经验的基础上结合我国国情及英语学习者实际对英语语料库建设、语料库语言学、语料库翻译学等方面开展了广泛的研究并取得丰硕成果.基于对国内外英语语料库建设现状及趋势的研究,我们应当在今后的英语语料库建设中更高程度地凸显其跨学科性,更多地关注语料库建设规范化、多模态化及智能化.【期刊名称】《宁波广播电视大学学报》【年(卷),期】2014(012)001【总页数】5页(P31-35)【关键词】英语语料库;现状;趋势【作者】叶章勇【作者单位】宁波职业技术学院浙江宁波315800【正文语种】中文【中图分类】H312一、引言自17世纪以来,由于受经验主义 (empiricism)影响,由内省法主导的传统“沙发里的语言学”(armchairlinguistics)(Charles J.Fillmore 1992:35)走入低谷,语言研究开始重视研究自然发生的语料,大量收集真实语言数据,在客观分析语言现象的基础上进行相关实证研究。

这种基于真实语料的语言研究在19世纪得到了进一步发展,人们尝试运用类似于自然科学研究方法收集真实语言数据,进行描述及探讨,重构语言之间的谱系关系。

20世纪初,受实证主义和行为主义思潮的影响,这种欧洲传统被美国结构主义语言学继承,经验主义在语言研究中逐渐占据主导地位。

经验主义认为:语言学研究的主要素材是语料,而大量收集某种语言中自然出现的语言实例,对研究该语言不仅是必要的,也是充分的 (Geoffrey Leech 1991:8)。

这种研究方法需要大量收集某种语言中的语句,组成一个语料库。

基于语料库的英语专业学习者动名搭配行为特征的研究

基于语料库的英语专业学习者动名搭配行为特征的研究

基于语料库的英语专业学习者动名搭配行为特征的研究作者:郑玲晓吴甜甜来源:《亚太教育》2015年第17期摘 ;要:本文利用中国学习者英语语料库(CLEC)和英国学术书面语语料库(BAWE)调查了中国英语专业学习者和英语本族语者动名搭配行为的特征。

研究结果显示:(1)中国英语专业学习者与knowledge搭配使用最多的是learn、have、get等动词,而英语本族语者与knowledge搭配使用最多的是gain、acquire、require等动词。

(2)与英语本族语者相比,中国英语专业学习者在与knowledge进行搭配的高频动词使用上存在差异,比较倾向于使用同义替换,且母语迁移现象严重。

关键词:中介语;学习者语料库;动名搭配;个案研究一、引言随着二语习得研究的深入,搭配(collocation)作为一项重要的研究内容,已经引起国内外研究者的广泛关注。

英国语言学家Firth(1957)所说的“You shall know a word by the company it keeps”更指出了词汇搭配的重要性。

近十几年来,随着语料库的建设与发展,越来越多的学者开始尝试利用语料库进行词汇搭配研究,这对英语教学大有裨益。

从目前的研究现状来看,有不少国内学者(如王立非、梁茂成 2007;许家金、吴良平 2014)对语料库的使用做过介绍,且越来越多的学者(如卫乃兴 2002;张文忠、杨士超 2014)开始使用语料库数据进行中国英语学习者的词语搭配研究,这极大地丰富了我国词汇搭配研究领域的相关成果。

在中国学习者书面语语料库(CLEC)中,动名搭配偏误被标注为[cc3] (桂诗春 2005),是所有搭配偏误类型中出现最多的(夏立新等 2014:68),这是本研究选取动名搭配进行研究的一个重要原因。

经过统计,中国学习者动名搭配偏误频数最高的是learn这个动词,其次是knowledge (夏立新等 2014:68)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中国英语学习者语料库 CLEC收集了包括中学生、大学英语4级和6级、专业英语低年级和高年级在内的5种学生的语料一百多万词,并对言语失误进行标注。其目的就是观察各类学生的英语特征和言语失误的情况,希望通过定量和定性的方法对中国学习者英语作出较为精确的描写,为我国学生的英语教学提供有用的反馈信息。

表1 CLEC语料分布 类型 词次 ST2 208088 ST3 209043 ST4 212855 ST5 214510 ST6 226106 总计 1070602

言语失误标注 原则 1. 简单合理,易于系统操作。参与标注的人比较多,分类表过于繁复,就难于掌握。我们采取两级分类,第一级有11类:词形(fm)、动词短语(vp)、名词短语(np)、代词(pr)、形容词短语(aj)、副词(ad)、介词短语(pp)、连词(cj)、词汇(wd)、搭配(cc)、句子(sn)。每一类里再用数目字细分。如[cc]为词语搭配不当,[cc1]表示名词和名词的搭配,[cc2]表示名词和动词的搭配,[cc3]表示动词和名词的搭配,等等。

2. 分类表的类别要适中。过粗容易统一,但信息太少,不利于分析学习者的失误/过细难以统一,容易把同一种失误归到不同类别。目前我们采取的办法是对常见的失误从细(如vp和np都有9小类),对少见的失误从粗(如cj只有两小类)。现在的分类表有61个失误码,是属于中等规模的分类表。

提供足够的失误信息(失误本身、失误类型和失误发生范围)。例如In the past, people are [vp6, 4-] kind to each other…, 失误用方括号表示,放在失误之后。 [vp6]为vp(动词)第6种(时态)失误,4-为失误发生的范围,-表示失误的位置,4表示失误前有4个词。要联系这4个词,才能判断are这个词用错了。

开放性。容许研究者根据需要对失误类型进行补充或进一步再分出细类。例如[sn8]为句子结构有缺陷,研究者可以对这种失误再分为若干细类来研究。这需要把sn8的失误全部检索出来,然后定出第三级的分类范畴,如sn81,sn82,等等。 5. 对语体或失误的来由暂不作标注,因为这需要标注者较多的主观判断,更难以统一。

言语失误分类表(总数:61) 词形 动词短语 名词短语 代词 码 类型 码 类型 码 类型 码 类型 fm1 Spelling vp1 pattern np1 pattern pr1 Reference

fm2 word building vp2 set phrase np2 set phrase pr2 anticipatory it fm3 capitalization vp3 agreement np3 agreement pr3 Agreement vp4 finite/non-finite np4 case pr4 Case vp5 non-finite np5 countability pr5 wh- vp6 tense np6 number pr6 Indefinite vp7 voice np7 article vp8 mood np8 quantifiers vp9 modal/auxiliary np9 other determiners 形容词短语 副词 介词短语 连词 码 类型 码 类型 码 类型 码 类型 aj1 pattern ad1 order pp1 pattern cj1 pattern

aj2 set phrase ad2 modification pp2 set phrase cj2 set phrase aj3 degree ad3 degree aj4 -ed/-ing confusion aj5 predicative/attributive 词语 搭配 句子 码 类型 码 类型 码 类型 wd1 order cc1 noun/noun sn1 run-on

sentence wd2 part of speech cc2 noun/verb sn2 sentence fragment wd3 substitution cc3 verb/noun sn3 dangling modifier wd4 absence cc4 adj/noun sn4 illogical comparison wd5 redundancy cc5 verb/adv sn5 topic prominence wd6 repetition cc6 adv/adj sn6 Coordination wd7 ambiguity sn7 Subordination sn8 structural deficiency sn9 Punctuation 标注说明 码 分 类 类 别 说 明 fm1 word Spelling(拼写) spelling, coinage, abbreviation, apostrophe fm2 word word building(构词) derivation, inflection, compounding, plurality (noun), irregularity(verb), 3rd person singular form(verb), syllabification, hyphenation, word division or fusion

fm3 word Capitalization(大小写) lower initial letter for upper initial letter or vice versa vp1 vb phr Pattern(及物性型式) error in transitivity(vi as vt or vice versa), transitive verb pattern/ grammatical(cf Oxford advanced learner’s dictionary of current English edited by A. S. Hornby)

vp2 vb phr set phrase(固定词组) phrasal verb and verbal phrase: error in form or use vp3 vb phr Agreement(主谓一致性) number agreement with its subject (noun or pronoun) vp4 vb phr finite/non-finite(定式) finite verb for non-finite verb or vice versa vp5 vb phr non-finite(不定式) infinitive error: form and use/ infinitive for participle or vice versa/ -ed participle for -ing participle or vice versa vp6 vb phr Tense(时态) error in tense use within a sentence/ the sequence of tenses between sentences vp7 vb phr voice (语态) error in the use of voice: active for passive or vice versa vp8 vb phr Mood(语气) error in the use of mood: imperative, subjunctive/ improper structure of conditional sentences vp9 vb phr modal/auxiliarymisuse of modal/auxiliary verbs/ wrong (情态) form of modal verb(or auxiliary verb) and verb combination (e.g tense form, voice form, etc) np1 nn phr Pattern(名词型式) Error in combination with other words/grammatical np2 nn phr set phrase(固定词组) omission or replacement of a fixed element that goes after a certain noun np3 nn phr Agreement(主谓一致性) number agreement of a noun with its determiner or a word that refers to it np4 nn phr Case(格) possessive case error: form or use np5 nn phr Countability(可数性) uncountable noun used as countable noun np6 nn phr Number(数) countable noun used with no determiner or -s/ a or -s with plural noun np7 nn phr Article(冠词) a/an confusion or definite/indefinite confusion np8 nn phr Quantifiers(数量词) misuse or confusion between many/much, (a) few/(a) little, some/any, etc

np9 nn phr other determiners(其他限定词) misuse or confusion of demonstratives, wh- determiners, numerals, etc.

pr1 pron Reference(指称) incorrect/ambiguous pronoun reference/anaphoric pr2 pron anticipatory it(先行it) improper or wrong use of anticipatory it / it replaced by a demonstrative,

etc pr3 pron Agreement(主谓一致性) number agreement with a noun it refers to pr4 pron Case(格) case error of any personal pronoun pr5 pron wh-(wh-代词) misuse or confusion of interrogative, relative and conjunctive pronouns pr6 pron Indefinite(不定式) misuse or confusion of indefinite pronouns such as all/both, few/little, some/any, either/neither, etc aj1 adj Pattern(形容词型式) error in the combination with other words/grammatical aj2 adj set phrase(固定词组) error in the idiomatic use of an adjectival phrase/ omission or replacement of a fixed element that goes after a certain adjective aj3 adj Degree(级) adjective degree error: form and use aj4 adj -ed/-ing confusion-ed adjective for -ing adjective or vice versa

相关文档
最新文档