CLEC中国英语学习者语料库

合集下载

基于语料库近义词辨析:以动词cause和generate为例

基于语料库近义词辨析:以动词cause和generate为例

基于语料库近义词辨析:以动词cause和generate为例展雪梅;张发祥【摘要】近义词辨析一直是英语学习的重点和难点.以近义词cause和generate 为例,通过检索它们在本族语料库BROWN和中国学习者英语语料库CLEC中的使用情况,从标准频率、类连接、词义、搭配的角度来分析它们的区别及实际用法,进而分析中国英语学习者误用的原因,并以此说明语料库检索工具对于近义词辨析具有重要的辅助作用,同时对于英语教学和英语习得也具有重要的意义.【期刊名称】《黑龙江教育学院学报》【年(卷),期】2011(000)011【总页数】4页(P148-151)【关键词】语料库;近义词;cause;genera【作者】展雪梅;张发祥【作者单位】河南科技大学外国语学院,河南洛阳 471003;河南科技大学外国语学院,河南洛阳 471003【正文语种】中文【中图分类】H314.1基于大量真实的语言材料,语料库语言学从调查信息的分布频率入手来研究语言在现实使用中的规律和模式。

词汇教学是语料资源和研究手段应用于外语教学时间最早和成果最多的一个领域,它在外语教学中占有举足轻重的地位。

英语近义词词义之间有什么细微区别、怎样使用一直是英语作为外语教学的难点。

随着语料库语言学被引进到国内,利用语料库进行英语教学研究也日益增多。

其中笔者所了解到的对词汇搭配与教学方面的研究也见诸各专业学术期刊、杂志,如:杜爱玲的《基于语料库的SEEM用法研究》、濮建忠的《英语词汇教学中的类联、搭配及词块》、王颖的《KEEP一词的语料库研究》、熊建国的《DOUBT的语料库研究及其对英语教学的一点启示》和杨贝的《中国英语学习者与本族语学生写作中HAVE用法比较》、邓耀臣的《学习者语料库与第二语言习得研究述评》、沈岚的《Corpus-based Vocabulary Planning in English Teaching 2007》等[1]。

本文运用语料库方法,分析比较cause和generate在英语为母语的语料库LOCNESS和中国英语学校者语料库(Chinese Learner English Corpus,CLEC)中的运用方法[2],以此为例来研究利用语料库对英语近义词教学的新思路和方法。

中国口译学习者语料库的副语言标注_标准与程序

中国口译学习者语料库的副语言标注_标准与程序

从 20 世纪 80 年代起, 基于上述实证数据, 研究人 员开始从理论层次上认识非语言信息在口译操作中的 Mercer,1994 /2002 ; Alex作用 ( Lang,1978 ; Moserieva, 1997 /2002 ; Wadensj, 2001 ) 。 Stenzl 于 1983 年 提 出“翻 译 交 际 模 型 ” 首先, ( communicative model ) ( 转 引 自 Pchhacker, 2004 : 9495 ) , “口译交际流动” ( communicative flow of 突出了 interpreting) 的概念, 最早论述了口译员接受原语语言 同时强调了译语副语言信息的 及副语言信息的过程, 特点。 其次, 非语言现象成为社会语言学、 心理语言学与 , 使口译副语言研究具备多学科、 口译研究的“接口 ” 118 ; 鲍刚,2005 ) , 跨学科的特点( 刘宓庆,2003 : 117口译情景是一种典型的社会公共交际行为 , 口译信息 包括三个基本成分: 语言、 副语言、 身势语 ( kinesics ) , 三者相互作用, 共同构成真实情景下实际交际语言 , 因 交际心理学、 话语分析等视角进 此应该从社会语言学、 1987 /2002 ; Jacobson, 2009 ) 。 行分析解读( Poyatos, 2. 3 口译副语言研究的不足 ( 1 ) 研究规模与影响有待提高 个别的 口译副语言迄今依然处于学界边缘地带 , 呼吁或尝试远未形成学术研究的规模效应 , 既无法产 生大规模数据基础, 更难以产生有普遍意义的结 论 ( Pchhacker, 2004 : 202 ) 。 ( 2 ) 研究方法有待系统化、 科学化 个人体悟, 基于口译实践 相关探索多为经验总结、 的实证性定量研究为数较少, 更缺乏大规模客观数据 支持, 研究方法与程序的参照意义并不明显 , 严重影响 了数据及结论的代表性, 其突出表现是部分研究数据 规模小( 如 Shlesinger ( 1994 ) 仅分析了一段 90 秒的口 译材料) , 而且结论相互矛盾( 详见: 2. 2. 2 ) 。 ( 3 ) 研究层次有待深化 首先, 相关研究均为对口译副语言的特点、 性质、 类别、 效 果 的 印 象 式 描 述 与 理 论 性 阐 释 ( Poyatos, 1987 /2002 ) , 不仅实证数据支撑不足, 而且各种副语言 现象的标准化分析方法与程序尚未严格界定 ( 如停顿 的时间、 发言的速度、 音量的高度等 ) , 不利于具体研 究数据的对比分析与后续研究的跟踪考察 。 其次, 没有充分考虑口译工作方式与环境对口译 副语言形式与功效的影响, 不利于对口译表达特点的 整体认识。如, 同传、 交传在加工负荷、 操作程序、 策略

36134402

36134402

第30卷 第5期 广东海洋大学学报V ol.30 No.52010年10月 Journal of Guangdong Ocean University Oct. 2010收稿日期:2010-05-12基金项目:广东海洋大学人文社会科学研究资助项目第一作者:庄 萍,女,1965年生,本科,硕士,高级讲师,研究方向:英语语言文学与应用语言学。

基于语料库的名词单复数失误研究庄 萍(广东海洋大学 外国语学院,外国语言与教学研究所,广东 湛江 524088)摘 要:利用中国学习者英语语料库,结合定量和定性研究方法,对中国英语学习者作文里英语名词单复数失误的现象进行了研究,发现:1)学习者的母语干扰是造成名词单复数失误的主要原因;2)中国学习者名词单复数失误最多的是名词复数形式使用不足;3)名词单复数失误与学习者英语水平相关主要表现在:低水平学习者使用失误的名词多数为常用的简单的名词,水平较高的学习者使用失误的名词多数是较复杂的抽象或物质名词。

并探讨了基于语料库的研究对英语教学所带来的启示。

关键词:语料库;名词的数;错误分析;语言迁移中图分类号:H319 文献标志码:A 文章编号:1673-9159(2010)05-0076-07A Corpus-based Study on the Errors of Number of English NounsZHUANG Ping(Faculty of Foreign Languages ,Foreign Language and Teaching Research Institute ,Guangdong Ocean University, Zhanjiang 524025,China )Abstract: This paper is a corpus-based study on the errors of number of English nouns committed by Chinese English learners in writing. It makes use of the Chinese Learner English Corpus (CLEC) and adopts both the qualitative and quantitative methods.Based on the results of the error analysis ,this study mainly finds out: 1) most errors of number of English nouns committed by Chinese learners are attributable to mother tongue interference; 2) most errors of noun number committed by Chinese learners are the errors of underuse of the plural markers due to L1 transfer; 3) the errors do have something to do with the English proficiency of the Chinese learners: the nouns with number errors used by ST2 and ST4 students are mostly simple nouns ; while the nouns with number errors used by ST6 students are difficult abstract or material nouns. In conclusion, some suggestions concerning the pedagogical implications of corpus-based study to English teaching in China are made. Key words : corpus; number of nouns; error analysis; language transfer很多研究者利用语料库对学习者的错误进行分析研究。

英汉语料库汇总

英汉语料库汇总

1.英语学习者语料库(书面语及口语)中国学习者语料库 CLEC(100万)广外、上海交大2.大学英语学习者口语语料库 COLSEC (5万) 上海交大3.香港科技大学学习者语料库 HKUST Learner Corpus 香港科技大学4.中国英语专业语料库 CEME (148万) 南京大学5.中国英语学习者口语语料库 SECCL (100万) 南京大学6.国际外语学习者英语口语语料库中国部分 LINSEI-China (10万) 华南师大7.硕士写作语料库 MWC (12万) 华中科技大学9.平行语料库汉英平行语料库 PCCE 北外10.南大-国关平行语料库南京大学11.英汉文学作品语料库;外研社12.冯友兰《中国哲学史》汉英对照语料库13.李约瑟(Joself Needham)《中国科学技术史》英汉对照语料库14.计算机专业的双语语料库;国家语言文字工作委员会语言文字应用研究所15.柏拉图(Plato)哲学名著《理想国》的双语语料库16.英汉双语语料库(15万对) 中科院软件所17.英汉双语语料库:LDC香港新闻英汉双语对齐语料36294段以及香港法律英汉双语对齐语料31万句子对中国科学院自动化研究所18.英汉双语语料库(100万),网上英汉语段电子词典及网上电子英汉搭配词典(1000万) 东北大学19.英汉双语语料库(40-50万句子对) 哈尔滨工业大学20.双语语料库(5万多对) 北京大学计算语言学研究所21.对比语料库 LIVAC(Linguistic variety in Chinese communities) 香港城市理工大学22.平衡语料库(Sinica Corpus);树图语料库(Sinica Treebank) 台湾23.特殊英语语料库中国英语(China English)语料库河南师范大学24.军事英语语料库(Corpus of Military Texts) 解放军外语学院25.新视野大学英语教材语料库上海交通大学26.汉语语料库汉语现代文学作品语料库(1979年,527万字) 武汉大学27.现代汉语语料库(1983年,2000万字) 北京航空航天大学28.中学语文教材语料库(1983年,106万8000字) 北京师范大学29.现代汉语词频统计语料库(1983年,182万字) 北京语言学院30.国家级大型汉语均衡语料库(2000万字) 国家语言文字工作委员会31.《人民日报》语料库(2700万字) 北京大学计算机语言学研究所32.大型中文语料库(5亿字,10分库) 北京语言文化大学33.现代汉语语料库(1亿字) 清华大学34.汉语新闻语料库;(1988年,250万字) 山西大学35.标准语料库(2000年,70万字)36.生语料库(3000万字);《作家文摘》的标注语料库(100万字) 上海师范大学37.现代自然口语语料库中国社会科学院语言所38.旅游咨询口语对话语料库和旅馆预定口语对话语料库中国科学院自动化所39.北京大学汉语语言学研究中心的三个语料库现代汉语语料库/yuliao.asp?item=1古代汉语语料库/yuliao.asp?item=2汉英双语语料库/yuliao.asp?item=3/printthread.php?t=2742汉语语料库使用权限国家语委语料库(http://219.238.40.213:8080/CpsQrySv.srf)”虽说是通用型平衡语料库,但不能完全免费使用;北京语言大学的汉语语料库(http://202.112.195.8)语料产出时间较早,且不能完全免费使用;北京大学汉语语言学研究中心语料库(现代汉语子库)”(/YuLiao_Contents.Asp)规模最大,逾亿字,但取样极不均衡,多半为文学作品;台湾“中央研究院”Sinica Corpus也是可免费使用的平衡汉语语料库。

语料库中国英语学习者短语动词使用调查

语料库中国英语学习者短语动词使用调查

基于语料库的中国英语学习者短语动词的使用调查摘要:文章基于中国英语学习者语料库,通过机辅语料检索与人工分析相结合,主要调查研究了中国英语学习者英语短语动词的使用情况。

结果表明,两个不同水平的学习者在短语动词的使用上有很多相似之处,所使用的英语短语动词有很多重合且数量不多。

关键词:语料库方法短语动词中国英语学习者一、引言短语动词(pvs)是英语习语的一个重要类别,又称“多词动词”(multi-word verbs)。

动词加上副词或介词或两者(有的语言学家把副词和介词统称为小品词particles),表达一个不可分割的完整动词概念,就构成了短语动词。

所谓不可分割的完整概念,指的是新形成的概念与其各组成部分的原有概念有较大区别,人们在使用短语动词的时候把它当做一个单词实义词对待,而不是几个词的随意组合,不同于自由的动词词组(free combination of verbs)。

当代有些语言学家把“介词动词”(动词+介词)和“短语介词动词”(动词+副词+介词)从短语动词中分出来(短语动词只限于“动词+副词”),本文采用的是广义的提法。

在现代英语中,短语动词数量多,使用广,成为现代英语词汇的一大特色。

那么,中国英语学习者在英语写作中的pvs的使用情况如何?本文对不同水平学习者pvs的使用情况加以对比,试图找到我国英语学习者学习和使用pvs 的一些规律和特点。

二、研究设计1.研究问题短语动词数量多,使用广,是现代英语词汇的一大特色。

由此本文以中国学习者语料库为基础,研究的具体问题是:两个水平的英语学习者在英语pvs的使用上是否具有相似之处?如果有,是什么?2.语料来源根据本研究的研究目的,我们从中国英语学习者语料库中挑选了两个字库(st2 & st4),代表不同水平的中国英语学习者。

详细信息见表1:表1 基本语料信息3.短语动词提取本文以clec(chinese learner english corpus)的两个子库(st2& st4)为基础,调查小品词是up,out,off,in和on的二词短语动词的使用特点。

基于语料库的中国英语专业学习者冠词使用错误分析

基于语料库的中国英语专业学习者冠词使用错误分析

基于语料库的中国英语专业学习者冠词使用错误分析[摘要]英语冠词是英语中出现频率最高的虚词,因此,能否正确掌握冠词的使用是判断二语学习者英语水平的关键指标之一。

从已有的研究发现来看,中国英语专业学习者与其他二语学习者一样,在英语冠词系统的习得中面临很大的困难。

造成这一现象的原因有三种:一是英语与汉语的区别,二是冠词本身的复杂语义及用法,三是学习者自身素质的差别。

[关键词]语料库冠词误用分析[中图分类号]h314.2[文献标识码]a[文章编号]2095-3437(2012)01-0092-02本文是以:“中国英语学习者英语语料库”(clec——收集了包括中学(st2)、大学英语4级(st3)和6级(st4)、英语专业低年级(st5)和高年级(st6)在内的5种cll的语料一百多万词,并对言语失误进行标注。

)以及其子语料库st5和st6为数据来源,通过语境共现的索引形式kwic (key words in context),对国内一些大学英语专业学生(st5,st6)英语冠词误用情况进行一系列地分类、标注、检索、分析和讨论。

采用的检索软件为antconc3.2.0beta2,该软件易于操作并且功能强大,适合普通的用户使用。

在“中国英语学习者英语语料库”(clec)以其子语料库st3, st4, st5, st6中,中国英语专业学习者对三类冠词的使用频率大致相同。

从使用频率看来,无论是非英语专业学习者还是英语专业学习者,对定冠词the的使用频率最高,其次是不定冠词a,最后是an。

接下来是鉴定clec中学生犯的冠词错误。

当前的研究将会采用clec中的错误标签(error tag),鉴别clec中的冠词误用。

在clec 中有关冠词的言语失误的分类有七种:ad3(副词), aj3(形容词短语), np1(名词形式), np2(固定词组), np6(数), np7(冠词), wd4(缺少), wd5(冗余)。

进过一系列的手工挑选和三位英语母语者核实确认后,检索结果如下表。

中国EFL学习者对thus的使用情况分析

中国EFL学习者对thus的使用情况分析【摘要】Thus 虽然词形简单,但由于其具有多种意义和用法,且同义词居多,常使得中国EFL学习者对之使用望而却步。

本研究利用中国学习者语料库(CLEC)分析中国EFL学习者对thus一词的使用情况,并与操母语者的语料库(Brown)进行对比,以期发现两者之间的异同,解释造成此种使用特点的原因,并据此探究中国二语习得课堂的高效教学模态,以期向中国的英语教学提供一些可供参考的建议。

【关键词】THUS;中国EFL学习者;对比分析;语料库0 引言随着语料库的蓬勃兴起,特别是桂诗春、杨惠中(2003)建立起中国英语学习者语料库以来,国内已有不少研究者通过对比分析二语习得者的语料和本族语者的语料来探究我国学生英语中介语的习得状况,其中有不少是对英语高频词的对比研究。

例如杨贝(2002),刘学敏(2005),张萍、周敏(2007),韩瑞娟(2011)。

此外,还有一些是专门针对高频词so的研究,例如李晓玲(2005),张宁(2006),宋京生(2007),雷春仪(2008)。

但纵观国内基于语料库的相关词汇研究,我们发现thus的使用情况却没有引起相关学者的注意。

笔者在进行大学英语写作助教的工作中发现,很多学生对thus一词的使用感到困扰,或者根本就不会去用thus,而是用其多种同义词取而代之,例如therefore、so、hence等。

那么,中国EFL学习者对thus一词的使用情况究竟如何是本文需要探讨的地方。

本研究主要基于中国学习者语料库(CLEC)来分析中国EFL学习者对thus一词的使用情况,并通过英语本族语者语料库(Brown)进行对比分析,找出两者之间的使用差异,阐述造成这种差异的可能性原因以及基于此对中国英语二语教学提出一些可供参考的意见。

1 研究方法1.1 研究对象本文研究主要以中国英语学习者语料CLEC(Chinese learner English Corpus)中的ST2、ST3、ST4、ST5和ST6五个子语料库为研究对象。

近十年国内外学习者语料库建设情况及研究述评

摘 要:本文通过对学习者语料库相关文献的搜索和整理,对近十年国内外学习者语料库建设情况进行了重点介绍,同时对基于学习者语料库的二语习得相关研究进行了探讨,旨在对我国学习者语料库的建设和相关研究提供借鉴。

关键词:学习者语料库;二语习得;英语学习[中图分类号]H319.3[文献标识码]A[文章编号]1006-2831(2015)02-0052-6 doi:10.3969/j.issn.1006-2831.2015.01.014苏晓俐(四川外国语大学,四川 重庆 400031)收稿日期:2014-11-29;修改稿:2014-12-101. 概述语料库语言学的研究开始于20世纪50年代,之后该领域的研究者逐渐增多,语料库的研究开始与大多数语言研究相关领域相结合,这一结合的主要贡献之一为变体研究,包括语言媒介变体研究(口语变体与笔语变体),语场变体研究(一般文体与专门化语体)以及地理地位变体研究(世界英语)。

然而,对外语/二语学习者语言变体的语料库研究直到20世纪90年代初才逐渐兴起(Granger, 2003: 538)。

学习者语料库主要是指经过计算机处理的外语学习者的语言产出的数据库(Leech, 1998: 3),本文将对近十年国内外学习者语料库的发展现状和基于学习者语料库的二语习得相关研究作一个评述。

2. 学习者语料库的建设情况经过三十多年的发展,学习者语料库的建设在全世界范围内掀起一股热浪。

在学习者语料库研究颇有建树的研究团队代表是由比利时Louvain-La-Neuve 大学的Sylviane Granger 教授所创建的英语语料库语言学中心(Center for English Corpus Linguistics ),简称CECL 。

根据C E C L 的不完全统计,截止到2014年11月14日,全世界学习者语料库已经达到136个,涉及的语言包括英语、汉语、捷克语、阿拉伯语、荷兰语、法语、德语、匈牙利语、朝鲜语、挪威语、西班牙语、意大利语等十几种,媒介方式由之前的以笔语为主逐渐向多媒介方式转变,包括口语(spoken )、笔语(written )、多媒体(m u l t i m e d i a )以及计算机中介交流(computer-mediated communication ,简称C M C ),收录的语料丰富多样,例如学生习作、访谈、演讲、测试等,涵盖了从语言初学者到熟练使用者不同层次的语言学习者(http://www.uclouvain.be/en-cecl-lcworld.html )。

基于语料库的tend和intend的对比研究 (1)

基于语料库的tend和intend的对比研究张艳妍(中国科学院研究生院外语系,北京,100049)摘要:通过在COCA语料库和CLEC语料库比较近义词tend和intend的用法,结果发现中国英语学习者有混用及语义韵含糊的现象。

本文以tend和intend为例,通过比较二词的类连接、搭配词及语义韵,对我国英语学习者的近义词习得提出探讨。

关键词:近义词;语料库;语义韵;词汇习得作者简介:张艳妍,1986年2月出生,女,汉族,籍贯江苏省海门市,中国科学院研究生院外国语言学及应用语言学学生,研究方向为词汇学,语料库语言学。

1.近义词辨析搭配能力是衡量语言使用者语言能力的重要指标。

Sinclair (2004)指出,语义韵的和谐是搭配地道性的先决条件。

Sinclair (1991)首先提出了语义韵的概念,认为一些节点词(node)总是与某一类具有相同或相似特点的搭配词(collocate)在文本中反复出现。

语义韵分为消极语义韵、积极语义韵和中性语义韵。

传统的课堂教学中,教师给出学生近义词语的汉语释义及例句,学生做大量的笔记,对近义词的辨析可以达到“言传”而不是“意会”的程度。

教师和学生更倾向于依赖工具书或者凭语感进行分析,从而比较近义词之间的差异。

词典中所提供的义项和例句对于英语学习者来说比较抽象,虽然这些义项是对近义词在语言使用中的大量用法的归纳总结。

以tend 和intend为例,《牛津高阶英汉双解词典(第四版增补本)》(2002)对这两个词作为动词的解释如下:中英文释义例句tend 1.take care of or look after sb./sth. 照料,照管(某人/某物)2.(US) serve customers in (a shop, bar, etc) 在(店铺、酒吧等)中接待顾客1. nurses tending the injured 照料受伤者的护士shepherds tending their sheep 照管羊的牧人2.tend the store 照看店铺3.[It] be likely to behave in a certain way or tohave a certain characteristic or influence 倾向;趋向;趋于4.tend to/ towards sth.: take a certain direction 朝某方向3.I tend to go to bed earlierduring the winter. 我在冬天常睡得较早。

基于语料库中学生英语写作中动词完成体错误论文

基于语料库的中学生英语写作中动词完成体的错误分析摘要:完成体是英语中较为关键的一个语法项目,而因英汉语言的差异,中国学习者在习得完成体时易受母语负迁移的影响,因此成为英语学习中的一个难点。

本研究将着眼于完成体动词词形变化,试图利用中国学习者英语语料库,通过语料的分析,对中国学习者在完成体的误用进行分类分析,对学习者产生错误的原因进行分析和总结。

关键词:语料库;完成体;“have”;中国学习者中图分类号:g623 文献标识码:a文章编号:1009-0118(2012)07-0303-02一、引言与汉语相比,英语具有更加丰富的形态变化,如时态的变化,而且这些变化往往带有标记符号。

受母语负迁移的影响,种种形态的变化给是英语学习的难点之一,也是学习者易出错的地方。

因此,总结出学习者的出错规律并提出行之有效的解决方案,是英语教学面临的迫切任务。

完成体是英语中关键的时体标记之一,由助动词have的一定形式加-ed分词构成,分为现在完成体和过去完成体(章振邦,2003)。

have是英语中常用的高频词,兼做助动词、情态动词(指半情态/半助动词have to)及主动词(nation,1990;参见杨贝,2003)。

本研究将着眼于完成体动词词形变化,试图通过对语料的分析,了解中国学习者对英语完成体的使用的分布情况以及使用特点,并对学习者在完成体的误用进行分类分析,对学习者产生错误的原因进行分析和总结,总结出学习者的出错规律,以期对英语完成体的教学有所启示。

二、研究回顾完成体是英语中很关键的时体标记之一,而构成这个标记的就是动词have。

have是英语中常用的高频词,兼做助动词、情态动词(指半情态/半助动词have to)及主动词(nation,1990;参见杨贝,2003)。

关于have的习得、搭配行为等引起了大量学者的兴趣,戴曼纯等(2008)在生成句法框架下研究了have的句法习得,其他学者则主要着眼于学习者写作中have的搭配行为,以及与本族语学生写作中的用法差异比较(韩建侠,2008;罗琴琴等,2007;杨贝,2003)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

CLEC中国英语学习者语料库CLEC收集了包括中学生、大学英语4级和6级、专业英语低年级和高年级在内的5种学生的语料一百多万词,并对言语失误进行标注。

其目的就是观察各类学生的英语特征和言语失误的情况,希望通过定量和定性的方法对中国学习者英语作出较为精确的描写,为我国学生的英语教学提供有用的反馈信息。

表1 CLEC语料分布类型词次ST2 208088ST3 209043ST4 212855ST5 214510ST6 226106总计 1070602言语失误标注原则1. 简单合理,易于系统操作。

参与标注的人比较多,分类表过于繁复,就难于掌握。

我们采取两级分类,第一级有11类:词形(fm)、动词短语(vp)、名词短语(np)、代词(pr)、形容词短语(aj)、副词(ad)、介词短语(pp)、连词(cj)、词汇(wd)、搭配(cc)、句子(sn)。

每一类里再用数目字细分。

如[cc]为词语搭配不当,[cc1]表示名词和名词的搭配,[cc2]表示名词和动词的搭配,[cc3]表示动词和名词的搭配,等等。

2. 分类表的类别要适中。

过粗容易统一,但信息太少,不利于分析学习者的失误/过细难以统一,容易把同一种失误归到不同类别。

目前我们采取的办法是对常见的失误从细(如vp和np都有9小类),对少见的失误从粗(如cj只有两小类)。

现在的分类表有61个失误码,是属于中等规模的分类表。

提供足够的失误信息(失误本身、失误类型和失误发生范围)。

例如In the past,[vp6, 4-] kind to each other…, 失误用方括号表示,放在失误people are 之后。

[vp6]为vp(动词)第6种(时态)失误,4-为失误发生的范围,-表示失误的位置,4表示失误前有4个词。

要联系这4个词,才能判断are这个词用错了。

开放性。

容许研究者根据需要对失误类型进行补充或进一步再分出细类。

例如[sn8]为句子结构有缺陷,研究者可以对这种失误再分为若干细类来研究。

这需要把sn8的失误全部检索出来,然后定出第三级的分类范畴,如sn81,sn82,等等。

5. 对语体或失误的来由暂不作标注,因为这需要标注者较多的主观判断,更难以统一。

言语失误分类表(总数:61)词形动词短语名词短语代词码类型码类型码类型码类型Spelling vp1 pattern np1 pattern pr1 Reference fm1fm2 word building vp2 set phrase np2 set phrase pr2 anticipatory it fm3 capitalization vp3 agreement np3 agreement pr3 Agreementvp4 finite/non-finite np4 case pr4 Casevp5 non-finite np5 countability pr5 wh-vp6 tense np6 number pr6 Indefinitevp7 voice np7 articlevp8 mood np8 quantifiersvp9 modal/auxiliary np9 otherdeterminers形容词短语副词介词短语连词码类型码类型码类型码类型pattern ad1 order pp1 pattern cj1 pattern aj1aj2 set phrase ad2 modification pp2 set phrase cj2 set phrase aj3 degree ad3 degree aj4 -ed/-ingconfusionaj5 predicative/attributive词语搭配句子码类型码类型码类型order cc1 noun/noun sn1 run-on wd1sentencewd2 part of speech cc2 noun/verb sn2 sentencefragmentwd3 substitution cc3 verb/noun sn3 danglingmodifierwd4 absence cc4 adj/noun sn4 illogicalcomparison wd5 redundancy cc5 verb/adv sn5 topicprominence wd6 repetition cc6 adv/adj sn6 Coordination wd7 ambiguity sn7 Subordinationsn8 structuraldeficiencysn9 Punctuation标注说明码分类类别说明fm1 word Spelling(拼写) spelling, coinage, abbreviation, apostrophefm2 word word buildingderivation, inflection, compounding,(构词) plurality (noun), irregularity(verb),3rd person singular form(verb),syllabification, hyphenation, worddivision or fusionfm3 word Capitalizationlower initial letter for upper initial (大小写) letter or vice versavp1 vb phr Pattern(及物性error in transitivity(vi as vt or vice 型式) versa), transitive verb pattern/grammatical(cf Oxford advancedlearner’s dictionary o f currentedited by A. S. Hornby) Englishvp2 vb phr set phrase(固定phrasal verb and verbal phrase: error 词组) in form or usevp3 vb phr Agreement(主谓number agreement with its subject一致性) (noun or pronoun)vp4 vb phr finite/non-finifinite verb for non-finite verb or vice te(定式) versavp5 vb phr non-finite(不定infinitive error: form and use/式) infinitive for participle or viceversa/ -ed participle for -ingparticiple or vice versavp6 vb phr Tense(时态) error in tense use within a sentence/the sequence of tenses betweensentencesvp7 vb phr voice (语态) error in the use of voice: active for passive or vice versavp8 vb phr Mood(语气) error in the use of mood: imperative, subjunctive/ improper structure ofconditional sentencesvp9 vb phr modal/auxiliarymisuse of modal/auxiliary verbs/ wrong (情态) form of modal verb(or auxiliary verb)and verb combination (e.g tense form,voice form, etc)np1 nn phr Pattern(名词型Error in combination with other式) words/grammaticalnp2 nn phr set phrase(固定omission or replacement of a fixed词组) element that goes after a certain nounnp3 nn phr Agreement(主谓number agreement of a noun with its一致性) determiner or a word that refers to itnp4 nn phr Case(格) possessive case error: form or usenp5 nn phr Countability(可uncountable noun used as countable数性) nounnp6 nn phr Number(数) countable noun used with no determineror -s/ a or -s with plural nounnp7 nn phr Article(冠词) confusion or a/andefinite/indefiniteconfusionnp8 nn phr Quantifiers(数misuse or confusion between many/much, 量词) , etc (a) few/(a) little, some/anynp9 nn phr other misuse or confusion of demonstratives,determiners(其wh- determiners, numerals, etc.他限定词)pr1 pron Reference(指称) incorrect/ambiguous pronounreference/anaphoricpr2 pron anticipatory itimproper or wrong use of anticipatoryit / it replaced by a demonstrative, (先行it)etcpr3 pron Agreement(主谓number agreement with a noun it refers 一致性) topr4 pron Case(格) case error of any personal pronounpr5 pron wh-(wh-代词) misuse or confusion of interrogative,relative and conjunctive pronounspr6 pron Indefinite(不定misuse or confusion of indefinite式) pronouns such as all/both,few/little, some/any, either/neither,etcaj1 adj Pattern(形容词error in the combination with other型式) words/grammaticalaj2 adj set phrase(固定error in the idiomatic use of an词组) adjectival phrase/ omission orreplacement of a fixed element thatgoes after a certain adjectiveaj3 adj Degree(级) adjective degree error: form and useaj4 adj -ed/-ing -ed adjective for -ing adjective or confusionvice versa(-ed/-ing混淆)aj5 adj predicative/attpredicative adjective used asributive(谓语/attributive adjective定语)ad1 adv Order(词序) improper adverb placement/wrongpositionad2 adv Modification(修adjective modifier used as verb饰语) modifier/ other kinds of confusionad3 adv Degree(级) adverb degree error: form and usepp1 prep Pattern(介词型unacceptable combination with other 式) words/grammaticalpp2 prep set phrase(固定error in the formation or use of an 词组) idiomatic prepositional phrasecj1 conj Pattern(连词型unacceptable combination with other 式) words/grammaticalcj2 conj set phrase(固定error in the formation or use of a词组) phrase functioning as a conjunctionwd1 word Order(词序) misplacement of any word other than an adverbwd2 word part of speecherror in part of speech: right root but (词类) wrong word classwd3 word Substitution(替error in word choice: right word class 代) but wrong selection (any part ofspeech)wd4 word Absence(缺少) omission of a word(any part of speech) wd5 word Redundancy(冗oversuppliance of a word(any part of 余) speech)wd6 word Repetition(重unnecessary repeating of a word复)wd7 word Ambiguity(歧义) not clear word meaning/semanticcc1 notionan/n collocationimproper noun(phrase) andl (名词/名词) noun(phrase) combination/semanticcc2 notionan/v collocationimproper noun(phrase) andl (名词/动词) verb(phrase) combination/semanticcc3 notionav/n collocationimproper verb and noun(phrase)l (动词/名词) combination/semanticcc4 notionaa/n collocationimproper adjective and noun(phrase) l (形容词/名词) combination/semanticcc5 notionav/ad improper verb and adverb (or ad/v)l collocation(动combination/semantic词/副词)cc6 notionaad/a improper adverb and adjectivel collocation(副combination/semantic词/形容词)sn1 sentencrun-on sentenceimproper addition of clauses/fused e (不断句) sentencesn2 sentencsentence subordinate clause as a sentence/ anye fragment(片段) phrase as a sentencesn3 sentencdangling illogical adverbial modification of ae modifier(垂悬修clause饰语)sn4 sentencillogical error in the comparison of words ore comparison(比较phrases in a sentence which can not be不符合逻辑) comparedsn5 sentenctopic the co-occurrence of an initial noune prominence(主题phrase and its equivalent(usually a突出) pronoun) in the same sentencesn6 sentencCoordination(并faulty parallelism of clauses (or e 列) words/phrases) in a sentencesn7 sentencSubordinationfaulty attachment of a subordinate e (主从) clause to the main clausesn8 sentencstructural error in the grammatical construction e deficiency(结构of a sentence: improper splitting,缺陷) pattern shifting, confusingstructure, etcsn9 sentencPunctuation(标overuse, absence, choice, apostrophe,e 点符号) comma splice, etc.标准化处理后的各种失误频数及其比例失误类型总计百分比(%) st2 st3 st3 st4 st51686.fm1 1928.8 2877.4 2112.6 1826.7 7 10432.2 17.47fm2 349.3 448.9 438.9 226.9 328.7 1792.7 3fm3 1474.4 731.8 405.8 694.1 174.6 3480.7 5.83vp1 259.4 325.9 498.4 103.4 200.8 1387.9 2.32vp2 179 139.3 61.2 104.2 22.1 505.8 0.85vp3 374 524.6 785.2 273.1 327 2283.9 3.82vp4 140.8 159.1 110.8 63.9 51.6 526.2 0.88vp5 140 118.7 107.4 89.9 46.7 502.7 0.84vp6 1165.7 356 311.6 379.8 215.6 2428.7 4.07vp7 172.7 104.1 98.4 63.9 46.7 485.8 0.81vp8 27.1 16.3 8.3 25.2 11.5 88.4 0.15vp9 111.4 274.3 278.5 42.9 86.1 793.2 1.33np1 46.9 33.5 28.9 16.8 10.7 136.8 0.23np2 24.7 22.4 17.4 19.3 2.5 86.3 0.14np3 202.1 247.7 249.6 210.9 186 1096.3 1.84 np4 66.8 55.9 26.4 22.7 21.3 193.1 0.32 np5 58.9 98 71.9 60.5 84.4 373.7 0.63 np6 374 654.4 481 358.8 354.1 2222.3 3.72 np7 237.9 107.5 89.3 174.8 54.9 664.4 1.11 np8 35 65.4 47.9 13.4 7.4 169.1 0.28 np9 6.4 41.3 12.4 7.6 5.7 73.4 0.12 pr182 236.5 205 89.9 18.9 632.3 1.06 pr2 16.7 78.3 23.1 4.2 0 122.3 0.2 pr3 52.5 54.2 172.7 28.6 60.6 368.6 0.62 pr4 74.8 37 20.7 48.7 10.7 191.9 0.32 pr5 26.3 53.3 14.1 7.6 10.7 112 0.19 pr6 9.5 2.6 5 3.4 0 20.5 0.03 aj1 6.4 18.9 15.7 5 9 55 0.09 aj2 9.5 3.4 9.9 5.9 7.4 36.1 0.06 aj3 38.2 39.6 32.2 43.7 97.5 251.2 0.42 aj4 16.7 2.6 22.3 12.6 5.7 59.9 0.1 aj5 0.8 3.4 7.4 1.7 0 13.3 0.02 ad1 35.8 96.3 39.7 27.7 15.6 215.1 0.36 ad2 42.2 37.8 12.4 9.2 4.9 106.5 0.18 ad3 7.2 12 9.9 1.7 2.5 33.3 0.06 pp1 136.1 98 43 169.7 28.7 475.5 0.8 pp2 25.5 262.3 143.8 37 27.9 496.5 0.83 cj1 27.8 20.6 18.2 21.8 12.3 100.7 0.17 cj2 4 7.7 13.2 5.9 4.9 35.7 0.06 Wd1 43.8 151.3 114.1 25.2 37.7 372.1 0.62 Wd2 324.6 929.6 772.8 226.9 242.6 2496.5 4.18 Wd3 1102 1634.7 1815 757.1 359.8 5668.6 9.49 Wd4 585.6 829.8 443.8 403.3 427 2689.5 4.5 Wd5 410.6 613.1 518.2 265.5 171.3 1978.7 3.31 Wd6 27.1 37 22.3 34.5 29.5 150.4 0.25 Wd7 261.8 430.8 261.2 228.6 209.8 1392.2 2.33 cc1 72.4 65.4 76 23.5 36.1 273.4 0.46 cc2 35 177.1 49.6 6.7 21.3 289.7 0.49 Cc3 168.7 514.2 417.4 75.6 112.3 1288.2 2.16 Cc4 64.5 94.6 134.7 42 39.3 375.1 0.63 Cc5 23.9 40.4 29.8 5 4.1 103.2 0.17 Cc6 17.5 12 6.6 2.5 1.6 40.2 0.07 Sn1 419.3 596.8 576.9 118.5 42.6 1754.1 2.94 Sn2 424.9 389.6 303.3 132.8 76.2 1326.8 2.22 Sn3 10.3 20.6 17.4 2.5 10.7 61.5 0.1 Sn4 17.5 24.9 6.6 20.2 4.9 74.1 0.12 Sn5 9.5 14.6 17.4 2.5 4.9 48.9 0.08 Sn6 84.3 41.3 39.7 41.2 1.6 208.1 0.35Sn7 49.3 55.9 63.6 23.5 3.3 195.6 0.33Sn8 1103.6 446.3 862.1 493.2 231.9 3137.1 5.25Sn9 861.7 573.6 337.2 649.5 322.9 2744.9 4.66633.总计 14105.2 16160.6 13935.9 8883.4 8 59718.9 100按大类区分言语失误排列表总计百分比累积百分比 st2 st3 st4 st5 st6词形 3752.5 4058.1 2957.3 2747.7 2190 15705.6 26.299 26.299 词汇2755.5 4626.3 3947.4 1941.1 1477.7 14748 24.696 50.995 句法 2980.4 2163.6 2224.2 1483.9 699 9551.1 15.993 66.988 动词 2570.1 2018.3 2259.8 1146.3 1008.1 9002.6 15.075 82.063 名词 1052.7 1326.1 1024.8 884.8 727 5015.4 8.398 90.461 搭配 382 903.7 714.1 155.3 214.7 2369.8 3.968 94.429 代词 261.8 461.9 440.6 182.4 100.9 1447.6 2.424 96.853 介词 161.6 360.3 186.8 206.7 56.6 972 1.628 98.481 形容词 71.6 67.9 87.5 68.9 119.6 415.5 0.696 99.177 副词 85.2 146.1 62 38.6 23 354.9 0.594 99.771 连词 31.8 28.3 31.4 27.7 17.2 136.4 0.228 99.999 总计 14105.2 16160.6 13935.9 8883.4 6633.8 59718.9 99.999 百分比 0.24 0.27 0.23 0.15 0.11 中国学习者最常见的言语失误类型 st2 st3 st4 st5 st6 总计百分比 fm1 1928.8 2877.4 2112.6 1826.7 1686.7 10432.2 17.47 wd3 1102 1634.7 1815 757.1 359.8 5668.6 9.49 fm3 1474.4 731.8 405.8 694.1 174.6 3480.7 5.83 sn8 1103.6 446.3 862.1 493.2 231.9 3137.1 5.25 sn9 861.7 573.6 337.2 649.5 322.9 2744.9 4.6 wd4 585.6 829.8 443.8 403.3 427 2689.5 4.5 wd2 324.6 929.6 772.8 226.9 242.6 2496.5 4.18 vp6 1165.7 356 311.6 379.8 215.6 2428.7 4.07 vp3 374 524.6 785.2 273.1 327 2283.9 3.82 np6 374 654.4 481 358.8 354.1 2222.3 3.72 wd5 410.6 613.1 518.2 265.5 171.3 1978.7 3.31 fm2 349.3 448.9 438.9 226.9 328.7 1792.7 3 sn1 419.3 596.8 576.9 118.5 42.6 1754.1 2.94 wd7261.8 430.8 261.2 228.6 209.8 1392.2 2.33 vp1 259.4 325.9 498.4 103.4 200.8 1387.9 2.32sn2 424.9 389.6 303.3 132.8 76.2 1326.8 2.22 cc3 168.7 514.2 417.4 75.6 112.3 1288.2 2.16 np3 202.1 247.7 249.6 210.9 186 1096.3 1.84 vp9 111.4 274.3 278.5 42.9 86.1 793.2 1.33 np7 237.9 107.5 89.3 174.8 54.9 664.4 1.11 pr1 82 236.5 205 89.9 18.9 632.3 1.06从上表可看出,1. 词形的3种失误(拼写、构词、大小写)均在其中,而拼写更是居榜首,占失误中的17.47%。

相关文档
最新文档