桂诗春等-2010-语料库语言学与中国外语教学

合集下载

语料库相关源

语料库相关源

语料库相关资源David Lee语料库研究书签Bookmarks for Corpus-based Linguists (David Lee).au/~dlee/CBLLinks.htm (/corpora)常用语料库资源链接汇集(语料天涯)/corpus/互动平台/forum/入门读物专著梁茂成、李文中、许家金,2010,《语料库应用教程》。

北京:外语教学与研究出版社。

Hunston, Susan. 2002. Corpora in Applied Linguistics. Cambridge: Cambridge. University Press. (世界图书出版社引进)Kennedy, Graeme. 1998. An Introduction to Corpus Linguistics. London: Longman. (外研社引进)期刊论文中国期刊网EBSCO英文期刊数据库书店可以买到的语料库相关书籍Aijmer, K. & B. Altenberg (Eds.). 2004. Advances in Corpus Linguistics. Papers from the 23rd International Conference on English Language Research on Computerized Corpora (ICAME 23). Amsterdam: Rodopi. (世界图书出版社引进)Austermühl, F. 2001. Electronic Tools for Translators《译者的电子工具》. Manchester: St.Jerome Publishing. (外研社引进)Biber, Douglas, Stig Johansson, Geoffrey Leech, Susan Conrad & Edward Finegan. 1999.Longman Grammar of Spoken and Written English. Longman Publications Group.(外研社引进)Biber, Douglas, Susan Conrad & Randi Reppen. 1998. Corpus Linguistics. Cambridge: Cambridge University Press. (外研社引进)Connor, U & T. Upton (Eds.). 2004. Applied Corpus Linguistics: A Multidimensional Perspective. Amsterdam: Rodopi. (世界图书出版社引进)Granger, S. & S. Petch-Tyson (Eds.). 2003. Extending the Scope of Corpus-based Research: New Applications, New Challenges. Amsterdam: Rodopi. (世界图书出版社引进)Granger, S. et al. (Eds.). 2003. Corpus-based Approaches to Contrastive Linguistics and Translation Studies《基于语料库的语言对比和翻译研究》. Amsterdam: Rodopi. (外研社引进)Gries, Stefan Thomas. 2004. Multifactorial Analysis in Corpus Linguistics: A Study of Particle Placement. Beijing: Peking University Press. (北大出版社引进)Hunston, Susan. 2002. Corpora in Applied Linguistics. Cambridge: Cambridge. University Press. (世界图书出版社引进)Kennedy, Graeme. 1998. An Introduction to Corpus Linguistics. London: Longman. (外研社引进)Kettemann, B. & G. Marko. 2002. Teaching and Learning by Doing Corpus Analysis.Amsterdam: Rodopi. (世界图书出版社引进)Meyer, Charles. 2002. English Corpus Linguistics: An Introduction. Cambridge: Cambridge University Press. (外教社引进)Mukherjee, J. 2001. Form and Function of Parasyntactic Presentation Structures. A Corpus-based Study of Talk Units in Spoken English. Amsterdam: Rodopi. (世界图书出版社引进)Nattinger, James R. & Jeanette S. DeCarrico. 1992. Lexical Phrases and Language Teaching. Oxford: Oxford University Press. (外教社引进)Sinclair, John. 1991. Corpus, Concordance, Collocation. Oxford: Oxford University Press.(外教社引进)Thomas, Jenny & Mick Short. 1996. Using Corpora for Language Education. London: Pearson Education. (外研社引进)Zanettin, F., et al. (eds.). 2003. Corpora in Translator Education《语料库与译者培养》.Manchester: St. Jerome Publishing. (外研社引进)蔡金亭,2003,《语言因素对英语过渡中使用——一般过去时的影响》。

36134402

36134402

第30卷 第5期 广东海洋大学学报V ol.30 No.52010年10月 Journal of Guangdong Ocean University Oct. 2010收稿日期:2010-05-12基金项目:广东海洋大学人文社会科学研究资助项目第一作者:庄 萍,女,1965年生,本科,硕士,高级讲师,研究方向:英语语言文学与应用语言学。

基于语料库的名词单复数失误研究庄 萍(广东海洋大学 外国语学院,外国语言与教学研究所,广东 湛江 524088)摘 要:利用中国学习者英语语料库,结合定量和定性研究方法,对中国英语学习者作文里英语名词单复数失误的现象进行了研究,发现:1)学习者的母语干扰是造成名词单复数失误的主要原因;2)中国学习者名词单复数失误最多的是名词复数形式使用不足;3)名词单复数失误与学习者英语水平相关主要表现在:低水平学习者使用失误的名词多数为常用的简单的名词,水平较高的学习者使用失误的名词多数是较复杂的抽象或物质名词。

并探讨了基于语料库的研究对英语教学所带来的启示。

关键词:语料库;名词的数;错误分析;语言迁移中图分类号:H319 文献标志码:A 文章编号:1673-9159(2010)05-0076-07A Corpus-based Study on the Errors of Number of English NounsZHUANG Ping(Faculty of Foreign Languages ,Foreign Language and Teaching Research Institute ,Guangdong Ocean University, Zhanjiang 524025,China )Abstract: This paper is a corpus-based study on the errors of number of English nouns committed by Chinese English learners in writing. It makes use of the Chinese Learner English Corpus (CLEC) and adopts both the qualitative and quantitative methods.Based on the results of the error analysis ,this study mainly finds out: 1) most errors of number of English nouns committed by Chinese learners are attributable to mother tongue interference; 2) most errors of noun number committed by Chinese learners are the errors of underuse of the plural markers due to L1 transfer; 3) the errors do have something to do with the English proficiency of the Chinese learners: the nouns with number errors used by ST2 and ST4 students are mostly simple nouns ; while the nouns with number errors used by ST6 students are difficult abstract or material nouns. In conclusion, some suggestions concerning the pedagogical implications of corpus-based study to English teaching in China are made. Key words : corpus; number of nouns; error analysis; language transfer很多研究者利用语料库对学习者的错误进行分析研究。

桂诗春,杨惠中-语料库

桂诗春,杨惠中-语料库

国家哲学社会科学“九五”规划项目中国学习者英语语料库桂诗春杨惠中广东外语外贸大学上海交通大学国外语言学及应用语言文字工程研究所语言学研究中心上海外语教育出版社目录前言I.中国学习者英语语料库一导言二CLEC的建立三CLEC的统计分析四中国学习者言语失误统计分析II.词频排列(按频数)表III.拼写失误表IV.词目表V.词频分布表VI.语法标注频数表(附Lob134个语法标注的说明与例子)VII.言语失误表I.中国学习者英语语料库一.导言中国学习者英语库(Chinese Learner English Corpus,CLEC)是国家社科基金95规划项目“基于语料库的中国学习者英语错误分析”(Corpus-based Analysis of Chinese Learner English,CBACLE)的一个重要组成部分。

本书所载的是CLEC的各种统计资料和列表;对中国学习者英语错误的各种分析另收集在《中国学习者英语错误分析》一书里。

两书为姐妹篇,供读者互相引证。

在某种意义上说,语料库语言学是一种研究方法; 而这种研究方法是借助计算机来实现的,故Leech(1998a)主张把语料库语言学(corpus Array linguistics)说成是计算机语料库语言学(computer corpuslinguistics)。

随着计算机的普及和现代技术(高速的中央处理器、精密的扫描仪和字母识别程序、大容量硬盘等等)的发展,这种研究方法在最近20~30年有了很大的发展。

McEnery & Wilson(1996)对使用语料库方法来进行语言学研究的发展归纳如表1.1。

根据英国Lancaster大学Taylor,Leech & Fligelstone等人在1989年的统计,英语的机读语料库当时已有36种,非英语的有18种。

Hofland等人(1999)更把18个大型的英语语料库制成ICAME (International Computer Archive of Modern English)英语语料库光盘(第二版),公诸于世。

中国英语学习者语料库CLEC(桂诗春杨惠中)

中国英语学习者语料库CLEC(桂诗春杨惠中)

中国英语学习者语料库CLEC收集了包括中学生、大学英语4级和6级、专业英语低年级和高年级在内的5种学生的语料一百多万词,并对言语失误进行标注。

其目的就是观察各类学生的英语特征和言语失误的情况,希望通过定量和定性的方法对中国学习者英语作出较为精确的描写,为我国学生的英语教学提供有用的反馈信息。

表1 CLEC语料分布类型词次ST2 208088ST3 209043ST4 212855ST5 214510ST6 226106总计1070602言语失误标注原则1.简单合理,易于系统操作。

参与标注的人比较多,分类表过于繁复,就难于掌握。

我们采取两级分类,第一级有11类:词形(fm)、动词短语(vp)、名词短语(np)、代词(pr)、形容词短语(aj)、副词(ad)、介词短语(pp)、连词(cj)、词汇(wd)、搭配(cc)、句子(sn)。

每一类里再用数目字细分。

如[cc]为词语搭配不当,[cc1]表示名词和名词的搭配,[cc2]表示名词和动词的搭配,[cc3]表示动词和名词的搭配,等等。

2.分类表的类别要适中。

过粗容易统一,但信息太少,不利于分析学习者的失误/过细难以统一,容易把同一种失误归到不同类别。

目前我们采取的办法是对常见的失误从细(如vp和np都有9小类),对少见的失误从粗(如cj只有两小类)。

现在的分类表有61个失误码,是属于中等规模的分类表。

提供足够的失误信息(失误本身、失误类型和失误发生范围)。

例如In the past, people are [vp6, 4-] kind to each other…, 失误用方括号表示,放在失误之后。

[vp6]为vp(动词)第6种(时态)失误,4-为失误发生的范围,-表示失误的位置,4表示失误前有4个词。

要联系这4个词,才能判断are这个词用错了。

开放性。

容许研究者根据需要对失误类型进行补充或进一步再分出细类。

例如[sn8]为句子结构有缺陷,研究者可以对这种失误再分为若干细类来研究。

英语教学中的错误分析

英语教学中的错误分析

英语教学中的错误分析作者:王粉梅来源:《教育界·下旬》2013年第07期【摘要】错误分析理论以语言学习者为研究对象,通过分析他们的语言错误来揭示学习过程中的一些规律性。

教师应当客观认识学生所犯错误,并进行理性分析。

在纠正学生错误时更应该采取灵活有效的方法,既帮助学生改正错误,又培养学生发现错误,改正错误的学习能力。

【关键词】英语教学错误错误的分类错误分析英语学习在我国的普遍性和重要性有目共睹,从幼儿园到大学我国拥有众多的英语学习者,他们在学习过程中难免犯错。

可以说学习者是在不断改正错误的过程中逐步提高自己的英语水平;教师是在不断指出并纠正学生的错误过程中改进和促进英语教学。

错误分析理论为从事语言教学的教师提了崭新的视角。

它以语言学习者为研究对象,通过分析他们的语言错误来揭示学习过程中的一些规律性。

桂诗春教授在《心理语言学》指出:通过对学习者错误分析能使教师发现学习者语言错误的个性和共性。

王初明教授在他的《应用心理语言学》中也提到学习者的语言错误是“一扇心灵的窗户,透过它我们可以窥视学习心理过程的奥秘,了解学习者的学习策略,探索中介语的发展过程和规律”。

可见错误不仅需要发现和单纯的指出,教师更要合理分析错误的性质、原因和错误类型,提供有效的纠错策略,真正把错误分析引入英语教学,才能收到实效。

一、什么是错误分析理论及错误的分类1967 年英国语言学家Corder发表论文 The Significance of Learner's Errors 标志着错误分析理论的诞生。

Corder认为学习者的语言错误反映了学习者当前所掌握的语言体系,对我们了解学习者的语言学习具有积极意义。

有了错误分析法,教师对学生所犯的语言错误不再停留在排斥、抵制和彻底清除的层面上,而是要对学生的语言错误进行科学分析,以求掌握学习者已经学习到什么程度、学习者如学习语言和学习者为什么犯错误等信息。

语言学家们依据不同的标准把外语学习者在语言学习过程中出现的错误做了不同的分类。

国内语料库语言学研究述评

国内语料库语言学研究述评
集 中 于 语 料 库 对 词 典 编 撰 的价 值 、 撰 方 法 、 编 以及 双 语 语 料
种新 的研 究方法 , 也代表着新 的思维方法 、 一种全新 的事
国 内语 料 库 语 言 学 的 建 设 与 发 展 在我 国, 2 纪2 代开始 , 从 O世 O年 有学 者 为 制 定 基 础 汉 字
次 。 1 9 广 州外 国 语 学 院 开 始 建 立 中 国学 生 交 际英 语 语 9 6年 料 库 。 外 由 广 东 外语 外 贸 大 学 桂诗 春教 授和 上海 交 通 大 学 此 杨 惠 中 教 授 牵 头 开 发 的 “ 国 学 习 者 语 料 库 ” C E 于 中 ( L C) 1 9 建 成 , 语 料 库 广 泛 收 集 了 包 括 我 国 中学 生 、 学 生 9 9年 该 大 在 内 的一 百 多 万词 的各 种 书 面语 资料 , 对 所 有 的 语料 进行 并 语 法 标 注 和 言 语 失 误 标 注 , 研 究 中 国学 习 者 的 英 语 特 点 具 对 有开创性意 义。 语 料 库 语 言 学 的研 究领 域 结 合 国 内研 究 实际 , 面 就 语 料 库 在 词 汇 、 义 韵 、 误 下 语 错
关键词 : 语料库 ; 语料 库语 言学; 究领域 研 中图分 类号 : H0 文献标识码 : A 文章编号 :O 4 3O 2 O ) 5 O 5 2 1O —4 1 (O 6O 一O 6 一O
词 典 是 使 用 中 的 语 言 的 纪 录 , 语 料 库 语 言 学 问 世 以 在
维普资讯
2 0 年 第 5期 06
N O. 2 6 5, 00
阜 阳师范 学院学 报 ( 会科 学版 ) 社
J u n l fFu a g Te c e sCo lg ( o il ce c ) o r a y n a h r l e S ca in e o e S

语料库在大学英语教育中的作用——以新升本科院校为例

语料库在大学英语教育中的作用——以新升本科院校为例

语料库在大 学英语教育 中的作用
— —
以新升本科院校为例
陆 兮 婷
吴 立 溪
410) 121
( . 南第一师范学院 ,湖 南长 沙 4 0;2湖 南科技大学 ,湖南湘潭 1湖 125 . 0

要 :文章针对 中国近年来新升本科院校英语教育的现实情况,探 索 了语 料库在 大学英语
教学 中的应用价值,多角度地研 究 了语料库在大学英语词汇、写作教学等方面的作用 。通过语料 库应用研 究来促进教学方 式多元化 ,进 一步推动英语教学的发展。 关键词:语料库;新升本科 院校;大学英语教 育
C— x) Ot t e 、语法、搭配和词语的不同用法( l ct nad hae l y 以及语用学等方面研 究了语料库 数据在 c l a o rso g ) oo i n p o 课堂 中的使用可行性 。【 l
我国的学习者语料库建设与研究始于 2 O世纪 8 0年代 中期 ,近三十年来发展迅速 ,一些研 究成果 已达
中出现 的错误进 行了深入分析 。 J 文秋芳教授主持建立 的中国学生英语 口笔语语料库可 以供英语教学研究 和学 习使用 ,也可作为教材编写 、教学测试 、网络课 程建设等 的重要参考依据 。 j 安平教授介绍和探讨 f 可 了语料库语言学应用于外语教育教学 的理论 与实践 ,并通 过解剖 大批研 究实例展示 了语料库研究 的方法和
中图分类号 :G 4 6 文献标识码:A 文章编号:1 0 - 1 5( 0 1 5 0 5— 3 0 9 8 2 1 )0— 研究
随着计算机科学的普及 ,语料库在语言教学中的应用发展得非常迅速。语料库指 的是 “ 大量文本材料
在计算机 中的输入的集合 ” 】 。【与计算机 融合的语料库 以容 量大 ,资料真 实,信 息提取快捷准确等独特优势 】 在现代语言教育 中发挥着越来越重要 的作用 。 些西方的语言学家们一直致力于语料库对语言教学的应用研究。 o rd认为语料语言 学的研究可 以 C na

语言学必读书目

语言学必读书目

语言学必读书目语言学必读书目有哪些呢?下面是店铺精心为您整理的语言学必读书目,希望您喜欢!语言学专业阅读书目1. 陈保亚《20世纪中国语言学方法论》,山东教育出版社,19992. 范晓《三个平面的语法观》,北京语言学院出版社,19963. 陆俭明《现代汉语语法研究教程》,北京大学出版社,20034. 陆俭明、马真《现代汉语虚词散论》,北京大学出版社,19855. 吕叔湘(1942)《中国文法要略》,商务印书馆,19826. 吕叔湘《汉语语法分析问题》,商务印书馆,19797. 吕叔湘《汉语语法论文集》(增订本),商务印书馆,19848. 马庆株《汉语动词和动词性结构》,北京语言学院出版社,19929. 马庆株《汉语语义语法范畴问题》,北京语言文化大学出版社,199810. 马庆株编《语法研究入门》,商务印书馆,199911. 沈家煊《不对称和标记论》,江西教育出版社,199912. 石毓智《语法的认知语义基础》,江西教育出版社,200013. 宋国明《句法理论概要》,中国社会科学出版社,199814. 游汝杰《汉语方言学导论》,上海教育出版社,199215. 袁家骅《汉语方言概要》(第二版),语文出版社,198316. 詹伯慧主编《汉语方言及方言调查》,湖北教育出版社,199117. 张伯江、方梅《汉语功能语法研究》,江西教育出版社,199618. 张敏《认知语言学与汉语的名词短语》,中国社会科学出版社,199819. 赵艳芳《认知语言学概论》,上海教育出版社,200120. 朱德熙《语法讲义》,商务印书馆,198221. 朱德熙《语法答问》,商务印书馆,198522. 赵金铭主编,对外汉语教学概论,商务印书馆,200423. 徐子亮、吴仁甫,实用对外汉语教学法,北京大学出版社,200624. 李泉主编,对外汉语教学理论研究,商务印书馆,200625. 王建勤主编,汉语作为第二语言的学习者语言系统研究,商务印书馆,200626. 王建勤主编,汉语作为第二语言的学习者习得过程研究,商务印书馆,200627. 孙德金主编,对外汉语词汇及词汇教学研究,商务印书馆,200628. 孙德金主编,对外汉语语法及语法教学研究,商务印书馆,200629. 李晓琪主编,对外汉语文化教学研究,商务印书馆,200630.陈昌来编,《应用语言学导论》,商务印书馆,200731.何自然,冉永平编著,《新编语用学概论》,北京大学出版社,200932.吴为善,《认知语言学与汉语研究》,复旦大学出版社,201133. Lappin, S. ed., 1998. The Handbook of Contemporary Semantic Theory(当代语义理论指南),487-507页,外语教学与研究出版社,布莱克韦尔出版社,200134. Levinson, S. 1983. Pragmatics(语用学),外语教学与研究出版社,剑桥大学出版社,200135. Saeed, John I. 1997. Semantics(语义学),外语教学与研究出版社,布莱克韦尔出版社,2000语言学必读书目《普通语言学教程》,索绪尔著,商务印书馆,1980《语言论》,布龙菲尔德著,商务印书馆,1990《现代语言学教程》,(上下)霍凯特著,北京大学出版社,1986、1987《句法结构》,乔姆斯基著,中国社会科学出版社,1979《句法理论的若干问题》,乔姆斯基著,中国社会科学出版社,1986《语言学说史》,康德拉绍夫著,武汉大学出版社,1985《现代语言学流派》,冯志伟编著,陕西人民出版社,1999《普通语音学纲要》,罗常培、王均编著,商务印书馆,1981《西方现代语言哲学》,周忠昌著,上海人民出版社1992《语义学》,利奇著,上海外语教育出版社,1987《语义学》,徐烈炯著,语文出版社,1995《生成语法理论》,徐烈炯著,上海外语教育出版社,1988《心理语言学》,桂诗春编著,上海外语教育出版社,1985《当代社会语言学》,徐大明等,中国社会科学出版社,1985《文化语言学》,(增订本)邢福义主编,湖北教育出版社,2000 《应用语言学》,刘涌泉、乔毅编著,上海外语教育出版社,1991《计算语言学概论》,俞士汶主编,商务印书馆,2003《语料库语言学》,黄昌宁、李涓子编著,商务印书馆,2002《对外汉语教学概论》,赵金铭主编,商务印书馆,2005《语言教学分析》,麦基著,北京语言学院出版社1991《语言学中的逻辑》,奥尔伍德等著,河北人民出版社,1984《语言逻辑分析(语言学家关注的一切逻辑问题)》,麦考莱著,杭州大学出版社1989 《20世纪中国语言学方法论》,陈保亚著,山东教育出版社,1999《语言学方法论》,桂诗春等著,外语教学与研究出版社,1997 《二十世纪的中国语言学》,刘坚主编,北京大学出版社,1998 《中国语法学史稿》,龚千炎著,语文出版社,1987《汉语和汉语研究十五讲》,陆俭明、沈阳,北京大学出版社,2003《语言学前沿与汉语研究》,刘丹青主编,上海教育出版社,2005《汉语语法学》,邢福义著,东北师范大学出版社1997《语法讲义》,朱德熙著,商务印书馆1982北大语言学及应用语言学专业研究生必读书目朱德熙(1982)《语法讲义》北京商务印书馆语法研究入门马庆株(编)吕叔湘(1984)《汉语语法论文集(增订本)》北京商务印书馆赵元任(1959)《语言问题》北京商务印书馆1995赵元任(1968)《汉语口语语法》北京商务印书馆1979丁声树等(1961)《现代汉语语法讲话》北京商务印书馆朱德熙(1980)《现代汉语语法研究》北京商务印书馆朱德熙(1985)《语法答问》北京商务印书馆朱德熙(1990)《语法丛稿》上海上海教育出版社林焘、王理嘉(1992)《语音学教程》北京北京大学出版社王理嘉(1991)《音系学基础》北京语文出版社王洪君(1999)《汉语非线性音系学》北京北京大学出版社符淮青(1996)《词义的分析与描写》北京语文出版社刘叔新(1990)《汉语描写词汇学》北京商务印书馆陆俭明(1993)《八十年代中国语法研究》北京商务印书馆陆俭明(1993)《现代汉语汉语句法论》北京商务印书馆陆俭明(1994)《陆俭明自选集》郑州河南教育出版社陆俭明(2003)《陆俭明选集》长春东北师范大学出版社陆俭明马真(1999)《现代汉语虚词散论(修订本)》北京语文出版社沈阳(1994)《现代汉语空语类研究》济南山东教育出版社沈阳(2000,主编)《配价理论与汉语语法研究》北京语文出版社沈阳郑定欧(1995,主编)《现代汉语配价语法研究》北京北京大学出版社沈阳何元建顾阳(2000)《生成语法理论与汉语语法研究》黑龙江出版社袁毓林(1998)《现代汉语动词的配价研究》南昌江西教育出版社袁毓林(1998)《语言的认知研究和计算分析》北京北京大学出版社袁毓林郭锐(1998,主编)《现代汉语配价语法研究(2)》北京大学出版社郭锐(2002)《现代汉语词类研究》北京商务印书馆詹卫东(2000)《面向中文信息处理方向的汉语短语结构规则研究》清华大学出版社张伯江方梅(1996)《汉语功能语法研究》南昌江西教育出版社张敏(1998)《认知语言学与汉语名词短语》北京中国社会科学出版社徐烈炯(1988)《生成语法理论》上海上海外语教育出版社徐烈炯(1990/1995)《语义学》北京语文出版社徐杰 (2001)《普遍语法原则与汉语语法现象》北京北京大学出版社邓思颖(2003)《汉语方言语法的参数理论》北京北京大学出版社石定栩(2002)《乔姆斯基的形式语法》北京北京语言文化大学出版社宋国明(1997)《句法理论概要》北京中国社会科学出版社龚千炎(1987)《中国语法学史稿》北京语文出版社邵敬敏(1990)《汉语语法学史稿》上海上海教育出版社陈保亚(1999)《20世纪中国语言学方法论》济南山东教育出版社古代汉语郭锡良商务印书馆古汉语词汇纲要蒋绍愚说文解字注段玉裁中华书局说文解字许慎中华书局汉语史稿王力中华书局音韵通讲耿振生河北教育出版社音韵学教程唐作藩北大出版社现代汉语北大中文系现代汉语教研室商务出版社八十年代中国语法研究陆俭明词汇的分析与描写符淮青语文出版社现代汉语词汇研究符淮青语言学概论(语音、词汇) 贺阳、沈阳语文出版社语言学纲要叶蜚声、徐通锵北京大学出版社20世纪中国语言学方法论陈保亚山东教育出版社现代语言学教程 [美]霍凯特北大出版社普通语言学教程[瑞士]索绪尔商务印书馆汉语方言概括袁家骅语文出版社汉语方言导论游汝杰上海教育出版社语音学教程林焘、王理嘉北京大学出版社音系学基础王理嘉文字学纲要苏培成简明汉语史向熹高等教育出版社汉语方言及方言调查詹伯慧湖北教育出版社。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2010年11月November 2010第33卷第4期Vol.33No.4现代外语(季刊)Modern Foreign Languages (Quarterly )语料库语言学与中国外语教学桂诗春冯志伟杨惠中何安平卫乃兴李文中梁茂成[编者按]为推动我国应用语言学研究的新发展,教育部人文社科重点研究基地———广东外语外贸大学外国语言学及应用语言学研究中心于2010年9月24-25日成功举办了“首届广外应用语言学论坛”,庆贺我国著名语言学家、应用语言学学科的开拓者桂诗春教授八十华诞。

期间,举行了题为“语料库语言学与外语教学”的高层论坛,就语料库语言学的现状、发展前景及语料库的建设、共享、应用等展开了互动讨论。

以下是根据专家发言,整理后的主要内容。

[中图分类号]H319[文献标识码]A[文章编号]1003-6105(2010)04-0419-08语料库语言学的发展前景与资源共享广东外语外贸大学桂诗春1.语料库语言学的发展前景语料库语言学在外国和国内都发展很快,有的人选择了它作为发展方向,因为它的入门比较容易,上手较快;有的人把语料库语言学作为收集数据的重要手段。

但是总的来说,我们的语料库研究还处在比较初级阶段,需要提高。

究其原因是很多人把它看成是一种工具或手段,可以运用现有的一些现成的程序和公开的语料库,如Brown ,LOB ,Frown.Flob ,BNC ,CLEC ,只要选题得当,就能获得很多量化的数据,从而写出洋洋洒洒的文章来。

在计算机和扫描仪的支持下,自行收集一些语言素材,建立一个特定的语料库,也不是什么难事。

我觉得,语料库语言学既是一种工具,但更是一门学科;它是对语言行为进行概率性归纳和概括的一门学科,它本身是跨学科性的,要做语料库语言学研究必须许多方面要有比较雄厚的基础。

首先是数学和统计学。

Herdan (1960)的一本早期著作,叫做《词次/词型数学》(Type /token Mathematics ),其副标题就是《数理语言学教科书》(A Textbook ofMathematical Linguistics ),当时还是前计算机时代,但Herdan 觉得有两件语言事实值得我们注意:一是大量语言资料(language inmass ),二是语言排列(language in line ),它们是任何语言运作都不能离开的两个方面。

某些语言学研究分支如果考虑到这两个方面,将会从中获益。

当时还没有真正的机读语料库,Brown 的语料库在1967年才面世,美国心理学家John Carroll 根据该语料库以及他后来参与制作500万词的AHI 语料库,所提出的词汇频数对数正态模型(lognormal model )均源于Herdan 所奠定的基础。

一直到最近美国Barber 利用计算机对英语语体的各种研究,更是利用了因子分析的统计方法。

其次是计算机科学。

语料库的发展离不开现代科学技术,其主要表现是个人电脑、扫描仪和大容量硬盘的普及,当初Brown 语料库要动用到大型电脑,而到如今,只需一万元左右就能在家里拥有这些设备,制作出甚至比Brown 还要大的语料库。

但是我们往往只注意到硬件部分,而不认识到软件的建设。

从事语料库语言学研究的人而不掌握一到两种编成语言,也不可能拓展他们的研究领域,因为他不能根据个人的研究需语料库语言学与中国外语教学1.双语料库的建设我很赞同桂诗春教授的意见,积极推进语言资源的共享,语料库只有共享才能变成财富,如果把语料库的研究成果“藏诸名山,束之高阁”,只是一堆数据垃圾,必将自毁前程。

桂诗春教授刚才提到宾西法尼亚大学的Linguistic Data Consortium (我建议最好翻译为“语言数据联盟”,简称LDC ),是一个很好的供语料库语言学研究者进行交流互动的平台。

在语言数据联盟和其他相关机构的帮助下,研究者们可以获得口语和书面语的大规模的语料。

重要的是,在这些语料中还包括一些标注过的语料,如宾州树库(Penn Treebank ),布拉格依存树库(Prague Dependency Tree Bank ),命题库(PropBank ),宾州话语树库(PennDiscourse Treebank ),修辞结构库(RSTBank )和TimeBank (我不知道TimeBank 这个名称如何翻译为中文)。

这些语料库是带有句法、语义和语用等不同层次的标记的标准文本语言资源。

这些语言资源的存在大大地推动了人们使用“有监督的机器学习方法”(supervisedmachine learning )来处理那些在传统上非常复杂的自动句法剖析(automatic syntactic parsing )和自动语义分析(automatic semantic双语语料库的建设与用途国家教育部语言文字应用研究所冯志伟要,通过计算机自行编程来检验假设。

此外,要做语料库语言学研究,文本分类(又叫文本分析或内容分析)也必须具备雄厚的基础。

它的研究范围也很广,从信息的提取、组织、储存,文本(包括语体)的分析,社会舆论调查,著作归属到文本格式。

这也牵涉到许多统计学知识和计算机知识。

数理语言学和计算机语言学的研究对象是文本和语篇。

有志于研究这门科学的必需具有这些基础训练,否则不会走得很远的。

我觉得,当务之急是让我国语料库语言学的先行者们聚在一起,研究语料库语言学作为一门科学应该在什么层次上开设?它有什么基本内容?由哪些核心课程组成?只有规范语料库语言学专业的课程,按照这些课程设置来培养我国语料库语言学的学生,他们才能高瞻远瞩,取得真正的进展。

2.资源共享问题语料库语言学对资源有很大的依赖性,为了促进语料库语言学在我国的发展,应该提倡资源共享。

回顾语料库语言学在国外的迅猛发展,和资源共享有密切的关系。

共享的方法有多种:一是免费提供,最典型的例子是GeorgeMiller 领衔制作的英语大型词汇数据库Wordnet 受到各方面资助,前后参与制作的不下一千人,而且还在不断完善。

他们认为这不是一个商品,应该为公众所有。

二是提供网上服务,整个语料库不提供,但是在网上可以自由检索获得数据,像美国Brigham Young 大学的Mark Davies 在他的网页上检索美国现代英语语料库、美国历史英语语料库、英国国家语料库、《时代》杂志语料库、西班牙语语料库、葡萄牙语语料库以供检索。

三是成立语料库分配中心,收少量成本费提供语料库,像挪威的ICAME (International Computer Archive of Modern and Medieval English ),美国的LDC (The Linguistic Data Consortium ),等等。

一些语料库工具,如TACT 、LEXA ,Wordcruncher ,Wordsmith 、Antconc 也都很容易在网上获取。

资源共享的理念是,只要有更多的人使用,我们所开发的资源、工具才能完善,学科才能发展。

只有互通有无,才能共同协作,才能减少重复劳动,制作出更成熟的成品。

4201.语料库语言学的应用研究这次专题讨论的题目“语料库语言学与外语教学”我觉得很好,很及时。

语料库语言学本来就是实践性、应用性很强的一门学科,语料库语言学的应用研究与贡献上海交通大学杨惠中analysis )等问题。

这些语言资源也推动了有竞争性的评测机制的建立,评测的范围涉及到自动剖析(parsing )、信息抽取(informationextraction )、词义排歧(word sense disambiguation )、问答系统(question-answer system )、自动文摘(automatic summarization )等领域。

几年前由中国中文信息学会发起,在北京创建了“中文语言数据联盟”(ChineseLinguistic Data Consortium ,缩写为CLDC ),是一个自愿组成的学术性社会团体,其宗旨是团结中文语言资源建设领域的广大科技工作者,建成代表中文信息处理国际水平的、通用的中文语言和语音的资源库。

欢迎语言学界的同仁积极参与CLDC 的工作,促进语料库资源的共享。

目前单语语料库很多,已取得煌煌的成绩,但双语并行语料库(parallel corpus )不容易获得,它的构建和加工是很困难的工作。

我国还没有高质量的、大规模真实文本的英汉双语语料库,更没有成熟的、可共享的加工工具,最近公布的2010年国家社会科学基金重大项目中有一项就是“大规模英汉平行语料库的构建与加工研究”,资助强度大约是50万元左右,可见国家对于双语语料库建设的重视。

这个项目是我和王克非教授在今年的社科基金评审会议上建议提出的,已开始招标,希望大家积极投标,积极推进我国的双语语料库建设。

2.如何将语料库语言学运用到外语教学,如何从语料库中挖掘知识?我认为英汉双语语料库的最大用途就是推进英语教学,我们可以从双语语料库中抽取教材的原材料,帮助语言学习者提高对于真实语言材料的语感,从而编写出高质量的外语教材。

有的外语老师冥思苦想地根据自己的语感来编写教材,费时费力,其实,如果依靠英汉双语平行语料库,就可以减轻搜集素材之困难,大大提高编写教材的工作效率。

另外,语料库中蕴藏着无比丰富的知识等待我们去挖掘,如果我们使用“文本数据挖掘”(text data mining )的技术,从语料库中挖掘知识,既可以挖掘语言学的知识,也可以挖掘非语言学的知识,就像从矿石中挖掘出黄金一样,这些知识可以弥补传统语言学的不足,克服研究者的主观性和片面性。

我们在text data mining 这个术语中使用mining (挖掘)这个单词,而没有使用extraction (抽取)这个单词,正是为了强调在从语料库中获取知识的时候,要开动脑筋,要经过一番“去粗取精,去伪存真,由此及彼,由表及里”的深思熟虑的功夫来加工数据,而不要被海量的数据所迷惑。

数据就像矿石,我们的任务是从海量的数据中挖掘出隐藏在其中的有规律性的东西,把海量的、离散的“数据”(data )变为精炼的、系统化的“知识”(knowledge ),从而把经验主义方法和理性主义方法紧密地结合起来。

这种知识获取方法上的巨大变化,有可能引起整个语言学研究的“战略转移”(strategytransit );我们中国的语言学家应当敏锐地关注“战略转移”问题,做出我们的应有的贡献,千万不要错过这个在语言学历史上千载难逢的良机。

桂诗春冯志伟杨惠中何安平卫乃兴李文中梁茂成421语料库语言学与中国外语教学脱离了应用,坐而论道,也就失去了发展的基础和动力,将变成无本之木、无源之水。

外语教学正是语料库语言学的重要应用领域,语料库语言学以实际使用中的语言事实作为研究对象是一种着眼于语言运用的研究方法(performance-based approach),因此跟语言教学有着直接的关系,对真实语言交际的各个方面,包括词汇的、句法的、语义的、语用的、语篇的,进行深入的探讨和全面的描写,其研究成果可以应用在教学大纲设计中,为确定教学内容、制定教学目标提供坚实可靠的决策依据。

相关文档
最新文档