大数据背景下语料库在英语教学与科研中的应用

龙源期刊网 https://www.360docs.net/doc/cf1335643.html,

大数据背景下语料库在英语教学与科研中的应用

作者:张薇

来源:《新丝路杂志(下旬)》2017年第09期

摘要:在大数据和计算机技术盛行的21世纪,传统的结构主义语言学、转换生成语言学、系统功能语言学已经不足以支撑现代英语教学与科学研究,语料库语言学的兴起已经成为一种必然。本文拟从语料库的定义和主要类型、语料库的建立和研究领域、以及语料库在英语教学和科研中的具体运用等方面进行探讨,希望对英语教育者在语料库的运用和建立方面有所借鉴。

关键词:语料库;语料库语言学;检索软件

21世纪的今天计算机和网络技术日新月异,所带来的变化不仅体现在随处可用的无货币

交易上,也体现在英语教学和研究的方法革新上。语料库语言学作为一种介于计算机科学和语言学之间的新兴边缘学科进入英语教育者和研究者的视野;语料库也卸下神秘的面纱成为一种日益普及的教学与科研方法,以其特有的精确和迅捷席卷全球,势不可当。

一、语料库的定义和主要类型

语料库(Corpus)一词来源于拉丁文,意为“人体”。它是指由大量经过科学抽样和计算机处理的电子文本所形成的数据库,借助计算机检索软件可从事理论或实践方面的语言学研究。英国语言学家约翰·辛克莱(John Sinclair)是公认的语料库语言学之父,著有《语料库·检索·搭配》(Corpus Concordance Collocation)一书,打破了乔姆斯基转换生成语法的统治,将实证主义结合信息技术带入语言研究当中来。20世纪80年代,因为计算机硬件的发展与普及,相关软件的开发与运用,以计算机检索为手段、以电子文本为主要构件的计算机语料库

建立起来,而语料库语言学也进入到了一个迅猛发展的全新时期。

根据不同标准,语料库可以分为多种类型:如通用语料库和专用语料库;共时语料库和历时语料库;口语语料库和书面语语料库;本族语语料库和学习者语料库;单语语料库和多语语料库以及双语/平行语料库,多模态语料库等。常用语料库有BNC(British National Corpus),COCA(Corpus of Contemporary American English),ANC(American National Corpus),BOE(Bank of English)等。

二、语料库的建立和研究领域

要建立一个语料库首先要搞清楚建库目的,即通过建立该语料库企图解决的具体问题是什么?以及搜寻的文本对象是哪一类?附码类型是词性码还是语法码?该语料库是否具有代表

相关文档
最新文档