英汉语语料库在语言研究中的应用

合集下载

语料库研究方法在话语研究领域的应用综述

语料库研究方法在话语研究领域的应用综述

2252020年42期总第534期ENGLISH ON CAMPUS语料库研究方法在话语研究领域的应用综述文/孟 莹话语研究提供一些参考意见。

一、语料库与话语研究的核心特征许家金在其著作《语料库与话语研究》中指出,语料库研究的核心特征可概括为“用”“量”“器”“聚”四个方面。

“用” 即尊重语言事实和关注用法。

语料库研究以对语言使用的充分描写为根本。

“量”主要是指需要通过“量化”的分析方法进行语言学研究。

“量”在统计上,主要通过频次得以体现。

根据语料库研究的基本思想,语言属于概率性现象。

Halliday认为概率性是对语言实例的模仿,也是一种理论构念,并且这种构念体现为一种“聚合”或是“共现”关系,我们称之为“聚”。

不论是语言成分之间的关联,还是语言成分与社会学变量之间的共选关系,最终都要通过概率统计以及语料库分析工具来揭示,即“器”。

在这四项特征中,“用”“量”“器”涉及语料采集、语言特征的量化统计分析及语料库工具的运用,它们都与研究方法紧密相关,而“聚”则体现语言学理论的最终归宿。

话语研究现已成为一个独立的语言学分支学科,批判性话语分析学者倡导使用“话语研究”(discourse study)这一概念来代替“话语分析”(discourse analysis)。

The Handbook of引言语料库研究与话语研究之间存在天然的亲和力和兼容性。

不难发现很多语料库学者同时也是话语研究专家,例如Paul Baker、Douglas Biber、Michael Hoey等。

究其根本,语料库与话语研究都关注自然语言,并且都将语义研究作为重要目标。

语料库和话语研究的融合,一方面能为揭示话语意义提供丰富的语言例证和强大的分析方法;另一方面,语料库中的词汇共现、语言特征共现等创新思路为话语研究增添了理论维度。

另外,在语料库领域的代表性期刊International Journal of Corpus Linguistics 和Corpora 上总能见到较多的话语研究论文,而在话语语用研究期刊Discourse Studies 和Journal of Pragmatics 上,也有相当比重的研究采用的是语料库方法。

语料库语言学及其在语言学习中的应用

语料库语言学及其在语言学习中的应用

语料库语言学及其在语言学习中的应用随着计算机技术的发展,语料库语言学在语言学中日益被重视。

语料库语言学是指运用计算机分析大规模语言语料库的一门学科。

语料库语言学的基本思想是依赖数据出发,通过对大量实际语言使用中的文本数据进行统计和分析,揭示语言的规律和规则。

这种方法能够根据实际的语言使用情况,去除主观的预设规则,使语言的研究更接近于实际情况,有助于提高语言教学质量。

一、语料库语言学的基本思想语料库语言学的基本思想是依赖数据出发。

语料库语言学是指运用计算机分析大规模语言语料库的一门新兴学科。

它的研究对象是实际使用中的语言文本,其目的是探究语言的规律和规则。

因此,语料库语言学的基本思想是建立在大量的真实语言数据的基础上的。

通过对大量真实的语言文本进行分析,统计出语言的规律和规则,从而更加准确地描绘出语言的本质,帮助我们更好地了解语言。

二、语料库语言学在语言学习中的应用语料库语言学在语言学习中有许多的应用,例如:1. 调整教学重心语料库语言学可以根据语料库中的文本数据,分析词汇和语法的使用频率,识别出高频词语和常见语法,可以为语言学习者提供更加实用、更加贴近实际的课程内容。

通过提供实际使用频率较高的词汇和语法内容,可以使学生更快地适应实际语言环境,提高学习效率,帮助学生更好地掌握语言。

2. 帮助学生结合实际语境学习语言语料库语言学可以提供真实的语料库数据,可以帮助学生更好地理解词语和语法的实际应用。

通过语料库分析,学生可以了解词语和语法在实际语境中的使用情况,帮助学生更好地掌握语言。

3. 提供语言交际中的真实场景语料库语言学可以提供真实的语言数据,可以帮助学生更好地了解语言交际中的真实场景。

通过语料库分析,学生可以更好地了解语言交际的真实场景,帮助学生更好地掌握语言。

4. 改善标准语音学习语料库语言学可以为标准语音学习提供更加科学的方法。

通过对语料库中的语音数据进行分析,可以找出发音和语音的规律和规则,根据这些规律,制定更加科学的语音教学计划,帮助学生更好地学习语音。

语料库在英语教学中的运用

语料库在英语教学中的运用

语料库在英语教学中的运用语料库是指由大量真实语言材料所构成的语言数据库,其中包含了各种语言用法的实例和模式。

在当今的英语教学中,语料库已经成为了一个不可或缺的工具。

通过利用语料库资源,教师们可以帮助学生更好地掌握英语,使他们能够更加自然地运用英语,避免单纯地翻译或者背诵。

一、语料库的定义语料库是指已存在的大量真实的语言使用情境,在语言学研究中它被视为一个很重要的研究工具。

语料库包括:写作、电子邮件、文章、电影和其他电子媒体中的语言使用等等。

这些使用情境被保存在计算机上,人们可以利用这些数据来进行研究或者制作词典等工具。

语料库被广泛应用于英语教学中,其主要用途是为学生提供真实的语言材料,并帮助他们更准确地掌握英语的用法、语法和词汇。

二、语料库在英语教学中的应用2.1 词汇教学语料库可以帮助学生更好地掌握英语词汇的使用方式。

通过词汇分析工具,教师可以帮助学生区分及分析动词或形容词在具体语境中的不同含义,以及它们在不同语言环境中的各种用法。

同时,语料库也为学生提供了更为准确的翻译和使用方式,而不是传统方法中的简单背诵单词和语法规则。

2.2 语法教学语料库可以帮助学生更深入地了解英语语法规则。

教师可以使用语料库分析工具来帮助学生发现英语语法规则中的差异和结构,从而使他们更清楚地了解英语的语言习惯。

同时,语料库还可以帮助学生了解英语中常用的语法结构,包括时态、语态、语气等等。

2.3 写作教学语料库也可以应用于英语写作教学。

它可以为学生提供范文和写作模式,并且可以为学生提供实时反馈。

例如,同学们可以用语料库查找类似主题的文章,从中学习常用词汇、句子和段落结构,以及表达方式。

这些功能都有助于学生提高英语写作能力。

三、语料库在英语教学中的优点语料库在英语教学中具有以下优点:3.1 真实性语料库中包含的语言使用是来自真实场景,可以使学生学习到更为真实的英语的使用方式,同时还可以帮助学生逐渐融入英语社区。

3.2 灵活性教师可以通过语料库快速获取所需材料,因此教学变得更加灵活和高效。

教学型汉英口语平行语料库语料研究

教学型汉英口语平行语料库语料研究

教学型汉英口语平行语料库语料研究随着全球化的不断发展,汉语和英语作为世界上最重要的语言之一,越来越多的人开始学习这两种语言。

为了更好地促进汉英口语教学的有效性和效率,构建和利用教学型汉英口语平行语料库成为了当前语言教学研究的一个热点话题。

教学型汉英口语平行语料库是指收集并整理汉语和英语口语表达的语料库,进行研究和分析,以帮助汉语和英语学习者更好地掌握口语交流能力。

一、平行语料库的意义教学型汉英口语平行语料库对于口语教学的意义重大。

通过对实际口语语料的收集和整理,可以帮助学习者更好地了解和掌握两种语言的口语表达习惯和特点,提高口语交际能力。

通过对语料库的研究和分析,可以为口语教学的教材编写提供可靠的语言参考和实例。

通过对口语语料的比对和对比分析,可以帮助学习者更好地理解两种语言之间的异同之处,减少语言障碍,提高口语表达的自信心和有效性。

二、语料库的构建教学型汉英口语平行语料库的构建需要进行大量的数据收集和整理工作。

需要搜集并整理汉语和英语口语表达的实际语料,包括日常口语、学术口语、商务口语等多种领域的口语表达。

需要对收集到的语料进行整理和分类,建立起不同领域和场景的口语语料库,以便进行后续的研究分析和应用。

需要对语料库进行不断更新和完善,以保证语料库的时效性和可用性。

教学型汉英口语平行语料库的研究内容主要包括对口语语料的分析和比较,以及对口语特点和表达习惯的研究。

需要对两种语言的口语表达进行比较分析,找出其共同点和不同点,揭示其语言特点和表达习惯。

需要对口语语料进行分类和整理,形成常用口语表达的语料库,并对语料库进行统计分析,找出其使用频率和语法规律。

需要对口语语料进行语用分析,揭示其语言功能和交际特点,为口语教学提供理论依据和实践指导。

教学型汉英口语平行语料库的构建和研究对于促进汉英口语教学和促进汉英语言交流具有重要的意义。

在未来的研究工作中,我们需要进一步深入研究和利用语料库,探索其更多的应用领域和潜在价值,不断提高其信息化水平和智能化程度,为语言教学和语言研究提供更加丰富和可靠的语言资源。

语料库在语言教学中的应用

语料库在语言教学中的应用

语料库在语言教学中的应用
语料库在语言教学中有很大的应用,可以帮助语言教师更有效地
进行教学。

首先,语料库可以帮助语言教师熟悉语言,掌握大量的词汇、句
式和语法结构等。

语料库从不同的角度分析语言,从而让教师了解如
何运用语言,以及如何表达某一情景或概念。

此外,对一门外语来说,语料库中收集了大量正确、有效的语言示例,有助于教师学习新的语
言知识,也可以让他们更好地提高自己学习语言的效率和能力。

其次,语料库可以帮助教师更准确地理解语言课程。

使用语料库
可以让教师清楚地了解学生在接受和使用语言知识上的特点、能力和
障碍,从而有针对性地教授语言,更好地满足学生在学习语言方面的
需求。

最后,使用语料库可以让教师更深入地研究语言,让学生在课堂
上更好地学习。

语料库提供了更多资料,可以让学生更深入地学习语言,从而更准确地掌握语言知识,并在实际场景中更好地运用。

此外,语料库的使用对于对学生的情感及态度也是非常有帮助的,它可以让
学生收获更多关于语言的知识,并真正体会语言的乐趣。

总之,语料库在语言教学中具有重要作用,它可以帮助教师和学
生更有效地学习和使用语言。

语料库研究技术在语言教学中的应用

语料库研究技术在语言教学中的应用

语料库研究技术在语言教学中的应用随着计算机和网络技术的飞速发展,语言研究也逐渐进入了数字化时代。

语料库研究技术作为一种新兴的语言研究方法,被广泛应用于语言教学领域。

本文将从语料库研究技术的基本概念、特点及其在语言教学中的应用等方面进行论述。

一、语料库研究技术的基本概念和特点语料库是指一个特定的语言使用的实际样本集合,它涵盖了不同类型的语言数据,包括口头语、书面语、纯文本、音频、视频等。

语料库研究技术是在计算机和网络技术的支持下,将语言数据经过系统处理和分类、统计分析、代表性抽样等方法,得到有关语言使用规律及语言变化的信息。

语料库研究技术的主要特点包括以下几个方面:1.大规模数据:语料库所涉及的数据量往往是庞大的,这对于数据的收集,分类和处理提出了挑战。

2.实际性:语料库所涉及的数据是从实际的语言使用情况中收集而来的,具有非常强的实际性和代表性。

3.系统性:语料库研究技术采用切实可行的方法对数据进行处理,质量和准确性有了保障,从而得到更客观、准确的结论和推断。

二、语料库研究技术在语言教学中的应用语言教学是语料库研究技术应用的一个非常重要的领域,尤其是在语言教学的词汇、语法、语用等方面,语料库研究技术具有非常丰富的应用前景。

以下是语料库研究技术在语言教学中的具体应用:1.词汇教学:语料库研究技术可以根据语料库中所涉及的词汇频率、搭配、义项等信息,为词汇教学提供更全面、准确的语言规律。

通过语料库技术,教师可以更好地掌握学习者需要掌握的生词、固定搭配及其语用功能,使学习者更加自然、流利地使用目标语。

2.语法教学:语料库研究技术可以通过对语料库的分析,提炼出目标语的语法规则和常见的语法错误,帮助学习者掌握语法知识。

同时,语料库研究技术还可以帮助学习者更好地理解目标语言的语法习惯和特点,提高学习者对不同语言体系之间的转换能力。

3.口语教学:语料库研究技术通过对语音和语音流程的分析,可以帮助教师在口语教学中更好地帮助学习者改善发音、掌握语音规则、加强口语表达能力。

英汉语料库应用研究

英汉语料库应用研究

1 基 于语 料 库 语 言学 的“ 据 驱 动 数 学 习" 论 理
语料 , 即语 言材 料 , 自然 发 生 的语 言 ( 是 包
收 稿 日期 :0 10 —9 2 1-40
北方工业大学校级课题“ 英语专业 ‘ 三点一线 ’ 实践教学体 系构建” 的部分成果 。 作者简介 : 李翔 , 博士 , 副教授。研究方 向: 语料库语言学 、 外语教学 。
重 视 , 其 实践 性不 像 物 理 或化 学 实验 课 那 样 但 直 观 , 以 常常 没有 看 作 是实 践 教 学 内容 的 一 所 部分 。随着教 育部 和各 高等 院校对 实践 教学 的

19 9 1年 , 国伯 明翰 大 学 Ti J h s 授 英 m o n 教
指 出“ 料库 不 应 只 为研 究 者 所 利 用” 并 提 出 语 ,
种基 于语 料库数 据 的“ 据 驱 动学 习” D t- 数 ( aa
其主要 思想 是引 导学 生对大 量真 实语 言材料 进 行观察 , 现 、 括 、 发 概 归纳语 言用法 和语 法规 则 。
D L方法 至 少 具 有 4个 特 征 : ) 学 生 为 中 D 1以
Dr e e rig 简称 D ) 言 学 习方 法 。 ] i nL ann , v DL 语 _ 1
计 与 定 性 分 析 相 结 合 的一 种 新 的语 言 研 究 范
式 。随着 计算 机文 字处 理技术 的发 展 以及 网络 的普 及 , 语料库 的发展呈 现 出规模大 、 能强 和 功 应 用范 围广 的趋势 。
学 习活动 ( 如英 语 角 ) 竞 赛 ( 英 语 辩 论赛 ) 或 如 , 即“ 第二 课堂 ” 3 校外工 作实 习 。其 中第 二 、 ;) 三 个 环节 实 践 性较 强 , 一个 环 节 尽 管一 直 受 到 第

如何利用语料库辅助语言教学与研究(BNC)

如何利用语料库辅助语言教学与研究(BNC)

如何利用语料库辅助语言教学与研究(BNC)一、绪言语料库是专门用于语言材料检索和统计的工具,包括为某一目的而收集的大量电子文本(加标注或未加标注)和专门的语料检索和管理程序。

其最大的特点是能快速提供大量真实的语言材料并进行相关统计(如词频和搭配词等),已广泛运用于词典、教材、语法书和词汇表等的编纂及语言研究中。

然而,语料库在日常外语课堂教学和学生自主学习中并没有得到广泛运用,至少在中国是如此。

这一方面是由于对语料库在教学中的运用缺乏有力推广,加价格、市场等因素使得购买商用语料库有难度,自己建设语料库又需花费较大精力,另一方面人们对如何获取网上免费语料库资源缺乏了解。

语料库在日常英语课堂教学和学生自主学习中能够起到多种作用。

作为一种高效的语言检索工具,它所提供的大量真实语言实例能提示从构词、词短语到句法结构乃至语篇几乎所有语言单位的语言生态(language ecology),包括语境、搭配规律、使用频率、语义和语用等。

语料库的获得和个人建设虽然面临诸多困难,但幸运的是,开放的互联网为广大英语教师和英语学习者提供了接触和使用语料库的机会。

二、网络语料库的运用1.英语单语语料库目前,语料库运用于日常英语课堂教学的主要还是英语单语语料库,互联网上的情况也是如此。

网上有许多大型通用语料库(单语)提供在线检索,其免费服务虽功能有所限制,但已能满足中学英语教学和学生自主学习的需求。

如1亿词次的英语国家语料库(BNC)(/)和5600万词次的柯林斯在线词库(Collins Wordbanks Online)(www. Collins./corpus/CorpusSearch.aspx)。

二者均是当今较权威的英语语料库,其语料语域广泛,有较好代表性,且均做了词性赋码(Part-of-speech tags)。

这些在线检索提供通配符功能(wildcard)、连续和非连续的词组或搭配检索功能(word combination),并能指定检索词词性,功能强大,检索方便,可在日常中学英语教学中加以运用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(3)检索带通配符的词,通配符有“*”和“?” 两种,“*”代表任何多个任意字符,“?”代 表一个任意字符。
a. 检索“un*ly”,在第一检索栏words输入它既 可,下面的collocates和pos list不选,点击search 就可以得到所有的以un开头和ly结尾的词。
b. 检索“r?n*”词,“?”只代表一个任意 字符,操作如检索“un*ly”。
(2)随机数字法
翻到随机数字表任何一页,在任意一行或列开始,如你 的处理数字最大为9(即处理号1到9),则从任何一行 一组数据开始(如03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45 60 11 14 10 95 ),除去重复的数字 和0外,依次找到的数字(347869125)即是随机数字; 如你的处理数字大于9时,如12,则从任何一行一组数 据开始,(如03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45 60 11 14 10 95 )每三位一组如347除以12 得到的余数就是随机数字。
b. 也可检索某个词有特定关系的词,如靠 近eyes的所有“clos*”词,在第一检索栏输 入eyes,在collocates中输入“clos*”,检索 即可。
(5)检索同义词分布。 a. 如检索beautiful的形容词的分布,在第一检
索栏words中输入“[=beautiful]”,再选 sections,点击show打上钩就可,即可检索。
应用于词典编纂,语言教学,传统语言研究, 自然语言处理中基于统计或实例的研究等方面。
二、英汉语大型语料库简介
序号
序号
名称
名称
库容
库容
网址
网址
1
British National Corpus 400 m
/bnc/
m /
c. 检索带-ed的所有形容词,可以在在主页的 左上角第一检索栏words输入 “*ed.”,然后 点击pos list选参数“adj.all”,则第一检索栏 自动变为“*ed.[j*]”,就可以检索了。
(4)、检索搭配的词。
a. 检索靠近某个名词,动词,形容词或副词的 词。如检索靠近woman的所有形容词,在主页 左上角search string下的第一检索栏words输入 “[woman]”,然后点击collocates,再点击pos list选“adj.all+”,collocates中自动出现“j*”, 检索即可。
.tw/kiwi/m kiwi/index.html
三、 语料采集(以BNC为例)
(一)英国国家语料库(BNC)的使用方法 1. 网站: / 用户可以免费申请一个使用账户,用户名
是自己的电子信箱名。
2. 用户可以使用此语料库检索以下信息: (1)检索特定的词和短语。在主页的左上
角第一检索栏words输入要检索的内容,如 mysterious, 下面的collocates和pos list不选, 点击search即可。
(2)检索出某个词所有曲折变化的方法。 在主页的左上角第一检索栏words输入要检 索的内容,如[tall]、[sing],把检索的内容 放在方括号中。
8 北京大学汉语语言学研究 中心
英汉双语语料库
:8080/ccl_c orpus/index.jsp?dir=xiandai
9 中英双语在线 ChineseEnglish Online(CEO)
10 台湾现代汉语平衡语料库
500万
http://202.204.128.82/CEO/inde x1.html
英汉语语料库在 语言研究中的应用
讲座提纲
一、语料库定义 二、英汉语大型语料库简介 三、语料采集(以BNC和VOA为例) 四、语料处理 五、语料分析 六、小结
一、 语料库的定义
在语言学中,语料库(Corpus)指大量文本的 集合,库中的文本(称为语料)通常经过整理, 具有既定的格式与标记,特指计算机存储的数 字化语料库。
b. 同时比较几个同义词。如比较 stunning|gorgeous|charming,在第一检索 栏words中输入 “stunning|gorgeous|charming”,点击 search即可。
(6)比较两个词或近义词的分布。
a. 比较两个近义词。如small和little,men和 woman,先点击display 下的compare,然后输 入要比较的词,在collocates还可选择和他 们搭配的noun或adj参数,在pos list中选取 参数,自动出现在collocates中。
b. 比较两个词在不同文体中的分布。如 “illicit”和“illegal”, 先点击display 下的 compare,然后输入要比较的词,再在 section中选“来源”,点击搜索即可。
(二)VOA语料检索
CONCAPP软件介绍
四、语料处理
抽样方法 (1)抽签法 (2)等距抽样(K=N/n, a, a+k, a+2k, …)
Contemporary American
English (COCA)
3
The Bank of English
450 m /
4 国家语委现代汉语语料库 2000万 5 国家语委古代汉语语料库 1亿
/ /
6 北京大学汉语语言学研究 307,317, :8080/ccl_c
中心
060
orpus/index.jsp?dir=xiandai
现代汉语语料库
7 北京大学汉语语言学研究 中心
古代汉语语料库
:8080/ccl_c orpus/index.jsp?dir=xiandai
相关文档
最新文档