美国当代英语语料库COCA使用介绍

合集下载

运用语料库提升学生作文中词汇的运用能力--以 COCA的应用为例

运用语料库提升学生作文中词汇的运用能力--以 COCA的应用为例
还 存 在 一 定 的差 别 。 ( 2 ) 相 关 语 料 库 建 设 。 中 国 学 习 者 英
语 料 均 衡 。C 0 c A的语料来源 十分广泛 , 涵盖 1 9 9 0年 至 今 美 国英 语 多 个 领 域 , 覆 盖学术 期刊 、 报纸 、 口语 、 小说、 通 俗
语 语料库( C L E C ) 是语 言 教学 与语 料 库研 究 结合 的典范 , 该 语 料 库 为 多角 度 研 究 中 国 学 生 英 语 书 面 语 提 供 了语 料 支 持 。( 3 ) 用 语 料 库 进 行 写 作 教 学 。董 洪 学 等 以输 人 假 设 理
避 免 词 汇使 用 简 单 化 、 固定 化 。


语料库应 用与英语写作教学 ( 国内) 相 关 研 究
国 内 对语 料 库 应 用 于 写 作 教 学 的 研 究 有 以 下 几 个 方
便 可免 费使 用 。 在语 料 库 有 功 能 更 新 时 , 系 统 还 会 发 送 邮 件 给注册用户 , 让 用 户 体 验 最新 的 内 容 。( 2 ) C OC A 是 监 控 语 料库 , 语 料 在 不 断 更 新 和 发 展 。该 语 料 库 的更 新 频 率 为 每 年 一 到 两 次 。2 0 0 8年 推 出 至 今 , c Oc A 已经更 新多 次 ,
用 能 力 方 面 的优 势 , 帮 助 学 生 克服 写作 中 词 汇 的 运 用 障 碍 ,
二、 美 国 当 代 英 语 语 料 库 简 介
美 国 当代 英 语 语 料 库 ( C 0 C A) 是 语 料 库 语 言 学 与 现 代 网络 技 术 发 展 结 合 的 优 秀 成 果 , Ma r k Da v i e s ( 就 职 于 美 国

常用在线语料库使用简介

常用在线语料库使用简介

字串查询区
图5-1
COCA
5. COCA界面简介(图5-1)
语料库分类区
图5-1
COCA
5. COCA界面简介(图5-1)
查询结果排列 方式区
图5-1
COCA
5. COCA界面简介(图5-1)
查询结果数据显示区
图5-1
COCA
5. COCA界面简介(图5-1)
例句显示区/帮助信息显示区
图5-1
结果如图6.5-2
图6.5-1
图6.5-2
COCA
7. 新增功能 7.1 Words and Phrases (图7.1-1)
/
图7.1-1
COCA
7. 新增功能 7.1 Words and Phrases 7.1.1 Frequency List (图7.1.1-1)
COCA语料库规模大,涵盖美国1990-2012年间
口语(spoken)、小说(fiction)、流行杂志(pop magzine)、报纸(newspaper)和学术期刊 (academic)五大类型的文本 使用界面友好,检索速度快 时效性强,不断更新功能
COCA
5. COCA界面简介 三大功能区:
图6.1.1-4
COCA
6.1.2 检索某一词性的单词
输入“feature.[v*]”,可得到“feature”做动词时的使
用情况 (图6.1.2-1) “.”表示feature不与其后的字符串组成短语 “[v*]”代表所有形式的动词 点击POS LIST后的问号,可了解具体词性代码
在搜索结果区可得到“feature”的频数 (图6.1.1-2 )
点击该词,可在例句显示区看到含有“feature”的词条

美国当代英语语料库简介

美国当代英语语料库简介

美国当代英语语料库简介发表于《中小学外语教学(中学篇)》2013年第10期/s/blog_6056c9a60101nav5.html湖北:周韵【摘要】美国杨百翰大学的Mark Davies教授主持创立了一系列英语语料库,语料以各种英语变体为主,包括美国英语、英国英语、加拿大英语、《时代》杂志中的书面英语和美国肥皂剧中的英语口语。

其中,美国当代英语语料库是当前针对美国英语的大型历时语料平衡的网络语料库,具有库容大、语料丰富、检索方便灵活等特点。

本文介绍了美国当代英语语料库,以语料库及其关系数据库为平台,通过不同检索实例演示了以词汇为中心的应用与操作,以期探讨美国当代英语语料库在词汇教学中的应用。

【关键词】美国当代英语语料库,词汇教学,词汇检索,关系数据库一、美国当代英语语料库美国当代英语语料库(Corpus of Contemporary American English,简称COCA)是目前最大的免费英语语料库,也是第一个大型的语料平衡的美国英语语料库,口语、小说、流行杂志、报纸和学术性文体在语料库库容中各占20%。

它不仅是一个简单的在线词典,而且从建立之初就体现了其作为检索语料库的特征,能够协助研究者追溯语言发展中的变迁(Davies,2010)。

该语料库由美国杨百翰大学的Mark Davies教授主持创立并在2008年正式上线。

目前,每月有数以万计的包括语言学家、教师、翻译工作者在内的各种类型的研究者通过互联网免费使用该语料库。

美国当代英语语料库由包含4.5亿词的文本构成,这些文本由口语、小说、流行杂志、报纸以及学术文章五种不同的文体构成。

从1999年至2012年这五个部分以每年增加2亿词的速度进行扩充,以保证语料库内容的时效性。

语料库每年更新1~2次。

因此,美国当代英语语料库被认为是用来观察美国英语当前发展变化的最合适的英语语料库。

除了在语料上拥有其他语料库无法比拟的优势外,美国当代英语语料库还将语料和检索软件结合起来,帮助语言研究者方便、快捷地分析和研究语料。

coca等级词汇

coca等级词汇

coca等级词汇一、什么是COCA词汇等级COCA(Corpus of Contemporary American English)词汇等级是根据词汇在当代美国英语中的使用频率划分的。

COCA等级词汇分为五个等级,分别是:最常用词汇(Level 1)、较常用词汇(Level 2)、中等常用词汇(Level 3)、较少用词汇(Level 4)和极少用词汇(Level 5)。

二、COCA词汇等级的划分标准COCA词汇等级是根据词汇在COCA语料库中的出现频率划分的。

COCA 语料库包含了大量的当代美国英语文本,包括书籍、杂志、报纸、网络文章和口语等。

词汇等级的划分标准如下:1.最常用词汇(Level 1):在日常生活中、书籍、文章等方面频繁出现的词汇。

2.较常用词汇(Level 2):在一般阅读材料中经常出现的词汇。

3.中等常用词汇(Level 3):在特定领域或专业文章中出现的词汇。

4.较少用词汇(Level 4):在较为生僻的文章或专业领域中使用的词汇。

5.极少用词汇(Level 5):非常生僻、罕见的词汇。

三、COCA等级词汇的应用场景COCA等级词汇对于英语学习者和使用者具有很高的指导意义。

通过掌握不同等级的词汇,可以基本满足日常生活和学习中的阅读需求。

在学习过程中,可以根据自己的实际需求选择相应等级的词汇进行学习。

此外,COCA等级词汇还可以用于以下场景:1.英语考试:了解COCA等级词汇有助于提高英语考试的阅读理解和写作能力。

2.英语写作:掌握高级词汇可以提升写作水平,使文章更具深度和说服力。

3.专业领域:在特定领域的研究中,熟练运用COCA等级词汇有助于展现专业素养。

四、如何提高COCA等级词汇量1.制定学习计划:根据自己的英语水平和需求,制定合适的学习计划,逐步提高COCA等级词汇量。

2.使用教材和词汇书:选用适合自己的教材和词汇书进行学习,如《新概念英语》、《英语词汇的奥秘》等。

3.多读多写:通过阅读书籍、文章、新闻等,积累COCA等级词汇,并尝试在写作中运用。

美国当代英语语料库(COCA)使用介绍要点

美国当代英语语料库(COCA)使用介绍要点

COCA语料库简介
COCA简介
– COCA美国当代英语语料库涵盖美国这一时期 的口语(spoken)、小说(fiction)、流行杂志(pop magzine)、报纸(newspaper)和学术期刊 (academic)五大类型的语料库,并且在这五个类 型方面基本呈均匀平衡分布。
– 网址:/coca
• 例1. 输入单词“mysterious” (图2.1.1-1):得 到相关结果(图2.1.1-2):在各子库中的频率,每 百万词使用的频率。
• 若对图2中的相应条块进行点击,那么就可以看到 KWIC,如图2.1.1-3 (以点Fiction的条块为例):
图2.1.1-1
图2.1.1-2
使用CHART显示
POS LIST
det.GEN 类指限定词 det.POS 物主限定词 num.CARD 基数词 num.ORD 序数词 conj.CRD 并列连词 conj.SUB 从属连词 Interj. 叹词 PUNC 标点
词性列表的使用
• 1)查询多义词特定的词性 • 2)某个词前或者后面特定词性的若干搭配
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
二、COCA主要搜索功能
• 2.1 搜索words、phrases、lemmas(单 词的所有形式)、wildcards(通配符)和 其他更加复杂的字词。
POS LIST
pron.INDF 不定代词 pron.PERS 人称代词 pron.WH 疑问代词 pron.REFL 反身代词 adj.CMP 形容词比较级 (comparative) adj.SPRL 形容词最高级 (superlative) adv.particle 副词小品词 adv.WH 疑问副词

coca等级词汇

coca等级词汇

coca等级词汇摘要:一、引言1.介绍COCA 等级词汇的背景和作用2.阐述COCA 等级词汇对于学习者的重要性二、COCA 等级词汇的概述1.COCA 的定义和来源2.COCA 等级词汇的分类和特点三、COCA 等级词汇的应用1.在英语学习中的作用2.如何有效地利用COCA 等级词汇提高英语水平四、COCA 等级词汇与其他词汇体系的比较1.GSL (General Service List)2.BNC (British National Corpus)五、结论1.总结COCA 等级词汇的重要性2.鼓励学习者积极利用COCA 等级词汇提高英语能力正文:一、引言COCA(The Corpus of Contemporary American English)等级词汇是英语学习者提高英语能力的重要工具。

COCA 等级词汇不仅可以帮助学习者掌握英语中最常用的词汇,还能让学习者了解词汇的难度和重要性,从而更好地进行英语学习。

二、COCA 等级词汇的概述COCA 等级词汇是基于COCA 语料库(The Corpus of Contemporary American English)进行的研究成果。

COCA 语料库包含了大量美国英语的文本,包括书籍、报纸、杂志、网络文章等,共约5.2 亿词。

通过对这些语料库的分析,研究人员将词汇按照其在英语中的使用频率和重要性进行分类,形成了COCA 等级词汇。

COCA 等级词汇共分为十个等级,从最常用的Level 1 词汇到较为生僻的Level 10 词汇。

每个等级的词汇都有其特定的使用场景和重要性。

例如,Level 1 词汇是英语中最常用的词汇,学习者需要熟练掌握这些词汇;而Level 10 词汇虽然在日常生活中使用频率较低,但对于学习特定领域(如科技、医学等)的专业知识具有重要意义。

三、COCA 等级词汇的应用COCA 等级词汇在英语学习中具有广泛的应用。

学习者可以通过掌握不同等级的词汇,提高自己的英语水平。

在美国当代英语语料库(COCA)如何查词

在美国当代英语语料库(COCA)如何查词

在美国当代英语语料库(COCA)如何查词.doc 在美国当代英语语料库(COCA)如何查词摘要:美国当代英语语料库(Corpus of Contemporary American English,COCA)由美国Brigham Young University 的Mark Davies教授开发,目前单词容量在4.5亿,是美国当前最新的当代英语语料库,也是当今世界上最大的英语平衡语料库。

该语料库的语料来自1990-2012年,每年更新,检索功能强大,是最佳的英语学习助手。

本文以sorry为例介绍了如何在美国当代英语语料库中查询单词及对单词sorry的检查与研究结果。

关键词:美国当代英语语料库,平衡语料库,sorryAbstract: The Corpus of Contemporary American English (COCA) is the largest freely-available corpus of English,and the only large and balanced corpus of American English.The corpus was created by Mark avies of Brigham Young University,and it is used by tens of thousands of sers every month (linguists,teachers,translators,and other searchers).COCA is also related to other large corpora that we have created.The corpus contains more than 450 million words of text and isqually divided among spoken,fiction,popular magazines,newspapers,and academic texts.It includes 20 million words each year from 1990-2012.Key words: the Corpus of Contemporary American English,parallel corpus,sorry中图分类号:H319.3文献标识码:A文章编号:1006-026X(2013)12-0000-02一、引论美国当代英语语料库(Corpus of Contemporary American English,COCA)由美国Brigham Young University 的Mark Davies教授开发,目前单词容量在4.5亿以上,是美国当前最新的当代英语语料库,也是当今世界上最大的英语平衡语料库,且与其他所建语料库相连。

美国当代英语语料库(COCA)使用介绍精品名师资料

美国当代英语语料库(COCA)使用介绍精品名师资料
美国当代英语语料库(COCA)使用说明
/
免费的英语语料库资源
• /static/worldcorpora.htm
• /index.html
• /m/micase/ • http://lextutor.ca/conc/eng/ • /
COCA界面简介
COCA界面简介
• 字串查询区:
• Ⅰ、WORDS:输入字符串。 • Ⅱ、COLLOCATES:上下文限定。 • Ⅲ、POS LIST:词性列表
COCA界面简介
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
• 功能:此区可以对查询的字符串限定语料类型 (Genre)和时段(Year) ,并且可以明确到查询某一 个子语料库,时段也可以查询任何一年的某个字词 的使用情况。
POS LIST





pron.INDF 不定代词 pron.PERS 人称代词 pron.WH 疑问代词 pron.REFL 反身代词 adj.CMP 形容词比较级 (comparative) adj.SPRL 形容词最高级 (superlative) adv.particle 副词小品词 adv.WH 疑问副词
图2.1.2-1
图2.1.2-2
Whiten*];动词: [v*]; 形容词: [j*]; 副词: [r*];代词:[p*];连词:[c*]……
POS LIST 词性列表
noun.ALL=名词 noun.SG=单数名词 noun.PL=复数名词 noun.CMN=普通名词 noun.+PROP=专有名词 noun.-PROP=非专有名词
COCA语料库简介

COCA简介
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
美国当代英语语料库COCA使用介 绍
图2.1.1-2
使用CHART显示
美国当代英语语料库COCA使用介 绍

图2.1.1-3
例句显示区使用的是KWIC显示
美国当代英语语料库COCA使用介 绍
KWIC显示方式
美国当代英语语料库COCA使用介 绍
KWIC显示方式
• 蓝色——名词 • 紫色——动词 • 绿色——形容词 • 棕色——副词 • 灰色——代词 • 黄色——介词
美国当代英语语料库COCA使用介 绍
COCA语料库简介
COCA简介
– COCA美国当代英语语料库涵盖美国这一时期 的口语(spoken)、小说(fiction)、流行杂志(pop magzine)、报纸(newspaper)和学术期刊 (academic)五大类型的语料库,并且在这五个类 型方面基本呈均匀平衡分布。
➢主要包括三大功能区:
➢ Ⅰ 显示及查询条件界定区,包括:显示方式区, 字串查询区,语料库分类区,查询结果排列方式 区。
➢ Ⅱ 查询结果数据显示区 ➢ Ⅲ 例句显示区
美国当代英语语料库COCA使用介 绍
COCA界面简介
美国当代英语语料库COCA使用介 绍
COCA界面简介
• 显示方式区:
• 1.LIST——列表显示 • 2.CHART——图表显示,可以显示在各语料库类型中的使
美国当代英语语料库(COCA)使用说明
美国当代英语语料库COCA使用介 绍
美国当代英语语料库COCA使用介 绍
一、COCA语料库简介
• COCA简介
– COCA:美国当代英语语料库(Corpus of Contemporary American English)是由美国杨 伯翰大学(Brigham Young University)的 Mark Davies 教授开发的美国最新当代英语语 料库,是当今世界上最大的英语平衡语料库。
美国当代英语语料库COCA使用介 绍
POS LIST
det.GEN 类指限定词 det.POS 物主限定词 num.CARD 基数词 num.ORD 序数词 conj.CRD 并列连词 conj.SUB 从属连词 Interj. 叹词 PUNC 标点
美国当代英语语料库COCA使用介 绍
POS LIST
pron.INDF 不定代词 pron.PERS 人称代词 pron.WH 疑问代词 pron.REFL 反身代词 adj.CMP 形容词比较级 (comparative) adj.SPRL 形容词最高级 (superlative) adv.particle 副词小品词 adv.WH 疑问副词
美国当代英语语料库COCA使用介 绍
POS LIST
verb base=动词原形 verb.INF=动词不定式 verb MODAL=情态动词 verb 3SG=动词第三人称单数 verb ED=过去式 verb EN=过去分词 verb ING=现在分词 verb.LEX=lexical verb实意动词 verb.[BE]=系动词 verb.[DO]=do verb.[HAVE]=have
美国当代英语语料库COCA使用介 绍
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
美国当代英语语料库COCA使用介 绍
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
美国当代英语语料库COCA使用介 绍
二、COCA主要搜索功能
• 2.1 搜索words、phrases、lemmas(单 词的所有形式)、wildcards(通配符)和 其他更加复杂的字词。
– 网址:
美国当代英语语料库COCA使用介 绍
选择学习COCA的原因
• 1. COCA免费且在线方便。 • 2. 规模大(4.5亿,1990-2012)、速度快
(一般几秒)、词性标注易于理解。 • 3.时效性强——每年至少更新两次,并且每
年新增2000万词汇。
美国当代英语语料库COCA使用介 绍
COCA界面简介
用频率和各时间段内的使用情况。 • 3.KWIC——Key word in context,上下文关键词显示 • PARE——单词比较显示,比较两个不同词或短语
的搭配情况。
美国当代英语语料库COCA使用介 绍
COCA界面简介
美国当代英语语料库COCA使用介 绍
COCA界面简介
• 字串查询区:
美国当代英语语料库COCA使用介 绍
COCA主要搜索功能
• 例2. 输入词组 “white+名词” (图2.1.2-1),得到 的结果都是white 后面跟的名词短语 (图2.1.2-2),检索 表达式为:white [n*]。
美国当代英语语料库COCA使用介

图2.1.2-1
图2.1.2-2
White+名词的短语
• 例1. 输入单词“mysterious” (图2.1.1-1):得 到相关结果(图2.1.1-2):在各子库中的频率,每 百万词使用的频率。
• 若对图2中的相应条块进行点击,那么就可以看到 KWIC,如图2.1.1-3 (以点Fiction的条块为例):
美国当代英语语料库COCA使用介 绍
图2.1.1-1
• Ⅰ、WORDS:输入字符串。 • Ⅱ、COLLOCATES:上下文限定。 • Ⅲ、POS LIST:词性列表
美国当代英语语料库COCA使用介 绍
COCA界面简介
美国当代英语语料库COCA使用介 绍
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
• 功能:此区可以对查询的字符串限定语料类型 (Genre)和时段(Year) ,并且可以明确到查询某一 个子语料库,时段也可以查询任何一年的某个字词 的使用情况。
规则:输入名词的话用正表达式: [nn*];动词: [v*]; 形容词: [j*]; 副词: [r*];代词:[p*];连词:[c*]……
美国当代英语语料库COCA使用介 绍
POS LIST 词性列表
美国当代英语语料库COCA使用介 绍
POS LIST
noun.ALL=名词 noun.SG=单数名词 noun.PL=复数名词 noun.CMN=普通名词 noun.+PROP=专有名词 noun.-PROP=非专有名词
相关文档
最新文档