可以免费使用的大型英语语料库资源

合集下载

常用在线语料库使用简介

常用在线语料库使用简介

字串查询区
图5-1
COCA
5. COCA界面简介(图5-1)
语料库分类区
图5-1
COCA
5. COCA界面简介(图5-1)
查询结果排列 方式区
图5-1
COCA
5. COCA界面简介(图5-1)
查询结果数据显示区
图5-1
COCA
5. COCA界面简介(图5-1)
例句显示区/帮助信息显示区
图5-1
结果如图6.5-2
图6.5-1
图6.5-2
COCA
7. 新增功能 7.1 Words and Phrases (图7.1-1)
/
图7.1-1
COCA
7. 新增功能 7.1 Words and Phrases 7.1.1 Frequency List (图7.1.1-1)
COCA语料库规模大,涵盖美国1990-2012年间
口语(spoken)、小说(fiction)、流行杂志(pop magzine)、报纸(newspaper)和学术期刊 (academic)五大类型的文本 使用界面友好,检索速度快 时效性强,不断更新功能
COCA
5. COCA界面简介 三大功能区:
图6.1.1-4
COCA
6.1.2 检索某一词性的单词
输入“feature.[v*]”,可得到“feature”做动词时的使
用情况 (图6.1.2-1) “.”表示feature不与其后的字符串组成短语 “[v*]”代表所有形式的动词 点击POS LIST后的问号,可了解具体词性代码
在搜索结果区可得到“feature”的频数 (图6.1.1-2 )
点击该词,可在例句显示区看到含有“feature”的词条

国外个主流语料库使用

国外个主流语料库使用

1. The Complete Lexical Tutorhttp://www.lextutor.ca/参考期刊网上刘玉山,胡志军的介绍。

是一个语料库中心词索引软件(concordancer),加拿大魁北克大学Tom Cobb the University of Quebec at Montreal (UQAM), 开发三部分:learners, researchers, teachers自我学习,研究,教师命题。

特别是concordance中有13个语料库为检索对象。

还可以用来对学生作文中的用词分析。

http://www.lextutor.ca/concordancers/concord_e.html可以同时提供多个语料库的在线搜索,但缺点是每次只能对一个文本加工。

2.BNC2014年开始,免费获得,通过BYU的申请。

British National Corpus一亿词,书面语90%,口语10%,共4124篇文本,从1980到1993年的语料英国牛津出版社﹑朗文出版公司﹑钱伯斯—哈洛普出版公司﹑牛津大学计算机服务中心、兰卡斯特大学英语计算机中心以及大英图书馆等联合开发建立的大型语料库共有七类口语spoken,小说fiction,流行杂志magazine,报纸newspaper和学术期刊academic还有COCA分类中没有的两类non-academic, miscellaneoussecond edition BNC World (2001)third edition BNC XML Edition (2007)extracts from regional and national newspapers, specialist periodicals and journals for all ages and interests, academic books and popular fiction, published and unpublished letters and memoranda, school and university essays, among many other kinds of text通常可进入的那个链接是BYU, 美国杨百翰大学提供的BYU大学在2012年对语料库经行了重新附码,用的CLAWS 73. COCA: the corpus of contemporary American EnglishBrigham Young University 美国犹他州杨百翰大学Doctor Mark Davies3.6亿,1990-2007年间,美国国内各种语料口语spoken,小说fiction,流行杂志magazine,报纸newspaper和学术期刊academic共五类语料来源且持续更新中,每年以2000万词递增,目前到1990-2012,共4.5亿词Display:显示方式,compare选项可以用来比较两个词的搭配区别,排列方式选择relevance 相关度标记了语料的时间,便于研究语言历时与共时的变化教学中相关用法查找同义词,如[=scold].[V*]表示查找所有scold的同义词查找某一话题的词汇,如flower.[N*],表示查找与花有关的词汇,如果需要查找更为专业的词汇,就利用互信息。

可以免费使用的大型英语语料库资源

可以免费使用的大型英语语料库资源

英语语料库#参考2012-03-02 22:29:26■BNC=The British National Corpus英国国家语料库/(备用)/bnc/■ANC = The American National Corpus美国国家语料库/■COCA = Corpus of Contemporary American English 美国当代英语语料库/■COHA = Corpus of Historical American English 美国近当代英语语料库/coha/■BOE=Bank of English 柯林斯英语语料库/wordbanks/■NMC=New Model Corpus 新规范语料库/■ARC=ACL Anthology Reference Corpus (ARC) 文选参考语料库/auth/preloaded_corpus/aclarc/ske/first_form■BAWE=British Academic Written Eng Corpus (BAWE) 英国学术书面语语料库/auth/preloaded_corpus/bawe2/ske/first_form/AcaDepts/ll/app_ling/internal/bawe/sketch_engine_bawe.htm download■BASE= British Academic Spoken English Corpus (BASE) 英国学术口语语料库/fac/soc/celte/research/base/■SCTS=Scottish Corpus Of Texts and Speech苏格兰口语与书面语语料库/■SCTS=Corpus Of Modern Scottish Writing 当代苏格兰语实库/cmsw/Slang/ (American, English, and Urban slang)/slang/ (UK)//cybereng/slang///可以免费使用的大型英语语料库资源常用语料库资源链接汇集(语料天涯)/time/http://www.lextutor.ca/concordancers/concord_e.html 常用语料库资源链接汇集(语料天涯)http://202.204.128.82/sweccl/Corpus//netprints/Corporalink/Corporalink.htm1. BNC-World Simple Search ☆☆☆/lookup.html But no more than 50 hits will be displayed, with a fixed amount of context.2. Brown, LOB, BNC sampler ☆☆☆Here are a few links for searching corpora online, including monolingual corpora like Brown, LOB, and BNC sampler and also some parallel English-Chinese corpora.English: /concordance/WWWConcappE.htmEnglish: http://www.lextutor.ca/concordancers/concord_e.htmlParallel: /concordance/paralleltexts/3. Collins Cobuild Corpus Concordance Sampler☆☆☆☆☆/Corpus/CorpusSearch.aspxThe Collins WordbanksOnline English corpus is composed of 56 million words of contemporary written and spoken text.4. New BNC interface - VIEW: ☆☆☆☆☆/5. Samples (about 2 million words) from the British National Corpus: both written and spoken ☆☆☆The Brown Corpus and many others - native, learner... Go tohttp://www.lextutor.ca/concordancers/concord_e.html6. MICASE ☆☆☆☆/m/micase/There are currently 152 transcripts (totaling 1,848,364 words) available at the site.7. CLEC online concordancing ☆☆☆☆/corpus/EngSearchEngine.aspxCLEC收集了包括中学生、大学英语4级和6级、专业英语低年级和高年级在内的5种学生的语料一百多万词,并对言语失误进行标注。

最全面的英语学习资源大盘点

最全面的英语学习资源大盘点

最全面的英语学习资源大盘点在如今全球化的时代,掌握一门优秀的外语已成为职场和学术界必不可少的技能之一。

而英语由于其广泛的使用范围和全球化的影响力,成为了最受欢迎的外语之一。

然而,英语学习的途径和资源千差万别,如何找到最全面的英语学习资源,是每个英语学习者的共同难题。

本篇文章将为大家盘点最全面的英语学习资源,帮助各位英语爱好者更快速、有效地提高英语水平。

一、英语学习网站1. Duolingo:Duolingo是一款非常受欢迎的语言学习网站,它提供了一个轻松、有趣、互动的学习环境,可以让学生通过各种活动和语音练习来学习英语单词、语法等内容。

2. BBC Learning English:BBC Learning English提供了许多英语学习资源,包括听力、口语、阅读、写作等,非常适合初学者和进阶学习者。

3. British Council:British Council是英国政府官方机构,旨在促进英语文化和教育。

它的网站提供了各种英语学习资源,包括学习指南、视频、语法规则等。

4. VOA Learning English:VOA Learning English提供了大量的英语学习资源,包括新闻、音频、视频、习题和练习等,它的特色是以美国英语为主。

5. English Central: English Central是一个在线英语学习平台,提供了数千个视频资源和习题,通过这些资源帮助学生提高英语听力、口语和发音等技能。

二、英语学习应用1. HelloTalk:HelloTalk是一款社交应用,它允许用户与全球范围内的母语人士交流和练习口语。

该应用提供了语音、文字和视频聊天等功能,鼓励学生在真实的语言环境中学习英语。

2. Memrise:Memrise是一款基于记忆科学的学习应用,它通过各种互动的游戏和挑战帮助学生快速有效地学习英语单词和短语。

3. Lingbe:Lingbe是一款提供无限制的语言交流的应用,用户可以与全球各地的人进行语音聊天。

常用免费外文全文数据库

常用免费外文全文数据库

常用免费外文全文数据库1.SpringerLINK数据库德国施普林格(Springer-Verlag)是世界上著名的科技出版集团, 通过SpringerLink系统提供其学术期刊及电子图书的在线服务。

2002年7月开始,Springer公司和EBSCO/Metapress 公司在国内开通了SpringerLink服务。

访问方式:镜像服务器(本校读者无需登录)、国外站点(用户需登录出国并自付国际网络通信费)。

访问权限:校园网IP地址范围。

访问全文:(PDF格式)需要使用Acrobat Reader软件,如需安装,可由此下载Acrobat Reader。

2.EBSCOhost数据库EBSCO公司通过国际专线提供检索服务,校园网的用户检索、下载无需支付国际网络通信费。

采用IP控制访问权限,不需要帐号和口令。

3.WorldSciNet数据库WorldSciNet为新加坡世界科学出版社(World Scientific Publishing Co.)电子期刊发行网站,该出版社委托EBSCO / MetaPress 公司在清华大学图书馆建立了世界科学出版社全文电子期刊镜像站.4.Ptics ExpressOptics Express由美国光学学会创办,刊登光学技术领域方面的报告和新进展。

提供1997年创刊以来的全部文献,以平均49天一期的速度出版,并支持彩色图像和多媒体文件。

网站地址:/创建者:Optical Society 0f America5.New Journal 0f PhysicsNew Journal 0fPhysics由英国皇家物理学会和德国物理学会出版,提供1998年创刊以来的全部文献。

所有用户可免费获取电子版文章。

网站地址:创建者:Institute of Physics & German Physical Society6.The Journal of Machine Learning ResearchThe Journal of Machine Learning Research由麻省理工学院出版,是机械研究领域的优质学术性论文的平台,用户可下载2000年创刊以来的全部文章。

免费的英语语料库汇总

免费的英语语料库汇总

免费的英语语料库汇总Here is a list of free English language corpora:1. British National Corpus (BNC): One of the most widely used corpora, it includes spoken and written texts from a range of genres and registers.2. Corpus of Contemporary American English (COCA): Contains over 520 million words of American English from a variety of sources, including fiction, non-fiction, newspapers, academic journals, and spoken language.3. Corpus of Historical American English (COHA): Covers American English from 1810 to 2024 and includes over 400 million words from a variety of genres.4. Corpus of Global Web-Based English (GloWbE): A web-based corpus that contains over 1.9 billion words from websites around the world. It includes texts from different countries and regions, allowing for the study of global variation in English.5. International Corpus of English (ICE): A collection of corpora representing different varieties of English, including British, American, Indian, Australian, and Hong Kong English.6. TIME Magazine Corpus: Contains articles from TIME Magazine published between 1923 and 2024. It is a useful resource for studying the use of language in news and current affairs.7. Open American National Corpus (OANC): A wide-ranging corpus that includes a variety of written and spoken texts from different sources, including newspapers, fiction, academic journals, and interviews.8. Santa Barbara Corpus of Spoken American English: A corpus of spoken American English that includes conversations between native speakers from different regions of the United States.9. EnTenTen Corpus: A web-based corpus that has over 20 billion words of English from a wide range of online sources. It is useful for studying contemporary English usage.10. BYU-BNC: A version of the British National Corpus that has been cleaned and lemmatized, making it easier to analyze.11. The Corpus of Contemporary American English under COCA: Similar to COCA, this corpus includes 560 million words of American English, allowing for detailed analysis of language use in various contexts.12. The Corpus of Contemporary American English under COCA-Spoken: Specifically focuses on spoken American English, with over 200 million words from conversations, interviews, and other spoken sources.13. The Hansard Corpus: Contains transcripts of parliamentary debates in the United Kingdom from 1803 to thepresent day. It is a valuable resource for studying political discourse and language change.14. TIMIT Corpus: A widely used speech database that contains recordings of speech from speakers of eight major American English dialects.15. The New York Times Annotated Corpus: An extensive collection of articles from The New York Times, allowing for analysis of language use in journalistic writing.。

美国当代英语语料库(COCA)使用介绍

美国当代英语语料库(COCA)使用介绍

POS LIST





pron.INDF 不定代词 pron.PERS 人称代词 pron.WH 疑问代词 pron.REFL 反身代词 adj.CMP 形容词比较级 (comparative) adj.SPRL 形容词最高级 (superlative) adv.particle 副词小品词 adv.WH 疑问副词
规则: 若要得到某种词性且词中带有部分带有某些字母的形 式时,如要得到以 un- 开头、 -ed 结尾的所有形容词的所有形 式,那么输入: un*ed.[j*]; 若要得到动词 + 任何词 +ground 的所有词组 , 那么输入 : [v*]*[ground]即可。 前者用来研究词汇,后者用来查询特定词性的搭配。
查询结果
筛选出“应用”和“增加”作主谓搭配的例句
• The annual application of fertilizers has increased by 5.48% on average since 1980, and that of pesticide… • In ten Member States, average application of nitrogen increased almost 400% between 1950 and 1981. • Finally, studies have shown that application of biosolids increases the water holding capacity as well as reduces the potential of(wildcards) ,如分别输入 un*ly 和r?n*,结果如图。
? 代替一个字母 * 代替任意数量字母

英语资料网址大全

英语资料网址大全

英语资料网址大全1、搜索网站:全球最强大的搜索网站。

在语言学习中,它的功能至少包括:搜索新词可用之语境、确认某种搭配或用法是否准确、通过同时输入中文及"English"寻找可能存在的双语介绍、查询文学作品译本、了解某一类事物的相关知识等。

雅虎分类检索。

2、汉英、英汉、英英、汉汉词典:/ 金山词霸网站,可以下载部分字典软件的共享版,英汉之间各种转换都有。

词条数一般在百万以上。

建议还是直接去买软件好,作为案头常备工具,还可随点随译。

/ 太阳雨汉英英汉词典,内容丰富,可以添加词汇,并有水平不错的论坛。

/ 韦氏大词典,英英,韦氏字典家族尽览。

/ 综合词典,同义词/反义词,分类,英英。

rs.fr/dico/en/search 同义词电子词典,英英。

3、百科辞典/reference/ 美国最大的免费在线参考网站。

下有Columbia Encyclopedia, Roget's Thesauri, American Heritage Dictionary, Columbia History of English and American Literature等众多参考词典。

更新快,内容丰富。

英文。

在线简明哥伦比亚百科全书,有5万多词条。

英文。

/reference/encyclopedia/index.html 在线简明牛津百科全书。

英文。

/biography/search.html 人名词典,可通过名字、关键词或时间查询28,000位世界著名人物的简要介绍。

英文。

/research/tools/vocabulary/tgn/index.html 地名大词典。

英文。

/index.shtm 新近开通的知识在线,号称网上最大中文知识库,有世界知识、中国文物、音乐、体育、历史等百科全书。

需要注册。

/fxd/lookup.htm 六合一佛学大词典,每个词条都有详介及英语译法。

/encyclopedia/index.html 英文伊斯兰教百科全书。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

可以免费使用的大型英语语料库资源
/time/
http://www.lextutor.ca/concordancers/concord_e.html
常用语料库资源链接汇集(语料天涯)
http://202.204.128.82/sweccl/Corpus/
/netprints/Corporalink/Corporalink.htm
1. BNC-World Simple Search ☆☆☆
/lookup.html
But no more than 50 hits will be displayed, with a fixed amount of context.
2. Brown, LOB, BNC sampler ☆☆☆
Here are a few links for searching corpora online, including monolingual corpora like Brown, LOB, and BNC sampler and also some parallel English-Chinese corpora. English: /concordance/WWWConcappE.htm
English: http://www.lextutor.ca/concordancers/concord_e.html
Parallel: /concordance/paralleltexts/
3. Collins Cobuild Corpus Concordance Sampler☆☆☆☆☆
/Corpus/CorpusSearch.aspx
The Collins WordbanksOnline English corpus is composed of 56 million words of contemporary written and spoken text.
4. New BNC interface - VIEW: ☆☆☆☆☆
/
5. Samples (about 2 million words) from the British National Corpus: both written and spoken ☆☆☆
The Brown Corpus and many others - native, learner...
Go to http://www.lextutor.ca/concordancers/concord_e.html
6. MICASE ☆☆☆☆
/m/micase/
There are currently 152 transcripts (totaling 1,848,364 words) available at the site.
7. CLEC online concordancing ☆☆☆☆
/corpus/EngSearchEngine.aspx
CLEC收集了包括中学生、大学英语4级和6级、专业英语低年级和高年级在内的5种学生的语料一百多万词,并对言语失误进行标注。

For an introduction of the corpus, its error tagset and some statistics, see
/baseinfo/achievement/Achievement1.htm
8. Business Letter Corpus Online KWIC Concordancer ☆☆☆
1 MILLION WORDS BUSINESS LETTER CORPUS (US & UK) AND OTHER CORPORA seek.co.jp/
9. Virtual Language Centre ☆☆☆
/concordance
The Starr Report, Brown, LOB, The Times (Jan, Feb, Mar) 3 files, SCMP, Business & Economy, Computing etc
10. Time Magazine archive ☆☆☆, 1923-2007 (100+ million words)
/time/ and more at /
11. Just the word
http://193.133.140.102/JustTheWord/
书店可以买到的语料库相关书籍
Austermühl, F. 2001. Electronic Tools for Translators《译者的电子工具》. Manchester: St.
Jerome Publishing. (外研社引进)
Biber, Douglas, Stig Johansson, Geoffrey Leech, Susan Conrad & Edward Finegan. 1999.
Longman Grammar of Spoken and Written English. Longman Publications Group.
(外研社引进)
Biber, Douglas, Susan Conrad & Randi Reppen. 1998. Corpus Linguistics. Cambridge: Cambridge University Press. (外研社引进)
Granger, S. et al. (eds.). 2003. Corpus-based Approaches to Contrastive Linguistics and Translation Studies《基于语料库的语言对比和翻译研究》. Amsterdam: Rodopi. (外研社引进)
Gries, Stefan Thomas. 2004. Multifactorial Analysis in Corpus Linguistics: A Study of Particle Placement. Beijing: Peking University Press. (北大出版社引进)Hunston, Susan. 2002. Corpora in Applied Linguistics. Cambridge: Cambridge. University Press. (世界图书出版社引进)
Kennedy, Graeme. 1998. An Introduction to Corpus Linguistics. London: Longman. (外研社引进)
Nattinger, James R. & Jeanette S. DeCarrico. 1992. Lexical Phrases and Language Teaching. Oxford: Oxford University Press. (外教社引进)
Sinclair, John. 1991. Corpus, Concordance, Collocation. Oxford: Oxford University Press.
(外教社引进)
Thomas, Jenny & Mick Short. 1996. Using Corpora for Language Education. London: Pearson Education. (外研社引进)
Zanettin, F., et al. (eds.). 2003. Corpora in Translator Education《语料库与译者培养》.
Manchester: St. Jerome Publishing. (外研社引进)
蔡金亭,2003,《语言因素对英语过渡中使用——一般过去时的影响》。

北京:外语教学与研究出版社。

何安平(主编),2004,《语料库在外语教育中的应用:理论与实践》。

广州:广东高等教育出版社出版。

何安平,2004,《语料库语言学与英语教学》。

北京:外语教学与研究出版社。

华南师范大学外国语学院编,2005,《语料库语言学的研究与应用》。

长春:东北师范大学出版社。

黄昌宁,李涓子著,2002,《语料库语言学》。

北京:商务印书馆。

濮建忠,2003,《学习者动词行为:类联接、搭配及词块》。

开封:河南大学出版社。

王建新,2005,《计算机语料库的建设与应用》。

北京:清华大学出版社。

王克非等,2004,《双语对应语料库研制与应用》。

北京:外语教学与研究出版社。

王立非、梁茂成等,2007,《计算机辅助第二语言研究方法与实用》。

北京:外语教学与研究出版社。

卫乃兴,2002,《词语搭配的界定与研究体系》。

上海:上海交通大学出版社。

卫乃兴,李文中,濮建忠等,2005,《语料库应用研究》。

上海:上海外语教育出版社。

文秋芳、王立非、梁茂成,2005,《中国学生英语口笔语语料库》。

北京:外语教学与研究出版社。

【含SWECCL语料库光盘】
杨达复,2000,《英语错误型式分析》。

西安:陕西人民出版社。

杨惠中、桂诗春,2003,《中国学习者英语语料库》。

上海:上海外语教育出版社。

【含CLEC 语料库光盘】
杨惠中、卫乃兴,2005,《中国学习者英语口语语料库建设与研究》。

上海:上海外语教育出版社。

【含COLSEC语料库光盘】
杨惠中等(主编),2005,《基于CLEC语料库的中国学习者英语分析》。

上海:上海外语教育出版社。

杨惠中主编,2002,《语料库语言学导论》。

上海:上海外语教育出版社。

2022年4月25日星期一。

相关文档
最新文档