中外学术英语语料库

合集下载

学术英语阅读 语料库

学术英语阅读 语料库

学术英语阅读语料库学术英语阅读对于非英语母语的学生来说常常是一项具有挑战性的任务。

为了克服这个难题,语料库是一个强大的工具,可以提供丰富的英文语料和学术资源,帮助学生提高阅读理解和写作能力。

本文将探讨学术英语阅读语料库的定义、功能和使用方法。

一、语料库的定义和功能语料库是一个用来收集、存储和组织大量实际语言材料的数据库。

学术英语阅读语料库是面向学术领域的语料库,包含了各个学科的学术文献、期刊文章、论文、报告等。

它的功能主要体现在以下几个方面:1. 提供真实语言样本:语料库中的文本是真实的、自然的语言材料,可以反映真实的学术写作风格和表达习惯。

学生通过接触大量真实的学术文本,可以更好地理解学术语言的特点和规范。

2. 支持研究和分析:学术英语阅读语料库可以提供丰富的数据资源,用于研究语言的使用、结构和变化。

研究者可以通过对语料库中的文本进行分析,揭示学术写作的规律和特点。

3. 提高阅读和写作能力:通过使用语料库,学生可以积累大量的词汇和短语,提高阅读理解能力。

同时,他们还可以学习到学术写作的技巧和表达方式,提高自己的写作能力。

4. 培养语境意识:语料库可以帮助学生理解单词和短语的多种使用方式和语境。

学生可以通过查找相关的实例文本,了解单词的准确含义和用法,避免翻译错误或语用不当的问题。

二、语料库的使用方法学术英语阅读语料库的使用方法多种多样,下面介绍几种常用的方法:1. 检索词汇和短语:学生可以通过输入关键词来检索语料库,获取与词汇或短语相关的实例文本。

这样可以帮助学生理解单词或短语的多种用法和语境,并学习如何正确运用它们。

2. 阅读相关文献:学生可以选择感兴趣的主题或领域,在语料库中搜索相关的学术文献。

通过阅读这些文献,他们可以了解研究的最新进展、学术观点和实证数据,提高自己对该领域的理解和认知水平。

3. 分析语言用法:学生可以选择一篇学术文章或论文,在语料库中搜索类似的文章,比较它们的语言用法和句式结构。

学术期刊论文摘要汉英双语语料库构建研究-英语论文-语言学论文

学术期刊论文摘要汉英双语语料库构建研究-英语论文-语言学论文

学术期刊论文摘要汉英双语语料库构建研究-英语论文-语言学论文——文章均为WORD文档,下载后可直接编辑使用亦可打印——论文摘要指以提供文献内容梗概为目的,不加评论和补充解释,简明、确切地记述文献重要内容的短文。

(国家标准GB 47) 学术论文摘要概括论文的主要信息,对研究的目的、方法、结果和最终结论有一个比较完整的说明,对于论文的发表、收录、检索及科研人员的学术交流等起着重要的作用。

当今时代,英语已成为国际交往的世界性语言,英文学术论文摘要的重要性日益显现。

近年来,不少中外学者(如Swales1990、段平2002、滕延江2008、邓军涛2013 等) 对论文摘要的语言特点与翻译进行了比较广泛深入的分析,其成果无疑有利于该领域的实践与发展。

然而,大多数相关研究都是基于研究者个人的经验,选取的例句和掌握的语料比较有限。

不少学习者和研究人员撰写及翻译摘要的能力还比较欠缺。

鉴于此,本课题组决定建设学术期刊论文摘要汉英双语语料库,一方面从大的语料基础上客观描述英文摘要的文体特征和进行汉英翻译研究,同时将该语料库用作翻译教学平台,试验并总结数据驱动的教学方法,推动学术研究与翻译教学共同发展。

一、学术期刊论文摘要汉英双语语料库的建设(一) 语料库与双语语料库语料库是指按照一定的语言学原则,运用随机抽样方法,收集自然出现的连续语言运用文本或话语片段而建成的具有一定容量的大型电子文本库(杨惠中,2002) 。

语料库具有语料真实、丰富、代表性强以及融合了计算机技术等特点,在语言研究和教学方面具有较大的优势与应用价值。

按照语料的语种,语料库可以分成单语、双语和多语语料库。

双语和多语语料库还可分为平行语料库和可比语料库。

平行语料库收集原文与译文双语对照的文本,按设定的标准对语料进行句子或段落的对齐。

可比语料库收集具有可比性的语料,分别放置于不同的文本库,主要用于语言对比研究。

关于双语语料库的作用,不少专家从不同角度进行了探讨。

常用的英语语料库

常用的英语语料库

常用的英语语料库English corpora, or language corpora, are collections of text samples that are used for linguistic research and analysis. These corpora serve as valuable resources for studying language patterns, trends, and usage in various contexts. In this article, we will explore some of the commonly used English language corpora and their applications.1. British National Corpus (BNC)The British National Corpus is one of the most widely used language corpora for studying contemporary British English. It contains a diverse range of texts, including spoken conversations, written documents, and academic papers. Researchers can access the BNC to examine language usage in different genres and domains, such as science, politics, and fiction. The BNC provides valuable insights into the changes in the English language over time.2. Corpus of Contemporary American English (COCA)The Corpus of Contemporary American English is a comprehensive corpus that provides a vast collection of English texts from different genres, including spoken, written, and academic. It offers researchers the opportunity to investigate various aspects of American English, including vocabulary, syntax, and discourse patterns. The COCA is frequently used in linguistic research, language teaching, and corpus-based language analysis.3. Google Books Ngram ViewerThe Google Books Ngram Viewer is a powerful tool that allows researchers to analyze the frequency of words or phrases in the vast collection of books digitized by Google. It provides a visual representation of the usage of specific terms over time, offering insights into the historical development and popularity of certain expressions. This tool is useful for investigating language change and cultural shifts through the lens of published literature.4. Corpus Linguistics Toolkit (CLAWS)The Corpus Linguistics Toolkit, also known as CLAWS, is a suite of programs specifically designed for corpus analysis. It provides researchers with tools for processing, annotating, and analyzing text corpora. CLAWS allows for the extraction of linguistic features, such as part-of-speech tags and named entities, which can be utilized for various linguistic studies. The toolkit's versatility makes it a valuable resource for researchers in the field.5. International Corpus of English (ICE)The International Corpus of English is a collection of English language corpora from different countries and regions. It aims to capture the linguistic variations within the English language across different cultures and contexts. The ICE provides researchers with valuable data for studying dialectal differences, language contact phenomena, and sociolinguistic aspects of English.6. Oxford English Corpus (OEC)The Oxford English Corpus is a corpus of contemporary English texts that serves as a reference for the analysis of language usage and trends. Itincludes a wide range of written and spoken materials from various sources, such as books, newspapers, and online platforms. The OEC is frequently used for linguistic research, lexicography, and language teaching purposes.7. Corpus Query Language (CQL)Corpus Query Language is a specialized language used to search and retrieve specific linguistic patterns within corpora. It enables researchers to formulate complex queries and retrieve relevant linguistic data for analysis. CQL is widely used in corpus linguistics and facilitates the exploration of language patterns and structures within corpora.In conclusion, English language corpora play a vital role in linguistic research and analysis. The aforementioned corpora, including the British National Corpus, Corpus of Contemporary American English, Google Books Ngram Viewer, Corpus Linguistics Toolkit, International Corpus of English, Oxford English Corpus, and Corpus Query Language, provide valuable resources for investigating language usage, trends, and patterns in various contexts. These corpora aid in the understanding of language change, societal influences, and cultural shifts, making them invaluable tools for language researchers, educators, and language enthusiasts.。

近十年来语料库在学术英语研究中的应用

近十年来语料库在学术英语研究中的应用

外语外文1472017年 第15期一、引言随着语料库语言学在中国的发展以及语料库知识的日渐普及, 越来越多的学者开始利用语料库来做研究。

特别是近几年来,语料库已成为语言学实证研究的一个重要手段,基于语料库的实证研究逐年增加,成为语言研究的一个热点。

语料库方法近十年来在学术英语研究中被广泛使用,该类研究以语料库为基础,以真实的语料为研究对象,以数据统计和理论分析为研究方法,依据语言学相关理论,分析学术英语的语体特点、学术写作等,直接受益于语料库语言学和描写性语言学研究。

笔者以检索摘要含有“语料库”和“学术英语”为关键词在中国知网上共检索到1318篇文章,其中被引频次为10以上的文章数量为172篇。

笔者结合被引频次和是否发表在外语类核心期刊上,进行分析总结,发现使用语料库为研究方法进行学术英语研究主要集中在体裁分析和元话语研究中。

二、语料库在学术英语领域的应用Stenfanowitsch 和Gries(2006:1)提到:在过去的15年中,语料库分析法已经成为语言学研究中的一个重要的实证范式,推动了词汇和语法的深入研究,并用于分析语言结构的几乎所有层面。

笔者以2006-2016年国际刊物Journal of Pragmatics 以及English for Specific Purposes.1. 语料库在体裁分析中的应用国外对学术英语的体裁分析 (genre analysis)的重要性得到广泛认可并取得了很大的进展(Swales,1990;Bhatia,1993; Bhatia, 1993;Henry&Roseberry,1998;Johns,2002;Williams & Hasan,1996)。

近年来在学术英语领域,运用基于体裁分析和语料库分析的研究方法已经引起了学者们越来越多的关注(Santos 1996;Huckin 2001;Martin 2003;Samraj 2005;Cross & Oppenheim 2006)。

中科院自动化所的中英文新闻语料库

中科院自动化所的中英文新闻语料库

中科院自动化所的中英文新闻语料库【引言】随着互联网的迅猛发展和全球化的加速,语言数据在各领域的应用越来越广泛。

作为我国顶级科研机构,中科院自动化所敏锐地捕捉到这一趋势,积极构建中英文新闻语料库,以满足各行业对高质量语言数据的需求。

本文将详细介绍中科院自动化所中英文新闻语料库的特点、应用领域以及在我国的现实意义与价值。

【中英文新闻语料库的特点与优势】1.数据来源与采集方式:中英文新闻语料库主要来源于国内外知名新闻网站、报纸、杂志等,采用自动化爬虫技术与人工筛选相结合的方式进行数据采集。

这保证了数据的权威性和准确性。

2.数据规模与类别:截至目前,中英文新闻语料库已收录千万级规模的新闻文本,涵盖政治、经济、科技、文化等多个领域。

丰富的数据类别为各类研究提供了广泛的素材。

3.实时更新与多样性:为保持数据的时效性,中英文新闻语料库采用实时更新的策略,确保研究人员可以获取最新的新闻文本。

同时,通过多种采集渠道,丰富了数据来源,提高了数据的多样性。

【中英文新闻语料库的应用领域】1.自然语言处理研究:中英文新闻语料库为自然语言处理领域的研究提供了丰富的数据支持。

研究人员可以利用这些数据开展文本分类、情感分析、实体识别等任务,推动我国自然语言处理技术的发展。

2.媒体监测与舆情分析:通过对中英文新闻语料库的分析,企业、政府等相关机构可以实时掌握舆论动态,发现并处置负面舆情,提高品牌形象。

3.智能推荐与信息检索:中英文新闻语料库可以为搜索引擎和推荐系统提供内容支持,实现精准的信息检索与推荐,提高用户体验。

【中英文新闻语料库在我国的现实意义与价值】1.促进我国媒体发展:中英文新闻语料库为媒体行业提供了丰富的素材,有助于提高新闻报道的质量和深度。

2.提高语言智能技术水平:借助中英文新闻语料库,我国科研机构可以开展更多关于自然语言处理技术的研究,推动我国在该领域的竞争力。

3.服务国家战略需求:在中英文新闻语料库的基础上,相关研究成果可应用于国防、外交、经济等国家战略领域,为国家决策提供有力支持。

SCI写作助手“Academic Phrasebank”,全网广泛推荐的学术语料库!

SCI写作助手“Academic Phrasebank”,全网广泛推荐的学术语料库!

SCI写作助手“Academic Phrasebank”,全网广泛推荐的学术语料库!假如说学术界是一个舞台,良好的论文写作就是你的入场券,特别是中国学者的Chi-english,尤其让文章逊色不少。

如果能有英文语句写作模板的话,这个问题也就引刃而解了,不过,模板和套路一样,虽然来源于文献却高于文献,要认真总结下来,总归要花费大量的时间和精力。

在此向大家安利一个神奇的网站——Academic Phrasebank,专治英文SCI写作的各种水土不服。

一、网站简介Academic Phrasebank网站是由曼彻斯特大学的博士John Morley创办的,里面提供了大量的SCI写作句型和短语,参考材料都是来自于英语母语者的文章。

通过您的灵魂注入和添加,一篇SCI文章就完成啦!网址:/二、操作指南1、导航栏介绍这个网站的操作方法很简单,导航栏中的各个选项分别对应着论文引言(Introduction)、引文部分如何引用、实验方法如何描述(Methods)、实验结果(Results)、讨论(Discussion)和总结(Conclusions)。

每个标签下面都会指导你,哪个部分该如何写、该利用什么动词时态……真正做到了文章写到哪指导到哪,是不是超级简单!2、详细解读论文关键部分以“Describing Methods”为例,如下图所示,清晰详细的描述了论文方法的部分,方便了其他研究学者重复研究并且复现结果,也详细的指出了这个部分的撰写中动词应该用过去时态。

、神奇宝典万能句式模板点击第一个选项“Describing previously used research methods ”,就会出现下面图中的万能句式模板,这对于缺乏写作经验和英语不在行的学者来说,可谓是神奇4、轻松搞定论文写作框架这个网站还有另外一个神奇之处,它不只是单一的给每一部分的撰写例句,还给作者搭建好了写作框架,简直是良心到不行。

显然,这个网站为大家提供了大量的黄金模板,不过,小编仍建议大家不要直接套用这些万能句式,引用句式的时候,应该对其做出相应的改动,这样可以规避查重风险。

语言学常用语料库

语言学常用语料库

语言学常用语料库
语言学常用语料库有很多,以下是一些常用的语料库:
1. Brown语料库:美国布朗大学语言学部于1960年代编制的语料库,是英语语料库中最早的、最著名的语料库之一。

2. Penn Treebank语料库:由宾夕法尼亚大学开发的语料库,主要用于句法分析和语言学研究。

3. CoNLL语料库:共享任务(Conference on Computational Natural Language Learning)所使用的语料库,包括各种语言的语料。

4. Europarl语料库:包括欧洲议会会议的多种语言翻译版本,用于机器翻译和跨语言研究。

5. Google语料库:由Google搜索引擎收集的大规模网络文本语料库,可用于研究自然语言处理和文本挖掘等领域。

6. Corpus of Contemporary American English (COCA):包括当代美国英语的语料库,涵盖了各种不同类型的文本。

7. British National Corpus (BNC):出版物、广播和会话等来源的英国英语语料库,是英国英语的重要资源。

这些语料库提供了大量的文本数据,可用于研究不同语言的语
言学现象,如词汇使用、语法结构和语义等。

它们对于语言学研究和自然语言处理的发展起着重要作用。

英语句子语料库

英语句子语料库

英语句子语料库
英语句子语料库是用于自然语言处理和机器学习的文本数据集,其中包含大量英语句子。

以下是一些常用的英语句子语料库:
1. Brown Corpus:布朗语料库,包含一百万个单词,涵盖了多种文体和主题。

2. Penn Treebank:宾州树库,包含大量的英语句子和词性标注信息。

3. CoNLL 2003:用于命名实体识别和词性标注的语料库。

4. OntoNotes:多语言语料库,包含英语、中文、阿拉伯语等多种语言的文本和标注信息。

5. BERT Corpus:BERT模型使用的语料库,包含大量的英语句子和预训练模型。

6. OpenWebText Corpus:开源的Web文本语料库,包含大量的英语句子和网络用语。

7. Common Crawl Corpus:公共爬虫语料库,包含大量的英语句子和网页内容。

8. News Crawl Corpus:新闻爬虫语料库,包含大量的英语新闻文章和句子。

9. WikiText-103:维基百科文本语料库,包含大量的英语维基百科文章和句子。

10. BookCorpus:书籍语料库,包含大量的英语书籍和句子。

以上是一些常用的英语句子语料库,可以根据需要进行选择和使用。

这些语料库可以用于自然语言处理、机器学习、文本挖掘等领域的研究和应用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中外学术英语语料库
中外学术英语语料库是一个大型的语料库,主要用于学术研究,特别是语言学、文学、翻译等领域。

该语料库包含了大量的学术论文、期刊文章、会议论文等资源,涵盖了各个学科领域。

中外学术英语语料库的建立,旨在为学者们提供一个全面、权威的学术资源平台,方便他们进行学术研究、论文写作、翻译等工作。

该语料库不仅提供了大量的语料资源,还提供了各种分析工具和统计数据,帮助学者们更好地分析和理解语言现象。

此外,中外学术英语语料库还注重学术诚信和版权保护,确保所有资源都经过严格的筛选和审核,确保学术研究的公正性和权威性。

同时,该语料库还提供了一些学术规范和指导,帮助学者们更好地遵守学术道德和规范。

总之,中外学术英语语料库是一个非常有价值的学术资源平台,为学者们提供了全面的学术支持和帮助。

相关文档
最新文档