语料库课程论文
基于语料库分析初一语文教材的文本语言特征

课程名称:中文信息处理任课教师:郑泽之论文题目:基于语料库分析初一语文教材的文本语言特征姓名:王杰学号:10120142202388摘要:语言的研究向来以定性研究为主导,定量的研究所占的比例不大,但随着计算机技术的发展,利用语料库技术,对文本进行分析研究成为当前语言研究的一大趋势。
依靠厦门大学教育教材语言分中心的便利,笔者选取建国后第一版教材的初一语文部分,并利用AntConc 3.2.0(windows)对此文本进行定量分析,从这一个角度去研究语文教材的文本语言特征。
关键词:语料库;初一语文教材;定量分析初一教材分上下两册,在操作中也是将两册分开,在两者的对比之中寻求共性。
为了对比更加有效,在分析的过程中,笔者还将引入其他类型文本的相关数据进行比较。
对教材语言的分析,将从宏观语言特征、高频词汇两方面入手。
因为教材不同于其他文本,它是各种文体的综合,有引言、有小说、有诗歌、有散文等等,若从细微之处入手,笔者很难分析出教材的文本语言特征。
故选择两个大的角度对教材进行分析,虽不能做到面面俱到,但力求在整体上对教材进行把握。
宏观语言特征宏观语言特征分析时,笔者从词长、句长、例型比、名词比例、标点符号比例、陈述句比例、疑问句比例、感叹句比例和单现词进行讨论,其中以词长、句长和例型比为主。
统计显示,第一册的词长为1.4934,第二册的词长为1.7535,第二册的词长比第一册的词长多0.2601,说明第二册中双字词和多字词的比重更多,选用词汇难度更高;而相对于另外两篇小说的1.4054和1.3716,教材所用的词明显更长,双字词和多字词比重较高体现出教材更加正式。
句长方面,第一册与第二册的句长相当,都在21左右;相对于小说文本的24.3735和33.3967,句长又偏短。
句长保持在21左右,简单句偏多,方便读者的阅读与理解,尤其是对于初中生而言,而小说文本较长的句长,更多的复杂句式,则是为了艺术性地表达。
应该注意到,教材中包含各种文体,小说自然也不例外,或许还包含其他句式更加复杂的文体,那么教材句长偏短该如何解释。
基于语料库的学术论文摘要体裁对比分析_李萍

and Feak 对体裁特征的描写( 1994 ) 。 表 1. 摘要 5 语步分析模式
语步 ( MOVE) 语步 1 : 定位研究 ( Situating the searchБайду номын сангаас 功能 ( FUNCTION) 范畴 ( QUESTION ADDRESSED) 对本研究领域已 知 道 什么?
re- 确立研究背景
架和词语型式。摘要体裁分析采用 Santos ( 1996 ) 的 5 语步模式; 语料库分析软件为 MonoConc Pro 和 Collocate 1. 0 ( Barlow 2004a, 2004b) 。分析数据显示, 中国研究者在英文摘要写作中实义词使用率偏高, 部分词组过度使用, 但同 结论语步出现频率偏低的现象 。就词语特征而言, 中国研究者较少使用被动语态过去时 时又呈现摘要语步数量偏少, 摘要的文献引证缺少详细的出处 。分析结果同时也显示了中外研究者在论文摘要写作上的相似之处 。 和模糊限制语, 论文最后讨论了研究结果对英文摘要撰写和学术英语教学所带来的启示 。 关键词: 基于语料库的体裁分析; 学术论文摘要; 语步; 语特征 中图分类号: H030 文献标识码: A 9876 ( 2011 ) 01003906 文章编号: 1673Abstract : Corpusbased research has received increasing attention in the field of English for Academic Purposes ( EAP) as the analysis of existing spoken and written corpora helps ascertain patterns of authentic language use across different academic, cultural and linguistic settings. This study has examined abstracts written in English by first ( L1 ) and second / foreign ( L2 / EFL) language speakers of English in the field of language teaching and learning. The aim of this study is to observe and compare the lexicogrammatical features and rhetorical patterns employed by these researchers for writing their abstracts. Using corpus software MonoConc Pro and Collocate 1. 0 ( Barlow 2004a,2004b ) and a 5move framework for abstracts ( Santos 1996 ) ,frequency and concordance data of 26 English Abstracts for Language Teaching ( EALT) and 26 Chinese English Abstracts for Language Teaching ( CEALT) have been obtained. It is found that the Chinese researchers,in comparison to their L1 English counterparts,have employed fewer rhetorical moves,more content words than functional words,less passive voice and fewer hedging and detailed references,and have overused a higher number of words. Some similarities have also been observed. The implications of these findings are discussed in terms of EAP teaching and English abstracts writing. Key words: corpusbased genre analysis; research abstracts; rhetorical moves; lexicogrammatical features
基于语料库的医学论文摘要动词语言特点探析

第 2期
福 建 医 科大 学学 报 ( 会 科 学版 ) 社
J u n l fFuinMe ia iest S ca ce c d t n) o r a ja dc l o Unv r i y( o il in eE ii S o
Vo1 3, .1 No. 2
研究 需要 确定语 料 的来 源 并 搜 集语 料 , 搜 集 的语 对 料 进行整 理 , 有 需 要 还 可 对 其 进 行 标 注 ; 数 据 若 在
讨论 了医学 学术 论 文 摘要 的语态 时态 等 文体 特
收 稿 日期 :0 20 —3 2 1—31 作者简 介: 齐 晖 ( 9O ) 女 , 师 , 语语 言 文 学 硕 士 。研 究方 向 : 料 库 语 言 学 , 学英 语 教 学 。 18一 , 讲 英 语 医
优 势
目前 , 研究英文摘要 的学者把科技文献按用途
不 同分为 “ 术 论 文 、 篇 报 道 、 议 文 献 、 士 论 学 短 会 博
G P等语料 库 索 引工 具 的不 断 完 善 , 得从 大 容 RE 使 量 的语料 库 中提取 所 需 信 息 、 析 语 言特 征 变得 更 分
趋 向和 语 义韵 。
关键词 : 医学 学术 论 文 ; 文 摘 要 ; 料 库 ; 言 特 点 英 语 语 中 图分 类 号 : 1 . H34 2 文献标识码 : A 文 章 编 号 :0 94 8 (0 2 0 —0 80 10 —7 4 2 1 ) 20 6 —5
医学 学术 论 文英 文 摘 要 浓 缩 了学 术 论 文 的重
要 内容 , 是全 文 的精 华 所 在 。一 篇 高 质 量 的 英 文摘
要 对 于正确 有效 地传 达 论 文 的 信 息 、 加 论 文 被检 增 索和 引用 的机会 、 大 学 术 影 响 起 着极 其 关 键 的作 扩 用 。因此 , 正确 掌握 医学 学 术 英 文 摘 要 的用 词 特 点 具有 重要 的现 实意 义 。本 文 旨在采 用 语 料 库 方 法 ,
《2024年语料库研究》范文

《语料库研究》篇一一、引言语料库作为一种资源丰富的语言数据集合,已成为语言学、语言学研究以及相关领域的热点研究对象。
它能够为语言分析、语言教学、翻译、词典编纂等多个领域提供支持。
本文将介绍语料库研究的重要性,并就当前语料库研究的现状进行梳理,进而分析其中存在的挑战和问题,并探讨未来的发展趋势。
二、语料库研究的现状1. 语料库类型及建设随着技术的进步,语料库建设日趋成熟。
根据不同领域和用途,语料库可大致分为通用型和专用型。
其中,通用型语料库如COCA、BNC等,涵盖了广泛的语言使用场景;专用型语料库则针对特定领域或主题进行收集,如法律、医学等。
此外,还有多媒体语料库和口语语料库等类型。
在建设过程中,研究者需考虑语料库的规模、代表性、时效性等因素。
2. 语料库应用领域语料库在多个领域得到了广泛应用。
在语言学领域,语料库为语言研究提供了丰富的数据支持;在翻译领域,语料库可帮助提高翻译的准确性和效率;在词典编纂方面,语料库为词汇的收集和释义提供了有力支持。
此外,在语言教学、自然语言处理等领域,语料库也发挥着重要作用。
三、当前挑战与问题尽管语料库研究取得了显著成果,但仍面临诸多挑战和问题。
首先,在语料库建设方面,如何确保数据的代表性和真实性是一个亟待解决的问题。
此外,随着技术的发展,如何利用人工智能等手段对语料库进行智能化处理和利用也是一大挑战。
其次,在应用方面,如何将语料库与实际需求相结合,提高应用效果也是一个难题。
此外,不同领域和行业对语料库的需求存在差异,如何满足这些不同需求也是一项挑战。
四、未来展望面对未来的发展,语料库研究将呈现以下几个趋势:1. 多样化与个性化:随着用户需求的多样化与个性化发展,未来的语料库将更加关注用户需求和实际应用场景的差异。
研究者需要设计更多类型的语料库来满足不同领域和行业的需求。
2. 智能化与自动化:人工智能技术的不断发展将促进语料库的智能化和自动化处理。
例如,利用自然语言处理技术对语料进行自动标注、分类和分析等操作,提高处理效率和准确性。
语料库与大学英语教学论文

语料库与大学英语教学【摘要】近年来,由于计算机及信息技术的飞速发展,语料库的发展进入了前所未有的阶段。
语料库被大量的应用到语言研究和语言教学,语料库对语言教学的地位逐渐成为了外语教学与研究的新课题。
本文通过探讨语料库对大学英语课堂教学的语音、语法和词汇教学的影响以及对大学英语学习者语言的输入与输出和自主学习能力培养方面的影响,强调语料库在大学英语教学中的积极作用。
【关键词】语料库;语料库语言学;大学英语教学1 引言以真实可靠的生活中使用的语言素材为基础的语料库对语言学的各个研究领域都有着非常明显的实用价值,已经成为语言研究的主流之一。
语料库不但提供了真实可靠的语料,还提供了科学的研究方法,推动语料库语言学快速发展。
语料库应用与外语教学也成为了一个备受语言研究者瞩目的大课题,基于语料库的外语教学对教学效果产生的积极影响是毋庸置疑的。
2 语料库与语料库语言学2.1 语料库与英语语料库语料库就是储存语言素材的仓库,这个仓库的语言素材是按照特定的目的与方式建立起来的。
这些语言素材都是某种语言中自然出现的,可以是书面的,也可以是口头的(谢应光,1996)。
语料库里储存的语料都是从有代表性的语言素材中通过随机抽样的方式选择输入电脑的。
“由于语料库收集了大量的人们实际使用的语言,而且可根据各种研究需要通过计算快速加以处理,故语料库为语言研究开辟了广阔的新研究领域”(郭杰克,1997:1)。
国际上知名的英语语料库的发展经历了三代:第一代的语料库以美国的布朗语料库(brown university standard corpus of present-day american english 简称brown)和英国的兰开斯特.奥斯陆.卑尔根语料库(lancaster-oslo-bergen corpus简称lob)为代表。
这两个语料库分别代表了当代美国和当代英语的语料库。
布朗语料库是第一个机器可读语料库,收集了500个英语书面语文本,每个文本2000词,整个语料库约计100万词。
语料库大学生自主写作论文

语料库与大学生自主写作【摘要】写作作为语言习得的一个高级目标,是外语教学中的一个重点和难点。
本文参考moodle 平台课程管理系统,尝试探索一种基于语料库的大学生英语写作能力培养模式。
同时,文章针对这种模式下教师角色的定位进行了阐述,以及对如何推进自主写作模式的应用提出了愚见。
【关键词】自主写作语料库培养模式应用引言在新的国际环境下,我国对大学英语教育又提出了新的要求:大学英语课程的设置应大量地使用先进的信息技术,推进基于计算机和网络的英语教学,为学生提供良好的语言环境与条件。
同时,课程要求认为学生个性化学习方法的形成和学生自主学习能力的发展是教学模式的改革成功的一个重要标志。
语言环境的限制和语料摄入不足等因素导致中国大学生的英语写作能力不容乐观,形成了在各种写作练习场合中八股文或者三段论式的写作方式。
笔者在一家考研培训机构任职期间发现这种三段论的论调有大行其道之风,写作公式化呆板化。
作为大学英语教育的直接执行者,教师的责任是不可推卸的,是非常应该值得反思的。
为此,本世纪初开始,我国许多语言教育者对此展开了新的探索。
受到西方语料库驱动教学理论的影响,他们也提出了利用语料库进行写作教学的想法,但是理论探索大于实践研究,针对语料库建设以及语料库检索软件在教学中的应用的相关研究不是很多,且没有提出一个具体的教学模式为英语教育所用,因此本文试图在前人的基础之上就语料库驱动下的自主写作模式做出尝试性探索。
一、可行性探索对于语料库在外语教学中的应用,在国内众多的理论和应用研究中,杨惠中(2002)认为语料库可以用在语言教学中。
为了提高中国大学生的英语写作能力,王立非等(2006)在总结濮建忠(2003)、刁琳琳(2004)、丁言仁等研究的基础之上,研究了二语学习中预制语块的作用并得出结论:学习者运用语块的能力与英语写作成绩具有显著的相关性,而且学生个体之间在词块使用上存在较大差异。
顾纪鑫等(2002)提议模仿国外的教学方法,建立网上写作实验室或网上写作中心,为学生和教师提供新的写作练习与指导途径。
语料库论文语料库语言学论文

语料库论文语料库语言学论文摘要:语言是我们生活的载体,是我们生活不可缺少的一部分,没有语言我们就不能称之为人类。
我们的生活离不开语言;没有语言,我们就无法生存。
由于语言对我们有着如此的重要性,因此,从某种程度上说,在人类漫长的历史过程中,人类一直以不同的方式对语言进行着研究。
语料库语言学是“基于现实生活中语言运用的实例进行的语言研究”(t. mcenery& a.wilson,1996)。
它是以真实的语言数据为基础,利用计算机对其进行统计、分类、标注、分析。
本文采用定性的方式,整理前人的研究,分析语料库语言学在二语习得中的作用及发展。
指出语料库强调词汇和语法的同一性,并认为意义是研究语言的关键所在。
关键词:语料库;二语习得;语言系统一、引言从语料库语言学针对语言研究的特点来看。
一种人们似乎广泛接受的观点是,如果不提及两个颇具影响的语言学学派——结构主义和转换-生成语法,要谈论语料库语言学对语言研究的贡献是不可思议的、不可想象的。
正如我们大多数人所知,对语言的真正研究是20世纪初现代语言学之父,ferdinand de saussure,从事的比较系统的语言研究出现时才开始的。
一些对语言感兴趣的人对saussure将语言视为一个相互限定的存在体系系统的概念感到十分惊讶并从中受到启发,这种语言概念与语言历来被看作的形式大相径庭。
于是,这些人开始用结构的方式从事语言研究。
这一充满生机的运动最初始于欧洲大陆,后来波及到美洲大陆,没过多久就遍及世界各地。
毫不夸张地说,saussure关于语言的富有洞察力的观点构成了许多当代结构语言学的基础,他的结构主义思想渗透到了每一个语言学学派。
在saussure的指导下,人们研制了一系列的程序来强调对话语的实质性特点在不参照语言抽象的底层结构或其意义的情况下进行切分和分类的过程(bullock & stephen, 1999)。
诚然,结构主义者不考虑意义来研究语言的纯科学方法显示了其空前的优势,因为这种方法是首次根据系统和结构来描述语言特点的。
《2024年语料库研究》范文

《语料库研究》篇一一、引言语料库研究作为一门新兴的跨学科研究领域,已经逐渐成为语言学、计算机科学、人工智能等多个领域的研究热点。
语料库的建立和应用,为语言研究提供了丰富的数据资源,使得我们能够更深入地探索语言的奥秘,推动语言研究的快速发展。
本文将介绍语料库研究的重要性和应用价值,以及其发展现状和未来趋势。
二、语料库研究的重要性与价值1. 丰富语言资源语料库研究为语言研究者提供了丰富的语言资源。
通过收集大量的文本数据,我们可以了解不同地域、不同文化、不同时代的语言特点和使用情况,为语言研究和教学提供有力的支持。
2. 推动语言学研究发展语料库研究为语言学研究提供了新的方法和手段。
通过对语料库进行统计分析,我们可以发现语言的规律和特点,揭示语言的内在机制和演变规律,推动语言学研究的深入发展。
3. 促进跨学科研究语料库研究不仅在语言学领域有着广泛的应用,还涉及到计算机科学、人工智能、社会学等多个领域。
通过跨学科的合作和研究,我们可以将语料库应用于更广泛的领域,推动相关领域的快速发展。
三、语料库的建立与应用1. 语料库的建立语料库的建立需要大量的文本数据和先进的技术手段。
在收集文本数据时,需要考虑数据的来源、规模、质量等因素。
同时,还需要使用先进的技术手段对数据进行处理和标注,以便于后续的研究和应用。
2. 语料库的应用语料库的应用范围非常广泛,包括语言教学、机器翻译、自然语言处理、情感分析等多个领域。
通过应用语料库,我们可以更好地了解语言的特点和使用情况,提高语言教学的效果和机器翻译的准确性。
四、语料库研究的现状与未来趋势1. 现状目前,语料库研究已经取得了重要的进展和成果。
许多大型的语料库已经建立起来,为语言研究和应用提供了有力的支持。
同时,随着计算机技术和人工智能技术的不断发展,语料库的研究和应用也在不断拓展和深化。
2. 未来趋势未来,语料库研究将继续朝着更加深入和广泛的方向发展。
一方面,随着技术的不断进步和数据的不断增加,我们将能够建立更大规模、更全面的语料库,为语言研究和应用提供更加丰富的数据资源。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Term paper for Corpus Linguistics and EFL Teaching1. Item investigatedDistinguishing LOOK, SEE and WA TCH with corpus evidence2. DataLOB (Z:\EC\LOB\)3. Corpus tools usedAntConc 3.4.4 (Laurence Anthony, 2014)(concordance, collocates)4. Findings4.1 Colligation patternsIn 194 concordance lines AntConc generated from LOB, the colligation patterns of SEE as a verb can be summarized as follows:(1) sb + SEE+(a/an/the) sth / sbThis pattern is used to emphasize the result of seeing. For example,to see the new musicalto see a clear realizationI see an aeroplanehim down there to see me(2) sb + SEE + sb+ do/doingWe see him swimming(3) sb + SEE + a clauseand see what he says beforeto see that their children haveto see how the persistentIn 99 concordance lines AntConc generated from LOB, there are 23 hints in which DEMAND is used as noun, and in the rest 76 hints, LOOK is used as a verb. the colligation patterns of LOOKas a verb can be summarized as follows:1) LOOK + prep(at/after/for/in. etc.)This pattern is used to emphasize the movement of seeing. For example,Take a good look at the namesefforts to look for an absolute2) LOOK + adj [as linking verb]Susan Small look well at3) LOOK + advbut they look uncommonlyhe looked hopefully4) LOOK + sth [as an intransitive verb]Mel looked every inch as good'Look! Grey squirrels didIn 173 concordance lines AntConc generated from LOB, the colligation patterns of W ATCH asa verb can be summarized as follows:1) WATCH + sth [as an intransitive verb]This pattern is used to emphasize the process of seeing. For example,To watch Christmas browsingHospital to watch operationsAnd watched the empty corridor2) WATCH + sb + doing/doand watch him shoeing a horseDiana watched her aunt presiding behind theHe watched her goHe watched her walk to the door3) WATCH + a clausehad to watch where I put my feet in case I fell.Watch that little tin thing4) WATCH + for [W ATCH as a transitive verb].This pattern usually means waiting for and be careful. For example,To watch for the prison flagAnd watched for the flight4.2 Collocates4.2.1 The collocates of SEE from 2L to 2R were identified by AntConc and are listed in the table below. The total frequencies of the collocates as well as their frequencies on the left and right context of SEE are also reported.As seen from the table, SEE most frequently collocates with function words, such as “we, to, he, you, the, a, in, it”. Pronouns such as “we, you” have higher frequencies on the left context than on the right. It does seem to collocate with content words. In term of the use of prepositions, “to” has the highest frequency “to SEE”, because“to” more often appears on the left of SEE as infinitive “to”.4.2.2. Through the identification of Antconc, collocates of LOOK from 2L to 2R are listed as below.As seen from the chart, LOOK also mostly collocates with function words like “the, a, at, to, like, for, and, as”. It does not seem to collocate with content words. In term of the use of prepositions, “at” has a higher frequency than other prep, “LOOK at” often used than “look for” and “look like” in LOB. And “to” more often appears on the left of LOOK as infinitive “to”.2.2.3. Through the identification of Antconc, collocates of WATCH from 2L to 2R are listed as below.As seen from the table, WATCH most frequently collocates with function words, such as “she, to, and, the, as”. Pronouns such as “he, she” have higher frequencies on the left context than on the right. This suggests that the pronouns are used more often in the pattern “sb.WA TCH” than in “WA TCH sb.”In term of the use of prepositions, “to”has the highest frequency “to WATCH”,because “to”more often appears on the left of WATCH as infinitive “to”.5. Implications for teachingSEE, LOOK and WATCH as verb is an expression of seeing. It’s particularly useful in conversation. However, it does seem to appear often in textbooks. It is often used by Chinese students too. However, when students come across these verbs, guidance and instruction is probably necessary for them to understand and master the form, the meaning as well as the use of it. It is especially important to explain to the students about the difference of these verbs, so that the students are aware of when and where to use it appropriately.When teaching, the teachers can make use of native speaker corpora, as important complementary materials to the textbooks. Examples from corpora can be used to help the students notice the authentic use of these verbs and acquire it. In addition, teachers can consciously use these verbs in class after it is introduced so that the students have a deeper and more vivid impression of it.Word count: 1043References①何安平语料库辅助英语教学入门[M], 北京;外语教学与研究出版社,2012Appendix:Grammar words – see, look and watch1. Look at the lines and find the groups:1) See sb do/doing sth2)Look+ prep(at/after/for/in. etc.)3)Watch + sth [as an intransitive verb]Can you find any useful expressions? Underline them2. fill in each brank with see, look or watch1. If he only cared to ___, he’d see what I am doing.2. He stood on the shore ___ the sea and hoping to ___ the boat. But as he had left his glasses behind, he couldn’t see anything no matter how hard he __.3. Now __ yourself in the mirror, and you __ the dirt in your cheek.4. The following evening they went to __ the prizefight. They __ the skillful movements of the boxers with great interest.。