基于语料库、体裁分析和建构

合集下载

基于语料库的学术论文摘要体裁对比分析_李萍

基于语料库的学术论文摘要体裁对比分析_李萍

and Feak 对体裁特征的描写( 1994 ) 。 表 1. 摘要 5 语步分析模式
语步 ( MOVE) 语步 1 : 定位研究 ( Situating the searchБайду номын сангаас 功能 ( FUNCTION) 范畴 ( QUESTION ADDRESSED) 对本研究领域已 知 道 什么?
re- 确立研究背景
架和词语型式。摘要体裁分析采用 Santos ( 1996 ) 的 5 语步模式; 语料库分析软件为 MonoConc Pro 和 Collocate 1. 0 ( Barlow 2004a, 2004b) 。分析数据显示, 中国研究者在英文摘要写作中实义词使用率偏高, 部分词组过度使用, 但同 结论语步出现频率偏低的现象 。就词语特征而言, 中国研究者较少使用被动语态过去时 时又呈现摘要语步数量偏少, 摘要的文献引证缺少详细的出处 。分析结果同时也显示了中外研究者在论文摘要写作上的相似之处 。 和模糊限制语, 论文最后讨论了研究结果对英文摘要撰写和学术英语教学所带来的启示 。 关键词: 基于语料库的体裁分析; 学术论文摘要; 语步; 语特征 中图分类号: H030 文献标识码: A 9876 ( 2011 ) 01003906 文章编号: 1673Abstract : Corpusbased research has received increasing attention in the field of English for Academic Purposes ( EAP) as the analysis of existing spoken and written corpora helps ascertain patterns of authentic language use across different academic, cultural and linguistic settings. This study has examined abstracts written in English by first ( L1 ) and second / foreign ( L2 / EFL) language speakers of English in the field of language teaching and learning. The aim of this study is to observe and compare the lexicogrammatical features and rhetorical patterns employed by these researchers for writing their abstracts. Using corpus software MonoConc Pro and Collocate 1. 0 ( Barlow 2004a,2004b ) and a 5move framework for abstracts ( Santos 1996 ) ,frequency and concordance data of 26 English Abstracts for Language Teaching ( EALT) and 26 Chinese English Abstracts for Language Teaching ( CEALT) have been obtained. It is found that the Chinese researchers,in comparison to their L1 English counterparts,have employed fewer rhetorical moves,more content words than functional words,less passive voice and fewer hedging and detailed references,and have overused a higher number of words. Some similarities have also been observed. The implications of these findings are discussed in terms of EAP teaching and English abstracts writing. Key words: corpusbased genre analysis; research abstracts; rhetorical moves; lexicogrammatical features

基于语料库浅析日语学术论文的句末表达形式

基于语料库浅析日语学术论文的句末表达形式

基于语料库浅析日语学术论文的句末表达形式作者:陈冰月来源:《校园英语·上旬》2015年第03期【摘要】日语专业学生撰写学术论文问题多多,究其原因在于语言基础不扎实,未能掌握学术论文的撰写方法。

日语学术论文的语言表达方式与一般书面语有差异,因此总结论文特有的表达方式很有必要。

本文运用自建语料库,通过统计句末表达形式及其出现频率进行比较分析,以试图总结日语学术论文的表达特点。

【关键词】日语语料库日语学术论文句末表达一、序言日语语言中书面语与口语在表达方式上有很大差异,日语学习者往往将重点放在练习口语表达上,而忽视了对日语书面语表达能力的训练。

学生语言基础不扎实,影响了学术论文写作的质量。

在研究领域,学术论文一直是呈现新知识的重要渠道。

学术论文作为一种特殊的体裁,有着它独特的语篇结构。

因此,系统性地归纳出学术论文的语言表达特点非常有必要,有利于帮助学生提高论文写作能力。

丸山指出句末表达是一句话的表达当中最为重要的一个要素,句末表达形式变化的丰富程度可以视为展示那一类文章所蕴含的丰富表现力的线索。

因此,本文以句末表达形式为切入点进而分析日语学术论文的表达特点。

二、研究方法1.语料采集。

CiNii(http://ci.nii.ac.jp)是目前世界上最全的日本学术论文数据库,收录日本各学会出版的学术期刊文献。

本文从CiNii数据库中采集2000年到2013年间发表的日语语言学论文,涵盖语音学、词汇学、语法学、教育学、中日对比研究、语用学、语义学及认知语言学等领域,共计50篇论文作为本次构建语料库的文本素材。

2.语料处理。

利用OCR文字识别软件“e.Typist”将采集到的样本转换成txt文本格式。

然后使用软件“edamame”、“himawari”将样本制作为可检索的语料库。

3.语料分析。

本文旨在研究日语学术论文的句末表达形式,因此在建成的语料库中将关键词设置为“。

”进行检索,得到6512个结果。

自然语言处理中的语料库构建与语料库分析研究

自然语言处理中的语料库构建与语料库分析研究

自然语言处理中的语料库构建与语料库分析研究自然语言处理(Natural Language Processing,简称NLP)是人工智能领域的一个重要研究方向,旨在使计算机能够理解、处理和生成人类语言。

而语料库是NLP研究中不可或缺的资源,它是大量文本的集合,用于训练和评估各种语言模型和算法。

本文将探讨语料库的构建方法以及语料库分析在NLP研究中的应用。

一、语料库的构建方法语料库的构建是NLP研究的基础工作之一,它需要从大量的文本数据中收集、整理和标注语料。

以下是几种常见的语料库构建方法:1. 人工标注法:这是最常用的语料库构建方法之一。

研究人员通过阅读文本并手动标注其中的语言现象,如词性、句法结构等。

这种方法的优点是标注准确,但缺点是耗时耗力,适用于小规模语料库的构建。

2. 自动标注法:随着机器学习和深度学习的发展,自动标注法越来越受到关注。

这种方法利用机器学习算法对大规模文本进行自动标注,如词性标注、命名实体识别等。

自动标注法的优点是高效快速,但准确度可能不如人工标注。

3. 网络爬虫法:这种方法通过网络爬虫程序从互联网上收集文本数据。

研究人员可以针对特定主题或领域进行爬取,构建领域特定的语料库。

然而,网络爬虫法需要解决反爬虫机制、数据噪声等问题。

4. 数据库整合法:这种方法通过整合已有的语料库来构建新的语料库。

研究人员可以从不同来源的语料库中选取合适的数据进行整合,以满足特定的研究需求。

数据库整合法的优点是节省时间和资源,但需要解决数据格式和标注不一致等问题。

二、语料库分析在NLP研究中的应用语料库分析是对语料库进行统计和语言学分析的过程,它可以帮助研究人员了解语言的规律和特点,为NLP研究提供基础数据和启发。

以下是语料库分析在NLP研究中的几个典型应用:1. 词频统计:通过对语料库中的词频进行统计分析,可以了解不同词汇的使用频率和分布情况。

这对于构建词典、词性标注、命名实体识别等任务都具有重要意义。

语言的语料库建设:利用语料库进行语言研究和教学

语言的语料库建设:利用语料库进行语言研究和教学

03
利用语料库进行语言研究
基于语料库的词汇研究
词汇的统计与分析
• 词频:统计词语在语料库中的出现次 数 • 词性分布:分析词语在不同词性中的 分布情况 • 词汇搭配:研究词语之间的组合关系 和搭配规律
词汇的变异与演变
• 词义变异:分析词语在特定语境中的 意义变化 • 词形演变:研究词语在不同历史时期 的形式变化 • 词汇创新:探讨新词的产生、发展和 传播过程
DOCS SMART CREATE
语言的语料库建设:利用语料库进行语言研究 和教学
CREATE TOGETHER
DOCS
01
语料库的基本概念与重要性
什么是语料库及其发展历程
01
语料库的定义
• 语料库是一个大型、有代表性的 文本集合 • 用于语言研究、教学和自然语言 处理等领域
02
语料库的发展历程
语料库的整理与标注
语料库的整理方法
• 数据分类:将文本数据按照主题、体裁、来源等进行分类 • 数据存储:将整理好的数据归档、备份,便于后续使用 • 数据维护:定期更新、维护语料库,确保数据的时效性和准确性
语料库的标注方法
• 词性标注:为文本中的每个词分配词性标签 • 句法标注:为文本中的每个句子分配句法结构标签 • 语义标注:为文本中的每个词分配语义角色标签
语料库在语言测试中的应用
语料库辅助语言测试
• 测试题设计:利用语料库提供真实、具有挑战性的测试题 • 评分标准:根据语料库制定客观、公正的评分标准 • 测试反馈:通过语料库提供详细、准确的测试反馈,帮助学生提高语言能力
语料库驱动语言测试
• 测试模式:利用语料库开发多样化、个性化的语言测试模式 • 测试评估:通过语料库进行全面、持续的测试评估,了解学生的学习进度和需求 • 测试资源:提供基于语料库的丰富、实用的测试资源,满足不同学生的测试需求

基于语料库的英语专业大学生信息性演讲稿分析

基于语料库的英语专业大学生信息性演讲稿分析


l 研 究 方 法
从 上述研 究 中笔者 发 现 , 以往 的 研 究 分 析 针 对 语 言 特 点 的研 究 不 足 。 因 此 , 文 基 于 自建 的 英 语 专 业 大 学 生 信 本 息 性 演 讲 语 料 库 的 研 究 , 用 ANT ONC软 件 对 1 0个 同 利 C 2
红 见 ( 0 9 借 助 于 语 言 学 理 论 以 及 数 学 统 计 学 的 知 识 对 20 ) 七 , , , , 一 , 二 届 “ 1世 纪 杯 ” 国 英 语 演 讲 比 赛 八 九 十 十 十 2 全 6 O篇 决 赛 已备 演 讲 稿 进 行 体 裁 分 析 和 研 究 , 在 总 结 出 英 意
1 % 9
图 2 a 各 种 语 法 现 象 在 英 语 专 业 S 大 学 生 信 息 性 演 讲 中 的使 用 比例
作 者 简 介 : 然 (9 9 , , 北石 家庄 人 , 北 科 技 大 学外 国语 学 院讲 师 , 语 语 言 学硕 士 , 究 方 向 : 国语 教 学 、 料 库 范 1 7 一) 女 河 河 荚 研 外 语
了一 定研究 , 经过 分析 笔者 总 结 出 自荐语 料 库 中英 语 专业 大学生 信息性演 讲的题 目大 致可 以分 为 1 9类 , 体分 布 情 具
况如 图~ 。
通 过对 图一 的分 析 得 出 , 日常生 活 、 康 、 境 、 化 、 健 环 文
旅游 等方面 的题 目选取 较 多 , 中得 出 同学 们 比较 注 重 日 从 常生 活和精神文 化 等方 面 , 因是 这些 内容 对 同学 们 来说 原 比较熟 悉 , 生活周 围经常接触 到 的内容 , 日常生 活息 息 是 与 相关 , 易于表 达 , 生们能够 对其 进行 分析 和讨论 。并 且八 学

专业的语料库语言分析

专业的语料库语言分析

专业的语料库语言分析语料库是指大量收集并整理起来的自然语言文本资源的集合。

在语言学和计算机科学领域,语料库是进行语言学研究和自然语言处理的重要基础。

语言分析是对语料库中的文本进行系统地处理和研究的过程。

本文将探讨专业的语料库语言分析的方法和应用。

一、语料库的构建与特点语料库的构建是一个相对复杂的过程,需要采集、整理、标注和存储大规模的文本数据。

常见的语料库类型包括平行语料库(Parallel Corpus)、单语语料库(Monolingual Corpus)和特定领域语料库(Specialized Corpus)等。

语料库的特点有多样性、真实性和大规模性。

多样性指语料库中的文本来自于不同的语言、文体和主题领域,能够涵盖各种文本类型的特征。

真实性指语料库中的文本是真实的语言数据,具有一定的时效性和可靠性。

大规模性指语料库中包含大量的文本数据,可以提供足够的样本数量进行分析和研究。

二、语料库语言分析的方法专业的语料库语言分析需要结合语言学和计算机科学的方法和技术。

以下是一些常用的语料库语言分析方法:1.词汇频率分析通过统计语料库中词汇的频率和分布情况,可以了解到不同词汇在语言中的重要性和使用情况。

词汇频率分析可以对文本进行关键词提取、词汇排序和热点话题挖掘等。

2.搭配分析搭配是指一组词在语境中经常一起出现的现象。

通过对语料库中的搭配进行分析,可以了解到词汇之间的搭配规律和固定搭配的使用频率。

搭配分析可以帮助改进词汇的搭配选择和提高语言表达的准确性。

3.句法分析句法分析是对语料库中句子结构和语法关系的分析。

通过句法分析,可以了解到句子的句法结构、成分之间的关系和句法规则的应用情况。

句法分析可以帮助理解句子的语法结构和语义含义,对翻译、文法教学和机器翻译等领域具有重要意义。

4.样式分析样式分析是对语料库中文本样式和表达方式的分析。

通过样式分析,可以了解到文本的体裁和风格特点、修辞手法和篇章结构等。

样式分析可以帮助提高写作能力和文本理解能力,对文学研究和科技写作等领域具有重要价值。

基于语料库的高考英语阅读理解试题语言复杂性分析——以2008-2012年重庆市高考英语试题为例

基于语料库的高考英语阅读理解试题语言复杂性分析——以2008-2012年重庆市高考英语试题为例

可 以通过判 断 三级词 表 中类符 所 占的 比例 来初 步 判 断 阅读理解 语 篇词 汇 的难 度 ¨ 。 除 了词汇 量外 , 词 汇 的丰 富 程度 也 是 衡 量 语 篇
第2 7卷 第 2期 2 0 1 4年 3月
重庆 第 二师 范学 院学报
J o u r n a l o f Ch o n g q i n g U n i v e r s i t y o f E d u c a t i o n
V0 1 . 2 7 No . 2
Ma r c h, 2 01 4
中图分类号 : G 4 2 4 . 7 4 文献标识码 : A 文章编 1 6 7— 0 4


引言
和类 符 比 ) 反 映的 易 读度 和 传 统 的易 读 公 式 计算 出
的结 果有 一定 差 异 , 这 说 明 通过 语 料 库 方 法 进一 步 分析 高考语 篇 的语 言复 杂性是 十分 必要 的 。
本文结 合 《 普通 高 等学 校 招 生 全 国统一 考 试 大
纲( 英语) 》 ¨ ( 以下简称《 考纲》 )和《 全 日制普通 高级中学英语教学大纲( 2 0 0 0实验修订版) 》 1 4 ] ( 以 下简称《 教纲》 ) , 基 于语料库研究方法从语篇体裁 、
语篇 长 度 、 生 词 率 和 词 汇 密 度 等 方 面 详 细 分 析 了 2 0 0 8 -2 0 1 2年重 庆 市 高 考 英 语 阅 读 理 解 语 篇 的语 言 复杂性 , 以期 对 高考 英 语 阅读试 题 的命 题 和 备考 提供 参考 。
读理解试题的研究一直是高考英语试题研究的热点
之一 。
目前 对高 考英 语 阅读试 题 的定性 研究 主要 可 分

基于语料库的研究范式

基于语料库的研究范式

基于语料库的研究范式是一种以语料库为基础,通过对大量真实语言数据的分析和处理来研究语言现象、语言使用和语言变化的方法。

这种范式通常包括以下几个步骤:
1. 语料库建设:收集大量的语言数据,并建立语料库。

这些数据可以来自不同的来源,如文学作品、新闻媒体、社交媒体等。

2. 语料处理:对语料库中的数据进行预处理,包括文本清洗、分词、词性标注等。

3. 语料分析:使用各种统计和分析方法来处理语料库中的数据。

这可能包括频率分析、关键词提取、主题建模等。

4. 结论得出:根据语料分析的结果,得出关于语言现象、语言使用和语言变化的结论。

这些结论可以为语言学、文学、文化等领域的研究提供有益的启示和证据。

基于语料库的研究范式具有以下优点:
1. 大量的语言数据支持:语料库可以包含大量的真实语言数据,使得研究者可以对语言现象进行深入的研究和分析。

2. 定量与定性相结合:基于语料库的研究范式可以将定性和定量的方法相结合,从而更全面地了解语言现象的本质和规律。

3. 跨学科性:基于语料库的研究范式可以应用于多个学科领域,如语言学、文学、文化学等,使得不同学科之间的交流和合作更加便捷。

总之,基于语料库的研究范式是一种重要的语言研究方法,可以帮助我们更好地了解语言的本质和规律,进一步拓展和丰富世界
文化多样性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于语料库、体裁分析和建构
【摘要】本文回顾了英语概要写作国内外的研究现状,通过大学英语概要写作语料库研究了英语概要写作的语场特征,提出了基于语料库、体裁分析和建构主义教学模式相结合的支架式英语概要写作教学模式,本研究对于提高英语读、写结合教学具有重要意义。

【关键词】概要写作语料库体裁建构主义
概要(summary)是一种对原始文献(或文章)的基本内容进行浓缩的语义连贯的短文。

它以迅速掌握原文内容梗概为目的,不加主观评论和解释,但必须简明、确切地表述原文的重要内容。

概要写作(summary writing)是一种控制性的作文形式,它能使学生通过阅读原文,吸收原文的文章结构与语言方面的长处,写出内容一致、结构近似、语言简洁的短文。

这种写作既要准确理解原文,又要能综合概括;既能培养欣赏能力,又能训练书面表达能力。

1 英语概要写作研究综述
曾炳辉(1989)在《英语概要写作与智力训练》中论述了概要写作是训练抽象概括能力即思维能力的最好的形式之一;郑文(2007)就大学英语读写过程中存在的输入和输出的矛盾,提出利用阅读教材作为写作输入,培养篇章图式;利用概要写作训练作为写作输出,揭示学生篇章图式的不足,提高学生的读写水平;张新玲和曾用强(2009)在《读写结合写作测试任务在大型考试中的构念效度验证》中从构念效度的实质方面入手对这类任务在我国大规模考试中所得分数进行效度验证,发现所取样本考生的读写结合写作测试应答数据和构念理论相拟合。

而国外学者,已经开始运用语料库,体裁分析理论,语篇分析理论和形式结构分析理论研究概要写作,如Rosalie Friend的“Effects of Strategy Instruction on Summary Writing of College Students”;Daniel Marcu的“From text discourse structures to text summaries”;Esther Uso Juan和Juan Carlos Palmer Silveira的“A Product-Focused Approach to Text Summarisation”;Sa-Kwang Song,Dong Hyun Jang,Sung Hyon Myaeng的“Text Summarization Based on Sentence Clustering wi th Rhetorical Structure Information”以及Jade Goldstein Stewart的“Genre Oriented Summarization”等。

2基于语料库的英语概要写作研究
语料库语言学研究的诞生可以追溯到19世纪末,二十世纪中叶以后随着计算机的广泛普及与使用,现今语料库的规模越来越大、种类越来越多,利用语料库进行语言研究和语言学习的人也就越来越方便。

本研究建立了大学英语概要写作语料库,其目的是通过语料库来研究大学英语概要写作的篇章及体裁的一部份特点,为大学英语概要写作的教学及测试评价提供一定的依据。

大学英语概要写作语料库中包括两个子语料库:概要写作原文库,概要写作库。

每个子语料库按
照记叙文、议论文、说明文3种不同的体裁又分成次子语料库。

在本研究中,为了增加语料的可靠性,语料主要来源于大学英语的相关教程包括《新视野大学英语读写教程1~4册》的A,B部分的精读课文,《大学英语精读1~4册》,概要来自于上面两个教程的配套教师用书《新视野大学英语读写教程教师用书1~4册》、《大学英语精读同步辅导1~4册》,其它一部分语料来源于外文书目包括“Writing and Reading Across the Curriculum”,“The Student Writer”,“The College Writer”,“Technical Writing”,“Steps to Writing Well”,“Reading Critically,Writing Well”,“Read,Reason,Write”,“Patterns or a purpose”,“Critical Strategies for Academic Writing”,“A Handbook of Writing”,剩余的一小部分语料来源于网络。

目前项目组利用该语料库主要研究了大学英语概要写作的语场特征。

本研究利用大学英语概要写作语料库,检索到大学英语概要写作的使用频率在前的名词和动词,以得到大学英语概要写作的语场特征。

检索中,发现了一些可以帮助确定概要写作语场的词语。

名词如:text,author,passage,problem,writer,story;动词如:lead,show,tell,explain,display,suggest,relate,describe。

通过把这些词汇在语料库工具AntConc中分析发现,原因在于大学英语概要写作的起始句通常采用能够概括文章主题的句子。

也就是说大学英语概要写作文章通常会包含一个能够表达文章中心思想的句子,而且这个中心句子经常会被放在概要写作文章的开篇。

基于语料库的大学英语概要写作研究为大学英语概要教学提供了客观的参考依据。

3基于体裁分析和建构主义教学模式的支架式英语概要写作教学研究
体裁分析与语篇分析密切相关,其中语篇的体裁分析超越了对语篇语言特征的简单描述,力求解释语篇建构的理据,探讨语篇结构背后的社会文化因素和心理认知因素,揭示实现交际目的特殊方式和语篇建构的规范性(韩金龙,秦秀白,2000)。

体裁教学法认为语言学习过程是一系列被建架的发展阶段,每一阶段解决语言某一方面的问题。

根据体裁分析理论和建构主义教学法,在英语概要写作教学过程中,教师应以学生为中心,教师只起组织者、指导者、帮助者和促进者的作用,利用体裁意识培养学生协作探究、学习效果评价等学习环境要素,充分发挥学生的主动性、积极性和首创精神。

根据体裁教学法和建构主义的教学模式和教学方法,本研究实践了支架式英语概要写作教学模式。

支架式英语概要写作教学由以下几个环节组成:①搭脚手架:围绕当前学习材料,使学生建立体裁和篇章意识。

②进入情境:将学生引入分析原材料的语言特点、交际目的和篇章结构特点。

③独立探索:让学生独立探索。

使学生在阅读过程中,对当前学习体裁的性质、规律以及该体裁与其它体裁之间的内在联系达到较深刻的理解,能从篇章语法规则中抽取语义,获得篇章图式;在写作过程中,能把在阅读过程中获取的篇章图式化为最简篇章图式,根据语义通过语法规则成篇。

④协作学习:进行小组协商、讨论。

第一、协商、讨论原材料的体裁类型,并分析其语言特点、交际目的和篇章结构特点;第二、协商、讨论英语概要写作的语言特点、交际目的、篇章结构特点、写作技巧和常见错误。

⑤效果评价:对
学习效果的评价包括学生个人的自我评价,学习小组对个人的学习评价,教师对个人的学习评价。

评价内容包括:体裁意识、体裁分析能力、阅读理解能力、批判能力、写作能力和英语思维能力。

4结语
英语概要写作是一项很好的读写结合的写作任务和复杂的思维训练活动,要求写作者具有很高的阅读和重组写作技巧,是有效连接阅读和写作的桥梁,是提高学生读、写能力的一种有效的途径。

本研究建立的基于语料库、体裁分析和建构主义的英语概要写作教学模式,经过一段时间的实践,提高了大学英语读、写的教学效果及学生的阅读理解能力、批判能力、写作能力和英语思维能力。

(黑龙江大学新世纪教育教学改革工程项目项目编号:2011C093。

黑龙江大学青年科学基金项目项目编号:QW201030)
参考文献
1 Bhatia V. K. Analyzing Genre. Language Use in Professional Settings[M]. London: Longman Publishing House,1993
2 李艳玲.英文概要写作简述[J].河北大学成人教育学院学报,2004 (6)
3 周玉妍.基于体裁的大学英语概要写作评价标准研究[D].黑龙江:黑龙江大学,2011。

相关文档
最新文档