基于语料库的语篇分析范式研究
基于语料库的文学语篇分析——以《外婆的日用家当》为例

带来很 大 的启示 。《 婆 的 日用 家 当 》 外 是美 国著名 黑
人女作 家艾 莉斯 ・沃克 的 早 期 短篇 小 说 集 《 情 与 爱 困惑 : 黑人妇 女 的故 事 》 的一 篇 , 述 的 是 由家里 中 讲 的两床 被子 引发 的母 亲 、 女 儿 麦 琪 和 大 女儿 迪 伊 小 之 间的 冲突 。本 文 将 使 用 Wod mi rs t h及 AnC n to c
基 于语料 库 的语 言研究 一般 采取 定性 与定 量相 结 合 的研究 方法 , 进行 定 量 研 究 就 要 涉 及 文本 检 要
索 和数 据 统计 。Wod mi rs t h软 件 中 的 Wodi r l t工 s
具 可 以对 语篇 的基 本 信 息 进行 统 计 , 自动生 成 词 表
舶 s e 9' i 1 ,丌 z
住 仃7
tk n 细 n m od } tx 36 9 oe s n w rs m e t .1
协 k n s dfr e su e o 耐d妊 l 3 1 搴 9 6 tp s sm t o d J ’ 3 y e t c w rs , 6 0
的三 个 主 要 工 具 : o cr a c 、 r l t和 Ke — C n od n e Wo di s y
8a tr i d Tr b s s 100 l ̄ a dse R a i , 0
me f r e  ̄hr c m'tr ) a wo l dln : 椭 h a es c
3 1 、 9 5
36 9 ,1 106 3
 ̄ p/ k nrt 限 ) 2 3 et e i o ao 86
ar a 埔s l r edEr d R 4 1 3 7 sa d tn  ̄ s dT sdd e TR t . 4 9 28
《2024年语料库与批判话语分析》范文

《语料库与批判话语分析》篇一一、引言在当今社会,语言不仅是人们交流的工具,更是社会文化、意识形态和权力关系的反映。
因此,对语言的研究显得尤为重要。
语料库和批判话语分析作为两种重要的语言研究方法,为人们提供了深入探讨语言背后隐藏的社会、文化和心理层面的手段。
本文将分别介绍语料库和批判话语分析的概念、特点及两者在语言研究中的应用,并探讨它们之间的互动关系。
二、语料库的概念与特点1. 语料库的概念语料库是一种大规模的、结构化的语言数据集合,用于语言学、语言教育、翻译等领域的研究。
它通过收集、整理和分析大量的语言实例,为研究者提供了丰富的语言数据资源。
2. 语料库的特点(1)大规模性:语料库包含大量的语言实例,可以反映语言的真实使用情况。
(2)结构化:语料库中的数据经过整理和标注,便于研究者进行数据分析和提取。
(3)客观性:语料库提供的数据具有客观性,可以避免主观臆断和偏见。
三、批判话语分析的概念与特点1. 批判话语分析的概念批判话语分析是一种以社会、文化和意识形态为背景的语言分析方法,旨在揭示语言背后的权力关系、意识形态和社会不平等。
它通过对文本、话语和交流过程的分析,揭示出语言使用中的社会、文化和心理层面的意义。
2. 批判话语分析的特点(1)社会性:批判话语分析关注语言与社会、文化和意识形态的关系。
(2)批判性:批判话语分析注重揭示语言背后的权力关系和意识形态。
(3)综合性:批判话语分析需要综合考虑文本、语境、交际者等多方面的因素。
四、语料库与批判话语分析在语言研究中的应用1. 语料库在语言研究中的应用(1)语言描写与对比:通过语料库,研究者可以收集大量语言实例,对不同语言进行描写和对比,揭示语言的特征和规律。
(2)语言教学与翻译:语料库为语言教学和翻译提供了丰富的数据资源,有助于提高教学效果和翻译质量。
(3)社会语言学研究:语料库可以反映社会的语言使用情况,为社会语言学研究提供数据支持。
2. 批判话语分析在语言研究中的应用(1)揭露社会不平等:批判话语分析通过分析文本和交际过程,揭露语言背后的权力关系和社会不平等。
《2024年语料库与批判话语分析》范文

《语料库与批判话语分析》篇一一、引言在当今社会,语言不仅是人们交流的工具,更是社会现象的反映和文化的载体。
随着语言学研究的深入发展,语料库和批判话语分析作为两种重要的研究方法,在语言研究中发挥着越来越重要的作用。
语料库为研究者提供了大量的语言实例,使得语言研究更加客观、科学;而批判话语分析则注重从社会、文化、政治等多角度对语言进行解读,揭示语言背后的深层含义。
本文将分别介绍语料库和批判话语分析的原理、方法及实践应用,并探讨二者在语言研究中的互补性。
二、语料库的原理与方法1. 语料库的原理语料库是一种大规模的语言实例集合,它通过收集、整理、标注等方式,将语言使用情况以数据的形式呈现出来。
语料库的建立为语言研究提供了丰富的数据资源,使得研究者可以通过统计分析等方法,客观地了解语言的特征和规律。
2. 语料库的方法语料库的方法主要包括语料收集、标注、检索和分析等步骤。
首先,研究者需要根据研究目的和需求,选择合适的语料来源,如报刊杂志、网络论坛等。
然后,对收集到的语料进行标注和整理,以便进行后续的检索和分析。
最后,通过使用计算机软件等工具,对标注好的语料进行统计分析,得出研究结论。
三、批判话语分析的原理与方法1. 批判话语分析的原理批判话语分析是一种从社会、文化、政治等多角度对语言进行解读的方法。
它认为语言不仅是交流的工具,更是社会现象的反映和文化的载体。
因此,批判话语分析注重揭示语言背后的深层含义和意识形态。
2. 批判话语分析的方法批判话语分析的方法主要包括文本解读、语境分析和互文性分析等。
首先,研究者需要对文本进行细致的解读,了解文本的主题、内容和表达方式。
其次,通过分析文本产生的语境,如社会背景、文化传统等,揭示文本背后的深层含义。
最后,通过分析文本之间的互文性关系,探讨文本与其他文本之间的联系和影响。
四、语料库与批判话语分析的实践应用1. 语料库在语言研究中的应用语料库在语言研究中的应用广泛,如词汇研究、句法研究、语用研究等。
语篇的语料库研究范式评介(1)

2010 年 3 月 第 33 卷第 2 期
— —多维分析法作较为详细的 库研究范式之一 — 介绍 。 2. 对语料库研究范式的不同看法 2. 1 对语料库研究范式的批评 对语料库研究范式用于语篇分析 ① 的批评 概括起来主要有以下几点: ( 1 ) 是以词汇 - 语法模式为焦点的自下而 上的分析 。 Swales[ 37 ] 认为语料库研究范式对语篇分
①பைடு நூலகம்
为行文方便, 本文不对 text 和 discourse 做区分, 均
统称为语篇。
35
析的出发点是句子层面, 焦点是词汇 - 语法模 式, 而不是语篇的宏观结构或句子层面以上的 更大的语篇单位;语料库展示的只是表层资料 ( surface data) [ 6 :511 ] ;对词汇 - 语法模式的分 析限于局部, 几乎未对它们在语篇中的功能进 23 :543 ] 。 行任何阐释[ ( 2 ) 将语篇从语境中剥离了出来[ 5 :36 ] 。 Widdowson [ 40 :22 ] 认为语料库资料是去 28 : 23 ] 语境化的 ( decontextualized ) 。 Hunston[ 认为 缺 乏 现 实 的 和 社 会 的 语 境 是 索 引 行 ( concordance line) 解释中的最严重的障碍 。 ( 3 ) 无法解决语义问题 。 Borsley & Ingham[ 17 ] 认为这种分析不能 处理意义问题, 揭示意义的唯一途径是询问本 36 :8 - 9 ] , 即本族语者依赖于直觉产 族语者[ 出的内省数据 。 2. 2 语料库研究范式的回应 语料库研究范式用于语篇 针对以上批评, 分析的倡导者认为: ( 1 ) 语料库的标注系统 ( tagging system ) 可 “自上而下 ” 的分析路径 。 以部分地实现 使用嵌入标注来标明语篇的语步结构, 可 24 :325 ] 。 使语料库在语篇层面上有更多作为[ Flowerdew[ 24 :326 - 327 ] 认为通过对具有修辞 特征的更大的语篇段( stretches of text ) 进行标 “词汇 - 语法模 注, 可部分地解决语料库是以 的 分 析 路 径 问 题, 如 式为 焦 点 的 自 下 而 上 ” Thompson[ 38 ] 39 ] 和 Upton[ 等的研究, 在这些 研究中词汇 - 语法特征是从基于语篇的语步结 构来分析的, 而不是在索引行或句子层面上进 行的②。这种语篇类型的标注可用于那些具有 如求 相对公式化和常规性修辞结构的体裁中, 职信等, 但对于由不同体裁组成的语篇 、 语步结 构范 围 跨 度 大 的 语 篇 或 具 有 嵌 入 式 语 步 ( embedded move structure) 的语篇, 这种标注方 式可能使用不便, 因此不是切实可行的选择 。 然而, 现在分析软件日益复杂化, 例如 WinMax 工具就具有标明嵌入式语步结构的功能, 可以 部分解决这一问题 。 ( 2 ) 语料库语言学在本质上是一种语境理论。
基于语料库的儿童文学的语篇分析

基于语料库的儿童文学的语篇分析本文将使用语料库检索软件,对美国作家弗兰克·鲍姆(Frank Baum)创作的儿童文学作品《绿野仙踪》的文本特征、主要内容等方面进行分析,以展示语料库检索软件在文学分析方面的强大功能,提高英语专业大学生对英语文学学习的兴趣,促进他们的英语学习。
标签:语料库;《绿野仙踪》;文本分析1简介随着近年来信息技术的发展以及计算机的普及和语料库研究的渐渐升温,国内外不少学者将语料库研究方法应用到文学领域,利用语料库检索软件(Concordance)对文学语篇进行分析,如Conrad、杨建枚、张厚振等。
他们的研究大胆创新,十分具有操作性,为后来的文学研究者带来很大的启示。
并且语料库研究方法也为英语专业的学习带来了非常大的便利,也节省了资源与时间,是一种高效的研究方法。
《绿野仙踪》又名《奇妙的奥兹男巫》,是美国作家弗兰克·鲍姆创作发表的奇幻冒险童话故事集,共十四本。
问世百年以来被翻译成多种语言出版,根据《绿野仙踪》故事改编的动画片和电影更是不计其数。
国内常见的《绿野仙踪》是这个系列的第一本。
《绿野仙踪》主要讲述了小女孩“Dorothy”和她的小狗“Toto”被龙卷风吹到了一个奇妙的“Oz”(奥兹国),小女孩为了能回到自己的家,经历了一系列有趣又惊现的事情,最后安全回家的故事。
2基于词表的语篇基本情况分析基于语料库的语言研究一般采取定性与定量相结合的研究方法,要进行定量研究就要涉及文本检索和数据统计。
Wordsmith软件中的Wordlist工具可以对语篇的基本信息进行统计,自动生成词表(图1),它可以提供文本中的简略统计数据,从而有助于分析文本的总体统计特征和基本情况。
词表的主要统计特征有:文件的字节数(bytes)、形符数(tokens)、类符数(types)、类符形符比(type/图1)The Wizard of OZ的文本统计信息截图(token ratio)、标准化类符形符比(standard type/tokenratio)、平均词长(meanword length)、句子数(sentences)等。
基于语料库的功能语篇分析——奥巴马总统2013年就职演说

基于语料库的功能语篇分析——奥巴马总统2013年就职演说[Abstract]This paper mainly used corpus and Halliday’s three meta-functions theories through the discussions of the transitivity system, modality system and theme system to find out Obama’s discourse strategies and intentions in 2013 inaugural speech. This speech not only adopts so many long sentences to reserve its seriousness and formality but also deploys massive simple words to cater for a large audience. The recurrent emphases on freedom and equality indicate his political stance and incentive strategies. Material process verbs occupy an overwhelming part in the transitivity system, which makes the speech more convincing and practical. The application of numerous first person pronouns, high value model verbs and radialized thematic progression patterns effectively motivate the audience’s passion. Corpus can provide important data support for the study of functional discourse, hence proved an effective approach in discourse analysis.[Key words]systemic-functional grammar,corpus linguistics,discourse analysisI. IntroductionThe year 2013 witnessed some American economic recoveries from the financial crisis, Obama’s inaugural speech once again caught thegeneral public’s attention after his first term as president. In order to generalize the implied discourse strategies and intentions between the lines of the very speech, the author adopted both quantitative and qualitative methods respectively through corpus-based approach and systemic-functional approach. We call the discourse analysis under the systemic functional grammar functional discourse analysis.\[1\] Ⅱ. Theoretical Framework2.1 Corpus linguisticsThe approach to linguistic study based on corpus and corpus linguistics theories can be called corpus linguistic approach, which resorts to modern computer techniques and relies on empirical data-based or data-driven method.\[2\] Compared with the traditional linguistic research methods, the advantages of corpus linguistics analysis methods are reflected in the following aspects: (1) to analyze the pattern of natural discourse in an empirical way; (2) to collect large scale natural language materials as the sources for analysis; (3) to have automatic data analysis with the help of computers; (4) to show a better picture with both quantitative and qualitative analyses.\[3\]2.2 Systemic-functional grammarHalliday gives a discourse analysis through the following threemajor functions of the language, which are called meta-functions: the ideational or content-bearing function; the interpersonal function, indicating the writer’s or speaker’s attitude; and the textual function, enabling a speaker to arrange his or his utterances in such a way that it makes sense in context and delivers messages.\[4\] The ideational function is realized through transitivity system and voice system. The interpersonal function is embodied by mood system and modality system. And the textual function can be represented by the theme system, information system and cohesion system, which can reveal the main point the writer or speaker is arriving at and also the progression of the textual information.\[5\]Ⅲ. Research MethodologyFirst, the author used the Wordlist function of Wordsmith Tool 4.0 to gain the words frequency and the statistics of the whole text. Next, CLAWS (POS tagger) was adopted to tag the parts of speech for all the words in the text for the convenience of abstracting the desirable words later. Then, he put the tagged text into Wordsmith, used its Concond function, and searched for all the verbs. According to Halliday’s transitivity system theory in ideational function theory. The author abstracted the verbs and discussed them within 6 processes: material process, mental process, relational process, verbal process, behavioralprocess and existential process. And based on his modality system in interpersonal function theory, the author abstracted all the modal verbs in the text and analyzed them from three levels depending on the degree. Finally, the author randomly selected from the whole text one part which consisted of several sentences for the analysis of rheme system in textual function theory. The thematic progression patten was studied together with the cohesive devices.Ⅳ. Data Analysis and Discussions4.1 OverviewPicture 1Picture 2With the assistance of Wordsmith Tool 4.0, it is found that in Obama’s 2013 inaugural speech there are altogether 2,135 words with 774 types and 85 sentences. The type/token ratio is 36%, which is a relatively low rate, meaning there are not so many unfamiliar words and it is easier for Obama to reach a large audience. The average length of a sentence consists of 25 words, which shows that it is a formal and serious discourse with many long sentences. From picture 2, it is perceived that there mainly exist short words with 2-5 characters, this is also to cater for the large audience.Picture 3The top 50 frequent words are selected out from the original text. From these data it can be concluded that the use of first personal pronouns are frequently used (like “we”, “us”, “our”), creating some effects that the president is just one of the audience, and he will make efforts with all the others in the construction the United States. Likewise, it merits attention on the abundant occurrences of semantic field:“people”, “America”, “country”, “citizens”, “together”, which is for the same purpose as mentioned above, proving that it is a typical provocative speech. In addition, the words like “equal” and “freedom” are highlighted, manifesting Obama’s persistence on the American spirits that would recall the majority of people to support him.4.2 The transitivity systemDiagram 1The data for transitivity systemThe ideational function is embodied by transitivity, which divides people’s activities into 6 different processes: material process, mental process, relational process, verbal process, behavioral process and existential process, among which the first three processes are commonly noticed. From this pie chart, it is clear to notice that material process is quite predominant in the whole text with a share of 75%, sufficient use of which makes the discourse sounds more objective and convincing, and which also indicates that Obama is trying to figure out more specificmoves to solve the current problems for the second term other than give a mere emotional inspiration. The process involves at least one participant as an actor (see Table 1). The second main process in this text is the relational process, which shows Obama has a clear mind of what the situations are and what need to be resolved (see Table 2). Some mental processes enable Obama to better reach the audience and make all the listeners feel amiable and natural, such as the uses of “determine”, “believe”, “understand” (see Table 3). A few verbal processes would reinforce Obama’s mood so that the speech sounds more inspiring, such as the use of “say”, “declare”, “tell”, but this does not counter much since Obama’s focus is on the actions. There are no behavioral and existential processes.We, the people,stillbelievethat enduring security and lastingpeace do not require perpetual war4.3 The modality systemModal manifestations are various, such as modal verbs, modaladjuncts and metaphors of modality. This paper mainly discusses the use of modal verbs, which serve different purposes of the speaker and in Halliday’s view they can be classified in to three levels according to intensity (see table 4). Modal verbs have some functions, expressing the following meanings: prediction of future events, personal intension, willingness or wish, ability, permission, hypothesis, possibility, certainty, obligation or requirement, desirability.\[6\]Table 4High valuemust, have toMedium valuewill, would, shouldLow valuemay, might, can, couldDiagram 2The data for the Modality SystemAbundant applications of high value modal verbs like “must” (see e.g.4) and medium value ones like “will” (see e.g.5) indicate Obama’s confidence for the recovery of American economy and determination to address other urgent issues confronting his country.E.g.4: We must act, knowing that our work will be better.E.g.5: We will respond to the threat of climate change.4.4 The theme systemTheme is the starting point of information, and rheme is the explanation of theme and gives unknown information. The relationship between theme and rheme is called thematic progression, the four patterns of which are commonly seen: radialized pattern, centralized pattern, continuous pattern, and crossover pattern. The following paragraph is a randomly chosen one.(1)We [T1], the people, still believe that every citizen deserves a basic measure of security and dignity[R1].(2)We [T2]must make the hard choices to reduce the cost of health care and the size of our deficit[R2].(3) But we [T3]reject the belief [R3](4) that America[T4]must choose between caring for the generation that built this country and investing in the generation that will build its future[R4].(5) For we [T5]remember the lessons of our past[R5],(6) when twilight years [T6]were spent in poverty [R6],(7) and parents [T7]of a child with a disability had nowhere to turn[R7].Picture 4Picture 5This paragraph discusses Obama’s attitudes towards the security and dignity of every citizen especially for the care of the old and the young. The cohesive devices are personal repetitions (“we”), references (“that”, “when”), and conjunctives (“but”, “for”). The thematic progression patterns are radialized pattern (see picture 4) and continuous pattern (see picture 5). The radialized thematic progression pattern is obviously noticed throughout the whole discourse, because this is for the purpose to making parallel sentences so that the speech may sounds much more inspiring and affirmative, which conforms to the typical style of Obama’s speech. In this way, the sentences develop fluently and cohesively in the discourse.Ⅴ. ConclusionIt can be concluded that Obama’s inaugural speech in 2013 reveals his some typical speech strategies with the abundant use of first personal references and radialized thematic progression pattern for motivating the masses to support him, the preference for material process verbs to promote his proposals and reinforce the speech effects, the adept use of modal verbs for expressing his authority and determination as a president,and also the application of easy and short words to reach an audience as large as possible. All the speech strategies are to serve for motivating the great masses to support his future policies on some important issues like employment, medical insurance, and economic recovery. Also, the study shows that corpus and system-functional grammar are effective approaches to discourse analysis.【References 】[1]Guo Wen, H. 2001. Discourse Analysis Theory and Practice [M].Shanghai Foreign Language Education Press.\[2\] Shan, S. 2008. Discourse analysis to speeches by American president — a corpus-based study on radio addresses by President George W Bush[D].Shandong Normal University.\[3\] Biber, D. S. Conrad, R. Reppen. 1998. Corpus Linguistics: Investigating Structure and Use[M].Cambridge University Press.\[4\] Halliday, M. A. K. 1973. Explorations in the Functions of Language[M].London: Edward Arnold.\[5\] Xinhua, K., Jia, X. 2012. A Functional Discourse Analysis of Obama’s speech in Arizona State University[J].Overseas English, 12.\[6\] Leech, G. 1994. A communicative Grammar of English[M].London: Longman Group UK Limited.\[7\] Haifeng, L.2012. Functional Discourse Analysis of “U.S. President Barack Obama’s speech at the G20 summit in Cannes press conference”[J].Overseas English, 15.基于语料库的功能语篇分析——奥巴马总统2013年就职演说[摘要]本文基于语料库的研究方法,主要运用韩礼德的三个元功能理论中的及物性系统、情态系统和主位系统来研究奥巴马2013的就职演说如何实现其演讲策略。
语料库视角下考研英语中阅读语篇难易度分析

3、答案搜索方法
在搜索答案时,考生可以结合题目中的关键词,定位到文章中的相关段落, 仔细阅读并找到相关信息。同时,需要注意答案选项中的干扰项,不要被其误导。
四、成功案例分析
小王是一名备考研究生英语考试的考生,他通过掌握有效的英语阅读策略, 取得了优异的成绩。在备考过程中,小王首先通过大量阅读英文文章,提高了自 己的词汇量和阅读速度;他注重理解文章的篇章结构和主题思想,准确地把握了 文章的核心内容;此外,小王还通过分析历年真题,熟悉了各类题型的解题技巧 和方法。最终,小王顺利通过了研究生英语考试,取得了高分。
d.论证3:总结并提出结论
综合以上两个论证,我们可以得出以下结论:从语料库视角看,考研英语中 阅读语篇的难易度存在一定差异,且主题和体裁是影响难易程度的重要因素;同 时,从考生角度出发,词汇和句子结构是导致阅读困难的主要因素。因此,在备 考过程中,考生应采取以下策略:
1、考试趋势,熟悉不同主题和体裁的阅读材料,以便更好地应对考试中的 各种难度的阅读语篇。
总之,考研英语阅读策略是提高英语阅读成绩的重要手段。通过了解语篇功 能,考生可以更好地把握文章的篇章结构、主题思想和作者意图;结合有效的解 题方法和实践经验,可以大大提高解题效率和准确率。因此,希望广大考生在备 考过程中注重积累英语阅读策略的知识和实践经验,为考试成功打下坚实的基础。
感谢观看
1、文章阅读方法
在阅读文章时,考生可以采用“先题后文”和“先文后题”两种方法相结合 的方式进行。首先浏览题目,了解文章大致涉及的内容;然后仔细阅读全文,准 确理解文章的篇章结构和主题思想;最后根据题目要求,寻找相关信息作答。
2、题目分析方法
对于不同类型的问题,考生需要采用不同的解题方法。例如,对于主旨题, 考生需要文章的开头和结尾部分,理解全文的主题思想;对于细节题,考生需要 在文章中寻找相关细节信息,理解作者的观点和态度。
基于语料库对美国总统奥巴马每周电台演讲的语篇分析

基于语料库对美国总统奥巴马每周电台演讲的语篇分析政治语篇是语片的一种特殊形式,诸如政客的讲演,政府公告,政策条文,议会辩论,政党策略等等都属于政治语篇的范畴。
政治语篇是从社会政治层面对语篇的一种划分,其中大都包含了语篇作者的政见观点。
本研究的研究对象是美国现任总统奥巴马每周电台演讲的转写文本。
此类语篇兼顾了政治语篇和政治演讲的特点,属于政治语篇的一种特殊形式。
因此此研究具有十分重要的研究意义,有助于我们了解此类政治语篇的语言特点和发掘语篇背后隐藏的政治观点。
自20世纪50年代被提出以来,当代话语分析理论得到了长足发展,已成为当代语言学的一个重要分支。
当前,话语分析主要是以系统功能语法,批评语言学,语用学,言语行为理论等为理论基础进行深层次的分析。
然而这种定性分析的分析方法其研究的深度和广度深受研究者的影响,其研究的主观性是不可避免的。
相比之下,建立在数据和定量分析基础上的语料库语言学更加客观,可以在很大程度上弥补话语分析理论的不足。
本研究引入了基于语料库的话语分析方法,根据语料库的建库原则建立了自建语料库CPOWA(包含了奥巴马总统自2010年5月执政至2011年12月31日共83篇每周电台演讲的演讲稿)。
在对其进行观察、检索、分析的基础上,作者尝试回答下列问题:(1)在词汇,短语,句子和衔接层面上此类文本有何特征?(2)文中体现的对某些特定对象的观点和看法是什么?在此研究中基于语料库的话语分析方法被运用在对自建语料库CPOWA中语篇的词汇、短语、句子和衔接层面的分析上。
最后作者对研究的成果,意义及局限性进行了总结。
当然,基于语料库的话语分析方法到目前为止发展还是不成熟的,其对语篇的研究大体还是集中在词汇层面,在索引分析的理论和技术层面还有待进一步的研究和提高。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
* 本文系山东省社会科学规划研究项目“语料库框架下的学术语篇多维视角研究”( 10CWXJ10) 、山东省高校人文 社科项目“英汉科技学术论文摘要的元语言视角对比研究”( J08WA14) 的阶段性成果。
94
2012 年
滕延江 李 平 基于语料库的语篇分析范式研究
第1 期
言学则侧重采用典型的例证; 语篇分析大都是质的研究, 语料库语言学从根本上讲是量的研究; 语篇分析侧重对 文本内容的 分 析,语 料 库 语 言 学 侧 重 对 语 言 的 分 析。 此 外,Bhatia ( 2008: 83) 也提到了三种反对二者结合的观点: 第一,从语境观上看,基于语料库的研究是一种去语境化 ( decontextualization) 的研究,而语篇分析恰恰要求所有的 研究要在语 篇 全 文 以 及 情 景 语 境 中 进 行。 第 二,从 研 究 方法上看,基于语料库的分析属于事后分析( Post-hoc analysis) 方法,在分析完数据出现频率后,再进行解释说 明,而语篇分析采用的是一种自上而下 ( Top-down) 的分 析方法; 换言之,语料库语言学的方法忽略语篇的结构, 侧重对中心词索引( Concordance) 的研究,而这正是语篇 分析开展的必要前提。针对上述批评,Tribble 进行了正 面的回应,尤 其 对 语 篇 的 语 境 特 征 进 行 了 详 细 讨 论。 比 如,语篇的社会语境、交际目的、读者与作者角色、共享的 文化价值等都会有助于确立所分析文本的语境。他还特 别指出,“理解语 言 使 用 包 括 理 解 社 会 与 语 境 知 识,并 非 仅仅语言系统 本 身 的 知 识”( Tribble 2002: 138 - 139 ) 。 此外,Swales ( 2002: 154 - 158) 也指出,语料库语言学分析 中的各种技巧,比如“中心词索引”( concordances) 用来分 析有关项目是一种“自下而上”式的分析,这与学术语篇 对语步分析( move analysis) 所要求的“自上而下”的模式 是相悖的。然而,之后 Swales 却改变自己的观点: 公开承 认语料库语言学方法可以用于语篇分析,特别是针对学术 目的英语语篇的分析与教学。( Lee & Swales 2006: 56 - 75) 由此可见,语料库语言学方法并非不能与语篇分析相 结合。
中图分类号: H0 - 06
文献标识码: A
文章编号: 1000 - 0100( 2012) 01 - 0094 - 05
A Survey on the Studies of Corpus-based Discourse Analysis Paradigm
Teng Yan-jiang Li Ping
2012 年第 1 期 总第 164 期
外语学刊 FOREIGN LANGUAGE RESEARCH
2012,No. 1 Serial No. 164
基于语料库的语篇分析范式研究*
滕延江 李 平
( 鲁东大学,烟台 264025)
提 要: 语料库是载有大量真实语言信息、可用计算机处理的资料集合,利用语料库研究语言的特征已成为语料库
2. 2 语料库技术的发展与语篇分析结合的可行性 语料库提供收 集 大 量、可 靠 数 据 的 手 段,“文 化 分 界 线”正在逐渐消失。在过去的十几年里,学者对语料库语 言学方法用于语篇分析越来越感兴趣。( Baker & McEnery 2005) Baker ( 2006) 鼓励学者大力实践,并提供基于 语料库的语篇分析 ( Corpus-based Discourse Analysis,CBDA) 的多种方法。 语料库技术与语篇分析的结合点在哪里呢? 首先, 从历史上看,计 算 机 辅 助 语 料 库 分 析 方 法 曾 经 在 语 篇 分 析实践中被采用过。早在 1970 年代,Michel Pecheux 曾经 采用自动句法分析的方法对马克思主义理论语篇中的附 加语进行过分 析,该 分 析 中 的 重 要 一 点 是 把 语 料 库 中 的 句子转换成简 单 的 结 构 集 合,然 后 使 用 分 配 程 序 的 方 法 来观察同样被重复或者被替代的结构模式。( McEnery & Wilson 2001: 114) 不仅如此,Hardt-Mautner ( 1995) 也曾经 采用中心词 索 引 技 术 分 析 语 篇 中 的 搭 配 关 系 。 因 此,从 方法论上看,语 篇 分 析 能 够 借 助 语 料 库 语 言 学 分 析 方 法 进行超句子 层 面 的 分 析。 其 次,语 料 库 对 语 篇 分 析 研 究 有潜在的重要性。如果语篇分析者发现某个语篇中的一
2 语料库语言学分析方法与语篇分析的兼 容性问题
2. 1 对语料库语篇分析模式质疑的声音 由于语料库 语 言 学 方 法 最 初 只 是 应 用 于 词 汇、语 法 分析领域,因此 采 用 语 料 库 语 言 学 的 方 法 进 行 语 篇 分 析 研究从一开始就受到了很多学者的质疑。Leech ( 2000: 678) 认为两者之间有一种“文化分界线”( Cultural divide line) 。这是因为语篇分析强调文本的整体性,语料库语
最重要的应用之一。当前,基于语料库的语言学研究方兴未艾,正在成为语言学中新的研究方法之一。语篇分析也是针
对现实语料进行的研究,二者的结合可以为语篇分析的研究注入新的活力。本文回顾基于语料库的语篇分析模式研究
产生的背景、研究范式并对今后的研究进行展望,同时也指出该研究范式存在的问题及其面临的挑战。
关键词: 语料库; 语篇分析; 语篇研究; 研究述评
3. 1 质的研究 语料库是各类交际活动中所使用语言的集合。借助 于语料库中的语料,针对某一类型的文本,对 其 宏 观 结 构、词汇、句法、语体特征等方面进行分析,多采用人工统 计为主的方法,然后在此基础上进行分类、解释与概括, 以此发现此 类 型 文 本 的 突 显 特 征。 例 如 借 助 语 料 库,通 过分析多篇学 术 论 文 的 结 构,我 们 发 现 绝 大 部 分 学 术 论 文通常包括研究背景、文献回顾( 研究空白) 、研究方法、 研究结论与研究意义等几个主要部分; 当然,还可以统计 学术语篇中的 名 词 化 现 象 使 用 情 况、被 动 语 态 的 使 用 频 率等问题。从 研 究 方 法 来 看,这 样 一 种 自 下 而 上 的 研 究 属于质的研 究。 由 于 语 料 库 只 发 挥 提 供 语 料 的 作 用,因 此这也是一种语料库意识的研究( corpus-informed study) 。 代表性的研究如 Swales ( 2004) 采用 Michigan Corpus of Academic Spoken Englis( MICASE) 语料库,调查不同学 科语境下的大学生在学术会话方 面 使 用 语 言 的 特 征。 MICASE 专门收集大学生英语口语语料,涵盖讲座、实验、 办公、图书馆服务等语域,为国际应用语言领域提供美国 英语口语素材,并 为 语 言 学 和 特 殊 用 大学生学术口语会话与 日常会话的使用情况方面的异同。Swales 的研究发现,就 大学生的学术 会 话 与 日 常 会 话 的 语 言 使 用 来 看 ,在 语 言 特征方面并无较大差异,而且在学科上的差别也不明显, 学术会话与日常会话一样,也具有非正式性的特征。 此外,Hyland( 2004) 对第二语言学习者学位论文“致 谢( Acknowledgement) ”部分的研究也是一项基于语料库 的质的研究,该 语 料 库 是 由 香 港 学 生 的 学 位 论 文 组 成 的 语料库。他考察其中“致谢”部分的结构特征以及社会角 色。该研究不 仅 显 示 这 些 文 本 的 典 型 呈 现 方 式,还 发 现 学生如何用其 来 展 示 他 们 对 学 科 归 属 性 的 认 识 ,即 用 特
1 引言
语料库是 以 计 算 机 为 载 体 存 放 真 实 语 言 材 料 的 集 合。语料库 语 言 学 是 收 集 数 据 的 重 要 手 段 ( 桂 诗 春 等 2010: 419) ,语料库语言学方法的目的在于通过对大规模 数据的分析来 观 察 人 们 使 用 语 言 的 特 点,其 优 势 体 现 在 发现词汇用法、使用频率、搭配、中心词索引等方面。( O’ Keeffe & Farr 2003: 390 - 391) 近年来,语料库语言学方法 在分析书面语或者口语方面得到了广泛的应用。与传统 的语言学研究 方 法 相 比,语 料 库 语 言 学 分 析 方 法 的 优 势 体现在以下方面: 1) 实证性,能分析自然语篇的实际使用 模式; 2) 以大规模收集的自然语料作为分析素材; 3) 采 用自动的、交互式模式,依靠计算机进行数据分析; 4) 集 定性分析与定量分析于一体,能对语言进行功能性解释。 ( Biber,et al 1998) 因此,语料库语言学“现在正处于成为
( Ludong University,Yantai 264025,China) A corpus is a database which consists of a large amount of authentic language materials that can be processed by a computer. Nowadays,corpus-based linguistics is in its prime and has turned into a new research means for language analysis. Discourse analysis is also a discipline which deals with everyday language interaction. The combination of the two can provide researchers with new vigor for discourse studies. This article makes a survey on the Corpus-based Discourse Analysis ( CBDA) with its initiating background,research pattern and its future perspective. Meanwhile,the article also points out its drawbacks and challenges of the CBDA paradigm. Key words: corpus; discourse analysis; discourse studies; research survey