语料库利用的两个问题
专业的语料库利用技巧

专业的语料库利用技巧语料库(Corpus)是指收集而成的大规模文本数据库,其中包含了各种语言的实际语言数据。
语料库是语言学研究、自然语言处理以及其他相关领域的重要资源。
在现代信息时代,语料库的利用技巧对于深入理解语言以及提高语言能力至关重要。
本文将介绍一些专业的语料库利用技巧,帮助读者更好地利用语料库进行学习与研究。
一、选择适合的语料库语料库有很多种类,包括通用语料库、专业领域语料库以及特定语言的语料库等。
在利用语料库之前,确保选择适合自己需求的语料库非常重要。
比如,如果你是英语学习者,可以选择通用的英语语料库,如British National Corpus(BNC)或者Corpus of Contemporary American English(COCA)。
如果你是专业翻译或者研究某一领域的学者,可以选择相关专业领域的语料库,如生物医学语料库或金融领域语料库。
二、设定查询限定条件在利用语料库进行查询时,设定合适的查询限定条件可以提高查询的准确性。
比如,设定查询单词的所在位置、所属文本类型、词性等条件,可以帮助你找到更精准的语料示例。
另外,一些语料库还提供强大的高级查询功能,如模糊搜索、正则表达式和语法查询等,这些技巧可以帮助你更好地操纵语料库,找到所需数据。
三、分析语料示例对于查询得到的语料示例,要进行仔细的分析和解读。
首先,注意上下文,观察单词的用法和搭配情况。
其次,关注词组、短语或句式的使用,这些都是丰富自己语言表达的重要资源。
同时,注意语境中的语法结构、语气和修辞手法等,这些都有助于提升自己的语言能力。
四、比较语料示例利用语料库进行比较分析,可以深入探究语言的变化和差异。
比如,可以比较不同时间段、不同地域或不同语言之间的语料示例,找出共同点和差异。
这种比较分析有助于揭示语言的演变规律和文化差异,对于学术研究和翻译工作都非常有价值。
五、利用频率统计语料库可以提供单词、短语、句式等的频率统计数据,帮助我们了解语言的使用规律和常用表达方式。
《基于语料库留学生“胜”“赢”的偏误分析及教学策略》

《基于语料库留学生“胜”“赢”的偏误分析及教学策略》一、引言在汉语学习中,留学生常常会遇到一些与母语不同的词汇和表达方式。
其中,“胜”和“赢”这两个词汇在汉语中虽然意思相近,但在使用上却有着微妙的差异。
由于母语与汉语在语义和用法上的差异,留学生在使用这两个词时常常会出现偏误。
本文基于语料库,对留学生使用“胜”“赢”的偏误进行分析,并提出相应的教学策略。
二、语料库中“胜”“赢”的偏误分析1. 语义理解偏误留学生在使用“胜”和“赢”时,往往只理解其基本意思,而忽视了它们在具体语境中的细微差别。
例如,有些留学生会错误地将“赢得比赛”表达为“胜了比赛”,或者在描述胜利的结果时,误用“赢”来替代“胜”。
这种偏误主要是由于对两个词在语义上的细微差别缺乏准确理解。
2. 用法混淆偏误由于“胜”和“赢”在用法上存在相似之处,留学生在使用时容易混淆。
例如,在描述比赛结果时,应使用“赢得胜利”而非“胜得胜利”。
这种偏误主要是由于对两个词的用法缺乏清晰的认识。
3. 搭配不当偏误留学生在使用“胜”“赢”时,有时会与其它词语搭配不当。
例如,将“胜利”与“打败”搭配使用,造成语义重复。
这种偏误主要是由于对汉语词汇的搭配习惯不够熟悉。
三、教学策略1. 强化语义理解在教学过程中,教师应重点讲解“胜”“赢”的语义差异,并通过具体例句帮助留学生理解两个词在具体语境中的用法。
同时,教师还可以通过语境练习、填空练习等方式,让留学生在实际运用中加深对两个词的理解。
2. 明确用法区别教师应向留学生明确讲解“胜”“赢”的用法区别,尤其是在描述比赛结果、成功等情境下的用法。
通过对比分析,帮助留学生掌握两个词的正确用法。
3. 培养词汇搭配意识教师应引导留学生注意汉语词汇的搭配习惯,避免出现搭配不当的偏误。
在词汇教学中,教师可以提供一些常用的搭配示例,帮助留学生熟悉并掌握正确的词汇搭配。
4. 增加实践练习通过增加实践练习,让留学生在实际运用中巩固所学知识。
专业的语料库应用技巧

专业的语料库应用技巧语料库是指收集和存储大量真实语言文本的数据库,这些文本可以用来进行语言学研究、语言教学以及自然语言处理等方面的工作。
在当今信息爆炸的时代,语料库的应用变得越来越重要。
本文将介绍一些专业的语料库应用技巧,帮助读者更好地利用语料库。
一、语言学研究语料库在语言学研究中有着广泛的应用。
研究人员可以通过语料库收集大规模的语言数据,分析其中的语言现象,从而对语言规律进行深入研究。
比如,研究人员可以通过语料库来研究某一语言的词汇使用频率、词义变化、语法特点等。
此外,语料库还可以帮助研究人员找到真实语言中的典型例子,验证自己的研究假设。
二、语言教学语料库在语言教学中也有着重要的应用。
通过利用语料库,教师可以为学生提供大量真实语言文本,让学生通过观察和分析,深入了解语言的使用。
学生可以通过语料库了解词汇的用法、短语和句型的搭配,从而提高自己的语言表达能力。
此外,语料库还可以帮助教师设计教学材料,制定教学计划。
三、自然语言处理语料库在自然语言处理领域也具有重要意义。
自然语言处理是研究如何使计算机能够理解和处理人类语言的学科。
语料库中的大量文本可以作为训练数据,用于开发和评估自然语言处理系统。
比如,通过语料库可以训练机器翻译系统、文本分类系统、信息抽取系统等。
语料库还可以帮助改善问答系统、机器人对话系统等人机交互系统。
四、语料库的构建构建一个优质的语料库是语料库应用的基础。
首先,语料库的收集需要广泛而有代表性,涵盖各类语言和语体。
其次,语料库的标注也非常重要,可以通过手工标注或自动标注的方式,对语料库中的各种语言信息进行注释。
再次,语料库需要定期更新和维护,以保证其数据的新鲜和可靠性。
最后,语料库的存储和检索功能也需要得到合理的设计和实现,方便用户的使用和查询。
五、语料库查询工具为了更好地利用语料库,我们需要了解一些有效的查询工具。
常见的查询工具有AntConc、Sketch Engine、CLAWS等。
语料库在英语教学中的运用

语料库在英语教学中的运用语料库是指由大量真实语言材料所构成的语言数据库,其中包含了各种语言用法的实例和模式。
在当今的英语教学中,语料库已经成为了一个不可或缺的工具。
通过利用语料库资源,教师们可以帮助学生更好地掌握英语,使他们能够更加自然地运用英语,避免单纯地翻译或者背诵。
一、语料库的定义语料库是指已存在的大量真实的语言使用情境,在语言学研究中它被视为一个很重要的研究工具。
语料库包括:写作、电子邮件、文章、电影和其他电子媒体中的语言使用等等。
这些使用情境被保存在计算机上,人们可以利用这些数据来进行研究或者制作词典等工具。
语料库被广泛应用于英语教学中,其主要用途是为学生提供真实的语言材料,并帮助他们更准确地掌握英语的用法、语法和词汇。
二、语料库在英语教学中的应用2.1 词汇教学语料库可以帮助学生更好地掌握英语词汇的使用方式。
通过词汇分析工具,教师可以帮助学生区分及分析动词或形容词在具体语境中的不同含义,以及它们在不同语言环境中的各种用法。
同时,语料库也为学生提供了更为准确的翻译和使用方式,而不是传统方法中的简单背诵单词和语法规则。
2.2 语法教学语料库可以帮助学生更深入地了解英语语法规则。
教师可以使用语料库分析工具来帮助学生发现英语语法规则中的差异和结构,从而使他们更清楚地了解英语的语言习惯。
同时,语料库还可以帮助学生了解英语中常用的语法结构,包括时态、语态、语气等等。
2.3 写作教学语料库也可以应用于英语写作教学。
它可以为学生提供范文和写作模式,并且可以为学生提供实时反馈。
例如,同学们可以用语料库查找类似主题的文章,从中学习常用词汇、句子和段落结构,以及表达方式。
这些功能都有助于学生提高英语写作能力。
三、语料库在英语教学中的优点语料库在英语教学中具有以下优点:3.1 真实性语料库中包含的语言使用是来自真实场景,可以使学生学习到更为真实的英语的使用方式,同时还可以帮助学生逐渐融入英语社区。
3.2 灵活性教师可以通过语料库快速获取所需材料,因此教学变得更加灵活和高效。
分析语言学中的语料库与语言教学

分析语言学中的语料库与语言教学语言是人类交流和表达思想的工具,而语言教学是培养学习者掌握一门语言的技能和能力的过程。
在语言教学中,语料库是一个重要的工具和资源。
本文将从分析语言学的角度,探讨语料库在语言教学中的应用与意义。
一、语料库的定义与特点语料库是指收集和整理大量真实语言材料的数据库。
它可以包括书面语料和口语语料,涵盖多种语言形式和语境。
语料库的特点有以下几个方面:1.真实性:语料库中的语言材料是真实的、自然的,反映了实际语言使用的情况。
2.多样性:语料库中包含了丰富的语言形式和语境,可以涵盖不同的话题、风格和文体。
3.数量性:语料库中包含大量的语言材料,可以提供丰富的例句和语言数据供学习者使用。
4.可检索性:语料库可以通过搜索功能进行检索和查询,方便学习者找到所需的语言材料。
二、语料库在语言教学中的应用语料库在语言教学中有着广泛的应用价值,主要体现在以下几个方面:1.语言输入:语料库可以提供大量真实的语言输入,学习者可以通过阅读和听取语料库中的语言材料,了解语言的用法、结构和表达方式。
这有助于学习者建立语感和语言模型,提升语言理解和运用能力。
2.语言输出:语料库可以为学习者提供丰富的例句和语言模板,帮助他们进行语言输出。
学习者可以通过模仿和借鉴语料库中的表达方式,提升自己的口语和写作水平。
3.语言规律:语料库中的语言材料可以反映语言的规律和特点。
通过对语料库中的语言数据进行分析和比较,学习者可以发现语言的规律和用法,提高对语言的理解和掌握。
4.词汇学习:语料库可以为学习者提供大量的词汇例句和语境信息。
学习者可以通过语料库查找词汇的用法、搭配和固定搭配,提高词汇的掌握和运用能力。
5.语言研究:语料库不仅可以用于语言教学,也是语言研究的重要工具。
语言学家可以通过分析语料库中的语言数据,研究语言的变异、演变和规律,为语言教学提供理论依据和指导。
三、语料库在语言教学中的实践案例1.语言输入与输出:教师可以利用语料库中的语言材料,设计听说读写的综合训练活动。
专业的语料库利用

专业的语料库利用语料库是指用于语言研究和语言处理的大规模文本数据库。
语料库利用是指将语料库应用于实际工作中,以提高语言学研究和语言处理的效率和准确性。
在当今信息时代,语料库利用已经成为了语言学和计算语言学领域的重要研究方向。
一、语料库的定义与特点语料库是指收集和整理大规模的自然语言文本的数据库,它以机器可读的方式存储,并提供便捷的访问方式。
语料库主要包括书面语料和口语语料,可以涵盖多个语言和语言变体。
语料库的特点包括真实性、多样性、可再现性和可检索性。
二、语料库利用的重要性1. 提供真实语言数据:语料库中的文本是真实生产的语言数据,可以反映语言的实际使用情况。
2. 支持语言学研究:语料库为语言学的各个分支提供了大量的语言样本,有助于发现语言的规律和现象。
3. 改善机器翻译质量:语料库为机器翻译技术提供了大量的平行文本,有助于改进翻译质量。
4. 促进词汇研究:语料库提供了丰富的词汇信息,可以用于词义研究、词频统计等。
5. 支持自然语言处理:语料库为自然语言处理任务提供了训练数据和测试数据,提高了算法的效果和准确性。
三、语料库利用的应用领域1. 词汇研究:语料库可以用于词汇的统计分析、词义的研究、词汇的语义关系分析等。
2. 句法和语法研究:通过语料库的句子和文本,可以探索句法和语法现象,发现语言规则和结构。
3. 语音识别和语音合成:语料库可以用于训练和测试语音识别和语音合成系统,提高其性能和准确率。
4. 信息检索和文本分类:语料库可以用于构建信息检索和文本分类模型,提供更准确的搜索和分类结果。
5. 机器翻译和自动摘要:语料库提供了翻译和摘要任务所需的大规模平行文本,支持机器翻译和自动摘要技术的发展和改进。
四、语料库利用的方法和工具1. 数据采集和处理:语料库的建立需要进行数据采集和预处理,包括数据收集、数据清洗和标注等步骤。
2. 语言分析和统计:语料库可以进行语言分析和统计,包括词频统计、搭配分析、语言模型建模等。
大学实用翻译教程(英汉双向 )第三章 计算机辅助翻译

1.2计算机辅助翻译的发展前景展望
• 根据前面对机器翻译的介绍可以看出,自然语言的复杂性决定了机器翻译 技术发展的困难性。计算机语言学家提出了各种各样的机器翻译理论,但 目前为止还没有哪种理论能够有效的解决所有问题。但是,机器翻译系统 的应用领域正在发生变化。人们正在尝试将机译技术结合到信息访问、信 息提取和自动文摘中。这类跨语言应用在全球范围内越来越引起人们的兴 趣。未来对于口语的翻译也是市场迫切需求的,但尽管基于某些方面的需 求,机器翻译的发展方向更加多元化,但无论从实际应用角度还是从理论 研究角度来看,全自动的话语翻译还是很难实现的。当然,虽然机器翻译 的发展有诸多阻碍,但仍然有更多的发展希望。目前,单语语料库加工技 术以及应用在计算语言学领域内取得的成功,使建立双语或多语语料库并 进行多层次的加工作为大规模的跨语言资源成为研究的焦点之一。另外, 大规模的语料库适合于统计方法的应用,通过统计来自动进行知识获取, 有助于克服自然语言处理中知识获取的瓶颈。把机器学习方法应用到机器 翻译中,可以帮众系统实现在线学习功能,最终建立主动的智能翻译服务 也是机器翻译的发展方向之一。
1.1计算机辅助翻译的发展历程
• “机器翻译”的概念可以追溯到20世纪30年代,40-50年代初经历 了早期的尝试阶段,当时,大多数从事手工翻译人士对于“利用计 算机进行翻译”不以为然,他们根本就不相信翻译会机械化,少数 人则或多或少有一点担心,害怕有一天机器会把他们取而代之。 • 50—60年代中期学界对于“机器翻译”持高度乐观的态度。 Systran翻译软件将“机器翻译”定义为利用计算机软件把文本内 容从一种自然语言转换成另一种自然语言,这个定义就是说“机器 翻译”是利用语言结构、规律和把原文(the source language) 的语言结构转换成译文(the target language)的语言结构。“机器 翻译”这一想法产生的时间正是结构主义语言学的观点盛行时期。 由于人类对语言结构规律的研究越发深入,语言学家为翻译找到了 更多的理论依据作为支撑,从而给翻译加上了科学主义的色彩。奈 达、巴尔胡达罗夫以及彼得· 纽马克等人的翻译观都是从结构主义 理论开始的。(张治中,俞可怀,2002:54-58)结构主义者认 为在各种复杂的表面现象的下都有着一种普遍性的规律,这些规律 就是结构,人们通过分割归并作品的各种结构就可弄清语言信息变 成文艺作品的奥秘。(吕俊, 2001:96-111)
《2024年语料库研究》范文

《语料库研究》篇一一、引言语料库作为一种资源丰富的语言数据集合,已成为语言学、语言学研究以及相关领域的热点研究对象。
它能够为语言分析、语言教学、翻译、词典编纂等多个领域提供支持。
本文将介绍语料库研究的重要性,并就当前语料库研究的现状进行梳理,进而分析其中存在的挑战和问题,并探讨未来的发展趋势。
二、语料库研究的现状1. 语料库类型及建设随着技术的进步,语料库建设日趋成熟。
根据不同领域和用途,语料库可大致分为通用型和专用型。
其中,通用型语料库如COCA、BNC等,涵盖了广泛的语言使用场景;专用型语料库则针对特定领域或主题进行收集,如法律、医学等。
此外,还有多媒体语料库和口语语料库等类型。
在建设过程中,研究者需考虑语料库的规模、代表性、时效性等因素。
2. 语料库应用领域语料库在多个领域得到了广泛应用。
在语言学领域,语料库为语言研究提供了丰富的数据支持;在翻译领域,语料库可帮助提高翻译的准确性和效率;在词典编纂方面,语料库为词汇的收集和释义提供了有力支持。
此外,在语言教学、自然语言处理等领域,语料库也发挥着重要作用。
三、当前挑战与问题尽管语料库研究取得了显著成果,但仍面临诸多挑战和问题。
首先,在语料库建设方面,如何确保数据的代表性和真实性是一个亟待解决的问题。
此外,随着技术的发展,如何利用人工智能等手段对语料库进行智能化处理和利用也是一大挑战。
其次,在应用方面,如何将语料库与实际需求相结合,提高应用效果也是一个难题。
此外,不同领域和行业对语料库的需求存在差异,如何满足这些不同需求也是一项挑战。
四、未来展望面对未来的发展,语料库研究将呈现以下几个趋势:1. 多样化与个性化:随着用户需求的多样化与个性化发展,未来的语料库将更加关注用户需求和实际应用场景的差异。
研究者需要设计更多类型的语料库来满足不同领域和行业的需求。
2. 智能化与自动化:人工智能技术的不断发展将促进语料库的智能化和自动化处理。
例如,利用自然语言处理技术对语料进行自动标注、分类和分析等操作,提高处理效率和准确性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、 语料库与语料库语言学
• 第四代语料库:
互联网作为语料库。 ……可以把不断发展的因特网作为虚拟语 料库。
一、语料库与语料库语言学
• 中国大陆的语料库建设: 始于80 年代初期,发展迅速。 例如:“汉语词频统计语料库”为200万 字次;“现代汉语语料库”为7000万字次; “中文五地区共时语料库”每年收入的语 料达6亿至8亿多字次;“面向语言教学研 究的汉语语料检索系统CCRL”为8亿多字次。
二、关于语料库利用的两个问题
• 学界共识: 1)最大难点:“多数学生难点中的难 点”。 2)回避:外国学习者对把字句采取了回 避的学习策略,尽量不用,用则必错。 • 证据: 1)外国人对把字句的使用率不足百分之 一。 2)谈话一小时,没用一个把字句。
二、关于语料库利用的两个问题
• 有学者利用语料库对把字句使用情况进行 了考察 • 偏误率: 在“HSK动态作文语料库”(1.0版) 中,共有把字句3682句,其中正确句3221 句,在把字句总数中所占比例约为87. 48%; 偏误句461句,在把字句总数中所占比例约 为12. 52%。
●
●
口语和书面语是不同质的研究对象,基本义 相同的口语词和书面语词经常不能替换: 如“帮”、“帮助”、“帮忙”基本意义 相同,“你帮我买张票”,不说“帮助” 和“帮忙”;“他欺骗我的感情”、“他骗我 的钱”,“欺骗”和“骗”也不能互换。 这和书面语与口语有关,也和汉语的节律 有关。 结论:对汉语形容词语法分布的论述应区 分口语体与书面语体。
一、 语料库与语料库语言学
• 研究案例一:关于汉语补语的习得难度与 习得顺序 一般认为有复杂的补语系统是汉语语法 的一个特点,也是外国学习者习得汉语的 一个难点。但是,北京语言大学的课题组 利用“汉语中介语语料库”对带“得”字 补语句的习得状况进行了考察,发现学习 者习得“得”字补语句的偏误率没有人们 想象的那么高。(见下表)。
• 2.1 利用语料库已经成为汉语作为第二语言 教学研究的主流方法 • 语料库以其语料的充分性、客观性、可验 证性、使用的便捷性,正在使语言学的研 究与应用产生量与质的飞跃。 • 语料库语言学将数据收集与理论论述有机 地结合在一起,使我们对语言的理解发生 了质的变化.(Halliday1991) • 基于语料库的研究方法,已经成为当代语 言学和应用语言学研究中的一种主流方法。 (王建新2005)
关于汉语作为第二语言教学研究中 语料库利用的两个问题
福建师范1.1 语料库(corpus/corpora): 是存储语料的数据库,是以电子文本或其 它电子介质形式存贮在计算机中的、借助计 算机软件进行管理并可以通过计算机软件进 行查询、检索、统计的一定数量的语言材料 的集合,是进行语言研究的一种普遍资源。
一、语料库与语料库语言学
• 上海交通大学、厦门大学、北京大学、中 国人民大学、北京师范大学、鲁东大学、 苏州大学、四川外国语学院、华中师范大 学等,也都已经建成或正在建设自己的汉 语语料库。 • 但是,现有的语料库绝大多数都是书面语 语料库,口语语料库很少,多模态语料库 尚无建成者。
一、 语料库与语料库语言学
二、关于语料库利用的两个问题
2.2 要注意研究对象的“同质”性 欧美现代语言学之父、瑞士语言学家 费尔迪南· 索绪尔(ferdinand de 德· saussure 1857-1913)十分重视语言研究 的“同质”问题。他提出了区分语言/言语、 历时/共时、能指/所指、组合关系/聚合关 系等一系列二分的语言学概念,就是为了 确保语言研究对象和语言研究的同质性。
“得”字程度补语句的习得状况
形式
· ·+ 得 + 多 ·
· ·+ 得 + 很 · · ·+ 得 + 不得了 · · ·+ 得 + 厉害 · · ·+ 得 + 慌 · · ·+ 得 + 要命 · · ·+ 得 + 远 ·
词次
32
17 8 2 2 1 1
正误比
28/4
12/5 7/1 2/0 2/0 1/0 1/0
二、关于语料库利用的两个问题
• 使用率:
• 外国学习者:3682 /4000000≈0.0921%。 • 汉语母语者: 张黎2007:46/210000≈0.0219% 李宁、王小珊2001:335万字,≈0.0894% • 人民日报: 俞士汶(98/1-6):9801/13000000≈0.0754% CCRL(2000):1498/1930000≈0.07762% CCRL(2012):18413/24000000≈0.0767% “比较大的样本可以减低样本统计量的变异” (戴维· 穆尔2003:162)。 S·
二、关于语料库利用的两个问题
形容词的主要语法功能:定语说+谓语说。
语料 口语 书面语 口+书 形容词 谓语 504 611 1115 298 107 405 频率 59.1% 17.5% 36.3% 定语 108 385 493 频率 21.4% 63.0% 44.2%
二、关于语料库利用的两个问题
二、关于语料库利用的两个问题
“性质形容词单独作谓语也有一定的限制, 一般只能用于对照、比较的情况。在没有 比较意味的句子里,一般要在前面加上程 度副词‘很’。” (刘月华等主编《实用现 代汉语语法》,商务印书馆,2002年。) 有学者利用语料库对汉语形容词在书面 语和口语中的分布进行了统计(张宝林 2011):
“得”字情状补语句的习得状况
一级 二级 三级 四级 五级 六级 合计
正
误
41
6
31
14
40
7
31
6
19
4
22
2
184
39
(孙德金2002,赵金铭 2008)
一、 语料库与语料库语言学
• 这一研究结果促使研究者利用相同语料库 对不带“得”字补语句(如趋向补语)的 习得情况进行考察,结果发现学习者习得 不带“得”字补语句偏误率整体高于带 “得”补语句。通过进一步的深入考察, 研究者大体构拟出了英、日、韩(朝)等 母语学习者对汉语不同类型补语的习得顺 序。(杨德峰2003、2008)
二、关于语料库利用的两个问题
• 如以英语为母语的学习者的语法难点有:形容词 谓语句、无标记被动句、带各种补语的句子、 “把”字句、“是……的”句、比较句以及 “了”“着”“过”的用法、量词用法、方位词 用法、长定语、大数目称数法以及话语连接等。 其中的大部分,对任何母语背景的学习者来说也 都是难点。
一、语料库与语料库语言学
1.3 汉语中介语语料库建设 • 汉语中介语语料库的建设是在国内外语料库 语言学和母语语料库建设的影响下开始的。 • 国外第一代计算机语料库(1960-70年代): 小规模(百万词级),以语言研究为导向, 词法级。 Brown、 LOB、 London-Lund Corpus。
• 通过语言对比突出语法的重点和难点。对外汉语 语法教学的一大特点是学习者会受到其第一语言 迁移作用的影响。作为第二语言的汉语对所有学 习者都有共同的难点,对不同母语背景的学习者 又有特殊的难点。(刘珣2000:366)
二、关于语料库利用的两个问题
• 对欧美学生来说,受事主语句、存现句、 主谓谓语句,以及时间、地点状语的位置, 始终是学习的难点,同时也体现汉语语法 特点。而带有普遍性的语法难点,则是 “把”字句、各类补语以及时态助词 “了”“着”等。至于我们所认为的特殊 句式,其实并非学习的难点,比如连动句、 兼语句、“是”字句、“有”字句以及名 词谓语句、形容词谓语句。这也是从多年 教学中体味出的。(赵金铭 2006)
一、语料库与语料库语言学
• 在这种背景下,从上世纪90年代开始,中 国大陆开始建设外国人学习汉语的中介语 语料库。经过10多年的发展,汉语中介语 语料库建设已初具规模,并在汉语作为第 二语言教学与习得等研究领域发挥了重要 的作用。
一、语料库与语料库语言学
1.4 已建成的主要汉语中介语语料库
• 北京语言大学:汉语中介语语料库系统 (1995)、HSK动态作文语料库(2006)、 首都外国留学生汉语文本语料库(2010)、 汉语学习者口语语料库(2007) • 南京师范大学:外国学生汉语中介语偏误信息 语料库 • 中山大学:留学生中介语语料库 • 暨南大学华文学院:留学生汉语中介语语料库
1.5 作用与成果 通过对语料库中较大规模真实语料的 考察,研究者发现了前人未曾发现的一些 汉语中介语现象。语料库为定量分析奠定 了坚实的基础,研究者可以把定性研究与 定量研究相结合,从而使得出的研究结论 具有较强的客观性、普遍性和科学性,这 在一定程度上改变了汉语教学与习得研究 的模式,极大地提高了汉语作为第二语言 教学研究的水平。
二、关于语料库利用的两个问题
●
研究案例三: “把”字句习得的“回避” 说与“不回避”说
• 量词的用法、形容词谓语句、无标记的被动句、 带各种补语的句子、“把”字句(多数学生难点 中的难点)、“了”“着”“过”的用法(“了” 也是难点中的难点)、比较句、方位词的用法、 长定语、三位数以上的大数目。 • 怎么知道什么是难点,什么不是难点呢?一是通 过语言对比研究来发现,二是靠教学经验。…… 到底什么是真正的难点,最终还要靠教学经验来 检验。(吕必松1992:110)
二、关于语料库利用的两个问题
●
研究案例二:关于汉语形容词的语法分布
在英语中,修饰名词作定语是形容词的 专利;但在汉语中,对形容词修饰名词作 定语的语法功能却有着截然相反的论述, 对形容词充当谓语也有不同的看法:
二、关于语料库利用的两个问题
“形容词能作谓语或谓语中心语和定语, 多数能够直接修饰名词。”(黄伯荣、廖 序东主编《现代汉语》,高等教育出版社, 2004年。已发行500多万册) “在不带‘的’的格式里,形容词和名 词的配合受到限制,比如可以说‘白纸’、 ‘白头发’,但是不说或不太说‘白手’、 ‘白家具’。”(朱德熙《语法讲义》, 商务印书馆,1982年。)