语料库在词典释义中的应川研究

合集下载

“最后”的词类标注问题及其对汉英词典编纂的启示--一项基于语料库的个案研究

“最后”的词类标注问题及其对汉英词典编纂的启示--一项基于语料库的个案研究

“最后”的词类标注问题及其对汉英词典编纂的启示--一项基于语料库的个案研究段继香【期刊名称】《成都师范学院学报》【年(卷),期】2016(032)007【摘要】The accurate notes of speech of words are very essential for dictionary compiling. This paper takes an empirical study of the Chinese word "zuihou" as an example based on the Corpus of Na-tional Language Committee of China to find out a comprehensive usage of this word and offer the appropri-ate suggestions of Chinese-English dictionaries.%准确的词类标注对词典编纂来说极其重要。

文章通过使用国家语委语料库对“最后”一词在实际生活中的使用情况开展了实证研究,以期对该词的词类做更全面的鉴定,并在此基础上对汉英词典编纂提出合理的建议。

【总页数】4页(P76-79)【作者】段继香【作者单位】四川外国语大学研究生院,重庆 400031【正文语种】中文【中图分类】H16;H316【相关文献】1.“矫情”的词类标注问题及其对汉英词典编纂的启示--一项基于语料库的个案研究 [J], 叶志新2.“矫情”的词类标注问题及其对汉英词典编纂的启示——一项基于语料库的个案研究 [J], 叶志新;3.基于语料库的汉英词典词类标注个案研究 [J], 张建红4."最后"的词类标注问题及其对汉英词典编纂的启示——一项基于语料库的个案研究 [J], 段继香;5.汉英词典中“祝福”的词类标注问题--一项基于语料库的个案研究 [J], 何滟秋因版权原因,仅展示原文概要,查看原文内容请购买。

语料库介入的汉语语文词典释义途径

语料库介入的汉语语文词典释义途径

语料库介入的汉语语文词典释义途径
王永耀
【期刊名称】《辞书研究》
【年(卷),期】2010(000)001
【摘要】语料库是现代词典编纂的重要技术手段,应用语料库是词典编纂的发展趋势.本文以<现代汉语词典>为例,探讨语料库在现代汉语语文词典释义中的具体应用方法,概括语料库介入模式下现代汉语语文词典主要释义途径.
【总页数】8页(P111-118)
【作者】王永耀
【作者单位】商务印书馆,北京,100710
【正文语种】中文
【相关文献】
1.语文词典中体育词汇的释义研究——基于《现代汉语词典》与《现代汉语规范词典》的比较 [J], 冯海霞;赵红梅;赵学峰
2.语文词典中专科条目的释义修订——以《现代汉语词典》第7版为例 [J], 潘雪莲
3.谈谈语文词典释义的精细化
——以《现代汉语词典》第7版单音节颜色词为例 [J], 白冰
4.语文词典植物词的释义例说
——以《汉语大词典》为例 [J], 张梦帆;曾昭聪
5.内向型语文词典与外向型汉语学习词典释义方式比较研究 [J], 田宇贺;臧淑佳
因版权原因,仅展示原文概要,查看原文内容请购买。

基于语料库的“生人”用法调查及其对汉语词典编纂的启示

基于语料库的“生人”用法调查及其对汉语词典编纂的启示
P a eigh v ete e n d i a c rtl o b ldi cre t .A trdslsn et epcueo eme nn e OS lb l a en i rd f e t cu aeyn rl ee t orcl n h i a y f ico igt r itr f h a igd — e h u t
维普资讯
20 06年 5月
船 『 外 语 学 院 学 报 I 1
J u n lo ih a ne ain tde nv ri o r a fSc u n Itr t a Su isU ies. 2 N . 12 o 3
国家语 料 库 等 ) 可 能 无 能 为 力 。 种 肇 始 于 也 L一 2 J
A r u - ae td fteU eo 生 人 "a d Co p sb sdSu yo s f“ h n
IsI p ia i n o i e e Le i o r p y t m l t sf r Ch n s x c g a h c o
WA NG Re — i n n qa g
vlp e t f 生人 ” ti pprae t apo oe et n o i i am du s e oenC i s i i a . e m n “ o o , h ae t mps r sdt a s t p r met ftn eim- zdm dr hn edco r i e tn y K yw rs “ e o d : 生人”; s esre ;cru ; ba op s C ieel i g p y ua u y op s We s ru ; hns xc r h g v c e oa
典 》 2 0 ) 精 编 当代汉 语 词典 》(0 3 等 1 ( 0 3 和《 20 ) O部

汉英词典中“翻译”一词的自指义项设立研究——一项基于语料库的个案

汉英词典中“翻译”一词的自指义项设立研究——一项基于语料库的个案
摘 要:现有的几部主要汉英词典对“翻译”一词的自指义项的标注情况各不相同,并出现配例与所标 注词类相悖的情况。以王仁强提出的“双层词类范畴化模型”为理论基础,并以国家语委语料库为依托,对 “翻译”一词自指义项的设立问题进行了研究。研究发现,“翻译”一词的自指用法已经不再局限于言语层 面上的活用,而是已经发生规约化,并进入社群语言系统。因此,其自指义项应当单独设立,从而使其释义 和词类标注更加全面,也有助于词典编纂中的词类标注。
2018年 11月 陇东学院学报 第 29卷 第 6期 JournalofLongdongUniversity
Nov.2018 Vol.29 No.6
汉英词典中“翻译”一词的自指义项设立研究
———一项基于语料库的个案
王辉辉,张 俊
(四川外国语大学 研究生院,重庆 400031)
关键词:汉英词典;自指义项;语料库;双层词类范畴化模型 中图分类号:H316 文献标识码:A 文章编号:16741730(2018)06001704 收稿日期:20170414 作者简介:王辉辉(1993—),男,浙江台州人,硕士在读,主要从事词典学、认知语言学、心理语言学研究。
Beck(2002)指出,词类在大多数(若非全部)句法 理论中都起着关键作用,它是词典学和词汇语义学的 基础,且在形态分析中也是关键要素[1]。虽然汉语中 的词类研究有很久远的历史,但是由于汉语本身缺乏 形态标志和形态变化等特点,从而致使词类研究成为 现代汉语语法研究中的一大难题。现有的汉语词典 与汉英词典之间就时常会出现词语的词类标注与配 例中的实际用法互相矛盾的现象,而且目前各路学者 对于词的本质以及词类划分的标准或依据仍然存在 较大的争 议,其 中 汉 语 界 和 外 语 界 的 争 议 又 最 为 明 显。例如,马建忠(1898)提出“词无定类”的观点[2], 吕叔湘(2002)主张“词义不变,词类不变”[3],高名凯 (1963)认为汉语实词无词类[4],朱德熙(1982)则主张 兼类要少的原则[5]。基于复杂适应系统语言观,王仁 强认为,词类与语言系统本身一样,处在不断变化之 中,是否需要标注相关词类,需看词类的用法是否已 经规约化,只要词类的使用实现了规约化,就可以标 注[6-8]。在词类辨别的问题上,要摆脱以往仅以理论 或内省的方式进行研究的观点,进而立足于语言的实 际使用情况,即语料库之类的大数据,来确保词类标 注 的 准 确 性[9]。基 于 “双 层 词 类 范 畴 化 理 论 模 型”[10],依托国家语委语料库数据分析,对“翻译”一 词词类标注中是否要设立自指义项的问题进行了研 究。该模型基于复杂适应系统语言观[11]和命题言语 行为功能[12],通过对社群语言系统层面词库中的词和 言语层面不同该模型指出词类范畴化在 两个层面发生,即词例(token)的词类范畴化和概括词 (type)的词类范畴化:前者指说话者表达指称、陈述、 修饰等命题言语行为功能,后者体现为一个语言社群

《2024年语料库研究》范文

《2024年语料库研究》范文

《语料库研究》篇一一、引言语料库作为一种资源丰富的语言数据集合,已成为语言学、语言学研究以及相关领域的热点研究对象。

它能够为语言分析、语言教学、翻译、词典编纂等多个领域提供支持。

本文将介绍语料库研究的重要性,并就当前语料库研究的现状进行梳理,进而分析其中存在的挑战和问题,并探讨未来的发展趋势。

二、语料库研究的现状1. 语料库类型及建设随着技术的进步,语料库建设日趋成熟。

根据不同领域和用途,语料库可大致分为通用型和专用型。

其中,通用型语料库如COCA、BNC等,涵盖了广泛的语言使用场景;专用型语料库则针对特定领域或主题进行收集,如法律、医学等。

此外,还有多媒体语料库和口语语料库等类型。

在建设过程中,研究者需考虑语料库的规模、代表性、时效性等因素。

2. 语料库应用领域语料库在多个领域得到了广泛应用。

在语言学领域,语料库为语言研究提供了丰富的数据支持;在翻译领域,语料库可帮助提高翻译的准确性和效率;在词典编纂方面,语料库为词汇的收集和释义提供了有力支持。

此外,在语言教学、自然语言处理等领域,语料库也发挥着重要作用。

三、当前挑战与问题尽管语料库研究取得了显著成果,但仍面临诸多挑战和问题。

首先,在语料库建设方面,如何确保数据的代表性和真实性是一个亟待解决的问题。

此外,随着技术的发展,如何利用人工智能等手段对语料库进行智能化处理和利用也是一大挑战。

其次,在应用方面,如何将语料库与实际需求相结合,提高应用效果也是一个难题。

此外,不同领域和行业对语料库的需求存在差异,如何满足这些不同需求也是一项挑战。

四、未来展望面对未来的发展,语料库研究将呈现以下几个趋势:1. 多样化与个性化:随着用户需求的多样化与个性化发展,未来的语料库将更加关注用户需求和实际应用场景的差异。

研究者需要设计更多类型的语料库来满足不同领域和行业的需求。

2. 智能化与自动化:人工智能技术的不断发展将促进语料库的智能化和自动化处理。

例如,利用自然语言处理技术对语料进行自动标注、分类和分析等操作,提高处理效率和准确性。

语料库词典学的发展过程与趋势预测

语料库词典学的发展过程与趋势预测

语料库词典学的发展过程与趋势预测近年来,在词典学和语料库语言学的碰撞融合下,产生了一门新兴的交叉学科——语料库词典学。

作为计算词典学的重要组成成分,语料库词典学的影响日益深远。

本文将对语料库词典学的发展过程进行简要介绍,探讨其发展的局限性,并对语料库词典学的发展趋势进行分析预测。

标签:语料库词典料库发展过程趋势预测随着语料库在词典学领域的广泛应用,产生了许多新的概念。

“语料库驱动词典学”、“基于语料库的词典学”和“语料库辅助词典学”等说法层出不穷,语料库与词典的关系也日趋密切。

仔细探究这些新概念,发现它们实际上是新技术、新学说与老传统的嫁接物。

新技术主要是日益发展的计算机应用技术和网络技术,而新学说主要是语言学新理论及其日益丰富的研究成果。

实际上,词典学与语料库的关系一直十分密切,有着不解之缘。

词典是对大自然语言的描写,而语料库则是语言能力的应用。

语料库语言学的技术方法使得词典的编纂发生了翻天覆地的变化,词典学也掀起了语料库的革命。

事实证明,词典与语料库的结合是时代与词典学发展的必然结果,语料库词典学也由此应运而生。

一、语料库词典学的兴起与发展1.语料库语言学与词典学的结合语料库原本是指为特定的目搜集的一批材料,然而随着语料库与计算机技术结合之后,其含义发生了变化,指的是“在一种语言中或多或少具有一定代表性的文本、话语的汇集,包括书面语、口语,通常以电子数据的形式存储”。

而语料库语言学指的是以语料库为手段,来对语言进行研究和分析的一门特色学科。

这种新的研究思路,为人们处理大规模真实文本开辟了方法。

之后,语料库语言学的研究着眼于“关联模式”的辨认和分析,即一种语言特征与其他语言特征及非语言特征的系统联系。

这种研究不仅可以使我们更全面地了解某一语言特征,还可以提取研究各种文本和变体的特征。

而这些内容正是词典学所需要的,具有重要的研究价值。

于是,词典学就自然而然地与语料库语言学结合起来,诞生出一个新的交叉学科——语料库词典学。

语料选择在词典编纂过程中的重要性

一语料中有关新词时间的界定葛本仪先生在现代汉语词汇学中指出所谓新词就是指刚产生的词或者是产生后使用时间不长久的词
语料选择ቤተ መጻሕፍቲ ባይዱ词典编纂过程中的重要性
语料选择在词典编纂过程中的重要性
一、语料中有关新词时间的界定 葛本仪先生在<现代汉语词汇学>中指出,所谓新词就是指刚产生的词,或者是产生后使用时间不长久的词.我们判断新词,首先应该有一个时间概念,也就是说,必须立足于某一个时段上来认识新词.
作 者:姚娟 作者单位:南京师范大学文学院 刊 名:现代语文(语言研究) 英文刊名:MODERNCHINESE 年,卷(期):2007 ""(12) 分类号:H1 关键词:

《蒙古语词典释义的比较研究》范文

《蒙古语词典释义的比较研究》篇一一、引言蒙古语作为我国重要的少数民族语言之一,其词汇丰富、语法独特,具有深厚的文化内涵和历史背景。

随着社会的发展和语言的演变,蒙古语的释义也在不断地发展和变化。

因此,对蒙古语词典释义进行深入研究,不仅有助于更好地理解和掌握蒙古语词汇的含义和用法,还有助于推动蒙古语言文化的发展和传承。

本文旨在通过对蒙古语词典释义的比较研究,探讨其发展变化及其背后的原因和影响。

二、蒙古语词典释义的概述蒙古语词典释义是指对蒙古语词汇的含义、用法、词性、搭配等进行详细解释和说明的过程。

在蒙古语词典中,释义通常采用多种方式进行描述,包括词义、例句、近义词、反义词等。

这些释义方式有助于读者全面理解和掌握词汇的含义和用法。

三、蒙古语词典释义的比较研究1. 不同版本的比较不同版本的蒙古语词典在释义上存在一定的差异。

这些差异可能来自于不同的编纂者、出版时间、地域文化等因素。

通过对不同版本的蒙古语词典进行比较,可以了解不同时期、不同地域的蒙古语词汇的释义变化,从而更好地把握蒙古语的演变和发展。

2. 中外词典的比较中外词典在释义上也存在一定的差异。

这主要是因为中外的语言文化背景、思维方式、表达方式等方面存在差异。

通过对中外蒙古语词典进行比较,可以更好地了解中外对蒙古语词汇的理解和解释,从而促进中外文化交流和语言互译的准确性。

3. 不同领域的比较不同领域的蒙古语词汇在释义上也存在差异。

例如,科技领域、文学领域、医学领域等对同一词汇的解释可能存在差异。

通过对不同领域的蒙古语词典进行比较,可以更好地了解同一词汇在不同领域的应用和解释,从而更好地掌握其含义和用法。

四、蒙古语词典释义的发展变化及其原因和影响随着社会的发展和语言的演变,蒙古语的释义也在不断地发展和变化。

这主要是由于社会变革、文化交流、语言发展等因素的影响。

同时,科技的进步也促进了蒙古语词汇的更新和发展。

例如,随着互联网的普及,一些新兴词汇和表达方式也逐渐进入了蒙古语的词汇库中。

基于词典语料库的介词注释模式研究

基于词典语料库的介词注释模式研究本文以《商务馆学汉语词典》和《现代汉语常用词用法词典》中的介词为研究对象,采用语料库技术,对《商务馆学汉语词典》和《现代汉语常用词用法词典》的介词词条注释语言进行标注,分析了两本对外学习词典在收录介词词目上的情况,并通过对词典中注释语言的分类和分析构拟了两本词典介词的注释模式以及理想的学习词典介词注释模式。

标签:介词对外学习型词典收词注释模式汉语在语法方面的最大特点就是缺乏表示语法意义的明显的词形变化,语序和虚词是汉语表达语法意义的主要手段。

介词属于虚词范畴,在汉语语法中主要起介引功能,往往需要依附其他词语,组成介词短语来充当句法成分。

介词在汉语词类中表现出的独特性和复杂性使外国学习者在掌握和运用汉语介词方面容易出现使用偏误。

对外学习型词典是学习汉语的重要工具,学习词典收词是否充分、注释结构是否合理、用法解释是否恰当等等都直接影响着汉语学习者的查阅效果和学习效果。

基于上述现状,我们选择有较大影响力的两本学习词典——《商务馆学汉语》(以下简称《学汉语》)和《现代汉语常用词用法词典》(以下简称《用法》)建设语料库,按词类分类提取注释语言。

通过建立两本字典中所有介词词条的语料库,对二者进行收词、注释模式的对比研究。

一、《学汉语》和《用法》收录介词词目情况根据《学汉语》和《用法》中对词性的标记,我们将所有标注有“(介)”,即标明介词词类简称外加括号的条目全部抽取出来,穷尽提取后,分别得到介词条目62个、64个。

利用Access对《学汉语》和《用法》所收词条进行统计,统计出《学汉语》中的介词词条共62个,《用法》中的介词词条共64个。

两本字典共有的介词条目有:把、被、比、朝、从、当、对、给、跟、和、叫、通过、往、为(wei2)、为(wei4)、为了、在、按、按照、趁、对于、关于、将、就、随、替、同、沿、以、由、由于、于、与、照、自、自从、冲、除、据、凭、奔、乘、根据、连、拿、让、依、至于,共48个。

基于语料库的英语学习词典类词缀处理研究

Sichuan International Studies UniversityThe Treatment of Affixoids in English Learner’s Dictionaries:A Corpus-based StudybyCheng JianyunA thesissubmitted to the Graduate Schoolin partial fulfillment of the requirements for the degree ofMaster of ArtsinEnglish Language and Literatureunderthe supervision ofProfessor Wang RenqiangChongqing, P. R. ChinaJune 2013摘 要现代英语中大量存在的类词缀是一种介于实词素与词缀之间的特殊构词成分。

虽然很多学者在其著作中或多或少的提及了英语类词缀这一语言现象,但由于类词缀自身的特殊性和复杂性,大部分学者将类词缀置于其上位概念“组合形式”之下进行了讨论,缺乏深入的调查和系统的研究。

本文在回顾英语组合形式研究和类词缀研究的基础上,以基于使用的语言理论作为理论基础,并借助当代美语语料库对类词缀在英语学习词典(《牛津高阶英语词典》(第七版)、《柯林斯高阶英语学习词典》(第五版)和《朗文当代英语词典》(第四版))中的处理情况进行了深入调查。

调查发现,三部词典对类词缀的标注不够准确,类词缀被等同于组合形式进行标注或将其列为某个词条的义项之一,极大地忽略了类词缀的地位和构词能力。

文章建议,英语学习词典处理类词缀时,应基于大型平衡语料库中词语使用模式调查为基础,研究其形态地位及构词能力,而不能片面地将类词缀置于“组合形式”之下或列为义项进行标注。

本项研究不仅对英语学习词典类词缀的处理有一定应用价值,对英语形态学研究也有一定的学术价值。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

语料库在词典释义中的应川研究 [Abstract]Definition is the main task of dictionary compilation. With the application of corpora to dictionary compilation, the problems also arise. This paper mainly points out the problems in the application of corpora to definition and tries to find the solutions.

[Key words]definition,corpora,dictionary compilation I. Introduction Nowadays, the combination of dictionary compilation into corpora can be said to be the most popular and promising topic in the field of linguistics, especially lexicography. However, what role the corpora are really playing in dictionary compilation? To be specific, what advantages do corpora bring into play in dictionary compilation? When mentioning about corpora, do they provide the great advantages for dictionary compilation? Or, are they really objective to compiling dictionary? First, let’s look back the history of dictionary compilation, i.e. what methods dictionary compilers have been used in dictionary compilation and what advantages and disadvantages these methods have in dictionary compilation. What purpose of dictionary is made for and what’s the first purpose of dictionary compilation?

The main purpose of corpora is designed to make dictionary. We can prove this from the update definition of corpus, i.e. corpus (plural corpora or corpuses) 1. formal. 2. linguistics, a collection of written and spoken language stored on computer and used for language research and writing dictionaries. (Rundell, 2002: 312) From this definition, we can conclude that the basic task of corpus is used to compile dictionary. 1995 witnessed the great history of dictionary compilation. In that year, four dictionaries were published based on corpus with 100 million entries: Longman Dictionary of Contemporary English (3rd edition), Oxford Advanced Learner’s Dictionary (5th edition), Collins COBUILD English Dictionary (2nd edition), and Cambridge International English Dictionary.[1]

Defining words, the central part of the work of compiling a dictionary, is the core of a reference unit (MICROSTRUCTURE). The principle of defining words in a dictionary should be defining rarely-used words in popular ones, and defining recondite words in lucid ones. In the era with advanced science and technology, the combination of dictionary compilation into advanced technology including computer-assisted system such as corpus has become an absolutely necessary trend in the field of dictionary compilation. We cannot deny that computer technology influence greatly many fields including dictionary compilation. First, let’s see how corpus applies to compiling dictionary, especially definition, the core of dictionary. Ⅱ. The Great Application of Corpora to Definition 2.1 The methods of corpora applied to compiling dictionary Speaking about the application of corpus to dictionary compilation, we cannot ignore the joint between corpus and dictionary compilation, ―Sketch Engine‖ which is designed to improve the efficiency of compiling dictionary based on corpus.

In the process of dictionary compilation, lexicographers need induce the examples to the vocabulary in the corpus and find out the senses in an abstract way to write them in the dictionary. Large-scaled corpus provides dependable information for dictionary compilation. However, when searching the common vocabulary and collocations in the corpus, lexicographers always find numerous concordance lines in several hundreds or evening in thousands or ten thousands, which is very inconvenient for lexicographers to discover the usage rules of language. In the face of ―information overload‖, the work of lexicographers becomes time-consuming and effort-wasting, inappropriate to the advance development of modern technology, which compels modern people to develop an efficient language information acquiring tool dependent on natural language management technology.[2]807-818

―Sketch Engine‖, developed by Kilgarriff et al, is just such a dictionary compiling assistance system based on the above consideration. This system serves as the joint between corpus and dictionary compilation, gathering language information of large-scaled corpus for the purpose of convenience of dictionary compilation. ―Sketch Engine‖ is virtually a database, building a bridge between lexical collocation and semantic meaning.

Sketch Engine has the following functions: 1)automatically producing Word Sketches — a page layout summarized from corpus. The page layout collects all the information of given words’ grammatical features and collocation features; 2) assisting dictionary compilers in decomposing lexical meanings; 3) establishing corpus of lexical meaning by analysis of lexical meaning from dictionary compilers, and carrying out Word Sense Disambiguation to corresponding words’ other using examples. (Kilgarriff et al., 2003)

相关文档
最新文档