词汇分布语义的语言学基础分析
语言学语言学理论与语言分析

语言学语言学理论与语言分析语言学:语言学理论与语言分析语言是人类沟通和表达思想的工具,它是文化的核心,也是人与人之间互动的基础。
语言学作为一门研究语言的学科,涉及声音、词汇、语法和意义等多个层面。
本文将从语言学理论和语言分析两个方面展开讨论。
一、语言学理论1. 结构主义语言学结构主义语言学强调语言结构的重要性,它将语言视为一种符号系统,通过分析语言的组织方式和规则来理解其意义。
其中,最著名的研究成果之一是弗洛伊德·德·索萨的语音学理论,他提出了音素的概念,并通过比较语言中不同音素的区别来揭示其语音系统的规律。
2. 生成语法生成语法是一种从输入(语法)到输出(句子)的映射关系。
它试图通过分析句子的结构和生成规则来解释语言的组织方式。
著名的生成语法理论家诺姆·乔姆斯基提出了生成语法的核心概念:深层结构和表层结构。
深层结构指句子的语义内容,表层结构则是句子的语法形式,两者通过转换规则相互联系。
3. 语用学语用学研究语言在实际交际中的运用和意义生成。
它关注的是话语背后的意图和上下文对人们理解的影响。
语用学理论探讨了言外之意、指示、言辞行为和交际策略等问题,帮助人们更准确地理解和运用语言。
二、语言分析语言分析是对具体语言材料进行的细致解读和研究,旨在了解语言的运作规律和表达方式。
1. 语音分析语音分析关注语言的声音部分,研究语音单元和语音规则。
通过分析语音的音素、音位等特性,可以揭示语言的语音系统。
2. 词汇分析词汇分析研究词汇的组织和意义。
词汇是语言的基本单位,通过分析词汇的内部结构、义项和语义关系等,可以更好地理解和运用词汇。
3. 句法分析句法分析关注句子的结构和组成成分之间的关系。
通过分析句子的层次结构、短语结构等特点,可以揭示句子的语法规律和句法关系。
4. 话语分析话语分析考察的是真实语言使用情境中的不同因素对意义产生的影响。
通过研究语言交际过程中的语用信息、语境和上下文,可以揭示话语的意图和实际含义。
语言学基础概念总结

《语言学基础概念总结》语言学是一门研究语言的科学,它涵盖了语言的各个方面,包括语言的结构、功能、历史演变以及语言在社会中的作用等。
本文将对语言学的一些基础概念进行总结。
一、语言的定义和特征语言是人类最重要的交际工具,它是一种符号系统,由语音、词汇和语法构成。
语言具有以下特征:1. 任意性:语言符号的形式和意义之间的关系是任意的,即语言符号的音和义之间没有必然的联系。
2. 线条性:语言符号在时间上是依次出现的,具有线条性特征。
3. 系统性:语言是一个系统,各个要素之间相互联系、相互制约。
4. 社会性:语言是社会的产物,它随着社会的发展而发展,同时也反映了社会的特点。
二、语音语音是语言的物质外壳,是语言符号的声音形式。
语音具有以下特点:1. 物理属性:语音具有音高、音强、音长和音色等物理属性。
2. 生理属性:语音是由人的发音器官发出的,发音器官的活动决定了语音的生理属性。
3. 社会属性:语音的社会属性表现在不同的语言或方言中,语音的发音和意义可能不同。
三、词汇词汇是语言的建筑材料,是语言中所有词的总汇。
词汇具有以下特点:1. 数量庞大:语言中的词汇数量非常庞大,而且随着社会的发展和人们的认知不断增加。
2. 系统性:词汇不是孤立的,而是相互联系、相互制约的,形成一个词汇系统。
3. 多义性:许多词汇具有多个意义,这是词汇多义性的表现。
4. 变化性:词汇随着社会的发展和人们的认知不断变化,新的词汇不断产生,旧的词汇逐渐淘汰。
四、语法语法是语言的结构规则,它规定了词如何组合成句子。
语法具有以下特点:1. 抽象性:语法是对语言结构的抽象概括,它不涉及具体的语言内容。
2. 递归性:语法结构可以层层嵌套,具有递归性特征。
3. 稳定性:语法相对稳定,变化比较缓慢。
4. 民族性:不同的语言有不同的语法结构,这反映了不同民族的思维方式和文化特点。
五、语义语义是语言的意义内容,它是语言符号所表达的意义。
语义具有以下特点:1. 客观性:语义是对客观事物的反映,具有客观性。
第一讲__汉语词汇学

3.因声求义
• • • • • • • (1)寻求词的声音与物的声音直接对应。 知了、布谷;当啷、滴答;叽里咕噜、噼里啪啦;呸、哼 (2)寻找非原始词及其赖以产生的原始词之间的语音联系。 韭,《说文》:“韭,菜名,一种而久者,故谓之韭。” 仲:《白虎通》:“仲,中也”。仲裁,即位于中间者裁决。 ◆音义关系 东汉刘熙的《释名》中,就注意到从字的语音形式角度来解释字义。 如: 刀末曰锋,言若蜂刺之毒利也。 北宋,王圣美发明“右文说”,认为:“凡字,其类在左,其义在右。 如木类,其左皆从木。所谓右文者,如戔,小也。水之小者曰浅,金 之小者曰钱,歹而小者曰残,贝之小者曰贱。诸如此类,皆以戔为义 也。” 到了清代,段玉裁提出“凡同声多同义”,王念孙提出“声同字异, 声近义同”,提炼出了“因声求义”的理论。 杨树达《积微居小学金石论丛•形声字声中有义略证》:燕声、宴声 字多含“白”义。鸟之白颈者谓之燕;马之白窍者为之驠;马尾本白 者谓之騴;白鱼谓之鰋。
第一讲 汉语词汇学绪论
• 一 词汇学:一门年轻而又古老的科学 • 语义学的一个分支学科,又称词汇语义学。在语文学 时期,词汇学是语言学的组成部分,曾经与语音学、 语法学并列;在现代语言学里,一般认为音系学、 句法学、语义学是语言学的三个组成部分。 • 二 词汇学类别 • 1.普通词汇学、个别词汇学 • 前者指的是研究语言中的词汇的一般规律的词汇学 子学科。如张永言《词汇学简论》;后者是研究某 种具体语言的词汇的独特规律的词汇学子学科,如 陆国强的《现代英语词汇学》。
• 印泥:秦汉之际,秘密的信息书于竹简木牍上,书毕把竹 简木牍合严,再用绳子捆捆扎,在绳子结扣处用粘泥封住, 然后加盖印章,作为信验,以防私拆。这个粘泥块称为封 泥。因而后世红印色称为印泥。
(四)词的理据的分析法、探求法
专业的语言学分析

专业的语言学分析语言学是研究语言的科学,它涉及语言的结构、规则和使用等方面。
专业的语言学分析是对语言现象进行深入研究和分析的过程。
本文将从语音学、词汇学、语法学和语用学四个方面,对专业的语言学分析进行探讨。
一、语音学分析语音学是研究语音的科学,它以语音的产生、传播和接收为研究对象。
语音学分析主要关注以下几个方面:1.语音单位:语音学分析通常将语音分割为音素、音节和音段等语音单位,并研究其特征和规律。
2.音位与音节:语音学分析可以确定某种语言中的音位和音节数量,并研究它们之间的关系和规则。
3.音系:通过语音学分析,可以建立音位的系统,并研究它们之间的相互作用、变体和分布规律。
二、词汇学分析词汇学是研究词汇的科学,它研究词汇的构成、词义和词法等方面。
词汇学分析主要关注以下几个方面:1.词汇构成和词源:通过词汇学分析,可以了解词汇的构成方式,包括词根、词缀、合成等,并追溯词汇的来源和演变过程。
2.词义和语义关系:词汇学分析可以研究词汇的词义和语义关系,包括义项、义理、义位等,并探讨词汇之间的关联和义理的变化。
3.词法规则:通过词汇学分析,可以建立和研究词法规则,包括词性、时态、语态等方面的规则,并分析其在语言中的使用和变化。
三、语法学分析语法学是研究句法结构和句法规则的科学,它研究词与词之间的组合和句子的结构等方面。
语法学分析主要关注以下几个方面:1.句子结构:通过语法学分析,可以研究句子的成分和句子的结构,包括主谓结构、定语从句、状语从句等。
2.句法规则:语法学分析可以提取和研究语言中的句法规则,包括词序、句型和语法关系等方面的规则,并分析其在语言中的使用和变化。
3.句法修饰:通过语法学分析,可以研究句子的修饰成分,包括名词短语、副词短语和介词短语等,并分析其在句子中的作用和位置。
四、语用学分析语用学是研究语言使用和意义的科学,它关注语言在交际中的功能和效果。
语用学分析主要关注以下几个方面:1.言语行为:通过语用学分析,可以研究和分析言语行为的目的和效果,包括陈述、询问、命令、请求等。
语义学理解(最新整理)

语义学各个领域对语义学的看法语义学(Semantics),也作“语意学”,是一个涉及到语言学、逻辑学、计算机科学、自然语言处理、认知科学、心理学等诸多领域的一个术语。
虽然各个学科之间对语义学的研究有一定的共同性,但是具体的研究方法和内容大相径庭。
四、认知科学对语义学的研究在于人脑对语言单位的意义的存储及理解的模式。
语义学分支1哲学语义学 这是哲学家对自然语言的语义的研究,围绕着什么是意义这一难题展开。
古希腊时代柏拉图(约公元前428~前348)以为既然词语是用来指称事物,为它命名的,词语的意义就是其所指对象。
这种原始的观点称为指称论。
可是有些词语,例如“当今法国皇帝”,虽然有意义,却没有指称对象,因为当今法国没有皇帝。
于是有人退一步说:意义是词语在说话者和听话者头脑中产生的形象或者观念。
然而这个说法也有缺点。
说词语的意义是形象,太具体,因为同一个词可以唤起不同的形象;说词语的意义是观念,又太笼统,因为观念本身是未知数,靠观念来确定意义不过是用一个未知数代替另一个未知数。
由于观念论说明不了意义,有些哲学家如D.戴维森便试图另辟途径,确立词语与世界的联系。
他们提出, 语句的意义与命题的真假有关。
这种观点称为真值论。
在真值论基础上发展出真值条件语义学,可能世界语义学及各种模式 -理论语义学。
维特根斯坦(1889~1951)反对真值论,他认为词的意义是它在语言中的用法。
他的理论叫做用法论。
用法论不象真值论那么狭窄,因为许多语句没有所谓真值,如疑问句、祈使句都无所谓真假,但是任何词语必有一定的用法。
可是用法论也有缺陷,困为“用法”的概念不明确。
后期的语言游戏论,认为“语言游戏论=自然语言分析+心理行为分析”。
维特根斯坦后期的转变不仅是语言基础的转变———从理想语言转到自然语言,也是分析方法的转变———从单纯的语言分析转到语言分析与心理分析的结合。
英国哲学家J.L.奥斯汀 (1911~1960)也反对真值论,他从另一个角度来弥补真值论的不足,他认为说话不仅是“言”,而且是“行”,因而话语有双重作用,一是陈述命题,二是起命令、请求、许愿、警告之类的言外作用。
语言学语音学与语义学的基本概念

语言学语音学与语义学的基本概念语言学是研究语言的科学,旨在理解语言的起源、结构和发展,以及语言在社会和个体中的作用。
语言学可以分为多个学科领域,其中语音学和语义学是其重要组成部分。
语音学是语言学中研究语音和语音系统的学科,涉及到语音的产生、传播和感知。
它主要关注语音的物理特性和语音音位的研究。
语音学研究的基本概念包括音素、音位和语音。
音素是语音学中最基本的单位,是语言中具有区分意义的最小音段。
不同的语言有不同的音素系统,可以通过音素进行语音的分类和比较。
音位是指一个语言中具有意义差异的音素,它是词汇中音素的具体表现形式。
通过对音位的研究,可以揭示出语言中的音位规则和音位的变体形式。
语音学的另一个重要方面是语音感知和产生的研究。
语音感知涉及到人类对语音的听觉知觉和处理过程,包括语音辨认、语音分类和语音联想等。
语音产生则是研究人类如何通过声音的产生器官(如喉头、口腔等)产生语音的过程,以及语音的声学特性。
与语音学相对应的是语义学,它是研究语言意义和语言符号之间关系的学科。
语义学通过研究词汇和句子的意义,揭示语言中的语义规则和语义结构。
语义学研究的基本概念包括词义、句法和语言意义。
词义是语义学的基本单位,它涉及到词汇的本义、引申义和隐喻义等。
词义的研究可以通过语境分析和语义关系的建立来进行。
句法是研究句子结构和语法规则的学科,它涉及到词类、短语、句子成分的分析和描述。
语义学还通过研究句子的语义结构和句法规则,分析句子的意义和句子成分之间的关系。
语义学的研究对象也包括语言意义的组织和推理。
语言意义的组织包括语义关系、语义场和语义网络的建立,以及语义规则的运用。
语义推理则涉及到语义逻辑和语义推导的研究,通过语义关系的推理和语义规则的运用来理解和表达语言意义。
综上所述,语言学的基本概念主要包括语音学和语义学。
通过语音学的研究,我们可以了解语音的产生和感知规律。
通过语义学的研究,我们可以揭示语言的意义和语言符号之间的关系。
语言学基础知识点
语言学基础知识点语言学是对人类语言的系统性研究,涉及语言的结构、使用和习得等方面。
它是一门复杂而精密的学科,需要掌握一系列基础知识点。
本文将介绍语言学的基础知识点,包括语言分类、语音学、语法学和语义学等内容。
一、语言分类语言是人类与世界沟通交流的工具,按照语言之间的关系,可以将语言分为以下几类:1. 语系分类:语系是指由共同祖源的语言所构成的系统,常见的语系有汉藏语系、印欧语系、阿尔泰语系等。
2. 语族分类:语族是指由同一远古时期的原始语所发展而来的一组语言,常见的语族有汉藏语族、印欧语族、阿尔泰语族等。
3. 语支分类:语支是指在一个语族内具有一定程度关系的一组语言,比如在汉藏语族中,汉语是其中的一个语支。
4. 语言类型分类:根据语言的语法结构,可以将语言分为屈折语、孤立语、辅助语等类型。
二、语音学语音学是研究语音的学科,包括音位、音韵和音系等内容。
1. 音位:音位是指在一种语言中能够区分意义的最小语音单位。
不同语言的音位差异很大,比如汉语有四个声调,而英语则没有。
2. 音韵:音韵是指研究语音的组织和规律的学科,包括音位的组合、音变规律等。
3. 音系:音系是指一个语言中所有音位的总体组织结构,可以通过音标来表示。
不同语言的音系差异很大,比如英语和法语的音系就有很大的不同。
三、语法学语法学是研究句子结构和组织的学科,包括句法、词法和语用学等内容。
1. 句法:句法是研究句子结构的学科,包括短语结构、句子成分等。
不同语言的句法结构也有很大差异,比如汉语的主谓宾结构,英语的主谓宾结构。
2. 词法:词法是研究词的形态和构词规律的学科,包括词的分类、词性等。
不同语言的词法规律也有所不同,比如汉语的词性很多,英语的词性相对简单。
3. 语用学:语用学是研究语言使用的学科,包括语境和语用的关系、指称和概括等。
语用学关注的是语言的真正意义和用途。
四、语义学语义学是研究词义和句义的学科,包括词义学和句义学等内容。
1. 词义学:词义学是研究词的意义和用法的学科,包括词义的构成、词汇关系等。
语义成分分析方法及其应用
语义成分分析方法及其应用重庆大学外语学院余渭深提要: 本文着重介绍Katz等人的语义成分分析方法的理论与实践。
探讨了语义成分分析法在词汇理解、动词意义结构和句法语义接口等语法分析、语义合成模式、概念结构等研究领域的应用。
以期向读者介绍以语义成分分析为核心的语义学理论系统。
关键词:成分分析,词汇,语法,意义合成模式,概念结构Abstract: This paper attempts to introduce some new semantic theories and practices based on semantic component analysis put forward by Katz and other contemporary linguists. The paper makes a detailed discussion on the application of the component analysis in the word meanings; grammatical analysis of the verb structures and the interface of syntax and semantics; semantic conflation; conceptual structure. The discussion provides readers with some insights on the system of new semantic theories.Key words: component analysis, words, grammar, conflation, conceptual structure引言语义学作为语言学的一门分相学科研究属于对语言本体的研究。
语义学的发展经历了几个主要的时期,形成了几种主要的语义研究模式,如解释语义学、生成语义学、逻辑数理语义学、格语法、齐夫语法等。
语言学中的语义理解与语言生成
语言学中的语义理解与语言生成语言学是研究语言的结构、演变和使用规律的学科。
语言的基本单位是词汇,而词汇的理解与生成涉及语义理解与语言生成的过程。
本文将从语义理解和语言生成两个方面,介绍语言学中的相关概念和研究方法。
一、语义理解语义理解是指在信息传递过程中,接收者对发出者所表达的信息进行解读和理解的过程。
它是将语言信号转化为意义的过程,包括词汇的解释、句子的理解和篇章的解析。
语义理解的价值在于能够帮助人们准确地理解他人的意图和信息。
1. 词汇的语义理解词汇是语言的基本单位,每个词汇都由一个或多个词义构成。
语义理解中的一个重要问题是词汇义项的确定。
在早期的观念中,词汇义项的界定是基于意图(intent)和含义(meaning)的不同理解。
然而,随着语言学研究的深入,现今认为词汇义项主要基于语境和语用,并区分自然语言中的直接义和隐含义。
2. 句子的语义理解句子作为语言的基本组织形式,其语义理解涉及词语的组合、句法结构和句子的意义等方面。
在语义理解的过程中,需要考虑上下文、语境、修辞手法等因素,以理解句子的意义。
此外,语义理解还需要处理歧义、语法剖析和逻辑推理等问题,以获得更准确的理解。
3. 篇章的语义理解篇章语义理解是对篇章、段落和句子等语言单位的深度理解。
在篇章的语义理解中,需要考虑信息的连贯性、关联性和主题的承接。
此外,还需要处理指代、共指和词汇搭配等问题,以确保篇章的逻辑连贯性和信息准确性。
二、语言生成语言生成是指将思想和意图转化为语言表达的过程。
它是语义信息到语言表达的转换过程,包括句子的生成、篇章的组织和话语的表达等过程。
语言生成的目标是选择合适的词汇和句法结构,以准确地表达意图。
1. 句子的语言生成句子的语言生成是将概念和意义转换为句子的过程。
在句子的语言生成中,需要选择适当的词汇、句法结构和修辞手法,以产生清晰、简洁和准确的句子。
此外,还需要考虑上下文、语境和修辞目的,以提高句子的表达效果。
语言学中的语义学与语用学
语言学中的语义学与语用学语义学和语用学是语言学中两个重要的分支学科,它们研究的是语言的意义和使用。
虽然两者都与语言相关,但各自关注的方面有所不同。
一、语义学语义学是研究语言中的意义的学科。
它探讨的是词汇、短语和句子的意义,以及它们之间的关系。
语义学主要关注语言形式与语言意义之间的联系,研究的是语言的内在结构。
语义学主要涉及以下几个重要概念:1. 词汇意义:词汇意义是指词汇本身的意义。
语义学家通过研究词汇的概念、义项、同义词、反义词等来揭示词汇意义的内涵和外延。
2. 句义:句义是指句子的意义。
语义学通过分析句子的组合规则、语义关系等来解释句子的意义。
3. 语境:语境是指语言使用的具体情境。
语义学认为,语境对于语言的意义有重要影响,同一词汇或句子在不同语境中可能会有不同的意义。
4. 语义关系:语义关系是指词汇、短语和句子之间的关系。
典型的语义关系包括同义关系、反义关系、上下位关系等。
语义学的研究方法主要包括语义分析、语义对比和语义推理等。
通过这些方法,语义学家可以揭示语言结构与意义之间的规律,帮助人们更好地理解和使用语言。
二、语用学语用学是研究语言使用的学科。
它关注的是语言在实际交际中的功能和效果,研究的是语言的外在运用。
语用学主要涉及以下几个重要概念:1. 言外之意:言外之意是指说话人通过语言暗示或隐含的意思。
语用学家通过分析上下文和语言非字面意义来揭示言外之意。
2. 语用规则:语用规则是指在特定语境中语言使用的约定俗成的规则。
比如,社交场合中的谦辞用语、禁忌用语等。
3. 语用失误:语用失误是指由于选择不当的语言,导致交际行为出现误解或不当反应的情况。
语用学研究语用失误的原因和修复方法,帮助人们更好地进行交际。
4. 语用策略:语用策略是指在特定交际目的下选择合适的语言行为。
语用学研究语用策略的选择和使用,以实现有效的交际目的。
语用学的研究方法主要包括语用分析、语用推理和语用实验等。
通过这些方法,语用学家可以揭示语言在不同交际场景下的特点和规律,帮助人们提高语言运用的效果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 词汇分布语义的语言学基础分析 一、引言 自然语言处理是人工智能领域极其重要也极具挑战的争辩方向,属于计算机科学与语言学的交叉学科。它将抽象的人类语言转换成适合计算机处理的形式,从而建立语言、学问与客观世界之间的可计算关系。自然语言处理的核心,是让机器具备理解各种语言形式(词汇、短语、句子、篇章等)内在含义的力量。词汇是自然语言的基本单位,词汇的语义表示因此也成为自然语言理解的基本问题之一。传统上,人们接受人工构建语义词典和语义学问库的方式来表达词汇语义①。但人工标注的方式成本昂扬,掩盖面亦有限,难以获得大规模高质量的标注数据。随着深度学习技术的进展和文本数据的爆炸式增长,利用机器学习算法在大规模语料上对词汇表示进行抽象和学习,成为当前词汇语义表示的主流方法。这种表示方法又称分布语义,它通过对语料的学习,将符号表示的词汇转化为数学表示的向量,使得词汇具有语义可计算的力量,已经在智能搜寻、语音识别、机器翻译、诗歌创作、古文断句、信息过滤、意图理解等领域得到了广泛使用②。尽管词汇分布语义在应用上取得了很大的成功,然而也应当看到,对其背后的语言学机理,我们还缺乏全面的生疏。我们要问,这种通过对语料的学习而自动获得的分布语义,本质上是一种什么样的语义?它能否涵盖词汇的完整意义?这种语义表示的潜力和局限又是什么?我们认为,要回答这些问题,需要结合相关的语言学理论来深化思考。 2
本文试图从语言学学说史的角度端详词汇分布语义的理论基础,并以在海量《人民日报》语料库上训练得到的词汇分布语义作为实证分析的依据③,以厘清词汇分布语义在自然语言处理领域的潜力和边界,并为自然语言理解模型的构建和应用供应新的思路。 二、意义即使用:词汇分布语义的语言哲学基础 词汇的意义理论是语言哲学的两个基本问题之一④。什么是词义?对这个问题的争辩,最早可追溯至古希腊时期对“词”与“物”的关系之辩,即名实之争。“逻各斯(logs)”学说的提出者,古希腊哲学家赫拉克里特(Heraclitus)主见“本质说”,认为名称与它所代表的事物之间的联系是不行分割的,名称包含了事物的本质⑤。与此相反,德谟克里特(Democletus)主见“商定说”,认为名称与事物之间的联系并非由事物的本质打算,而是商定俗成的⑥。后来柏拉图(Plato)在他的《对话录》中提出了“语词是命名(naming)”的折中观点,认为事物的意义在于名称和事物之间的自然联系,但这种内在联系会随着时间推移而减弱。柏拉图的同学亚里斯多德则坚决主见名实分别,认为名称不是自然赐予的,而是商定俗成的具有意义的声音,在成为一种符号时才成为名称⑦。公元二世纪语言学的亚历山大里亚学派(theAlexandrians)也传承了这一观点⑧。古希腊哲学家关于名实关系的争辩,对中世纪以后的语言哲学学说,产生了极其深远的影响。意义的指称论(referentialtheoryofmeaning)即秉持“商定说”的名实分别观点,认为词的意义就是词所指的对象。近代英国哲学家、规律学家密尔(J.S.Mill)把名称分为专名和通名,其中通名既有外延又有内 3
涵,外延表示所指称的事物,而内涵表示所指事物的特性,即意义⑨。德国哲学家弗雷格(G.Frege)进一步进展了指称论,在1892年发表的《论意义和所指》一文中,弗雷格对符号的意义和所指(一译“意谓”)做了明确区分。他以望远镜观看月亮来比方:月亮是所指,望远镜物镜中的影像是意义,视网膜上的图像是意象,意义介于所指和意象之间,既不是所指对象本身,也不像意象那样主观,而是一种客观的存在⑩。指称论的另一位代表人物罗素(B.A.W.Russell)则提出,应将语词分为专名和摹状词,专名的意义就是所指称的对象,摹状词的意义由所组成的语词的意义确定輥輯訛,罗素的意义理论被称为“规律指称论”,并深刻影响了他的同学维特根斯坦,早期维特根斯坦就认为,名称和对象之间存在直接的对应关系,名称所指的对象就是名称的意义輥輰訛。由上可知,指称论者虽然在具体观点上有所差异,但都主见语言是对世界的反映,词汇的意义在于所指称的世界中的事物。但是,指称论是以名称为范例来看待词汇的,而词汇并不都是名称,很多词汇的意义,要依据上下文甚至社会语境才能确定。后期维特根斯坦就否定了自己早期的指称论观点,在后期著作《哲学争辩》中,他提出“意义即用法”的观点,他说:“一个字词的意义是它在语言中的用法。”輥輱訛例如,作为路标的箭头符号之所以能够指路,是由于人们使用它,依据它的指向行走,正是使用赐予箭头符号以意义。依据维特根斯坦的观点,词汇的意义受到语言使用规章的制约,因此必需争辩语言玩耍的规章,这种思路被称作意义的使用论(usetheoryofmeaning),并直接促使人们对词的用法进行阅历性争辩。 4
意义的使用论被多个语言学派所吸取和接受,但“使用”这一概念过于空泛,不少语言学家给出了更为明确的关于“词义”的阐述。语言学伦敦学派的创始人弗斯(J.R.Firth)说:“词汇的意义取决于搭配”,认为意义存在于词汇消灭的上下文之中,上下文可以挂念理解词义。輥輲訛英国语言学家克鲁斯认为:“一个词项在各种语境中遇到的全部正常关系称为它的语境关系(contextualrelations),…,词的意义是由它的语境关系构成的。”輥輳訛用词的上下文信息来表达词的意义,与传统语义学和乔姆斯基(A.N.Chomsky)的生成语法理论形成了鲜亮对比,但在实践中却有很强的可操作性。我们以汉字“埙”为例,假设一个人并不清楚这个字的含义,但告知他这个字在如下的文本中消灭輥輴訛:(1)正是周敏在城墙头上吹动了埙,声音沉缓悠长,呜呜如夜风临窗。(贾平凹《废都》)(2)它的外形有椭圆形、圆形、橄榄形不等,大多由陶土烧制而成,所以又叫陶埙。(新华社新闻文本)(3)若不会吹笛,埙和箫都成,曲风应是悠扬轻远的。(剧本《武林外传》)那么,依据“埙”这个词在上下文中的分布,不难推断出它的意义:“一种陶制的吹奏乐器”。由此可见,假如给定足够多的上下文,就能够利用分布统计方法来刻画每个词的含义。词汇分布语义各种模型的基本思想,正是通过机器学习算法来学习词汇在大规模文本语料中的分布模式,从而获得词汇的语义表示。在各具特色的词汇分布语义学习模型中,Word2Vec神经网络模型是较有影响力的一种輥輵訛。本文接受Word2Vec的Skip-Gram算法对《人民日报》语料进行训练,然后将得到的词向量降到3维(原参数设为256维),再检索“埙”的语 5
义近邻分布,结果如下图1所示。由图1中词汇的空间分布,可以得到更多关于“埙”的语义学问,例如,由“编钟”、“篪”、“古琴”、“青铜器”等近邻词可以推断,“埙”应是一种远古乐器。可见,词汇分布语义实质上是通过词汇在空间中的位置来表达语义的。自然语言本质上是符号化的,而在分布表示框架下,符号表示的词汇最终被转换成了数学表示的向量,这种转换具有格外重要的意义,由于在转为数学向量之后,词汇语义变得可计算甚至可推理了。例如,通过向量计算,可以发觉“埙”与“箫”的距离要明显小于它与“架子鼓”的距离,也就是说,“埙”在语义上要更接近“箫”。同时,这种语义距离还具有可推理的性质,例如,通过计算,我们可以得到类似于“吹奏乐器-埙=打击乐器-架子鼓”这样的语义推理结果。那么,通过空间距离来表达词汇语义,是否符合人类对概念的认知规律呢?我们可以从认知语言学的角度看待这个问题。温格乐(F.Ungereer)认为,概念结构是体验性的(embodied,一译“具身”),语义的形成,很大程度上源于我们的身体体验輥輶訛。认知语言学的代表人物莱考夫(G.Lakoff)指出,隐喻是人类语言的普遍现象,是人类认知和思维的本质輥輷訛。格雷迪(E.J.Grady)的基本隐喻理论认为,儿童在概念认知的早期,能学会数百个可被辨识的基本隐喻,基本隐喻又进一步构成了简单隐喻輦輮訛。莱考夫总结分析了约50条基本隐喻,其中格外重要的一条就是“相像是近(similarityiscloseness)”,该隐喻是人类对挨近的相像对象进行观看而获得的基本阅历,表明人类的思维会将实体概念映射到空间,而相像的概念在空间中的距离也相近輦輯訛。莱考夫认为,人类 6
正是通过“相像是近”这一基本隐喻来进行概念层面的抽象思维。由此可见,用词汇在向量空间中的位置来表示词汇,用词汇间的空间距离来表示词汇的语义相像度,可以从认知语义学中找到理论依据。 三、句段与联想:词汇分布语义的两类上下文 词汇分布语义通过空间距离表达语义相像程度,而这种距离正是通过对词汇在语料中的“使用”模式进行统计,由学习模型自动习得的。因此,有必要端详词汇的“使用”指的是什么?以及对“使用”的不同定义得到的词汇语义有何区分?瑞士语言学家索绪尔(F.D.Saussure)是现代语言学的奠基者輦輰訛。索绪尔认为,语言是一套具有价值的符号系统,符号的价值在于对不同功能的区分,而这种区分是不能脱离系统而存在的。依据索绪尔的观点,作为语言符号系统的一部分,词汇不仅具有意义,而且具有价值,词汇的价值由它与其他词的关系打算,索绪尔将这种关系分为两类:句段关系和联想关系輦輱訛。句段关系是指话语中各个要素挨序排列结成的线条性关系,其特征是有序的,在现场的(法语inpraesentia)輦輲訛,例如,语词中构字成词,连词成句,集句成段等都属于句段关系;联想关系的特征是无序的,非现场的(法语inabsentia),可替换的輦輳訛。下面以一个简洁例子来说明句段关系和联想关系,如下图2所示。在这个例子中,“李白”和“诗人”属于句段关系,“李白”和“杜甫”则属于联想关系。索绪尔指出,整个语言机构都无外乎对这两种关系的运用。从这个角度来看,词汇分布语义模型对语义的学习,最终可以归结为对这两种关系的学习。句段关系是词汇的横向组合,通过对固定的语言单元内(如句子、