0409_19_王惠_现代汉语语义词典的结构及应用

合集下载

语文词典中的语法功能描写

语文词典中的语法功能描写

语文词典中的语法功能描写——兼评《现代汉语规范用法大词典》王惠新加坡国立大学中文系chswh@.sg一、 引言汉语的语文词典自古以来都很重视词语的形、音、义的标注。

而实际上,在确定一个词的信息量时,单靠这三个要素是不够的。

一个词除了具备这三者以外,还有一个很重要的因素——词在一定语言环境中所能发挥的能力与作用,即词的功能或用法。

词的意义和词的用法有着密切的关系。

词典的任务就是帮助读者了解词义,掌握词的用法。

关于这一点,许多学者都已从不同角度作了充分的论述。

如当代语言学家罗宾斯认为:“一个词的意义可以看作是它作为不同的句子的一个基本成分而被使用的方式。

词典的工作就是概括地诠释语言里每个词在某类句子中的使用方式。

”词典学家兹古斯塔也说:“词典编纂者的基础是指称词(词汇单位)。

词典编纂者还不得不把所有的词汇单位收进词典。

标出这些词汇单位作为句子的个别成分所具有的种种功能,而不管是指称功能,还是情态功能、实用功能或语法功能。

这些词汇单位都是语言系统的单位,它们在造句中,有不同但类似的功能。

这种观点不仅有理论作为基础,而且也出于实际的考虑。

……无论如何,词条的任何和词义相关的功能,甚至纯语法功能,都要在词典中标出。

”在形态发达的语言里,词典一般在释义时首先表明词性。

通过标词性把词的意义和用法有机地结合了起来。

但是在缺乏严格意义的形态的汉语里,由于还没有一套为大家普遍认同的词类划分体系,词的语法功能的描写不得不占据主要的地位。

《现代汉语词典》在这方面做了有益的探索,比如,不仅明确标注了封闭词类的词的词性,如代词、量词、副词、介词、连词、助词、叹词和象声词等,而且在释文和引例里尽可能地提示出词的语法功能。

如:多:副词。

①用在疑问句里,问程度。

不休:不停止(用作补语)不一:不相同(只作谓语,不作定语)《现代汉语八百词》率先自觉地对汉语虚词及少数特殊实词的结合能力、用法进行了详尽的分析,很具详解词典的风范。

但由于它主要是“供非汉族人学习汉语时使用”的,收词太少。

符号学在文学翻译中的应用研究

符号学在文学翻译中的应用研究

符号学在文学翻译中的应用研究王惠榆林学院外国语学院,陕西榆林719000[摘要]符号学是研究意义的学问,很多语言学家都对符号学作出了解释,符号学中的符号可以分为抽象符号、指示符号、类象符号等三种,而不管哪一种符号都是由解释者、符号载体以及符号所指三部分组成,这三个部分之间形成了符号学的意义,那就是实用意义、形式意义和存在意义,将这三方面的意义与语言研究相结合,则形成了语言意义的几个方面,那就是指称意义、言内意义和语用意义。

而文学翻译就是要对语言的意义进行翻译,达到功能相似、意义相符的目的,将语言符号中的言内意义、语用意义和指称意义传达出来,从而对原文的信息通过译文的形式予以再现。

本文是从符号学在文学翻译中的应用进行具体的分析。

[关键词]符号学;文学翻译;应用[作者简介]王惠(1981-),女,汉族,陕西省榆林市人,硕士,榆林学院外国语学院讲师。

研究方向:认知语言学及英语教学法研究。

今天,要想对不同文化背景下文学作品进行了解,翻译是一个非常重要的途径,文学的翻译本身就是一个非常复杂的过程,在翻译中所涉及到的学科和相关理论也比较多。

首先就是文学与翻译学,应用在文学翻译中的理论则主要有话语理论、接受理论以及多元系统论等等,这些理论和符号学之间的联系都非常密切。

总之,符号学与文学翻译的各个方面有着紧密的联系,下面笔者将就符号学在文学翻译中的应用进行具体的探讨。

一、符号学理论发展的基本情况介绍符号学是对符号系统进行研究的一门科学。

早在古希腊时代人们就已经开始关注符号学,直到二十世纪初,符号学作为一门科学正式诞生,并且在发展的过程中形成了两个不同的学派,即美国学派和欧洲大陆学派。

其中,皮尔士与莫里斯是美国学派的代表人物,而瑞士的索绪尔和法国的巴特则是欧洲大陆学派的代表人物。

索绪尔是符号学的奠基者,他认为,语言本身就是符号系统,语言学的出发点与基础就是语言符号,他对符号的社会性特征也比较重视,并且认为所指与能指的关系是语言符号最主要的意义。

第三章现代汉语语汇 (1)

第三章现代汉语语汇 (1)

第三章现代汉语语汇教学目的:理解现代汉语词的构造和词汇发展的途径及其规范,掌握词义的特点和辨析词义的方法,不断丰富自己的词汇,并提高词语的运用能力。

教学重点:语素、词的鉴别;词的构成;词义的构成;义素的分析和运用;基本词汇和一般词汇的区分。

第一节词汇、词汇单位和词的构造一、词汇1、定义:词汇又称语汇,是一种语言中所有的(或特定范围的)词和固定短语的总和。

(1)因为固定短语如成语、惯用语、歇后语等在结构与意义的定型化、造句的备用单位等方面与词是等价的,符合语言建筑材料的特点和功能要求,因而成为“词汇”内容不可或缺的组成部分。

我们不赞同“词汇就是词的总汇”或“词汇就是词语的总汇”等将固定结构排除在词汇之外的说法。

(2)特定范围如:某一个人或某一作品所用的词和固定短语的总和。

“老舍的词汇”、“《鲁迅全集》的词汇”等等。

汉语是高度发达的语言,词汇极其丰富。

《汉语大词典》所收词语达37万条。

《现代汉语词典》是以记录普通话词语为主的中型词典,所收词语也有5万余条。

我们应该努力掌握更多的词语,不断提高自己的语言表达能力。

2、积累词汇的三个方法:一、搜集、记录各种类型的词汇。

二、阅读作品。

三、写作。

二、词汇单位(一)语素1、定义:语素是语言中最小的音义结合体。

是组词的基本结构单位。

例如“书”:shu1,成本的著作。

2、音节表现:现代汉语的语素绝大部分是单音节的,如:天、地、河、土。

也有两个音节的,如:踌躇、荒唐、牢骚、参差、尼龙等。

还有三个或三个以上音节的,如:俱乐部、巧克力、乌鲁木齐、奥林匹克。

双音节语素有一部分是从外语借来的,三音节和三音节语素大都是从外语借来的。

3、确定语素的方法:替代法。

用已知语素来替代,可以为别的语素替代的是语素,例如“蜡烛”中的“蜡”、“烛”。

蜡——蜡烛花烛香烛大烛烛——蜡烛蜡人蜡纸蜡染再如“礼貌”。

注意:1、组成成分都要能替代。

“蝴蝶”、“蜘蛛”。

2、替代中要保持意义一致。

例如“马虎”。

《现代汉语通论》 第五章 语用讲义

《现代汉语通论》 第五章  语用讲义

《现代汉语通论》第五章语用讲义(上)《现代汉语通论》第五章总目:第一节现代汉语语用概述第二节言语行为及其基本准则第三节话语结构第四节语用意义第五节语言要素的修辞第六节语用效果与辞格第七节语体分析第八节病句修改第一节现代汉语语用概述————————————————————————————学习要点:了解对于汉语进行语用分析的意义,认识语用分析的基本原则和主要模式,尤其是对语用意义、话语结构等基本概念更应有深刻的领会,并且能够在分析发话者、受话者以及语境这三种要素的基础上说明语用意义和话语结构的变化。

————————————————————————————————通常认为词汇学探讨的是语言符号与符号所指对象之间的关系,语法学探讨的是语言符号与语言符号之间的关系,而语用学探讨的则是语言符号与符号的使用者之间的关系。

然而使用者不可能在真空中使用语言符号,所以语用学还要探讨语言符号与符号的使用环境——语境之间的关系。

可见,语用分析与语言学领域内其他分析最大的不同之处就在于:它把语言放在语言与人、语言与人使用语言的环境的关系中去考察,因此,无论分析语言的哪一部分,无论用什么方法去分析,只要把被分析的语言现象放到使用过程中,涉及语言的使用者和使用环境,那么所进行的就是语用分析。

所谓语用指的就是人(使用者)在一定环境(语境)中对语言的运用。

一旦采取这样的角度来观察语言,语言在我们的视野中就不再是一个个静态的词、短语和句子,而成了人们在一定的语境中说出和听辨这些词、短语或句子的动态的行为过程。

语言交际的基本单位也就不再是句子,而成了请求、叙述、讲解、提问、命令、威胁等运用语言的行为。

所以语用的分析又称为动态的分析,以区别于孤立地考察语言单位的静态的分析。

一、语用分析的基本原则(一)语用分析的意义现代汉语的语音、词汇和语法,都是语言系统中抽象的语言单位,而不是实际话语中起着交际作用的言语单位。

后者要比前者复杂得多,也丰富得多。

翻译教学语料库的标注及应用_英文_省略_经报道中文翻译及注释语料库_介绍_王惠

翻译教学语料库的标注及应用_英文_省略_经报道中文翻译及注释语料库_介绍_王惠

C o n s t r u c t i o n o f a n O n l i n e P l a t f o r m f o r C o m u t e r a i d e d * 本文为香港城市大学教学发展基金项目 “ - - p / 香港城市 T e a c h i n a n d L e a r n i n o f B i l i n u a l W r i t i n a n d T r a n s l a t i n i n b e t w e e n E n l i s h a n d C h i n e s e( g g g g g g ) ” 大学项目 6 的部分成果 。 0 0 0 3 0 4
·2 4 6·
— —“ 王 惠 朱纯深 翻译教学语料库的标注及应用 — 英文财经报道中文翻译及注释语料库 ” 介绍
。但这些工具在分析实现形式可预测性不强的文 小适中的文本中抽取的语料 ” 因为它们 “ 肯定不能用于深入‘ 分析’ 这 些 特 征, 或将整个文 本特征时作用有限 , ( , 本置于上下文之中研究 ” 同上 ) 使用这些语料库工具的结果只能让语料库主要 “ ( 以概率和统计为手段 ” 王克非 、 黄立波 2 在翻译研究中发挥作用 。 除 0 0 7: 1 0 1) 此之外 , 更深层次的语料标 注 、 分 析 则 需 要 人 工 进 行。可 喜 的 是, 近年来出现一 ) 、 分 析 语 料, 如P 如M 句法标注 些人工附码帮助处 理 、 O S标注( u l t e x t c o r o r a p ( ) 冯志伟 2 等 。 毋庸置疑 , 这 些 标 注 对 翻 译 现 象 的 研 究, 对某一特定文本类 0 0 7 型语言及文体特征的考量 提 供 了 更 为 精 确 有 效 的 考 察 依 据 。 但 是 , 上述工具在 分析和解释方面无能为力 , 而这对于提高翻 提供关于某一翻译现象的系统描述 、 译教学效率 , 特别是教学中对特定翻译现象的集中观察 、 解释与理解以及技巧的 训练至关重要 。 要扩大对应语料库在翻译 教 学 中 的 作 用 , 可行方法之一就是设计一个语料 通过对语料库实行人工标注 , 使语料库增值 。 通过这个系统给语料添 标注系统 , , 加的 “ 解释性 、 语言性 ” 信息 ( 对扩充语料库提供的信息 G a r s i d e e t a l. 1 9 9 7: 2) 量以供翻译教学使用具有决定性意义 。 用于翻译教学的 “ 英文财经报道中文翻译及注释语料库 ” 正是基于此目的创 ‘ 自深深处 ’ 英汉对照版及注释 ” 语料库 ( 的 建的 。 此语料库是 “ Z h u &Y i 2 0 1 0) p 延伸和拓展 。 本文通过介绍该 语 料 库 所 采 用 的 标 注 系 统 和 语 料 抽 取 工 具 , 探讨 特别是语料标注 , 拓宽语料库在翻译教学中的应用 。 如何通过语料库建设 , 2.语料库设计目的 本语料库的设计有两个目的 。 其一 , 秉承 Z 的思路 , 致力于 h u &Y i 2 0 1 0) p( 设计以理论为指导的标注系统 , 建立可用于深度文本分析的标注系统的方法论 ; 其二 , 对前者单一译者 、 单一 ( 文学) 语料来源的模式做出补充, 为本科和硕士翻 译专业的翻译教师提供一个设计案例 , 探讨如何在保证教学质量的前提下 , 为推 动大班教学 、 远程翻译教学和学生自主学习提供可操作平台 。 3.语料库的语料选择 “ 英文财经报道中文翻译及注释语料库 ” 是英汉双语对应语料库 。 所有语料 ( 均选自 《 金融时报 》 的“ 全球经济报道” 栏目2 F i n a n c i a l T i m e s) 0 0 3年中文网站 ) 中的 “ 每日英语 ” 系列 , 并已获得 《 金融时报 》 授权 。 选择的原因如下 : 语料提供 1 随着全球化经济的发展 , 翻译市场日渐兴旺 , 但翻译质 者在业界的名声和地位 : 量良莠不齐 , 而本语料库的建库目的对翻译文本质量提出了较高要求 。《 金融时

第四课-现代汉语语汇市公开课获奖课件省名师示范课获奖课件

第四课-现代汉语语汇市公开课获奖课件省名师示范课获奖课件
③革命 带头 动员 列席
支配关系 前表动作行为,后表受影响、
支配旳事物
④心疼 头疼 眼看 月食
后阐明前 主谓关系
⑤提升 阐明 注定 改良
前表动作,后指出动作成果 补充关系
心疼/头疼 )
生理现象——词组(我今日头疼
心疼/头疼 心理现象——词(他心疼你)
下列复合式合成词从构 造上看是一样吗
脱贫 牵头
花里胡哨、古里古怪、稀里糊涂 2.合成词旳特点:
除了“儿”化音节,都是多音词,意义可拆 3.合成词旳构成方式:
复合式:词根+词根 附加式:词根+词缀 重叠式:同形词根反复
0412
(1)复合式合成词
①朋友 村庄 光荣 反正
并列关系 地位平等,不分轻重主次
②铁路 钢笔 红烧 优点
偏正关系 前描写限制后,前次要后主直 接进入了当代汉语,而当代汉语里新 造旳词极少采用单音节形式。
(二)复音词
在复音词中,尤以双音节词占优势, 这体现了当代汉语语汇发展旳趋势。
二、单纯词和合成词
(一)单纯词 单纯词是由一种语素构成旳词。
1.联绵词 澎湃 ⑴ 双声 窈窕 ⑵ 叠韵 玻璃 ⑶ 非双声叠韵 猩猩 2.叠音词 模特 3.译音词 哗啦 4.拟声词
补充
附加式合成词 前加 后附 嵌入 重叠式合成词
第三节 词旳缩略形式
又称“简称”、“紧缩词”。 (一)提取式 1.提取每个词旳一种语素构成缩略形式
A 指导教师——导师 B 职业学校——职校 C 全国运动会——全运会 D 人民政治协商会议——政协
2.提取各词旳一种语素和共同语素组合 成缩略形式 中年青年——中青年 高档、中档、低档——高中低档 3.提取一种词形成缩略形式 清华大学——清华 省人民政府——省府

现代汉语 词义的聚合——语义

现代汉语 词义的聚合——语义
A B
A=-B B=-A -A=B B=-A 男——女 内政——外交 整体——局部
反义义场类型
2、极性反义义场
处于同一反义义场的两个词,除二者之外,
这个语义场还留又空白,二者之间可以插入 别的成员。
Aห้องสมุดไป่ตู้B
A=-B B=-A -B≠A 大——小 冷——热 前进——倒退
-A≠B 反对——弃权
三、反义义场和反义词
反义义场:两个意义相反或相对的词可以 构成反义义场,这两个词互为反义词。
长——短
手——脚
条件:两个词必须属于同一意义范畴。 反义词是就词与词而言,不是就词与短语 的关系。
反义义场的类型
1、互补反义义场:处于同一反义义场的 两个词,它们分尽了一个共同领域,而不 留下空白。即二者关系是非此即彼。
语义场的层次
语义场的结构是一个有次序的集合,是有 层次的。 母场——子场 上位词——下位词
语义场的种类
类属义场:类属义场的成员同属于一个较大的类。
锅碗瓢盆——厨具语义场
顺序义场:顺序义场的各成员按照某种固定的顺 序排列。
春夏秋冬——季节语义场
关系义场:一般有两个成员组成,二者处于某种 关系的两端,互相对立、互相依靠。
感情色彩语体色彩语法意义理性意义意义的轻重毁坏破坏损坏范围的大小时间期间时期集体和个体词汇词搭配对象不同交换交流语法意义词性方面深入形容词动词形容词突然猛然状语状语形容词副词同义词的作用同义词连用可以加强语势使语意完足三反义义场和反义词反义义场
第四节 词义的聚合——语义场
一、语义场
语义场就是通过不同词之间的对比,根据 它们词义的共同特点或关系划分出来的类。 词义受同一语义场中的其他词的词义制约。

“现代汉语语义词典”的结构及应用

“现代汉语语义词典”的结构及应用

“现代汉语语义词典”的结构及应用
《现代汉语语义词典》是一本权威的汉语词典,主要收录了现代汉语
中的词语及其相关的语义解释和用法。

该词典一般按照词语的拼音顺序进行组织,每个词语的解释通常包括
以下几个方面:
1.词语的基本意义:介绍词语的主要含义和用法。

2.词语的扩展意义:介绍词语在不同语境下的拓展用法和引申意义。

3.词语的近义词和反义词:列举与该词语意思相近或相反的其他词语,帮助读者准确理解词语的语义辨析。

4.词语的常见搭配和固定搭配:提供该词语在常用的搭配中的用法和
搭配方式,使读者能够正确运用词语。

5.词语的用法注意事项:指出词语在使用中需要注意的特殊用法或容
易出错的错误使用。

《现代汉语语义词典》的应用主要有以下几个方面:
1.语义理解:词典详尽的解释帮助读者准确理解词语的意思,避免语
义混淆和误解。

2.语言教学:对于学习者来说,词典提供了词语的用法和搭配,帮助
学习者在语言表达中选择准确的词语,并避免中式英语的问题。

3.翻译和写作:作为翻译工具和写作参考,词典提供了常见的搭配和
用法,帮助读者在翻译和写作中选择合适的词语,丰富表达。

4.语言研究:对于语言学家和研究者来说,词典提供了大量的词语例证和用法解释,帮助他们深入研究和探讨汉语词汇的语义变化和演化。

总之,《现代汉语语义词典》在提供准确的词语解释和用法指导的同时,也能够满足读者在语言学习、翻译和写作等方面的需求,是一本实用的汉语学习和研究工具。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

“现代汉语语义词典”的结构及应用♣王惠 俞士汶詹卫东(北京大学计算语言学研究所)(北京大学中文系)whui@; yusw@; zwd@摘要:“现代汉语语义词典”是一部面向汉英机器翻译的语言知识库,它以数据库文件形式收录了6.8万余条现代汉语的实词,不仅给出了每个词语所属的词类、语义类,而且以义项为单位详细描述了它们的各种语义搭配限制。

目的是为计算机语义自动分析,词义消歧等任务提供强有力的支持。

本文介绍这部语义词典的结构、内容,并且以实例说明这部词典可有效地解决翻译系统中的词汇歧义问题。

关键词:语义词典 语义类 词义消歧 计算词典学 中文信息处理The Semantic Knowledge-base of Contemporary Chineseand its Applications in MTWang Hu i1, Yu Shiwen1, Zhan Weidong21(Institute of Computational Linguistics, Peking University, Beijing 100871, China)2(Dept. of Chinese Language and Literature, Peking University, Beijing 100871, China)whui@; yusw@; zwd@AbstractThe Semantic Knowledge-base of Contemporary Chinese (SKCC) is a machine-readable dictionary, which provides rich semantic information such as a thesaurus, semantic collocation, and parts-of-speech (POS) of 68,000 Chinese words. The paper introduces the outline of SKCC, and indicates that it is effective for word sense disambiguation in MT system and is likely to be important for general Chinese NLP.Key words:Semantic knowledge-base, Chinese thesaurus, computational lexicography, word sense disambiguation(WSD), Chinese language information processing♣本研究得到国家973重点基础研究项目“面向新闻领域的汉英机器翻译系统”(项目号:G1998030507-4)与“面向中文信息处理的现代汉语动词论旨结构系统和汉语词语语义分类层级系统研究”(项目号:G1998030507-1)的支持。

1. 开发历程在机器翻译系统及其它自然语言处理系统中,通常都有一部包括语义信息的电子词典。

北京大学计算语言学研究所与中科院计算所自1994年联合开发“汉英机器翻译模型系统”开始,就着手研制为汉英机器翻译服务的“现代汉语语义词典”,目的是在语法分析的基础上,为计算机提供更深入的语义信息。

1996年至1998年,双方共同承担了国家863高科技项目“通用机器翻译开发平台和汉英机器翻译系统”课题(项目编号:863-306-03-06-2)。

作为该课题的一个重要组成部分,“现代汉语语义词典”进入到大规模开发阶段,并取得了重要的阶段性成果,完成了4.9万名词、动词、形容词的语义分类,并在配价理论的基础上,简要描述了其语义搭配限制[2]。

这些语义信息在汉英机器翻译系统中,为词义和句法歧义的消解提供了强有力的支持。

从2001年开始,“现代汉语语义词典”的再开发受到了国家973重点基础研究发展规划项目“面向新闻领域的汉英机器翻译系统”和“面向中文信息处理的现代汉语动词论旨结构系统和汉语词语语义分类层级系统研究”的支持,由北京大学计算语言学研究所和中文系合作进行,对词语的语义分类以及配价属性描述重新进行填写或修订。

在双方的积极努力下,项目进展得非常顺利,不仅使词典的规模有了较大幅度的扩充,而且质量也有了显著的提高。

目前,正在一个具体的机器翻译系统中发挥着重要作用。

2.内容概要2.1 规模与结构“现代汉语语义词典”收录了66,539个通用领域内的实词语,采用Foxpro 6.0实现,共有12个数据库,其中包含全部词语的总库1个,每类词语各建一库,计11个。

库名词条属性字段名词 3752215时间词 56715处所词 18515方位词 20415代词 23615动词 2114216形容词 382715区别词 75315状态词 99715副词 99711数词 10911总库665398总库与各类词库可以通过“词语、词类、同形、义项”这4个关键字段进行链接,从而使13个库文件构成有上下位继承关系的“树”,子结点可继承父结点的全部信息。

每个库文件都详细刻画了词语及其语义属性的二维关系。

总库中包括词语、拼音、同形、义项、语义类、词类、子类、兼类等8个字段。

每类词的特有属性填在各类词库中,如名词库设15个属性字段,动词库设16个属性字段,如此等等。

词语词类 同形 义项 语义类配价数参照体对象WORD EcatN 老虎n 动物 0 tigerN 腿n 1 1 生物构件 1 人/动物 legN 腿n 2 2 非生物构件 1 用具leg意见n 1 1 认知 2 人实体|抽象物view N意见n 2 2 认知 2 人人|事件 objection N表1 名词库部分属性字段2.2 词语的语义分类“现代汉语语义词典”的一个突出特点就是其语义分类的深度与广度取决于语法分析的需要,而非基于语义常识。

经过4年来的应用检验与研究,我们发现,对于汉语信息处理来说,这种分类法是很有前途和实用价值的。

为了更彻底地贯彻这个原则,同时便于与Wordnet[1]和“中文概念辞书(CCD)”[4]兼容,与“知网(hownet)”[5]、《同义词词林》等已有的多种语义词典实现资源共享,我们在参照现有各家语义类的基础上,针对汉英机器翻译的需要,对语义词典(1998版)的原分类体系作了较大的调整。

·名词上下位关系更加系统化:首先,将具体事物、抽象事物与过程、时间、空间并列为5大类;然后再逐层细分:具体事物分为生物、非生物2类,生物里再把人与动物、植物、微生物相并列,非生物中则进一步区分开人工物、自然物、排泄物和外形。

然后,根据Wordnet与“知网”中的填写内容,补充了一些较低层的名词小类,如“人工物”的下位概念(“建筑物、衣物、食物、药物、钱财、票据、证书”等)。

·把Wordnet中的动词分类借鉴过来,但根据汉语的实际作了相应改造;·形容词的分类更加细化,由原来的7类发展成为现在的5大类29小类,与名词的分类互相照应,从而可以更细致地刻画形名搭配关系。

总的来说,新的语义分类更趋合理,其特点是对名词的分类相对较细,动词、形容词、数词、副词的分类较粗,只要能揭示出与名词性成分、动词性组合成分的不同组合类型即可。

目前我们已实际完成了6.8万词语的语义类划分与标注。

具体分类体系如下:(1)名词(包括时间词、处所词、方位词)1 具体事物(entity)1.1生物(organism)1.1.1人(person)1.1.1.1个人(individual)1.1.1.1.1职业(profession):教师秘书会计医生1.1.1.1.2身份(identity):华侨外行健将模范1.1.1.1.3关系(relation):父亲阿姨长辈朋友1.1.1.1.4姓名(name):爱因斯坦毛泽东鲁迅1.1.1.2团体(group)1.1.1.1.1机构(organization):工厂医院商店剧团1.1.1.1.2人群(society):人民委员会少先队团伙1.1.2动物(animal)1.1.2.1 兽(beast):狗猪牛羊老虎豹子狐狸1.1.2.2 鸟(bird):鸡鸭麻雀杜鹃1.1.2.3 鱼(fish):鲤鱼河豚鲸泥鳅1.1.2.4 昆虫(insect):蚯蚓知了蟑螂1.1.2.5 爬行动物(reptile):青蛙乌龟甲鱼蛇1.1.3植物(plant):树花草牡丹芍药1.1.3.1 树(tree):白杨水杉芭蕉1.1.3.2 草(grass):狗尾巴草含羞草蒲公英1.1.3.3 花(flower):牡丹芍药杜鹃映山红1.1.3.4 庄稼(crop):蔬菜小麦高粱棉花1.1.4微生物(microbe):细菌病毒霉菌1.2 非生物(object)1.2.1 人工物(artifact)1.2.1.1建筑物(building):别墅礼堂会议室水库庙1.2.1.2衣物(clothes):服装外套衬衫裙子帽子1.2.1.3食物(food):面包牛奶菜米饭饮料1.2.1.4药物(drug):药片阿斯匹林酒精镇定剂1.2.1.5创作物(works):论文书杂志文章油画电影1.2.1.6计算机软件(software):操作系统数据库程序软件1.2.1.7钱财(asset):财产钱资金报酬罚款美元利息1.2.1.9票据(bill):发票单据汇票支票包裹单1.2.1.10证书(certificate):结婚证执照毕业证驾驶证1.2.1.11符号(symbol):签名路标箭头句号1.2.1.12材料(material):木材钢铁煤炭玻璃水泥1.2.1.13器具(instrument)1.2.1.13.1用具(tool):剪子刀子钉子拖把改锥1.2.1.13.2交通工具(vehicle):车船飞机自行车1.2.1.13.3武器(weapon):大炮机关枪鱼雷1.2.1.13.4家具(furniture):桌子椅子沙发1.2.1.13.5乐器(musical-instrument):钢琴吉他鼓1.2.1.13.6电器(electricity):电视空调电冰箱1.2.1.13.7文具(stationery):钢笔橡皮尺子1.2.1.13.8运动器械(sports- instrument):足球单杠1.2.2自然物(natural object)1.2.2.1天体(celestial body):太阳月亮流星星星1.2.2.2气象(weather):云彩虹晚霞1.2.2.3地理(geography)1.2.2.3.1 地表物(land):原野沙漠山山洞陆地1.2.2.3.2 水域物(water):江河湖海河流1.1.2.2.4 矿物(mineral):煤矿原油铁矿1.1.2.2.5 元素(element):金银铜铁1.1.2.2.6 基本物质(substance):水土灰1.2.3 排泄物(excrement):汗尿粪便奶水眼泪1.2.4 外形(shape):粉末长方形圆窟窿孔洞泡1.3 构件(part)1.3.1 身体构件(body-part):头脸鼻子嘴耳朵头发血液骨头1.3.2 非生物构件(object-part):梁屋檐车闸车筐2 抽象事物(abstraction)2.1属性(attribute)2.1.1量化属性(measurable):体积面积重量质量价格2.1.2模糊属性2.1.2.1 人性(property_of_human):胆量勇气脾气作风2.1.2.2 事性(description_of_event):境况形势状态环节2.1.2.3 物性(property_of_object):性能效用品种式样2.1.3 颜色(color):黑色白色浅色素色2.2信息(information):话言语信件口信密码声明借口2.3领域 (field ):社会经济法律科学艺术2.4法规(rule):法律条约协议制度规章合同协议条文2.5生理(physiological_state):瘟疫疾病炎症艾滋病2.5心理特征(psychol feature)2.5.1情感(feelings):态度感情爱情2.5.2意识(cognition):意图幻想兴趣主意见解2.6动机(motivation):目的原因理由3 过程(process)3.1事件(event):学潮球赛晚会课早餐战争火灾3.2自然现象(natural phenomenon)3.2.1 可视现象(visible phenomenon):火电光风雨3.2.2 可听现象(audible phenomenon):声音雷鸣风暴4 时间(time)4.1 绝对时间(specific time):宋朝三国清代4.2 相对时间(relative time):昨天当代古代今天5 空间(space)5.1处所(location):浙江西湖黄山中国亚洲5.2方位(direction):东南前面之间途中高空(2)形容词(包括区别词、状态词)1 事性值:紧急 突然 困难 容易 错误 费时2 物性值2.1 量化属性值(measurable value):2.1.1 浓度(concentration):浓稀薄2.1.2 温度(temperature):热冷凉爽2.1.3 速度(speed):快慢2.1.4 长度(length):长短2.1.5 高度(height):高矮低2.1.6 宽度(width):宽窄2.1.7 深度(depth):深浅2.1.8 厚度(thickness):厚薄2.1.9 硬度(rigidity):硬软2.1.10湿度(humidity):潮湿湿润干燥2.1.11粗细(degree of finish):粗细2.1.12松紧(degree of tightness):松紧2.1.13大小(size):大中小2.1.14价值(value):贵便宜2.2 模糊属性值(unmeasurable value)2.2.1视感(vision):亮醒目清晰混浊2.2.2触感(tactility):紧松粗糙滑柔2.2.3音质(tone):响亮低沉刺耳2.2.4味道(taste):酸甜苦辣可口2.2.5 性质(quality):新旧真假好坏强弱2.2.6内容(content):空洞晦涩清楚浅显2.2.7外形(shape):方圆尖2.3颜色(color):红黄蓝绿鲜艳3 人性值3.1 年龄(age):年轻幼小老3.2品格(character):善良博学幼稚优雅3.3 关系(relation):亲密疏远热情冷淡3.4境况(condition):繁忙贫穷危险疲劳4 空间值4.1 一维值:远 近4.2 二维值:平 斜 弯4.2 三维值:拥挤 杂乱 整齐 满 壮阔5 时间值:古老 久远 短暂 早 晚(3)动词1 静态关系(state):是有等于包括2心理活动(emotion/ cognition):喜欢尊敬反对同意怀疑思考判断3动态行为(event)3.1 变化(change):死病下降长高缩小变暗3.2 气象(weather):下雨刮风打雷起雾3.3 身体活动(bodily care and functions):蹬跳推笑咳嗽游泳3.4 五官感觉(perception):看见听到闻着品尝3.5 消耗(consumption):吃喝饮3.6 位移(motion):跑走散步飞过来回去拉来3.7 创造(creation):制作画炒写创建修筑3.8 接触(contact):触摸撞击打中系挖掘3.9 领属转移(possession):买卖赠送给转让借3.10信息交流(communication):告诉询问请求转达叮嘱说3.11比赛(competition):竞赛赛跑打仗摔跤辩论3.12社会活动(social behavior):改革调价开会联欢3.13 其他行为(other event)(4)副词1程度(degree):很挺太顶更最极十分非常稍稍微略微2范围(range):都也总共一共总共统统只就光仅仅仅3时间(time):正刚刚就先曾经已经终于立刻马上永远4处所(location):到处处处暗中当场当面5频度(frequency):常常常时常又再还重新重6方式(manner):渐渐逐渐挨次挨个逆时针慢慢7否定(negation):不没有没未莫休勿别8 语气(modality):却倒竟偏偏都简直索性幸亏难道究竟(5)数词1基数(cardinal number)1.1系数:一二两三五六七八九几1.2位数:十、百、千、万、亿、万万2序数(ordinal number):第一第二第十3概数(amount):多半多少若干很多许多好多好几好些无数4助数:又来左右2.3 词语的语义属性描写为了进一步提高机器翻译系统的性能,本词典在语义分类的基础上,进一步详细刻画了每个词的配价数以及其在上下文中的语义搭配限制。

相关文档
最新文档