意念词典·语义词典·机器翻译
NLP 的四大智慧支柱

NLP 的四大智慧支柱NLP(自然语言处理)的四大智慧支柱自然语言处理(Natural Language Processing,简称NLP)是计算机科学与人工智能领域的一个重要分支,旨在使计算机能够理解、处理和生成自然语言。
NLP 的发展已经取得了显著的进展,其中四大智慧支柱为语音识别、文本分类、情感分析和机器翻译。
一、语音识别语音识别是NLP的重要组成部分,它使得计算机能够理解和转化人类的语音输入。
通过使用语音识别技术,计算机可以将人类的语音转换为文本形式,从而实现语音交互和语音命令。
例如,智能助理如Siri和Alexa就是通过语音识别技术来理解用户的指令并作出相应的回应。
语音识别的关键技术包括声学模型、语言模型和解码算法等。
二、文本分类文本分类是指将大量的文本数据按照预先设定的类别进行分类的任务。
通过文本分类技术,计算机可以自动将文本数据归类到不同的类别中,从而实现文本的自动分类和组织。
文本分类广泛应用于新闻分类、情感分析、垃圾邮件过滤等领域。
文本分类的关键技术包括特征提取、特征选择和分类器构建等。
三、情感分析情感分析是指通过NLP技术对文本中的情感进行分析和识别的任务。
情感分析可以帮助人们了解文本中的情感倾向和情感态度,从而对文本进行情感分类、情感评分等。
情感分析在社交媒体分析、舆情监控、产品评论分析等领域具有重要的应用价值。
情感分析的关键技术包括情感词典构建、情感特征提取和情感分类算法等。
四、机器翻译机器翻译是指通过计算机自动将一种语言的文本翻译成另一种语言的任务。
机器翻译的目标是实现不同语言之间的无缝沟通和交流。
机器翻译技术可以帮助人们快速准确地理解和翻译外语文本,对于跨语言交流和跨文化交流具有重要的意义。
机器翻译的关键技术包括语言模型、翻译模型和解码算法等。
总结:NLP的四大智慧支柱分别是语音识别、文本分类、情感分析和机器翻译。
语音识别使得计算机能够理解和转化人类的语音输入;文本分类实现了对大量文本数据的自动分类和组织;情感分析帮助人们了解文本中的情感倾向和情感态度;机器翻译实现了不同语言之间的自动翻译。
机器翻译

机器翻译1 概述机器翻译(machine translation),又称为自动翻译,是利用计算机把一种自然源语言转变为另一种自然目标语言的过程,一般指自然语言之间句子和全文的翻译。
它是自然语言处理(Natural Language Processing)的一个分支,与计算语言学(Computational Linguistics )、自然语言理解( Natural Language Understanding)之间存在着密不可分的关系。
2 国内外现状机器翻译思想的萌芽关于用机器来进行语言翻译的想法,远在古希腊时代就有人提出过了。
在17世纪,一些有识之士提出了采用机器词典来克服语言障碍的想法。
笛卡(Descartes)和莱布尼兹(Leibniz)都试图在统一的数字代码的基础上来编写词典。
在17世纪中叶,贝克(Cave Beck)、基尔施(Athanasius Kircher)和贝希尔(Johann JoachimBecher)等人都出版过这类的词典。
由此开展了关于“普遍语言”的运动。
维尔金斯(JohnWilkins)在《关于真实符号和哲学语言的论文》(An Essay towards a Real Character andPhilosophical Language, 1668)中提出的中介语(Interlingua)是这方面最著名的成果,这种中介语的设计试图将世界上所有的概念和实体都加以分类和编码,有规则地列出并描述所有的概念和实体,并根据它们各自的特点和性质,给予不同的记号和名称。
本世纪三十年代之初,亚美尼亚裔的法国工程师阿尔楚尼(G.B. Artsouni)提出了用机器来进行语言翻译的想法,并在1933年7月22日获得了一项“翻译机”的专利,叫做“机械脑”(mechanical brain)。
这种机械脑的存储装置可以容纳数千个字元,通过键盘后面的宽纸带,进行资料的检索。
阿尔楚尼认为它可以应用来记录火车时刻表和银行的帐户,尤其适合于作机器词典。
大学实用翻译教程(英汉双向 )第三章 计算机辅助翻译

1.2计算机辅助翻译的发展前景展望
• 根据前面对机器翻译的介绍可以看出,自然语言的复杂性决定了机器翻译 技术发展的困难性。计算机语言学家提出了各种各样的机器翻译理论,但 目前为止还没有哪种理论能够有效的解决所有问题。但是,机器翻译系统 的应用领域正在发生变化。人们正在尝试将机译技术结合到信息访问、信 息提取和自动文摘中。这类跨语言应用在全球范围内越来越引起人们的兴 趣。未来对于口语的翻译也是市场迫切需求的,但尽管基于某些方面的需 求,机器翻译的发展方向更加多元化,但无论从实际应用角度还是从理论 研究角度来看,全自动的话语翻译还是很难实现的。当然,虽然机器翻译 的发展有诸多阻碍,但仍然有更多的发展希望。目前,单语语料库加工技 术以及应用在计算语言学领域内取得的成功,使建立双语或多语语料库并 进行多层次的加工作为大规模的跨语言资源成为研究的焦点之一。另外, 大规模的语料库适合于统计方法的应用,通过统计来自动进行知识获取, 有助于克服自然语言处理中知识获取的瓶颈。把机器学习方法应用到机器 翻译中,可以帮众系统实现在线学习功能,最终建立主动的智能翻译服务 也是机器翻译的发展方向之一。
1.1计算机辅助翻译的发展历程
• “机器翻译”的概念可以追溯到20世纪30年代,40-50年代初经历 了早期的尝试阶段,当时,大多数从事手工翻译人士对于“利用计 算机进行翻译”不以为然,他们根本就不相信翻译会机械化,少数 人则或多或少有一点担心,害怕有一天机器会把他们取而代之。 • 50—60年代中期学界对于“机器翻译”持高度乐观的态度。 Systran翻译软件将“机器翻译”定义为利用计算机软件把文本内 容从一种自然语言转换成另一种自然语言,这个定义就是说“机器 翻译”是利用语言结构、规律和把原文(the source language) 的语言结构转换成译文(the target language)的语言结构。“机器 翻译”这一想法产生的时间正是结构主义语言学的观点盛行时期。 由于人类对语言结构规律的研究越发深入,语言学家为翻译找到了 更多的理论依据作为支撑,从而给翻译加上了科学主义的色彩。奈 达、巴尔胡达罗夫以及彼得· 纽马克等人的翻译观都是从结构主义 理论开始的。(张治中,俞可怀,2002:54-58)结构主义者认 为在各种复杂的表面现象的下都有着一种普遍性的规律,这些规律 就是结构,人们通过分割归并作品的各种结构就可弄清语言信息变 成文艺作品的奥秘。(吕俊, 2001:96-111)
机器翻译与人工翻译的比较与展望

2512020年36期总第528期ENGLISH ON CAMPUS机器翻译与人工翻译的比较与展望文/张 敏现的频率,选取频率最高者进行译文的输出。
这一翻译模式劣势在于它忽略了语言的灵活性以及语境的重要性。
神经网络语言模型。
该模式与以往的翻译模式有所区别,其基本思路是运用端到端的神经网络实现自然语言间的自动转换。
就目前状况来看,其译文质量要远高于前几种翻译模式。
二、机器翻译与人工翻译的比较1.共性比较。
(1)本质相同。
无论是机器翻译还是人工翻译,二者皆具有相同的本质,那就是将一种语言所传递的信息和感受通过另一种语言向目的语读者进行传达,并尽可能地让目的语读者获得与源语读者相同的信息与感受。
(2)目的相同。
机器翻译与人工翻译殊途同归,无非是希望能够消除或是减少国与国、人与人之间沟通交流的障碍和壁垒,最终达到方便于人,促进社会发展的作用。
2.差异比较。
(1)对于语境、文化差异的处理。
就非文学文本而言,语境对词语的选择有着十分重要的影响。
人工翻译可以通过对语境的解读,对平行文本的参照选择最恰当的用词,而机器翻译目前还做不到对于语境的深入分析,这也是机器翻译质量屡遭诟病的原因之一。
就文学文本而言,翻译不仅仅是简单地将一种语言转换为另一种语言,还是要将语言所承载的文化一并展示给读者。
面对文学作品中涉及的种种文化差异,例如各个国家的历史传统、神话故事、民族特色、民间习俗等,机器翻译目前的引言世界各国交流中出现的语言障碍逐渐凸显,而翻译作为解决这一障碍的桥梁,其需求与地位不言而喻。
然而日渐庞大的翻译市场,与为数不多的合格译者形成了鲜明的对比。
近年来,机器翻译的出现和发展使得这一紧张局面得到了很大程度上的缓解,机器翻译也因此备受大众关注。
本文旨在对机器翻译和人工翻译进行简要比较,而由于人工翻译历史悠久,大众对人工翻译的认识也比较普遍,因此在此不作赘述,只重点对人们还不是十分了解的机器翻译作简单介绍。
一、机器翻译1.机器翻译定义。
机器翻译中的语义理解

机器翻译中的语义理解机器翻译(Machine Translation,MT)是指利用计算机技术将一种自然语言的文本自动翻译成另一种自然语言的过程。
随着人工智能技术的快速发展,机器翻译在各个领域得到了广泛应用。
然而,要实现高质量的机器翻译仍然面临着许多挑战,其中之一就是语义理解。
语义理解是指理解文本中隐含的意义和信息,并将其转化为计算机可以处理的形式。
在机器翻译中,语义理解起着至关重要的作用。
传统的基于规则和统计方法的机器翻译系统主要关注句子表面结构和单词之间的对应关系,而忽视了句子中蕴含的深层次语义信息。
这导致了许多常见问题,如歧义消解、指代消解、上下文处理等。
为了克服这些问题,近年来出现了基于神经网络和深度学习方法的神经机器翻译(Neural Machine Translation,NMT)系统。
NMT系统通过学习大量平行语料库中源语言和目标语言之间对应关系来实现翻译过程。
与传统方法不同,NMT系统可以更好地捕捉句子的语义信息,从而提高翻译质量。
在NMT系统中,语义理解的关键在于如何将源语言句子的语义信息转化为机器可以理解的表示。
一种常用的方法是使用编码器-解码器框架。
编码器将源语言句子编码成一个固定长度的向量表示,解码器则将该向量表示转化为目标语言句子。
编码器可以是循环神经网络(Recurrent Neural Network,RNN)或者是卷积神经网络(Convolutional Neural Network,CNN)。
在编码阶段,RNN通过逐个处理源语言句子中的单词,并通过隐藏状态传递上下文信息。
而CNN则通过卷积和池化操作来提取局部特征,并利用堆叠多个卷积层来获取更高层次的特征表示。
这些方法都能够有效地捕捉到源语言句子中单词之间的上下文关系和依赖关系。
然而,在翻译过程中,仅仅依靠单一向量表示可能无法完全表达源语言句子中丰富多样的语义信息。
为了进一步提高翻译质量,研究者们提出了一系列的改进方法。
机器翻译中的命名实体识别和实体关系抽取方法

机器翻译中的命名实体识别和实体关系抽取方法机器翻译(Machine Translation, MT)是一项涉及自然语言处理(Natural Language Processing, NLP)和人工智能(Artificial Intelligence, AI)的重要技术,旨在将源语言文本自动翻译成目标语言文本。
命名实体识别(Named Entity Recognition, NER)和实体关系抽取(Entity Relationship Extraction)是机器翻译中的两个关键任务,本文将详细介绍这两个方法及其在机器翻译中的应用。
一、命名实体识别(Named Entity Recognition, NER)命名实体识别是一种识别文本中特定类别实体(如人名、地名、组织机构名等)的技术。
NER在机器翻译中具有重要意义,因为命名实体在句子中往往具有特殊的语义和语法作用,对翻译结果起到重要影响。
1.传统方法传统的命名实体识别方法主要基于规则和词典匹配。
规则匹配方法依赖于手工编写的规则来识别命名实体,例如,利用正则表达式来匹配人名的特定模式。
词典匹配方法则利用已有的命名实体词典,通过查找词典中的实体词来识别命名实体。
这些方法在一定程度上能够识别命名实体,但对于未知的实体和词义消歧等问题表现不佳。
2.基于机器学习的方法随着机器学习的发展,基于机器学习的命名实体识别方法逐渐兴起。
常用的机器学习方法包括:最大熵(Maximum Entropy)、支持向量机(Support Vector Machine)、条件随机场(Conditional Random Field)等。
这些方法通过在标注数据上进行训练,学习到命名实体识别的模式和规律,并能够识别未知的实体。
3.深度学习方法近年来,深度学习方法在命名实体识别中逐渐崭露头角。
其中,基于循环神经网络(Recurrent Neural Network, RNN)的模型如长短时记忆网络(Long Short-Term Memory, LSTM)和门控循环单元(GatedRecurrent Unit, GRU)等,以及基于卷积神经网络(Convolutional Neural Network, CNN)的模型在命名实体识别任务上表现出色。
“现代汉语语义词典”的结构及应用

2006 年第 1 期
王 惠等 “: 现代汉语语义词典”的结构及应用
1 35
一 前 言
在机器翻译系统及其他自然语言处理系统中 ,提供更全面 、深入的语义信息 ,我们应充分吸收现有的研究成果 ,在语
法知识库的基础上构建语义知识库 。不仅要进行系统的语义分类 ,而且要对词义组合信息加
1. 名词 (Noun) 111 具体事物 (entity) 11111 生物 (organism) 1111111 人 (person) 111111111 个人 (individual) :职业 身份 关系 姓名 111111112 团体 (group) :机构 人群 1111112 动物 (animal) :兽 鸟 鱼 昆虫 爬行动物 1111113 植物 (plant) :树 草 花 庄稼 1111114 微生物 (microbe) :细菌 病毒 霉菌 11112 非生物 (object) 1111211 人工物 (artifact) :建筑物 衣物 食物 药物 创作物 计算机软件 钱财
意见 n
2
2
认知
2
人
人| 事件
objection
N
(二) 词语的语义分类 国内外对汉语语义分类体系的研究已有不少成果 ,但由于各家分类体系的目的及应用范
围不同 ,对同一事物可能有不同的定义与归类 。如“动物”在一个语义体系中分为“兽类 、鸟类 、
13 6
语言文字应用
2006 年第 1 期
源共享 ,我们在参照现有各家语义类的基础上 ,针对汉英机器翻译的需要 ,对语义词典 (1998
版) 的原分类体系作了较大的调整 。总的来说 ,新的语义分类更趋合理 ,其特点是对名词的分
类相对较细 ,动词 、形容词的分类较粗 ,只要能揭示出与名词性成分 、动词性组合成分的不同组 合类型即可 。目前我们已实际完成了 616 万词语的语义类划分与标注 。具体分类体系如下 :
中文语义词库

中文语义词库中文语义词库是一种用于存储和查询中文词汇的数据库,它包含了大量的中文词汇及其相关的语义信息。
这些信息可以帮助计算机理解和处理中文语言,提供语义分析、自然语言处理等功能。
在本篇文章中,我将介绍中文语义词库的基本概念、应用场景以及相关的技术和发展趋势。
一、中文语义词库的基本概念中文语义词库是由大量中文词汇及其相关的语义信息组成的数据库。
它可以提供词汇的含义、词性、用法、搭配等信息,帮助计算机理解和处理中文语言。
中文语义词库通常包括词典、词汇分类体系、语义关系等内容,通过这些信息,可以实现中文文本的自动分词、词性标注、语义分析等功能。
中文语义词库在自然语言处理、信息检索、机器翻译等领域有着广泛的应用。
在自然语言处理中,中文语义词库可以用于词性标注、句法分析、语义角色标注等任务,提高计算机对中文语言的理解能力。
在信息检索中,中文语义词库可以用于相关性排序、查询扩展等功能,提高搜索结果的准确性和覆盖率。
在机器翻译中,中文语义词库可以提供词汇的对应关系和翻译规则,辅助机器进行翻译。
三、中文语义词库的技术和发展趋势中文语义词库的构建和维护是一个复杂而庞大的工程。
目前,中文语义词库的构建主要依靠人工标注和自动化处理两种方式。
人工标注是一种准确而繁琐的方式,需要专业人员对大量的中文词汇进行标注,但可以保证标注结果的准确性。
自动化处理则是利用计算机算法对中文文本进行分析和处理,可以快速构建大规模的中文语义词库,但准确性可能有所损失。
随着人工智能和自然语言处理技术的不断发展,中文语义词库的构建和应用也在不断演进。
未来的中文语义词库可能会更加精准和全面,涵盖更多的词汇和语义信息。
同时,中文语义词库的应用也会更加广泛和深入,涉及到更多的领域和场景,如智能助手、智能客服、智能翻译等。
中文语义词库的发展将进一步推动中文自然语言处理技术的进步,为人们提供更好的中文语言服务。
中文语义词库是一种重要的中文词汇数据库,可以帮助计算机理解和处理中文语言。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
意念词典·语义词典·机器翻译易绵竹薛恩奎/解放军外国语学院提要词典或词库建设是研制开发自然语言处理系统的一项重要基础性工程,它区别于纸版辞书的特征是能存放在计算机系统中供语言信息处理程序使用,它一般以CD—ROM(Compact Disc—Read Only Memory高密度盘只读存储器)为介质,登录构成句子的词汇单位所负载的词法信息、句法信息、语用信息、概念信息及对译信息,这就是所谓的机器可读词典(Machine Readable Dictionary,MRD)或电子词典。
本文将讨论意念词典、语义词典的性质和编纂原则以及它们在语言信息处理中的作用。
关键词意念词典语义词典电子词典机器翻译1. 电子词典是机器翻译系统工程化的一个重要方面据有关文献记载,前苏联工程师П.П.Троянский首次提出了机器翻译设想。
1933年9月5日,他在莫斯科登记一项专利,其内容是要求保护“制造一台在从一种语言翻译成另一种语言或多种语言时能选择和打印词汇的机器”的专利,这实际上是一台查字典的机器,其思想已经使计算机介入了语言翻译环节。
(ЭСЮФ 1984:214;吴蔚天等1994:224)1946年当世界上第一台电子计算机问世之时,就有人考虑将它应用到语言学研究中,并由此产生了“计算语言学”这一边缘性交叉学科。
但是由于受计算机功能和程序设计环境上的制约,当时只能做词条索引及词语系统等方面的工作。
1949年,美国工程师W.Weaver(韦弗)提出使用计算机可能“解决世界范围内的翻译问题”,其主要方法也是“查字典”:先为源语言中的每一个词查出一个目标语言中的等价词,再按照目标语言的语法规则来编排每一个词,从而达到翻译的目的。
(林尧瑞等 1996:305)可见,词典在机器翻译的原初设想中占据重要地位。
在计算语言学文献中,电子词典亦称自动词典或机器词典,它被认为是语言工程的支柱和基石,构建信息含量大、功能齐全的电子词典应当成为民族语言现代化的一项基本建设。
冯志伟先生正确指出:“机器翻译系统的基本信息都来自机器词典,语法语义规则利用来自机器词典中的各种静态信息,运算出表示话语语义特征的各种动态信息来。
因此,我们可以说,机器词典是机器翻译的基础,没有好的机器词典,机器翻译就等于做无米之炊,是根本无法进行的。
近年来,,机器词典的研制成为一种专门学问,叫做‘电子词典’(electronic dictionary)。
电子词典是机器翻译系统工程化的一个重要方面。
”(冯志伟1994:231)电子词典是服务于机器翻译的知识库(лингвистическаябазазнаний)的重要构件之一(另一重要构件是语法规则库),它构造的是知识库而不是数据库。
电子词典的词条是具有完整意义的单词所代表的简单概念或词素(simple concept or lexeme)和具有完整意义的非自由短语(固定词组或句子)所代表的复合概念或句素(complex concept or phraseme/syntaxeme),而由这些概念所形成的层级化、秩序化的语义关系网络,能够充分揭示中外语言单位之间的内在逻辑联系,为计算机理解词义、句义及篇章义奠定基础。
(姚天顺等1995:215 216)众所周知,机器翻译的逻辑过程通常分为分析、转换和生成3个阶段,而对词汇的处理则贯穿机器翻译的全过程。
在分析过程中,通过设置一定的语义限制,以便于从源语言一个词的多个义项中选择一个正确的词义,亦即排除词汇歧义:在生成过程中,源语言一个词义往往可用目标语言不同的词来表达,如何选择一个符合目标语言表达习惯的等价词则是选词模块的主要工作:而在转换过程中,主要涉及两种语言词汇的转换和语言表达结构的转换。
2. 意念词典的性质及编纂原则2.1 什么是意念词典确定于计算机语言信息处理的总词表或总词库,实际上就是构造某种语言的义类词典(тезаурс),而义类词典亦称意念词典或概念词典(идеологический,идеографическийилиюнцептуальныйсловари)И.М.Кобозева将义类词典确定为语言内容平面聚合关系结构的模式(тезаурускакмодельпарадигматическойструктруыпланасодержанияязыка),并把它看作该语言的语义场系统。
(И.M.Кобозева 2000:123 124) 在各类辞书中,对义类词典或意念词典的译义大同小异,下面试列几条:(1)ТЕЗАУРУС(отгреч.thesauros-сокровище,сокровищница)— 1)словарь,вк-роммаксимальнополнопредставленывсесловаязыкасисчерпывающимпереченемпримеровихупореблениявконтекстах;2)идеографичекийсловарь,вк-ромпоказанысемантическиеотношения(родо-видовые,синонимическиеидр.)междулексическимиединицами.(ЛЭС 1990:506)(2)ТЕЗАУРУС—идеографическийсловарь,вкоторомпоказанысемантическиеотношениямеждуегоединицами.Структунойосновойтезаурусаявляетсяиерархическаясистемапонятийконкретнойпредметнойобласти.(ПЯ1996:13)(3)ТЕЗАУРУС…винформатике—полныйсистематизированныйнаборданныхокакой-л.областизнания,позволяющийчеловекуиливычислительноймашниевнейориентироваться.(ССИС 1992:597-598)(4)ТЕЗАУРУС(спец.)— 1)словарьязыка,ставящийзадачуполногоотражениявсейеголексики;2)словарьилисводданных,полностьюохватывающийтермины,понятиякакой-н.специальнойсферы.(ТСРЯ 1992:819)(5)THESAURUS — dictionary of words and phrases grouped together acoording to similarities in their meanings.同义语字汇;同义语字典。
(OALDCECT 1984:1223) 由上面所引这些译义可以推断,意念词典旨在揭示词汇单位之间各种语义关系(种—属关系、同义关系等),以构成语言知识库的语义描写系统,并使之与某个具体知识领域的概念层级系统对接起来,为人机通用的知识信息处理服务。
2.2 意念词典的编纂原则与一般详解的词典并不同,意念词典的词条不是按字母顺序排列,而是按一定主题原则(тематическийпринцип)排列。
从这个角度看,编纂意念词典应当尽可能全面地搜罗有关语言中概念相近、语义相关的所有词汇及短语,并将它们按照一定的主题原则分门别类,也就把这些词汇和短语表示的不同意义分成若干概念类目,用特定的符号代码标示出来,分别填入不同的工作单。
这样,意念词典的词条是由词典和短语所代表的概念类目(таксон),而概念类目实际上就是语义场。
确切地讲,意念词典输入的是“意念”(идеи),即概念范畴,而输出的却是表达该概念范畴的词汇或短语。
原则上,一部标准的意念(义类)词典应具有以下4种输入方式(参见И.М.Кобозева2000:125)。
1)由概念到概念(отконцептакконцепту:К→К),亦即从一个概念寻绎体现在纵横相联(上—下位、种—属、属—属等关联)的概念图式中另一概念。
这种图式是意念词典的基础,它被称作统览图式(синоптическаясхема)。
2)由概念到语词符号(отконцептакзнаку:К→З),亦即从一个概念寻绎表达这个概念的所有语词,它是意念词典的主干部分。
3)由语词符号到概念(отзнакакконцепту:З→К),亦即从贝字母顺序编排的词汇表中标志出某个语词在概念场的访问地址。
4)由语词符号到语词符号(отзнакакзнаку:З→З),亦即由一个语词(多为词组成短语)找出另一个单个的词,比如,从автоматический找到автоматизация总的说来,意念词典的构造原则在许多方面还存在争议,其争议的焦点可归结为下面4个方面的问题(А.Н.Баранов2000:64 65或访问http://ramina.irk.ru/lang/dict/agens.htm)。
1)如何提取语词的某个义素作为概念类目的名称?因为原则上任何义素均可选作概念类目,如俄语动词обманывать (欺骗)既可列入主题栏《ОБМАН,ЛОЖЬ》。
也可并入《ДОСТИЖЕНИЕЦЕЛИ》,《НЕКООПЕРАТИВНОСТЬПОВЕДЕНИЯ》,《ЭТИЧЕСКИЕНОРМЫ》,《ПРЕСТУПЛЕНИЕ》等类目。
2)怎样才能使概念层级系统囊括所有的语义关系类型?须知,词汇单位之间的语义关系绝非仅限于种—属、同义关系,还可能存在推涵/因果关系(отношенияследствия)、联想关系(отношенияассоциации)、论证关系(отношенияобоснования)等。
因此,采用树型图的分析方法不可能构筑严整的概念层级系统,为了表征多重的语义关系,最理想的方法是用语义网络(семаническаятеть)结构图,使各个语词能在其中彼此关联,相互引证。
3)如何制定概念类目划分的统一规则?因为只有根据统一的概念类目划分规则,方可判定语词的哪些义素能够选作概念类目,而哪些义素又是禁止用作概念类目的。
4)怎样区分素朴的与科学的世界观(наивныйинаучныйвзгляднамир)?亦即如何使概念的层级系统或统览图式与素朴的和科学的世界图景相吻合(наивнаяинаучнаякартинамира)?所谓“素朴的世界图景”,是指操某种语言的中等智力者对世界的映像,这种映像建立在前科学家的一般概念之基础上,而这些概念是由中等智力者掌握的语言所前定的。
波兰著名语言学家А.Вежбицкая在研究用于词义描写的语义原语(семантическийметаязык)过程中提出的心智语言(ligua mentalis),实质上就是素朴世界图景的概念构架。