基于语义的文本话题倾向性分析
《基于语义理解的文本相似度计算研究与实现》

《基于语义理解的文本相似度计算研究与实现》一、引言随着互联网的快速发展,海量的文本信息充斥着我们的日常生活。
如何有效地处理和利用这些文本信息,成为了当前研究的热点问题。
文本相似度计算作为自然语言处理领域的重要分支,被广泛应用于信息检索、文本分类、问答系统等领域。
传统的文本相似度计算方法主要基于词法或简单的语义特征进行计算,但在面对复杂的语义关系和歧义问题时,往往难以准确度量文本之间的相似性。
因此,基于语义理解的文本相似度计算方法显得尤为重要。
本文将详细介绍基于语义理解的文本相似度计算的研究背景、意义、方法以及实现过程。
二、研究背景与意义随着深度学习和自然语言处理技术的不断发展,基于语义理解的文本相似度计算方法逐渐成为研究热点。
传统的文本相似度计算方法主要基于词频统计、字符串匹配等技术,无法准确捕捉文本的语义信息。
而基于语义理解的文本相似度计算方法,能够通过分析文本的语义信息,更准确地度量文本之间的相似性。
这不仅有助于提高信息检索、文本分类等任务的性能,还能为智能问答、机器翻译等应用提供有力支持。
因此,研究基于语义理解的文本相似度计算方法具有重要意义。
三、相关技术研究与进展3.1 语义理解技术语义理解技术是自然语言处理领域的重要分支,旨在理解文本的语义信息。
目前,基于深度学习的语义理解技术已经取得了显著的成果,如词向量表示、循环神经网络(RNN)、长短期记忆网络(LSTM)和Transformer等模型。
这些模型能够有效地捕捉文本的语义信息,为文本相似度计算提供了有力的支持。
3.2 文本相似度计算方法传统的文本相似度计算方法主要包括基于词频统计的方法、基于字符串匹配的方法和基于知识图谱的方法等。
随着深度学习和语义理解技术的发展,基于语义理解的文本相似度计算方法逐渐成为主流。
这些方法主要通过分析文本的语义信息,如词向量、句子表示等,来度量文本之间的相似性。
四、基于语义理解的文本相似度计算方法研究4.1 语料库的构建为了训练有效的模型和评估算法性能,需要构建大规模的语料库。
基于语义的文本倾向性分析在高校教学评价中的应用

义 的文 本倾 向性 分 析 应 用 到 教 学 评 价
中。
的倾 向性 词典 笔 者 只关 心 与教学 评价
式 的文 本 倾 向 性 分析 以及 基 于语 义模 式 库 的 文 本 倾 向性 分 析 本 文 以基 于 语
本 倾 向 性 分 析 。其 中 . 于 语 义 的 文 本 个 模 块 ( 图 1 。 模 块 功 能 描 述 如 下 : 基 见 )各
是 中 国科 学 院计 算 技 术 研 究 所 研 制 出 的汉语 词 法 分析 系 统 IT L . 主 要 C C AS 其
l
( 结 寐)
图 1 文 本 倾 向 性 分 析 流 程 图
类 方法 首先 对 待 估 文 档 参 照 语 义 模 式 库 中的模 式 做模 式 匹配 . 然后 累 加所 有 匹配 好 的模 式对 应 的倾 向性 值 . 到原 得
文 档 的 总 词 发 现 .
教 学 评 价 文 本 的倾 向性 分 析 属 于
针 对 特 定 领 域 的 文 本 倾 向 性 分 析 建 立 包 含 大 家 关 心 的 评 价 对 象 ( “ 解 ” 如 讲 、 “ 践 环 节 ” “ 件 ” ) 词 典 能 够 有 实 、课 等 的 效 地 实 现 观 点 的 识 别 和 分 析 本 文 利 用 已 掌 握 的评 价 文 本 . 其 中 出 现 的 评 价 对 主 题 进 行 汇 总 和 扩 展 构 成 一 个 主 题 词 词典 。 通 常 的 文 本 倾 向 性 分 析 方 法 依 赖 于 由 观 点 表 达 词 及 其 倾 向 性 标 注 构 成
;
瞒 点 倾 『 分 忻 性
基于语义特征的文本情感倾向识别研究

( 重庆邮电大学 计算机科学与技术研究所, 重庆 406 ) 005 摘 要 :由于网络评论用语的多样性 , 常用的文本主题分类方法并不能完全适应情感倾向识别。针对这个问
题 , 语义理 解 的角度 出发 , 出一种 基 于语 义特征 的情 感倾 向识别 方法 , 从 提 通过增加 语 义特征使 得原 始 文本表 现 出更加 明确的情 感倾 向 , 并且更加容 易区分 。实验 结果表 明了该方 法的有效 性 。
第2 7卷 第 3期
21 0 0年 3月
计 算 机 应 用 研 究
Ap l a in Re e r h o mp tr p i t s a c fCo u e s c o
V0 _ 7 No 3 l2 . Ma . 2 0 r 01
基 于语 义 特征 的文 本情 感倾 向识别 研 究 术
文本 中情感倾 向的独特表达方式 , 出了一种基于语义特征的 提
0 引言
互联 网逐渐成为人们生活不可 或缺 的一部分 , 随之 而兴起
情感分类方法。
1 文本 的主题分 类方 法及 其用 于情感 分类 的不足
1 1 主 题 分 类 框 架 .
的 We b已经成为 网民发表个人见解的最常用 载体。网络评论 反映 了网民对热点事件 的观点 , 体现 了网民兴趣 所在 , 于 网 对 络评论进行挖掘和分析 , 识别 出其情感倾 向, 以更好 地分析 可 热点舆情 , 理解用户的兴趣爱好 , 给政 府和企业 提供重要 的参 考信息。
关键 词 :语 义特征 ; 向识 别 ;情感 分类 ;主题分 类 倾
中图法分 类号 :T 3 9 7 P 0 .
文献标 志码 :A
文章编 号 :1 0 — 6 5 2 1 ) 3 0 9 — 3 0 13 9 (0 0 0 — 9 2 0
一种基于文本语义的网络敏感话题识别方法

显 。网络 中传播的色情 、非法煽动 、暴力 、商业欺 分介 绍 网络 敏感 话 题文 本特 点及 相应 的表 示方 法 ; 部分根据网络敏感话题的特点 ,提出基于倾 向性 诈等不 良信息 内容若不能得倒识别和及时监控 ,则 第4
会 对青 少 年造 成 了极 大 的负 面影 响 。 因此 ,能够 正 词典的网络敏感话题的识别方法 ; 部分通过实验 第5 确识 别 网络 中的不 良话 题 ,敏 感话 题 对 网络 舆情 的 评价方 法 的有 效性 ;第 6 部分对 全文进行 总结 。
第9 第3 卷 期
21年9 0 1 月
深圳信息职业技术学 院学 报
Ju n l f h n h nI s tt f nomainT c n lg o ra e z e n tueo fr t e h ooy oS i I o
V 1 o3 o. N . 9 S p 2 1 e.01
摘
要 :网络 已成 为 当今世 界重要的信 息载体 ,但是 网络信息 良莠不齐,对人们 的生活造 正确识别 网络 中的敏感话题,是 当前网络舆情分析与监管的重要任务之一 。本文以识 别网络论坛中的敏感话题 为 目标 ,基 于网络论坛文本在 结构和表达上表现 出的篇幅短、结构 不完整 、文字 口语化等特性 ,将该类文本表示成基 于
文 章 编 号 : 1 7 — 3 2 ( 0 0 — 0 3 0 2 63 2 1 6 1) 3 0 3 — 5
[ 息技 术理论研究】 信
一
种基 于文本语 义 的网络敏感话题识别方法
刘霁 ,周亚 东,高峰 ,赵俊 舟 ,薛峰
( 西安交通大学智 能网络与网络安全教育部重点实验室 ,机械制造 系统工程 国家重点实验室 ,西安 7 0 4 109)
基于词典的中文情感倾向文本分析工具

基于词典的中文情感倾向文本分析工具有很多基于词典的中文情感倾向文本分析工具可供选择,以下是一些常用的工具:
1.哈工大情感词典:这是一个经典的情感词典,包含了积极、消极和中性情感词汇。
可以用来判断文本中词语的情感倾向。
2. 情感分析工具包SNownlp:这是一种基于Python的中文情感分析工具包。
它提供了情感分析的功能,可以判断文本的情感倾向,并进行情感强度计算。
3. 中文情感词汇本体库CNSentiLex:这是一种基于知网构建的情感词汇本体库。
它包含了积极、消极和中性情感词汇,并提供了情感强度和极性的评分。
4. 情感词汇本体SentiWordNet:这是一种基于英文的情感词汇本体库。
虽然它是英文的,但是也可以用于判断中文文本的情感倾向。
这些工具都可以根据词典中的情感词汇和语义规则来判断文本的情感倾向。
它们都有不同的优点和适用场景,具体选择哪个工具取决于你的需求和文本分析的目标。
基于语义分析的社交网络信息分析

基于语义分析的社交网络信息分析在如今信息爆炸的社交网络时代,每天都会涌现出大量的文字、图片、视频等内容。
这些内容的数量之大,已经远远超出了人类的处理能力。
因此,如何利用人工智能的技术手段,对社交网络上的信息进行有效的筛选和分析,成为了一个备受关注的话题。
其中,基于语义分析的社交网络信息分析,能够通过自然语言处理等技术,发现其中的隐藏信息,为我们提供更全面、准确的数据支持。
一、语义分析的基本思想语义分析是一种基于自然语言处理的技术,旨在让计算机能够像人类一样理解句子的意思,从而能够更好地分析和处理自然语言文本。
与传统的文本处理技术不同,语义分析不仅考虑到文本中的词汇和语法结构,还关注文本所表达的含义和上下文关系。
它可以通过提取出文本中的实体、情感、关键词等信息,对文本进行进一步的分析和挖掘。
二、社交网络信息分析的基本方法社交网络信息分析是一种将社交网络中的大量信息提取、分析、挖掘的技术。
它涉及到多个领域,如自然语言处理、机器学习、数据挖掘等。
其中,基于语义分析的社交网络信息分析是其中比较常见的方法之一。
社交网络中用户产生的大量内容包括文本、图片、视频等信息,这些信息包含着用户的观点、情感、需求等多个方面。
为了有效地分析这些信息,需要建立一个合适的语义模型。
该模型可以将文本内容转化为数学模型,以实现自动化的数据分析。
语义模型的构建基于数据驱动,通常需要根据社交网络上已有的数据进行训练。
在这个过程中,使用者需要为算法提供足够的样本数据以及标签,这些样本数据可以是已有的社交网络信息,也可以是手动或自动标注的数据集合。
通过学习和总结这些数据,算法可以逐渐形成有效的语义模型。
三、语义分析在社交网络中的应用1、情感分析情感分析是社交网络信息分析的重要应用之一。
它旨在通过自然语言处理技术,对社交网络中的文本内容进行情感倾向的判断。
情感分析可以分析用户对某个话题的态度和情感色彩,例如对于某款产品的用户评价,情感分析可以通过抽取出评价内容中的关键词和情感化的词汇,来判断用户对该产品的态度是积极的、消极的还是中立的。
基于语义分析的微博用户情感倾向分析研究

基于语义分析的微博用户情感倾向分析研究引言:随着社交媒体的快速发展,微博等平台已经成为人们表达情感和观点的主要渠道之一。
在这样的平台上,用户可以分享自己的喜怒哀乐,并且与他人交流互动。
对于品牌、政府、媒体等机构来说,了解用户的情感倾向对于制定营销策略、舆论引导等方面具有重要意义。
然而,对于海量的微博文本进行情感倾向分析是一项具有挑战性的任务。
本文将介绍基于语义分析的微博用户情感倾向分析的研究。
一、问题描述在微博中,用户的情感倾向可以分为正向、负向和中性三种。
正向情感倾向表示用户对某一主题表示积极的情绪,负向情感倾向则表示消极的情绪,而中性情感倾向则表示用户对主题没有明显的情感倾向。
因此,基于语义分析的微博用户情感倾向分析就是要根据微博内容来确定用户对主题的情感倾向。
二、语义分析技术语义分析是一种通过理解和解释文本来获取其意义的技术。
在微博用户情感倾向分析中,常用的语义分析技术包括情感词汇本体库和机器学习。
情感词汇本体库是一种用于存储情感词汇的资源,其中包括正向情感词汇和负向情感词汇。
通过将微博文本与情感词汇本体库进行匹配,可以确定文本中是否包含情感词汇以及这些情感词汇的情感极性。
机器学习则是一种通过训练模型来实现情感倾向分析的方法。
通过构建训练集,将微博文本与情感倾向进行关联,然后通过训练模型来识别新的微博文本的情感倾向。
三、研究方法针对基于语义分析的微博用户情感倾向分析,研究者可以采用以下方法:1. 构建情感词汇本体库:通过收集和整理大量微博文本,筛选其中的情感词汇,并根据其情感极性进行分类,构建情感词汇本体库。
这个过程需要考虑不同情感词汇在不同主题下的情感极性可能会有变化。
2. 建立机器学习模型:将收集到的微博文本与其情感倾向进行关联,构建训练集。
然后选择适合的机器学习算法,例如支持向量机(SVM),朴素贝叶斯(Naive Bayes),逻辑回归等来训练模型。
训练完成后,使用该模型预测新的微博文本的情感倾向。
语义分析

语义分析语义分析是一种重要的自然语言处理技术,旨在理解和解释文本中的意义和语境。
这项技术在许多领域中发挥着重要的作用,例如信息检索、语音识别、机器翻译和情感分析等。
本文将介绍语义分析的基本概念、方法和应用,并探讨其在现实生活中的应用前景。
首先,我们来理解一下语义分析的概念。
语义分析是指通过对文本内容进行深入理解和分析,从而获取隐藏在其中的含义、关系及情感等信息的能力。
与传统的文本分析相比,语义分析注重的是语义层面的理解和解释,而非仅仅对语法和词义的处理。
通过语义分析,我们能够更好地理解文本的真实意图和情感倾向,从而更准确地进行相关决策和应用开发。
语义分析的方法多种多样,包括基于规则的方法和基于机器学习的方法。
基于规则的方法依赖于人工定义的规则和规则引擎来进行分析和理解。
这种方法的优点是可解释性强,但其局限性在于需要大量的人工参与和规则的不断更新和调整。
与之相对,基于机器学习的方法则利用大规模的训练数据和算法模型来进行分析和理解。
这种方法的优点是能够更好地处理复杂的语言结构和情感表达,但其挑战在于数据标注和模型训练的成本较高,以及模型的可解释性相对较低。
语义分析在现实生活中有着广泛的应用前景。
首先,在信息检索领域,语义分析可以帮助提升搜索引擎的准确度和用户体验。
通过理解用户的搜索意图和搜索结果之间的语义关系,搜索引擎可以更精确地匹配用户的需求,从而提供更有价值的搜索结果。
其次,在商业智能和市场研究领域,语义分析可以帮助企业收集和分析用户的声音和意见,了解用户对产品和服务的真实评价和需求。
通过对大量用户评论和社交媒体数据进行语义分析,企业可以及时发现问题和改进产品,从而提升用户满意度和市场竞争力。
此外,在舆情监测和情感分析领域,语义分析也发挥着重要作用。
通过对社交媒体和新闻数据进行语义分析,我们可以及时了解公众对特定事件或话题的情感倾向,从而为政府和企业提供决策支持和舆情管理。
总的来说,语义分析是一项具有广泛应用前景的技术,它可以帮助我们更好地理解和应用文本中隐藏的语义信息。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相似度运算。 3.2.2. 词语相似度计算 对于两个汉语词语 W1 和 W2 ,如果能够在情感字 典中都检索到并且只考虑两词的第一个概念描述式,
,S1n ,W2 有 m 个义原: 假设 W1 有 n 个义原:S11 , S12 , S 21 ,S22 , ,S2 m ,我们规定,W1 和 W2 的相似度是各个
3. 文本情感倾向性分析
计算机如何对有主观情感的文本进行分类,判断 其是正面还是负面,是持支持态度还是反对态度,这 就引出了自然语言处理领域一个重要的研究方向—— 倾向性分析。我们先了解一下需要抽取的词应该需要 满足的特性,确定必须抽取的词性,然后给出语义相 似度计算的方法。
义原的相似度之最大值,则有:
本文通过将种子集作为情感词倾向判断的基准 词,情感词越是接近褒义种子集,其带有的褒义倾向 越是浓烈;越是接近贬义种子集,其带有的负面倾向 越是强烈。于是,一个情感词的情感极性及其强度取 决于他与两类种子集合的接近程度,即该词与词语集 合相似度。从微观角度来说,种子集由常用情感词组 成,词语与集合的相似度可以通过词语与词语的相似 度来简单计算,以种子情感词集合中元素的相似度的 平均值简单作为该词与情感集合的相似度。 3.2.1. 语义相似度的计算原理 利用《知网》计算语义相似度,一个最简单的方 法就是直接使用词语语义表达式中的第一基本义原 描述式(即该词对应的第一个概念或者说是用法),把 词语相似度等价于第一概念的相似度。任意给定两个 词语,计算它们之间的语义相似度取决于它们义原集 合的相似度。集合计算本文采用递归程序来实现集合
2.3. 情感字典的构建
情感字典的构建[9]以 HowNet 发布的“情感词语 集”为基础,为了构建情感词典现采用人工和计算机 双重删选,试图删去那些不常用的或情感倾向不明的 词语,使得情感字典的规模下降以便于计算机的检索 速度提升。
2. 文本倾向性分析相关技术
2.1. 知网(HowNet)
《知网》 是一个以汉语和英语的词语所代表的 概念为描述对象,以揭示概念与概念之间以及概念所 具有的属性之间的关系为基本内容的常识知识库。在
2.2. 词语相似度
本文中词语相似度就是两个词语在不同的上下 文中可以互相替换使用而不改变文本的句法语义结 构的程度。两个词语,如果在不同的上下文中可以互 相替换且不改变文本的句法语义结构的可能性越大, 二者的相似度就越高,否则相似度就越低。相似度这 个概念,涉及到词语的词法、句法、语义甚至语用等 方方面面的特点。其中,对词语相似度影响最大的应 该是词的语义。在本文中,相似度被定义为一个 0 到 1 之间的实数。 词语距离和词语相似度是一对词语的相同关系 特征的不同表现形式,二者之间可以建立一种简单的 对应关系。对于两个词语 W1 和 W2 ,记其相似度为
[3] [2]
知网世界中,有相当重要的两个概念: “概念”与“义 原” 。 “概念”是对词汇语义的一种描述。每一个词可 以表达为几个概念。 “概念”是用一种“知识表示语 言”来描述的,这种“知识表示语言”所用的“词汇” 叫做“义原” 。义原是描述概念的最基本单位。在《知 网》中,一共描述了义原之间的 8 种关系,其中最重 要的还是上下位关系。
3.3. 义原相似度计算
由于所有的义原根据上下位关系构成了一个树 状的义原层次体系,我们采用简单的通过语义距离计 算相似度的办法。假设两个义原在这个层次体系中的 路径距离为 d,根据公式(1),我们可以得到这两个义 原之间的语义距离[8]:
Sim p1 , p2
3.2. 情感词的语义倾向计算
基于语义的文本话题倾向性分析*
朱 平,费本华,范少辉
国际竹藤中心,北京 Email: zhuping@ 收稿日期:2012 年 10 月 14 日;修回日期:2012 年 10 月 29 日;录用日期:2012 年 11 月 7 日
摘
要:文本情感倾向性研究是人工智能的分支学科,涉及了计算语言学,数据挖掘,自然语言处理等多个学
Sim W1 , W2 ,其词语距离为 Dis W1 , W2 ,那么我们
可以定义一个满足以上条件的简单转换关系[8]:
Sim W1 , W2
Dis W1 , W2
其中 α 是一个可调节的参数,具体实验中选 1.6 较为 适宜。α 的含义是:当相似度为 0.5 时的词语距离值。 这种转换关系并不是唯一的,我们这里只是给出了其 中的一种可能。在很多情况下,直接计算词语的相似 度比较困难,通常可以先计算词语的距离,然后再转 换成词语的相似度。
Abstract: The text emotional tendency research is a subdiscipline of artificial intelligence, involving computational linguistics, data mining, natural language processing, and other disciplines. Semantic-based study and research based on machine learning are two divided directions of emotional tendency analysis. In this paper, we applied the semantic-based method, using emotion word dictionary provided by HowNet on text semantic analysis, give each text phrase or word an emotional value, then use the semantic similarity and semantic unit similarity calculation method to calculate the semantic similarity of words in the text, thereby get their emotional polarity and intensity, and finally obtain a quantify value of text emotional tendency. Experiments show that the accuracy of this method is relatively high. Keywords: Semantic Orientation Analysis; HowNet; Primitive; Word Similarity
1. 引言
传统的文本倾向性分析(Sentiment Classification) 就是用户对某个事物看法或评论进行文本的分析,从 而得到该看法或者评论是属于对该事物消极的还是 积极意见。关于文本倾向性分析的研究近年来得到了 长足的发展,它是数据挖掘中研究的热点,涉及自然 语言的处理,信息检索,数据挖掘,计算语言学等领
3.1. 短语和词汇的抽取
情感词和其它的上下文尤其是修饰副词能够体 现文本作者的情感倾向[10],实验表明,存在一个以上 形容词、副词的句子属于含主观倾向性的句子的概率 为 55.8%。因此,形容词和副词是必须从文档中抽取 的词语。一些动词,名词也是具有情感色彩的和褒贬 义的。本文中,我们选择抽取形容词、副词、动词和 名词这四类的词性的词作为候选情感词。
Semantic-Based Text Topic Sentiment Orientation Analysis*
Ping Zhu, Benhua Fei, Shaohui Fan
International Centre for Bamboo Rattan, Beijing Email: zhuping@ Received: Oct. 14th, 2012; revised: Oct. 29th, 2012; accepted: Nov. 7th, 2012
科。基于语义的情感倾向研究和基于机器学习的情感倾向研究是情感倾向性分析的两个方向。本文采用了基于 语义的方法,利用 HowNet 提供的情感词词典来进行文本的语义分析,对文本短语或词逐一赋予一个情感值, 然后用语义和义元相似度计算的方法,计算文本中词语的语义相似度,得到词语的情感极性和强度,从而对文 本的情感倾向给出一个量化的倾向程度值。通过实验表明这种方法文本研判的正确率较高。 关键词:文本倾向性分析;HowNet;义原;语义相似度
*
域。基于语义的倾向判别为文本过滤、自动文摘等研 究工作提供了新的思路和新的手段。我们可以对语义 倾向度量值设定一个合适的阈值,对于倾向值低于或 高于阈值,也就是态度倾向过于偏激的文章进行过滤 操作,或者可将倾向值赋予一定的权值,作为文本过 滤中需要考虑的一个因素。文本的倾向性分析主要由 完成以下几个任务: 1) 找出文档中能够体现情感的词 或短语;2) 判断所找出的词或倾向值的极性和强度; 3) 找出所抽取词的或短语与主题的关系。
Computer Science and Application 计算机科学与应用, 2012, 2, 282-286 doi:10.4236/csa.2012.25050 Published Online December 2012 (/jo © 2012 Hanspub
资助信息:本文由国家林业局国际竹藤网络中心科研专项项目 1632009006 资助。
282
基于语义的文本话题倾向性分析
目前,国内外对于文本倾向性的分析研究大体上 分为两大类:基于机器学习的和基于语义的文本倾向 性研究。传统文本分类技术是基于机器学习的方法。 如 Pang 等人分别使用朴素贝叶斯、最大熵及支持向 量机等方法进行文本倾向性研究。 文献[1]选取褒贬倾 向性比较强烈的词作为特征项,构造了一个支持向量 机(Support Vector Machine, SVM)褒贬两类分类器来 进行文本倾向性分析。 就上面三种方法来说, SVM 的 准确率要略高于其他两种分类技术,所以支持向量机 法用的更为普遍。 基于语义的文本倾向性研究方法是国内最为普 遍的一种情感倾向研究方法,其主要思想是先对待分 析的文本中能够明显体现主观色彩的词进行抽取,其 中主要是对形容词和副词 进行操作,然后对抽取出 来的词通过计算逐一附上一个倾向值,这些词倾向度 的平均值作为整个文本的倾向度。基于语义的文本倾 向性分析方法又可以大致分为基于词和短语模式的 文本倾向性分析方法和基于语义模式库的文本倾向 性分析方法。朱嫣岚 等人利用 HowNet 提供的语义 相似度和语义相关场的定义,计算待估词与预先选好 的褒贬基准词对组的相似性和相关性,从而得到该词 或短语的倾向度。文献[4]在利用 Wordnet 计算词语的 语义相似度时,除了结点间的路径长度外,还考虑到 了概念层次树的深度,概念层次树的区域密度等因 素。李艺红,蒋秀凤[5]等人就使用一个倾向性词汇表 和一个倾向性模式库,对抽取出来的句子和短语进行 语义关系分析,进而得到文本倾向性。Wenbin Pan[6] 等人尝试将商品的评论文本情感倾向识别为三类,不 仅包括正面和负面评论,还有中性评论。 本文采用的是基于语义的方法,尝试构建领域情 感字典,通过采用 HowNet 的语义和义元相似度计算 的方法,计算文本中词语的语义相似度,得到词语的 情感极性和强度,从而对文本的情感倾向给出一个量 化的倾向程度值。