Web文本情感分析研究综述_李光敏
文本情感分析综述

文本情感分析综述文本情感分析是指对文本内容进行分析,以确定其中所包含情感的方法。
情感分析在自然语言处理领域具有广泛的应用,包括社交媒体监测、品牌管理、市场调研等。
本文将综述目前文本情感分析的技术和方法,并探讨其应用领域和存在的挑战。
一、情感分析技术和方法:1. 基于词典的方法:该方法使用预定义的情感词典,对文本中的词进行情感打分,然后通过加权求和或者分类算法来确定整个文本的情感极性。
常用的词典有SentiWordNet、AFINN等。
2.机器学习方法:该方法通过训练一个分类器,将文本分为积极、消极或中性,常用的算法有朴素贝叶斯、支持向量机、随机森林等。
3.深度学习方法:近年来,深度学习方法在情感分析中取得了显著的进展。
深度学习模型如循环神经网络(RNN)和卷积神经网络(CNN)能够对文本进行端到端的建模,包括长期依赖和局部特征提取。
二、情感分析的应用领域:1.社交媒体监测:情感分析可用于监测社交媒体上用户对特定事件、产品或品牌的态度和情感倾向,帮助公司及时了解用户的反馈和需求。
2.市场调研:情感分析可以帮助企业了解产品的市场反应和用户的需求,进而优化产品设计和营销策略。
3.品牌管理:情感分析可以帮助企业评估品牌形象和声誉,并及时发现并解决潜在的危机和问题。
4.情感分析还可应用于舆情监测、情感化以及个性化推荐等领域。
三、情感分析的挑战:1.多样性和主观性:情感分析受到文本多样性和主观性的影响,不同文化和背景下,不同人对同一词汇或句子的情感倾向可能会有差异。
2.语义理解:情感分析需要深入理解文本的上下文和语义,包括语言的隐喻、讽刺等。
这对于机器来说是一大挑战。
3.数据标注:情感分析的训练需要大量标注好情感的数据,然而标注数据是一项复杂且耗时的任务,为情感分析提供高质量的训练数据仍然是一个问题。
综上所述,文本情感分析是一项具有挑战性但应用广泛的任务。
随着技术的不断发展,我们可以期待情感分析在各个领域的更深入应用,并希望能够解决当前面临的挑战,提升情感分析的准确性和效果。
文本情感分析综述

d o c u me n t l e v e l s e n t i me n t a n a l y s i s ,a n d t e x t s e n t i me n t na a ly s i s a p p l i c a t i o n s .I t p o i n t e d o u t t h a t t h e c u r r e n t s e n t i me n t na a ly s i s
文本 情 感 分 析 综 述
杨 立 公 , 朱 俭 , 汤世 平
( 1 . 北 京理工大学 计算机学院, 北京 1 0 0 0 8 1 ; 2 . 中国青年政治学 院 计算 机教学及应用 中心, 北京 1 0 0 0 8 9 ) (}通信作者 电子 邮箱  ̄l l g g @g ma i l . C O B)
文章编号 : 1 0 0 1 —9 0 8 1 ( 2 0 1 3 ) o 6—0 1 5 7 4— 0 5
C OD EN J YI I DU
h t t p : / / w w w. j o c a . c a
d o i : 1 0 . 3 7 2 4 / S P . J . 1 0 8 7 . 2 0 1 3 . 0 1 5 7 4
s y s t e m c a n n o t g a i n h i g l l p r e c i s i o n .F u r t h e r r e s e a r c h s h o u l d f o c u s o n : w i d e l y a n d a p p r o p r i a t e l y a p p l y i n g s t u d y a c h i e v e m e n t o f
文本情感分析方法研究综述

内容摘要
结论:文本情感分析作为一种强大的文本数据分析方法,可以帮助我们更好 地理解和识别文本中所表达的情感信息。然而,该方法也存在一些挑战和限制。 例如,对于不同领域和场景的情感分析,需要定制化的解决方案;数据清洗和预 处理对结果影响较大;模型训练和调优过程较为复杂等。未来,需要进一步研究 和改进文本情感分析方法,以适应更多场景和应用需求。
3、研究成果与不足
然而,文本情感分析仍存在一些不足。首先,情感词典的构建和维护需要大 量的人力和物力,成为制约文本情感分析发展的重要因素。其次,虽然深度学习 在文本情感分析中取得了显著成果,但大多数模型仍依赖于手工设计的特征,如 何自动地学习有效的特征是亟待解决的问题。此外,如何处理非情绪性文本和非 规范语言表达方式,以及如何处理不同语言和文化的情感分析问题,也是需要进 一步探讨的问题。
内容摘要
引言:随着社交媒体和在线平台的快速发展,人们产生和分享文本数据的数 量大幅增加。这些文本数据中蕴含着人们的观点、情感和态度,对于理解和引导 消费趋势、改善客户服务、预测市场变化具有重要的商业价值。文本情感分析作 为一种有效的文本数据分析方法,旨在挖掘这些文本数据中的情感信息,对于企 业决策、产品优化等方面具有广泛的应用。
内容摘要
目前,研究人员在情感分析方面已经取得了显著的成果。例如,利用机器学 习和深度学习算法,研究人员可以实现对文本的高效情感分类。此外,研究人员 还开发了多种情感词典和工具,如褒义词典、贬义词典和情感极性词典等,以帮 助更好地进行情感分析。
内容摘要
然而,尽管前人研究取得了不少成果,但仍存在一些不足之处。首先,情感 分析的准确性仍需进一步提高。尽管现有的机器学习和深度学习算法在许多情况 下能够取得较好的效果,但在处理某些复杂情感时仍存在一定的局限性。其次, 现有的情感词典和工具大多基于英语语言,对于其他语言尤其是小语种的情感分 析支持不够。因此,针对不同语言的特点开发相应的情感词典和工具是未来的研 究方向之一。
文本情感分析综述

文本情感分析综述作者:刘爽赵景秀杨红亚徐冠华来源:《软件导刊》2018年第06期摘要:近年来,随着互联网和社交网络的发展,网络上文本信息迅速增长,对文本情感进行分析成为研究热点。
根据文本情感分析方法的不同,总结了近年来文本情感分析的研究进展。
将文本情感分析分为基于词典的方法和基于机器学习的方法两大类:基于词典的文本情感分析方法分为人工构建和自动构建两种;基于机器学习的文本情感分析方法分为基于贝叶斯算法、基于最大熵算法和基于SVM的文本情感分析3种。
通过梳理国内外研究现状,对两类情感分析方法进行了深入分析,对文本情感分析进行了总结和展望。
关键词:文本情感分析;词典构建;机器学习;贝叶斯算法;最大熵算法;SVMDOI:10.11907/rjdk.172640中图分类号:TP3-0文献标识码:A 文章编号:1672-7800(2018)006-0001-04Abstract:In recent years, with the development of the internet and social networks, text information on the Internet has been increased rapidly, and sentiment analysis has become a research hotspot. According to the different methods of sentiment analysis, the research progress of sentiment analysis in recent years is summarized.Sentiment analysis is divided into dictionary-based methods and machine learning-based methods. The dictionary-based sentiment analysis methods are divided into two kinds: artificial construction and automatic construction. Machine learning-based sentiment analysis methods are divided into three kinds based on Bayesian algorithm, based on maximum entropy algorithm and sentiment analysis based on SVM. Through the research status at home and abroad, two kinds of sentiment analysis methods are deeply analyzed, and the sentiment analysis is summarized and forecasted.Key Words:sentiment analysis; dictionary construction; machine learning; Bayesian algorithm; maximum entropy algorithm; SVM0 引言近年来,随着互联网和移动互联网的飞速发展,文本情感分析已经广泛应用于多个领域。
在线社交媒体中基于文本的情感分析研究

在线社交媒体中基于文本的情感分析研究1. 引言在当今社交化的互联网时代,人们越来越依赖在线社交媒体来进行信息的传递与交流。
随着社交媒体的快速发展,人们在具体应用场景中逐渐发现在线社交媒体中大量存在的文本信息可以被有效的挖掘与应用。
其中,对文本进行情感分析是一项极具实际应用价值的技术。
本文将重点介绍基于文本的情感分析技术在在线社交媒体中的研究进展。
2. 在线社交媒体中情感分析的基础在进行情感分析之前,必须先了解情感分析所依赖的基础技术。
文本情感分析所依赖的核心技术为自然语言处理(Natural Language Processing,NLP)技术。
NLP 技术是一门研究对自然语言进行分析和处理的计算机科学。
其主要任务是将人类所使用的自然语言转换成计算机可以理解的形式,从而实现对文本的智能分析、自动化处理和语意理解。
自然语言是一套非常复杂的符号系统,它与情感密不可分。
因此,处理文本中的情感就需要对文本中所隐含的情感进行逐一抽取和描述。
3. 情感分析的基本流程情感分析的基本流程包括文本预处理、情感极性的判定和情感的分类。
具体流程如下:(1)文本预处理:文本预处理是指对待处理的文本进行处理,将文本中的噪声数据、冗余信息、非字符串数据和无用数据处理掉,以减少其对分类算法的干扰。
文本预处理的主要内容包括:文本清洗,分词,停用词过滤,词干提取等。
(2)情感极性判定:对于一个文本,先要确定它所表达的情感极性即是正面的、负面的还是中性的。
情感极性判定可以基于情感词典等资源进行,也可基于机器学习等方法进行。
(3)情感分类:情感分类是指在情感极性已经明确的前提下,针对这个文本对应的具体情感进行分类。
情感分类可分为基于规则的方法和基于机器学习的方法。
4. 基于规则的方法基于规则的情感分析方法是基于特定的规则和知识推理,用语法分析或者搜索方法结合先验规则将单词或短语转换为其情感类别的方法。
这种方法通常包括构建情感词典和规则库。
文本情感计算研究综述

算 法名 称 文 档频 率法 ( D F ) 信 息增 益 ( f G)
算 法描 述
算 法性 能
不 同的应用领 域 的需求 ,应根据具 体的 训 练集过程和 分类算法 选择合适 的特征
选择算法 。 特 征 词 集 的 质 量训练 集 中 出 现 的频 率 未 考 虑 分 类 信 息 , 忽 略 了低 来判 断特征 的重 要程 度 频 词汇 的分类 作用 文 档在 考虑 特征 项 前后熵 值 的变 化 若 训练 样 本 有 限 ,可 能会 造 成 特征 项稀 疏
期望 交叉 熵 ( E C E ) 特 征 在 训练 集 中 出现 时所 获 得 的信 未 考 虑 特 征 未发 生 时 对 于 分 息量大 小 类 的影 响 , 一般 来 说 分 类 精 度 优于 信 息增益
取算法 ,例如 文档 频率 法、期望交叉熵、 互信 息以及卡方统 计量等 。归纳总结现 在文本分 析理论研 究不断发展 的趋
1 - 2情感特征提取算法
运用情感词 典计算 出文本 情感值是
一
文 本 包 含 的 情感 信 息是 错 综 复 杂 有 的文本特征提取算法 , 整理得到表 2 。
1 ] 。H u 的交叉学科 ,情感计算 引起 了众 多学术 感分类 的模型 。因此 ,关于文本情 感识 在 英 文 的 情 感 分 析 中 广 泛 使 用 [ 团 体 和 企 业 机 构 的兴 趣 ,在 国际 期 刊 和 别 的讨 论,主要集 中在 文本情感特 征标 整 理 汇 编 的 情 感 词 典 Op i n i o n L e x i c o n , 会 议 上 出现 了 不 少 有 关 情 感 计 算 的研 究 注、情感特 征提取 算法 和情感信 息分类 也是很 多研 究人员选用 的基础 资源 _ 2 】 。 成 果 ,主 流 的 研 究 对 象 包 括 表 情 情 感 、 语音情 感、行为情感 和文本情感 等。 由 这 三 个 方 面 ,本 文 将 主 要 对 这 三 个 方 面 针对汉 语文字 ,最 常用的是知 网发布 的
文本情感分析方法研究综述

文本情感分析方法研究综述一、本文概述随着信息技术的飞速发展和大数据时代的到来,文本情感分析作为自然语言处理领域的一个热门研究方向,正受到越来越多的关注。
本文旨在对文本情感分析方法进行全面的研究综述,旨在梳理和分析当前情感分析的主要方法、技术及其发展趋势,以期为读者提供一个清晰、系统的认识框架。
本文将简要介绍文本情感分析的研究背景和意义,阐述情感分析在社交媒体分析、舆情监控、产品评价等领域的重要应用。
随后,文章将重点回顾和总结情感分析的发展历程,包括早期的基于词典的方法和规则的方法,以及近年来兴起的基于机器学习和深度学习的情感分析方法。
在详细分析各类情感分析方法时,本文将深入探讨各种方法的原理、优缺点以及适用场景。
文章还将关注情感分析领域的一些前沿研究,如基于深度学习的情感分析模型、多模态情感分析以及情感分析的跨领域应用等。
本文将对未来的研究方向和挑战进行展望,以期为推动文本情感分析技术的发展提供有益的参考和启示。
通过本文的综述,读者可以对文本情感分析方法有一个全面、深入的了解,为相关领域的研究和实践提供有益的借鉴和指导。
二、文本情感分析的发展历程文本情感分析,也称为观点挖掘或情感挖掘,是自然语言处理(NLP)领域的一个重要研究方向。
自20世纪90年代起,随着计算机科学和的飞速发展,文本情感分析逐渐受到了广泛关注,经历了从简单规则到复杂模型的发展历程。
早期的研究主要基于规则或词典的方法。
研究者们通过构建情感词典或情感词汇列表,结合简单的文本处理规则,对文本进行情感倾向的判断。
然而,这种方法受限于情感词典的完备性和规则设计的灵活性,难以处理复杂的语言现象和上下文依赖。
随着机器学习技术的兴起,文本情感分析开始进入新的发展阶段。
研究者们开始尝试使用各种机器学习算法,如朴素贝叶斯、支持向量机(SVM)、最大熵模型等,对文本进行情感分类。
这些算法能够从大量数据中学习出有效的特征表示,从而提高了情感分析的准确性和鲁棒性。
文本情感分析综述

文本情感分析综述目录1. 内容描述 (2)1.1 文本情感分析的定义和重要性 (2)1.2 研究背景和动机 (4)1.3 文档综述的范围和结构 (5)2. 文本情感分析的技术与方法 (6)2.1 传统文本分析方法 (8)2.1.1 语言学角度的分析 (10)2.1.2 心理学角度的分析 (11)2.2 机器学习和人工智能方法 (12)2.2.1 传统的机器学习方法 (14)2.2.2 深度学习方法 (15)2.3 混合和协同方法 (17)2.3.1 数据驱动与问题驱动混合方法 (17)2.3.3 协同过滤与推荐系统 (20)3. 文本情感分析的应用领域 (22)3.1 社交媒体分析 (23)3.2 产品评论分析 (24)3.3 市场策略与消费者行为预测 (26)3.4 医疗健康分析 (27)3.5 情感定向内容生成与推荐系统 (28)4. 存在的问题与挑战 (29)4.1 数据收集与标注的困难 (31)4.2 偏见与多样性问题 (32)4.3 性能评估的标准与方法 (33)4.4 模型复杂性与效率的平衡 (35)5. 未来的研究方向 (36)5.1 跨语言情感分析 (37)5.3 情感识别的道德与隐私问题 (40)5.4 情感分析在边缘计算环境中的应用 (42)1. 内容描述本文深入探討文本情感分析(Text Sentiment Analysis,TSA)的相關概念和技術。
我们将介绍文本情感分析的定义和分类,涵盖情感极性分析、情感細粒度分析以及情感蕴含分析等不同种类,并分析其各自的应用场景和挑战。
我们将系统地综述文本情感分析的关键技术,包括:文本预处理、词特征提取、情感词典、机器学习模型(如Naive Bayes、Support Vector Machines、深度学习模型等)、以及情感分析的评估指标。
本文也将介绍文本情感分析在不同领域的应用,例如市场调查、舆情监测、社交媒体分析、用户体验评估等,并探讨其在推动智慧决策、用户行为洞察和情感识别方面的价值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
( ) 湖北师范学院计算机科学技术学院 , 湖北 黄石 4 3 5 0 0 0
〔 摘 要 〕 随着 W e b 2 . 0 的迅速发展 , 互联网成为人们表达观点 、 抒发情感的重要工具 , 如何有效地从 W e b文本中提取 、 归纳 出用户的情感观点是研究者所面临的重要问题 。 本文首先提出对日益增多的 W e b 文本进行情感分析的必要性 。 然后从文本主客观 性分类 、 情感极性分类和主题及观点持有者抽取等方面介绍文本情感分 析 在 国 内 外 的 研 究 进 展 ; 最 后 总 结 出 今 后 需 深 入 研 究 的 问 题。 〔 关键词 〕 情感分析 ; 主客观分类 ; 情感极性 ; 情感信息抽取
A n O v e r v i e w o f R e s e a r c h o n W e b T e x t S e n t i m e n t A n a l s i s y
L i G u a n m i n u X i n s h a n i o n X u h u i X X g g ( , ,H ,C ) C o l l e e o f C o m u t e r S c i e n c e a n d T e c h n o l o u b e i N o r m a l U n i v e r s i t u a n s h i 4 3 5 0 0 0 h i n a g p g y H y g
[4 ] 国内方面 ,L 提出了基于层叠式 C i u1 R F s模 型 的 句 子
实验分析了上下文信息对主客观分类的影响 。 从国内外研究现状来看 , 通过分类器和特征项选取是完 成文本主客观分类的主要方法 , 那么今后采用更深层 、 更具 针对性的特征项更能提高分类效果 。
褒贬度分析方法能在有效识别句子褒贬度的同时 , 提高了句
2 0 1 4年5月 第3 4 卷第 5 期
现 代 情 报
J o u r n a l o f M o d e r n I n f o r m a t i o n
, M a 2 0 1 4 y V o l . 3 4 o . 5 N
· 综 述 ·
W e b文本情感分析研究综述
李光敏 许新山 熊旭辉
构化的文本进行提 取 和 分 类 的 情 感 分 析 技 术 ( S e n t i m e n t A- ) 便应运而生 。 n a l s i s y
1 文本情感分类
广义上讲 , 文本信息主要用来描述客观性事实和表达主
] 1 , 当前的文本信息处理大多通过关键词抽取文本 观性观点 [
描述中特定事 件 发 生 的 时 间 、 地 点 、 人 物 、 属 性 等 客 观 信 息 。 文本情感分类则先对文本进行主客观分类 , 然后对主观 性文本中的情感信息划分极性 。 极性划分是指对主观性文本 )的肯 进行情 感 极 性 的 识 别 , 并 分 别 标 注 为 正 面 ( P o s i t i v e ) 的否定和中性 ( ) ,即完成情感 定 、 负面 ( N e a t i v e N e u t r a l g 信息分类的第二大任务 。
[ ] 1 2 、最 大 熵 ( P a n S VM) ME) 和 朴 g 使用支持 向 量 机 (
) 分类器 , 采 用 作为特征 , 设计了朴素贝叶斯 ( N a v e B a e s y 1 0 折交叉验证 的 测 试 方 法 , 并 通 过 实 验 证 明 平 均 分 类 准 确 率达到 8 1 . 5 %。W i e b e 又在此 基 础 上 加 入 词 性 和 基 于 词 典
] 1 5 子褒贬强度判 别 的 准 确 度 。 徐 军 [ 等人利用朴素贝叶斯和
1 . 2 主观性文本中的情感极性分类研究
主观性文本 中 的 情 感 极 性 分 类 目 前 主 要 有 两 种 研 究 思 路 : 基于情感知识的情感词典建立 选取 。 1 . 2 . 1 基于情感知识
[ ] 8 、 T o n r e a t a c t i n g 通过人工抽 取 与 影 评 相 关 的 词 汇 ( g g [ ] 7
[ ] 3
的语义词两类特征 项 , 使 得 分 类 效 果 提 升 明 显 。O r t e a 通 g
[ ] 4
过无监督粗 粒 度 的 词 义 消 岐 方 式 来 区 分 每 个 词 的 客 观 、 主 观 、 强主观性用法 , 从而完成句子级的主客观分类 。 由于中文表达的复杂性和特殊性 , 国内在该方面的研究 成果不多 。Y 情 感 形 容 词、第 一 a o 较早 通 过 预 选 特 征 项 (
— 1 7 3 —
2 0 1 4年5月 第3 4 卷第 5 期
W e b文本情感分析研究综述
, M a 2 0 1 4 y V o l . 3 4 o . 5 N
1 . 1 主客观分类国内外研究现状
[] W i e b e2 等人较早将形 容 词 、 副 词 等 和 标 点 及 句 子 位 置
[ ] 5
)3 种分类器对篇章级的电影评论文本进行分 素贝叶斯 ( N B 类对比 , 发现机器学习方法比基于人工标注特征的方法更有
[ ] 1 3 效 , 并且 S VM 在 3 种 分 类 器 中 平 均 表 现 最 好 。T h e l w a l l
, 或第二人称代词 、 标点符号 、 感叹词 、 动词 、 数字和日期 ) 使用 W e k a中多种分类算法进行性能测 试 , 最 后 采 用 6 种 稳 定特征项和用于支持向量分 类 的 连 续 最 小 优 化 算 法 ( S MO) 能达到最高 F 度 量 为 9 3 . 8 % 的 分 类 效 果。W a n g 通过对比
[ ] 6
结合研究用户书写习惯 ( 含感叹号 、 重复标点符号 、 单词中 字母重复等 ) 实现 S e n t i S t r e n t h 算法对 M S a c e评论进行极 g y p 性分类 , 实 验 结 果 表 明 正 向 预 测 准 确 率 达 到 6 0 . 6 %, 负 向 准确率达到 7 2 . 8 %。
: / D O I 1 0 . 3 9 6 9 . i s s n . 1 0 0 8 -0 8 2 1 . 2 0 1 4 . 0 5 . 0 3 7 j 〔 )0 中图分类号 〕T 文献标识码 〕A 〔 文章编号 〕1 P 1 8 0 0 8 -0 8 2 1( 2 0 1 4 5 -0 1 7 3 -0 4 〔
” 中的 “ 草泥马 ” 泥马你何时给老百姓分过房了 ? C N N” 和 “ 暗示负面情 感 。 这 类 网 络 新 词 也 增 加 了 情 感 词 典 建 立 的 难 度。 1 . 2 . 2 基于机器学习算法 基于机器学习算法方式主要使用训练集对统计模型进行 训练 , 最后用训 练 好 的 分 类 器 预 测 新 输 入 文 本 中 的 情 感 极 性。
〔 〕W , A b s t r a c t i t h t h e r a i d d e v e l o m e n t o f W e b 2 . 0 t e c h n o l o I n t e r n e t h a s b e c o m e a n i m o r t a n t t o o l f o r e o l e t o e x - p p g y p p p r e s s t h e i r o i n i o n a n d e m o t i o n . I t i s a c h a l l e n e f o r r e s e a r c h e r s h o w t o e x t r a c t a n d s u mm a r i z e u s e r o i n i o n s e x r e s s e d i n p p g p p , w e b t e x t .F i r s t l t h i s a e r r e s e n t e d t h e n e c e s s i t o f s e n t i m e n t a n a l s i s o n t h e r o w i n W e b t e x t .T h e n i t i n t r o d u c e d y p p p y y g g r e s e a r c h r o r e s s b o t h a t h o m e a n d a b r o a d o f t e x t s e n t i m e n t a n a l s i s f r o m t h e r o s e c t o f e m o t i o n a l i n f o r m a t i o n c l a s s i f i t h e - p g y p p , ,e r o b l e m s c a t i o n a n d i n f o r m a t i o n e x t r a c t i o n .F i n a l l i t s u mm a r i z e d t h e s e n t i m e n t a n a l s i s a l i c a t i o n s t a t u s x i s t i n a n d p y y p p g d e f i c i e n c i e s o f i t . 〔 〕s ; ; ; K e w o r d s e n t i m e n t a n a l s i s s u b e c t i v e c l a s s i f i c a t i o n s e n t i m e n t i n f o r m a t i o n e x t r a c t i o n o l a r i t y j p y y e b文本成为交流情感 、 发表 随着互联网的飞速发展 , W 观点的主要载体和热点话题的信息源 。 用户通过社会化媒体 ( 论坛 、 博客 、 微博 ) 分 享 对 所 购 商 品 的 使 用 感 受 、 新 上 映 电影的评论 、 当前热点新闻的个人看法等 , 这些言论往往包 含有喜 、 怒 、 哀 、 乐 、 肯定 、 否定 、 中立等个人丰富的情感 和观点 。 正是这些包含 丰 富 情 感 的 W e b评 论 文 本 的 涌 现, 一 方 面帮 助 生 产 厂 商 通 过 网 络 口 碑 ( E l e c t r o n i c W o r d-o f- ) 了解产品优势 和 不 足 , 以 改 进 产 品 设 计 和 服 务 , 调 m o u t h 整广告投放策略 , 获得市场竞争优势 ; 另一方面帮助消费者 了解产品性能 , 缩短购买决策时间 。 如果仅靠手工对这些日 益增长的海量信息进行归纳 、 分类 , 显然是不现实的 。 因此 结合信息检索 、 自然语言处理 、 机器学习等领域知识对非结