产品评论挖掘研究综述

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2008, 44(36 1引言

随着 Web 的广泛使用,用户购买和使用产品之后会在

Web 上发表对产品的评论, 这些评论中包含用户对产品的性能或功能等方面持有肯定还是否定的态度。生产厂商和用户对产品评论的分析可以获得大量的有用信息:生产厂商不仅可以了解用户对产品目前已提供的性能的评价和产品的不足, 还可以了解用户的需求,找出用户最感兴趣和最希望提供的功能, 从而改进产品[1]。用户购买产品之前可以了解已经购买了该产品的用户关于该产品的使用体验,了解产品各个方面的性能, 还可以对同类型的产品按照性能进行对比, 从而合理地购买产品 [2]。

目前用户一般通过在 Web 上填写问卷调查表的方式或直接使用自然语言发表一段评论的方式来表达对产品的态度。问卷调查表属于结构化数据, 可以使用成熟的数据库技术进行分析并显示统计结果, 自然语言描述的产品评论属于无结构化数据, 生产厂商和用户要想从产品评论中获取信息, 只有通过人工阅读方式来获取信息, 而这是一个消耗时间且容易产生错误的过程。因此产生了对用户评论挖掘的研究, 目的是通过采用

自然语言处理技术, 对自然语言描述的无结构的用户产品评论

中进行数据的自动挖掘, 找到有用的信息, 并以直观的方式对挖掘结果进行表示。

2产品评论挖掘框架

产品评论挖掘是文本挖掘研究领域中最近几年兴起的研究热点, 以 Web 上发表的用户产品评论作为挖掘对象, 采用自然语言处理技术,从大量文本数据中发现用于对该产品各方面性能的评价。目前产品评论挖掘分为产品特征提取、主观句定位、用户态度提取、态度极性判定和挖掘结果显示 5个子任务 (如图 1 。

(1 产品评论语料库。产品评论挖掘是针对某类产品 (比如手机、数码相机进行挖掘, 因此必须首先建立产品评论的语料库。目前研究主要采用从指定的网站 (比如英文的 www.Ama 、中文的 获取某类产品的产品评论来构建产品评论语料库。

(2 产品特征提取。从产品评论中发现用户对产品的哪些产品特征 (产品的部件、部件的性能或功能进行了评价。

基金项目:重庆市自然科学基金 (the Natural Science Foundation of Chongqing City of China under Grant No.2007BB2134 。

作者简介:伍星 (1978- , 男, 博士研究生, 讲师, 主要研究方向为自然语言理解、Web 挖掘; 何中市 (1968- , 博士, 教授, 博导, 主要研究方向为机器

-收稿日期:2008-09-15

修回日期:2008-10-16

产品评论挖掘研究综述

伍星, 何中市, 黄永文 WU Xing , HE Zhong-shi , HUANG Yong-wen

重庆大学计算机学院, 重庆 400044

Computer College of Chongqing University , Chongqing 400044, China E-

mail :wuxing@

WU Xing , HE Zhong-shi , HUANG Yong-wen.Product review mining :A puter Engineering and Applications , 2008, 44(36 :37-41. Abstract :Product review mining is the process of finding information from product reviews on the Web through natural language process technology.It is a rising field that is the sub field of unstructured data mining from plain text.The information mined from

product reviews can help manufacturers to improve their product ,

and help user to buy product with more rationality.A survey of product review mining is discussed.Firstly , the framework of product review mining is analyzed.Then , the tasks of product review

mining that include subjective sentence identify , product feature extracting , user attitude extracting , polarity classifying and mining result show are also described in detail , and finally the future reseach directions about product review mining are pointed out. Key words :textual pattern ; subjective feature ; word polarity

摘要:

产品评论挖掘是以 Web 上用户发表的产品评论为挖掘对象, 采用自然语言处理技术, 从大量的文本数据中发现关于产品的功能和性能的评价信息的过程。产品评论挖掘是一个新兴的研究领域, 是对自然语言描述的无结构数据进行数据挖掘的典型代表。产品评论中挖掘得到的信息不仅可以帮助生产厂商改进产品, 还可以帮助用户合理的购买产品。对产品评论挖掘进行了全面深入地讨论, 介绍了产品评论挖掘系统的通用框架, 然后对产品特征提取、主观句定位、用户态度提取、态度极性判定、挖掘结果显示这 5个子任务进行了详细地阐述, 最后介绍了产品评论挖掘的最新方向。

关键词:

用户评论; 主观特征; 词语极性 DOI :10.3778/j.issn.1002-8331.2008.36.010

文章编号:1002-8331(2008 36-0037-05

文献标识码:A

中图分类号:TP18

Computer Engineering and Applications 计算机工程与应用 37

相关文档
最新文档