产品评论挖掘研究综述

合集下载

评论效价、新产品类型与调节定向对在线评论有用性的影响

评论效价、新产品类型与调节定向对在线评论有用性的影响一、本文概述本文旨在探讨评论效价、新产品类型以及调节定向对在线评论有用性的影响。

随着电子商务的迅速发展，在线评论已成为消费者做出购买决策的重要依据。

因此，深入理解哪些因素会影响在线评论的有用性，对于电商平台、商家以及消费者来说都具有重要意义。

本文将从这三个方面入手，系统分析它们对在线评论有用性的影响机制，以期为相关领域的研究和实践提供有益的参考。

具体而言，本文首先将对评论效价进行研究，分析正面评论和负面评论对消费者购买决策的影响，以及在不同产品类型下，消费者对不同效价评论的接受程度。

本文将探讨新产品类型对在线评论有用性的影响，分析消费者在面对创新型产品和改进型产品时，对在线评论的依赖程度和重视程度。

本文将研究调节定向在在线评论有用性中的作用，分析不同调节定向的消费者在面对在线评论时的心理反应和行为倾向。

通过综合考虑这三个方面的影响，本文希望能够为电商平台提供有效的策略建议，帮助商家优化在线评论管理，提高评论的有用性，进而促进消费者的购买决策。

本文也希望能够为消费者提供更加明确和有用的信息，帮助他们更好地利用在线评论做出购买决策。

二、文献综述在线评论的有用性一直以来都是电子商务和营销研究领域的重要议题。

随着互联网的普及和电子商务的快速发展，消费者越来越依赖于在线评论来做出购买决策。

因此，了解哪些因素影响在线评论的有用性变得至关重要。

本文旨在探讨评论效价、新产品类型以及调节定向对在线评论有用性的影响，并在此基础上对相关文献进行综述。

评论效价指的是在线评论的情感倾向，通常分为正面、负面和中性三类。

大量研究表明，评论效价对在线评论的有用性具有显著影响。

正面评论往往能够提升消费者对产品的信任和购买意愿，而负面评论则可能引发消费者的担忧和疑虑。

中性评论则可能缺乏足够的情感色彩，难以对消费者产生明显的影响。

因此，评论效价是评估在线评论有用性的重要因素之一。

新产品类型也是影响在线评论有用性的重要因素。

消费者在线评论影响的研究综述

２０１３年ｌ２月
中国管理信息化
ＣｈｉｎａＭａｎａｇｅｍｅｎｔＩｎｆｏｒｍａｔｉｏｎｉｚａｔｉｏｎ
Ｄｅｃ．，０１２３
第ｌ６卷第２４期
Ｖ０ｌ＿１６．Ｎｏ．２４
消费者在线评论影响的研究综述
张克一
（西南财经大学工商管理学院，成都６ｌｌ１３０）
［摘要］消费者在线评论作为新的网络口碑形式成为企业和消费者决策的重要信息来源。不论是在理论还是在实践等方面受到国外学者的大量关注，并产生了不少高质量的研究成果。本文通过对在线评论相关文献的梳理和归纳．从消费者评论信息的不同语言展现方式角度出发．根据不同的产品类型．研究是否会对其他消费者的网络购物决策产生不良影响［关键词］在线评论信息；信息特征：消费者决策
ｄｏｉ：１０．３９６９／ｊ．ｉｓｓｎ．１６７３—０ｌ９４．２０ｌ３．２４．０４２
［中图分类号］Ｆ７２４．６
［文献标识码］Ａ
［文章编号］１６７３ — ０１９４（２０１３）２４＿０ｏ６８ — ０ｌ
ｉａｎｄ（ＨａｒｒｉｓｏｎＷａｌｋｅｒ．２００１）。根据Ｆｒｏｓｔｅｒ的预计，２０１４年超过５０％的影响．得出语义特征对评论有用性投票的影响最大ＬＺｈａｎ（２０ｌ１）通过实证和实验的方法分析了语言风格，组织结构的销售额将受到网络口碑的影响，而随着互联网的发展，越来越多的消费者使用Ｗｅｂ２．０工具，比如网络讨论论坛、消费者评论以及其他评论内容特征对感知评论有用性的影响消费者的购

文本情感分析方法研究综述

内容摘要
结论：文本情感分析作为一种强大的文本数据分析方法，可以帮助我们更好地理解和识别文本中所表达的情感信息。然而，该方法也存在一些挑战和限制。例如，对于不同领域和场景的情感分析，需要定制化的解决方案；数据清洗和预处理对结果影响较大；模型训练和调优过程较为复杂等。未来，需要进一步研究和改进文本情感分析方法，以适应更多场景和应用需求。
3、研究成果与不足
然而，文本情感分析仍存在一些不足。首先，情感词典的构建和维护需要大量的人力和物力，成为制约文本情感分析发展的重要因素。其次，虽然深度学习在文本情感分析中取得了显著成果，但大多数模型仍依赖于手工设计的特征，如何自动地学习有效的特征是亟待解决的问题。此外，如何处理非情绪性文本和非规范语言表达方式，以及如何处理不同语言和文化的情感分析问题，也是需要进一步探讨的问题。
内容摘要
引言：随着社交媒体和在线平台的快速发展，人们产生和分享文本数据的数量大幅增加。这些文本数据中蕴含着人们的观点、情感和态度，对于理解和引导消费趋势、改善客户服务、预测市场变化具有重要的商业价值。文本情感分析作为一种有效的文本数据分析方法，旨在挖掘这些文本数据中的情感信息，对于企业决策、产品优化等方面具有广泛的应用。
内容摘要
目前，研究人员在情感分析方面已经取得了显著的成果。例如，利用机器学习和深度学习算法，研究人员可以实现对文本的高效情感分类。此外，研究人员还开发了多种情感词典和工具，如褒义词典、贬义词典和情感极性词典等，以帮助更好地进行情感分析。
内容摘要
然而，尽管前人研究取得了不少成果，但仍存在一些不足之处。首先，情感分析的准确性仍需进一步提高。尽管现有的机器学习和深度学习算法在许多情况下能够取得较好的效果，但在处理某些复杂情感时仍存在一定的局限性。其次，现有的情感词典和工具大多基于英语语言，对于其他语言尤其是小语种的情感分析支持不够。因此，针对不同语言的特点开发相应的情感词典和工具是未来的研究方向之一。

用户体验质量(QoE)的模型与评价方法综述

用户体验质量(QoE)的模型与评价方法综述随着互联网和信息技术的飞速发展，用户体验质量(QoE)日益成为评估产品和服务质量的重要指标。

在竞争激烈的市场环境中，提供卓越的用户体验将成为企业赢得用户和提升竞争力的关键。

因此，研究用户体验质量的模型和评价方法对于企业的成功至关重要。

一、用户体验质量模型用户体验质量模型是对用户体验进行描述、评估和解释的框架。

以下将介绍几种常见的用户体验质量模型。

1. 声学模型声学模型主要关注音频和声音方面的用户体验。

该模型通过衡量音频的清晰度、音量、噪音等指标来评估用户体验。

2. 视觉模型视觉模型主要关注视频和图像方面的用户体验。

该模型通过衡量分辨率、亮度、对比度等指标来评估用户体验。

3. 交互模型交互模型主要关注用户与产品或服务之间的互动过程。

该模型通过衡量响应时间、操作方便性、界面设计等指标来评估用户体验。

4. 情感模型情感模型主要关注用户情感、情绪和满意度对用户体验的影响。

该模型通过衡量用户的情感表达、情绪反应和满意度来评估用户体验。

5. 综合模型综合模型将以上多个方面的指标综合考虑，以综合评估用户体验。

该模型综合考虑声学、视觉、交互和情感等因素，能够更全面地评估用户体验。

二、用户体验质量评价方法用户体验质量评价方法是对用户体验质量进行量化和评估的方法。

以下将介绍几种常见的用户体验质量评价方法。

1. 主观评价方法主观评价方法通过收集用户的主观感受和意见来评估用户体验质量。

最常用的主观评价方法是用户调查和用户反馈。

用户调查可以通过问卷、访谈等方式收集用户意见，用户反馈可以通过用户在使用过程中的评论和建议来获取。

主观评价方法能够更直接地了解用户的真实感受和需求，但受到个体主观因素的影响。

2. 客观评价方法客观评价方法通过使用仪器和设备来进行量化评估。

例如，声音和图像的质量可以通过音频和视频质量分析仪器进行测量和评估。

客观评价方法具有客观性强、结果可重复等优点，但可能无法准确反映用户的主观感受。

本科毕业论文文献综述范文(通用7篇)

本科毕业论文文献综述范文第1篇一、什么是文献综述1、文献综述的概念文献综述是对某一学科、专业或专题的大量文献进行整理筛选、分析研究和综合提炼而成的一种学术论文，是高度浓缩的文献产品。

根据其涉及的内容范围不同，综述可分为综合性综述和专题性综述两种类型。

所谓综合性综述是以一个学科或专业为对象，而专题性综述则是以一个论题为对象的。

文献综述反映当前某一领域中某分支学科或重要专题的历史现状、最新进展、学术见解和建议，它往往能反映出有关问题的新动态、新趋势、新水平、新原理和新技术等等。

2、文献综述的作用文献综述在于高度浓缩了几十篇甚至上百篇散乱无序的同类文献之成果与存在问题或争论焦点，对其进行了归纳整理，使之达到了条理化和系统化的程度。

3、要求同学们学写综述的意义1)通过搜集文献资料过程，可进一步熟悉文献的查找方法和资料的积累方法,在查找的过程中同时也扩大了知识面;2)查找文献资料、写文献综述是科研选题的第一步，因此学习文献综述的撰写也是为今后科研活动打基础的过程;3)通过综述的写作过程，能提高归纳、分析、综合能力，有利于独立工作能力和科研能力的提高。

二、文献综述的选题与文献资料的搜集(一)选题原则1.结合所学知识选自己专长的或有基础的题目，否则难以写出水平较高的综述。

2.根据所占有文献资料的质和量选题。

3.选题一定要能反映出新的学科矛盾的焦点、新成果、新动向。

4.题目不宜过大、范围不宜过宽。

这样查阅文献的数量相对较小，撰写时易于归纳整理，否则，题目选得过大，查阅文献花费的时间太多，影响实习，而且归纳整理困难，最后写出的综述大题小作或是文不对题。

(二)文献资料的搜集1、文献资料的搜集途径(1)利用有关的检索工具(包括目录、文摘和索引等)搜集文献资料。

(2)利用国际联机检索系统搜集文献资料。

(3)利用原始文献(包括专业期刊、科技报告、专利文献、学位论文、会议文献、专著和标准等)搜集文献资料。

(4)利用三次文献(包括综述、述评、百科全书、年鉴和手册等)搜集文献资料。

虚假评论检测技术综述

Special Issue 专论•综述 1
引用格式: 尤苡名.虚假评论检测技术综述.计算机系统应用,2019,28(3):1–9. /1003-3254/6812.html
Survey on Review Spam Detection Techniques
YOU Yi-Ming (School of Information Science and Technology, Zhejiang Sci-Tech University, Hangzhou 310018, China) Abstract: With the development of the Internet, users tend to refer to online reviews before shopping, travelling, and dining. After that, they write reviews to express their own opinions. Online reviews are increasingly of great value. The significant guiding role of reviews playing in consumers’ decisions has given rise to false comments, which we call review spam. The review spam refers to the comments written by users that do not meet the true characteristics of products, due to factors such as commercial profits and personal bias. Spammers imitate the writing style of true reviewers so that customers can hardly discriminate the review spam. Scholars at home and abroad use natural language processing techniques to detect review spam. From the perspective of feature engineering, review spam detection methods are divided into three types: the linguistic and behavior based, the graph based, and the representation learning based. This survey mainly describes the general process of review spam detection, summarizes feature designing of the models, and makes a comparison among three types of methods. Furthermore, the most commonly used datasets are introduced. Finally, it explores the research directions in the future. Key words: review spam; review spam detection technique; review spammer detection; opinion mining; natural language processing

《网购消费水平的影响因素研究国内外文献综述3000字》

网购消费水平的影响因素研究国内外文献综述1 国外研究现状及趋势网购消费水平测度及影响因素方面，Xinyu(Jason) Cao等（2013）[1]通过建立结构方程模型，研究明尼阿波利斯和明尼苏达州圣保罗市区的互联网用户，检验两个相互竞争的假说：技术扩散假说和效率假说，实证研究表明购物可达性对电子购物的影响并不一致，主要取决于大城市的地理位置，生活在城市地区、购物便利性较强的地区或两者都有的网民往往比其他地区的网民更经常地在网上购物。

研究消费者网购行为的影响因素方面，Liao Shu hsien等（2011）[2]通过聚类分析方法分析如何提高网上购物率。

Miguel Jaller and Anmol Pahwa（2020）[3]开发了一个计量经济行为模型，以了解影响购物决策的因素。

Ocampo Lanndon等（2021）[4]运用解释结构模型方法理解网络购物驱动关系。

MelovićBoban等（2021）[5]通过结构方程建模和差异分析千禧一代网上购物行为的态度和主要决定因素。

Siyal Musrat等（2021）[6]通过扩展技术验收模型讨论了导致外国人使用网上购物受阻的因素及其行为。

Kim Woojung等（2021）[7]使用多个同时方程模型，研究送货与网上购物之间的关系。

Khathutshelo M. Makhitha等（2021）[8]研究确定人口因素是否影响南非消费者对网上购物态度的风险因素。

Grudiček Ines等（2021）[9]使用SPSSAMOS26建模结构方程对影响克罗地亚消费者网上购物行为的因素进行分析。

Bhattacharyya Sekhar Som等（2021）[10]研究在线评论对千禧一代购买行为的影响，并研究其特点。

Dominici Andrea等（2021）[11]发现远离实体店和拥有汽车并不是网上购物的影响因素。

Deepa S等（2021）[12]发现手机和笔记本电脑方便人们从世界各地购买产品，从而导致人们喜欢网上购物。

游客满意度的内涵、测评及形成机理国外相关研究综述

游客满意度的内涵、测评及形成机理国外相关研究综述一、概述游客满意度是衡量旅游业发展水平的重要指标之一，也是旅游学术界和实务界共同关注的重要问题。

自1970年代游客满意度概念提出以来，其在全球范围内的研究已经取得了丰硕的成果。

本文旨在综述国外关于游客满意度内涵、测评及形成机理的相关研究，以期为提升我国旅游业的服务质量和游客满意度提供理论支持和借鉴。

通过对文献的梳理和评价，本文将剖析游客满意度的影响因素及其作用机理，以期为未来的研究提供借鉴。

同时，本文还将探讨未来研究趋势和需要进一步探讨的问题，以期为我国旅游业的持续发展提供有益参考。

在游客满意度的内涵方面，国外学者普遍认为游客满意度是游客对旅游产品或服务质量的整体评价。

这种评价受到多种因素的影响，包括旅游目的地的自然风光、历史文化、服务质量、交通设施等。

游客满意度不仅反映了游客对旅游体验的期望与实际感知之间的差异，还体现了游客对旅游目的地整体形象的认知和评价。

在游客满意度的测评方面，国外学者提出了多种测评方法。

最常用的方法是问卷调查法，通过设计合理的问卷，收集游客对旅游产品或服务的评价数据，进而分析游客满意度的水平和影响因素。

还有数据挖掘、情感分析等方法，从大量数据中提取游客满意度的相关信息，为游客满意度的测评提供了更多的可能性。

在游客满意度形成机理方面，国外学者提出了多种理论模型。

最著名的模型是期望不一致模型（ExpectationDisconfirmation Model），该模型认为游客满意度是游客期望与实际感知之间的差异所导致的。

还有服务质量差距模型（Service Quality Gap Model）、满意度形成过程模型等，从不同角度探讨了游客满意度形成的过程和机制。

游客满意度的研究对于提升旅游业服务质量和游客满意度具有重要意义。

通过对国外相关研究的综述和评价，本文旨在为我国旅游业的发展提供理论支持和借鉴。

同时，本文还将探讨未来研究趋势和需要进一步探讨的问题，以期为我国旅游业的持续发展提供有益参考。

乔治·利帕德《贵格会市》研究综述

收稿日期：2020-8-17乔治•利帕德《贵格会市》研究综述□ 郝香玉方文开江南大学外国语学院[摘要] 作为美国城市暴露小说之父，乔治·利帕德的小说《贵格会市》在问世十年间畅销不断，之后的五十年间却鲜为人知。

但从20世纪70年代起，许多评论家开始关注利帕德，并试图恢复利帕德美国内战前重要作家的文学地位。

本文系统梳理了利帕德及《贵格会市》的相关国内外研究文献，试图挖掘新的研究视角并为之后的研究提供参考。

[关键词] 乔治·利帕德；《贵格会市》；研究综述；社会改革[中图分类号] I106 [文献标识码] A [文章编号] 1009-6167（2021）02-0013-03作者简介：郝香玉，英语语言文学硕士研究生。

研究方向：美国文学。

方文开，教授，江南大学外国语学院院长。

研究方向：美国文学。

1 作品背景作为19世纪上半叶美国最畅销的作家之一，乔治·利帕德以其在写作中通过暴力色情叙事揭露美国社会丑恶、鞭挞资本主义体制和积极为工人阶级发声而闻名。

在其短暂的十二年创作生涯中，利帕德创办了一份周报（The Quaker City Weekly ），完成了二十多部小说，其中包括最为人知的《贵格会市》，又名《僧侣殿里的僧侣》（The Quaker City, or The Monks of Monk Hall ，1845）。

小说通过发生在僧侣殿里的三个看似松散但又有所关联的故事揭露了费城上流社会贵族和社会体制的虚伪和腐败。

《贵格会市》出版后深受民众喜欢，十年间一再出版，并被认为是“美国第一部揭示城市生活隐秘的作品”。

但该小说充斥着暴力、色情和犯罪情节，为此招来了不少评论家的批评和谴责。

但可以确定的一点是，《贵格会市》在美国早期城市暴露小说这一体裁中的奠基地位已得到普遍认可，利帕德也因此被称为19世纪美国城市暴露小说之父。

作为积极的社会活动家，利帕德还创办了联盟兄弟会并积极参与社会活动，思考并身体力行地应对着那个时代激烈的社会变革给人们所带来的众多问题。

文献综述的类型

一、文献综述的类型、特点及作用文献综述是“一种在分析、比较、整理、归纳一定时空范围内有关特定课题研究的全部或大部情报的基础上,简明的类述其中的最重要部分,并标引出处的情报研究报告”。

文献综述的定义包含三个基本要素:首先,文献综述反映原始文献有一定的时间和空间范围,它反映一定时期内或是某一时期一定空间范围的原始文献的内容。

其次,文献综述集中反映一批相关文献的内容。

其它二次文献如题录、索引、文摘、提要等一条只能揭示一篇原始文献的外表信息或内容信息,且各条目之间没有联系,而综述一篇可集中一批相关文献,且将这批文献作为一个有机整体予以揭示,信息含量比二次文献多得多。

第三,文献综述是信息分析的高级产物。

书目、索引等是对原始文献的外表特征进行客观描述,不涉及文献内容,编写人员不需了解原始文献的内容,也不需具备相关学科的基础知识;提要、文摘是对原始文献的内容作简要介绍和评价,编写人员需要具有相关学科的一些基础知识,以识别和评价原始文献;文献综述则要求编写人员对综述的主题有深入的了解,全面、系统、准确、客观地概述某一主题的内容。

运用分析、比较、整理、归纳等方法对一定范围的文献进行深度加工,对于读者具有深度的引导功能,是创造性的研究活动。

1.文献综述的类型可以从不同的角度对文献综述进行划分,最常见的方法是根据文献综述反映内容深度的不同即信息含量的不同划分按照文献综述信息含量的不同,可将文献综述分为叙述性综述、评论性综述和专题研究报告三类。

叙述性综述是围绕某一问题或专题,广泛搜集相关的文献资料,对其内容进行分析、整理和综合,并以精炼、概括的语言对有关的理论、观点、数据、方法、发展概况等作综合、客观的描述的信息分析产品。

叙述性综述最主要特点是客观,即必须客观地介绍和描述原始文献中的各种观点和方法。

一般不提出撰写者的评论、褒贬,只是系统地罗列。

叙述性综述的特点使得读者可以在短时间内,花费较少的精力了解到本学科、专业或课题中的各种观点、方法、理论、数据,把握全局,获取资料。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2008, 44(36 1引言随着 Web 的广泛使用,用户购买和使用产品之后会在 Web 上发表对产品的评论, 这些评论中包含用户对产品的性能或功能等方面持有肯定还是否定的态度。生产厂商和用户对产品评论的分析可以获得大量的有用信息:生产厂商不仅可以了解用户对产品目前已提供的性能的评价和产品的不足, 还可以了解用户的需求,找出用户最感兴趣和最希望提供的功能, 从而改进产品 [1]。用户购买产品之前可以了解已经购买了该产品的用户关于该产品的使用体验,了解产品各个方面的性能, 还可以对同类型的产品按照性能进行对比, 从而合理地购买产品 [2]。

目前用户一般通过在 Web 上填写问卷调查表的方式或直接使用自然语言发表一段评论的方式来表达对产品的态度。问卷调查表属于结构化数据, 可以使用成熟的数据库技术进行分析并显示统计结果, 自然语言描述的产品评论属于无结构化数据, 生产厂商和用户要想从产品评论中获取信息, 只有通过人工阅读方式来获取信息, 而这是一个消耗时间且容易产生错误的过程。因此产生了对用户评论挖掘的研究, 目的是通过采用

自然语言处理技术, 对自然语言描述的无结构的用户产品评论中进行数据的自动挖掘, 找到有用的信息, 并以直观的方式对挖掘结果进行表示。

2产品评论挖掘框架产品评论挖掘是文本挖掘研究领域中最近几年兴起的研究热点, 以 Web 上发表的用户产品评论作为挖掘对象, 采用自然语言处理技术,从大量文本数据中发现用于对该产品各方面性能的评价。目前产品评论挖掘分为产品特征提取、主观句定位、用户态度提取、态度极性判定和挖掘结果显示 5个子任务 (如图 1 。 (1 产品评论语料库。产品评论挖掘是针对某类产品 (比如手机、数码相机进行挖掘, 因此必须首先建立产品评论的语料库。目前研究主要采用从指定的网站 (比如英文的 www.Ama -zon.com 、中文的 pinglun.IT168.com 获取某类产品的产品评论来构建产品评论语料库。

(2 产品特征提取。从产品评论中发现用户对产品的哪些产品特征 (产品的部件、部件的性能或功能进行了评价。

基金项目:重庆市自然科学基金 (the Natural Science Foundation of Chongqing City of China under Grant No.2007BB2134 。

作者简介:伍星 (1978- , 男, 博士研究生, 讲师, 主要研究方向为自然语言理解、 Web 挖掘; 何中市 (1968- , 博士, 教授, 博导, 主要研究方向为机器

-收稿日期:2008-09-15 修回日期:2008-10-16 产品评论挖掘研究综述伍星, 何中市, 黄永文 WU Xing , HE Zhong-shi , HUANG Yong-wen 重庆大学计算机学院, 重庆 400044 Computer College of Chongqing University , Chongqing 400044, China E-mail :wuxing@cqu.edu.cn

WU Xing , HE Zhong-shi , HUANG Yong-wen.Product review mining :A survey.Computer Engineering and Applications , 2008, 44(36 :37-41. Abstract :Product review mining is the process of finding information from product reviews on the Web through natural language process technology.It is a rising field that is the sub field of unstructured data mining from plain text.The information mined from product reviews can help manufacturers to improve their product , and help user to buy product with more rationality.A survey of product review mining is discussed.Firstly , the framework of product review mining is analyzed.Then , the tasks of product review

mining that include subjective sentence identify , product feature extracting , user attitude extracting , polarity classifying and mining result show are also described in detail , and finally the future reseach directions about product review mining are pointed out. Key words :textual pattern ; subjective feature ; word polarity

摘要: 产品评论挖掘是以 Web 上用户发表的产品评论为挖掘对象, 采用自然语言处理技术, 从大量的文本数据中发现关于产品的功能和性能的评价信息的过程。产品评论挖掘是一个新兴的研究领域, 是对自然语言描述的无结构数据进行数据挖掘的典型代表。产品评论中挖掘得到的信息不仅可以帮助生产厂商改进产品, 还可以帮助用户合理的购买产品。对产品评论挖掘进行了全面深入地讨论, 介绍了产品评论挖掘系统的通用框架, 然后对产品特征提取、主观句定位、用户态度提取、态度极性判定、挖掘结果显示这 5个子任务进行了详细地阐述, 最后介绍了产品评论挖掘的最新方向。

关键词: 用户评论; 主观特征; 词语极性 DOI :10.3778/j.issn.1002-8331.2008.36.010 文章编号:1002-8331(2008 36-0037-05 文献标识码:A 中图分类号:TP18 Computer Engineering and Applications 计算机工程与应用 37 Computer Engineering and Applications 计算机工程与应用 2008, 44(36 产品评论语料库产品特征提取主观句定位产品特征集合主观句集合用户态度提取态度极性判定挖掘结果显示图 1产品评论挖掘系统框架 1. 最大的缺点是电池容量小使用时间短。 2. 外表华丽, 适合白天使用夜景不用三角架不行, 防抖极差, 防红眼基本不起作用。

3. SONY T9可以放在裤兜里。图 2产品特征 (3 主观句定位。发现产品评论中的哪些句子用户表达了对产品的主观态度。

(4 用户态度提取。从主观句中寻找表示用户态度的单词、短语或结构。 (5 态度极性判定。确定用户态度的极性:正性 (肯定、支持 /负性 (否定、反对。

(6 挖掘结果显示。对挖掘结果进行直观地显示。文章的后续部分将对产品评论的 5个子任务进行详细地介绍。

2.1产品特征提取生产厂商一般会提供一个关于产品各个方面性能的说明文件, 但是产品评论挖掘一般不从这样的说明性文件中提取产品特征, 主要原因是:首先生产厂商和用户对产品特征关注的角度不一样, 生产厂商提供的产品特征更多的专注于一些技术细节, 对于这样的细节用户一般不感兴趣; 其次产品评论中对特征的描述是一个开放性的问题, 用户可能在产品评论中发表生产厂商根本没有考虑到的一些产品特征, 因此需要从产品评论语料库中提取产品特征。

产品特征分为显示特征和隐示特征, 显示特征是直接出现在产品评论中描述产品的性能或功能的名词或名词短语。隐示特征没有在语句中直接进行描述, 需要句子进行语义理解才能

得到。图 2中的第 1、 2句中的电池容量、外表、三脚架和防红眼是显示特征, 而第 3句中语句的字面语义是相机容易放在口袋

里, 其实指出了 SONY T9的大小这个隐示特征。提取隐示特征需要自然语言的完全理解技术, 而该技术不成熟, 因此目前的

产品评论挖掘中产品特征提取均都只考虑显示产品特征。显示产品特征的提取分为人工定义和自动提取两类方法。人工定义就是针对特定领域的产品建立该领域的产品特征词

汇表。 Li Zhuang 人工定义针对电影的产品特征, 将电影的产品特征分为两类:电影的元素 (比如:screenplay 、 vision effect 和

与电影相关的人员 (比如:director 、 screenwriter 、 actor [3]。姚天昉利用本体建立了汽车的产品特征 [4]; Kobayashi 、 Inui 和 Mat -sumoto 以半自动的方式建立了针对汽车和游戏的产品特征, 首 (论文档中抽取候选的特征, 再以人工的方式进行标注 [5]。

采用人工定义产品特征的方法, 每一个领域的产品都需要该领域的专家参与才能定义该领域的产品特征, 因此移植性较