产品评论挖掘研究综述.

合集下载

在线评论研究现状综述及未来展望

在线评论研究现状综述及未来展望
前 沿 理 论
中国市场 2 0 1 7 年第 1 6期 ( 总第 9 3 5 期)
在 线 评 论 研 究 现 状 综 述 及 未 来 展 望
徐 慧 ,康 丽
( 三江学院 商学院 ,江苏 南京 2 1 0 0 1 2 )
[ 摘 要 ] 随着移动 互联 网技 术的飞速发展 ,网络购物成为人们购物 时的一种重要 选择。 消费者利用 网络 来分 享产 品的 相关信息 ,潜在 消费者依据 购买者的评价信 息 ,做 出是 否购 买的决策 ,在线评论对 消费者购物 决策的影响 日趋 重要 。文章通 过对在线评论 内涵、在 线评论特征指标及 对消 费者购 买决策的影响 、在线评论对企 业经营活动 的影响 这三个方面的研 究成果 进行梳理 ,指 出现有研 究存在 不足 并展 望未来研 究方向或重点。
[ 关键 词]在 线评论 ;特征 指标 ;购买决策 ;综述
[ D O1 ]1 0 . 1 3 9 3 9 / j . c n k i . z g s c . 2 0 1 7 . 1 6 . 0 1 4 2 0 1 6年 6月中 国互联 网络信息 中心 ( 以下简称 C N N I C) 发布 的 4 2 0 1 5年 中国网络 购物 市场 研究 报告 》 中指 出,在
买 意愿 。 在线 评 论 中 可 能存 在 一 些 无 效 甚 至 恶 意 的评 论 ,对 消 费 者决 策 产 生 一 定 负 面 影 响 ,因 而 ,在 线 评 论 的有 用 性 越
或负 面的评论 。 而郭 国庆等 ( 2 0 1 0 )认为在 线评论 是 由网
络购物消 费者 发表在互 联网上 ,涉及对产品或服务 的满意 和 抱怨 ,或 内 心 对 该 商 品 的 使 用 感 觉 的 表 达 。 【 张 小 娟 ( 2 0 1 5 )认为在线评论是消 费者在 网站上发 布 的,关 系产 品

在线评论对消费者购买行为的研究综述

在线评论对消费者购买行为的研究综述

在线评论对消费者购买行为的研究综述李丽(武汉大学湖北·武汉430079)摘要近年来,网络的迅速发展推动以网络为载体的口碑传播飞速增长,在线评论作为口碑传播的一种新形式,为学术研究提供了新的内容:在网络环境中,在线评论以文本形式出现,看得见、可复制的特征为学者们利用内容分析,模拟其影响消费者的真实过程提供了方便,引起实践界和理论界的重视。

本文将对国内文献进行综述,以分析总结我国近年来研究在线评论对消费者购买意愿影响机制的情况。

关键词在线评价消费者购买意愿中图分类号:F713.5文献标识码:A0引言在线评论是指消费者在购物网站或者其他评论网站、论坛根据自己的亲身体验或他人的经历对某种产品或服务发表的正面或负面的看法。

这一定义也强调了在线评论的易获取性,因此在线评论拥有其它口碑形式所不能比拟的易获取性优势,已成为消费者购买决策过程中最具影响力的信息来源之一。

在我国文化环境下,消费者做出购买决策时在很大程度上受到他人的影响,在线评论对消费者购买决策的影响也备受国内学者的关注。

通过掌握在线评论的特征,消费者可以知晓人们对商品优劣的评价,识别和摒除在线评论中由外部动机带来的主观偏差,优化购买决策。

可以帮助网络商家重视网站投资,识别在线评论各因素影响重要程度,探明在线客户评论对消费者购买决策的影响机理,使其按照趋利避害原则控制在线评论传播的影响力,提高其竞争优势。

1在线评论对消费者购买行为的研究综述在线评论与消费者购买意愿二者之间的关系。

对于在线评论对消费者购买意愿的影响的研究,早期主要集中于从在线评论的特征出发来研究其影响。

随着研究的深入,学者们开始对在线评论对消费者购买意愿影响的内在因素进行实证研究,本文从在线评论特征、消费者特征和二者关系之间中介或调节因素三个角度进行归纳,具体如下:(1)从在线评论特征的角度。

龚诗阳、刘霞、赵平等人从评论数量、评论效价和评论差异三个方面(以在线图书为例)研究了在线评论对消费者购买的影响。

在线评论研究综述:基于细粒度情感分析视角

在线评论研究综述:基于细粒度情感分析视角

35摘要:在电子商务服务中,用户的在线评论对消费者的购买决策与商家行为的影响日益凸显,如何利用这一重要的在线文本数据去挖掘用户的情感倾向成为学界以及业界关注的焦点。

经过文献整理,本文梳理出一个在线评论的细粒度层次情感分析业务流程,基于这一流程分析了本领域的研究与发展现状,为未来的研究提供参考。

关键词:在线评论;文本挖掘;情感分析引言近年来我国电子商务飞速发展,各类电商平台大量崛起,据国家统计局统计数据显示:2017年网上零售额达到71751亿元,同比2016年增长32.2%。

伴随电子商务的不断普及以及平台逐步完善的业态功能体系,电商平台带来了大量个性化、网络化、非结构化的在线评论文本。

在线评论作为一种新型的口碑传播方式,打破了传统口碑以人际扩散为基础的时空限制,使得潜在消费者可以通过阅读评论来完善对产品的认知,辅助完成购买决策。

商家可以通过收集评论内容来分析用户对商品的态度,获取用户的喜好进而更好的为消费者服务。

基于在线评论在电子商务链条中重要的作用,国内外学者对此领域给予了极大关注,本文收集了近年国内外在线评论研究的文献成果,从情感分析视角出发,对在线评论领域的相关技术应用以及研究现状进行概述。

1、基于文本情感分析的在线评论研究信息爆炸时代,互联网的高度开放性和可追溯性使得消费者在作出网购决策前面对着海量的消费者评论,这些评论通常包含着他人有价值的观点意见,对这些包含观点的评论文本进行人工识别和分析是极其低效率的,因此自动化的文本情感分析成为当前主流的应用领域。

情感分析,是属于文本挖掘的一个细分研究领域,是指通过自然语言的处理从文本中提取出人们对于实体及其属性所表达的观点、情感、态度和情绪等[1]。

从分析的粒度层次来看可划分为粗粒度情感分析和细粒度情感分析,粗粒度情感分析包括篇章级和句子级情感分析,细粒度层次的分析则是基于评价对象及其属性的分析。

伴随着人工智能、自然语言处理技术的进步,业界对情感分析的要求逐步提高,细粒度层次的情感分析正成为当前国内外研究的热点内容,本文通过分析当前细粒度层次情感分析的业务流程来对当前在线评论研究进行概述。

面向产品评论的意见挖掘研究综述

面向产品评论的意见挖掘研究综述

/ பைடு நூலகம்
文章 编 号 : 1 0 0 7 — 1 4 2 3 ( 2 0 1 3 ) 0 7 — 0 0 1 1 - 0 6
D OI : 1 0 . 3 9 6 9 / j . i s s n . 1 0 0 7 — 1 4 2 3 . 2 0 1 3 . 0 7 . 0 0 3
面 向产 品 评 论 的意 见 挖 掘研 究 综 述
针 对 产 品 评 论 的 意 见 挖 掘 一 直 是 意 见 挖 掘 领 域 的 热
近年来 . 随 着 以用 户 为 中 心 的 We b 2 . 0技 术 的快 速
发展 和应用 的不断扩 展 , 人 们可 以通过微 博 、 博客 、 论 坛 、电子商务 网站等多种途径发 表 自己 的对 于某件产 品或服务 的意见 或观点 .这些评论 信息 中包含 了用户
点。 文献『 2 1 认为, 意 见 是 意 见 持 有 者 针 对 某 个 实 体 或 实 体某个方 面的正面或者 负面的观点 、 态度 、 情 感 或 者 评 价. 其 中意 见 的表 达 对 象 可 以是 任 何 事 物 , 例如 产 品 、 服务 、 事件 、 主题等 , 意 见 的 持 有 者 可 以是 个 人 或 组 织 。 在 本 章 中 .我 们 将 利 用 来 自 A m a z o n . c n的一 段 关 于 笔 记 本 电脑 的评 论 来 进 一 步 阐述 意 见 挖 掘 这 个 问题 “ ( 1 ) 十一 月 底 打 特价 买 的 这 个 本 。 ( 2 ) 开 箱 封 条 是 完 整的 , 货运保护措施 也很到位 。( 3 ) 可 是 本 本 后 面 几 颗 螺 丝 有 非 常 明 显 的划 痕 . 还 有 屏 幕 上 有 几 条 划 痕 。

京东在线评论对生鲜农产品销量影响的实证

京东在线评论对生鲜农产品销量影响的实证

口碑传播理论
口碑传播是影响消费者购买决策 的重要因素,在线评论作为互联 网时代的口碑传播方式,对生鲜
农产品销量具有重要影响。
信任转移理论
消费者往往将对其他消费者的信 任转移到其产品评价上,因此, 正面在线评论有助于提升消费者 对生鲜农产品的信任感,从而促
进销量增长。
研究方法与数据来
03

研究假设与模型构建
稳健性检验
变量替换:尝试使用其他可能的变量替换原有变量,如使用评论长度的对数替换原 评论数量,观察模型结果的变化,以验证原模型的稳健性。
子样本分析:从不同时间段、不同产品类别等角度抽取子样本进行分析,观察模型 结果是否稳定,以进一步检验模型的稳健性。
通过以上实证分析,可以全面深入地研究京东在线评论对生鲜农产品销量的影响。
对销量的影响差异。
考虑更多影响因素
03
除了在线评论外,还可以考虑其他影响因素,如价格、促销活
动等,以更全面地解析生鲜农产品销量的影响因素。
THANKS.
假设1
评论数量与生鲜农产品销量正相 关。随着评论数量的增加,生鲜
农产品的销量也会相应增加。
假设2
评论质量对生鲜农产品销量有影响 。评论中包含的情感倾向、详细程 度等信息会对消费者的购买决策产 生影响,从而影响销量。
模型构建
基于上述假设,可以采用回归分析 等方法,构建评论数量、评论质量 与生鲜农产品销量之间的数学模型 ,进行实证分析。
品牌和商家的信誉度在评论与销量关系中起到调节作用。信誉度高的品牌和商家能够更好 地利用在线评论提升销量。
管理启示与建议
重视在线评论管理
生鲜农产品商家应高度重视在线评论的管理,通过积极回 应、解决问题和合理引导,提升评论质量和数量,促进销 量的提升。

《基于文本与用户行为挖掘的虚假评论识别研究》范文

《基于文本与用户行为挖掘的虚假评论识别研究》范文

《基于文本与用户行为挖掘的虚假评论识别研究》篇一一、引言随着互联网技术的不断发展,在线评论平台已经成为消费者决策的重要依据。

然而,由于商业利益的驱动,虚假评论的存在却对评论的真实性和可信度产生了严重的负面影响。

为了有效应对这一问题,本研究提出了基于文本与用户行为挖掘的虚假评论识别方法。

本文将详细介绍该方法的理论基础、研究方法及实验结果,以期为虚假评论的识别与防范提供参考。

二、研究背景及意义在线评论已经成为消费者获取商品信息、评价及选择的重要依据。

然而,随着电子商务的迅猛发展,虚假评论问题日益严重,严重影响了消费者的购物体验和决策。

虚假评论不仅误导了消费者,还损害了商家的信誉。

因此,研究虚假评论的识别方法,对于提高在线评论的真实性和可信度,维护消费者权益,促进电子商务的健康发展具有重要意义。

三、研究方法本研究采用基于文本与用户行为挖掘的虚假评论识别方法,主要包括以下几个方面:1. 文本挖掘:通过对评论内容的语义、情感、语言风格等特征进行提取和分析,识别出虚假评论的文本特征。

2. 用户行为挖掘:通过对用户的行为数据进行分析,包括评论频率、评论时间、评论内容相似度等,挖掘出虚假评论的用户行为特征。

3. 特征融合:将文本挖掘和用户行为挖掘得到的特征进行融合,构建虚假评论的识别模型。

4. 模型训练与优化:利用大量真实数据对模型进行训练和优化,提高识别准确率。

四、实验结果与分析1. 实验数据集:本研究采用了公开的在线评论数据集进行实验,包括商品评论、用户行为数据等。

2. 实验方法与步骤:首先对评论内容进行文本挖掘,提取出语义、情感、语言风格等特征;然后对用户行为数据进行挖掘,提取出评论频率、评论时间、评论内容相似度等特征;最后将两者特征进行融合,构建虚假评论的识别模型。

3. 实验结果:通过大量实验,我们发现该方法能够有效识别虚假评论。

在准确率、召回率、F1值等指标上均取得了较好的效果。

五、讨论与展望本研究提出的基于文本与用户行为挖掘的虚假评论识别方法具有一定的实用性和可行性。

在线评论对消费者购买行为的研究综述

在线评论对消费者购买行为的研究综述

在线评论对消费者购买行为的研究综述随着互联网技术和电子商务的迅猛发展,在线购物已成为许多消费者的首选,购物行为也从线下转移到线上。

与此同时,消费者对于商品评价的重视程度也逐渐提升,越来越多的人在购买商品前会查看其他消费者的评价和评论。

因此,在线评论在消费者的购买行为中扮演着越来越重要的角色。

本文将综述国内外学者在在线评论对消费者购买行为方面的研究成果,分类总结其影响因素,为相关企业提供参考。

一、在线评论的定义在线评论(Online Reviews)指在商品的销售网站上,由消费者对所购买的商品进行文字、图片、视频等形式的评价和反馈,它是一种传播消费者体验的方式,可以帮助其他消费者对商品进行更好的了解和选择。

二、在线评论的影响因素1.评论内容影响在线评论对消费者购买行为的因素众多,其中最为显著的是评论的内容。

在线评论主要包括商品的质量、价格、服务、配送等方面,以及消费者对于这些方面的评价和建议。

研究表明,评论内容越多越详细、越真实可信,消费者的购买意愿越高,反之亦然。

2.评论情感评论情感是又一个极为重要的因素,它指评论中所包含的喜好或厌恶情感。

消费者购买行为往往会受到情感因素的影响。

例如,前期积累了一定的好评,能够有效地增强消费者的购买意愿;而遭遇大量的差评则会让消费者对该商品失去信心。

3.评价者特征评价者特征也是影响消费者对于在线评论的看法的一个因素。

一些原本对于商品毫无了解的人,可能因为看到其他消费者好评如潮而产生了购买欲望,而一些对于商品较为了解并有自己的判断的人则可能会选择忽略高度集中的评论。

4.定价策略定价策略也会影响到消费者对于在线评论的看法。

例如,消费者在看到某品牌的价位过高时,容易将其与其他同类产品进行比较,此时其他消费者的评论就显得相对重要。

研究表明,在线评论对消费者的购买意愿、购买量和满意度有着显著的积极影响。

对于消费者而言,在线评论能够提供多方面、多角度的信息,减少购买风险,帮助消费者做出准确的购买决策。

《基于CNN的中文评论情感分类研究》范文

《基于CNN的中文评论情感分类研究》范文

《基于CNN的中文评论情感分类研究》篇一一、引言随着互联网的迅猛发展,社交媒体和在线评论平台上的用户生成内容(UGC)已成为消费者了解产品、服务以及企业的重要途径。

这些中文评论中蕴含了大量的情感信息,因此,对中文评论进行情感分类研究具有重要的实际意义。

近年来,卷积神经网络(CNN)在自然语言处理领域取得了显著的成果,本文旨在探讨基于CNN的中文评论情感分类研究。

二、相关文献综述在过去的研究中,情感分类主要依赖于传统的机器学习方法,如支持向量机(SVM)、朴素贝叶斯(Naive Bayes)等。

然而,这些方法在处理复杂的中文评论时,往往难以捕捉到评论中的语义信息和情感表达。

近年来,深度学习技术在自然语言处理领域取得了重要突破,其中CNN因其优秀的特征提取能力在情感分类任务中表现优异。

三、研究问题与方法本文采用基于CNN的模型对中文评论进行情感分类研究。

首先,对中文评论进行预处理,包括分词、去除停用词等步骤。

然后,构建CNN模型,通过卷积层和池化层提取评论中的有效特征。

最后,使用全连接层对提取的特征进行分类,得到评论的情感极性(如积极、消极、中立等)。

四、实验设计与实现1. 数据集:本文使用公开的中文评论数据集进行实验,包括电影、酒店、餐厅等领域的评论。

2. 模型架构:构建包含多个卷积层和池化层的CNN模型,通过调整超参数优化模型性能。

3. 训练与优化:采用交叉熵损失函数和Adam优化器对模型进行训练,通过调整学习率和批大小等参数优化模型性能。

4. 评估指标:采用准确率、召回率、F1值等指标评估模型的性能。

五、结果与讨论1. 实验结果:本文所提出的基于CNN的中文评论情感分类模型在公开数据集上取得了较高的准确率、召回率和F1值,证明了模型的有效性。

2. 结果分析:通过分析模型的输出结果,发现CNN能够有效地提取评论中的语义信息和情感表达,从而实现对中文评论的情感分类。

此外,通过调整模型超参数和优化算法,可以进一步提高模型的性能。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2008, 44(36 1引言随着 Web 的广泛使用,用户购买和使用产品之后会在Web 上发表对产品的评论, 这些评论中包含用户对产品的性能或功能等方面持有肯定还是否定的态度。

生产厂商和用户对产品评论的分析可以获得大量的有用信息:生产厂商不仅可以了解用户对产品目前已提供的性能的评价和产品的不足, 还可以了解用户的需求,找出用户最感兴趣和最希望提供的功能, 从而改进产品[1]。

用户购买产品之前可以了解已经购买了该产品的用户关于该产品的使用体验,了解产品各个方面的性能, 还可以对同类型的产品按照性能进行对比, 从而合理地购买产品 [2]。

目前用户一般通过在 Web 上填写问卷调查表的方式或直接使用自然语言发表一段评论的方式来表达对产品的态度。

问卷调查表属于结构化数据, 可以使用成熟的数据库技术进行分析并显示统计结果, 自然语言描述的产品评论属于无结构化数据, 生产厂商和用户要想从产品评论中获取信息, 只有通过人工阅读方式来获取信息, 而这是一个消耗时间且容易产生错误的过程。

因此产生了对用户评论挖掘的研究, 目的是通过采用自然语言处理技术, 对自然语言描述的无结构的用户产品评论中进行数据的自动挖掘, 找到有用的信息, 并以直观的方式对挖掘结果进行表示。

2产品评论挖掘框架产品评论挖掘是文本挖掘研究领域中最近几年兴起的研究热点, 以 Web 上发表的用户产品评论作为挖掘对象, 采用自然语言处理技术,从大量文本数据中发现用于对该产品各方面性能的评价。

目前产品评论挖掘分为产品特征提取、主观句定位、用户态度提取、态度极性判定和挖掘结果显示 5个子任务 (如图 1 。

(1 产品评论语料库。

产品评论挖掘是针对某类产品 (比如手机、数码相机进行挖掘, 因此必须首先建立产品评论的语料库。

目前研究主要采用从指定的网站 (比如英文的 www.Ama 、中文的 获取某类产品的产品评论来构建产品评论语料库。

(2 产品特征提取。

从产品评论中发现用户对产品的哪些产品特征 (产品的部件、部件的性能或功能进行了评价。

基金项目:重庆市自然科学基金 (the Natural Science Foundation of Chongqing City of China under Grant No.2007BB2134 。

作者简介:伍星 (1978- , 男, 博士研究生, 讲师, 主要研究方向为自然语言理解、Web 挖掘; 何中市 (1968- , 博士, 教授, 博导, 主要研究方向为机器-收稿日期:2008-09-15修回日期:2008-10-16产品评论挖掘研究综述伍星, 何中市, 黄永文 WU Xing , HE Zhong-shi , HUANG Yong-wen重庆大学计算机学院, 重庆 400044Computer College of Chongqing University , Chongqing 400044, China E-mail :wuxing@WU Xing , HE Zhong-shi , HUANG Yong-wen.Product review mining :A puter Engineering and Applications , 2008, 44(36 :37-41. Abstract :Product review mining is the process of finding information from product reviews on the Web through natural language process technology.It is a rising field that is the sub field of unstructured data mining from plain text.The information mined fromproduct reviews can help manufacturers to improve their product ,and help user to buy product with more rationality.A survey of product review mining is discussed.Firstly , the framework of product review mining is analyzed.Then , the tasks of product reviewmining that include subjective sentence identify , product feature extracting , user attitude extracting , polarity classifying and mining result show are also described in detail , and finally the future reseach directions about product review mining are pointed out. Key words :textual pattern ; subjective feature ; word polarity摘要:产品评论挖掘是以 Web 上用户发表的产品评论为挖掘对象, 采用自然语言处理技术, 从大量的文本数据中发现关于产品的功能和性能的评价信息的过程。

产品评论挖掘是一个新兴的研究领域, 是对自然语言描述的无结构数据进行数据挖掘的典型代表。

产品评论中挖掘得到的信息不仅可以帮助生产厂商改进产品, 还可以帮助用户合理的购买产品。

对产品评论挖掘进行了全面深入地讨论, 介绍了产品评论挖掘系统的通用框架, 然后对产品特征提取、主观句定位、用户态度提取、态度极性判定、挖掘结果显示这 5个子任务进行了详细地阐述, 最后介绍了产品评论挖掘的最新方向。

关键词:用户评论; 主观特征; 词语极性 DOI :10.3778/j.issn.1002-8331.2008.36.010文章编号:1002-8331(2008 36-0037-05文献标识码:A中图分类号:TP18Computer Engineering and Applications 计算机工程与应用 37Computer Engineering and Applications 计算机工程与应用2008, 44(36产品评论语料库产品特征提取主观句定位产品特征集合主观句集合用户态度提取态度极性判定挖掘结果显示图 1产品评论挖掘系统框架1. 最大的缺点是电池容量小使用时间短。

2. 外表华丽, 适合白天使用夜景不用三角架不行, 防抖极差, 防红眼基本不起作用。

3. SONY T9可以放在裤兜里。

图 2产品特征(3 主观句定位。

发现产品评论中的哪些句子用户表达了对产品的主观态度。

(4 用户态度提取。

从主观句中寻找表示用户态度的单词、短语或结构。

(5 态度极性判定。

确定用户态度的极性:正性 (肯定、支持 /负性 (否定、反对。

(6 挖掘结果显示。

对挖掘结果进行直观地显示。

文章的后续部分将对产品评论的 5个子任务进行详细地介绍。

2.1产品特征提取生产厂商一般会提供一个关于产品各个方面性能的说明文件, 但是产品评论挖掘一般不从这样的说明性文件中提取产品特征, 主要原因是:首先生产厂商和用户对产品特征关注的角度不一样, 生产厂商提供的产品特征更多的专注于一些技术细节, 对于这样的细节用户一般不感兴趣; 其次产品评论中对特征的描述是一个开放性的问题, 用户可能在产品评论中发表生产厂商根本没有考虑到的一些产品特征, 因此需要从产品评论语料库中提取产品特征。

产品特征分为显示特征和隐示特征, 显示特征是直接出现在产品评论中描述产品的性能或功能的名词或名词短语。

隐示特征没有在语句中直接进行描述, 需要句子进行语义理解才能得到。

图 2中的第 1、 2句中的电池容量、外表、三脚架和防红眼是显示特征, 而第 3句中语句的字面语义是相机容易放在口袋里, 其实指出了 SONY T9的大小这个隐示特征。

提取隐示特征需要自然语言的完全理解技术, 而该技术不成熟, 因此目前的产品评论挖掘中产品特征提取均都只考虑显示产品特征。

显示产品特征的提取分为人工定义和自动提取两类方法。

人工定义就是针对特定领域的产品建立该领域的产品特征词汇表。

Li Zhuang 人工定义针对电影的产品特征, 将电影的产品特征分为两类:电影的元素 (比如:screenplay 、 vision effect 和与电影相关的人员 (比如:director 、 screenwriter 、 actor [3]。

姚天昉利用本体建立了汽车的产品特征 [4]; Kobayashi 、 Inui 和 Mat -sumoto 以半自动的方式建立了针对汽车和游戏的产品特征, 首 (论文档中抽取候选的特征, 再以人工的方式进行标注 [5]。

采用人工定义产品特征的方法, 每一个领域的产品都需要该领域的专家参与才能定义该领域的产品特征, 因此移植性较差, 并且人工定义的产品特征是静态的, 当产品的功能发生改变后 (比如手机加入了新的功能 , 只有重新召集领域专家才能将新特征加入该类产品的产品特征集合中。

自动提取产品特征主要使用词性标注、句法分析、文本模式等自然语言技术对产品评论中的语句进行分析, 从中自动发现产品特征。

Kim 和 Hovy 首先寻找句子中包含表达主观性的词汇, 然后定义一个大小固定的窗口, 以主观性词汇为中心, 将窗口中的名词或名词短语作为特征 [6]。

Jeonhee Y 、 Nasukawa 、 Bunescu 和 Niblack 指定了具有 BNP (Base Noun Phrase 结构的名词短语才可能是产品特征, 并使用信息检索算法度量该特征是否与指定产品类相关 [7]。

Hu Minqing 和 Liu Bing 首先对评论中的语句进行词性标注,只保留句子中的名词或名词短语, 将产品评论语料库中的每一个句子生成一条记录插入 Trans -action File , 然后采用 Apriori 算法从 Transaction File 中寻找频繁项 (频繁 1, 2, 3项集 , 将得到的频繁项作为候选产品特征, 再根据两条启发式规则对候选产品特征进行过滤得到产品特征集合。

该方法结构简单便于实现, 具有良好的移植性, 获得了较高的召回率 (80% , 但准确率有待提高 (71% [8]。

Popescu 、Yates 和 Etzioni 采用 KnowItAll 中人工定义的抽取指定关系 (part of 关系、 is a 关系的文本模式抽取产品特征。

相关文档
最新文档