轻型评论的情感分析研究

轻型评论的情感分析研究
轻型评论的情感分析研究

软件学报ISSN 1000-9825, CODEN RUXUEW E-mail: jos@https://www.360docs.net/doc/5310009170.html,

Journal of Software,2014,25(12):2790?2807 [doi: 10.13328/https://www.360docs.net/doc/5310009170.html,ki.jos.004728] https://www.360docs.net/doc/5310009170.html,

+86-10-62562563 ?中国科学院软件研究所版权所有. Tel/Fax:

?

轻型评论的情感分析研究

张林1,2, 钱冠群3, 樊卫国4, 华琨5, 张莉1

1(北京航空航天大学计算机学院,北京 100191)

2(浙江财经大学信息学院,浙江杭州 310018)

3(百度公司,北京 100085)

4(Department of Information Systems, Pamplin College of Business, Virginia Technological University, USA)

5(Electrical and Computer Engineering Department, Lawrence Technological University, USA)

通讯作者: 张林, E-mail: zhanglin_hz@https://www.360docs.net/doc/5310009170.html,

摘要: 以在智能移动设备上发表的用户评论作为研究对象,并将该类评论称为轻型评论.指出了轻型评论与早

期互联网评论及短文本研究的异同点,并通过实验总结轻型评论的独有特性:字数少、跨度大,短小评论数量众多,

评论长度与数量满足幂率分布.同时,针对轻型评论的情感分类研究展开了一系列的实验研究,发现:(1) 情感分类效

果随着评论长度的增加而下降;(2) 传统的特征筛选方法以及特征加权方法对于轻型评论效果都不够理想;(3) 极

性词在短评论中比例高于长评论;(4) 长、短评论在用词上存在较高的重叠度.在此基础上,提出了一种基于短评论

特征共现的特征筛选方法,将短小评论中的优势信息和传统的特征筛选方法相结合,在筛选掉无用噪音的同时增补

有利于分类的有效特征.实验结果表明,该方法可以有效地提高轻型评论中较长评论的分类效果.

关键词: 情感分析;用户评论;短文本;意见挖掘

中图法分类号: TP181

中文引用格式: 张林,钱冠群,樊卫国,华琨,张莉.轻型评论的情感分析研究.软件学报,2014,25(12):2790?2807.http://www.jos.

https://www.360docs.net/doc/5310009170.html,/1000-9825/4728.htm

英文引用格式: Zhang L, Qian GQ, Fan WG, Hua K, Zhang L. Sentiment analysis based on light reviews. Ruan Jian Xue Bao/

Journal of Software, 2014,25(12):2790?2807 (in Chinese).https://www.360docs.net/doc/5310009170.html,/1000-9825/4728.htm

Sentiment Analysis Based on Light Reviews

ZHANG Lin1,2, QIAN Guan-Qun3, FAN Wei-Guo4, HUA Kun5, ZHANG Li1

1(School of Computer Science and Engineering, BeiHang University, Beijing 100191, China)

2(Department of Information Technology, Zhejiang University of Finance & Economic, Hangzhou 310018, China)

3(Baidu Inc., Beijing 100085, China)

4(Department of Information Systems, Pamplin College of Business, Virginia Technological University, USA)

5(Electrical and Computer Engineering Department, Lawrence Technological University, USA)

Corresponding author: ZHANG Lin, E-mail: zhanglin_hz@https://www.360docs.net/doc/5310009170.html,

Abstract: This paper researches the newly emerging user reviews (referred here as “light reviews”) generated from smart mobile

devices. The similarities and differences between this research and the early studies are pointed out. The unique characteristics of the light

review can be summarized as having shorter texts, bigger span, and in most cases fewer words per review. The review length and scale

also meet the power-law distribution. A series of experiments are studies based on light reviews, resulting in some interesting findings: (1)

There is an inverse relationship between classification accuracy and review length; (2) The traditional classical feature selection and

feature weight method do not perform well enough on light reviews; (3) The polar word ratio in short reviews, which is the most

important feature in sentiment analysis, is higher than in long reviews; (4) There is a higher shared feature term proportion between short

?收稿时间:2014-05-05; 修改时间: 2014-08-21; 定稿时间: 2014-09-30

张林等:轻型评论的情感分析研究2791

review and long review. Based on above studies, the paper puts forward a feature selection method based on short text co-occurrence feature. By combining the information advantages in short reviews with the traditional feature selection methods, the presented method preserves useful information and details as much as possible while removing noise. The results of experiment show that the method is effective and the classification rate is higher.

Key words: sentiment analysis; user review; short-text; opinion mining

基于文本的意见挖掘是近10年来备受关注的研究领域,其目的是研究如何从文本中获得用户对各种事物的意见倾向,从而了解互联网上用户的普遍观点和意见[1?3].其中,基于评论的情感分析是意见挖掘的一个重要分支和研究方向,主要研究如何采用自动化的方法,从用户的评论中获取用户对事物的褒贬倾向.从本质上讲,判断褒贬倾向是一个分类问题,因此也称为情感分类、极性分类.前期的研究中,有较多针对互联网用户评论的情感分类研究,如Turney[3],Dave[2],Fan[4]等人的研究.

随着智能手机、平板电脑、无线传感器网络等各种普适系统的快速发展,人类已经生活在由通信网、互联网、传感网相互融合的混合网络环境.同时,各类实用的App软件已经日益盛行.有数据显示:谷歌的Andriod market在2012年就拥有40万款App应用[5];而苹果的Appstore在2013年6月达到了90万款App应用,下载次数更是达到了150亿次以上[6].与此同时,人们已经习惯在日常生活中随时随地用手机或平板电脑发表意见和观点.在Appstore上各类App页面下,成千上万的用户在吐槽、发表评论.这些评论不同于发表在互联网上的评论,它更加短小精干,很多时候仅用一个字、词甚至一个标点符号来表明自己的态度.相比早期在互联网上那些文字较多、具有一定组织结构、较为正式的评论,这种评论可以称为轻型评论.

随着更多移动智能应用的出现,轻型评论将成为一种新的评论形态.因此,情感分析研究应该将研究的广度扩展到这类轻型评论上,重新审视传统的方法和流程,讨论该类评论在情感分析上独有的特性.目前,针对这类短小简洁而数量众多的轻型评论的研究还很少.根据我们的统计分析,这类评论具有以下几个较为鲜明的特点:

(1) 平均字数少,不仅远远小于早期在PC用户评论的平均字数,也小于大多短文本的平均字数;

(2) 字符数量跨度大.最短的评论只有一个字或一个标点符号,最长的却有上千字,这种长短严重不齐的字符跨度为后期情感分析带来一定的难度;

(3) 最为重要的是,评论的文本长度与数量之间呈现出幂律关系,短小评论占了整体评论中的大多数,长评论数量相对较少.

这些特点都与前期文献研究涉及到的互联网用户评论的特点有很大的不同.互联网用户评论不仅平均字数较多,且短小文本的数量相对较少.此外,很多文献显示:这些过于短小且数量不多的评论在文本预处理阶段就会被清洗及过滤掉[5,8,9],而轻型评论中的主体正是极其短小且数量众多的短小评论,这种评论在早期研究中正是被忽略和过滤掉的那部分.因此,本文所针对的轻型评论不同于早期情感分析的研究对象,呈现出不同于其他评论的特性.

本文研究的轻型评论来自苹果Appstore发布的基于各类App的用户评论.选择这类评论为研究对象,是由于App软件用户评论数量巨大,符合社会计算研究中对海量、真实数据的处理要求.同时,此类用户评论具有一定的代表性,它非常类似社会网络中的随笔、吐槽,具有典型的字数少、数量大等特点,可以作为社会化计算、扩展情感分析广度的一个典型样本.此外,对这类用户评论进行情感分析,可以帮助我们了解App用户的情感和意见,辅助指导App的进一步改进及演化.这对于软件供应商、App开发商以及用户都很重要,同时也可作为软件评测的一个重要指标.

本文对轻型评论在情感分析上进行了一系列的实验研究,发现轻型评论中的一些特性:

(1)评论长度对情感分类效果有较大的影响;评论长度与分类效果成反比的关系;短小评论分类效果

更好;这与传统的短文本由于特征向量稀疏,而分类效果不好[7]的结论有所不同;

(2)对于文本分类有显著作用的特征筛选方法并不完全适用于轻型评论,对轻型评论中的短评论而言,

特征筛选方法并没有提高分类效果,反而有所降低;

(3)传统的特征加权方法在各评论分组中表现各异,不够稳定;

2792 Journal of Software软件学报 V ol.25, No.12, December 2014

(4)短评论中极性词的比例明显高于长评论中极性词的分布比例,而长评论中的极性词含量会逐步趋于

稳定;

(5)长评论和短评论中的特征项重叠率较高,即长短评论中有较多的特征词是重复出现的.

在上述实验结果的基础上,我们提出了基于短评论共现的特征筛选法(简称SCO),以提高轻型评论中长评论的分类效果.该方法利用短评论富含极性词以及与长评论特征重叠率高的特性,在传统特征筛选的基础上,将短评论中的特征引入到长评论中,既降低了噪音又补充了优势信息.实验证明,这种方法取得了较好的效果.

本文第1节综述相关的工作.第2节给出轻型评论的定义及统计特性.第3节是轻型评论在情感分析方面的一些讨论.第4节是基于短评论共现的特征筛选方法的介绍,包括方法思路、定义.第5节展示该方法的验证.第6节是总结和将来的工作.

1 相关研究

1.1 情感分析的相关研究

情感分析是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的一种技术,当前研究使用的方法主要分为两种:基于机器学习的方法和基于语义词典的方法:基于机器学习的方法是利用机器学习的各种分类方法来识别情感;而基于语义词典的方法则先构造情感词词典或是列表,借助该字典判断情感的倾向.两种方法各有优势:

?基于机器学习的情感分类方法可以跨领域应用且稳定性较好,对于数据量较小、标注完整的数据集具有较好的效果[8].如:Pang和Li等人采用不同的特征选择方法,应用了NB,ME,SVM等不同的分类方法对电影评论进行分类,取得了较好效果[9];Ni等人利用CHI方法和信息增益方法(IG)进行特征选择,并采用NB,SVM和Rocchio算法对情感分类[10];Mullen等人和Whitelaw等人用SVM做分类算法,但他们在特征的选择和处理上不同[11,12];Cui等人比较了PA(passive-aggressive),LM(language modeling)和Winnow分类器的性能,发现PA>Winnow>LM[13].这些方法需要大量繁琐的人工标注工作,同时,分类方法由于与数据集较相关,不同类型的数据需要采用不同的分类方法才能有较好的效果,很多研究通过实验对比找到针对某类数据较好的分类方法.

?基于语义词典方法的优点是能够更好地利用人类的知识,减少机器学习的盲目性,同时也能大幅度地减少人工标注样本的工作,但如何自动或半自动地构造极性词典或极性词列表是一个关键问题.这方面大部分的研究是通过人为观察语言中的一些现象,诸如同义词或者词语之间搭配,挖掘出众多极性词及极性词的倾向.例如:Wiebe等人利用一种相似度分布的词聚类方法,标记了形容词极性词及极性[14];Riloff等人利用手工制定的模板并选取种子评价词语,使用迭代的方法获取名词极性词及极性[15];Turney和Littma提出了点互信息(point mutual information)的方法判别某个词语是否是极性词语[16].此外,不少研究人员利用现有的通用词典WordNet或HowNet,将手工采集的种子评价词语进行扩展来获取大量的极性词语及极性[17,18].事实上,由于情感的表达与领域息息相关,不同领域的极性表达方式各不相同,甚至截然相反,需要依据更多的上下文表达才能了解整个句子或者段落的极性倾向,这就需要词法、句法等更深层次的分析.如文献[19]使用依存句法结构(如ADV,ATT以及DE结构),即,利用极性词之间的句法关系来获取句子的极性.由于自然语言的复杂性,建立起一个完备的极性词词典几乎是不可能的任务[20].当然,也有一些研究是将这两种方法相结合,但整体上分析效果并没有明显的提升[21,22].

中文的基于情感分析研究还不是很多,大多数处于借用英文的相关技术.叶强等人在PMI-IR基础上探讨了中文的情感分类方法[23,24];朱嫣岚基于HowNet提出了两种词语语义倾向性计算的方法[18];上海交通大学[25]则开发了一个用于汉语汽车论坛的意见挖掘系统,并给出了统计及可视化结果.

张林等:轻型评论的情感分析研究2793

1.2 用户评论的相关研究

情感分析的研究语料很大一部分都来自于用户评论,早期针对用户评论的研究语料大多来自于互联网[26],其文本长度较长,与本文研究的轻型评论有较为明显的差异.我们列举一些目前能够搜集到的、具有明确语料长度的研究案例,以说明在用户评论研究中,类似轻型评论语料的研究尚不多见.

Pang等人[9]在2002年~2004年的研究中,采用的是发表在IMDB[27]上的电影评论,据我们统计,该语料集合中,每个评论平均长度为3500+字符,平均包含700+的单词.

Fan等人[4]对用户发表在汽车论坛上的反馈意见进行了研究,该研究语料来自2010年美国交通部、国家高速安全部门等数据库,在这些研究语料中,他们主要研究超过50个单词以上的用户评论,他们的研究语料平均包含502个单词,最小50个单词,最大8 586个单词.

Cui和Mittal的研究中[13]收集了很多针对电子产品的评论,如照相机、笔记本电脑、PDA、MP3等,整个语料库大约0.4G,包括了32W的用户评论,而评论的平均长度是875字节.

Kasthuriarachchy的研究[28]中比较了各种不同领域的用户评论,诸如电影、DVD、手机甚至tweets,在他的研究语料中,每个评论至少包含1个句子,每个句子的平均单词数是17个~22.2个.根据论文中的统计,其中电影评论语料平均包含35.8个句子.

在中文情感分析的语料研究中,ChnSentiCorp语料库[29]由谭松波博士提供.该语料包含酒店、电脑与书籍这3个领域的相关评价,每种类型的语料来源单一,但不同类型间的来源差异性较大.根据杨震的研究[33]发现:在文本清洗、分词和预处理之后,得到的文本有效属性为29 550个,单一文本平均由76.35个词组成.在去除无效字符后,平均文本长度为70.4114个词.此外,根据刘鲁的研究[43]可知,中文微博的平均长度为45个中文字符.

由于书写的局限,来自手机的评论与大部分研究文献中的评论有非常明显的不同.手机评论的长度要远远小于PC评论的长度.在上述研究中的语料大部分经过了筛选,如Fan[4]的研究中只保留超过50个单词的评论进行研究.而手机评论中平均只有17个字,70%的评论都不超过30个字(详细信息参见第2节),因此,我们认为非常有必要对这类轻型评论进行专门的研究,重新审视早期的研究方法和研究流程.

1.3 短文本的相关研究

短文本是指那些文本长度小于160个字符的文本[30],一般以微博、手机短信、网页评论以及聊天等形式存在(短文本的概念是相对于长文本而言).研究学者普遍认为,短文本由于特征向量的维度过少,在整体特征矩阵中不可避免地出现极度稀疏的问题,即:每个短文本样本中,只有极少数的维数上是有取值的.由此,给短文本的处理带来了极大的不确定性和困难.解决这种稀疏性主要从两个方面入手:一是通过降低整体的特征向量维度来避免稀疏性问题;二是通过各种方法扩展短文本的信息,从而提高短文本自身的向量维度.

一方面,研究者通过特征选择方法来降低维度,对高维数据进行有效降维的典型方法有信息增益方法(information gain)[31]、CHI方法(统计量)[32]以及互信息(MI)[33]方法,其他的方法有潜在语义索引(latent semantic indexing,简称LSI)方法[34,35]、基于聚类重心数据降维(centroidmethod,简称CM)[36]的方法等.这些降维的方法或者需要计算大矩阵的特征值和特征向量,或者需要对数据进行频繁的聚类迭代分析,其计算复杂度和计算时间都比较大.

另一方面,研究者希望通过属性联想或组合来扩充短文本特征矩阵,这些研究大多集中在对主题的检测与分类上.如:Wang等人[37]利用WR-kmeans聚类方法综合相关手机短消息解决相似短文本发现问题;Fan等人[38]利用特征扩展和控制模型,有效提高短文本的分类精度;Adams等人[39]利用WordNet解决即时聊天信息话题检测与抽取问题.

文献[7]研究了中文短文本评论的情感分类,该文献认为:短文本存在着数据稀疏性及上下文缺失的情况,需要用某种方法来补充和扩展信息.但该文献中情感分类不仅包括了对情感的极性分类,还包括了对领域主题的划分,文献中对短文本的缺失补充主要体现在对于领域主题的补充和扩展上,而不是情感的极性分类.

我们研究针对的是轻型评论,它与短文本的概念之间有很大的相似之处,都是较为短小的文本信息.但是,

2794 Journal of Software软件学报 V ol.25, No.12, December 2014

我们的研究重点与短文本的研究重点是不一样的,短文本的相关研究更注重补充缺失的信息,根据我们的实验研究,短文本缺失的信息并不体现在情感极性分类上,而是体现在评论主题的识别和抽取.由于不同研究学者对情感分析概念划分的不同,因此,尽管一些文献也在研究短文本的情感分类问题[33],但该文献里的情感分类还包括了主题的识别和主题的抽取,并不是单纯的情感极性分类问题.

根据本文研究,短评论尽管信息含量少,但其情感信息并不少.如“很好!”、“坑爹啊”等语句,其中就包含了强烈倾向性的情感信息(垃圾及无用的评论不计),短评论缺失的信息仅仅是产品的主题或者是产品的特征信息.实验结果显示(详见第3.1节):越是文本短小的评论,其情感分类的效果越好;而文本长度越长,其携带的信息中,不利于情感分类的噪音信息也会加大,分类效果远远不如短小文本评论.早期对于短文本的研究大多集中在主题的分类上,而对于情感极性分析,几乎没有人专门针对短小评论进行研究.而手机评论不仅短小,而且短小评论的数量极其众多,但同时包含丰富的极性词,在情感分类上表现更好.轻型评论与短文本前期研究是有非常大区别的.

综上所述,本文的研究对象是文本长度较短,但数量极其众多的轻型评论,它不同于早期互联网上的用户评论,因为它的文本长度远远小于互联网用户评论;同时,它也不同于短文本的主题分类研究,不存在情感信息缺失的问题.目前,这类轻型评论的情感分析研究尚未见到,本文扩展了情感分析的研究范围.

2 轻型评论的定义及特点

2.1 轻型评论的定义

由于书写方式的局限,人们发表在手机或者其他移动设备上的用户评论通常呈现出更加短小精干的特点,其平均字数只有不到20个汉字;此外,手机评论的长度跨度大,短到只有1个字甚至一个标点,长的可以达到数千甚至上万;其长度和规模符合幂律分布,即非常多的短评论和非常少的长评论交织在一起.我们将符合这几个特点的评论称为轻型评论.

本文中的轻型评论与短文本概念有点类似,但却有明显的不同:

?短文本是针对长文本提出的概念,虽然也指那些长度较小的文本,但更主要是指人们谈论的主体或者某些领域信息过于简短、有所省略,因此,短文本的主要研究大部分集中在如何补充这些重要信息,提高主题分类的准确性.在短文本研究中,“短”是不足,是需要通过各种方式进行弥补的.此外,短文本只是泛指那些较为短小的文本,一般不超过160个字符;

?而轻型评论中,不仅有更加短小的文本也有上千字符的长文本;且长短文本的规模分布极端不均衡;对于轻型评论的情感分类,“短”是优点,因为短评论中包含了更多的情感极性词,噪音少指向更加明确,充分利用规模巨大的“短”评论更有利于整体分类效果的提升.

2.2 轻型评论的特点

本文通过真实数据的一些统计实验来论证和说明轻型评论的具体特点.本文采集了2011-01-21~2013- 06-06期间Appstore上各类App用户评论,共计145 263条.每条App评论具体包含标题、正文、评分等信息.其中,评分为1分~5分,1分最低,5分最高.我们对原始评论进行了过滤和筛选,其中被过滤掉的评论有:①标题和正文不含任何文字的评论;②用户打分为3的评论,因人为都很难判断其正负情感倾向.剩下共计133 575条评论.用户打分在1分~2分的评论作为负例,打分在4分~5分的评论作为正例.

通过一些统计及实验,我们发现,轻型评论具有以下自身独有的特点:

2.2.1 字数少,字符分布跨度大

样本数据的统计结果见表1,可以看出,样本评论包括标点符号的平均字数只有17个中文字符.这不仅远远小于文献中有记载的研究语料长度,也远远小于微博40个字的平均长度.同时也可以看出:评论的字符最小的只有1个字(空评论已经过滤掉),最大到6 336个字,可见其字符分布跨度大.

张林 等:轻型评论的情感分析研究

2795 Table 1 Sample data statistics result

表1 样本数据统计结果

正例 反例 总体 字符数

最小~最大

1~1891 1~6336 1~6336平均

15.75 34.11 17.08 标准差 21.850 4765.960 2134.396

2.2.2 评论长度与数量之间满足幂律分布

通过观察发现:在轻型评论中,评论长度与数量存在着极端不均衡的现象.即:有非常多的评论字数很少,而字数多的评论其数量又很少,平均长度已经不能代表轻型评论的分布特性.其文本长度与数量之间满足幂率分布,如图1所示.其中,x 表示文本长度,y 表示长度为x 的评论数量.从图中可以看出:在双对数坐标系下,这是一个典型的幂律分布关系,满足y =kx α,其中,幂律指数α=?4.177.

Fig.1 Power-Law relation of the length of reviews and the scale of reviews

图1 评论长度与评论数量幂率关系图

3 轻型评论在情感分类的特性

为了考察文本长度、特征筛选等对轻型评论情感分类的影响,我们进行了一系列实验.实验基于WEKA 工具[40],采用10-fold 交叉进行测试和验证.中文分词采用mmseg4j [41]工具.本论文中的分类算法均采用Naive Bayes Multinomial 方法(据前期实验研究,采用SVM 方法实验效果类似).

3.1 评论长度与情感分类效果之间的关系

为了考察评论长度是否影响情感的分类效果,我们采用了两种方式进行了实验:

(1) 按照字符长度进行分组,考察其对分类的影响.

这里,特征向量的赋值采用了TF 方法.实验结果见表2,可以看到,F -Value 随着评论字符的增长而下降.它说明评论长度越长,情感分类越不够准确.字数在300以上的评论,分类的准确性达到最低,只有0.4左右.

(2) 按照样本数量及字符长度进行分组,考察对分类的影响

为避免样本数量影响分类效果,我们在设计实验时,按照实验样本的数量重新进行了分组,使得每一组参与的样本数量保持在同一个级别上.表3为分组情况及实验结果,可以看出:在样本数量都较为均衡的条件下,不同长度的评论其分类依然存在评论越长,情感分类准确性越低的结论.

y vs. x 拟合结果文本长度101010101010

评论数量 104

10101010

2796

Journal of Software 软件学报 V ol.25, No.12, December 2014

Table 2 Classification result comparison based on length group

表2 基于不同字符长度的分组分类效果

分组(评论长度)

Precision Recall F -Value 1+ 0.923 0.911 0.915

5+ 0.909 0.896 0.9

10+ 0.881 0.868 0.872

15+ 0.857 0.846 0.849

20+ 0.844 0.836 0.837

25+ 0.825 0.821 0.822

30+ 0.827 0.824 0.814

35+ 0.808 0.807 0.799

40+ 0.809 0.809 0.794

50+ 0.796 0.795 0.785

60+ 0.791 0.794 0.773

70+ 0.795 0.795 0.765

90+ 0.753 0.729 0.755

100+ 0.757 0.735 0.735

150+ 0.639 0.738 0.678

200+ 0.649 0.637 0.642

250+ 0.539 0.543 0.543

300+ 0.333 0.5 0.4

Table 3 Classification result comparison based on balanced sample set

表3 基于均衡样本数的分组分类效果 分组(评论长度)

评论数量 Precision Recall F -Value 1# (1~5)

31 978 0.981 0.981 0.975 2# (6~10)

32 086 0.955 0.955 0.955 3# (11~20)

33 316 0.900 0.893 0.893 4# (21+) 36 125 0.815 0.811 0.812

从上述两组实验看出,较短评论的情感分类效果要好于较长评论的分类效果.

3.2 特征筛选方法对轻型评论的作用

在文本分类的流程中,特征筛选方法是一个非常重要的步骤,它可以有效地减少特征维度,降低噪音,提高分类的效果.那么,特征筛选方法对于轻型评论是否还存在类似的作用呢?

这里,我们选用经典特征筛选方法——信息增益方法(简称IG)以及CHI 方法(即χ2统计法)进行了实验,两种特征筛选方法得到的实验结果非常相似,见表4.

Table 4 Feature selection classification effect contrast in different length group

表4 特征筛选在不同长度分组中分类效果

分组 (评论长度) F -Value(不用特征筛选)F -Value(采用特征筛选(IG)) F -Value(采用特征筛选方法(CHI))

1+ 0.915 0.900↓ 0.899↓

10+ 0.872 0.872 0.872

20+ 0.837 0.821↓ 0.821↓

30+ 0.814 0.810↓ 0.811↓

50+ 0.785 0.781↓ 0.780↓

70+ 0.765 0.761↓ 0.762↓

90+ 0.755 0.755 0.754↓

100+ 0.735 0.739↑ 0.738↑

150+ 0.678 0.688↑ 0.687↑

200+ 0.642 0.640↓ 0.643↑

250+ 0.543 0.546↑ 0.545↑

300+ 0.4 0.560↑ 0.562↑

实验结果显示:采用两种特征筛选方法之后,分类效果并没有显著的提高,相反,在大多数短评论分组内还有所下降;只有评论字数超过100时,即在评论字数较长时,特征筛选方法才使得分类效果有提高,但幅度有限.

张林 等:轻型评论的情感分析研究

2797

同时我们注意到:在特征筛选后,特征向量大幅度减少,特征矩阵变得越来越稀疏.图2显示了在使用IG 特征筛选前后特征数量的对比.非常多样本的特征被筛选为空,这违背了特征筛选的初衷,给机器学习带来了更多的不确定性,分类效果很难预测.因此,我们建议对于较短评论可以不进行特征筛选的工作.因为筛选后的分类效果不够理想,筛选后特征数量减少过多.通过对筛选词的分析发现:筛选掉的一些看似噪音的特征词,很可能是网络中最常见的错字、别字或者网络新词,像“神马”、“滚粗去”、“肿么办”,这些特征词的保留,有利于提高整体的分类效果.

Fig.2 Feature decline tendency after feature selection (IG method)

图2 原始特征数量与IG 筛选后特征数量对比图

3.3 特征加权方法对轻型评论的作用

在机器学习过程中,通常要给每个特征项赋予一定的权重,以衡量某个特征项在文档表示中的重要程度或者区分能力的强弱.权重计算方法有很多,如:TF 方法直接根据词语的频率赋予权重,出现频率较高的词汇会得到更高的权重;IDF 方法则给予区分度较高但频率出现较低的特征项更高的权重,以降低那些出现频率高但又不重要的常用词权重;TF-IDF 方法则充分考虑了两者的结合,给予了那些出现频率高并且对分类具有良好区分度的特征更高的权重;TFC 方法是对TF-IDF 方法进行了归一化处理;ITC 方法则是将频率数值改成了频率的对数值;TF-IWF 则是用特征频率的倒数的对数值来代替IDF 方法.具体公式见文献[42].

这里,我们选择上述几种经典的权重赋值方法,按照评论长度不同,分组对比不同加权算法对分类效果的影响,结果见表5.

Table 5 Classification effort comparison in different feature weight methods

表5 不同特征加权方法的分类效果对比

分组 (评论长度)

F -Value TF IDF TF-IDF TFC ITC TF_IWF 1+

0.915 0.917 0.900 0.911 0.909 0.902 10+

0.872 0.861 0.862 0.865 0.854 0.876 20+

0.837 0.820 0.825 0.805 0.806 0.806 30+

0.814 0.785 0.815 0.765 0.789 0.781 40+

0.794 0.745 0.765 0.749 0.774 0.743 50+

0.785 0.743 0.761 0.763 0.760 0.752 60+

0.773 0.754 0.750 0.761 0.765 0.748 70+

0.765 0.749 0.755 0.752 0.768 0.744 90+

0.755 0.706 0.723 0.745 0.752 0.731 100+

0.735 0.714 0.705 0.733 0.750 0.727 150+

0.678 0.693 0.678 0.654 0.684 0.686 200+

0.642 0.52 0.642 0.518 0.552 0.588 250+

0.543 0.612 0.543 0.479 0.52 0.516 300+ 0.4 0.567 0.4 0.433 0.433 0.524

表中数据表明:这些特征加权方法在长短不同的样本分组里表现各异,并没有一个特征加权方法能够整体原始特征数量与IG 特征筛选后特征数量对比图原始特征向量数量 IG 之后特征向量数量 300+

200+100+70+50+35+25+ 15+ 5+9000

8000

7000

6000

5000

4000

3000

2000

1000

2798 Journal of Software 软件学报 V ol.25, No.12, December 2014 上优于其他方法.为简便起见,本文中大部分实验在特征形式化时均采用TF 加权方法.此外,本实验与第3.1节的实验结论一致:不论对特征向量如何形式化,情感分类效果依然随着文本长度而呈现较为明显的下降趋势.

3.4 情感极性词在长短评论中的分布对比

情感极性词是能够明显表达用户情感倾向的词,如“太好了!”、“垃圾”等.不论是构造情感字典的方式,还是采用机器学习的方式,情感极性词对于情感分类都是至关重要的[47].本实验考察极性词在长短评论中是否均匀分布,是否会随着评论长度的增长而线性递增.对此,我们进行了如下的实验过程:

(1) 人工标注所有样本中出现的极性特征词.我们挑选了5名学生分别将评论中的极性词标识出来,并进

行交叉验证以保证标注的一致性和正确性;

(2) 按评论的文字长度对样本进行分组,划分成长度不同、跨度相互重叠的评论组;

(3) 统计不同分组内,特征数量、极性词数量以及在特征中的占比情况.

表6为实验结果,可以看出:随着文本长度的增加,极性特征词的数量在攀升,但这种攀升是逐步收敛的,会逐步稳定在某个数值上;极性词在整体特征中比例逐步下降.在长评论中,极性词比率变小,说明长评论的表达大多采用了间接或更复杂的表述方式,不像短评论那样更直接地使用极性词.本实验可以看出:随着极性词比例的相对减少,具有噪音特性的其他特征词越来越多,因此也越来越难以识别长评论的情感倾向.由此可见,极性词比例的逐步下降很可能是长评论分类效果不好的原因之一.

Table 6 Count and proportion of polar word in different length group

表6 极性词在不同长度分组中的数量及比例关系

评论长度 特征总数 情感词个数比例(情感词个数/特征总数)(%)

1~5 1 907 200 11.01

1~10 4 234 370 9.08

1~20 6 309 466 7.45

1~30 6 911 490 7.18

1~50 7 453 512 6.87

1~70 7 603 520 6.84

1~100 7 693 520 6.76

1~150 7 739 524 6.77

1~300 7 748 525 6.78

1~∞ 7 899 526 6.66

3.5 长短评论特征的共现程度度量

用户在写评论表达自己观点时,表达的方式或用词存在一定的共性,也可以称为共现.这里,我们不做语义上的分析,仅从特征词上的重叠比例来考察长短评论之间的共性程度.

为了后续讨论的方便,我们先给出共现程度的相关定义:

设R i ,j 表示字数从i 到j 的评论集合,F i ,j 代表R i ,j 中所有特征的集合,F IG (i ,j )表示经过IG 特征筛选之后的特征集合;用|X |表示集合X 的元素个数.如果有两组评论集合分别是R i ,j 和R k ,l ,那么两组评论之间共现的特征集合

为F i ,j ∩F k ,l ;|F i ,j ∩F k ,l |则是共现特征集合包含的元素个数.因此,两组评论之间的共现特征比为,,,,||||

i j k l i j k l F F F F ∩∪,共现特征占某评论特征F i ,j 的比例可表示为,,,||

||i j k l i j F F F ∩.这里,我们用3个指标来度量两组评论之间的共现程度:

,,,,,,,,,,||||||,,||||||

i j k l i j k l i j k l i j k l i j k l F F F F F F F F F F ∩∩∩∪.实验过程如下: (1) 将评论按照字符长度大致分成4组:1~10,11~20,21~30,31~+∞;

(2) 分别统计各组的特征向量个数|F 1,10|,|F 11,20|,|F 21,30|,|F 31,+∞|;

(3) 统计两组间的共现特征个数.如:|F 1,10∩F 11,20|为1~10与11~20两组评论中共现的特征数;|F 1,10∩F 21,30|

为1~10与21~30两组评论中共现的特征数;

张林 等:轻型评论的情感分析研究

2799 (4) 计算两组间的共现特征比.如,

1,1011,201,1011,20||||F F F F ∩∪表示1~10与1~20两组评论中共现的特征占两组总体特

征的比例; (5) 计算共现特征占某一评论分组中的比例.如

1,1011,201,1011,201,1011,20||||,||||F F F F F F ∩∩表示1~10与11~20两组评论 中共现的特征分别占1~10组、11~20组中特征的比例.

表7为各评论分组统计及计算结果.我们以1~10组为例,该组与11~20组的共现特征占其自身特征数量的92%,与21~30组的共现特征占其自身特征数量的90%,与31~+∞组的共现特征占其自身特征数量的95%;该共现特征又分别占两组总体特征数量的62%,59%以及54%.如此高的共现率说明,各组之间在表达方式上有很大的共性.

表8为各评论分组经过IG 特征筛选前后的统计结果.以1~10组为例,筛选之前,该组内特征为4 234个,IG 筛选之后该组内特征为948个,共现特征个数占筛选前特征个数的22%.未经筛选的1~10组与经过筛选的11~20组之间,共现特征个数是1 103个,共现特征个数仅占1~10组中特征个数的26%,占两组所有特征的25%.可以看出:经过筛选之后,各组间共现的特征项变少,共现率下降严重,信息损失严重.这可能是特征筛选后分类效果不够理想的原因之一.

Table 7 Feature co-occurrence degree measurement in different length group

表7 不同长度评论间特征向量共现程度度量

|F i ,j ∪F k ,l | |F i ,j ∩F k ,l |

,,,,,,,,,,||||||,,||||||i j k l i j k l i j k l i j k l i j k l F F F F F F F F F F ∩∩∩∪ k =1,

l =10

k =11,l =20k =21,l =30k =31,l =+∞k =1,l =10k =11,l =20k =21,l =30k =31,l =+∞k =1,l =10k =11,l =20 k =21, l =30 k =31, l =+∞ i =1,

j =10

4234 6 305 6 4867 527 4 234 3 894 3 796 4 032 1 0.92, 0.65, 0.62 0.90, 0.63, 0.59 0.95, 0.55, 0.54 i =11,

j =20

5 965

6 797

7 59

8 5 965 5 216 5 692 1 0.87, 0.86, 0.77 0.95, 0.78, 0.75 i =21,

j =30

6 048

7 58

8 6 048 5 785 1 0.96, 0.79, 0.76 i =31,

j =+∞ 7 325 7 325 1

Table 8 Feature co-occurrence degree measurement used feature selection method in different length group

表8 特征筛选后不同字数评论之间特征向量共现程度度量 经过IG 特征筛选

|F i ,j ∪F k ,l | |F i ,j ∩F k ,l | ,(,),(,),(,),(,),(,)||||||,,||||||

i j IG k l i j IG k l i j IG k l i j IG k l i j IG k l F F F F F F F F F F ∩∩∩∪ k =1,

l =10

k =11,l =20k =21,l =30k =31,l =+∞k =1, l =10 k =11,l =20k =21,l =30k =31,l =+∞k =1, l =10 k =11, l =20 k =21, l =30 k =31, l =+∞ 未 经 过 IG 特 征 筛 选 i =1,

j =10 4 234 4 396 4 455

4 533948 1 103 1 102 1 2240.22, 1, 0.22 0.26, 0.87, 0.2

5 0.26, 0.83, 0.25 0.29, 0.8, 0.27 i =11, j =20 5 999 5 965

6 008

6 024914 1 265 1 280 1 4640.15, 0.96, 0.15 0.21, 1, 0.21 0.21, 0.97, 0.21 0.25, 0.96, 0.24 i =21, j =30 6 102 6 065 6 048

6 088894 1 248 1 323 1 4830.15, 0.94, 0.15 0.21, 0.99, 0.21 0.22, 1, 0.22 0.25, 0.97, 0.24 i =31, j =+∞

7 343 7 3267 3297 325930 1 264 1 319 1 5230.13, 0.98,

0.13 0.17, 1, 0.17 0.18, 1, 0.18 0.21, 1, 0.21

2800 Journal of Software软件学报 V ol.25, No.12, December 2014

从前面的各个实验看出,对于轻型评论的情感分类,具有以下几个特点:

(1)短评论分类效果更好,长评论分类效果会随着文本长度的增加呈现下降趋势;

(2)传统的特征筛选方法对于大部分是短评论的手机评论来讲并不是特别适用,对于短评论部分,它没

有起到提高分类效果的作用;同时,筛选后特征数量急剧减少,甚至导致部分样本所有特征权重为空,

有价值的特征词并没有被保留下来,也使得分类难以判断;

(3)各种特征加权方法对于轻型评论来讲表现并不稳定;

(4)短评论中极性词含量较高,而长评论中极性词并没有因为文本长度增加而显著增加;相反,其极性词

比例在下降.这有可能是长评论中分类准确性降低的原因之一;

(5)短评论中的特征词与长评论中的特征词有较大的重叠率,说明在长评论中存在与短评论类似的基本

表达方法,但长评论中存在着比短评论更多的特征,而这些特征很可能是噪音,是造成长评论分类准

确性较低的原因之一.

4 基于短评论共现的特征筛选法

4.1 方法思想

轻型评论中,短评论呈现出分类效果好、极性词含量高、与长评论的共现特征多等优点;而长评论呈现出分类效果不够理想、极性词含量低、噪音特征较多等不足.本文希望借助轻型评论中短评论的优点,提高长评论的分类效果.主要考虑以下几个因素:

(1) 短评论的数量极大.

从统计数据上看,轻型评论中短评论占了整体评论的绝大多数,因此,短评论所包含的信息应该被充分地挖掘和利用,而不是被忽略或被过滤掉.

(2) 短评论中极性词和情感表达方式多,这使得短评论具有其他评论所不具备的优势信息.

一些需要借助领域词典或上下文才能判断出情感倾向的词,诸如“快”、“慢”、“多”、“少”,在短评论中已经给出了明显的标示,如:“功能好少”、“下载速度快”等.这样的词在短评论中大批量重复地出现,并且短评论的句子简单、同现的其他特征词少,无关的噪音也少.这些都给训练提供了良好的学习样本.此外,短评论中不断有新生的网络词汇出现,如“坑爹啊”、“有木有”等,这也为有效识别网络用语、提高分类效果提供了很好的条件.

(3) 短评论中的表达方式与长评论中的表达方式有很高的重叠性.

如,短评论中有90%多的特征词都会出现在长评论中,而长评论中大概有50~60%的特征词与短评论中的特征词相重叠,这说明长评论中有和短评论类似的表达,可以认为长评论特征的一部分是由短评论中的特征构成的,一部分是由其他的特征构成的.而短评论中的大部分特征有利于极性的判断,长评论中的另一部分非常有可能是极性特征不够明显的噪音.

基于上述的分析,本文提出了一种利用短评论优势以提高长评论情感分类的方法——基于短评论共现的特征筛选法简称SCO(base on short-review co-occurrence)特征选择方法.

4.2 方法定义

如前面实验所示:传统的特征选择方法对于长评论来讲,分类的准确率稍微有所提高,但提高的幅度很小;同时,由于特征筛选方法使得特征更加稀疏,很多样本变成了空实例,分类效果没有预期的好.

方法的前提假设是:短评论特征词富含极性词和极性表达方式.基于这个假设,我们扩展了传统的特征选择方法,在现有特征筛选方法基础上增加长评论中与短评论共现的特征,即增加那些在长评论和短评论中共同出现的特征.增加的这部分特征由于在短评论中曾经出现过,因此富含极性词或极性表达方式,能够辅助长评论进行情感分类.

这里给出该方法的定义:设评论集合为R i,j,其中,i,j(i

张林 等:轻型评论的情感分析研究

2801

假设有两组评论R i ,j 和R k ,l ,其中:R i ,j 为长评论,其原始特征集合为F i ,j ,传统特征筛选方法,筛选出来的特征集合为F IG (i ,j ),该集合通常为参与情感分类的特征集合;为了提高分类的准确性,SCO 方法将分类效果较好的短小评论R k ,l 的特征集合F k ,l 引入进来,并获取其共现的特征集合F i ,j ∩F k ,l .最终,评论R i ,j 的最终特征集合为F IG (i ,j )∪(F i ,j ∩F k ,l ).该集合作为新的情感分类的特征集合,通过重新计算各特征值,再进行情感分类.

该方法与其他方法的对比如图3所示.如果不采用特征筛选方法,则长评论R i ,j 的最终特征集合为其原始的特征集合F i ,j ;如果采用特征筛选方法以降低噪音,则长评论R i ,j 的最终特征集合为F IG (i ,j );如果采用SOC 方法,在降低部分噪音的同时引入短评论R k ,l 的特征F k ,l ,将F k ,l 与F i ,j 的共现集合F i ,j ∩F k ,l 作为辅助集合增加到传统的特征筛选集合F IG (i ,j )中,即,长评论R i ,j 的最终特征集合为F IG (i ,j )∪(F i ,j ∩F k ,l ).

Fig.3 Three feature selection methods comparison

图3 3种特征集合选择方法对比

5 方法验证

5.1 实验流程

为了验证本文提出的SCO 方法的有效性,我们进行了情感分类的对比实验.分别选择了:① 不采用特征筛选方法;② 采用特征筛选方法(IG 和CHI);③ 采用本文提出的SCO 方法等3种不同形式的分类效果进行比较.这里,我们重点阐述SCO 方法的实验流程.

第1步:我们将评论分为两部分:短评论,记为R k ,l ;长评论,记为R i ,j .

这里,我们选择长度≥100字符的评论作为长评论.从前面的实验结果看,长度在100以上的评论其分类效果开始急剧下降,从75%降到了40%,因此,我们选择字符在100以上的评论作为实验用的长评论,作为需要提高和改善的主要对象.

在SCO 方法中,短评论中的特征是用来补充长评论特征的.选择多少长度区间的短评论,即k ,l 的选择是一个值得研究的问题.如果选择的区间过小,短评论的特征过少,与长评论中的共现特征也会变少,不能起到补充信息的作用;如果选择的区间过大,短评论与长评论的共现特征会增大,但同时也会引入噪音,影响分类效果.本文拟通过实验的方法,比较不同短文本长度区间对分类效果的影响.

传统特征筛选方法选择的特征集合S O C 方法选择的特征集合无筛选方法的特征集合长评论R i ,j 自身的特征集合特征筛选特征筛选长评论R i ,j 自身的特征集合

长评论

R i ,j 自身

的特征

集合

短评论

R k ,l 自身

的特征

集合共现特征特征集合选择方法用以分类的特征集合

3种特征集合选择方法对比F i ,j F IG (i ,j )∪(F i ,j ∩F k ,l )

F I

G (i ,j ) F i ,j ∩F k ,l F IG (i ,j )F IG (i ,j )F i ,j F i ,j F i ,j F k ,l

2802 Journal of Software软件学报 V ol.25, No.12, December 2014

由于长度≤50的评论分类效果较好且样本实例众多,因此选择该部分作为短评论,并将其分成5个长度不同的实验区间:1~10,1~20,1~30,1~40和1~50,以考察不同区间对分类效果的影响.这里,我们的k值都从1选取,主要考虑到越是短小的评论,其极性词比例越高,因此,我们将最短评论作为短评论选择区间的起点.

第2步:对长评论进行特征筛选处理.

如果筛选前的特征集合记为F i,j,则IG筛选之后的特征集合记为F IG(i,j).

第3步:获取不同区间的短评论特征集合F k,l.根据实验分组,分别为F1,10,F1,20,F1,30,F1,40和F1,50.

第4步:采用F IG(i,j)∪(F i,j∩F k,l)公式,进行长、短评论特征集合的交、并操作.

例如,长度在100+的长评论将分别与5个不同区间的短评论特征集合相交,找出其共现特征,并将该共现特征集合与其自身筛选后的特征集合进行合并.

第5步:将第4步得到的集合作为新的特征集合,重新计算各个特征的权重值,这里采用TF方法.

第6步:采用分类算法(这里选用NB分类算法)进行分类,对比分类效果.

5.2 实验效果对比

表9显示了不采用特征筛选方法、采用IG特征筛选方法以及采用SCO方法后的效果比较.从实验结果看: SCO方法分类效果要普遍好于IG特征筛选方法;特别是当选择1~30及1~40的短评论区间时,分类效果最优.为了进一步验证SCO方法,我们按照同样的思路,将特征筛选方法换成了CHI方法,表10显示CHI特征筛选方法与SCO方法的效果比较,SCO方法同样也普遍好于单纯采用CHI方法.

Table 9Compare SCO method classification with IG-methods

表9 SCO方法与IG方法的分类性能对比

NB分类算法效果F-VALUE

不采用

特征筛选

采用IG

特征筛选

基于短评论共现的特征筛选方法(SCO)

采用F IG(i,j)∪(F i,j∩F k,l)作为分类特征

不同选择区间的短评论R k,l

k=1

l=10

k=1

l=20

k=1

l=30

k=1

l=40

k=1

l=50

不同长度的长评论

R i,j

i=100, j=+∞0.735 0.739 0.7210.7230.773↑0.771↑0.736 i=150, j=+∞0.678 0.688 0.6450.71↑0.718↑0.721↑0.677 i=200, j=+∞0.642 0.640 0.643↑0.67↑0.726↑0.724↑ 0.652↑i=250, j=+∞0.543 0.546 0.6↑ 0.611↑0.667↑0.644↑ 0.64↑i=300, j=+∞0.4 0.560

0.587↑0.649↑0.692↑0.674↑ 0.673↑Table 10Compare SCO method classification with CHI-methods 表10SCO方法与CHI方法的分类性能对比

NB分类算法效果F-VALUE

不采用

特征筛选

采用CHI

特征筛选

基于短评论共现的特征筛选方法(SCO)

采用F CHI(i,j)∪(F i,j∩F k,l)作为分类特征

不同选择区间的短评论R k,l

k=1

l=10

k=1

l=20

k=1

l=30

k=1

l=40

k=1

l=50

不同长度的长评论

R i,j i=100, j=+∞0.735 0.738 0.7300.7300.772↑0.762↑ 0.740↑i=150, j=+∞0.678 0.687 0.6520.6770.717↑0.724↑0.673 i=200, j=+∞0.642 0.643 0.655↑0.668↑0.718↑0.712↑ 0.656↑i=250, j=+∞0.543 0.545 0.620↑0.619↑0.662↑0.651↑ 0.658↑i=300, j=+∞0.4 0.562

0.585↑0.657↑0.682↑0.691↑ 0.683↑

在SCO方法中,如何选择最理想的短评论长度区间,也是一个较为关键的问题.选择不同长度区间的短评论,情感分类效果有所不同,其原因有两种:(1) 如果选择的长度区间过小,则该区间的短评论特征与长评论特征的共现程度太低,特别是针对每条长评论来讲,其共现的特征更少,并没有起到补充极性特征或极性表达方式的作用;(2) 如果选择的长度区间过大,长短评论之间的共现程度有所增加,但同时也带来一定的噪音,从而影响其分类效果.

以表9中数据为例,图4显示了SCO方法中不同区间的分类效果对比.当我们采用1~10区间的短评论特征

张林 等:轻型评论的情感分析研究 2803 与长评论IG 特征合并时,效果并不很理想;而采用1~20区间时,性能略有所上升;选择1~30及1~40区间时,效果较为理想,各项分组均高于IG 特征筛选方法时的效果;但当选择1~50区间时,部分长评论分组的效果开始有所下降.从实验效果来看:选择1~30或1~40特征区间,各个评论长度的分类效果最为理想.这里,我们仅通过实验对比的方法,发现长度在1~30区间分类效果最好.如何提出一套判定方法或判定指标,能够判断出最佳的短评论长度区间,还有待于后期进一步研究.

Fig.4 SCO method classification comparison in different reviews and different interval

图4 SCO 方法在不同评论长度及不同特征选取区间的分类效果比较

5.3 方法总结

传统的特征筛选方法可以降低文本中的噪音,减少特征的维度.但在长评论中,其特征词重复率较低,相互间共同点较少,在特征筛选过程中,一些有用的信息因为出现在文档中的次数少而容易被过滤掉.因此,特征筛选方法对于轻型评论来讲更容易造成信息缺失,将短评论与长评论的共现特征补充进来,可以有效地增加有利于极性判断的特征词,从而提高分类效果.

这里,我们给出样本实例:

样本评论1:“好友圈——把微信好友圈,弄个有我的好友圈,自己发过什么,点击我的好友圈,就可以看见了,就不要找半死,每天好友圈发的那么东西,我要找我发字和我分享的音乐都得找半死,还有照片,怎么那么烂啊,为什么不可以设置回答答案就可以看见照片的???!!!!!.”(负向)

该样本在经过IG 特征筛选了之后,只保留了“每天”、“可以”、“别”这样的特征词,机器判别其为正向.显然,筛选后没有保留该评论中的关键特征词,这有悖于特征筛选的初衷.经过短评论特征的补充,该句子中的大部分有用的特征词,如“好友圈”、“分享”、“半死”、“烂”、“!”等,由于在短评论中曾经大量出现过而被保留下来,并重新赋予了权重,机器判别为负向,从而提高了分类效果.

样本评论2:“我好像是沙发啊,哈哈!希望能出ipad 版,不要总是iphone 班(版)啊,......然后就是要提高下流畅度,在左划删除会话的时候,总是会有黑条在闪动,需要改进啊.”(正向)

该样本在经过IG 特征筛选了之后,保留的特征词有“删除”、“沙发”,判断出的极性是负向.但是经过短评论的特征补充之后,更多的特征词被保留下来,如“提高”、“流畅度”、“闪动”、“改进”、“iphone”等,机器判断也改为正向.

由上述两个样本实例我们可以看出:短评论中的特征有效地弥补了特征筛选所造成的信息过少的不足,补充的信息也有效地提高了分类的效果.

本论文提出的方法不仅能够辅助提高轻型评论中较长评论的分类效果,还可以扩展应用到其他的场景中.例如,游戏厂商可以通过采集手机游戏类的轻型评论,建立游戏类的短评论特征模型,利用该特征模型,辅助判评论长度 SCO 方法在不同评论长度及不同特征选取区间的分类效果比较0.80

分类效果F -v a l u e 特征选取区间 0.750.700.650.600.551~50区间

1~40区间1~30区间1~20区间 1~10区间

2804 Journal of Software软件学报 V ol.25, No.12, December 2014

断互联网游戏用户发表在论坛或微博上的情感,提高同领域长评论的分类效果.此外,利用轻型评论中的短评论特征模型中的优势信息,也可以建立该领域内的极性词词典或典型极性表达方式列表,这个领域字典或列表对于分析用户的情感也具有较好的辅助作用.

6 结论和未来的工作

随着智能移动设备的日渐普及,文本短小、数量众多的轻型评论将成为移动设备上评论的主流.本文将这类轻型评论作为研究对象,探讨该类评论的特点;在相关实验基础上,发现该类评论在情感分析上具有的特性;根据这些特性,本文提出了基于短评论共现的特征筛选法,以提高轻型评论中长评论的分类效果.

本文贡献主要有以下3点:

1) 提出了轻型评论的概念、特点及定义.

智能移动设备上日益丰富的用户评论是一种新兴的评论形态,是文本挖掘以及意见挖掘值得关注的研究对象.本文将这类评论定义为轻型评论,并根据统计及实验分析总结了该类评论的特点,即:平均字数少、跨度大,且短小评论占了评论中的主流,评论长度与评论数量满足幂率分布规律.

同时,本文也指出了轻型评论与互联网评论、短文本研究的不同点.在长度上,轻型评论比互联网评论更加短小;在数量上,短小评论成了评论的主流;这使得传统的分析方法值得重新审视;短文本的概念尽管与轻型评论有相似之处,但在分类的特性上,短文本研究主要是针对主题的分类研究,解决的是短文本信息缺失的问题.事实上,轻型评论中短文本中的情感极性信息并不缺失,相反,其信息含量更高,因此其情感分类效果更好.这也是轻型评论研究与短文本研究的不同点.

2) 发现轻型评论在情感分类方面具有的特性

本文按照传统的情感分析方法进行了一系列实验对比研究,发现轻型评论中:

(1) 文本长度越短,其情感分类效果越好;而随着文本长度的增加,其分类效果逐步降低;

(2) 传统的特征筛选方法,比如IG,CHI方法对轻型评论并不完全适用,甚至会降低短评论的分类效果;

(3) 传统的特征加权方法在不同的评论长度中,分类表现很不稳定;

(4) 短评论中的极性词比例要明显高于长评论中的含量;长评论中的极性词数量不是线性递增的,而是逐步收敛趋向稳定;

(5) 短评论与长评论中的特征有较高的共现度,说明长短评论在用词上存在着很高的相似性.

这些特性的发现,不仅使得我们重新审视传统的情感分类方法和结论,也有利于我们找到适合轻型评论自身特点的情感分类方法.

3) 提出了基于短评论共现的特征筛选方法.

针对轻型评论的特点,本文提出了基于短评论共现的特征筛选方法(SCO).该方法充分利用了短评论中富含极性词及极性表达方式的特点,在传统特征筛选方法的基础上,将长评论与短评论共现的特征保留下来;在筛选掉噪音的基础上,扩大了特征的维度,将优势信息补充进来.实验证明,该方法在长评论的情感分类上取得了良好的效果.

在未来的工作中,我们将会从以下几个方面深入研究:

(1)继续探讨针对轻型评论的情感分类方法,例如,如何定义一套指标或方法,帮助选择最佳的短评论长

度区间;

(2)扩大研究样本,将论文中提出的方法应用到其他领域的评论中;

(3)尝试利用轻型评论中的短评论信息,建立某一领域内的极性词词典,辅助语义角度的情感分析.

致谢本文是作者在美国访学期间完成的.在此,向给予本文的工作支持和建议的北京航空航天大学计算机学院软件研究所、美国弗吉尼亚理工大学、美国劳伦斯理工大学的老师及同学表示感谢.

张林等:轻型评论的情感分析研究2805

References:

[1] Hu MQ, Liu B. Mining and summarizing customer reviews. In: Proc. of the 10th ACM SIGKDD Int’l Conf. on Knowledge

Discovery and Data Mining. Seattle: ACM Press, 2004. 168?177. [doi: 10.1145/1014052.1014073]

[2] Dave K, Lawrence S, Pennock DM. Mining the peanut gallery: Opinion extraction and semantic classification of product reviews.

In: Proc. of the 12th Int’l Conf. on World Wide Web. Budapest: ACM Press, 2003. 519?528. [doi: 10.1145/775152.775226]

[3] Turney PD. Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews. In: Proc. of the

40th Annual Meeting on Association for Computational Linguistics. Philadelphia: Association for Computational Linguistics, 2002.

417?424.

[4] Abrahams AS, Jiao J, Wang GA, Fan WG. Vehicle defect discovery from social media. Decision Support Systems, 2012,54(1):

87?97. [doi: 10.1016/j.dss.2012.04.005]

[5] Tencent. Google android market. 2014 (in Chinese). https://www.360docs.net/doc/5310009170.html,/a/20120104/000474.htm

[6] Encyclopedia B. Appstore. 2014 (in Chinese). https://www.360docs.net/doc/5310009170.html,/view/2771827.htm

[7] Yang Z, Lai YX, Duan LJ, Li YJ. Short text sentiment classification based on context reconstruction. Acta Automatica Sinica, 2012,

38(1):55?67 (in Chinese with English abstract). [doi: 10.3724/SP.J.1004.2012.00055]

[8] Su JS, Zhang BF, Xu X. Advances in machine learning based text categorization. Ruan Jian Xue Bao/Journal of Software, 2006,

17(9):1848?1859 (in Chinese with English abstract). https://www.360docs.net/doc/5310009170.html,/1000-9825/17/1848.htm

[9] Pang B, Lee L, Vaithyanathan S. Thumbs up? Sentiment classification using machine learning techniques. In: Proc. of the Conf. on

Empirical Methods in Natural Language Processing. Philadelphia: Association for Computational Linguistics, 2002. 79?86. [doi:

10.3115/1118693.1118704]

[10] Ni XC, Xue GR, Ling X, Yu Y, Yang Q. Exploring in the weblog space by detecting informative and affective articles. In: Proc. of

the 16th Int’l Conf. on World Wide Web. Banff: ACM Press, 2007. 281?290. [doi: 10.1145/1242572.1242611]

[11] Mullen T, Collier N. Sentiment analysis using support vector machines with diverse information sources. In: Proc. of the Conf. on

Empirical Methods in Natural Language Processing. Barcelona: Association for Computational Linguistics, 2004. 412?418.

[12] Whitelaw C, Garg N, Argamon S. Using appraisal groups for sentiment analysis. In: Proc. of the 14th ACM Int’l Conf. on

Information and Knowledge Management. Bremen: ACM Press, 2005. 625?631. [doi: 10.1145/1099554.1099714]

[13] Cui H, Mittal V, Datar M. Comparative experiments on sentiment classification for online product reviews. In: Proc. of the 21st

National Conf. on Artificial Intelligence. Boston: AAAI Press, 2006. 1265?1270.

[14] Wiebe JM. Learning subjective adjectives from corpora. In: Proc. of the 17th National Conf. on Artificial Intelligence and 12th

Conf. on Innovative Applications of Artificial Intelligence. Austin: IEEE, 2000. 735?740.

[15] Riloff E, Wiebe J. Learning extraction patterns for subjective expressions. In: Proc. of the Conf. on Empirical Methods in Natural

Language Processing. Sapporo: Association for Computational Linguistics, 2003. 105?112. [doi: 10.3115/1119355.1119369] [16] Turney PD, Littman ML. Measuring praise and criticism: Inference of semantic orientation from association. ACM Trans. on

Information Systems, 2003,21(4):315?346.

[17] Kim SM, Hovy E. Identifying and analyzing judgment opinions. In: Proc. of the Main Conf. on Human Language Technology Conf.

of the North American Chapter of the Association of Computational Linguistics. New York: Association for Computational Linguistics, 2006. 200?207. [doi: 10.3115/1220835.1220861]

[18] Zhu YL, Min J, Zhou YQ, Huang XJ, Wu LD. Semantic orientation computing based on hownet. Journal of Chinese Information

Processing, 2006, 20(1):14?20 (in Chinese with English abstract). [doi: 10.3969/j.issn.1003-0077.2006.01.003]

[19] Ni MS, Lin HF. Mining product reviews based on association rule and polar analysis. In: Proc. of the NCIRCS. 2007. 628?634 (in

Chinese with English abstract).

[20] Xu J, Ding YX, Wang XL. Sentiment classification for Chinese news using machine learning methods. Journal of Chinese

Information Processing, 2007,21(6):95?100 (in Chinese with English abstract). [doi: 10.3969/j.issn.1003-0077.2007.06.013] [21] Moschitti A, Basili R. Complex linguistic features for text classification: A comprehensive study. In: Proc. of the Advances in

Information Retrieval. Springer-Verlag, 2004. 181?196. [doi: 10.1007/978-3-540-24752-4_14]

[22] Kehagias A, Petridis V, Kaburlasos VG, Fragkou P. A comparison of word- and sense-based text categorization using several

classification algorithms. Journal of Intelligent Information Systems, 2003,21(3):227?247. [doi: 10.1023/A:1025554732352]

2806 Journal of Software软件学报 V ol.25, No.12, December 2014

[23] Ye Q, Lin B, Li Y. Sentiment classification for chinese reviews: A comparison between SVM and semantic approaches. In: Proc. of

the Int’l Conf. on Machine Learning and Cybernetics. Guangzhou: IEEE, 2005. 2341?2346. [doi: 10.1109/ICMLC.2005.1527335] [24] Ye Q, Shi W, Li YJ. Sentiment classification for movie reviews in Chinese by improved semantic oriented approach. In: Proc. of

the 39th Annual Hawaii Int’l Conf. on System Sciences. Kauai: IEEE, 2006. 53b. [doi: 10.1109/HICSS.2006.432]

[25] Yao TF, Nie QY, Li JC, Li LL, Lou DC, Chen K, Fu Y. An opinion mining system for Chinese automobile reviews. In: Proc. of the

Chinese Society of Chinese Information 25 Anniversary Conf. Beijing: Tsinghua University Press, 2006. 260?281 (in Chinese with English abstract).

[26] Ye Q, Zhang ZQ, Luo ZX. Automatically measuring subjectivity of Chinese sentences for sentiment analysis to reviews on the

Internet. China Journal of Information Systems, 2007,1(1):79?91 (in Chinese with English abstract).

[27] Corpus-Imdb. 2014. https://www.360docs.net/doc/5310009170.html,/people/pabo/movie-review-data/

[28] Kasthuriarachchy BH, De Zoysa K, Premaratne HL. A review of domain adaptation for opinion detection and sentiment

classification. In: Proc. of the Int’l Conf. on Advances in ICT for Emerging Regions. Colombo: IEEE, 2012. 209?213. [doi:

10.1109/ICTer.2012.6423023]

[29] Tan S, Wang YF. Chnsenticorp corpus. 2010 (in Chinese). https://www.360docs.net/doc/5310009170.html,/tansongbo/corpus.htm

[30] Wang S, Fan XH, Chen XL. Chinese short text classification based on hyponymy relation. Journal of Computer Applications, 2010,

30(3):603?606 (in Chinese with English abstract). [doi: 10.3724/SP.J.1087.2010.00603]

[31] Mitchell TM. Machine learning and data mining. Communications of the ACM, 1999,42(11):30?36. [doi: 10.1145/319382.319388]

[32] Dunning T. Accurate methods for the statistics of surprise and coincidence. Computational Linguistics, 1993,19(1):61?74.

[33] Wiener E, Pedersen JO, Weigend AS. A neural network approach to topic spotting. In: Proc. of the 4th Annual Symp. on Document

Analysis and Information Retrieval. 1995. 317?332.

[34] Chen L, Tokuda N, Nagai A. A new differential LSI space-based probabilistic document classifier. Information Processing Letters,

2003,88(5):203?212. [doi: 10.1016/j.ipl.2003.09.002]

[35] Kim H, Howland P, Park H. Dimension reduction in text classification with support vector machines. Journal of Machine Learning

Research, 2005,6:37?53.

[36] Park H, Jeon M, Rosen JB. Lower dimensional representation of text data based on centroids and least squares. BIT Numerical

Mathematics, 2003,43(2):427?448. [doi: 10.1023/A:1026039313770]

[37] Wang L, Jia Y, Han W. Instant message clustering based on extended vector space model. In: Proc. of the 2nd Int’l Conf. on

Advances in Computation and Intelligence. Springer-Verlag, 2007. 435?443. [doi: 10.1007/978-3-540-74581-5_48]

[38] Fan XH, Hu HG. A new model for Chinese short-text classification considering feature extension. In: Proc. of the Int’l Conf. on

Artificial Intelligence and Computational Intelligence. Sanya: IEEE, 2010. 7?11. [doi: 10.1109/AICI.2010.125]

[39] Adams PH, Martell CH. Topic detection and extraction in chat. In: Proc. of the IEEE Int’l Conf. on Semantic Computing. Santa

Clara: IEEE, 2008. 581?588. [doi: 10.1109/ICSC.2008.61]

[40] Hall M, Frank E, Holmes G, Pfahringer B, Reatemann P, Witten IN. The WEKA data mining software: An update. ACM SIGKDD

Explorations Newsletter, 2009, 11(1):10?18. [doi: 10.1145/1656274.1656278]

[41] Mmseg4j. 2014. https://www.360docs.net/doc/5310009170.html,/p/mmseg4j/

[42] Zong CQ. Statistical Natural Language Processing. Tsinghua University Press, 2008 (in Chinese).

[43] Liu ZM, Liu L. Empirical study of sentiment classification microblog based on machine learning. Computer Engineering and

Applications, 2012,48(1):1?4 (in Chinese with English abstract). [doi: 10.3778/j.issn.1002-8331.2012.01.001]

附中文参考文献:

[5] 腾讯科技.谷歌Android Market. 2014. https://www.360docs.net/doc/5310009170.html,/a/20120104/000474.htm

[6] 百度百科.AppStore. 2014. https://www.360docs.net/doc/5310009170.html,/view/2771827.htm

[7] 杨震,赖英旭,段立娟,李玉.基于上下文重构的短文本情感极性判别研究.自动化学报,2012,38(1):55?67. [doi: 10.3724/SP.J.1004.

2012.00055]

[8] 苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展.软件学报,2006,17(9):1848?1859. https://www.360docs.net/doc/5310009170.html,/1000-

9825/17/1848.htm

张林等:轻型评论的情感分析研究2807

[18] 朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算.中文信息学报,2006,20(1):14?20. [doi: 10.3969/j.issn.

1003-0077.2006.01.003]

[19] 倪茂树,林鸿飞.基于关联规则和极性分析的商品评论挖掘.见:第3届全国信息检索与内容安全学术会议.苏州,2007.635?642.

[20] 徐军,丁宇新,王晓龙.使用机器学习方法进行新闻的情感自动分类.中文信息学报,2007,21(6):95?100. [doi: 10.3969/j.issn.

1003-0077.2007.06.013]

[25] 姚天昉,聂青阳,李建超,李林琳,娄德成,陈珂,付宇.一个用于汉语汽车评论的意见挖掘系统.见:中国中文信息学会25周年学术

会议.北京:清华大学出版社,2006.260?281.

[26] 叶强,张紫琼,罗振雄.面问互联网评论情感分析的中文主观性自动判别方法研究.信息系统学报,2007,1(1):79?91.

[29] 谭松波,王月粉.ChnSentiCorp语料.2010. https://www.360docs.net/doc/5310009170.html,/tansongbo/corpus.htm

[30] 王盛,樊兴华,陈现麟.利用上下位关系的中文短文本分类.计算机应用,2010,30(3):603?606. [doi: 10.3724/SP.J.1087.2010.00603]

[42] 宗成庆,统计自然语言处理.北京:清华大学出版社,2008.

[43] 刘志明,刘鲁.基于机器学习的中文微博情感分类实证研究.计算机工程与应用,2012,48(1):1?4. [doi: 10.3778/j.issn.1002-8331.

2012.01.001]

张林(1970-),女,山西翼城人,博士生,副教授,CCF会员,主要研究领域为意见挖掘,需求验证.

E-mail: zhanglin_hz@https://www.360docs.net/doc/5310009170.html,

华琨(1977-),男,博士,副教授,主要研究领域为人工智能,多媒体挖掘.

E-mail: Khua@https://www.360docs.net/doc/5310009170.html,

钱冠群(1978-),男,博士,主要研究领域为

大数据处理,用户属性挖掘,复杂网络

分析.

E-mail: Qianguanqun@https://www.360docs.net/doc/5310009170.html,

张莉(1968-),女,博士,教授,博士生导

师,CCF会员,主要研究领域为软件过程,

需求分析,软件测试.

E-mail: Lily@https://www.360docs.net/doc/5310009170.html,

樊卫国(1973-),男,博士,教授,博士生导

师,主要研究领域为商业智能挖掘,文本

挖掘.

E-mail: wfan@https://www.360docs.net/doc/5310009170.html,

文本情感分析综述

文本情感分析综述? 赵妍妍+, 秦兵, 刘挺 (哈尔滨工业大学计算机科学与技术学院信息检索研究中心, 黑龙江哈尔滨 150001) A Survey of Sentiment Analysis * ZHAO Yan-Yan+, QIN Bing, LIU Ting (School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China) + Corresponding author: Phn: +86-451-86413683 ext 800, E-mail: zyy@https://www.360docs.net/doc/5310009170.html, Abstract: Sentiment analysis is a novel research topic with the quick development of online reviews, which has drawn interesting attention due to its research value and extensive applications. This paper surveys the state-of-the-art research on sentiment analysis. First, three important tasks of sentiment analysis are summarized and analyzed in detail, including sentiment extraction, sentiment classification, sentiment retrieval and summarization; then the evaluation and corpus for sentiment analysis are introduced; finally the applications of sentiment analysis are concluded. This paper aims to take a deep insight into the mainstream methods and recent progress in this field, making detailed comparison and analysis. It is expected to be helpful to the future research. Key words: sentiment analysis; sentiment extraction; sentiment classification; sentiment retrieval and summarization; evaluation; corpus 摘 要: 文本情感分析是随着网络评论的海量增长而迅速兴起的一个新兴研究课题,其研究价值和应用价值受到人们越来越多的重视.本文对文本情感分析的研究现状与进展进行了总结.首先将文本情感分析归纳为三项主要任务,即情感信息抽取,情感信息分类以及情感信息的检索与归纳,并对它们进行了细致的介绍和分析;进而介绍了文本情感分析的国内外评测和资源建设情况;最后介绍了文本情感分析的应用.文本重在对文本情感分析研究的主流方法和前沿进展进行概括,比较和分析,以期对后续研究有所助益. 关键词: 文本情感分析;情感信息抽取;情感信息分类;情感信息的检索与归纳;评测;资源建设 中图法分类号: TP391文献标识码: A 随着Web2.0的蓬勃发展,互联网逐渐倡导“以用户为中心,用户参与”的开放式构架理念.互联网用户由单纯的“读”网页,开始向“写”网页、“共同建设”互联网发展,并由被动地接收互联网信息向主动创造互联网信息迈进.因此,互联网(如:博客和论坛)上产生了大量的用户参与的,对于诸如人物、事件、产品等有价值的评论信息.这些评论信息表达了人们的各种情感色彩和情感倾向性,如“喜”、“怒”、“哀”、“乐”,和“批评”、“赞扬”等.基于此,潜在的用户就可以通过浏览这些主观色彩的评论,来了解大众舆论对于某一事件或产品的看法.由于越来越多的用户乐于在互联网上分享自己的观点或体验,这类评论信息迅速膨胀,仅靠人工的方法难以应对网上海量信 ?Supported by the National Natural Science Foundation of China under Grant Nos. 60803093, 60975055 (国家自然科学基金) and the “863” National High-Tech Research and Development of China via grant 2008AA01Z144(863计划探索类专题项目)

文本情感分析论文总结

文本情感分析 赵妍妍,秦兵,刘挺- 软件学报, 2010 - https://www.360docs.net/doc/5310009170.html, 按粒度,情感分析可分为词语级、短语级、句子级、篇章级、多篇章级;按文本类别,可分为基于新闻评论和基于产品的情感分析。 情感分析的研究任务:情感信息的抽取、分类以及检索与归纳。 一、情感信息抽取(评价词语、评价对象、观点持有者) 1.评价词语的抽取:基于语料库的抽取;基于词典的抽取;基于图的方法。 2.评价对象的抽取:基于规则/模板的方法(词序列、词性、句法规则、关联规则挖掘);评 价对象最为产品属性,考察评价对象与领域指示词的关联度来获取;多粒度的话题模型方法。 3.观点持有者抽取:命名实体识别技术(人名或机构名)、语义角色标注;分类任务,看做 序列标注问题,使用CRF融合特征抽取;名词短语作为候选,使用ME模型计算。 4.组合评价单元的抽取: 主观表达式:Wiebe的主观表达式库(抽取n元词语/词组作为候选,对比训练预料判断) 评价短语抽取(程度副词-评价词语):情感词典的方法;依存句法解构(ADV,ATT,DE)。 评价搭配抽取(评价词语-评价对象):基于模板的方法(8个共现模板、句法关系模板)。 二、情感信息分类 1.主客观信息分类:文本是否含情感知识方法;组合评价单元判断;情感模板识别;基于 分类器和分类特征的二元分类任务(词语特征,标点、人称代词、数字特征,基于图); 2.主观信息情感分类(句子级、篇章级):基于情感知识、基于特征分类的方法(n-gram词语 特征和词性特征、位置特征、评价词特征)。 三、情感信息的检索与归纳 1.情感信息检索 2.情感信息归纳 基于产品属性的情感文摘:识别评论信息中的产品属性,抽取描述产品属性的情感句,判断其倾向性。 基于情感标签的情感文摘:标签可定义为评价搭配形式,建立标签库,相似度聚类的方法聚类得到相似的情感标签,每一类视为潜在的话题(即产品属性)。 基于新闻评论的文摘 四、情感分析的评测与资源 1.情感分析的评测:TREC,NTCIR的MOAT(新闻观点检测,情感问答,跨语言情感分析), 国内的COAE。 2.情感分析的语料:康奈尔大学的影评数据集,UIC的Hu和Liu的产品领域的评论语料, Wiebe的MPQA新闻评论深度标注语料,MIT的多角度餐馆评论语料,中科院的中文酒店评论语料。 3.词典资源:GI(general inquirer)评价词词典,NTU评价词词典(繁体中文),主观词词典(英 文),HowNet评价词词典(简体中文、英文) 问题:情感信息抽取忽略词语所在语境的影响;评价对象的情感分类,而非句子级或篇章级;基于情感标签的情感文摘的深入研究;

基于商品评论文本的情感分析研究

龙源期刊网 https://www.360docs.net/doc/5310009170.html, 基于商品评论文本的情感分析研究 作者:陶莉娜李超萍李健高荣 来源:《现代信息科技》2018年第04期 摘要:随着互联网络科技的迅速发展,越来越多的用户开始网上购物,网络中的商品评 论数据也随之增加。如何在大量的评论数据中提取有用的信息,使数据价值最大化是值得重视的问题。本文针对京东网站商品的评论数据进行了情感分析,从中提取有用的信息,帮助商家了解消费者的需求,发现商品的不足之处,并制定改进方案,以提高商品的竞争力。 关键词:数据挖掘;商品评论;情感分析 中图分类号:TP391.1 文献标识码:A 文章编号:2096-4706(2018)04-0019-03 Abstract:With the rapid development of internet technology,more and more users have begun to shop online,and the product review data on the internet has also increased. However,how to extract useful information from a large amount of review data and maximize the value of data is a problem worthy of attention. This article analyzes the sentiment data of https://www.360docs.net/doc/5310009170.html, website products,provides useful information to help businesses understand the needs of consumers,discovers the inadequacies of products,and formulates improvement programs to improve the competitiveness of products. Keywords:data mining;commodity reviews;sentiment analysis 1 主要技术实现 1.1 网络爬虫 网络的迅速发展使互联网成为大量信息的载体,有效地提取并利用这些信息对我们来说是一个很大的挑战。为了快速的提取有用信息,我们采取网络爬虫技术,它的好处是获取成本小,可以将网页上的内容按照一定的格式规范进行有针对性地获取。 1.2 基于文本情感分析 文本的情感分析是指利用计算机语言、自然语言处理和文本挖掘来辨别文本主观情感信息的一种手段。一般来说,情感分析是对说话者当时的言语评论或建议的一个情感状况辨析。其研究内容包括非结构化文本的分词、情感倾向性分类和情感强度等,它涉及到自然语言处理、文本分词、机器学习等多个研究领域。本文的研究重点是对商品评论文本所表达的正向或负向情感进行分类[1]。

文本情感分析研究现状

文本情感分析研究现状 机器之心专栏 作者:李明磊 作为NLP领域重要的研究方向之一,情感分析在实际业务场景中 存在巨大的应用价值。在此文中,华为云NLP算法专家李明磊为 我们介绍了情感分析的概念以及华为云在情感分析方面的实践和 进展。 基本概念 为什么:随着移动互联网的普及,网民已经习惯于在网络上表达意见和建议,比 如电商网站上对商品的评价、社交媒体中对品牌、产品、政策的评价等等。这些评价中都蕴含着巨大的商业价值。比如某品牌公司可以分析社交媒体上广大民众对该品牌的评价,如果负面评价忽然增多,就可以快速采取相应的行动。而这种正负面评价的分析就是情感分析的主要应用场景。 是什么:文本情感分析旨在分析出文本中针对某个对象的评价的正负面,比如「华为手机非常好」就是一个正面评价。情感分析主要有五个要素,(entity/实体, aspect/属性,opinio n/观点,holder/观点持有者,time/时间),其中实体和属性合并称为评价对象(target)。情感分析的目标就是从非结构化的文本评论中抽取出这五个要素

、 (entity 体, 输入文木 holder/?点持有者,time/ 时 |i 图i情感分析五要素 举例如下图: 我觉得华为手机非常牛逼。(华为手机* 图2情感分析五要素例子 上例中左侧为非结构化的评论文本,右侧为情感分析模型分析出的五个要素中的四个(不包括时间)。其中实体「华为手机」和属性「拍照」合并起来可以作为评价对象。评价对象又可细分为评价对象词抽取和评价对象类别识别。如实体可 以是实体词和实体类别,实体词可以是「餐馆」、「饭店」、「路边摊」,而实 体类别是「饭店」;属性可以是属性词和属性类别,如属性词可以是「水煮牛肉」、 「三文鱼」等,都对应了属性类别「食物」。实体类别和属性类别相当于是对实体词和属性词的一层抽象和归类,是一对多的关系。词和类别分别对应了不同的

情感分析简述

情感分析简述 分类:NLP2012-04-08 12:38 1022人阅读评论(3) 收藏举报情感classification算法测试translationmatrix 情感分析,我研究了也有半年有余了,ACL Anthology上关于情感分析的论文也基本看过了一遍,但是到目前还没有什么成就的。以下是我为一位同学毕业设计写的情感分析方面的综述,引用的论文基本上是ACL 和COLING还有EMNLP上历年关于情感分析的论文,本文应该学术性比较强一点,本文虽不打算发表,但由于将来可能还有用,以及关于学术上的原因,请大家如果要引用请务必标明出处 (https://www.360docs.net/doc/5310009170.html,/s/blog_48f3f8b10100irhl.html)。 概述 情感分析自从2002年由Bo Pang提出之后,获得了很大程度的研究的,特别是在在线评论的情感倾向性分析上获得了很大的发展,目前基于在线评论文本的情感倾向性分析的准确率最高能达到90%以上,但是由于深层情感分析必然涉及到语义的分析,以及文本中情感转移现象的经常出现,所以基于深层语义的情感分析以及篇章级的情感分析进展一直不是很大。情感分析还存在的一个问题是尚未存在一个标准的情感测试语料库,虽然Bo Pang实验用的电影评论数据集(https://www.360docs.net/doc/5310009170.html,/people/pabo/movie-review-data/)以及Theresa Wilson等建立的MPQA(https://www.360docs.net/doc/5310009170.html,/mpqa/)是目前广泛使用的两类情感分析数据集,但是并没有公认的标准加以确认。 目前情感分析的研究基本借鉴文本分类等机器学习的方法,还没有根据自身的特点形成一套独立的研究方法,当然在某种程度上也可以把情感分析看出一种特殊的文本分类。比较成熟的方法是基于监督学习的机器学习方法,半监督学习和无监督学习目前的研究不是很多,单纯的基于规则的情感分析这两年已很少研究了。既然目前很多情感分析的研究基于机器学习,那么特征选择就是一个很重要的问题,N元语法等句法特征是使用最多的一类特征,而语义特征(语义计算)和结构特征(树核函数)从文本分类的角度看效果远没有句法特征效果好,所以目前的研究不是很多的。 由于基于监督学习情感分析的研究已经很成熟了,而且在真实世界中由于测试集的数量要远远多于训练集的数量,并且测试集的领域也不像在监督学习中被限制为和训练集一致,也就是说目前情感分析所应用的归纳偏置假设在真实世界中显得太强的,为了和真实世界相一致,基于半监督学习或弱指导学习的情感分析和跨领域的情感分析势必是将来的研究趋势之一。 在情感分析的最初阶段基于语义和基于规则的情感分析曾获得了比较大的重视,但是由于本身实现的复杂性以及文本分类和机器学习方法在情感分析应用上获得的成功,目前关于这方面的研究以及很少了,但是事实上,语义的相关性和上下文的相关性正是情感分析和文本分类最大的不同之处,所以将基于语义和规则的情感分析与基于机器学习的情感分析相结合也将是未来的研究趋势之一。 以下将分别对情感分析的起源,目前基于监督学习,无监督学习,基于规则和跨领域的情感分析的一些研究工作进行简单的介绍。 起源 虽然之前也有一些相关工作,但目前公认的情感分析比较系统的研究工作开始于(Pang et al., 2002)基于监督学习(supervised learning)方法对电影评论文本进行情感倾向性分类和(Turney,2002)基于无监督学习(unsupervised learning)对文本情感情感倾向性分类的研究。(Pang et al., 2002)基于文本的N元语法(ngram)和词类(POS)等特征分别使用朴素贝叶斯(Naive Bayes),最大熵(Maximum Entropy)和支持向量机(Support Vector Machine,SVM)将文本情感倾向性分为正向和负向两类,将文本的情感进行二元划分的做法也一直沿用至今。同时他们在实验中使用电影评论数据集目前已成为广泛使用的情感分析的测试集。(Turney ,2002)基于点互信息(Pointwise Mutual Information,PMI)计算文本中抽取的关键词和种子词(excellent,poor)的相似度来对文本的情感倾向性进行判别(SO-PMI算法)。 在此之后的大部分都是基于(Pang et al., 2002)的研究。而相对来说,(Turney et al.,2002)提出的无监督学习的方法虽然在实现上更加简单,但是由于单词之间的情感相似度难以准确的计算和种子词的难以确定,继续在无监督学习方向的研究并不是很多的,但是利用SO-PMI算法计算文本情感倾向性的思想却被很多研究者所继承了。 监督学习 目前,基于监督学习的情感分析仍然是主流,除了(Li et al.,2009)基于非负矩阵三分解(Non-negative Matrix Tri-factorization),(Abbasi et al.,2008)基于遗传算法(Genetic Algorithm)的情感分析之外,使用的最多的监督学习算法是朴素贝叶斯,k最近邻(k-Nearest Neighbor,k-NN),最大熵和支持向量机的。而对于算法的改进主要在对文本的预处理阶段。 一个和文本分类不同地方就是情感分析有时需要提取文本的真正表达情感的句子。(Pang et al., 2004)基于文本中的主观句的选择和(Wilson el al.,2009)基于文本中的中性实例(neutral instances)的分析,都是为了能够尽量获得文本中真正表达情感的句子。(Abbasi et al.,2008)提出通过信息增益(Information Gain,IG)的方法来选择大量特征集中对于情感分析有益的特征。 而对于特征选择,除了N元语法和词类特征之外,(Wilson el al.,2009)提出混合单词特征,否定词特征,情感修饰特征,情感转移特征等各类句法特征的情感分析,(Abbasi et al.,2008)提出混合句子的句法(N元语法,词类,标点)和结构特征(单词的长度,词类中单词的个数,文本的结构特征等)的情感分析。 除了对于文本的预处理,对于监督学习中情感分析还进行了以下方面的研究的。(Melville et al., 2009)和(Li et al.,2009)提出结合情感词的先验的基于词典的情感倾向性和训练文本中后验的基于上下文的情感情感倾向性共同判断文本的情感倾向性。(Taboada et al.,2009)提出结合文本的题材(描述,评论,背景,解释等)和文本本身的特征共同判断文本的情感倾向性。(Tsutsumi et al.,2007)提出利用多分类器融合技术来对文本情感分类。(Wan, 2008)和(Wan, 2009)提出结合英文中丰富的情感分析资源来提高中文情感分析的效果。 基于规则/无监督学习

Web文本情感分类研究综述

情报学报  ISSN1000-0135 第29卷第5期931-938,2010年10月 JOURNALOFTHECHINASOCIETYFORSCIENTIFIC ANDTECHNICALINFORMATIONISSN1000-0135Vol.29 No.5,931-938October 2010 收稿日期:2009年6月29日 作者简介:王洪伟,男,1973年生,博士,副教授桙博导,研究方向:本体建模和情感计算,E-mail:hwwang@tongji.edu.cn。刘勰,男,1985年生,硕士研究生,研究方向:数据挖掘与情感计算。尹裴,女,1986年生,硕士研究生,研究方向:商务智能。廖雅国,男,1954年生,博士,教授,研究方向:人工智能与电子商务。 1) 本文得到国家自然科学基金项目(70501024,70971099);教育部人文社会科学资助项目(05JC870013);上海市重点学科建设项目(B310);香港研究资助局项目(polyU5237桙08E)资助。 doi:10.3772桙j.issn.1000-0135.2010.05.023 Web文本情感分类研究综述 1) 王洪伟1  刘 勰1  尹 裴1  廖雅国 2 (1畅同济大学经济与管理学院,上海200092;2畅香港理工大学电子计算学系,香港) 摘要 对用户发表在Web上的评论进行分析, 能够识别出隐含在其中的情感信息,并发现用户情感的演变规律。为此,本文对Web文本情感分类的研究进行综述。将情感分类划分为三类任务:主客观分类、极性判别和强度判别,对各自的研究进展进行总结。其中将情感极性判别的方法分为基于情感词汇语义特性的识别和基于统计自然语言处理的识别方法。分析了情感分类中的语料库选择和研究难点。最后总结了情感分类的应用现状,并指出今后的研究方向。 关键词 Web文本 情感分类 综述 主观性文本 LiteratureReviewofSentimentClassificationonWebText WangHongwei1 ,LiuXie1 ,YinPei1 andLiuN.K.James 2 (1畅SchoolofEconomicsandManagement,TongjiUniversity,Shanghai200092;2畅DepartmentofComputing,HongKongPolytechnicUniversity,HongKong) Abstract Analyzingtheusers’reviewsontheWebcanhelpustoidentifyusers’implicitsentimentsandfindtheevolution lawsoftheiremotion.Tothisend,thispaperisasurveyaboutthesentimentclassificationontheWebtext.Wedividedtheprocessofclassificationintothreecategories:subjectiveandobjectiveclassification,polarityidentificationandintensity identificationandrespectivelysummarizetheresentresearchachievementsinthesefields.Wealsosortedthemethodsofpolarityidentificationintotwotypes:oneisbasedontheemotionalwordswithsemanticcharacteristics,whiletheotherstatisticmethodsof naturallanguageprocessing.Whatismore,thechoiceofcorpusandpotentialresearchproblemsarediscussed.Atlast,thispaper summarizedthestatusquoofapplicationandpointedoutthedirectionoffutureresearch. Keywords Webtexts,sentimentclassification,survey,subjectivetext 随着互联网的流行,Web文本成为我们获取信 息、发表观点和交流情感的重要来源。特别是随着Web2畅0技术的发展,网络社区、博客和论坛给网络用户提供了更宽广的平台来交流信息和表达意见。这些文章和言论往往包含有丰富的个人情感,比如 对某部大片的影评,对某款手机的用户体验等,其中 蕴含着巨大的商业价值。如何从这些Web文本中进行情感挖掘,获取情感倾向已经成为当今商务智能领域关注的热点。所谓情感分析(sentimentanalysis),就是确定说话人或作者对某个特定主题的 — 139—

开题报告(文献综述)-在线评论分析系统的情感分析

开题报告(文献综述)-在线评论分析系统的情感分析本科毕业设计(论文)开题报告 论文题目在线评论分析系统的情感分析开题报告内容: 一、选题的背景及意义 近年来,在“大数据”(Big Data)时代的背景下,随着电子商务行业的蓬勃发展,网络购物平台、手机APP应用市场平台等不仅为用户提供了大量商品信息,同时还允许用户参与商品评论。它不仅为商家提供了一个信息的展示平台以发布新产品的规格数据,也为消费者提供了一个产品使用体验交流以及质量评价的平台。因此很多网络用户在购买或使用某类产品前,往往会选择先上网浏览一些该产品的相关信息,尤其是其他用户的使用体验,多方比较产品的性能,从而使自己的消费和选择更趋理性化。分析这些评论信息,蕴含着巨大的商业价值和社会价值,具有很大的现实意义。 然而,这些主观性评论文本每天以指数级的速度增长,仅靠人工方式难以进行 收集、处理和分析。因此采用计算机技术来自动地分析这些主观性文本表达的情感,成为目前数据挖掘(Data Mining)研究的一个热点,而这个热点的研究方向就是文本情感分析(Sentiment Analysis)。 文本情感分析,也称为意见挖掘(Opinion Mining),是指通过分析和挖掘文本中的表达情感、观点和立场的主观性信息并判断其情感倾向。它涉及自然语言处理(Natural Language Processing)、计算机语言学(Computational Linguistics)、机器学习(Machine Learning)、信息检索(Information Retrieval)等众多领域,在计算机科学、管理学、政治学、经济学和社会学方向都有广泛的应用。进入21 世纪以后,情感分析这个领域变得活跃起来,吸引越来越多的学者投入其中。目前

文本情感分类研究综述

Web文本情感分类研究综述 王洪伟/刘勰/尹裴/廖雅国 2012-9-27 14:55:59 来源:《情报学报》(京)2010年5期【英文标题】Review of Sen time nt Classificati on on Web Text 【作者简介】王洪伟,男,1973年生,博士,副教授/博士生导师,研究方向:本体建模和情感计算,E-mail:hwwa ng@t on https://www.360docs.net/doc/5310009170.html,.c n 。同济大学经济与管理学院,上海200092; 刘勰,男,1985年生,硕士研究生,研究方向:数据挖掘与情感计算。同济大学经济与管理学院,上海200092; 尹裴,女,1986年生,硕士研究生,研究方向:商务智能。同济大学经济与管理学院,上海200092; 廖雅国,男,1954年生,博士,教授,研究方向:人工智能与电子商务。香港理工大学电子计算学系,香港 【内容提要】对用户发表在Web上的评论进行分析,能够识别出隐含在其中的情感信息,并发现用户情感的演变规律。为此,本文对Web文本情感分类的研究进行综述。将情感分类划分为三类任务:主客观分类、极性判别和强度判别,对各自的研究进展进行总结。其中将情感极性判别的方法分为基于情感词汇语义特性的识别和基于统计自然语言处理的识别方法。分析了情感分类中的语料库选择和研究难点。最后总结了情感分类的应用现状,并指出今后的研究方向。 Analyzing the users' reviews on the Webcan help us to identify users' implicit

sen time nts and find the evoluti on laws of their emoti on. To this end, this paper is a survey about the sen time nt classificati on on the Web text. We divided the process of classificati on into three categories:subjective and objective classification,polarity iden tificati on and in ten sity ide ntificati on and respectively summarize the rese nt research achieveme nts in these fields. We also sorted the methods of polarity identification into two types: one is based on the emotional words with semantic characteristics, while the other statistic methods of natural Ianguage processing. What is more, the choice of corpus and pote ntial research problems are discussed. At last, this paper summarized the status quo of applicatio n and poin ted out the direct ion of future research. 【关键词】Web文本/情感分类/综述/主观性文本Web texts/Sentiment classificati on/Survey/Subjective text 随着互联网的流行,Web文本成为我们获取信息、发表观点和交流情感的重要来源。特别是随着Web2.0技术的发展,网络社区、博客和论坛给网络用户提供了更宽广的平台来交流信息和表达意见。这些文章和言论往往包含有丰富的个人情感,比如对某部大片的影评,对某款手机的用户体验等,其中蕴含着巨大的商业价值。如何从这些Web文本中进行情感挖掘,获取情感倾向已经成为当今商务智能领域关注的热点。所谓情感分析(sentiment analysis),就是确定说话人或作者对某个特定主题的态度。其中,态度可以是他们的判断或者评估,他们(演说、写作时)的情绪状态,或者有意(向受众)传递的情感信息。因此,情感分析的一个重要问题就是情感倾向性的判断,即判断作者的观点是褒义的、积极的,还是贬义的、消极的。这类问题也被称为情感分类(sentiment classification) 。

文本情感分析综述

随着企业信息化与互联网的发展,信息以爆炸性速度飞速增长,其中包括了大量的非结构化与半结构化数据。非结构化与半结构化数据,主要是文本型数据,阐述5w问题,即who,when,where,what,Why。如何充分利用非结构化数据与半结构化数据,分析其包含的潜在信息,拥有支持决策,成为了众多企业与研究者关注的重点。尤其,针对互联网(如博客和论坛)上大量的用户参与的、对于诸如人物、事件、产品等有价值的评论信息。这些评论信息表达了人们的各种情感色彩和情感倾向性,如喜、怒、哀、乐和批评、赞扬等。基于此,潜在的用户就可以通过浏览这些主观色彩的评论来了解大众舆论对于某一事件或产品的看法。由于越来越多的用户乐于在互联网上分享自己的观点或体验,这类评论信息迅速膨胀,仅靠人工的方法难以应对网上海量信息的收集和处理,因此迫切需要计算机帮助用户快速获取和整理这些相关评价信息。因此,如何从这些Web文本中进行情感挖掘,获取情感倾向已经成为当今商务智能领域关注的热点。情感分析(sentiment analysis)技术也就应运而生(本文中提及的情感分析,都是指文本情感分析)。 文本情感分析(sentiment analysis),又称为意见挖掘,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。其中,主观情感可以是他们的判断或者评价,他们的情绪状态,或者有意传递的情感信息。因此,情感分析的一个主要任务就是情感倾向性的判断,Pang等人在文献1中将情感倾向分为正面、负面和中性,即褒义、贬义和客观评价。研究初期,大量研究者都致力于针对词语和句子的倾向性判断研究,但随着互联网上大量主观性文本的出现,研究者们逐渐从简单的情感词语的分析研究过渡到更为复杂的情感句研究以及情感篇章的研究。文本情感分析主要可以归纳为3项层层递进的研究任务,即情感信息的抽取、情感信息的分类以及情感信息的检索与归纳[2]。情感信息抽取就是将无结构的情感文本转化为计算机容易识别和处理的结构化文本。情感信息分类则是利用情感信息抽取的结果将情感文本单元分为若干类别,供用户查看,如分为褒、贬、客观或者其他更细致的情感类别。情感信息检索和归纳可以看作是与用户直接交互的接口,强调检索和归纳的两项应用。 情感分析是一个新兴的研究课题,具有很大的研究价值和应用价值,正受到国内外众多研究者的青睐。目前实现情感分析的技术主要包括基于机器学习法和基于语义方法两类。本文主要针对这两大方法的研究进展进行比较分析,接着介绍国内外现有的资源建设情况,最后介绍情感分析的几个重要应用和展望它的发展趋势。 1 基于统计机器学习法 随着大规模语料库的建设和各种语言知识库的出现,基于语料库的统计机器学习方法进入自然语言处理的视野。多种机器学习方法应用到自然语言处理中并取得了良好的效果,促进了自然语言处理技术的发展。机器学习的本质是基于数据的学习(Learning from Data)。利用机器学习算法对统计语言模型进行训练,最后用训练好的分类器对新文本情感进行识别。2002年,Pang 等人就在文献[1]中提出用机器学习的方法进行情感倾向的挖掘工作,他们以互联网上的电影评论文本作为语料,采用了不同的特征选择方法,应用朴素贝叶斯(Naive Bayes)、最大熵(Maximum Entropy)、向量机(SVM)对电影评论分别进行分类,实验表明SVM 的分类性能最好,准确率达到87.5%。该研究引起学术界的关注,之后用于倾向性判断的机器学习算法的改进被陆续提出,基本的算法有:支持向量机(SVM)、朴素贝叶斯(NB)、K-近邻(KNN)、简单线性分类器(SLC)和最大熵(ME)等。他们在另一项工作中,将文本极性分类问题转换成求取句子连接图的最小分割问题,实现了一个基于minimum-cut的分类器。[7]。Whitelaw等人[11]关注研究带形容词的词组及其修饰语(如“extremely boring”或“not really verygood”),他们提取带形容词的词组作为特征,基于这些特征,用向量空间模型表示文

商品评论情感分析系统的设计与实现

商品评论情感分析系统的设计与实现 近几年随着电子商务的不断发展成熟,网上购物越来越普及。消 费者在浏览电子商务网站的同时,也可以将对各种商品的评论发表到 网站上。如何充分挖掘、高效利用这些商品评论信息显得格外重要, 情感分析技术由此产生。目前主流的情感分析研究方法有基于情感知识的方法和基于机器学习的方法。基于情感知识的情感分析方法关键是针对词语的情感倾向进行研究,具有一定的局限性。基于机器学习 的情感分析方法目前主要利用传统的机器学习方法。随着深度学习的兴起,越来越多的学者将Deep Learning运用到情感分析领域。因此,本文探究运用深度学习方法进行情感分析研究,提高评论文本情感分 类的准确率。本文目标是构建一个高效准确的商品评论情感分析系统。实验所用的商品评论数据集,一部分利用Scrapy框架从京东网站上 爬取,一部分来自网上公开的数据集。对中文数据进行分词、词性筛选、去停用词,通过合理改进Word2Vec模型实现将预处理过的评论文本转换成词向量矩阵,输入到后续的情感分析分类器中。本文重点是 情感分析分类器的设计。卷积神经网络TextCNN能够降低数据规模和复杂程度,深层次捕捉文本数据的n元语法特征。门控循环单元GRU 模型简单、训练时间短,能够有效解决长短时间序列的变化问题,获得全局文本特征。本文提出新模型TextCNN-GRU作为系统的分类器。该模型先进入嵌入层完成词向量化训练,接着CNN部分提取文本局部最 优特征,GRU部分获得全局的句子表达,最后输出情感分类。为了提升模型的效果,本文在参数选择上设置很多对比实验,有词向量维度、

GRU层层数、滑动窗口大小等。通过TextCNN-GRU混合模型与单一模型TextCNN、GRU以及传统机器学习模型SVM、Naive Bayes、KNN比较,表明TextCNN-GRU在情感分析上比其他5种模型有更高的准确率,很好说明TextCNN-GRU能够综合TextCNN和GRU各自优势,取得更好的分类效果。

基于在线评论情感分析的快递服务质量评价

第43卷第3期 2017年3月 北京工业大学学报 JOURNAL OF BEIJING UNIVERSITY OF TECHNOLOGY Vol.43 No.3 Mar. 2017 基于在线评论情感分析的快递服务质量评价 王洪伟\宋媛\杜战其u,郑丽娟3,华瑾4,张艺伟1 (1.同济大学经济与管理学院,上海200092 ; 2.上海海洋大学工程学院,上海201306; 3.聊城大学商学院,山东聊城252000; 4.上海通用汽车销售有限公司,上海201206) 摘要:由于问卷调查分析法受访者少,问卷质量也低,为此,以海量的在线消费者评论为数据,采用情感分析技 术,提出一种快递服务质量评价方法.选取大众点评网上S F和ST两家快递企业的评论语料为例进行实验分析,首 先,应用服务质量测评模型SERVQUAL量表和物流服务质量评价的相关理论,结合文本分析方法,建立一套基于 在线评论情感分析的快递服务质量评价指标体系;其次,对评论语料进行抓取、分句、标识等预处理,比较不同特征 选择算法在不同分类算法下的查全率与查准率,最终以信息增益和支持向量机作为最佳组合,抽取614个特征项 用于有用性文本的识别;然后,基于HowNet的语义相似度极性计算方法和副词量级划分方法对在线评论进行情感 极性和强度分析;最后,应用TF-IDF法,结合评论文本确定评价指标的权重,对快递企业服务质量计算综合评价得 分.与大众点评网的星级评分进行对比,实验结果表明:该方法与现有方法相比,能够直观地比较S F和ST两家快 递企业在快递服务质量各项评价指标上的差异,并且两者的得分趋势相吻合. 关键词:在线评论;情感分析;快递服务;质量评价 中图分类号:U461; TP308 文献标志码:A 文章编号:0254 -0037(2017)03 -0402 -11 doi:10.11936/bjutxb2016010063 Evaluation of Service Quality for Express Industry Through Sentiment Analysis of Online Reviews WANG Hongwei1,SONG Y uan1,DU Zhanqi1,2,ZHENG Lijuan3,HUA Jin4,ZHANG Yiwei1 (1. School of Economics and Management,Tongji University,Shanghai 200092,China; 2. College of Engineering,Shanghai Ocean University,Shanghai 201306,China; 3. School of Business,University of Liaocheng,Liaocheng 252000,Shandong,China; 4. Saic General Motors Sales C o.,L td.,Shanghai 201206,China) A b stra c t :The evaluation m ethod based on questionnaire survey has lim ited respondents with low quality, therefore,an evaluation method of express service quality was put forward in this paper through sentim ent analysis of massive online reviews by selecting online reviews of express com panies SF and ST from dianping. com for experim ent analysis. F irst,the SERVQUAL model of service quality evaluation and the related theory of quality evaluation of logistics service was applied com bined with text analysis,to establish an index system of quality evaluation of express service through sentim ent analysis. Then online reviews such as capturing,phrasing and m arking were preprocessed,and the recall ratio and precision ratio under different feature selection algorithm and different classification algorithm were com pared. 614 features were extracted and the useful text were identified by choose IG and SVM as the best combination. 收稿日期:2016-01-27 基金项目:国家自然科学基金资助项目(71371144,71601082);上海市哲学社会科学规划课题资助项目(2013BGL004) 作者简介:王洪伟(1973—),男,教授,博士生导师,主要从事商务智能与情感计算方面的研究,E-mail:hwwang@tongji. edu. cn

文本情感分析_赵妍妍

ISSN 1000-9825, CODEN RUXUEW E-mail: jos@https://www.360docs.net/doc/5310009170.html, Journal of Software, Vol.21, No.8, August 2010, pp.1834?1848 https://www.360docs.net/doc/5310009170.html, doi: 10.3724/SP.J.1001.2010.03832 Tel/Fax: +86-10-62562563 ? by Institute of Software, the Chinese Academy of Sciences. All rights reserved. ? 文本情感分析 赵妍妍+, 秦兵, 刘挺 (哈尔滨工业大学计算机科学与技术学院信息检索研究中心,黑龙江哈尔滨 150001) Sentiment Analysis ZHAO Yan-Yan+, QIN Bing, LIU Ting (Center for Information Retrieval, School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China) + Corresponding author: E-mail: yyzhao@https://www.360docs.net/doc/5310009170.html, Zhao YY, Qin B, Liu T. Sentiment analysis. Journal of Software, 2010,21(8):1834?1848. https://www.360docs.net/doc/5310009170.html,/ 1000-9825/3832.htm Abstract: This paper surveys the state of the art of sentiment analysis. First, three important tasks of sentiment analysis are summarized and analyzed in detail, including sentiment extraction, sentiment classification, sentiment retrieval and summarization. Then, the evaluation and corpus for sentiment analysis are introduced. Finally, the applications of sentiment analysis are concluded. This paper aims to take a deep insight into the mainstream methods and recent progress in this field, making detailed comparison and analysis. Key words: sentiment analysis; sentiment extraction; sentiment classification; sentiment retrieval and summarization; evaluation; corpus 摘要: 对文本情感分析的研究现状与进展进行了总结.首先将文本情感分析归纳为3项主要任务,即情感信 息抽取、情感信息分类以及情感信息的检索与归纳,并对它们进行了细致的介绍和分析;进而介绍了文本情感分 析的国内外评测和资源建设情况;最后介绍了文本情感分析的应用.重在对文本情感分析研究的主流方法和前 沿进展进行概括、比较和分析. 关键词: 文本情感分析;情感信息抽取;情感信息分类;情感信息的检索与归纳;评测;资源建设 中图法分类号: TP391文献标识码: A 随着Web2.0的蓬勃发展,互联网逐渐倡导“以用户为中心,用户参与”的开放式构架理念.互联网用户由单纯 的“读”网页,开始向“写”网页、“共同建设”互联网发展,并由被动地接收互联网信息向主动创造互联网信息迈进. 因此,互联网(如博客和论坛)上产生了大量的用户参与的、对于诸如人物、事件、产品等有价值的评论信息. 这些评论信息表达了人们的各种情感色彩和情感倾向性,如喜、怒、哀、乐和批评、赞扬等.基于此,潜在的用 户就可以通过浏览这些主观色彩的评论来了解大众舆论对于某一事件或产品的看法.由于越来越多的用户乐 于在互联网上分享自己的观点或体验,这类评论信息迅速膨胀,仅靠人工的方法难以应对网上海量信息的收集 和处理,因此迫切需要计算机帮助用户快速获取和整理这些相关评价信息.情感分析(sentiment analysis)技术应 ?Supported by the National Natural Science Foundation of China under Grant Nos.60803093, 60975055 (国家自然科学基金); the National High-Tech Research and Development Plan of China under Grant No.2008AA01Z144 (国家高技术研究发展计划(863)) Received 2009-08-14; Revised 2009-12-25; Accepted 2010-03-11

相关文档
最新文档