中文短文本多级情感分析

合集下载

文本情感分析综述

文本情感分析综述

文本情感分析综述∗赵妍妍+, 秦兵, 刘挺(哈尔滨工业大学计算机科学与技术学院信息检索研究中心, 黑龙江哈尔滨 150001)A Survey of Sentiment Analysis *ZHAO Yan-Yan+, QIN Bing, LIU Ting(School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China)+ Corresponding author: Phn: +86-451-86413683 ext 800, E-mail: zyy@Abstract: Sentiment analysis is a novel research topic with the quick development of online reviews, which has drawn interesting attention due to its research value and extensive applications. This paper surveys the state-of-the-art research on sentiment analysis. First, three important tasks of sentiment analysis are summarized and analyzed in detail, including sentiment extraction, sentiment classification, sentiment retrieval and summarization; then the evaluation and corpus for sentiment analysis are introduced; finally the applications of sentiment analysis are concluded. This paper aims to take a deep insight into the mainstream methods and recent progress in this field, making detailed comparison and analysis. It is expected to be helpful to the future research.Key words: sentiment analysis; sentiment extraction; sentiment classification; sentiment retrieval and summarization;evaluation; corpus摘 要: 文本情感分析是随着网络评论的海量增长而迅速兴起的一个新兴研究课题,其研究价值和应用价值受到人们越来越多的重视.本文对文本情感分析的研究现状与进展进行了总结.首先将文本情感分析归纳为三项主要任务,即情感信息抽取,情感信息分类以及情感信息的检索与归纳,并对它们进行了细致的介绍和分析;进而介绍了文本情感分析的国内外评测和资源建设情况;最后介绍了文本情感分析的应用.文本重在对文本情感分析研究的主流方法和前沿进展进行概括,比较和分析,以期对后续研究有所助益.关键词: 文本情感分析;情感信息抽取;情感信息分类;情感信息的检索与归纳;评测;资源建设中图法分类号: TP391文献标识码: A随着Web2.0的蓬勃发展,互联网逐渐倡导“以用户为中心,用户参与”的开放式构架理念.互联网用户由单纯的“读”网页,开始向“写”网页、“共同建设”互联网发展,并由被动地接收互联网信息向主动创造互联网信息迈进.因此,互联网(如:博客和论坛)上产生了大量的用户参与的,对于诸如人物、事件、产品等有价值的评论信息.这些评论信息表达了人们的各种情感色彩和情感倾向性,如“喜”、“怒”、“哀”、“乐”,和“批评”、“赞扬”等.基于此,潜在的用户就可以通过浏览这些主观色彩的评论,来了解大众舆论对于某一事件或产品的看法.由于越来越多的用户乐于在互联网上分享自己的观点或体验,这类评论信息迅速膨胀,仅靠人工的方法难以应对网上海量信∗Supported by the National Natural Science Foundation of China under Grant Nos. 60803093, 60975055 (国家自然科学基金) and the “863” National High-Tech Research and Development of China via grant 2008AA01Z144(863计划探索类专题项目)赵妍妍等:情感倾向性分析纵览息的收集和处理.因此,迫切需要计算机帮助用户快速获取和整理这些相关评价信息,情感分析(Sentiment Analysis)技术应运而生(本文中提及的情感分析,都是指文本情感分析).文本情感分析,又称意见挖掘,简单而言,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程.最初的情感分析源自前人对带有情感色彩的词语的分析[1],如“美好”是带有褒义色彩的词语,而“丑陋”是带有贬义色彩的词语.随着互联网上大量的带有情感色彩的主观性文本的出现,研究者们逐渐从简单的情感词语的分析研究过渡到更为复杂的情感句研究以及情感篇章的研究.基于此,按照处理文本的粒度不同,情感分析可分为词语级、短语级、句子级、篇章级以及多篇章级等几个研究层次[2].按照处理文本的类别不同,可分为基于新闻评论的情感分析和基于产品评论的情感分析.其中,前者处理的文本主要是新闻评论,如情感句“他坚定地认为台湾是中国不可分割的一部分”,表明了观点持有者“他”对于事件“台湾归属问题”的立场;后者处理的主要是网络在线的产品评论文本,如“Polo的外观很时尚”,表明了对评价对象“Polo的外观”的评价“时尚”是褒义的.由于基于产品评论的情感分析可以帮助用户了解某一产品在大众心目中的口碑,因此受到很多消费者和商业网站的青睐.而基于新闻评论的情感分析多用于舆情监控和信息预测中,是国内外评测中重要的评测任务.情感分析涉及多项非常有挑战性的研究任务.本文综合已有的研究成果,将情感分析归纳为三项层层递进的研究任务,即情感信息的抽取、情感信息的分类以及情感信息的检索与归纳,如图1所示.Fig.1 The framework of sentiment analysis图1 情感分析的研究框架其中,情感信息抽取是情感分析的最底层的任务,它旨在抽取情感评论文本中有意义的信息单元.其目的在于将无结构化的情感文本转化为计算机容易识别和处理的结构化文本,继而供情感分析上层的研究和应用服务.如将情感句“我觉得Canon的相片质量不错”转化为如图1所示的结构化文本形式.情感信息分类则利用底层情感信息抽取的结果将情感文本单元分为若干类别,供用户查看,如分为褒贬两类或者其他更细致的情感类别(如:喜、怒、哀、乐等).按照不同的分类目的,可分为主客观分析和褒贬分析;按照不同的分类粒度,可分为词语级、短语级、篇章级等多种情感分类任务.这些分类任务在情感分析初期吸引了大量的研究者.最高层的情感信息的检索与归纳可以看作与用户直接交互的接口,着重强调“检索”和“归纳”两项应用.该层次的研究主要在前两项任务即情感信息抽取和分类的结果的基础上,进行进一步的加工处理.情感分析是一个新兴的研究课题,具有很大的研究价值和应用价值[3-5].鉴于此,该研究课题受到国内外越来越多的研究机构的重视.本文在接下来的部分首先分别详细阐述情感分析的三个主要研究任务,重点针对各任务的主流方法和前沿进展进行对比分析;接着介绍国内外主流的评测会议以及现有的资源建设情况;然后,本文介绍情感分析几个重要的应用点;最后,展望情感分析技术的发展趋势.1 情感信息抽取情感信息抽取旨在抽取情感文本中的有价值的情感信息.它可以看作情感分析的基础任务,一直以来,学术界对它兴趣不减.纵观目前的研究现状,有价值的情感信息单元主要有评价词语(如“优秀”,“好用”)、评价对象(如“GPS”, “屏幕分辨率”)、观点持有者(如“国家政府”, “台湾当局”) 等.在对大量的情感文本进行分析之后,不少研究者发现某些组合搭配对于情感分析的上层任务如:情感信息分类以及情感信息的检索与归纳有更直接的帮助,如“评价搭配”(评价对象和评价词语的搭配,如“屏幕分辨率-高”)、“评价短语”(程度副词及其修饰的评价词语的搭配,如“不怎么-好”)等.下面本文将一一介绍目前情感信息抽取的具体任务及其主要实现技术.1.1 评价词语的抽取和判别评价词语又称极性词、情感词,特指带有情感倾向性的词语.很显然,评价词语在情感文本中处于举足轻重的地位,评价词语的识别和极性判断在情感分析领域创建伊始就引起了人们极大的兴致.基于前人大量的研究工作,评价词语的抽取和判别往往是一个一体化的工作,主要分为基于语料库和基于词典两种方法[10].基于语料库的评价词语抽取和判别主要是利用大语料库的统计特性,观察一些现象来挖掘语料库中的评价词语并判断极性.早期的一些学者发现,由连词(如and或but)连接的两个形容词的极性往往存在一定的关联性,如“and”连接的形容词(如“lovely and beautiful”)极性相同,然而“but”连接的形容词(如:“lovely but unnatural”)极性相反.基于这种现象, Hatzivassiloglou和McKeown[1]从大语料库华尔街日报(Wall Street Journal)中发掘出大量的形容词性的评价词语. Wiebe等人[11]沿袭了较为相似的工作,他们使用了一种相似度分布的词聚类方法在大语料库上完成了形容词性的评价词语的获取.然而,以上的两种方法仅将评价词语的词性局限于形容词词性,忽略了其他词性的评价词语.为了避免评价词语词性的限制, Riloff等人[12]手工制定一些模板并选取种子评价词语,使用迭代的方法获取了名词词性的评价词语.随后,Turney和Littman[13]提出了点互信息(Point Mutual Information)的方法判别某个词语是否是评价词语.这种方法适用于各种词性的评价词语的识别,但是较为依赖种子褒/贬词语集合.鉴于此,基于语料库的方法最大的优点在于简单易行,缺点则在于可利用的评论语料库有限,同时评价词语在大语料库中的分布等现象并不容易归纳.基于词典的评价词语抽取及判别方法主要是使用词典中的词语之间的词义联系来挖掘评价词语.这里的词典一般是指使用WordNet或HowNet等.很自然的,有学者想到利用词典将手工采集的种子评价词语进行扩展来获取大量的评价词语[14-16].这种方法简单易行,但是较依赖于种子评价词语的个数和质量,并且容易由于一些词语的多义性而引入噪声.为了避免词语的多义性,一部分学者使用词典中词语的注释信息来完成评价词语的识别与极性判断[17-20].此外,一些学者[21]沿用了Turney等人的点互信息的方法[13],通过计算WordNet中的所有形容词与种子褒义词代表“good”和贬义词“bad”之间的关联度值来识别出评价词语.然而,并非所有的语种的情感资源都像英文一样丰富,对于某些词典资源非常稀缺的语种,有学者将词典资源丰富的语种的情感词典翻译到资源较少的语种中[22],如将英文的情感词典翻译成中文,供中文情感分析应用.但是实验显示,不少评价词语在经过翻译之后极性发生了改变.这也印证了Wiebe在文献[23]中所指出的“词语的词义和其极性有一定的关系,但是相同的词义并不一定有相同的极性”.鉴于此,基于词典的方法的优点在于获取的评价词语的规模非常可观,但是由于很多词存在一词多义现象,构建的情感词典往往含有较多的歧义词,如词语“好”在大多数情况下表现为“优秀”的意思,但在某些情况下扮演修饰成分(如“他跑的好快啊!”).此外,还有一部分学者采用基于图的方法来识别评价词语的极性[10,24].具体的,该方法将要分类的词语作为图上的点,利用词语之间的联系形成边来构建图,继而采用各种基于图的迭代算法(Propagation Algorithm)来完成词语的分类.如,有学者考察图中两个词语的注释信息而构建图[24],继而使用Spin模型对图中的点迭代的进行概率计算,得出每个词语的极性.还有一些学者尝试使用多种图模型[10],如:最小切分模型(Mincuts)、随机最小切分模型(Randomized Mincuts)及标签迭代模型(Label Propagation)等完成评价词语的褒贬分类.实验证实了基于图的方法的有效性.基于图的方法是一种新颖的方法,它可以灵活的将词语间的各种联系作为特征融入图中,继而进行迭代计算.然而,寻找更有效的词语间特征以及如何选取图算法是值得深入研究的问题.1.2 评价对象的抽取评价对象是指某段评论中所讨论的主题,具体表现为评论文本中评价词语所修饰的对象,如新闻评论中的某个事件/话题或者产品评论中某种产品的属性(如“屏幕”)等.现有的研究大部分集中于产品领域的评价对象的抽取,他们大多将评价对象限定在名词或名词短语(候选评价对象)的范畴内,进而对它们进行进一步的识别.赵妍妍等:情感倾向性分析纵览一部分学者使用基于规则/模板的方法抽取评价对象.规则的制定通常要基于一系列的语言分析与预处理过程,如词性标注,命名实体识别和句法分析等.相应地,制定的规则也包括词序列规则,词性规则以及句法规则等形式.Yi[25]使用三条限制等级逐渐递进的词性规则从候选评价对象中抽取出真正的评价对象.还有学者[26-27]使用关联规则挖掘的方法或是基于句法分析的结果[28]找出频繁出现的候选评价对象,继而使用两种剪枝方法去除错误样例.然而,这些方法仅能找出频繁的评价对象.为了发掘出非频繁的评价对象,有学者尝试使用含有评价词语和评价对象槽(slot)的词序列模板[26].此类方法最主要的优点在于针对性强,可以直接针对待解决的问题或特定的语言现象制定规则/模板.而其缺点则在于规则/模板的可扩展性差,人工编写的工作量大,成本较高.有学者[29]从另一个角度诠释了评价对象的抽取.他们将评价对象看作产品属性的一种表现形式(如对数码相机领域而言,“相机的大小”是数码相机的一个属性,而“相机滑盖” 是数码相机的一个组成部分),继而考察候选评价对象与领域指示词(如“整体-部分”关系指示词:“scanner has”)之间的关联度来获取真正的评价对象.实验证明这种方法取得了较好的实验效果,超过了基于规则/模板的方法.但难点在于领域指示词的获取.近年来,随着话题模型(Topic Model)[30-31]的逐渐兴起,很多学者将其应用到情感分析领域.由于评价对象是蕴涵于情感文本中的某些话题,因此可以使用话题模型用于评价对象的识别.有学者[32]采用多粒度的话题模型挖掘产品领域情感文本中的评价对象,并将相似的评价对象进行聚类.这种方法理论上能够提高评价对象抽取的召回率,但是遗憾的是,还没有实验将这种方法和上述传统的基于名词短语的方法进行对比.此外,还有一部分学者从事新闻评论文本中的话题评价对象的抽取[33-34].如:对于情感句“所有人都认为政府应该加强改善医疗卫生条件”,抽取话题评价对象“政府应该加强改善医疗卫生条件”.1.3 观点持有者抽取观点持有者的抽取在基于新闻评论的情感分析中显得尤为重要,它是观点/评论的隶属者,如新闻评论句“我国政府坚定不移的认为台湾是中国领土不可分割的一部分”中的“我国政府”.很自然的,人们会想到评论中的观点持有者一般是由命名实体(如:人名或机构名)组成,因此可以借助于命名实体识别技术来获取观点持有者[35].此外,还有学者曾尝试借助语义角色标注来完成观点持有者的抽取[33].但是这些方法较为依赖自然语言处理的基础技术,有较低的语言覆盖现象和较差的领域适应性.还有人将观点持有者的抽取定义为分类任务,这种方法的关键在于分类器和特征的选取.如Choi将其看作一个序列标注问题[36],并使用CRF (Conditional Random Fields)模型融合各种特征来完成观点持有者的抽取.相似的,Kim[15]将所有名词短语都视为候选观点持有者,使用ME (Maximum Entropy)模型来进行计算.以上的方法将观点持有者的抽取当作一个独立的任务.通过观察,许多研究者发现,观点持有者一般是和观点同时出现的,所以可以将观点和观点持有者的识别作为一个任务同时解决.Bethard[37]在抽取出情感句中的观点单元(多是由一些短语组成)之后,分析句中观点和动词的句法关系,即可同步获取观点持有者.由于产品评论中一般默认观点持有者是用户本身,因此鲜有研究者在产品评论领域研究这一任务.1.4 组合评价单元的抽取评价词语在情感分析中的作用是不言而喻的.然而在某些情况下,单独的评价词语存在一定的歧义性,如评价词语“高”在以下三个句子中的使用.¾Sen1: 凯越的油耗真高.¾Sen2: 捷达的性价比相当的高.¾Sen3: 这辆车有1m多高.Sen1和Sen2是情感句,但是评价词语“高”在修饰不同的评价对象时表现出不同的极性.如在Sen1中“高”表示贬义,而在Sen2中则表示褒义.此外,评价词语往往也会出现在非情感句中,如Sen3.因此仅考虑单独的评价词语在情感分析中的应用是远远不够的.研究者们发现有些包含评价词语的“组合评价单元”(如:组合“油耗-高”,“相当-高”)对于处理情感分析的上层任务更有帮助.下面将具体的介绍各种形式的组合评价单元.1.4.1 主观表达式的抽取主观表达式(Subjective Clues)是指表示情感文本单元主观性的词语或词组. 1.1节的评价词语是主观表达式的一部分.此外,某些词语的组合(如:“village idiot”或“get out of here”)也能很明显的标识文本的主观性,虽然它们中的任何一个词语单独可能都并非评价词语.如何获取这些有意义的词组是主观表达式抽取的重点.Wiebe和Wilson是这项任务的引领者[38].近几年来,他们挖掘大量的主观表达式形成主观表达式库,并基于此完成文本的主客观分类和褒贬分类.具体的,他们首先从语料中抽取出所有的n元词语/词组(1≤n≤4)作为候选主观表达式;继而通过对比训练语料中的标准的主观表达式,为每个候选主观表达式计算出可能成为主观表达式的概率;最后通过对概率值的分析,获得这些主观表达式.Wiebe和Wilson[39]在随后的工作中又引入了“主观表达式密度”协助判断主观表达式.2004年,Wiebe和Wilson将他们前期的工作进行了总结[40],从不同的语料中扩充了大量的主观表达式,主要包括手工收集的一部分主观表达式以及自动从标注/未标注语料中学习而来的一部分主观表达式.此外,他们首次利用句法分析的结果发掘了句法主观表达式[41].随后,Wiebe和Wilson采用多种特征及机器学习方法对他们获取的大量的主观表达式的情感程度(strong或weak)进行了识别.1.4.2 评价短语的抽取评价短语表现为一组连续出现的词组,但不同于主观表达式,该词组往往是由程度副词和评价词语组合而成,如:“very good”等.因此,这种组合评价单元不仅顾及了主观表达式的情感极性,还考察了其修饰成分.这些修饰成分或加强或减弱或置反了主观表达式的情感极性,使得评价短语成为一种情感色彩丰富的组合评价单元.有学者采用基于一些情感词典的方法识别这种评价短语.如Whitelaw[42]结合WordNet使用半自动的方法构建了形容词性的评价词词典以及修饰词词典.对于一个含有评价词语的情感文本,该方法首先查看评价词前面的词语,如果属于修饰词词典,获取这个词组作为评价短语.根据两个词典中的属性值计算出情感极性.这种方法由于基于较为细致的词典,因此准确率较高.然而,由于词典中词语有限而限制了召回率.还有学者使用依存句法结构(如ADV、ATT以及DE结构),在句法树上获取评价短语[27].这种方法巧妙的利用了评价短语中所含词语之间的句法修饰关系,但是较为依赖句法分析的结果.评价短语考察的是连续出现的词组,然而,有些表示修饰关系的词语并非总是和评价词语连续出现. 如在情感句“[I did [not]- have any [doubt]- about it.]+”中,修饰词“not”和评价词“doubt”并非连续出现,但它们共同决定了情感句的最终极性. Moilanen等人[43]和Choi等人[44]将其定义为“组合语义单元”(Compositional Semantics),具体表现为一组非连续的词语,通过相互作用来表达出某种情感极性.“组合语义单元”可以看作一种更复杂的评价短语,多使用人工总结或半自动生成的模板来识别.1.4.3 评价搭配的抽取评价搭配是指评价词语及其所修饰的评价对象二者的搭配,表现为二元对<评价对象,评价词语>,如情感句“凯越的油耗很高”中的“油耗-高”.前面所介绍的“主观表达式”和“评价短语”主要是考察含有情感极性的一些词和短语,然而情感句中出现的某些“主观表达式”和“评价短语”并非真正的表现出情感极性.如情感句s1“车跑的好快啊”中的词语“好”并不存在情感极性,需要过滤掉.此外,还有一些“主观表达式”和“评价短语”存在一定的歧义,其极性需要根据上下文而确定.“评价搭配”则可以很好的解决上述两点问题.针对评价搭配的抽取任务,大部分学者采用了基于模板的获取方法. Kobayashi等人[45]考察评价对象和评价词语之间的修饰关系,并用8个共现模板来描述.然而,由于模板太过简单且修饰关系仅仅停留在词表面,该方法产生了大量的噪声.为了深入挖掘评价对象和评价词语之间的修饰关系,一部分学者尝试使用句法关系模板. Bloom等人[46]利用Stanford Parser手工构建了31条句法规则.此外, Popescu等人[29]利用MINIPAR Parser手工构建了10条依存句法抽取模板来获取评价搭配.同时,国内的姚天昉等人[47]基于依存句法分析总结出“上行路径”和“下行路径”的匹配规则;后续总结出SBV极性传递规则,用于评价搭配的识别.可以看出,他们的工作融入了更多对评价对象和评价词语之间深层关系的挖掘.然而,由于匹配规则或模板的制定参与了过多的人工,覆盖率较低.因此,在未来工作中我们应该侧重于研究自动生成评价对象和评价词语之间的匹配规则的策略.2 情感信息分类情感信息的分类任务可大致分为两种,一种是主、客观信息的二元分类;另一种是主观信息的情感分类,包括最常见的褒贬二元分类以及更细致的多元分类[48].赵妍妍等:情感倾向性分析纵览2.1 主客观信息分类在对情感文本进行情感分析时,往往由于情感文本中夹杂着少量的客观信息而影响了情感分析的质量[49],因此将情感文本中的主观信息和客观信息进行分离变得非常必要.由于情感文本单元表现格式比较自由,且区分主、客观文本单元的特征并不明显,在很多情况下,情感文本的主客观识别比主观文本的情感分类更有难度.一部分学者通过考察文本内部是否含有情感知识(具体表现为第1部分情感信息抽取的结果)来完成主客观信息分类[14,50].然而,我们发现许多客观句中也可能会包含评价词语,如客观句“这位英雄名叫张三丰”同样含有评价词语“英雄”.为了更大程度上消除歧义性,很多学者挖掘并使用情感文本中的组合评价单元,如 1.4节中提到的“主观表达式”, “评价短语”和“评价搭配”等组合信息.此外,还有学者[12]构建情感模板识别情感文本的主客观性(如贬义模板:“<x> drives <y> up the wall”).以上这些基于情感知识的主客观分类方法的工作重心在于情感文本中情感知识的挖掘,以及各种情感知识融合的方法研究.还有一部分学者将情感文本单元的主客观分类定义为一种二元分类任务,即对任意给定的情感文本单元,由分类器协助判断其主客观性.这种方法的关键在于分类器和分类特征的选取.具体的,Hatzivassiloglou[51]使用了词语作为特征,并采用了NB (Naïve Bayes)分类器完成篇章级情感文本的主客观分类.Yao[52]着重从一些特殊的特征角度考察了主客观文本,如:标点符号角度,人称代词角度,数字角度等等.Pang[53]则采用基于图的分类算法完成句子级的主客观分类.基于特征分类的方法目前还是主客观信息分类的主流方法,这种方法定义明确,根本的问题在于特征的选取.因此,尝试使用更深层,更复杂的分类特征也许是这类方法的突破方向之所在.2.2 主观信息情感分类主观信息情感任务按不同的文本粒度可分为词语级、短语级、句子级和篇章级等.其中第1部分已经对词语级和短语级的情感分类方法进行了总结,因此本节将着重介绍句子级和篇章级的主观信息情感分类方法.一般而言,研究者将主观本文的极性分为褒义和贬义两类(Thumbs up? Thumbs down?).纵观目前的研究工作,和主客观信息分类类似,可分为两种研究思路:基于情感知识的方法以及基于特征分类的方法.相似的,前者主要是依靠一些已有的情感词典或领域词典,以及主观文本中带有情感极性的组合评价单元进行计算,来获取主观文本的极性.后者主要是使用机器学习的方法,选取大量的有意义的特征来完成分类任务.这两种研究思路有很多代表性的研究工作.文献[14,51,54-55]首先分析句子/篇章中的评价词语或组合评价单元的极性,然后进行极性加权求和.这种方法的重点一般都放在评价词语或组合评价单元的抽取和极性判断方法的研究上.在基于特征分类的方法中,Pang[56]首次将机器学习的方法应用于篇章级的情感分类任务中.他们尝试使用了n-gram 词语特征和词性特征,并对比了NB、ME和SVM(Support Vector Machine)三种分类模型,发现unigram特征效果最好.然而, Cui[57]通过实验证明,当训练语料较少的时候,unigram的效果较优,但随着训练语料的增多,n-gram(n>3)发挥了越来越重要的作用. Kim[58]除了考察传统的n-gram模型外,还引入了位置特征和评价词特征来完成句子级的褒贬分类.Zhao[59]则将句子级情感分类任务提炼为一个三层分类任务,利用各层之间类别标签的相互作用,并考虑上下句之间情感的互相影响,使用CRF模型将这些特征进行融合..类似于主客观信息分类任务,基于特征的方法的研究重点在于有效特征的发现,以及特征选择和特征融合等问题的研究.除了对主观文本信息的褒贬二元分类之外,还有一些研究工作进行更细致的情感分类任务.Pang[60]将褒贬等级分为三类,并使用了one-vs-all多元分类算法和回归分类算法完成情感分类.Goldberg[61]则使用了一种基于图的半指导的分类算法,完成评论的褒贬包括四个等级的分类.2.3 观点分类与挖掘情感分类还可以体现在对某些事件的观点分类上面.Lin[8]主要使用三种分类模型识别有关“巴以冲突”主题的评论文本所表达的观点,即是“支持巴方”还是“支持以方”.而Kim[9]主要对美国大选时涌现出来的大量的评论文章进行分类汇总,来推断大部分选民是支持“共和党”还是“民主党”.该文献同样也是使用分类器和分类特征相结合的算法,其中作者对分类特征进行了泛化,取得了较好的效果.和主观信息情感分类不同的是, “观点分类与挖掘”任务除了需要使用情感知识之外,还需要发掘一部分和“观点”相关的知识.。

中文-情感分析

中文-情感分析

7 4
中 文 信 息 学 报
2 0 1 2年
到2 用户数超过了 1. 0 1 1 年 4 月底 , 4 亿 。 微博正在 包括大量的信 从各个方面渗透并 影 响 人 们 的 生 活 , 息传播 、 更快的信息发现 、 与世界的连接等 。 微博消息数量大 , 更新快 , 吸引了一大批学者对 其进行研究 。 针对微博的自然语言处理研究已成为 而情感分析就 当前一个新的研究 热 点 和 前 沿 课 题 , 是其中一个热点 话 题 。 情 感 分 析 , 也被称为观点挖 掘、 观点分析 、 主客观分析等 。 情感分析的目的是从 文本中挖掘用户表达的观点以及情感极性 。 挖掘用 既能吸引潜在用户 , 帮助用户做决 户观点意义重大 , 策
情、 表达观点等 。 微博自问世以来 , 迅速吸引了大众 的眼光 , 蓬勃发展 。 以国内的新浪微博 ① 为例 ,截止
: / / / v a i l a b l e a t h t t w e i b o . c o m ① A p
, , 作者简介 :谢丽星 ( 女, 硕士 , 主要研究方向为缩略语识别 、 输入法和中文微博的情 感 分 析 ; 孙茂松( 男, 1 9 8 7—) 1 9 6 2—) , 博士 , 清华大学计算机 系 教 授 , 博士生导师, 主要研究方向为自然语言处理、 信息检索和社会计算; 周明( 男, 博士, 微 1 9 6 4—) 软亚洲研究院主任研究员 , 博士生导师 , 主要研究方向为自然语言处理 、 机器翻译 、 搜索引擎和社会关系网络 。
1 2 1 X I E L i x i n Z HOU M i n S UN M a o s o n g, g g ,
( , 1. S t a t e K e L a b o r a t o r o f I n t e l l i e n t T e c h n o l o a n d S s t e m s T s i n h u a N a t i o n a l L a b o r a t o r f o r y y g g y y g y , , S c i e n c e a n d T e c h n o l o D e a r t m e n t o f C o m u t e r S c i e n c e a n d T e c h n o l o I n f o r m a t i o n g y p p g y , ; , ) T s i n h u a U n i v e r s i t B e i i n 1 0 0 0 8 4, C h i n a 2.M i c r o s o f t R e s e a r c h A s i a B e i i n 1 0 0 0 8 4, C h i n a g y j g j g :W A b s t r a c t i t h t h e d e v e l o m e n t o f W e b 2. 0,m i c r o b l o h a s d r a w n s u b s t a n t i a l a t t e n t i o n f r o m b o t h a c a d e m i a a n d p g a e r i n d u s t r c o mm u n i t i e s . T h i s u t i l i z e s m i c r o b l o A P I f r o m S i n a a n d c a r r i e s o u t s e n t i m e n t a n a l s i s o n C h i n e s e p p y g y , , e r f o r m a n c e s b l o .W e c o m a r e o f t h r e e m e t h o d b a s e d o n t h e e m o t i c o n t h e s e n t i m e n t l e x i c o n a n d t h e h b r i d m i c r o p g p y ,w a r o a c h o v e r h i e r a r c h i c a l s t r u c t u r e u s i n S VM, r e s e c t i v e l .T h r o u h t h e e x e r i m e n t s e f i n d t h a t S VM b a s e d p p g p y g p , a r o a c h a c h i e v e s t h e b e s t w e a n a l z e t h e c o n t r i b u t i o n o f v a r i o u s f e a t u r e s i n t h i s h b r i d e r f o r m a n c e . F u r t h e r m o r e p p y y p , i n c l u d i n t a r e t i n d e e n d e n t f e a t u r e s a n d t a r e t d e e n d e n t f e a t u r e s .E x e r i m e n t a l r e s u l t s s h o w t h a t S VM m o d e l - - g g p g p p , b a s e d m e t h o d c a n a i n a n a c c u r a c o f 6 6. 4 6 7% w i t h t a r e t i n d e e n d e n t f e a t u r e s a n d a n i m r o v e d a c c u r a c o f - g y g p p y 6 7. 2 8 3% w i t h t h e a d d i t i o n o f t a r e t d e e n d e n t f e a t u r e s . - g p : ; ; K e w o r d s s i n a m i c r o b l o s e n t i m e n t a n a l s i s S VM g y y

基于词典的中文情感倾向文本分析工具

基于词典的中文情感倾向文本分析工具

基于词典的中文情感倾向文本分析工具以下是一些基于词典的中文情感倾向文本分析工具:
1.哈工大情感词典:哈尔滨工业大学开发的情感词典,包含了积极、消极和中性的词汇。

可以使用该词典进行情感倾向的判断。

2.百度情感分析API:百度提供的自然语言处理工具之一,可以对中文文本进行情感分析,返回积极、消极和中性的概率值。

3.哥伦比亚大学中文情感词典:由哥伦比亚大学研究团队创建的中文情感词典,包含了积极、消极和中性的词汇以及其情感强度。

可以用于中文情感分析。

4.中山大学中文情感词汇本体库:中山大学开发的情感词汇本体库,包含了积极、消极、中性和其他情感倾向的词汇。

可以用于中文文本情感分析的研究和应用。

这些工具通常是基于词典匹配的方式进行情感分析,通过匹配文本中的词汇与情感词典中的词汇进行情感倾向的判断。

然而,这种方法可能无法处理多义词、语境相关性等问题,所以结果可能不准确。

一些工具还结合了机器学习和统计方法进行情感分析,以提高准确性。

基于深度学习的中文情感分析系统设计

基于深度学习的中文情感分析系统设计

基于深度学习的中文情感分析系统设计中文情感分析是指通过对中文文本的处理和分析,利用机器学习和自然语言处理技术,从文本中提取情感信息并对其进行情感分类和评分的过程。

基于深度学习的中文情感分析系统设计,是利用深度学习模型构建情感分析系统,实现对中文文本情感的准确分类和评估。

在设计基于深度学习的中文情感分析系统时,首先需要收集和标注大量的中文情感分类数据集。

这个数据集需要包含标注好的中文文本,以及对应的情感分类标签,例如正面情感、负面情感或中性情感等。

确保数据集的质量和代表性对于系统的准确性和稳定性至关重要。

接下来,选择合适的深度学习模型用于训练情感分析系统。

常用的模型包括卷积神经网络(CNN)、长短期记忆网络(LSTM)和Transformer等。

这些模型可以对中文文本进行特征提取和表征学习,从而较好地捕捉文本中的情感信息和语义信息。

在使用深度学习模型之前,还需要对原始文本进行预处理,包括分词、去除停用词和标点符号等。

这样可以减少模型训练和推理的计算量,并提高情感分析的效果。

接着,进行数据集的划分,将数据集划分为训练集、验证集和测试集。

训练集用于深度学习模型的参数训练,验证集用于模型的超参数选择和性能评估,测试集用于最终评估模型的泛化能力。

在模型训练过程中,需要定义适当的损失函数和优化算法。

常用的损失函数有交叉熵损失函数,常用的优化算法有随机梯度下降(SGD)、Adam等。

优化算法的选择需要考虑模型的收敛速度、准确性和稳定性。

在模型训练完成后,需要进行模型的评估和调优。

可以使用准确率、召回率、F1值等指标来评估模型的性能。

如果模型的性能不理想,可以尝试调整模型的超参数、增加训练数据量或修改模型结构等方法来改进模型的性能。

当模型的性能满足要求后,可以将其应用于实际的中文情感分析任务中。

根据用户输入的中文文本,系统将自动对其进行情感分类,并给出相应的情感评分。

这个系统可以应用于舆情监测、产品评价、社交媒体分析等各种实际应用场景中。

基于BERT模型和双通道注意力的短文本情感分析方法

基于BERT模型和双通道注意力的短文本情感分析方法

信IB与电腐China Computer&Communication2021年第5期基于BERT模型和双通道注意力的短文本情感分析方法金华涛(任子行网络技术股份有限公司,北京100029)摘要:语篇情绪分析是自然语言处理的热门研究内容之一,已广泛应用在很多领域.因为主题建模能够发现隐含的语义结构,所以很多学者提出了基于主题模型的情感分析模型,虽然都考虑了语篇语境,但是还缺乏对情感语境的考虑和整合.针对情感分析任务和短文的特殊性,本文首先分析了BERT模型的发展历程和研究现状,进而分析了短文本情感分析网络设计,最后结合情感语境提出了基于词汇和主题的情感分类模型,希望能够为相关研究提供借鉴.关键词:BERT模型;双通道注意力;短文本情感分析中图分类号:TP183文献标识码:A文章编号:1003-9767(2021)05-041-03Short Text Sentiment Analysis Method Based on BERT and Dual Channel AttentionJIN Huatao(Surfilter Network Technology Co.,Ltd.,Beijing100029,China)Abstract:Discourse sentiment analysis is one of the popular research contents of natural language processing,and it has been widely used in many fields.Because topic modeling can discover the implicit semantic structure,many scholars have proposed emotional analysis models based on topic models.Although they all consider the context of the text,they still lack consideration and integration of the emotional context.Aiming at the particularity of sentiment analysis tasks and short texts,this article first analyzes the development process and research status of the BERT model,and then analyzes the short text sentiment analysis network design,and finally proposes a vocabulary and topic-based sentiment classification model based on sentiment context,hoping to provide reference for related research.Keywords:Bert Model;Two Channel Attention;Short Text Sentiment Analysis0引言交互式网络改变了用户和网络之间的关系,用户已经成为内容的重要来源。

文本情感分析研究

文本情感分析研究

文本情感分析研究李青松【摘要】随着互联网的高速发展,在线评论数量爆炸式增长.用户在电商、微博、论坛等网站上发表大量的文本评论信息,其中包含他们对产品、服务、事件等的态度、观点以及情感倾向.如果能够从这些信息中获取用户的情感倾向,将会为商品推荐、市场分析、舆情控制等提供巨大的帮助.根据近年来文本情感分析的研究成果,可以将其分为基于词典的方法,基于传统机器学习的方法和基于深度学习的方法.通过梳理国内外研究现状,对目前文本情感分析方法进行介绍和总结.【期刊名称】《现代计算机(专业版)》【年(卷),期】2019(000)004【总页数】5页(P21-25)【关键词】文本情感分析;情感词典;机器学习;深度学习【作者】李青松【作者单位】四川大学计算机学院,成都610065【正文语种】中文0 引言文本情感分析又称意见挖掘,是自然语言处理领域的一项研究热点,目的在于从具有情感倾向的文本中提取出评论者的情感信息,并对其进行分析、处理、归纳和推理的过程。

文本情感分析已经被广泛应用于商品推荐、市场分析、舆论控制等领域,具有很高的商业和社会价值。

目前主流的情感分析方法可以分为三类,一类是基于情感词典的方法,这类方法主要依赖于情感词典,并通过特定的语义规则进行情感分析;第二类是基于传统机器学习的方法,这类方法首先要挖掘文本的特征,再使用支持向量机、朴素贝叶斯、最大熵等模型对文本进行情感分析;最后一类为基于深度学习的方法,首先将文本转换为文本向量,然后作为深度学习模型的输入进行训练,最后验证并保存训练好的模型。

1 基于情感词典的方法基于情感词典的方法主要通过情感词典对文本进行情感分析。

该方法通常不考虑文本中词与词间的关系,而是将文本看作多个词语或短语的集合。

该方法的一般步骤是:首先根据语料等构建情感词典,然后将1.1 相关技术在构建情感词典时,会经常用到点互信息算法(Pointwise Mutual Information,PMI)和隐含狄利克雷模型(Latent Dirichlet Allocation,LDA)。

文本情感分析综述

文本情感分析综述作者:来亮钱屹来源:《计算机光盘软件与应用》2012年第18期摘要:近年来随着计算机、人工智能、心理学等学科交叉领域的不断延伸,情感分析引起了很多研究人员的兴趣。

情感分析主要是对主观性文本进行挖掘与分析,从中获取有价值的信息。

本文针对中文文本情感分析的研究现状与进展进行总结。

首先介绍文本情感分析的内容,并按粒度层次,从词语级、语句级介绍相关的技术,分析了近年来的一些研究进展。

接着介绍了中文文本情感分析的方法,最后总结了中文文本情感分析的研究难点与未来的研究方向。

关键词:文本;情感分析;倾向性;情感计算;粒度中图分类号:TP391 文献标识码:A 文章编号:1007-9599(2012)18-0000-021 情感计算概述情感计算是人工智能的一个热门、前沿的研究领域,它的目标是要赋予计算机类似人一样的观察、理解和生成各种情感特征的能力,最终能够像人一样自然亲切的交流。

随着Internet 的发展,以文本形式出现的信息越来越多,已经成为最容易获取,也是最为丰富的一种交互资源。

1.1 文本情感分析的内容。

美国MIT媒体实验室的Picard教授认为情感计算主要包括三个部分,即情感识别、情感发生、情感表达。

内容具体可分为九个方面:情感机理、情感信息的获取、情感模式识别、情感的建模与理解、情感合成与表达、情感计算的应用、情感计算机的接口、情感的传递与交流、可穿戴计算机。

关于文本的情感计算是文本情感分析中的核心问题之一,文本情感分析,广义上包含对文本的主客观性分析,同时也包含了对主观信息的倾向性分析及强度分析。

倾向性分析也就是我们通常所说的褒贬性分析,一般指说话人对某事某物的看法或观点,通常以“表扬——批评”、“赞同——反对”这样具有较强烈情感倾向的词汇来分类;而强度分析指的是对同一事物所持观点的语气强烈程度,如:“我喜欢文学”与“我热爱文学”,两个句子同样表达了对文学的喜爱,但程度不同,“热爱”的语气强烈程度要远远超过“喜欢”。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

……………………M 吼 Ec0 ATl0Ns 中文短文本多级情感分析 全湘溶 (中国信息通信研究院数据研究中心,北京100191) 

摘要:多年来,文本情感分析精度不高和适用面窄等 问题一直是国内外专家研究的热点和难点。首先设 计了一种新的句子分割和关键信息抽取的算法,使 得一般评论能够得到较为理想的断句;其次,设计了 

一套适用于常规语言环境下中文句子情感细粒度分 析的框架模型,能够对微博等短文本语句通过简单 训练进行快速的初步分析,并提供有实质意义的相 关信息。 关键词:情感分析。文本挖掘,句子切割 

Abstract:For low precision and limited applicability, text multi-level sentiment analysis has belen a heated 船well a8 hard issue round the ̄obe.Our proposition makes two contributions to it.Firstly,we designed a new algorithm to segment Chinese sentences and ex- tract key information from them.If the passage is not too long,the result seems satisfactory.Secondly we propose amodelto analyzethepolarity andintensity of the sentiment in context,which can.work fast by Sl m— pie training and submit valuable information. Keywords:sentiment analysis,data mining in text, sentence segmentation 

1国内外研究现状 自然语言的情感分析长期以来都是热门领域。但 是,目前无论是精度还是分析的可靠性和稳定性方 面,都存在较大的提升空间,国内外大量专家学者都 对此进行了探索。V.S.Subrahmanian等人提出了一种 分析方法,该方法特别重视形容词、动词和副词的分 析,使用一个统一的手段,依赖于句子树把他们合起 来进行计算,取得了一定的成果fl1。但相对于中文句子 来说,英文句子更容易拆分句法,而且经验表明动词 在英文中的情感作用大于中文,中文中旬法形成的歧 义情况也多于英文,所以该方法不能简单迁徙到中文 领域。 Chris Nicholls等人希望通过提高POS (part—of-speech)的权值精度,使用最大熵模型,从改 善标注的角度来提升模型性能[2]。但是,其相关文章涉 及的数据相对较小,其优势主要在于能够去除停用 词。在自然语言分析处理中,分词系统的误差一直是 影响系统分析能力很关键的因素。 Xinghna Hu等人的文章先把所有评论分为正负 

……一……~ 警 曼 … 墅璧坚 R 塞 二:。=。 :二 二………・ 两部分,对两个集合中的句子进行关键词组抽取,然 后对关键词组进行比照,通过倾向性计算词组差值, 从而得到一个总体分析结果【3]。 I)aniela Oelke等人首先使用一种新技术抽取正 负面评论的主体,然后使用逆距离评估方法把属性 映射到正负评论中。其文章还把相似的评论进行了 聚类,创造了一个词频一逆向类频(TF—ICF,C代表 class)的排序方式。文章给出的一种情感强度打分方 式是基于统计频率的,合理性存在一定争议 。 Meng X等人打算解决不同词语在不同环境下 语义变化的问题。论文中训练和测试的数据都是人 工标注的。其文章特征选择用的是朴素贝叶斯,以便 实现自动化和半监督。它在特征抽取的时候设计了 一个时间窗口,截取固定数量的词语。实际上这是一 种流行但是死板的方法。文章设计多种模板用于词 组选择,起到了一定的效果。他还测试了多种算法的 精度,均略高于贝叶斯算法_5J。 Sheng—Chun Ding等人试图改进条件随机场 (CRF),分两个层次两次使用CRF方法。第一层对 文章进行了极性判断,第二层给出了5个级别的强 度分类,取得了相对不错的效果同。 V.K.Singh等人对电影评论和博客信息进行了 分析,其文章得出两条结论:一是SentiWordNet对于 分析直白的和非直白的评论都有一定的效果;二是 形容词是最重要的情感词,副词对形容词的影响很 重要 。 

2相关原理和流程设计 2.1朴素贝叶斯和贝叶斯信念网络 在机器学习的各种算法中,朴素贝叶斯具有很 强的独立性,而且被证明是一种简单、高效、可靠的 概率模型。它通常被用作比较基准,简要叙述如下。 假设 相互独立,变量c的条件概率如文献【8] 所述: 竺 ..2 5 一 p(CI , ,..., )? p(c)?p( l c) (1) 厶 f:1 其中Z?P? ,..., 是一个仅与 ,…, 有关 的数。因此,只需要p?c??p( I c)取最大值即可。 f=l 在进行判决时,使用最大后验概率准则,可以得 到一个判决式: classify(f ̄,...,,2)?argmax p(C?c)?p( ? I C?c) (2) 利用这个条件,就可以对后续事件进行分类。在 不同的应用场景下,还会对以上算式进行调整,使得 计算更加方便,节约运算资源并提高运算效率,如引 进变量独立性假设等。 在朴素贝叶斯分类器无法胜任某些判决情形的 时候,可以考虑采用贝叶斯信念网络或简称贝叶斯 网络。设x?? ,x2….,X 是变量或属性yl, ,…,yn 描述的数据元组。对于既定的双亲,每个变量都有条 件地独立于网络图中其非后代,令P q.xI,…,Xn 为x 的值的特定组合的概率,P? IParents? 的值对 应于yJ的条件概率表的数值,那么可以把相应的联 合概率表示为: P ,…, ??? ( IParents ?? (3) 仁1 可以运用式子(3),经过多次迭代训练出对应的 贝叶斯网络分类器。在许多相关研究中,朴素贝叶斯 分类器和贝叶斯网络分类器经常作为基准分类器或 者对应模型中的重要组成部分,实践证明是一种普 遍适用的高效分类算法。 2.2基于朴素贝叶斯判决器和四元组运算器 的多级情感分析 多级情感分析系统的模型总体如图l所示。将 新的语料先作分词标记处理,然后调用分句算法进 行句子分析,所分割的句子同时进行贝叶斯分类判 断和四元组词表计算,最终进行结果对比,得出该句 子的极性和强度值,进而确定强度等级。接下来将对 ……………………‘M N0L0GY ELE UNI 各个环节进行详细叙述,为了简便,将系统名称缩写 为BQMSAS(Bayes-Quatemary Multi-level Sentiment Analysis System)。 从图1的流程可知,先获取预处理过的语料,并 进行分词。然后使用句子类型判决器进行断句,分好 的句子同时都要经过贝叶斯判决器和四元组运算器 的处理,然后对结果进行比较,最终得到该句子的极 性和强度值。 断句算法和四元组聚合是多级情感分析非常重 要的基础条件。下一小节对这两个方面内容详细介 绍 语料 生一 分词 < 兰 … i 责 朴套 … 丽 分类器I I 】 { 五 {词表 形容词词 袁 图1多级情感分析整体流程示例 2.2.1断句算法和四元组的定义 (1)SOw segmentation算法 受到POS tagging结果的启发,考虑到中文句法 分析本身的困难和现实情况,本文创新了句子处理 方法。实践证明SOW(sequence ofwords)segmentation 算法对于陕速有效处理中文句子是可行的。 第一步,标点符号归一,即将所有涉及断句的标 点置为统一的断句符号。 第二步,按照统一断句符进行句子切分,生成子 句数组。 第三步,依照如下两种策略,重组步骤二生成的 子句数组。 策略一:复合句正则。 当前子句是否符合复合句式正则(如当前子句 中包含“不但…而且”),当即判定当前子句为一个断 句。 策略二:评价对象控位。这里的评价对象是使用 PECE(LDA+PageRank+Condition Entropy)系统抽 取的名词词组 。提取当前句中的评价对象,并按照 靠近原则,将没有评价对象出现的子句,与上一个已 经确定的断句合并,将出现评价对象的子句作为一 个新的断句。当出现2个甚至2个以上名词在同一 个句子中时,一般把最后一个名词作为最终评价对 

在断句或者情感分析的词汇处理中,有不少人 喜欢运用窗口截取的办法。比如按照每组5个词截 取包括评价对象、情感词等。这样做的好处就是快 捷,在分词器可靠而且预处理良好的情况下,能有效 处理信息。但是,缺点也十分明显,即一旦中途发生 

……………曼 曼警蔓曼 辑… 皇堡 ! R : ……・ 采集错误,后续窗口中采集到的信息就会连续出错。 而且计算机程序无法自动判断出错点的位置并进行 修正,句子之间的一些关联关系也没有得到充分考 虑。采用SOW segmentation算法,比起时间窗口的方 法而言更具有灵活性。 一个普通评论,如“酒店卧室太脏了,早餐既难 吃,又贵。而且服务员态度不仅不好,还十分恶劣”。 分词系统处理后,句子呈现如下形式“酒店/n卧室 /n太/d脏/a了,v早餐/n既/c难吃/a/W又,d贵/a 而且,c服务员/n态度/n不仅/c不/d好/a,w还,d 十分/m恶劣/a”。如果根据一个机械的窗口截取, 则出现如下分句“酒店/n卧室/n太/d脏/a了/v”、 “早餐/n既/c难吃/a/w又/d贵/a”、“而且,c服务 员,n态度/n不仅/c不/d”、“好/a/w还/d十分/m 恶劣/a”。在这个句子中,可以看到,分出来的四句 话,前2句是完整的,但是后两句并不能进行独立分 析。且如果按照这样的截取方式,会直接导致后续可 能的评论残缺,这是因为需要向上补足五个窗口值。 又比如“这/r家/q酒店/n的/u卧室,n太,d脏/a 了,y,每天/r的/u早餐/n既/c难吃/a,又/d贵/a ,服务员/n态度/n不仅/c不/d好/a,还/d十分/m 恶劣/a”。如果按照标点符号进行简单的断句,遇到 “又贵”、“还十分恶劣”这句话就找不到主题词,可能 会被舍弃相关信息。如果出现类似“房间很大,明亮, 没有异味,看上去很整洁”这样的话,就能快速按照 评价对象“房间”进行归类,所有形容词以评价对象 为核心集结在一起,进行统一计算。 SOW segmentation算法主要的关注点就在于通 过评价对象的控位作用,在特定的商品服务类短评 论中,忽略一些极少出现的被字句或者宾语作为评 价对象的情况,而快速地从短文本中归纳关键信息, 提供给情感分析系统进行极性和强度的判断 (图2)。 (2)四元组定义 四元组包括作为评价对象的名词、描述评价对 象并表达情感的形容词、增强情感的程度副词和反 转情感的否定副词四种重要词汇,是综合考虑效率 和可行性后,提出的一种关键信息的组合。有必要把 

相关文档
最新文档