中文微博情感分析评测结果

合集下载

基于中文文本分析的微博情感地图的制作

基于中文文本分析的微博情感地图的制作

基于中文文本分析的微博情感地图的制作
郭义超;樊红
【期刊名称】《计算机系统应用》
【年(卷),期】2017(026)002
【摘要】自web进入2.0时代以来,互联网社交信息爆炸式地融入了人民生活,对海量社交网络信息的分析成为文本分析领域的一个重要研究方向.本文通过整理情感词典,制定语义规则,分析评测中文微博的情感色彩并与GIS空间分析方法相结合绘制出了情感地图.试图以客观的评价手段,对主观情绪进行科学计量化描述,并以地图为载体进行直观表达.论文将微博情感分析结果作为公民幸福指数的评价参考,同时,将地理信息科学与传统的情感分析相结合制作出情感地图,能够为国民幸福指数宏观评价及其空间分布特征提供更直观的展示和参考.
【总页数】5页(P25-29)
【作者】郭义超;樊红
【作者单位】武汉大学,武汉430079;武汉大学,武汉430079
【正文语种】中文
【相关文献】
1.基于领域情感词典的中文微博情感分析 [J], 肖江;丁星;何荣杰
2.基于表情图片与情感词的中文微博情感分析 [J], 张珊;于留宝;胡长军
3.基于情感词典的中文微博情感分析模型研究 [J], 梁亚伟
4.基于多部情感词典和规则集的中文微博情感分析研究 [J], 吴杰胜; 陆奎
5.基于cw2vec与CNN-BiLSTM注意力模型的中文微博情感分类 [J], 卢昱波;刘德润;蔡奕超;杨庆雨;陈伟;刘太安
因版权原因,仅展示原文概要,查看原文内容请购买。

中文微博情感分析系统LT六B上海交通大学中德语言技术联复习课程

中文微博情感分析系统LT六B上海交通大学中德语言技术联复习课程

1. 预处理
预处理过程主要进行句子的分词、句法分析、以及评价词抽取。 鉴于微博文本的特殊性,预处理不直接对整句操作,而是将每个句
子划分成四种不同的成分:
URL 用户名及转发标志:变现为:“@ + 用户名”,或“|| @ + 用户名” 话题:即一对“#”包裹的非空格字符 正常文本信息
分词和句法分析
分词使用了中科院的分词系统ICTCLAS,句法分析使用了Stanford Parser。 为了改善分词效果,评测小组成员从网络和评测样例数据中收集了一部
分常用网络用语,加入用户词典中。
1. 预处理
评价词抽取
基于评价词词典对词或词组进行匹配 分为正面评价词词典和负面评价词词典 词典来源由3部分构成:Hownet情感词集合、NTUSD情感词集合、
根据实验结果,人工调整了个别特征的权重,调低了分类器 判分的阈值
3. 情感要素抽取
主要使用基于分类器的方法,辅以基于模板的方法。使用评价 对象与评价词间的位置关系判别极性。
分类器同样采用VFI分类器。对于一条微博,首先抽取其中的 候选评价对象,然后对于微博中的每个观点句,分别判断每个 候选评价对象是否是其正确评价对象。
中文微博情感分析系统LTLAB
上海交通大学中德语言技术联合实验室
报告人:周霄
简介
在本届评测设立的3个评测任务中,LTLAB分别参加了 任务1(观点句识别)和任务3(情感要素抽取)。
对于任务1:采用了基于分类器的方案,特征抽取时 考虑到了多种词性和句法特征。
对于任务3:参评系统结合了基于分类器的抽取和基 于模板的抽取两种方案,考虑到了词的统计信息和微 博特有的话题信息。
4. 总结
谢谢!
基于词性的特征。选取了在观点句中常出现的词性或词性组合作 为特征,如:连词个数、代词个数、副词+形容词个数、“不”+ 形容词个数等等

中文-情感分析

中文-情感分析

7 4
中 文 信 息 学 报
2 0 1 2年
到2 用户数超过了 1. 0 1 1 年 4 月底 , 4 亿 。 微博正在 包括大量的信 从各个方面渗透并 影 响 人 们 的 生 活 , 息传播 、 更快的信息发现 、 与世界的连接等 。 微博消息数量大 , 更新快 , 吸引了一大批学者对 其进行研究 。 针对微博的自然语言处理研究已成为 而情感分析就 当前一个新的研究 热 点 和 前 沿 课 题 , 是其中一个热点 话 题 。 情 感 分 析 , 也被称为观点挖 掘、 观点分析 、 主客观分析等 。 情感分析的目的是从 文本中挖掘用户表达的观点以及情感极性 。 挖掘用 既能吸引潜在用户 , 帮助用户做决 户观点意义重大 , 策
情、 表达观点等 。 微博自问世以来 , 迅速吸引了大众 的眼光 , 蓬勃发展 。 以国内的新浪微博 ① 为例 ,截止
: / / / v a i l a b l e a t h t t w e i b o . c o m ① A p
, , 作者简介 :谢丽星 ( 女, 硕士 , 主要研究方向为缩略语识别 、 输入法和中文微博的情 感 分 析 ; 孙茂松( 男, 1 9 8 7—) 1 9 6 2—) , 博士 , 清华大学计算机 系 教 授 , 博士生导师, 主要研究方向为自然语言处理、 信息检索和社会计算; 周明( 男, 博士, 微 1 9 6 4—) 软亚洲研究院主任研究员 , 博士生导师 , 主要研究方向为自然语言处理 、 机器翻译 、 搜索引擎和社会关系网络 。
1 2 1 X I E L i x i n Z HOU M i n S UN M a o s o n g, g g ,
( , 1. S t a t e K e L a b o r a t o r o f I n t e l l i e n t T e c h n o l o a n d S s t e m s T s i n h u a N a t i o n a l L a b o r a t o r f o r y y g g y y g y , , S c i e n c e a n d T e c h n o l o D e a r t m e n t o f C o m u t e r S c i e n c e a n d T e c h n o l o I n f o r m a t i o n g y p p g y , ; , ) T s i n h u a U n i v e r s i t B e i i n 1 0 0 0 8 4, C h i n a 2.M i c r o s o f t R e s e a r c h A s i a B e i i n 1 0 0 0 8 4, C h i n a g y j g j g :W A b s t r a c t i t h t h e d e v e l o m e n t o f W e b 2. 0,m i c r o b l o h a s d r a w n s u b s t a n t i a l a t t e n t i o n f r o m b o t h a c a d e m i a a n d p g a e r i n d u s t r c o mm u n i t i e s . T h i s u t i l i z e s m i c r o b l o A P I f r o m S i n a a n d c a r r i e s o u t s e n t i m e n t a n a l s i s o n C h i n e s e p p y g y , , e r f o r m a n c e s b l o .W e c o m a r e o f t h r e e m e t h o d b a s e d o n t h e e m o t i c o n t h e s e n t i m e n t l e x i c o n a n d t h e h b r i d m i c r o p g p y ,w a r o a c h o v e r h i e r a r c h i c a l s t r u c t u r e u s i n S VM, r e s e c t i v e l .T h r o u h t h e e x e r i m e n t s e f i n d t h a t S VM b a s e d p p g p y g p , a r o a c h a c h i e v e s t h e b e s t w e a n a l z e t h e c o n t r i b u t i o n o f v a r i o u s f e a t u r e s i n t h i s h b r i d e r f o r m a n c e . F u r t h e r m o r e p p y y p , i n c l u d i n t a r e t i n d e e n d e n t f e a t u r e s a n d t a r e t d e e n d e n t f e a t u r e s .E x e r i m e n t a l r e s u l t s s h o w t h a t S VM m o d e l - - g g p g p p , b a s e d m e t h o d c a n a i n a n a c c u r a c o f 6 6. 4 6 7% w i t h t a r e t i n d e e n d e n t f e a t u r e s a n d a n i m r o v e d a c c u r a c o f - g y g p p y 6 7. 2 8 3% w i t h t h e a d d i t i o n o f t a r e t d e e n d e n t f e a t u r e s . - g p : ; ; K e w o r d s s i n a m i c r o b l o s e n t i m e n t a n a l s i s S VM g y y

微博用户情感分析与影响力评估

微博用户情感分析与影响力评估

微博用户情感分析与影响力评估随着社交媒体的不断普及和使用,微博已经成为了一种流行的社交平台。

作为国内最具影响力的社交媒体之一,微博拥有数亿的用户,其中不乏许多具有一定影响力的大V。

然而,仅仅拥有大量的关注者并不足以证明一个用户的影响力,因为每个人都有自己的情感和价值观,而用户发表的每一条微博均会直接或间接地影响到他的粉丝,对于微博用户的情感分析和影响力评估,因此具有十分重要的意义。

一、微博情感分析微博用户发表的微博中包含丰富的情感信息,它们可以是喜悦、愤怒、悲伤、惊讶等等。

情感分析就是一种通过计算机技术对这些情感信息进行识别和分类的方法。

情感分类的目的就是将微博分成积极、中性和消极三大类,这样就可以更好地理解网民的态度和观点。

情感分析技术通常采用机器学习和自然语言处理等技术,首先需要对大量的微博数据进行训练,建立情感识别模型。

训练集的建立需要耗费大量的人力和物力,在训练集具备一定的规模和代表性之后,利用这些数据训练模型,根据模型给出的概率或权重,对新的微博进行分类。

微博情感分析除了能够帮助用户了解网络上的观点和态度外,还可以应用到企业的品牌管理和公共舆情监测中。

二、微博影响力评估对于大V或是其他影响力人士而言,影响力评估同样具有重要的意义。

影响力评估其实是通过对用户的微博进行分析,整合用户在微博上的各种数据,并对其深入挖掘,最终判断该用户在微博中的影响力大小。

影响力评估一般可以包括以下几个方面:1. 粉丝数粉丝数是判断一个用户影响力大小的最简单和最直接的指标之一。

但是,单纯的粉丝数量并不能反映出用户在微博中的价值和影响力。

2. 微博转发量转发量是最能反映一个微博的传播效果的指标之一。

对于大V来说,越多的转发意味着更广泛的传播和更高的影响力。

3. 微博原创量原创微博是用户表达个性、个人认知和态度最直接的途径。

发表多量且质量高的原创微博,可以增加自身在粉丝中的影响力。

4. 微博互动量在微博上与粉丝之间的互动可以增强粉丝的忠诚度和归属感,帮助用户提高自己的影响力。

微博情感分析及其应用研究

微博情感分析及其应用研究

微博情感分析及其应用研究随着互联网与社交媒体的兴起,微博已经成为现代人们生活中重要的一部分。

人们不仅在微博上商业营销产品,也在微博上展示自我。

微博不仅是人们传播信息的平台,还是情感表达的集散地。

因此,对微博情感的分析和研究已成为计算机科学、心理学等领域的重要课题。

一、什么是微博情感分析?微博情感分析(Sentiment Analysis)是利用计算机技术,通过对用户发布的微博文本进行处理,判断微博发布者的情感倾向。

其核心目标是通过处理文本,将微博文本对应的情感值分为正面、负面或中性。

微博情感分析是从数据分析与语言分析多个角度出发,从海量数据中提取有意义的情感信息,对微博用户及社会公众的心理和情感状态进行把握并为决策提供参考。

二、微博情感分析的技术方法微博情感分析技术主要包括文本挖掘、机器学习和自然语言处理技术。

1、文本挖掘技术文本挖掘技术是指对自然语言文本进行处理、分类、聚类、分析和挖掘的技术。

通过对微博文本进行分析和处理,主要是对其中的关键词进行提取和分类,找到表情符号的意义,以及识别出语句中所表达的情感,并归类为正面、负面或中性。

2、机器学习技术机器学习技术指通过对大量数据的学习和分析,从中发现规律和模式,并对新数据进行预测的一种方法。

微博情感分析中常用的机器学习技术包括朴素贝叶斯算法、支持向量机、逻辑回归等。

3、自然语言处理技术自然语言处理技术是指对人类自然语言进行分析、处理、理解和生成的技术。

在微博情感分析中,自然语言处理技术主要包括分词、词性标注、依存句法分析等。

三、微博情感分析的应用研究微博情感分析的应用研究主要有以下几个方面。

1、企业品牌形象管理企业可以根据微博情感分析结果,对自己的品牌形象进行调整,从而提升品牌吸引力和竞争力。

如某手机品牌在上市时,发现用户的情感倾向都是负面的,便可以通过修改手机设计和功能等方面提升用户的情感体验。

2、舆情监测通过微博情感分析技术,政府、企业和公众都可以对社会舆情进行监测。

基于情感词典的中文微博情感倾向分析研究

基于情感词典的中文微博情感倾向分析研究

基于情感词典的中文微博情感倾向分析研究基于情感词典的中文微博情感倾向分析研究随着社交媒体的普及,微博成为了人们表达情感和观点的重要平台之一。

在海量的微博数据中,分析用户的情感倾向对于了解公众舆论和市场趋势具有重要价值。

因此,基于情感词典的中文微博情感倾向分析逐渐成为研究的热点。

首先,我们需要明确情感词典的概念和作用。

情感词典是指一类特殊的词典,其中记录了大量的情感词汇,包括积极、消极和中性的情感词汇。

这些情感词汇是通过人工标注和统计方法得到的,可以帮助我们识别和分析文本中的情感倾向。

情感词典在情感分析中起到了至关重要的作用,成为了研究和应用领域的基础。

在中文微博情感倾向分析中,研究者们通常采用两种常见的方法。

一种是基于词频统计的方法,另一种是基于情感词典的方法。

在基于词频统计的方法中,研究者会通过统计文本中出现的情感词的数量和频率来判断情感倾向。

然而,词频统计方法容易受到文本长度和词汇多样性的影响,无法准确捕捉情感信息。

因此,基于情感词典的方法逐渐受到研究者的青睐。

基于情感词典的中文微博情感倾向分析主要分为两个步骤:情感词典建立和情感倾向判别。

首先,我们需要建立一个适用于中文微博的情感词典。

这个过程中,我们可以通过分析大量的微博数据,人工标注其中的情感词汇,并结合统计方法不断完善词典。

情感词典的质量对于情感分析的准确性具有决定性影响,所以需要不断迭代和改进。

在情感倾向判别的过程中,我们使用情感词典对微博文本进行情感判别。

首先,将微博文本进行分词,并将其中的情感词与情感词典进行匹配。

然后,考虑到情感词的前后语境对情感倾向的影响,我们通常会采用一定的上下文匹配规则,以提高情感判别的准确性。

最后,通过计算匹配到的情感词的数量和权重,我们可以得到微博的情感倾向。

然而,基于情感词典的中文微博情感倾向分析仍面临一些挑战。

首先,中文的语言特点使得情感词典的建立更加困难,因为中文中情感的表达方式更为隐晦和多样化。

文本情感分析

文本情感分析

正向情感(如果正向情感词数 + 正向表情符号数 > 负向情感词数 + 负向表情符号数) 情感极性 = 负向情感(如果正向情感词数 + 正向表情符号数 < 负向情感词数 + 负向表情符号数) 中性情感(如果正向情感词数 + 正向表情符号数 = 负向情感词数 + 负向表情符号数)
基于情感词词典和表情符号的微博倾向性识别算法如下: 输入:微博集合T = {t 1 ,t 2 ,t 3 ,……,t n },情感词词典Dict,表情符号集Emotions; 1) 对于每条微博t i 按公式Score(t i )打分
微博情感倾向性分析
娄鑫坡,柴玉梅,昝红英,韩英杰
(郑州大学信息工程学院,郑州 450001) 摘要:本文主要介绍郑州大学自然语言处理实验室(ZZUNLP) 在参加 NLP&CC2012 中文 微博情感分析评测中完成的系统。其中评测共分 3 个任务,包括观点句识别、情感倾向性分 析和情感要素抽取。 对于三个任务, 其中观点句识别和情感倾向性分析采用了基于表情符号 的规则方法和基于情感词典的规则方法, 情感要素抽取采用了基于依存句法分析的评价对象 抽取方法。 关键词:情感分析;情感词;句法分析;微博
图1 首先通过情感词 “渣” 找情面的 SBV 结构, “[2]是_[1]配置(SBV)” 构成 SBV 依存关系, 而依存关系中的主语为配置,而配置前面有修饰词“神马” ,与配置构成依存关系,其依存
关系为“[2]配置_[1]神马(ATT) ” ,则抽取“神马配置”作为该条微博的情感对象。 情感要素抽取过程如下: Step1:对每条微博用哈尔滨工业大学的句法分析处理。 Step2:对于句子中每个词对应情感词词典 Dict 判断是否为情感词。如果是情感词转(3) , 否则继续查找,如果到句子末尾转(6) Step3:如果该词为情感词,则查找该情感词前面是否含有 SBV 依存关系,是则判断该依存 关系中主语是否为第一人称,如果主语不是第一人称则转(4) ,否则一直往前查找 SBV 结构,如果到句首依然没有没则转(5) 。 Step4:抽取该主语并且查找主语前是否有词与该主语形成 ATT 依存关系,有则一块抽取并 一直往前找,直到没有存在 ATT 依存关系为止。 Step5:抽取主题作为情感对象。转(2) Step6:转一下条微博处理。 4 实验及分析 NLP&CC2012 的评测语料包含大约 30,000 篇微博,给定了 20 个主题,其中包括产品 名,事件名等。情感词词典是通过人工浏览大量的微博语料抽取的,其中褒义词 577 个,贬 义词 3548 个。 4.1 任务 1 任务描述:针对每条微博的中各个句子,本任务要求判断该句是观点句还是非观点句。 观点句的定义不包括表达自我情感、 意愿或心情的句子, 只限定于对特定事物或对象的评价, 不包括内心自我情感、意愿或心情。 表一 评测结果 正确率 ZZU_opinion 平均结果 最佳结果 4.2 任务 2 任务描述: 本任务要求判断微博中每天观点句的情感倾向。 评测数据集包括每条微博中 的各个句子, 需要在任务 1 观点句识别的基础上再进行观点句的倾向性分许。 观点句的情感 倾向性可以分为正面(POS) ,负面(NEG)和其他(OTHER) 。 0.765 0.727 0.671 微平均 召回率 0.647 0.615 0.944 F值 0.701 0.647 0.784 正确率 0.760 0.727 0.674 任务 1 的评测结果 宏平均 召回率 0.640 0.607 0.942 F值 0.680 0.634 0.783

微博舆情分析报告

微博舆情分析报告

微博舆情分析报告1. 引言近年来,随着社交媒体的快速发展,人们对于舆情分析的需求不断增加。

作为最大的中文社交媒体平台之一,微博扮演着重要的角色。

本文将对微博上的舆情进行分析,通过收集和分析用户在微博上的发言,揭示其中蕴含的信息和趋势,为决策者提供参考。

2. 数据收集为了进行舆情分析,我们首先需要收集微博上的相关数据。

可以通过以下步骤进行数据收集: 1. 确定分析的对象和关键词:根据研究目的,确定要分析的微博主题和相关关键词。

2. 使用微博开放平台API:通过微博开放平台提供的API,获取与关键词相关的微博数据。

3. 数据清洗和整理:对收集到的数据进行清洗和整理,去除重复和无关的内容,并按照时间和其他相关信息进行排序。

3. 文本分析在收集到微博数据后,我们需要对文本数据进行分析,以揭示其中的舆情信息。

以下是一些常用的文本分析方法: 1. 情感分析:通过使用自然语言处理技术,对微博文本进行情感分类,判断其中的情感倾向,例如正面、负面或中性。

2. 关键词提取:识别微博文本中的关键词和热点话题,帮助我们了解用户关注的焦点和讨论话题。

3. 主题模型:使用主题模型技术对微博文本进行聚类分析,找出其中的主题和相关性,以便更好地理解用户的观点和意见。

4. 可视化分析为了更好地呈现舆情分析的结果,将数据可视化是一种常见的方法。

以下是一些常用的可视化方法: 1. 情感分布图:通过绘制情感分布图,可以直观地展示微博文本中的情感倾向,帮助我们了解用户对于某一话题的整体情绪。

2. 关键词云图:将关键词绘制成词云图,可以显示用户关注的热点话题和关键词,帮助我们把握舆情中的重点词汇。

3. 时间趋势图:通过绘制时间趋势图,可以展示微博舆情随时间的变化,帮助我们观察到微博话题的发展和变化。

5. 结论通过对微博舆情的分析,我们可以得出以下结论: 1. 用户情感倾向:通过情感分析,我们可以了解用户对于某一话题的情感倾向,帮助我们更好地了解用户需求和态度。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2012年CCF自然语言处理与中文计算会议中文微博情感分析评测结果1.提交结果编号本次评测共有34支队伍提交53组有效结果,提交结果编号及所属参评单位对应情况如表1所示。

表1 提交结果编号与参评单位对照表提交结果编号参评单位1 北京工商大学2 北京工商大学3 北京航空航天大学计算机学院4 北京航空航天大学计算机学院5 北京理工大学海量语言信息处理与云计算应用工程技术研究中心16 北京理工大学网络搜索挖掘与安全实验室7 北京理工大学海量语言信息处理与云计算应用工程技术研究中心28 北京理工大学海量语言信息处理与云计算应用工程技术研究中心29 大连理工大学10 大连理工大学11 广东工业大学DMIR实验室12 哈尔滨工业大学语言技术研究中心网络智能研究室13 哈尔滨工业大学语言技术研究中心网络智能研究室14 哈尔滨工业大学计算机科学与技术学院/机器智能与翻译研究室15 哈尔滨工业大学计算机科学与技术学院/机器智能与翻译研究室16 哈尔滨工业大学(威海)17 海军工程大学信息安全系18 黑龙江大学计算机科学技术学院19 湖南工业大学计算机与通信学院20 湖南工业大学计算机与通信学院21 湖南科技大学外国语学院22 华侨大学计算机科学与技术学院23 华侨大学计算机科学与技术学院24 华中科技大学25 南京大学计算机科学与技术系自然语言处理研究组26 南京理工大学27 南京理工大学28 清华大学计算机系智能技术与系统国家重点实验室信息检索组29 清华大学计算机系智能技术与系统国家重点实验室信息检索组1参评队伍联系人为刘全超2参评队伍联系人为王金刚提交结果编号参评单位30 厦门大学人工智能研究所31 厦门大学人工智能研究所32 上海交通大学中德语言技术联合实验室33 上海交通大学中德语言技术联合实验室34 上海交通大学计算机系35 上海交通大学计算机系36 上海交通大学信息内容分析技术国家工程实验室37 上海交通大学信息内容分析技术国家工程实验室38 同济大学计算机科学与技术系39 武汉大学计算机学院40 武汉大学计算机学院41 西安交通大学/山西省天地网技术重点实验室42 西南大学计算机信息科学学院1010实验室43 浙江大学城市学院44 浙江工商大学计算机与信息工程学院45 浙江工商大学计算机与信息工程学院46 郑州大学自然语言处理实验室47 郑州大学自然语言处理实验室48 中国传媒大学国家语言资源监测与研究中心有声媒体语言分中心49 中国传媒大学国家语言资源监测与研究中心有声媒体语言分中心50 中国科学院声学研究所51 中国科技大学知识与数据工程实验室52 中国科技大学知识与数据工程实验室53 北京交通大学自然语言处理研究室2.观点句识别评测结果针对每条微博中的各个句子,本任务要求判断出该句是观点句还是非观点句。

评测使用正确率(Precision),召回率(Recall)和 F 值(F-measure)来评价各个参赛队伍对观点句的识别结果。

微平均以整个数据集为一个评价单元,计算整体的评价指标;宏平均以每个话题为一个评价单元,计算参评系统在该话题中的评价指标,最后计算所有话题上各指标的平均值。

评测结果如表2所示。

表2 观点句识别评测结果结果编号微平均宏平均正确率召回率F值正确率召回率F值1 0.743 0.691 0.716 0.745 0.680 0.7072 0.733 0.746 0.739 0.734 0.735 0.7313 0.681 0.918 0.782 0.684 0.914 0.7794 0.707 0.577 0.635 0.715 0.577 0.6325 0.673 0.773 0.720 0.680 0.774 0.7126 0.742 0.694 0.717 0.706 0.684 0.6927 0.740 0.557 0.636 0.733 0.541 0.618正确率召回率F值正确率召回率F值8 0.734 0.528 0.614 0.724 0.514 0.5999 0.825 0.603 0.697 0.828 0.589 0.67910 0.822 0.592 0.688 0.824 0.581 0.67411 0.835 0.449 0.584 0.836 0.435 0.55712 0.738 0.726 0.732 0.743 0.717 0.72613 0.738 0.726 0.732 0.743 0.717 0.72614 0.619 0.378 0.469 0.601 0.383 0.41315 0.619 0.378 0.469 0.601 0.383 0.41316 0.647 0.757 0.697 0.648 0.751 0.68917 0.828 0.537 0.651 0.826 0.520 0.62918 0.728 0.502 0.594 0.736 0.502 0.58219 0.747 0.439 0.553 0.741 0.431 0.54220 0.781 0.406 0.534 0.776 0.395 0.52021 0.746 0.772 0.759 0.747 0.757 0.74822 0.707 0.656 0.681 0.713 0.651 0.67223 0.700 0.733 0.716 0.705 0.734 0.71324 0.737 0.536 0.621 0.743 0.522 0.60725 0.695 0.473 0.563 0.695 0.461 0.54826 0.745 0.406 0.525 0.742 0.394 0.50327 0.745 0.406 0.525 0.742 0.394 0.50328 0.714 0.717 0.716 0.722 0.708 0.70429 0.715 0.745 0.729 0.721 0.738 0.72130 0.740 0.646 0.690 0.744 0.639 0.68031 0.733 0.683 0.707 0.737 0.678 0.70232 0.671 0.944 0.784 0.674 0.942 0.78333 0.671 0.944 0.784 0.674 0.942 0.78334 0.805 0.588 0.680 0.807 0.581 0.67135 0.745 0.789 0.767 0.748 0.782 0.76036 0.674 0.891 0.768 0.679 0.892 0.76437 0.660 0.871 0.751 0.663 0.869 0.74738 0.704 0.562 0.625 0.699 0.557 0.61539 0.725 0.632 0.675 0.723 0.618 0.66140 0.708 0.649 0.677 0.708 0.634 0.66341 0.638 0.221 0.328 0.630 0.217 0.32042 0.783 0.338 0.472 0.792 0.337 0.45243 0.780 0.455 0.575 0.781 0.443 0.55744 0.696 0.348 0.464 0.686 0.348 0.44645 0.645 0.959 0.772 0.649 0.960 0.77046 0.765 0.647 0.701 0.760 0.641 0.68047 0.779 0.542 0.639 0.767 0.529 0.61548 0.756 0.802 0.779 0.758 0.788 0.769正确率召回率F值正确率召回率F值49 0.756 0.812 0.783 0.757 0.797 0.77350 0.773 0.119 0.206 0.766 0.112 0.18151 0.728 0.658 0.691 0.732 0.651 0.68652 0.716 0.716 0.716 0.719 0.712 0.71153 0.701 0.334 0.452 0.707 0.341 0.4543.情感倾向性判断评测结果本任务要求判断微博中每条观点句的情感倾向。

本任务同样使用正确率(Precision),召回率(Recall)和F 值(F-measure)作为评价标准。

评测结果如表3所示。

表3 情感倾向性判断评测结果结果编号微平均宏平均正确率召回率F值正确率召回率F值1 0.831 0.574 0.679 0.823 0.563 0.6662 0.824 0.614 0.704 0.825 0.608 0.6983 0.761 0.698 0.728 0.768 0.702 0.7334 0.764 0.440 0.559 0.758 0.445 0.5595 0.734 0.568 0.640 0.738 0.574 0.6426 0.782 0.565 0.656 0.783 0.562 0.6537 0.724 0.403 0.518 0.708 0.387 0.4968 0.718 0.379 0.496 0.703 0.365 0.4779 0.841 0.507 0.633 0.849 0.497 0.62010 0.833 0.493 0.619 0.843 0.487 0.61111 0.426 0.426 0.426 0.413 0.413 0.41312 0.881 0.640 0.741 0.878 0.632 0.73313 0.863 0.626 0.726 0.860 0.619 0.71814 0.258 0.097 0.141 0.341 0.105 0.13915 0.261 0.099 0.143 0.342 0.107 0.14116 0.559 0.559 0.559 0.561 0.561 0.56117 0.772 0.415 0.540 0.776 0.404 0.52318 0.809 0.406 0.541 0.791 0.407 0.53019 0.598 0.262 0.365 0.583 0.253 0.35020 0.594 0.241 0.343 0.578 0.232 0.32821 0.796 0.614 0.693 0.789 0.600 0.67924 0.643 0.344 0.449 0.641 0.335 0.43725 0.803 0.379 0.515 0.800 0.370 0.50226 0.647 0.399 0.493 0.641 0.390 0.48228 0.788 0.565 0.658 0.780 0.562 0.64929 0.794 0.591 0.678 0.786 0.590 0.67130 0.740 0.478 0.580 0.734 0.472 0.57231 0.725 0.495 0.588 0.725 0.490 0.583正确率召回率F值正确率召回率F值34 0.893 0.481 0.625 0.895 0.481 0.62235 0.886 0.631 0.737 0.888 0.630 0.73336 0.587 0.587 0.587 0.579 0.579 0.57937 0.850 0.850 0.850 0.854 0.854 0.85438 0.691 0.389 0.498 0.693 0.387 0.49139 0.809 0.511 0.627 0.799 0.496 0.60740 0.740 0.480 0.582 0.731 0.465 0.56541 0.832 0.184 0.301 0.829 0.181 0.29342 0.288 0.288 0.288 0.289 0.289 0.28943 0.879 0.400 0.550 0.872 0.391 0.53344 0.803 0.266 0.399 0.733 0.263 0.37545 0.804 0.771 0.787 0.809 0.778 0.79346 0.902 0.584 0.709 0.899 0.578 0.69047 0.857 0.464 0.602 0.855 0.452 0.57948 0.842 0.675 0.749 0.840 0.663 0.73949 0.844 0.685 0.756 0.842 0.672 0.74550 0.108 0.108 0.108 0.102 0.102 0.10251 0.476 0.341 0.397 0.459 0.329 0.38252 0.476 0.341 0.397 0.459 0.329 0.38253 0.450 0.150 0.225 0.435 0.151 0.2224.情感要素抽取评测结果本任务要求找出微博中每条观点句作者的评价对象,即情感对象,同时判断针对情感对象的观点极性。

相关文档
最新文档