中文微博语言的功能文体分析

中文微博语言的功能文体分析
中文微博语言的功能文体分析

微博与微信经营模式的SWOT对比分析 (1)

微博与微信经营模式的SWOT对比分析-新闻学 微博与微信经营模式的SWOT对比分析 ○马庆贺 【摘要】随着传播技术的革新与智能手机的普及,一个崭新的传播时代来临。微博与微信是在新技术的发展下应运而生的社交媒体,是新兴的信息发布与传播、分享与获取的平台。2009年,新浪微博上线,2011年,微信后来居上,作为后起之秀的微信正在全力赶超曾经异军突起的新浪微博。本文主要通过新浪微博与微信的SWOT对比分析,来研究二者经营模式的不同,探讨微信是否能在将来激烈的互联网产品竞争中取代新浪微博。 关键词新浪微博微信经营模式 一、微博概述 微博,也叫做微博客,用户可以通过多种渠道发布与分享140个字符之内的文字或者图像、链接、音频与视频等多种形式的信息。和其他互联网产品一样,微博也是由国外传播到中国的舶来品。2006年,Twitter的推出红遍了世界,微博逐渐进入到中国的市场。2009年8月新浪微博上线之后,依托新浪门户网站的大流量与其博客产品的好口碑,新浪微博成为了网民关注与讨论的焦点,2010年也被称作“微博元年”。2010年4月,腾讯微博上线,但因新浪微博用户活跃度高、粘性大,形成了用户规模壁垒、市场占有率高,腾讯在经过多方努力后仍未赶超新浪微博。此后,基本上没有实力相近的对手与新浪竞争,新浪微博已经成为人们口中约定俗成的“微博”产品。 二、微信概述 微信是2011年1月21日,由腾讯公司基于手机移动终端推出的一款即时聊

天通讯软件,用户可以通过网络发送语音、文字、图片、视频等消息与好友进行聊天或者多人群聊。早在微信上市之初,其信息传递形式就不再拘泥于文字或20KB(部分压缩彩信可达50KB)以下的图片+文字形式。随着后续版本的不断更新,例如像talk box功能、“查看附近的人”的陌生人交友功能等不断完善,不但丰富了信息的表现形式,更开创了信息无限传递的可能。随后,微信5.0版本的上线,让“游戏中心”、“微信支付”等商业化功能成为新的亮点,这也加速了微信打造综合性应用平台的进程,建立了自身盈利模式,填补了微信生态圈的重要一环。 三、微信与新浪微博经营模式的SWOT对比分析 1、微信对比新浪微博的Strength (1)用户粘性与用户体验。微信是一种强关系的社交软件,偏重于关系纽带,通讯属性强。注册微信需要绑定手机号码或者QQ号码与邮箱账号等,可以导入手机通讯录与QQ好友,是一个成熟稳定联系密切的熟人交际圈。通过线下真人互动带动线上好友沟通,用户粘性大,忠诚度高,信任度强。 新浪微博则是一种弱关系社交平台,偏重内容传播,媒体属性强。注册微博较为简单,准入门槛低,平台开放,没有实名制,陌生人之间也可以通过点赞、评论、转发等进行人际互动。因为新浪微博传播内容的开放性,信息传播中,畅通无阻,速度快,互动性强。 作为即时通讯软件,微信主打点对点的语音聊天,但其传播符号也非常多样化,语音,文字,图片,视频,链接,表情等都囊括在其中。语音聊天比其他传播符号能够更加准确的传递用户的心情与态度,通过语音这个载体,用户之间的沟通更加的顺畅,沟通误差较小,沟通质量得到提高与增强。通过微信传递信息的成

新浪微博推广技巧

新浪微博推广技巧 一、活跃有朝力 你用心想一下就知道了,生活中那些比较活跃有活力的人身边的好友是不是比较多点,人缘是不是也要比整天沉默不语的人要好很多呢?玩微博也是一样的,想要自己有个很好的人际圈子,别人喜欢你,你就不能每天沉默不语,要多发言,多抢沙发,让别人不能忽视你的存在,每天都让他们可以看到你在动,你在他们的身边围绕着呢?这样日久之后他们自然而然就会关注起你来了,因为你已经成为他们生活中的一部分了。 二、幽默风趣 刚才说到要发言,然而并不是你什么都说,乱发的,每天发一些垃圾信息,而是要发你粉丝感兴趣的东西才行,要让他们喜欢你发的广播,而不是看到你发的内容他们就心烦意乱,想把你屏蔽。因此,在你发广播的时候就要多注意发一些幽默风趣能够带给人喜悦的内容来,让人看了就忍不住的想笑,轻松而愉快,相信没有人会拒绝给自己带来快乐的人吧?做好这点,你又成功了一步。

三、互动交流 如果你每天都是一个劲在的取悦你的粉丝,发他们喜欢的内容,讨好他们时间长了相信你也会烦的吧,是不是很想你发的广播能够引起朋友们的兴趣,和他们互动起来呢?自己发了一条广播是不是想马上看看自己粉丝的反应呢?他们会说什么呢?其实这很简单的,只需要别在发广播的时候你可以给以回复或是评论转发就可以了,他们在看到你内容时是这样做的,你也不能不理了,就放那了,要时时的和他们交流,互相转播评论才行的,互动交流才是王道,没人会喜欢自己老是主动,而却一直得不到任何回应的。 四、人脉传播 如果你能利用好你自己目前所拥有的资源,而把这些资源都利用起来的话,那么你的新浪微博应该也会有不少的人气了。平时可以给你的QQ好友发消息,让他关注你的微博,然后请他帮你转发给他的朋友,也可发在QQ群里的每个好友,也能给友好发邮件,告诉他们你的微博地址,让他们没事的时候多加关注。这样一传十,十传百的力量绝对是你增加人气的捷径。 微薄营销; 一、微博营销是刚刚推出的一个网络营销方式,因为随着微博的火热,既催生了有关的营销方式,就是微博营销。每一个人都可以在新浪,网易等等注册一个微博,然后利用更新自己的微型博客。每天的更新的内容就可以跟大家交流,或者有大家所感兴趣的话题,这样就可

文本情感分析综述

文本情感分析综述? 赵妍妍+, 秦兵, 刘挺 (哈尔滨工业大学计算机科学与技术学院信息检索研究中心, 黑龙江哈尔滨 150001) A Survey of Sentiment Analysis * ZHAO Yan-Yan+, QIN Bing, LIU Ting (School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China) + Corresponding author: Phn: +86-451-86413683 ext 800, E-mail: zyy@https://www.360docs.net/doc/c97734031.html, Abstract: Sentiment analysis is a novel research topic with the quick development of online reviews, which has drawn interesting attention due to its research value and extensive applications. This paper surveys the state-of-the-art research on sentiment analysis. First, three important tasks of sentiment analysis are summarized and analyzed in detail, including sentiment extraction, sentiment classification, sentiment retrieval and summarization; then the evaluation and corpus for sentiment analysis are introduced; finally the applications of sentiment analysis are concluded. This paper aims to take a deep insight into the mainstream methods and recent progress in this field, making detailed comparison and analysis. It is expected to be helpful to the future research. Key words: sentiment analysis; sentiment extraction; sentiment classification; sentiment retrieval and summarization; evaluation; corpus 摘 要: 文本情感分析是随着网络评论的海量增长而迅速兴起的一个新兴研究课题,其研究价值和应用价值受到人们越来越多的重视.本文对文本情感分析的研究现状与进展进行了总结.首先将文本情感分析归纳为三项主要任务,即情感信息抽取,情感信息分类以及情感信息的检索与归纳,并对它们进行了细致的介绍和分析;进而介绍了文本情感分析的国内外评测和资源建设情况;最后介绍了文本情感分析的应用.文本重在对文本情感分析研究的主流方法和前沿进展进行概括,比较和分析,以期对后续研究有所助益. 关键词: 文本情感分析;情感信息抽取;情感信息分类;情感信息的检索与归纳;评测;资源建设 中图法分类号: TP391文献标识码: A 随着Web2.0的蓬勃发展,互联网逐渐倡导“以用户为中心,用户参与”的开放式构架理念.互联网用户由单纯的“读”网页,开始向“写”网页、“共同建设”互联网发展,并由被动地接收互联网信息向主动创造互联网信息迈进.因此,互联网(如:博客和论坛)上产生了大量的用户参与的,对于诸如人物、事件、产品等有价值的评论信息.这些评论信息表达了人们的各种情感色彩和情感倾向性,如“喜”、“怒”、“哀”、“乐”,和“批评”、“赞扬”等.基于此,潜在的用户就可以通过浏览这些主观色彩的评论,来了解大众舆论对于某一事件或产品的看法.由于越来越多的用户乐于在互联网上分享自己的观点或体验,这类评论信息迅速膨胀,仅靠人工的方法难以应对网上海量信 ?Supported by the National Natural Science Foundation of China under Grant Nos. 60803093, 60975055 (国家自然科学基金) and the “863” National High-Tech Research and Development of China via grant 2008AA01Z144(863计划探索类专题项目)

情感分析简述

情感分析简述 分类:NLP2012-04-08 12:38 1022人阅读评论(3) 收藏举报情感classification算法测试translationmatrix 情感分析,我研究了也有半年有余了,ACL Anthology上关于情感分析的论文也基本看过了一遍,但是到目前还没有什么成就的。以下是我为一位同学毕业设计写的情感分析方面的综述,引用的论文基本上是ACL 和COLING还有EMNLP上历年关于情感分析的论文,本文应该学术性比较强一点,本文虽不打算发表,但由于将来可能还有用,以及关于学术上的原因,请大家如果要引用请务必标明出处 (https://www.360docs.net/doc/c97734031.html,/s/blog_48f3f8b10100irhl.html)。 概述 情感分析自从2002年由Bo Pang提出之后,获得了很大程度的研究的,特别是在在线评论的情感倾向性分析上获得了很大的发展,目前基于在线评论文本的情感倾向性分析的准确率最高能达到90%以上,但是由于深层情感分析必然涉及到语义的分析,以及文本中情感转移现象的经常出现,所以基于深层语义的情感分析以及篇章级的情感分析进展一直不是很大。情感分析还存在的一个问题是尚未存在一个标准的情感测试语料库,虽然Bo Pang实验用的电影评论数据集(https://www.360docs.net/doc/c97734031.html,/people/pabo/movie-review-data/)以及Theresa Wilson等建立的MPQA(https://www.360docs.net/doc/c97734031.html,/mpqa/)是目前广泛使用的两类情感分析数据集,但是并没有公认的标准加以确认。 目前情感分析的研究基本借鉴文本分类等机器学习的方法,还没有根据自身的特点形成一套独立的研究方法,当然在某种程度上也可以把情感分析看出一种特殊的文本分类。比较成熟的方法是基于监督学习的机器学习方法,半监督学习和无监督学习目前的研究不是很多,单纯的基于规则的情感分析这两年已很少研究了。既然目前很多情感分析的研究基于机器学习,那么特征选择就是一个很重要的问题,N元语法等句法特征是使用最多的一类特征,而语义特征(语义计算)和结构特征(树核函数)从文本分类的角度看效果远没有句法特征效果好,所以目前的研究不是很多的。 由于基于监督学习情感分析的研究已经很成熟了,而且在真实世界中由于测试集的数量要远远多于训练集的数量,并且测试集的领域也不像在监督学习中被限制为和训练集一致,也就是说目前情感分析所应用的归纳偏置假设在真实世界中显得太强的,为了和真实世界相一致,基于半监督学习或弱指导学习的情感分析和跨领域的情感分析势必是将来的研究趋势之一。 在情感分析的最初阶段基于语义和基于规则的情感分析曾获得了比较大的重视,但是由于本身实现的复杂性以及文本分类和机器学习方法在情感分析应用上获得的成功,目前关于这方面的研究以及很少了,但是事实上,语义的相关性和上下文的相关性正是情感分析和文本分类最大的不同之处,所以将基于语义和规则的情感分析与基于机器学习的情感分析相结合也将是未来的研究趋势之一。 以下将分别对情感分析的起源,目前基于监督学习,无监督学习,基于规则和跨领域的情感分析的一些研究工作进行简单的介绍。 起源 虽然之前也有一些相关工作,但目前公认的情感分析比较系统的研究工作开始于(Pang et al., 2002)基于监督学习(supervised learning)方法对电影评论文本进行情感倾向性分类和(Turney,2002)基于无监督学习(unsupervised learning)对文本情感情感倾向性分类的研究。(Pang et al., 2002)基于文本的N元语法(ngram)和词类(POS)等特征分别使用朴素贝叶斯(Naive Bayes),最大熵(Maximum Entropy)和支持向量机(Support Vector Machine,SVM)将文本情感倾向性分为正向和负向两类,将文本的情感进行二元划分的做法也一直沿用至今。同时他们在实验中使用电影评论数据集目前已成为广泛使用的情感分析的测试集。(Turney ,2002)基于点互信息(Pointwise Mutual Information,PMI)计算文本中抽取的关键词和种子词(excellent,poor)的相似度来对文本的情感倾向性进行判别(SO-PMI算法)。 在此之后的大部分都是基于(Pang et al., 2002)的研究。而相对来说,(Turney et al.,2002)提出的无监督学习的方法虽然在实现上更加简单,但是由于单词之间的情感相似度难以准确的计算和种子词的难以确定,继续在无监督学习方向的研究并不是很多的,但是利用SO-PMI算法计算文本情感倾向性的思想却被很多研究者所继承了。 监督学习 目前,基于监督学习的情感分析仍然是主流,除了(Li et al.,2009)基于非负矩阵三分解(Non-negative Matrix Tri-factorization),(Abbasi et al.,2008)基于遗传算法(Genetic Algorithm)的情感分析之外,使用的最多的监督学习算法是朴素贝叶斯,k最近邻(k-Nearest Neighbor,k-NN),最大熵和支持向量机的。而对于算法的改进主要在对文本的预处理阶段。 一个和文本分类不同地方就是情感分析有时需要提取文本的真正表达情感的句子。(Pang et al., 2004)基于文本中的主观句的选择和(Wilson el al.,2009)基于文本中的中性实例(neutral instances)的分析,都是为了能够尽量获得文本中真正表达情感的句子。(Abbasi et al.,2008)提出通过信息增益(Information Gain,IG)的方法来选择大量特征集中对于情感分析有益的特征。 而对于特征选择,除了N元语法和词类特征之外,(Wilson el al.,2009)提出混合单词特征,否定词特征,情感修饰特征,情感转移特征等各类句法特征的情感分析,(Abbasi et al.,2008)提出混合句子的句法(N元语法,词类,标点)和结构特征(单词的长度,词类中单词的个数,文本的结构特征等)的情感分析。 除了对于文本的预处理,对于监督学习中情感分析还进行了以下方面的研究的。(Melville et al., 2009)和(Li et al.,2009)提出结合情感词的先验的基于词典的情感倾向性和训练文本中后验的基于上下文的情感情感倾向性共同判断文本的情感倾向性。(Taboada et al.,2009)提出结合文本的题材(描述,评论,背景,解释等)和文本本身的特征共同判断文本的情感倾向性。(Tsutsumi et al.,2007)提出利用多分类器融合技术来对文本情感分类。(Wan, 2008)和(Wan, 2009)提出结合英文中丰富的情感分析资源来提高中文情感分析的效果。 基于规则/无监督学习

新浪微博分析报告

新浪微博分析报告

新浪微博分析报告 新浪微博加粉丝,完善个人资料。最好用自己的真实姓名(或有趣的匿名)、真实的头像(美女、帅锅或有趣的头像)、个人介绍(可以是搞笑的吸引人的)。真实的信息让人觉得更可信,会大大提高被收听的几率。 通过微博第三方应用(狠狠转、互粉大厅、粉丝大师、互粉加加、互粉小助手、推兔、爱互粉、推兔互粉等。。。)来添加粉丝数量。最好不要用软件,软件刷的粉丝大多是死粉,且用软件刷还很容易被封号。 我发现想让一个人转发或评论你的微博不是件容易的事。首先微博必须有看点(让别人有耐心看下去)、笑点(让别人对你产生兴趣)、创意(让别人新鲜有趣),或者有活动优惠(大部分网民是爱贪便宜的)。且不要刷屏,网民是很反感刷屏的,所以一天发3~5条微博就差不多了。多参加一些热点话题的讨论,尽量把自己的曝光度提升。如:我申请了#第三代搜索技术#这个话题的主持人,那么怎么推广呢?

我们可以点击微博下面的推广, 也可以通过狠狠转的“我要转发”,其他第三方应用也有这项功能, 也可以借助热门话题的力量进行宣传

借助话题,如:#第三代搜索技术#话题镶入#360#、#360好搜#、#奇虎360#等这些热门话题中,从而有了间接的关系,我们可以这样做:这就是借助引流方式。

添加相应的标签,有助于网民的搜索 还有就是借助其他渠道宣传,qq、微信、论坛、软文等。。。。推广方式很多,我也不多说了。 针对一个兴趣(或一个产品)来发布微博,如果每天都发不同的兴趣(或产品)那样会损失一批粉丝。明星就可以不在乎这些,但我们不是,所以要多多与网民互动,培养信任度,这样也有助于提高网民的转帖效率。 微博营销,也就是社会化媒体营销,同微信、论坛、博客、sns社区是一样的,他们不同于其他传统营销,它们的内容都是由用户自愿提供的,而不是直接的雇佣关系,这个就需要社交思维。这种营销方式广泛,易于流行。我们可以从微博、论坛寻找潜在用户,让其进入微信进行一对一交谈,从而成为精确用户进行维护。 最近了解到微博在2014.04月份采取了措施,在微博发微信二维码、微信公众号会被删或封号等

新浪微博粉丝通推广效果分析

新浪微博粉丝通推广效果分析 新浪微博“粉丝通”是基于微博的企业营销推广产品,它会根据用户属性和社交关系将信息精准的投放给目标人群,同时“粉丝通”也具有普通微博的全部功能,如转发、评论、收藏等,这些天我注册并使用了一下微博“粉丝通”,并对其推广数据进行了一番分析。 粉丝通的收费规则有两种,一种按CPM收费,最低出价为1000人次/5元,一种是按CPE 收费,最低出价1人次/0.5元。根据客服的建议,广告推广只选择了按CPM方式的广告投放,一共投放了两个广告计划。 第一个广告计划是针对兴趣投放的广告,投放微博用户为全部用户,然后在“社交兴趣图谱”里选择指定的兴趣人群来投放,投放了7天,出价为千次15元。平均数据为:平均千次展示成本为13.07元,单次互动成本为18.42元,微博内链接点击平均价格为37.5元。 第二个广告计划是针对行业微博大号的粉丝投放的,“社交兴趣图谱”里选择全部,投放了两天,出价为千次15元。平均数据为:平均千次展示成本为11.66元,单次互动成本为4. 51元,微博内链接点击平均价格为6.41元。

从投放效果看,针对行业微博大号粉丝的投放效果明显好于针对社交兴趣投放的效果,可见新浪微博对于用户的真实社交兴趣把握还并不太准确。不过,即使针对行业微博大号的粉丝投放,其微博内链接点击成本价格也较高。 根据千次展示成本,也可以估算一下普通一条微博推广的费用,如果按照12元的价格计算,一条微博如果展示了5万次,那么按照粉丝通的计算价格应该为600元推广费用。 一条推广微博是否有效果,一般由如下三方面组成:粉丝的质量、微博的到达率、微博的质量,粉丝通解决了前两项,但微博的创意却是由企业来提供,只有高质量的微博才能够吸引到别人,如果微博质量不高的话,使用CPM方式投放广告就不太划算。 如果无法撰写出高质量的微博创意,那么可以尝试用用按照互动次数投放广告,预计按照CPE方式投放对于低交互微博可能会更合算一些。

基于深度学习的中文短文本情感分析

基于深度学习的中文短文本情感分析 随着互联网不断发展,网络评论平台不断增加,用户评论数量也 爆发式增长。利用情感分析技术能够有效的挖掘文本包含的情感信息,目前已成为社会舆情监督和厂家获取反馈信息的重要途径,具有很高的研究价值。本文的研究目的是探究中文短文本中所包含的情感信息,主要解决文本情感极性褒贬义分类问题。传统的情感分析方法主要有两种:基于情感词典的方法和基于机器学习的方法。但由于文本语料简短,含有大量未登录词使得上述方法存在数据稀疏问题,且过分依 赖领域专家的标注。近年来出现的深度学习技术能够很好的解决上述问题。因此,本文采用深度学习的方法对中文短文本进行情感分析。主要研究内容如下:首先,在文本数据预处理过程,针对目前网络上存在的大量未登录词,设计了一种新词发现方法,主要是利用词语的内 部凝固度、边界自由度及语言规则对候选新词进行过滤。将识别的新词加入词库,提高分词的准确率。其次,传统的词向量仅考虑了文本中的语义语法信息,会将语义相近,情感极性却相反的词语映射到相邻 的位置,导致最终分类结果错误。为了解决此问题,本文在传统词向量的基础上融合了情感信息,提出一种情感词向量的生成方法。最后, 针对循环神经网络在处理时序信息发生的梯度消失问题,本文提出基于GRU(Gated Recurrent Unit)的情感分析模型,将循环神经网络的隐层节点替换为GRU单元,用于情感分析。本文利用Python中的Keras 深度学习库构建提出的GRU情感分析模型,通过实验,找到模型最佳 参数,并在最佳参数下进行情感分析,其分类的准确率达到92.01%。

将其与机器学习模型SVM及深度学习模型LSTM,CNN进行对比实验,结果表明,在所有指标下,本文提出的以情感词向量作为输入的情感分析模型明显优于其他模型。

新浪微博推广的效果分析

网络营销考试论文 论文题目:新浪微博推广的效果分析学生姓名: 学生学号: 专业: 班级: 成绩:

目录 一、微博微博推广、网络推广,其关系是怎样的 (1) 二、常用微博推广方法及技巧 (1) 三、怎样进行微博推广 (1) (一)注册微博技巧 (2) (二)微博推广技巧 (2) 四、微博推广总体成效分析 (4) 五、总结 (4) 参考文献 (4)

微博推广的效果分析 一、微博微博推广、网络推广,其关系是怎样的 微博,即微博客(MicroBlog)的简称,是一个基于用户关系的信息分享、传播以及获取平台。在这样一个平台里,你既可以作为观众,通过WEB、WAP以及各种客户端组建个人社区,浏览你感兴趣的信息;也可以作为发布者,在微博上发布140字左右的文字更新信息,或者是图片、视频,实现即时分享。但微博的社交性质并不强,只是一种最佳的信息发布平台。而微博推广,就是以微博为媒体,在最短的时间内将信息以裂变的方式传播出去,它是社会媒体优化(被称为Social media optimization,简称SMO)的一种,亦是网络推广的一种有效方式。现在微博推广的主流微博有新浪,腾讯,搜狐,网易等等,其中新浪微博是使用和关注人群最多的,它的推广被越来越多的站长们所重视,已经成为热门的网络推广行为。 二、常用微博推广方法及技巧 话题,根据你的目标听众设定话题,就是要在微博设立初期制定内容策略,就像一本杂志的主编设定杂志内容策略是类似的。微博的最终目的其实是分享内容。 标签,设好标签可以帮你查找相同爱好的人,志同道合的人才会成为你忠实的粉丝。 善用大众热门话题,及关注热点。每小时热门话题排行以及每日热门话题排行都是很有用的,因为这些话题适合微博的每个人,并且善加策划进我们的营销内容,可以增加被用户搜索到的机率。 制定有规律的更新频率,每日发6-20条,一个小时都能发1-2条,频率和节奏把握不好,会让粉丝流失。 互动交流,写微博,发微博,相互评论与转播,增加粉丝间的互动,加强彼此间的交流,巩固粉丝间的稳定性。 规划好发帖时间。微博有几个高峰,上班、午休、下午4点后晚上8点,要抓住这些高峰人群时间发帖,才可能产生高阅读率和高转发率。 广加好友,新浪微博可以发邮件给好友,邀请他们开通新浪微博,结合微博推广第一条,可以说明,微博,朋友多是王道! 同步博客微博,只需要博客地址就能同步别人博客的文章,户主社区没有帐号审核之类的。 完善资料,加入微博后先完善资料,修改头像,让大家感觉到你的真实,才会有更多的人关注你。 三、怎样进行微博推广 挑选一个好的微博平台,建立一个微博账号。一个好的平台,有足够的人气,能够找到潜在的关注群体,有利于培养潜在客户。

文本情感分析论文总结

文本情感分析 赵妍妍,秦兵,刘挺- 软件学报, 2010 - https://www.360docs.net/doc/c97734031.html, 按粒度,情感分析可分为词语级、短语级、句子级、篇章级、多篇章级;按文本类别,可分为基于新闻评论和基于产品的情感分析。 情感分析的研究任务:情感信息的抽取、分类以及检索与归纳。 一、情感信息抽取(评价词语、评价对象、观点持有者) 1.评价词语的抽取:基于语料库的抽取;基于词典的抽取;基于图的方法。 2.评价对象的抽取:基于规则/模板的方法(词序列、词性、句法规则、关联规则挖掘);评 价对象最为产品属性,考察评价对象与领域指示词的关联度来获取;多粒度的话题模型方法。 3.观点持有者抽取:命名实体识别技术(人名或机构名)、语义角色标注;分类任务,看做 序列标注问题,使用CRF融合特征抽取;名词短语作为候选,使用ME模型计算。 4.组合评价单元的抽取: 主观表达式:Wiebe的主观表达式库(抽取n元词语/词组作为候选,对比训练预料判断) 评价短语抽取(程度副词-评价词语):情感词典的方法;依存句法解构(ADV,ATT,DE)。 评价搭配抽取(评价词语-评价对象):基于模板的方法(8个共现模板、句法关系模板)。 二、情感信息分类 1.主客观信息分类:文本是否含情感知识方法;组合评价单元判断;情感模板识别;基于 分类器和分类特征的二元分类任务(词语特征,标点、人称代词、数字特征,基于图); 2.主观信息情感分类(句子级、篇章级):基于情感知识、基于特征分类的方法(n-gram词语 特征和词性特征、位置特征、评价词特征)。 三、情感信息的检索与归纳 1.情感信息检索 2.情感信息归纳 基于产品属性的情感文摘:识别评论信息中的产品属性,抽取描述产品属性的情感句,判断其倾向性。 基于情感标签的情感文摘:标签可定义为评价搭配形式,建立标签库,相似度聚类的方法聚类得到相似的情感标签,每一类视为潜在的话题(即产品属性)。 基于新闻评论的文摘 四、情感分析的评测与资源 1.情感分析的评测:TREC,NTCIR的MOAT(新闻观点检测,情感问答,跨语言情感分析), 国内的COAE。 2.情感分析的语料:康奈尔大学的影评数据集,UIC的Hu和Liu的产品领域的评论语料, Wiebe的MPQA新闻评论深度标注语料,MIT的多角度餐馆评论语料,中科院的中文酒店评论语料。 3.词典资源:GI(general inquirer)评价词词典,NTU评价词词典(繁体中文),主观词词典(英 文),HowNet评价词词典(简体中文、英文) 问题:情感信息抽取忽略词语所在语境的影响;评价对象的情感分类,而非句子级或篇章级;基于情感标签的情感文摘的深入研究;

新浪微博整体分析

新浪微博分析 微博又叫微博客 (micro blog),是微型博客的简称,基于web2.0技术的即时信息发布系统。是一个基于用户关系的信息分享、传播以及获取平台,用户可以通过WEB、WAP以及各种客户端组件个人社区,以140字左右的文字更新信息,并实现即时分享。与传统博客相比,以“短、灵、快”为特点。140字左右的文字更新信息,并实现即时分享。微型博客可分为两大市场,一类是定位于个人用户的微型博客,另外一类是定位于企业客户的微型博客。微博客是信息日益碎片化的必然结果。“围脖”是微博客的谐音,所以微博也称围脖。微博客的代表性网站是美国的Twitter,是最早也是最著名的微博,这个词甚至已经成为了微博客的代名词。新浪作为中国最大的门户网站之一,2009年八月新浪推出新浪微薄测试版,成为门户网站第一家提供微薄服务的网站,微薄正式进入中文上网人群视野! 一、新浪微薄发展背景 Web2.0时代。新的媒体形态层出不穷,每一个新媒体形式的出现都意味着Web2.0的普及和网络的进步。进入2010年,Web2.0更是狂飙突进,中国网民的参与度和活跃呈现爆炸式增长,这一情况的出现,与一种新媒体形态的诞生不无关系—微博。 网络与传统的博客相比,微博发布更便利、传播更迅速,发布字数限制在140字之内,方便用户通过电脑、手机等多平台浏览发布,所发布信息是传达,并可一键转发。微博相比传统博客那种需要考虑文题、组织语言修辞来叙述的长篇大论,以“短、灵、快”为特点的“微博”几乎不需要很高成本,无论你是用电脑还是手机,只需三言两语,就可记录下自己某刻的心情、某一瞬的感悟,或者某条可供分享和收藏的信息,这样的即时表述显然更加迎合我们快节奏的生活。微博微博客草根性更强,且广泛分布在桌面、浏览器、移动终端等多个平台上,有多种商业模式并存,或形成多个垂直细分领域的可能。微博更符合现在人的生活节奏和习惯。而新技术的运用使得用户更容易对访问者者留言进行回复,从而形成良好的互动关系。导致微博时代快速来临。微博已经成为门户网站标志性产品。 二、新浪微博SWOT分析 (一)概述 相对于新浪微博而言,Twitter诞生的更早,而业界中也一直有人认为新浪微博是Twitter的模仿者,但从双方对产品的定位、关注的业务特征、采取的发展策略以及总体的经营思路而言,新浪微博可以被认为是一个包含了Twitter 相关功能的新平台,其更为强调的是自身的媒体特性,以及服务于社交的目的。而Twitter期初更多的是,将传统手机短信息服务转换为以互联网载体的一个形式转换。应该说新浪微博与Twitter之间不存在谁模仿谁的问题,虽然双方都在

中文微博情感分析评测结果(2012)

2012年CCF自然语言处理与中文计算会议 中文微博情感分析评测结果 1.提交结果编号 本次评测共有34支队伍提交53组有效结果,提交结果编号及所属参评单位对应情况如表1所示。 表1 提交结果编号与参评单位对照表 提交结果编号参评单位 1 北京工商大学 2 北京工商大学 3 北京航空航天大学计算机学院 4 北京航空航天大学计算机学院 5 北京理工大学海量语言信息处理与云计算应用工程技术研究中心1 6 北京理工大学网络搜索挖掘与安全实验室 7 北京理工大学海量语言信息处理与云计算应用工程技术研究中心2 8 北京理工大学海量语言信息处理与云计算应用工程技术研究中心2 9 大连理工大学 10 大连理工大学 11 广东工业大学DMIR实验室 12 哈尔滨工业大学语言技术研究中心网络智能研究室 13 哈尔滨工业大学语言技术研究中心网络智能研究室 14 哈尔滨工业大学计算机科学与技术学院/机器智能与翻译研究室 15 哈尔滨工业大学计算机科学与技术学院/机器智能与翻译研究室 16 哈尔滨工业大学(威海) 17 海军工程大学信息安全系 18 黑龙江大学计算机科学技术学院 19 湖南工业大学计算机与通信学院 20 湖南工业大学计算机与通信学院 21 湖南科技大学外国语学院 22 华侨大学计算机科学与技术学院 23 华侨大学计算机科学与技术学院 24 华中科技大学 25 南京大学计算机科学与技术系自然语言处理研究组 26 南京理工大学 27 南京理工大学 28 清华大学计算机系智能技术与系统国家重点实验室信息检索组 29 清华大学计算机系智能技术与系统国家重点实验室信息检索组 1参评队伍联系人为刘全超 2参评队伍联系人为王金刚

微博营销成功案例分析定稿版

微博营销成功案例分析 HUA system office room 【HUA16H-TTMS2A-HUAS8Q8-HUAH1688】

Weimedia--微营销分析 完美“优雅女”营销案例分析 weimedia微媒体平台是华人基业公司旗下核心业务之一,是中国最专业的微博营销平台,是国内最早深入研究微博营销广告技术平台的公司。北京华人基业科技有限公司成立于2004年,总部设立于北京,长期服务于国内300多家知名企业,旗下拥有4大核心自主技术广告平台,定位于互联网全程效果整合营销专业服务,拥有大批互联网营销、管理、技术等专业人才、优质媒体资源和自主核心技术平台。 网络营销的方法和案例非常多,在较为浮躁的中国互联网环境下,一个好的创意是网络营销活动中最主要的灵魂。去年的“贾君鹏事件”就是一个非常好的创意,也用事实说明了事件营销的效果和所产生的推动力,往往比其他营销方法要好的多。今天我就具体以最近发生的一起事件营销“后宫优雅事件”为例,来分析一下在社会化网络环境下的微博事件营销的过程和方法。 事件营销策划 事件营销就是通过制造具有新闻价值的事件,并让这一新闻事件得以传播,来转弯抹角的做广告,达到广告的效果。比如某公司要推广某一款网络游戏,使用知名度高的明星代言往往需要较高的费用,推广时候的广告费也不菲,而如果通过事件营销的方式打造一个知名度很高的网络红人来代言这个网络游戏,不仅仅可以节省大量费用,还以低廉的成本进行了网络推广营销。

营销策划人可谓用心良苦,从去年12月就开始计划利用互联网来打造这个具有较高知名度的“网络红人”—“后宫优雅”。这个案例的营销平台选择的是“新浪微博”,这是一个2009年后半年开始逐渐热闹起来的社会化网络平台,注册用户约有几十万,有不少“名人”入驻。由于网络的虚拟性和匿名性,注册的微博用户背后的身份往往无从知晓,于是做好几方面准备之后就可以开始进行事件营销。 事先的准备工作包括,寻找一个虚拟的“网络美女”,并预备几十张左右的自拍照片,然后寻找一个写作团队,能够持续地写出有趣的段子。准备好这一切后,就可以开微博帐号进行炒作。微博前期的炒作主要以“美女”、“炫富”、“明星八卦”为着重点,总而言之就是“找骂贴”。典型的症状包括,自称来自“新加坡”,“后宫三千,独我优雅”。号称有私人飞机,认识很多明星,和阿娇去日本泡温泉,被范冰冰专门因为安慰过,经常行来于夏威夷、香港等地,投资几千万给电影《阿凡达》,并与许多大牌娱乐圈艺人私交甚好等等。 值得一提的是,该微博的写作团队具有较高的文案写作水准,在初期炒作阶段,发表的段子非常诙谐幽默,颇具有娱乐效果,可读性很高,使得不少新浪微博的名人都转发其段子,在12月中旬时,“后宫优雅”具有了约四千左右的粉丝数。 平媒介入 12月下旬,平面媒体、报刊杂志开始报道和炒作“优雅女”,使得“后宫优雅”的知名度急剧上升,并在2009年12月29日达到了一个小高峰,用户关注度增长惊人,搜索量也开始猛增,也开始有网友对其进行人肉搜索,“后宫优雅”的微博在29日粉丝数

微博营销成功案例分析

Weimedia--微营销分析 完美“优雅女”营销案例分析 weimedia微媒体平台是华人基业公司旗下核心业务之一,是中国最专业的微博营销平台,是国内最早深入研究微博营销广告技术平台的公司。北京华人基业科技有限公司成立于2004年,总部设立于北京,长期服务于国内300多家知名企业,旗下拥有4大核心自主技术广告平台,定位于互联网全程效果整合营销专业服务,拥有大批互联网营销、管理、技术等专业人才、优质媒体资源和自主核心技术平台。 网络营销的方法和案例非常多,在较为浮躁的中国互联网环境下,一个好的创意是网络营销活动中最主要的灵魂。去年的“贾君鹏事件”就是一个非常好的创意,也用事实说明了事件营销的效果和所产生的推动力,往往比其他营销方法要好的多。今天我就具体以最近发生的一起事件营销“后宫优雅事件”为例,来分析一下在社会化网络环境下的微博事件营销的过程和方法。 事件营销策划 事件营销就是通过制造具有新闻价值的事件,并让这一新闻事件得以传播,来转弯抹角的做广告,达到广告的效果。比如某公司要推广某一款网络游戏,使用知名度高的明星代言往往需要较高的费用,推广时候的广告费也不菲,而如果通过事件营销的方式打造一个知名度很高的网络红人来代言这个网络游戏,不仅仅可以节省大量费用,还以低廉的成本进行了网络推广营销。 营销策划人可谓用心良苦,从去年12月就开始计划利用互联网来打造这个具有较高知名度的“网络红人”—“后宫优雅”。这个案例的营销平台选择的是“新浪微博”,这是一个2009年后半年开始逐渐热闹起来的社会化网络平台,注册用户约有几十万,有不少“名人”

入驻。由于网络的虚拟性和匿名性,注册的微博用户背后的身份往往无从知晓,于是做好几方面准备之后就可以开始进行事件营销。 事先的准备工作包括,寻找一个虚拟的“网络美女”,并预备几十张左右的自拍照片,然后寻找一个写作团队,能够持续地写出有趣的段子。准备好这一切后,就可以开微博帐号进行炒作。微博前期的炒作主要以“美女”、“炫富”、“明星八卦”为着重点,总而言之就是“找骂贴”。典型的症状包括,自称来自“新加坡”,“后宫三千,独我优雅”。号称有私人飞机,认识很多明星,和阿娇去日本泡温泉,被范冰冰专门因为安慰过,经常行来于夏威夷、香港等地,投资几千万给电影《阿凡达》,并与许多大牌娱乐圈艺人私交甚好等等。 值得一提的是,该微博的写作团队具有较高的文案写作水准,在初期炒作阶段,发表的段子非常诙谐幽默,颇具有娱乐效果,可读性很高,使得不少新浪微博的名人都转发其段子,在12月中旬时,“后宫优雅”具有了约四千左右的粉丝数。 平媒介入 12月下旬,平面媒体、报刊杂志开始报道和炒作“优雅女”,使得“后宫优雅”的知名度急剧上升,并在2009年12月29日达到了一个小高峰,用户关注度增长惊人,搜索量也开始猛增,也开始有网友对其进行人肉搜索,“后宫优雅”的微博在29日粉丝数增长到八千多。经过人肉搜索,网友发现“优雅女”的身份真实性存在很大疑问,有人称其照片为盗用他人照片,而“优雅女”则发帖称自己的相册被盗了。 围观吹牛

024047中文文本情感倾向性分析

中文文本情感倾向性分析1 黄萱菁 赵 军 复旦大学 关键词:情感倾向 语料库 引言 大约在两年半前,《新华网》、《环球时报》等大众媒体纷纷转载了英国《新科学家》杂志的一则报道,英国Corpora软件公司开发了一套名为“感情色彩(Sentiment)”的软件2,它能判断报纸刊登的文章对一个政党的政策是持肯定态度还是否定态度,或者网上的评论文章是称赞还是贬低一种产品,并以此帮助政府和一些大公司全面了解公众对他们的看法。这则报道之所以引起了舆论的广泛关注,是因为它介绍了一个非常新颖而又很有价值的研究方向—文本情感倾向性分析。 所谓文本情感倾向性分析,就是对说话人的态度(或称观点、情感)进行分析,即对文本中的主观性信息进行分析。由于立场、出发点、个人状况和偏好的不同,民众对生活中各种对象和事件所表达出的信念、态度、意见和情绪的倾向性必然存在很大的差异。在论坛、博客(blog)等反应草根观点的网络媒体上,这种差异表现得尤为明显。 长期以来,要了解关于某个问题的报道是正面的还是反面的,是消极的还是中立的,往往需要求助于调查公司。这些公司的员工仔细阅读有关某个机构、个人、事件或问题的所 1 本项研究受国家自然科学基金课题资助(60673038,60673042)。 2 https://www.360docs.net/doc/c97734031.html,/products/sentiment.aspx 图1 英国Corpora软件公司的“感情色彩(Sentiment)”的软件

专题报道 有文字,然后就这些评论的态度做出反馈。这不仅耗费了大量人力和财力,而且过程相当缓慢。由此可见,文本情感倾向性的自动分析具有很好的商业应用前景。 文本情感倾向性分析属于计算语言学的范畴。以前,在计算语言学以及相关领域,研究人员普遍关注的是客观性信息的分析和提取,对主观性信息分析与提取的研究尚处于起步阶段,其中存在的很多问题都需要进行全面探索。这项研究涉及到计算语言学、人工智能、机器学习、信息检索和数据挖掘等多方面研究内容,因此文本情感倾向性分析也具有重要的学术研究价值。 总体来看,文本情感倾向性分析的研究大致可以分成词语情感倾向性分析、句子情感倾向性分析、篇章情感倾向性研究以及海量信息的整体倾向性预测等四个研究层次。接下来将首先介绍在各个层次所取得的研究进展,其次介绍情感倾向性分析标准语料库的建设和系统评测,最后是本文的结论。 词语情感倾向性分析 对词语的情感倾向进行研究是文本情感倾向分析的前提。具有情感倾向的词语以名词、动词、形容词和副词为主,包括人名、机构名、产品名、事件名等命名实体。其中,除部分词语的褒贬性(或称为极性,通常分为褒义、贬义和中性三种)可以通过查词典3的方式得到之外,其余词语的极性都无法直接获得。此外,词语的情感倾向还包括倾向性的强烈程度。例如,“谴责”的强度就远远超过了“批评”和“指责”,而这种强度很难由词典编撰者用人工的方式进行量化。另外,词语的极性往往取决于特定的上下文环境,例如,“骄傲”在表示“自豪”概念时,是褒义词;而在表示“自满”概念时,则是贬义词。 词语情感倾向分析包括对词语极性、强度和上下文模式的分析。其分析结果甚至可以写入到语义词典中,如北京大学计算语言学研究所以基于人民日报基本标注语料库的真实文本为实例,进行统计归纳得到词语的情感倾向,而后在现代汉语语法信息词典中实现形式化[1]。词语情感倾向分析目前主要有以下三种方法:1.由已有的电子词典或词语知识库扩展生成情感倾向词典。英文词语情感倾向信息的获取主要是在WordNet4和General Inquirer5的基础上进行的文献[3-4] ;而中文词语情感倾向信息的获取依据主要有HowNet[5]。这种方法的主要思想是,给定一组已知极性的词语集合作为种子,对于一个情感倾向未知的新词,在电子词典中找到与该词语义相近并且在种子集合中出现的若干个词,根据这几个种子词的极性,对未知词的情感倾向进行推断。这种方法对种子词数量的依赖比较明显。 2.无监督机器学习的方法。这种方法与第1种方法类似,也是假设已经有一些已知极性的词语作为种子词,对于一个新词,根据它和种子词的紧密程度对其情感倾向性进行推断。不同的是,第1种方法的词语紧密程度的度量是以词典信息为依据判断,而这种方法是根据词语在语料库中的同现情况判断其联系紧密程度。根据文献[6-7]的经典方法,假设以“真”、“善”、“美”作为褒义种子词,“假”、“恶”、“丑”作为贬义种子词,则任意其它词语的语义倾向定义为,将与各褒义种子词的点态互信息量(Point of Contact Information,PMI)之和,减去与各贬义种子词的点态互信息量之和后所得的结果。语义倾向的正负号就可以表示词语的极性,而绝对值 3 例如,General Inquirer [Stone,1966],知网:heep://https://www.360docs.net/doc/c97734031.html, 4 WordNet 5 通用查询者,最早为KWIC编写的程序之一,该程序根据基于理论编写的词典给单词分类。

相关文档
最新文档