关于微博信息传播影响因素的研究——以新浪微博为例

关于微博信息传播影响因素的研究——以新浪微博为例
关于微博信息传播影响因素的研究——以新浪微博为例

关于微博信息传播影响因素的研究

——以新浪微博为例

2012年3月20日

【摘要】网络时代的信息狂潮中,信息的分享度的差异巨大。了解信息传播的影响因素有着理论上和现实上的重要性,而目前对这一问题的研究比较零散,大都停留在简单观察总结的阶段,本研究以被广泛接受的流行三要素理论为出发点,依托微博,对影响信息传播的诸要素进行实证研究。数据样本来自合理抓取的微博,利用计算语言学的方法进行切词、过滤等操作,并对数据样本进行量化,采用网络计量模型进行实证分析。本研究发现对于微博类平台上的信息传播,流行三要素理论同样适用,但其独有的特点是用户特征的影响显著大于内容特征。本研究从实证上加深了对微博信息传播特性的理解,对于微博营销策略、识别僵尸粉等实际问题给出了指导意见,并对未来的研究方向进行了展望。

【关键词】信息传播微博网络计量

Research on In?uencing Factors of information disseminationg on Micro-blog

–taking Sina Micro-blog as an example

2012.3

Abstract In the frenzy of the Internet age,the degree of di?erence on sharing of infor-mation is enormous.Understanding of in?uencing factors of the information dissemination is of both theoretical and realistical importance,but current reasearches on this issue remain in the ?eld of simple observation summary.In view of the widely accepted prevalence of The Three Rules of Epidemics,we use it as our assumption,relying on Sina micro-blog to carry out an em-pirical research on the various factors a?ecting the dissemination of information.Data samples are from a reasonable selected micro-blogging,and we use computational linguistics methods of segmentation,?ltering and other operations to quantify the data samples.Afterwards,we use the data samples to build a webometrics model for empirical analysis.This study found that the celebrated“Three Rules of Epidemics”is equally applicable for the dissemination of information on the micro-blogg platform,while its unique feature is that the impact of user characteristics is signi?cantly greater than the content features.Theoretically,this study has deepened our understanding of the characteristics of the dissemination of information on the micro-blogg;Empirically,this study o?ers suggestions about micro-blog marketing strategy and zombie fan identifying.In the end,implications of future research are given.

Key Words Information Dissemination Micro-blog Webmetrics

1

目录

1引言4

2文献综述4

2.1流行三要素理论 (4)

2.1.1关键人物法则 (5)

2.1.2附着力法则 (6)

2.1.3环境威力法则 (6)

2.2信息计量学和网络计量学 (6)

3研究方法7

3.1数据的提取与初步分析 (7)

3.1.1原始数据提取 (7)

3.1.2简单数据提取 (7)

3.1.3热门词汇分析 (8)

3.1.4情绪处理 (9)

3.2数据分析 (9)

3.2.1研究变量 (9)

3.2.2回归分析 (11)

3.2.3回归结果 (11)

3.2.4数据解释 (12)

4相关讨论12

4.1关键人物的影响 (12)

4.1.1粉丝数的影响 (12)

4.1.2用户活跃程度的影响 (13)

4.1.3身份认证的影响 (13)

4.2外部环境的影响 (13)

4.3内容附着力的影响 (14)

4.3.1关键词影响指数 (14)

4.3.2微博内容的字数 (15)

4.3.3微博携带的图像信息 (15)

4.3.4情绪 (16)

4.3.5链接因素 (16)

5结论16

6实践意义16

6.1微博营销 (16)

6.2微博水军和僵尸粉的发现 (17)

7不足与展望17

7.1本研究所存在的不足 (17)

7.2后续研究的展望 (18)

A附录:情绪词表20

1引言4

1引言

每个人都有与他人分享故事、新闻等信息乃至自己的心情的欲望。网络出现以前,我们的的信息渠道是平面媒体,尽管我们可以在咖啡厅、洗手间和饮水机前进行小范围的信息交流,但主流的信息发布方式是不平等的,话语权不向无名群体开放,这个时候的信息传播遵循帕累托(Pareto)提出的“80/20”定律[1];

网络出现以后,信息的传播进入了新的时代,最早出现的是web1.0模式,其合流的结果就是提供前所未有的巨大信息流的门户网站,然后出现了BBS,百度贴吧,将信息发布的权力送到每个可互联的人手中。而今天则是Web2.0的时代,信息发布的主动权完全开放,我们每天都有大量的时间投放在人人、微博、Facebook上,网络互动使得与他人分享信息变得无比快捷。但与此而来的问题却是严重的:网络的平等化使得我们之中的任何一个人都有能力上传自己的信息,便捷的信息发送方式释放了我们发送信息的惊人能力,每分钟都有数以百万计的信息上传到各种SNS网站,传统的“80/20”定律被安德森(Anderson)提出的“长尾理论”

[2][3]所取代,在信息分布的长尾部分我们的信息面临沉重的竞争压力:在令人咂舌的信息狂潮中,信息的分享度的差异同样巨大:有的帖子会被疯狂转发,甚至引导一周内的话题走向;与之相较,另一些帖子默默无闻,引不起一丝波澜。

那么究竟是什么主导了信息的传播?果壳网上曾挂出一个著名的疑问(http://www. https://www.360docs.net/doc/066968641.html,/article/49912/):“郭美美的故事为何在网络上迅速传播?一条“豆腐脑是甜是咸”的微博为何被疯狂转发?为何‘我们爱讲冷笑话’长期稳坐微博‘草根榜’榜首?”作为生活中的普通人,我们关心自己的微博状态、人人状态怎样才能被好友关注,自己的体验和情绪怎样才能感染到他人;作为社会意见表达者的热血青年,我们关心自己的质疑、呼吁如何被更大范围的人感知,从而引起社会层面的反响;作为产品推广的营销人员,我们关心自己的广告描述如何被大量转载,从而到达自己的目标客户...

这样的问题现实而又紧迫,但是相关研究往往是零散的、简单的观察总结,而定量化的研究因为驱动力的因素往往倾向于商业化,并且其中最重要的成果既不公之于众,又有特别局限的针对性。同时考虑到目前被广泛接受并在传统电视媒体中得到实证验证的流行三要素理论对这一课题的适应性,以及信息计量学和网络计量学所发展出的成熟的理论分析技术,所以我们决定采用上述两种理论,并在受众最为广泛的SNS网站方面进行定量化的实证研究,以期找到影响信息传播的关键因素。

2文献综述

2.1流行三要素理论

流行三要素理论在Malcolm Gladwell所写的Tipping Point[4]一书中有着系统的阐述,三种要素分别被称为:关键人物法则(The Law of the Few)、附着力法则(Stickiness Factor)、环境威力法则(Power of Context),下面分别予以阐述:

关键人物法则指出了这样的社会信息交流的事实:社会上绝大多数人构成的社会主体在进行决策时所依据的信息只来自于一小部分影响者组成的群体,而这个影响者群体在社会网络中与其他人没有明显的等级差别。这个结果在社会网络理论中有着重要的意义,从而得到了广泛而深入的研究,哥伦比亚大学的Andrea Galeotti和Sanjeev Goyal对这法则给出一个博弈论的模型,并进行了严格的数学证明[5]。

具体到信息传播,该法则指出有3类人在整个传播中起到关键性作用:内行(Mavens)、联系员(Connectors)和推销员(Salesmen),是他们发起并带动了整个传播过程:内行们相当于数据库,为大家提供信息;联系员是粘合剂,将信息传播到各处;推销员则负责“最后一公里”,说服人们接受该信息。

内行是指那些在某些领域积累有丰富知识的人,他们的丰富经历和权威认证提高了信息阅读者对信息的信任度,很多被大量转载的微博状态都来自某种意义上的“内行”,他们或是某行业的知名从业人员,发布关于该行业的内部信息,或是人们所关心话题的公认专家,发布对于该话题的权威意见,或是相关部门的发言代表,发布热点问题的官方意见...内行们聚集并提供了最重要的信息,开始形成数据库。在微博这个具体的信息发布平台上,我们可以清晰地看到内行的作用——名人效应,事实上,新浪微博的成功在一定程度上来自于名人微博的创意[6],各个领域的名人受到高度的关注,其发布的信息往往迅速传播,并成为一定时间内的话题导向。

联系员是那类富有社交天赋的人,其人际关系可能同时涉及到几大领域。关于这个问题有著名的“六度分隔(Six Degrees of Seperation)”理论[7],该理论指出世界上任何两个人之间的间隔平均仅为六度;但作者指出,并不是每一个人都与其他人之间仅存在六度之隔,它的实际意义是有个别一些人与其他所有人相隔仅几度,而大部分人就是通过这几个人与世界联系起来的。“一个思想或一种产品离联系员越近,这种想法或产品推广的势头或可能性也就越大。”同样的,一条信息在发布之后被联系员角色转发之后就会迅速扩展其受众面,实际经验也表明,很多情况下,一条信息在某个关键人物的转发之后,其传播速度和广度发生跳跃,这就是联系员的作用。此外,在Web2.0的理念下,SNS网站充分显示了六度分隔理论中所谓“弱纽带”的威力,事实上,网络社交平台就是依赖“弱纽带”关系建立起来的[8],微博让永远无法相遇的人跟踪彼此的动态,人人网使人们有效地管理不常联系的熟人,社会学家格兰诺维特(Mark Granovetter)指出,弱纽带是新信息和新思想的主要来源[9],这是我们信息传播极为重要的一环。

推销员是指那些能说服你的人,他们或许不是知识丰富的内行、也不是社交广泛的联系员(当然也有可能同时兼有内行或联系员的身份,甚至三者合一),但他们能解决这“最后一公里”,说服人们接受信息。信息能不能真正病毒式的扩散出去,最最重要的一点是有多少强有力(说服力)的推销员在为此努力,对应到微博状态的传播,就是阅读人的评论。正如我们在网上购物时要查阅顾客评价,我们在考虑是否认真阅读甚至转发一条状态时,他人的意见是很重要的一环,这种从众的潜意识在某种程度上左右了我们的一部分信息传播行为,这也是很多微博谣言之所以能够借由推手策划得以迅速散播的原因[10]。

流行三要素理论的第二个法则是附着力法则。个别人物法则揭示的是人们传播信息的行为,而附着力法则则阐述了被传播信息的本身特征;在同等条件下,附着力越高的信息引爆流行的可能性越大。所谓附着力,就是人们得到信息后,对其留下了多大的印象、有没有采取相应的行动、以及采取行动的程度如何。信息时代产生的巨大信息量使得信息的附着力成了难题。在Tipping Point一书中,作者重点分析的一个实证研究就是在附着力方面,这个实证研究就是著名的“芝麻街(Sesame Street)”电视媒体实验[11]。

学界对信息附着力的研究,将其中最重要的要素概括为六个方面(Six character-istics of sticky messages):简洁性(simplicity)、不可预期性(unexpectedness)、具体性(concreteness)、可信性(credibility)、情绪性(emotions)、叙事性(stories)[12]。附着力的六个要素在我们阅读信息时都能深切体会到:简短的信息更容易被认真阅读,爆炸性的新闻会引起强烈的关注,热点高频新闻词的出现更加吸引眼球,还有各种咆哮体、凡客体、淘宝体等等,我们的信息接收行为被这六个因素强烈地引导,相关的调查研究也在实证上确认了这一点。

2.1.3环境威力法则

流行三要素理论的最后一个要素是环境威力法则。根据环境因素的差异,环境威力法则可分为“破窗理论”和“150法则”两部分。破窗理论(Break Pane Law)[13]阐述的是具体情境对人的行为的影响,进而产生对信息传播的影响,其理论核心是“犯罪是秩序混乱的必然结果”。该理论指出人们习惯于从内在特征来解释事物,而忽略了具体情境所起的作用,但是人的行为是社会环境的作用,外部环境决定着我们的心态。在微博类信息的阅读转发行为中,一些环境因素尤为突出,比如信息转发在一天中的固定时段、在一周的周末产生高峰,在这些信息阅读转发的高峰段发布信息,被关注和传播的可能性将大大提高。此外,一些网站版面的设计,比如分享按钮的设置,信息呈现的形式,都强烈地影响信息的传播特性。

与破窗理论阐述的相对共性环境影响不同,150法则(Rule of150)[14]揭示了相对个别环境的影响--群体环境。心理学家指出,人们在人群中考虑得出的结论,往往与他们独自一人时得出的结论截然不同--这是因为当人们成为群体中的一员时,就很容易感受到来自身边众人的压力、社会规范和任何其他形式的影响。任何新兴的、意识形态的传播都要借助于这种群体力量,例如BBS社区就是其中一种方式。

150法则进一步指出,群体环境的影响力并不是无止境的,所谓“群体”,它存在一个极限数量--150,这个数量在科学上的解释是,因为受“社会通路容量”制约,人类大脑只能处理大约150人左右的群体关系[15];也就是说,当一个“群体”的活跃人数超过了150人时,群体对成员的影响力开始下降。对应于本课题的研究,150法则的意义在于解释信息传播的起伏模式,信息传播爆发点和衰落点的出现。这将在google trends的研究中有鲜明的体现

2.2信息计量学和网络计量学

信息计量学也叫情报计量学,最初是由前联邦德国学者奥托纳克(Nacke,O)在1979年提出的[16]。目前分为4个大的分支–文献计量学、科学计量学、信息计量学、网络计量学。

1997年T.C.阿曼德(Tomas C.Almind)首次提出了“网络计量学(Web/Cybermetrics)”概念[17],将传统文献计量方法使用在Web分析上。网络计量学是应用文献计量学及网络挖掘等信息技术,对网上信息的组织、存储、分布、传递、相互引用和开发利用等进行定量描述和统计分析,以揭示其数量特征和内在规律的一门新兴分支学科。

网络计量学通常可统计诸如语言、单词、词汇、频次、作者特征、作者合作的能力和程度,还有对作者的引文分析,学科或数据库增长的测量,新概念、新定义的增长、信息的测量、信息措施的形式与特征等信息。

网络信息的急速膨胀为网络计量学提供了广阔的“用武之地”,统计与分析结果对于指导信息资源的组织管理、完善网络信息检索、满足用户需求等许多方面都有实践意义。

3研究方法

3.1数据的提取与初步分析

3.1.1原始数据提取

我们的数据来源为新浪微博。原始数据分为两部分:普通微博和热门微博。普通微博即为在一段时间内的所有微博中随机抓取了一部分,作者和题材都很分散,可以代表整个微博数据的状态。热门微博来自新浪微博官方统计的转发数热门排行榜,转发量从几百到十余万不等,主要来自于名人言论,官方发布,热门事件和一些大众话题等。之所以使用两种数据来源,是因为官方的统计资料分布于转发数比较大的区域,不能反映一般用户的真实情况;而如果只随意抓取数据,则获得的资料可利用性又较低,可能混入过多的垃圾数据。而且两种来源的数据,为之后进行的分组别统计和研究提供了直接分类法,即考察在转发数分布较高处和较低处的不同规律。以下的数据提取和分析,如未说明则都是把这两个样本分别做的。

由于新浪微博本身的限制和出于对服务器的礼貌协议,我们仅抓取了自2010年12月29日至2012年2月14日的热门微博30381条,以及普通微博7858条。抓取过程采用了Python 脚本和PyQuery开源库作为支持。详细抓取算法这里不再赘述。

3.1.2简单数据提取

从原始数据中,我们提取出了如下几个数据:

1.微博发布人信息,包括:发布人的粉丝数、关注人数、已发微博数、是否“加V”(意为

是否是新浪认证用户)。

2.微博发布时间信息,包括:微博发布的年、月、日、时、分、星期几、距2012.2.14的天

数。

3.微博基本信息,包括:微博的转发数、评论数、是否包含“@”(意为提及某个新浪用

户)、包含“#”(意为标签)的数量、是否包含图片、是否包含网址、微博长度(并不是所占字节数,而是本身的内容长度,即:每个汉字、英文字母、标点符号都算作一个字)。

3.1.3热门词汇分析

为了能够量化地度量热门词汇的量进而分析热门词汇和转发量的关系,我们使用了Google Trends作为指标。然而出于对GoogleTrends服务器的礼貌控制,我们只能对有限数量的词取出其Trends值。于是这里面需要对最能影响内容的词语进行一个判断与过滤。同时,热门词汇是以词为单位的处理,而把微博的内容转换为词语,需要用到中文分词技术。

1.中文分词

与英语等拉丁语言不同,汉语没有空格这种自然的词语划分间隔,所以需要使用分词系统来将句子转化为词语的集合。我们使用的是SCWS(https://www.360docs.net/doc/066968641.html,/scws/)开源中文分词系统,把微博切分成单独的词,并且得到了词的词性。初步分词后,我们得到了76220个词汇。这个词汇量过多,并且有很多没有价值的,需要进行过滤。

2.初步过滤

对于数词、代词、助词等常用但无核心意义的词语,我们会首先滤掉。这部分词在信息检索中被称为停留词(Stop Word)。在这部分被过滤的词如:的(目的这样的词不会因为这个被过滤)、大家、么等等。进行初步过滤后,剩下了69313个词汇。

3.进一步排序

然而这样的规模还是过大,我们需要对这批词汇进行一个排序,已得到最应该优先获取其Trends值的列表。这里面需要介绍一个非常重要的概念:IDF(Inversed Document Frequence)。首先介绍一下总词频(N)和文档频率(df)。

N:总词频。是指某个词在所有文档里面出现的次数。这能从很重要的一方面说明一个词语的重要程度。但这样,一些很常用的词语也会被算入,比如“的”这样的词,在我们抓取的微博里面出现了十万次左右。根据Salton的工作[18][19],我们需要使用另一个量来使得这种级别的常用词不会如此明显。

df:文档频率。指出现了某个词的文档数目。这里的每一个文档,在我们的研究中就是一条微博。

于是,有重要的经验公式定义idf:

id f=ln N

d f

(1)

这个idf就能够表征一个词真实的重要程度。而我们这里,为了同时反映其热门程度,使用了idf·log(N)作为排序依据。

4.Google Trends

由此,我们编排除了一份2000词的热门关键词列表。我们从https://www.360docs.net/doc/066968641.html,/ trends/获取了这份热门关键词列表的Google Trends值,用此值来衡量关键词在一段时间内的热度。

Google Trends是Google公司推出的一个产品,它用来分析关键词在Google上的搜索量随时间地点的变化趋势。我们采用的具体数值是“?xed mode”下,Google Trends值在最近一段时间内的平均值。“?xed mode”是指对数据做了这样的定标:设1.0为一个

特定月份的平均搜索量,其他月份的搜索量除以此固定月份的搜索量即可得出该月的Google Trends值。因此由这样得出的Google Trends值即可反应出关键词在最近一段时间内的搜索热度,用来代表该关键词在网络上出现的热度是合理的。

最后,我们把每条微博中出现的热门词汇的Trends值加起来,得到了其内容的关键词热度。另外,因为人名以及地名也会对结果有影响,但是关键词列表中无法包含所有的人名地名,故把词性为nr(人名)和ns(地名)的词的Trends值直接定为0.1一起加到总的Trends和当中。

3.1.4情绪处理

我们依据情绪状态问卷POMS对情绪的分类将其分为正性情绪与负性情绪[20],并综合微博中出现的全部表情词汇,列出相应的情绪词表。例如,高兴、好受、开心等为正性情绪词;怒、愤慨、愤怒等为负性情绪词。完整词表见附录1。我们对所有微博分别统计了出现正性情绪词和负性情绪词的次数,作为2个参量。

3.2数据分析

根据前文所依据的“流行三法则”理论,我们将因变量分为三大类:分别是与发微博人(关键人物)有关的因素,与微博内容无关的外在属性(环境威力)因素,微博的内容和技巧(附着力)因素。

利用统计和信息计量方法,对各变量进行模型设定和回归实证,探讨微博转发数与以上三大类因素是否有关及相关系数的大小,并且研究在不同的用户人群中这种关系的不同。

3.2.1研究变量

本研究依据流行三要素理论,分别考察三种要素对信息传播程度的影响。其中,关键人物包含微博发布人的社会影响、活跃程度以及是否获得认证三个维度;环境威力包含微博发布时间、发布日期以及距今时间三个维度;附着力包含微博内容的影响力指数、微博字数、以及情绪三个维度。

因变量:微博转发数TransNum

如何衡量一条微博所携带的信息的传播程度?其转发数无疑是最直接和罪有说服力的考量,并且十分容易取得。纵观采集到的的数据,转发数从0到几百上千分布,其中所反映的信息传播的畸形差距也显然可见。

与转发量相似的还有“评论量”这一特殊的因素,并且其本身也体现了以上三大因素的作用,即评论量与转发量是同一类型的数据,但由于其对信息传播的贡献并不大,反而更体现了用户作为个体的交流,因此不是我们选择的首要观察因素。

“关键人物”–微博作者因素

1.发布微博人的社会影响Fans:统计量是发布微博人的粉丝数。粉丝数是表征一个用户受

关注程度以及其自身社会认知的最直接客观的变量。由于发布的微博只能被自己的粉丝

及时看到,因此粉丝数代表了有可能转发此微博的用户数目,是我们考核的转发数的基数变量,十分重要。

2.发布微博人的活跃程度Act:统计量是发布微博人的已发帖量。一个用户越活跃,则其可

能获得的关注也越多,并且发布的微博数越多,用户有可能在内容和技巧等方面有更多经验,因此也会和转发数产生关系。

3.发布微博人的认证Iden:虚拟变量,根据是发布人是否被新浪官方加V标志,加V时

取1。该虚拟变量从一个侧面反映了发布微博人的社会威信,并且考量新浪加V的影响也是有意义的。

“环境威力”因素–与微博内容无关的外在属性

1.发布微博的时间WorkT和SleepT:将一天中的24小时根据一般生活习惯分为三个区间

段–工作时间9:00到17:00,晚上活动时间17:00到凌晨1:00,睡眠时间是1:00到9:00。

因此设置两个虚拟变量WorkT和SleepT,取1时代表处于工作时间段和睡眠时间段,根据结果比较三个时间段的不同影响。

2.发布微博的日期Weekend:对1的一个修正,因为在周末人们的活动并不严格受1中

划分的限制,因此加入一个虚拟变量Weekend表征是否发帖时间在周末(周六和周日),取1时在周末。

3.发布微博距今时间T:一条微博内容在某一时刻的转发数应当与其自发出到该时刻的时

间有关,以天数计量T。

“附着力”因素–微博的内容和技巧因素

1.微博内容的关键词影响指数Key:这是比较关键的因素,较大程度上反映了该微博的主

题指向、涵盖范围和涉及面等。首先利用中文分词算法对收集来的微博语料进行处理,切分出核心词汇(具体算法和思路见上文所述);之后对这些词汇中的高频部分进行人工筛选,目的是排除一些由于算法不完善导致的问题,如与具体内容无关的高频词汇等;

再通过由google公司提供的trends搜索功能,获得某个关键词的社会影响度,一个词被人群搜索的频率足够反应其受关注程度;最后对一条微博内容的所有关键词影响度进行加总,作为其总关键词影响指数Key。

2.微博内容的附加信息:关键词只衡量了微博的文字信息内容,除此之外一条微博还包括

许多附加信息,如图像、链接和对他人的引用(微博系统特有的@功能)等,从而增加以下三个虚拟变量:

Img:取1代表该微博内容含有图片或视频信息

Link:取1代表该微博内容含有向外的网页链接

At:取1代表该微博内容中有@了其他用户

3.微博内容的字数Words:考虑到微博限制了140字的篇幅,因此信息的聚集量比较大,

我们猜测字数的差别影响也会比较大,因此将其作为一个考量。

4.微博内容的情绪色彩Pos_Emo和Neg_Emo:信息所携带的情绪也对其传播特征有很大

影响,如人群容易受到“讥讽”“愤怒”等情绪的感染。我们依据情绪的效价,将微博涉及的情绪词分为正性情绪词与负性情绪词两个自变量,并依据每条微博中情绪词出现的个数判定其情绪程度。

以上变量中,我们对于数值比较大的粉丝数采取除以1000的处理,方便系数值的观察。

3.2.2回归分析

出于样本量的限制,我们筛选出了约8000条一般微博和约10000条热门微博数据进行实证分析。

分别对一般微博数据、热门微博数据以及总体数据三组进行以下多元线性回归和显著性检验:

TransNum=a1Fans

1000

+a2Act+a3Iden+b1WorkT+b2SleepT+

b3Weekend+b4T+c1Key+c2Img+c3Link+

c4At+c5Words+c6Pos_Emo+c7Neg_Emo(2)

3.2.3回归结果

Variable总体数据TransNum热门微博TransNum一般微博TransNum Fans/10000.457***0.162***0.207***

Act0.107***-0.029***-0.009***

Iden-622.476***-1788.913***32.569***

WorkT462.833***2225.468***-1.840

SleepT100.3291228.554***-0.0384

Weekend-371.772**-523.159* 1.954

T15.042***-3.871***0.038

Key15.082*** 1.910 -0.043

Img Omitted1285.136***Omitted

Link-388.652**-663.769***-18.523**

At1543.403***771.912***-2.487

Words24.412***11.909***0.353***

Pos_Emo102.801-189.703-4.415

Neg_Emo37.53153.261-6.844

Constant558.145***9201.414***-9.283*

Observatons1751196537858

R-squared0.2040.03250.0689

F-test344.89***23.15***44.68****

注:p代表拒绝零假设的概率,显著性程度***p<0.01,**p<0.05,*p<0.1

3.2.4数据解释

由表中可知:

1.微博用户粉丝数对于转发数的影响最为显著,无论是对于热门微博还是一般微博都是如

此,一般而言每增加一万个粉丝,微博平均多转发2~4次。

2.微博用户的活跃度和认证对于转发数的影响虽然显著,但是影响系数较小或是影响方向

并不确定。有趣的一个现象是,官方认证对于微博尤其是热门微博的影响反而是负向的。

3.发布微博的时间分布和星期分布对于转发数的影响并不显著,之所以有的系数显著可能

是大样本与虚拟变量之下的假设检验系统性缺陷导致。不过可以看到的是,在白天发布的微博平均转发数高于半夜发布的微博。

4.发布微博距今的时间对于转发数的影响也并不明显,之所以有的系数显著可能是大样本

与虚拟变量之下的假设检验系统性缺陷导致。

5.关键词影响指数对于转发数的影响不明显。

6.微博携带有影像对于转发数的影响明显,有图片或者视频的微博平均转发数比没有图像

的微博多1285条,但是这只是针对于热门微博的分析,一般性微博中携带图片的很少,可以忽略。

7.微博携带有链接对于转发数有负的显著性影响。

8.微博@其他用户对于转发数的影响存在差异性,之所以有的系数显著可能是大样本与虚

拟变量之下的假设检验系统性缺陷导致。

9.微博的字数对于转发数有显著的正效应,多一个字可能带来十余条的转发增加。

10.情绪对于微博的转发影响很不明显。

11.整体检验显示回归联合显著。

4相关讨论

4.1关键人物的影响

4.1.1粉丝数的影响

经过我们的统计分析,微博用户的粉丝数是与微博信息的传递关系最直接最显著的因素。这与我们日常的观察也很吻合,对于动辄成百上千万粉丝的热门用户而言,几乎每一条微博都有上千次转发,而粉丝只有几十到几百的普通用户则往往是转发寥寥。其中的主要原因可以归结为以下两点:

1.微博用户的粉丝一大部分是喜爱或关心该用户的人,尤其是对于热门明星或是某个特定

爱好群体的代表性微博等,因此粉丝数也可以理解为大众对于和其有关的新闻的关心程度,而且粉丝有比较大的动力去转发,目的是为了表征自己的喜好或引起微博作者关注等。

2.粉丝这一群体在微博特殊的浏览设置下,可以理解或抽象为一个平台,每个用户所面对

的平台并不相同,而粉丝数就是这个平台的大小。因而尽管是在同一个网络系统中,但是用户信息传递的起点就是“不公平”的,而且这种平台效应会随着转发的深入以指数的形式影响着信息的传递,即粉丝中的用户也有粉丝,并且热门用户的粉丝中也会存在热门用户,这种传递效应会不断深入下去,甚至一个重磅消息在短短一天内就可以遍布整个信息网络。热门用户的微博就比如刊登在全国性报纸上的新闻或是核心电视台发布的消息,有着广大的受众和潜在的信息传递者。

而其余两个与微博作者有关的因素则对于信息的传递效用不明显:

4.1.2用户活跃程度的影响

用户的活跃程度是一个历史累计统计,越是活跃的用户,其信息的形成可能越有经验,同时积累的关注度可能更高。但是之所以在分析中不显著,主要原因在于:

1.普通用户的活跃程度与热门用户差异并不大,由结果而言活跃程度也许更多的是与一个

人对微博的依赖程度或是其表达自我的诉求多少有关,而普通的用户在表达自我方面的限制反而更少。

2.活跃程度对转发数存在理论上的一定的负作用,受众肯接受或认真阅读的消息是有限的,

发布的信息过多可能使得用户的选择分散。有的名人用户发布信息的频率很低,但是也许正是由于这种低,使得一旦信息出现,粉丝大多选择转发。

4.1.3身份认证的影响

身份认证这一虚拟变量对于转发数的负作用看似很难理解,但经过对数据的人工观察后,发现了以下两个引起该效果的原因:

1.新浪官方对于用户认证的门槛较低,加V的用户只有数百粉丝的大有人在,无法将此作

为一个划分用户影响力的主要因素。

2.用户认证一般是针对于实体人的用户,而许多热门微博如“可爱动物中心”“我们爱讲冷

笑话”“微博搞笑排行榜”等用户则是不加认证的,这些以一种共同的兴趣诉求等建立起来的抽象用户无法获得认证,但其信息的传递效果却很显著。

4.2外部环境的影响

由于提取数据的限制,能够定量研究的外部环境只有时间相关的变量,主要包括的是发布微博的时间点和微博进行转发的时间段。而两者的影响并不很显著,这与网络媒介的特殊是分不开的:

1.半夜发出的微博并不意味着不会有转发,因为第二天它还是会出现在粉丝们的页面上,

并且考虑到信息传递是不断有时延的,则具体的时间点对其传播特征不会有很大影响。

这与传统的媒体是不同的,一则电视上的广告播出结束后就无法再与观众接触,但网络时代的信息却是不断累积或者说是膨胀的,其存储量与并发性惊人,因此时间的点效应有所消减。

2.正是由于信息传递的时延特性,微博的转发数与发布微博距当时的时间段长度应当存在关联。但之所以表现的不明显,可能的原因是抓取到的微博发布时间范围比较大,由于当间隔时间大于一定值时可能影响就会逐渐消减,因此其中的关联受到双向作用而不明显。

3.对于数据的统计显示,微博转发数与月份、日期、周几、小时等时间因素似乎都没有明显的关系,呈现出一种均匀分布的趋势,这也验证了网络信息系统特性消减时间点效用的观点。有趣的是,唯一波动比较明显的是在3月份和7、8月份的转发数呈现一个小的波峰,我们怀疑这与学生群体的寒暑假有关系。

转发量与各个时间参数的关系图,请见图1至图5。

图1:转发量与月份关系图

图2:转发量与周几关系图图3:转发量与日期关系图图4:转发量与小时关系图

4.3

内容附着力的影响4.3.1关键词影响指数

出乎我们的预料,反映一条微博内容因素的关键词影响指数竟然对转发数并没有显著的作用,在控制了关键人物和外部环境的影响后,内容的作用并不向理论指出的那样重要。转发量与Google Trends 和的散点图见图6。这其中有关的原因大致可以分为两部分:

1.与研究观测有关的原因:一段文本资料的影响力和吸引力是难以衡量的,采用文本分割的方式获取所有的名词并进行手工筛除后的词汇大致可以反应微博内容的主题,而利

图5:

转发量与分钟关系图图6:转发量与Google Trends和的散点关系

用搜索引擎关注度排行度量其具体影响也是目前最为合理的方法之一。但是,这样度量出来的文本内容,无法体现文本的语言技巧和可能隐藏的内在涵义,如热门的“凡客体”“咆哮体”等是一种语言文体的创新而非语言内容。中文语言博大精深,受到用户追捧的微博经常体现了中文双关、蕴涵、指代等幽默元素,这也是现有的文本分析技术无法探及的。

2.与网络时代特性有关的原因:网络时代是一个信息爆炸的时代,也是一个信息泛滥的时

代。互联网的开放性和人们言论自由的表达诉求,使得每一个话题在微博上都能产生亿万计的观点,而这些微博内容的关键词差异并不大,根据简单的文本分析获得的指数也会相似。这反映了网络社区的一个特点,越是热门的话题和事物,参与讨论和评价的用户便越多,因此决定一条特定的热门信息传播的关键因素已经不再是其本质内容,而是发出它的用户的用户特征。例如同样是对于慈善活动的宣传和呼吁,普通人发布的微博影响力远远不及公众名人。而很多普通用户中产生的热门微博,往往是经过热门用户的转发后才获得了广泛传播,热门用户起到了间接的第二作者的作用。

4.3.2微博内容的字数

微博内容的字数对于其转发数有显著性的正影响:

这与微博内容的字数限制密不可分,由于140字的严格文本限制,微博的文字信息密度很大,这也使字数增加带来的信息增加相应增长。而信息传递中的个体,更倾向于选择结构完整、信息携带量大的内容,这也是我们从热门微博文本数据中观察到的结果。此外,随着长微博工具的使用,我们对于字数的统计也存在一定偏差,但是这种长微博的出现也从侧面说明了用户对于一次性传递更多信息量的需求。

4.3.3微博携带的图像信息

微博携带图像信息对于转发数的正效应,见图7::

在文本信息受限和视觉信息日益膨胀的环境下,图片和视频对于微博内容的补充甚至是以图像信息为主的微博无疑会受到用户的欢迎,这种选择偏好与传统媒介中图像的作用是类似的。

5结论16

图7:

转发量与是否包含图片的关系图图8:转发量与是否包含链接关系图

4.3.4情绪

依据流行三要素理论,情绪性作为附着力的一个因素会对信息的流行性产生影响,但分析结果与假设结果不符,这可能由以下两个因素导致。第一,由于情绪是微博内容的一个组成部分,因此不可避免地在网络用户特征大于内容特征的背景下无法体现其作用。其二,每条微博中出现的情绪词个数不能够完全体现其情绪的唤醒程度,如微博中咆哮体等具有较高情绪唤醒程度的文字格式,我们并未能在分析中有所体现。

4.3.5链接因素

首先向外链接的负作用看似无法解释(如图8),但通过对数据的统计后发现,带有链接的微博只占很小一部分,这是导致其负作用的主要因素,也表明其对于研究转发数的意义并不大。

5结论

在影响转发数(微博信息传递)的诸多因素中,我们发现:

1.受众的多少比内容的热门程度影响更大,用户特征大于内容特征。

2.由于网络媒介的累积效应,信息发布的点时间影响并不大。

3.与传统媒介类似,携带信息量的多少和途径丰富性对传递影响较大。

6实践意义

6.1微博营销

微博营销是当前广告和营销界最新兴和热门的研究,与传统营销的区别在于,其互动性更强,可能的受众更广,同时成本更低。

根据本研究的结果,微博营销的关键在于吸引更多的粉丝,虽然内容本身会对粉丝的积累有正作用,但更重要的结论是粉丝的特征对于转发行为的影响要大于广告内容的技巧。此外,根据研究发现,字数所表征的信息量在微博这种平台上对转发行为有重要影响,图片也对转发有重要正作用。据此,可以提出以下关于微博营销的策略。

7不足与展望17

(一)增加粉丝数

根据一些成功的微博营销案例可以总结出增加粉丝数的常见策略:

1.执行力,微博要高频率地更新,增加“曝光率”

2.名人效应的利用,请明星做微博软广告

3.通过特定微博内容吸引粉丝,然后穿插进行广告

4.“互粉”策略,通过关注别人而引起别人关注

(二)粉丝的特征

这就是所谓质量粉丝的培养,培养质量粉丝的意图在于通过优质粉丝的二期转发行为扩大微博信息的接触域,并且根据理论,关键人物的二期转发行为将有可能“引爆”信息的传播。所以微博营销要重视质量粉丝的识别和争取。

(三)信息量和图片

微博营销应当尽可能传达丰富的信息,并且附以精心选取的图片,因为生动的图片说明不但提高了信息密度,还增加了生动性,更易诱导信任和转发。

6.2微博水军和僵尸粉的发现

使用微博水军和僵尸粉是一种破坏网络信息秩序的行为,最近这种行为的频繁出现对有效识别它们的方法提出了迫切的要求。

新浪官方对微博水军的定义如下:

水军的帐号基本上都是机器(如一些微博营销软件)在维护,这些帐号从帐号本身的属性和他的访问行为及操作行为上都有一些明显的特征,如帐号的昵称、头像等都具有批量性,访问行为都与正常的浏览器访问行为有明显差异。

对僵尸粉定义如下:

僵尸粉一般指极度不活跃的用户,多是被人注册来人为增加粉丝数或制造垃圾微博的账户。界定标准有三条:已注销的用户、粉丝数低于5个、微博数低于5条。只要满足其中任何一条,就可认定为僵尸粉。

针对以上界定标准,借由我们在研究过程中发展的相关技术手段,提取用户账号的昵称、粉丝数、微博数和转发行为,并统计高转发量微博的各项指标数据,从而可以判断账户及其转发现象是否合理,由此自动甄别出可疑的粉丝和微博内容,大大缩小人工排查的范围,可以在一定程度上满足识别网络水军和僵尸粉的需求。

7不足与展望

7.1本研究所存在的不足

1.尽管采集了数万条的微博数据,但是这些相对于微博系统而言只是沧海一粟,因此代表

性有所限制。

2.考虑的影响因素有所局限,还存在很多思考不到或是数据采集不到的地方。

3.对于微博内容影响指数的量化不够完善,有许多现有自然语言处理技术无法分析的因素。

7.2后续研究的展望

1.本研究所抓取的微博时间跨度较大,是在较大时间尺度上的综合分析,未来有更加细致

数据的情况下,可以缩小时间跨度,从而更好地研究微博的转发数与发布微博距当时的时间段长度的关联效用。

2.我们在研究中发现一个有趣的现象:3月份和7、8月份的转发数呈现一个明显的波峰。

猜想这与学生群体的寒暑假有关,关于这一点的实证问题还有待研究。

3.由于现有技术手段的限制,尤其是受限于现有文本分析技术和中文语言特点之间的鸿沟,

我们无法对文本的语言技巧和可能隐藏的内在涵义进行细致可靠地分析,所以相关方面的研究还有待未来的技术手段发展。

4.本研究发现用户特征的影响远大于内容特征,从而使得内容特征的作用被相当程度地掩

盖,未来的研究可以通过剔除用户特征的作用进行回归或者通过问卷调查、个案分析等手段,对内容特征的作用进行更加细致的分析。

参考文献

[1]Reed,W.J.“The Pareto,Zipf and other power laws”,Economics Letters,2001,74(1):

15–19.

[2]Anderson,Chris.“The Long Tail”Wired,2004.

[3]Anderson,Chris.The Long Tail:Why the Future of Business is Selling Less of More.New

York,NY:Hyperion,2006.

[4]Malcolm Gladwell.“The Tipping Point:How Little Things Can Make a Big Di?erence”

,2002.

[5]Galeotti,Andrea,and Sanjeev Goyal.“The Law of the Few.”American Economic Review,

2010,100(4):1468–92.

[6]戴丽娟.微博名人战略研究,《暨南大学》,2011.

[7]Reza Bakhshandeh,Mehdi Samadi,Zohreh Azimifar,Jonathan Schae?er.“Degrees of

Separation in Social Networks”,Fourth Annual Symposium on Combinatorial Search, 2011.

[8]Caroline Haythornthwaite,“Strong,Weak,and Latent Ties and the Impact of New Media”

,The Information Society:An International Journal,Volume18,Issue5,2002.

[9]The Strength of Weak Ties.Mark S.Granovetter.American Journal of Sociology,Volume

78,Issue6,1973,1360-1380.

[10]孙海文,微博谣言,从众流瀑中的虚假信息传播,传媒观察,2011.

[11]Huston,Aletha C;Daniel R.Anderson,John C.Wright,Deborah Linebarger,Kelly L.

Schmidt.“Sesame Street Viewers as Adolescents:The Recontact Study”.In Shalom M.

Fisch,Rosemarie T.Truglio.“G”is for Growing:Thirty Years of Research on Children and Sesame Street.Mahweh,New Jersey:Lawrence Erlbaum Publishers,2001:p.133.

[12]Chip Heath,Dan Heath,“Made to Stick:Why Some Ideas Survive and Others Die”,

Random House;1st edition,2007.

[13]Philip Zimbardo,In?uencing Attitudes and Changing Behavior.Reading,MA:Addison

Wesley Publishing Co.,1969.

[14] A.Hernando, D.Villuendas, C.Vesperinas,M.Abad, A.Plastino,Unravelling the

size distribution of social groups with information theory on complex network-s,https://www.360docs.net/doc/066968641.html,/abs/0905.3704v3

[15]Dunbar,Robin.Grooming,Gossip,and the Evolution of Language.Harvard University

Press,1998.

[16]Nacke,O.“Informetrie:eine neuer Name für eine neue Disziplin”.Nachrichten für

Dokumentation,1979,30(6):219–226.

[17]Tomas C.Almind and Peter Ingwersen.“Informetric analyses on the World Wide Web:

Methodological approaches to‘webometrics’”.Journal of Documentation,1997,53(4): 404–426.

[18]Salton,G.and McGill,M.J.Introduction to modern information retrieva.McGraw-Hill,

1983.

[19]Salton,G.,Fox,E.A.and Wu,H.Extended Boolean information https://www.360docs.net/doc/066968641.html,mun.AC,

1983,26:1022–1036.

[20]祝蓓里,POMS量表及简式中国常模简介,《天津体育学院学报》,1995.

A附录:情绪词表20

A附录:情绪词表

1.正性情绪词:

高兴、好受、开心、快活、快乐、庆幸、舒畅、舒服、舒坦、爽快、甜美、甜蜜、甜丝丝、痛快、喜出望外、喜悦、喜滋滋、心花怒放、心旷神怡、幸灾乐祸、愉快、入迷、着迷、入神、喜欢、心醉、快慰、愉悦、畅快、大喜、欣喜、喜洋洋、兴冲冲、乐融融、乐陶陶、乐呵呵、乐悠悠、甜滋滋、兴高采烈、兴致勃勃、欢呼雀跃、兴趣盎然、手舞足蹈、欢天喜地、称心如意、心满意足、欢欣鼓舞、喜出望外、喜上眉梢、喜笑颜开、喜形于色、眉飞色舞、乐不可支、心旷神怡、心花怒放、欣喜若狂、洋洋自得、满面春风、自得其乐、满意、如意、如愿、顺心、随意、幸福、圆满、精力旺盛、动人心魄、欢喜、渴望、销魂、有活力、狂热、悦耳、兴奋、幻想、飘飘然、有希望、扬声欢呼、无忧无虑、可爱、幸运、惊奇、乐观、满意、积极、太棒了、激动、自豪、赞赏、有吸引力、美丽、有胆量、自信、无惧、英雄、独立、聪明、无敌、胜过、可爱、强大、有力、顺利、蓄意、尊敬、坚定、确信、有才、得胜、智慧、值得、精力充沛、主动、机敏、活跃、野心勃勃、生气蓬勃、沸腾、自由、活力、生气勃勃、有动力、精神抖擞、复活、恢复生气、有朝气、震颤、生龙活虎、有生气。

2.负性情绪词:

怒、愤慨、愤怒、生气、恼火、气不过、气不忿、气愤、愤恨、激怒、激动、痛苦、挑战、不高兴、不满意、暴怒、怒气冲冲、挫折、盛怒、讨厌、残酷、敌意、激发怒气、发怒、不愉快、厌恶、烦躁、发狂、恼羞成怒、不舒服、暴乱、狂怒、恼怒、叛逆、愤慨、反抗、无情、怀恨、不可原谅、激烈、报复、记仇、残暴、恶毒、悲伤、抓狂、心情低落、挫败、气馁、堕落、忧郁、丧气、失去勇气、心情不佳、抑郁、阴沉、哀伤、闷闷不乐、落魄、悲哀、悲惨、哀恸、麻木、悲观、听天由命、心情不好、郁闷、可悲、悲伤、不快乐、害怕、焦虑、畏惧、吃惊、挂虑、失去、不设防、绝望、挂念、易怒、惧怕、烦躁、发狂、惊骇、惧怕、歇斯底里、不安、不耐烦、危险、神经质、恐慌、失控、被情感淹没、惊慌、茫然若失、紧张、不耐烦、无法镇定、吓到、压迫、紧绷、恐惧、威胁、不舒服、担心、脆弱、担忧、支配、恐吓、打扰、征服、批评、压榨、羞耻、罪恶、歉意、过失、不好、贬低、受责、责备、堕落、没面子、尴尬、暴露、不智、卑微、屈辱、受辱、没规矩、归咎、嘲笑、懊悔、懊恼、可笑、腐败、轻蔑、抱歉、愚蠢、卑贱、奸诈、可耻、阴暗、卑劣、侮辱、淫秽、丑陋、猖狂、疏远、独自、分离、断绝、忽视、冷淡、空虚、想家、忽略、孤立、排斥、孤独、寂寞、不理睬、疏忽、拒绝、不在乎、不重要、不受欢迎、不被想要、不欢迎、虐待、非难、轻视、背叛、被责备、欺骗、批评、堕落、剥夺、破坏、受伤、虐待、误解、疏忽、痛苦、归咎、拒绝、无动于衷、无聊、漠不关心、精力耗尽、疲惫、身心疲乏、不重视、不关心、听天由命、衰弱、懒惰、疲劳、担忧、冷淡、疲倦、困惑、混乱、冲突、混淆不清、杂乱无章、怀疑、慌乱、犹豫、不知所措、错乱、纠缠、迷惑、卡住、哭泣、忌妒、不信任、妄想、怀疑、消沉、哀愁、苦闷、郁闷、恼火、沮丧、失意、自卑讨厌、敌人、厌恶、痛恨、虚伪、报复、仇恨、嫉妒、战争、惊讶、惊愕、不动、麻木、麻痹、震惊、目瞪口呆、惊吓、茫然。

微博营销的历史演变

微博营销的历史演变 2006年3月,博客技术先驱blogger创始人埃文·威廉姆斯(Evan Williams)创建的新兴公司Obvious推出了大围脖服务产品——Twitter。 Twitter的出现把世人的眼光引入了一个叫微博的小小世界里。世界100强大企业中有73家在Twitter上安了家。较早利用Twitter进行品牌营销的企业是戴尔,从2007年3月开始,戴尔的Twitter账号已超过了150万的追随者,通过这一销售渠道宣传促销而卖出的个人电脑、计算机配件和软件,已超过650万美元的销售收入,有超过100名的员工通过Twitter消息与顾客沟通。 Twitter在国外的大红大紫促使国内很多企业家看到了商机。 2007年,中国第一家带有微博色彩的“饭否网”开始进入人们的视野。 2009年8月份,中国最大的门户网站新浪网推出“新浪微博”内测版,成为了中国首家提供专业微博服务的网站,从此微博正式进入中文上网主流人群视野。而微博这个全新的名词,成为全世界最流行的词汇。 在企业微博方面,以新浪微博为例,已有超过13万家企业开通了自己的企业官方微博,也有过半的个人微博用户关注了企业微博;企业借微博平台更人性化地和消费者“对话”,消费者也会直接通过企业微博投诉和维权,目前买卖双方的日均微博互动高峰时长已达12小时。

仅在新浪上,目前开通微博的企业用户就覆盖22个行业,餐饮美食、汽车交通、商务服务、电子商务、IT等跻身前五大开通微博量最高行业。在开通微博的13万家企业中,有143家世界500强企业,有207家中国500强企业。在地域分布上,京沪穗企业占地域分布榜前三名,三地开微博的企业量均超过1.7万个。 据第31次《中国互联网络发展状况统计报告》显示,到2012年12月底,中国网民规模达到5.64亿,中国微博用户规模为3.09亿,手机微博用户规模2.02亿。 由于目前不少企业微博更新快、够实用,56%的个人用户至少会关注1个企业微博。专家指出,官方微博目前仍处发展初级阶段,但未来有替代企业官网的趋势。

新浪微博研究报告

新浪微博研究报告 前言:这份报告是对新浪微博的全方位解读。新浪目前已经在微博领域赢得先发优势,在用户数量上正试图与腾讯相抗衡,不过在公司营收上,其最大竞争对手是百度。我们给予新浪微博20亿美元估值,并认为其将挑战腾讯在社交应用领域的霸权。腾讯在规模上有优势,但是新浪在影响力上占了上风。与此同时,我们维持新浪“持有”评级,但是将其目标价上调最高至80美元。在中国新一轮SNS爆发期,我们认为腾讯将在营收上领先于新浪。 摘要:不到一年时间,已经有14%的中国互联网用户使用微博,其中新浪的市场份额接近87%,腾讯接近8%(附1) 新浪目前正遭到腾讯全产品线的围攻,在综合六类互联网社交沟通产品的整体市场份额对比中,腾讯占有88%份额,但新浪只有2%; 我们对新浪微博估值为20亿美元。估值的一半依据来自广告收入,另一半依据增加用户活跃程度所带来的营收;但是这样一来会造成对新浪自身其他板块的营收总体照成20%的减额。 如果以40x2011PE(36x ex-cash)衡量,新浪已经很贵;但以28x2012PE(24x ex-cash)估算,新浪股价将是合理的。 研究正文(共分为九大部分) 1.按浏览时间衡量新浪微博占87%市场份额 自新浪推出微博产品一年后,中国已有14%的互联网用户使用微博服务,在中国最常用网络应用程序中排名第16位。2010年中国微博用户增加5倍,总浏览时间增加11倍。在移动互联网领域,微博的上述市场份额更高。按总浏览时间衡量,新浪微博以87%份额居统治地位,按活跃用户数衡量,新浪微博的市场份额为54%(2010年11月数据)。新浪将继续引领微博产品的创新。 新浪推出微博产品后的股价表现注:以下图片如无特殊说明,均来自MIRAE ASSET 2.新浪微博与腾讯的整体数据对比 单纯对比新浪微博与腾讯微博的做法并不可取。正确的方法应该是对比新浪微博与腾讯Qzone,腾讯Qzone目前也是腾讯全社交战略(total SNS)的核心。腾讯全社交战略(total SNS)包括博客、IM、邮箱、BBS、SNS以及最新发布的免费短信应用微信(Kik),此战略的目的是提供一站式平台服务,满足网络用户的各种在

浅析新浪微博的优缺点及前景

仿佛在一夜之间,那些曾经神秘的明星、名人和社会名流仿佛通过新浪微博一下子来到了我们面前,我们甚至可以去评论他们的所说所想,运气好的话说不定还可以得到其回复,曾经的遥远感觉不再遥远。由于微博规定的单条状态发布字数不超过140个,很多文化较为欠缺的名人也纷纷开微,几句感想,几句随笔,不用再有小学生凑字数的感觉了。如果真有长篇大论,长微博也可以轻松 搞定,博客在这种大背景下也逐渐淡出了历史的舞台。可以说是名人和明星为微博的“燃烧”点起了第一把火。在这方面,腾讯微博就没有他的优势了,由于腾讯微博嵌入QQ,没有哪个名人愿意把自己的个人隐私聊天软件账号泄露出去,这也导致了腾讯微博在互动性上的劣势。 2、即时性 新浪微博惊人的传播速度和传播范围满足了很多希望第一时间掌握信息的用户的“虚荣心理”。随 着3G、4G网络的部署,数据流量的速度不再是用户使用移动端app的障碍,人们更愿意将自己的碎片时间用到刷微博上,享受着压力释放、最新新闻资讯、幽默漫画等给他们带来的生活享受。 3、自主性 微博是一个内容自创的平台,同时也是一个传播的平台。人人都可以通过微博来表达和传播自己的观点,从而形成一个自己的受众群落。此外,用户还可以通过@、转发等形式来和自己的朋友、同学或者是同事进行沟通和互动。 缺点 1、广告与营销越来越多 随着微博的迅猛发展,越来越多的商家看到了其潜在的巨大利益和商机,他们不断的把广告内容发到微博中,包括其中的一些旅行、英文等专题类微博也越来越多的充斥着各种广告,这不免让给用户产生抵触心理,进而对微博的好感度下降。 2、有价值的信息越来越少 随着用户不断的发表自己日常的衣食住行,同时转发一些大V的生活琐事,微博内容的信息量正在逐渐减少,其他用户在刷微博的时候难免会对这些事情产生反感心态。 3、盈利点较少 目前,微博主要依靠广告和向用户企业收费来盈利,但上面也说过,这种方式无疑会增加用户的反感度,所以无异于饮鸩止渴。所以说,新浪微博现在除了为网站集聚大量人气之外,其尚无明确的盈利模式,长此以往,其自身的运营将会成为一个比较严重的问题。

我国政府微博现状分析及建设思考讲解

我国政府微博现状分析及建设思考 摘要:微博这一新兴传播媒介具有较大的社会价值,政府开通微博也具有重要意义。本文分析了目前国内政府以参考国外政府微博的使用现状,提出了笔者对现阶段政府微博建设的几点建议及思考。关键词:政府微博;现状分析;建议一、微博的传播价值及建立政府微博的意义微博,即微博客的简称,是一个基于用户关系的信息分享、传播以及获取平台,用户可以通过WEB、WAP以及各种客户端组建个人社区,以140字左右的文字更新信息,并实现即时分享。对于政府微博目前学术界没有明确定义,本文将政府微博这一概念界定为以政府部门或机构设立的微博为主,包括政府官员个人微博在内的微博平台的总和。建立建设政府微博对现实生活有很大意义。首先,微播传播及时性很强,特别是对突发事件的传播。由普通网民临时客串的“公民报道者”,赶在传统媒体报道和政府新闻发布的前面,第一时间在微博上发布一手信息,对突发事件进行“现场直播”。如玉树地震救灾中一条寻找藏语翻译的求助信息在微博上发布近18小时后被转发8000多次,近1500名网友热情发言,表示要帮“博主”寻找藏语翻译,救助那些青海玉树的灾民。随着现代社会突发事件及灾难的增多,政府不可能掌握全部信息,通过建立微博可以从网友那里及时发现重要情况以便处理应对;同时,政府作为微博发布主体,可以向民众传播一些信息,并更具有权威性。其次,微博传播促进了知情权与接近权的发展,开辟言论自由的新局面。网络“个个是中心,处处是边缘”的技术特点改变了传统媒介的信息传播体制。其交互式人机交流界面和信息超文本链接,为互动传播提供了便捷之路,为用户提供了较大的主动权。人们不仅可以按照自己的兴趣选择性地接触信息,还可以及时反馈自己的意见和主张。“微博”的传播方式与特征决定了任何人都有权利成为信息的发布者与传递者。建立政府微博满足了民众接近政府、了解政府的愿望,有利于拉近官民距离,提高政府透明性和公开性。再次,微博的言论平等和自由为民主监督提供了新平台。目前,微博已能和大多数通讯工具实现平滑对接,特别是几乎所有的微博都提供了手机绑定服务,用户可以像发短信一样通过手机发微博。而手机信号接收点几乎无处不在,使得信息无法屏蔽,可以自由发布,一定程度上满足了言论自由。随着越来越多的领导干部、政府部门开通微博,在这个言论自由、身份平等的平台之上,政府可以更好地了解民情民意,与民众及时沟通,接受民众的监督。二、政府微博现状分析 (一)开通微博的机构多数为公安、交通类据新浪微博2010年8月底提供的资料显示,目前已有近60个政府部门在新浪注册微博。其中包括一个省级微博(即“微博云南”),而公安微博占总数的近7成。政府部门积极开通微博,在某种程度上显示出了官方对微博这种新兴传播形式的认可,另一方面也证明官方正积极探索通过新形式、新技术与民众建立更好的关系,推动政务公开。不过相对于各级政府数目之多、机构之庞杂,政府微博的规模需要扩大,涉及的范围领域需要拓宽,以满足民众对官方信息的需求。(二)政府微博“粉丝”数目虽少,但有较强的实际影响力目前政府机构微博中,“成都发布”“粉丝”数量在半年内积累到5.3万人,高居城市政府微博之首位,然而与明星微博的百万粉丝相比,可谓是小巫见大巫。而官方微博影响力从直观数量上虽不及名人微博,但在实际中却可以发挥很大作用。2010年“8?13”山洪泥石流灾害发生期间,“成都发布”发出旅游预警,粉丝们及时响应,短

新浪微博推广技巧

新浪微博推广技巧 一、活跃有朝力 你用心想一下就知道了,生活中那些比较活跃有活力的人身边的好友是不是比较多点,人缘是不是也要比整天沉默不语的人要好很多呢?玩微博也是一样的,想要自己有个很好的人际圈子,别人喜欢你,你就不能每天沉默不语,要多发言,多抢沙发,让别人不能忽视你的存在,每天都让他们可以看到你在动,你在他们的身边围绕着呢?这样日久之后他们自然而然就会关注起你来了,因为你已经成为他们生活中的一部分了。 二、幽默风趣 刚才说到要发言,然而并不是你什么都说,乱发的,每天发一些垃圾信息,而是要发你粉丝感兴趣的东西才行,要让他们喜欢你发的广播,而不是看到你发的内容他们就心烦意乱,想把你屏蔽。因此,在你发广播的时候就要多注意发一些幽默风趣能够带给人喜悦的内容来,让人看了就忍不住的想笑,轻松而愉快,相信没有人会拒绝给自己带来快乐的人吧?做好这点,你又成功了一步。

三、互动交流 如果你每天都是一个劲在的取悦你的粉丝,发他们喜欢的内容,讨好他们时间长了相信你也会烦的吧,是不是很想你发的广播能够引起朋友们的兴趣,和他们互动起来呢?自己发了一条广播是不是想马上看看自己粉丝的反应呢?他们会说什么呢?其实这很简单的,只需要别在发广播的时候你可以给以回复或是评论转发就可以了,他们在看到你内容时是这样做的,你也不能不理了,就放那了,要时时的和他们交流,互相转播评论才行的,互动交流才是王道,没人会喜欢自己老是主动,而却一直得不到任何回应的。 四、人脉传播 如果你能利用好你自己目前所拥有的资源,而把这些资源都利用起来的话,那么你的新浪微博应该也会有不少的人气了。平时可以给你的QQ好友发消息,让他关注你的微博,然后请他帮你转发给他的朋友,也可发在QQ群里的每个好友,也能给友好发邮件,告诉他们你的微博地址,让他们没事的时候多加关注。这样一传十,十传百的力量绝对是你增加人气的捷径。 微薄营销; 一、微博营销是刚刚推出的一个网络营销方式,因为随着微博的火热,既催生了有关的营销方式,就是微博营销。每一个人都可以在新浪,网易等等注册一个微博,然后利用更新自己的微型博客。每天的更新的内容就可以跟大家交流,或者有大家所感兴趣的话题,这样就可

新浪微博技术

中国首届微博开发者大会在北京举行,这是国内微博行业的首场技术盛宴。作为国内微博市场的绝对领军者,新浪微博将在此次大会上公布一系列针对开发者的扶持政策,以期与第三方开发者联手推动微博行业的整体发展。图为微博平台首席架构师杨卫华演讲。 以下为演讲实录: 大家下午好,在座的大部分都是技术开发者,技术开发者往往对微博这个产品非常关心。最晚的一次,是12点多收到一个邮件说想了解一下微博底层是怎么构架的。很多技术人员对微博的构架非常感兴趣,就是一个明星他有300万粉丝,这个技术怎么来实现?今天在这里跟大家分享一下微博的底层机构,让大家对微博的底层技术有更好的了解。另外不管是做客户端、1.0、2.0、论坛、博客都要考虑架构的问题,架构实际上是有一些共性的。今天我通过讲解微博里面的一些架构,分析一下架构里面哪些共性大家可以参考。 首先给大家介绍一下微博架构发展的历程。新浪微博在短短一年时间内从零发展到五千万用户,我们的基层架构也发展了几个版本。第一版是非常快的,我们可以非常快的实现我们的模块。我们看一下技术特点,微博这个产品从架构上来分析,它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式,假如说我们一个明星用户他有10万个粉丝,那就是说用户发表一条微博的时候,我们把这个微博消息攒成10万份,这样就是很简单了,第一版的架构实际上就是这两行字。第一版本的技术细节,典型的LAMP(Linux-Apache-MySQL-PHP)架构,是使用Myisam搜索引擎,它的优点就是速度非常快。另外一个是MPSS,就是多个端口可以布置在服务器上。为什么使用MPSS?假如说我们做一个互联网应用,这个应用里面有三个单元,我们可以由三种部署方式。我们可以把三个单元部署在三台服务器上,另外一种部署模式就是这三个单元部署在每个服务器上都有。这个解决了两个问题,一个是负载均衡,因为每一个单元都有多个结点处理,另外一个是可以防止单点故障。如果我们按照模式一来做的话,任何一个结点有故障就会影响我们系统服务,如果模式二的话,任何一个结点发生故障我们的整体都不会受到影响的。 我们微博第一版上线之后,用户非常喜欢这个产品,用户数增长非常迅速。我们技术上碰到几个问题。第一个问题是发表会出现延迟现象,尤其是明星用户他的粉丝多。另外系统处理明星用户发表时候的延迟,可能会影响到其他的用户,因为其他的用户同一时间发表的话,也会受到这个系统的影响。我们就考虑这个系统怎么改进。首先是推模式,这肯定是延迟的首要原因,我们要把这个问题解决掉。其次我们的用户越来越多,这个数据库表从一百万到一亿,数据规模不一样处理方式是有差别的。我们第一版单库单表的模式,当用户数量增多的时候,它不能满足就需要进行拆分。第二个是锁表的问题,我们考虑的是更改引擎。另外一个是发表过慢,我们考虑的是异步模式。 第二版我们进行了模块化,我们首先做了一个层,做了拆分,最右边的发表做了异步模式。第二个服务层,我们把微博基础的单元设计成服务层一个一个模块,最大是对推模式进行了改进。首先看一下投递模式的优化,首先我们要思考推模式,如果我们做一下改进把用户分成有效和无效的用户。我们一个用户比如说有一百个粉丝,我发一条微博的时候不需要推给一百个粉丝,因为可能有50个粉丝不会马上来看,这样同步推送给他们,相当于做无用功。我们把用户分成有效和无效之后,我们把他们做一下区分,比如说当天登陆过的人我们分成有效用户的话,只需要发送给当天登陆过的粉丝,这样压力马上就减轻了,另外投递的延迟也减小了。

未来的资产:《新浪微博研究报告》

此篇报告由未来资产互联网分析师Eric Wen与Vincen Sun合作完成。 前言:这份报告是对新浪微博的全方位解读。新浪目前已经在微博领域赢得先发优势,在用户数量上正试图与腾讯相抗衡,不过在公司营收上,其最大竞争对手是百度。我们给予新浪微博20亿美元估值,并认为其将挑战腾讯在社交应用领域的霸权。腾讯在规模上有优势,但是新浪在影响力上占了上风。与此同时,我们维持新浪“持有”评级,但是将其目标价上调最高至80美元。在中国新一轮SNS爆发期,我们认为腾讯将在营收上领先于新浪。 不到一年时间,已经有14%的中国互联网用户使用微博,其中新浪的市场份额接近87%,腾讯接近8%(附1); 新浪目前正遭到腾讯全产品线的围攻,在综合六类互联网社交沟通产品的整体市场份额对比中,腾讯占有88%份额,但新浪只有2%; 我们对新浪微博估值为20亿美元。估值的一半依据来自广告收入,另一半依据增加用户活跃程度所带来的营收;但是这样一来会造成对新浪自身其他板块的营收总体照成20%的减额。 如果以40x2011PE(36x ex-cash)衡量,新浪已经很贵;但以28x2012PE(24x ex-cash)估算,新浪股价将是合理的。 1.按浏览时间衡量新浪微博占87%市场份额 自新浪推出微博产品一年后,中国已有14%的互联网用户使用微博服务,在中国最常用网络应用程序中排名第16位。2010年中国微博用户增加5倍,总浏览时间增加11倍。在移动互联网领域,微博的上述市场份额更高。按总浏览时间衡量,新浪微博以87%份额居统治地位,按活跃用户数衡量,新浪微博的市场份额为54%(2010年11月数据)。新浪将继续引领 微博产品的创新。 (新浪推出微博产品后的股价表现注:以下图片如无特殊说明,均来自MIRAE ASSET) 2.新浪微博与腾讯的整体数据对比 单纯对比新浪微博与腾讯微博的做法并不可取。正确的方法应该是对比新浪微博与腾讯Qzone,腾讯Qzone目前也是腾讯全社交战略(total SNS)的核心。腾讯全社交战略(total SNS)包括博客、IM、邮箱、BBS、SNS以及最新发布的免费短信应用微信(Kik),此战略的目的是提供一站式平台服务,满足网络用户的各种在线需要。除非用户大量离开QQ而转向腾讯微博,否则腾讯全社交战略就不会有所变化。 如果将上述六大产品作为整体看待,那么腾讯拥有中国社交网络73%的日活跃用户数,88%浏览时长以及77%的访问次数,而新浪数据分别为6%、2%、3%。换句话说,在中国社区应用

微博的由来及发展历史

一、微博的定义 微博,即微博客,是一个基于用户关系信息分享、传播以及获取平台,用户可以及时更新简短的话题,并以公开的方式进行发布。 微博是web3.0新兴起的一类开放因特网社交服务,国际上最知名的微博网站是推特,目前推特的独立访问用户已达3200万人,美国总统奥巴马、美国白宫、FBI、Google、HTC等很多国际知名个人和组织在Twitter上进行营销与用户交互。国内著名的微博有:新浪微博、腾讯说说、网易微博、搜狐微博等。 二、微博的特点: 微博虽然火热,但是风格与Twitter完全不同。国人不爱隐私爱热闹,微博与其说是朋友圈,不如说是粉丝厂。正好又由于众所周知的原因,微博又变成网民集体娱乐广场和讨伐的战场,知识分子启蒙的公共课堂。微博作为一种分享和交流平台,其更注重时效性和随意性。微博客更能表达出每时每刻的思想和最新动态,而博客则更偏重于梳理自己在一段时间内的所见、所闻、所感。

1.便捷性。 微博有140个字符的长度限制,对于西文,以英文为例,一个英文单词加上空格平均也要五六个字符,而中文以双字词为主流,这样每条Twitter能够传达的信息量,就只有一条中文微博的1/3左右。 2.创新交互性。 与博客的交互方式不同,微博实际上是可以一点对多点,也可以点对点,当你关注一个子集感兴趣的人时,两三天就会形成习惯地关注,移动终端提供的便利性和多媒体化,是的微博用户体验的粘性越来越强。 3.原创性。 微博网站的即时通信功能非常强大,通过QQ和MSN就可以直接发布,在没有网络的地方,只要有手机也可以及时更新微博的内容,哪怕你就在事发现场。 如一些大的突发事件或引起全球关注的大事,如果你当时在场,利用各种手段在微博上发布,其实时性,现场感以及快捷性,甚至超过所有媒体。

新浪微博粉丝通推广效果分析

新浪微博粉丝通推广效果分析 新浪微博“粉丝通”是基于微博的企业营销推广产品,它会根据用户属性和社交关系将信息精准的投放给目标人群,同时“粉丝通”也具有普通微博的全部功能,如转发、评论、收藏等,这些天我注册并使用了一下微博“粉丝通”,并对其推广数据进行了一番分析。 粉丝通的收费规则有两种,一种按CPM收费,最低出价为1000人次/5元,一种是按CPE 收费,最低出价1人次/0.5元。根据客服的建议,广告推广只选择了按CPM方式的广告投放,一共投放了两个广告计划。 第一个广告计划是针对兴趣投放的广告,投放微博用户为全部用户,然后在“社交兴趣图谱”里选择指定的兴趣人群来投放,投放了7天,出价为千次15元。平均数据为:平均千次展示成本为13.07元,单次互动成本为18.42元,微博内链接点击平均价格为37.5元。 第二个广告计划是针对行业微博大号的粉丝投放的,“社交兴趣图谱”里选择全部,投放了两天,出价为千次15元。平均数据为:平均千次展示成本为11.66元,单次互动成本为4. 51元,微博内链接点击平均价格为6.41元。

从投放效果看,针对行业微博大号粉丝的投放效果明显好于针对社交兴趣投放的效果,可见新浪微博对于用户的真实社交兴趣把握还并不太准确。不过,即使针对行业微博大号的粉丝投放,其微博内链接点击成本价格也较高。 根据千次展示成本,也可以估算一下普通一条微博推广的费用,如果按照12元的价格计算,一条微博如果展示了5万次,那么按照粉丝通的计算价格应该为600元推广费用。 一条推广微博是否有效果,一般由如下三方面组成:粉丝的质量、微博的到达率、微博的质量,粉丝通解决了前两项,但微博的创意却是由企业来提供,只有高质量的微博才能够吸引到别人,如果微博质量不高的话,使用CPM方式投放广告就不太划算。 如果无法撰写出高质量的微博创意,那么可以尝试用用按照互动次数投放广告,预计按照CPE方式投放对于低交互微博可能会更合算一些。

新浪微博分析报告

新浪微博分析报告

新浪微博分析报告 新浪微博加粉丝,完善个人资料。最好用自己的真实姓名(或有趣的匿名)、真实的头像(美女、帅锅或有趣的头像)、个人介绍(可以是搞笑的吸引人的)。真实的信息让人觉得更可信,会大大提高被收听的几率。 通过微博第三方应用(狠狠转、互粉大厅、粉丝大师、互粉加加、互粉小助手、推兔、爱互粉、推兔互粉等。。。)来添加粉丝数量。最好不要用软件,软件刷的粉丝大多是死粉,且用软件刷还很容易被封号。 我发现想让一个人转发或评论你的微博不是件容易的事。首先微博必须有看点(让别人有耐心看下去)、笑点(让别人对你产生兴趣)、创意(让别人新鲜有趣),或者有活动优惠(大部分网民是爱贪便宜的)。且不要刷屏,网民是很反感刷屏的,所以一天发3~5条微博就差不多了。多参加一些热点话题的讨论,尽量把自己的曝光度提升。如:我申请了#第三代搜索技术#这个话题的主持人,那么怎么推广呢?

我们可以点击微博下面的推广, 也可以通过狠狠转的“我要转发”,其他第三方应用也有这项功能, 也可以借助热门话题的力量进行宣传

借助话题,如:#第三代搜索技术#话题镶入#360#、#360好搜#、#奇虎360#等这些热门话题中,从而有了间接的关系,我们可以这样做:这就是借助引流方式。

添加相应的标签,有助于网民的搜索 还有就是借助其他渠道宣传,qq、微信、论坛、软文等。。。。推广方式很多,我也不多说了。 针对一个兴趣(或一个产品)来发布微博,如果每天都发不同的兴趣(或产品)那样会损失一批粉丝。明星就可以不在乎这些,但我们不是,所以要多多与网民互动,培养信任度,这样也有助于提高网民的转帖效率。 微博营销,也就是社会化媒体营销,同微信、论坛、博客、sns社区是一样的,他们不同于其他传统营销,它们的内容都是由用户自愿提供的,而不是直接的雇佣关系,这个就需要社交思维。这种营销方式广泛,易于流行。我们可以从微博、论坛寻找潜在用户,让其进入微信进行一对一交谈,从而成为精确用户进行维护。 最近了解到微博在2014.04月份采取了措施,在微博发微信二维码、微信公众号会被删或封号等

新浪微博技术架构

首先给大家介绍一下微博架构发展的历程。新浪微博在短短一年时间内从零发展到五千万用户,我们的基层架构也发展了几个版本。第一版就是是非常快的,我们可以非常快的实现我们的模块。我们看一下技术特点,微博这个产品从架构上来分析,它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式,假如说我们一个明星用户他有10万个粉丝,那就是说用户发表一条微博的时候,我们把这个微博消息攒成10万份,这样就是很简单了,第一版的架构实际上就是这两行字。第一颁的技术细节,典型的LAMP架构,是使用Myisam搜索引擎,它的优点就是速度非常快。另外一个是MPSS,就是多个端口可以布置在服务器上。为什么使用MPSS?假如说我们做一个互联网应用,这个应用里面有三个单元,我们可以由三种部署方式。我们可以把三个单元部署在三台服务器上,另外一种部署模式就是这三个单元部署在每个服务器上都有。这个解决了两个问题,一个是负载均衡,因为每一个单元都有多个结点处理,另外一个是可以防止单点故障。如果我们按照模式一来做的话,任何一个结点有故障就会影响我们系统服务,如果模式二的话,任何一个结点发生故障我们的整体都不会受到影响的。 我们微博第一版上线之后,用户非常喜欢这个产品,用户数增长非常迅速。我们技术上碰到几个问题。第一个问题是发表会出现延迟现象,尤其是明星用户他的粉丝多。另外系统处理明星用户发表时候的延迟,可能会影响到其他的用户,因为其他的用户同一时间发表的话,也会受到这个系统的影响。我们就考虑这个系统怎么改进。首先是推模式,这肯定是延迟的首要原因,我们要把这个问题解决掉。其次我们的用户越来越多,这个数据库表从一百万到一亿,数据规模不一样处理方式是有差别的。我们第一版单库单表的模式,当用户数量增多的时候,它不能满足就需要进行拆分。第二个是锁表的问题,我们考虑的是更改引擎。另外一个是发表过慢,我们考虑的是异步模式。 第二版我们进行了模块化,我们首先做了一个层,做了拆分,最右边的发表做了异步模式。第二个服务层,我们把微博基础的单元设计成服务层一个一个模块,最大是对推模式进行了改进。首先看一下投递模式的优化,首先我们要思考推模式,如果我们做一下改进把用户分成有效和无效的用户。我们一个用户比如说有一百个粉丝,我发一条微博的时候不需要推给一百个粉丝,因为可能有50个粉丝不会马上来看,这样同步推送给他们,相当于做无用功。我们把用户分成有效和无效之后,我们把他们做一下区分,比如说当天登陆过的人我们分成有效用户的话,只需要发送给当天登陆过的粉丝,这样压力马上就减轻了,另外投递的延迟也减小了。 我们再看数据的拆分,数据拆分有很多方式,很多互联网产品最常用的方法,比如说如可以按照用户的UID来拆分。但是微博用户的一个特点就是说大家访问的都是最近的服务器,所以我们考虑微博的数据我们按照时间拆分,比如说一个月发一张表,这样就解决了我们不同时间的惟度可以有不同的拆分方式。第二个考虑就是要把内容和索引分开存放。假如说一条微博发表的地址是索引数据,内容是内容数据。假如说我们分开的话,内容就简单的变成了一种key-value的方式,key-value是最容易扩展的一种数据。比如说一个用户发表了一千条微博,这一千条微博我们接口前端要分页放,比如说用户需要访问第五页,那我们需要迅速定位到这个记录。假如说我们把这个索引拆分成一个月一张表,我们记录上很难判断第五页在哪张表里,我们需要索引所有的表。如果这个地方不能拆分,那我们系统上就会有一个非常大的瓶颈。最后我们想了一个方法,就是说索引上做了一个二次索引,改变我们还是按照时间拆分,但是我们把每个月记录的偏移记下来,就是一个月这个用户发表了多少条,ID是哪里,就是按照这些数据迅速把记录找出来。 异步处理,发表是一个非常繁重的操作,它要入库、统计索引、进入后台,如果我们要把所有的索引都做完用户需要前端等待很长的时间,如果有一个环节失败的话,用户得到的提示是发表失败,但是入库已经成功。所以我们做了一个异步操作,就是发表成功我们就提示成功,然后我们在后台慢慢的消息队列慢慢的做完。另外新浪发表了一个很重要的产品叫做MemcacheQ,我们去年做了一个对大规模部署非常有利的指令,就是stats queue,适合大规模运维。 第二版我们做了这些改进之后,微博的用户和访问量并没有停止,还有很多新的问题出现。比如说系统问题,单点故障导致的雪崩,第二个是访问速度问题因为国内网络环境复杂,会有用户反映说在不同地区访问图片、js这些速度会有问题。另外一个是数据压力以及峰值,MySql复制延迟、慢查询,另外就是热门事件,比如说世界杯,可能会导致用户每秒发表的内容达到几百条。我们考虑如何改进,首先系统方面循序任意模块失败。另外静态内容,第一步我们用CDN来加速,另外数据的压力以及峰值,我们需要将数据、功能、部署尽可能的拆分,然后提前进行容量规划。 另一方面我们还有平台化的需求,去年11月我们就说要做开放平台,开放平台的需求是有差异的,Web系统它有用户行为才有请求,但是API系统特别是客户端的应用,只要用户一开机就会有请求,直到他关闭电脑这种请求一直会不间断的过来,另外用户行为很难预测。 系统规模在持续的增大,另外也有平台化的需求,我们新架构应该怎么做才能满足这些需要?我们看一下同行,比如说Google怎么样考虑这个问题的?Google首席科学家讲过一句话,就是一个大的复杂的系统,应该要分解成很多小的服务。比如说我们在https://www.360docs.net/doc/066968641.html,执行一个搜索查询的话,实际上这个操作会调动内部一百多个服务。因此,我们第三版的考虑就是先有服务才有接口最后才有应用,我们才能把这个系统做大。

新浪个人微博运营前期总结

现在玩微博的人越来越多了,很多企业也都以微博进行营销,主要是在于它的传播速度够快,传播范围也够大。而微博营销也必然成为企业营销的一部分。因为随着微博的火热,每一个粉丝都成为了营销对象,利用140字向网友传播企业或者产品的信息,树立良好的企业形象或者产品形象,每天更新内容就可以跟大家交流或者提供大家感兴趣的话题,这样就可以达到营销目的,何乐而不为呢。同样个人微博也一样。下面讲得我自己个人微博的经历,希望对大家有所帮助。 新浪微博运营之细节决定成败 其实,微博其实和网站是一样的,一个微博相当于一个小型网站。名字即网站名称,标签即网站关键词,介绍就是描述,而且现在已经有个性域名了,那就相当于自己的网站地址,还可以设置自己喜欢的背景。因此这些细节问题一定要做好。 首先是定位问题。做事情之前都有一个目标,这将决定着最终的成败。在微博上定位的时候还是建议把品牌考虑进去,就是说做口碑营销,对以后培养有效粉丝有很大的帮助。 然后是名字,定位之后给自己起一个响亮的名字,让别人一看就知道你是做什么内容的。这样他们看了之后紧接着看你的内容怎样才会关注。 最后就是其他资料了,包括:标签、介绍、域名、背景等。大家应该知道关键词在网站中的作用,微博中的标签也是如此,别人在搜索的时候也会通过标签搜索,这样的粉丝就是在找明确的目标,质量很高的。介绍就是让别人更加信任你,一句好的介绍很可能让他立马关注你。个性域名这一块,要注意的就是一旦改好将不能修改,因此要慎重。一个好的背景也是粉丝关注你的关键,因为也许粉丝进入你的微博,从背景可以看你是不是很有品味,另一点就是增加可信度。最后其他资料也要完善,便于别人联系我们增加可信度和互动机会。 新浪微博运营之坚持很重要 任何事情都需要坚持,总之记住,坚持就是胜利。微博运营中前期要坚持的就是粉丝,内容和互动。 一、首先说粉丝。在前期你想自然增加粉丝那肯定是不可能的,除非你是名人。那怎样才能有了粉丝呢?下面给大家介绍几种方法。 1:进出微群 进出微群的意思就是退群加群,大家应该都知道微群中有个板块是欢迎新人。大部分人在微群中会看新人这些,有喜欢的就会关注你,特别是互粉群中,因为他们也想得到粉丝,因此就回先关注你,互粉群更是如此。 那什么时间进出最好呢?通过四个月的实验,大概可以分为这几个时间段早上8点—9点半(人们都刚上班,玩的人多)中午11点半—12点半(快下班和吃饭时间)晚上5点—6点(将要下班时间)。提醒一下:每天退群和进群的次数是有限的,因此要适当分开。 2:互粉

新浪微博推广的效果分析

网络营销考试论文 论文题目:新浪微博推广的效果分析学生姓名: 学生学号: 专业: 班级: 成绩:

目录 一、微博微博推广、网络推广,其关系是怎样的 (1) 二、常用微博推广方法及技巧 (1) 三、怎样进行微博推广 (1) (一)注册微博技巧 (2) (二)微博推广技巧 (2) 四、微博推广总体成效分析 (4) 五、总结 (4) 参考文献 (4)

微博推广的效果分析 一、微博微博推广、网络推广,其关系是怎样的 微博,即微博客(MicroBlog)的简称,是一个基于用户关系的信息分享、传播以及获取平台。在这样一个平台里,你既可以作为观众,通过WEB、WAP以及各种客户端组建个人社区,浏览你感兴趣的信息;也可以作为发布者,在微博上发布140字左右的文字更新信息,或者是图片、视频,实现即时分享。但微博的社交性质并不强,只是一种最佳的信息发布平台。而微博推广,就是以微博为媒体,在最短的时间内将信息以裂变的方式传播出去,它是社会媒体优化(被称为Social media optimization,简称SMO)的一种,亦是网络推广的一种有效方式。现在微博推广的主流微博有新浪,腾讯,搜狐,网易等等,其中新浪微博是使用和关注人群最多的,它的推广被越来越多的站长们所重视,已经成为热门的网络推广行为。 二、常用微博推广方法及技巧 话题,根据你的目标听众设定话题,就是要在微博设立初期制定内容策略,就像一本杂志的主编设定杂志内容策略是类似的。微博的最终目的其实是分享内容。 标签,设好标签可以帮你查找相同爱好的人,志同道合的人才会成为你忠实的粉丝。 善用大众热门话题,及关注热点。每小时热门话题排行以及每日热门话题排行都是很有用的,因为这些话题适合微博的每个人,并且善加策划进我们的营销内容,可以增加被用户搜索到的机率。 制定有规律的更新频率,每日发6-20条,一个小时都能发1-2条,频率和节奏把握不好,会让粉丝流失。 互动交流,写微博,发微博,相互评论与转播,增加粉丝间的互动,加强彼此间的交流,巩固粉丝间的稳定性。 规划好发帖时间。微博有几个高峰,上班、午休、下午4点后晚上8点,要抓住这些高峰人群时间发帖,才可能产生高阅读率和高转发率。 广加好友,新浪微博可以发邮件给好友,邀请他们开通新浪微博,结合微博推广第一条,可以说明,微博,朋友多是王道! 同步博客微博,只需要博客地址就能同步别人博客的文章,户主社区没有帐号审核之类的。 完善资料,加入微博后先完善资料,修改头像,让大家感觉到你的真实,才会有更多的人关注你。 三、怎样进行微博推广 挑选一个好的微博平台,建立一个微博账号。一个好的平台,有足够的人气,能够找到潜在的关注群体,有利于培养潜在客户。

新浪微博粉丝分析都包含哪些内容-

新浪微博粉丝分析都包含哪些内容? 篇一:新浪微博分析报告 新浪微博分析报告 新浪微博加粉丝,完善个人资料。最好用自己的真实姓名(或有趣的匿名)、真实的头像(美女、帅锅或有趣的头像)、个人介绍(可以是搞笑的吸引人的)。真实的信息让人觉得更可信,会大大提高被收听的几率。 通过微博第三方应用(狠狠转、互粉大厅、粉丝大师、互粉加加、互粉小助手、推兔、爱互粉、推兔互粉等。。。)来添加粉丝数量。最好不要用软件,软件刷的粉丝大多是死粉,且用软件刷还很容易被封号。 我发现想让一个人转发或评论你的微博不是件容易的事。首先微博必须有看点(让别人有耐心看下去)、笑点(让别人对你产生兴趣)、创意(让别人新鲜有趣),或者有活动优惠(大部分网民是爱贪便宜的)。且不要刷屏,网民是很反感刷屏的,所以一天发3~5条微博就差不多了。多参加一些热点话题的讨论,尽量把自己的曝光度提升。如:我申请了#第三代搜索技术#这个话题的主持人,那么怎么推广呢? 我们可以点击微博下面的推广, 也可以通过狠狠转的“我要转发”,其他第三方应用也有这项功能,

也可以借助热门话题的力量进行宣传 借助话题,如:#第三代搜索技术#话题镶入#360#、#360好搜#、#奇虎360#等这些热门话题中,从而有了间接的关系,我们可以这样做:这就是借助引流方式。 添加相应的标签,有助于网民的搜索 还有就是借助其他渠道宣传,qq、微信、论坛、软文等。。。。推广方式很多,我也不多说了。 针对一个兴趣(或一个产品)来发布微博,如果每天都发不同的兴趣(或产品)那样会损失一批粉丝。明星就可以不在乎这些,但我们不是,所以要多多与网民互动,培养信任度,这样也有助于提高网民的转帖效率。 微博营销,也就是社会化媒体营销,同微信、论坛、博客、sns 社区是一样的,他们不同于其他传统营销,它们的内容都是由用户自愿提供的,而不是直接的雇佣关系,这个就需要社交思维。这种营销方式广泛,易于流行。我们可以从微博、论坛寻找潜在用户,让其进入微信进行一对一交谈,从而成为精确用户进行维护。 最近了解到微博在月份采取了措施,在微博发微信二维码、微信公众号会被删或封号等危险,但还可以在朋友圈上发。 微博是一个很大的用户圈,如果想建立品牌,采用微博、微信、论坛、博客、sns社区宣传然后再加上在猪八戒发条任务,那样基本整个网络都是我们的信息。 篇二:新浪微博微数据主要包括什么版块?

新浪微博框架

大家下午好,在座的大部分都是技术开发者,技术开发者往往对微博这个产品非常关心。最晚的一次,是12点多收到一个邮件说想了解一下微博底层是怎么构架的。很多技术人员对微博的构架非常感兴趣,就是一个明星他有300万粉丝,这个技术怎么来实现?今天在这里跟大家分享一下微博的底层机构,让大家对微博的底层技术有更好的了解。另外不管是做客户端、1.0、2.0、论坛、博客都要考虑架构的问题,架构实际上是有一些共性的。今天我通过讲解微博里面的一些架构,分析一下架构里面哪些共性大家可以参考。 首先给大家介绍一下微博架构发展的历程。新浪微博在短短一年时间内从零发展到五千万用户,我们的基层架构也发展了几个版本。第一版就是是非常快的,我们可以非常快的实现我们的模块。我们看一下技术特点,微博这个产品从架构上来分析,它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式,假如说我们一个明星用户他有10万个粉丝,那就是说用户发表一条微博的时候,我们把这个微博消息攒成10万份,这样就是很简单了,第一版的架构实际上就是这两行字。第一颁的技术细节,典型的LAMP架构,是使用Myisam搜索引擎,它的优点就是速度非常快。另外一个是MPSS,就是多个端口可以布置在服务器上。为什么使用MPSS?假如说我们做一个互联网应用,这个应用里面有三个单元,我们可以由三种部署方式。我们可以把三个单元部署在三台服务器上,另外一种部署模式就是这三个单元部署在每个服务器上都有。这个解决了两个问题,一个是负载均衡,因为每一个单元都有多个结点处理,另外一个是可以防止单点故障。如果我们按照模式一来做的话,任何一个结点有故障就

会影响我们系统服务,如果模式二的话,任何一个结点发生故障我们的整体都不会受到影响的。 我们微博第一版上线之后,用户非常喜欢这个产品,用户数增长非常迅速。我们技术上碰到几个问题。第一个问题是发表会出现延迟现象,尤其是明星用户他的粉丝多。另外系统处理明星用户发表时候的延迟,可能会影响到其他的用户,因为其他的用户同一时间发表的话,也会受到这个系统的影响。我们就考虑这个系统怎么改进。首先是推模式,这肯定是延迟的首要原因,我们要把这个问题解决掉。其次我们的用户越来越多,这个数据库表从一百万到一亿,数据规模不一样处理方式是有差别的。我们第一版单库单表的模式,当用户数量增多的时候,它不能满足就需要进行拆分。第二个是锁表的问题,我们考虑的是更改引擎。另外一个是发表过慢,我们考虑的是异步模式。 第二版我们进行了模块化,我们首先做了一个层,做了拆分,最右边的发表做了异步模式。第二个服务层,我们把微博基础的单元设计成服务层一个一个模块,最大是对推模式进行了改进。首先看一下投递模式的优化,首先我们要思考推模式,如果我们做一下改进把用户分成有效和无效的用户。我们一个用户比如说有一百个粉丝,我发一条微博的时候不需要推给一百个粉丝,因为可能有50个粉丝不会马上来看,这样同步推送给他们,相当于做无用功。我们把用户分成有效和无效之后,我们把他们做一下区分,比如说当天登陆过的人我们分成有效用户的话,只需要发送给当天登陆过的粉丝,这样压力马上就减轻了,另外投递的延迟也减小了。

微博的商业化进程研究-以新浪微博为例

微博商业化进程研究 以新浪微博为例 内容提要:2011年1月份新浪微博推出增值收费服务——“短信微博高级会员特权”,这一举动被业内人士认为是新浪微博开始商业化运作的标志性动作。经过半年的摸索,新浪微博商业化正在不断推进,但是因为运营成本高,数据积累不够,政策不确定性等等因素,新浪微博商业化未来依然迷茫。因此,新浪微博商业化遇到的困难分析,采取的措施以及商业化的未来展望将是本篇论文的重点。 关键词:微博商业化新浪用户体验微博广告企业微博 正文 “随时随地分享身边的新鲜事儿”。这是一句亿万网民尤其是新浪微博用户再熟悉不过的话,在过去一两年间也照此行事。聚会大家低头争相“刷微博”、酒桌上大家分享新闻之类的现象司空见惯。毫无疑问,微博是新浪期待已久的机会。此前,随着用户需求的升级,腾讯、百度一路绝尘,网易依靠游戏,搜狐通过搜狗、畅游、视频等增值业务巩固了优势,而新浪这家中国最老牌的互联网媒体公司却在竞争中逊色不少—一直缺乏制敌的“杀手锏”。 [1] 但是,一度引领乃至成为“微博”代名词的新浪,却没有从中获益。在微博如火如荼之时,外界丝毫不怀疑,新浪可能因微博成为中国互联网又一家平台级公司。 但如今,外界的预期已大不如从前。2011年全年,新浪应占净亏损3.021亿美元①。亏损的原因之一是微博的高投入;二是新浪投资的麦考林和中国房产信息集团股价大跌造成贬值亏损达2.815亿美元。按新浪CEO曹国伟之前的说法,微博2011年将产生收入,2012年将产生规模化收入。但现在看来,新浪微博的商业化远没想象来得快。 为应对支出大幅上涨压力,新浪加快了微博商业化的步伐。2011年1月份新浪微博推出增值收费服务——“短信微博高级会员特权”,这一举动被业内人士认为是新浪微博开始商业化运作的标志性动作。 经济之声特约评论员、新媒体营销专家贾敬华认为,新浪微博正式推出增值收费的高级会员服务并非其开始商业化运作的标志性动作,仅仅只是一种尝试。从它的平台发展来看,新浪微博这个平台已经搭建完毕,而且它推出了开放的政策,从这个动作上来说,它正在搭建一个微博的产业链。但是综合各方面的状况来看,新浪微博的产业链目前还在完善过程中,如果说它的收费是一种商业化的标志,我觉得还不是太恰当,只能说是一种尝试。” 贾敬华表示,整个微博平台的商业开发还远远没有到挣钱的时候,微博平台要想实现盈

微博现状讲解

北京航空航天大学 微博分析 1 综述 随着网络的快速发展和普及。微博作为一个信息分享、获取以及传播的平台,以其快速传播、实时搜索等特点,已成为当代人们抒发情感,分享信息,获取资源必不可少的工具。 本文主要对近两年国内微博信息搜索发展和应用情况进行分析。 2 微博使用现状 2.1 微博使用情况 根据中国物联网信息中(CNNIC)公布的《第35次中国互联网发展状况统计报告》,截止2014年12月,我国网民规模6.7亿,使用微博用户2.49亿,网民使用率38.4%,相较2013年底下降7.1%(如图 2-1所示)。而CNNIC《第35次中国互联网发展状况统计报告》中“2013年-2014年中国网民各类互联网使用过的使用率统计表”(如表1所示)显示同为交流沟通类应用中即时通信应用使用率增长率10.4%,微博应用使用率下降11.4%,电子邮件应用下降 2.9%,由以上数据不难看出微博、电子邮件等交流沟通类应用使用率出现下降的主要原则在于其在即时通信上的劣势导致。 图2-1 2013年-2014年微博客/手机微博客用户国模及使用率(数据来源:CNNIC)

北京航天航空大学 表 1 2013年-2014年中国网民各类互联网使用过的使用率统计 2.2 微博信息检索 2.2.1 微博信息检索概况 尽管2013年-2014年网民对微博的使用率存在下降的趋势,但微博自身快速传播、实时搜索等特点依然使微博在信息检索中存在一定优势。 根据中国物联网信息中(CNNIC)发布的《2014年中国网民搜索行为研究报告》,截止2014年6月,95.4%的搜索用户通过综合搜索网站搜索信息,除此之外搜索用户在购物网站、视频网站、资讯类网站、微博上进行搜索的比例分别达到78.5%、75.2%、57.2%和57.1%(如图 2-2所示)。而随着手机的快速发展,网民从PC 端向手机端持续转移,更多的人使用手机进行搜索,而用户实际微博搜索的比率则为58.1%高于PC端48.8(如图2-3所示)。

相关文档
最新文档