一种面向微博用户的标签推荐方法
一种基于标签关联关系的微博推荐方法

一种基于标签关联关系的微博推荐方法
马慧芳;贾美惠子;李晓红;鲁小勇
【期刊名称】《计算机工程》
【年(卷),期】2016(042)004
【摘要】通过分析微博特点及现有微博推荐发现算法的缺陷,提出一种新的微博推荐方法.采用标签检索策略对未加标签和标签较少的用户进行加标,构建用户-标签矩阵,得到用户-标签权重并利用标签信息表征用户兴趣.为解决该矩阵中高维稀疏的问题,通过挖掘标签间的关联关系,继而更新用户-标签矩阵,获得最终的用户兴趣并进行相关推荐.实验结果表明,与忽略标签间关系的微博推荐方法相比,该推荐方法能够更有效地进行微博推荐.
【总页数】6页(P197-201,208)
【作者】马慧芳;贾美惠子;李晓红;鲁小勇
【作者单位】西北师范大学计算机科学与工程学院,兰州730070;西北师范大学计算机科学与工程学院,兰州730070;西北师范大学计算机科学与工程学院,兰州730070;西北师范大学计算机科学与工程学院,兰州730070
【正文语种】中文
【中图分类】TP391
【相关文献】
1.融合标签关联关系与用户社交关系的微博推荐方法 [J], 马慧芳;贾美惠子;张迪;蔺想红
2.一种面向微博用户的标签推荐方法 [J], 陈渊;林磊;孙承杰;刘秉权
3.一种面向微博用户的标签推荐方法 [J], 陈渊;林磊;孙承杰;刘秉权
4.一种基于标签概率相关性的微博推荐方法 [J], 张迪;马慧芳;贾俊杰;余丽
5.基于多标签语义关联关系的微博用户兴趣建模方法 [J], 王艳茹;马慧芳;刘海姣;魏家辉
因版权原因,仅展示原文概要,查看原文内容请购买。
微博推广的几点技巧

微博推广的几点技巧技巧一:微博的基本设置。
像头像,昵称,标签,基本信息等,这里我建议大家的是最好实用真实名字,真实的资料,真实的头像,真实的介绍自己,因为真实的东西让人可信,不断提高被关注的几率,吸引更多粉丝的关注,很一般消费者都是很反感虚假的东西。
还有标签的设置也是很重要的,譬如想谈论“美食”那么我就将美食设立为标签,这样就很有明确性,而且微博会推荐有共同标签或共同兴趣的人加关注,你既可以加关注推荐给你感兴趣的人,其他用户也可以在微博推荐中加关注你。
设置的标签尽可能的多点,这样你被搜索到的几率就大。
技巧二:巧妙的发布微博内容。
我们要根据大众的喜好来发布微博内容,善用大众话题,或者是当今热门话题,如奥运会,精妙将我们营销的内容巧妙的策划进火爆的话题中,增加被用户搜索到的置信区间,引起别人的注意,得到关注,从而达到了营销的目的。
我们一般在发广播的时候,在最火爆关键词加双井号如:#××#。
还有在新发微博的切不可时候不要忙着推广自己的产品,这样不仅得不到别人的关注反而遭到。
先开始我们可以视频多发点搞笑的图片,好看的视频等,去勾起别人对你感兴趣,让他们主动的关注你。
慢慢的等你的听众多了再去推广你的东西,这样转载转载和评论你的乐迷就会更多。
技巧三:培养博客的活跃度。
1.自己去找实况转播一些微博用户收听他们,你收听他们了,一般都是会回听你的,但是广播也要注意不要去收听的都是名人,一般名人不会回听你的。
我们还可以筹组一些话题转播收听,如互听大队、诚信互听、冷笑话,这个方法很好,能带来很多的听众。
2.转发和评论别人的微博,别人也会来回复你,这样就很好的人带起了互动,互动多了微博的活跃度也就高了。
但是不要过分的转播他人的话题,也不要为了多给别人时评就去随便的给别人回复内容,这很容易让人长厌恶。
3.多加入一些微博群,它也是一个能让你展示自己的一个机会的渠道,因为那上面有各种各样的人,总会有人需要对你感兴趣。
微博推广工具详解

工欲善其事,必先利其器!玩微博,也一样。
微博开通过后,无论是官微、个人微博还是草根娱乐微博,都要先取一个好名字,再给它一个定位,然后才能开启你的微博之旅。
玩微博的过程,我个人总结如下:学着玩→玩着学→教别人玩。
对于微博工具的熟悉程度就得因人而异了,但就算没吃过猪肉,难道还没见过猪跑吗?不管你是微博专职运维人员,还是普通微博使用者,下面提到的这些应用你肯定用过或者其中一二。
因为做图篇幅和版面的关系,列举的工具优缺点都一句话代过,在接下来的三篇文章中,我将为大家详细介绍如何深度发掘它们的价值。
第一部分:内容生成。
微博内容离不开文+图+链接三部分,纵然一个微博有千百万粉丝,但长期不更新或者没有好的内容,粉丝肯定是越来越少的,其实质就是:内容决定一切。
这也是当下红人微博在细分领域也有众多粉丝的原因。
内容是一个微博生存的必要条件,如果你的微博找不到好的文字内容,而又亟需,“微博内容库”和“皮皮时光机”这两款应用一定是最好的选择。
它们的内容库里分类明确,并且有关键字搜索功能,而且每条微博连图都配好了,轻击鼠标选择发送即可。
好的图片往往能使微博的传播事半功倍,皮皮就提供了独立的选图功能,让微博内容更加出彩。
“微博段子”是第三方网站,它是通过抓取新浪微博热门微博内容呈现在网站上面。
这个网站是看微博热门、稀奇事的好地方。
其实,新浪微博自带了一个强大的内容库,那就是它的搜索功能。
新浪微博搜索提供了热门转发、评论等微博内容(虽然很多热门转发都是广告,但还是有一些利用价值)。
特别是关键字搜索,想要什么内容就搜关键字,搜出来的热门结果适当改改(鼓励原创,但时间紧可以这样利用),再发到自己微博上往往有异想不到的效果,我在忙时用这招屡试不爽。
现在是读图时代,好的图片往往能使微博传播达到事半功倍的效果。
有时很多图片需要拼接在一起,目前大家熟知的拼图工具除了新浪微博内嵌的,还有美图、可牛和PS等。
而在新浪微博拼图功能出现以前,我发微博时间紧的时候,拼图就用“闻彰拼图”,这个应用使用快捷,可以往四个方向拼贴,并且可以用一组图片拼GIF动态图片。
微博推广方法(共2篇)

微博推广方法(共2篇)微博营销策划方案一份详细的策划书预测了在实施过程中一些可能会出现的问题,也是成功的保证,以下《微博营销策划方案》由策划书为您精心提供,欢迎大学参考学习。
1、策划目标①通过企业微博,提高华人卡的知名度和美誉度,树立品牌形象。
②扩大华人卡产品知名度。
③提高华人卡平台销售的效率,达到预期的销售目标。
④在微博上建比较完善的华人卡销售渠道。
⑤加强与客户的关系,实时沟通,得到顾客体验的反馈。
2、微博营销技巧1)标签:根据不同的时期设置不同的标签,时时刻刻让搜索结果处在第一页;2)互动:创造有意义的体验和互动,客户才会和我们进行交流;3)主动搜索行业相关话题,主动与用户互动;4)善用大众热门话题如_地震_、_代购_,因为它适合微博的每个人;5)话题:我听见你的声音+我在听你说+我明白你说的+达成营销目的;6)有规律地进行更新,每天5_10条,一小时内不要连发两条;7)上班、午休、下午四点后、晚上8点,抓住这些高峰发帖时间;8)让你的内容有连载性,连载会显著提高粉丝的活跃度;9)定期举办活动,能够带来快速的粉丝增长,并增加其忠诚度;10) 微博营销的关键数据:粉丝:新粉丝增长的情况、粉丝的属性、粉丝的来源;微博:每一条微博的曝光、转发、评论;话题:品牌_相关话题_的检测;3、营销策略1)将微博作为官方宣传渠道可以在自己的上发布活动信息,但是如果没有人知道你的,那么这些信息只能在有限的范围内传播。
华人卡应通过多种渠道,发布多个链接,宣传我们的官方微博,以企业官方微博名义,将自己的企业文化,展现在企业微博上,让更多的人了解我们企业的发展,企业的建设等相关的信息。
2)在微博上获取客户监视并发现那些提到竞争对手和行业术语的消息,然后找准时机加入到这些对话讨论中。
最开始,不要显露出销售的意图,这样可能会使潜在用户产生反作用。
首先要态度真诚地给予帮助,最终你会发现一些意想不到的机会来利用这种投资,进而从中获利,而唯一需要我们做的仅仅只是倾听。
利用微博话题推广产品特点和使用方法

利用微博话题推广产品特点和使用方法微博是一款非常受欢迎的社交媒体平台,拥有庞大的用户群体和活跃的用户互动。
利用微博话题推广产品特点和使用方法是一种有效的营销策略。
在本文中,我们将探讨如何利用微博话题来推广产品,并介绍一些使用方法。
一、了解微博话题的特点在开始推广产品之前,首先要了解微博话题的特点。
微博话题是一种用户生成的内容,用户可以通过添加特定的标签将自己的微博和相关主题进行关联。
话题可以是与当前热门事件相关的,也可以是自定义的主题。
微博话题的特点如下:1. 实时性:微博话题更新非常迅速,可以及时了解最新的热点事件和用户关注的话题。
2. 多样性:微博用户可以根据自己的兴趣和需求,创建和关注不同的话题。
3. 用户互动:微博话题可以促进用户间的互动和讨论,增加用户参与度。
二、确定推广产品的特点在利用微博话题推广产品之前,必须明确产品的特点和优势,以便更好地宣传和推广。
根据产品的不同,可以从以下几个方面来确定产品的特点:1. 需求解决:产品是如何解决用户需求和问题的,能够给用户带来什么样的好处和价值。
2. 独特性:产品相比竞争对手有什么独特之处,为何用户应该选择你的产品。
3. 用户体验:产品的易用性,界面设计是否吸引人,用户使用后的体验如何。
三、制定推广策略1. 选择合适的话题:根据产品特点,选择与之相关的微博话题。
可以通过观察热门话题和用户关注度来选择合适的话题。
2. 发布有吸引力的内容:根据产品的特点,撰写有吸引力和价值的微博内容,可以包括产品介绍、使用方法、用户心得等。
同时,可以结合图片、视频等多媒体形式来增加内容的吸引力。
3. 与用户互动:在发布内容的同时,要与用户进行积极互动,回复他们的评论和问题,增加用户参与度。
4. 利用微博工具增加曝光率:微博提供了一些工具和功能,可以帮助用户增加曝光率,如微博广告、微博热门推荐等。
四、案例分析以下是一个利用微博话题推广产品的案例:某电子产品公司推出了一款新型手机,该手机具有高清摄像、超长待机和智能助手等特点。
微博营销的十种操作模式

微博营销的十种操作模式随着社交媒体的普及和发展,微博营销已经成为越来越多企业品牌宣传和推广的重要手段。
在众多的微博营销策略中,有十种操作模式经常被使用。
一、话题营销话题营销是指借助热点话题引导用户讨论,将品牌或产品内容与热点话题联系起来,从而达到宣传和推广的目的。
例如某个节日或大事件经常成为热点话题,品牌可以利用这些时机发布相关内容,并使用相应的标签进行传播。
二、活动营销活动营销是以举办活动为手段,吸引用户参加,同时宣传和推广品牌或产品。
例如举行抽奖活动或打卡活动等,让用户积极参与并分享到自己的社交平台上,从而达到推广的效果。
三、达人营销达人营销是通过邀请有影响力的微博用户转发自己品牌或产品相关内容,让更多用户关注和了解。
这些有影响力的微博用户被称为“达人”,他们的传播力和影响力很大。
借助达人的力量,可以让品牌或产品得到更多的曝光和推广。
四、微博广告微博广告是微博提供的一种商业服务,通过购买广告位来投放广告宣传品牌和产品,实现营销目的。
微博广告的优势在于广告效果可量化,可以根据广告投放效果来调整投放策略。
五、微博达人合作微博达人是指拥有大量微博粉丝的明星、网红、行业达人等,借助他们的影响力和粉丝量,可以在微博上推广品牌或产品。
与达人合作需要提供优质的合作内容和高额的合作费用,但收益也相应非常高。
六、微博直播微博直播是近年来非常热门的一种营销方式,借助直播平台实时展示品牌或产品的特点和优点,通过直播互动的形式吸引更多用户关注和购买。
微博直播的优势是可以提高用户互动体验和关注度。
七、微博话题挑战微博话题挑战是一种利用挑战性话题吸引用户参与和分享的方式,例如“五秒钟吃掉三个苹果”,通过挑战的形式增加用户的互动和分享,达到品牌的宣传目的。
八、微博大V带货微博大V带货是指通过微博大V的影响力,引导粉丝关注并购买品牌或产品。
大V在微博上分享自己喜欢的品牌或产品,并推荐给粉丝购买,从而达到品牌推广和销售的目的。
如何利用微博进行品牌推广

如何利用微博进行品牌推广微博作为一款社交媒体平台,拥有庞大的用户群体和强大的影响力,成为了品牌推广的重要渠道之一。
然而,要想在微博上成功推广品牌,需要注意以下几点:1. 找准目标用户品牌推广必须有一个精确的定位。
首先要确定目标用户是谁,他们有哪些消费习惯和娱乐需求,喜欢哪些话题和内容,接下来才能有针对性的制定推广方案和内容。
例如,如果你的品牌定位为年轻时尚群体,那么在微博上可以选择发布与时尚、娱乐、音乐相关的内容,引导目标用户关注和转发。
2. 发布高质量的内容好的内容是品牌推广的关键所在。
微博用户习惯于追求新鲜、有趣、有价值的内容,所以推广内容必须具备这些特点。
细节把握至关重要,例如微博配图、文案的语言风格、文字排版、标签的使用、和选题的关联性等等都能直接影响到内容的传播效果。
如果能让用户在刷微博时注意到你的品牌,就成功了大半。
3. 善于使用互动策略互动是社交媒体的本质,也是品牌推广的重要方式。
通过粉丝互动策略,积极参与热门话题和激发用户情感,增加用户留存率,并且增加用户粘性。
例如,可以制定品牌课堂的互动环节,用户参与互动即可获得品牌的小礼品或积分等,激发用户的积极性。
4. 建立与用户的链接建立与用户的链接可以帮助品牌推广更好的进入用户的生活圈子,增加用户的品牌忠诚度。
通过一些小游戏、互动等方式,可以让用户对品牌产生情感,或帮助用户解决日常问题和疑惑,增加品牌的亲和力。
例如,京东的“当当当当达人计划”就是一个比较成功的案例,通过与用户一起选品、试用、评价,形成了品牌与用户之间的紧密联系。
总之,利用微博进行品牌推广需要精准定位目标用户、发布高质量的内容、善于使用互动策略、和建立与用户的链接。
只有通过持之以恒的努力,才能在微博这个广阔的平台上创造出自己品牌的价值。
微博营销成功实施办法的三个步骤

微博营销成功实施办法的三个步骤随着微博的发展,微博营销成了人们常用的营销方式之一,在竞争日益激烈的微博营销中,如何实施微博营销才能成功?微博营销不是盲目的,微博营销要想取得成功,打造成一个受众精准的互动平台很重要!有互动才有人气,没有互动的微博营销平台式失败的.............没有必要的..............浪费精力的................微博营销最大的特点是互动,人与人之间的便捷互动。
140个字,短小,一秒钟的传播时间,迅捷,但却具备了信息社会中能量最大化的最基本优势。
一.寻找微博上的精准用户1.通过标签寻找用户微博上的用户都会根据自己的特点或者喜好为自己的微博贴上不同的标签。
这些标签都是用户自身设定的,最能体现出个人的特点。
根据这些粉丝的特点,我们就可以对他们进行年龄、身份、职业、爱好等方面的归类。
如果我们的目标用户正好和某一类人群重合,则这类微博用户就是我们的目标用户,也是我们需要引导的人群。
2.通过话题找用户微博上的话题是通过#话题名称#来实现的,最大的优点就是我们可以通过微博搜索直接找到参与某个话题讨论的人群。
如果你发现某些用户经常参与#NBA#、#足球#这样的话题进行讨论,而你的企业恰好又是卖运动鞋的,那这些微博用户就是你的目标用户了。
二..让精准的用户成为我们的微博粉丝一个微博要想拥有更多的粉丝,最重要的一条就是要有优质的内容。
微博可写的内容非常多:记录自己每天的想法、心情;自己身边发生的趣事、新鲜事;相关行业的评论;热门话题的讨论;有价值的经验分享等等。
我认为一定要让其他用户通过我们的微博感受到一个真实的自我,只有这样才能赢取用户信任。
单纯的企业信息或者营销信息的发布平台,是非常不受欢迎的。
如果是一家化妆品企业,那么微博的内容可以包括很多方面。
首先,应该是个人信息的展示。
自己的美容小窍门、自己今天遇到的新鲜事、自己今天做了什么、今天心情如何、和朋友聊天中提到的趣事等等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
标签推荐方法。
关 键 词 :微博;特征分析;标签源;标签推荐
中图分类号:TP391.1
文献标识码: A
文章编号:2095-2163(2011)03-0021-06
A Tag Recommendation Method for Microblog Users
CHEN Yuan, LIN Lei, SUN Chengjie, LIU Bingquan (School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China)
1.3 微博信息 微博信息的组织方式比较复杂,是嵌套式的。 与用户信
息 一 样 ,微 博 信 息 也 有 唯 一 标 识 符 ,微 博 ID,用 于 数 据 的 管 理 ,新 浪 微 博 中 该 ID 是 连 续 增 长 的 ,即 微 博 ID 与 微 博 发 布 时 间 是 正 相 关 的 ,Cheong[1]在 分 析 twitter[2-7]平 台 上 的 微 博 数 据 时 就 使 用 过 该 特 性 ,用 微 博 ID 做 特 殊 的 时 间 标 注 。 从 新 浪 微 博 的 微 博 ID 中 还 能 看 出 ,新 浪 微 博 的 微 博 总 数 已 经 超 过 了 100 亿 条 。
战,但却因其充分代表了微博的特点,因而具有更大的研究 价 值 。 腾 讯 微 博 比 新 浪 微 博 起 步 晚 ,虽 然 腾 讯 利 用 自 身 QQ 用户群体庞大的优势,迅速占据了微博的一大片市场,但新 浪微博似乎显得更为纯粹, 而且新浪微博开放平台提供的 API 比 腾 讯 微 博 开 放 平 台 提 供 的 API 更 完 善 , 更 利 于 抽 取 数据以做进一步的研究工作。 基于以上的原因,本文选择的 研究对象为新浪微博。
用户信息主要包括三类:唯一标识信息、基本描述信息 和 活 动 信 息 。 用 户 UID 和 微 博 昵 称 是 一 一 对 应 的 ,都 唯 一 标 识 了 一 个 用 户 。 用 户 UID 用 于 后 台 数 据 管 理 ,在 新 浪 微 博 中 是 一 个 随 机 生 成 的 10 位 数 字 。 微 博 昵 称 用 于 用 户 交 流 ,可 以是用户真实姓名,也可以是个性化的称呼。 地址、个人描 述、用户标签和性别属于用户的基本描述信息,显式地表现 了用户的特征,其中,用户标签和个人描述对用户特征的刻 画最直接。 粉丝数、关注数、微博数、创建时间和微博认证是 用户的活动信息,间接表现了用户的各种特征,如影响力、
Abstract: The paper first makes a comprehensive analysis for the information of domestic microblog platforms, then introduces the definition of microblog information, points out which part of the complicated microblog information is more important, what is included in the information and how the information is organized. After that, it chooses Sina Microblog for study and designs a crawler by using its API to collect a large number of user information. Furthermore, the paper makes a quantitative analysis of user information by using the number of user's friends, fans and microblogs. At last, the paper puts forward different tag recommendation strategies for different user groups by using the result of analysis. Key words: Microblog; Feature Analysis; Tag Source; Tag Recommendation
图 4 显示的是关注人数很少, 而粉丝数较多的用户按 照发布的微博数量产生的统计结果。 该类用户的数量为 8 213 位 ,占 数 据 集 总 人 数 的 1.78%,比 例 很 小 。 该 用 户 群 体 的 一个明显特征是大部分用户微博数较多, 发布微博数在 100 条 以 上 的 用 户 占 该 群 体 的 52.3%,查 看 这 部 分 用 户 信 息 后发现这些用户主要是一些信息发布源,包括广告、生活小 常 识 和 笑 话 等 ,典 型 的 用 户 有 “免 费 打 折 大 全 ”、“全 球 潮 流 风尚”、“幽默基地”等。
发布微博的数量反映了微博用户的活跃程度, 因此本 文主要以用户发布微博的数量作为对用户进行特征分析的 依据。 图 3 显示的是关注人数和粉丝数均很少的用户按照 发布的微博数量产生的统计结果。 这里选取的阈值是 5,即 关注人数或粉丝数小于 5 则称为很少, 下面的分析中出现 的关注人数很少或粉丝数很少均使用该定义。 在数据集中 关 注 人 数 和 粉 丝 数 均 很 少 的 用 户 数 量 为 22 848, 占 总 数 的 4.95%。 该 用 户 群 中 发 布 的 微 博 总 数 在 10 条 以 下 的 用 户 数 为 14 201,占 该 用 户 群 的 62.2%,占 总 数 的 3.08%。 如 果 将 关 注 人 数 和 粉 丝 数 均 小 于 5,且 发 布 的 微 博 数 小 于 10 的 用 户称为极不活跃用户的话,那么根据以上分析,再考虑不活 跃用户数据更难被抽取, 可以估算出新浪微博极不活跃用 户数量在 3%以上。
1 微博信息的特点
1.1 国内微博平台分析 到目前为止,国内四大门户网站新浪、腾讯、网易、搜狐
均推出了自己的微博服务,虽然还有很多其力和规模上来看, 都远不如上述四大门户网站的 微博平台, 尤其是新浪微博和腾讯微博, 其用户数量早在 2011 年 年 初 就 均 已 过 亿 ,是 国 内 微 博 的 领 跑 者 。 新 浪 微 博 和腾讯微博一个很大的特点就是规模庞大, 其使用者几乎 覆盖了所有年龄段、所有行业的人群,话题覆盖面广,信息 量大, 同时也十分杂乱, 对其研究者而言是一个巨大的挑
第1卷 第3期 2011 年 10 月
智能计算机与应用 INTELLIGENT COMPUTER AND APPLICATIONS
Vol. 1 No. 3 Oct. 2011
一种面向微博用户的标签推荐方法
陈 渊, 林 磊, 孙承杰, 刘秉权
(哈尔滨工业大学 计算机科学与技术学院,哈尔滨 150001)
在网页上显示的微博创建时间可分为相对时间和绝对 时间。 对于距当前时刻较远的时刻,如几天以前则显示绝对 时 间 “XX 年 XX 月 XX 日 XX”; 对 于 距 当 前 时 刻 较 近 的 时
2 用户特征分析
2.1 数据集选取 面对新浪微博庞大的用户群体, 需要根据不同类型用
户 的 特 征 选 择 不 同 的 标 签 推 荐[8-10]方 法 ,因 此 首 先 需 要 随 机 抽取大量的用户信息,分析其特征。 为了达到随机抽取用户 信息的目的,需要设计一个爬虫程序。 该爬虫程序利用新浪 微 博 API 实 现 ,数 据 的 抽 取 方 式 为 :首 先 获 取 实 时 的 公 共 微 博 , 提 取 微 博 发 布 者 的 用 户 ID, 根 据 该 ID 获 取 用 户 信 息 , 主要包括用户的关注人数、粉丝数和发布的微博数等。 本次
的信息,体现了大多数人使用微博获取信息的特点。
在关注人数和粉丝数均很少的用户群中还存在一些发 布 微 博 较 多 的 用 户 ,从 图 3 中 可 以 看 出 ,发 布 微 博 数 在 100 条 以 上 用 户 数 为 1 776,只 占 总 数 的 约 0.4%。 通 过 查 看 该 类 用户的微博信息, 发现这类用户主要将微博当做一种记事 或者写心情等的工具, 而不同于大多数用户对微博的理解 和使用。
0 引言
微博的诞生和飞速发展给互联网用户的生活带来了巨 大的影响,因其以新颖的表现形式出现在用户面前,吸引了 大量的用户群体,蕴含着巨大的商业价值和研究价值。 近两 年 内 ,国 内 微 博 发 展 速 度 惊 人 ,根 据 2011 年 5 月 举 行 的 首 届中国微博大会公布的数据, 中国活跃微博用户数量已经 达 到 2.2-2.4 亿 。 庞 大 的 用 户 群 体 同 时 也 产 生 了 海 量 的 信 息,对相关的信息处理和研究提出了挑战。 标签是微博上提 供的用户描述方式, 是进行微博好友推荐和微博信息推荐 的基础。 但是大多数用户不愿意花时间自己给自己打标签。 本文对国内微博平台的信息特点和用户特征进行了初步分 析, 并在此基础了提出了针对属于不同用户群体的微博用 户的标签推荐方法。
第3期
陈渊,等:一种面向微博用户的标签推荐方法
· 23 ·
数 据抽取时间段为 2011-05-23 至 2011-05-27, 每 间 隔 30 秒 从 公 共 微 博 抽 取 一 次 微 博 数 据 , 设 置 为 每 次 抽 取 100 条 (实 际 有 时 可 能 不 足 100 条 ),从 而 获 取 100 位 用 户 信 息 ,在 大 约 四 天 的 时 间 段 内 获 取 的 总 用 户 数 量 为 461 249 位 。 2.2 用户特征分析
摘 要 :首先对国内微博平台的信息进行了综合分析,主要介绍了微博信息的定义,在错综复杂的微博信息中哪些信息比较重要,以及这
Hale Waihona Puke 些微博信息包含哪些详细的内容,是如何组织的。然后选取新浪微博平台作为研究对象,利用新浪微博 API 设计了爬虫程序,抽取用户信息;