社交图谱挖掘与社会化推荐引擎
挖掘社交媒体数据的方法与应用

挖掘社交媒体数据的方法与应用社交媒体成为了人们日常生活中不可或缺的一部分。
随着人们在社交媒体上的活动不断增加,海量的社交媒体数据也随之涌现。
这些数据蕴含着丰富的信息,对于个人用户和商业机构都有着重要的意义。
因此,如何挖掘并利用这些社交媒体数据已成为一个备受关注的话题。
一、数据的收集与存储要挖掘社交媒体数据,首先需要进行数据的收集与存储。
常用的方法是利用API(应用程序编程接口)从社交媒体平台上获取数据。
例如,通过Twitter的API可以获取用户的关注列表、发帖内容等信息。
获取到的数据可以使用数据库进行存储,如MySQL、MongoDB等。
同时,还需要进行数据清洗和去重,确保数据的质量和完整性。
二、数据的预处理社交媒体数据通常是非结构化的,包含大量的文本、图片和视频等内容。
因此,在进行数据挖掘之前,需要对数据进行预处理。
常见的预处理操作包括分词、去除停用词、词性标注等。
还可以利用自然语言处理技术进行情感分析,了解用户对不同主题的态度和情感倾向。
三、数据的分析与挖掘数据经过预处理后,可以进行进一步的分析和挖掘。
其中,文本挖掘是重要的一环。
可以基于机器学习的方法进行主题分类,识别用户对某一主题的兴趣。
另外,也可以进行实体识别,提取文本中的关键实体,如人名、地址等。
此外,社交媒体数据还可以进行社交网络分析,探索用户之间的关联和影响。
通过分析用户的关系网络,可以推断用户的兴趣和行为倾向。
四、数据的应用场景社交媒体数据的挖掘可以应用于多个领域。
在市场营销中,可以利用用户的社交网络信息进行精准的推广和定向广告投放。
例如,根据用户的兴趣和关系网络,向目标用户推荐个性化的产品和服务。
在舆情分析中,社交媒体数据可以用来监测和预测公众对某一事件或产品的关注和态度。
还可以应用于疫情防控,通过监测社交媒体上的信息,及时了解疾病传播的趋势和疫苗接种情况。
总之,挖掘社交媒体数据具有重要的意义和潜在的应用价值。
通过有效的数据收集、预处理和分析,可以从数据中提取出有用的信息,为个人用户和商业机构带来新的机遇和洞察力。
社交网络数据挖掘与分析

社交网络数据挖掘与分析一、社交网络数据挖掘概述社交网络数据挖掘是一种从社交网络中提取有用信息的技术过程。
因为社交网络已经成为了很多人生活的一部分,所以社交网络数据挖掘也变得越来越重要。
社交网络数据挖掘可以用于许多领域,例如社交推荐、情感分析、社交媒体营销等。
二、社交网络数据挖掘方法社交网络数据挖掘有许多方法,包括:文本挖掘、网络分析、机器学习等。
下面分别介绍它们的具体内容。
1. 文本挖掘文本挖掘是从文本数据中提取知识的过程。
在社交网络中,文本数据通常是指用户发表的帖子、评论、私信等。
文本挖掘的任务包括情感判断、主题提取、关键字提取等。
以情感判断为例,我们可以通过分析用户发表的评论来判断用户对某个话题的态度是积极的还是消极的。
2. 网络分析网络分析是指分析社交网络中的用户之间的互动关系。
社交网络中的用户可以通过关注、点赞、分享等方式进行互动。
通过网络分析,我们可以了解哪些用户之间交流比较频繁,哪些用户之间交流不太频繁等。
通过对这些数据的分析,我们可以了解用户的兴趣、好友、群组等信息。
3. 机器学习机器学习是指通过训练模型来预测新数据的过程。
在社交网络中,我们可以通过机器学习方法来预测用户的兴趣和行为。
以兴趣预测为例,我们可以通过分析用户的历史行为来预测用户可能感兴趣的话题。
这对于社交推荐来说非常重要。
三、社交网络数据挖掘应用社交网络数据挖掘可以应用于许多领域,下面分别介绍它们的具体内容。
1. 社交推荐社交推荐是指通过挖掘用户在社交网络中的行为数据,提供个性化、精准的推荐服务。
以朋友圈为例,我们可以通过分析用户在朋友圈中发布的内容和与之交互的用户,来向用户推荐他们感兴趣的内容、关注的用户等。
2. 情感分析情感分析是指从文本数据中挖掘出句子或文章的情感(如积极、消极、中立等)。
社交网络中的文本数据非常丰富,通过对用户评论、点赞等行为的分析,我们可以挖掘出用户对某个话题的情感倾向,如用户对某个品牌的态度、对某个事件的反应等。
社交媒体图片数据挖掘与分析研究

社交媒体图片数据挖掘与分析研究随着互联网的快速发展,社交媒体已经成为人们进行交流、分享信息和展示个人生活的重要平台。
在社交媒体上,用户不仅可以发布文字信息,还可以分享大量的图片。
这些图片数据蕴含着丰富的信息,对于了解用户的兴趣、喜好以及社会趋势具有重要意义。
因此,社交媒体图片数据挖掘与分析研究变得越来越受关注。
一、社交媒体图片数据挖掘的意义1. 揭示用户行为和趋势社交媒体上的图片数据可以反映用户的行为习惯和兴趣爱好。
通过对图片进行分析,可以得到用户的偏好、购买意向、生活方式等信息,为企业和广告商提供精准的营销和推广策略。
同时,通过大规模的社交媒体图片数据分析,可以揭示用户间的联系、网络影响力等社交关系,为社会科学研究提供数据支持。
2. 辅助媒体监管和舆情分析社交媒体上的图片数据中潜藏着大量的舆情信息。
通过对图片数据的挖掘和分析,可以发现公众舆情的变化趋势、热点问题以及对事件的态度和情感色彩。
这为政府和媒体提供了重要的参考,帮助它们更好地了解公众的需求和意见,及时做出应对措施。
3. 支持研究和创新社交媒体图片数据挖掘与分析研究可以为学术界提供丰富的研究素材和方法论。
通过分析用户在社交媒体上的图片行为,可以研究社会的文化趋势、审美观念以及创新活动等,为艺术、文化研究和创作提供启示。
二、社交媒体图片数据挖掘与分析的方法1. 图像特征提取社交媒体图片数据通常包含大量的图片文件。
为了能够对这些图片进行挖掘和分析,首先需要对图片进行特征提取。
常用的图片特征包括颜色直方图、纹理特征、形状特征等。
这些特征可以通过图像处理和计算机视觉的方法进行提取,为后续的数据分析提供基础。
2. 图片内容识别除了提取基本的图像特征外,还可以使用深度学习等技术进行图片内容的识别。
通过训练图像识别模型,可以自动识别出图片中的物体、场景、人物等。
这对于理解图片的含义和话题具有重要意义。
通过图片内容识别,可以从海量的图片数据中筛选出特定的主题或领域的图片。
社交网络分析与社交媒体数据挖掘

社交网络分析与社交媒体数据挖掘现代化社会中,人们不再仅仅依赖于面对面的社交,而是更加倾向于使用社交媒体来进行社交。
这个趋势的发生迫使大量数据为人们所掌握,在这些数据中隐藏着丰富的信息,隐藏在社交媒体平台上的信息尤其重要。
社交网络分析和社交媒体数据挖掘为利用这些信息提供了一些可行的方法,使人们能够更好地理解人类行为和交互的深层次因素。
社交网络分析(SNA)是指利用数学和计算机技术来分析社交网络、社交支持网络以及社交资本网络等,从而得到有关社交信任、合作、文化等的相关信息。
SNA将社交关系视为重要组成部分,通过分析不同节点(个人,组织,国家等)之间的联系,可以从不同层面达到理解整个社交网的目的。
社交网络分析的重要性在于它可以揭示不同节点之间的联系,并通过更细致的关系分析,生成更深入的社会关系洞见。
然而,社交网络分析并不是所有类型的社交媒体数据挖掘工具的终点。
社交媒体上提供的信息表面看似简单,但其背后却隐藏着大量数据,例如文字、图片、视频等。
社交媒体数据挖掘(SMD)集中于对这些不同类型的数据进行分析,从而揭示各种社交现象。
与社交网络分析不同的是,SMD聚焦于更多关注人们的行为、态度和意识形态等方面,通过深度学习、机器学习和自然语言处理等技术,将大型数据集中的有用信息提取出来。
企业可以基于这些数据分析的信息来了解公众对其产品或服务的态度,描述潜在顾客,以及预测产品趋势等诸多方面。
当SNA和SMD的数据集被组合到一起时,产生的信息准确性和可用性相比单个技术增加了很多。
一个例子是, SNA和SMD已经成为许多企业在购买新市场准入的战略决策中使用的基础数据。
在医疗领域,社交媒体平台可以通过对大众传染病爆发的分析来进行系统疫情监测,以便更好的保护恐惧的民众。
因此,社交网络分析和社交媒体数据挖掘不仅在学术界有理论价值,而且也对商业和公共政策有实际用途。
虽然社交网络分析和社交媒体数据挖掘为我们提供了丰富的信息,我们在分析它们时也面临一些挑战和问题。
社交媒体领域数据挖掘技术在社交网络中的应用

社交媒体领域数据挖掘技术在社交网络中的应用近年来,随着社交媒体的普及和用户数量的急速增长,社交网络逐渐成为人们沟通交流的重要平台。
然而,这些平台中所产生的庞大数据量却给人们带来了一定的管理和分析困惑。
为了更好地理解和利用这些海量数据,社交媒体领域的数据挖掘技术开始得到广泛应用。
本文将探讨社交媒体领域数据挖掘技术在社交网络中的应用。
一、用户分析社交媒体平台积累了大量用户个人信息和行为数据,通过数据挖掘技术,可以进行用户画像的创建,帮助平台进行优化和个性化推荐。
这些技术可以识别用户的兴趣、喜好、行为模式等,并根据这些信息为用户提供更加精准的服务。
其次,社交网络中用户的社交关系分析也是数据挖掘技术的一个重要应用方向。
通过分析用户之间的互动情况、社交圈子和社交影响力等指标,可以了解用户之间的关系网络,并通过这些数据为用户推荐适合的社交圈子、好友或相关内容。
二、内容挖掘社交媒体平台每天都会产生大量的文本、图片、视频等内容。
通过数据挖掘技术,可以对这些内容进行挖掘和分析,提取出其中的信息和主题。
例如,通过文本挖掘技术,可以自动识别出内容中的情感倾向、关键词和主题等。
这不仅有助于用户更好地了解和筛选社交媒体上的信息,还可以为平台提供更加有效的内容推荐。
三、舆情监测社交媒体平台成为了用户表达观点、分享感受和批评产品的重要场所。
通过数据挖掘技术,可以对社交网络中的舆情进行实时分析和监测。
例如,可以通过情感分析技术,对用户在社交媒体上对产品或事件的态度进行判断,及时发现用户的需求和问题,并进行相应的处理和优化。
四、社交广告社交媒体平台的商业化进程促使了社交广告的兴起。
通过社交媒体的数据挖掘技术,可以对用户的个人信息、行为数据进行分析,实现广告的精准投放。
例如,根据用户的兴趣、地理位置和社交关系等信息,将广告投放给潜在的目标用户,提高广告的效果和转化率。
总结社交媒体领域数据挖掘技术在社交网络中的应用广泛且成效显著。
通过对用户行为、社交关系、内容和舆情等数据的挖掘和分析,可以更好地理解用户需求,优化用户体验,提供个性化的推荐和服务。
社交媒体挖掘中的数据采集与分析工具

社交媒体挖掘中的数据采集与分析工具随着社交媒体的普及和用户数量的不断增长,社交媒体平台成为了获取大量用户数据的重要来源。
社交媒体挖掘充分利用了这些数据,帮助企业、研究人员和政府机构了解用户行为、市场趋势和舆情动态。
在社交媒体挖掘中,数据采集与分析工具起着关键作用。
本文将介绍一些常用的社交媒体挖掘数据采集与分析工具。
一、数据采集工具1. Social MentionSocial Mention是一款免费的社交媒体搜索工具,能够实时搜索和分析包括博客、微博、新闻、论坛等在内的各种社交媒体平台上的内容。
它提供了一系列的指标,如提到次数、情感分析、关键词云等,帮助用户获取关于特定话题的信息。
2. NetvizzNetvizz是一个用于Facebook数据提取的工具,可以从Facebook页面或个人账户中获取数据。
它提供了多种数据格式的导出选项,如CSV、GDF和Gephi,方便用户进行后续的数据分析和可视化。
Netvizz还支持获取用户的社交网络、帖子和评论等数据。
TAGS是一款免费的Twitter数据采集工具,可以通过Twitter的API获取关键词相关的推文数据。
用户只需输入关键词,TAGS 便会自动收集与该关键词相关的推文,并导出为Excel格式。
TAGS还提供了采集频率和时间范围的设置,方便用户根据需求进行数据采集。
二、数据分析工具1. GephiGephi是一款开源的网络分析和可视化工具,适用于分析和可视化社交网络数据。
它提供了丰富的网络分析算法和布局算法,如度中心性、紧密度和社区检测等。
Gephi还支持自定义节点和边的显示样式,用户可以通过可视化图表更好地理解和展示社交网络数据。
2. TableauTableau是一款流行的商业智能工具,可以对社交媒体数据进行分析和可视化。
它支持多种数据源的导入,如Excel、CSV和数据库等。
用户可以通过简单的拖拽操作实现数据的探索和可视化,也可以使用内置的数据分析功能,如数据透视表、计算字段和数据预测等。
社交媒体的数据挖掘

社交媒体的数据挖掘在当今信息化的社会,社交媒体已经成为人们日常生活的重要组成部分。
从 Facebook 到Twitter,再到微信和微博,这些平台不仅为个人提供了表达自我的机会,也为企业和组织提供了丰富的数据源。
数据挖掘作为一种分析和处理信息的方法,能够深入洞察用户行为、社交趋势及市场变化,促进决策的优化与创新。
数据挖掘的概念数据挖掘指的是从海量数据中提取潜在信息和知识的过程。
它涉及多种技术,包括统计分析、机器学习、模式识别等。
通过这些技术,数据挖掘能够发现数据中隐藏的规律和趋势。
这对于社交媒体来说尤为重要,因为其用户生成的内容量庞大且多样,蕴含着丰富的用户行为和偏好信息。
社交媒体数据的类型社交媒体产生的数据主要可以分为以下几类:1. 用户生成内容:用户在社交媒体上发布的帖子、评论、照片和视频等。
2. 社交关系数据:用户之间的关注关系、评论互动及分享行为。
3. 用户行为数据:用户在平台上的浏览记录、点赞行为及转发记录。
这些数据为分析用户的偏好、社交网络结构以及传播模式提供了基础。
数据挖掘的应用用户行为分析社交媒体数据挖掘可以用于分析用户行为,通过关注用户在平台上的活动,帮助企业理解用户的偏好和需求。
例如,通过分析用户的互动频率和内容偏好,企业可以制定更有针对性的营销策略。
舆情监测社交媒体是信息传播的快速通道,舆情监测可以实时追踪热点话题和用户情感走向。
应用数据挖掘技术,企业可以快速捕捉用户对品牌或事件的态度,及时调整市场策略,避免潜在的公共关系危机。
内容推荐系统数据挖掘技术被广泛应用于社交媒体平台的内容推荐系统。
通过分析用户的历史行为和偏好,系统能够向用户推送更符合其兴趣的内容,提高用户留存率和互动率。
社交网络分析社交网络分析旨在挖掘用户之间的关系结构及信息传播路径。
通过分析社交关系数据,研究人员可以识别出网络中的关键节点和影响力人物,这对于市场营销和信息传播策略都有重要意义。
挑战与未来尽管社交媒体的数据挖掘带来了诸多优势,但也面临一系列挑战。
社交媒体数据的分析与挖掘教程

社交媒体数据的分析与挖掘教程社交媒体已经成为人们日常生活中不可或缺的一部分,每天都有大量的信息在各种各样的社交平台上产生和传播。
这些海量的数据中蕴含着极其有价值的信息,有助于企业做出更明智的决策、了解消费者需求,并提升营销策略的效果。
本文将介绍基础的社交媒体数据分析与挖掘方法,并提供一些实用的教程和技巧。
1. 社交媒体数据的采集在进行社交媒体数据的分析与挖掘之前,我们首先需要采集大量的数据。
针对不同的社交平台,我们可以选择不同的工具进行数据采集。
例如,Facebook提供了强大的API,可以通过开发者平台获取用户信息、帖子、评论等数据。
Twitter也提供了类似的API,我们可以通过调用API来获取用户的推文、转发、点赞等信息。
此外,还有一些第三方工具如:Social Mention、Hootsuite等,可以帮助我们采集来自不同社交平台的数据。
2. 社交媒体数据的清洗与整理采集回来的社交媒体数据中往往包含大量的垃圾信息和冗余数据。
因此,在进行数据分析与挖掘之前,我们需要对数据进行清洗和整理。
首先,要去除重复的数据和垃圾信息,确保数据的准确性和可靠性。
其次,要对数据进行结构化处理,将其整理成易于分析的格式,比如使用Excel或数据库等。
最后,要进行语义分析和标注,可以利用自然语言处理的技术,将文本数据标注成不同类别的情绪、主题等。
3. 社交媒体数据的文本分析社交媒体数据中包含大量的文本信息,通过对文本数据的分析,我们可以了解用户的意见、情感、需求等。
常见的文本分析方法包括情感分析、主题模型和词频分析。
情感分析可以识别出文本中的情感倾向,判断用户对某个产品或事件的态度是正面的、负面的还是中性的。
主题模型可以提取出文本中的主题,例如在产品评论中可以找到关于产品质量、性能、价格等的主题。
词频分析可以统计文本中各个词汇的出现频率,从而了解关注点和热度。
4. 社交媒体数据的网络分析社交媒体数据中的关系网络是非常有价值的信息。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多模型组合提高精度 • • Boosting Random Forest
离线评估/模型更新自动化
• • • MAE/RMSE AUC 训练、评测、更新自动化
线上实验 • • A/B test 实时报表反馈
摘要
• • • • • • • • 人人应用研究中心简介 社会化图谱挖掘案例概述 图谱挖掘一:社会化推荐系统概览 图谱挖掘二:好友推荐算法库 图谱挖掘三:好友亲密度模型 图谱挖掘四:好友智能分组算法 图谱挖掘五:热点内容检测及传播分析 社会化图谱挖掘主要任务归纳及展望
前沿关键技术成果
• 涉及图挖掘学习、文 本挖掘、社区检测
推荐 系统 社交 网络
• 研发面向超海量异构
网状数据的推荐框架 及算法 • 关系推荐、内容推荐 • 研究SNS和SMS的社 会化生态圈 • 社交图谱、兴趣图谱、 信息流
摘要
• • • • • • • • 人人应用研究中心简介 社会化图谱挖掘案例概述 图谱挖掘一:社会化推荐系统概览 图谱挖掘二:好友推荐算法库 图谱挖掘三:好友亲密度模型 图谱挖掘四:好友智能分组算法 图谱挖掘五:热点内容检测及传播分析 社会化图谱挖掘主要任务归纳及展望
• 应用场景举例 – Web端“好友推荐位” • 应用场景举例 – Web端“名片卡”(推荐解释) • 应用场景举例 – Web端“推荐好友新鲜事” • 应用场景举例 – Web端“连续推荐好友” • 应用场景举例 – 移动端 通讯录好友推荐、“附近的人” • 应用场景举例 – Web端照片内容推荐 • 应用场景举例 – “人人头条” • 应用场景举例 – Web端“推荐加入小组小站” • 应用场景举例 – Web端“推荐聊天群” ….
摘要
• • • • • • • • 人人应用研究中心简介 社会化图谱挖掘案例概述 图谱挖掘一:社会化推荐系统概览 图谱挖掘二:好友推荐算法库 图谱挖掘三:好友亲密度模型 图谱挖掘四:好友智能分组算法 图谱挖掘五:热点内容检测及传播分析 社会化图谱挖掘主要任务归纳及展望
数据挖掘案例二:好友推荐算法库
数据挖掘案例一:社会化推荐系统
• 背景:信息爆炸、信息过载
• • • • •
1分钟互联网产生多少数据?
48小时新视频@Youtube 2000000次搜索请求@Google 684478分享消息@Facebook 100000条微博@Twitter 3600张照片@Instagram
“We are
好友申请发送率提高近 100% 首页推荐位发送申请数 提高近70%
好友推荐算法库2:好友簇算法
• 算法原理:
社会网络拓扑结构中存在大量的强关系紧密结构 将用户分成簇,同簇的成员之间具备相近的社交关系
• 好友簇模型: • 效果:
最大团,层次聚类
加好友转化率提高122% 首页推荐位加好友数提高近89%
推荐解 释 数据统 计
实验分流 平台
系统监控
好友 推荐
User
新二度好友/好友簇/关联 规则/用户趋势/…
内容 推荐
协同过滤/内容关联/…
SocialGraph 一度人脉:同学/校友/同事/老乡; 二度人脉;同兴趣;亲人;情人; … 用户 好友 page
Content
基础数据
小站
视频
日志
…
线上统一排序模型
from , Oct. 2011
搜索排序
热点内容发现、预测 好友推荐
导航浏览 优化
新鲜事排序 + 用户关系建模
广告排序优化
from , Oct. 2011
应用研究中心主要工作领域
机器 学习
Mining Social Graph @renren
• 整合并改进机器学习
Friend Rec.
Family
• 好友智能分组及命名算法; • 群/讨论组推荐; • 搜人排序;新鲜事排序
?
? ?
• 二度好友模型、基于加好友趋势预估模型; • 接受率模型; • 通讯录社交图谱合并算法;好友亲密度模型
摘要
• • • • • • • • 人人应用研究中心简介 社会化图谱挖掘案例概述 图谱挖掘一:社会化推荐系统概览 图谱挖掘二:好友推荐算法库 图谱挖掘三:好友亲密度模型 图谱挖掘四:好友智能分组算法 图谱挖掘五:热点内容检测及传播分析 社会化图谱挖掘主要任务归纳及展望
moving from an Information Age to the Recommendation Age. ”
– “The Long Tail ” by Chris Anderson
• 推荐系统:给用户推荐符合其喜好的信息
好友推荐,商品推荐,日志推荐,视频推荐,App推荐,广告推 荐
Amazon, Facebook,Google, Netflix, Youtube, Apple…
Feature Extraction
Regression
。。 Logit
Model Selection
Model Updation
...
Random Forest
Offline Evaluation
多数据源整合生成特征 • • • • Action/Business LOG Cache MySql Hbase
大学同学
人人游戏同 事 商业产品部& 应用研究中心
新入职人人同事
Jun. 2011 renren @李伟
增加近700条边
Jun. 2013
好友推荐算法库4:加好友趋势预估模型
Action Log
Data Collection
Cache
Decistion Tree SVM
线上实验
HBase
Data Preproces sing
社交图谱挖掘与社会化推荐引擎
摘要
• • • • • • • • 人人网及人人应用研究中心简介 社会化图谱挖掘案例概述 图谱挖掘一:社会化推荐系统概览 图谱挖掘二:好友推荐算法库 图谱挖掘三:好友亲密度模型 图谱挖掘四:好友智能分组算法 图谱挖掘五:热点内容检测及传播分析 社会化图谱挖掘主要任务归纳及展望
Products: 可能认识的人、 附近的人
Friend Rec.
Family
• 好友智能分组及命名算法; • 群/讨论组推荐; • 搜人排序;新鲜事排序
?
? ?
• 二度好友模型、基于加好友趋势预估模型; • 接受率模型; • 通讯录社交图谱合并算法;好友亲密度模型
SNS大数据挖掘案例
Interest Discovery
• The method
交互建模
以交互周期为单位增量计算 不同行为赋予不同权重 区分交互对象,人重要于内容 区分短时间连续交互行为与间隔交互行为 资料相似度 共同好友
静态资料建模
图谱挖掘三:好友亲密度模型
• @ 黄晶(85432256): top 15 Strong Renren Friends
• 主要挑战之二
Two-step Link Prediction
x‰
(展示好友推荐) Show (发送好友申请) Invitation 目标 增加总体发送量 提高发送转化率 提升推荐准确度 不足 仅提升发送方的体验 好友关系边增长缓慢 xx % (接受好友申请) Accept 目标 增加好友关系的边数 提高发送-接受转化率 提升推荐准确度 提升双方的体验
好友推荐算法库3:加好友趋势预估模型
• Motivation
• The model
发现用户对不同群组的倾向性 根据用户反馈及时调整倾向性 为用户推送当前时刻最想扩充的群组对应的 好友
有道同事 主站&3G业务 同事
好友最大扩充的方向未必是当前 时间最大的群组
大学同学
有道同 事 人人同 事
推 荐 技 术 多 样 化
推 荐 社 会 化
2010年
Facebook公布 其二度好友推 荐算法,标志 社会化推进技 术逐步成熟。 Hadoop平台已 趋于成熟, Mahout子项目 也逐步丰富
2009年 2007年
Google Personalized News推进个性化 推荐技术影响力 巨大进步 Netflix Prize推荐 大赛结束,推荐 技术开始受到普 遍关注,
图谱挖掘三:好友亲密度模型
• 为什么有用?
好友Ranking UGC Ranking
图谱挖掘三:好友亲密度模型
• 为什么有用?
好友Ranking UGC Ranking
图谱挖掘三:好友亲密度模型 • What matter?
交互行为 用户资料 用户主动排序
特别好友 新鲜事黑白名单
推荐系统历史
推 荐 系 统 诞 生
1992年
Collaborative Filtering算法诞 生,推荐系统 诞生;
GroupLens Project应用CF 到新闻过滤
推 荐 个 性 化
2004年 2003年
Karypis引入个性 化推荐系统并逐 Amazon商品推荐、 步发展 CDNOW音乐专 辑推荐使用Itembased CF; MovieLens电影 推荐;
f1uf2 Nhomakorabeafof
• Computing paradigm
建立好友关系的可能性:有10个 共同好友是有1个共同好友为12倍 HDFS/HBase/MapReduce 线下计算:全量更新4.5小时/次;增量1小 时/次 线上更新:月活跃用户每天2次,日登用户 每天4次
• Results
• The system
Products:人人头条、 横插内容新鲜事推荐 Products: 群聊讨论组推荐、好友分组
Renren Colleagues College mates