社交网络中基于图排序的好友推荐机制研究与实现(郑佳佳)

社交网络中基于图排序的好友推荐机制研究与实现(郑佳佳)
社交网络中基于图排序的好友推荐机制研究与实现(郑佳佳)

分类号: TP391.1 单位代码:10335

学号:20821043

硕士学位论文

论文题目社交网络中基于图排序的

好友推荐机制研究与实现作者姓名郑佳佳

指导教师王强副教授

学科(专业) 计算机软件与理论__

所在学院计算机科学与技术学院

提交日期2011年1月

A Dissertation Submitted to Zhejiang

University for the Degree of

Master of Engineering

TITLE:Friends Recommendation Based on

Graph Ranking on Social Network Site Author: Jiajia Zheng

Supervisor: Associate Professor Qiang Wang Subject: Computer Software and Theory College: College of Computer Science

Submitted Date: 2011-01

浙江大学研究生学位论文独创性声明

本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得浙江大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。

学位论文作者签名:签字日期:年月日

学位论文版权使用授权书

本学位论文作者完全了解浙江大学有权保留并向国家有关部门或机构送交本论文的复印件和磁盘,允许论文被查阅和借阅。本人授权浙江大学可以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。

(保密的学位论文在解密后适用本授权书)

学位论文作者签名:导师签名:

签字日期:年月日签字日期:年月日

浙江大学硕士学位论文摘要

摘要

随着web2.0技术的蓬勃发展,全球互联网进入了SNS时代。各种不同的SNS 网站不断涌现,如Facebook,twitter,Myspace,Flickr等。在这类网站上,用户可以添加其他用户为好友。对于一个用户,特别是新加入的用户,添加哪些用户为自己的好友成了一个困难的问题。社交网站中好友推荐系统就是针对这一难题而出现的。

本文深刻分析了社交网络上好友推荐机制,研究了热点好友推荐和个性化好友推荐两类问题。

在热点好友推荐部分,我们提出了社交网络中用户的行为模式,从用户档案的创建、内容创建和关系建立三方面来描述用户的行为模式。其次,我们提出了社交网络中网页访问模型。在此基础上,我们设计了一个评价指标来衡量用户的热点度,热点度高的用户被推荐为热点好友的概率大。最后,通过实验,分析了Flickr网站上用户的信息传播贡献值,即热点度的分布。实验发现,热点度的分布成幂分布型。这一结果表明,大多数用户拥有比较小的热点度,只有少部分用户拥有比较大的热点度。

在个性化好友推荐部分,本文将三种算法用于个性化好友推荐问题,三个算法分别是naive算法、Personalized PageRank算法、基于图的多类关联对象降维算法。通过实验分析三个算法在好友推荐中的效果,实验结果表明多类关联对象的降维算法要优于前两种方法。这主要是由于多类关联对象的降维算法利用了更多的用户信息。

关键词:社交网络,信息传播贡献值,热点好友推荐,个性化好友推荐

i

浙江大学硕士学位论文Abstract

Abstract

With the rapid development of web2.0 technology, the global Internet goes into the SNS era. A variety of SNS sites are emerging, such as Facebook, twitter, Myspace, Flickr and so on. In these sites, users can add other users as friends. For a user, in particular, a new user, how to find friends for him becomes a difficult problem. Friends recommendation system is the emergence of this problem on social networking sites.

In this dissertation, we analyze friends recommendation mechanism, and propose two sets of issues: hot friends recommendation and personalized friends recommendation.

In hot friends recommendation section, we propose the concept of user's behavior patterns in social networking sites. Firstly, we describe the user behavior patterns from three aspects: the user profile creation, content creation and relationship building. Secondly, we propose a model of social network siting surfering. And, we design an evaluation indicators to measure the user's hot degree. Hot users are recommended with high probability. Finally, we analyze the distribution of the users' information propagation contribution in the experiment. It was found that the distribution of hot degree is the power-law distribution. The results show that most users have relatively small hot degree, and only a few users have the relatively large hot degree.

In personalized friends recommendation part, we use three algorithms for personalized friends recommendation problem. The three algorithms inlcude the naive algorithm, Personalized PageRank algorithm, and Multi-type Interrelated Objects Embedding(MIOE) algorithm. We anaysize the effect of friends recommendation of three algorithms in experiments. The experimental results show that MIOE algorithm is better than the first two methods. This is mainly because MIOE can use more user information.

Keywords:social network site, information propagation contribution, hot friends recommendation, personalized friends recommendation

ii

浙江大学硕士学位论文目录

目录

摘要 (i)

Abstract (ii)

第1章绪论 (1)

1.1 引言 (1)

1.2 社交网络发展现状 (1)

1.3 本文工作 (3)

1.4 本文组织 (4)

1.5 本章小结 (4)

第2章好友推荐关键技术综述 (5)

2.1 问题描述 (5)

2.2 推荐算法综述 (6)

2.2.1 协同过滤推荐算法 (6)

2.2.2 基于内容的推荐算法 (8)

2.3 图排序技术综述 (11)

2.3.1 PageRank算法 (11)

2.3.2 HITS算法 (13)

2.3.3 Manifold Ranking算法 (14)

2.4 本章小结 (14)

第3章社交网络中热点好友推荐 (15)

3.1 问题描述 (15)

3.2 热点好友评价指标 (16)

3.2.1 社交网络中用户行为 (16)

3.2.2 社交网络中网页访问模型 (18)

3.2.3 评价指标 (20)

3.3 实验 (21)

3.4 本章小结 (25)

第4章社交网络中个性化好友推荐 (26)

4.1 问题描述 (26)

4.2 个性化好友推荐算法 (27)

4.2.1 Na?ve算法 (27)

4.2.2 Personalized PageRank算法 (27)

4.2.3 基于图的多类关联对象降维算法(MIOE) (28)

4.3 实验 (31)

4.3.1 实验数据 (31)

4.3.2 评价指标 (32)

II

浙江大学硕士学位论文目录

4.3.3 算法实验 (32)

4.4 本章小结 (34)

第5章系统设计与实现 (35)

5.1 总体设计 (35)

5.2 数据获取模块 (36)

5.3 推荐算法模块 (37)

5.3.1 热点好友推荐算法 (37)

5.3.2 个性化好友推荐算法 (37)

5.4 界面显示模块 (39)

5.5 推荐结果及讨论 (41)

5.6 本章小结 (42)

第6章总结与展望 (43)

6.1 总结 (43)

6.2 下一步工作 (43)

参考文献 (45)

攻读硕士学位期间主要的研究成果 (50)

致谢 (51)

II

浙江大学硕士学位论文目录

图目录

图1-1社交网站用户年龄构成 (2)

图1-2网络中用户概念增强图 (3)

图2-1简单PageRank的计算 (12)

图3-1人人网热点好友推荐 (16)

图3-2Jack,Bill,Tom之间主要的关系 (18)

图3-3信息传播贡献值分布图 (23)

图3-4基于收藏关系的信息传播贡献值分布图 (24)

图3-5基于好友关系的信息传播贡献值分布图 (25)

图4-1人人网个性化好友推荐 (26)

图4-2MIOE算法考虑的图结构 (29)

图5-1好友推荐系统框图 (35)

图5-2数据获取模块示意图 (36)

图5-3热点好友推荐算法流程图 (37)

图5-4na?ve算法流程图 (37)

图5-5Personalized PageRank算法流程图 (38)

图5-6热点好友推荐界面 (40)

图5-7个性化好友推荐界面 (41)

图5-8个性化好友推荐界面 (41)

IV

浙江大学硕士学位论文目录

表目录

表2-1评分矩阵 (9)

表3-1 Flickr数据统计特征 (24)

表4-1 Friends表 (33)

表4-2 Favorites表 (33)

表4-3 Photo表 (33)

表4-4 数据统计特征 (34)

表4-5 Na?ve算法的准确率和查全率 (35)

表4-6 Personalized PageRank算法的准确率和查全率 (35)

表4-7 MIOE算法的准确率和查全率 (36)

IV

浙江大学硕士学位论文第1章绪论

第1章绪论

1.1引言

随着web2.0技术的蓬勃发展,全球互联网进入了SNS时代。各种不同的SNS 网站不断涌现,如Facebook,twitter,Myspace,Flickr等。在这类网站上,用户可以添加其他用户为好友。对于一个用户,特别是新加入的用户,添加哪些用户为自己的好友成了一个困难的问题。社交网站中好友推荐系统就是针对这一难题而出现的。它不同与一般的推荐系统,有自己的特点。本文研究社交网站中好友推荐机制。

1.2社交网络发展现状

社交网站的定义为基于网页的服务,它允许人们进行[1](1)在一个有界的系统中建立一个公开的或者半公开的档案,(2)和一些用户建立关系,相互分析链接,(3)访问系统中其他人创建的链接。

社交网络,例如MySpace、Facebook、Cyworldy已经吸引了上百万的用户,其中很多人把这些网络融入了每天的生活中。当MySpace在美国及其他国家吸引了大众媒体的关注,社交网站已经在全世界流行。Friendster在太平洋岛屿获得吸引力,Orkut变成巴西主要的社交网站,Mixi在日本获得广泛的接受。Hi5在拉丁美洲的小国家受到关注。当中国的QQ即时消息服务加进去档案及交朋友功能,它变成了世界上最大的社交网站。

具有社交网站性质的博客服务业变得流行。在美国,具有社交网站特性的博客工具,如Xanga,LiveJournal,和V ox吸引了广泛的观众。Skyrock在法国处于主导地位。Windows Live Spaces 主导了世界上的大多数市场,包括墨西哥、意大利和西班牙。其他如QQ,Orkut,Live Space和MySpace一样大。它们在美国和英语媒体报道的比较少,这使得追踪它们的发展变的困难。

社交网站带来的多样化社交网络应用正在改变着人们对互联网的使用习惯,

4

浙江大学硕士学位论文第1章绪论也对中国互联网的发展和普及起到了积极的推动作用,随着各类社交网站在竞争中快速发展,用户规模迅速增长,根据CNNIC测算,截止到2009年底,中国使用交友和社交网站的网民数将达到1.24亿。

图1-1 社交网站用户年龄构成

社交网站用户年龄的年轻化特征非常突出,用户群以20-29岁的青年为主,达到52.6%,在这一年龄段高出全国网民平均水平22.8个百分点,而在其他年龄分段上,均低于全国网民的平均水平。社交网络中用户年龄构成如图1-1所示。

经过三、四年的发展,中国社交网络业务市场雏形已基本形成。2008年三大类SNS网站发展非常迅速。一是以娱乐为主的SNS网站,例如开心网、https://www.360docs.net/doc/6b15088775.html,,这类网站在2008年发展非常迅速,并且在服务模式和盈利模式方面有所突破;二是以服务校园学生为主的校园SNS网站,例如校内网、QQ校友等,这类网站起步最早,并以占据最具活力的大学生群体作为核心竞争优势;三是以商务沟通和交友为主的SNS网站,例如联络家、XING网等,这类网站进入中国较晚,发展较为稳定。

在论坛中,用户的概念仅仅限于一个用户名;在博客中,用户可以发表文章,发表图片等,但是博客与博客之间的联系不够紧密;在社交型网络中,如人人网

4

浙江大学硕士学位论文第1章绪论中,用户具有一个独立的空间,可以在里面更新状态,发表文章,上传照片等等功能。用户与用户之间可以添加彼此为好友,可以评论别人创建的文章、图片等资源。从论坛到博客在到社交网站,用户的概念越来越强,在网络中可以利用来进行个性化分析的资源越来越多。用户概念增强图如图1-2所示。

图1-2 网络中用户概念增强图

1.3本文工作

本文分析了社交网络的发展及社交网络中好友推荐问题。在社交网站上,用户可以添加其他用户为好友。对于一个用户,特别是新加入的用户,添加哪些用户为自己的好友成了一个困难的问题。本文针对这一问题提出了热点好友推荐及个性化好友推荐。

本文的主要工作如下:

1.提出了社交网络中好友推荐问题,皆在帮助用户更好的选择添加好友;

2.提出了社交网络中用于衡量信息传播的指标,利用该指标来做热点好友推荐;

3.提出社交网络中个性化好友推荐问题;

4.比较分析了三种个性化好友推荐算法的优劣。

4

浙江大学硕士学位论文第1章绪论1.4本文组织

本文后续内容的组织形式如下:

第2章是关键技术综述,将介绍好友推荐相关的研究工作,同时也将介绍分用于好友推荐的算法及链接分析技术。

第3章介绍信息传播贡献值,首先分析了社交网络上的用户行为,然后提出了社交网络中网页访问模型,最后提出了信息传播贡献值。利用信息传播贡献值来做热点好友推荐。

第4章提出了个性化好友推荐问题,设计了个性化好友推荐算法。

第5章介绍社交网络中好友推荐系统的设计与实现。首先将给出整个系统的流程图,然后介绍数据获取方法,接着介绍数据统计特性,随后展示推荐系统的界面,最后将实验结果给出分析。

第6章针对本文工作做总结,并对下一步工作作出展望。

1.5本章小结

本章介绍了社交网络的发展现状,阐述了社交网络中好友推荐问题的研究背景,说明了用户推荐的必要性,最后对本文的主要研究工作和内容做了概述。

4

浙江大学硕士学位论文第1章绪论第2章好友推荐关键技术综述

社交网络中的好友推荐问题分为两类,一类是全局意义的受欢迎的用户,我们称它为热点好友;另一类是针对某一个用户来说的好友,我们称它为个性化好友。社交网络中好友推荐问题和一般的推荐问题有其相似的地方,但又有区别。

2.1问题描述

对推荐系统的研究文献很多。很多方法用到协同过滤技术,它利用用户爱好之间的相似性来推荐物品,例如电影。这些方法不依赖于物品的实际内容,而是需要用户对物品的偏好信息,通常通过评价打分的形式。

另一些研究利用物品的内容来推荐。Pazaani et al[2]利用网页包含的单词对网页进行描述,并利用用户的热点网页来建立用户的档案。他们根据档案利用朴素贝叶斯分类器来推荐有趣的网页。Mooney et al.[8]用一个相似的基于内容的方式来推荐书籍。

有些研究利用社交网站的结构来推荐。例如Spertus et al[3]根据现在社区的用户来推荐在线社区给用户,并在一个针对社交网络Orkut的大型研究中比较了几种不同的相似性度量。Geyer et al[4]利用社交网站的信息建立了一个系统来推荐自我描述的主题,指出基于社交网络的推荐优于简单的内容匹配推荐。

上述提到的技术都可以用于社交网络中的好友推荐。例如基于内容相似性的方法可以直接从档案、图片、评论、用户等来计算相似性。基于社交网络结构的方法也可以容易的用来推荐好友。相反,经典的协调过滤方法不能直接用因为她用评分在一个用户和物品组成的非均匀的网络推荐物品。社交网络中的用户推荐机制是推荐好友给用户,没有内容和物品的概念。

利用社交网络的信息在寻找专家是非常相关的一类研究。Ehrlich et al[5]介绍了一个系统,它支持用电子邮件或者聊天信息来帮助用户在他们的社交网络中来寻找专家。不管怎么样,相比之前的研究,我们集中点不在于用户去寻找专家,而在于为了建立链接和交流,给社交网站上的用户推荐好友,与Facebook上的应

42

浙江大学硕士学位论文 第1章 绪论 42

用“你可能认识的人”相似。

2.2 推荐算法综述

2.2.1 协同过滤推荐算法

几十年下来,协同过滤推荐算法已经从抓住用户偏好的算法研究演化到追求效率的的商业系统。在这一章中,我们将介绍被人们熟知的协同过滤推荐算法。Breese et al [6]把协同过滤算法分成两类:基于记忆的算法需要把所有的评分,物品,用户都装在内存中,基于模型的算法离线周期性的创建评分模式的摘要。纯基于记忆的算法在实际应用中的扩展性不好。因此几乎所有的实用算法都是利用预处理的方式来减少时间的复杂度。所以现在实用的算法要么是纯基于模型的算法要么是一些混合的算法。

最著名的协同推荐算法是最近邻算法。我们介绍两类不同的最近邻协同推荐算法:基于用户的最近邻算法和基于物品的最近邻算法。

基于用户的最近邻算法:早期算法基于相似用户的评分对用户进行预测。我们叫这些相似的用户为邻居。如果一个用户n 和用户u 相似,我们把n 叫作u 的邻居。基于用户的算法依据用户u 的邻居对i 的评分对物品i 进行预测。我们可以用所有邻居评分的平均值来对i 评分。如等式一所示, ni r 是邻居n 对i 的评分。 ()(,)ni n neighbors u r

pred u i numberof neighbors ?=∑ 公式(2.1)

等式2.1没有考虑某些用户u 的邻居比另一些与u 更相似。我们能通过给用户加权重的方法给出更精确地预测。如果用(,)Sim u n 衡量一个用户u 和它的邻居n 的相识性,等式2.2给出另一种预测。

()(,)(,).ni n neighbors u pred u i userSim u n r ?=∑ 公式(2.2) 因为用户的相似度相加不等于一,所以这个方法不正确。因此提出规范化后的等式2.3。

浙江大学硕士学位论文 第1章 绪论

42 ()()

(,).(,)(,)ni

n neighbors u n neighbors u userSim u n r pred u i userSim u n ??=∑∑ 公式(2.3) 最后,用户的评分是不同的。比如一个乐观的用户五分里面评四分和一个悲观的用户五分里面评三分。他们的意思都是我喜欢的一部电影,但是用了不同的值。

为了弥补用户评分的不同,公式2.4调整了用户的平均评分。 __

()()(,).()(,)(,)

ni n n neighbors u u n neighbors u userSim u n r r pred u i r userSim u n ??-=+∑∑ 公式(2.4) 第一个协同过滤推荐系统,GroupLens 系统,用Pearson correlation [9]定义公式

2.4中的(,)userSim u n 。Pearson correlation 系数通过比较被目标用户和邻居评分所有物品的分数来计算。公式2.5给出了用户u 和邻居n 之间的Pearson correlation ,,u n CR 表示u 和n 都评分的物品的集合。

__()()(,)ui u ni n i CR r r r r userSim u n ?--=∑

公式(2.5)

Pearson correlation 从完全同意的用户1.0到完全不同意的用户-1.0之间。 基于物品的最近邻算法:基于物品的最近邻算法是基于用户的最近邻算法的变换。基于用户的算法基于用户之间的相似性来产生预测,基于物品的推荐算法基于物品之间的相似性产生预测[7]。对一个物品的预测应该基于用户对相似物品的评分。考虑表格 2-1中的评分矩阵。假设我们预测用户三对“Speed ”(用X 表示)的打分,首先我们观察到“Speed ”和“Sideways ”的评分很相似,与“The Matrix ”不相似。我们通过构建用户三对其他用户的权重平均值对X 打分。既然“Speed ”和“Sideways ”相似,我们猜测“Sideways ”的评分更重要。我们推测一个好的评分是0.25*3+0.75*4=3.75。

浙江大学硕士学位论文 第1章 绪论

42

表格 2-1 评分矩阵

基于物品的推荐算法用公式2.6表示。用户u 对物品i 的预测由用户u 与i 最相似的物品的评分的加权和组成。

()()(,)..(,)(,)ui j ratedItems u j ratedItems u itemSim i j r itemSim i j pred u i ∈∈∑=∑ 公式(2.6)

在公式2.6中,()itemSim 是物品相似度的衡量,不是用户相似度。

求物品对(,)item i j 计算相似性存在多个变种。余弦相似度,最常用的相似性度量

值,用对i 和j 打过分的所有用户来计算。公式2.7给出了余弦相似度公式,

,i j RB 表示对物品i 和物品j 都打过分的用户集合。

__()()(,)ui u uj u u RB r r r r itemSim i j ?--=∑

公式(2.7)

与Pearson correlation 的不同仅在于平均调整用户用户而不是物品。

基于物品的最近邻算法比基于用户的最近邻算法更精确[7]。

2.2.2 基于内容的推荐算法

在基于内容的推荐算法中,物品s 对于用户c 的效用(,)u c s 通过效用(,)i u c s 用户c 对与s 相似的物品i s S ∈来估计。比如在电影推荐应用中,为了推荐电影给用户c ,基于内容的推荐系统试图理解用户c 在过去打分高的电影的共性(特定的

浙江大学硕士学位论文 第1章 绪论 42 演员,导演,类型,主题等)。那些和用户偏好符合的具有高评分的电影被推荐给用户。

基于内容的推荐算法具有信息检索[10][11]和信息过滤[12]的背景。因为信息检索和过滤的显著地进步及基于文本的应用的重要性,现在很多基于内容的推荐系统集中在推荐包含文本信息物品,比如文档,网站,新闻。与传统信息检索方法相比,进步的地方在于利用了包含用户偏好的用户档案。用户档案信息可以明确的得到,比如通过调查或者通过他们的交易行为。

更形式化的,()Content s 表示一个物品档案,即表示物品s 的一组特性。通常从物品s 中提取出的一组特征,用于决定物品是否适合推荐。前面提到,基于内容的系统大多被设计成用来推荐基于文本的物品,在这些系统中,内容通常用关键词来描述。比如一个基于内容的系统Fab system ,推荐网页给用户,用100个最重要的词来描述网页。相似的,Syskill 和Webert 系统[13]用128个最重要的词语来描述文档。词语j k 在文档j d 中的重要性通过权重ij w 来衡量,这个权重可以

通过不同的方法来定义。

在信息检索中,衡量关键词重要性的一个为人所知的指标是TF-IDF 。它的定义如下:假设N 是能被推荐给用户的所有的文档数目,关键词i k 出现在文档j d 中的数目用,i j f 表示。那么,i j TF ,关键词i k 出现在文档j d 中的词频定义如下: ,,,max i j

i j z z j f TF f = 公式(2.8)

这里最大值是所以关键词z k 出现在,z j f 中的最大值。那些出现在很多文档中

的词无非用来区分一个文档是否相关。因此倒文档频率i IDF 和,i j TF 一同使用。关

键词i k 的倒文档频率被定义为: log i i N IDF n = 公式(2.9)

因此关键词i k 在文档j d 中的TF-IDF 权重定义为:

,,i j i j i w TF IDF =?

公式(2.10)

浙江大学硕士学位论文 第1章 绪论

42

文档j d 的内容被定义成:

1()(,...,)j j kj Content d w w = 公式(2.11) 基于内容的系统推荐的物品是与用户以往喜欢的物品相似的物品[13][14][15]。特别的,将用户过去打分过的物品与很多待选的物品比较,最匹配的物品推荐给用户。更加形式化的,用Pr ()ContentBased ofile c 表示包含用户偏好的档案。这个档案通过分析物品的内容,用户的打分得到。比如,Pr ()ContentBased ofile c 可以被定义为一组权重向量1(,...,)c ck w w ,每一个权重ci w 表示关键词i k 对用户c 的重要性,可以用多种技术通过个体评分内容向量被计算出来。比如一些平均化的方法,像Rocchio 算法[16],可以用来计算Pr ()ContentBased ofile c ,作为一个从个体内容向量得到的平均向量[14][17]方面,[13]估一个文档被喜欢的概率用了贝叶斯分类器。Winnow 算法[18]实现这个目的,特别是当存在很多可能特征时[19]

在基于内容的算法中,效用函数(,)u c s 被定义为:

(,)(Pr (),())u c s score ContentBased ofile c Content s =

利用上面提到的基于信息检索的范例来推荐网页,网站或者新闻,用户c 的Pr ()ContentBased ofile c 和文档s 的()Content s 都可以表示为TF IDF -向量c w →和s w →

。效用函数(,)u c s 可以表示为余弦相似度[10][11]:

22(,)cos(,)

.||||||||c s c s

c s K u c s w w w w w w w w →→→→→→==?= 公式(2.12)

K 是系统中总共的关键词数目。

比如,如果用户c 读了很多关于生物信息学的文章,那么基于内容的推荐技术将推荐其他关于生物信息学的文章给用户。因为这些文章比其他主题的文章有更多生物信息学相关的词语(比如基因,测序,蛋白质),因此

浙江大学硕士学位论文 第1章 绪论 42

Pr ()ContentBased ofile c 将用高权重表示这些词i k 。所以利用余弦相似度或相关的衡量标准的推荐系统将对于有高权重的生物信息学的词赋予更高的效用(,)u c s 。

除了传统的基于信息检索的方法,其他的方法也用户基于内容的推荐系统,比如贝叶斯分类器[13][20],机器学习技术,包括聚类,决策树,人工神经网络。这些技术不同与基于信息检索的方法,他们不是利用余弦相似度计算效用,而是基于用统计学习机器学习从数据中学习得到的模型。比如被用户标记的一组相关和不相关的网页,用朴素贝叶斯分类来区分没有被评估的网页。更具体的,利用朴素贝叶斯分类器来估算给定关键词1,,,...,j n j k k 后,网页j p 属于类i C (相关不相关)的概率:

1,,(|,...,)i j n j P C k k 公式(2.13)

2.3 图排序技术综述

互联网中超链接和图结构的分析是互联网检索中的一个重点。其中链接分析技术是网络搜索引擎计算网页得分时候所使用的重要技术之一。

2.3.1 PageRank 算法

为了衡量网页的相对重要性提出了PageRank ,它是基于网络中的图,计算每个网页的排序。PageRank 在搜索中具有重要的作用。对PageRank 给出如下直观的描述:一个网页具有高的排序,如果链入的排序的和是高的[21][22][23]。这包括一个网页具有很多链入或者网页具有一些排序高的链入。PageRank 的定义如下:u 表示一张网页。u F 表示u 指向的一组页面,u B 表示指向u 的一组页面。||u u N F =表示从u 链出的链接数目,c 是一个归一化因子。

定义一个简单的排序,R 是一个简化版的PageRank :

()()u

v B v R v R u c N ∈=∑ 公式(2.14) 注意1c <因为有些网页没有前向链接,它们的权重在系统中丢失了。这个等式是迭代的,但是它可以从任一点开始计算,迭代直到收敛。图2-1展示了传播

关于社交网络的理论研究

关于社交网络的理论研究 社交的逻辑 社交网络的理论研究是一个很久就开始的事情了,以下列出4个基础论断,作为后续产品论述的前提(其实很多在产品中体现的还很不好)。 关系对人的影响在于,六度分隔所描述的是弱连接,通过弱连接,我们可以传递消息,创造合作机会;但如果关注人们之间是如何互相产生影响的,就必须关注强连接,尼古拉斯?克里斯塔斯基将称为“三度影响力原则”(人类行为深受三度以内朋友的影响),这种现象的出现原因,既包括行为习惯上的影响,也包括观念上的影响。 群体对人的影响,主要是极化,即群体愚蠢或群体智慧。理论上,有一个共同的目标,分工互补,就可形成紧密的群。《乌合之众》里讲到,群体对于个体有着极端放大和缩小的能力,可以没有责任的暴虐成为暴民,也可以用高尚情感使之舍生赴死(领袖们打动群众需要言之凿凿,信誓旦旦的重复和强大意志的感染)。情绪化、简单化和跟随成本大大降低,是群对个人行为带来的影响。新浪微博的运营,就是典型的时尚流行话题带动,名人引导,最后完成群体讨论和活跃的。 另一方面,群体是可以产生超越个体的群体智能的,《失控》里称之为“涌现”(整体才具有,孤立部分及其总合不具有的性质)。这个在人类社会尚无很好的范例,亚马逊的相关商

品精准推荐,可能算群体预测吧,但在自然界涌现有很多范例,比如水分子朝一个方向运动会形成漩涡,白蚁可以构筑相当于人类数千层楼高的蚁巢,且通风卫生情况良好。 北京大学计算机系李晓明教授为《大连接》一书所写的推荐语:“社会网络”不仅是‘网络’更是‘社会’,深合我心。互联网的社交产品,就是要遵循规则,帮助用户使用、经营、扩展其社交关系,将整个社交网络经营成良好运转的虚拟社会。 社交的产品 社交产品主要论述四个部分:关系社交产品、内容社交产品、服务社交产品和社交产品的运营。 关系社交产品 扎克伯格在Facebook上市前公开信中写道:“人际关系是社会的基本构成单元……人们分享得越多——即便只是与密友或家人分享——文化就越开放,对于他人的生活和观点的理解也就越深。我们认为,它能够创造更多、更强的人际关系,并帮助人们接触到更多不同观点。”这就是平台型的关系社交产品的主要思路。 实名动态(FEED)、好友关系(推荐)、个人主页(Profile)是关系社交产品的基本构成,持续不断的优化FEED的聚合和展现形态,进而激励更多的分享(含评论转发),不断基于标签推荐用户添加好友,不断引导用户浏览好友的个人空间,以此完成关系链的活跃和建设,其中相册、日志、活动和投票,是关系社交产品的基础分享应用和UGC内容来源。

社交网络用户的心理需求分析

社交网络用户的心理需求分析 用户在社交网络里的行为逻辑是用户个人的真实写照,在社交网络里的自我个性特点,也反映了用户的真实个性,如果能准确把握用户的行为逻辑,那么将有助于你做出符合大众用户的社交功能。一款社交产品的成功必须能够准确把握用户在其中的心理变化,哪些莫名火爆的应用背后到底是什么? 笔者不才,就几个简单的用户行为阐述一下自己的观点,在我简述几个行为的同时,看看你自己有没有同感? 1、不同社交应用的不同社会角色 我们每个人都是如此,在不同的社会场景下,扮演不同的社会角色,即会有不同的表现,这是一种社会效应,即使映射到社交网络,无论在你微博、微信、QQ、人人上,你都扮演着不同的角色,留意一下你自己的各种不同社交应用,每次你打开它一定是不同的意图,继而获取信息和产生内容的初衷也会有所不同。有人会说,我有的好友在不同的社交应用里同时更新一样的内容作何解释?不要忘了,获取社交信息和用户产生内容是两种行为,可能他在获取的阶段是不同的社交初衷。 这就是我为年轻人高呼“爸妈来了,这个应用我不用了”的现象做出的解释,除了青春期遗留下来的逆反心里,企图标新立异有意采取不同的态度和行为来引起别人的注意和得到

社会认同之外,单一的大众性社交应用将现实社会不同场景下的社会关系高度重合在一个社交场景里,难免让人感到“隐私”没了,在不同的场合扮演不同的社会角色的时候自然就有不同的语言行为规范,一个父母面前温顺可人的角色怎么能容忍客串成在朋友当中破粗口胡吃海喝的角色。 从这个角度来分析一些老牌的社交应用里,即使我们经常登录,也再也不会更新内容的现象,因为像 QQ 这样的社交应用,根基太早,从家庭朋友社交场景到工作关系场景,社交关系太过臃肿,不是一个很好的展现自我的平台,还是应该将它着重定位在即时通讯吧。随着微信将手机通讯录和 QQ 好友关系链都移植到了自己的社交关系里,即使在朋友圈里更新可以设置可见范围分组,比起这种在下游手动添加范围,我宁愿有个从始至终都是一个社会场景的应用。 还有两个相对成型的特定社交分类,即职业社交与婚恋交友,用户其实都是在扮演特定的社会角色;婚恋网站https://www.360docs.net/doc/6b15088775.html,的邵光荣曾表示,社交本身并不是需求,而是手段,不同的社交都是有着不同的目的,一旦某个平台的社交功能无法达到用户的目的,用户也就会沉默或离开,社交其实也就不存在了。意思无外乎也是说用户需要扮演角色来达到某种目的。 2、自我“隐私”保护和窥探他人“隐私” 为什么要在隐私上加引号?因为在社交网络我们自主公开的生活隐私不能纯粹意义上算隐私。先说说第一种行为,你的好友会经常直播自己的生活或者一天上传几十张自拍照,人类是群居动物,群居本能分两级:第一级寻求群体认可,心理学上认为,“爱向别人炫”是一

社交网络中基于图排序的好友推荐机制研究与实现(郑佳佳)

分类号: TP391.1 单位代码:10335 学号:20821043 硕士学位论文 论文题目社交网络中基于图排序的 好友推荐机制研究与实现作者姓名郑佳佳 指导教师王强副教授 学科(专业) 计算机软件与理论__ 所在学院计算机科学与技术学院 提交日期2011年1月

A Dissertation Submitted to Zhejiang University for the Degree of Master of Engineering TITLE:Friends Recommendation Based on Graph Ranking on Social Network Site Author: Jiajia Zheng Supervisor: Associate Professor Qiang Wang Subject: Computer Software and Theory College: College of Computer Science Submitted Date: 2011-01

浙江大学研究生学位论文独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得浙江大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:签字日期:年月日 学位论文版权使用授权书 本学位论文作者完全了解浙江大学有权保留并向国家有关部门或机构送交本论文的复印件和磁盘,允许论文被查阅和借阅。本人授权浙江大学可以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 (保密的学位论文在解密后适用本授权书) 学位论文作者签名:导师签名: 签字日期:年月日签字日期:年月日

社交网络用户行为的研究.

社交网络用户行为的研究 摘要:社交网络是近几年产生、发展、兴起的,给人们的现代生活带来了巨大的影响和冲击。社交网络具有传统网络的一般特征,又具有其独特性,它是以人为中心建立的网络社 交。社交网站是互联网由分散的网络应用向以人为中心的网络应用平台转化的必由之路,是互联网发展由浅层向深入,由分散到集中,由以应用为核心到以人为核心的转变。 关键词:社交网络、社交网站、社交网站用户行为 中图分类号:TP393 文献标识码:A 文章编号:1006-026X(2012)05-0000-01 据艾瑞咨询最新发布的《2011年中国社交化电子商务报告》显示,2011年中国社交网络的用户规模已经达到3.7亿,较2010年增长17.6%,预计到2014年这一规模将达到5.1 亿人,社交化元素已成为中国互联网中的基础性应用。从社交网络用户数据快速增长上来看,社交网络对人们生活的影响越来越大。为什么越来越多的人喜欢使用社交网络,他的 用户行为特征具体表现在哪些方面,本文以文献综述法进行总结归纳研究。 1.社交网络和社交网站 1.1社交网络的定义 自社交网络诞生以来,有关学者和专家就对社交网络的概念定义和内涵解释存在不少争议,且国内外的学者对社交网络的研究更多的集中于其商业及社交价值,加之社交网络 这一存在还处于不断变化发展的过程中,使得学界对社交网络的定义更加模糊不清。 国外学者Antelman(2003)对社交网络的定义是:社交网络是一个虚拟的个 人空间,用户在空间里上传个人资料,兴趣爱好,并且不断更新自我状态与信息,同时连接聚集到一 个或多个可信赖的朋友或同事群体中,使用社交网络提供的多种应用工具丰富充实空间里的信息资料,同时达到增进群体内部关系的目的。黄婷(2009)在总结社交网络特点 的基础上将社交网络服务定义为:社交网络服务(SNS)是以网站为载体,通过为用户提供各种交互功能,以帮助用户拓展社交圈为目的的服务类产品。 --!> 综合网络及国内外学者对社交网络的研究,本文将社交网络定义为:以社交软件(Social Network Software)为工具,以社交网站(Social Network Site)为载体,通过一系列 网站应用为人们提供社会性网络服务,帮助人们建立网络社交关系的交往平台。也就是我们平常所说的社交网站。 1.2 社交网站的特点

社会网络分析方法(总结)

社会网络分析方法 SNA分析软件 ●第一类为自由可视化SNA 软件,共有Agna 等9 种软件,位于图1 的右上角,这类软件可以自 由下载使用,成本低,但一般这类软件的一个共同缺点是缺乏相应的如在线帮助等技术支持; ●第二类为商业可视化SNA 软件,如InFlow 等3种,这类软件大都有良好的技术支持;(3)第 三类为可视化SNA 软件,如KliqFinder 等4 种,这类软件一般都是商业软件,但他们都有可以通过下载试用版的软件,来使用其中的绝大部分功能 ●第四类为自由非可视化SNA 软件,如FATCAT 等7 种,这类软件的特点是免费使用,但对SNA 的分析结果以数据表等形式输出,不具有可视化分析结果的功能; ●第五类为商业非可视化SNA 软件,只有GRADAP 一种,该软件以图表分析为主,不具有可 视化的功能。在23 种SNA 软件中,有16 种SNA 软件,即近70%的SNA 软件,具有可视化功能。 SNA分析方法 使用SNA 软件进行社会网络分析时,一般需要按准备数据、数据处理和数据分析三个步骤进行。尽管因不同的SNA 软件的具体操作不同,但这三个步骤基本是一致的。 1.准备数据,建立关系矩阵 准备数据是指将使用问卷或其他调查方法,或直接从网络教学支撑平台自带的后台数据库中所获得的用于研究的关系数据,经过整理后按照规定格式形成关系矩阵,以备数据处理时使用。这个步骤也是SNA 分析的重要的基础性工作。SNA 中共有三种关系矩阵:邻接矩(AdjacencyMatrix)、发生阵(Incidence Matrix)和隶属关系矩阵(Affiliation Matrix)。邻接矩阵为正方阵,其行和列都代表完全相同的行动者,如果邻接矩阵的值为二值矩阵,则其中的“0”表示两个行动者之间没有关系,而“1”则表示两个行动者之间存在关系。然而我们

基于融合社交网络相似度的群体推荐算法研究

基于融合社交网络相似度的 群体推荐算法研究 1课题来源、研究意义和目的 1.1课题来源 本课题来源于实验室项目,旨在研究电子商务中的推荐系统。 1.2 研究意义和目的 近年来,Web2.0 技术的兴起更进一步拓展了用户与计算机之间的交互作用,提高了用户的使用体验,但也进一步加快了互联网信息资源的增长速度。海量的信息在给广大互联网用户带来更多选择的同时也使得其不得不花费大量的时间和精力从偌大的信息库中找到自己感兴趣或者对自己有用的信息,由此便导致了“信息过载”和“信息爆炸”的问题。个性化推荐作为目前解决信息过载问题的主要技术,个性化推荐技术已经在诸多领域得到了应用,如电子商务、社交网站、搜索引擎等。作为全球率先研究个性化推荐系统的企业之一的Amazon[1]错误!未找到引用源。[2][3],也早已将个性化推荐服务放到了网站中的各个角落,成为目前应用个性化推荐系统的成功案例之一。 迄今为止,关于个性化推荐技术的研究已有很多,但是已有的推荐系统大多都旨在为单个用户提供推荐,而现实生活中,有时却需要向一个群体提供推荐。比如一个家庭的所有成员同时观看电影、一个群体需要选择旅游目的地以及一个群体需要选择用餐地点等。由于群体成员的兴趣爱好具有差异性、多样性与复杂性,因此为一个群体提供推荐,同时要求推荐列表能够最大化群体用户的满意程度是相当困难的,传统的个性化推荐算法已经不能很好地适应于群体推荐系统的情景,因此研究更为有效的群体推荐系统算法就显得尤为迫切与重要。群体推荐系统的研究对于互联网企业寻找新的盈利模式也有积极的指导意义,它能够借助于用户的兴趣偏好与社交网络关系扩大企业产品或者服务的接触面,从而获得更

基于数据挖掘的校园社交网络用户行为分析毕业设计论文

基于数据挖掘的校园社交网络用户行为分析毕业设计论文

1 绪论 1.1 选题背景 社交网络,简称SNS(social network service),在Web2.0浪潮中已发展为社会化媒体中一个主要平台。据最新的中国互联网络信息中心(CNNIC)2013年1月15 日发布的第31次《中国互联网络发展状况统计报告》,截至2012年12月底,我国网民规模达5.64亿,互联网普及率为42.1%,较2011年底提升3.8个百分点。同时报告显示,社交网络应用持续呈现增长趋势,截止2012年12月,国内社交网络用户总数已达2.75亿,占到了全部网民人数的48.8%,增速保持在10%以上。 与此同时在2010年之后社交网络又出现两大新增长点:其一微博用户持续增长,微博用户规模在2012年达到3.09亿,较2011年底增长了5873万。虽然微博急速扩张的阶段已经结束,但年增幅仍能达到23.5%;其二用户逐渐移动化成为了社交网络用户增长的又一亮点,截至2012年12月底,我国手机网民规模为4.2亿,较上年底增加约6440万人,网民中使用手机上网的人群占比由上年底的69.3%提升至74.5%,随着手机智能化,相当一部分用户访问和发送微博的行为发生在手机终端上,为社交网站的进一步发展提供了可能。此外“社交化”已经作为一种重要的功能元素,正在全面融合到各类互联网应用中。一方面,2012年涌现出大批具备社交基因的新应用,包括图片社交、私密社交、购物分享等,尤其在移动互联网领域,由于手机天生的通讯功能,2012年许多热门移动应用都具备社交功能;另一方面,搜索、网购、媒体等互联网应用正在融合社交因素,以丰富自身的功能、提升用户体验,创新服务和盈利模式。在整个互联网都走向社交化的大趋势下,传统的实名制社交网站也不断增加平台功能,在原

社交类网站分析报告

社交类网站分析报告 社交网站因具有用社群性、互动性、开放性、娱乐性等一系列特点发展迅速,国内也出现了人人网、开心网等一系列知名社交网站。随着社交网站不断地发展除了较为成功的大型社交网站外,在很多细分市场也出现了众多中小型社交网站,数以万计的中小型社交网站给网民带来了更多的选择,为整个社交网站的发展不断注入新鲜的血液。 项目背景 互联网自上个世纪诞生以来,其影响力已经涉及到人类生活的方方面面。网站的发展突飞猛进。在中国从以门户网站等技术为代表,强调内容的组织与提供的web 1.0时代,到如今更注重用户交互作用的以博客(BLOG)、百科全书(Wiki)、社交网络(SNS)、即时信息(IM)等为代表的web2.0时代,用了不到20年的时间。 如今网民在互联网上可获得的应用得到了极大地丰富,有以信息获取和交流为主的网络新闻、电子邮件、即时通信等应用;有以休闲娱乐为主的网络音乐、网络视频、网络游戏、网络文学等应用;也有以商务交易为主的网络购物、网上银行、网上支付、团购、网络炒股、旅行预定等应用;还有以满足人们社交需求实现自我表达为主的博客、微博、社交网站等新型应用。 网站需求和目的 社交型网站的最大用户群是大学生,对于大学生来说,社交型网站除了心情、网志、游戏等这些基础产品服务是不够的,还必须有一个用户真正需要、真正认可的核心应用。学生使用社交型网站的终极目的是为了休闲娱乐,其中休闲娱乐包括看新闻、听音乐、看电影、玩游戏、购物、时尚等方面。大学生普遍的“宅”已经发出需求,我们开发的新型社交型网站就不仅要满足他们在私人空间内的需求,并且要成为现实的延伸,网聚成员,开展活动。 定位:为年轻人服务 竞争性分析 由于国外社交网站facebook的火热,同时细分市场最大的职业社交网站率先上市,让国内的互联网创业者看准了职业社交网站的发展前景。于是纷纷效仿,前有天际若邻,后有环球人脉网。 若邻网人脉拓展频道依托于若邻网最大的职场社交招聘网,在这里不仅可以人脉拓展,结交好友,维护人脉,还可以通过人际网络获得更好的工作和商业机会。 精英招聘是天际网面向用户提供的社交招聘服务。与传统招聘相比,不仅可以将职位通过人际网络传递至数百万目标人群,还可以通过动态多维度考量候选人,为聘用提供依据。 环球人脉网广场汇集用户提出的热门问题以及具有职业帮助的高质量回答, 内容主要涵盖国际贸易、环球热点、职场管理、读书生活、交际人脉、创业投资六大板块。 同时展示乐于奉献自己专业知识的热门用户,以是其获得更多人脉拓展的机会。

社交网络分析SNS

SNS SNS,全称Social Networking Services,即社会性网络服务,专指旨在帮助人们建立社会性网络的互联网应用服务。也指社会现有已成熟普及的信息载体,如 或“社交网”。 目录

创立了面向社会性网络的互联网服务,通过“熟人的熟人”来进行网络社交拓展,比如ArtComb,Friendster,Wallop,adoreme等。 但“熟人的熟人”,只是社交拓展的一种方式,而并非社交拓展的全部。因此,现在一般所谓的SNS,则其含义还远不及“熟人的熟人”这个层面。比如根据相同话题进行凝聚(如贴吧)、根据爱好进行凝聚(如Fexion 网)、根据学习经历进行凝聚(如Facebook)、根据周末出游的相同地点进行凝聚等,都被纳入“SNS”的畴。 SNS源自英文缩写 在互联网领域有SNS三层含义:服务 Social Network Service,软件Social Network Software, Social Network Site。Social Network Service 中文直译为社会性网络服务或社会化网络服务,意译为社交网络服务。中文的网络含义包括硬件、软件、服务及应用,加上四字构成的词组更符合中国人的构词习惯,因此人们习惯上用社交网络来代指SNS(包括Social Network Service的三层含义),用社交软件代指Social Network Software,用社交代指Social Network Site。SNS专指旨在帮助人们建立社会性网络的互联网应用服务。 医学领域:Sympathetic Nervous System 【解】交感神经系统 sns是soft net system的缩写,即柔性网系统,在建筑方面,特别是公路、铁路建设方面应用很大,用于防护边坡细微垮塌的防护。根据防护方式不同,分为主动防护和被动防护。主动防护是防护网系统将有垮塌倾

基于社交网络的社会化推荐算法研究

龙源期刊网 https://www.360docs.net/doc/6b15088775.html, 基于社交网络的社会化推荐算法研究 作者:朱彦杰 来源:《科技视界》2014年第09期 【摘要】社交网络日趋活跃,基于社交网络的推荐成为电子商务推荐系统研究的热点领 域之一;如何利用社交网络数据给用户进行推荐物品,是基于社交网络的推荐算法的研究重点。对社交网络的定义、社交网络数据的分类进行概述,研究基于邻域的社会化推荐和基于图的社会化推荐算法;结合实际推荐系统对社会化推荐算法进行改进设计。 【关键词】社交网络;社会化;推荐 Research of Social Recommendation Algorithm Based on Social Network ZHU Yan-jie (Xuchang University, Xuchang Henan 461000, China) 【Abstract】As social networking has become increasingly active,Recommendations based on the social network have recently become one of the hottest topics in the domain of e-commerce recommender systems. How to recommend items to the users with social network data is the research content of the recommendation algorithm based on social network. With definition of social network and the classification of social network data, the social recommendation algorithm based on neighborhood or graph is studied. An?improved?social recommendation algorithm is also discussed in practical recommendations system. 【Key words】Social network; Socialization; Recommendation 美国著名的第三方调查机构尼尔森调查了影响用户相信某个推荐的因素[1],调查结果显示,90%的用户相信朋友对他们的推荐,70%的用户相信网上其他用户对广告商品的评论。从该调查可以看到,好友的推荐对于增加用户对推荐结果的信任度非常重要。在社交网站中,可以通过好友给自己过滤信息,只关注与阅读和自己有共同兴趣好友分享来的信息,从而避免了很多无关的信息,自然地减轻了信息过载问题。 在社交网站方面,国外以Facebook和Twitter为代表,国内社交网站,以QQ空间、人人网、朋友网、新浪微博等为代表;这些社交网站形成了两类社交网络结构。一种是,好友一般都是自己在现实社会中认识的人,比如同事、同学、亲戚等,并且这种好友关系是需要双方确认的,如Facebook、QQ空间,这种社交网络称为社交图谱。另一种是,好友往往都是现实中自己不认识的,而只是出于对对方言论的兴趣而建立好友关系,好友关系也是单向的关注关系,如Twitter、新浪微博,这种社交网络称为兴趣图谱。同时,也必须指出,任何一个社会 化网站都不是单纯的社交图谱或兴趣图谱。在QQ空间中大多数用户联系基于社交图谱,而在

社交网络现状分析 中国社交网络的三个价值维度

社交网络现状分析中国社交网络的三个价值维度 2012-07-13 14:19 共计17846次阅读来源:DoNews赞我有话说小中 分享 “人,生来就有社会性。所以借助于互联网的社交网络,将会让世界更加紧密!”说这话的是美国著名社交网络公司Facebook的创始人马克·扎克伯格。这家已在美国上市的互联网公司是迄今为止,全球最为成功的社交网络之一。 随着互联网的发展以及人类互动和沟通需求的扩展,社交网络和社交媒体开始影响人们的生活。作为一个具有十几亿人口的大国,中国的社交网络也在波涛汹涌中蓬勃向前。那么,社交媒体对于国内互联网市场产生了怎样的意义?中国社交网络又在经历着怎样翻天覆地的变化? 社交改变信息传播和分享方式 社交网络即社交网络服务,源自英文SNS(Social Network Service)。社交网络表现形式多种多样,其中博客、论坛和播客发展较早,而微博、社区、QQ空间在最近几年呈现火爆趋势。人们通过这些社交网站或平台进行撰写、分享、评价、讨论、互动和沟通。在社交网络中,意见表达、见解交流、经验分享和观点沟通最为常见。 可以说,社交网络在互联网的汪洋中如鱼得水,其传播信息之快、范围覆盖之广、分享率之大,无不令人惊叹。社交网络已成为人们使用互联网的重要组成部分,不仅制造了人们社交生活中争相讨论的一个又一个热门话题,更吸引传统媒体争相跟进。如果说,以前了解网络新闻的途径是门户的话,显然今天社交网络已经开始占据主流。 细心的朋友可能已经发现,现在无论浏览什么网站,来自各个社交平台的分享组件已经成为网站的标配,而很多人也已经习惯了把信息分享到自己的社交网络中。在国外的网站或者APP应用中,Facebook和Twitter的出现频率和分享程度最高。在国内,来自两家领先的社会化分享按钮提供商Jiathis和Bshare的数据显示,QQ空间以绝对优势稳坐国内社会化分享的龙头位置,新浪微博、腾讯微博占据第二、第三的位置。 中外社交网络齐头并进 据国外知名数据监测公司Pingdom公布的数据显示,社交网络链接和网页插件已经占领了全世界所有网站的25%。在世界排名前一万的网站中,这种社交网络的占有率更是达到了惊人的49.3%。由此不难看出,社交媒体已经成为互联网不可分割的一部分。 社交网络对于互联网正在产生重要意义,在国外,几乎所有网站都急不可待的想与这些掌控着全世界十几亿用户的社交网站开展合作,用户和流量的导入,使得整个市场流动性更强。依仗庞大的用户资源,社交网络又极易产生巨头,于是怎样才能攀上这门亲戚,成为很多令国外网站心头疼的事情。 国外社交网络风生水起,环顾国内,中国社交网络和社交媒体也在迅猛发展中大浪淘沙。从早期的博客、论坛等初级社交媒体形式,发展到今天SNS、微博等相继登上历史舞台。在美国孕育出世界级社交网络facebook的同时,拥有七年历史,积聚大量人气和品牌价值的

浅析现代网络社交工具对大学生人际关系的影响

本科生毕业论文 论文题目浅析现代网络社交工具对大学生人际交往的影响 作者姓名徐鑫 专业名称公共关系 指导教师翟进 2015年3 月23 日

浅析现代网络社交工具对大学生人际关系的影响 【摘要】当今时代是一个开放包容,飞速发展的“信息化时代”,随着计算机科技的瞬息万变,这一新的技术工具逐渐开始引领社会的发展,使信息能够快速的产生和交流传播。由QQ、微博、微信等即时通讯工具和社交网络服务平台组成的现代网络社交工具,正是伴随这现代信息技术的进步和互联网的普及而产生的时代产物。它的发展随着信息技术的发展日益成熟和完善,不仅提供了从个人所熟悉的人群,延伸到了遥远、陌生的人群。大学生是现代网络社交工具最为主要的接受者和使用者之一,网络社交工具已经成为了大学生日常交往的必备工具,它克服了传统人际交往的时空限制,扩大了大学生的交往空间,拓展了交往手段,改变了人们的认识和行为方式,但与此同时,网络社交工具也使大学生现实人际关系在某些情况下变得疏离,现实交往能力下降,出现了诸如孤独、叛逆等心理问题,产生了信任危机。互联网影响下的人际关系显得越来越冷漠。因此,研究网络社交工具对大学生人际关系的影响有着重要的意义。 【关键词】:现代网络社交工具;大学生;人际关系 根据中国互联网信息中心2015年1月调查报告,截至2014年12月底,上网人群中20-29岁年龄段的网民占到总网民数的30%,在各年龄段中互联网普及率和使用率最高,达到72.9%,从职业角度分析,学生是网民中规模最大的群体,占30.2%。从文化程度上看,大专及以上学历人群互联网使用率达到了96.1%。从上述数据反映出,高校大学生使用互联网频率最高,人群最多,因而,现代网络社交工具必然会影响大学生人际关系。

六个主要的社会网络分析软件的比较UCINET简介

六个主要的社会网络分析软件的比较UCINET简介 UCINET为菜单驱动的Windows程序,可能是最知名和最经常被使用的处理社会网络数据和其他相似性数据的综合性分析程序。与UCINET捆绑在一起的还有Pajek、Mage和NetDraw 等三个软件。UCINET能够处理的原始数据为矩阵格式,提供了大量数据管理和转化工具。该程序本身不包含网络可视化的图形程序,但可将数据和处理结果输出至NetDraw、Pajek、Mage 和KrackPlot等软件作图。UCINET包含大量包括探测凝聚子群(cliques, clans, plexes)和区域(components, cores)、中心性分析(centrality)、个人网络分析和结构洞分析在内的网络分析程序。UCINET还包含为数众多的基于过程的分析程序,如聚类分析、多维标度、二模标度(奇异值分解、因子分析和对应分析)、角色和地位分析(结构、角色和正则对等性)和拟合中心-边缘模型。此外,UCINET 提供了从简单统计到拟合p1模型在内的多种统计程序。 Pajek简介 Pajek 是一个特别为处理大数据集而设计的网络分析和可视化程序。Pajek可以同时处理多个网络,也可以处理二模网络和时间事件网络(时间事件网络包括了某一网络随时间的流逝而发生的网络的发展或进化)。Pajek提供了纵向网络分析的工具。数据文件中可以包含指示行动者在某一观察时刻的网络位置的时间标志,因而可以生成一系列交叉网络,可以对这些网络进行分析并考察网络的演化。不过这些分析是非统计性的;如果要对网络演化进行统计分析,需要使用StOCNET 软件的SIENA模块。Pajek可以分析多于一百万个节点的超大型网络。Pajek提供了多种数据输入方式,例如,可以从网络文件(扩展名NET)中引入ASCII格式的网络数据。网络文件中包含节点列表和弧/边(arcs/edges)列表,只需指定存在的联系即可,从而高效率地输入大型网络数据。图形功能是Pajek的强项,可以方便地调整图形以及指定图形所代表的含义。由于大型网络难于在一个视图中显示,因此Pajek会区分不同的网络亚结构分别予以可视化。每种数据类型在Pajek中都有自己的描述方法。Pajek提供的基于过程的分析方法包括探测结构平衡和聚集性(clusterability),分层分解和团块模型(结构、正则对等性)等。Pajek只包含少数基本的统计程序。 NetMiner 简介 NetMiner 是一个把社会网络分析和可视化探索技术结合在一起的软件工具。它允许使用者以可视化和交互的方式探查网络数据,以找出网络潜在的模式和结构。NetMiner采用了一种为把分析和可视化结合在一起而优化了的网络数据类型,包括三种类型的变量:邻接矩阵(称作层)、联系变量和行动者属性数据。与Pajek和NetDraw相似,NetMiner也具有高级的图形特性,尤其是几乎所有的结果都是以文本和图形两种方式呈递的。NetMiner提供的网络描述方法和基于过程的分析方法也较为丰富,统计方面则支持一些标准的统计过程:描述性统计、ANOVA、相关和回归。 STRUCTURE 简介 STRUCTURE 是一个命令驱动的DOS程序,需要在输入文件中包含数据管理和网络分析的命令。STRUCTURE支持五种网络分析类型中的网络模型:自主性(结构洞分析)、凝聚性(识别派系)、扩散性、对等性(结构或角色对等性分析和团块模型分析)和权力(网络中心与均质分析)。STRUCTURE提供的大多数分析功能是独具的,在其他分析软件中找不到。MultiNet简介 MultiNet 是一个适于分析大型和稀疏网络数据的程序。由于MultiNet是为大型网络的分析而专门设计的,因而像Pajek那样,数据输入也使用节点和联系列表,而非邻接矩阵。对于分析程序产生的几乎所有输出结果都可以以图形化方式展现。MultiNet可以计算degree, betweenness, closeness and components statistic,以及这些统计量的频数分布。通过MultiNet,可以使用几种本征空间(eigenspace)的方法来分析网络的结构。MultiNet包含四种统计技术:交叉表和卡方检验,ANOVA,相关和p*指数随机图模型。

社会网络分析报告的应用

7、社会网络分析的应用 一、国外的应用 社会网络分析萌芽于20世纪30年代,形成于60年代,从1980年以后,关于社会网络分析的论文显著增长。国外的应用研究主要集中在社会科学、家庭关系、交通运输、健康和医疗以及传染病传播机制等方面。 在情报学领域,国外的研究主要集中在两个方面:合著网络的研究和引文网络的研究。 (一)合著网络研究 1.Liuxiaoming,BollenJohan等人利用ACM和IEEE的数字图书馆会议文献建立了作者合著网络,利用中心性分指标析该合著网络,研究表明了PageRank和AuthorRank在合著网络研究中的重要性和优势。 2.M.E.J.Newman利用社会网络分析法对物理学、生物学和计算机科学三种学科的作者建立起了论文合著网络,分析了不同学科作者合著网络类型的区别和特点。 3.Logan和Pao则致力于研究如何使用社会网络分析法寻找出某一个领域的最核心作者。 (二)引文网络研究 主要应用于信息资源研究中,对文献之间的引用、共引的研究。 1.HENRY KREUZMAN进行了哲学学科62位代表作者的引文网络研究,揭示了哲学科学和认知论之间的联系。 2.HowardD.white专门探讨了社会网络结构和引文网络之间的在联

系。 3.学者们提出了二值矩阵和赋值矩阵,还构建同被引网络的研究方法,用来分析同被引情况。 二、.国的应用 国的社会网络分析己被运用到合著和引文网络研究、竞争情报、知识管理、网络信息资源评价以及图书馆资源配置等众多领域。 (一)合著网络研究 1.亮,朱庆华等选取《情报学报》1998一2005年之间的合著者为研究对象,对合著网络进行中心性分析、凝聚子群分析和核心--边缘分析的实证研究。 2.蓓,袁毅等选取中国期刊网里情报学、情报工作栏目下的所有作者为研究对象,进行社会网络分析,并做了团队合作的时序变化研究。 3.鲍,朱庆华等选取了CSSCI数据库里近十年以来的全部情报学领域的论文进行社会网络分析研究,在合著网络分析中,对“小团体”的形成机制进行了研究。 (二)引文网络研究 社会网络引文分析方法与引文分析家所使用的方法是一致的并扩展了它的研究方法,主要分为作者引文研究和期刊引文研究。 1.徐媛媛,朱庆华以参考咨询领域的32名高被引作者为研究对象,运用社会网络分析法从密度、中心度和凝聚子群方面进行研究。 2.邱均平教授对编辑出版类期刊进行引文网络分析,结果说明期刊同被引方法应用于确定核心期刊是有效的。他在后来对图书馆学情报学

社会网络用户关系分析与预测

目录 目录……………………………………………………………………………………………………………..iTABLEOFI::ONTENTS……………………………………………………………………………….iii摘jI枣……………………………………………………………………………………………………………..IABSTRACT………………………………………………………………………………………………..III第一章绪论………………………………………………………………………….11.1研究背景……………………………………………………………………一l1.2问题描述……………………………………………………………………..21.3本文工作………………………………………………………………………31.4论文结构……………………………………………………………………一4第二章相关工作…………………………………………………………………….52.1基于网络结构的用户关系分析……………………………………………..52.1.1基于共同好友的关系分析……………………………………………52.1.2基于路径的关系分析…………………………………………………62.2基于属性的用户关系分析…………………………………………………。82.3社交行为建模………………………………………………………………一92.4本章小结……………………………………………………………………一9第三章社交网络用户属性建模与用户关系度量……………………………………lo3.1属性分析与建模……………………………………………………………103.1.1基于属性的用户偏好分析OOO....O....OOQOQOOOOOOOOOO.OOO...................OOO103.2基于属性的用户关系度量…………………………………………………123.3本章小结……………………………………………………………………13第四章社交网络用户行为建模与用户关系度量……………………………………144.1行为分析与建模……………………………………………………………144.1.1信息发布行为分析……………………………………………………154.1.2用户潜在因素提取……………………………………………………164.2基于行为的用户关系度量…………………………………………………l7

社会网络分析_SNA_研究热点与前沿的可视化分析.

情报、信息与共享 Intelligence,Inform ation &Sharing [基金项目] 本文系国家社会科学基金资助项目社会网络分析在企业知识共享中的应用研究 (09B TQ 022的研究成果之一。[作者简介] 赵蓉英,女,1966年生,教授,博士生导师,武汉大学科学评价研究中心副主任;王静,女,1986年生,硕士生。 社会网络分析(SNA研究热点与前沿的可视化分析 Resea rch o f Inte rna tio nal Soc ial Net w or k Analysis in Fro nt ier Do mains in Visualize d Info rm atio n 赵蓉英王静 (武汉大学信息资源研究中心,武汉大学科学评价研究中心,武汉,430072 [摘要] 本文首先对IS I We b of Kno w le dg e 数据库中收录的以社会网络分析(S NA为主题的文献的时空分布进行了分析;然后利用信息可视化软件Cite Space 绘制出社会网络分析(SNA的代表人物、代表作的知识图谱,并对其进行了分析;最后通过检测词频变动趋势显著的主题词确定出国际社会网络分析(SNA研究的前沿领

域和发展趋势,并绘制出国际视野下的社会网络分析(S NA研究热点与研究前沿的 知识图谱。 [关键词] 社会网络分析研究热点研究前沿知识图谱 CiteSpace ! [中图分类号] G 203 [文献标识码] A [文章编号] 1003 2797(201101 0088 07 [Abstract] The distri bution of time,geographic regi ons for the publi shed papers regarding to Social N etwork Analysis was analyzed by maki ng use of the newly developed informati on vi s ualization m ethods,and the co-citation data records retri eved from ISI Web of Knowledge,then dr aw the knowledge map of C i ted Author ,Cited Reference on Soci al N etwork Analysis.And confirm s the research edge and trend of i nternational research on Social N etwork Analysis by detecting subject headings whos e word frequency fluctuation are s i gni ficant,and draws the knowledge map of them by us i ng Citespace.[Key words] Social N etwork Analysi s ,research edge,knowledge map,C i teSpace ! 最初对社会网络感兴趣的是英国著名的人类学家布朗(Ra dcliffe Brown ,他在对社会结构的关注中,以相对来说非技术的形式提出了社会网络的思想(参见布 朗,1999。从30年代到70年代,越来越多的社会人类学家和社会学家开始构建布朗的社会结构概念,认真思考社会结构和社会网络这些概念和隐喻。这些结构化的隐喻目的在于理解相互缠绕和关联在一起的关系,而社会行动恰恰是通过这些关系组织在一起的。渐渐的, 社会网络这个隐喻步入学术殿堂。社会网络的一些关键概念也应运而生,诸如密度 (d ensity、中心度 (cen trality、三方关系 (triad 等概念如雨后春笋,纷纷涌现[1] 。 概括地讲,社会网络分析是对社会关系结构及其 属性加以分析的一套规范和方法。它主要分析的是不同社会单位(个体、群体或社会所构成的关系的结

趋势分析之社交网络分析

趋势分析之社交网络分析 社交网络分析(Social Network Analysis)是指基于信息学、数学、社会学、管理学、心理学等多学科的融合理论和方法,为理解人类各种社交关系的形成、行为特点分析以及信息传播的规律提供的一种可计算的分析方法。 社交网络分析最早是由英国著名人类学家Radcliffe-Brown在对社会结构的分析关注中提出的,他呼吁开展社会网络的系统研究分析。随着社会学家、人类学家、物理学家、数学家,特别是图论、统计学家对社会网络分析的日益深入,社交网络分析中形成的理论、方法和技术已经成为一种重要的社会结构研究范式。由于在线社交网络具有的规模庞大、动态性、匿名性、内容与数据丰富等特性,近年来以社交网站、博客、微博等为研究对象的新兴在线社交网络分析研究得到了蓬勃发展,在社会结构研究中具有举足轻重的地位。 下面我们将用Trend analysis分析社交网络分析领域内的研究热点。 (点击链接即可进入Social Network Analysis Trend: https://https://www.360docs.net/doc/6b15088775.html,/topic/trend?query=Social%20Network%20Analysis) 下图是当前该领域的热点技术趋势分析,通过Trend analysis分析挖掘可以发现当前该领域的热点研究话题有social network、information system、network analysis、social influence、search engine等。 根据Trend analysis的分析结果我们可以发现,social network是该领域内的热门话题,从21世纪开始,social network的研究热度开始迅速上升,论文发表数量也遥遥领先;2007

相关文档
最新文档