基于统计模型的社会网络群体关注度的分析与预测

合集下载

社会网络分析的基本理论和方法

社会网络分析的基本理论和方法

社会网络分析的基本理论和方法社会网络分析(Social Network Analysis,SNA)是研究人际关系和组织关系的一种方法,通过描述和分析网络中的关系结构,揭示其中的规律和特点,为社会科学研究提供了新的视角和方法。

本文将从定义、历史、基本概念、方法等方面阐述社会网络分析的基本理论和方法。

一、定义和历史社会网络分析是一种研究人际关系和组织关系的方法,它以网络节点(Node)、网络边(Edge)为基本单位,分析网络中的连接、关系和结构等方面的特征,揭示其中的规律和意义。

社会网络分析是从数学、物理学、社会学和计算机科学等多个领域交叉发展而来的,被广泛应用于社会科学、组织管理、信息科学等领域。

社会网络分析的历史可以追溯到20世纪30年代的心理学和社会学中,当时主要研究人际互动和社会结构等问题。

随着计算机和统计学的发展,社会网络分析的方法越来越受到重视。

1990年代初,社会网络分析进入了一个快速发展的时期,研究涉及面也越来越广泛,从社会财富分配、企业家网络、组织结构到科技创新和地理信息系统等。

目前,社会网络分析已经成为社会科学研究中的一个重要方法和工具。

二、基本概念和术语(一)节点(Node)网络中的节点是指网络中的个体、机构、组织、事件等的抽象表示,代表网络中的元素。

节点的性质和特征不同,可以对网络的结构和特征产生重要影响。

(二)边(Edge)网络中的边是连接节点的连接线,反映着节点之间的相互关系和联系。

边的类型和强度不同,可以揭示不同方面的网络特征,如网络密度、中心性和耐性等。

(三)度数(Degree)节点的度数是指与该节点相连的边的数量,反映节点的重要程度和在网络中的位置。

节点的度数越高,就越容易在网络中传播和被影响。

(四)连接(Link)连接是节点之间的联系,即相互关系和相互作用。

连接的类型和方向不同,影响着网络的结构和性质。

(五)中心度(Centrality)中心度是描述节点在网络中相对重要程度的指标,反映节点在网络中的位置和影响力。

统计数据建模与预测分析方法

统计数据建模与预测分析方法

统计数据建模与预测分析方法统计数据建模与预测分析方法是一种通过收集、整理和分析数据来预测未来趋势和结果的方法。

它在各个领域都有广泛的应用,包括经济学、金融学、市场营销、医学等。

本文将探讨统计数据建模与预测分析方法的基本原理、常用技术以及其在实际应用中的局限性。

统计数据建模是通过对已有数据进行分析和建模,来推断未来的结果。

它的基本原理是假设过去的数据可以反映未来的趋势和规律。

在建模过程中,需要选择合适的模型来描述数据的变化,并使用统计方法对模型进行参数估计和检验。

常用的统计模型包括线性回归模型、时间序列模型和非线性模型等。

线性回归模型是最常见的统计模型之一。

它假设自变量与因变量之间存在线性关系,并通过最小二乘法来估计模型的参数。

线性回归模型可以用来预测因变量的数值,也可以用来研究自变量对因变量的影响程度。

然而,线性回归模型的局限性在于它只能描述线性关系,无法处理非线性关系的数据。

时间序列模型是用来处理时间相关数据的统计模型。

它假设数据的变化是随时间而变化的,并通过分析时间序列的特征来预测未来的数值。

常用的时间序列模型包括移动平均模型、自回归模型和ARIMA模型等。

时间序列模型在金融市场预测、气象预测和股票价格预测等领域有广泛的应用。

非线性模型是用来处理非线性关系的统计模型。

它假设自变量与因变量之间存在非线性关系,并通过拟合非线性函数来预测未来的数值。

非线性模型的建模过程更加复杂,需要选择合适的非线性函数和优化算法。

常用的非线性模型包括多项式回归模型、神经网络模型和支持向量机模型等。

非线性模型在生物学、工程学和社会科学等领域有广泛的应用。

虽然统计数据建模与预测分析方法在许多领域都有成功的应用,但它也存在一些局限性。

首先,建模的结果受到数据的质量和可靠性的影响。

如果数据存在缺失、异常或错误,建模的结果可能不准确。

其次,建模过程中需要做出一些假设,如线性关系、独立同分布等。

如果这些假设不成立,建模的结果可能不可靠。

社会网络分析方法及应用

社会网络分析方法及应用

社会网络分析方法及应用社会网络分析是一种研究人际关系网络的分析方法,它可以描述和解释社会群体的结构、关系、行为以及动态变化等。

社会网络分析可以被应用于不同领域和主题,包括组织管理、社交网络、政治、健康、环境等。

本文将探讨社会网络分析的方法、应用及未来的发展。

一、社会网络分析的方法社会网络分析的方法主要包括:1.数据收集:社会网络分析需要收集关于人际关系的数据,如成员的姓名、联系方式、互动情况等。

数据采集的方法可以通过调查、观察、实验方法等获取。

其中,在社交媒体网络上的数据,也可以被用来进行社会网络分析。

2.网络构建:基于收集的数据,可以构建一个人际关系网络的模型。

最常见的是节点和边的表示法。

节点表示人,边表示人之间的联系或互动。

3.度量和分析:度量主要用于描述和统计节点或边之间关系及其特征。

常用的度量指标包括节点的度数、中心性、连通性、社区等。

分析主要用于理解网络的拓扑结构,关系及其特征。

常用的社会网络分析方法包括社区检测、影响力分析、网络结构分析等。

4.可视化:可视化是将社会网络分析的结果呈现出来的过程,包括网络图和其他形式的可视化方法。

通过可视化,分析人员可以更加清晰地理解人际关系网络的拓扑结构、关系特征以及变化趋势等。

二、社会网络分析的应用社会网络分析已经被应用于许多领域,以下是其中的几个例子:1.组织社会网络分析:通过分析组织内部的人际联系,可以更好地理解团队的工作方式、复杂程度以及信任程度等。

这使得管理者可以根据分析结果来优化团队结构,改善通讯、协作和问题解决等方面的工作效率。

2.社交网络分析:社交媒体网站已经成为目前人们交流和互动的主要平台。

社会网络分析可以被用来研究社交媒体平台上的用户行为、关系及其影响力。

这对于社交媒体营销及推广活动非常有帮助。

3.政治分析:政治家和策略家们可以通过社会网络分析来了解选民、竞争对手、政治联盟等角色和关系之间的联系,以便更好地了解他们的需求和采取更好的政策。

大规模群体行为的统计分析和建模

大规模群体行为的统计分析和建模

大规模群体行为的统计分析和建模随着互联网技术的不断发展和普及,人们的社交方式也逐渐从传统的面对面交流转变为基于互联网的虚拟社交,人们在社交媒体上的行为数据已经成为了非常重要的信息资源。

这些数据可以告诉我们人类社会中的趋势,也可以用于预测和研究一些特定场景下的行为规律。

在这种情况下,大规模群体行为的统计分析和建模已经成为了一个非常重要的研究领域。

一、群体行为的数据来源和类型人们在社交媒体上的行为数据可以分为两种类型,一种是自己的个人信息,包括注册时填写的资料、发表的言论、贴出的图片等等。

另一种则是他人对自己的评价和互动,比如点赞、评论、分享等等。

这些数据可以来源于各种各样的互联网平台,比如微博、微信、Facebook等等。

这些数据往往以文本和图片的形式展现,所以在进行统计分析时需要进行自然语言处理和图像分析。

此外,还需要注意数据的收集方式和处理方式,防止采集到垃圾数据或者因样本选择不当导致的统计偏差。

二、群体行为的模型和预测方法针对群体行为的模型和预测方法主要有以下几种:1. 社交网络分析:利用图论和统计学方法研究社交网络结构和信息传递规律。

可以通过分析社交网络的节点数量、连接情况和网络直径等信息来预测信息传递的速度和流量。

2. 文本分析:利用自然语言处理技术研究文本数据中的主题、情感倾向、情感极性等特征。

可以通过文本数据中的关键词、情感倾向等信息预测舆论趋势和事件演变方向。

3. 图像识别:利用计算机视觉技术研究图像数据中的内容和特征。

可以通过分析图像数据中的人物、场景、情感等信息预测人群的兴趣和品味。

4. 机器学习:结合以上方法,建立合适的模型和算法来进行数据分析和预测。

可以通过训练机器学习模型来预测事件的发生概率,或者进行数据分类和聚类,从而获取更为准确的分析结果和预测结果。

三、群体行为的应用群体行为的分析和研究可以应用到很多方面,比如智慧城市建设、产品市场营销、事件预测和风险控制等方面。

以智慧城市建设为例,利用群体行为数据可以对城市交通、能源消耗、环境污染等情况进行实时监测和预测,进而调节城市运行和管理。

社会网络的分析和建模

社会网络的分析和建模

社会网络的分析和建模社会网络学是一门专门研究人际关系网络的学科,随着互联网的普及,社会网络学也逐渐成为了学术研究和商业决策的重要分支。

该领域主要研究人际网络及其特征,以及网络中节点之间的联系、信息流动等问题。

本文旨在针对社会网络的分析和建模方法进行探讨。

一、社会网络的基本概念社会网络是指一个群体中各成员之间相互联系的网络结构,由数个节点和边所组成。

节点代表着群体成员,边代表着成员之间的关系。

具体地,社会网络可以分为以下几个概念:1.节点:群体或社区中的每个成员都被定义为一个节点。

节点可以是个人、组织、公司、国家等。

2.边:边是节点之间的互相关联的线性连接,它可以是单向的或双向的。

在不同的情境下,边的类型也有所不同,例如亲戚关系、友谊关系、商业合作等。

3.度:节点的度是指该节点与其他节点之间的连边数,也就是它在网络结构中的联系数。

4.中心性:中心性是用来度量节点在网络中的重要性。

不同的中心性指标有不同的计算方法,如度中心性、接近中心性、介数中心性等。

5.社区:社区是指具有相似特征或相似目的的节点之间的内部连通性较强的一组节点。

二、社会网络分析的方法1.基本统计方法基本统计方法是用于分析社会网络中关系和联系的最基础方法,包括度分布、平均度、聚类系数、网络密度等。

这些指标可以帮助我们了解网络的全貌,如网络中的节点和边分布情况,以及网络的稠密程度。

2.中心性指标中心性指标是用来衡量节点在网络中的重要性。

它们可以帮助我们定位网络中存在的重要节点,从而有效地分析并优化网络。

中心性指标包括度中心性、接近中心性、介数中心性等。

3.社区发现算法社区发现算法是用来将网络中的节点分组成社区的一种方法。

这些社区组成的特征是:节点相互之间联系紧密,而与其他社区之间联系较少。

社区发现算法可以帮助我们深入理解网络中的各种关系,并且可以对社会学、经济学等领域进行有益的探究。

4.复杂网络的分析方法复杂网络的分析方法是用来研究复杂网络结构的方法,包括随机图模型、小世界网络、无标度网络等。

社会网络的理论建模与分析方法

社会网络的理论建模与分析方法

社会网络的理论建模与分析方法引言社会网络理论作为一门跨学科的领域,涵盖了多个学科的知识,包括社会学、心理学、统计学和计算机科学等。

社会网络的理论建模和分析方法是研究社会网络中人际关系、信息传播、群体行为等重要问题的基础工具。

本文将介绍社会网络的基本概念和理论模型,并介绍一些常用的社会网络分析方法。

1. 社会网络概述社会网络是指由一组个体(节点)和它们之间的联系(边)组成的网络。

在社会网络中,个体可以是人、组织、物体或其他实体,而联系可以是人际关系、信息传递、资源分配等。

社会网络的研究可以帮助我们理解人类社会的结构和动态。

2. 社会网络的理论建模社会网络的理论建模是研究社会网络的结构与动态的基础。

常用的社会网络理论模型包括:2.1. 符号网络模型符号网络模型是最早发展起来的社会网络模型,在该模型中,节点代表个体,边代表个体之间的关系。

符号网络模型适用于研究人际关系、社会影响等问题。

2.2. 关系网络模型关系网络模型是一种基于隐含关系的社会网络模型,节点代表个体,边代表个体之间的共享关系或相似性。

关系网络模型适用于研究兴趣群体、文化扩散等问题。

2.3. 随机图模型随机图模型是基于概率统计方法的社会网络模型,节点代表个体,边代表个体之间的随机连接。

随机图模型适用于研究网络演化、信息传播等问题。

3. 社会网络分析方法社会网络分析方法是研究社会网络数据的工具,可以帮助我们揭示网络中的模式和规律。

常用的社会网络分析方法包括:3.1. 中心性分析中心性分析用于衡量节点在社会网络中的重要程度,常用的中心性指标包括度中心性、接近中心性和介数中心性等。

3.2. 社区发现社区发现是研究社会网络中群体结构的方法,可以将网络中相似的节点聚类成社区。

常用的社区发现方法包括基于模块度的方法和基于谱聚类的方法。

3.3. 信息传播分析信息传播分析研究社会网络中信息的传播路径和传播速度。

常用的信息传播分析方法包括影响力最大化、信息流模型和级联模型等。

社会网络分析的方法和应用

社会网络分析的方法和应用随着互联网的飞速发展,人们之间的联系方式也在不断地发生着变化。

传统的人际交往方式已经无法满足现代社会的需求,社会网络成为了重要的交际方式。

社会网络分析(Social Network Analysis, SNA)已经成为了社会学、心理学、管理学、计算机科学等多个领域的热点研究课题。

本文将会介绍社会网络分析的方法和应用。

一、社会网络分析的方法社会网络分析主要使用计算机科学和数学统计学的方法研究社会网络结构和网络节点之间的关系。

以下是主要的社会网络分析方法:1.问卷调查法:通过向研究对象发放调查问卷的方式了解研究对象之间的关系,并将其转化为网络形式。

问卷调查法在研究大规模网络时不太适用,但是在研究小规模网络时可以提供深刻的洞见。

2.直接观察法:通过直接观察研究对象之间的交互关系,并将其转化为网络形式。

3.网络分析软件法:使用社会网络分析软件来收集和分析网络数据。

目前常用的社会网络分析软件有UCINET、Gephi、Pajek等。

4.复杂网络理论:运用复杂网络理论来深入探讨网络结构及其演化规律。

5.社会学模型:通过建立社会学模型,分析节点之间的关系及其演化规律。

二、社会网络分析的应用社会网络分析可以应用于多个领域,从个人层面到组织层面,从实证研究到理论探讨都有许多应用。

1.个人层面应用:(1)个人自我认知:了解自己在社会网络中的位置和作用,有助于个人更好地交际。

(2)情感支持:研究表明,社会网络中的情感关系对个人的生活质量和幸福感有着重要的作用。

(3)知识传播:社会网络可以帮助个人传播知识和信息。

2.组织层面应用:(1)管理与策略:通过分析组织网络结构,找出组织中存在的问题和瓶颈,并制定相应的解决策略。

同时,了解组织网络中的关系可以帮助管理者更好地分配资源和合理安排工作。

(2)团队协作:研究表明,组织网络结构与团队协作密切相关,优化组织网络结构可以提高团队的协作效率。

(3)创新与合作:社会网络可以促进组织内外的创新和合作,提高组织的竞争力。

社会关系网络分析与模型建立

社会关系网络分析与模型建立现代社会是一个高度网络化的世界,人与人之间的互动、联系和交流都通过各种形式的社会网络实现。

在这样的背景下,社会关系网络分析成为了一种重要的研究工具和方法,它通过对人际关系网络进行分析和建模,揭示社会之间的联系和结构,推测行为和态度,预测变化趋势和发展方向,帮助人们更好地理解社会现象和改善社会行为。

一、社会关系网络的概念及特点社会关系网络是指一组人或团体之间相互联系、互相依存的关系,包括直接的和间接的联系。

社会网络以人为节点,以人际关系为边来表示,涉及到人口学、人类学、心理学、统计学等多个领域。

个体在网络中的位置和角色是社会关系研究的核心,而网络结构、密度、连通性、层次等是网络分析的基础要素。

与传统的调查研究相比,社会关系网络分析有以下特点:1、自下而上。

研究的对象是一群人或者一些组织等,以网络关系为研究对象,而不是以个体为研究对象,重视复杂的群体过程。

2、可视化。

社会关系网络分析具有可视化的优势,研究者可以通过图表等方式直观地展现人际关系的连通性和其他性质。

3、综合性。

社会关系网络分析可以在不同的学科领域中进行多种多样的研究,可以运用于人口学、心理学、社会学、人类学、统计学等领域。

二、社会关系网络分析的方法社会关系网络分析用于研究人际关系和群体行为的过程中,有许多不同的方法和技术。

其中,最重要的是两种方法:1、观察性研究。

这种方法通过对真实社会网络的观察,获取和分析社会关系的数据来得到研究结果。

观察性研究可以采用问卷、访谈等方法进行数据收集,也可以利用网络爬虫等技术获取数据。

观察性研究的优点是能够获取真实的关系数据,但有时候获取数据困难或者样本难以取得。

2、模拟性研究。

这种方法是通过数学模型来模拟社会关系网络中节点的联系和交互,进而得到模拟结果。

模拟性研究有利于对网络的结构、过程和演化进行深入理解和预测。

但缺点是最后的结果可能与真实情况不一致。

三、社会关系网络模型的建立社会关系网络模型是基于真实社会关系网络或者模拟数据,通过几何结构、统计数据和因素分析等方法进行处理和计算,以此揭示人际关系和网络特性的模型。

社会网络分析的方法与应用

社会网络分析的方法与应用一、引言社会网络分析(Social Network Analysis,SNA)是一种结构和关系导向的研究方法,用于描述人际或组织之间的关系。

随着社交媒体的兴起,社会网络分析逐渐成为了社会学、心理学、管理学和信息科学等领域的重要研究方法之一。

本文将介绍社会网络分析的方法和应用。

二、社会网络分析的方法社会网络分析的方法主要包括几何图形和数学统计方法两个方面。

几何图形方法主要用于描述人际或组织之间的联系,如节点和边,以及网络的中心性、密度、结构和演化等。

而数学统计方法则用于分析网络的属性、结构和演化等,如下列几种方法。

1、节点中心性节点中心性是网络中节点的重要性衡量指标,通常分为度中心性、接近中心性和介数中心性。

度中心性是指节点的直接联系数量,即连接它的边的数量,越多则节点越重要。

接近中心性是指节点到其他节点的距离,在网络中越靠近中心位置的节点越重要。

介数中心性是指经过该点的最短路径数量,即通过该点的路径越多,则节点越重要。

2、网络密度和结构网络密度是指节点间连接的紧密程度,可以用以下公式计算:网络密度=实际边数/总可能边数。

网络结构则指节点间联系的聚集程度,如同一组织或群体内部联系紧密,而与外部联系稀疏。

3、社区结构社区结构是网络中节点具有相似属性或功能的集合,并且节点之间的联系紧密。

社区结构可以用模块度刻画,模块度越大则社区间差异越大。

4、演化模型社会网络演化模型主要有静态模型和动态模型。

静态模型描述网络中的静态结构,不考虑时间因素的影响。

而动态模型则考虑时间因素,描述网络结构随时间演化的过程。

三、社会网络分析的应用社会网络分析技术广泛应用于社会学、心理学、管理学、信息科学等多个领域,如以下几个应用实例。

1、组织管理社会网络分析技术可以用于分析组织内部人际关系的特点和结构,如领导者、关键绩效指标影响因素、联盟和合作伙伴等,为组织的管理和决策提供依据。

2、社区互动社会网络分析技术可以揭示社区内部成员的联系,以及社区成员间愿望和动机等,为社区建设和治理提供依据。

社会网络的建模和分析方法

社会网络的建模和分析方法社会网络已经成为现代社会的一个重要组成部分,互联网的兴起更是进一步促进了社会网络的发展。

社会网络的数据分析和建模成为了现代社会科学研究的一个重要工具。

本文将从社会网络的建模与分析方法方面进行探讨。

一、社会网络的建模社会网络的建模是指通过提取网络中的节点、边及其相关信息,对网络中的人际关系、群体特征等进行系统化描述和建模的过程。

常用的建模方法包括:1. 矩阵表示法矩阵表示法是将网络中的节点和边以矩阵的形式进行表示。

它通过矩阵中的数值、形状、大小等参数,描述社会网络关系的强度、方向、稳定性等特征。

常用的矩阵有邻接矩阵、距离矩阵、相似矩阵等。

邻接矩阵描述了节点之间的直接联系,可以统计节点度数、密度和度分布等;距离矩阵则是计算节点之间的距离,可以用于社区检测和聚类等操作;相似矩阵则是刻画节点之间的相似度,可以用于社交推荐和信息过滤。

2. 社会关系图社会关系图通过画图的形式表现网络中的人-人关系。

它将人-人关系抽象成节点和边的形式,在节点和边的属性上标示上人际关系的特征和价值。

社会关系图通常通过统计节点的中心度、连通性、子图等统计信息,得到社会网络的重要性分布和结构特征。

3. 模型化方法模型化方法是通过数学模型来描绘社会网络中人际关系的变化和演化。

它常用的方法包括随机模型、小世界模型、规模无关网络模型以及重压网络模型等。

这些模型可以较好地描述网络中人际关系的动态性质,从而帮助我们理解社会网络的演化机制。

二、社会网络的分析方法社会网络的分析方法是基于社会网络建模的方法,通过计算网络中节点和边的量化特征,来研究网络结构与性质之间的关系,以及角色、群体等因素在网络中的作用和影响。

常用的分析方法如下:1. 节点度数分析节点度数是一个网络中最基本的节点属性,可以表示该节点连接的关系数量。

节点度数分析可以帮助我们识别重要节点和社区之间的联系,分析不同类型群体在网络中表现的特征。

2. 社区检测社区检测是指在给定网络中找到相互紧密连接的节点集合。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
to
model which
to
can
precisely predict fading
the applicability of this model
as
other social communities,it
owns important applied values in multiple applications,such control and Key words

有关.本文的研究工作着重在分析群体关注度的变 化特点与规律,通过发掘影响关注度变化的决定因 素为预测其未来的变化趋势找到科学的参考依据.
2群体关注度分析
在线网络论坛(BBS)是网络社区的重要表现形 式,研究社会网络的实体特性可以从研究论坛用户 的行为特点出发.本文有针对性地研究实际的网络 论坛,从不同角度分析网络社区用户的群体关注度 特点和变化趋势. 2.1研究对象 2.1.1社会网络论坛的特点分析 现今,很多综合性社会网络论坛都有庞大的用 户群体和众多的版面.论坛设计者往往依据帖子主 题或性质来设置版面,如电脑技术、时政新闻、生活 娱乐等等.具有不同兴趣爱好的用户可以到相应的 版面去寻找志同道合者,探讨共同感兴趣的话题,很 容易聚集在一起形成一个小型的网络社区,或者称 之为社团(Web community),而整个论坛则可以看 作是一个由不同小社团组成的庞大网络社会.复旦 大学的日月光华BBS论坛是一个具备上述特性的 综合性社会网络论坛.已有的对社会网络论坛的调 查发现,论坛中的一部分用户喜欢发帖且数量很多, 因此在论坛上具有较高的知名度,这类人被视作是 社会网络中的“专家”.而更多的用户则喜欢浏览别 人的帖子,自己很少发帖甚至不发帖,这类人物往往 被网友戏称为潜水者.我们从光华论坛中抽取发帖数 和用户数最多的12个版面进行统计发现,如文献E43 所述,光华用户的发帖数也符合幂律分布(power- law).图1的X轴和y轴分别是发帖数和对应的用 户数(样本用户数约占论坛总用户数的1/5),都采 用了对数刻度表示,从中看出U。CP一.发贴数为1 的用户数最大,占所有发帖用户总数的32.7%,他 们和部分从未发过帖的用户一起构成潜水者主体. 随着发贴数的增长,用户数以幂律方式单调下降,这 样的趋势充分说明在论坛上,用户发贴行为有着明 显的多样性,而不像指数分布那样绝大部分用户都 遵循相同的发帖行为.图1中长尾(10ng tail)的出现 充分说明了论坛中存在不可忽视的“专家”用户,比 如发帖数排在前3.6%的用户(发帖数在100以上)的 发帖总数占到帖子总数的49.9%.网络论坛用户间 发帖和回帖的关系被视作是他们之间的一种重要的 社会关系,就如同很多学者把两个网络用户发送
network
社会学和传播学领域的学者对SNS中的用户行为 特征和信息传播方式有着浓烈的研究兴趣,计算机 科学领域的专家也同样关注相关问题的研究.其中 一个热点问题就是社会网络用户的群体关注度
(collective
attention)[1。,该问题主要研究社会网络
中某些群体(例如社团)用户的共同兴趣爱好,或者 某个时段内这些用户所关注的对象,及其关注度变
area
of social network.It is
understand how people’s attention to novel items propagates in online community and
eventually fades among large populations.In this paper,authors analyzed the dynamics of collective attention among thousands of
计算机 II一1777]TP
基于统计模型的社会网络群体关注度的分析与预测
阳德青 肖仰华


上海200433)
(复旦大学计算机科学技术学院
(yangdeqing@fudan.edu.on)
Statistical Networks
Model—Based
Analysis and Prediction of Collective Attentions in Social
中图法分类号TP311.13
广大网民利用BBS论坛、博客、推客(twitter) 等网络媒体形式,不光可以在网上发布和共享信息, 还能交友、购物和玩游戏,从而构成了一个庞大而又 复杂的虚拟社会.很多综合性网站,如国际上知名的 FaceBook,国内的开心网和人人网等,为网络用户 提供了建立彼此间社会关系的功能,因而往往被人 们称作社交网站(social
发帖数P
图1光华论坛用户的发帖数量统计分布
2.1.2群体关注度的度量 上文已经提到,论坛用户间的发帖一回帖关系是 用户关系的一个重要表现,如果用户对某个帖子感 兴趣自然会去回帖评论.因此,我们将一个帖子在某 个时间段内能够获得的回帖数作为群体关注度的度 量指标.论坛各个版面的帖子列表页面中,原帖(即 某个标题的第1个帖子)和回帖(回复原帖并具有和 原帖相同标题的帖子)都是混列在一起的.如果一个 原帖能够引起较多的回帖,那么它们在一张列表页 面上就占有很大的篇幅,自然会得到越来越多的关 注;而那些不能得到足够回帖的帖子自然也就容易 被淹没在其他标题的帖子当中,会越来越难被发现, 因此得到回帖的概率越来越小.该现象启示我们,要 让一个新近发出的帖子引起较多的关注,让其在尽 可能短的时间内获得尽可能多的回帖是一个比较有 效的办法,比如让其尽快登上“十大”页面. 2.2群体关注度的相关因素分析 本小节将详细统计论坛中不同版面的原帖的回 帖数变化情况(在统计的样本数据中,只有不到 1.3%的原帖发出后20 h后还能获得回帖,因此本 文只统计原帖发出前20 h内的情况),以此作为用
380
计算机研究与发展2010,47(增刊)
email或者聊天,以及两个学者间的论文合作关系作 为社会网络中两个实体间的关系一样.此外,一个用 户还可以将任何其他用户加入自己的好友列表,从 而方便地给自己的好友直接发站内信件或者进行在 线聊天,这种好友关系也可视为用户间的某种关系, 但不作为本文的研究重点.为了让所有用户都能随 时了解到当前的讨论热点,和很多网络论坛类似,光 华论坛会自动统计最近24 h内获得的回帖数拍在 前10位的帖子(简称“十大”)并显示在进站画面上. 这样“十大”页面上的帖子在一段时间内会得到越来 越多的关注(被点击浏览得更多或者得到更多的回 帖),直到该帖已经失去时效性(例如时事新闻)或者 已经让绝大多数用户熟知(失去了新鲜感),不再具 备深入讨论的价值.
users
based
on
statistics
of tremendous posts

on

scenario of online
community,i.e.,BBS of Fudan University,and generated trend of collective attention.Thanks
相关工作
以往在计算机研究领域中关于社会网络的研究
工作主要集中于社会网络中的社区发现技术[2],以 基于网络实体(用户或者网页)间的拓扑结构【31为 主.随着对社会网络实体本身性质和内容的研究深 入,群体关注度问题的研究逐步进入人们的视野.群 体关注度的研究涉及到人群注意力和兴趣的转移、 变化等问题,和网络信息的传播模式研究息息相关, 因而在网络广告,新闻传播与控制,以及人性心理研 究等方面都有应用价值.文献[1]对群体关注度问题 做出了解释,并用在线论坛的统计数据说明了社会 网络用户的群体关注度具有随时间推移呈幂律下降 的趋势.相类似地,文献E4-]也通过针对在线社区的 实证分析,建立了能够反映网络用户对于一个新生 事件的行为特点和兴趣变化的模型.对于群体关注 度的研究大多从网络影响力的传播最大化角度来考 虑,例如文献[5]利用用户间的相似度(例如好友)来 分析用户间相互影响,而文献I-6—7]则提出一种寻找 最具网络传播影响力的种子结点集的有效算法.这 些问题都和用户群体中的关注度形成、扩散和转变
10 0()0 ◆▲ l000 b
户群体关注度分析的依据,分析影响关注度变化的 相关因素.文献[1]已经证实很多社会网络论坛的用 户群体关注度的变化呈指数律(exponetial law)衰减. 即,对于一个网络中的新生事物,例如论坛上新发出 的一个帖子,用户一开始的关注度较高,但随着时间 推移,由于该帖的内容已经被越来越多的人所熟知, 其新鲜感或者时效性渐渐消失,最后用户不会再对 其感兴趣,因此也就不会再有新的回帖出现.但文献 [1]的研究不够深入,对于各种发帖因素(例如不同 版面、不同主题、初期回帖数等)对于帖子关注度演 化的影响尚未予足够的考虑.本节通过统计分析,我 们证实帖子主题、发帖时间和初期回帖数对于帖子 关注度的演化有着显著的影响. 2.2.1不同版面(主题)的对比 上文提到,网络论坛通常根据不同领域或用户 的不同兴趣爱好划分为不同版面.不同版面上的讨
藿100

10 l 1
\-
10
论帖具有不同的主题,活跃在其上的用户因兴趣爱


10U l 000 10000
好不同,行事特点也不同,加上群体人数的不同,造 成他们对各自版面上出现的原帖的回帖行为也应该 有所区别.经过统计截止到2010年4月4日前在光 华论坛回帖数超过lo的原帖的回帖平均数,我们画 出了5个不同版面的原帖的回帖数衰减蛆线对比 图,如图2所示.
site,SNS).不仅是
收稿日期:2010—06—25
基金项目:国家自然科学基金项目(60703093)
阳德青等:基于统计模型的社会网络群体关注度的分析与预测
379
化的状况.本文研究的群体关注度问题可以具体阐 述为:网络论坛中的一个新生事件(一条消息或者论 坛上的一个帖子)如何得到某些群体的用户关注,进 而在相关用户群体中进行传播的问题.由于该问题 的研究对于揭示广大网络用户群体的兴趣、特性和 信息的传播模式有着重要作用,因而对于网络广告 传播效应最大化,以及网络舆论引导与控制等问题 的有效解决有借鉴意义,因此该问题的研究有着广 泛的应用前景以及较高的研究价值. 本文的主要工作和贡献如下: 1)分析了社会网络用户的群体关注度特点,并 以复旦大学日月光华BBS论坛(以下都简称为光 华)为例,通过统计其用户的发帖、回帖数据来论证 分析结论的正确性与合理性. 2)从大量的统计数据中发掘出决定用户群体 关注度变化的相关因素,并以此为依据建立了网络 社区用户特性的群体关注度演化模型. 3)介绍了用群体关注度演化模型来预测用户 将来行为(例如对一个新帖的回帖情况)的方法,也 为热门帖的预先判定等问题提供了较为准确的参 考,而且通过现实的论坛数据从不同角度验证了该 模型的有效性和准确性.
相关文档
最新文档