复杂网络链路预测研究现状与展望

合集下载

基于复杂网络拓扑结构的链路预测方法研究

基于复杂网络拓扑结构的链路预测方法研究

基于复杂网络拓扑结构的链路预测方法研究基于复杂网络拓扑结构的链路预测方法研究摘要:链路预测是复杂网络研究中的重要问题之一。

在许多实际应用中,了解网络中未来可能出现的链接对是非常有用的,它可以帮助我们了解网络的演化趋势、发现新的社交关系、预测可能的传播路径等。

本文通过研究复杂网络的拓扑结构,提出了一种基于复杂网络拓扑结构的链路预测方法,该方法可以有效地预测网络中新的链接对。

1.引言随着互联网的迅猛发展和各种社交网络的兴起,复杂网络的研究引起了广泛关注。

复杂网络不仅具有丰富的结构特征,而且具有快速演化、高效传播等特点。

链路预测作为复杂网络研究中的一个重要问题,已经成为许多领域的研究热点。

链路预测可以帮助我们预测网络中未来可能出现的链接对,从而帮助我们了解网络的演化机理、发现新的社交关系等。

2.相关工作在链路预测方面,已经有很多方法被提出,并取得了一定的成果。

这些方法可以分为基于相似度和基于结构的方法。

基于相似度的方法通过计算节点之间的相似度,来预测节点之间的链接。

基于结构的方法则利用网络的拓扑结构信息来预测链接的出现。

然而,这些方法存在一些问题,比如无法处理复杂网络中的高度非线性关系、无法考虑到网络中的动态变化等。

3.基于复杂网络拓扑结构的链路预测方法在本文中,我们提出了一种基于复杂网络拓扑结构的链路预测方法。

该方法首先分析网络中节点的度分布、聚集系数等拓扑特征,并据此构建网络的邻接矩阵。

然后,我们利用SVM(支持向量机)算法来训练链路预测模型。

在训练过程中,我们将网络中一部分已知的链接对作为正样本,将网络中不存在的链接对作为负样本。

通过不断调整模型的参数,我们可以得到一个最佳的链路预测模型。

4.实验结果与分析为了验证我们的方法的有效性,我们在多个真实复杂网络数据集上进行了实验。

实验结果表明,我们的方法能够有效地预测复杂网络中的新链接对。

与其他方法相比,我们的方法具有较高的准确率和较低的误判率。

此外,我们的方法还能够很好地适应网络的动态变化,具有一定的鲁棒性。

复杂网络的链接分析及预测研究

复杂网络的链接分析及预测研究

复杂网络的链接分析及预测研究现实世界中,有许多科技、商业、经济和生物的数据可用复杂网络来表示,例如电力网格、电话交互网、社交网络、万维网以及科学家的合著关系和引用网络;在生物学领域,有流行病学网络、细胞与新陈代谢网络和食物网络;在人际关系中,公司内部的E-mail信息交互、新闻组、聊天室、朋友联系都是网络数据的例子。

现在,链接预测问题在社会学、人类学、信息科学以及计算机科学等各个领域都受到了广泛的关注。

当前,对网络数据进行链接预测的方法主要有基于相似度的、基于似然分析的和基于概率模型的方法等。

本文对当前网络链接预测的现状进行了分析,针对当前预测算法中存在的一些问题进行了研究,提出了相应的有效的算法。

本文的主要工作如下:(1)提出了直接优化AUC的链接预测算法。

快速扩展的互联网形成了具有高维、稀疏和冗余特性的复杂网络。

因此需要有效的链接预测技术来提高链接预测的精度。

考虑到AUC指标是衡量链接预测结果质量的主要标准,提出了直接优化AUC的链接预测算法。

在该算法中,将链接预测问题看成是二值分类问题,将AUC最大化作为优化的目标,使用hinge函数作为损失函数,使用随机次梯度下降算法迭代权重向量。

实验结果表明,本算法与其他算法的结果相比,不但在AUC指标上有较大的提高,在其他指标上也超过其他算法,可以实现更高质量的预测。

(2)提出了针对节点带有属性的网络的链接预测算法。

在很多领域,比如社会学、人类学、信息科学、计算机科学中,网络节点所代表的实体往往具有自己的属性。

这些属性的取值为链接预测提供了很有价值的信息。

如何应用这些信息进行链接预测的问题已经吸引了相当多的关注。

本文提出了利用模块度测度反映网络社区结构信息链接预测算法。

基于同一个社区中的节点对之间的链接的可能性比在不同的社区中大这一事实,提出了模块度贡献的概念。

基于模块度贡献的概念,将网络的节点映射到一个低维的欧氏空间。

在这个低维空间中,在同一个社区内的节点的将处于相邻的位置。

复杂网络的链路预测算法及其应用研究

复杂网络的链路预测算法及其应用研究

复杂网络的链路预测算法及其应用研究复杂网络的链路预测算法及其应用研究随着信息化时代的到来和互联网的广泛应用,网络结构日益复杂。

网络的复杂性使得链路预测成为了一个重要而复杂的问题。

链路预测是指通过已知网络的拓扑结构,预测出未知节点之间潜在的连接关系。

在现实生活中,链路预测算法在社交网络、信任网络、交通网络、生物网络等领域都有着重要的应用。

本文将重点介绍复杂网络的链路预测算法及其应用研究。

首先,我们需要了解什么是复杂网络。

复杂网络是由大量节点和节点之间的连接构成的,节点之间的连接关系可以用图形化的方式表示出来。

其中,节点代表网络中的实体,连接代表节点之间的关系。

复杂网络的拓扑结构既有规则性也有随机性,在真实网络中都能体现出来。

复杂网络的特点包括小世界性、无标度性、社区结构以及同配性等。

链路预测算法在复杂网络研究中具有重要的作用。

链路预测算法可以帮助我们预测网络中不存在的连接关系,并帮助我们更好地理解网络的结构和动态变化。

链路预测算法主要分为基于相似性的方法、基于机器学习的方法和基于传播模型的方法等。

基于相似性的链路预测方法主要利用已知连接关系的相似性来预测未知连接关系。

其中,常用的相似性度量方法包括共同邻居法、Jaccard系数、Katz相似性指数等。

共同邻居法指出,节点A和节点B的共同邻居越多,节点A和节点B之间存在连接的概率就越大。

Jaccard系数是用于计算两个节点之间共同邻居的比例,比例越大,两个节点之间存在连接的概率也越大。

Katz相似度指数则考虑了共同邻居的多度传递作用,加权考虑了接近距离的节点和达到距离的节点之间的连接概率。

基于机器学习的链路预测方法利用机器学习算法构建预测模型,从而预测未知连接关系。

通常,该方法首先提取网络中节点的特征,并将其作为输入特征。

然后,利用训练集的已知连接关系和节点特征进行特征学习和模型训练。

最后,通过预测模型,对未知连接进行预测。

常用的机器学习算法包括支持向量机(SVM)、决策树(Decision Tree)、随机森林(Random Forest)等。

复杂网络理论研究的现状与未来

复杂网络理论研究的现状与未来

复杂网络理论研究的现状与未来网络已经成为了人们生活中不可或缺的一部分。

无论是个人的社交网络还是全球的互联网,网络连接了我们的生活,也改变了我们的生活方式。

随着互联网的不断发展,网络已经从简单的连接工具演变成了复杂的系统。

因此,复杂网络理论的研究成为了当前的热点之一。

本文将探讨复杂网络理论的现状和未来发展方向。

一、复杂网络理论的概念和基本特征复杂网络是指由大量节点和边构成,具有复杂结构、多样性、非线性、动力学特征、自组织性、鲁棒性和鲜明的小世界效应、无标度特性等基本特征的网络。

通常情况下,复杂网络分为三类:随机网络、小世界网络和无标度网络。

随机网络是指所有节点的度数都差不多的网络,其中每个节点与其他节点随机连接。

小世界网络是指带有高度聚集性的连通性网络,即绝大部分节点都连接在一起,少数节点之间存在着远距离的联系。

无标度网络是指网络中有少部分节点拥有大量边缘连接的特性,即一小部分节点拥有着绝大部分的节点连接。

二、复杂网络理论的研究现状复杂网络理论的研究已经成为了跨学科研究的重要领域,包括数学、物理、计算机科学、生物学等。

近年来,随着人们对网络数据的深入研究,社交网络、生物网络、交通运输网络等越来越多的网络数据被发现,这些网络的存在和演变规律与我们生活中的许多重要问题相关。

比如,在社交网络中,人们如何形成朋友圈,如何通过朋友圈传播信息;在生物网络中,多种生物体之间的相互作用方式及其对生物群落演化的影响等等。

在复杂网络理论的研究中,目前主要的研究方向包括网络结构的建模和分析、网络中的动态演化过程、网络的鲁棒性和动力学过程。

在网络结构的建模和分析方面,研究者们主要从拓扑结构及其参数、形成机理、应用场景等方面展开探索。

在动态演化过程的研究中,主要探索网络中的复杂动态行为以及动态行为的建模。

在网络鲁棒性的研究中,主要探讨网络的鲁棒性如何改进和优化。

最后,在网络的动力学过程的研究中,主要是探讨网络的动态演化行为如何对网络中的元素产生影响,以及如何对网络整体产生作用。

基于复杂网络的链路预测研究

基于复杂网络的链路预测研究

基于复杂网络的链路预测研究随着全球信息化进程的不断推进,互联网已经成为人们获取信息及交流的重要平台。

在这个互联网时代,复杂网络已经成为了网络关系研究的一个重要方向,其中链路预测是一个极具潜力的研究领域。

复杂网络是由众多的节点和链接组成的,它的网络结构非常复杂,难以直接进行分析。

因此,链路预测是一项关键的任务,它可以用来预测节点之间未来可能存在的连接。

这一任务的重要性在于,通过链路预测,我们可以识别出潜在的社交群体、网络犯罪团伙等,从而防止社交事件、打击犯罪活动。

在实践中,基于复杂网络的链路预测通常分为两种方法:基于相似性和基于机器学习的方法。

基于相似性的方法在网络中寻找相似的节点,然后将它们连接起来。

而基于机器学习的方法则是通过训练模型,例如神经网络、支持向量机(SVM)等,来预测未来可能的链接。

这两种方法各有优缺点,其应用范围也不同。

在基于相似性的方法中,常用的算法包括常用邻居方法(common neighbor)、资源分配指数(resource allocation index)、优先接近度指数(preferential attachment index)等。

这些算法都是基于节点之间的共同特征进行链路预测的。

例如,常用邻居方法是利用节点之间的共同邻居数量,认为节点之间邻居数量越多,则它们之间的连边越可能存在。

资源分配指数则根据节点间的资源分配情况来判断它们连边的可能性。

而优先接近度指数则是依据节点度数的大小来进行链路预测的。

与相似性方法相比,基于机器学习的方法更重视节点属性的多样性。

这种方法不仅考虑了节点之间的共同特征,还从节点属性、网络拓扑结构等方面综合分析,利用机器学习算法预测链路。

常用的机器学习算法包括逻辑回归、决策树、朴素贝叶斯等。

这些机器学习算法所需要的节点属性数据可以通过网络中的节点特征进行获取,例如节点的度数、介数中心性、紧密度等。

在链路预测的实践中,需要注意一些问题。

首先,节点的属性特征应该充分考虑,尽可能多地提取网络中的隐性信息。

复杂网络链路预测算法研究

复杂网络链路预测算法研究

复杂网络链路预测算法研究复杂网络链路预测算法研究随着社交网络、互联网和大数据的快速发展,复杂网络链路预测算法成为了一个研究热点。

复杂网络链路预测的目标是利用网络中已有的信息,通过算法预测现有的链接以及未来可能的链接。

该研究对于社交关系分析、推荐系统、信息传播以及网络安全等领域具有重要的意义。

复杂网络链路预测算法的研究可以从传统的基于拓扑结构的算法和基于机器学习的算法两个方面展开。

基于拓扑结构的链路预测算法主要利用网络的拓扑结构进行预测。

其中一个经典的算法是“共享邻居算法(Common Neighbors)”,它认为两个节点间的共享邻居越多,它们之间的链接就越可能存在。

然而,这种算法在处理大规模网络时存在效率低下的问题,因为它需要遍历整个网络来计算共享邻居的数量。

针对以上问题,研究者提出了一种改进算法,“加权共享邻居算法 (Weighted Common Neighbors)”。

该算法认为,不同的共享邻居对于链路预测的贡献度是不一样的,因此对邻居节点进行权重分配。

该算法首先通过计算节点之间的权重矩阵,然后利用该矩阵进行链路预测。

实验证明,与传统的共享邻居算法相比,加权共享邻居算法能够提高预测准确性。

除了基于拓扑结构的算法外,基于机器学习的链路预测算法在复杂网络中也被广泛应用。

这些算法主要通过学习网络中节点和链接的特征来进行预测。

其中一个常用的算法是“随机游走算法(Random Walk)”。

该算法通过在网络中进行随机游走,来学习节点间的潜在联系。

另一个算法是“支持向量机算法(Support Vector Machine, SVM)”。

该算法通过构建分类器来预测链接的存在与否。

它通过训练数据集,学习分类器的参数,从而实现链路预测。

然而,基于机器学习的链路预测算法需要依赖大量的训练数据,且对特征选择十分敏感。

因此,在实际应用中,构建合适的训练集和选择有效的特征是非常关键的。

同时,基于机器学习的算法在处理大规模复杂网络时也存在计算复杂度高的问题。

复杂网络链路预测研究现状与展望

复杂网络链路预测研究现状与展望

复杂网络链路预测研究现状与展望复杂网络链路预测是指通过对已知网络拓扑结构和节点属性进行分析,预测未来可能形成的新的网络连接。

这项研究对于理解网络的演化规律、预测新的信任关系、推荐新的社交关系等具有重要意义。

本文将对复杂网络链路预测的研究现状和展望进行讨论。

首先,基于拓扑结构的链路预测方法。

这类方法主要从网络的拓扑结构入手,通过分析节点之间的连接模式,预测未来可能形成的新的连接。

其中,基于邻居节点的方法利用节点的邻居节点信息,如共同邻居数、邻居距离等,来判断节点之间是否存在潜在的连接。

而基于网络结构的方法则通过挖掘网络的结构特征,如聚类系数、度分布等,来预测节点之间的连接。

其次,基于节点属性的链路预测方法。

这类方法主要利用节点的属性信息,如性别、年龄、兴趣等,来预测节点之间的连接。

其中,基于相似性的方法通过计算节点之间的属性相似度,来判断节点之间是否存在连接。

而基于概率模型的方法则通过对节点属性的概率分布进行建模,从而预测节点之间的连接。

此外,还有一些集成了网络拓扑结构和节点属性的混合方法。

这类方法将网络拓扑结构和节点属性信息进行综合分析,从而提高链路预测的准确性。

例如,可以通过构建二部图模型,同时考虑节点的邻居节点和节点属性信息,来预测节点之间的连接。

未来,复杂网络链路预测的研究将面临以下几个挑战和展望。

首先,需要发展更加有效的特征提取方法。

当前的链路预测方法主要依赖于特征工程,即从现有的网络拓扑结构和节点属性中提取有效的特征。

然而,如何自动地提取有意义的特征仍然是一个挑战。

因此,需要研究更加高效的特征提取方法,以提高链路预测的准确性和效率。

其次,需要考虑网络的演化动态性。

当前的链路预测方法主要基于静态的网络拓扑结构和节点属性,很难适应网络的演化过程。

然而,真实的网络是动态演化的,节点之间的连接会随着时间不断变化。

因此,需要研究如何考虑网络的演化动态性,从而提高链路预测的准确性。

最后,需要解决大规模网络链路预测问题。

复杂网络中的链路预测算法研究与应用

复杂网络中的链路预测算法研究与应用

复杂网络中的链路预测算法研究与应用随着信息时代的到来,社交网络、生物网络、交通网络等复杂网络的规模和复杂性不断增加。

在这些网络中,链路(边)的预测成为一项重要的任务,旨在通过已有的网络结构信息,预测未来可能存在的链路,从而洞察网络的演化规律、探索网络的隐含关系。

一、链路预测算法的研究进展近年来,学术界和工业界都对链路预测算法进行了广泛的研究和探索。

传统的链路预测算法主要基于相似性原理,通过计算节点对之间的相似性指标(如共同邻居、Jaccard系数、Adamic/Adar指数等),来衡量节点对之间可能存在的链接。

然而,由于复杂网络的特殊性,传统的相似性原理算法在链路预测任务中存在诸多问题,例如无法处理高度稀疏网络、忽视了节点之间的联系强度等。

为了克服传统算法的局限性,研究者们提出了各种新的链路预测算法。

其中一类常见的方法是基于机器学习的算法,如支持向量机(SVM)、神经网络(NN)、随机森林(RF)等。

这些算法通过学习已知链路属性与节点特征之间的关系,在预测未知链路时进行推断。

此外,还有一些基于社区结构、网络结构等特征的算法被提出,如基于社区信息的算法、基于路径的算法等。

二、链路预测算法的应用领域链路预测算法在各个领域都有广泛的应用。

以下是几个典型的应用领域:1. 社交网络:社交网络中的链路预测可以帮助我们发现可能有潜在关系的人物,为社交平台的推荐系统提供更准确、个性化的推荐结果。

例如,在微博平台上,可以通过预测两个用户之间是否存在链接,提供更精准的用户推荐、好友推荐等服务。

2. 生物网络:在生物网络中,链路预测可以帮助我们理解蛋白质相互作用网络、基因调控网络等生物过程中的关键因素和相互关系。

通过预测蛋白质之间的相互作用,有助于研究疾病的发生机制、药物研发等领域。

3. 交通网络:链路预测在交通网络中的应用可用于预测城市道路的流量、拥堵情况和交通状况。

基于链路预测的交通优化算法可以帮助城市规划者和交通管理部门制定更合理的交通规划和交通流管理策略,提高城市交通效率和安全性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

复杂网络链路预测的研究现状及展望吕琳媛前言:做链路预测这个方向有一年多的时间了,有一些收获和体会。

一直想写一个综述进行总结,总是希望这个综述尽可能的包括更多更全面的信息,但是新的思想和结果源源不断的涌现,所谓的综述也就无限期的搁置了下来。

前不久刚刚和伟平合作发表了一篇关于利用网络局部随机游走进行链路预测的文章,借此文发表之动力,总结一下链路预测这个方向的研究进展以及展望。

希望该文能对那些正奋战在这个方向上和希望在此领域有所建树的科研工作者有所帮助和启迪。

(本文中所提到的具体的技术方法以及实验结果将在另一篇中文综述中详细介绍。

)1.链路预测及其研究意义网络中的链路预测(Link Prediction)是指如何通过已知的网络节点以及网络结构等信息预测网络中尚未产生连边的两个节点之间产生链接的可能性[1]。

这种预测既包含了对未知链接(exist yet unknown links)的预测也包含了对未来链接(future links)的预测。

该问题的研究在理论和应用两个方面都具有重要的意义和价值。

近年来,随着网络科学的快速发展,其理论上的成果为链路预测搭建了一个研究的平台,使得链路预测的研究与网络的结构与演化紧密联系起来。

因此,对于预测的结果更能够从理论的角度进行解释。

这也是我们相比计算机专业的人研究链路预测的优势所在。

与此同时,链路预测的研究也可以从理论上帮助我们认识复杂网络演化的机制。

针对同一个或者同一类网络,很多模型都提供了可能的网络演化机制[2, 3]。

由于刻画网络结构特征的统计量非常多,很难比较不同的机制孰优孰劣。

链路预测机制有望为演化网络提供一个简单统一且较为公平的比较平台,从而大大推动复杂网络演化模型的理论研究。

另外,如何刻画网络中节点的相似性也是一个重大的理论问题[4],这个问题和网络聚类等应用息息相关[5]。

类似地,相似性的度量指标数不胜数,只有能够快速准确地评估某种相似性定义是否能够很好刻画一个给定网络节点间的关系,才能进一步研究网络特征对相似性指标选择的影响。

在这个方面,链路预测可以起到核心技术的作用。

链路预测问题本身也带来了有趣且有重要价值的理论问题,也就是通过构造网络系综并藉此利用最大似然估计的方法进行链路预测的可能性和可行性研究。

这方面的研究对于链路预测本身以及复杂网络研究的理论基础的建立和完善,可以起到推动和借鉴的作用。

链路预测研究不仅具有如上所述的理论价值,其更重要的意义还是体现在应用方面。

很多生物网络,例如蛋白质相互作用网络和新陈代谢网络,节点之间是否存在链接,或者说是否存在相互作用关系,是需要通过大量实验结果进行推断的。

我们已知的实验结果仅仅揭示了巨大网络的冰山一角。

仅以蛋白质相互作用网络为例,酵母菌蛋白质之间80%的相互作用不为我们所知[6],而对于人类自身,我们知道的仅有可怜的0.3%[7,8]。

由于揭示这类网络中隐而未现的链接需要耗费高额的实验成本。

那么如果能够事先在已知网络结构的基础上设计出足够精确的链路预测算法,再利用预测的结果指导试验,就有可能提高实验的成功率从而降低试验成本并加快揭开这类网络真实面目的步伐!实际上,社会网络分析中也会遇到数据不全的问题,这时候链路预测同样可以作为准确分析社会网络结构的有力的辅助工具[9,10]。

除了帮助分析数据缺失的网络,链路预测算法还可以用于分析演化网络,即对未来的预测。

举例来说,近几年在线社交网络发展非常迅速[11],链路预测可以基于当前的网络结构去预测哪些现在尚未结交的用户“应该是朋友”,并将此结果作为“朋友推荐”发送给用户:如果预测足够准确,显然有助于提高相关网站在用户心目中的地位,从而提高用户对该网站的忠诚度。

另外,链路预测的思想和方法,还可以用于在已知部分节点类型的网络(partially labeled的类型[12]或者判断一个手机用户是否产生了切换运营商(例如从移动到联通)的念头[13]。

最近在一篇关于链路预测的工作中提到了不仅可以预测所谓的缺失链接还可以预测网络中的错误链接[14],这对于网络重组和结构功能优化有重要的应用价值。

例如在很多构建生物网络的实验中存在暧昧不清甚至自相矛盾的数据[15],我们就有可能应用链路预测的方法对其进行纠正。

2.研究现状链路预测作为数据挖掘领域的研究方向之一在计算机领域已有一些早期的研究。

他们的研究思路和方法主要基于马尔科夫链和机器学习。

Sarukkai[16]应用马尔科夫链进行网络的链路预测和路径分析。

之后Zhu等人[17]将基于马尔科夫链的预测方法扩展到了自适应性网站(adaptive web sites)的预测中。

此外,Popescul和Ungar[18]提出一个回归模型在文献引用网络中预测科学文献的引用关系。

他们的方法不仅用到了引文网络的信息还有作者信息,期刊信息以及文章内容等外部信息。

应用节点属性的预测方法还有很多,例如O’Madadhain等人[19]利用网络的拓扑结构信息以及节点的属性建立了一个局部的条件概率模型来进行预测。

Lin[20]基于节点的属性定义了节点间的相似性,可以直接用来进行链路预测。

虽然应用节点属性等外部信息的确可以得到很好的预测效果,但是很多情况下这些信息的获得是非常困难的,甚至是不可能的。

比如很多在线系统的用户信息都是保密的。

另外即使获得了节点的属性信息也很难保证信息的可靠性,即这些属性是否反映了节点的真实情况,例如在线社交网络中很多用户的注册信息都是虚假的。

更进一步,在能够得到节点属性的精确信息的情况下,如何鉴别出哪些信息对网络的链路预测是有用的,哪些信息是没用的仍然是个问题。

因此与节点属性信息相比较,已观察到的网络结构或者用户的历史信息更容易获得也是更可靠的。

近几年,基于节点相似性的链路预测方法受到了广泛的关注。

此方法的一个重要前提假设就是两个节点之间相似性(或者相近性)越大,它们之间存在链接的可能性就越大。

因此如何定义节点的相似性就成为该方法的一个核心问题。

尽管这个框架非常简单,但是相似性定义本身内涵丰富,它既可以是非常简单的共同邻居的个数,也可以是包含了复杂数学物理内容的诸如随机游走的平均通讯时间[21]或者是基于图论的矩阵森林方法 [22]。

因此这个简单的框架事实上提供了无穷无尽的可能性。

Liben-Nowell和Kleinberg[23]提出了基于网络拓扑结构的相似性定义方法,并将这些指标分为基于节点和基于路径的两类,并分析了若干指标对社会合作网络中链路预测的效果。

他们发现,在仅考虑节点邻居信息的若干指标中,Adamic-Adar参数[24]表现最好。

周涛、吕琳媛和张翼成[25]在6种不同网络中比较了9种已知的基于局部信息的相似性指标在链路预测中的效果,并提出了两种新指标:资源分配指标(resource allocation index)和局部路径指标(local path index)。

研究发现,新提出来的这两种指标具有明显好于包括Adamic-Adar参数在内的9中已知指标的预测能力。

最近其他小组的研究结果显示,新提出来的相似性指标在进行群落划分[5]和含权网络权重设置[26]的时候也比原有指标好。

吕琳媛、金慈航和周涛[27]进一步在噪音强度以及网络密度可控的网络模型中细致分析了局部路径指标的性能,发现这个指标在网络的平均最短路径较小的时候具有与依赖于网络全局结构信息的指标,例如Katz参数[28],可匹敌的预测能力,甚至在噪声较大的情况下可以比Katz参数预测的更加准确。

另外,由于局部路径指标仅仅考虑了网络的局部信息,其计算量远远小于基于全局信息的指标,特别是在网络规模较大且稀疏的情况下,局部路径指标在计算复杂度上的优势更加明显,因此其应用前景相当可观。

最近,刘伟平和吕琳媛[29]提出了两种基于网络局部随机游走的相似性指标,通过与其他五种相似性指标的比较,发现有限步的随机游走可以给出比全局收敛后的预测精度更好的结果,而最优的游走步数受到网络平均距离的强烈影响。

此外,在五种网络上的比较结果显示该方法比08年Nature[31]上提出的基于网络层次结构的预测方法准确度更高。

另外,Huang 等人的实验结果显示[30],在得到节点间的直接相似性后,利用协同过滤技术对相似性指标进行一轮加权处理,一般而言可以得到更好的结果。

这一方法已广泛应用于推荐算法的设计上,并得到了成功。

实际上,个性化推荐可以看作是链路预测的一个子问题。

链路预测另一类方法是基于最大似然估计的。

Clauset, Moore和Newman[31]认为很多网络的连接可以看作某种内在的层次结构的反映,基于此,他们提出了一种最大似然估计的算法进行链路预测,这种方法在处理具有明显层次组织的网络,如恐怖袭击网络和草原食物链,具有较好的精确度。

但是,由于每次预测要生成很多个样本网络,因此其计算复杂度非和Sales-Pardo[14]假设我们观察到的网络是一个随机分块模型(Stochastic Block Model)[32]的一次实现,在该模型中节点被分为若干集合,两个节点间连接的概率只和相应的集合有关。

他们所提出的基于随机分块模型的链路预测方法,可以得到比Clauset, Moore和Newman更好的结果。

以此同时,该方法不仅可以预测缺失边,还可以预测网络的错误链接,例如纠正蛋白质相互作用网络中的错误链接。

另外一个需要特别注意的趋势,是随着一些原来从事复杂网络研究的学者对链路预测问题的关注,很多复杂网络,特别是社会网络分析中遇到的理论与方法被应用到链路预测中。

例如吕琳媛和周涛[33]发现在针对某些含权网络进行链路预测的时候,权重很小的边反而起到了比高权重边更大的作用,这与社会网络研究中广为人知的“弱连接理论”[34]有深刻的关联。

Leskovec, Huttenlocher和Kleinberg[35]则注意到了近期“社交平衡理论”的定量化研究成果[36,37],并在此启发下设计了可以预测网络中的正负(友敌)链接的算法。

链路预测最近两年受到了比较多的关注,很可能得益于Clauset, Moore和Newman在08年发表的《自然》论文[31],以及Redner在《自然》上的评论文章[38]。

弗里堡小组较早地认识到链路预测问题的重要价值,并开展了一系列的工作。

同时,通过大力的宣传国内对这个方向已经开始有一些关注。

湘潭大学胡柯小组[40]利用链路预测方法预测人类蛋白质相互作用网络中的致病基因,也得到了不错的精度。

最近胡柯小组及青岛理工大学许小可与弗里堡小组就有向网络的链路预测问题和社会平衡理论应用于链路预测的问题展开了紧密合作。

3.前沿趋势分析及展望我们注意到一方面受阻于网络节点外在属性在获取上的难度,另一方面受益于复杂网络研究的快速发展,链路预测问题的主要研究热点逐渐从依赖于节点属性的方法转移到只利用网络结构信息的方法上[23]。

相关文档
最新文档