自然基金成功范本复杂网络链路预测的理论、算法和应用研究

合集下载

【国家自然科学基金】_pan_基金支持热词逐年推荐_【万方软件创新助手】_20140731

【国家自然科学基金】_pan_基金支持热词逐年推荐_【万方软件创新助手】_20140731

107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160
53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106
科研热词 数值模拟 大鼠 合成 基因表达 细胞凋亡 镁合金 聚丙烯腈 神经网络 遗传算法 腐蚀 目标跟踪 有限元 晶体结构 土壤 食管癌 鉴定 配合物 聚苯胺 稳定性 碳纳米管 玉米 燃烧合成 激光技术 模型 故障诊断 增殖 土壤有机碳 吸附 高效液相色谱 预测 静电纺丝 铜 超声检查 质子交换膜 试验 自适应 肝脏 聚乙二醇 细胞增殖 细胞周期 磁场 猪链球菌 特征提取 燃料电池 混凝土 水稻土 气候变化 无线传感器网络 成骨细胞 岩石力学 动脉粥样硬化 克隆
重金属 车辆路径问题 血管平滑肌细胞 自组装 胰岛素抵抗 肿瘤 聚合酶链反应 聚丙烯腈纤维 聚丙烯腈(pan) 综述 纳米纤维 粗糙集 神经元 碳纤维 猪 激发态 流固耦合 数据融合 支持向量机 抗压强度 成纤维细胞 性能分析 快淬薄带 异常检测 建模 序列分析 小鼠 小波变换 土地利用 危险因素 动物模型 力学性能 高温超导 骨髓间充质干细胞 预氧化 非线性 非共价复合物 降解 阿尼玛卿缝合带 长江口 长期施肥 镉 钱塘江 遥感 迁移 轨道交通 超重力 质子交换膜燃料电池 表达 血管新生 血管支架 蚁群算法 虚拟仪器 蒸发皿蒸发量

复杂网络理论及其在生态系统中的应用

复杂网络理论及其在生态系统中的应用

复杂网络理论及其在生态系统中的应用绪论复杂网络理论是近年来发展起来的一门跨学科领域,它在各种领域中都具有广泛的应用,其中包括生态系统。

生态系统是由各种生物种群相互作用形成的复杂系统,而复杂网络理论可以帮助我们更好地理解和分析生态系统中的相互作用关系。

本文将首先介绍复杂网络理论的基本概念和特点,然后详细讨论其在生态系统中的应用。

一、复杂网络理论的基本概念和特点1.1 复杂网络的定义复杂网络是由大量节点和连接它们的边组成的系统。

节点代表网络的元素,可以是生物个体、物理对象或者抽象概念;边代表节点之间的连接关系,可以是物质传输、信息交流或者关系联系等。

复杂网络的结构可以是随机、小世界或者无标度等,不同的网络结构会对网络的功能和稳定性产生不同的影响。

1.2 复杂网络的特点复杂网络具有以下几个特点:第一,复杂网络包含大量的节点和边,其规模庞大;第二,节点之间的连接关系具有一定的模式和规律;第三,复杂网络的动态演化过程是非线性和非确定性的;第四,复杂网络具有自组织和自适应的特性。

这些特点使得复杂网络可以用来描述和模拟各种复杂系统,包括生态系统。

二、复杂网络在生态系统中的应用2.1 复杂网络在生态相互作用的分析中的应用生态系统由不同的生物种群相互作用而形成,而复杂网络可以帮助我们揭示种群之间的相互作用关系。

通过构建和分析生态网络,我们可以研究物种之间的捕食关系、共生关系、竞争关系等。

例如,研究者可以构建一个以物种为节点,以捕食关系为边的复杂网络,然后使用复杂网络分析方法来研究不同物种之间的相互作用模式和稳定性。

这些研究结果可以帮助我们更好地理解生态系统的结构和功能。

2.2 复杂网络在生态系统的稳定性分析中的应用生态系统的稳定性是生物多样性和生态功能的基础,而复杂网络可以有效地分析生态系统的稳定性。

通过构建生态网络模型,并使用复杂网络稳定性分析方法,我们可以评估物种灭绝对生态系统的影响、预测环境变化对生态系统的稳定性的影响等。

复杂网络建模与分析研究

复杂网络建模与分析研究

复杂网络建模与分析研究摘要:复杂网络建模和分析是一项重要的研究领域,它在现代科学和技术应用中扮演着重要角色。

这篇文章致力于深入探讨复杂网络的建模方法和分析技术,以及它们在各个领域的应用。

首先,我们介绍了复杂网络的基本概念和特征,然后讨论了几种常见的复杂网络模型,并解释了它们在实际中的应用。

接着,我们重点关注复杂网络的分析方法,包括中心性度量、社区发现和网络演化分析等。

最后,我们讨论了复杂网络在社交网络、生物学和物理学等领域中的应用,并展望了未来的研究方向。

1. 引言复杂网络是由大量节点和连接构成的网络结构,它可以用来描述现实世界中的各种系统和现象。

复杂网络建模和分析可以帮助我们理解网络的演化规律、节点之间的相互作用以及整个系统的行为。

因此,它在计算机科学、社会学、生物学和物理学等领域中得到了广泛的应用。

2. 复杂网络的基本概念和特征复杂网络具有许多独特的特征,例如小世界性、无标度性和社区结构等。

小世界性指的是网络中任意两个节点之间的距离相对较近,换句话说,通过少数几个中间节点即可实现节点之间的快速通信。

无标度性表示网络中只有少数节点具有极高的度数,而大多数节点的度数较低。

社区结构则描述了网络中存在节点分组的现象,即某些节点之间的连接比其他节点更为密集。

3. 复杂网络模型为了更好地理解复杂网络的特性和行为,研究者提出了多种复杂网络模型。

常见的模型包括随机网络模型、无标度网络模型和小世界网络模型。

随机网络模型是最简单的一种模型,它的节点连接是随机生成的,没有任何特定的模式或规律。

无标度网络模型则基于“富者愈富”的原则,它认为节点连接的形成更倾向于选择度数较高的节点。

小世界网络模型则结合了随机网络和无标度网络的特性,它既具有短路径长度,又具有较高的聚集度。

4. 复杂网络分析方法为了理解复杂网络的结构和功能,研究者提出了多种分析方法。

中心性度量是一种常用的方法,它用来衡量节点在网络中的重要性。

常见的中心性度量包括度中心性、接近中心性和介数中心性等。

复杂网络研究简介

复杂网络研究简介

∑d
i> j
ij
d12 = 1
d13 = 1 d 23 = 1
d14 = 2 d 24 = 1 d 34 = 2
d15 = 1 d 25 = 2 d 35 = 2 d 45 = 3
Total = 16 Average:
L = 16 / 10 = 1.6
聚类系数
• 一个网络的聚类系数 C满足:
0<C<1
规则网络
(a) 完全连接;
(b) 最近邻居连接;
(c) 星形连接
规则网络
... ...
(d) Lattice
(z) Layers
随机图理论
• 随机图论 - Erdös and Rényi (1960) • ER 随机图模型统治四十余年…… 直到今天 …… • 当今大量可获取的数据+高级计算工具,促使人们 重新考虑随机图模型及其方法
“图论之父”
看作4个节点,7条边的 图
路必须有起点和终点。 一次走完所有的桥,不重复,除起点与终点外,其余点必须有偶数 条边,所以七桥问题无解。 1875年, B 与 C 之间新建了一条桥解决了该问题!☺
Euler 对复杂网络的贡献
Euler 开启了数学图论,抽象为顶点与边的集 合 图论是网络研究的基础 网络结构是理解复杂世界的关键
电信网络
(Stephen G. Eick)
美国航空网
世界性的新闻组网络
(Naveen Jamal)
生物网络
人际关系网络
复杂网络概念
• • • • • • 结构复杂:节点数目巨大,网络结构呈现多种不同特征。 节点多样性:同一网络中可能有多种不同的节点。 连接多样性:节点之间的连接权重存在差异,且有可能存在方向性。 网络进化:表现在节点或连接的产生与消失。例如WWW,网页或链 接随时可能出现或断开,导致网络结构不断发生变化。 动力学复杂性:节点集可能属于非线性动力学系统,例如节点状态随 时间发生复杂变化。 多重复杂性融合:即以上多重复杂性相互影响,导致更为难以预料的 结果。例如,设计一个电力供应网络需要考虑此网络的进化过程,其 进化过程决定网络的拓扑结构。当两个节点之间频繁进行能量传输时, 他们之间的连接权重会随之增加,通过不断的学习与记忆逐步改善网 络性能。 复杂网络简而言之即呈现高度复杂性的网络。

复杂网络数据分析与预测研究

复杂网络数据分析与预测研究

复杂网络数据分析与预测研究复杂网络数据分析与预测研究随着互联网的发展,人们的生活和工作方式已经发生了翻天覆地的变化。

互联网的普及和数据的快速增长,为复杂网络数据分析和预测研究提供了更加广阔的空间。

复杂网络数据分析和预测研究是一门新兴的科学,它将计算机科学、统计学、数学和物理学等多个学科相结合,用于研究复杂系统中的数据分析和预测问题。

复杂网络是指由大量节点和边组成的网络,它们之间的关系非常复杂和多样化。

复杂网络数据分析和预测研究的目标是通过对复杂网络的分析和建模,揭示网络中隐藏的规律和特征,进而对网络未来发展趋势进行预测和控制。

复杂网络数据分析和预测研究的方法包括社区发现、节点重要性评估、网络结构分析、动态演化模型等。

其中,社区发现是指将网络中相互关联且密集连接的节点聚类成一个社区,以揭示网络中的群体结构和功能模块;节点重要性评估是指通过计算节点在网络中的度、介数、接近度等指标,评估节点在网络中的重要性;网络结构分析是指通过对网络拓扑结构进行分析,揭示网络中的特征和规律;动态演化模型是指通过对网络动态演化过程进行建模,预测网络未来的发展趋势。

复杂网络数据分析和预测研究在许多领域都有广泛的应用,如社交网络、金融风险管理、医疗健康、交通运输等。

在社交网络中,复杂网络数据分析和预测研究可以用于发现社交网络中的社区结构、预测用户行为和趋势等;在金融风险管理中,复杂网络数据分析和预测研究可以用于评估金融系统中的风险,发现金融市场中的异常波动等;在医疗健康领域中,复杂网络数据分析和预测研究可以用于对疾病传播进行建模和预测;在交通运输领域中,复杂网络数据分析和预测研究可以用于交通拥堵预测、路网优化等。

总之,复杂网络数据分析和预测研究是一门具有广泛应用前景的新兴学科,它将对我们理解复杂系统中的规律和特征、掌握未来发展趋势、优化决策等方面产生重要影响。

复杂网络的理论和应用

复杂网络的理论和应用

复杂网络的理论和应用随着互联网的普及和信息技术的快速发展,人类社会面临的许多问题已经变得越来越复杂。

促进信息交流和知识共享是一个重要的任务,而复杂网络的理论和应用被认为是解决这些挑战的一种新方法。

一、复杂网络的定义和特点复杂网络是由许多互相连接的节点组成的,这些节点可以代表人、公司、网站等各种实体。

网络中的节点可以通过边或链接相互连接,这些链接可以表示各种关系,如友谊、交易、信息传递等等。

复杂网络具有许多特点,其中最重要的是小世界性和无标度性。

小世界性意味着网络中的大多数节点可以通过较短的路径相互连接。

无标度性意味着网络的度分布呈现出幂律分布,即少数节点拥有大量的链接,而大多数节点只有很少的链接。

这些节点通常被称为“超级节点”。

二、复杂网络的应用1.社交网络分析社交网络是由许多人组成的网络,可以表示人与人之间的社交关系。

社交网络分析可以帮助我们了解人与人之间的连接,并使用这些信息来预测人们的行为。

一些重要的应用包括社交网络推荐、影响力分析、恶意行为检测等。

2.金融网络金融网络是由各种金融机构和市场组成的网络,其中节点之间的链接表示交易、担保等各种金融关系。

通过分析金融网络可以帮助我们了解市场风险,预测金融危机等。

金融网络分析在风险评估、金融监管和投资决策等方面具有很大潜力。

3.生态网络生态网络是由各种生物和它们之间的生态关系组成的网络。

通过分析生态网络可以帮助我们了解生态系统的演化规律,预测生物种群的动态变化,以及研究生物迁移路径等问题。

生态网络分析在生态保护、环境管理和资源保护等方面都具有很大价值。

三、复杂网络的挑战尽管复杂网络提供了新的解决方案,但它们也面临许多挑战。

其中最重要的是网络的动态性和复杂性。

网络在不断的变化中,节点和链接也在不断地出现和消失。

在这种情况下,如何保证网络的鲁棒性和可靠性是一个非常复杂的问题。

此外,网络中的大量数据也会带来更复杂的数据挖掘和分析挑战。

四、总结复杂网络理论和应用为我们提供了一种新的解决方案,可以帮助我们更好地理解和掌握现代社会、生态和金融系统的动态演化。

复杂网络

复杂网络

表现
复杂网络复杂网络简而言之即呈现高度复杂性的网络。其复杂性的主要表现以下几个方面:
1)结构复杂的主要表现为节点数目巨大,网络结构呈现多种不同特征。
2)网络进化的主要表现为节点或连接的产生与消失。例如world-wide network,网页或链接随时可能出现 或断开,导致网络结构不断发生变化。
复杂网络
具有自组织、自相似或全部性质的网络
01 概念
03 内容 05 研究方向
目录
02 表现 04 特性
复杂网络(Complex Network),是指具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质的 网络。特征:小世界、集群即集聚程度的概念、幂律的度分布概念。
概念
复杂网络钱学森给出了复杂网络的一个较严格的定义:具有自组织、自相似、吸引子、小世界、无标度中部 分或全部性质的网络称为复杂网络。
第二,集群即集聚程度(clustering coefficient)的概念。例如,社会网络中总是存在熟人圈或朋友圈, 其中每个成员都认识其他成员。集聚程度的意义是网络集团化的程度;这是一种网络的内聚倾向。连通集团概念 反映的是一个大网络中各集聚的小网络分布和相互联系的状况。例如,它可以反映这个朋友圈与另一个朋友圈的 相互关系。
3)连接样性:节点之间的连接权重存在差异,且有可能存在方向性。
4)动力学复杂性:节点集可能属于非线性动力学系统,例如节点状态随时间发生复杂变化。
5)节点多样性:复杂网络中的节点可以代表任何事物,例如,人际关系构成的复杂网络节点代表单独个体, 万维网组成的复杂网络节点可以表示不同网页。
6)多重复杂性融合:即以上多重复杂性相互影响,导致更为难以预料的结果。例如,设计一个电力供应网络 需要考虑此网络的进化过程,其进化过程决定网络的拓扑结构。当两个节点之间频繁进行能量传输时,他们之间 的连接权重会随之增加,通过不断的学习与记忆逐步改善网络性能。

复杂网络结构的理论研究与应用

复杂网络结构的理论研究与应用

复杂网络结构的理论研究与应用随着信息技术的快速发展,网络已经成为人类生活中不可或缺的一部分。

然而,网络的复杂性也是我们需要面对的一个问题。

为了更好地理解和解决网络复杂性问题,科学家们开展了大量的理论研究和实践探索。

本文将就复杂网络的理论研究和应用进行探讨。

1. 复杂网络的基本概念复杂网络是指较大规模、节点间具有多重联系、结构随机、动态变化的网络系统。

在复杂网络中,节点数较多,联系较为密集,而且存在不同的联系类型,如友谊关系、合作关系、竞争关系等。

这些联系形成了复杂的网络结构,网络中的信息传递和影响机制也相应变得复杂。

2. 复杂网络的理论研究复杂网络的理论研究主要涉及四个方面:网络结构、动力学过程、复杂网络中的特殊现象和拓扑结构等。

网络结构的研究包括节点度、聚类系数、网络直径等指标的定义和计算方法。

动力学过程则分析网络中各节点或网络子系统的演化过程和互动行为。

特殊现象包括网络中的“小世界效应”、“幂律分布”和“社区结构”等。

拓扑结构探讨的是网络中的关键节点、网络攻击等与网络安全相关的问题。

3. 复杂网络的应用复杂网络的应用范围广泛,涵盖了众多领域,如社会学、物理学、生物学、金融学等。

以下是其中的几个应用领域。

社会学:利用复杂网络分析社交网络结构、思想传播机制、领导人选择过程等。

例如,在政治选举中,通过分析政治家之间的联系以及社会网络中的节点贡献,可以更准确地预测选举结果。

物理学:利用复杂网络研究物质传递和信号传递等信息传输的机制。

例如,在材料科学领域中,人们可以通过研究材料中的交叉点来确定晶体结构,并根据这些结构设计更好的材料。

生物学:利用复杂网络分析生物系统中的代谢网络、生长发育以及蛋白质互作等复杂性问题。

例如,在癌症研究方面,可以利用复杂网络模型来分析不同细胞之间的依赖关系,以更准确地诊断和治疗癌症。

金融学:利用复杂网络预测股票市场走势、分析金融机构风险等。

例如,在股票市场中,可以通过分析不同公司之间的联系以及市场情况,预测股票价格的波动。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

自然基金成功范本--复杂网络链路预测的理论、算法和应用研究

国家自然科学基金

申 请 书 2 0 1 0 版 资助类别:面上项目 亚类说明: 附注说明: 项目名称:复杂网络链路预测的理论、算法和应用研究 国家自然科学基金申请书 2010 版

经费申请表 (金额单位:万元) 科目 申请经费 备注(计 算依据与说明) 一.研究经费 26.0000 1.科研业务费 16.0000 (1)测试/计算/分析费 4.0000 开发测试平台,购买计算时间,购买商业数据

(2)能源/动力费 (3)会议费/差旅费 5.0000 协办会议1万,国内参会或访问20人次 4 万

(4)出版物/文献/信息传播费 7.0000 国内论文出版费2万,PNAS/PLoS/NJP论文费5万

(5)其他 2.实验材料费 3.0000 (1)原材料/试剂/药品购置费 3.0000 项目开展中的各种耗材

(2)其他 3.仪器设备费 7.0000 (1)购置 7.0000 购买电脑10台,和其它研究用设备

(2)试制 4.实验室改装费 5.协作费 二.国际合作与交流费 5.2000 1.项目组成员出国合作交流 3.2000 项目组成员出国交流访问及参加学术会议4人次

2.境外专家来华合作交流 2.0000 境外专家来华访问2人次

三.劳务费 5.8500 学生助研费 四.管理费 1.9500 项目管理费 合 计 39.0000 国家其他计划资助经费 与本项目相关的 其他经费资助(含部门匹配) 其他经费来源 其他经费来源合计 0.0000

第 4 页 版本 国家自然科学基金申请书 2010 版

报告正文 (一) 立项依据与研究内容 1. 项目的立项依据 1.1 问题的提出 链路预测 Link Prediction 问题是指通过对已知网络结构的分析,包括一些可能的节点的其他信

息,来评估尚不相连的两个点之间产生链接的可能性,进而实现预测[1]。该问题具有重要的应用价

值,并且可以对网络科学的理论研究,特别是网络演化规则和节点相似性指标的评判问题,起到重

要的贡献。下面我们从实际应用和理论意义两个方面叙述。 很多生物网络,例如蛋白质相互作用网络和新陈代谢网络,节点之间是否存在链路,或者说是

否存在相互作用,是需要通过大量实验结果进行推断。我们已知的实验结果仅仅揭示了巨大网络的

冰山一角。仅以蛋白质相互作用网络为例,酵母菌蛋白质之间 80%的相互作用不为我们所知[2] ,而

对于人类自身,我们知道的仅有可怜的 0.3%[3,4]。由于揭示这类网络中隐而未现的链接需要耗费高

额的实验成本,如果能够在已知结构的基础上设计出足够精确的链路预测算法,再利用预测的结果 指导试验,就有可能非常明显地降低试验成本并加快揭开这类网络真实面目的步伐!实际上,社会

网络分析中也会遇到数据不全的问题,这时候链路预测同样可以作为准确分析社会网络结构的有力

的辅助工具[5,6]。除了帮助分析数据缺失的网络,链路预测算法还可以用于分析演化网络。举例来

说,近几年在线社会网络发展非常迅速[7] ,链路预测可以基于当前的网络结构去预测哪些现在尚未

结交的用户“ 应该是朋友” ,并将此结果作为“ 朋友推荐” 发送给用户:如果预测足够准确,显然有

助于提高相关网站在用户心目中的地位。另外,链路预测的思想和方法,还可以用于在已知部分节

点类型的网络 partially labeled networks 中预测未标签节点的类型――这可以用于判断一篇学术论文

的类型[8]或者判断一个手机用户是否产生了切换运营商 例如从移动到联通 的念头[9] ;以及用于纠 正观察到的网络结构中可能存在的错误[10] ,因为很多构建生物网络的实验中存在暧昧不清甚至自相

矛盾的数据[11]。 链路预测的研究可以从理论上帮助认识复杂网络演化的机制。针对同一个或者同一类网络,很

多模型都提供了可能的网络演化机制[12,13]。由于刻画网络结构特征的统计量非常多,很难比较不

同的机制孰优孰劣。链路预测机制有望为演化网络提供一个简单统一且较为公平的比较平台,从而

大大推动复杂网络演化模型的理论研究。另外,如何刻画网络中节点的相似性也是一个重大的理论

问题[14] ,这个问题和网络聚类等应用息息相关[15]。类似地,相似性的度量指标数不胜数,只有能

够快速准确地评估某种相似性定义是否能够很好刻画一个给定网络节点间的关系,才能进一步研究

网络特征对相似性指标选择的影响。在这个方面,链路预测可以起到核心技术的作用。链路预测问 题本身也带来了有趣且有重要价值的理论问题,也就是通过构造网络系综并藉此利用最大似然估计

的方法进行链路预测的可能性和可行性研究。这方面的研究对于链路预测本身以及复杂网络研究的

理论基础的建立和完善,可以起到推动和借鉴的作用。 1.2 研究进展 链路预测作为数据挖掘的方向之一在计算机领域已有一些早期的研究。他们的研究思路和方法

主要基于马尔科夫链和机器学习。Sarukkai[16]应用马尔科夫链进行网络的链路预测和路径分析。之

第 5 页 国家自然科学基金申请书 2010 版

后 Zhu 等人[17]将基于马尔科夫链的预测方法扩展到了自适应性网站(adaptive web sites)的预测 中。此外,Popescul 和 Ungar[18]提出一个回归模型在文献引用网络中预测科学文献的引用关系。

他们的方法不仅用到了引文网络的信息还有作者信息,期刊信息以及文章内容等外部信息。应用节

点属性的预测方法还有很多,例如 O’Madadhain 等人[19]利用网络的拓扑结构信息以及节点的属性

建立了一个局部的条件概率模型来进行预测。Lin[20]基于节点的属性定义了节点间的相似性,可以

直接用来进行链路预测。虽然应用节点属性等外部信息的确可以得到较好的预测效果,但是很多情

况下这些信息的获得是非常困难的,甚至是不可能的。比如很多在线系统的用户信息都是保密的。

另外即使获得了节点的属性信息也很难保证信息的可靠性,即这些属性是否反映了节点的真实情况,

例如在线社交网络中很多用户的注册信息都是虚假的。更进一步,在能够得到节点属性的精确信息

的情况下,如何鉴别出哪些信息对网络的链路预测是有用的,哪些信息是没 用的仍然是个问题。因 此与节点属性信息相比较,已观察到的网络结构或者用户的历史信息更容易获得也是更可靠的。

近几年,基于节点相似性的链路预测框架受到了广泛的关注,在该框架中,两个节点之间相似

性 或者相近性 越大,就认为它们之间存在链接的可能性越大。尽管这个框架非常简单,但是相似性

定义本身内涵丰富,它既可以是非常简单的共同邻居的个数,也可以是包含了复杂数学物理内容的

诸如随机游走的平均通讯时间[21]或者矩阵森林数目[22]。因此这个简单的框架事实上提供了无穷无

尽的可能性。Liben-Nowell 和 Kleinberg[23]将相似性指标分为基于节点和基于路径的两类,并分析

了若干指标对社会合作网络中链路预测的效果,他们发现,在仅考虑节点邻居信息的若干指标中,

Adamic-Adar 参数[24]表现最好。周涛、吕琳媛和张翼成[25]在 6 种不同网络中比较了 9 种局部相似 性指标在链路预测中的效果,并提出了两种新指标:资源分配指标 resource allocation index 和局

部路径指标 local path index 。研究发现,新提出来的这两种指标具有明显好于包括 Adamic-Adar

参数在内的 9 种已知指标的预测能力。最近其他小组的研究结果显示,新提出来的相似性指标在进

行群落划分[15]和含权网络权重设置[26]的时候也比原有指标好。吕琳媛、金慈航和周涛[27]进一步

在噪音强度可控的网络模型与真实网络中细致分析了局部路径指标的性能,发现这个指标具有与依

赖于网络全局结构信息的指标,例如 Katz 参数[28],可匹敌的预测能力,甚至在噪声较大的情况下

可以比 Katz 参数预测得更加准确。考虑到局部路径指标是一个计算量非常小的局部参数,其应用前

景可观。刘伟平和吕琳媛[29]比较研究了一些基于随机游走的相似性指标,并提出了两种局部随机游 走指标,他们发现有限步的随机游走反而可以给出超过全局收敛后的预测精度,而最优的游走步数

受到网络平均距离的强烈影响。另外,Huang 等人的实验结果暗示[30],在得到节点间的直接相似

性后,利用协同过滤技术对相似性指标进行一轮加权处理,一般而言可以得到更好的结果。

最近,最大似然估计方法被尝试应用于链路预测中。Clauset, Moore 和 Newman[31]认为很多

网络的连接可以看作某种内在的层次结构的反映,基于此,他们提出了一种最大似然估计的算法进

行链路预测,这种方法在处理具有明显层次组织的网络,如恐怖袭击网络和草原食物链,具有较好

的精确度。Guimera 和 Sales-Pardo[10]假设我们观察到的网络是一个随机分块模型 Stochastic

Block Model [32]的一次实现,在该模型中节点被分作若干的集合,两个节点间连接的概率只和相应

的集合有关。Guimera 和 Sales-Pardo[10]提出了基于随机分块模型的最大

相关文档
最新文档