源路由胖树网络的端节点动态容错路由方法

合集下载

解决路由器环路现象的方法

解决路由器环路现象的方法

解决路由器环路现象的方法路由器环路是指在计算机网络中,数据包在网络中传递时被路由器错误地传送回遍历的路径上,造成数据包不断循环。

这会导致网络拥塞、延迟增加甚至服务不可达等问题。

为了解决路由器环路现象,可以采取以下方法。

1.使用距离矢量路由协议(DVRP)距离矢量路由协议(Distance Vector Routing Protocol)是一种简单的路由选择算法,通过在网络中交换信息来建立路由表,并使网络中的每个路由器都能计算出到目的地的最佳路径。

DVRP可以避免环路形成,因为它使用了路由器之间的距离来计算路径成本,而不是直接通过之前的路径。

2.使用链路状态路由协议(LSRP)链路状态路由协议(Link State Routing Protocol)是一种更复杂的路由选择算法,它将网络中的每个路由器的链路状态信息(如带宽、延迟等)存储在路由器的链路状态数据库中。

通过交换链路状态信息,每个路由器可以计算出到目的地的最佳路径,并使用该路径转发数据包。

同样,LSRP可以避免环路形成,因为它计算路径时会考虑链路状态信息。

3.使用回环检测机制回环检测机制是一种可以检测并阻止环路的方法。

在实现中,路由器在转发数据包时,将数据包的源IP地址和传来的接口信息保存下来。

当同样的数据包重新出现在相同的接口上时,说明存在环路,路由器可以使用回环检测机制,丢弃数据包,阻止环路的产生。

4.利用路由器控制平面与数据平面分离路由器控制平面与数据平面分离是一种新兴的网络架构,它将路由器的控制决策从数据平面分离开来。

通过将控制平面与数据平面分离,可以在控制平面中实现环路检测和避免环路的算法,从而更好地管理网络中的路由器。

5.使用链路聚合技术链路聚合技术(Link Aggregation)是将多个链路捆绑为一个逻辑链路的技术。

在链路聚合中,多个链路可以同时传输数据,增加带宽和可靠性。

同时,通过链路聚合,可以避免环路的产生,因为传输数据的路径是预先配置好的,不会产生循环路径。

局域网组建的网络容错和冗余配置

局域网组建的网络容错和冗余配置

局域网组建的网络容错和冗余配置现代社会中,计算机网络的重要性不言而喻。

无论是企业、学校还是家庭,都离不开一个稳定、安全的局域网。

然而,网络故障或中断可能导致数据丢失、业务中断等问题,因此,局域网的网络容错和冗余配置显得尤为重要。

本文将探讨局域网组建中的网络容错和冗余配置,以确保网络运行的稳定性和可靠性。

一、网络容错技术概述网络容错是指在网络设备或连接出现故障时,能够自动检测并转移数据流量,从而在不影响业务的前提下保证网络的可靠运行。

常见的网络容错技术包括冗余设备、链路故障切换和负载均衡等。

1. 冗余设备冗余设备是指在一个网络节点出现故障时,能够自动切换到备用设备,以保证网络的正常运行。

例如,通过配置冗余路由器和交换机,当主设备损坏时,备用设备能够立即接管主设备的功能,从而避免网络中断。

2. 链路故障切换链路故障切换是指当一个网络链路出现故障时,能够自动转移数据流量到备用链路,以确保网络的可用性。

通过配置链路故障检测机制和备用链路,可以在主链路故障时快速切换到备用链路,避免数据丢失和业务中断。

3. 负载均衡负载均衡是指将网络流量均匀分配到多个网络设备上,以避免某个设备负载过重而导致性能下降或故障。

通过配置负载均衡算法,可以根据网络设备的负载情况智能地将流量分担到各个设备上,提高网络的可用性和性能。

二、网络容错和冗余的部署实践在局域网组建过程中,如何合理地配置网络容错和冗余设备,以达到最佳的网络可用性是关键。

下面将介绍一些常见的网络容错和冗余配置实践。

1. 设备冗余部署在局域网中,可以通过配置双机热备、主备模式等方式来实现设备的冗余部署。

双机热备是指在局域网中设置两台主机,一台作为主机提供服务,一台作为备机,当主机故障时,备机会自动接管主机的功能。

主备模式则是在局域网中设置一台主设备和一台备设备,当主设备故障时,备设备会自动切换为主设备。

通过这种方式,可以保证在设备故障时网络的正常运行。

2. 多链路冗余备份在局域网中,可以通过配置多个链路和链路故障检测机制来实现链路的冗余备份。

物联网中的动态路由算法

物联网中的动态路由算法

物联网中的动态路由算法近年来,随着物联网技术的飞速发展,越来越多的智能设备进入我们的生活中。

这些设备之间需要进行通信,而要实现这样的通信,就需要迅速、高效地找到一条合适的通信路径。

在物联网中,动态路由算法被广泛应用,它可以实现网络的自适应、优化和可靠性。

本文将介绍物联网中常用的动态路由算法及其优缺点。

一、物联网中的路由算法在物联网中,路由算法的主要任务是找到一条最佳的路径,让信息尽快地传输到目的地。

传统的路由算法有基于离散事件的模拟技术(DES)、最短路径算法(SPF)和最小成本路由算法等。

但这些传统算法并不适用于物联网。

物联网通常涉及大量的设备和节点,这个网络是分布式的、动态的,并且节点具有不可预测的移动性。

因此,物联网中的路由算法必须是动态的、自适应的、具有负载均衡和容错能力的。

为此,物联网中采用了一些适用于动态环境下的路由算法,常用的有以下几种。

二、基于距离矢量的路由算法基于距离矢量的路由算法(Distance Vector Routing Protocol,DVRP)是一种基于链路状态的路由算法,其主要思想是每个节点维护到其他节点的距离信息,通过比较每个节点距离其它节点的距离,寻找到一条最短路径。

这种算法的优势在于其简单易实现、抗噪声和抗故障能力强。

但它的缺点也很明显,如容易出现环路、收敛速度慢等。

但在小型的物联网中,这种算法仍然是一个不错的选择。

三、基于链路状态的路由算法在物联网中,基于链路状态的路由算法(Link State Routing Protocol,LSRP)也被广泛应用。

该算法要求每个节点通过广播自己的链路状态信息,以构建整个网络图,然后计算每个节点到达其他节点的最短路径。

这种算法的优点在于其收敛速度快、计算准确性高,但缺点也很明显,如通信效率低下、节点存储和计算负载大等。

四、基于蚁群算法的路由算法基于蚁群算法的路由算法是指模拟蚂蚁寻找食物的行为来寻找网络中最短的路径,它具有自组织、分布式、容错、自适应等特点,可以有效地处理动态和复杂的网络环境。

OMNET++建模正交胖树网络

OMNET++建模正交胖树网络

1正交胖树1.1理论基础拉丁方阵“拉丁方阵”是一个n*n的矩阵,方阵的每一行每一列都包含了n个元素:1, 2, …, n。

两个拉丁方阵、正交是指:从中选出的每一个有序对不重复。

包含n个元素的正交拉丁方阵不超过n-1个。

下面是n=4时的正交拉丁方阵:图1–1 n=4时的正交拉丁方阵1.2胖树何为“胖树”(Fat Tree),其递归定义如下:1 单个顶点是一个胖树,该顶点也是根节点2 如果、、、是胖树,且根节点分别为:、、、,构造新的胖树方法是:将、、、以任意方式与一组新的顶点、、、互连,得到的新胖树则以、、、为根节点,、、、为其子树。

2级胖树两级胖树,分为parent级和children级,分别对应level1和level0.图1–2 度为3时,2级胖树最多互连7个孩子节点表1–1 孩子节点连到付节点的编号(c代表孩子节点编号,p代表父节点编号)c i p1p2p31 12 32 1 4 53 1 6 74 2 4 65 2 5 76 3 4 77 3 5 7这里用到了一个定理:顶点度最大为d,且任意两个孩子节点之间的距离为2时,孩子节点数量最多为。

1.3基于拉丁方阵的两级胖树构造算法1.3.1算法输入输出算法输入顶点度:d正交拉丁方阵的序(order):n,n=d-1孩子节点数:算法输出N行d列的矩阵,第i行数值代表的是第i个孩子分别互连的d个父节点。

1.3.2算法步骤算法分为5步。

1)第1行d个元素分别是:N-d+1, N-d+2, …, N。

以d=4,n=3,N=13为例(下同),则是:10 11 12 132)第一列的元素,从第2个开始分别是:N-d+1(d-1个), N-d+1(d-2个),…,3)第一个方阵(标黄的n*n区域)包括第2, 3, …, d行的第2, 3, …, d24)第二个方阵(橙色的n*n区域)包括第d+1, d+2, …,2d-1行的第2, 3, …,d列。

第二个方阵用第一个方阵的转置填充。

dsr算法

dsr算法

dsr算法DSR算法是一种常用的分层移动Ad Hoc网络中的路由协议。

它的全称是Dynamic Source Routing,也就是动态源路由。

DSR算法可以在没有统一的协议和中心路由器的情况下,利用网络中的节点信息来实现数据的传输和路由选择。

在本文中,我们将详细探讨DSR算法的实现原理、优缺点以及应用场景。

一、DSR算法的实现原理DSR算法的实现原理可以简单地概括为“源路由”。

也就是说,当一个节点要发送数据包时,它会在数据包的头部添加一些路由信息,这些路由信息可以指示数据包要经过哪些节点才能到达目的地。

对于每一个节点,它都会根据数据包头部的路由信息来判断是否为当前节点所需要处理的路由信息。

如果是,则当前节点会按照路由信息的指示,将数据包转发给下一跳节点,直到最终到达目的地。

二、DSR算法的优缺点DSR算法相比其他路由协议具有以下优点:1. 简单易实现:DSR算法不需要中心路由器,通过在数据包头部添加路由信息,即可完成数据包的路由选择。

因此,它具有很好的可移植性和易扩展性。

2. 自组织能力强:由于DSR算法中所有节点都可以充当路由器,因此网络的拓扑结构可以持续地变化,使得网络具有很强的自组织能力。

3. 路由维护少:DSR算法中每个节点都只存储自己的路由表,因此相比其他路由协议,路由维护的压力较小。

DSR算法也存在一些缺点:1. 传输效率:DSR算法中数据包头部需要添加一些路由信息,这会增加数据包的大小和传输时间,降低传输效率。

2. 安全性:DSR算法中所有节点都可以获得数据包传输的路由信息,这也就意味着存在安全性问题。

攻击者可以通过篡改数据包头部中的路由信息来影响数据包的传输路径,从而危害网络的安全。

三、DSR算法的应用场景DSR算法适用于分层移动Ad Hoc网络环境下的数据传输和路由选择。

例如,车辆间通信、无线传感器网络等领域都可以使用DSR算法。

由于它的自组织能力强,适用于节点拓扑结构经常变化的情况下,使得应用场景更加广阔。

互联网行业的网络容错与冗余技术

互联网行业的网络容错与冗余技术

互联网行业的网络容错与冗余技术互联网的快速发展和普及给人们的生活带来了很多便利,但同时也带来了一些问题,比如网络的不稳定性和数据的丢失。

为了解决这些问题,互联网行业不断在网络容错和冗余技术上进行创新和改进。

本文将探讨互联网行业中常见的网络容错和冗余技术,并分析其应用和优势。

一、网络容错技术1. 高可用性技术高可用性技术是指互联网系统在面对网络中断或硬件故障时仍然能够运行的能力。

在实现高可用性的过程中,主要有以下几种技术:(1)负载均衡:通过将请求分发到多个服务器上,以实现对用户请求的平衡负载,提升系统的处理能力和稳定性。

(2)故障转移:一旦服务器出现故障,系统能够自动将请求转移到备份服务器上,确保服务的连续性。

(3)热备份:在主服务器发生故障时,备份服务器能够立即接管主服务器的工作,避免服务中断。

主备服务器之间通过心跳机制实现实时的状态同步。

2. 容错路由技术容错路由技术是指通过多条路径将数据传输到目的地,当某一条路径发生故障时,可以选择备用路径进行数据传输。

容错路由技术主要有以下几种:(1)多路径路由:源节点将数据同时发送到多个相邻节点,并根据不同的路径质量选择最优路径进行传输。

(2)路由备份:当某一节点发现网络中断时,可以选择备份节点进行数据传输,确保数据能够准确快速地到达目的地。

3. 容错协议技术容错协议技术是指通过合理设计和选择网络协议,使得互联网能够在面对故障和攻击时自动恢复或提供可靠的数据传输。

常用的容错协议技术包括:(1)UDP容错协议:UDP协议在数据传输过程中不对数据进行确认和重传,速度快,但不保证数据的可靠传输。

通过在应用层使用冗余校验方法,可以提高UDP传输的可靠性。

(2)TCP容错协议:TCP协议通过使用确认、重传和拥塞控制等机制,保证了数据的可靠传输。

当网络中断时,TCP协议能够自动重传丢失的数据,确保数据的完整性。

二、网络冗余技术网络冗余技术主要是为了保证系统的可用性和数据的安全性,在网络出现故障或攻击时能够进行自我修复和保护。

一种用于虚拟网络传输路径验证的新方法——SDN带内测量技术的应用

一种用于虚拟网络传输路径验证的新方法——SDN带内测量技术的应用邓晓智;李昭桦【摘要】网络中流量的传输路径验证问题是服务等级协议的重点内容之一.在网络虚拟化技术盛行的今天,对于PoT有严格要求的技术如服务功能链、分段路由等都需要对业务流量的实际转发路径做出严格的监管.为了解决虚拟网络环境中的PoT 问题,通过引入软件定义网络带内测量技术,结合基于秘密分享的叠加多项式算法,介绍了流量传输路径的验证原理,并在基于开放网络操作系统控制器的实验环境下进行验证.实验结果表明该方法有效可行,同时能保证整个过程自动且低负载.【期刊名称】《移动通信》【年(卷),期】2018(042)012【总页数】6页(P47-52)【关键词】路径验证;网络虚拟化;SDN;带内测量;秘密分享【作者】邓晓智;李昭桦【作者单位】广东电网有限责任公司电力调度控制中心,广东广州 510000;中国能源建设集团广东省电力设计研究院有限公司,广东广州 510000【正文语种】中文【中图分类】TN915.411 引言随着IT技术的不断发展,人们对IT服务质量的要求越来越高。

目前的服务等级协议(Service Level Agreement,SLA)[1]监测指标大都集中在延时、抖动、吞吐量、分组丢失率[2]等方面,旨在验证服务器正常运行的时间、存储可用性等[3]。

而利用SLA来保障流量路径方面的研究还未形成体系,相关文献也较为稀缺。

但无论是流量工程(Traffic Engineering,TE),服务功能链(Service Function Chain,SFC),还是基于策略的路由[3],都要将流量引导到具体可控的路径上,否则将面临网络服务质量无法保证的问题。

在网络功能虚拟化(Network Function Virtualization,NFV)的趋势下,流量传输路径的验证不再简单可控,这就需要研究一种满足虚拟网络下的传输路径验证(Proof of Transit,PoT)的新方法。

网络拓扑动态调整与优化方法

网络拓扑动态调整与优化方法随着网络技术的快速发展和互联网的普及应用,现代网络已经成为我们日常生活中不可或缺的一部分。

而在这个数字化时代,网络拓扑动态调整与优化方法变得尤为重要。

本文将介绍一些网络拓扑动态调整与优化的方法,帮助我们在不同需求下提高网络性能和效率。

一、网络拓扑动态调整的背景网络拓扑是指网络中各节点之间的连接关系,而网络拓扑动态调整则是指在网络运行过程中根据需求调整网络中节点之间的连接关系。

这是因为网络的需求是经常变化的,例如在某一时刻网络需要快速传输大量数据,而在另一时刻则需要优化网络结构以节省能源等。

因此,网络拓扑动态调整成为了解决这些问题的重要手段。

二、网络拓扑动态调整的方法1. 最小生成树算法最小生成树算法是一种经典的网络拓扑动态调整方法,它通过找到一颗生成树来实现最短路径的查找。

当网络中节点之间的连接关系需要调整时,最小生成树算法可以重新计算出最佳的路径,使得数据传输更加高效和快速。

最小生成树算法包括Prim算法和Kruskal算法等,这些算法通过权重等因素来确定节点之间的连接关系,从而优化网络拓扑。

2. 基于遗传算法的拓扑优化遗传算法是一种模拟自然进化过程的算法,它通过模拟“选择-交叉-变异”等步骤来优化网络拓扑。

在网络拓扑动态调整中,基于遗传算法的拓扑优化方法可以通过不断迭代来寻找最优网络结构。

该方法通过定义适应度函数,将网络结构看作一种基因组合,通过选择适应度高的基因来不断演化网络,以达到最优路径和连接的目的。

3. 人工智能算法的应用近年来,人工智能技术的发展为网络拓扑动态调整提供了新的思路和方法。

例如,神经网络算法可以通过学习网络中的连接和传输规律,自动调整网络拓扑结构。

深度学习算法可以通过大数据分析来预测网络需求,并进行智能化的拓扑调整。

人工智能算法的应用不仅可以提高网络的性能和效率,还可以降低人工干预的成本和复杂度。

三、网络拓扑动态调整与优化的意义网络拓扑动态调整与优化方法的应用可以带来许多重要意义。

网络容错与故障恢复

网络容错与故障恢复在现代社会,网络已经成为我们生活中不可或缺的一部分。

无论是个人使用还是商业领域,网络的稳定性和可靠性都提供了许多便利性。

然而,由于网络的复杂性和不可预测性,故障和中断是不可避免的。

因此,网络容错和故障恢复成为了保障网络可用性和稳定性的关键措施。

一、网络容错技术网络容错是指通过一系列技术手段来减少网络故障和中断对用户造成的影响,并保持网络的可用性。

下面将介绍一些常见的网络容错技术:1. 冗余技术冗余技术是一种通过增加冗余设备或路径来提高网络可靠性的方法。

例如,冗余路由器可以用作备份,当主路由器故障时自动切换到备用路由器,保证网络的连通性。

2. 负载均衡负载均衡是一种将网络流量分散到多个服务器上的技术。

通过将流量分散到多个服务器上,可以降低单个服务器的负载,并提高整个网络的性能和可用性。

3. 容错协议容错协议是一种在数据传输过程中具备自我修复能力的协议。

它能够检测和纠正数据传输中可能出现的错误,并确保数据的完整性和准确性。

二、网络故障恢复技术网络故障恢复技术是指在网络出现故障时,通过一系列措施来迅速修复故障,并将网络恢复到正常工作状态。

以下是一些常见的网络故障恢复技术:1. 自动重启服务自动重启服务是一种自动监控和重启网络服务的技术。

通过监控网络服务的状态,一旦出现故障,系统将自动进行重启,以恢复网络的正常功能。

2. 备份和恢复备份和恢复是一种通过定期备份数据和配置信息,并在发生故障时恢复到备份状态的技术。

这可以帮助快速恢复网络,并最小化对用户的影响。

3. 网络故障监测系统网络故障监测系统是一种用于实时监测和检测网络故障的技术。

它能够及时发现故障,并提供详细的故障报告,以便管理员能够快速定位和解决问题。

三、网络容错与故障恢复的重要性网络容错和故障恢复对于保障网络的可用性和稳定性至关重要。

以下是网络容错与故障恢复的几个重要方面:1. 最小化服务中断通过有效的网络容错和故障恢复措施,可以最小化网络服务中断的时间和影响。

网络拓扑结构的容错与冗余设计

网络拓扑结构的容错与冗余设计现代社会离不开网络的存在,而网络的可靠性和稳定性对于数据传输和通信的重要性日益凸显。

网络拓扑结构的容错与冗余设计成为保障网络稳定性的关键因素之一。

本文将围绕这一主题展开,讨论网络拓扑结构的容错设计原理、常用的冗余技术及其应用。

一、网络拓扑结构的容错设计原理网络拓扑结构是指网络中各节点之间连接的方式,它决定了数据传输的路径和可用性。

在容错设计中,采用适当的网络拓扑结构是至关重要的。

常见的网络拓扑结构有总线型、环形、星型、网状等。

1. 总线型拓扑结构总线型拓扑结构是指所有节点通过一个公共的传输线连接起来,数据传输按照先到先服务的方式进行。

在总线型结构中,任何一个节点的故障都会导致整个网络的瘫痪。

因此,在保证网络传输速度的前提下,需要在总线两端设置冗余节点,以防止单点故障导致的中断。

2. 环形拓扑结构环形拓扑结构是指各节点按照环状连接,数据按照顺时针或逆时针方向传输。

在环形结构中,任何一个节点故障都会导致整个环路断开,因此需要设置冗余节点或采用双向链路来实现容错设计。

此外,还可通过添加从其他网络拓扑结构到环形结构的连接实现冗余备份,以提高网络的可靠性。

3. 星型拓扑结构星型拓扑结构是指所有节点以中心节点为核心通过独立的链路连接起来。

在星型结构中,如果中心节点故障,将导致所有的节点失去连接。

所以,在星型结构中添加冗余节点成为保证网络稳定性的主要方法之一。

4. 网状拓扑结构网状拓扑结构是指各节点通过多个链路相互连接,形成一个复杂的网络结构。

网状结构的特点是具有高度的冗余性和容错性,因为其中的任何一个节点故障都不会影响整个网络的正常运行。

但是,网状结构的缺点是链路数量多、布线复杂,成本较高。

二、常用的冗余技术及其应用冗余技术是实现网络拓扑结构容错与冗余设计的重要手段,常见的冗余技术有冗余链路、冗余节点和冗余路径。

1. 冗余链路冗余链路指的是在网络中为主链路设置备用链路,以备主链路故障时能够自动切换到备用链路。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

源路由胖树网络的端节点动态容错路由方法*曹继军,刘 路,王永庆(国防科学技术大学计算机学院,湖南长沙410073)摘 要:容错路由是一种提高互连网络可用性的重要技术。

针对源路由胖树网络,本文提出一种端节点动态容错路由方法。

该方法采用三级路由存储层次结构,即端节点网卡存储路由表(RT),端节点内存存储扩展路由表(ERT),管理服务器硬盘存储系统扩展路由表(SERT)。

同时,节点的路径管理进程负责本节点扩展路由表的多路径状态管理,并在网络出现链路故障时选择可用路径代替当前的失效路径。

分析表明,本文提出的容错路由方法具有实现代价低、可扩展性高且不会导致死锁问题等优点。

关键词:胖树;源路由;容错路由;多路径中图分类号:TP393.06文献标志码:Adoi:10.3969/j.issn.1007-130X.2013.03.002End-point dynamic fault-tolerantapproach in source-routing fat treesCAO Ji-jun,LIU Lu,WANG Yong-qing(School of Computer Science,National University of Defense Technology,Changsha 410073,China)Abstract:Fault tolerant routing is an important approach to improve the usability of interconnectionnetworks.Aiming at the source-routing fat tree,this paper proposes an endpoint dynamic fault tolerantrouting approach.In the approach,a three level hierarchy is adopted for the routing storage,in which theRT(Routing Table)is stored in NIC(Network Interface Card)of the endpoint,the ERT(ExtendedRT)is stored in the memory of the endpoint,and the SERT(System ERT)is stored in the hard disk ofthe management server.Meanwhile,the path management process running in the endpoint is responsiblefor managing the state of multi-path maintained in the ERT of this endpoint,and replaces the currentfailed path with a chosen available path when a link fault occurs in the network.The primary analysis re-sults show that our proposed fault tolerant routing method has a low implementation cost and high scal-ability and cannot lead to deadlock problems.Key words:fat tree;source routing;fault tolerant routing;multi-path1 引言在大规模并行计算系统中,尽管单个网络部件发生故障的概率很低,但是整个互连网络出现故障的可能性却很高。

网络故障会导致应用程序异常退出甚至整个系统无法正常工作。

因此,互连网络的容错性设计已经成为工业界的共识,并得到学术界的广泛关注。

根据网络采取的容错措施是否会影响作业的正常运行,互连网络的容错可分为静态容错和动态容错。

静态容错在网络出现故障时需要停止作业,处理故障后再从作业检查点(CheckPoint)处重启作业。

而动态容错在网络出现故障时,网络上的消*收稿日期:2012-04-28;修回日期:2012-06-11基金项目:国家863计划资助项目(2012AA01A301)通讯地址:410037湖南省长沙市国防科学技术大学计算机学院计算机研究所Address:Institute of Computer,School of Computer Science,National University of Defense Technology,Changsha 410073,Hunan,P.R.China. CN 43-1258/TPISSN 1007-130X 计算机工程与科学Computer Engineering &Science第35卷第3期2013年3月 Vol.35,No.3,Mar.2013 文章编号:1007-130X(2013)03-0008-07息可以通过新的路径路由,从而保持网络的可用性。

显然,相对于静态容错而言,动态容错对作业运行的影响较轻,从而可使系统获得较高的可靠性和可用性。

动态容错通常是利用源和目的节点间路径多样性(Path Diversity)实现的,而根据容错位置又可分为端节点动态容错EDFT(EndpointDynamic Fault Tolerance)和局部动态容错LDFT(Local Dynamic Fault Tolerance)[1]。

前者由源节点动态地选择其他可用路径实现,因此较适合于采用源路由的网络;后者通过消息在故障区域处局部地重新选择可“绕开”故障区域的路径实现,该方式较适合于采用自适应路由的网络。

胖树拓扑结构由Leiserson在1985年提出[2],它是一种典型的多级交换网络。

胖树具有等分带宽高、网络直径短、扩展性好等优点,所以被广泛应用于超级计算机系统中。

同时,胖树能够为同一源和目的结点对提供多条路径,这种路径多样性使得胖树具有良好的容错支持能力。

源路由算法是一种通用的选路算法,这种选路方式实现较为简单,所以目前已广泛应用于互连网络的实现中,例如MIT Parc和Arctic路由器、Meiko CS-2、Myrinet等。

2010年世界超级计算机Top500排名第一的“天河一号(TH-1A)”[3]使用的就是源路由胖树网络。

本文针对源路由胖树网络,提出了一种端节点动态容错路由实现方法,并分析了该方法的特点和容错能力。

2 源路由胖树网络模型描述源路由胖树网络在拓扑结构上采用胖树结构,在路由实现上采用源路由,其路由算法通常选择最短路径路由算法。

本节首先给出胖树结构模型,然后基于该模型分别对源路由和最短路径路由算法的基本原理做简要描述。

2.1 胖树结构模型常见的胖树结构模型有两种,一种是k-ary n-tree模型[4],另一种是m-port n-tree模型[5,6]。

前者提出较早,且大量胖树方面的研究都是基于该模型的。

但是,与之相比,后者的所有交换机模块相连端口数相同,这更合乎实际应用。

为此,本文采用m-port n-tree的胖树结构模型,该模型的一种描述方式[6]如下。

定义1 m-port n-tree胖树由两种类型的顶点组成:2×(m/2)n个处理节点和(2n-1)×(m/2)n-1个m端口交换机。

处理节点标记为P(p=pn-1pn-2…p1p0),其中p∈{0,1,…,m-1}×{0,1,…,(m/2)-1}n-1,交换机标记为SW〈l,c=cn-2cn-3…c1c0〉,其中,l为交换机所在层号,l∈{0,1,…,n-1};c的取值范围是:c∈{0,1,…,(m/2)-1}n-1,if l=n-1{0,1,…,m-1}×{0,1,…,(m/2)-1}n-2, if l∈{0,1,…,n-2烅烄烆} 交换机SW〈l,c〉的第k个端口标记为SW〈l,c〉k,其中k∈{0,1,…,m-1}。

交换机端口SW〈l,c〉k和SW〈l′,c′〉k′相连,当且仅当:l′=l+1c′i=cifor all i≠lk′=cik=c′i+m/烅烄烆2 交换机端口SW〈l,c〉k和节点P(p)相连,当且仅当:l=0ci=pi+1for all i∈{0,1,…,n-2}k=p烅烄烆0 上述模型定义给出了由m端口构成的n级胖树网络中任意节点和交换机的标记规则,也给出了任意节点和交换机以及交换机间的端口连接规则。

图1所示为4-port 3-tree胖树的结构。

通常,整个计算系统的资源管理系统(如Slurm[7]等)是按照自然数序列对处理节点进行编号的。

为此,本文补充定义节点序号如下。

Figure 1 4-port 3-tree fat tree topology图1 4-port 3-tree胖树的拓扑结构定义2 m-port n-tree胖树中处理节点的节点序号以自然数编号,则任意的节点序号NID∈{0,1,…,2×(m/2)n-1}。

对于标记为P(p=pn-1pn-2…p1p0)的处理节点,其中p∈{0,1,…,m-1}×{0,1,…,(m/2)-1}n-1,则NIDP=pn-1·(m/2)n-1+pn-2·(m/2)n-2+…+p1·(m/2)+p0。

定义2给出了节点序号和节点标记的对应关9曹继军等:源路由胖树网络的端节点动态容错路由方法系。

例如,在4-port 3-tree胖树中,NID101=5,NID310=14。

2.2 源路由描述基于定义1和定义2给出的m-port n-tree胖树结构模型,基本的源路由模型具体包括路由表的结构和路由选择过程等。

定义3 m-port n-tree胖树的每个节点P存储着一张路由表RTP,该路由表是由2×(m/2)n个表项构成的线性表,其第i表项指明了本处理节点到节点序号为i的处理节点的路由路径(i∈{0,1,…,2×(m/2)n-1}),它可表示为RTP(i)=〈d,h=h0h1…hd-2hd-1〉,其中d为跳步数,即路径所经过的交换机SW的数目;h∈{0,1,…,m-1}d为路由路径,hk(k∈{0,1,…,d-1})即为路径所经过的第k+1跳交换机的输出端口。

如果采用最短路径路由,则跳步数d∈{1,…,2n-1}。

定义4 m-port n-tree胖树的源路由过程为:假设源节点标记为ps,目的节点标记为pd,(其中,ps,pd∈{0,1,…,m-1}×{0,1,…,(m/2)-1}n-1),则源节点和目的节点的序号分别为NIDps和NIDpd。

相关文档
最新文档