基于2D Mesh的NoC路由算法设计与仿真

合集下载

片上网络可重构路由算法的开题报告

片上网络可重构路由算法的开题报告一、选题背景和意义随着芯片制造工艺的不断发展和集成度的提高，片上网络（NoC）已成为面向多核系统的通信架构。

相比传统的总线或交叉开关网络，片上网络的通信带宽更大、延迟更小、可靠性更高，因此在高性能计算、通信、嵌入式系统等领域有着广泛应用。

然而，随着系统规模的扩大，传统的路由算法在网络拓扑结构复杂、路由表规模大等方面面临着挑战。

因此，如何提高片上网络的路由性能成为了一个重要的研究课题。

可重构技术是一种重要的解决方案，可以根据应用场景和网络拓扑结构来灵活地调整路由算法，以适应不同的需求。

二、研究内容和目标本论文将研究基于可重构技术的片上网络路由算法。

具体来说，研究内容包括：1. 基于可重构技术的片上网络路由算法设计与实现。

通过设计可重构的路由器和路由表，实现灵活可调的路由算法。

2. 基于不同应用场景和网络拓扑结构的路径搜寻策略。

根据应用场景和网络拓扑结构的特点，设计不同的路径搜寻策略，以实现更高效的路由。

3. 路由算法的优化与测试。

针对不同应用场景和网络拓扑结构，优化路由算法，实现更高效的路由。

同时进行实验测试，验证算法的性能和可扩展性。

本论文的目标是提出一种适用于不同应用场景和网络拓扑结构的高效灵活的可重构片上网络路由算法，以提高片上网络的通信性能和可靠性。

三、研究方法和进度安排本研究采用以下研究方法：1. 文献研究：对相关文献进行深入研究，了解当前片上网络路由算法的发展状况和存在的问题。

2. 算法设计与实现：设计可重构的路由器和路由表，实现灵活可调的路由算法。

3. 路径搜寻策略设计：根据不同应用场景和网络拓扑结构的特点，设计不同的路径搜寻策略，以实现更高效的路由。

4. 优化与测试：针对不同应用场景和网络拓扑结构，优化路由算法，实现更高效的路由。

同时进行实验测试，验证算法的性能和可扩展性。

预计的进度安排如下：第一年：设计可重构的路由器和路由表，实现灵活可调的路由算法。

2DMesh片上网络分区容错路由算法

2DMesh片上网络分区容错路由算法作者：胡哲琨杨升春陈杰来源：《计算机应用》2016年第05期Abstract： In order to reduce the entries of routing tables and avoid using large numbers of Virtual Channels （VC）， a Regionbased Fault Tolerant Routing （RFTR） algorithm was proposed for wormhole switching 2D Mesh Network on Chip （NoC） to reduce the amount of hardware resources. According to the positions of faulty nodes and links， the 2D Mesh network was divided into several rectangular regions. Within each region the packet could be routed by deterministic or adaptive routing algorithms， while among these regions the routing path was determined by up*/down* routing algorithm. Besides， with the Channel Dependency Graph （CDG） model， the proposed algorithm was proved to be deadlockfree using only two VCs. In a6×6 Mesh network， the RFTR algorithm can reduce the amount of routing table resources by 25%. Simulation results show that， with the same amount of buffer resources， the RFTR algorithm can achieve an equivalent or even higher performance compared to up*/down* and segmentbased routing algorithms.Key words：Network on Chip （NoC）； fault tolerant routing； deadlock avoidance；routing table； Channel Dependency Graph （CDG）0 引言随着集成电路工艺技术的发展，芯片内部可集成的IP核数目不断增加，出于对可扩展性、连线延时和功耗等因素的考虑，片上网络（Network on Chip， NoC）逐渐成为多核间通信的主流方式。

面向NoC的无死锁路由算法的研究的开题报告

面向NoC的无死锁路由算法的研究的开题报告一、研究背景随着处理器芯片的发展，集成的处理器数量越来越多，单个处理器显然已经不能满足处理大量数据的需求。

针对这一问题，研究人员开始探索如何在一个芯片上集成多个处理器，这就出现了多处理器系统（Multiprocessor System-on-Chip，MPSoC）。

在MPSoC中，处理器通过网络互连，数据在网络中传递，因此网络通信的性能和可靠性至关重要。

On-Chip Network（NoC）作为一种纽带，负责处理器之间的通信，已经成为了现代MPSoC架构中最重要的组成部分之一。

在NoC中，最常用的路由算法是基于最短路径的迪杰斯特拉（Dijkstra）算法。

该算法是基于收敛的无死锁路由基础，通常会在路由时引入一些虚拟通道，以避免死锁。

虚拟通道确实可以有效地解决死锁问题，但是另一方面，它们又会增加芯片面积和功耗。

因此，如何在不引入虚拟通道的情况下保证无死锁路由是NoC研究领域中的一个热门话题。

二、研究目的本研究旨在探索面向NoC的无死锁路由算法，以提高路由性能和网络可靠性。

具体的研究目标包括以下几点：1.调研目前常用的无死锁路由算法及其优缺点，并确定研究重点。

2.设计面向NoC的新型无死锁路由算法，并提出可行的方案。

3.通过仿真验证算法的有效性和性能，并对比不同算法之间的优缺点。

三、研究内容1. NoC网络结构及路由算法概述本章将介绍On-Chip网络的概念和作用，例如NoC中一些常见的网络结构和路由算法，并分析它们的优缺点和适用情况。

2.分析无死锁路由算法的现状本章将对目前常用的无死锁路由算法进行归纳，分析其优缺点，并决定研究的重点。

3.设计新型无死锁路由算法在前两个章节的基础上，本章将提出一种新的无死锁路由算法，并设计相应的算法逻辑和数据结构。

4.仿真分析算法的有效性和性能通过仿真验证新算法的有效性和性能，并与传统算法进行对比分析。

四、研究意义本研究旨在解决NoC中路由算法存在的死锁问题，提高网络通信性能和可靠性。

一种基于2D—mesh的低延迟NoC路由算法设计

ቤተ መጻሕፍቲ ባይዱ
方体（ｙｅｂ）ｈｐｒｕｅ以及蜘蛛网（ｉｒｎ等。图１ｃｓｄｇ）ｐｅｏ所示的是基于经典的２．ｅ结构的ＮＣ模型。此外，Ｄｍｓｈｏ由于在规
传统总线架构带来的问题。ｏＮＣ不仅提供了良好的空问可
国家自然科学基金资助项目（ｏ６８６２）安徽省自然科学基Ｎ．７０８，０
机制、由算法、路拥塞控制、ｏ（ＱＳ服务质量）和路由器结构
等６个方面，而片上网络的路由算法就是研究关键问题之
一
的规模川。当单个芯片上集成了成百上千个Ｉ核时，Ｐ传统
的基于共享总线机制的片上系统ｆｓｍＯ．ｉ．ｏ）ｓｔ．ｌｈＳＣ通ｙｅｉｐｃ信架构遇到了严峻的挑战，主要表现在片上系统的可扩展性问题变得突出，有限的资源空间问题日益成为扩展系统
１引言
随着半导体特征尺寸的缩小和集成电路工艺技术的发展，预计在未来若干年内，电子元件的特征尺寸将达到
３ｍ甚至２ｍ．并且在集成电路上将有数十亿晶体管２ｌｌ２ｌｉ
扩展性，还提供了很好的并行通信能力，从而提高了数据
吞吐率和网络性能。ＮＣ的互连技术的主要研究内容有：ｏ拓扑结构、交换
ｉ
ｔ
囊。
研究与开发
一
种基于２ — ｓＤｍｅｈ的低延迟ＮＣ路由算法设计ｏ
欧阳一鸣 ’丁同柱 ’梁华国 ’谢，，，涛１，２（．１合肥工业大学计算机与信息学院合肥２００：３０９２美国加利福尼亚圣地亚哥州立大学计算机科学系圣地亚哥９１２．２８）

基于双通道的NoC路由器系统级设计

Ｖｏ．２Ｎ．１１ｏ１Ｍａ．０２ｒ２１
基于双通道的ＮＣ路由器系统级设计ｏ
段丽芬，吴宁
（南京航空航天大学电子信息工程学院，江苏南京２０１）１０６
［摘要］为提高路南器的并行处理能力，减少传输延时，提出并设计了一种包含Ｇ通道与ＢＴＥ通道的双通道路由器．Ｔ通道Ｇ
ｏｈｙｔｍＣｌｔｏｍ，ａｄａｏｔｈｅＸＹ— ｍｅｓｏａｏｉｇａｇｉｈｍ，ｔｌｎｒｉｒｔｏｎｄｔｗｉｃｏｔｏｎｔｅＳｓｅｐａｆｒｎｄｐｓｔｄｉｎｉｎｌｒｕｔｎｌｏｒｔｈｅｐｏｌｇａｂｔａｉｎａｈｅｓｔｈｃｎｒｌｉ
ｆｂｉｔｅｌｅｔｅＧａａｐｃｅｓａｄＢａａｐｃｅｓｔｎｍｉｉｇｐｒｌ１ａｒｏｒａｉｈＴｄｔａｋｔｎＥｄｔａｋｔｒｓｔｎａａｌ．ｃｚａｔｅＫｅｒｓｅｗｏｋｏｈｐ，ｔ — ｈｎｅｒｕｅ，Ｓｓｅｙｗｏｄ：ｎｔｒｎｃｉｗｏｃａｎｌｏｔｒｙｔｍＣ
ＢａｅｎｙｔｍｖｌｓｄｏＳｓｅＬｅｅ
ＤｕｎＬｆｎ，ｕＮｉｇａｉｅＷｎ
（ｏｌｅｏＥｅｔｎｃＩｆｒｔｎＥｇｎｅｉ，ＮｎｉｇＵｉｅｓｙｏｅｏａｔｓｎｓｏａｔｓＮｍｉｇ２０１，ＣｉａＣｌｇｆｌｒｉｎｏｍａｏｎｉｅｒｇａｊｎｖｒｉｆｒｎｕｉｄＡｔｎｕｉ，ａｎ１０６ｈｎ）ｅｃｏｉｎｎｔＡｃａｒｃ

高性能NoC路由器结构研究的开题报告

高性能NoC路由器结构研究的开题报告一、研究背景及意义近年来，随着SoC（System on Chip）集成度的不断提高，大规模集成电路中网络互连的设计与实现变得日益复杂。

在诸多的互联方案中，网络-on-chip（NoC）逐渐成为一种主流的互连结构。

NoC使用一个分布式的通信系统来实现系统中的各个功能模块之间的数据交换，有助于提高系统的可维护性、可靠性和程序的并发性等特性。

NoC系统中的核心组件是路由器，它决定着数据包的转发、缓存和调度等关键参数。

因此，高性能NoC路由器的设计是一个具有理论和实际意义的重要课题。

目前，NoC路由器的研究主要集中在以下方面：路由算法、拥塞控制、缓存技术、核心处理器接口等。

这些研究工作为NoC系统设计和优化提供了很好的基础和指导，但还需要进一步探索高性能NoC路由器的结构方面的问题。

因此，本文将研究高性能NoC路由器的结构，分析其关键因素对路由性能的影响，以期为NoC系统的设计和实现提供新的思路和方法。

二、研究目标本文旨在研究高性能NoC路由器的结构，探索如下问题：1. 分析高性能NoC路由器的结构特点和需求。

2. 研究高性能NoC路由器结构因素对路由性能的影响。

3. 提出有效的高性能NoC路由器结构优化方法。

三、研究内容本文的研究内容主要包括以下几个方面：1. 阅读相关文献，分析高性能NoC路由器的结构特点和需求。

2. 研究高性能NoC路由器的核心组件，包括：输入端口（input port）、输出端口（output port）、路由计算单元（routing computation unit）和缓存单元（buffer memory）。

3. 分析高性能NoC路由器结构因素对路由性能的影响，包括：链路带宽、拥塞状况、缓存大小、路由算法等。

4. 提出高性能NoC路由器的结构优化方法，尝试解决实际场景中的路由器性能瓶颈问题。

5. 通过仿真实验验证所提出的优化方法的有效性。

四、研究方法本文主要采用文献研究的方法，收集和分析现有高性能NoC路由器的研究成果，探讨其结构特点和需求。

NoC_MPSim：基于片上网络通信架构多核仿真平台

Ａｂｓｒｃ：Ａｏｆｇｒｂｅｓｍｕａｉｎｐａｆｒ－ＮｏＭＰＳｍｓｐｏｏｅｈｓｐｐｒｏｘｌｒｎｓｇｐｃｔａｔｃｎｕａｌｉｌｔｌｔｍ－ｉｏｏＣｉｉｒｐｓｄｉｔｉａｅｒｅｐｏｇｔｄｅｉｎｓａｅｎｆｉｈｅ
ＮＣＭＳｍｏ — Ｐｉ。该平台包含处理器工具链、台自动化配置脚本以及一个包含处理器、平网络适配器以及多
种路由器的ＲＬ型库，Ｔ模可根据用户输入的系统配置信息自动生成周期精确的多核仿真系统。针对片上网络通信架构的特征，定义了基于该通信架构的多核系统的高层次通信抽象模型，并借鉴并行机中
的消息传递机制，出了一种可有效隐藏网络乱序的并行编程模型及其通信原语，完成其所需要的提并
软＼硬件建模。用提出的编程模型，应实现了ＭＳＣ算法基于四核仿真系统的分布式并行计算，ＵＩ并经实验得到该并行ＭＳＣ算法在该系统中加速比可达２６ＵＩ．。关键字：片上多处理器；片上网络；编程模型；通信抽象
— —
ｏＣ— ａｅｌｉｏｅｓｓｅｆＮｏｂｓｄＭｕｔ－ｃｒｙｔｍ．Ｔｈｌｔｒｗｈｉｈｃｎａｎｈｒｃｓｏｏｌｃｉ，ａｃｎｇａｉｎｓｒｐｎｅｐａｆｍｃｏｔｉｓｔｅｐｏｅｓｒｔｏｈａｎｏｏｆｕｒｔｏｃｉｔａｄａｉＲＴＬｍｏｅｉｒｒｎｌｄｎｒｃｓｅｓｎｅｗｏｋａｐｏｓａｄｒｕｅｓｉｂｅｔｅｅａｅａｃｃｅａｃｒｔｌ —ｃｒｄｌｌａｙｉｃｕｉｇｐｏｅｓｒ，ｔｒｄａｔｒｎｏｔｒ，ｓａｌｏｇｎｒｔｙｌｃｕａｅｍｕｔｏｅｂｉｓｍｕａｉｎｓｓｅａｃｒｉｏｉｐｔｐｒｍｅｅｓＡｇｅｅｏｉｌｔｏｙｔｍｃｏｄｎｇｔｎｕａａｔｒ．ｈｉｈｌｖｌｃｍｍｕｉａｉｎｍｏｅｓａｓｅｎｄｂｓｄｏｈｓｎｃｔｄｌｉｌｏｄｆｅａｅｎｔｉｏｉｃｍｍｕｉａｉｎａｃｉｅｔｒ，ｎｄｂｓｄｏｔａａｌｌｒｇａｏｎｃｔｒｈｔｃｕｅａａｅｎｉ，ａｐｌｏｒｍｍｉｇｍｏｅｎｄｉｏｏｒｅｐｎｄｌａｔｃｍｍｕｉａｉｎｐｉｔｖｓｓｎｃｔｒｍｉｅ，ｗｈｃｏｉｉｈｃｎｅｆｃｉｅｙｓｌｅｔｅｏｔｏ－ｏｄｒｐｏｌｍ，ａｅｒａｉｅｔｏｗａｅｈｄｒｎｒｓｒｃｕｅＢａｅｎｔｉａｆｅｔｌｏｖｈｕ — ｆｒｅｒｂｅｖｒｅｌｚｄｗｉｈｓｆｒ／ａｗａｅｉｆａｔｕｔｒ．ｔｒｓｄｏｈｓｐｏａｒｇｍｍｉｇｍｏｅ，ｅｉｅｐａｌｌｒｎｄｌｗｅｒａｚａｌｌｒｅＭＵＳＣａｔｍｅｉｎａ４ｏｅｓｓｅａｄｐｏｅｔｅｓｅｓ２．Ｉｒｈｔｉ－ｃｒｙｔｍ，ｎｒｖｈｐｅｄｕｐｉ６．ｉｃＫｅｒｓ：ｌｉｒｃｓｏｙｔｍ－ｎ— ｐ；ｔｒ —ｏ — ｉ；ｏａｙｗｏｄＭｕｔ－ＰｏｅｓｒＳｓｅｏ — ＣｈｉＮｅｗｏｋ —ｎ— ＣｈｐＰｒｇｍｍｉｇｍｏｅ；ｍｍｕｉａｉｎａｓｒｃｒｎｄｌＣｏｎｃｔｏｂｔａｔ

2D-Mesh结构片上网络无虚通道容错路由算法

2D-Mesh结构片上网络无虚通道容错路由算法姚磊;蔡觉平;李赞;张海林;王韶力【摘要】10.3969/j.issn.1001-2400.2012.06.005% 为了解决单故障节点情况下片上网络的无虚通道容错通信问题，提出一种新的片上网络容错路由算法.该算法在已有算法绕行思想的基础上，首先利用内建自测试机制获取故障节点的位置信息，再通过辅助节点来优化数据的绕行策略，达到了均衡故障节点周围链路负载并减少部分数据的绕行距离的目的.针对8×82D-Mesh网络的仿真结果表明，与Zhang摧s算法和Chen摧s算法相比，采用本文算法后网络的饱和注入率分别提高了3畅13%和21畅77%，在注入率为0.09时网络的通信功耗分别降低了3畅40%和5畅57%.【期刊名称】《西安电子科技大学学报（自然科学版）》【年(卷),期】2012(000)006【总页数】8页(P26-33)【关键词】容错;无死锁;片上网络;虚通道【作者】姚磊;蔡觉平;李赞;张海林;王韶力【作者单位】西安电子科技大学综合业务网理论及关键技术国家重点实验室，陕西西安 710071;西安电子科技大学宽带隙半导体国家重点实验室，陕西西安 710071;西安电子科技大学综合业务网理论及关键技术国家重点实验室，陕西西安710071;西安电子科技大学综合业务网理论及关键技术国家重点实验室，陕西西安710071;西安电子科技大学综合业务网理论及关键技术国家重点实验室，陕西西安 710071【正文语种】中文【中图分类】TP302随着内核数目的增加和特征尺寸的缩小,NoC中的串扰、耦合和电磁干扰等负面效应愈发明显,从而降低了NoC芯片的可靠性.具有容错能力的NoC路由算法可以有效降低NoC对各种干扰的敏感性,进而提高芯片的成品率,减少制造成本,成为近年来NoC研究的热点技术之一.针对NoC的容错路由算法可分为两类:使用虚通道(Virtue Channel)技术的路由算法[1-3]和无虚通道的路由算法[4-6].文献[7]的研究表明,与无虚通道的路由节点相比,使用虚通道技术的路由节点的逻辑门数目增加了1到2倍,建立时延增加了将近1倍.因此,无虚通道的路由算法更适用于对功耗和成本要求较为严格的NoC芯片中.Chen在文献[4]中提出一种Mesh结构NoC无虚通道容错路由算法(简称为Chen’s算法),该算法用于解决单故障节点容错时存在绕行规律性不强,网络负载不均衡的问题,如图11(a)所示.Zhang在文献[6]中提出了一种针对Mesh结构NoC 的单故障节点容错算法(本文简称为Zhang’s算法),如图11(b)所示,该算法在无故障区域使用XY算法,在绕过故障节点时通过禁止数据在东北角的转弯来避免死锁.Zhang’s算法绕行规律性较强,算法复杂度低,但存在绕行环路上负载较重的问题,影响了NoC的性能.针对Chen’s算法和Zhang’s算法存在的不足,笔者提出一种2D-Mesh无虚通道单故障节点容错路由算法,该算法以Zhang’s算法的绕行思想为基础,在BIST 获取的故障区域信息的基础上通过优化数据绕行策略来均衡故障区域周围链路负载,减少部分数据的绕行距离,保留了Zhang’s算法路由规则简单,绕行规律性强的特点,可有效减少单故障节点NoC的容错通信时延,降低芯片的路由功耗.分析和仿真结果证明了该算法的可行性和有效性.2D-Mesh片上网络的容错结构模型如图1所示,该网络模型由节点及节点间的连接边组成,其中节点分为正常节点和故障节点两种类型.当连接边的两端均为正常节点时,该边为正常边;否则,为失效边.与故障节点相邻的正常节点及正常边构成的环路称之为绕行环路.当故障节点位于Mesh网络的内部时,绕行环路为一个封闭的环;当故障节点位于网络的边或顶点时,绕行环路变为非封闭的链路.在本文中将这两种情况统称为绕行环路.用N NE、N NW、N SE和N SW分别表示绕行环路的东北、西北、东南和西南4个顶点.C、S、D和A分别代表当前节点、源节点、目的节点和故障节点.NoC节点按照功能可分为路由模块和本地单元,本文算法的节点结构如图2所示. 本文算法包括数据沿X轴方向的绕行方法和沿Y轴方向的绕行方法两部分.S与D的相对位置如下列情况时,数据会沿X方向遇到绕行环路:(1)S和D均位于绕行环路所在行(y A-1≤y S≤y A+1,y A-1≤y D≤y A+1)且分别处于A的东西两侧(x D＜x A＜x S或x S＜x A＜x D),D不在绕行环路上(x D＜x A-1或x D＞xA+1);(2)S位于绕行环路所在行,D位于故障区域所在列(x A-1≤x D≤x A+1).对于第1种情况,按Zhang’s算法,数据在绕过故障节点的过程中需要经过绕行环(链)路上的NW(SW)和NE(SE)两个顶点,到达第2个顶点后按照XY算法传输到目的节点D,如图3中S 1到D 1和D 2,S 2和S 3到D 5的传输路线(实线箭头所示).对于第2种情况,按Zh ang’s算法,若故障节点位于数据按照XY算法从当前节点C到目的节点D的传输路线上,则数据需要绕过故障节点A到达绕行环路上与D 同侧且纵坐标相同的节点,然后按XY算法传输,如图3中S 1到D 3,S 2和S 3到D 4的传输路线(实线箭头所示).需要注意的是,由于Zhang’s算法禁止在绕行环路东北角转弯,源节点S满足x S≥x A+1且y A-1≤y S≤y A,目的节点D满足xD≤x A且y D≥y A+1时,增加了数据的路由距离,还加剧了绕行环路上的拥塞.本文算法的优化如下:增加坐标为(x A+2,y A-1)和(x A+2,y A)的2个辅助节点,并增加坐标为(x A+2,y A+1)的辅助拐点,辅助节点存有通过BIST机制获得的故障节点A的坐标,辅助拐点的作用是改善部分数据因不能在绕行环路东北角转弯而出现绕行距离过长的问题.当数据到达辅助节点后根据目的节点D的坐标来判断下一步的路由方式,若满足x D≤x A且y D≥y A+1,则将数据沿Y轴向辅助拐点传输,并在到达后继续按照XY算法路由;否则,继续按照Zhang’s算法路由,如图3中S 2和S 3到D 4和D 5虚线所示的传输路线.在引入辅助拐点后,数据会沿着以NW,SW,辅助节点(x A+2,y A-1)和辅助拐点为顶点的矩形形成逆时针的环路,进而导致死锁.由于NW,SW和辅助拐点为绕行必需的节点,因此只能通过禁止数据在辅助节点(x A+2,y A-1)处由东向北的转弯来避免死锁的形成.根据Zhang’s算法,源节点和目的节点的相对位置满足x S＜x A,y S=y A且x D=x A+2,y D=y A以及x S≤xA+1,y S=y A-1且x D=x A+2,y D≥y A时,数据才会在辅助节点(x A+2,y A-1)处由东向北的转弯.对此本文算法改进如下:若源节点和目的节点的相对位置满足在节点(x A+2,y A-1)处由东向北的转弯,则当x S＜x A时数据到达绕行环路后按顺时针传输,在到达NE节点后按照XY算法路由;当x S=x A或x A+1时,数据沿绕行环路逆时针传输,在到达NE节点后按照XY算法路由.对于m×n的2D-Mesh NoC,当故障节点坐标满足1＜x A≤n-2且1＜y A≤m-1时,存在2(n-x A-1)×[x A(m-y A)]个符合优化条件的源-目的节点对.算法流程如图5(a)所示.与D的相对位置关系如下时,数据会沿Y方向遇到绕行环路:D和S分别位于故障区域南北两侧(y S＞y A+1,y D＜y A或y S＜y A-1,y D＞y A),且D位于故障节点所在列.数据沿Y方向绕行过程中,按Zhang’s算法,数据先沿着X方向到达目的节点所在列,再沿Y方向到达绕行环路并顺其左半周绕过故障节点,如图4中实线箭头所示传输路线.在这个过程中,数据沿着X方向多次进行180°转向,不仅增加了绕行距离,也使得绕行环路左半周负载较重.本文算法的优化如下:将坐标满足y＜y A-1,x A-1≤x≤x A+2或y＞y A+1,x A-1≤x≤x A+1的节点定义为辅助点,辅助拐点坐标为(x A+2,y A+2).数据在路由过程中,若发现当前节点C为辅助节点,则调整路由方式为:(1)若当前辅助节点C的横坐标xC=x A+2,目的节点D坐标为x A-1≤x D≤x A+1且y D≥y A+1,则将数据沿Y 轴向辅助拐点传输,并在到达后继续按照XY算法路由;(2)若当前辅助节点C坐标为y C＜y A-1,x A-1≤x C≤x A+1,目的节点坐标为x D=x A,y D＞y A,则数据先以XY 算法向SW节点传输,再按Zhang’s算法绕行;(3)若当前辅助节点C坐标为y C＞y A+1,x A-1≤x C≤x A+1,目的节点坐标为x D=x A,y D＜y A时,分两种情况,若x C=x A-1,数据先以XY算法向NW节点传输,再按Zhang’s算法绕行,否则,数据先以XY算法向NE节点传输,再按Zhang’s算法绕行;(4)不满足前3种条件时,按照Zhang’s算法路由.如图4中虚线所示的传输路线.对于m×n的2D-Mesh NoC,当故障节点坐标满足1＜y A＜m-1时,网络中存在[(y A-2)n(m-y A)+(m-y A-1)n(y A-1)]个符合优化条件的源节点-目的节点对.算法流程如图5(b)所示.定义1 NoC可视为一强联通有向图I=G(N,C),其中N表示网络I中所有路由节点的集合,C为所有路由节点间有向通道的集合.任意相邻的两个路由节点均由一对方向相反的通道(cai,c bi)相连,下标i为该通道对所对应路由节点的编号,下标a,b为通道的指向,其中a表示通道指向坐标增加的方向,b则相反.定义2 给定网络I,路由算法R的作用是将数据从当前通道cpi,p∈{a,b}及节点n d 映射到目的通道cqj,q∈{a,b},即R(c pi,n d)=cqj,p,q∈{a,b},其中n d为c pi所指向的节点.如果存在R(c pi,n d)=cqj,p,q∈{a,b},则称c pi到c qj存在通道依赖.根据本文算法的特点,若R(x pi,n d)=x qj或R(y pi,n d)=y qj,i≠j.定义3 对于存在一个故障节点的2D-Mesh网络I可分为两个部分I 1和I 2.其中I 1为包含绕行环路及辅助拐点在内的最小矩形网络,在该矩形网络内因绕行需要,存在从Y到X方向的转弯;I 2为网络I中除I 2外的部分.引理1 给定的网络I和算法R生成的通道依赖图D,若D中不存在环,则R在网络I 中是无死锁的.证明 Duato在文献[8]中已证明.引理2 对于无故障的2D-Mesh结构NoC网络,采用本文算法是无死锁的.证明对于无故障的2D-Mesh,本文算法等效于XY算法.由XY算法的规则可知其对应的通道依赖图D中不存在环,由引理1可知在2D-Mesh中采用XY算法是无死锁的.引理3 图6(a)所示的网络I 1,在本文算法R下是无死锁的.证明假设故障节点A的坐标为(s,t),按照Zhang’s算法,禁止数据在绕行环路东北角的转弯,如图6(b)所示,则禁止了边x a(s+1,t)到y b(s,t+1)转弯,在本文算法中为了避免死锁禁止了边x a(s-1,t+1)到y a(s-1,t+2)的转弯,并增加了从边y a(s,t+1)到x a(s+1,t+1)以及y a(s,t+2)到x b(s+1,t+1)的转弯.因为边的数目有限,采用穷举法可以证明图6(b)中的边无法形成环路,由引理1知,网络I采用本文算法R是无死锁的.同理可证,A位于网络边沿时对应的I 1在本文算法R下是无死锁的.定理1 对于最多存在一个故障节点的2D-Mesh结构NoC网络,采用本文算法是无死锁的.证明若无故障节点,由引理2可知,该命题成立.若存在一个故障节点,则等效于证明网络I中存在I 1时整个网络是无死锁的.用反证法.假设存在一个故障节点时,I的通道依赖图中存在一个环,则该环上的节点根据位置关系可分为3种情况:(1)环上的节点均位于I 2内;(2)环上的节点均位于I 1内;(3)环上的节点一部分位于I 2内,另外一部分位于I 1内.由引理2可知,情况(1)不成立.由引理3可知,情况(2)不成立.对于情况(3),若环存在,则需要满足:环路上的一条边从I1内离开后能与I 2内的其它边组成一条可再次回到I 1的链路.由引理2的证明过程可知,在X或者Y方向上不存在这样的链路,而在I 2构成的二维网络内,由于禁止了Y方向边到X方向边的转弯,因此也不存在这样的链路.即情况(3)不成立.综上,假设不成立,即对于最多存在一个故障节点的2D-Mesh结构网络,采用本文算法是无死锁的.仿真采用OPNEC-Sim[9]仿真软件,该软件以OPNET的网络仿真引擎为基础,针对NoC的特点在进程域,节点域和网络域建模,构成了一个用于仿真NoC网络性能的专用平台.仿真分为静态分析、动态分析和功耗分析3部分.文献[10]中提出了一种静态分析方法,为了能更准确地比较不同容错路由算法下NoC中的性能差异,引入静态分析的均值和方差σ2的概念,其中,均值是每个节点平均转发数据包的个数,反映了当前算法中所有源-目的节点对的平均端到端距离.方差σ2反映了节点转发数据包个数偏离均值的程度,反映了当前算法对应的节点负载的均衡状况.对8×8的2D-Mesh NoC分别采用Chen’s算法,Zhang’s算法以及本文算法进行静态分析,故障节点坐标为(4,5),结果如图7所示.与Che n’s算法和Zhang’s算法相比,本文算法能有效均衡故障周围节点的负载强度,使得故障周围节点的负载分布趋于对称.静态分析结果的均值和方差σ2如表1所示.本文算法得到的均值和方差均优于采用Zhang’s算法和Chen’s算法得到的结果,且随着NoC网络规模的扩大本文算法的优势会更明显.当网络为8×8时,与本文算法相比,Chen’s算法和Zhang’s算法静态分析结果的均值分别增加了7.86%和1.52%,方差σ2分别增加了147%和16%.为了评估本文算法的动态性能,仿真参数设置如下[12]:(1)整个NoC网络使用虫孔交换方式进行数据包的传递,数据包由微片(flit)组成,微片为数据交换的最小单位,每个节点以注入率α向网络中发送微片.(2)数据包的目的节点服从均匀分布.(3)每个节点发送的数据包相互独立,数据包的发送间隔服从指数分布,且参数λ=1/(1.25×103α).(4)每个节点在本地输入方向上的缓存无限大,目的节点能够快速处理收到的数据包.(5)每个输入信道的缓存大小为4flit,每个数据包由4个flit构成.对于每个注入率仿真时间持续30000 cycles,前10 000 cycles不计入仿真结果.在8×8的2D-Mesh网络中随机生成故障节点,仿真算法为本文算法,Zhang’s算法和Chen’s算法,仿真500次所得到的结果求均值.仿真结果如图8所示,与Zhang’s算法和Chen’s算法相比,采用本文算法可有效减少NoC的网络时延,且随着注入率的增加本文算法的优势更为明显.定义最低时延的两倍大小为饱和时延,饱和时延对应的注入率为饱和注入率.与Zhang’s算法和Chen’s算法相比,采用本文算法可以将NoC的饱和注入率分别提高3.13%和21.77%.改变故障节点位置,将故障点分别取在(3,4),(0,4)和(0,0),即故障节点分别位于网络中心、网络边沿上和网络的顶点时,仿真结果如图9所示.当故障节点位于网络中心部分时本文算法优势较为明显,这是由于故障节点位于网络中心时满足优化条件的源-目的节点对数目最多,算法的效果最为明显.当故障节点位于网络顶点时不存在满足优化条件的源-目的节点对,此时本文算法与Zhang’s算法性能相同.与Zhang’s算法和Chen’s算法所需的路由器[6]不同,本文算法在每个端口增加故障坐标存储器,如图2所示.功耗仿真环境为Orion2.0[1-2],参数设置如下:路由器采用65 nm工艺,工作频率为500 MHz,工作电压为0.8 V,每个端口输入缓存大小均为128 bit,本文算法所需的故障坐标存储器为32 bit,节点之间的连线长度为2.5 mm,其它参数采用默认值.NoC大小为8×8,故障节点位置为(4,5).本文的路由功耗仿真采用文献[13]中的思想方法,功耗分析结果如表2所示.虽然增加了32bit的故障坐标存储器,但是本文算法能够改善数据包在故障节点周围的拥塞以及减少平均端到端距离,其路由功耗在3种算法中最少.在注入率为0.09时,与Zhang’s算法和Chen’s算法相比,实现本文算法所需的通信功耗分别降低了3.40%和5.57%.本文针对Zhang’s算法和Chen’s算法的不足,提出了一种基于故障预测的2D-Mesh结构NoC无虚通道容错路由算法,该算法通过NoC的BIST机制获取故障节点位置信息,再通过辅助节点来优化数据的绕行路线,能有效降低NoC的网络通信时延.本文算法具有Zhang’s算法简单,绕行规律性强,无死锁的特点,还能降低网络的平均端到端时延.仿真表明,随着故障节点位置的变化,本文算法的时延性能优于Zhang’s算法和Chen’s算法,且随着网络规模的增加这一优势更加明显.同时,与Zhang’s算法和Chen’s算法相比,实现本文算法需要的功耗更少.【相关文献】[1]Rameshan N,Laxmi V,Gaur M S,et al.Minimal Path,Fault Tolerant,QoS Aware Routing with Node and Link Failure in 2-D Mesh NoC[C]//Proc of the 2010 25th IEEE International Symposium on Defect and Fault Tolerance in VLSI Systems.Los Alamitos:IEEE Computer Society,2010:60-66.[2]Seyrafi M,Asad A,Zonouz A E,et al.A New Low Cost Fault Tolerant Solution for Mesh Based NoCs[C]//2010 International Conference on Electronics and Information Engineering.Piscataway:IEEE,2010:207-213.[3]Duan Xinming,Sun Xuemei.Fault-tolerant Routing in A PRDT(2,1)-based NoC[C]//2010 2nd International Conference on Computer Engineering andTechnology.Piscataway:IEEE,2010:506-510.[4]Chen K H,Chiu G M.Fault-tolerant Routing Algorithm for Meshes Without Using Virtual Channels[J].Journal of Information Science and Engineering,1998,14(4):765-783.[5]Fukushima Y,Fukushi M.Fault-Tolerant Routing Algorithm for Network on Chip without Virtual Channels[C]//2009 IEEE International Symposium on Defect and Fault Tolerance in VLSI Systems.Piscataway:IEEE,2009:313-321[6]Zhang Z,Greiner A,Taktak S.A Reconfigurable Routing Algorithm for a Fault-Tolerant2D-Mesh Network-on-chip[C]//45th ACM/IEEE Design AutomationConference.Piscataway:IEEE,2008:441-446.[7]Chien A A.A Cost and Speed Model for k-ary n-Cube Wormhole Routers[J].IEEE Trans on Parallel and Distributed Systems,1998,9(2):150-162.[8]Duato J.A Theory of Fault-Tolerant Routing in Wormhole Networks[J].IEEE Trans on Parallel and Distributed Systems,1997,8(8):790-802.[9]Cai Jueping,Huang Gang,Wang Shaoli,et al.OPNEC-Sim:an Efficient Simulation Tool for Network-on-Chip Communication and Energy Performance Analysis[C]//International Conference on Solid-State and Integrated Circuit Technology2010.Piscataway:IEEE,2010:1892-1894.[10]Lin Shuyen,Huang Chunhsiang,Chao Chihhao,et al.Traffic-Balanced Routing Algorithm for Irregular Mesh-Based On-Chip Networks[J].IEEE Trans on Computers,2008,57(9):1156-1168.[11]Kiasari A E,Rahmati D.A Markovian Performance Model for Networks-on-Chip.Parallel[C]//Proc of the 16th Euromicro Conference on Parallel,Distributed and Network-Based Processing.Piscataway:IEEE,2008:157-164.[12]Kahng A B,Li B,Peh L S,et al.Orion 2.0:a Fast and Accurate Noc Power and Area Model for Early-Stage Design Space Exploration[C]//2009 Design,Automation&Test in Europe Conference&Exhibition.Piscataway:IEEE,2009:423-428.[13]Merkel A,Bellosa F.Task Activity Vectors:a New Metric for Temperature-Aware Scheduling[C]//Proc of the EuroSys 2008 Conference.New York:ACM,2008:1-12.。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

基于2D Mesh的NoC路由算法设计与仿真
欧阳一鸣;董少周;梁华国
【期刊名称】《计算机工程》
【年(卷),期】2009(035)022
【摘要】An XY-YX routing algorithm of 2D Mesh structure is presented, which is based on researching the turn model. The algorithm is deterministic, minimal and deadlock-free. Proof of deadlock freedom is presented. The algorithm is simulated on 4×4 2D Mesh network to evaluate the performance through NIGAM experimental platform. By comparing the algorithm with XY routing algorithm and minimal odd-even routing algorithm, it shows that the algorithm had a good performance in the uniform pattern and the hot spot pattern.%在研究Turn Model模型的基础上,提出一种基于2D Mesh结构的XY-YX路由算法,是一种确定性的无死锁的最短路径路由算法.给出无死锁的证明,通过片上网络(NoC)模拟仿真实验平台NIRGAM,将该算法在一个4×4的2D Mesh网络中进行仿真,并与XY路由算法及minimal OE(odd-even)路由算法进行比较,结果显示在转置模式和热点模式下具有良好的性能.
【总页数】4页(P227-229,235)
【作者】欧阳一鸣;董少周;梁华国
【作者单位】合肥工业大学计算机与信息学院,合肥,230009;合肥工业大学计算机与信息学院,合肥,230009;合肥工业大学计算机与信息学院,合肥,230009
【正文语种】中文
【中图分类】TP302
【相关文献】
1.基于内建自测技术的Mesh结构NoC无虚通道容错路由算法 [J], 姚磊;蔡觉平;李赞;张海林;王韶力
2.一种基于2D-mesh的低延迟NoC路由算法设计* [J], 欧阳一鸣;丁同柱;梁华国;谢涛
3.基于数控分流策略的2DMesh NoC路由节点设计 [J], 高健;崔建明
4.一种不规则2D Mesh的NoC路由算法 [J], 徐欣;王长山
5.基于Concentrated-Mesh和2D-Mesh结构的NoC路由算法 [J], 章功干;陈广宏
因版权原因，仅展示原文概要，查看原文内容请购买。