计算机体系结构的分类模型_沈绪榜

合集下载

计算机体系结构的分类模型

现在的基于构令流计算的体系结构是采用粗粒度的变件动态实现的：它可以是一个可重构的处理部件rPU ( reconfigurable Processing Unit) ，也可以是一个rPU 阵列，如图3 中所示。构令流来自存放在构令存储器CM ( Configuration Memory) 中的构件源，通过构令管理器(configuration manager) 控制执行。它是用来改变rPU 阵列的硬件结构以及形成进出rPU 阵列的数据流互连关系的[ 1 ] ，是按照数据流计算的方式工作的。

众所周知，由Flynn 提出的基于指令流计算的体系结构的分类方案，共用了6 个分类概念： IM( Instruction Memory) ， DM (Data Memory) ， CU(Control Unit) ， PU ( Processing Unit ) ， IS ( Inst ruc2tion St ream) 与DS(Data St ream) ，只有一个分类层次，共有4种体系结构类别：SISD、SIMD、MISD与MIMD。在实际计算机的体系结构中，除了Flynn 所提出的IM ，DM ，CU ， PU ，IS与DS等6个分类概念之外，还出现了构令存储器CM、可重构的处理部件rPU 以及构令流CS这3 个新的概念。
3.2.1坐标轴上的体系结构分类表示 2.2.2
坐标平面上的体系结构分类表示 3.2.3坐标空间中的体系结构表示
4.1
三维坐标分类法的必要性 4.2 三维坐标分类法的合理性 4.3 三维坐标分类法的完备性

最简单的基于数据流计算的体系结构就是ASIC
电路。因为ASIC 电路所要完成的功能是固定的，不需要操作码去定义其所要完成的功能，只需要用地址码去指明ASIC 电路的输入数据的来源与输出结果的目的地，就能完成ASIC 本身所定义的计算功能。

计算机体系结构知识点

第一章计算机体系结构得基本概念1 计算机系统结构得经典定义程序员所瞧到得计算机属性，即概念性结构与功能特性。

2 透明性在计算机技术中，把这种本来存在得事物或属性，但从某种角度瞧又好像不存在得概念称为透明性。

3 系列机由同一厂家生产得具有相同系统结构、但具有不同组成与实现得一系列不同型号得计算机。

4 常见得计算机系统结构分类法有两种：Flynn 分类法、冯氏分类法Flynn 分类法把计算机系统得结构分为4 类：单指令流单数据流(SISD)单指令流多数据流(SIMD)多指令流单数据流(MISD)多指令流多数据流(MIMD)5 改进后程序得总执行时间系统加速比为改进前与改进后总执行时间之比6CPI(Cycles Per Instruction ):每条指令执行得平均时钟周期数CPI = 执行程序所需得时钟周期数／IC7 存储程序原理得基本点：指令驱动8冯•诺依曼结构得主要特点1 以运算器为中心。

2 在存储器中，指令与数据同等对待。

指令与数据一样可以进行运算，即由指令组成得程序就是可以修改得。

3 存储器就是按地址访问、按顺序线性编址得一维结构，每个单元得位数就是固定得。

4 指令得执行就是顺序得5 指令由操作码与地址码组成。

6 指令与数据均以二进制编码表示，采用二进制运算。

9 软件得可移植性一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上正确地运行。

差别只就是执行时间得不同。

我们称这两台计算机就是软件兼容得。

实现可移植性得常用方法:采用系列机、模拟与仿真、统一高级语言。

软件兼容：向上（下）兼容：按某档机器编制得程序，不加修改就能运行于比它高（低）档得机器。

向前（后）兼容：按某个时期投入市场得某种型号机器编制得程序，不加修改地就能运行于在它之前（后）投入市场得机器。

向后兼容就是系列机得根本特征。

兼容机：由不同公司厂家生产得具有相同系统结构得计算机。

10 并行性：计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。

计算机系统结构考点总结

计算机系统结构考点总结计算机系统结构是计算机科学与技术领域的重要分支，涉及计算机硬件和软件的组成及其相互关系。

为了帮助大家更好地掌握这一领域的核心知识，本文将针对计算机系统结构的考点进行详细总结。

一、计算机系统结构基本概念1.计算机系统结构的定义及发展历程2.计算机系统结构的分类：冯·诺伊曼结构、哈佛结构、堆栈式结构等3.计算机系统性能指标：指令周期、CPU时钟周期、主频、缓存命中率等二、中央处理器（CPU）1.CPU的组成：算术逻辑单元（ALU）、控制单元（CU）、寄存器组等2.指令集架构：复杂指令集计算机（CISC）、精简指令集计算机（RISC）3.CPU缓存：一级缓存、二级缓存、三级缓存及其工作原理4.多核处理器：核数、并行计算、线程级并行等三、存储系统1.存储器层次结构：寄存器、缓存、主存储器、辅助存储器等2.主存储器：DRAM、SRAM、ROM等3.磁盘存储器：硬盘、固态硬盘、光盘等4.存储器管理：分页、分段、虚拟存储器等四、输入输出系统1.I/O接口：并行接口、串行接口、USB、PCI等2.I/O设备：键盘、鼠标、显示器、打印机等3.I/O控制方式：程序控制、中断、直接内存访问（DMA）等4.I/O调度策略：先来先服务（FCFS）、最短作业优先（SJF）、扫描算法等五、总线与通信1.总线分类：内部总线、系统总线、I/O总线等2.总线标准：ISA、PCI、PCI Express等3.通信协议：TCP/IP、UDP、串行通信等4.网络拓扑结构：星型、总线型、环型、网状等六、并行计算与分布式系统1.并行计算：向量机、SIMD、MIMD等2.分布式系统：分布式计算、分布式存储、负载均衡等3.并行与分布式编程：OpenMP、MPI、MapReduce等4.并行与分布式算法：排序、搜索、分布式锁等通过以上考点的总结，相信大家对计算机系统结构有了更加全面和深入的了解。

并行前缀加法器的研究与实现

并行前缀加法器的研究与实现微电子学与计算机2005年第22卷第12期并行前缀加法器的研究与实现靳战鹏沈绪榜罗曼(西北工业大学计算机学院.陕西西安710072)摘要:随着微处理器运算速度的大幅度提高,对快速加法器的需求也越来越高.当VLSI工艺进入深亚微米阶段的时候,很多情况下,无论是在面积还是在时序上连线都起着决定性的作用.文章基于不同的CMOS工艺.针对三种不同结构的并行前缀加法器,在不同数据宽度的情况下进行性能比较.根据深亚微米下金属互连线对加法器性能的影响,挑选出适合深亚微米工艺的加法器结构.关键词:并行前缀加法器,KS结构,LF结构,BK结构中图法分类号:TF39文献标识码:A文章编号:1000—7180(2005)12—092—04 ResearchandImplementationofParallelPrefixAdderJINZhan—peng,SHENXu—bang,LUOMin(SchoolofComputerScience,NorthwesternPolytechnicalUniversity,Xi'an710072China) Abstract:Witlltllegreatincreaseofthespeedofmodernmicroprocessors.theneedoffastadde rsbecomesmoreexi.gent.Whenthetechnologyhasgotthestageofdeepsubmicron.theconnectivewirewillplaya nimportantroleeitherintheareaorinthetiming.BasedonvariousCMOStechnologies:O.181~m,O.151~m,O.131~ mand90nm,thisthesismakes aperformancecomparisonwithdifferentbitwidths,andthenselectstheadderarchitecturefitf ordeepsubmicrontech. nologyaccordingtotheimpactofconnectivewiresonadderperformanceindeepsubmicront echnology.Keywords:Parallelprefixadder,KSadder,LFadder,BKadder 1引言众所周知.在高性能微处理器和DSP处理器中.二进制加法器的运算时间至关重要,加法运算常常处于高性能处理器运算部件的关键路径中随着微处理器运算速度的大幅度提高.对快速加法器的需求也越来越高.因此,为了减少进位传输所耗的时间.提高计算速度,多年以来,人们提出了许多快速加法器结构.并且以不同的电路设计类型加以实现i1一.为了进一步提高加法器的运算速度.提出了并行前缀加法器(ParallelPrefixAdder)结构[3-5]由于采用了简单的标准单元以及规则的内部连接.并行前缀加法器非常适合于VLsI实现对于目前的并行前缀加法器而言.在逻辑层次已经最小的情况下.如何进一步提高加法器的性能是一个关键的问题.在影响性能的几个因素中.扇出(Fanout)和连线长度在其中起了关键作用当VLSI工艺进入深亚微米工艺阶段的时候.在很多情况下.连线的作用无论是在面积还是在时序上都起收稿日期:20o5—04—14基金项目:国防"十五"预研课题(41308010108)西北工业大学研究生创业种子基金(Z20040o5O)着决定性的作用[6一.因此,研究加法器中互连线的作用是非常有必要的本文基于不同的CMOS工艺:0.18m,0.15m,0.13m,以及90nm,针对三种不同结构的并行前缀加法器:LF结构[41,BK结构网,以及KS结构[3J.在不同数据宽度的情况下进行性能比较.根据深亚微米下金属互连线对加法器结构的影响.挑选出适合深亚微米工艺的加法器结构2并行前缀加法器对于并行前缀加法器,有如下定义:两个操作数A=aoa1..…a1.an_l'B=bob1...6.b.其中0<i<0—1,O<j<n一1.同时有操作:+6,.j}F+6l,pi=aiblO<i<n一1(1)定义前缀操作"?":()?()=()<(2)因此,加法进位可以表示为:(—Cnkn-lkk)=(卫k)(卫k)(卫k)卫kh\,….j}1o厂,?,,?,…()().(,nm(3)2005年第22卷第l2期微电子学与计算机93从式(1)～式(3)廿J以看出,日lJ缴加法器廿J以是一个级联进位加法器(ripplecalTyadder).但是由于前缀操作具有结合律(Associativity):(()¨?()?()J,=()¨?(()J?()『,h<i<j<k(4)其中,()=()?()?()?…?()J一让明如卜:(()¨?()?(,=(学).(铷=(舒)(6)()?(()?(=()?()一,岛.±墨!(臣止盘iJ:&l盘2,一,g±墨:臣.f±(盘!墨:臣&2, 一.j}^,磅,～kl,,.j}磅,:(啦)(7)一磅,前缀操作同时还具有冥等律(Idempotency),()¨=()¨?()h<k<i<j(8)证明如下:()?()=()蛐?(,.?()"?()=().(=(?()()=()蛐?()=()(9)但是前缀操作不支持交换率.证明如下:()?()『=()()『?()F()(10)以上两个鲁式不相等.根据结合律以及冥等律这两种重要的特性.可以将以上串行加法操作转化成为并行的加法操作.其中.结合律允许前缀等式中的每一个子项进行预计算.这也就意味着上面提到的串行计算可以被分解为多个并行计算的过程.同时,冥等律允许这些并行计算的子项相互之间可以重叠.这样就使并行计算具有很大的灵活性.目前.通常使用的并行前缀加法器有KS加法器[31,LF加法器网以及BK加法器【5】,这三种并行前缀加法器的结构分别如图l～图3所示.图1KS/JI]法器结构图2LFJJII法器结构图3BK~II法器结构在以上三种结构中.LF结构充分利用了前缀计算所具有的结合律特性.但是没有使用冥等律.图2 中显示了l6位加法器的每一级节点之间的互联关系输入在最顶层.输出在最低层,最高位在最左边图中仅仅显示了横向之间的联系,而没有显示纵向之间的联系在第一行中.每一个节点用来计算,p,k.在后面每行中,拥有横向连线的节点都是一个前缀计算节点最后一行用来计算加法的和.LF加法器结构具有最小的逻辑深度,但是同时也具有最大的扇出.在最后一级.最大扇出可以达到n,2.因此,对于LF加法器而言,连线长度与扇出成为影响延迟的主要因素.如图1所示.KS加法器在一定程度上缓解了微电子学与计算机2005年第22卷第12期LF加法器大扇出的问题KS加法器充分利用了冥等律的特点.通过限制每一个节点的输出来减小扇出.但是付出的代价就是每一级中使用了更多的横向连线.在KS加法器中.最长连线的长度与LF加法器中的一样如图3所示.为了改进LF加法器的扇出,BK加法器增加了逻辑层次深度3并行前缀加法器电路特性分析为了简化三种加法器结构的比较.假设加法器的输入是同时达到在没有考虑连线延迟和扇出影响的情况下.KS加法器和LF加法器拥有最小的加法器延迟.而BK加法器由于其逻辑层次深度多了一级.因此比起KS加法器和LF加法器而言,延迟较大.但是随着CMOS工艺的不断发展.扇出和连线对电路延迟的影响已经起着重要的作用.因此. 评判加法器延迟的大小.已经不能够仅仅只关注逻辑电路层次的多少.同时也更要考虑扇出和连线的影响.在电路中.一段连线的模型分割成为多个短线.其中每一短线可以抽象成为分布式的连线模型.如图4所示其中.逻辑输入电容C;输出电阻.;门延迟;(C和为每一个线段的电容,电阻;(CL)为连线每一个负载节点i的负载电容图4分布式连线模型因此.总延迟就是每一级逻辑的延迟与每一级线段延迟的总和,即=+.当不考虑连线延迟的时候,根据文献[8],可以将逻辑延迟模型简化为lumpedRC模型.Ⅳ=+o.7Ro(CL)(11)/=1然而.随着工艺特征尺寸的不断下降.连线所引起的延迟越来越占据总延迟中的较大比重.文献提出了一种连线延迟的估计模型.如式(12)所示: NNNN=∑∑=∑(∑(12)/=1j=l/=1j=l根据文献[8],整个连线延迟公式可以简化为:NNo.7.∑(c+∑(0.4(Cw)+o.7(CL)Ⅳ+o.7∑((+(c))(13)j=/+l其中,第一项是连线电容效应,也就是连线的lumpedRC模型.第二项是连线的电阻效应.也就是分布式RC模型.4实验结果在TSMC0.181~m1P6M工艺,0.151zm1P6M工艺,0.131zm1P7M工艺,以及90nm1P8M工艺下.针对16位宽加法器,32位宽加法器,64位宽加法器, 以及128位宽加法器的LF结构,KS结构,BK结构进行比较.如图5所示16bit32bit64bit128bitDelay(0.18n1)16bit32bit64bit128bitDelay(0.15m)16bit32bit64biL128biLDelay(0.15m)圜囵圈囵16bit32bit64bit128bitDelay(90nm1图5四种工艺和位宽下三种加法器结构性能对比从图5中可以看出.BK加法器虽然在O.181zm工艺下的延迟不是最小.但是随着工艺尺寸的不断缩小,其相对于其他结构的加法器而言,具有一定2005年第22卷第12期微电子学与计算机的优势.即使在O.181xm工艺下,64位加法器的BK结构加法器的延迟也能够满足时序要求.因此,为了满足今后设计对工艺要求不断提高.便于工艺上的转换,在实现上,宜选取BK结构作为加法器结构.5结束语随着微处理器运算速度的大幅度提高.对快速加法器的需求也越来越高.因此.人们提出了许多快速加法器结构.包括并行前缀加法器(Parallel PrefixAdder)结构由于采用了简单的标准单元以及规则的内部连接.并行前缀加法器非常适合于VLSI实现本文基于不同的CMOS工艺.针对三种不同结构的并行前缀加法器.在不同数据宽度的情况下进行性能比较.根据深亚微米下金属互连线对加法器结构的影响.挑选出了适合深亚微米工艺的加法器结构参考文献[1】KUdea,NSasaki,HSato,eta1.A64-BitCarryLookA—headUsingPassTransistorBiCMOSGate[J].IEEEJ.Sol—id—StateCircuits,1996,31:810-819.[2】KSuzuki,eta1.A500MHz32bit0.4txmCMOSRISCPro—cessor[J].IEEE,Solid-StateCircuits,1994,29(12):1464- 1476.f3】PMKogge,HSStone.AParallelAlgorithmfortheEttl—cientSolutionofaGeneralClassofRecurrenceEquationsputers,1973,22(8):786-793.f4】RELadner,MJFischer.ParallelPrefixCompu~fion[J]. JACM,1980,27(4):831-838.f5】RPBrent,HTKung.ARegularLayoutforParallel Adders[J]puters,1982,31(3):260-264.f6】JCong.ChallengesandOpportunitiesforDesignInnova—tionsinNanometerTechnologies.SRCWorkingPaper,/prg_mgmt/frontier.dgw,1997.f7】JCong,DZPan.InterconnectDelayEstimationModels forSynthesisandDesignPlanning[J]andSouth PacificDesignAutomationConf.,1999,97-100.[8】HBBakoglu.Circuit,InterconnectionsandPackagingfor VLSI[M].Addison-WesleyPublishingCompany,1990.f9】EElmore.TheTransientResponseofDampedLinearNet—workswithParticularRegardtoWidebandAmplifiers[J1. JournalofAppliedPhysics,1948,55-63.靳战鹏男,(1981~),硕士研究生.研究方向为计算机系统结构,专用微处理器设计.沈绪榜男.(1933一),博士生导师,中国科学院院士.研究方向为计算机体系结构,专用微处理器设计,超大规模集成电路设计罗晏男,(1975一),博士,讲师.研究方向为计算机系统结构,专用微处理器设计,ASIC设计.(上接第91页)型的自身结构,对其作进一步的优化,是提高FIRE—Agent求解效率的根本途径.本文进一步的工作将从上述2个方面展开.参考文献[1】eBaySite.http://www.eBay.eom.WorldWideWeb.[2】AmazonSite.http://www.amazon.eom.WorldWideWeb. [3】ZaehariaG,MacsP.TrustManagementThroughReputa—tionMechanisms.AppliedArtificialIntelligence,2000,14 (9):881-908.f4】HuynhTD,JenningsNR,ShadbohNR.FIRE:Aninte—gratedTrustandRepumtionModelforOpenMullti-agent Systems.Proc.16thEuropeanConferenceonArtificialIn—telligence,V alencia,Spain,2004:18-22.f5】ShehoryO,KrausS.CoalitionFormationAmongAu—tonomousAgents:Strategiesandcomplexity.Reactionto Cognition,LectureNotesinArtificialIntelligence,Berlin: Springer,1993,957:57-72.[6】KetchpelS.CoalitionFormationAmongAutonomousA—gents.ReactiontoCognition,LectureNotesinArtificial Intelligence,Berlin:Springer,1993,957:73～88.f7】SandholmTW,LesserVR.CoalitionAmongComputa—tionallyBoundedAgents.ArtificialIntelligence,1997,94 (1):99-137.[8】罗翊,石纯一.Agent协作求解中形成联盟的行为策略. 计算机学报,1997.20(11):961～965.『91徐晋晖,石纯一.一种基于等价的联盟演化机制.计算机研究与发展,1999,36(5):513～517.李凯男,(1977一),博士研究生,助教.研究方向为人工智能,企业建模与优化.杨善林男.(1948一),教授,博士生导师.研究方向为人工智能,信息管理与决策支持系统.刘桂庆女,(1978一),博士研究生,讲师.研究方向为供应链管理,人工智能.。

计算机体系结构(计算机软、硬件的系统结构)

在支持多线程并行应用方面，未来多核处理器应该从如下两个方向加以考虑。第一是引入新的能够更好的能够表示并行性的编程模型。由于新的编程模型支持编程者明确表示程序的并行性，因此可以极大的提升性能。比如Cell处理器提供不同的编程模型用于支持不同的应用。其难点在于如何有效推广该编程模型以及如何解决兼容性的问题。第二类方向是提供更好的硬件支持以减少并行编程的复杂性。并行程序往往需要利用锁机制实现对临界资源的同步、互斥操作，编程者必须慎重确定加锁的位置，因为保守的加锁策略限制了程序的性能，而精确的加锁策略大大增加了编程的复杂度。一些研究在此方面做了有效的探索。比如，Speculative Lock Elision机制允许在没有冲突的情况下忽略程序执行的锁操作，因而在降低编程复杂度的同时兼顾了并行程序执行的性能。这样的机制使得编程者集中精力考虑程序的正确性问题，而无须过多地考虑程序的执行性能。
计算机体系结构发展的第四代从20世纪80年代中期开始，一直持续到现在。这个阶段，人们感受到的是硬件和软件的综合效果。由复杂操作系统控制的强大的桌面机及局域网和广域网，与先进的应用软件相配合，已经成为当前的主流。计算机体系结构已迅速地从集中的主机环境转变成分布的客户机/服务器(或浏览器/服务器)环境。世界范围的信息网为人们进行广泛交流和资源的充分共享提供了条件。软件产业在世界经济中已经占有举足轻重的地位。随着时代的前进，新的技术也不断地涌现出来。面向对象技术已经在许多领域迅速地取代了传统的软件开发方法。
概念性结构与功能特性，这是从程序设计者角度所看到的计算机属性。它包括机器内的数据表示、寻址方式以及对这些数据的运算和控制这些运算的执行等(即指令系统)。对于通用型机器，一般包括数据表示、寻址方式、寄存器定义、指令系统、中断机构、机器工作状态的定义和状态切换、机器级的输入、输出结构以及对信息保护的支持等。

计算机系统结构自考笔记

计算机系统结构自考笔记一、计算机系统结构概述。

1. 计算机系统的层次结构。

- 从底层到高层：硬件、操作系统、系统软件、应用软件。

- 各层次的功能及相互关系。

例如，硬件为软件提供运行平台，软件控制硬件资源的使用等。

2. 计算机系统结构的定义。

- 经典定义：程序员所看到的计算机属性，即概念性结构与功能特性。

- 包括指令系统、数据类型、寻址技术、I/O机制等方面的属性。

3. 计算机系统结构的分类。

- 按指令流和数据流的多倍性分类。

- 单指令流单数据流（SISD）：传统的单处理器计算机。

- 单指令流多数据流（SIMD）：如阵列处理机，适合进行数据并行处理。

- 多指令流单数据流（MISD）：较少见的结构。

- 多指令流多数据流（MIMD）：多处理器系统，如对称多处理机（SMP）。

- 按存储程序原理分类。

- 冯·诺依曼结构：程序和数据存储在同一存储器中，按地址访问。

- 哈佛结构：程序存储器和数据存储器分开，有各自独立的地址空间。

二、数据表示与指令系统。

1. 数据表示。

- 数据类型。

- 数值型数据（整数、浮点数）：不同的表示格式，如定点数的原码、反码、补码表示；浮点数的IEEE 754标准表示。

- 非数值型数据（字符、字符串、逻辑数据等）。

- 数据的存储方式。

- 大端存储与小端存储：大端存储是高位字节存于低地址，小端存储是低位字节存于低地址。

2. 指令系统。

- 指令格式。

- 操作码：表示指令的操作类型，如加法、减法等操作。

- 地址码：指出操作数的地址或操作数本身。

有零地址、一地址、二地址、三地址等指令格式，每种格式的特点及适用场景。

- 指令类型。

- 数据传送指令：在寄存器、存储器等之间传送数据。

- 算术运算指令：加、减、乘、除等运算。

- 逻辑运算指令：与、或、非等逻辑操作。

- 控制转移指令：如无条件转移、条件转移、子程序调用与返回等，用于改变程序的执行顺序。

三、存储系统。

1. 存储器层次结构。

- 高速缓冲存储器（Cache） - 主存储器 - 辅助存储器的层次结构。

计算机体系结构

一、计算机体系结构的基本概念计算机体系结构是指机器语言程序的设计者或是编译程序设计者所看到的计算机系统的概念性结构和功能特性。

Amdahl所定义的体现结构是指程序员面对的是硬件的系统。

所关心的是如何合理的进行软硬件功能的分配。

计算机系统结构是指机器语言级的程序员所了解的计算机的属性，即外特性。

可以包含数据表示，寄存器定义、数量、使用方式，指令系统，中断系统，存存储系统，IO系统等。

计算机组成是计算机结构的逻辑实现。

可以包含数据通路宽度，专用部件设置，缓冲技术，优化处理等。

计算机的实现是指其计算机组成的物理实现。

包括处理机，主存部件的物理结构，器件的集成度，速度的选择，模块、硬件、插件底板的划分和连接。

从使用语言的角度，可以把计算机系统按功能从高到低分为7级：0应用语言机器级、1高级程序语言机器级、2汇编语言机器级、3操作系统机器级、4传统机器语言机器级、5微程序机器级和6电子线路级。

3～6级为虚拟机，其语言功能均由软件实现。

硬件功能分配的基本原则：（1）功能要求。

首先是应用领域对应的功能要求，其次是对软件兼容性的要求；（2）性能要求。

如运算速度，存储容量，可靠性，可维护性和人机交互能力等；（3）成本要求。

体系结构设计的方法有三种：由上而下－从考虑如何满足应用要求开始设计；由下而上－基于硬件技术所具有的条件；由中间开始的方法。

体系设计的步骤：需求分析、需求说明、概念性设计、具体设计、优化和评价。

计算机体系结构的分类：（1）弗林FLYNN分类法：按指令流和数据流将计算机分为4类：①单指令流、单数据流－Single Instruction Stream Single Data Stream，SISD。

计算机，即传统的单处理机，通常用的计算机多为此类，如脉动阵列计算机systolic array；②单指令流、多数据流－Multiple，SIMD。

典型代表是并行处理机。

其并行性在于指令一级。

如ILLIAC、PEPE、STARAN、MPP等；③MISD计算机；④MIMD计算机。

计算机体系结构的分类模型_沈绪榜

图 1 M akintoto 波形
2. 1 基于指令流计算的体系结构基于指令流计算的体系结构是目前主要的冯诺依曼计算机体系结构. 因为运算指令是由操作码与数据地址码两部分组成的 , 于是指令流包括了操作流与数据流 , 是按控制流原理 (cont ro l f low paradigm )工作的 , 是应用最灵活的体系结构 . 如图 1 中所示 , 20 世纪 60 年代后期 , 基于指令流计算的体系结构 , 是通过以 74 /54 和 4000 系列为代表的 GP L(GeneralP urpo se L ogic)可重用的定制芯片实现的 . 20 世纪 70 年代第一块存储器芯片与第一块处理器芯片问世之后 , 可重用性是以微处理器、存储器和 GP L 器件相结合的(称为嵌入式系统)硬件形式实现的 , 用户只需通过编写不同的应用软件就能实现不同的应用 . 20 世纪 70 年代后期 , 随着芯片集成度的进一步提高 , 便出现了流行的(称为 MCU (MicroCo ntro lle r Unit) )的可重用的器件.
第 28 卷第 11 期 2005 年 11 月
计算机学报 CH IN ESE JOU RNA L OF COM P UT E RS
V ol. 28 N o. 11 No v. 2005
计算机体系结构的分类模型
沈绪榜张发存
1) 1), 2)
冯国臣车得亮王光
11 期
沈绪榜等 : 计算机体系结构的分类模型
1761
过程语言现在主要是在控制流计算机上 , 通过程序设计实现的 , 例如 , 面向对象的语言在控制流计算机上用程序实现是非常成功的. 2 . 2 基于数据流计算的体系结构最简单的基于数据流计算的体系结构就是 ASIC 电路 . 因为 ASIC 电路所要完成的功能是固定的 , 不需要操作码去定义其所要完成的功能 , 只需要用地址码去指明 ASIC 电路的输入数据的来源与输出结果的目的地 , 就能完成 ASIC 本身所定义的计算功能. 从 1987 年开始 , 美国卡内基梅隆大学的 Kung 及其同事 , 通过研究算法计算与专用逻辑芯片体系结构的关系 , 提出了基于数据流计算的脉动阵列 (sy st olic array )体系结构

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第28卷第11期2005年11月计算机学报CH INESE JOURNA L OF COM PU TERSV ol.28N o.11No v.2005收稿日期:2004-09-01;修改稿收到日期:2005-05-08.沈绪榜,男,1933年生,中国科学院院士,博士生导师,长期从事嵌入式计算机及其国产芯片实现的研究工作.张发存,男,博士,副教授,研究方向为嵌入式计算机系统结构.冯国臣,男,1975年生,博士研究生,研究方向为嵌入式计算机系统结构.车德亮,男,1975年生,博士研究生,研究方向为嵌入式计算机系统结构.王光,男,1973年生,博士研究生,嵌入式计算机系统结构.计算机体系结构的分类模型沈绪榜1) 张发存1),2)冯国臣1) 车得亮1) 王光1)1)(西安微电子技术研究所西安 710054)2)(西安理工大学计算机学院西安 710048)摘要根据计算机体系结构的发展,以指令流(instruction st ream)计算、数据流(data stream )计算与构令流(config ur atio n str eam)计算的概念为基础,提出了一种新的计算机体系结构的分类模型.关键词指令流;数据流;构令流;软件;构件;流件;体系结构中图法分类号T P 302The Classification Model of Computer ArchitecturesSHEN Xu -Bang 1) ZH AN G Fa -Cun 1),2) FENG Guo -Chen 1) CH E De -Liang 1) WANG Guang 1)1)(X i c an M icroelectronic T echnique Institute ,X i c an 710054)2)(S choolof Compu ter ,X i c an Univ ersity of T ech nology ,X i c an 710048)Abstract A ccording to the dev elo pment o f computer architectures,on the basis o f the concept of Instruction Str eam co mputation,Data Stream computation and Co nfiguration Str eam co mputa -tion,this paper proposes a new classification m odel of co mputer architectures.Keywords instruction stream;data stream;co nfiguratio n stream;so ftw are;configw are;flow -w are;ar chitecture1 引言从制造技术上讲,芯片的集成度是按摩尔定律成指数增长的,摩尔定律不是一个物理定律,而是一个经营管理的规律,目前已成为IC 业制定规划的标准,只有达到这个标准,才能实现计算能力不变时,微处理器的价格和体积每18个月能减小1倍的目标.从设计技术上讲,芯片集成度的不断提高,促进了可重用的芯片实现形式的不断发展变化.如何改变和重新定义计算硬件的性质,这不但会影响软件和硬件的计算平台,而且也会影响计算机的应用领域.在多媒体、无线通信、数据通信与许多其它的嵌入式应用领域中,为了满足标准的不断更新和多标准操作所带来的高吞吐量和超低功耗要求,可重构计算技术成了当前的研究热点.重构计算已经为硬件设计开辟了一个新天地,可能导致计算/逻辑0的一次革命.硬件重构不仅能加快程序执行,而且也能调整计算平台.为了尽可能地降低可重构性的开销,设计者必须从硬件与软件两个方面考虑计算任务的优化划分,寻找可重构性与性能之间的平衡.人们估计到2010年,90%以上的程序设计者都将是从事嵌入式系统的程序设计的,那时,可重构计算也将是程序设计者必须具备的基础知识之一.可重构计算技术的发展,使计算机不仅有传统的基于指令流计算的体系结构和基于数据流计算的体系结构,而且有基于构令流的体系结构.所以,为了更清楚地能对现代计算机的体系结构进行分类描述,需要有一种新的计算机体系结构分类模型.本文以指令流(instruction stream)计算、数据流(data stream)计算与构令流(configuration stream )计算的概念为基础,研究了一种新的计算机体系结构的分类模型.2 体系结构的发展导致现在的多种可重用的IC(Integrated Circuit)实现形式以及数字计算机体系结构发展的微电子学技术,是从1947年晶体管的发明开始的,1947~1957年是其研究与发展的10年;1957~1967年开始了晶体管生产的商业化.当1955年晶体管用于计算机事业之后,便开始了微电子技术沿着5个重要方面演变的革命:晶体管缩小(shrinking tran -sistor )、器件发明(device invention)、封装改进(package improvement)、体系结构创新(ar chitecture inno vation)以及CAD 设计(design by computer).按照Makimoto .s 的统计资料,IC 的实现形式是波浪式发展的,从标准化(standardization)形式到定制化(custo mization)形式再到标准化形式,以10年为周期周而复始地发展变化的,如图1中所示[1].每一周期都有与IC 集成度相适应的新的发展内容:芯片是1958年由Kilby 发明的,1967~1977年开始了定制芯片的商业化;微处理器是1974年由H off 发明的,1977~1987年开始了微处理器芯片商业化;1987~1997年是定制逻辑芯片的10年,也许低功耗高集成度的Flash 存储器件与可重构的逻辑器件预示着一个以用户编程(重构)能力为发展内容的IC 标准化实现形式新周期的开始,使IC 的标准化实现形式从可编程的芯片(处理器)形式,发展到可重构的芯片形式.图1 M akintoto 波形2.1 基于指令流计算的体系结构基于指令流计算的体系结构是目前主要的冯#诺依曼计算机体系结构.因为运算指令是由操作码与数据地址码两部分组成的,于是指令流包括了操作流与数据流,是按控制流原理(contro l flow para -digm)工作的,是应用最灵活的体系结构.如图1中所示,20世纪60年代后期,基于指令流计算的体系结构,是通过以74/54和4000系列为代表的GPL (General -Pur pose -Logic)可重用的定制芯片实现的.20世纪70年代第一块存储器芯片与第一块处理器芯片问世之后,可重用性是以微处理器、存储器和GPL 器件相结合的(称为嵌入式系统)硬件形式实现的,用户只需通过编写不同的应用软件就能实现不同的应用.20世纪70年代后期,随着芯片集成度的进一步提高,便出现了流行的(称为MCU(Micro -Co ntro ller Unit))的可重用的器件.历史上,基于指令流的具体结构除了控制流体系结构外,还出现过非控制流体系结构.控制流体系结构是以过程语言(例如BASIC,FORTRAN,PASCAL 和C)的基本概念为基础的,基本的动作是赋值,语句执行是顺序控制的.非控制流体系结构则出现过4种:(1)以单赋值语言(例如,ID,LU CID,VAL 和VALID)的基本概念为基础的,数据从一个语句/流0向另一个语句,语句的执行是数据驱动的,而且,标识符遵守单赋值规则,对应的是数据流体系结构;(2)以应用语言(例如:Puro,LISP,SASL 和FP)的基本概念为基础的归约的体系结构;(3)以面向对象的语言(例如,SM ALLTALK)的基本概念为基础的递归的体系结构;(4)以谓词逻辑语言(例如,PROLOG)的基本概念为基础的推理的体系结构.非控制流体系结构虽然有过很多研究,但由于开销太大,没有得到实际应用,如今已没有继续研究.非1760计算机学报2005年过程语言现在主要是在控制流计算机上,通过程序设计实现的,例如,面向对象的语言在控制流计算机上用程序实现是非常成功的.212 基于数据流计算的体系结构最简单的基于数据流计算的体系结构就是ASIC 电路.因为ASIC 电路所要完成的功能是固定的,不需要操作码去定义其所要完成的功能,只需要用地址码去指明ASIC 电路的输入数据的来源与输出结果的目的地,就能完成ASIC 本身所定义的计算功能.从1987年开始,美国卡内基#梅隆大学的Kung 及其同事,通过研究算法计算与专用逻辑芯片体系结构的关系,提出了基于数据流计算的脉动阵列(sy stolic array)体系结构[2].脉动阵列是一个数据路径部件DPU (Data Path Unit)的阵列,实际上是一个PU 的阵列,如图2中所示.它能完成大粒度的计算,例如,矩阵运算.它的工作过程是:数据以一种有节奏的方式从数据存储器流出,通过流入PU 阵列完成计算,计算结果从PU 阵列流出,再流入数据存储器.就像心脏收缩使血液进出心脏那样,作者遂称其为脉动阵列.图2 基于数据流计算的体系结构示意图由于PU 阵列的计算功能是事先按照算法的需要设计好的,不需要有控制PU 阵列如何操作的命令,而只需要有控制数据存储器的数据进出PU 阵列的命令,也就是对PU 阵列来说,是按数据流计算的方式工作的,不需要有操作流的功能,而只需要有数据流的功能.因此,控制PU 阵列工作的命令,就没有像通常的指令那样有控制数据流与操作流的功能,而只有控制数据流的功能.实质上,这就是现在人们称作流件(flow ware)的起源.流件只是用来定义数据进出PU 阵列的端口与时间步骤的,如图2中所示,与PU 阵列的12个端口相联系的12个数据流,具体表明了流件的基本语义原理:从一个流件源产生的数据调度,决定在什么时候什么数据对象必须进入或离开哪一个PU 阵列端口.流件就是按照这种办法去安排嵌入式分布存储器的自动控制的数据存储器DM (Data Memo ry)体,以产生所希望的数据流的.指令流计算的指令流来自软件源,通过单一的程序计数器(pr ogram counter)控制执行,其数据流在指令的控制下流动;而数据流计算的数据流则来自流件源,在一个或多个数据计数器(data co unt -ers)控制下流动.按照数据流体系结构的划分方案,允许每个自动控制的数据存储器体可以有一个数据计数器(如图2所示).程序计数器是用来管理指令流的:读出下一条指令,改变指令地址,指令循环与嵌套,数据操作;指令地址计算与读出指令是有存储周期开销的;而数据计数器是用来管理数据流的:读出下一个数据,改变数据地址,数据循环与嵌套,但是没有数据操作;数据地址计算与读出数据的存储周期开销是可以避免的[3].文献[4]中的非控制流体系结构的数据流计算机已被淘汰,随着芯片集成度的提高,基于数据流计算的控制流体系结构得到了迅速发展.213 基于构令流计算的体系结构20世纪80年代后期,随着芯片集成度的进一步提高,硬件从不可重构的实现形式,发展到了以PLD 与FPGA 为代表的各种细粒度的静态可重构的(reconfig urable)硬件实现形式,进一步提高了硬件的可重用性.静态可重构实质上就是用户在使用FPGA 之前,要事先定义FPGA 中的细粒度单元的功能以及重构这些单元之间的互联关系.最简单的基于构令流计算的体系结构,就是这种可重构的FPGA 电路,也就是现在称之为变件(morphw are)的电路.它的结构一旦改变好之后,则只需要控制该电路的输入数据的来源与输出结果的目的地,就能完成重构所事先赋予FPGA 的计算功能,它也是按数据流计算的方式工作的.因此,构令流计算的效率接近于数据流计算的效率,但是,构令流计算的可重构性则带来了类似指令流计算那样的灵活性.如图1中所示,20世纪90年代,出现了粗粒度的FPGA 芯片,实际上,就是一种基于总线的SoC 动态可重构的硬件实现形式,重构是通过现在人们所说的构件(configuw ar e)实现的.动态可重构就是在使用过程中,可以通过构件定义FPGA 的功能.176111期沈绪榜等:计算机体系结构的分类模型大约在1999年,人们又开始了基于网络的SoC(又称为NoC(Netw ork on Chip))的动态可重构硬件实现形式的研究[5].现在的基于构令流计算的体系结构是采用粗粒度的变件(morphware)动态实现的:它可以是一个可重构的处理部件rPU (r econfigurable Processing Unit),也可以是一个rPU 阵列,如图3中所示.构令流来自存放在构令存储器CM (Configuratio n Memo ry)中的构件源,通过构令管理器(config ura -tion m anager)控制执行.它是用来改变rPU 阵列的硬件结构以及形成进出rPU 阵列的数据流互连关系的[1],也是按照数据流计算的方式工作的:构令执行之后,只要该构令的数据流还在进行时,硬件结构以及互连关系是不变化的.图3 基于构令流计算的体系结构示意图随着芯片集成度的提高,基于构令流计算的体系结构已成为当今的研究热点.PA CP 公司研制的名为XPP(eXtreme Processing Platfo rm)的动态可重构的IP 核,已用于一种可重构的So C 芯片中①.该动态可重构的IP 核由64个可重构的24位的ALU 模块、16个可重构的RAM 模块以及8个可重构的I/O 模块组成,在构令管理器的控制下工作.根据应用的计算要求不同,在SoC 芯片上可以包含一个或多个动态可重构XPP 这样的IP 核.3 体系结构的分类模型众所周知,由Flynn 提出的基于指令流计算的体系结构的分类方案,共用了6个分类概念:IM (Instructio n M em ory ),DM (Data M emor y ),CU (Contr ol U nit),PU(Pr ocessing Unit),IS (Instruc -tion Stream)与DS(Data Stream );只有一个分类层次,共有4种体系结构类别:SISD 体系结构、SIMD 体系结构、MISD 体系结构与M IMD 体系结构.Fly nn 的体系结构分类方案是在1966年提出来的[6],在当时的硬件水平条件下,提出的指令流与数据流的概念以及把指令流和指令控制下的数据流结合在一起的4种计算机体系结构的分类,对计算机体系结构的发展起到了促进作用.由于Flynn 的分类方案非常简洁,后来便出现了一些更细化的体系结构分类方案.例如,1989年Dasgupta 提出了一个多层次的分类方案[7],可以详细地刻画现有机器的内体系结构.由于其分类字符是以计算机内体系结构中的典型部件结构为依据的,因此,如果再出现新的典型部件结构,则这种分类方案就无法描述了.这些方案都没有像Flynn 提出的只以典型逻辑概念为基础的体系结构分类方案那样,受到广泛的关注和引用.芯片集成度与CM OS 掩膜版价格的指数上升,促进了可重用的芯片实现形式的迅速发展.以IP 核为基础的设计方法学以及用来完成功能与体系结构协同设计的动态可重构平台的使用,有效地提高了SoC 设计的效率,增加了SoC 功能的可调整性,使更多可重构的硬件集成到SoC 的体系结构中,除了基于指令流计算的体系结构之外,还形成了基于数据流计算与构令流计算的体系结构.在实际计算机的体系结构中,除了Flynn 所提出的IM ,DM,CU,PU,IS 与DS 等6个分类概念之外,还出现了构令存储器CM(Co nfiguration M em ory)、可重构的处理部件rPU (reconfig ur able Processing U nit)以及构令流CS(Config uration Stream)等3个新的概念.针对这种情况,本文提出了一种新的计算机体系结构分类模型及其分类表示方法.311 一种新的体系结构分类模型这里提出的计算机体系结构的分类模型,是以指令流、数据流与构令流的概念为基础的,是以分别称为I(Instruction stream )体系结构、D(Data str eam)体系结构和C(Config ur ation stream)体系结构为坐标轴来建立的(如图4中所示),在此称为IDC 体系结构分类模型.这3个正交的坐标轴是用来定义体系结构所在的空间的.I 轴只表示基于指令流计算的体系结构,D 轴只表示基于数据流计算的体系结构,C 轴只表示基于构令流计算的体系结构.每个轴的箭头方向表示该类体系结构的实现程度.1762计算机学报2005年①PACT T ech nologies.Th e XPP White Paper Release 211.http://w 图4IDC体系结构分类模型在IDC体系结构分类模型中,两个轴定义的平面用来表示具有两类流计算的体系结构.ID平面用来表示具有指令流计算与数据流计算两种硬件实现形式的计算机体系结构.IC平面用来表示具有指令流计算和构令流计算的体系结构.DC平面用来表示具有数据流计算和构令流计算的体系结构.实际上更多的体系结构是分布在IDC体系结构分类模型的三维空间中的,属于具有指令流计算、数据流计算与构令流计算的计算机体系结构.312体系结构的分类表示如前所述,在图4所示的体系结构分类模型中,体系结构可以看做是属于一维的坐标轴上的,二维的坐标平面上的以及三维的坐标空间上的.为了使这3种情形以及由多种基本体系结构组合而成的复杂体系结构的分类表示清楚起见,体系结构的分类采用了众所周知的e-mail地址的类似表示方法. 31211坐标轴上的体系结构分类表示对在坐标轴I上表示的基于指令流计算的体系结构来说,采用Flynn分类的体系结构表示方法,共有SISD,SIM D,M ISD与MIM D4种基本体系结构分类表示.但是,现代的计算机并不都是单一的SISD,SIM D,M ISD或M IMD的体系结构,而有些是这些体系结构的组合.例如,由一个SISD的RISC处理器作为宿主机,与一个SIMD的PE阵列作为协处理器组成的嵌入式图像处理的SoC芯片,就是两种体系结构的组合,用SISD#SIMD表示就更为准确一些.这种组合表示是需要的,因为在现代的微处理器中,为了更好地支持多媒体应用,也开始增加一些SIMD指令,M MX指令就是一个众所周知的例子.这种微处理器所构成的计算机,其体系结构用SISD#SIM D组合表示就更准确些.这样一来,在坐标轴I上就可以有15(C14+C24+C34+C44)种体系结构的类别表示.对在坐标轴D上表示的基于数据流计算的体系结构来说,其数据流是从流件源来的,如图2中所示,是没有操作流而只有数据流的.所以,只有单数据流与多数据流两种基本情形,分别用SD(Single Data stream architecture)与MD(Multiple Data str eam architecture)表示.例如,图2中的脉动阵列体系结构,就可以用MD表示.故在坐标轴D上只有3(C12+C22)种体系结构类别.对在坐标轴C上表示的基于构令流计算的体系结构来说,也是按数据流计算的方式工作的,其数据流是由构令流决定的,换句话说,构令不仅用来改变并决定硬件的逻辑结构,而且用来改变并决定数据的流动路径.因此,与I体系结构类似,也有4种基本分类表示:SCSD(Sing le Config ur ation Single Data str eam),SCMD(Single Co nfiguratio n Mult-i ple Data stream),MCSD(M ultiple Config ur ation Sing le Data stream)和MCM D(M ultiple Co nfigura-tion Multiple Data stream).例如,图3中的C体系结构就可以用SCMD表示.因此,利用这4种基本表示,总共可以有15种体系结构类别.31212坐标平面上的体系结构分类表示对在坐标平面ID上表示的基于指令流计算与数据流计算的体系结构来说,则可以用坐标轴I上与坐标轴D上的体系结构表示方法的组合来表示,故有45(15@3)种体系结构类别(不包括坐标轴上的情形,下同).例如,由一个SISD的RISC处理器作为宿主机,与一个如图2中所示的基于数据流的脉动阵列作为协处理器组成的嵌入式So C芯片,就是这两种体系结构的组合,可以用SISD@MD表示.实际上,在指令流计算机的输入输出接口逻辑中,数据流一般是在输入输出指令控制下,也就是程序计数器的控制下流动的,但为了提高计算的并行性,也出现了在DM A或FIFO等部件控制下,也就是在数据计数器控制下流动、按数据流计算的情形.对在坐标平面IC上表示的基于指令流计算与构令流计算的体系结构来说,则可以用坐标轴I上与坐标轴C上的体系结构表示方法的组合来表示,故有225(15@15)种体系结构类别.例如,由一个SISD的RISC处理器作为宿主机,与一个如图3中所示的基于构令流的r PU阵列作为协处理器组成的嵌入式SoC芯片,就是这两种体系结构的组合,可以用SISD@SCM D表示.实际上,动态可重构的概念现在已经用到微处理器设计中,将处理器设计成由指令流与构令流两种流组成[8],是属于IC平面上的体系结构.对在坐标平面DC上表示的基于数据流计算与176311期沈绪榜等:计算机体系结构的分类模型构令流计算的体系结构来说,则可以用坐标轴D上与坐标轴C上的体系结构表示方法的组合来表示,故有45(3@15)种体系结构类别.例如,由一个可重构的RISC处理器作为宿主机,与一个图2中的Systolic Arr ay作为协处理器所构成的SoC芯片,就是坐标平面DC上的一种体系结构,可以用SCSD@ MD表示.31213坐标空间中的体系结构表示对在坐标空间IDC中表示的基于指令流、数据流与构令流的体系结构来说,则可以用坐标轴I上、坐标轴D上与坐标轴C上的体系结构表示方法的组合来表示,可以有675(15@3@15)种体系结构类别(不包括坐标轴上的与坐标平面上的情形).例如,嵌入式SoC可以是由一个SISD的RISC处理器作为宿主机,与一个如图2中所示的脉动阵列作为协处理器,还有一个如图3中所示的rPU阵列作为协处理器组成的计算机体系结构,就是一个坐标空间IDC中的体系结构,可以用SISD@MD@SCMD表示.4讨论随着芯片集成度的上升与应用领域的扩展,如图1所示,1977~1987年是通过指令编程的IC标准化实现形式的10年;1987~1997年是逻辑芯片商业化的10年,So C主要是面向应用领域设计的;现在微电子技术正在从M ega Age向Gig a Ag e过渡,1997~2007年将是通过构令重构的IC标准化实现形式的10年.从而使组成现代计算机的芯片可分为4类:除了存储器芯片与处理器芯片外,还有逻辑芯片与模拟芯片.对于所有3种体系结构来说,都是要用到存储、通信与处理的功能的,其中,存储功能是相同的,以用来存储数据以及软件、流件或构件.差异主要体现在通信功能与处理功能的体系结构上.下面将进一步讨论三维坐标分类法的必要性、合理性与完备性.411三维坐标分类法的必要性基于指令流计算的体系结构,因为指令一般是由操作码和数据地址码两部分组成的,软件(soft-w are)就是由这些指令组成的.因此,基于指令流计算的体系结构是最基本的、最灵活的体系结构,但不是最高效的体系结构.其体系结构的特点主要体现在处理器芯片的通用计算方式以及指令(也就是程序计数器)控制下的存储器与处理器之间的数据通信功能上.有CISC,RISC与DSP3种处理器.模拟芯片完成嵌入式计算机与物理世界的接口功能,其数据流可以在指令(也就是程序计数器)控制下流动,按指令流计算的体系结构设计;也可以在部件(也就是数据计数器)控制下流动,按数据流计算的体系结构设计.基于数据流计算的体系结构则正好相反,因为流件(flow w are)可以看作是只有访问地址与地址操作,而没有数据操作的命令组成的.例如,从图2中可以看出,数据是直接通过脉动阵列来完成计算的,所以它是最快的,但是,是面向单个算法设计的,最不灵活.其体系结构的特点主要体现在逻辑芯片的专用计算方式以及部件(也就是数据计数器)控制下的存储器与逻辑芯片之间的数据通信功能上.不仅有与处理器差别很大的ASIC电路,而且有只完成一种固定功能的类似处理器的电路,例如,由ZarLink公司研制的完成FFT计算的PDSP芯片.这些逻辑芯片所完成的功能,都比处理器芯片功能的粒度大.因为处理器受指令字长的限制,每条指令一般都只能完成加、减、乘、除中的一种运算(只有乘加指令是例外),而在上述FFT逻辑芯片中,完成的是固定的1024点或4096点的复数蝶式运算功能,每个复数蝶式运算包括4次乘法、3次加法与3次减法.因此,数据流计算有比指令流计算粒度大的高效性,但没有指令流计算粒度小的的灵活性,彼此是不能取代的.前两种体系结构都是基于不可重构的硬件实现形式的;也就是说,硬件(芯片)的结构是用户无法改变的.而基于构令流计算的体系结构,则主要是让用户通过构令(configuratio n)来改变(重构)芯片的结构的.其体系结构的特点主要体现在可重构芯片所提供的灵活的计算方式与通信方式上.所以,基于构令流计算的体系结构具有类似指令流计算体系结构的灵活性;一旦硬件的操作功能与数据的流动路径形成之后,它就是按数据流计算的方式工作的,所以,它又具有接近基于数据流计算的体系结构的高效性,是指令流计算与数据流计算所不能做到的.当构令流计算的体系结构是以IP核为基础的SoC芯片时,IP核的结构以及IP核之间的互连结构都可以重构,按构令流计算的方式工作.特别是在高性能数字信号处理应用领域中,可重构的体系结构已经成了研究的热点.412三维坐标分类法的合理性正是以逻辑概念而不是以部件结构为依据使1764计算机学报2005年。