计算机系统结构有详细答案

合集下载

计算机体系结构课后答案

计算机体系结构课后答案

计算机体系结构课后答案【篇一:计算机体系结构习题(含答案)】1、尾数用补码、小数表示,阶码用移码、整数表示,尾数字长p=6(不包括符号位),阶码字长q=6(不包括符号位),为数基值rm=16,阶码基值re=2。

对于规格化浮点数,用十进制表达式写出如下数据(对于前11项,还要写出16进值编码)。

(1)最大尾数(8)最小正数(2)最小正尾数(9)最大负数(3)最小尾数(10)最小负数(4)最大负尾数(11)浮点零(5)最大阶码(12)表数精度(6)最小阶码(13)表数效率(7)最大正数(14)能表示的规格化浮点数个数2.一台计算机系统要求浮点数的精度不低于10-7.2,表数范围正数不小于1038,且正、负数对称。

尾数用原码、纯小数表示,阶码用移码、整数表示。

(1) 设计这种浮点数的格式(2) 计算(1)所设计浮点数格式实际上能够表示的最大正数、最大负数、表数精度和表数效率。

3.某处理机要求浮点数在正数区的积累误差不大于2-p-1 ,其中,p是浮点数的尾数长度。

(1) 选择合适的舍入方法。

(2) 确定警戒位位数。

(3) 计算在正数区的误差范围。

4.假设有a和b两种不同类型的处理机,a处理机中的数据不带标志符,其指令字长和数据字长均为32位。

b处理机的数据带有标志符,每个数据的字长增加至36位,其中有4位是标志符,它的指令数由最多256条减少到不到64条。

如果每执行一条指令平均要访问两个操作数,每个存放在存储器中的操作数平均要被访问8次。

对于一个由1000条指令组成的程序,分别计算这个程序在a处理机和b处理机中所占用的存储空间大小(包括指令和数据),从中得到什么启发?5.一台模型机共有7条指令,各指令的使用频率分别为35%,25%,20%,10%,5%,3%和2%,有8个通用数据寄存器,2个变址寄存器。

(1) 要求操作码的平均长度最短,请设计操作码的编码,并计算所设计操作码的平均长度。

6.某处理机的指令字长为16位,有双地址指令、单地址指令和零地址指令3类,并假设每个地址字段的长度均为6位。

计算机系统结构--《张晨曦、王志英》课后习题参考答案

计算机系统结构--《张晨曦、王志英》课后习题参考答案

第1章计算机系统结构的基本概念1.1 解释下列术语层次机构: 按照计算机语言从低级到高级的次序, 把计算机系统按功能划分成多级层次结构, 每一层以一种不同的语言为特征。

这些层次依次为: 微程序机器级, 传统机器语言机器级, 汇编语言机器级, 高级语言机器级, 应用语言机器级等。

虚拟机: 用软件实现的机器。

翻译: 先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序, 然后再在这低一级机器上运行, 实现程序的功能。

解释: 对于高一级机器上的程序中的每一条语句或指令, 都是转去执行低一级机器上的一段等效程序。

执行完后, 再去高一级机器取下一条语句或指令, 再进行解释执行, 如此反复, 直到解释执行完整个程序。

计算机系统结构: 传统机器程序员所看到的计算机属性, 即概念性结构与功能特性。

在计算机技术中, 把这种本来存在的事物或属性, 但从某种角度看又好像不存在的概念称为透明性。

计算机组成: 计算机系统结构的逻辑实现, 包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

计算机实现: 计算机组成的物理实现, 包括处理机、主存等部件的物理结构, 器件的集成度和速度, 模块、插件、底板的划分与连接, 信号传输, 电源、冷却及整机装配技术等。

系统加速比: 对系统中某部分进行改进时, 改进后系统性能提高的倍数。

Amdahl定律: 当对一个系统中的某个部件进行改进后, 所能获得的整个系统性能的提高, 受限于该部件的执行时间占总执行时间的百分比。

程序的局部性原理: 程序执行时所访问的存储器地址不是随机分布的, 而是相对地簇聚。

包括时间局部性和空间局部性。

CPI: 每条指令执行的平均时钟周期数。

测试程序套件: 由各种不同的真实应用程序构成的一组测试程序, 用来测试计算机在各个方面的处理性能。

存储程序计算机: 冯·诺依曼结构计算机。

其基本点是指令驱动。

程序预先存放在计算机存储器中, 机器一旦启动, 就能按照程序指定的逻辑顺序执行这些程序, 自动完成由程序所描述的处理工作。

计算机系统结构——课后答案

计算机系统结构——课后答案

习题一1、解释下列术语计算机系统的外特性:通常所讲的计算机系统结构的外特性是指机器语言程序员或编译程序编写者所看到的外特性,即由他们所看到的计算机的基本属性(概念性结构和功能特性)。

计算机系统的内特性:计算机系统的设计人员所看到的基本属性,本质上是为了将有关软件人员的基本属性加以逻辑实现的基本属性。

模拟:模拟方法是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统。

可移植性:在新型号机出台后,原来开发的软件仍能继续在升级换代的新型号机器上使用,这就要求软件具有可兼容性,即可移植性。

可兼容性是指一个软件可不经修改或只需少量修改,便可由一台机器移植到另一台机器上运行,即同一软件可应用于不同环境。

Amdahl 定律:系统中对于某一部件采用某种更快的执行方式所能获得的系统性能改进程度,取决于这种执行方式被使用的频度或占总执行时间的比例。

虚拟机(Virtual Machine ):指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。

6、7、假定求浮点数平方根的操作在某台机器上的一个基准测试程序中占总执行时间的20%,为了增强该操作的性能,可采用两种不同的方法:一种是增加专门的硬件,可使求浮点数平方根操作的速度提高为原来的20倍;另一种方法是提高所有浮点运算指令的速度,使其为原来的2倍,而浮点运算指令的执行时间在总执行时间中占30%。

试比较这两种方法哪一种更好些。

答:增加硬件的方法的加速比23.120/2.0)2.01(11=+-=p S ,另一种方法的加速比176.12/3.0)3.01(12=+-=p S ,经计算可知Sp1>Sp2第一种方法更好些。

9、假设高速缓存Cache 的工作速度为主存的5倍,且Cache 被访问命中的概率为90%,则采用Cache 能使整个存储系统获得多高的加速比? 答:加速比%10)(%90'⨯++⨯==tc tm tc tmT T S ,其中tm=5tc ,代入公式,得到加速比S=3.33。

计算机体系结构习题答案

计算机体系结构习题答案

一、(5分)计算机系统设计中经常使用的4个定量原理是什么?请简要说明它们的含义。

答:(1)以经常性事件为重点。

在计算机系统的设计中,对经常发生的情况,赋予它优先的处理权和资源使用权,以得到更多的总体上的改进。

(2)Amdahl 定律。

加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。

(3)CPU 性能公式。

执行一个程序所需的CPU 时间 = IC ×CPI ×T 。

(4)程序的局部性原理。

程序在执行时所访问地址的分布不是随机的,而是相对地簇聚。

二、(15分)假设某应用程序中有4类操作,通过改进各类操作的功能部件,可(2)各类操作单独改进后,程序获得的加速比分别是多少? (3)4类操作均改进后,整个程序的加速比是多少? 答:根据Amdahl 定律aff S n +-=)1(1,其中f 是可改进部分在总运行时间中所占比例,a 是可改进部分的加速比,可得4类操作均改进后,整个程序的加速比:11.77(1)n ii iS FF S =≈-+∑∑三、(5分)请简述指令之间数据冲突的类型。

答:指令之间的数据冲突有3种类型:真相关、反相关、输出相关。

真相关(数据依赖,有时候也称为数据相关):考虑两条指令i 和j ,i 在j 的前面,指令k 在指令i 和指令j 之间。

如果下述条件之一成立,则称指令j 与指令i 真相关:(1)指令j 使用指令i 产生的结果(写后读);(2)指令j 与指令k 真相关,而指令k 又与指令i 真相关。

(真相关的传递性) 反相关:考虑两条指令i 和j ,i 在j 的前面,如果指令j 所写的名与指令i 所读的寄存器名或存储地址相同,则称指令i 和j 发生了反相关。

(读后写)输出相关:考虑两条指令i 和j ,i 在j 的前面,如果指令j 和指令i 所写的寄存器名或存储地址相同,则称指令i 和j 发生了输出相关。

(写后写) 其中反相关和输出相关又合称名相关。

计算机系统结构作业答案

计算机系统结构作业答案

计算机系统结构计算机系统结构作业1第1章计算机系统结构的基本概念一、解释下列术语:计算机系统结构;计算机组成;计算机实现;透明性;系列机;软件兼容;兼容机;模拟;仿真;虚拟机;宿主机;Amdahl定律;CPI;MIPS;MFLOPS。

【答案】计算机系统结构、计算机组成和计算机实现是三个不同的概念。

系统结构定义为由程序设计者所看到的一个计算机系统的属性,即概念性结构和功能特性,这里的程序设计者所看到的计算机属性是指为机器语言或编译程序设计者所看到的计算机属性,是硬件子系统的概念性结构及其功能特性,它是计算机系统的软、硬件的界面。

计算机组成是计算机系统结构的逻辑实现,包括机器内部的数据流和控制流的组成以及逻辑设计等。

计算机实现是指计算机组成的物理实现。

透明性:在计算机技术中,一种本来是存在的事物或属性,但从某种角度看似乎不存在,成为透明性现象。

所谓系列机是指在一个厂家内生产的具有相同的系统结构,但具有不同组成和实现的一系列不同型号的机器。

不同公司厂家生产的具有相同系统结构的计算机称为兼容机。

软件兼容:在新的计算机系统出台后,原先已开发的软件仍能继续在升档换代的新型号机器上使用,这就是软件兼容。

系列机方法能够在具有相同系统结构的各种机器之间实现软件移植,为了实现软件在不同系统结构的机器之间的相互移植,可以采用模拟和仿真。

模拟方法是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统。

仿真是指用微程序直接解释另一种机器指令系统的方法。

虚拟机是被模拟的机器;宿主机是进行模拟的机器。

Amdahl 定律:系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。

Fe=(改进前可改进部分占用的时间)/(改进前整个任务的执行时间) Se=(改进前可改进部分的执行时间)/(改进后改进部分的执行时间) 则,改进后整个系统加速比为ee e n S F F s /)1(1+-=。

计算机系统结构答案

计算机系统结构答案

一、选择题1、对汇编语言程序员,下列(A )不是透明的。

A: 中断字寄存器 B: 乘法器 C: 移位器 D: 指令缓冲器2、假设对A机器指令系统的每条指令的解释执行可直接由B机器的一段微程序解释执行,则A称为(D )。

A: 仿真机 B: 宿主机 C: 虚拟机 D: 目标机3、 1. 查看下面三条指令:V3←A;V2←V0+V1;V4←V2*V3;假设向量长度小于64,且前后其他的指令均没有相关性,数据进入和流出每个功能部件,包括访问存储器都需要一拍的时间,假设向量的长度为N。

三条指令全部采用串行的方法,那么执行的时间是:A: 3N+20 B: 3N+21 C: 3N+22 D: 3N+234、某向量处理机有16个向量寄存器,其中V0-V5种分别存放有向量A,B,C,D,E,F,向量的长度是8,向量各元素均为浮点数;处理部件采用两个单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。

采用类似CRAY-1的链接技术,先计算(A+B)*C,在流水线不停的情况下,接着计算(D+E)*F。

求此链接流水线的通过时间是多少拍?(设寄存器出入各需1拍)A: 8 B: 9 C: 17 D: 185、设有一个4个处理器的MIMD系统,假设在系统中访存取指和取数的时间可以忽略不计;加法与乘法分别需要2拍和4拍;在MIMD系统中处理器(机)之间每进行一次数据传送的时间为1拍;在MIMD系统中,每个PE都可以和其它PE有直接的的通路。

求利用此系统计算表达式所需的节拍数。

A: 23 B: 12 C: 11 D: 106、以下哪些是周期窃取方式的特点?A : 硬件结构简单B : 硬件结构复杂C : 数据输入或输出过程中占用了CPU时间D : 数据输入或输出过程中不占用CPU时间7、从下列有关Cache的描述中,选出应填入空格中的正确答案:(1)今有甲、乙两台计算机,甲计算机的Cache存取时间为50ns,主存储器为2us;乙计算机的Cache存储时间为100ns,主存储器为1.2us。

计算机系统结构答案

计算机系统结构答案

第一章2 执行第2、第3、第4级的一条指令各需KNns、KN2ns、KN3ns的时间。

3 这样做,可以加快操作系统中操作命令的解释速度,同时也节省了存放解释操作命令这部分解释程序所占的存储空间,简化了操作系统机器级的设计,也有利于减少传统机器级的指令条数。

4 第2、3、和4级上的一段等效程序分别需要KN/Ms、KN2/M2s、KN3/M3s的时间。

13(1)可以。

因为它虽然是属计算机系统结构的内容,但它是新增加的数据类型和指令,不会影响到已有指令所写的程序的正确运行,只是现在用新增加的指令来写程序,会使计算机的性能和效率变得更好。

(2)不可以。

中断的分级和中断的响应次序等中断机构都属于计算机系统结构的内容。

中断分级由原来的4级增加到5级应当还是允许的,关键是重新调整了中断响应的优先次序,这就使原有程序的中断响应次序发生了改变,会影响原有程序工作得正确性。

(3)可以。

Cache存贮器属于计算机组成,它不会改变原有的系统程序和应用程序,不会影响到它们的正常运行,只是有了Cache存贮器后,系统的性能有了明显的提高。

(4)可以。

浮点数尾部的下溢处理不属于计算机系统结构,而是计算机组成设计所考虑的内容。

(5)不可以。

指令的操作码、字段格式、寻址方式等的指明都是计算机系统结构的内容,如果将它们加以改变,就会直接导致以前编写的程序都不能正确运行了。

(6)可以。

数据通路宽度是计算机组成的内容。

(7)可以。

单总线改为双总线是计算机组成的内容。

(8)不可以。

通用寄存器的德使用是属于计算机系统结构的内容。

0号通用寄存器该作堆栈指示器,将使原先程序中0号通用寄存器中的内容改变直接影响到堆栈指针的位置发生变化,造成程序无法正常工作的局面。

第二章6 p=6、m=48时,在非负阶、规格化、正尾数情况下,r m=2、8、16时的各个参数的计算结果如表2.1所示。

8ROM下溢处理表16个单元的地址码0000~1111,它与其内容(即下溢处理后的3位结果值)的对照表关系如表2.2所示。

《计算机系统结构》及参考答案

《计算机系统结构》及参考答案

《计算机系统结构》练习题一一、单项选择题1。

页式虚拟存储器得地址变换对于 D 就是透明得、ﻩA、操作系统设计者ﻩﻩB、任何程序员C、系统结构设计者D、应用程序员2.以下各类中断中,属于自愿中断得就是C、ﻩA、外部中断B、 I/O中断ﻩC、执行“访管”指令D、机器校验中断3、高速外部设备磁盘机适合连接于 C 、A、选择通道或字节多路通道ﻩB、数组多路通道或字节多路通道C、数组多路通道或选择通道ﻩﻩD、任意一种通道4、页式虚拟存储器页表得作用就是A、ﻩA、反映虚页在主存得存储情况B、仅反映虚页就是否调入主存C、反映主存实页与Cache得对应关系D、反映虚页在辅存得存储情况5.软件与硬件得功能在逻辑上就是C得、A、固件优于软件ﻩﻩB、不等价C、等价ﻩﻩﻩD、软件优于固件6、计算机中最优化得操作码编码方法就是 D 、ﻩD、哈夫曼编码A、BCD码ﻩﻩﻩB、ASCII码C、扩展操作码ﻩﻩﻩ7、从计算机系统执行程序得角度瞧,并行性等级由低到高分为四级 A 、A.指令内部—-指令之间-—进程之间-—程序之间B。

指令之间——指令内部-—进程之间-—程序之间ﻫC。

进程之间——指令之间——指令内部——程序之间D.程序之间—-进程之间——指令之间——指令内部8、计算机系统多级层次结构中,操作系统机器级得直接上层就是D、A.传统机器级ﻩB。

高级语言机器C.应用语言机器级ﻩD.汇编语言机器级9、全相联地址映像就是指A、A、任何虚页都可装入主存中任何实页得位置B、一个虚页只装进固定得主存实页位置ﻩC、组之间就是固定得,而组内任何虚页可以装入任何实页位置D、组间可任意装入,组内就是固定装入10.对于同一系列机,必须保证软件能够 C 、A。

向前兼容,并向上兼容ﻩB。

向前兼容,并向下兼容C.向后兼容,力争向上兼容ﻩD.向后兼容,力争向下兼容11。

设有16个处理单元得并行处理机系统,采用共享主存得方式、若同时存取16个数据, 为避免存储器访问冲突,共享主存得多体数量应该为 C 才合理、ﻩA、15ﻩﻩﻩﻩB、16ﻩC、17ﻩﻩD、1912、软件兼容得根本特征就是C、A、向前兼容ﻩﻩB、向后兼容C、向上兼容ﻩD、向下兼容ﻩ13、在下列机器中,能够实现软件兼容得机器就是B、A、完全不同种类得机型ﻩB、系统结构相同得机器ﻩﻩC、宿主机与目标机ﻩD、虚拟机ﻩ14。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(仅供参考,不作为考试标准),
选择题分,每题分)2(30计算机系统结构设计者所关心的是________所看到的的计算机结构。

A)硬件设计人员B)逻辑设计人员
D)高级语言程序员C)机器语言或汇编语言程序员。

意________,应当注提系在计算机统设计时,为了高系统性能度的令执行速快A)加经常性使用指大的指令特B)要别精心设计少量功能强数的占减少在数量上很小比例的指令条C)要度D)要加快少量指令的速。

的问题统中因________而导致系主重叠寄存器技术要用于解决在RISC 流水线影A)JMP指令响保护令B)CALL指的现场问存储器不便来只C)有LOAD和STORE指令带的访度速器访问D)存储
________ 效率高计为使流水算机运行要A)各过程段时间不同B)连续处理的任务类型应该不同
D)连续处理的任务数尽可能少C)连续处理的任务类型应该相同
栈型替是的________。

换算法堆不属于B)近期最少A)近期最使用法久未用法
D)页面失效频率法出进C)先先法
象联组,相映的优点。

是________象联全与相映相比B)块冲突概率低C)命中率高D)主存利用率小录A)目表高
是方好关相指除中叠次一重消令最的法________。

B)设相关专用令指改准A)不修通路
令指条下析分后推C) 令指条下行执后推D)
流的用采,时关据数到,中作水操遇相________。

有法办解决器译编化优A)用办的排新重令指过通,测检序法据数B)向定重技术
C)延迟转移技术
D)加快和提前形成条件码
经多级网络串联来实现全排列网络,只能用________。

A)多级立方体网络B)多级PM2I网络
D)上述多级混洗交换网络任何网络C)
序传送的________。

是以虫蚀寻径流水方式在各寻径器是顺B)包A)消息C)片节D)字
________
处理机超标量作指条令部件个B) 只有一操期A)在一个时钟周内分时发射多多钟C)在一个时周期内同时发射条指令件有只一个取指部D)
________ 流水括标不包线的技术指率比加B) 应A)响比吞吐率C)速D)效
________ 属于机向量处理D)MIMD
B)SIMD A)SISD C)MISD
系。

统结构属________于MIMD 同一的管理元个控制单时元理A)各处单同受的送单一时理各B)处单元同接受同个控制元来指令机算机理和多计处C)多机处理阵D)列
储的储,单处机处并计BSP算机的行理有16个理元并行存器存体个数________。

为B)1
C)32
D)17A)16
判断题正确打√,错误打╳,分,每题分)10(1( ×)对计算机系统中经常使用的基本单元功能,宜于用软件来实现,这样可降低系统的成本。

(√)处理机级流水线又称为指令流水线。

( ×)由于RISC简化了指令系统,因此,RISC上的目标程序比CISC上的目标程序要短一些,程序执行的时间就会少一些。

( ×)在存储体系中,地址的映象与地址的变换没有区别。

( ×)在满足Cache与主存的一致性方面,写回比写直达法好。

( ×)Cache组相联映象的块冲突概率比直接映象的高。

(√)采用LRU替换的Cache存储器,分配给程序的Cache容量一定时,块的大小增加,Cache的命中率将先上升,到一定时候又会逐渐降低。

(×)阵列处理机以多个处理机构成阵列。

( √)SIMD计算机的算法极大地依赖于机器的系统结构。

(×)解决多处理机Cache不一致性问题是基于链式目录的协议优点是限制了共享数据块的拷贝数量。

综合题
(10分)如果某计算机系统有3个部件可以改进,则这三个部件经改进后的加速比分别为:S1=30,S2=20,S3=10。

(1)如果部件1和部件2改进前的执行时间占整个系统执行时间的比例都为30%,那么,部件3
改进前的执行时间占整个系统执行时间的比例为多少,才能使3个部件都改进后的整个系统的加速比Sn达到10
(2)如果3个部件改进前执行时间占整个系统执行时间的比例分别为30%、30%和20%,那么,3个部件都改进后系统的加速比是多少未改进部件执行时间在改进后的系统执行时间中占的比例是多少
,5%,10%,,别为35%25%,20%使条共有7指令,各指令的用频率分机一(10分)台模型。

3%和2%。

长平均度设算所计操作码的,并码设度的求(1)要操作码平均长最短,请计操作的编码计存储器型变址寻址方式-16位字长的寄存器-8字长的寄存器寄存器型指令3条,(2)设计127。

请设计指令格式,并给出各字段的长度和操作码的编码。

指令4条,变址范围不小于±
解:
Huffman)要使得到的操作码长度最短,应采用解:(1树如下:编码,构造Huffman
S1S2 S3S4这样,采用Huffman编码法得到的操作码的平均长度为:
H = 2×++ + 3×+ 4 ×+ 5×+
=+++
=
(10分)有一个4段流水线,如下图所示:
S1S2S3S4
其中,段S1和S3的执行时间均为200ns,段S2和S4的执行时间均为100ns。

若瓶颈段S1可使用细分方法改造,瓶颈段S3可使用并联方法改造,对改造后的流水线,分别使用公式和时空图求连续流入4条指令的实际吞吐率和效率
(10分)设向量长度均为64,在Cray-1机上所用浮点功能部件的执行时间分别为:相加6拍,相乘7拍,求倒数近似值14拍;从存储器读数6拍,打入寄存器及启动功能部件各1拍,问下列各指令组,组内的哪些指令可以链接哪些指令不可链接不能链接的原因是什么
分别计算出各指令组全部完成所需要的拍数。

(2)V2<--V0*V1(3)V0<--存储器存储器(4)V0<--存储器(1)V0<--存储器V3<--V1<--1/V0 V1<--V2+V3 V2<--V0*V1 V3<--V1*V2 V3<--V2+V0 V4<--V5*V6
V4<--V2+V3 V5<--V3+V4 V5<--V3+V4
解:(1)3 条向量指令之间既没有发生源Vi 冲突,也没有Vi 的先写后读相关,又不存在功能部件的使用冲突,所以这3 条向量指令可以同时并行流水。

向量指令组全部完成需要
max{(1+6(访存)+1+64-1),(1+6(浮加)+1+64-1),(1+7(浮乘)+1+64-1)}
=72拍。

(2)3 条向量指令之间没有功能部件的使用冲突,但是在第1、2 两条向量指令与第3 条向量指令之间有V2 及V3 的先写后读相关。

只要让第1 条向量指令较第2 条向量指令提前1 拍启动,则第1,2 两条向量指令的第1 个结果元素就可以被同时链接到第3 条向量指令中。

(1+7(浮乘)+1)+(1+6(浮加)+1+64-1)
=80(拍)。

(3)第1 条向量指令与第2 条向量指令之间有V0 的先写后读相关,两者可以链接。

第3
条向量指令与第2 条向量指令之间有源向量寄存器V0 的冲突,它们之间只能串行。

第3
条向量指令与第4 条向量指令之间有加法功能部件的使用冲突,它们之间也只能串行。

)+1+64-1)浮加乘)+1+64-1)+(1+6( 访存)+1+64-1)+(1+6( (1+6( 访存)+1+1+7( 浮。

拍)=222(冲用的使功能部件,但无源Vi 冲突,也无依(4)4 条向量指令均次有Vi 的先写后读相关水。

,进行流以全部链接在一起以突,所,这4 条向量指令可加)+1)+64-1乘)+1)+(1+6(浮)+1)+(1+(7 访
存)+1)+(1+14(求倒数浮(1+6(=104 拍。

表所示其预约表如下Δ水线,各段执行时间均为t,一(10分)有个5段流时间tt1t2t3t4t5t6t7S 段XS1XXS2XXXS3XS4XXXS5
(1)列出禁止表F和冲突向量C。

(2)画出流水线调度的状态图。

(3)分别求出允许不等时间间隔调度和等时间间隔调度的两种最优调度策略,以及这两种调度策略的流水线最大呑吐率。

(4)若连续输入10个任务,求这两种调度策略的流水线实际呑吐率和加速比。

解:
(1)禁止向量F=(1,3,6) (1 分)
冲突向量C=(100101) (1 分)
(2)
(3)
最小启动循环(2,2,5) 最小平均延迟(2+2+5)/3=3 TPmax=1/(3Dt) (1 分)
最小恒定循环(4)
TPmax=1/(4Dt) (1 分)
(4)
(10分)阵列机有0~7共8个处理单元互连,要求按(0,5),(1,4),(2,7),(3,6)配对通信。

(1)写出实现此功能的互连函数的一般式。

(2)画出用3级立方网络实现该互连函数的互连网络拓扑结构图,并标出各控制开关状态。

解:(1)
如下图所示:(2)。

相关文档
最新文档