计算机体系结构练习题参考解答

合集下载

计算机组成与结构习题及答案

计算机组成与结构习题及答案

第一章:概述一、选择题1.完整的计算机系统应包括__ ___。

A. 运算器、存储器、控制器B. 外部设备和主机C. 主机和实用程序D. 配套的硬件设备和软件系统2.至今为止,计算机中的所有信息仍以二进制方式表示的理由是_ __。

A. 节约元件B. 运算速度快C. 物理器件的性能决定D. 信息处理方便3.从系统结构看,至今绝大多数计算机仍属于__ __型计算机。

A. 并行B. 冯.诺依曼C. 智能D. 实时处理4.计算机外围设备是指__ ___A. 输入/输出设备B. 外存储器C. 远程通讯设备D. 除CPU5.在微型机系统中,外围设备通过___ ___与主板的系统总线相连接。

A. 适配器B. 译码器C. 计数器D.6.冯·诺依曼机工作的基本方式的特点是__ ____。

A. 多指令流单数据流B. 按地址访问并顺序执行指令C. 堆栈操作D. 存贮器按内容选择地址7.微型计算机的发展一般是以_____A. 操作系统B.C. 磁盘D.8.下列选项中,___ ___A. CPUB. ASCIIC. 内存D.9.对计算机的软、硬件进行管理是__ ____A. 操作系统B. 数据库管理系统C. 语言处理程序D.10.下面的四个叙述中,只有一个是正确的,它是____。

A.系统软件就是买的软件,应用软件就是自己编写的软件B.外存上的信息可以直接进入CPU被处理C.用机器语言编写的程序可以由计算机直接执行,用高级语言编写的程序必须经过编译(解释)才能执行D.如果说一台计算机配置了FORTRAN语言,就是说它一开机就可以用FORTRAN 语言编写和执行程序答案:1.D 2C. 3.B. 4.D. 5.A. 6B 7.B 8. B 9. A 10. C二、判断题1.在微型计算机广阔的应用领域中,会计电算化应属于科学计算应用方面。

2.决定计算机计算精度的主要技术指标一般是指计算机的字长。

3.计算机“运算速度”指标的含义是指每秒钟能执行多少条操作系统的命令。

计算机体系结构考试卷子及答案

计算机体系结构考试卷子及答案

1.某台主频为1GHz的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下:求该计算机的有效CPI、MIPS和程序执行时间。

(10分)2.将计算机系统中某一功能的处理速度加快15倍,但该功能的处理时间仅占整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?3.如果某计算机系统有3个部件可以改进,则这3个部件进改进后达到的加速比分别为:S1=30,S2=20,S3=10。

(1)如果部件1和部件2改进前的执行之间占整个系统执行的时间比例都为30%,那么,部件3改进前的执行时间占整个系统执行时间的比例为多少,才能使3个部件都改进后的整个系统的加速比Sn达到10?(2)如果3个部件改进前执行时间占整个系统执行时间的比例分别是30%,30%和20%,那么,3个部件都改进后系统的加速比是多少?未改进部件执行时间在改进后的系统执行时间中占的比例是多少?(10分)4.假设某应用程序中有4类操作,通过改进,各操作获得不同的性能提高。

具体数据如下表所示:(1)改进后,各类操作的加速比分别是多少?(2)各类操作单独改进后,程序获得的加速比分别是多少?(3)4类操作均改进后,整个程序的加速比是多少?5.一台模型机的9条指令的使用频度如下:(10分)ADD(加):26%SHR(右移):2%SUB(减):17%CLL(循环左移):5%JOM(按页转移):11%CLA(累加器清零):15%STO(存):2%STP(停机):12%JMP(转移):10%试设计这9条指令的Huffman编码的操作码表示以及其等长扩展操作码表示,并计算这两种表示的平均操作码长度。

6.有一个“Cache-主存”存储层次。

主存共分为8个块(0~7),Cache为4个块(0~3),采用直接映像方式。

(1)对于如下主存块地址流:0、2、6、1、3、7、0、1、4、5、4、6、0、7、2,如主存中内容一开始未装入Cache,请列出每次访问后Cache中各块的分配情况;(2)对于(1),指出既发生块失效又发生块争用的时刻;(3)对于(1),求出此期间的Cache命中率。

计算机体系结构答案

计算机体系结构答案

计算机体系结构答案2021 福师网院一、填空题(每空1分,共14分)1.高速缓冲存储器的地址映象方式有三种,它们分别是:全向量方式,直接相联方式,组相联方式。

2. 虚拟存储器的三种管理方式是段式管理,页式管理和段页式管理。

3.从主存的角度来看,“Cache—主存”层次的目的是为了提高速度,而“主存—辅存”层次的目的是为了扩大容量。

4.根据指令间的对同一寄存器读和写操作的先后次序关系,数据相关冲突可分为RAW 、WAR 和WAW 三种类型。

5.当代计算机体系结构的概念包括指令集结构、计算机组成和计算机实现三个方面的内容。

二、名词解释(每题2分,共16分)计算机体系结构:答:计算机体系结构包括指令集结构、计算机组成和计算机实现三个方面的内容。

兼容机:答:不同厂家生产的具有相同计算机结构的计算机;系列机:同一厂家生产的具有相同计算机结构,但具有不同组成和实现的一系列不同档次不同型号的机器;写直达法:答:执行“写”操作时,不仅写入Cache,而且也写入下一级存储器。

高速缓冲存储器:答:为解决CPU与主存储器间速度差而在内存储器和CPU之间增加的一种存取速度远高于普通内存的特殊存储器。

延迟转移技术:答:为了使指令流水线不断流,在转移指令之后插入一条不相关的有效的指令,而转移指令被延迟执行,这种技术称为延迟转移技术。

线性流水线:答:指各段串行连接、没有反馈回路的流水线。

数据通过流水线中的各段时,每一个段最多只流过一次;非线性流水线:指各段除了有串行的连接外,还有反馈回路的流水线。

流水线的吞吐率:答:在单位时间内流水线所完成的任务数量或输出结果的数量。

并行性:答:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。

只要在时间上相互重叠,就存在并行性。

它包括同时性与并发性两种含义。

三、简答题(每题5分,共30分)1. 如有一个经解释实现的计算机,可以按功能划分成4级。

每一级为了执行一条指令需要下一级的N条指令解释。

计算机体系结构基础知识试题及

计算机体系结构基础知识试题及

计算机体系结构基础知识试题及答案解析一、选择题1. B2. A3. D4. C5. B6. C7. A8. D9. B 10. C二、填空题1. 互联网2. 中央处理器3. 存储器4. 输入/输出设备三、简答题1. 计算机体系结构是指计算机硬件与软件之间的逻辑结构和功能关系,即计算机的整体结构和组成方式。

2. CPU(中央处理器)是计算机体系结构的核心,它负责执行计算机的指令并控制计算机的运行。

3. 存储器是计算机中用于存储数据和程序的部件,包括主存储器(RAM)和辅助存储器(硬盘、固态硬盘等)。

4. 输入/输出设备用于实现计算机与外部设备之间的数据交换,包括显示器、键盘、鼠标、打印机等。

四、论述题计算机体系结构是计算机科学中的重要组成部分,它对于计算机的设计和开发具有重要意义。

计算机体系结构的基本原理可以通过一系列试题来进行检测和考察。

下面是一套基础的计算机体系结构试题及其答案解析。

首先是选择题部分,这部分试题主要考察对计算机体系结构基础知识的理解和应用能力。

通过选择正确的答案来判断考生对相关知识的掌握情况。

根据试题解析,我们可以得出正确的答案和解释。

接下来是填空题部分,这部分试题主要考察考生对计算机体系结构相关术语的理解和记忆能力。

通过填写正确的术语来补全句子,从而测试考生对相关知识的熟悉程度。

最后是简答题部分,这部分试题通过提出开放式问题,要求考生对计算机体系结构的相关概念和原理进行简要的叙述。

考生需要用清晰、准确的语言来回答问题,展示自己对知识的理解和运用能力。

综上所述,计算机体系结构基础知识试题及答案解析是一套用于考察计算机科学学习者对计算机体系结构基本原理的掌握程度的试题。

通过做题和解析,考生可以检测自己的学习效果,并加深对相关知识的理解。

希望这套试题能为广大学习者提供帮助,推动计算机科学的进一步发展。

计算机体系结构试题及答案

计算机体系结构试题及答案

计算机体系结构试题及答案12008年01月23日22:211、计算机高性能发展受益于:(1)电路技术的发展;(2)计算机体系结构技术的发展。

2、层次结构:计算机系统可以按语言的功能划分为多级层次结构,每一层以不同的语言为特征。

第六级:应用语言虚拟机-> 第五级:高级语言虚拟机-> 第四级:汇编语言虚拟机-> 第三级:操作系统虚拟机-> 第二级:机器语言(传统机器级) ->第一级:微程序机器级。

3、计算机体系结构:程序员所看到的计算机的属性,即概括性结构与功能特性。

For personal use only in study and research; not for commercial use4、透明性:在计算机技术中,对本来存在的事物或属性,从某一角度来看又好像不存在的概念称为透明性。

5、Amdahl提出的体系结构是指机器语言级程序员所看见的计算机属性。

6、经典计算机体系结构概念的实质3是计算机系统中软、硬件界面的确定,也就是指令集的设计,该界面之上由软件的功能实现,界面之下由硬件和固件的功能来实现。

7、计算机组织是计算机系统的逻辑实现;计算机实现是计算机系统的物理实现。

8、计算机体系结构、计算机组织、计算机实现的区别和联系?答:一种体系结构可以有多种组成,一种组成可以有多种物理实现,体系结构包括对组织与实现的研究。

9、系列机:是指具有相同的体系结构但具有不同组织和实现的一系列不同型号的机器。

10、软件兼容:即同一个软件可以不加修改地运行于系统结构相同的各机器,而且它们所获得的结果一样,差别只在于运行时间的不同。

11、兼容机:不同厂家生产的、具有相同体系结构的计算机。

12、向后兼容是软件兼容的根本特征,也是系列机的根本特征。

13、当今计算机领域市场可划分为:服务器、桌面系统、嵌入式计算三大领域。

14、摩尔定律:集成电路密度大约每两年翻一番。

15、定量分析技术基础(1)性能的评测:(a)响应时间:从事件开始到结束之间的时间;计算机完成某一任务所花费的全部时间。

北理工计算机体系结构习题解答

北理工计算机体系结构习题解答

*1
32000 *
2
15000
*
2
8000
*
2)
*
(
40
1 *106
)
3.875*103秒
21
1-11 假设在一台40MHz处理机上运营200,000条指令旳目旳代码,程序主要
由四种指令构成。根据程序跟踪试验成果,已知指令混合比和每种指令所 需旳指令数如下:
指令类型
CPI
指令混合比
算术和逻辑
1
6
第1章 基础知识
仿真
用一种机器(A)旳微程序直接解 释 实 现 另 一 种 机 器 ( B) 旳 指 令 系 统,从而实现软件移植旳措施
被仿真旳机器称为目旳机,进行 仿真旳机器称为宿主机,解释微 程序机器称为仿真微程序
7
第1章 基础知识
并行性
指能够同步进行运算或操作旳特 征,它有两重含义:
40
第2章
(1)最优Huffman H=- ∑Pi×log2Pi
=0.25×2+0.20×2.322+0.15×2.737+ ……
=2.96
41
I10
I9
I8
I7
I6
I5
I4
I3
I2
0.02
0.03
0.04
0.05
0.08
0.08
0.10
0.15
0.20
1
1 0
0
0.05
0.09
1
0
1
0
0.17
原来存在旳事物或属性,从某个角 度看却好象不存在
软件兼容
程序能够不加修改地运营在各档机 器上,区别仅在于运营时间不同

计算机体系结构试题及答案

计算机体系结构试题及答案一、简答题1、请你简述冯·诺依曼结构的工作原理。

指出:它的结构特点是什么?冯·诺依曼结构是指计算机采用存储程序的工作方式,包含五个部分:算术逻辑单元(ALU)、控制单元(CU)、存储器(Memory)、输入/输出设备(I/O)、数据通路(Bus)。

它的工作原理是,程序从存储器中读取指令,指令分解成操作码和地址,控制单元根据操作码控制算术逻辑单元完成运算,然后将结果存储到存储器中或输出到I/O设备中。

其结构特点是:CPU与存储器采用同一总线,存储程序的方式,将数据和指令存储在同一存储器中,指令操作码和地址采用相同位数的二进制代码表示。

2、请你简述计算机的指令周期,以及每个阶段的作用。

指令周期是指计算机执行一条指令所经历的若干个阶段,一般包括取指令(Fetch)、指令译码(Decode)、执行指令(Execute)、存储结果(Write Back)四个阶段。

具体作用如下:取指令:从存储器中读取指令。

指令译码:对指令进行解析,确定指令的类型和操作数。

执行指令:根据指令类型和操作数进行相应的运算。

存储结果:将执行结果存储到指定的地址中,或者输出到I/O设备中。

3、请你简述计算机CPU的主要组成部分及其作用。

计算机CPU包含三个主要组成部分:算术逻辑单元(ALU)、控制单元(CU)、寄存器组。

具体作用如下:算术逻辑单元(ALU):执行算术和逻辑运算,例如加、减、乘、除、与、或、非等运算。

控制单元(CU):控制计算机的运行,包括指令译码、节拍发生、中断处理、目标跳转等操作。

寄存器组:存储一些特殊的数据,例如程序计数器(PC)、指令寄存器(IR)、通用寄存器等。

4、请你简述计算机的系统总线及其作用。

计算机的系统总线是一种用于传送信息的共享通信通路,分为三类:地址总线(Address Bus)、数据总线(Data Bus)、控制总线(Control Bus)。

其主要作用是实现各个组件之间的数据传输和控制信号传送,如CPU向存储器读写数据、I/O设备访问存储器等。

计算机体系结构习题答案

一、(5分)计算机系统设计中经常使用的4个定量原理是什么?请简要说明它们的含义。

答:(1)以经常性事件为重点。

在计算机系统的设计中,对经常发生的情况,赋予它优先的处理权和资源使用权,以得到更多的总体上的改进。

(2)Amdahl 定律。

加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。

(3)CPU 性能公式。

执行一个程序所需的CPU 时间 = IC ×CPI ×T 。

(4)程序的局部性原理。

程序在执行时所访问地址的分布不是随机的,而是相对地簇聚。

二、(15分)假设某应用程序中有4类操作,通过改进各类操作的功能部件,可(2)各类操作单独改进后,程序获得的加速比分别是多少? (3)4类操作均改进后,整个程序的加速比是多少? 答:根据Amdahl 定律aff S n +-=)1(1,其中f 是可改进部分在总运行时间中所占比例,a 是可改进部分的加速比,可得4类操作均改进后,整个程序的加速比:11.77(1)n ii iS FF S =≈-+∑∑三、(5分)请简述指令之间数据冲突的类型。

答:指令之间的数据冲突有3种类型:真相关、反相关、输出相关。

真相关(数据依赖,有时候也称为数据相关):考虑两条指令i 和j ,i 在j 的前面,指令k 在指令i 和指令j 之间。

如果下述条件之一成立,则称指令j 与指令i 真相关:(1)指令j 使用指令i 产生的结果(写后读);(2)指令j 与指令k 真相关,而指令k 又与指令i 真相关。

(真相关的传递性) 反相关:考虑两条指令i 和j ,i 在j 的前面,如果指令j 所写的名与指令i 所读的寄存器名或存储地址相同,则称指令i 和j 发生了反相关。

(读后写)输出相关:考虑两条指令i 和j ,i 在j 的前面,如果指令j 和指令i 所写的寄存器名或存储地址相同,则称指令i 和j 发生了输出相关。

(写后写) 其中反相关和输出相关又合称名相关。

计算机体系结构典型习题和题例分析与解答

典型习题和题例分析与解答题1.1 有一个经解释实现的计算机,可以按功能划分成4级。

每一级为了执行一条指令需要下一级的N 条指令解释。

若执行第1级的一条指令要K ns 时间,那么执行第2、第3、第4级的一条指令各需要用多少时间?[分析] 计算机按功能分成级时,最底层是第l 级,向上依次为第2、第3和第4级;解释方式的执行是在低级机器级上用它的一串语句或指令来仿真高一级机器级上的一条语 句或指令的功能,而且是通过对高级机器级程序中的每条语句或指令逐条加以解释来实现的。

[解答] 执行第2、第3、第4级的一条指令各需KN ns 、KN 2 ns 、KN 3 ns 的时间。

题1.2 操作系统机器级的某些指令就用传统机器级的指令,这些指令可以用微程序直接实现,而不必由操作系绕自己来实现。

你认为这样做有哪些好处?[解答] 这样做,可以加快操作系统中操作命令解释的速度,同时也节省了存放解释操作命令这部分解释程序所占的存贮空间,简化了操作系统机器级的设计,也有利于减少传统机器级的指令条数。

题1.3 有一个计算机系统可按功能分成4级,各级的指令都不相同,每一级的指令都比其下一级的指令在效能上强M 倍,即第i 级的一条指令能完成第i-1级的M 条指令的计算量。

现若需第i 级的N 条指令解释第i+l 级的一条指令,而有一段第l 级的程序需要运行的时间为K s ,问在第2、3和4级上一段等效的程序各需要运行多长时间?[分析] 因为从功能意义上讲,第i 级的一条指令能完成第i-1级的M 条指令的计算量,但第i 级的一条指令的执行,都是靠第i-1级的N 条指令的执行来解释完成。

已知,第1级的一段程序运行时间为K s 。

第2级的一段程序从功能等效上讲,所需的指令条数应当是第1级上指令数的1/M 。

而由第1级解释时又需要执行N 条指令,所以,第2级一段等效程序的运行就需要K ·s MN 的时间。

第3、4级则可依次类推。

计算机体系结构试题及答案

计算机体系结构试题及答案【篇一:计算机体系结构习题(含答案)】1、尾数用补码、小数表示,阶码用移码、整数表示,尾数字长p=6(不包括符号位),阶码字长q=6(不包括符号位),为数基值rm=16,阶码基值re=2。

对于规格化浮点数,用十进制表达式写出如下数据(对于前11项,还要写出16进值编码)。

(1)最大尾数(8)最小正数(2)最小正尾数(9)最大负数(3)最小尾数(10)最小负数(4)最大负尾数(11)浮点零(5)最大阶码(12)表数精度(6)最小阶码(13)表数效率(7)最大正数(14)能表示的规格化浮点数个数2.一台计算机系统要求浮点数的精度不低于10-7.2,表数范围正数不小于1038,且正、负数对称。

尾数用原码、纯小数表示,阶码用移码、整数表示。

(1) 设计这种浮点数的格式(2) 计算(1)所设计浮点数格式实际上能够表示的最大正数、最大负数、表数精度和表数效率。

3.某处理机要求浮点数在正数区的积累误差不大于2-p-1 ,其中,p是浮点数的尾数长度。

(1) 选择合适的舍入方法。

(2) 确定警戒位位数。

(3) 计算在正数区的误差范围。

4.假设有a和b两种不同类型的处理机,a处理机中的数据不带标志符,其指令字长和数据字长均为32位。

b处理机的数据带有标志符,每个数据的字长增加至36位,其中有4位是标志符,它的指令数由最多256条减少到不到64条。

如果每执行一条指令平均要访问两个操作数,每个存放在存储器中的操作数平均要被访问8次。

对于一个由1000条指令组成的程序,分别计算这个程序在a处理机和b处理机中所占用的存储空间大小(包括指令和数据),从中得到什么启发?5.一台模型机共有7条指令,各指令的使用频率分别为35%,25%,20%,10%,5%,3%和2%,有8个通用数据寄存器,2个变址寄存器。

(1) 要求操作码的平均长度最短,请设计操作码的编码,并计算所设计操作码的平均长度。

6.某处理机的指令字长为16位,有双地址指令、单地址指令和零地址指令3类,并假设每个地址字段的长度均为6位。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章
2.13在一台单流水线多操作部件的处理机上执行下面的程序,每条指令的取指令、指令译码需要一个时钟周期,MOVE、ADD和MUL操作分别需要2个、3个和4个时钟周期,每个操作都在第一个时钟周期从通用寄存器中读操作数,在最后一个时钟周期把运算结果写到通用寄存器中。

k: MOVE R1,R0 ;R1← (R0)
k+1: MUL R0,R2,R1 ;R0← (R2)×(R1)
k+2: ADD R0,R2,R3 ;R0← (R2)+(R3)
(1)就程序本身而言,可能有哪几种数据相关?
(2)在程序实际执行过程中,哪几种数据相关会引起流水线停顿?
(3)画出指令执行过程的流水线时空图,并计算完成这3条指令共需要多少个时钟周期?
解:(1)就程序本身而言,可能有三种数据相关。

若3条指令顺序流动,则k指令对R1寄存器的写与k+1指令对R1寄存器的读形成的“先写后读”相关。

若3条指令异步流动,则k指令对R0寄存器的读与k+1指令对R0寄存器的写形成的“先读后写”相关,k+2指令对R0寄存器的写与k+1指令对R0寄存器的写形成的“写—写”相关。

(2)在程序实际执行过程中,二种数据相关会引起流水线停顿。

一是“先写后读”相关,k指令对R1的写在程序执行开始后的第四个时钟;k+1指令对R1的读对指令本身是第三个时钟,但k+1指令比k指令晚一个时钟进入流水线,则在程序执行开始后的第四个时钟要读R1。

不能在同一时钟周期内读写同一寄存器,因此k+1指令应推迟一个时钟进入流水线,产生了流水线停顿。

二是“写—写”相关,k+1指令对R0的写对指令本身是第六个时钟,而要求该指令进入流水线应在程序执行开始后的第三个时钟,所以对R0的写是在程序执行开始后的第八个时钟。

k+2指令对R0的写对指令本身是第五个时钟,而k+2指令比k+1指令晚一个时钟进入流水线,则在程序执行开始后的第四个时钟,所以对R0的写是在程序执行开始后的第八个时钟。

不能在同一时钟周期内写写同一寄存器,因此k+2指令应推迟一个时钟进入流水线,产生了流水线停顿。

另外,可分析“先读后写”相关不会产生流水线的停顿。

(3)由题意可认位该指令流水线由六个功能段取指、译码、取数、运一、运二和存数等组成,则程序指令执行过程的流水线时空图如下图所示。

若3条指令顺序流动,共需要9个
空间
存数
运二
运一
取数
译码
取指
0 1 2 3 4 5 6 7 8 9
2.23 有一条5个功能段的线性动态多功能流水线如图所示,其中1→2→3→5功能段组成加法流水线,1→4→5功能段组成乘法流水线,设每个功能段的延迟时间均相等为△t 。

用这条流水线计算F=41
()i
i i a b =+∏
,画出流水线时空图,并计算流水线的实际吞吐率、加速比
和效率。

解:由于该流水线为动态双功能流水线,计算要求先加后乘,因此应先设置加法功能,连续计算出(a 1+b 1)、(a 2+b 2)、(a 3+b 3)、(a 4+b 4)四个加法后;再设置乘法功能,而且按[(a 1+b 1)×(a 2+b 2)]×[(a 3+b 3)×(a 4+b 4)]顺序做3个乘法。

因此可画出该流水线的时空图如图所示,图中A=a 1+b 1,B=a 2+b 2,C=a 3+b 3,D=a 4+b 4。

由时空图可以看出,在总共12个△t 的时间内输出7个结果,所以有:
TP=n/Tn=7/12△t
而当用串行方法完成操作时,需要四次加法和三次乘法,完成一次加法需要4△t ,完成一次乘法需要3△t ,完成该运算总共需要时间为:
T 0 = 4×4△t+3×3△t = 25△t
所以 S = T 0/Tn = 2.08
E= 有效时空区面积/全部时空区面积
= (4×4△t+3×3△t)/(5×12△t) = 0.42
2.24 有一条3个功能段的流水线如下图所示,每个功能段的延迟时间均为△t ,但是,功能段S 2的输出要返回到它自己的输入端循环执行一次。

输出
△t △t △t
(1)如果每隔一个△
t 向流水线连续输入任务,这条流水线会发生什么问题? (2)求这条流水线能够正常工作的实际吞吐率、加速比和效率。

1 b 1
2 b 2
3 b 3
4 b 4 B
D
C ·D
(3)可用什么办法来提高流水线的吞吐率,画出改进后的流水线结构。

解:(1)每个任务在段S 2要反馈循环一次,执行时间为2Δt ,其它各段的执行时间为Δt ,因此应按瓶颈段的执行时间2Δt 流入任务,才不会发生冲突现象,否则会发生流水线的阻塞。

(2)若连续输入n 个任务,则流水线的实际吞吐率、加速比和效率分别为: TP = n/(4Δt +2(n –1)Δt )= n/2(n + 1)Δt →1/2Δt
S = 4n Δt/(4Δt +2(n –1)Δt )= 2n/(n + 1)→2
E = 4n Δt/3(4Δt +2(n –1)Δt )= 2n/3(n + 1)→2/3
(3)为提高流水线的吞吐率,可重复设置段S 2,并使两个段S 2串连在一起,从而消除瓶颈段S 2,而且各段执行时间相等为Δt ,流水线的段数为4。

流水线的结构如下图所示。

△t △t △t △t
2.25 在一个5段的流水线处理机上需经9△t 才能完成一个任务,其预约表为:
(1)写出流水线的初始冲突向量。

(2)画出流水线任务调度的状态有向图。

(3)求出流水线的最优调度策略及最小平均延迟时间和流水线的最大吞吐率。

(4)按最优调度策略连续输入8个任务时,流水线的实际吞吐率是多少?
解:(1)根据初始冲突向量的构成方法,对预约表各行中打“×”的拍数求出差值,除去重复的后汇集在一起,即得到延迟禁止表为F ={1,5,6,8}。

由F 可得到初始冲突向量为: C =(10110001)
(2)根据后继冲突向量的递推规则C j = SHR (k )
(C i )∨C 0则可得出所有的后继状态,具体有:
C 0四个后继状态:C 1 =SHR (2)
(C 0)∨C 0 = 10111101 7 C 2 =SHR (3)
(C 0)∨C 0C 3 =SHR (4)
(C 0)∨C 0C 4 =SHR (7)
(C 0)∨C 0 = 10110001=C 0C 1二个后继状态:C 5 =SHR (2)
(C 1)∨C 0 = 10111111 C 6 =SHR (7)
(C 1)∨C 0 = 10110001=C 07
C 2二个后继状态:C 7 =SHR (4)
(C 2)∨C 0 = 10111011=C 3C 8 =SHR (7)
(C 2)∨C 0 = 10110001=C 0
C 3二个后继状态:C 9 =SHR (3)(C 3)∨C 0 = 10110111=C 2 C 10=SHR (7)
(C 3)∨C 0 = 10110001=C 0
C 5一个后继状态:C 11=SHR (7)
(C 5)∨C 0 = 10110001=C 0
由后继状态和引起状态转移的时间间隔可得到状态有向图如上图所示。

(3)由状态转移有向图可得到无冲突的任务调度策略及其平均延迟时间,如下表所示。

调度策略平均延迟时间特别地,从C0出发的[3,(4,3)]也是一个
(2,2,7)(2+2+7)△t/3 = 3.67△t 任务调度策略,除第一条有向弧外,第二、三条(2,7)(2+7)△t/2 = 4.5△t 有向组成一个环路,该调度策略为(4,3)。

从表(3,4,7)(3+4+7)△t/3 = 4.67△t 中可以得到平均延迟时间最小的调度策略为(4,(3,7)(3+7)△t/2 = 5△t 3),该调度策略则为最优调度策略,相应的最小
(4,3,7)(4+3+7)△t/3 = 4.67△t 平均延迟时间为3.5△t,所以流水线的最大吞吐(4,7)(4+7)△t/2 = 5.5△t 率为:
(7) 7△t TP max = 1/(3.5△t)= 0.286/△t
3,(4,3)(4+3)△t/2 = 3.5△t
(4)按最优调度策略[3,(4,3)]连续输入8个任务时,流水线的实际吞吐率为:
TP = 8/[(3 + 4 + 3 + 4 + 3 + 4 + 3 + 9)△t] = 0.24/△t。

相关文档
最新文档