流水线课后习题

合集下载

第一章习题

第一章习题

一、填空题:1、在流水施工中,如果有n个施工过程,则流水步距就有(n-1 )个2、流水施工按组织方式可分为(等节奏流水施工)(等步距异节奏流水施工)(异步距异节奏流水施工)(无节奏流水施工)3、当组织流水施工对象有层间关系时,为使各专业工作队能连续工作,每层施工段数目应满足m(≥)n。

4、流水施工的时间参数包括(流水节拍)(流水步距)(平行搭接时间)(技术间歇时间)(组织间歇时间)5、建设项目按其组成内容由大到小可分解为(单项工程)(单位工程)(分部工程)(分项工程)二、选择题:单选:1、在工业建设中,拟建一个化肥厂,则该项目是一个(C)A、单项工程B、单位工程C、建设项目D、分部分项工程2、建筑产品的特点不包括:(B)A、固定性B、流动性C、多样性D、庞大性3、空间参数不包括:(C)A、施工段B、施工层C、流水强度D、工作面4、流水施工中流水节拍的大小可以反映出的内容不包括:(A)A、相邻施工班组进入同一施工段作业的时间间隔B、流水施工速度的快慢C、节奏感的强弱D、资源消耗量的多少5、施工组织设计是(A)的一项重要内容。

A、施工准备工作B、施工过程C、竣工验收6、施工组织设计是用以指导施工项目进行(D)的基本技术经济文件。

A、施工准备B、正常施工C、投标报价D、施工准备和正常施工7、施工过程的连续性是指施工过程各阶段、各工序之间在(A)具有紧密衔接的特性。

A、在时间上B、空间上C、工序上D、阶段上不定项选择:8、横道图进度计划的特点(BCD)A、能明确那些为关键工作B、作业进度清淅C、便于实际进度与计划进度的比较D、编制简单、方便、直观9、平行作业是指几个相同的工作队,在(AC)上进行施工。

A、同一时间B、不同时间C、不同空间D、同一空间10、组织流水施工时,划分施工段的的主要目的是(BD)A、可增加更多的专业队B、有利于不同专业队在同一时间在各施工段平行施工C、缩短施工工艺与组织间歇时间D、充分利用工作面11、流水节拍数值的确定可用(ABD)方法A、定额计算法B、经验估算法C、框算法D、工期倒排法三、判断题:1、施工准备工作的重要内容之一是编制施工组织设计。

《自动控制原理》课后习题章节测试满分答案

《自动控制原理》课后习题章节测试满分答案

绪论单元测试1【判断题】(100 分)自动控制理论经历了经典控制理论、现代控制理论和近代控制理论三个发展阶段。

A.错B.对第一章测试1【单选题】(10 分)下列系统中属于开环控制的为()。

A.家用空调器B.普通车床C.无人驾驶车D.自动跟踪雷达2【单选题】(10 分)下列系统属于闭环控制系统的为()。

A.家用电冰箱B.传统交通红绿灯控制C.自动流水线D.普通车床3【单选题】(10 分)下列系统属于定值控制系统的为()。

A.自动跟踪雷达B.自动化流水线C.家用空调D.家用微波炉4【单选题】(10 分)下列系统属于随动控制系统的为()。

A.火炮自动跟踪系统B.家用空调器C.自动化流水线D.家用电冰箱5【单选题】(10 分)下列系统属于程序控制系统的为()。

A.传统交通红绿灯控制B.火炮自动跟踪系统C.家用空调器D.普通车床6【单选题】(10 分)()为按照系统给定值信号特点定义的控制系统。

A.连续控制系统B.离散控制系统C.线性控制系统D.随动控制系统7【单选题】(10 分)下列不是对自动控制系统性能的基本要求的是()。

A.准确性B.快速性C.稳定性D.复现性8【单选题】(10 分)下列不是自动控制系统基本方式的是()。

A.开环控制B.复合控制C.闭环控制D.前馈控制9【单选题】(10 分)下列不是自动控制系统的基本组成环节的是()。

A.测量变送器B.控制器C.被控变量D.被控对象10【单选题】(10 分)自动控制系统不稳定的过度过程是()。

A.发散振荡过程B.其余选择都不是C.单调过程D.衰减振荡过程第二章测试1【单选题】(10 分)自动控制系统的数学模型为()。

A.热学方程B.梅森公式C.微分方程、传递函数、动态结构框图、信号流图D.状态方程、差分方程2【单选题】(10 分)以下关于传递函数的描述,的是()。

A.传递函数取决于系统和元件的结构和参数,并与外作用及初始条件有关B.传递函数是一种动态数学模型C.传递函数是复变量的有理真分式函数D.一定的传递函数有一定的零极点分布图与之相对应3【单选题】(10 分)系统的传递函数是由系统的()决定的。

计算机组成原理第8章习题指导

计算机组成原理第8章习题指导

第8章CPU的结构和功能例8.1假设指令流水线分取指(IF)、译码(ID)、执行(EX)、回写(WR)四个过程段,共有10条指令连续输入此流水线。

(1)画出指令周期流程。

(2)画出非流水线时空图。

(3)画出流水线时空图。

(4)假设时钟周期为100ns,求流水线的实际吞吐率。

(5)求该流水处理器的加速比。

解:(1)根据指令周期包括IF、ID、EX、WR四个子过程,图8.1(a)为指令周期流程图。

(2)非流水线时空图如图8.1(b)所示。

假设一个时间单位为一个时钟周期,则每隔4个时钟周期才有一个输出结果。

(3)流水线时空图如图8.1(c)所示。

由图可见,第一条指令出结果需要4个时钟周期。

当流水线满载时,以后每一个时钟周期可以出一个结果,即执行完一条指令。

(a)指令周期流程(b) 非流水线时空图(c) 标准流水线时空图图8.1 例8.1答图(4)由图8.1(c)所示的10条指令进入流水线的时空图可见,在13个时钟周期结束时,CPU执行完10条指令,故实际吞吐率为:10/(100ns×13) ≈ 0.77×107条指令/秒(5)在流水处理器中,当任务饱满时,指令不断输入流水线,不论是几级流水线,每隔一个时钟周期都输出一个结果。

对于本题四级流水线而言,处理10条指令所需的时钟周期数为T4 = 4 +(10 −1)= 13。

而非流水线处理10条指令需4×10 = 40个时钟周期。

故该流水处理器的加速比为40 ÷13 ≈ 3.08 例8.2设某机有四个中断源1、2、3、4,其硬件排队优先次序按1→2→3→4降序排列,各中断源的服务程序中所对应的屏蔽字如表8.1所示。

表8.1 例8.2各中断源对应的屏蔽字中断源 屏蔽字1 2 3 41 1 1 0 12 0 1 0 03 1 1 1 14 0 1 0 1(1)给出上述四个中断源的中断处理次序。

(2)若四个中断源同时有中断请求,画出CPU执行程序的轨迹。

高教版课后习题答案

高教版课后习题答案

第1章计算机系统结构的基本概念1.6 某台主频为400MHz的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下:求该计算机的有效CPI、MIPS和程序执行时间。

解:(1)CPI =(45000×1+75000×2+8000×4+1500×2) / 129500=1.776 (2)MIPS速率=f/ CPI =400/1.776 =225.225MIPS(3)程序执行时间= (45000×1+75000×2+8000×4+1500×2)/400=575s没有错误,但是不严密,指令数量的单位是MIPS.1.7 将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?解由题可知:可改进比例= 40% = 0.4 部件加速比= 10根据Amdahl定律可知:采用此增强功能方法后,能使整个系统的性能提高到原来的1.5625倍。

1.8 计算机系统中有三个部件可以改进,这三个部件的部件加速比为:部件加速比1=30;部件加速比2=20;部件加速比3=10(1)如果部件1和部件2的可改进比例均为30%,那么当部件3的可改进比例为多少时,系统加速比才可以达到10?(2)如果三个部件的可改进比例分别为30%、30%和20%,三个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少?解:(1)在多个部件可改进情况下,Amdahl定理的扩展:已知S1=30,S2=20,S3=10,S n=10,F1=0.3,F2=0.3,得:得F3=0.36,即部件3的可改进比例为36%。

(2)设系统改进前的执行时间为T,则3个部件改进前的执行时间为:(0.3+0.3+0.2)T = 0.8T,不可改进部分的执行时间为0.2T。

已知3个部件改进后的加速比分别为S1=30,S2=20,S3=10,因此3个部件改进后的执行时间为:改进后整个系统的执行时间为:Tn = 0.045T+0.2T = 0.245T那么系统中不可改进部分的执行时间在总执行时间中占的比例是:1.9 假设某应用程序中有4类操作,通过改进,各操作获得不同的性能提高。

流水线题解

流水线题解

• I1:
Hale Waihona Puke R1←A1+A2• I2:
R2←A3+A4
• I3:
R3←A5+A6
• I4:
R4←A7+A8
• I5:
R5←A9+A10
• I6:
R6←R1+R2
• I7:
R7←R3+R4
• I8:
R8←R5+R6
• I9:
F←R7+R8
这并不是唯一可能的计算方法。假设功能段的延迟
为Δt。时空图如下,图中的数字是指令号。
Z=A+B+C+D+E+F+G+H
1 2 34
5
6
解: TP=7/15△t E=7*4/(15*4)=7/15=46%
Sp=4*7/15=28/15=1.87
7
空间 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1 23 4
5
6
7
1 2 34
5
6
7
12 3 4
5
6
1 23 4
部件
规格化 尾乘3 尾乘2 尾乘1 阶加
输入 A C BD
输出
A*B C*D
A*BC*D
11
时间
A*B*C*D
图(B)
流水线按图(b)组织时,实现A*B*C*D的时空关系如图(B) 吞吐率TP=3/(11⊿t) 效率E =(3×5⊿t)/(5×11⊿t)=3/11=27.3%
n TP=
m
Σ△ti+(n-1)△tj
i=1
n 4时,TP 4 4 (6 9)t 15t

计算机组成原理复习题库流水线题

计算机组成原理复习题库流水线题

4.假设指令流水线分取指(IF)、译码(ID)、 执行(EX)、回写(WR)四个过程段,共 有10条指令连续输出此流水线。
(1)画出指令周期流程。
(2)画出非流水线时空图。
(3)画出流水线时空图。
(4)假设时钟周期为100 ns,求流水线的实 际吞吐量(单位时间执行完毕的指令数)。
(5)求该流水处理器的加速比。
5.流水线中有三类数据相关冲突:写后读相关(Read After Write, RAw),读后写相关( Write After Read, WAR),写后写相关( Write After Write, WAW)。 判断下面三组指令各存在哪种类型的数据相关。
(1)I1 I2
(2)I3 I4
(3)I5 I6
SUB R1,R2,R3 ;(R2) - (R3)
Байду номын сангаас
R1
ADD R4,R5,R1 ;(R5) + (R1)
R4
STA M,R2 ;(R2) M, M为存储单元
ADD R2 ,R4,R5;(R4) + (R5)
R2
MUL R3,R2,R1 ;(R2)* (R1)
R3
SUB R3 ,R4,R5;(R4) - (R5)
R3
6.什么是指令流水?画出指令二级流水和四级 流水的示意图,它们中的哪个更能提高处理 器的速度,为什么?
7.当遇到什么情况时,流水线将受阻?举例说 明。
8.写一组指令序列,说明因数据相关会影响该 程序的执行结果。
9.举例说明流水线中的几种数据相关。
10.假设指令流水线分8个过程段,若每个过程段所 需的时间为T,试问完成100条指令共需多少时间?
第六章 中央处理器习题

第05章流水线课后习题

第05章流水线课后习题第5章课后习题1.填空题(1) 衡量流水线性能的主要指标有(2) 指令乱序流动可能造成(3) 解决数据相关主要有(4) 超标量处理机开发的是行性。

(1). 吞吐率、加速比、效率(2). 先写后读、先读后写、写写(3). 推后分析、设置专用路径(4). 空间、时间2.假设一条指令的执行过程分为"取指令"、"分析"和"执行"三段,每一段的时间分别为△t、2△t和3△t。

在下列各种情况下,分别写出连续执行n条指令所需要的时间表达式。

(1) 顺序执行方式。

(2) 仅"取指令"和"执行"重叠。

(3) "取指令"、"分析"和"执行"重叠。

第2题(1) 顺序执行时每条指令用时=△t+2△t+3△t=6△t,因此n条指令所需要的时间=6n*△t(2) 第一条指令完成需要时间=△t+2△t+3△t=6△t,根据题义,下一条指令的"取指令"与上一条指令"执行"的最后一个△t重叠。

因此,自从第一条指令完成后,每隔4△t完成一条指令。

所以余下的n-1条指令用时(n-1)*4△t.所以,n条指令所需要的时间=6△t+(n-1)*4△t=2(2n+1)△t。

(3) 第一条指令完成需要时间=△t+2△t+3△t=6△t,由于一条指令的"取指令"和"分析"阶段和下一条指令的"执行"阶段重叠,因此,此后每3△t 完成一条指令,余下的n-1条指令用时(n-1)*3△t.因此n条指令所需要的时间=6△t+(n-1)*3△t=3(n+1)△t3.用一条5个功能段的浮点加法器流水线计算F=。

每个功能段的延迟时间均相等,流水线的输出端与输入端之间有直接数据通路,而且设置有足够的缓冲寄存器。

课后习题七(第八、九、十章)

课后习题(第八、九、十章)1、CPU是指( B )A. 控制器B. 运算器和控制器C. 运算器、控制器和主存D. 运算器、控制器、主存和I/O2、指令周期是( C )A. CPU执行一条指令的时间B. CPU从主存取出一条指令的时间C. CPU从主存取出一条指令加上执行这条指令的时间D. 对应于不同的指令,时间长短一致3、同步控制是( B )A. 只适用于CPU控制的方式B. 由统一时序信号控制的方式C. 所有指令执行时间都相同的方式D. 具有应答联络控制信号的方式4、异步控制常用于( A )A. CPU访问外设时B. 微程序控制中C. 微型机的CPU控制中D. CPU访问主存时5、下列说法中( C )是正确的A. 指令周期等于机器周期B. 指令周期小于机器周期C. 指令周期大于机器周期D. 指令周期是机器周期的两倍6、下列说法中( A )是错误的A. 计算机的速度完全取决于主频B. 计算机的速度不完全取决于主频C. 计算机的速度与主频、机器周期内平均含主振周期数有关D. 计算机的速度与机器的平均指令执行速度有关24、微程序控制器中,机器指令与微指令的关系是( B )A. 每一条机器指令由一条微指令来执行B. 每一条机器指令由一段微指令编成的微程序来解释执行C. 一段机器指令组成的程序可由一个微程序来执行D. 一段机器指令组成的程序可由一条微指令来执行26、Intel 8086 CPU是( B )A. 8位微处理器B. 16位微处理器C. 32位微处理器D. 准16位微处理器28、控制器的控制方式中,局部控制( B )A. 和异步控制相同,都不存在基准时标系统B. 属于同步控制,它和中央控制的基准时标是保持同步的C. 属于同步控制并有独立的时标系统,与中央控制的基准时标系统无关D. 属于异步控制,它和中央控制的基准时标应答联络33、隐指令是指( B )A. 操作数隐含在操作码中的指令B. 指令系统中没有的指令C. 在一个机器周期里完成全部操作的指令D. 用户特殊使用的指令34、中断向量可提供( C )A. 被选中设备的地址B. 传送数据的起始地址C. 中断服务程序入口地址D. 主程序的断点地址36、同步通讯之所以比异步通讯具有较高的传输率是因为( E )A. 同步通讯不需要应答信号B. 同步通讯方式的总线长度较短C. 同步通讯用一个公共的时钟信号进行同步D. 同步通讯中各部件存取时间比较接近E. 以上各项因素综合的结果40、下述( D )种情况会提出中断请求A. 产生存储周期“窃取”B. 一次I/O操作结束C. 两数相加结果溢出D. 上述B、C两项41、中断发生时,程序计数器内容的压栈保护,是由( C )完成的A. 压栈指令B. 转移指令C. 中断隐指令D. 中断服务程序44、在中断响应周期,置“0”中断允许触发器是由( A )完成的A. 硬件自动B. 关中断指令C. 程序员在编制中断服务程序时设置的D. 开中断指令45、采用DMA方式传送数据时,每传送一个数据要占用( C )的时间A. 一个指令周期B. 一个机器周期C. 一个存储周期D. 一个时钟周期46、DMA 方式( B )A. 既然能用于高速外围设备的信息传送,也就能代替中断方式B. 不能取代中断方式C. 是一种纯粹的软件方式D. 是一种操作时与主存无关的操作方式47、I/O编址方式通常可分为统一编址和不统一编址,( B )A. 统一编址就是将I/O地址看作是存储器地址的一部分,可用专门的I/O指令对设备进行访问B. 不统一编址是指I/O地址和存储器地址是分开的,所以对I/O访问必须有专门的I/O指令C. 统一编址是指I/O地址和存储器地址是分开的,所以用访存指令实现CPU对设备的访问D. 不统一编址就是将I/O地址看作是存储器地址的一部分,但对I/O访问必须有专门的I/O指令48、带有处理器的终端一般被称为( B )A. 交互式终端B. 智能终端C. 远程终端D. 移动终端49、目前在小型机和微型机里普遍采用的字母与字符编码是( C )A. BCD码B. 十六进制代码C. ASCII码D. 补码以下为书上相关例题50、某机器字长16位,主存按字节编址,转移指令采用相对寻址,由2字节组成,第一个字节为操作码字段,第二字节为相对位移量字段。

嵌入式系统课后习题部分答案1

第一章1-1.简述嵌入式系统的定义。

嵌入式系统是以应用为中心,以计算机技术为基础,并且软硬件可裁剪,适用于应用系统对功能、可靠性、成本、体积、功耗有严格要求的专用计算机系统。

1-2.简述嵌入式系统的组成。

从体系结构上看,嵌入式系统主要由嵌入式处理器、支撑硬件和嵌入式软件组成。

其中嵌入式处理器通常是单片机或微控制器,支撑硬件主要包括存储介质、通信部件和显示部件等,嵌入式软件则包括支撑硬件的驱动程序、操作系统、支撑软件及应用中间件等。

嵌入式系统的组成部分是嵌入式系统硬件平台、嵌入式操作系统和嵌入式系统应用。

嵌入式系统硬件平台为各种嵌入式器件、设备(如ARM 、PowerPC、Xscale、MIPS等);嵌入式操作系统是指在嵌入式Linux、uCLinux、WinCE等。

1-3.ARM7处理器使用的是(ARMv4)指令集。

ARM7内核采用冯·诺依曼体系结构,数据和指令使用同一条总线。

内核有一条3级流水线,执行ARMv4指令集。

1.4.Cortex-M3主要应用在哪些方向?主要用在平衡ARM的产品的性能和功耗,提高ARM的性能,降低其功耗1.5.简述StrongARM处理器和ARM处理器的关系StrongARM是第一个包含5级流水线的高性能ARM处理器,但它不支持Thumb指令集1-6.ARM9采用的是(5)级流水线设计。

存储器系统根据哈佛体系结构(程序和数据空间独立的体系结构)重新设计,区分数据总线和指令总线。

1.7.简述ARM9和ARM9E的不同点硬件处理器不一样指令集不一样1.8.ARM11采用的是什么架构的指令ARMv6嵌入式操作系统的特点(1)体积小(2)实时性(3)特殊的开发调试环境SecureCore处理器系列的特点(1)支持ARM指令集和Thumb指令集,以提高代码密度和系统性能(2)采用软内核技术一提供最大限度的灵活性,可以防止外部对其进行扫描探测(3)提供了安全特性,可以抵制攻击(4)提供面向智能卡和低成本的存储保护单元MPU(5)可以集成用户自己的安全特性和其它的协处理器第二章2-1.简述ARM可以工作在几种模式。

计算机组织与系统结构第七章习题答案

习题1.给出以下概念的解释说明。

指令流水线(Instruction pipelining)流水线深度(Pipeline Depth)指令吞吐量(Instruction throughput)流水线冒险(Hazard)结构冒险(Structural hazard)控制冒险(Control hazard)数据冒险(Data hazard)流水线阻塞(Pipeline stall)气泡(Bubble)空操作(nop)分支条件满足(Branch taken)分支预测(Branch predict)静态分支预测(Static predict)动态分支预测(Dynamic predict)延迟分支(Delayed branch)分支延迟槽(Delayed branch slot)转发(Forwarding)旁路(Bypassing)流水段寄存器(Pipeline register)IPC(Instructions Per Cycle)静态多发射(Static multiple issue)动态多发射(Dynamic multiple issue)超流水线(Superpipelining)超长指令字VLIW超标量流水线(Superscalar)动态流水线(Dynamic pipelining)指令预取(Instruction prefetch)指令分发(Instruction dispatch)按序发射(in-order issue)无序发射(out-of-order issue)存储站(Reservation station)重排序缓冲(Reorder buffer)指令提交单元(Instruction commit unit)乱序执行(out-of-order execution)按序完成(in-order completion)无序完成(out-of-order completion)2. 简单回答下列问题。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第5章课后习题1.填空题(1) 衡量流水线性能的主要指标有、和。

(2) 指令乱序流动可能造成、、三种数据相关。

(3) 解决数据相关主要有法和法。

(4) 超标量处理机开发的是并行性,而超流水线处理机开发的是并行性。

(1). 吞吐率、加速比、效率(2). 先写后读、先读后写、写写(3). 推后分析、设置专用路径(4). 空间、时间2.假设一条指令的执行过程分为"取指令"、"分析"和"执行"三段,每一段的时间分别为△t、2△t和3△t。

在下列各种情况下,分别写出连续执行n条指令所需要的时间表达式。

(1) 顺序执行方式。

(2) 仅"取指令"和"执行"重叠。

(3) "取指令"、"分析"和"执行"重叠。

第2题(1) 顺序执行时每条指令用时=△t+2△t+3△t=6△t,因此n条指令所需要的时间=6n*△t(2) 第一条指令完成需要时间=△t+2△t+3△t=6△t,根据题义,下一条指令的"取指令"与上一条指令"执行"的最后一个△t重叠。

因此,自从第一条指令完成后,每隔4△t完成一条指令。

所以余下的n-1条指令用时(n-1)*4△t.所以,n条指令所需要的时间=6△t+(n-1)*4△t=2(2n+1)△t。

(3) 第一条指令完成需要时间=△t+2△t+3△t=6△t,由于一条指令的"取指令"和"分析"阶段和下一条指令的"执行"阶段重叠,因此,此后每3△t 完成一条指令,余下的n-1条指令用时(n-1)*3△t.因此n条指令所需要的时间=6△t+(n-1)*3△t=3(n+1)△t3.用一条5个功能段的浮点加法器流水线计算F=。

每个功能段的延迟时间均相等,流水线的输出端与输入端之间有直接数据通路,而且设置有足够的缓冲寄存器。

要求用尽可能短的时间完成计算,画出流水线时空图,计算流水线的实际吞吐率、加速比和效率。

第3题假设每个功能段的延迟时间为△t。

F==[(A1+1A2)+6(A3+2A4)+8(A5+3A6)]+9[(A7+4A8)+7(A9+5A10)]由上面的时空图可以看出,在20△t时间内共完成9个加法操作。

因此:吞吐率为:TP= 9/20=0.45加速比为:Sp= 9*5/20=2.5效率为:E= 45/(20*5)=45%4.设有一个15000条指令的程序在一台时钟速率为25MHz的线性流水线处理机上执行。

假设该指令流水线有5段,并且每个时钟周期发射一条指令。

忽略由于转移指令和无序执行造成的损失。

(1) 用该流水线执行这一程序,并用流过延迟与其相等的一个等效非流水线处理机执行同一程序,将两者加以比较,并计算其加速比。

(2) 该流水线处理机的效率是多少?(3) 计算该流水线的吞吐率。

第4题(1) 等效的非流水处理机执行一条指令需要的时间是5个时钟周期。

依照加速比定义,(2) 效率E为(3) 吞吐率TP为5.设有5段流水线处理机的预约表如下:(1) 列出禁止等待时间和冲突向量集。

(2) 画出状态转换图,说明不引起流水线冲突的所有可能的启动序列(循环)。

(3) 根据状态图列出所有简单循环。

(4) 从简单循环中找出迫切循环。

(5) 此流水线的最小平均等待时间(MAL)是多少?(6) 使用此流水线时,列出可允许的最小恒定循环。

(7) 该流水线的最大吞吐率是多少?(8) 如果使用最小恒定循环,则吞吐率是多少?1 2 3 4 5 6S1 X XS2 X XS3 XS4 XS5 X X第5题(1) 禁止等待时间是:3,4,5。

冲突向量为(11100)。

(2) 状态转换图如下所示:(3) 简单循环如下:(1,1,6),(2,6),(6),(1,6)(4) 迫切(最小启动)循环为(1,1,6)(5) 最小平均等待时间MAL为(6) 最小恒定循环为(6)。

(7) 设该流水线的时钟周期为τ,则该流水线的最大吞吐率TP MAX为(8) 使用最小恒定循环时,设该流水线的时钟周期为τ,该流水线的吞吐率为6.下列汇编代码在一台3段流水线处理机上执行,每一段都有冒险(相关)检测和分解。

这三段是取指令、取操作数(根据要求取一个或者多个)和执行(包括写回操作)。

试说明在代码执行中所有可能的相关情况。

Inc R0/R0←(R0)+1/Mul ACC,R0/ACC←(ACC)×(R0)/Store R1,ACC/R1←(ACC)/Add ACC,R0/ACC←(ACC)+(R0)/Store M,ACC /M←(ACC)/第6题我们首先给上面的指令序列编号如下:I1:Inc R0 /R0←(R0)+1/I2:Mul ACC,R0 /ACC←(ACC)×(R0)/I3:Store R1,ACC /R1←(ACC)/I4:Add ACC,R0 /ACC←(ACC)+(R0)/I5:Store M,ACC/M←(ACC)/我们使用IF、OF和EX来分别代表流水线的取指令、取操作数和执行三段。

下面的图表显示了执行的序列:图中的箭头方向是同一条指令在流水线中的流动方向,从图中我们可以看出:在t3时刻:O(I1)∩ I(I2)= {R0} ,会发生RAW相关;在t4时刻:O(I2)∩ I(I3)= {Acc} ,会发生RAW相关;在t6时刻:O(I4)∩ I(I5)= {Acc} ,会发生RAW相关。

其中我们用O(I1)表示指令I1的输出寄存器(如R0表示寄存器,而Acc表示表示累加器),I(I2)表示指令I2的输入寄存器。

下面的调度方法能够避免相关的发生:其中,Stall表示流水线停顿,通过这种方法,可以避免相关的发生。

7.设有4段流水线处理机如下,此流水线的总求值时间为6个时钟周期,所有相继段必须在每个时钟周期之后才能使用。

(1) 列出这一流水线的4行六列预约表。

(2) 列出任务启动之间的禁止等待时间集。

(3) 画出表示所有可能的等待时间循环的状态图。

(4) 根据状态图列出所有的迫切(最小启动)循环。

(5) 最小平均等待时间值是多少?第7题可能会有多种方案。

答案一:(1) 预约表如下所示:1 2 3 4 5 6S1 X XS2 X X S3 XS4 X(2) 禁止等待时间为:4,冲突向量为:(1000)。

(3) 状态转移图如下:(4) 简单循环如下所示:(1,5),(1,1,5),(1,1,1,5),(1,2,5),(1,2,3,5),(1,2,3,2,5),(1,2,3,2,1,5),(2,5),(2,1,5) (2,1,2,5),(2,1,2,3,5),(2,3,5),(3,5),(3),(3,2,5),(3,2,1,5),(3,2,1,2,5),(5),(3,2,1,5)(5) 最小启动循环如下:(1,1,1,5)和(1,2,3,2)(6) 平均最小等待时间为:(7) 最大的吞吐量为:答案二:(1) 预约表如下所示:1 2 3 4 5 6S1 X XS2 X X X S3 X XS4 X(2) 禁止等待时间为:2和4,冲突向量为:(1010)。

(3) 状态转移图如下:(4) 简单循环如下所示:(3),(5),(1,5)和(3,5)(5) 最小启动循环如下:(1,5)和(3)(6) 最小平均等待时间为:(7) 最大吞吐量为:8.三条功能流水线f1,f2和f3可用下面的预约表来描述:用这三条流水线还可形成一个组合流水线网络如下:通过此组合流水线的每个任务按以下的次序使用流水线:第一是f1,其次是f2和f3,再是f1,然后得到输出。

双多路转换器从(A,B)或(X,Y)中选择一对输入,并把他们输入给f1。

组合流水线的使用也是用组合的预约表来描述的。

(1)(2) 写出禁止启动循环和初始冲突向量。

(3) 画出能清楚表示所有等待时间循环的状态图。

(4) 列出所有简单循环和迫切(最小启动)循环。

(5) 计算此组合流水线的MAL和最大吞吐率。

第8题(1) 预约表如下:(2) 禁止等待时间为:8,1,7,9,3,2;初始冲突向量为:(1)(3) 状态转换图如下:(4) 简单循环为:(5),(6),(10),(4,6),(4,10),(5,6),(5,10);其中最小启动循环为:(5)和(4,6);(5) 最小平均启动距离为:(6) 最大吞吐量为;9.假设一个四段流水线(其时钟周期τ=20ns)的预约表如下:1 2 3 4 5 6S1 X XS2 X XS3 XS4 X X(1)哪些是禁止等待时间和初始冲突向量?(2) 画出调度该流水线的状态变换图。

(3) 确定与最佳迫切循环相关联的MAL。

(4) 确定与MAL和给定的τ相对应的流水线吞吐率。

(5) 确定该流水线的MAL下限。

从上面的状态图你得到最佳等待时间了吗?如果允许你在上面的流水线中插入一个非计算延迟段,使最短迫切循环中的等待时间为1,其目的是要产生一张新的预约表,以获得下限最佳等待时间。

(6) 画出5行7列修改后的预约表。

(7) 为得到最佳循环画出新的状态变换图。

(8) 根据状态图列出所有的简单循环和迫切循环。

(9) 证明新的MAL等于下限。

(10) 这条流水线的最佳吞吐率是多少?与上面的吞吐率相比,改善的百分比是多少?第9题(1) 禁止等待时间为:1,2,5;初始冲突向量为:(10011);(2) 状态转移图如下:(3) 最小平均等待时间为:(4) 最大吞吐量为:(million operation per second)(5) 最小的平均等待时间为2,因此,这种调度方法不是最优的。

(6) 插入非计算性延迟后,预约表如下所示:1 2 3 4 5 6 7S1 X XS2 X XS3 XS4 X XD X(7) 状态转换图变成如下所示:(8) 简单循环如下:(4),(5),(7),(3,1),(3,4),(3,5,4),(3,5,7),(1,7)(5,4),(5,7),(3,7),(1,3,4),(1,3,5,4),(1,3,5,7)(1,3,7),(1,4,3),(1,4,4),(1,4,7),(5,3,4),(5,3,7)(5,3,1,7)其中最小启动循环为(1,3)(9) 此时的最小启动距离为:(10) 此时的最大吞吐率为:10.假设分支概率(相对于所有的指令)为:条件分支20%,跳转和过程调用:5%,其中,条件成功分支有60%可能执行。

在一个4段的流水线中,如果分支指令在第2个时钟周期末决定是否是条件失败分支,在第3个时钟周期末决定是否是条件成功分支。

假定第1个时钟周期的操作和条件分支无关,并且忽略其他流水停顿,那么,如果没有控制相关的话,处理器能快多少?第10题我们使用加速比来衡量控制相关引起的流水线的效率下降。

相关文档
最新文档