计算机体系结构试卷试题(答案全)
计算机体系结构考试卷子及答案

1.某台主频为1GHz的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下:求该计算机的有效CPI、MIPS和程序执行时间。
(10分)2.将计算机系统中某一功能的处理速度加快15倍,但该功能的处理时间仅占整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?3.如果某计算机系统有3个部件可以改进,则这3个部件进改进后达到的加速比分别为:S1=30,S2=20,S3=10。
(1)如果部件1和部件2改进前的执行之间占整个系统执行的时间比例都为30%,那么,部件3改进前的执行时间占整个系统执行时间的比例为多少,才能使3个部件都改进后的整个系统的加速比Sn达到10?(2)如果3个部件改进前执行时间占整个系统执行时间的比例分别是30%,30%和20%,那么,3个部件都改进后系统的加速比是多少?未改进部件执行时间在改进后的系统执行时间中占的比例是多少?(10分)4.假设某应用程序中有4类操作,通过改进,各操作获得不同的性能提高。
具体数据如下表所示:(1)改进后,各类操作的加速比分别是多少?(2)各类操作单独改进后,程序获得的加速比分别是多少?(3)4类操作均改进后,整个程序的加速比是多少?5.一台模型机的9条指令的使用频度如下:(10分)ADD(加):26%SHR(右移):2%SUB(减):17%CLL(循环左移):5%JOM(按页转移):11%CLA(累加器清零):15%STO(存):2%STP(停机):12%JMP(转移):10%试设计这9条指令的Huffman编码的操作码表示以及其等长扩展操作码表示,并计算这两种表示的平均操作码长度。
6.有一个“Cache-主存”存储层次。
主存共分为8个块(0~7),Cache为4个块(0~3),采用直接映像方式。
(1)对于如下主存块地址流:0、2、6、1、3、7、0、1、4、5、4、6、0、7、2,如主存中内容一开始未装入Cache,请列出每次访问后Cache中各块的分配情况;(2)对于(1),指出既发生块失效又发生块争用的时刻;(3)对于(1),求出此期间的Cache命中率。
福师(2020-2021)《计算机体系结构》在线作业二(2)答案

福师(2020-2021)《计算机体系结构》在线作业二
注:本科有多套试卷,请核实是否为您所需要资料,本资料只做参考学习使用!!!
一、单选题(共20题,40分)
1、下列关于标量流水机的说法不正确的是()。
A可对标量数据进行流水处理
B没有向量数据表示
C不能对向量数据进行运算
D可以对向量、数组进行运算
提示:认真复习课本知识302,并完成以上题目
【参考选择】:C
2、()是访问主存空间的地址
A物理地址
B程序地址
C逻辑地址
D虚拟地址
提示:认真复习课本知识302,并完成以上题目
【参考选择】:A
3、在IBM系统中,中断响应硬件分工保存的是()。
A通用寄存器内容
B条件码等状态信息
C各种软件状态和标志
D作业名称和优先级等
提示:认真复习课本知识302,并完成以上题目
【参考选择】:B
4、在IBM 370系统中,支持操作系统实现多进程共用公用区管理最有效的指令是()。
A“测试与置定”指令
B“比较与交换”指令
C“执行”指令
D“程序调用”指令
提示:认真复习课本知识302,并完成以上题目
【参考选择】:B
5、通道流量是在某个时期单位时间内传送的字节数,这个时期应是()。
A通道开始选择设备期
B通道数据传送期
C通道数据传送结束期
D用户经访管指令进入管态,运行I/O管理程序的期间
提示:认真复习课本知识302,并完成以上题目
【参考选择】:B。
计算机系统结构试题及答案

××× ××× ××× ××× ××× ××× ××× ×××
64+116=180
TP
40 40 40 6t (40 1)t j 6t 39 3t 123t
E
SP
40 6t 48.8% 4 123t
40 6t 1.95 123t
48 3 35 七、 (10 分) TP 175( MIPS ) (5 3 4 8) 7 5ns 40 5ns [解]:不能与输出的 2、 3、 6、 结点相连。
四、 (10 分) [ 解] : (1)低速设备应接字节多路通道
f max .byte
1 1 1 n Ts TD 4.9 0.1 250
所以,n≤50 台,即最多可接 50 台 (2)根据题T
1 TS D n
1 .9 0.1 4n
姓名:
2009-2010 学年度第一学期 2007 级 《计算机系统结构》期末考试试卷(A) (闭卷) 学号: 专业: (注:①考试时间为 120 分钟;②所有解答必须写在答题纸上。 )
一、单项选择题(每小题 3 分,共 30 分) 1.在系列机中发展一种新型号机器,你认为下列( )设想是不行的? 【A】新增加字符数据类型和若干条字符处理指令 【B】将中断分级由原来的 4 级增加到 5 级 【C】在 CPU 和主存之间增设 Cache 存贮器 【D】将浮点数的下溢处理法由原来的恒置“1”法,改为查表舍入法 2.对计算机系统结构来说,不透明的是( ) 。 【A】存储器采用交叉存取还是并行存取 【B】CPU 内部的数据通路的宽度是 8 位还是 16 位 【C】采用浮点数据表示还是标志符数据表示 【D】指令采用硬联逻辑实现还是微程序实现 3.一个平衡的计算机系统,应该是( ) 。 【A】1MIPS 的 CPU 速度 【B】1MB 的主存容量 【C】1Mb/s 的 I/O 吞吐率 【D】A、B 和 C 4、 ( )设计是现代计算机系统设计所采用的方法。 【A】由上往下 【B】由下往上 【C】由中间开始 【D】上下同时开始 5.当今微型机中实现软件移植最好的方法是( ) 。 【A】系列机 【B】兼容机 【C】仿真技术 【D】统一高级语言 6、不能够对向量数据结构提供直接支持的是( )数据表示。 【A】向量 【B】堆栈 【C】描述符 【D】A 和 C 7、采用整数边界存储技术,其主要目的是( ) 。 【A】节约主存空间 【B】提高数据的访问速度 【C】一个主存周期可取多条指令 【D】一个主存周期至少可取到一条指令 8、在指令的操作码编码方式中,优化实用的编码是( ) 。 【A】Huffman 编码 【B】等长编码 【C】Huffman 扩展编码 【D】BCD 码 9、流水计算机中将指令 Cache 和数据 Cache 分开,主要是为了( ) 。 【A】提高存储系统的速度 【B】增加主存容量 【C】解决功能部件冲突 【D】解决访存冲突 10、当 N=16 时,能描述 4 组 4 元交换的函数是( ) 。 【A】C1+C2 【B】C0+C1 【C】C0+C2 【D】C2+C3 二、 (10 分)在采用通用寄存器指令集结构的计算机上得到了如下所示的数据: 指令类型 ALU 指令 LOAD 指令 STORE 指令 分支指令 执行频率 43% 21% 12% 24% 时钟周期数 1 2 2 2
计算机体系结构模拟试卷整理版

模拟卷一、选择题(每小题2分,共20分)1.最早的冯·诺依曼结构的计算机是以()为中心的。
A.运算器B.控制器C.存储器D.I/O设备小结:1.计算机以运算器为中心。
2.在存储器中,指令和数据同等对待。
3.存储器是按地址访问、按顺序线性编址的一维结构,每个单元的位数是固定的。
4.指令的执行是顺序的5.指令由操作码和地址码组成。
6.指令和数据均以二进制编码表示,采用二进制运算。
2.Amdahl提出的系统结构指的是()级程序员所看到的计算机属性。
A.操作系统级B.高级语言C.机器语言(传统机器级)D.汇编语言3.计算机指令集的两个发展方向是RISC和()。
A.ARMB.MIPSC.SIMDD.CISC4.从执行程序的角度看,并行性等级最低的是()。
A.指令内部并行B.指令级并行C.线程级并行D.作业级并行小结:指令内部并行、指令级并行、线程级并行、任务级或过程级并行、作业或程序级并行5.流水线的通过时间是指流水线中()流出结果所需的时间。
A.流水线第一段B.流水线第二段C.第一个任务D.最后一个任务小结:排空时间:最后一个任务从进入流水线到流出结果所需的时间。
6.弗林(Michael J. Flynn)对计算机的分类中,MIMD指的是()计算机。
A.单指令流单数据流B.单指令流多数据流C.多指令流单数据流D.多指令流多数据流7..因为分支指令引起的相关叫做()相关。
A.数据B.结构C.控制D.循环8.基本的MIPS整数流水线中,访存地址的计算发生在流水线的第()段。
A.1 B.2 C.3D.49.RISC执行程序的速度比CISC要快的原因是()。
A.RISC的指令系统中指令条数较少B.程序在RISC上编译生成的目标程序较短。
C.RISC的指令平均执行周期数较少。
D.RISC只允许load和store指令访存。
10.通过编译器重新安排指令的执行顺序以减少流水的停顿方法,称之为( )。
A.线性流水线B.非线性流水线C.动态调度D.静态调度二、填空题(每空2分,共30分)1.按某个时期投入市场的某种型号机器编制的程序,不加修改地就能运行于在它之前或之后投入市场的机器。
计算机网络试题(附答案)

第一章计算机网络的基本概念一、选择题1、完成路径选择功能是在OSI模型的()。
A.物理层B.数据链路层C.网络层D.运输层2、在TCP/IP协议簇的层次中,保证端-端的可靠性是在哪层上完成的?()A.网络接口层B.互连层C.传输层D.应用层3、在TCP/IP体系结构中,与OSI参考模型的网络层对应的是()。
A.网络接口层B.互联层C.传输层D.应用层4、在OSI七层结构模型中,处于数据链路层与传输层之间的是()。
A.物理层B.网络层C.会话层D.表示层5、计算机网络中可以共享的资源包括()。
A.硬件、软件、数据B.主机、外设、软件C.硬件、程序、数据D.主机、程序、数据6、网络协议组成部分为()。
A.数据格式、编码、信号电平B.数据格式、控制信息、速度匹配C.语法、语义、定时关系D.编码、控制信息、定时关系二、填空题1、按照覆盖的地理范围,计算机网络可以分为________、________和________。
2、Internet采用_______协议实现网络互连。
3、ISO/OSI中OSI的含义是________。
4、计算机网络是利用通信线路将具有独立功能的计算机连接起来,使其能够和________ 和________。
5、TCP/IP协议从上向下分为________、________、________和________4层。
6、为了实现对等通信,当数据需要通过网络从一个节点传送到到另一个节点前,必须在数据的头部(和尾部)加入____________,这种增加数据头部(和尾部)的过程叫做____________或____________。
7、计算机网络层次结构划分应按照________和________的原则。
8、ISO/OSI参考模型将网络分为从低到高的________、________、________、________、________、________和________七层。
9、建立计算机网络的目的是___________和____________。
计算机体系结构基础知识试题及

计算机体系结构基础知识试题及答案解析一、选择题1. B2. A3. D4. C5. B6. C7. A8. D9. B 10. C二、填空题1. 互联网2. 中央处理器3. 存储器4. 输入/输出设备三、简答题1. 计算机体系结构是指计算机硬件与软件之间的逻辑结构和功能关系,即计算机的整体结构和组成方式。
2. CPU(中央处理器)是计算机体系结构的核心,它负责执行计算机的指令并控制计算机的运行。
3. 存储器是计算机中用于存储数据和程序的部件,包括主存储器(RAM)和辅助存储器(硬盘、固态硬盘等)。
4. 输入/输出设备用于实现计算机与外部设备之间的数据交换,包括显示器、键盘、鼠标、打印机等。
四、论述题计算机体系结构是计算机科学中的重要组成部分,它对于计算机的设计和开发具有重要意义。
计算机体系结构的基本原理可以通过一系列试题来进行检测和考察。
下面是一套基础的计算机体系结构试题及其答案解析。
首先是选择题部分,这部分试题主要考察对计算机体系结构基础知识的理解和应用能力。
通过选择正确的答案来判断考生对相关知识的掌握情况。
根据试题解析,我们可以得出正确的答案和解释。
接下来是填空题部分,这部分试题主要考察考生对计算机体系结构相关术语的理解和记忆能力。
通过填写正确的术语来补全句子,从而测试考生对相关知识的熟悉程度。
最后是简答题部分,这部分试题通过提出开放式问题,要求考生对计算机体系结构的相关概念和原理进行简要的叙述。
考生需要用清晰、准确的语言来回答问题,展示自己对知识的理解和运用能力。
综上所述,计算机体系结构基础知识试题及答案解析是一套用于考察计算机科学学习者对计算机体系结构基本原理的掌握程度的试题。
通过做题和解析,考生可以检测自己的学习效果,并加深对相关知识的理解。
希望这套试题能为广大学习者提供帮助,推动计算机科学的进一步发展。
【上海交通大学(上海交大)计算机组成与系统结构】【习题试卷】2

一.单项选择题(每个空格只有一个正确答案,35分,每题5分)1. B 的基本任务是按照 H 所排的指令序列,从 F 取出指令操作码到 B 中,对指令操作码译码分析,执行指令操作。
适配器的作用是保证 A 用计算机系统特性所要求的形式发送或接收信息。
A. I/O设备B. 控制器C. 缓冲器D. 译码器E. 寄存器F. 存储器G. 地址H. 程序2.在奇偶校验中,只有当数据中包含有 A 个1时,奇校验位C=0;只有当数据中包含有 B 个1时,偶校验位C= C 。
奇偶校验可提供单个错误检测,但无法检测 E 错误,更无法识别错误信息的 G 。
A. 奇数B. 偶数C. 0D. 1E. 多个F. 内容G. 位置H. 来源3.MOS半导体存储器中, D 的外围电路简单,速度 G ,但其使用的器件多,集成度不高; C 可大幅度提高集成度,但由于 F 操作,外围电路复杂,速度 H 。
A. ROMB. RAMC. DRAMD. SRAME. 读写F. 刷新G. 快H. 慢4.指令格式就是 G 用二进制代码表示的结构形式,通常由 A 字段和 F 字段组成,前者表征指令的操作特性与功能,后者通常指定参与操作的 B 的 E 。
A. 操作码B. 操作数C. 操作特性D. 数据字E. 地址F. 地址码G. 指令字H. 功能字5.根据设计方法不同, B 控制器可分为三种:第一种称为 G 控制器,它是采用时序逻辑技术来实现的;第二种称为 A 控制器,它是采用 E 逻辑来实现的;第三种是前两种方式的 F 。
A. 微程序B. 操作C. 指令D. 时间E. 存储F. 组合G. 硬布线H. 软布线6.一条 C 是由若干条 G 组成的序列(通常叫做 E )来实现的,而 E 的总和便可实现整个的 D 。
A. 微操作B. 宏操作C. 机器指令D. 指令系统E. 微程序F. 宏程序G. 微指令H. 宏指令7.奔腾CPU的大多数简单指令用 E 控制实现,在 A 个时钟周期内执行完毕。
计算机体系结构试卷试题(答案全)

一填空题(每空1分,共30分)1、系列机是指具有相同的体系结构,但具有不同组织和实现的一系列不同型号的机器。
2、存储程序计算机结构上的主要特点之一是以运算器为中心。
3、从计算机系统结构的多级层次结构可知,通常情况下,第1、2、3级用解释方法实现,第4或更高级用翻译方法实现。
4、对于最常见的事件,通常赋予它优先的处理权和资源使用权,这是计算机体系结构设计中的大概率事件优先原则。
5、容量为64块的Cache采用组相联方式映像,字块大小为128字节,每4块为一组,若主存容量为4096块,且以字编址,那么主存地址为 19 位,主存区号为 6 位。
6、可改进比例的值总是小于等于1 。
7、一般有两种策略来保存寄存器的内容,即:调用者保存和被调用者保存。
8、DLX指令集提供了立即数寻址、寄存器寻址、偏移寻址和寄存器间接寻址4种寻址方式。
9、对某流水线处理器测试时发现其存在结构冲突,通常可采用资源重复和流水化功能单元方法解决该问题。
10、编译器通过重新组织代码顺序消除暂停的技术被称为指令调度。
11、按照流水的级别可以把流水线分为部件级流水线、处理机级流水线和处理机间流水线。
12、为解决流水线使用非流水数据通路的寄存器引起冲突,在流水线设计中采用寄存器文件技术解决该问题。
13、Cache的替换算法常见的有 FIFO 、LRU 和随机法。
14、改进Cache性能的方法主要有降低失效率、减少失效开销和减少Cache命中时间。
15、减少流水线处理分支暂停时钟周期数的途径包括尽早判断分支转移是否成功和尽早计算出分支成功转移的PC值。
二、选择题(1—15题,每题1分,共15分)1、下面的指令中, A 不属于RISC处理器指令集。
A.ADD R4,[1000] B.LD R3,(R4) C.SUB R4,R3 D.SD 0(R3),R42. 在其它部件性能保持不变的情况下,对CPU性能的不断改进并没有获得期望的结果,这主要是受到了 A 的影响。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一填空题(每空1分,共30分)
1、系列机是指具有相同的体系结构,但具有不同组织和实现的一系列不同型号的机器。
2、存储程序计算机结构上的主要特点之一是以运算器为中心。
3、从计算机系统结构的多级层次结构可知,通常情况下,第1、2、3级用解释方法实现,第4或更高级用翻译方法实现。
4、对于最常见的事件,通常赋予它优先的处理权和资源使用权,这是计算机体系结构设计中的大概率事件优先原则。
5、容量为64块的Cache采用组相联方式映像,字块大小为128字节,每4块为一组,若主存容量为4096块,且以字编址,那么主存地址为 19 位,主存区号为 6 位。
6、可改进比例的值总是小于等于1 。
7、一般有两种策略来保存寄存器的内容,即:调用者保存和被调用者保存。
8、DLX指令集提供了立即数寻址、寄存器寻址、偏移寻址和寄存器间接寻址4种寻址方式。
9、对某流水线处理器测试时发现其存在结构冲突,通常可采用资源重复和流水化功能单元方法解决该问题。
10、编译器通过重新组织代码顺序消除暂停的技术被称为指令调度。
11、按照流水的级别可以把流水线分为部件级流水线、处理机级流水线和处理机间流水线。
12、为解决流水线使用非流水数据通路的寄存器引起冲突,在流水线设计中采用寄存器文件技术解决该问题。
13、Cache的替换算法常见的有 FIFO 、LRU 和随机法。
14、改进Cache性能的方法主要有降低失效率、减少失效开销和减少Cache命中时间。
15、减少流水线处理分支暂停时钟周期数的途径包括尽早判断分支转移是否成功和尽早计算出分支成功转移的PC值。
二、选择题(1—15题,每题1分,共15分)
1、下面的指令中, A 不属于RISC处理器指令集。
A.ADD R4,[1000] B.LD R3,(R4) C.SUB R4,R3 D.SD 0(R3),R4
2. 在其它部件性能保持不变的情况下,对CPU性能的不断改进并没有获得期望的结果,这主要是受到了 A 的影响。
A.Amdahl定律
B.流水线
C.指令集
D.体系结构
3、对cache性能进行分析时,我们发现 A 不受cache容量的影响。
A.强制性失效 B.容量失效 C.冲突失效 D.3C失效
4、若某CPU只有一个存储器,采用DLX流水线并执行如下的程序段,①SD (R1),R2
②LD R3,(R1)#4③ADD 0(R1),#8④SUB R3,R1;则该程序段中指令①和指令④的关系属于 A 。
A 数据相关
B 名相关
C 控制相关
D 结构相关
5、在下列存储器中访问速度最慢的是 D 。
A Cache
B SDRAM
C DRAM
D Flash
6、最近计算机上采用的SSD(固态硬盘)实质上是 A 存储器。
A.Flash B.磁盘 C.磁带 D.光盘
7、计算机使用总线结构的主要优点是便于实现积木化,同时 C 。
A.减少了通信传输量B.提高了通信传输的速度
C.减少了通信传输线的条数D.有利于芯片中布线
8、下面关于流水线的说法不正确的是 D 。
A 流水线由若干个“段”或“级”组成
B 流水线有“通过时间”
C 流水线的“各段时间”应尽量相等
D 流水线的”深度”越多越好
9、我们常说的32位处理器是指处理器的 A 是32位的。
A 数据总线
B 控制总线
C 地址总线
D 所有的总线
10、科学计算中采用向量处理机的主要原因是 A 较少。
A数据相关B控制相关C结构相关D非向量处理机
11、为了便于实现多级中断,保存现场信息最有效的方法是采用_B__.。
A.通用寄存器B堆栈C.存储器D.外存
12、在下面描述的RISC指令系统基本概念中不正确的表述是 A 。
A.选取使用频率低的一些复杂指令,指令条数多。
B.指令长度固定
C.指令功能简单
D.指令运行速度快
13、在下述I/O控制方式中,主要由程序实现的是 B 。
A.I/O处理机方式B.中断方式C.DMA方式D.通道方式
14、以下属于降低Cache失效率的方法是 B 。
A.子块放置技术 B.编译器优化 C.采用两级Cache D.虚拟Cache
15、现有一个Web服务器,其它部分不变的情况下,若采用如下的增强方式:采用40个CPU,想要达到30的加速比,则串行部分的比率最大是 A 。
A.0.11 B.0.12 C.0.10 D.0.13
三、简述题(每题5分,共25分)
1、解释如下几个缩写:RISC、ISA、MIMD、RAID、Cache。
RISC精简指令集计算机
ISA工业标准结构
MIMD多指令流多数据流
RAID廉价磁盘冗余阵列
Cache高速缓冲存储器
2、试说明名相关的两种类型。
反相关:指令i先执行,指令j写的名是指令i读的名。
反相关指令之间的执行顺序是必须保证的,反相关就是先读后写相关。
输出相关:指令j和指令i写相同的名。
输出相关指令的指令顺序是不允许颠倒的。
输出相关就是写后写相关。
3、试说明定向技术的思想。
定向技术的思想是:在某条指令产生一个计算结果之前,其他指令并不真正需要该计算结果,如果将该计算结果产生的地方直接送到其他指令需要他的地方,那么就可以避免暂停。
4、试说明伪相联Cache的特点。
伪相联Cache既能获得多路组相联Cache的低失效率,又能保持直接映像Cache的命中速度。
采用这种方法时,在命中情况下,访问Cache的过程和直接映像Cache 中的情况相同,而发生失效时,在访问下一级存储器之前会先检查Cache另一个位置,看是否匹配。
5、试说明分布式共享多处理机的优缺点。
分布式存储器结构的优点:
(1)如果大多数的访问是针对本结点的局部存储器,则可降低对存储器和互连网络的带宽要求;
(2)对局部存储器的访问延迟低。
主要缺点:处理器之间的通信较为复杂,且各处理器之间访问延迟较大。
四、图表题(第一题6分,第二题9分,共15分)
1、(6分)下图是写操作流水化的硬件结构,试说明采用该技术的原因及其工作特点。
每个写操作过程分为两个阶段完成,第一阶段进行标识比较,并把标识和数据存入延迟写缓冲器中,第二阶段再进行写入,这两个阶段按流水方式工作。
这样,当前的写标识比较就可以和上一个写的数据写入并行起来,实现每个时钟周期完成一个写操作
2、(9分)下面是采用DLX浮点部件的Tomasulo算法执行过程中用到的状态表,试填写状态表中的相关空白。
假定:浮点流水线的延迟如下:加法2个时钟周期,乘法10个时钟周期,除法40个时钟周期。
给出SUBD 将要写结果时状态表的信息。
只填写相关部分空格。
指令状态表
五、计算题(第一题7分,第二题8分,共15分)
1.某RISC处理机各类指令使用频率和理想CPI(指令和数据访问Cache命中率为100%时的CPI)如下表所示。
而实际测得的指令访问Cache缺失率(miss rate)为5%,数据访问的Cache缺失率为10%,Cache的缺失损失(miss penalty)为40个时钟周期。
1)该机器在无Cache缺失(理想情况)时的CPI是多少?(3分)
1)CPI=43%X1+21%X2+12%X2+24%X2=1.57
2)对指令讲,指令Cache的访问占全部访问的100%/(100%+21%+12%)=75%
对数据来讲,数据Cache的访问占全部访问的(21%+12%)/(100%+21%+12%)=25%
非理想平均访存时间=命中时间+失效率X失效开销
=1.57+(75%X5%+25%X10%)X40=1.57+2.5=4.07
则:4.07/1.57=2.59=2.6 大约快2.6倍
2.在一台单流水线处理机上执行下面的程序。
每条指令都要经过“取指令”、“译码”、“执行”和“写结果”4个流水段,每个流水段的执行时间都是10ns。
采用基本的
DLX流水线,执行如下指令段:
1 SUB R0, R0 ;R0←0
2 LD R1, #4 ;R1←向量长度4
3 LOOP: LD R2, A(R1) ;R2←A向量的一个元素
4 MUL R2, R1 ;R2←(R2)×(R1)
5 ADD R0, R2 ;R0←(R0)+(R2)
6 BNEZ R1, LOOP ;R1←(R1)-1,若(R1)≠0 转向LOOP
7 SD (R3), R0 ;保存结果
采用“预测分支失败技术”。
画出指令流水线的时空图(中间部分可以省略,图
加速比S=22X40/25X10=3.52。