计算机系统结构复习题

参考书目：《计算机体系结构》，张晨曦等编著，高等教育出版社。

第一章：

基本概念：层次结构、计算机体系结构的概念、透明性、计算机组成和计算机实现技术、翻译和解释技术、系列机概念、兼容性、程序的局部性原理。

1.1 对于一台400MHz计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如表所示。

指令类型指令执行数量平均时钟周期数

整数45000 1

数据传送75000 2

浮点8000 4

分支1500 2

求该计算机的有效CPI、MIPS（即计算机每秒执行的百万条指令数）和程序执行时间。

1.2 假设在某程序的执行过程中,浮点操作时间占整个执行时间的10%,现希望对浮点操作加速,则

(1) 设对浮点操作的加速比为S f。画出程序总加速比S P和S f之间的关系曲线。

（2）程序的最大加速比可达多少？

1.3 计算机系统中有3个部件可以改进方法,这3个部件的部件加速比如下:

部件加速比1=30

部件加速比2=20

部件加速比3=10

(1)如果部件1和部件2的可改进比例均为30%,那么当部件3 可改进比例为多少时,系统加

速比才可以达到10?

(2)如果3个部件的可改进比例分别为30%、30%和20%,3个部件同时改进,那么系统中不可

加速部分的执行时间在总执行时间中占的比例是多少?

(3)如果相对某个测试程序3个部件的可改进比例分别为20%、20%和70%，要达到最好改进

效果，仅对一个部件改进时，要选择哪个部件？如果允许改进两个部件，又如何选择？

第二章：

基本概念：CISC计算机指令集、RISC计算机指令集、 DLX指令集。

2.1 指令集结构设计所涉及的内容有哪些?

2.2简述 CISC指令集结构功能设计的主要目标。从当前的计算机技术观点来看，CISC指令集结构的计算机有什么缺点？

2.3简述RISC指令集结构设计的原则。

2.4现有如下C语言源代码:

for(i=0;i<=100;i++)

{A[i]=B[i]+C;}

其中,A和B是两个32位整数的数组,C和i均是32位整数.假设所有数据的值及其地址均保存在存储器中,A和B的起始地址分别是0和5000,C和i的地址分别是1500和2000.在循环的两次迭代之间不将任何数保存在寄存器中.

(1)请写出该C语言源程序的DLX实现代码.

(2)该程序段共执行了多少条指令?

(3)程序对存储器中的数据访问了多少次？

(4)DLX代码的大小是多少?

2.5 参考习题2.4,现假设i的值和数组变量的地址在程序运行过程中,只要有可能就一直保存在寄存器中.

(1)请写出该C语言源程序的DLX实现代码.

(2)该程序段共执行了多少条指令?

(3)程序对存储器中的数据访问了多少次?

(4)DLX代码的大小是多少?

第三章：

基本概念：流水线、时空图、单功能流水线与多功能流水线、静态流水线和动态流水线、部件级、处理机级和处理机间流水、标量流水处理机和向量流水、线性流水线和非线性流水线、结构相关、数据相关、控制相关、写后读相关、写后写相关、读后写相关、 DLX的基本流水线。

3.1简述流水线技术的特点.

3.2请画出DLX基本流水线,并简述其工作原理.

3.3解决流水线结构相关的方法有哪些？

3.4降低流水线分支损失的方法有哪些？

3.5有一指令流水线如图3.5所示

入出

1 2 3 4

50ns 50ns 100ns 200ns

图3.5

求连续输入10条指令,该流水线的实际吞吐率和效率.

(1)该流水线的“瓶颈”在哪一段?请采取三种不同的措施消除此“瓶颈”.对于你所给出的

3种新的流水线,仍计算连续输入10条指令时,其实际吞吐率和效率.

3.6 流水线有m段,各段的处理时间分别是t i(i=1,2,…,m),现有n 个任务需要完成 ,且每个任务均需流水线各段实现,请计算:

(1)流水线完成这n个任务所需要的时间.

(2)和非流水实现相比,这n个任务流水实现的加速比是多少?加速比的峰值是多少?

3.7 在改进的DLX流水线上运行如下代码序列:

LOOP: LW R1,0(R2)

ADDI R1,R1,#1

SW 0(R2),R1

ADDI R2,R2,#4

SUB R4,R3,R2

BNZ R4,LOOP

其中, R3的初值是R2+396.假设:在整个代码序列的运行过程中,所有的存储器访问都是命中的,并且在一个时钟周期中对同一个寄存器的读操作和写操作可以通过寄存器文件“定向”.问:

(1)在没有任何其他定向(或旁路)硬件的支持下,请画出该指令序列执行的流水线时空图.

假充采用排空流水线的策略处理分支指令,且所有的存储器访问都可以命中Cache,那么执行上述循环需要多少个时钟周期?

(2)假设该DLX流水线有正常的定向路径,请画出该指令序列执行的流水线时空图.假设采

用预测分支失败的策略正理分支指令,且所有的存储器访问都可以命中Cache,那么执行上述循环需要多少个时钟周期?

(3)假设该DLX流水线有正常的定向路径和一个单周期延迟分支,请对该循环中的指令进行

高度,你可以重新组织指令的顺序,也可以修改指令的操作数,但是注意不能增加指令的条数.请画出该指令序列执行的流水线时空图,并计算执行上述循环所需要的时钟周期数.

3.8 假设各种分支指令数占所有指令数的百分比如表3.1所示.

条件分支20%(其中的60%是分支成功的)

跳转和调用5%

现有一深度为4的流水线(流水线有4段),无条件分支在第2个时钟周期结束时就被解析出来,而条件分支要到第3个时钟周期结束时才能够被解析出来.第一个流水段是完全独立于指令类型的,也即所有类型的指令都必须经过第一个流水段的处理.请问在没有任何控制相关的情况下,该流水线相对于存在上述控制相关情况下的加速比是多少?

第四章：

基本概念：存储层次、全相联映像、直接映像、组相联映像、替换算法、写直达法、写回法、按写分配法、不按写分配法、命中时间、失效率、强制性失效、容量失效、冲突失效、多体交叉存储器。

5.1 简述“Cache-主存”层次与“主存-辅存”层次的区别.

5.2地址映象方法有哪几种?它们各有什么优缺点?

5.3降低Cache失效率有哪几种方法?简述其基本思想.

5.4简述减小Cache失效开销的几种方法.

5.5 给定以下的假设,试计算直接映象Cache和两路组相联Cache的平均访问时间以及CPU 的性能.由计算结果能得出什么结论?

(1)理想Cache情况下的CPI为2.0,时钟周期为2ns,平均每条指令访存1.2次.

(2)两者Cache容量均为64KB,块大小都是32B.

(3)组相联Cache中的多路选择器使CPU的时钟周期增加了10%.

(4)这两种Cache的失效开销都是80ns

(5)命中时间为1个时钟周期

(6)64KB直接映象Cache的失效率为1.4%,64KB两路组相联Cache的失效率为1.0%.

5.6假设一台计算机具有以下特性:

(1)95%的访存在Cache中命中.

(2)块大小为两个字,且失效时整个块被调入

(3)CPU发出访存请求的速率为109Bps

(4)25%的访存为写访问

(5)存储器的最大流量为109Bps(包括读和写)

(6)主存每次只能读或写一个字

(7)在任何时候, Cache中有30%的块被修改过

(8)写失效时,Cache采用按写分配法.

现欲给该计算机增添一台外设,为此首先想知道主存的频带已用了多少.试对于以下两种情况计算主存频带的平均使用比例

(1)写直达Cache

(2)写回法Cache

第五章：

基本概念：基本概念：响应时间、数据传输速率、RAID、通道。

5.1 RAID有哪些分级,各有何特点?

5.2什么是通道?简述通道完成一次数据传输的主要过程.

5.3试比较三种通道的优缺及适用场合.

5.4假设一台计算机的I/O处理时间占10%,当其CPU性能改进为原来的100倍,而I/O性能仅改进为原来的两倍时,系统总体性能会有什么样的变化?

5.5假设磁盘空闲,这样没有排队延迟；公布的平均寻道时间是9ms,传输速度为4MBps,转速为7200RPM,控制器开销为1ms,那么读写一个512B的扇区的平均时间是多少?

第六章：

基本概念：集中式共享存储器、分布式共享存储器、互连网络、静态连接网络、动态连接网络。

6.1 什么是多处理机的一致性?给出解决一致性的监听协议和目录协议的工作原理,并画出他们各自的状态变迁图.

北邮高级计算机系统结构实验二三四五

实验二指令流水线相关性分析 ·实验目的通过使用WINDLX模拟器，对程序中的三种相关现象进行观察，并对使用专用通路，增加运算部件等技术对性能的影响进行考察，加深对流水线和RISC处理器的特点的理解。 ·实验原理：指令流水线中主要有结构相关、数据相关、控制相关。相关影响流水线性能。·实验步骤一．使用WinDLX模拟器，对做如下分析：（1）观察程序中出现的数据/控制/结构相关。指出程序中出现上述现象的指令组合。（2）考察增加浮点运算部件对性能的影响。（3）考察增加forward部件对性能的影响。（4）观察转移指令在转移成功和转移不成功时候的流水线开销。 ·实验过程一．使用WinDLX模拟器，对做如下分析： } 浮点加、乘、除部件都设置为1，浮点数运算部件的延时都设置为4，如图1：图1 初始设置将和加载至WinDLX中，如图2示。

图2 加载程序 1.观察程序中出现的数据/控制/结构相关；指出程序中出现上述现象的指令组合。 1）数据相关点击F7，使程序单步执行，当出现R-Stall时停止，运行过程中出现下图3所示，输入整数6。图3 输入整数6 @ 打开Clock Diagram，可以清楚的看到指令执行的流水线如图4所示。图4 指令流水线双击第一次出现R-Stall的指令行，如图5所示。

图5 指令详细信息对以上出现的情况分析如下：程序发生了数据相关，R-Stall（R-暂停）表示引起暂停的原因是RAW。 lbu r3,0×0(r2) 要在WB周期写回r3中的数据；而下一条指令 & seqi r5,r3,0×a 要在intEX周期中读取r3中的数据。上述过程发生了WR冲突，即写读相关。为了避免此类冲突， seq r5,r4,0×a的intEX指令延迟了一个周期进行。由此，相关指令为： 2）控制相关由图6可以看出，在第4时钟周期：第一条指令处于MEM段，第二条命令处于intEX段，第三条指令出于aborted状态，第四条命令处于IF段。图 6 指令流水线 }

计算机系统结构考试计算题

3.12 有一指令流水线如下所示（1）求连续输入10条指令，该流水线的实际吞吐率和效率；（2）该流水线的“瓶颈”在哪一段？请采取两种不同的措施消除此“瓶颈”。对于你所给出的两种新的流水线，连续输入10条指令时，其实际吞吐率和效率各是多少？解：（1） 2200(ns)2009200)10050(50t )1n (t T max m 1 i i pipeline =?++++=?-+?=∑= )(ns 220 1 T n T P 1pipeline -== 45.45%11 5 4400T P m t T P E m 1 i i ≈=? =?? =∑= （2）瓶颈在3、4段。 ? 变成八级流水线（细分） 850(ns)509850t 1)(n t T max m 1 i i pipeline =?+?=?-+?=∑= )(ns 85 1 T n T P 1pipeline -== 58.82%17 10 8400T P m ti T P E m 1 i ≈=? =?? =∑= ? 重复设置部件出 50ns 50ns 100ns 200ns

)(ns 85 1 T n T P 1pipeline -== 58.82%17 10885010400E ≈=??= 3.13 4段组成，3段时，一次，然4段。如果需要的时间都是，问：（1）当在流水线的输入端连续地每时间输入任务时，该流水线会发生什么情况？（2）此流水线的最大吞吐率为多少？如果每输入一个任务，连续处理 10个任务时的实际吞吐率和效率是多少？（3）当每段时间不变时，如何提高该流水线的吞吐率？仍连续处理10个任务时，其吞吐率提高多少？（2） t ?t ?2

计算机系统结构基本习题和答案

计算机系统结构基本习题和答案填空题 1、从（使用语言的）角度可以将系统看成是按（功能）划分的多个机器级组成的层次结构。 2、计算机系统结构的层次结构由高到低分别为（应用语言机器级，高级语言机器级，汇编语言机器级，操作系统机器级，传统机器语言机器级，微程序机器级）。 3、应用程序语言经（应用程序包）的（翻译）成高级语言程序。 4、高级语言程序经（编译程序）的（翻译）成汇编语言程序。 5、汇编语言程序经（汇编程序）的（翻译）成机器语言程序。 6、在操作系统机器级，一般用机器语言程序（解释）作业控制语句。 7、传统机器语言机器级，是用（微指令程序）来（解释）机器指令。 8、微指令由（硬件）直接执行。 9、在计算机系统结构的层次结构中，机器被定义为（能存储和执行相应语言程序的算法和数据结构）的集合体。 10、目前M0由（硬件）实现，M1用（微程序（固件））实现，M2到M5大多用（软件）实现。以（软件）为主实现的机器成为虚拟机。（虚拟机）不一定全用软件实现，有些操作也可用（固件或硬件）实现。 11、透明指的是（客观存在的事物或属性从某个角度看不到），它带来的好处是（简化某级的设计)，带来的不利是（无法控制）。 12、计算机系统结构也称（计算机体系结构），指的是（传统机器级的系统结构）。它是（软件和硬件/固件）的交界面，是机器语言汇编语言程序设计者或编译程序设计者看到的（机器物理系统）的抽象。 13、计算机组成指的是（计算机系统结构的逻辑实现），包括（机器级内的数据流和控制流）的组成逻辑设计等。计算机实现指的是（计算机组成的物理实现），它着眼于（器件）技术和（微组装）技术。 14、确定指令系统中是否要设乘法指令属于（计算机系统结构），乘法指令是用专门的高速乘法器实现还是用加法器实现属于（计算机组成），乘法器和加法-移位器的物理实现属于（计算机实现）。 15、主存容量与编址方式的确定属于（计算机系统结构），主存是否采用多体交叉属于（计算机组成），主存器件的选定属于（计算机实现）。 16、设计何种系列机属于（计算机系统结构），系列机内不同型号计算机的组织属于（计算机组成）。 17、是否采用通道方式输入输出的确定属于（计算机系统结构），通道采用结合型还是独立型属于（计算机组成）。 18、对PDP-11或VAX-11来说，单总线结构属于（计算机系统结构），其机器级的I/O连接和使用方式属于（计算机组成）。 19、由于计算机组成和计算机实现关系密切，有人称它们为（计算机实现），即计算机系统的（逻辑实现）和（物理实现）。 20、计算机系统结构可有（由上而下）、（由下而上）和（由中间开始）三种不同的设计思路。 21、“由中间开始”设计的“中间”是指（层次结构中的软硬交界面），目前多数是在（传统机器级）与（操作系统级）之间。 22、除了分布处理，MPP和机群系统外，并行处理计算机按其基本结构特征可分为（流水线计算机）、（阵列处理机）、（多处理机）、（数据流计算机）四种不同的结构。 23、费林按指令流和数据流的多倍性把计算机系统分类，这里的多倍性指（系统瓶颈部件上

计算机体系结构实验报告二

实验二结构相关一、实验目得: 通过本实验,加深对结构相关得理解,了解结构相关对CPU性能得影响。二、实验内容: 1、用WinDLX模拟器运行程序structure_d、s 。 2、通过模拟,找出存在结构相关得指令对以及导致结构相关得部件。 3、记录由结构相关引起得暂停时钟周期数,计算暂停时钟周期数占总执行周期数得百分比。 4、论述结构相关对CPU性能得影响,讨论解决结构相关得方法。三、实验程序structure_d、s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; < A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit < this is a ment !! A: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 四、实验过程打开软件,load structure_d、s文件,进行单步运行。经过分析,此程序一次循环中共有五次结构相关。(Rstall 数据相关Stall 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面得数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关得部件:译码部件。

计算机系统结构试卷B

《计算机系统结构B卷》一、填空题（每小题1.5分，共30分）。 1．对系列机而言，必须保证做到软件，力争做到软件向上兼容。 2．由软件实现的计算机称之为。 3. 多处理机系统按组织形式分有三种，功能分布是多处理机系统分工方式。 4．依据从哪一层开始设计，计算机体系结构设计的主要方法有三种，占据主导地位的是设计。 5. 在先行控制方式实现流水线的处理器中，有先行指令、先行操作、先行读数和后行写数等四个缓冲栈，缓冲深度最大的是。 6.按流水线的功能多寡分，可分为单功能流水线和。 7. 用于表示非线性流水线中的任务对未进入流水线的后继任务流入流水线的时间间隔的约束称为。 8.中断转移相关处理的基本方法包括不精确断点法和。 9. 互连网络中任意两个结点之间距离的最大值称为。 10．在多级交叉开关互联网络中，交叉开关的控制方式有、组控制和单元控制。 11. 在多计算机系统的互连网络中，通信模式包括、选播、广播和会议等四种。 12. 描述网络寻径效率常用的两个参数是通道流量和。 13．自定义数据表示包括标志符和两种数据表示。 14. 浮点数尾数基值越大，浮点数表示的数据范围。 15. 根据运算类型指令操作数存储方法不同，指令集结构可分为堆栈型、累加器型和。 16. 标量处理机是否高度并行是以指令级并行度（ILP）为来区分。 17．存储系统的基本存储层次有、主存储器和辅助存储器。 18. 采用并行存储器的目的是。 19. 从时间开销来看，伪命中的时间正常命中的时间。 20. 增加Cache存储系统的相联度，可降低Cache的不命中率，但会增加Cache 的。

二、简答题(每小题6分，共30分)。 1．多计算机系统和多处理机系统的差别有哪几方面？其中最根本的差别是哪个方面？ 2. 什么是流水线相关？流水线相关可分为哪几大类？ 3. 什么是动态互连网络？动态互连网络的互联形式有哪几种？ 4. 指令系统设计包括哪两个方面？指令格式优化设计的目的是什么？ 5. 维护Cache与主存一致性的更新算法有哪些? 三、分析题(第一小题8分，第二小题12分，共20分)。 1．某种处理机10条指令的使用频度分别为：0.25，0.20，0.15，0.10，0.08，0.08，0.05，0.04 ，0.03 ，0.02，试画出该处理机进行Huffman编码时的一棵Huffman树。 2. 在某采用全相联映象、相联目录表实现地址变换Cache存储器中，Cache 的容量是8KB，主存是由4个存储体组成的低位交叉访问存储器，主存总容量是32MB，每一个存储体的字长是32位，。（1）写出主存地址和Cache地址的格式，并标出各字段的长度。（2）说明目录表的行数、相联比较的位数和目录表的宽度。四、计算题(第一小题8分，第二小题12分，共20分)。 1. 设16个处理器编号分别为0、1、……、15，用单级互连网络连接，当互连函数分别为：（1）Cube3、（2）PM+3、（3）Shuffle（Shuffle）时，第13号处理器分别与哪一个处理器相连? 2. 有一条5个功能段的线性动态多功能流水线如图所示，其中1→2→3→5功能段组成加法流水线，1→4→5功能段组成乘法流水线，设每个功能段的延迟时间均相等为△t。用这条流水线计算F=4 1() i i i a b = + ∏，画出流水线时空图，并计算流水线的实际吞吐率、加速比和效率。 Z

2010年4月自考计算机系统结构试题及答案

全国2010年4月自学考试计算机系统结构试题课程代码：02325 一、单项选择题(本大题共10小题，每小题1分,共10分) 在每小题列出的四个备选项中只有一个是符合题目要求的，请将其代码填写在题后的括号内。错选、多选或未选均不得分。 1．在计算机系统结构设计中，提高软件功能实现的比例可( ) A．提高解题速度B．减少需要的存储器容量 C．提高系统的灵活性D．提高系统的性能价格比 2．浮点数表示的尾数的基r m=16，尾数长度p=8，可表示的规格化最大正尾数的值是( ) A．1／256 B．1／2 C．15／16 D．255／256 3．下列数据存储空间为隐含寻址方式的是( ) A．CPU中的通用寄存器B．主存储器 C．I／O接口中的寄存器D．堆栈 4．当计算机系统执行通道程序完成输入输出工作时，执行通道程序的是( ) A．CPU B．通道 C．CPU和通道D．指定的外设 5．下列有关中断的叙述正确的是( ) A．中断响应的次序是由硬件决定的B．中断处理的次序是由硬件决定的 C．中断处理的次序是不可改的D．中断响应的次序是可灵活改变的 6．与虚拟存储器的等效访问速度无关．．的是( ) A．访存页地址流B．页面替换算法 C．主存的容量D．辅存的容量 7．非线性流水线的特征是( ) A．一次运算中使用流水线中的多个功能段 B．一次运算中多次使用流水线中的某些功能段 C．流水线中某些功能段在各次运算中的作用不同 D．流水线的各功能段在不同的运算中可以有不同的连接 8．属于集中式共享存储器结构的SIMD计算机是( ) A．ILLIAC IV B．BSP C．CM-2 D．MP-1 1

(完整版)计算机系统结构试题及答案

计算机系统结构复习题单选及填空：计算机系统设计的主要方法 1、由上往下的设计（top-down） 2、由下往上的设计（bottom-up） 3、从中间开始（middle-out） Flynn分类法把计算机系统的结构分为以下四类：（1）单指令流单数据流（2）单指令流多数据流（3）多指令流单数据流 (4) 多指令流多数据流堆栈型机器：CPU 中存储操作数的单元是堆栈的机器。累加器型机器：CPU 中存储操作数的单元是累加器的机器。通用寄存器型机器：CPU 中存储操作数的单元是通用寄存器的机器。名词解释：虚拟机：用软件实现的机器叫做虚拟机，但虚拟机不一定完全由软件实现，有些操作可以由硬件或固件（固件是指具有软件功能的固件）实现。系列机：由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。兼容机：它是指由不同公司厂家生产的具有相同系统结构的计算机。流水线技术：将一个重复的时序过程，分解成为若干个子过程，而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。单功能流水线：指流水线的各段之间的连接固定不变、只能完成一种固定功能的流水线。多功能流水线：指各段可以进行不同的连接，以实现不同的功能的流水线。顺序流水线：流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。乱序流水线：流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同，允许后进入流水线的任务先完成。这种流水线又称为无序流水线、错序流水线、异步流水线。吞吐率：在单位时间内流水线所完成的任务数量或输出结果的数量。指令的动态调度：

是指在保持数据流和异常行为的情况下，通过硬件对指令执行顺序进行重新安排，以提高流水线的利用率且减少停顿现象。是由硬件在程序实际运行时实施的。指令的静态调度：是指依靠编译器对代码进行静态调度，以减少相关和冲突。它不是在程序执行的过程中、而是在编译期间进行代码调度和优化的。超标量：一种多指令流出技术。它在每个时钟周期流出的指令条数不固定，依代码的具体情况而定，但有个上限。超流水：在一个时钟周期内分时流出多条指令。多级存储层次：采用不同的技术实现的存储器，处在离CPU不同距离的层次上，各存储器之间一般满足包容关系，即任何一层存储器中的内容都是其下一层（离CPU更远的一层）存储器中内容的子集。目标是达到离CPU最近的存储器的速度，最远的存储器的容量。写直达法：在执行写操作时，不仅把信息写入Cache中相应的块，而且也写入下一级存储器中相应的块。写回法：只把信息写入Cache中相应块，该块只有被替换时，才被写回主存。集中式共享多处理机：也称为对称式共享存储器多处理SMP。它一般由几十个处理器构成，各处理器共享一个集中式的物理存储器，这个主存相对于各处理器的关系是对称的，分布式共享多处理机：它的共享存储器分布在各台处理机中，每台处理机都带有自己的本地存储器，组成一个“处理机-存储器”单元。但是这些分布在各台处理机中的实际存储器又合在一起统一编址，在逻辑上组成一个共享存储器。这些处理机存储器单元通过互连网络连接在一起，每台处理机除了能访问本地存储器外，还能通过互连网络直接访问在其他处理机存储器单元中的“远程存储器”。多Cache一致性：多处理机中，当共享数据进入Cache，就可能出现多个处理器的Cache中都有同一存储器块的副本，要保证多个副本数据是一致的。写作废协议：在处理器对某个数据项进行写入之前，它拥有对该数据项的唯一的访问权。写更新协议：当一个处理器对某数据项进行写入时，它把该新数据广播给所有其它Cache。这些Cache用该新数据对其中的副本进行更新。机群：是一种价格低廉、易于构建、可扩放性极强的并行计算机系统。它由多台同构或异构

计算机系统结构期末考试题目

第一章： 1.计算机系统结构的定义答：由程序设计者看到的一个计算机系统的属性，即概念性结构和功能特性。 2.透明性概念答：在计算机技术中，一种本来是存在的事物或属性，但从某种角度看似乎不存在，称为透明性现象。 3.兼容性向后兼容兼容性：同一个软件可以不加修改地运行于系统结构相同的各档机器，可获得相同的结果，差别只在于不同的运行时间。向后兼容：按某个时期投入市场的某种型号机器编制的程序，不加修改就能运行于在它之后投入市场的机器。 4.Amdahl定律答：系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。 5.CPI 答：每条指令的平均时钟周期数。 6.MIPS 答：每秒百万条指令数！MIPS=时钟频率/(CPI*10^6) 7.MFLOPS 答：每秒百万次浮点操作次数。MFLOPS=程序中的浮点操作次数/(执行时间*10^6) 8.命中率的概念答： 9.Flynn分类法是按指令流和数据流的多倍性特征进行计算机系统结构的划分答：①单指令流单数据流SISD ②单指令流多数据流SIMD ③多指令流单数据流MISD （实际不存在）④多指令流多数据流MIMD 10.计算机系统设计的定量原理（四个）答：①加快经常性事件的速度②Amdahl定律③CPU性能公式④访问的局部性原理11.CPI和加速比的计算答：CPI=CPU时钟周期数/IC CPU时间=CPU时钟周期数/频率 CPU时间=CPU时钟周期*时钟周期长加速比=（采用改进措施后的性能）/（没有采用改进措施前的性能） =(没有采用改进措施前执行某任务的时间)/(采用改进措施后执行某任务的时间) 12.软硬件实现的特点硬件实现：速度快、成本高；灵活性差、占用内存少软件实现：速度低、复制费用低；灵活性好、占用内存多 13.系统评价的标准 ①运算速度②存储器系统③其他性能④成本标准

计算机系统结构考试题库及答案

计算机系统结构试题及答案一、选择题（50分，每题2分，正确答案可能不只一个，可单选或复选） 1.（CPU周期、机器周期）是内存读取一条指令字的最短时间。 2.（多线程、多核）技术体现了计算机并行处理中的空间并行。 3.（冯?诺伊曼、存储程序）体系结构的计算机把程序及其操作数据一同存储在存储器里。 4.（计算机体系结构）是机器语言程序员所看到的传统机器级所具有的属性，其实质是确定计算机系统中软硬件的界面。 5.（控制器）的基本任务是按照程序所排的指令序列，从存储器取出指令操作码到控制器中，对指令操作码译码分析，执行指令操作。 6.（流水线）技术体现了计算机并行处理中的时间并行。 7.（数据流）是执行周期中从内存流向运算器的信息流。 8.（指令周期）是取出并执行一条指令的时间。 9.1958年开始出现的第二代计算机，使用（晶体管）作为电子器件。 10.1960年代中期开始出现的第三代计算机，使用（小规模集成电路、中规模集成电路）作为电子器件。 11.1970年代开始出现的第四代计算机，使用（大规模集成电路、超大规模集成电路）作为电子器件。 12.Cache存储器在产生替换时，可以采用以下替换算法：（LFU算法、 LRU算法、随机替换）。

13.Cache的功能由（硬件）实现，因而对程序员是透明的。 14.Cache是介于CPU和（主存、内存）之间的小容量存储器，能高速地向CPU提供指令和数据，从而加快程序的执行速度。 15.Cache由高速的（SRAM）组成。 16.CPU的基本功能包括（程序控制、操作控制、时间控制、数据加工）。 17.CPU的控制方式通常分为：（同步控制方式、异步控制方式、联合控制方式）反映了时序信号的定时方式。 18.CPU的联合控制方式的设计思想是：（在功能部件内部采用同步控制方式、在功能部件之间采用异步控制方式、在硬件实现允许的情况下，尽可能多地采用异步控制方式）。 19.CPU的同步控制方式有时又称为（固定时序控制方式、无应答控制方式）。 20.CPU的异步控制方式有时又称为（可变时序控制方式、应答控制方式）。 21.EPROM是指（光擦可编程只读存储器）。 22.MOS半导体存储器中，（DRAM）可大幅度提高集成度，但由于（刷新）操作，外围电路复杂，速度慢。 23.MOS半导体存储器中，（SRAM）的外围电路简单，速度（快），但其使用的器件多，集成度不高。 24.RISC的几个要素是（一个有限的简单的指令集、CPU配备大量的通用寄存器、强调对指令流水线的优化）。

系统结构期末考试试题及答案

得分评分人填空题: （20分，每题2 分）单选题：（10分，每题1分） A.任何虚页都可装入主存中任何实页的位置 B. 一个虚页只装进固定的主存实页位置《计算机系统结构》期末考试试卷（A ）得分注：1、共100分，考试时间120分钟。 2、此试卷适用于计算机科学与技术本科专业。 1、."启动I/O"指令是主要的输入输出指令，是属于（ A. 目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、输入输出系统硬件的功能对（B ）是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、全相联地址映象是指（A ） C. 组之间固定，组内任何虚页可装入任何实页位置 D.组间可任意装入，组内是固定装入 4、（ C ）属于MIMD 系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D. 阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关，则（ B ） A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、计算机使用的语言是（B ） A.专属软件范畴，与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D. 属于符号化的机器指令 7、指令执行结果出现异常引起的中断是（ C ） A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 &块冲突概率最高的 Cache 地址映象方式是（A ） A.直接 B .组相联 C .段相联 D .全相联 9、组相联映象、LRU 替换的Cache 存储器，不影响 Cache 命中率的是（B ） A.增大块的大小 B .增大主存容量 C .增大组的大小 D .增加Cache 中的块数 10、流水处理机对全局性相关的处理不包括（C ） A.猜测法 B.提前形成条件码 C.加快短循环程序的执行 D.设置相关专用通路

北邮计算机系统结构实验报告-实验一到五-WINDLX模拟器

北京邮电大学实验报告课程名称计算机系统结构计算机学院03班王陈(11)

目录实验一WINDLX模拟器安装及使用......................................... 错误!未定义书签。 ·实验准备................................................................................ 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验内容及要求.................................................................... 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验二指令流水线相关性分析 ............................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验三DLX处理器程序设计 .................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 A.向量加法代码及性能分析 ................................................... 错误!未定义书签。 B.双精度浮点加法求和代码及结果分析 .............................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验四代码优化 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结+实习体会........................................................... 错误!未定义书签。实验五循环展开 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。矩阵乘程序代码清单及注释说明........................................... 错误!未定义书签。相关性分析结果........................................................................... 错误!未定义书签。增加浮点运算部件对性能的影响........................................... 错误!未定义书签。增加forward部件对性能的影响 ............................................ 错误!未定义书签。转移指令在转移成功和转移不成功时候的流水线开销 .. 错误!未定义书签。 ·实验总结+实习体会+课程建议......................................... 错误!未定义书签。

计算机系统结构期末考试试题及其答案

《计算机系统结构》期末考试试卷A 卷第 2 页共 24 页计算机科学系《计算机系统结构》期末考试试卷（A 卷） 2、此试卷适用于计算机科学与技术本科专业。一单选题：(10分，每题1分) 1、 ."启动I/O"指令是主要的输入输出指令，是属于（ B ） A.目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、输入输出系统硬件的功能对(B )是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、全相联地址映象是指（A ） A.任何虚页都可装入主存中任何实页的位置 B.一个虚页只装进固定的主存实页位置 C.组之间固定，组内任何虚页可装入任何实页位

置 D.组间可任意装入，组内是固定装入 4、( C ) 属于MIMD系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D.阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关，则（B ） A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、计算机使用的语言是（B） A.专属软件范畴，与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D.属于符号化的机器指令 7、指令执行结果出现异常引起的中断是（C ） A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断《计算机系统结构》期末考试试卷A卷第 3 页共 24 页

计算机系统结构实验报告

计算机系统结构实验报告一．流水线中的相关实验目的： 1. 熟练掌握WinDLX模拟器的操作和使用，熟悉DLX指令集结构及其特点； 2. 加深对计算机流水线基本概念的理解； 3. 进一步了解DLX基本流水线各段的功能以及基本操作； 4. 加深对数据相关、结构相关的理解，了解这两类相关对CPU性能的影响； 5. 了解解决数据相关的方法，掌握如何使用定向技术来减少数据相关带来的暂停。实验平台： WinDLX模拟器实验内容和步骤： 1.用WinDLX模拟器执行下列三个程序：求阶乘程序fact.s 求最大公倍数程序gcm.s 求素数程序prim.s 分别以步进、连续、设置断点的方式运行程序，观察程序在流水线中的执行情况，观察 CPU中寄存器和存储器的内容。熟练掌握WinDLX的操作和使用。 2. 用WinDLX运行程序structure_d.s，通过模拟找出存在资源相关的指令对以及导致资源相关的部件；记录由资源相关引起的暂停时钟周期数，计算暂停时钟周期数占总执行周期数的百分比；论述资源相关对CPU性能的影响，讨论解决资源相关的方法。 3. 在不采用定向技术的情况下（去掉Configuration菜单中Enable Forwarding选项前的勾选符），用WinDLX运行程序data_d.s。记录数据相关引起的暂停时钟周期数以及程序执行的总时钟周期数，计算暂停时钟周期数占总执行周期数的百分比。在采用定向技术的情况下（勾选Enable Forwarding），用WinDLX再次运行程序data_d.s。重复上述3中的工作，并计算采用定向技术后性能提高的倍数。 1. 求阶乘程序用WinDLX模拟器执行求阶乘程序fact.s。这个程序说明浮点指令的使用。该程序从标准输入读入一个整数，求其阶乘，然后将结果输出。该程序中调用了input.s中的输入子程序，这个子程序用于读入正整数。实验结果：在载入fact.s和input.s之后，不设置任何断点运行。 a.不采用重新定向技术，我们得到的结果

计算机系统结构考试计算题

有一指令流水线如下所示入 1 2 3 4 出 50ns 50ns 100ns 200ns （1）求连续输入10条指令，该流水线的实际吞吐率和效率；（2）该流水线的“瓶颈”在哪一段请采取两种不同的措施消除此“瓶颈”。对于你所给出的两种新的流水线，连续输入10条指令时，其实际吞吐率和效率各是多少解：（1） 2200(ns) 2009200)10050(50t )1n (t T max m 1 i i pipeline =?++++=?-+?=∑= )(ns 220 1T n TP 1pipeline -== 45.45%11 5 4400TP m t TP E m 1 i i ≈=? =?? =∑= （2）瓶颈在3、4段。变成八级流水线（细分） 850(ns) 509850t 1)(n t T max m 1 i i pipeline =?+?=?-+?=∑= )(ns 85 1 T n TP 1pipeline -== 58.82%17 10 8400TP m ti TP E m 1 i ≈=? =?? =∑= 重复设置部件 1 2 3_1 3_2 4_1 4_4 入出

)(ns 851T n TP 1pipeline -== 58.82%17 10 8 85010400E ≈=??= 有一 4段组成，其3段时，总次，然后流到第4段。如果需要的时间都是t ?，问：（1）当在流水线的输入端连续地每t ?时间输入任务时，该流水线会发生什么情况（2）此流水线的最大吞吐率为多少如果每t ?2输入一个任务，连续处理 10个任务时的实际吞吐率和效率是多少（3）当每段时间不变时，如何提高该流水线的吞吐率仍连续处理10个任务时，其吞吐率提高多少（2）

计算机体系结构实验报告二

实验二结构相关一、实验目的：通过本实验，加深对结构相关的理解，了解结构相关对CPU性能的影响。二、实验内容： 1. 用WinDLX模拟器运行程序structure_d.s 。 2. 通过模拟，找出存在结构相关的指令对以及导致结构相关的部件。 3. 记录由结构相关引起的暂停时钟周期数，计算暂停时钟周期数占总执行周期数的百分比。 4. 论述结构相关对CPU性能的影响，讨论解决结构相关的方法。三、实验程序structure_d.s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ；浮点运算，两个周期，结构相关 ADDD F2, F0, F2 ; <- A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ；条件跳转 TRAP #0 ;; Exit <- this is a comment !! A: .double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: .double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10

四、实验过程打开软件，load structure_d.s文件，进行单步运行。经过分析，此程序一次循环中共有五次结构相关。（R-stall 数据相关Stall- 结构相关） 1)第一个结构相关：addd f2,,f0,f2 由于前面的数据相关，导致上一条指令addd f0,f0,f4暂停在ID阶段，所以下一条指令addd f2,,f0,f2发生结构相关，导致相关的部件：译码部件。 2)第二个结构相关：ADDI R2, R2, #8，与第一个结构相关类似。由于数据相关，上一条指令暂停在ID阶段，所以导致下一条指令发生结构相关。

专升本《计算机系统结构》_试卷_答案,DOC

专升本《计算机系统结构》一、（共75题,共150分） 1. 最早的冯·诺依曼(von Neumann)结构计算机是以（）为中心的。（2分） A.运算器 B.控制器 C.存储器 D.I/O设备 .标准答案：A 2. 同构型多处理机和异构型多处理机所采用的提高并行性的技术途径分别是（）（2分） A.资源共享、资源重复 B.资源重复、资源共享 C.资源共享、时间重叠 D.资源重复、时间重叠 .标准答案：D 3. 由同一厂家生产的、系统结构相同的，但组成和实现不同的所有计算机，称为（）（2分） A.兼容机 B.扩展机 C.系列机 D.系统机 .标准答案：C 4. 从计算机系统中处理数据的并行性看，并行性等级从低到高分为（）（2分） A.位串字串、位并字串、位串字并、全并行 B.位并字串、全并行、位串字串、位串字并 C.全并行、位并字串、位串字串、位串字并 D.位串字串、位串字并、位并字串、全并行 .标准答案：A 5. 扩展编码要求（），否则会产生解码不唯一的问题。（2分） A.所有的短码都必须是长码的前缀 B.所有的短码都不能是长码的前缀 C.所有的短码都必须是长码的后缀 D.所有的短码都不能是长码的后缀 .标准答案：B 6. 下面的指令中，（）不属于RISC处理器指令集。（2分） A.ADD R4，[1000] B.LD R3，(R4) C.SUB R4，R3 D.SD 0(R3)，R4 .标准答案：A 7. 指令的重叠解释方式与顺序解释方式相比，可以提高（）指令的执行速度。（2分） A.一条 B.两条 C.两条以上 D.两条或两条以上 .标准答案：D 8. 虚拟存储器外部地址变换，实现的是虚地址到（）的变换。（2分） A.辅存物理地址 B.主存地址 C.Cache地址 D.虚地址 .标准答案：A 9. 设主存和辅存的平均访问时间分别为秒和秒，若要使虚拟存储器的主存-辅存层平均时间达到，问至少应保证主存访问命中率为（）（2分） A.0.97 B.0.98 C.0.99 D.1 .标准答案：C 10. 替换算法要解决的问题是（）（2分） A.用户的虚页如何与主存的实页对应 B.如何用主存的实页号替代多用户的虚页号 C.当页面失效时，选择主存中哪个页作为被替换页 D.新用户要进入主存，选择哪个用户作为被替换的用户 .标准答案：C 11. RISC执行程序的速度比CISC要快的原因是（）（2分） A.RISC的指令系统中指令条数较少 B.程序在RISC上编译生成的目标程序较短 C.RISC的指令平均执行周期数较少 D.RISC只允许load和store指令访存 .标准答案：C 12. 输入输出系统硬件的功能对（）是透明的。（2分） A.操作系统程序员 B.编译程序员 C.应用程序员 D.系统结构设计师 .标准答案：C 13. 在由多个通道组成的I/O系统中，I/O的最大流量是（）（2分） A.各通道最大流量的最大值 B.各通道最大流量之和 C.各通道实际流量的最大值 D.各通道实际流量之和 .标准答案：B 14. 通道方式输入输出系统中，对优先级高的磁盘等高速设备，适合于连接( ) （2分） A.字节多路通道 B.选择通道 C.数组多路通道 D.字节及数组多路通道 .标准答案：B