计算机系统结构试卷

《计算机系统结构》试题（A）

（计02级本科2005年1月）

班别______ _______姓名_____________学号______ ________总分_____________

一、（20分）选择题：

1、在计算机系统结构来看，机器语言程序员看到的机器属性是（ C ）。

A)计算机软件所要完成的功能B)计算机硬件的全部组成

C)编程要用到的硬件知识D)计算机各部件的硬件实现

2、对汇编语言程序员透明的是（A ）。

A)I/O方式中的DMA访问方式B)浮点运算

C)程序性中断D)存取操作数

3、用循环表示PM2-1的互连函数，应该是（A）。

A)（6 4 2 0）（7 5 3 1）B)（0 2 4 6）（1 3 5 7）

C)（0 1 2 3 4 5 6 7）D)（7 6 5 4 3 2 1 0）

4、在提高CPU性能的问题上，从系统结构角度，可以（C）。P10

A)提高时钟频率B)减少程序指令条数

C)减少每条指令的时钟周期数D)减少程序指令条数和减少每条指令的时钟周期数

5、能实现指令、程序、任务级并行的计算机系统属于（D）。

A)SISD B)SIMD C)MISD D)MIMD

6、计算机系统结构不包括（A ）。P4

A)主存速度B)机器工作状态C)信息保护D)数据表示

7、"一次重叠"中消除"指令相关"最好的方法是(A)。

A)不准修改指令B)设相关专用通路C)推后分析下条指令D)推后执行下条指令

8、重叠寄存器技术主要用于解决在RISC系统中因（ B ）而导致的问题。P121

A)JMP指令影响流水线B)CALL指令的现场保护

C)只有LOAD和STORE指令带来的访问存储器不便D)存储器访问速度

10、推出系列机的新机器，不能更改的是（A ）。

A)原有指令的寻址方式和操作码B)系统的总线的组成

C)数据通路宽度D)存储芯片的集成度

11、在流水机器中，全局性相关是指（D）。

A)先写后读相关B)先读后写相关C)指令相关D)由转移指令引起的相关

12、下列说法不正确的是（D）。

A)线性流水线是单功能流水线B)动态流水线是多功能流水线

C)静态流水线是多功能流水线D)动态流水线只能是单功能流水线

13、结构不对称的静态互联网络是是（A）。

A)线性阵列B)环网C)立方体网络D)全连接网络

14、在系统结构设计中，提高软件功能实现的比例会（C）。

A)提高解题速度B)减少需要的存储容量C)提高系统的灵活性D)提高系统的性能价格比

15、多处理机主要实现的是（B）。P500

A)指令级并行B)任务级并行C)操作级并行D)操作步骤的并行

16、虫蚀寻径以流水方式在各寻径器是顺序传送的是（C）。

A)消息B)包C)片D)字节

17、BSP计算机的并行处理机有16个处理单元，并行存储器的存储体个数为（D）。P463

A)16 B)1 C)32D)17

20、ILLIAC Ⅳ是一种（C）。

A)流水线处理机B)指令重叠处理机C)阵列处理机D)多处理机

二、（10分）判断题：

1、对计算机系统中经常使用的基本单元功能，宜于用软件来实现，这样可降低系统的成本。( F )

2、由于RISC简化了指令系统，因此，RISC上的目标程序比CISC上的目标程序要短一些，程序执行的时间就会少一些。（F）

3、流水线调度是看如何调度各任务进入流水线的时间，使单功能线性流水线有高的吞吐率和效率。（ T）

4、无论采用什么方法，只要消除流水线的瓶颈段，就能提高流水线的吞吐率和效率。( F)

5、在满足Cache与主存的一致性方面，写回比写直达法好。（F）

6、在多处理机上，各个任务的执行时间不同时，在个处理机总的运行时间均衡的前提下，取不均匀分配，让各处理机所分配的任务数要么尽量的多，要么尽量的少，这样，才可使总的运行时间减少。（F）

7、Cache组相联映象的块冲突概率比直接映象的高。（F）

8、要使线性流水线的实际吞吐率接近于理想的最大吞吐率，应将子过程数分得越多越好。（F）

9、在系列机内可以将单总线改为双总线，以减少公共总线的使用冲突。( F )

10、0-15共16个处理单元用Cube2单级互连网络互连，第10号处理单元将连到第8号处理单元。（F）

三、（10分）如果某计算机系统有3个部件可以改进，则这三个部件经改进后的加速比分别为：S1=30，S2=20，S3=10。

（1）如果部件1和部件2改进前的执行时间占整个系统执行时间的比例都为30%，那么，部件3改进前的执行时间占整个系统执行时间的比例为多少，才能使3个部件都改进后的整

个系统的加速比Sn达到10？

（2）如果3个部件改进前执行时间占整个系统执行时间的比例分别为30%、30%和20%，那么，3个部件都改进后系统的加速比是多少？未改进部件执行时间在改进后的系统执行时间中占的比例是多少？

四、（10分）一台模型机共有7条指令，各指令的使用频率分别为35%，25%，20%，10%，5%，3%和2%，有8个通用数据寄存器，2个变址寄存器。

（1）要求操作码的平均长度最短，请设计操作码的编码，并计算所设计操作码的平均长度。（2）设计8字长的寄存器-寄存器型指令3条，16位字长的寄存器-存储器型变址寻址方式指令4条，变址范围不小于±127。请设计指令格式，并给出各字段的长度和操作码的编码。

解：（1）要使得到的操作码长度最短，应采用Huffman 编码，构造Huffman树如下：

这样，采用Huffman编码法得到的操作码的平均长度为：

H = 2×(0.35+0.25+0.20) + 3×0.10 + 4 ×0.05+ 5×(0.03 + 0.02) =1.6+0.3+0.2+0.25

=2.35

五、（10分）在页式虚拟存储器中，一个程序由P1～P6共6个页面组成，系统分配给这个程序的主存只有4个页面。在程序开始执行之前，P1至P4已经装入主存。程序执行过程中依次访问到的页面如下：P1，P2，P3，P4，P5，P3，P6，P5，P2，P1，P5，P2，P4，P1。采用LRU页面替换算法对这4页主存进行调度。

(1)画出主存页面替换和命中的情况表。

(2)计算两种页面替换算法的页命中率。

(3)假设每个数据平均被访问10次，采用LRU页面替换算法，为了使页面失效率小于10-5，计算页面大小至少应该为多少？

六、（10分）有一个4段流水线，如下图所示：

其中，段S1和S3的执行时间均为200ns,段S2和S4的执行时间均为100ns。

（1）分别使用公式和时空图求连续流入4条指令的实际吞吐率和效率。

（2）若瓶颈段S1可使用细分方法改造，瓶颈段S3可使用并联方法改造，对改造后的流水线，分别使用公式和时空图求连续流入4条指令的实际吞吐率和效率

七、（10分）设向量长度均为64，在CRAY-1机上所用浮点功能部件的执行时间分别为：相加6拍，相乘7拍，求倒数近似值14拍；从存储器读数6拍，打入寄存器及启动功能部件各1拍，问下列各指令组，组内的哪些指令可以链接？哪些指令不可链接？不能链接的原因是什么：分别计算出各指令组全部完成所需要的拍数。

(1) V0←存储器(2) V2←V0*V1 (3) V0←存储器(4) V0←存储器

V1←V2+V3 V3←存储器V2←V0*V1 V1←1/V0

V4←V5*V6 V4←V2+V3 V3←V2+V0 V3←V1*V2

V5←V3+V4 V5←V3+V4

八、（10分）假定有128个处理器,采用PM2I多级网络互连,若网络中的i=2的1级损坏,拟用Cubei多级网络代替损坏的这一级,试说明最多需要几级Cubei网络?5

九、（10分）A和B都是元素为浮点表示的64×64的二维数组，一次浮点加法的计算过程可由取数、求阶差、对阶、尾数加、规格化和存数共6个段组成，若每个段的执行时间均为Δt，请分别求出在下列结构不同的处理机上完成C=A+B所需的时间及相对于顺序处理的加速比。

（1）顺序处理方式的处理机。

（2）具有浮点加法流水线的流水线处理机，且浮点加法流水线分为6个段，各段执行时间均为Δt。

（3）8×8的阵列处理机，且处理阵列上和每个处理器只能顺序处理浮点加运算。

（4）8×8的阵列处理机，且处理阵列上和每个处理器均能流水处理浮点加运算。

（5）64×64的阵列处理机，且处理阵列上和每个处理器均能流水处理浮点加运算。

计算机系统结构题库

《计算机系统结构》题库一．单项选择题（在下列每小题的四个备选答案中，只有一个答案是正确的，请把你认为是正确的答案填入题后的（）内，每小题2分）第一章： 1.计算机系统多级层次中，从下层到上层，各级相对顺序正确的应当是： A.汇编语言机器级---操作系统机器级---高级语言机器级 B.微程序机器级---传统机器语言机器级---汇编语言机器级 C.传统机器语言机器级---高级机器语言机器级---汇编语言机器级 D.汇编语言机器级---应用语言机器级---高级语言机器级答案：B 分数：2 所属章节1—1 2.汇编语言源程序变成机器语言目标程序是经来实现的。 A. 编译程序解释 B. 汇编程序解释 C. 编译程序翻译 D. 汇编程序翻译答案：D 分数：2 所属章节1—1 3.直接执行微指令的是： A. 汇编程序 B. 编译程序 C. 硬件 D. 微指令程序答案：C 分数：2 所属章节1—1 4.对系统程序员不透明的是： A. Cache存储器 B. 系列机各档不同的数据通路宽度 C. 指令缓冲寄存器 D. 虚拟存储器答案：D 分数：2 所属章节1—2 5.对应用程序员不透明的是： A. 先行进位链 B. 乘法器 C. 指令缓冲器 D. 条件码寄存器答案：D 分数：2 所属章节1—2 6.对机器语言程序员透明的是： A. 中断字 B. 主存地址寄存器 C. 通用寄存器 D. 条件码答案：B 分数：2 所属章节1—2 7.计算机系统结构不包括： A. 主存速度 B. 机器工作状态 C. 信息保护 D. 数据表示答案：A 分数：2 所属章节1—2 8.对计算机系统结构透明的是： A. 字符行运算指令 B. 是否使用通道行I/O处理机 C. 虚拟存储器 D. VLSI技术答案：D 分数：2 所属章节1—2 9.对汇编语言程序员透明的是： A.I/O方式中的DMA访问方式 B. 浮点数据表示 C. 访问方式保护 D 程序性中断. 答案：A 分数：2 所属章节1—2 10.属计算机系统结构考虑的应是：

北邮高级计算机系统结构实验二三四五

实验二指令流水线相关性分析 ·实验目的通过使用WINDLX模拟器，对程序中的三种相关现象进行观察，并对使用专用通路，增加运算部件等技术对性能的影响进行考察，加深对流水线和RISC处理器的特点的理解。 ·实验原理：指令流水线中主要有结构相关、数据相关、控制相关。相关影响流水线性能。·实验步骤一．使用WinDLX模拟器，对做如下分析：（1）观察程序中出现的数据/控制/结构相关。指出程序中出现上述现象的指令组合。（2）考察增加浮点运算部件对性能的影响。（3）考察增加forward部件对性能的影响。（4）观察转移指令在转移成功和转移不成功时候的流水线开销。 ·实验过程一．使用WinDLX模拟器，对做如下分析： } 浮点加、乘、除部件都设置为1，浮点数运算部件的延时都设置为4，如图1：图1 初始设置将和加载至WinDLX中，如图2示。

图2 加载程序 1.观察程序中出现的数据/控制/结构相关；指出程序中出现上述现象的指令组合。 1）数据相关点击F7，使程序单步执行，当出现R-Stall时停止，运行过程中出现下图3所示，输入整数6。图3 输入整数6 @ 打开Clock Diagram，可以清楚的看到指令执行的流水线如图4所示。图4 指令流水线双击第一次出现R-Stall的指令行，如图5所示。

图5 指令详细信息对以上出现的情况分析如下：程序发生了数据相关，R-Stall（R-暂停）表示引起暂停的原因是RAW。 lbu r3,0×0(r2) 要在WB周期写回r3中的数据；而下一条指令 & seqi r5,r3,0×a 要在intEX周期中读取r3中的数据。上述过程发生了WR冲突，即写读相关。为了避免此类冲突， seq r5,r4,0×a的intEX指令延迟了一个周期进行。由此，相关指令为： 2）控制相关由图6可以看出，在第4时钟周期：第一条指令处于MEM段，第二条命令处于intEX段，第三条指令出于aborted状态，第四条命令处于IF段。图 6 指令流水线 }

计算机系统结构三四章作业及答案

3.1 简述流水线技术的特点。（1）流水线把一个处理过程分解为若干个子过程，每个子过程由一个专门的功能部件来实现。因此，流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件，并依靠它们的并行工作来提高吞吐率。（2）流水线中各段的时间应尽可能相等，否则将引起流水线堵塞和断流。（3）流水线每一个功能部件的前面都要有一个缓冲寄存器，称为流水寄存器。（4）流水技术适合于大量重复的时序过程，只有在输入端不断地提供任务，才能充分发挥流水线的效率。（5）流水线需要有通过时间和排空时间。在这两个时间段中，流水线都不是满负荷工作。 3.2 解决流水线瓶颈问题有哪两种常用方法？答：细分瓶颈段与重复设置瓶颈段 3.3 有一条指令流水线如下所示：（1 用两给出条指（1）（24? 变八级流水线（细分） ? 重复设置部件 )(ns 85 1 T n TP 1pipeline -== 3.4 有一个流水线由4段组成，其中每当流过第三段时，总要在该段循环一次，然后才能流到第4段。如果每段经过一次所需的时间都是△t ，问：（1）当在流水线的输入端连续地每△t 时间输入一个任务时，该流水线会发生什么情况？（2）此流水线的最大吞吐率为多少？如果每2△t 输入一个任务，连续处理10个任务时，其实际吞吐率和效率是多少？（3）当每段时间不变时，如何提高流水线的吞吐率？人连续处理10个任务时，其吞吐率提高多少？解：（1）会发生流水线阻塞情况。

（2）（3）重复设置部件吞吐率提高倍数＝ t t ??2310 75 ＝1.64 3.5 有一条动态多功能流水线由5段组成，加法用1、3、4、5段，乘法用1、2、5段，第2段的时间为2△t ，其余各段的时间均为△t ，而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。现在该流水线上计算 ∏=+4 1 )(i i i B A ，画出时空图，并计算其吞吐率、加速比和效率。＋B 4；再计算由图可见，它在18个△t 时间中，给出了7个结果。所以吞吐率为：如果不用流水线，由于一次求积需3△t ，一次求和需5△t ，则产生上述7个结果共需（4×5+3×3）△t =29△t 。所以加速比为：该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得： 3.6 在一个5段流水线处理机上,各段执行时间均为△t,需经9△t 才能完成一个任务,其预约表如下所示。段23 时间入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A × B C ×D

2010年4月自考计算机系统结构试题及答案

全国2010年4月自学考试计算机系统结构试题课程代码：02325 一、单项选择题(本大题共10小题，每小题1分,共10分) 在每小题列出的四个备选项中只有一个是符合题目要求的，请将其代码填写在题后的括号内。错选、多选或未选均不得分。 1．在计算机系统结构设计中，提高软件功能实现的比例可( ) A．提高解题速度B．减少需要的存储器容量 C．提高系统的灵活性D．提高系统的性能价格比 2．浮点数表示的尾数的基r m=16，尾数长度p=8，可表示的规格化最大正尾数的值是( ) A．1／256 B．1／2 C．15／16 D．255／256 3．下列数据存储空间为隐含寻址方式的是( ) A．CPU中的通用寄存器B．主存储器 C．I／O接口中的寄存器D．堆栈 4．当计算机系统执行通道程序完成输入输出工作时，执行通道程序的是( ) A．CPU B．通道 C．CPU和通道D．指定的外设 5．下列有关中断的叙述正确的是( ) A．中断响应的次序是由硬件决定的B．中断处理的次序是由硬件决定的 C．中断处理的次序是不可改的D．中断响应的次序是可灵活改变的 6．与虚拟存储器的等效访问速度无关．．的是( ) A．访存页地址流B．页面替换算法 C．主存的容量D．辅存的容量 7．非线性流水线的特征是( ) A．一次运算中使用流水线中的多个功能段 B．一次运算中多次使用流水线中的某些功能段 C．流水线中某些功能段在各次运算中的作用不同 D．流水线的各功能段在不同的运算中可以有不同的连接 8．属于集中式共享存储器结构的SIMD计算机是( ) A．ILLIAC IV B．BSP C．CM-2 D．MP-1 1

计算机体系结构实验报告二

实验二结构相关一、实验目得: 通过本实验,加深对结构相关得理解,了解结构相关对CPU性能得影响。二、实验内容: 1、用WinDLX模拟器运行程序structure_d、s 。 2、通过模拟,找出存在结构相关得指令对以及导致结构相关得部件。 3、记录由结构相关引起得暂停时钟周期数,计算暂停时钟周期数占总执行周期数得百分比。 4、论述结构相关对CPU性能得影响,讨论解决结构相关得方法。三、实验程序structure_d、s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; < A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit < this is a ment !! A: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 四、实验过程打开软件,load structure_d、s文件,进行单步运行。经过分析,此程序一次循环中共有五次结构相关。(Rstall 数据相关Stall 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面得数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关得部件:译码部件。

计算机系统结构网上作业

计算机系统结构作业参考答案一、 1、试述现代计算机系统的多级层次结构。计算机系统具有层次性，它由多级层次结构组成。从功能上计算机系统可分为五个层次级别：第一级是设计级。这是一个硬件级，它由机器硬件直接执行。第二级是一般机器级，也称为机器语言级。它由微程序解释系统.这一级是硬件级。第三级是操作系统级，它由操作系统程序实现。这些操作系统由机器指令和广义指令组成，这些广义指令是操作系统定义和解释的软件指令。这一级也称混合级。第四级是汇编语言级。它给程序人员提供一种符号形式的语言，以减少程序编写的复杂性。这一级由汇编程序支持执行。第五级是高级语言级。这是面向用户为编写应用程序而设置的。这一级由各种高级语言支持。 2、试述RISC设计的基本原则和采用的技术。答：一般原则： (1)确定指令系统时，只选择使用频度很高的指令及少量有效支持操作系统，高级语言及其它功能的指令，大大减少指令条数，一般使之不超过100条； (2)减少寻址方式种类，一般不超过两种； (3)让所有指令在一个机器周期内完成； (4)扩大通用寄存器个数，一般不少于32个，尽量减少访存次数； (5)大多数指令用硬联实现，少数用微程序实现； (6)优化编译程序，简单有效地支持高级语言实现。

基本技术： (1)按RISC一般原则设计，即确定指令系统时，选最常用基本指令，附以少数对操作系统等支持最有用的指令，使指令精简。编码规整，寻址方式种类减少到1、2种。 (2)逻辑实现用硬联和微程序相结合。即大多数简单指令用硬联方式实现，功能复杂的指令用微程序实现。 (3)用重叠寄存器窗口。即：为了减少访存，减化寻址方式和指令格式，简有效地支持高级语言中的过程调用，在RISC机器中设有大量寄存嚣，井让各过程的寄存器窗口部分重叠。 (4)用流水和延迟转移实现指令，即可让本条指令执行与下条指令预取在时间上重叠。另外，将转移指令与其前面的一条指令对换位置，让成功转移总是在紧跟的指令执行之后发生，使预取指令不作废，节省一个机器周期。 (5)优化设计编译系统。即尽力优化寄存器分配，减少访存次数。不仅要利用常规手段优化编译，还可调整指令执行顺序，以尽量减少机器周期等。 3、试述全相联映像与直接映像的含义及区别（1）全相连映像主存中任何一个块均可以映像装入到Cache中的任何一个块的位置上。主存地址分为块号和块内地址两部分，Cache地址也分为块号和块内地址。Cache的块内地址部分直接取自主存地址的块内地址段。主存块号和Cache块号不相同，Cache块号根据主存块号从块表中查找。Cache保存的各数据块互不相关，Cache必须对每个块和块自身的地址加以存储。当请求数据时，Cache控制器要把请求地址同所有的地址加以比较，进行确认。（2）直接映像把主存分成若干区，每区与Cache大小相同。区内分块，主存每个区中块的大小和Cache 中块的大小相等，主存中每个区包含的块的个数与Cache中块的个数相等。任意一个主存块只能映像到Cache中唯一指定的块中，即相同块号的位置。主存地址分为三部分：区号、块号和块内地址，Cache地址分为：块号和块内地址。直接映像方式下，数据块只能映像到Cache中唯一指定的位置，故不存在替换算法的问题。它不同于全相连Cache，地址仅需比较一次。（3）区别：全相连映像比较灵活，块冲突率低，只有在Cache中的块全部装满后才会出现冲突，Cache 利用率高。但地址变换机构复杂，地址变换速度慢，成本高。直接映像的地址变换简单、速度快，可直接由主存地址提取出Cache地址。但不灵活，块冲突率较高，Cache空间得不到充分利用。 4. 画出冯?诺依曼机的结构组成？

计算机系统结构有详细答案

(仅供参考，不作为考试标准)，选择题分，每题分)2(30计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 D)高级语言程序员C)机器语言或汇编语言程序员。意________，应当注提系在计算机统设计时，为了高系统性能度的令执行速快A)加经常性使用指大的指令特B)要别精心设计少量功能强数的占减少在数量上很小比例的指令条C)要度D)要加快少量指令的速。的问题统中因________而导致系主重叠寄存器技术要用于解决在RISC 流水线影A)JMP指令响保护令B)CALL指的现场问存储器不便来只C)有LOAD和STORE指令带的访度速器访问D)存储 ________ 效率高计为使流水算机运行要A)各过程段时间不同B)连续处理的任务类型应该不同 D)连续处理的任务数尽可能少C)连续处理的任务类型应该相同栈型替是的________。换算法堆不属于B)近期最少A)近期最使用法久未用法 D)页面失效频率法出进C)先先法象联组，相映的优点。是________象联全与相映相比B)块冲突概率低C)命中率高D)主存利用率小录A)目表高是方好关相指除中叠次一重消令最的法________。B)设相关专用令指改准A)不修通路令指条下析分后推C) 令指条下行执后推D) 流的用采，时关据数到，中作水操遇相________。有法办解决器译编化优A)用办的排新重令指过通，测检序法据数B)向定重技术 C)延迟转移技术 D)加快和提前形成条件码经多级网络串联来实现全排列网络，只能用________。 A)多级立方体网络B)多级PM2I网络 D)上述多级混洗交换网络任何网络C) 序传送的________。是以虫蚀寻径流水方式在各寻径器是顺B)包A)消息C)片节D)字 ________ 处理机超标量作指条令部件个B) 只有一操期A)在一个时钟周内分时发射多多钟C)在一个时周期内同时发射条指令件有只一个取指部D)

计算机体系结构试题汇总

计算机系统结构姓名：学号：一、简答题（每小题10分，共20分） 1．简述使用物理地址进行DMA存在的问题，及其解决办法。 2．从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较（列表）。二、（60分）现有如下表达式： Y＝a ×X 其中：X和Y是两个有64个元素的32位的整数的向量，a为32位的整数。假设在存储器中，X和Y的起始地址分别为1000和5000，a的起始地址为6000。 1．请写出实现该表达式的MIPS代码。 2．假设指令的平均执行时钟周期数为5，计算机的主频为500 MHz，请计算上述MIPS 代码（非流水化实现）的执行时间。 3．将上述MIPS代码在MIPS流水线上（有正常的定向路径、分支指令在译码段被解析出来）执行，请以最快执行方式调度该MIPS指令序列。注意：可以改变操作数，但不能改变操作码和指令条数。画出调度前和调度后的MIPS代码序列执行的流水线时空图，计算调度前和调度后的MIPS代码序列执行所需的时钟周期数，以及调度前后的MIPS流水线执行的加速比。 4．根据3的结果说明流水线相关对CPU性能的影响。三、（20分）请分析I/O对于性能的影响有多大？假设： 1．I/O操作按照页面方式进行，每页大小为16 KB，Cache块大小为64 B；且对应新页的地址不在Cache中；而CPU不访问新调入页面中的任何数据。 2．Cache中95%被替换的块将再次被读取，并引起一次失效；Cache使用写回方法，平均50%的块被修改过；I/O系统缓冲能够存储一个完整的Cache块。 3．访问或失效在所有Cache块中均匀分布；在CPU和I/O之间，没有其他访问Cache 的干扰；无I/O时，每1百万个时钟周期中，有15,000次失效；失效开销是30个时钟周期。如果替换块被修改过，则再加上30个周期用于写回主存。计算机平均每1百万个周期处理一页。

华科专升本计算机系统结构-作业全

第一章作业简答题 1、简述什么是计算机系统结构。 2、答：计算机系统结构是程序员所看到的计算机属性，即概念性结构与功能性结构。 3、 4、计算机系统的层次从下到上包括哪些？ 5、答：计算机系统的层次从上到下包括微程序机器级、机器语言、操作系统虚拟机、汇编语言虚拟机、高级语言虚拟机、应用语言虚拟机。 6、 7、Flynn分类法是以什么对计算机系统进行分类分成哪几类？ 8、答：Flynn分类法是以指令流和数据流的多倍性对计算机系统进行分类。Flynn分类法把计算机系统的结构分为以下4类：单指令流单数据流、单指令多数据流、多指令流单数据流、多指令流多数据流。 9、 10、简述Amdahl定律及加速比计算公式。答：Amdahl定律指出加快某部件执行速度所能获取得系统性加速比，受限于该部件的执行时间占系统中总执行时间的百分比。加速比计算公式=系统性能（改进后）/系统性能（改进前）=总执行时间（改进前）/总执行时间（改进后）计算题 5、如果某一些计算任务用向量方式求解比用标量方式求解快20倍。为达到加速比2，可用向量方式求解所花费时间占总的时间的百分比为多少解：由题可知，系统加速比=2，部件加速比=20，通过向量方式求解可改进比例未知，可设为X。根据Amdahl定律可知系统加速比=1/[(1-X)+X/20]=2 求解得X=10/19 由此可得，可用向量方式求解所花费时间占总的时间的百分比魏53% 第二章作业 1、简述指令集结构设计的基本原则。完整性、规整性、高效性和兼容性 2、简述RISC结构的设计原则。 1）选取使用频率最高的指令，并补充一些最有用的指令； 2）每条指令的功能应尽可能简单，并在一个机器周期内完成； 3）所有指令长度均相同； 4）只有Load和Store操作指令才访问存储器，其它指令操作均在寄存器之间进行； 5）以简单有效的方式支持高级语言。 3

计算机系统结构复习总结

计算机系统结构复习总结一、计算机系统结构概念 1.1 计算机系统结构：程序员所看到的计算机的基本属性，即概念性结构与功能特性。 *注意：对不同层次上的程序员来说，由于使用的程序设计语言不同，可能看到的概念性结构和功能特性会有所不同。 1.2 计算机系统的层次结构现代计算机是一种包括机器硬件、指令系统、系统软件、应用程序和用户接口的集成系统。现代计算机结构图 *注意：计算机结构的层次模型依据计算机语言广义的理解，可将计算机系统看成由多级“虚拟”计算机所组成。

从语言层次上画分可得下图：计算机结构的层次模型 1.3计算机系统结构组成与实现计算机系统结构：是计算机系统的软件与硬件直接的界面计算机组成：是指计算机系统结构的逻辑实现计算机实现：是指计算机组成的物理实现*计算机系统结构、组成与实现三者间的关系：计算机系统结构不同会影响到可用的计算机组成技术不同，而不同的计算机组成又会反过来影响到系统结构的设计。因此，计算机系统结构的设计必须结合应用来考虑，要为软件和算法的实现提供更多更好的硬件支持，同时要考虑可

能采用和准备采用哪些计算机组成技术，不能过多或不合理地限制各种计算机组成、实现技术的采用与发展。计算机组成与计算机实现可以折衷，它主要取决于器件的来源、厂家的技术特长和性能价格比能否优化。应当在当时的器件技术条件下，使价格不增或只增很少的情况下尽可能提高系统的性能。 1.4 计算机系统结构的分类计算机结构分类方式主要有三种：（1）按“流”分类按“流”分类法是Flynn教授在1966年提出的一种分类方法，它是按照计算机中指令流（Instruction Stream）和数据流（Data Stream）的多倍性进行分类。指令流是指机器执行的指令序列，数据流是指指令流调用的数据序列。多倍性是指在计算机中最受限制（瓶颈最严重）的部件上，在同一时间单位中，最多可并行执行的指令条数或处理的数据个数。 *注意：按“流”分类法，即Flynn分类法的逻

(完整版)计算机系统结构试题及答案

计算机系统结构复习题单选及填空：计算机系统设计的主要方法 1、由上往下的设计（top-down） 2、由下往上的设计（bottom-up） 3、从中间开始（middle-out） Flynn分类法把计算机系统的结构分为以下四类：（1）单指令流单数据流（2）单指令流多数据流（3）多指令流单数据流 (4) 多指令流多数据流堆栈型机器：CPU 中存储操作数的单元是堆栈的机器。累加器型机器：CPU 中存储操作数的单元是累加器的机器。通用寄存器型机器：CPU 中存储操作数的单元是通用寄存器的机器。名词解释：虚拟机：用软件实现的机器叫做虚拟机，但虚拟机不一定完全由软件实现，有些操作可以由硬件或固件（固件是指具有软件功能的固件）实现。系列机：由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。兼容机：它是指由不同公司厂家生产的具有相同系统结构的计算机。流水线技术：将一个重复的时序过程，分解成为若干个子过程，而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。单功能流水线：指流水线的各段之间的连接固定不变、只能完成一种固定功能的流水线。多功能流水线：指各段可以进行不同的连接，以实现不同的功能的流水线。顺序流水线：流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。乱序流水线：流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同，允许后进入流水线的任务先完成。这种流水线又称为无序流水线、错序流水线、异步流水线。吞吐率：在单位时间内流水线所完成的任务数量或输出结果的数量。指令的动态调度：

是指在保持数据流和异常行为的情况下，通过硬件对指令执行顺序进行重新安排，以提高流水线的利用率且减少停顿现象。是由硬件在程序实际运行时实施的。指令的静态调度：是指依靠编译器对代码进行静态调度，以减少相关和冲突。它不是在程序执行的过程中、而是在编译期间进行代码调度和优化的。超标量：一种多指令流出技术。它在每个时钟周期流出的指令条数不固定，依代码的具体情况而定，但有个上限。超流水：在一个时钟周期内分时流出多条指令。多级存储层次：采用不同的技术实现的存储器，处在离CPU不同距离的层次上，各存储器之间一般满足包容关系，即任何一层存储器中的内容都是其下一层（离CPU更远的一层）存储器中内容的子集。目标是达到离CPU最近的存储器的速度，最远的存储器的容量。写直达法：在执行写操作时，不仅把信息写入Cache中相应的块，而且也写入下一级存储器中相应的块。写回法：只把信息写入Cache中相应块，该块只有被替换时，才被写回主存。集中式共享多处理机：也称为对称式共享存储器多处理SMP。它一般由几十个处理器构成，各处理器共享一个集中式的物理存储器，这个主存相对于各处理器的关系是对称的，分布式共享多处理机：它的共享存储器分布在各台处理机中，每台处理机都带有自己的本地存储器，组成一个“处理机-存储器”单元。但是这些分布在各台处理机中的实际存储器又合在一起统一编址，在逻辑上组成一个共享存储器。这些处理机存储器单元通过互连网络连接在一起，每台处理机除了能访问本地存储器外，还能通过互连网络直接访问在其他处理机存储器单元中的“远程存储器”。多Cache一致性：多处理机中，当共享数据进入Cache，就可能出现多个处理器的Cache中都有同一存储器块的副本，要保证多个副本数据是一致的。写作废协议：在处理器对某个数据项进行写入之前，它拥有对该数据项的唯一的访问权。写更新协议：当一个处理器对某数据项进行写入时，它把该新数据广播给所有其它Cache。这些Cache用该新数据对其中的副本进行更新。机群：是一种价格低廉、易于构建、可扩放性极强的并行计算机系统。它由多台同构或异构

吉大14秋学期《计算机系统结构》在线作业二答案

吉大14秋学期《计算机系统结构》在线作业二单选题判断题一、单选题（共15 道试题，共60 分。） 1. 关于非专用总线三种控制方式中，下列叙述错误的是（）。 A. 集中式定时查询，所有部件共用同一条“总线忙”线 B. 集中式定时查询，所有部件都用同一条“总线请求”线 C. 集中式独立请求，所有部件都用同一条“总线请求”线 D. 集中式串行链接，所有部件都用同一条“总线请求”线 -----------------选择：C 2. 汇编语言源程序变换成机器语言目标程序是经( ) 来实现的。 A. 编译程序解释 B. 汇编程序解释 C. 编译程序翻译 D. 汇编程序翻译 -----------------选择：D 3. 计算机使用的语言是( )。 A. 专属软件范畴，与计算机体系结构无关 B. 分属于计算机系统各个层次 C. 属于用以建立一个用户的应用环境 D. 属于符号化的机器指令 -----------------选择：B 4. 多端口存储器适合于连接（）。 A. 紧耦合多处理机 B. 松耦合多处理机 C. 机数很多的处理机 D. 机数可变的多处理机 -----------------选择：A 5. 在系统结构设计中，提高软件功能实现的比例会( )。 A. 提高解题速度 B. 减少需要的存贮容量 C. 提高系统的灵活性 D. 提高系统的性能价格比 -----------------选择：C 6. 用户高级语言源程序中出现的读写(I/O) 语句，到读写操作全部完成，需要通过( )共同完成。 A. 编译系统和操作系统 B. I/O 总线、设备控制器和设备 C. 操作系统和I/O 设备硬件 D. 编译系统、操作系统软件和I/O 总线，设备控制器、设备硬件等 -----------------选择：D

计算机系统结构_小抄

1．Cache一致性问题主要由哪些可能的因素有关？共享可写数据引起的不一致，进程迁移引起的不一致，I/O 传输引起的不一致 2．在先行控制方式处理机中，为了保证处理机的最大性能，对于控制相关（包括短循环）采取了哪些应对措施？采用硬件或软件的办法尽量避免数据相关发生；在确保指令正确执行的前提下，推后指令分析；设置相关专用通路来解决数据梯状 3．数据类型、数据表示和数据结构之间的关系是什么？在设计一个计算机系统时，确定数据表示的原则主要有哪几个？数据表示研究的是计算机硬件能够直接识别，可以被指令系统直接调用的那些数据类型。数据结构研究的是面向系统软件，面向就用领域所需要处理的各种数据类型，研究这些数据类型的逻辑结构和物理结构之间的关系，并给出相应的算法。数据表示和数据结构都是数据类型的子集。原则：一是缩短程序的运行时间，二是减少CPU与主存储器之间的通信量，三是这种数据表示的通用性和利用率。 4．从机器（汇编）语言程序员看，以下哪些是透明的？指令地址寄存器；指令缓冲器；时标发生器；条件码寄存器；乘法器；主存地址寄存器；磁盘外设；先行进位链；移位器；通用寄存器；中断字寄存器；参考答案：透明的有：指令缓冲器、时标发生器、乘法器、先行进位链、移位器 5．用具体例子来说明计算机系统结构、计算机组成和计算机实现三个概念计算机系统结构、计算机组成和计算机实现是三个不同的概念。系统结构是计算机系统的软、硬件的界面；计算机组成是计算机系统结构的逻辑实现；计算机实现是计算机组成的物理实现。 6．综述线性流水线和非线性流水线的异同？线性流水线段间无反馈或越过的通路，非线性流水线则有反馈回路或前越通路。在线性流水线中，由于每一个任务在流水线的每一功能段中都流过一次，而且仅流过一次，因此，可以在每一个时钟周期向流水线输入一个新任务。在非线性流水中，由于存在有反馈回路，当一个任务在流水线中流过时，在同一个功能段中可能要经过多次。因此，就不能每一个时钟周期向流水线输入一个新任务。线性流水线是将流水线的各段逐个串接起来。非线性流水线经常用于递归调用，或构成多功能流水线。其性能指标有吞吐率、加速比和效率。 7．虚拟机：通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。 8．程序访问的局部性局部性的实质是：根据程序的最近情况，可以较精确地预测出最近的将来将要用到哪些指令和数据。 9、分别用变址寻址方式和间接寻址方式编写一个程序，求C=A+B，其中，A与B都是由n个元素组成的一维数组。比较两个程序，并回答下列问题：（1）从程序的复杂程度看，哪一种寻址方式更好？（2）从硬件实现的代价看，哪一种寻址方式比较容易实现？（3）从对向量运算的支持看，哪一种寻址方式更好？参考答案：（1）变址寻址方式（2）间接寻址方式（3）变址寻址方式 10、简述SIMD计算机的分布式存储器与共享存储器的异同。参考答案：SIMD计算机的分布式存储器与共享存储器的相同点都存在互联网络。不同点是在共享内存方案中，共享的多体并行存储器通过对准网络与各处理单元相连。在分布内存方案中，每个处理单元有自己的本地存储器，处理单元有自己的本地存储器，处理单元之间的数据通过数据寻径网络完成。 11、根据多台外围设备共享通道的不同情况，通道可分为那三种类型？参考答案：字节多路通道、选择通道、数组多路通道。 12、简述流水线技术的特点参考答案：流水线技术具有以下特点： ⑴水过程由多个相联系的子过程组成，每个过程称为流水线的"级"或"段"。

计算机系统结构考试题库及答案

计算机系统结构试题及答案一、选择题（50分，每题2分，正确答案可能不只一个，可单选或复选） 1.（CPU周期、机器周期）是内存读取一条指令字的最短时间。 2.（多线程、多核）技术体现了计算机并行处理中的空间并行。 3.（冯?诺伊曼、存储程序）体系结构的计算机把程序及其操作数据一同存储在存储器里。 4.（计算机体系结构）是机器语言程序员所看到的传统机器级所具有的属性，其实质是确定计算机系统中软硬件的界面。 5.（控制器）的基本任务是按照程序所排的指令序列，从存储器取出指令操作码到控制器中，对指令操作码译码分析，执行指令操作。 6.（流水线）技术体现了计算机并行处理中的时间并行。 7.（数据流）是执行周期中从内存流向运算器的信息流。 8.（指令周期）是取出并执行一条指令的时间。 9.1958年开始出现的第二代计算机，使用（晶体管）作为电子器件。 10.1960年代中期开始出现的第三代计算机，使用（小规模集成电路、中规模集成电路）作为电子器件。 11.1970年代开始出现的第四代计算机，使用（大规模集成电路、超大规模集成电路）作为电子器件。 12.Cache存储器在产生替换时，可以采用以下替换算法：（LFU算法、 LRU算法、随机替换）。

13.Cache的功能由（硬件）实现，因而对程序员是透明的。 14.Cache是介于CPU和（主存、内存）之间的小容量存储器，能高速地向CPU提供指令和数据，从而加快程序的执行速度。 15.Cache由高速的（SRAM）组成。 16.CPU的基本功能包括（程序控制、操作控制、时间控制、数据加工）。 17.CPU的控制方式通常分为：（同步控制方式、异步控制方式、联合控制方式）反映了时序信号的定时方式。 18.CPU的联合控制方式的设计思想是：（在功能部件内部采用同步控制方式、在功能部件之间采用异步控制方式、在硬件实现允许的情况下，尽可能多地采用异步控制方式）。 19.CPU的同步控制方式有时又称为（固定时序控制方式、无应答控制方式）。 20.CPU的异步控制方式有时又称为（可变时序控制方式、应答控制方式）。 21.EPROM是指（光擦可编程只读存储器）。 22.MOS半导体存储器中，（DRAM）可大幅度提高集成度，但由于（刷新）操作，外围电路复杂，速度慢。 23.MOS半导体存储器中，（SRAM）的外围电路简单，速度（快），但其使用的器件多，集成度不高。 24.RISC的几个要素是（一个有限的简单的指令集、CPU配备大量的通用寄存器、强调对指令流水线的优化）。

北邮计算机系统结构实验报告-实验一到五-WINDLX模拟器

北京邮电大学实验报告课程名称计算机系统结构计算机学院03班王陈(11)

目录实验一WINDLX模拟器安装及使用......................................... 错误!未定义书签。 ·实验准备................................................................................ 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验内容及要求.................................................................... 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验二指令流水线相关性分析 ............................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验三DLX处理器程序设计 .................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 A.向量加法代码及性能分析 ................................................... 错误!未定义书签。 B.双精度浮点加法求和代码及结果分析 .............................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验四代码优化 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结+实习体会........................................................... 错误!未定义书签。实验五循环展开 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。矩阵乘程序代码清单及注释说明........................................... 错误!未定义书签。相关性分析结果........................................................................... 错误!未定义书签。增加浮点运算部件对性能的影响........................................... 错误!未定义书签。增加forward部件对性能的影响 ............................................ 错误!未定义书签。转移指令在转移成功和转移不成功时候的流水线开销 .. 错误!未定义书签。 ·实验总结+实习体会+课程建议......................................... 错误!未定义书签。

计算机系统结构三四章作业及答案

简述流水线技术的特点。（1）流水线把一个处理过程分解为若干个子过程，每个子过程由一个专门的功能部件来实现。因此，流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件，并依靠它们的并行工作来提高吞吐率。（2）流水线中各段的时间应尽可能相等，否则将引起流水线堵塞和断流。（3）流水线每一个功能部件的前面都要有一个缓冲寄存器，称为流水寄存器。（4）流水技术适合于大量重复的时序过程，只有在输入端不断地提供任务，才能充分发挥流水线的效率。（5）流水线需要有通过时间和排空时间。在这两个时间段中，流水线都不是满负荷工作。解决流水线瓶颈问题有哪两种常用方法？答：细分瓶颈段与重复设置瓶颈段有一条指令流水线如下所示：（1 （? ? TP = 有一个流水线由4段组成，其中每当流过第三段时，总要在该段循环一次，然后才能流到第4段。如果每段经过一次所需的时间都是△t ，问：（1）当在流水线的输入端连续地每△t 时间输入一个任务时，该流水线会发生什么情况？（2）此流水线的最大吞吐率为多少？如果每2△t 输入一个任务，连续处理10个任务时，其实际吞吐率和效率是多少？（3）当每段时间不变时，如何提高流水线的吞吐率？人连续处理10个任务时，其吞吐率提高多少？解：（1）会发生流水线阻塞情况。（2）

（3）重复设置部件吞吐率提高倍数＝ t t ??2310 75 有一条动态多功能流水线由5段组成，加法用1、3、4、5段，乘法用1、2、5段，第2段的时间为2△t ，其余各段的时间均为△t ，而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。现在该流水线上计算 ∏=+4 1 )(i i i B A ，画出时空图，并计算其吞吐率、加速比和效率。 4＋B 4；再计算(A 由图可见，它在18个△t 时间中，给出了7个结果。所以吞吐率为：如果不用流水线，由于一次求积需3△t ，一次求和需5△t ，则产生上述7个结果共需（4×5+3×3）△t =29△t 。所以加速比为：该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得： △t,需经9△t 才能完成一个任务,其预约表如下所示。（1）画出流水线任务调度的状态转移图。时间入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A × B C ×D