计算机系统结构

选择&填空

1.关于计算机系统结构下列描述不正确的是（B）

A．计算机系统结构是指程序设计者所看到的计算机系统属性。

B．同一计算机系统对于所有的计算机程序设计者来说系统结构是相同的。

C．计算机系统结构对不同层次的用户来说具有透明性。

D．计算机系统结构涉及到软硬件功能分配及其界面的确定。2.下列属于SIMD的是（D）

A．标量处理机B. 向量处理机C.计算机网络D.超标量处理机

3.关于数组多路通道，其设备所需求的实际最大流量应为（A）

A.所连接设备的字节传送速率之最大者。

B.所连接设备的字节传送速率之最小者。

C.所连接设备的字节传送速率之和。

D.所连接设备的字节传送速率之平均值。

4.下列不是堆栈型算法的是（D）

A.最有替换算法。

B.近期最少使用算法。

C.近期最久没有使用算法。

D.先进先出算法。

5.关于软件的兼容性下面说法不正确的事（C）

A.软件的兼容性是指一个软件可不经修改或只需少量修改便可以由一台机器移植到另一台机器上去运行。

B.实现软件兼容性的方法有系列机法，模拟和仿真，采用统一的高级语言。

C.系列机能够实现软件兼容，而兼容机不能实现软件兼容。

D.模拟是用软件方法实现兼容，而仿真则是通过软硬件结合的方法。

6.在下列Cache中不需要替换算法的是（B）

A.全相联Cache

B.直接映射Cache

C.组相联Cache

D.段相联Cache

7.关于超标量处理机，下列说法不正确的是（B）

A.一个基本时钟周期内能够同时发射多条指令。

B.只需增加少量硬件，通过各部分硬件的充分重叠工作来提高处理机性能。

C.重复设置多个操作部件同时工作来提高指令的执行速度。

D.超标量处理机利用空间的并行性来提高指令执行速度。

8.在基本输入输出方式中，数据不通过CPU的方式是（C）

A.程序控制方式

B.中断方式

C.DMA方式

D.都不通过CPU

9.计算机更新换代的标志主要是计算机的器件和系统结构的特点。

10.计算机系统指令系统的两种典型设计方案是复杂指令集系统CISC 和精简指令集系统RISC。

11.一台计算机的浮点操作由软件实现，它占整个程序执行时间的20%，为使计算机的性能提高到原来的1.2倍，浮点操作改由硬件实现，浮点操作的加速比是 6 。

12. 模拟是指由一台机器的指令系统解释另一台机器的指令系统，仿真是指由一台机器的微指令解释另一台机器的指令系统。

13.从计算机系统结构的发展和演变来看，早期的冯诺依曼计算机是以运算器为中心的系统结构，而近代的计算机是以存储器为中心的系统结构。

14.在指令取消技术中，向后转移不成功取消下一条指令，向前转移不成功是执行下条指令。

15.在先行控制技术中相关性可分为数据相关和控制相关。

16.在各功能段执行时间不同的流水线中，确定流水线最大吞吐率高低的因素是流水线中执行时间最长的功能段，有两种解决办法是将瓶颈功能段再次细分或采用多个瓶颈功能段并行工作。

17.向量处理机的关键问题是存储器系统能够满足运算部件带宽要求，采用的办法有存储器—存储器结构和寄存器—寄存器结构。

18.互联网由16个处理机采用单级Clube3连接，10号处理机与2号处理机连接。

判断题：对应的知识点：P164,138,239,131,93,329,349

1.尽管硬件的速度一般高于软件，但硬件实现的性能不一定优于软

件。

2.地址码低位交叉在提高存储系统的访问速度的同时也增大了其容

量。

3.字节多路通道是一种简单共享通道，适合连接低速或中速的外围

设备。有两种不同的工作方式，子节交叉方式和成组方式。选择通道适合连接磁盘存储器等高速外围设备。

4.虚拟存储其用来提高容量，而Cache用来提高速度。

5.超标量处理机开发的是处理机内部的空间并行性。

分析题：

1.什么是软件的向上兼容和向下兼容？哪一种兼容比较容易做到？

(P24)

向上兼容是指按某种档机器编制的程序，不加修改就能运行于

比它高档的机器。向下兼容是指按某种档机器编制的程序不加

修改就能运行于比它低档的机器。软件的向下兼容比较容易做

到。

向前兼容是指按某个时期投入市场的某种型号机器编制的程

序，不加修改就能运行于在它之前投入市场的机器；向后兼容

是指按某个时期投入市场的某种型号机器编制的程序，不加修

改就能运行于在它之后投入市场的机器。向后兼容一定要做到。

2.简述Amdahl定律及其在系统结构设计中的应用。(P9)

Amdahl定律表明系统中某一部件采用更快的执行方式后整个系统的性能提高与这种执行方式的使用频率或占用总执行时间的比例有关。定义了由于采用特殊的方法所获得的加速比的大小：

3.简述先行控制技术的主要思想(P253)

先行控制技术的关键是缓冲技术个预处理技术，以及两者的结合。通过对指令流和数据流的预处理和缓冲，能够尽量使指令分析器和指令执行部件独立地工作，并始终处于忙碌状态。

4.简述控制相关和数据相关及其避免方法(P263)

相关是指在一段程序的相近指令之间有某种关系，这种关系可能影响指令的重叠执行。相关分为两大类，控制相关和数据相关。控制相关是指由条件分支指令、转子程序指令、中断等引起的相关。数据相关是指在本条指令执行的过程中，如果用到的指令、操作数、变址偏移量等正好是前面指令的执行结果，则必须等待前面指令执行完成，并把结果写到贮存或通用寄存器中之后，本条指令猜能开始执行，这种相关是数据相关。

解决数据相关的方法有两种：推后分析法，设置专用路径

控制相关避免方法有：软件”猜测法”，硬件”猜测法”，延迟转移技术，指令取消技术。

计算题：

1.Huffman编码，设计指令格式。例题

2.14（P127）

2.线性静态（动态）流水线时空图，实际吞吐率，加速比，效率。

3.非线性流水线禁止向量，冲突向量，调度流水线状态图，最佳调

度策略，最小相等间隔，平均间隔拍数，各功能段连接图。

4.页式虚拟存储器按地址编址，最多128个用户，每个用户最多要

用2048页，每页4K字节，主存容量为64M字节，快表按地址访问，共32个存储字，快表地址经散列变换得到，为减少散列冲突，快表分为两组，有两组独立的比较电路。

1>.写出用户虚地址和主存地址的格式，并标出各字段的长度。

2>.计算散列变换的输入和输出位数。

3>.每个相等比较电路的位数是多少？

4>.快表每个存储字的总长度、各字段的长度为多少？

5>.画出多用户虚地址换成实地址的逻辑示意图。

重点复习：

第一章基本概念

1.计算机系统结构定义：由程序设计者所看到的的计算机系统的

属性，即概念性结构和功能特性。这里的程序设计者是指汇编

语言、机器语言、编译系统、操作系统。

2.计算机系统结构主要研究软硬件功能分配和对软硬件界面的

确定。

3.计算机系统由软件、硬件、固件共同组成。它们在功能上是等

同的，即硬件和软件在功能上是等效的，但在性能和价格上是

不等效的。

4.计算机组成与实现的区别：系统结构是计算机系统的软硬件界

面；计算机组成是计算机系统结构的逻辑实现（包括机器内部

的数据流和控制流的组成以及逻辑设计等）；计算机实现是计

算机组成的物理实现（包括处理机、主存等部件的物理结构等）。

5.透明性概念：在计算机技术中一种本是存在的事物或属性，但

从某种角度看似乎是不存在的。

6.计算机系统结构分类方法：Flynn分类法，冯氏分类法，Handler

分类法

1>.Flynn分类法：4种SISD:单指令流单数据流(传统的顺序处理

机) SIMD:单指令流多数据流(阵列处理机或并行处理机) MISD:多指令流单数据流(可代表任何计算机) MIMD:多指令流多数据流(多处理机)

2>.冯氏分类法：4种WSBS:字串位串WPBS:字并位串WSBP:

字串位并WPBP:……

7.计算机系统设计技术：

1>.加快经常性事件的速度。

2>.Amdahl定律

3>.CPU性能公式

4>.访问的局部性原理：程序往往反复使用它刚刚使用过的数据

和指令。

8.计算机系统设计者的主要任务：

1>.确定用户对计算机系统的功能、价格和性能要求。

2>.软硬件的平衡

3>.设计出符合今后发展方向的系统结构。

9.计算机系统结构设计方法：

1>.由下往上设计：根据硬件条件设计（专用计算机，早期计算

机）

2>.由上往下设计：容易使软件和硬件脱节，整体效率较低。

3>.由中间开始设计：适用于系列机，从某两级的界面开始(传

统机器级与操作系统机器级)

10.系统结构的评价标准：性能和指标（P15）

CPU性能取决于三个要素（CPU时间=IC * CPI * 时钟周期）

性能主要标准：MIPS,MFLOPS,基准测试程序，综合基准测试程序。

11.软件对计算机系统结构的影响：解决软件的可移植性问题的方

法：

1>.采用系列机：指在一个厂家内生产的具有相同的系统结构，

但具有不同的组成和实现的一系列不同型号的机器。

2>.采用模拟与仿真方法：模拟是指用软件方法在一台机器上实

现另一台机器的指令系统，模拟程序放在主存中；仿真则是指用硬件、软件、固件混合的方法实现，仿真微程序在控存中。

3>.采用统一的高级语言方法：可以解决结构相同或者完全不同

的机器上的软件移植。

习题：P33 ：1.12 1.17 1.19 1.21

第二章

1．浮点数的表示方法、性质、运算规则(P38)

1>.浮点数表示方式主要研究的内容是：数据字长与这种数据表示

方式的表数范围、表数精度和表数效率之间的关系。目的是：用尽量短的字长实现尽可能大的表数范围和尽可能高的表数精度。主要研究对象：尾数基值r m ，阶码字长q ，尾数字长p 。

2>.浮点数的表数范围：两个数值：

m ：尾数的值，包括尾数的数制(小数或整数)和码制(原码或补码) e ：阶码的值，整数,一般采用移码（补码的符号位取反）

两个基值：

rm ：尾数基值，2、4、8、16和10进制等

re ：阶码的基值，通常为2进制

两个字长：

p ：尾数长度，当rm ＝16时，每4个二进制位表示一位 q ：阶码长度，阶码部分的二进制位数

p 和q 均不包括符号位

二进制数的字长：L=p+q+1+1（1，1分别为尾数和阶码的符号位）尾数为原码、小数，阶码用移码、整数时，规格化浮点数N 的表数范

围：

尾数为补码、小数，阶码用移码、整数是：正区间相同。

浮点数阶码的字长q 每增加一位，所能表示的阶码最大值就大一倍，

当尾数的基值从2增加到时，所能表示的阶码最大值就增加倍。 3>.表数精度：又称表数误差，误差产生的直接原因有两个：

(1)两个浮点数都在浮点集内，而运算结果却可能不在这个浮点

集内

(2)数据从十进制转化为2、4、8、16进制，产生误差。

(3)N| (M:近似

值 N:真实值) r e m m N ?=m m p m m r r r r e q e q r N r -?+-≤≤----)(11

表数精度：

(4)总结：当浮点数的尾数长度相同时，尾数的基值取2具有最

高的表数精度。

4>.表数效率：rm=2

(1)

提高的倍数: T=η(rm)/η

5>.结论：在浮点数的字长确定之后，尾数基值取2或4具有最大

的表数范围和最高的表数精度。采用隐藏位表数方法（rm=2时，规格化尾数的最高位一定为1，若尾数采用补码形式，则尾数的最高位一定与尾数的符号位相反，所以最高位不表示出来，只在计算是恢复隐藏位，或用某种方法对计算结果进行修正）2．浮点数的设计方法

3．浮点数的舍入方法和警戒位位数的设置

1>.舍入方法的性能标准：本身的误差小，积累的误差小，容易实现

2>.恒舍法：又称截断法，无论多余的尾数是什么都全部舍掉。实现容易误差大。

恒置法：无论多余的尾数是多少，把p的最低位恒置为r/2(rm=16时—>8)。表数精度比较低，实现比较容易，积累误差比

较小，正负区误差平衡。

上舍下入法：以多出来的g位代码中间值为准，大于则入，小于则舍。

精度高，积累误差小，正负区误差完全平衡，实现比

较困难。

R*舍入法：没有积累误差，精度非常高，实现非常困难。

查表法：主要通过修改ROM或PLA中的内容使积累误差达到平衡。

3>.警戒位的设置：不需要增加浮点数的长度，只须要增加一个累

加器的长度，而其他数据寄存器和存储器的长度，运

算器的长度等都不用增加。

用处：用于左规格化时移入尾数的有效字长内；用于舍入。

来源：做加减法时因对阶而从有效字长内移出去的部分；做乘法时双倍字长乘积的低字长部分；做除法时因没有除尽而多

上商的几位；右规格化时移出有效字长的那部分；从

十进制转换成二进制，尾数超出有效字长的那部分。4．自定义数据表示方法的原理：

5．指令格式的优化设计（Huffman编码，操作码扩展编码等）6．RISC思想：(只保留功能简单的指令，功能较复杂的指令由子程序来实现)

减少指令平均执行周期数是RISC思想的精华

1>.大多数指令在单周期内完成。

2>.采用LOAD/STORE结构。

3>.硬布线控制逻辑。

4>.减少指令和寻址方式的种类

5>.固定的指令格式

6>.注重译码优化。

7．RISC关键技术

1>.延时转移技术：在转移指令后插入一条不相关的有效指令，而

转移指令被延时，从而使指令流水线不断流。限制条件：一定不能改变原来程序的数据相关关系；被移动的指令不要破坏机器的条件码，至少不要影响后面的条件码测试指令所要求的条件码。

2>.指令取消技术：向后转移（循环程序）在转移成功时执行下条

指令，否则取消下条指令；向前转移（IF THEN）在转移成功时取消下条指令，否则执行下条指令。

3>.重叠寄存器窗口技术：每个过程使用的相邻的几个窗口中，有

一个窗口与前一个过程共用，有一个窗口与后一个过程共用。

4>.指令流调整技术：调整指令序列消除数据相关，提高流水线的

工作效率。

5>.硬件为主固件为辅

习题：P127：2.13 2.14 2.19 2.20

第三章

1．半导体存储器工作原理及主存储器构成方法

2．存储系统的定义及主要性能计算。

1>.定义：两个或两个以上速度、容量和价格各不相同的存储器用

硬件、软件、或软件与硬件相结合的方法连接起来成为一个存

储系统。这个系统对应用程序员透明，并且，从应用程序员看，它是一个存储器，这个存储器的速度接近速度最快的那个存储器，存储容量与容量最大的那个存储器相等，单位容量的价格接近最便宜的那个存储器。

2>.在一般计算机系统中，主要有两种存储系统：

Cache存储系统：由Cache和主存储器构成主要目的：提高存储器速度

虚拟存储系统：由主存储器和磁盘存储器构成主要目的：扩大存储器容量

3>.访问周期T，命中率H，访问效率e，预处理技术(提高命中率).

4>.提高存储系统速度的方法：提高命中率，减小两存储器之间的

速度差。

5>.解决存储器频带平衡的方法：多个存储器并行工作，设置各种

缓冲存储器，采用存储系统。

3．并行存储器的工作原理。P136

1>.高位交叉访问存储器：A=m*k+j (纵向) 扩大存储器容量

2>.低位交叉访问存储器：A=n*j+k(横向) 提高存储器访问速度低位交叉能有效解决访问冲突问题。

访问冲突的原因：数据的随机性(影响大)，程序中有转移指令。

解决办法：同一列中的相邻元素要错开两个存储体存放，同一行中的各个元素仍然要按顺序存放在该行中，但要按5取模。(会

浪费存储体)

4．虚拟存储系统的工作原理。

1>.虚拟存储器：由主存储器和联机工作的外部存储器共同组成。

2>.工作原理：一个用户程序访问虚拟存储器时，必须给出多用户虚拟地址Av,在操作系统和有关硬件的共同管理下，首先进行内部地址变换。如果命中，则得到主存实页号p，而多用户虚拟地址中的页内偏移量D可直接作为主存实地址中的页内偏移量d，这样就可以得道主存实地址A。如果没有命中，就要进行外部地址变换将在磁盘存储器中的数据所在的实页调入主存或者运用某种算法替换原在主存中的某一页。

3>.地址映像：把虚拟地址空间映像到主存地址空间

地址变换：在程序被装入住存储器之后，在实际运行时，把多用户虚地址变换成主存实地址或磁盘存储器地址。

4>.类型：页式虚拟存储器，段式虚拟存储器，段页式虚拟存储器。

5>.段式虚拟存储器：（段表基本字段：段号，段长，起始地址）

地址映象方法：每个程序段都从0地址开始编址，长度可长可短，可以在程序执行过程中动态改变程序段的长度。

地址变换方法：

由用户号找到基址寄存器

从基址寄存器中读出段表的起始地址

把起始地址与多用户虚地址中段号相加得到段表地址

把段表中的起始地址与段内偏移D相加就能得到主存实地址。

优点：程序的模块化性能好，便于程序和数据的共享，程序的动态链接和调度比较容易，便于实现信息保护。

缺点：地址变换所花费的时间比较长，做两次加法运算，主存储器的利用率往往比较低，对辅存（磁盘存储器）的管理比较困难。

6>.页式虚拟存储器：把虚拟地址空间划分为一个个固定大小的块，

每块称为一页（虚页），把主存储器的地址空间也分为同样大小的页，称为实页。

只需要进行虚页到实页的映射

用户号找到基址寄存器，从中读出页表的起始地址，将其与圩堤之中的虚页号相加的到页表地址，将该地址所对应的主存页号与虚地址中的偏移量直接连接起来即可得到主存实地址A。

优点：主存储器的利用率比较高，页表相对比较简单，地址变换的速

度比较快，对磁盘的管理比较容易

缺点：程序的模块化性能不好页表很长,需要占用很大的存储空间 7>.段页式虚拟存储器：用户按照段来编写程序，每个段分为几个固

定大小的页

地址映像方法：每个程序段在段表占一行，段表给出该程序段的页表

长度和页表起始地址，页表给出这个程序段的每一页对应在主存中的实页号

地址变换方法：

先查段表，得到该程序段的页表起始地址和页表长度，

再查页表找到要访问的主存实页号，

最后把实页号p 与页内偏移d 拼接得到主存的实地址。

用户程序器段页式虚拟存储器的地址映象

5．虚拟存储器中加快地址变换的方法。

1>.虚拟存储器速度降低的原因：访问主存储器必须先查段表或页

表，可能要采用多级页表。

2>.目录表：思想：用一个小容量的高速存储器来存放页表

地址变换过程：把多用户虚地址中U 与P 拼接，相联访问目录表。读

出主存实页号p ，把p 与多用户虚地址中的D 拼接得到主存实地址。如果相联访问失败，发出页面失效请求。

优点：比存放在主存中查找速度快。

缺点：可扩展性差。

3>.快慢表：

快表：采用高速硬件实现，相联方式访问。

慢表：当快表中查不到是，在主存中去查找慢表，用软件实现，按地

址方式访问。

址

4>.散列函数：

目的：将相联访问方式变为按地址访问方式，扩展快表容量。

6．虚拟存储系统的页面替换算法。

1>.RAND随机算法：利用随机数确定被替换的页面。易于实现，

命中率低。

2>.FIFO先进先出算法：易于实现，利用历史信息，但没有反映程

序的局部性。

3>.LFU近期最少使用算法：既充分利用了历史信息，又反映了程

序的局部性，实现起来非常困难。

4>.LRU最久没有使用算法：把LRU算法中的“多”与“少”简化

成“有”与“无”，实现比较容易。

5>.OPT最优替换算法：是一种理想算法,仅用作评价其它页面替换

算法好坏的标准，在虚拟存储器中,实际上可能采用的只有FIFO 和LRU两种算法。

7．Cache存储系统的地址映象及变换方法。P174

1>.全相联映像及其变换：主存中的任意一块都可以映象到

Cache中的任意一块。

目录表（由相联存储器构成，共C b个字）

全相联地址变换

用硬件实现非常复杂，在虚拟存储器中，全部用，软件实现

2>.直接映射及其地址变换：主存中一块只能映象到Cache的一个

特定的块中。

区表存储器

3>.组相联映像及其变换：主存和Cache按同样大小划分成块，还

按同样大小划分成组。从主存的组到Cache的组之间采用直接映象方式。在两个对应的组内部采用全相联映象方式。

地址变换过程：用主存地址中的组号G按地址访问块表存储器。把读出来的一组区号和块号与主存地址中的区号和块号进行相联比较。如果有相等的，表示Cache命中。如果没有相等的，表示

组相联映象方式的地址变换

把块表存储器中一个相联比较的组按块方向展开存放。用多个相等比较器来代替相联访问，加块查表的速度。

4>.位选择组相联映像及其变换

5>.段相联映像及其变换

8．Cache存储系统的块替换算法。

1>.轮换法：被装入或被替换的块，它所属的计数器被清“0”，同

组其他块的计数器的值加“1”，替换时替换计数器值最大的块。

2>.LRU算法：被装入或被替换的块对应的计数器清“0”，同组其

他的计数器加“1”，命中的块计数器清“0”，同组其他的计数

器中凡是计数器值小于命中块原来的值的都加“1”，其余不变。

替换时选择同组计数器值最大的替换掉

3>.比较对法：

4>.堆栈法：优点：块失效率比较低，因为它采用了LRU算法。硬

件实现相对比较简单；缺点：速度比较低，因为它需要进行相联比较。

习题：P205 3.2 3.7 3.12 3.14 3.20 //3.21

第四章

1．三种基本输入输出方式的工作原理

1>.特点：异步性，实时性，与设备无关性。

2>.基本输入输出方式：程序控制方式输入输出方式，中断输入输

出方式，直接存储器访问方式。

3>.程序控制方式：特点：

(1)何时对何设备进行输入或输出操作完全受CPU控制

(2)CPU要通过指令对设备进行测试才能知道设备的工作状态

设备空闲、准备就绪、正在忙碌等

(3)数据的输入和输出都要经过CPU

(4)用于连接低速外围设备，如终端、打印机等

优点：

灵活性很好可以很容易地改变各台外围设备的优先级

缺点：

实现处理机与外围设备并行工作困难

处理机的工作周期全部被I/O占用

4>.中断方式：特点：

CPU与外围设备能够并行工作，能够处理例外事件例如，电源掉电、非法指令、地址越界、数据溢出、数据校验错、页面失效等

数据的输入和输出都要经过CPU，灵活性好，用于连接低速外围设备

5>.直接存储器访问方式

外围设备访问请求直接发往主存储器

不需要CPU做保存现场和恢复现场等工作

在DMA控制器中，需要设置数据寄存器、设备状态或控制寄存器、主存地址寄存器、设备地址寄存器和数据交换个数计数器在DMA方式开始和结束时，需要处理机进行管理

在DMA方式中，数据的传送过程不需要CPU的干预

2．通道中的数据传送过程及流量分析

1>.字节多路通道：实际流量是连接在这个通道上的所有设备的数据流量之和。

2>.选择多路通道和数组多路通道：实际流量是连接在这个设备上的所有设备中数据流量最大的那一个。

习题：P251 4.7 4.9

第五章(都是重点)

习题：P342 5.8 5.9 5.11 5.12 5.15

第六章

1．向量的表示方法

2．向量运算中的数据相关

3．向量链接技术与递归技术

习题：P391 6.6 6.8

北邮高级计算机系统结构实验二三四五

实验二指令流水线相关性分析 ·实验目的通过使用WINDLX模拟器，对程序中的三种相关现象进行观察，并对使用专用通路，增加运算部件等技术对性能的影响进行考察，加深对流水线和RISC处理器的特点的理解。 ·实验原理：指令流水线中主要有结构相关、数据相关、控制相关。相关影响流水线性能。·实验步骤一．使用WinDLX模拟器，对做如下分析：（1）观察程序中出现的数据/控制/结构相关。指出程序中出现上述现象的指令组合。（2）考察增加浮点运算部件对性能的影响。（3）考察增加forward部件对性能的影响。（4）观察转移指令在转移成功和转移不成功时候的流水线开销。 ·实验过程一．使用WinDLX模拟器，对做如下分析： } 浮点加、乘、除部件都设置为1，浮点数运算部件的延时都设置为4，如图1：图1 初始设置将和加载至WinDLX中，如图2示。

图2 加载程序 1.观察程序中出现的数据/控制/结构相关；指出程序中出现上述现象的指令组合。 1）数据相关点击F7，使程序单步执行，当出现R-Stall时停止，运行过程中出现下图3所示，输入整数6。图3 输入整数6 @ 打开Clock Diagram，可以清楚的看到指令执行的流水线如图4所示。图4 指令流水线双击第一次出现R-Stall的指令行，如图5所示。

图5 指令详细信息对以上出现的情况分析如下：程序发生了数据相关，R-Stall（R-暂停）表示引起暂停的原因是RAW。 lbu r3,0×0(r2) 要在WB周期写回r3中的数据；而下一条指令 & seqi r5,r3,0×a 要在intEX周期中读取r3中的数据。上述过程发生了WR冲突，即写读相关。为了避免此类冲突， seq r5,r4,0×a的intEX指令延迟了一个周期进行。由此，相关指令为： 2）控制相关由图6可以看出，在第4时钟周期：第一条指令处于MEM段，第二条命令处于intEX段，第三条指令出于aborted状态，第四条命令处于IF段。图 6 指令流水线 }

计算机系统结构考试计算题

3.12 有一指令流水线如下所示（1）求连续输入10条指令，该流水线的实际吞吐率和效率；（2）该流水线的“瓶颈”在哪一段？请采取两种不同的措施消除此“瓶颈”。对于你所给出的两种新的流水线，连续输入10条指令时，其实际吞吐率和效率各是多少？解：（1） 2200(ns)2009200)10050(50t )1n (t T max m 1 i i pipeline =?++++=?-+?=∑= )(ns 220 1 T n T P 1pipeline -== 45.45%11 5 4400T P m t T P E m 1 i i ≈=? =?? =∑= （2）瓶颈在3、4段。 ? 变成八级流水线（细分） 850(ns)509850t 1)(n t T max m 1 i i pipeline =?+?=?-+?=∑= )(ns 85 1 T n T P 1pipeline -== 58.82%17 10 8400T P m ti T P E m 1 i ≈=? =?? =∑= ? 重复设置部件出 50ns 50ns 100ns 200ns

)(ns 85 1 T n T P 1pipeline -== 58.82%17 10885010400E ≈=??= 3.13 4段组成，3段时，一次，然4段。如果需要的时间都是，问：（1）当在流水线的输入端连续地每时间输入任务时，该流水线会发生什么情况？（2）此流水线的最大吞吐率为多少？如果每输入一个任务，连续处理 10个任务时的实际吞吐率和效率是多少？（3）当每段时间不变时，如何提高该流水线的吞吐率？仍连续处理10个任务时，其吞吐率提高多少？（2） t ?t ?2

计算机系统结构模拟试题(5)

计算机组成原理模拟试题（2）一、填空题:04分，每题02分 1、X=-0.1001 ［X］原=_____________ [X］补=_____________［-X］补=_____________ Y=0.0101 ［Y］原=_____________ ［Y］补=_____________ [-Y］补=_____________ ［X+Y］补=_____________ 2、对西文输出的字符设备，在计算机的内存储器中存储的是字符数据的每个字符的_____________码，输出(包括显示或打印)的则是每个字符的_____________，设备中的字符发生器的主要功能是解决从字符的_____________码和字符的_____________间的对应关系。二、单选题:20分，每题02分 3、32 x 32点阵汉字的机内编码需要。 A: 16个字节 B: 32个字节 C: 32×2个字节 D: 32×4个字节 4、某机字长32位，采用原码定点整数表示，符号位为1位，数值位为31位，则可表示的最大正整数为，最小负整数为。 A: B: C: D: 5、在定点二进制运算器中，减法运算一般通过来实现。 A: 原码运算的二进制减法器 B: 补码运算的二进制减法器 C: 补码运算的十进制加法器 D: 补码运算的二进制加法器 6、在浮点数运算中产生溢出的原因是。 A: 运算过程中最高位产生了进位或借位 B: 参加运算的操作数超出了机器的表示范围 C: 运算的结果的阶码超出了机器的表示范围 D: 寄存器的位数太少，不得不舍弃最低有效位 7、无论如何划分计算机的功能部件，控制器部件中至少含有。 A: PC、IP B: PC、IR C: IR、IP D: AR、IP 8、某存储器容量为32K×16位，则 A: 地址线为16根，数据线为32根 B: 地址线为32根，数据线为16根

计算机体系结构实验报告二

实验二结构相关一、实验目得: 通过本实验,加深对结构相关得理解,了解结构相关对CPU性能得影响。二、实验内容: 1、用WinDLX模拟器运行程序structure_d、s 。 2、通过模拟,找出存在结构相关得指令对以及导致结构相关得部件。 3、记录由结构相关引起得暂停时钟周期数,计算暂停时钟周期数占总执行周期数得百分比。 4、论述结构相关对CPU性能得影响,讨论解决结构相关得方法。三、实验程序structure_d、s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; < A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit < this is a ment !! A: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 四、实验过程打开软件,load structure_d、s文件,进行单步运行。经过分析,此程序一次循环中共有五次结构相关。(Rstall 数据相关Stall 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面得数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关得部件:译码部件。

计算机系统结构试卷B

《计算机系统结构B卷》一、填空题（每小题1.5分，共30分）。 1．对系列机而言，必须保证做到软件，力争做到软件向上兼容。 2．由软件实现的计算机称之为。 3. 多处理机系统按组织形式分有三种，功能分布是多处理机系统分工方式。 4．依据从哪一层开始设计，计算机体系结构设计的主要方法有三种，占据主导地位的是设计。 5. 在先行控制方式实现流水线的处理器中，有先行指令、先行操作、先行读数和后行写数等四个缓冲栈，缓冲深度最大的是。 6.按流水线的功能多寡分，可分为单功能流水线和。 7. 用于表示非线性流水线中的任务对未进入流水线的后继任务流入流水线的时间间隔的约束称为。 8.中断转移相关处理的基本方法包括不精确断点法和。 9. 互连网络中任意两个结点之间距离的最大值称为。 10．在多级交叉开关互联网络中，交叉开关的控制方式有、组控制和单元控制。 11. 在多计算机系统的互连网络中，通信模式包括、选播、广播和会议等四种。 12. 描述网络寻径效率常用的两个参数是通道流量和。 13．自定义数据表示包括标志符和两种数据表示。 14. 浮点数尾数基值越大，浮点数表示的数据范围。 15. 根据运算类型指令操作数存储方法不同，指令集结构可分为堆栈型、累加器型和。 16. 标量处理机是否高度并行是以指令级并行度（ILP）为来区分。 17．存储系统的基本存储层次有、主存储器和辅助存储器。 18. 采用并行存储器的目的是。 19. 从时间开销来看，伪命中的时间正常命中的时间。 20. 增加Cache存储系统的相联度，可降低Cache的不命中率，但会增加Cache 的。

二、简答题(每小题6分，共30分)。 1．多计算机系统和多处理机系统的差别有哪几方面？其中最根本的差别是哪个方面？ 2. 什么是流水线相关？流水线相关可分为哪几大类？ 3. 什么是动态互连网络？动态互连网络的互联形式有哪几种？ 4. 指令系统设计包括哪两个方面？指令格式优化设计的目的是什么？ 5. 维护Cache与主存一致性的更新算法有哪些? 三、分析题(第一小题8分，第二小题12分，共20分)。 1．某种处理机10条指令的使用频度分别为：0.25，0.20，0.15，0.10，0.08，0.08，0.05，0.04 ，0.03 ，0.02，试画出该处理机进行Huffman编码时的一棵Huffman树。 2. 在某采用全相联映象、相联目录表实现地址变换Cache存储器中，Cache 的容量是8KB，主存是由4个存储体组成的低位交叉访问存储器，主存总容量是32MB，每一个存储体的字长是32位，。（1）写出主存地址和Cache地址的格式，并标出各字段的长度。（2）说明目录表的行数、相联比较的位数和目录表的宽度。四、计算题(第一小题8分，第二小题12分，共20分)。 1. 设16个处理器编号分别为0、1、……、15，用单级互连网络连接，当互连函数分别为：（1）Cube3、（2）PM+3、（3）Shuffle（Shuffle）时，第13号处理器分别与哪一个处理器相连? 2. 有一条5个功能段的线性动态多功能流水线如图所示，其中1→2→3→5功能段组成加法流水线，1→4→5功能段组成乘法流水线，设每个功能段的延迟时间均相等为△t。用这条流水线计算F=4 1() i i i a b = + ∏，画出流水线时空图，并计算流水线的实际吞吐率、加速比和效率。 Z

计算机系统结构模拟试题5

计算机组成原理模拟试题（2）一、填空题:04分，每题02分 =_____________ [X］补=_____________补-X］［1、 X=-0.1001 ［X］原 =_____________ =_____________ =_____________ [-Y］补Y］原=_____________ ［］补 Y=0.0101 ［Y ］补=_____________ ［X+Y对西文输出的字符设备，在计算机的内存储器中存储的是字符数据的每个字符的、 2，设备中的字符_____________(包括显示或打印)的则是每个字符的码，输出_____________间的对应关_____________发生器的主要功能是解决从字符的 _____________码和字符的系。分二、单选题:20分，每题02 。3、 32 x 32点阵汉字的机内编码需要 A: 16个字节 B: 32个字节 2个字节 C: 32×个字节 D: 32×4位，则可表示位，数值位为314、某机字长32位，采用原码定点整数表示，符号位为1 。，最小负整数为的最大正整数为 A: B: C: D: 来实现。 5、在定点二进制运算器中，减法运算一般通过 A: 原码运算的二进制减法器 B: 补码运算的二进制减法器 C: 补码运算的十进制加法器 D: 补码运算的二进制加法器。 6、在浮点数运算中产生溢出的原因是运算过程中最高位产生了进位或借位 A: 参加运算的操作数超出了机器的表示范围B: C: 运算的结果的阶码超出了机器的表示范围寄存器的位数太少，不得不舍弃最低有效位 D: 。 7、无论如何划分计算机的功能部件，控制器部件中至少含有 IP A: PC、 IR B: PC、、IP C: IR D: AR、IP 8、某存储器容量为32K×16位，则 A: 地址线为16根，数据线为32根根16根，数据线为32地址线为B: C: 地址线为15根，数据线为16根 D: 地址线为15根，数据线为32根 9、在统一编址方式下，存储单元和I/O设备是靠指令中的来区分的。

计算机系统结构期末考试题目

第一章： 1.计算机系统结构的定义答：由程序设计者看到的一个计算机系统的属性，即概念性结构和功能特性。 2.透明性概念答：在计算机技术中，一种本来是存在的事物或属性，但从某种角度看似乎不存在，称为透明性现象。 3.兼容性向后兼容兼容性：同一个软件可以不加修改地运行于系统结构相同的各档机器，可获得相同的结果，差别只在于不同的运行时间。向后兼容：按某个时期投入市场的某种型号机器编制的程序，不加修改就能运行于在它之后投入市场的机器。 4.Amdahl定律答：系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。 5.CPI 答：每条指令的平均时钟周期数。 6.MIPS 答：每秒百万条指令数！MIPS=时钟频率/(CPI*10^6) 7.MFLOPS 答：每秒百万次浮点操作次数。MFLOPS=程序中的浮点操作次数/(执行时间*10^6) 8.命中率的概念答： 9.Flynn分类法是按指令流和数据流的多倍性特征进行计算机系统结构的划分答：①单指令流单数据流SISD ②单指令流多数据流SIMD ③多指令流单数据流MISD （实际不存在）④多指令流多数据流MIMD 10.计算机系统设计的定量原理（四个）答：①加快经常性事件的速度②Amdahl定律③CPU性能公式④访问的局部性原理11.CPI和加速比的计算答：CPI=CPU时钟周期数/IC CPU时间=CPU时钟周期数/频率 CPU时间=CPU时钟周期*时钟周期长加速比=（采用改进措施后的性能）/（没有采用改进措施前的性能） =(没有采用改进措施前执行某任务的时间)/(采用改进措施后执行某任务的时间) 12.软硬件实现的特点硬件实现：速度快、成本高；灵活性差、占用内存少软件实现：速度低、复制费用低；灵活性好、占用内存多 13.系统评价的标准 ①运算速度②存储器系统③其他性能④成本标准

计算机系统结构模拟题

《计算机系统结构》模拟题一．判断是非题,对的打√，错的打× 1.系列机是指由一个厂家生产的具有相同组成，但具有不同系统结构和实现的一系列不同型号的机器。（ × ） 2.Cray 1向量处理机中，由于每个向量寄存器的长度为64，当实际需要处理的向量长度大于64时，它就不能够处理了。（ × ） 3.按照Flynn 分类法，Illiac IV 阵列处理机是MIMD 计算机。（ × ） 4.多级混洗交换网络是阻塞网络。（ √ ）二．填空题 1．多机系统的互连网络的通信模式可分为4种，其中，一对一的通信模式称为____单播_____模式，一对全体的通信模式为_____广播____模式，多对多的通信模式为____会议_____模式。 2．SIMD 计算机和流水线向量处理机都可以执行向量指令，前者采用___资源重复______并行性，后者采用___时间重叠______并行性。 3．系列机软件兼容必须做到___向后_____兼容，力争做到___向上_____兼容。 4．流水线消除瓶颈段的方法有____细分_____和____重复设置瓶颈段（可交换次序）_____2种方法。 5．设通道数据传送过程中，选择一次设备的时间为 s T ，传送一个字节的时间为D T ，则字节多路通道最大流量等于____ D s T T 1 _____。 6．Illiac IV 8×8阵列中，网络直径为____7_____。 7．对堆栈型替换算法，增大分配给程序的___主存页面______，对第一级存储器的命中率就会单调____上升_____。 8．从网络的任何结点看，若网络拓扑结构都是相同的，则称这样的网络是___对称______网络。三．单项选择题 1.在计算机系统层次结构中，从下层到上层，各层相对顺序正确的是（ B ）。 A.汇编语言机器级－操作系统机器级－高级语言机器级 B.微程序机器级－传统机器语言机器级－汇编语言机器级 C.传统机器语言机器级－高级语言机器级－汇编语言机器级 D.汇编语言机器级－应用语言机器级－高级语言机器级 2．Illiac IV 阵列处理机中，PE 之间所用的互连函数是（ A ）。

计算机系统结构考试题库及答案

计算机系统结构试题及答案一、选择题（50分，每题2分，正确答案可能不只一个，可单选或复选） 1.（CPU周期、机器周期）是内存读取一条指令字的最短时间。 2.（多线程、多核）技术体现了计算机并行处理中的空间并行。 3.（冯?诺伊曼、存储程序）体系结构的计算机把程序及其操作数据一同存储在存储器里。 4.（计算机体系结构）是机器语言程序员所看到的传统机器级所具有的属性，其实质是确定计算机系统中软硬件的界面。 5.（控制器）的基本任务是按照程序所排的指令序列，从存储器取出指令操作码到控制器中，对指令操作码译码分析，执行指令操作。 6.（流水线）技术体现了计算机并行处理中的时间并行。 7.（数据流）是执行周期中从内存流向运算器的信息流。 8.（指令周期）是取出并执行一条指令的时间。 9.1958年开始出现的第二代计算机，使用（晶体管）作为电子器件。 10.1960年代中期开始出现的第三代计算机，使用（小规模集成电路、中规模集成电路）作为电子器件。 11.1970年代开始出现的第四代计算机，使用（大规模集成电路、超大规模集成电路）作为电子器件。 12.Cache存储器在产生替换时，可以采用以下替换算法：（LFU算法、 LRU算法、随机替换）。

13.Cache的功能由（硬件）实现，因而对程序员是透明的。 14.Cache是介于CPU和（主存、内存）之间的小容量存储器，能高速地向CPU提供指令和数据，从而加快程序的执行速度。 15.Cache由高速的（SRAM）组成。 16.CPU的基本功能包括（程序控制、操作控制、时间控制、数据加工）。 17.CPU的控制方式通常分为：（同步控制方式、异步控制方式、联合控制方式）反映了时序信号的定时方式。 18.CPU的联合控制方式的设计思想是：（在功能部件内部采用同步控制方式、在功能部件之间采用异步控制方式、在硬件实现允许的情况下，尽可能多地采用异步控制方式）。 19.CPU的同步控制方式有时又称为（固定时序控制方式、无应答控制方式）。 20.CPU的异步控制方式有时又称为（可变时序控制方式、应答控制方式）。 21.EPROM是指（光擦可编程只读存储器）。 22.MOS半导体存储器中，（DRAM）可大幅度提高集成度，但由于（刷新）操作，外围电路复杂，速度慢。 23.MOS半导体存储器中，（SRAM）的外围电路简单，速度（快），但其使用的器件多，集成度不高。 24.RISC的几个要素是（一个有限的简单的指令集、CPU配备大量的通用寄存器、强调对指令流水线的优化）。

计算机系统结构第一章自考练习题答案

第一章计算机系统结构的基本概念历年真题精选 1. 下列对系统程序员不透明的是（）。 A. 乘法器 B. 先行进位链 C. 指令缓冲器 D. 条件码寄存器2．“从中间开始”设计的“中间”目前多数是在（ D ）。 A. 微程序机器级与汇编语言机器级之间 B. 操作系统机器级与汇编语言机器级之间 C. 传统机器语言机器级与微程序机器级之间 D. 传统机器语言机器级与操作系统机器级之间 3. 开发计算机系统结构并行性的主要技术途径有时间重叠、（资源重复）和（资源共享）。 4. 计算机系统弗林分类法，把计算机系统分成单指令流单数据流（SISD）、单指令流多数据流（SIMD）、（多指令流单数据流（MISD））和（多指令流多数据流（MIMD））四大类。 5. 设计指令系统时，以乘法运算为例，简述系统结构设计、计算机组成设计、计算机实现各应考虑的问题。（ P4） 6. 实现软件移植的途径有哪些各受什么限制（ P14）同步强化练习一．单项选择题。 1. 实现汇编语言源程序变换成机器语言目标程序是由（ C ）。 A. 编译程序翻译 B. 编译程序解释 C. 汇编程序翻译 D. 汇编程序解释 2. 系列机软件应做到（ B ） A. 向前兼容，并向下兼容 B. 向后兼容，力争向上兼容 C. 向前兼容，并向上兼容 D. 向后兼容，力争向下兼容 3. 在计算机系统多级层次结构中，机器级由低到高，相对顺序正确的应当是（ B ）。 A. 传统机器语言、汇编语言、操作系统 B. 微程序、传统机器语言、高级语言 C. 高级语言、汇编语言、传统机器语言 D. 传统机器语言、应用语言、高级语言 4. 可以直接执行微指令的是（ C ）。 A. 编译程序 B. 微程序 C. 硬件 D. 汇编程序 5. 计算机系统结构不包括（ A ）。 A. 主存速度 B. 数据表示 C. 机器工作状态 D. 信息保护 6. 对计算机系统结构透明的是（）。 A. 是否使用通道型I/0处理机 B. 虚拟存储器 C. 字符行运算指令 D. VLSI技术 7. 在主存设计上，属计算机系统结构考虑的应是（ C ）。 A. 频宽的确定 B. 多体交叉还是单体 C. 容量和编址单位 D. 用MOS还是TTL 8. 计算机组成设计不考虑（ B ）。 A. 缓冲技术 B. 功能部件的集成度 C. 专用部件设置 D. 控制机构的组成

计算机系统结构

课后习题第一章计算机系统结构的基本概念 5.从机器（汇编）语言程序员看，以下哪些是透明的？指令地址寄存器；指令缓冲器；时标发生器；条件寄存器；乘法器；主存地址寄存器；磁盘外设；先行进位链；移位器；通用寄存器；中断字寄存器。答：透明的有：指令缓冲器、时标发生器、乘法器、先进先出链、移位器、主存地址寄存器。 6.下列哪些对系统程序员是透明的？哪些对应用程序员是透明的？系列机各档不同的数据通路宽度；虚拟存储器；Cache存储器；程序状态字；“启动I/O”指令；“执行”指令；指令缓冲寄存器。答：对系统程序员透明的有：系列机各档不同的数据通路宽度；Cache存储器；指令缓冲寄存器；对应用程序员透明的有：系列机各档不同的数据通路宽度；Cache存储器；指令缓冲寄存器；虚拟存储器；程序状态字；“启动I/O”指令。 note: 系列机各档不同的数据通路宽度、Cache存贮器、指令缓冲寄存器属于计算机组成，对系统和程序员和应用程序员都是透明的。

虚拟存贮器、程序状态字、“启动I/O”指令，对系统程序员是不透明的，而对应用程序员却是透明的。 “执行”指令则对系统程序员和应用程序员都是不透明的。 8. 实现软件移植的主要途径有哪些?分别适用于什么场合?各存在什么问题?对这些问题应采取什么对策?如果利用计算机网络实现软件移植,计算机网络应当如何组成?

第二章数据表示与指令系统 1.数据结构和机器的数据表示之间是什么关系？确定和引入数据表示的基本原则是什么？答：数据表示是能由硬件直接识别和引用的数据类型。数据结构反映各种数据元素或信息单元之间的结构关系。数据结构要通过软件映象变换成机器所具有的各种数据表示实现，所以数据表示是数据结构的组成元素。不同的数据表示可为数据结构的实现提供不同的支持，表现在实现效率和方便性不同。数据表示和数据结构是软件、硬件的交界面。除基本数据表示不可少外，高级数据表示的引入遵循以下原则：

北邮计算机系统结构实验报告-实验一到五-WINDLX模拟器

北京邮电大学实验报告课程名称计算机系统结构计算机学院03班王陈(11)

目录实验一WINDLX模拟器安装及使用......................................... 错误!未定义书签。 ·实验准备................................................................................ 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验内容及要求.................................................................... 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验二指令流水线相关性分析 ............................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验三DLX处理器程序设计 .................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 A.向量加法代码及性能分析 ................................................... 错误!未定义书签。 B.双精度浮点加法求和代码及结果分析 .............................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验四代码优化 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结+实习体会........................................................... 错误!未定义书签。实验五循环展开 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。矩阵乘程序代码清单及注释说明........................................... 错误!未定义书签。相关性分析结果........................................................................... 错误!未定义书签。增加浮点运算部件对性能的影响........................................... 错误!未定义书签。增加forward部件对性能的影响 ............................................ 错误!未定义书签。转移指令在转移成功和转移不成功时候的流水线开销 .. 错误!未定义书签。 ·实验总结+实习体会+课程建议......................................... 错误!未定义书签。

计算机系统结构期末考试试题及其答案

《计算机系统结构》期末考试试卷A 卷第 2 页共 24 页计算机科学系《计算机系统结构》期末考试试卷（A 卷） 2、此试卷适用于计算机科学与技术本科专业。一单选题：(10分，每题1分) 1、 ."启动I/O"指令是主要的输入输出指令，是属于（ B ） A.目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、输入输出系统硬件的功能对(B )是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、全相联地址映象是指（A ） A.任何虚页都可装入主存中任何实页的位置 B.一个虚页只装进固定的主存实页位置 C.组之间固定，组内任何虚页可装入任何实页位

置 D.组间可任意装入，组内是固定装入 4、( C ) 属于MIMD系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D.阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关，则（B ） A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、计算机使用的语言是（B） A.专属软件范畴，与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D.属于符号化的机器指令 7、指令执行结果出现异常引起的中断是（C ） A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断《计算机系统结构》期末考试试卷A卷第 3 页共 24 页

计算机系统结构模拟题

《计算机系统结构》模拟题（补）一．单项选择题 1. SIMD是指（）。 A、单指令流单数据流 B、单指令流多数据流 C、多指令流单数据流 D、多指令流多数据流 2. 磁盘外部设备适合于连接到（）。 A．字节多路通道B．数组多路通道或选择通道 C．选择通道或字节多路通道D．数组多路通道或字节多路通道 3. 下列（）存储设备不需要编址。 A. 通用寄存器 B. 主存储器 C. 输入输出设备 D. 堆栈 4.多处理机的各自独立型操作系统( )。 A.要求管理程序不必是可再入的 B.适合于紧耦合多处理机 C.工作负荷较平衡 D.有较高的可靠性 5.输入输出系统硬件的功能对( )是透明的。 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 6. 实现汇编语言源程序变换成机器语言目标程序是由（）。 A．编译程序解释B．编译程序翻译 C．汇编程序解释D．汇编程序翻译 7.全相联地址映象是指( )。 A.任何虚页都可装入主存中任何实页的位置 B.一个虚页只装进固定的主存实页位置 C.组之间是固定的，而组任何虚页可以装入任何实页位置 D.组间可任意装入，组是固定装入 8.( )属于MIMD系统结构。 A.各处理单元同时受同一个控制单元的管理 B.各处理单元同时接受同一个控制单元送来的指令 C.松耦合多处理机和多计算机 D.阵列处理机

9.设16个处理器编号分别为0，1，2，…，15用Cube3互联函数时，第10号处理机与第( ) 号处理机相联。 A.11 B.8 C.14 D.2 10.若输入流水线的指令既无局部性相关，也不存在全局性相关，则( )。 A.可获得高的吞吐率和效率 B.流水线的效率和吞吐率恶化 C.出现瓶颈 D.可靠性提高 11．流水线的技术指标不包括( )。 A.响应比 B.吞吐率 C.加速比 D.效率 12．指令优化编码方法，就编码的效率来讲，方法最好是（）。 A. 固定长度编码 B. 扩展编码法 C. Huffman编码法 D. 以上编码都不是 13．RISC 计算机的指令系统集类型是 ( ) 。 A. 堆栈型 B. 累加器型 C. 寄存器—寄存器型 D. 寄存器 - 存储器型 14．相联存储器的访问方式是( )。 A．先进先出顺序访问B．按地址访问 C．无地址访问D．按容访问 15．存储器读写速率越高，每位的成本也越高，存储容量也小。解决这一问题的主要方法是采用( )。 A．多级存储体系结构B．并行存储器 C． Cache D．缓冲技术 16．计算机系统多级层次中，从下层到上层，各级相对顺序正确的应当是（）。 A.汇编语言机器级---操作系统机器级---高级语言机器级 B.微程序机器级---传统机器语言机器级---汇编语言机器级 C.传统机器语言机器级---高级语言机器级---汇编语言机器级 D. 汇编语言机器级---应用语言机器级---高级语言机器级 17．对系统程序员不透明的是（）。 A.Cache 存储器 B.系列几各档不同的数据通路宽度 C.指令缓冲寄存器 D.虚拟存储器 18．在计算机系统设计中，比较好的方法是（）。

计算机系统结构实验报告

计算机系统结构实验报告一．流水线中的相关实验目的： 1. 熟练掌握WinDLX模拟器的操作和使用，熟悉DLX指令集结构及其特点； 2. 加深对计算机流水线基本概念的理解； 3. 进一步了解DLX基本流水线各段的功能以及基本操作； 4. 加深对数据相关、结构相关的理解，了解这两类相关对CPU性能的影响； 5. 了解解决数据相关的方法，掌握如何使用定向技术来减少数据相关带来的暂停。实验平台： WinDLX模拟器实验内容和步骤： 1.用WinDLX模拟器执行下列三个程序：求阶乘程序fact.s 求最大公倍数程序gcm.s 求素数程序prim.s 分别以步进、连续、设置断点的方式运行程序，观察程序在流水线中的执行情况，观察 CPU中寄存器和存储器的内容。熟练掌握WinDLX的操作和使用。 2. 用WinDLX运行程序structure_d.s，通过模拟找出存在资源相关的指令对以及导致资源相关的部件；记录由资源相关引起的暂停时钟周期数，计算暂停时钟周期数占总执行周期数的百分比；论述资源相关对CPU性能的影响，讨论解决资源相关的方法。 3. 在不采用定向技术的情况下（去掉Configuration菜单中Enable Forwarding选项前的勾选符），用WinDLX运行程序data_d.s。记录数据相关引起的暂停时钟周期数以及程序执行的总时钟周期数，计算暂停时钟周期数占总执行周期数的百分比。在采用定向技术的情况下（勾选Enable Forwarding），用WinDLX再次运行程序data_d.s。重复上述3中的工作，并计算采用定向技术后性能提高的倍数。 1. 求阶乘程序用WinDLX模拟器执行求阶乘程序fact.s。这个程序说明浮点指令的使用。该程序从标准输入读入一个整数，求其阶乘，然后将结果输出。该程序中调用了input.s中的输入子程序，这个子程序用于读入正整数。实验结果：在载入fact.s和input.s之后，不设置任何断点运行。 a.不采用重新定向技术，我们得到的结果

计算机系统结构考试计算题

有一指令流水线如下所示入 1 2 3 4 出 50ns 50ns 100ns 200ns （1）求连续输入10条指令，该流水线的实际吞吐率和效率；（2）该流水线的“瓶颈”在哪一段请采取两种不同的措施消除此“瓶颈”。对于你所给出的两种新的流水线，连续输入10条指令时，其实际吞吐率和效率各是多少解：（1） 2200(ns) 2009200)10050(50t )1n (t T max m 1 i i pipeline =?++++=?-+?=∑= )(ns 220 1T n TP 1pipeline -== 45.45%11 5 4400TP m t TP E m 1 i i ≈=? =?? =∑= （2）瓶颈在3、4段。变成八级流水线（细分） 850(ns) 509850t 1)(n t T max m 1 i i pipeline =?+?=?-+?=∑= )(ns 85 1 T n TP 1pipeline -== 58.82%17 10 8400TP m ti TP E m 1 i ≈=? =?? =∑= 重复设置部件 1 2 3_1 3_2 4_1 4_4 入出

)(ns 851T n TP 1pipeline -== 58.82%17 10 8 85010400E ≈=??= 有一 4段组成，其3段时，总次，然后流到第4段。如果需要的时间都是t ?，问：（1）当在流水线的输入端连续地每t ?时间输入任务时，该流水线会发生什么情况（2）此流水线的最大吞吐率为多少如果每t ?2输入一个任务，连续处理 10个任务时的实际吞吐率和效率是多少（3）当每段时间不变时，如何提高该流水线的吞吐率仍连续处理10个任务时，其吞吐率提高多少（2）

计算机系统结构模拟试题(3)

计算机系统结构模拟试题（3）一、单选题:15分，每题03分 1、一台模型机共有7条指令，各指令的使用的频率分别为45％,30％,15％,5％,3％,1％,1％。要求操作码的平均长度最短，那么该值应该是： A: 2 B: 1.87 C: 2.1 D: 1.97 2、设a为一个计算机系统中n台处理机可以同时执行的程序代码的百分比，其余代码必须用单处理机顺序执行。而单个节点机的处理效率是4MIPS,那么在a=0.8的条件下，要让系统的效率达到20MIPS,则至少需要多少台节点机？ A: 8 B: 16 C: 32 D: 以上均错误 3、一条流水线的可分为k段，各段的执行时间都是，共向该流水线输入n个任务，求该流水线实际吞吐率为： A: B: C: D: 4、一条4段的流水线可以由以下时空图来表示，求该流水线的实际吞吐率（假设n=100） A: B: C: D: 5、在超标量，超流水线，超标量超流水线等不同结构的指令级并行处理机上运行矩阵乘法C＝A×B（假设A是m×n阶的矩阵，B是n×l阶的矩阵），最少需要进行多少次乘法

和多少次加法？ A: mn, nl B: mnl, ml(n-1) C: mnl, mn(l-1) D: mnl, mnl 二、多选题:04分，每题04分 6、下列功能，那些一般由硬件实现？ A : 第一次关CPU中断 B : 返回中断点 C : 第一次开CPU中断 D : 保存中断点三、填空选择题:04分，每题04分 7、星形网络的网络直径和链路数分别为（）和（）。选项 1 : N-1 N/2 2 N(N-1)/2 选项 2 : N-1 N/2 2 N(N-1)/2 四、大型计算题:10分，每题10分 8、假设我们考虑条件分支指令的两种不同设计方法如下： CPU1：通过比较指令设置条件码，然后测试条件码进行分支。 CPU2：在分支指令中包括比较过程。在两种CPU中，条件分支指令都占用2个时钟周期而所有其他指令占用1个时钟周期，对于CPU1，执行的指令中分支指令占20％；由于每个分支指令之前都需要有比较指令，因此比较指令也占20％。由于CPU1在分支时不需要比较，因此假设它的时钟周期时间比CPU2快1.25倍。哪一个CPU更快？如果CPU1的时钟周期时间仅仅比CPU2快1.1倍，哪一个CPU更快？五、中型计算题:16分，每题08分 9、在一个Cache存储系统中，主存储器的访问周期、存储容量和单位价格分别为60ns、64MB和10元／NB，Cache的访问周期、存储容量和单位价格分别为10ns、512KB和100元／MB，Cache的命中率为0．98。计算这个Cache存储系统的等效访问周期、存储容量和单位价格。 10、超标量机、超流水线机、超标量超流水线机都能开发指令级的并行性。假设这3种机器的流水线都为4段，每段均为1个时钟周期。还假设超标量处理机每个时钟周期可同时启动3条指令，超流水线机每隔1/3个时钟周期启动一条指令，超标量超流水线机每次启动3条指令，每隔1/3个时钟周期启动一次指令。现有9条指令的代码序列，问这3种机器各需要多少个时钟周期才能执行完毕，求各流水线的效率。画出时空图。