计算机系统结构复习题

计算机系统结构复习题
计算机系统结构复习题

计算机106 计算机系统结构复习题

一、选择题

1.Cache存储器写操作时,只写入Cache,仅当需要块替换时,才将其写回主存,称这种修改主存块内容的方法为___写回法

_______。

2.仿真和模拟的主要区别在于采用不同的语言进行解释。仿真采用___________解释,其解释程序在控制存储器中,而模拟

采用机器语言程序解释,其解释程序在___________中。

3.16个处理器编号为0~15,采用PM2+3单级网络互连,与13号处理器相连的处理器号是( 利用公式计算机一下。。。 )

A.5 B.7 C.11 D.14

4.在共享主存的多处理机中,为减少访问主存冲突,采用的方式一般是( )

A.虚拟存储器B.共享Cache存储器

C.用高速单体主存系统D.并行多体交叉主存系统

5.7.下列关于标量流水机的说法不正确的是( )

A.没有向量数据表示 B.不能对向量数据进行运算

C.可对标量数据进行流水处理 D.可以对向量、数组进行运算

6.广义地讲, F. 有着两种含义:一是 G. ,指两个以上事件在 A. 发生;二是 H. ,指两个以上事件在 C. 间

隔内发生。

A. 同一时刻

B. 不同时刻

C. 同一时间

D. 不同时间

E. 串行性

F. 并行性

G. 同时性

H. 并发性

7.页式虚拟存储管理中,实页冲突概率最低的地址映象方式是( )

A.直接映象B.全相联映象

C.组相联映象D.段相联映象

8.组相联映象、LRU替换的Cache存储器,不影响Cache命中率的是( )

A.增大块的大小B.增大主存容量

C.增大组的大小 D.增加Cache中的块数

9.不同系列的机器之间,实现软件移植的途径不包括()

A.模拟 B.仿真

C.用统一汇编语言D.用统一高级语言

10.采用地址码高位交叉的目的是()。

A. 扩大存储器的容量

B. 提高存储器的速度

C. 缩小存储器的容量

D. 减小存储器的速度

11.超标量处理机主要是采用()来开发处理机内部的并行性的。

A. 空间

B. 重叠

C.资源重复

D. 时间重叠

12.在下列内容中,对系统程序员和应用程序员都透明的是()。

A.数据传送指令

B.指令缓冲队列

C.向量中断

D. 浮点运算指令

13.计算机硬件能够直接识别,指令系统能够直接调用的数据类型是()。

A.结构体数据类型

B.数据表示

C.数据描述符

D. 数据结构

14.在计算机系统设计中,提高软件功能实现的比例会()。

A.提高解题速度

B.增强指令功能

C.提高系统的性能价格比

D.提高系统的灵活性

15.中断优先级的次序()改变。

A.不可以B、可以

16.下列有关CACHE的命中率说法不正确的是()

A、CACHE的块越大,命中率不一定越高

B、主存的容量越大,命中率越高

C、组数适当时,命中率可以达到最高

D、 CACHE的块越大,命中率越大。

17.采用高速缓冲存储器的主要目的是()

A、提高速度

B、增加容量

C、提高命中率

D、提高灵活性

18.设有64个处理机系统、处理机编号为0,1,…,63,当采用复合互连函数PM2

-1[shuffle(b

5

b

4

b

3

b

2

b

1

b

)]时,第9号处理机

与(。。。 )号处理机相连。

A 、2 B、16 C、32 D、7

19.对于虚拟存储器,如果所要访问的内容不在内存中,则必须访问磁盘存储器,这是进行()。

A、外部地址变换

B、内部地址变换

C、实地址变换

D、虚地址变换

20.一个系统中中断优先级由硬件已经确定了,但可以通过()改变其优先级。

A、中断优先级控制寄存器

B、中断指令

C、中断屏蔽字

D、优先级轮转

21.在下列内容中,对系统程序员和应用程序员都透明的是()

A、浮点数据表示

B、二级Cache

C、高级程序设计语言

D、立即寻址方式

22.开发处理机内部的并行性包括:()并行性和空间并行性。

A.空间

B. 重叠

C.资源

D. 时间

23.在下面的内容中,属于计算机系统结构内容的是()

A、32位数据宽度

B、4级中断

C、指令缓冲队列

D、数据结构

24.在下面的内容中,不属于计算机组成内容的是()

A、“与”运算指令

B、“BOOTH”一位乘法

C、指令缓冲器

D、移位加法器

25.对于虚拟存储器如果()失败,表示要访问的数据不在主存中,必须访问磁盘存储器,这时要进行外部地址变换。

A、物理地址转换成逻辑地址

B、外部地址变换

C、逻辑地址转换成物理地址

D、内部地址变换

26.输入输出系统包括()

A、输入输出设备

B、输入输出接口

C、输入输出软件

D、A、B和C

27.一个系统中的中断优先级由硬件已经确定了,但可以通过()改变其优先级。

A、中断控制寄存器

B、应用软件

C、中断屏蔽字

D、优先级循环

28.计算机硬件能够直接识别,指令系统能够直接调用的数据类型是(B)

A. 数据结构

B.数据表示

C.数据描述符

D.十进制数

29.在下列内容中,对系统程序员和应用程序员都透明的是()

A、8位的数据总线

B、Cach e

C、汇编语言

D、指令有8种寻址方式

30.在多级存储器层次结构中,Cache—主存层次主要用于解决()问题。

A、命中率

B、速度

C、容量

D、页面调度

31.设有128个处理机系统,处理机编号为0,1,…,127,当采用混洗交换函数

shuffle[Exchange(b6b5b4b3b2b1b0)]时,第29号处理机与(。。。)号处理机相连。

A、23

B、56

C、39

D、19

32.确定下列内容各属于哪方面的问题。

设某一计算机系统的设计为:

1)堆栈指令(系统)

2)采用BOOTH乘法算法(组成)

3)最小的寻址单位为1b (系统)

4)主板上有2个ASI总线插槽(实现)

可选择答案:A.系统结构 B.计算机组成 C.计算机实现

33.对于系统程序员,分析以下情况的的透明性

5)“执行”指令(不)

6)CACHE存储器(透)

7)系列机各档不同的数据通路宽度(透)

8)存储器的模m交叉存取(透)

A. 透明

B. 不透明

34.判断下列内容属于哪方面内容:

(1)采用单排风扇。(实现)

( 2)机器设有移位运算指令。(系统)

(4)存储器的最小编址单位是字节。(系统)

(5)微指令字长为64位。(组成)

可选答案:A、系统结构 B、计算机组成 C、计算机实现

35.对于系统程序员,分析下列情况透明性

(1)某机设有向量数据表示,且用向量运算指令对向量进行处理。(不)

(2)某机有4个通用寄存器AX, BX, CX, DX 。 ( 不 )

(3)cache存储器采用组相联映象方式。 ( 透 )

(4)某机采用8级向量中断。 ( 不 )

(5)某机设有指令缓冲器。 ( 透 )

A、透明

B、不透明

36.确定下列内容各属于哪方面的问题。

设某一计算机系统的设计为:

(1)一位补码乘法器;(组成)

(2)主存储器最小寻址单位为字节;(系统)

(3)采用16M╳8位的DRAM存储器芯片,组装在一块印刷电路板上;(实现)(4)64字节的指令队列。(组成)

可选择答案:A.系统结构 B.计算机组成 C.计算机实现

37.标量流水机主要通过()方法实现并行性的。

A 时间重叠

B 寄存器 C流水线重复 D 资源重复

38.计算机系统结构不包括()。

A 磁盘速度 B数据表示 C 存储器的寻址方式 D信息保护

39.采用系列机方法实现软件可移植必须是()

A 任何类型的系统结构的机器

B 不同系统结构的机器

C 实现相同的机器 D相同系统结构的机器

40.对计算机系统结构不影响的因素是()。

A 价格 B数据结构 C 器件 D 应用

41.对于虚拟存储器,首先进行()地址变换。

A 外部地址变换

B 实地址变换

C 内部地址变换

D 虚地址变换

42.不是存储系统的主要参数的是()。

A 速度

B 接口方式

C 容量

D 价格

43.自定义的数据表示中用于描述复杂多维的数据是()

A带标志符的数据表示 B数据描述符的数据表示

C向量数据表示 D标量数据表示

44.与流水线最大吞吐率高低有关的是()

A 最后空间的延迟时间

B 最快空间的延迟时间

C 最慢空间的延迟时间 D各个空间的延迟时间

45.系列机软件兼容的基本要求和特性是()

A.向上兼容

B.向下兼容

C.向后兼容

D.向前兼容

46.计算机硬件能够直接识别,指令系统能够直接调用的数据类型是()。

A.整型数

B.数据表示

C.浮点数

D.十进制数

47.在计算机系统设计中,提高软件功能实现的比例会()。

A. 提高系统的灵活性

B.减少所需存储容量

C.提高系统的性能价格比

D. 提高解题速度

48.在下列通道中,信息传输的单位是单字节的是()

A. 选择通道

B.数组多路通道

C. 字节多路通道

D.数组多路通道和字节多路通道

49.虚存、CACHE得以实现的理论根据是()。

A. 只加快使用频率高的部件

B.并行性原理

C.程序访问的局部性原理

D.计算机系统的多级层次结构

二、简答题

1.谈谈提高计算机系统性能的方法。

2.引入新的数据表示的其衡量标准是什么?

3.简述在设计主存系统时,计算机系统结构、计算机组成、计算机实现各需要考虑的问题。

4.简述设计RISC结构使用的基本技术。

5.总线控制方式有哪几种?他们的歌有哪些优缺点?

6.简述在现代计算机系统中,应如何考虑中断现场硬件状态的保存并说明理由。

7.简述流水线瓶颈子过程的概念并举例说明消除流水线瓶颈子过程的两种方法。

8.简述系统结构的影响因素有哪些。

9.简述计算机系统结构与计算机组成原理区别于联系。

10.名词解释:模拟,仿真,透明性

11.简述计算机系统结构、计算机组成、计算机实现的关系。

12.如何实现软件的可移植性?

13.试说明Cache的块大小,替换算法,主存容量对命中率的影响。

三.综合题

1.在向量流水处理机中,为了加快向量处理速度,常采用链接的基本条件。在CRAY—1机中执行下面一组指令,已知读主存

为六段流水,向量加为六段流水,向量乘为七段流水,向量倒数为十四段流水,每个流水段为1拍,另外启动功能部件需1拍,打入寄存器需1拍。设向量长度为VL=100,问这组指令全部执行完最少共需多少节拍?最多需多少拍?

⑴ V0 存储器(读向量)

⑵ V1 V0 * V3 (浮点乘)

⑶ V5 V4+V1 (浮点加)

2.在向量流水处理机中,为了加快向量处理速度,常采用链接的基本条件。在CRAY—1机中执行下面一组指令,已知读主存

为六段流水,向量加为六段流水,向量乘为七段流水,向量浮点倒数十四段流水,每个流水段为1拍,另外启动功能部件需1拍,打入寄存器需1拍。设向量长度为VL=64,问这组指令全部执行完最少共需多少节拍?最多需多少拍?

⑴ V0 存储器(读向量)

⑵ V1 V2 + V3 (浮点加)

⑶ V4 V0×V1 (浮点乘)

3.下图所示为一个四段的流水线连接图。

(1)为了提高流水线的性能,需要对该流水线进行改造,请对其进行改造,要求画出改造后的流水线连接图和n=4的时空图;

(2)计算改进后的流水线的吞吐率、加速比和效率;

4.在一个4段的流水线处理机上需经7拍才能完成一个任务,其预约表如下表所示。

(1)分别写出延迟禁止表F、初始冲突向量C;

(2)画出流水线状态转移图;

(3)求出最小平均延迟、流水线的最大吞吐率及其调度时的最佳方案。

(4)按所选择的调度方案,连续输入4个任务,试画出流水线的时空图并求出流水线的最大吞吐率、实际吞吐率和效率。

5.设计算机的主存容量为16MB,Cache的容量为64KB,主存与Cache均按64B大小分块。

1)画出在直接映像方式中,主存与Cache的地址结构格式。

2)若Cache采用组相联映象,每组块数为8块,试给出主存与Cache地址的结构格式。(注:地址格式要求标出各个字段的位号或位数)。

6.设某虚拟存储器上运行的程序含5个虚页,其页地址流依次为4,5,3,2,5,1,3,2,5,1,3。用LRU替换。

(1)用堆栈对该页地址流模拟一次,画出此模拟过程,并标出实页数为3,4,5时的命中

情况。

(2)为获得最高的命中率,应分配给该程序几个实页?最高命中率是多少?

7.某虚拟存储器共有8个页面,每页1024个字,实际主存为4K个字,采用页表法进行地址映像。映Array像表如右图所示。装入位“1”,表示该虚页已经装入内存。

(1)列出会发生页面失效的全部虚页号;

(2)按以下虚地址计算主存实地址:

2,3700,1024,2048,7800,4096

8.某机主存容量为8MB,CACHE容量为64KB,主存与CACHE均按32B的大小分块,如CACHE采用组相连映象,每组块数为4

块。

(1)试画出主存与CACHE地址的结构格式并标出各个字段的位数;

(2)一个主存块可以映象到多少个CACHE块中?一个CACHE块可与多少个主存块有对应关系?

9.设某机I/O系统配置两个I/O通道:一个数组多路通道,一个字节多路通道。其中数组多路通道连接3台硬盘和5台磁带

机;字节多路通道连接3台激光打印机,4台喷墨打印机和2台针式打印机。各设备的数据传送率如下:(1)硬盘 40MB/S (2)磁带机 5MB/S (3)激光打印机 1MB/S

(4)喷墨打印机 0.5MB/S (5)针式打印机 0.2MB/S

试计算每个通道的实际最大流量以及整个I/O系统的流量。

10.假设某模型机共有5条指令I1~I5使用的频度分别:0.45,0.25,0.15,0.10,0.05,利用Huffman算法,构造Huffman

树,计算Huffman编码和平均码长,并分析采用扩展操作码的编码法的优劣。

设某机指令字长为16位,指令系统设有零地址指令,,二地址指令共三类指令,若每个地址字段为6位,已知二地址指令有13条,一地址指令188条,试问该指令系统最多可有多少零地址指令?(要求给出计算过程)

一个通道型I/O系统,所接设备及设备的数据传送率如下表所示:

求出各通道的流量以及I/O系统总的实际最大流量。

计算机系统结构模拟试题(5)

计算机组成原理模拟试题(2) 一、填空题:04分,每题02分 1、X=-0.1001 [X]原=_____________ [X]补=_____________[-X]补=_____________ Y=0.0101 [Y]原=_____________ [Y]补=_____________ [-Y]补=_____________ [X+Y]补=_____________ 2、对西文输出的字符设备,在计算机的内存储器中存储的是字符数据的每个字符的_____________码,输出(包括显示或打印)的则是每个字符的_____________,设备中的字符发生器的主要功能是解决从字符的_____________码和字符的_____________间的对应关系。 二、单选题:20分,每题02分 3、32 x 32点阵汉字的机内编码需要。 A: 16个字节 B: 32个字节 C: 32×2个字节 D: 32×4个字节 4、某机字长32位,采用原码定点整数表示,符号位为1位,数值位为31位,则可表示的最大正整数为,最小负整数为。 A: B: C: D: 5、在定点二进制运算器中,减法运算一般通过来实现。 A: 原码运算的二进制减法器 B: 补码运算的二进制减法器 C: 补码运算的十进制加法器 D: 补码运算的二进制加法器 6、在浮点数运算中产生溢出的原因是。 A: 运算过程中最高位产生了进位或借位 B: 参加运算的操作数超出了机器的表示范围 C: 运算的结果的阶码超出了机器的表示范围 D: 寄存器的位数太少,不得不舍弃最低有效位 7、无论如何划分计算机的功能部件,控制器部件中至少含有。 A: PC、IP B: PC、IR C: IR、IP D: AR、IP 8、某存储器容量为32K×16位,则 A: 地址线为16根,数据线为32根 B: 地址线为32根,数据线为16根

北邮高级计算机系统结构实验二三四五

实验二指令流水线相关性分析 ·实验目的 通过使用WINDLX模拟器,对程序中的三种相关现象进行观察,并对使用专用通路,增加运算部件等技术对性能的影响进行考察,加深对流水线和RISC处理器的特点的理解。 ·实验原理: 指令流水线中主要有结构相关、数据相关、控制相关。相关影响流水线性能。·实验步骤 一.使用WinDLX模拟器,对做如下分析: (1)观察程序中出现的数据/控制/结构相关。指出程序中出现上述现象的指令组合。 (2)考察增加浮点运算部件对性能的影响。 (3)考察增加forward部件对性能的影响。 (4)观察转移指令在转移成功和转移不成功时候的流水线开销。 ·实验过程 一.使用WinDLX模拟器,对做如下分析: } 浮点加、乘、除部件都设置为1,浮点数运算部件的延时都设置为4,如图1: 图1 初始设置 将和加载至WinDLX中,如图2示。

图2 加载程序 1.观察程序中出现的数据/控制/结构相关;指出程序中出现上述现象的指令组合。 1)数据相关 点击F7,使程序单步执行,当出现R-Stall时停止,运行过程中出现下图3所示,输入整数6。 图3 输入整数6 @ 打开Clock Diagram,可以清楚的看到指令执行的流水线如图4所示。 图4 指令流水线 双击第一次出现R-Stall的指令行,如图5所示。

图5 指令详细信息 对以上出现的情况分析如下: 程序发生了数据相关,R-Stall(R-暂停)表示引起暂停的原因是RAW。 lbu r3,0×0(r2) 要在WB周期写回r3中的数据;而下一条指令 & seqi r5,r3,0×a 要在intEX周期中读取r3中的数据。 上述过程发生了WR冲突,即写读相关。为了避免此类冲突, seq r5,r4,0×a的intEX指令延迟了一个周期进行。 由此,相关指令为: 2)控制相关 由图6可以看出,在第4时钟周期:第一条指令处于MEM段,第二条命令处于intEX段,第三条指令出于aborted状态,第四条命令处于IF段。 图 6 指令流水线 }

计算机系统结构试题及答案(二)

计算机系统结构试题及答案 一、单项选择题(本大题共20小题,每小题2分,共20分) 1.以下正确的是()。 A)机箱是计算机的外特性,属系统结构的研究范围 B)集成电路芯片的设计是计算机组成原理的研究范围 C)加法器的设计是计算机实现的研究内容 D)计算机性能评价是计算机系统结构的研究范围 2.在流水线相关处理中,采用()会产生“写-写”相关和“先读后写”相关。 A)猜测法B)顺序流动 C)异步流动 D)相关专用通路3.非线性流水线是指() A)存在分叉连接的流水线B)存在反向连接的流水线 C)一个任务使用多个功能段的流水线D)动态连接的流水线4.网络直径与网络的()有关 A)度B)链路总数 C)结点间通信经过的最多链路数D)通信延迟 5.下列关于存储器的描述,哪个是正确的() A)多体交叉存储器主要解决扩充容量问题 B)Cache的功能全由硬件完成 C)Cache与主存统一编址,即主存空间的某一部分属于Cache D)“主存—外存”的存储层次是为了弥补主存速度的不足 6.在单指令流多数据流计算机中各处理单元必须()。 A)以同步方式在同一时间内执行不同的指令 B)以同步方式在同一时间内执行相同的指令 C)以异步方式在同一时间内执行相同的指令 D)以异步方式在同一时间内执行不同的指令 7.虚拟存储器地址变换是指()。 A)多用户虚地址与实地址如何一一对应 B)程序的逻辑地址变换成主存实地址 C)程序执行时将虚地址变换成对应的实存地址 D)指令的符号地址变换成二进制地址

8.反映网络在理想通信模式下通信带宽的特性是() A)度B)直径C)带宽总和D)等分带宽 9.依据Michael J.Flynn提出的按指令流和数据流的多倍性对计算机系统分类,Illiac IV计算机属于()A)SISD B)SIMD C)MISD D)MIMD 10.全相联地址映象是指()。 A)任何主存页都可装入Cache中任何页的位置 B) 一个虚页只装进固定的主存实页位置 C ) 组之间是固定的,而组内任何主存页可以装入任何Cache页位置 D) 组间可任意装入,组内是固定装入 二、名词解释题(本大题共5小题,每小题4分,共20分)解释每小题所给名词的含义,若解释正确则给分,若 解释错误则无分,若解释不准确或不全面,则酌情扣分。 1.目录表 2.阻塞网络 3. 写直达法 4. 乱序流动 5. 向量链接技术 三、简答题(本大题共4小题,共25分) 1.(5分)存储程序计算机(冯氏机)在系统结构上的主要特点是什么? 2.(5分)在cache容量一定的情况下,增加cache中的块大小能否达到提高cache命中率的效果?为什么? 3.(5分)解释数据相关(局部相关)与控制相关(全局相关)。 4.(10分)有哪几种向量处理方式?它们对向量处理机的结构要求有何不同? 四、综合题(本大题共4小题,共35分) 1. (5分)某计算机系统采用浮点运算部件后使浮点运算速度提高到原来的20倍,而系统运行一程序 的整体性能提高到原来的10倍,试计算该程序中浮点操作所占的比例。

计算机系统结构模拟试题5

计算机组成原理模拟试题(2)一、填空题:04分,每题02分 =_____________ [X]补=_____________补-X][1、 X=-0.1001 [X]原 =_____________ =_____________ =_____________ [-Y]补Y]原=_____________ []补 Y=0.0101 [Y ]补=_____________ [X+Y对西文输出的字符设备,在计算机的内存储器中存储的是 字符数据的每个字符的、 2,设备中的字符_____________(包括显示或打印)的则是每个字 符的码,输出_____________间的对应关_____________发生器的主要功能是解决从字符的 _____________码和字符的系。分二、单选题:20分,每题02 。3、 32 x 32点阵汉 字的机内编码需要 A: 16个字节 B: 32个字节 2个字节 C: 32×个字节 D: 32×4位,则可表示位,数值位为314、某机字长32位,采 用原码定点整数表示,符号位为1 。,最小负整数为的最大正整数为 A: B: C: D: 来实现。 5、在定点二进制运算器中,减法运算一般通过 A: 原码运算的二进制减法器 B: 补码运算的二进制减法器 C: 补码运算的十进制加法器 D: 补码运算的二进制加法器 。 6、在浮点数运算中产生溢出的原因是运算过程中最高位产生了进位或借位 A: 参加运算的操作数超出了机器的表示范围B: C: 运算的结果的阶码超出了机器的表示范围寄存器的位数太少,不得不舍弃最低有效位 D: 。 7、无论如何划分计算机的功能部件,控制器部件中至少含有 IP A: PC、 IR B: PC、、IP C: IR D: AR、IP 8、某存储器容量为32K×16位,则 A: 地址线为16根,数据线为32根 根16根,数据线为32地址线为B: C: 地址线为15根,数据线为16根 D: 地址线为15根,数据线为32根 9、在统一编址方式下,存储单元和I/O设备是靠指令中的来区分的。

计算机体系结构实验报告二

实验二结构相关 一、实验目得: 通过本实验,加深对结构相关得理解,了解结构相关对CPU性能得影响。 二、实验内容: 1、用WinDLX模拟器运行程序structure_d、s 。 2、通过模拟,找出存在结构相关得指令对以及导致结构相关得部件。 3、记录由结构相关引起得暂停时钟周期数,计算暂停时钟周期数占总执行 周期数得百分比。 4、论述结构相关对CPU性能得影响,讨论解决结构相关得方法。 三、实验程序structure_d、s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; < A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit < this is a ment !! A: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 四、实验过程 打开软件,load structure_d、s文件,进行单步运行。经过分析,此程序一 次循环中共有五次结构相关。(Rstall 数据相关Stall 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面得数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关得部件:译码部件。

计算机系统结构简答题复习

计算机系统结构简答题复习(1) 1、如果外设要求的通道实际流量十分接近或等于通道具有的最大流量时, 则可能发生局部的数据丢失问题,我们怎样解决(三种方法)? 答: 1. 增大通道最大流量。 2. 动态改变设备优先级。 3. 增加一定数量的缓存器,尤其是优先级比较低的设备 2、解决软件移植最好的办法有哪些? 1.采用系列机 2.采用模拟与仿真 3.采用统一的高级语言 3、证明在浮点数的字长和表数范围一定时,尾数基值rm取2或4具有最高 的表数精度 4、假设一条指令的执行过程分为"取指令"、"分析"和"执行"三段,每一段 的时间分别为△t、2△t和3△t。在下列各种情况下,分别写出连续执行n条指令所需要的时间表达式。 (1)顺序执行方式。 (2) "取指令"、"分析"和"执行"重叠。 计算机系统结构简答题复习(2) 5、RISC处理机的关键技术有哪四种? 1. 延时转移技术 2. 指令取消技术 3. 重叠寄存器窗口技术 4. 指令流调整技术 6、多处理机有那些基本特点?发展这种系统的主要目的有哪些?多处理机 着重解决那些技术问题? 1. 结构灵活 2. 程序并行 3. 并行任务派生 4. 进程同步 5. 多处理机工作时,要根据任务的多少来调用资源,因此,所需要的资源变化复杂 目的是:利用多台处理机并发执行一个作业,使得执行速度比单处理机块着重解决的问题 着重解决的技术问题:

1. 硬件结构上多处理机,主存,I/O子系统之间应有高带宽,低价格,灵活无规则互联,尽可能不发生信息传送冲突 2. 从并行语言并行算法编译等,最大限度的开发程序并行性 3. 大的任务如何分成多个子任务 4. 从操作系统上解决并行任务分配,调度和资源分配;任务或进程间的同步,死锁竞争等问题的解决 7、向量的处理方式有哪三种?各有何特点? 1. 横向处理方式。向量计算是按行的方式从左至右横向地进行。 2. 纵向处理方式。向量计算是按列的方式自上而下纵向地进行。 3. 纵横处理方式。横向处理和纵向处理相结合的方式。 8、向量处理机实现链接的条件是什么? 1.没有向量寄存器冲突和运算部件冲突。 2. 只有第一个结果送入向量寄存器的那一个周期可以链接。 3. 先行的两条指令产生运算结果的时间必须相等。 4.两条向量指令的向量长度必须相等。 9、提高向量处理机性能的常用技术有那些? 1.链接技术 2.向量循环或分段开采技术 3. 向量递归技术 4.稀疏矩阵的处理技术 10、列出互连网络中四种寻径方式?并指出它们各自优缺点? 1.线路交换。在传递一个信息前需要频繁的建立从源结点到目地结点的物理通路,开销将会很大。 2.存储转发寻址。包缓冲区大,不利于VLSI的实现;时延大,与结点的距离成正比 3.虚拟直通。没有必要等到整个消息全部缓冲后再做路由选择,只要接收到用作寻址的消息头部即可判断,通信时延与结点数无关;同样不利于VLSI 的实现。 4.虫蚀寻址。每个结点的缓冲区小,易于VLSI实现;较低的网络时延。 计算机系统结构简答题复习(3) 11、采用并行处理机的SIMD 计算机主要特点是什么?▲ 1.速度快,而且潜力大 2.模块性好,生产和维护方便 3.可靠性高,容易实现容错和重构 4.效率低。与流水线处理机,向量处理机等比较。依靠是资源重复,而 不是时间重叠,所以其效率要低一些。 5.潜力大。主要依靠增加PE个数,与流水线处理机主要依靠缩短时钟 相比,其提高速度的潜力要大得多。

计算机系统结构模拟题

《计算机系统结构》模拟题 一.判断是非题,对的打√,错的打× 1.系列机是指由一个厂家生产的具有相同组成,但具有不同系统结构和实现的一系列不同型号的机器。 ( × ) 2.Cray 1向量处理机中,由于每个向量寄存器的长度为64,当实际需要处理的向量长度大于64时,它就不能够处理了。 ( × ) 3.按照Flynn 分类法,Illiac IV 阵列处理机是MIMD 计算机。 ( × ) 4.多级混洗交换网络是阻塞网络。 ( √ ) 二.填空题 1.多机系统的互连网络的通信模式可分为4种,其中,一对一的通信模式称为____单播_____模式,一对全体的通信模式为_____广播____模式,多对多的通信模式为____会议_____模式。 2.SIMD 计算机和流水线向量处理机都可以执行向量指令,前者采用___资源重复______并行性,后者采用___时间重叠______并行性。 3.系列机软件兼容必须做到___向后_____兼容,力争做到___向上_____兼容。 4.流水线消除瓶颈段的方法有____细分_____和____重复设置瓶颈段(可交换次序)_____2种方法。 5.设通道数据传送过程中,选择一次设备的时间为 s T ,传送一个字节的时间为D T ,则字 节多路通道最大流量等于____ D s T T 1 _____。 6.Illiac IV 8×8阵列中,网络直径为____7_____。 7.对堆栈型替换算法,增大分配给程序的___主存页面______,对第一级存储器的命中率就会单调____上升_____。 8.从网络的任何结点看,若网络拓扑结构都是相同的,则称这样的网络是___对称______网络。 三.单项选择题 1.在计算机系统层次结构中,从下层到上层,各层相对顺序正确的是( B )。 A.汇编语言机器级-操作系统机器级-高级语言机器级 B.微程序机器级-传统机器语言机器级-汇编语言机器级 C.传统机器语言机器级-高级语言机器级-汇编语言机器级 D.汇编语言机器级-应用语言机器级-高级语言机器级 2.Illiac IV 阵列处理机中,PE 之间所用的互连函数是( A )。

计算机体系结构试题库—简答题

计算机体系结构试题库 简答题(100题) 1.简述CISC结构计算机的缺点。 答: ●在CISC结构的指令系统中,各种指令的使用频率相差悬殊。据统计,有20%的指 令使用频率最大,占运行时间的80%。也就是说,有80%的指令在20%的运行时 间内才会用到。 ●CISC结构指令系统的复杂性带来了计算机体系结构的复杂性,这不仅增加了研制 时间和成本,而且还容易造成设计错误。 ●CISC结构指令系统的复杂性给VLSI设计增加了很大负担,不利于单片集成。 ●CISC结构的指令系统中,许多复杂指令需要很复杂的操作,因而运行速度慢。 ●在CISC结构的指令系统中,由于各条指令的功能不均衡性,不利于采用先进的计 算机体系结构技术(如流水技术)来提高系统的性能。 2.RISC结构计算机的设计原则。 答: A.选取使用频率最高的指令,并补充一些最有用的指令; B.每条指令的功能应尽可能简单,并在一个机器周期内完成; C.所有指令长度均相同; D.只有load和store操作指令才访问存储器,其它指令操作均在寄存器之间进行; E.以简单有效的方式支持高级语言。 3.影响现代微处理器主频提升的主要原因由哪些? 答:线延迟、功耗。 4.指令集格式设计时,有哪三种设计方法? 答:固定长度编码、可变长编和混合编码)三种设计方法。

5.简述存储程序计算机(冯·诺依曼结构)的特点。 答: (1)机器以运算器为中心。 (2)采用存储程序原理。 (3)存储器是按地址访问的、线性编址的空间。 (4)控制流由指令流产生。 (5)指令由操作码和地址码组成。 (6)数据以二进制编码表示,采用二进制运算。 6.在进行计算机系统设计时,一个设计者应该考虑哪些因素对设计的影响? 答: 在进行计算机系统设计时,设计者应该考虑到如下三个方面因素的影响: ●技术的发展趋势; ●计算机使用的发展趋势; ●计算机价格的发展趋势。 7.简述程序翻译技术的特点。 答: 翻译技术是先把N+1级程序全部变换成N级程序后,再去执行新产生的N级程序,在执行过程中N+1级程序不再被访问。 8.简述程序解释技术的特点。 答: 解释技术是每当一条N+1级指令被译码后,就直接去执行一串等效的N级指令,然后再去取下一条N+1级的指令,依此重复进行。 9.经典体系结构的定义是什么? 计算机体系结构是机器级程序员所看到的计算机的属性,即概念性结构与功能特性。10.“线延迟墙”指的是什么?

计算机系统结构总复习题

一、单项选择题 1、直接执行微指令的是( ) A.汇编程序B.编译程序 C.硬件D.微指令程序 2、对系统程序员不透明的应当是( )。 A.Cache存贮器B.系列机各档不同的数据通路宽度C.指令缓冲寄存器D.虚拟存贮器 3、对机器语言程序员透明的是( )。 A.中断字B.主存地址寄存器 C.通用寄存器D.条件码 4、计算机系统结构不包括( )。 A.主存速度B.机器工作状态 C.信息保护D.数据 5、从计算机系统结构上讲,机器语言程序员所看到的机器属性是( )。A.计算机软件所要完成的功能B.计算机硬件的全部组成 C.编程要用到的硬件组织D.计算机各部件的硬件实现 6、计算机组成设计不考虑( )。 A.专用部件设置B.功能部件的集成度 C.控制机构的组成D.缓冲技术 7、以下说法中,不正确的是( )。 软硬件功能是等效的,提高硬件功能的比例会: A.提高解题速度B.提高硬件利用率 C.提高硬件成本D.减少所需要的存贮器用量 8、在系统结构设计中,提高软件功能实现的比例会( )。 A.提高解题速度B.减少需要的存贮容量 C.提高系统的灵活性D.提高系统的性能价格比 9、下列说法中不正确的是( )。 A.软件设计费用比软件重复生产费用高 B.硬件功能只需实现一次,而软件功能可能要多次重复实现 C.硬件的生产费用比软件的生产费用高 D.硬件的设计费用比软件的设计费用低 10、在计算机系统设计中,比较好的方法是( )。 A.从上向下设计B.从下向上设计 C.从两头向中间设计D.从中间开始向上、向下设计11、"从中间开始"设计的"中间"目前多数是在( )。 A.传统机器语言级与操作系统机器级之间 B.传统机器语言级与微程序机器级之间 C.微程序机器级与汇编语言机器级之间 D.操作系统机器级与汇编语言机器级之间 12、系列机软件应做到( )。 A.向前兼容,并向上兼容 B.向后兼容,力争向上兼容

计算机系统结构简答题范文

第1 章系统结构的基本概念 1、为什么将计算机系统看成是多级机器构成的层次结构?P2 2、从机器(汇编)语言程序员的角度来看,以下哪些是不透明的?为什么? 条件码寄存器、磁盘外设、先行进位链、中断寄存器、移位器、I/O端口寄存器 3、就目前通用机来说,计算机系统结构的属性主要包括哪些(03.7)?P3 4、设计指令系统时,以乘法运算为例,简述系统结构设计、计算机组成设计、计算机实现 各应考虑的问题(09.4)。P4 5、简述在设计主存系统时,计算机系统结构、计算机组成、计算机实现各需要考虑的问题 (08.7)。P4 6、简述计算机系统结构、组成和实现三者的相互关系(03.4)。 7、计算机系统结构用软件实现和硬件实现各自的优缺点?P7 8、简述软硬件功能分配的基本原则(06.7)。P8 9、简述计算机系统“由中间开始”设计的基本思想(05.4)其“中间”指的是什么地方?这样 设计的优点是什么(05.7) (07.7)? 10、试述由上往下、由下往上设计思路和存在的问题?P9 11、什么是软件的可移植性(03.7)?为什么要进行软件移植?P10 12、简述采用统一高级语言方法、适用场合、存在问题和应采取的策略。 13、简述统一高级语言的出发点、难点和发展前景(04.4)。 14、采用系列机方法、适用场合、好处、存在问题和应采取的策略P11 15、采用模拟与仿真方法、适用场合、好处、存在问题和应采取的策略。 16、模拟与仿真的主要区别和适合场合是什么(02.4)? 17、软件移植的途径,各受什么限制(08.4)?P14 18、器件的发展对逻辑设计方法的影响(06.4)。P17 19、什么是计算机系统的并行性、开发并行性的目的和两重含义(02.7)?P19 20、从执行程序角度出发,简述并行处理数据的四个等级,给出简单解释,各举一例P19 21、从处理数据的并行上,简述并行处理数据的四个等级,给出简单解释,各举一例P19 22、简要解释提高计算机系统并行性的三个技术途径(07.4),简要解释并举例说明。P20 23、简述计算机系统Flynn分类法的分类角度及类别,并说明各类别的特征(04.7) (09.7)。第2 章数据表示、寻址方式与指令系统 1、数据结构和机器的数据表示之间的关系?引入数据表示的基本原则?P27 2、简述标志符数据表示的主要优点(02.4)。P29 3、标识符数据表示与描述符数据表示有什么不同? 4、使用标志符数据表示会带来什么问题?对此应如何认识。 5、数据描述符和向量数据表示对向量数据结构所提供的支持有什么不同?P30 6、堆栈型机器与通用寄存器型机器的主要区别?堆栈型机器对程序调用的哪些操作提供支持?P32 7、以浮点数数据表示说明数的可表示精度、运算中的精度损失,尾数基值取小对哪个有利

计算机系统结构模拟题

《计算机系统结构》模拟题(补)一.单项选择题 1. SIMD是指()。 A、单指令流单数据流 B、单指令流多数据流 C、多指令流单数据流 D、多指令流多数据流 2. 磁盘外部设备适合于连接到()。 A.字节多路通道B.数组多路通道或选择通道 C.选择通道或字节多路通道D.数组多路通道或字节多路通道 3. 下列()存储设备不需要编址。 A. 通用寄存器 B. 主存储器 C. 输入输出设备 D. 堆栈 4.多处理机的各自独立型操作系统( )。 A.要求管理程序不必是可再入的 B.适合于紧耦合多处理机 C.工作负荷较平衡 D.有较高的可靠性 5.输入输出系统硬件的功能对( )是透明的。 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 6. 实现汇编语言源程序变换成机器语言目标程序是由()。 A.编译程序解释B.编译程序翻译 C.汇编程序解释D.汇编程序翻译 7.全相联地址映象是指( )。 A.任何虚页都可装入主存中任何实页的位置 B.一个虚页只装进固定的主存实页位置 C.组之间是固定的,而组任何虚页可以装入任何实页位置 D.组间可任意装入,组是固定装入 8.( )属于MIMD系统结构。 A.各处理单元同时受同一个控制单元的管理 B.各处理单元同时接受同一个控制单元送来的指令 C.松耦合多处理机和多计算机 D.阵列处理机

9.设16个处理器编号分别为0,1,2,…,15用Cube3互联函数时,第10号处理机与第( ) 号处理机相联。 A.11 B.8 C.14 D.2 10.若输入流水线的指令既无局部性相关,也不存在全局性相关,则( )。 A.可获得高的吞吐率和效率 B.流水线的效率和吞吐率恶化 C.出现瓶颈 D.可靠性提高 11.流水线的技术指标不包括( )。 A.响应比 B.吞吐率 C.加速比 D.效率 12.指令优化编码方法,就编码的效率来讲,方法最好是()。 A. 固定长度编码 B. 扩展编码法 C. Huffman编码法 D. 以上编码都不是 13.RISC 计算机的指令系统集类型是 ( ) 。 A. 堆栈型 B. 累加器型 C. 寄存器—寄存器型 D. 寄存器 - 存储器型 14.相联存储器的访问方式是( )。 A.先进先出顺序访问B.按地址访问 C.无地址访问D.按容访问 15.存储器读写速率越高,每位的成本也越高,存储容量也小。解决这一问题的主要方法是采用( )。 A.多级存储体系结构B.并行存储器 C. Cache D.缓冲技术 16.计算机系统多级层次中,从下层到上层,各级相对顺序正确的应当是()。 A.汇编语言机器级---操作系统机器级---高级语言机器级 B.微程序机器级---传统机器语言机器级---汇编语言机器级 C.传统机器语言机器级---高级语言机器级---汇编语言机器级 D. 汇编语言机器级---应用语言机器级---高级语言机器级 17.对系统程序员不透明的是()。 A.Cache 存储器 B.系列几各档不同的数据通路宽度 C.指令缓冲寄存器 D.虚拟存储器 18.在计算机系统设计中,比较好的方法是()。

北邮计算机系统结构实验报告-实验一到五-WINDLX模拟器

北京邮电大学 实验报告 课程名称计算机系统结构 计算机学院03班 王陈(11)

目录 实验一WINDLX模拟器安装及使用......................................... 错误!未定义书签。 ·实验准备................................................................................ 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验内容及要求.................................................................... 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验二指令流水线相关性分析 ............................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验三DLX处理器程序设计 .................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 A.向量加法代码及性能分析 ................................................... 错误!未定义书签。 B.双精度浮点加法求和代码及结果分析 .............................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验四代码优化 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结+实习体会........................................................... 错误!未定义书签。实验五循环展开 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 矩阵乘程序代码清单及注释说明........................................... 错误!未定义书签。 相关性分析结果........................................................................... 错误!未定义书签。 增加浮点运算部件对性能的影响........................................... 错误!未定义书签。 增加forward部件对性能的影响 ............................................ 错误!未定义书签。 转移指令在转移成功和转移不成功时候的流水线开销 .. 错误!未定义书签。 ·实验总结+实习体会+课程建议......................................... 错误!未定义书签。

计算机系统结构期末考试试题及其答案

计算机系统结构期末考试试题及其答案

《计算机系统结构》期末考试试卷A 卷第 2 页 共 24 页 计算机科学系《计算机系统结构》期末考试试卷(A 卷) 2、此试卷适用于计算机科学与技术本科专业。 一 单选题:(10分,每题1分) 1、 ."启动I/O"指令是主要的输入输出指 令,是属于( B ) A.目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、 输入输出系统硬件的功能对(B )是透 明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、 全相联地址映象是指(A ) A.任何虚页都可装入主存中任何实页的位置 B.一个虚页只装进固定的主存实页位置 C.组之间固定,组内任何虚页可装入任何实页位

置 D.组间可任意装入,组内是固定装入 4、( C ) 属于MIMD系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D.阵列处理机 5、多处理机上两个程序段之间若有先写 后读的数据相关,则(B ) A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、计算机使用的语言是(B) A.专属软件范畴,与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D.属于符号化的机器指令 7、指令执行结果出现异常引起的中断是 (C ) A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 《计算机系统结构》期末考试试卷A卷第 3 页共 24 页

计算机系统结构作业答案第三章(张晨曦)

3.1 -3.3为术语解释等解答题。 3.4 设一条指令的执行过程分为取指令,分析指令和执行指令3个阶段,每个阶段所需时间分别为ΔT, ΔT, 2ΔT,分别求出下列各种情况下,连续执行N条指令所需的时间。 (1) 顺序执行方式 (2) 只有“取指令”与“执行指令”重叠 (3) “取指令”,“分析指令”与“执行指令”重叠 解: (1) 4NΔT (2) (3N+1) ΔT (3) 2(N+1) ΔT 3.6 解决流水线瓶颈问题有哪两种常用方法? 解: (1) 细分瓶颈段 将瓶颈段细分为若干个子瓶颈段 (2) 重复设置瓶颈段 重复设置瓶颈段,使之并行工作,以此错开处理任务 3.9 列举下面循环中的所有相关,包括输出相关,反相关,真数据相关。 for(i = 2; i < 100; i=i+1) { a[i] = b[i] + a[i]; -----(1) c[i+1] = a[i] + d[i]; -----(2) a[i-1] = 2*b[i]; -----(3) b[i+1] = 2*b[i]; -----(4) } 解: 输出相关:第k次循环时(1)与第k+1轮时(3) 反相关:第k次循环时(1)和(2)与第k-1轮时(3) 真数据相关:每次循环(1)与(2),第k次循环(4)与k+1次循环(1),(3),(4) 3.12 有一指令流水线如下所示 50ns 50ns 100ns 200ns (1)求连续如入10条指令的情况下,该流水线的实际吞吐率和效率 (2)该流水线的“瓶颈”在哪一段?请采用两种不同的措施消除此“瓶颈”。对于你所给出 的两种新的流水线连续输入10条指令时,其实际吞吐率和效率各是多少? 解:(1)(m表示流水线级数,n 表示任务数)

计算机系统结构考试题库及答案

计算机系统结构试题及答案 一、选择题(50分,每题2分,正确答案可能不只一个,可单选 或复选) 1.(CPU周期、机器周期)是内存读取一条指令字的最短时间。 2.(多线程、多核)技术体现了计算机并行处理中的空间并行。 3.(冯?诺伊曼、存储程序)体系结构的计算机把程序及其操作数 据一同存储在存储器里。 4.(计算机体系结构)是机器语言程序员所看到的传统机器级所具 有的属性,其实质是确定计算机系统中软硬件的界面。 5.(控制器)的基本任务是按照程序所排的指令序列,从存储器取 出指令操作码到控制器中,对指令操作码译码分析,执行指令操作。 6.(流水线)技术体现了计算机并行处理中的时间并行。 7.(数据流)是执行周期中从内存流向运算器的信息流。 8.(指令周期)是取出并执行一条指令的时间。 9.1958年开始出现的第二代计算机,使用(晶体管)作为电子器件。 10.1960年代中期开始出现的第三代计算机,使用(小规模集成电路、 中规模集成电路)作为电子器件。 11.1970年代开始出现的第四代计算机,使用(大规模集成电路、超 大规模集成电路)作为电子器件。 12.Cache存储器在产生替换时,可以采用以下替换算法:(LFU算法、 LRU算法、随机替换)。

13.Cache的功能由(硬件)实现,因而对程序员是透明的。 14.Cache是介于CPU和(主存、内存)之间的小容量存储器,能高 速地向CPU提供指令和数据,从而加快程序的执行速度。 15.Cache由高速的(SRAM)组成。 16.CPU的基本功能包括(程序控制、操作控制、时间控制、数据加 工)。 17.CPU的控制方式通常分为:(同步控制方式、异步控制方式、联合 控制方式)反映了时序信号的定时方式。 18.CPU的联合控制方式的设计思想是:(在功能部件内部采用同步控 制方式、在功能部件之间采用异步控制方式、在硬件实现允许的情况下,尽可能多地采用异步控制方式)。 19.CPU的同步控制方式有时又称为(固定时序控制方式、无应答控 制方式)。 20.CPU的异步控制方式有时又称为(可变时序控制方式、应答控制 方式)。 21.EPROM是指(光擦可编程只读存储器)。 22.MOS半导体存储器中,(DRAM)可大幅度提高集成度,但由于(刷 新)操作,外围电路复杂,速度慢。 23.MOS半导体存储器中,(SRAM)的外围电路简单,速度(快),但 其使用的器件多,集成度不高。 24.RISC的几个要素是(一个有限的简单的指令集、CPU配备大量的 通用寄存器、强调对指令流水线的优化)。

计算机系统结构实验报告

计算机系统结构实验报告 一.流水线中的相关 实验目的: 1. 熟练掌握WinDLX模拟器的操作和使用,熟悉DLX指令集结构及其特点; 2. 加深对计算机流水线基本概念的理解; 3. 进一步了解DLX基本流水线各段的功能以及基本操作; 4. 加深对数据相关、结构相关的理解,了解这两类相关对CPU性能的影响; 5. 了解解决数据相关的方法,掌握如何使用定向技术来减少数据相关带来的暂停。 实验平台: WinDLX模拟器 实验内容和步骤: 1.用WinDLX模拟器执行下列三个程序: 求阶乘程序fact.s 求最大公倍数程序gcm.s 求素数程序prim.s 分别以步进、连续、设置断点的方式运行程序,观察程序在流水线中的执行情况,观察 CPU中寄存器和存储器的内容。熟练掌握WinDLX的操作和使用。 2. 用WinDLX运行程序structure_d.s,通过模拟找出存在资源相关的指令对以及导致资源相 关的部件;记录由资源相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行周期数的 百分比;论述资源相关对CPU性能的影响,讨论解决资源相关的方法。 3. 在不采用定向技术的情况下(去掉Configuration菜单中Enable Forwarding选项前的勾选符),用WinDLX运行程序data_d.s。记录数据相关引起的暂停时钟周期数以及程序执行的 总时钟周期数,计算暂停时钟周期数占总执行周期数的百分比。 在采用定向技术的情况下(勾选Enable Forwarding),用WinDLX再次运行程序data_d.s。重复上述3中的工作,并计算采用定向技术后性能提高的倍数。 1. 求阶乘程序 用WinDLX模拟器执行求阶乘程序fact.s。这个程序说明浮点指令的使用。该程序从标准 输入读入一个整数,求其阶乘,然后将结果输出。 该程序中调用了input.s中的输入子程序,这个子程序用于读入正整数。 实验结果: 在载入fact.s和input.s之后,不设置任何断点运行。 a.不采用重新定向技术,我们得到的结果

相关文档
最新文档