计算机系统结构复习提纲

第1章

1.1.1 简要理解什么是图灵机和通用图灵机

图灵机：模拟人们用纸笔进行数学运算的过程的假想的机器

通用图灵机：能够模拟其它所有图灵机的图灵机

1.1.2 从计算机语言的角度看，计算机系统的多级层次结构是怎样的

1.1.3 翻译与解释的区别

翻译：先把高一级机器上的程序全部转换为低一级机器上等效的目标程序，然后再在这低一级机器上运行。执行过程中，高一级机器上的程序不再被访问。

解释：并不产生目标程序，每取高一级机器上的程序中的一条语句，就直接转去执行低一级机器上的一段等效的指令。高一级机器上的语句被低一级机器逐条直接执行。

一般来说，解释执行比编译执行耗时多，但占用的存储空间要少。

1.1.4 狭义的计算机系统结构的概念，它与计算机组成和实现的区别与联系

计算机系统结构（狭义）：计算机系统中软硬件的交界面，即机器语言程序员所看到的传统机器级的属性。

计算机组成（也称微体系结构）：计算机系统结构的逻辑实现包含物理机器级中的数据流和控制流的组成以及逻辑设计等。着眼于硬件系统在逻辑上如何组织的，侧重各部件的逻辑功能以及各部件之间的联系。

计算机实现（即硬件实现）：计算机组成的物理实现包括处理机、主存等部件的物理结构，器件的集成度和速度，模块、插件、底板的划分与连接，信号传输，电源、冷却及整机装配技术等。着眼于器件技术（起主导作用）、微组装技术。

具有相同系统结构的计算机可以采用不同的计算机组成，同一种计算机组成又可以采用多种不同的计算机实现。

1.1.5 广义的计算机系统结构指什么

广义的计算机系统结构概念则囊括了以上体系结构、组成和实现三个方面。

1.1.6 计算机系统结构分类：Flynn分类法、冯氏分类法、Handler分类法

Flynn分法（指令流、数据流）：

单指令流单数据流SISD 传统的顺序处理计算机

（Single Instruction stream Single Data stream）

单指令流多数据流SIMD 阵列机、向量机、GPU

（Single Instruction stream Multiple Data stream）

多指令流单数据流MISD 无实际机器

（Multiple Instruction stream Single Data stream）

多指令流多数据流MIMD 多处理机

（Multiple Instruction stream Multiple Data stream）

冯氏分法（字位）：

字串位串：n＝1，m＝1。一次处理单个字的一个位(第一代计算机发展初期的纯串行计算机)

字串位并：n＞1，m＝1。同时处理单个字的多个位，如16位、32位等。传统的单处理机，SISD

字并位串：n＝1，m＞1。同时处理多个字的同一位（位片）。某些SIMD

字并位并：n＞1，m＞1。同时处理多个字的多个位。某些SIMD和MIMD

Handler 分类法：

根据并行度和流水线程度对计算机进行分类把计算机的硬件结构分成 3 个层次：

程序控制部件（ PCU ）的个数 k

算术逻辑部件（ ALU ）或处理部件（ PE ）的个数 d 每个算术逻辑部件包含基本逻辑线路(ELC)的套数 w

1.2.1计算机系统设计的5大（定量）原理是哪5个

经常、A/C 、局部、并行

1.2.2 Amdahl 定律例题例

1.1,1.2

1.2.3 CPI 公式例题例1.3

例1.3假设FP 指令的比例为25%，其中，FPSQR 占全部指令的比例为2%FP 操作的CPI 为4FPSQR 操作的CPI 为20，其他指令的平均CPI 为1.33。现有两种改进方案，第一种是把FPSQR 操作的CPI 减至2，第二种是把所有的FP 操作的CPI 减至2，试比较两种方案对系统性能的提高程度。

解没有改进之前，每条指令的平均时钟周期CPI 为：

()()2

%7533.1%2541=?+?=??? ??

?=∑=n

i i i IC IC CPI CPI

（1）采用第一种方案

FPSQR操作的CPI由CPI FPSQR＝20减至CPI’FPSQR＝2，则整个系统的指令平均时钟周期数为：

CPI1＝CPI-(CPI FPSQR-CPI’FPSQR)×2%

＝2-(20-2)×2%＝1.64

（2）采用第二种方案

所有FP操作的CPI由CPI FP＝4减至CPI’FP＝2，则整个系统的指令平均时钟周期数为：

CPI2＝CPI-(CPI FP-CPI’FP)×25%

＝2-(4-2)×25%＝1.5

从降低整个系统的指令平均时钟周期数的程度来看，第二种方案优于第一种方案。

1.2.4计算机系统设计有哪3种主要方法（top-down，bottom-up，middle-out），每种方法的适用领域

top-down:

首先确定面对使用者的那级机器的基本特征、数据类型和格式、基本命令等

然后再逐级往下设计，每级都考虑如何优化上一级的实现

适用于专用机的设计

bottom-up:

从层次结构的最下面一级开始，逐层往上设计各层的机器

采用这种方法时，软件技术完全处于被动状态，这会造成软件和硬件的脱节，使整个系统的效率降低在早期被采用得比较多，现在已经很少被采用了

“由上往下”和“由下往上”设计方法的主要缺点软、硬件设计分离和脱节

解决方法：综合考虑软、硬件的分工，从中间开始

middle-out:

首先要进行软、硬件功能分配，确定好这个界面

然后从这个界面开始，软件设计者开始往上设计操作系统、汇编、编译系统等，硬件设计者开始往下设计传统机器级、微程序机器级等

适用于通用机的设计

1.3.1程序执行的CPU时间计算

CPU时间=用户时间+系统时间

1.3.2会用加权算数平均时间、加权几何平均值对机器性能进行比较

第一章PPT 59屏性能比较

1.3.3常用的基准测试程序有哪些，其中最流行的合成测试程序有哪两种

核心测试程序：从真实程序中选出的关键代码段构成的小程序

小测试程序：简单的只有几十行的小程序

合成的测试程序：人工合成出来的程序

Whetstone与Dhrystone是最流行的合成测试程序(前者测浮点运算性能，后者测整数和字符串运算性能)

1.4.1冯·诺依曼结构的理解, 冯·诺依曼结构与哈佛结构的比较

冯·诺依曼结构就是一种存储程序计算机结构，现在多专指：指令和数据共享存储和传输总线的存储程序计算机冯·诺依曼瓶颈问题：对指令和数据的访问不能同时进行

冯·诺依曼结构的主要特点：

由运算器、控制器、存储器、输入和输出设备5 部分构成；

计算机以运算器为中心；

存储程序原理，且存储器中指令和数据同等对待；

存储器是按地址访问、按顺序线性编址的一维结构，每个单元的位数是固定的；

指令的执行是顺序的

一般是按照指令在存储器中存放的顺序执行

程序的分支由转移指令实现

由指令计数器PC指明当前正在执行的指令在存储器中的地址；

指令由操作码和地址码组成；

指令和数据均以二进制编码表示，采用二进制运算

简述：冯·诺依曼结构最根本特点是存储程序原理；共享存储，集中控制，顺序执行，二进制

哈佛结构：把指令和数据的存储和传输总线分开

1.4.2什么是RISC和CISC

RISC：精减指令集计算机

CISC：复杂指令集计算机

1.4.3实现软件可移植性的常用方法,其中模拟和仿真的区别

常用方法：采用系列机、模拟与仿真、统一高级语言

模拟：用软件的方法在一台现有的机器（称为宿主机）上实现另一台机器（称为虚拟机）的指令集

仿真：用一台现有机器（宿主机）上的微程序去解释实现另一台机器（目标机）的指令集

模拟与仿真的主要区别：

模拟是用机器语言程序解释另一机器的机器指令；仿真是用微程序直接解释另一机器的机器指令；

1.4.4晶体管的动态功耗取决于哪些因素（会据此做小计算）

正比于?×电容负载×电压平方×开关频率

1.5.1并行性的概念（同时性和并发性）

并行性：计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。只要在时间上相互重叠，就存在并行性同时性：两个或两个以上的事件在同一时刻发生

并发性：两个或两个以上的事件在同一时间间隔内发生

1.5.2并行性的等级划分（分别从处理数据/执行程序/当前流行应用的角度）

（1）从处理数据的角度来看，并行性等级从低到高可分为：

字串位串：每次只对一个字的一位进行处理最基本的串行处理方式，不存在并行性

字串位并：同时对一个字的全部位进行处理，不同字之间是串行的开始出现并行性

字并位串：同时对许多字的同一位（称为位片）进行处理具有较高的并行性

全并行：同时对许多字的全部位或部分位进行处理最高一级的并行

（2）从执行程序的角度来看，并行性等级从低到高可分为：

指令内部并行：单条指令中各微操作之间的并行

指令级并行：并行执行两条或两条以上的指令

线程级并行：并行执行两个或两个以上的线程通常是以一个进程内派生的多个线程为调度单位。

进程级并行：并行执行两个或两个以上的进程以进程或子程序为调度单元。

作业级并行：并行执行两个或两个以上的作业或程序

（3）从现在流行的应用的角度，对并行性的一种新划分：

指令级并行：利用流水线思想开发的指令间并行

数据级并行：向量机、GPU等SIMD型处理机将单条指令并行应用于一个数据集（多个数据项）

线程级并行：并行执行多个线程

请求级并行：并行执行多个（请求）任务

1.5.1提高并行性有哪三种途径

时间重叠：引入时间因素，让多个处理过程在时间上相互错开，轮流重叠地使用同一套硬件设备的各个部分，以加快硬件周转而赢得速度

资源重复：引入空间因素，以数量取胜。通过重复设置硬件资源，大幅度地提高计算机系统的性能

资源共享：这是一种软件方法，它使多个任务按一定时间顺序轮流使用同一套硬件设备

1.5.2简要回答并行机的发展的5个阶段

并行机的萌芽阶段（1964年～1975年）

向量机的发展和鼎盛阶段（1976年～1990年）

MPP出现和蓬勃发展阶段（1990年～1995年）

各种体系结构并存阶段（1995年～2000年）

机群蓬勃发展阶段（2000年以后）

第2章：

2.1.1计算机指令集架构(ISA)有哪三种类型,其中哪种是现代的主流结构。常见的指令集中x86/ARM/MIPS/Powe 分别属于RM 型还是RR 型

堆栈结构累加器结构通用寄存器结构（现代的主流结构） RM 型：x86

RR 型：ARM 、MIPS 、PowerPC

2.2.1信息存储的整数边界对齐原则（结合存储对齐的作业做理解）信息在主存中存放的起始地址必须是该信息宽度（字节数）的整数倍 2.

3.1简要说明指令系统设计的基本要求有哪5点完整性、规整性、正交性、高效率、兼容性

2.3.2指令操作码的优化编码方法有哪三种，其中哈夫曼编码是重点，掌握例2.1

哈夫曼编码、等长扩展码、定长操作码

例2.1 假设某模型机有7

条指令，这些指令的使用频度如下表所示。

(1) 计算这7条指令的操作码编码的最短平均码长；17

.2log 7

12==∑=i i i p p H －

(2) 画出哈夫曼树，写出这7条指令的哈夫曼编码，并计算该编码的平均码长和信息冗余量。

1 1 1

1 1 1 0 0 0

76543211.00

0.60 0.30 0.15 0.06 0.09

0.03 0.03 0.04 0.40 0.30 0.15 0.05

2.3.3指令字有哪3种编码格式（根据指令字长）

可变长度编码格式、固定长度编码格式、混合型编码格式

2.4.1简要说明设计RISC 机器遵循的6条原则

指令条数少、指令功能简单；采用简单而又统一的指令格式，并减少寻址方式；采用 load-store 结构；大多数指令都采用硬连逻辑来实现；充分利用流水技术来提高性能；强调优化编译器的作用 2.5.1数据表示与数据结构概念的区别

数据表示：计算机硬件能够直接识别、指令系统可以直接调用的数据类型数据结构：由软件进行处理和实现的各种数据类型

2.6.1 MIPS 处理器的寄存器有哪些，MIPS 的数据寻址方式有哪些 32个64位通用寄存器（GPRs ）、32个64位浮点数寄存器（FPRs ）例如： FCSR ：浮点状态寄存器，32位，保存有关浮点操作结果的信息 PC ：程序计数器，32位

LO ：存放乘积的低位或除法的商，64位 HI ：存放乘积的高位或除法的余数，64位 MIPS 的数据寻址方式：

1. 寄存器寻址、立即数寻址与偏移量寻址

2. 寄存器间接寻址

3. 直接寻址

4.MIPS 的存储器是按字节寻址的，地址为 64 位

5. 所有存储器访问都必须是边界对齐的 2.

6.2 MIPS 的指令格式的简要特点

定长操作码:6位、定长指令字:32位、寻址方式编码到操作码中、3种指令格式

I 类指令

R 类指令

J 类指令

第3章

3.1.1理解流水线的概念，流水线时空图的含义

流水线技术：把一个过程 (任务 ) 分解为若干个子过程(工序)，每个子过程由专门的功能部件来实现。把多个这样的过程(任务)

在时间上错开，依次使用各功能部件，这样，每个子过程就可以与其它的子过程并行（重叠）进行。

rt rs 立即数（immediate ）操作码 6 5 5 16 0 5 6 10 11 15 16 31 操作码 rs 6 5 5 6 rt 5 rd funct 0 5 6 10 11 15 16 31 20 21 sham 25 26 5 26

操作码 6 偏移量 31 0 5 6

3.1.2单功能与多功能流水线，静态与动态流水线，顺序与乱序流水线

3.2会求流水线的性能指标（吞吐率、加速比和效率），会做例3.1和例3.2（要求既要能画出时空图，又要会计算3大性能指标，自己将运算数量扩为5到6个）

3.4 流水线冲突有哪3种类型，每种冲突举例及解决办法（可结合实验2加深理解，重点理解解决数据冲突的定向（Forwarding）、指令调度（Scheduling）技术，以及解决控制冲突的延迟槽(Delay Slot)技术（注：延迟槽只适合在按序执行的单发射处理器上用）

结构冲突：因硬件资源满足不了指令重叠执行的要求而发生的冲突。

结构冲突举例：访存冲突有些流水线处理机只有一个存储器，将数据和指令放在一起，访存指令会导致访存冲突。解决办法Ⅰ：插入暂停周期（“流水线气泡”或“气泡”）引入暂停后的时空图

解决方法Ⅱ：设置相互独立的指令存储器和数据存储器或设置相互独立的指令Cache和数据Cache。

数据冲突：当指令在流水线中重叠执行时，因需要用到前面指令的执行结果而发生的冲突。

通过定向技术减少数据冲突引起的停顿（定向技术也称为旁路或短路）；让编译器重新组织指令顺序来消除冲突，这种技术称为指令调度或流水线调度。

控制冲突：流水线遇到分支指令和其它会改变PC值的指令所引起的冲突。

第4章

4.1 向量和向量处理机的概念，向量的3种处理方式

向量由一组有序、具有相同类型和位数的元素组成

在流水线处理机中，设置向量数据表示和相应的向量指令，称为向量处理机

处理方式：

横向(水平)处理方式，数据相关：N次，不适合于向量处理机的并行处理

纵向(垂直)处理方式，数据相关：1次

纵横(分组)处理方式，组内数据相关：1次

4.2 向量处理机有哪两种典型结构

存储器-存储器型结构（纵向）寄存器-寄存器型结构（分组处理方式采用）

4.4 什么是向量处理机的最大（峰值）性能，半性能向量长度，向量长度临界值

R ∞表示当向量长度为无穷大时，向量处理机的最高性能，也称为峰值性能

半性能向量长度n1/2是指向量处理机的性能为其最大性能的一半时所需的向量长度

向量长度临界值nv是指：对于某一计算任务而言，向量方式的处理速度优于标量串行方式处理速度时所需的最小向量长度

补充：x86处理器中的向量扩展指令集有哪些，什么是GPU，什么是CUDA

MMX：Multi-Media Extensions，多媒体扩展指令集

SSE：Streaming SIMD Extensions，SIMD流扩展指令集

SSE2 / SSE3 / SSE4: 是SSE的扩展技术

AVX ：Advanced Vector Extensions：高级向量扩展指令集

Graphic Processing Unit，图形处理器

CUDA：Compute Unified Device Architecture NVIDIA公司提出的基于NVIDIA的GPU的一个并行计算平台和编程模型向量机、GPU和向量扩展指令都属于SIMD架构，都是数据集并行技术。

第5章

5.1.1通过例5.1和例5.2理解循环展开技术

看PPT

5.2.1在指令级并行中，要正确地执行程序，必须保持的最关键的两个属性是什么

数据流(Data Flow) 异常行为(Exception)

5.3.1指令静态调度与动态调度的区别

静态调度它不是在程序执行的过程中、而是在编译期间进行代码调度和优化

动态调度在程序的执行过程中，依靠专门硬件对代码进行调度

5.3.2为了支持乱序执行，我们将5段流水线的译码阶段再细分为哪两个阶段

发射（Issue，IS）：指令译码，检查是否存在结构冲突。若不存在，就将指令发射出

读操作数（Read Operands，RO）：等待数据冲突消失（如果有的话），然后读操作数

5.3.3两种比较典型的动态调度算法是哪两种

记分牌算法：Scoreboard

Tomasulo算法: 改进了记分牌算法，应用更广

5.4.1什么是动态分支预测，简述分支目标缓冲器BTB的工作原理

动态分支预测：在程序运行时，根据分支指令过去的表现来预测其将来的行为。

将分支成功的分支指令的地址和它的分支目标地址都放到一个缓冲区中保存起来，缓冲区以分支指令的地址作为标识。这个缓冲区就是分支目标缓冲器

5.4.2什么是ROB，ROB在乱序执行的计算机中起什么作用

重排序缓冲器

通过ROB实现了指令乱序执行却能顺序完成，能够实现精确异常

5.5.1什么是超标量技术(主流的多指令发射技术）

是当前主流的多指令发射技术。

其实质是多条流水线的同时处理（依赖硬件资源重复设置）。

在每个时钟周期发射的指令条数不固定（有上限n，称n-发射）

用硬件完成冲突检测，以动态调度为主。

第7章

7.1.1多级存储系统利用的是什么原理

局部性原理

7.1.2多级存储系统有哪几个性能指标（参数），如何计算

7.1.3 Cache-主存-辅存三级存储系统中每个层次的作用

“Cache - 主存”层次：弥补主存速度的不足，完全由硬件实现，对程序员是透明的

“主存－辅存”层次：弥补主存容量的不足，依靠辅助软硬件，特别是操作系统，常用来实现虚拟存储器

7.2.1三种映像规则的概念，相联度的概念

全相联：主存中的任一块可以被放置到Cache中的任意一个位置。

直接映象：主存中的每一块只能被放置到Cache中唯一的一个位置。

组相联：主存中的每一块可以被放置到Cache中唯一的一个组中的任何一个位置。

组相联中若每组有n个块(n＝M/G )，则n 称为相联度。

7.2.2简述CPU如何通过查找目录表在Cache中找到需要的块（即查找方法）

先通过主存块地址中的索引确定在Cache中的候选位置

再查找候选位置所对应的目录表项(将主存地址中的标识与目录表项中的标识进行比较)

7.2.3 Cache系统中的替换算法解决什么问题，有哪几种替换算法。能够简述LRU算法的两种硬件实现方法（堆栈法和比较对法）的原理。会画原理图实现“比较对法”并分析所需的硬件量

所要解决的问题：当Cache中新调入一块，而Cache却已被占满时，替换哪一块？

直接映象Cache中替换最简单，只有一个块，别无选择

在组相联和全相联Cache中，则有多个块供选择

主要的替换算法有三种

随机法优点：实现简单

先进先出法(FIFO) 不符合局部性原理，很少采用

最近最少使用法LRU 性能最好，广泛采用

堆栈法：用一个堆栈来记录组相联Cache的同一组中各块被访问的先后次序；用堆栈元素的物理位置来反映先后次序

比较对法:让各（候选）块两两组合，构成比较对。每一个比较对用一个触发器的状态来表示它所相关的两个块最近一次被访问的远近次序，再经过逻辑组合就可找到LRU块。

7.2.4有哪两种写策略（写命中时）

写直达法：执行“写”操作时，不仅写入Cache，而且也写入下一级存储器

写回法：执行“写”操作时，只写入Cache。仅当Cache中相应的块被替换时，才写回主存。常设置修改位标志

7.2.5例7.1 Cache性能计算

例7.1 用一个和Alpha AXP类似的机器作为第一个例子。假设Cache不命中开销为50个时钟周期，当不考虑存储器停顿时，所有指令的执行时间都是2.0个时钟周期，访问Cache不命中率为2%，平均每条指令访存1.33次。试分析Cache对性能的影响。

解：CPU时间有cache＝IC×(CPI execution＋每条指令的平均访存次数×不命中率×不命中开销)×时钟周期时间

＝IC ×（2.0＋1.33×2 %×50）×时钟周期时间

＝IC ×3.33×时钟周期时间

实际CPI ：3.33, 3.33/2.0 = 1.67(倍)

CPU时间也增加为原来的1.67倍。

但若不采用Cache, 则：CPI＝2.0＋50×1.33＝68.5

7.2.6一般从哪三个方面改进Cache的性能

降低不命中率减少不命中开销减少Cache命中时间

7.3.1有哪三种类型的不命中，分别用什么方法可以减少每种不命中

强制不命中增加块大小，预取

容量不命中只能增加Cache容量

冲突不命中提高相联度（理想情况：全相联）

7.3.2增加Cache块大小、增加Cache的容量、提高相联度如何影响不命中率

对于给定的Cache容量，当块大小增加时，不命中率开始是下降，后来反而可能上升了。Cache容量越大，使不命中率达到最低所需的块大小就越大。

降低不命中率最直接的方法是增加Cache的容量，增加Cache容量会降低不命中率，但当Cache容量已经很大时，

再增大Cache的效果也会不明显

提高相联度会降低不命中率，但相联度过高也意义不大。通常，一级Cache相联度不会超过8。提高相联度是以增加命中时间为代价。

7.3.3伪相联Cache 的工作原理是什么，并说明什么是快速命中与慢速命中

在逻辑上把直接映象Cache的空间上下平分为两个区。对于任何一次访问，伪相联Cache先按直接映象Cache的方式去处理。若正常命中，则其访问过程与直接映象Cache的情况一样。若不命中，则再到另一区相应的位置去查找；若找到，则发生了伪命中，否则就只好访问下一级存储器。

正常命中伪命中

7.3.4编译优化技术中内外循环交换例子的理解

7.3.5简要回答什么是“牺牲”Cache（Victim Cache）

一种能减少冲突不命中次数而又不影响时钟频率的方法。

基本思想：在Cache和它从下一级存储器调数据的通路之间设置一个全相联的小Cache，称为“牺牲”Cache（Victim Cache）。用于存放被替换出去的块(称为牺牲者)，以备重用。

每当发生不命中时，先检查牺牲Cache中有无所需的块，若没有，再访问主存。

7.4 两级Cache的性能计算题例7.3（会自己推广到3级Cahce计算）

7.6并行主存系统有哪两种，理解多体交叉存储器中低位交叉编址方式（给定体号和体内地址，会求主存单元的编址；给定某单元的编址，会求存储体号和体内地址。并且能列表写出每个单元的地址[参见课件108屏例题]）

并行主存系统是在一个访存周期内能并行访问多个存储字的存储器。两种：单体多字存储器、多体交叉存储器

第8章

8.2 什么是MTTF, MTTR, MTBF。系统失效率与可靠性计算例题：例8.1

平均无故障运行时间MTTF：系统从正常运行开始到发生故障的平均时间(Mean Time To Failure)

平均故障修复时间MTTR：系统从发生故障开始到故障修复完成的平均时间。反映系统中断服务的时间(Mean Time To Repair)

平均故障间隔时间MTBF：MTBF=MTTF+MTTR

例8.1 假设磁盘子系统的组成部件和它们的MTTF如下：

（1）磁盘子系统由10个磁盘构成，每个磁盘的MTTF为1000000小时；

（2）1个SCSI控制器，其MTTF为500000小时；

（3）1个不间断电源，其MTTF为200000小时；

（4）1个风扇，其MTTF为200000小时；

（5）1根SCSI连线，其MTTF为1000000小时。

假定每个部件的生存期服从指数分布，同时假定各部件的故障是相互独立的，求整个系统的MTTF。

解整个系统的失效率为：

系统的MTTF为系统失效率的倒数，即：

即将近5年。

8.3 什么是RAID（中英文），RAID一共有哪几级，哪些在实际应用中常见

廉价磁盘冗余阵列RAID(Redundant Arrays of Inexpensive Disks ) 也称：独立磁盘冗余阵列(Independent)

分级：RAID0 1 2 3 4 5 6 10 01 50

实际应用中常见的是RAID0、RAID1、RAID5、RAID10和RAID50.

在服务器中RAID5和RAID50现在也不建议使用了，只推荐RAID1和RAID10。

第10章

10.1.1根据存储器的组织结构，可以把现有的MIMD机器分为哪两类,SMP、DSM分别指什么机器，UMA、NUMA、NORMA分别指什么访存模型（记住中英文全称）

集中式共享存储器结构分布式存储器多处理机

对称共享存储器多处理机SMP（Symmetric shared-memory MultiProcessor）

分布式共享存储器系统DSM: Distributed Shared-Memory

UMA（Uniform Memory Access，均匀存储访问）

NUMA（Non-Uniform Memory Access非均匀存储访问）

NORMA (No-Remote Memory Access，非远程存储访问)

10.1.2分布式存储器结构的多处理机系统有哪两种编址方式的存储器结构，分别采用什么通信机制

统一编址共享存储器通信机制

独立编址消息传递通信机制

10.1.3并行性相关的系统加速比计算题例10.1

10.1.4什么是多核处理器CMP，如何使用OpenMP编译制导语句将一个串行循环并行化

多核处理器又称单芯片多处理器（CMP, Chip Multi Processor），是在单个芯片内集成多个处理器。

10.2.1什么是多处理机的Cache一致性问题

允许共享数据进入Cache，就可能出现多个处理器的Cache中都有同一存储块的副本，当其中某个处理器对其Cache 中的数据进行修改后，就会使得其Cache中的数据与其他Cache中的数据不一致。

10.2.2常用的多Cache一致性协议有哪两种

目录式协议（directory）适于较大规模的多处理机

物理存储器中数据块的共享状态被保存在一个称为目录的地方。

监听式协议（snooping）适于较小规模

当物理存储器中的数据块被调入Cache时，其共享状态信息与该数据块一起放在该Cache中。系统中没有集中的状态表。

10.2.3监听协议操作过程的理解（结合实验5），给定一个访问序列，能写出监听协议所进行的操作（含状态的转换）

10.5.1什么是同时多线程(SMT)技术

同时多线程技术(SMT，Simultaneous MultiThreading)

是一种在动态多发射的处理器(主要是超标量处理器)上同时开发指令级并行和线程级并行的技术。

在细粒度多线程技术的基础上，允许在一个周期内发射来自不同线程的多条指令。

Intel的超线程技术就是SMT的一种实现

10.6.1常见的MIMD型并行计算机有哪几类

并行向量处理机（PVP）

对称式共享存储器多处理机（SMP）

分布式共享存储器多处理机（DSM）

大规模并行处理机（MPP）

机群/集群（Cluster）

10.6.2什么是集群，什么是仓库级计算机（WSC）

机群（集群，Cluster）

一种价格低廉、易于构建、可扩放性极强的并行计算机系统；它由多台同构或异构的独立计算机通过商用高性能网络或局域网互连在一起，协同完成特定的并行计算任务；从用户的角度来看，集群是一个单一、集中的计算资源。

集群的主要特点

每个结点都是一台完整的计算机，拥有本地磁盘和操作系统，可以作为一个单独的计算资源供用户使用。

机群的各个结点一般通过商品化网络连接在一起；

网络接口以松散耦合的方式连接到结点的I/O总线。

当前最大规模的集群，称为仓库级计算机（WSC）

第11章

简述什么是数据流机、什么是智能机

数据流计算机

采用数据驱动方式工作，没有程序计数器，没有常规的变量概念。

指令是在数据可用性的控制下并行执行的。

智能计算机应该主要是面向知识处理的计算机系统

信息加上语义就形成了知识，对知识进行获取、表示，并利用其进行演绎推理，”思维“产生出新的知识，就有了智能。

智能的高低主要体现在知识获取和知识利用的能力高低上。

计算机系统结构模拟试题(5)

计算机组成原理模拟试题（2）一、填空题:04分，每题02分 1、X=-0.1001 ［X］原=_____________ [X］补=_____________［-X］补=_____________ Y=0.0101 ［Y］原=_____________ ［Y］补=_____________ [-Y］补=_____________ ［X+Y］补=_____________ 2、对西文输出的字符设备，在计算机的内存储器中存储的是字符数据的每个字符的_____________码，输出(包括显示或打印)的则是每个字符的_____________，设备中的字符发生器的主要功能是解决从字符的_____________码和字符的_____________间的对应关系。二、单选题:20分，每题02分 3、32 x 32点阵汉字的机内编码需要。 A: 16个字节 B: 32个字节 C: 32×2个字节 D: 32×4个字节 4、某机字长32位，采用原码定点整数表示，符号位为1位，数值位为31位，则可表示的最大正整数为，最小负整数为。 A: B: C: D: 5、在定点二进制运算器中，减法运算一般通过来实现。 A: 原码运算的二进制减法器 B: 补码运算的二进制减法器 C: 补码运算的十进制加法器 D: 补码运算的二进制加法器 6、在浮点数运算中产生溢出的原因是。 A: 运算过程中最高位产生了进位或借位 B: 参加运算的操作数超出了机器的表示范围 C: 运算的结果的阶码超出了机器的表示范围 D: 寄存器的位数太少，不得不舍弃最低有效位 7、无论如何划分计算机的功能部件，控制器部件中至少含有。 A: PC、IP B: PC、IR C: IR、IP D: AR、IP 8、某存储器容量为32K×16位，则 A: 地址线为16根，数据线为32根 B: 地址线为32根，数据线为16根

北邮高级计算机系统结构实验二三四五

实验二指令流水线相关性分析 ·实验目的通过使用WINDLX模拟器，对程序中的三种相关现象进行观察，并对使用专用通路，增加运算部件等技术对性能的影响进行考察，加深对流水线和RISC处理器的特点的理解。 ·实验原理：指令流水线中主要有结构相关、数据相关、控制相关。相关影响流水线性能。·实验步骤一．使用WinDLX模拟器，对做如下分析：（1）观察程序中出现的数据/控制/结构相关。指出程序中出现上述现象的指令组合。（2）考察增加浮点运算部件对性能的影响。（3）考察增加forward部件对性能的影响。（4）观察转移指令在转移成功和转移不成功时候的流水线开销。 ·实验过程一．使用WinDLX模拟器，对做如下分析： } 浮点加、乘、除部件都设置为1，浮点数运算部件的延时都设置为4，如图1：图1 初始设置将和加载至WinDLX中，如图2示。

图2 加载程序 1.观察程序中出现的数据/控制/结构相关；指出程序中出现上述现象的指令组合。 1）数据相关点击F7，使程序单步执行，当出现R-Stall时停止，运行过程中出现下图3所示，输入整数6。图3 输入整数6 @ 打开Clock Diagram，可以清楚的看到指令执行的流水线如图4所示。图4 指令流水线双击第一次出现R-Stall的指令行，如图5所示。

图5 指令详细信息对以上出现的情况分析如下：程序发生了数据相关，R-Stall（R-暂停）表示引起暂停的原因是RAW。 lbu r3,0×0(r2) 要在WB周期写回r3中的数据；而下一条指令 & seqi r5,r3,0×a 要在intEX周期中读取r3中的数据。上述过程发生了WR冲突，即写读相关。为了避免此类冲突， seq r5,r4,0×a的intEX指令延迟了一个周期进行。由此，相关指令为： 2）控制相关由图6可以看出，在第4时钟周期：第一条指令处于MEM段，第二条命令处于intEX段，第三条指令出于aborted状态，第四条命令处于IF段。图 6 指令流水线 }

《计算机系统结构》复习题

计算机系统结构复习填空（15*1分），选择（15*1分），简答题（5/6 30分），综合题（4*10分） 1、从使用语言角度，可将系统按功能划分为多层次机器级结构，层次结构分别是：应用语言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器语言机器级和微程序机器级。 2、各机器级的实现主要靠翻译和解释或两者结合进行。翻译是先用转换程序将高一级机器级上的程序整个地变换成低一级机器级上等效的程序，然后再在低一级机器级上实现的技术。解释则是在低级机器上用它的一串语句或指令来仿真高级机器上的一条语句或指令的功能，是通过对高级的机器级语言程序中的每条语句或指令逐条解释来实现的技术。 3、计算机系统结构在计算机系统机器级层次中指传统机器级的系统结构。 4、计算机系统结构研究的是软、硬件之间的功能分配以及对传统机器级界面的确定，为机器语言、汇编语言程序设计或编译程序生成系统提供使其设计或生成的程序能在机器上正确运行应看到的遵循的计算机属性。 5、计算机系统结构的属性包括： 1.数据表示、2.寻址方式、3.寄存器组织、4.指令系统、5.存储系统组织、6.中断机构、7.系统机器级的管态和用户态的定义和切换、8.机器级的I/O 结构、9.系统各部分的信息保护方式和保护机构等。 6、机器透明性：指相对于每一机器级设计人员，都客观存在的功能或属性看不到的现象，称相对于此级设计人员来说，这些功能或属性是具有透明性，即透明的。 7、计算机组成指的是计算机系统结构的逻辑实现，包括机器级内部的数据流和控制流的组成以及逻辑设计等。它着眼于机器级内部各事件的排序方式与控制机构、各部件的功能及各部件间的联系。 8、计算机组成设计要解决的问题是在所希望达到的性能和价格下，怎样更好、更合理地把各种设备各部件组织成计算机，来实现所确定的系统结构。 9、当前，计算机组成设计主要是围绕提高速度，着重从提高操作的并行度、重叠度，以及功能的分散和设置专用功能部件来进行的。 10、计算机组成设计要确定的方面一般应包括： 1.数据通路宽路、2.专用部件的设置、3.各种操作对部件的共享程度、4.功能部件的并行度、5.控制机构的组成方式、6.缓冲和排队技术、7.预估预判技术、8.可靠性技术等。 11、计算机实现指计算机组成的物理实现，包括处理机、主存等部件的物理结构，器件的集成度和速度，器件、模块、插件、底板的划分与连接，专用器件的设计，微组装技术，信号传输，电源、冷却及整机装配技术等。它着眼于器件技术和微组装技术，其中，器件技术在实现技术中起着主导作用。 13、软、硬件取舍的三个基本原则是：（1）.考虑在现有硬件、器件(主要是逻辑器件和存储器)条件下，系统要有高的性能价格比，主要从实现费用、速度和其他性能要求来综合考虑。（2）.考虑到准备采用和可能采用的组成技术，使它尽可能不要过多或不合理地限制各种组成、实现技术的采用。（3）.从“软”的角度考虑如何为编译和操作系统的实现以及为高级语言程序的设计提供更多更好的硬件支持。 14、程序在系统上运行的时间应该是衡量机器时间（速度）性能最可靠的标准。 15、计算机性能通常用峰值性能及持续性能来评价。峰值性能是指在理想情况下计算机系统可获得的最高理论性能值，它不能反映出系统的实际性能。

计算机系统结构基本习题和答案

计算机系统结构基本习题和答案填空题 1、从（使用语言的）角度可以将系统看成是按（功能）划分的多个机器级组成的层次结构。 2、计算机系统结构的层次结构由高到低分别为（应用语言机器级，高级语言机器级，汇编语言机器级，操作系统机器级，传统机器语言机器级，微程序机器级）。 3、应用程序语言经（应用程序包）的（翻译）成高级语言程序。 4、高级语言程序经（编译程序）的（翻译）成汇编语言程序。 5、汇编语言程序经（汇编程序）的（翻译）成机器语言程序。 6、在操作系统机器级，一般用机器语言程序（解释）作业控制语句。 7、传统机器语言机器级，是用（微指令程序）来（解释）机器指令。 8、微指令由（硬件）直接执行。 9、在计算机系统结构的层次结构中，机器被定义为（能存储和执行相应语言程序的算法和数据结构）的集合体。 10、目前M0由（硬件）实现，M1用（微程序（固件））实现，M2到M5大多用（软件）实现。以（软件）为主实现的机器成为虚拟机。（虚拟机）不一定全用软件实现，有些操作也可用（固件或硬件）实现。 11、透明指的是（客观存在的事物或属性从某个角度看不到），它带来的好处是（简化某级的设计)，带来的不利是（无法控制）。 12、计算机系统结构也称（计算机体系结构），指的是（传统机器级的系统结构）。它是（软件和硬件/固件）的交界面，是机器语言汇编语言程序设计者或编译程序设计者看到的（机器物理系统）的抽象。 13、计算机组成指的是（计算机系统结构的逻辑实现），包括（机器级内的数据流和控制流）的组成逻辑设计等。计算机实现指的是（计算机组成的物理实现），它着眼于（器件）技术和（微组装）技术。 14、确定指令系统中是否要设乘法指令属于（计算机系统结构），乘法指令是用专门的高速乘法器实现还是用加法器实现属于（计算机组成），乘法器和加法-移位器的物理实现属于（计算机实现）。 15、主存容量与编址方式的确定属于（计算机系统结构），主存是否采用多体交叉属于（计算机组成），主存器件的选定属于（计算机实现）。 16、设计何种系列机属于（计算机系统结构），系列机内不同型号计算机的组织属于（计算机组成）。 17、是否采用通道方式输入输出的确定属于（计算机系统结构），通道采用结合型还是独立型属于（计算机组成）。 18、对PDP-11或VAX-11来说，单总线结构属于（计算机系统结构），其机器级的I/O连接和使用方式属于（计算机组成）。 19、由于计算机组成和计算机实现关系密切，有人称它们为（计算机实现），即计算机系统的（逻辑实现）和（物理实现）。 20、计算机系统结构可有（由上而下）、（由下而上）和（由中间开始）三种不同的设计思路。 21、“由中间开始”设计的“中间”是指（层次结构中的软硬交界面），目前多数是在（传统机器级）与（操作系统级）之间。 22、除了分布处理，MPP和机群系统外，并行处理计算机按其基本结构特征可分为（流水线计算机）、（阵列处理机）、（多处理机）、（数据流计算机）四种不同的结构。 23、费林按指令流和数据流的多倍性把计算机系统分类，这里的多倍性指（系统瓶颈部件上

计算机系统结构模拟试题5

计算机组成原理模拟试题（2）一、填空题:04分，每题02分 =_____________ [X］补=_____________补-X］［1、 X=-0.1001 ［X］原 =_____________ =_____________ =_____________ [-Y］补Y］原=_____________ ［］补 Y=0.0101 ［Y ］补=_____________ ［X+Y对西文输出的字符设备，在计算机的内存储器中存储的是字符数据的每个字符的、 2，设备中的字符_____________(包括显示或打印)的则是每个字符的码，输出_____________间的对应关_____________发生器的主要功能是解决从字符的 _____________码和字符的系。分二、单选题:20分，每题02 。3、 32 x 32点阵汉字的机内编码需要 A: 16个字节 B: 32个字节 2个字节 C: 32×个字节 D: 32×4位，则可表示位，数值位为314、某机字长32位，采用原码定点整数表示，符号位为1 。，最小负整数为的最大正整数为 A: B: C: D: 来实现。 5、在定点二进制运算器中，减法运算一般通过 A: 原码运算的二进制减法器 B: 补码运算的二进制减法器 C: 补码运算的十进制加法器 D: 补码运算的二进制加法器。 6、在浮点数运算中产生溢出的原因是运算过程中最高位产生了进位或借位 A: 参加运算的操作数超出了机器的表示范围B: C: 运算的结果的阶码超出了机器的表示范围寄存器的位数太少，不得不舍弃最低有效位 D: 。 7、无论如何划分计算机的功能部件，控制器部件中至少含有 IP A: PC、 IR B: PC、、IP C: IR D: AR、IP 8、某存储器容量为32K×16位，则 A: 地址线为16根，数据线为32根根16根，数据线为32地址线为B: C: 地址线为15根，数据线为16根 D: 地址线为15根，数据线为32根 9、在统一编址方式下，存储单元和I/O设备是靠指令中的来区分的。

计算机体系结构实验报告二

实验二结构相关一、实验目得: 通过本实验,加深对结构相关得理解,了解结构相关对CPU性能得影响。二、实验内容: 1、用WinDLX模拟器运行程序structure_d、s 。 2、通过模拟,找出存在结构相关得指令对以及导致结构相关得部件。 3、记录由结构相关引起得暂停时钟周期数,计算暂停时钟周期数占总执行周期数得百分比。 4、论述结构相关对CPU性能得影响,讨论解决结构相关得方法。三、实验程序structure_d、s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; < A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit < this is a ment !! A: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 四、实验过程打开软件,load structure_d、s文件,进行单步运行。经过分析,此程序一次循环中共有五次结构相关。(Rstall 数据相关Stall 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面得数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关得部件:译码部件。

(完整版)计算机系统结构复习题(附答案)范文

计算机系统结构复习题和重点（附答案）一、单项选择题 1．实现汇编语言源程序变换成机器语言目标程序是由（） A．编译程序解释B．编译程序翻译 C．汇编程序解释D．汇编程序翻译 2．系列机软件必须保证（） A．向前兼容，并向上兼容B．向前兼容，并向下兼容 C．向后兼容，力争向上兼容D．向后兼容，力争向下兼容 3．浮点数尾数基值r m=8，尾数数值部分长6位，可表示规格化正尾数的个数是（）A．56个B．63个 C．64个D．84个 4．在IBM370系统中，支持操作系统实现多进程共用公用区管理最有效的指令是（）A．“执行”指令B．“程序调用”指令 C．“比较与交换”指令D．“测试与置定”指令 5．关于非专用总线三种控制方式中，下列叙述错误．．的是（） A．集中式定时查询，所有部件共用同一条“总线忙”线 B．集中式定时查询，所有部件都用同一条“总线请求”线 C．集中式独立请求，所有部件都用同一条“总线请求”线 D．集中式串行链接，所有部件都用同一条“总线请求”线 6．磁盘外部设备适合于连接到（） A．字节多路通道B．数组多路通道或选择通道 C．选择通道或字节多路通道D．数组多路通道或字节多路通道 7．在Cache存储器中常用的地址映象方式是（） A．全相联映象B．页表法映象 C．组相联映象D．段页表映象 8．在指令级高度并行的超级处理机中，下列叙述正确的是（） A．超标量处理机利用资源重复，要求高速时钟机制 B．超流水线处理机利用资源重复，要求高速时钟机制 C．超标量处理着重开发时间并行性，要求高速时钟机制 D．超流水线处理机着重开发时间并行性，要求高速时钟机制 9．间接二进制n方体网络是一种（） A．多级立方体网络B．多级全排列网络

2010年4月自考计算机系统结构试题及答案

全国2010年4月自学考试计算机系统结构试题课程代码：02325 一、单项选择题(本大题共10小题，每小题1分,共10分) 在每小题列出的四个备选项中只有一个是符合题目要求的，请将其代码填写在题后的括号内。错选、多选或未选均不得分。 1．在计算机系统结构设计中，提高软件功能实现的比例可( ) A．提高解题速度B．减少需要的存储器容量 C．提高系统的灵活性D．提高系统的性能价格比 2．浮点数表示的尾数的基r m=16，尾数长度p=8，可表示的规格化最大正尾数的值是( ) A．1／256 B．1／2 C．15／16 D．255／256 3．下列数据存储空间为隐含寻址方式的是( ) A．CPU中的通用寄存器B．主存储器 C．I／O接口中的寄存器D．堆栈 4．当计算机系统执行通道程序完成输入输出工作时，执行通道程序的是( ) A．CPU B．通道 C．CPU和通道D．指定的外设 5．下列有关中断的叙述正确的是( ) A．中断响应的次序是由硬件决定的B．中断处理的次序是由硬件决定的 C．中断处理的次序是不可改的D．中断响应的次序是可灵活改变的 6．与虚拟存储器的等效访问速度无关．．的是( ) A．访存页地址流B．页面替换算法 C．主存的容量D．辅存的容量 7．非线性流水线的特征是( ) A．一次运算中使用流水线中的多个功能段 B．一次运算中多次使用流水线中的某些功能段 C．流水线中某些功能段在各次运算中的作用不同 D．流水线的各功能段在不同的运算中可以有不同的连接 8．属于集中式共享存储器结构的SIMD计算机是( ) A．ILLIAC IV B．BSP C．CM-2 D．MP-1 1

计算机系统结构模拟题

《计算机系统结构》模拟题一．判断是非题,对的打√，错的打× 1.系列机是指由一个厂家生产的具有相同组成，但具有不同系统结构和实现的一系列不同型号的机器。（ × ） 2.Cray 1向量处理机中，由于每个向量寄存器的长度为64，当实际需要处理的向量长度大于64时，它就不能够处理了。（ × ） 3.按照Flynn 分类法，Illiac IV 阵列处理机是MIMD 计算机。（ × ） 4.多级混洗交换网络是阻塞网络。（ √ ）二．填空题 1．多机系统的互连网络的通信模式可分为4种，其中，一对一的通信模式称为____单播_____模式，一对全体的通信模式为_____广播____模式，多对多的通信模式为____会议_____模式。 2．SIMD 计算机和流水线向量处理机都可以执行向量指令，前者采用___资源重复______并行性，后者采用___时间重叠______并行性。 3．系列机软件兼容必须做到___向后_____兼容，力争做到___向上_____兼容。 4．流水线消除瓶颈段的方法有____细分_____和____重复设置瓶颈段（可交换次序）_____2种方法。 5．设通道数据传送过程中，选择一次设备的时间为 s T ，传送一个字节的时间为D T ，则字节多路通道最大流量等于____ D s T T 1 _____。 6．Illiac IV 8×8阵列中，网络直径为____7_____。 7．对堆栈型替换算法，增大分配给程序的___主存页面______，对第一级存储器的命中率就会单调____上升_____。 8．从网络的任何结点看，若网络拓扑结构都是相同的，则称这样的网络是___对称______网络。三．单项选择题 1.在计算机系统层次结构中，从下层到上层，各层相对顺序正确的是（ B ）。 A.汇编语言机器级－操作系统机器级－高级语言机器级 B.微程序机器级－传统机器语言机器级－汇编语言机器级 C.传统机器语言机器级－高级语言机器级－汇编语言机器级 D.汇编语言机器级－应用语言机器级－高级语言机器级 2．Illiac IV 阵列处理机中，PE 之间所用的互连函数是（ A ）。

计算机系统结构试题及答案

计算机系统结构复习题单选及填空：计算机系统设计的主要方法 1、由上往下的设计（top-down） 2、由下往上的设计（bottom-up） 3、从中间开始（middle-out） Flynn分类法把计算机系统的结构分为以下四类：（1）单指令流单数据流（2）单指令流多数据流（3）多指令流单数据流 (4) 多指令流多数据流堆栈型机器：CPU 中存储操作数的单元是堆栈的机器。累加器型机器：CPU 中存储操作数的单元是累加器的机器。通用寄存器型机器：CPU 中存储操作数的单元是通用寄存器的机器。名词解释：虚拟机：用软件实现的机器叫做虚拟机，但虚拟机不一定完全由软件实现，有些操作可以由硬件或固件（固件是指具有软件功能的固件）实现。系列机：由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。兼容机：它是指由不同公司厂家生产的具有相同系统结构的计算机。流水线技术：将一个重复的时序过程，分解成为若干个子过程，而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。单功能流水线：指流水线的各段之间的连接固定不变、只能完成一种固定功能的流水线。多功能流水线：指各段可以进行不同的连接，以实现不同的功能的流水线。顺序流水线：流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。乱序流水线：流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同，允许后进入流水线的任务先完成。这种流水线又称为无序流水线、错序流水线、异步流水线。吞吐率：在单位时间流水线所完成的任务数量或输出结果的数量。指令的动态调度：

是指在保持数据流和异常行为的情况下，通过硬件对指令执行顺序进行重新安排，以提高流水线的利用率且减少停顿现象。是由硬件在程序实际运行时实施的。指令的静态调度：是指依靠编译器对代码进行静态调度，以减少相关和冲突。它不是在程序执行的过程中、而是在编译期间进行代码调度和优化的。超标量：一种多指令流出技术。它在每个时钟周期流出的指令条数不固定，依代码的具体情况而定，但有个上限。超流水：在一个时钟周期分时流出多条指令。多级存储层次：采用不同的技术实现的存储器，处在离CPU不同距离的层次上，各存储器之间一般满足包容关系，即任何一层存储器中的容都是其下一层（离CPU更远的一层）存储器中容的子集。目标是达到离CPU最近的存储器的速度，最远的存储器的容量。写直达法：在执行写操作时，不仅把信息写入Cache中相应的块，而且也写入下一级存储器中相应的块。写回法：只把信息写入Cache中相应块，该块只有被替换时，才被写回主存。集中式共享多处理机：也称为对称式共享存储器多处理SMP。它一般由几十个处理器构成，各处理器共享一个集中式的物理存储器，这个主存相对于各处理器的关系是对称的，分布式共享多处理机：它的共享存储器分布在各台处理机中，每台处理机都带有自己的本地存储器，组成一个“处理机-存储器”单元。但是这些分布在各台处理机中的实际存储器又合在一起统一编址，在逻辑上组成一个共享存储器。这些处理机存储器单元通过互连网络连接在一起，每台处理机除了能访问本地存储器外，还能通过互连网络直接访问在其他处理机存储器单元中的“远程存储器”。多Cache一致性：多处理机中，当共享数据进入Cache，就可能出现多个处理器的Cache中都有同一存储器块的副本，要保证多个副本数据是一致的。写作废协议：在处理器对某个数据项进行写入之前，它拥有对该数据项的唯一的访问权。写更新协议：当一个处理器对某数据项进行写入时，它把该新数据广播给所有其它Cache。这些Cache用该新数据对其中的副本进行更新。机群：是一种价格低廉、易于构建、可扩放性极强的并行计算机系统。它由多台同构或异构

计算机系统结构考试题库及答案

计算机系统结构试题及答案一、选择题（50分，每题2分，正确答案可能不只一个，可单选或复选） 1.（CPU周期、机器周期）是内存读取一条指令字的最短时间。 2.（多线程、多核）技术体现了计算机并行处理中的空间并行。 3.（冯?诺伊曼、存储程序）体系结构的计算机把程序及其操作数据一同存储在存储器里。 4.（计算机体系结构）是机器语言程序员所看到的传统机器级所具有的属性，其实质是确定计算机系统中软硬件的界面。 5.（控制器）的基本任务是按照程序所排的指令序列，从存储器取出指令操作码到控制器中，对指令操作码译码分析，执行指令操作。 6.（流水线）技术体现了计算机并行处理中的时间并行。 7.（数据流）是执行周期中从内存流向运算器的信息流。 8.（指令周期）是取出并执行一条指令的时间。 9.1958年开始出现的第二代计算机，使用（晶体管）作为电子器件。 10.1960年代中期开始出现的第三代计算机，使用（小规模集成电路、中规模集成电路）作为电子器件。 11.1970年代开始出现的第四代计算机，使用（大规模集成电路、超大规模集成电路）作为电子器件。 12.Cache存储器在产生替换时，可以采用以下替换算法：（LFU算法、 LRU算法、随机替换）。

13.Cache的功能由（硬件）实现，因而对程序员是透明的。 14.Cache是介于CPU和（主存、内存）之间的小容量存储器，能高速地向CPU提供指令和数据，从而加快程序的执行速度。 15.Cache由高速的（SRAM）组成。 16.CPU的基本功能包括（程序控制、操作控制、时间控制、数据加工）。 17.CPU的控制方式通常分为：（同步控制方式、异步控制方式、联合控制方式）反映了时序信号的定时方式。 18.CPU的联合控制方式的设计思想是：（在功能部件内部采用同步控制方式、在功能部件之间采用异步控制方式、在硬件实现允许的情况下，尽可能多地采用异步控制方式）。 19.CPU的同步控制方式有时又称为（固定时序控制方式、无应答控制方式）。 20.CPU的异步控制方式有时又称为（可变时序控制方式、应答控制方式）。 21.EPROM是指（光擦可编程只读存储器）。 22.MOS半导体存储器中，（DRAM）可大幅度提高集成度，但由于（刷新）操作，外围电路复杂，速度慢。 23.MOS半导体存储器中，（SRAM）的外围电路简单，速度（快），但其使用的器件多，集成度不高。 24.RISC的几个要素是（一个有限的简单的指令集、CPU配备大量的通用寄存器、强调对指令流水线的优化）。

计算机系统结构总复习题

一、单项选择题 1、直接执行微指令的是( ) A．汇编程序B．编译程序 C．硬件D．微指令程序 2、对系统程序员不透明的应当是( )。 A．Cache存贮器B．系列机各档不同的数据通路宽度C．指令缓冲寄存器D．虚拟存贮器 3、对机器语言程序员透明的是( )。 A．中断字B．主存地址寄存器 C．通用寄存器D．条件码 4、计算机系统结构不包括( )。 A．主存速度B．机器工作状态 C．信息保护D．数据 5、从计算机系统结构上讲，机器语言程序员所看到的机器属性是( )。A．计算机软件所要完成的功能B．计算机硬件的全部组成 C．编程要用到的硬件组织D．计算机各部件的硬件实现 6、计算机组成设计不考虑( )。 A．专用部件设置B．功能部件的集成度 C．控制机构的组成D．缓冲技术 7、以下说法中，不正确的是( )。软硬件功能是等效的，提高硬件功能的比例会： A．提高解题速度B．提高硬件利用率 C．提高硬件成本D．减少所需要的存贮器用量 8、在系统结构设计中，提高软件功能实现的比例会( )。 A．提高解题速度B．减少需要的存贮容量 C．提高系统的灵活性D．提高系统的性能价格比 9、下列说法中不正确的是( )。 A．软件设计费用比软件重复生产费用高 B．硬件功能只需实现一次，而软件功能可能要多次重复实现 C．硬件的生产费用比软件的生产费用高 D．硬件的设计费用比软件的设计费用低 10、在计算机系统设计中，比较好的方法是( )。 A．从上向下设计B．从下向上设计 C．从两头向中间设计D．从中间开始向上、向下设计11、"从中间开始"设计的"中间"目前多数是在( )。 A．传统机器语言级与操作系统机器级之间 B．传统机器语言级与微程序机器级之间 C．微程序机器级与汇编语言机器级之间 D．操作系统机器级与汇编语言机器级之间 12、系列机软件应做到( )。 A．向前兼容，并向上兼容 B．向后兼容，力争向上兼容

计算机系统结构(复习题)

《计算机系统结构》复习题（一）一、单项选择题 1．同号相减或异号相加，阶差为1，只需要设置位警戒位。【】A．0 B. 1 C. 2 D. 3 2．计算机系统多级层次结构中，操作系统机器级的直接上层是【】A．传统机器级B．高级语言机器级 C．应用语言机器级D．汇编语言机器级 3．以下不．是设计RISC的原则的是【】A．指令多用硬联控制实现 B．指令条数多，通常超过100条 C．指令寻址方式一般不超过两种 D．所有指令都在一个机器周期内完成 4. 下列操作码的编码方法中，操作码平均长度最短的是：【】 A、固定长编码 B、Huffman编码 C、不等长扩展编码 D、等长扩展编码 5．在采用延迟转移技术时，在以下几种调度方法中，效果最好的是哪一种方法【】 A.将转移指令前的那条指令调度到延迟槽中 B.将转移目标处的那条指令调度到延迟槽中 C.将转移不发生时该执行的那条指令调度到延迟槽中 D.在延迟槽中填入NOP空操作指令 6．在以下输入输出控制器的管理方式中，外设的工作速度对计算机性能影响最小的是【】 A. 程序控制轮询方式 B. 程序控制中断方式 C. 直接存储器访问方式 D. I/O处理机方式 7. 计算机系统多级层次结构中，操作系统机器级的直接上层是【】 A．传统机器级B．高级语言机器级 C．应用语言机器级D．汇编语言机器级 8．多处理机的互连方式采用总线形式的优点是【】 A.硬件成本低且简单 B.适用于处理机机数较多的场合 C.有很高的潜在通信速率 D.不便于改变系统硬件设置 9．浮点数尾数基值r m=8，尾数数值部分长6位，可表示规格化正尾数的个数是【】A．56个B．63个 C．64个D．84个

计算机系统结构模拟题

《计算机系统结构》模拟题（补）一．单项选择题 1. SIMD是指（）。 A、单指令流单数据流 B、单指令流多数据流 C、多指令流单数据流 D、多指令流多数据流 2. 磁盘外部设备适合于连接到（）。 A．字节多路通道B．数组多路通道或选择通道 C．选择通道或字节多路通道D．数组多路通道或字节多路通道 3. 下列（）存储设备不需要编址。 A. 通用寄存器 B. 主存储器 C. 输入输出设备 D. 堆栈 4.多处理机的各自独立型操作系统( )。 A.要求管理程序不必是可再入的 B.适合于紧耦合多处理机 C.工作负荷较平衡 D.有较高的可靠性 5.输入输出系统硬件的功能对( )是透明的。 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 6. 实现汇编语言源程序变换成机器语言目标程序是由（）。 A．编译程序解释B．编译程序翻译 C．汇编程序解释D．汇编程序翻译 7.全相联地址映象是指( )。 A.任何虚页都可装入主存中任何实页的位置 B.一个虚页只装进固定的主存实页位置 C.组之间是固定的，而组任何虚页可以装入任何实页位置 D.组间可任意装入，组是固定装入 8.( )属于MIMD系统结构。 A.各处理单元同时受同一个控制单元的管理 B.各处理单元同时接受同一个控制单元送来的指令 C.松耦合多处理机和多计算机 D.阵列处理机

9.设16个处理器编号分别为0，1，2，…，15用Cube3互联函数时，第10号处理机与第( ) 号处理机相联。 A.11 B.8 C.14 D.2 10.若输入流水线的指令既无局部性相关，也不存在全局性相关，则( )。 A.可获得高的吞吐率和效率 B.流水线的效率和吞吐率恶化 C.出现瓶颈 D.可靠性提高 11．流水线的技术指标不包括( )。 A.响应比 B.吞吐率 C.加速比 D.效率 12．指令优化编码方法，就编码的效率来讲，方法最好是（）。 A. 固定长度编码 B. 扩展编码法 C. Huffman编码法 D. 以上编码都不是 13．RISC 计算机的指令系统集类型是 ( ) 。 A. 堆栈型 B. 累加器型 C. 寄存器—寄存器型 D. 寄存器 - 存储器型 14．相联存储器的访问方式是( )。 A．先进先出顺序访问B．按地址访问 C．无地址访问D．按容访问 15．存储器读写速率越高，每位的成本也越高，存储容量也小。解决这一问题的主要方法是采用( )。 A．多级存储体系结构B．并行存储器 C． Cache D．缓冲技术 16．计算机系统多级层次中，从下层到上层，各级相对顺序正确的应当是（）。 A.汇编语言机器级---操作系统机器级---高级语言机器级 B.微程序机器级---传统机器语言机器级---汇编语言机器级 C.传统机器语言机器级---高级语言机器级---汇编语言机器级 D. 汇编语言机器级---应用语言机器级---高级语言机器级 17．对系统程序员不透明的是（）。 A.Cache 存储器 B.系列几各档不同的数据通路宽度 C.指令缓冲寄存器 D.虚拟存储器 18．在计算机系统设计中，比较好的方法是（）。

北邮计算机系统结构实验报告-实验一到五-WINDLX模拟器

北京邮电大学实验报告课程名称计算机系统结构计算机学院03班王陈(11)

目录实验一WINDLX模拟器安装及使用......................................... 错误!未定义书签。 ·实验准备................................................................................ 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验内容及要求.................................................................... 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验二指令流水线相关性分析 ............................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验三DLX处理器程序设计 .................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 A.向量加法代码及性能分析 ................................................... 错误!未定义书签。 B.双精度浮点加法求和代码及结果分析 .............................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验四代码优化 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结+实习体会........................................................... 错误!未定义书签。实验五循环展开 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。矩阵乘程序代码清单及注释说明........................................... 错误!未定义书签。相关性分析结果........................................................................... 错误!未定义书签。增加浮点运算部件对性能的影响........................................... 错误!未定义书签。增加forward部件对性能的影响 ............................................ 错误!未定义书签。转移指令在转移成功和转移不成功时候的流水线开销 .. 错误!未定义书签。 ·实验总结+实习体会+课程建议......................................... 错误!未定义书签。

《计算机体系结构》期末复习题标准答案

《计算机体系结构》期末复习题答案

————————————————————————————————作者：————————————————————————————————日期：

《计算机体系结构》期末复习题答案系别_________ 班级_________ 姓名__________ 学号__________ 一、填空题（每空1分） 1.按照弗林（Flynn）分类法，计算机系统可以分为4类：SISD计算机、（SIMD计算机）、（MISD计算机）和（MIMD计算机）。 2. 改进之后的冯?诺依曼计算机的只要特点是存储器为中心，总线结构，分散控制。 3. 当前计算机系统中的存储系统是一个层次结构，其各层分别为：（通用寄存器，高速缓存，主存，辅存，脱机大容量存储器）。 4.高速缓冲存储器的地址映象方式有三种，它们分别是：（全向量方式，直接相联方式，组相联方式）。 5.虚拟存储器的三种管理方式是（段式管理，页式管理和段页式管理）。 6.目前计算机中常用数据有（用户定义数据，系统数据和指令数据）三种类型。 7.通常可能出现的流水线的相关性有（资源相关，数据相关和控制相关）。 8.解决中断引起的流水线断流的方法有（不精确断点法和精确断点法）。 9.目前向量处理机的系统结构有两种：（存储器－存储器型和寄存器－寄存器型）。 10.通用计算机基本指令分为5类，它们分别是：（数据传送类，运算类，程序控制类，输入输出类，处理机控制和调试类）。 11．执行指令x1=x2+x3；x4=x1-x5会引起（RAW）类型的数据相关，执行指令x5=x4*x3；x4=x0+x6会引起（W AR）类型的数据相关，执行指令x6=x1+x2；x6=x4*x5会引起（WA W）类型的数据相关。 12．多计算机网络中，通常出现的4种通信模式是（单播模式，选播模式，广播模式和会议模式）。 13.传统的冯?诺依曼计算机是以控制驱动方式工作，以数据驱动方式工作的典型计算机是（数据流计算机），以需求驱动方式工作的典型计算机是（归约机），以模式匹配驱动方式工作的典型计算机是（人工智能计算机）。二、名词解释（每题2分） 1.计算机体系结构：计算机系统结构就是计算机的机器语言程序员或编译程序编写者所看到的外特性，是硬件子系统的概念结构及其功能特性。 2.系列机：所谓系列机是指同一厂家生产的具有相同的系统结构，但采取了不同的组成和实现的技术方案，形成了不同型号的多种机型。 3.模拟: 模拟是指用软件的方法在一台计算机上，实现另一台计算机的指令系统，被模拟的机器是不存在的，称为虚拟机，执行模拟程序的机器称宿主机。 4.程序的局部性原理: 程序访问局部性原理说明了计算机在程序执行过程中呈现出的一种规律，即程序往往重