计算机体系结构复习资料(汇总情况版)

计算机体系结构复习资料(汇总情况版)
计算机体系结构复习资料(汇总情况版)

第一章计算机系统结构的基础知识

1、计算机体系结构:计算机体系结构是程序员所看到的计算机属性,即概念性结构与功能特性。

2、透明性:对本来是存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。在一个计算机系统中,低层机器的属性对高层机器的程序员往往是透明的,如传统机器级的概念性结构和功能特性,对高级语言程序员来说是透明的。

3、计算机系统结构、计算机组成、计算机实现之间的关系:

计算机系统结构指的是计算机系统的软、硬件的界面,即机器语言程序员所看到的传统机器级所具有的属性。

计算机组成:指的是计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。它着眼于物理机器级内各事件的排序方式与控制方式、各部件的功能以及各部件之间的关系。

计算机的实现:指的是计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。它着眼于器件技术和微组装技术,其中器件技术在实现技术中起主导作用。

4、计算机系统的分类:1)Flynn(单/多指令流单/多数据流四种)

2)冯氏分类法:最大并行速度。

5、程序的局部性:时间局部性(程序即将用到的信息很可能就是目前正在使用的信息)

空间局部性(程序即将用到的信息很可能与目前正在使用的信息在空间上相邻或者邻近)。

6、计算机系统设计原理:由上往下设计、由下往上设计、从中间开始设计。

从中间设计的优点:“中间”指层次结构中的软硬件的交界面,目前一般是在传统机器语言机器级与操作系统机器级之间。好处:采用这种方法时,首先要进行软硬件功能分配,确定好这个界面。然后从这个界面开始,软件设计者往上设计操作系统、汇编、编译系统等,硬件设计者往下设计传统机器级、微程序机器级等。软件和硬件并行设计可以缩短设计周期,设计过程中可以交流协调,是一种交互式的、很好的设计方法。

7、存储程序计算机(冯·诺依曼结构):采用存储程序原理,将程序和数据存放在同一存储器中。指令在存储器中按其执行顺序存储,由指令计数器指明每条指令所在的单元地址。存储程序原理的基本点是指令驱动。

主要特点:

·计算机以运算器为中心。输入/输出设备与存储器之间的数据传送都经过运算器;存储器、输入/输出设备的操作以及它们之间的联系都由控制器集中控制。

·在存储器中,指令和数据同等对待。指令和数据一样可以进行运算,即由指令组成饿程序是可以修改的。

·存储器是按地址访问、按顺序线性编址的一维结构,每个单元的位数是固定的。

·指令的执行是顺序的,即一般是按照指令在存储器中存放的顺序执行。程序的分支由转移指令实现。由程序计数器PC指明当前正在执行的指令在存储器中的地址。

·指令由操作码和地址码组成。操作码指明本指令的操作类型,地址码指明操作数地址和存放运算结果的地址。操作数的类型由操作码决定,操作数本身不能判定是何种数据类型。·指令和数据均以二进制编码表示,采用二进制运算。

8、计算机五大部件:控制器、运算器、存储器、输入输出设备。

9、一条指令由那两部分组成:操作码、地址码。

10、软件兼容:同一个软件可以不加修改第运行于体系结构相同的各档及其,而且它们所获得的结果一样,差别只在于运行时间不同。

11、系列机的软件兼容方式:软件兼容有(向上兼容)和(向下兼容)之分,又有(向前兼容)和(向后兼容)之分。系列机软件必须保证(向后兼容),力争(向上兼容)。 兼容机:不同制造商生产的具有相同系统结构的计算机。 系列机:在一个厂家内生产的具有相同的体系结构,但具有不同组织和实现的一系列不同型号的机器。

12、并行性的概念:指计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。只要在时间上相互重叠,就存在并行性。他是同时性和并发性两种含义。 同时性:两个或两个以上的事件在同一时刻发生。 并发性:两个或两个以上的事件在同一时间间隔内发生。

从处理数据的角度并行性从低到高分为:a 、字串位串:每次只对一个字的一位进行处理。这是最基本的串行处理方式,不存在并行性 b 、字串位并:同时对一个字的全部位进行处理,不同字之间是串行的。已开始出现并行性。 c 、字并位串:同时对许多字的同一位进行处理,这种方式具有较高的并行性。 d 、全并行:同时对许多字的全部位或部分位进行处理,这是最高一级的并行。

从执行角度来看,并行性从低到高依次分为:a 、指令内部并行:单条指令中各微操作之间的并行。b 、指令级并行:并行执行两条或两条以上的指令。c 、线程级并行:并行执行两个或两个以上的线程,通常是以一个进程内派生的多个线程为调度单位。d 、任务级或过程级并行:并行执行两个或两个以上的过程或任务,以子程序或进程为调度单元。e 、作业或程序级并行:并行执行两个或两个以上的作业或程序。 13、提高并行性的技术途径:

(1)时间重叠:多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。

(2)资源重复:通过重复设置资源,尤其是硬件资源,大幅度提高计算机系统的性能。 (3)资源共享:是一种软件方法,它使多个任务按一定时间顺序轮流使用同一套硬件设备。 14、多机系统的耦合度分类:

(1)最低耦合:除通过某种中间存储介质之外,各计算机之间没有物理连接,也无共享的联机硬件资源。(2)松散耦合:通过通道或通信线路实现计算机间互连,共享某些外围设备,机间的相互作用是在文件或数据集一级进行。(3)紧密耦合:机间物理连接的频带较高,往往通过总线或高速开关实现互连,可以共享主存。

第二章 指令系统的设计

1、计算题:Amdahl 定律:加快某部件执行速度所能获得的系统性能加速比,受限于该部件的执行时间占系统中总执行时间的百分比(P7页)。

向上(下)兼容:按某档机器编制的程序,不加修改

就能运行于比它高(低)档的机器。

向前(后)兼容:按某个时期投入市场的某种型号机

器编制的程序,不加修改地就能运行于在它之前(后)投入市场的机器。向后兼容是系列机的根本特征。

兼容机:由不同公司厂家生产的具有相同系统结构的计算机 。

时间

机器档次

高 低

向上兼容 向下兼容

向前兼容 向后兼容

当前机器

2、计算题:哈夫曼树

哈弗曼编码方法的计算(1)码长表示法(2)码点表示法

1)码长表示法:2—4—6(有三种长度,两位的、四位的、六位的)

2)码点表示法:3/6/4(最短的有三条,最长的有四条,中间长度对应为6条)

3)2—4最多码点数:13

解释:2可以有00、01、10、11四种,但是必须是2-4扩展至少有一个为两位,其他的可以在前面扩展两位,每个可以对应四种例如对于01可以变成:0001、0101、1001、1101,所以总共加起来最多只能是3*4+1=13种

4)以下四种编码中:不是2-4扩展的是(D)

A:1/2 B:2/8 C:3/4 D:4/8

大题:有一台模型机,有以下七种不同的指令,

使用频率表示如下:

T1: 20% T2: 12% T3:11% T4: 15% T5: 8%

T6:3% T7: 2% T8:18% T9: 10% T10: 1%

(1)上图为哈夫曼编码图:平均长度为

2*20%+3*(10%+11%+12%+15%+18%)+4*8%+5*3%+6*(1%+2%)=3.03

可以表示成:00、010、011、100、101、110、1110、11110、111110、111111

(2)若用定长操作码表示至少需要多少位?

答:至少需要4位

(3)用扩展操作码(只有两位)可以有多种方式表示,要求平均长度不能大于 3.2,给出最合理的编码方式,并求出平均编码长度?

①采用扩展操作码可以用2—4扩展操作码的码点1/9表示:求得平均长度为:1*(20%)+4(80%)=3.4>3.2不符合

②3—4的6/4编码方式:平均长度为3*(10+11+12+15+18+20)%+4*(1+2+3+8)% =3.14<3.2符合条件

③4—5编码6/4方式:4*(10+11+12+15+18+20)%+5*(1+2+3+8)%>3.2

④2—5编码中的3/7方式:2*(15+18+20)%+5*(1+2+3+8+10+11+12)%=3.41>3.2不符合

3、数据表示:硬件能够直接识别、指令集可以直接调用的数据类型。

第三章流水线技术

1、流水线技术是指:将一个重复的时序过程分解成为若干个子过程,而每个子过程都可有效地在其专用功能段上与其他子过程同时执行。

2、从不同的角度和观点,把流水线分成多种不同的种类。

(1)按照流水线所完成的功能来分类

单功能流水线:只能完成一种固定功能的流水线。

多功能流水线:流水线的各段可以进行不同的连接,从而使流水线在不同的时间,或者在同一时间完成不同的功能。

(2)按照同一时间内各段之间的连接方式对多功能流水线做进一步的分类

静态流水线:在同一时间内,流水线的各段只能按同一种功能的连接方式工作。

动态流水线:在同一时间内,当某些段正在实现某种运算时,另一些段却在实现另一种运算。

(3)按照流水的级别来进行分类

部件级流水线(运算操作流水线):把处理机的算术逻辑部件分段,以便为各种数据类型进行流水操作。

处理机级流水线(指令流水线):把解释指令的过程按照流水方式处理。

处理机间流水线(宏流水线):由两个以上的处理机串行地对同一数据流进行处理,每个处理机完成一项任务。

(4)按照流水线中是否有反馈回路来进行分类

线性流水线:各段串行连接、没有反馈回路的流水线。

非线性流水线:各段除了有串行连接外,还有反馈回路的流水线。

(5)根据任务流入和流出的顺序是否相同来进行分类

顺序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。每一个任务在流水线的各段中是一个跟着一个顺序流动的。

乱序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同,允许后进入流水线的任务先完成(从输出端流出)。又称为无序流水线、错序流水线、异步流水线。3、流水线指标:吞吐率、加速比、效率

A吞吐率是指单位时间内流水线所完成的任务数或输出结果的数量。

最大吞吐率是指流水线在连续流动达到稳定状态后所得到的吞吐率。

第一种情况:各段时间相等(设为△t0)

假设流水线由 m 段组成,完成 n 个任务。

完成 n 个任务所需的时间

第二种情况:各段时间不等

B加速比是指流水线的速度与等功能非流水线的速度之比。S=T非流水/T流水

若流水线为 m 段,且各段时间相等,均为△t0 ,则: T非流水=n m△t0

T流水=m△t0+(n-1)△t0 (公式自己代入)

C (1)若各段时间相等,则各段的效率ei相等,即e1=e2 =e3=、、、=em=n△t0/T流水整个流水线的效率为:E=n△t0/T流水=n/(n+m-1)

(2)从时-空图上看,效率实际上就是 n 个任务所占的时空区与 m 个段总的时空区之比,即:

n 个任务占用的时空区

E =━━━━━━━━━━━━━

m 个段总的时空区

实例分析:性能分析(分析法, 时空图法).

例1. 四段流水线, △t1=△t3=△t4=△t, △t2=3△t,4个任务、10个任务时TP,η、SP 。(1)分析法: 各段时间不等

(2) 时空图法:

比较说明:N>>M流水性能才发挥得更好

4、非线性流水线调度:

5、流水线中的相关是指相邻或相近的两条指令因存在某种关联

流水线相关有3种类型:a数据相关、b名相关,包括反相关和输出相关(输出相关用换名技术来消除)、c控制相关(结构相关、数据相关、控制相关)

流水线冲突有3种类型及对策:

a结构冲突:因硬件资源满足不了指令重叠执行的要求而发生的冲突。

b数据冲突:当指令在流水线中重叠执行时,因需要用到前面指令的执行结果而发生的冲突。包括写后读冲突、写后写冲突和读后写冲突,对策有定向技术、停顿(气泡法)和编译器解决

c控制冲突:流水线遇到分支指令和其他会改变PC值的指令所引起的冲突。最简单方法冻结或排空。

第四章向量处理机

1、向量处理机:为了充分发挥流水线的效率,实现高性能计算,有的流水线处理机设置了向量数据表示和相应的向量指令。这种处理机称为向量处理机。

向量处理机的四个性能指标:a.向量指令的处理时间T vp;b.最大性能R 和半性能向量

长度n2/1;c.向量长度临界值n v。

第五章指令级并行及其开发—硬件开发

1、指令调度:通过改变指令在程序中的位置,将相关指令之间的距离加大到不小于指令执行延迟,将相关指令转化为无关指令。指令调度是循环展开的技术基础。

静态调度:它不是在程序执行的过程中,而是在编译期间进行代码调度和优化的。

动态调度:是在程序的执行过程中,依靠专门硬件对代码进行调度。

2、记分牌动态调度方法:该机器用一个称为记分牌的硬件实现了对指令的动态调度。

3、多指令流出技术(CPI值小于,就必须采用多流出技术),处理器有3种基本结构:

超长指令字:每个时钟周期流出的指令数是固定的,它们构成一条长指令,或说是一个混合指令包,这种处理器目前只能通过编译静态调度。

超标量:每个时钟周期流出的指令数不定,它既可以通过编译器静态调度,也可以通过记分牌或 Tomasulo算法动态调度。

超流水:将每个功能部件进一步流水化,特别是取指令或指令流出被分解为多个段,使得一个功能部件在一拍中可以处理多条指令。

流水线实现的五步:取指令、指令编译或寄存器读取、执行或有效地址计算、存储器访问或分支完成、写回

4、多指令处理机有几种(超流水线处理机)

K段流水线基准标量处理机、m度超标量处理机、n度超流水线处理机、(m,n)度超标量超流水线处理机。

指令多流出处理器受哪些因素的限制呢?主要受以下三个方面的影响:a程序所固有的指令级并行性。b硬件实现上的困难。c超标量和超长指令字处理器固有的技术限制。

第六章指令级并行及其开发—软件开发

1、循环展开和指令调度要注意哪些问题?

1 保证正确性:在循环展开和调度过程中尤其要注意两个地方的正确性:循环控制,操作数偏移量的修改;

2 注意有效性:只有能够找到不同循环体之间的无关性,才能有效地使用循环展开;

3 使用不同的寄存器,否则可能导致新的冲突;

4 删除多余的测试指令和分支指令,并对循环结束代码和新的循环体代码进行相应的修正;

5 注意对存储器数据的相关性分析;

6 注意新的相关性。由于原循环不同次的迭代在展开后都到了同一次循环体中,因此可能带来新的相关性。

第七章存储系统

1、程序的局部性原理:程序在执行时所访问的地址不是随机的,而是相对簇聚;这种簇聚包括指令和数据两部分。包含时间局部性(程序马上将要用到的信息很可能就是现在正在使用的信息)和空间局部性(程序马上将要用到的信息很可能与现在正在使用的信息在存储空间上是相邻的)。

2、计算机三级存储系统:高速缓冲存储器、主存储器、辅助存储器。

3、三种映像规则:全相联映像、直接相联映像、组相联映像。

全相联:是指主存中的任一块可以被放置到Cache中的任意一个位置。

直接映像:是指主存中的每一块只能放置到Cache中唯一的一个位置。

组相联映像:Cache被等分为若干组,每组有若干个块构成。主存中的每一块可以被放置到Cache中唯一的一个组中的任何一个位置。

4、三种类型的不命中:强制性不命中、容量不命中、冲突不命中。

命中率与Cache和相联度关系:(1)相联度越高,冲突不命中就越少。(2)强制性不命中和容量不命中不受相联度影响。(3)强制性不命中不受Cache容量的影响,但容量不命中却随着容量的增加而减少。

牺牲Cache:在Cache和其下一级存储器的数据通路上增设一个全相联的小Cache,称为牺牲Cache。牺牲Cache中存放因冲突而被替换出去的那些块。每当失效发生时,在访问下一级存储器之前,先检查Victim Cache中是否含有所需块。

5、Cache优化技术三种优化措施考一种:

第八章输入输出系统

优化技术不命

中率

不命中

开销

命中

时间

硬件复

杂度

说明

增加块大小+ —0 实现容易;Pentium 4的第二级Cache采用了128B

的块

增加Cache容量+ 1 被广泛采用,特别是第二级Cache 提高相联度+ — 1 被广泛采用

“牺牲”Cache + 2 AMD Athlon采用了8个项的“牺牲”Cache 伪相联Cache + 2 MIPS R10000的第二级Cache采用

硬件预取指令和数

+ 2~3 许多机器预取指令,UltraSPARC Ⅲ预取数据

编译器控制的预取+ 3 需同时采用非阻塞Cache;有几种微处理器提供了

对这种预取的支持

用编译技术减少Cache不命中次数+ 0

向软件提出了新要求;有些机器提供了编译器选项

使读不命中优于写+ 1 在单处理机上实现容易,被广泛采用

写缓冲合并+ 1 与写直达合用,广泛应用,例如21164,UltraSPARC

尽早重启动和关键

字优先

+ 2 被广泛采用非阻塞Cache + 3 所有乱序执行的CPU中都采用

两级Cache + 2 硬件代价大;两级Cache的块大小不同时实现困难;

被广泛采用

小而简单的Cache —+ 0 实现容易,被广泛采用对Cache进行索引

时不必进行地址转

换+ 2

对于小容量Cache来说实现容易,已被Alpa21164

和UltraSPARC Ⅲ采用

流水化Cache访问+ 1 被广泛采用Trace Cache + 3 Pentium 4 采用

1、I/O 系统的可靠性、可用性和可信性

a.系统从初始状态开始一直提供服务的能力,用平均无故障时间衡量

b.系统正常工作时间在连续两次正常服务间隔时间中所占的比例,用平均失效间隔时间衡量

c.多大程度上可以合理地认为服务是可靠的,不可度量。 2、同步方式、异步方式的优缺点

同步总线的控制线中包含一个时钟,总线上所有设备的所有通讯操作都以该时钟为基准。这种总线不仅速度快,而且成本低。但同步总线有两个缺点:①由于时钟过长距离传输后会扭曲,因而同步总线不能用于长距离的连接。特别是对于高速同步总线来说,更是如此。②总线上的所有设备都必须以同样的时钟频率工作。虽然有的同步总线上可以连接不同速度的设备,但其工作频率必须以最慢的设备为基准。CPU-储存器总线通常是采用同步总线。

异步总线上没有统一的参考时钟,每个设备都有各自的定时方法。总线上的发送设备和接收设备采用握手协议。异步总线能够比较容易地连接各种不同的设备,而且由于不是用统一的时钟来定时,因而也就不存在时钟扭曲和同步的问题,所以其传输距离可以比较长。很多I/O 总线都采用异步总线。

同步总线通常比异步总线快,因为它避免了传输时握手协议的额外开销。选择同步总线还是异步总线,不仅要考虑数据宽带,而且要考虑传输距离以及可以连接的设备数量。一般来说,如果设备的类型较少且距离较近,则宜采用同步总线;否则,就宜采用异步总线。 3、三种通道类型,三种类型通道与CPU 、设备控制器和外设的连接关系,三种类型的通道的流量

(1)字节多路通道 a 为多台低速或中速的外设服务。b 以字节交叉的方式分时轮流地为它们服务。c 字节多路通道可以包含多个子通道,每个子通道连接一台设备控制器。

(2)选择通道 a 为多台高速外围设备服务。 b 在一段时间内只为一台高速外设独占使用。c 选择通道的硬件包括5个寄存器、格式变换部件及通道控制部件

(3)数组多路通道 a 适用于高速设备。b 每次选择一个高速设备后传送一个数据块,轮流为多台外围设备服务。c 数组多路通道之所以能够并行地为多台高速设备服务,是因为虽然其所连设备的传输速率很高,但寻址等辅助操作时间很长。

通道流量:一个通道在数据传送期间,单位时间内能够传送的最大数据量,一般用字 节个数来表示。又称为通道吞吐率,通道数据传输率等。 通道最大流量,一个通道在满负荷工作状态下的流量。 TS :设备选择时间。

TD :传送一个字节所用的时间。

p : 在一个通道上连接的设备台数,且这些设备同时都在工作。 n: 每台设备传送的字节数,这里假设每台设备传送的字节数都相同。

k : 数组多路通道传输的一个数据块中的包含的字节数。在一般情况下,k

选择通道:

数组多路通道: 第九章 互连网络

n p )T (T T D S BYTE ??+=n p )T n

T (T D S

SELECT ??+=n

p )T k

T (T D S BLOCK ??+=

1、互连网络:一种由开关元件按照一定的拓扑结构和控制方式构成的网络,用来实现计算机系统中结点之间的相互连接。这些结点可以是处理器、存储模块或其他设备。

2、基本互联函数:恒等函数、交换函数、均匀洗牌函数

交换函数:实现二进制地址编码中第k 位互反的输入端与输出端之间的连接

主要用于构造立方体互连网络和各种超立方体互连网络。它共有n =log2N 种互连函数。(N 为结点个数)当N =8时,n =3,可得到常用的立方体互连函数:

N=8 的立方体交换函数

均匀洗牌函数:将输入端分成数目相等的两半,前一半和后一半按类似均匀混洗扑克牌的方式交叉地连接到输出端(输出端相当于混洗的结果)。 函数关系

即把输入端的二进制编号循环左移一位。 N=8 的均匀洗牌和逆均匀洗牌函数

逆均匀洗牌函数:将输入端的二进制编号循环右移

一位而得到所连接的输出端编号。

互连函数

逆均匀洗牌是均匀洗牌的逆函数

3、互连网络的主要特性参数有:(时延和带宽是评估互连网络性能的两个基本指标) (1)网络规模:网络中结点的个数。表示该网络所能连接的部件的数量。

(2)结点度:与结点相连接的边数(通道数),包括入度和出度。进入结点的边数称为入度。 从结点出来的边数称为出度。

(3)距离:对于网络中的任意两个结点,从一个结点出发到另一个结点终止所需要跨越的边数的最小值。

(4)网络直径:网络中任意两个结点之间距离的最大值。网络直径应当尽可能地小。 (5)结点之间的线长:两个结点之间连线的长度,用米、千米等表示。

(6)等分宽度:当某一网络被切成相等的两半时,沿切口的边数(通道数)的最小值称为

()011121011121x

x x x x x

x x x x x x x x E k k k n n k k k n n -+---+--=()()()

012012201201210120120x x x x x x C x x x x x x C x x x x x x C ===

0 1

2

3

4 5

6

7

0 1 2 3 4 5 6 7 (a) C 0交换函数

0 1 2 3

4 5 6 7 0 1 2 3 4 5 6 7 0 1 2

3 4 5 6 7 0 1 2 3 4 5 6

7

(b) C 1交换函数 (c) C 2交换函数 0

1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 (a) 均匀洗牌函数

1 2 3 4 5 6 7 0

1 2

3

4

5 6

7

(b) 逆均匀洗牌函数 ()101320121-----=n n n n n x x x x x x x x x S ()1

21001211x

x x

x x x x

x

S

n n n n -----=

通道等分宽度,用b表示。线等分宽度:B=b×w 其中:w为通道宽度(用位表示)。该参数主要反映了网络最大流量。

(7)对称性:从任何结点看到的拓扑结构都是相同的网络称为对称网络。对称网络比较容易实现,编程也比较容易。课本P257弄清楚线性阵列和环和带弦环。

1、cache降低失效率的几种方法增加Cache块大小、提高相联度、victim cache、伪相联cache、硬件预存、编译器控制的预存、编译器优化

4、减少失效开销技术

①让读失效优先于写②子块放置技术③请求字处理技术④非阻塞Cache技术⑤采用两级Cache

5、请求字优先:调块时,从请求字所在的位置读起。这样,第一个读出的字便是请求字。将之立即发送给CPU

计算机体系结构论文

计算机体系结构论文 论文题目:计算机系统结构中多处理机技术姓名:XXX 班级:XXX 学号:XXXX

摘要:多处理机是指能同时执行多个进程的计算机系统.多处理机通过共享的主存或输入/输出子系统或高速通信网络进行通信。利用多台处理机进行多任务处理,协同求解一个大而复杂的问题来提高速度,或者依靠冗余的处理机及其重组能力来提高系统的可靠性、适应性和可用行。该文介绍了微处理器的发展、多处理机的总线以及处理机系统中通信和存储技术的发展和两种特殊的多处理机系统结构,以及现今几种典型的并行计算机体系结构及处理机分配与调度策略。而本篇论文主要根据所阅读的文章进行扩展延伸,主要介绍了多处理机技术,它的总线以及分配调度方面。 关键字:多处理机;体系结构;总线;调度 引言: 微电子技术和封装技术的进步,使得高性能的VLSI微处理器得以大批量生产,性能价格比不断合理,这为并行多处理机的发展奠定了重要的物质基础。计算机系统性能增长的根本因素有两个:一个是微电子技术,另一个是计算机体系结构技术。五十年代以来,人们先后采用了先行控制技术、流水线技术、增加功能部件甚至多机技术、存储寻址和管理能力的扩充、功能分布的强化、各种互联网络的拓扑结构以及支持多道、多任务的软件技术等_系列并行处理技术,提高计算机处理速度,增强系统性能。多处理机体系结构是计算机体系结构发展中的一个重要内容,已成为并行计算机发展中人们最关注的结构。 多处理机的介绍: 多处理机是指能同时执行多个进程的计算机系统。 由于超大规模集成电路(VLSI)技术迅速发展的结果,多处理技术能够充分地发挥高性能的32位微处理机的有效性,用大量低价格的部件配置高性能的计算机结构系统.以典型的

计算机体系结构期末复习

计算机体系结构期末复习资料 1.并行性:是指在同一时刻或者是同一时间间隔内完成两种或两种以上性质相同或不同的工作。 2.CPI:每条指令执行时所花费的平均时钟周期。 3.体系结构:即计算机的属性,即概念性结构与功能特性。 4.Amdahl定理:加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。 5.信息存储的整数边界:信息在主存中存放的起始地址必须是该信息(字节数)的整数倍。 6.指令系统的正交性:指在指令中各个不同含义的字段,在编码时应互不相关,相互独立。 7.流水线技术:是指将一个重复的时序过程,分解成为若干子过程,而每个过程都可有效在其专用功能段上与其他子过程同时执行。 8.定向技术:在某条指令产生一个结果之前,其他指令并不直接需要该计算结果,如果能将该计算结果从其他产生的地方直接送到其他指令需要它的地方,那么就可以避免暂停的技术就叫定向技术。 9.相关:衡量两个随机变量之间相关程度的指标。 10.向量流水处理机:是指处理机具有向量数据表示并通过向量指令对向量的各元素进行处理。、

11.定向:将计算结果从其产生的地方直接送到其他指令需要它的地方,或所有需要它的功能单元,避免暂停。 12.指令集的并行:当指令之间不存在相关时,它们在流水线中是可以重叠起来并行执行。 13.记分牌技术:流出和读操作数。在没有结构冲突时,尽可能早地执行没有数据冲突的指令,实现每个时钟周期执行一条指令。如果某条指令被暂停,而后面的指令与流水线中正在执行或被暂停的指令都不相关,是这些指令可以跨越它,继续流出和执行下去。 14.Tomasulo算法:寄存器换名是通过保留站和流出逻辑来共同完成,当指令流出时,如果其操作数还没有计算出来,则该指令中相应的寄存器换名将产生这个操作数的保留站的标识。因此,指令流出到保留站后,其操作数寄存器或者换成了数据本身,或换成了保留站的标识,和寄存器无关。后面指令对该寄存器的写入操作就不会产生WAR冲突。 15.替换算法:由于主存中的块比Cache中的块多,所以当要从主存中调一个块到Cache中时,会出现该块所映象到的一组(或一个)Cache块已全部被占用的情况。这时,需要被迫腾出其中的某一块,以接纳新调入的块。

软件体系结构总结

第一章:1、软件体系结构的定义 国内普遍看法: 体系结构=构件+连接件+约束 2、软件体系结构涉及哪几种结构: 1、模块结构(Module) 系统如何被构造为一组代码或数据单元的决策 2、构件和连接件结构(Component-And-Connector,C&C) 系统如何被设计为一组具有运行时行为(构件)和交互(连接件)的元素 3、分配结构(Allocation) 展示如何将来自于模块结构或C&C结构的单元映射到非软件结构(硬件、开发组和文件系统) 3、视图视点模型 视点(View point) ISO/IEC 42010:2007 (IEEE-Std-1471-2000)中规定:视点是一个有关单个视图的规格说明。 视图是基于某一视点对整个系统的一种表达。一个视图可由一个或多个架构模型组成 架构模型 架构意义上的图及其文字描述(如软件架构结构图) 视图模型 一个视图是关于整个系统某一方面的表达,一个视图模型则是指一组用来构建 4、软件体系结构核心原模型 1、构件是具有某种功能的可复用的软件结构单元,表示了系统中主要的计算元素和数据存储。 2.连接件(Connector):表示构件之间的交互并实现构件

之间的连接 特性:1)方向性2)角色3)激发性4)响应特征 第二章 1、软件功能需求、质量属性需求、约束分别对软件架构产生的影响 功能性需求:系统必须实现的功能,以及系统在运行时接收外部激励时所做出的行为或响应。 质量属性需求:这些需求对功能或整个产品的质量描述。 约束:一种零度自由的设计决策,如使用特定的编程语言。 质量原意是指好的程度,与目标吻合的程度,在软件工程领域,目标自然就是需求。 对任何系统而言,能按照功能需求正确执行应是对其最基本的要求。 正确性是指软件按照需求正确执行任务的能力,这无疑是第一重要的软件质量属性。质量属性的优劣程度反映了设计是否成功以及软件系统的整体质量。 系统或软件架构的相关视图的集合,这样一组从不同视角表达系统的视图组合在一起构成对系统比较完整的表达

系统结构期末考试试题及答案

得分 评分人 填空题: (20分,每题2 分) 单选题:(10分,每题1分) A.任何虚页都可装入主存中任何实页的位置 B. 一个虚页只装进固定的主存实页位置 《计算机系统结构》期末考试试卷(A ) 得分 注:1、共100分,考试时间120分钟。 2、此试卷适用于计算机科学与技术本科专业。 1、."启动I/O"指令是主要的输入输出指令,是属于( A. 目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、 输入输出系统硬件的功能对 (B )是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、 全相联地址映象是指(A ) C. 组之间固定,组内任何虚页可装入任何实页位置 D.组间可任意装入,组内是固定装入 4、( C ) 属于MIMD 系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D. 阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关,则( B ) A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、 计算机使用的语言是(B ) A.专属软件范畴,与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D. 属于符号化的机器指令 7、 指令执行结果出现异常引起的中断是( C ) A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 &块冲突概率最高的 Cache 地址映象方式是(A ) A.直接 B .组相联 C .段相联 D .全相联 9、 组相联映象、LRU 替换的Cache 存储器,不影响 Cache 命中率的是(B ) A.增大块的大小 B .增大主存容量 C .增大组的大小 D .增加Cache 中的块数 10、 流水处理机对全局性相关的处理不 包括(C ) A.猜测法 B.提前形成条件码 C.加快短循环程序的执行 D.设置相关专用通路

计算机系统结构复习总结

计算机系统结构复习总结

计算机系统结构复习总结 一、计算机系统结构概念 1.1 计算机系统结构:程序员所看到的计算机的基本属性,即概念性结构与功能特性。 *注意:对不同层次上的程序员来说,由于使用的程序设计语言不同,可能看到的概念性结构和功能特性会有所不同。 1.2 计算机系统的层次结构 现代计算机是一种包括机器硬件、指令系统、系统软件、应用程序和用户接口的集成系统。 现代计算机结构图 *注意:计算机结构的层次模型 依据计算机语言广义的理解,可将计算机系统看成由多级“虚拟”计算机所组成。

从语言层次上画分可得下图: 计算机结构的层次模型 1.3计算机系统结构组成与实现 计算机系统结构:是计算机系统的软件与硬件直接的界面 计算机组成:是指计算机系统结构的逻辑实现 计算机实现:是指计算机组成的物理实现*计算机系统结构、组成与实现三者间的关系: 计算机系统结构不同会影响到可用的计算机组成技术不同,而不同的计算机组成又会反过来影响到系统结构的设计。因此,计算机系统结构的设计必须结合应用来考虑,要为软件和算法的实现提供更多更好的硬件支持,同时要考虑可

能采用和准备采用哪些计算机组成技术,不能过多或不合理地限制各种计算机组成、实现技术的采用与发展。 计算机组成与计算机实现可以折衷,它主要取决于器件的来源、厂家的技术特长和性能价格比能否优化。应当在当时的器件技术条件下,使价格不增或只增很少的情况下尽可能提高系统的性能。 1.4 计算机系统结构的分类 计算机结构分类方式主要有三种: (1)按“流”分类 按“流”分类法是Flynn教授在1966年提出的一种分类方法,它是按照计算机中 指令流(Instruction Stream)和数据流(Data Stream)的多倍性进行分类。指令流是指机 器执行的指令序列,数据流是指指令流调用 的数据序列。多倍性是指在计算机中最受限 制(瓶颈最严重)的部件上,在同一时间单 位中,最多可并行执行的指令条数或处理的 数据个数。 *注意:按“流”分类法,即Flynn分类法的逻

计算机系统结构论文

计算机系统结构论文 计算机系统结构中多处理机技术 摘要:多处理机通过共享的主存或输入/输出子系统或高速通信网络进行通信。利用多台处理机进行多任务处理,协同求解一个大而复杂的问题来提高速度,或者依靠冗余的处理机及其重组能力来提高系统的可靠性、适应性和可用行。该文介绍了微处理器的发展、多处理机的总线以及处理机系统中通信和存储技术的发展和两种特殊的多处理机系统结构。 关键词:多处理机;体系结构;总线 微电子技术和封装技术的进步,使得高性能的VLSI 微处理器得以大批量生产,性能价格比不断合理,这为并行多处理机的发展奠定了重要的物质基础。 计算机系统性能增长的根本因素有两个:一是微电子技术,另一个是计算机体系结构技术。五十年代以来,人们先后采用了先行控制技术、流水线技术、增加功能部件甚至多机技术、存储寻址和管理能力的扩充、功能分布的强化、各种互联网络的拓扑结构以及支持多道、多任务的软件技术等一系列并行处理技术,提高计算机处理速度,增强系统性能。多处理机体系结构是计算机体系结构发展中的一个重要内容,已成为并行计算机发展中人们最关注的结构。

1 微处理器的发展 20 世纪80 年代中期,RISC 精简指令集计算机,用20%指令的组合实现了CISC 计算机指令系统不常用的80%指令的功能。在提高性能方面,RISC 采用了超级流水线、超级标量、超长指令字并行处理结构;多级指令Cache;编译优化等技术,充分利用RISC 的内部资源,发挥其内部操作的并行性,从而提高流水线的执行效率。20 世纪80 年代后期,RISC 处理机的性能指标几乎以每年翻一番的速度发展,它对于提高计算机系统的性能和应用水平起着巨大的作用。 目前,由Intel 和HP 两家公司联合开发的基于IA—64 架构的Merced 芯片,并由其共同定义的显式并行指令计算技术EPIC(Explicitly Parallel Instruction Computing ),将为微处理器技术的发展带来突破性进展。EPIC 技术主要指编译器在微处理器执行指令之前就对整个程序的代码作出优化安排,编译器分析指令间的依赖关系,将没有依赖关系的指令(最多3 个)组成一“组”,由Merced内置的执行单元读入被分成组的指令群并执行。从理论上讲,EPIC 可以并行执行3 倍于执行单元数的指令。64 位体系结构的Merced 芯片还采用了指令预测、数据预装等技术,可以显著地减少实际执行程序的长度,同时增强语句执行的并行性,经过代码的重组,程序的执行时间比基于传统体系结构

计算机系统结构期末考试题目

第一章: 1.计算机系统结构的定义 答:由程序设计者看到的一个计算机系统的属性,即概念性结构和功能特性。 2.透明性概念 答:在计算机技术中,一种本来是存在的事物或属性,但从某种角度看似乎不存在,称为透明性现象。 3.兼容性向后兼容 兼容性:同一个软件可以不加修改地运行于系统结构相同的各档机器,可获得相同的结果,差别只在于不同的运行时间。 向后兼容:按某个时期投入市场的某种型号机器编制的程序,不加修改就能运行于在它之后投入市场的机器。 4.Amdahl定律 答:系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。 5.CPI 答:每条指令的平均时钟周期数。 6.MIPS 答:每秒百万条指令数!MIPS=时钟频率/(CPI*10^6) 7.MFLOPS 答:每秒百万次浮点操作次数。MFLOPS=程序中的浮点操作次数/(执行时间*10^6) 8.命中率的概念 答: 9.Flynn分类法是按指令流和数据流的多倍性特征进行计算机系统结构的划分 答:①单指令流单数据流SISD ②单指令流多数据流SIMD ③多指令流单数据流MISD(实际不存在)④多指令流多数据流MIMD 10.计算机系统设计的定量原理(四个) 答:①加快经常性事件的速度②Amdahl定律③CPU性能公式④访问的局部性原理11.CPI和加速比的计算 答:CPI=CPU时钟周期数/IC CPU时间=CPU时钟周期数/频率 CPU时间=CPU时钟周期*时钟周期长 加速比=(采用改进措施后的性能)/(没有采用改进措施前的性能) =(没有采用改进措施前执行某任务的时间)/(采用改进措施后执行某任务的时间) 12.软硬件实现的特点 硬件实现:速度快、成本高;灵活性差、占用内存少 软件实现:速度低、复制费用低;灵活性好、占用内存多 13.系统评价的标准 ①运算速度②存储器系统③其他性能④成本标准

计算机系统结构学习心得

计算机系统结构学习心得 姓名: 班级: 学号:

在大四上学期课程中对于计算机系统结构的学习已经结束,老师细心的讲解,耐心的辅导,是我从中学到很多的知识。 从中我了解到计算机系统结构(Computer Architecture)也称为计算机体系结构,它是由计算机结构外特性,内特性,微外特性组成的。经典的计算机系统结构结构的定义是指计算机系统多级层次结构中机器语言机器级的结构,它是软件和硬件固件的主要交界面,是由机器语言程序、汇编语言源程序和高级语言源程序翻译生成的机器语言目标程序能在机器上正确运行所应具有的界面结构和功能。计算机系统结构指的是什么? 是一台计算机的外表? 还是是指一台计算机内部的一块块板卡安放结构? 都不是,那么它是什么? 计算机系统结构就是计算机的的机器语言程序员或编译程序编写者所看到的外特性。所谓外特性,就是计算机的概念性结构和功能特性。用一个不恰当的比喻一,比如动物吧,它的"系统结构"是指什么呢? 它的概念性结构和功能特性,就相当于动物的器官组成及其功能特性,如鸡有胃,胃可以消化食物。至于鸡的胃是什么形状的、鸡的胃部由什么组成就不是"系统结构"研究的问题了。系统结构只管到这一层。关于计算机系统的多层次结构,用"人"这种动物的不恰当的例子列表对比如下。计算机系统,人,应用语言级,为人民服务级,高级语言级,读书、学习级,汇编语言级,语言、思维级,操作系统级,生理功能级,传统机器级,人体器官级,微程序机器级,细胞组织级,电子线路级,分子级。传统机器级以上的所有机

器都称为虚拟机,它们是由软件实现的机器。软硬件的。功能在逻辑上是等价的,即绝大多部分硬件的功能都可用软件来实现,反之亦然。计算机系统结构的外特性,一般应包括以下几个方面(这也就是我们要分章学习的几个章节)把这几个方面弄清了,系统结构也就基本明确了:(1)指令系统 (2)数据指令 (3)作数的寻址方式 (4)寄存器的构成定义 (5)中断机构和例外条件 (6)存 储体系和管理 (7)I/O结构 (8)机器工作状态定义和切换 (9)信息保护。所以在以后的学习中常回头想想这是系统结构的哪一方面,这对把握全局有好处。这里提一下计算机系统结构的内部特性,计算机系统结构的内特性就是将那些外特性加以"逻辑实现"的基本属性。所谓"逻辑实现"就是在逻辑上如何实现这种功能,比如"上帝"给鸡设计了一个一定大小的胃,这个胃的功能是消化食物,这就是鸡系统的某一外特性,那怎么消化呢,就要通过鸡喙吃进食物和砂石,再通过胃的蠕动、依靠砂石的研磨来消化食物,这里的吃和蠕动等操作就是内特性。还有一个就是计算机实现,也就是计算机组成的物理实现。它主要着眼于器件技术和微组装技术。拿上面的例子来说,这个胃由哪些组织组成几条肌肉和神经来促使它运动就是"鸡实现"。据此我们可以分清计算机系统的外特性、内特性以及物理实现之间的关系。在所有系统结构的特性中,指令系统的外特性是最关键的。因此,计算机系统结构有时就简称为指令集系统结构。我们这门课注重学习的是计算机的系统结构,传统的讲,就是处在硬件和软件之间介面的描述,

计算机测试系统发展综述

计算机测试系统发展综述 来源:牌技研究中心 https://www.360docs.net/doc/9215373042.html, 摘要: 计算机测试系统通常作为设备或武器系统的一个不可缺少的组成部分,其测试性能是衡量设备或武器系统优劣的一项重要指标。其应为基于标准总线的、模块化的开放式体系结构且具备虚拟仪器特点。通过分析和比较VXI总线和PXI总线特点,给出了计算机测试系统的发展方向。归纳出了计算机测试系统应具备的9个方面功能。给出了设计和研制计算机测试系统应遵循的基本原则。 关键词: 测试系统;VXI总线; PXI总线 测试技术涉及到众多学科专业领域,如传感器、数据采集、信息处理、标准总线、计算机硬件和软件、通信等等。测试技术与科学研究、工程实践密切相关,两者相辅相成,科学技术的发展促进了测试技术的发展,测试技术的发展反过来又促进了科学技术的进步。 测试仪器发展至今,大体经历了5 代: 模拟仪器、分立元件式仪器、数字化仪器、智能仪器和虚拟仪器。自上个世纪80年代以来,伴随微电子技术和计算机技术飞速发展,测试技术与计算机技术的融合已引起测试领域一场新的革命。1986 年美国国家仪器公司提出“虚拟仪器”即“软件就是仪器”的概念。虚拟仪器是卡式仪器的进一步发展,是计算机技术应用于仪器领域而产生的一种新的仪器类型,它以标准总线作为测试仪器和系统的基本结构框架,配置测量模块,通过软件编程实现强大的测量功能。在虚拟仪器系统中,用灵活、强大的计算机软件代替传统仪器的某些硬件,用人的智力资源代替物质资源,特别是系统中应用计算机直接参与测试信号的产生和测量特征的解析,使仪

器中的一些硬件、甚至整件仪器从系统中“消失”,而由计算机的硬软件资源来完成它们的功能。另外,通过软件可产生许多物理设备难以产生的激励信号以检测并处理许多以前难以捕捉的信号。虚拟仪器是计算机技术和测试技术相结合的产物,是传统测试仪器与测试系统观念的一次巨大变革。 测试技术和设备涉及国民经济和国防建设的各行各业,先进的电子测试设备在众多行业的科研、生产和设备维护使用过程中起着举足轻重的作用。特别是在电子产品、航空航天、武器装备、工业自动化、通信、能源等诸多领域,只要稍微复杂一点的涉及到弱电的系统(或装置)都要考虑测试问题。测试系统是设备或装备的一个必不可少的组成部分,如武器系统的维护维修离不开测试设备。一个系统(或装置)测试功能的完备与否已成为衡量其设计是否合理和能否正常运行的关键因素之一。 测试仪器和系统在国民经济和国防建设中起着把关和指导者的作用,它们广泛应用于炼油、化工、冶金、电力、电子、轻工和国防科研等行业。测试仪器和系统从生产现场各个环节获得各种数据,进行处理、分析和综合,通过各种手段或控制装置使生产环节得到优化,进而保证和提高产品质量。在武器系统科研试验现场,测试仪器和系统可获得试验中各个阶段和最终试验数据,用于及时发现试验中出现的问题和给出试验结论,并为后续相关试验提供依据。因此,测试仪器与系统对于提高科研和试验效率,加快武器试验进程和保证试验安全至关重要。以雷达、综合电子战为代表的军事电子领域,以预警机、战斗机、卫星通信、载人航天和探月工程为代表的航空、航天领域及以导弹武器系统为代表的兵器领域等都离不开测试设备,它是这些装备和系统正常使用和日常维护及维修所必备的。 1 系统类型 现代的测试系统主要是计算机化系统,它是计算机技术与测量技术深层次结合的产物。随着计算机技术的发展,构成测试系统的可选择性不断加大,按照测试功能要求,可构成多种类型的计算机测试系统。在计算机测试系统分类问题上并没有严格的统

2020.4《计算机体系结构》期末试卷A含答案

《计算机体系结构》期末考试A卷 (总分:100分,时间:100分钟) 姓名:周元华 专业:计算机科学与技术 学号: 18260070164016 学习中心:上海弘成 一、填空题(每空1分,共14分) 1.高速缓冲存储器的地址映象方式有三种,它们分别是:全向量方式,直接相联方式,组相连方式。 2.虚拟存储器的三种管理方式是段式管理,页式管理和 段页式管理。 3.从主存的角度来看,“Cache—主存”层次的目的是为了提高速度,而“主存—辅存”层次的目的是为了扩大容量 4.根据指令间的对同一寄存器读和写操作的先后次序关系,数据相关冲突可分为读与写(RAM)、写与读(WAR)和写与写(WAW)三种类型。 5.当代计算机体系结构的概念包括指令集结构、计算机组成和计算机实现三个方面的内容 二、名词解释(每题2分,共16分) 计算机体系结构: 计算机体系结构是指根据属性和功能不同而划分的计算机理论组成部分及计算机基本工作原理、理论的总称。其中计算机理论组成部分并不单与某一个实际硬件相挂钩,如存储部分就包括寄存器、内存、硬盘等。 兼容机: 兼容机,就是由不同公司厂家生产的具有相同系统结构的计算机。简单点说,就是非厂家原装,而改由个体装配而成的机器,其中的元件可以是同一厂家出品,但更多的是整合各家之长的 计算机。 写直达法: 写直达法一般指全写法。全写法(write-through):又称写直达法、写穿法,透写法,Cache使 用方式之一。 高速缓冲存储器: 高速缓冲存储器(Cache)其原始意义是指存取速度比一般随机存取记忆体(RAM)来得快 的一种RAM,一般而言它不像系统主记忆体那样使用DRAM技术,而使用昂贵但较快速的SRAM 技术,也有快取记忆体的名称。 高速缓冲存储器是存在于主存与CPU之间的一级存储器,由静态存储芯片(SRAM)组成, 容量比较小但速度比主存高得多,接近于CPU的速度。在计算机存储系统的层次结构中,是介 于中央处理器和主存储器之间的高速小容量存储器。它和主存储器一起构成一级的存储器。高速 缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的。 高速缓冲存储器最重要的技术指标是它的命中率。 延迟转移技术: 在转移指令之后插入一条或几条有效的指令。当程序执行时,要等这些插入的指令执行完成 之后,才执行转移指令,因此,转移指令好像被延迟执行了,这种技术称为延迟转移技术。 线性流水线: 线性流水线就是由一整套工艺串联而成的生产线。 流水线又称为装配线,一种工业上的生产方式,指每一个生产单位只专注处理某一个片段的工 作,以提高工作效率及产量;按照流水线的输送方式大体可以分为:皮带流水装配线、板链线、 倍速链、插件线、网带线、悬挂线及滚筒流水线这七类流水线。 输送线的传输方式有同步传输的/(强制式),也可以是非同步传输/(柔性式),根据配置的 选择,可以实现装配和输送的要求。输送线在企业的批量生产中不可或缺。 流水线的吞吐率: 流水线的吞吐率是单位时间内流水线处理的任务数。 并行性: 并行性是指计算机系统具有可以同时进行运算或操作的特性,在同一时间完成两种或两种以 上工作。它包括同时性与并发性两种含义。同时性指两个或两个以上事件在同一时刻发生。并发 性指两个或两个以上事件在同一时间间隔发生。 三、简答题(每题5分,共30分) 1.如有一个经解释实现的计算机,可以按功能划分成4级。每一 级为了执行一条指令需要下一级的N条指令解释。若执行第一 级的一条指令需K(ns)时间,那么执行第2、3、4级的一条指 令各需要用多少时间(ns)? 答:第1级:1条1级指令 K ns 第2级:1条2级指令N条1级指令 1*N*K ns = NK ns 第3级:1条3级指令N条2级指令 1*N*NK ns =N2K ns 第4级:1条4级指令N条3级指令 1*N*NNK ns =N3K ns 2.根据Amdahl定律,系统加速比由哪两个因素决定? 答:系统加速比依赖于两个因素: (1)可改进比例:可改进部分在原系统计算时间中所占的比例 (2)部件加速比:可改进部分改进以后的性能提高 3.简述组相联映象规则。 答:(1)主存与缓存分成相同大小的数据块。(2)主存和Cache 按同样大小划分成组。(3)主存容量 是缓存容量的整数倍,将主存空间按缓冲区的大小分成区,主存中每一区的组数与缓存的组数相同 4.引起Cache与主存内容不一致的原因是什么?为了保持Cache 的一致性,在单计算机系统中一般采取哪些措施? 答:不一致的原因:(1)由于CPU写Cache,没有立即写主存 (2)由于I/O处理机或I/O设备写主存 采取措施: (1)全写法,亦称写直达法(WT法-Write through) 方法:在对Cache进行写操作的同时,也对主存该内容进行写入 (2)写回法(WB法-Write back) 方法:在CPU执行写操作时,只写入Cache,不写入主存。 5.按照同一时间内各段之间的连接方式来分,流水线可分为哪两 类? 答:(1)静态流水线:在同一时间内,流水线的各段只能按同一种功能的连接方式工作。 (2)动态流水线:在同一时间内,当某些段正在实现某种运算时,另一些段却在实现另一种运算。 6.Flynn分类法是根据什么对计算机进行分类的?将计算机分 成哪几类? 答:Flynn分类法,根据计算机中指令和数据的并行状况把计算机分成: (1)单指令流单数据流(SISD.; (2)单指令流多数据流(SIMD.; (3)多指令流单数据流(MISD.; (4)多指令流多数据流(MIMD.。 四、问答与计算题(第1题10分,第2、3题每题15分共40分) 1.一个有快表和慢表的页式虚拟存储器,最多有64个用户,每 个用户最多要用1024个页面,每页4K字节,主存容量8M字节。 (1)写出多用户虚地址的格式,并标出各字段的长度。 (2)写出主存地址的格式,并标出各字段的长度。

计算机网络体系结构论文

计算机网络体系结构 摘要:计算机冈络体系结构描述了计算机网络功能实体的划分原则及其相互之间协同工作的方法和规则。本文主要介绍的是现在应用比较广泛的层次型网络体系结构,OSI基本参考模型,计算机网络的七层通信协议的主要功能及其之间的关系,并简单介绍了TCP/IP四层通信模型。 关键字:计算机网络,层次型网络体系结构,OSI,TCP/IP 上世纪60年代末期,早期的网络都是各公司根据用户的要求而设计的。虽然用户的应用要求千变万化,但对网络(通信)的要求相对一致。为使公司的产品可以适应千变万化的应用要求,尤其是适应用户扩充应用的要求,同时也是为了满足市场的要求,保证新老产品的兼容性和可操作性,各公司提出了基于本公司产品的计算机网络体系结构。 随着计算机技术和通信技术的发展,通用的计算机网络体系结构逐渐浮出水面。现在应用比较广泛的网络体系结构为层次型网络体系结构。层次型网络体系结构是计算机网络出现以后第一个被提出并实际使用的网络体系结构。直到目前,其产生和发展的过程始终与计算机网络产生和发展的过程保持协调一致。为了简化网络设计与实现的复杂性,层次型网络体系结构将复杂的网络问题分解为若干个不同的小问题,每个层次专注于解决特定的同题,这样就比较容易对所解决本层次涉及的同题实现模块化和标准化,标准化的层次间的通信规则被称为协议。层次型网络体系结构是层和协议的集合。典型的层次型网络体系结构通信模型如下图所示 层次型网络体系结构首先提出了模块化的设计实现思想:将复杂的网络问题分解为较为单纯易于解决的小问题;用不同的模块解决不同的问题。不同的模块之间接口简单明确,因此可以各自独立地制定标准和进行开发。这一思路即使在后来出现的其他网络体系结构中仍然得到了遵循。 国际标准化组织ISO为层次型网络体系结构设计了OSI参考模型。该模型将网络自底向上划分为物理层、数据链路层、网络层、传输层、会话层、表示层和应用层七个层次,每

软件体系结构综述

软件体系结构研究综述 班级:软件092 学号:17 姓名:陈世华摘要: 近年来,软件体系结构逐渐成为软件工程领域的研究热点以及大型软件系统与软件产品线开发中的关键技术之一.归纳了软件体系结构技术发展过程及其主要研究方向.在分析了典型的软件体系结构概念之后,给出了软件体系结构的定义.通过总结软件体系结构领域的若干研究活动,提出了软件体系结构研究的两大思路,并从7个方面介绍了软件体系结构研究进展.探讨了软件体系结构研究中的不足之处,并分析其原因.作为总结,给出了软件体系结构领域最有前途的发展趋势. 关键词: 软件体系结构;基于体系结构的软件开发;软件体系结构描述语言;软件体系结构描述方法;软件体系结构演化;软件体系结构发现;软件体系结构分析;软件体系结构验证;特定域软件体系结构(DSSA) Abstract: Software architecture (SA) is emerging as one of the primary research areas in software engineering recently and one of the key technologies to the development of large-scale software-intensive system and software product line system. The history and the major direction of SA are summarized, and the concept of SA is brought up based on analyzing and comparing the several classical definitions about SA. Based on summing up the activities about SA, two categories of study about SA are extracted out, and the advancements of researches on SA are subsequently introduced from seven aspects. Additionally, some disadvantages of study on SA are discussed, and the causes are explained at the same time. Finally, it is concluded with some significantly promising tendency about research on SA. Key words: software architecture; architecture-based development; architecture description language; architectural representation and description; architectural evolution and reuse; architectural discovery; architectural analysis; architectural verification and evaluation; domain-specific software architecture (DSSA)

计算机体系结构期末试卷及答案

课程测试试题( A 卷) ----------------------以下为教师填写-------------------- I、命题院(部):信息科学与工程学院 II、课程名称:计算机体系结构 III、测试学期:2014-2015学年度第2学期 IV、测试对象:信息学院计算机、网络专业 2012 级班 V、问卷页数(A4): 3 页 VI、答卷页数(A4): 4 页 VII、考试方式:闭卷(开卷、闭卷或课程小论文,请填写清楚) VIII、问卷内容: 一、填空题(共30分,20空,每空分) 1、现代计算机系统是由()和()组成的十分复杂的系统。 2、计算机系统应能支持软件可移植,实现可移植性的常用方法有3种,即(),(), 统一高级语言。 3、可以将当前大多数通用寄存器型指令集结构进一步细分为3种类型,即()、() 和存储器-存储器型指令集结构。 4、MIPS指令DADDIU R14,R5,#6属于()类型的指令格式;MIPS指令 SD R4,300(R5)属于()类型的指令格式。 5、描述流水线的工作,常采用时空图的方法。在时空图中,横坐标表示(),纵坐 标代表()。 6、在MIPS指令实现的简单数据通路中,在WB周期中,有两大类指令执行操作:() 和()指令。 7、存储器的层次结构中,“Cache-主存”层次是为了弥补主存()的不足,“主 存-辅存”层次是为了弥补主存()的不足。 8、Cache实现的映像规则有全相联映像、()和()三种。 9、反映存储外设可靠性能的参数有可靠性、()和()。 10、根据系统中处理器个数的多少,可把现有的MIMD计算机分为两类,每一类代表 了一种存储器的结构和互连策略。第一类机器称为()结构,第二类机器具有()。 二、判断题(每小题1分,共10分) 1、从计算机语言的角度,系统结构把计算机系统按功能划分成多级层次结构,其中, 第2级是操作系统虚拟机,第3级是汇编语言虚拟机。() 2、计算机系统中提高并行性的3种途径中,资源重复是在并行性概念中引入时间因 素,加快硬件周转而赢得时间。() 3、指令集结构中采用多种寻址方式可能会增加实现的复杂度和使用这些寻址方式的 指令的CPI。() 4、指令条数多,通常超过200条,是设计RISC的原则之一。() 5、根据流水线中各功能段之间是否有反馈回路,可把流水线分为线性流水线和非线 性流水线。() 6、在多级存储体系中,“cache——主存”层次的存储管理实现主要由软件件实现。

计算机体系结构知识点汇总

第一章计算机体系结构的基本概念 1.计算机系统结构的经典定义 程序员所看到的计算机属性,即概念性结构与功能特性。 2.透明性 在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。 3.系列机 由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。 4.常见的计算机系统结构分类法有两种:Flynn分类法、冯氏分类法Flynn分类法把计算机系统的结构分为4类: 单指令流单数据流(SISD) 单指令流多数据流(SIMD) 多指令流单数据流(MISD) 多指令流多数据流(MIMD) 5. 改进后程序的总执行时间

系统加速比为改进前与改进后总执行时间之比 6.CPI(Cycles Per Instruction):每条指令执行的平均时钟周期数 CPI = 执行程序所需的时钟周期数/IC 7.存储程序原理的基本点:指令驱动 8.冯·诺依曼结构的主要特点 1.以运算器为中心。 2.在存储器中,指令和数据同等对待。 指令和数据一样可以进行运算,即由指令组成的程序是可以修改的。 3.存储器是按地址访问、按顺序线性编址的一维结构,每个单元的位数是固定的。 4.指令的执行是顺序的 5.指令由操作码和地址码组成。 6.指令和数据均以二进制编码表示,采用二进制运算。 9.软件的可移植性 一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上正确地运行。差别只是执行时间的不同。我们称这两台计算机是软件兼容的。 实现可移植性的常用方法:采用系列机、模拟与仿真、统一高级语言。 软件兼容: 向上(下)兼容:按某档机器编制的程序,不加修改就能运行于比它高(低)档的机器。 向前(后)兼容:按某个时期投入市场的某种型号机器编制的程序,不加修改地就能运行于在它之前(后)投入市场的机器。 向后兼容是系列机的根本特征。 兼容机:由不同公司厂家生产的具有相同系统结构的计算机。

计算机体系结构重点总结

1、、Amdahl定律:某部件应用越频繁,当提高该部件性能时,整机性能也提高得越多;整机得性能加速不可能大于在原机器中除该部件外所有其它部件运行时间得百分比得倒数1/(1-F)。 F定义为采用先进高速部件得那部分程序在未采用先进高速部件得计算机上运行得时间占总时间得百分比,则F= 采用高速部件得任务在老计算机上运行得时间 整个任务在老计算机上运行得时间 同时将S定义为先进高速部件与老部件得性能,则 S= 老部件完成该功能得时间 先进高速部件完成该功能得时间 而采用了高速部件后整机性能提高比,即 Speedup = T old = 1 T new (1-F)+F/S 某种硬件增强技术,可使执行速度提高10倍,在采用增强技术得计算机上测出其使用率就是50%。根据Amdahl定律计算: ⑴采用增强技术后计算机性能加速比就是多少? ⑵未采用增强技术运行得部件在不采用增强技术得机器上运行时得时间比例。 2、(1)90/10局部性规则:程序花费90%得执行时间运行指令集中10%得指令代码。这就就是说在指令集中所有得指令只有10%指令就是常用得,而另外90%指令得使用率合起来只有10%。 (2)时间局部性:如果某一参数被引用,那它不久将再次被引用。这里指出了程序执行时在时间上得局部性 (3)空间局部性:如果某一参数被引用,那它附近得参数不久也将被引用。指出程序执行时地址空间上得局部性。 3、计算机得性能就是指在计算机上完成用户得应用任务所需得时间长短。完成同样任务所需得时间越短,计算机得性能越好。(考判断) 4、衡量计算机性能得参数:响应时间就是指计算机系统完成某一任务(程序)所花费得时间。 5、如果用速度来评价性能,我们称“高”为性能好;如果用响应时间来评价性能,我们称“短”为性能好。(考判断) 6、计算机整机性能分成两部分:一就是CPU执行程序得时间,二就是等待时间。 提高计算机性能就就是提高CPU性能与减少等待时间。 cpu性能因子CPI:每条指令得平均时钟周期数(clock cycles per instruction), CPI=CPU花费得时钟数/CPU执行得总指令数 CPUtime =指令数× CPI ×时钟周期==I× CPI ×τ 8、CPU性能因子:(1)时钟频率(f)(2)CPI(3)指令数(I) (考填空) CPU性能 =1/CPU time= f / ( I×CPI ) 计算机性能常用指标:(1)MIPS(million instruction per second)MIPS得意思就是每秒钟执行得百万条指令数。 MIPS= 指令数/ ( 执行时间×106 ) = 时钟频率 / ( CPI×106 ) =f / ( CPI×106 ) MFLOPS(million floating-point operation per second)每秒钟执行得百万个浮点操作数MFLOPS=浮点操作数 / 执行时间×106 10、工作负载基准程序(workload benchmark): (1)实际程序(2)核心基准程序(3)简单基准程序(4)合成基准程序 (考填空) 11、基准程序得一般设计原则: (1)具有代表性,反映用户得实际应用。 (2)不能对基准程序进行优化。 (3)复现性。能重复测试,其环境相同,结果能重复出现。(4)可移植性。系统相关性要小。 (5)紧凑性。基准程序不宜太庞大。 (6)成本-效率要高。 12、测量结果得统计与比较----性能报告:SPEC(system performance evaluation cooperative)基准程序 13、指令设计时主要以下几个方面来考虑: (考填空) ⑴应用范围;⑵指令得使用概率;⑶常用指令分析;⑷特殊指令设计。

计算机系毕业论文

计算机系毕业论文 计算机系毕业论文篇一:计算机系统结构简述 摘要:计算机系统结构是一个有多个层次组合而成的有机整体,随着科技的不断发展,未来的计算机将会朝着微型化、网络化和智能化的方向发展,为了使大家对计算机系统结构有一个大概的了解,本文主要介绍了计算机系统结构的一些基本概念、计算机系统结构的发展、计算机系统结构的分类方法和计算机系统设计的方法。 关键词:计算机系统结构;冯诺依曼结构;Flynn分类法;冯氏分类法 世界上第一台电子计算机ENIAC诞生于1946年,在问世将近70年的时间里,计算机共历经电子管计算机时代、晶体管计算机时代、中小规模集成电路计算机时代、大规模和超大规模集成电路计算机时代和巨大规模集成电路计算机时代,计算机更新换代的一个重要指标就是计算机系统结构。 1 计算机系统结构的基本概念 1.1 计算机系统层次结构的概念 现代计算机系统是由硬件和软件组合而成的一个有机整体,如果继续细分可以分成7层。L0:硬联逻辑电路;L1:微程序机器级;L2:机器语言级;L3:操作系统级;L4:汇编语言级;L5:高级语言级;L6:应用语言级。其中L0级由硬件实现;L1级的机器语言是微指令级,用固件来实现;L2级的机器语言是机器指令集,用L1级的微程序进行解释执行;L3级的机器语言由传统机器指令集和操作系统级指令组成,除了操作系统级指令由操作系统解释执行外,其余用这一级语言编写的程序由L2和L3共同执行;L4级的机器语言是汇编语言,该级语言编写的程序首先被翻译成L2或L3级语言,然后再由相应的机器执行;L5级的机器语言是高级语言,用该级语言编写的程序一般被翻译到L3或L4上,个别的高级语言用解释的方法实现;L6级的机器语言适应用语言,一般被翻译到L5级上。 1.2 计算机系统结构的定义 计算机系统结构较为经典的定义是Amdahl等人在1964年提出的:由程序设计者所看到的一个计算机系统的属性,即概念性结构和功能特性。由于计算机具有不同的层次结构,所以处在不同层次的程序设计者所看到的计算机的属性显然不同。

相关文档
最新文档