北京科技大学计算机体系结构总复习汇总(无重复带计算)

北京科技大学计算机体系结构总复习汇总(无重复带计算)
北京科技大学计算机体系结构总复习汇总(无重复带计算)

一、名词解释

1、Cache 2:1 经验规则:大小为N的直接映像Cache的失效率约等于大小为N/2的两路组相联Cache的失效率。

2、计算机体系结构:指那些对程序员可见的系统属性,还包括设计思想与体系结构。

3、同构型多处理机:由多个同类型,至少担负同等功能的处理机组成,同时处理同一作业中能并行执行的多个任务。

4、通道处理机:能够执行有限I/O指令,并且能够被多台外围设备共享的小型DMA专用处理机。

5、堆栈型机器:其CPU中存储操作数的主要单元是堆栈。

6、Victim Cache:在Cache与下一级存储器的数据通路之间增设一个全相联的小Cache,用来存放由于失效而被丢弃(替换)的那些块。

7、RAID:廉价磁盘冗余阵列或独立磁盘冗余阵列

8、累加器型机器:其CPU中存储操作数的主要单元是累加器

9、透明性:在计算机技术中,对本来存在的事物或属性,但从某种角度看又好象不存在的概念称为透明性。

10、向量处理机:面向向量型并行计算,以流水线结构为主的并行处理计算机。

11、通用寄存器型机器:CPU中存储操作数的主要单元是通用寄存器。

12、虚拟Cache:访问Cache的索引和标识都是虚拟地址的一部分。

13、机群:机群是一种价格低廉、易于构建、可扩放性极强的并行计算机系统。它由多台同构或异构的独立计算机通过高性能网络或局域网互连在一起,协同完成特定的并行计算任务。从用户的角度来看,机群就是一个单一、集中的计算资源。

14、定向技术:当流水线中出现数据冲突时,可以将计算结果从其产生的地方直接送到其他指令中需要它的地方,或所有需要它的功能单元,避免暂停。

15、系列机:由同一厂家生产的具有相同的系统结构,但具有不同组成和实现的一系列不同型号的机器。

16、强制性失效:当第一次访问一个块时,该块不在Cache中,需从下一级存储器中调入Cache,这就是强制性失效。

17、失效率:CPU在第一级存储器中找不到所需数据的概率。

18、数据相关:对于两条指令i(在前)和j(在后),如果下述条件之一成立,则称指令j 与指令i数据相关:

(1)指令j使用指令i产生的结果;

(2)指令j与指令k数据相关,而指令k又与指令i数据相关。

19、失效开销:CPU向第二级存储器发出访问请求到把这个数据块调入第一级存储器所需的时间。

20、容量失效:如果程序执行时所需的块不能全部调入Cache中,则当某些块被替换后,若又重新被访问,就会发生失效。这种失效称为容量失效。

21、通道:①传输信息的数据通路。②计算机系统中传送信息和数据的装臵。

22、指令级并行:并行执行两条或两条以上的指令。

1、Cache失效可以分为(强制失效)、(冲突失效)和(容量失效)三种。

2、说出三种对计算机发展非常关键的实现技术:(逻辑电路) 、(磁盘)和(网络) 。

3、2:1 Cache经验规则是指大小为N的(直接映象)Cache的失效率约等于大小为N/2的(两路组相联)Cache的失效率。

4、单机和多机系统中并行性发展的技术途径有:(时间重叠)、(资源重复)、(资源共享)。

5、通道分为(字节多路)通道、(选择)通道和(数组多路)通道三种类型

6、流水线中的相关有(名)相关、(数据)相关和(控制)相关三种。

7、在处理机中,若指令序列完成的顺序总是与它们开始执行的顺序保持一致,则只可能出现(名)相关,否则就有可能出现(名相关)、(数据相关)和(控制)相关。

8、输入/输出系统包括(外部设备(I/O设备,辅助存储器))和(其与主机之间的控制部分)

9、设计I/O系统的三个标准是(成本)、(性能)和(容量)。

10、存储器层次结构设计技术的基本依据是程序的(访问的局部性原理)。

11、相联度越高,(冲突)失效就越少;(强制性)失效不受Cache容量的影响,但(容量)失效却随着容量的增加而减少。

12、在虚拟存储器中,一般采用(全相连)地址映象方法和(LRU)更新策略。

13、计算机系统中提高并行性的技术途径有(时间重叠)、(资源重复)、(资源共享)三种。在高性能单处理机的发展中,起主导作用的是(时间重叠原理)。

14、对向量的处理有(水平处理)方式、(垂直处理)方式和(分组处理)方式。

15、同构型多处理机和异构型多处理机所采用的提高并行性的技术途径分别是(时间重叠)和(资源重复)。

16、地址映象方法有(全相联)、(组相联)和(直接相联)三种,其中(全相联)的冲突率最低。

17、软件兼容有(向上兼容)、(向下兼容)、(向前兼容)和(向后兼容)四种。其中(向后兼容)是软件兼容的根本特征。

18、流水线数据相关(冲突)有三种,分别是:(写后读相关(WAR))、(读后写相关(RAW))和(写后写相关(WAW))。

19、从处理数据的角度,并行性等级可以分为字串位串、(字串位并)、(字并位串)和全并行。

20、从执行程序的角度看,并行性等级可以分为:(指令内部并行)、(指令级并行)、(线程级并行)、(任务级或过程级并行)和作业或程序级并行。

21、在存储层次中,常用的替换算法有(随机法)、(FIFO)和(LRU)。

22、设有一个“Cache-主存”层次,Cache为4块,主存为8块;试分别对于以下2种情况,计算访存块地址为5时的索引(index)。

(1)组相联,每组两块;索引为(1)。5%2=1

(2)直接映象;索引为(1)。5%4

23、根据CPU内部存储单元类型,可将指令集结构分为(堆栈)型指令集结构、(累加器)型指令集结构和(通用寄存器)型指令集结构。

1、简述使用物理地址进行DMA存在的问题,及其解决办法。

1)对于超过一页的数据缓冲区,由于缓冲区使用的页面在物理存储器中不一定是连续的,所以传输可能会发生问题。

2)如果DMA正在存储器和缓冲区之间传输数据时,操作系统从存储器中移出(或重定位)一些页面,那么,DMA将会在存储器中错误的物理页面上进行数据传输。

解决方法:使操作系统在I/O的传输过程中确保DMA设备所访问的页面都位于物理存储器中,这些页面被称为是钉在了主存中。利用“虚拟DMA”技术,允许DMA设备直接使用虚拟地址,并在DMA期间由硬件将虚拟地址转换为物理地址。在采用虚拟DMA的情况下,如果进程在内存中被移动,操作系统应该能够及时地修改相应的DMA地址表。

2、从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型

3、在指令集结构设计中,应该考虑哪些主要问题?

1)①指令集功能设计:主要有RISC和CISC两种技术发展方向;②寻址方式的设计:设臵寻址方式可以通过对基准程序进行测试统计,察看各种寻址方式的使用频度,根据适用频度设臵相应必要的寻址方式;③操作数表示和操作数类型:主要的操作数类型和操作数表示的选择有,浮点数据类型(可以采用IEEE 754标准)、整型数据类型(8位、16位、32位的表示方法)、字符型(8位)、十进制数据类型(压缩十进制和非压缩十进制数据表示)等等。

2)寻址方式的表示:可以将寻址方式编码与操作码中,也可将寻址方式作为一个单独的域来表示。

3)指令集格式的设计:有固定长度编码方式、可变长编码方式和混合编码方式三种选择。

4、试以系列机为例,说明计算机体系结构、计算机组成和计算机实现三者之间的关系。

1)如在设计主存系统时,i)确定主存容量、编址方式、寻址范围属于计算机系统结构。

ii)确定主存周期、逻辑上是否采用并行主存、逻辑设计等属于计算机组成。

iii)选择存储芯片类型、微组装技术、线路设计等属于计算机实现。

2)计算机组成是计算机系统结构的逻辑实现。计算机实现是计算机组成的物理实现。一种体系结构可以有多种组成。一种组成可以有多种实现。

5、任写出五种降低Cache失效开销的方法(Cache的优化技术),并简述其基本思想。

1)让读失效优先于写:Cache中的写缓冲器导致对存储器访问的复杂化,所以推迟对读失效的处理并检查写缓冲器的内容。

2)写缓冲合并:如果写缓冲器中已经有了待写入的数据,就要把这次的写入地址与写缓冲器中已有的所有地址进行比较,看是否有匹配的项。如果有地址匹配而对应的位臵又是空闲的,就把这次要写入的数据与该项合并。

3)请求字处理技术:从下一级存储器调入Cache的块中,只有请求字是立即需要的。所以应尽早把请求字发送给CPU。

4)非阻塞Cache技术:Cache失效时仍允许CPU进行其他的命中访问。

5)采用二级Cache:第一级Cache小而快,第二级Cache容量大,即快和容量二者兼顾6、指令集结构设计中表示寻址方式的主要方法有哪些?简述这些方法的优缺点。

1)将寻址方式编于操作码中,由操作码在描述指令的同时也描述了相应的寻址方式。

优缺点:这种方式译码快,但操作码和寻址方式的结合不仅增加了指令的条数,导致了指令的多样性,而且增加了CPU对指令译码的难度。

2)为每个操作数设臵一个地址描述符,由该地址描述符表示相应操作数的寻址方式。

优缺点:这种方式译码较慢,但操作码和寻址独立,易于指令扩展。

7、软件兼容有几种?其中哪一种是软件兼容的根本特征?

1)软件兼容:一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。分为:向上、下、前、后兼容四种。

2)上(下):按某档计算机编制的程序,不加修改就能运行于比它高(低)档的计算机。

3)后(前)兼容:按某个时期投入市场的某种型号计算机编制的程序,不加修改地就能运行于在它之后(前)投入市场的计算机。

4)向后兼容是一定要保证的,它是软件兼容的根本特征,是系列机的根本特征。

8、造成流水线“断流”的主要原因是哪三种相关?简述三种相关的基本思想。

1)数据相关:指令j使用指令i产生的结果,或者指令j与指令k数据相关,指令k又与指令i数据相关。

2)名相关:两条指令使用相同的名,但他们之间并没有数据流动。

3)控制相关:由分支指令引起,需要根据分支指令的执行结果来确定后续指令是否执行9、计算机体系结构设计和分析中最经常使用的三条基本原则是什么?并说出它们的含义。

1)以经常性事件为重点:对经常发生的情况进行优化,使分配更多的资源,达到更高的性能或者分配更多的电能。

2)Amdahl定律:加快某部件执行速度所能获得的系统性能加速比,受限于该部件的执行事件占系统中总执行事件的百分比。

3)程序的局部性原理:程序执行时所访问的存储器地址分布不是随机的,而是相对的簇聚。

10、通道分为哪三种类型?它们分别适合为哪种外围设备服务?

1)字节多路通道。一种简单的共享通道,主要为多台低速或中速的外围设备服务。

2)数组多路通道。适于为高速设备服务。

3)选择通道。为多台高速外围设备(如磁盘存储器等)服务的。

11、调度分支延迟指令有哪三种常用方法?它们各有什么优缺点。

1)从前调度:可以有效提高流水线性能,但分支必须不依赖于被调度的指令。

2)从目标处调度:分支转移成功时,可以提高流水线性能,但由于复制指令,可能加大程序空间。

3)从失败处调度:分支转移失败时,可以提高流水线性能。但如果分支转移成功,必须保证被调度的指令对程序的执行没有影响。

12、表示寻址方式的主要方法有哪些?简述它们的优缺点。

1)将寻址方式编于操作码中,由操作码在描述指令的同时也描述了相应的寻址方式。这种方式译码快,但操作码和寻址方式的结合不仅增加了指令的条数,导致了指令的多样性,而且增加了CPU对指令译码的难度。

2)为每个操作数设臵一个地址描述符,由该地址描述符表示相应操作数的寻址方式。这种方式译码较慢,但操作码和寻址独立,易于指令扩展。

14、试从3C失效的关系分析增加块大小对Cache性能的影响。

降低失效率最简单的方法是增加块大小。(1)对于给定的Cache 容量,当块大小增加(从16字节开始)时,失效率开始是下降,后来反而上升了。(2) Cache 容量越大,使失效率达到最低的块大小就越大。导致上述失效率先下降后上升的原因,在于增加块大小会产生双重作用。一方面它减少了强制性失效,因为局部性原理有两方面的含义:时间局部性和空间局部性,增加块大小利用了空间局部性;另一方面,由于增加块大小会减少Cache 中块的数目,所以有可能会增加冲突失效。在Cache 容量较小时,甚至还会增加容量失效。刚开始增加块大小时,由于块大小还不是很大,上述的第一种作用超过第二种作用,从而使失效率下降。但等到块大小较大时,第二种作用超过第一种作用,使失效率上升。0简述减小Cache失效开销的几种方法答:让读失效优先于写、写缓冲合并、请求字处理技术、非阻塞Cache或非锁定Cache技术、采用二级Cache。15、写出三级Cache的平均访问时间的公式。

平均访存时间=命中时间+失效率× 失效开销

只有第I层失效时才会访问第I+1。

设三级Cache的命中率分别为HL1、Hl2、HL3,失效率分别为Ml1、Ml2、ML3,第三级Cache的失效开销为PL3.

则平均访问时间TA =HL1+Ml1{Hl2+Ml2(HL3+ML3×PL3)}

16、有哪几种向量处理方式?它们对向量处理机的结构要求有何不同?

1) 水平处理方式:不适合对向量进行流水处理。

2) 垂直处理方式:适合对向量进行流水处理,向量运算指令的源/目向量都放在存储器内,

使得流水线运算部件的输入、输出端直接与存储器相联,构成MM型的运算流水线。

3) 分组处理方式:适合流水处理。可设长度为n的向量寄存器,使每组向量运算的源/

目向量都在向量寄存器中,流水线的运算部件输入、输出端与向量寄存器相联,构成RR 型运算流水线。

17、在进行计算机系统设计时,一个设计者应该考虑哪些因素对设计的影响?

技术的发展趋势;计算机使用的发展趋势;计算机价格的发展趋势。

18、流水线数据相关有哪几种?解释它们的含义,并用代码举例说明。解决数据相关有哪些主要方法?

首先,流水线有三种相关:名相关,数据相关和控制相关。而数据相关分为:RAW读后写、WAR写后读和WAW写后写相关。

1)其中WAR相关是由于流水线数据相关引起的,即j 的执行要用到 i 的计算结果,当它们在流水线中重叠执行时,j 可能在 i 写入其计算结果之前就先行对保存该结果的寄存器进行读操作,从而得到错误的值。

2)WAW相关是由于名相关的输出相关引起的,即j和i的目的寄存器相同,当它们在流水线中重叠执行时,j可能在i写入其计算结果之前就先行对该结果寄存器进行写操作,从而导致写入顺序错误,在目的寄存器中留下的是i 写入的值,而不是j 写入的值。

3)RAW相关是由于名相关的反相关引起的,即j可能在i读取某个源寄存器的内容之前就先对该寄存器进行写操作,导致i 后来读取到的值是错误的。

如下列代码:F0,F4和R1都存在数据相关,执行将出现错误。但为了保证下述指令序列的正确执行,流水线只好暂停。

Loop:L.D F0,0(R1)// F0为数组元素

ADD.D F4,F0,F2 // 加上F2中的值

S.D F4,0(R1)// 保存结果

DADDIU R1,R1,-8 // 数组指针递减8个字节

BNE R1,R2,Loop // 如果R1≠R2,则分支

采用定向技术可以消除相关,思想是:在某条指令产生计算结果之前,其他指令并不真正立即需要该计算结果,如果能够将该计算结果从其产生的地方直接送到其他指令需要它的地方,那么就可以避免停顿。

19、试举例说明DLX流水线中存在不能依靠定向技术解决的数据相关及其解决方法。

不是所有数据相关带来的暂停都可以通过定向技术消除,如下面的例子:

LW R1,0(R2)

SUB R4,R1,R5

AND R6,R1,R7

OR R8,R1,R9

这是LW指令不能将结果定向到SUB指令,就需要设臵一个称为流水线互锁的功能部件。

一旦流水线互锁检测到上述数据相关,流水线暂停执行LW指令之后的所有指令,直到能够通过定向解决该数据相关为止。

四、计算题

1、给定以下的假设,试计算直接映象Cache和两路组相联Cache的平均访问时间以及CPU 的性能。由计算结果能得出什么结论?(考试的时候数肯定不一样!!!)

(1)理想Cache情况下的CPI为2.0,时钟周期为2 ns,平均每条指令访存1.3次。(2)两者Cache容量均为64 KB,块大小都是32字节。

(3)组相联Cache中的多路选择器使CPU的时钟周期增加了10%。

(4)这两种Cache的失效开销都是70 ns。

(5)命中时间为1个时钟周期。

(6)64 KB直接映象Cache的失效率为1.4%,64 KB两路组相联Cache的失效率为1.0%。

平均访存时间为:平均访存时间=命中时间+失效率×失效开销

=2.0+(0.014×70)=2.98 ns

平均访存时间

1路

=2.0×1.10+(0.010×70)=2.90 ns

平均访存时间

2路

2路组相联Cache的平均访存时间比较低。

CPU 时间=IC×(CPIexe+每条指令的平均存储器停顿周期数)×时钟周期时间

=IC ×(CPIexe×时钟周期时间+每条指令的平均存储器停顿时间) CPU时间1路=IC×(2.0×2+(1.3×0.014×70)) =5.27×IC

CPU时间2路=IC×(2.0×2×1.10+(1.3×0.010×70)) =5.31×IC

所以直接映象Cache的平均性能好一些。

2、计算机系统字长64位,包含三个选择通道和一个多路通道,每个选择通道上连接了两台磁盘机和三台磁带机,多路通道上连接了了两台行式打印机,两台读卡机、10台终端,假定各设备的传输率如下:磁盘机:600 KBps,磁带机:200 KBps,行打机:6.6 KBps,读卡机:1.2 KBps,终端:1 KBps

TS:设备选择时间。从通道响应设备发出的数据传送请求开始,到通道实际为这台设备传送数据所需要的时间。

TD:传送一个字节所用的时间。

p:在一个通道上连接的设备台数,且这些设备同时都在工作。

n:每台设备传送的字节数,这里假设每台设备传送的字节数都相同。

k:数组多路通道传输的一个数据块中包含的字节数。在一般情况下,k

磁带等磁表面存储器,通常k=512。

选择通道和数组多路通道的实际流量就是连接在这个通道上的所有设备中数据流量最大的那一个 。

因此,多路通道最大传输率是6.6 KBps ,选择通道最大传输率是600KBps ,系统的最大I/O 传输率应为二者之和606.6KBps

3、某计算机系统采用浮点运算部件后使浮点运算速度提高到原来的20倍,而系统运行一程序的整体性能提高到原来的10倍,试计算该程序中浮点操作所占的比例。

设比例为x ,根据Amdahl 定律知:

求解得x=0.0956,即占比9.56%

4、动态多功能流水线由6个功能段组成,如下图所示:

其中,s1、s4、s5、s6组成乘法流水线,s1、s2、s3、s6组成加法流水线,各个功能段时间为△t ,假设该流水线的输出结果可以直接返回输入端,而且设置有足够地缓冲寄存器,若以最快的方式用该流水计算:∏(Ai +Bi )(其中i =1..4,∏为连乘符号)

(1)画出其处理过程的时空图。

(2)计算其实际的吞吐率、加速比和效率。

1) 先计算A1+B1、A2+B2、A3+B3和A4+B4;

再计算(A1+B1)×(A2+B2)和(A3+B3)×(A4+B4);

然后求总的乘积结果。

时空图:

时间 段

A 1

B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B

C

D A ×B

C ×

D 1 2 3 4

流水线的各段时间不完全相等时,一条k 段流水线完成n 个连续任务的实际加速比为:

所以上述在18个△t 时间中,给出了7不用流水线,

4△t ,则产生上述7个结果共需(4×6+3×4)

△t = 36△t 5、在伪相联中,假设在按直接映象找到的位臵处没有发现匹配,而在另一个位臵才找到数据(伪命中)需要2个额外的周期;直接映象的命中时间为1个时钟周期,两路组相联的命中时间为1.2个时钟周期,直接映象情况下失效开销为50个时钟周期,当Cache 容量为64 KB 时,直接映象的失效率为1.4%,两路组相联的失效率为1%,问:直接映象、两路组相联和伪相联这三种组织结构中,哪一种速度最快?

解:

首先考虑标准的平均访存时间公式:

平均访存时间伪相联 = 命中时间伪相联+失效率伪相联×失效开销伪相联

由于:失效率伪相联=失效率2路

命中时间伪相联=命中时间1路+伪命中率伪相联×2

伪相联查找的命中率等于2路组相联Cache 的命中率和直接映象Cache 命中率之差。 所以,伪命中率伪相联 =命中率2路-命中率1路

=(1-失效率2路)-(1-失效率1路)

=失效率1路-失效率2路

平均访存时间伪相联=命中时间1路+(失效率1路-失效率2路)×2

+ 失效率2路×失效开销1路

所以:

平均访存时间伪相联64 KB =1+(0.014-0.01)×2+(0.01×50)=1.508个时钟

而正常的平均访存时间=命中时间+失效率×失效开销

对于64KB Cache,可得:

平均访存时间1路=1 + 0.014 ×50 = 1.7个时钟

平均访存时间2路=1.2 + 0.01 ×50 = 1.7个时钟

所以,伪相联Cache都是速度最快的。

6、假定Cache的失效开销为50个时钟周期,当不考虑存储器停顿时,所有指令的执行时间都是2.0个时钟周期,访问Cache失效率为2%,平均每条指令访存1.33次。求没有Cache 和有Cache两种情况下的平均指令执行时间。

平均访存时间有Cache=2 + 0.02 ×50 = 3个时钟

平均指令执行时间有Cache= 1.33 ×3 = 3.99个时钟

平均访存时间无Cache=2 + 1 ×50 = 52个时钟

平均指令执行时间无Cache= 1.33 ×52= 69.69个时钟

显然有Cache快得多。

7、在三级Cache中,第一级Cache、第二级Cache和第三级Cache的局部失效率分别为4%、30%和50%。它们的全局失效率各是多少?

第一级Cache、第二级Cache和第三级Cache的局部失效率分别为4%、30%和50%指假设访问存储器1000次,则第一级失效40次,第二级失效x2/40 = 0.3,即12次,第三级失效x3/12 = 0.5,即6次。所以全局失效率为:第一级4%,第二级12/1000=1.2%,第三级6/1000=0.6%。

8、计算机A和计算机B具有相同的指令系统。执行同一个程序时,计算机A的时钟周期为1.1 ns,CPI为2.0,计算机B的时钟周期为2 ns,CPI为1.3。请问执行这个程序时,哪台计算机更快?

CPI表示每条计算机指令执行所需的时钟周期数

A需要2个,即2×1.1=2.2ns 一条指令;

B需要1.3个,即1.3×2=2.6ns一条指令。

显然A更快。

9、(1)根据Amdahl定律写出系统加速比的公式。

(2)某计算机系统有两个部件可以改进,这两个部件的加速比为:部件加速比1=30;部件加速比2=20;如果部件1和部件2的可改进比例分别为30%和40%,求整个系统的加速比。

所以:

系统加速比=系统加速比1×系统加速比2 = 2.2716

所以整个系统的性能提高到原来的2.2716倍。

10、将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?

由题可知:可改进比例= 40% = 0.4 部件加速比= 10

根据Amdahl定律可知:

采用此增强功能方法后,能使整个系统的性能提高到原来的1.5625倍。

11、在Tomasulo算法中,进入“流出”段的条件是什么?对于浮点操作来说,要进行哪些动作和记录工作?

进入“流出”段的条件:有空闲保留站r

动作和记录工作:(1)判断第一操作数是否就绪;如果是,就把操作数读到保留站,否则就把寄存器状态表中的标识送给保留站。(2)判断第二操作数是否就绪;如果是,就把操作数读到保留站,否则就把寄存器状态表中的标识送给保留站。(3)把保留站臵为忙。(4)把操作码送保留站。(5)把保留站号r送到与该指令的结果寄存器对应的寄存器状态表项。

12、目录协议中,Cache块有哪三种状态?

(1)共享:在一个或多个处理器上具有这个块的副本,且主存中的值是最新值(所有Cache 均相同)。(2)未缓冲:所有处理器的Cache都没有此块的副本。(3)专有:仅有一个处理器上有此块的副本,且已对此块进行了写操作,而主存的副本仍是旧的。这个处理器称为此块的拥有者。

13、论述Tomasulo算法的基本思想。

记录和检测指令相关,操作数一旦就绪就立即执行,把发生RAW(写后读)冲突的可能性减少到最少。通过寄存器换名来消除WAR(读后写)和WAW(写后写)冲突。14.论述Tomasulo算法的基本思想。

Tomasulo算法的基本思想是只要操作数有效,就将其取到保留站,避免指令流出时才到寄存器中取数据,这就使得即将执行的指令从相应的保留站中取得操作数,而不是从寄存器中。指令的执行结果也是直接送到等待数据的其他保留站中去。因而,对于连续的寄存器写,只有最后一个才真正更新寄存器中的内容。一条指令流出时,存放操作数的寄存器名被换成为对应于该寄存器保留站的名称(编号)。指令流出逻辑和保留站相结合实现寄存器换名,从而完全消除了数据写后写和先读后写相关这类名相关。

15.在Tomasulo算法中,进入“流出”段的条件是什么?对于浮点

操作来说,要进行哪些动作和记录工作?(9分)

进入“流出”段的条件:有空闲保留站r

动作和记录工作:写出算法或者文字描述均可。

要点:

(1)判断第一操作数是否就绪;如果是,就把操作数读到保留站,否则就把寄存器状态表中的标识送给保留站。

(2)判断第二操作数是否就绪;如果是,就把操作数读到保留站,否则就把寄存器状态表中的标识送给保留站。

(3)把保留站臵为忙。

(4)把操作码送保留站。

(5)把保留站号r送到与该指令的结果寄存器对应的寄存器状态表项。

8.请简述I/O系统设计的步骤。

?了解常用外围设备或被控设备与CPU之间信息交换的要求,确定控制方式;

?考虑硬件和软件的功能分配;

?进行I/O端口的数量统计、数据流向安排和端口地址号分配;

?I/O接口硬件电路的扩展设计;

?I/O接口控制软件设计;

?进行接口硬件和软件联调。

9.流水线数据相关有哪几种?简述定向技术的基本思想。(15分)

相关有3种类型,分别是数据相关(也称真数据相关)、名相关、控制相关。

在发生数据冲突时,后面的指令并不是立即就要用到前一条指令的计算结果。如果能够将计算结果从其产生的地方直接送到需要它的地方,就可以避免暂停。当定向硬件检测到前面某条指令的结果寄存器就是当前指令的源寄存器时,控制逻辑会将前面那条指令的结果直接从其产生的地方定向到当前指令所需的位臵。

北科大研究生计算方法作业

计算方法 姓名: 学号: 班级: 指导教师:

目录 作业1 (1) 作业2 (5) 作业3 (8) 作业4 (10) 作业5 (14) 作业6 (16) 作业7 (17)

作业1 1、分别用不动点迭代与Newton 法求解方程 -+=x 2x e 30的正根与负根。 解: (1)不动点迭代 a.原理: 将 230x x e -+=变型为1()k k x g x +=进行迭代,直到为止 变型后为有两种形式:和 b.程序:初值为1 形式: x=zeros(100,1); tol=1; i=1; x(1)=1; whiletol>=10e-6; disp(x(i)) x(i+1)=log(2*x(i)+3); tol=abs(x(i+1)-x(i)); i=i+1; end disp(i-1); 形式: x=zeros(100,1); tol=1; i=1; x(1)=1; whiletol>=10e-6; disp(x(i)) x(i+1)=(exp(x(i))-3)/2; tol=abs(x(i+1)-x(i)); i=i+1; end disp(i-1); c.运行结果: 初值为1 (23) 1ln k x k x ++=6 110k k x x -+-<13 2 k x k e x +-= (23)1ln k x k x ++=132 k x k e x +-=

迭代次数:11 迭代次数:9 (2)Nexton法 a.原理: 令 () () 1' k k k k f x x x f x + =-得到迭代公式为: () 1 23 2 k k x k k k x x e x x e + -+ =- - b.程序:初值为0 x=zeros(100,1); tol=1; i=1; x(1)=0; whiletol>=10e-6; disp(x(i)) x(i+1)=x(i)-((2*x(i)-exp(x(i))+3)/(2-exp(x(i)))); tol=abs(x(i+1)-x(i)); i=i+1; end disp(i-1); 初值为1 x=zeros(100,1); tol=1; i=1; x(1)=1; whiletol>=10e-6; disp(x(i)) x(i+1)=x(i)-((2*x(i)-exp(x(i))+3)/(2-exp(x(i)))); tol=abs(x(i+1)-x(i)); i=i+1; end disp(i-1) a=x(i-1); b=2*a-exp(a)+3; disp(b); c.运行结果: 初值为0

计算机体系结构期末复习

计算机体系结构期末复习资料 1.并行性:是指在同一时刻或者是同一时间间隔内完成两种或两种以上性质相同或不同的工作。 2.CPI:每条指令执行时所花费的平均时钟周期。 3.体系结构:即计算机的属性,即概念性结构与功能特性。 4.Amdahl定理:加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。 5.信息存储的整数边界:信息在主存中存放的起始地址必须是该信息(字节数)的整数倍。 6.指令系统的正交性:指在指令中各个不同含义的字段,在编码时应互不相关,相互独立。 7.流水线技术:是指将一个重复的时序过程,分解成为若干子过程,而每个过程都可有效在其专用功能段上与其他子过程同时执行。 8.定向技术:在某条指令产生一个结果之前,其他指令并不直接需要该计算结果,如果能将该计算结果从其他产生的地方直接送到其他指令需要它的地方,那么就可以避免暂停的技术就叫定向技术。 9.相关:衡量两个随机变量之间相关程度的指标。 10.向量流水处理机:是指处理机具有向量数据表示并通过向量指令对向量的各元素进行处理。、

11.定向:将计算结果从其产生的地方直接送到其他指令需要它的地方,或所有需要它的功能单元,避免暂停。 12.指令集的并行:当指令之间不存在相关时,它们在流水线中是可以重叠起来并行执行。 13.记分牌技术:流出和读操作数。在没有结构冲突时,尽可能早地执行没有数据冲突的指令,实现每个时钟周期执行一条指令。如果某条指令被暂停,而后面的指令与流水线中正在执行或被暂停的指令都不相关,是这些指令可以跨越它,继续流出和执行下去。 14.Tomasulo算法:寄存器换名是通过保留站和流出逻辑来共同完成,当指令流出时,如果其操作数还没有计算出来,则该指令中相应的寄存器换名将产生这个操作数的保留站的标识。因此,指令流出到保留站后,其操作数寄存器或者换成了数据本身,或换成了保留站的标识,和寄存器无关。后面指令对该寄存器的写入操作就不会产生WAR冲突。 15.替换算法:由于主存中的块比Cache中的块多,所以当要从主存中调一个块到Cache中时,会出现该块所映象到的一组(或一个)Cache块已全部被占用的情况。这时,需要被迫腾出其中的某一块,以接纳新调入的块。

计算机系统结构考试计算题

3.12 有一指令流水线如下所示 (1) 求连续输入10条指令,该流水线的实际吞吐率和效率; (2) 该流水线的“瓶颈”在哪一段?请采取两种不同的措施消除此“瓶颈”。 对于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少? 解:(1) 2200(ns)2009200)10050(50t )1n (t T max m 1 i i pipeline =?++++=?-+?=∑= )(ns 220 1 T n T P 1pipeline -== 45.45%11 5 4400T P m t T P E m 1 i i ≈=? =?? =∑= (2)瓶颈在3、4段。 ? 变成八级流水线(细分) 850(ns)509850t 1)(n t T max m 1 i i pipeline =?+?=?-+?=∑= )(ns 85 1 T n T P 1pipeline -== 58.82%17 10 8400T P m ti T P E m 1 i ≈=? =?? =∑= ? 重复设置部件 出 50ns 50ns 100ns 200ns

)(ns 85 1 T n T P 1pipeline -== 58.82%17 10885010400E ≈=??= 3.13 4段组成,3段时,一次,然4段。如果 需要的时间都是,问: (1) 当在流水线的输入端连续地每时间输入任务时,该流水线会发生 什么情况? (2) 此流水线的最大吞吐率为多少?如果每输入一个任务,连续处理 10个任务时的实际吞吐率和效率是多少? (3) 当每段时间不变时,如何提高该流水线的吞吐率?仍连续处理10个 任务时,其吞吐率提高多少? (2) t ?t ?2

北京科技大学有限元试题及答案

一 判断题(20分) (×)1. 节点的位置依赖于形态,而并不依赖于载荷的位置 (√)2. 对于高压电线的铁塔那样的框架结构的模型化处理使用梁单元 (×)3. 不能把梁单元、壳单元和实体单元混合在一起作成模型 (√)4. 四边形的平面单元尽可能作成接近正方形形状的单元 (×)5. 平面应变单元也好,平面应力单元也好,如果以单位厚来作模型化 处理的话会得到一样的答案 (×)6. 用有限元法不可以对运动的物体的结构进行静力分析 (√)7. 一般应力变化大的地方单元尺寸要划的小才好 (×)8. 所谓全约束只要将位移自由度约束住,而不必约束转动自由度 (√)9. 同一载荷作用下的结构,所给材料的弹性模量越大则变形值越小 (√)10一维变带宽存储通常比二维等带宽存储更节省存储量。 二、填空(20分) 1.平面应力问题与薄板弯曲问题的弹性体几何形状都是 薄板 ,但前者受力特点是: 平行于板面且沿厚度均布载荷作用 ,变形发生在板面内; 后者受力特点是: 垂直于板面 的力的作用,板将变成有弯有扭的曲面。 2.平面应力问题与平面应变问题都具有三个独立的应力分量: σx ,σy ,τxy ,三个独立的应变分量:εx ,εy ,γxy ,但对应的弹性体几何形状前者为 薄板 ,后者为 长柱体 。3.位移模式需反映 刚体位移 ,反映 常变形 ,满足 单元边界上位移连续 。 4.单元刚度矩阵的特点有:对称性 , 奇异性 ,还可按节点分块。 5.轴对称问题单元形状为:三角形或四边形截面的空间环形单元 ,由于轴对称的特性,任意一点变形只发生在子午面上,因此可以作为 二 维问题处理。 6.等参数单元指的是:描述位移和描述坐标采用相同的形函数形式。等参数单元优点是:可以采用高阶次位移模式,能够模拟复杂几何边界,方便单元刚度矩阵和等效节点载荷的积分运算。 7.有限单元法首先求出的解是 节点位移 ,单元应力可由它求得,其计算公式为 {}{} [][]e D B σδ=。(用符号表示即可) 8.一个空间块体单元的节点有 3 个节点位移: u ,v ,w 9.变形体基本变量有位移应变应力 基本方程 平衡方程 物理方程 几何方程 10.实现有限元分析标准化和规范化的载体就是单元

系统结构期末考试试题及答案

得分 评分人 填空题: (20分,每题2 分) 单选题:(10分,每题1分) A.任何虚页都可装入主存中任何实页的位置 B. 一个虚页只装进固定的主存实页位置 《计算机系统结构》期末考试试卷(A ) 得分 注:1、共100分,考试时间120分钟。 2、此试卷适用于计算机科学与技术本科专业。 1、."启动I/O"指令是主要的输入输出指令,是属于( A. 目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、 输入输出系统硬件的功能对 (B )是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、 全相联地址映象是指(A ) C. 组之间固定,组内任何虚页可装入任何实页位置 D.组间可任意装入,组内是固定装入 4、( C ) 属于MIMD 系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D. 阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关,则( B ) A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、 计算机使用的语言是(B ) A.专属软件范畴,与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D. 属于符号化的机器指令 7、 指令执行结果出现异常引起的中断是( C ) A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 &块冲突概率最高的 Cache 地址映象方式是(A ) A.直接 B .组相联 C .段相联 D .全相联 9、 组相联映象、LRU 替换的Cache 存储器,不影响 Cache 命中率的是(B ) A.增大块的大小 B .增大主存容量 C .增大组的大小 D .增加Cache 中的块数 10、 流水处理机对全局性相关的处理不 包括(C ) A.猜测法 B.提前形成条件码 C.加快短循环程序的执行 D.设置相关专用通路

2020年北京科技大学材料专业考研经验

北京科技大学材料专业考研经验 转眼间,已经尘埃落定。回首这一年,有努力,也有回报,有汗水,也有欢笑。这一年,个人的付出固然重要,但诚然,我也从论坛收益良多,现在我小小的总结一下自己的观点,希望能对学弟学哥妹们有所帮助。 先来说说自己的情况:我报考的是北京科技大学材料学院,所考的分数分别为政治58,英语57,数学二115,专业课(材料科学基础)108,总分338。这样一个分数,对于一个工科生而言,算是中规中矩,但是对于今年的北科材料,可算是一个不折不扣的擦线党(初试线337)。即便如此,我想我还是很有必要介绍一下自己的经验。 如今,考研是一个热门的话题。同时,也是大学本科生的一个未来规划中的热门选项。很多人很轻率的就决定考研,对此我是不发表任何评论的。但是,我觉得,一旦决定考研,就要对全局有一个清醒的认识,而不是在模模糊糊的状态下就开始看书,鄙人鱼见,这样只是浪费了自己的时间和经历。 看书前要做好万全准备。大家可能会问要做好哪些准备。且听我慢慢道来。

做好了以上的各种准备,接下来就需要开始各科的复习了。不需要过多的解释,数学和英语都是要从大三下开始的,而政治和专业课是从九月份开始。细节我慢慢道来。 因为本人是工科生,所以只介绍工科生相关经验。我们考的是数学二,也就是只有高数和线性代数。而关于考研复xí,论坛里很多人都会分为三轮,说实话,我自己到目前为止也没好好划分过,所以只按自己的经验一点点介绍。 先插播一下我的学习理念。我觉得作为一个工科生,在学习这一块,理应有些自己的方法。我觉得不管是学什么,首先我们得对这一科有一个全局的把握,其次,我们还要有能力从众多信息中抽象出重点,然后循着重点对症下药。简单来讲,我觉得就是个盖房子的过程,先打地基,再出骨架,最后各种装饰。 频道调回到数学,关于数学的学习,我觉得首先得从书本下手,高数用同济5或者6版的两本书,线代无所谓,大同小异。依据往年的大纲,先把书本过个一遍,对各种概念,各种公式有个初步印象,我觉得这一步很重要:对于基础好的同学,可以作为回顾,对于基础差的同学,可以作为启蒙用。然而这样还不够,书本还要用第二遍,这一遍,最好边看边把你自己认为是重点的句子,定义,概念等抄下来(后期还有大作用),基础好的同学可以随意练练课后习题,基础

计算机系统结构计算题

计算题 用一条4段浮点加法器流水线求8个浮点数的和:Z =A +B +C +D +E +F +G +H 解: Z =[(A +B)+(C +D)]+[(E +F)+(G +H)] 例 设在下图所示的静态流水线上计算: 流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中,试计算其吞吐率、加 周期 1 2 3 规格化 尾数加 对阶 求阶差 时间A C E G A+B E+F A+B+C+D 7个浮点加法共用了15个时钟周期。 流水线的吞吐率为:TP n T t t k ==?=?7150471?? 流水线的加速比为:S T T t t k ==???=?04715187?? 流水线的效率为:E T k T t t k =?=????=?047415047?? 乘法 加减法 时间 段 输 入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A ×B C ×D 1 2 3 4

(3)计算性能 在18个△t 时间中,给出了7个结果。吞吐率为: 不用流水线,由于一次求和需6△t ,一次求积需 则产生上述7个结果共需(4×6+3×4)△t = 36△t 加速比为 流水线的效率 例 有一条动态多功能流水线由5段组成,加法用1、3、4、5 段,乘法用1、2、5段,第2段的时间为2△t ,其余各段时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中。若在该流水线上计算: 试计算其吞吐率、加速比和效率。 (1) 选择适合于流水线工作的算法 应先计算A 1×B 1、A 2×B 2、A 3×B 3和A 4×B 4; 再计算(A 1×B 1)+(A 2×B 2) (A 3×B 3)+(A 4×B 4); 然后求总的累加结果。 (2) 画出时空图 (3) 计算性能 非线性流水线 例5.3:一条4功能段的非线性流水线,每个功能段的延迟时间都相等,它的预约表如下: (1)写出流水线的禁止向量和初始冲突向量。 乘法 加法 t TP ?=18756.11828≈??=t t S 31.018 54344≈??+?=E

北京科技大学计算方法试题

《计算方法》2008试题与答案 一、填空题(每空2分,共20分) (1) 为了提高数值计算精度, 当正数x 充分大时, 应将)1ln(2--x x 改写为 _ln(x -______. (2) 3*x 的相对误差约是*x 的相对误差的_1/3____ 倍 (3).设?? ?? ? ?????---=283012251A ,则∞A =__13______.1A =___14_____ (4) 已知()p x 为二次多项式,满足(2)(2)3P f -=-=, (1)(1)1P f -=-=和 '(1)'(1)1P f -=-=,则()(2)(2)(2)(1)p x f a x b x x =-+++++,这里 a = -2 , b = 3 。 (5) 设32()4321f x x x x =+++,则差商[]3 ,2 ,1 ,0f =__4__[]0, 1, 2, 3, 4f =_0_. (6)n 个求积节点的求积公式的代数精确度最高为_21n -_____次. (7) 求解初值问题1)0(),(50'=+-=y x y y 时,若用改进欧拉方法的绝对稳定域中步长h 不 超过.0.04 二、(10分)用Newton 法求方程2ln =-x x 在区间) ,2(∞内的根, 取03x =, 要求 8110k k k x x x -+-<,计算过程中数值保留8位有效数字。 解 此方程在区间(2, )∞内只有一个根s ,而且在区间(2,4)内。设 ()ln 2f x x x =-- 则 ' 1()1f x x =- , '' 21()f x x = Newton 法迭代公式为 1ln 2(1ln )11/1 k k k k k k k k x x x x x x x x +--+=- =--, (5分)

计算机系统结构期末考试题目

第一章: 1.计算机系统结构的定义 答:由程序设计者看到的一个计算机系统的属性,即概念性结构和功能特性。 2.透明性概念 答:在计算机技术中,一种本来是存在的事物或属性,但从某种角度看似乎不存在,称为透明性现象。 3.兼容性向后兼容 兼容性:同一个软件可以不加修改地运行于系统结构相同的各档机器,可获得相同的结果,差别只在于不同的运行时间。 向后兼容:按某个时期投入市场的某种型号机器编制的程序,不加修改就能运行于在它之后投入市场的机器。 4.Amdahl定律 答:系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。 5.CPI 答:每条指令的平均时钟周期数。 6.MIPS 答:每秒百万条指令数!MIPS=时钟频率/(CPI*10^6) 7.MFLOPS 答:每秒百万次浮点操作次数。MFLOPS=程序中的浮点操作次数/(执行时间*10^6) 8.命中率的概念 答: 9.Flynn分类法是按指令流和数据流的多倍性特征进行计算机系统结构的划分 答:①单指令流单数据流SISD ②单指令流多数据流SIMD ③多指令流单数据流MISD(实际不存在)④多指令流多数据流MIMD 10.计算机系统设计的定量原理(四个) 答:①加快经常性事件的速度②Amdahl定律③CPU性能公式④访问的局部性原理11.CPI和加速比的计算 答:CPI=CPU时钟周期数/IC CPU时间=CPU时钟周期数/频率 CPU时间=CPU时钟周期*时钟周期长 加速比=(采用改进措施后的性能)/(没有采用改进措施前的性能) =(没有采用改进措施前执行某任务的时间)/(采用改进措施后执行某任务的时间) 12.软硬件实现的特点 硬件实现:速度快、成本高;灵活性差、占用内存少 软件实现:速度低、复制费用低;灵活性好、占用内存多 13.系统评价的标准 ①运算速度②存储器系统③其他性能④成本标准

北京科技大学材料科学基础真题大全

1999年招收攻读硕士学位研究生入学考试试题 考试科目: 金属学 适用专业: 科学技术史冶金物理化学钢铁冶金有色金属材料加工工程 说明:统考生做1~10题,单考生做1~7题和11~13题。 1、名词解释10分) (1)点阵畸变(2)组成过冷 (3)再结晶温度 (4)滑移和孪生(5)惯习现象 2、说明面心立方、体心立方、密排六方(c/a≥1.633)三种晶体结构形成的最密排面,最密排方向和致密度。(10分) 3、在形变过程中,位错增殖的机理是什么?(10分) 4、简述低碳钢热加工后形成带状组织的原因,以及相变时增大冷却度速度可避免带状组织产生的原因。(10分) 5、简要描述含碳量0.25%的钢从液态缓慢冷却至室温的相变过程(包括相变转换和成分转换)。(10分) 6、选答题(二选一,10分) (1)铸锭中区域偏析有哪几种?试分析其原因,并提出消除区域偏析的措施。 (2)固溶体结晶的一般特点是什么?简要描述固溶体非平衡态结晶时产生显微偏析的原因,说明消除显微偏析的方法。 7、简述金属或合金冷塑性变形后,其结构、组织和性能的变化。(10分) 8、简述经冷变形的金属或合金在退火时其显微组织,储存能和性能的变化规律。(10分) 9、选答题(二选一,10分) (1)为了提高Al-4.5%Cu合金的综合力学性能,采用了如下热处理工艺制度,在熔盐浴中505℃保温30分钟后,在水中淬火,然后在190℃下保温24小时,试分析其原因以及整个过程中显微组织的变化过程。 (2)什么叫固溶体的脱溶?说明连续脱溶和不连续脱溶在脱溶过程中母相成分变化的特点。 10、简述固溶强化,形变强化,细晶强化和弥散强化的强化机理。(10分) 11、简述影响再结晶晶粒大小的因素有哪些?并说明其影响的基本规律。(10分) 12、画出铁碳相图,并写出其中包晶反应,共晶反应和共析反应的反应式。(10分) 13、选做题(二选一,10分) (1)如果其他条件相同,试比较下列铸造条件下,铸件中晶粒大小,并分析原因。 a.水冷模浇铸和砂模浇铸 b.低过热度浇铸和高过热浇铸 c.电磁搅拌和无电磁搅拌 d.加入,不加入Al-Ti-B铅合金。 (2)什么叫形变织构?什么叫再结晶织构?简要说明形变织构,再结晶织构的形成机理。 2000年招收攻读硕士学位研究生入学考试试题 考试科目: 金属学 适用专业: 材料加工工程科学技术史 说明:统考生答1-10题,单考生答1-7题和11-13题。 1.名词解释(10分) 1相界面2相律3过渡相④菲克第一定律⑤退火织构 2.什么是固溶体?在单相合金中,影响合金元素的固溶度的因素有哪些?固溶体与组成固溶体

计算机体系结构复习计算题

1. 将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少 根据Amdahl 定律可知: 系统加速比 = = = 由题可知: 可改进比例 = 40% = 部件加速比 = 10 系统加速比 = 采用此增强功能方法后,能使整个系统的性能提高倍。 2. 假设一台计算机的I/O 处理占10%,当其CPU 性能改进到原来的10倍时,而I/O 性能仅改进为原来的两倍时,系统总体性能会有什么改进 加速比=1/(10%/2+90%/10)= 本题反映了Amdahl 定律,要改进一个系统的性能要对各方面性能都进行改进,不然系统中最慢的地方就成为新系统的瓶颈。 3. 双输入端的加、乘双功能静态流水线有1、2、3、4四个子部件,延时分别为Δt, Δt, 2Δt, Δt ,“加”由1→2→4组成,“乘”由1 →3→4组成,输出可直接返回输入或锁存。现执行 ∑=*+4 1 ])[(i i i i c b a (1) 画出流水时空图,标出流水线输入端数据变化情况。 (2) 求运算全部完成所需的时间和流水线效率。 (3) 找出瓶颈子过程并将其细分,重新画出时空图并计算流水时间和效率。 (1) (2)由上图可知,全部运算完的时间是23Δt 。 92 37 23437=???= t t η (3) 部件 ① ② ③ ④ ⑤ ⑥ 结果 输入 a 1 a 2 a 3 a 4 a 1+b 1 a 2+b 2 a 3+b 3 a 4+b 4 ① ③ ⑤ b 1 b 2 b 3 b 4 c 1 c 2 c 3 c 4 ② ④ ⑥ Δt 4 3 2 1

2020.4《计算机体系结构》期末试卷A含答案

《计算机体系结构》期末考试A卷 (总分:100分,时间:100分钟) 姓名:周元华 专业:计算机科学与技术 学号: 18260070164016 学习中心:上海弘成 一、填空题(每空1分,共14分) 1.高速缓冲存储器的地址映象方式有三种,它们分别是:全向量方式,直接相联方式,组相连方式。 2.虚拟存储器的三种管理方式是段式管理,页式管理和 段页式管理。 3.从主存的角度来看,“Cache—主存”层次的目的是为了提高速度,而“主存—辅存”层次的目的是为了扩大容量 4.根据指令间的对同一寄存器读和写操作的先后次序关系,数据相关冲突可分为读与写(RAM)、写与读(WAR)和写与写(WAW)三种类型。 5.当代计算机体系结构的概念包括指令集结构、计算机组成和计算机实现三个方面的内容 二、名词解释(每题2分,共16分) 计算机体系结构: 计算机体系结构是指根据属性和功能不同而划分的计算机理论组成部分及计算机基本工作原理、理论的总称。其中计算机理论组成部分并不单与某一个实际硬件相挂钩,如存储部分就包括寄存器、内存、硬盘等。 兼容机: 兼容机,就是由不同公司厂家生产的具有相同系统结构的计算机。简单点说,就是非厂家原装,而改由个体装配而成的机器,其中的元件可以是同一厂家出品,但更多的是整合各家之长的 计算机。 写直达法: 写直达法一般指全写法。全写法(write-through):又称写直达法、写穿法,透写法,Cache使 用方式之一。 高速缓冲存储器: 高速缓冲存储器(Cache)其原始意义是指存取速度比一般随机存取记忆体(RAM)来得快 的一种RAM,一般而言它不像系统主记忆体那样使用DRAM技术,而使用昂贵但较快速的SRAM 技术,也有快取记忆体的名称。 高速缓冲存储器是存在于主存与CPU之间的一级存储器,由静态存储芯片(SRAM)组成, 容量比较小但速度比主存高得多,接近于CPU的速度。在计算机存储系统的层次结构中,是介 于中央处理器和主存储器之间的高速小容量存储器。它和主存储器一起构成一级的存储器。高速 缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的。 高速缓冲存储器最重要的技术指标是它的命中率。 延迟转移技术: 在转移指令之后插入一条或几条有效的指令。当程序执行时,要等这些插入的指令执行完成 之后,才执行转移指令,因此,转移指令好像被延迟执行了,这种技术称为延迟转移技术。 线性流水线: 线性流水线就是由一整套工艺串联而成的生产线。 流水线又称为装配线,一种工业上的生产方式,指每一个生产单位只专注处理某一个片段的工 作,以提高工作效率及产量;按照流水线的输送方式大体可以分为:皮带流水装配线、板链线、 倍速链、插件线、网带线、悬挂线及滚筒流水线这七类流水线。 输送线的传输方式有同步传输的/(强制式),也可以是非同步传输/(柔性式),根据配置的 选择,可以实现装配和输送的要求。输送线在企业的批量生产中不可或缺。 流水线的吞吐率: 流水线的吞吐率是单位时间内流水线处理的任务数。 并行性: 并行性是指计算机系统具有可以同时进行运算或操作的特性,在同一时间完成两种或两种以 上工作。它包括同时性与并发性两种含义。同时性指两个或两个以上事件在同一时刻发生。并发 性指两个或两个以上事件在同一时间间隔发生。 三、简答题(每题5分,共30分) 1.如有一个经解释实现的计算机,可以按功能划分成4级。每一 级为了执行一条指令需要下一级的N条指令解释。若执行第一 级的一条指令需K(ns)时间,那么执行第2、3、4级的一条指 令各需要用多少时间(ns)? 答:第1级:1条1级指令 K ns 第2级:1条2级指令N条1级指令 1*N*K ns = NK ns 第3级:1条3级指令N条2级指令 1*N*NK ns =N2K ns 第4级:1条4级指令N条3级指令 1*N*NNK ns =N3K ns 2.根据Amdahl定律,系统加速比由哪两个因素决定? 答:系统加速比依赖于两个因素: (1)可改进比例:可改进部分在原系统计算时间中所占的比例 (2)部件加速比:可改进部分改进以后的性能提高 3.简述组相联映象规则。 答:(1)主存与缓存分成相同大小的数据块。(2)主存和Cache 按同样大小划分成组。(3)主存容量 是缓存容量的整数倍,将主存空间按缓冲区的大小分成区,主存中每一区的组数与缓存的组数相同 4.引起Cache与主存内容不一致的原因是什么?为了保持Cache 的一致性,在单计算机系统中一般采取哪些措施? 答:不一致的原因:(1)由于CPU写Cache,没有立即写主存 (2)由于I/O处理机或I/O设备写主存 采取措施: (1)全写法,亦称写直达法(WT法-Write through) 方法:在对Cache进行写操作的同时,也对主存该内容进行写入 (2)写回法(WB法-Write back) 方法:在CPU执行写操作时,只写入Cache,不写入主存。 5.按照同一时间内各段之间的连接方式来分,流水线可分为哪两 类? 答:(1)静态流水线:在同一时间内,流水线的各段只能按同一种功能的连接方式工作。 (2)动态流水线:在同一时间内,当某些段正在实现某种运算时,另一些段却在实现另一种运算。 6.Flynn分类法是根据什么对计算机进行分类的?将计算机分 成哪几类? 答:Flynn分类法,根据计算机中指令和数据的并行状况把计算机分成: (1)单指令流单数据流(SISD.; (2)单指令流多数据流(SIMD.; (3)多指令流单数据流(MISD.; (4)多指令流多数据流(MIMD.。 四、问答与计算题(第1题10分,第2、3题每题15分共40分) 1.一个有快表和慢表的页式虚拟存储器,最多有64个用户,每 个用户最多要用1024个页面,每页4K字节,主存容量8M字节。 (1)写出多用户虚地址的格式,并标出各字段的长度。 (2)写出主存地址的格式,并标出各字段的长度。

2020年北京科技大学材料专业考研经验全分享

XX年北京科技大学材料专业考研经验全分享转眼间,已经尘埃落定。回首这一年,有努力,也有回报,有汗水,也有欢笑。这一年,个人的付出固然重要,但诚然,我也从论坛收益良多,现在我小小的总结一下自己的观点,希望能对学弟学哥妹们有所帮助。 先来说说自己的情况:我报考的是北京科技大学材料学院,所考的分数分别为政治58,英语57,数学二115,专业课(材料科学基础)108,总分338。这样一个分数,对于一个工科生而言,算是中规中矩,但是对于今年的北科材料,可算是一个不折不扣的擦线党(初试线337)。即便如此,我想我还是很有必要介绍一下自己的经验。 如今,考研是一个热门的话题。同时,也是大学本科生的一个未来规划中的热门选项。很多人很轻率的就决定考研,对此我是不发表任何评论的。但是,我觉得,一旦决定考研,就要对全局有一个清醒的认识,而不是在模模糊糊的状态下就开始看书,鄙人鱼见,这样只是浪费了自己的时间和经历。 看书前要做好万全准备。大家可能会问要做好哪些准备。且听我慢慢道来。

做好了以上的各种准备,接下来就需要开始各科的复习了。不需要过多的解释,数学和英语都是要从大三下开始的,而政治和专业课是从九月份开始。细节我慢慢道来。 因为本人是工科生,所以只介绍工科生相关经验。我们考的是数学二,也就是只有高数和线性代数。而关于考研复xí,论坛里很多人都会分为三轮,说实话,我自己到目前为止也没好好划分过,所以只按自己的经验一点点介绍。 先插播一下我的学习理念。我觉得作为一个工科生,在学习这一块,理应有些自己的方法。我觉得不管是学什么,首先我们得对这一科有一个全局的把握,其次,我们还要有能力从众多信息中抽象出重点,然后循着重点对症下药。简单来讲,我觉得就是个盖房子的过程,先打地基,再出骨架,最后各种装饰。 频道调回到数学,关于数学的学习,我觉得首先得从书本下手,高数用同济5或者6版的两本书,线代无所谓,大同小异。依据往年的大纲,先把书本过个一遍,对各种概念,各种公式有个初步印象,我觉得这一步很重要:对于基础好的同学,可以作为回顾,对于基础差的同学,可以作为启蒙用。然而这样还不够,书本还要用第二遍,这一遍,最好边看边把你自己认为是重点的句子,定义,概念等抄下来(后期还有大作用),基础好的同学可以随意练练课后习题,基础

计算机体系结构参考1

第一题选择题 1.SIMD是指(B) A、单指令流单数据流 B、单指令流多数据流 C、多指令流单数据流 D、多指令流多数据流 2.下列那种存储设备不需要编址?D A. 通用寄存器 B. 主存储器 C. 输入输出设备 D. 堆栈 3.按照计算机系统层次结构,算术运算、逻辑运算和移位等指令应属于(A)级机器语言。 A、传统机器语言机器 B、操作系统机器 C、汇编语言机器 D、高级语言机器 4.早期的计算机系统只有定点数据表示,因此硬件结构可以很简单。但是这样的系统有明显的缺点,下面哪一个不是它的缺点:B A.数据表示范围小 B.单个需要的计算时钟周期多 C.编程困难 D.存储单元的利用率很低 7.下面哪个页面替换算法实际上是不能够实现的?D A)随机页面替换算法 B)先进先出替换算法 C)最久没有使用算法 D)最优替换算法

9.指令优化编码方法,就编码的效率来讲,那种方法最好?C A. 固定长度编码 B. 扩展编码法 C. huffman编码法 D. 以上编码都不是 10.在早期冯·诺依曼计算机特征中,机器以(C)为中心。 A、存储器 B、输入输出设备 C、运算器 D、控制器 1.RISC 计算机的指令系统集类型是( C ) 。 A. 堆栈型 B. 累加器型 C. 寄存器—寄存器型 D. 寄存器- 存储器型 2、相联存储器的访问方式是( D )。 A.先进先出顺序访问 B.按地址访问 C.无地址访问 D.按内容访问 3、假设—条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每—段分别只有—个部件可供使用,并且执行时间分别为Δt、2Δt和3Δt,连续执行n条指令所需要花费的最短时间约为( C )。 (假设“取指令”、“分析”和“执行”可重叠,并假设n足够大) A.6 nΔt B.2 nΔt C.3 nΔt D.nΔt 6、下列计算机不属于RISC计算机的是(C )。 A.SUN:Ultra SPARC

北京科技大学2004年《计算方法》试题及答案

北京科技大学2004年《计算方法》试题及答案 一、判断题(下列各题,你认为正确的,请在括号内打“√”,错的打“×”,每题2分,共12分) 1、任何近似值的绝对误差总是大于其相对误差 (×) 2、3步Adams 隐式法比4步Adams 显式法的绝对稳定性要好。 (√) 3、在任何情况下,求解线性方程组时,Sidel 迭代法总是优于Jacobi 迭代法。 (×) 4、设],[)(b a C x f n ∈,若0)() (≡x f n ,],[b a x ∈,则0],,,[10=n x x x f ,其中 ],[b a x i ∈,n i ,,1,0 = (√) 5、给定n 个数据点,则至多构照1-n 次最小二乘多项式 (√) 6、数值求积公式的代数精确度越高,计算结果越可靠。 (×) 二、填空题(1、2、3小题每空1分,其他题每空2分,共20分) 1、设A 是一个108?的矩阵,B 是一个5010?的矩阵,C 是一个150?的矩阵,D 是 一个801?的矩阵,根据矩阵乘法结合率,ABCD F =可按如下公式计算 (1)[]D BC A F )(= (2)[])(CD B A F = 则公式(1)效率更高,其计算量为1240flops 。 2、设数据21,x x 的相对误差限分别为05.0和005.0,那么两数之商 2 1 x x 的相对误差限为 =)( 2 1 x x r ε0.055。 3、 设?? ? ???-=1123A ,则=1A 4,=∞A 5,=F A 15,=)(A ρ4,=∞)(A cond 4。 4、计算3 a 的割线法迭代公式为2 1 121 113133 1 )()(------++++=---=k k k k k k k k k k k k k k k x x x x x x x x x x x x x x x 5、求解初值问题???=-='0)0() exp(2y x y 的改进后的 Euler 公式为 )]exp()[exp(2 2 121++-+-+=n n n n x x h y y 。 6、将正定矩阵???? ??????--=201032124A 作T LL 分解,则=L ?????? ???????? -8134 22 102 1 002

计算机体系结构期末试卷及答案

课程测试试题( A 卷) ----------------------以下为教师填写-------------------- I、命题院(部):信息科学与工程学院 II、课程名称:计算机体系结构 III、测试学期:2014-2015学年度第2学期 IV、测试对象:信息学院计算机、网络专业 2012 级班 V、问卷页数(A4): 3 页 VI、答卷页数(A4): 4 页 VII、考试方式:闭卷(开卷、闭卷或课程小论文,请填写清楚) VIII、问卷内容: 一、填空题(共30分,20空,每空分) 1、现代计算机系统是由()和()组成的十分复杂的系统。 2、计算机系统应能支持软件可移植,实现可移植性的常用方法有3种,即(),(), 统一高级语言。 3、可以将当前大多数通用寄存器型指令集结构进一步细分为3种类型,即()、() 和存储器-存储器型指令集结构。 4、MIPS指令DADDIU R14,R5,#6属于()类型的指令格式;MIPS指令 SD R4,300(R5)属于()类型的指令格式。 5、描述流水线的工作,常采用时空图的方法。在时空图中,横坐标表示(),纵坐 标代表()。 6、在MIPS指令实现的简单数据通路中,在WB周期中,有两大类指令执行操作:() 和()指令。 7、存储器的层次结构中,“Cache-主存”层次是为了弥补主存()的不足,“主 存-辅存”层次是为了弥补主存()的不足。 8、Cache实现的映像规则有全相联映像、()和()三种。 9、反映存储外设可靠性能的参数有可靠性、()和()。 10、根据系统中处理器个数的多少,可把现有的MIMD计算机分为两类,每一类代表 了一种存储器的结构和互连策略。第一类机器称为()结构,第二类机器具有()。 二、判断题(每小题1分,共10分) 1、从计算机语言的角度,系统结构把计算机系统按功能划分成多级层次结构,其中, 第2级是操作系统虚拟机,第3级是汇编语言虚拟机。() 2、计算机系统中提高并行性的3种途径中,资源重复是在并行性概念中引入时间因 素,加快硬件周转而赢得时间。() 3、指令集结构中采用多种寻址方式可能会增加实现的复杂度和使用这些寻址方式的 指令的CPI。() 4、指令条数多,通常超过200条,是设计RISC的原则之一。() 5、根据流水线中各功能段之间是否有反馈回路,可把流水线分为线性流水线和非线 性流水线。() 6、在多级存储体系中,“cache——主存”层次的存储管理实现主要由软件件实现。

计算机体系结构试题汇总

计算机系统结构 姓名:学号: 一、简答题(每小题10分,共20分) 1.简述使用物理地址进行DMA存在的问题,及其解决办法。 2.从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较(列表)。 二、(60分)现有如下表达式: Y=a ×X 其中:X和Y是两个有64个元素的32位的整数的向量,a为32位的整数。假设在存储器中,X和Y的起始地址分别为1000和5000,a的起始地址为6000。 1.请写出实现该表达式的MIPS代码。 2.假设指令的平均执行时钟周期数为5,计算机的主频为500 MHz,请计算上述MIPS 代码(非流水化实现)的执行时间。 3.将上述MIPS代码在MIPS流水线上(有正常的定向路径、分支指令在译码段被解析出来)执行,请以最快执行方式调度该MIPS指令序列。注意:可以改变操作数,但不能改变操作码和指令条数。画出调度前和调度后的MIPS代码序列执行的流水线时空图,计算调度前和调度后的MIPS代码序列执行所需的时钟周期数,以及调度前后的MIPS流水线执行的加速比。 4.根据3的结果说明流水线相关对CPU性能的影响。 三、(20分)请分析I/O对于性能的影响有多大?假设: 1.I/O操作按照页面方式进行,每页大小为16 KB,Cache块大小为64 B;且对应新页的地址不在Cache中;而CPU不访问新调入页面中的任何数据。 2.Cache中95%被替换的块将再次被读取,并引起一次失效;Cache使用写回方法,平均50%的块被修改过;I/O系统缓冲能够存储一个完整的Cache块。 3.访问或失效在所有Cache块中均匀分布;在CPU和I/O之间,没有其他访问Cache 的干扰;无I/O时,每1百万个时钟周期中,有15,000次失效;失效开销是30个时钟周期。如果替换块被修改过,则再加上30个周期用于写回主存。计算机平均每1百万个周期处理一页。

北京科技大学 经费预算说明

北京市科技计划项目课题经费预算编制说明 一、项目课题建议单位在申报项目课题时必须按照北京市科委的规定编制项目课题经费预算。项目课题经费预算的编制应严格遵守目标相关、政策相符、实事求是的原则。 二、课题经费来源包括项目课题建议单位从各个渠道筹集的资金: 市科技经费:指北京市科委拨付的财政经费,包括科三费和科学事业费。 国家有关部委拨款:指除北京市科委以外的其它各级政府(如国家科技部、北京市计委、区科委等)为实施本项目课题拨付的财政经费。 项目依托单位匹配经费:指具有直接行政隶属的主管单位为实施本项目课题拨付的经费。 课题承担单位自筹经费:企业通过其它渠道筹措到的资金,如股东增资、历年的经营利润等。 银行贷款:指为实施本项目课题,项目课题建议单位从经中国人民银行批准的可以经营信贷业务的金融机构处获得的贷款经费。 其它:指未列入以上各项的其它经费来源。 三、课题经费支出即项目课题研究过程中发生的全部费用支出预算: 人员费用:指直接参加项目课题研究人员的工资性费用,包括专职人员费用及外聘人员费用。列入的人员要与项目课题任务书中参加的人员一致,其中:项目课题组人员所在单位有事业费拨款的,由所在单位按照国家规定的标准从事业费中及时足额支付给项目课题组成员,并按规定在项目课题预算的相关科目中列示,不得在国家资助的项目课题经费中重复列支。国家另有规定的,按照有关规定执行。 试验外协费:指研究、开发项目课题所发生的带料外加工或因本单位不具备条件面委托外单位进行试验、加工、测试、计算等发生的费用。发生试验外协费时,必须与协作单位签订合同书。 合作交流费:指项目课题研究过程中需与国内外机构开展合作研究所发生的费用。发生合作费时,必须与合作机构签订相关的合同书。

《计算机体系结构》期末复习题标准答案

《计算机体系结构》期末复习题答案

————————————————————————————————作者:————————————————————————————————日期:

《计算机体系结构》期末复习题答案 系别_________ 班级_________ 姓名__________ 学号__________ 一、填空题(每空1分) 1.按照弗林(Flynn)分类法,计算机系统可以分为4类:SISD计算机、(SIMD计算机)、(MISD计算机)和(MIMD计算机)。 2. 改进之后的冯?诺依曼计算机的只要特点是存储器为中心,总线结构,分散控制。 3. 当前计算机系统中的存储系统是一个层次结构,其各层分别为:(通用寄存器,高速缓存,主存,辅存,脱机大容量存储器)。 4.高速缓冲存储器的地址映象方式有三种,它们分别是:(全向量方式,直接相联方式,组相联方式)。 5.虚拟存储器的三种管理方式是(段式管理,页式管理和段页式管理)。 6.目前计算机中常用数据有(用户定义数据,系统数据和指令数据)三种类型。 7.通常可能出现的流水线的相关性有(资源相关,数据相关和控制相关)。 8.解决中断引起的流水线断流的方法有(不精确断点法和精确断点法)。 9.目前向量处理机的系统结构有两种:(存储器-存储器型和寄存器-寄存器型)。 10.通用计算机基本指令分为5类,它们分别是:(数据传送类,运算类,程序控制类,输入输出类,处理机控制和调试类)。 11.执行指令x1=x2+x3;x4=x1-x5会引起(RAW)类型的数据相关,执行指令x5=x4*x3;x4=x0+x6会引起(W AR)类型的数据相关,执行指令x6=x1+x2;x6=x4*x5会引起(WA W)类型的数据相关。 12.多计算机网络中,通常出现的4种通信模式是(单播模式,选播模式,广播模式和会议模式)。 13.传统的冯?诺依曼计算机是以控制驱动方式工作,以数据驱动方式工作的典型计算机是(数据流计算机),以需求驱动方式工作的典型计算机是(归约机),以模式匹配驱动方式工作的典型计算机是(人工智能计算机)。 二、名词解释(每题2分) 1.计算机体系结构: 计算机系统结构就是计算机的机器语言程序员或编译程序编写者所看到的外特性,是硬件子系统的概念结构及其功能特性。 2.系列机: 所谓系列机是指同一厂家生产的具有相同的系统结构,但采取了不同的组成和实现的技术方案,形成了不同型号的多种机型。 3.模拟: 模拟是指用软件的方法在一台计算机上,实现另一台计算机的指令系统,被模拟的机器是不存在的,称为虚拟机,执行模拟程序的机器称宿主机。 4.程序的局部性原理: 程序访问局部性原理说明了计算机在程序执行过程中呈现出的一种规律,即程序往往重

相关文档
最新文档