计算机体系结构最新版本

计算机体系结构最新版本
计算机体系结构最新版本

1.、Amdahl定律:某部件应用越频繁,当提高该部件性能时,整机性能也提高的越多;整机的性能加速不可能大于在原机器中除该部件外所有其它部件运行时间的百分比的倒数1/(1-F)。

F定义为采用先进高速部件的那部分程序在未采用先进高速部件的计算机上运行的时间占总时间的百分比,则F= 采用高速部件的任务在老计算机上运行的时间

整个任务在老计算机上运行的时间

同时将S定义为先进高速部件与老部件的性能,则

S= 老部件完成该功能的时间

先进高速部件完成该功能的时间

而采用了高速部件后整机性能提高比,即

Speedup = T old = 1

T new (1-F)+F/S

某种硬件增强技术,可使执行速度提高10倍,在采用增强技术的计算机上测出其使用率是50%。根据Amdahl 定律计算:

⑴采用增强技术后计算机性能加速比是多少?

⑵未采用增强技术运行的部件在不采用增强技术的机器上运行时的时间比例。

2、(1)90/10局部性规则:程序花费90%的执行时间运行指令集中10%的指令代码。这就是说在指令集中所有的指令只有10%指令是常用的,而另外90%指令的使用率合起来只有10%。

(2)时间局部性:如果某一参数被引用,那它不久将再次被引用。这里指出了程序执行时在时间上的局部性(3)空间局部性:如果某一参数被引用,那它附近的参数不久也将被引用。指出程序执行时地址空间上的局部性。

3、计算机的性能是指在计算机上完成用户的应用任务所需的时间长短。完成同样任务所需的时间越短,计算机的性能越好。(考判断)

4、衡量计算机性能的参数:响应时间是指计算机系统完成某一任务(程序)所花费的时间。

5、如果用速度来评价性能,我们称“高”为性能好;如果用响应时间来评价性能,我们称“短”为性能好。(考判断)

6、计算机整机性能分成两部分:一是CPU执行程序的时间,二是等待时间。

提高计算机性能就是提高CPU性能和减少等待时间。

7、cpu性能因子CPI:每条指令的平均时钟周期数(clock cycles per instruction),

CPI=CPU花费的时钟数/CPU执行的总指令数

CPUtime =指令数×CPI ×时钟周期==I×CPI ×τ

8、CPU性能因子:(1)时钟频率(f)(2)CPI(3)指令数(I)(考填空)

CPU性能=1/CPU time= f / ( I×CPI )

9、计算机性能常用指标:(1)MIPS(million instruction per second)MIPS的意思是每秒钟执行的百万条指令数。

MIPS= 指令数/ ( 执行时间×106 ) = 时钟频率/ ( CPI×106 ) =f / ( CPI×106 )

(2)MFLOPS(million floating-point operation per second)每秒钟执行的百万个浮点操作数

MFLOPS=浮点操作数/ 执行时间×106

10、工作负载基准程序(workload benchmark):

(1)实际程序(2)核心基准程序(3)简单基准程序(4)合成基准程序(考填空)

11、基准程序的一般设计原则:

(1)具有代表性,反映用户的实际应用。(2)不能对基准程序进行优化。

(3)复现性。能重复测试,其环境相同,结果能重复出现。(4)可移植性。系统相关性要小。

(5)紧凑性。基准程序不宜太庞大。(6)成本-效率要高。

12、测量结果的统计和比较----性能报告:SPEC(system performance evaluation cooperative)基准程序

13、指令设计时主要以下几个方面来考虑:(考填空)

⑴应用范围;⑵指令的使用概率;⑶常用指令分析;⑷特殊指令设计。

14、正向条件转移大部分是不成功的,它满足条件的概率较低。(考判断)

15、一般基本传送指令包含Load,Store和Move三类。(考填空)

16、从操作数存放的位置来说,至少有三类地址:(1)存储器地址(2)I/O地址(3)寄存器地址

如果不加特殊说明,我们称地址就是指存储器地址或I/O地址。

17、主存储器编址:计算机有两种习惯使用方法,即在字单元地址内有两种字节排列次序:

第一种为低位收尾(little endian),其字节次序是低字节在最低位的排列;DEC Intel公司

第二种为高位收尾(big endian),其字节次序是高字节在最低位的排列。IBM Motorola公司

18、操作码的信息源熵(系统包含的平均信息量)公式(H=-Σp i log2p i)式中pi为事件出现的频率,由此我们可以比较压缩前后的信息冗余量或时间冗余量。

19、“Simple is fast”和“Small is fast”,即:简单事件可以更快速处理;小规模器件的速度可以做的更快,体现了RISC思想的精髓。

20、构成计算机的成本组合:(1)器件成本(2)直接成本(3)间接成本(4)报价单价格(考填空)

21、计算机的三种机器结构:堆栈、累加器、通用寄存器

22、处理器(CPU)可分为两部分:

(1.)数据通路(ALU(arithmetic logic unit)+寄存器)为处理器工作时数据实际流过的路径。

(2)控制器(解释计算机机器指令代码,并按这些代码发出控制信号控制数据通道的工作以完成指令)是处理器中的主控部分,是将指令转换为实际硬件动作的桥梁,设计最复杂。

23、数据通路组成图

24、寄存器:专用寄存器+通用寄存器

专用寄存器:(1)PC (Program Counter) 程序计数器(2)MAR(memory address register) 存储器地址寄存器

(3)MDR(memory data register) 存储器数据寄存器(4)IAR(interrupt address register) 中断地址寄存器

(5)Temp 暂存寄存器:数据访问中起暂存作用的寄存器。

不知道存在:MAR、MDR、Temp 用户透明:PC、IAR

通用寄存器:能被用户自由地用于数据计算的寄存器

寄存器堆(register file)由多个通用寄存器合起来的。存储器层次结构中的最高层,属于最小也是最快的暂存部件。

25、指令的执行分为以下五个步骤:

(1)取指令IF(2.)指令译码/寄存器读出ID(3)执行/有效地址计算EX

(4)存储器访问/完成转移:a. 访存指令b. 转移指令MEM(5)写回WB

26、微指令编制方式:(1)垂直微代码:加一些硬件电路来解释这些信号,而不是直接使用它们

(2)水平微代码:完全不编码的微指令

27、中断在不同的计算机系统中有不同的叫法,Intel和IBM仍将所有的都称为中断,而Motorola将它们称为例外,DEC则根据不同的情况,将它们称作异常、出错、自陷、放弃或中断。

28、流水线的作用:提高硬件功能部件的使用率,减少指令的平均执行时间。

流水线(pipeline)是指在程序执行时多条指令重叠进行操作的一种准并行处理实现技术(流水线的并行处理是指完成一条指令的各个部件在时间上可以重叠工作)。

29、

30、流水线竞争有三种:⑴结构竞争(资源竞争):由资源缺乏引起。⑵数据竞争(data hazard):由指令间数据相关而引起。⑶控制竞争(control hazard):由程序指针PC值的改变而引起。(考填空)

31、为什么计算机设计者允许结构竞争存在

(1)减少成本。(2)降低单元电路的延时时间。(3)减少电路的复杂程度。

32、三种数据竞争:(1)先写后读相关RAW (read after write)(2)写写相关WAW (write after write)

(3)先读后写相关WAR (write after read)

33、指令从ID级流入EX级,一般称指令发射(instruction issue)。一条指令已建立了这一过程,称为已发射(issued)。

34、

35、浮点乘法:15个周期,执行周期7个。浮点加法:执行周期4个。浮点除法:15个周期

36、

37、集中式动态调度。记分牌有以下四级流水步骤:

⑴发射级(issue) 处理结构竞争和WAW竞争⑵读操作数(read operands) 动态解决RAW竞争⑶执行(execution) ⑷写结果(write result) 处理WAR竞争

记分牌重点掌握:

38、下面我们来分析如图4-30所示的5个功能部件的记分牌数据结构和工作过程。表4-24给出了执行下列简单的指令序列时记分牌的组成信息:

LD F6,34(R2)

LD F2,45(R3)

MULTD F0,F2,F4

SUBD F8,F6,F2

DIVD F10,F0,F6

ADDD F6,F0,F2

表4-24 记分牌的组成结构指令状态

记分牌构成分三个部分:

1. 指令状态。指出指令工作处在上述四级中的哪一级。

2. 功能部件工作状态。指出功能部件的工作情况,每个功能部件需要指出九项相关参数。

Busy—指出功能部件地忙或空闲状态。

Op—功能部件所执行的操作类型。

F i—目的寄存器。

F j,F k—源操作数所用的寄存器。

Q j,Q k—产生源寄存器数据的功能单元。

R j,R k—指示源寄存器Fj,Fk准备就绪。

3. 寄存器结果状态。如果有一条已激活指令有一个目的操作数是寄存器,则指出那个功能单元将写(操作)这个寄存器。

相应流水线记分牌的工作过程也分三步。从表4-24可以看到,每条指令不论有没有发射,只要已取入流水线,在指令状态表中就有记录。而每个功能部件在其状态表中只保持一条记录。

对于上述指令序列:

指令状态寄存器表明第一条LD指令已经完成并且将结果写入了寄存器,而第二条LD指令已经执行完成,但还没有写结果。第三、四、五条指令MULTD,SUBD和DIVD已经发射,但被暂停在读操作数这一级,等候其操作数的到来。

功能部件工作状态则表明第一个乘法单元在等整数单元取操作数F2,同样加法单元在等整数减法部件的操作数F2,除法部件在等第一个乘法部件的操作数F0。

加法指令ADDD被暂停发射,因为存在一个结构竞争,这个结构竞争是减法指令引起的,等加法功能部件的减法指令执行完,功能部件竞争就会消除。

[例4-8] 我们假定浮点功能部件在EX级流水级其等待延迟时间,加法部件是2时钟周期,乘法部件是10时钟周期,则对表4-24记分牌记录的代码序列和初值数据结构,分析当前指令MULTD和指令DIVD继续执行各自进入写结果状态时记分牌的数据结构。

解:第二条指令LD给MULTD和SUBD指令带来了RAW型数据竞争,而指令MULTD给指令DIVD、指令SUBD给指令ADDD也带来了RAW型数据竞争。在指令DIVD和ADDD之间存在着WAR数据竞争。对加法指令ADDD要用到的加法功能单元还存在结构竞争。因此,乘法指令进入写结果状态和除法指令DIVD进入写结果状态是不同的,分别如表4-25和表4-26所示。

表4-25 指令MULTD进入写结果级前的记分牌数据结构

表4-26是指令DIVD进入写结果级前记分牌的数据结构。此时加法指令已完成,同时除法指令DIVD通过读操作数级获得操作数F6。最后完成除法指令。

表4-26 指令DIVD进入写结果级前记分牌的数据结构

表4-26 指令DIVD进入写结果级前记分牌的数据结构

39、评价存储器性能的参数主要有三个方面:容量、性能、价格

高速度、大容量、低价格始终是存储体系的设计目标。

40、存储器层次结构设计中的四大基本问题:(1)映象方式(2)映象机构(3)替换策略(4)写策略

41、最基本的Cache/主存映象方式有三种:

(1)直接映象(主存中的一信息块只能对应Cache的一个特定行)

(2)全关联映象(主存中的一信息块可对应Cache中的任意一行)

(3)组关联映象(主存中的第i块可以对应Cache中的某一特定组中的任意一行)

42、

如图5-12,当Cache读命中时,Cache的工作流程可分为五大步骤,这五个步骤是在一个CPU时钟周期内完成的。(1)来自CPU的地址被分为29位块帧地址和3位块内偏移地址,块帧地址又分成20位标志和9位索引。(2)根据索引选择Cache中的一个组,读取组内各行标志以判定要访问的数据块是否在Cache中。

(3)块帧地址的标志域与步骤2中读取的两个行标志作相等比较。

(4)假设有一行标志与块帧地址的标志相匹配,则由2选1多路转换器选取相应的数据行。

(5)读出的字送往CPU。

43、按导致Cache失配的原因划分,Cache失配可分成以下三类。这种分析失配的方法也称之为3C模型。(1)被迫(compulsory)失配:第一次访问存储块时,由于该块不在Cache中,所以必须首先将此存储块从主存取入Cache中。

(2)容量(capacity)失配:如果Cache不能容纳程序执行过程中所需的所有存储块,那么当程序再次访问到曾装入Cache又已被替换出去的某存储块时,就会出现容量失配。

(3)冲突(conflict)失配:在采用组关联和直接映象方式的Cache中,主存的很多块都将映象到Cache的某一行。如果因为这个原因,当程序再次访问到曾装入Cache又被替换出去的某存储块时,就会出现冲突失配,也称为碰撞失配(collision miss)。

44、越靠近CPU的存储器容量越小、速度越快、价格越高,离CPU越远的容量越大、速度越慢、价格越低;

45、平均存储访问时间(average memory_access time,AMT)

平均存储访问时间=命中率+失配率×失配时间表示为:AMT=HT+M×MP

46、两级Cache:

(1)一级Cache,一般做在CPU芯片上(也称片内Cache)。它容量较小,速度与CPU的时钟周期相匹配。(2)二级Cache,一般做在CPU芯片上(也称为片外Cache),它容量大,速度在CPU和主存之间,以便尽可能多的访问二级Cache中完成而不必再去访问主存。

47、主存组织方式:(1)单体单字主存结构(2)单体多字主存结构(3)多体交叉主存结构

48、输入/输出(简称I/O)设备可分为三大类:数据表示设备、网络通讯设备、存储设备。

49、网络通讯设备的种类,按连接处理器的距离分,MPP网、局域网、广域网等;

50、根据网上节点数目和它们连接的紧密程度,可以把互连网络分为三种不同的类型:

(1)大规模并行处理器(massively parallel processors,MPP)网络。

MPP网=SAN(store area network)存储区域网

(2)局域网(local area network, LAN)

(3)广域网(wide area network, WAN)

51、根据机器最关键部位的指令和由指令引起数据流的并行性,把所有的计算机分为四类:

(1)单指令流,单数据流(SISD)——这就是一个单处理器。

(2)单指令流,多数据流(SIMD)——同一指令由多个处理器执行,这些处理器使用不同数据流,有各自的数据内存,但共享一个指令内存和控制处理器(负责存取和发送指令)。处理器通常是专用的,不要求通用性。(3)多指令流,单数据流(MISD)——这种类型的商用机器目前尚未出现,今后也许有可能。

(4)多指令流,多数据流(MIMD)——每个处理器存取自己的指令,操作自己的数据。通常采用普通的微处理器。

52、现有的MIMD机器基于使用的处理器数目,可以分为两类:

(1)集中共享存储器式体系结构(2)分布式存储器的机器

(此文档部分内容来源于网络,如有侵权请告知删除,文档可自行编辑修改内容,供参考,感谢您

的配合和支持)

计算机体系结构解

计算机体系结构解

————————————————————————————————作者:————————————————————————————————日期:

第一章计算机组成原理 本部分要求掌握计算机方面的基础知识,包括计算机的发展、计算的系统组成、基本组成和工作原理、计算机的数制数据表示以及运算校验、指令系统以及计算机系统的安全等基础性的知识。内容多而且复杂,尤其是有关计算机硬件方面的内容,很细而且灵活性不高,知识量相当大,掌握这部分一定要多下功夫,学会取舍、把握重点、抓住要害。 1.1 考试大纲及历年考题知识点 1.1.1 大纲要求 考试要求: 1 掌握数据表示、算术和逻辑运算; 2 掌握计算机体系结构以及各主要部件的性能和基本工作原理考试范围 1 计算机科学基础 1.1 数制及其转换二进制、十进制和十六进制等常用制数制及其相互转换 1.2 数据的表示 ?数的表示(原码、反码、补码、移码表示,整数和实数的机内表示,精度和溢出)?非数值表示(字符和汉字表示、声音表示、图像表示) ?校验方法和校验码(奇偶校验码、海明校验码、循环冗余校验码) 1.3 算术运算和逻辑运算 ?计算机中的二进制数运算方法 ?逻辑代数的基本运算和逻辑表达式的化简 2.计算机系统知识 2.1 计算机系统的组成、体系结构分类及特性 ?CPU 和存储器的组成、性能和基本工作原理 ?常用I/O 设备、通信设备的性能,以及基本工作原理 ?I/O 接口的功能、类型和特性 ?I/O 控制方式(中断系统、DMA、I/O 处理机方式) ?CISC/RISC,流水线操作,多处理机,并行处理 2.2 存储系统 ?主存-Cache 存储系统的工作原理 ?虚拟存储器基本工作原理,多级存储体系的性能价格 ?RAID 类型和特性 2.3 安全性、可靠性与系统性能评测基础知识 ?诊断与容错 ?系统可靠性分析评价 ?计算机系统性能评测方式 1.2 计算机科学基础 1.2.1 数制及其转换 1、R 进制转换成十进制的方法按权展开法:先写成多项式,然后计算十进制结果. 举例: (1101.01)2=1×2^3+1×2^2+0×2^1+1×2^0+ 0×2^-1+1×2^-2 =8+4+1+0.25=13.25 (237)8=2×8^2+3×8^1+7×8^0 =128+24+7=159 (10D)16=1×16^2+13×16^0=256+13=269

计算机体系结构期末复习

计算机体系结构期末复习资料 1.并行性:是指在同一时刻或者是同一时间间隔内完成两种或两种以上性质相同或不同的工作。 2.CPI:每条指令执行时所花费的平均时钟周期。 3.体系结构:即计算机的属性,即概念性结构与功能特性。 4.Amdahl定理:加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。 5.信息存储的整数边界:信息在主存中存放的起始地址必须是该信息(字节数)的整数倍。 6.指令系统的正交性:指在指令中各个不同含义的字段,在编码时应互不相关,相互独立。 7.流水线技术:是指将一个重复的时序过程,分解成为若干子过程,而每个过程都可有效在其专用功能段上与其他子过程同时执行。 8.定向技术:在某条指令产生一个结果之前,其他指令并不直接需要该计算结果,如果能将该计算结果从其他产生的地方直接送到其他指令需要它的地方,那么就可以避免暂停的技术就叫定向技术。 9.相关:衡量两个随机变量之间相关程度的指标。 10.向量流水处理机:是指处理机具有向量数据表示并通过向量指令对向量的各元素进行处理。、

11.定向:将计算结果从其产生的地方直接送到其他指令需要它的地方,或所有需要它的功能单元,避免暂停。 12.指令集的并行:当指令之间不存在相关时,它们在流水线中是可以重叠起来并行执行。 13.记分牌技术:流出和读操作数。在没有结构冲突时,尽可能早地执行没有数据冲突的指令,实现每个时钟周期执行一条指令。如果某条指令被暂停,而后面的指令与流水线中正在执行或被暂停的指令都不相关,是这些指令可以跨越它,继续流出和执行下去。 14.Tomasulo算法:寄存器换名是通过保留站和流出逻辑来共同完成,当指令流出时,如果其操作数还没有计算出来,则该指令中相应的寄存器换名将产生这个操作数的保留站的标识。因此,指令流出到保留站后,其操作数寄存器或者换成了数据本身,或换成了保留站的标识,和寄存器无关。后面指令对该寄存器的写入操作就不会产生WAR冲突。 15.替换算法:由于主存中的块比Cache中的块多,所以当要从主存中调一个块到Cache中时,会出现该块所映象到的一组(或一个)Cache块已全部被占用的情况。这时,需要被迫腾出其中的某一块,以接纳新调入的块。

计算机系统结构考试计算题

3.12 有一指令流水线如下所示 (1) 求连续输入10条指令,该流水线的实际吞吐率和效率; (2) 该流水线的“瓶颈”在哪一段?请采取两种不同的措施消除此“瓶颈”。 对于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少? 解:(1) 2200(ns)2009200)10050(50t )1n (t T max m 1 i i pipeline =?++++=?-+?=∑= )(ns 220 1 T n T P 1pipeline -== 45.45%11 5 4400T P m t T P E m 1 i i ≈=? =?? =∑= (2)瓶颈在3、4段。 ? 变成八级流水线(细分) 850(ns)509850t 1)(n t T max m 1 i i pipeline =?+?=?-+?=∑= )(ns 85 1 T n T P 1pipeline -== 58.82%17 10 8400T P m ti T P E m 1 i ≈=? =?? =∑= ? 重复设置部件 出 50ns 50ns 100ns 200ns

)(ns 85 1 T n T P 1pipeline -== 58.82%17 10885010400E ≈=??= 3.13 4段组成,3段时,一次,然4段。如果 需要的时间都是,问: (1) 当在流水线的输入端连续地每时间输入任务时,该流水线会发生 什么情况? (2) 此流水线的最大吞吐率为多少?如果每输入一个任务,连续处理 10个任务时的实际吞吐率和效率是多少? (3) 当每段时间不变时,如何提高该流水线的吞吐率?仍连续处理10个 任务时,其吞吐率提高多少? (2) t ?t ?2

计算机系统结构有详细答案

(仅供参考,不作为考试标准), 选择题分,每题分)2(30计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 D)高级语言程序员C)机器语言或汇编语言程序员 。意________,应当注提系在计算机统设计时,为了高系统性能度的令执行速快A)加经常性使用指大的指令特B)要别精心设计少量功能强数的占减少在数量上很小比例的指令条C)要度D)要加快少量指令的速 。的问题统中因________而导致系主重叠寄存器技术要用于解决在RISC 流水线影A)JMP指令响保护令B)CALL指的现场问存储器不便来只C)有LOAD和STORE指令带的访度速器访问D)存储 ________ 效率高计为使流水算机运行要A)各过程段时间不同B)连续处理的任务类型应该不同 D)连续处理的任务数尽可能少C)连续处理的任务类型应该相同 栈型替是的________。换算法堆不属于B)近期最少A)近期最使用法久未用法 D)页面失效频率法出进C)先先法 象联组,相映的优点。是________象联全与相映相比B)块冲突概率低C)命中率高D)主存利用率小录A)目表高 是方好关相指除中叠次一重消令最的法________。B)设相关专用令指改准A)不修通路 令指条下析分后推C) 令指条下行执后推D) 流的用采,时关据数到,中作水操遇相________。有法办解决器译编化优A)用办的排新重令指过通,测检序法据数B)向定重技术 C)延迟转移技术 D)加快和提前形成条件码 经多级网络串联来实现全排列网络,只能用________。 A)多级立方体网络B)多级PM2I网络 D)上述多级混洗交换网络任何网络C) 序传送的________。是以虫蚀寻径流水方式在各寻径器是顺B)包A)消息C)片节D)字 ________ 处理机超标量作指条令部件个B) 只有一操期A)在一个时钟周内分时发射多多钟C)在一个时周期内同时发射条指令件有只一个取指部D)

系统结构期末考试试题及答案

得分 评分人 填空题: (20分,每题2 分) 单选题:(10分,每题1分) A.任何虚页都可装入主存中任何实页的位置 B. 一个虚页只装进固定的主存实页位置 《计算机系统结构》期末考试试卷(A ) 得分 注:1、共100分,考试时间120分钟。 2、此试卷适用于计算机科学与技术本科专业。 1、."启动I/O"指令是主要的输入输出指令,是属于( A. 目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、 输入输出系统硬件的功能对 (B )是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、 全相联地址映象是指(A ) C. 组之间固定,组内任何虚页可装入任何实页位置 D.组间可任意装入,组内是固定装入 4、( C ) 属于MIMD 系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D. 阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关,则( B ) A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、 计算机使用的语言是(B ) A.专属软件范畴,与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D. 属于符号化的机器指令 7、 指令执行结果出现异常引起的中断是( C ) A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 &块冲突概率最高的 Cache 地址映象方式是(A ) A.直接 B .组相联 C .段相联 D .全相联 9、 组相联映象、LRU 替换的Cache 存储器,不影响 Cache 命中率的是(B ) A.增大块的大小 B .增大主存容量 C .增大组的大小 D .增加Cache 中的块数 10、 流水处理机对全局性相关的处理不 包括(C ) A.猜测法 B.提前形成条件码 C.加快短循环程序的执行 D.设置相关专用通路

计算机系统结构计算题

计算题 用一条4段浮点加法器流水线求8个浮点数的和:Z =A +B +C +D +E +F +G +H 解: Z =[(A +B)+(C +D)]+[(E +F)+(G +H)] 例 设在下图所示的静态流水线上计算: 流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中,试计算其吞吐率、加 周期 1 2 3 规格化 尾数加 对阶 求阶差 时间A C E G A+B E+F A+B+C+D 7个浮点加法共用了15个时钟周期。 流水线的吞吐率为:TP n T t t k ==?=?7150471?? 流水线的加速比为:S T T t t k ==???=?04715187?? 流水线的效率为:E T k T t t k =?=????=?047415047?? 乘法 加减法 时间 段 输 入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A ×B C ×D 1 2 3 4

(3)计算性能 在18个△t 时间中,给出了7个结果。吞吐率为: 不用流水线,由于一次求和需6△t ,一次求积需 则产生上述7个结果共需(4×6+3×4)△t = 36△t 加速比为 流水线的效率 例 有一条动态多功能流水线由5段组成,加法用1、3、4、5 段,乘法用1、2、5段,第2段的时间为2△t ,其余各段时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中。若在该流水线上计算: 试计算其吞吐率、加速比和效率。 (1) 选择适合于流水线工作的算法 应先计算A 1×B 1、A 2×B 2、A 3×B 3和A 4×B 4; 再计算(A 1×B 1)+(A 2×B 2) (A 3×B 3)+(A 4×B 4); 然后求总的累加结果。 (2) 画出时空图 (3) 计算性能 非线性流水线 例5.3:一条4功能段的非线性流水线,每个功能段的延迟时间都相等,它的预约表如下: (1)写出流水线的禁止向量和初始冲突向量。 乘法 加法 t TP ?=18756.11828≈??=t t S 31.018 54344≈??+?=E

计算机体系结构参考1

第一题选择题 1.SIMD是指(B) A、单指令流单数据流 B、单指令流多数据流 C、多指令流单数据流 D、多指令流多数据流 2.下列那种存储设备不需要编址?D A. 通用寄存器 B. 主存储器 C. 输入输出设备 D. 堆栈 3.按照计算机系统层次结构,算术运算、逻辑运算和移位等指令应属于(A)级机器语言。 A、传统机器语言机器 B、操作系统机器 C、汇编语言机器 D、高级语言机器 4.早期的计算机系统只有定点数据表示,因此硬件结构可以很简单。但是这样的系统有明显的缺点,下面哪一个不是它的缺点:B A.数据表示范围小 B.单个需要的计算时钟周期多 C.编程困难 D.存储单元的利用率很低 7.下面哪个页面替换算法实际上是不能够实现的?D A)随机页面替换算法 B)先进先出替换算法 C)最久没有使用算法 D)最优替换算法

9.指令优化编码方法,就编码的效率来讲,那种方法最好?C A. 固定长度编码 B. 扩展编码法 C. huffman编码法 D. 以上编码都不是 10.在早期冯·诺依曼计算机特征中,机器以(C)为中心。 A、存储器 B、输入输出设备 C、运算器 D、控制器 1.RISC 计算机的指令系统集类型是( C ) 。 A. 堆栈型 B. 累加器型 C. 寄存器—寄存器型 D. 寄存器- 存储器型 2、相联存储器的访问方式是( D )。 A.先进先出顺序访问 B.按地址访问 C.无地址访问 D.按内容访问 3、假设—条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每—段分别只有—个部件可供使用,并且执行时间分别为Δt、2Δt和3Δt,连续执行n条指令所需要花费的最短时间约为( C )。 (假设“取指令”、“分析”和“执行”可重叠,并假设n足够大) A.6 nΔt B.2 nΔt C.3 nΔt D.nΔt 6、下列计算机不属于RISC计算机的是(C )。 A.SUN:Ultra SPARC

计算机体系结构知识点

目录 第一章计算机系统结构基本概念 (2) (一) 概念 (2) (二) 定量分析技术 (3) (三) 计算机系统结构发展 (4) (四) 计算机的并行性 (5) 第二章计算机指令集结构 (7) 一. 指令集结构的分类 (7) 二. 寻址方式 (7) 三. 指令集结构的功能设计 (8) 四. 指令格式的设计 (10) 五. MIPS指令集结构 (10) 第三章流水线技术 (14) 一. 流水线的基本概念 (14) 二. 流水线的性能指标 (14) 三. 流水线的相关与冲突 (16) 四. 流水线的实现 (18) 第四章指令集并行 (18) 付志强

第一章计算机系统结构基本概念 (一)概念 什么是计算机系统结构:程序员所看到的计算机属性,即概念性结构与功能特性. 透明性:在计算机技术中,把本来存在的事物或属性,但从某种角度看又好像不存在的概念成为透明性. 常见计算机系统结构分类法 冯氏分类法(冯泽云):按最大并行度对计算机进行分类. Flynn分类法:按指令流和数据流多倍性进行分类 ①单指令流单数据流 ②单指令流多数据流 ③多指令流单数据流(不存在) ④多指令流多数据流 付志强

(二)定量分析技术 Amdahl定律:加快某部件执行速度所能获得的系统性能加速比,受限于该部件的执行时间占系统中总执行时间的百分比. 加速比=系统性能 改进后 系统性能 改进前 = 总执行时间 改进前 总执行时间 改进后 加速比依赖于以下两个因素 ①可改进比例 ②部件加速比 CPU性能公式 CPU时间 CPU时间=执行程序所需时间的时钟周期数x时钟周期时间(系统频率倒数) CPI(Cycles Per Instruction) CPI =执行程序所需时钟周期数/所执行指令条数 ∴CPU时间= IC x CPI x 时钟周期时间 可知CPU性能取决于一下三个方面 ①时钟周期时间:取决于硬件实现技术和计算机组成 付志强

计算机系统结构期末考试题目

第一章: 1.计算机系统结构的定义 答:由程序设计者看到的一个计算机系统的属性,即概念性结构和功能特性。 2.透明性概念 答:在计算机技术中,一种本来是存在的事物或属性,但从某种角度看似乎不存在,称为透明性现象。 3.兼容性向后兼容 兼容性:同一个软件可以不加修改地运行于系统结构相同的各档机器,可获得相同的结果,差别只在于不同的运行时间。 向后兼容:按某个时期投入市场的某种型号机器编制的程序,不加修改就能运行于在它之后投入市场的机器。 4.Amdahl定律 答:系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。 5.CPI 答:每条指令的平均时钟周期数。 6.MIPS 答:每秒百万条指令数!MIPS=时钟频率/(CPI*10^6) 7.MFLOPS 答:每秒百万次浮点操作次数。MFLOPS=程序中的浮点操作次数/(执行时间*10^6) 8.命中率的概念 答: 9.Flynn分类法是按指令流和数据流的多倍性特征进行计算机系统结构的划分 答:①单指令流单数据流SISD ②单指令流多数据流SIMD ③多指令流单数据流MISD(实际不存在)④多指令流多数据流MIMD 10.计算机系统设计的定量原理(四个) 答:①加快经常性事件的速度②Amdahl定律③CPU性能公式④访问的局部性原理11.CPI和加速比的计算 答:CPI=CPU时钟周期数/IC CPU时间=CPU时钟周期数/频率 CPU时间=CPU时钟周期*时钟周期长 加速比=(采用改进措施后的性能)/(没有采用改进措施前的性能) =(没有采用改进措施前执行某任务的时间)/(采用改进措施后执行某任务的时间) 12.软硬件实现的特点 硬件实现:速度快、成本高;灵活性差、占用内存少 软件实现:速度低、复制费用低;灵活性好、占用内存多 13.系统评价的标准 ①运算速度②存储器系统③其他性能④成本标准

计算机体系结构复习计算题

1. 将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少 根据Amdahl 定律可知: 系统加速比 = = = 由题可知: 可改进比例 = 40% = 部件加速比 = 10 系统加速比 = 采用此增强功能方法后,能使整个系统的性能提高倍。 2. 假设一台计算机的I/O 处理占10%,当其CPU 性能改进到原来的10倍时,而I/O 性能仅改进为原来的两倍时,系统总体性能会有什么改进 加速比=1/(10%/2+90%/10)= 本题反映了Amdahl 定律,要改进一个系统的性能要对各方面性能都进行改进,不然系统中最慢的地方就成为新系统的瓶颈。 3. 双输入端的加、乘双功能静态流水线有1、2、3、4四个子部件,延时分别为Δt, Δt, 2Δt, Δt ,“加”由1→2→4组成,“乘”由1 →3→4组成,输出可直接返回输入或锁存。现执行 ∑=*+4 1 ])[(i i i i c b a (1) 画出流水时空图,标出流水线输入端数据变化情况。 (2) 求运算全部完成所需的时间和流水线效率。 (3) 找出瓶颈子过程并将其细分,重新画出时空图并计算流水时间和效率。 (1) (2)由上图可知,全部运算完的时间是23Δt 。 92 37 23437=???= t t η (3) 部件 ① ② ③ ④ ⑤ ⑥ 结果 输入 a 1 a 2 a 3 a 4 a 1+b 1 a 2+b 2 a 3+b 3 a 4+b 4 ① ③ ⑤ b 1 b 2 b 3 b 4 c 1 c 2 c 3 c 4 ② ④ ⑥ Δt 4 3 2 1

完整版计算机体系结构课后习题原版答案_张晨曦著

第1章计算机系统结构的基本概念 (1) 第2章指令集结构的分类 (10) 第3章流水线技术 (15) 第4章指令级并行 (37) 第5章存储层次 (55) 第6章输入输出系统 (70) 第7章互连网络 (41) 第8章多处理机 (45) 第9章机群 (45) 第1章计算机系统结构的基本概念 1.1 解释下列术语 层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。 虚拟机:用软件实现的机器。 翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。 计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。 在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。 计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。 计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。 系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。 Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。 程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。包括时间局部性和空间局部性。

2020.4《计算机体系结构》期末试卷A含答案

《计算机体系结构》期末考试A卷 (总分:100分,时间:100分钟) 姓名:周元华 专业:计算机科学与技术 学号: 18260070164016 学习中心:上海弘成 一、填空题(每空1分,共14分) 1.高速缓冲存储器的地址映象方式有三种,它们分别是:全向量方式,直接相联方式,组相连方式。 2.虚拟存储器的三种管理方式是段式管理,页式管理和 段页式管理。 3.从主存的角度来看,“Cache—主存”层次的目的是为了提高速度,而“主存—辅存”层次的目的是为了扩大容量 4.根据指令间的对同一寄存器读和写操作的先后次序关系,数据相关冲突可分为读与写(RAM)、写与读(WAR)和写与写(WAW)三种类型。 5.当代计算机体系结构的概念包括指令集结构、计算机组成和计算机实现三个方面的内容 二、名词解释(每题2分,共16分) 计算机体系结构: 计算机体系结构是指根据属性和功能不同而划分的计算机理论组成部分及计算机基本工作原理、理论的总称。其中计算机理论组成部分并不单与某一个实际硬件相挂钩,如存储部分就包括寄存器、内存、硬盘等。 兼容机: 兼容机,就是由不同公司厂家生产的具有相同系统结构的计算机。简单点说,就是非厂家原装,而改由个体装配而成的机器,其中的元件可以是同一厂家出品,但更多的是整合各家之长的 计算机。 写直达法: 写直达法一般指全写法。全写法(write-through):又称写直达法、写穿法,透写法,Cache使 用方式之一。 高速缓冲存储器: 高速缓冲存储器(Cache)其原始意义是指存取速度比一般随机存取记忆体(RAM)来得快 的一种RAM,一般而言它不像系统主记忆体那样使用DRAM技术,而使用昂贵但较快速的SRAM 技术,也有快取记忆体的名称。 高速缓冲存储器是存在于主存与CPU之间的一级存储器,由静态存储芯片(SRAM)组成, 容量比较小但速度比主存高得多,接近于CPU的速度。在计算机存储系统的层次结构中,是介 于中央处理器和主存储器之间的高速小容量存储器。它和主存储器一起构成一级的存储器。高速 缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的。 高速缓冲存储器最重要的技术指标是它的命中率。 延迟转移技术: 在转移指令之后插入一条或几条有效的指令。当程序执行时,要等这些插入的指令执行完成 之后,才执行转移指令,因此,转移指令好像被延迟执行了,这种技术称为延迟转移技术。 线性流水线: 线性流水线就是由一整套工艺串联而成的生产线。 流水线又称为装配线,一种工业上的生产方式,指每一个生产单位只专注处理某一个片段的工 作,以提高工作效率及产量;按照流水线的输送方式大体可以分为:皮带流水装配线、板链线、 倍速链、插件线、网带线、悬挂线及滚筒流水线这七类流水线。 输送线的传输方式有同步传输的/(强制式),也可以是非同步传输/(柔性式),根据配置的 选择,可以实现装配和输送的要求。输送线在企业的批量生产中不可或缺。 流水线的吞吐率: 流水线的吞吐率是单位时间内流水线处理的任务数。 并行性: 并行性是指计算机系统具有可以同时进行运算或操作的特性,在同一时间完成两种或两种以 上工作。它包括同时性与并发性两种含义。同时性指两个或两个以上事件在同一时刻发生。并发 性指两个或两个以上事件在同一时间间隔发生。 三、简答题(每题5分,共30分) 1.如有一个经解释实现的计算机,可以按功能划分成4级。每一 级为了执行一条指令需要下一级的N条指令解释。若执行第一 级的一条指令需K(ns)时间,那么执行第2、3、4级的一条指 令各需要用多少时间(ns)? 答:第1级:1条1级指令 K ns 第2级:1条2级指令N条1级指令 1*N*K ns = NK ns 第3级:1条3级指令N条2级指令 1*N*NK ns =N2K ns 第4级:1条4级指令N条3级指令 1*N*NNK ns =N3K ns 2.根据Amdahl定律,系统加速比由哪两个因素决定? 答:系统加速比依赖于两个因素: (1)可改进比例:可改进部分在原系统计算时间中所占的比例 (2)部件加速比:可改进部分改进以后的性能提高 3.简述组相联映象规则。 答:(1)主存与缓存分成相同大小的数据块。(2)主存和Cache 按同样大小划分成组。(3)主存容量 是缓存容量的整数倍,将主存空间按缓冲区的大小分成区,主存中每一区的组数与缓存的组数相同 4.引起Cache与主存内容不一致的原因是什么?为了保持Cache 的一致性,在单计算机系统中一般采取哪些措施? 答:不一致的原因:(1)由于CPU写Cache,没有立即写主存 (2)由于I/O处理机或I/O设备写主存 采取措施: (1)全写法,亦称写直达法(WT法-Write through) 方法:在对Cache进行写操作的同时,也对主存该内容进行写入 (2)写回法(WB法-Write back) 方法:在CPU执行写操作时,只写入Cache,不写入主存。 5.按照同一时间内各段之间的连接方式来分,流水线可分为哪两 类? 答:(1)静态流水线:在同一时间内,流水线的各段只能按同一种功能的连接方式工作。 (2)动态流水线:在同一时间内,当某些段正在实现某种运算时,另一些段却在实现另一种运算。 6.Flynn分类法是根据什么对计算机进行分类的?将计算机分 成哪几类? 答:Flynn分类法,根据计算机中指令和数据的并行状况把计算机分成: (1)单指令流单数据流(SISD.; (2)单指令流多数据流(SIMD.; (3)多指令流单数据流(MISD.; (4)多指令流多数据流(MIMD.。 四、问答与计算题(第1题10分,第2、3题每题15分共40分) 1.一个有快表和慢表的页式虚拟存储器,最多有64个用户,每 个用户最多要用1024个页面,每页4K字节,主存容量8M字节。 (1)写出多用户虚地址的格式,并标出各字段的长度。 (2)写出主存地址的格式,并标出各字段的长度。

计算机体系结构试题汇总

计算机系统结构 姓名:学号: 一、简答题(每小题10分,共20分) 1.简述使用物理地址进行DMA存在的问题,及其解决办法。 2.从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较(列表)。 二、(60分)现有如下表达式: Y=a ×X 其中:X和Y是两个有64个元素的32位的整数的向量,a为32位的整数。假设在存储器中,X和Y的起始地址分别为1000和5000,a的起始地址为6000。 1.请写出实现该表达式的MIPS代码。 2.假设指令的平均执行时钟周期数为5,计算机的主频为500 MHz,请计算上述MIPS 代码(非流水化实现)的执行时间。 3.将上述MIPS代码在MIPS流水线上(有正常的定向路径、分支指令在译码段被解析出来)执行,请以最快执行方式调度该MIPS指令序列。注意:可以改变操作数,但不能改变操作码和指令条数。画出调度前和调度后的MIPS代码序列执行的流水线时空图,计算调度前和调度后的MIPS代码序列执行所需的时钟周期数,以及调度前后的MIPS流水线执行的加速比。 4.根据3的结果说明流水线相关对CPU性能的影响。 三、(20分)请分析I/O对于性能的影响有多大?假设: 1.I/O操作按照页面方式进行,每页大小为16 KB,Cache块大小为64 B;且对应新页的地址不在Cache中;而CPU不访问新调入页面中的任何数据。 2.Cache中95%被替换的块将再次被读取,并引起一次失效;Cache使用写回方法,平均50%的块被修改过;I/O系统缓冲能够存储一个完整的Cache块。 3.访问或失效在所有Cache块中均匀分布;在CPU和I/O之间,没有其他访问Cache 的干扰;无I/O时,每1百万个时钟周期中,有15,000次失效;失效开销是30个时钟周期。如果替换块被修改过,则再加上30个周期用于写回主存。计算机平均每1百万个周期处理一页。

计算机体系结构期末试卷及答案

课程测试试题( A 卷) ----------------------以下为教师填写-------------------- I、命题院(部):信息科学与工程学院 II、课程名称:计算机体系结构 III、测试学期:2014-2015学年度第2学期 IV、测试对象:信息学院计算机、网络专业 2012 级班 V、问卷页数(A4): 3 页 VI、答卷页数(A4): 4 页 VII、考试方式:闭卷(开卷、闭卷或课程小论文,请填写清楚) VIII、问卷内容: 一、填空题(共30分,20空,每空分) 1、现代计算机系统是由()和()组成的十分复杂的系统。 2、计算机系统应能支持软件可移植,实现可移植性的常用方法有3种,即(),(), 统一高级语言。 3、可以将当前大多数通用寄存器型指令集结构进一步细分为3种类型,即()、() 和存储器-存储器型指令集结构。 4、MIPS指令DADDIU R14,R5,#6属于()类型的指令格式;MIPS指令 SD R4,300(R5)属于()类型的指令格式。 5、描述流水线的工作,常采用时空图的方法。在时空图中,横坐标表示(),纵坐 标代表()。 6、在MIPS指令实现的简单数据通路中,在WB周期中,有两大类指令执行操作:() 和()指令。 7、存储器的层次结构中,“Cache-主存”层次是为了弥补主存()的不足,“主 存-辅存”层次是为了弥补主存()的不足。 8、Cache实现的映像规则有全相联映像、()和()三种。 9、反映存储外设可靠性能的参数有可靠性、()和()。 10、根据系统中处理器个数的多少,可把现有的MIMD计算机分为两类,每一类代表 了一种存储器的结构和互连策略。第一类机器称为()结构,第二类机器具有()。 二、判断题(每小题1分,共10分) 1、从计算机语言的角度,系统结构把计算机系统按功能划分成多级层次结构,其中, 第2级是操作系统虚拟机,第3级是汇编语言虚拟机。() 2、计算机系统中提高并行性的3种途径中,资源重复是在并行性概念中引入时间因 素,加快硬件周转而赢得时间。() 3、指令集结构中采用多种寻址方式可能会增加实现的复杂度和使用这些寻址方式的 指令的CPI。() 4、指令条数多,通常超过200条,是设计RISC的原则之一。() 5、根据流水线中各功能段之间是否有反馈回路,可把流水线分为线性流水线和非线 性流水线。() 6、在多级存储体系中,“cache——主存”层次的存储管理实现主要由软件件实现。

计算机体系结构重点总结

1、、Amdahl定律:某部件应用越频繁,当提高该部件性能时,整机性能也提高得越多;整机得性能加速不可能大于在原机器中除该部件外所有其它部件运行时间得百分比得倒数1/(1-F)。 F定义为采用先进高速部件得那部分程序在未采用先进高速部件得计算机上运行得时间占总时间得百分比,则F= 采用高速部件得任务在老计算机上运行得时间 整个任务在老计算机上运行得时间 同时将S定义为先进高速部件与老部件得性能,则 S= 老部件完成该功能得时间 先进高速部件完成该功能得时间 而采用了高速部件后整机性能提高比,即 Speedup = T old = 1 T new (1-F)+F/S 某种硬件增强技术,可使执行速度提高10倍,在采用增强技术得计算机上测出其使用率就是50%。根据Amdahl定律计算: ⑴采用增强技术后计算机性能加速比就是多少? ⑵未采用增强技术运行得部件在不采用增强技术得机器上运行时得时间比例。 2、(1)90/10局部性规则:程序花费90%得执行时间运行指令集中10%得指令代码。这就就是说在指令集中所有得指令只有10%指令就是常用得,而另外90%指令得使用率合起来只有10%。 (2)时间局部性:如果某一参数被引用,那它不久将再次被引用。这里指出了程序执行时在时间上得局部性 (3)空间局部性:如果某一参数被引用,那它附近得参数不久也将被引用。指出程序执行时地址空间上得局部性。 3、计算机得性能就是指在计算机上完成用户得应用任务所需得时间长短。完成同样任务所需得时间越短,计算机得性能越好。(考判断) 4、衡量计算机性能得参数:响应时间就是指计算机系统完成某一任务(程序)所花费得时间。 5、如果用速度来评价性能,我们称“高”为性能好;如果用响应时间来评价性能,我们称“短”为性能好。(考判断) 6、计算机整机性能分成两部分:一就是CPU执行程序得时间,二就是等待时间。 提高计算机性能就就是提高CPU性能与减少等待时间。 cpu性能因子CPI:每条指令得平均时钟周期数(clock cycles per instruction), CPI=CPU花费得时钟数/CPU执行得总指令数 CPUtime =指令数× CPI ×时钟周期==I× CPI ×τ 8、CPU性能因子:(1)时钟频率(f)(2)CPI(3)指令数(I) (考填空) CPU性能 =1/CPU time= f / ( I×CPI ) 计算机性能常用指标:(1)MIPS(million instruction per second)MIPS得意思就是每秒钟执行得百万条指令数。 MIPS= 指令数/ ( 执行时间×106 ) = 时钟频率 / ( CPI×106 ) =f / ( CPI×106 ) MFLOPS(million floating-point operation per second)每秒钟执行得百万个浮点操作数MFLOPS=浮点操作数 / 执行时间×106 10、工作负载基准程序(workload benchmark): (1)实际程序(2)核心基准程序(3)简单基准程序(4)合成基准程序 (考填空) 11、基准程序得一般设计原则: (1)具有代表性,反映用户得实际应用。 (2)不能对基准程序进行优化。 (3)复现性。能重复测试,其环境相同,结果能重复出现。(4)可移植性。系统相关性要小。 (5)紧凑性。基准程序不宜太庞大。 (6)成本-效率要高。 12、测量结果得统计与比较----性能报告:SPEC(system performance evaluation cooperative)基准程序 13、指令设计时主要以下几个方面来考虑: (考填空) ⑴应用范围;⑵指令得使用概率;⑶常用指令分析;⑷特殊指令设计。

-计算机系统结构(有详细答案)

(仅供参考,不作为考试标准), 选择题(30分,每题2分) 计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 C)机器语言或汇编语言程序员D)高级语言程序员 在计算机系统设计时,为了提高系统性能,应当注意________。 A)加快经常性使用指令的执行速度 B)要特别精心设计少量功能强大的指令 C)要减少在数量上占很小比例的指令的条数 D)要加快少量指令的速度 重叠寄存器技术主要用于解决在RISC系统中因________而导致的问题。 A)JMP指令影响流水线 B)CALL指令的现场保护 C)只有LOAD和STORE指令带来的访问存储器不便 D)存储器访问速度 为使流水计算机运行效率高________ A)各过程段时间要不同B)连续处理的任务类型应该不同 C)连续处理的任务类型应该相同D)连续处理的任务数尽可能少不属于堆栈型替换算法的是________。 A)近期最少使用法B)近期最久未用法 C)先进先出法D)页面失效频率法 与全相联映象相比,组相联映象的优点是________。 A)目录表小B)块冲突概率低C)命中率高D)主存利用率高"一次重叠"中消除"指令相关"最好的方法是________。 A)不准修改指令B)设相关专用通路 C)推后分析下条指令D)推后执行下条指令 流水操作中,遇到数据相关时,采用的解决办法有________。 A)用优化编译器检测,通过指令重新排序的办法 B)数据重定向技术 C)延迟转移技术 D)加快和提前形成条件码 经多级网络串联来实现全排列网络,只能用________。 A)多级立方体网络B)多级PM2I网络 C)多级混洗交换网络D)上述任何网络 虫蚀寻径以流水方式在各寻径器是顺序传送的是________。 授课:XXX

第一部分计算机系统组成及说明

第一部分:计算机系统组成及说明 一、计算机系统组成 一个完整的计算机系统通常是由硬件系统和软件系统两大部分组成的。(一)硬件(hardware) 硬件是指计算机的物理设备,包括主机及其外部设备。具体地说,硬件系统由运算器、控制器、存储器、输入设备和输出设备五大部件组成。 ①存储器。存储器是计算机用来存放程序和原始数据及运算的中间结果和最后结果的记忆部件。 ②运算器。运算器对二进制数码进行算术或逻辑运算。 ③控制器。控制器是计算机的“神经中枢”。它指挥计算机各部件按照指令功能的要求自动协调地进行所需的各种操作。 ④输入/输出设备(简称I/O设备)。计算机和外界进行联系业务要通过输入输出设备才能实现。输入设备用来接受用户输入的原始数据和程序,并将它们转换成计算机所能识别的形式(二进制)存放到内存中。输出设备的主要功能是把计算机处理的结果转变为人们能接受的形式,如数字、字母、符号或图形。 (二)软件(software) 软件是指系统中的程序以及开发、使用和维护程序所需要的所有文档的集合。包括计算机本身运行所需的系统软件和用户完成特定任务所需的应用软件(三)硬件和软件的关系

硬件是计算机的基础,软件对硬件起辅助支持作用,二者相辅相成,缺一不可,只有有了软件的支持,硬件才能充分发挥自己的作用。 二、计算机工作原理 (一)冯·诺依曼设计思想 计算机问世50年来,虽然现在的计算机系统从性能指标、运算速度、工作方式、应用领域和价格等方面与当时的计算机有很大的差别,但基本体系结构没有变,都属于冯·诺依曼计算机。 冯·诺依曼设计思想可以简要地概括为以下三点: ①计算机应包括运算器、存储器、控制器、输入和输出设备五大基本部件。 ②计算机内部应采用二进制来表示指令和数据。每条指令一般具有一个操作码和一个地址码。其中,操作码表示运算性质,地址码指出操作数在存储器的位置。 ③将编好的程序和原始数据送入内存储器中,然后启动计算机工作,计算机应在不需操作人员干预的情况下,自动逐条取出指令和执行任务。 冯·诺依曼设计思想最重要之处在于他明确地提出了“程序存储”的概念。他的全部设计思想,实际上是对“程序存储”要领的具体化。

《计算机体系结构》期末复习题标准答案

《计算机体系结构》期末复习题答案

————————————————————————————————作者:————————————————————————————————日期:

《计算机体系结构》期末复习题答案 系别_________ 班级_________ 姓名__________ 学号__________ 一、填空题(每空1分) 1.按照弗林(Flynn)分类法,计算机系统可以分为4类:SISD计算机、(SIMD计算机)、(MISD计算机)和(MIMD计算机)。 2. 改进之后的冯?诺依曼计算机的只要特点是存储器为中心,总线结构,分散控制。 3. 当前计算机系统中的存储系统是一个层次结构,其各层分别为:(通用寄存器,高速缓存,主存,辅存,脱机大容量存储器)。 4.高速缓冲存储器的地址映象方式有三种,它们分别是:(全向量方式,直接相联方式,组相联方式)。 5.虚拟存储器的三种管理方式是(段式管理,页式管理和段页式管理)。 6.目前计算机中常用数据有(用户定义数据,系统数据和指令数据)三种类型。 7.通常可能出现的流水线的相关性有(资源相关,数据相关和控制相关)。 8.解决中断引起的流水线断流的方法有(不精确断点法和精确断点法)。 9.目前向量处理机的系统结构有两种:(存储器-存储器型和寄存器-寄存器型)。 10.通用计算机基本指令分为5类,它们分别是:(数据传送类,运算类,程序控制类,输入输出类,处理机控制和调试类)。 11.执行指令x1=x2+x3;x4=x1-x5会引起(RAW)类型的数据相关,执行指令x5=x4*x3;x4=x0+x6会引起(W AR)类型的数据相关,执行指令x6=x1+x2;x6=x4*x5会引起(WA W)类型的数据相关。 12.多计算机网络中,通常出现的4种通信模式是(单播模式,选播模式,广播模式和会议模式)。 13.传统的冯?诺依曼计算机是以控制驱动方式工作,以数据驱动方式工作的典型计算机是(数据流计算机),以需求驱动方式工作的典型计算机是(归约机),以模式匹配驱动方式工作的典型计算机是(人工智能计算机)。 二、名词解释(每题2分) 1.计算机体系结构: 计算机系统结构就是计算机的机器语言程序员或编译程序编写者所看到的外特性,是硬件子系统的概念结构及其功能特性。 2.系列机: 所谓系列机是指同一厂家生产的具有相同的系统结构,但采取了不同的组成和实现的技术方案,形成了不同型号的多种机型。 3.模拟: 模拟是指用软件的方法在一台计算机上,实现另一台计算机的指令系统,被模拟的机器是不存在的,称为虚拟机,执行模拟程序的机器称宿主机。 4.程序的局部性原理: 程序访问局部性原理说明了计算机在程序执行过程中呈现出的一种规律,即程序往往重

相关文档
最新文档