计算机系统结构2011年串讲及汇总(第二部分)[精品文档]
计算机系统结构2011年串讲及汇总(第一部分)

第一章计算机系统结构的基本概念1. 从使用语言的角度可以将系统看成是按功能划分的多个机器级组成的层次结构。
由高到低分别为:(1)应用语言机器级(2)高级语言机器级(3)汇编语言机器级(4)操作系统机器级(5)传统机器语言机器级(6)微程序机器级。
2. 应用程序语言经应用程序包的翻译成高级语言程序。
3. 高级语言程序经编译程序的翻译成汇编语言程序。
4.汇编语言程序经汇编程序的翻译成机器语言程序。
5.在操作系统机器级,一般用机器语言程序解释作业控制语句。
6.传统机器语言机器级,是用微指令程序来解释机器指令。
7.微指令由硬件直接执行。
8. 在计算机系统结构的层次结构中,机器被定义为能存储和执行相应语言程序的算法和数据结构的集合体。
9.透明指的是客观存在的事物或属性从某个角度看不到,它带来的好处是简化某级的设计,带来的不利是无法控制10.翻译:先用转换程序将高一级机器级上的程序整个地变换成底一级机器级上行将的程序,然后在低一级机器级上实现的技术11.解释:在低级机器级上用它的一串语句或指令来仿真高级机器级上的一条语句或指令的功能,通过高级机器语言程序中的每条语句或指令逐条解释来实现的技术。
12硬件取舍原则:(1)应考虑在现有硬器件(主要是逻辑器件和存储器件)条件下,系统要有高的性能价格比。
(2)要考虑到准备采用和可能采用的组成技术,使它尽可能不要过多或不合理地限制各种组成、实现技术的采用。
(3)不能仅从“硬”的角度考虑如何便于应用组成技术的成果和便于发挥器件技术的进展,还应从“软”的角度把如何为编译和操作系统的实现以及为高级语言程序的设计提供更多更好的硬件支持放在首位。
13. 计算机系统的设计思路:(1)由上往下(2)由下往上(3)由中间开始14. 软件的可移植性:指的是软件不修改或只经少量修改就可由一台机器搬到另一台机器上运行,同一软件可应用于不同的环境。
15. 实现欠件移植的几个基本技术:(1)统一高级语言(2)采用系列机(3)模拟与仿真16. 为什么没有对各种应用真正通用的语言?(1)不同的用途要求语言的语法、语义结构不同。
计算机系统结构课件第2章

2.1
数据表示:
数据表示
研究计算机硬件能够直接辨认与处理的数据类型 所谓“硬件能够直接辨认与处理”,指的是对该数据类型的各 种运算操作都有相应的实现硬件电路。 通常数据表示涉及的数据类型有整数、实数、逻辑数、浮点数、 字符串等。
数据结构:
研究应用领域中的各种复杂数据类型。 如:队列、链表、图、树、文件等, 研究它们的存储、处理、运算方法,并给出相应的算法。
2.1.1.1 浮点数的组成 浮点数的组成与“科学记数法”非常相似,但各部分均为有限位 数: e m
N m r
其中:
N 浮点数 m 尾数的值,纯小数,符合规格化原则(最高位的绝对值不为0)
e r 阶码的值,整数,常用移码表示 基值,常见的有2进制、8进制、16进制、10进制等
浮点数的机内格式
计算机系统结构主要研究数据表示,主要为浮点数的表示
2.1.1
浮点数据表示
浮点数据就是高级语言课程中所说的“实型数”。 定点数据表示的缺点: 编程困难 表示数的范围小 数据存储单元的利用率低(大量的前置0,造成浪费)
浮点数表示方式要研究的核心内容:
数据长度与表数范围、表数精度和表数效率之间的关系。
2( rm 1) rmp1 2 req 1 2 rmp 2 req
化简,并忽略机器 0 :
rm 1 rm
21 50 % 信息利用率很低。 现考察尾基=2时的情况: ( 2) 2 16 1 ( 16 ) 94 % 而尾基=16时, 16
1. 加减法
(1)同号尾数相加、异号尾数相减,不必设置警戒位; 原因:结果的绝对值<2,不需要左规格化。 (2)同号尾数相减、异号尾数相加, 若阶差为0,不必设置警戒位; 若阶差为1,只需设置1位警戒位; 若阶差 >1,只需设置1位警戒位用于左规。
计算机体系结构第2版课件第2章 第2讲

寻址技术
寻址实际上是从形式地址到实际地址的转换。 形式地址由指令描述,实际地址也称为有效 地址。
有效地址指明的是存储器单元的地址或寄存 器地址。
必须加速有效地址生成。
常用的一些操作数寻址方式
寄存器寻址
指令实例:Add R4 , R3 含义:Regs[R4]←Regs[R4]+Regs[R3]
八十年代发展起来的精简指令集计算机(RISC), 其目的是尽可能地降低指令集结构的复杂性,以达 到简化实现,提高性能的目的。
CISC指令集功能设计
面向目标程序增强指令功能
提高运算型指令功能; 提高传送指令功能; 增加程序控制指令功言和编译系统支持的指令功能; 高级语言计算机指令系统。
常用的一些操作数寻址方式
自减寻址
指令实例:Add R1, -(R2) 含义:
Regs[R2]←Regs[R2]-d Regs[R1]←Regs[R1]+Mem[Regs[R2]]
缩放寻址
指令实例:Add R1 , 100(R2)[R3] 含义:
Regs[R1]←Regs[R1]+Mem[100+ Regs[R2]+Regs[R3]*d]
操作数的类型和大小
整数(定点):二进制补码表示;其大小可以是字 节(8位)、半字(16位)或单字(32位)。
浮点:可以分为单精度浮点(单字大小)和双精度 浮点(双字大小)。当前普遍采用的是IEEE 754 浮点操作数表示标准。
字符和字符串:8位ASCII码表示。
操作数的类型和大小
十进制:通常采用 “压缩十进制”或“二进制编 码十进制”表示。压缩十进制数据表示用4位编码 数字0~9,然后将两个十进制数字压缩在一个字 节中存储。如果将十进制数字直接用字符串来表示, 就叫做“非压缩十进制”表示法。
第2章计算机系统结构PPT课件

(2)I/O中断
中央处理器按程序规定的顺序执行指令,当中央处理器执 行到一条“启动外设(启动I/O)”指令时,就按指令中给定的 参数启动指定的设备,并把设备的控制权交给输入输出控制系 统。由输入/输出控制系统控制外围设备与主存储器之间的信息 传送,外围设备独立工作,不再需要中央处理器的干预,于是 中央处理器可以继续执行其他程序。(中央处理器和外设便可 以并行工作)
2.2.1 计算机系统的硬件环境之并行工作
1、CPU与外设并行工作的I/O中断(P17) 在现代通用计算机系统中,输入/输出控制系统负责完成外围设备与
主存储器之间的信息传送。 (1)CPU与外设并行工作
各种外设连接到相应的设备控制器上,通过通道把设备控制器连接 到公共的系统总线上,这种结构允许CPU与外设并行工作。
这些寄存器都是处理器的工作寄存器,当处理器执行程序时, 每次从主存储器中读出一条指令,并把它存入“指令寄存器”中, 然后分析指令,根据指令中指定的地址,从主存储器读出操作数, 存入“通用寄存器”,根据指令中的操作码,对操作数进行运算, 并将所得的结果或暂存在通用寄存器中或存储到主存储器中,利用 控制寄存器来保证各程序交替占用处理器时能正确执行,保证系统 安全。
但由于外围设备是由中央处理器根据程序的要求而启动的, 故当外围设备工作结束后,应反馈该设备的工作情况,形成一 个“输入/输出操作结束的事件”,由中断完成,硬件识别该事 件后就急触发一个I/O中断,并暂停当前占用中央处理器的程序 的执行,让操作系统的处理程序来处理这个“输入/输出操作结 束”事件,操作系统进行分析后就可以知道该外围设备的工作 情况,从而确定启动该外围设备的程序的工作状态。
▪ 如果没有找到,就从主存中读取,同时把这个数据复制到高速 缓存中
计算机系统结构课件第2章

2.Huffman编码法 Huffman编码法是1952年由Huffman提出的一种可变字长编码 (VLC)。采用Huffman编码法表示操作码,必须先知道各种指令在 程序中出现的概率,这可通过对典型程序统计得到。根据 Huffman编码法的原理,操作码的最短长度可通过下式计算:
H pi log 2 pi
(3)主存寻址 主存寻址是所有计算机中都普遍采用的一类寻址方式,其寻 址种类也最为复杂。主存寻址的指令格式主要有: OPC M OPC M, M OPC M, M, M (4)堆栈寻址 堆栈寻址方式的地址是隐含的,在指令中不必给出操作数的 地址。因此,指令的长度很短,一般的形式有: OPC OPC M
i 1
n
Pi表示第i种操作码在程序中出现的概率,一共有n种操作码。 如果采用固定长操作码,n种操作码共需要个 log 2 n 二进制 位,因此固定长度操作码的信息冗余量为:
R 1
pi log 2 pi
i 1
n
log 2 n
3.扩展编码法 Huffman编码法能使操作码的平均长度最短,信息的冗余量 最小。然而,这种编码方法所形成得操作码很不规整。这不利于 硬件的译码,也不利于软件的编译,也很难与地址码配合,形成 有规则长度的指令编码。 在许多处理机中,采用了一种新的折中的方法,称为扩展编 码法。这种方法是由固定长操作码与Huffman编码法相结合形成 的。对于上节中有7条指令的模型机例子,如果采用扩展编码法编 排操作码,可有多种方法。
3.自定义数据表示 为了减少高级语言与机器语言之间的差别,采用了自定义数 据表示,就是由数据本身来表明数据类型,这样可以使每种指令 的种类大为减少,称为通用化指令。自定义数据表示有带标志符 数据表示和数据描述符表示。 (1)带标志符数据表示就是对每一个数据都附加一个标志符, 由这个标志符来表示这个数据的类型。这种表示法的优点是:简 化指令系统;易于对编程查错;自动类型转换;简单化编译;方 便程序调试。缺点是增加存储空间又使指令执行速度变慢。 (2)数据描述符表示,主要用来描述复杂和多维结构的数据 类型,如向量、记录等。它与带标志符数据表示不同之处是: ①标志符与每个数据相连,两者合存在一个存储单元中;而 描述符则和数据分开存放; ②要访问数据集中的元素时,先访问描述符,这至少增加一 级寻址; ③描述符看成是程序一部分,而不是数据的一部分。标志符 则可看作是数据的一部分。
计算机系统结构串讲

• 领会多级互连网络的构成和控制方式。 • 领会多级立方体网络的结构,表6.1需要 掌握。难点。 • 其余多级互连网络掌握其基本概念即可 。
• 领会并行存储器的无冲突访问的基本思想。能够进行 简单的应用。难点。 • 了解各种并行处理机。 • 识记相联处理机的基本构成、各组成部分的作用。 • 不要求掌握相联检索算法。
• 了解CISC、RISC的基本特点。 • 领会RISC结构的基本技术,不要求大家 进行指令调整等技术的应用。 • 了解RISC技术的发展。 • 本章的应用主要是浮点数尾数的简单应 用、huffman编码、扩展编码和尾数下溢 处理。
第三章 总线、中断与输入输出系统
• 领会输入输出系统概述,主要是其中的 基本概念。 • 领会总线的类型,各种分类的特点及其 适应范围。 • 领会总线的控制方式,包括三种总线控 制的工作过程,优缺点等。 • 领会总线通信技术,主要是概念。不要 求掌握图形。
• 能够根据给出的表达式,设计其流水处 理过程,画出相应的流水线时-空图,计 算相应的吞吐率、效率等。 • 领会局部性相关处理的基本概念。如流 动方式、相关性处理等。具体的计算机 相关处理控制机构不要求。
• 领会全局性相关的处理方法。 • 识记流水机器的中断处理方法。 • 流水线调度的简单应用。能够在给出流 水线预约表的情况下,设计其调度方案 。重点与难点。 • 了解向量流水处理。不要求向量流水处 理机的结构。 • 了解超级向量流水处理机。
• 二、填空题(本大题共20分,共 10 小题,每小题 2 分) 1. 计算机仿真用 解释,计算机模拟用 ______ 解释. 2. 输入输出系统发展经过了3个阶段,分别是 ______ , ______ 和 ______ . 3. 在计算机系统结构的设计中,若先考虑满足用户的 要求,这是 ______ ;若根据根据现有器件先进行微程 序机器级设计和传统机器级设计,这是 ______ . 4. 计算机系统的器件主要是 ______ 和 ______ . 5. 现代计算机以 ______ 为中心.
《计算机系统结构》

《计算机系统结构》计算机系统结构计算机是一种用于处理数据的电子设备,其内部结构和组成部分称为计算机系统结构。
计算机系统结构可以分为五个层次,包括硬件层、操作系统层、编程语言层、应用层和用户层,每个层次的结构和组成部分都不同,但彼此之间却相互关联。
硬件层是计算机系统结构最基本的层次,包括计算机的主板、CPU、内存、存储器、输入输出设备等,这些硬件组成了计算机的物理部分。
其中,CPU 是计算机系统结构的核心,它能够执行各种计算、运算和控制操作,使计算机能够高效地完成各种任务。
操作系统层是计算机系统结构的第二层次,包括计算机的操作系统、驱动程序和各种系统服务,这些软件组成了计算机的逻辑层次。
操作系统是计算机系统结构的“大脑”,它负责计算机资源的管理、任务的分配和调度等,以保障计算机能够高效地运行。
编程语言层是计算机系统结构的第三层次,包括各种编程语言和编译器等,这些软件可以让程序员能够使用高级语言编写程序,而不需要了解底层的硬件和操作系统。
应用层是计算机系统结构的第四层次,包括各种应用软件,这些软件可以让用户完成各种计算、办公、娱乐和通讯等任务。
用户层是计算机系统结构的最高层,包括计算机的终端用户和计算机的外部环境,比如网络、打印机、扫描仪等,这些用户能够直接接触、使用和操作的设备和软件。
以上五个层次共同构成了计算机系统结构,每个层次都有其独立的构成和作用,但也相互依存和联系,这种结构可以让计算机能够高效地工作,完成各种复杂任务。
在计算机系统结构中,CPU的设计和实现尤为复杂和重要。
CPU需要具备高性能、低功耗、高可靠性、高安全性等多方面的要求,而这些要求之间往往具有矛盾性。
CPU的设计需要涉及到微处理器芯片的制造、集成电路的设计和开发、指令集架构的设计和实现等多个方面。
指令集架构是CPU设计中最核心和最基本的部分,它定义了所有可执行的指令的格式和功能,以及CPU的寄存器、内存地址空间等的规范。
现代计算机系统结构中,主流的指令集架构有CISC、RISC和VLIW等几种,它们都有各自的特点和优势。
计算机系统结构(第2版(课后习题答案

word文档下载后可自由复制编辑你计算机系统结构清华第2版习题解答word文档下载后可自由复制编辑1 目录1.1 第一章(P33)1.7-1.9(透明性概念),1.12-1.18(Amdahl定律),1.19、1.21、1.24(CPI/MIPS)1.2 第二章(P124)2.3、2.5、2.6(浮点数性能),2.13、2.15(指令编码)1.3 第三章(P202)3.3(存储层次性能),3.5(并行主存系统),3.15-3.15加1题(堆栈模拟),3.19中(3)(4)(6)(8)问(地址映象/替换算法--实存状况图)word文档下载后可自由复制编辑1.4 第四章(P250)4.5(中断屏蔽字表/中断过程示意图),4.8(通道流量计算/通道时间图)1.5 第五章(P343)5.9(流水线性能/时空图),5.15(2种调度算法)1.6 第六章(P391)6.6(向量流水时间计算),6.10(Amdahl定律/MFLOPS)1.7 第七章(P446)7.3、7.29(互连函数计算),7.6-7.14(互连网性质),7.4、7.5、7.26(多级网寻径算法),7.27(寻径/选播算法)word文档下载后可自由复制编辑1.8 第八章(P498)8.12(SISD/SIMD算法)1.9 第九章(P562)9.18(SISD/多功能部件/SIMD/MIMD算法)(注:每章可选1-2个主要知识点,每个知识点可只选1题。
有下划线者为推荐的主要知识点。
)word 文档 下载后可自由复制编辑2 例, 习题2.1 第一章(P33)例1.1,p10假设将某系统的某一部件的处理速度加快到10倍,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少?解:由题意可知:Fe=0.4, Se=10,根据Amdahl 定律SeFe Fe T To S n n +-==)1(1 56.164.01104.06.01≈=+=n Sword 文档 下载后可自由复制编辑例1.2,p10采用哪种实现技术来求浮点数平方根FPSQR 的操作对系统的性能影响较大。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章存储体系1.对存储器的基本要求是:大容量、高速度和低价格。
2.存储器容量为:S M = W·l·m (其中W为存储体的字长,l为存储体的字数,m为并行工作的存储体数)3.单体最大频宽:B m = W / T M m体在座体并行的最大频宽:B m = W·m / T M(T M为连续启动一个在存储体所需时间间隔)4.并行主存系统:能并行读出多个CPU字的单体多字、多体单字、多体多字的交叉访问主存系统系统为并行主存系统。
5.为什么主存实际频宽不是随着模m的提高而线情增大:(1)工程实现上由于模m越高,存储器数据总线越长,总线并联的负载越重,有时不得不增加门的级数,这些会使传输延迟增加(2)实际程序中指令不总是顺序执行的,一旦出现转移,效率就会下降,而数据的性比指令的还差,实际的效率还更低。
6.CPU与主存速度差给系统性能带来影响,解决办法有:(1)在CPU中设置通用寄存器(2)采用存储器的多体交叉并行存取(3)采用Cache存储器。
7.存储体系设计的主要依据是:程序访存的局部性,其主要包括:(1) 时间上:最近的未来要用到的信息很可能是现在正在使用的信息,这是因为程序存在循环。
(2) 空间上:最近的未来要用到信息很可能与现在正在使用的信息在程序空间上是邻近的,这是因为指令常是顺序存放、顺序执行,数据通常是以微量、阵列、树形、表格等形式簇聚地存放的。
8.命中率指CPU产生的逻辑地址能在M1中访问到(命中到)的概率。
若逻辑地址流的信息能在M1中访问到的次数为R1,当时在M2中还未调到M1的次数为R2,则命中率H=R1 /(R1+R2)。
)(影响因素:地址流、预判算法、M1的容量等)9.未命中率(失效率)是指由CPU产生的逻辑地址在M1中访问不到的概率。
对二级存储层次,失效率为1-H10.段式管理:将主存按段分配的存储管理方式称为段式管理。
将虚地址(程序号,段号,段内位移)通过段表找到段的基地址,然后再形成物理地址,访问存储器。
段表结构=(段名,段地址,装入位,段长,访问方式)11.段式管理的主要优点:(1)程序模块化的性能好,各段在功能上是相互独立的;(2)便于程序与数据的共享;(3)便于实现存储保护。
12.段式管理的主要缺点:(1)地址变换所需的时间比较长(2)主存的空间利用不充分。
13.页式管理:把主存空间和程序空间都机械等分成固定大小的页(页面大小随机器而异)14.页式存储的优点:(1)主存储器的空间利用率比较高。
(2)页表比较简单,大大简化了映像表的硬件,节省了页表的存储量(3)地址映象与地址转换速度比较快。
15.页式存储的缺点:(1)页表很长,占用很大的存储空间。
(2)程序的模块化性能不好。
16.段页式管理:把实存机械的等分成固定大小的页,把程序按模块分段,每个段分成与主存页面大小相同的页,每道程序通过一个段表和相应于每段的一组页表来进行定位。
17.装入位:标识该段的页表是否已装入主存。
地址字段:指明已装入页表在主存中的起始地址。
访问方式:指明该段的控制保护信息。
页表长:指明该段页表的行数。
18.地址的映象:将每个虚存单元按什么规则(算法)装入(定位于)实存,建立起多用户虚地址与实地址之间的对应关系。
19.页面替换算法:(1)随机算法(RAND) (2)先进先出法(FIFO)(3)近期最少使用法/近期最久未用算法(LRU法)(4)最优替换算法(OPT) 20.第五章重叠、流水和向量处理机21.指令的解释方式一般分为顺序、重叠、流水三种。
22.解释一条机器指令的微操作可归并为:(1)取指令、(2)分析、(3)执行三个部分。
(1)取指令:是按指令计数器的内容访主存,取出该指令送到指令寄存器。
(2)指令分析:是对指令的操作码进行译码,按寻址方式和地址字段形成操作数真地址,并用此真地址去取操作数。
为取下条数据,还要形成下条指令的地址。
(3)指令的执行:是对操作数进行运算、处理,或存储运算结果。
(可能要访主存)23.顺序解释:指的是各条指令之间顺序串行进行。
(即执行完一条指令后才取下一条指令)优点:控制简单,节省设备;缺点:速度慢,机器各部件的利用率很低;24.重叠解释:是在解释第K条指令的操作完成之前,就可以开始解释第K+1条指令。
25.重叠解释方式存在着访存冲突,解决访主存的冲突的几种方式:(1)主存分成两个独立编址的存储器,一个专门存放指令一个专门存放操作数;(加重了主存总线控制的复杂性及软件设计麻烦)(2)指令和数据仍然混存在一个存储器中,采用多体交叉主存结构;(不能根本解决)(3)增设采用先进先出方式工作的指令缓冲寄存器(指缓)。
26.一次重叠:把取指令操作隐含在分析、执行指令过程中,则在任何时候只允许上条指令“执行”与下条指令“分析”相重叠。
27.相关:因程序相邻指令之间出现了关联,为防止出错它们不能同时解释。
这种现象称发生了“相关”。
(1)数相关:第K+1条指令的源操作数地址正好是第K条指令结果地址。
[分为(1)主存空间的数相关(2)通用寄存器组的数相关] 顺序解释没问题,而重叠解释时,在“执行K”和“分析K+1”重叠时就出现问题。
(2)指令相关:经过第K条指令的执行来形成第K+1条指令。
(重叠解释时先从指缓中取到第K+1条指令是旧内容->出错)指令相关是因为机器指令允许修改引起的。
28.指令相关的处理:可通过限定程序运行过程中不准修改指令-不可行。
IBM370采用“执行”指令。
被修改的指令以“执行”指令的操作数形式出现,将指令相关转成数相关。
(这样只要统一进行数相关处理就可以了)29.主存空间数相关的处理:相邻两条指令之间出现对同一主存单元要求先写后读的关联。
(设置优先级:写优先级> 读优先级)30.通用寄存器组相关(a.通用寄存器组数相关b.通用寄存器组基址和变址值相关)的处理:(1)推后分析K+1 (降低速度为代价) (2)设置相关专用通路(增加设备为代价)31.流水是重叠的进一步延伸:一次重叠:把指令的解释分成两个子过程,同时解释两条指令。
流水:把指令的解释分成多个子过程,同时解释多条指令。
32.流水的最大吞吐率:流水线满负荷,每隔Δt流出一个结果时所达到的吞吐率。
33.流水的分类:流水按扩展方向分类:(1)流水向下扩展:把子过程进一步细分。
(过程并行)(2)流水向上扩展:在多个处理机之间流水。
(任务并行)流水按处理级别分为(1)部件级的流水:构成部件内的各个子部件之间的流水。
(如运算器内的“浮点加”流水)(2)处理机级流水:构成处理机的各个部件之间的流水。
(如取指、分析、执行的流水)(3)系统级流水:构成计算机系统的多个处理机之间的流水,也称为宏流水。
按流水线的功能多少分为:(1)单功能流水线:只能实现一种功能的流水。
(如“浮点加”流水)(2)多功能流水线:同一流水线的各个段之间可以有多种不同的连接方式实现多种不同的运算或功能的流水。
(a)静态流水线:在某一时间内各段只能按一种功能联接流水,只有等流水线全部流空后,才能切换成按另一种功能来联接流水。
实现简单。
(b)动态流水线:各功能段在某一时间内可按不同运算或功能联接。
控制复杂。
从流水线中各功能段之间是否有反馈回路分为:(1)线性流水线:各个段之间串行连接,无反馈也无跳跃,每个任务流经流水线中各个段均只有一次。
(2)非线性流水线:各个段之间除了有串行连接,还有反馈回路,使一个任务流经流水线时,需多次经过某段或越过某段。
按机器所具有的数据表示分为:(1)标量流水机(2)向量流水机34.流水处理机的主要性能:(1)吞吐率(2)效率35.吞吐率:指在单位时间内流水线完成的任务数或输出的结果数。
TP = n /Tk (n表示任务数,Tk表示完成n个任务所需时间)36.最大吞吐率:TPmax = 1/max{△t1, △t2, △t3 …△tn}37.瓶颈子过程:流水线中经过时间最长的子过程。
38.消除瓶颈的方法:(1)将瓶颈子过程再细分(2)重复设置多套瓶颈段并联39.加速比Sp:流水方式相对于非流水顺序方式速度提高的比值。
40.效率:流水线设备的实际使用时间占整个运行时间之比,也称流水线设备的时间利用率。
41.影响流水线效率不高的因素包括:(1)静态多功能流水线流水时,总有一些本功能用不到的段处于空闲状态。
(2)流水建立过程中,本功能要用到的某些段也有部分处于空闲状态。
(3)功能切换时,增加了前一种功能流水的排空时间及后一种功能流水的建立时间。
(4)上一步运算的结果要送到流水线的输入端,下一任务才能开始。
42.全局性相关:机器系统出现相关时,影响面较宽,较严重,称为全局性相关。
(如转移指令废指缓)43.局部性相关:机器系统出现相关时,只影响相关的几条指令,最多影响流水线某些段工作的后推,不会改动指缓中预取到的指令,影响是局部的。
(如指令相关,主存操作数相关等)44.局部性相关的处理:流水技术是重叠技术的发展,因此,重叠机器处理相关的方法也适用于流水机器,即①推后读②设置相关直接通路。
按流水线中流动顺序的安排,分为两种形式:(1)同步流动:任务(指令)流出流水线的顺序与流入流水线的顺序一致(顺序流动)。
(2)异步流动:任务(指令)流出流水线的顺序与流入流水线的顺序不一致。
45.异步流动要处理的三种相关(都是对同一单元的要求):(1)“先写后读”相关:在先的指令先写入,在后的指令才能读的关联,称“先写后读”相关。
(2)“写—写”相关:在先的指令先写入,在后的指令才能写的相关。
(3)“先读后写”相关:在先的指令先读,在后的指令才能写的相关,称“先读后写”相关。
s46.全局相关的处理:(1)猜测法:概率相近时宜选用i+1 不成功转移分枝;概率不均等时,宜选用高概率分支(2)加快和提前形成条件码(3)采取延迟转移(4)加快短循环程序的处理47.流水机器原中断处理:主要是为了处理好中断点现场的保存和恢复。
48.向量的流水处理:将向量数据表示和流水线技术结合起来,构成向量流水处理机,使向量运算最能充分发挥出流水线效率。
49.向量的三种处理方法:(1)横向(水平)处理方法:以元素为单位,逐个求向量元素值。
例如求:D=A*(B+C),则进行bi+ci—>k,k*ai—>di操作。
横向处理适合标量处理机,发挥不出流水的优势。
(2)纵向(垂直)处理方式:以向量为单位,对整个向量求结果向量。
例如求:D=A*(B+C),则进行B+C—>K,K*A—>D操作。
(3)分组纵横处理方式:若向量的长度过长,则可分成若干组,使每组都能装入向量寄存器组,组内按纵向方式处理,组间靠软件循环处理。
50.指令级高度并行的超级处理机:(1)超标量处理机(2)超长指令字处理机(3)超流水线处理机51.超标量处理机:多条指令流水线,每个Δt同时流出m条指令(称为度m),靠编译程序优化指令执行顺序。