第5章--重叠、流水和向量处理机 ppt课件

合集下载

计算机体系结构第五章重叠、流水与向量之一 2

(2)同一时间内各段之间的连接方式来分类
l 静态流水线在同一时间内，流水线的各段只能按同一种功
能的连接方式工作，只有程序中连续出现同一种运算时，流水线的效率才能得到充分的发挥。 l 动态流水线
在同一时间内，多功能流水线中的各段可以按照不同的方式连接，同时执行多种功能。
优点：能提高流水线的效率。缺点：会使流水线的控制变得复杂
空间
S4 S3 S2 S1 1
1
2
3
…n
1
2
3
…n
1
2
3…n
2
3
…n
SDti
(n-1)Dt2
Tm
时间
计算效率第二种方法：时空区法

n个任务占用的时空区积面 m个流水段的总的时空面区积

任务数*每个任务所占的面积设备数*流水线的整个工作时间
m
n Dti
i1 m Tm
T0 m Tm
2 3 … … n-1 n
mDt
(n-1) Dt
Tm
时间
各段执行时间相等，输入连续任务情况下完成n 个连续任务需要的总时间为：
Tm=m△t+(n-1)*△t
=(m+n-1)△t
吞吐率：
TP
n
(mn1)Dt
最大吞吐率为：
Tm P a x Ln i m (m n n1)DtD 1t
最大加速比为
Sma xLimmn m n mn1
如果流水线各段时间不相等
顺序执行需要的时间： T0=任务数*每个任务顺序通过流水线各段所需要
的时间
m
n Dti
i 1

第5章_重叠、流水和向量处理机

2.分类流水线依据向下和向上扩展的思路，可分类出在计算机系统不同等级上使用的流水线。向下扩展指的是把子过程进一步细分，让每个子过程经过的时间都同等程度减少，吞吐率就会进一步提高。向上扩展可理解为在多个处理机之间流水；流水线按照处理级别可分为部件级(部件内各子部件间的流水)、处理机级(构成处理机的各部件之间的流水)和系统级( 构成计算机系统的多处理机之间的流水)；从流水线具有功能的多少来看，可以分为单功能流水线(只能实现单一功能的流水)和多功能流水线(同一流水线的各个段之间可以有多种不同的联接方式以实现多种不同的功能或功能)；按多功能流水线的各段能否允许同时用于多种不同功能联接流水，可把流水线分成静态流水线(同一时间内各段只能按一种功能联接流水)和动态流水线(同一时间内可按不同运算或功能联接)；以机器所具有的数据表示可把流水线处理机分为标量流水机(没有向量数据表示，只能以标量循环方式处理向量和数据)和向量流水机；从流水线中各功能段之间是否有反馈回路，分为线性流水和非线性流水。
5.1.1 基本思想和一次重叠
接着，看执行 k 与分析 k+1 。为了实现它们的重叠，硬件上应有独立的指令分析部件和指令执行部件。而且，由于执行时间的不同，还需在硬件上解决控制上的同步问题。此外，当第k条指令是转移指令时，还需采用延迟转移技术使重叠效率不致下降。在控制上还需解决邻近指令之间可能出现的数和指令相关的问题。
5.1.2 相关处理
1.指令相关的处理如果采用机器指令可修改的办法经第 k 条指令的执行来形成第 k+1 条指令，由于在执行 k 的末尾才形成第 k+1条指令，按照一次重叠的时间关系，为避免出错，第k 、k+1 条指令就不能同时解释，这时这两条指令之间就发生了指令相关。为解决指令相关问题，可设置一条“执行”指令解决。在这条执行指令中，被修改的指令以“执行”指令操作数形式出现，这样就将指令相关转化成了数据相关因为操作数可以存放在主存，也可以存放在通用寄存器中，这样就有了主存空间的数相关和通用寄存器组的数相关。

计算机体系结构L5_CA流水线和向量处理机

计算机体系结构
北理工计算机学院
6
一次重叠执行方式
一种最简单的流水线方式每次只重叠执行两条指令，故称为一次重叠特点：在第K条指令完成之前就开始处理第
K+1条指令（重叠执行两条指令）
取指k 分析k 执行k 取指k+1 分析k+1 执行k+1 取指k+2 分析k+2 执行k+2
如果三个过程的时间相等，都为t，则执行n 条指令的时间为：T=(1+2n)t
计算机体系结构
北理工计算机学院
17
先行指令缓冲站
先行程序计数器 PC1
主
存控
指令缓冲
制器
存储区
控制逻辑
现行程序计数器 PC
指令分析部件
指令寄存器 IR
先行指令缓冲站的组成
计算机体系结构
北理工计算机学院
18
先行指令缓冲站
指令缓冲存储区和相应的控制逻辑
按队列方式工作。只要指令缓冲站不满，它就自动地向主存控制器发取指令请求，不断
取指k
分析k 执行k 取指k+1 分析k+1 执行k+1
取指k+2 分析k+2 执行k+2
如果三过程的时间相等，执行n条指令的时间为：T=(2+n)t
采用二次重叠执行方式能够使指令的执行时间缩短近三分之二。
计算机体系结构
北理工计算机学院
9
二次重叠执行方式
部件
执行
k k+1 k+2
分析
k k+1 k+2
计算机体系结构
北理工计算机学院
32
例题解答

第5章重叠、流水和向量处理机

反馈回路一种简单的非线性流水线
• 流水线的其他分类方法（1）按照控制方式：同步流水线和异步流水线。（2）顺序流水线与乱序流水线：乱序流水线又称为无序流水线、错序流水线或异步流水线等。
5.2.2 流水线处理机的主要性能衡量流水线处理机的性能主要使吞吐率（Through Put Rate,TP）和效率（Efficiency, η）和加速比。 1.吞吐率吞吐率使流水线单位时间里能流出的任务数或结果数。
T P
m Dti ( n- 1)Dtj i 1
n Δ ti
m
n
• 其加速比为：
sp
Δ t ( n 1 ) Δ t
i j i 1
m
i 1
2.效率
流水线的效率是指流水线中设备的实际使用时间占整个运行时间之比，也称流水线设备的时间利用率。如果是线性流水线且各段经过的时间相同，则在T时间里，流水线各段的效率都相同，均为η0。即： n Δ t0 n
5.1.2 相关处理
1、基本概念 • “相关”：邻近指令之间出现关联，为了防出错让它们不能同时解释的现象； • “数相关”：邻近两条指令的数据地址有了关联 • “指令相关”：采用机器指令可修改的方法在第 K条指令执行后才产生第K+1条指令的现象。即：为了避免出错，第k、第k+1条指令就不能同时解释。
3 … … n-1 n 时间 (k-1)Dt T
3 … … n-1 n
3 … … n-1 n
kD t
nD t
(n-1) Dt
– 吞吐率：TP
n (k n 1)Dt
最大吞吐率为：
n 1 TP max Lim n ( k n 1)Dt Dt

第5章计算机流水线技术.ppt

3、流水的分级、分类
分级：（处理的级别分类） ❖ 部件级：将复杂的算逻运算组成流水工作方式； ❖ 指令级：把一条指令解释过程分成多个子过程； ❖ 处理机级：每个处理机完成某一专门任务，各个处理机所得到的结果需存放在与下一个处理机所共享的存储器中
其他分类： ➢ 功能：单功能流水线（如CRAY-1）、多功能流水线（如TI-ASC） ➢ 工作方式：静态流水线、动态流水线 ➢ 连接方式：线性、非线性 ➢ 处理数据：标量流水、向量流水
通过一种极端情况计算举例：
假设先行指令缓冲栈已经完全充满，缓冲深度是D1。此时指令缓冲栈输出端，指令流出速度最快，而输入端，流入最慢
假设指令序列的最大长度是L1，平均分析一条指令的时间是t1 而此时更坏的是取指令很慢，平均取一条指令的时间是t2 假设先行控制栈充满到被取空的过程中指令分析条数是L1
若各段时间不等时，有
实际执行时间：
n
T t分1 max t分i , t执i1 t执n
i2
✓先行控制：分析部件和执行部件能分别连续不断地分析和执行指令，预取和缓冲相结合的技术，通过对指令流和数据流的先行控制，使指令分析器和执行部件能尽量连续并行工作。执行时间：
S2
….. .….
输出 Sk
时钟
流水线的基本结构
空间
填入
正常
排空
4 1 2 3 4 5 ... ... ... n-1 n
3
1 2 3 4 5 ... ... ... n-1 n
2 1 2 3 4 5 ... ... ... n-1 n
1 1 2 3 4 5 ... ... ... n-1 n
△t0 △ t0 △ t0 △ t0

计算机体系结构(金星)第五章重叠、流水与向量之二

(3) 分组(纵横)处理方式
定义：横向处理和纵向处理相结合的方式。
用于寄存器-寄存器结构的向量处理机中，向量寄存器的长度是有限的。当向量长度n大于向量寄存器长度m时，需要分组处理。处理方式：将长度为n的向量分成若干组，每组长度为m，组内按纵向方式处理，依次处理各组。分组方法：n＝k· m＋ｒ，其中：ｒ为余数，共分Ｋ＋１组。组内采用纵向处理方式，组间采用横向处理方式。因此，也称为分组处理方式，纵横加工方式等。
b 计算所有调度方案的平均间隔拍数
设某方案为(t1,t2,t3)
调度方案平均间隔拍数 3.67 （2，2，7） 4.50 （ 2，7 ） 3.50 （3，4）
平均间隔拍数= 循环周期中的各间隔拍数之（4，3）和 / 一个周期的任务数（3, 4，7） =(t1+t2+t3)/3 （3，7）
1.
加快短循环程序的处理
– 将长度小于指缓容量的短循环程序整个一
次性放入指缓内，并暂停预取指令 – 恒猜循环分支法
(3)流水机器的中断处理

不精确断点法
当指令I有中断，未进入流水线的后续指令不再进入，已在流水线的指令仍继续流完，然后才转入中断处理程序。断点为目前流水线的的最后一条指令。
NUM: N
NUM: N
采用延迟转移技术
ADD R1，R2 2. JMP NEXT2 3. NEXT1:SUB R3，R4 …… n NEXT2: MOVE R4，A
1.
用软件方法将
转移指令与其不相关的指令交换位置。
JMP NEXT2 2. ADD R1，R2 3. NEXT1: SUB R3，R4 …… n NEXT2: MOVE R4，A

重叠流水和向量处理机PPT课件

也就是说，在“执行k”得到的、送入通用寄存器的运算结果来不及作为“分析k+2”的基址值用，更不用说作为“分析 k+1”的基址值用。因此，虽然是一次重叠，但基址值相关(B
相关)就不止会出现一次相关，还会出现二次相关。即当出现
B(k+1)=L3(k) 时，称为发生了 B 一次相关；而当出现 B(k+2)=L3(k)时，称为发生了B二次相关，如图5.10所示。
图 5.9 用相关专用通路解决通用寄存器组的数相关
第 5 章重叠、流水和向量处理机
设操作数的有效地址
( X d ) (B2 ) (B2 0000 ) d2
由分析器内的地址加法器形成。由于通常情况下，“分析” 周期等于主存周期，所以，从时间关系上要求在“分析”周期的前半段，就能由通用寄存器输出总线取得(B2)，送入地址加法器。由于运算结果是在“执行”周期的末尾才送入通用寄存器组的，它当然不能立即出现在通用寄存器输出总线上。
图 5.20 瓶颈子过程再细分
第 5 章重叠、流水和向量处理机
图 5.21 瓶颈子过程并联
第 5 章重叠、流水和向量处理机
设一m段流水线的各段经过时间均为Δt0，则第1条指令从流入到流出需要T0=mΔt0的流水建立时间，之后每隔Δt0 就可以流出一条指令，其时—空图如图5.22所示(这里设m=4)。这样，完成n个任务的解释共需时间T=m·Δt0+(n-1)Δt0。在
3.
操作码 L1
L3
B2
或
操作码 L1
L3
d2 L2
第 5 章重叠、流水和向量处理机图 5.7 指令解释过程中与通用寄存器内容有关的微操作时间关系

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

k：存通用寄存器， k+1； (通用寄存器)→k+1
k+1: ……
由于在“执行k”的末尾才形成第k+1条指令，按照一次重叠的时间关系，“分析k+1”所分析的是早已取进指缓的第 k+1条指令的旧内容，这就会出错。第k、k+1条指令就不能同时解释，我们称此时这两条指令之间发生了“指令相关”。特别是当指令缓冲器可缓冲存放n条指令情况下，执行到第k条指令时，与已预取进指缓的第k+1到第k+n条指令都有可能发生指令相关。指缓容量越大，或者说指令
第 5 章重叠、流水和向量处理机
第 5 章重叠、流水和向量处理机
5.1 重叠解释方式 5.2 流水方式 5.3 向量的流水处理与向量流水处理机 5.4 指令级高度并行的超级处理机
1
ppt课件
第 5 章重叠、流水和向量处理机
计算机组成设计的基本任务：加快机器语言的解释
– 提高每条指令的执行速度
M
M
M
M
0
1
…2 … …3 …
9
ppt课件
第 5 章重叠、流水和向量处理机
– 在处理机内部设置一定容量的指令缓冲寄存器，把指令分析器所需要的指令事先取到指令缓冲寄存器中，而不必访问主存储器。这样，就能够使取指令、分析指令和执行指令重叠起来执行。如果指令分析器每次取指令都能够在先行指令缓冲寄存器中得到，则取指令只需要很短的时间就能够完成，因此，可以把取指令与分析指令合并到一起，从而构成如图所示的一次重叠执行方式。
7
ppt课件
第 5 章重叠、流水和向量处理机
解决办法
– 把主存储器分成两个独立编址的存储器，一个专门存放指令，称为指令存储器，另一个专门存放操作数，称为数据存储器。两个存储器可以同时独立访问；这样，就解决了取指令和读操作数的冲突。如果再规定，在执行指令阶段产生的运算结果只写到通用寄存器中，不写到主存，那么，取指令、分析指令和执行指令就可以同时进行。
10
ppt课件
第 5 章重叠、流水和向量处理机
实际上要达到这个速度还有许多困难，主要有如下三个问题需要解决：
1、现代计算机的指令系统是很复杂的，各种类型的指令，其“分析”和“执行”所需要的时间相差往往很大。因此，指令分析部件和指令执行部件经常要相互等待，从而造成功能部件的浪费。
2、当出现转移或转子程序指令时，程序的执行过程就不是顺序的。这时，在先行指令缓冲器中预取的指令和已经分析完成的下一指令等都可能要作废。
5
ppt课件
第 5 章重叠、流水和向量处理机
二次重叠执行方式。
如果执行一条指令的三过程的时间相等，则执行n条指令所用的时间为：
T＝(2＋n）t
采用二次重叠执行方式能够使指令的执行时间缩短近三分之二，这是一种理想的指令执行方式。在正常情况下，处理机中同时有三条指令在执行。
6
ppt课件
第 5 章重叠、流水和向量处理机
11
ppt课件第 5 章重源自、流水和向量处理机12图 5.4 当第k条指令是条件转移时ppt课件
第 5 章重叠、流水和向量处理机
3、如果“分析k+1”所要读取的操作数正好是 “执行k”的结果，则它们不能重叠执行，这种情况称为数据相关。
13
ppt课件
第 5 章重叠、流水和向量处理机
如果采用Von Neumann型机器上指令可修改的办法经第k条指令的执行来形成第k+1条指令，
采用顺序执行方式执行n条指令所用的时间为：
如果取指令、分析指令和执行指令的时间都相等，每段的时间都为t，则执行n条指令所用的时间为：
T＝3nt
优点：是控制简单，节省设备。
缺点：一是处理机执行指令的速度慢。只有当上一条指令全部执行完之后，下一条指令才能够开始执行。
4
ppt课件
第 5 章重叠、流水和向量处理机
令送到指令寄存器。
分析--是指对指令的操作码进行译码，按照给定的寻址方
式和地址字段中的内容形成操作数的地址，并用这个地址
读取操作数（主存储器或寄存器中）。
执行--是指根据操作码的要求，完成指令规定的功能，在
此期间，要把运算结果写到寄存器或主存储器中。
3
ppt课件
第 5 章重叠、流水和向量处理机
1、顺序执行方式
采用二次重叠执行方式，在处理机中同时有三条指令分别在取指令、分析和执行。要使指令能够正确地重叠执行，必须解决如下两个问题：第一，为了实现取指令，分析指令和执行指令同时进行，需要有独立的取指令部件、指令分析部件和指令执行部件。因此，要把顺序执行方式中的一个集中的指令控制器，分解成三个相对独立的控制器，它们是：存储控制器，简称存控；指令控制器，简称指控；运算控制器，简称运控。第二，要解决访问主存储器的冲突问题。例如，取指令时要访问主存储器，分析指令时可能要取操作数，执行指令时可能要向主存储器写运算结果。常规的主存储器体系结构无法实现指令的重叠执行。
一次重叠执行方式。
如果执行一条指令的两个过程的时间均相等，则执行n 条指令所用的时间为：
T＝(1＋2n）t
优点：一是指令的执行时间缩短了近二分之一，二是功能部件的利用明显提高。
缺点：需要增加一些硬件，控制过程也要复杂一些。例如，为了能够在执行第k条指令的同时，分析第k+1条指令，必须再增加一个指令寄存器。用原来的指令寄存器存放当前正在执行的第k条指令，而新增加的一个指令寄存器存放新取出来的第k+1条指令。
– 通过控制机构采用同时解释两条、多条甚至整段程序来加快（重叠、流水）
2
ppt课件
第 5 章重叠、流水和向量处理机
5.1 重叠解释方式
5.1.1 基本思想和一次重叠指令的执行过程可以被分解为相互独立的几个阶段，具体的分法要根据各种处理机的情况而确定。
取指--按照指令计数器的内容访问主存储器，取出一条指
在许多高性能处理机内部，一级Cache一般都设置有两个，其中，一个是指令Cache，另一个是数据Cache。这样，可以减少取指令和读操作数的访问冲突。这种结构被称为哈佛结构。
8
ppt课件
第 5 章重叠、流水和向量处理机
– 指令和数据仍然混合存放在同一个主存储器内，采用第三章中介绍的低位交叉存取方式，在一个存储器周期中可以访问多个存储单元。如果处理机同时执行的取指令和读操作数所访问的不是同一个存储体，则可以实现指令重叠执行。如果正好访问同一个存储体，则指令无法重叠执行。

第5章--重叠、 流水和向量处理机 ppt课件

计算机体系结构第五章 重叠、 流水与向量之一 2