第5章--重叠、 流水和向量处理机 ppt课件

合集下载

计算机体系结构第五章 重叠、 流水与向量之一 2

计算机体系结构第五章  重叠、 流水与向量之一 2

(2)同一时间内各段之间的连接方式来分类
l 静态流水线 在同一时间内,流水线的各段只能按同一种功
能的连接方式工作,只有程序中连续出现同一种运 算时,流水线的效率才能得到充分的发挥。 l 动态流水线
在同一时间内,多功能流水线中的各段可以按 照不同的方式连接,同时执行多种功能。
优点:能提高流水线的效率。 缺点:会使流水线的控制变得复杂
空间
S4 S3 S2 S1 1
1
2
3
…n
1
2
3
…n
1
2
3…n
2
3
…n
SDti
(n-1)Dt2
Tm
时间
计算效率第二种方法:时空区法


n个任务占用的时空区 积面 m个流水段的总的时空 面区 积


任务数*每个任务所占的面积 设备数*流水线的整个工作时间
m
n Dti
i1 m Tm
T0 m Tm
2 3 … … n-1 n
mDt
(n-1) Dt
Tm
时间
各段执行时间相等,输入连续任务情况下完成n 个连续任务需要的总时间为:
Tm=m△t+(n-1)*△t
=(m+n-1)△t
吞吐率:
TP
n
(mn1)Dt
最大吞吐率为:
Tm P a x Ln i m (m n n1)DtD 1t
最大加速比为
Sma xLimmn m n mn1
如果流水线各段时间不相等
顺序执行需要的时间: T0=任务数*每个任务顺序通过流水线各段所需要
的时间
m
n Dti
i 1

第5章_重叠、流水和向量处理机

第5章_重叠、流水和向量处理机

2.分类 流水线依据向下和向上扩展的思路,可分类出在计算机系 统不同等级上使用的流水线。向下扩展指的是把子过程进一 步细分,让每个子过程经过的时间都同等程度减少,吞吐率 就会进一步提高。向上扩展可理解为在多个处理机之间流水 ;流水线按照处理级别可分为部件级(部件内各子部件间的流 水)、处理机级(构成处理机的各部件之间的流水)和系统级( 构成计算机系统的多处理机之间的流水);从流水线具有功能 的多少来看,可以分为单功能流水线(只能实现单一功能的流 水)和多功能流水线(同一流水线的各个段之间可以有多种不 同的联接方式以实现多种不同的功能或功能);按多功能流水 线的各段能否允许同时用于多种不同功能联接流水,可把流 水线分成静态流水线(同一时间内各段只能按一种功能联接流 水)和动态流水线(同一时间内可按不同运算或功能联接);以 机器所具有的数据表示可把流水线处理机分为标量流水机(没 有向量数据表示,只能以标量循环方式处理向量和数据)和向 量流水机;从流水线中各功能段之间是否有反馈回路,分为 线性流水和非线性流水。
5.1.1 基本思想和一次重叠
接着,看 执行 k 与分析 k+1 。为了实现它们的重叠, 硬件上应有独立的指令分析部件和指令执行部件 。而 且,由于执行时间的不同,还需在 硬件上解决控制上 的同步问题。此外,当第k条指令是转移指令时,还需 采用延迟转移技术使重叠效率不致下降。 在控制上还需解决邻近指令之间可能出现的数和指 令相关的问题。
5.1.2 相关处理
1.指令相关的处理 如果采用机器指令可修改的办法经第 k 条指令的执 行来形成第 k+1 条指令,由于在执行 k 的末尾才形成第 k+1条指令,按照一次重叠的时间关系,为避免出错, 第k 、k+1 条指令就不能同时解释,这时这两条指令之 间就发生了指令相关。 为解决指令相关问题,可设置一条“执行”指令解 决 。在这条执行指令中,被修改的指令以“执行”指 令操作数形式出现,这样就 将指令相关转化成了数据 相关 因为操作数可以存放在主存,也可以存放在通用寄 存器中,这样就有了 主存空间的数相关 和 通用寄存器 组的数相关。

计算机体系结构L5_CA流水线和向量处理机

计算机体系结构L5_CA流水线和向量处理机

计算机体系结构
北理工计算机学院
6
一次重叠执行方式
一种最简单的流水线方式 每次只重叠执行两条指令,故称为一次重叠 特点:在第K条指令完成之前就开始处理第
K+1条指令(重叠执行两条指令)
取指k 分析k 执行k 取指k+1 分析k+1 执行k+1 取指k+2 分析k+2 执行k+2
如果三个过程的时间相等,都为t,则执行n 条指令的时间为:T=(1+2n)t
计算机体系结构
北理工计算机学院
17
先行指令缓冲站
先行程序计数器 PC1

存 控
指令 缓冲
制 器
存储 区
控 制逻辑
现行程序计数器 PC
指令分析部件
指令寄存器 IR
先行指令缓冲站的组成
计算机体系结构
北理工计算机学院
18
先行指令缓冲站
指令缓冲存储区和相应的控制逻辑
按队列方式工作。 只要指令缓冲站不满,它就自动地向主存控制器发取指令请求,不断
取指k
分析k 执行k 取指k+1 分析k+1 执行k+1
取指k+2 分析k+2 执行k+2
如果三过程的时间相等,执行n条指令的 时间为:T=(2+n)t
采用二次重叠执行方式能够使指令的执行时 间缩短近三分之二。
计算机体系结构
北理工计算机学院
9
二次重叠执行方式
部件
执行
k k+1 k+2
分析
k k+1 k+2
计算机体系结构
北理工计算机学院
32
例题解答

第5章 重叠、流水和向量处理机

第5章  重叠、流水和向量处理机

反馈回路 一种简单的非线性流水线
• 流水线的其他分类方法 (1)按照控制方式:同步流水线和 异步流水线。 (2)顺序流水线与乱序流水线: 乱序流水线又称为无序流水线、错序 流水线或异步流水线等。
5.2.2 流水线处理机的主要性能 衡量流水线处理机的性能主要使吞吐率 (Through Put Rate,TP)和效率(Efficiency, η)和加速比。 1.吞吐率 吞吐率使流水线单位时间里能流出的任务数或结 果数。
T P
m Dti ( n- 1)Dtj i 1
n Δ ti
m
n
• 其加速比为:
sp
Δ t ( n 1 ) Δ t
i j i 1
m
i 1
2.效率
流水线的效率是指流水线中设备的实际使用时间占 整个运行时间之比,也称流水线设备的时间利用率。 如果是线性流水线且各段经过的时间相同,则在T时间 里,流水线各段的效率都相同,均为η0。 即: n Δ t0 n
5.1.2 相关处理
1、基本概念 • “相关”:邻近指令之间出现关联,为了防出错 让它们不能同时解释的现象; • “数相关”:邻近两条指令的数据地址有了关联 • “指令相关”:采用机器指令可修改的方法在第 K条指令执行后才产生第K+1条指令的现象。即: 为了避免出错,第k、第k+1条指令就不能同时 解释。
3 … … n-1 n 时间 (k-1)Dt T
3 … … n-1 n
3 … … n-1 n
kD t
nD t
(n-1) Dt
– 吞吐率:TP
n (k n 1)Dt
最大吞吐率为:
n 1 TP max Lim n ( k n 1)Dt Dt

第5章计算机流水线技术.ppt

第5章计算机流水线技术.ppt

3、流水的分级、分类
分级:(处理的级别分类) ❖ 部件级:将复杂的算逻运算组成流水工作方式; ❖ 指令级:把一条指令解释过程分成多个子过程 ; ❖ 处理机级:每个处理机完成某一专门任务,各个处理机所 得到的结果需存放在与下一个处理机所共享的存储器中
其他分类: ➢ 功能:单功能流水线(如CRAY-1)、多功能流水线 (如TI-ASC) ➢ 工作方式:静态流水线、动态流水线 ➢ 连接方式:线性、非线性 ➢ 处理数据:标量流水、向量流水
通过一种极端情况计算举例:
假设先行指令缓冲栈已经完全充满,缓冲深度是D1。 此时指令缓冲栈输出端,指令流出速度最快,而输入端,流 入最慢
假设指令序列的最大长度是L1,平均分析一条指令的时间是t1 而此时更坏的是取指令很慢,平均取一条指令的时间是t2 假设先行控制栈充满到被取空的过程中指令分析条数是L1
若各段时间不等时,有
实际执行时间:
n
T t分1 max t分i , t执i1 t执n
i2
✓先行控制:分析部件和执行部件能分别连续不断地分析和执 行指令,预取和缓冲相结合的技术 ,通过对指令流和数据流的 先行控制,使指令分析器和执行部件能尽量连续并行工作。 执行时间:
S2
….. .….
输出 Sk
时钟
流水线的基本结构
空间
填入
正常
排空
4 1 2 3 4 5 ... ... ... n-1 n
3
1 2 3 4 5 ... ... ... n-1 n
2 1 2 3 4 5 ... ... ... n-1 n
1 1 2 3 4 5 ... ... ... n-1 n
△t0 △ t0 △ t0 △ t0

计算机体系结构(金星)第五章 重叠、 流水与向量之二

计算机体系结构(金星)第五章 重叠、 流水与向量之二

(3) 分组(纵横)处理方式
定义:横向处理和纵向处理相结合的方式。
用于寄存器-寄存器结构的向量处理机中,向量 寄存器的长度是有限的。当向量长度n大于向量寄存 器长度m时,需要分组处理。 处理方式:将长度为n的向量分成若干组,每组长度 为m,组内按纵向方式处理,依次处理各组。 分组方法:n=k· m+r,其中:r为余数,共分K +1组。 组内采用纵向处理方式,组间采用横向处理方式。 因此,也称为分组处理方式,纵横 加工方式等。
b 计算所有调度方案的平均间隔拍数
设某方案为(t1,t2,t3)
调度方案 平均间隔拍数 3.67 (2,2,7) 4.50 ( 2,7 ) 3.50 (3,4)
平均间隔拍数= 循环周期中的各间隔拍数之 (4,3) 和 / 一 个 周 期 的 任 务 数 (3, 4,7) =(t1+t2+t3)/3 (3,7)
1.
加快短循环程序的处理
– 将长度小于指缓容量的短循环程序整个一
次性放入指缓内,并暂停预取指令 – 恒猜循环分支法
(3)流水机器的中断处理

不精确断点法
当指令I有中断,未进入流水线的后续指令不再 进入,已在流水线的指令仍继续流完,然后才转入 中断处理程序。断点为目前流水线的的最后一条指 令。
NUM: N
NUM: N
采用延迟转移技术
ADD R1,R2 2. JMP NEXT2 3. NEXT1:SUB R3,R4 …… n NEXT2: MOVE R4,A
1.
用软件方法将
转移指令与其 不相关的指令 交换位置。
JMP NEXT2 2. ADD R1,R2 3. NEXT1: SUB R3,R4 …… n NEXT2: MOVE R4,A

重叠流水和向量处理机PPT课件

重叠流水和向量处理机PPT课件
也就是说,在“执行k”得到的、送入通用寄存器的运算结果 来不及作为“分析k+2”的基址值用,更不用说作为“分析 k+1”的基址值用。因此,虽然是一次重叠,但基址值相关(B
相关)就不止会出现一次相关,还会出现二次相关。即当出现
B(k+1)=L3(k) 时 , 称 为 发 生 了 B 一 次 相 关 ; 而 当 出 现 B(k+2)=L3(k)时,称为发生了B二次相关,如图5.10所示。
图 5.9 用相关专用通路解决通 用寄存器组的数相关
第 5 章 重叠、流水和向量处理机
设操作数的有效地址
( X d ) (B2 ) (B2 0000 ) d2
由分析器内的地址加法器形成。由于通常情况下,“分析” 周期等于主存周期,所以,从时间关系上要求在“分析”周 期的前半段,就能由通用寄存器输出总线取得(B2),送入地址 加法器。由于运算结果是在“执行”周期的末尾才送入通用 寄存器组的,它当然不能立即出现在通用寄存器输出总线上。
图 5.20 瓶颈子过程再细分
第 5 章 重叠、流水和向量处理机
图 5.21 瓶颈子过程并联
第 5 章 重叠、流水和向量处理机
设一m段流水线的各段经过时间均为Δt0,则第1条指 令从流入到流出需要T0=mΔt0的流水建立时间,之后每隔Δt0 就可以流出一条指令,其时—空图如图5.22所示(这里设m=4)。 这样,完成n个任务的解释共需时间T=m·Δt0+(n-1)Δt0。在
3.
操作码 L1
L3
B2

操作码 L1
L3
d2 L2
第 5 章 重叠、流水和向量处理机 图 5.7 指令解释过程中与通用寄存器内容有关的微操作时间关系
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
k: 存 通用寄存器, k+1; (通用寄存器)→k+1
k+1: ……
由于在“执行k”的末尾才形成第k+1条指令,按照一次重 叠的时间关系,“分析k+1”所分析的是早已取进指缓的第 k+1条指令的旧内容,这就会出错。第k、k+1条指令就不 能同时解释,我们称此时这两条指令之间发生了“指令相 关”。 特别是当指令缓冲器可缓冲存放n条指令情况下, 执行到第k条指令时,与已预取进指缓的第k+1到第k+n条 指令都有可能发生指令相关。指缓容量越大,或者说指令
第 5 章 重叠、流水和向量处理机
第 5 章 重叠、 流水和向量处理机
5.1 重叠解释方式 5.2 流水方式 5.3 向量的流水处理与向量流水处理机 5.4 指令级高度并行的超级处理机
1
ppt课件
第 5 章 重叠、流水和向量处理机
计算机组成设计的基本任务:加快机器语言的 解释
– 提高每条指令的执行速度
M
M
M
M
0
1
…2 … …3 …
9
ppt课件
第 5 章 重叠、流水和向量处理机
– 在处理机内部设置一定容量的指令缓冲寄存器,把 指令分析器所需要的指令事先取到指令缓冲寄存器 中,而不必访问主存储器。这样,就能够使取指令、 分析指令和执行指令重叠起来执行。 如果指令分析器每次取指令都能够在先行指令缓冲 寄存器中得到,则取指令只需要很短的时间就能够 完成,因此,可以把取指令与分析指令合并到一起, 从而构成如图所示的一次重叠执行方式。
7
ppt课件
第 5 章 重叠、流水和向量处理机
解决办法
– 把主存储器分成两个独立编址的存储器,一个专门 存放指令,称为指令存储器,另一个专门存放操作 数,称为数据存储器。两个存储器可以同时独立访 问;这样,就解决了取指令和读操作数的冲突。如 果再规定,在执行指令阶段产生的运算结果只写到 通用寄存器中,不写到主存,那么,取指令、分析 指令和执行指令就可以同时进行。
10
ppt课件
第 5 章 重叠、流水和向量处理机
实际上要达到这个速度还有许多困难,主要有如下三 个问题需要解决:
1、现代计算机的指令系统是很复杂的,各种类型 的指令,其“分析”和“执行”所需要的时间相差往 往很大。因此,指令分析部件和指令执行部件经常要 相互等待,从而造成功能部件的浪费。
2、当出现转移或转子程序指令时,程序的执行过 程就不是顺序的。这时,在先行指令缓冲器中预取的 指令和已经分析完成的下一指令等都可能要作废。
5
ppt课件
第 5 章 重叠、流水和向量处理机
二次重叠执行方式。
如果执行一条指令的三过程的时间相等,则执行n条指令 所用的时间为:
T=(2+n)t
采用二次重叠执行方式能够使指令的执行时间缩短近三 分之二,这是一种理想的指令执行方式。在正常情况下, 处理机中同时有三条指令在执行。
6
ppt课件
第 5 章 重叠、流水和向量处理机
11
ppt课件第 5 章 重源自、流水和向量处理机12图 5.4 当第k条指令是条件转移时ppt课件
第 5 章 重叠、流水和向量处理机
3、如果“分析k+1”所要读取的操作数正好是 “执行k”的结果,则它们不能重叠执行,这种 情况称为数据相关。
13
ppt课件
第 5 章 重叠、流水和向量处理机
如果采用Von Neumann型机器上指令可修改的办法经 第k条指令的执行来形成第k+1条指令,
采用顺序执行方式执行n条指令所用的时间为:
如果取指令、分析指令和执行指令的时间都相等,每段 的时间都为t,则执行n条指令所用的时间为:
T=3nt
优点:是控制简单,节省设备。
缺点:一是处理机执行指令的速度慢。只有当上一条指 令全部执行完之后,下一条指令才能够开始执行。
4
ppt课件
第 5 章 重叠、流水和向量处理机
令送到指令寄存器。
分析--是指对指令的操作码进行译码,按照给定的寻址方
式和地址字段中的内容形成操作数的地址,并用这个地址
读取操作数(主存储器或寄存器中)。
执行--是指根据操作码的要求,完成指令规定的功能,在
此期间,要把运算结果写到寄存器或主存储器中。
3
ppt课件
第 5 章 重叠、流水和向量处理机
1、顺序执行方式
采用二次重叠执行方式,在处理机中同时有三条指令 分别在取指令、分析和执行。要使指令能够正确地重 叠执行,必须解决如下两个问题: 第一,为了实现取指令,分析指令和执行指令同时 进行,需要有独立的取指令部件、指令分析部件和指 令执行部件。因此,要把顺序执行方式中的一个集中 的指令控制器,分解成三个相对独立的控制器,它们 是:存储控制器,简称存控;指令控制器,简称指控; 运算控制器,简称运控。 第二,要解决访问主存储器的冲突问题。例如,取 指令时要访问主存储器,分析指令时可能要取操作数, 执行指令时可能要向主存储器写运算结果。常规的主 存储器体系结构无法实现指令的重叠执行。
一次重叠执行方式。
如果执行一条指令的两个过程的时间均相等,则执行n 条指令所用的时间为:
T=(1+2n)t
优点:一是指令的执行时间缩短了近二分之一,二是功 能部件的利用明显提高。
缺点:需要增加一些硬件,控制过程也要复杂一些。 例如,为了能够在执行第k条指令的同时,分析第k+1条 指令,必须再增加一个指令寄存器。用原来的指令寄存 器存放当前正在执行的第k条指令,而新增加的一个指 令寄存器存放新取出来的第k+1条指令。
– 通过控制机构采用同时解释两条、多条甚至整段程 序来加快(重叠、流水)
2
ppt课件
第 5 章 重叠、流水和向量处理机
5.1 重叠解释方式
5.1.1 基本思想和一次重叠 指令的执行过程可以被分解为相互独立的几个阶段,具 体的分法要根据各种处理机的情况而确定。
取指--按照指令计数器的内容访问主存储器,取出一条指
在许多高性能处理机内部,一级Cache一般都 设置有两个,其中,一个是指令Cache,另一个是 数据Cache。这样,可以减少取指令和读操作数的 访问冲突。这种结构被称为哈佛结构。
8
ppt课件
第 5 章 重叠、流水和向量处理机
– 指令和数据仍然混合存放在同一个主存储器内,采 用第三章中介绍的低位交叉存取方式,在一个存储 器周期中可以访问多个存储单元。如果处理机同时 执行的取指令和读操作数所访问的不是同一个存储 体,则可以实现指令重叠执行。如果正好访问同一 个存储体,则指令无法重叠执行。
相关文档
最新文档