第5章标量处理机(5.7) 超标量超流水处理机

合集下载

第5章标量处理机(5.7) 超标量超流水处理机

第5章标量处理机(5.7)  超标量超流水处理机
yangruioot@
计算机科学与技术
超标量处理机的结构


超标量处理机至少具有两套或者两条以上完整的 指令执行部件。 高性能的超标量处理机通常还设置一个先行指令 窗口: 能够从指令Cache中预取多条指令 能够对窗口内的指令进行数据相关性分析和功 能部件冲突的检测 窗口的大小:一般为2至8条指令
yangruioot@
计算机科学与技术
实际指令级并行度与理论指令级并行度的关系




当横坐标给出的理论指令级并行度比较低时,处 理机的实际指令级并行度的提高比较快。 当理论指令级并行度进一步增加时,处理机实际 指令级并行度提高的速度越来越慢。 在实际设计超标量、超流水线、超标量超流水线 处理机的指令级并行度时要适当,否则,有可能 造成花费了大量的硬件,但实际上处理机所能达 到的指令级并行度并不高。 目前,一般认为,m 和 n 都不要超过4。
多条无数据相关和控制相关的指令在单发射处理机中 的时空图如图
度为1
部件 写结果 执行 译码 取指 0 1 1 1 2 2 1 2 3 3 1 2 3 4 4 2 3 4 5 5 3 4 5 6 6 4 5 6 7 7 5 6 7 8 8 6 7 8 9 9 7 8 9 10 10 8 9 10 11 11 9 10 11 12 12 13 14 15 10 11 12 11 12 12
写结果
图 5 44 超 标 量 超 流 水 线 时 空 图
在一台指令并行度为(m, n)的超标量超流水线处理机 上,连续执行没有相关的N条 指令的所需要的时间为:
T ( m, n ) ( k N m ) t nm
执行 译码 取指
超标量超流水线处理机相对 于单流水线普通标量处理机的 加速比为:

标准流水线测测试试题

标准流水线测测试试题
★★
2.请写出2种数据相关方式,并举例说明分别在什么情况下发生(采用设计程序段的方式来说明)
答:
⑴写读相关:
例如程序段R0=R1×R4; R2=R0×R3若第二条指令在第一条指令前执行则最终的结果与正确结果不同,此时发生写读相关
⑵读写相关
例如程序段R2=R0×R3; R3=R4-1若第二条指令在第一条指令前执行则最终的结果与正确结果不同,此时发生读写数据相关
A. 2.4
B. 2.46
C. 2.67
D. 2.75
答案:B
★★
16.一条4个功能段的加-乘静态流水线,四个功能段如下所示,计算 ,最少需要经过多少时间,假设运算的结果有专门的输出通路连接到输入端。并且只有当一个流水线排空后流水线才可以发生另一种运算。
(1)取指
(2)译码、取数
(3)运算
(4)写结果
A. 流水线设备
B. 上海流水线
C. 无锡流水线
D. 杭州流水线
答案B
★★
3.假设一条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每一段的执行时间均为 ,连续执行n条指令所需要花费的最短时间约为(假设仅有“取指令”和“分析”可重叠并假设n足够大):
A.
B.
C.
D.
答案B
★★
4.假设一条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每一段的执行时间分别为 、 和 ,连续执行n条指令所需要花费的最短时间约为(假设仅有“取指令”和“执行”可重叠并假设n足够大):
超标量处理机一般具有多于一条的流水线,一台m度的超标量处理机可同时发射m条指令,指令的发射等待时间为1个时钟,指令的并行度为m。
超流水线处理机一般具有一条k段的超流水线,一台n度的超流水处理机可以同时发射一条指令,指令的发射等待时间为1/n个时钟周期,每个时钟周期共发射n条指令。指令的并行度为n。

第05章-流水线课后习题

第05章-流水线课后习题

第5章课后习题1.填空题(1) 衡量流水线性能的主要指标有(2) 指令乱序流动可能造成(3) 解决数据相关主要有(4) 超标量处理机开发的是行性。

(1). 吞吐率、加速比、效率(2). 先写后读、先读后写、写写(3). 推后分析、设置专用路径(4). 空间、时间2.假设一条指令的执行过程分为"取指令"、"分析"和"执行"三段,每一段的时间分别为△t、2△t和3△t。

在下列各种情况下,分别写出连续执行n条指令所需要的时间表达式。

(1) 顺序执行方式。

(2) 仅"取指令"和"执行"重叠。

(3) "取指令"、"分析"和"执行"重叠。

第2题(1) 顺序执行时每条指令用时=△t+2△t+3△t=6△t,因此n条指令所需要的时间=6n*△t(2) 第一条指令完成需要时间=△t+2△t+3△t=6△t,根据题义,下一条指令的"取指令"与上一条指令"执行"的最后一个△t重叠。

因此,自从第一条指令完成后,每隔4△t完成一条指令。

所以余下的n-1条指令用时(n-1)*4△t.所以,n条指令所需要的时间=6△t+(n-1)*4△t=2(2n+1)△t。

(3) 第一条指令完成需要时间=△t+2△t+3△t=6△t,由于一条指令的"取指令"和"分析"阶段和下一条指令的"执行"阶段重叠,因此,此后每3△t 完成一条指令,余下的n-1条指令用时(n-1)*3△t.因此n条指令所需要的时间=6△t+(n-1)*3△t=3(n+1)△t3.用一条5个功能段的浮点加法器流水线计算F=。

每个功能段的延迟时间均相等,流水线的输出端与输入端之间有直接数据通路,而且设置有足够的缓冲寄存器。

超标量处理机和超流水线处理机——计算机系统结构

超标量处理机和超流水线处理机——计算机系统结构

超标量处理机和超流⽔线处理机——计算机系统结构在表5.2中,基准标量处理机是⼀台普通的单流⽔线处理机。

为了便于进⾏⽐较,把基准标量处理机的机器流⽔线周期和指令发射等待时间都假设为1个时钟周期,同时发射的指令条数为⼀条,它的指令级并⾏度ILP(Instruction Level Parallelism)假设为1。

另外三种指令级并⾏处理机,即并⾏度为m的超标量处理机,并⾏度为n的超流⽔线处理机,以及并⾏度为(m,n)的超标量超流⽔线处理机,它们的性能都相对于基准标量处理机进⾏⽐较。

单流⽔线处理机只有⼀条指令流⽔线,只有⼀个多功能的操作部件,每个时钟周期"取指令"和"分析"完成⼀条指令。

在许多流⽔线处理机中,指令流⽔线的流⽔段数k=4;它把⼀条指令的执⾏过程主要分解为"取指令"、"分析"、"执⾏"和"写结果"4个阶段。

指令所要执⾏的功能主要在多功能操作部件中,在"执⾏"这⼀流⽔段完成。

多数流⽔线处理机的多功能操作部件采⽤流⽔线结构。

有的简单指令,只要⼀个时钟周期就能够在"执⾏"流⽔段中完成,⽽⽐较复杂的指令往往需要多个时钟周期。

另外,还有条件转移等的影响;因此,⼀般流⽔线标量处理机每个时钟周期平均执⾏指令的条数⼩于1,即它的指令级并⾏度ILP<1。

超标量、超流⽔线和超标量超流⽔线三种处理机在⼀个时钟周期内可以执⾏完成多条指令,即它们的指令级并⾏度ILP都⼤于1。

超标量处理机基本结构超标量处理机的典型结构是有多个操作部件,⼀个或⼏个⽐较⼤的通⽤寄存器堆,⼀个或两个⾼速Cache。

先进的超标量处理机⼀般都包含有三个处理单元,⼀个是定点处理单元,通常称为中央处理单元(CPU),它由⼀个或多个整数处理部件组成;第⼆个是浮点处理单元(FPU),它由浮点加减法部件和浮点乘除法部件等组成;第三个是图形加速部件,也称为图形处理单元(GPU),这是现代处理机中不可缺少的⼀个部分。

超标量处理器概览

超标量处理器概览

超标量处理器概览超标量处理器概览1.1为什么需要超标量处理器执⾏速度的影响因素程序中指令的数量每条指令在处理器中执⾏所需要的周期数普通流⽔线处理器每周期最多执⾏1条指令超标量处理器每周期可以执⾏多于⼀条的指令但不是每周期执⾏多于⼀条指令的处理器都是超标量处理器,如VLIW结构的也可以(依靠编译器和程序员来决定哪些指令可以并⾏执⾏)处理器每个周期的时间超标量处理器专门针对优化IPC(instruction per cycle),超标量处理器每周期可以从I-Cashe提取n条指令送⼊流⽔线,1.2 普通处理器的流⽔线理想流⽔线流⽔线各阶段所需时间近似相等各阶段的操作被重复执⾏。

对于算数运算类型的指令不需要访问存储器,那么它只需要在访存阶段什么都不做就可以。

流⽔线中各个阶段相互独⽴,互不相⼲。

但各指令间存在各种相关性,因此很难满⾜。

对于复杂指令集如x86,因为指令长度不等,执⾏时间不等,很难直接实现流⽔线。

对于精简指令集如arm,因为指令长度相等,并且每条指令任务量⽐较规整,所以容易使⽤流⽔线。

将流⽔线阶段合并,可以产⽣三级流⽔等,适⽤于对性能要不⾼的低功耗嵌⼊式领域。

将流⽔线阶段继续细分,可以获得更⾼性能,但是也会增加硬件资源开销和分⽀预测失败后果更严重。

指令相关性先写后读:后⼀条指令的操作数来源于上⼀条指令的结果,后条指令必须等上⼀条指令得到结果才能继续执⾏。

先读后写:⼀条指令要将结果写⼊到某个寄存器,但这个寄存器还在被其他指令读取,不能够马上写⼊。

先写后写:两条指令都要将结果写⼊同⼀个寄存器,那么后⾯指令必须等前⾯指令执⾏完才能执⾏写操作。

控制相关性:分⽀指令只有计算出结果才可以知道后续执⾏哪些指令,在得到结果的等待时间中只能按照预测⽅式取指。

对于超标量处理器WAW、WAR、RAW三种相关性都会阻碍指令乱序执⾏,需要在流⽔线中进⾏特殊处理。

1.3 超标量处理器的流⽔线超标量处理器执⾏指令两种⽅式:顺序执⾏、乱序执⾏frontend指流⽔线中的取指、译码issue指发射,将指令送到对应的功能单元执⾏。

计算机组成原理基础知识流水线技术和超标量处理器

计算机组成原理基础知识流水线技术和超标量处理器

计算机组成原理基础知识流水线技术和超标量处理器计算机组成原理基础知识:流水线技术和超标量处理器计算机组成原理是指计算机硬件的基本组成和工作原理。

在计算机科学与技术领域,流水线技术和超标量处理器是两个重要的概念。

本文将介绍这两种技术的基本原理和应用。

一、流水线技术流水线技术是指将一个复杂的操作分解成多个简单的子操作,并将这些子操作连续地执行,以提高计算机的指令执行效率。

在传统的自顶向下的设计方法中,计算机硬件主要包括控制器、运算器等单一功能模块,而在流水线技术中,计算机硬件被划分成多个阶段,每个阶段执行一个特定的功能子模块。

经典的流水线包括取指、译码、执行、访存和写回等阶段。

在取指阶段,计算机从存储器中读取指令;在译码阶段,计算机对指令进行解码并读取相应的操作数;在执行阶段,计算机执行相应的操作;在访存阶段,计算机对数据进行读写操作;在写回阶段,计算机将执行结果写回到寄存器或存储器。

流水线技术的优点是可以充分利用计算机硬件资源,提高指令的并行执行程度。

但是,流水线技术也存在一些问题,例如数据的相关性和冒险问题,需要通过一些技术手段来解决。

二、超标量处理器超标量处理器是一种在流水线技术基础上的改进方案。

传统的流水线技术中,每个阶段只能执行一个指令,而超标量处理器允许在同一个时钟周期内执行多个指令,以进一步提高计算机的执行效率。

超标量处理器主要依靠两个关键技术来实现多指令并行执行:乱序执行和动态调度。

乱序执行是指根据指令之间的依赖关系,按照合理的顺序执行指令,而不是按照指令在程序中的顺序执行。

动态调度是指通过硬件对指令进行调度,在不改变程序语义的前提下,尽可能地重排指令的执行顺序,以提高指令的并行度。

超标量处理器的工作原理可以简单描述为:在取指阶段,计算机从存储器中读取多个指令;在译码阶段,计算机对这些指令进行解码;在执行阶段,计算机并行执行多个指令;在访存阶段,计算机同时进行多个数据的读写操作;在写回阶段,计算机将执行结果写回到寄存器或存储器。

标量处理机

标量处理机
第五章 标量处理机
1.标量处理机:只有标量数据表示和标量指令系统的处
理机称为标量处理机。标量处理机是一种最通用,也是 使用最普遍的处理机。
2.标量处理机中提高指令执行速度的主要途径有:
①提高主频;②缩短CPI——设计更好的算法和功 能部件;③指令级并行——主要方法,又可分为:
a.流水线技术和超流水线技术;
2.主存操作数相关 例如:k: add [0001],ax k+1: mov bx, [0001]
2021/8/10
第五章 标量处理机
第8 页
5.1 先行控制技术
在现代计算机中,中间结果一般写入寄存器,所以该类 相关发生不多。 解决方法:推后分析法。
2021/8/10
第五章 标量处理机
第9 页
5.1 先行控制技术
1.采用先行控制技术的处理机结构
2021/8/10
第五章 标量处理机
第4 页
5.1 先行控制技术
2.四个先行缓冲栈 (1) 先行指令缓冲栈——缓冲主存和指令分析器 (2) 先行操作栈——存放经过指令分析器预处理后的指
令。这种预处理内容很多。
2021/8/10
第五章 标量处理机
第5 页
5.1 先行控制技术
2021/8/10
第五章 标量处理机
第15 页
5.1 先行控制技术
对于条件转移,相关最严重的情况发生在条件码是 由上一条指令产生的。
下面是条件转移对程序执行速度影响的分析:
① 如果转移不成功——运算器等待一个时钟周期 ② 如果转移成功
如果L在先行指令缓冲栈中,则条件转移对程序执行的 影响是:
a.作废k+2到L-1之间的所有指令; b.运算器等待一个时钟周期。

超标量、超级流水线处理机的性能分析

超标量、超级流水线处理机的性能分析

为 了更 深 地 挖掘 计 算 机 的并行 性 , 行 处 理 机 现 都 采 用 了超 标 量 和超 级 流水 线 技术 ,甚 至采 用 超 级
流 水 线 超 标 量 处 理 机 ,超 级 流 水 线 的代 表 机 型 是
R 00机 , 标 量计 算 机 的代 表 有 C coe 算 机 、 40 超 yln 计
排 队室 等 待接 受 下 一个 服 务 员 的服 务 …。在 本 系统 中 , 客 在 排 队室 等 待 , 第 一个 服 务 员服 务 后 , 顾 被 紧
接着 被 第 二个 服 务员 服 务 ,服务 完 成后 紧 接 着接 受
( )服务 员 作 业 的服 务 时 间为 一个 时钟 周 期 下 3 ,

服 从 定长 分 布 , 然 , 服务 员 服务 时间 均 为 下 显 n个 。
( )统 经 过长 时 间运行 后 达 到统 计 平稳 状 态 。 4
( )服 务 员 串行 服 务 , 和 典 型 的 串行 服 务 系 5 这 统 不 同 : 般情 况 , 一 串行 排 队系统 中 , 个服 务 员 前 每
度接 口锁存器隔离 , 相邻段之间的信息流动处在一 个 公 共 时钟 控 制 之 下 , 基 本 结构 如 图 1 示 …。 其 所 若
每一 段 s的逻辑 电路 的延迟 时 间为 下,锁存 器 时 间 ;
延 迟 为 下 , 么 , 水线 的时 钟周 期 为 : 那 流
1 1
个 子 任务 。其 中 n个 周 期 用来 填 满 流水 线 或 完成 第
维普资讯
1 0
微 电子 学 与计 算 机
20 0 2年 第 6期
超 标 量 、 级 流 水 线 处 理 机 的 性 能 分 析 超
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计算机科学与技术
yangruioot@
由4个操作部件组成的单发射处理机
来自指 令Cache IF ID
FA1 FA2 FA3 浮点加法部件
MD1 MD2 MD3 乘除法部件
WR 通用寄存器 后行写数栈
AL 定点ALU部件 LS 取数存数部件
计算机科学与技术
yangruioot@
来自指令 Cache
IF
ID
乘除部件 AL
WR
来自指令 Cache
定点算术逻辑部件 IF ID LS 取数存数部件 Байду номын сангаасR
计算机科学与技术
yangruioot@
在前图中执行指令的时空图如下图所示
部件 3 写结果 2 1 3 执行 2 1 3 译码 2 1 3 取指 2 1 0 3 2 1 1 3 2 1 6 5 4 2 3 2 1 6 5 4 9 8 7 3 3 2 1 6 5 4 9 8 7 12 11 10 4 5 6 7 时间(∆t) 6 5 4 9 8 7 12 11 10 9 8 7 12 11 10 12 11 10
写结果
执行
译码
取指
计算机科学与技术
返回公式页 yangruioot@
超流水处理机与超标量处理机


提高处理机性能的不同方法: 超标量处理机是通过增加硬件资源为代价来换 取处理机性能的。 超流水线处理机则通过各硬件部件充分重叠工 作来提高处理机性能。 两种不同并行性: 超标量处理机采用的是空间并行性 超流水处理机采用的是时间并行性
yangruioot@
计算机科学与技术
4. 超标量处理机性能
单流水线普通标量处理机的指令级并行度记为(1,1); 超标量处理机的指令并行度记做(m,1); 超流水线处理机的指令并行度记为(1,n); 超标量超流水线处理机的指令并行度记为(m,n)。
假设:一个时钟周期为∆t,可以得出在没有资源相关、数据相 关和控制相关的N条指令在单发射k个功能段的流水线处理机上 执行的时间为:
多条无数据相关和控制相关的指令在单发射处理机中 的时空图如图
度为1
部件 写结果 执行 译码 取指 0 1 1 1 2 2 1 2 3 3 1 2 3 4 4 2 3 4 5 5 3 4 5 6 6 4 5 6 7 7 5 6 7 8 8 6 7 8 9 9 7 8 9 10 10 8 9 10 11 11 9 10 11 12 12 13 14 15 10 11 12 11 12 12
S (m, n) T (1,1) m n(k N 1) T (m, n) m nk N m
当N→∞时,超标量超流水线 处理机的加速比最大值为mn。
超标量、超流水、超标量超流水处理机的主要性能 机器类型 机器流水 线周期 同时发射 指令条数 指令发射 等待时间 指令级并 行度ILP
相对性能
2.5
2.0 1.5 1.0 0.5 0.0
超标量
超标量 超流水线 1 2 3 4 5 6 7
超流水线
指令级 并行度
8
计算机科学与技术
yangruioot@
相对性能的比较

超标量处理机的相对性能最高,其次是超标量超 流水线处理机,超流水线处理机的相对性能最低



超标量处理机在每个时钟周期的一开始就同时发射 多条指令,而超流水线处理机则要把一个时钟周期 平均分成多个流水线周期,每个流水线周期发射一 条指令;因此,超流水线处理机的启动延迟比超标 量处理机大。 条件转移造成的损失,超流水线处理机要比超标量 处理机大。 在指令执行过程中的每一个功能段,超标量处理机 都重复设置有多个相同的指令执行部件,而超流水 线处理机只是把同一个指令执行部件分解为多个流 水级;因此,超标量处理机指令执行部件的冲突要 比超流水线处理机小。
yangruioot@
计算机科学与技术
超标量处理机的结构


超标量处理机至少具有两套或者两条以上完整的 指令执行部件。 高性能的超标量处理机通常还设置一个先行指令 窗口: 能够从指令Cache中预取多条指令 能够对窗口内的指令进行数据相关性分析和功 能部件冲突的检测 窗口的大小:一般为2至8条指令
图: 单发射指令流水线的时空图
计算机科学与技术
yangruioot@
2 多发射指令流水线





每个周期同时取多条指令、同时译码多条指令, 同时执行多条指令,同时写回多个运算结果。 需要设置多个取指令部件,多个指令译码部件和 多个写结果部件。 设置多个指令执行部件,有些指令执行部件采用 流水线结构。 当多个结果同时产生时,在不发生数据相关的前 提下,可以同时写多个结果。 目标是每个时钟周期平均执行多条指令,ILP的期 望值大于1。

计算机科学与技术
yangruioot@
1 超流水处理机的指令执行时空图

每隔1/n个时钟周期发射一条指令,流水线周期为 1/n个时钟周期
空间 3 2 1 3 2 1 3 2 1 3 2 1 0 1 1 1 3 2 4 2 5 7 3 6 8 10 4 5 6 7 8 时间∆t 1 3 2 4 9 11 5 7 12 6 8 10 1 3 2 4 9 11 5 7 12 6 8 10 3 2 4 9 11 5 7 12 6 8 10 9 11 12
写结果
执行
译码
取指
计算机科学与技术
yangruioot@
2 超流水处理机的指令执行时序


每隔1/n个时钟周期发射一条指令,流水线周期为 1/n个时钟周期 在超标量处理机中,流水线的有些功能段还可以 进一步细分 例如:ID功能段可以再细分为译码、读第一操 作数和读第二操作数三个流水段。也有些功能 段不能再细分,如WR功能段一般不再细分。 因此有超流水线的另外一种定义:有8个或8个 以上流水段的处理机称为超流水线处理机


在超标量处理机中,有多条指令流水线在同时工 作,设置有多个能独立工作的操作部件,为了达 到最大并行度m,必须解决: 多流水线的调度问题(教材:5.4.3) 顺序发射顺序完成 顺序发射乱序完成 乱序发射乱序完成 资源冲突问题(教材:5.4.4 ) 操作部件尽量使用流水线结构 系统中设置多个相同种类的操作部件
计算机科学与技术
yangruioot@
空间 n-1 n n
S4 S3 S2 S1 1 1 2 1 2 3
1 2 3 …
2 3 … …
3 … … n-1
… … n-1 n
… n-1 n
k·△t Tk
(n-1)·△t
时间 (单位:△t)
空间 3 2 1 3 2 1 3 2 1 3 2 1 0 1 1 1 3 2 4 2 5 7 3 6 8 10 4 5 6 7 8 时间∆t 1 3 2 4 9 11 5 7 12 6 8 10 1 3 2 4 9 11 5 7 12 6 8 10 3 2 4 9 11 5 7 12 6 8 10 9 11 12
T (1,1)= (k+N-1) ∆t
计算机科学与技术
yangruioot@
在一台指令并行度为(m,1)的超标量处理机上执行N条没 有资源相关、数据相关和控制相关的指令时,所需要的时间 为:
T (m,1)=(
N m k m )∆t
超标量处理机相对于单流水线普通标量处理机的加速比为:
T (1,1) m(k N 1) S (m,1)= T (m,1) N m(k 1)
当N→∞时,超标量处理机的加速比最大值为m,即超标量 处理机同时发射指令的条数。
计算机科学与技术 yangruioot@
5.5.2 超流水处理机

定义 一个周期内能够分时发射多条指令的处理机称 为 超流水线处理机。 指令流水线有8个或更多功能段的流水线处理 机称为超流水线处理机。 分时发射多条指令?
写结果
图 5 44 超 标 量 超 流 水 线 时 空 图
在一台指令并行度为(m, n)的超标量超流水线处理机 上,连续执行没有相关的N条 指令的所需要的时间为:
T ( m, n ) ( k N m ) t nm
执行 译码 取指
超标量超流水线处理机相对 于单流水线普通标量处理机的 加速比为:
5.7 多指令流水线技术
5.5.1 超标量处理机 5.5.2 超流水处理机 5.5.3 超标量超流水处理机
1 单发射指令流水线




每个周期只取一条指令、只译码一条指令,只执 行一条指令,只写回一个运算结果。 取指令部件和指令译码部件各设置一套; 只设置一个多功能操作部件或设置多个独立的操 作部件; 操作部件中可以采用流水线结构,也可以不采用 流水线结构。 目标是每个时钟周期平均执行一条指令,ILP的期 望值为1。
yangruioot@
计算机科学与技术
多发射指令流水线
取指令 指令译码 FA1 来自指令 Cache IF ID 执行指令 FA2 FA3 WR 写回结果 通用寄存器 或 后行写数栈 通用寄存器 或 后行写数栈 通用寄存器 或 后行写数栈
浮点加法部件 MD1 MD2 MD3
指令并行 度为m
多发射指令流水线的时空图
计算机科学与技术
返回公式页
yangruioot@
5.5.1 超标量处理机


一个时钟周期内能够同时发射多条指令的处理机 称为超标量处理机 目前的超标量处理机每个时钟周期发射2-4条指令 Intel公司的i860、i960、Pentium处理机, Motolora公司的MC88110处理机,IBM公司的 Power 6000处理机等每个周期都发射两条指令 TI公司生产的SuperSPARC处理机以及Intel的 Pentium III处理机等每个周期发射三条指令 操作部件的个数多于每个周期发射的指令条数。 4个至16个操作部件 超标量处理机的指令级并行度:1<ILP<m; m为每个周期发射的指令条数。
相关文档
最新文档