哈工大—并行处理—第二章流水线处理机和向量处理机

合集下载

哈工大并行计算课件第二章

吞吐率处理顺序程序并行系统spps模型也称为吞吐率处理一个并行系统能够提高处理速度又能增加独立顺序作业的处理提高系统的吞吐率哈尔滨工业大学计算机科学与技术学院哈尔滨工业大学计算机科学与技术学院哈尔滨工业大学计算机科学与技术学院编译器将源代码翻译成二进制代码在并行平台上运行该平台包含操作系统和在它之下的并行计算机硬件
例如，在一个SGI PowerChallenge计算机例如，在一个SGI PowerChallenge计算机它是SMP) SMP)，上(它是SMP)，自然模型为共享变量模型 SGIPowerC)。 (如SGIPowerC)。数据并行( HPF)和消息传送和消息传送( MPl)可在数据并行(如HPF)和消息传送(如MPl)可在其顶部实现。其顶部实现。
这些并行语言大多数在当前系统上使用的并行语言均是Fortran Fortran或用的并行语言均是Fortran或C的某种扩展。扩展。
一个编程模型即是程序员在开发一个并行程序时所见到和使用的模型。并行程序时所见到和使用的模型。
哈尔滨工业大学计算机科学与技术学院
自然模型的定义：自然模型的定义：是由一个特定并行计算机平台所提供的、是由一个特定并行计算机平台所提供的、用户可见的最低层的编程模型。用户可见的最低层的编程模型。其他的编程模型可在此自然模型上加以实现。程模型可在此自然模型上加以实现。
并行编程基础第2章并行编程基础
ζ1 并行编程综述
ζ2 进程任务和线程 ζ3 并行性问题 ζ4 交互和通信问题
哈尔滨工业大学计算机科学与技术学院
ζ1 并行编程综述
并行编程处于令人遗憾的状况：并行编程处于令人遗憾的状况：
并行软件开发远落后于并行硬件的进展。并行软件开发远落后于并行硬件的进展。缺少合适的并行软件是阻碍主流用户接纳并行计算的主要原因。纳并行计算的主要原因。与顺序计算相比，与顺序计算相比，当今的并行系统软件和应用软件不仅数量很少, 和应用软件不仅数量很少,而且功能性也相当原始。相当原始。隧道之末总有阳光。隧道之末总有阳光。

计算机体系重叠流水和向量处理机

计算机体系重叠流水和向量处理机1. 引言计算机体系结构是指计算机硬件和软件组成的总体结构，其中包含了各个组件之间的互连关系、指令执行过程和数据传输方式等。

在计算机体系结构中，重叠流水和向量处理机是两种常见的优化技术，它们可以显著提升计算机的性能和效能。

2. 重叠流水技术重叠流水是一种通过将指令执行过程划分为多个阶段，并在不同阶段同时执行不同的指令来实现指令级并行的技术。

重叠流水的核心思想是任务重叠，即在当前指令执行的同时，下一条指令的取指阶段已经开始，上一条指令的结果也可以被下一条指令使用。

重叠流水主要包含以下几个阶段： - 取指（Instruction Fetch）：从内存中取得当前指令。

- 译码（Instruction Decode）：对指令进行解码，并获取操作数。

- 执行（Execution）：对指令所需的操作数进行运算，得到结果。

- 访存（Memory Access）：根据需要，读取或写入内存中的数据。

- 写回（Write Back）：将结果写回到目标寄存器。

2.1 重叠流水的优势重叠流水技术的优势主要表现在以下几个方面： - 提高了指令级并行处理的能力，加快了程序的执行速度。

- 充分利用了硬件资源，提高了系统的效率和吞吐量。

- 可以将计算任务划分为多个小任务，提高了系统的可扩展性和可移植性。

2.2 重叠流水的限制重叠流水技术虽然可以提高计算机的性能，但也存在一些限制： - 指令之间的依赖关系会影响重叠流水的效果，当一个指令的结果需要被后续指令使用时，需要等待该指令执行完成，从而降低了并行的效果。

- 分支指令（如if、for循环等）会导致流水线的中断和重新调整，影响了流水线的效率。

- 数据冒险（Data Hazards）和控制冒险（Control Hazards）也会对重叠流水的效果造成影响。

3. 向量处理机技术向量处理机是一种以向量为基本数据单位，以向量操作为基本操作，通过向量指令和向量寄存器实现的高性能处理机。

2022年哈尔滨理工大学计算机应用技术专业《计算机系统结构》科目期末试卷A(有答案)

2022年哈尔滨理工大学计算机应用技术专业《计算机系统结构》科目期末试卷A（有答案）一、选择题1、在操作系统机器级，一般用（）程序（）作业控制语句。

A.汇编程序，翻译B.汇编程序，解释C.机器语言，解释D.机器语言，翻译2、CRAY-I的流水线是( )A.多条单功能流水线B.一条单功能流水线C.多条多功能流水线D.一条多功能流水线3、对系统程序员不透明的应当是( )。

A.Cache存贮器XB.系列机各档不同的数据通路宽度C.指令缓冲寄存器D.虚拟存贮器4、目前，MO由（）实现，M1用（）实现，M2至M5大多用（）实现。

A.软件，固件，硬件B.固件，软件，硬件C.硬件，软件，固件D.硬件，固件，软件5、若输入流水线的指令既无局部性相关，也不存在全局性相关，则（）。

A.可获得高的吞吐率和效率B.流水线的效率和吞吐率恶化C.出现瓶颈D.可靠性提高6、计算机系统的层次结构按照由高到低的顺序分别为（）。

A.高级语言机器级，汇编语言机器级，传统机器语言机器级，微程序机器级B.高级语言机器级，应用语言机器级，汇编语言机器级，微程序机器级C.应用语言机器级，传统机器语言机器级，汇编语言机器级，操作系统机器级D.应用语言机器级，操作系统机器级，微程序机器级，传统机器语言机器级7、1TFLOPS计算机能力，1TBYTE/S的I/O带宽和（）称为计算机系统的3T性能目标。

A，1TBYTE 硬盘容量B.1TBYTE 软盘容量C.1TBYTE 主存容量D.A和B8、传统机器语言机器级，是用（）来（）机器指令。

A.硬件，翻译B.编译程序，翻译C.微指令程序，解释D.微指令程序，翻译9、在计算机系统设计中，比较好的方法是（）。

A.从上向下设计B.从下向上设计C.从两头向中间设计D.从中间开始向上、向下设计10、高级语言程序经（）的（）成汇编语言程序。

A.编译程序，翻译B.汇编程序，翻译C.汇编程序，解释D.编译程序，解释二、判断题11、计算机仿真用微程序解释，计算机模拟用机器语言解释。

流水线技术-向量处理机

流水线技术广泛应用于计算机硬件和软件领域，如CPU、GPU和编译器优化等。通过合理地划分任务和调度执行顺序，流水线技术可以显著提高程序的执行效率和响应速度。
向量处理机概述
向量处理机是一种专门用于处理大规模向量运算的计算机系统。它通过并行处理多个数据元素，能够高效地完成矩阵运算、信号处理、图像处理等计算密集型任务。
流水线并行处理
01
02
03
数据并行
将数据划分为多个子集，每个子集在流水线的一个阶段进行处理，实现数据并行处理。
任务并行
将任务划分为多个子任务，每个子任务在流水线的一个阶段进行处理，实现任务并行处理。
指令并行
在同一时间内，流水线可以执行多个指令，实现指令并行处理。
流水线冲突解决
数据冲突
并行处理单元
增加并行处理单元，如多核处理器、GPU等，进一步提高计算性能。
05
流水线技术-向量处理机的应用场景
科学计算
数值模拟
向量处理机在科学计算中广泛应用于数值模拟，如流体动力学、气象预报、地震数据处理等。
VS
统计分析
向量处理机能够高效处理大规模数据集，适用于统计分析、数据挖掘等领域。
图像处理
图像增强
向量处理机能够并行处理像素数据，适用于图像增强技术，如锐化、色彩校正等。
图像分析
在图像识别和目标检测等任务中，向量处理机能够加速特征提取和比对过程。
机器学习
模型训练
向量处理机能够高效处理大规模数据和矩阵运算，适用于机器学习模型的训练和推理。
并行算法
向量处理机支持并行算法，能够加速机器学习算法的实现和优化。
向量处理机通常采用特殊的硬件架构和指令集，以最大化并行处理能力。它通过将数据存储在特殊的向量寄存器中，并执行一组长指令来处理这些数据，从而实现高效的向量计算。

计算机系统结构--向量处理机

如果程序的90％是向量运算，10％是标量运算。则向量平衡点为0.9。硬件利用率最高。向量处理机的向量平衡点必须与用户程序的向量化程度相匹配。 IBM向量计算机的设计思想与上述方法不同，它维持较低的向量与标量比例，定在3～5的范围之间。这种做法能够适应通用应用问题对标量和向量处理要求。
6.2.1 存储器－存储器结构
向量处理机中有多个高速流水线运算部件，存储器的访问速度是关键采用多个存储体交叉和并行访问来提高存储器速度，例如： CRAY-1有64个存储体，每个处理机访问4个存储体 STAR-100采用32个存储体交叉，每个存储体并行读出8个64位数据我国研制的YH-1向量计算机有37个存储体
把存储器-存储器结构中的缓冲栈改为向量寄存器，运算部件需要的操作数从向量寄存器中读取，运算的中间结果也写到向量寄存器中。向量寄存器与标量寄存器的主要差别是：一个向量寄存器能够保存一个向量，例如：64个64位寄存器。连续访问一个向量的各个分量。需要有标量寄存器和地址寄存器等。
采用寄存器-寄存器结构的主要优点：降低主存储器的流量。例如：采用寄存器-寄存器结构的 CRAY-1与采用存储器-存储器结构的 STAR-100比较，运算速度高3倍多，而主存流量低2.5倍。 STAR-100的主存储器流量： 32×8W/1.28us=200MW/S CRAY-1的主存储器流量： 4W/50ns=80MW/S
6.3 向量处理方式
要根据向量运算的特点和向量处理机的类型选择向量的处理方式。有三种处理方式： 1．横向处理方式，又称为水平处理方式，横向加工方式等。向量计算是按行的方式从左至右横向地进行。 2．纵向处理方式，又称为垂直处理方式，纵向加工方式等。向量计算是按列的方式自上而下纵向地进行。 3．纵横处理方式，又称为分组处理方

操作系统课件

Operating System
22
哈工大计算机科学与技术学院
进程状态转换
在进程执行过程中，其状态会不断变化
运行
一个CPU上正在执行的进程
就绪
准备运行的进程
Harbin Institute of Technology
Operating System
23
哈工大计算机科学与技术学院
进程状态转换
(1) 就绪 (2) 运行运行: 该进程被配遣(Dispatch) 就绪: 运行并中断，如时间片用完
将其它资源加以限制后分配给不同的进程
如内存映射: Give each process their own address space 内核/用户模式: Arbitrary multiplexing of I/O through system calls
Harbin Institute of Technology
Harbin Institute of Technology
Operating System
16
哈工大计算机科学与技术学院
进程 vs. 程序
程序: 代码 + 数据
是静态的
int c; int main() { printf(“hello”); }
进程是程序关于某数据集 stack 上的一次运行活动
Harbin Institute of Technology
Operating System
7
哈工大计算机科学与技术学院
并发引出的问题
多个用户对资源的共享
单一的CPU,单一的DRAM,单一的I/O设如何分配如何让用户(程序员)感觉到是独占机器
操作系统需要协调所有的活动

并行处理与体系结构

所设计的结点体系结构允许使用不同的通信体系结构(例如以太网或HPS)。
通信协议独立于通信硬件：如以太网或HPS，都允许使用标准IP协议或IBM 专用用户空间协议。
哈尔滨工业大学计算机科学与技术学院
33
例题： MPI及超立方体计算机
消息传递接口(MPl)是使用少量独立(正交)语言特征的佳例。
随着附加处理器的增多，系统性能会有多大改进。
哈尔滨工业大学计算机科学与技术学院
14
例如，假定一个有n个处理器的系统，作数据库服务器用
它拥有美国人口数据库，通常有100位美国科学家查询，其性能为每秒1000个事务处理(TPS)。
现在如果我们将处理器数加倍成2n，能期望速度有多少改进?期望是多少？
所增加的资源中，处理器最为常见；也可能是存储器容量和I／O容量。
哈尔滨工业大学计算机科学与技术学院
15
（2）问题规模可扩展性
是指系统在处理更大数据量和工作负载的更大求解问题时其性能如何。
例如：仍以上述的数据库服务器为例，如果该服
务器上装有中国人口的数据库，则此服务器的服务质量将会如何? 注意到此数据库的大小已增至原来的5
实际系统总有一个最大存储器容量的上限。例如：
IBM SP2中的每个结点最多可容纳2GB 存储器；
CrayT3D为64MB。
哈尔滨工业大学计算机科学与技术学院
12
（3）软件可扩展性
包括：
操作系统的一个新版本，它具有更多功能性，如多线程，从而可支持更多的用户进程，更大的地址空间以及更高效的内核功能等。
哈尔滨工业大学计算机科学与技术学院64哈尔滨工业大学计算机科学与技术学院65哈尔滨工业大学计算机科学与技术学院666419哈尔滨工业大学计算机科学与技术学院67哈尔滨工业大学计算机科学与技术学院68例如高位存储器扩充存储器和扩展存储器哈尔滨工业大学计算机科学与技术学院69考虑到代的可扩展性ibmrs6000smp作了过度设计第一代的smp基于powerpc601处理器

并行处理与体系结构哈工大复习提纲

并行处理与体系结构哈工大复习提纲
一、并行处理
1.什么是并行处理
并行处理是指通过多台计算机、多个处理器、多核处理器等结构，在同一时间段内，同时完成多个任务，通过将任务分解成多个小任务分别在多个处理器上同时进行处理，从而大大加快处理速度，达到快速处理数据的目的。

2.并行处理的应用
并行处理可以应用在多种场景：
（1）由于实时数据处理的迅速处理，可以将其应用在实时视频、社交网络等环境中；
（2）可以将其应用在科学计算和模拟仿真等高计算量计算中，对一些巨大的数据进行处理；
（3）可以将其应用于大数据处理，比如通过大数据分析和挖掘，对市场动态进行分析；
（4）可以将其用于虚拟化技术，比如提高虚拟机的性能。

3.并行处理的技术
并行处理技术追求的是极致的性能
（1）多处理器技术：多处理器技术是指将多台处理器相互协调、协同工作，来实现对工作的并行处理；
（2）多核处理器技术：多核处理器技术是指在单个处理器的结构中，将多个处理单元连接在一起，由多个处理单元同时完成任务，实现并行处理；
（3）虚拟处理器技术：虚拟处理器技术是通过虚拟处理器分配多个
处理任务。

操作系统习题(哈工大)(汇编)

第一章：1、操作系统的主要性能参数有(响应时间)、(可靠性)。

2、Windows98是一个（单用户多任务）得操作系统。

3、当前作为自由软件的操作系统是（c）a、Windowsb、UNIXc、Linuxd、OS/24. 操作系统的地位：操作系统是裸机之上的第一层软件，是建立其他所有软件的基础。

它是整个系统的控制管理中心，既管硬件，又管软件，它为其它软件提供运行环境。

5. 操作系统的发展历程1.最初是手工操作阶段，需要人工干预，有严重的缺点，此时尚未形成操作系统2.早期批处理分为联机和脱机两类，其主要区别在与I/O是否受主机控制3.多道批处理系统中允许多道程序并发执行，与单道批处理系统相比有质的飞跃6.操作系统的主要类型？多道批处理系统、分时系统、实时系统、个人机系统、网络系统和分布式系统1.多道批处理系统1)批处理系统的特点：多道、成批2)批处理系统的优点：资源利用率高、系统吞吐量大3)批处理系统的缺点：等待时间长、没有交互能力2.分时系统1)分时：指若干并发程序对CPU时间的共享。

它是通过系统软件实现的。

共享的时间单位称为时间片。

2)分时系统的特征：同时性：若干用户可同时上机使用计算机系统交互性：用户能方便地与系统进行人--机对话独立性：系统中各用户可以彼此独立地操作，互不干扰或破坏及时性：用户能在很短时间内得到系统的响应3)优点主要是：响应快，界面友好多用户，便于普及便于资源共享3.实时系统1)实时系统：响应时间很快，可以在毫秒甚至微秒级立即处理2)典型应用形式：过程控制系统、信息查询系统、事务处理系统3)与分时系统的主要区别：4. 个人机系统1) 单用户操作系统单用户操作系统特征：个人使用：整个系统由一个人操纵，使用方便。

界面友好：人机交互的方式，图形界面。

管理方便：根据用户自己的使用要求，方便的对系统进行管理。

适于普及：满足一般的工作需求，价格低廉。

2) 多用户操作系统多：代表是UNIX，具有更强大的功能和更多优点。

intel公司多核多线程技术

多核程序设计
第一章多核技术导论
电子书及资料下载： /zh-cn/articles/32067
长春工业大学计算机科学与工程学院
并行计算机

由一组处理单元组成，这组处理单元通过相互之间的通信与协作，以更快的速度共同完成一项大规模的计算任务。出现背景:

长春工业大学计算机科学与工程学院
片上多核处理器架构

片上多核处理器（Chip Multi-Processor，CMP）就是将多个计算内核集成在一个处理器芯片中，从而提高计算能力。按计算内核的对等与否，CMP可分为同构多核和异构多核 CPU核心数据共享与同步的通信机制：

长春工业大学计算机科学与工程学院
并行计算机从系统结构角度分类

分布式存储器的SIMD处理机

含有多个同样结构的处理单元（PE），通过寻径网络以一定方式互相连接。每个PE有各自的本地存储器（LM）。集中设臵存储器，共享的多个并行存储器通过对准网络与各处理单元PE 相连。在处理单元数目不太大的情况下很理想。
长春工业大学计算机科学与工程学院
并行计算机从系统结构角度分类

机群（cluster）有三个明显的特征

系统由商用结点构成，每个结点包含2-4 个商用微处理器，结点内部共享存储。采用商用机群交换机连接结点，结点间分布存储。在各个结点上，采用机群Linux 操作系统、GNU 编译系统和作业管理系统。
长春工业大学计算机科学与工程学院
并行计算机从系统结构角度分类

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

以上几种相关称为局部相关，因为它最多只影响流入流水线中与之相关的后面几条指令，使其暂停流动，并不会更改指令缓冲器的内容，所以说影响是局部的。
2．局部性相关的处理
①推后后续指令对相关单元的读操作，直至在先的指令写入完成。两种方法 ②设置相关直接通路，将运算结果经相关直接通路直接送所需部件，不必先把运算结果写入相关单元，再从此单元取出来使用
3.全局性相关
第K条为条转指令:
取指K
分析K
执行K
按流水关系条件转移不成功时: 取指K＋1 分析K＋1 执行K＋1 条件转移为成功且指令r在指缓中时: 取指r 条件转移为成功且指令r不在指缓中时：从主存中取指r
分析r
执行r
分析r
执行r
全局性相关----转移指令和其后面的指令之间的相关。
4.全局性相关的处理
采用异步流动方式发生的相关有二种：
写—写相关——对同一单元，要求在先的指令先
写入，在后的指令后写入的关联。要求在先的指令先写入,既写入顺序不变.
先读后写相关——对同一单元，要求在先的指令先
读出，在后的指令才写入的关联。要求在先的指令先读出,既读写的先后顺序不变.
流水机器一般同时解释多条指令，并经常采用多个可并行工作的功能部件，若在各功能部件之间为每种局部性相关都设置单独的相关直接通路，将会使硬件耗费大，控制复杂。因此，一般宜采用分布式控制和管理，并设置公共数据总线以简化各种相关的判别和实现相关直接通路的连接。
即： η=
n 个任务实际占用的时空区 = m 个段总的时空区
n.
m
i =1
· ti △
m.[ Δt i (n 1)Δt j ]
i 1

m
再考虑到各段设备量不同，为反映出其重要性，数量、成本等不同，在计算整个系统设备利用率时，可对各个段加不同的数值α，这样： i
▲
n .(
η=
m
i =1
2.按流水线完成功能的多少分类
单功能流水线----只能实现一种功能的流水处理。
多功能流水线指----同一流水线的各个段之间可以有多种不同的联接方式以实现多种不同的运算或功能。
流水线功能块浮点加、减运算时的连接定点乘法运算的连接
3.按流水不同功能的联接切换方式分类
静态流水线----在某一时间里各段只能按一种功能联接流水，只有等流水线全部流空后才能切换成按另一种功能来联接流水。
机器的最大吞吐率-----机器单位时间内能处理指令的最大条数，或机器能输出结果的最多个数。流水的最大吞吐率是指流水线处于正常满负荷流动时的吞吐率，只有这时才会每隔Δt 流出一个结果。为缓冲各子部件的速度差异并在部件之间往往都要设置高速缓冲器
高速接口锁存器
2.2流水线的分类
1.按流水处理的级别分类 2.按流水线完成功能的多少分类 3.按流水不同功能的联接切换方式分类
1
2 3 4
2
3
3
4
4
… …
n-1 n
… …
4 … … n-1 n … … n-1 n
四
五
六
七时间
4．按处理的数据类型分类
标量流水处理机：没有向量数据表示，只能对标量进行处理
向量流水处理机：机器具有向量数据表示，设置有向量指令和向量运算硬件，能对向量的各个元素流水地处理。
5.按流水线的结构分类
时
空图
2a
入
1
Δt0
出
2b 2c 3 Δt0 3
Δt0
4
Δt0
空间
4
3 2c
2b 2a
1 1
2
Δt0
1 2 3 4 5 6 7 1 2 3 4 5 6 7 8 3 6 9 2 5 8 1 4 7 10 3 4 5 6 7 8 9 10 11
8
时间
瓶颈过程并联示意图
清除瓶颈的办法
空间
4
3 2 1
线性流水----各段串行联接，没有反馈回路，各段只经过一次。
非线性流水----流水线中除有串行联接的通路外.还有某种反馈回路，使一个任务流经流水线时，需要多次经过某个段或跳过某些段，称非线性流水。
入
1
+
2
+
3
+
4
出
图：非线性流水线
6.其它类型
可大量采用，用硬件来实现复杂的多维流水线，同时设多个方向脉动地向前推进，以进一步提高流水的并行处理能力
m
△ α i· t i)
i =1
α i[ Δt i (n 1)Δt j]
i 1
m
对于复杂的非线性流水线，吞吐率和效率需要通过画实际的时空图才能用下面两个式子求得：
▲
TP=
任务数n
从开始流入到n个任务全部流出的时间T
η=
N个任务的总的加权时空区 m 个段的总的加权时空区
如果线性流水线各段经过的 tc不等，其中瓶颈的时间为 tj，则完成几个任务所能达到的实际吞吐率
和恢复。
不精确断点法-----不论指令i在流水线的哪一段
发生了中断，都不再允许尚未进入流水线的后续指令再进入，但将已进入的指令执行完，转入中断处理。
η1= η2=… ηm=
n△t0 T
=
n =η0 m+n-1
●整个流水线的效率为η=
η1+η2+…+ηm m
= m.n△t0 m.T
=η0
▲
若各段经过时间均相同的线性流水，其效率与吞吐率是成正比的，即: η=TP·△t0 n>>m时，η才趋近于1
▲如果流水线各段经过的时间不等，各段的效率就会不等。
（4）加快短循环程序的处理
将长度小于指缓容量的短循环放入指缓内，减少访主存重复取指令次数。
由于循环分支概率高，让循环出口端的条转指令恒猜循环分支，减少断流。
2.5 流水机器的中断处理
中断会引起流水线断流，但其出现的概率比条件转移引起的断流概率要低得多，且又是随机发生的。所以，流水线机器处理中断主要是如何处理好断点现场的保存
4.按处理的数据类型分类
5.按流水线的结构分类 6.其它类型
1、按流水处理的级别分类
部件级流水: 指构成部件内的各个子部件之间的流水
处理机级流水: 指构成处理机的各个部件之间的流水系统级流水: 指构成计算机系统的多个处理机之间的流水
处理机1
处理机2
处理机n
数据集
图：处理机的流水处理系统级流水----宏流水
动态流水线----各功能段在同一时间内可按不同运算或功能联接
目前，高性能流水处理机大多都采用多功能静态流水
静态多功能流水线时-空图
空间（段号）
浮加
定乘
8 7 6 5 4 3 2 1 1 1 2 1 2 3 1 2 3 4 1 2 3
1
2
3
4
… …
n-1 n
一一二一二三
2 3 4
3 4
从C中取操作值
流水线中的先写后读相关
取指K＋1 分析K＋1 执行K＋1
若：C是主存地址——K和K+1条指令间发生了主存操作数相关
C是通用寄存器号——K和K+1条间发生通用寄存器组的数相关 C是变地址寄存器号——K和K+1条间发生通用寄存器的变址值相关若：第K＋1条中放的是条指令，而K＋1条指令的代码要等第K条指令执行结束后才能形成，则称K和K＋1条指令间发生了指令相关。
TP n/[ Δt i (n 1) t j ]
i 1
m
加速比为:
SP=( n
i 1
Δt i
m
)/ [
Δt
i 1
m
i
(n 1)Δt j ]
2.效率效率（利用率）：是指流水线中，设备实际被使用的时间占整个运行时间的比率。
如果是线性流水，且各段经过的时间相等，则在 T时间内，流水线各段效率都相同，均为 η0，即：
m-1 n )
TPmax
m-1 1+ n
若用加速比(speed up Ratio, Sp)表示流水线方式相对非流水顺序串行方式，速度提高的比值，则其:
Sp=
n.m .Δt0 m .Δt0+(n-1). Δt0
=
m
m-1 1+ n
一般机器手册中提供的吞吐率都是最大吞吐率
如果线性流水线各段经过的时间Δt不等,则完成n个任务所能达到的实际吞吐率为：
4
… … n-1 n
n-1 n
… …
n-1 n
… …
4 … … n-1 n … … n-1 n
一二
三
四
动态多功能流水线时-空图
空间（段号）
浮加
定乘
8 7 6 5 4 3 2 1 1 1 2 1 2 3 1
1
2ቤተ መጻሕፍቲ ባይዱ
3
4
… …
n-1 n
一二一二三三四
三四五
四五六
一二 2 3 4 … … n-1 n 一二三 n-1 n
1.猜测法
I+1 i-2 I-1 i P P+1 P+2 P+3 P+4 I+2 I+3 I+4 I+5
转移概率可以静态地根据转移指令类型或程序执行期间转移的历史状况来预测．但需事先对大量程序的转移类型和转移概率进行统计，且统计所得的概率值一般不好改动，难以得高的猜测准确度．还可采取动态策略,由编译程序根据执行时转移的历史记录来预测,准确度90%左右.