流水线技术--向量处理机

计算机体系结构优化方法

计算机体系结构优化方法随着科技的不断发展和计算机应用范围的不断扩大，人们对于计算机性能的需求也越来越高。

计算机体系结构是计算机硬件与软件之间的桥梁，它的设计和优化对提高计算机性能至关重要。

本文将介绍几种常见的计算机体系结构优化方法。

一、流水线技术流水线技术是一种可以同时执行多个指令的技术，它能够充分利用计算机硬件资源，提高计算机的执行效率。

在流水线技术中，计算机的处理过程被划分为多个阶段，每个阶段执行不同的指令。

通过将多个指令交错执行，可以大幅度提高计算机的吞吐量。

同时，流水线技术还能降低处理器的时钟周期，提高计算机的工作频率。

二、超标量技术超标量技术是一种可以同时执行多条指令的技术，它可以通过在一个时钟周期内执行多个指令来提高计算机的执行效率。

在超标量技术中，计算机可以同时从指令流中提取多个指令并执行，而不是依次执行指令。

通过并行执行多条指令，超标量技术可以显著提高计算机的性能。

为了实现超标量执行，计算机需要有多个功能单元和多个寄存器，以支持多条指令的并行执行。

三、向量处理器技术向量处理器技术是一种可以同时处理多个数据元素的技术，它能够将一条指令应用于多个数据元素，从而提高计算机的处理速度。

在向量处理器技术中，计算机可以将多个数据元素存储在向量寄存器中，并通过单条指令同时对多个数据元素进行操作。

与传统的标量处理器相比，向量处理器可以在一个时钟周期内执行更多的计算操作，从而提高计算机的性能。

目前，向量处理器技术已经广泛用于科学计算、图形处理等领域。

四、并行计算技术并行计算技术是一种通过同时使用多个处理器来执行任务的技术，它能够显著提高计算机的计算速度。

在并行计算技术中，计算机可以将一个任务分解成多个子任务，并由多个处理器并行执行。

通过充分利用多个处理器的计算能力，计算机可以在更短的时间内完成任务。

并行计算技术在科学计算、数据分析等领域有着广泛的应用。

结论计算机体系结构优化方法的发展，不仅可以提高计算机的性能和效率，还可以推动计算机技术的发展和进步。

计算机体系结构之流水线工作原理与分类

如：多操作部件处理机、超标量处理机时间并行性：采用流水线技术
不增加或只增加少量硬件就能使运算速度提高几倍，如：流水线处理机、超流水线处理机
流水线工作原理
流水线的分类
线性流水线的性能分析
非线性流水线的调度技术
流水线工作原理
1、流水线锁存器流水线的每一个阶段称为流水步、流水步骤、流水段、流水线阶段、流水功能段、功能段、流水级、流水节拍等。
在每一个流水段的末尾或开头必须设置一个(多个)寄存器，
称为
流水寄存器、流水锁存器、流水闸门寄存器等。
流水锁存器会增加每条指令的执行时间，但采用流水线之
后整个程序的执行时间会缩短。
为了简化，在一般流水线中不画出流水锁存器。
输入
指令分析器分析 k+1
流水锁存器
△t1
指令执行部件执行 k
流水锁存器
Latency & throughput?
流水线技术
流水线技术在50年代后期被应用于处理器设计 IBM Stretch----first general-purpose pipelined
computer CDC 6600 use load/store design to achieve efficient
任
时间
务A
顺序B
C
D
°
洗4 个人的衣物，顺序操作需要 8 个小时
°
如果使用流水线作业, 将需要多少时间呢?
流水线作业
6 下午 7
8
9
10
11
12
时间
任
30 30 30 30 30 30 30
务A
顺
序
B
C
D

流水方式

1 2 3 4 5 6…
0
时间
动态流水线时空图
流水线的分类（续）
按数据表示
标量流水：没有向量数据，只能用标量循环方式来对向量、数组进行处理。
Amdahl 470V/6 IBM 360/91
向量流水：设置有向量指令和向量运算硬件，能对向量、数组中的各个元素流水地处理。
CRAY-1
器中，其延迟时间和功能切换所需的时间都可以忽略不计。
x
1
2
y
3
5
z
4
静态多功能流水线
空间
A*B=a1b1+ a2b2+ a3b3+ a4b4
举例1：
用一条4段浮点加法器流水线求8个浮点数的和： Z＝A＋B＋C＋D＋E＋F＋G＋H
解：Z = [(A+B) + (C+D)] + [(E+F) + (G+H)]
空间
规格化
1234 5 6
7
尾数加
1234 5 6
7
对阶 1 2 3 4 5 6
7
求阶差 1 2 3 4 5 6
7
时间
加数 A C E G A+B E+F
同，加权
m
n * [ i D t i ]
m
i1 m
i * [ D t i ( n 1 ) D t j ]
i1
i1
m
7 .当 i 1时，有： i 1
m
n * [ i D t i ]
m
i1
D ti (n 1)D t j
i 1
顺序流水线与乱序流水线：乱序流水线又称为无序流水线、错序流水线或异步流水线等

流水线技术--流水线的基本概念

虚拟存储器的特点
10／24
3.1 流水线的基本概念
(3) 各个功能段所需时间应尽量相等，否则，时间长的功能段将成为流水线的瓶颈，会造成流水线的 “堵塞”和“断流”。这个时间一般为一个时钟周期 (4) （拍）；流水线需要有“通过时间”（第一个任务流出结果所需的时间），在此之后流水过程才进入稳定工作状 (5) 态，每一个时钟周期（拍）流出一个结果；流水技术适合于大量重复的时序过程，只有输入端能连续地提供任务，流水线的效率才能充分发挥。
虚拟存储器的特点 11／24
3.1 流水线的基本概念
3.1.2 流水线的分类
流水线可以按不同的观点进行分类。
1．按功能的多少来分
◆ 单功能流水线：只能完成一种固定功能的
流水线。
◆ 多功能流水线：流水线的各段可以进行不同的
连接，从而实现不同的功能。
例如： TI ASC的多功能流水线
虚拟存储器的特点
并让它们分别用各自独立的部件来实现。理想情况：速度提高3倍
虚拟存储器的特点
6／24
3.1 流水线的基本概念
虚拟存储器的特点
7／24
3.1 流水线的基本概念
4. 时－空图时－空图从时间和空间两个方面描述了流水
线的工作过程。时－空图中，横坐标代表时间，
纵坐标代表流水线的各个段。
虚拟存储器的特点
◆ 线性流水线：流水线中的各段串行连接，没
有反馈回路。 ◆ 非线性流水线：流水线中的各段除有串行连接外，还有反馈回路。 (举例)
虚拟存储器的特点 21／24
3.1 流水线的基本概念
虚拟存储器的特点
22／24
◆ 流水线的调度问题
3.1 流水线的基本概念

体系结构的其他基础知识

3．4 体系结构其他基础知识3．4．1主要知识点了解掌握流水线技术、RISC计算机、并行处理技术、多处理机系统方面的基本知识。

3．4．1．1流水线技术流水线技术是通过并行硬件来提高系统性能的常用方法。

计算机流水线技术包括指令流水线和运算操作流水线。

计算机中一条指令的执行需要若干步，通常采用流水线技术来实现指令的执行，以提高CPU 性能。

流水线设计的基本思想其实很简单，任何一个可以分解的任务都可以用流水线来做，可以设置多个处理机构，分别执行相应的子任务。

为了提高流水线性能，有些处理时间长的步骤还需分解成更小的步骤，使流水线上所有步骤的处理时间相同。

实际上，流水线技术对性能的提高程度取决于其执行顺序中最慢的一步。

在实际情况中，流水线各个阶段可能会相互影响，阻塞流水线，使其性能下降。

阻塞主要由两种情形引起：执行转移指令和共享资源冲突。

指令流水线技术其实是把处理瓶颈从CPU子系统转移给了存储子系统。

在存储系统中也需要使用流水线技术的CPU系统的处理能力。

流水线计算机的存储器分成若干（4个）独立存储体，以支持流水线方式并发访问。

流水线计算机也使用了Cache，通常分为指令Cache和数据Cache，各自用于存放指令和操作数。

3．4．1．2RISC计算机的主要特点①指令数量少：RISC机优先选取使用频率最高的一些简单指令以及一些常用的指令，避免使用复杂指令。

②复杂的寻址方式少：RISC机通常支持寄存器寻址方式、立即数寻址方式以及相对寻址方式。

③指令长度固定，指令格式种类少：因为RISC指令数量少，格式也相对简单（与CISC比较）其指令长度固定，指令之间各字段的划分比较一致，所以其译码也相对容易。

④只提供了Load/Store指令访问存储器。

⑤以硬布线逻辑控制为主：RISC机为了提高操作的执行速度，通常采用硬布线逻辑（组合逻辑）来构建控制器。

而CISC机的指令系统很复杂，难以用组合逻辑电路来实现控制器，通常采用微程序控制。

计算机体系结构习题与答案

第二章习题（P69-70）一、复习题1．简述冯∙诺依曼原理，冯∙诺依曼结构计算机包含哪几部分部件，其结构以何部件为中心？答：冯∙诺依曼理论的要点包括：指令像数据那样存放在存储器中，并可以像数据那样进行处理；指令格式使用二进制机器码表示；用程序存储控制方式工作。

这3条合称冯∙诺依曼原理冯∙诺依曼计算机由五大部分组成：运算器、控制器、存储器、输入设备、输出设备，整个结构一般以运算器为中心，也可以以控制器为中心。

(P51-P54)2．简述计算机体系结构与组成、实现之间的关系。

答：计算机体系结构通常是指程序设计人员所见到的计算机系统的属性，是硬件子系统的结构概念及其功能特性。

计算机组成（computer organization）是依据计算机体系结构确定并且分配了硬件系统的概念结构和功能特性的基础上，设计计算机各部件的具体组成，它们之间的连接关系，实现机器指令级的各种功能和特性。

同时，为实现指令的控制功能，还需要设计相应的软件系统来构成一个完整的运算系统。

计算机实现，是计算机组成的物理实现, 就是把完成逻辑设计的计算机组成方案转换为真实的计算机。

计算机体系结构、计算机组成和计算机实现是三个不同的概念，各自有不同的含义，但是又有着密切的联系，而且随着时间和技术的进步，这些含意也会有所改变。

在某些情况下，有时也无须特意地去区分计算机体系结构和计算机组成的不同含义。

(P47-P48)3．根据指令系统结构划分，现代计算机包含哪两种主要的体系结构？答：根据指令系统结构划分，现代计算机主要包含：CISC和RISC两种结构。

(P55)4．简述RISC技术的特点？答：从指令系统结构上看，RISC 体系结构一般具有如下特点：(1) 精简指令系统。

可以通过对过去大量的机器语言程序进行指令使用频度的统计，来选取其中常用的基本指令，并根据对操作系统、高级语言和应用环境等的支持增设一些最常用的指令;(2) 减少指令系统可采用的寻址方式种类，一般限制在2或3种;(3) 在指令的功能、格式和编码设计上尽可能地简化和规整，让所有指令尽可能等长;(4) 单机器周期指令，即大多数的指令都可以在一个机器周期内完成，并且允许处理器在同一时间内执行一系列的指令。

计算机体系结构课后答案

计算机体系结构课后答案【篇一：计算机体系结构习题(含答案)】1、尾数用补码、小数表示，阶码用移码、整数表示，尾数字长p=6（不包括符号位），阶码字长q=6（不包括符号位），为数基值rm=16，阶码基值re=2。

对于规格化浮点数，用十进制表达式写出如下数据（对于前11项，还要写出16进值编码）。

（1）最大尾数（8）最小正数（2）最小正尾数（9）最大负数（3）最小尾数（10）最小负数（4）最大负尾数（11）浮点零（5）最大阶码（12）表数精度（6）最小阶码（13）表数效率（7）最大正数（14）能表示的规格化浮点数个数2．一台计算机系统要求浮点数的精度不低于10-7.2，表数范围正数不小于1038，且正、负数对称。

尾数用原码、纯小数表示，阶码用移码、整数表示。

(1) 设计这种浮点数的格式(2) 计算（1）所设计浮点数格式实际上能够表示的最大正数、最大负数、表数精度和表数效率。

3．某处理机要求浮点数在正数区的积累误差不大于2-p-1 ，其中，p是浮点数的尾数长度。

(1) 选择合适的舍入方法。

(2) 确定警戒位位数。

(3) 计算在正数区的误差范围。

4．假设有a和b两种不同类型的处理机，a处理机中的数据不带标志符，其指令字长和数据字长均为32位。

b处理机的数据带有标志符，每个数据的字长增加至36位，其中有4位是标志符，它的指令数由最多256条减少到不到64条。

如果每执行一条指令平均要访问两个操作数，每个存放在存储器中的操作数平均要被访问8次。

对于一个由1000条指令组成的程序，分别计算这个程序在a处理机和b处理机中所占用的存储空间大小（包括指令和数据），从中得到什么启发？5．一台模型机共有7条指令，各指令的使用频率分别为35%，25%，20%，10%，5%，3%和2%，有8个通用数据寄存器，2个变址寄存器。

(1) 要求操作码的平均长度最短，请设计操作码的编码，并计算所设计操作码的平均长度。

6．某处理机的指令字长为16位，有双地址指令、单地址指令和零地址指令3类，并假设每个地址字段的长度均为6位。

06 章流水线与超标量技术-1

20
济南大学信息科学与工程学院研究生课程
©2008 张玉璘
高
级
计
算
机
体
系
结
构
迫切循环可找出合法的循环有：（1 , 8 ) ( 3 ) ( 3 , 8 ) ( 1 , 8 , 6 , 8 ) ( 6 ) ( 3 , 6 , 3 ）
………
简单循环：每种状态只出现一次的等待时间循环（3) , ( 6 ) , ( 8 ) ( l , 8 ) ( 3 , 8 ）（6 , 8）
则τ=τm+d
即不考虑时钟错位。
6
济南大学信息科学与工程学院研究生课程
©2008 张玉璘
高
级
计
算
机
体
系
结
构
6．1．3
加速比、效率和吞吐率
在理想情况下：线性流水线：（k段）处理n个任务，需k+(n-1) 个时钟周期（k是第一个任务，每个时钟一个任务，其余n-1任务需要n-1个时钟）总的时间：Tk=[k+(n-1)] τ
等效的非流水线“流过延迟”为kτ， n个任务的时间T1=nkτ
加速因子一条k段流水线对一台等效的非流水线处理机的加速因子，定义: Sk=T1/Tk=[nkτ]/[kτ+(n-1) τ]=[nk]/[k+(n-1)] 加速因子与n任务数的关系。图6-2
7
济南大学信息科学与工程学院研究生课程
©2008 张玉璘
14
济南大学信息科学与工程学院研究生课程
©2008 张玉璘
高
级
计
算
机
体
系
结
构
预约表
在图6-3a所示的三段非线性流水线里，对 X的流水线求值过程可由图6-3b的预约表