计算机系统结构6

合集下载

自考《计算机系统结构》问答题总结（6）

第六章 1、试分析阵列处理机特点（1）阵列处理机提⾼速度是利⽤资源重复，利⽤并⾏性中的同时性；（2）处理单元同等地担负起各种运算，其设备利⽤率可能不那么⾼；（3）速度提⾼在硬件价格⼤幅度下降情况下，潜⼒巨⼤；（4）互连络对系统性能影响显著；（5）互连络使阵列处理机⽐固定结构的单功能流⽔线灵活；（6）阵列处理机结构和所采⽤并⾏算法紧密联系；（7）阵列处理机还必须提⾼标量处理速度。

总之，阵列处理机实质上是专门对付数组运算的处理单元阵列组成的处理机、专门从事处理单元阵列控制及标量处理的处理机和专门从事输⼊输出及操作系统管理的处理机组成的⼀个异构型多处理机系统。

2、试⽐较阵列机的两种基本形式（1）分布式存储器阵列机。

a、各处理单元PE有局部存储器，被分布数据只能被本处理单元直接访问。

b、在控制部件CU内有主存储器。

运⾏时所有指令都在CU中，只把适合并⾏处理的“向量类”指令播给各PE，并控制各PE并⾏执⾏。

c、各PE可通过互连ICN交换数据。

d、PE通过CU连到管理处理机SC上，⽤于管理系统资源。

（2）集中式共享存储器阵列机。

a、K个存储体集中组成，经互连络为全部N个处理单元共享。

其中K等于数据处理单元数。

b、互连⽤于处理单元与存储分体之间进⾏转接构成数据通路。

3、试⽐较多级互连的⼏种络 ATRAN——拓扑结构：第I级交换单元处于交换⽅式时，实现Cubei；控制⽅式：级控制分级控制；交换单元：⼆功能交换单元。

间接⼆进制N⽅体——拓扑结构：第I级交换单元处于交换⽅式时，实现Cubei；控制⽅式：单元控制；交换单元：⼆功能交换单元。

多级混洗omega——拓扑结构：每⼀级有⼀个全混拓扑和⼀列四功能交换单元；控制⽅式：单元控制；交换单元：四功能交换单元。

多级PM2I——拓扑结构：每级按PM2I连接；控制⽅式：级控制或单元控制；交换单元：⼆功能交换单元。

全排列Benes——拓扑结构：三维⽴⽅体多级络与它的逆络连在⼀起，省去中间重复⼀级；控制⽅式：单元控制；交换单元：⼆功能交换单元。

计算机体系结构第6章答案

计算机体系结构第6章答案一填空题六、输入输出系统（28空）1、连接特性I/O系统容量2、响应时间吞量3、寻道时间旋转时间4、传输时间控制器开销5、从盘面到缓冲存储器从缓冲存储器到主机6、面密度7、提高转速提高记录密度8、可用性可信性9、可用性可信性可靠性10、容量大可靠性高11、RAID1 RAID212、同步异步13、通用串行总线14、必须独占使用15、周边元件扩展接口廉价磁盘冗余阵列六、输入输出系统（10个）6.1 引言6.2 外部存储设备6.3 可靠性、可用性和可信性1、系统可靠性：系统可靠性是指系统从初始状态开始一直提供服务的能力,可靠性通常用平均无故障时间(MTTF)来衡量。

2、系统可用性：系统可用性是指系统正常工作时间在连续两次正常服务间隔时间中所占的比率。

3、系统可信性：系统的可信性是指服务的质量，即在多大程度上可以合理的认为服务是可靠的。

可信性是不可以度量的。

4、故障容忍技术：通过冗余措施，虽然可能出现故障，但是可以通过冗余信息保证服务仍然能够正常进行。

6.4 廉价磁盘冗余陈列RAID5、RAID：即廉价磁盘冗余陈列，通过在磁盘阵列中增加冗余信息来容错，提高磁盘阵列的可靠性。

当单个磁盘失效时，丢失的信息可以通过冗余盘中的信息重新构建。

6、RAID1：亦称镜像盘，使用双备份磁盘。

每当数据写入一个磁盘时，将该数据也写到另一个冗余盘，这样形成信息的两份复制品。

如果一个磁盘失效，系统可以到镜像盘中获得所需要的信息。

镜像是最昂贵的解决方法。

特点是系统可靠性很高，但效率很低。

6.5 I/O设备与CPU和存储器的连接7、PCI：Peripheral Component Interconnect，即外围器件互连，是一种为CPU和外设之间提供高性能数据通道的总线。

8、I/O层次结构：即I/O系统的四级层次结构，在一台大型计算机系统中可以有多个通道，一个通道可以连接多个设备控制器，而一个设备控制器又可以管理一台或多台外围设备。

计算机系统结构简介

计算机系统结构简介计算机系统结构是指计算机硬件与软件的组织和设计方式，它是计算机系统功能实现和性能提升的基础。

本文将介绍计算机系统结构的主要组成部分以及它们之间的相互关系。

一、中央处理器（Central Processing Unit, CPU）中央处理器是计算机系统的核心组成部分，它负责执行计算机指令、控制和处理数据。

CPU包括算术逻辑单元（Arithmetic Logic Unit, ALU）和控制单元（Control Unit, CU），其中ALU负责进行算术和逻辑运算，CU则负责指令的解码和执行。

二、存储器（Memory）存储器用于存储计算机程序和数据，它分为主存储器（Main Memory）和辅助存储器（Auxiliary Storage）。

主存储器是CPU能够直接访问的存储空间，常用的主存储器包括随机存取存储器（Random Access Memory, RAM）和只读存储器（Read-Only Memory, ROM）等。

辅助存储器则用于扩展主存储器的容量，如硬盘、光盘等。

三、输入输出设备（Input-Output Devices）输入输出设备用于与计算机系统进行交互，它可以将外部设备的数据输入到计算机系统中，或者将计算机系统的数据输出到外部设备中。

常见的输入输出设备包括键盘、鼠标、显示器、打印机等。

四、总线（Bus）总线是计算机系统中不同组件之间传送数据和控制信息的通道，它分为地址总线、数据总线和控制总线。

地址总线用于指示数据在存储器中的位置，数据总线用于传输数据，控制总线用于传送控制信号。

五、操作系统（Operating System）操作系统是计算机系统的核心软件，它负责管理计算机系统的资源、控制程序的执行、提供用户接口等功能。

常见的操作系统有Windows、Linux、macOS等。

六、指令系统（Instruction Set）指令系统是计算机系统中的一组机器指令，它规定了CPU能够执行的操作和数据的表示方式。

计算机系统结构概述

计算机系统组成
硬件系统
包括运算器、控制器、存储器、输入设备和输出设备五个基本部分，以及连接这些部分的总线。
软件系统
包括系统软件和应用软件两大类，系统软件是控制和协调计算机及外部设备，支持应用软件开发和运行的系统，主要功能是调度，监控和维护计算机系统；负责管理计算机系统中各种独立的硬件，使得它们可以协调工作。应用软件是为了某种特定的用途而被开发的软件，它可以是一个特定的程序，也可以是一组功能联系紧密，可以互相协作的程序的集合，也可以是一个由众多独立程序组成的庞大的软件系统。
这一级别提供高级程序设计语言，如C、C、 Java等，程序员使用高级语言编写程序，然后经过编译或解释得到机器语言程序或字节码程序。
02
指令系统
指令格式
操作码
指定指令要执行的操作类型，如加法、减法、乘法等。
操作数地址
指定参与运算的操作数所在的位置，可以是寄存器、内存地址等。
指令长度
指令所占用的位数，与计算机的字长有关。
计算机系统结构概述
目录
• 计算机系统基本概念 • 指令系统 • 存储器层次结构 • 中央处理器 • 输入输出系统 • 并行处理技术
01
计算机系统基本概念
计算机系统定义
计算机系统是一种能够按照事先存储的程序，自动、高速地进行大量数值计算和各种信息处理的现代化智能电子机器。
计算机系统由硬件系统和软件系统两大部分组成，两者相互依存、缺一不可，共同构成一个完整的计算机系统。
降低能耗
多核处理器可以通过动态调整内核的工作状态来降低能耗。
提高可靠性
多核处理器可以通过冗余设计来提高系统的可靠性。
分布式内存并行计算

计算机系统结构(ch-6)

处理器的基本组成
运算器
控制器
执行算术和逻辑运算操作的部件，是处理器的核心部分。
控制处理器执行指令的部件，负责指令的读取、译码和执行。
寄存器
指令缓存
用于存储处理器内部数据和状态的部件，包括指令寄存器、操作数寄存器和状态寄存器等。
存储指令的部件，用于提高指令的访问速度。
指令系统结构
指令格式寻址方式
操作系统
是计算机系统的核心软件，负责管理计算机的硬件和软件资源。
计算机系统的层次结构
硬件层
包括计算机的物理组件，如中央处理器、存储器和输入输出设备等。
操作系统层
是计算机系统的核心软件，负责管理计算机的硬件和软件资源。
应用软件层
包括各种应用程序，如办公软件、图像处理软件等。
计算机系统的性能指标
03 存储器系统结构
存储器的基本组成
存储器的基本组成包括存储单元阵列、地址寄存器、数据寄存器、读写控制逻辑等。
存储单元阵列用于存储二进制数据，每个存储单元都有一个唯一的地址，可以通过地址寄存器进行访问。
数据寄存器用于暂存读/写操作的数据，读写控制逻辑用于实现数据的读/写操作。
主存储器
主存储器是计算机系统中最重要的存储器之一，用于存储程序和数据。
高速缓存的容量和速度直接影响计算机的性能。
辅助存储器
01
辅助存储器是计算机系统中用于长期存储大量数据的设备。
02
常见的辅助存储器包括硬盘、固态硬盘、磁带等。
03
辅助存储器的容量大、价格低，但访问速度较慢。
04 I/O系统结构
I/O设备分类
输入设备
如键盘、鼠标、触摸屏、扫描仪等，用于向计算机输入数据和命令。

计算机系统结构知识点汇总

计算机系统结构知识点汇总计算机系统结构是一门研究计算机硬件与软件之间关系的学科，它涵盖了从处理器设计到存储系统，再到输入输出设备等多个方面。

以下是对计算机系统结构中一些重要知识点的汇总。

一、指令系统指令系统是计算机硬件能够执行的操作的集合。

它规定了计算机能够执行的指令格式、操作码和操作数的编码方式等。

指令的长度、寻址方式以及指令的类型（如数据传输指令、算术逻辑运算指令、控制转移指令等）都会对计算机的性能产生影响。

例如，精简指令集计算机（RISC）通常具有较少但简单、规整的指令，而复杂指令集计算机（CISC）则拥有更多复杂的指令。

RISC 处理器通过简化指令集来提高指令执行的效率，而 CISC 处理器则试图通过提供丰富的指令来减少编程的复杂性。

二、处理器结构处理器是计算机的核心部件，其结构包括数据通路和控制单元。

数据通路负责处理数据的运算和传输，而控制单元则根据指令来控制数据通路的操作。

流水线技术是提高处理器性能的重要手段之一。

通过将指令的执行过程分为多个阶段，并在不同的阶段同时处理不同的指令，可以大大提高指令的执行速度。

但流水线也会带来诸如冒险（如数据冒险、控制冒险）等问题，需要通过适当的方法（如前递、延迟槽等）来解决。

超标量和超流水线技术则进一步提升了处理器的性能。

超标量处理器在一个时钟周期内可以同时发射多条指令，而超流水线处理器则将流水线的级数进一步增加，以提高时钟频率。

三、存储系统存储系统包括高速缓存（Cache）、主存和辅存。

高速缓存是位于处理器和主存之间的小而快的存储器，用于减少处理器访问主存的时间。

Cache 的命中率对系统性能至关重要，而影响命中率的因素包括Cache 的容量、块大小和替换策略等。

主存通常采用动态随机存储器（DRAM），其速度比Cache慢，但容量较大。

为了提高主存的访问速度，可以采用多体交叉存储技术。

辅存如硬盘、光盘等用于长期存储大量数据，其特点是容量大但速度慢。

计算机系统结构第六章自考练习题答案

2计算机系统结构自考复习资料
5.阵列处理机是（单）指令流（多）数据流的计算机。 6.ILLIAC IV 8×8 的阵列中，任意两个处理单元之间通信的最大距离不会超过（步。推广到一般， n × n 的阵列中，则为（
n -1
7 ）
）步。） ,Shuffle(Shuffle
7.8 个节点混洗网络，其混洗函数为 Shuffle P 2 P1 P 0 ）（ P1 P 0 P 2 （＝（ P 2 P1 P 0 ）) ＝（ P 0 P 2 P1 ）。
N /2
）。
不同的多级互连网络，在所用的（交换开关）、拓扑结构和（控制方式）上各有不同。 4. 阵列处理机按存储器的组织方式不同，分为两种不同的基本构形，一种是采用（分布）存储器的阵列处理机构形，另一种是具有（集中）共享存储器的阵列处理机构形。 5. 简述去安排列网络的概念及实现全排列网络的两种方法。（P174-175） 6.
（参考 P176-177）
同步强化练习
一．单项选择题。
1. 2. （ 3. 4. 多级混洗交换网络又称为（ B ）。 A.移数网络 B.Omega C.STARAN 网络 D.数据交换网络存储器分体数 m 为质数时，访问一维数组的元素无冲突，要求数组变址的跳距为 A ）。 A.与 m 互质 B.是 m 的倍数 C.与 m 不等 D.与 m 相等 ILLIAC IV 是一种（ C ）。 A.流水线处理机 B.指令重叠处理机 C.阵列处理机 D.多处理机 N 个结点的单级立方体网络，互连函数种数为（ B ）。 A.N 5. B. log
计算机系统结构自考复习资料
第六章阵列处理机历年真题精选
1. 拓扑结构用多级立方体网络，二功能交换单元，级控制方式，这种网络称为（ B ）。 A. Omega 网络 B. 交换网络 C. 间接二进制 n 方体网络 D. 数据变换网络 2．N 个结点的 PM2I 单级网络的最短距离是（ 3. log 2

计算机系统结构考点总结

计算机系统结构考点总结计算机系统结构是计算机科学与技术领域的重要分支，涉及计算机硬件和软件的组成及其相互关系。

为了帮助大家更好地掌握这一领域的核心知识，本文将针对计算机系统结构的考点进行详细总结。

一、计算机系统结构基本概念1.计算机系统结构的定义及发展历程2.计算机系统结构的分类：冯·诺伊曼结构、哈佛结构、堆栈式结构等3.计算机系统性能指标：指令周期、CPU时钟周期、主频、缓存命中率等二、中央处理器（CPU）1.CPU的组成：算术逻辑单元（ALU）、控制单元（CU）、寄存器组等2.指令集架构：复杂指令集计算机（CISC）、精简指令集计算机（RISC）3.CPU缓存：一级缓存、二级缓存、三级缓存及其工作原理4.多核处理器：核数、并行计算、线程级并行等三、存储系统1.存储器层次结构：寄存器、缓存、主存储器、辅助存储器等2.主存储器：DRAM、SRAM、ROM等3.磁盘存储器：硬盘、固态硬盘、光盘等4.存储器管理：分页、分段、虚拟存储器等四、输入输出系统1.I/O接口：并行接口、串行接口、USB、PCI等2.I/O设备：键盘、鼠标、显示器、打印机等3.I/O控制方式：程序控制、中断、直接内存访问（DMA）等4.I/O调度策略：先来先服务（FCFS）、最短作业优先（SJF）、扫描算法等五、总线与通信1.总线分类：内部总线、系统总线、I/O总线等2.总线标准：ISA、PCI、PCI Express等3.通信协议：TCP/IP、UDP、串行通信等4.网络拓扑结构：星型、总线型、环型、网状等六、并行计算与分布式系统1.并行计算：向量机、SIMD、MIMD等2.分布式系统：分布式计算、分布式存储、负载均衡等3.并行与分布式编程：OpenMP、MPI、MapReduce等4.并行与分布式算法：排序、搜索、分布式锁等通过以上考点的总结，相信大家对计算机系统结构有了更加全面和深入的了解。

操作系统的组成部分

操作系统的组成部分
现今，一个操作系统有六个组成部分：１、进程管理２、存储管理３、设备管理４、文件管理５、程序接口６、用户界面
LOGO
一、进程管理
LOGO
进程是操作系统中的最重要的概念，是系统资源的分配单位。
各进程间的关系是否从属等等
二、存储管理
存储管理的功能有以下几点：
LOGO
这种思想是：尽可能的将更多的东西从操作系统中去掉，只留下一个很小的内核。依据这种思想，文件管理、设备管理的高层、甚至存储管理的一些部分、都从内核中被“踢”了出去。留下的是一个非常纯粹的操作系统，一个最精简的内核。
也有人反对这种思想，其中最著名的人是： Linus Torvalds 他对这种思想最让人受不了的微词是：微内核是一个自欺欺人的方案，目的是获取更多的研究经费。
四、文件管理
LOGO
程序和数据等软件信息，在操作系统中以文件的形式在外存储器中长期保存。文件管理将处理有关文件的所有事务，结构、命名、存取、保护等。
补充知识
传统的操作系统将：进程、存储、设备、文件这四大部分看作系统的内核，这四大部分组成的系统是纯粹的操作系统。而广义的操作系统则包括很多运行在内核之上的相关软件如外壳、编辑器和其它附件。８０年代以后操作系统研究邻域出现了“微内核”（Microkernel）的思想，并成为了一研究趋势，当然，这些研究者认为这将是以后的发展趋势。
五、程序接口
LOGO
提供一组指令或函数等形式的调用方式，使用户程序和其它系统程序能够调用系统的服务例程、原语等。
如DOS下的INT N指令、Windows的API （application programming interface）等。

计算机系统结构的组成

计算机系统结构的组成
计算机系统结构通常包括以下几个主要组成部分：
1. 处理器：处理器是计算机的核心部分，负责执行程序中的指令。

它从内存中获取指令并执行，然后处理数据，并将结果存储回内存中。

处理器的能力决定了计算机的速度和性能。

2. 内存：内存是计算机的临时存储设备，用于存储正在处理的程序和数据。

内存分为随机存取存储器（RAM）和只读存储器（ROM）。

RAM可以随时读写，而ROM只能读取不能写入。

3. 输入/输出设备：输入/输出设备是计算机与外部世界交互的工具。

常见的输入设备包括键盘、鼠标、触摸屏等，常见的输出设备包括显示器、打印机、音响等。

4. 存储器：存储器是计算机的永久性存储设备，用于长期存储数据和程序。

常见的存储器包括硬盘、闪存盘、光盘等。

5. 总线：总线是计算机中各个部分之间传输数据的通道。

总线带宽决定了数据传输的速度，总线类型决定了计算机各个部分之间的连接方式。

6. 操作系统：操作系统是计算机的管理和控制软件，
负责管理计算机的资源，控制程序的执行，并提供用户界面。

操作系统是计算机的重要组成部分，它使得计算机更易于使用和管理。

7. 应用软件：应用软件是为特定目的而编写的程序，例如办公软件、图像处理软件等。

应用软件使计算机具有各种功能和用途。

以上这些部分共同构成了计算机系统结构的主要组成部分。

在实际应用中，根据不同的需求和用途，还可以对计算机系统结构进行更详细或更概括的分类。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

0
0 0 0 1 1 2 1 2 3
1
2 3 4
2
3 4 5
3
4 5 6
4
5 6 7
5
6 7 W3
6
7
7
RB5 RB5 RA7 RA7 W3
RB4 RB4 RA6 RA6 W2
RB3 RB3 RA5 RA5 W1 RB2 RB2 RA4 RA4 W0 RB1 RB1 RA3 RA3 RB0 RB0 RA2 RA2 RA1 RA1 RA0 RA0 RB7 RB7 RB6 RB6 W0 W1

三种执行方式比较： (1) 如果向量长度为N，三条指令采用串行方法执行的时间为： [(1+6+1)+N-1]+[(1+6+1)+N-1]+[(1+7+1)+N-1] = 3N+22 拍 (2) 如果前两条指令并行执行，第三条指令串行执行，则执行时间为： [(1+6+1)+N-1]+[(1+7+1)+N-1] = 2N+15 拍 (3) 如果采用链接技术，则执行时间为： (1+6+1)+(1+7+1)+(N-1)=17+N-1=N+16 拍

向量处理机系统结构的设计目标

较好地维持向量/标量性能平衡
向量平衡点（vector balance point)定义为：为了使向量硬件设备和标量硬件设备的利用率相等，一个程序中向量代码所占的百分比。例如：系统在向量模式下能够达到9Mflops，在标量模式下能够达到1Mflops的运算速度，假设代码的90%是向量运算，10%是标量运算，这样花在两种模式上的计算时间相等，那么向量平衡点为0.9。
存储器－存储器结构

下图说明一个具有8个存储体的向量处理机：
M
M
三条互相独立的数据通路，可并行工作，同一个存储模块同时只能为一个通路服务
A B 流水结构加法器 C=A+B
M
M
M
M
M
M

向量处理示例1：求C=A+B，设A、B、C的存储形式如图：
B[6] B[7] B[0] C[4] C[5] C[6] …… …… ……
V3 V1＋V2 V6 V4 +V5 (b)功能部件的预定
V3 V1＋V2 V0 V1＋V2 V6 V1*V5 V3 V1 + V5 (c) 操作数寄存器预定 (d)功能部件和操作数寄存器的预定 3、向量链接技术(chaining) 结果寄存器可能成为后继指令的操作数寄存器两条有数据相关的向量指令并行执行，这种技术称为两条流水线的链接技术。

什么是向量处理
例如：一个简单的C语言程序如下： for (i = 1; i <n; i++){ a[i] = b[i] +c[i] ; b[i] =2*a[ i+1] ; } 在标量处理机上用下述指令实现：
A、B、C分别是向量a、b、c在内存中的起始地址： INITIALIZE I=1 if (i>N ) GOTO 20 10 read b[I] 常量2，a,b,c中每 read c[I] 一个元素都称为一 add b[I]+c[I] 个标量。该指令序 store a[I]b[I]+c[I] 列称为标量指令序列，执行过程为标 read a[I+1] 量处理过程，每一 multiply 2*a[I+1] store b[I] 2*a[I+1] 条指令只处理一个或一对数据。 increment I I+1 goto 10 20 Stop
模块0 A[0] 模块1 A[1] 模块2 A[2]
模块3 A[3]
模块4 A[4]
B[1]
B[2] C[0]
C[7]
……
……
模块5 A[5]
模块6 模块7 A[6]
B[3]
B[4]
C[2]
C[3]
……
……
A[7]
B[5]
C[4]
……Leabharlann A、B、C在主存储器中的存放情况
流水段4 流水段3 流水段2 流水段1 M7 M6 M5 M4 M3 M2 M1 M0
几种超级计算机的向量性能和标量性能（了解）
向量性能标量性能向量平衡点机器型号 Mflops Mflops Cray IS 85.0 9.8 0.90 Cray 2S 151.5 11.2 0.93 Cray X-MP 143.3 13.1 0.92 Cray Y-MP 201.6 17.0 0.92 Hitachi S820 737.3 17.8 0.98 NEC SX2 424.2 9.5 0.98 Fujitsu VP400 207.1 6.6 0.97

向量处理机是解决数值计算问题的一种高性能计算机结构向量处理机一般都采用流水线结构，有多条流水线并行工作向量处理机通常属大型或巨型机，也可以用微机加一台向量协处理器组成一般向量计算机中包括有一台高性能标量处理机必须把要解决的问题转化为向量运算，向量处理机才能充分发挥作用
6.1 向量处理的基本概念

上述程序用向量化指令序列实现为： a[1:n]=b[1:n]+c[1:n] temp[1:n]=a[2:n+1] b[1:n]=2*temp[1:n] 将n个独立的数构成的整体称为向量，对这一组数的运算称为向量处理。一条向量处理指令可以处理n个或n对操作数。

向量处理方式
要根据向量运算的特点和向量处理机的类型选择向量的处理方式。有三种处理方式： 1．横向处理方式，又称为水平处理方式，横向加工方式等。向量计算是按行的方式从左至右横向地进行。 2．纵向处理方式，又称为垂直处理方式，纵向加工方式等。向量计算是按列的方式自上而下纵向地进行。 3．纵横处理方式，又称为分组处理方式，纵横向加工方式等。横向处理和纵向处理相结合的方式。以一个简单的C语言编写的程序为例，说明向量的三种处理方式的工作原理。 for (i = 1；i <= n；i++) y[i] = a[i] ×( b[i] + c[i] );
0
0 0 0 1 1 2 1 2 3
1
2 3 4
2
3 4 5
3
4 5 6
4
5 6 7
5
6 7
RA7 RA7 RB7 RB7
RA6 RA6 RB6 RB6
RA5 RA5 RB5 RB5 RA4 RA4 RB4 RB4 RA3 RA3 RB3 RB3 RA2 RA2 RB2 RB2 RA1 RA1 RB1 RB1 RA0 RA0 RB0 RB0 RA8 RA8 RA8 RA8 RA8 RB8 RA8 RA8 RB8 RB8 RA8 RA8 RB8 RB8 W0
0
1
2
3
4
5
6
7
8
9
10
11 12
存储器发生冲突时两个向量相加的时序图
寄存器-寄存器结构

把存储器-存储器结构中的缓冲栈改为向量寄存器，运算部件需要的操作数从向量寄存器中读取，运算的中间结果也写到向量寄存器中。向量寄存器与标量寄存器的主要差别是：一个向量寄存器能够保存一个向量，例如：64个64位寄存器。连续访问一个向量的各个分量。需要有标量寄存器和地址寄存器等。采用寄存器-寄存器结构的主要优点：降低主存储器的流量。例如：采用寄存器-寄存器结构的CRAY-1 与采用存储器-存储器结构的STAR-100比较，运算速度高3倍多，而主存流量低2.5倍。 STAR-100的主存储器流量： 32×8W/1.28us=200MW/S CRAY-1的主存储器流量： 4W/50ns=80MW/S

横向处理方式
也称为水平处理方式，横向加工方式等逐个分量进行处理：假设中间结果为T[I] 计算第1个分量： T[1] ＝B[1]＋C[1] Y[1] ＝A[1]×T[1] 计算第2个分量： T[2] ＝B[2]＋C[2] Y[2] ＝A[2]×T[2] …… 最后一个分量： T[N] ＝B[N]＋C[N] Y[N]＝A[N]×T[N] 存在两个问题：在计算向量的每个分量时，都发生写读数据相关。流水线效率低如果采用多功能流水线，必须频繁进行流水线切换横向处理方式对向量处理机不适合即使在标量处理机中，也经常通过编译器进行指令流调度。
6.2 向量处理机结构

向量处理机的基本思想是把两个向量的对应分量进行运算，产生一个结果向量。最关键问题是存储器系统能够满足运算部件带宽的要求。主要采用两种方法： 1. 存储器－存储器结构多个独立的存储器模块并行工作处理机结构简单，对存储系统的访问速度要求很高 2. 寄存器－寄存器结构运算通过向量寄存器进行需要大量高速寄存器，对存储系统访问速度的要求降低

8个向量寄存器 8×64×64 主存储器缓冲寄存器 64×64 缓冲寄存器 64×24 标量寄存器 8×64 地址寄存器 8×24
8MB
64个个体
12个流水线结构的运算部件
指令缓冲寄存器 256×16
CRAY-1向量处理机结构
6.3

提高向量处理机性能的办法
向量处理机系统结构的设计目标提高向量处理机性能的常用技术
W2
W6 W5 W4 W4 W5
0
1
2
3
4
5
6
7 8 9 10 时间（时钟周期）
11 12
两个向量在流水线方式下分量相加的时序图