并行计算机访存模型

合集下载

并行计算分布式计算网格高性能计算机资料收集

并行计算分布式计算网格高性能计算机资料收集并行计算是相对于串行计算来说的，所谓并行计算分为时间上的并行和空间上的并行。

时间上的并行就是指流水线技术，而空间上的并行则是指用多个处理器并发的执行计算。

并行计算科学中主要研究的是空间上的并行问题。

空间上的并行导致了两类并行机的产生，按照Flynn的说法分为：单指令流多数据流（S IMD）和多指令流多数据流（MIMD）。

我们常用的串行机也叫做单指令流单数据流（S ISD）。

MIMD类的机器又可分为以下常见的五类：并行向量处理机(PVP)对称多处理机(SMP)大规模并行处理机(MPP)工作站机群(COW)分布式共享存储处理机(DSM)。

[编辑]访存模型并行计算机有以下四种访存模型：均匀访存模型（UMA）非均匀访存模型（NUMA）全高速缓存访存模型（COMA）一致性高速缓存非均匀存储访问模型（CC-NUMA）和非远程存储访问模型（NORMA）。

从物理划分上，共享内存和分布式内存是两种基本的并行计算机存储方式，除此之外，分布式共享内存也是一种越来越重要的并行计算机存储方式。

存储问题在计算机中的地位越来越重要，现在计算机的性能在很大程度上决定于存储器，而且新型的计算机有可能采用以存储器为中心而不是传统的以处理器为中心。

共享内存的并行计算机在编程上相对简单，容易使用，但是它有一个重要的缺点就是扩展性较差，不可能有太多的处理器共用相同的存储器，这样由于一致性访问和读写冲突等问题会引起计算效率的降低。

对于分布式内存的并行计算机，其扩展性较好，增加更多的处理器引起的问题不会象共享内存一样突出，但是在这样的计算机上编写并行程序相对较难。

共享内存的并行计算机对于共享内存的并行计算机，各个处理单元通过对共享内存的访问来交换信息、协调各处理器对并行任务的处理。

对这种共享内存的编程，实现起来相对简单，但共享内存往往成为性能特别是扩展性的重要瓶颈。

分布式内存的并行计算机对于分布式内存的并行计算机，各个处理单元都拥有自己独立的局部存储器，由于不存在公共可用的存储单元，因此各个处理器之间通过消息传递来交换信息，协调和控制各个处理器的执行。

计算机发展过程中的三个模型

计算机发展过程中的三个模型
冯·诺伊曼模型是一种基于存储程序的计算机体系结构，由冯·诺伊曼在20世纪40年代提出。

它包括一个中央处理器（CPU）、存储器（内存）、输入输出设备和控制单元。

这种模型的特点是指
令和数据存储在同一存储器中，指令和数据可以通过地址访问，这
种模型成为了现代计算机体系结构的基础。

哈佛体系结构是另一种计算机体系结构模型，它与冯·诺伊曼
模型不同之处在于指令和数据存储在不同的存储器中。

哈佛体系结
构的特点是具有独立的指令存储器和数据存储器，这种模型能够提
高指令和数据的并行处理能力。

并行计算模型是一种计算机模型，它利用多个处理器同时执行
任务以提高计算性能。

这种模型包括多处理器系统、集群计算、分
布式计算等。

并行计算模型的发展使得计算机能够更快地处理大规
模数据和复杂计算任务，提高了计算机的整体性能。

并行计算模型的研究及其应用

并行计算模型的研究及其应用随着计算机技术和应用领域的不断发展，单机计算已经无法满足人们不断增长的需求。

为了提高计算效率和处理能力，人们开始研究并行计算模型。

并行计算是指同时执行多个计算任务，可以极大地提高处理速度和效率。

本文将探讨并行计算模型的研究及其应用。

一、并行计算模型并行计算模型是指在多个处理器之间分配任务并协调它们之间的数据交换和同步的模型。

常见的并行计算模型包括共享内存模型、分布式内存模型和混合内存模型等。

其中，共享内存模型是指多个处理器共享同一个内存空间，分布式内存模型是指每个处理器有自己的私有内存空间，不同处理器之间通过网络进行通信和数据交换，而混合内存模型是指既有共享内存模型又有分布式内存模型的特点。

在并行计算中，为了提高处理效率，需要对任务进行合理分配和调度。

常见的任务分配策略包括静态分配和动态分配。

静态分配是指将任务在执行之前预先分配给处理器，而动态分配则是根据任务数量和处理器负载情况动态地将任务进行分配和调度。

二、并行计算应用领域并行计算模型可以广泛应用于大规模的科学计算、数据处理和图像处理等领域。

以下是一些典型应用案例：1. 天气预报模拟天气预报模拟需要处理大量的气象数据和模拟计算，而这种计算需要高度并行的处理能力。

因此，采用并行计算模型可以很好地加速计算速度和提高计算效率。

2. 图像分析和处理图像处理通常需要大量的计算和数据存储能力，采用并行计算模型可以实现快速的图像处理和分析。

例如，通过并行计算可以在几秒钟内对数以千计的图像进行分析和识别。

3. 科学计算科学计算通常涉及到数据模拟和仿真，需要高度并行的处理能力。

采用并行计算模型可以大大提高科学计算的效率和精度，例如天文学、生物学、物理学等领域的科学计算。

4. 数据处理与分析现代社会中，数码化已经成为一种趋势，数据处理和分析也成为了一项重要的任务。

采用并行计算模型可以快速地分析和挖掘数据，从而实现高效的数据管理与应用。

三、并行计算的优势并行计算模型有以下几个优势：1. 更高的计算效率和处理能力并行计算可以同时执行多个计算任务，从而大大提高处理速度和效率。

面向大数据处理的并行计算模型及性能优化

面向大数据处理的并行计算模型及性能优化随着信息时代的发展，大数据已经成为了人民生产生活中的重要组成部分。

而对大数据进行高效处理和分析已经成为了一个紧迫的问题。

并行计算作为一种解决方案，广泛应用于大数据处理和分析的领域。

本文将讨论面向大数据处理的并行计算模型及其性能优化方法。

一、并行计算模型1. 传统的并行计算模型传统的并行计算模型主要有共享内存模型、分布式内存模型和混合模型。

- 共享内存模型：共享内存模型中，多个处理器通过共享内存交换数据，每个处理器可以同时访问和修改共享内存中的变量。

这种模型的优点是简单易懂，但缺点是并行度有限，不适用于大规模数据处理。

- 分布式内存模型：分布式内存模型中，多个处理器通过消息传递的方式交换数据。

每个处理器有自己的本地内存，并且需要通过消息传递来实现数据的共享或同步。

这种模型的优点是适用于大规模数据处理，但缺点是编程复杂度高。

- 混合模型：混合模型是共享内存模型和分布式内存模型的结合。

多个共享内存模型的计算节点组成一个分布式内存模型的集群。

这种模型既考虑了共享内存模型的便利性，又兼顾了分布式内存模型的灵活性。

2. 新兴的并行计算模型新兴的并行计算模型主要有MapReduce、Spark和MPI。

- MapReduce模型：MapReduce模型是Google提出的一种分布式计算模型。

它将大数据分解为不同的部分，在各个计算节点上并行地执行计算，并将结果进行合并。

MapReduce模型适用于大规模数据的批处理，但不适用于实时计算。

- Spark模型：Spark是一种基于内存的分布式计算框架，具有较高的计算速度。

Spark模型中，数据以弹性分布式数据集（RDD）的形式存储，可以在内存中进行迭代计算。

Spark模型适用于大规模数据的实时计算和迭代计算。

- MPI模型：MPI（Message Passing Interface）模型是一种用于并行计算的标准接口。

它允许不同计算节点进行消息传递，实现数据共享和同步。

计算机体系结构中的并行计算模型

计算机体系结构中的并行计算模型计算机体系结构中的并行计算模型是指通过多个处理单元同时协同工作来完成任务的一种计算方式。

在传统的串行计算模型中，任务是按照顺序执行的，每个任务的执行都需要等待上一个任务的完成。

而在并行计算模型中，多个任务可以并发执行，从而提高计算效率和性能。

并行计算模型可以分为两种主要类型：共享内存模型和分布式内存模型。

一、共享内存模型（Shared Memory Model）共享内存模型是指多个处理单元共享同一块内存空间，每个处理单元可以直接访问内存中的数据。

常见的共享内存模型有多线程模型和多进程模型。

1. 多线程模型多线程模型是指在同一进程内创建多个线程，这些线程可以共享进程的内存空间。

每个线程可以独立执行不同的任务，通过共享内存进行通信和同步。

多线程模型具有资源共享方便、通信速度快的优点，但也需要考虑线程间的同步和数据一致性问题。

2. 多进程模型多进程模型是指创建多个独立的进程来执行不同的任务。

每个进程拥有独立的内存空间，通过进程间通信机制（如管道、消息队列、共享内存等）进行数据交换和同步。

多进程模型具有独立性强、容错性好的优点，但也存在进程切换开销大、通信复杂等问题。

二、分布式内存模型（Distributed Memory Model）分布式内存模型是指多个处理单元通过网络连接，每个处理单元拥有独立的内存空间，彼此之间没有直接访问对方内存的权限。

常见的分布式内存模型有消息传递模型和数据并行模型。

1. 消息传递模型消息传递模型是指通过发送消息来进行处理单元之间的通信。

每个处理单元在执行任务的过程中，需要向其他处理单元发送消息来获取所需的数据或者完成协同计算。

消息传递模型具有灵活性高、可扩展性好的优点，但也需要解决消息传递的开销和同步问题。

2. 数据并行模型数据并行模型是指将任务按照数据划分的方式进行并行计算。

每个处理单元负责处理一部分数据，计算结果再进行合并。

数据并行模型适用于处理大规模数据和需要迭代计算的任务。

并行计算机系统结构

并⾏计算机系统结构
并⾏计算机系统结构
1. 并⾏计算机结构模型
1. 单指令流多数据流机SIMD(Single Instruction Multiple Data)；
2. 并⾏向量计算机PVP(Parallel Vector Processor)；
3. 对称多处理机SMP(Symmetric MultiProcessor)；
4. ⼤规模并⾏处理机MPP(Massively Parallel Processor)；
5. 分布式共享存储DSM(Distributed Shared Memory)
6. 多处理机和⼯作站机群COW(Cluster Of Workstation)（现在常称之为机群）。

1. 并⾏计算机访存模型
1. UMA（Uniform Memory Access）模型是均匀存储访问模型的简称。

2. NUMA(Nonuniform Memory Access)模型是⾮均匀存储访问模型的简称。

3. COMA(Cache-Only Memory Access)模型是全⾼速缓存存储访问的简称。

4. CC-NUMA（Coherent-Cache Nonuniform Memory Access）模型是⾼速缓存⼀致性⾮均匀存储访问模型的简称。

5. NORMA（No-Remote Memory Access）模型是⾮远程存储访问模型的简称。

02_2并行计算机(系统结构)

P
M
P M
P M
...
P M
2019/2/23
23
构建并行机系统的不同存储结构
PVP (Cray
中央存储器 T90)
UMA SMP SGI
多处理机（单地址空间共享存储器） (Intel SHV,SunFire,DEC 8400, PowerChallenge,IBMR60,etc.) (KSR-1,DDM) (Stanford Dash, SGI Origin 2000,Sequent NUMA-Q, HP/Convex Exemplar) (Cray T3E)
2019/2/23 10
MPP（Massively Parallel Processor）

处理节点采用微处理器系统中有物理上的分布式存储器采用高通信带宽和低延迟的互连网络（专门设计和定制的）能扩展至成百上千乃至上万个处理器异步MIMD，构成程序的多个进程有自己的地址空间，进程间通信消息传递相互作用
16
Origin3000 与 Altix3000
Origin3000
2019/2/23
Altix3000
17
并行计算机内存访问模型

UMA / NUMA / COMA / CC-NUMA / NORMA
2019/2/23
18
并行计算机访存模型（1）

UMA（Uniform Memory Access）模型是均匀存储访问模型的简称。其特点是：
节点1 P / C 节点N M e m P / C
… P/C
交叉开关总线或
…
I / O
…P/C
开关总线或交叉

并行计算

+ + + +
为利用并行计算，通常计算问题表现为以下特征：（1）将工作分离成离散部分，有助于同时解决；（2）随时并及时地执行多个程序指令；（3）多计算资源下解决问题的耗时要少于单个计算资源下的耗时。 + 并行计算是相对于串行计算来说的，所谓并行计算分为时间上的并行和空间上的并行。时间上的并行就是指流水线技术，而空间上的并行则是指用多个处理器并发的执行计算。
+ 并行计算机有以下五种访存模型：
+ 均匀访存模型（UMA）
+ 非均匀访存模型（NUMA）
+ 全高速缓存访存模型（COMA）
+ 一致性高速缓存非均匀存储访问模型（CC-
NUMA） + 非远程存储访问模型（NORMA）。
不像串行计算机那样，全世界基本上都在使用冯· 诺伊曼的计算模型；并行计算机没有一个统一的计算模型。不过，人们已经提出了几种有价值的参考模型：PRAM模型，BSP模型，LogP模型，C^3模型等。
+ 并行计算机是靠网络将各个处理机或处理
器连接起来的，一般来说有以下几种方式：处理单元间有着固定连接的一类网络，在程序执行期间，这种点到点的链接保持不变；典型的静态网络有一维线性阵列、二维网孔、树连接、超立方网络、立方环、洗牌交换网、蝶形网络等。静态连接
+ 节点度:射入或射出一个节点的边数。在单
ቤተ መጻሕፍቲ ባይዱ
向网络中，入射和出射边之和称为节点度。 + 网络直径:网络中任何两个节点之间的最长距离，即最大路径数。 + 对剖宽度:对分网络各半所必须移去的最少边数。 + 对剖带宽:每秒钟内，在最小的对剖平面上通过所有连线的最大信息位（或字节)。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

并行计算机体系结构讲义I、引入：一、计算机系统结构的分类（从计算机系统结构的并行性能出发）弗林（Flynn）分类法1966年M.J.Flynn按照指令流和数据流（所谓指令流是计算机在计算过程中执行的一串指令；而数据流是指令执行过程中的一串数据。

）的不同组织方式，把计算机系统的结构分为以下4类：1. 单指令流，单数据流(SISD)——这就是一个单处理器。

2.单指令流，多数据流(SIMD)——同一指令由多个处理器执行，这些处理器使用不同数据流，有各自的数据内存，但共享一个指令内存和控制处理器（负责存取和发送指令）。

处理器通常是专用的，不要求通用性。

3. 多指令流，单数据流(MISD)——4. 多指令流，多数据流(MIMD)——每个处理器存取自己的指令，操作自己的数据。

处理器通常就采用普通的微处理器。

这是一个粗略的模型分类，许多机器是这些类型的混合体。

SISD是传统的顺序处理计算机。

SIMD以阵列处理机为代表。

MISD在实际中代表何种计算机，存在着不同的看法。

MIMD 的代表是多处理机。

二、并行性技术一个理想的计算机系统结构应在处理速度、存储容量和I/O吞吐能力三者之间取得平衡。

而并行性技术是实现这种平衡的主要手段。

并行性技术包括时间并行、空间并行、时间并行+空间并行、资源共享4种方法。

也就是说, 计算机系统中提高并行性的措施就其基本思想而言，可归纳如下4条途径：(1) 时间重叠：即多个处理过程在时间上相互错开，轮流重叠地使用同一套硬件设备的各个部分，以加快硬件周转时间而赢得速度。

因此时间重叠可称为时间并行技术。

(2) 资源重复：在并行性概念中引入空间因素，以数量取胜的原则，通过重复设置硬件资源，大幅度提高计算机系统的性能。

随着硬件价格的降低，这种方式在单处理机中广泛使用，而多处理机本身就是实施“资源重复”原理的结果。

因此资源重复可称为空间并行技术。

(3) 时间重叠+资源重复：在计算机系统中同时运用时间并行和空间并行技术，这种方式在计算机系统中得到广泛使用，成为并行性主流技术。

(4) 资源共享：这是一种软件方法，它使多个任务按一定时间顺序轮流使用同一套硬件设备。

例如多道程序、分时系统就是遵循“资源共享”原理而产生的。

资源共享既降低了成本，又提高了计算机设备的利用率。

II、讲授内容：一、并行性的概念：并行性，是指计算机系统具有可以同时进行运算或操作的特性，它包括同时性与并发性两种含义。

同时性——两个或两个以上的事件在同一时刻发生。

并发性——两个或两个以上的事件在同一时间间隔发生。

计算机系统中的并行性有不同的等级。

从处理数据的角度看，并行性等级从低到高可分为：(1)字串位串：同时只对一个字的一位进行处理。

这是最基本的串行处理方式，不存在并行性。

(2)字串位并：同时对一个字的全部位进行处理，不同字之间是串行的。

这里已开始出现并行性。

(3)字并位串：同时对许多字的同一位进行处理。

这种方式有较高的并行性。

(4)全并行：同时对许多字的全部位进行处理。

这是最高一级的并行。

从执行程序的角度看，并行性等级从低到高可分为：(1)指令内部并行：一条指令执行时各微操作之间的并行。

(2)指令级并行：并行执行两条或多条指令。

(3)任务级或过程级并行：并行执行两个以上过程或任务(程序段)。

(4)作业或程序级并行：并行执行两个以上作业或程序。

在单处理机系统中，这种并行性升到某一级别后(如任务级或作业级并行)，则需要通过软件(如操作系统中的进程管理、作业管理)来实现。

而在多处理机系统中，由于已有了完成各个任务或作业的处理机，其并行性是由硬件实现的。

在一个计算机系统中，可以采取多种并行性措施。

既可以有数据处理方面的并行性，又可以有执行程序方面的并行性。

当并行性提高到一定级别时，则称之为进入并行处理领域。

并行处理着重挖掘计算过程中的并行事件，使并行性达到较高的级别。

因此，并行处理是系统结构、硬件、软件、算法、语言等多方面综合研究的领域。

二、单机系统中并行性的发展在发展高性能单处理机过程中，起着主导作用的是时间重叠原理。

实现时间重叠的物质基础是“部件功能专用化”，即把一件工作按功能分割为若干相互联系的部分，把每一部分指定给专门的部件完成；然后按时间重叠原理把各部分执行过程在时间上重叠起来，使所有部件依次分工完成一组同样的工作。

例如解释指令的5个子过程分别需要5个专用部件，即取指令部件(IF)、指令译码部件(ID)、指令执行部件(EX)、访问存储器部件(M)、写回结果部件(WB)。

将它们按流水方式连接起来，就满足时间重叠原理，从而使得处理机内部同时处理多条指令，提高了处理机的速度。

显然，时间重叠技术开发了计算机系统中的指令级并行。

在单处理机中，资源重复原理的运用也已经十分普遍。

例如不论是非流水线处理机，还是流水线处理机，多体存储器和多操作部件都是成功应用的结构形式。

在多操作部件处理机中，通用部件被分解成若干个专用操作部件，如加法部件、乘法部件、除法部件、逻辑运算部件等。

一条指令所需的操作部件只要空闲，就可以开始执行这条指令，这就是指令级并行。

在单处理机中，资源共享的概念实质上是用单处理机模拟多处理机的功能，形成所谓虚拟机的概念。

例如分时系统，在多终端情况下，每个终端上的用户感到好像自己有一台处理机一样。

三、多机系统中并行性的发展多机系统也遵循时间重叠、资源重复、资源共享原理，向着三种不同的多处理机方向发展。

但在采取的技术措施上与单处理机系统有些差别。

为了反映多机系统各机器之间物理连接的紧密程度与交互作用能力的强弱，使用了耦合度这样一个术语。

多机系统的耦合度，分为紧耦合系统和松耦合系统两大类。

紧耦合系统又称直接耦合系统，指计算机间物理连接的频带较高，一般是通过总线或高速开关实现计算机间的互连，可以共亨主存。

由于具有较高的信息传输率，因而可以快速并行处理作业或任务。

松耦合系统又称间接耦合系统，一般是通过通道或通信线路实现计算机间的互连，可以共享外存设备(磁盘、磁带等)。

机器之间的相互作用是在文件或数据集一级上进行。

松耦合系统表现为两种形式：一种是多台计算机和共享的外存设备连接，不同机器之间实现功能上的分工(功能专用化)，机器处理的结果以文件或数据集的形式送到共享外存设备，供其他机器继续处理。

另一种是计算机网，通过通信线路连接，以求得更大范围的资源共享。

多处理机中为了实现时间重叠，将处理功能分散给各专用处理机去完成，即功能专用化，各处理机之间则按时间重叠原理工作。

许多主要功能，如数组运算、高级语言编译、数据库管理等，也逐渐分离出来，交由专用处理机完成，机间的耦合程度逐渐加强，从而发展成为异构型多处理机系统。

通过设置多台相同类型的计算机而构成的容错系统，可使系统工作的可靠性在处理机一级得到提高。

各种不同的容错多处理机系统方案计算对计算机间互连网络的要求是不同的，但正确性、可靠性是首要要求。

如果提高对互连网络的要求，使其具有一定的灵活性、可靠性和可重构性，则可将其发展成一种可重构系统。

在这种系统中，平时几台计算机都正常工作，像通常的多处理机系统一样。

但一旦发生故障，就使系统重新组织，降低档次继续运行，直到排除故障为止。

随着硬件价格的降低，人们追求的目标是通过多处理机的并行处理来提高整个系统的速度。

为此，对机间互连网络的性能提出了更高要求。

高带宽、低延迟、低开销的机间互连网络，是高效实现程序段或任务一级并行处理的前提条件。

为了使并行处理的任务能在处理机之间随机地进行调度，就必须使各处理机具有同等的功能，从而成为同构型多处理机系统四、并行计算机系统1、多处理机的一般模型多处理机的系统结构由若干台独立的计算机组成，每台计算机能够独立执行自己的程序。

Flynn称这种结构为MIMD(多指令流多数据流)结构。

在多处理机系统中，处理机与处理机之间通过互连网络进行连接，从而实现程序之间的数据交换和同步。

上图给出了多处理机系统的一般模型。

系统中有n个处理机(P1到Pn)，它们通过一个处理机存储器互连网络(PMIN)连接到一个共享的主存储器上，这些处理机之间通过共享主存储器进行通信。

处理机间还可以有一个处理机处理机互连网络(PPIN)，PPIN通常用来从一台处理机向处理机发送中断信号，以达到进程同步的目的。

此外，这些处理机还通过处理机-I/O互连网络(PIOIN)同各I/O设备连接。

有时为了使系统简单，可以把全部I/O设备连接在一台I/O处理机或少数几台处理机上。

为了减少各处理机在访问主存储器时发生的冲突，把主存分为m个模块交叉工作，而且常使m大于n。

此外，还可以为每台处理机配备私有的存储器(PM)，在其中存放常用的操作系统和暂存受到阻塞或被中断了的进程，这样做还可以减少互连网络PMIN上的通信量。

但一个处理机的PM存储器不能为其他处理机所直接访问，因而，如要把一个受到阻塞的进程转给其他处理机去执行时，要花相当大的时间开销。

增加了处理机的私有存储器，尽管可以减少主存冲突和PMIN网络的通信量负担，但当整个系统中处理机数量比较多时，系统的吞吐量仍会因主存冲突和PMIN开关时间的限制受到很大影响。

为此，可以在每个处理机同PMIN 间设置Cache(CM)，以进一步减少访问主存的次数。

但有了Cache以后，又要产生系统中多个Cache之间以及Cache同主存间的数据一致性问题，这个问题孙彭敏讲解。

在共享存储器的多处理机中，处理机和存储器间的互连网络中信息传送非常频繁。

当互连的处理机数较多时，要求这个互连网络的频带很宽，所以频带宽度往往限制了处理机数目的增加，因而对多处理机系统，希望能设计成具有好的可缩放性。

在一个具有可缩放性的多处理机系统中，当增加其处理机结点数目时，整个多处理机系统的处理能力随结点数线性地增长，以满足不同用户的需要。

2、多处理机分类多处理机系统由多个独立的处理机组成，每个处理机都能够独立执行自己的程序。

它有多种分类方法。

按多处理机各机器之间物理连接的紧密程度与交互作用能力的强弱来分，多处理机分为紧耦合系统和松耦合系统两大类。

按处理机的结构是否相同来分，如果每个处理机是同类型的，且完成同样的功能，我们称为同构型多处理机系统。

如果多处理机是由多个不同类型，且担负不同功能的处理机组成，我们称为异构型多处理机系统。

按多处理机系统的组成结构来分，现有的MIMD计算机分为如下五种类型：并行向量处理机(PVP)、对称多处理机(SMP)、大规模并行处理机(MPP)、分布共享存储器多处理机(DSM)、工作站机群(COW)，如图所示。

图 (a)是并行向量处理机，它是由少数几台巨型向量处理机采用共享存储器方式互连而成，第六章中提到的CRAY X-MP等属于这种类型。

在这种类型中，处理机数目不可能很多。

图 (b)是对称多处理机，它由一组处理机和一组存储器模块经过互连网络连接而成。