并行编程模式

合集下载

并行模式的基本特征

并行模式的基本特征并行模式是一种计算机处理任务的方式，它能够同时执行多个子任务，以提高整体的计算效率和处理能力。

并行模式具有以下几个基本特征：1. 任务分解与分配：并行模式中，将一个大任务分解成多个独立的子任务，并将这些子任务分配给多个处理单元同时执行。

任务分解的目的是将大任务划分成小任务，以便能够同时处理，提高整体的计算效率。

2. 多个处理单元：并行模式需要多个处理单元来执行分配的子任务。

这些处理单元可以是多个CPU核心、多个计算节点、多个GPU等。

每个处理单元独立地执行自己分配到的子任务，之间相互协作完成整体任务。

3. 数据通信与同步：并行模式中，不同的处理单元之间需要进行数据通信与同步。

数据通信用于传递子任务之间的输入数据和计算结果，同步机制用于协调不同子任务的执行顺序和结果的一致性。

4. 并行计算与结果合并：并行模式中，多个处理单元同时执行不同的子任务，每个处理单元独立计算并生成结果。

在任务完成后，需要将各个处理单元的计算结果合并，得到最终的整体结果。

5. 性能扩展与负载均衡：并行模式能够有效地扩展计算资源，提高计算性能。

通过增加处理单元的数量，可以将任务分配给更多的处理单元来并行执行，从而加快任务的完成速度。

同时，为了保证各个处理单元的负载均衡，需要合理地划分任务和调度处理单元。

6. 容错与可靠性：并行模式中，由于存在多个处理单元同时执行子任务，可能会出现处理单元故障或计算错误的情况。

为了提高系统的容错性和可靠性，需要设计适当的容错机制和错误处理策略。

7. 并行算法与并行编程：并行模式需要采用适合的并行算法和并行编程模型来实现任务的并行化。

并行算法是指将串行算法改造成适合并行执行的算法，以充分利用并行计算资源。

并行编程是指使用并行编程语言或框架，将并行算法实现为可执行的程序。

总结起来，通过任务分解与分配、多个处理单元、数据通信与同步、并行计算与结果合并、性能扩展与负载均衡、容错与可靠性、并行算法与并行编程等基本特征，可以实现并行模式下的高效计算和任务处理。

并行计算编程模型及系统架构研究

并行计算编程模型及系统架构研究一、综述随着信息技术的飞速发展，计算任务的数量和复杂性呈现出迅速增长的态势。

传统的单处理器计算系统已经无法满足这些日益增长的需求，因此并行计算技术在众多领域得到了广泛的关注和研究。

并行计算编程模型及系统架构的研究不仅具有理论价值，而且在实际应用中具有广泛的意义。

在过去的几十年里，人们提出了许多并行计算编程模型，包括共享存储模型、分布式内存模型和图形处理器模型等。

这些模型各自具有一定的优势和局限性，适用于不同类型的应用场景。

本文将对这些并行计算编程模型及系统架构进行综述，以期为相关领域的研究和应用提供有益的参考。

随着芯片技术的发展，硬件性能得到了极大的提升，这为新并行计算模型的出现提供了物质基础。

随着计算机体系结构的改进，如多核处理器、GPU和分布式计算机系统等，也为新并行计算模型的实现提供了可能。

在并行计算编程模型方面，本文将重点关注共享存储模型、分布式内存模型和图形处理器模型等方面的研究进展。

在分布式内存模型方面，本文将介绍一致性哈希、目录一致性协议等相关技术。

在图形处理器模型方面，本文将探讨通用计算GPU和图形处理器编程模型（GPGPU）的发展及其在密码学、科学计算和机器学习等领域的应用。

在并行计算系统架构方面，本文将分析多种计算系统的结构，如层次结构、众核计算系统和可扩展计算系统等。

本文还将关注如何提高并行计算系统的可扩展性、性能和容错性等方面的研究。

本文将对并行计算编程模型及系统架构进行深入的综述，为相关领域的研究和应用提供有价值的参考。

1. 并行计算的重要性与挑战随着信息技术的飞速发展，数字数据处理和存储的需求呈现出爆炸性增长。

在这种背景下，并行计算逐渐成为解决复杂计算问题和提高计算效率的关键手段。

并行计算不仅能够缩短计算时间，提高资源利用率，还能为多学科领域的研究提供强大的支持，推动科学研究的进步。

提升计算效率：并行计算通过在多个处理器上同时执行多个任务，显著提高了计算速度，缩短了问题的解决周期。

PLC步进编程应用—并行分支编程方法

X2
S27
Y4
右限位X4
右移Y4 X4
对应梯形图
M8002 SET S0
S0 X5 RST Y1
RST Y0
Y2 X6
RST Y3
Y4 X0 X4 X2 Y1
SRY S20 S20
Y0
X1
S21
SET S21
T0 K10
SET Y1
T0 SET S22
S22 S23 S24 S25
S26 S27
END
(4) 并行分支、汇合编程应注意的问题
②并行分支与汇合流程中，并联分支后面不能使用选择转移条件※，在转移条件*后不允许并行汇合，如下图(a)所示，应改成图 (b)后，方可编程。
【应用系统设计】简易红绿灯控制系统
选择分支与汇合流程设计
项目说明：
①若方式选择开关（COS）置于手动方式，当按下START启动后，
状态编程思想在非状态元件编程中的应用
一、用辅助继电器实现状态编程
左图为小车往返辅助继电器状态编程梯形图
辅助继电器实现的状态编程方法, 同基本指令梯形图的编程完全相同。
注意！
在设计每个工序的梯形图时，应将前工序辅助继电器的复位操作放在本工序负载驱动的前面，防止编程时出现逻辑错误，导致控制混乱。
②因为只有一个放在工件补充位置的PH0来侦测工件的有无，而另外的钻孔、测孔及搬运位置并没有其他传感装置，那么应如何得知相应位置有无工件呢？本题所使用的方式是为工件补充、钻孔、测孔及搬运设置4个标志，即M10-M13。当PH0侦测到传送带送来的工件时，则设定M10为1，当转盘转动后，用左移指令将M10-M13左移一个位元，亦即 M11为1,钻孔机因此标志为1而动作。其他依此类推，测孔机依标志M12 动作、包装搬运依M13动作。

并行程序设计

并行程序设计并行程序设计并行程序设计是指将一个任务或问题分解成多个子任务，然后同时执行这些子任务，以提高程序的运行效率和响应速度。

本文将介绍并行程序设计的概念、原则和常用的并行编程模型。

概念并行程序设计是一种计算思维方式，通过利用计算机多核心、多处理器或者分布式系统的能力，将一个大的问题分解成多个小的子问题，并且让这些子问题可以同时被处理。

通过同时处理多个子问题，可以大大提高程序的处理速度。

并行程序设计原则并行程序设计有一些基本原则，下面是其中几个重要的原则：1. 任务划分：将一个大的任务划分成多个小的子任务。

划分任务时需要注意任务之间的依赖关系，以保证划分后的任务可以并行执行。

2. 任务分配：将划分后的子任务分配给可用的计算资源，如多核心、多处理器或分布式系统中的节点。

任务分配需要考虑计算资源的负载均衡，以充分利用计算资源的能力。

3. 任务通信：并行程序中的任务之间通常需要进行数据交换或同步操作。

任务通信需要合理选择通信方式，并通过合适的同步机制来确保数据的一致性和正确性。

4. 任务合并：在一些情况下，多个子任务的处理结果需要进行合并。

任务合并需要保证合并操作的正确性和效率，同时还要考虑合并操作可能引入的额外开销。

并行编程模型为了简化并行程序的设计与开发，人们提出了一系列并行编程模型。

下面介绍几种常用的并行编程模型：1. 共享内存模型：多个线程共享同一块内存地质空间，线程之间通过读写共享内存来进行通信和同步。

常见的共享内存模型有OpenMP和Cilk等。

2. 消息传递模型：多个进程或线程通过消息的方式进行通信。

每个进程或线程有独立的内存空间，通过发送和接收消息来实现进程间的通信和同步。

常见的消息传递模型有MPI和PVM等。

3. 数据流模型：任务之间通过数据流进行通信。

任务根据数据的可用性来进行执行，并将处理结果传递给下游任务。

数据流模型可以以图形化的方式表示任务之间的依赖关系。

常见的数据流模型有GPGPU和FPGA等。

并行计算基础知识

并行计算基础知识在计算机科学领域中，随着计算需求的增加和任务的复杂化，人们开始寻找更高效的计算方式。

并行计算作为一种重要的计算模式，在多个处理单元同时进行计算操作，大大提高了计算速度和效率。

本文将介绍并行计算的基础知识，包括并行计算的定义、分类、应用领域以及相关技术等。

一、并行计算的定义和分类并行计算是指通过将一个计算问题划分为多个子问题，并在多个处理单元上同时进行计算操作，从而加快计算速度的一种计算方式。

与之相对的是串行计算，即按照顺序逐一执行计算任务的方式。

根据并行计算的规模和任务划分方式，可以将并行计算分为以下三种分类：1. 指令级并行计算：该种并行计算方式主要是对计算机中的单个指令进行并行处理，即同时执行多个指令操作。

它通过优化处理器的执行流水线、指令突发处理等技术实现加速。

2. 数据级并行计算：该种并行计算方式主要是对大规模的数据集进行划分，将数据分配给多个处理单元同时进行计算操作，最终将各个处理结果进行合并得到最终结果。

这种方式主要用于解决一些数据密集型的计算问题，如图像处理、数据挖掘等。

3. 任务级并行计算：该种并行计算方式是将一个复杂的计算任务划分为多个子任务，并将不同的子任务分配给不同的处理单元进行计算。

各个处理单元之间通过通信来交换计算结果或者协同工作，最终得到整体的计算结果。

这种方式主要用于解决一些计算复杂度高、任务独立的问题，如天气预报、分布式数据库查询等。

二、并行计算的应用领域并行计算广泛应用于各个领域，尤其是那些需要大规模计算和高性能计算的领域。

以下是几个常见的应用领域：1. 科学计算：并行计算在科学计算领域发挥着重要作用，能够加速复杂的数值计算和模拟实验，例如天气预报、地震模拟、宇宙学研究等。

2. 人工智能：并行计算可以加速机器学习、神经网络训练等人工智能任务，提高算法的训练效率和模型的准确性。

3. 数据分析：对于大规模数据的处理和分析，通过并行计算可以提高数据处理的速度和效率，如数据挖掘、图像处理、自然语言处理等。

并行编程的基本原理及其应用

并行编程的基本原理及其应用并行编程是一种将计算机程序分解为互相独立的部分，以便它们能够同时运行的编程模式。

并行编程的核心思想是并行思维，即将问题划分为多个相互独立的部分，并同时处理这些部分，以提高程序运行的效率。

并行编程的基本原理是利用多个处理器或计算机同时执行程序的各个部分，从而加速程序的运行，提高计算机性能。

并行编程最主要的应用在科学计算和数据处理领域。

例如，在天气预报、气候模拟、生物医学、生产制造、金融计算、大数据分析等领域中，都需要使用到并行编程技术。

并行编程需要考虑以下几个因素：1.数据分割：将大规模的数据分解成多个小规模的数据，以便并行处理。

2.任务分解：将程序分解成多个相互独立的任务，并分发给多个处理器执行。

3.通信机制：不同处理器之间需要通过网络或共享存储器进行通信，以便共享数据和结果。

4.同步机制：确保多个处理器之间的数据同步，以便正确地执行程序。

在并行编程中，我们需要选择适当的并行编程模式和算法，以实现高效的计算和数据处理。

常用的并行编程模式包括任务并行、数据并行、管道(parallel pipeline)并行、反向流水(linear pipeline)并行、数据流(dataflow)并行、SPMD(Single Program Multiple Data)并行、MPMD(Multiple Program Multiple Data)并行等。

任务并行模式适用于将任务分解成独立的子任务，每个子任务由一个处理器执行的情况；数据并行模式则适用于将数据分解成多个小部分，每个处理器对其中的部分进行操作；管道并行、反向流水并行、数据流并行则更适合处理数据流，以便实现高效的数据处理。

虽然并行编程可以提高计算机性能，但也存在一些问题和挑战，例如：1.并行性和并发性：并行编程需要考虑各个处理器之间的并发执行和数据竞争等问题，以保证程序的正确性和可靠性。

2.调度和负载平衡：多个处理器之间需要协调和平衡任务的负载，以避免某个处理器负载过重，而其他处理器负载不足的情况。

基于SMP集群系统的并行编程模式研究

维普资讯
２０年第２期０８
福
建
电
脑
４９
基于ＳＭＰ集群系统的并行编程模式研究
田跃欣
（河南交通职业技术学院河南郑州４００５０５）
【要】并行计算技术是计算机技术发展的重要方向之一，ＭＰ与集群是当前主流的并行体系结构。当前并行程序摘：Ｓ设计方法主要采用基于消息传递模型的ＭＩ基于共享存储模型的ＯｅＭＰ两种编程模式各有特点和适用范围。本文对Ｐ和ｐｎ，ＳＭＰ集群以及ＭＰ和ＯｅＭＰ的特点进行了分析，并介绍了在ＳＩｐｎＭＰ集群系统中利用ＭＰＩ和ＯｅＭＰ混合编程的可行性方ｐｎ
法。
【关键词】体系结言、
近年来，群系统得到了高速发展，为提升计算机系统性集成
并行计算是提高计算机系统计算速度和处理能力的一种有能的一个较为有效的解决办法。所谓集群（ｌｓｒ．，是指Ｃｕｔ）统就ｅ￣主按效手段。当前，并行计算已经成为解决重大问题的关键，的基利用网络将计算机（要是商用服务器１照某种结构连接起来，它本思想是用多个处理器来协同解决同一问题，即将被求解的问在并行计算环境下支持统一调度的并行系统。计算机集群系统允许使用低成本的商品化计算机来构造具题分解成若干个部分．各部分均由一个独立的处理机来并行计算。行程序设计是并行处理技术的核心问题，并目前基于消息传有高可伸缩性和高可用性的高性能计算机网络系统．即今天所递的ＭＩｓｇａｓｇＩｔｆｃ）Ｐ（ｓｅＰｓｉｅａｅ Ⅲ编程是集群系统上主流的讲的集群系统。性能通过数年的技术研究。Ｍｅａｎｎｒ其已经逐渐接近甚至编程模型．而在集群系统上寻求共享存储编程乃至支持自动并超越同时期同规模的大ＳＭＰ系统。群系统的主要特点和优点集行一直是并行计算的研究热点。ＯｅＭＩ共享存储体系结构有：１性能价格比高；２可靠性高；３可扩展性好；４使用方ｐｎＩＰ是２（）（）（）（）的并行编程标准，特点是易于编程且支持增量并行，是不易便；５应用领域广泛。其但（）扩展：Ｉ消息传递编程具有很好的可扩展性，却不易编程调２＿ＳＰ与集群系统的融合ＭＰ、３Ｍ２试。ＭＰ与ＯｅＭＩｐｎＰ各有所长．两者的优点融合在同一并行结将ＳＰ系统和集群各有其特点．Ｍ目前采用ＳＰ技术构造集群Ｍ节点已成为一个趋势。算机集群系统的发展。计使得通过成熟的构特别是ＳＭＰ集群系统中，会获得更好的性能。将商业化产品组建的集群系统同时具备低价高性能成为可能。其组成部分主要包括节点机系统、网络系统、储系统、制系统、存控２１并行体系结构分类．从２０世纪６０年代初开始．众多的科学家和工程师系统地电源及散热系统等集群系统的节点机本身就是一个经济型的ＳＭＰ系统．备具研究了种类繁多的并行计算机体系结构．并形成了不同的分类

并行编程模式及分析

何元清” 孙世新傅彦
（电子科技大学计算机科与工程学院成都６０５）学１０４
【摘要】讨论了主从模型、单控制流多数据流、舟治策略、数据流水线、投机策略、混夸模型六种井行蝙程模型的结构和工作方式、性能厦特点，分析统计了大量应用程序．指出了井行程序设计中，井行蝙程模式的选择直接影响了并行程序的正确性和效率，而主从模型和单控制流多数据流在整体性能上最忧，程序执行效率也最好，是两种最常甩的并行蝙程模型。
（ｌｇｆｍｐｔｒｃ朗ｃｎｇｎｅｎ－ＵＥＳｏＣｈｎＣｈｒｄ６１０４ＣｏｌｅｏＣｏｕｅｉｅａｄＥｎｉｅｎｇｅＳＴｆｉａｅ，ｕｇ０５
ＡｂｔａｔＩｈｓｐｐｒｔｅｓｒｃｕｅｏｅｅａｄｌｉｉｔｏｕｅｓｃｓＭａｔ／ｌｖ，ｉｇｅｓｒｃｎｔｉａｅ，ｈｔｕｔｒｆｓｖｒｌｍｏｅｓＳｎｒｄｃｄ，ｕｈａｓｅＳａｅＳｎｌ
维普资讯
第３卷第２期１２００２年４月
电子科技大学学报
Ｊｕａ０ＵＥＳｏｍｌｆＴｏＣｈｎｆｉａ
Ｖ０．１Ｎｏ２Ｉ３Ａｐ．０２ｒ２０
并行编程模式及分析
地过程调用（Ｐ）Ｒｃ进行通信，并不具有内在并行性。并行计算领域的一些专家将模式从各种角度进行了分类，目前，并行编程中用到的模式有以下６：）任务播种；）单控制流多数据流；）数种１２３
２０年Ｉ月２日收稿０１１０・信息产业部预研基金资助项目 ¨ 男３岁在职博士生讲师４

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

并行程序的编程模型、运行环境、调试环境等都要比串行程序复杂得多。

提供良好的高性能计算开发环境，一直是学术界和工业界所追求的目标。

目前比较流行的高性能计算系统，大体可以分为两类:一类是共享内存系统(SMP)，如IBM的P690，HP的SuperDome等，其特点是多个处理器拥有物理上共享的内存；一类是分布存储系统(DMP)，如MPP和集群系统，其特点是系统由多个物理上分布的结点组成，每个结点拥有自己的内存，结点通过高速以太网或专用高速网络连接。

本文主要介绍这两类系统上的开发工具。

一、并行程序的开发模式
1. 共享内存模型
在共享内存模型中，一个并行程序由多个共享内存的并行任务组成，数据的交换通过隐含地使用共享数据来完成。

此编程模式一般仅需指定可以并行执行的循环，而不需考虑计算与数据如何划分，以及如何进行任务间通信，编译器会自动完成上述功能。

目前流行的共享内存模型开发标准是OpenMP。

OpenMP定义了一套编译指导语句，用于指定程序的并行性、数据的共享/私有等信息。

其目标是为SMP系统提供可移植、可扩展的开发接口。

OpenMP由OpenMP Architecture Review Board于1997年推出，现在已发展到2.0版。

OpenMP支持的编程语言包括Fortran、C和C++。

OpenMP得到了工业界的广泛支持，有大量的商业编译器和其他开发工具支持OpenMP的开发，如IBM、HP、Sun、SGI、Intel等硬件厂商均有支持OpenMP的编译器产品，另外还有一些第三方厂商的OpenMP编译器。

2. 消息传递模型
在消息传递模型中，一个并行程序由多个并行任务组成。

每个并行任务拥有自己的数据并对其进行计算操作。

任务之间数据的交换是通过显式的消息传递语句来完成的。

现在广泛使用的消息传递模型有两个：PVM和MPI。

PVM即Parallel Virtual Machine(并行虚拟机)与MPI即Message Passing Interface(消息传递界面)。

PVM与MPI所提供的功能大致相同，但两者的侧重点有所不同。

PVM强调在异构环境下的可移植性和互操作性，程序之间可以互相通信，并支持动态的资源管理和一定程度的容错；而MPI更强调性能，不同的MPI 实现之间缺乏互操作性，本身也不支持容错（可以通过专门的容错软件来支持容错）。

一般而言，使用MPI比较适合于开发MPP或同构集群上的并行应用，可以有较高的通信性能;而PVM更适合于异构的集群系统。

几乎所有的高性能计算系统都支持PVM和MPI。

3. HPF
HPF(High Performance Fortran)的思想与OpenMP类似，都是通过定义编译指导语句来帮助编译器生成并行代码。

HPF的目标系统与OpenMP不同，它支持DMP系统。

因此，除了指定并行性的编译指导语句外，HPF还指定数据划分的编译指导语句。

HPF与消息传递模型的不同之处则在于:HPF通过编译器来生成通信语句，不需要程序员手工编写。

HPF得到了工业界的广泛支持，如IBM、HP、Sun都有HPF编译器。

第三方产品则有PGI的PGHPF、APR的Forge xHPF等。

其不足是对于某些问题无法得到与手工编写的消息传递程序相同的性能。

4. 并行库
使用并行库开发高性能计算程序的基本思想是:用户不需要自己编写通用的并行算法代码，而由程序库提供并行算法，并对用户透明。

用户只需要根据自己的需求，调用相应的库函数，就可以编写出并行程序。

由于库函数的编写者一般经验丰富，而且库函数会采取较为优化的算法，并采用优化编译，使得库函数的执行效率很高。

对于大量使用通用计算算法的用户来说，使用并行库是一种高效的开发模式。

并行库的缺点是无法帮助那些需要自己书写非通用
并行算法的用户。

目前的并行库很多，包括PBLAS(Parallel Basic Linear Algebra Subroutines)，以及建立在其基础上的LAPACK和ScaLAPACK，提供了一些线性代数问题的并行求解算法，如求特征值、最小二乘问题等。

LAPACK是为SMP系统优化的，ScaLAPACK是为DMP系统优化的。

大多数高性能计算系统都提供在本系统上优化的PBLAS、LAPACK、ScaLAPACK。

另一个著名的并行库是PETSc。

PETSc是一套基于MPI的数据结构和库函数，用于解决基于偏微分方程的典型科学计算问题。

另外，MATLAB是很常用的科学计算软件。

很多公司和研究机构也在进行并行化MATLAB的工作，如RTExpress。

5. 串行程序并行化
另一种并行程序的开发模式是将串行程序并行化。

此模式的优点在于，可以将现有的很多串行代码转换成并行代码。

并行化分为全自动并行化和交互式并行化两种模式。

全自动并行化的并行过程不需要人的干预，可以自动发现程序中可并行的部分，生成并行代码。

现在，高性能计算系统提供商的Fortran和C编译器大都能提供面向SMP系统的自动并行化的编译选项。

对于少数程序，全自动并行化编译器可以达到较好的效果;但对大多数程序来说，并行化的效果还不理想。

交互式并行化工具通过给用户提供程序中的有效信息，包括相关性分析结果、程序调用图、性能预测结果等帮助用户进行并行化工作，但是如何更好地结合用户和并行化工具的能力还需要进一步研究。

目前产品化的交互式并行化工具主要有APR的Forge，该系统支持Fortran77的并行化，并同时支持SMP系统和DMP系统。

二、开发工具
1. 调试器
调试是程序开发的重要部分，并行程序尤其难调试，更需要调试器的支持。

高性能计算系统中大多会带有并行调试器，如IBM的pdb（命令行方式）、pedb（Xwindow图形界面）、HP 的DDE（XWindow图形界面）和LaDebug(用于Alpha系统)、Sun的Prism等。

Etnus的TotalView是最著名的第三方并行调试器。

它提供对C、C++、Fortran程序的图形化符号调试，可以调试MPI、PVM、HPF、OpenMP程序，支持SGI、Sun、HP、IBM等几乎所有的高性能厂商的产品，还提供对Linux的支持。

KAI的Assure Thread Analyzer是一个支持OpenMP的程序正确性检测工具，用于自动发现程序中的常见错误。

它目前仅支持IA32和IA64上的Linux。

2. 性能分析和预测
程序性能分析(profiling)可以帮助用户找到程序中最费时的部分，从而集中精力进行改进和优化，是改进程序性能的有效手段。

传统的性能分析工具一般仅提供子程序级的性能分析，但对于高性能程序来说，对于循环程序的性能分析是必不可少的。

现有的大部分高性能计算系统中大都具有能够进行循环级性能分析的性能分析器，有些还提供了友好的用户界面，如Intel的VTune、IBM的Xprofiler等。

一些第三方厂商也提供性能分析工具，比如Pallas的Vampir，它支持从Linux PC到IBM、HP、Sun、SGI等几乎所有的高性能厂商的产品。

3.资源管理和负载平衡系统
严格地说，负载平衡系统是运行时环境，而不是开发环境，但对于开发者来说，了解负载平衡系统是有必要的。

某些高性能计算系统主要用于提供共享的多任务处理环境。

对于SMP系统来说，操作系统内置的任务调度器可以完成任务的调度功能。

对于DMP系统来说，需要专门的软件来进行任务调度，达到负载平衡。

负载平衡系统通过了解系统中各个结点的负载状况、计算能力、内存状况等，可以合理地分配任务的执行结点，必要时迁移现有的任务到其他结点，从而达
到提高系统吞吐量的作用。

著名的负载平衡系统包括Platform公司的LSF(Load Sharing Facility)和Veridian的PBS(Portable Batch System)。

这两个系统都支持多种操作系统和硬件平台，能够管理异构的集群系统。

另外开放源代码的OpenMosix主要支持Linux集群系统。

发展趋势
OpenMP将成为支持SMP系统编程的主要标准，将来的工作在于研究和开发更加有效的OpenMP编译器，以及更加强大友好的开发、调试工具。

MPI和PVM将仍然是DMP系统的主要标准。

并行库是很有前途的开发方式和研究方向，随着更多的并行程序库的出现，并行化编程会越来越容易。

程序自动并行化技术也能大大缩短并行程序的开发时间，但目前的技术即使对SMP系统也没有达到实用的水平，还需要技术上的突破。

网格计算是现在的热门话题，也是将来高性能计算的发展方向之一。

为网格计算制定标准，提供所需的开发环境和运行环境将是未来的发展方向。