基于MPI的并行计算程序设计测试报告

中南大学

CENTRAL SOUTH UNIVERSITY

基于MPI的并行计算程序设计测试报告

学院：软件学院

专业：软件工程

学号：

姓名：

指导教师：

20**-**-**

基于MPI的并行计算程序设计测试报告

一．并行计算概述

1.采用并行计算的原因：

?串行程序速度提升缓慢。从串行程序的发展来讲，一方面，物理速度渐变发展，芯片速度每18个加快一倍，而内存传输率每年加快9%。另一方面，物理极限无法突破，芯片晶体管接近了原子极限，传输速度不可能超过光速。

?可以加快速度。更短的时间内解决相同的问题，相同的时间内解决更多的复杂的问题。

?可以加大规模。并行计算可以计算更大规模的问题。

2.并行计算简介

并行计算（Parallel Computing）是指同时使用多种计算资源解决计算问题的过程。为执行并行计算，计算资源应包括一台配有多处理机（并行处理）的计算机、一个与网络相连的计算机专有编号，或者两者结合使用。并行计算的主要目的是快速解决大型且复杂的计算问题。此外还包括：利用非本地资源，节约成本，使用多个“廉价”计算资源取代大型计算机，同时克服单个计算机上存在的存储器限制。为利用并行计算，通常计算问题表现为以下特征：1.将工作分离成离散部分，有助于同时解决；2.随时并及时地执行多个程序指令；3.多计算资源下解决问题的耗时要少于单个计算资源下的耗时。

对并行处理的需求极大的促进了并行技术的发展，因此许多大规模并行计算机系统相继问世，如PVP、SMP、MPP、DSM等。但传统的并行系统的高成本性、专用性、系统规模的不可伸缩性等使其难以推广到普通的商业应用和科学计算中。高性能集群系统因其性能价格比高、高可复用性、强可扩展性、用户编程方便等优点在科学研究中得到了广泛的应用。并行计算机系统的出现就需要对程序进行并行设计，这种需求使得各种不同的并行编程环境得到了很大发展。现行高性能计算机系统中使用的并行编程环境主要有两种：PVM(Parallel Virtual Machine)和MPI(Message Passing Interface)。PVM的开发始于1988年，由美国橡树岭国家实验室发起。目前很多人采用MPI作为并行开发环境。

3.并行计算的相关内容

?存储方式。共享内存：ccNUMA,SMP；分布式内存：MPP,Cluster。

?三种计算模式。Uniprocessor,shared memory,distribute memory.

?并行化分解方法。任务分解：多任务并行执行；功能分解：分解被执行的计算；区域分解:分解被执行的数据。

?并行算法的分类。按运算的基本对象：分数值并行算法和非数值并行算法。按进程间的依赖关系：分同步并行算法，异步并行算法和纯并行算法。按并行计算的任务大小：分粗粒度并行算法，中粒度并行算法和细粒度并行算法。

二． MPI简介

MPI是一个库而不是一门语言许多人认为MPI就是一种并行语言这是不准确的。但是按照并行语言的分类，可以把FORTRAN+MPI或C+MPI，看作是一种在原来串行语言基础之上扩展后得到的并行语言。MPI库可以被FORTRAN77/C/Fortran90/C++调用，从语法上说，它遵守所有对库函数/过程的调用规则和一般的函数/过程没有什么区别。

MPI是一种标准或规范的代表而不特指某一个对它的具体实现迄今为

止所有的并行计算机制造商都提供对MPI的支持可以在网上免费得到MPI在不同并行计算机上的实现一个正确的MPI程序可以不加修改地在所有的并

行机上运行。

MPI是一种消息传递编程模型并成为这种编程模型的代表和事实上的

标准MPI虽然很庞大但是它的最终目的是服务于进程间通信这一目标的。三． MPI编程

在基于MPI编程模型中，计算是由一个或多个彼此通过调用库函数进行消息收、发通信的进程所组成。在绝大部分MPI实现中，一组固定的进程在程序初始化时生成，一般情况下，一个处理器只生成一个进程。这些进程可以执行相同或不同的程序（相应地称为单程序多数据（SPMD)或多程序多数据（MPMD)模式）。进程间的通信可以是点到点的，也可以是集合的。MPI 只是为程序员提供了一个并行环境库，程序员通过调用MPI的库程序来达到程序员所要达到的并行目的，MPI提供C语言和Fortran语言程序接口。其中的6个最基本的函数就能编写一个完整的MPI程序去求解很多问题。它们是：1.MPI_INIT； 2.MPI_FINALIZE； 3.MPI_COMM_SIZE 确定进程数；

4.MPI_COMMON_RANK 确定自己的进程标识符；

5.MPI_SEND：发送一条消息；

6.MPI_RECV：接收一条信息。

MPI程序的一般结构：

图1

四．并行程序设计及测试准备工作

1.准备工作：

- 操作系统分别为Win seven 和Win 2008 server

- Microsoft .NET Framework 2.0

- Microsoft Visual C++ 6.0

- mpich2-1.0.6p1-win32-ia32.msi ：mpich2的安装文件

2. 环境搭建：

2.1在两台机器上分别安装Microsoft .NET Framework 2.0和Microsoft Visual

C++ 6.0

2.2 在两台机器上分别安装mpich2-1.0.6p1-win32-ia32.msi；

2.3 安装完成后，其目录结构如下（假定安装路径为D:\Program

Files\MPICH2 ）：

图2

2.4将...\MPICH2\bin（即安装目录，如：D:\Program Files\MPICH2\bin）添加至系统环境变量pat h中。单机测试mpich2。测试前首先需要注册一个用户，具体操作如下：开始-->所有程序-->MPICH2-->wmpiregister.exe：

图3

需要说明的一点：该用户名须为有效的操作系统管理员账户，密码对应为系统登录密码。接下来，测试时有两种方式可供选择：GUI界面和命令行。GUI方式：开始-->所有程序-->MPICH2-->wmpiexec.exe；

图4

命令行方式：mpiexec 4 D:\ProgramFiles\MPICH2\examples\cpi.exe。

2.5联机测试MPICH2。有以下几个要点：

1. 参加并行计算的机器须至少注册一个相同的账户，如笔者两台PC上都注

册了一个MPI帐号；这些账户最好位于同一工作组，当然不在同一工作组也可以，笔者作过测试，没有问题。

2.创建联机目录。每台机器上须有一个路径相同的目录，用于存放待

执行的程序（即exe 程序），测试创建的目录是d:/mp i/ ，并将测试用的cpi.exe 文件copy至该目录下。

3.联机执行命令：mpiexec -hosts 4 218.196.109.201 218.196.109.212

218.196.109.239 218.196.109.213/cpi.exe 。“-hosts”表示要联机运行，4 表示有两台机器参加运算，Node_1（及Node_2 ...）为各机器的计算机名或IP。".../***.exe" 必须位于前面设置的目录中。

2.6 与vc++ 6.0 的集成。在MPICH2的readme文件中有个粗略的说明：

1. Add mpich2\include to the include path

2.Add mpich2\lib to the library path

3.For C applications add mpi.lib to your target link command.

具体到VC6 中步骤如下：打开VC6，选择”Tools->Options”，在弹出的“Options”对话框中选择Directories选项卡，分别设置如下图：

图5

图6

图7

3．MPI的编译和运行

MPI 程序的开发大体分为两个阶段：

使用visual studio 编译MPI程序，将其debug为exe文件。

将exe文件copy到上面环境搭建过程中创建的并行实验的目录下，联机运行。环境搭建好之后，接下来的编译和运行就非常简单。编译MPI程序前，创建一个c++工程，MPI代码放于工程中的cpp文件中，build，start debuging...，OK，编译完成。copy exe文件至每台机器的并行实验目录，进入任何一台机器的cmd下，执行联机运行命令即可。

五．

六．

MPI提供了良好的并行程序接口，通过调用MPI的库程序，可以达到并行化程序的目的，但并行程序的设计相对于串行程序的设计来说要复杂得多，本报告中就提出了影响并行程序设计的诸多因素。

通过测试，可以深刻的认识到MPICH为并行程序的实现提供了并行环境，并且可以根据具体应用程序的不同来选择处理机，基本达到了测试并行程序的目的。但它是先进行单纯的后台计算，然后给用户输出一组时间数据，即求解同一个问题使用单个到多个处理器的时间值。用户必须比较时间值并额外计算加速比和并行效率，才可以对并行程序进行评价。这种方式，只是提供给用户几个呆板的数据，具体的分析还得靠用户去做，并且不能让用户深刻地体会到并行的理念和优越性。如果将衡量并行程序性能的指标集成到此软件中，并且让后台在进行并行计算的同时，前台能同步地以生动的图像（例如进度条）来演示并行程序执行效率的情况，则既可以向用户演示并行程序执行效率的情况，又可以生动地演示各处理机的使用情况。总之，并行程序设计涉及到诸多方面的技术，只依靠某一种方法或某一种软件工具是难以设计出高质量的程序的，需要用多种方法，研究多种软件工具间有机地协调应用。

MPI并行程序设计实例教程

编辑推荐 ◆书中内容侧重于以MPI库为基础开发并行应用程序，对MP规范定义的各项功能和特征在阐述其特点基础上均配以实例加以说明和印证。 ◆书中所附实例尽量采用独立的功能划分，其中的代码片段可直接用于并行应用程序开发 ◆在讲述基本原理的同时，注重对各项消息传递和管理操作的功能及局限性、适用性进行分析从而使熟读此书的读者能够编写出适合应用特点，易维护、高效率的并行程序。 ◆与本书配套的电子教案可在清华大学出版社网站下载。本书简介本书旨在通过示例全面介绍MP1并行程序开发库的使用方法、程序设计技巧等方面的内容，力争完整讨论MP1规范所定义的各种特征。主要也括MPI环境下开发并行程序常用的方法、模式、技巧等内容。在内容组织上力求全面综合地反映MPl-1和MPI-2规范。对MPI所定义的各种功能、特征分别

给出可验证和测试其工作细节的示例程序目录第1章 MPI并行环境及编程模型　1.1 MPICH2环境及安装和测试 1.1.1 编译及安装 1.1.2 配置及验汪 1.1.3 应用程序的编译、链接 1.1.4 运行及调试 1.1.5 MPD中的安全问题　1.2 MPI环境编程模型 1.2.1 并行系统介绍 1.2.2 并行编程模式 1.2.3 MPI程序工作模式　1.3 MPI消息传递通信的基本概念 1.3.1 消息 1.3.2 缓冲区 1.3.3 通信子 1.3.4 进样号和进程纰 1.3.5 通价胁议 1.3.6 隐形对象第2章点到点通信　2.1 阻糍通信 2.1.1 标准通信模式 2.1.2 缓冲通信模式 2.1.3 就绪通信模式 2.1.4 同步通信模式 2.1.5 小结　2.2 非阻塞通信 2.2.1 通信结束测试 2.2.2 非重复的非阻塞通信 2.2.3 可醺复的非阻塞通信 2.2.4 Probe和Cancel 　2.3 组合发送接收 2.3.1 MPl_Send,MPI_RecvoMPl_Sendreev 2.3.2 MPI_Bsend←→MPl_Sendrecv 2.3.3 MPI_Rsend←→MPI_Sendrecv 2.3.4 MPl_Ssend←→MPl_Sendrecv 2.3.5 MPl_lsend←→MP1一Sendrecv 2.3.6 MPl_Ibsend←→MPI_Sendrecv 2.3.7 MPI_Irsend←→MPI_Sendrecv 2.3.8 MPl_Issend,MPI_Irecv←→MPI_Sendrecv 2.3.9 MPI Send_init←→MPl_Sendrecv 2.3.10 MPI一Bsendj init←→MPl_Sendrecv 2.3.11 MPI_Rsend_init←→MPI_Sendrecv 2.3.12 MPl_Ssend_init,MPl_Recv_init←→MPl_Sendrecv 2.4 点到点通信总结

MPI并行编程环境及程序设计

第27卷　第3期河北理工学院学报Vol127　No13 2005年8月Journa l of Hebe i I n stitute of Technology Aug.2005 文章编号:100722829(2005)0320041203 MP I并行编程环境及程序设计杨爱民1,陈一鸣2 (11河北理工大学理学院,河北唐山063009;21燕山大学理学院,河北秦皇岛066004)关键词:MP I;并行编程;消息传递摘　要:通过对MP I原理和特点的研究,给出了并行MP I程序的基本设计思路和执行过程,并实现了向量相加的并行计算。中图分类号:TP316　文献标识码:A 0　引　言近几十年来,大规模和超大规模的并行机取得了快速发展,由于各种原因,开发商对用户提供的必要支持,如它们各自专有的消息传递包NX、EU I、P VM等,虽然在特定平台上具有很优越的性能,但是从应用程序来看,可移植性差。1992年11月,在Supercomputi ong’92会议上,正式成立了一个旨在建立一个消息传递标准平台的MP I(Message Passing I nterface)论坛,该论坛不仅包括了许多P VM、Exp ress等的研制者及并行程序用户,还吸收了许多著名计算机厂商的代表。论坛于1994年5月,公布了MP I标准。MP I是一种为消息传递而开发的广泛使用的标准,它为消息传递建立了一个可移植的、高效、灵活的标准。 1　MP I的原理与特征 MP I是一个函数库,而不是一门语言,它是一种消息传递模型,它的最终目的是服务于进程间通信。MP I作为一个并行程序库的开发平台,为用户编写和运行程序提供了便利的条件。由于MP I是基于消息传递机制构建的系统,因此它在体系结构为分布存储的并行机中有很宽阔的应用空间,它可以应用在各种同构和异构的网络平台中。它的编程语言可以为Fortran77/90、C/C++。在Fortran77/90、C/C++语言中都可以对MP I的函数进行调用,它作为一种消息传递模式的并行编程环境,MP I并行程序要求将任务进行划分,同时启动多个进程并发的执行,而各个进程之间通过MP I的库函数来实现其中的消息传递。 MP I与其它并行编程环境相比,显著的特点有: (1)可移植性强,能同时支持同构和异构的并行计算; (2)可伸缩性强,允许并行结构中的节点任意增加或减少; (3)能很好的支持点对点通信和集体通信方式; (4)对C语言和Fortran语言的支持,使其能很好的满足各种大规模科学和工程计算的需要。这样,以MP I作为公共消息传递接口的并行应用程序就可以不作任何改动的移植到不同种类和型号的并行机上,也能够正常运行,或者移到网络环境中也一样。 2　MP I的基本函数 MP I为消息传递和相关操作提供了功能强大的库函数,MPl-1中有128个,MP I-2中有287个库函数。但是从理论上来说,MP I的所有通信功能都可以用它的6个基本调用来完成,即使用这6个函数可以实现所有的消息传递并行程序。这六个函数分别为呼(Fortran77语言的调用格式来描述): (1)MP I初始化 MP I程序的初始化工作通过调用MPl l N I T(I ERROR)来实现,所有MP I程序的第一条可执行语句都是收稿日期:2004210221 基金项目:河北省自然科学基金项目(E2004000245) 作者简介:杨爱民(19782),男,河北顺平人,河北理工大学理学院教师,硕士。

消息传递并行编程环境MPI

国家973项目高性能计算环境支持讲座 MPI与PETSc 莫则尧（北京应用物理与计算数学研究所）

个人介绍莫则尧，男，汉族，1971年7月生，副研究员：●1992年国防科技大学应用数学专业本科毕业； ●1997年国防科技大学计算机应用专业并行算法方向博士毕业； ●1999年北京应用物理与计算数学数学博士后流动站出站，并留所工作； ●主要从事大规模科学与工程并行计算研究。

消息传递并行编程环境MPI 一、进程与消息传递二、MPI环境的应用现状三、MPI并行程序设计入门（程序例1）四、初步的MPI消息传递函数五、作业一六、先进的MPI函数七、MPI并行程序示例2（求解- u=f）；八、MPI环境的发展九、作业二

一、进程与消息传递 1．单个进程（process ） ● 同时包含它的执行环境（内存、寄存器、程序计数器等），是操作系统中独立存在的可执行的基本程序单位； ● 通俗理解：串行应用程序编译形成的可执行代码，分为“指令”和“数据”两个部分，并在程序执行时“独立地申请和占有”内存空间，且所有计算均局限于该内存空间。 2．单机内多个进程： ● 多个进程可以同时存在于单机内同一操作系统：由操作系统负责调度分时共享处理机资源（CPU 、内存、存储、外设等）； ● 进程间相互独立（内存空间不相交）：在操作系统调度下各自独立地运行，例如多个串行应用程序在同一台计算机中运行； ● 进程间可以相互交换信息：例如数据交换、同步等待，内存

些信息在进程间的相互交换，是实现进程间通信的唯一方式； ●最基本的消息传递操作：发送消息（send）、接受消息（receive）、进程同步（barrier）、规约（reduction）； ●消息传递的实现：共享内存或信号量，用户不必关心； 3．包含于通过网络联接的不同计算机的多个进程： ●进程独立存在：进程位于不同的计算机，由各自独立的操作系统调度，享有独立的CPU和内存资源； ●进程间相互信息交换：消息传递； ●消息传递的实现：基于网络socket机制,用户不必关心； 4．消息传递库函数: ●应用程序接口（API）：提供给应用程序（FORTRAN、 C、C++语言）的可直接调用的完成进程间消息传递

MPI并行编程系列二快速排序

MPI并行编程系列二快速排序阅读：63评论：0作者：飞得更高发表于2010-04-06 09：00原文链接在上一篇中对枚举排序的MPI并行算法进行了详细的描述和实现，算法相对简单，采用了并行编程模式中的单程序多数据流的并行编程模式。在本篇中，将对快速排序进行并行化分析和实现。本篇代码用到了上篇中的几个公用方法，在本篇中将不再做说明。在本篇中，我们首先对快速排序算法进行描述和实现，并在此基础上分析此算法的并行性，确定并行编程模式，最后给出该算法的MPI实现。一、快速排序算法说明快速排序时一种最基本的排序算法，效率相对较高。其基本思想是：在当前无序数组R[1,n]中选取一个记录作为比较的"基准"，即作为排序中的"轴"。经过一趟排序后，当前无序数组R[1,n]就会以这个轴为核心划分为两个无序的子区r1[1,i-1],r2[i,n]。其中左边的无序子区都会比"轴"小，右边的无序子区都会比"轴"大。这样下一趟排序，我们就可以对这两个子区用同样的方法进行划分排序，知道所有的无序子区中的记录均排好为止。根据算法的说明，快速排序时一个典型的递归算法，算法描述如下：无序数组R[1],R[2],.,R[n] quick_sort(R,start,end) if(start end) r=partion(R,start,end) quick_sort(R,start,r-1) quick_sort(R,r+1,end) endif end quick_sort方法partion的作用就是选取"轴"，并将数组分为两个无序子区，并将该"轴"的最终位置返回，在这里我们选择数组的第一个元素为"轴"，其算法描述为： partion(R,start,end) r=R[start] while(start end)

MPI并行编程系列二快速排序

MPI 并行编程系列二快速排序阅读：63 评论：0作者：飞得更高发表于2010-04-06 09 ：00 原文链接在上一篇中对枚举排序的MPI并行算法进行了详细的描述和实现，算法相对简单，采用了并行编程模式中的单程序多数据流的并行编程模式。在本篇中，将对快速排序进行并行化分析和实现。本篇代码用到了上篇中的几个公用方法，在本篇中将不再做说明。在本篇中，我们首先对快速排序算法进行描述和实现，并在此基础上分析此算法的并行性，确定并行编程模式，最后给出该算法的MPI实现。一、快速排序算法说明快速排序时一种最基本的排序算法，效率相对较高。其基本思想是：在当前无序数组R[1,n] 中选取一个记录作为比较的"基准" ，即作为排序中的"轴" 。经过一趟排序后，当前无序数组R[1,n] 就会以这个轴为核心划分为两个无序的子区r1[1,i-1],r2[i,n] 。其中左边的无序子区都会比"轴"小，右边的无序子区都会比" 轴" 大。这样下一趟排序，我们就可以对这两个子区用同样的方法进行划分排序，知道所有的无序子区中的记录均排好为止。根据算法的说明，快速排序时一个典型的递归算法，算法描述如下：无序数组R[1],R[2],.,R[n] quick_sort(R,start,end) if(start end) r=partion(R,start,end) quick_sort(R,start,r-1) quick_sort(R,r+1,end) endif end quick_sort 方法partion 的作用就是选取" 轴" ，并将数组分为两个

无序子区，并将该" 轴" 的最终位置返回，在这里我们选择数组的第一个元素为"轴" ，其算法描述为： partion(R,start,end) r=R[start] while(start end) while((R[end]=r)&&(start end)) end- end ehile R[start]=R[end] while((R[start]r)&&(start end)) start++ end wile R[end]=R[start] end while R[start]=r return start end partion 该排序算法的性能好坏主要取决于" 轴" 的选定，即无序数组的划分是否均衡。最好的情况下，无序数组每次都会被划为两个均等的无序子区，这是算法的负责度为o(nlogn) ；最坏的情况，无序数组每次划分都是左边n-1 个元素，右边0 个元素，这时算法的复杂度为 o(n A2)。在通常的情况下，该算法的复杂度会依然保持在o(nlogn) ，上只不过具有更高的常数因子。因此，选定一个有效地"轴"，成为该算法的关键。一般情况下，会选定无序数组的第一个，中间或者是最后一个元素作为算法的"轴"，我们可以对着三个元素进行比较，取大小居中的那个元素作为该算法的" 轴" 。、快速排序算法的串行实现确定在什么条件下终止递归操作。主函数代码如下： 1：void quick_sort_function(int*array,int start,int last){2

基于MPI并行编程环境简述

并行计算课程报告题目：MPI并行编程环境概要指导老师：阮幼林教授学院：信息工程学院班级：信息研1001班姓名：余华学号：104972102820 时间：2011年01-10

摘要随着科技的发展，新一代的计算机，无论计算能力和计算速度，都比旧的计算机优越。但人类对高性能计算的需求，也不断提高.除了增强处理器本身的计算能力外，并行处理是一种提高计算能力的有效手段.从前，并行处理要采用昂贵的专用计算机，随着个人计算机及网络成本下降，现已广泛用分布式网络计算机系统进行并行处理。在分布网络计算机系统中，采用消息传递方法实现进程间的通讯。当前流行基于消息传递的并行编程环境是MPI(Message Passing Interface)。关键词：消息传递；消息传递接口；并行编程； Abstract Because of the development of technology, the new generation of computer should be better than the former ones in the power and speed of computing. But the people's demand of high performance of computing is increasing too. In addition to enhancing the computing power of the processor, parallel processing is also an efficient way to enhance the power of computing. In the past, the parallel processing can only run on the expensive and special computers. As the cost of personal computers and networks decreased, and now, it is popular to process the parallel processing on the distributed network computing systems. In the distributed network computing systems, message passing is used for the communication between processes. MPI (Message Passing Interface) are common development environments of parallel processing based on message passing. Keyword：Message passing; Message passing interface; Parallel programming;

基于MPI的并行计算程序设计测试报告

中南大学 CENTRAL SOUTH UNIVERSITY 基于MPI的并行计算程序设计测试报告学院：软件学院专业：软件工程学号：姓名：指导教师： 20**-**-**

基于MPI的并行计算程序设计测试报告一．并行计算概述 1.采用并行计算的原因： ?串行程序速度提升缓慢。从串行程序的发展来讲，一方面，物理速度渐变发展，芯片速度每18个加快一倍，而内存传输率每年加快9%。另一方面，物理极限无法突破，芯片晶体管接近了原子极限，传输速度不可能超过光速。 ?可以加快速度。更短的时间内解决相同的问题，相同的时间内解决更多的复杂的问题。 ?可以加大规模。并行计算可以计算更大规模的问题。 2.并行计算简介并行计算（Parallel Computing）是指同时使用多种计算资源解决计算问题的过程。为执行并行计算，计算资源应包括一台配有多处理机（并行处理）的计算机、一个与网络相连的计算机专有编号，或者两者结合使用。并行计算的主要目的是快速解决大型且复杂的计算问题。此外还包括：利用非本地资源，节约成本，使用多个“廉价”计算资源取代大型计算机，同时克服单个计算机上存在的存储器限制。为利用并行计算，通常计算问题表现为以下特征：1.将工作分离成离散部分，有助于同时解决；2.随时并及时地执行多个程序指令；3.多计算资源下解决问题的耗时要少于单个计算资源下的耗时。对并行处理的需求极大的促进了并行技术的发展，因此许多大规模并行计算机系统相继问世，如PVP、SMP、MPP、DSM等。但传统的并行系统的高成本性、专用性、系统规模的不可伸缩性等使其难以推广到普通的商业应用和科学计算中。高性能集群系统因其性能价格比高、高可复用性、强可扩展性、用户编程方便等优点在科学研究中得到了广泛的应用。并行计算机系统的出现就需要对程序进行并行设计，这种需求使得各种不同的并行编程环境得到了很大发展。现行高性能计算机系统中使用的并行编程环境主要有两种：PVM(Parallel Virtual Machine)和MPI(Message Passing Interface)。PVM的开发始于1988年，由美国橡树岭国家实验室发起。目前很多人采用MPI作为并行开发环境。 3.并行计算的相关内容 ?存储方式。共享内存：ccNUMA,SMP；分布式内存：MPP,Cluster。 ?三种计算模式。Uniprocessor,shared memory,distribute memory. ?并行化分解方法。任务分解：多任务并行执行；功能分解：分解被执行的计算；区域分解:分解被执行的数据。 ?并行算法的分类。按运算的基本对象：分数值并行算法和非数值并行算法。按进程间的依赖关系：分同步并行算法，异步并行算法和纯并行算法。按并行计算的任务大小：分粗粒度并行算法，中粒度并行算法和细粒度并行算法。