快速多极与常规边界元法机群并行计算的比较

合集下载

快速多极子算法

快速多极子算法快速多极子算法（Fast Multipole Method，简称FMM）是一种高效的计算N体问题的方法，它可以在O(N)的时间复杂度内求解N个粒子之间的相互作用力。

本文将从FMM的基本思想、算法流程、优缺点以及应用领域等方面进行详细介绍。

一、基本思想FMM的基本思想是将远距离作用力的计算转化为局部近距离作用力的计算，从而大大降低了计算复杂度。

具体来说，FMM将空间分割成一系列边长逐级递减的立方体网格，在每个网格中以多项式函数来逼近粒子分布，并利用多极展开和局部展开等技术来实现快速计算。

二、算法流程1. 空间划分：将整个空间划分成若干个立方体网格，并确定每个网格中包含的粒子数目。

2. 多项式逼近：对于每个网格中包含的粒子，采用多项式函数来逼近其分布情况。

3. 多极展开：利用多项式函数对每个网格进行多极展开，并计算其多极矩和电荷矩。

4. 局部展开：对于近距离作用力，采用局部展开技术来计算每个网格中的相互作用力。

5. 远距离作用力计算：对于远距离作用力，采用多极展开技术来计算每个网格之间的相互作用力。

6. 精度控制：根据需要，可以通过增加多项式阶数或网格密度等方式来提高计算精度。

三、优缺点1. 优点：(1) 计算速度快：FMM的时间复杂度为O(N)，比传统的直接求解方法要快得多。

(2) 空间复杂度低：FMM只需要存储每个网格中的多项式系数和电荷矩等信息，空间占用较小。

(3) 适用范围广：FMM不仅适用于N体问题，还可以应用于其他需要求解远距离相互作用力的问题。

2. 缺点：(1) 实现难度较大：FMM需要掌握多项式函数、多极展开等专业知识，并且实现过程较为复杂。

(2) 对粒子分布要求较高：FMM需要将空间划分成若干个网格，并要求每个网格中的粒子分布较为均匀，否则会影响计算精度。

四、应用领域FMM在计算物理、计算化学、电磁学等领域都有广泛应用。

例如，在分子动力学模拟中，FMM可以用于求解分子之间的相互作用力，从而得到分子的结构和性质等信息；在电磁场模拟中，FMM可以用于求解电荷分布所产生的电场和磁场等问题。

《二维弹性快速多极边界元算法及截断误差分析》范文

《二维弹性快速多极边界元算法及截断误差分析》篇一一、引言随着计算科学技术的不断进步，有限元法已经成为一种解决各种工程问题的重要工具。

边界元法是其中一种有效的技术，特别是针对复杂的边界问题，如弹性力学问题。

在本文中，我们将介绍一种高效的二维弹性快速多极边界元算法，并对其截断误差进行分析。

二、二维弹性快速多极边界元算法2.1 算法基础多极边界元算法（Multiple Boundary Element Method）的基本原理在于其采用边界的多个多项式作为逼近基底来对复杂的区域进行逼近和解析。

而在弹性力学中，这一原理则应用在力场和位移场的求解上。

在二维空间中，我们可以通过定义边界的节点和相应的多项式来描述物体的形状和状态。

2.2 快速多极算法快速多极算法是一种高效的计算方法，它通过将计算过程分解为多个子过程，并利用并行计算技术来提高计算效率。

在二维弹性快速多极边界元算法中，我们通过构建一个层次化的计算结构，使得每个子过程都能独立地并行进行，从而大大提高了计算速度。

三、截断误差分析在数学计算中，我们往往只能获得近似的结果，因为各种因素的影响会导致我们无法得到完全精确的结果。

这就产生了截断误差。

对于二维弹性快速多极边界元算法来说，截断误差主要来源于以下几个方面：3.1 逼近基底的选择我们采用的多项式逼近基底只是一种近似逼近方法，并不能完全精确地描述所有物体的形状和状态。

因此，我们选择的逼近基底的数量和类型都会对结果产生一定的影响，从而产生截断误差。

3.2 计算过程中的舍入误差由于计算机的精度限制，计算过程中可能无法得到完全精确的解。

例如，对于非常小的数或者需要进行多次乘除法操作的数，可能会产生舍入误差。

这些舍入误差会在计算过程中累积，最终对结果产生影响。

3.3 截断的边界条件在处理实际问题时，我们往往需要对问题进行截断处理。

例如，在处理无限大的区域时，我们只能选择一个有限大的区域进行计算。

这种截断处理会导致一些边界条件无法得到满足，从而产生截断误差。

二维位势问题快速多极虚边界元解

得了相应成果；就边界元直接法而言，一些学者结合该算法思想开展了很多有意义的应用研究工作－．于边界元间接法，８对有学者提出了快速多极虚边界元法ｎ】并对大规模弹性问题进行了，模拟．本文拟将快速多极虚边界元法用于位势问题的求解．
】为二维位势问题控制方程的基本解，下所示，）如
ｕ（，＝ｅＧ）（ｚｚＲ一（】７ｏ）【ｚ）
：
Ｒ一Ｇ，］（ｅｏ）８［ｚ）
为了导出Ｇ，）（。２的快速多极展开格式，现引入两个辅助函数，即
１二维位势问题的虚边界元法思想
虚边界元法的基本思想可由文献［１—４获］
知，此处只作以简述．设所研究的区域为ｎ，实边界为ｒ，虚边界为Ｓ见图１；（）对于实边界上的场点必存在有实际问题所给定的位势值（或位）势沿该点法向的方向导数值ｑ）又设在虚拟边（．
，
阵的储存量将达到Ｄ Ⅳ ）（量级；若采用类似于高斯消去法直接求解技术计算，该计算量将达到
界Ｓ上存在有能使实际边界条件得以满足的相应
虚拟场源函数（）这里的ｙｙ，称为源点；若对应的
虚拟场源函数存在，则原问题的域内位移及其边界上的位势和位势沿某一方向ｎ的方向导数可由下式计算（不考域内场源）即，
一
步研究，为实践提高边界元法的计算效率和减少
ｙ
存储空间提供了可行的思路；这也为边界元法和虚
边界元法扩大应用空间带来了新的契机．

并行计算：使用并行计算提高计算效率的技巧和方法

并行计算：使用并行计算提高计算效率的技巧和方法并行计算是一种通过同时处理多个任务或部分任务来提高计算效率的方法。

在计算机科学领域中，随着数据量不断增大和计算需求不断增加，传统的串行计算方式已经无法满足要求。

因此，并行计算技术成为了一种重要的解决方案。

并行计算的主要优点包括：提高计算效率、减少计算时间、增加计算容量、降低成本等。

利用多核处理器、集群、云计算等技术，可以实现并行计算。

以下是一些提高并行计算效率的技巧和方法：1.任务分解：将大任务分解成多个子任务，然后同时执行这些子任务，提高整体计算效率。

在任务分解过程中，要考虑到任务之间的依赖关系和数据之间的传输延迟，避免出现资源竞争和数据不一致的情况。

2.负载均衡：合理分配任务给不同的处理单元，避免出现某一处理单元负载过重而导致整体性能下降的情况。

负载均衡可以通过动态调整任务分配策略来实现，根据任务的执行情况进行监控和调整。

3.数据传输优化：在并行计算过程中，数据传输往往是影响计算效率的关键因素之一。

通过减少数据传输量、优化数据传输路径、减少数据传输延迟等方法，可以提高计算效率。

4.并行编程模型：选择合适的并行编程模型对于提高计算效率至关重要。

常见的并行编程模型包括MPI、OpenMP、CUDA等，根据具体的应用场景和硬件平台选择合适的并行编程模型可以提高计算效率。

5.并行算法设计：设计并行算法时，需要考虑到并行计算的特点，合理利用并行计算资源，减少通信开销和数据冗余，提高算法并行度和并行效率。

6.硬件优化：在进行并行计算时，选择合适的硬件设备也非常重要。

优化硬件配置、选择性能强劲的处理器和内存、使用高速网络连接等方法可以提高并行计算效率。

7.并行计算框架：利用现有的并行计算框架如Hadoop、Spark等，可以简化并行计算的开发流程，提高开发效率，同时也能够提高计算效率。

8.任务调度策略：合理的任务调度策略能够有效地利用计算资源，避免资源浪费和资源竞争，提高整体计算效率。

并行计算基础知识-中国科学技术大学超级计算中心

十年来体系结构的演变
2018/9/4
并行计算基础知识
29/66
机群：厂家面临的问题
怎样避免同质化？

一样的CPU、一样的网络、一样的操作系统、几乎一样的机群系统不一样的用户需求，一样的系统能最优满足？ Scalability Usability Manageability Availability 可扩展性易用性可管理性高可用性

最大可“在线”扩展到80个机柜 1300个CPU 每秒6.75万亿次峰值速度 4000G内存 600T存储 1200A最大电流，160千瓦最大功耗的海量处理系统
并行计算基础知识 35/66
2018/9/4
初步的面向网格的特点
Grid Terminal智能控制台能够实现庞大系统的安全管理 GridView网格监控中心软件则提供了逻辑视角、视角的可伸缩性、历史记录分析三项特色，被称为系统的“千里眼”。
Earth Simulator
2018/9/4
并行计算基础知识
8/66
Earth Simulator
2018/9/4
并行计算基础知识
9/66
ASCI Q
1024 nodes 8cpu/node 10240Gflops 7727Gflops
2018/9/4
并行计算基础知识
10/66
ASCI white
设想logp模型中的log都为0那么logp模型就等同于pram模型2019310并行计算基础知识5566各种计算模型比较模型属性pramaprambsplogp体系结构simdsmmimdsmmimddmmimddmmimddm计算模式同步异步异步异步异步同步方式自动同步路障同步路障同步隐式同步路障同步模型参数单位时间步d读写时间b同步时间p处理器数g带宽因子l同步间隔l通信延迟o额外开销g带宽因子p处理器数l信包长度s发送建立时间h通信延迟计算粒度细粒度中粒度中粒度粗粒度中粒度粗粒度中粒度粗粒度粗粒度通信方式读写共享变量读写共享变量发送接收消息发送接收消息发送接收消息地址空间全局地址空间单地址空间单多地址空间单多地址空间多地址空间2019310并行计算基础知识5666性能评价与benchmark常见benchmark简介2019310并行计算基础知识5766加速比定律在给定的并行计算系统上给定的应用并行算法并行程序的执行速度相对于串行算法串行程序加快的倍数就是该并行算法并行程序的加速比

多介质工频电场分析的快速多极子边界元法

摘要：对变电站关键设备工频电场计算存在计算效率低的问题，针结合快速多极子法和边界元模拟电荷法提出一种快速计算多介质工频电场分布的方法。根据边界元模拟电荷法基本原理建立变电
站关键设备工频电场计算模型。利用快速多极子法可以加速矩阵与向量乘积效率的特点，得到提高多介质工频电场分布的快速算法。并应用该方法具体计算５０ｋ变电站中开关场内刀闸周围的电０Ｖ场分布。结果表明：快速多极子边界元模拟电荷法的计算结果与积分工程软件的仿真结果的最大相对误差为８１。在满足工程误差允许前提下，．％该方法相对于传统边界元模拟电荷法运算速度快、内存消耗少、计算精确度高，适合于求解大尺度多未知量、多自由度的工频电场计算问题。关键词：工频电场；变电站；边界元法；快速多极子；算方法计
ＺＡＧＺａ．ｎＤＮｎＨＮｈｎ１ｇ，ＥＧＪ，１Ｄ —ｅＺＵＺｅ．ｉＨｉｇ，皿Ｗｅｏｕ３ｅｎ，Ｈｈｎｈｗａ，ＵＱａ３ｎｉ
（．ｔｅＫｙＬｂｒｔｙｏｏｅｒｓｉｉｎＥｕｐｅｔＳｓｍＳｃｒｙａｄＮｗＴｃｎｌｙＣｏｇｉｎｖｒｉ，１Ｓａｅａｏａｒｆｗｒａｍｓｏｑｉｍｎ＆ｙｔｅｕｉｎｅｅｈｏｇ，ｈｎｑｎＵｉｓｙｔｏＰＴｎｓｅｔｏｇｅｔ
张占龙邓军，李德文朱祯海胡强。何为，，，，
（．１重庆大学输配电装备及系统安全与新技术国家重点实验室，重庆４０３；．０００２中国南方电网超高压输电

大目标声散射计算的快速多极边界元法

大目标声散射计算的快速多极边界元法传统的数值方法，如有限差分法和有限元法等，在处理大目标声散射问题上存在一些困难。

这是因为这些方法需要在整个计算域上离散所有的网格单元或单元。

对于较大的链路，这将导致计算时间和内存的大大增加。

为了克服这个问题，研究人员提出了快速多极边界元法（Fast Multipole Boundary Element Method，FMBEM）。

快速多极边界元法是边界元法（Boundary Element Method，BEM）的一种重要扩展。

边界元法是一种基于积分方程的数值方法，通过将问题分解为边界和内部两个区域来进行计算。

边界元法的优点是能够自动满足边界条件，并且仅需要在边界处离散网格单元。

但是，在处理大目标声散射问题时，边界元法面临着计算量大的问题，特别是在计算Green函数时。

快速多极边界元法通过使用多级化的算法和多极展开技术来解决这个问题。

多级化的算法将计算域划分为不同的层次，在不同的层次上使用不同的计算方法。

这样一来，计算量会随着层次的增加而减少。

多极展开技术则通过将波场表示为一组距离中心点的多级展开来加速计算。

这种展开使得在较远距离处的计算成为可能，从而大大减少了计算时间。

快速多极边界元法在处理大目标声散射问题上具有许多优点。

首先，它能够处理非常大的计算域，能够处理数百万个边界单元。

其次，它能够显著减少计算时间和内存需求。

通过将波场表示为多极展开，计算时间可以减少到O(NlogN)，其中N是边界单元的数量。

此外，快速多极边界元法还具有高度的可扩展性和并行化能力，可以在大规模并行计算机上运行。

总之，快速多极边界元法是处理大目标声散射问题的一种高效的数值方法。

它通过使用多级化的算法和多极展开技术，能够显著减少计算时间和内存需求。

这种方法在工程领域具有广泛的应用前景，可以用于设计和优化声学传感器、无人机、航空器和水声通信系统等。

快速多极边界元方法在大规模声学问题中的应用

S
⎡ ⎢− ⎢⎣
∂
2Gk ∂ny
(x, y ∂nx
)
φ
(
y)
+
∂Gk (x, ∂nx
y)
⎤ q( y)⎥ dSy
⎦
+
∂φin (x) ∂nx
(5)
方程式(5)与方程式(3)一样，对于求解外部声波问题，这两组边界积分方程具有不同的伪频率，这
84
机械工程学报
第 47 卷第 7 期期
些频率下无法求得唯一解。BURTON 等提出将方程式(3)、(5)线性组合以求得任意频率下的唯一解方法

(6)
式中，α 为非零耦合常数，通常虚部非零，一般可
取为 α = i / k 。文献[16]已证明方程式(6)可以在任意频率下求
得唯一解。然而，方程式(6) 存在一个难题，即 Helmholtz 积分方程的法向导数引入一个超奇异积分，直接计算超奇异积分十分困难，必须将它规划
法用于克服传统边界元方法非唯一解的缺陷，其中 Burton-Miller 方法[16]是被公认最为有效及鲁棒性的方法。因此，本文运用 Burton-Miller 方法来克服传统边界元方法非唯一解问题。
将方程式(3)对配置点 x 处的边界外法线方向 nx 求导，可以得到如下边界积分方程式
∫ C(x) ∂φ(x) = ∂nx
∫ ∫ α
S
∂
2Gk (x, y ∂ny ∂nx
)
φ
(
y)
dS
y
+
S
∂Gk (x, ∂ny
y) φ( y) dSy
=
∫ ∫ S Gk (x, y)q( y) dSy

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

线性代数方程组．对方程重新排列，把未知量移到
方程左端，己知量移到方程右端，并把已知量和右
端的系数矩阵相乘，得到方程
舣＝占
（２）
其中Ａ是重新排列后，与未知量相关的系数矩阵，
它是一个非对称满阵；ｘ为未知列向量，曰为已知
量与右端系数矩阵相乘后的列向量。求解方程（２）
即得到所有边界上的未知量。
２调用ＳｃａＩ，ＡＰＡＣＫ的常规求解方法
ｃｏ（ｘ）ｕｊ（ｘ）＋Ｊｌ弓（五ｙ）ｕｊ（ｙ）ｄＳ２。（１）
Ｉ。蛎（ｚ，ｙ）ｔＩ（ｙ）ｄＳ
式中“：（ｘ，ｙ）和ｆ；（ｘ，ｙ）是弹性力学位移方程的基本
解，ｘ，Ｙ分别为基本解中的源点和场点。“，（ｙ）和
ｔｊ（ｙ）分别是边界Ｙ点的位移和面力；ｃｆ『（ｘ）是依赖
于边界点ｘ处边界几何特征的常数。
对边界积分方程进行按边界单元离散后形成
ＴＨＥＣｏＭＰＡＲＩＳＯＮｏＦＰＡＲＡＬＬＥＬＣｏＭＰＵＴＡＴＩｏＮＢＥＴＷＥＥＮＦＡＳＴＭＵＩ。ＴＩＰｏＬＥＡＮＤＣｏＮＶＥＮＴＩｏＮＡＬＢＥＭｏＮＰＣＣＬＵＳＴＥＲ
ＬＥＩＴｉｎｇ，‘ＹＡＯＺｈｅｎ．ｂａｎ，ＷＡＮＧＨａｉ．ｔａｏ
（ＤｅｐａｒｔｍｅｎｔｏｆＥｌｌｇｉｎｅｅｒｉｎｇＭｅｃｈａｎｉｃｓ，ＴｓｉｎｇｈｕａＵｎｉｖｅｒｓｉｔｙ，Ｂｅｉｊｉｎｇ１０００８４，Ｃｈｉｎａ）
快速多极边界元法采用了树的存储结构，每个树结构节点包括了相邻的一定个数的边界单元。一般来说，树结构是非线性且不平衡的数据结构，对树结构的任务划分和划分得到的任务之间的通信操作比常规矩阵要复杂ｐ】，这也是快速多极边界元并行格式区别于常规边界元的主要难点。
为并行计算所需的处理器的个数，划分的单位是树结构的节点，划分的目标是保证每个任务中含有大致相同的单元个数，而划分的方法是首先对树结构的节点和边界元法中边界单元按照同样的空间顺序进行排序，然后再进行以节点为单位的划分，图２给出了三维问题划分为４个任务的自动划分示意图。在并行计算中首先根据任务间树结构的相互关系判断消息传递关系，然后调用ＭＰＩ函数将需要通信的展开系数的进行传递。
。“
ｎ’＝ｌｍ。＝ｌ
其中
万方数据
３０
工
程
力
学
以ｗ（‰）＝∑∑簖嚣－（ｙｏ，Ｘｏ）Ｃ．，ｏｏ）（５）
ｎ＝ｌｍ＝ｌ
“ｗ称为局部展开系数，ＸＯ为满足ＩＸｏＸｌ－＜｛ｌ‰ｙｏｌ的
任一点。通过将模型划分为树结构，并递归的使用这两种展开，可以完成式（１）中积分的计算。
由式（５）可以看出，两组展开系数的转换计算量为ｏ（ｐ４），该计算当Ｐ较大时比较费时，Ｒｏｋｈｌｉｎ和
』。“；（ｘ，ｙ）ｔｊ（ｙ）ｄＳｍ∑∑‰（‘Ｙｏ）ｃ．。（蜘）（３）。ｎ＝ｌｍ＝ｌ
其中Ｐ为多极展开阶数，ｃｎ。（舶）为多极展开系数，
Ｙｏ为满足ｌＹｏＹ阵士ｌＹｏｘｌ的任意一点，式（１）还可以进一步展开为如式（４）的局部展开级数。
ｆ。”沁ｙ）ｔｊ（ｙ）ｄＳｚ∑艺‰．（五ｘｏ）ｄ．ｗ（峋）（４）
ＳｃａＬＡＰＡＣＫ全称为ＳｃａｌａｂｌｅＬｉｎｅａｒＡｌｇｅｂｒａＰＡＣＫａｇｅ［”，是标准线性代数方程组求解函数库ＬＡＰＡＣＫ的分布式并行版本，通过调用统一命名的接口函数，可以编写跨平台的求解程序。为了提高数据的局部性，ＳｃａＬＡＰＡＣＫ采用分块矩阵的算法，
需要将全局的系数矩阵在积分的过程中分布到各个计算节点中。图１表示的是如何将一个全局矩阵按照二维子块循环方法映射到四个计算节点中去，图中的每个格子表示一个子块矩阵，其大小的选取与软硬件等许多因素密切相关，通常通过实际测试得到最优值，本常规边界元并行程序中选取为１９２×１９２。该映射方案不仅保证了负载的均衡，而且与常用的卷帘式存储方案相比，可以更加合理地对子块矩阵进行消去，克服消去过程的串行瓶颈，并充分利用现代计算机的高速缓冲区结构，从而显著提高计算效率【７ＪＪ。通过将单元数据广播到各个计算节点中，再由各个计算节点积分出其所需存储的子块系数矩阵，最后调用ＳｃａＬＡＰＡＣＫ的进程网格初始化函数和求解函数，完成并行求解。
本文应用快速多极算法实现了三维弹性力学快速多极边界元的并行计算，并与传统的通过调用ＳｃａＬＡＰＡＣＫ的单域常规边界元并行计算进行了比较。数值算例表明，快速多极边界元并行计算，能使解题规模有数量级的提高，计算速度明显提高，而且并行效率也优于常规边界元并行算法。
１边界元法数值计算格式
考虑一个三维的各向同性弹性体，其边界由ｓ表示。在无体力作用的情况下，可列出如下弹性力学边界积分方程：
４数值算例
４．１计算模型本文选择的模型为在立方体内随机分布不同
数目的球形孔洞，孔洞数目从１个取到１００个，分布具有随机性。其中立方体边界离散为３，０７２个常值面元，每个球形孔洞离散为３９２个常值面元，如图３所示。自由度最小为１０，３９２，最大为１２６．８１６。所有模型边界条件均为约束立方体法向为ｘ，Ｙ，ｚ负方向的三个表面的法向位移，载荷为ｘ正方向的表面一个均布拉力１００ＭＰａ。
收稿日期ｌ２００５．０３．１５；修改日期：２００５—０７—２Ｉ基金项目；国家自然科学基金（１０４７２０５１１
作者简介：雷霆（１９７７），男，北京．博士生，从事计算力学研究；＋姚振汉（１９３９），男．江苏．教授－从事计算力学研究（Ｅ－ｍａｉｌ：ｄｅｍｙ曲＠ｔｓｉｎｇｈｔｍｅｄｕｃｎ）；王海涛（１９７７），男，山东，讲师ｔ博士．从事计算力学研究。
随着计算机技术的迅速发展，并行计算已成为缩短计算时间，扩大解题规模和提高计算精度的有效手段。网络机群系统下的并行计算环境，由于其较高的性价比和程序的高可移植性，在我国已经成为当前的主流并行环境。几年前，在作者的研究组，通过基于常规边界元法的并行计算使解题规模从单台微机的数千提高到了大约５万自由度【ｌ一。但是这还是不能满足求解大规模复杂工程问题的要求。
Ｇｒｃｅｎｇａｒｄ于９０年代末提出进～步使用指数展开以完成该计算的方法［４】，通过将多极展开系数到指数展开系数的转换、指数展开系数的原点转换以及指数展开系数到局部展开系数的转换，以此三步转换来代替式（５）中的直接转换，可以证明Ｈ，虽存储量略有增加，但计算量上将有大幅下降，引入此展开的快速多极算法被称为新版本快速多极算法，设指数展开阶数为ｇ，则其计算精度将同时依赖于Ｐ和ｇ的选择，与之对应，不采用指数展开的快速多极算法被称为原始版本快速多极算法，而其计算精度仅依赖于Ｐ的选择。关于计算精度的选择将在文中数值算例部分讨论。
全局矩阵
分布式存储矩阵
图１矩阵的分布式存储方式
Ｆｉｇ１Ｄｉｓｔｒｉｂｕｔｅｄｓｔｏｒａｇｅｐａｔｔｅｍｏｆｔｈｅｃｏｅｆｆｉｃｉｅｎｔｍａｔｒｉｘ
３快速多极边界元并行求解方法
快速多极算法（ＦＭＭ）Ｒｏｌｄａｌｉｎ和Ｇｒｅｅｎｇａｒｄ于上世纪８０年代末提出，其特点是在Ｏ（Ｎ）的计算复杂度和存储复杂度下完成矩阵向量的近似相乘，再结合迭代算法ＧＭＲＥＳ完成线性方程组的求解。基本思路是通过引入核函数的级数展开，并通过存储展开级数的系数以用来计算矩阵向量相乘，式（１）中的积分可以展开为如下的多极展开级数（具体表达式参见文献［６】）。
Ａｂｓｔｒａｅｔ：Ｆｏｒ３Ｄｅｌａｓｆｉｃｉｔｙｐｒｏｂｌｅｍｓ，ｔｈｅｐａｒａｌｌｅｌｃｏｍｐｕｔａｔｉｏｎｓｂａｓｅｄｏｎｔｈｅｆａｓｔｍｕｌｔｉｐｏｌｅａｎｄｔｈｅｃｏｎｖｅｎｔｉｏｎａｌｂｏｕｎｄａｒｙｅｌｅｍｅｎｔｍｅｔｈｏｄ（ＢＥＭ）ｏｎＰＣｃｌｕｓｔｅｒａｒｅｃｏｍｐａｒｅｄ．ＴｈｅｐａｒａｌｌｅｌｃｏｍｐｕｔａｔｉｏｎｏｆｃｏｎｖｅｎｔｉｏｎａｌＢＥＭａｐｐｌｉｅｓＧａｕｓｓｅｌｉｍｉｎａｔｉｏｎｂｙｃａｌｌｉｎｇｔｈｅＳｃａＬＡＰＡＣＫｌｉｂｒａｒｙ，ｗｈｉｌｅｔｈｅｆａｓｔｍｕｌｔｉｐｏｌｅｖｅｒｓｉｏｎｉｓｉｍｐｌｅｍｅｎｔｅｄｂｙｐｒｏｇｒａｍｍｉｎｇｗｉｔｈＡＮＳＩＣ＋＋ａｎｄＭＰＩｒＭｅｓｓａｇｅＰａｓｓｉｎｇＩｎｔｅｒｆａｃｅ）．ＢｏｔｈａｐｐｒｏａｃｈｅｓａｒｅｔｅｓｔｅｄｏｎｔｈｅｓａｍｅＰＣｃｌｕｓｔｅｒ．ＮｕｍｅｒｉｃａｌｅｘａｍｐｌｅｓｓｈｏｗｔｈａｔｔｈｅｓｃａｌｅｏｆｓｏｌｖａｂｌｅｐｒｏｂｌｅｍｓｃａｎｂｅｉｎｃｒｅａｓｅｄｓｉｇｎｉｆｉｃａｎｔｌｙｆｏｒｔｈｅｆａｓｔｍｕｌｔｉｐｏｌｅＢＥＭ．ａｎｄｔｈａｔｔｈｅｃｏｍｐｕｔａｔｉｏｎａｌｓｐｅｅｄｉｓｍｕｃｈｆａｓｔｅｒｔｈａｎｃｏｎｖｅｎｔｉｏｎａｌＢＥＭ．Ｂｅｓｉｄｅｓ．ｔｈｅｐａｒａｌｌｅｌｓｐｅｅｄｕｐｏｆｔｈｅｆａｓｔｍｕｌｔｉｐｏｌｅＢＥＭｉｓａｌｓｏｈｉｇｈｅｒｔｈａｎｔｈａｔｏｆｔｈｅｃｏｎｖｅｎｔｉｏｎａＩｏｎｅ
图２树结构的任务划分方案Ｆｉｇ．２Ｔａｓｋｐａｒｔｉｔｉｏｎｓｃｈｅｍｅｏｆｔｈｅｔｒｅｅｓｔｒｕｃｔｕｒｅ
本文程序采用如下对于树结构节点的划分方案‘”１。整个区域被划分为ｎｐ个任务，其中ｎｐ通常
万方数据
图３立方体基体内随机分布球形孔洞
Ｆｉｇ．３Ｖｏｉｄｓｒａｎｄｏｍｌｙｄｉｓｔｒｉｂｕｔｅｄｉｎａｃｕｂｉｃｍａｔｒｉｘ
第２３卷第１１期２００６年１１月
Ｖ０１．２３Ｎｏ．１１Ｎｏｖ．２００６
工
程
力
学
ＥＮＧ矾ＥＥＲⅡｑＧＭＥＣＨＡＮＩＣＳ
文章编号：１０００－４７５０（２００６）１１－００２８－０５
快速多极与常规边界元法机群并行计算的比较
雷霆，＋姚振汉，王海涛
（清华大学工程力学系，北京１０快速多极与常规边界元法机群并行计算进行了比较。其中常规边界元法求解方程采用高斯消去法，通过调用标准并行求解函数库ＳｃａＬＡＰＡＣＫ实现；快速多极边界元法并行计算程序采用ＡＮＳＩｃ＋＋语言、调用ＭＰＩ并行通信库自行编写。两种程序均运行于同一机群并行环境。数值算例表明，在同样的机群条件下，采用快速多极边界元法可使解题规模有数量级的提高，计算速度明显高于常规边界元法，并行效率也优于常规边界元法。关键词；边界元法；并行计算；快速多极：ＳｃａＬＡＰＡＣＫ：ＭＰＩ中图分类号：０３４４５文献标识码：Ａ