快速多极与常规边界元法机群并行计算的比较

合集下载

快速多极子算法

快速多极子算法

快速多极子算法快速多极子算法(Fast Multipole Method,简称FMM)是一种高效的计算N体问题的方法,它可以在O(N)的时间复杂度内求解N个粒子之间的相互作用力。

本文将从FMM的基本思想、算法流程、优缺点以及应用领域等方面进行详细介绍。

一、基本思想FMM的基本思想是将远距离作用力的计算转化为局部近距离作用力的计算,从而大大降低了计算复杂度。

具体来说,FMM将空间分割成一系列边长逐级递减的立方体网格,在每个网格中以多项式函数来逼近粒子分布,并利用多极展开和局部展开等技术来实现快速计算。

二、算法流程1. 空间划分:将整个空间划分成若干个立方体网格,并确定每个网格中包含的粒子数目。

2. 多项式逼近:对于每个网格中包含的粒子,采用多项式函数来逼近其分布情况。

3. 多极展开:利用多项式函数对每个网格进行多极展开,并计算其多极矩和电荷矩。

4. 局部展开:对于近距离作用力,采用局部展开技术来计算每个网格中的相互作用力。

5. 远距离作用力计算:对于远距离作用力,采用多极展开技术来计算每个网格之间的相互作用力。

6. 精度控制:根据需要,可以通过增加多项式阶数或网格密度等方式来提高计算精度。

三、优缺点1. 优点:(1) 计算速度快:FMM的时间复杂度为O(N),比传统的直接求解方法要快得多。

(2) 空间复杂度低:FMM只需要存储每个网格中的多项式系数和电荷矩等信息,空间占用较小。

(3) 适用范围广:FMM不仅适用于N体问题,还可以应用于其他需要求解远距离相互作用力的问题。

2. 缺点:(1) 实现难度较大:FMM需要掌握多项式函数、多极展开等专业知识,并且实现过程较为复杂。

(2) 对粒子分布要求较高:FMM需要将空间划分成若干个网格,并要求每个网格中的粒子分布较为均匀,否则会影响计算精度。

四、应用领域FMM在计算物理、计算化学、电磁学等领域都有广泛应用。

例如,在分子动力学模拟中,FMM可以用于求解分子之间的相互作用力,从而得到分子的结构和性质等信息;在电磁场模拟中,FMM可以用于求解电荷分布所产生的电场和磁场等问题。

《二维弹性快速多极边界元算法及截断误差分析》范文

《二维弹性快速多极边界元算法及截断误差分析》范文

《二维弹性快速多极边界元算法及截断误差分析》篇一一、引言随着计算科学技术的不断进步,有限元法已经成为一种解决各种工程问题的重要工具。

边界元法是其中一种有效的技术,特别是针对复杂的边界问题,如弹性力学问题。

在本文中,我们将介绍一种高效的二维弹性快速多极边界元算法,并对其截断误差进行分析。

二、二维弹性快速多极边界元算法2.1 算法基础多极边界元算法(Multiple Boundary Element Method)的基本原理在于其采用边界的多个多项式作为逼近基底来对复杂的区域进行逼近和解析。

而在弹性力学中,这一原理则应用在力场和位移场的求解上。

在二维空间中,我们可以通过定义边界的节点和相应的多项式来描述物体的形状和状态。

2.2 快速多极算法快速多极算法是一种高效的计算方法,它通过将计算过程分解为多个子过程,并利用并行计算技术来提高计算效率。

在二维弹性快速多极边界元算法中,我们通过构建一个层次化的计算结构,使得每个子过程都能独立地并行进行,从而大大提高了计算速度。

三、截断误差分析在数学计算中,我们往往只能获得近似的结果,因为各种因素的影响会导致我们无法得到完全精确的结果。

这就产生了截断误差。

对于二维弹性快速多极边界元算法来说,截断误差主要来源于以下几个方面:3.1 逼近基底的选择我们采用的多项式逼近基底只是一种近似逼近方法,并不能完全精确地描述所有物体的形状和状态。

因此,我们选择的逼近基底的数量和类型都会对结果产生一定的影响,从而产生截断误差。

3.2 计算过程中的舍入误差由于计算机的精度限制,计算过程中可能无法得到完全精确的解。

例如,对于非常小的数或者需要进行多次乘除法操作的数,可能会产生舍入误差。

这些舍入误差会在计算过程中累积,最终对结果产生影响。

3.3 截断的边界条件在处理实际问题时,我们往往需要对问题进行截断处理。

例如,在处理无限大的区域时,我们只能选择一个有限大的区域进行计算。

这种截断处理会导致一些边界条件无法得到满足,从而产生截断误差。

二维位势问题快速多极虚边界元解

二维位势问题快速多极虚边界元解
得了相应成果 ; 就边界元直接法而言 , 一些学者结 合该算法 思想 开展 了很 多有意 义 的应用 研究 工 作- . 于边界元间接法 , 8 对 有学者提 出了快 速多 极 虚 边界 元 法 n 】并 对 大 规 模 弹 性 问 题 进 行 了 , 模拟 . 本文拟将快速多极虚边界元法用于位势问题 的求解 .
】 为 二维位 势 问题控 制方 程 的基 本解 , 下所示 , ) 如
u(, = e G ) ( zz R 一 ( 】 7 o) 【 z )

R 一 G ,] ( e o) 8 [ z )
为了导出 G ,) (。2 的快速多极展开格式 , 现引 入两个辅助函数 , 即
1 二维位势 问题 的虚边界元法思想
虚边界元法 的基 本思想 可 由文 献 [ 1—4 获 ]
知, 此处只作以简述 . 设所研究 的区域为 n, 实边界 为 r, 虚边界 为 S 见图 1 ; ( ) 对于实边界上 的场点 必存在有实际问题所给定 的位势值 ( 或位 ) 势沿该点法向的方向导数值 q )又设 在虚拟边 ( .

阵的储存量将达到 D Ⅳ ) ( 量级 ; 若采用类似于高 斯 消 去法 直 接求 解技 术计 算 , 该计 算 量将 达到
界 S 上存在有能使实际边界条件得以满足 的相应
虚拟场源函数 ( )这里的 y y, 称为源点 ; 若对应 的
虚拟场源函数存在 , 则原问题的域 内位移及其边界 上的位势和位势沿某一方向 n的方向导数可 由下 式计算 ( 不考域内场源)即 ,

步研究 , 为实践提高边界元法的计算效率和减少

存储空间提供 了可行 的思路 ; 这也为边界元法和虚
边界 元法扩 大应用空 间带来 了新 的契机 .

并行计算:使用并行计算提高计算效率的技巧和方法

并行计算:使用并行计算提高计算效率的技巧和方法

并行计算:使用并行计算提高计算效率的技巧和方法并行计算是一种通过同时处理多个任务或部分任务来提高计算效率的方法。

在计算机科学领域中,随着数据量不断增大和计算需求不断增加,传统的串行计算方式已经无法满足要求。

因此,并行计算技术成为了一种重要的解决方案。

并行计算的主要优点包括:提高计算效率、减少计算时间、增加计算容量、降低成本等。

利用多核处理器、集群、云计算等技术,可以实现并行计算。

以下是一些提高并行计算效率的技巧和方法:1.任务分解:将大任务分解成多个子任务,然后同时执行这些子任务,提高整体计算效率。

在任务分解过程中,要考虑到任务之间的依赖关系和数据之间的传输延迟,避免出现资源竞争和数据不一致的情况。

2.负载均衡:合理分配任务给不同的处理单元,避免出现某一处理单元负载过重而导致整体性能下降的情况。

负载均衡可以通过动态调整任务分配策略来实现,根据任务的执行情况进行监控和调整。

3.数据传输优化:在并行计算过程中,数据传输往往是影响计算效率的关键因素之一。

通过减少数据传输量、优化数据传输路径、减少数据传输延迟等方法,可以提高计算效率。

4.并行编程模型:选择合适的并行编程模型对于提高计算效率至关重要。

常见的并行编程模型包括MPI、OpenMP、CUDA等,根据具体的应用场景和硬件平台选择合适的并行编程模型可以提高计算效率。

5.并行算法设计:设计并行算法时,需要考虑到并行计算的特点,合理利用并行计算资源,减少通信开销和数据冗余,提高算法并行度和并行效率。

6.硬件优化:在进行并行计算时,选择合适的硬件设备也非常重要。

优化硬件配置、选择性能强劲的处理器和内存、使用高速网络连接等方法可以提高并行计算效率。

7.并行计算框架:利用现有的并行计算框架如Hadoop、Spark等,可以简化并行计算的开发流程,提高开发效率,同时也能够提高计算效率。

8.任务调度策略:合理的任务调度策略能够有效地利用计算资源,避免资源浪费和资源竞争,提高整体计算效率。

并行计算基础知识-中国科学技术大学超级计算中心

并行计算基础知识-中国科学技术大学超级计算中心

十年来体系结构的演变
2018/9/4
并行计算基础知识
29/66
机群:厂家面临的问题
怎样避免同质化?


一样的CPU、一样的网络、一样的操作系统、几乎一 样的机群系统 不一样的用户需求,一样的系统能最优满足? Scalability Usability Manageability Availability 可扩展性 易用性 可管理性 高可用性

最大可“在线”扩展到80个机柜 1300个CPU 每秒6.75万亿次峰值速度 4000G内存 600T存储 1200A最大电流,160千瓦最大功耗的海量处理系统
并行计算基础知识 35/66
2018/9/4
初步的面向网格的特点
Grid Terminal智能控制台能够实现庞大系 统的安全管理 GridView网格监控中心软件则提供了逻辑 视角、视角的可伸缩性、历史记录分析三 项特色,被称为系统的“千里眼”。
Earth Simulator
2018/9/4
并行计算基础知识
8/66
Earth Simulator
2018/9/4
并行计算基础知识
9/66
ASCI Q
1024 nodes 8cpu/node 10240Gflops 7727Gflops
2018/9/4
并行计算基础知识
10/66
ASCI white
设想logp模型中的log都为0那么logp模型就等同于pram模型2019310并行计算基础知识5566各种计算模型比较模型属性pramaprambsplogp体系结构simdsmmimdsmmimddmmimddmmimddm计算模式同步异步异步异步异步同步方式自动同步路障同步路障同步隐式同步路障同步模型参数单位时间步d读写时间b同步时间p处理器数g带宽因子l同步间隔l通信延迟o额外开销g带宽因子p处理器数l信包长度s发送建立时间h通信延迟计算粒度细粒度中粒度中粒度粗粒度中粒度粗粒度中粒度粗粒度粗粒度通信方式读写共享变量读写共享变量发送接收消息发送接收消息发送接收消息地址空间全局地址空间单地址空间单多地址空间单多地址空间多地址空间2019310并行计算基础知识5666性能评价与benchmark常见benchmark简介2019310并行计算基础知识5766加速比定律在给定的并行计算系统上给定的应用并行算法并行程序的执行速度相对于串行算法串行程序加快的倍数就是该并行算法并行程序的加速比

多介质工频电场分析的快速多极子边界元法

多介质工频电场分析的快速多极子边界元法

摘 要 : 对 变电站 关键设备 工频 电场计 算存在计 算效 率低的 问题 , 针 结合快 速 多极 子法和边界 元模 拟 电荷法提 出一种快速计算 多介质工频 电场分布的方法 。根据边界元模拟 电荷 法基本原理 建立 变电
站 关键 设备工频 电场计算模 型。利用快速 多极子 法可 以加速 矩 阵与 向量乘 积效率 的特点 , 得到提 高 多介质工频 电场分布的快速算法。并应 用该 方法具体计 算 50k 变 电站 中开 关场 内刀闸周 围的 电 0 V 场分布。结果表明 : 快速 多极 子边界元模 拟 电荷 法的计 算结果 与积分 工程软件 的仿真 结果的 最大相 对误 差为 8 1 。在 满足 工程误 差允许前提 下, .% 该方 法相 对 于传 统边界 元模拟 电荷法运 算速度 快、 内 存 消耗 少、 计算精确度 高, 适合 于求解 大尺度 多未知量 、 多自由度的工频 电场计算 问题 。 关键 词 : 工频 电场 ;变电站 ;边界 元 法 ; 快速 多极子 ; 算方法 计
Z A GZa. n D N n H N hn1 g, E GJ , 1 D —e Z UZe. i H i g, 皿 We o u 3 e n , H hnh w a , U Qa 3 n i
( . teK yLbrt yo o e r s i inE up et Ss m S cryadN w Tc nl y C ogi nvri , 1Sa e aoa r f w r a m s o q im n & yt eui n e eh o g , h nqn U i sy t o P Tn s e t o g e t
张 占龙 邓军 , 李德文 朱祯海 胡强。 何 为 , , , ,
(. 1重庆大学 输配电装备及系统安全与新技术国家重点实验室 , 重庆 403 ; . 000 2 中国南方 电网 超高压输 电

大目标声散射计算的快速多极边界元法

大目标声散射计算的快速多极边界元法

大目标声散射计算的快速多极边界元法传统的数值方法,如有限差分法和有限元法等,在处理大目标声散射问题上存在一些困难。

这是因为这些方法需要在整个计算域上离散所有的网格单元或单元。

对于较大的链路,这将导致计算时间和内存的大大增加。

为了克服这个问题,研究人员提出了快速多极边界元法(Fast Multipole Boundary Element Method,FMBEM)。

快速多极边界元法是边界元法(Boundary Element Method,BEM)的一种重要扩展。

边界元法是一种基于积分方程的数值方法,通过将问题分解为边界和内部两个区域来进行计算。

边界元法的优点是能够自动满足边界条件,并且仅需要在边界处离散网格单元。

但是,在处理大目标声散射问题时,边界元法面临着计算量大的问题,特别是在计算Green函数时。

快速多极边界元法通过使用多级化的算法和多极展开技术来解决这个问题。

多级化的算法将计算域划分为不同的层次,在不同的层次上使用不同的计算方法。

这样一来,计算量会随着层次的增加而减少。

多极展开技术则通过将波场表示为一组距离中心点的多级展开来加速计算。

这种展开使得在较远距离处的计算成为可能,从而大大减少了计算时间。

快速多极边界元法在处理大目标声散射问题上具有许多优点。

首先,它能够处理非常大的计算域,能够处理数百万个边界单元。

其次,它能够显著减少计算时间和内存需求。

通过将波场表示为多极展开,计算时间可以减少到O(NlogN),其中N是边界单元的数量。

此外,快速多极边界元法还具有高度的可扩展性和并行化能力,可以在大规模并行计算机上运行。

总之,快速多极边界元法是处理大目标声散射问题的一种高效的数值方法。

它通过使用多级化的算法和多极展开技术,能够显著减少计算时间和内存需求。

这种方法在工程领域具有广泛的应用前景,可以用于设计和优化声学传感器、无人机、航空器和水声通信系统等。

快速多极边界元方法在大规模声学问题中的应用

快速多极边界元方法在大规模声学问题中的应用

S
⎡ ⎢− ⎢⎣

2Gk ∂ny
(x, y ∂nx
)
φ
(
y)
+
∂Gk (x, ∂nx
y)
⎤ q( y)⎥ dSy

+
∂φin (x) ∂nx
(5)
方程式(5)与方程式(3)一样,对于求解外部声波 问题,这两组边界积分方程具有不同的伪频率,这
84
机械工程学报
第 47 卷第 7 期期
些频率下无法求得唯一解。BURTON 等提出将方 程式(3)、(5)线性组合以求得任意频率下的唯一解 方法

(6)
式中,α 为 非零耦合常数,通常虚部非零,一般可
取为 α = i / k 。 文献[16]已证明方程式(6)可以在任意频率下求
得唯 一解 。 然而 ,方 程 式(6) 存在 一 个难 题, 即 Helmholtz 积分方程的法向导数引入一个超奇异积 分,直接计算超奇异积分十分困难,必须将它规划
法用于克服传统边界元方法非唯一解的缺陷,其中 Burton-Miller 方法[16]是被公认最为有效及鲁棒性的 方法。因此,本文运用 Burton-Miller 方法来克服传 统边界元方法非唯一解问题。
将方程式(3)对配置点 x 处的边界外法线方向 nx 求导,可以得到如下边界积分方程式
∫ C(x) ∂φ(x) = ∂nx
∫ ∫ α
S

2Gk (x, y ∂ny ∂nx
)
φ
(
y)
dS
y
+
S
∂Gk (x, ∂ny
y) φ( y) dSy
=
∫ ∫ S Gk (x, y)q( y) dSy
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

线性代数方程组.对方程重新排列,把未知量移到
方程左端,己知量移到方程右端,并把已知量和右
端的系数矩阵相乘,得到方程
舣=占
(2)
其中A是重新排列后,与未知量相关的系数矩阵,
它是一个非对称满阵;x为未知列向量,曰为已知
量与右端系数矩阵相乘后的列向量。求解方程(2)
即得到所有边界上的未知量。
2 调用ScaI,APACK的常规求解方法
co(x)uj(x)+J l弓(五y)uj(y)dS 2 。 (1)
I。蛎(z,y)tI(y)dS
式中“:(x,y)和f;(x,y)是弹性力学位移方程的基本
解,x,Y分别为基本解中的源点和场点。“,(y)和
tj(y)分别是边界Y点的位移和面力;cf『(x)是依赖
于边界点x处边界几何特征的常数。
对边界积分方程进行按边界单元离散后形成
THE CoMPARISON oF PARALLEL CoMPUTATIoN BETWEEN FAST MUI。TIPoLE AND CoNVENTIoNAL BEM oN PC CLUSTER
LEI Ting,‘YAO Zhen.ban,WANG Hai.tao
(Department ofEllgineering Mechanics,Tsinghua University,Beijing 100084,China)
快速多极边界元法采用了树的存储结构,每个 树结构节点包括了相邻的一定个数的边界单元。一 般来说,树结构是非线性且不平衡的数据结构,对 树结构的任务划分和划分得到的任务之间的通信 操作比常规矩阵要复杂p】,这也是快速多极边界元 并行格式区别于常规边界元的主要难点。
为并行计算所需的处理器的个数,划分的单位是树 结构的节点,划分的目标是保证每个任务中含有大 致相同的单元个数,而划分的方法是首先对树结构 的节点和边界元法中边界单元按照同样的空间顺 序进行排序,然后再进行以节点为单位的划分,图 2给出了三维问题划分为4个任务的自动划分示意 图。在并行计算中首先根据任务间树结构的相互关 系判断消息传递关系,然后调用MPI函数将需要通 信的展开系数的进行传递。
。“
n’=lm。=l
其中
万方数据
30




以w(‰)=∑∑簖嚣-(yo,Xo)C.,oo) (5)
n=lm=l
“w称为局部展开系数,XO为满足IXoXl-<{l‰yol的
任一点。通过将模型划分为树结构,并递归的使用 这两种展开,可以完成式(1)中积分的计算。
由式(5)可以看出,两组展开系数的转换计算量 为o(p4),该计算当P较大时比较费时,Rokhlin和
』。“;(x,y)tj(y)dS m∑∑‰(‘Yo)c.。(蜘)(3) 。 n=lm=l
其中P为多极展开阶数,cn。(舶)为多极展开系数,
Yo为满足lYoY阵士lYoxl的任意一点,式(1)还可以进 一步展开为如式(4)的局部展开级数。
f。”沁y)tj(y)dS z∑艺‰.(五xo)d.w(峋)(4)
ScaLAPACK全称为Scalable Linear Algebra PACKage[”,是标准线性代数方程组求解函数库 LAPACK的分布式并行版本,通过调用统一命名的 接口函数,可以编写跨平台的求解程序。为了提高 数据的局部性,ScaLAPACK采用分块矩阵的算法,
需要将全局的系数矩阵在积分的过程中分布到各 个计算节点中。图1表示的是如何将一个全局矩阵 按照二维子块循环方法映射到四个计算节点中去, 图中的每个格子表示一个子块矩阵,其大小的选取 与软硬件等许多因素密切相关,通常通过实际测试 得到最优值,本常规边界元并行程序中选取为 192×192。该映射方案不仅保证了负载的均衡,而 且与常用的卷帘式存储方案相比,可以更加合理地 对子块矩阵进行消去,克服消去过程的串行瓶颈, 并充分利用现代计算机的高速缓冲区结构,从而显 著提高计算效率【7JJ。通过将单元数据广播到各个计 算节点中,再由各个计算节点积分出其所需存储的 子块系数矩阵,最后调用ScaLAPACK的进程网格 初始化函数和求解函数,完成并行求解。
本文应用快速多极算法实现了三维弹性力学 快速多极边界元的并行计算,并与传统的通过调用 ScaLAPACK的单域常规边界元并行计算进行了比 较。数值算例表明,快速多极边界元并行计算,能 使解题规模有数量级的提高,计算速度明显提高, 而且并行效率也优于常规边界元并行算法。
1 边界元法数值计算格式
考虑一个三维的各向同性弹性体,其边界由s 表示。在无体力作用的情况下,可列出如下弹性力 学边界积分方程:
4数值算例
4.1计算模型 本文选择的模型为在立方体内随机分布不同
数目的球形孔洞,孔洞数目从1个取到100个,分 布具有随机性。其中立方体边界离散为3,072个常 值面元,每个球形孔洞离散为392个常值面元,如 图3所示。自由度最小为10,392,最大为126.816。 所有模型边界条件均为约束立方体法向为x,Y,z负 方向的三个表面的法向位移,载荷为x正方向的表 面一个均布拉力100 MPa。
收稿日期l 2005.03.15;修改日期:2005—07—2I 基金项目;国家自然科学基金(104720511
作者简介:雷霆(1977),男,北京.博士生,从事计算力学研究; +姚振汉(1939),男.江苏.教授-从事计算力学研究(E-mail:demy曲@tsinghtm edu cn); 王海涛(1977),男,山东,讲师t博士.从事计算力学研究。
随着计算机技术的迅速发展,并行计算已成为 缩短计算时间,扩大解题规模和提高计算精度的有 效手段。网络机群系统下的并行计算环境,由于其 较高的性价比和程序的高可移植性,在我国已经成 为当前的主流并行环境。几年前,在作者的研究组, 通过基于常规边界元法的并行计算使解题规模从 单台微机的数千提高到了大约5万自由度【l一。但是 这还是不能满足求解大规模复杂工程问题的要求。
Grcengard于90年代末提出进~步使用指数展开以 完成该计算的方法[4】,通过将多极展开系数到指数 展开系数的转换、指数展开系数的原点转换以及指 数展开系数到局部展开系数的转换,以此三步转换 来代替式(5)中的直接转换,可以证明H,虽存储量 略有增加,但计算量上将有大幅下降,引入此展开 的快速多极算法被称为新版本快速多极算法,设指 数展开阶数为g,则其计算精度将同时依赖于P和g 的选择,与之对应,不采用指数展开的快速多极算 法被称为原始版本快速多极算法,而其计算精度仅 依赖于P的选择。关于计算精度的选择将在文中数 值算例部分讨论。
全局矩阵
分布式存储矩阵
图1矩阵的分布式存储方式
Fig 1 Distributed storage pattem ofthe coefficient matrix
3快速多极边界元并行求解方法
快速多极算法(FMM) Roldalin和Greengard 于上世纪80年代末提出,其特点是在O(N)的计算 复杂度和存储复杂度下完成矩阵向量的近似相乘, 再结合迭代算法GMRES完成线性方程组的求解。 基本思路是通过引入核函数的级数展开,并通过存 储展开级数的系数以用来计算矩阵向量相乘,式(1) 中的积分可以展开为如下的多极展开级数(具体表 达式参见文献[6】)。
Abstraet: For 3D elasficity problems,the parallel computations based on the fast multipole and the conventional boundary element method(BEM)on PC cluster are compared.The parallel computation of conventional BEM applies Gauss elimination by calling the ScaLAPACK library,while the fast multipole version is implemented by programming with ANSI C++and MPI rMessage Passing Interface).Both approaches are tested on the same PC cluster.Numerical examples show that the scale of solvable problems can be increased significantly for the fast multipole BEM.and that the computational speed is much faster than conventional BEM. Besides.the parallel speedup ofthe fast multipole BEM is also higher than that ofthe conventionaI one
图2树结构的任务划分方案 Fig.2 Task partition scheme ofthe tree structure
本文程序采用如下对于树结构节点的划分方 案‘”1。整个区域被划分为np个任务,其中np通常
万方数据
图3立方体基体内随机分布球形孔洞
Fig.3 Voids randomly distributed in a cubic matrix
第23卷第11期 2006年11月
V01.23No.11 Nov.2006




ENG矾EERⅡqG MECHANICS
文章编号:1000-4750(2006)11-0028-05
快速多极与常规边界元法机群并行计算的比较
雷霆,+姚振汉,王海涛
(清华大学工程力学系,北京10快速多极与常规边界元法机群并行计算进行了比较。其中常规边界元法求 解方程采用高斯消去法,通过调用标准并行求解函数库ScaLAPACK实现;快速多极边界元法并行计算程序采用 ANSI c++语言、调用MPI并行通信库自行编写。两种程序均运行于同一机群并行环境。数值算例表明,在同样 的机群条件下,采用快速多极边界元法可使解题规模有数量级的提高,计算速度明显高于常规边界元法,并行效 率也优于常规边界元法。 关键词;边界元法;并行计算;快速多极:ScaLAPACK:MPI 中图分类号:0344 5 文献标识码:A
相关文档
最新文档