ANSYS高性能并行计算
高性能计算中的并行计算优化技巧

高性能计算中的并行计算优化技巧在高性能计算(HPC)中,并行计算是提高计算效率和加速计算过程的核心方法。
并行计算通过同时执行多个计算任务,将大型计算问题划分为多个小的子问题,并利用多个计算资源来解决这些子问题。
然而,并行计算的效果受到多个因素的影响,包括计算任务的分解、任务调度、通信开销等。
因此,为了充分发挥并行计算的优势,需要采取一些优化技巧。
1.任务分解和负载均衡任务分解是将大型计算问题划分为多个小的子问题,而负载均衡则是确保每个计算节点上的工作负载相对均衡。
在任务分解中,一种常用的方法是将计算任务划分为一个个的任务单元,每个任务单元对应着一部分计算任务。
在划分任务单元时,应该避免出现过大或过小的任务单元,以充分利用计算资源并减少负载不均衡。
负载均衡则通过任务调度和动态任务分配来实现,使得各个计算节点能够以相似的速度完成任务。
2.数据并行和任务并行数据并行是指将数据分成多个部分,并在多个计算节点上同时处理不同的数据部分。
在数据并行中,不同计算节点之间需要进行数据的交换与通信。
与之对应的,任务并行是将不同的任务分配给不同的计算节点并行执行,各个计算节点之间独立运行,不需要进行数据交换和通信。
数据并行和任务并行可以灵活地应用在不同的计算问题中,选择适合的并行策略可以提升计算性能。
3.通信优化在并行计算中,各个计算节点之间需要进行通信和数据交换。
通信的开销是影响并行计算性能的一个关键因素。
为了优化通信性能,可以采取以下策略:a)减少通信次数:通过减少计算节点之间的通信次数,可以降低通信开销。
可以使用一些优化算法和数据结构来减少通信量或者利用本地缓存来避免不必要的通信。
b)合并通信操作:将多个小的通信操作合并成一个大的通信操作,可以减少通信的开销。
通过合并通信操作,可以减少通信的固有开销并提升计算效率。
c)优化通信模式:根据计算任务的特点和通信模式的需求,可以选择最适合的通信模式。
例如,可以选择点对点通信、集合通信或者广播通信等不同的通信模式来满足计算任务的需求。
ansyscfx 并行原理

ANSYS CFX的并行原理基于有限元的有限体积法,并采用了ANSYS-CFX求解器。
这种求解器具有优秀的并行计算能力,计算速度与CPU数量成近似正比的关系。
在CFX中,并行计算方法从总体上可以分为两个步骤:
网格分区:首先将所要计算的网格区域划分割成为指定数量的小分区,求解器会按照用户设定分割计算域,但最多不能超过512个分区。
计算各分区:网格分区过程结束以后,求解器就将分割好的每个网格分区交给处理器计算。
一般来说,求解器并不限制每个处理器所求解的分区数量(例如2个分区可以共用一个处理器)。
此外,ANSYSCFX所具有突出的并行运算功能还表现在:它可以在混合网络上的WINDOWS、UNIX、LINUX平台之间随意并行运算。
如需了解更多关于ANSYSCFX并行原理的信息,建议咨询专业人士或查阅相关书籍。
Ansys14并行计算配置

Ansys14并行计算配置The following tutorial walks you through the setup of your Distributed ANSYSenvironment, and is applicable only to systems running ANSYS 14.0 on a Windows cluster under Platform MPI 8.1.2.One of the sample problems, tutor1_carrier_win.inp (static) or tutor2_carrier_modal.inp (modal), is required to complete the tutorial. These files are found in Program Files\AnsysInc\V140\ansys\Data\models. Copy the file you want to use to your working directory before beginning the tutorial. You can run either sample problem using the problem setup described here.1.Set up identical installation and working directory structures on all machines (master andslaves) in the cluster.2.Install ANSYS 14.0 on the master machine, following the typical installation process.3.Configure ANSYS 14.0 on the slave machines.4.Install and register Platform MPI 8.1.2 on both ma chines following the instructions inPrerequisites for Running Distributed ANSYS.5.Add %MPI_ROOT%\bin to the PATH environmental variable on both machines (assumingPlatform MPI 8.1.2 was installed on the C:\ drive). This line must be in your path for the mpirun command to be recognized.6.On each machine, right-click on My Computer, left-click on Properties, and select theNetwork Identification or Computer Name tab. The fullcomputer name will be listed. Note the name of each machine (not including the domain). You will need this name to set up the Configure Cluster option of the ANS_ADMIN utility.7.Run the ANS_ADMIN utility on the master machine: Start >Programs >ANSYS14.0 >Utilities >ANS_ADMIN 14.0.8.Choose ANSYS / Workbench Configure Cluster to configure the hosts140.ans file.Specify the directory in which the hosts140.ans will be configured (two possible locations are presented). Also select Configure for ... Distributed ANSYS. Click OK.Enter the system name (from Step 6) in the Machine hostname field and click Add. On the next dialog box, enter the system type in the Machine type drop-down, and the number of processors in the Max number of jobs/processors field and click OK. Repeat this step for each machine in the cluster. When you are finished adding machines, click Close and then File >Exit. The resulting hosts140.ans file using our example machines where machine1 has 2 processors and machine2 has 4 processors would look like this:machine1intel 0 2 0 0 MPI 1 1machine2intel 0 4 0 0 MPI 1 19.Start ANSYS using the launcher: Start >Programs >ANSYS 14.0 > Mechanical APDL ProductLauncher 14.0.10.Select ANSYS Batch as the Simulation Environment, and choose a license. Specifytutor1_carrier_win.inp or tutor2_carrier_modal.inp as your input file. Both of these examples use the PCG solver. You must specify your working directory to be the location where this fileis located.11.Go to the High Performance Computing Setup tab. Select Use Distributed Computing (MPP).You must specify either local machine or multiple hosts. For multiple hosts, select the machines you want to use from the list of available hosts. The list of available hosts is populated from the hosts140.ans file. Click on the machines you want to use and click Addto move them to the Selected Hosts list to use them for this run. Click on a machine in Selected Hosts and click Edit if you wish to add multiple processors for that host. You can also add or remove a host, but be aware that adding or removing a host from here will modify only this run; the hosts140.ans file will not be updated with any new information from this dialog box.12.Click Run.13.When the solution is complete, you can postprocess your results as you would with anyanalysis.。
ANSYSMechanical结构并行计算(HPC)总结

ANSYSMechanical结构并行计算(HPC)总结ANSYS结构并行计算(HPC)一、概述HPC(High Performance Computing)高性能计算是一种融合了软件、硬件提高计算效率的计算,随着计算模型的精细化(更多的网格)、整体化(更多的结构)、精确化(动力学、多物理场)要求,高性能计算受到了越来越多的重视,甚至成为了决定项目桎梏的关键环节。
对于ANSYS的高性能计算,有三个重要的因素:计算机硬件、软件许可、操作设置。
二、计算机硬件随着计算机硬件的发展,CPU的计算能力逐年迭代,单CPU可以达到几十个核心,组成双路核心数可以轻松破百;如果组装集群,哪个成千上万也成为可能,这就为高性能计算提高了硬件保证。
三、软件许可软件许可也是高性能计算的必要保证,具有良好架构的软件,就可以调用更多的计算机核心参与计算,并且使得多核心CPU高度参与计算,整体提升运算效率。
ANSYS pack是ANSYS三种并行许可之一(其余两个是ANSYS HPC和ANSYS Workgroup),具有更高的多核心计算能力,一个Pack可以调用8核CPU参与计算,两个调用32核,三个就可以调用128核,目前有测试资料显示,ANSYS的具有千核CPU计算仍能保证线性效率的能力。
四、并行方式ANSYS 并行方式分为两种类型:SMP和DMP。
u SMP:即Shared-Memory Paraller。
该种方式适用于单个计算机具有多核心CPU进行高性能计算,单路和双路CPU都可以。
u DMP:即Distributer Computing。
该种方式适用于具有多个计算计算机(计算单元)的集群使用。
五、设置及相关1、经典界面启动设置HPC计算1)SMP计算除了在计算过程中调用多个CPU核心外,其余与单核无异。
2)DMP计算DMP的并行方式,由于采用多个计算节点进行计算,故计算完成后会生成多个部分结果,具体数量与设置的Number of Processors相对应;如计算完成后,生成的结果文件可能是***0.rst,***1.rst,***2.rst。
ANSYS mechanical如何在Workbench环境中使用高性能计算

文章来源:安世亚太官方订阅号(搜索:peraglobal)ANSYS mechanical属于隐式结构有限元分析求解器,一般完成一个有限元分析过程需要前处理、求解和后处理三个步骤。
前处理一般在图形工作站上完成,有限元求解可在工作站、集群及SMP 服务器上进行。
对于中小型问题(例如1000 万节点以内的ANSYS mechanical问题),一般认为在图形工作站上就可以进行求解;对于中大型问题(例如1000 万节点以上的ANSYS mechanical 问题),建议还是在计算性能更高的集群或SMP 服务器上进行。
对于中小型问题,可以在图形工作站上运行有限元后处理程序,读取计算结果进行结果的分析。
因此对于ANSYS mechanical在Workbench环境中使用高性能计算的方法共有两种:一种是直接通过workbench界面进行设置并行计算求解,在本地的工作站进行求解计算;另外一种是在workbench界面中将文件保存为ANSYS mechanical经典界面的求解文件格式,提交给高性能计算平台进行计算。
1、ANSYS mechanical在Workbench界面设置方法此种方法适合中小型问题在本地的工作站进行求解计算,设置方法简单方便。
在Workbench界面环境下,打开Model模块,在菜单中依次选择Tools>Solve Process Settings>Advanced,进行CPU设置选择对应的CPU核数(建议关闭超线程,设置的核数不能超过工作站的CPU物理核数),默认使用分布式求解选项。
2、保存为经典界面的求解文件格式方法此种方法适合中大型问题在高性能计算平台进行计算,需要在Workbench界面中存储为指定的格式,设置步骤稍微繁琐些。
方法一:输出为dat文件,设置文件名为:file.dat。
在Workbench界面环境下,打开Model模块,在左侧的目录树上选中Static Structural。
ansys多cpu并行计算设置

关于ansys程序运行大内存多核CPU的设置问题转载近期出现这些问题找了些资料并整理下放这里了。
下面这些方法并没有一一试过。
1.ansys结果文件过大如何处理解决超大结果文件的方案主要有四种方法方法一将磁盘格式转换为NTFS 方法二在begin level的时候加上一条命令/configfsplitvalue其中value is the size of file the final size equal to nvalven is the number of sub-file在PC机上面一般1单位4M则/configfsplit750 生成每个分割后的文件都是3G的大小在这个命令下不只是rst文件被分割只要是由ansys所产生的binary文件都会。
如下面命令大概会产生6个rst文件/configfsplit1 14MB /prep7 et145 mpex12e11 mpprxy10.3 blc41011 esize0.1 vmeshall /solu da5all sfa2pres0.1 solve 方法三将不同时间段内的结果分别写入一序列的结果记录文件使用/assign命令和重启动技术ANSYS采用向指定结果记录文件追加当前计算结果数据方式使用/assign指定的文件所以要求指定的结果记录文件都是新创建的文件否则造成结果文件记录内容重复或混乱。
特别是反复运行相同分析命令流时在重复运行命令流文件之前一定要删除以前生成的结果文件序列。
方法四采用载荷步文件批处理方式求解在结果文件大小达到极限而终止计算时同样可以接着计算不过在重新计算时在重启动对话框里选择—create .rst并且read上次的计算结果。
转simwe 2.ansys中物理内存和虚拟内存设置增大物理内存是提高解题效率的关键。
虚拟内存理想配置为物理内存250Mansys的运行速度与内存大小直接有关对于同一台机器内存由256M增大到512M时计算同一题目的速度可以提高几倍解体规模可以达10万自由度以上。
ansys8.1并行计算指南

目录 Ansys8.1并行计算指南前言一、安装二、安装三、添加用户 (2)四、配置mpich (2)1、设置mpirun (mpich 的主程序)的“路径”环境变量。
(必需) (2)2、注册mpich (不是必需) (5)五、进行mpich 通信测试。
(不是必需) (6)1、创建host.list 文件(用于运行mpich 通信测试) (6)2、运行mpitestmpich (7)3、以GUI 方式运行mpirun (8)六、ansys8.1并行计算设置的三种方式 (9)1、使用local 方式运行并行计算 (10)2、使用script 方式运行并行计算 (11)1)使用GUI 方式并使用script 选项运行并行计算 (15)2)使用纯命令流方式并使用script 选项运行并行计算 (15)3、使用file 方式运行并行计算 (16)七、运行并行ansys8.1 (17)1、使用launcher 运行 ,图形界面 (17)1)设置ansys options (19)2)设置solution controls (20)2、使用launcher 运行,batch 模式 (22)3、使用命令行模式启动ansys (23)八、需要注意的问题 (25)九、ansys8.1与ansys9.0、ansys10.0并行计算的区别。
(25)end (25)Ansys8.1并行计算指南前言:如果你也在使用ansys ,如果你也在使用ansys 进行非线性结构分析、地震时程分析或者某些自由度比较大的模型的分析,你是否为漫长的等待而感到烦恼?你是否在责怪自己的机子太慢却发现公司里有很多联网的机子在做着386也能胜任的活?如果答案是肯定的,那么赶紧试试ansys 的分布式并行计算吧!俗话说得好:time is money !注意,下面所叙述的方法基于如下平台:操作系统: Windows XP 32位版本(未安装补丁)深圳新红景天膜结构技术设计部2006.02.09CPU :intel pentium4内存:256MB这里提供的方法适用于32位CPU运行于32位windows xp(2000)系统。
ansys多cpu并行计算设置

关于ansys程序运行大内存多核CPU的设置问题转载近期出现这些问题找了些资料并整理下放这里了。
下面这些方法并没有一一试过。
1.ansys结果文件过大如何处理解决超大结果文件的方案主要有四种方法方法一将磁盘格式转换为NTFS 方法二在begin level的时候加上一条命令/configfsplitvalue其中value is the size of file the final size equal to nvalven is the number of sub-file在PC机上面一般1单位4M则/configfsplit750 生成每个分割后的文件都是3G的大小在这个命令下不只是rst文件被分割只要是由ansys所产生的binary文件都会。
如下面命令大概会产生6个rst文件/configfsplit1 14MB /prep7 et145 mpex12e11 mpprxy10.3 blc41011 esize0.1 vmeshall /solu da5all sfa2pres0.1 solve 方法三将不同时间段内的结果分别写入一序列的结果记录文件使用/assign命令和重启动技术ANSYS采用向指定结果记录文件追加当前计算结果数据方式使用/assign指定的文件所以要求指定的结果记录文件都是新创建的文件否则造成结果文件记录内容重复或混乱。
特别是反复运行相同分析命令流时在重复运行命令流文件之前一定要删除以前生成的结果文件序列。
方法四采用载荷步文件批处理方式求解在结果文件大小达到极限而终止计算时同样可以接着计算不过在重新计算时在重启动对话框里选择—create .rst并且read上次的计算结果。
转simwe 2.ansys中物理内存和虚拟内存设置增大物理内存是提高解题效率的关键。
虚拟内存理想配置为物理内存250Mansys的运行速度与内存大小直接有关对于同一台机器内存由256M增大到512M时计算同一题目的速度可以提高几倍解体规模可以达10万自由度以上。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ANSYS高性能并行计算
作者:安世亚太雷先华
高性能并行计算主要概念
·高性能并行计算机分类
并行计算机主要可以分为如下四类:对称多处理共享存储并行机(SMP,Symmetric Multi-Processor)、分布式共享存储多处理机(DSM,Distributied Shared Memory)、大规模并行处理机(MPP,Massively Parallel Processor)和计算机集群系统(Cluster)。
这四类并行计算机也正好反映了高性能计算机系统的发展历程,前三类系统由于或多或少需要在CPU、内存、封装、互联、操作系统等方面进行定制,因而成本非常昂贵。
最后一类,即计算机集群系统,由于几乎全采用商业化的非定制系统,具有极高的性能价格比,因而成为现代高性能并行计算的主流系统。
它通过各种互联技术将多个计算机系统连接在一起,利用所有被连接系统的综合计算能力来处理大型计算问题,所以又通常被称为高性能计算集群。
高性能并行计算的基本原理就是将问题分为若干部分,而相连的每台计算机(称为节点)均可同时参与问题的解决,从而显著缩短解决整个问题所需的计算时间。
·集群互联网络
计算机集群系统的互联网络大体上经历了从Ethernet到Giganet、Myrinet、Infiniband、SCI、Quadrics(Q-net)等发展历程,在“延时”和“带宽”两个最主要指标上有了非常大的改善,下表即是常用的互联方式:
ANSYS主要求解器的高性能并行计算特性
ANSYS系列CAE软件体系以功能齐全、多物理场耦合求解、以及协同仿真而著称于世。
其核心是一系列面向各个方向应用的高级求解器,并行计算也主要是针对这些求解器而言。
ANSYS的主要求解器包括:
Mechanical:隐式有限元方法结构力学求解器;
CFX :全隐式耦合多重网格计算流体力学求解器;
AUTODYN:显式有限元混合方法流固耦合高度非线性动力学求解器;
LS-DYNA:显式有限元方法非线性结构动力学求解器;
FEKO:有限元法、矩量法、高频近似方法相互混合的计算电磁学求解器;
·高性能并行计算的典型应用
现代CAE计算的发展方向主要有两个:系统级多体耦合计算和多物理场耦合计算,前者摒弃了以往只注重零部件级CAE仿真的传统,将整个对象的完整系统(如整机、整车)一次性纳入计算范畴;后者在以往只注重单一物理场分析(如结构力学、流体力学)的基础上,将影响系统性能的所有物理因素一次性纳入计算范畴,考虑各物理因素综合起来对分析对象的影响。
因此,可以说,高性能并行计算也是CAE的发展方向,因为它是大规模CAE 应用的基石。
例如,在航空航天领域,需要高性能并行计算的典型CAE应用有:
–飞机/火箭/导弹等大型对象整体结构静力、动力响应、碰撞、安全性分析,整体外流场分析,多天线系统电磁兼容性及高频波段RCS分析,全模型流体-结构-电磁耦合分析;–航空发动机多级转子/静子联合瞬态流动分析,流体-结构-热耦合分析;
–大型运载火箭/导弹发射过程及弹道分析……
· ANSYS求解器对高性能并行计算的支持
作为大型商用CAE软件的领头雁,ANSYS在对高性能并行计算的支持方面也走在所有CAE软件的前列,其各个求解器对高性能并行系统的支持可用下表描述:
· ANSYS各求解器并行计算部分算例简况
ANSYS Structural曲轴应力计算:8CPU AMD Opteron 64bit 集群(HP-MPI 2.1.1+Voltaire Infiniband),4400万自由度。
1000M Ethernet互联8CPU并行加速比为3.46,InfiniBand 互联8CPU加速比为5.36。
ANSYS CFX飞机外流场计算:32CPU AMD Opteron 64bit集群,Turbo Linux 8.0 for AMD64操作系统,1000M Ethernet互联。
263万节点,256万单元。
32CPU加速比为20。
ANSYS LS-DYNA汽车整车碰撞计算:32CPU AMD Opteron集群,Giganet互联,26万单元,32CPU加速比为13.4。
ANSYS AUTODYN装甲车地雷爆破冲击计算:25台Intel Pentium PC集群,1.2G Myrinet 互联,25万单元,24CPU加速比为23.36。
ANSYS FEKO大型电大尺寸反射面天线辐射特性计算:64CPU AMD Opteron集群,1000M Ethernet互联。
176606未知量,32CPU加速比接近26。
(end)。