高性能集群计算解决方案

合集下载

HP Linux高性能集群解决方案 -1102

HP Linux高性能集群解决方案 -1102

前言高性能计算集群(HPCC-High Performance Computing Cluster)是计算机科学的一个分支,以解决复杂的科学计算或数值计算问题为目的,是由多台节点机(服务器)构成的一种松散耦合的计算节点集合。

为用户提供高性能计算、网络请求响应或专业的应用程序(包括并行计算、数据库、Web)等服务。

相比起传统的小型机,集群系统有极强的伸缩性,可通过在集群中增加或删减节点的方式,在不影响原有应用与计算任务的情况下,随时增加和降低系统的处理能力。

还可以通过人为分配的方式,将一个大型集群系统分割为多个小型集群分给多个用户使用,运行不同的业务与应用。

集群系统中的多台节点服务器系统通过相应的硬件及高速网络互连,由软件控制着,将复杂的问题分解开来,分配到各个计算节点上去,每个集群节点独立运行自己的进程,这些进程之间可以彼此通信(通常是利用MPI -消息传递接口),共同读取统一的数据资源,协同完成整个计算任务,以多台计算节点共同运算的模式来换取较小的计算时间。

根据不同的计算模式与规模,构成集群系统的节点数可以从几个到上千个。

对于以国家政府、军方及大型组织机构来讲,节点数目可以达到数千甚至上万。

而随着HPCC 应用的普及,中小规模的高性能计算集群也慢慢走进中小型用户的视野,高性能计算集群系统的部署,极大地满足了此类用户对复杂运算的能力的需求,大大拓展了其业务范围,为中小型用户的成长提供支持。

本次方案研究适合于中小规模用户的典型系统:基于32个计算节点和In finiBand 高速网络的Linux 集群。

惠普Linux 高性能集群方案方案描述此次方案中,高性能计算集群系统的节点由 HP BladeSystem 刀片服务器搭建,节点间通过InfiniBand 高速网络相连,管理、登录和存储节点由HP ProLiant机架式服务器构成,存储节点通过SAN 交换机外挂HPStorageWorks 磁盘阵列来存储大容量数据。

LSF高性能分布运算解决方案

LSF高性能分布运算解决方案

LSF高性能分布运算解决方案一、系统组成速度系统主要由IBM X3850 X5集群计算机、IBM X3650 M3 虚拟化服务器、Dell R5100图形工作站、存储系统组成。

IBM X3850 X5集群计算机:每个节点 4 颗CPU,每个 CPU 8核,主频 2.26GHz,节点内存 128GB。

IBM X3650 M3虚拟化服务器:每个节点 2 个 CPU,每个 CPU4核,主频 2.66GHz,节点内存 48GB。

Dell R5100图形工作站:每个节点包括 1个NVIDIA Quadro 6000 显示卡,主机CPU 主频为3.06 GHz,内存为 8GB,硬盘为 4*146GB。

存储系统:IBM DS5020 可用容量约为 12TB,由集群计算机、虚拟化服务器和图形工作站共享。

IBM X3850 X5计算集群运行用户的程序。

LSF高性能分布运算解决方案系统示意图二、主要软件1.操作系统:IBM X3850 X5集群计算机安装 64 位Windows2008 系统,IBM X3650 M3 安装Vmware ESX4.1系统,图形工作站安装64 位Windows2008 系统。

2.作业调度系统:Platform 公司的LSF。

3.应用软件:如表 1 所示。

名称厂家LightTools ORAZEMAX-EE Focus SoftwarePADS ES Suite Ap SW Mentor GraphicsExpedition PCB Pinnacle Mentor GraphicsDxDesigner ExpPCB Bnd SW Mentor GraphicsI/O Designer Ap SW Mentor GraphicsMulti-FPGA Optimization Op S Mentor GraphicsHyperLynx SI PI Bnd SW Mentor GraphicsQuesta Core VLOG Ap SW Mentor GraphicsPrecision RTL Plus Ap SW Mentor GraphicsSystemVision 150 Ap SW Mentor GraphicsFlowTHERM Parallel Ap SW Mentor GraphicsLabview NICode Composer Studio TIQuartus II AlteraISE XilinxVxworks Wind RiverIntel C++ Studio XE IntelMatLab及相关工具箱MathworksMaple MapleSoftOracle OracleNX Mach 3 Product Design Siemens PLM SoftwareADAMS MSCNASTRAN MSCPATRAN MSCMarc MSCFatigue MSCABAQUS SIMULIAADINA ADINAANSYS Mechanical+Fluent ANSYSFe-safe safetechnologySysnoise LMSMaxwell ANSYSHFSS ANSYS表 1三、运行程序的方法1.用户入口:LSF portal 是所有用户使用网格系统的唯一入口。

高性能计算集群的搭建与配置技巧

高性能计算集群的搭建与配置技巧

高性能计算集群的搭建与配置技巧高性能计算集群是一种利用多台计算机协同工作来完成强大计算任务的解决方案。

它可以有效地提高计算效率,加快数据处理速度,并且适用于各种应用领域,如科学研究、工程设计、数据分析等。

本文将介绍高性能计算集群的搭建与配置技巧,帮助读者了解如何创建一个高效的计算环境。

1. 硬件选型与配置高性能计算集群的性能关键在于硬件的选择与配置。

首先要确定集群规模和预算,然后选择适合的服务器、网络设备和存储系统。

在选购服务器时,要考虑计算性能、内存容量、硬盘速度以及网络带宽等因素。

确保服务器之间的网络连接速度快且稳定,并采用合适的交换机和路由器来管理网络流量。

存储系统也要具备足够的容量和读写速度,以满足大规模数据存储和访问的需求。

2. 软件安装与配置高性能计算集群需要安装和配置一系列软件来实现任务调度、资源管理、数据共享等功能。

下面是一些常用的软件组件:- 操作系统:可以选择Linux发行版作为集群的操作系统,如CentOS、Ubuntu等。

这些操作系统具有良好的稳定性和可扩展性,并且有大量的软件和工具可用于集群管理和开发。

- 并行编程库:高性能计算集群通常使用并行编程来实现任务的分配和调度。

MPI(Message Passing Interface)是一种常用的并行编程库,用于实现多节点计算。

在安装MPI时,要确保版本兼容性并准确设置环境变量。

- 任务调度器:任务调度器负责分配和管理集群中的计算任务。

常用的任务调度器包括Slurm、PBS等。

在安装和配置任务调度器时,要根据实际需求设置不同的参数,如资源分配、任务优先级等。

- 分布式文件系统:为了实现集群中的数据共享和访问,需要安装和配置适当的分布式文件系统,如NFS、GlusterFS等。

这些文件系统能够提供高性能和可靠的数据存储和访问服务。

3. 网络设置与安全在搭建高性能计算集群时,网络设置和安全性非常重要。

以下是几个关键方面:- IP地址规划:根据集群规模和网络拓扑,设置合理的IP地址规划方案,确保每个节点都有唯一的IP地址和子网掩码。

联想HPC高性能计算解决方案

联想HPC高性能计算解决方案

3
2015 LENOVO INTERNAL. ALL RIGHTS RESERVED.
TOP500中的 Lenovo System X (2010)
Nov 2010 TOP500 Entries IBM leads, followed by HP
Dell, 20 Oracle,
11
Cray, 29
Rack 计算结点
计算网 管理网
管理结点
登录结点
8
2015 LENOVO INTERNAL. ALL RIGHTS RESERVED.
I/o结点
共享数据 磁盘阵列
并行I/O L-ParaStor
联想高性能计算平台标准系统架构
9
2015 LENOVO INTERNAL. ALL RIGHTS RESERVED.
✓ Fastest system in Europe (Juelich-JUQUEEN BG/Q) ✓ Fastest Intel based system (x86-only LRZ-SuperMUC iDataPlex) 6 ✓ 201256LoEf 3N0OmVosOt enINerTgyE-eRffiNcieAnLt .syAsLteLmsRIGHTS RESERVED.
Bull , 18 Dell, 11 Oracle, 6
Appro, 24
Other, 50
IBM, 193
Cray, 31 SGI, 19
HP, 148
IBM supercomputing leadership …
✓ Most systems in TOP500 with 193 entries (HP:148, Cray:31, Appro:24)

高性能计算中的耗能与散热问题解决方案

高性能计算中的耗能与散热问题解决方案

高性能计算中的耗能与散热问题解决方案随着科技的不断发展,计算机技术也在不断提升。

高性能计算已成为科学研究和工业生产中不可或缺的一部分。

然而,高性能计算在实现高速运算的同时也带来了耗能和散热问题。

本文将探讨高性能计算中的耗能与散热问题,并提出相应的解决方案。

一、高性能计算中的耗能问题高性能计算机在运行时需要大量的电能供应。

在大规模并行计算集群中,计算节点的数量众多,其耗能问题尤为突出。

传统的计算机大多是单核处理器,而高性能计算机主要依赖于多核处理器以实现更高的计算速度和处理能力。

然而,多核处理器的功耗可观,导致高性能计算机整体的耗能问题更加突出。

为了解决高性能计算中的耗能问题,一种可行的方案是采用低功耗的处理器。

例如,ARM架构的处理器在功耗上有一定的优势,同时由于其高度可定制化的特点,可以根据具体需求定制处理器的规格,从而降低功耗。

另外,高性能计算机还可以采用混合式处理器的架构,即将不同功耗的处理器组合在一起,以更好地平衡性能与功耗的关系。

二、高性能计算中的散热问题高性能计算中的大规模计算集群产生的热量也是一个不可忽视的问题。

大规模运算需要大量的数据传输和计算,而这些操作都会产生大量的热量。

如果散热不及时有效地进行,那么计算机的温度将会升高,导致硬件的故障甚至烧毁。

为了解决高性能计算中的散热问题,有以下几种解决方案。

首先,可以通过改善散热系统来提高热量的排出效果。

例如,采用更大型号的散热器、增加风扇的数量、改进散热风道,以加快热量的排出速度。

另外,可以采用液冷技术,利用导热液体将产生的热量传递至散热器,再由散热器将热量散发出去,以降低计算机的温度。

此外,科学家还在研究新型散热材料,以解决高性能计算中的散热问题。

相比传统的金属散热材料,新型散热材料具有更好的散热性能和导热性能。

例如,石墨烯在导热性能方面具有优势,可以作为散热材料的一种选择。

此外,纳米材料也被广泛应用于散热材料的研究中,其具有较高的比表面积,能够更好地传递热量,并提高散热效果。

高性能计算(HPC)资源管理和调度系统解决方案

高性能计算(HPC)资源管理和调度系统解决方案
优势—安全性
网络安全:整个系统只需要在防火墙上针对特定服务器开放特定端口,就可以实现正常的访问和使用,保证了系统的安全性。数据安全性:通过设定ACL(访问控制列表)实现数据访问的严格控制,不同单位、项目、密级用户的数据区严格隔离,保证了数据访问的安全性。用户任务的安全性。排他性调度策略,虚拟机隔离用户账户的安全性。三员管理:系统管理员、安全管理员、审计管理员三个权限分离,互相监督制约,避免权限过大。审计系统。保证所有与系统安全性相关的事件,如:用户管理(添加、删除、修改等)、用户登录,任务运行,文件操作(上传,下载,拷贝,删除,重命名,修改属性)等都能被记录,并通过统计分析,审查出异常。密级管理。支持用户和作业的密级定义。
基于数据库的开放式调度接口
案例 用户自定义调度策略:需要根据用户余额来对其作业进行调度,如果用户余额不足,该用户的作业将不予调度。 解决方案: 针对上述需求可以自定义作业的准备阶段,在数据库中为该阶段定义一存储过程用来检测用户余额信息表,根据作业所对应的用户余额来返回结果,例如: Step 1. 根据数据库开放schema配置该自定义调度策略 表 POLICY_CONF:POLICY_NAME | POLICY_ENABLEmy_policy_01 | true Step 2. 为自定义调度策略my_policy_01自定义作业准备阶段 表JOB_PREPARE_PHASE: POLICY_NAME | READY_FUNC | REASON_IDX my_policy_01 | check_user_balance | 4 check_user_balance 为方案中所描述的存储过程,其接口需要满足作业准备阶段自定义的接口要求,其实现细节如下:
现有的LSF集群系统不用作任何改动,包括存储、操作系统、LSF、应用程序和二次开发的集成脚本等。大大降低了系统的整合的难度和工作量。也有利于保护现有的投资。同时考虑到了作业以及相关数据的转发。降低了跨集群作业管理的难度。数据传输支持文件压缩和断点续传,提高了作业远程投送的效率和稳定性。支持https加密传输,安全性更强。

高性能计算HPC解决方案

高性能计算HPC解决方案
数据来源:
MPP 15%
Others 11%
Others1 %
CPU+ GPGPU 21 %
Others 16%
GE 36% Cluster 85%
Intel X86 89%
Linux 99%
纯CPU 79%
IB 47%
系统架构
处理器
操作系统
计算加速
互联网络
主流架构技术 - Cluster+X86+Linux+CPU+IB/GE 计算、网络加速- GPGPU加速和IB网络
目录
1 2
高性能计算挑战及趋势
高性能计算解决方案 高性能计算在全球
3
创新 - 释放高性能计算潜力
应用集成 业务调度 融合管理
融合业务管理平台
开放融合
All In Rack All In Room
液冷方案
低功耗服务器
快速交付
节能技术
加速
一体化交付
NVMe PCIe SSD 卡
低能耗产品和方案
GPU加速卡 KunLun
hpc典型组网场景hpc方案总结目录高性能计算在全球高性能计算在全球高性能计算挑战及趋势高性能计算挑战及趋势高性能计算解决斱案高性能计算解决斱案112233覆盖全球多行业的hpc建设经验内布拉斯加大学田纳西大学数字领域公司澳门气象局新加波globalfoundries新加坡科学技术研究所菲律宾气象局一期新加坡astar维多利亚大学昆士兰大学肯迪大学智利cassac天文台巴西麦肯锡大学古巴石油cupet委内瑞拉国家石油公司墨西哥水利局墨西哥农业部土耳其学术网络不信息中心ulakbim土耳其yilidiz科技大学ytu土耳其伊斯坦布尔科技大学itu土耳其harran大学土耳其yeditepe大学土耳其国家石油中国欧洲亚太北美拉美中亚沙特moi非洲中东津巴布韦高等教育科技发南非chpc国家地震防灾科技学院河北省环保局北京数据通信研究院北京交通大学北京航空航天大学西南大学首都医科大学中国电力科学院国家气象局上海天文台上海众信生物东斱物探清华大学华大基因bgp英国纽卡斯尔大学英国帝国理工大学德国汉堡大学德国吕贝克大学西班牙burgos大学法国照明娱乐公司德国戴姆勒奔驰德国爱伦堡水管局荷兰水利局意大利cnr波兰华沙大学波兰pcss波兰格但斯克大学波兰西里西亚大学波兰cyfronet波兰qumak大学俄罗斯圣彼得堡大学daimler集团选择hpc造品质最好的轿车刀片及高密服务器构建戴姆勒核心汽车研发平台劣力波兰pcss建设top80超算中心137pflopspue12全球top80超算中心劣力土耳其ytu大学打造hpc平台提升科研效率80降低初期投资成本80劣力美国数字领域构建高性能渲染平台计算密度提升25每机柜能耗降低15thankyou

HPC高性能计算系列二之联想Intellegent+Cluster解决方案

HPC高性能计算系列二之联想Intellegent+Cluster解决方案

14% - 16%
19% - 21%
调试 到投产
集成,配置和测试 上架, 线缆连接,网络连接 软件 集成,配置和应用测试 集成配置和测试中间件 应用部署和安装
45% 45% 29%
Implement
Configure/test
74 – 93
74 – 80
12%
10% - 11%
Cluster & HA
Intel Xeon Phi
nVIDIA
Mellanox Infiniband
NeXtScale
x86 平台
7
iDataPlex dx360 M4 System x3550/x3650
FlexSystem X3750 M4/x3850
Intelligent Cluster 大大降低HPC项目的风险
Intelligent Cluster具有更好的用户体验 ---- 降低销售风险和售后服务费用,提升服务质量 1. 在投标前,系统配置及方案经过专家验证,确保方案可行; 2. 在交付用户前,整机系统经过严格的测试,避免到达用户现场后出现更换故障部件的情况,有利于增 强System x产品高质量形象; 3. 由中国本地工厂服务团队提供的专业上架及布线服务,确保系统具有良好整洁的外观,提升用户体验 (见下图); 4. 整机系统到达用户现场后可以直接加电,仅需要少量甚至不需要集成商参与,可以减少系统实施所产 生的外部费用; 5. 集群系统部署及辅助用户业务安装的工作基本可以远程实现,不需要或短时间在用户现场工作,从而 降低LBS或GTS的内部实施费用
Customer Benefits
LENOVO Intelligent Cluster
$ €¥£
帮助您的应用快速上线
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

/sige_online/blog/item/d6aa74a9106a10ff1f17a224.html和卫星遥测,遥感等探矿技术的发展,促使油气勘探的数据量爆炸性地增长, 要求信息系统能够获取,存储和处理TB级的巨量数据; 使用更精确的模型:为了提高探矿水平,必须使用规模更大,更精确数值模型来模拟地下矿藏的分布.5年前,模型的节点数一般不超过10万个;现在,经常需要使用节点数超过百万的3维模型来进行数值模拟; 提供更强的计算和数据管理能力:模型规模的扩大要求使用处理能力指数增长的计算机系统和更复杂的算法快速和精确地求解,同时也要求更强的数据管理能力来建立历史数据库,并把当前数据与长期积累的历史数据相比较,得到精确的综合预测结果; 支持功能丰富的应用软件:现代的油气探测应用软件必须具有直观的3维图象显示和输出,人机交互功能, 以提高工作效率; 降低成本:经济效益和市场竞争压力还迫使油气行业的信息系统在严格控制开支,降低总拥有成本条件下满足上述要求当前,传统的巨型机已经很难全面满足上述要求.油气行业要求使用更经济实惠的新解决方案来全面满足应用需求.Schluberger信息系统公司(SIS)是油气勘探信息处理领域中领先的厂商,也是HP在高性能技术计算领域重要的合作伙伴.该公司在使用基于安腾2的HP Integrity 服务器为计算节点的Linux集群上开发的面向油气矿藏模拟的ECLIPSE Parallel解决方案,能够全面满足油气矿藏勘探信息系统在性能和成本两方面的需求,提供解决人类社会现代化进程中能源问题的利器. 目标市场 ECLIPSE Parallel解决方案使用数值模拟方法满足油气行业探测石油和天然气地下分布状况和预测储量的需要, 油气公司从低级经理到高级主管各种类型的人员都可以得益于这一解决方案,包括:负责提供优化的矿藏分布和产量预测评估人员和经济分析师,负责作出开采决策的经理,信息系统管理人员;需要得到直观和实时矿藏信息的首席信息官(CIO)和首席执行官(CEO),负责监管的政府机构等等. 这一解决方案特别适合于要求打破油气行业使用巨型机传统,采用性能更高,价格/性能最佳的新颖解决方案的油气公司. 解决方案概貌 SIS ECLIPSE Parallel是一个基于英特尔和HP工业标准技术的成套解决方案,便于实施和灵活配置,提供先进的油气矿藏模拟功能.这一解决方案由系统平台和模拟软件两大部分组成(见下图). HP Linux ClusterBlocks集群系统是第一个经过认证的系统平台.这一Linux集群包括如下的层次: 计算节点:采用基于安腾2的HP Integrity rx2600服务器,使用新一代安腾2提供强大的64位处理能力; 互联设备:采用工业标准的高速Myrinet把计算节点联成一体,以太网联接管理节点; 操作环境:采用应用最广泛的RedHat Linux Advanced Server操作系统建立集群运行的操作环境; 集群管理和作业调度:采用Scali, Scyld或ClusterWare 公司著名的Linux工具软件管理集群系统;采用业界领先的Platform Computing的LSF 5.0软件来实现负载平衡,提高集群的工作效率上层的ECLIPSE Parallel模拟软件负责完成矿藏模拟的数值计算,它把整个数值求解问题分解成一系列较小的子问题,送到各个计算节点上并行地求解,然后再合成完整的结果. ECLIPSE Parallel解决方案这一基于Linux集群并行计算的设计思想,在性能,性价比,可伸缩性和可用性等方面都超过基于巨型机的传统解决方案,具有广阔的发展前途. 组成部件 SIS ECLIPSE Parallel软件与HP ClusterBlocks 集群结合在一起形成了一个把最先进硬件和软件完美地结合在一起的油气储藏模拟解决方案,它的主要组成部件有: 基于安腾2处理器的HP Integrity rx2600服务器; 工厂组装的基于Myrinet高速互联网络的16-128节点 Linux集群系统; RedHat Linux Advanced Server 2.1操作系统; Platform Computing的负载调度软件(LSF) 5.0:用于平衡集群内各节点的工作负载,提供运行效率; 消息传递接口(MPICH/GM):用于支持基于集群架构系统内的并行计算; 集群管理软件:允许采用Scali, Scyld, ClusterWareLinux 等公司的软件管理集群系统运行和资源共享; SIS ECLIPSE Parallel 油气储藏模拟软件 SIS ECLIPSE Parallel解决方案的硬件系统使用HP Integrity rx2600服务器作为计算节点,高速的Myrinet作为互联设备组成Linux集群,为油气储藏模拟软件提供高性能运行平台. ECLIPSE Parallel软件把整个模拟模型分解成若干个子区域.子区域的个数与系统中处理器个数相等.每个处理器负责模拟一个子区域,相互之间通过消息传递接口通信,使整个系统能够并行地求解整个油气储藏模拟问题, 提供强大的处理能力.子区域的划分是自动的,也可以由用户控制. 143 144 SIS ECLIPSE Parallel 解决方案还允许用户在基于奔腾4的 HP工作站上通过直观的3D模型显示,观察和分析模拟的结果,优化软件的运行,提高工作效率. 客户价值基于英特尔和HP最强大的硬件和先进的软件技术, ECLIPSE Parallel解决方案为客户提供如下的实利: 更快的结果:节约矿藏模拟计算阶段所用的时间使客户能够在规定的时间界限内完成更多的分析,从而提高决策的水平和竞争优势.在16节点的集群上运行大的模型速度可以提高10倍,单机系统上48小时的计算任务在集群上只需使用5个小时; 更精确的结果:在相同的时间框架内运行更大,更详细模型的能力产生更好的报告和预测结果; 更低的风险:开挖一个油井往往耗资上千万美元.精确结果能够帮助用户优化开采计划,降低挖到"干井" 和低产井的风险,这对于客户具有很高的经济价值; 更好地适应市场的变化:快速的分析能力使公司能够适应市场变化,及时发现和掌握各种机遇; 更低的总拥有成本:使用工业标准的技术能够降低管理和维护的费用,实现最低的总拥有成本; 基于工业标准技术的其他好处,还包括:提供最佳的性价比,可用性和可伸缩性,保护用户的投资联系方式需要进一步的信息请访问如下的网站: 市场需求设计链加速器(DCA)通过为制造厂(如汽车和飞机工业制造厂)提供超级的高性能产品开发解决方案改进产品开发. DCA以更高精度和可靠性帮助公司开发基于先进的设计标准销售的产品.它通过从产品设计到正式投产前,进行复杂的模拟,包括计算流体力学(CFD),碰撞和结构模拟,大大减少代价极大的设计错误.DCA在基于英特尔赛扬处理器,英特尔奔腾和英特尔安腾2的HP工作站和服务器上运行,提供很高的速度,兼容性和可靠性.开放的英特尔工业标准的64位和32位处理器系列保证了解决方案能够满足各种实施的需要,提供很高的可伸缩性和更快的投资回报. 目标市场 MSC在HP平台上提供的高性能计算解决方案主要面向汽车,飞机等行业,以这些行业的制造厂和研究院所为目标市场.这些行业的制造厂设计部门和研究院所经常处于压力之下,要求提供更好,更快和更便宜的产品,保持竞争优势和增加市场份额.必须通过允许在开发过程中更早理解和改进设计来提高产品的开发水平.更早了解设计获得的知识和对设计的改进能够消除制造中昂贵的错误,使得客户获得可预测和较好的体验. 改进开发过程的关键是在"电子"舞台上模拟产品的性能,而不是在物理样机上测试产品的性能.例如,利用计算机模型模拟汽车碰撞的过程,不再需要投资和化时间制造整个车辆进行碰撞测试,就能够通过"电子模拟碰撞"得到更好的结果.通过计算机模拟测试汽车的好处还包括能够得到许多通过物理测试难以得到的深入结果.这允许生产出更好的产品,同时缩短上市时间,降低成本. 过去,昂贵的超级计算机和复杂的实施过程给制造厂使用这一新的工程过程造成很大的障碍.MSC在运行Linux 的HP工业标准计算机上以低得多的成本建立了容易实施,高性能计算环境,满足旨在优化设计的高性能技术需要,使得许多制造厂都能够承受这一投资,得到相应的投资回报,开辟了Linux和高性能计算新的市场领域. 解决方案概貌 DCA从考虑制造厂的工程需要和优化设计应用出发,实施一个完整的高性能计算环境.这一专门解决方案的组成依赖于客户的需要,因此可以随着每次实施的具体情况而变化.但是,每个解决方案一般都包含如下的部件: 基于英特尔安腾2处理器的服务器,它们是今天和未来要求最高的,计算密集64位HPC解决方案的理想计算平台; 基于英特尔赛扬处理器的服务器,它们是今天32 位HPC解决方案的理想计算平台; 基于英特尔奔腾4处理器的工作站,它们非常适合于分布式,对等(P2P)桌面环境; 基于Netservers或HP工作站的计算机集群,包括互联设备,交换器和存储设备; Linux和/或Microsoft Windows 2000技术来自MSC.Linux套件的中间件,支持高性能计算(HPC) 集群配置; 现场系统集成; 认证的Linux培训和知识传授; 信息技术(IT)服务和支持; 应用创建,调整和移植,包括调整和移植商品化的 CFD,碰撞和结构分析应用高性能技术计算解决方案 9.2 MSC优化产品设计的高性能计算解决方案 145 典型产品开发过程起初是以几何设计为特征.许多公司专门开发以交互方式使用的CAD产品.由于工程师通过程序接口构建和修改几何图形的工作速度是十分有限的, 处理器的实际计算量相当低,可以利用桌面系统来处理. 一旦定义了几何图形后,典型的产品开发过程仍然是在理想的几何图形上进行,使得其它的应用能够解释它, 预测设计的性能.最常用的预测设计性能的方法是有限元方法(FEM).在这一方法中,创立"网格"把模型分解成有限元素.网格化的过程也是相对地交互的,不需要很大的计算量. 工程师可以通过向其它应用发送请求,利用网格了解设计的物理性能.工程师就是利用这些应用来执行不同类型的模拟.例如,利用LS-DYNA程序,工程师可以模拟如果一辆汽车撞到墙上将如何变形(或破损).这要求应用 (此时是LS-DYNA)能够求解复杂的模拟问题,通常需要完成非常大的计算量.DCA允许在基于英特尔工业标准平台上以合理的代价,更快地解决这些问题.其它类型的模拟也都需要高性能计算,它们是结构分析和CFD.例如,一个飞机制造厂使用基于英特尔处理器的HP机架安装DCA集群来预测不同飞机的空气动力学性能.制造厂可以利用这些信息确定具有最佳飞行特性的几何,包括最高的速度,机动性或最低的燃料消耗等.这可以在制造飞机前在"电子"空间中确定.它也提供设计其它内部参数,允许工程师在进行昂贵的风洞试验前改进设计.快速和方便地完成这些工作是DCA解决方案提供的好处之一. 组成部件 DCA使用下面所列的组成技术部件把产品设计技术提供给制造厂.DCA在基于英特尔64位和32位处理器的 HP工作站和服务器上运行.基于英特尔处理器系列服务器提供的数据中心水平的可靠性,可用性,可维护性和可管理性帮助制造厂取得成功.在今天快速发展的经济中, 许多工业都得益于英特尔架构提供的速度和可靠性. 应用架构-应用可以包括商业的CFD,碰撞和结构应用软件包以及必要时针对用户需要定制的程序. 硬件-解决方案采用HP硬件,包括工作站和服务器以及互联交换器和其它高质量的部件: HP Netservers; HP工作站; HP互联设备:Procurve (快速Ethernet),4108GL; KVM (键盘,视频和监控器); SAN (存储区域网络) 服务器处理器-完整的解决方案往往是异构的.根据客户的需求,完整的解决方案可以包含一些基于英特尔赛扬处理器或英特尔安腾2处理器的2-路服务器系统. 操作系统-解决方案也能够使用异构的操作系统环境包括Linux和Microsoft Windows 2000操作系统. 安装,管理和集群工具-MSC.Linux套件包括基于Web 的安装和管理工具Webmin和现代的集群工具包OSCAR (开放源集群应用资源),由开放集群组提供集成服务. 按分析网络设计首节点指派给集群并返回结果提交给首节点首节点 CFD 碰撞结构结构CFD碰撞首节点高速网络高速网络首节点高速网络结果通过首节点返回用户 146 147 其它软件(中间件)包括: 安装软件(PXE, Etherboot, SystemImager); 消息传递软件(MPIch, LAM/MPI, PVM); 队列调度软件(LSF, PBS, Maui Scheduler); 集群工具(C3, CCP); 安全和保密软件(OpenSSH, OpenSSL); 监控软件(MON, fping, ganglia, MRTG, lm-sensors, IPMI, btools, Health); 高可用性软件(Heartbeat) Linux套件是集群成功的关键.为了提供最高水平的性能, 套件应当按照高性能特殊需要进行裁剪,把重点放在支持大内存,大文件,高性能I/O和集群工具上.DCA所使用的MSC.Linux套件就是按照这些重点裁剪.它包含如下的主要模块何软件包: lm_sensors:这一核心模块用于监控基于母板的传感器 (如CPU温度和风扇速度),使得集群监控工具在硬件故障变得严重前探测到它们,或者在发生故障后立即探测到它们; 应用层网络:MSC.Linux套件包括Myrinet网络的驱动程序.这些网络提供高带宽和低延迟.低延迟是通过在应用层利用最小核心驱动程序驱动接口实现的,这能够最大限度地减少集群中范围交换的开销; OSCAR集群工具包:OSCAR集群工具包是一个开放源项目,包括一个可伸缩,分布式并行命令执行工具 C3.其它工具和程序库是消息传递接口(MPI)和并行虚拟机器(PVM) 客户价值 DCA为制造厂提供一体化的设计解决方案,允许它们使用高性能计算改进产品开发过程.典型的行业包括汽车, 飞机和一般的制造业.模拟包括对汽车制造特别重要的碰撞测试和飞机制造关键的结构分析.制造厂能够利用 DCA增加它们的容量,加速它们的工作,降低开支.制造模拟需要进行大量的计算,这样大的计算量过去只有非常昂贵的超级计算机才能够提供,但现在DCA解决方案能够以合理的成本,提供满足大规模模拟应用所需的计算能力.这一解决方案给客户提供如下的实利: 高性能和超额的价值; 更快的设计周期和更短的新产品上市时间; 降低产品开发和保修的成本; 加速投资回报,系统一般能够在到货后一天内投入生产运行; 可伸缩性:DCA能够方便地随着客户需求增长而扩展联系方式需要进一步的信息请访问如下的网站: 首节点指派给集群并返回结果提交给首节点 Webmin 控制台按分析网络设计HTTP OS分布 Webmin OSCAR 互连设备驱动程序内核 Linux内核中间件:排队(LSF, PBS, Maul Scheduler) MPI (MPIch, LAM/MPL, PVM) 碰撞 LS-DYNA* Pam-Crash, MSC, Dytran 结构分析 MSC. Nastran , MSC. Marc , ANSYS CFD StarCD*, Fluent*, OverFlow* CFL3D* C3工具。

相关文档
最新文档