高性能计算集群项目采购需求

合集下载

高性能计算集群的搭建与配置技巧

高性能计算集群的搭建与配置技巧

高性能计算集群的搭建与配置技巧高性能计算集群是一种利用多台计算机协同工作来完成强大计算任务的解决方案。

它可以有效地提高计算效率,加快数据处理速度,并且适用于各种应用领域,如科学研究、工程设计、数据分析等。

本文将介绍高性能计算集群的搭建与配置技巧,帮助读者了解如何创建一个高效的计算环境。

1. 硬件选型与配置高性能计算集群的性能关键在于硬件的选择与配置。

首先要确定集群规模和预算,然后选择适合的服务器、网络设备和存储系统。

在选购服务器时,要考虑计算性能、内存容量、硬盘速度以及网络带宽等因素。

确保服务器之间的网络连接速度快且稳定,并采用合适的交换机和路由器来管理网络流量。

存储系统也要具备足够的容量和读写速度,以满足大规模数据存储和访问的需求。

2. 软件安装与配置高性能计算集群需要安装和配置一系列软件来实现任务调度、资源管理、数据共享等功能。

下面是一些常用的软件组件:- 操作系统:可以选择Linux发行版作为集群的操作系统,如CentOS、Ubuntu等。

这些操作系统具有良好的稳定性和可扩展性,并且有大量的软件和工具可用于集群管理和开发。

- 并行编程库:高性能计算集群通常使用并行编程来实现任务的分配和调度。

MPI(Message Passing Interface)是一种常用的并行编程库,用于实现多节点计算。

在安装MPI时,要确保版本兼容性并准确设置环境变量。

- 任务调度器:任务调度器负责分配和管理集群中的计算任务。

常用的任务调度器包括Slurm、PBS等。

在安装和配置任务调度器时,要根据实际需求设置不同的参数,如资源分配、任务优先级等。

- 分布式文件系统:为了实现集群中的数据共享和访问,需要安装和配置适当的分布式文件系统,如NFS、GlusterFS等。

这些文件系统能够提供高性能和可靠的数据存储和访问服务。

3. 网络设置与安全在搭建高性能计算集群时,网络设置和安全性非常重要。

以下是几个关键方面:- IP地址规划:根据集群规模和网络拓扑,设置合理的IP地址规划方案,确保每个节点都有唯一的IP地址和子网掩码。

人工智能算力中心 招标依据

人工智能算力中心 招标依据

人工智能算力中心招标依据人工智能算力中心招标依据一、项目背景和需求分析随着人工智能技术的快速发展,人工智能算力中心成为支撑人工智能应用和推动行业创新的关键基础设施。

人工智能算力中心具备强大的计算能力、高效的数据处理能力和稳定的服务能力,是进行大规模数据处理、深度学习、机器学习等人工智能相关领域的必备设施。

基于当前市场需求,人工智能算力中心的招标需求分析主要包括以下几个方面:1. 算力需求:人工智能的发展需要大规模的计算资源支持,人工智能算力中心需要具备高性能的计算设备,包括服务器、GPU集群、高速存储等,能够满足大规模数据处理和模型训练的需求。

2. 数据处理能力:人工智能算力中心需要具备高效的数据处理能力,包括数据采集、存储、传输和处理等环节的能力,能够支持海量数据的处理和实时数据的分析。

3. 网络带宽和通信能力:人工智能算力中心需要具备高速、稳定的网络带宽和通信能力,能够满足数据传输和服务调用的需求,保障人工智能算法和模型的实时可用性。

4. 安全和稳定性:人工智能算力中心需要具备高度的安全性和稳定性,能够保障数据的安全和隐私,同时能够保证服务的稳定运行,防止因为硬件故障或网络故障等原因导致的中断或数据丢失。

5. 综合管理和监控能力:人工智能算力中心需要具备综合的管理和监控能力,包括对硬件设备的监测和运维、对数据流和计算量的实时监控、对服务质量的评估和调优等,能够保证整个系统的高效运行。

二、招标要求和评分标准在人工智能算力中心的招标过程中,可以根据以上需求分析制定招标要求和相应的评分标准:1. 硬件设备要求:要求供应商提供具备高性能计算能力的服务器和GPU集群,并提供详细的配置参数和性能指标。

评分标准可以包括计算能力、存储容量、能耗等。

2. 数据处理能力:要求供应商提供高效的数据处理方案,包括数据采集、存储、传输和处理等环节的技术方案和实现细节。

评分标准可以包括数据处理速度、数据质量、数据安全等。

高性能计算集群方案

高性能计算集群方案

高性能计算集群方案引言高性能计算(High Performance Computing,HPC)是指利用大规模的计算机群集,通过并行计算方法解决复杂科学、工程和商业问题的一种计算模式。

为了提高计算效率,构建一个高性能计算集群是非常重要的。

本文将介绍一种高性能计算集群方案,该方案包括硬件设备的选择、软件平台的搭建以及集群管理的方法。

硬件设备选择搭建高性能计算集群的第一步是选择适合的硬件设备。

在选择硬件设备时,需要考虑以下几个因素:1. 处理器高性能计算集群的处理器是关键的硬件组成部分。

在选择处理器时,需要考虑其计算能力、核心数量、功耗以及成本等因素。

目前,常见的选择包括Intel Xeon、AMD EPYC等。

2. 内存集群的内存容量直接影响到计算任务的并行性和数据处理能力。

需要根据具体需求选择适当的内存容量,一般建议每个节点的内存容量应满足最大计算任务的内存需求。

3. 网络高性能计算集群需要使用高速网络进行节点间的数据通信。

目前常用的网络技术包括以太网(Ethernet)、InfiniBand等。

网络的带宽、延迟以及可扩展性都是选择网络技术时需要考虑的因素。

4. 存储对于高性能计算集群来说,快速的存储系统对于数据读写的效率至关重要。

可以选择使用固态硬盘(SSD)作为主存储,同时使用磁盘阵列(RAID)进行数据备份和冗余。

软件平台搭建搭建高性能计算集群的第二步是搭建软件平台。

软件平台需要提供集群管理、作业调度以及并行计算等功能。

1. 集群管理软件集群管理软件可以协调和控制集群中的各个节点。

常见的集群管理软件有Slurm、OpenPBS等,可以根据实际需求选择合适的软件。

2. 作业调度软件为了提高集群资源的利用率,需要使用作业调度软件进行任务调度和节点分配。

常见的作业调度软件有Torque、Moab等,根据需求选择合适的软件。

3. 并行计算软件高性能计算集群需要支持并行计算,因此需要安装相应的并行计算软件。

高性能计算资源建设方案

高性能计算资源建设方案

高性能计算资源建设方案背景随着科技的发展,越来越多的领域需要使用高性能计算资源来进行复杂的计算和分析。

为了满足这一需求,我们制定了以下高性能计算资源建设方案。

目标我们的目标是建设一套高性能计算资源,以支持如下领域的需求:1. 科学研究:为科学家提供强大的计算和模拟能力,加快研究进展。

2. 工程设计:为工程师提供高效的计算平台,优化设计流程。

3. 数据分析:为数据分析师和决策者提供高速、高容量的计算资源,帮助他们做出更准确的决策。

方案我们的高性能计算资源建设方案包括以下几个关键步骤:1. 硬件采购:根据需求评估,选购适合的高性能计算服务器、存储设备和网络设备。

2. 网络建设:搭建高速、稳定的网络环境,确保计算资源之间的通信畅通无阻。

3. 软件配置:安装并配置高性能计算软件,包括操作系统、计算库和调度系统等。

4. 数据备份:建立合理的数据备份策略,确保数据安全,并提供数据恢复的能力。

5. 用户支持:建立专业的技术支持团队,为用户提供及时的帮助和解决方案。

预期效果通过实施这一高性能计算资源建设方案,我们预期可以达到以下效果:1. 提升计算效率:高性能计算资源能够大幅度缩短计算时间,提升科学研究和工程设计的效率。

2. 支持大规模数据分析:高容量存储设备和快速网络环境可以支持大规模数据的分析和处理。

3. 降低成本:通过合理的硬件采购和软件配置,可以降低建设和维护成本。

总结本文档提出了一个高性能计算资源建设方案,旨在为科学研究、工程设计和数据分析等领域提供优质的计算资源。

通过合理的硬件采购、网络建设、软件配置、数据备份和用户支持,我们预期可以提升计算效率、支持大规模数据分析,并降低成本。

2024年高性能计算资源服务采购合同

2024年高性能计算资源服务采购合同

20XX 专业合同封面COUNTRACT COVER甲方:XXX乙方:XXX2024年高性能计算资源服务采购合同本合同目录一览第一条合同主体1.1 供应商信息1.2 采购方信息第二条服务内容2.1 计算资源描述2.2 服务期限2.3 服务地点第三条服务费用3.1 费用计算3.2 支付方式3.3 费用支付时间表第四条技术支持和维护服务4.1 技术支持范围4.2 维护服务范围4.3 响应时间第五条合同的履行5.1 供应商的义务5.2 采购方的义务第六条保密条款6.1 保密信息定义6.2 保密义务6.3 保密信息的使用第七条违约责任7.1 供应商的违约行为7.2 采购方的违约行为第八条争议解决8.1 争议解决方式8.2 适用法律第九条合同的变更和终止9.1 合同变更条件9.2 合同终止条件9.3 合同终止后的处理第十条不可抗力10.1 不可抗力事件10.2 不可抗力事件的后果第十一条合同的生效11.1 合同生效条件11.2 合同生效时间第十二条其他条款12.1 合同的转让12.2 合同的附件12.3 通知机制第十三条附则13.1 合同的修订13.2 合同的语言版本13.3 合同的完整声明第十四条签署页14.1 供应商签署14.2 采购方签署14.3 日期记录第一部分:合同如下:第一条合同主体1.1 供应商信息1.1.1 供应商全称:____________1.1.2 供应商地址:____________1.1.3 供应商联系人:____________ 1.1.4 供应商联系电话:____________ 1.2 采购方信息1.2.1 采购方全称:____________1.2.2 采购方地址:____________1.2.3 采购方联系人:____________ 1.2.4 采购方联系电话:____________第二条服务内容2.1 计算资源描述2.1.1 计算资源类型:____________2.1.2 计算资源数量:____________2.1.3 计算资源性能指标:____________ 2.2 服务期限2.2.1 服务开始日期:____________2.2.2 服务结束日期:____________2.3 服务地点:____________第三条服务费用3.1 费用计算3.1.1 计算资源使用费:____________ 3.1.2 技术支持费:____________3.1.3 维护服务费:____________3.2 支付方式:____________3.3 费用支付时间表3.3.1 首次支付日期:____________3.3.2 后续支付日期:____________第四条技术支持和维护服务4.1 技术支持范围4.1.1 技术支持内容:____________4.1.2 技术支持响应时间:____________ 4.2 维护服务范围4.2.1 维护服务内容:____________4.2.2 维护服务响应时间:____________第五条合同的履行5.1 供应商的义务5.1.1 供应商提供的计算资源应满足合同约定的性能指标。

高性能计算集群的配置与使用教程

高性能计算集群的配置与使用教程

高性能计算集群的配置与使用教程高性能计算(High Performance Computing,HPC)集群是一种强大的计算工具,能够处理大规模的数据和执行复杂的计算任务。

本文将介绍高性能计算集群的配置和使用方法,并为您提供详细的教程。

1. 配置高性能计算集群配置高性能计算集群需要以下几个步骤:1.1 硬件要求选择适合的硬件设备是配置高性能计算集群的第一步。

您需要选择性能强大的服务器,并确保服务器之间能够互相通信。

此外,还需要大容量的存储设备来存储数据和计算结果。

1.2 操作系统安装选择合适的操作系统安装在每个服务器上。

常用的操作系统有Linux和Windows Server,其中Linux被广泛使用于高性能计算集群。

安装操作系统后,您还需要配置网络设置、安装必要的软件和驱动程序。

1.3 服务器网络连接为了保证高性能计算集群的正常工作,需要配置服务器之间的网络连接。

您可以选择以太网、光纤等网络连接方式,并确保每个服务器都能够互相访问。

1.4 集群管理软件安装为了方便管理和控制高性能计算集群,您需要安装相应的集群管理软件。

常用的集群管理软件有Hadoop、Slurm和PBS等。

这些软件可以帮助您管理任务队列、分配资源和监控集群的运行状态。

2. 使用高性能计算集群配置完高性能计算集群后,您可以开始使用它进行计算任务。

以下是使用高性能计算集群的一般步骤:2.1 编写并提交任务首先,您需要编写计算任务的代码。

根据您的需求,可以选择编写Shell脚本、Python脚本或其他编程语言的代码。

编写完毕后,您需要将任务提交到集群管理软件中。

2.2 监控任务状态一旦任务提交成功,您可以使用集群管理软件提供的监控功能来跟踪任务的状态。

您可以查看任务的进度、资源使用情况和错误信息等。

2.3 调整任务与资源如果您发现任务需要更多的计算资源或运行时间,您可以根据需要调整任务的资源配置。

集群管理软件通常提供了资源调整的功能,您可以根据任务的实际情况进行调整。

高性能GPU服务器采购招标文件

高性能GPU服务器采购招标文件一、招标概况本次采购旨在获得高性能GPU服务器,以满足公司对于计算资源的需求。

希望通过此招标,找到合适的供应商提供稳定可靠的GPU服务器。

二、招标要求1. 服务器性能要求a. 必须配备高性能GPU,支持多种深度学习框架和计算任务;b. CPU至少为Intel Xeon E5系列或更高性能的处理器;c. 内存容量不低于128GB;d. 支持大容量存储,硬盘至少为4TB;e. 配备可靠的冗余电源供应,以确保系统稳定性;f. 具备较高网络带宽,以满足大规模数据传输需求。

2. 软件要求a. 操作系统:Windows Server或Linux操作系统;b. 支持常见的编程语言和开发环境;c. 预装相应的深度学习框架(如TensorFlow、PyTorch等)。

3. 服务要求a. 供应商需提供服务器的购买发票,保修卡等相关证明;b. 需提供标准的售后服务和远程技术支持,保证服务器的稳定运行;c. 如有需要,供应商应提供系统的升级和维护服务;d. 供应商需提供详细的技术支持手册。

4. 其他要求a. 供应商需具备良好的信誉和丰富的经验;b. 提供的服务器应符合国家相关法律法规,并具备相应的认证。

三、投标文件要求1. 供应商应提供以下文件:a. 公司资质证明:包括公司注册证明、税务登记证等;b. 产品说明书:详细描述提供的GPU服务器的规格、性能以及其他相关信息;c. 产品报价单:列出每台GPU服务器的单价及数量,并注明是否包含增值税;d. 技术支持手册:包括服务器安装和维护手册,以及常见问题解答;e. 售后服务承诺:详细描述供应商提供的售后服务内容和承诺;f. 产品保修卡及相关证明。

2. 文件格式要求a. 投标文件以PDF格式提交,清晰可读;b. 文件命名统一规范,如“公司名称-招标文件-日期.pdf”;c. 文件应包含封面,标示招标公司名称、招标文件名称及日期等信息;d. 文件中的表格、图表等内容需清晰可辨认。

货物类采购需求模板通用

招标项目要求本招标项目要求中所出现的工艺、材料、设备或参照的品牌仅为方便描述而没有限制性,投标人可以在其提供的文件资料中选用替代标准,但这些替代标准要优于或相当于技术规格中要求的标准。

一、项目背景高性能计算机已成为开展天气、气候、地球环境、海洋等数值模拟业务和科学研究所必须的基础工具,其应用的核心是数值预报(Numerical Prediction)。

数值预报是指根据流体(大气或海洋)的物理和运动特性,在一定的初值和边值条件下,通过高性能计算机进行数值计算,求解描写流体演变过程的流体力学和热力学的控制方程组,预测未来一定时段的流体运动状态和大气、海洋现象的方法.我中心建立的海洋预报系统,必须通过高性能计算机的处理,才能正常稳定地运行。

基于我中心预报系统实际需求,计划采购刀片服务器集群,包括1套计算系统、1套交换系统、1套管理系统。

二、采购清单三、技术参数1。

整体需求:完整性:依据招标方单位能够为此平台提供的设备用地、电力系统、核心交换机端口等运行支持环境,提供整体解决方案。

方案必须满足本技术要求中涉及的内容;计算系统:系统由刀片集群,并包含满足集群管理使用的管理/登陆节点;同时提供在线共享存储系统一套,高速SAS裸容量≥6TB(高速存储);交换系统:系统配置双交换系统设计,系统内所有节点实现FDR网络56Gb全线速,同时配置千兆以太管理网,用于整个系统的管理及计算网的备份。

管理系统:配置统一界面的高性能集群管理系统,及高性能集群相关的编译器,数学库和并行环境。

售后服务:提供5年免费人工服务,7×24小时响应,4小时带备件上门的原厂服。

2. 计算系统要求:▲2.1 刀片平台:机架式刀片机箱,可以支持≥10个计算刀片,含上架套件;1*管理模块,集成远程KVM和远程虚拟媒体;1*千兆网络交换模块,支持对内≥10个网络接口,对外≥6个网络接口;FDR交换网络接口:对内FDR 56Gb/s网络接口≥10个,对外FDR 56Gb/s网络接口≥10个;4*冗余热插拔智能调节散热模块;金牌电源效率且支持3+1冗余电源,单体电源支持最大功耗≥2000w;▲2。

如何分析高性能计算任务的资源需求?(十)

高性能计算(High-performance computing)是一种需要大量计算资源的计算方法,通常用于解决复杂的科学、工程和商业问题。

然而,为了确保计算任务能够高效地执行,我们需要对其资源需求进行分析和优化。

本文将讨论如何分析高性能计算任务的资源需求,以帮助读者更好地规划和管理计算任务。

一、任务特性分析在进行资源需求分析之前,首先需要对计算任务的特性进行分析。

不同类型的计算任务对计算资源的需求可能会有很大的差异。

例如,有些任务可能需要大量的内存和存储来处理大规模的数据集,而另一些任务可能主要需要大量的计算核心来处理复杂的计算模型。

因此,我们需要了解计算任务的类型、数据量、计算量以及运行时间等特性。

二、性能指标测量与分析在分析任务的资源需求之前,我们首先需要了解任务的性能指标。

将任务的执行时间作为性能指标是一种常用的方法。

我们可以通过测量任务的实际执行时间来了解任务对计算资源的需求。

为了准确测量性能指标,我们还需要考虑许多其他因素,如系统的负载情况、网络带宽和延迟、数据传输速度等。

这些因素可能对任务的性能产生显著影响,因此需要进行详细的分析。

三、资源需求分析现在我们已经了解了任务的特性和性能指标,可以开始进行资源需求分析了。

在分析资源需求时,我们通常需要考虑以下几个关键因素:1. CPU资源需求:根据任务的计算量,我们可以估算出所需的CPU核心数。

通常情况下,计算密集型任务需要更多的核心来处理大量的计算操作。

2. 内存需求:某些任务可能需要较大的内存空间来存储和处理数据。

我们需要根据任务要求来评估所需的内存大小。

3. 存储需求:对于处理大规模数据集的任务,我们需要足够的存储空间来存储数据。

此外,还需要考虑数据的读取和写入速度,以确保任务的正常执行。

4. 网络需求:某些任务可能需要高带宽和低延迟的网络环境。

我们需要评估任务对网络资源的需求,并选择合适的网络配置。

5. 并行性分析:许多任务可以通过并行计算来提高处理能力。

招标技术规格要求

高性能计算集群技术参数一、设备名称:高性能计算集群二、采购数量:1台套三、总体要求:卖方所投设备的制造商必须有五年以上研制、生产该类设备的经验,五年以上的销售业绩。

系统制造商已通过ISO 9001认证,且在国内外高校和研究院所有良好的供货记录,不少于10台套。

四、主要参数1.需配备1台管理兼I/O节点选用Inter E5 V3系列处理器(主频≥2.1G,数量≥1),内存≥32GB,计算核心≥12个。

硬盘容量(SAS)≥300G。

2.需配备2台SMP节点一台为ANSYS/ABAQUS隐式求解器计算用节点,选用Inter E5 V3系列处理器(主频≥2.5G),内存≥128GB,计算核心≥20个,硬盘(6Gb SAS)≥300G。

;一台为Ls-DYNA\CFD类的计算节点,选用Inter E5 V3系列处理器(主频≥2.5G,数量≥2),内存≥72GB,计算核心≥24个。

,硬盘(6Gb SAS)≥300G。

3.需配备多台双路节点(≥3台)选用Inter E5 V3系列处理器(主频≥2.5G,数量≥2),内存≥72GB,计算核心≥24个,硬盘(6Gb SAS)≥300G。

4.需配备一台用于规模在1000万自由度以上的网格剖分或试算及后处理的图像工作站。

(Inter E5V2系列处理器两颗(主频≥2.8G),内存≥64GB,NV QUADRO K2200 4GB -E2x16 68W 单宽显卡一块,硬盘:固态硬盘容量不低于240G+SATA 硬盘2TB),配套正版ANSYS复合材料专用前后处理软件一套,操作系统Win8专业版或更高。

5.总体浮点运算能力为:50000亿次;6.总内存为600G物理内存,整体计算能力和内存满足1亿以上网格数量级的计算要求;7.需配备24TB的FC-SATA2存储;至少 4×1000M以太网接口,IB网络接口。

8.需配备56GB专用Infiniband计算网络(至少24口及满足现有计算的网卡及线),一套千兆以太管理网络(至少48口);9.需配备原厂机柜,KVM视频管理系统。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高性能计算集群项目采购需求
以下所有指标均为本项目所需设备的最小要求指标,供应商提供的产品应至少大于或等于所提出的指标。

系统整体为“交钥匙”工程,厂商需确保应标方案的完备性。

投标商在投标方案中须明确项目总价和设备分项报价。

数量大于“1”的同类设备,如刀片计算节点,须明确每节点单价。

硬件集成度本项目是我校校级高算平台的组成部分,供应商提供的硬件及配件要求必须与现有相关硬件设备配套。

相关系统集成工作由供应商负责完成。

刀片机箱供应商根据系统结构和刀片节点数量配置,要求电源模块满配,并提供足够的冗余。

配置管理模块,支持基于网络的远程管理。

配置交换模块,对外提供4个千兆以太网接口,2个外部万兆上行端口,配置相应数量的56Gb InfiniBand接口
刀片计算节点双路通用刀片计算节点60个,单节点配置2个CPU,Intel Xeon E5-2690v4(2.6GHz/14c);不少于8个内存插槽,内存64GB,主频≥2400;硬盘裸容量不小于200GB,提供企业级SAS或SSD 硬盘;每节点配置≥2个千兆以太网接口,1个56Gb InfiniBand 接口;满配冗余电源及风扇。

刀片计算节点(大内存)双路通用刀片计算节点5个,单节点配置2个CPU,Intel Xeon E5-2690v4;不少于8个内存插槽,内存128GB,主频≥2400;硬盘裸容量不小于200GB,提供企业级SAS或SSD硬盘;每节点配置≥2个千兆以太网接口,1个56Gb InfiniBand接口;满配冗余电源及风扇。

GPU节点2个双路机架GPU节点;每个节点2个Intel Xeon E5-2667 v4每节点2块NVIDIA Tesla K80GPU加速卡;采用DDR4 2400MHz ECC内存,每节点内存16GB*8=128GB;每节点SSD 或SAS硬盘≥300GB;每节点配置≥2个千兆以太网接口,1个56Gb/s InfiniBand接口;满配冗余电源及风扇。

数据存储节点机架式服务器2台,单台配置2颗Intel Xeon E5-2600v4系列CPU;配置32GB内存,最大支持192GB;配置300GB 2.5" 10Krpm
SAS 企业级硬盘2块;配置3.5" 7.2Krpm SATA企业级硬盘总容量(裸容量)不少于45TB;配置≥2个千兆以太网接口;配置1个FDR 56Gb主机接口;八通道高性能SAS RAID卡(1GB缓存);1+1冗余服务器电源;须并入现有集群Lustre文件系统,扩展现有文件系统存储容量和读写带宽;供应商须负责在保证现有文件系统数据安全的前提下,完成此项工作;扩容完成后,存储系统整体读写带宽≥7GB/s,以IOZone实测结果为准。

计算网络配套Mellanox InfiniBand 交换机SX6512,18 port FDR Leaf for SX65xx Chassis Switch, ROHS6刀片页板4块。

配置数量足够的Infiniband FDR线缆,QSFP接口,10m,光纤缆。

管理节点2U机架式服务器1台,每台配置≥2颗Intel Xeon E5-2600 v4系列CPU;≥64GB DDR4 ECC 内存,主频≥2133;≥3块300GB 10Krpm SAS热插拔硬盘,支持RAID 0/1;≥2个千兆以太网接口,1个56Gb InfiniBand接口;满配冗余电源及风扇
IPMI交换机24个10/100/1000Base-T以太网端口,4个1000Base-X SFP千兆以太网端口,交换容量为208Gbps(全双工),包转发率51Mpps 支持链路聚合、端口聚合,支持VLAN,可管理,支持2.5G堆叠,支持IPv6+MAC绑定,支持USB备份日志及配置。

配备足够数量的6类千兆网线。

管理网络管理网络利用现有交换机。

要求刀片机箱管理网络通过2个外部万兆上行端口链接至现有万兆交换机,配置长度及数量足够的10Gb以太网SFP+直连线缆和模块。

机柜、KVM系统及供电系统42U工业标准机柜2个,每个机柜配备专业工业PDU,可选220V/380V供电环境。

提供机柜至配电柜的双路供电电缆、接地线缆及相关辅材,以及与PDU配套的机房PDU专用航空插头,并负责安装施工,须严格遵循机房施工及电工施工相关规范。

机柜与配电柜的直线距离约为5米。

提供数量足够并且能够与现有SKVM串行视频切换系统集成的USB节点、终结器等设备及配套线缆。

集群管理软件1.要求集群管理软件支持双机热备方式部署。

2.作业管理模块:支持脚本提交、命令提交、模板提交;支
持查看作业状态及结果;支持停止、删除、启动、查看图形化作业;支持回填、资源预留、公平共享等多种策略,并支持自定义策略。

3.集群管理模块:提供IP管理,Hosts管理,进程管理,服
务管理,远程开机/关机管理。

4.集群系统部署模块:可以同时针对不同的节点分发不同的
系统镜像与定制软件包,系统镜像及定制软件包安装过程中无需手动干预,可指定系统最终IP、主机名,自动适应各节点间的软硬件配置。

5.监控模块:可监控集群实时信息、历史信息、节点性能对
比数据;可生成作业信息面板、资源使用情况面板、报警信息监控面板等。

6.报警模块:提供详细报警信息列表、报警参数设置、报警
阈值设置;支持邮件报警,短信报警,web界面报警。

7.文件管理模块:支持文件的上传、下载操作,支持在线复
制、粘贴、删除、打包、重命名、新建、打开等操作。

8.记账统计模块:支持记账配置,支持按照CPU、内存、存
储使用情况计费或者自定义计费策略;支持统计报表导出;
支持在线用户缴费和余额管理。

9.物理视图模块:可通过物理视图展示整体视图,监控机柜
中各节点状态;可通过物理视图直接对节点进行远程桌面、远程shell、报警信息、显示节点运行情况、开关机等操作。

10.支持通过Web界面的脚本作业提交。

至少提供以下应用软
件的Web界面模板提交:Lammps、VASP、Materials Studios、Gaussian、Fluent、ABAQUS、CP2k、STARCCM、SIESTA。

提供以上应用软件的测试算例和作业提交方法的详细说明文档。

11.大屏幕监控模块:适用于大屏幕监控,适用于无人干预的
长期显示,包括集群资源使用情况监控,集群节点状态监控,集群作业信息监控;提供集群概况监控页面,集群节点状态监控页面,集群作业监控页面。

到货及安装服务本项目到货安装地点西安交通大学兴庆校区网络中心一楼数据中心机房。

要求系统整体在2016年11月15日前完成系统安装调试。

应标方负责集群系统安装调试,集群管理软件、作业调度系统、开发环境等的安装,协助进行应用软件的移植安装,常用计算软件的整合等。

验收时应能够达到完整功能使用需求。

售后服务投标产品是当前主流产品,备品备件充足,满足本系统保修期内备件需求并及时响应。

产品软硬件五年以上质保。

应标方应对平台软件与硬件提供不低于五年的上门服务与技术支持;在此期间提供2小时内上门服务,一般问题应在48小时内解决,重大问题或其它无法迅速解决的问题应在三个工作日内解决或提出明确解决方案。

定制服务提供新购设备与平台现有设备整体运维解决方案。

提供系统集群管理软件,作业调度软件,应用特征分析软件,集群部署软件,系统及并行软件,以及整体平台的界面定制(如定制为西安交通大学的平台),作业模板的定制接口开发(例如新增应用软件的作业提交模板的定制),以及系统硬件管理接口的开放等其他硬件的二次开发接口,以便于自主定制开发管理系统。

培训投标人中标后须指定工程师提供的系统使用、管理和维护培训。

经培训后,用户应能够熟练掌握集群维护工作并能及时排除大部分的硬件和软件系统故障。

投标人应提供各种并行开发技术如MPI并行编程、OpenMP并行程序设计、集群系统基础、GPU通用计算技术及编程、并行文件系统、集群服务平台产品和使用、服务器应用特征分析方法、存储系统实施、服务器负载均衡产品介绍等的专业培训,并在投标时提供相关课程列表及培训方式,接受培训的人数≥2。

投标人应承担培训完全费用(如果培训异地进行,应包括差旅费等)。

案例要求要求供应商或厂商具备《计算机信息系统集成企业资质》
要求提供所代理品牌近三年内(2014年1月1日至今),在国内客户领域,100万亿次或以上规模高性能计算项目案例,不少于3个,提供采购合同复印件。

相关文档
最新文档