Mellanox-4036-QDR交换机白皮书

Mellanox-4036-QDR交换机白皮书
Mellanox-4036-QDR交换机白皮书

Mellanox Technologies

Mellanox GD4036高性能QDR InfiniBand交换机

Mellanox公司是全球网格骨干解决方案的领导者,致力于为下一代数据中心网络化计算提供最为全面的解决方案。Mellanox公司的产品涵盖了从服务器到网络交换到存储互联的各个领域,凭借先进的架构设计以及严谨的质量控制,Mellanox公司的软硬件产品在全球用户市场获得了广泛的好评,通过IBM、HP、SGI、NEC、SUN等合作伙伴建立了OEM合作关系,Mellanox公司的产品以及解决方案正在被部署在各行各业。

作为业高性能InfiniBand交换解决方案,Mellanox GD4036为高性能计算集群和网格提供了水平空前的性能和扩展性。GD4036交换机能使高性能应用运行在分布式的服务器、存储和网络资源上。Mellanox GD4036对单个机箱中的36个节点精心设计并提供了QDR规格的40Gb/s通讯带宽,多台GD4036或者与Mellanox其他产品配合,我们可以搭建更大规模的集群运算系统,可配置的节点数量范围从十几个到几千个,内部无阻塞的交换设计最大限度的为集群运算系统提供了可靠高效的通讯环境

Mellanox Technologies

一、Mellanox GD4036模块介绍

Mellanox GD4036主要由主机箱、sPSU电源模块以及相应的系统散热模块构成,整机采用模块化设计、无线缆接插件紧密连接结构,大大提高了设备的可靠性,同时方便了系统安装以及以后的维护工作。

GD4036机箱及相关部件

Mellanox GD4036机箱采用工业标准设计完全符合19英寸机柜的安装,支持网络机柜和服务器机柜安装使用;高度为1U,在一个标准42U机柜中可以轻松部署多台Mellanox GD4036;Mellanox GD4036提供了机架导轨,更方便机箱的机柜安装;

Mellanox Technologies

1. 对外端口

Mellanox GD4036机箱提供了36个QDR 40Gb/s端口,总计可以提供2.88Tb/s吞吐量;

2. 管理模块

Mellanox GD4036内置了子网管理器,无须在服务器上安装子网管理器软件;管理模块提供了标准的DB9串口以及以太网连接接口提供远程管理。同时还提供了一个标准的USB接口用于软件及微码的升级。

GD4036除了标准的36端口交换芯片外,还设计有由一个低功耗的CPU以及相应的缓存组成的板载监控系统,通过搭载相应的固件,可以实时监控电源模块、风扇散热工作状

Mellanox Technologies

况以及系统工作温度等详细信息;对于交换机端口可以实现启用、禁用以及速率调整等功能;

3. 风扇模块

Mellanox GD4036机箱标准配置了一个散热模块,内部包含两个冗余风扇,支持热插拔更换维护,提高了高可用性和可维护性。

4.电源模块

随机箱配置2个最大功率为350Watt的电源模块,确保系统能够实现N+1,N+N电源供电,每个电源模块提供对机箱内所有模块的供电,用户不必担心出现竞争友商产品中的分区供电故障问题。所有电源模块均位于机箱两侧支持热插拔更换,并且与外部线缆连接

Mellanox Technologies

模块不在同侧,这样的设计充分考虑了线缆布线对未来电源系统维护带来的挑战,大大方便系统维护。

二、Mellanox GD4036可靠性

Mellanox GD4036全部采用模块化设计,部件连接均采用先进可靠的连接模块来实现,从根本上保证了系统内部通讯链路的可靠性;

在管理方面,Mellanox GD4036内置子网管理器、集成Device Manager,可实现设备硬件监控功能、完全支持Unified Fabric Manager(UFM)软件管理;

在系统供电方面,Mellanox GD4036支持N+1以及N+N的冗余供电配置,所有电源模块均提供对整个机箱供电,平均负担整机负载,电源模块支持热插拔更换维护,确保整个系统不间断运行;

Mellanox Technologies

Mellanox GD4036提供了一个散热模块,散热模块具备两个散热风扇,两路散热风扇互为备份;同时,先进的机箱模块设计使得系统散热效率最大化;

Mellanox GD4036通过了国际FCC、UL、CB、VCCI等多项认证,在产品设计、运行可靠性、电磁稳定性等多方面获得权威机构的认可!

三、Mellanox GD4036 性能

Mellanox GD4036采用全互连无阻塞架构,总计提供2.88Tbps的吞吐率,同一个内

部交换模块的两个端口之间的延迟小于100纳秒;

四、Mellanox GD4036管理

Mellanox GD4036提供了命令行管理方式以及先进的UFM管理软件,借助Mellanox UFM管理软件,InfiniBand网络不再是个神秘的黑盒子,整个网络的监控与管理将变得透明化、系统化。

Mellanox Technologies

1. Mellanox UFM核心特点

●以应用软件为中心的网络管理;

●无限可扩展性提供对应用软件、数据库以及存储系统的无缝支持;

●直观的展现网络交通以及设备运行状况,确保用户清晰并深度掌握网络工作

Mellanox Technologies

●先进的网络阻塞状况发现与分析优化处理功能;

●基于应用软件工作流以及网络拓扑结构的通讯路由优化功能;

●可设定与调节的故障预警机制,使用户对网络通讯状况了如指掌;

●提供网络分区以及多服务等级的分区功能,方便用户设定与调整;

●提供在一个共享的网络中实现多个基于应用软件的独立通讯区域设定;

●集中化的InfiniBand网络设备管理使得大型网络中设备管理更为便捷;

●安全可靠的HA架构设计确保UFM管理系统的高可用性;

●提供API接口,方便用户将UFM管理纳入现有的综合管理系统中。

2. Mellanox UFM网络状况发现与控制

Mellanox UFM集成了先进的网络监控引擎,对InfiniBand网络交换机以及连接到InfiniBand网络的主机提供实时的监控。

Mellanox UFM提供了一个可自行设定的公告牌界面,可以提供网络健康状况以及主机CPU、内存、磁盘等资源的使用状况,通过公告牌界面,我们可以方便的看到服务器中网络通讯带宽开销最大的Top10(数量可以自行设定),网络中阻塞最多的Top10,网络中故障报警的实时列表,网络中阻塞问题的热点出现在哪里等等,

Mellanox Technologies

3. 网络拓扑结构自动发现,网络瓶颈实时显示

Mellanox UFM能够自动监测网络拓扑结构并自动绘制出相应的拓扑结构图,同时,通过实时的通讯链路监控,Mellanox UFM能够自动发现网路拥塞的热点区域并通过

Mellanox Technologies

图表方式显示给用户,此功能可以帮助用户精确的定位网络通讯的阻塞状况,为下一步性能优化提供参考数据。

4. 网络分区优化与路由通讯优化

Mellanox UFM提供先进的网络通讯优化功能,针对不同需求的计算群组(低延迟、高带宽等等)可以创建相应的逻辑计算机资源组,在同一个组内的计算节点之间通讯会自动根据所设定的网络需求类型进行优化,确保网络通讯能够分层进行,大大提高网络通讯效率;

Mellanox Technologies

同时,Mellanox UFM还提供了独有的Traffic Optimized Routing (TOR)路由算法,经过优化后,网络中的阻塞热点会自动被均衡再分配,大大降低网络带宽资源争抢所造成的整体计算效率下降的问题。

Mellanox Technologies

Mellanox Technologies

5. 全网络通讯日志收集与保存

Mellanox UFM会自动收集并保存整个网络(包括交换机端、计算节点I/O节点端)的通讯日志,为系统通讯状况分析以及故障排查提供强有力的资源支持。

Mellanox Technologies

6. Mellanox UFM支持的InfiniBand网络设备以及主机平台

Mellanox UFM支持的硬件交换机平台:

Mellanox GD2004/2012系列

Mellanox Vantage系列

Mellanox GD4000系列

Mellanox Technologies

Mellanox IS5000系列

Mellanox UFM支持的主机平台:

Redhat 5.1/5.2/5.3/5.4/5.5/5.6/6.0

Centos 5.1/5.2/5.3/5.4/5.5/5.6/6.0

Windows 2003/2008

五、Mellanox GD4036在OEM厂商

目前,Mellanox GD4036交换机已经通过IBM、HP、富士通、曙光、浪潮等多个服务器厂商严格的OEM产品测试,已经开始面向市场销售并获得了数目可观的订单,这进一步说明了Mellanox GD4036无论在可靠性、性能以及可扩展性等方面已经获得诸多国际厂商以及用户的充分认可!

相关主题
相关文档
最新文档