超融合项目可行性报告

超融合项目可行性报告
超融合项目可行性报告

超融合项目方案可行性报告

规划管理部

2016年12月

目录

1.IT发展背景 (3)

2.超融合基础架构 (5)

3.超融合平台的收益分析 (8)

架构简单 (8)

横向扩展 (10)

解除性能瓶颈 (11)

可靠性 (11)

易于部署 (12)

集中管理 (12)

自动故障恢复 (12)

4.行业超融合产品调研 (14)

联想超融合 (14)

华为超融合 (15)

EMC超融合 (17)

5.联想超融合HX系列的优势及成功案例 (18)

System X的可靠性 (20)

强大的XClarity管理工具 (25)

创新的超融合软件系统 (28)

联想技术支持服务 (30)

超融合专业服务 (30)

售后技术支持服务 (31)

平台定期巡检服务 (31)

联想超融合的成功案例 (32)

人民银行福州中心支行超融合 (32)

上海交通银行信用卡中心超融合 (34)

兴业银行超融合 (36)

上海通联金融服务有限公司超融合 (39)

1.IT发展背景

一、IT挑战

当前IT基础架构已实施了虚拟化平台,但这种以服务器、存储、网络为基础建设的系统平台存在系统复杂,缺乏创新等问题。随着业务的飞速发展,急需对当前IT架构进行整体升级改造,以应对业务增长的需求。

不断增长且集中的业务对IT 部门的要求越来越高,所以数据中心需要更为快速的提供所需能力,提供可靠性的同时,简化IT运维管理。

为了满足未来业务发展的需要,有效地解决数据安全、集中管控、快速部署、跨平台访问、节能环保等问题,信息技术部已经开始关注通过虚拟化、分布式及超融合等互联网相关技术来解决现有数据中心的各种挑战,随着虚拟化及云计算的日益成熟,计划将其数据中心新业务系统运行在的基于互联网基因的超融合基础架构平台上。

现有数据中心存在的挑战包括:

?服务器数量众多,管理变得越来越复杂;

?新业务系统上线周期长,部署慢;

?SAN/NAS存储扩展性差,无法支撑新业务的性能需求;

?新业务走向互联网化,传统架构无法实现线性扩展能力;

?应用系统缺乏高可用性保护;

?数据中心空间资源有限等。

重要的业务系统采用x86服务器和存储组成的平台,硬件设备已经使用多年,目前处于更新换代期;应用软件基于不同平台开发,管理上不同的单点工具亦较为复杂;

存储存在资源扩容瓶颈、维护费用较高,部分性能不能满足业务需求的问题;

分散的服务器和存储资源不能共享,使用率低;不能快速响应业务系统增长对资源的需求。难以实现对系统数据的统一备份、本地高可用和远程容灾等数据保护方案;

企业数据中心面临成本与复杂性、IT孤岛、无暇创新的难题:部署、管理和扩展数据中心变得极其昂贵和消耗时间;老旧的基础设施造成不灵活的数据孤岛,需要专门管理;IT 人员忙于解决日常运维事务而错失机遇。

缺乏多维度统一的性能监控(服务器、存储、SAN网络、整体业务、应用)

信息技术如何转化成增长动力?

新业务模式产业化转型,IT架构要随之改变,

如何从传统架构的束缚中释放潜力?

IT的投资方向,需要把握未来已知和未知的机遇。

创新的步伐需要更加敏捷,以利用已知和未知的市场变化。

2.超融合基础架构

超融合基础架构(Hyper-Converged Infrastructure,或简称“HCI”)是指在同一套单元设备中不仅仅具备计算、网络、存储和服务器虚拟化等资源和技术,而且还包括备份软件、快照技术、重复数据删除、在线数据压缩等元素,而多套单元设备可以通过网络聚合起来,实现模块化的无缝横向扩展(scale-out),形成统一的资源池。HCI是实现“软件定义数据中心”的终极技术途径。HCI类似Google、Facebook等互联网数据中心的大规模基础架构模式,可以为数据中心带来最优的效率、灵活性、规模、成本和数据保护。使用计算存储超融合的一体化平台,替代了传统的服务器加集中存储的架构,使得整个架构更清晰简单。

超融合基础架构的核心概念表述如下:

?天然的将两个或者多个组件组合到一个独立的单元中:在一个超融合系统中,至少有两个或者两个以上的组件天然的整合在一起(而非简单的捆绑在一起或者安装在

一个机柜中);

?采用标准的服务器硬件:不再需要专门的SAN存储;

?软件与硬件紧密结合:实现资源整合、统一管理与调配,及存储功能;

?虚拟化:与Hypervisor虚拟化层紧密结合,实现计算、存储、网络虚拟化;

总结超融合系统的四个典型特征:

?计算与存储资源融合;

?软件定义的基础架构;

?分布式的自治系统;

?线性的横向扩展;

下表列举了使用超融合架构(计算+存储)和传统数据中心三层架构(服务器+光纤交换机+存储)的对比:

那么为什么现在超融合概念得到了普遍的认同?是什么在驱动超融合的快速发展?

第一:业务创新要求IT基础架构更灵活和敏捷:传统孤立、割裂的三层架构,稳定性有余,灵活性不足;

第二:数据中心面临效率和成本的挑战:如何提高运营效率,降低总体拥有成本是所有IT人员面临的挑战;

第三:硬件资源充足:CPU性能越来越强,内存越来越来越大,HDD容量越来越高,SSD的容量不断提升,万兆以太网络逐渐普及,与此同时,硬件采购成本持续降低,单位提供的资源密度提升;

第四:软件智能走向成熟:虚拟化、、分布式、云计算技术愈加成熟,使得我们对资源管理的粒度可以做的很小,而在节点规模上可以做的很大;

3.超融合平台的收益分析

架构简单

超融合在同一套单元设备中不仅仅具备计算、网络、存储和服务器虚拟化等资源和技术,而且还包括备份软件、快照技术、重复数据删除、在线数据压缩等元素,而多套单元设备可以通过网络聚合起来,实现模块化的无缝横向扩展(scale-out),形成统一的资源池,它的扩展方式变为横向增加节点即可.

这种架构使得企业的基础架构变得简单。有了超融合,技术架构设计方面,不用再考虑到过多的基础架构设计环节,真正得到极大解放。比如:不再考虑存储设备,和存储网络设备选型,以及不用在存储容量和性能规划(Sizing)上大费脑筋。

图:超融合简化IT基础架构设计与实现

一句话概括,超融合简化IT基础架构:专用系统、特殊硬件转变为灵活定制的可横向扩展标准硬件;

使用超融合的虚拟化基础架构,在保证应用数据的高速访问和高可靠性同时,不再需要传统的集中式存储架构,避免在今后运行过程中出现设计初期忽视的性能问题。

按照服务器和存储使用现状,建议使用超融合来支撑现有应用。在今后随着业务发展,可以方便的按照节点进行扩容,避免建设初期一次性投资过大,后期却发现性能问题,需要追加投资的问题出现。

超融合是部署广泛、值得信赖的虚拟化基础架构平台。可为数据中心虚拟化带来横向扩展架构、高可用性和可靠性等优势。研究显示,并非所有的企业数据中心项目真正做到了全面部署,很大一部分项目通常因为基础设施的成本不断攀升而束之高阁。传统服务器和存储阵列扩展成为企业数据中心项目成本高昂、过程复杂并且难于实施的主要因素。从诸多数据中心项目实施来看,在企业环境中,性能、可靠性、可扩展性是关键,因为最终用户体验直接来自于基础设施的高性能和高可靠性。

超融合将融合基础设施、横向扩展架构和软件定义存储的各种优势结合在一起,可提供极佳的数据中心虚拟化体验,而其成本仅为传统服务器和存储器的一小部分。超融合完整集群是一种能够横向扩展的计算和存储基础设施,它使各组织机构无需存储网络(SAN或NAS)即可实现数据中心虚拟化。超融合专门为虚拟化而设计,能够提供全面的计算和存储能力,以及企业级的性能、可扩展性、可用性和数据管理功能。它采用英特尔芯片、固态硬盘等符合行业标准的硬件组件,以及市场领先的高级管理程序,以便提供开箱即用的解决方案,让数据中心虚拟化变得极其简单有效。

横向扩展

超融合解决方案给虚拟化环境带来的重要差异化因素之一就是,基础设施在进行扩展时其性能仍然保持不变。在超融合架构中,在每个物理节点本地都运行一个虚拟存储控制虚机。它负责本地所有其他虚拟机的IO操作。当集群扩展时,新增加节点的同时也新增了CVM,保证了整个集群性能的横向扩展。与传统集中存储不同,传统架构下集中存储只有两个存储控制器,在集群扩展时,存储控制器无法进行有效的扩展,从而必然成为整个架构的瓶颈。

拿桌面虚拟化(VDI)项目举例,模拟桌面启动风暴,并且当基础设施从300台桌面扩展到3000台时,超融合的性能从最终用户体验的角度来看保持了一致。在大多数传统的存储环境中,最佳性能仅出现在第一天,因为应用程序或工作负载越来越多,导致性能随着时间的推移不断下降,直至需要进行叉车式升级,采用全新的存储阵列。

下图说明了从300台桌面扩展到3000台时,应用响应时间保持不变:

相对应用性能

虚拟桌面数量与应用响应时间

图2.8 超融合在不同VDI数量下的相应时间

解除性能瓶颈

超融合解决方案在数据中心虚拟化环境中的主要优势之一就是性能,而性能优势是通过传统的服务器和存储架构实现的。在传统的架构中,时延是因为每次访问存储都需要通过网络而造成的。通过NFS和iSCSI等协议提供存储本身没有问题,但网络会增加时延。超融合解决方案可提供NFS协议的优势及其易用性,而通过所谓的“无网络NFS”消除了网络时延。超融合采用的分布式文件系统直接对虚拟机进行检测,然后将特定虚拟机的所有数据存放到本地物理服务器上。因此,虚拟机不是通过网络、而是通过高速内部总线访问其数据。并且所有节点标配SSD 磁盘,提供极高的IOPS以满足虚拟化环境各种类型应用需求,无论是虚拟桌面还是服务器虚拟化场景。

可靠性

超融合平台使用复制因子(RF - Replication Factor)和校验和(checksum)来保证当节点或者磁盘失效时,数据的冗余度和可用性。当数据写入SSD时,会被“同步”复制到另1个或者2个节点的SSD之中(依赖RF设置为2或者3),当这个操作完成之后,此次写操作才被确认(Ack)。这样能确保数据至少存在于2个或者3个独立的节点上,保证数据的冗余度。

所有超融合节点都参与数据的复制操作,这样能消除“热点节点”,并保证线性的性能扩展。当数据被写入时,同时计算该数据块的校验和,并且作为数据块元数据中的一部分进行存储。随后数据块在保证满足RF的前提下,被“异步”推送到HDD中。当发生节点或者磁盘失效,数据块会重新在所有节点间进行复制以满足复制因子的设置。任何时候,读取数据块并同时计算其校验和以确保数据块有效。当数据块检查结果不匹配校验和时,副本数据将会覆盖该无效数据块。

易于部署

超融合开箱即用的部署方式,可以免去传统集中存储环境下存储的规划、连接、配置联想等复杂的管理操作,无需再配置Raid组、LUN、卷等。新设备安装上架后只需要约20分钟即可完成初始化配置,用户可以马上开始部署应用虚拟机。

超融合集群的扩展也非常方便,通过鼠标点击即可扫描并自动发现新安装的节点,按照提示完成IP地址配置之后,新节点即完成加入集群操作,新增资源也自动纳入资源池统一调度管理。集中管理

通过超融合的一键式运维管理界面实现所有基础架构的管理操作,包括健康检查、物理机管理、虚拟机管理、存储管理、数据保护、告警监控、报表分析等内容。用户不再需要通过不同界面进行各种管理任务,所有任务都在同一个界面中完成,极大减少的管理复杂程度。

所有物理和虚拟管理对象均提供详细的性能采集数据,包括CPU、内存、磁盘容量、IOPS、吞吐、读写延迟等指标,不再依赖于专用的监控工具和复杂的监控脚本。

自定义的报表工具可以灵活的将将不同监控项进行组合和展示,减少日常维护的工作量。有利于简化大规模IT架构、或者多站点场景下的日常管理任务。

自动故障恢复

超融合抛弃了传统的Raid机制来保护硬件失效,采用全新的复制因子和校验和技术来保证当节点或者磁盘失效时,数据的冗余度和可用性。当发生单点磁盘甚至是单个节点故障时,超融合集群将自动发现这一故障,并立刻在后台开始数据重建工作。整个重建过程非常简单,假设复

制因子是2,系统会自动发现只有1份副本的数据块,并将其在另一个节点上复制第2份副本即可。

4.行业超融合产品调研

截止到2016年底,全球市场上能够看得见名字的超融合解决方案供应商至少超过30-50家,仅在中国就有超过10家公司“宣称其能够提供企业级的超融合解决方案”。不同超融合方案也存在着技术成熟度、虚拟化支持、产品可靠性、功能和特性、管理便利性的巨大差别。

如下就市场最主流的几个超融合产品进行调研和梳理。

联想超融合

Lenovo联合超融合业界顶级的软件厂商Nutanix推出了超融合HX系列产品,它是基于Lenovo企业级服务器平台开发的超融合系统.HX超融合解决方案的计算资源池是通过联想久负盛名的System x服务器虚拟化来实现的,可以支持VMware vSphere、MicroSoft Hyper-v 及Nutanix Acropolis平台提供的KVM等Hypervisor.

联想HX提供的分布式文件系统(NDFS)可以将一组集群内的节点组成一个统一的分布式存储平台。HX分布式存储架构不仅同样提供传统存储的能力外,还提供更多的能力。针对于虚拟化方面提供快照、克隆等机制,数据层实现本地优先访问、存储分层等性能机制,对数据进行压缩和去重提高存储可用容量,借助两份以上冗余数据提供存储的可靠性,增加或减少节点数据分布会自动平台,当节点宕机或磁盘损坏后具备数据自恢复能力等.

通过联想HX超融合的Prism界面实现所有基础架构的管理操作,包括健康检查、物理机管理、虚拟机管理、存储管理、数据保护、告警监控、报表分析等内容。用户不再需要通过不同界面进行各种管理任务,所有任务都在同一个界面中完成,极大减少的管理复杂程度。

华为超融合

华为FusionCube超融合基础设施,于机框中融合刀片服务器、分布式存储及网络交换机为一体,无需外置存储、交换机等设备,并预集成了分布式存储引擎、虚拟化平台及管理软件,资源可按需调配、线性扩展。

华为FusionCube虚拟化超融合基础设施的总体架构图如下:

图:华为FusionCube解决方案总体架构

FusionCube Center:作为FusionCube的管理软件,管理其中的虚拟化资源、硬件资源,提供系统监控管理和运维管理等功能。

FusionCube Builder:提供现场快速安装部署FusionCube系统软件,可用于现场更换虚拟化平台软件或者更新版本。

FusionStorage:使用分布式存储技术,通过合理有序组织刀片服务器的本地硬盘,提供高性能高可靠的块存储业务。

硬件:服务器使用E9000/X6800,支持计算、存储、交换、电源模块化设计,计算和存储节点按需混配,计算、存储都在框内部署完成,支持GPU,SSD PCIe等I/O加速扩展,支持丰富的交换模块GE,10GE,IB,根据业务要求灵活配置。

兼容的虚拟化平台包括FusionSphere和VMware vSphere。FusionCube支持为虚拟化平台提供统一的计算、存储和网络资源。?支持虚拟化平台软件的预安装和自动安装部署,一次性完

成虚拟化平台、FusionCube等软件的安装,提高系统部署效率。集成虚拟化平台资源监控功能,一个管理界面即可提供整个系统的日常运维。

EMC超融合

EMC在2016年2月推出了VxRail超融合平台,这是一款专门针对VMware vSphere环境设计的集成的超融合基础设施解决方案。VxRail一体机将VMware超融合软件内的系统管理功能--包括VMware vSphere、vCenter Server以及VMware Virtual SAN--结合到一个产品家族中。VxRail还加载了集成的EMC的数据服务,包括复制、备份和云分层。

注:VxRail 中的分布式存储软件vSAN是vSphere核心组件,它紧密融合在vSphere Kernel中,合并的计算和存储故障域,可能会使得整个平台在IO负载较大的情况下可能发生连锁崩溃,从而影响平台稳定性。当SSD故障,SSD所在的磁盘组均不可用,重建需要花费更长时间。集群内只能扩展同型号节点,配置型号是固定的。

5.联想超融合HX系列的优势及成功案例

对以上三种超融合的整体对比如下表:

对比项Lenovo HX华为FusionCube EMC VxRail

架构独立的控制虚拟机虚拟化软件内核的模

块虚拟化软件内核的模块

数据的本地化支持不支持,需要经常跨网

络读取,延迟高不支持,需要经常跨网络读取,延迟高

智能分布式数据分

支持部分支持不支持

写缓存(最大)无限制600GB 600GB (VSAN 6.2 全

闪存)

对vSphere集群的依赖性无依赖,支持多种虚拟

化平台KVM,hyper-V,

KVM

只支持vsphere和KVM 必须依赖且只支持

vsphere

数据恢复时间马上执行Rebuild start time =

50min Rebuild start time = 60min(如果无法判断节点状态)

在线重复数据删除和MapReduce重删支持不支持要求全闪存配置才支

压缩(在线和MapReduce压缩)、纠删码特性支持要求全闪存配置才支

要求全闪存配置才支

原生云备份、迁移支持备份迁移到微软和

AWS平台

不支持不支持

主次节点之分无主次节点之分,无计

算/存储节点之分。

有主次节点,计算节点

和存储节点

有主次节点

一键软件升级、一键

硬件升级、一键虚拟

化软件升级

支持不支持不支持

集群扩展性和网络

要求

无限制(不需要组播)未知64节点(支持组播)

单一界面自动化运

维管理

支持,包含所有健康检

查一目了然(含集群、

硬件、虚拟机、数据安

全性)

需要多个组件,包括

FusionCube Center,

FusionSphere,

FusionStorage

需要很多昂贵组件–

vRealize Suite

联想拥有领先的云基础架构设施,通过提供极具可靠性、软硬一体的超融合解决方案,对平台和应用层提供一站式的服务,体现技术的价值。

通过提供基于OpenStack自动化管理的超融合云一体机,超融合HX系列产品,联想具有了快速交付用户、实现内部业务全部虚拟化的能力。

联想超融合战略的目标,就是实现私有云和公有云的互联互通,将私有云、超融合经验转移,实现传统IT架构彻底云化。

联想超融合HX系列的架构优势

相关主题
相关文档
最新文档