H3C CAS高可靠性和高可用性技术白皮书

合集下载

H3C SecCenter 解决方案技术白皮书 V1.1

H3C SecCenter 解决方案技术白皮书 V1.1

SecCenter解决方案技术白皮书Hangzhou H3C Technology Co., Ltd.杭州华三通信技术有限公司All rights reserved版权所有侵权必究目录1 商业用户网络对于安全管理的需求 (5)2 安全管理技术方案比较 (6)3 H3C安全管理中心解决方案 (7)3.1 安全管理中心基本思路 (7)3.2 解决方案特点 (8)3.3 典型组网图 (9)4 系统主要技术特性分析 (10)4.1 不同种类的安全设备支持 (10)4.2 企业安全分析 (11)4.3 网络架构 (12)4.4 安全拓扑和可视化威胁 (12)4.5 监控&事件关联 (13)4.6 安全管理报告 (15)4.7 可升级日志管理 (15)4.8 搜索分析 (15)5 总结和展望 (16)6 参考文献 (16)7 附录 (16)Figure List 图目录图1 典型组网图 (10)图2 安全管理添加到网络和应用管理 (11)图3 SecCenter支持单独配置和分布式配置 (12)图4 基于拓扑的实时威胁可视化下拉菜单 (13)图5 监控仪表盘展示了一个实时的全部安全状态的一部分 (14)SecCenter解决方案技术白皮书关键词:SecCenter、安全管理、事件、日志、搜索摘要:本文档对于SecCenter安全管理中心的解决方案进行了介绍。

描述了用户对于安全管理中心的需求,各种方案的比较。

介绍了H3C推出解决方案的技术特点、组网图、主要技术分析等。

缩略语清单:1 商业用户网络对于安全管理的需求一个公司只是注重在物理上对网络安全的投资是远远不够的,即使安全防范再严密的网络,也会有可能有破坏性漏洞的产生。

据估计在世界范围内由攻击造成的经济损失已经由1997 年的33 亿美元上升到2003 年的120亿美元。

这个数字还在快速上升。

另外,为了满足政府规范要求,需要执行安全审计流程。

如果不能满足政府的规范要求,除了有可能被高额的罚款以外,还有可能触犯法律,面临刑事诉讼。

h3c cas操作手册

h3c cas操作手册

h3c cas操作手册摘要:一、h3c cas操作手册简介二、h3c cas操作手册的使用场景三、h3c cas操作手册的功能模块1.用户管理2.配置管理3.系统监控4.安全策略管理四、h3c cas操作手册的安装与配置五、h3c cas操作手册的高级应用六、h3c cas操作手册的常见问题及解决方法七、总结正文:h3c cas操作手册是一本介绍h3c cas(H3C Cluster Authentication System)集群认证系统的使用和管理的综合性指南。

它适用于h3c cas集群认证系统的管理员和操作员,可以帮助他们更好地理解和使用该系统。

h3c cas操作手册主要针对以下场景:1.系统初始安装和配置2.日常运维和管理3.故障排查和恢复h3c cas操作手册共分为七个主要模块:一、h3c cas操作手册简介本部分简要介绍h3c cas操作手册的目的、适用对象和使用方法,以及对各章节的概述。

二、h3c cas操作手册的使用场景本部分详细描述h3c cas集群认证系统在不同场景下的应用,包括系统初始安装、日常运维、故障排查等。

三、h3c cas操作手册的功能模块h3c cas集群认证系统主要包括以下功能模块:1.用户管理:本部分介绍如何创建、删除、修改用户,以及如何管理用户角色和权限。

2.配置管理:本部分介绍如何配置系统参数、认证服务器、认证客户端和网络设备等。

3.系统监控:本部分介绍如何监控系统运行状态、资源使用情况、认证事件等。

4.安全策略管理:本部分介绍如何配置安全策略、审计策略和认证策略等。

四、h3c cas操作手册的安装与配置本部分详细介绍h3c cas集群认证系统的安装流程和注意事项,以及如何进行基本配置。

五、h3c cas操作手册的高级应用本部分介绍一些高级应用,如集群管理、负载均衡、高可用性等。

六、h3c cas操作手册的常见问题及解决方法本部分列举了一些常见的使用问题,并提供了解决方法。

H3C CDP技术白皮书

H3C CDP技术白皮书

H3C CDP技术白皮书Huawei-3Com Technology Co., Ltd.华为3Com技术有限公司All rights reserved版权所有侵权必究声明Copyright © 2006 杭州H3C及其许可者版权所有,保留一切权利。

非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本书内容的部分或全部,并不得以任何形式传播。

H3C、Aolynk、、IRF、H3Care、、Neocean、、TOP G、SecEngine、SecPath、COMWARE、VVG、V2G、V n G、PSPT、NetPilot、XGbus均为杭州H3C的商标。

对于本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。

修订记录版本描述作者日期2006年8月22日 1.00 初稿完成秦祖福2006年9月05日 1.01 根据评审意见进行修改秦祖福目录第1章引言 (8)1.1 企业面临的挑战 (8)1.1.1 数据安全 (8)1.1.2 业务连续 (8)1.1.3 “软错误”的恢复 (8)1.2 传统灾备面临的挑战 (9)1.3 CDP让灾备发新芽 (10)第2章CDP技术概述 (11)2.1 CDP的定义 (11)2.2 CDP的特点及技术优势 (11)2.3 CDP的关键技术 (13)2.3.1 基准参考数据模式 (13)2.3.2 复制参考数据模式 (14)2.3.3 合成参考数据模式, (14)2.3.4 三种模式比较 (15)2.4 CDP的实现模式 (15)2.4.1 基于应用实现持续数据保护 (16)2.4.2 基于文件实现持续数据保护 (16)2.4.3 基于数据块实现持续数据保护 (16)第3章H3C CDP技术介绍 (17)3.1 H3C CDP技术核心理念 (17)3.1.1 以快速恢复生产为前提的服务器完整保护 (17)3.1.2 有效降低数据丢失风险 (17)3.1.3 确保数据库恢复的完整性 (17)3.1.4 SAN级别的服务器保护 (17)3.1.5 备份数据立即检查及还原验证 (18)3.1.6 让关键业务先恢复正常运行再进行修复 (18)3.1.7 从本地服务器保护立即扩大为远程容灾 (18)3.2 NeoStor数据管理平台CDP技术 (18)3.2.1 NeoStor 数据管理平台-核心服务 (19)3.2.2 NeoStor 数据管理平台-Client Agents (23)第4章H3C CDP方案介绍 (26)4.1 H3C CDP解决方案特色 (26)4.1.1 服务器完整保护 (26)4.1.2 数据库恢复保障 (26)4.1.3 系统运行快速恢复 (26)4.1.4 直接升级远程机制 (26)4.2 本地CDP方案 (27)4.3 远程CDP方案 (28)4.3.1 阶段一:灾难发生前 (29)4.3.2 阶段二:灾难发生时 (30)4.3.3 阶段三:灾难发生后 (31)第5章结束语 (32)第6章附录 (33)插图目录图2-1 持续数据保护与传统数据保护技术在实施数据保护时的间隔比较 (12)图2-2 基准参考数据模式 (14)图2-3 复制参考数据模式 (14)图2-4 合成参考数据模式 (15)图3-1 COFW技术 (20)图3-2 远程复制 (21)图3-3 自适应复制 (22)图3-4 DiskSafe数据保护 (23)图4-1 本地CDP方案 (27)图4-2 远程CDP方案 (29)H3C CDP技术白皮书关键词:CDP摘要:本文档在全面分析CDP技术现状的基础上,阐述了华为3Com公司的CDP技术以及CDP方案。

基于H3C_CAS云计算平台和爱数AnyBackup备份设备的数字校园容灾系统的研究与实现

基于H3C_CAS云计算平台和爱数AnyBackup备份设备的数字校园容灾系统的研究与实现

信息系统的数据安 全 和 系 统 服 务 的 连 续 性,根 据 学
方案。
1 H3C CAS 云计算平台简介
H3CCAS 云计算平台是 H3C 公司推出的构建
云计算基础架构的 管 理 软 件,它 为 数 据 中 心 云 计 算
保存有一份可用的关键业务的数据。应用容灾是在
基础架构提供完善的虚拟化和云业务运营管理解决
务器,配 有 90 TB 共 享 存 储。 在 16 台 刀 片 服 务 器
拟机进行监测。当 一 台 虚 拟 机 出 现 故 障 时,系 统 会
划分为 3 个集群,一个集群有 8 台主机,另两个集群
之后,
CVM 会 持 续 对 集 群 内 所 有 的 物 理 主 机 和 虚
在本主机或其他主机上重新生成同样的一台虚拟机
4 基于 H3C CAS HA 高 可 靠 性 和 爱 数 AnyBa
ck-
mi
n 的时间间隔 内 进 行 数 据 备 份,可 以 克 隆 出 多 个
可以连续记录数据变化,在秒级范围恢复数据,持续
保护数据中的接管演练功能可以在生产服务器损坏
时,将实时备份某个 时 间 点 的 数 据 拉 起 一 台 虚 拟 容
各有 4 台 主 机。3 个 集 群 上 虚 拟 出 了 80 余 台 虚 拟
机,运行学院的各种应用系统。
容灾系统 的 设 计 指 标 除 了 恢 复 过 程 所 涉 及 的
RPO(Re
c
ove
r
i
n
t Ob
e
c
t
i
ve,恢 复 点 目 标 )和
y Po
j
RTO(
Re
c
ove
r
e

H3C CAS云计算管理平台技术白皮书

H3C CAS云计算管理平台技术白皮书

H3C CAS云计算管理平台技术白皮书目录1 前言 (1)1.1 IT行业当前面临的困境 (1)1.1.2 高昂的成本支出 (1)1.1.3 缓慢的业务部署速度 (1)1.1.4 分散的管理策略 (1)1.2 应对困境的有效措施 (2)1.2.1 控制服务器数量膨胀,提高服务器利用率 (2)1.2.2 采用虚拟化基础架构技术和云运营体系,提高业务响应速度 (2)1.2.3 对数据中心IT基础设施进行集中化、可视化的管理 (2)1.3 H3C CAS云计算管理平台简介 (2)1.3.1 概念介绍 (2)1.3.2 H3C CAS云计算管理平台产品介绍 (3)2 技术特点 (5)2.1 基于集群的集中管理 (5)2.2 完备的虚拟机生命周期管理 (5)2.3 性能状况监测 (6)2.3.1 物理服务器性能状况监测 (6)2.3.2 虚拟机性能状况监测 (6)2.3.3 虚拟交换机状况监测 (7)2.3.4 虚拟网卡性能状况监测 (7)2.4 共享存储管理能力 (8)2.5 高可靠性 (9)2.5.1 传统的高可靠性和故障切换解决方案 (9)2.5.2 H3C CAS云计算管理平台HA解决方案 (10)2.6 动态资源调整 (11)2.7 经济高效的灾备恢复方案 (12)2.8 支持IEEE 802.1Qbg标准 (13)2.9 多租户业务安全 (13)2.10 自助式云业务工作流 (14)2.11 用户分级管理 (16)2.12 数据中心集中保护与审核 (18)3 典型组网应用 (18)3.1 服务器虚拟化应用 (18)i3.2 云业务运营管理应用 (19)3.3 注意事项 (20)3.3.1 对服务器硬件的要求 (20)3.3.2 整合比(单台服务器上虚拟机数量)的决定因素 (21)ii1 前言1.1 IT行业当前面临的困境自从上世纪90年代开始,IT行业在全球范围内得到了迅猛的发展,IT平台的规模和复杂程度出现了大幅度的提升,与此同时,很多企业的IT机构却因为这种提升而面临着一种新的困境:高昂的硬件成本和管理运营成本、缓慢的业务部署速度以及缺乏统一管理的基础架构。

H3C云安全服务技术白皮书-V1.0

H3C云安全服务技术白皮书-V1.0

H3C云安全服务技术白皮书Copyright © 2016 杭州H3C技术有限公司版权所有,保留一切权利。

非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。

本文档中的信息可能变动,恕不另行通知。

目录1 概述 (1)2 云安全架构与模型 (1)2.1 云数据中心安全访问控制需求 (1)2.2 云安全总体架构 (2)2.3 基于租户的安全隔离 (3)2.4 安全架构的两种模型 (4)3 嵌入式安全 (5)3.1 安全组ACL功能 (5)3.2 分布式状态防火墙功能 (6)4 云服务链 (6)5 基于SDN和服务链的云安全组网方案 (8)5.1 VSR做网关的服务链方案 (8)5.2 物理交换机做网关的服务链方案 (9)5.3 服务链和第三方安全设备对接 (10)5.4 服务链支持东西向和南北向安全的总结 (12)6 安全资源池化 (12)6.1 网络服务资源虚拟化和池化 (12)6.2 多资源池支持 (14)6.3 安全资源池之大规模租户技术 (15)6.3.1 硬件资源池支持大规模租户 (15)6.3.2 软件资源池支持大规模租户 (16)6.4 云安全微分段服务 (17)6.5 安全资源池之高可靠性技术 (17)7 多层次安全防护体系 (18)7.1 异构设备组成的统一安全资源池 (18)7.2 多层次的安全体系 (19)8 安全功能通过云服务部署 (19)9 H3C云安全优势总结 (21)1 概述云计算技术的发展,带来了新一轮的IT技术变革,但同时也给网络与业务带来巨大的挑战。

网络服务模式已经从传统的面向连接转向面向应用,传统的安全部署模式在管理性、伸缩性、业务快速升级等方面已经无法跟上步伐,需要考虑建设灵活可靠,自动化快速部署和资源弹性可扩展的新安全防护体系。

同时,按照云计算等保规范《信息系统安全等级保护第二分册云计算安全要求》草案7.1.2网络安全章节的描述,对云网络安全也有下述要求:•保证云平台管理流量与云租户业务流量分离;•根据云租户的业务需求自定义安全访问路径;•在虚拟网络边界部署访问控制设备,并设置访问控制规则;•依据安全策略控制虚拟机间的访问。

H3C CAS云平台方案

H3C CAS云平台方案

H3C CAS云平台方案CAS 基于开源KVM的虚拟化技术优化文/欧珊瑚KVM(Kernel-based Virtual Machine,基于内核的虚拟机)是一个基于Linux环境的开源虚拟化解决方案,最早由Qumranet公司开发,在2006年10月出现在Linux内核的邮件列表上,并于2007年2月被集成到Linux 2.6.20内核中,成为内核的一部分。

“基于Linux内核”实现的KVM系统在实现方式上不同于其它的Hypervisor,其设计目标是最大限度地利用现有操作系统的各个功能模块和硬件对虚拟化技术进行支持,以一个内核来加载功能模块的方式实现,并将整个Linux内核转化成一个裸机的Hypervisor。

除此之外,KVM还充分利用了Linux内核已有的成熟功能和基础服务,减少不必要的重新开发,如任务调度、物理内存管理、内存空间虚拟化、电源管理等功能。

在KVM的系统构架中,虚拟机以普通Linux进程的方式来实现,由标准的Linux进程调度器来调度,每个虚拟CPU(vCPU)都以一个常规的Linux进程来呈现,硬件设备的模拟则是通过一个修改过的QEMU来进行,提供了BIOS,PCI总线,USB总线和其他标准设备(如IDE和SCSI硬盘控制器以及网络控制器等)的模拟。

KVM将Linux内核转化为Hypervisor,通常情况下,支持Linux的硬件设备就可以被KVM支持。

虽然开源KVM存在诸多优点,但是原生态的KVM在业务可靠性、网络控制、可管理性、可运维性等方面存在缺陷。

首先,开源KVM基于虚拟化内核实现,对底层硬件故障、虚拟机故障、虚拟机操作系统故障和上层应用故障都缺少解决方案;其次,KVM系统的虚拟交换机是一个标准化的流量转发模块,它无法应对实际生产系统对复杂网络访问控制策略的需求,例如:QoS、ACL、VxLAN、端口聚合、流量镜像等;最后,KVM缺少可视化的配置与管理工具、丰富的业务系统性能监控能力和资源的自动化调度管理能力。

H3C-高可靠性技术概述

H3C-高可靠性技术概述

网络高可靠性主要是指当设备或网络出现故障 时 网络提供服务的不间断性 时,网络提供服务的不间断性。

可靠性达到5个9以上 可靠性99.999%意味着每年故障时间不超过5分钟 可靠性99.9999%意味着每年故障时间不超过30秒

园区网高可靠性技术

链路备份技术 设备备份技术:包含设备自身备份技术以及设备间备份技 术 堆叠技术

9
Smart Link
SWA
SWB
SWC
SWD

Smart Link解决方案,实现了主备链路的冗余 解决方案 实现了主备链路的冗余 备份,具备快速收敛性能,收敛速度可达到亚 秒级。
10

目录
高可靠性技术简介 链路备份技术 设备备份技术 堆叠技术
16

IRF高可靠性

堆叠系统由多台成员设备组成,Master设备负 责堆叠的运行 管理和维护 Slave设备在作 责堆叠的运行、管理和维护, 为备份的同时也可以处理业务。 一旦Master设备故障,系统会迅速自动选举新 的Master,以保证通过堆叠的业务不中断,从 而实现了设备级的 实 了设备级的1:N备份。 备份 成员设备之间物理堆叠口支持聚合功能,堆叠 系统和上、下层设备之间的物理连接也支持聚 合功能,这样通过多链路备份提高了堆叠系统 的 靠性 的可靠性。

5
目录
高可靠性技术简介 链路备份技术 设备备份技术 堆叠技术
链路备份技术

链路备份技术用于避免由于单链路故障 导致的网络通信中断。当主链路中断后, 备用链路会成为新的主用链路。 会
链路聚合 RRPP Smart
Link

7
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

H3C CAS高可靠性和高可用性技术白皮书目录1 技术应用背景 (1)2 H3C实现的技术特色 (2)2.1 H3C CAS云计算管理平台简介 (2)2.2 相关技术基础简介 (3)2.2.1 共享存储 (3)2.2.2 动态迁移 (4)2.3 H3C CAS高可靠性(HA)技术 (5)2.3.1 相关术语 (5)2.3.2 物理服务器主机HA工作原理 (5)2.3.3 虚拟机HA工作原理 (6)2.3.4 技术特色总结 (7)2.4 H3C CAS高可用性技术 (8)2.4.1 动态资源调整 (8)2.4.2 虚拟机资源限额 (10)2.5 应用限制 (11)3 典型组网案例 (12)3.1 组网拓扑 (12)3.2 注意事项 (13)3.2.1 对服务器硬件的要求 (13)3.2.2 整合比(单台服务器上虚拟机数量)的决定因素 (13)4 参考文献 (14)i1 技术应用背景随着虚拟化和云计算浪潮在全球IT行业的兴起,越来越多的企业、行业和运营商纷纷将自身的IT 架构切换到虚拟化环境中。

虚拟化技术对数据中心内未被充分利用的服务器进行整合,极大地降低了客户的一次性投入成本,精简了数据中心物理服务器的数量,同时,减少了供电、制冷、场地和运维人员方面的运营成本。

但是,虚拟化也为IT应用带来了单点故障问题,在未实施虚拟化技术之前,IT管理员往往遵循“根据最坏情况下的工作负载来确定所有服务器的配置”这一策略,即一台高性能物理服务器仅安装一个应用程序。

在这种情况下,即使该物理服务器出现了断电或操作系统崩溃等异常状况,最多只会影响到一个应用的运行,而在虚拟化环境下,每台物理服务器往往运行多个虚拟的应用服务器,因此,虚拟化技术的实施将使IT环境面临的灾难破坏性更严重,尤其对于一些重要的业务入口或接入点(如企业的生产服务器和金融行业的数据库服务器等),即使出现秒级的业务中断,也将遭受灾难性的后果。

在这种应用背景下,如何保证虚拟化环境下业务应用的高可靠性和高可用性,成为急需解决的一个技术问题。

VM VM VM图1物理服务器故障造成虚拟化业务全部中断传统的集群解决方案(如微软的Cluster Service和Veritas Cluster Server)致力于在发生服务器主机故障或虚拟机故障时,在最短的应用程序停机时间内实现即时恢复,要达到这个目标,IT基础架构必须进行如下设置:•每台物理服务器和虚拟机都必须有一个镜像虚拟机(可能在其它服务器主机上)。

•使用集群软件将服务器(或虚拟机及其主机)设置为互相镜像,一般情况下,由主虚拟机向镜像发送心跳信号,一旦发生故障,镜像将立即接管。

下图显示使用传统集群方法的典型的虚拟机设置:1机箱内集群跨机箱集群图2使用传统集群配置确保虚拟化应用的高可靠性设置和维护这样的集群解决方案成本昂贵,并会占用大量资源。

每添加一台新的虚拟机,可能需要更多的虚拟机甚至是更多的服务器主机才能进行故障切换。

您将不得不设置、连接和配置所有的新计算机,并更新群集应用程序的配置。

总之,传统解决方案虽然能够保证快速恢复,但却是资源和劳动密集型的,而且通常存在对应用程序和操作系统的依赖性问题。

由于集群解决方案的成本和复杂性问题,它们通常只被一小部分企业应用程序所采用,而大部分应用程序则没有任何故障切换保护。

为了解决虚拟化和云计算部署带来的单点故障问题,H3C CAS云计算软件摒弃了高成本、高复杂度的传统集群方案,通过为应用程序提供可用的、经济的高可用性,而使其更“大众化”。

2 H3C实现的技术特色2.1 H3C CAS云计算管理平台简介H3C CAS云计算管理平台是H3C公司面向企业和行业数据中心推出的虚拟化和云计算管理软件,通过精简数据中心服务器的数量,整合数据中心IT基础设施资源,精简IT操作,提高管理效率,达到提高物理资源利用率和降低整体拥有成本的目的。

同时,利用先进的云管理理念,建立安全的、可审核的数据中心环境,为业务部门提供成本更低、服务水平更高的基础架构,从而能够针对业务部门的需求做出快速的响应。

H3C CAS云计算管理平台由三个组件构成:•CVK:Cloud Virtualization Kernel,虚拟化内核平台运行在基础设施层和上层客户操作系统之间的虚拟化内核软件。

针对上层客户操作系统对底层硬件资源的访问,CVK用于屏蔽底层异构硬件之间的差异性,消除上层客户操作系统对硬件设备以及驱动的依赖,同时增强了虚拟化运行环境中的硬件兼容性、高可靠性、高可用性、可扩展性、性能优化等功能。

•CVM:Cloud Virtualization Manager,虚拟化管理系统主要实现对数据中心内的计算、网络和存储等硬件资源的软件虚拟化管理,对上层应用提供自动化服务。

其业务范围包括:虚拟计算、虚拟网络、虚拟存储、高可用性(HA)、动态资源调度(DRS)、虚拟机容灾与备份、虚拟机模板管理、集群文件系统、虚拟交换机策略等。

2•CIC:Cloud Intelligence Center,云业务管理中心由一系列云基础业务模块组成,通过将基础架构资源(包括计算、存储和网络)及其相关策略整合成虚拟数据中心资源池,并允许用户按需消费这些资源,从而构建安全的多租户混合云。

其业务范围包括:组织(虚拟数据中心)、多租户数据和业务安全、云业务工作流、自助式服务门户、兼容OpenStack的REST API接口等。

图3H3C CAS云计算管理平台系统逻辑结构图2.2 相关技术基础简介2.2.1 共享存储H3C CAS云计算管理平台中的存储用于保存虚拟机的操作系统、应用程序文件、配置文件以及与活动相关的其它数据,是虚拟机正常工作的基本前提条件。

根据存储的种类不同,可以分为本地存储和共享存储两种。

•在部署了H3C CAS云计算管理平台,并将主机作为被管理资源对象添加到H3C CAS云计算管理平台之后,该主机默认使用本地磁盘介质作为存储,其它主机不能使用。

•在数据中心中,很多用户选择使用共享存储来承载虚拟机及其数据,目前,H3C CAS云计算管理平台支持IP SAN等类型的存储。

采用共享存储的好处是:•共享存储往往比本地存储提供更好的I/O性能(尤其在多虚拟机环境下)。

•H3C CAS云计算管理平台中的高可用性功能需要共享存储作为先决条件,例如HA和动态资源调整等。

3H3C CAS中的虚拟机文件系统是一种优化后的高性能集群文件系统,允许多个云计算节点同时访问同一虚拟机存储。

由于虚拟架构系统中的虚拟机实际上是被封装成了一个档案文件和若干相关环境配置文件,通过将这些文件放在SAN存储阵列上的文件系统中,可以让不同服务器上的虚拟机都可以访问到该文件,从而消除了单点故障。

图4共享存储组网拓扑结构2.2.2 动态迁移动态迁移是实现自动化和自我优化的数据中心所必需的关键特性。

H3C CAS动态迁移支持在物理服务器之间实时迁移正在运行中的虚拟机,利用虚拟机实时迁移技术,不仅在执行硬件维护时无需安排宕机和中断业务操作,而且可以使资源池内的虚拟机不断自动优化,最大限度地提高硬件利用率、灵活性和可用性。

图5虚拟机迁移技术利用H3C CAS动态迁移技术在物理服务器之间实时迁移虚拟机的过程是通过两项底层技术实现的。

4(1) 虚拟机操作系统和应用程序的完整状态被封装在共享存储设备上的一组文件之中,这样的共享存储设备可以是iSCSI存储区域网络(SAN)或网络连接存储(NAS)。

通过H3C CAS高性能集群文件系统,多个物理服务器主机可以同时访问同一个虚拟机文件。

(2) 虚拟机的内存映像和精确执行状态可通过高速网络在各物理服务器主机之间迅速传递。

H3C动态迁移技术通过在一个位图中保存对现行内存处理过程的跟踪,使用户在数据传递期间察觉不到性能变化。

一旦整个内存和系统状态被复制到目标物理服务器主机之后,H3C CAS动态迁移技术就会中止源虚拟机的运行,随后,将位图复制到目标物理服务器,并在目标物理服务器上继续运行该虚拟机。

2.3 H3C CAS高可靠性(HA)技术H3C CAS云计算软件将一组服务器主机合并为一个具有共享资源池的集群,并持续对集群内所有的服务器主机与虚拟机运行状况进行检测,一旦某台服务器主机或虚拟机发生故障,H3C CAS HA 软件模块会立即响应并在集群内另一台服务器主机上重启所有受影响的虚拟机。

2.3.1 相关术语1. 节点(Node)运行HA心跳进程的一个独立主机,称为节点。

节点是HA软件模块的运行载体,每个节点上运行着H3C CAS云计算操作系统和心跳软件服务。

2. DC(Designated Coordinator,指定协调者)HA软件模块在开始工作前,首先在各节点间选举产生一个节点作为主节点,用于管理和控制集群HA的指令,所有配置操作都在该DC主机上进行,并由其分发到集群下的各个节点上。

3. 资源(Resource)资源是一个节点可以控制的实体,并且当节点发生故障时,这些资源能够被其它节点接管,如虚拟机镜像文件资源等。

4. 事件(Event)集群中可能发生的事情,例如节点系统故障、网络连通故障、网卡故障、应用程序故障等。

这些事件都会导致节点的资源发生转移,HA的稳定运行与检测也是基于这些事件来进行的。

5. 动作(Action)事件发生时HA的响应方式,动作是由shell脚本控制的,例如,当某个节点发生故障后,备份节点将通过事先设定好的执行脚本进行服务的关闭或启动。

进而接管故障节点的资源。

2.3.2 物理服务器主机HA工作原理H3C CAS云计算软件统一在各个物理服务器节点之间维持“心跳”(默认为3秒),节点之间通过相互发送组播报文以检测对方是否存在,当发现某个节点连续多次(默认为10次)未响应组播请求时,就认为该节点发生了节点系统故障事件,此时,集群内的DC就会重启该节点,并根据一定的策略算法,尝试在其它的服务器上重新启动所有失效的虚拟机。

HA软件模块会保证在任何时候当物理服务器发生宕机时,资源池中都有足够的硬件资源,使失效的服务器中的虚拟机在其它的服务器上顺利启动。

H3C CAS采用优化后的高性能集群文件系统,通过支持SAN/iSCSI/NFS等存储5协议,可以允许不同的服务器访问同一虚拟机磁盘文件,这一特性使得H3C CAS HA的实现非常的简单和方便。

VM VM VM图6使用H3C CAS云计算软件HA特性进行主机故障切换需要注意的是,如果发生系统故障事件的节点恰好为DC节点,那么,在检测到DC节点故障后,集群内的备份节点之间自动发起DC的选举,重新生成新的DC。

2.3.3 虚拟机HA工作原理除了对集群中的物理服务器节点进行持续检测之外,H3C CAS HA软件模块还对运行于物理服务器节点之上的虚拟机进行持续检测。

相关文档
最新文档