FusionCompute平台日常维护指南
FusionCompute运维故障处理指南

主机故障案例-添加主机失败
收集 • 在FusionCompute界面上添加主机失败 信息
定位 故障
• VRM与CNA节点网络链路不通
• 添加主机失败后,主机上可能残留网络配置数据,导致再次添加主机 失败
排除
• 检查VRM与故障CNA节点网络连接 • 删除故障CNA节点残留网络数据
故障
检查
• 告警消失 • 业务正常
收集 • FusionCompute服务异常,无法重新启动VRM虚拟机 信息
定位 故障
• 在FusionCompute中对VRM虚拟机执行关机操作 • 在VRM虚拟机上执行关机命令 • VRM操作系统异常引发VRM自动关机
排除 故障
• 使用“PuTTY”,登录VRM节点所在主机 • 切换至“root”用户: su - root • 查找VRM虚拟机id: ll /etc/galax/eucalyptus • 启动虚拟机: /opt/galax/NCclient ncStartInstances 虚拟机ID
确认
第12页
系统接口管理
⚫ FusionCompute管理如下几类系统接口:
绑定网口
◼ 绑定主机的网口,以提高网络的可靠性。
存储接口
◼ 在主机中添加存储接口,实现主机与存储设备对接。 ◼ 添加多个存储接口,可以实现存储的多路径传输。
业务管理接口
◼ 承载一些特殊业务流量的系统接口,这些特殊业务包括热迁移虚拟 机、虚拟机主机容灾、虚拟化SAN存储心跳检测等。
添加主机存储接口
第7页
主机和集群故障点
站点故障
不能使用 FusionCompute
不能配置级联
集群故障
不能创建、修 改、移除集群
FusionCompute_V100R005C00_日常操作维护与故障处理(PDF)

Copyright © 2015 Huawei Technologies Co., Ltd. All rights reserved.
Page 13
虚拟机管理—虚拟机操作管理
虚拟机操作包括虚拟机启动、休眠、唤醒、关闭、迁移、删除、帮定主机等。
Copyright © 2015 Huawei Technologies Co., Ltd. All rights reserved.
CPU热插拔策略不同时,调整CPU属性生效的条件不同: 不启用CPU热添加:调整CPU资源控制策略时,在线生效;增加CPU数量或减 少CPU数量时,需重启虚拟机后生效。 启用CPU热添加:增加CPU数量、调整CPU资源控制策略时,在线生效;减少 CPU数量,需重启虚拟机后生效。
Copyright © 2015 Huawei Technologies Co., Ltd. All rights reserved.
Copyright © 2015 Huawei Technologies Co., Ltd. All rights reserved. Page 4
目录
1. FusionCompute基本维护操作
FusionCompute Portal
虚拟机管理 账户管理
告警管理
备份恢复
Copyright © 2015 Huawei Technologies Co., Ltd. All rights reserved.
Copyright © 2015 Huawei Technologies Co., Ltd. All rights reserved.
Page 16
虚拟机管理—快照还原虚拟机
快照还原注意事项: 1、快照恢复虚拟机前提,虚拟机必须为“已关闭”或“已休眠”; 2、若虚拟机在创建快照后绑定了新磁盘,则在使用该快照还原虚拟机时,新磁 盘会自动与虚拟机解绑定。可根据需要,手动重新绑定。 3、若虚拟机的某个磁盘属性为“不受快照影响”,则使用快照还原虚拟机时, 不对该磁盘的数据进行还原。如果快照后,该磁盘被解绑定,则快照恢复的虚 拟机会重新绑定该磁盘,但磁盘数据不进行还原。 4、如果快照后,该磁盘被删除,则快照恢复的虚拟机上不存在该磁盘。
FusionCompute平台日常维护指南

FusionCompute数据手工恢复
在对FusionCompute进行重大操作(如升级或打补丁、重大数据调整、扩容等)后,系 统有可能出现异常或未达到预期结果。此时,需要对其进行回退,回退过程中需要进行 数据恢复操作。 恢复过程中需要停止VRM服务:
Page 32
目录
1. FusionCompute基本维护操作 2. FusionCompute定位信息收集
备份存放路径 数据库备份文件:/var/backup/[YYYY]-[MM]-[DD]_sn/DATA 配置备份文件:/var/backup/[YYYY]-[MM]-[DD]_sn/DB
Page 30
FusionCompute手工备份
备份的作用:进行重大操作(如升级、重大数据调整等)前,对VRM节 点数据进行手工备份,从而保证系统在出现异常或未达到预期结果时 可以及时进行数据恢复,将对业务的影响降到最低。
Page 18
网络管理—添加上行链路
添加上行链路:在已创建的分布式交换机中添加上行链路,为虚 拟机提供网络资源。
Page 19
网络管理—创建端口组
端口组是一种策略设置机制,这些策略用于管理与端口组相连的 网络。虚拟机的虚拟网卡连接到分布式交换机的端口组,这样, 即使与同一端口组相连接的虚拟机各自在不同的主机上,这些虚 拟机也都属于虚拟环境内的同一网络。
Page 25
虚拟机管理—制作模板
制作模板方式:虚拟机转为模板、虚拟机克隆为模板和模板克隆为模板。
Page 26
虚拟机管理—创建虚拟机快照
虚拟机快照:将某一时刻虚拟机的所有磁盘信息保存下来,用于虚拟机数据的 还原和恢复。一台虚拟机可以创建多个快照,使用其中一个快照恢复虚拟机时, 不会对其他快照产生影响。
FusionCompute云平台高危技术操作一览表

可以正常使用。
操作名称
操作风险
风险等级
规避措施
重大操作观察项目
手动重启VRM
该操作会导致
★★
重启完数据库
-
节点数据库
写数据库失
后,在VRM节
败,造成任务
点上执行命令
无响应。
service vrmd
restart,重启
VRห้องสมุดไป่ตู้服务。
修改内部对接
修改密码过程
★
修改内部对接
观察对接网元
恢复管理节点数据
操作不当会导致部分管理数据丢失。
★★
在对FusionCompute进行数据恢复 操作时,需要 选择正确时间 点的备份数据 进行恢复操作。
数据恢复后, 检查系统是否正常运行。
强制关闭虚拟机
操作不当,可能导致数据丢失。
★★
强制关闭不明确或故障恢复中状态的虚拟机。否则虚拟机会无法启动或造成数据破坏丢失。
定模式从主备
模式,建议将
切换到负荷分
此主机上的用
担时,该绑定
户虚拟机热迁
网口的通信会
移到其他主机
中断2~3s。
上;修改完成
后,再将用户
虚拟机迁移到
本主机;修改
过程中不进行
配置或管理类
操作。
★★★
请勿在短时间内频繁修改。修改前确认操作的必要性。若修改后产生告警,需要根据告警信息和告警帮助进行处理。
观察是否存在未恢复的异常告警。
修改VRM节点
IP地址
若操作不当, 会使管理平面网络不通,请详细了解使用约束后操作。
★★★
请严格按照 “修改VRM节点IP地址”操作步骤进行修改。
FusionCloud桌面云一体机(RH2288H V2)系统管理指南说明书

FusionCloud 桌面云一体机 (RH2288H V2) V100R005C10系统管理指南文档版本02发布日期2014-04-25版权所有 © 华为技术有限公司 2014。
保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。
商标声明和其他华为商标均为华为技术有限公司的商标。
本文档提及的其他所有商标或注册商标,由各自的所有人拥有。
注意您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内。
除非合同另有约定,华为公司对本文档内容不做任何明示或默示的声明或保证。
由于产品版本升级或其他原因,本文档内容会不定期进行更新。
除非另有约定,本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。
华为技术有限公司地址:深圳市龙岗区坂田华为总部办公楼邮编:518129网址:前言概述本文档提供了在桌面云系统维护阶段的常用操作,包括帐户管理、证书管理、补丁管理、系统配置管理、系统监控、系统维护、备份与恢复等,指导系统维护人员对桌面云系统进行维护管理。
读者对象本文档(本指南)主要适用于以下工程师:l技术支持工程师l维护工程师符号约定在本文中可能出现下列标志,它们所代表的含义如下。
修订记录修改记录累积了每次文档更新的说明。
最新版本的文档包含以前所有文档版本的更新内容。
文档版本 02 (2014-04-25)第二次发布版本。
新增l增加更新ITA HTTPS证书和更新ITA与FusionManager的认证证书的操作指导。
l增加恢复GaussDB/HDC/WI服务器的操作指导。
l增加FusionCompute证书管理和FusionManager证书管理的操作指导。
修改l更新软件重装恢复和系统重装恢复节点下各服务器的备份恢复操作指导。
l恢复策略页面中,增加vAG/vLB组件的恢复策略。
FusionCompute日常维护与故障处理介绍

FusionCompute日常维护与故障处理介绍技术创新,变革未来⚫FusionCompute是华为云计算解决方案的基石,了解和掌握FusionCompute的日常维护和故障处理方法,可以更好的部署和维护企业云计算环境。
通过本章学习,您将能够掌握FusionCompute系统的日常运维能力。
⚫学完本课程后,您将能够:⚫描述日常维护操作⚫区分FusionCompute告警⚫分析常见故障处理步骤⚫描述FusionCompute常见故障处理方法1.维护管理◼日常监控☐配置管理☐用户管理☐FusionCompute备份与恢复2.故障管理日常维护操作⚫为了保证系统长期正常、稳定的运行,维护工程师需要定期对系统进行检查,并根据检查出的异常结果排除故障。
维护项目检查项正常状态维护周期查看系统告警FusionCompute 上的告警无新增告警每天检查FusionCompute 健康状态健康检查报告无“不合格”检查项每天检查设备运行状态服务器、交换机和存储设备的指示灯状态指示灯显示正常每天检查设备运行环境温湿度符合运行环境对温度和湿度的要求。
每周空气质量符合运行环境对空气质量的要求每周防尘情况无明显尘土附着每周查看预警整改公告“/enterpr ise”,选择“公告>产品公告>预警公告>IT >云计算数据中心>FusionSphere >FusionSphere”,查看预警整改公告。
满足预警通知的要求每月查看告警告警级别图标说明紧急已经影响业务、需要立即采取纠正措施的告警为紧急告警。
重要已经影响业务,如果不及时处理会产生较为严重后果的告警为重要告警。
次要目前对业务没有影响,但需要采取纠正措施,以防止更为严重的故障的发生,这种情况下的告警为次要告警。
提示检测到潜在的或即将发生的影响业务的故障,但是目前对业务还没有影响,这种情况下的告警为提示告警。
实时监控⚫管理员可以查看集群、主机以及虚拟机的监控信息,以便于了解集群在指定时间段内的运行状态目录1.维护管理☐日常监控◼配置管理☐用户管理☐FusionCompute备份与恢复2.故障管理⚫管理员可以根据业务需求对FusionCompute系统配置参数作出调整。
FusionCompute V100R003C10 存储管理指南 02说明书

FusionCompute V100R003C10存储管理指南文档版本02发布日期2013-12-28版权所有 © 华为技术有限公司 2013。
保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。
商标声明和其他华为商标均为华为技术有限公司的商标。
本文档提及的其他所有商标或注册商标,由各自的所有人拥有。
注意您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内。
除非合同另有约定,华为公司对本文档内容不做任何明示或默示的声明或保证。
由于产品版本升级或其他原因,本文档内容会不定期进行更新。
除非另有约定,本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。
华为技术有限公司地址:深圳市龙岗区坂田华为总部办公楼邮编:518129网址:前言概述本文档提供了FusionCompute中数据存储、磁盘等存储资源的创建、调整和回收的流程和方法,帮助管理员对FusionCompute的存储资源进行管理。
读者对象本文档(本指南)主要适用于以下工程师:l技术支持工程师l维护工程师符号约定在本文中可能出现下列标志,它们所代表的含义如下。
界面图形使用约定文档中所有界面图形仅为示例,请以产品实际界面为准。
修订记录修改记录累积了每次文档更新的说明。
最新版本的文档包含以前所有文档版本的更新内容。
文档版本 02 (2013-12-28)第二次正式发布。
文档版本 01 (2013-11-15)第一次正式发布。
目录前言 (ii)1 存储管理简介 (1)2 存储资源管理 (4)2.1 向站点添加存储资源 (5)2.2 向主机关联存储资源 (7)2.3 扫描存储设备 (9)2.4 修改存储资源 (11)2.5 解关联存储资源 (13)3 数据存储管理 (14)3.1 添加数据存储 (15)3.2 查看数据存储信息 (19)3.3 修改数据存储的名称和描述 (20)3.4 删除数据存储 (21)4 磁盘管理 (23)4.1 创建磁盘 (24)4.2 绑定磁盘 (27)4.3 解绑定磁盘 (29)4.4 增加磁盘容量 (29)4.5 为NFS服务器添加磁盘 (32)4.6 迁移磁盘(基于虚拟机) (34)4.7 迁移磁盘(基于数据存储) (39)4.8 回收磁盘空间 (43)4.9 修改磁盘属性 (44)4.10 删除磁盘 (46)A 附录 (48)A.1 配置IE浏览器 (49)A.2 配置Firefox浏览器 (52)A.3 登录FusionCompute (52)A.4 如何创建Advanced SAN的管理帐号 (56)A.5 如何配置IP SAN启动器 (58)A.6 如何清除主机存储设备的残留信息 (59)A.7 在Windows操作系统中合并磁盘分区 (62)A.8 在Linux操作系统中新建磁盘分区 (62)A.9 在Windows操作系统中初始化磁盘 (65)A.10 在Linux操作系统中初始化磁盘 (66)A.11 技术支持 (69)A.12 参数参考 (69)A.12.1 存储资源参数说明 (70)A.12.2 数据存储参数说明 (72)A.12.3 磁盘参数说明 (72)B 术语 (76)B.1 A-E (77)B.2 F-J (78)B.3 K-O (79)B.4 P-T (80)B.5 U-Z (81)1存储管理简介内容简介FusionCompute的资源包括主机和集群资源、网络资源和存储资源。
FusionCompute云计算平台故障处理指南

FusionCompute云计算平台故障处理指南目录前言 (ii)1概述 (1)1.1故障处理流程 (2)1.2故障分类 (3)2信息收集 (5)2.1基本故障信息收集 (6)2.2告警信息收集 (6)2.3事件信息收集 (8)2.4收集日志 (8)3常见故障处理 (11)3.1用户虚拟机故障 (12)3.1.1虚拟机蓝屏 (12)3.1.2SUSE 虚拟机网卡不可用 (14)3.1.3Ubuntu10.04 及以上版本操作系统中uvp-monitor 进程未启动 (18)3.1.4Windows Server 2003 虚拟机绑定USB 2.0 设备后,虚拟机黑屏或关机失败 (19)3.1.5SUSE 10 虚拟机不能正常使用USB 2.0 设备 (20)3.1.6重启或关闭主机网络服务后,主机网络异常 (21)3.1.7虚拟机同时绑定SCSI 磁盘和IDE 磁盘时无法正常启动 (22)3.1.8本地磁盘的ext4 文件系统损坏 (23)3.1.9虚拟机内存数值显示异常 (25)3.2管理节点故障 (26)3.2.1VRM 虚拟机故障 (26)3.2.2主机操作系统故障 (32)3.3操作维护类故障 (35)3.3.1登录界面时IE 浏览器异常 (36)3.3.2FusionComute 无法获取监控数据 (38)3.3.3修改虚拟机IP 后虚拟机通信中断 (40)3.3.4主机管理网络配置与交换机不匹配 (42)3.3.5异常掉电再上电后,任务长时间无响应 (43)3.3.6网络数据残留导致添加主机失败 (44)3.3.7仲裁IP 地址失效,导致Web 客户端无法登录 (46)故障处理目录3.4Tools 故障 (47)3.4.1Windows 下安装Tools 时弹出警告提示 (47)3.4.2Windows 下安装Tools 时异常中止 (48)4部件更换 (50)4.1部件更换策略 (51)4.2更换主机 (53)A 附录 (57)A.1使用ISO 方式安装VRM 虚拟机 (58)A.2清除FusionCompute 中本地硬盘的残留数据 (63)A.3配置FusionCompute 告警上报 (64)A.4配置单点登录 (66)A.5如何处理虚拟机网卡乱序问题 (67)A.6ISO 镜像方式安装主机 (68)A.7配置IE 浏览器 (76)A.8配置Firefox 浏览器 (79)A.9登录FusionCompute (80)A.10兼容性 (83)B 术语 (94)B.1A-E (95)B.2F-J (96)B.3K-O (97)B.4 P-T (98)B.5 U-Z (99)1 概述关于本章1.1故障处理流程1.2故障分类1.1故障处理流程故障处理总体流程主要分为四个过程:故障信息收集、故障判断、故障定位、故障排除。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主机和集群管理—主机添加存储接口
主机添加存储接口:实现主机与存储设备对接;添加多个存储接口,可以 实现存储的多路径传输。 添加存储接口的方式:手动添加存储接口和批量添加主机存储接口。 参数:名称、描述、IP地址、子网掩码、VLAN ID、限速设置、上限带宽。
Page 7
主机和集群管理—设置主机时间同步
在浏览器输入以下地址进入 FusionCompute Portal : http://VRM节点的IP地址
Page 3
主机和集群管理—概述
主机和集群管理包括创建集群、添加主机、主机添加存储接口、设置主 机时间同步、设置集群资源调度策略、设置集群HA和内存复用、设置虚 拟机启动策略等。
Page 4
主机和集群管理—创建集群
Page 23
虚拟机管理—修改虚拟机规格
系统支持对虚拟机规格做如下修改:调整CPU、调整内存、增加磁盘 容量、绑定磁盘、解绑定磁盘、添加网卡、删除网卡。
Page 24
虚拟机管理—迁移虚拟机
迁移虚拟机方式:主机间迁移和数据存储间迁移。 主机间迁移:将虚拟机迁移至其所在站点内指定的主机上。 数据存储间迁移:将虚拟机中的磁盘从一个数据存储迁移到另一个数据存储中。
设置主机时间同步:为主机配置单独的外部时钟源,定期同步 时间以保证主机时间运行准确。设置主机时间同步需要重启主 机业务进程,会引起主机服务暂时中断,需谨慎操作。
Page 8
主机和集群管理—设置集群资源调度策略
集群的计算资源调度策略:实现集群内计算资源的动态调度,达到计算 资源的合理分配。
Page 9
配置参数: 集群名称 描述 迁移阈值 电源管理阈值 HA资源预留 CPU预留(%) 内存预留(%) 主机内存复用 虚拟机启动策略
Page 5
主机和集群管理—添加主机
添加主机的方式:手动逐个添加主机和使用模板批量添加主机。 参数:名称、IP地址、描述、BMC IP、BMC用户名、BMC密码。
Page 6
Page 18
网络管理—添加上行链路
添加上行链路:在已创建的分布式交换机中添加上行链路,为虚 拟机提供网络资源。
Page 19
网络管理—创建端口组
端口组是一种策略设置机制,这些策略用于管理与端口组相连的 网络。虚拟机的虚拟网卡连接到分布式交换机的端口组,这样, 即使与同一端口组相连接的虚拟机各自在不同的主机上,这些虚 拟机也都属于虚拟环境内的同一网络。
Page 25
虚拟机管理—制作模板
制作模板方式:虚拟机转为模板、虚拟机克隆为模板和模板克隆为模板。
Page 26
虚拟机管理—创建虚拟机快照
虚拟机快照:将某一时刻虚拟机的所有磁盘信息保存下来,用于虚拟机数据的 还原和恢复。一台虚拟机可以创建多个快照,使用其中一个快照恢复虚拟机时, 不会对其他快照产生影响。ge 14
存储管理—添加数据存储
添加数据存储:在主机上添加数据存储,从而在数据存储上创建 虚拟机的磁盘。一个主机可以添加多个数据存储,一个数据存储 也可以添加到多个主机上。只有当虚拟机磁盘所在的数据存储同 时添加到两个主机上时,虚拟机才能在这两个主机之间进行计算 迁移。 主机关联存储资源方式:手动关联存储资源和批量关联存储资源。
Page 11
存储管理—概述
存储管理提供对存储资源、数据存储和磁盘进行调整和操作。
Page 12
存储管理—配置共享存储资源
共享存储资源包括SAN存储、Advanced SAN存储以及NAS存储。如果使用共 享存储,需要先把准备好的共享存储资源添加到系统中。
Page 13
存储管理—主机关联存储资源
华为FusionCompute平台 日常维护指南
目录
1. FusionCompute基本维护操作 2. FusionCompute定位信息收集
Page 1
目录
1. FusionCompute基本维护操作
FusionCompute Portal基本维护 备份恢复
Page 2
登录FusionCompute Portal
Page 20
虚拟机管理—概述
虚拟机管理包含创建虚拟机、克隆虚拟机、修改虚拟机规格、迁移虚拟机、 制作模板、创建虚拟机快照等。
Page 21
虚拟机管理—创建虚拟机
先创建裸虚拟机,再安装虚拟机操作系统和应用软件。
Page 22
虚拟机管理—克隆虚拟机
克隆虚拟机方式: 1. 虚拟机克隆为虚拟机:基于系统内已有的虚拟机,创建
Page 15
存储管理—创建磁盘
在数据存储上创建磁盘,并通过与虚拟机绑定,为虚拟机提供存 储资源。
Page 16
网络管理—概述
网络管理提供创建分布式交换机和端口组等网络资源的功能,支持对网络 资源进行调整和配置。
Page 17
网络管理—创建分布式交换机
分布式交换机的功能类似于普通的物理交换机,每台主机都连接到分布式 交换机中。分布式交换机的一端是与虚拟机相连的虚拟端口,另一端是与 虚拟机所在主机上的物理以太网适配器相连的上行链路。通过它可以连接 主机和虚拟机,实现系统网络互通。
主机和集群管理—设置集群HA和内存复用
HA策略:用于虚拟机故障切换时,系统用预留的资源为HA的虚拟机分配 CPU和内存。 内存复用策略:开启集群内主机的内存复用功能后,可以实现虚拟机内 存规格总和大于主机规格内存,提高主机的虚拟机密度。
Page 10
主机和集群管理—设置虚拟机启动策略
虚拟机启动策略:在虚拟机启动时,会按照配置的策略在集群内选择对应 的主机,分为自动分配和负载均衡两种方式。 自动分配:虚拟机启动时,在集群中满足资源条件的节点中随机进行节点 的选择。 负载均衡:虚拟机启动时,根据节点的CPU和内存利用率进行节点的选择。