vmvare虚拟化平台巡检细则和方法

合集下载

虚拟化的健康巡检

虚拟化的健康巡检

虚拟桌面优化及健康检查一个成功的项目离不开从项目实施到日常维护过程不间断的按照最佳实践去设计、规划、实施,其中对于系统的健康性检查是保证项目成功不可或缺的一个部分。

虽然相比较于设计一个新的项目,健康检查看起来并不是一项特别高深的技术工作,并不需要像设计一个大型项目那样需要全方位的技能,但此工作检验的是运维管理人员对于整个系统的熟悉程度、仔细程度。

其对于每一个事件日志、每一个报警、每一个变更都能按部就班,一丝不苟的完成,则可以让整个系统在日常运行过程就能规避很多可能出现的问题。

所以一个成功的项目离不开对整个系统不间断的健康检查。

第一章优化方案一般情况下Citrix桌面虚拟化项目,从底层的物理服务、服务器虚拟化、网络、存储、AD、SQL、DDC、PVS、SF等都会通过N+1、双机、多路径等方式来保证高可用性。

核工院项目前期高可用方案的设计到实施并通过验证确保所有核心组件不存在单点风险。

第二章日常运维中健康检查Director巡检1:首先Citrix系统中有一个非常重要的组件Citrix Director,Director能够让运维人员查阅整个虚拟桌面平台的使用状态、包括用户连接状态、出现的故障虚拟化、许可使用情况。

我已经把组件安装在10.2.156.9(SF02这台服务器上。

2:可以对于故障的计算机、用户查看故障原因。

3:对于个别用户反馈登录比较慢,可以直接读取该用户访问的虚拟桌面获得更为详细信息,包括终端信息、ip、Receiver版本等。

4:查看会话信息当然Director还有很多其他的功能、比如查看虚拟机使用率、查看DDC状态、配置文件查看情况、系统报告、查看用户集成了那些策略(包括DDC策略、域策略和本地策略、远程虚拟桌面、查看用户运行的程序等。

DDC巡检1 :DDC日常巡检中主要查看交付组中对应的虚拟机注册状态。

如出现没有注册的虚拟机、以下几种步骤可以参考排除、定位问题。

1:因为之前虚拟机都是可以正常注册的、所以就不会存在防火墙、DDC在虚拟桌面的全域名不对等一些常规问题。

VMware云平台巡检服务报告

VMware云平台巡检服务报告
重新划分LUN,
(注意做好数据备份)
0
虚拟机状态
虚拟机存在红色告警
检查虚拟Guest OS,vmtools等等
0
软件授权
软件授权存在隐患
购买vsphere 5.1 license;
0
3
虚拟平台安状态
开放服务
正常

0
防火墙开放端口
正常

0
4
虚拟平台性能状况
CPU使用率
优良

0
内存使用率
某节点内存处于繁忙边界;且内存状态无法识别;
某节点内存处于超额且繁忙;
12.75更换内存;
12.76增加内存;
0
磁盘性能
正常

0
网络性能
正常,但负载不平衡
重新配置标准虚拟交换机
0
5
系统告警
系统告警
某节点告警功能被关闭;
某节点功能正常
打开某节点的告警功能
0
虚拟机状态
虚拟机存在红色告警
0.8
软件授权
软件授权存在隐患
0.7
4
虚拟平台安状态
开放服务
正常
0
防火墙开放端口
正常
0
虚拟平台性能状况
CPU使用率
优良
0
内存使用率
某节点内存处于繁忙边界;且内存状态无法识别;
某节点内存处于超额且繁忙;
0.9
磁盘性能
正常
0
网络性能
正常,但负载不平衡
0.3
5
系统告警
系统告警
某节点告警功能被关闭;
VMware云平台巡检服务报告

序号
检查类别

VMware巡检表模板

VMware巡检表模板

VMware vSphere健康检查报告服务介绍-系统健康检查服务是系统预防性维护服务的重要组成部分,是现场预防维护服务的升级服务。

-本服务的初衷、目标是:通过Teamlong公司系统健康检查服务,利用Teamlong公司系统专家及Teamlong公司多年在系统维护方面的经验,帮助客户检查系统目前的状态并分析其潜在的问题,最大限度地减少由于系统维护不当所带来的危害,并对将来日常维护系统提出建议,避免产生新的系统问题。

从手段上,组织系统维护工程师,通过现场对客户系统进行全面检查,及早发现潜在问题,提交详细检查报告及问题的针对性建议,提高用户业务的可用性。

系统健康检查概要客户签字:服务工程师签字:签字日期:签字日期:VMware vSphere平台巡检内容健康检查内容1.1 检测多个主机之间是否有相同的软件版本1.2 检查网络和存储配置信息是否一致1.3 检查服务器配置信息是否相同,是否有不同的CPU类型1.4 是否配置NTP时钟同步服务1.5适当的配置MANAGEMENT NETWORK的网络参数1.6为Management Network使用固定的IP地址1.7检查主机是否告警1.8其他2.1 虚拟交换机是否配置冗余物理网卡2.2 物理网卡速率和全双工检查2.3 应用流量和管理流量的分配3.1正确配置存储多路径管理3.2虚拟机在LUN上的存储4.1处于不同的管理目的为ESXi服务器使用不同账号4.2限制远端的root登陆ESXi服务器4.3出于不同的管理任务使用合适的VC用户帐号和权限4.4通过使用和合适的VLAN确保不同网络的隔离4.5在虚拟交换机上使用安全策略VMware Tools5.1虚拟机中正确安装5.4虚拟机的是否有时钟同步配置6.2vCenter服务没有受到其他应用影响6.3vCenter数据库使用情况6.4HA群集冗余容量usage6.5虚拟机CPU Ready和6.6vCenter与ESXi主机服务器时间6.7Anti-Affinity设置6.8vCenter监控设置6.9vCenter性能监控。

vmvare虚拟化平台巡检研究细则和方法

vmvare虚拟化平台巡检研究细则和方法

vmvare虚拟化平台巡检细则和方法1.1 检测多个主机之间是否有相同的软件版本1.2 检查网络和存储配置信息是否一致1.3 检查服务器配置信息是否相同,是否有不同的CPU类型1.4 是否配置NTP时钟同步服务1.5适当的配置M AN AG E M E NT NE TW ORK的网络参数1.6为M anagem ent Netw ork使用固定的I P地址1.7检查主机是否告警1.8其他交换机是否配置冗余物理网卡2.1 虚拟2.2 物理网卡2.3 应用流量和管理流量的分配3.1正确配置存储多路径管理3.2虚拟机在LUN上的存储4.1处于不同的管理目的为E SXi服务器使用不同账号4.2限制远端的root登陆ES X i服务器用户帐号和权限4.3出于不同的管理任务使用合适的V C络的隔离5.1虚拟机中正确安装VM ware Tool s5.2虚拟机的屏幕保护是否打开5.3虚拟机的外设使用情况5.4虚拟机的是否有时钟同步配置6.2v Cen ter服务没有受到其他应用影响6.3v Cen ter数据库使用情况6.4H A群集冗余容量6.5虚拟机CP U Read y和u sageter与E S X i主机服务器时间6.6v Cen6.7Cen ter监控设置6.9v Cen ter性能监控7.1是否有控制生产环境改变的变更流程控制7.2是否有相适应的操作手册来控制日常管理8.1是否有冗余的电源管理8.2是否有供V C和l i cense serv er使用的热切换机制,针对网络的冗余网卡,存储多路径管理实用文案8.3是否有虚拟机的备份和恢复流程文案大全。

(完整版)vmvare虚拟化平台巡检细则和方法

(完整版)vmvare虚拟化平台巡检细则和方法
检查虚拟机文件是否正常
通过VS Client查看每个Datastore上存储的虚拟机
正常异常
4.1
检测客户是否有帐户管理机制
询问客户使用什么账户来完成对ESXi服务器的日常管理目的
正常异常
4.2
是否有防止恶意攻击的手段
以root用户登录命令行察看配置文件/etc/ssh/sshd_config的“PermitRootLogin”数据项的值是否为真
vmvare虚拟化平台巡检细则和方法
1.1
检测多个ESXi主机间是否有不同的软件版本
通过图形化方法:
为了获得ESXi主机的版本信息,使用VS Client,点击给定ESXi主机的配置标签。
为了获得VC的版本信息,通过使用VS Client,在主菜单上选择帮助-〉关于虚拟化架构选项
ESXi 5.0.0 1311175
正常异常
1.5
检测设定的网卡特性是否和实际网络环境相同
图形化方法:
使用VS Client检测物理网卡的速度和全双工状态,带宽速度是固定还是自动协商。
正常异常
1.6
检测DHCP选项是否开启
图形化方法:
在VS Client里面,导航到Configuration -> Networking并且点击带有Management Network的虚拟交换机属性,然后点击编辑,点击继续浏览查看DHCP选项是否开启
命令行方法:
键入“esxcfg-vswif –l”并且查看DHCP列表项是否在false
正常异常
1.7
检测主机硬件是否异常、检查主机是否告警
图形化方法:
1、在VS Client里面,查看主机是否告警
2、主机硬件状态巡检,点击主页上的“主机和集群”图标,然后点击物理机,选中"硬件状态",查看传感器是否为正常状态

vmvare虚拟化平台巡检周报

vmvare虚拟化平台巡检周报

2
网络的冗余网卡,存储多路径管理
正常
3 是否有虚拟机的备份和恢复流程
正常
巡检细那么和巡检方法:详见?vmvare 虚拟化平台巡检细那么和方法?
正常
7 Anti-Affinity 设置
正常
8 vCenter 监控设置
正常
9 vCenter 性能监控
正常
一般检查 – 标准化与支持
1 是否有控制生产环境改变的变更流程控制
正常
2 是否有相适应的操作手册来控制日常管理
正常
一般检查 – 高可用性

1 是否有冗余的电源管理
正常
是否有供 VC 和 license server 使用的热切换机制,针对
正常
6 为 Management Network 使用固定的 IP 地址
正常
7 检查主机是否告警
正常
8 其他
正常
网络
1 虚拟交换机是否配置冗余物理网卡
正常
2 物理网卡速率和全双工检查
正常
3 应用流量和管理流量的分配
正常
存储
1 正确配置存储多路径管理
正常
2 虚拟机在 LUN 上的存储
正常
平安
1 处于不同的管理目的为 ESXi 效劳器使用不同账号
正常
4 虚拟机的是否有时钟同步配置
正常
vCenter 效劳器
1 许可证效劳器有足够的许可
正常
2 vCenter 效劳没有受到其他应用影响
正常
3 vCenter 数据库使用情况
正常
4 HA 群集冗余容量
正常
5 虚拟机 CPU Ready 和 usage
正常
6 vCenter 与 ESXi 主机效劳器时间

VMware虚拟化平台巡检手册

VMware虚拟化平台巡检手册

VMware虚拟化平台巡检手册VMware 云平台巡检手册2系统拓扑图第一章系统拓扑图11.1物理连接图 (1)1.2整体拓扑图 (1)1.3拓扑结构说明 (2)第二章2.1 2.2物理硬件检查报告3172.16.12.75 硬件状态报告 ............................................................................................ 3 172.16.12.76 硬件状态报告 (5)第三章3.1 3.2 3.3 3.4虚拟平台检查报告8虚拟平台基本状态检查 ...................................................................................................... 8 虚拟平台安全检查报告 .................................................................................................... 15 系统性能检查报告 ............................................................................................................ 17 系统告警检查报告 (21)第一章系统拓扑图1.1 物理连接图第一章 11.2 整体拓扑图2系统拓扑图1.3 拓扑结构说明由上图可以看到,物理层面,我们用户采用了两台IBM X3850 X5 的 X86 服务器作为虚拟化的物理服务器。

用 1 台 IBM DS5020 作为虚拟化存储,同时该存储中划分了众多 LUN,部分 LUN 用于别的系统使用(如小型机系统)。

存储和主机之间通过 SAN 交换机连接。

网络设备巡检规范与方法

网络设备巡检规范与方法

网络设备巡检规范与方法网络设备巡检是保障网络正常运行的重要环节。

合理有效的巡检规范与方法能够帮助管理员及时发现并解决网络设备的故障和隐患,提高网络的稳定性和安全性。

本文将介绍网络设备巡检的规范和方法,以便提供一个全面的指南。

一、巡检的重要性网络设备巡检是确保网络正常运行的关键步骤。

通过定期巡检,可以及时发现和解决网络设备的故障和隐患,提高网络的可靠性和可用性,确保网络服务的稳定性和安全性。

巡检还可以及时发现网络性能瓶颈,并进行优化和改善,从而提升网络的传输速度和流畅度。

二、巡检规范1. 设定巡检周期:根据网络规模和重要性,合理设定巡检周期。

对于大型企业或重要部门的网络,建议每周进行一次完整巡检;而对于小型办公室或普通用户,每月一次即可。

2. 制定巡检计划:在巡检前,制定详细的巡检计划,明确要巡检的网络设备和巡检内容。

根据网络设备的种类和用途,分别制定巡检要点和操作流程。

3. 检查硬件设备:检查网络设备的外观和机箱是否有明显的损坏或异常情况。

确保设备的工作环境良好,避免过热或过度尘埃等情况。

4. 检查连通性:通过Ping命令或其他网络连通性测试工具,检查网络设备之间的连通性。

验证网络设备之间的通信是否正常,发现问题及时解决。

5. 检查设备日志:查看网络设备的系统日志和安全日志,了解设备的工作状态和异常情况。

对于有日志报警功能的设备,及时处理报警信息。

6. 检查网络配置:检查网络设备的配置是否符合规范和要求,包括IP地址、子网掩码、网关、DNS等。

确保配置正确,避免因配置错误导致的网络问题。

7. 检查网络性能:使用网络性能测试工具,对网络设备进行性能测试,包括带宽、延迟、丢包率等指标。

发现性能问题后,及时进行优化和改进。

8. 更新设备固件:检查网络设备的固件版本,及时更新最新的稳定版本,修复已知的漏洞和问题,提升设备的性能和安全性。

三、巡检方法1. 手动巡检:管理员通过远程登录网络设备,手动进行巡检操作。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

vmvare虚拟化平台巡检细则和方法
1.1 检测多个主机之间是否有相同的软件版本
通过图形化方法:
为了获得ESXi主机的版本信
息,使用VS Client,点击给定ESXi
主机的配置标签。

为了获得VC的版本信息,通过
使用VS Client,在主菜单上选择帮助
正常异常
-〉关于虚拟化架构选项
ESXi 5.0.0 1311175
命令行方法:
以root权限登陆ESXi 主机,在
命令行提示符下输入“vmware –v”
1.2 检查网络和存储配置信息是否一致
图形化方法:
正常异常
在VS Client里面, 导航到
Configuration -> Networking and Network Adapters 检测:
虚拟交换机数量
虚拟交换机命名 物理网卡数量
物理网卡的速度/全双

端口组类型
是否有冗余
命令行方法:
在命令行提
示符下键入 “esxcfg –vswitch –l” 列出多个虚拟交换机和端口组信息
在命令行提示符下键入 “esxcfg -nics –l” 列出多个物理网卡,网卡的速度,制造商,连接状态
1.3 检查服务器配置信息是否相同,是否有不同的CPU 类型
图形化方法:
在VS Client里面, 导航到每个主机的Configuration -> Processors 检测:
Cpu型号
处理器速度
处理器数量
每个物理处理器上是否有多核核数是否相同
超线程是否开启
逻辑cpu数量正常异常
1.4 是否配置NTP时钟同步服务
图形化方法:
在VS Client中, 导航到Configuration -> Security Profile 并且观察NTP Client 选择是否开启了外出连接选项。

正常异常
命令行方法:
键入“ntpq –p”
检查/etc/ntp.conf 和
/etc/ntp/step-tickers 配置文件中的
目标服务器名称和ip地址。

1.5适当的配置MANAGEMENT NETWORK的网络参数
图形化方法:
使用VS Client 检测物理网卡的速度和全双工状态,带宽速度是固定还是自动协商。

正常异常
1.6为Management Network使用固定的IP地址
图形化方法:
在VS Client里面, 导航到Configuration -> Networking 并且点击带有Management Network的虚正常异常
拟交换机属性,然后点击编辑,点击继续浏览查看DHCP 选项是否开启
命令行方法:
键入 “esxcfg -vswif –l” 并且查看DHCP 列表项是否在false
1.7检查主机是否告警
图形化方法:
1、在 VS Client 里面, 查看主
机是否告警
2、主机硬件状态巡检,点击
主页上的“主机和集群”图标,然后点击物理机,选中"硬件状态
",查看传感器是否为正常状态
正常


2.1 虚拟交换机是否配置冗余物理网卡
通过VS Client 查看虚拟交换机配置
正常 异

2.2 物理网卡速率和全双工检查
通过VS Client 查看虚拟交换机连接的网卡配置
正常 异

2.3 应用流量和管理流量的分配
正常


3.1正确配置存储多路径管理
通过VS Client查看VMFS、HBA和存储路径摘要
正常异常
3.2虚拟机在LUN上的存储
如果一个LUN上虚拟机数量超过16台,提醒客户
加以注意
对于存放在本地存储的虚拟机,提醒客户加以注意,这些虚拟机不能使用VMotion、
DRS或HA迁移
检查虚拟机文件是否正常
通过VS Client查看每
个Datastore上存储的虚拟机
正常异

4.1处于不同的管理目的为ESXi 服务器使用不同账号
询问客户使用什么账
户来完成对ESXi 服务器的日
常管理目的
正常


4.2限制远端的root 登陆ESXi 服务器
以root 用户登录命令
行 察看配置文件/etc/ssh/sshd_config

“PermitRootLogin” 数据项的值是否为真
尝试远程ssh ,root 登

正常 异

4.3出于不同的管理任务使用合适的VC 用户帐号和权限
询问客户是否使用不
同的VC用户和权限来完成不同的管理任务正常异常
4.4通过使用和合适的VLAN确保不同网络的隔离
图形化方法:
使用VS Client 检测虚拟交换机中不同的端口组是否有多VLAN 设定正常异常
4.5在虚拟交换机上使用安全策略
混杂模式,
图形化方法:
在VS Client中, 导航到
Configuration -> Networking 并且点
击属性查看虚拟交换机的安全选

正常异

5.1虚拟机中正确安装VMware Tools
通过VS Client查看虚
拟机的VMware Tools版本,工作状态
正常异常
5.2虚拟机的屏幕保护是否打开
通过VS Client访问虚
拟机的控制台,查看虚拟的屏幕保护是否打开正常异常
5.3虚拟机的外设使用情况
虚拟机是否用到串并
口外设,软驱,光驱。

虚机的外设需要满足VMotion的要求正常异常
5.4虚拟机的是否有时钟同步配置
通过VS Client访问虚拟机属性。

检查VMware Tools 是否使用时钟同步,或虚机的时钟服务正常工作
正常异常
在VS Client中,查看
Administration Licenses
正常异常6.1vCenter服务没有受到其他应用影响
主机配置,内存小于2G,单CPU 或磁盘空间不足
操作系统版本及SP与vCenter
登陆到vCenter主机,
输入“winver”,Control Panel
Add/Remove Program
正常异

兼容
是否存在
与vCenter服务争用
资源或影响vCenter
服务运行的应用
6.2vCenter数据库使用情况
检查vCenter数据库版
本与SP
检查vCenter数据库所需磁盘空间正常异常
6.3HA群集冗余容量
通过VS Client,查看
HA群集设置,检查“Host failure setting”正常异常
6.4虚拟机CPU Ready和usage
通过VS Client,
Performance页面检查CPU
Performance图形以及CPU
Ready图形
正常异

6.5vCenter与ESXi主机服务器时间
通过VS Client,查看
vCenter时间,并与ESXi主机服务器时间对比正常异常
6.6Anti-Affinity设置
通过VS Client,编辑正常异
6.7vCenter监控设置
通过VS Client,检查
Datacenter、ESXi主机服务器、资源池或虚拟机上Alarm设置正常异常
6.8vCenter性能监控
通过VS Client,检查
Performance当中CPU、内存、网络和Disk IO。

正常异常
7.1是否有控制生产环境改变的变更流程控制
询问客户是否有对关
键应用的变更说明书可以追溯正常异常
7.2是否有相适应的操作手册来控制日常管理
询问客户是否有相应
的操作手册用以进行日常虚
拟机管理(例如虚拟机的供给,性能的监控,日常问题的处理方法)正常异常
8.1是否有冗余的电源管理
询问客户是否有对虚
拟化环境相应硬件环境的双
电源管理(例如pc server,LAN Switch,SAN Switch,storage Array)正常异常
8.2是否有供VC和license server使用的热切换机制,针对网络的冗余网卡,存储多路径管理
询问客户是否有VC和
license server的热切换机制,
正常异
9.1 虚拟化平台巡检说明
为保障贵单位虚拟化数据中心系统和业务系统稳定、高效的运行。

安排每个月定期巡检,主要是对数据中心硬件设备、数据中心平台、存储设备外观及指示灯状况、设备运行信息进行巡检,发现设备运行中可能出现及已经存在的问题,减少和避免设备因为配置问题及硬件存在故障产生的生产事故,给贵单位IT信息系统运维工作提供有力的参考依据。

相关文档
最新文档