VMware虚拟机故障排除方法
解决VMware虚拟机快照故障的方法

解决VMware虚拟机快照故障的方法虚拟化管理员能在VMware ESX上使用快照回到以前的状态及找出虚拟机哪里出错。
在这一系列文章的第一次部分中,我们讨论了怎么使用VMware快照。
在第二部分中,解释了在不浪费磁盘空间的情况下如何删除快照。
不过,当快照出现故障时该如何解决呢?定位有快照的虚拟机尝试找出哪台虚拟机有快照是个挑战。
在VMware Infrastructure Client或VirtualCenter里没有一个集中的办法找到快照,因此,你应该定期地检查ESX服务器,找到那些需要删除的旧快照。
下面有一些方法:方法1——使用服务器控制台的Find命令1.登录服务器控制台。
2.更改/vmfs/volumes/目录。
3.键入find -iname "*-delta.vmdk" -mtime +7 -ls找到在7天之内未被修改的快照文件或键入find -iname"*-delta.vmdk"找到所有的快照文件。
方法2——使用Dominic Rivera的叫做Snapalert的免费脚本。
这个脚本使用VI Perl工具包直接与VirtualCenter对话,并确保不需要在每台主机上安装任何组件(也适用于ESXi)。
也可以选择让脚本产生一个Email报告。
方法3——使用来自Xtravirt的叫做Snaphunter的免费工具,它能从多个ESX Servers报告虚拟机的快照状态,也能发送Email报告。
方法4——查询V irtualCenter SQL数据库。
VirtualCenter一直在它的VPX_SNAPSHOT表中追踪每台主机上的所有快照。
我曾经写了一个需要这个表的VBS脚本以显示运行快照的虚拟机列表。
这个方法不错。
不过它依赖数据库表,这可能在未来的VirtualCenter版本里有改变。
处理未正确删除的快照偶尔,一个快照未被正确删除,在虚拟机里仍然是活动的快照。
VMware虚拟化维护及故障排除x

03
故障排除
常见故障识别
虚拟机启动失败 可能是由于虚拟机配置错误、硬 件故障或宿主机资源不足等原因。
高可用性和容灾问题 虚拟机无法在主节点故障时自动 切换到备用节点,可能是由于高 可用性配置错误、网络延迟或资 源分配问题等。
密钥管理
建立密钥管理体系,对加密和解密过程中使用的密钥进行安全存储和管理,防止密钥泄 露。
安全审计与监控
日志审计
对虚拟化平台上的操作进行日志记录,以便对异常行为进行审计和分析。
实时监控
对虚拟化平台的关键指标进行实时监控,及时发现异常情况并进行处理。
安全策略与制度
要点一
安全策略制定
根据组织的安全需求和标准,制定适合虚拟化平台的安全 策略和制度。
混合云集成
实现虚拟化环境与公有云、私有 云的无缝集成,提供一致的资源 管理和服务交付体验。
感谢您的观看
THANKS
虚拟化技术可以降低企业的IT成本, 包括硬件成本、电力成本和维护成本 等。
02
维护操作
备份与恢复
定期备份虚拟机
使用VMware的备份工具,如VMware Data Recovery,定期备份虚拟机,确保 数据安全。
VS
恢复虚拟机
在虚拟机出现故障或数据丢失时,使用备 份文件快速恢复虚拟机,减少停机时间。
兼容性问题
不同厂商的虚拟化产品之间的兼容性差异可能导致资源共享和互操 作性问题。需要加强标准制定和产品互通性测试。
未来发展方向
自动化运维
通过自动化运维工具和流程,实 现虚拟化环境的快速部署、监控 和故障排除,提高运维效率。
VMware虚拟机开机卡死黑屏,进不了系统解决办法

VMware虚拟机开机卡死⿊屏,进不了系统解决办法Vmware虚拟机Linux、Ubuntu、CentOS、windowns开机启动卡死⿊屏,想重置虚拟机⼜
没有拍摄快照?重新装⼀次虚拟机?别着急,这⾥有个⽅法可以试⼀试
VMware 15.5.0 build-14665864 物理机操作系统版本Windows 10, 64-bit (Build 18363)
10.0.18363
1、为什么会出现这种原因
1. ⾮正常关闭虚拟机,⼀般是直接关闭物理机,任务管理器是关闭不了正在运⾏的虚拟机系
统
2. 电脑配置不⾼,⼜同时运⾏多个程序。
⽐如物理机的系统正在更新打补丁等会严重占⽤系
统资源
3. 硬件软件不兼容。
⽐如VMware15的某个版本与win10的某个版本不兼容,直接打不开
VMware软件
4. 其他原因
2、解决办法
⾸先定位到虚拟机系统的存放⽬录
这个是正常关闭的虚拟机系统⽬录
不正常关闭或挂起的虚拟机⽬录
CentOS的是这样
我们可以看到这个vmem⽂件的⼤⼩其实就是你分配给虚拟机运⾏内存的⼤⼩,我们得删除卡死
状态下的内存⽂件(标记为红⾊的⽂件),好让系统重新加载正常的配置。
如果你的虚拟机系
统正在运⾏,不管卡不卡死,你是⽆法删除正在被占⽤的⽂件,⼀般来说,先重启物理机,定
位到虚拟机系统⽬录,删除之后再启动虚拟机。
之后就可以正常进⼊了。
有时候,拍摄快照有备⽆患(如果是虚拟机操作系统内部的配置有问题,⽐如中毒之类啥的,
使⽤这个⽅法)
如果以上⽅法不⾏的话,你再⾛⼀遍虚拟机的安装吧
如果出现⽂件复制卡死问题,⽽且不是最新的Vmware,请更新VM。
Vmware常见故障处理

Vmware故障处理1、为主机应用Host Profiles提示compliance错误故障状态:为主机应用Host Profiles失败,提示如下错误:01.Specification state absent from host: device '<datastore>' state needs to be set to 'on'02.Host state doesn't match specification: device '<datastore>' needs to be reset03.Specification state absent from host: device '<datastore>' Path Selection Policy needs to be set to 'VMW_PSP_FIXED'04.Host state doesn't match specification: device '<datastore>' Path Selection Policy needs to be set to default for claiming SATP故障分析:这是由于PSA组件导致的;解决方案:1、右击Host Profiles后点击Enable/Disable Profiles配置选项;2、展开“Storage Configuration”选项,展开“Pluggable Storage Architecture”这个uxanxiang;3、去掉“PSA Device Configuration”;4、展开“Native Muti-Pathing(NMP)”这个选项后,接着展开“PSP and SATP configuration for NMP devi”选项;5、去掉“PSP configuration for”这个选项后点击OK即可。
VMware vSphere HA主机状态故障排除方法

VMware vSphere HA主机状态故障排除方法VmwarevCenter Server 和 ESXi 主机在运行时难免遇到这样那样或潜在的故障,那么如何提前知晓这些故障或处理这些故障呢,在此小编支支招VMware vSphere HA主机状态故障的排除方法。
1、VMware vSphere HA主机状态故障排除方法一般情况下,vCenter Server 会报告 vSphere HA 主机状况,指示主机上的错误情况,这类错误会阻止 vSphere HA 充分保护主机上的虚拟机,并阻碍 vSphere HA 在故障出现后重新启动虚拟机的功能,当在主机上配置或取消配置 vSphere HA 时,或很少数情况下在正常运行期间可能出现错误,当出现错误时,应确定如何解决错误才能使 vSphere HA 全面运行。
2、vSphere HA 代理处于代理无法访问状况主机上的 vSphere HA 代理已处于代理无法访问状况一分钟或更长时间。
可能需要用户干预来解决这种情况。
问题:当首选主机或 vCenter Server 无法访问主机的代理时,vSphere HA 会报告代理处于代理无法访问状况。
因此,vSphere HA 无法监控该主机上的虚拟机,并且在出现故障后可能不会重新启动这些虚拟机。
原因:vSphere HA 代理可能因多个原因而处于代理无法访问状况。
这种情况通常表示网络连接问题正在阻止 vCenter Server 访问首选主机和主机上的代理,或表示群集中的所有主机都失败。
这种情况还可能表示一种不太可能的情况:vSphere HA 已被禁用并已在群集中重新启用但 vCenter Server 无法与主机上的 vSphere HA 代理通信,或主机上的代理已失败且监视程序进程无法将其重新启动。
解决方案:确定 vCenter Server 是否报告主机无响应。
如果是,则说明存在网络问题或整体性群集故障。
VMwarevSphereHA主机状态故障排除方法

VMware vSphere HA主机状态故障排除方法Vmware vCenter Server 和 ESXi 主机在运行时难免遇到这样那样或潜在的故障,那么如何提前知晓这些故障或处理这些故障呢,在此小编支支招VMware vSphere HA主机状态故障的排除方法。
1、VMware vSphere HA主机状态故障排除方法一般情况下,vCenter Server 会报告 vSphere HA 主机状况,指示主机上的错误情况,这类错误会阻止 vSphere HA 充分保护主机上的虚拟机,并阻碍 vSphere HA 在故障出现后重新启动虚拟机的功能,当在主机上配置或取消配置 vSphere HA 时,或很少数情况下在正常运行期间可能出现错误,当出现错误时,应确定如何解决错误才能使 vSphere HA 全面运行。
2、vSphere HA 代理处于代理无法访问状况主机上的 vSphere HA 代理已处于代理无法访问状况一分钟或更长时间。
可能需要用户干预来解决这种情况。
问题:当首选主机或 vCenter Server 无法访问主机的代理时,vSphere HA 会报告代理处于代理无法访问状况。
因此,vSphere HA 无法监控该主机上的虚拟机,并且在出现故障后可能不会重新启动这些虚拟机。
原因:vSphere HA 代理可能因多个原因而处于代理无法访问状况。
这种情况通常表示网络连接问题正在阻止 vCenter Server 访问首选主机和主机上的代理,或表示群集中的所有主机都失败。
这种情况还可能表示一种不太可能的情况:vSphere HA 已被禁用并已在群集中重新启用但 vCenter Server 无法与主机上的 vSphere HA 代理通信,或主机上的代理已失败且监视程序进程无法将其重新启动。
解决方案:确定 vCenter Server 是否报告主机无响应。
如果是,则说明存在网络问题或整体性群集故障。
Vmware vSphere常见问题及解决办法
VmwarevSphere常见问题及解决办法1. 虚拟机文件被锁,无法正常 power on故障状态:启动虚拟机时95%,停顿并且进程中断,提示:ubable to access files since it is locked。
祸根:HA解决方法:(1)首先将cluster中的HA功能关闭。
如果该功能不关闭,容易造成死锁,,VM不断跳动,,不断再不同的ESX内循环被锁,徒劳而无功。
(2)磁盘文件被锁,要解决,必须要知道到底是哪台ESX把他给锁住了,这是关键。
方法:看/var/log/vmkernel但是,在做这些前, 再准备些别的工作。
(3)在VC中,把被锁的VM从Inventory中remove掉。
原因很简单,这是一个 unregister的过程。
(4)根据/var/log/vmkernel,搜索owner,可以找到类似以下的语句: Oct 19 04:23:33 esx-hostname vmkernel: 3:06:29:47.992 cpu6:1656)FS3:1975: Checking if lock holders are live for lock [type 10c00001 offse t 52008960 v 380, hb offset 3554304 Oct 19 04:23:33 esx-hostname vmk ernel: gen 17, mode 1, owner 48f5f637-462688bc-fd28-0e1a6434b6f8 mti me 38112]OK,owner后面的48f5f637-462688bc-fd28-0e1a6434b6f8就是你的target 了。
因为他就是锁住VM 的宿主.。
(5)根据以下命令,,找出到底哪台ESX的UUID是 48f5f637-462688bc-fd28-0e1a6434b6f8[root@esxhostname root]# esxcfg-info |grep -i 'system uuid'(6)找到目标主机后,当然是杀死他锁住VM的进程。
Mac中VMware虚拟机无法上网解决方法是什么
Mac中VMware虚拟机无法上网解决方法是什么人们使用电脑时候最不想看到的事情之一就是上不了网了,无论是工作还是玩游戏时候都很不爽。
那么的在Mac中VMware虚拟机无法上网怎么办?方法步骤1、在虚拟机右下角的网络适配器上面观察该图标是否是有绿色的灯在闪烁,如果网络适配器是灰色的证明虚拟机的网络没有打开,而是被禁用了,在适配器上点击鼠标右键,打开【设置】,在【已连接】、【启动时连接】的前面打勾。
2、网络类型你是选择的什么?如果你是通过路由器拨号来上网,那么我们一般会给虚拟机网络设置成【桥接模式】3、如果是电脑直接拨号上网,那么一般我们把虚拟机网络模式设置成为【NAT】模式,在虚拟机的网络适配器上点击【设置】-->选择NAT模式,然后点击【确定】按钮4、虚拟计算机是否获取到IP地址?虚拟主机中,我们查看是否获取到了IP地址。
NAT模式的话,获得的IP和虚拟网卡8的IP是一个网段哦!查看虚拟网卡8的IP地址请在网络中心里面查看。
5、查看虚拟网卡是否被禁用或者未安装成功,在网上邻居图标上点击鼠标右键-->属性,然后就可以查看两个虚拟网卡是否正常运行。
6、如果是桥接模式,查看本机的IP地址方法是在网络中心里面的本地连接图标上点击鼠标右键--->【属性】--->状态-->支持7、使用ping的方法判断,根据你的连接方式来ping不同的ID 地址如:我的连接方式是NAT模式,那么我就先在虚拟机系统中ping 我的网关,然后再用真实电脑也去ping这个网关。
如果虚拟机ping不通自己的网关,那么就是这个虚拟网卡8和虚拟机之间有问题,如果是实体机无法ping通虚拟网卡的IP地址(其实是虚拟机的网关),那么也是这个虚拟网卡8有问题。
对于这种问题,我们只能重装虚拟机了。
补充:电脑突然无法上网如何解决右击网络图标,打开网络共享中心,查看我们的网络连接目前的情况。
在网络共享中心中第一条就是我们目前网络连接的示意图,查看在那个位置有问题。
VMware虚拟化维护及故障排除
VMware 虚拟化环境维护及常见故障排除
23
© 2011 VMware Inc. All rights reserved
VMware 虚拟化环境维护及常见故障排除
24
© 2011 VMware Inc. All rights reserved
VMware 虚拟化环境维护及常见故障排除
20
© 2011 VMware Inc. All rights reserved
常见故障排除
常见存储故障 VM 显示DISK I/O error, File System read-only
VMware 虚拟化环境维护及常见故障排除
21
© 2011 VMware Inc. All rights reserved
虚拟机维护
VMware 虚拟化环境维护及常见故障排除
13
© 2011 VMware Inc. All rights reserved
虚拟机维护
VMware管理员日常最多的工作就是对虚拟机的维护,具体包括:
使用向导创建虚拟机 认识虚拟机文件 使用VMware Tools 使用OVF模板 自定义客户机操作系统 使用模板 使用快照 更改虚拟机配置
VMware 虚拟化环境维护及常见故障排除
16
© 2011 VMware Inc. All rights reserved
常见故障排除
#vm-support
VMware 虚拟化环境维护及常见故障排除
17
© 2011 VMware Inc. All rights reserved
常见故障排除
使用VI Client导出日志或事件
VMware 虚拟化环境维护及常见故障排除
VMwarevSphereHA主机状态故障排除方法
VMware vSphere HA主机状态故障排除方法Vmware vCenter Server 和 ESXi 主机在运行时难免遇到这样那样或潜在的故障,那么如何提前知晓这些故障或处理这些故障呢,在此小编支支招VMware vSphere HA主机状态故障的排除方法。
1、VMware vSphere HA主机状态故障排除方法一般情况下,vCenter Server 会报告 vSphere HA 主机状况,指示主机上的错误情况,这类错误会阻止 vSphere HA 充分保护主机上的虚拟机,并阻碍 vSphere HA 在故障出现后重新启动虚拟机的功能,当在主机上配置或取消配置 vSphere HA 时,或很少数情况下在正常运行期间可能出现错误,当出现错误时,应确定如何解决错误才能使 vSphere HA 全面运行。
2、vSphere HA 代理处于代理无法访问状况主机上的 vSphere HA 代理已处于代理无法访问状况一分钟或更长时间。
可能需要用户干预来解决这种情况。
问题:当首选主机或 vCenter Server 无法访问主机的代理时,vSphere HA 会报告代理处于代理无法访问状况。
因此,vSphere HA 无法监控该主机上的虚拟机,并且在出现故障后可能不会重新启动这些虚拟机。
原因:vSphere HA 代理可能因多个原因而处于代理无法访问状况。
这种情况通常表示网络连接问题正在阻止 vCenter Server 访问首选主机和主机上的代理,或表示群集中的所有主机都失败。
这种情况还可能表示一种不太可能的情况:vSphere HA 已被禁用并已在群集中重新启用但 vCenter Server 无法与主机上的 vSphere HA 代理通信,或主机上的代理已失败且监视程序进程无法将其重新启动。
解决方案:确定 vCenter Server 是否报告主机无响应。
如果是,则说明存在网络问题或整体性群集故障。