请问用3台物理机做的集群,PVE7.2-3,ceph 16.2.11,模拟1台物理机关机,所有虚机都不正常了,虚机是启动着的,但是网络不通了,通过控制台也连不上了,点击控制台提示:VM 100 qmp command 'set_password' failed - unable to connect to VM 100 qmp socket - timeout after 31 retries
TASK ERROR: Failed to run vncproxy.
在一台物理机ssh另外一台物理机 不需要密码可以直接访问的,不知道这个提示是什么情况,请问大家应该怎么解决?
这个情况可能是由于其中一台物理机下挂的Ceph OSD节点(即存储节点)宕机导致的虚拟机无法正常工作,需要进行排查和修复。
具体的解决方法如下:
ceph -s
或 ceph osd status
命令进行检查。ceph osd tree
命令查看集群中的OSD状态,并使用 ceph osd out
和 ceph osd down
命令将其从集群中移除并标记为下线状态,然后进行相应故障排除操作,修复后再加入到集群中。另外,对于无需密码即可SSH访问的情况,也需要谨慎设置,以确保系统安全。可以使用ssh-keygen生成公钥和私钥,将公钥添加到目标主机的authorized_keys文件,这样就可以在不使用密码的情况下访问目标主机。同时也需要注意设置防火墙和安全组策略,以保障系统安全。