promox 物理机关机后,虚机无法正常使用

请问用3台物理机做的集群,PVE7.2-3,ceph 16.2.11,模拟1台物理机关机,所有虚机都不正常了,虚机是启动着的,但是网络不通了,通过控制台也连不上了,点击控制台提示:VM 100 qmp command 'set_password' failed - unable to connect to VM 100 qmp socket - timeout after 31 retries
TASK ERROR: Failed to run vncproxy.
在一台物理机ssh另外一台物理机 不需要密码可以直接访问的,不知道这个提示是什么情况,请问大家应该怎么解决?

这个情况可能是由于其中一台物理机下挂的Ceph OSD节点(即存储节点)宕机导致的虚拟机无法正常工作,需要进行排查和修复。
具体的解决方法如下:

  1. 检查Ceph存储节点,确保所有Ceph OSD节点都处于正常工作状态。可以通过 ceph -sceph osd status 命令进行检查。
  2. 如果有Ceph OSD节点宕机或异常,需要对其进行排查和修复。可以使用 ceph osd tree 命令查看集群中的OSD状态,并使用 ceph osd outceph osd down 命令将其从集群中移除并标记为下线状态,然后进行相应故障排除操作,修复后再加入到集群中。
  3. 针对无法访问控制台的问题,可以尝试重启虚拟机,并检查其网络配置和QEMU/KVM配置是否正常。
  4. 如果仍然存在问题,可以尝试对虚拟机进行删除重建,或者恢复虚拟机备份进行测试。

另外,对于无需密码即可SSH访问的情况,也需要谨慎设置,以确保系统安全。可以使用ssh-keygen生成公钥和私钥,将公钥添加到目标主机的authorized_keys文件,这样就可以在不使用密码的情况下访问目标主机。同时也需要注意设置防火墙和安全组策略,以保障系统安全。