公司架设的档案服务器,h730p配置6块硬盘raid10。esxi里面挂软防火墙和win server。1月1号晚上服务器掉线。第二天上午现场检查,服务器指示灯没问题,esxi存储器错误,子系统由于读不到硬盘数据就挂了。日志查看,硬盘1错误,紧接着硬盘0错误。后莫名其妙的0-7号硬盘插入。后台数据重建。10:45现场重启服务器后恢复正常上线。
问:问题出在哪?硬盘坏道?那紧紧是坏道raid10这么高冗余掉线的?阵列卡坏了么?厂家是这样说的,让换,对么?后续怎么回避解决,保证系统可靠性?换硬盘,怎么换,还要考虑旧数据。换阵列卡?风险?为啥重新启动就好了,没再报错?
不确定服务器出现的问题是由哪些因素导致的。通常情况下,RAID 10配置的冗余能力很高,如果一个硬盘出现故障,通常不会导致系统故障。但是如果出现了多个硬盘故障,或者阵列控制器出现故障,可能会导致系统故障。
建议联系服务器制造商或者服务商,他们来帮助检测服务器的故障原因。他们可以使用特殊的测试工具来确定硬盘是否有损坏的扇区,或者阵列控制器是否有故障。
如果决定更换硬盘或阵列控制器,务必联系服务商或制造商,以确保正确的更换方法。更换硬盘时,需要考虑如何保留旧数据。更换阵列控制器可能会有一定的风险,因为如果操作不当,可能会导致数据丢失。
至于为什么重新启动后服务器恢复正常,可能是因为某些临时性的故障被清除了,也可能是因为硬盘或者阵列控制器的故障被修复了。
仅供参考,望采纳,谢谢。
有以下几方面的原因有可能会导致此故障的发生:
1、服务器突然断电(数据中心有UPS电池柜);
2、服务器未正常关机;
3、硬盘接触不稳定;
4、阵列卡故障;
5、硬盘物理故障(坏道,固件,磁头损坏,电路板坏)等。
【服务器存储安全建议】
1.对存储硬件状态及服务器运行情况做定期检测,发现异常情况时及时采取相应解决方案;
2.在存储出现多块硬盘离线的情况下,切忌贸然对硬盘强制上线或REBUILD,以免数据受到进一步破坏;
3.使用数据备份方案,实时,定期或手动备份数据的二次以上的备份。有条件可考虑异地实时备份。
问:问题出在哪?硬盘坏道?那紧紧是坏道raid10这么高冗余掉线的?阵列卡坏了么?厂家是这样说的,让换,对么?后续怎么回避解决,保证系统可靠性?换硬盘,怎么换,还要考虑旧数据。换阵列卡?风险?为啥重新启动就好了,没再报错?
这样说吧,
如果阵列卡没问题,那只要不是多个硬盘崩坏(概率很低),那raid10真的是很高冗余的,工作这么多年,没出现过1次多个硬盘损坏的。
如果真的是阵列卡问题,那就整个阵列都会丢失,
但听你的情况描述,是重启之后,好了?如果真坏,哪会重启之后就好了🤣
不过也有情况,就是阵列卡可能真的有损坏,但这个需要去检测才可以确定。
厂家建议更换,是服务器原厂吗?还是服务商?
还有个问题,你机器用多少年了?
至于说更换硬盘?你是有硬盘损坏?有的话,直接在服务器上都有提示,只的需要更换的话,只有RAID还在,不是多坏损坏,直接更换就好。
至于数据方面,你现在不是说恢复了?如果恢复了,就马上先备份数据先,因为不知道后续是否又再出现啊,所以还是备份数据最稳妥了。
备份好数据,厂商说更换阵列卡的话,保证数据在的前提下,可以尝试更换,但还是先进行检测,是否真的是阵列卡损坏,
既然现在恢复了,那就下备份数据,然后观察运行,不行,就更换。
再次强调,记得备份数据。数据无价。
导致 ESXi 系统挂载的硬盘丢失,并且重启也无法恢复可以尝试以下解决方案:
1.检查服务器的电源、散热和硬件连接是否正常。有时候故障可能是由于硬件故障造成的,因此建议检查一下服务器的电源是否正常,散热器是否堵塞,硬件连接是否松动等。
2.检查 H730P 阵列卡的固件版本是否是最新的。如果固件版本不是最新的,可能会导致故障。建议更新 H730P 阵列卡的固件版本。
3.尝试重新加载 H730P 阵列卡的驱动。有时候阵列卡的驱动可能会损坏或者丢失,这时候可以尝试重新加载驱动来解决问题。
4.尝试使用系统恢复工具来修复系统。如果你的 ESXi 系统遇到了问题,可以尝试使用系统恢复工具来修复系统。
5.尝试重新安装 ESXi 系统。如果以上方法都无法解决问题,可以尝试重新安装 ESXi 系统。重新安装系统可能会帮助你清除掉系统中的损坏或者损坏的配置,从而解决问题。
在进行重新安装之前,建议先备份好系统中的所有重要数据,以防万一。重新安装系统的过程也需要按照说明步骤操作,以避免出现意外问题。
建议您按照厂家的建议更换硬盘。更换硬盘时,应确保系统正常运行并备份所有重要数据,以防在更换过程中发生意外。
如果您决定更换阵列卡,需要考虑到更换的风险。在更换阵列卡之前,应先备份所有重要数据,以防在更换过程中发生意外。
不清楚重新启动服务器后为什么没有再次出现错误。如果您遇到了类似的问题,建议您寻找专业人员进行进一步的诊断和解决方案。
为了保证系统的可靠性,您可以考虑定期对服务器进行维护和检查,并定期备份所有重要数据。这有助于防止意外发生,并为您的业务提供更强的保障。