生产环境两节点oracle RAC数据库,先是客户反映业务系统慢,后来反映无法登录,开始我以为是服务器某节点资源占用较高导致,我连上去top看cpu、内存占用正常,刚看完,服务器抛出下面的信息,然后就重启了。
Message from syslogd@yxv6db2 at Nov 15 11:47:47 ...
kernel:BUG: soft lockup - CPU#141 stuck for 21s! [oracle:228937]
Message from syslogd@yxv6db2 at Nov 15 11:47:56 ...
kernel:BUG: soft lockup - CPU#73 stuck for 21s! [oracle:81176]
Message from syslogd@yxv6db2 at Nov 15 11:47:57 ...
kernel:BUG: soft lockup - CPU#189 stuck for 22s! [oracle:81384]
Message from syslogd@yxv6db2 at Nov 15 11:47:58 ...
kernel:BUG: soft lockup - CPU#40 stuck for 22s! [oracle:240903]
Message from syslogd@yxv6db2 at Nov 15 11:47:58 ...
kernel:BUG: soft lockup - CPU#43 stuck for 22s! [oracle:81323]
Message from syslogd@yxv6db2 at Nov 15 11:47:59 ...
kernel:BUG: soft lockup - CPU#95 stuck for 22s! [oracle:81184]
各位大神有遇到过类似情况的么,求各位大神指导。
您好,您是私有云吗,可能的原因可能是高级别的过度使用或其他虚拟化开销。如果您认为过度使用是原因,您尝试修改内核参数。
echo 30 > /proc/sys/kernel/watchdog_thresh
时间不能超过60。
如果修改后还不行,那么您得仔细检查您得资源使用情况。检查是否底层问题。尤其是io。