问题描述
服务器不定时重启,收集日志查看,在意外关闭时间点之前十几分钟到二十几分钟内,会有bmc-watchdog报错,类似如下:
/usr/sbin/bmc-watchdog[xxxx]: fiid_obj_get:’present_countdown_value’: data not available
问题原因
此问题属于Redhat/CentOS 6.5系统Bug,官方说明:https://access.redhat.com/site/solutions/628963
初步分析是freeipmi无法正确重置watchdog timer,导致watchdog timer归零,从而触发BMC发送重启指令。
解决方案
方法一:卸载掉如下4个软件包
卸载时请使用rpm -e –nodeps命令,否则在卸载freeipmi-1.2.1-3.el6.x86_64时会提示conman-0.2.7-2.el6.x86_64和这个包有依赖关系
方法二:升级freeipmi到1.2.1-6.el6_5或更新版本。
下载地址:http://rhn.redhat.com/errata/RHBA-2013-1795.html
升级指令:
yum update freeipmi
升级完成需要启动服务,使用root用户登录,在/etc/modprobe.d/watchdog‐reboot‐workaround.conf文件中添加如下内容:
alias acpi:IPI000*:* ipmi_si alias acpi:IPI000*:* ipmi_devintf alias acpi:IPI000*:* ipmi_msghandler
然后执行以下命令:
# modprobe ipmi_devintf # modprobe ipmi_msghandler # modprobe ipmi_si # service bmc‐watchdog condrestart
发表评论