king

安装Redhat/CentOS 6.5时选择了freeipmi相关软件包,可能会导致服务器不定时重启。

king 系统安装 2021-03-31 1389浏览 0

问题描述

服务器不定时重启,收集日志查看,在意外关闭时间点之前十几分钟到二十几分钟内,会有bmc-watchdog报错,类似如下:

/usr/sbin/bmc-watchdog[xxxx]: fiid_obj_get:’present_countdown_value’: data not available

问题原因

此问题属于Redhat/CentOS 6.5系统Bug,官方说明:https://access.redhat.com/site/solutions/628963

初步分析是freeipmi无法正确重置watchdog timer,导致watchdog timer归零,从而触发BMC发送重启指令。

解决方案

方法一:卸载掉如下4个软件包

安装Redhat/CentOS 6.5时选择了freeipmi相关软件包,可能会导致服务器不定时重启。

卸载时请使用rpm -e –nodeps命令,否则在卸载freeipmi-1.2.1-3.el6.x86_64时会提示conman-0.2.7-2.el6.x86_64和这个包有依赖关系

方法二:升级freeipmi到1.2.1-6.el6_5或更新版本。

下载地址:http://rhn.redhat.com/errata/RHBA-2013-1795.html

升级指令:

yum update freeipmi

升级完成需要启动服务,使用root用户登录,在/etc/modprobe.d/watchdog‐reboot‐workaround.conf文件中添加如下内容:

alias acpi:IPI000*:* ipmi_si
alias acpi:IPI000*:* ipmi_devintf
alias acpi:IPI000*:* ipmi_msghandler

然后执行以下命令:

# modprobe ipmi_devintf
# modprobe ipmi_msghandler
# modprobe ipmi_si
# service bmc‐watchdog condrestart


发表评论