对于经常进行系统维护的人员来讲,下面的服务器故障排错的基本原则应该不错,值得一看!
1. 尽量恢复系统缺省配置
a:硬件配置:去除标配备件(去除第三方厂商备件和非标配备件)。 b:资源配置:清除CMOS,恢复资源初始配置。 c: BIOS,F/W,驱动程序:升级最新的BIOS,F/W和相关驱动程序。 d: TPL:扩展的第三方的I/O卡属于该机型的硬件兼容列表(TPL)吗?
2. 从基本到复杂
a:系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理。 b:硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到现实系统为止。 c: 软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实系统为止。
3. 交换对比
a:在最大可能相同的条件下,交换操作简单效果明显的部件。 b: 交换NOS载体,既交换软件环境。 c:交换硬件,既交换硬件环境。 d:交换整机,既交换整体环境。
转载请注明:IT运维空间 » 运维技术 » 服务器故障排查方法总纲
发表评论