Linux进程经常误入歧途,什么都不做,甚至不耗用CPU周期。虽然僵尸进程不像运行中的流氓应用程序那样占用宝贵资源,但可能会构成威胁。如何构成威胁?某个进程成为僵尸进程时,它保留其进程ID(PID)。由于Linux系统的PID数量有限(不过数量很大),如果足够的PID沦为僵尸,其他进程就无法启动。
发生这种情况的可能性非常小。然而更重要的是,僵尸进程表明应用程序出现了岔子,某个程序中可能存在着错误。不应容忍数据中心软件上的错误,需要加以解决。你可能需要检查并杀死僵尸进程,才能解决问题。
因此,某个进程成为僵尸进程时,你怎么做?你要找到并杀死那些僵尸进程。下面教你怎么做。
找出僵尸进程
首先要做的是找出僵尸进程。幸好,由于ps命令,这很简单。通过grep显示ps命令的输出,列出STAT是Z(代表僵尸)的任何进程。打开终端窗口,执行下列命令:
psaux|grep'Z'
上述命令的输出将列出输出中包含Z的任何进程(图A)。
图A
如你所见,许多运行中的进程呈僵尸状态。该命令还将列出输出中包含字母Z的任何进程,因此你要忽略STAT列中没有Z的任何进程。
杀死僵尸进程
我们想要使用kill命令来终结那些僵尸进程。命令的输出将包括所有僵尸进程的PID,因此想终结其中一个,只要执行命令:
killPID
其中PID是相关进程的进程ID。因此,如果你想终终结沦为僵尸的thunderbird进程(其PID是20589),命令是:
kill20589
就是这样。
你完全可以编写一个bash脚本来自动处理这项任务,不过可能会杀死必要进程。由于存在这个风险,我总是建议你手动处理此任务。考虑到我们面对的是生产级数据中心服务器(不过我在桌面系统上进行了演示),尤其应该这样。
如果你发现服务和应用程序崩溃,应该检查有无僵尸进程,并终结它们。一旦你知道了哪些进程是僵尸进程,应提交错误报告,或者联系并告知开发人员(如果应用程序常常崩溃,更应如此)。
转载请注明:IT运维空间 » 安全防护 » 如何找到并杀死Linux数据中心服务器上的僵尸进程?
发表评论