Crontab导致Linux文件描述符枯竭问题
问题
系统中的定时任务,过一段时间之后,不能运行。通过系统命令查看到系统有大量sendmail进程,导致文件描述符耗尽。以下主要通过分析整个处理过程,供大家参考。
处理过程
根据以上问题,分析步骤如下:
1、首先手动执行了一下定时任务,结果执行失败,通过错误判断是文件描述符被用光了。具体报错如下:
"cannot open shared object file: Too many open files in system"
2、查看定时任务是否堆积,ps -ef | grep <TASK_NAME>没有发现任何任务在跑。猜测应该是其他问题导致,具体是什么,不清楚。
3、通过系统命令top看到有多个sendmail进程,然后ps -ef | grep sendmail,发现大量进程。初步定位应该是sendmail的问题。首先将所有sendmail进程kill掉,然后定时任务可以执行了。一段时间后,重新查看进程,发现又有了一些sendmail进程,进一步定位问题。
/usr/sbin/sendmail -FCronDaemon -i -odi -oem -oi -t -f root
4、通过pstree发现,sendmail进程是有crond守护进程启动的。crontab怎么会启动sendmail进程?原来crond在执行脚本时会将脚本输出信息以邮件的形式发送给crond用户,但是sendmail进程堆积的原因是什么呢?
init───2*[bash]
├─crond──102*[crond─┬─sendmail]
│ └─sh───sh]
5、查看sendmail日志,发现大量的warning告警信息。经查原来是环境的postfix没有正常运行,导致大量sendmail进程阻塞。
postfix/postdrop[23110]: warning: mail_queue_enter: create file maildrop/749274.23110: No such file or directory
6、根据博文[1]中的方法,将crontab的第一行添加:MAILTO=””,然后查看确实没有了sendmail进程。
本以为解决了问题,但是过了几天发现系统负载升高,同样的方式查看,发现有了大量的postdrop进程,pstree发现发生了变化,原来postdrop进程是sendmail进程产生的,也就是说sendmail并没有完全解决掉。
init───2*[bash]
|-crond---125*[crond---sendmail---postdrop]
│ │ └─sh───sh]
7、查看sendmail日志(/var/log/maillog),发现大量的warning告警信息,错误显示是权限问题,那么首先查看maildrop目录的权限(/var/spool/postfix/maildrop/),修改权限后,查看没有了该warning信息。
告警信息如下:
postfix/postdrop[21235]: warning: mail_queue_enter: create file maildrop/577217.21235: Permission denied
执行命令如下:
chown postfix.postdrop /var/spool/postfix/public -R
chown postfix.postdrop /var/spool/postfix/maildrop -R
chmod 777 /var/spool/postfix/maildrop -R (仅修改以上两步时,仍然有告警。)
8、基于稳妥考虑,将/etc/crontab的MAILTO设为"",这样保证crontab不发送日志,也就不会产生sendmail进程了。
9、通过pstree检查进程树状态,crond守护进程不会调用sendmail了,具体如下所示:
init───2*[bash]
├─crond
除此之外,在查看sendmail日志的时候,发现以下告警信息较多,应该是系统设置上有些问题。经查是由于/etc/postfix/main.cf配置文件中,inet_protocols = all的原因。修改配置为inet_protocols = ipv4后,warning信息没有了。
postfix/postdrop[17405]: warning: inet_protocols: IPv6 support is disabled: Address family not supported by protocol
postfix/postdrop[17405]: warning: inet_protocols: configuring for IPv4 support only