Linux前后台作业切换及脱机管理
Linux bash shell单一终端界面下,我们经常需要管理或同时完成多个作业,如一边执行编译,一边实现数据备份,以及执行SQL查询等其他的任务。所有的上述的这些工作我们可以在一个bash内实现,也就是说在同一个终端窗口完成。下面主要描述了Linux下前后台作业切换与管理以及作业在脱机的情形下如何管理。
1、前后台作业的定义
前后台作业实际上对应的也就是前后台进程,因此也就有对应的pid。在这里我们统称为作业。
无论是前台作业还是后台作业,两者都来自当前的shell,是当前shell的子程序。
下面是两者的定义。
前台作业:可以由用户参与交互及控制的作业我们称之为前台作业。
后台作业:在内存可以自运行的作业,用户无法参与交互以及使用[ctrl]+c来终止,只能通过bg或fg来调用该作业。
2、几个常用的作业命令
a、command & 直接让作业进入后台运行
b、[ctrl]+z 将当前作业切换到后台
c、jobs 查看后台作业状态
d、fg %n 让后台运行的作业n切换到前台来
d、bg %n 让指定的作业n在后台运行
e、kill %n 移除指定的作业n
"n" 为jobs命令查看到的job编号,不是进程id。
每一个job会有一个对应的job编号,编号在当前的终端从1开始分配。
job 编号的使用样式为[n],后面可能会跟有 "+" 号或者 "-" 号,或者什么也不跟。
"+" 号表示最近的一个job,"-" 号表示倒数第二个被执行的Job。注,"+" 号与 "-" 号会随着作业的完成或添加而动态发生变化。
通过jobs方式来管理作业,当前终端的作业在其他终端不可见。
3、演示后台作业命令
[python]
a、直接将作业放入到后台(附加 & 符号)
robin@SZDB:/tmp> tar -czvf temp.tar.gz tempSYBO2SZ.dbf &
[1] 12500
robin@SZDB:/tmp> tempSYBO2SZ.dbf
robin@SZDB:/tmp> #此时可进行其它操作,作业一旦完成,会弹出如下的提示
[1]+ Done tar -czvf temp.tar.gz tempSYBO2SZ.dbf
robin@SZDB:/tmp> ls -hltr temp*
-rwxr-xr-x 1 robin oinstall 490M 2013-05-02 17:48 tempSYBO2SZ.dbf
-rw-r--r-- 1 robin oinstall 174M 2013-05-02 17:50 temp.tar.gz
b、已经开始执行,但需要放入后台(使用[ctrl]+z)
robin@SZDB:/tmp> tar -czvf temp2.tar.gz tempSYBO2SZ.dbf
tempSYBO2SZ.dbf
[1]+ Stopped tar -czvf temp2.tar.gz tempSYBO2SZ.dbf
robin@SZDB:/tmp> jobs
[1]+ Stopped tar -czvf temp2.tar.gz tempSYBO2SZ.dbf
#下面同时发布两个作业,并且在中途按下[ctrl]+z以便将当前作业提交到后台
robin@SZDB:/tmp> find /u02 -type f -size +100000k
robin@SZDB:/tmp> find / -type f -size +100000k
#再次查看当前的jobs时,jobs管理器里出现了3个处于stopp状态的job
robin@SZDB:/tmp> jobs
[1] Stopped tar -czvf temp2.tar.gz tempSYBO2SZ.dbf
[2]- Stopped find / -type f -size +100000k
[3]+ Stopped find /u02 -type f -size +100000k
robin@SZDB:/tmp> jobs -l #使用-l参数查看当前shell下所有的作业以及对应的job number,进程pid
[1] 32682 Stopped tar -czvf temp2.tar.gz tempSYBO2SZ.dbf
[2]- 32687 Stopped find /u02 -type f -size +100000k
[3]+ 32707 Stopped find / -type f -size +100000k
#下面通过pid可以查看到对应的进程信息
robin@SZDB:/tmp> ps -ef | grep 32707 | grep -v grep
robin 32707 32095 0 09:48 pts/1 00:00:00 find / -type f -size +100000
robin@SZDB:/tmp> tty #当前终端的信息为pts/1
/dev/pts/1
#打开另外一个终端
robin@SZDB:~> tty
/dev/pts/3
robin@SZDB:~> jobs #此时可以看到jobs命令无任何返回
robin@SZDB:~> ps -ef | grep 32707 | grep -v grep #仅仅根据进程id可以找到对应的作业
robin 32707 32095 0 09:48 pts/1 00:00:00 find / -type f -size +100000
#由上可知,对于当前shell下的jobs,仅当前shell(终端)可见
c、将后台作业切换到前台(fg命令)
robin@SZDB:/tmp> fg #省略Job number的情形,则将缺省的job切换到前台
find / -type f -size +100000k
/u02/database/old/CNMMBOBK/undo/undotbsCNMMBOBK.dbf
......
[ctrl]+z
robin@SZDB:/tmp> fg %1
tar -czvf temp2.tar.gz tempSYBO2SZ.dbf
robin@SZDB:/tmp> jobs
[2]- Stopped find /u02 -type f -size +100000k
[3]+ Stopped find / -type f -size +100000k
d、运行后台中暂停的作业(bg命令)
#前面有2个job处于stopped状态,现在我们让其在后台运行,直接输入bg命令则缺省的job继续运行,否则输入job编号,运行指定的job
robin@SZDB:/tmp> bg 2 #输入bg 2之后,可以看到原来的命令后被追加了&
[2]- find /u02 -type f -size +100000k &
robin@SZDB:/tmp> jobs
[2]- Running find /u02 -type f -size +100000k &
[3]+ Stopped find / -type f -size +100000k
e、移除指定的作业n(kill)
robin@SZDB:/tmp> jobs
[3]+ Stopped find / -type f -size +100000k
robin@SZDB:/tmp> kill -9 %3 #强制终止job 3,注意,此处的%不可省略
robin@SZDB:/tmp> jobs
[3]+ Killed find / -type f -size +100000k
robin@SZDB:/tmp> jobs
#kill -9 表明强制终止指定的Job,-15则表明是正常终止指定的job。 kill -l 则列出kill能够使用的所有信号
#对于上述命令的详细帮助,使用 man command来获取帮助信息
f、带参shell脚本的后台处理
#下面是一个测试用的shell脚本
robin@SZDB:~/dba_scripts/custom/bin> more echo_time.sh
#!/bin/bash
SID=$1
sqlplus -S scott/tiger@$1 <<EOF
select to_char(sysdate,'yyyy-mm-dd hh24:mi:ss') today from dual;
begin
dbms_lock.sleep(300);
end;
/
select to_char(sysdate,'yyyy-mm-dd hh24:mi:ss') today from dual;
exit;
EOF
exit
#直接执行带参的shell脚本
robin@SZDB:~/dba_scripts/custom/bin> ./echo_time.sh CNMMBO
TODAY
-------------------
2013-05-03 11:07:48
[1]+ Stopped ./echo_time.sh CNMMBO #按下[ctrl]+z将其切换到后台
robin@SZDB:~/dba_scripts/custom/bin> jobs
[1]+ Stopped ./echo_time.sh CNMMBO
robin@SZDB:~/dba_scripts/custom/bin> kill -9 %1 #强制终止该job
[1]+ Stopped ./echo_time.sh CNMMBO
robin@SZDB:~/dba_scripts/custom/bin> jobs #此时该job已经被标记为killed
[1]+ Killed ./echo_time.sh CNMMBO
robin@SZDB:~/dba_scripts/custom/bin> ./echo_time.sh CNMMBO & #将shell脚本参数之后跟 &符号即将job放入到后台
[1] 2233
robin@SZDB:~/dba_scripts/custom/bin> #此时依旧可以看到有输出,但可以继续后续操作
TODAY
-------------------
2013-05-03 11:08:25
robin@SZDB:~/dba_scripts/custom/bin> jobs
[1]+ Running ./echo_time.sh CNMMBO &
robin@SZDB:~/dba_scripts/custom/bin> ./echo_time.sh CNMMBO >temp.log 2>&1 & #最佳的办法是直接将其输出到日志文件
[2] 2256
robin@SZDB:~/dba_scripts/custom/bin> jobs
[1]- Running ./echo_time.sh CNMMBO &
[2]+ Running ./echo_time.sh CNMMBO >temp.log 2>&1 &
#下面来查看日志,日志中的两次查询正好相差5分钟
robin@SZDB:~/dba_scripts/custom/bin> more temp.log
TODAY
-------------------
2013-05-03 11:09:24
PL/SQL procedure successfully completed.
TODAY
-------------------
2013-05-03 11:14:24
4、作业脱机管理
[python]
将作业(进程)切换到后台可以避免由于误操作如[ctrl]+c等导致的job被异常中断的情形,而脱机管理主要是针对终端异常断开的情形。
通常使用nohup命令来使得脱机或注销之后,Job依旧可以继续运行。也就是说nohup忽略所有挂断(SIGHUP)信号。
如果该方式命令之后未指定&符号,则job位于前台,指定&符号,则job位于后台。
#下面是使用nohup的示例,可以省略日志的输出,因为原job的输出会自动被nohup重定向到缺省的nohup.out日志文件
robin@SZDB:~/dba_scripts/custom/bin> nohup ./echo_time.sh CNMMBO
nohup: appending output to `nohup.out'
#直接断开终端,并重新连接一个新的终端窗口
robin@SZDB:~/dba_scripts/custom/bin> jobs #由于是一个新的终端,所以jobs无法看到任何作业
robin@SZDB:~/dba_scripts/custom/bin> ps -ef | grep echo_time.sh
robin 2623 1 0 11:26 ? 00:00:00 /bin/bash ./echo_time.sh CNMMBO
robin@SZDB:~/dba_scripts/custom/bin> more nohup.out #其输出的日志可以看到job被成功完成
TODAY
-------------------
2013-05-03 11:26:32
PL/SQL procedure successfully completed.
TODAY
-------------------
2013-05-03 11:31:32
#下面使用nohup方式且将Job放入后台处理,同时指定了日志文件,则nohup使用指定的日志文件,而不会输出到缺省的nohup.out
robin@SZDB:~/dba_scripts/custom/bin> nohup ./echo_time.sh CNMMBO >temp2.log 2>&1 &
[1] 3019
robin@SZDB:~/dba_scripts/custom/bin> jobs
[1]+ Running nohup ./echo_time.sh CNMMBO >temp2.log 2>&1 &