shell sed 命令操作手册

发布时间：2014-09-05 16:33:11作者：知识屋

author:润明2012-2-15 QQ:226399587
shell sed 手册
Sed 命令列可分成编辑指令与文件档部份。其中, 编辑指令负责控制所有的编辑工作; 文件档表示所处理的档案。sed 的编辑指令均由位址(address)与函数(function)两部份组成, 其中, 在执行时, sed 利用它的位址参数来决定编辑的对象;而用它的函数参数(解[3])编辑。此外, sed 编辑指令, 除了可在命令列上执行, 也可在档案内执行。其中差别只是在命令列上执行时, 其前必须加上选项-e ; 而在档案(解[4])内时, 则只需在其档名前加上选项-f。另外 , sed 执行编辑指令是依照它们在命令列上或档内的次序。
下面各节, 将介绍执行命令列上的编辑指令、sed 编辑指令、执行档案内的编辑指令、执行多个档案的编辑、及执行sed 输出控制。
2.1 执行命令列上的编辑指令
2.2 sed 编辑指令
2.3 执行档案内的编辑指令
2.4 执行多个档案的编辑
2.5 执行sed 输出控制
2.1.执行命令列上的编辑指令
当编辑指令(参照[section 2.2])在命令列上执行时, 其前必须加上选项-e 。其命令格式如下:
sed -e '编辑指令1' -e '编辑指令2' ... 文件档
其中, 所有编辑指令都紧接在选项-e 之後, 并置於两个" ' " 特殊字元间。另外, 命令上编辑指令的执行是由左而右。
一般编辑指令不多时, 使用者通常直接在命令上执行它们。例如, 删除yel.dat 内1 至10 行资料, 并将其馀文字中的"yellow" 字串改成"black" 字串。此时, 可将编辑指令直接在命令上执行, 其命令如下:
sed -e '1,10d' -e 's/yellow/black/g' yel.dat
在命令中, 编辑指令'1,10d'(解[5])执行删除1 至10 行资料; 编辑指令's/yellow/black/g'(解[6]) , "yellow" 字串替换(substuite)成"black" 字串。
2.2 sed 的编辑指令
sed 编辑指令的格式如下:
[address1[,address2]]function[argument]
其中, 位址参数address1 、address2 为行数或regular expression 字串, 表示所执行编辑的资料行 ; 函数参数function[argument] 为sed 的内定函数, 表示执行的编辑动作。下面两小节, 将仔细介绍位址参数的表示法与有哪些函数参数供选择。
2.2.1 位址(address)参数的表示法
实际上, 位址参数表示法只是将要编辑的资料行, 用它们的行数或其中的字串来代替表示它们。下面举几个例子说明(指令都以函数参数d(参照[section4.2]) 为例) :
删除档内第10 行资料, 则指令为10d。
删除含有"man" 字串的资料行时, 则指令为/man/d。
删除档内第10 行到第200 行资料, 则指令为10,200d。
删除档内第10 行到含"man" 字串的资料行, 则指令为10,/man/d。
接下来, 以位址参数的内容与其个数两点, 完整说明指令中位址参数的表示法(同样也以函数参数d 为例)。
位址参数的内容: 位址为十进位数字: 此数字表示行数。当指令执行时, 将对符合此行数的资料执行函数参数指示的编辑动作。例如,
删除资料档中的第15 行资料, 则指令为15d(参照[section4.2])。其馀类推,如删除资料档中的第m 行资料, 则指令为md 。
位址为regular expression(参照[附录A]): 当资料行中有符合regular expression 所表示的字串时, 则执行函数参数指示的编辑动作。另外, 在regular expression 前後必须加上"/"。例如指令为/t.*t/d , 表示删除所有含两"t" 字母的资料行。其中, "." 表示任意字元; "*" 表示其前字元可重任意次, 它们结合".*" 表示两"t" 字母间的任意字串。
位址参数的个数: 在指令中, 当没有位址参数时, 表示全部资料行执行函数参数所指示的编辑动作; 当只有一位址参数时, 表示只有符合位址的资料行才编辑; 当有两个位址参数, 如address1,address2 时, 表示对资料区执行编辑, address1 代表起始资料行, address2 代表结束资料行。对於上述内容, 以下面例子做具说明。
例如指令为d 其表示删除档内所有资料行。
例如指令为5d 其表示删除档内第五行资料。
例如指令为1,/apple/d 其表示删除资料区, 由档内第一行至内有"apple" 字串的资料行。
例如指令为/apple/,/orange/d 其表示删除资料区, 由档内含有"apple" 字串至含有"orange" 字串的资料行
2.2.2 有那些函数(function)参数
下页表中介绍所有sed 的函数参数(参照[chapter 4])的功能。
函数参数功能: label 建立script file 内指令互相参考的位置。
# 建立解
{ } 集合有相同位址参数的指令。
! 不执行函数参数。
= 印出资料行数( line number )。
a 添加使用者输入的资料。
b label 将执行的指令跳至由: 建立的参考位置。
c 以使用者输入的资料取代资料。
d 删除资料。
D 删除pattern space 内第一个newline 字母前的资料。
g 拷贝资料从hold space。
G 添加资料从hold space 至pattern space 。
h 拷贝资料从pattern space 至hold space 。
H 添加资料从pattern space 至hold space 。
l 印出l 资料中的nonprinting character 用ASCII 码。
i 插入添加使用者输入的资料行。
n 读入下一笔资料。
N 添加下一笔资料到pattern space。
p 印出资料。
P 印出pattern space 内第一个newline 字母前的资料。
q 跳出sed 编辑。
r 读入它档内容。
s 替换字串。
t label 先执行一替换的编辑指令, 如果替换成牛p>则将编辑指令跳至: label 处执行。
w 写资料到它档内。
x 交换hold space 与pattern space 内容。
y 转换(transform)字元。
虽然, sed 只有上表所述几个拥有基本编辑功能的函数, 但由指令中位址参数和指令与指令间的配合, 也能使sed 完成大部份的编辑任务。
2.3 执行档案内的编辑指令
当执行的指令太多, 在命令列上撰写起来十分混乱, 此时, 可将这些指令整理储存在档案(譬如档名为script_file )内, 用选项-f script_file , 则让sed 执行script_file 内的编辑指令。其命令的格示如下:
sed -f script_file 文件档
其中, 执行script_file 内编辑指令的顺序是由上而下。例如上一节的例子, 其可改成如下命令: sed -f ysb.scr yel.dat
其中, ysb.scr 档的内容如下:
1,10d
s/yellow/black/g
另外, 在命令列上可混合使用选项-e 与-f , sed 执行指令顺序依然是由命令列的左到右, 如执行至-f 後档案内的指令, 则由上而下执行。
2.4 执行多个文件档的编辑
在sed 命令列上, 一次可执行编辑多个文件档, 它们跟在编辑指令之後。例如, 替换white.dat、red.dat、black.dat 档内的"yellow" 字串成"blue" , 其命令如下:
sed -e 's/yellow/blue/g' white.dat red.dat black.dat
上述命令执行时, sed 依white.dat、red.dat、black.dat 顺序, 执行编辑指令s/yellow/blue/(请参照[section 4.1] , 进行字串的替换。
2.5.执行输出的控制
在命令列上的选项-n (解[7]) 表示输出由编辑指令控制。由前章内容得知, sed 会"自动的" 将资料由pattern space 输送到标准输出档。但藉着选项-n , 可将sed 这"自动的" 的动作改成"被动的" 由它所执行的编辑指令(解[8])来决定结果是否输出。
由上述可知, 选项-n 必须与编辑指令一起配合, 否则无法获得结果。例如, 印出white.dat 档内含有"white" 字串的资料行, 其命令如下:
sed -n -e '/white/p' white.dat
上面命令中, 选项-n 与编辑指令/white/p (参照[section4.6]) 一起配合控制输出。其中, 选项-n 将输出控制权移给编辑指令;/white/p 将资料行中含有"white" 字串印出萤幕。
SED 手册- 3.例
http://phi.sinica.edu.tw aspac@phi.sinica.edu.tw (2001-07-29 13:05:00)

一般在实际使用编辑器的过程中, 常需要执行替换文件中的字串、搬移、删除、与搜寻资料行等等动作。当然, 一般交谈式编辑器(如vi、emacs)都能做得到上述功能, 但文件一旦有大量上述编辑需求时, 则用它们编辑十分没有效率。本章将用举例的方式说明如何用sed 自动执行这些编辑功能。此外, 在本章例中, 均以下述方式描述文件的需求:
将文件中...资料, 执行...(动作)
如此, 目的是为了能将它们迅速的转成编辑指令。其中, " ...资料" 部份, 转成指令中的位址参数表示; "执行...动作" 部份, 则转成函数参数表示。另外, 当"执行...动作" 要由数个函数参数表示时, 则可利用"{ "与" }" 集合这些函数参数(解[9]) , 其指令形式如下:
位址参数{
函数参数1
函数参数2
函数参数3
.
:
}
上述指令表示, 将对符合位址参数的资料, 依次执行函数参数1、函数参数2、函数参数3 ... 表示的动作。
下面各节, 分别举例说明sed 替换资料、移动、删除资料、及搜寻资料的命令。
3.1 替换文件中的资料
3.2 搬动文件中的资料
3.3 删除文件中的资料
3.4 搜寻文件中的资料
3.1 替换文件中的资料
Sed 可替换文件中的字串、资料行、甚至资料区。其中, 表示替换字串的指令中的函数参数为s(参照[section4.1]); 表示替换资料行、或资料区的指令中的函数参数为c(参照[section4.5])。上述情况以下面三个例子说明。上述情况以下面三个例子说明。
例一. 将文件中含"machine" 字串的资料行中的"phi" 字串, 替换成为"beta" 字串。其命令列如下:
sed -e '/machine/s/phi/beta/g' input.dat(以後文件档都以input.dat 代表)
例二. 将文件中第5 行资料, 替换成句子"Those who in quarrels interpose, must often wipe a bloody nose."。
其命令列如下
sed -e '5c
Those must often wipe a bloody nose.
' input.dat
例三. 将文件中1 至100 行的资料区, 替换成如下两行资料:
How are you?
data be deleted!
则其命令列如下
sed -e '1,100c
How are you?
data be deleted!
' input.dat
3.2 搬动文件中的资料
使用者可用sed 中的hold space 暂存编辑中的资料、用函数参数w(参照[section4.9])将文件资料搬动到它档内储存、或用函数参数r(参照[section4.8])将它档内容搬到文件内。Hold space 是sed 用来暂存pattern space 内资料的暂存器, 当sed 执行函数参数h、H(参照[section4.19])时, 会将pattern space 资料暂存到hold space;当执行函数参数x、g、G(参照[section4.22])时, 会将暂存的资料取到pattern space 。下面举三个例子说明。
例一. 将文件中的前100 资料, 搬到文件中第300 後输出。其命令列如下:
sed -f mov.scr 文件档
mov.scr 档的内容为
1,100{
H
d
}
300G
其中,
1,100{
H
d
}
它表示将文件中的前100 资料, 先储存(参照[section4.19])在hold space 之後删除;指令300G (参照[section4.22]) 表示, 将hold space 内的资料, 添加在文件中的第300 资料後输出。
例二. 将文件中含"phi" 字串的资料行, 搬至mach.inf 档中储存。其命令列如下:
sed -e '/phi/w mach.inf' 文件档
例三. 将mach.inf 档内容, 搬至文件中含"beta" 字串的资料行。其命令列如下:
sed -e '/beta/r mach.inf' 文件档
另外, 由於sed 是一stream(参照[section1.4])编辑器, 故理论上输出後的文件资料不可能再搬回来编辑。
3.3 删除文件中的资料
因为sed 是一行编辑器, 所以sed 很容易删除个别资料行或整个资料区。一般用函数参数d(参照[section4.2])或D(参照[section4.17]) 来表示。下面举两个例子说明。
将文件内所有空白行全部删除。其命令列为
sed -e '/^$/d' 文件档
regular expression(解[附录A]) , ^$ 表示空白行。其中, ^ 限制其後字串必须在行首; $ 限制其前字串必须在行尾。
将文件内连续的空白行, 删除它们成为一行。其命令列为
sed -e '/^$/{
N
/^$/D
}' 文件档
其中, 函数参数N(参照[section4.16])表示, 将空白行的下一行资料添加至pattern space 内。函数参数/^$/D 表示, 当添加的是空白行时, 删除第一行空白行, 而且剩下的空白行则再重新执行指令一次。指令重新执行一次, 删除一行空白行, 如此反覆直至空白行後添加的为非空白行为止, 故连续的空白行最後只剩一空白行被输出。
3.4 搜寻文件中的资料
Sed 可以执行类似UNIX 命令grep 的功能。理论上, 可用regular expression(参照[附录A])。例如, 将文件中含有"gamma" 字串的资料行输出。则其命令列如下:
sed -n -e '/gamma/p' 文件档但是, sed 是行编辑器, 它的搜寻基本上是以一行为单位。因此, 当一些字串因换行而被拆成两部份时, 一般的方法即不可行。此时, 就必须以合两行的方式来搜寻这些资料。其情况如下面例子:
例. 将文件中含"omega" 字串的资料输出。其命令列如下
sed -f gp.scr 文件档
gp.scr 档的内容如下:
/omega/b
N
h
s/.* //
/omega/b
g
D
在上述sed script(解[10]), 因藉着函数参数b 形成类似C 语言中的case statement 结构, 使得sed 可分别处理当资料内含"omega" 字串; 当"omega" 字串被拆成两行; 以及资料内没有"omega" 字串的情况。接下来就依上述的三种情况, 将sed script 分成下面三部份来讨论。当资料内含"omega" , 则执行编辑指令
/omega/b
它表示当资料内含"omega" 字串时, sed 不用再对它执行後面的指令, 而直接将它输出。当资料内没有"omega" , 则执行编辑指令如下
N
h
s/.* //
/omega/b
其中, 函数参数N(参照[section 4.16]) , 它表示将下一行资料读入使得pattern space 内含前後两行资料。函数参数h(参照[section 4.19]) , 它表示将pattern space 内的前後两行资料存入hold space 。函数参数s/.* // , 它表示将pattern space 内的前後两行资料合(解[11])成一行。/omega/b , 它表示如果合後的资料内含"omega" 字串, 则不用再执行它之後的指令, 而将此资料自动输出;
当合後的资料依旧不含"omega" , 则执行编辑指令如下
g
D

其中, 函数参数g(参照[section4.21]) , 它表示将hold space 内合前的两行资料放回pattern space。函数参数D(参照[section4.17]) , 它表示删除两行资料中的第一行资料, 并让剩下的那行资料, 重新执行sed script。如此, 无论的资料行内或行间的字串才可搜寻完全。
SED 手册- 4.介绍函数参数
http://phi.sinica.edu.tw aspac@phi.sinica.edu.tw (2001-07-30 07:00:00)
本章将以一节一个函数参数的方式,介绍所有sed 提供的函数参数, 其中有
| s | d | a | i | c | p | l | r | w | y | ! | n | q | = | # | N | D | P | h | H | g | G | x | b | t |
另外, 在各节中, 首先简单介绍函数参数功能, 接着说明函数参数与位址参数配合的格式, 而其中也一描述sed 执行此函数参数的工作情形。
4.1 s
函数参数s 表示替换(substitute)文件内字串。其指令格式如下:
[address1[ ,address2]] s/pattern/replacemen/[flag]
对上述格式有下面几点说明:
函数参数s 最多与两个位址参数配合。关於"s/pattern/replacement/[flag]"(解[12]) 有下面几点说明:
pattern : 它为reguler expression 字串。它表示文件中要被替换的字串。
replacement : 它为一般字串。但其内出现下列字元有特别意义:
& : 代表其前pattern 字串。例如
sed -e 's/test/& my car/' 资料档名
指令中, & 代表pattern 字串"test"。故执行後, 资料档的"test" 被替换成"test my car"。
: 代表pattern 中被第n 个( 、)(参照[附录A]) 所括起来的字串。例如
sed -e 's/(test) (my) (car)/[2 3 1]/' 资料档名
指令中, 1 表示"test"、2 表示"my"、1 表示"car" 字串。故执行後, 资料档的"test my car" 被替换成"[my car test]"。
: 可用它来还原一些特殊符号(如上述的& 与)本身字面上的意义, 或用它来代表换行。
flag : 主要用它来控制一些替换情况:
当flag 为g 时, 代表替换所有符合(match)的字串。
当flag 为十进位数字m 时, 代表替换行内第m 个符合的字串。
当flag 为p 时, 代表替换第一个符合pattern 的字串後, 将资料输出标准输出档。
当flag 为w wfile 时, 代表替换第一个符合pattern 的字串後, 输出到wfile 档内(如果wfile 不存在, 则会重新开启名为wfile 的档案)。
当没有flag 时, 则将资料行内第一个符合pattern 的字串以replacement 字串来替换。
delimiter : 在"/pattern/replace/[flag] " 中"/" 被当成一delimiter。除了空白(blank)、换行(newline) 之外,
使用者可用任何字元作为delimiter。例如下述编辑指令
s#/usr#/usr1#g

上述命令中verb|#| 为delimiter。如果用"/" 做delimiter , 则sed 会将pattern 与replacement 中的"/" 当成delimiter 而发生错误。
例:
题目: 替换 input.dat 档(後面如果没有特别指定, 均假设文件档名为input.dat)内"1996" 字串成"1997" , 同时将这些资料行存入year97.dat 档内。
说明: 用函数参数s 指示sed 将"1996" 字串替换成"1997" , 另外用s argument 中的flag w 指示sed 将替换过的资料行存入year97.dat 档内。
sed 命令列:
sed -e 's/1996/1997/w year97.dat' input.dat
4.2 d
函数参数d 表示删除资料行, 其指令格式如下:
[address1[ ,address2]] d
对上述格式有下面几点说明:
函数参数d 最多与两个位址参数配合。
sed 执行删除动作情况如下:
将pattern space 内符合位址参数的资料删除。
将下一笔资料读进pattern space 。
重新执行sed script。
例: 可参考section 3.3。
4.3 a
函数参数a 表示将资料添加到文件中。其指令格式如下:
[address1] a 使用者所输入的资料
对上述格式有下面几点说明:
函数参数a 最多与一个位址参数配合。
函数参数a 紧接着"" 字元用来表示此行结束, 使用者所输入的资料必须从下一行输入。如果资料超过一行, 则须在每行的结尾加入""。
sed 执行添加动作情况如下: 当pattern space 内资料输出後, sed 跟着输出使用者所输入的资料。
例: 题目: 添加"多工作业系统" 在含"UNIX" 字串的资料行後。假设input.dat 档的内容如下:
UNIX
说明: 用函数参数a 将所输入的资料添加在含"UNIX" 字串的资料行後。
sed 命令列如下:
sed -e '/UNIX/a
多工作业系统
' input.dat
执行上述命令後, 其输出结果如下:
UNIX
多工作业系统
4.4 i
函数参数i 表示将资料插入文件中。其指令格式如下:
[address1] i 使用者所输入的资料
对上述格式有下面几点说明:
函数参数i 最多与一个位址参数配合。
函数参数i 紧接着"" 字元用来表示此行结束, 使用者所输入的资料必须从下一行输入。如果资料超过一行, 则须在每行的结尾加入""。
sed 执行插入动作的情况如下: 在pattern space 内资料输出前, sed 先输出使用者所输入的资料。
例: 题目: 将"文章版权属於中央研究院" 插在input.dat 档中含"院长: 李远哲" 的资料行之前。假设input.dat 档内容如下:
院长: 李远哲
说明: 用函数参数i 将资料行"文章版权属於中央研究院" 插在含"院长: 李远哲" 的资料行之前。
sed 命令列如下:
sed -e '/院长: 李远哲/i
文章版权属於中央研究院
' input.dat
执行上述命令後的输出如下:
文章版权属於中央研究院
院长: 李远哲
4.5 c
函数参数c 表示改变文件中的资料。其格式如下:
[address1[ ,address2]]c 使用者所输入的资料
对上述格式有下面几点说明:
函数参数c 最多与两个位址参数配合。
函数参数c 紧接着"" 字元用来表示此行结束, 使用者所输入的资料必须从下一行输入。如果资料超过一行, 则须在每行的结尾加入""。
sed 执行改变动作的情况: 在pattern space 内资料输出时, sed 改变它成为使用者所输入的资料。
例: 参考section 3.1 之例二、三。
4.6 p
函数参数p 表示印出资料。其指令格式如下:
[address1[ , address2]] p
对於上述格式有下面几点说明:
函数参数p 最多与两个位址参数配合。
sed 执行印出动作的情况如下: sed 拷备一份pattern space 内容至标准输出档。
例: 参考section 3.4 开头的内容。
4.7 l
函数参数l , 除可将资料中的nonprinting character 以ASCII码列出外, 其於均与函数参数p 相同。例如, 将下面input.dat 档中的^[ 以ASCII 码印出
The Great ^[ is a movie starring Steve McQueen.

执行命令sed -e 'l' input.dat 後, 则输出结果如下:
The Great

（免责声明：文章内容如涉及作品内容、版权和其它问题，请及时与我们联系，我们将在第一时间删除内容，文章内容仅供参考）