find/pg/grep/sed/awk命令简析

发布时间：2014-09-05 16:17:32作者：知识屋

Java代码

【【【find 介绍】】】

find pathname -options [-print -exec -ok ...]

-print： find命令将匹配的文件输出到标准输出。

当前目录下查找文件权限位为 7 5 5的文件

$ find . -perm 755 -print

当前目录及子目录中查找文件名以一个大写字母开头的文件

$ find . -name "[A-Z]*"

希望在系统根目录下查找更改时间在 5日以内的文件

$ find / -mtime -5 -print

为了在/var/adm目录下查找更改时间在 3日以前的文件

$ find /var/adm -mtime +3 -print

查找除目录以外的所有类型的文件,可以用:

$ find . ! -type d www.zhishiwu.com

【b-块设备文件；d-目录；c-字符设备文件；p-管道文件；l-符号链接文件；f-普通文件】

当前目录下查找文件长度大于 4K 字节的文件,可以用:

$ find . -size +4000c

find命令从文件系统的根目录开始,查找一个名为 CON.FILE的文件。

它将首先匹配所有的文件然后再进入子目录中查找

$ find / -name "CON.FILE" -depth

当匹配到一些文件以后,可能希望对其进行某些操作：

查找更改时间在 5日以前的文件并删除它们

find / -type f -mtime +5 -exec rm {} /;

exec选项后面跟随着所要执行的命令,然后是一对儿 { },一个空格和一个 /,最后是一个分号

为了查找系统中所有文件长度为 0的普通文件,并列出它们的完整路径,可以用:

$ find / -type f -size 0 -exec ls -l {} /;

日志文件名的最后含有数字,这样我们一眼就可以看出哪个文件是最新的,哪个是最旧的。

Admin.log 文件编上了序号:admin.log.001.admin.log.002等等。

下面的find命令将删除 /logs目录中访问时间在 7日以前、

含有数字后缀的 admin.log文件。该命令只检查三位数字,所以相应日志文件的后缀不要超过999。

$ find /logs -name 'admin.log[0-9][0-9][0-9] e +7 -exec rm {} /;

查找当前文件系统中的所有目录并排序,可以用:

$ find . -type d -print -mount |sort

为了查找系统中所有的 rmt磁带设备,可以用:

$ find /dev/rmt

【【【pg 介绍】】】--page

pg [option] filename

分页显示指定文件的内容。在显示一页文件时，最后一行将显示等待用户输入指令

[option]：可输入的指令有如下选项。

h this screen

q or Q quit program

<newline> next page

f skip a page forward

d or ^D next halfpage

l next line

$ last page

/regex/ search forward for regex

?regex? or ^regex^ search backward for regex

. or ^L redraw screen

w or z set page size and go to next page

s filename save current file to filename

!command shell escape www.zhishiwu.com

p go to previous file

n go to next file

注释：当pg命令显示到文件的末尾时，显示一个文件结束信息EOF(end of file)。

例如：% pg filename

【【【grep 介绍】】】

grep [keyword] [options] filename

[options]主要参数：

－c：只输出匹配行的计数。

－i：不区分大小写(只适用于单字符)。

－h：查询多文件时不显示文件名。

－l：查询多文件时只输出包含匹配字符的文件名。

－n：显示匹配行及行号。

－s：不显示不存在或无匹配文本的错误信息。屏蔽错误！

－v：显示不包含匹配文本的所有行。排除！

pattern正则表达式主要参数：

/：忽略正则表达式中特殊字符的原有含义。

^：匹配正则表达式的开始行。

$: 匹配正则表达式的结束行。

/<：从匹配正则表达式的行开始。

/>：到匹配正则表达式的行结束。

[ ]：单个字符，如[A]即A符合要求。

[ - ]：范围，如[A-Z]，即A、B、C一直到Z都符合要求。

. ：所有的单个字符。

* ：有字符，长度可以为0。

【grep】和【sed】命令中,同时结合 {//}(以字符出现情况进行匹配的元字符)使用在【awk】语言中。

^ 只匹配行首---$ ls -l |grep ^-

$ 只匹配行尾---$ ls -l |grep k$

* 只一个单字符后紧跟 *,匹配0个或多个此单字符

[] 只匹配 [ ]内字符。可以是一个单字符,也可以是字符序列。可以使用

表示[]内字符序列范围,如用 [1-5]代替[12345]

/ 只用来屏蔽一个元字符的特殊含义。因为有时在 s h e l l中一些元字符有

特殊含义。 /可以使其失去应有意义

. 只匹配任意单字符：【5,6字符为XC： ....XC....】

pattern/{n/} 只用来匹配前面 pattern出现次数。 n为次数

pattern/{n,/}m 只含义同上,但次数最少为 n www.zhishiwu.com

pattern/{n,m/} 只含义同上,但 pattern出现次数在 n与m之间

类等价的正则表达式类等价的正则表达式

[[:upper:]] [A-Z] [[:alnum:]] [0-9a-zA-Z]

[[:lower:]] [a-z] [[:space:]] 空格或tab键

[[:digit:]] [0-9] [[:alpha:]] [a-zA-Z]

在一个目录中查询不包含目录的所有文件：$ ls -l |grep '^[^d]'

********************************************************************************

【【【sed 介绍】】】Sed(Stream EDitor)为 UNIX 系统上提供将编辑工作自动化的编辑器

sed [-nefri] command 输入文本

1.使用sed命令行格式为:

sed [选项] sed命令输入文件

2.使用sed脚本文件格式为:

sed [选项] -f sed脚本文件输入文件

3.使用第一行具有 sed命令解释器的sed脚本文件,其格式为:

sed脚本文件 [选项] 输入文件

常用选项：

-n∶ 使用安静(silent)模式。在一般 sed 的用法中，所有来自 STDIN的资料一般都会被列出到萤幕上。

但如果加上 -n 参数后，则只有经过sed 特殊处理的那一行(或者动作)才会被列出来。

-e∶ 直接在指令列模式上进行sed的动作编辑；$ sed -e '1,5d' -e 's/test/check/' example

-f∶ 直接将 sed 的动作写在一个档案内， -f filename 则可以执行 filename 内的sed 动作；

-r∶ sed 的动作支援的是延伸型正规表示法的语法。(预设是基础正规表示法语法)

-i∶ 直接修改读取的档案内容，而不是由萤幕输出。

sed -e '编辑指令 1' -e '编辑指令 2' ... 文件档

替换标记：

g：表示行内全面替换。

p：表示打印行。

w：表示把行写入一个文件。w file

x：表示互换模板块中的文本和缓冲区中的文本。

y：表示把一个字符翻译为另外的字符（但是不用于正则表达式）

$ sed -e '/info/w tofile' fromfile

$ sed '1,3w wfile' rfile #写入文件wfile，屏幕显示rfile内容

常用命令：（command）

a--append ∶新增，a 的后面可以接字串，而这些字串会在新的一行出现(目前的下一行)～

c--change ∶改变，c 的后面可以接字串，这些字串可以取代 n1,n2 之间的行！

d--delete ∶删除，因为是删除啊，所以 d 后面通常不接任何咚咚；

i--insert ∶插入，i 的后面可以接字串，而这些字串会在新的一行出现(目前的上一行)；

p--print ∶列印，亦即将某个选择的资料印出。通常 p 会与参数 sed -n 一起运作～

s--substuite ∶替换，可以直接进行取代的工作哩！通常这个 s 的动作可以搭配正规表示法！例如 1,20s/old/new/g www.zhishiwu.com

$ sed '1,3a drink tea' file #第一行到第三行后增加字符串"drink tea"

$ sed '1,2c Hi' file #第一行到第二行代替为一行"Hi"

$ sed '2,$d' file #删除第二行到最后一行

$ sed -i '8,$i bye' file #在文件file中第八行到最后行每行间插入一行"bye"

$ sed -n '5,9p' file #在屏幕中显示出5到9行的内容（！没有<-n>时5～9行重复列出！）

$ sed -n '5,9！p' file #'!'取反

$ sed -e 's/test/& my car/' file #"test" 被替换成 "test my car"

$ sed -e 's/(test) (my) (car)/[2 3 1]/' file #

$ sed '/显示/s/info/信息/g' file1 file2 #文件中含“显示”的行中"info"替换为"信息"。

#若没有'g'，则只有每行的第一个'info'被替换为"信息"。

（紧跟着s命令的都被认为是新的分隔符）

$ sed -e '/^$/d' file #删除全部空行

$ sed -e 'y/abcdefghijklmnopqrstuvwxyz/ABCDEFGHIJKLMNOPQRSTUVWXYZ/' file #小写字母改成大写

$ sed -n -e 'n' -e 'p' file #输出偶数行

$ sed -n -e 'N' -e 'P' file #输出奇数行

$ sed -e '/日期/q' -e '1,3d' file #遇到有‘日期’的行则不再处理显示文件以后的内容

$ sed -n '=' file #只打印出行号

$ sed -e '=' file #行号+行内容

--------------------------------------------------

file：

12321##FDGH##45.12^M

00325##GJSD##32.56^M

02556##GFGF##98.52^M

1) 用一个空格替换所有的( ##)符号；

2) 删除起始域中最前面的 0(00)；

3) 删除行尾控制字符( ^M)；

$ sed 's/##/ /g' file

$ sed 's/^0*//g' file

$ sed 's//^M//g' file

$ sed -e 's/##/ /g' -e 's/^0*//g' -e 's//^M//g' file

----------------------------------------------------

********************************************************************************

【【【awk 介绍】】】

awk [-f separator] 'commands' input-file(s) www.zhishiwu.com

awk 'BEGIN{actions}{actions;actions……}……END{actions}' inputfile

**其中BEGIN{actions}和END{actions}是可选的！！BEGIN，END必须为大写！！！！

**如果不特别指明模式, awk总是匹配或打印行数

**实际动作在大括号 {}内指明

**如果不指明采取动作, awk将打印出所有浏览出来的记录

**浏览域标记为 $1,$2 . . . $n（用逗号分隔域）,所有域为：$0

**打印一个域或所有域,使用 print命令

$ awk '{print $1,$2,$3}' script.txt #不保存文件，屏幕显示输出结果

$ awk '{print $1,$2,$3}' script.txt>outfile.txt #保存到文件，屏幕不显示输出结果

$ awk '{print $0}' script|tee outfile.txt #保存到文件，屏幕显示输出结果

$ awk 'BEGIN{print "aa/tbb/n----------------"} {print $1"/t"$2} END{print"end of report"}' script.txt

&& AND:语句两边必须同时匹配为真。

|| OR :语句两边同时或其中一边匹配为真。

! 非 :求逆

~ 匹配正则表达式

!~ 不匹配正则表达式

$ awk '$2~/政法/{print $0}' script.txt

$ awk '$2~/政法学院/' script.txt

$ awk '$2=="政法学院" {print $0}' script.txt

$ awk '{if($2~/政法学院/)print $0}' script.txt

【awk内置变量】

ARGC --命令行参数个数

ARGV --命令行参数排列

ENVIRON --支持队列中系统环境变量的使用

FILENAME--awk浏览的文件名 www.zhishiwu.com

FNR --浏览文件的记录数

FS --设置输入域分隔符,等价于命令行 -F选项

NF --浏览记录的域个数

NR --已读的记录数

OFS --输出域分隔符

ORS --输出记录分隔符

RS --控制记录分隔符

【awk内置字符串函数】

gsub(r,s) 在整个$0中用s替代r----$ awk 'gsub(/1002/,1102){print $0}' file

gsub(r,s,t) 在整个t中用s替代r----$

index(s,t) 返回s中字符串t的第一位置----$ awk 'BEGIN {print index(hello,el)}' file

length(s) 返回s长度----$ awk '$1=="kk"{print length($1)" "$1}' file

match(s,r) 测试s是否包含匹配 r的字符串----$ awk 'BEGIN {print match("hello",/e/)}' file

split(s,a,fs) 在fs上将s分成序列a----$ awk 'BEGIN {print split("0461-3205-1656",array,"-")}' file

sprint(fmt,exp) 返回经fmt格式化后的 exp----$

sub(r,s) 用$0中最左边最长的子串代替 s----$ awk '$1=="kk" substr($1,1,5)' file

substr(s,p) 返回字符串 s中从p开始的后缀部分----$ awk 'BEGIN {print match("hello",/e/)}'

substr(s,p,n) 返回字符串 s中从p开始长度为 n的后缀部分----$

【awk中使用的屏蔽序列】

/b 退格键

/f 走纸换页

/n 新行

/r 回车键

/t tab键

/ddd 八进制值

/c 任意其他特殊字符,例如 //为反斜线符号

【awk printf修饰符】

- 左对齐 www.zhishiwu.com

Width 域的步长,用 0表示0步长

.prec 最大字符串长度,或小数点右边的位数

【awk printf格式】

%c ASCII字符---$ echo "65" |awk '{print "%c",$0}'

%d 整数---

%e 浮点数,科学记数法---

%f 浮点数,例如( 123.44)---

%g awk决定使用哪种浮点数转换 e或者f---

%o 八进制数---

%s 字符---

%x 十六进制数串---

作者 185800961

（免责声明：文章内容如涉及作品内容、版权和其它问题，请及时与我们联系，我们将在第一时间删除内容，文章内容仅供参考）

上一篇:linux下jdk的安装及配置

下一篇:Linux下手动设置HOST DNS IP

软件推荐

更多 >

游戏推荐

更多 >

精选栏目

手机游戏

手机软件

电脑软件

猜你喜欢

解谜传奇腾讯导航母婴二次元格斗闯关网贷借钱拍照摄像宫斗角色舞蹈卡牌手机美化彩票财经放置美食网易西游回合 3D 棋牌投注生活养成恋爱换装体育投屏运动系统旅游学习社交音乐直播角色扮演招聘视频三国理财休闲战斗街机冒险塔防不上征信

find/pg/grep/sed/awk命令简析

相关知识

软件推荐

游戏推荐

精选栏目

win10

YLMF—OS

Win—XP

windows8

linux

windows7

热门推荐

手机游戏

手机软件

电脑软件

猜你喜欢