awk-笔记

shixiaomu

浏览: 375670 次
性别:
来自: 北京

最近访客更多访客>>

haining128

choyajoy

jiedushi

lvite3mc

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

linux

正则表达式 F#

分类汇总:

| awk '{print $6}' | sort | uniq -c | sort -rn

awk 里面的like $0 ~ /^$/ 空格
awk 里面的like $0 ~ /^ shixm / 空格 like shixm*
awk 里面的like $0 ~ /^$shixm / 空格 like shixm (绝对匹配)

awk NF 去除空行

-----------------sort-------------
-n 以数字方式排序
（+|-）n以n个分隔符开始（+n）、结束（-n）的域排序
-r 反向排序
-f 忽略大小写
+nM 排列域的前三个字符作为缩写的月份名称
-d 排列目录顺序，只考虑字母、数字和空格。其他字符忽略(-D大写,显示全部重复的行)
-o filename输出结果到指定filename文件中
-b 在限定起始和结束排序域时忽略开头的空格字符
-t char使用char字符作为域分隔符，如果没有指定该参数，则使用空格字符作为默认参数
$ ls -ld f* > list
-----------------sort-------------
-----------------uniq-------------

-c或--count   在每列旁边显示该行重复出现的次数。
-d或--repeated   仅显示重复出现的行列。(大写-D显示重复出现的所有行)
-f<栏位>或--skip-fields=<栏位>   忽略比较指定的栏位。
-s<字符位置>或--skip-chars=<字符位置>   忽略比较指定的字符。
-u或--unique   仅显示出一次的行列。
-w<字符位置>或--check-chars=<字符位置>   指定要比较的字符。
--help   显示帮助。
--version   显示版本信息。
[输入文件]   指定已排序好的文本文件。
[输出文件]   指定输出的文件。
uniq命令的作用：显示唯一的行，对于那些连续重复的行只显示一次！

-----------------uniq-------------

------------diff--------------
　在上述形式的每一行的后面跟随受到影响的若干行，以“＜”打头的行属于第一个文件，以“＞”打头的行属于第二个文件。

------------diff--------------

awk ' NR < 11 '如前所述，这里省略了动作，即为打印输出。匹配模式是变量NR需要小于11，NR即为当前的行号。这个写法很简单，但是有一个问题，在NR大于10的时候，awk其实还是对每行进行了判断，如果文件很大，比如说有上万行，浪费的时间是无法忽略的。所以，更好的写法是

awk '1; NR = 10 { exit }'第一句对当前行进行输出。第二句判断是不是已经到了第10行，如果是则退出。

输出文件的第一行（模拟 head -n 1 ）
awk 'NR > 1 { exit }; 1'这个例子与前一个很相似，中心思想就是第二行就退出。

输出文件的最后两行（模拟 tail -n 2 ）
awk '{ y=x "\n" $0; x=$0}; END { print y }'的确，这一句看起来确实有些别扭。第一句总是把一个在当前行前面再加上变量x的内容赋值给y，然后用x记录当前行内容。这样的效果是y的内容始终是上一行加上当前行的内容。在最后，输出y的内容。如果仔细看的话，不难发现这个写法是很不高效的，因为它不停的进行赋值和字符串连接，只为了找到最后一行！所以，如果你想要输出文件的最后两行，tail -n 2是最好的选择。

输出文件的最后一行（模拟 tail -n 1 ）
awk 'END { print }'句法方面没什么好说的，print省略参数即是等价于print $0。但是这个语句可能不能被非GNU awk的某些awk版本正常执行，如果为了兼容，下面的写法是最安全的：

awk '{ rec = $0 }; END { print rec }'输出只匹配某些模式的行（模拟 grep ）
awk '/regex/'似乎没什么好说的了。

输出不匹配某些模式的行（模拟 grep -v ）
awk '!/regex/'匹配模式前加“!”就是否定判断结果。

输出匹配模式的行的上一行，而非当前行
awk '/regex/ { print x }; { x = $0 }'变量x总是用来记录上一行的内容，如果模式匹配了当前行，则输出x的内容。

输出匹配模式的下一行
awk '/regex/ { getline; print }'这里使用了getline函数取得下一行的内容并输出。getline的作用是将$0的内容置为下一行的内容，并同时更新NR，NF，FNR变量。如果匹配的是最后一行，getline会出错，$0不会被更新，最后一行会被打印。

输出匹配AA或者BB或者CC的行
awk '/AA|BB|CC/'没什么好说的，正则表达式。如果有看不懂的朋友，请自行学习正则表达式。

输出长过65个字符的行
awk 'length > 64'length([str])返回字符串的长度，如果参数省略，即是以$0作为参数，括号也可以省略了。

输出短于65个字符的行
awk 'length < 65'和上例基本一样。

输出从匹配行到最后一样的内容
awk '/regex/,0'这里使用了“pattern1,pattern2”的形式来指定一个匹配的范围，其中pattern2这里为0，也就是false，所以一直会匹配到文件结束。

从第8行输出到第12行
awk 'NR==8,NR==12'同上例，这也是个范围匹配。

输出第52行
awk 'NR==52'如果想要少执行些不必要的循环，就这样写：

awk 'NR==52 {print;exit}'输出两次正则表达式匹配之间的行
awk '/regex1/, /regex2/'删除所有的空行
awk NFNF为真即是非空行。另外一种写法是用正则表达式：

awk '/./'

分享到：

tcp-ip-状态详解 | awk

2010-12-06 23:38
浏览 1653
评论(0)
分类:非技术
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

awk-笔记

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

awk-笔记

评论

发表评论

相关推荐

crontabl -e

神器gdb（整合）

awk 交集 并集 累加

hadoop-map-reduce执行流程调研报告

ping 监控+监控网络状况+监控服务器运行状态

linux 性能分析工具汇总(转 ) (2012-02-24 11:57)

Unicode和UTF-8

linux 文件描述符

sed-linux下查找替换命令使用 & 分割文件

awk 分类汇总

tcp-ip-状态详解

awk

awk 学习笔记

查找jar 文件里面 有没有匹配的class

ftp文件标准模板

我的linux工作台

查看 那个文件夹最大

进程详细信息 分析

文件夹比对工具

linux db 监控脚本

最近访客更多访客>>

awk 交集并集累加

查找jar 文件里面有没有匹配的class

查看那个文件夹最大

进程详细信息分析