Awk命令是处理数据的强大工具。它获取输入数据,对其进行操作,并在标准输出中给出结果。可以对文件的行和列执行各种操作。
要有效地处理数据,了解“awk”命令的基本要素是非常重要的,这篇文章将涵盖“awk”命令的关键特性。让我们先检查语法:
$ awk [options] [file]
下表列出了一些常用的选项:
选项 | 说明 |
-F | To specify a file separator |
-f | 指定包含“awk”脚本的文件 |
-v | 指定变量 |
让我们看一些有关“ awk”命令用法的示例,为了演示,我新建了一个文本文件,名称为linuxmi.com.txt:
1、如何使用awk命令打印文件的列?
“ awk”命令可用于获取文本文件的特定列。 要打印文件的内容,请使用:
linuxmi@linuxmi:~/www.linuxmi.com$ cat linuxmi.com.txt
现在,打印文件的第二列,使用:
linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘{print $2}’ linuxmi.txt
要打印多个字段,使用命令:
linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘{print $1,$2,$3}’ linuxmi.txt
如果你不使用逗号“,”,那么输出将没有空格:
linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘{print $1$2$3}’ linuxmi.txt
2、如何使用正则表达式与awk命令:
为了匹配字符串或任何表达式,我们使用斜杠” // “,例如,如果你想打印正在学习”lishi”的人的名字,那么使用:
linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘/历史/{print $2}’ linuxmi.txt
输出清楚地表明,只有“张三”和“方咪”正在学习“历史”课程。
3、如何通过“awk”命令使用关系表达式:
为了匹配特定字段的内容,可以使用关系表达式。要将任何字符串或表达式与字段进行匹配,请指示该字段,并使用比较符“〜”与以下命令中显示的模式进行比较:
linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘$3 ~/语/ {print $2}’ linuxmi.txt
上面的输出显示第2列中的每个字段与第3列中包含“语”的每个字段的对比。
要获得上述命令的相反输出,请使用“! ~”运算符:
linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘$3!~/语/ {print $2}’ linuxmi.txt
为了进行比较,我们还可以使用大于“>”,小于“ <”和等于“ =”的运算符:
linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘$4>81 {print $2}’ linuxmi.txt
输出显示了获得81分以上得分的人员的姓名。
4、如何通过awk命令使用范围模式:
范围也可以用于搜索;只需使用逗号“,”来分隔范围,如下面提到的命令所示:
linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘/李四/,/陈明/ {print $3}’ linuxmi.txt
输出显示第2列中从“李四”到“陈明”之间的课程。请参见下面的示例:
linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘$4==87,$4==91 {print $2}’ linuxmi.txt
输出显示第2列中人员的姓名,第4列中标记“ 87到91”的范围。
5、如何使用逻辑运算符组合模式:
使用逻辑运算符(例如OR“ ||”,“ &&&”)可以组合模式进行搜索。使用以下命令
linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘$4>81 && $6>0.4 {print $2}’ linuxmi.txt
上面的命令将在第四个字段上打印大于81的人名,在第六个字段上打印大于0.4的人名。并且只有两个记录满足条件。
6、awk命令的特殊表达式:
有两个特殊表达式,“ BEGIN”和“ END”:
开始:在处理数据之前执行操作
结束:在处理完数据后执行一项操作
linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘BEGIN {print “处理已经开始”}; {print $2}; END {print “处理已结束”}’ linuxmi.txt
7、awk命令的有用的内置变量:
awk命令具有各种有助于数据处理的变量:
变量 | 说明 |
NF | 它给出了数据中字段的数量 |
NR | 给出当前记录的编号 |
FILENAME | 显示当前正在处理的文件的名称 |
FS 和 OFS | 字段分隔符和输出字段分隔符 |
RS 和 ORS | 分离记录和输出记录分隔符 |
示例:
linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘END{print “文件名是 “, FILENAME, “有”, NF, “个字段和”, NR, “个记录”}’ linuxmi.txt
我们使用“ END”,但是如果使用“ BEGIN”,则输出将给出0个字段和0个记录。
8、如何更改记录分隔符:
记录中的默认分隔符通常为空格;如果有逗号“,”或点“。”作为字段分隔符,然后将“ FS”选项与分隔符一起使用。
我们再来看一个文件,其中的数据字段之间用逗号“:”隔开:
linuxmi@linuxmi:~/www.linuxmi.com$ cat linuxmi.txt linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘BEGIN {FS=”:”}{print $2}’ linuxmi.txt
由于文件的分隔符是冒号,但是“ awk”命令甚至对此类文件也很有用,因此只需使用“ FS”选项即可。
也可以使用“ -F”:
linuxmi@linuxmi:~/www.linuxmi.com$ awk -F “:” ‘{print $2}’ linuxmi.txt
默认记录分隔符为“换行符”,并将记录分隔符设置为“:”,请使用:
linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘BEGIN{RS=”:”}{print $1}’ linuxmi.txt
9、Awk Actions:
Awk Actions是由“{}”括号括起来的小程序,它有多个用分号“;”分隔的语句。
使用“ awk”命令最常用的语句是“ print”语句。例如,要打印每条记录的文本,请在引号中使用文本字符串:
linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘{print “Linux迷 www.linuxmi.com,” $2}’ linuxmi.com.txt
让我们使用awk执行简单的求和运算:
linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘{sum += $4} END {printf “%d\n”, sum}’ linuxmi.com.txt
10、创建awk程序:
让我们从“ awk”编程开始,下面给出的编程只是在做乘法:
### Linux迷 www.linuxmi.com ### ### Linux迷 www.linuxmi.com ### ### Linux迷 www.linuxmi.com ### BEGIN { i=2 while(j<4) { print “The multiplication of 2 with” j ” is ” i*j; j++ } }
用“linuxmi.awk”的名称保存程序并运行,打开终端并输入:
linuxmi@linuxmi:~/www.linuxmi.com$ awk -f linuxmi.awk
总结:
“awk”命令是一种方便的命令,用于处理,扫描文本文件的数据,例如分隔文件的任何特定字段;我们使用“ awk”命令。它使从文本文件中以任何形式或模式搜索任何内容变得更加容易。在本指南中,我们了解“ awk”命令的基本知识及其用法。 “ awk”命令可验证数据,生成报告,甚至解析文件。使用简单的命令“ awk”还可以使用户编写微型程序来更有效地处理数据。
转自https://www.linuxmi.com/10-awk-mingling.html