IT序号网

10个超级棒的Awk命令知识解答

itxm 2021年05月25日 程序员 145 0

Awk命令是处理数据的强大工具。它获取输入数据,对其进行操作,并在标准输出中给出结果。可以对文件的行和列执行各种操作。

要有效地处理数据,了解“awk”命令的基本要素是非常重要的,这篇文章将涵盖“awk”命令的关键特性。让我们先检查语法:

$ awk [options] [file]

下表列出了一些常用的选项:

选项 说明
-F To specify a file separator
-f 指定包含“awk”脚本的文件
-v  指定变量

让我们看一些有关“ awk”命令用法的示例,为了演示,我新建了一个文本文件,名称为linuxmi.com.txt:

1、如何使用awk命令打印文件的列?

“ awk”命令可用于获取文本文件的特定列。 要打印文件的内容,请使用:

linuxmi@linuxmi:~/www.linuxmi.com$ cat linuxmi.com.txt

现在,打印文件的第二列,使用:

linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘{print $2}’ linuxmi.txt

要打印多个字段,使用命令:

linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘{print $1,$2,$3}’ linuxmi.txt

如果你不使用逗号“,”,那么输出将没有空格:

linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘{print $1$2$3}’ linuxmi.txt

2、如何使用正则表达式与awk命令:

为了匹配字符串或任何表达式,我们使用斜杠” // “,例如,如果你想打印正在学习”lishi”的人的名字,那么使用:

linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘/历史/{print $2}’ linuxmi.txt

输出清楚地表明,只有“张三”和“方咪”正在学习“历史”课程。

3、如何通过“awk”命令使用关系表达式:

为了匹配特定字段的内容,可以使用关系表达式。要将任何字符串或表达式与字段进行匹配,请指示该字段,并使用比较符“〜”与以下命令中显示的模式进行比较:

linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘$3 ~/语/ {print $2}’ linuxmi.txt

上面的输出显示第2列中的每个字段与第3列中包含“语”的每个字段的对比。

要获得上述命令的相反输出,请使用“! ~”运算符:

linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘$3!~/语/ {print $2}’ linuxmi.txt

为了进行比较,我们还可以使用大于“>”,小于“ <”和等于“ =”的运算符:

linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘$4>81 {print $2}’ linuxmi.txt

输出显示了获得81分以上得分的人员的姓名。

4、如何通过awk命令使用范围模式:

范围也可以用于搜索;只需使用逗号“,”来分隔范围,如下面提到的命令所示:

linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘/李四/,/陈明/ {print $3}’ linuxmi.txt

输出显示第2列中从“李四”到“陈明”之间的课程。请参见下面的示例:

linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘$4==87,$4==91 {print $2}’ linuxmi.txt

输出显示第2列中人员的姓名,第4列中标记“ 87到91”的范围。

5、如何使用逻辑运算符组合模式:

使用逻辑运算符(例如OR“ ||”,“ &&&”)可以组合模式进行搜索。使用以下命令

linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘$4>81 && $6>0.4 {print $2}’ linuxmi.txt

上面的命令将在第四个字段上打印大于81的人名,在第六个字段上打印大于0.4的人名。并且只有两个记录满足条件。

6、awk命令的特殊表达式:

有两个特殊表达式,“ BEGIN”和“ END”:

开始:在处理数据之前执行操作

结束:在处理完数据后执行一项操作

linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘BEGIN {print “处理已经开始”}; {print $2}; END {print “处理已结束”}’ linuxmi.txt

7、awk命令的有用的内置变量:

awk命令具有各种有助于数据处理的变量:

变量 说明
NF 它给出了数据中字段的数量
NR 给出当前记录的编号
FILENAME 显示当前正在处理的文件的名称
FS 和 OFS 字段分隔符和输出字段分隔符
RS 和 ORS 分离记录和输出记录分隔符

示例:

linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘END{print “文件名是 “, FILENAME, “有”, NF, “个字段和”, NR, “个记录”}’ linuxmi.txt

我们使用“ END”,但是如果使用“ BEGIN”,则输出将给出0个字段和0个记录。

8、如何更改记录分隔符:

记录中的默认分隔符通常为空格;如果有逗号“,”或点“。”作为字段分隔符,然后将“ FS”选项与分隔符一起使用。

我们再来看一个文件,其中的数据字段之间用逗号“:”隔开:

linuxmi@linuxmi:~/www.linuxmi.com$ cat linuxmi.txt 
linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘BEGIN {FS=”:”}{print $2}’ linuxmi.txt

由于文件的分隔符是冒号,但是“ awk”命令甚至对此类文件也很有用,因此只需使用“ FS”选项即可。

也可以使用“ -F”:

linuxmi@linuxmi:~/www.linuxmi.com$ awk -F “:” ‘{print $2}’ linuxmi.txt

默认记录分隔符为“换行符”,并将记录分隔符设置为“:”,请使用:

linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘BEGIN{RS=”:”}{print $1}’ linuxmi.txt

9、Awk Actions:

Awk Actions是由“{}”括号括起来的小程序,它有多个用分号“;”分隔的语句。

使用“ awk”命令最常用的语句是“ print”语句。例如,要打印每条记录的文本,请在引号中使用文本字符串:

linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘{print “Linux迷 www.linuxmi.com,” $2}’ linuxmi.com.txt

让我们使用awk执行简单的求和运算:

linuxmi@linuxmi:~/www.linuxmi.com$ awk ‘{sum += $4} END {printf “%d\n”, sum}’ linuxmi.com.txt

10、创建awk程序:

让我们从“ awk”编程开始,下面给出的编程只是在做乘法:

### Linux迷 www.linuxmi.com ### 
### Linux迷 www.linuxmi.com ### 
### Linux迷 www.linuxmi.com ### 
BEGIN { 
i=2 
while(j<4) 
{ 
print “The multiplication of 2 with” j ” is ” i*j; 
j++ 
} 
}

用“linuxmi.awk”的名称保存程序并运行,打开终端并输入:

linuxmi@linuxmi:~/www.linuxmi.com$ awk -f linuxmi.awk

总结:

“awk”命令是一种方便的命令,用于处理,扫描文本文件的数据,例如分隔文件的任何特定字段;我们使用“ awk”命令。它使从文本文件中以任何形式或模式搜索任何内容变得更加容易。在本指南中,我们了解“ awk”命令的基本知识及其用法。 “ awk”命令可验证数据,生成报告,甚至解析文件。使用简单的命令“ awk”还可以使用户编写微型程序来更有效地处理数据。

转自https://www.linuxmi.com/10-awk-mingling.html


发布评论
IT序号网

微信公众号号:IT虾米 (左侧二维码扫一扫)欢迎添加!

awk的gsub函数知识解答
你是第一个吃螃蟹的人
发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。