詳解Linux中的awk命令

簡介

awk是一個強大的文本分析工具，相對於grep的查找，sed的編輯，awk在其對數據分析並生成報告時，顯得尤為強大。簡單來說awk就是把文件逐行的讀入，以空格為默認分隔符將每行切片，切開的部分再進行各種分析處理。

awk有3個不同版本: awk、nawk和gawk，未作特別說明，一般指gawk，gawk 是 AWK 的 GNU 版本。

awk其名稱得自於它的創始人 Alfred Aho 、Peter Weinberger 和 Brian Kernighan 姓氏的首個字母。實際上 AWK 的確擁有自己的語言： AWK 程序設計語言，三位創建者已將它正式定義為“樣式掃描和處理語言”。它允許您創建簡短的程序，這些程序讀取輸入文件、為數據排序、處理數據、對輸入執行計算以及生成報表，還有無數其他的功能。

一、選項參數說明

awk是一種處理文本文件的語言，我們可以使用awk --help查看一下它的選項參數，如下：

二、基本用法

1、行匹配語句，此處awk后只能跟單引號，格式如下：

 
                  awk '{匹配的內容}' 匹配的文件名稱

例如：

現有如下測試文件test：

使用如下命令輸出文中每行的1、4項內容：

 
                   awk '{print $1,$4}' test

也可以添加如下內容使其格式化輸出：

awk '{printf "%-8s %-10s\n",$1,$4}' test

2、指定分隔符

 
                    awk '{printf "%-8s %-10s\n",$1,$4}' test

例如：

有如下test文件：

執行如下命令，使用逗號分割輸出每行的第一、二項內容：

 
                     awk -F, '{print $1,$2}' test

也可以使用內建變量，格式如下：

 
                      awk 'BEGIN{FS=","} {print $1,$2}' test

對於使用多個分隔符，首先使用空格分割，然后再使用其他分割符進行分割：

 
                       awk -F '[ ,]' '{print $1,$2,$4}' test

3、設置變量

 
                        awk -v

例如：

現有如下數據：

執行如下命令，每行第一項加1：

 
                         awk -va=1 '{print $1,$1+a}' test

也可以使用如下命令設置多個變量：

 
                          awk -va=1 -vb=s '{print $1,$1+a,$1b}' test

4、通過awk腳本來運行awk命令

 
                           awk -f awk腳本 文件名

例如：

 
                            awk -f file.awk test

三、運算符

例如：

1、過濾第一列大於2的行

 
                             awk '$1>2' test

2、過濾等於2的列

 
                              awk '$1==2 {print $1,$3}' test

3、過濾第一列大於2並且第二列等於Are的行

 
                               awk '$1>2 && $2=="Are" {print $1,$2,$3}' test

四、內建變量

例如：

 
                                awk 'BEGIN{printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n","FILENAME","ARGC","FNR","FS","NF","NR","OFS","ORS","RS";printf "---------------------------------------------\n"} {printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n",FILENAME,ARGC,FNR,FS,NF,NR,OFS,ORS,RS}' test

 
                                 awk -F\' 'BEGIN{printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n","FILENAME","ARGC","FNR","FS","NF","NR","OFS","ORS","RS";printf "---------------------------------------------\n"} {printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n",FILENAME,ARGC,FNR,FS,NF,NR,OFS,ORS,RS}' test

 
                                  awk '{print NR,FNR,$1,$2,$3}' test

 
                                   awk '{print $1,$2,$5}' OFS=" $ " test

五、使用正則，字符串匹配

例如：

1、輸出第二列包含“th”並打印第二列與第四列。

 
                                    awk '$2 ~ /th/ {print $2,$4}' test

~表示模式開始，//中存放匹配的模式。

2、輸出包含“re”的行

 
                                     awk '/re/ ' test

六、忽略大小寫

 
                                      awk 'BEGIN{IGNORECASE=1} /this/' test

七、模式取反

 
                                       awk '$2 !~ /th/ {print $2,$4}' test

 
                                        awk '!/th/ {print $2,$4}' test

八、awk腳本

關於awk腳本，需要注意BEGIN和END兩個關鍵詞：

（1）BEGIN{存放執行前的語句}；

（2）END{存放處理完所有的行后要執行的語句}。

例如：

現有數據如下：

我們的awk腳本內容如下：

執行結果如下：

詳解Linux中的awk命令

免責聲明！