awk用法詳解


零、awk的基本知識

 

1、awk命令形式:

awk [-F|-f|-v] ‘BEGIN{} // {command1; command2} END{}’ file

 

2awk語法解釋:

[-F|-f|-v]

大參數。-F指定分隔符,-f調用腳本,-v定義變量 var=value

'  '

引用代碼塊。

BEGIN

初始化代碼塊。在對每一行進行處理之前,初始化代碼,主要是引用全局變量,設置FS分隔符

//

匹配代碼塊。可以是字符串或正則表達式

{}

命令代碼塊。包含一條或多條命令,多條命令使用分號分隔

END

結尾代碼塊。在對每一行進行處理之后再執行的代碼塊,主要是進行最終計算或輸出結尾摘要信息

 

3、awk內置變量:

FILENAME  

awk瀏覽的文件名  

 

FNR  

與NR類似,不過多文件記錄不遞增,每個文件都從1開始  

 

FS  

設置輸入字段分隔符,同- F選項

 

NF

瀏覽記錄的字段個數

awk '{print NF}' file    //顯示每行有多少字段

$NF

最后一個字段的值

awk '{print $NF}' file    //將每行第NF個字段的值打印出來

NR

已讀的記錄數,理解為行號,多文件行號遞增

awk 'NR==5{print}'  file    //顯示第5

OFS

輸出數據時,每個字段間以OFS制定的字符作為分隔符

awk '{print $3,$5,$4}' OFS="\n" file

ORS

輸出數據時,每行記錄間以OFS制定的字符作為分隔符

awk '{print $3,$5,$4}' ORS="\n" file

 

 

一、awk的大參數

awk [-F|-f|-v] 'BEGIN{} // {command1; command2} END{}' file

 

1、-F 指定分隔符

可不寫,不寫時默認空格為分隔符

一個或多個連續的空格看做一個分隔符,即多個空格看做一個空格

可以定義多個分隔符,如 -F[./] 是指,同時以“.”和“/”作為分隔符

 

2-f -v

(暫時不必接觸這部分內容)

 

二、awk的引用代碼塊

awk [-F|-f|-v] ‘BEGIN{} // {command1; command2} END{}’ file

 

1、操作符

綜合看引用代碼部分實際上相當於一個編程環境,支持很多操作符。如條件運算操作符、邏輯運算操作符等。

 

==

等於,精確比較

awk '$3=="48" {print $0}' file    只打印第3個字段等於"48"的記錄

!=

不等於,精確比較

awk '$1 != "abc"' file    //提取第一個字段不是abc的行

~

匹配,與==相比不是精確比較

awk '{if ($4~/abc/) print $0}' file    //表示如果第四個字段包含abc,就打印整行

!~

不匹配,不精確比較

awk '$0 !~ /abc/' file      打印整條不包含abc的記錄

&&

 和

awk '{if ( $1=="a" && $2=="b" ) print $0}' file    //如果第1、第2個字段值是ab,打印整行

||

awk '{if ($1=="a" || $1=="b") print $0}' temp    //如果第1、第2個字段值是ab,打印整行

 >

 大於

awk '$1>500 {print $2}' file     //如果字段1的值大於500,則打印字段2

>=

大於等於

awk '$1>=400 {print $2}' file     //如果字段1的值大於等於400,則打印字段2

<

小於

awk '$1<200 {print $2}' file     //如果字段1的值小於200,則打印字段2

<=

小於等於

awk '$1<=100 {print $2}' file     //如果字段1的值小於等於100,則打印字段2

+

awk '{print $3+10}' file    //字段3數值加10

-

awk '{print $3-10}' file    //字段3數值減10

*

awk '{print $3*10}' file    //字段3數值乘10

/

awk '{print $3/10}' file    //字段3數值除10

 

2、字符匹配代碼塊

awk [-F|-f|-v] ‘BEGIN{} // {command1; command2} END{}’ file

 

①字符匹配代碼支持針對字符串的操作符

需要注意的是,不支持部分針對數字的操作符

awk '$3>/200/ {print $1}' baidu.log $3>/200/ 實際沒有生效,不管條件結果如何都會被忽略,直接print $1

②字符匹配代碼塊 // 中支持正則表達式

  

3if語句

①必須用在{}中,且比較內容用()擴起來,支持if else

awk -F: '{if($1~/abc/) print $1}' file     //簡寫

awk -F: '{if($1~/abc/) {print $1}}'  file    //全寫

awk -F: '{if($1~/abc/) {print $1} else {print $2}}' file    //if...else...

②有時不用if語句也可以實現同樣效果圖,如

awk -F: '{if($1~/abc/) {print $1}}' file    //$1為指定內容才顯示

awk -F: '$1~/abc/ {print $1}' file    //與上面相同效果,沒有用if語句,條件寫在‘’外

    

4、while語句

與其他語言的while語句類似,條件為True時執行循環語句,False時不執行。

 

 

 

 

 

以下知識尚未整理驗證

 

數組

netstat -anp|awk 'NR!=1{a[$6]++} END{for (i in a) print i,"\t",a[i]}'

netstat -anp|awk 'NR!=1{a[$6]++} END{for (i in a) printf "%-20s %-10s %-5s \n", i,"\t",a[i]}'

9523                               1     

9929                               1     

LISTEN                            6     

7903                               1     

3038/cupsd                   1     

7913                               1     

10837                             1     

9833                               1     

 

應用1

awk -F: '{print NF}' helloworld.sh                                                       //輸出文件每行有多少字段

awk -F: '{print $1,$2,$3,$4,$5}' helloworld.sh                                 //輸出前5個字段

awk -F: '{print $1,$2,$3,$4,$5}' OFS='\t' helloworld.sh                 //輸出前5個字段並使用制表符分隔輸出

awk -F: '{print NR,$1,$2,$3,$4,$5}' OFS='\t' helloworld.sh           //制表符分隔輸出前5個字段,並打印行號

 

應用2

awk -F'[:#]' '{print NF}'  helloworld.sh                                                  //指定多個分隔符: #,輸出每行多少字段

awk -F'[:#]' '{print $1,$2,$3,$4,$5,$6,$7}' OFS='\t' helloworld.sh   //制表符分隔輸出多字段

 

應用3

awk -F'[:#/]' '{print NF}' helloworld.sh                                               //指定三個分隔符,並輸出每行字段數

awk -F'[:#/]' '{print $1,$2,$3,$4,$5,$6,$7,$8,$9,$10,$11,$12}' helloworld.sh     //制表符分隔輸出多字段

 

應用4

計算/home目錄下,普通文件的大小,使用KB作為單位

ls -l|awk 'BEGIN{sum=0} !/^d/{sum+=$5} END{print "total size is:",sum/1024,"KB"}'

ls -l|awk 'BEGIN{sum=0} !/^d/{sum+=$5} END{print "total size is:",int(sum/1024),"KB"}'         //int是取整的意思

 

應用5

統計netstat -anp 狀態為LISTEN和CONNECT的連接數量分別是多少

netstat -anp|awk '$6~/LISTEN|CONNECTED/{sum[$6]++} END{for (i in sum) printf "%-10s %-6s %-3s \n", i," ",sum[i]}'

 

應用6

統計/home目錄下不同用戶的普通文件的總數是多少?

ls -l|awk 'NR!=1 && !/^d/{sum[$3]++} END{for (i in sum) printf "%-6s %-5s %-3s \n",i," ",sum[i]}'   

mysql        199 

root           374 

統計/home目錄下不同用戶的普通文件的大小總size是多少?

ls -l|awk 'NR!=1 && !/^d/{sum[$3]+=$5} END{for (i in sum) printf "%-6s %-5s %-3s %-2s \n",i," ",sum[i]/1024/1024,"MB"}'

 

應用7

輸出成績表

awk 'BEGIN{math=0;eng=0;com=0;printf "Lineno.   Name    No.    Math   English   Computer    Total\n";printf "------------------------------------------------------------\n"}{math+=$3; eng+=$4; com+=$5;printf "%-8s %-7s %-7s %-7s %-9s %-10s %-7s \n",NR,$1,$2,$3,$4,$5,$3+$4+$5} END{printf "------------------------------------------------------------\n";printf "%-24s %-7s %-9s %-20s \n","Total:",math,eng,com;printf "%-24s %-7s %-9s %-20s \n","Avg:",math/NR,eng/NR,com/NR}' test0

 

[root@localhost home]# cat test0 

Marry   2143 78 84 77

Jack    2321 66 78 45

Tom     2122 48 77 71

Mike    2537 87 97 95

Bob     2415 40 57 62

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM