(轉)Linux中awk的gsub函數用法


原文:https://www.cnblogs.com/Linux-guowen/p/12659776.html

一。遇到的問題:

問題:echo "a b c 2011-11-22 a:d" | awk '$4=gsub(/-/,"",$4)'為啥 輸出后 2011-11-22 變成 2 了?

解答:
gsub(/-/,"",$4)的值是2【在賦值的情況下是這樣的~】,你將2賦值給$4 ,gsub返回的是替換的次數。
如下是測試結果:
[root@Test230 ~]# echo "a b c 2011-11-22 a:d" | awk '$4=gsub(/-/,"",$4)'
a b c 2 a:d

看另一種情況,只是替換的話~

[root@sor-sys config]# echo "a b c 2011-11-22 a:d" | awk 'gsub(/-/,"",$4)'
a b c 20111122 a:d
[root@sor-sys config]# echo "a b c 2011-11-22 a:d" | awk 'gsub(/-/,"_",$4)'
a b c 2011_11_22 a:d

 

二。實例詳解

下面我們來總結一下這個gsub的用法:

有一個文本文件data.test的內容如下:

0001|20081223efskjfdj|EREADFASDLKJCV
0002|20081208djfksdaa|JDKFJALSDJFsddf
0003|20081208efskjfdj|EREADFASDLKJCV
0004|20081211djfksdaa1234|JDKFJALSDJFsddf

以'|'為分隔, 現要將第二個域字母前的數字去掉,其他地方都不變, 輸出為:
0001|efskjfdj|EREADFASDLKJCV
0002|djfksdaa|JDKFJALSDJFsddf
0003|efskjfdj|EREADFASDLKJCV
0004|djfksdaa1234|JDKFJALSDJFsddf

解法:

awk -F '|'  '{sub(/[0-9]+/,"",$2);print $0}' data.test 

 

三。sub和gsub的區別

sub匹配第一次出現的符合模式的字符串,相當於 sed 's//'   
gsub匹配所有的符合模式的字符串,相當於 sed 's//g'   

awk的sub函數用法:
sub函數匹配指定域/記錄中最大、最靠左邊的子字符串的正則表達式,並用替換字符串替換這些字符串。如果沒有指定目標字符串就默認使用整個記錄,替換只發生在第一次匹配的時候。

實例:
$ awk '{ sub(/test/, "mytest"); print }' testfile
$ awk '{ sub(/test/, "mytest", $1); print }' testfile
第一個例子在整個記錄中匹配,替換只發生在第一次匹配發生的時候。
第二個例子在整個記錄的第一個域中進行匹配,替換只發生在第一次匹配發生的時候

 

gsub函數作用如sub,但它在整個文檔中進行匹配。        

實例:
$ awk '{ gsub(/test/, "mytest"); print }' testfile
$ awk '{ gsub(/test/, "mytest", $1); print }' testfile
第一個例子在整個文檔中匹配test,匹配的都被替換成mytest。
第二個例子在整個文檔的第一個域中匹配,所有匹配的都被替換成mytest。


只有當記錄中的域有改變的時候 ,指定0FS變量才有用, 如果記錄中的域無變化, 指定OFS產生不了實際效果。

awk -F'|' -v OFS='|' '{ gsub(/[0-9]/, "", $3); print $0; }' data.txt   

將把第三個域中所有數字都去掉。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM