Linux-awk和sort處理字符串


題目:

有一個文件b.txt

1 http://www.baidu.com/index.html
2 http://www.google.com/index.html
3 http://www.baidu.com/get.html
4 http://www.baidu.com/set.html
5 http://www.google.com/index.html
6 http://www.yahoo.com.cn/put.html
7 http://www.yunpan.com/img
8 http://iot.com.cn/index
9 http://iot.com.cn/get

要求將域名截取出來,並且統計出重復域名出現的次數:

1    2 iot.com.cn 2    3 www.baidu.com 3    2 www.google.com 4    1 www.yahoo.com.cn 5    1 www.yunpan.com 

代碼如下:

awk -F '/' '{print $3}' b.txt | sort | uniq -c

講解:

awk的基本用法

# 格式
$ awk 動作 文件名
# 示例
$ awk '{print $0}' demo.txt
#-F 參數,指定分隔符,單引號中是指定的分割字段
$ awk -F '/’

 $0 代表的是一整行的數據

sort和uniq結合使用:

uniq的參數-c ,表示在每列旁邊顯示該行重復的次數

 

參考文檔:

http://www.ruanyifeng.com/blog/2018/11/awk.html

http://man.linuxde.net/awk

http://man.linuxde.net/sort

http://man.linuxde.net/uniq

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM