grep、cut、awk、sed的使用


grep、cut、awk、sed 常常應用在查找日志、數據、輸出結果等等,並對我們想要的數據進行提取。
通常grep,sed命令是對行進行提取,cut跟awk是對列進行提取

處理海量數據之grep命令

grep應用場景:

通常對數據進行 行的提取

 

語法:

grep [選項]...[內容]...[file]

-v #對內容進行取反提取

-n #對提取的內容顯示行號(原文件中對應行號)

-w #精確匹配

-i #忽略大小寫

^ #匹配開頭行首

-E #正則匹配

 

系統文件進行實例演示:

 1. 提取是區分大小寫的提取

  

2. -v 提取上述以外的內容

 

-w  全字符匹配  

 -i 

 

^ 開頭

-E  正則

 

 

處理海量數據之cut命令 

cut應用場景:

通常對數據進行列的提取

語法:

cut [選項]...[file] 

-d #指定分割符
-f #指定截取區域
-c #以字符為單位進行分割

注意:不加-d選項,默認為制表符,不是空格

 

仍然以系統文件為實例

 

-d與-f:
eg:

以':'為分隔符,截取出/etc/passwd的第一列跟第三列
cut -d ':' -f 1,3 /etc/passwd

eg:

以':'為分隔符,截取出/etc/passwd的第一列到第三列
cut -d ':' -f 1-3 /etc/passwd

eg:

以':'為分隔符,截取出/etc/passwd的第二列到最后一列
cut -d ':' -f 2- /etc/passwd

-c:
eg:

截取/etc/passwd文件從第二個字符到第九個字符

cut -c 2-9 /etc/passwd

eg:

截取linux上面所有可登陸普通用戶

        /bin/bash #代表可以登錄的用戶
        /sbin/nologin #代表不可以登錄的用戶

grep '/bin/bash' /etc/passwd | cut -d ':' -f 1 | grep -v root

 cut -d ':' -f 1--------第一列代表所有用戶

-v #對內容進行取反提取  

 

 

處理海量數據之awk命令

awk的簡介:

其實一門編程語言,支持條件判斷,數組,循環等功能,與grep,sed被稱為  linux三劍客

awk的應用場景:

通常對數據進行  列的提取           先執行條件再執行動作

語法:
awk '條件 {執行動作}'文件名

awk '條件1 {執行動作} 條件2 {執行動作} ...' 文件名

或awk [選項] '條件1 {執行動作} 條件2 {執行動作} ...' 文件名

 

特殊要點與舉例說明:
printf #格式化輸出,不會自動換行。
( %ns:字符串型,n代表有多少個字符; 
     %ni:整型,n代表輸出幾個數字;
     %.nf:浮點型,n代表的是小數點后有多少個小數)

print #打印出內容,默認會自動換行


\t #制表符(tab鍵 )
\n #換行符

 

 

eg:

 

注意:%s 是字符串  %i 是整形

 

 

df -h  磁盤空間分區使用率

df -h |grep /dev/vda1 | awk '{printf "/dev/vda1的使用率是:"} {print $5 }'  

與之前傳參不同: $1 #代表第一列   $2 #代表第二列   $0 #代表一整行

 

 

%.nf:浮點型,n代表的是小數點后有多少個小數    \n換行

小數:echo "scale=2; 0.13 + 0.1" | bc | awk '{printf "%.2f\n", $0}'

 

 

 

-F #指定分割符
eg:cat /etc/passwd | awk -F":" '{print $1}'

 以:為分隔符打印出第一列

  

另一種方式

 

  

BEGIN     #在讀取所有行內容前就開始執行,常常被用於修改內置變量的值
FS           #BEGIN時定義分割符

eg:cat /etc/passwd | awk 'BEGIN {FS=":"} {print $1}'

 



 

 END #結束的時候 執行   (在最后的時刻才會執行)

 


NR #行號

eg:df -h | awk 'NR==2 {print $5}'     

 


打印多行:         

 

 

打印行數

 

 


處理海量數據之sed命令

sed的應用場景:(只更改輸出  不會對源文件進行操作)

主要對數據進行處理(選取,新增,替換,刪除,搜索)

 

sed語法:

sed [選項] [動作] 文件名

 

常見的選項與參數:

-n   #把匹配到的行輸出打印到屏幕
p    #以行為單位進行查詢,通常與-n一起使用

eg:

df -h | sed -n '2p'

 

d #刪除  (只是打印的內容看不見  並不是對原文件刪除)
eg:

sed '2d' df.txt

 源文件保留

 

 

a #在行的下面插入新的內容
eg: sed '2a 1234567890' df.txt

i #在行的上面插入新的內容
eg: sed '2i 1234567890' df.txt

 

 

c #替換 
eg: sed '2c 1234567890' df.txt

 


s/要被取代的內容/新的字符串/g #指定內容進行替換

-i #對源文件進行修改(高危操作,慎用,用之前需要備份源文件)

修改 不打印

 

 

搜索:(同grep)

在文件中搜索內容   '/100%/p'
eg:

cat -n df.txt | sed -n '/100%/p'

 

 

 

-e #表示可以執行多條動作    (注意)
eg:

cat -n df.txt | sed -n -e 's/100%/100%-----100%/g' -e '/100%-----100%/p'

 

轉載自:   https://www.cnblogs.com/hmm1995/p/10418968.html


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM