Linux之grep的使用


2021-12-06  10:49:22

 

基本介紹

  Linux系統中grep命令是一種強大的文本搜索工具,它能使用正則表達式搜索文本,並把匹 配的行打印出來。grep全稱是Global Regular Expression Print,表示全局正則表達式版本,它的使用權限是所有用戶。

  grep的工作方式是這樣的,它在一個或多個文件中搜索字符串模板。如果模板包括空格,則必須被引用,模板后的所有字符串被看作文件名。搜索的結果被送到標准輸出,不影響原文件內容。

  grep可用於shell腳本,因為grep通過返回一個狀態值來說明搜索的狀態,如果模板搜索成功,則返回0,如果搜索不成功,則返回1,如果搜索的文件不存在,則返回2。我們利用這些返回值就可進行一些自動化的文本處理工作。

表達式

grep [option] pattern file     注意:后面可以跟多個file

參數介紹

 

  • -a 不要忽略二進制數據。
  • -A<顯示列數> 除了顯示符合范本樣式的那一行之外,並顯示該行之后的內容。
  • -b 在顯示符合范本樣式的那一行之外,並顯示該行之前的內容。
  • -c 計算符合范本樣式的列數。
  • -C<顯示列數>或-<顯示列數> 除了顯示符合范本樣式的那一列之外,並顯示該列之前后的內容。
  • -d<進行動作> 當指定要查找的是目錄而非文件時,必須使用這項參數,否則grep命令將回報信息並停止動作。
  • -e<范本樣式> 指定字符串作為查找文件內容的范本樣式。
  • -E 將范本樣式為延伸的普通表示法來使用,意味着能使用擴展正則表達式。
  • -f<范本文件> 指定范本文件,其內容有一個或多個范本樣式,讓grep查找符合范本條件的文件內容,格式為每一列的范本樣式。
  • -F 將范本樣式視為固定字符串的列表。
  • -G 將范本樣式視為普通的表示法來使用。
  • -h 在顯示符合范本樣式的那一列之前,不標示該列所屬的文件名稱(不顯示匹配到的文件名)。
  • -H 在顯示符合范本樣式的那一列之前,標示該列的文件名稱。
  • -i 胡列字符大小寫的差別。
  • -l 列出文件內容符合指定的范本樣式的文件名稱。
  • -L 列出文件內容不符合指定的范本樣式的文件名稱。
  • -n 在顯示符合范本樣式的那一列之前,標示出行號。
  • -q 不顯示任何信息。
  • -R/-r 此參數的效果和指定“-d recurse”參數相同。
  • -s 不顯示錯誤信息。
  • -v 反轉查找,也就是顯示沒有匹配行。
  • -w 只顯示全字符合的列。
  • -x 只顯示全列符合的列。
  • -y 此參數效果跟“-i”相同。
  • -o 只輸出文件中匹配到的部分。
  • --color=auto :可以將找到的關鍵詞部分加上顏色的顯示喔!

規則表達式:

  • grep的規則表達式:
  • ^  #錨定行的開始 如:'^grep'匹配所有以grep開頭的行。    
  • $  #錨定行的結束 如:'grep$'匹配所有以grep結尾的行。    
  • .  #匹配一個非換行符的字符 如:'gr.p'匹配gr后接一個任意字符,然后是p。    
  • *  #匹配零個或多個先前字符 如:'*grep'匹配所有一個或多個空格后緊跟grep的行。    
  • .*   #一起用代表任意字符。   
  • []   #匹配一個指定范圍內的字符,如'[Gg]rep'匹配Grep和grep。    
  • [^]  #匹配一個不在指定范圍內的字符,如:'[^A-FH-Z]rep'匹配不包含A-R和T-Z的一個字母開頭,緊跟rep的行。    
  • \(..\)  #標記匹配字符,如'\(love\)',love被標記為1。    
  • \<      #錨定單詞的開始,如:'\<grep'匹配包含以grep開頭的單詞的行。    
  • \>      #錨定單詞的結束,如'grep\>'匹配包含以grep結尾的單詞的行。    
  • x\{m\}  #重復字符x,m次,如:'0\{5\}'匹配包含5個o的行。    
  • x\{m,\}  #重復字符x,至少m次,如:'o\{5,\}'匹配至少有5個o的行。    
  • x\{m,n\}  #重復字符x,至少m次,不多於n次,如:'o\{5,10\}'匹配5--10個o的行。   
  • \w    #匹配文字和數字字符,也就是[A-Za-z0-9],如:'G\w*p'匹配以G后跟零個或多個文字或數字字符,然后是p。   
  • \W    #\w的反置形式,匹配一個或多個非單詞字符,如點號句號等。   
  • \b    #單詞鎖定符,如: '\bgrep\b'只匹配grep。

 

分類

  • grep:
  • egrep:egrep和grep -e的效果是一樣的 ,用於擴展正則表達式
  • fgrep:就是fixed grep或fast grep,它們把所有的字母都看作單詞,也就是說,正則表達式中的元字符表示回其自身的字面意義,不再特殊

基本使用

示例:

復制代碼
[root@localhost test]# cat test.txt 
hnlinux
peida.cnblogs.com
ubuntu
ubuntu linux
redhat
Redhat
linuxmint
[root@localhost test]# cat test2.txt 
linux
Redhat
復制代碼
  • 從文件中讀取關鍵詞進行搜索

    命令:cat test.txt | grep -f test2.txt test3.txt

   說明:輸出test.txt文件中含有從test2.txt和test3.txt文件中讀取出的關鍵詞的內容行

  • 從文件中讀取關鍵詞進行搜索 且顯示行號

   命令:cat test.txt | grep -nf test2.txt

    說明:輸出test.txt文件中含有從test2.txt文件中讀取出的關鍵詞的內容行,並顯示每一行的行號

  • 從多個文件中查找包含指定關鍵詞

    命令:grep 'linux' test.txt test2.txt

  • 從多個文件中查找指定關鍵詞

    命令:grep -w 'linux' test.txt test2.txt

  • 輸出非u開頭的行內容

    命令:cat test.txt |grep ^[^u]

  • 找出已u開頭的行內容

    命令:cat test.txt |grep ^u

  • 輸出以hat結尾的行內容

    命令:cat test.txt |grep hat$

  • 過濾ip地址

    命令:ifconfig eth0|grep "[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}"

    結果:inet addr:192.168.120.204  Bcast:192.168.120.255  Mask:255.255.255.0

    命令:ifconfig eth0|grep -E "([0-9]{1,3}\.){3}[0-9]"

    結果:inet addr:192.168.120.204  Bcast:192.168.120.255  Mask:255.255.255.0

  • 顯示包含ed或者at字符的內容行

    命令:cat test.txt |grep -E "ed|at"

  • 顯示當前目錄下面以.txt 結尾的文件中的所有包含每個字符串至少有7個連續小寫字符的字符串的行

    命令:grep '[a-z]\{7\}' *.txt

  • -A 數字N:找到匹配行,並顯示后面的N行

    命令:grep -A 2 "a" test.txt

  • -B 數字N:找到匹配行,並顯示前面的N行‘

    命令:grep -B 2 "a" test.txt

  • -C 數字N:找到匹配行,並顯示前面和后面各N行‘

  命令:grep -C 2 "a" test.txt

  • 顯示匹配到的字符在文件中的偏移地址

  命令:grep -b "a" test.txt

  • 顯示有多少行被匹配到

  命令:grep -c "a" test.txt

  • -e:可以使用多個正則表達式,多個表達式之間時或的關系

  命令:grep -e "a" -e "1" test.txt

  • -i:不區分大小寫

  命令:grep -i "a" test1.txt

  • -m 數字N:最多匹配N個后停止

  命令:grep -m 2 "a" test.txt

  • -n:打印行號

  命令:grep -n -m 2 "a" test.txt

  • -o:會打印匹配到的字符

  命令:grep -n -o "a" test.txt

  • -R:在當前目錄和子目錄查找字符,如果不加-R默認是在當前目錄下查找

  命令:grep -R "a" *

  • -v:顯示不包括查找字符的所有行

  命令:grep -v "a" test.txt

  • 現在想把abc或okm篩選出來

  命令:grep "abc\|okm" test.txt

  • 把出現abc整個單詞篩選出來,不區分大小寫

  命令:grep -wi "abc" test.txt

  • 查出至少包含1,2,3,a,b其中一個的行

  命令:grep -n --color '[1-3 a-b]' test.txt

  • 任意字符開頭然后第二個字符為 ‘3’

   命令:grep -n --color  '^.3' test.txt

  • 匹配前面的字符0 次或者 多次,包括空白行也會匹配出來

  命令:grep -n --color '3\?' test.txt

  • 匹配字符串”33”但是 第二個字符‘3’只能匹配0次或者1次,因此實際匹配到的字符有“33 ”和 ‘3’這兩種

  命令:grep -n --color '33\?' test.txt

  • \+:匹配前面的字符1次或者多次

  命令:grep -n --color '3\+' test.txt

  • x\{m\}:匹配字符X m次 。x\{m,\}:匹配字符X 最少m次。x\{m,n\}:匹配字符X至少m次最多n次

  命令:grep -n --color '3\{0,1\}' test.txt

  • \|:表示或的關系

  命令:grep -n --color 'ab23ab‖23' test.txt

  • 顯示輸出第一個字符以“M”或“m”開頭,以字符“ay”結束的行

  命令: grep "[Mm]ay" test.txt

  • 顯示輸出第一個字符的范圍是“A-D”,第二個字符是“9”,第三個字符的是“D”的所有的行

  命令:grep "[A-Z][9]D" test.txt

  • 顯示輸出空行的行號

  grep -n "^$" test.txt 

  • 如果要查詢目錄列表中的目錄 同:ls -d *

  命令:ls -l |grep "^d"

  • 在一個目錄中查詢不包含目錄的所有文件

  命令:ls -l |grep "^d[d]"

  • 查詢其他用戶和用戶組成員有可執行權限的目錄集合

  命令:ls -l |grpe "^d…..x..x"

  • -e和-E用法的異同

  命令:grep -e '2|3' test.txt和grep -E '2|3' test.txt和grep -e '2' -e '3' test.txt都是等價的

  說明:上面三種命令都是表示或的關系,即,2和3至少包含一個就是符合條件的,但是grep -E 'b' -E 'd' test2.txt test1.txt這種寫法中’d‘是不生效的,並且會報:grep: d: No such file or directory

  • 同時滿足多個條件的方法

  命令:cat test.txt |grep '2' |grep '3'

  說明:此命令表示必須同時包含2和3才算符合條件

zgrep命令

  • 在查看壓縮文件(以tar.gz結尾)時

  命令:zgrep -a -A10 '19060222332049555917' za-telecom-cashloan-mics-20190602-10.253.*

  • 查詢一段時間內的日志:

  命令:zgrep -a 'repayTrialByPeriods' za-telecom-cashloan-mics-20190604-10.253.*|grep -E '2019-06-04 2[3-4]' |grep '查無相應的還款計划,或者已結清'


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM