2021-12-06 10:49:22
基本介紹
Linux系統中grep命令是一種強大的文本搜索工具,它能使用正則表達式搜索文本,並把匹 配的行打印出來。grep全稱是Global Regular Expression Print,表示全局正則表達式版本,它的使用權限是所有用戶。
grep的工作方式是這樣的,它在一個或多個文件中搜索字符串模板。如果模板包括空格,則必須被引用,模板后的所有字符串被看作文件名。搜索的結果被送到標准輸出,不影響原文件內容。
grep可用於shell腳本,因為grep通過返回一個狀態值來說明搜索的狀態,如果模板搜索成功,則返回0,如果搜索不成功,則返回1,如果搜索的文件不存在,則返回2。我們利用這些返回值就可進行一些自動化的文本處理工作。
表達式
grep [option] pattern file 注意:后面可以跟多個file
參數介紹
- -a 不要忽略二進制數據。
- -A<顯示列數> 除了顯示符合范本樣式的那一行之外,並顯示該行之后的內容。
- -b 在顯示符合范本樣式的那一行之外,並顯示該行之前的內容。
- -c 計算符合范本樣式的列數。
- -C<顯示列數>或-<顯示列數> 除了顯示符合范本樣式的那一列之外,並顯示該列之前后的內容。
- -d<進行動作> 當指定要查找的是目錄而非文件時,必須使用這項參數,否則grep命令將回報信息並停止動作。
- -e<范本樣式> 指定字符串作為查找文件內容的范本樣式。
- -E 將范本樣式為延伸的普通表示法來使用,意味着能使用擴展正則表達式。
- -f<范本文件> 指定范本文件,其內容有一個或多個范本樣式,讓grep查找符合范本條件的文件內容,格式為每一列的范本樣式。
- -F 將范本樣式視為固定字符串的列表。
- -G 將范本樣式視為普通的表示法來使用。
- -h 在顯示符合范本樣式的那一列之前,不標示該列所屬的文件名稱(不顯示匹配到的文件名)。
- -H 在顯示符合范本樣式的那一列之前,標示該列的文件名稱。
- -i 胡列字符大小寫的差別。
- -l 列出文件內容符合指定的范本樣式的文件名稱。
- -L 列出文件內容不符合指定的范本樣式的文件名稱。
- -n 在顯示符合范本樣式的那一列之前,標示出行號。
- -q 不顯示任何信息。
- -R/-r 此參數的效果和指定“-d recurse”參數相同。
- -s 不顯示錯誤信息。
- -v 反轉查找,也就是顯示沒有匹配行。
- -w 只顯示全字符合的列。
- -x 只顯示全列符合的列。
- -y 此參數效果跟“-i”相同。
- -o 只輸出文件中匹配到的部分。
- --color=auto :可以將找到的關鍵詞部分加上顏色的顯示喔!
規則表達式:
- grep的規則表達式:
- ^ #錨定行的開始 如:'^grep'匹配所有以grep開頭的行。
- $ #錨定行的結束 如:'grep$'匹配所有以grep結尾的行。
- . #匹配一個非換行符的字符 如:'gr.p'匹配gr后接一個任意字符,然后是p。
- * #匹配零個或多個先前字符 如:'*grep'匹配所有一個或多個空格后緊跟grep的行。
- .* #一起用代表任意字符。
- [] #匹配一個指定范圍內的字符,如'[Gg]rep'匹配Grep和grep。
- [^] #匹配一個不在指定范圍內的字符,如:'[^A-FH-Z]rep'匹配不包含A-R和T-Z的一個字母開頭,緊跟rep的行。
- \(..\) #標記匹配字符,如'\(love\)',love被標記為1。
- \< #錨定單詞的開始,如:'\<grep'匹配包含以grep開頭的單詞的行。
- \> #錨定單詞的結束,如'grep\>'匹配包含以grep結尾的單詞的行。
- x\{m\} #重復字符x,m次,如:'0\{5\}'匹配包含5個o的行。
- x\{m,\} #重復字符x,至少m次,如:'o\{5,\}'匹配至少有5個o的行。
- x\{m,n\} #重復字符x,至少m次,不多於n次,如:'o\{5,10\}'匹配5--10個o的行。
- \w #匹配文字和數字字符,也就是[A-Za-z0-9],如:'G\w*p'匹配以G后跟零個或多個文字或數字字符,然后是p。
- \W #\w的反置形式,匹配一個或多個非單詞字符,如點號句號等。
- \b #單詞鎖定符,如: '\bgrep\b'只匹配grep。
分類
- grep:
- egrep:egrep和grep -e的效果是一樣的 ,用於擴展正則表達式
- fgrep:就是fixed grep或fast grep,它們把所有的字母都看作單詞,也就是說,正則表達式中的元字符表示回其自身的字面意義,不再特殊
基本使用
示例:
[root@localhost test]# cat test.txt
hnlinux
peida.cnblogs.com
ubuntu
ubuntu linux
redhat
Redhat
linuxmint
[root@localhost test]# cat test2.txt
linux
Redhat
- 從文件中讀取關鍵詞進行搜索
命令:cat test.txt | grep -f test2.txt test3.txt
說明:輸出test.txt文件中含有從test2.txt和test3.txt文件中讀取出的關鍵詞的內容行
- 從文件中讀取關鍵詞進行搜索 且顯示行號
命令:cat test.txt | grep -nf test2.txt
說明:輸出test.txt文件中含有從test2.txt文件中讀取出的關鍵詞的內容行,並顯示每一行的行號
- 從多個文件中查找包含指定關鍵詞
命令:grep 'linux' test.txt test2.txt
- 從多個文件中查找指定關鍵詞
命令:grep -w 'linux' test.txt test2.txt
- 輸出非u開頭的行內容
命令:cat test.txt |grep ^[^u]
- 找出已u開頭的行內容
命令:cat test.txt |grep ^u
- 輸出以hat結尾的行內容
命令:cat test.txt |grep hat$
- 過濾ip地址
命令:ifconfig eth0|grep "[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}"
結果:inet addr:192.168.120.204 Bcast:192.168.120.255 Mask:255.255.255.0
命令:ifconfig eth0|grep -E "([0-9]{1,3}\.){3}[0-9]"
結果:inet addr:192.168.120.204 Bcast:192.168.120.255 Mask:255.255.255.0
- 顯示包含ed或者at字符的內容行
命令:cat test.txt |grep -E "ed|at"
- 顯示當前目錄下面以.txt 結尾的文件中的所有包含每個字符串至少有7個連續小寫字符的字符串的行
命令:grep '[a-z]\{7\}' *.txt
- -A 數字N:找到匹配行,並顯示后面的N行
命令:grep -A 2 "a" test.txt
- -B 數字N:找到匹配行,並顯示前面的N行‘
命令:grep -B 2 "a" test.txt
- -C 數字N:找到匹配行,並顯示前面和后面各N行‘
命令:grep -C 2 "a" test.txt
- 顯示匹配到的字符在文件中的偏移地址
命令:grep -b "a" test.txt
- 顯示有多少行被匹配到
命令:grep -c "a" test.txt
- -e:可以使用多個正則表達式,多個表達式之間時或的關系
命令:grep -e "a" -e "1" test.txt
- -i:不區分大小寫
命令:grep -i "a" test1.txt
- -m 數字N:最多匹配N個后停止
命令:grep -m 2 "a" test.txt
- -n:打印行號
命令:grep -n -m 2 "a" test.txt
- -o:會打印匹配到的字符
命令:grep -n -o "a" test.txt
- -R:在當前目錄和子目錄查找字符,如果不加-R默認是在當前目錄下查找
命令:grep -R "a" *
- -v:顯示不包括查找字符的所有行
命令:grep -v "a" test.txt
- 現在想把abc或okm篩選出來
命令:grep "abc\|okm" test.txt
- 把出現abc整個單詞篩選出來,不區分大小寫
命令:grep -wi "abc" test.txt
- 查出至少包含1,2,3,a,b其中一個的行
命令:grep -n --color '[1-3 a-b]' test.txt
- 任意字符開頭然后第二個字符為 ‘3’
命令:grep -n --color '^.3' test.txt
- 匹配前面的字符0 次或者 多次,包括空白行也會匹配出來
命令:grep -n --color '3\?' test.txt
- 匹配字符串”33”但是 第二個字符‘3’只能匹配0次或者1次,因此實際匹配到的字符有“33 ”和 ‘3’這兩種
命令:grep -n --color '33\?' test.txt
- \+:匹配前面的字符1次或者多次
命令:grep -n --color '3\+' test.txt
- x\{m\}:匹配字符X m次 。x\{m,\}:匹配字符X 最少m次。x\{m,n\}:匹配字符X至少m次最多n次
命令:grep -n --color '3\{0,1\}' test.txt
- \|:表示或的關系
命令:grep -n --color 'ab∥23ab‖23' test.txt
- 顯示輸出第一個字符以“M”或“m”開頭,以字符“ay”結束的行
命令: grep "[Mm]ay" test.txt
- 顯示輸出第一個字符的范圍是“A-D”,第二個字符是“9”,第三個字符的是“D”的所有的行
命令:grep "[A-Z][9]D" test.txt
- 顯示輸出空行的行號
grep -n "^$" test.txt
- 如果要查詢目錄列表中的目錄 同:ls -d *
命令:ls -l |grep "^d"
-
在一個目錄中查詢不包含目錄的所有文件
命令:ls -l |grep "^d[d]"
-
查詢其他用戶和用戶組成員有可執行權限的目錄集合
命令:ls -l |grpe "^d…..x..x"
- -e和-E用法的異同
命令:grep -e '2|3' test.txt和grep -E '2|3' test.txt和grep -e '2' -e '3' test.txt都是等價的
說明:上面三種命令都是表示或的關系,即,2和3至少包含一個就是符合條件的,但是grep -E 'b' -E 'd' test2.txt test1.txt這種寫法中’d‘是不生效的,並且會報:grep: d: No such file or directory
- 同時滿足多個條件的方法
命令:cat test.txt |grep '2' |grep '3'
說明:此命令表示必須同時包含2和3才算符合條件
zgrep命令
- 在查看壓縮文件(以tar.gz結尾)時:
命令:zgrep -a -A10 '19060222332049555917' za-telecom-cashloan-mics-20190602-10.253.*
- 查詢一段時間內的日志:
命令:zgrep -a 'repayTrialByPeriods' za-telecom-cashloan-mics-20190604-10.253.*|grep -E '2019-06-04 2[3-4]' |grep '查無相應的還款計划,或者已結清'