linux grep 命令用於查找文件里符合條件的字符串。
grep 指令用於查找內容包含指定的范本樣式的文件,如果發現某文件的內容符合所指定的范本樣式,預設 grep 指令會把含有范本樣式的那一列顯示出來。若不指定任何文件名稱,或是所給予的文件名為 -,則 grep 指令會從標准輸入設備讀取數據。
語法
grep [-abcEFGhHilLnqrsvVwxy][-A<顯示行數>][-B<顯示列數>][-C<顯示列數>][-d<進行動作>][-e<范本樣式>][-f<范本文件>][--help][范本樣式][文件或目錄...]
參數:
- -a 或 --text : 不要忽略二進制的數據。
- -A<顯示行數> 或 --after-context=<顯示行數> : 除了顯示符合范本樣式的那一列之外,並顯示該行之后的內容。
- -b 或 --byte-offset : 在顯示符合樣式的那一行之前,標示出該行第一個字符的編號。
- -B<顯示行數> 或 --before-context=<顯示行數> : 除了顯示符合樣式的那一行之外,並顯示該行之前的內容。
- -c 或 --count : 計算符合樣式的列數。
- -C<顯示行數> 或 --context=<顯示行數>或-<顯示行數> : 除了顯示符合樣式的那一行之外,並顯示該行之前后的內容。
- -d <動作> 或 --directories=<動作> : 當指定要查找的是目錄而非文件時,必須使用這項參數,否則grep指令將回報信息並停止動作。
- -e<范本樣式> 或 --regexp=<范本樣式> : 指定字符串做為查找文件內容的樣式。
- -E 或 --extended-regexp : 將樣式為延伸的正則表達式來使用。
- -f<規則文件> 或 --file=<規則文件> : 指定規則文件,其內容含有一個或多個規則樣式,讓grep查找符合規則條件的文件內容,格式為每行一個規則樣式。
- -F 或 --fixed-regexp : 將樣式視為固定字符串的列表。
- -G 或 --basic-regexp : 將樣式視為普通的表示法來使用。
- -h 或 --no-filename : 在顯示符合樣式的那一行之前,不標示該行所屬的文件名稱。
- -H 或 --with-filename : 在顯示符合樣式的那一行之前,表示該行所屬的文件名稱。
- -i 或 --ignore-case : 忽略字符大小寫的差別。
- -l 或 --file-with-matches : 列出文件內容符合指定的樣式的文件名稱。
- -L 或 --files-without-match : 列出文件內容不符合指定的樣式的文件名稱。
- -n 或 --line-number : 在顯示符合樣式的那一行之前,標示出該行的列數編號。
- -o 或 --only-matching : 只顯示匹配PATTERN 部分。
- -q 或 --quiet或--silent : 不顯示任何信息。
- -r 或 --recursive : 此參數的效果和指定"-d recurse"參數相同。
- -s 或 --no-messages : 不顯示錯誤信息。
- -v 或 --invert-match : 顯示不包含匹配文本的所有行。
- -V 或 --version : 顯示版本信息。
- -w 或 --word-regexp : 只顯示全字符合的列。
- -x --line-regexp : 只顯示全列符合的列。
- -y : 此參數的效果和指定"-i"參數相同。
實例
1、在當前目錄中,查找后綴有 file 字樣的文件中包含 test 字符串的文件,並打印出該字符串的行。此時,可以使用如下命令:
grep test *file
結果如下所示:
$ grep test test* #查找前綴有“test”的文件包含“test”字符串的文件 testfile1:This a Linux testfile! #列出testfile1 文件中包含test字符的行 testfile_2:This is a linux testfile! #列出testfile_2 文件中包含test字符的行 testfile_2:Linux test #列出testfile_2 文件中包含test字符的行
2、以遞歸的方式查找符合條件的文件。例如,查找指定目錄/etc/acpi 及其子目錄(如果存在子目錄的話)下所有文件中包含字符串"update"的文件,並打印出該字符串所在行的內容,使用的命令為:
grep -r update /etc/acpi
輸出結果如下:
$ grep -r update /etc/acpi #以遞歸的方式查找“etc/acpi” #下包含“update”的文件 /etc/acpi/ac.d/85-anacron.sh:# (Things like the slocate updatedb cause a lot of IO.) Rather than /etc/acpi/resume.d/85-anacron.sh:# (Things like the slocate updatedb cause a lot of IO.) Rather than /etc/acpi/events/thinkpad-cmos:action=/usr/sbin/thinkpad-keys--update
3、反向查找。前面各個例子是查找並打印出符合條件的行,通過"-v"參數可以打印出不符合條件行的內容。
查找文件名中包含 test 的文件中不包含test 的行,此時,使用的命令為:
grep -v test *test*
結果如下所示:
$ grep-v test* #查找文件名中包含test 的文件中不包含test 的行 testfile1:helLinux! testfile1:Linis a free Unix-type operating system. testfile1:Lin testfile_1:HELLO LINUX! testfile_1:LINUX IS A FREE UNIX-TYPE OPTERATING SYSTEM. testfile_1:THIS IS A LINUX TESTFILE! testfile_2:HELLO LINUX! testfile_2:Linux is a free unix-type opterating system.
Linux 里利用 grep 和 find 命令查找文件內容
從文件內容查找匹配指定字符串的行:
$ grep "被查找的字符串" 文件名
例子:在當前目錄里第一級文件夾中尋找包含指定字符串的 .in 文件
grep "thermcontact" /.in
從文件內容查找與正則表達式匹配的行:
$ grep –e "正則表達式" 文件名
查找時不區分大小寫:
$ grep –i "被查找的字符串" 文件名
查找匹配的行數:
$ grep -c "被查找的字符串" 文件名
從文件內容查找不匹配指定字符串的行:
$ grep –v "被查找的字符串" 文件名
從根目錄開始查找所有擴展名為 .log 的文本文件,並找出包含 "ERROR" 的行:
$ find / -type f -name "*.log" | xargs grep "ERROR"
例子:從當前目錄開始查找所有擴展名為 .in 的文本文件,並找出包含 "thermcontact" 的行:
find . -name "*.in" | xargs grep "thermcontact"
grep命令_Linux grep命令:文本搜索工具(可使用正則表達式)
grep、egrep、fgrep/ \
(選項) (-E) (-F)
/ \
egrep fgrep
從上面的關系圖可以看出,egrep 和 fgrep 都可以通過 grep 加上不同選項來實現,真是“打斷胳膊連着筋”,血脈相親的一家人啊。它們三兄弟,各有特點,如表 1 所示。
grep 入門招式
grep 是能力最全面的,下面我們就先來學習 grep,圍繞 /etc/passwd 文件來講解 grep 的作用。注意上面的
--color
選項,它的作用是高亮我們查找的字符串,這里,leo 字符串變成了紅色字體。grep 的反查技能
下面來搜索不包含 leo 字符串的行。我們使用
-v
選項實現了反查效果,可以看到,含有 leo 的行都沒有展示出來。grep 展示行號和統計行數
有時,我們希望 grep 不僅能搜索到字符串,還能展示出它們位於文件的第幾行,這時我們可以使用-n
選項來實現這個效果。來看看包含 leo 的行位於文件的第幾行。
大家注意觀察輸出內容的開頭部分,leo 前的內容表示的就是行位置信息,原來是在第 29 行呀!
另外一些時候,我們希望 grep 不要輸出搜索到的行的內容,而是簡單地告訴我們到底搜索到了多少行就好了,試試
-c
選項吧。 輸出很簡單,這表示含有 leo 的行只有 1 行。grep 能環顧四周
我想搜索包含 leo 的行,但 grep 在輸出時,最好能把 leo 所在行的上面或下面相鄰的行也都展示出來。我們來看看 grep 是如何做到的。
上面示例中的
-A
選項,是 After 的縮寫,表示除了展示匹配行之外,還要展示出匹配行下面的若干行。而示例中的 -A 1 則表示還展示匹配行下面一行的內容。上面示例中的
-B
選項,是 Before 的縮寫,表示除了展示匹配行之外,還要展示出匹配行上面的若干行。而示例中的 -B 1 則表示還展示匹配行上面一行的內容。上面示例中使用了
-C
選項,它是-A
和-B
選項的合體,表示除了展示匹配行之外,還要展示出匹配行上面和下面各若干行。而示例中的 -C 1 則表示還展示匹配行上面一行和下面一行的內容。讓 grep 不要區分大小寫
在搜索過程中,我們有時候希望不要區分字母的大小寫,這樣做可以提高搜索命中的概率,而-i選項則可以幫我們這個忙。看到了吧,即便我們把要搜索的字符串指定為全部大寫的 LEO,仍然可以順利地搜索到全部小寫的 leo。
grep 處理多文件
grep 命令可以一次搜索很多個文件,最常使用的一個場景就是:從大量的文件中找出含有特定字符的文件。下面我們來試驗一下。我們的搜索需求是,找出內容中含有first單詞的文件都有哪些。我們希望得到的是一個文件列表。
原來只有 1.txt 文件中包含有 first 單詞。如果我想找出不含 first 單詞的文件都有哪些,該如何操作呢? 反向操作就要用反向選項,只需把 -l 變成 -L 即可。
grep 也正則
上面講解的內容,更多的是以普通字符串作為搜索對象的,接下來的內容里,我們會更多地設置一些復雜的搜索需求,讓大家體會到正則的好處與威力。我們希望搜索/etc/passwd文件中開頭是 leo 的行:
看到了吧,我們使用“^leo”表達了“開頭是 leo 的行”,而 grep 也心領神會,幫我們找到了所求。
那如果我們希望搜索 /etc/passwd 文件中行尾是 bash 的行呢? 使用“bash$”即可,你會發現正則表達式其實並不難。
有關“詞”的知識
我們希望搜索含有 bin 這個詞的行,按照原來我們學到的知識,一定會這樣來搜索:但是,你會發現,這樣的搜索結果有一個問題,那就是連 sbin 這樣的詞也會被搜索出來,而我們並不想看到這樣的結果。這個問題,算是一個比較難的問題了,需要我們了解“詞”的定義,以及知道正則表達式中如何表示一個“詞”。
首先,正則表達式中的“詞(word)”,一般是由字母、數字和下划線所組成的,且詞與詞之間通常使用空格、制表符或換行符分隔。舉個例子,“I love you.”中的“love”就是一個“詞”,但“My gloves are red.”中的“love”就不能稱作一個“詞”。
在正則表達式中,我們通常用尖括號表示一個“詞”,比如能夠匹配“I love you.”,但不能匹配“My gloves are red.”。
下面我們通過示例學習這個知識點:
我們通過使用
\<
和\>
來准確匹配到了 bin 這個詞,而 sbin 卻被擋在了門外。其實,上面的方法還是有些復雜了,grep 中還有一個更加簡單的方法來實現對“詞”的搜索:
grep 的多條件查找
如果我想查找以 root 為行首的或以 bash 為行尾的行,那應該怎么查找呢?這時就要有請我們的二師兄 egrep 來幫忙了。我們通過 egrep 命令實現了兩個條件的搜索,其中“|”符號表示“或”,連接了兩個搜索條件。
同樣的搜索需求,grep 就沒有辦法滿足(除非使用-E選項):
這就是 grep 和 egrep的區別了,grep 的正則表達式是基本正則表達式,而 egrep 的正則表達式是擴展正則表達式,這兩種表達式是有區別的,下面我們就一起來看看它們的區別。
基本正則表達式和擴展正則表達式
世界上的正則表達式種類繁多且復雜,面對這樣的狀況,POSIX 將正則表達式進行了標准化,並把實現方法分為了兩大類:兩者的區別,更多的是元字符的區別。
在基本正則表達式(BRE)中,只承認“^”、“$”、“.”、“[”、“]”、“*”這些是元字符,所有其他的字符都被識別為普通字符。
而在擴展正則表達式(ERE)中,則在BRE的基礎上增加了“(”、“)”、“{”、“}”、“?”和“+”、“|”等元字符。
最后要特別說明的一點,只有在用反斜杠進行轉義的情況下,字符“(”、“)”、“{”和“}”才會在擴展正則表達式(ERE)中被當作元字符處理,而在基本正則表達式(ERE)中,任何元字符前面加上反斜杠反而會使其被當作普通字符來處理。這樣的設計,有些奇葩,同學們一定要記清楚哦。
三師弟 fgrep 最朴素
grep 和 egrep 都支持正則表達式,但 fgrep 卻完全不支持正則表達式。 這個示例證明了 fgrep 的確不支持正則表達式。那 fgrep 還有用武之地么?答案是肯定的。當我們搜索時,假如搜索字符串中包含了不少特殊字符,而這些特殊字符恰好又是正則表達式預留的字符,比如說“^”、“$”等,這時,我們就可以使用 fgrep 來避免煩瑣的轉義了,因為我們心里知道,在 fgrep 的眼里,沒有特殊字符,都是普通字符。我們來看下面的示例。