轉自於:http://fatmouse.xyz/2016/05/10/2016-05-10-find-grep-xargs-and-pipe/
問題
相信大家都知道在目錄中搜索含有固定字符串文件的命令:
1 |
find . -name '*.py' |xargs grep test |
剛開始的時候,我不熟悉xargs
命令,所以直接使用的命令是
1 |
find . -name '*.py' |grep test |
結果並不是自己所期望的。此命令只是找出文件名*.txt
有test
的情況。
這里我就研究一下,究竟xargs
做了什么,使得結果不相同。
參數與標准輸入
這兩個詞我們在Linux命令中是很常見的。但是參數和標准輸入其實是有區別的。我們日常使用的很多命令,例如ls -lah .
中。l
, a
, h
,.
都是命令ls
的參數。至於標准輸入,可以說它某種流數據。而通常來講標准輸入的流數據來源就是我們的終端輸入。在Linux命令中,有些命令可以接收標准輸入,有些是不能的。像上面的ls
,就是只能接收參數,不能接收標准輸入。像cat
命令或echo
命令,這些是可以的。
怎么分辨一個命令可不可以接收標准輸入?很簡單,當你敲完命令回車后,終端會等待接收你的輸入,例如當你在終端輸入cat
后,終端會等待你輸入字符,當你輸入一些字符后,然后按Ctrl-C
發送終止符號。這時cat
命令接收標准輸入完畢,執行命令,也就是將剛才鍵入的內容輸出的標准輸出上(屏幕)。
管道
管道的作用是將前面命令的標准輸出作為后面命令的標准輸入。這里要注意,后面的命令接收的是標准輸入,所以如果命令不支持接收標准輸入,那么就不能直接使用管道,例如常用的ls
命令,只能使用參數,而不能使用標准輸入,所以[command] | ls
是不能使用的。而命令如echo
或cat
就可以。那么肯定有方法來實現這些不能使用標准輸入的命令與管道結合,這時候xargs
便出場了。
xargs命令
xargs
命令通俗來講就是將標准輸入轉成各種格式化的參數,所以命令[command 1] | xargs [command 2]
就是將command 1
的標准輸出結果,通過管道|
變成xargs
的標准輸入,然后xargs
再將此標准輸入變成參數,傳給[command 2]
。這樣一來,通過xargs
命令,我們便可以在管道后面使用那些不接收標准輸入的命令了。例如[command 1]|xargs ls
,是不是很熟悉?
find與grep
有了以上的知識點,到這里終於可以解答最開始的問題了。為什么命令
1 |
find . -name '*.py' |grep test |
和
1 |
find . -name '*.py' |xargs grep test |
的結果是不一樣的了。
我們首先來查看grep手冊。通過man grep
命令。
1 |
DESCRIPTION |
這里可以看到grep是支持標准輸入的。
假設目錄存在如下文件:
1 |
$ ls |
那么對於第一個命令find . -name '*.py' |grep test
,是將前面命令的標准輸出作為標准輸入傳給了grep test
,那么grep
是從這些標准輸入尋找test
字符,也就是文件名組成的字符流
1 |
$ find . -name '*.py' |grep test |
可以看到最終選擇出的是這些文件名。
而對於第二個命令find . -name '*.py' |xargs grep test
,通過xargs
,find
得到的文件名成為了參數傳給后面的grep
,那么這時候這些文件名就是實實在在的文件標識,grep
接收后會按正常的使用方式在各文件中搜尋字符串。
1 |
#find . -name '*.py' |xargs grep test |
到這里算是將find
,grep
,xargs
和管道的作用理解清楚了。
xargs
還有指定參數位置的作用。假設我們要將目錄下所有的.py
文件放到Python目錄中去,可以使用命令find . -name '*.py' | xargs -I {} mv {} ./Python
參數-I
指定了管道前命令作為參數所應該在管道后面命令的位置。我們在查看很多命令手冊時,手冊會說明命令的使用方法。例如
grep [OPTIONS] PATTERN [FILE...]
,也就是命令的最后一個位置是文件名[FILE]。
這里要注意這個文件名[FILE]也是參數。