perl中grep的詳細用法

本文轉載自查看原文 2014-05-21 18:07 5519 perl grep函數/ perl

最近一直在學習perl語言，下面介紹下如果和在perl編程中使用強大的grep函數。

1. Grep函數
grep有2種表達方式：

1 grep BLOCK LIST
2 grep EXPR, LIST

BLOCK表示一個code塊，通常用{}表示；EXPR表示一個表達式，通常是正則表達式。原文說EXPR可是任何東西，包括一個或多個變量，操作符，文字，函數，或子函數調用。
LIST是要匹配的列表。
grep對列表里的每個元素進行BLOCK或EXPR匹配，它遍歷列表，並臨時設置元素為$_。在列表上下文里，grep返回匹配命中的所有元素，結果也是個列表。在標量上下文里，grep返回匹配命中的元素個數。
2. Grep 和 loops

1 open FILE "&lt;myfile"ordie"Can't open myfile: $!";
2 print grep /terrorism|nuclear/i,&lt;FILE&gt;;

這里打開一個文件myfile，然后查找包含terrorism或nuclear的行。<FILE>返回一個列表，它包含了文件的完整內容。可能你已發現，如果文件很大的話，這種方式很耗費內存，因為文件的所有內容都拷貝到內存里了。
當然你也可以使用loop（循環）來完成：

1  while($line =&lt;FILE&gt;;){
2     if($line =~/terrorism|nuclear/i){print $line }
3     }

上述code顯示，loop可以完成grep能做的任何事情。那為什么還要用grep呢？答案是grep更具perl風格，而loop是C風格的。
更好的解釋是：（1）grep讓讀者更顯然的知道，你在從列表里選擇某元素；（2）grep比loop簡潔。
一點建議：如果你是perl新手，那就規矩的使用loop比較好；等你熟悉perl了，就可使用grep這個有力的工具。
3.幾個grep的示例

1. 統計匹配表達式的列表元素個數

$num_apple = grep /^apple$/i,@fruits;

在標量上下文里，grep返回匹配中的元素個數；在列表上下文里，grep返回匹配中的元素的一個列表。
所以，上述code返回apple單詞在@fruits數組中存在的個數。因為$num_apple是個標量，它強迫grep結果位於標量上下文里。

2. 從列表里抽取唯一元素

1 @unique= grep {++$count{$_}&lt;2}
2 qw(a b a c d d e f g f h h);
3 print"@unique\n";

上述code運行后會返回：a b c d e f g h
即qw(a b a c d d e f g f h h)這個列表里的唯一元素被返回了。為什么會這樣呀？讓我們看看：
%count是個hash結構，它的key是遍歷qw()列表時，逐個抽取的列表元素。++$count{$_}表示$_對應的hash值自增。在這個比較上下文里，++$count{$_}與$count{$_}++的意義是不一樣的哦，前者表示在比較之前，就將自身值自增1；后者表示在比較之后，才將自身值自增1。所以，++$count{$_} < 2 表示將$count{$_}加1，然后與2進行比較。$count{$_}值默認是undef或0。所以當某個元素a第一次被當作hash的關鍵字時，它自增后對應的hash值就是1，當它第二次當作hash關鍵字時，對應的hash值就變成2了。變成2后，就不滿足比較條件了，所以a不會第2次出現。
所以上述code就能從列表里唯一1次的抽取元素了。

2. 抽取列表里精確出現2次的元素

1     @crops= qw(wheat corn barley rice corn soybean hay
2     alfalfa rice hay beets corn hay);
3     @duplicates= grep { $count{$_}==2}
4     grep {++$count{$_}&gt;;1}@crops;
5     print"@duplicates\n";

運行結果是：rice
這里grep了2次哦，順序是從右至左。首先grep { ++$count{$_} >; 1 } @crops;返回一個列表，列表的結果是@crops里出現次數大於1的元素。
然后再對產生的臨時列表進行grep { $count{$_} == 2 }計算，這里的意思你也該明白了，就是臨時列表里，元素出現次數等於2的被返回。
所以上述code就返回rice了，rice出現次數大於1，並且精確等於2，明白了吧？

3. 在當前目錄里列出文本文件

1     @files= grep {-f and-T } glob '* .*';
2     print"@files\n";

glob返回一個列表，它的內容是當前目錄里的任何文件，除了以’.'開頭的。{}是個code塊，它包含了匹配它后面的列表的條件。這只是 grep的另一種用法，其實與 grep EXPR,LIST 這種用法差不多了。-f and -T 匹配列表里的元素，首先它必須是個普通文件，接着它必須是個文本文件。據說這樣寫效率高點哦，因為-T開銷更大，所以在判斷-T前，先判斷-f了。

4. 選擇數組元素並消除重復

1     @array= qw(To be ornot to be that is the question);
2     @found_words=
3     grep { $_ =~/b|o/i and++$counts{$_}&lt;2;}@array;
4     print"@found_words\n";
5

運行結果是：To be or not to question
{}里的意思就是，對@array里的每個元素，先匹配它是否包含b或o字符（不分大小寫），然后每個元素出現的次數，必須小於2（也就是1次啦）。
grep返回一個列表，包含了@array里滿足上述2個條件的元素。

5. 從二維數組里選擇元素，並且x<y

1     # An array of references to anonymous arrays
2     @data_points=([5,12],[20,-3],
3     [2,2],[13,20]);
4     @y_gt_x= grep { $_-&gt;;[0]&lt; $_-&gt;;[1]}@data_points;
5     foreach $xy (@y_gt_x){print"$xy-&gt;;[0], $xy-&gt;;[1]\n"}

運行結果是：
5, 12
13, 20
這里，你應該理解匿名數組哦，[]是個匿名數組，它實際上是個數組的引用（類似於C里面的指針）。
@data_points的元素就是匿名數組。例如：

1     foreach(@data_points){
2     print $_-&gt;;[0];}

這樣訪問到匿名數組里的第1個元素，把0替換成1就是第2個元素了。
所以{ $_->;[0] < $_->;[1] }就很明白了哦，它表示每個匿名數組的第一個元素的值，小於第二個元素的值。
而grep { $_->;[0] < $_->;[1] } @data_points; 就會返回滿足上述條件的匿名數組列表。

參考：perl語言學習

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Perl 中 Pod 的基本用法。 linux中grep用法（“或”、“與”） "箭頭的意義及用法"> Perl中"—>"箭頭的意義及用法 Linux find、grep命令詳細用法 shell腳本中GREP的用法 linux中grep命令的用法 linux中grep命令的用法 shell腳本中grep的用法 linux中grep命令的用法 Linux中grep搜索用法