正則表達式的子模式詳解


首先,我們先看一段PHP代碼:

<?php
    $time = date ("Y-m-d H:i:s");
    $pattern = "/\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2}/i"; 
    if(preg_match($pattern,$time,$arr)){
    echo "<pre>";
    print_r($arr);        
    echo "</pre>";
    }
?>

顯示結果:

Array
(
    [0] => 2012-06-23 03:08:45
)

有沒有注意到,顯示的結果只有一條數據,即符合匹配模式的時間格式,那如果只有一條記錄的話,為什么還要用數組保存呢?直接使用字符串保存不是更好?

帶着這個問題,我們來看下正則表達式中的子模式。

在正則表達式中,可以使用“(”和“)”將模式中的子字符串括起來,以形成一個子模式。將子模式視為一個整體時,那么它就相當於一個單個字符。

比如,我們將以上的代碼稍微修改下,改成如下:

 

<?php
    $time = date ("Y-m-d H:i:s");
    $pattern = "/(\d{4})-(\d{2})-(\d{2}) (\d{2}):(\d{2}):(\d{2})/i"; 
    if(preg_match($pattern,$time,$arr)){
    echo "<pre>";
    print_r($arr);        
    echo "</pre>";
    }
?>

注意:我只修改了$pattern,在匹配模式中,使用了括號()

執行結果:

Array
(
    [0] => 2012-06-23 03:19:23
    [1] => 2012
    [2] => 06
    [3] => 23
    [4] => 03
    [5] => 19
    [6] => 23
)
總結:我們可以使用小括號給整個匹配模式進行分組,默認情況下,每個分組會自動擁有一個組號,規則是,從左到右,以分組的左括號為標志,第一個出現的分組為組號1,第二個為組號2,以此類推。其中,分組0對應整個正則表達式。
對整個正則匹配模式進行了分組以后,就可以進一步使用“向后引用”來重復搜索前面的某個分組匹配的文本。例如:\1代表分組1匹配的文本,\2代表分組2匹配的文本等等
我們可以進一步修改下代碼,如下所示:
<?php
    $time = date ("Y-m-d H:i:s");
    $pattern = "/(\d{4})-(\d{2})-(\d{2}) (\d{2}):(\d{2}):(\d{2})/i";
    $replacement = "\$time格式為:$0<BR>替換后的格式為:\\1年\\2月\\3日 \\4時\\5分\\6秒";
    print preg_replace($pattern, $replacement, $time);
    if(preg_match($pattern,$time,$arr)){
        echo "<pre>";
        print_r($arr);        
        echo "</pre>";
    }
?>

 

注意:

  1. 因為是在雙引號中,所以使用分組的時候應該使用兩個反斜杠,如:\\1,而如果在單引號中,則使用一個反斜杠就可以了,如:\1
  2. \\1用於捕獲分組一種的內容:2012,\\6用於捕獲分組6中的內容          

執行結果:

$time格式為:2012-06-23 03:30:31
替換后的格式為:2012年06月23日 03時30分31秒
Array
(
    [0] => 2012-06-23 03:30:31
    [1] => 2012
    [2] => 06
    [3] => 23
    [4] => 03
    [5] => 30
    [6] => 31
)

 




免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM