PHP正則表達式,看這一篇就夠啦!


前言

不知道你們有沒有這個感覺,看正則表達式就像看天文數字一樣,什么電話號碼、郵箱的正則表達式,上網復制一下粘貼下來就搞定了。完全不知道這寫的是什么玩意。后來我自己也想學一下,因為感覺用處還是挺大的。看了看視頻,額...真**簡單。這里的話如果想看視頻學習的話我推薦一下慕課網這門鬼斧神工之正則表達式課程,上手真的太快了。好了,廢話不多說,開始搞事情。

基本語法

界定符:

標識一個正則表達式的開始和結束,用'/'或'#'或'{ }',因為語法'{ }'也可能是正則表達式的運算符,為了避免混淆,所以不建議使用。建議的用法如下:

$pattern = '/[0-9]/';  //我喜歡這個,看起來比較簡潔 
$pattern = '#[0-9]#';

原子:

可見原子:Unicode編碼表中可用鍵盤輸出后肉眼可見的字符,例如:標點 ; . / ? 或者英文字母,漢字等等可見字符
不可見原子:Unicode編碼表中可用鍵盤輸出后肉眼不可見的字符,例如:換行符 \n,Tab制表符\t, 空格等等,
一般只用這三個(換行符一般和其他字符一起匹配,因為只有換行符是匹配不到的)
小提示:匹配運算符前面需要加 '\' 例如:'+' 號,匹配的話需要寫出 '\+'

元字符

原子的篩選方式:

| 匹配兩個或者多個分支選擇
[] 匹配方括號中的任意一個原子
[^] 匹配除方括號中的原子之外的任意字符;
例子:Duang|duang 或者 [Dd]uang 都可以匹配到Duang和duang
區間寫法:[a-z]匹配a到z的字符, [0-9]匹配0到9的字符。也可以[a-z0-9]
. 匹配除換行符之外的任意字符
\d 匹配任意一個十進制數字,即{0-9]
\D 匹配任意一個非十進制數字[^0-9] 相當於[^\d]
\s 匹配一個不可見的原子,即[\f\n\r\t\v]
\S 匹配一個可見的原子,即[\f\n\r\t\v],相當於[\s]z
\w 匹配任意一個數字、字母或下划線,即[0-9a-zA-Z_]
\W 匹配任意一個非數字、字母或下划線,[0-9a-zA-Z_],相當於[\w]

量詞

{n} 表示其前面的原子剛好出現了n次。
[n] 表示其前面的原子最少出現n次
{n,m} 最少出現n次,最多出現m次
* 匹配0次、一次或者多次,即{0,}
+ 匹配一次或多次,即{1,}
? 匹配0或1次,即{0,1}

邊界控制

^ 匹配字符串開始的位置
$ 匹配字符串結尾的位置
例:^John 可以匹配到:John 但是匹配不到:123John,因為規定了字符串以John開頭

模式單元

() 匹配其中的整體為一個原子, 如: (X|x)iaomi , 可以匹配到 xiaomi



修正模式

貪婪匹配

匹配結果存在歧義時取其長(默認)

懶惰匹配

匹配結果存在歧義時取其短,只需在正則表達式的后面'/'加上'U',例如'/[0-9]/U';
例子:

$subject = "test__123123123";
preg_match('/test.+123/', $subject, $matches); //貪婪模式  
var_dump($matches);
preg_match('/test.+123/U', $subject, $matches); //懶惰模式
var_dump($matches);

常見的修正模式:

U 懶惰匹配
i 忽略英文字母的大小寫
x 忽略正則表達式的空白符
s 讓元字符'.' 匹配包括換行符在內的所有字符



常用函數

preg_match

執行匹配正則表達式

preg_match ( string $pattern , string $subject [, array &$matches [, int $flags = 0 [, int $offset = 0 ]]] ) : int

  • pattern: 要搜索的模式,字符串類型。
  • subject:輸入字符串。
  • match: 如果提供了參數matches,它將被填充為搜索結果,數據結構為一維數組。
  • flags: 可以設置為PREG_OFFSET_CAPTURE,使用搜索結果的第0個元素為匹配的字符串,第1個元素為對應的偏移量(位置)
  • offset: 搜索從目標字符串的起始位置開始匹配。

返回值:匹配次數
類似函數preg_match_all,參數與preg_match一致
區別:

  • preg_match:只匹配一次,搜索結構match的數據結果為一維數組
  • preg_match_all:匹配全部,搜索結果match的數據結構為二維數組。

preg_replace

執行一個正則表達式搜索和替換,返回值為替換后的字符串

preg_replace ( mixed $pattern , mixed $replacement , mixed $subject [, int $limit = -1 [, int &$count ]] ) : mixed

  • pattern:要搜索的模式。可以是一個字符串或字符串數組。
  • replacement:用於替換的字符串或字符串數組
  • subject:要進行搜索和替換的字符串或字符串數組。
  • limit:替換的最大次數。默認是 -1(無限)。
  • count:替換次數。
    類似函數preg_filter,參數與preg_replace一致
    區別(使用數組進行匹配的時候才看得出區別):
  • preg_replace:不管是否有替換,返回全部結果
  • preg_filter:只返回匹配的結果。

preg_split

通過一個正則表達式分隔字符串

preg_split ( string $pattern , string $subject [, int $limit = -1 [, int $flags = 0 ]] ) : array

  • $pattrn:用於搜索的模式,字符串形式。
  • subject:輸入字符串
  • limit:將限制分隔得到的子串最多只有limit個,返回的最后一個 子串將包含所有剩余部分。
  • flags:有以下標記的組合:
    -- 1. PREG_SPLIT_NO_EMPTY: 返回分隔后的非空部分。
    -- 2. PREG_SPLIT_DELIM_CAPTURE: 用分隔符'()'括號把匹配的捕獲並返回。
    -- 3. PREG_SPLIT_OFFSET_CAPTURE: 匹配返回時將會附加字符串偏移量

PREG_SPLIT_DELIM_CAPTURE這個參數可能比較難明白,舉個例子看看:

$subject = "1a23b";  
$a = preg_split('/[\d]/', $subject, -1, PREG_SPLIT_NO_EMPTY);  
var_dump($a);  
$a = preg_split('/([\d])/', $subject, -1, PREG_SPLIT_NO_EMPTY | PREG_SPLIT_DELIM_CAPTURE); 
var_dump($a);  

輸出如下:

array (size=2)
0 => string 'a' (length=1)
1 => string 'b' (length=1)
array (size=5)
0 => string '1' (length=1)
1 => string 'a' (length=1)
2 => string '2' (length=1)
3 => string '3' (length=1)
4 => string 'b' (length=1)

preg_grep

返回匹配模式的數組條目

preg_grep ( string $pattern , array $input [, int $flags = 0 ] ) : array

  • $pattern:要搜索的模式,字符串形式
  • $input:輸入數組
  • flags:如果不設置則返回匹配的數目,設置PREG_GREP_INVERT則返回不匹配的數目。

preg_quote

轉義正則表達式字符,返回為轉義后的字符串

preg_quote ( string $str [, string $delimiter = NULL ] ) : string

  • str:輸入字符串
  • delimiter:需要轉義的字符串

個人博客網址: https://colablog.cn/

如果我的文章幫助到您,可以關注我的微信公眾號,第一時間分享文章給您

微信公眾號


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM