‘’正則表達式:
對文本字符串按照某種規則進行檢索、替換
分類:
BRE(基本正則表達式) ---> ERE(擴展正則表達式) --->PCRE(高級語言使用的正則表達式)
基本語法:
元字符metacharacter:
. | 匹配除換行符外任意一個字符 |
[abc] | 字符集合,只能表示一個字符位置。匹配所包含的任意一個字符 |
[^abc] | 字符范圍,只能表示一個字符位置,匹配除去所包含的任意一個字符 |
[a-z] |
字符范圍,也是個集合,表示一個字符位置
匹配所包含的任意一個字符
|
[^a-z] |
字符范圍,也是個集合,表示一個字符位置
匹配除去集合內字符的任意一個字符
|
\b | 匹配單詞的邊界 |
\B | 不匹配單詞的邊界 |
\d | [0-9]匹配1位數字 |
\D | [^0-9]匹配1位非數字 |
\s | 匹配1位空白字符,包括換行符、制表符、空格[\f \r \n \t \v] |
\S | 匹配1位非空白字符 |
\w | 匹配[a-zA-Z0-9_],包括中文 |
\W | 匹配\w之外的字符 |
單行模式:
' . ' 可以匹配所有字符,包括換行('\n')
^ 表示整個字符串的首位, $行尾
多行模式:
' . ' 可以匹配除了換行符之外的字符
^ 表示每行的行首, $行尾
開始指的是\n后緊接着下一個字符,結束指的是\n前的字符
*表示前面的正則表達式會重復0次或多次
+重復至少1次
?重復0次或1次
{n}重復固定n次
{n,}重復至少n次
{n,m}重復n-m次
1、匹配手機號
133xxxxxxxx
\d{11}
2、匹配座機:
025-12345678
0100-1234567
\d{3,4}-\d{7,8}
x|y: 匹配x或y
wood took foot food
w|food 或者 (w|f)ood
\數字 匹配對應的分組
(very)\1 匹配到的是 very very 匹配的組是(very)
(?:pattern)括號為了改變優先級 不需要分組就可以使用?:
(?
<name>exp)
(?'name'exp)
分組捕獲,可以通過name訪問分組
python語法 (?P<name>exp)
零寬斷言
(?=exp)
斷言后面必定跟個exp
f(?=oo) f后面必定有oo出現
(?<=exp)
(?<=f)ood 匹配 ood,前面一定會出現f
斷言左邊必定有個exp前綴
負向零寬斷言
(?!exp) 斷言exp一定不會出現在右側,也就是說斷言后面一定不是exp
foo(?!d) foo后面一定不是d
(?<!exp) 斷言exp一定不能出現在左側,也就是說斷言前面一定不能是exp
(?<!f)ood ood的左邊一定不是f
斷言不占分組號
貪婪與非貪婪:
編譯器默認是貪婪模式,匹配盡量長的字符串
非貪婪模式,在重復的符號后面+'?',匹配最少的字符串
代碼 | 說明 |
*? | 匹配任意次 |
+? | 匹配至少一次 |
?? | 匹配0或1次 |
{n,}? | 匹配至少n次 |
{n,m}? | 匹配至少n次,至多m次 |
引擎選項:
代碼 | 說明 |
IgnoreCase | 匹配時忽略大小寫 |
Singleline |
單行模式:
可以匹配所有字符
|
Multiline |
多行模式:
^行首、$行尾
|
IgnorePatternWhitespace | 忽略表達式中的空白字符,如果要使用空白字符串要是用轉義 |
練習:
1、匹配0-999任意數字: