MySQL中正則表達式通常被用來檢索或替換符合某個模式的文本內容,根據指定的匹配模式匹配文中符合要求的特殊字符串。
例如,從一個文件中提取電話號碼,查找一篇文章中重復的單詞或替換用戶輸入的敏感語匯等,這些地方都可以使用正則表達式。正則表達式強大而且靈活,常用於復雜的查詢。
MySQL 中使用 REGEXP 關鍵字指定正則表達式的字符匹配模式,下表列出了 REGEXP 操作符中常用的匹配列表。
選項 | 說明 | 例子 | 匹配值示例 |
---|---|---|---|
^ | 匹配文本的開始字符 | '^b' 匹配以字母 b 開頭 的字符串 | book、big、banana、 bike |
$ | 匹配文本的結束字符 | 'st$’ 匹配以 st 結尾的字 符串 | test、resist、persist |
. | 匹配任何單個字符 | 'b.t’ 匹配任何 b 和 t 之間有一個字符 | bit、bat、but、bite |
* | 匹配零個或多個在它前面的字 符 | 'f*n’ 匹配字符 n 前面有 任意個字符 f | fn、fan、faan、abcn |
+ | 匹配前面的字符 1 次或多次 | 'ba+’ 匹配以 b 開頭,后 面至少緊跟一個 a | ba、bay、bare、battle |
<字符串> | 匹配包含指定字符的文本 | 'fa’ | fan、afa、faad |
[字符集合] | 匹配字符集合中的任何一個字 符 | '[xz]'匹配 x 或者 z | dizzy、zebra、x-ray、 extra |
[^] | 匹配不在括號中的任何字符 | '[^abc]’ 匹配任何不包 含 a、b 或 c 的字符串 | desk、fox、f8ke |
字符串{n,} | 匹配前面的字符串至少 n 次 | b{2} 匹配 2 個或更多 的 b | bbb、 bbbb、 bbbbbbb |
字符串 {n,m} |
匹配前面的字符串至少 n 次, 至多 m 次 | b{2,4} 匹配最少 2 個, 最多 4 個 b | bbb、 bbbb |
查詢以特定字符或字符串開頭的記錄
字符“^”匹配以特定字符或者字符串開頭的文本。
【實例 1】在 tb_departments 表中,查詢 dept_name 字段以字母“C”開頭的記錄,輸入的 SQL 語句和執行結果如下所示。
tb_departments表原始查詢如下:
正則表達查詢如下:
【實例 2】在 tb_departments 表中,查詢 dept_name 字段以“Ch”開頭的記錄,輸入的 SQL 語句和執行結果如下所示。
只有 Chinese 是以“Ch”開頭的,所以查詢結果中只有 1 條記錄。
查詢以特定字符或字符串結尾的記錄
字符“$”匹配以特定字符或者字符串結尾的文本。
【實例 3】在 tb_departments 表中,查詢 dept_name 字段以字母“y”結尾的記錄,輸入的 SQL 語句和執行結果如下所示。
在 tb_departments 表中有兩條記錄的 dept_name 字段值是以字母 y 結尾的,返回結果有 2 條記錄。
【實例 4】在 tb_departments 表中,查詢 dept_name 字段以“my”結尾的記錄,輸入的 SQL 語句和執行結果如下所示。
只有 Economy 是以“my”結尾的,所以查詢結果中只有 1 條記錄。
用符號“.”代替字符串中的任意一個字符
【實例 5】在 tb_departments 表中,查詢 dept_name 字段值包含字母“o”與字母“y”,且兩個字母之間只有一個字母的記錄,輸入的 SQL 語句和執行結果如下所示。
查詢語句中“o.y”指定匹配字符中要有字母 o 和 y,且兩個字母之間包含單個字符,並不限定匹配的字符的位置和所在查詢字符串的總長度,因此 Economy 和 History 都符合匹配條件。
使用“*”和“+”來匹配多個字符
星號“*”匹配前面的字符任意多次,包括 0 次。加號“+”匹配前面的字符至少一次。
【實例 6】在 tb_departments 表中,查詢 dept_name 字段值包含字母“C”,且“C”后面出現字母“h”的記錄,輸入的 SQL 語句和執行結果如下所示。
星號“*”可以匹配任意多個字符,Computer 、Economy、Music中字母 C(MySQL默認不區分大小寫,所以查詢條件中的寫的'C',但是結果中會包含出現大寫'C'和小寫'c'的結果) 后面並沒有出現字母 h,但是也滿足匹配條件。
【實例 7】在 tb_departments 表中,查詢 dept_name 字段值包含字母“C”,且“C”后面出現字母“h”至少一次的記錄,輸入的 SQL 語句和執行結果如下所示。
h+”匹配字母“h”至少一次,只有 Chinese 滿足匹配條件。
匹配指定字符串
正則表達式可以匹配指定字符串,只要這個字符串在查詢文本中即可,若要匹配多個字符串,則多個字符串之間使用分隔符“|”隔開。
【實例 8】在 tb_departments 表中,查詢 dept_name 字段值包含字符串“in”的記錄,輸入的 SQL 語句和執行結果如下所示。
可以看到,dept_name 字段的 Chinese 中包含字符串“in”,滿足匹配條件。
【實例 9】在 tb_departments 表中,查詢 dept_name 字段值包含字符串“in”或者“on”的記錄,輸入的 SQL 語句和執行結果如下所示。
可以看到,dept_name 字段的 Chinese 中包含字符串“in”,Economy 中包含字符串“on”,滿足匹配條件。
提示:LIKE 運算符也可以匹配指定的字符串,但與 REGEXP 不同,LIKE 匹配的字符串如果在文本中間出現,就找不到它,相應的行也不會返回。而 REGEXP 在文本內進行匹配,如果被匹配的字符串在文本中出現,REGEXP 將會找到它,相應的行也會被返回。
匹配指定字符串中的任意一個
方括號“[]”指定一個字符集合,只匹配其中任何一個字符,即為所查找的文本。
【實例 10】在 tb_departments 表中,查詢 dept_name 字段值包含字母“o”或者“e”的記錄,輸入的 SQL 語句和執行結果如下所示。
從查詢結果可以看到,所有返回的記錄的 dept_name 字段的值中都包含字母 o 或者 e,或者兩個都有。
方括號“[]”還可以指定數值集合。
【實例 11】在 tb_departments 表中,查詢 dept_call 字段值中包含 1、2 或者 3 的記錄,輸入的 SQL 語句和執行結果如下所示。
查詢結果中,dept_call 字段值中有 1、2、3 三個數字中的一個即為匹配記錄字段。
匹配集合“[123]”也可以寫成“[1-3]”,即指定集合區間。例如,“[a-z]”表示集合區間為a~z的字母,“[0-9]”表示集合區間為所有數字。
匹配指定字符以外的字符
“[^字符集合]”匹配不在指定集合中的任何字符。
【實例 12】在 tb_departments 表中,查詢 dept_name 字段值包含字母 a~t 以外的字符的記錄,輸入的 SQL 語句和執行結果如下所示。
返回記錄中的 dept_name 字段值中包含了指定字母和數字以外的值,如 u、y 等,這些字母均不在 a~t 中,滿足匹配條件。