MySQL之正則表達式(REGEXP)


MySQL中正則表達式通常被用來檢索或替換符合某個模式的文本內容,根據指定的匹配模式匹配文中符合要求的特殊字符串。

例如,從一個文件中提取電話號碼,查找一篇文章中重復的單詞或替換用戶輸入的敏感語匯等,這些地方都可以使用正則表達式。正則表達式強大而且靈活,常用於復雜的查詢。

MySQL 中使用 REGEXP 關鍵字指定正則表達式的字符匹配模式,下表列出了 REGEXP 操作符中常用的匹配列表。

選項 說明 例子 匹配值示例
^ 匹配文本的開始字符 '^b' 匹配以字母 b 開頭 的字符串 book、big、banana、 bike
$ 匹配文本的結束字符 'st$’ 匹配以 st 結尾的字 符串 test、resist、persist
. 匹配任何單個字符 'b.t’ 匹配任何 b 和 t 之間有一個字符 bit、bat、but、bite
* 匹配零個或多個在它前面的字 符 'f*n’ 匹配字符 n 前面有 任意個字符 f fn、fan、faan、abcn
+ 匹配前面的字符 1 次或多次 'ba+’ 匹配以 b 開頭,后 面至少緊跟一個 a ba、bay、bare、battle
<字符串> 匹配包含指定字符的文本 'fa’ fan、afa、faad
[字符集合] 匹配字符集合中的任何一個字 符 '[xz]'匹配 x 或者 z dizzy、zebra、x-ray、 extra
[^] 匹配不在括號中的任何字符 '[^abc]’ 匹配任何不包 含 a、b 或 c 的字符串 desk、fox、f8ke
字符串{n,} 匹配前面的字符串至少 n 次 b{2} 匹配 2 個或更多 的 b bbb、 bbbb、 bbbbbbb
字符串
{n,m}
匹配前面的字符串至少 n 次, 至多 m 次 b{2,4} 匹配最少 2 個, 最多 4 個 b bbb、 bbbb

查詢以特定字符或字符串開頭的記錄

字符“^”匹配以特定字符或者字符串開頭的文本。

【實例 1】在 tb_departments 表中,查詢 dept_name 字段以字母“C”開頭的記錄,輸入的 SQL 語句和執行結果如下所示。

tb_departments表原始查詢如下:

正則表達查詢如下:

 

 

 【實例 2】在 tb_departments 表中,查詢 dept_name 字段以“Ch”開頭的記錄,輸入的 SQL 語句和執行結果如下所示。

 

 

 只有 Chinese 是以“Ch”開頭的,所以查詢結果中只有 1 條記錄。

查詢以特定字符或字符串結尾的記錄

字符“$”匹配以特定字符或者字符串結尾的文本。

【實例 3】在 tb_departments 表中,查詢 dept_name 字段以字母“y”結尾的記錄,輸入的 SQL 語句和執行結果如下所示。

 

 

 在 tb_departments 表中有兩條記錄的 dept_name 字段值是以字母 y 結尾的,返回結果有 2 條記錄。

【實例 4】在 tb_departments 表中,查詢 dept_name 字段以“my”結尾的記錄,輸入的 SQL 語句和執行結果如下所示。

 

 

 只有 Economy 是以“my”結尾的,所以查詢結果中只有 1 條記錄。

用符號“.”代替字符串中的任意一個字符

【實例 5】在 tb_departments 表中,查詢 dept_name 字段值包含字母“o”與字母“y”,且兩個字母之間只有一個字母的記錄,輸入的 SQL 語句和執行結果如下所示。

 

 

 查詢語句中“o.y”指定匹配字符中要有字母 o 和 y,且兩個字母之間包含單個字符,並不限定匹配的字符的位置和所在查詢字符串的總長度,因此 Economy 和 History 都符合匹配條件。

使用“*”和“+”來匹配多個字符

星號“*”匹配前面的字符任意多次,包括 0 次。加號“+”匹配前面的字符至少一次。

【實例 6】在 tb_departments 表中,查詢 dept_name 字段值包含字母“C”,且“C”后面出現字母“h”的記錄,輸入的 SQL 語句和執行結果如下所示。

 

 

 星號“*”可以匹配任意多個字符,Computer 、Economy、Music中字母 C(MySQL默認不區分大小寫,所以查詢條件中的寫的'C',但是結果中會包含出現大寫'C'和小寫'c'的結果) 后面並沒有出現字母 h,但是也滿足匹配條件。

【實例 7】在 tb_departments 表中,查詢 dept_name 字段值包含字母“C”,且“C”后面出現字母“h”至少一次的記錄,輸入的 SQL 語句和執行結果如下所示。

 

 

 h+”匹配字母“h”至少一次,只有 Chinese 滿足匹配條件。

匹配指定字符串

正則表達式可以匹配指定字符串,只要這個字符串在查詢文本中即可,若要匹配多個字符串,則多個字符串之間使用分隔符“|”隔開。

【實例 8】在 tb_departments 表中,查詢 dept_name 字段值包含字符串“in”的記錄,輸入的 SQL 語句和執行結果如下所示。

 

 可以看到,dept_name 字段的 Chinese 中包含字符串“in”,滿足匹配條件。

【實例 9】在 tb_departments 表中,查詢 dept_name 字段值包含字符串“in”或者“on”的記錄,輸入的 SQL 語句和執行結果如下所示。

 

 可以看到,dept_name 字段的 Chinese 中包含字符串“in”,Economy 中包含字符串“on”,滿足匹配條件。

提示:LIKE 運算符也可以匹配指定的字符串,但與 REGEXP 不同,LIKE 匹配的字符串如果在文本中間出現,就找不到它,相應的行也不會返回。而 REGEXP 在文本內進行匹配,如果被匹配的字符串在文本中出現,REGEXP 將會找到它,相應的行也會被返回。

匹配指定字符串中的任意一個

方括號“[]”指定一個字符集合,只匹配其中任何一個字符,即為所查找的文本。

【實例 10】在 tb_departments 表中,查詢 dept_name 字段值包含字母“o”或者“e”的記錄,輸入的 SQL 語句和執行結果如下所示。

 

 

 

 從查詢結果可以看到,所有返回的記錄的 dept_name 字段的值中都包含字母 o 或者 e,或者兩個都有。

方括號“[]”還可以指定數值集合。

【實例 11】在 tb_departments 表中,查詢 dept_call 字段值中包含 1、2 或者 3 的記錄,輸入的 SQL 語句和執行結果如下所示。

 

 

 

 查詢結果中,dept_call 字段值中有 1、2、3 三個數字中的一個即為匹配記錄字段。

匹配集合“[123]”也可以寫成“[1-3]”,即指定集合區間。例如,“[a-z]”表示集合區間為a~z的字母,“[0-9]”表示集合區間為所有數字。

匹配指定字符以外的字符

“[^字符集合]”匹配不在指定集合中的任何字符。

【實例 12】在 tb_departments 表中,查詢 dept_name 字段值包含字母 a~t 以外的字符的記錄,輸入的 SQL 語句和執行結果如下所示。

 

 返回記錄中的 dept_name 字段值中包含了指定字母和數字以外的值,如 u、y 等,這些字母均不在 a~t 中,滿足匹配條件。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM