MySQL 正則表達式
在前面的章節我們已經了解到MySQL可以通過 LIKE ...% 來進行模糊匹配。
MySQL 同樣也支持其他正則表達式的匹配, MySQL中使用 REGEXP 操作符來進行正則表達式匹配。
如果您了解PHP或Perl,那么操作起來就非常簡單,因為MySQL的正則表達式匹配與這些腳本的類似。
下表中的正則模式可應用於 REGEXP 操作符中。
模式 | 描述 |
---|---|
^ | 匹配輸入字符串的開始位置。如果設置了 RegExp 對象的 Multiline 屬性,^ 也匹配 '\n' 或 '\r' 之后的位置。 |
$ | 匹配輸入字符串的結束位置。如果設置了RegExp 對象的 Multiline 屬性,$ 也匹配 '\n' 或 '\r' 之前的位置。 |
. | 匹配除 "\n" 之外的任何單個字符。要匹配包括 '\n' 在內的任何字符,請使用像 '[.\n]' 的模式。 |
[...] | 字符集合。匹配所包含的任意一個字符。例如, '[abc]' 可以匹配 "plain" 中的 'a'。 |
[^...] | 負值字符集合。匹配未包含的任意字符。例如, '[^abc]' 可以匹配 "plain" 中的'p'。 |
p1|p2|p3 | 匹配 p1 或 p2 或 p3。例如,'z|food' 能匹配 "z" 或 "food"。'(z|f)ood' 則匹配 "zood" 或 "food"。 |
* | 匹配前面的子表達式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。* 等價於{0,}。 |
+ | 匹配前面的子表達式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等價於 {1,}。 |
{n} | n 是一個非負整數。匹配確定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的兩個 o。 |
{n,m} | m 和 n 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。 |
實例
了解以上的正則需求后,我們就可以根據自己的需求來編寫帶有正則表達式的SQL語句。以下我們將列出幾個小實例(表名:person_tbl )來加深我們的理解:
查找name字段中以'st'為開頭的所有數據:
mysql> SELECT name FROM person_tbl WHERE name REGEXP '^st';
查找name字段中以'ok'為結尾的所有數據:
mysql> SELECT name FROM person_tbl WHERE name REGEXP 'ok$';
查找name字段中包含'mar'字符串的所有數據:
mysql> SELECT name FROM person_tbl WHERE name REGEXP 'mar';
查找name字段中以元音字符開頭或以'ok'字符串結尾的所有數據:
mysql> SELECT name FROM person_tbl WHERE name REGEXP '^[aeiou]|ok$';
MySQL LIKE:模糊查詢
在 MySQL 中,LIKE 關鍵字主要用於搜索匹配字段中的指定內容。其語法格式如下:
[NOT] LIKE '字符串'
其中:
- NOT :可選參數,字段中的內容與指定的字符串不匹配時滿足條件。
- 字符串:指定用來匹配的字符串。“字符串”可以是一個很完整的字符串,也可以包含通配符。
LIKE 關鍵字支持百分號“%”和下划線“_”通配符。
通配符是一種特殊語句,主要用來模糊查詢。當不知道真正字符或者懶得輸入完整名稱時,可以使用通配符來代替一個或多個真正的字符。
帶有“%”通配符的查詢
“%”是 MySQL 中最常用的通配符,它能代表任何長度的字符串,字符串的長度可以為 0。例如,a%b
表示以字母 a 開頭,以字母 b 結尾的任意長度的字符串。該字符串可以代表 ab、acb、accb、accrb 等字符串。
例 1
在 tb_students_info 表中,查找所有以字母“T”開頭的學生姓名,SQL 語句和運行結果如下。
mysql> SELECT name FROM tb_students_info -> WHERE name LIKE 'T%'; +--------+ | name | +--------+ | Thomas | | Tom | +--------+ 2 rows in set (0.12 sec)
可以看到,查詢結果中只返回了以字母“T”開頭的學生姓名。
注意:匹配的字符串必須加單引號或雙引號。
NOT LIKE 表示字符串不匹配時滿足條件。
例 2
在 tb_students_info 表中,查找所有不以字母“T”開頭的學生姓名,SQL 語句和運行結果如下。
mysql> SELECT NAME FROM tb_students_info -> WHERE NAME NOT LIKE 'T%'; +-------+ | NAME | +-------+ | Dany | | Green | | Henry | | Jane | | Jim | | John | | Lily | | Susan | +-------+ 8 rows in set (0.00 sec)
可以看到,查詢結果中返回了不以字母“T”開頭的學生姓名。
例 3
在 tb_students_info 表中,查找所有包含字母“e”的學生姓名,SQL 語句和運行結果如下。
mysql> SELECT name FROM tb_students_info -> WHERE name LIKE '%e%'; +-------+ | name | +-------+ | Green | | Henry | | Jane | +-------+ 3 rows in set (0.00 sec)
可以看到,查詢結果中返回了所有包含字母“e”的學生姓名。
帶有“_”通配符的查詢
“_”只能代表單個字符,字符的長度不能為 0。例如,a_b
可以代表 acb、adb、aub 等字符串。
例 4
在 tb_students_info 表中,查找所有以字母“y”結尾,且“y”前面只有 4 個字母的學生姓名,SQL 語句和運行結果如下。
mysql> SELECT name FROM tb_students_info -> WHERE name LIKE '____y'; +-------+ | name | +-------+ | Henry | +-------+ 1 row in set (0.00 sec)
LIKE 區分大小寫
默認情況下,LIKE 關鍵字匹配字符的時候是不區分大小寫的。如果需要區分大小寫,可以加入 BINARY 關鍵字。
例 5
在 tb_students_info 表中,查找所有以字母“t”開頭的學生姓名,區分大小寫和不區分大小寫的 SQL 語句和運行結果如下。
mysql> SELECT name FROM tb_students_info WHERE name LIKE 't%'; +--------+ | name | +--------+ | Thomas | | Tom | +--------+ 2 rows in set (0.00 sec) mysql> SELECT name FROM tb_students_info WHERE name LIKE BINARY 't%'; Empty set (0.01 sec)
由結果可以看到,區分大小寫后,“Tom”和“Thomas”等記錄就不會被匹配到了。
使用通配符的注意事項和技巧
下面是使用通配符的一些注意事項:
- 注意大小寫。MySQL 默認是不區分大小寫的。如果區分大小寫,像“Tom”這樣的數據就不能被“t%”所匹配到。
- 注意尾部空格,尾部空格會干擾通配符的匹配。例如,“T% ”就不能匹配到“Tom”。
- 注意 NULL。“%”通配符可以到匹配任意字符,但是不能匹配 NULL。也就是說 “%”匹配不到 tb_students_info 數據表中值為 NULL 的記錄。
下面是一些使用通配符要記住的技巧。
- 不要過度使用通配符,如果其它操作符能達到相同的目的,應該使用其它操作符。因為 MySQL 對通配符的處理一般會比其他操作符花費更長的時間。
- 在確定使用通配符后,除非絕對有必要,否則不要把它們用在字符串的開始處。把通配符置於搜索模式的開始處,搜索起來是最慢的。
- 仔細注意通配符的位置。如果放錯地方,可能不會返回想要的數據。
總之,通配符是一種極其重要和有用的搜索工具,以后我們會經常用到它。
拓展
如果查詢內容中包含通配符,可以使用“\”轉義符。例如,在 tb_students_info 表中,將學生姓名“Dany”修改為“Dany%”后,查詢以“%”結尾的學生姓名,SQL 語句和運行結果如下:
mysql> SELECT NAME FROM test.`tb_students_info` WHERE NAME LIKE '%\%'; +-------+ | NAME | +-------+ | Dany% | +-------+ 1 row in set (0.00 sec)