今兒個才知道SQL語句還可以搭配正則表達式作為查詢條件,很是有用。
REGEXP_LIKE(匹配)
REGEXP_INSTR (包含)
REGEXP_REPLACE(替換)
REGEXP_SUBSTR(提取)
表 1:定位元字符
| 元字符 |
說明 |
| ^ |
使表達式定位至一行的開頭 |
| $ |
使表達式定位至一行的末尾 |
表 2:量詞或重復操作符
| 量詞 |
說明 |
| * |
匹配 0 次或更多次 |
| ? |
匹配 0 次或 1 次 |
| + |
匹配 1 次或更多次 |
| {m} |
正好匹配 m 次 |
| {m,} |
至少匹配 m 次 |
| {m, n} |
至少匹配 m 次但不超過 n 次 |
表 3:預定義的 POSIX 字符類
| 字符類 |
說明 |
| [:alpha:] |
字母字符 |
| [:lower:] |
小寫字母字符 |
| [:upper:] |
大寫字母字符 |
| [:digit:] |
數字 |
| [:alnum:] |
字母數字字符 |
| [:space:] |
空白字符(禁止打印),如回車符、換行符、豎直制表符和換頁符 |
| [:punct:] |
標點字符 |
| [:cntrl:] |
控制字符(禁止打印) |
| [:print:] |
可打印字符 |
表 4:表達式的替換匹配和分組
| 元字符 |
說明 |
| | |
替換 |
分隔替換選項,通常與分組操作符 () 一起使用 |
| ( ) |
分組 |
將子表達式分組為一個替換單元、量詞單元或后向引用單元(參見“后向引用”部分) |
| [char] |
字符列表 |
表示一個字符列表;一個字符列表中的大多數元字符(除字符類、^ 和 - 元字符之外)被理解為文字 |
表 5:REGEXP_LIKE 操作符
| 語法 |
說明 |
REGEXP_LIKE(source_string, pattern [, match_parameter]) |
source_string 支持字符數據類型(CHAR、VARCHAR2、CLOB、NCHAR、NVARCHAR2 和 NCLOB,但不包括 LONG)。pattern 參數是正則表達式的另一個名稱。match_parameter 允許可選的參數(如處理換行符、保留多行格式化以及提供對區分大小寫的控制)。 |
表 6:REGEXP_INSTR 函數
| 語法 |
說明 |
REGEXP_INSTR(source_string, pattern [, start_position [, occurrence [, return_option [, match_parameter]]]]) |
該函數查找 pattern ,並返回該模式的第一個位置。您可以隨意指定您想要開始搜索的 start_position。 occurrence 參數默認為 1,除非您指定您要查找接下來出現的一個模式。return_option 的默認值為 0,它返回該模式的起始位置;值為 1 則返回符合匹配條件的下一個字符的起始位置。 |
表 7: 5 位數字加 4 位郵政編碼表達式的說明
| 語法 |
說明 |
|
必須匹配的空白 |
| [:digit:] |
POSIX 數字類 |
| ] |
字符列表的結尾 |
| {5} |
字符列表正好重復出現 5 次 |
| ( |
子表達式的開頭 |
| - |
一個文字連字符,因為它不是一個字符列表內的范圍元字符 |
| [ |
字符列表的開頭 |
| [:digit:] |
POSIX [:digit:]類 |
| [ |
字符列表的開頭 |
| ] |
字符列表的結尾 |
| {4} |
字符列表正好重復出現 4 次 |
| ) |
結束圓括號,結束子表達式 |
| ? |
? 量詞匹配分組的子表達式 0 或 1 次,從而使得 4 位代碼可選 |
| $ |
定位元字符,指示行尾 |
表 8:REGEXP_SUBSTR 函數
| 語法 |
說明 |
REGEXP_SUBSTR(source_string, pattern [, position [, occurrence [, match_parameter]]]) |
REGEXP_SUBSTR 函數返回匹配模式的子字符串。 |
表 9: REGEXP_REPLACE 函數
| 語法 |
說明 |
REGEXP_REPLACE(source_string, pattern [, replace_string [, position [,occurrence, [match_parameter]]]]) |
該函數用一個指定的 replace_string 來替換匹配的模式,從而允許復雜的“搜索並替換”操作。 |
表 10:后向引用元字符
| 元字符 |
說明 |
| \digit |
反斜線 |
緊跟着一個 1 到 9 之間的數字,反斜線匹配之前的用括號括起來的第 digit 個子表達式。 (注意:反斜線在正則表達式中有另一種意義,取決於上下文,它還可能表示 Escape 字符。 |
表 11:模式交換正則表達式的說明
| 正則表達式項目 |
說明 |
| ( |
第一個子表達式的開頭 |
| . |
匹配除換行符之外的任意單字符 |
| * |
重復操作符,匹配之前的 . 元字符 0 到 n 次 |
| ) |
第一個子表達式的結尾;匹配結果在 \1 中獲取(在這個例子中,結果為 Ellen。) |
|
必須存在的空白 |
| ( |
第二個子表達式的開頭 |
| . |
匹配除換行符之外的任意單個字符 |
| * |
重復操作符,匹配之前的 . 元字符 0 到 n 次 |
| ) |
第二個子表達式的結尾;匹配結果在 \2 中獲取(在這個例子中,結果為 Hildi。) |
|
空白 |
| ( |
第三個子表達式的開頭 |
| . |
匹配除換行符之外的任意單字符 |
| * |
重復操作符,匹配之前的 . 元字符 0 到 n 次 |
| ) |
第三個子表達式的結尾;匹配結果在 \3 中獲取(在這個例子中,結果為 Smith。) |
表 12:社會保險號碼正則表達式的說明
| 正則表達式項目 |
說明 |
| ^ |
行首字符(正則表達式在匹配之前不能有任何前導字符。) |
| ( |
開始子表達式並列出用 | 元字符分開的可替換選項 |
| [ |
字符列表的開頭 |
| [:digit:] |
POSIX 數字類 |
| ] |
字符列表的結尾 |
| {3} |
字符列表正好重復出現 3 次 |
| - |
連字符 |
| [ |
字符列表的開頭 |
| [:digit:] |
POSIX 數字類 |
| ] |
字符列表的結尾 |
| {2} |
字符列表正好重復出現 2 次 |
| - |
另一個連字符 |
| [ |
字符列表的開頭 |
| [:digit:] |
POSIX 數字類 |
| ] |
字符列表的結尾 |
| {4} |
字符列表正好重復出現 4 次 |
| | |
替換元字符;結束第一個選項並開始下一個替換表達式 |
| [ |
字符列表的開頭 |
| [:digit:] |
POSIX 數字類 |
| ] |
字符列表的結尾 |
| {9} |
字符列表正好重復出現 9 次 |
| ) |
結束圓括號,結束用於替換的子表達式組 |
| $ |
定位元字符,指示行尾;沒有額外的字符能夠符合模式 |
|
|
SELECT * FORM. tKHXX where REGEXP_LIKE(SJHM, '^[1]{1}[35]{1}[[:digit:]]{9}$'
針對這個表達式解釋一下
^ 表示開始
$ 表示結束
[]內部為匹配范圍
{}里的內容表時個數,有幾位
手機號碼的特點是以 1開頭接着是3或5再加9位的數字 所以這么理解
1開頭 表達式為 ^[1]{1} 意為 開始1位里包含1
3或5 表達式為 [35]{1}
9位數字結束 為: [[:digit:]]{9}$ 這里[:digit:]為特殊寫法,代表為數字 再加個結束符$
轉摘:http://blog.itpub.net/352988/viewspace-702052/