SQL語句中的正則表達式


正則表達式

REGEXP_LIKE執行正則表達式匹配

SELECT FIRST_NAME

FROM EMPLOYEES

WHERE REGEXP_LIKE(FIRST_NAME,'^al(an|yss)a$','i');--al之后是an或yss

SELECT FIRST_NAME

FROM EMPLOYEES

WHERE REGEXP_LIKE(FIRST_NAME,'^al(.){2}a$','i');--中間有任意一個字母出現兩次

SELECT FIRST_NAME

FROM EMPLOYEES

WHERE REGEXP_LIKE(FIRST_NAME,'^al[^y]+a$','i');--第三個字母不允許是y一直匹配

REGEXP_REPLACE執行正則表達式替換

SELECT PHONE_NUMBER,REGEXP_REPLACE(PHONE_NUMBER,'\.','-')AS PHONE FROM EMPLOYEES;--必須要加轉義字符\ 不加的話  ‘.’代表任意字符

REGEXP_INSTR搜索出現的位置

SELECT STREET_ADDRESS,

REGEXP_INSTR(STREET_ADDRESS,'[[:alpha:]]')AS FIRST_ALPHA_POSITION,--任何字母第一次出現的位置

REGEXP_INSTR(STREET_ADDRESS,'[[:digit:]]')AS FIRST_ALPHA_POSITION,--任何數字第一次出現的位置

REGEXP_INSTR(STREET_ADDRESS,'[[:alnum:]]')AS FIRST_ALPHA_POSITION--任何數字或字母第一次出現的位置

FROM LOCATIONS;

使用REGEXP_SUBSTR控制字符輸出

SELECT STREET_ADDRESS,

REGEXP_SUBSTR(STREET_ADDRESS, ' [^ ]+ ')AS ROAD1,

REGEXP_SUBSTR(STREET_ADDRESS, '[^ ]+ ')AS ROAD2,

REGEXP_SUBSTR(STREET_ADDRESS, '[^ ]+')AS ROAD3,

REGEXP_SUBSTR(STREET_ADDRESS, ' [^ ]+(.)+')AS ROAD4,

REGEXP_SUBSTR(STREET_ADDRESS, '[[:alpha:]]')AS ROAD5,

REGEXP_SUBSTR(STREET_ADDRESS, '[[:alpha:]]+')AS ROAD6,

REGEXP_SUBSTR(STREET_ADDRESS, '[[:alpha:]]+(.)')AS ROAD7,

REGEXP_SUBSTR(STREET_ADDRESS, '[[:alpha:]]+(.)+')AS ROAD8

FROM LOCATIONS;

. 匹配支持字符集中的任何字符,除了空

+   匹配前面的子表達式一次或多次

|   指明兩項之內的一個選擇

‘i’不區分大小寫的匹配

[[:alpha:]]任何字母

[[:digit:]]任何數字

[[:alnum:]]任何字母和數字

[[:space:]]任何空格

子表達式

SELECT

    REGEXP_INSTR

    ('0123456789',   --源字符

    '(123)(4(56)(78))',--用於匹配的表達式

    1,               --開始搜索的位置

    1,               --第幾次匹配上

    0,               --0返回第一個出現位置;1下一個起始位置

    'i',             --大小寫不敏感

    1)RESULT               --第幾個表達式

FROM DUAL;

子表達式中有括號即為一個表達式

如(123(4(56)(78)))中(123(4(56)(78)))為第一個子表達式

(4(56)(78))為第二個表達式 (56)為第三個 (78)為第四個

Check約束和正則表達式:示例

ALTER TABLE EMP8

    ADD CONSTRAINT EMAIL_ADDR

    CHECK(REGEXP_LIKE(email,'@')) NOVALIDATE;

INSERT INTO EMP8 VALUES

    (500,'Christian','Patal','ChrisP2creme.com',

    1234567890,'12-Jan-2004','HR-REP',2000,null,102,40);

select * from t50 where REGEXP_LIKE(email,'[^@][@][[:alnum:]]+([\.][[:alnum:]]+|[\.][[:alnum:]]+[\.][[:alnum:]]+)[^\.]$');

ALTER TABLE t50 ADD CONSTRAINT email_addr CHECK(REGEXP_LIKE(email,'[^@][@][[:alnum:]]+([\.][[:alnum:]]+|[\.][[:alnum:]]+[\.][[:alnum:]]+)[^\.]$')) NOVALIDATE;

 

表 1:定位元字符

元字符
說明

^
使表達式定位至一行的開頭

$
使表達式定位至一行的末尾

表 2:量詞或重復操作符

量詞
說明

*
匹配 0 次或更多次

?
匹配 0 次或 1 次

+
匹配 1 次或更多次

{m}
正好匹配 m 次

{m,}
至少匹配 m 次

{m, n}
至少匹配 m 次但不超過 n 次

表 3:預定義的 POSIX 字符類

字符類
說明

[:alpha:]
字母字符

[:lower:]
小寫字母字符

[:upper:]
大寫字母字符

[:digit:]
數字

[:alnum:]
字母數字字符

[:space:]
空白字符(禁止打印),如回車符、換行符、豎直制表符和換頁符

[:punct:]
標點字符

[:cntrl:]
控制字符(禁止打印)

[:print:]
可打印字符

表 4:表達式的替換匹配和分組

元字符
說明

|
替換
分隔替換選項,通常與分組操作符 () 一起使用

( )
分組
將子表達式分組為一個替換單元、量詞單元或后向引用單元(參見“后向引用”部分)

[char]
字符列表
表示一個字符列表;一個字符列表中的大多數元字符(除字符類、^ 和 - 元字符之外)被理解為文字

表 5:REGEXP_LIKE 操作符

語法
說明

REGEXP_LIKE(source_string, pattern
[, match_parameter])
source_string 支持字符數據類型(CHAR、VARCHAR2、CLOB、NCHAR、NVARCHAR2 和 NCLOB,但不包括 LONG)。pattern 參數是正則表達式的另一個名稱。match_parameter 允許可選的參數(如處理換行符、保留多行格式化以及提供對區分大小寫的控制)。

表 6:REGEXP_INSTR 函數

語法
說明

REGEXP_INSTR(source_string, pattern
[, start_position
[, occurrence
[, return_option
[, match_parameter]]]])
該函數查找 pattern ,並返回該模式的第一個位置。您可以隨意指定您想要開始搜索的 start_position。 occurrence 參數默認為 1,除非您指定您要查找接下來出現的一個模式。return_option 的默認值為 0,它返回該模式的起始位置;值為 1 則返回符合匹配條件的下一個字符的起始位置。

表 7: 5 位數字加 4 位郵政編碼表達式的說明

語法
說明

必須匹配的空白

[:digit:]
POSIX 數字類

]
字符列表的結尾

{5}
字符列表正好重復出現 5 次

(
子表達式的開頭

-
一個文字連字符,因為它不是一個字符列表內的范圍元字符

[
字符列表的開頭

[:digit:]
POSIX [:digit:]類

[
字符列表的開頭

]
字符列表的結尾

{4}
字符列表正好重復出現 4 次

)
結束圓括號,結束子表達式

?
? 量詞匹配分組的子表達式 0 或 1 次,從而使得 4 位代碼可選

$
定位元字符,指示行尾

表 8:REGEXP_SUBSTR 函數

語法
說明

REGEXP_SUBSTR(source_string, pattern
[, position [, occurrence
[, match_parameter]]])
REGEXP_SUBSTR 函數返回匹配模式的子字符串。

表 9: REGEXP_REPLACE 函數

語法
說明

REGEXP_REPLACE(source_string, pattern
[, replace_string [, position
[,occurrence, [match_parameter]]]])
該函數用一個指定的 replace_string 來替換匹配的模式,從而允許復雜的“搜索並替換”操作。

表 10:后向引用元字符

元字符
說明

\digit
反斜線
緊跟着一個 1 到 9 之間的數字,反斜線匹配之前的用括號括起來的第 digit 個子表達式。
(注意:反斜線在正則表達式中有另一種意義,取決於上下文,它還可能表示 Escape 字符。

表 11:模式交換正則表達式的說明

正則表達式項目
說明

(
第一個子表達式的開頭

.
匹配除換行符之外的任意單字符

*
重復操作符,匹配之前的 . 元字符 0 到 n 次

)
第一個子表達式的結尾;匹配結果在 \1
中獲取(在這個例子中,結果為 Ellen。)

必須存在的空白

(
第二個子表達式的開頭

.
匹配除換行符之外的任意單個字符

*
重復操作符,匹配之前的 . 元字符 0 到 n 次

)
第二個子表達式的結尾;匹配結果在 \2
中獲取(在這個例子中,結果為 Hildi。)

空白

(
第三個子表達式的開頭

.
匹配除換行符之外的任意單字符

*
重復操作符,匹配之前的 . 元字符 0 到 n 次

)
第三個子表達式的結尾;匹配結果在 \3
中獲取(在這個例子中,結果為 Smith。)

表 12:社會保險號碼正則表達式的說明

正則表達式項目
說明

^
行首字符(正則表達式在匹配之前不能有任何前導字符。)

(
開始子表達式並列出用 | 元字符分開的可替換選項

[
字符列表的開頭

[:digit:]
POSIX 數字類

]
字符列表的結尾

{3}
字符列表正好重復出現 3 次

-
連字符

[
字符列表的開頭

[:digit:]
POSIX 數字類

]
字符列表的結尾

{2}
字符列表正好重復出現 2 次

-
另一個連字符

[
字符列表的開頭

[:digit:]
POSIX 數字類

]
字符列表的結尾

{4}
字符列表正好重復出現 4 次

|
替換元字符;結束第一個選項並開始下一個替換表達式

[
字符列表的開頭

[:digit:]
POSIX 數字類

]
字符列表的結尾

{9}
字符列表正好重復出現 9 次

)
結束圓括號,結束用於替換的子表達式組

$
定位元字符,指示行尾;沒有額外的字符能夠符合模式


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM