核心思想在於下面幾個模式的組合使用:
%[0-9]% : 所有數字
%[A-Za-z]%:所有字母
%[吖-咗]%:所有漢字
1. 去除漢字(字母、數字):
舉出一例,其他類似:
CREATE FUNCTION f_RemoveChinese ( @str VARCHAR(500) ) RETURNS VARCHAR(500) AS BEGIN -- '%[0-9]%' 所有數字 -- '%[A-Za-z]%' 所有字母 -- '%[A-Za-z0-9]%' 所有數字與字母 -- .... 組合使用,依此類推 WHILE PATINDEX('%[吖-咗]%',@str) > 0 SET @str = STUFF(@str,PATINDEX('%[吖-咗]%',@str),1,'') RETURN @str END GO SELECT dbo.f_RemoveChinese('愛@@情123騙子我問@@你') -- @@123@@
2. 提取漢字(字母、數字):
提取XX可轉化為去除非XX 。 舉出一例,其他類似
CREATE FUNCTION f_getChinese ( @str VARCHAR(500) ) RETURNS VARCHAR(500) AS BEGIN -- '%[^0-9]%' 所有數字 -- '%[^A-Za-z]%' 所有字母 -- '%[^A-Za-z0-9]%' 所有數字與字母 -- .... 組合使用,依此類推 WHILE PATINDEX('%[^吖-咗]%',@str) > 0 SET @str = STUFF(@str,PATINDEX('%[^吖-咗]%',@str),1,'') RETURN @str END GO SELECT dbo.f_getChinese('愛@@情123騙子我問@@你') -- 愛情騙子我問你
3. 提取數字(支持小數點):
上面的代碼將模式直接換成'%[^0-9]%'的話,不支持帶小數點的數字,下面給出一個修正的:
-- 提取所有漢字(字母、數字) CREATE FUNCTION f_GetNum ( @str VARCHAR(500) ) RETURNS VARCHAR(500) AS BEGIN -- get num and dot WHILE (PATINDEX('%[^0-9.]%',@str) > 0) SET @str = STUFF(@str,PATINDEX('%[^0-9.]%',@str),1,'') -- remove left dot WHILE(LEFT(@str,1)='.') SET @str = RIGHT(@str,LEN(@str)-1) -- remove right dot WHILE(RIGHT(@str,1)='.') SET @str = LEFT(@str,LEN(@str)-1) RETURN @str END GO SELECT dbo.f_GetNum('愛@@..情1.23騙子我問...@@你') -- 1.23
4.sql server通配符表達式
該部分轉自:https://www.cnblogs.com/yangmingyu/p/6928209.html
%:匹配零個及多個任意字符; _:與任意單字符匹配; []:匹配一個范圍; [^]:排除一個范圍 ;-:連字符
Symbol Meaning like '5[%]' 5% like '[_]n' _n like '[a-cdf]' a, b, c, d, or f like '[-acdf]' -, a, c, d, or f like '[[]' [ like ']' ] like 'abc[_]d%' abc_d and abc_de like 'abc[def]' abcd, abce, and abcf like '[^1-9]' 0 like '[^1-9b-z]' 0, a
對於字符串中出現的特殊字符:'%','[','[]', '_' 可以使用 '[]' 把它們包含起來,這樣在匹配模式(pattern)中,它們就被當作普通字符對待了。
1. 用 like '[[]' 匹配特殊字符 '[' select 1 where '[ABCDE' like '[[]%' 2. 用 like ']' 匹配特殊字符 ']' select 1 where ']ABCDE' like ']%' 3. 用 like '[[]]' 匹配特殊字符 '[]' select 1 where '[]ABCDE' like '[[]]%%' 4. 用 like '[_]' 匹配特殊字符 '_' select 1 where '_ABCDE' like '[_]%' 5. 用 like '[%]' 匹配特殊字符 '%' select 1 where 'ABC%DE' like 'ABC[%]DE'
對於其他的特殊字符:'^', '-', ']' 因為它們本身在包含在 '[]' 中使用,所以需要用另外的方式來轉義,於是就引入了 like 中的 escape 子句,另外值得注意的是:escape 可以轉義所有的特殊字符。
select 1 where '^ABCDE' like '!^ABCDE' escape '!' select 1 where '-ABCDE' like '!-ABCDE' escape '!' select 1 where ']ABCDE' like '!]ABCDE' escape '!' select 1 where '%ABCDE' like '\%ABCDE' escape '\' select 1 where '%ABCDE' like '!%ABCDE' escape '!' select 1 where '%ABCDE' like '#%ABCDE' escape '#' select 1 where '%ABCDE' like '@%ABCDE' escape '@' select 1 where '[ABCDE' like '![ABCDE' escape '!' select 1 where ']ABCDE' like '!]ABCDE' escape '!'
看出規律了吧,就是用 escape 后面緊跟着的字符來做轉義字符。 escape 后面的字符相當於 C 語言字符串中的轉義字符 '\'。
最后,看一個更加復雜的匹配,注意“-”這個也是特殊字符也需轉義。
select 1 where '[^A-Z]ABCDE' like '\[\^A\-Z\]%' escape '\'
后記:用過正則表達式的朋友應該都知道,在正則表達式里可以用*表示匹配0次或是多次, [\u4e00-\u9fa5]這個可以匹配中文,但在這里我沒有發現類似的功能,所以匹配一些復雜的語句就比較頭疼。如我要匹配形如:印張數量*單價、200+印張數量*單價、印張數量,但不匹配形如:印張數量5*單價、印張數量6767、55印張數量uu的數據就很難實現了。
下面這個就是要匹配包括“紡夢”這兩個字,但這兩個字只能是與“+-*/”這四個字符相連或是單獨存在。如果這里的“紡夢”是任意中文字符就沒辦法去處理了。
create table #tbl(n int,v nvarchar(100)) insert into #tbl select 1,'1+紡夢1+2' union select 2,'1+紡夢+1' union select 3,'紡夢' union select 4,'紡夢+1' select * from #tbl where (v like '%[+\-*/]紡夢[+\-*/]%' ESCAPE '\') or (v like '紡夢[+\-*/]%' ESCAPE '\') or (v like '%[+\-*/]紡夢' ESCAPE '\') or (v = '紡夢') --select * from #tbl drop table #tbl