sql 查詢字段是中文/英文/數字正則表達式

本文轉載自查看原文 2019-01-22 11:18 3757 10_DBServer/sql/proc

一、包含中文字符

select * from 表名 where 列名 like '%[吖-座]%'

二、包含英文字符

select * from 表名 where 列名 like '%[a-z]%' 

三、包含純數字

select * from 表名 where 列名 like '%[0-9]%'

上面的正則表達式，只能用like選出該字段中含有中文/英文/數字的人，那如果需求是選出姓名全部是中文的人，要如何做？

sqlserver中有函數len，以及datalength

可將字段名強制類型轉換成為varchar類型，根據db中長度，賦予強制類型一定的長度，注意千萬不要太小，導致刪除了部分字符

英文數字符號轉為字符后，len和datalength長度一致

中文，len的2倍=datalength長度

MySQL：

char定義存儲字符，實際存儲也是按照字符形式存儲，大小char（255個字符），注意不是字節。

在此說下字符與字節的區別？

字節是計算機中存儲信息的單位，一個字節占八位，字符是A、B、C等以及一些符號，一般在計算機中用一個字節表示，也就是說一般占一個字節，但還有不一般，根據特定編碼每個字符所占的字節數不同，就如在gbk，gb2312中一個漢字占兩個字節，但國際通用編碼格式utf-8中一個漢字占3個字節。

因此char在utf8編碼下最多可存儲255*3個字節的數據，無論是單獨的一個漢字，還是英文字母都是一個字符，只是所占字節不同而已，Soga，char（255個字符），

不管是sqlserver還是MySQL存儲，如果存儲的字符沒有255個會以英文空格字符的形式填滿。這就是所謂的定長。

下面說說varchar（0-65532個字節）定義的是字符，但是實際以字節的形式進行存儲，最多可以存儲Max（65532）個字節，因此在utf8編碼形式下最多存儲65532/3-1個字符，在gbk編碼下，最多存儲65532/2-1，為什么會減一呢？因為MySQL的機制會留1-3個字節來存儲該字符串的長度。多了這個用來記錄長度的結果就可以做到動態變化，而不需要像char那樣用空格填充剩余空間，減少內存消耗，但同樣也增加了內耗，影響了性能。

舉個例子：定義了name字段：varchar(60)，為其填充數據張三，則只占用6個字節，剩余54個字節未被占用，上例如果定義name字段為char(60),同樣填充數據張三的話，雖然也是占用6個字節，但剩余58個字符會用空格填充，實際占用60個字符所耗空間

sqlserver：

先說說nvarchar和varcahr的區別：

varchar：可變長度，存儲ANSI字符，根據數據長度自動變化。

nvarchar：可變長度，存儲Unicode字符，根據數據長度自動變化。

varchar[(n)]：長度為 n 個字節的可變長度且非 Unicode的字符數據。n 必須是一個介於 1 和 8,000之間的數值。存儲大小為輸入數據的字節的實際長度，而不是 n 個字節

nvarchar(n) ：包含 n個字符的可變長度 Unicode 字符數據。n 的值必須介於1與4,000 之間。字節的存儲大小是所輸入字符個數的兩倍。

從以上可以看出nvarchar是以字符方式存儲，因為用Unicode編碼，這里大家可以看看這篇博客：各種編碼的詳解：http://blog.csdn.net/lvxiangan/article/details/8151670

因此可以說是規定nvarchar是雙字節存儲，不管你存儲的是漢字還是英文字母都是占兩個字節，

分析優缺點：

優點：判斷字符串的時候可以不需要考慮中英文兩種字符的差別，可以避免程序中亂碼的問題。

缺點：存儲英文字符會增大一倍的存儲空間．但是在存儲代價已經很低廉的情況下，優先考慮兼容性會給你帶來更多好處的，效率沒有varchar高。

char在此不做多解釋與MySQL情況一致。

一般使用情況說明：

存儲的數據長度確定如電話號碼，編碼等固定的，而且不包中文的，可以選擇char類型。

存儲的數據長度不確定，存儲只有英文、數字的最好用varchar

存儲的數據長度不確定，也有可能有中文，可以選擇nvarchar類型。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 java正則表達式提取數字、英文、中文 js正則表達式驗證中文和英文及數字正則表達式--只能中文，英文，數字以及/ \\ * 空格正則表達式(僅可輸入中文英文數字以及英文逗號) 如何批量添加中文和英文數字之間的空格？用正則表達式吧利用正則表達式分離漢字、英文、數字正則表達式匹配中文，英文字母和數字及_的寫法！同時控制長度 JS 正則表達式控制文本框只能輸入中文、英文、數字與指定特殊符號正則表達式匹配中文，英文字母和數字及_的寫法！同時控制長度請問4-20位字符可由中文,英文,數字及“—”,“-”組成正則表達式

sql 查詢字段是中文/英文/數字 正則表達式

免責聲明！

sql 查詢字段是中文/英文/數字正則表達式