編碼區別
在mysql中存在着各種utf8編碼格式,如下(新建數據庫時一般選用utf8_general_ci就可以):
utf8_bin:將字符串中的每一個字符用二進制數據存儲,區分大小寫(在二進制中 ,小寫字母 和大寫字母 不相等.即 a !=A)。
utf8_genera_ci:不區分大小寫,ci為case insensitive的縮寫(insensitive ; 中文解釋: adj. 感覺遲鈍的,對…沒有感覺的),即大小寫不敏感。
utf8_general_cs:區分大小寫,cs為case sensitive的縮寫(sensitive 中文解釋:敏感事件;大小寫敏感;注重大小寫;全字拼寫須符合),即大小寫敏感
utf8_unicode_ci:不能完全支持組合的記號。
應用上的差別
utf8_general_ci與utf8_unicode_ci
一句話概況:utf8_unicode_ci比較准確,utf8_general_ci速度比較快。
utf8_general_ci與utf8_bin
用utf8_genera_ci沒有區分大小寫,導致這個字段的內容區分大小寫時出問題:
作為密碼時就會出現不合理的方面;
而驗證碼則一般不區分大小寫,所以用這個就合理
utf8_general_cs這個選項一般不用,所以使用utf8_bin區分大小寫
修改編碼
兩種修改方案:
通過SQL(結構化查詢語言(Structured Query Language))來修改
alter table emp modify ename varchar(30) collate utf8_general_ci
直接通過設計表,點擊需要修改字段,直接可修改utf8_general_ci為utf8_bin。
示例
CREATE TABLE `t_bin` ( `id` int(11) DEFAULT NULL, `name` varchar(20) DEFAULT NULL, UNIQUE KEY `uk_name` (`name`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin; CREATE TABLE `t_ci` ( `id` int(11) DEFAULT NULL, `name` varchar(20) DEFAULT NULL, UNIQUE KEY `uk_name` (`name`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_general_ci; CREATE TABLE `t_default` ( `id` int(11) DEFAULT NULL, `name` varchar(20) DEFAULT NULL, UNIQUE KEY `uk_name` (`name`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8;
執行以下語句
insert into t_bin values (1, 'Alex'); insert into t_bin values (2, 'alex'); insert into t_ci values (1, 'Alex'); insert into t_ci values (2, 'alex'); insert into t_default values (1, 'Alex'); insert into t_default values (2, 'alex');
結果如下:
insert into t_bin values (1, 'Alex') > Affected rows: 1 > 時間: 0.067s insert into t_bin values (2, 'alex') > Affected rows: 1 > 時間: 0.031s insert into t_ci values (1, 'Alex') > Affected rows: 1 > 時間: 0.098s insert into t_ci values (2, 'alex') > 1062 - Duplicate entry 'alex' for key 'uk_name' > 時間: 0.024s >
結果分析
編碼為utf8_bin時,Alex和alex被認為是兩個不同的值,區分大小寫;
編碼為utf8_general_ci時,即默認的編碼時,Alex和alex被認為是相同的值,不區分大小寫。
所以在選擇編碼的時候應該注意區分。