查詢不區分大小寫
最近,在用SSH框架完成一個實踐項目時,碰到了一個莫名其妙的Bug困擾了我好久,最后終於解決,記錄如下。
問題:同學在測試系統的時候突然發現,數據庫保存的賬戶本來應該是admin,結果該同學用Admin賬戶居然登錄成功了……
……EXM???這樣也行?好吧,我還是查找這個Bug發生的原因吧。然后就是各種排查程序的過程,找來找去也沒發現什么問題。終於想到,不用hql,自己寫sql語句在數據庫里面直接查詢試試,結果果然發現了問題所在:
select * from user where username = 'admin' and password = 'admin'; select * from user where username = 'Admin' and password = 'admin';
用上面的兩條sql語句分表查詢,出來的結果居然是一樣的!……!!去搜索引擎搜索關鍵詞:MySQL 查詢 大小寫,果然找到問題了!MySQL查詢是不區分大小寫的!這可真的是驚呆我了,雖然知道一般情況下,關鍵字是不區分大小寫的,但是沒想到連要查詢的參數都是不區分大小寫的!!再嘗試下面的sql語句,果然還是一樣的結果。
select * from user where username = 'ADMIN' and password = 'admin';
解決方案
Mysql默認的字符檢索策略:utf8_general_ci,表示不區分大小寫;utf8_general_cs表示區分大小寫,utf8_bin表示二進制比較,同樣也區分大小寫 。(注意:在Mysql5.6.10版本中,不支持utf8_genral_cs!!!!)
創建表時,直接設置表的collate屬性為utf8_general_cs或者utf8_bin;如果已經創建表,則直接修改字段的Collation屬性為utf8_general_cs或者utf8_bin。
-- 創建表: CREATE TABLE testt( id INT PRIMARY KEY, name VARCHAR(32) NOT NULL ) ENGINE = INNODB COLLATE =utf8_bin;
-- 修改表結構的Collation屬性 ALTER TABLE TABLENAME MODIFY COLUMN COLUMNNAME VARCHAR(50) BINARY CHARACTER SET utf8 COLLATE utf8_bin DEFAULT NULL;
直接修改sql語句,在要查詢的字段前面加上binary關鍵字即可。
-- 在每一個條件前加上binary關鍵字 select * from user where binary username = 'admin' and binary password = 'admin'; -- 將參數以binary('')包圍 select * from user where username like binary('admin') and password like binary('admin');
MySQL 編碼格式
在mysql中存在着各種utf8編碼格式,如下:
1)utf8_bin
2)utf8_general_ci
3)utf8_general_cs
utf8_bin將字符串中的每一個字符用二進制數據存儲,區分大小寫。
utf8_genera_ci不區分大小寫,ci為case insensitive的縮寫,即大小寫不敏感。
utf8_general_cs區分大小寫,cs為case sensitive的縮寫,即大小寫敏感。
現在假設執行如下命令:
create table test_bin ( name varchar(32) not null primary key, age int unsigned not null ) engine = InnoDB COLLATE=utf8_bin;
以上命令能夠執行成功。
create table test_ci ( name varchar(32) not null primary key, age int unsigned not null ) engine = InnoDB COLLATE=utf8_general_ci;
以上命令能夠執行成功。
create table test_cs ( name varchar(32) not null primary key, age int unsigned not null ) engine = InnoDB COLLATE=utf8_general_cs;
在5.6.10版本中,以上命令執行失敗,不支持utf8_genral_cs。
insert into test_bin values('Alice', 18);
以上命令能夠執行成功。
insert into test_bin values('alice', 18);
以上命令能夠執行成功,因為utf8_bin是以十六進制方式存儲數據,兩條記錄的主鍵不重復。
insert into test_ci values('Alice', 18);
以上命令能夠執行成功。
insert into test_ci values('alily', 20);
以上命令執行失敗,因為utf8_general_ci不區分大小寫,兩條記錄的主鍵重復。