mysql之字符集與校對集


一、字符集

1.mysql的字符集設置非常靈活

可以設置服務器默認字符集;

數據庫默認字符集;

表默認字符集;

列字符集;

如果某一級別沒有指定字符集,則繼承上一級。

查看所有字符集語句:show character set;

2.以表聲明為utf-8為例,最終存儲在表中的數據為utf-8

  ①我們要告訴服務器,我給你發送的數據是什么編碼?character_set_client

  ②告訴字符集轉換器,轉換成什么編碼?character_set_connection

  ③查詢的結果用什么編碼?character_set_results

  如果以上三者都為字符集N,可簡寫為set names N;

 3.什么情況下會出現亂碼呢?

我們首先創建一個測試表指定表的字符集為utf8

create table temp(

  name varchar(10)

) charset utf8;   //charset utf8;決定了服務器的編碼

然后執行這三條命令:

set character_set_client=gbk;

set character_set_connection=gbk;

set_character_set_results=gbk; 這三句可以簡寫為set names gbk;

最后往表里插入一條數據:

insert into temp values('中國');

select * from temp;這時候顯示的結果是正常的。

當我們再執行這句命令時:set character_results=utf8;

出現亂碼了,如圖:

由此可得出當返回的結果result的字符集與客戶端的字符集不符的時候會出現亂碼。

還有一種情況也會出現亂碼:client聲明與事實不符時,你客戶端明明是utf8,你卻非要叫我轉成gbk的,如下圖:

可能還有很多種情況,這里沒有一一列舉。

4.什么情況下會造成數據的丟失呢?

執行這三條語句:

set character_set_client=gbk;

set character_set_connection=latin1;

set character_set_results=gbk;

再往表里插入一條數據:insert into temp values('美國');

最后查詢的時候結果如下圖:

 

數據丟失了。

由此可得出當connection和服務器的字符集比client小時,會造成數據的丟失,可能用語不是很准確,但是能理解即可以了。個人理解,就跟java里面不同數據類型相互轉換時一樣,比如把double類型強制轉換成int類型,就會造成精度的丟失一樣。

。。。。。。    

 

ag:

舊服務器,類似於谷歌等,服務器使用的編碼是gbk或者是gb2312 ,現在開發的頁面使用的都是utf8,如何才能保證數據的不丟失

解決:其中connection可以設置為gbk或者utf8都可以

二、校對集

如果有a B c D按照asc排序,此時默認排序后的結果還是a B c D ,並不是按照ASCII排序的

 

什么是校對集?

校對集:指字符集的排序規則。

查看所有校對集語句:show collation;

一種字符集可以有一個或多個排序規則。

show collation like 'utf8%';將顯示所有關於utf8的校對集

以utf8為例,默認是使用utf8_general_ci校對集,也可以按二進制來排,utf8_bin

怎樣聲明校對集?

create table tableName

(

  ...

)charset utf8 collate utf8_general_ci;

注意:聲明的校對集必須是字符集合法的校對集。比如你字符集是utf8,你不能聲明gbk的校對集。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM