SET NAMES UTF8的具體作用是什么?
那么,有個問題,如果在DSN中指定了charset, 是否還需要執行set names <charset>呢?
是的,不能省。set names <charset>其實有兩個作用:
A. 告訴mysql server, 客戶端(PHP程序)提交給它的編碼是什么
B. 告訴mysql server, 客戶端需要的結果的編碼是什么
也就是說,如果數據表使用gbk字符集,而PHP程序使用UTF-8編碼,我們在執行查詢前運行set names utf8, 告訴mysql server正確編碼即可,無須在程序中編碼轉換。這樣我們以utf-8編碼提交查詢到mysql server, 得到的結果也會是utf-8編碼。省卻了程序中的轉換編碼問題,不要有疑問,這樣做不會產生亂碼。
那么在DSN中指定charset的作用是什么? 只是告訴PDO, 本地驅動轉義時使用指定的字符集(並不是設定mysql server通信字符集),設置mysql server通信字符集,還得使用set names <charset>指令。
改變了character_set_client/character_set_connection/character_set_results三個值
是的,一條命令等於你所列的3條,主要確保編碼一致性不亂碼
解決亂碼的方法,我們經常使用“set names utf8”,那么為什么加上這句代碼就可以解決了呢?下面跟着我一起來深入set names utf8的內部執行原理
先說MySQL的字符集問題。Windows下可通過修改my.ini內的
[mysql]
default-character-set=utf8 //客戶端的默認字符集
[mysqld]
default-character-set=utf8 //服務器端默認的字符集
假設我們把兩個都設為utf8,然后在MySQL Command Line Client里面輸入“show variables like“character_set_%”;”,可看到如下字符:
character_set_client latin1
character_set_connection latin1
character_set_database utf8
character_set_results latin1
character_set_server utf8
character_set_system utf8
要是我們通過采用UTF-8的PHP程序從數據庫里讀取數據,很有可能是一串“?????”或者是其他亂碼。
解決辦法是,在連接數據庫之后,讀取數據之前,先執行一項查詢“SET NAMES UTF8”,即在php里為
mysql_query("SET NAMES UTF8");
//該句話一定要放在數據庫服務器連接語句【$connection=mysql_connect($db_host,$db_user,$db_psw)or die("連接服務器失敗");】之后
即可顯示正常(只要數據庫里信息的字符正常)。
到MySQL命令行輸入“SET NAMES UTF8;”,然后執行“show variebles like“character_set_%”;”,發現原來為latin1的那些變量“character_set_client”、“character_set_connection”、“character_set_results”的值全部變為utf8了,原來是這3個變量在搗蛋。
查閱手冊,上面那句等於:
SET character_set_client = utf8;
SET character_set_results = utf8;
SET character_set_connection = utf8;
看看這3個變量的作用:
信息輸入路徑:client→connection→server;
信息輸出路徑:server→connection→results。
換句話說,每個路徑要經過3次改變字符集編碼。以出現亂碼的輸出為例,server里utf8的數據,傳入connection轉為latin1,傳入results轉為latin1,utf-8頁面又把results轉過來。如果兩種字符集不兼容,比如latin1和utf8,轉化過程就為不可逆的,破壞性的。
但這里要聲明一點,“SET NAMES UTF8”作用只是臨時的,MySQL重啟后就恢復默認了。
接下來就說到MySQL在服務器上的配置問題了。豈不是我們每次對數據庫讀寫都得加上“SET NAMESUTF8”,以保證數據傳輸的編碼一致?能不能通過配置MySQL來達到那三個變量默認就為我們要想的字符集?手冊上沒說,我在網上也沒找到答案。所以,從服務器配置的角度而言,是沒辦法省略掉那行代碼的。
總結:為了讓你的網頁能在更多的服務器上正常地顯示,還是加上“SET NAMES UTF8”吧,即使你現在沒有加上這句也能正常訪問。
注:根據以上文章,本人理解為,也就是說,mysql中修改了默認的編碼格式,可以使得server即數據庫中的數據編碼格式為utf8但是無法保證connection中和results中的編碼格式也為utf8因此需要加上set names utf8來使得三個地方的編碼格式都統一為utf8