mysql存儲emoji表情報錯的處理方法:更改編碼為utf8mb4
uft-8編碼可能2個字節、3個字節、4個字節,而MySql的uft-8只支持3字節的數據,而移動端的表情數據是4字節的字符。如果直接采用utf-8編碼的數據庫中插入表情數據,Java程序將報錯:
java.sql.SQLException: Incorrect string value: '\xF0\x9F\x92\x94' for column 'name' at row 1
at com.mysql.jdbc.SQLError.createSQLException(SQLError.java:1073)
at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3593)
at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3525)
at com.mysql.jdbc.MysqlIO.sendCommand(MysqlIO.java:1986)
at com.mysql.jdbc.MysqlIO.sqlQueryDirect(MysqlIO.java:2140)
at com.mysql.jdbc.ConnectionImpl.execSQL(ConnectionImpl.java:2620)
at com.mysql.jdbc.StatementImpl.executeUpdate(StatementImpl.java:1662)
at com.mysql.jdbc.StatementImpl.executeUpdate(StatementImpl.java:1581)
解決方法之一是對4字節的字符進行編碼存儲,然后取出來的時候,再進行解碼。這樣做的話就會使得任何使用該字符的地方都要進行解碼和編碼。
utf8mb4編碼是utf8編碼的超集,兼容utf8,並且能存儲4字節的表情字符。
采用utf8mb4的好處是:存儲與獲取數據的時候,不用考慮編碼和解碼的問題
解決辦法
更改數據庫的編碼為uft8mb4
1.MySql的版本
utf8mb4的最低版本支持版本為5.5.3+
2.MySql驅動
5.1.34可用,最低不能低於5.1.13
3.修改MySql配置文件
修改mysql的配置文件my.cnf,linux環境下一般在/etc/mysql/my.cnf位置。在文件中添加如下內容:
[client]
default-character-set = utf8mb4
[mysql]
default-character-set = utf8mb4
[mysqld]
character-set-client-handshake = FALSE
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
init_connect='SET NAMES utf8mb4'
4.重啟數據庫,檢查變量
登錄mysql后輸入:SHOW VARIABLES WHERE Variable_name LIKE 'character_set_%' OR Variable_name LIKE 'collation%';
確保一下幾個變量:
系統變量 | 描述 |
---|---|
character_set_client | 客戶端來源數據使用的字符集 |
character_set_connection | 連接層字符集 |
character_set_database | 當前選中數據庫的默認字符集 |
character_set_results | 查詢結果字符集 |
character_set_server | 默認的內部操作字符集 |
這幾個變量必須是utf8mb4.
同時,數據庫和建好的表也轉化為utf8mb4.
5.數據庫連接的配置
數據庫連接參數中:
characterEncoding=utf8會被自動識別為utf8mb4,也可以不加這個參數,會自動檢測。
而autoReconnect=true是必須加上的。
經過上面的步驟,就可以實現在mysql數據庫中存儲emoji表情了。