教你如何讓數據庫支持emoji表情符存儲


一、教你如何讓數據庫支持emoji表情符存儲

解決方式:

更換字符集utf8-->utf8mb4

問題描述:

前台應用抓取微博信息,每天總有幾條數據插入不成功。應用日志顯示:  

java.sql.SQLException: Incorrect string value: '\xF0\x9F\x92\xAA",...' for column 'raw_json' at row 1, 異常:org.springframework.jdbc.UncategorizedSQLException:  

其中raw_json字段顯示如下:

  由上圖可知,插入的字段里面包含emoji表情符。基本可以判定是字符編碼的問題。我們的數據庫里面使用的是utf8編碼,普通的字符串或者表情都是占位3個字節,所以utf8足夠用了,但是移動端的表情符號占位是4個字節,普通的utf8就不夠用了,為了應對無線互聯網的機遇和挑戰、避免 emoji 表情符號帶來的問題、涉及無線相關的 MySQL 數據庫建議都提前采用utf8mb4 字符集,這必須要作為移動互聯網行業的一個技術選型的要點。

utf8與utf8mb4說明:  

UTF- 8:Unicode Transformation Format-8bit,允許含BOM,但通常不含BOM。是用以解決國際上字符的一種多字節編碼,它對英文使用8位(即一個字節),中文使用24為(三個字節)來編碼。UTF-8包含全世界所有國家需要用到的字符,是國際編碼,通用性強。UTF-8編碼的文字可以在各國支持UTF8字符集的瀏覽器上顯示。如果是UTF8編碼,則在外國人的英文IE上也能顯示中文,他們無需下載IE的中文語言支持包。  

UTF8MB4:MySQL在5.5.3之后增加了utf8mb4的編碼,mb4就是most bytes 4的意思,專門用來兼容四字節的unicode。   

 

既然找到了原因就來執行吧.既然只有raw_json列含表情符,就先嘗試修改此列的字符集:  

ALTER TABLE xx_pnl_weibo_usershow  
MODIFY ` raw_json` varchar(3000) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

改完后測試,插入失敗。  

嘗試修改表的字符集:  

alter table xx_pnl_weibo_usershow CHARSET=utf8mb4 ;  (修改表的默認字符集)
alter table xx_pnl_weibo_usershow CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;(修改表和字段的字符集)

改完后測試,插入失敗。  

修改庫級別的字符集 

vi /etc/my.cnf  

[client]   
default-character-set=utf8mb4   
[mysqld]   
character-set-server = utf8mb4  
 
service mysqld restart 

 改完后測試,插入成功。查看插入的數據:  

root@localhost zx_prod >select id,raw_json,hex(raw_json),length(raw_json) from  xx_pnl_weibo_usershow where id=2;

+----+------------------+----------------------------------+---------------------+
| id | raw_json | hex(raw_json) | length(raw_json) |
+----+------------------+----------------------------------+---------------------+
| 2 |  | F09F9894F09F9882F09F9898F09F9894 | 16 |
+----+------------------+----------------------------------+---------------------+
1 row in set (0.00 sec)

 

 因為是線上生產業務,需要先在測試環境做好測試工作。避免業務高峰期,線上申請停機窗口操作。

 

emoji表情編碼參考: 

  http://punchdrunker.github.io/iOSEmoji/table_html/flower.html

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM