[轉]PHP開發中涉及到emoji表情的三種處理方法


最近幾個月做微信開發比較多,存儲微信昵稱必不可少,可這萬惡的微信支持emoji表情做昵稱,這就有點蛋疼了

一般Mysql表設計時,都是用UTF8字符集的。把帶有emoji的昵稱字段往里面insert一下就沒了,整個字段變成了空字符串。這是怎么回事呢?

原來是因為Mysql的utf8字符集是3字節的,而emoji是4字節,這樣整個昵稱就無法存儲了。這要怎么辦呢?我來介紹幾種方法

1、使用utf8mb4字符集


如果你的mysql版本>=5.5.3,你大可直接將utf8直接升級為utf8mb4字符集
這種4字節的utf8編碼可完美兼容舊的3字節utf8字符集,並且可以直接存儲emoji表情,是最好的解決方案
至於字節增大帶來的性能損耗,我看過一些評測,幾乎是可以忽略不計的

2、使用base64編碼


如果你因為某些原因無法使用utf8mb4的話,你還可以使用base64來曲線救國
使用例如base64_encode之類的函數編碼過后的emoji可以直接存儲在utf8字節集的數據表中,取出時decode一下即可

3、干掉emoji表情


emoji表情是個麻煩的東西,即使你能存儲,也不一定能完美顯示。在iOS以外的平台上,例如PC或者android。如果你需要顯示emoji,就得准備一大堆emoji圖片並使用第三方前端類庫才行。即便如此,還是可能因為emoji圖片不夠全而出現無法顯示的情況
在大多數業務場景下,emoji也不是非要不可的。我們可以適當地考慮干掉它,節約各種成本

經過一番苦苦的google,終於找到靠譜能用的代碼:

// 過濾掉emoji表情
function filterEmoji($str)
{
    $str = preg_replace_callback(
            '/./u',
            function (array $match) {
                return strlen($match[0]) >= 4 ? '' : $match[0];
            },
            $str);

     return $str;
 }

原理:基本思想就是遍歷字符串中的每個字符,如果該字符的長度為4個字節,就將其刪除。

參考

1.PHP開發中涉及到emoji表情的幾種處理方法

2.PHP刪除字符串中的emoji表情

擴展

nodejs,javascript過濾emoj表情


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM