CP936 轉換成 UTF-8


最近寫了一個抓取腳本,抓取的大部分內容正常,但少部分亂碼

 

檢測字符編碼,得出的結果是CP936

mb_detect_encoding($str, 'GBK, gb2312, GB18030, ISO-8859-1, ASCII, UTF-8', true)

嘗試轉換此編碼,但得出的結果還是亂碼

mb_convert_encoding($str, 'UTF-8', 'CP936');
氓聧擄氓潞婁盲賂聙70氓虜聛貓聙聛氓隴麓莽聦樓盲潞碌7氓虜聛氓樓魯氓顱漏貓聙聦貓壟蘆忙聧聲

最后發現,這樣可以轉碼

iconv('utf-8', 'latin1', $str);
iconv('utf-8','latin1//IGNORE', $str);

  


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM