再次遇到golang亂碼問題，用simplifiedchinese解決

本文轉載自查看原文 2020-01-22 15:16 1635

上篇文章中，抓取網頁時，本想匹配其中的漢字。由於出現亂碼，只好匹配英文繞過了問題。

原因很簡單：該網頁沒指定utf8，默認應該是GBK

解決辦法也很簡單：引入

"golang.org/x/text/encoding/simplifiedchinese"

比如原來的代碼是

resp, err := this.cleint.Get(url)
body, err := ioutil.ReadAll(resp.Body)

此時body中讀取到的是亂碼。

只需增加一個reader

resp, err := this.cleint.Get(url)
reader := simplifiedchinese.GB18030.NewDecoder().Reader(resp.Body)
body, err := ioutil.ReadAll(reader)

此時，body中就是正確解碼后的漢字。可以進行查找或正則匹配了。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 解決python中遇到的亂碼問題 Golang中文亂碼問題 golang--解決郵件發送標題亂碼問題 (原創)開發微信公眾平台遇到的亂碼等問題的解決老是遇到亂碼問題：它是如何產生的，又如何解決呢？ golang解決中文亂碼的方法 SSM項目經常遇到的亂碼問題使用Golang解壓縮文件遇到的問題及解決方法 Xshell個性化設置，解決Xshell遇到中文顯示亂碼的問題解決爬取網站過程中遇到的HTTP Error 302錯誤和中文亂碼問題