再次遇到golang乱码问题，用simplifiedchinese解决

本文转载自查看原文 2020-01-22 15:16 1635

上篇文章中，抓取网页时，本想匹配其中的汉字。由于出现乱码，只好匹配英文绕过了问题。

原因很简单：该网页没指定utf8，默认应该是GBK

解决办法也很简单：引入

"golang.org/x/text/encoding/simplifiedchinese"

比如原来的代码是

resp, err := this.cleint.Get(url)
body, err := ioutil.ReadAll(resp.Body)

此时body中读取到的是乱码。

只需增加一个reader

resp, err := this.cleint.Get(url)
reader := simplifiedchinese.GB18030.NewDecoder().Reader(resp.Body)
body, err := ioutil.ReadAll(reader)

此时，body中就是正确解码后的汉字。可以进行查找或正则匹配了。

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 解决python中遇到的乱码问题 Golang中文乱码问题 SSM项目经常遇到的乱码问题使用Golang解压缩文件遇到的问题及解决方法 Xshell个性化设置，解决Xshell遇到中文显示乱码的问题解决爬取网站过程中遇到的HTTP Error 302错误和中文乱码问题解决HbuilderX乱码问题解决Cookie乱码问题解决图片乱码的问题 golang查询数据遇到空值问题