node爬虫使用cheerio解析html()出现乱码问题


自己手动写了一个node爬虫,在使用cheerio解析页面时,通过cheerio的html()获取页面内容,但通过控制台打印出来,却出现“乱码”问题了。

 

需要注意的是,这里的“乱码”并不是真的乱码,这是HTML实体编码。

解决办法是:在load方法中,加入{decodeEntities:false}即可,

let $ = cheerio.load(html,{decodeEntities:false})

参考地址:https://www.jianshu.com/p/60ae70a1fb88

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM