node爬蟲使用cheerio解析html()出現亂碼問題 - 碼上歡樂

相關內容簡體繁體

node爬蟲使用cheerio解析html()出現亂碼問題

本文轉載自查看原文 2020-04-21 21:43 916 node/ 學習筆記

自己手動寫了一個node爬蟲，在使用cheerio解析頁面時，通過cheerio的html()獲取頁面內容，但通過控制台打印出來，卻出現“亂碼”問題了。

需要注意的是，這里的“亂碼”並不是真的亂碼，這是HTML實體編碼。

解決辦法是：在load方法中，加入{decodeEntities:false}即可，

let $ = cheerio.load(html,{decodeEntities:false})

參考地址：https://www.jianshu.com/p/60ae70a1fb88

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 基於superagent 與 cheerio 的node簡單爬蟲 nodejs中使用cheerio爬取並解析html網頁今天用node的cheerio模塊做了個某乎的爬蟲 node-cheerio插件實現網頁爬蟲 cheerio html方法中文被編碼問題 Node.js 網頁爬蟲再進階，cheerio助力 Node.js爬蟲數據抓取亂碼問題總結 Node.js的學習--使用cheerio抓取網頁數據使用freemarker時，生成的html出現亂碼關於使用Tomcat搭建的Web項目，出現 URL 中文亂碼的問題解析

粵ICP備18138465號 © 2018-2026 CODEPRJ.COM