徹底解決Python3寫爬蟲或網站時的亂碼問題

本文轉載自查看原文 2019-08-05 23:22 621 Python編碼轉換

第一次寫貼子，試試水

很多玩Python3的都會遇到編碼問題，如果直接去處理未知編碼的網頁，不是Python內部編碼格式utf8會出現亂碼，下面介紹一種將未知編碼的字串轉換為utf8來避免亂碼的方法，

在很多Python編碼轉換的場景中都可以使用，

這段是自己寫的爬蟲中的一段代碼，代碼比較簡短，聰明的你一定能抓住其中的重點

#請求網頁並轉網頁編碼
def getHtmlAndDealCode(url):
    #html=requests.get(url,verify=False)
    html = s.get(url,headers=header)
    code=html.encoding
    html=html.text
    html=html.encode(code)
    html=html.decode('utf-8')
    parser = 'html.parser'
    soup = BeautifulSoup(html ,parser)
    return soup

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 徹底解決Tomcat中文亂碼問題徹底解決fiddler 里面 textview顯示亂碼問題深度剖析java編碼，徹底解決java亂碼問題_1 徹底解決Spring MVC 中文亂碼問題徹底解決python3錯誤：ModuleNotFoundError: No module named 'Cryptodome' 徹底解決 Chrome 允許 Flash 無法添加網站問題徹底解決springMVC中文亂碼徹底解決mysql中文亂碼徹底解決Qt中文亂碼以及漢字編碼的問題(UTF-8/GBK) 徹底解決Hive小文件問題