python3 輸出中文、日文等等亂碼問題的解決辦法

本文轉載自查看原文 2020-01-09 15:22 1451 python

例如：

url = 'https://zozo.jp/shop/mrolive/goods-sale/44057773/?did=73037089'
resp = requests.get(url=url)
html = etree.HTML(resp.text)
title = html.xpath('//div[@id="item-intro"]/h1/text()')[0]
print(title)

打印結果為：

AeB[N ubN JEU[  / MA-1 U[ u]

以上打印結果為亂碼，解決辦法：

1 先獲取網址的編碼：

url = 'https://zozo.jp/shop/mrolive/goods-sale/44057773/?did=73037089'
resp = requests.get(url=url)
encodings = requests.utils.get_encodings_from_content(resp.text)
print(encodings)

結果為：

['Shift_JIS']

由此可知網站的編碼是['Shift_JIS']

2 將獲取的response.conetent的編碼設置為['Shift_JIS']，再次請求，獲取到的就不是亂碼了。

url = 'https://zozo.jp/shop/mrolive/goods-sale/44057773/?did=73037089'
resp = requests.get(url=url)
resp_txt = resp.content.decode('Shift_JIS')
html = etree.HTML(resp_txt)
title = html.xpath('//div[@id="item-intro"]/h1/text()')[0]
print(title)

結果為：

アンティーク ブラック カウレザー  / MA-1 レザー ブルゾン

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Python3 使用 logging.basicConfig() 配置輸出日志中的中文亂碼解決辦法 Pycharm 輸出中文或打印中文亂碼現象的解決辦法 MySQL客戶端輸出窗口顯示中文亂碼問題解決辦法 python3中文輸出亂碼的問題 Python項目，VS Code控制台輸出亂碼問題解決辦法 Servlet中文亂碼問題解決辦法 get/post時中文亂碼問題的解決辦法中文亂碼問題的原因和解決辦法 Web項目中,出現中文亂碼問題的解決辦法 Python3解決Nginx日志的中文亂碼問題