前言
博主最近在用python3練習一些爬蟲腳本的時候,發現一些url的編碼問題,在瀏覽器提交請求api時,如果url中包含漢子,就會被自動編碼掉。呈現的結果是 ==> %xx%xx%xx。如果出現3個百分號為一個原字符則為utf8編碼,如果2個百分號則為gb2312編碼。下面為大家演示編碼和解碼的代碼。
編碼&解碼
from urllib.parse import quote,unquote text = "麗江" print(quote(text,'utf-8')) str = "%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98" print(unquote(str,'utf-8'))
運行以上代碼可以得到如下結果:
%E4%B8%BD%E6%B1%9F
數據挖掘
原文:https://blog.csdn.net/qq_33876553/article/details/79730246