我們在訪問網站時,有很多連接都是有一些特殊符號組成,例如,我在百度搜索“大魚海棠”,結果可以看到它的搜索出來的鏈接是:
https://www.baidu.com/s?wd=%E5%A4%A7%E9%B1%BC%E6%B5%B7%E6%A3%A0
此鏈接就是進行過URL編碼之后的鏈接,它並不是我們所說的亂碼,而是進行了編碼,我們不認識罷了。那么如何在python處理URL編碼進行解碼呢。例如:
(1).解碼
from urllib import parse url ='https://www.baidu.com/s?wd=%E5%A4%A7%E9%B1%BC%E6%B5%B7%E6%A3%A0' new_url=parse.unquote_plus(url) print(new_url)
解碼結果是:https://www.baidu.com/s?wd=大魚海棠
(2)加上編碼
from urllib import parse url ='https://www.baidu.com?query=Python基礎教程' new_url=parse.quote_plus(url) print(new_url)
結果是:https%3A%2F%2Fwww.baidu.com%3Fquery%3DPython%E5%9F%BA%E7%A1%80%E6%95%99%E7%A8%8B