python爬蟲(二) urlparse和urlsplit函數


urlparse和urlsplit函數:

urlparse:

url='http://www.baidu.com/s?wd=python&username=abc#1'

result=parse.urlparse(url)

print(result)

 

 輸入的結果為解析之后的各部分

輸出對應的參數:

url='http://www.baidu.com/s?wd=python&username=abc#1'

result=parse.urlparse(url)

# print(result)
print('scheme:',result.scheme)
print('netloc:',result.netloc)
print('path:',result.path)
print('params:',result.params)
print('query:',result.query)
print('fragment:',result.fragment)

結果就是輸入的網址各個部分

 

 urlsplit:

url='http://www.baidu.com/s?wd=python&username=abc#1'
result=parse.urlsplit(url)
print(result)

 

 這個里面沒有params這個參數

因為在urlparse中,

 

 在這個網址問好前面加一個分號,分號和問好中間加一個hello

 

 urlparse這個函數的params這個參數就是為了獲得分號和問號中間的值

在平時使用中兩個函數是一樣的。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM