網頁下載器:將URL對應的網頁以HTML下載到本地,用於后續分析 常見網頁下載器:Python官方基礎模塊:urllib2 第三方功能包:requests
python 3.x中urllib庫和urilib2庫合並成了urllib庫。 其中urllib2.urlopen()變成了urllib.request.urlopen() urllib2.Request()變成了urllib.request.Request()
python2中的cookielib改為http.cookiejar.
import http.cookiejar
代替 import cookielib
再次強調:print “hello”;應寫為print("hello");

python3對urllib和urllib2進行了重構,拆分成了urllib.request, urllib.response, urllib.parse, urllib.error等幾個子模塊,這樣的架構從邏輯和結構上說更加合理。
urljoin現在對應的函數是urllib.parse.urljoin