Python urllib 庫提供了一個從指定的 URL 地址獲取網頁數據,然后對其進行分析處理,獲取想要的數據。 urlopen(url, data=None, proxies=None) 創建一個表示遠程url的類文件對象,然后像本地文件一樣操作這個類文件對象來獲取遠程數據。 參數url表示遠程數據的路徑,一般是網址; 參數data表示以post方式提交到url的數據(玩過web的人應該知道提交數據的兩種方式:post與get); 參數proxies用於設置代理。 urlopen返回 一個類文件對象(fd),它提供了如下方法: read() , readline() , readlines() , fileno() , close() :這些方法的使用方式與文件對象完全一樣; info():返回一個httplib.HTTPMessage 對象,表示遠程服務器返回的頭信息(header) getcode():返回Http狀態碼。如果是http請求,200表示請求成功完成;404表示網址未找到; geturl():返回請求的url; 例子: from urllib2 import urlopen datas = urlopen("http://www.baidu.com").read() print datas