在使用urlopen的時候經常出現HTTP Error 403: Forbidden的問題,
這個問題是因為服務器在收到這個請求的時候並不知道發送請求的瀏覽器,系統的硬件信息.為了解決這個方案,只需要我們手動添加即可
#如果不加上下面的這行出現會出現urllib2.HTTPError: HTTP Error 403: Forbidden錯誤 #主要是由於該網站禁止爬蟲導致的,可以在請求加上頭信息,偽裝成瀏覽器訪問User-Agent,具體的信息可以通過火狐的FireBug插件查詢 headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0'} req = urllib.request.Request(url="http://en.wikipedia.org/wiki/Kevin_Bacon", headers=headers) html = urlopen(req)
這樣就解決了.
我的csdn博客地址:http://blog.csdn.net/fontthrone/article/details/70432101