打開網站URL遇到“HTTP Error 418：”問題

本文轉載自查看原文 2020-02-05 15:04 9482 python筆記

問題：urllib.error.HTTPError: HTTP Error 418:

程序：

import urllib.request

response=urllib.request.urlopen('https://movie.douban.com/')
html=response.read().decode('utf8')
print(html)

運行程序讀取網頁時顯示：

“HTTP Error 418:”應該是網站的反爬程序返回的。

在使用瀏覽器訪問網站時，訪問請求中包含請求頭。檢測請求頭是常見的反爬蟲策略。

服務器通過檢測請求頭判斷這次請求是不是人為的。

在程序上加入請求頭，這樣服務器就會認為這是一個從瀏覽器發出的人為請求：

import urllib.request

url='https://movie.douban.com/'
#請求頭
herders={
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1;WOW64) AppleWebKit/537.36 (KHTML,like GeCKO) Chrome/45.0.2454.85 Safari/537.36 115Broswer/6.0.3',
    'Referer':'https://movie.douban.com/',
    'Connection':'keep-alive'}
req=urllib.request.Request(url,headers=herders)
response=urllib.request.urlopen(req)
html=response.read().decode('utf8')
print(html)

返回正確結果。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python打開網站爬蟲遇到HTTP Error 403的問題 python爬取網頁時返回http狀態碼HTTP Error 418 python爬取網頁時返回http狀態碼HTTP Error 418 如何在使用 RemoteWebDriver 打開網頁的同時獲取 Http 狀態碼 asp.net mvc 如何定時執行任務（包含打開網站和關閉網站繼續執行） unity打開網頁打開網站提示“安全檢測 | 百度雲加速”，怎么辦？ phpstudy 首次安裝后打開網站數據庫內容中文亂碼 firefox因 HTTP 嚴格傳輸安全（HSTS）機制無法打開網頁