python爬取文件時，內容為空

本文轉載自查看原文 2019-08-23 10:44 502

解決方式：

img_res = requests.get(src,headers=header)
在header中加上referer防盜鏈
加上防盜鏈header的例子：

    header = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64; rv:66.0) Gecko/20100101 Firefox/66.0",
              "Referer":"https://www.mzitu.com/",}






；
還有關於header的問題，
如果進不去網址，說明瀏覽器防火牆給阻斷了，這時候要加入  虛擬瀏覽器頭：例子如上

     header = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64; rv:66.0) Gecko/20100101 Firefox/66.0",
              "Referer":"https://www.mzitu.com/",}




；
還有關於python進行一段時間便出現'NoneType' object has no attribute 'find'
這是空類型的問題，即 <class 'NoneType'>

用isinstance()函數將空類型過濾掉。

例子：

源代碼如下：

max_no = soup_item.find('div', class_='pagenavi').find_all('span')[6].get_text()

　　解決方式：

max_no = soup_item.find('div', class_='pagenavi').find_all('span')[6].get_text()
     if isinstance(max_no,bs4.element.Tag):
            #后邊的代碼

　　************************************************************************************************************

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python爬取動態網頁2，從JavaScript文件讀取內容【Python爬蟲】之爬取頁面內容、圖片以及用selenium爬取 Python爬蟲爬取貼吧的帖子內容用python爬取小說章節內容 python 爬蟲爬取內容時， \xa0 、 \u3000 的含義 python爬蟲一之爬取分頁下的內容 python爬取網頁內容demo 利用python 爬取網頁上特定的內容 python，爬取小說網站小說內容，同時每一章存在不同的txt文件中 python爬蟲爬取海量病毒文件