python爬取文件時,內容為空


解決方式:

img_res = requests.get(src,headers=header)
在header中加上referer防盜鏈
加上防盜鏈header的例子:
    header = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64; rv:66.0) Gecko/20100101 Firefox/66.0",
"Referer":"https://www.mzitu.com/",}






還有關於header的問題,
如果進不去網址,說明瀏覽器防火牆給阻斷了,這時候要加入 虛擬瀏覽器頭:例子如上
     header = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64; rv:66.0) Gecko/20100101 Firefox/66.0",
"Referer":"https://www.mzitu.com/",}





還有關於python進行一段時間便出現'NoneType' object has no attribute 'find'
這是空類型的問題,即 <class 'NoneType'>

   用isinstance()函數將空類型過濾掉。

         例子:

                 源代碼如下:

max_no = soup_item.find('div', class_='pagenavi').find_all('span')[6].get_text()

            解決方式:

max_no = soup_item.find('div', class_='pagenavi').find_all('span')[6].get_text()
     if isinstance(max_no,bs4.element.Tag):
            #后邊的代碼

  

  ************************************************************************************************************

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM