原文:爬蟲521錯誤(又是一次和可愛的前端vs的故事)

起因: 今天突然想重構一下代理池,並且想擴充一下代理,所以就想着爬點代理IP,然后就有了下面的故事 一上來先進行了一頓操作: 然后看都沒看狀態碼直接xpath取:過了一會黑人問號 ,喵喵喵,為啥是空,點開源代碼,啥都有,哦,可能是xpath寫的有問題,又進行了微調,還是取不到,突然感覺這個網站好騷,怎么就取不到呢.有重新分析了一次源代碼與Network, 然后看了眼返回狀態碼, ,進過分析以后得出 ...

2019-05-27 18:36 1 1165 推薦指數:

查看詳情

爬蟲遇到521錯誤怎么辦

  本人最近用python開發着爬蟲相關的項目,在上個月就已經把爬蟲的相關代碼寫得差不多了,因為春節,項目停滯了十多天。最近,當我再次運行之前的爬蟲項目的時候,What?怎么不行了??本來好好的,報了521錯誤。我只是一個爬蟲菜鳥,還是第一次接觸到這個錯誤。然后我就去百度了。百度一圈后,發現這是 ...

Wed Feb 12 03:26:00 CST 2020 6 1320
一次爬蟲事件

0.序 我同學論文需要數據建模,想用爬蟲軟件爬取數據,就問有沒有人會用爬蟲軟件,我回了句:我不會用爬蟲軟件,但我會寫爬蟲。然后爬蟲事件就拉開了序幕。 1. 我同學要的數據是P2P借款人信息,她就選了翼龍貸上的數據,我先去瀏覽了翼龍貸網站,然后知道了數據的位置。先要進入產品列表 ...

Mon May 14 10:33:00 CST 2018 0 934
爬蟲遭遇521狀態碼

起因:工作中爬取頁面遭遇521狀態碼 scrapy中遭遇521狀態碼,會被無視,而不會被爬蟲處理。 通過F12開發者工具 可知 通過在下載器中間件的查看,可以得知是可以在process_response中獲取response.text 實際上是js代碼,一段不規則 ...

Thu Dec 05 21:47:00 CST 2019 0 733
一次數據庫壓力測試的故事

前言 最近配合某客戶做了一個關於XX系統的壓力測試,其實經過和客戶的溝通得知,客戶此系統上線后壓力並不大,但由於應用方前期的表現不是特別盡如人意,對此不太信任,所以要求本次壓力測試着重觀察。 參與 ...

Mon Mar 25 19:18:00 CST 2019 2 2210
vs code 第一次創建前端項目 vuejs 從零開始

2018年12月5日 第一階段 雖然網上教程很多,但是還是記錄一次完整的步驟 1.安裝nodejs,網上一堆的教程,基本上下載后傻瓜式一路next 2.安裝npm,網上一堆的教程,也是基本下載后傻瓜式一路next 3.安裝完成運行cmd,查看是否安裝成功 4.安裝cnpm ...

Thu Dec 06 06:30:00 CST 2018 0 4385
一次故事機器人的開發-我有故事,讓機器人來讀

一次故事機器人的開發-我有故事,讓機器人來讀 最近工作較忙,回家閑下來只想閉目休息,一分鍾屏幕都不想再看,然而我又想追更之前看的小說,於是,需求來了——我需要一個給我講故事的機器人! 瀏覽器或者閱讀器App里其實也有朗讀功能,但是比較僵硬,總是將引人入勝的情節念成流水賬,分分鍾讓人棄坑 ...

Sat Oct 17 18:59:00 CST 2020 1 392
一次排查線上程序內存的忽高忽低,又是大集合惹禍了

一:背景 1. 講故事 昨天繼續還技術債,優化一輪后的程序拉到線上后內存繼續忽高忽低,低的時候20G,高的時候30G,過了一會又下降了幾個G,毫無疑問,程序中有什么集合或者什么操作占用了大量內存,所以准備在28,29G的時候抓dump分析分析。 二:解決思路 從快照中找問題就像看病一樣 ...

Thu May 21 02:17:00 CST 2020 30 3703
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM