原本是發布在【原創發布區】板塊的,但是審核太慢了,一天了新帖都不超過3個,所以改發布到精品軟件區。
因為昨天的帖子還沒通過審核,不能修改,但是我今天又升級了一下功能,所以把新版本發布到這里。
2020/03/14更新內容:
1、可以自定義保存圖片目錄,但還是會保存在軟件目錄下的images目錄下,可以選擇當前日期,或者網站域名,或者自己輸入文件夾名稱,請勿輸入特殊字符,支持中文
2、去掉非站內url的跳轉,提升爬蟲效率
3、軟件底部新增正在爬取的鏈接和正在下載的圖片,並顯示實時下載速度,每2s更新一次速度
4、更換了新的背景圖,減少軟件大小
軟件是自己編碼,visual studio2019 + .net4.5,本人覺得沒必要殺毒,如果各位不放心的,請留言,我會進行殺毒測試。
昨天,我發布了一個用C#寫的網站圖片爬蟲軟件,由於涉及色情內容,被刪除了,我痛定思痛,重新寫了一個可以爬取任意網站圖片的軟件
由於是可以爬取任意輸入的網站圖片,所以沒有做過濾,只要符合圖片格式的都會被爬取,可以通過設置圖片大小去掉不符合的圖片,總之,效率可能一般。
界面很粗糙,為了趕在周末前給大家測試,所有很多細節都沒處理,各位在用的時候有什么建議可以提,我會繼續完善的。
軟件本身很小,但是加了個背景圖,大了很多。
使用方式:
1、在地址輸入框輸入爬取的地址
2、選擇爬取深度,深度1層代表只爬取1輸入的網站內容,2層表示把1的網站內容中出現的url繼續訪問,3層在2 的基礎上繼續跳轉,以此類推,一般2層就可以了
3、輸入限制圖片的大小,小於該數值的圖片會被刪掉,比如5V網!就是可以采集一下的。
4、輸入本次爬取的圖片數量,只有符合大小的圖片才會增加數量
5、去吧!皮卡丘
爬取過程中,可以隨時停止,但是不能繼續,只能重來。
最后,按照國際慣例,求免費的評分,昨天被刪帖,扣了一些分。
出現爬取失敗,可能是由於網站禁止爬蟲,亦或是跳轉鏈接是要加前綴,這個問題將在下一個版本改善。
免責聲明:請勿用於非法用途,爬取網站是否違法就看網站是否禁止爬蟲。