matlab學習 — 實現簡單的爬蟲


  這里復雜的情況暫時不考慮。。測試網址為pixiv的每日排行榜 = =

url = 'https://www.pixiv.net/ranking.php?mode=daily'
text = webread(url) % urlopen函數也可以打開網頁
link = regexp(text,'data-filter=".*?lazy-image"data-src="(https.+?.(jpg|png))"','tokens') % 區分大小寫的正則表達式函數 tokens匹配所有圓括號中的標文 regexpi函數不區分大小寫

for i = 1 : length(link)
rgb = webread(char(link{i})) % webread函數可讀取圖片、音頻等數據並返回對應的解析數據
imshow(rgb) % 顯示圖片
type = char(link{i})
name = [num2str(i) type(end-4:end)]
imwrite(rgb,['C:\Users\adimin\Desktop\video\' name]) % 下載
end

  

  運行結果:

  emm。。。實際上,才跑了一張圖就停了233,不知道是不是太快了 還是什么,停掉的原因是被請求被禁止了:403
  不過有效果就算成功了。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM