剛開始爬取了 百度圖片和搜狗圖片
但是圖片不是很多,隨后繼續爬取淘寶圖片,但是淘寶反爬比較厲害 之前的方法不能用
記錄可行的 淘寶爬取 利用selenium爬取
https://cloud.tencent.com/developer/article/1151774
github
https://github.com/Python3WebSpider/TaobaoProduct
(需要修改代碼,自己掃碼登陸 繼續爬)看issues
注意:爬多了 肯能出現滑塊驗證 使用開發者模式避免
利用pyquery進行搜索 就不需要正則表達式了
使用方法