數據采集流程--采集阿里巴巴商品信息--使用甩手工具箱進行采集


 說明:此次采集是采用軟件進行,需要付費(此處費用如下圖)

第一步:注冊登陸甩手網

http://www.shuaishou.com/products/ToolBox/

賬號:*********

密碼:********

第二步:下載甩手軟件

第三步:安裝甩手工具箱軟件,點擊最右測“使用”

點擊立即訂購

去支付

第四步:登陸阿里巴巴(1688)平台,查找產品列表頁

http://page.1688.com/

https://s.1688.com/selloffer/offer_search.htm#beginPage=1&offset=0

beginPage為頁碼

 

第五步:復制上述地址到甩手軟件抓取網址欄,點擊抓取整頁商品(此處為第1頁)

點擊下一步:

下載完成后出現下圖界面:

點擊下一步:

選中導出淘寶助理數據包,點擊下一步:

注:此處轉換后類目名稱可能不成功,可以手動點擊選擇相應類目再繼續下一步

全選,點擊屬性預轉換

點擊下一步:

 

全選點擊下一步:

點擊導出:

點擊打開文件夾:

點擊打開淘寶助理5201709031943.csv文件,查看轉換效果

刪除第一行,並將csv文件另存為xls文件

安裝mysql數據庫客戶端navicat客戶端

右擊彈出導入對話框

點擊下一步:

點擊下一步:

點擊下一步,導入成功

點擊下一步:

此處可以給這個表加一個主鍵,另外可以將該表修改合適的字段的類型和長度,由於此表比較長,可以考慮優化進行分表存儲(此處由於時間關系沒有做分表+加主鍵+修改字段類型和長度的操作)。

 

點擊下一步:

點擊下一步后點擊開始

說明:此處沒有采集完全,只采集了第1頁的商品信息,其他頁數據采集同理

      此軟件也將商品圖片采集下來了

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM