淘寶數據采集-火車頭采集之多頁采集


1.如何采集淘寶產品圖片大圖?

淘寶產品小圖格式一般為:http://gd4.alicdn.com/bao/uploaded/i4/T1CMpIFM8XXXXXXXXX_!!0-item_pic.jpg_50x50.jpg

大圖的格式一般為:http://gd4.alicdn.com/bao/uploaded/i4/T1CMpIFM8XXXXXXXXX_!!0-item_pic.jpg_600x600.jpg

利用正則匹配即可得到真實的大圖地址。

 

2.如何采集淘寶產品描述?

淘寶的描述是用ajax異步獲取的,研究了html發現真實的地址是:"apiItemDesc":"http://dsc.taobaocdn.com/i7/380/241/38624980066/T1ULBiFG8eXXcWeqbX.desc%7Cvar%5Edesc%3Bsign%5E2e7278bcb05832f21ecab94708b3523e%3Blang%5Egbk%3Bt%5E1402729711",

再利用火車頭采集器的多頁管理,先新建一個多頁:

保存多頁后點擊“切換到無限極多頁編輯模式”,如下圖

然后點擊“編輯多頁規則”

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM