Python 爬蟲知識點 - 淘寶商品檢索結果抓包分析(續一)


通過前一節得出地址可能的構建規律,如下:

https://s.taobao.com/search?data-key=s&data-value=44&ajax=true&_ksTS=1481814489094_902&callback=jsonp903&q=Python%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0&imgfile=&js=1&stats_click=search_radio_all%3A1&initiative_id=staobaoz_20161215&ie=utf8&bcoffset=3&ntoffset=0&p4ppushleft=1%2C48

https://s.taobao.com/search?data-key=s&data-value=88&ajax=true&_ksTS=1481814530312_1045&callback=jsonp1046&q=Python%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0&imgfile=&js=1&stats_click=search_radio_all%3A1&initiative_id=staobaoz_20161215&ie=utf8&bcoffset=0&ntoffset=6&p4ppushleft=1%2C48&s=44

https://s.taobao.com/search?data-key=s&data-value=132&ajax=true&_ksTS=1481816198100_1326&callback=jsonp1327&q=Python%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0&imgfile=&js=1&stats_click=search_radio_all%3A1&initiative_id=staobaoz_20161215&ie=utf8&bcoffset=-3&ntoffset=3&p4ppushleft=1%2C48&s=88

https://s.taobao.com/search?data-key=s&data-value=176&ajax=true&_ksTS=1481816618010_1533&callback=jsonp1534&q=Python%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0&imgfile=&js=1&stats_click=search_radio_all%3A1&initiative_id=staobaoz_20161215&ie=utf8&bcoffset=-6&ntoffset=0&p4ppushleft=1%2C48&s=132


https://s.taobao.com/search?data-key=s&data-value=176&ajax=true&_ksTS=1481817378403_2108&callback=jsonp2109&q=Python%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0&imgfile=&js=1&stats_click=search_radio_all%3A1&initiative_id=staobaoz_20161215&ie=utf8&bcoffset=-6&ntoffset=-6&p4ppushleft=1%2C48&s=132

https://s.taobao.com/search?data-key=s&data-value=176&ajax=true&_ksTS=1481817378403_2108&callback=jsonp2109&q=Python%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0&imgfile=&js=1&stats_click=search_radio_all%3A1&initiative_id=staobaoz_20161215&ie=utf8&bcoffset=-6&ntoffset=-6&p4ppushleft=1%2C48&s=132

https://s.taobao.com/search?data-key=s&data-value=176&ajax=true&_ksTS=1481817378403_2108&callback=jsonp2109&q=Python%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0&imgfile=&js=1&stats_click=search_radio_all%3A1&initiative_id=staobaoz_20161215&ie=utf8&bcoffset=-6&ntoffset=-6&p4ppushleft=1%2C48&s=132


https://s.taobao.com/search?data-key=s&data-value=220&ajax=true&_ksTS=1481816618010_1533&callback=jsonp1534&q=Python%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0&imgfile=&js=1&stats_click=search_radio_all%3A1&initiative_id=staobaoz_20161215&ie=utf8&bcoffset=-6&ntoffset=-6&p4ppushleft=1%2C48&s=176


https://s.taobao.com/search?data-key=s&data-value=264&ajax=true&_ksTS=1481818506324_2454&callback=jsonp2455&q=Python%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0&imgfile=&js=1&stats_click=search_radio_all%3A1&initiative_id=staobaoz_20161215&ie=utf8&bcoffset=-9&ntoffset=-3&p4ppushleft=1%2C48&s=220

https://s.taobao.com/search?data-key=s&data-value=264&ajax=true&_ksTS=1481818506324_2454&callback=jsonp2455&q=Python%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0&imgfile=&js=1&stats_click=search_radio_all%3A1&initiative_id=staobaoz_20161215&ie=utf8&bcoffset=-9&ntoffset=-3&p4ppushleft=1%2C48&s=220

 

但是從瀏覽器者開發工具中,拷貝出來的URL,放在瀏覽器中,刷新后,同樣的URL,而結果確實變化的,為什么???同時打開兩次,返回的數據是變化的?初步判斷可能是后台搜索服務器中對於bcoffset=-9&ntoffset=-3&p4ppushleft=1等參數做了偏移處理,這是不是由於后台搜索機制引起的了???

URL是:https://s.taobao.com/search?data-key=s&data-value=264&ajax=true&_ksTS=1481818506324_2454&callback=jsonp2455&q=Python%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0&imgfile=&js=1&stats_click=search_radio_all%3A1&initiative_id=staobaoz_20161215&ie=utf8&bcoffset=-9&ntoffset=-3&p4ppushleft=1%2C48&s=220

 

 

 

 

 更為緊張的事情,本來關鍵詞是Python機器學習,結果搜索的結果是:全套2本2016秋期末沖刺100分二年級上完全試卷 二年級上 數學語文2年級全2本2年級上冊人教版RJ小學生同步練習卷期中期末測試卷搭,正版【全2冊】C程序設計語言//計算機科學叢書(第2版新版) 第二版 教材+習題詳解 媲美譚浩強 the c programming language 克尼漢等。為什么會是這樣的結果了?

 

 

 

可能解釋的結果是:淘寶禁止爬取通過搜索框輸入返回的結果列表???對參數做了特殊處理???有誰知道這樣的規律了?僅僅是為了學習抓包分析和爬蟲技術,不做他用。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM