因為參與了創新計划,所以懵懵懂懂的接觸到了網絡爬蟲。
爬數據使用工具,因此了解到Python、asp.net等可以用來抓數據。
想想在學習.net的時候根本沒有想到會使用在這個上面——書本上的知識都是死的,那學習的基礎知識只能通過不斷的拓展使用領域才能在更好的得到深化、應用!
進入一個陌生的領域,從入門到精通的路真的是需要用汗水積累起來的——沒有真正的天才,只有自感聰明的蠢材。(自我審視)
有句話說的特別的好:“世界上兩種聰明的人:一種是從來不認為自己聰明的聰明人;而另一種是自以為自己很聰明的‘聰明人’。”——天才=99.99%汗水+0.01%聰明
學習爬蟲的時間,更多的是在吸取前輩的經驗,更多的是走一遍優秀規則的代碼,還是實例實踐更有助於知識的融會貫通。

pardon!like a bot!不怕,把cookies歷史清一清就好使用了。
在抓取數據之前最重要的一項就是要搞清楚自己抓取數據的網絡結構,明確自己的目標數據。
連續規則的抓取重要是要把記號標志和定位編號設置好。
整理箱的使用要結合樣例復制,優化規則的設置。
