大概路線就這樣:
(圖來源於某交流群的蔡老板)
如果圖片看不清楚,百度下載:
鏈接: https://pan.baidu.com/s/1YgH4W3v8-7rwj08ahc2BWQ 提取碼: nvx4
掌握了以上的技術的話,基本就沒什么東西了,無論是爬蟲還是反爬還是反反爬,都絕不能局限於Python這一門語言上,比如你要搞web部分的js爬蟲破解,那會javascript的同時,還得學會AST,要搞移動端部分的話,得會java和安卓開發體系之類的
如果還想提升,那只有往逆向和算法上研究了
也就是我博客右邊欄說的那句話:
爬蟲的盡頭是逆向,逆向的源頭是java(這里的java指java和javascript)
爬蟲的捷徑是 A I, A I 的源頭是算法