易班易喵喵的話題連續打卡活動,人工統計實在太麻煩
寫了一個爬蟲用於統計 也算是給自己python爬蟲的入門練習
因為易喵喵的話題只有手機客戶端可以看到,模擬器登錄易班,任意訪問一個易喵喵話題,抓包
可以看到是get請求 有四個參數
page和size顯然表示頁數和每頁動態的數量
topicId是話題的唯一標識
返回的是json格式,能獲取到用戶易班ID,用戶昵稱,文字內容,圖片鏈接,點贊數,評論數等等信息
不過還有一個問題 為了不用每次爬取都手動抓包獲取loginToken輸入,還要再實現一步登錄操作
抓登錄請求
密碼被加密了
我這里使用selenium框架來操控瀏覽器 就可以跳過js分析那一步 emm偷個懶
驗證碼也可以一並搞定了 一步到位
源碼已經上傳到我的github