大數據分析之納稅人畫像-實現和優化思路
1.背景環境 本文章來自最近做的項目模塊的思考和總結,主要講思路不涉及過多的基礎和實現細節。 需求:統計出來納稅人名稱、行業、近一年業務量(辦稅服務廳、電子稅務局、自助渠道),近一年業務量top5(辦稅服務廳、電子稅務局、自助渠道)、近一年納稅金額、近一年申報數、近一年用票數。支持 ...
1.背景環境 本文章來自最近做的項目模塊的思考和總結,主要講思路不涉及過多的基礎和實現細節。 需求:統計出來納稅人名稱、行業、近一年業務量(辦稅服務廳、電子稅務局、自助渠道),近一年業務量top5(辦稅服務廳、電子稅務局、自助渠道)、近一年納稅金額、近一年申報數、近一年用票數。支持 ...
經歷過企查查這個網站后,強烈感覺到使用抓包的重要性,以至於決定從此以后使用抓包進行模擬請求,放棄使用F12進行分析。 寫下這篇文章,奠基死去的F12~~~ 代碼很簡單,甚至於簡陋,為什么要記錄下這個爬蟲,因為請求頭部信息,自己進行分析,和ctrl+c+v導致請求頭數據不准確,嚴重 ...
爬取企查查需要考慮到其驗證碼問題 驗證碼有兩種(滑動驗證碼和圖片驗證碼) 一、滑動驗證碼 解決辦法:使用selenium技術 1 先獲取到需滑動的塊狀 2 進行滑動、點擊按鈕 具體代碼如下: def get_track(distance ...
...
1、普通查詢 ...