1. 通過訂閱號/服務號采集
1.1 流程簡介
1)采集入口:登錄訂閱號/服務號后,依次點擊“素材管理 – 新建圖文消息 – 超鏈接”;
2)反爬措施:需要登錄后的cookie和登錄后地址欄中token值,cookie有效期為一天。
1.2實現簡單描述
注冊多個訂閱號/服務號,建立cookie池,隨機選取一個賬號的cookie和token,通過請求公眾號列表頁面獲得詳情頁url,然后再訪問詳情頁時不需要cookie和token即可獲取到數據。
1.3 優缺點
優點
Ÿ 不需要關注目標公眾號;
Ÿ 實時性較好,每次請求目標公眾號列表數據時均能獲取到最新數據;
Ÿ 方便獲取歷史數據(請求列表頁的url有翻頁參數)。
缺點/風險
Ÿ 因為訂閱號登陸后cookie有效期為一天,需要每天登陸獲取cookie和token。
Ÿ 訂閱號/服務號的注冊是需要個人/企業認證,存在微信可能記錄我們的瀏覽記錄。