微信運動數據抓取(Python)

本文轉載自查看原文 2018-05-20 16:14 1022

“微信運動”能夠向朋友分享一個包含有運動數據的網頁，網頁中就有我們需要的數據。url類似於：http://hw.weixin.qq.com/steprank/step/personal?openid=用戶的openid，其中有用於對於微信運動的唯一openid，打開fiddler進行抓包，首先打開fiddler，然后打開微信運動點擊我的主頁，如下：

微信通過請求頭區分是否是通過微信瀏覽器進行的請求，如果用瀏覽器直接打開鏈接會出現如下錯誤提示，說明不是通過微信瀏覽器打開被微信攔截了：

通過Fiddler的抓包數據我們可以通過偽造Request Headers請求頭抓取數據
Fiddler抓包顯示：

通過postman偽造請求頭模擬微信瀏覽器。偽造請求頭后成功在瀏覽器中得到了對應的網頁內容：

Python實現代碼：

import requests
import re
import json


class WechatSprot(object):
    def __init__(self, openid):
        self.openid = openid

    def getInfo(self):
        url = "http://hw.weixin.qq.com/steprank/step/personal"

        querystring = {"openid": self.openid}

        headers = {
            'host': "hw.weixin.qq.com",
            'connection': "keep-alive",
            'accept': "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8",
            'user-agent': "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36 MicroMessenger/6.5.2.501 NetType/WIFI WindowsWechat QBCore/3.43.691.400 QQBrowser/9.0.2524.400",
            'accept-encoding': "gzip, deflate",
            'accept-language': "zh-CN,zh;q=0.8,en-us;q=0.6,en;q=0.5;q=0.4",
            'cookie': "hwstepranksk=JxMBWw1sxQhxnMgsJnnLh-r0VFzLH6RtJWv5b_j3z8MPs6-J; pass_ticket=p9R%2FqjIh%2BlXt%2BoxP7GIWrqm3Sbf1Minisk%2FNUz5zra4ReETR2ATI8H57zkEERCvG",
        }

        response = requests.request("GET", url, headers=headers, params=querystring)

        res = re.findall('window.json = (.+);', response.text)
        # print(res)
        # exit()
        return json.loads(res[0])


if __name__ == "__main__":
    obj = WechatSprot(用戶的openid)
    print(obj.getInfo())

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 微信運動數據抓取(PHP) 微信公眾號數據抓取 Fidder - 抓取微信公眾號數據【小程序+ thinkphp5】獲取微信運動數據微信運動如何讀取小米手環的數據 [Python爬蟲] 之四：Selenium 抓取微博數據微信小程序獲取用戶信息，獲取微信運動數據 python_爬蟲_微信公眾號抓取 python通過手機抓取微信公眾號 python 抓取搜狗微信出現的問題，求大神解決