微博用戶信息爬蟲

1 實現功能

這個項目是用來根據用戶id爬取微博用戶信息的數據，並寫入sqlite數據庫。

而這個用戶id是在微博簽到頁爬蟲這個爬蟲項目生成的weibo.sqlite數據庫中讀取的。所以想要爬自己有的一串用戶id的數據的朋友，可能還需要在這個小爬蟲上面再改改。

以及這個爬蟲是需要自己微博登錄的cookie的。

使用的是Python 3.7（在雲上用過3.5也完全ok）。

需要額外的第三方庫有yagmail（用來發送郵件）,pandas，bs4, numpy。均可使用pip來安裝。

pip install yagmail pandas bs4 numpy

step1. 修改cookie.txt中的cookie改為自己微博登錄的cookie。（如何獲取還請額外百度，非常多教程！）

step2. 修改代碼中的郵箱賬號密碼以及數據庫路徑。

step3. Run！

包含兩個文件。

就是用來存放cookie的。

爬蟲本體。

如果開始成功運行之后，控制台輸出大概是這樣的。

1545039042299

得到的user.sqlite結構就只有user一個表。

1545039128211

如果有什么Bug，或者改進建議。

請聯系我！(924154233@qq.com)

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 新浪微博搜索頁用戶信息爬取【Python項目】爬取新浪微博簽到頁運用Python爬取新浪微博用戶的信息 Python爬取新浪微博評論 python3使用requests爬取新浪熱門微博 Python-爬取微博信息用python寫網絡爬蟲-爬取新浪微博評論 python3爬蟲 -----新浪微博(m)-------評論爬取 Scrapy爬取新浪微博移動版用戶首頁第一條微博 Scrapy 爬取新浪微博