前言
利用Scrapy框架爬取並簡單分析安居客租房信息,讓我們愉快地開始吧~
開發工具
Python版本:3.6.4
相關模塊:
scrapy模塊;
pyecharts模塊;
以及一些Python自帶的模塊。
環境搭建
安裝Python並添加到環境變量,pip安裝需要的相關模塊即可。
原理簡介
這依舊是scrapy爬蟲框架的一個簡單應用,然后加了點數據可視化分析。
首先還是先新建一個爬蟲項目:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-LR1V3BLF-1617415512941)(https://upload-images.jianshu.io/upload_images/2539976-2a2bc246fb424e04?imageMogr2/auto-orient/strip|imageView2/2/w/1240)]
我們需要爬的網站是:
我選的上海,想爬的信息大概是這些:
先定義一下要爬取的內容(items.py):
然后隨便設置一下(settings.py):
最后寫下我們的爬蟲代碼(spider.py):
好的,我們很輕松地寫完了我們的爬蟲代碼。完整爬蟲項目詳見個人簡介獲取相關文件。
數據分析
首先讓我們來看看想租上海的房子,大概每個月需要多少錢:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Czc7wVo6-1617415512952)(https://upload-images.jianshu.io/upload_images/2539976-5cca19094461bd9b?imageMogr2/auto-orient/strip|imageView2/2/w/1240)]
把房價除以面積可能更客觀一點:
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-Zc6iUfaZ-1617415512954)(https://upload-images.jianshu.io/upload_images/2539976-40971810439d591c?imageMogr2/auto-orient/strip|imageView2/2/w/1240)]
再來看看這些房子的朝向吧:
向南的挺多~
還有住房類型:
文章到這里就結束了,感謝你的觀看,關注我每天分享Python模擬登錄系列,下篇文章分享Python獲取IP地址對應的地理位置信息。