爬蟲管理平台以及wordpress本地搭建
學習目標:
- 各爬蟲管理平台了解
- scrapydweb
- gerapy
- crawlab
- 各爬蟲管理平台的本地搭建
- Windows下的wordpress搭建
爬蟲管理平台了解:
-
scrapydweb:
用於Scrapyd實施管理的web應用程序,支持Scrapy日志分析和可視化 github地址:https://github.com/my8100/scrapydweb.git
-
gerapy:
基於Scrapy,Scrapyd,Scrapyd-Client,Scrapyd-API,Django和Vue.js的分布式爬蟲管理框架 相關的配置在我之前博客地址:https://www.cnblogs.com/xbhog/p/13336651.html 該項目github地址:https://github.com/Gerapy/Gerapy.git
-
crawlab:
基於Golang的分布式爬蟲管理平台,支持多種編程語言以及多種爬蟲框架. 文檔地址:https://docs.crawlab.cn/zh/ GitHub地址:https://github.com/crawlab-team/crawlab.git
注意:前兩個框架的搭建基於Scrapyd,如果不知道怎么配置可以看我之前寫的博客:https://www.cnblogs.com/xbhog/p/13336651.html
爬蟲管理平台的本地搭建:
-
scrapydweb搭建:
-
安裝:pip install scrapydweb -i https://pypi.doubanio.com/simple
-
先打開scrapyd(命令行輸入)
-
再輸入scrapydweb
-
界面效果:
-
部署安裝網上教程很多,不多贅述
-
-
gerapy
- 相關的配置在我之前博客地址:https://www.cnblogs.com/xbhog/p/13336651.html
-
crawlab:(配置安裝官方給的很詳細,這里簡單說下)
-
首先把代碼從遠程倉庫clone下來:git clone 地址/復制地址到pycharm中
-
#官方推薦幾種安裝方式: Docker(入門簡單,推薦) Kubernetes(多機器部署,推薦) 直接部署(理解原理) 開發模式(開發調試) 多節點部署 #個人選擇docker,該項目配置環境過多,怕給本地造成沖突
-
docker的安裝:
-
安裝環境:本地虛擬化以及hyper-V需要打開,如圖所示
-
默認安裝即可
-
相關詳細鏈接(菜鳥教程:https://www.runoob.com/docker/windows-docker-install.html)
-
安裝docker-compose包:pip install docker-compose
-
在根目錄下測試:
docker-compose ps 正常為空 Name Command State Ports ------------------------------ --------------------------------
-
安裝並啟動:docker-compose up -d
-
Windows下的wordpress搭建:
環境准備:
- wampserver軟件
- wordpress源碼
- 百度網盤地址:鏈接:https://pan.baidu.com/s/1mAFu8XrNSfpyL_VgSvb8VA 提取碼:1234
搭建步驟:
-
打開wampserver.exe,默認安裝(注意在安裝路徑的時候不能有中文文件夾)
-
最后會有四個彈窗:
-
是否更改瀏覽器,該軟件默認瀏覽器是explorer,我們點擊是,選擇谷歌瀏覽器;
-
選擇nodpad++,選擇否。
-
-
安裝完成后,點擊桌面圖標運行,程序顏色表示狀態
- 紅色:配置沒啟動
- 橙色:配置啟動一部分
- 綠色:配置完全啟動
-
綠色后,單機程序圖標,點擊localhost進入網頁
-
將預先准備的wordpress安裝包放到wampserver/www文件夾下
-
進入網頁地址輸入:localhost/wordpress
點擊開始進入配置頁面:
-
上面配置先放置,我們先進行數據庫設置
輸入用戶名root,密碼空,點擊執行。
-
進入賬戶下的root,修改權限,修改密碼
-
我們需要對應之前的數據庫名稱(wordpress),所以新建數據庫
-
設置成功后返回之前的數據庫登錄頁面,填寫相關信息:
-
提交進入登陸界面配置:
-
填寫完成進入登陸界面
-
登陸:前后台界面