爬蟲管理平台以及wordpress本地搭建


爬蟲管理平台以及wordpress本地搭建

學習目標:

  1. 各爬蟲管理平台了解
    • scrapydweb
    • gerapy
    • crawlab
  2. 各爬蟲管理平台的本地搭建
  3. Windows下的wordpress搭建

爬蟲管理平台了解:

  1. scrapydweb:

    用於Scrapyd實施管理的web應用程序,支持Scrapy日志分析和可視化
    
    github地址:https://github.com/my8100/scrapydweb.git
    
  2. gerapy:

    基於Scrapy,Scrapyd,Scrapyd-Client,Scrapyd-API,Django和Vue.js的分布式爬蟲管理框架
    
    相關的配置在我之前博客地址:https://www.cnblogs.com/xbhog/p/13336651.html
    
    該項目github地址:https://github.com/Gerapy/Gerapy.git
    
  3. crawlab:

    基於Golang的分布式爬蟲管理平台,支持多種編程語言以及多種爬蟲框架.
    
    文檔地址:https://docs.crawlab.cn/zh/
    
    GitHub地址:https://github.com/crawlab-team/crawlab.git
    

注意:前兩個框架的搭建基於Scrapyd,如果不知道怎么配置可以看我之前寫的博客:https://www.cnblogs.com/xbhog/p/13336651.html

爬蟲管理平台的本地搭建:

  1. scrapydweb搭建:

    • 安裝:pip install scrapydweb -i https://pypi.doubanio.com/simple

    • 先打開scrapyd(命令行輸入)

    • 再輸入scrapydweb

    • 界面效果:

    • 部署安裝網上教程很多,不多贅述

  2. gerapy

  3. crawlab:(配置安裝官方給的很詳細,這里簡單說下)

    • 首先把代碼從遠程倉庫clone下來:git clone 地址/復制地址到pycharm中

    • #官方推薦幾種安裝方式:
      Docker(入門簡單,推薦)
      Kubernetes(多機器部署,推薦)
      直接部署(理解原理)
      開發模式(開發調試)
      多節點部署
      #個人選擇docker,該項目配置環境過多,怕給本地造成沖突
      
    • docker的安裝:

Windows下的wordpress搭建:

環境准備:

  1. wampserver軟件
  2. wordpress源碼
  3. 百度網盤地址:鏈接:https://pan.baidu.com/s/1mAFu8XrNSfpyL_VgSvb8VA 提取碼:1234

搭建步驟:

  1. 打開wampserver.exe,默認安裝(注意在安裝路徑的時候不能有中文文件夾)

  2. 最后會有四個彈窗:

    • 是否更改瀏覽器,該軟件默認瀏覽器是explorer,我們點擊是,選擇谷歌瀏覽器;

    • 選擇nodpad++,選擇否。

  3. 安裝完成后,點擊桌面圖標運行,程序顏色表示狀態

    • 紅色:配置沒啟動
    • 橙色:配置啟動一部分
    • 綠色:配置完全啟動
  4. 綠色后,單機程序圖標,點擊localhost進入網頁

  5. 將預先准備的wordpress安裝包放到wampserver/www文件夾下

  6. 進入網頁地址輸入:localhost/wordpress

    點擊開始進入配置頁面:

  7. 上面配置先放置,我們先進行數據庫設置

    輸入用戶名root,密碼空,點擊執行。

  8. 進入賬戶下的root,修改權限,修改密碼

  9. 我們需要對應之前的數據庫名稱(wordpress),所以新建數據庫

  10. 設置成功后返回之前的數據庫登錄頁面,填寫相關信息:

  11. 提交進入登陸界面配置:

  12. 填寫完成進入登陸界面

  13. 登陸:前后台界面


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM