Linux搭建Scrapy爬蟲集成開發環境

本文轉載自查看原文 2016-04-26 09:51 2732 LINUX

下載地址：http://www.python.org/， Python 有 Python 2 和 Python 3 兩個版本，語法有些區別，ubuntu上自帶了python2.7.6，所以在 ubuntu上暫時不需額外安裝。

下載地址：http://www.oracle.com/technetwork/java/javase/downloads，下載與具體機器對應的版本，我這里由於是ubuntu64位，所以下載了jdk-8u77-linux-x64.tar.gz

解壓：tar -zxvf jdk-8u77-linux-x64.tar.gz

進入到解壓的目錄，拷貝：cp -R jdk1.8.0_77/ /usr/local/

配置環境變量：vi .bashrc

添加：

export JAVA_HOME=/usr/local/jdk1.8.0_77

export JAVA_BIN=$JAVA_HOME/bin

export JAVA_LIB=$JAVA_HOME/lib

export CLASSPATH=.:$JAVA_LIB/tools.jar:$JAVA_LIB/dt.jar

export PATH=$JAVA_BIN:$PATH

使環境變量生效：source .bashrc

下載地址：http://www.eclipse.org/downloads/

下載完后，解壓就可以直接使用， Eclipse不需要安裝。

tar -zxvf eclipse-jee-mars-2-linux-gtk-x86_64.tar.gz

cp -R eclipse /usr/local/

下載地址：http://www.pydev.org/index.html

將壓縮文件解壓出來，得到features和plugins兩個文件夾，然后將兩個文件夾中的文件分別拷貝到Eclipse安裝目錄下的features和plugins目錄中。

然后配置python解釋器，啟動Eclipse，打開window->Preferences，選擇Interpreter-Python，然后選擇New，在彈出的對話框的Interpreter Name寫Python, 在Interpreter Executable寫入python可執行解釋器的地址。

如果eclipse打開時沒有菜單欄，通過以下方法解決:

其實就是缺一個環境變量UBUNTU_MENUPROXY. 在/etc/profile 里面新建這個變量並且把值寫成0，然后重啟就行啦,export UBUNTU_MENUPROXY=0

下面是Scrapy爬蟲開發安裝：

1.先安裝好python集成開發環境，參考前面步驟

2. 安裝 Scrapy

Scrapy依賴於Python開發庫和pip。

Python 最新的版本已經在Ubuntu上預裝了，因此我們在安裝 Scrapy之前只需安裝pip和python開發庫就可以了。

pip是作為python包索引器easy_install的替代品，用於安裝和管理Python包。

安裝pip：sudo apt-get install python-pip

安裝python-dev：sudo apt-get install python-dev

安裝Scrapy：pip install Scrapy

3. 安裝pyquery包：pip install pyquery

pyQuery 是 jQuery 的Python實現,如果對Web前端有了解,特別是有用過 jQuery 的,那么 pyQuery 將會是你處理HTML內容的最佳選擇。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 windows和linux中搭建python集成開發環境IDE——如何設置多個python環境使用Android Studio搭建Android集成開發環境第一記搭建Java集成開發環境 Python集成開發環境什么是IDE（集成開發環境）？ Windows環境下ARM集成開發環境的搭建與使用 java學習：eclipse + Weblogic 12c + svn 集成開發環境搭建使用IntelliJ IDEA 13搭建Android集成開發環境（圖文教程）使用Android Studio搭建Android集成開發環境（圖文教程）幾個linux 下C/C++集成開發環境推薦