0-0 前言
最近和同事做爬蟲,其中我主要遇到的問題是:同事在github上放了爬蟲demo讓我自己去下載,然后自己能搭好環境讓整個項目跑起來去抓51job找工作數據。git上克隆一個項目下來,項目是通過maven管理各種插件jar包,我自己摸索搭環境跑起來。
(1)網頁內容爬取用python2.7來做,爬取主要用的庫有:beautifulsoup4-4.5.1,lxml-3.6.0,stomp.py-4.1.9;均可去官網下載后解壓,在解壓目錄運行steup.py文件即可。
(2)消息隊列中間件用apache-activemq-5.9.1,下載后解壓運行bin\win64\activemq.bat,開啟一個消息隊列mq
(3)其中java處理部分用Intellij IDEA IDE,導入后發現各個依賴均沒有自動下載。Intellij iDEA IDE怎么導入maven工程,選擇file——open——projectName,打開項目,發現各種依賴包都沒有,需要我一個一個的去找再下載,然后放在本地自己安裝的maven項目里面,依賴的包太多,根本找不過來,只能重新想辦法。
用到的技巧是:導入一個maven項目到 IntellijIDAE2016.2,關鍵的一點是選擇open——》pom.xml,會自動下載和導入依賴包文件,而不用手動去一個一個的找。超級方便。如果選項目名稱導入的話需要配置pom.xml
0. 引言
今天想跟大家分享一下我主要的 Java 開發工具,我一般是這樣工作的:用 IDEA 寫代碼,用 Maven 管理 jar 包依賴與項目打包,用 Git 進行代碼版本控制。
關於這三款工具的安裝與配置的過程,本文不作說明,有不太明白的朋友,可以給我留言,我會盡力解答。
下面以開發 Smart 應用為例,描述一下這三款工具的具體使用方法。
1. 使用 Git 下載源碼
首先,在你的磁盤里找個單獨的文件夾來存放 Smart 的所有項目源碼,例如:D:\Project\smart,以下稱為“工作目錄”。
然后,分別通過 git clone 命令下載 Smart Framework 與 Smart Sample 的源碼到本地磁盤上。下載地址如下:
- Smart Framwork:http://git.oschina.net/huangyong/smart-framework
- Smart Sample:http://git.oschina.net/huangyong/smart-sample
- Smart Cache:http://git.oschina.net/huangyong/smart-plugin-cache
例如:使用 git clone http://git.oschina.net/huangyong/smart-framework 命令,下載 Smart Framework 項目源碼。
執行完以上三條 git clone 命令后,你的工作目錄中應該會看到這三個子目錄:smart-framework、smart-sample、smart-plugin-cache。
2. 編寫 Maven 項目配置文件
此時,你可以在工作目錄里(也就是在以上三個項目目錄的同級)編寫一個 Maven 項目配置文件(作為根配置文件),同樣需要命名為 pom.xml,用它來組織這三個項目。代碼如下:
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"> <modelVersion>4.0.0</modelVersion> <groupId>smart</groupId> <artifactId>smart</artifactId> <version>1.0</version> <packaging>pom</packaging> <modules> <module>smart-framework</module> <module>smart-sample</module> <module>smart-plugin-cache</module> </modules> </project>
3. 使用 IDEA 直接打開 Maven 項目
打開你的 IDEA,選擇 Open Project,此時會彈出一個對話框:
在地址欄中定位到你的工作目錄(可以手工編寫路徑或直接粘貼路徑),選擇 pom.xml,隨后 IDEA 將自動創建一個基於 Maven 項目。
注意:在 IDEA 的向導界面中一定要選擇是 Open Project,而不要選擇 Create New Project。也可以使用 Import Project 導入 Maven 項目,但沒有直接 Open Project 來得痛快。
彈指之間,項目已創建完畢!
4. 編譯源碼
先編譯一下吧,可以在工具欄中點擊這個按鈕:
你也可使用快捷鍵 Ctrl + F9,顯擺一下你的專業。
隨后,IDEA 將編譯整個項目源碼,一般情況下是沒有任何消息的,因為沒有消息就是好消息。
此外,你還可使用 Maven 進行編譯。在 IDEA 中點擊右側的 Maven Projects 選項卡,可看到如下界面:
注意:上圖中 smart (root) 表示 Maven 的根配置,也就是你剛才手工編寫的那個 pom.xml,由它來管理所有其他的 Maven 項目。
可雙擊一下 compile 節點,隨后 IDEA 會調用 Maven 進行編譯。這樣你就不需要在 cmd 里手工輸入 Maven 命令了,當然其他的命令你也是可以雙擊運行。
5. 在 IDEA 中配置 Tomcat
注意:建議使用 Tomcat 7.0+
在 IDEA 中配置 Tomcat,只需進行一下幾個步驟:
首先,點擊工具欄中的下拉框,然后點擊下拉菜單中的 Edit Configurations 菜單項。
點擊后將彈出一個對話框,你可點擊左上角的“+”按鈕,新建一個 Local 的 Tomcat Server。
然后,可對 Tomcat 進行命名,默認是 Unnamed,可修改為 Tomcat。此外,若你不想讓 IDEA 自動打開瀏覽器,去掉 Start browser 復選框即可,我一般都是這么干的。
隨后,部署一個項目,需要切換到上圖中的 Deployment 選項卡中,進行簡單的配置。
操作步驟:點擊“+”按鈕 -> 點擊 Artifacts... -> 選擇 smart-sample:war exploded -> 修改 Application context 為“/smart-sample”。
最后,建議你切換回 Server 選項卡,在 On frame deactivation 下拉框下選擇 Update resources。
這樣做是為了當你切換出 IDEA 后,可自動更新資源(包括:HTML、CSS、JS、JSP 等),如需要自動編譯的話,可使用第三個選項。
注意:IDEA 12.1.6(最新版)中有一個 Bug,第二項也進行了自動編譯,在之前的版本中是不存在的,不知道下個版本會不會解決這個問題,不過此問題不會影響你使用。
點擊 OK 按鈕完成 Tomcat 的所有配置,現在可在工具欄中看見 Tomcat 圖標了。
提示:在運行之前,你必須手工創建數據庫。比如,Smart Sample 的數據庫腳本就在 smart-sample 的 doc 目錄下。
6. 以 Debug 方式運行應用程序
你只需點一下工具欄中的 Debug 按鈕,即可以 Debug 方式運行 Smart Sample 了。
建議:在開發過程中盡量使用 Debug 方式運行,這樣你可以隨時在 IDEA 中打斷點進行調試。此外,需要說明的是,IDEA 的調試功能非常強大,而且非常好用!
7. 在 IDEA 中對 Git 進行提交與更新
在工具欄中也包括了 Git 的常用操作,操作非常方便。
以上圖標分別表示:更新代碼、提交代碼、查看差異、查看歷史、撤銷更改。
此外,你還可以點擊最下方的 Changes 選項卡,用來查看本地變更(Local)與提交日志(Log)。
你可以選擇某個版本來查看具體提交的文件內容,還可以同時選擇多個版本一起查看,還有很多實用的功能。
8. 總結
IDEA 是一款非常優秀的 Java 集成開發環境,用法非常簡單,上手也非常快。它對主流技術與工具都有相應的插件支持,你可以自定義插件列表,把對於自己無用的插件禁用掉。
Maven 是一款非常優秀的項目構建工具,有了它之后,你無需在每個項目中管理一大堆的 jar 包了,此外,它還非常有助於對項目進行打包(打 jar/war 包),當然它的功能絕不僅僅如此。
Git 是一款非常優秀的代碼版本控制系統,它可以有效地實現多人異地辦公,此外,你可以提交代碼到本地倉庫中,然后一次性提交到遠程倉庫。
以上三款工具的結合,會大大提高 Java 程序員的戰斗能力!在此,強烈推薦大家使用!