FNLP是一個基於機器學習的中文自然語言文本處理的開發工具包,FNLP主要是為中文自然語言處理而開發的工具包,也包含為實現這些任務的機器學習算法和數據集。
----------百度百科
- 信息檢索 文本分類 新聞聚類
- 中文處理: 中文分詞 詞性標注 實體名識別 關鍵詞抽取 依存句法分析 時間短語識別
- 結構化學習: 在線學習 層次分類 聚類
在看這篇文章之前,請確定已經裝好了Eclipse,如果沒有安裝Eclipse,請看這里JSP環境安裝
因為FNLP在Github上已經有了很詳盡的入門教程,所以在這里我只是把這些教程的順序、要點和要注意的地方寫出來:
FNLP在Github上的項目地址:中文自然語言處理工具包 Toolkit for Chinese natural language processing (formerly FudanNLP)
首先先下載最新的fnlp版本文件,點這里............................:)IE瀏覽器有可能會點不動

往下找有一個入門教程鏈接

入門教程有兩個,我感覺第二個教程唯一有用的是一篇介紹Eclipse安裝Maven插件的文章,在這里:Eclipse安裝Maven插件
在使用fnlp工具之前,我們需要先安裝Maven工具,Maven和maven插件我已經傳到了網盤里,這里是地址Maven網盤文件
現在簡單的測試一下你的環境配置有沒有成功,打開cmd,分別輸入java -version javac -version mvn -version


進行到這一步可能有的同學會出現問題,提示沒有JAVA_HOME變量,進入電腦系統屬性-環境變量,新建系統變量JAVA_HOME,變量值為java/jdk的安裝目錄,java安裝目錄在cmd下可以用java -verbose查看

最后一行的地址就是你的java安裝地址,以我的電腦為例,JAVA_HOME的變量名就是C:\Program Files\Java\jdk1.8.0_20
好了,現在環境已經配置好了,其實有一些步驟我也是借鑒的第一篇教程,現在開始看第一篇fnlp入門教程:
為了方便,官方給的模型文件、兩個jar包的鏈接在這里直接貼出來http://pan.baidu.com/s/1D7CVc ,注意jar包只需要下載Trove和Commons-cli兩個。
接下來按教程走
cmd進入fnlp源碼目錄,如我的fnlp文件放在E:/fnlp下,

執行上面的命令:mvn install -Dmaven.test.skip=true,編譯fnlp
接下來就簡單多了,不過要注意官方教程里命令行調用中,包與包的間隔用的 : 號,windows用戶要改成 ; 號,英文狀態下。
在Eclipse項目中引用FNLP中需要注意的是,新建一個java Project,如果沒有找到,請注意右上角

然后只要按照Github上的第一個教程就好了
其實好多都是官方已經說明的,嗯,先感謝一下FNLP項目組成員!!!下面介紹幾個常見錯誤解決辦法(百度來的,經過驗證)
一、命令行執行報錯模型文件版本錯誤
用網盤的模型文件就好了,這種錯誤是因為你的模型文件和FNLP版本號不符,網盤里永遠是最新的
二、命令行報錯找不到或無法加載主類
首先請確定你的系統變量配置正確,Path,CLASSPATH還有JAVA_HOME
系統變量的正確配置是類似

只要把JAVA_HOME換成你的jdk目錄就好了
三、如果報錯空指針異常之類的錯誤,怎么也檢查不到代碼錯誤,或者干脆是cmd執行卻還是報空指針異常
額,恭喜你,估計是源文件有問題,歡迎加群253541693,報告管理員。
四、無論是maven,fnlp或者jdk,安裝目錄都不要用中文,否則奇奇怪怪的問題就來了。雖然,我的是英文路徑。
因為本人也是剛剛認識的FNLP,在安裝使用的過程中遇到了問題,也走了彎路,所以特地將安裝使用過程詳細的整理了下,希望能給想要使用FNLP的同學以幫助!
最后,歡迎有問題有錯誤的同學到這里一起討論,共同進步。轉載請注明來自任祥磊。
