環境:Ubuntu 16.04+anaconda3
一、pyltp
1. 安裝
直接用pip安裝:
pip install pyltp
然后下載語言模型庫,網址:https://pan.baidu.com/share/link?shareid=1988562907&uk=2738088569#list/path=%2F
這里我下載的是最新的3.4.0的版本,路徑隨意。
2. 使用
import pyltp
安裝成功之后,嘗試import發現報錯:undefined symbol: _ZTISt19__codecvt_utf8_baseIwE
然后各種百度,無果,最后還是在谷歌第一條就搜到了解決方法,附上鏈接:https://github.com/HIT-SCIR/pyltp/issues/58
解決方法:
cd ~/anaconda2/lib rm libstdc++.so.6.0.19 ln -s /usr/lib/x86_64-linux-gnu/libstdc++.so.6 libstdc++.so.6.0.19
然后再嘗試import,成功!
二、StanfordCoreNLP
按照以下逐步安裝:
1. jdk-8u181-linux-x64.tar.gz(Java環境):參考https://blog.csdn.net/yan3013216087/article/details/78307258
2. stanford-corenlp-full-2018-02-27.zip(Stanford NLP程序包):鏈接:https://stanfordnlp.github.io/CoreNLP/,點擊下方的download corenlp 3.9.1
3. stanford-chinese-corenlp-2018-02-27-models.jar(Stanford中文語言模型):跟上步一樣的鏈接,然后點擊下方的Chinese下載:
4. stanford-corenlp-master.zip(用Python實現的API接口,非常方便!):鏈接https://github.com/Lynten/stanford-corenlp,按照說明里的安裝與使用就可以,是查到的最方便的了!也可以直接調用Chinese里的模型。