環境:Ubuntu 10.10 + Python 2.6.6
NLTK: http://nltk.org/ 一個基於Python的自然語言處理的工具包
1.運行 sudo easy_install pip 出錯,
需要將setuptools-0.6c11-py2.6.egg之類的文件,設置成可執行的文件才可以
chmod u+x setuptools-0.6c11-py2.6.egg
2.sudo pip install -U numpy
這一步如果安裝失敗,如出現如下的錯誤:
Cannot compile 'Python.h'
會導致后面 import nltk 是出現如下錯誤:
Cannot find numpy module
解決方法,是改用以下的命名安裝numpy:
sudo apt-get install python-numpy
3. text.generate() causes AssertionError
參考:https://github.com/nltk/nltk/issues/285
需要覆蓋兩個文件:text.py 與 model/ngram.py
然后重新編譯下整個目錄即可:
import compileall compileall.compile_dir("/usr/local/lib/python2.6/dist-packages/nltk")
其中/usr/local/lib/python2.6/dist-packages/nltk 是筆者電腦上NLTK默認安裝的路徑
