linux下python3離線加載nltk_data,不用nltk.download()


在不能上網的服務器上把nltk_data關聯到python3,已經安裝anaconda3所以不需要安裝nltk,環境是linux

首先沒有nltk_data在使用nltk會報錯

LookupError: 
**********************************************************************
  Resource 'tokenizers/punkt/PY3/english.pickle' not found.
  Please use the NLTK Downloader to obtain the resource:  >>>
  nltk.download()
  Searched in:
    - '/home/hadoopcj/nltk_data'
    - '/usr/share/nltk_data'
    - '/usr/local/share/nltk_data'
    - '/usr/lib/nltk_data'
    - '/usr/local/lib/nltk_data'
    - '/home/hadoopcj/nltk_data'
    - ''

1.下載nltk_data

https://github.com/nltk/nltk_data

里面的Packages就是我們要的資源。
2.里面有部分是壓縮包,需要解壓。punkt就是,不解壓即使路徑對了還是會報上面的錯誤

3.將Packages文件夾改名為nltk_data,拷貝到服務器

4.進入python console(如輸入/home/hadoopcj/anaconda3/bin/python3.6)在nltk添加你data的路徑

>>>from nltk import data
>>>data.path.append(r"/home/hadoopcj/nltk_data(你的路徑)")

5.查看nltk_data的搜索路徑,如果有你添加的就成功了

>>> nltk.data.path
>>> nltk.data.path
['/home/hadoopcj/nltk_data', '/usr/share/nltk_data', '/usr/local/share/nltk_data', '/usr/lib/nltk_data', '/usr/local/lib/nltk_data']

 

Related

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM