nltk安裝配置以及語料庫的安裝配置


一 nltk的安裝

  nltk的安裝個人推薦使用pip安裝 直接在pycharm的Termial中安裝即可

 

 

   其中 安裝語句為 pip3 install nltk (如有python版本不同 可嘗試pip install nltk)

 

  此處我的已經安裝過所以顯示的是安裝位置  在安裝時如果很慢 可以使用其他的源路徑 如

阿里雲 :-i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com
中國科技大學: https://pypi.mirrors.ustc.edu.cn/simple/
豆瓣(douban) :http://pypi.douban.com/simple/
清華大學 :https://pypi.tuna.tsinghua.edu.cn/simple/
中國科學技術大學 :http://pypi.mirrors.ustc.edu.cn/simple/

二 安裝nltk語料庫

 之后在調用相關庫函數時會提示你相關的語料庫不存在 需要安裝

其中提示在python控制台輸入

import nltk

nltk.download()

然后會彈出一個nltk downloader nltk下載器

但是由於一些問題 我認為這是端口的原因 他的下載路徑一個美國的網址 而ip的進入就會有一些問題

網上相關的解釋 會讓你設置hosts文件

於是我選擇的手動安裝 語料庫

在使用庫函數的時候會在最后提示你可以安裝的路徑

這些路徑都是它可以找到的路徑 手動安裝好語料庫壓縮包后 將其解壓到任一路徑即可

 

在github上下載語料庫:https://github.com/nltk/nltk_data

 

文件有些大 大概600MB

在下載完成后 直接將里面的packages文件名改成nltk_data(里面的壓縮包都要解壓),然后放在該放的路徑下。

然后再次運行代碼 成功運行

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM