NLP&Python筆記——nltk模塊基礎操作

本文轉載自查看原文 2018-07-18 15:19 2041 NLP/ Python

nltk是一款常用的基於python的NLP工具包，本文介紹了nlkt的安裝導入以及一些基礎的函數操作。

1. 安裝

（1）安裝nltk庫： pip install nlkt

（2）下載nltk庫中的book文件：

import nltk
nltk.download()

運行--> 彈出下載界面 --> 選擇book--> 設置好路徑--> Download

（3）下載好后，加載nltk的book模塊中所有條目：

from nltk.book import *

（4）加載后，就可以使用庫中包含的文檔了。如，text1/tex2/tex3.....

（1）搜索文本：text.concordance(word)

例如，在text1中搜索詞”is”在文本中出現的次數以及上下文的詞：text1.concordance("is")

（2）搜索上下文相似的詞：text.similar(word)

例如，在text1中搜索哪些相似的詞出現在詞”is”的上下文中：text1.similar("is")

（3）搜索幾個詞匯上下文的公共詞匯：text.common_contexts([word1,word2…])

例如，在text1中搜索哪些詞是”is”和“that”上下文中的公共詞匯：text1.common_contexts(["is","that"])

（4）離散圖表示詞出現的位置序列：text.dispersion_plot([word1, word2,])

例如，用離散圖表示詞"am","is","are","the","a"在text1中出現的位置，即從開頭算起的第多少個詞：text1.dispersion_plot(["am","is","are","the","a"])

（5）統計文本標示符（單詞和標點符號）的個數：len(text)

（6）獲取文本的詞匯表（含標點符號）：set(text)

（7）獲取詞匯表並排序：sorted(set(text))

（8）統計詞匯表的大小：len(set(text))

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 NLP&Python筆記——語料庫 NLTK與NLP原理及基礎 NLP python庫 nltk 安裝【NLP】Python NLTK 走進大秦帝國【NLP】Python NLTK處理原始文本【NLP】Python NLTK獲取文本語料和詞匯資源【NLP】干貨！Python NLTK結合stanford NLP工具包進行文本處理 Python文本處理nltk基礎 NLTK基礎 NLTK學習筆記(一):語言處理和Python