Python利用jieba獲取中文詞匯等

本文轉載自查看原文 2017-07-19 23:51 1231 python

import jieba
import os
import jieba.analyse

data = cleaned_comments # 數據來源於評論數據
seg = jieba.lcut(data)
print(seg)

# 增加自定義詞表庫
mydict = os.getcwd()+"/mydict.txt"
jieba.load_userdict(mydict)
seg = jieba.lcut(data)
print(seg)

import jieba.posseg as pseg
posseg = pseg.lcut(data)
print(posseg)

# 抽取出現次數最多的詞匯
extracttext = jieba.analyse.extract_tags(data, topK=20,withWeight=False, allowPOS=())
print(extracttext)

待續。。。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Python基於jieba的中文詞雲 Python基礎庫之jieba庫的使用（第三方中文詞匯函數庫）超詳細：Python(wordcloud+jieba)生成中文詞雲圖利用jieba庫和wordcloud庫，進行中文詞頻統計並利用詞雲圖進行數據可視化 Python新手入門英文詞匯筆記（轉） python利用jieba進行中文分詞去停用詞 jieba中文處理 python python繪制中文詞雲圖 Python新手入門英文詞匯（1-1） Python 中文詞頻統計