-- coding：utf-8 --

import jieba

讀取文件

f=open(r'E:\Chrome_download\tieba.txt',encoding='utf-8')
txt =f.read()

words = jieba.lcut(txt)
string = ' '.join(words)

print(f"輸出詞數量：{len(words)}") # 詞數量
print(f"不重復詞數量{len(set(words))}") # 不重復詞數量

counts ={}
for word in words:
if len(word)==1:
continue
else:
counts[word]=counts.get(word,0)+1 # 這個語法需要理解下

    # dict.get(key,default=None)
    # key -- 字典中要查找的鍵
    # default 指定key不存在時，返回值。
    #

items = list(counts.items()) #返回可遍歷的(鍵, 值) 元組數組。

items.sort(key=lambda x:x[1],reverse=True)

for i in range(15):
word ,count = items[i]
print(f"{word}--出現了--{count}-次")

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python統計文檔中詞頻 Python 統計英文詞頻（txt格式) python—文本詞頻統計哈姆雷特 txt 下載 Python 讀取 Word 文檔統計詞頻輸出至excel文件【Python】詞頻統計詞頻統計（python）詞雲圖 Python利用jieba庫做詞頻統計利用python實現簡單詞頻統計、構建詞雲用Python來進行詞頻統計 Python詞頻統計