1、准備
1)txt文檔
2)wordcloud安裝,用於生成詞雲:pip install wordcloud
3)jieba庫安裝,用於對文檔進行分詞,不分詞的話,詞雲圖上顯示的是句子:pip install jieba
4)背景圖,注:想要輪廓效果,圖的背景必須是純色(白色或黑色最好,圖像有明顯的反差色)
2、不分詞
1)代碼:
# 生成不分詞的圖片 from wordcloud import WordCloud import PIL.Image as image import numpy as np with open("hetang.txt", encoding='utf-8') as f: # 打開文本,我此處使用的是荷塘月色 text = f.read() mask = np.array(image.open("mod_imgs/3.png")) # 打開背景圖片 wc= WordCloud( mask=mask, # 背景圖像 font_path='FZSTK.TTF' # 中文字體,一般在c:\windows\fonts 下面 ).generate(text) # 生成文字雲 image_produce = wc.to_image() image_produce.show() # 打印圖片 wc.to_file('詞雲3-1.jpg') # 將圖片存入文件
2)效果圖
3、分詞
1)代碼
from wordcloud import WordCloud import PIL.Image as image import numpy as np import jieba with open("hetang.txt", encoding='utf-8') as f: text = f.read() word_list = jieba.cut(text) # 對中文進行分詞 text = " ".join(word_list) # 分詞后用空格連接在一起 mask = np.array(image.open("mod_imgs/3.png")) wc= WordCloud( mask=mask, background_color='white', # 圖像背景色,默認是黑色(如上圖) font_path = "FZSTK.TTF" ).generate(text) image_produce = wordcloud.to_image() image_produce.show() wc.to_file('詞雲3-2.jpg')
2)效果圖