一、wordcloud庫基本介紹
1.1 wordcloud庫概述
wordcloud是優秀的詞雲展示第三方庫
- 詞雲以詞語為基本單位,更加直觀和藝術的展示文本
1.2wordcloud庫的安裝
pip install wordcloud(cmd命令行)
二、wordcloud庫使用說明
2.1 wordcloud庫基本是使用
wordcloud庫把詞雲當作一個WordCloud對象
- wordcloud.WordCloud()代表一個文本對應的詞雲
- 可以根據文本中詞語出現的頻率等參數繪制詞雲
- 繪制詞雲的形狀、尺寸和顏色都可以設定
2.2 wordcloud庫常規方法
w = wordcloud.WordCloud()
- 以WordCloud對象為基礎
- 配置參數、加載文本、輸出文件
| 方法 | 描述 |
|---|---|
| w.generate(txt) | 向WordCloud對象w中加載文本txt,w.generate("Python and WordCloud") |
| w.to_file(filename) | 將詞雲輸出為圖像文件,.png或.jpg,w.to_file("outfile.png") |
- 步驟1:配置對象參數
- 步驟2:加載詞雲文本
- 步驟3:輸出詞雲文件
import wordcloud
w = wordcloud.WordCloud()
w.generate("Python and WordCloud")
w.to_file("pywordcloud.png")
2.3 配置對象參數
w = wordcloud.WordCloud(<參數>)
| 參數 | 描述 |
|---|---|
| width | 指定詞雲對象生成圖片的寬度,默認400像素 |
| height | 指定詞雲對象生成圖片的高度,默認200像素 |
| min_font_size | 指定詞雲中字體的最小字號,默認4號 |
| max_font_size | 指定詞雲中字體的最大字號,根據高度自動調節 |
| font_step | 指定詞雲中字體字號的步進間隔,默認為1 |
| font_path | 指定字體文件的路徑,默認None |
| max_words | 指定詞雲顯示的最大單詞數量,默認200 |
| stop_words | 指定詞雲的排除詞列表,即不顯示的單詞列表 |
| mask | 指定詞雲形狀,默認為長方形,需要引用imread()函數 |
| background_color | 指定詞雲圖片的背景顏色,默認為黑色 |
# mask
from scipy.misc import imread
mk=imread("pic.png")
w=wordcloud.WordCloud(mask=mk)
2.4 wordcloud應用實例
import wordcloud
txt = "life is short, you need python"
w = wordcloud.WordCloud(background_color="white")
w.generate(txt)
w.to_file("pywcloud.png")
中文需要先分詞並組成空格分隔字符串





