1. wordcloud概述
wordcloud是優秀的詞雲展示第三方
詞雲以詞語為基本單位,更加直觀和藝術地展示文本
2.安裝wordcloud
在編寫程序之前需要下載第三方庫:
jieba
wordcloud
scipy
python3.0是:pip3 install module_name
python2.7是:pip install module_name
3.wordcloud庫的使用
- wordcloud庫把詞雲當作一個WordCloud對象
- wordcloud.WordCloud()代表一個文本對應的詞雲
- 可以根據文本中詞語出現的頻率等參數繪制詞雲
- 詞雲的繪制形狀、尺寸和顏色都可以設定
4. wordcloud.WordCloud()中參數解釋
參數 | 描述 |
---|---|
width | 指定詞雲對象生成圖片的寬度,默認400像素>>>w=wordcloud.WordCloud(width=600) |
height | 指定詞雲對象生成圖片的高度,默認200像素>>>w=wordcloud.WordCloud(height=400) |
min_font_size | 指定詞雲中字體的最小字號,默認4號>>>w=wordcloud.WordCloud(min_font_size=10) |
max_font_size | 指定詞雲中字體的最大字號,根據高度自動調節>>>w=wordcloud.WordCloud(max_font_size=20) |
font_step | 指定詞雲中字體字號的步進間隔,默認為1>>>w=wordcloud.WordCloud(font_step=2) |
font_path | 指定字體文件的路徑,默認None>>>w=wordcloud.WordCloud(font_path="msyh.ttc") |
max_words | 指定詞雲顯示的最大單詞數量,默認200>>>w=wordcloud.WordCloud(max_words=20) |
stop_words | 指定詞雲的排除詞列表,即不顯示的單詞列表>>>w=wordcloud.WordCloud(stop_words={"Python"}) |
mask | 指定詞雲形狀,默認為長方形,需要引用imread()函數>>>from scipy.misc import imread>>>mk=imread("pic.png")>>>w=wordcloud.WordCloud(mask=mk) |
background_color | 指定詞雲圖片的背景顏色,默認為黑色>>>w=wordcloud.WordCloud(background_color="white") |
5.程序模版
import jieba
import wordcloud
file1 = open("country.txt", "r") #打開文本
t = file1.read() #讀取全部內容
file1.close() #關閉文件
ls = jieba.lcut(t) #將讀取內容轉化成列表形式
txt = " ".join(ls) #用空格連接內容,必須是空格
w = wordcloud.WordCloud(font_path="ukai.ttc", width=1000, height=700,\
background_color="white")
w.generate(txt) #向wordcloud對象中添加txt文本
w.to_file("map.png") #將詞雲輸出成圖像文件
5.圖片實例
- 在自定義圖片輸出格式之后,比如輸出中國地圖樣式的圖片,只需在上述代碼中添加如下幾行代碼即可:
from scipy.misc import imread
mask=imread("chinamap.jpg") #自定義要輸出的詞雲形狀,注意添加的圖片背景顏色必須與要輸出的圖片一致。
在wordcloud.WordCloud()中添加參數mask=mask