WordCloud


1. wordcloud概述

wordcloud是優秀的詞雲展示第三方
詞雲以詞語為基本單位,更加直觀和藝術地展示文本

2.安裝wordcloud

在編寫程序之前需要下載第三方庫:
jieba
wordcloud
scipy

python3.0是:pip3 install module_name
python2.7是:pip install module_name

3.wordcloud庫的使用

  • wordcloud庫把詞雲當作一個WordCloud對象
  • wordcloud.WordCloud()代表一個文本對應的詞雲
  • 可以根據文本中詞語出現的頻率等參數繪制詞雲
  • 詞雲的繪制形狀、尺寸和顏色都可以設定

4. wordcloud.WordCloud()中參數解釋

參數 描述
width 指定詞雲對象生成圖片的寬度,默認400像素>>>w=wordcloud.WordCloud(width=600)
height 指定詞雲對象生成圖片的高度,默認200像素>>>w=wordcloud.WordCloud(height=400)
min_font_size 指定詞雲中字體的最小字號,默認4號>>>w=wordcloud.WordCloud(min_font_size=10)
max_font_size 指定詞雲中字體的最大字號,根據高度自動調節>>>w=wordcloud.WordCloud(max_font_size=20)
font_step 指定詞雲中字體字號的步進間隔,默認為1>>>w=wordcloud.WordCloud(font_step=2)
font_path 指定字體文件的路徑,默認None>>>w=wordcloud.WordCloud(font_path="msyh.ttc")
max_words 指定詞雲顯示的最大單詞數量,默認200>>>w=wordcloud.WordCloud(max_words=20)
stop_words 指定詞雲的排除詞列表,即不顯示的單詞列表>>>w=wordcloud.WordCloud(stop_words={"Python"})
mask 指定詞雲形狀,默認為長方形,需要引用imread()函數>>>from scipy.misc import imread>>>mk=imread("pic.png")>>>w=wordcloud.WordCloud(mask=mk)
background_color 指定詞雲圖片的背景顏色,默認為黑色>>>w=wordcloud.WordCloud(background_color="white")

5.程序模版

import jieba
import wordcloud

file1 = open("country.txt", "r")     #打開文本
t = file1.read()                                     #讀取全部內容
file1.close()                                         #關閉文件

ls = jieba.lcut(t)                                  #將讀取內容轉化成列表形式
txt = " ".join(ls)                                   #用空格連接內容,必須是空格

w = wordcloud.WordCloud(font_path="ukai.ttc", width=1000, height=700,\
		background_color="white")
w.generate(txt)                #向wordcloud對象中添加txt文本
w.to_file("map.png")    #將詞雲輸出成圖像文件

5.圖片實例

  • 在自定義圖片輸出格式之后,比如輸出中國地圖樣式的圖片,只需在上述代碼中添加如下幾行代碼即可:
from scipy.misc import imread
mask=imread("chinamap.jpg")       #自定義要輸出的詞雲形狀,注意添加的圖片背景顏色必須與要輸出的圖片一致。

在wordcloud.WordCloud()中添加參數mask=mask


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM