python 中關於詞雲wordcloud的一些總結:


 

wordcloud類

from wordcloud import WordCloud

wc = WordCloud(參數)

#參數
# font_path:字體文件(OTF或TTF)的路徑,字符串

# width:繪圖區寬度,默認400,整型

# height:繪圖區高度,默認200,整型

# prefer_horizontal:單詞傾向於水平放置還是垂直放置,如果值小於1,則會在不合適的情況下旋轉單詞,浮點型,默認0.9

# mask:是否在給定的形狀內繪制單詞,這個參數使我們能夠根據給定的輪廓形狀繪制各種詞雲圖,當此參數不為None時,width和height將被忽略,nd-array型或None,默認None

# scale:計算過程和實際繪圖的比例,浮點型,默認1

# min_font_size:繪圖時最小的字體大小,整型,默認4

# font_step:字體大小的迭代步長,大於1時可能會出現錯誤排列,整型,默認1

# max_words:繪圖使用的最大單詞數,整型,默認200

# stopwords:排除的單詞集,字符串集或None,默認為None時,內置的字符串集將會被使用

# background_color:背景顏色,顏色值,默認為'black'

# max_font_size:繪圖時最大字體大小,整型或None,默認為None

# mode:模式,默認為'RGB',當為'RGBA'時,倘若背景顏色為None,則會得到透明的背景

# relative_scaling:單詞出現頻率對其字體大小的權重,值為0時,只考慮單詞排名對字體大小的影響,值為1時,具有2倍出現頻率的單詞具有2倍的字體大小,一般值設置為0.5最棒,浮點型

# color_func:顏色函數,用於生成不同顏色單詞的詞雲圖,默認為None

# regexp:正則表達式,用於分詞,默認為 r"\w[\w']+" 

# collocations:是否包括二元詞組,布爾型,默認為True

# colormap:顏色圖,隨機分配顏色給每個單詞,如果指定了color_func,則本參數被忽略,字符串或matplotlib colormap型,默認為'viridis'

# normalize_plurals:移除單詞末尾的's',布爾型,默認為True

屬性

wc.words_
#對應頻率的詞例,字典類型{字符串:浮點數}

wc.layout_
#記錄每個單詞的值,字體大小,位置,方向以及顏色,由一系列元組組成的列表,每個元組格式為(string, int, (int, int), int, color)

方法

wc.generate(text)
#從文本中生成詞雲圖

wc.fit_words(frequencies)
#根據給定單詞及頻率生成詞雲圖
#frequencies:元組型數組,每個元組包含一個單詞及其頻率

wc.generate_from_frequencies(frequencies, max_font_size=None)
#根據給定單詞及頻率生成詞雲圖
#frequencies:字典,包含字符串(單詞):浮點數(頻率)的值對
#max_font_size:最大字體大小

wc.process_text(text)
#將長文本分詞,並移除stopwords集合中的單詞
#返回字典,dict (string, int)

wc.recolor(random_state=None, color_func=None, colormap=None)
#重新上色
#random_state:隨機種子,整型或None

wc.to_array()
#以numpy矩陣的格式返回詞雲圖

to_file(filename)
#以圖片的格式返回詞雲圖
#filename:保存路徑

  

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM