wordcloud類
from wordcloud import WordCloud wc = WordCloud(參數) #參數 # font_path:字體文件(OTF或TTF)的路徑,字符串 # width:繪圖區寬度,默認400,整型 # height:繪圖區高度,默認200,整型 # prefer_horizontal:單詞傾向於水平放置還是垂直放置,如果值小於1,則會在不合適的情況下旋轉單詞,浮點型,默認0.9 # mask:是否在給定的形狀內繪制單詞,這個參數使我們能夠根據給定的輪廓形狀繪制各種詞雲圖,當此參數不為None時,width和height將被忽略,nd-array型或None,默認None # scale:計算過程和實際繪圖的比例,浮點型,默認1 # min_font_size:繪圖時最小的字體大小,整型,默認4 # font_step:字體大小的迭代步長,大於1時可能會出現錯誤排列,整型,默認1 # max_words:繪圖使用的最大單詞數,整型,默認200 # stopwords:排除的單詞集,字符串集或None,默認為None時,內置的字符串集將會被使用 # background_color:背景顏色,顏色值,默認為'black' # max_font_size:繪圖時最大字體大小,整型或None,默認為None # mode:模式,默認為'RGB',當為'RGBA'時,倘若背景顏色為None,則會得到透明的背景 # relative_scaling:單詞出現頻率對其字體大小的權重,值為0時,只考慮單詞排名對字體大小的影響,值為1時,具有2倍出現頻率的單詞具有2倍的字體大小,一般值設置為0.5最棒,浮點型 # color_func:顏色函數,用於生成不同顏色單詞的詞雲圖,默認為None # regexp:正則表達式,用於分詞,默認為 r"\w[\w']+" # collocations:是否包括二元詞組,布爾型,默認為True # colormap:顏色圖,隨機分配顏色給每個單詞,如果指定了color_func,則本參數被忽略,字符串或matplotlib colormap型,默認為'viridis' # normalize_plurals:移除單詞末尾的's',布爾型,默認為True
屬性
wc.words_
#對應頻率的詞例,字典類型{字符串:浮點數}
wc.layout_
#記錄每個單詞的值,字體大小,位置,方向以及顏色,由一系列元組組成的列表,每個元組格式為(string, int, (int, int), int, color)
方法
wc.generate(text) #從文本中生成詞雲圖 wc.fit_words(frequencies) #根據給定單詞及頻率生成詞雲圖 #frequencies:元組型數組,每個元組包含一個單詞及其頻率 wc.generate_from_frequencies(frequencies, max_font_size=None) #根據給定單詞及頻率生成詞雲圖 #frequencies:字典,包含字符串(單詞):浮點數(頻率)的值對 #max_font_size:最大字體大小 wc.process_text(text) #將長文本分詞,並移除stopwords集合中的單詞 #返回字典,dict (string, int) wc.recolor(random_state=None, color_func=None, colormap=None) #重新上色 #random_state:隨機種子,整型或None wc.to_array() #以numpy矩陣的格式返回詞雲圖 to_file(filename) #以圖片的格式返回詞雲圖 #filename:保存路徑
