[筆記] 利用詞雲圖分析熱詞


1.安裝第三方庫(matplotlib,jieba,wordcloud,numpy)

  1.1安裝方法:pip命令在線安裝(python3.x默認安裝了pip,pip下載地址:https://pypi.python.org/pypi/pip#downloads

    已經配置好環境變量前提下,在cmd窗口直接運行:pip install 包名(應為我已經安裝過了,所以提示已經安裝過了),如 pip install numpy

 

  1.2官網下載對應的whl進行安裝

    在 http://www.lfd.uci.edu/~gohlke/pythonlibs/ 下載所需的庫的.whl文件,注意如果安裝Python3.6,應下載對應的cp36的.whl文件,運行pip install **.whl

2. 導入對應的庫

import matplotlib
import matplotlib.pyplot as plt #數據可視化
import jieba #詞語切割
import wordcloud #分詞
from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS #詞雲,顏色生成器,停止
import numpy as np #科學計算
from PIL import Image #處理圖片

3.主要實現代碼

def ciyun():
    #打開文本
    textfile = open('1.txt').read() #讀取文本內容
    wordlist = jieba.cut_for_search(textfile)#切割詞語
    space_list = ' '.join(wordlist) # 鏈接詞語
    backgroud = np.array(Image.open('2.jpg')) #背景圖片,只有黑白圖才能按照形狀生成詞雲
    mywordcloud = WordCloud(width=1400, height=1200,
                            background_color= 'white',#背景顏色
                            mask=backgroud, #寫字用的背景圖,從圖片中提取顏色
                            max_words=500, #最大詞語數
                            stopwords=STOPWORDS,#停止的默認詞語
                            font_path='simkai.ttf',#源碼自帶字體
                            max_font_size=100,#最大字體尺寸
                            random_state=50,#隨機角度
                            scale=1).generate(space_list) #生成詞雲
    image_color = ImageColorGenerator(backgroud)#生成詞雲的顏色
    plt.imshow(mywordcloud) #顯示詞雲
    plt.axis('off') #關閉坐標(x,y軸)
    #plt.savefig('4.png') #保存圖片
    plt.show()#顯示

def main():
    ciyun()

if __name__ == '__main__':
    main()

4.效果如下:

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM