[筆記] 利用詞雲圖分析熱詞

本文轉載自查看原文 2018-11-25 22:14 1487 筆記/ Python

1.安裝第三方庫（matplotlib，jieba，wordcloud，numpy）

　　1.1安裝方法：pip命令在線安裝（python3.x默認安裝了pip，pip下載地址：https://pypi.python.org/pypi/pip#downloads）

　　　　已經配置好環境變量前提下，在cmd窗口直接運行：pip install 包名(應為我已經安裝過了，所以提示已經安裝過了)，如 pip install numpy

　　1.2官網下載對應的whl進行安裝

　　　　在 http://www.lfd.uci.edu/~gohlke/pythonlibs/ 下載所需的庫的.whl文件，注意如果安裝Python3.6，應下載對應的cp36的.whl文件，運行pip install **.whl

2. 導入對應的庫

import matplotlib
import matplotlib.pyplot as plt #數據可視化
import jieba #詞語切割
import wordcloud #分詞
from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS #詞雲，顏色生成器，停止
import numpy as np #科學計算
from PIL import Image #處理圖片

3.主要實現代碼

def ciyun():
    #打開文本
    textfile = open('1.txt').read() #讀取文本內容
    wordlist = jieba.cut_for_search(textfile)#切割詞語
    space_list = ' '.join(wordlist) # 鏈接詞語
    backgroud = np.array(Image.open('2.jpg')) #背景圖片，只有黑白圖才能按照形狀生成詞雲
    mywordcloud = WordCloud(width=1400, height=1200,
                            background_color= 'white',#背景顏色
                            mask=backgroud, #寫字用的背景圖，從圖片中提取顏色
                            max_words=500, #最大詞語數
                            stopwords=STOPWORDS,#停止的默認詞語
                            font_path='simkai.ttf',#源碼自帶字體
                            max_font_size=100,#最大字體尺寸
                            random_state=50,#隨機角度
                            scale=1).generate(space_list) #生成詞雲
    image_color = ImageColorGenerator(backgroud)#生成詞雲的顏色
    plt.imshow(mywordcloud) #顯示詞雲
    plt.axis('off') #關閉坐標（x,y軸）
    #plt.savefig('4.png') #保存圖片
    plt.show()#顯示

def main():
    ciyun()

if __name__ == '__main__':
    main()

4.效果如下：

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 用詞雲圖分析一帶一路峰會哪3個詞說的最多 Python 爬取熱詞並進行分類數據分析-[雲圖制作+數據導入] Python - 利用詞雲wordcloud，jieba和中國地圖制作四大名著的熱詞圖 [超詳細] Python3爬取豆瓣影評、去停用詞、詞雲圖、評論關鍵詞繪圖處理詞雲圖 Python利用jieba庫做詞頻統計 ES 實現實時從Mysql數據庫中讀取熱詞,停用詞 python對影評進行評論分析，形成詞雲圖 Python爬蟲b站視頻彈幕並生成詞雲圖分析利用jieba庫和wordcloud庫，進行中文詞頻統計並利用詞雲圖進行數據可視化 Python生成詞雲圖