用詞雲圖分析一帶一路峰會哪3個詞說的最多


前言

最近幾日關注度最高的新聞莫過於一帶一路峰會相關的消息,會議結束后,一帶一路峰會聯合公告已經公布出來了。
本文通過詞雲分析,了解本次公告以及習大大在峰會開幕式上主要都講了哪些關鍵內容。

1 一帶一路峰會聯合公告詞雲圖

5月17日公布的一帶一路峰會聯合公告的詞雲分析結果圖,如下:

詞雲圖上,字體越大表示該詞語在文件中出現的次數越多。

從上圖可以看出,出現次數最多的3個詞語為“合作”、“我們”以及“加強” ,基本可以看出,本次峰會是一個新的起點,今后需要做的事情還很多,需要各方務實合作,哈。

2 一帶一路峰會開幕式上習大大的講話詞雲圖

分析開幕式上習大大的講話內容,得到詞雲圖如下:

從上圖可看出,出現次數最多的幾個詞語為“一帶一路”、“合作”、“我們”以及“發展”等。

3 用python制作詞雲圖

下面主要來介紹下用python制作這個詞雲圖的過程,主要分為如下幾個步驟:

  • 從txt文件讀取需要分析的文本內容
  • 使用jieba分詞工具進行中文分詞
  • 選取合適的顯示圖形
  • 用wordcloud進行詞雲圖顯示
  • 保存圖片

一帶一路峰會聯合公告詞雲圖實現的代碼如下:

# -*- coding: utf-8 -*-
""" Created on Wed May 17 2017 @author: lemon """

import jieba
from wordcloud import WordCloud, ImageColorGenerator
import matplotlib.pyplot as plt
import os
import PIL.Image as Image
import numpy as np

with open('ydyl_gb.txt', 'rb') as f:
# 讀取一帶一路峰會聯合公報的內容
# with open('yidaiyilu.txt', 'rb') as f:
    text = f.read()
    f.close()

# 首先使用 jieba 中文分詞工具進行分詞
wordlist = jieba.cut(text, cut_all=False)      
# cut_all, True為全模式,False為精確模式

wordlist_space_split = ' '.join(wordlist)

d = os.path.dirname(__file__)
alice_coloring = np.array(Image.open(os.path.join(d,'colors.png')))
my_wordcloud = WordCloud(background_color='#F0F8FF', max_words=100, mask=alice_coloring,
                         max_font_size=300, random_state=42).generate(wordlist_space_split)

image_colors = ImageColorGenerator(alice_coloring)

plt.show(my_wordcloud.recolor(color_func=image_colors))
plt.imshow(my_wordcloud)            # 以圖片的形式顯示詞雲
plt.axis('off')                     # 關閉坐標軸
plt.show()

my_wordcloud.to_file(os.path.join(d, 'ydyl_gb_colors_cloud.png'))

更多精彩內容請關注微信公眾號:

“Python數據之道”


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM