前言
最近幾日關注度最高的新聞莫過於一帶一路峰會相關的消息,會議結束后,一帶一路峰會聯合公告已經公布出來了。
本文通過詞雲分析,了解本次公告以及習大大在峰會開幕式上主要都講了哪些關鍵內容。
1 一帶一路峰會聯合公告詞雲圖
5月17日公布的一帶一路峰會聯合公告的詞雲分析結果圖,如下:
詞雲圖上,字體越大表示該詞語在文件中出現的次數越多。
從上圖可以看出,出現次數最多的3個詞語為“合作”、“我們”以及“加強” ,基本可以看出,本次峰會是一個新的起點,今后需要做的事情還很多,需要各方務實合作,哈。
2 一帶一路峰會開幕式上習大大的講話詞雲圖
分析開幕式上習大大的講話內容,得到詞雲圖如下:
從上圖可看出,出現次數最多的幾個詞語為“一帶一路”、“合作”、“我們”以及“發展”等。
3 用python制作詞雲圖
下面主要來介紹下用python制作這個詞雲圖的過程,主要分為如下幾個步驟:
- 從txt文件讀取需要分析的文本內容
- 使用jieba分詞工具進行中文分詞
- 選取合適的顯示圖形
- 用wordcloud進行詞雲圖顯示
- 保存圖片
一帶一路峰會聯合公告詞雲圖實現的代碼如下:
# -*- coding: utf-8 -*-
""" Created on Wed May 17 2017 @author: lemon """
import jieba
from wordcloud import WordCloud, ImageColorGenerator
import matplotlib.pyplot as plt
import os
import PIL.Image as Image
import numpy as np
with open('ydyl_gb.txt', 'rb') as f:
# 讀取一帶一路峰會聯合公報的內容
# with open('yidaiyilu.txt', 'rb') as f:
text = f.read()
f.close()
# 首先使用 jieba 中文分詞工具進行分詞
wordlist = jieba.cut(text, cut_all=False)
# cut_all, True為全模式,False為精確模式
wordlist_space_split = ' '.join(wordlist)
d = os.path.dirname(__file__)
alice_coloring = np.array(Image.open(os.path.join(d,'colors.png')))
my_wordcloud = WordCloud(background_color='#F0F8FF', max_words=100, mask=alice_coloring,
max_font_size=300, random_state=42).generate(wordlist_space_split)
image_colors = ImageColorGenerator(alice_coloring)
plt.show(my_wordcloud.recolor(color_func=image_colors))
plt.imshow(my_wordcloud) # 以圖片的形式顯示詞雲
plt.axis('off') # 關閉坐標軸
plt.show()
my_wordcloud.to_file(os.path.join(d, 'ydyl_gb_colors_cloud.png'))
更多精彩內容請關注微信公眾號:
“Python數據之道”