【Python】以词云分析文章


import wordcloud,jieba
from scipy.misc import imread #安装scipy库才可以
mk = imread('love.jpg')  #选择形状图片
#对象的创建与参数设置
w = wordcloud.WordCloud(mask=mk,width=1000,height=700,font_path='msyh.ttc',background_color = 'white')  #形状,宽,高,字体路径,背景色
#文本文件的解析,并整合成一段以空格为间断的字符串
txtjb = open('C:/Users/eternal/中国.txt','r',encoding='UTF-8')  #路径,打开模式,编码模式
txt = txtjb.read() #ok
for rev in '。,·1234567890-=【】;‘、~!@#¥%……&*()——+{}:“《》?|\n ':  #去掉这些东西,但是jieba库自带去掉..我白忙活
txt = txt.replace(rev,'') #居然需要返回到txt
#以jieba库来变成以空格为间断的字符串
newtxt = ' '.join(jieba.lcut(txt))
#以wordcloud库把这些以空格分成的字符串变成图
w.generate(newtxt)  #赋予词云对象-字符串
w.to_file('中国.png')  #产生词云图的名称
print(newtxt)


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM