【Python】以詞雲分析文章


import wordcloud,jieba
from scipy.misc import imread #安裝scipy庫才可以
mk = imread('love.jpg')  #選擇形狀圖片
#對象的創建與參數設置
w = wordcloud.WordCloud(mask=mk,width=1000,height=700,font_path='msyh.ttc',background_color = 'white')  #形狀,寬,高,字體路徑,背景色
#文本文件的解析,並整合成一段以空格為間斷的字符串
txtjb = open('C:/Users/eternal/中國.txt','r',encoding='UTF-8')  #路徑,打開模式,編碼模式
txt = txtjb.read() #ok
for rev in '。,·1234567890-=【】;‘、~!@#¥%……&*()——+{}:“《》?|\n ':  #去掉這些東西,但是jieba庫自帶去掉..我白忙活
txt = txt.replace(rev,'') #居然需要返回到txt
#以jieba庫來變成以空格為間斷的字符串
newtxt = ' '.join(jieba.lcut(txt))
#以wordcloud庫把這些以空格分成的字符串變成圖
w.generate(newtxt)  #賦予詞雲對象-字符串
w.to_file('中國.png')  #產生詞雲圖的名稱
print(newtxt)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM