【領域文章來源】: 通過百度查找的《三國演義》,下載,在本地自己創建txt文件。注:用encoding=utf-8 【源代碼】: import jieba excludes = {"來到","人馬","領兵","將軍","卻說","荊州","二人","不可","不能","如此"} txt ...
Hamlet詞頻統計 含Hamlet原文文本 CalHamletV .py def getText : txt open hamlet.txt , r .read txt txt.lower for ch in amp , . : lt gt : txt txt.replace ch, 將文本中特殊字符替換為空格 return txt hamletTxt getText words hamlet ...
2020-01-10 19:41 0 267 推薦指數:
【領域文章來源】: 通過百度查找的《三國演義》,下載,在本地自己創建txt文件。注:用encoding=utf-8 【源代碼】: import jieba excludes = {"來到","人馬","領兵","將軍","卻說","荊州","二人","不可","不能","如此"} txt ...
...
目標 統計三國演義中出現次數前100,並繪制雲圖 准備 分析工具:jieba,pandas,matplotlib,wordcloud 數據文檔:三國演義.txt(原著),三國人物.txt(三國人名,大約1000多個),三國字.txt(一些常見人名及字,約800) 這些文檔,放到了后面 說明 ...
作為一個三國迷,我有了這樣的想法:能不能用文本處理的方法,得到《三國演義》中的人物社交網絡,再進行分析呢? 首先還是獲得三國演義的txt文本。 先用jieba庫把人物出場計算出來 用numpy庫和matplotlib庫做一個出場人物柱形圖 ...
第001回 宴桃園豪傑三結義 斬黃巾英雄首立功 第002回 張翼德怒鞭督郵 何國舅謀誅宦豎 第003回 議溫明董卓叱丁原 饋金珠李肅說呂布 第004回 廢漢帝陳留踐位 謀董賊孟德獻刀 第005 ...
一、安裝所需要的第三方庫 jieba (jieba是優秀的中文分詞第三分庫) pyecharts (一個優秀的數據可視化庫) 《三國演義》.txt下載地址(提取碼:kist ) 使用pycharm安裝庫 打開Pycharm選擇【File】下的Settings ...
...
羅貫中在《三國演義》里到底描寫了多少個人物?下面我將列出一組數字,有的朋友可能會懷疑數字的准確性。這個沒有別的辦法,只好請懷疑的朋友自己找來《三國演義》清點一下,保證你點一遍一個數字,再點一遍和上一遍還是不一樣。呵呵,還是請你相信我列的數字吧。 imgLoading 羅貫中(1330 ...