1、網頁URL: http://www.shicimingju.com/book/sanguoyanyi.html 接着安裝requests庫和BeautifulSoup4這兩個庫 通過調用BeautifulSoup對象中相關的屬性或者方法進行標簽定位和數據提取。 快捷鍵 ...
作為一個三國迷,我有了這樣的想法:能不能用文本處理的方法,得到 三國演義 中的人物社交網絡,再進行分析呢 首先還是獲得三國演義的txt文本。 先用jieba庫把人物出場計算出來 用numpy庫和matplotlib庫做一個出場人物柱形圖 接着我們導出數據文件,將數據導入到 三國人物出場次數.txt 這個文件里面。 用數據畫出氣泡圖 這個matplotlib庫做數據分析挺好用,能做出來各種各樣的圖標 ...
2020-05-09 16:47 0 866 推薦指數:
1、網頁URL: http://www.shicimingju.com/book/sanguoyanyi.html 接着安裝requests庫和BeautifulSoup4這兩個庫 通過調用BeautifulSoup對象中相關的屬性或者方法進行標簽定位和數據提取。 快捷鍵 ...
#Hamlet詞頻統計(含Hamlet原文文本) #CalHamletV1.py def getText(): txt = open("hamlet.txt", "r").read() ...
0x00 前言 找不到要寫什么東西了!今天有個潭州大牛講師 說了個 文本詞頻分析 我基本上就照抄了一遍 中間遇到一些小小的問題 自我百度 填坑補全了 如下 : 效果演示 0x01 准備環境及介紹 python3.x版本 隨意 安裝jieba庫 pip ...
...
目標 統計三國演義中出現次數前100,並繪制雲圖 准備 分析工具:jieba,pandas,matplotlib,wordcloud 數據文檔:三國演義.txt(原著),三國人物.txt(三國人名,大約1000多個),三國字.txt(一些常見人名及字,約800) 這些文檔,放到了后面 說明 ...
第001回 宴桃園豪傑三結義 斬黃巾英雄首立功 第002回 張翼德怒鞭督郵 何國舅謀誅宦豎 第003回 議溫明董卓叱丁原 饋金珠李肅說呂布 第004回 廢漢帝陳留踐位 謀董賊孟德獻刀 第005 ...
/14743080.html 這次,就用分析統計下《三國演義》這部書里各角色出現的頻率,並繪制成詞雲 ...
運行結果: ...