1、网页URL: http://www.shicimingju.com/book/sanguoyanyi.html 接着安装requests库和BeautifulSoup4这两个库 通过调用BeautifulSoup对象中相关的属性或者方法进行标签定位和数据提取。 快捷键 ...
作为一个三国迷,我有了这样的想法:能不能用文本处理的方法,得到 三国演义 中的人物社交网络,再进行分析呢 首先还是获得三国演义的txt文本。 先用jieba库把人物出场计算出来 用numpy库和matplotlib库做一个出场人物柱形图 接着我们导出数据文件,将数据导入到 三国人物出场次数.txt 这个文件里面。 用数据画出气泡图 这个matplotlib库做数据分析挺好用,能做出来各种各样的图标 ...
2020-05-09 16:47 0 866 推荐指数:
1、网页URL: http://www.shicimingju.com/book/sanguoyanyi.html 接着安装requests库和BeautifulSoup4这两个库 通过调用BeautifulSoup对象中相关的属性或者方法进行标签定位和数据提取。 快捷键 ...
#Hamlet词频统计(含Hamlet原文文本) #CalHamletV1.py def getText(): txt = open("hamlet.txt", "r").read() ...
0x00 前言 找不到要写什么东西了!今天有个潭州大牛讲师 说了个 文本词频分析 我基本上就照抄了一遍 中间遇到一些小小的问题 自我百度 填坑补全了 如下 : 效果演示 0x01 准备环境及介绍 python3.x版本 随意 安装jieba库 pip ...
...
目标 统计三国演义中出现次数前100,并绘制云图 准备 分析工具:jieba,pandas,matplotlib,wordcloud 数据文档:三国演义.txt(原著),三国人物.txt(三国人名,大约1000多个),三国字.txt(一些常见人名及字,约800) 这些文档,放到了后面 说明 ...
第001回 宴桃园豪杰三结义 斩黄巾英雄首立功 第002回 张翼德怒鞭督邮 何国舅谋诛宦竖 第003回 议温明董卓叱丁原 馈金珠李肃说吕布 第004回 废汉帝陈留践位 谋董贼孟德献刀 第005 ...
/14743080.html 这次,就用分析统计下《三国演义》这部书里各角色出现的频率,并绘制成词云 ...
运行结果: ...