第001回 宴桃园豪杰三结义 斩黄巾英雄首立功 第002回 张翼德怒鞭督邮 何国舅谋诛宦竖 第003回 议温明董卓叱丁原 馈金珠李肃说吕布 第004回 废汉帝陈留践位 谋董贼孟德献刀 第005 ...
第001回 宴桃园豪杰三结义 斩黄巾英雄首立功 第002回 张翼德怒鞭督邮 何国舅谋诛宦竖 第003回 议温明董卓叱丁原 馈金珠李肃说吕布 第004回 废汉帝陈留践位 谋董贼孟德献刀 第005 ...
#Hamlet词频统计(含Hamlet原文文本) #CalHamletV1.py def getText(): txt = open("hamlet.txt", "r").read() ...
...
运行结果: ...
python爬取《三国演义》小说&统计词频&生成词云图 注意点: 爬取小说正文时用的正则表达式涉及到多行匹配。需要开启多行模式(?s) book_content_re = re.compile(r'(?s)<div.*?id="htmlContent"> ...
1、网页URL: http://www.shicimingju.com/book/sanguoyanyi.html 接着安装requests库和BeautifulSoup4这两个库 通过 ...
【领域文章来源】: 通过百度查找的《三国演义》,下载,在本地自己创建txt文件。注:用encoding=utf-8 【源代码】: import jieba excludes = {"来到","人马","领兵","将军","却说","荆州","二人","不可","不能","如此"} txt ...
0x00 前言 找不到要写什么东西了!今天有个潭州大牛讲师 说了个 文本词频分析 我基本上就照抄了一遍 中间遇到一些小小的问题 自我百度 填坑补全了 如下 : 效果演示 0 ...