#Hamlet词频统计(含Hamlet原文文本) #CalHamletV1.py def getText(): txt = open("hamlet.txt", "r").read() txt = txt.lower() for ch in '!"#$%& ...
一 安装所需要的第三方库 jieba jieba是优秀的中文分词第三分库 pyecharts 一个优秀的数据可视化库 三国演义 .txt下载地址 提取码:kist 使用pycharm安装库 打开Pycharm选择 File 下的Settings 出现下面页面, 选择右边的 出现下面页面,在此页面顶端搜索想要的库,然后安装就可以了 二 编写代码 结果如下图: 可以看到这里面有很多不是人物的名字,所以 ...
2020-11-24 18:57 3 2268 推荐指数:
#Hamlet词频统计(含Hamlet原文文本) #CalHamletV1.py def getText(): txt = open("hamlet.txt", "r").read() txt = txt.lower() for ch in '!"#$%& ...
目标 统计三国演义中出现次数前100,并绘制云图 准备 分析工具:jieba,pandas,matplotlib,wordcloud 数据文档:三国演义.txt(原著),三国人物.txt(三国人名,大约1000多个),三国字.txt(一些常见人名及字,约800) 这些文档,放到了后面 说明 ...
运行结果: ...
...
【领域文章来源】: 通过百度查找的《三国演义》,下载,在本地自己创建txt文件。注:用encoding=utf-8 【源代码】: import jieba excludes = {"来到","人马","领兵","将军","却说","荆州","二人","不可","不能","如此"} txt ...
python爬取《三国演义》小说&统计词频&生成词云图 注意点: 爬取小说正文时用的正则表达式涉及到多行匹配。需要开启多行模式(?s) book_content_re = re.compile(r'(?s)<div.*?id="htmlContent"> ...
作为一个三国迷,我有了这样的想法:能不能用文本处理的方法,得到《三国演义》中的人物社交网络,再进行分析呢? 首先还是获得三国演义的txt文本。 先用jieba库把人物出场计算出来 用numpy库和matplotlib库做一个出场人物柱形图 ...
第001回 宴桃园豪杰三结义 斩黄巾英雄首立功 第002回 张翼德怒鞭督邮 何国舅谋诛宦竖 第003回 议温明董卓叱丁原 馈金珠李肃说吕布 第004回 废汉帝陈留践位 谋董贼孟德献刀 第005 ...