【领域文章来源】: 通过百度查找的《三国演义》,下载,在本地自己创建txt文件。注:用encoding=utf-8 【源代码】: import jieba excludes = {"来到","人马","领兵","将军","却说","荆州","二人","不可","不能","如此"} txt ...
Hamlet词频统计 含Hamlet原文文本 CalHamletV .py def getText : txt open hamlet.txt , r .read txt txt.lower for ch in amp , . : lt gt : txt txt.replace ch, 将文本中特殊字符替换为空格 return txt hamletTxt getText words hamlet ...
2020-01-10 19:41 0 267 推荐指数:
【领域文章来源】: 通过百度查找的《三国演义》,下载,在本地自己创建txt文件。注:用encoding=utf-8 【源代码】: import jieba excludes = {"来到","人马","领兵","将军","却说","荆州","二人","不可","不能","如此"} txt ...
...
目标 统计三国演义中出现次数前100,并绘制云图 准备 分析工具:jieba,pandas,matplotlib,wordcloud 数据文档:三国演义.txt(原著),三国人物.txt(三国人名,大约1000多个),三国字.txt(一些常见人名及字,约800) 这些文档,放到了后面 说明 ...
作为一个三国迷,我有了这样的想法:能不能用文本处理的方法,得到《三国演义》中的人物社交网络,再进行分析呢? 首先还是获得三国演义的txt文本。 先用jieba库把人物出场计算出来 用numpy库和matplotlib库做一个出场人物柱形图 ...
第001回 宴桃园豪杰三结义 斩黄巾英雄首立功 第002回 张翼德怒鞭督邮 何国舅谋诛宦竖 第003回 议温明董卓叱丁原 馈金珠李肃说吕布 第004回 废汉帝陈留践位 谋董贼孟德献刀 第005 ...
一、安装所需要的第三方库 jieba (jieba是优秀的中文分词第三分库) pyecharts (一个优秀的数据可视化库) 《三国演义》.txt下载地址(提取码:kist ) 使用pycharm安装库 打开Pycharm选择【File】下的Settings ...
...
罗贯中在《三国演义》里到底描写了多少个人物?下面我将列出一组数字,有的朋友可能会怀疑数字的准确性。这个没有别的办法,只好请怀疑的朋友自己找来《三国演义》清点一下,保证你点一遍一个数字,再点一遍和上一遍还是不一样。呵呵,还是请你相信我列的数字吧。 imgLoading 罗贯中(1330 ...