【领域文章来源】: 通过百度查找的《三国演义》,下载,在本地自己创建txt文件。注:用encoding=utf-8 【源代码】: import jieba excludes = {"来到","人 ...
这周老师布置了一项作业,让我们回去将自己喜欢的小说里面的主角出场次数统计出来,我对这个充满了兴趣,但我遇到了三个问题: 一开始选了一部超长的小说 最爱之一 ,但是运行时老是不行,老是显示下图错误: 我一开始是像书本那样直接把txt文件名打上去,类似于open two.txt , r .read ,但总是出现一下一行字: 三个字的人名总是会有几个人只打了两个字 一 撇开这些问题,开始写代码: 我刚 ...
2019-03-28 15:45 2 727 推荐指数:
【领域文章来源】: 通过百度查找的《三国演义》,下载,在本地自己创建txt文件。注:用encoding=utf-8 【源代码】: import jieba excludes = {"来到","人 ...
一、安装所需要的第三方库 jieba (jieba是优秀的中文分词第三分库) pyecharts (一个优秀的数据可视化库) 《三国演义》.txt下载地址(提取码:kist ) ...
最近在学习网易云课堂上面的一门课,上面有一道测验题我觉得很有意思,记录了下来。 作业详情: 统计 THE TRAGEDY OF ROMEO AND JULIET (罗密欧与朱丽叶)英文小说中各单词出现的次数。小说TXT文件下载链接: 链接:https://pan.baidu.com/s ...
1、知识点 2、标点符号处理,并分词,存储到文件中 3、中文分词统计 4、英文分词统计 ...
前面分析统计了金庸名著《倚天屠龙记》中人物按照出现次数并排序 https://www.cnblogs.com/becks/p/11421214.html 然后使用pyecharts,统计B站某视频弹幕内容,并绘制成词云显示 https://www.cnblogs.com/becks/p ...
#Hamlet词频统计(含Hamlet原文文本) #CalHamletV1.py def getText(): txt = open("hamlet.txt", "r").read() txt = txt.lower() for ch in '!"#$%& ...
环境: Python 3的代码,亲测可用。 思路: 是先把每个字符提出来放在列表里;再过滤掉其中的标点符号;最后用字典对某个字出现的频率进行累加。 扩展: 用处很多,稍微改改,既可以用来统计小说或文章,也可以用来决定让孩子学哪些常用字,还可以用来分析微博或朋友圈中好友 ...
来自:天蝎圣诞结 利用Python字典统计 利用Python的collection包下Counter类统计 利用Python的pandas包下的value_counts类统计 字典统计 collection包下Counter类统计 ...