...
...
python爬取《三国演义》小说&统计词频&生成词云图 注意点: 爬取小说正文时用的正则表达式涉及到多行匹配。需要开启多行模式(?s) book_content_re = re.compile(r'(?s)<div.*?id="htmlContent"> ...
0x00 前言 找不到要写什么东西了!今天有个潭州大牛讲师 说了个 文本词频分析 我基本上就照抄了一遍 中间遇到一些小小的问题 自我百度 填坑补全了 如下 : 效果演示 0x01 准备环境及介绍 python3.x版本 随意 安装jieba库 pip ...
目标 统计三国演义中出现次数前100,并绘制云图 准备 分析工具:jieba,pandas,matplotlib,wordcloud 数据文档:三国演义.txt(原著),三国人物.txt(三国人名,大约1000多个),三国字.txt(一些常见人名及字,约800) 这些文档,放到了后面 说明 ...
一、安装所需要的第三方库 jieba (jieba是优秀的中文分词第三分库) pyecharts (一个优秀的数据可视化库) 《三国演义》.txt下载地址(提取码:kist ) 使用pycharm安装库 打开Pycharm选择【File】下的Settings ...
#Hamlet词频统计(含Hamlet原文文本) #CalHamletV1.py def getText(): txt = open("hamlet.txt", "r").read() txt = txt.lower() for ch in '!"#$%& ...
1、网页URL: http://www.shicimingju.com/book/sanguoyanyi.html 接着安装requests库和BeautifulSoup4这两个库 通过 ...
...