《三國演義》回目
第001回 宴桃園豪傑三結義 斬黃巾英雄首立功 第002回 張翼德怒鞭督郵 何國舅謀誅宦豎 第003回 議溫明董卓叱丁原 饋金珠李肅說呂布 第004回 廢漢帝陳留踐位 謀董賊孟德獻刀 第005 ...
第001回 宴桃園豪傑三結義 斬黃巾英雄首立功 第002回 張翼德怒鞭督郵 何國舅謀誅宦豎 第003回 議溫明董卓叱丁原 饋金珠李肅說呂布 第004回 廢漢帝陳留踐位 謀董賊孟德獻刀 第005 ...
#Hamlet詞頻統計(含Hamlet原文文本) #CalHamletV1.py def getText(): txt = open("hamlet.txt", "r").read() ...
...
運行結果: ...
python爬取《三國演義》小說&統計詞頻&生成詞雲圖 注意點: 爬取小說正文時用的正則表達式涉及到多行匹配。需要開啟多行模式(?s) book_content_re = re.compile(r'(?s)<div.*?id="htmlContent"> ...
1、網頁URL: http://www.shicimingju.com/book/sanguoyanyi.html 接着安裝requests庫和BeautifulSoup4這兩個庫 通過 ...
【領域文章來源】: 通過百度查找的《三國演義》,下載,在本地自己創建txt文件。注:用encoding=utf-8 【源代碼】: import jieba excludes = {"來到","人馬","領兵","將軍","卻說","荊州","二人","不可","不能","如此"} txt ...
0x00 前言 找不到要寫什么東西了!今天有個潭州大牛講師 說了個 文本詞頻分析 我基本上就照抄了一遍 中間遇到一些小小的問題 自我百度 填坑補全了 如下 : 效果演示 0 ...