...
...
python爬取《三國演義》小說&統計詞頻&生成詞雲圖 注意點: 爬取小說正文時用的正則表達式涉及到多行匹配。需要開啟多行模式(?s) book_content_re = re.compile(r'(?s)<div.*?id="htmlContent"> ...
0x00 前言 找不到要寫什么東西了!今天有個潭州大牛講師 說了個 文本詞頻分析 我基本上就照抄了一遍 中間遇到一些小小的問題 自我百度 填坑補全了 如下 : 效果演示 0x01 准備環境及介紹 python3.x版本 隨意 安裝jieba庫 pip ...
目標 統計三國演義中出現次數前100,並繪制雲圖 准備 分析工具:jieba,pandas,matplotlib,wordcloud 數據文檔:三國演義.txt(原著),三國人物.txt(三國人名,大約1000多個),三國字.txt(一些常見人名及字,約800) 這些文檔,放到了后面 說明 ...
一、安裝所需要的第三方庫 jieba (jieba是優秀的中文分詞第三分庫) pyecharts (一個優秀的數據可視化庫) 《三國演義》.txt下載地址(提取碼:kist ) 使用pycharm安裝庫 打開Pycharm選擇【File】下的Settings ...
#Hamlet詞頻統計(含Hamlet原文文本) #CalHamletV1.py def getText(): txt = open("hamlet.txt", "r").read() txt = txt.lower() for ch in '!"#$%& ...
1、網頁URL: http://www.shicimingju.com/book/sanguoyanyi.html 接着安裝requests庫和BeautifulSoup4這兩個庫 通過 ...
...