安徽工程大學
Python程序設計實驗報告
班級:物流192 姓名:李心悅 學號:3190505218 成績:
日期:2020.6.3 指導教師:修宇
【實驗名稱】實驗八 文件
【實驗目的】
掌握讀寫文本文件或 CSV 文件,進而對數據進行處理的方法。
【實驗條件】
PC機或者遠程編程環境
【實驗內容】
完成兩個編程題。
1)水滸傳詞頻統計
水滸傳-詞頻統計
描述
使用詞頻統計的方法,生成《水滸傳》出場次數最多的10個人物的姓名。
讀取《水滸傳》文本文件的代碼如下:
txt = open("AllManAreBrothers.txt", "r", encoding="utf-8").read()
代碼模板:
# ThreeKingdomsV2
import jieba
# 讀取txt文件,獲取需要統計詞匯的文本
txt = open("AllManAreBrothers.txt", "r", encoding="utf-8").read()
# 設置需要輸出最多的前n位人物的數量
n = 10
# 請在下列exludes集合中,自行補充其他需要排除的詞匯
excludes = { "兩個", "一個", "只見", "如何", "那里", "哥哥", }
words = jieba.lcut(txt)
counts = {}
# 請擴展下列分支結構,轉換更多替代詞
for word in words:
if len(word) == 1:
continue
elif word == "宋江道":
rword = "宋江"
else:
rword = word
counts[rword] = counts.get(rword, 0) + 1
# 實現刪除干擾詞匯功能(此處約2行代碼)
# 使用列表和lambda功能實現 詞匯的排序 (此處約2行代碼)
# 依次輸出統計次數最多的前n位(此處約3行代碼)
2)血壓心率分析
描述
BP.txt”是以逗號分隔的日期、血壓、心率記錄數據文本文件( open('BP.txt',encoding="gbk"))
統計收縮壓、舒張壓、心率的總平均值(保留3位小數)。
【實驗過程】
1)水滸傳詞頻統計
注:實驗過程中需要不斷排除干擾詞,以達到既定目標。如:
2)血壓心率分析
代碼提示:
先用IDLE理解每層代碼的含義,再補充剩下的幾行代碼,最終得出結果。
注:注意print輸出時的中英文符號。