原文:個人作業——統計多個文本文件中的單詞及詞組出現頻率

作業要求 .對源文件 .txt, .cpp, .h, .cs, .html, .js, .java, .py, .php等 統計字符數 單詞數 行數 詞頻,統計結果以指定格式輸出到默認文件中,以及其他擴展功能,並能夠快速地處理多個文件 .使用性能測試工具進行分析,找到性能的瓶頸並改進 .對代碼進行質量分析,消除所有警告 .設計 個測試樣例用於測試,確保程序正常運行 例如:空文件,只包含一個詞的文件 ...

2018-03-30 23:27 4 1224 推薦指數:

查看詳情

分析一個文本文件各個詞出現頻率

要求:   寫一個程序,分析一個文本文件各個詞出現頻率,並且把頻率最高的10個詞打印出來。文本文件大約是30KB~300KB大小。 解決步驟:   1、讀取一個 txt 文本文件;   2、統計文件里面每個詞出現的次數;   3、進行排序,打印出頻率 ...

Mon Mar 17 16:28:00 CST 2014 4 2351
對英文文檔單詞詞組進行頻率統計

一、程序分析 1、以只讀模式讀取文件到字符串 2、對字符串進行數據清洗,返回一個字典 使用正則表達式過濾掉文檔的特殊字符,把它們全部替換為空格,方便后續的分隔操作。(忽略大小寫,所以全部使用小寫字母)      2.1、只考慮單詞頻率統計 ...

Sat Oct 06 03:45:00 CST 2018 1 742
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM