最近想實現一個統計英文檔單詞出現次數的功能。 查找規則是將文檔里連續出現的<字母>判斷為一個單詞,如:“D) Let's go to d”,會將其判斷為D、Let、s、go、to五個單詞並統計出現的次數並不區分大小; 最后將將序排序過的統計結果wordNodes輸出 ...
一 程序分析 以只讀模式讀取文件到字符串 對字符串進行數據清洗,返回一個字典 使用正則表達式過濾掉文檔中的特殊字符,把它們全部替換為空格,方便后續的分隔操作。 忽略大小寫,所以全部使用小寫字母 . 只考慮單詞頻率統計 判斷單詞列表中的單詞是否在單詞頻率字典中。 如果這個單詞在字典中,則該單詞的個數加 如果這個單詞不在字典中,則以這個單詞為鍵,賦值為 ,表示這個單詞第一次出現。 . 考慮單詞和詞組的 ...
2018-10-05 19:45 1 742 推薦指數:
最近想實現一個統計英文檔單詞出現次數的功能。 查找規則是將文檔里連續出現的<字母>判斷為一個單詞,如:“D) Let's go to d”,會將其判斷為D、Let、s、go、to五個單詞並統計出現的次數並不區分大小; 最后將將序排序過的統計結果wordNodes輸出 ...
這是一道我們軟件工程的個人作業,得到了這個題目,我第一個念頭就是用C語言來編寫,畢竟別的語言不太精通只能選擇C語言! 程序說明:對於這個問題我的理解就是要通過結構體來實現對單詞和出現次數的統計,先將文章讀入,然后通過每次讀入一個字符來判斷它是否是字母,如果不是字母,那么就說 ...
作業要求 1. 對源文件(*.txt,*.cpp,*.h,*.cs,*.html,*.js,*.java,*.py,*.php等)統計字符數、單詞數、行數、詞頻,統計結果以指定格式輸出到默認文件中,以及其他擴展功能,並能夠快速地處理多個文件 2. 使用性能測試工具進行分析,找到性能的瓶頸並改進 ...
選用的英文文本為飄; package myproject1; //先導入飄的文本 //讀取飄的文本 //並通過分隔符統計每個單詞出現的次數,和計算單詞總數 //輸出出現次數最多的單詞和其出現次數 import java.io.; import java.util.; public class ...
寫英語作文的時候,常常要求滿足一定的字數,在以往,要么,我們一個一個地數,要么,我們估算一行的單詞數,然后用行數進行估算。第一種方法太費時,如果要是寫個長篇大論,那幾乎是mission imposible,而第二種方法有不太准確。這就給我們留下了一個問題:如何又快又准確地統計一篇英文文章中的單詞 ...
[本文出自天外歸雲的博客園] 題目要求: 1、統計英文文檔中每個單詞出現的次數。 2、統計結果先按次數降序排序,再按單詞首字母降序排序。 3、需要考慮大文件的讀取。 我的解法如下: 其中read_big_file方法存在的問題:按大小進行文件讀取可能會在邊界處將一個單詞 ...