原文:PTA 詞頻統計(30 分)

詞頻統計 分 請編寫程序,對一段英文文本,統計其中所有不同單詞的個數,以及詞頻最大的前 的單詞。 所謂 單詞 ,是指由不超過 個單詞字符組成的連續字符串,但長度超過 的單詞將只截取保留前 個單詞字符。而合法的 單詞字符 為大小寫字母 數字和下划線,其它字符均認為是單詞分隔符。 輸入格式: 輸入給出一段非空文本,最后以符號 結尾。輸入保證存在至少 個不同的單詞。 輸出格式: 在第一行中輸出文本中所有 ...

2018-03-12 23:14 0 989 推薦指數:

查看詳情

7-1 詞頻統計 (30 )

詞頻統計 參考: 對參考的代碼進行了一些補充和修改,大體思路沒變 並不是想說這題多難,只是在這題可以用STL的很多結構幫助解題,所以能讓代碼變得很簡單 題目 7-1 詞頻統計 (30 ) 請編寫程序,對一段英文文本,統計其中所有不同單詞的個數,以及詞頻最大的前10%的單詞。 所謂“單詞 ...

Sun Jun 09 06:30:00 CST 2019 0 970
7-44 基於詞頻的文件相似度 (30)

實現一種簡單原始的文件相似度計算,即以兩文件的公共詞匯占總詞匯的比例來定義相似度。為簡化問題,這里不考慮中文(因為分詞太難了),只考慮長度不小於3、且不超過10的英文單詞,長度超過10的只考慮前10個 ...

Tue Feb 11 00:15:00 CST 2020 5 875
PTA 7-5 有趣的最近公共祖先問題 (30)

題目描述: 給出一顆二叉樹的后序遍歷和中序遍歷,你能計算出兩個結點的最近公共祖先嗎? 輸入格式: 第一行給出兩個整數N(N<=10000)和M(M< ...

Sun Aug 02 04:53:00 CST 2020 0 741
PTA 7-3 編輯距離問題 (30 )

一、實踐題目 二、問題描述 題目大意是:給出兩個字符串 a、b,可以通過增刪改三個操作將a變成b,需要進行幾次操作。 三、算法描述 這道題類似於求最長公共子序列,但是還是更高級一 ...

Sun Oct 20 07:05:00 CST 2019 0 317
PTA 08-圖9 關鍵活動 (30)

題目地址 https://pta.patest.cn/pta/test/15/exam/4/question/719 假定一個工程項目由一組子任務構成,子任務之間有的可以並行執行,有的必須在完成了其它一些子任務后才能執行。“任務調度”包括一組子任務、以及每個子任務可以執行所依賴的子任務 ...

Sun Jul 09 20:14:00 CST 2017 0 1246
詞頻統計

這是我們數據結構課程最后的一次作業,詞頻統計。 其主要要求是這樣的: 編寫程序統計一個英文文本文件中每個單詞的出現次數(詞頻統計),並將統計結果按單詞出現頻率由高至低輸出到指定文件中。 看到這個要求,在給出數據規模與下一步要求時,本來大家肯定會想,統計詞頻嘛。就是套用一下trie樹(字典樹 ...

Wed May 10 01:14:00 CST 2017 0 2312
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM