作業要求中已有的內容將不再回答,在博客或群中已解答的問題將不再回答。
-
Java 版本要求
- JDK 1.8
-
Java 對包管理器的支持情況,是否允許使用Maven / Gradle等
- 不支持包管理器,但在符合組織目錄要求的情況下允許引用第三方庫,必須可編譯,如按包路徑復制class文件等
-
C++ 編譯參數,包括但不限於是否開啟編譯優化、使用字符集、target msvcrt等
- 使用VS的自帶腳本vcvarsall.bat進行編譯
-
C++ 對包管理器的支持情況,是否允許使用NuGet / vcpkg等
- 不支持包管理器,但在符合組織目錄要求的情況下允許引用第三方庫,必須可編譯,如直接復制源代碼等
-
輸出格式換行符選用格式,\r\n或\n
- \r\n
-
空白字符的定義
- ASCII中的33個控制字符和空格(0-32、127)
-
換行符字符數如何計算
- 換行符記為一個,"\r\n"作為字符串記為四個
-
爬蟲測試要求
- 爬蟲部分不與wordcount一起測試,可自由發揮,具體請看作業要求
-
尾行輸出要求
- 評測會自動去除尾行空白
-
輸出格式修正
- 基本需求和進階需求中的詞頻統計的輸出中,格式應為"<word word>",單詞或詞組與尖括號間無空格
-
進階需求測試數據
- 進階需求的測試數據就是cvpr2018的論文列表爬取結果。
-
幾個合法單詞中夾雜着不合法單詞,如何判定詞組
- 比如:used in many computer(m=3時)由於in不是合法單詞,故此時沒有滿足條件的詞組
-
兩個單詞中穿插多個分隔符,還是一個詞組嗎
- 比如:answer the question("orange") (m=2時),這時只有1個合法詞組 question("orange
-
幾個合法單詞組成詞組輸出時包含分隔符嗎
- 比如上例,輸出為<question("orange>:1
- 即輸出的詞組是單詞+分隔符+單詞+……+單詞+分隔符
測試樣例
換行符為\r\n (CRLF)
壓縮文件:測試樣例
