原文:Java實現的詞頻統計——功能改進

本次改進是在原有功能需求及代碼基礎上額外做的修改,保證了原有的基礎需求之外添加了新需求的功能。 功能: . 小文件輸入 從控制台由用戶輸入到文件中,再對文件進行統計 .支持命令行輸入英文作品的文件名 .支持命令行輸入存儲有英文作品文件的目錄名,批量統計 .從控制台讀入英文單篇作品,重定向輸入流。 實現: .判斷輸入方式,如果從命令行傳遞參數則直接對文件進行統計 如果未傳遞參數,其方式同控制台相同 ...

2016-09-12 15:22 3 6039 推薦指數:

查看詳情

改進)Python語言實現詞頻統計

需求: 1.設計一個詞頻統計的程序。 2.英語文章中包含的英語標點符號不計入統計。 3.將統計結果按照單詞的出現頻率由大到小進行排序。 設計: 1.基本功能和用法會在程序中進行提示。 2.原理是利用分隔符分詞存入列表,然后從列表讀出存入字典,鍵為詞,值存放詞的數量。 代碼 ...

Mon Nov 14 19:06:00 CST 2016 1 10946
Java實現詞頻統計

要求: 1.讀取文件; 2.記錄出現的詞匯及出現頻率; 3.按照頻率降序排列; 4.輸出結果。 概要: 1.讀取的文件路徑是默認的,為了方便調試,將要統計的文章、段落復制到文本中即可;2.只支持英文;3.會按照詞匯出現的頻率降序排列。 實現: 1.使用 ...

Sat Sep 03 19:25:00 CST 2016 2 6507
效能分析——詞頻統計java實現方法的第一次改進

java效能分析可以使用JProfiler 詞頻統計處理的文件為WarAndPeace,大小3282KB約3.3MB,輸出結果到文件 在程序本身內開始和結束分別加入時間戳,差值平均為480-490ms。 結果如下: 1.統計概要 2.CPU運行曲線:程序運行高峰可以達到21.44 ...

Thu Sep 15 04:41:00 CST 2016 5 754
Java實現詞頻統計——單元測試

  前言:本次測試過程中發現了幾個未知字符,這里將其轉化為十六進制碼對其加以區分。     1)保存統計結果的Result文件中顯示如圖:            2)將其復制到eclipse環境下的切分方法StringTokenizer中卻沒有顯示;       復制前 ...

Tue Sep 27 06:41:00 CST 2016 12 1951
英文詞頻統計java實現方法

需求概要 1.讀取文件,文件內包可含英文字符,及常見標點,空格級換行符。 2.統計英文單詞在本文件的出現次數 3.將統計結果排序 4.顯示排序結果 分析 1.讀取文件可使用BufferedReader類按行讀取 2.針對讀入行根據分隔符拆分出單詞,使用java.util工具提供 ...

Sat Sep 03 02:51:00 CST 2016 5 831
awk詞頻統計功能

[root@test88 ~]# vim word_freq.sh #!/bin/bash if [ $# -ne 1 ];then echo "Usage: $0 filename" ...

Tue Sep 26 20:27:00 CST 2017 1 1480
java實現文件單詞頻統計

思路: 1、將文件內容存入StringBuffer中。 2、利用split()函數分割字符串,可按(“,”,“.”,“!”,“空格”,“回車”)分割,得到一個數組。 3、遍歷數組,將 ...

Fri Jan 18 05:28:00 CST 2013 1 8863
java 詞頻統計代碼

package hello; import java.io.BufferedReader; import java.io.FileNotFoundException; import java.io.FileReader; import java.io.IOException; import ...

Wed Oct 19 07:11:00 CST 2016 0 2829
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM