需求: 1.设计一个词频统计的程序。 2.英语文章中包含的英语标点符号不计入统计。 3.将统计结果按照单词的出现频率由大到小进行排序。 设计: 1.基本功能和用法会在程序中进行提示。 2.原理是利用分隔符分词存入列表,然后从列表读出存入字典,键为词,值存放词的数量。 代码 ...
本次改进是在原有功能需求及代码基础上额外做的修改,保证了原有的基础需求之外添加了新需求的功能。 功能: . 小文件输入 从控制台由用户输入到文件中,再对文件进行统计 .支持命令行输入英文作品的文件名 .支持命令行输入存储有英文作品文件的目录名,批量统计 .从控制台读入英文单篇作品,重定向输入流。 实现: .判断输入方式,如果从命令行传递参数则直接对文件进行统计 如果未传递参数,其方式同控制台相同 ...
2016-09-12 15:22 3 6039 推荐指数:
需求: 1.设计一个词频统计的程序。 2.英语文章中包含的英语标点符号不计入统计。 3.将统计结果按照单词的出现频率由大到小进行排序。 设计: 1.基本功能和用法会在程序中进行提示。 2.原理是利用分隔符分词存入列表,然后从列表读出存入字典,键为词,值存放词的数量。 代码 ...
要求: 1.读取文件; 2.记录出现的词汇及出现频率; 3.按照频率降序排列; 4.输出结果。 概要: 1.读取的文件路径是默认的,为了方便调试,将要统计的文章、段落复制到文本中即可;2.只支持英文;3.会按照词汇出现的频率降序排列。 实现: 1.使用 ...
java效能分析可以使用JProfiler 词频统计处理的文件为WarAndPeace,大小3282KB约3.3MB,输出结果到文件 在程序本身内开始和结束分别加入时间戳,差值平均为480-490ms。 结果如下: 1.统计概要 2.CPU运行曲线:程序运行高峰可以达到21.44 ...
前言:本次测试过程中发现了几个未知字符,这里将其转化为十六进制码对其加以区分。 1)保存统计结果的Result文件中显示如图: 2)将其复制到eclipse环境下的切分方法StringTokenizer中却没有显示; 复制前 ...
需求概要 1.读取文件,文件内包可含英文字符,及常见标点,空格级换行符。 2.统计英文单词在本文件的出现次数 3.将统计结果排序 4.显示排序结果 分析 1.读取文件可使用BufferedReader类按行读取 2.针对读入行根据分隔符拆分出单词,使用java.util工具提供 ...
[root@test88 ~]# vim word_freq.sh #!/bin/bash if [ $# -ne 1 ];then echo "Usage: $0 filename" ...
思路: 1、将文件内容存入StringBuffer中。 2、利用split()函数分割字符串,可按(“,”,“.”,“!”,“空格”,“回车”)分割,得到一个数组。 3、遍历数组,将 ...
package hello; import java.io.BufferedReader; import java.io.FileNotFoundException; import java.io.FileReader; import java.io.IOException; import ...