原文:Java实现的词频统计——功能改进

本次改进是在原有功能需求及代码基础上额外做的修改,保证了原有的基础需求之外添加了新需求的功能。 功能: . 小文件输入 从控制台由用户输入到文件中,再对文件进行统计 .支持命令行输入英文作品的文件名 .支持命令行输入存储有英文作品文件的目录名,批量统计 .从控制台读入英文单篇作品,重定向输入流。 实现: .判断输入方式,如果从命令行传递参数则直接对文件进行统计 如果未传递参数,其方式同控制台相同 ...

2016-09-12 15:22 3 6039 推荐指数:

查看详情

改进)Python语言实现词频统计

需求: 1.设计一个词频统计的程序。 2.英语文章中包含的英语标点符号不计入统计。 3.将统计结果按照单词的出现频率由大到小进行排序。 设计: 1.基本功能和用法会在程序中进行提示。 2.原理是利用分隔符分词存入列表,然后从列表读出存入字典,键为词,值存放词的数量。 代码 ...

Mon Nov 14 19:06:00 CST 2016 1 10946
Java实现词频统计

要求: 1.读取文件; 2.记录出现的词汇及出现频率; 3.按照频率降序排列; 4.输出结果。 概要: 1.读取的文件路径是默认的,为了方便调试,将要统计的文章、段落复制到文本中即可;2.只支持英文;3.会按照词汇出现的频率降序排列。 实现: 1.使用 ...

Sat Sep 03 19:25:00 CST 2016 2 6507
效能分析——词频统计java实现方法的第一次改进

java效能分析可以使用JProfiler 词频统计处理的文件为WarAndPeace,大小3282KB约3.3MB,输出结果到文件 在程序本身内开始和结束分别加入时间戳,差值平均为480-490ms。 结果如下: 1.统计概要 2.CPU运行曲线:程序运行高峰可以达到21.44 ...

Thu Sep 15 04:41:00 CST 2016 5 754
Java实现词频统计——单元测试

  前言:本次测试过程中发现了几个未知字符,这里将其转化为十六进制码对其加以区分。     1)保存统计结果的Result文件中显示如图:            2)将其复制到eclipse环境下的切分方法StringTokenizer中却没有显示;       复制前 ...

Tue Sep 27 06:41:00 CST 2016 12 1951
英文词频统计java实现方法

需求概要 1.读取文件,文件内包可含英文字符,及常见标点,空格级换行符。 2.统计英文单词在本文件的出现次数 3.将统计结果排序 4.显示排序结果 分析 1.读取文件可使用BufferedReader类按行读取 2.针对读入行根据分隔符拆分出单词,使用java.util工具提供 ...

Sat Sep 03 02:51:00 CST 2016 5 831
awk词频统计功能

[root@test88 ~]# vim word_freq.sh #!/bin/bash if [ $# -ne 1 ];then echo "Usage: $0 filename" ...

Tue Sep 26 20:27:00 CST 2017 1 1480
java实现文件单词频统计

思路: 1、将文件内容存入StringBuffer中。 2、利用split()函数分割字符串,可按(“,”,“.”,“!”,“空格”,“回车”)分割,得到一个数组。 3、遍历数组,将 ...

Fri Jan 18 05:28:00 CST 2013 1 8863
java 词频统计代码

package hello; import java.io.BufferedReader; import java.io.FileNotFoundException; import java.io.FileReader; import java.io.IOException; import ...

Wed Oct 19 07:11:00 CST 2016 0 2829
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM