要求: 写一个程序,分析一个文本文件中各个词出现的频率,并且把频率最高的10个词打印出来。文本文件大约是30KB~300KB大小。 解决步骤: 1、读取一个 txt 文本文件; 2、统计文件里面每个词出现的次数; 3、进行排序,打印出频率 ...
作业要求 .对源文件 .txt, .cpp, .h, .cs, .html, .js, .java, .py, .php等 统计字符数 单词数 行数 词频,统计结果以指定格式输出到默认文件中,以及其他扩展功能,并能够快速地处理多个文件 .使用性能测试工具进行分析,找到性能的瓶颈并改进 .对代码进行质量分析,消除所有警告 .设计 个测试样例用于测试,确保程序正常运行 例如:空文件,只包含一个词的文件 ...
2018-03-30 23:27 4 1224 推荐指数:
要求: 写一个程序,分析一个文本文件中各个词出现的频率,并且把频率最高的10个词打印出来。文本文件大约是30KB~300KB大小。 解决步骤: 1、读取一个 txt 文本文件; 2、统计文件里面每个词出现的次数; 3、进行排序,打印出频率 ...
一、程序分析 1、以只读模式读取文件到字符串 2、对字符串进行数据清洗,返回一个字典 使用正则表达式过滤掉文档中的特殊字符,把它们全部替换为空格,方便后续的分隔操作。(忽略大小写,所以全部使用小写字母) 2.1、只考虑单词频率统计 ...
一、统计字母的频率,并按照由大到小的频率输出 二、统计单词的数量,并输出出现频率最高的前N个单词(N手动输入) ...
代码实现: package com.jn.test; import java.io.File; import java.io.FileInputStream; import java.io. ...
num_lines = sum(1 for line in open(input_file_name)) ...