原文:个人作业——统计多个文本文件中的单词及词组出现频率

作业要求 .对源文件 .txt, .cpp, .h, .cs, .html, .js, .java, .py, .php等 统计字符数 单词数 行数 词频,统计结果以指定格式输出到默认文件中,以及其他扩展功能,并能够快速地处理多个文件 .使用性能测试工具进行分析,找到性能的瓶颈并改进 .对代码进行质量分析,消除所有警告 .设计 个测试样例用于测试,确保程序正常运行 例如:空文件,只包含一个词的文件 ...

2018-03-30 23:27 4 1224 推荐指数:

查看详情

分析一个文本文件各个词出现频率

要求:   写一个程序,分析一个文本文件各个词出现频率,并且把频率最高的10个词打印出来。文本文件大约是30KB~300KB大小。 解决步骤:   1、读取一个 txt 文本文件;   2、统计文件里面每个词出现的次数;   3、进行排序,打印出频率 ...

Mon Mar 17 16:28:00 CST 2014 4 2351
对英文文档单词词组进行频率统计

一、程序分析 1、以只读模式读取文件到字符串 2、对字符串进行数据清洗,返回一个字典 使用正则表达式过滤掉文档的特殊字符,把它们全部替换为空格,方便后续的分隔操作。(忽略大小写,所以全部使用小写字母)      2.1、只考虑单词频率统计 ...

Sat Oct 06 03:45:00 CST 2018 1 742
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM