注:这次使用C语言做的这个程序。个别不懂的地方和算法部分是请教的其他同学,交流并吸收,所以收获颇多! 在程序中每一个地方我都做了注释,方便同学之间交流。也让老师容易看。程序也有很多不足的地方,但限于本人能力有限以及时间紧迫,难免出现很多问题,希望老师和同学能够帮助解决! 设计思路 ...
程序就是数据结构 算法,要解决这个问题,我们得找到适用的数据结构以及一个好的算法。 既然要找出出现频率最高的 个单词,我们必须统计每个单词出现的次数。一个单词对应一个数字,在java中这种结构用map来实现最方便了,key value形式的键值对,不会重复又可以很好的统计结果。关于这个问题的算法,我没有想到特别好的,就是利用一些文件操作函数,遍历整个文本,统计单词。 具体实现步骤: 遍历文本,统计 ...
2014-04-07 16:38 0 8363 推荐指数:
注:这次使用C语言做的这个程序。个别不懂的地方和算法部分是请教的其他同学,交流并吸收,所以收获颇多! 在程序中每一个地方我都做了注释,方便同学之间交流。也让老师容易看。程序也有很多不足的地方,但限于本人能力有限以及时间紧迫,难免出现很多问题,希望老师和同学能够帮助解决! 设计思路 ...
package english; import java.io.File; import java.util.Scanner; import java.io.FileNotFoundException; import java.util.HashMap; import ...
Jieba是一个中文分词组件,可用于中文句子/词性分割、词性标注、未登录词识别,支持用户词典等功能。 Matplotlib是Python中最常用的可视化工具之一,可以非常方便地创建海量类型的 ...
前段时间接触的这个题目,大体理解了,还有些小地方仍待进一步品味,暂且记下。 原文:http://www.2cto.com/kf/201205/133219.html,此处略有改动 ...
入string类型的动态数组,而且用int型动态数组记录相应的每个单词出现的次数,最最后10次循环可得 ...
#!/usr/bin/python #Filename: readlinepy.py import sys,re urldir=r"C:\python27\a.txt" distone={} ...