原需求 1.读取文件,文件内包可含英文字符,及常见标点,空格级换行符。 2.统计英文单词在本文件的出现次数 3.将统计结果排序 4.显示排序结果 新需求: 1.小文件输入. 为表明程序能跑 2.支持命令行输入英文作品的文件名 3. 支持命令行输入存储有英文作品文件的目录名,批量统计 ...
需求: .设计一个词频统计软件,统计给定英文文章的单词频率。 .文章中包含的标点不计入统计。 .将统计结果以从大到小的排序方式输出。 设计: .因为是跨专业 . 并不会c 和java,只能用仅学过的C语言进行编写,还是挺费劲的。 .定义一个包含单词和频率两个成员的结构体来统计词频 进行了动态分配内存,可以处理较大文本 。 .使用fopen函数读取指定的文档。 .使用fgetc函数获取字符,再根据取 ...
2016-09-06 10:47 7 5314 推荐指数:
原需求 1.读取文件,文件内包可含英文字符,及常见标点,空格级换行符。 2.统计英文单词在本文件的出现次数 3.将统计结果排序 4.显示排序结果 新需求: 1.小文件输入. 为表明程序能跑 2.支持命令行输入英文作品的文件名 3. 支持命令行输入存储有英文作品文件的目录名,批量统计 ...
需求: 1.设计一个词频统计的程序。 2.英语文章中包含的英语标点符号不计入统计。 3.将统计结果按照单词的出现频率由大到小进行排序。 设计: 1.基本功能和用法会在程序中进行提示。 2.原理是利用分隔符分词存入列表,然后从列表读出存入字典,键为词,值存放词的数量。 代码 ...
这是一道我们软件工程的个人作业,得到了这个题目,我第一个念头就是用C语言来编写,毕竟别的语言不太精通只能选择C语言! 程序说明:对于这个问题我的理解就是要通过结构体来实现对单词和出现次数的统计,先将文章读入,然后通过每次读入一个字符来判断它是否是字母,如果不是字母,那么就说 ...
#include<stdio.h> int main() { int sz[10]={0},zm[26]={0},z[26]={0},i,space=0,e=0,t=0; char c ...
词频统计 (个人项目) 要求 (1). 实现一个控制台程序,给定一段英文字符串,统计其中各个英文单词(4字符以上含4字符)的出现频率。 附加要求:读入一段文本文件,统计该文本文件中单词的频率。 (2). 性能分析: 对C++代码运行VS的性能分析工具,找出性能问题并进行优化 ...
项目需求: 1.设计一个词频统计小软件,对给定的英文文章进行单词频率的统计。 2.文章中相应的标点不计入统计。 3.将统计结果以从大到小的排序方式输出。 设计: 1.因为功能相对简单,采用C语言直接进行编写。 2.项目包含的统计功能利用定义的结构体分别对单词和次数进行统计 ...
...
问题描述:现在有n个文本文件,使用MapReduce的方法实现词频统计。 附上统计词频的关键代码,首先是一个通用的MapReduce模块: 然后需要针对词频统计这个实际问题写好自己的mapper方法和reducer方法: 用3个文本文件进行测试: text\a.tex ...