原文:PTA 词频统计(30 分)

词频统计 分 请编写程序,对一段英文文本,统计其中所有不同单词的个数,以及词频最大的前 的单词。 所谓 单词 ,是指由不超过 个单词字符组成的连续字符串,但长度超过 的单词将只截取保留前 个单词字符。而合法的 单词字符 为大小写字母 数字和下划线,其它字符均认为是单词分隔符。 输入格式: 输入给出一段非空文本,最后以符号 结尾。输入保证存在至少 个不同的单词。 输出格式: 在第一行中输出文本中所有 ...

2018-03-12 23:14 0 989 推荐指数:

查看详情

7-1 词频统计 (30 )

词频统计 参考: 对参考的代码进行了一些补充和修改,大体思路没变 并不是想说这题多难,只是在这题可以用STL的很多结构帮助解题,所以能让代码变得很简单 题目 7-1 词频统计 (30 ) 请编写程序,对一段英文文本,统计其中所有不同单词的个数,以及词频最大的前10%的单词。 所谓“单词 ...

Sun Jun 09 06:30:00 CST 2019 0 970
7-44 基于词频的文件相似度 (30)

实现一种简单原始的文件相似度计算,即以两文件的公共词汇占总词汇的比例来定义相似度。为简化问题,这里不考虑中文(因为分词太难了),只考虑长度不小于3、且不超过10的英文单词,长度超过10的只考虑前10个 ...

Tue Feb 11 00:15:00 CST 2020 5 875
PTA 7-5 有趣的最近公共祖先问题 (30)

题目描述: 给出一颗二叉树的后序遍历和中序遍历,你能计算出两个结点的最近公共祖先吗? 输入格式: 第一行给出两个整数N(N<=10000)和M(M< ...

Sun Aug 02 04:53:00 CST 2020 0 741
PTA 7-3 编辑距离问题 (30 )

一、实践题目 二、问题描述 题目大意是:给出两个字符串 a、b,可以通过增删改三个操作将a变成b,需要进行几次操作。 三、算法描述 这道题类似于求最长公共子序列,但是还是更高级一 ...

Sun Oct 20 07:05:00 CST 2019 0 317
PTA 08-图9 关键活动 (30)

题目地址 https://pta.patest.cn/pta/test/15/exam/4/question/719 假定一个工程项目由一组子任务构成,子任务之间有的可以并行执行,有的必须在完成了其它一些子任务后才能执行。“任务调度”包括一组子任务、以及每个子任务可以执行所依赖的子任务 ...

Sun Jul 09 20:14:00 CST 2017 0 1246
词频统计

这是我们数据结构课程最后的一次作业,词频统计。 其主要要求是这样的: 编写程序统计一个英文文本文件中每个单词的出现次数(词频统计),并将统计结果按单词出现频率由高至低输出到指定文件中。 看到这个要求,在给出数据规模与下一步要求时,本来大家肯定会想,统计词频嘛。就是套用一下trie树(字典树 ...

Wed May 10 01:14:00 CST 2017 0 2312
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM