linux统计单词数

本文转载自查看原文 2016-07-07 10:40 3227 Linux

sort +awk+uniq 统计文件中出现次数最多的前10个单词

实例

cat logt.log|sort -s -t '-' -k1n |awk '{print $1;}'|uniq -c|sort -k1nr|head -100

使用linux命令或者shell实现：文件words存放英文单词，格式为每行一个英文单词（单词可以重复），统计这个文件中出现次数最多的前10个单词。

cat words.txt | sort | uniq -c | sort -k1,1nr | head –10

主要考察对sort、uniq命令的使用，相关解释如下，命令及参数的详细说明请自行通过man查看，简单介绍下以上指令各部分的功能：

sort: 对单词进行排序

uniq -c: 显示唯一的行，并在每行行首加上本行在文件中出现的次数

sort -k1,1nr: 按照第一个字段，数值排序，且为逆序

head -10: 取前10行数据

参考： http://man.linuxde.net/

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 统计单词数 C++统计单词数 c++ 统计单词数量 WordCount 统计行数、字符数、单词数统计单词数（NOIP2011）使用jdk8 stream 统计单词数 c语言中统计单词数目统计字符串单词数的两种方法(c语言实现) 用什么命令对一个文件的内容进行统计？(行号、单词数、字节数) ? (第二次作业)运用Java统计字符数、单词数、行数