linux shell 统计文件单词出现次数

本文转载自查看原文 2021-07-06 09:10 181 linux shell

#! /bin/bash
#文件名：word_freg.sh
#用途：计算文件中单词的词频

if [ $# -ne 1 ]
then
echo "Usage:$0 filename"
exit -1
fi

filename=$1

egrep -o "\b[[:alpha:]]+\b" $filename | \　　
awk '{ count[$0]++ }
END{ printf("%-14s%s\n","word","count")
　　for(ind in count){

　　　　printf("%-14s%d\n",ind,count[ind])

　　}

输出如下：

[root@server script01]# bash word_freg.sh words.txt
word 　　 count
used 　　 1
this 　　 2
counting 1

说明：

egrep -o "\b[[:alpha:]]+\b" $filename | \　　#用于输出单词，-o选项打印出自由换行符分割的匹配字符序列。

\b：单词边界标记符

[:alpha:]：表示字母的字符类。

awk命令用来避免对每一个单词进行迭代。因为awk默认会逐行执行{}块中的语句，就不需要编写循环了。借助关联数组，当执行count[$0]++时，单词计数就增加。最后，在END{}语句块中通过迭代所有的单词，就能打印出单词及他们各自出现的次数。

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 Linux统计文件中单词出现的次数统计文件中出现的单词次数 linux shell中统计文本中指定单词出现的次数 linux查找某个文件中单词出现的次数统计文件中单词出现频率最高的10个以及他们出现的次数【shell脚本实例】shell脚本统计单词频率、出现次数最多的n个单词 linux系统中统计文本中单词出现的次数 Scala统计一个文件所有单词出现的次数 Python: 统计一个文件中每个单词出现的次数 python编程：统计文件中单词出现次数