linux shell 統計文件單詞出現次數

本文轉載自查看原文 2021-07-06 09:10 181 linux shell

#! /bin/bash
#文件名：word_freg.sh
#用途：計算文件中單詞的詞頻

if [ $# -ne 1 ]
then
echo "Usage:$0 filename"
exit -1
fi

filename=$1

egrep -o "\b[[:alpha:]]+\b" $filename | \　　
awk '{ count[$0]++ }
END{ printf("%-14s%s\n","word","count")
　　for(ind in count){

　　　　printf("%-14s%d\n",ind,count[ind])

　　}

輸出如下：

[root@server script01]# bash word_freg.sh words.txt
word 　　 count
used 　　 1
this 　　 2
counting 1

說明：

egrep -o "\b[[:alpha:]]+\b" $filename | \　　#用於輸出單詞，-o選項打印出自由換行符分割的匹配字符序列。

\b：單詞邊界標記符

[:alpha:]：表示字母的字符類。

awk命令用來避免對每一個單詞進行迭代。因為awk默認會逐行執行{}塊中的語句，就不需要編寫循環了。借助關聯數組，當執行count[$0]++時，單詞計數就增加。最后，在END{}語句塊中通過迭代所有的單詞，就能打印出單詞及他們各自出現的次數。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Linux統計文件中單詞出現的次數統計文件中出現的單詞次數 linux shell中統計文本中指定單詞出現的次數 linux查找某個文件中單詞出現的次數統計文件中單詞出現頻率最高的10個以及他們出現的次數【shell腳本實例】shell腳本統計單詞頻率、出現次數最多的n個單詞 linux系統中統計文本中單詞出現的次數 Scala統計一個文件所有單詞出現的次數 Python: 統計一個文件中每個單詞出現的次數 python編程：統計文件中單詞出現次數