linux統計單詞數


sort +awk+uniq 統計文件中出現次數最多的前10個單詞

實例
cat logt.log|sort -s -t '-' -k1n |awk '{print $1;}'|uniq -c|sort -k1nr|head -100


使用linux命令或者shell實現:文件words存放英文單詞,格式為每行一個英文單詞(單詞可以重復),統計這個文件中出現次數最多的前10個單詞。

cat words.txt | sort | uniq -c | sort -k1,1nr | head –10

 

主要考察對sort、uniq命令的使用,相關解釋如下,命令及參數的詳細說明請自行通過man查看,簡單介紹下以上指令各部分的功能:

sort:  對單詞進行排序

uniq -c:  顯示唯一的行,並在每行行首加上本行在文件中出現的次數

sort -k1,1nr:  按照第一個字段,數值排序,且為逆序

head -10:  取前10行數據

 

參考: http://man.linuxde.net/


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM