linux統計單詞數

本文轉載自查看原文 2016-07-07 10:40 3227 Linux

sort +awk+uniq 統計文件中出現次數最多的前10個單詞

實例

cat logt.log|sort -s -t '-' -k1n |awk '{print $1;}'|uniq -c|sort -k1nr|head -100

使用linux命令或者shell實現：文件words存放英文單詞，格式為每行一個英文單詞（單詞可以重復），統計這個文件中出現次數最多的前10個單詞。

cat words.txt | sort | uniq -c | sort -k1,1nr | head –10

主要考察對sort、uniq命令的使用，相關解釋如下，命令及參數的詳細說明請自行通過man查看，簡單介紹下以上指令各部分的功能：

sort: 對單詞進行排序

uniq -c: 顯示唯一的行，並在每行行首加上本行在文件中出現的次數

sort -k1,1nr: 按照第一個字段，數值排序，且為逆序

head -10: 取前10行數據

參考： http://man.linuxde.net/

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 統計單詞數 Linux - wc統計文件行數、單詞數或字節數 linux-統計一個文件中出現的單詞數 C++統計單詞數統計單詞數自動機 c++ 統計單詞數量 WordCount 統計行數、字符數、單詞數統計單詞數（NOIP2011）使用jdk8 stream 統計單詞數 linux wc 的用法-linux 下統計行數、單詞數、字符個數