相关内容简体繁体

Linux下统计出现次数最多的指定字段值

本文转载自查看原文 2016-02-22 13:46 2762 Linux

假设桌面上有一个叫“data.txt”的文本，内容如下：

{id='xxx' info='xxx' kk='xxx' target='111111' dd='xxx'}
{id='xxx' info='xxx' kk='xxx' target='777' dd='xxx'}
{id='xxx' info='xxx' kk='xxx' target='yyyy' dd='xxx'}
{id='xxx' info='xxx' kk='xxx' target='5555' dd='xxx'}
{id='xxx' info='xxx' kk='xxx' target='777' dd='xxx'}
{id='xxx' info='xxx' kk='xxx' target='555566' dd='xxx'}

要求：找出“data.txt”文件中target字段出现次数最多的值。

Linux下统计字符串

在linux终端通过常用工具进行解决，方法如下：

其中组合用到了一些命令行和工具，有cat、awk、cut、sed、sort、uniq、tail——

cat

cat data.txt，获取并显示“data.txt”文件的每一行内容：

awk

cat data.txt | awk '{print $4}'，显示传入的每一行中第四个字段：

cut

cat data.txt | awk '{print $4}' | cut -c 8-，从传入字符串的第八位开始，截取字符串到最后：

sed

cat data.txt | awk '{print $4}' | cut -c 8- | sed "s/'//g"，去掉传入字符串中包含的 ' 字符：

sort

cat data.txt | awk '{print $4}' | cut -c 8- | sed "s/'//g" | sort，对结果进行排序：

uniq

cat data.txt | awk '{print $4}' | cut -c 8- | sed "s/'//g" | sort | uniq -c | sort，去重并统计每种字符串出现的次数：

tail

cat data.txt | awk '{print $4}' | cut -c 8- | sed "s/'//g" | sort | uniq -c | sort | tail -n 1，显示结果中的最后一行：

我们至此已知出现次数最多的target字段值为777，出现次数为2。若有多个相同次数的字段值出现，可以通过修改tail -n后面接的数值来查看，改为10即显示结尾10行。

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 python 取出现次数最多的值 Java统计出现次数最多的字母及其出现的次数 Linux awk统计日志中出现过的IP(或出现次数最多的N个IP) Linux 统计日志中出现过的IP(或出现次数最多的N个IP) 返回（统计）一个列表中出现次数最多的元素 js统计字符串，并且判断出现次数最多的 php 获取某数组中出现次数最多的值（重复最多的值）与出现的次数 linux 统计某个时段ip访问次数最多的字符串：统计字符串中出现次数最多的字符，并统计其出现次数数组去重，判断字符串中出现次数最多的字符并统计这个次数

粤ICP备18138465号 © 2018-2026 CODEPRJ.COM