场景题 有 100 机器,每个机器的磁盘特别大,磁盘大小为 1T,但是内存大小只有 4G,现在每台机器上都产生了很多 ip 日志文件,每个文件假设有50G,那么如果计算出这 100 太机器上访问量最多的 100 ip 呢?也就是Top 100。 思路 其实,一开始我有往布隆过滤器 ...
命令: cat 文件名 管道 各种限制条件 简单示例:有如下文件test.txt 要统计出现次数最多的IP可以利用以下shell脚本: cat test.txt awk print sort uniq c sort n r head n 参数含义: 针对首行不是IP地址信息的情况 tail n :去掉上面用红色标明的两行。 awk print :取数据的低 域 第 列 ,本例中是第 列,因此将 写 ...
2020-05-08 11:38 1 2012 推荐指数:
场景题 有 100 机器,每个机器的磁盘特别大,磁盘大小为 1T,但是内存大小只有 4G,现在每台机器上都产生了很多 ip 日志文件,每个文件假设有50G,那么如果计算出这 100 太机器上访问量最多的 100 ip 呢?也就是Top 100。 思路 其实,一开始我有往布隆过滤器 ...
背景 记得以前有个培训班的老师过来宣传,他当时问了我们一个问题,“打开一个网页慢,你能说出10个原因么?”,我脑海里立刻就出现了网速慢、电脑卡等原因,但是发现自己能说出的不超过五个,自己还是学web的,GG。今天突然想到了这个问题,就总结下 带宽不足 首先想到的就是自己网速 ...
程序就是数据结构+算法,要解决这个问题,我们得找到适用的数据结构以及一个好的算法。 既然要找出出现频率最高的10个单词,我们必须统计每个单词出现的次数。一个单词对应一个数字,在java中这种结构用map来实现最方便了,key-value形式的键值对,不会重复又可以很好的统计 ...
目录 Java 数据结构 数据库 -- 已结束待补充 网络 -- 未完待续 操作系统 Python linux -- 已结束待补充 算法题 智力题 -- 已结束待补充 测试 游戏测试 个人向 -- 已 ...
操作步骤: esc + 冒号 + set number + 回车 显示行号 命令::set number 可以简写为::set nu 关闭行号 命令::set ...
目录 功能测试 性能测试 兼容性测试 界面测试 可用性测试 安全性测试 本地化测试 ===================================== ...
目录 自动化测试工具脑图 工具概述 测试管理工具 自动化测试工具 性能测试工具 静态代码检查工具 自动化测试工具脑图 ========== ...
目录 功能测试 性能测试 界面/易用性 兼容性 安全性 功能测试 1 输入关键字,查看: 返回结果是否准确,返回的文本长度需限制 1.1输入可查 ...