前言 很多时候数据库的TempDB、日志等文件的暴增可能导致磁盘空间被占满,如果日常配置不到位,往往会导致数据库故障,业务被迫中断。 这种文件暴增很难排查,经验不足的一些运维人员可能更是无法排查具体原因,导致问题不能彻底解决。 场景描述 客户系统比较稳定,用了5台机器做了 ...
周六生产服务器出现redis服务器不可用状态,错误信息为: 状态不可用,等待后台检查程序恢复方可使用。Unexpected end of stream expected type Status 如下图所示,下图 就是我们redis服务器运行的端口。 头一次碰到此类问题,心想难道是redis挂掉了,随即通过telnet ip 端口。发现运行正常,然后就想着进入redis看下目前连接情况。一看发现竟然 ...
2020-06-07 19:37 0 1240 推荐指数:
前言 很多时候数据库的TempDB、日志等文件的暴增可能导致磁盘空间被占满,如果日常配置不到位,往往会导致数据库故障,业务被迫中断。 这种文件暴增很难排查,经验不足的一些运维人员可能更是无法排查具体原因,导致问题不能彻底解决。 场景描述 客户系统比较稳定,用了5台机器做了 ...
最近测试环境的redis经常性发生某些key丢失的问题,最终的找到的问题让人大吃一惊。 复盘一下步骤: 1、发现问题 不知道从某天开始,后台经常报错,原因是某些key丢失,一开始不在意,以为是小bug,后来越来越频繁。 2、检查代码 看看是不是有误删除的情况,这些key的访问范围很小,压根没有删除 ...
一次正常的上线,发了几台docker后,却发现有的机器打了info.log里面有日志,有的没有。排查问题开始: 第一:确认这台docker是否有流量进来,确认有流量进来。 第二:确认这台docker磁盘是否慢了,磁盘没有满。 第三:确认这台docker日志级别,确认 ...
日志集中式监控平台上线已经有一段时间,但是大部分情况下只是作为发布或者出问题时查看日志的便利工具使用。平时大家都不怎么主动上去看看。于是前几天把应用的错误日志也加上邮件、Hi和短信报警,马上就收到很多错误报警,引起了大家的重视。其中有一个Redis报错: 看起来挺严重的,拿不到Redis连接 ...
欢迎大家前往腾讯云社区,获取更多腾讯海量技术实践干货哦~ 前言 “在一次正常的活动促销之后,客服开始陆续反馈有用户反应在抢标的时候打不开网页或者 APP,在打开的时候标的就已经被抢光了。 刚开始没有特别的上心,觉得抢标不就是这样吗,抢小米手机的时候不也是 ...
背景 将log4j.xml的日志级别从error调整为info后,进行压测发现CPU占用很高达到了90%多(之前也就是50%,60%的样子). 问题排查 排查思路: 看进程中的线程到底执行的是什么,导致CPU占用较高. 1. 使用top命令查看到底是哪个应用 ...
? 通过查阅资料,发现了一篇比较好的文章:一次NoHttpResponseException问题分析解决。 ...