原文:记一次ZOOKEEPER集群超时问题分析

CDH安装的ZK,三个节点,基本都是默认配置,一直用得正常,今天出现问题,客户端连接超时 倍时长,默认最大会话超时时间是一分钟。原因分析: .首先要确认网络正确。确认时钟同步。 .查看现有的配置,基本都是默认配置 JVM配置是 G 有 g的,不一样 .查看dataDir目录,du sh .发现已经有五百多M具体原因不确定,没有看到日志中出现的问题,分析可能是因为随着时间的推移,ZOOKEEPER中 ...

2018-12-31 21:01 0 1443 推荐指数:

查看详情

一次定位zookeeper连接不上的问题

起因,想起来分布式锁也是常考的知识点,自己还不是太熟,就想着在网上找个demo学学 找到了一个看上去还不错的,他使用的是ZkClient这个客户端。 由于我之前在工程里测试过kafka,而kafka其实是自带ZkClient客户端的,版本是 代码看上去没问题,但是一执行就爆 ...

Wed Jan 13 03:11:00 CST 2021 0 598
一次kubernetes集群异常: kubelet连接apiserver超时

Background kubernetes是master-slave结构,master node是集群的大脑, 当master node发生故障时整个集群都"out of control"。master node中最重要的当属apiserver组件, 它负责处理所有请求, 并持久化状态到etcd ...

Wed May 29 00:00:00 CST 2019 2 4194
一次zookeeper集群搭建错误的排除

zookeeper官网上的文档说得很清楚。 http://zookeeper.apache.org/doc/r3.5.1-alpha/zookeeperAdmin.html#sc_designing 设置好jdk的环境变量 下载并解压zookeeper. zoo.cfg配置,直接复制官网 ...

Wed Sep 23 15:45:00 CST 2015 0 2045
一次feign跨服务调用偶尔成功偶尔超时问题

原因:由于多环境开发导致测试本地服务注册到测试服务的注册中心中,导致请求服务提供方服务请求不到,报超时错误 注意点:1.排查此类问题要先检查服务是否注册到相应的注册中心     2.feigin连接时间配置设置 ...

Fri Jul 02 19:56:00 CST 2021 0 200
一次队列积压问题分析、解决

现象: 同事负责的项目转到我部门,整理服务过程中发现了队列的积压问题。 为了搞清楚积压的严重程度, 对队列任务数每分钟进行一次采样,生成一个走势图, 队列积压情况一目了然,非常严重。 分析: 听了同事对系统的介绍,猜测是mongo性能影响了处理效率,于是针对mongo进行分析 ...

Thu Apr 27 01:57:00 CST 2017 2 1439
一次docker问题定位(perf,iostat等性能分析)

背景 最近参与的项目是基于 OpenStack 提供容器管理能力,丰富公司 IaaS 平台的能力。日常主要工作就是在开源的 novadocker 项目(开源社区已停止开发)基础上进行增强,与公司的其他业务组件进行对接等。 周末给下游部门的 IaaS 平台进行了一次升级,主要升级 ...

Fri Apr 27 18:29:00 CST 2018 4 3482
【疑难杂症】一次生产问题之事务超时

现象和猜测 我们每日日终跑批,跑批的第一步要去NFS文件系统检查信贷还款文件的标志文件,即dbas.ok文件,以便做相关账务处理,该代码使用了while(true),直到file.exist()返回 ...

Thu Nov 30 01:45:00 CST 2017 0 1020
一次redis连接建立超时问题解决

背景: 1.系统由多个进程组成,几乎每个进程都需要访问redis。 2.所有进程都部署在一台机器,包括redis/mysql。 3.redis驱动程序使用的是jedis 2.8。 4.每个进程 ...

Fri Feb 22 19:44:00 CST 2019 0 5280
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM