原文:Ceph osd故障恢复

调高osd的日志等级 加上红框那一行就可以了 osd的日志路径: var log ceph ceph osd. .log 注意:加上了这一行后日志会刷很多,所以要特别注意日志容量的变化,以防把var目录写满了 缺少osdmap或者错误的osdmap 从osd日志中发现这两种错误都是属于osdmap不正常,可以从其它正常osd上拷贝osdmap到对应启动错误的osd上,假设不正常的osdmap序号 ...

2019-12-03 19:30 0 952 推荐指数:

查看详情

Ceph monitor故障恢复探讨

1 问题 一般来说,在实际运行中,ceph monitor的个数是2n+1(n>=0)个,在线上至少3个,只要正常的节点数>=n+1,ceph的paxos算法能保证系统的正常运行。所以,对于3个节点,同时只能挂掉一个。一般来说,同时挂掉2个节点的概率比较小,但是万一挂 ...

Thu Aug 21 07:47:00 CST 2014 3 13506
ETCD节点故障恢复

我在微服务组里面主要负责配置中心的构建,我们的配置中心使用到了ETCD。在我们的内网环境中搭建了三个节点的ETCD,不过这三个节点的ETCD都搭建在同一台机器上。后来机器资源不够了系统直接kill了E ...

Mon Jan 15 08:01:00 CST 2018 0 1395
Ceph OSD故障处理

故障描述: 节前将所有ceph节点全部关机,节后开机后发现 osd 全部down ceph -s发现 HEALTH_WARN 320 pgs stale; 320 pgs stuck stale; 3/3 in osds are down 查询很多资料都不知道如何处理,只能删除 ...

Mon Feb 06 06:05:00 CST 2017 0 1939
rabbitMQ故障恢复的顺序(重要)

rabbitmq模式 这里我们重点说下镜像队列模式: 镜像有三种类型: 所以,集群模式是为了提高扩展性,镜像模式提高高可用性。rabbitmq的节点存储类型 RabbitMQ的集群 ...

Fri Nov 05 23:17:00 CST 2021 0 1026
ceph_osd故障检测

1. 当前monitor可以通过3种途径检测到osd离线 1) Osd自主上报 2) Osd通过投票的方式(满足一下条件之一,mon会将osd标记为down) a) 投票携带了Force/Immediate标识(和其他osd建立链接时返回 ...

Sat Apr 20 18:02:00 CST 2019 0 684
MongoDB集群节点RECOVERING故障恢复

今天收到客服部说查询不到数据,随后上服务器检查集群状态,发现了有两台机的副本集异常了,状态为RECOVERING ps: 集群为3节点3副本 集群主机副本2 ...

Sat Apr 27 00:18:00 CST 2019 0 1336
记一次mysql故障恢复

事情要从俩月前的一个坑说起,一台新的测试服务器,新项目一元夺宝用的。 配置aws上的一台云主机,系统盘8G,一块300G的云硬盘。 拿到机器后,另一运维小哥安装php,nginx,mysql等软件 ...

Wed Dec 07 01:44:00 CST 2016 0 2076
mysql MHA高可用故障恢复

恢复MHA故障 1.手动修复 1)修复挂掉的数据库 2)找到主从语句 3)修复的数据库执行change语句 4)查看主从状态 5)修复MHA配置 6)重新启动MHA 2.脚本修复 1)创建脚本目录 2)写脚本 3)加上判断 三、MHA ...

Tue Nov 10 22:37:00 CST 2020 0 376
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM