原文:Ceph剖析:故障检测

作者:吴香伟 发表于 版权声明:可以任意转载,转载时务必以超链接形式标明文章原始出处和作者信息以及版权声明 心跳是用于OSD节点间检测对方是否故障的,以便及时发现故障节点进入相应的故障处理流程。故障检测需要在故障的发现时间和心跳带来的负载之间做权衡,如果心跳频率太高则过多的心跳报文会影响系统性能,如果心跳频率过低则会延长发现故障节点的时间,从而影响系统的可用性。 建立连接 在大规模部署的场景中,如 ...

2014-10-10 19:40 0 2345 推荐指数:

查看详情

ceph_osd故障检测

1. 当前monitor可以通过3种途径检测到osd离线 1) Osd自主上报 2) Osd通过投票的方式(满足一下条件之一,mon会将osd标记为down) a) 投票携带了Force/Immediate标识(和其他osd建立链接时返回 ...

Sat Apr 20 18:02:00 CST 2019 0 684
Ceph源码解析:Scrub故障检测

转载请注明出处 陈小跑 http://www.cnblogs.com/chenxianpao/p/5878159.html 本文只梳理了大致流程,细节部分还没搞的太懂,有时间再看,再补充,有错误请指正,谢谢。 Ceph 的主要一大特点是强一致性,这里主要指端到端的一致性 ...

Sat Sep 17 19:35:00 CST 2016 0 4380
Ceph剖析:Leader选举

作者:吴香伟 发表于 2014/09/11 版权声明:可以任意转载,转载时务必以超链接形式标明文章原始出处和作者信息以及版权声明 Paxos算法存在活锁问题。从节点中选出Leader,然后将所有对数 ...

Fri Sep 12 03:30:00 CST 2014 0 4287
Ceph osd故障恢复

1 调高osd的日志等级 加上红框那一行就可以了 osd的日志路径:/var/log/ceph/ceph-osd.3.log 注意:加上了这一行后日志会刷很多,所以要特别注意日志容量的变化,以防把var目录写满了 2 缺少osdmap或者错误的osdmap ...

Wed Dec 04 03:30:00 CST 2019 0 952
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM