防患未然 备份 做任何修改之前一定要备份,方便出问题进行回滚。 数据库备份,安装程序备份,条件允许最好异地备份。 权限 需要登录服务器的人,分配可以完成工作的最小权限。 敏感操作要进行逐级确认之后进行操作。 对症下药 重启大法 重启应用程序 重启 ...
运维问题排查思路 常见的方法: 确定故障现象并初判问题影响 在处理故障前,运维人员首先要知道故障现象,故障现象直接决定故障应急方案的制定,这依赖于运维人员需要对应用系统的整体功能有一定的熟悉程度。确认了故障现象后,才能指导运维人员初判断故障影响。 应急恢复 运维最基本的指标就是系统可用性,应急恢复的时效性是系统可用性的关键指标。有了上述故障现象与影响的判断后,就可以制定故障应急操作,故障应急有很多 ...
2019-09-08 21:43 0 2188 推荐指数:
防患未然 备份 做任何修改之前一定要备份,方便出问题进行回滚。 数据库备份,安装程序备份,条件允许最好异地备份。 权限 需要登录服务器的人,分配可以完成工作的最小权限。 敏感操作要进行逐级确认之后进行操作。 对症下药 重启大法 重启应用程序 重启 ...
1、常见的方法: 1)确定故障现象并初判问题影响 在处理故障前,运维人员首先要知道故障现象,故障现象直接决定故障应急方案的制定,这依赖于运维人员需要对应用系统的整体功能有一定的熟悉程度。确认了故障现象后,才能指导运维人员初判断故障影响。 2)应急恢复 运维最基本的指标就是系统可用性,应急 ...
linux系统故障 网络问题 linux系统无响应 linux系统无法启动 linux系统故障处理思路 1.重视报错信息,一般情况下此提示基本定位了问题的所在 2.查阅日志文件,系统日志和应用日志 3.分析、定位问题 4.动手解决 网络问题处理思路 1.网络硬件问题 ...
1 分布式 DDL 某数据节点的副本不执行 (1)问题:使用分布式 ddl 执行命令 create table on cluster xxxx 某个节点上没有创建 表,但是 client 返回正常,查看日志有如下报错。 <Error> xxx.xxx ...
在我们日常的运维工作中,面对着大量的基础设施和软件服务,该如何管理?这个管理的原则又是什么?粒度该如何控制?我们是否可以建立一个统一的标准模型来管理以上对象?管理过程中,如何降低人力成本?资源对象的生命周期管理如何实现?这么多的疑问,所有的运维人都会想到ITIL中的CMDB。的确CMDB在ITIL ...
前些日子小组内安排值班,轮流看顾我们的服务,主要做一些报警邮件处理、Bug排查、运营issue处理的事。工作日还好,无论干什么都要上班的,若是轮到周末,那这一天算是毁了。 不知道是公司网络广了就这样还是网络运维组不给力,网络总有问题,不是这边交换机脱网了,就是那边路由器坏了,还偶发地各种超时 ...
网络问题排查思路 网络模型 这是我们的网络知识框架 数据传输路径 这是知识框架中串联的线 排查问题路径-自下而上 链路层 网线是否正常 网卡状态 网络层 IP|NETMASK|GATEWAY DNS ...
作为一名合格的 Linux 运维工程师,一定要有一套清晰、明确的解决故障思路,当问题出现时,才能迅速定位、解决问题,这里给出一个处理问题的一般思路: 重视报错提示信息:每个错误的出现,都是给出错误提示信息,一般情况下这个提示基本定位了问题的所在,因此一定要重视这个报错信息 ...